- Vylepšení obrazu „Nano Banana“ přináší lepší videa: Nejnovější aktualizace Google Nano Banana je nový špičkový model pro zpracování obrazu (Gemini 2.5 Flash Image), který zvyšuje fotorealističnost a konzistenci blog.google. Umožňuje Gemini zachovat přesnou podobu osoby napříč úpravami a kombinovat více obrázků, a dokonce tyto vylepšené obrázky použít při generování videa blog.google blog.google. Toto vylepšení vytváří základ pro vysoce kvalitní převod fotografie na video v aplikaci Gemini.
- Fotky na 8sekundová videa se zvukem: Aplikace Gemini nyní umožňuje uživatelům proměnit jakoukoli statickou fotografii v 8sekundový videoklip se zvukem (zvukové efekty, hluk v pozadí, dokonce i dialog) blog.google. Tato funkce, poháněná video modelem AI Veo 3 od Google DeepMind, animuje váš obrázek na základě textového zadání a vytváří krátké video doplněné hudbou nebo ambientním zvukem. Google uvádí, že již zaznamenal explozi kreativity – za pouhých sedm týdnů od spuštění bylo vygenerováno přes 40 milionů AI videí blog.google.
- Snadné rozhraní, pouze pro předplatitele Pro: Používání video nástroje Gemini je jednoduché: vyberte „Videa“ v aplikaci, nahrajte fotografii a popište scénu a zvuk, který chcete blog.google. Za přibližně 1–2 minuty Gemini vytvoří video klip v rozlišení 720p, 24 snímků za sekundu tomsguide.com. (Předplatitelé Google AI Pro získají Veo 3 Fast pro rychlejší 8s videa, zatímco předplatitelé Ultra mají přístup k nejkvalitnějšímu modelu Veo 3 gemini.google gemini.google.) Dostupnost je omezena na placené tarify – uživatelé Pro mohou vytvořit 3 videa/den a uživatelé Ultra 5/den blog.google blog.google – a funkce je zaváděna ve vybraných zemích blog.google. Všechna AI-generovaná videa jsou jasně označena, s viditelným vodoznakem „AI“ a neviditelným digitálním vodoznakem SynthID vloženým do videa blog.google.
- Nové kreativní triky a tipy od Googlu: V příspěvku na blogu Google se kreativní producent dělí o 3 způsoby, jak využít nástroj Gemini pro převod fotek na video. Za prvé, animujte ilustrace – oživte kresby nebo grafiku jako pohyblivé obrázky blog.google. (Videa jsou ve formátu 16:9 na šířku, s černými pruhy, pokud váš obrázek není již ve formátu widescreen blog.google.) Za druhé, proměňte fotografii v pohyblivý obraz – začněte skutečnou fotkou a přidejte kreativní prvky nebo nové postavy; Gemini „doplňuje mezery“ a animuje scénu blog.google. (Tip: původní fotografie se stává prvním snímkem videa, takže jasný, detailní objekt přináší lepší výsledek blog.google.) Za třetí, vyjádřete uměleckou vizi – použijte detailní zadání k vizualizaci storyboardů nebo konceptů pro prezentace blog.google. Autor poznamenává, že to může být rychlejší a efektivnější než statické makety a pomáhá ostatním „lépe si představit můj koncept“ díky realistickým AI vizualizacím blog.google. Zadávání promptů vyžaduje praxi – možná budete muset zadání několikrát upravit blog.google. Můžete dokonce požádat Gemini, aby navrhl úhly kamery nebo střihy pro vylepšení videa blog.google. A pokud výsledek vypadá příliš realisticky, pamatujte: SynthID značky a vodoznaky zajišťují transparentnost, že jde o výtvor AI blog.google.
- Kinematografická kvalita díky Veo 3 a Flow: Pod kapotou je tvorba videí v Gemini poháněna Veo 3, nejnovějším generativním video modelem Google DeepMind. Odhalený na Google I/O 2025, Veo 3 je AI generátor videí filmové kvality, schopný ultra-realistických vizuálů (dokonce až do 4K v laboratořích) s přesnou fyzikou, plynulým pohybem a nativní generací zvuku protunesone.com protunesone.com. Nejenže vytváří živé obrazové záběry, ale také synchronizuje zvukové efekty, okolní hluk a mluvené repliky – vše pouze z textového zadání protunesone.com protunesone.com. Tento vše-v-jednom přístup znamená, že vaše AI-vytvořená postava se může na obrazovce věrohodně pohybovat a mluvit, což je jedinečná výhoda oproti některým konkurentům. Google také představil Flow, pokročilé AI rozhraní pro filmovou tvorbu postavené na Veo 3 protunesone.com. Dostupné pro uživatele Pro/Ultra v Labs, Flow umožňuje tvůrcům spojovat více AI-generovaných záběrů do delších scén s ovládáním ve stylu storyboardu. Můžete generovat sérii klipů s konzistentními postavami a prostředími, používat ovládání kamery (pohyby, přiblížení, změny úhlu) a dokonce „rozšiřovat“ scény generováním toho, co předchází nebo následuje po záběru venturebeat.com venturebeat.com. Stručně řečeno, Flow + Gemini mají být virtuálním filmovým studiem – zvládnou vizuály, kameru, a zvuk – takže jednotliví tvůrci mohou vytvářet vícescénové příběhy zcela pomocí AI protunesone.com blog.google.
- Jak si Gemini vede ve srovnání se Sora, Runway, Pika & Firefly: Snahy Googlu v oblasti AI videa přicházejí v době, kdy je trh s textově-vizuálními nástroji velmi zaplněný. OpenAI Sora (nedávno spuštěná přes ChatGPT) také dokáže generovat krátké klipy na základě zadání. Sora je chválena pro výjimečnou kvalitu a filmový nádech, se silnou časovou konzistencí mezi snímky stockimg.ai. Používá více „storyboardový“ styl zadávání, který někteří tvůrci považují za intuitivní stockimg.ai. Přístup k Soře je však odstupňovaný – uživatelé ChatGPT Plus mohou vytvářet videa až do 720p, 10 sekund, zatímco ChatGPT Pro (200 $/měsíc) umožňuje 1080p až 20 sekund a rychlejší výstupy openai.com openai.com. Sora také postrádá nativní generování zvuku, což znamená, že vytváří tichá videa (zvuk je třeba přidat ručně) protunesone.com. Oproti tomu Gemini’s Veo 3 automaticky zahrnuje zvukový design, což je významná výhoda stockimg.ai. Runway ML, raný průkopník generativního videa, rychle inovoval od Gen-1 přes Gen-2 až po Gen-3. Runway Gen-2 (poprvé uveden v roce 2023) byl prvním komerčně dostupným modelem text-to-video a uživatele ohromil svým pokrokem venturebeat.com venturebeat.com. Aktualizace Gen-2 z konce roku 2023 byla široce označována za „game changer“ díky výraznému zlepšení kvality a konzistence videa venturebeat.com. Umožnila delší klipy (zpočátku ~4 sekundy, později až 18 sekund) a představila funkce „Director Mode“, jako je ovládání simulovaných pohybů kamery (panning, zoomování atd.) ve scéně AI venturebeat.com <a href=“https://venturebeat.com/ai/runways-gen-2-update-is-blowing-peoples-minds-with-incredible-ai-video#:~:text=V září Runway dále aktualizoval, umožnil generovat videa. Runway’s Gen-2 dokázal vzít vstupní obrázek a animovat ho (podobně jako Gemini převod fotografie na video) a dokonce zvýšit výstupní rozlišení (jedna aktualizace zvýšila výstup videa založeného na statickém obrázku na ~1536p) venturebeat.com. Nyní v roce 2025 Runway’s Gen-3 (alfa) dále posouvá realističnost a možnosti editace, blíží se profesionální kvalitě výstupu stockimg.ai. Tvůrci chválí Runway za komplexní sadu nástrojů (nabízí plnohodnotný webový editor s keyframingem, in-paintingem atd.), i když při intenzivním používání může být dražší a v době špičky mohou být fronty stockimg.ai stockimg.ai. Stejně jako Gemini jsou videa z Runway aktuálně bez zvuku (bez automatického audia), zaměřují se čistě na vizuální stránku. Pika Labs je další nově vznikající hráč, známý hravějším a stylizovanějším přístupem k AI videu. Spuštěn v roce 2023 malým startupem (a podpořen významným financováním), Pika si získal popularitu díky unikátním „Pika efektům“ – přednastavením, která přidávají rozmarné animace nebo trendy vizuální styly do videí generativeai.pub. Podporuje převod textu na video i obrázku na video a je chválen pro uživatelskou přívětivost a rychlost, což je skvělé pro obsah na sociální sítě. Výstupy Pika bývají kratší, stylizované klipy (ideální pro memy, hudební vizuály atd.) spíše než hyperrealistické kino. Jak poznamenala jedna analýza, nástroje jako Runway a Pika si „vybudovaly místo pro stylizovaný nebo experimentální obsah“, zatímco Google Gemini/Veo „jde po realističnosti a skutečně ji doručuje“ protunesone.com. Jinými slovy, Pika Labs vyniká v kreativním vyjádření a snadném použití, i když nemusí dosáhnout fotorealismu Gemini. Ceny Pika jsou poměrně dostupné (nabízí bezplatnou zkušební verzi a plány kolem 10 USD/měsíc s omezeným počtem videokreditů) tomsguide.com tomsguide.com, což ji činí populární mezi nezávislými tvůrci. Průmyslový gigant Adobe také vstoupil na scénu s Adobe Firefly generativním videem (aktuálně v betě). Fireflyho text-to-video a image-to-video nástroje jsou integrovány do webové platformy Adobe a cílí na 1080p vysoce kvalitní klipy o délce několika sekund. Adobe zdůrazňuje „pro značky bezpečnou“ AI generaci videí – model Firefly je trénován na licencovaném nebo Adobe Stock obsahu, aby se předešlo problémům s autorskými právy, a je propagován jako první podnikový, „komerčně bezpečný“ generátor videí. V praxi Firefly dokáže animovat obrázky nebo generovat krátké scény s působivými detaily (Adobe ukazuje příklady jako filmové přírodní krajiny, produktové záběry s přejezdy kamery a dokonce i detailní záběry lidských tváří) adobe.com adobe.com. Nabízí také některé posuvníky pro ovládání kamery a styly, využívající zkušenosti Adobe s vizuálními efekty. Kompromisem je, že Firefly je poměrně omezený, aby bylo zajištěno, že výstupy jsou „právně bezpečné“ a řádně licencované adobe.com. Adobe se zaměřuje na profesionální tvůrce, kteří potřebují spolehlivé záběry s vyřešenými právy – například marketingové týmy mohou rychle generovat B-roll nebo storyboardy bez obav z porušení duševního vlastnictví. Zatímco Firefly má silnou vizuální věrnost, Google Gemini má výhodu v plynulém generování zvuku a dynamičtějších, delších scén (a samozřejmě Google má výhodu zavedené uživatelské základny díky aplikaci Gemini). Konkurence je tvrdá, ale každá platforma – Sora, Runway, Pika, Firefly a Gemini – nabízí trochu jinou kombinaci schopností pro různé publikum a použití.
- Přijetí: Co říkají tvůrci a experti: Veřejná reakce na video nástroje Gemini byla převážně nadšená. Mnoho uživatelů sdílelo na sociálních sítích ohromující příklady – od starých rodinných fotografií oživených jemným pohybem až po fantastické malby animované do krátkých filmů. Technologičtí recenzenti z Tom’s Guide důkladně otestovali Gemini Veo 3 a byli ohromeni. „Musím uznat, že to vypadá opravdu věrohodně,“ napsal jeden z recenzentů poté, co proměnil selfie ve video, kde běží po pláži, a poznamenal, že i když některé detaily byly trochu rozmazané, „video vypadá přesně“ a dokonce obsahovalo zvuk vln a kroků, což „působilo ještě uvěřitelněji“ tomsguide.com tomsguide.com. V dalším testu AI úspěšně přidala „mimozemskou invazi“ do obyčejné fotky z parku – výsledek měl pár zvláštních artefaktů (UFO se objevovala a mizela), ale celkově šlo o působivou malou sci-fi scénu vygenerovanou během několika minut tomsguide.com tomsguide.com. Takové zkušenosti ukazují jak nadšení, tak i současná omezení: Gemini dokáže vytvořit úžasně realistické vizuály a zvuk, ale bystré oko si může všimnout občasných chyb nebo rozmazání. Odborné názory naznačují, že Google je v čele rychle se vyvíjejícího oboru. Tým ze Stockimg.ai při srovnání nejlepších video modelů poznamenal, že „co se týče čisté kvality výstupu, Sora a VEO3 jsou aktuálně na špici,“ přičemž oba produkují videa, která je „těžké rozeznat od skutečných záběrů“ stockimg.ai. Zdůraznili výhodu Gemini v podobě nativního zvuku a silného AI zázemí Googlu stockimg.ai. Další analytik vyzdvihl, že integrace těchto nástrojů od Googlu (Gemini, Veo, Flow) vytváří „tak trochu celé studio na dosah ruky,“ zatímco ostatní mohou vyžadovat dílčí řešení pro zvuk nebo střih protunesone.com. Přesto se uznává, že žádný model zatím není dokonalý – například Veo 3 může mít potíže s velmi rychlým pohybem nebo složitými interakcemi (např. více lidí mluvících najednou) a záměrně se vyhýbá generování rozpoznatelně skutečných tváří nebo chráněných postav z etických důvodů. Významné je, že Google vědomě řeší etické a bezpečnostní otázky kolem generativního videa. Ve svém oznámení Google zdůraznil rozsáhlé„red teaming“ a prosazování zásad k zabránění zneužití AI videí blog.google. Každé video vytvořené pomocí Gemini je opatřeno vodoznakem, aby se zabránilo klamání blog.google. Tento opatrný přístup byl většinou odborníků přijat pozitivně, protože se shodují, že je zásadní jasně označovat AI obsah, jakmile se stává realističtějším. Někteří tvůrci však zůstávají z AI obrazů neklidní – dokonce i jedna producentka z Googlu přiznává, že „kolísá mezi vzrušením a neklidem“, když tyto nástroje používá, ale nakonec zjistila, že AI-generované umění jí umožňuje vytvářet vizuály, které by jinak neexistovaly, a tím její práci spíše obohacuje, než nahrazuje blog.google. Tento opatrný optimismus – přijímání nového tvůrčího potenciálu při současném sledování možných úskalí – shrnuje většinu veřejného mínění.
Během několika málo měsíců aktualizace „Nano Banana“ Google Gemini a funkce generování videa katapultovaly platformu na špičku AI kreativity. Spojením výkonného editoru obrázků s generativním video enginem umožňuje Gemini komukoli s předplatným a představivostí vytvářet krátké „filmy“ z jediné fotografie nebo zadání. Toto propojení AI pro obrázky a video – spolu s konkurenty, kteří drží krok – naznačuje, že vstupujeme do nové éry, kdy vyprávění příběhů může začít jen textovým zadáním a snem. A zpráva Googlu pro tvůrce je jasná: Světla. Kamera. AI-akce! blog.google
Zdroje:
- Google Blog – „Úpravy obrázků v Gemini právě dostaly velký upgrade“ (aktualizace Nano Banana) blog.google blog.google
- Google Blog – „Proměňte své fotky ve videa v Gemini“ (David Sharon) blog.google blog.google blog.google blog.google blog.google
- Google Blog – „3 způsoby, jak použít převod fotky na video v Gemini“ (Tatiana Gonzalez) blog.google blog.google blog.google blog.google blog.google blog.google
- Tom’s Guide – „Proměnil jsem fotky ve videa pomocí Google’s Veo 3 – ohromující výsledky“ tomsguide.com tomsguide.com tomsguide.com
- ProTunes One – „Nový nástroj Gemini pro tvorbu videí: Co to znamená pro tvůrce“ protunesone.com protunesone.com protunesone.com
- Stockimg AI Blog – „Srovnání nejlepších modelů pro generování AI videí: Sora, VEO3, Runway & další“ stockimg.ai stockimg.ai stockimg.ai stockimg.ai stockimg.ai
- VentureBeat – „Runway’s Gen-2 update… neuvěřitelné AI video“ venturebeat.com venturebeat.com venturebeat.com
- OpenAI – Stránka produktu Sora openai.com openai.com
- Adobe – Stránka generátoru videí Firefly AI adobe.com adobe.com
https://youtube.com/watch?v=gcZwE5cM4xs