Gemini Omni: Video AI Google je příliš cool

11

Úterní I/O konference nebyla o drobných vylepšeních.
Google představil Gemini Omni.

Není to jen nástroj Veo, který vydali dříve.
Veo přemění text na video. Dobře. Ale Omni? Omni přijímá všechno. Text, obrázky, hotové videoklipy. Všechno recykluje.

Architektura zůstává stejná – Gemini, ale aplikace je jiná. Toto je skutečný multimodální systém. Vstup, výstup, opakování. Na začátku jsou k dispozici pouze videa. Generování obrázků a textu přijde později. Počkejte na aktualizaci.

Obsah AI přebírá naše kanály. Mezitím laboratoře vytvářejí nové simulátory úrovní.

Tady teď leží napětí. Zdroje jsou plné. Technologie se zlepšuje.
Google to nazývá krokem směrem k „modelům světa“. Nejen dohady. Uvažování. Na fyzice záleží. Pokud upustíte sklo ve videu Omni, rozbije se jako sklo, ne jako hromada zamotaných pixelů. Závěry jsou svázány s realitou. K té, ve které žijeme.

Strašidelná část je tlačítko Upravit

Vytvoříte video.
Tobě se to nelíbí.
Žádáte o nápravu.

Omni přijímá původní film jako vstup. Prvky můžete vyměnit. Změnit pozadí. Úplně změnit scénu.
Dříve to bylo téměř nemožné.

Impozantní. A zároveň děsivé.
Vytváření deepfakes je každou minutou snazší. S takovou silou je změna vzhledu nebo jednání člověka otázkou několika sekund.
Přemýšlel o tom Google? Ano. Existují omezení.
Digitální vodoznaky SynthID. Každé video má digitální stopu. To není všelék. To je začátek. Malý digitální štítek na potenciálně obrovské lži.

Kde to můžu vyzkoušet?

Přepracovaná aplikace Gemini již byla aktualizována. Šablony pro vaše fotografie na jedno kliknutí.
Vytvořte si avatara sami se sebou. Hlas na objednávku, tváří v tvář. Vložte je do videa. Zvláštní, že?
Předplatitelé získají předběžný přístup. Google Flow. YouTube Shorts.
Vývojáři obdrží API. Za pár týdnů.
Zástupci podniků? Stejná časová osa. Vlastní integrace je již ve frontě.

Prozatím dvě možnosti

Modelové rozkoly jsou pro Blížence běžné.
Omni Flash vychází jako první. Dobré pro rychlé a lehké úkoly.
Omni Pro? Stále probíhá. Později vyjde výkonnější, dražší.

Jsme svědky přechodu z generace na simulaci.
Od vytvoření něčeho cool až po dokonalé kopírování reality.

Kde bude nakreslena hranice?