Wtorkowa konferencja I/O nie dotyczyła drobnych ulepszeń.
Google wprowadziło Gemini Omni.
To nie tylko narzędzie Veo, które wypuścili wcześniej.
Veo zamienia tekst w wideo. Cienki. Ale Omni? Omni akceptuje wszystko. Tekst, obrazy, gotowe klipy wideo. On wszystko poddaje recyklingowi.
Architektura pozostaje ta sama – Gemini, ale zastosowanie jest inne. To prawdziwy system multimodalny. Wejście, wyjście, powtórz. Na początku dostępne są tylko filmy. Generowanie obrazów i tekstu nastąpi później. Poczekaj na aktualizację.
Treści AI przejmują nasze kanały. Tymczasem laboratoria tworzą nowe symulatory poziomów.
W tym miejscu leży teraz napięcie. Kanały są pełne. Technologia się poprawia.
Google nazywa to krokiem w stronę „modeli świata”. Nie tylko domysły. Rozumowanie. Fizyka ma znaczenie. Jeśli upuścisz szklankę na filmie Omniego, rozbije się ona jak szkło, a nie jak wiązka splątanych pikseli. Wnioski mają związek z rzeczywistością. Do tego, w którym żyjemy.
Przerażającą częścią jest przycisk edycji
Tworzysz wideo.
Nie podoba ci się to.
Prosisz o naprawę.
Omni akceptuje oryginalny film jako sygnał wejściowy. Można wymieniać elementy. Zmień tło. Całkowicie zmień scenę.
Wcześniej było to prawie niemożliwe.
Imponujący. A jednocześnie przerażające.
Tworzenie deepfake’ów staje się z każdą minutą łatwiejsze. Przy takiej mocy zmiana wyglądu lub działania danej osoby to kwestia kilku sekund.
Czy Google o tym pomyślał? Tak. Istnieją ograniczenia.
Cyfrowe znaki wodne SynthID. Każdy film ma ślad cyfrowy. To nie jest panaceum. To jest początek. Mała cyfrowa etykieta na potencjalnie ogromnym kłamstwie.
Gdzie mogę tego spróbować?
Przeprojektowana aplikacja Gemini została już zaktualizowana. Szablony zdjęć dostępne jednym kliknięciem.
Stwórz ze sobą awatara. Głos na zamówienie, twarzą na zamówienie. Umieść je w filmie. Dziwne, prawda?
Abonenci uzyskują wcześniejszy dostęp. Przepływ Google. Shorty w YouTube.
Programiści otrzymają API. Za kilka tygodni.
Przedstawiciele przedsiębiorstw? Ta sama oś czasu. Integracja niestandardowa już czeka w kolejce.
Na razie dwie opcje
Podziały modeli są powszechne w przypadku Gemini.
Omni Flash pojawia się jako pierwszy. Dobry do szybkich, lekkich zadań.
Omni Pro? Wciąż w toku. Mocniejszy i droższy pojawi się później.
Jesteśmy świadkami przejścia od generacji do symulacji.
Od stworzenia czegoś fajnego po perfekcyjne kopiowanie rzeczywistości.
Gdzie zostanie wytyczona granica?
