Bei der I/O-Konferenz am Dienstag ging es nicht um kleine Änderungen.
Google hat Gemini Omni eingestellt.
Es unterscheidet sich von dem zuvor veröffentlichten Veo-Tool.
Veo verwandelt Text in Video. Bußgeld. Aber Omni? Omni nimmt alles. Texte, Bilder, vorhandene Clips. Es frisst alles.
Die zugrunde liegende Architektur ist immer noch Gemini, aber die Anwendung ist anders. Ein echtes multimodales System. Rein, raus, wiederholen. Beim Start erhalten Sie Videoausgänge. Bilder und Textgenerierung folgen später. Warten Sie auf das Update.
KI-Slop füllt unsere Feeds. Inzwischen bauen die Labore bessere Simulatoren.
Das ist derzeit die Spannung. Das Futter verrottet. Die Technologie verbessert sich.
Google nennt es einen Schritt in Richtung „Weltmodelle“. Nicht nur raten. Argumentation. Physik ist jetzt wichtig. Wenn Ihnen in einem Omni-Video ein Glas herunterfällt, zersplittert es wie Glas und nicht wie verwechselte Pixel. Es begründet die Ausgabe in der Realität. Wir leben in.
Der gruselige Teil ist die Schaltfläche „Bearbeiten“.
Du machst ein Video.
Du hasst es.
Sie veranlassen eine Lösung.
Omni akzeptiert den Originalclip als Eingabe. Sie können Elemente austauschen. Hintergründe ändern. Ändern Sie die Szene vollständig.
Das war noch nie wirklich möglich.
Es ist beeindruckend. Es ist auch erschreckend.
Deepfakes werden von Minute zu Minute einfacher. Bei so viel Macht ist es trivial, das Aussehen oder Verhalten einer Person zu ändern.
Hat Google daran gedacht? Ja. Leitplanken sind vorhanden.
SynthID-Wasserzeichen. Jede Ausgabe trägt eine digitale Signatur. Es ist nicht narrensicher. Es ist ein Anfang. Ein winziger digitaler Hinweis auf eine möglicherweise massive Lüge.
Wo spielst du damit?
Die neu gestaltete Gemini-App erhält die Behandlung. Ein-Klick-Vorlagen für Ihre Kamerarolle.
Erstelle einen Avatar aus dir. Individuelle Stimme, individuelles Gesicht. Fügen Sie es in Videos ein. Seltsam, oder?
Bezahlte Abonnenten erhalten frühen Zugriff. Google Flow. YouTube-Shorts.
Entwickler erhalten die APIs. In einigen Wochen.
Enterprise-Leute? Gleicher Zeitplan. Benutzerdefinierte Integrationen warten in der Warteschlange.
Vorerst zwei Geschmacksrichtungen
Split-Modelle gehören zum Standardtarif für Gemini.
Omni Flash landet zuerst. Gut für schnelle, leichte Aufgaben.
Omni Pro? Kocht immer noch. Leistungsstärker, teurer, kommt später.
Wir beobachten den Wandel von der Generierung zur Simulation.
Von etwas Coolem bis zur perfekten Nachahmung der Realität.
Wo wird die Grenze gezogen?
