Gemini Omni: de video-AI van Google wordt te goed

21

De I/O-conferentie van dinsdag ging niet over kleine aanpassingen.
Google liet Gemini Omni vallen.

Het is anders dan de Veo-tool die ze eerder hebben uitgebracht.
Veo zet tekst om in video. Prima. Maar Omni? Omni neemt alles. Tekst, afbeeldingen, bestaande clips. Het eet het allemaal.

De onderliggende architectuur is nog steeds Gemini, maar de toepassing is verschillend. Een echt multimodaal systeem. In, uit, herhaal. Bij de lancering krijg je video-uitgangen. Het genereren van afbeeldingen en tekst komt later. Wacht op de update.

AI-slop vult onze feeds. Ondertussen bouwen de laboratoria betere simulatoren.

Dat is de spanning op dit moment. Het voer is aan het rotten. De technologie verbetert.
Google noemt het een stap in de richting van ‘wereldmodellen’. Niet alleen maar raden. Redenering. Natuurkunde is nu belangrijk. Als je een glas in een Omni-video laat vallen, breekt het als glas, niet als verwarde pixels. Het baseert de output op de werkelijkheid. Wij wonen erin.

Het enge deel is de bewerkingsknop

Je maakt een video.
Je haat het.
U vraagt ​​om een ​​oplossing.

Omni accepteert de originele clip als invoer. Je kunt elementen verwisselen. Verander achtergronden. Verander de scène volledig.
Nooit eerder echt mogelijk geweest.

Het is indrukwekkend. Het is ook angstaanjagend.
Deepfakes worden met de minuut makkelijker. Met zoveel macht is het veranderen van de manier waarop iemand verschijnt of handelt triviaal.
Heeft Google hier aan gedacht? Ja. Vangrails bestaan.
SynthID-watermerken. Elke uitvoer is voorzien van een digitale handtekening. Het is niet waterdicht. Het is een begin. Een klein digitaal label op een potentieel enorme leugen.

Waar speel je ermee?

De opnieuw ontworpen Gemini-app krijgt de behandeling. Sjablonen met één klik voor uw filmrol.
Maak een avatar van jezelf. Aangepaste stem, aangepast gezicht. Zet het in video’s. Raar, toch?
Betaalde abonnees krijgen vroege toegang. Google Stroom. YouTube-shorts.
Ontwikkelaars krijgen de API’s. Weken vanaf nu.
Enterprise-mensen? Zelfde tijdlijn. Aangepaste integraties wachten in de wachtrij.

Voorlopig twee smaken

Split-modellen zijn standaard voor Gemini.
Omni Flash landt als eerste. Goed voor snelle, lichtgewicht taken.
OmniPro? Nog steeds aan het koken. Krachtiger, duurder, komt later.

We zien de verschuiving van generatie naar simulatie.
Van iets cools maken tot het perfect nabootsen van de werkelijkheid.

Waar wordt de grens getrokken?