La conférence I/O de mardi n’était pas une question de petits ajustements.
Google a abandonné Gemini Omni.
C’est différent de l’outil Veo qu’ils ont publié plus tôt.
Veo transforme le texte en vidéo. Bien. Mais Omni ? Omni prend n’importe quoi. Texte, images, clips existants. Ça mange tout.
L’architecture sous-jacente est toujours Gemini, mais l’application est distincte. Un véritable système multimodal. Dedans, dehors, répétez. Au lancement, vous obtenez des sorties vidéo. La génération d’images et de texte viendra plus tard. Attendez la mise à jour.
Les déchets d’IA remplissent nos flux. Pendant ce temps, les laboratoires construisent de meilleurs simulateurs.
C’est la tension en ce moment. Les aliments pourrissent. La technologie s’améliore.
Google appelle cela une étape vers des « modèles mondiaux ». Pas seulement deviner. Raisonnement. La physique compte maintenant. Si vous laissez tomber un verre dans une vidéo Omni, il se brise comme du verre, pas comme des pixels confus. Cela fonde la sortie sur la réalité. Nous vivons.
Ce qui fait peur, c’est le bouton Modifier
Vous faites une vidéo.
Vous détestez ça.
Vous demandez un correctif.
Omni accepte le clip original comme entrée. Vous pouvez échanger des éléments. Changer les arrière-plans. Modifiez entièrement la scène.
Cela n’a jamais vraiment été possible auparavant.
C’est impressionnant. C’est aussi terrifiant.
Les deepfakes deviennent plus faciles de minute en minute. Avec autant de pouvoir, changer la façon dont quelqu’un apparaît ou agit est trivial.
Google y a-t-il pensé ? Oui. Des garde-fous existent.
Filigrane SynthID. Chaque sortie porte une signature numérique. Ce n’est pas infaillible. C’est un début. Une petite étiquette numérique sur un mensonge potentiellement énorme.
Où joues-tu avec ?
L’application Gemini repensée reçoit le traitement. Modèles en un clic pour votre pellicule.
Faites-vous un avatar. Voix personnalisée, visage personnalisé. Mettez-le dans des vidéos. Bizarre, non ?
Les abonnés payants bénéficient d’un accès anticipé. Google Flux. Courts métrages YouTube.
Les développeurs obtiennent les API. Dans quelques semaines.
Les gens d’entreprise ? Même chronologie. Les intégrations personnalisées attendent dans la file d’attente.
Deux saveurs pour l’instant
Les modèles divisés sont le tarif standard pour Gemini.
Omni Flash atterrit en premier. Idéal pour les tâches rapides et légères.
OmniPro ? Toujours en train de cuisiner. Plus puissant, plus cher, venant plus tard.
Nous observons le passage de la génération à la simulation.
De créer quelque chose de cool à imiter parfaitement la réalité.
Où se situe la limite ?






























