Google Gemini évolue : l’IA génère désormais des modèles et des simulations 3D interactifs

17

Google étend les capacités de son IA Gemini, allant au-delà des images et du texte statiques pour fournir aux utilisateurs des modèles 3D interactifs et des simulations en temps réel. Cette mise à jour permet au chatbot de transformer des requêtes complexes en outils visuels dynamiques que les utilisateurs peuvent manipuler pour mieux comprendre les concepts physiques.

Des images statiques aux interactions dynamiques

Auparavant, les capacités visuelles de Gemini se limitaient à générer des images interactives. La nouvelle mise à niveau introduit un niveau d’engagement beaucoup plus profond. Au lieu de simplement regarder une image, les utilisateurs peuvent désormais interagir avec le résultat via plusieurs méthodes :

  • Rotation et zoom : Les utilisateurs peuvent faire pivoter les modèles 3D pour les visualiser sous n’importe quel angle ou zoomer sur des détails spécifiques.
  • Ajustements en temps réel : De nombreuses simulations incluent des curseurs qui permettent aux utilisateurs de modifier des variables, telles que la vitesse ou la force, pour voir instantanément comment elles affectent le résultat.
  • Contrôles personnalisés : Des fonctionnalités telles que des boutons « pause » ou des bascules pour masquer les chemins orbitaux permettent une expérience éducative plus contrôlée.

Par exemple, une demande de visualisation de la Lune en orbite autour de la Terre aboutit à un modèle dans lequel l’utilisateur peut ajuster la vitesse orbitale via un curseur ou mettre le mouvement en pause pour inspecter des points spécifiques du cycle.

La course à l’intelligence visuelle

Ce développement fait partie d’une « course aux armements » plus large parmi les principaux développeurs d’IA pour passer du raisonnement textuel à l’intelligence multimodale. La capacité de visualiser les données et la physique devient une exigence standard pour les modèles d’IA haut de gamme.

La décision de Google suit de près les récentes mises à jour de ses principaux concurrents :
Anthropic a récemment permis à son modèle Claude de répondre avec des graphiques et des diagrammes interactifs.
OpenAI a introduit des fonctionnalités pour ChatGPT qui permettent la visualisation de concepts mathématiques et scientifiques.

Cette tendance suggère que la prochaine frontière de l’IA n’est pas seulement de « connaître » l’information, mais aussi de la « démontrer » par un raisonnement interactif et visuel.

Comment accéder aux nouvelles fonctionnalités

La possibilité de générer ces simulations est actuellement disponible pour les utilisateurs de l’application Gemini qui sélectionnent le modèle “Pro” dans la barre d’invite.

Pour utiliser cette fonctionnalité, les utilisateurs peuvent saisir des invites liées à la physique, aux mathématiques ou à la mécanique complexe, telles que :
* “Montre-moi un double pendule”
* “Aidez-moi à visualiser l’effet Doppler”

Une fois que Gemini fournit une réponse textuelle, un bouton “Montrez-moi la visualisation” apparaîtra sous la réponse, déclenchant le modèle interactif.


Conclusion : En intégrant des simulations 3D, Google transforme Gemini d’un assistant conversationnel en un puissant outil éducatif et scientifique, en suivant le rythme d’une industrie en évolution rapide axée sur l’IA visuelle et interactive.