Google Gemini evolueert: AI genereert nu interactieve 3D-modellen en simulaties

13

Google breidt de mogelijkheden van zijn Gemini AI uit en gaat verder dan statische afbeeldingen en tekst om gebruikers te voorzien van interactieve 3D-modellen en realtime simulaties. Met deze update kan de chatbot complexe vragen omzetten in dynamische visuele hulpmiddelen die gebruikers kunnen manipuleren om fysieke concepten beter te begrijpen.

Van statische afbeeldingen naar dynamische interacties

Voorheen waren de visuele mogelijkheden van Gemini beperkt tot het genereren van interactieve beelden. De nieuwe upgrade introduceert een veel dieper niveau van betrokkenheid. In plaats van alleen maar naar een afbeelding te kijken, kunnen gebruikers nu op verschillende manieren met de uitvoer communiceren:

  • Rotatie en zoom: Gebruikers kunnen 3D-modellen draaien om ze vanuit elke hoek te bekijken of in te zoomen op specifieke details.
  • Realtime aanpassingen: Veel simulaties bevatten schuifregelaars waarmee gebruikers variabelen (zoals snelheid of kracht) kunnen wijzigen om te zien hoe deze de uitkomst onmiddellijk beïnvloeden.
  • Aangepaste bedieningselementen: Functies zoals “pauze”-knoppen of schakelaars om baanpaden te verbergen zorgen voor een meer gecontroleerde educatieve ervaring.

Een verzoek om bijvoorbeeld de maan in een baan om de aarde te visualiseren resulteert in een model waarin de gebruiker de omloopsnelheid via een schuifregelaar kan aanpassen of de beweging kan pauzeren om specifieke punten in de cyclus te inspecteren.

De race om visuele intelligentie

Deze ontwikkeling maakt deel uit van een bredere ‘wapenwedloop’ onder grote AI-ontwikkelaars om over te stappen van op tekst gebaseerd redeneren naar multimodale intelligentie. De mogelijkheid om data en fysica te visualiseren wordt een standaardvereiste voor hoogwaardige AI-modellen.

De stap van Google volgt op de voet van recente updates van zijn belangrijkste concurrenten:
Anthropic heeft zijn Claude-model onlangs in staat gesteld te reageren met interactieve grafieken en diagrammen.
OpenAI heeft functies voor ChatGPT geïntroduceerd die de visualisatie van wiskundige en wetenschappelijke concepten mogelijk maken.

Deze trend suggereert dat de volgende stap voor AI niet alleen het ‘kennen’ van informatie is, maar het ‘demonstreren’ ervan door middel van interactief, visueel redeneren.

Hoe u toegang krijgt tot de nieuwe functies

De mogelijkheid om deze simulaties te genereren is momenteel beschikbaar voor gebruikers van de Gemini-app die het “Pro”-model selecteren in de promptbalk.

Om de functie te gebruiken, kunnen gebruikers aanwijzingen invoeren die verband houden met natuurkunde, wiskunde of complexe mechanica, zoals:
* “Laat me een dubbele slinger zien”
* “Help me het Doppler-effect te visualiseren”

Zodra Gemini een tekstantwoord geeft, verschijnt er een knop “Toon mij de visualisatie” onder het antwoord, waardoor het interactieve model wordt geactiveerd.


Conclusie: Door 3D-simulaties te integreren transformeert Google Gemini van een gespreksassistent in een krachtig educatief en wetenschappelijk hulpmiddel, dat gelijke tred houdt met een snel evoluerende industrie die zich richt op visuele en interactieve AI.