Evolution of Google Gemini: AI nyní vytváří interaktivní 3D modely a simulace

11

Google rozšiřuje možnosti své Gemini AI nad rámec statických obrázků a textu, aby uživatelům poskytoval interaktivní 3D modely a simulace v reálném čase. Tato aktualizace umožňuje chatbotu přeměnit složité dotazy na dynamické vizuální nástroje, se kterými mohou uživatelé manipulovat, aby lépe porozuměli fyzikálním konceptům.

Od statických obrázků k dynamickým interakcím

Dříve byly vizuální schopnosti Gemini omezeny na generování interaktivních obrázků. Nová aktualizace přináší mnohem hlubší úroveň interakce. Místo pouhého prohlížení obrázku mohou nyní uživatelé s výsledkem pracovat několika způsoby:

  • Otáčení a přibližování: Uživatelé mohou otáčet 3D modely a prohlížet si je z libovolného úhlu nebo přibližovat jednotlivé části.
  • Nastavení v reálném čase: Mnoho simulací obsahuje posuvníky, které umožňují měnit proměnné – jako je rychlost nebo síla – a okamžitě vidět, jak ovlivňují výsledek.
  • Vlastní ovládací prvky: Funkce, jako jsou tlačítka pro pozastavení nebo přepínače pro skrytí oběžných drah, poskytují lépe kontrolovaný vzdělávací zážitek.

Například požadavek na vizualizaci Měsíce obíhajícího kolem Země vytvoří model, ve kterém uživatel může upravit rychlost oběhu pomocí posuvníku nebo pozastavit pohyb a prozkoumat konkrétní body cyklu.

Závod o vizuální inteligenci

Tento vývoj je součástí rozsáhlého „závodu ve zbrojení“ mezi hlavními vývojáři AI, kteří se snaží přejít od uvažování založeného na textu k multimodální inteligenci. Schopnost vizualizovat data a fyzické procesy se stává standardním požadavkem pro špičkové modely umělé inteligence.

Krok společnosti Google přichází po nedávných aktualizacích od jeho hlavních konkurentů:
Anthropic nedávno posílil svůj model Claude o schopnost reagovat pomocí interaktivních grafů a tabulek.
OpenAI představil funkce pro ChatGPT pro vizualizaci matematických a vědeckých konceptů.

Tento trend naznačuje, že další hranicí pro AI nebude jen „znat“ informace, ale „ukazovat“ je prostřednictvím interaktivního vizuálního uvažování.

Jak získat přístup k novým funkcím

Možnost generovat takové simulace je aktuálně dostupná uživatelům aplikace Gemini, kteří ve vstupním řádku vyberou model Pro.

Pro použití této funkce mohou uživatelé zadávat dotazy týkající se fyziky, matematiky nebo složité mechaniky, například:
* “Ukaž mi dvojité kyvadlo”
* „Pomozte mi představit si Dopplerův efekt“

Jakmile Gemini poskytne textovou odpověď, objeví se pod ním tlačítko Ukázat vizualizaci, které spustí interaktivní model.


Závěr: Integrací 3D simulací Google přeměňuje Gemini z jednoduchého konverzačního asistenta na výkonný vzdělávací a vědecký nástroj, který drží krok s rychle se rozvíjejícím průmyslem zaměřeným na vizuální a interaktivní umělou inteligenci.