Ewolucja Google Gemini: AI tworzy teraz interaktywne modele i symulacje 3D

20

Google rozszerza możliwości swojej sztucznej inteligencji Gemini poza statyczne obrazy i tekst, aby zapewnić użytkownikom interaktywne modele 3D i symulacje w czasie rzeczywistym. Ta aktualizacja umożliwia chatbotowi przekształcanie złożonych zapytań w dynamiczne narzędzia wizualne, którymi użytkownicy mogą manipulować, aby lepiej zrozumieć pojęcia fizyczne.

Od statycznych obrazów po dynamiczne interakcje

Wcześniej możliwości wizualne Gemini ograniczały się do generowania interaktywnych obrazów. Nowa aktualizacja wprowadza znacznie głębszy poziom interakcji. Zamiast po prostu patrzeć na obraz, użytkownicy mogą teraz wchodzić w interakcję z wynikami na kilka sposobów:

  • Obracanie i powiększanie: Użytkownicy mogą obracać modele 3D, aby oglądać je pod dowolnym kątem, lub powiększać poszczególne części.
  • Ustawienia w czasie rzeczywistym: wiele symulacji zawiera suwaki, które pozwalają zmieniać zmienne – takie jak prędkość czy siła – i natychmiast sprawdzać, jak wpływają one na wynik.
  • Niestandardowe sterowanie: Funkcje takie jak przyciski pauzy lub przełączniki ukrywania orbit zapewniają bardziej kontrolowane doświadczenia edukacyjne.

Na przykład żądanie wizualizacji Księżyca krążącego wokół Ziemi stworzy model, w którym użytkownik będzie mógł dostosować prędkość orbity za pomocą suwaka lub wstrzymać ruch w celu zbadania określonych punktów cyklu.

Wyścig o inteligencję wizualną

Rozwój ten stanowi część zakrojonego na szeroką skalę „wyścigu zbrojeń” wśród głównych twórców sztucznej inteligencji, którzy chcą przejść od rozumowania tekstowego do inteligencji multimodalnej. Możliwość wizualizacji danych i procesów fizycznych staje się standardowym wymogiem w przypadku zaawansowanych modeli sztucznej inteligencji.

Posunięcie Google następuje po ostatnich aktualizacjach głównych konkurentów:
– Firma Anthropic niedawno wzbogaciła swój model Claude o możliwość reagowania za pomocą interaktywnych wykresów i wykresów.
OpenAI wprowadziło funkcje ChatGPT do wizualizacji pojęć matematycznych i przyrodniczych.

Tendencja ta wskazuje, że kolejnym obszarem rozwoju sztucznej inteligencji będzie nie tylko „poznawanie” informacji, ale także „pokazywanie” ich za pomocą interaktywnego rozumowania wizualnego.

Jak uzyskać dostęp do nowych funkcji

Możliwość generowania takich symulacji dostępna jest obecnie dla użytkowników aplikacji Gemini, którzy w linii wejściowej wybiorą model Pro.

Aby skorzystać z tej funkcji, użytkownicy mogą wprowadzić zapytania związane z fizyką, matematyką czy złożoną mechaniką, na przykład:
* * „Pokaż mi podwójne wahadło”
* * „Pomóż mi zwizualizować efekt Dopplera”

Gdy Gemini prześle odpowiedź tekstową, pod nią pojawi się przycisk Pokaż wizualizację, który uruchomi interaktywny model.


Wniosek: integrując symulacje 3D, Google przekształca Gemini z prostego asystenta konwersacyjnego w potężne narzędzie edukacyjne i naukowe, dotrzymując kroku szybko rozwijającej się branży skupiającej się na wizualnej i interaktywnej sztucznej inteligencji.