Еволюція Google Gemini: ІІ тепер створює інтерактивні 3D-моделі та симуляції

1

Google розширює можливості свого ІІ Gemini, виходячи за рамки статичних зображень та тексту, щоб надати користувачам інтерактивні 3D-моделі та симуляції в реальному часі. Це оновлення дозволяє чат-боту перетворювати складні запити на динамічні візуальні інструменти, якими користувачі можуть маніпулювати для кращого розуміння фізичних концепцій.

Від статичних зображень до динамічної взаємодії

Раніше візуальні можливості Gemini обмежувалися створенням інтерактивних зображень. Нове оновлення впроваджує набагато глибший рівень взаємодії. Замість того, щоб просто дивитися на картинку, користувачі тепер можуть взаємодіяти з результатом кількома способами:

  • Обертання та масштабування: користувачі можуть обертати 3D-моделі, щоб розглянути їх з будь-якого ракурсу, або наближати окремі деталі.
  • Налаштування в реальному часі: багато симуляцій включають повзунки, що дозволяють змінювати змінні – наприклад, швидкість або силу – щоб миттєво побачити, як вони впливають на результат.
  • Управління користувача: такі функції, як кнопки «пауза» або перемикачі для приховування орбіт, забезпечують більш контрольований освітній процес.

Наприклад, запит на візуалізацію Місяця, що обертається навколо Землі, створить модель, в якій користувач зможе регулювати швидкість орбіти за допомогою повзунка або поставити рух на паузу, щоб вивчити конкретні точки циклу.

Гонка за візуальним інтелектом

Ця розробка є частиною масштабної «перегони озброєнь» серед найбільших розробників ІІ, які прагнуть перейти від текстових міркувань до мультимодального інтелекту. Здатність візуалізувати дані та фізичні процеси стає стандартною вимогою для високотехнологічних моделей ІІ.

Крок Google пройшов відразу за недавніми оновленнями його основних конкурентів:
Anthropic нещодавно наділила свою модель Claude здатністю відповідати за допомогою інтерактивних графіків та діаграм.
OpenAI представила функції для ChatGPT, що дозволяють візуалізувати математичні та наукові концепції.

Цей тренд вказує на те, що наступним рубежем для ІІ стане не просто знання інформації, а її демонстрація через інтерактивні візуальні міркування.

Як отримати доступ до нових функцій

Можливість генерації таких симуляцій на даний момент доступна користувачам програми Gemini, які вибрали модель “Pro” у рядку введення.

Щоб скористатися функцією, користувачі можуть вводити запити, пов’язані з фізикою, математикою або складною механікою, наприклад:
* «Покажи мені подвійний маятник»
* «Допоможи мені візуалізувати ефект Доплера»

Як тільки Gemini надасть текстову відповідь, під нею з’явиться кнопка “Показати візуалізацію” (Show me the visualization), яка запустить інтерактивну модель.


Висновок: Інтегруючи 3D-симуляції, Google перетворює Gemini з простого розмовного помічника на потужний освітній і науковий інструмент, йдучи в ногу з індустрією, що швидко розвивається, орієнтованої на візуальний та інтерактивний ІІ.