Google Gemini evolui: IA agora gera modelos e simulações 3D interativos

16

O Google está expandindo os recursos de sua IA Gemini, indo além de imagens estáticas e texto para fornecer aos usuários modelos 3D interativos e simulações em tempo real. Esta atualização permite que o chatbot transforme consultas complexas em ferramentas visuais dinâmicas que os usuários podem manipular para compreender melhor os conceitos físicos.

De imagens estáticas a interações dinâmicas

Anteriormente, as capacidades visuais do Gemini limitavam-se à geração de imagens interativas. A nova atualização introduz um nível de envolvimento muito mais profundo. Em vez de apenas olhar uma imagem, os usuários agora podem interagir com o resultado por meio de vários métodos:

  • Rotação e zoom: os usuários podem girar modelos 3D para visualizá-los de qualquer ângulo ou ampliar detalhes específicos.
  • Ajustes em tempo real: Muitas simulações incluem controles deslizantes que permitem aos usuários alterar variáveis, como velocidade ou força, para ver como elas afetam o resultado instantaneamente.
  • Controles personalizados: Recursos como botões de “pausa” ou alternadores para ocultar caminhos orbitais permitem uma experiência educacional mais controlada.

Por exemplo, uma solicitação para visualizar a Lua orbitando a Terra resulta em um modelo onde o usuário pode ajustar a velocidade orbital por meio de um controle deslizante ou pausar o movimento para inspecionar pontos específicos do ciclo.

A corrida pela inteligência visual

Este desenvolvimento faz parte de uma “corrida armamentista” mais ampla entre os principais desenvolvedores de IA para passar do raciocínio baseado em texto para a inteligência multimodal. A capacidade de visualizar dados e física está se tornando um requisito padrão para modelos de IA de ponta.

A ação do Google segue de perto as atualizações recentes de seus principais concorrentes:
– A Anthropic recentemente permitiu que seu modelo Claude respondesse com gráficos e diagramas interativos.
OpenAI introduziu recursos para ChatGPT que permitem a visualização de conceitos matemáticos e científicos.

Esta tendência sugere que a próxima fronteira da IA ​​não é apenas “conhecer” a informação, mas “demonstrá-la” através de raciocínio visual e interactivo.

Como acessar os novos recursos

A capacidade de gerar essas simulações está atualmente disponível para usuários do aplicativo Gemini que selecionam o modelo “Pro” na barra de prompt.

Para usar o recurso, os usuários podem inserir instruções relacionadas à física, matemática ou mecânica complexa, como:
* “Mostre-me um pêndulo duplo”
* “Ajude-me a visualizar o efeito Doppler”

Assim que o Gemini fornecer uma resposta de texto, um botão “Mostre-me a visualização” aparecerá abaixo da resposta, acionando o modelo interativo.


Conclusão: Ao integrar simulações 3D, o Google está transformando o Gemini de um assistente de conversação em uma poderosa ferramenta educacional e científica, acompanhando o ritmo de uma indústria em rápida evolução focada em IA visual e interativa.