A conferência I/O de terça-feira não foi sobre pequenos ajustes.
O Google abandonou o Gemini Omni.
É diferente da ferramenta Veo lançada anteriormente.
Veo transforma texto em vídeo. Multar. Mas Omni? Omni leva qualquer coisa. Texto, imagens, clipes existentes. Ele come tudo.
A arquitetura subjacente ainda é Gemini, mas a aplicação é distinta. Um verdadeiro sistema multimodal. Dentro, fora, repita. No lançamento você obtém saídas de vídeo. A geração de imagens e texto virá mais tarde. Aguarde a atualização.
O lixo de IA preenche nossos feeds. Enquanto isso, os laboratórios estão construindo simuladores melhores.
Essa é a tensão agora. Os alimentos estão apodrecendo. A tecnologia está melhorando.
O Google chama isso de um passo em direção aos “modelos mundiais”. Não apenas adivinhando. Raciocínio. A física importa agora. Se você deixar cair um copo em um vídeo Omni, ele se estilhaçará como vidro, não como pixels confusos. Isso fundamenta a saída na realidade. Nós moramos em.
A parte assustadora é o botão de edição
Você faz um vídeo.
Você odeia isso.
Você solicita uma correção.
Omni aceita o clipe original como entrada. Você pode trocar elementos. Mude os planos de fundo. Altere totalmente a cena.
Nunca foi realmente possível antes.
É impressionante. Também é assustador.
Deepfakes ficam mais fáceis a cada minuto. Com tanto poder, mudar a forma como alguém aparece ou age é trivial.
O Google pensou nisso? Sim. Existem guarda-corpos.
Marca d’água SynthID. Cada saída carrega uma assinatura digital. Não é infalível. É um começo. Uma pequena etiqueta digital numa mentira potencialmente massiva.
Onde você brinca com isso?
O aplicativo Gemini redesenhado recebe o tratamento. Modelos de um clique para o rolo da câmera.
Faça um avatar de você mesmo. Voz personalizada, rosto personalizado. Coloque isso em vídeos. Estranho, certo?
Assinantes pagos têm acesso antecipado. Fluxo do Google. Curtas do YouTube.
Os desenvolvedores obtêm as APIs. Daqui a algumas semanas.
Pessoal da empresa? Mesma linha do tempo. Integrações personalizadas aguardam na fila.
Dois sabores por enquanto
Os modelos divididos são padrão para Gemini.
Omni Flash pousa primeiro. Bom para tarefas rápidas e leves.
Omni Pró? Ainda cozinhando. Mais poderoso, mais caro, chegando depois.
Estamos observando a mudança da geração para a simulação.
Desde fazer algo legal até imitar a realidade perfeitamente.
Onde a linha é traçada?
