The Dawn of Dexterity: Como novos modelos de IA estão ensinando aos robôs “senso comum físico”

11

O sonho de um robô que possa dobrar sua roupa, organizar sua mesa ou até mesmo manusear papel-moeda delicado está passando da ficção científica para a realidade. Enquanto as gerações anteriores de robótica lutavam com a imprevisibilidade do mundo físico, um novo avanço na IA física está preenchendo a lacuna entre a programação rígida e a destreza humana.

O avanço da geração 1

A Generalist AI, com sede na Califórnia, revelou o Gen-1, um novo modelo físico de IA projetado para servir como um “cérebro” universal para vários sistemas robóticos. Ao contrário dos modelos tradicionais que podem funcionar apenas para um braço industrial específico, o Gen-1 foi construído para ser independente de plataforma, o que significa que pode alimentar tudo, desde um robô humanóide até um membro industrial estacionário.

As capacidades do modelo são melhor demonstradas através de sua capacidade de lidar com tarefas “complicadas” – ações que exigem habilidades motoras finas e uma compreensão de textura e fricção. Manifestações recentes incluem:
Manuseio de moeda: Retirar e reinserir papel-moeda frágil em uma carteira com sucesso.
Tarefas domésticas: Separar as meias por cor e dobrá-las em pilhas organizadas.
Tarefas de precisão: Descompactar estojos de lápis, empilhar laranjas em pirâmides e conectar cabos Ethernet.

Resolvendo o problema de dados: “Data Hands”

Para entender por que este é um avanço, é preciso olhar para o principal obstáculo na robótica: a escassez de dados.

Embora os grandes modelos de linguagem (como ChatGPT) tenham sido treinados na vasta extensão da Internet, os robôs carecem de uma “internet de movimento físico” semelhante. A maioria dos robôs é treinada por meio de teleoperação, onde um humano controla remotamente um robô para lhe ensinar uma tarefa. Isso é lento e difícil de escalar.

A IA generalista contornou esse gargalo usando uma abordagem mais orgânica. Eles distribuíram tecnologia vestível para humanos em todo o mundo, permitindo-lhes realizar milhões de tarefas. Isso forneceu à IA “mãos de dados” – um enorme conjunto de dados que captura as nuances sutis do movimento humano, como:
* Feedback tátil: quanta pressão aplicar a um objeto.
* Deslizamento e recuperação: como ajustar a pegada quando um objeto começa a deslizar.
* Modulação de força: A capacidade de distinguir entre uma meia macia e um smartphone rígido.

Esses dados permitem que o robô desenvolva o “bom senso físico”, abandonando a execução de instruções rígidas e predefinidas e em direção a uma compreensão intuitiva de como os objetos se comportam.

Da programação rígida à improvisação robótica

Uma das mudanças mais significativas destacadas pela Gen-1 é a mudança em direção à improvisação.

Tradicionalmente, se um robô encontrasse uma ligeira mudança no seu ambiente – como uma peça sendo colocada ligeiramente fora de alcance – ele simplesmente falharia. A Gen-1 foi projetada para “pensar por conta própria”. Por exemplo, em uma tarefa de montagem automotiva, o modelo demonstrou a capacidade de usar as duas mãos para reposicionar uma peça, apesar de ter sido treinado para usar apenas uma. Esta capacidade de adaptação a situações complicadas é essencial para que os robôs façam a transição dos chãos de fábrica controlados para os ambientes caóticos do retalho, da hotelaria e, eventualmente, das nossas casas.

O Horizonte Econômico

O momento deste avanço está alinhado com uma mudança massiva na economia global. À medida que empresas como Boston Dynamics e Honor ultrapassam os limites do movimento humanóide, os analistas veem um mercado florescente. Morgan Stanley prevê que o mercado de robótica poderá atingir US$ 5 trilhões até 2050.

Para que este mercado concretize o seu potencial, os robôs devem ir além do trabalho pesado e entrar no domínio das interações diárias complexas. As taxas de sucesso observadas na Geração 1 – como o aumento da taxa de sucesso na manutenção de um aspirador robótico de 50% para 99% – sugerem que a transição de ferramentas industriais para ajudantes domésticos está se acelerando.

“Estamos começando a ver um progresso real e estamos entusiasmados em ampliar os limites da inteligência incorporada.” — Pete Florence, cofundador e CEO da Generalist AI


Conclusão
Ao treinar a IA nas nuances sutis do toque humano, em vez de apenas em comandos rígidos, a IA generalista está aproximando a robótica da verdadeira autonomia. Esta mudança da repetição programada para a improvisação física é a chave para trazer robôs úteis e confiáveis ​​para as nossas casas e locais de trabalho.