El amanecer de la destreza: cómo los nuevos modelos de IA están enseñando a los robots el “sentido común físico”

7

El sueño de un robot que pueda doblar la ropa, organizar el escritorio o incluso manejar delicados billetes está pasando de la ciencia ficción a la realidad. Mientras que las generaciones anteriores de robótica luchaban con la imprevisibilidad del mundo físico, un nuevo avance en la IA física está cerrando la brecha entre la programación rígida y la destreza humana.

El avance de la Generación 1

Generalist AI, con sede en California, ha presentado Gen-1, un nuevo modelo físico de IA diseñado para servir como “cerebro” universal para varios sistemas robóticos. A diferencia de los modelos tradicionales que podrían funcionar solo para un brazo industrial específico, Gen-1 está diseñado para ser independiente de la plataforma, lo que significa que puede alimentar cualquier cosa, desde un robot humanoide hasta una extremidad industrial estacionaria.

Las capacidades del modelo se demuestran mejor a través de su capacidad para manejar tareas “complicadas”: acciones que requieren habilidades motoras finas y comprensión de la textura y la fricción. Las manifestaciones recientes incluyen:
Manejo de moneda: Retirar y reinsertar con éxito billetes endebles en una billetera.
Tareas del hogar: Clasificar calcetines por color y doblarlos en montones ordenados.
Tareas de precisión: Abrir estuches para lápices, apilar naranjas en pirámides y conectar cables Ethernet.

Resolviendo el problema de los datos: “Manos de datos”

Para entender por qué se trata de un salto adelante, hay que observar el principal obstáculo de la robótica: la escasez de datos.

Mientras que los modelos de lenguajes grandes (como ChatGPT) se entrenaron en la vasta extensión de Internet, los robots carecen de una “Internet de movimiento físico” similar. La mayoría de los robots se entrenan mediante teleoperación, donde un humano controla remotamente un robot para enseñarle una tarea. Esto es lento y difícil de escalar.

La IA generalista superó este cuello de botella utilizando un enfoque más orgánico. Distribuyeron tecnología portátil a humanos en todo el mundo, permitiéndoles realizar millones de tareas. Esto proporcionó a la IA “manos de datos”, un conjunto de datos masivo que captura los matices sutiles del movimiento humano, como:
* Retroalimentación táctil: Cuánta presión aplicar a un objeto.
* Deslizamiento y recuperación: Cómo ajustar un agarre cuando un objeto comienza a deslizarse.
* Modulación de fuerza: La capacidad de distinguir entre un calcetín blando y un teléfono inteligente duro.

Estos datos permiten que el robot desarrolle “sentido común físico”, alejándose de la ejecución de instrucciones rígidas y preestablecidas y avanzando hacia una comprensión intuitiva de cómo se comportan los objetos.

De la programación rígida a la improvisación robótica

Uno de los cambios más significativos destacados por Gen-1 es el movimiento hacia la improvisación.

Tradicionalmente, si un robot encontraba un ligero cambio en su entorno (como una pieza que se colocaba ligeramente fuera de su alcance) simplemente fallaba. Gen-1 está diseñado para “pensar con rapidez”. Por ejemplo, en una tarea de ensamblaje de automóviles, el modelo demostró la capacidad de usar dos manos para reposicionar una pieza, a pesar de haber sido entrenado para usar solo una. Esta capacidad de adaptarse a las “bolas curvas” es esencial para que los robots pasen de las fábricas controladas a los entornos caóticos del comercio minorista, la hostelería y, finalmente, nuestros hogares.

El horizonte económico

El momento de este avance se alinea con un cambio masivo en la economía global. A medida que empresas como Boston Dynamics y Honor amplían los límites del movimiento humanoide, los analistas ven un mercado floreciente. Morgan Stanley predice que el mercado de la robótica podría alcanzar los 5 billones de dólares en 2050.

Para que este mercado alcance su potencial, los robots deben ir más allá del trabajo pesado y entrar en el ámbito de las interacciones complejas y cotidianas. Las tasas de éxito observadas en Gen-1 (como el aumento de la tasa de éxito en el mantenimiento de un robot aspirador del 50 % al 99 %) sugieren que la transición de herramientas industriales a ayudantes domésticos se está acelerando.

“Estamos empezando a ver un progreso real y estamos entusiasmados de ampliar los límites de la inteligencia incorporada”. — Pete Florence, cofundador y director ejecutivo de Generalist AI


Conclusión
Al entrenar a la IA en los matices sutiles del contacto humano en lugar de solo órdenes rígidas, la IA generalista está acercando la robótica a una verdadera autonomía. Este cambio de la repetición programada a la improvisación física es la clave para llevar robots útiles y fiables a nuestros hogares y lugares de trabajo.