Le rêve d’un robot capable de plier votre linge, d’organiser votre bureau ou même de manipuler du papier-monnaie délicat passe de la science-fiction à la réalité. Alors que les générations précédentes de robotique étaient aux prises avec l’imprévisibilité du monde physique, une nouvelle avancée dans l’IA physique comble le fossé entre la programmation rigide et la dextérité humaine.
La percée de la génération 1
La société californienne Generalist AI a dévoilé Gen-1, un nouveau modèle d’IA physique conçu pour servir de « cerveau » universel pour divers systèmes robotiques. Contrairement aux modèles traditionnels qui ne fonctionnent que pour une branche industrielle spécifique, Gen-1 est conçu pour être indépendant de la plate-forme, ce qui signifie qu’il peut tout alimenter, d’un robot humanoïde à un membre industriel stationnaire.
Les capacités du modèle sont mieux démontrées par sa capacité à gérer des tâches « délicates » – des actions qui nécessitent une motricité fine et une compréhension de la texture et de la friction. Les démonstrations récentes incluent :
– Gestion de la monnaie : Retirer et réinsérer avec succès du papier-monnaie fragile dans un portefeuille.
– Tâches ménagères : Trier les chaussettes par couleur et les plier en tas soignés.
– Tâches de précision : Décompresser les trousses à crayons, empiler les oranges en pyramides et brancher les câbles Ethernet.
Résoudre le problème des données : “Data Hands”
Pour comprendre pourquoi il s’agit d’un pas en avant, il faut examiner le principal obstacle en robotique : la pénurie de données.
Alors que les grands modèles de langage (comme ChatGPT) ont été formés sur la vaste étendue d’Internet, les robots ne disposent pas d’un « Internet de mouvement physique » similaire. La plupart des robots sont formés par téléopération, où un humain contrôle à distance un robot pour lui apprendre une tâche. C’est lent et difficile à mettre à l’échelle.
L’IA généraliste a contourné ce goulot d’étranglement en utilisant une approche plus organique. Ils ont distribué des technologies portables aux humains dans le monde entier, leur permettant d’effectuer des millions de tâches. Cela a fourni à l’IA des « mains de données », un ensemble de données massif capturant les nuances subtiles du mouvement humain, telles que :
* Rétroaction tactile : Quelle pression appliquer à un objet.
* Glissement et récupération : Comment ajuster une poignée lorsqu’un objet commence à glisser.
* Modulation de force : La capacité de faire la distinction entre une chaussette souple et un smartphone rigide.
Ces données permettent au robot de développer un « bon sens physique », en s’éloignant de l’exécution d’instructions rigides et prédéfinies pour s’orienter vers une compréhension intuitive du comportement des objets.
De la programmation rigide à l’improvisation robotique
L’un des changements les plus importants mis en évidence par la génération 1 est l’évolution vers l’improvisation.
Traditionnellement, si un robot rencontrait un léger changement dans son environnement, comme une pièce légèrement hors de portée, il échouerait tout simplement. Gen-1 est conçu pour « penser debout ». Par exemple, lors d’une tâche d’assemblage automobile, le modèle a démontré sa capacité à utiliser ses deux mains pour repositionner une pièce, alors qu’il n’avait été formé que pour en utiliser une seule. Cette capacité d’adaptation aux « courbes » est essentielle pour que les robots puissent passer des usines contrôlées aux environnements chaotiques du commerce de détail, de l’hôtellerie et, éventuellement, de nos maisons.
L’horizon économique
Le timing de cette avancée correspond à un changement massif dans l’économie mondiale. Alors que des sociétés comme Boston Dynamics et Honor repoussent les limites du mouvement humanoïde, les analystes voient un marché en plein essor. Morgan Stanley prédit que le marché de la robotique pourrait atteindre 5 000 milliards de dollars d’ici 2050.
Pour que ce marché réalise son potentiel, les robots doivent aller au-delà du travail lourd et entrer dans le domaine des interactions complexes et quotidiennes. Les taux de réussite observés dans la génération 1, comme l’augmentation du taux de réussite de l’entretien d’un robot aspirateur de 50 % à 99 %, suggèrent que la transition des outils industriels vers les aides ménagères s’accélère.
“Nous commençons à constater de réels progrès et sommes ravis de repousser les limites de l’intelligence incarnée.” — Pete Florence, co-fondateur et PDG de Generalist AI
Conclusion
En formant l’IA aux nuances subtiles du toucher humain plutôt qu’à de simples commandes rigides, l’IA généraliste rapproche la robotique d’une véritable autonomie. Ce passage de la répétition programmée à l’improvisation physique est la clé pour introduire des robots utiles et fiables dans nos maisons et nos lieux de travail.
