Мечта о роботе, который может сложить ваше белье, навести порядок на рабочем столе или даже аккуратно пересчитать бумажные деньги, превращается из научной фантастики в реальность. В то время как предыдущие поколения робототехники пасовали перед непредсказуемостью физического мира, новый прорыв в области физического ИИ (Physical AI) позволяет преодолеть разрыв между жестким программированием и человеческой ловкостью.
Прорыв Gen-1
Компания Generalist AI, базирующаяся в Калифорнии, представила Gen-1 — новую модель физического ИИ, предназначенную для выполнения функций универсального «мозга» для различных робототехнических систем. В отличие от традиционных моделей, которые могут работать только с конкретным промышленным манипулятором, Gen-1 является платформонезависимой. Это означает, что она может управлять чем угодно: от человекоподобного робота до стационарного промышленного механизма.
Возможности модели лучше всего демонстрируются через выполнение «тонких» задач — действий, требующих мелкой моторики, а также понимания текстуры и трения. Последние демонстрации включают:
— Работа с валютой: успешное извлечение и повторное помещение тонких бумажных купюр в кошелек.
— Домашние дела: сортировка носков по цвету и складывание их в аккуратные стопки.
— Прецизионные задачи: расстегивание молнии на пенале, выкладывание апельсинов пирамидкой и подключение Ethernet-кабелей.
Решение проблемы данных: «Руки из данных»
Чтобы понять, почему это является качественным скачком вперед, нужно взглянуть на главное препятствие в робототехнике: дефицит данных.
Если большие языковые модели (такие как ChatGPT) обучались на бескрайних просторах интернета, то у роботов нет подобного «интернета физических движений». Большинство роботов обучаются методом телеуправления, когда человек дистанционно управляет роботом, чтобы обучить его задаче. Это медленный процесс, который трудно масштабировать.
Generalist AI обошла это «узкое место», используя более органичный подход. Они распространили носимые технологии среди людей по всему миру, позволяя им выполнять миллионы различных задач. Это обеспечило ИИ так называемыми «данными рук» — огромным набором данных, фиксирующим тончайшие нюансы человеческих движений, таких как:
* Тактильная обратная связь: понимание того, с какой силой нужно давить на объект.
* Скольжение и восстановление: умение корректировать захват, если предмет начинает выскальзывать.
* Модуляция силы: способность отличить мягкий носок от твердого смартфона.
Эти данные позволяют роботу развивать «физический здравый смысл», переходя от выполнения жестких, заранее заданных инструкций к интуитивному пониманию того, как ведут себя объекты.
От жесткого программирования к роботизированной импровизации
Одним из наиболее значимых сдвигов, продемонстрированных Gen-1, является переход к импровизации.
Традиционно, если робот сталкивался с малейшим изменением среды — например, деталь оказывалась чуть дальше, чем ожидалось, — он просто прекращал работу. Gen-1 спроектирована так, чтобы «принимать решения на ходу». Например, в задаче по сборке автомобилей модель продемонстрировала способность использовать две руки для перепозиционирования детали, хотя обучалась использовать только одну. Эта способность адаптироваться к непредвиденным обстоятельствам крайне важна для того, чтобы роботы могли выйти за пределы контролируемых заводских цехов в хаотичную среду магазинов, сферы услуг и, в конечном итоге, наших домов.
Экономические горизонты
Время этого технологического прорыва совпадает с масштабными сдвигами в мировой экономике. В то время как такие компании, как Boston Dynamics и Honor, раздвигают границы возможностей человекоподобных роботов, аналитики видят зарождающийся гигантский рынок. Morgan Stanley прогнозирует, что к 2050 году рынок робототехники может достичь 5 триллионов долларов.
Чтобы этот рынок реализовал свой потенциал, роботы должны выйти за рамки перемещения тяжестей и перейти в сферу сложных повседневных взаимодействий. Показатели успеха, продемонстрированные Gen-1 — например, увеличение эффективности обслуживания робота-пылесоса с 50% до 99% — говорят о том, что переход от промышленных инструментов к домашним помощникам ускоряется.
«Мы начинаем видеть реальный прогресс и с воодушевлением расширяем границы воплощенного интеллекта (embodied intelligence)» — Пит Флоренс, соучредитель и генеральный директор Generalist AI
Заключение
Обучая ИИ тончайшим нюансам человеческого осязания, а не просто жестким командам, Generalist AI приближает робототехнику к истинной автономности. Этот переход от запрограммированного повторения к физической импровизации является ключом к тому, чтобы полезные и надежные роботы вошли в наши дома и на рабочие места.





























