Мрія про роботу, який може скласти вашу білизну, навести лад на робочому столі або навіть акуратно перерахувати паперові гроші, перетворюється з наукової фантастики на реальність. У той час як попередні покоління робототехніки пасували перед непередбачуваністю фізичного світу, новий прорив у сфері фізичного ІІ дозволяє подолати розрив між жорстким програмуванням і людською спритністю.
Прорив Gen-1
Компанія Generalist AI, що базується в Каліфорнії, представила Gen-1 — нову модель фізичного ІІ, призначену для виконання функцій універсального “мозку” для різних робототехнічних систем. На відміну від традиційних моделей, які можуть працювати тільки з конкретним промисловим маніпулятором, Gen-1 є платформонезалежним. Це означає, що вона може керувати будь-чим: від людиноподібного робота до стаціонарного промислового механізму.
Можливості моделі найкраще демонструються через виконання «тонких» завдань – дій, що вимагають дрібної моторики, а також розуміння текстури та тертя. Останні демонстрації включають:
– Робота з валютою: успішне вилучення та повторне розміщення тонких паперових купюр у гаманець.
– Домашні справи: сортування шкарпеток за кольором та складання їх в акуратні стоси.
– Прецизійні завдання: розстібка блискавки на пеналі, викладання апельсинів пірамідкою та підключення Ethernet-кабелів.
Вирішення проблеми даних: «Руки з даних»
Щоб зрозуміти, чому це є якісним стрибком уперед, потрібно поглянути на головну перешкоду в робототехніці: дефіцит даних.
Якщо великі мовні моделі (такі як ChatGPT) навчалися на безкрайніх просторах інтернету, то роботи не мають подібного «інтернету фізичних рухів». Більшість роботів навчаються методом телеуправління, коли людина дистанційно керує роботом, щоб навчити його задачі. Це повільний процес, який важко масштабувати.
Generalist AI обійшла це “вузьке місце”, використовуючи більш органічний підхід. Вони розповсюдили носні технології серед людей по всьому світу, дозволяючи їм виконувати мільйони різних завдань. Це забезпечило ІІ так званими “даними рук” – величезним набором даних, що фіксує найтонші нюанси людських рухів, таких як:
* Тактильний зворотний зв’язок: розуміння того, з якою силою потрібно тиснути на об’єкт.
* ** Ковзання та відновлення: ** вміння коригувати захоплення, якщо предмет починає вислизати.
* Модуляція сили: здатність відрізнити м’який носок від твердого смартфона.
Ці дані дозволяють роботу розвивати «фізичний здоровий глузд», переходячи від виконання жорстких, заздалегідь заданих інструкцій до інтуїтивного розуміння того, як поводяться об’єкти.
Від жорсткого програмування до роботизованої імпровізації
Одним з найбільш значущих зрушень, продемонстрованих Gen-1, є перехід до імпровізації.
Традиційно, якщо робот стикався з найменшою зміною середовища — наприклад, деталь виявлялася трохи далі, ніж очікувалося, — він просто припиняв роботу. Gen-1 спроектована так, щоб “приймати рішення на ходу”. Наприклад, у задачі зі збирання автомобілів модель продемонструвала здатність використовувати дві руки для перепозиціонування деталі, хоча навчалася використовувати лише одну. Ця здатність адаптуватися до непередбачених обставин є вкрай важливою для того, щоб роботи могли вийти за межі контрольованих заводських цехів у хаотичне середовище магазинів, сфери послуг і, зрештою, наших будинків.
Економічні горизонти
Час цього технологічного прориву збігається із масштабними зрушеннями у світовій економіці. У той час як такі компанії, як Boston Dynamics і Honor, розсувають межі можливостей людиноподібних роботів, аналітики бачать гігантський ринок, що зароджується. Morgan Stanley прогнозує, що до 2050 року ринок робототехніки може досягти 5 трильйонів доларів.
Щоб цей ринок реалізував свій потенціал, роботи повинні вийти за рамки переміщення важких речей і перейти у сферу складних повсякденних взаємодій. Показники успіху, продемонстровані Gen-1 – наприклад, збільшення ефективності обслуговування робота-пилососа з 50% до 99% – говорять про те, що перехід від промислових інструментів до домашніх помічників пришвидшується.
«Ми починаємо бачити реальний прогрес і з натхненням розширюємо межі втіленого інтелекту (embodied intelligence)» – Піт Флоренс, співзасновник і генеральний директор Generalist AI *
Висновок
Навчаючи ІІ найтонших аспектів людського дотику, а не просто жорстким командам, Generalist AI наближає робототехніку до справжньої автономності. Цей перехід від запрограмованого повторення до фізичної імпровізації є ключем до того, щоб корисні та надійні роботи увійшли до наших будинків та робочих місць.





























































