Marzenie o robocie, który potrafi złożyć pranie, posprzątać biurko, a nawet dokładnie przeliczyć papierowe pieniądze, zmienia się z science fiction w rzeczywistość. Podczas gdy poprzednie generacje robotyki uległy nieprzewidywalności świata fizycznego, nowe przełomy w fizycznej sztucznej inteligencji wypełniają lukę pomiędzy twardym programowaniem a ludzką zręcznością.
Przełom Gen-1
Kalifornijska firma Generalist AI zaprezentowała Gen-1, nowy fizyczny model sztucznej inteligencji zaprojektowany tak, aby działał jako „mózg” ogólnego przeznaczenia dla różnych systemów robotycznych. W przeciwieństwie do tradycyjnych modeli, które mogą współpracować tylko z konkretnym manipulatorem przemysłowym, Gen-1 jest niezależny od platformy. Oznacza to, że może kontrolować wszystko, od robota humanoidalnego po stacjonarną maszynę przemysłową.
Możliwości modelu najlepiej można wykazać, wykonując drobne zadania — czynności wymagające umiejętności motorycznych oraz zrozumienia tekstury i tarcia. Najnowsze dema obejmują:
– Obsługa waluty: Pomyślne wyjmowanie i ponowne wkładanie cienkich papierowych banknotów do portfela.
– Prace domowe: sortowanie skarpetek według koloru i układanie ich w schludne stosy.
– Zadania precyzyjne: rozpakowywanie piórnika, układanie pomarańczy w piramidę i podłączanie kabli Ethernet.
Rozwiązywanie problemu danych: „Ręce z danych”
Aby zrozumieć, dlaczego jest to milowy krok naprzód, musimy przyjrzeć się głównej przeszkodzie w robotyce: niedoborowi danych.
Podczas gdy duże modele językowe (takie jak ChatGPT) były szkolone na rozległych obszarach Internetu, roboty nie mają podobnego „Internetu ruchów fizycznych”. Większość robotów jest szkolona przy użyciu metody telekontroli, podczas której człowiek zdalnie steruje robotem, aby nauczyć go wykonywania zadania. Jest to proces powolny i trudny do skalowania.
Generalistyczna sztuczna inteligencja ominęła to wąskie gardło, przyjmując bardziej organiczne podejście. Udostępnili technologię do noszenia ludziom na całym świecie, umożliwiając im wykonywanie milionów różnych zadań. Dzięki temu sztuczna inteligencja otrzymała tak zwane „dane dłoni” – ogromny zbiór danych rejestrujących najsubtelniejsze niuanse ludzkich ruchów, takie jak:
* Opinia dotykowa: zrozumienie, jak trudno jest wywrzeć nacisk na obiekt.
* Przesuwanie i odzyskiwanie: możliwość dostosowania chwytu, jeśli obiekt zacznie się ślizgać.
* Modulacja siły: możliwość odróżnienia miękkiej skarpety od twardego smartfona.
Dane te pozwalają robotowi rozwinąć „fizyczny zdrowy rozsądek”, przechodząc od wykonywania sztywnych, z góry określonych instrukcji do intuicyjnego zrozumienia zachowania obiektów.
Od sztywnego programowania po robotyczną improwizację
Jedną z najbardziej znaczących zmian zademonstrowanych przez Gen-1 jest przejście w kierunku improwizacji.
Tradycyjnie, jeśli robot napotkał najmniejszą zmianę w swoim otoczeniu – na przykład część znajdowała się nieco dalej, niż oczekiwano – po prostu przestał działać. Gen-1 została zaprojektowana tak, aby „podejmować decyzje w drodze”. Na przykład podczas montażu samochodu model wykazał się umiejętnością używania dwóch rąk do zmiany położenia części, mimo że został przeszkolony w posługiwaniu się tylko jedną ręką. Ta zdolność dostosowywania się do nieoczekiwanego jest kluczowa, jeśli roboty mają przenieść się poza kontrolowaną halę produkcyjną do chaotycznego otoczenia sklepów, zakładów usługowych, a ostatecznie naszych domów.
Horyzonty gospodarcze
Moment tego przełomu technologicznego zbiega się z głównymi zmianami w gospodarce światowej. W miarę jak firmy takie jak Boston Dynamics i Honor przesuwają granice możliwości humanoidalnych robotów, analitycy dostrzegają wyłaniający się gigantyczny rynek. Morgan Stanley przewiduje, że do 2050 r. rynek robotyki może osiągnąć 5 bilionów dolarów.
Aby rynek ten mógł wykorzystać swój potencjał, roboty muszą wyjść poza podnoszenie ciężkich przedmiotów i wkroczyć w sferę złożonych, codziennych interakcji. Wskaźniki sukcesu zaprezentowane przez Gen-1 – takie jak zwiększenie wydajności konserwacji robota odkurzającego z 50% do 99% – sugerują, że przejście od narzędzi przemysłowych do asystentów domowych nabiera tempa.
„Zaczynamy widzieć prawdziwy postęp i jesteśmy podekscytowani przesuwaniem granic ucieleśnionej inteligencji”. — Pete Florence, współzałożyciel i dyrektor generalny Generalist AI
Wniosek
Ucząc AI subtelnych niuansów ludzkiego dotyku, a nie tylko twardych poleceń, Generalistyczna sztuczna inteligencja przybliża robotykę do prawdziwej autonomii. To przejście od zaprogramowanych powtórzeń do fizycznej improwizacji jest kluczem do wprowadzenia użytecznych i niezawodnych robotów do naszych domów i miejsc pracy.
