Sztuczna inteligencja uczy roboty precyzyjnych zadań dzięki interakcji z człowiekiem
Naukowcy z UC Berkeley opracowali nowatorską metodę uczenia robotów, która łączy demonstracje, informacje zwrotne od ludzi i własne próby w rzeczywistym świecie. Efektem jest system o nazwie Human-in-the-Loop Sample Efficient Robotic Reinforcement Learning (HiL-SERL), który umożliwia robotom opanowanie złożonych zadań z niemal stuprocentową skutecznością.
Jednym z najbardziej spektakularnych przykładów jest opanowanie przez robota zadania „Jenga whipping”, polegającego na strąceniu pojedynczego klocka z wieży Jenga za pomocą uderzenia batem, bez naruszenia stabilności pozostałej konstrukcji. To wyzwanie, które sprawia trudność nawet ludziom, robot dzięki nowemu systemowi jest w stanie realizować bezbłędnie.
Jak to działa?
HiL-SERL opiera się na uczeniu przez wzmacnianie, gdzie robot uczy się na podstawie prób i błędów, korzystając z danych wizyjnych z kamer. Kluczowym elementem jest interwencja człowieka, który za pomocą specjalnego interfejsu może korygować ruchy robota. Te poprawki są następnie zapisywane i analizowane przez system, co przyspiesza proces uczenia.
„Za pierwszym razem, kiedy robot pokonał wyzwanie Jenga whipping, byłem naprawdę zszokowany”, powiedział Jianlan Luo, główny autor badania. „To zadanie jest bardzo trudne dla większości ludzi. Sam próbowałem i miałem zerową skuteczność.”
Wszechstronność systemu
Oprócz Jenga whipping, roboty poddano próbom w bardziej złożonych zadaniach: przewracanie jajka na patelni, przekazywanie przedmiotu z jednej ręki do drugiej oraz montaż płyty głównej komputera, deski rozdzielczej samochodu i paska rozrządu. Zadania te zostały wybrane ze względu na ich zróżnicowanie i reprezentowanie niepewności występującej podczas wykonywania zadań w rzeczywistym świecie.
Naukowcy testowali również zdolność adaptacji robotów, symulując awarie, takie jak upuszczenie przedmiotu przez chwytak czy przesunięcie płyty głównej podczas instalacji mikroprocesora. Celem było nauczenie robotów reagowania na zmieniające się sytuacje, z którymi mogą się spotkać poza laboratorium.
Przyszłość robotyki
Twórcy systemu HiL-SERL widzą jego zastosowanie przede wszystkim w produkcji na zamówienie, gdzie elastyczność i niezawodność robotów są kluczowe. Otwarty kod źródłowy ma umożliwić innym badaczom dalszy rozwój technologii.
„Kluczowym celem tego projektu jest uczynienie tej technologii tak dostępną i przyjazną dla użytkownika jak iPhone”, powiedział Luo. „Jestem przekonany, że im więcej osób będzie mogło z niej korzystać, tym większy wpływ możemy wywrzeć.”
