Robotyka

Nowa metoda uczenia maszynowego pozwala robotom adaptować się do nieznanych zadań

Chodzenie i bieganie to dla ludzi czynności intuicyjne. Dostosowujemy krok i tempo bez zastanowienia. Jednak roboty, nawet te wyposażone w zaawansowaną sztuczną inteligencję, często mają problem z adaptacją do nowych, nieoczekiwanych zadań.

Nawet jeśli robot jest wytrenowany do szybkiego biegania, może mieć trudności z precyzyjnymi ruchami, takimi jak zmiana kąta nachylenia nóg lub dostosowanie siły, co często prowadzi do niestabilności. Zespół profesora Seungyula Hana z Graduate School of Artificial Intelligence na UNIST opracował nowatorską technikę meta-uczenia ze wzmocnieniem, która ma to zmienić.

Task-Aware Virtual Training (TAVT) – wirtualny poligon dla robotów

Wprowadzona przez nich metoda, nazwana Task-Aware Virtual Training (TAVT), pozwala sztucznej inteligencji generować i uczyć się na wirtualnych zadaniach, zwiększając jej zdolność do adaptacji do nieznanych wyzwań. System TAVT składa się z dwóch modułów: modułu reprezentacji opartego na głębokim uczeniu i modułu generowania. Moduł reprezentacji ocenia podobieństwa między różnymi zadaniami, tworząc przestrzeń ukrytą, która wychwytuje istotne cechy. Następnie moduł generowania syntetyzuje nowe, wirtualne zadania odzwierciedlające kluczowe aspekty rzeczywistych scenariuszy.

Jeongmo Kim, główny badacz projektu, wyjaśnia: „Tradycyjne uczenie ze wzmocnieniem trenuje agenta do osiągania doskonałości w konkretnym zadaniu, ograniczając jego zdolność do generalizacji. Meta-uczenie ze wzmocnieniem wystawia agenta na wiele zadań, ale adaptacja do zupełnie nowych, nieznanych sytuacji pozostaje wyzwaniem. Nasze podejście TAVT proaktywnie przygotowuje sztuczną inteligencję na takie scenariusze.”

Testy i wyniki

Zespół przetestował TAVT w różnych symulacjach robotycznych, w tym z gepardami, mrówkami i robotami dwunożnymi. W eksperymencie Cheetah-Vel-OOD roboty wykorzystujące TAVT szybko dostosowywały się do nieznanych wcześniej prędkości pośrednich (1,25 i 1,75 m/s), utrzymując stabilny i wydajny ruch. Roboty trenowane konwencjonalnie miały trudności z adaptacją, co prowadziło do utraty równowagi.

Profesor Han podkreśla: „Ta metoda znacząco poprawia zdolność sztucznej inteligencji do generalizacji w różnych zadaniach, co jest kluczowe dla zastosowań takich jak pojazdy autonomiczne, drony i roboty pracujące w nieprzewidywalnych środowiskach. Otwiera to drogę do bardziej elastycznych i odpornych systemów sztucznej inteligencji.”

Wyniki badań zostały zaprezentowane na International Conference on Machine Learning (ICML 2025). Praca ta podkreśla wysiłki na rzecz rozwoju podstawowych technologii AI i tworzenia innowacyjnych rozwiązań dla realnych wyzwań.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *