Robotyka

Koniec ery żmudnego przyuczania robotów? Ai2 udowadnia siłę danych syntetycznych

W świecie robotyki tradycyjna ścieżka rozwoju agentów fizycznych przypomina syzyfową pracę. Aby nauczyć maszynę prostego chwytania przedmiotów, giganci technologiczni, tacy jak Google DeepMind czy ośrodki badawcze skupione wokół projektu DROID, inwestują setki godzin pracy wykwalifikowanych operatorów, którzy zdalnie sterują urządzeniami, tworząc bazy danych liczące dziesiątki tysięcy przykładów. To proces nie tylko nieludzko nudny, ale przede wszystkim elitarny – stać na niego tylko najbogatsze laboratoria.

Demokratyzacja poprzez symulację

Badacze z Allen Institute for AI (Ai2) postanowili przełamać ten paradygmat, prezentując projekt MolmoBot. To rodzina modeli do manipulacji robotycznej, która została wytrenowana wyłącznie na danych syntetycznych. Zamiast polegać na materiałach wideo z udziałem ludzi, zespół wykorzystał proces generatywny w środowisku MolmoSpaces. Wynik? Ponad 1,8 miliona trajektorii ruchu wygenerowanych proceduralnie, co pozwala pominąć najbardziej kosztowny etap produkcji AI: czynnik ludzki.

Kluczem do sukcesu okazało się połączenie silnika fizycznego MuJoCo z agresywną randomizacją domen. System nie uczy się jednego, idealnego scenariusza. Zamiast tego bombardowany jest miliardami wariacji dotyczących oświetlenia, tekstur obiektów, punktów widzenia kamer i dynamiki ruchu. Jak zauważa Ranjay Krishna z Ai2, zamiast próbować zasypywać lukę między symulacją a rzeczywistością (tzw. sim-to-real gap) za pomocą realnych danych, badacze postawili na radykalne zwiększenie różnorodności wirtualnego świata. Okazuje się, że kiedy symulacja jest wystarczająco bogata, bariera ta przestaje istnieć.

Skuteczność mierzona faktami

Liczby przemawiają na korzyść nowego podejścia. Dzięki wykorzystaniu setki procesorów graficznych Nvidia A100, potok danych Ai2 był w stanie wygenerować 130 godzin doświadczenia robota w zaledwie jedną godzinę czasu rzeczywistego. To niemal czterokrotnie wyższa przepustowość niż w przypadku tradycyjnego zbierania danych przez ludzi. Efektywność kosztowa idzie tu w parze z czystymi osiągami.

Podczas testów fizycznych na robotach Rainbow Robotics RB-Y1 oraz ramionach Franka FR3, MolmoBot wykazał zdolność do transferu wiedzy „zero-shot”. Oznacza to, że maszyny radziły sobie z nowymi przedmiotami i otoczeniem bez żadnego dodatkowego douczania. W testach typu pick-and-place model MolmoBot osiągnął 79,2% skuteczności, miażdżąc konkurencyjny model π0.5 (trenowany na danych rzeczywistych), który uzyskał zaledwie 39,2%.

Otwarty standard zamiast zamkniętych ekosystemów

Strategia Ai2 to nie tylko techniczny popis, ale też manifest polityczny w świecie technologii. Ujawnianie całego stosu technologicznego – od zestawów danych MolmoBot-Data, poprzez potoki generatywne, aż po same architektury modeli – ma umożliwić globalnej społeczności naukowej budowanie na wspólnych fundamentach. Ali Farhadi, CEO Ai2, podkreśla, że robotyka nie może rozwijać się w izolowanych laboratoriach, jeśli ma stać się realnym narzędziem naukowym.

Dla biznesu i przemysłu oznacza to mniejszą zależność od zamkniętych systemów własnościowych i ogromnych infrastruktur zbierania danych. MolmoBot pokazuje, że droga do inteligentnych maszyn w fabrykach i laboratoriach może prowadzić nie przez hale pełne operatorów, lecz przez coraz doskonalsze, gęsto zaludnione cyfrowe światy.