Robotyka

SPEAR-1: przełom w robotyce dzięki otwartemu modelowi 3D

Współczesna robotyka stoi u progu rewolucji, a jej katalizatorem mogą okazać się otwarte modele sztucznej inteligencji. Analogicznie do wpływu otwartych modeli językowych na rozwój generatywnej AI, teraz pojawia się nadzieja na podobny przełom w świecie maszyn fizycznych. Dowodem na to jest SPEAR-1, potężny otwarty model sztucznej inteligencji, opracowany przez naukowców z Instytutu Informatyki, Sztucznej Inteligencji i Technologii (INSAIT) w Bułgarii.

SPEAR-1: nowe perspektywy dla robotów

Model SPEAR-1 ma potencjał, aby znacząco przyspieszyć proces tworzenia i eksperymentowania z inteligentniejszym sprzętem w fabrykach i magazynach. Jego kluczową innowacją jest integracja danych 3D w procesie szkolenia. W przeciwieństwie do istniejących fundamentalnych modeli robotycznych, które w dużej mierze opierają się na wizualno-językowych modelach (VLM) trenowanych na dwuwymiarowych obrazach, SPEAR-1 uzyskuje znacznie głębsze zrozumienie świata fizycznego.

Martin Vechev, naukowiec z INSAIT i ETH Zurich, podkreśla, że otwarte modele są kluczowe dla postępu w dziedzinie ucieleśnionej sztucznej inteligencji. „Nasze podejście rozwiązuje problem niezgodności między trójwymiarową przestrzenią, w której działa robot, a wiedzą VLM, która stanowi rdzeń fundamentalnego modelu robotycznego” – wyjaśnia Vechev.

Wyniki testów na platformie RoboArena, która ocenia zdolność robota do wykonywania zadań takich jak ściskanie butelki z keczupem czy spinanie papieru, pokazują, że SPEAR-1 dorównuje komercyjnym fundamentalnym modelom. Plasuje się na poziomie zbliżonym do Pi-0.5, stworzonego przez startup Physical Intelligence, co świadczy o jego wysokiej skuteczności i konkurencyjności.

Dążenie do inteligentniejszych maszyn

Wyścig o stworzenie bardziej inteligentnych robotów to gra o miliardy dolarów. Rozwój wszechstronnie zdolnych robotów napędza inwestycje w start-upy takie jak Skild czy Generalist, obok Physical Intelligence. Pojawienie się SPEAR-1 sugeruje, że przyszłość inteligentnej robotyki będzie prawdopodobnie kształtowana zarówno przez modele zamknięte, takie jak te oferowane przez OpenAI czy Google, jak i warianty open source, na wzór Llama, DeepSeek i Qwen.

Niezaprzeczalnie, inteligencja robotów jest wciąż w początkowej fazie rozwoju. Obecnie, chociaż możliwe jest wytrenowanie modelu AI do obsługi ramienia robota w celu precyzyjnego podnoszenia obiektów z powierzchni, wymaga to ponownego szkolenia od podstaw, jeśli zmieni się typ ramienia robota, obiekt lub otoczenie.

Badacze robotyki mają nadzieję, że powtórzenie strategii, która doprowadziła do sukcesu dużych modeli językowych – ogromne ilości danych szkoleniowych i moc obliczeniowa – w końcu zaowocuje modelami robotycznymi o podobnych, ogólnych zdolnościach. Oznaczałoby to roboty zdolne do szybkiej adaptacji do nowych sytuacji i zadań, a docelowo nawet humanoidalne maszyny operujące w złożonych i nieznanych środowiskach dzięki ogólnemu zrozumieniu świata.

Karl Pertsch, badacz z Physical Intelligence, zauważa, że choć jest jeszcze za wcześnie, aby ocenić pełny wpływ danych szkoleniowych 3D na fundamentalne modele robotyczne, SPEAR-1 jest dowodem dynamicznego postępu w tworzeniu bardziej ogólnych modeli robotycznych. „Wspaniale jest widzieć, jak grupy akademickie tworzą ogólne strategie, które można oceniać w różnorodnych środowiskach i które osiągają znaczącą wydajność. Jeszcze rok temu było to niemożliwe” – podsumowuje Pertsch.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *