Nomadic przejmuje kontrolę nad chaosem danych w autonomii. 8,4 mln dolarów na rozwój „modelu dla modeli”
W sektorze pojazdów autonomicznych i fizycznej sztucznej inteligencji (Physical AI) panuje paradoks: firmy dysponują petabajtami danych, z których większość pozostaje bezużyteczna. Twórcy robotów i maszyn budowlanych gromadzą miliony godzin nagrań, ale ich selekcja wciąż opiera się na żmudnej pracy ludzkich analityków. NomadicML, startup założony przez absolwentów Harvardu, Mustafę Balę i Varuna Krishnana, zamierza to zmienić. Spółka właśnie zabezpieczyła 8,4 mln dolarów w rundzie seed przy wycenie na poziomie 50 mln dolarów.
Koniec z ręcznym przeglądaniem nagrań
Tradycyjne podejście do analizy danych wideo nie skaluje się. Nawet przy wielokrotnym przyspieszeniu, człowiek nie jest w stanie efektywnie przeszukać archiwów w poszukiwaniu tzw. *edge cases* – rzadkich zdarzeń drogowych, które są kluczowe dla bezpieczeństwa systemów autonomicznych. To właśnie te nietypowe sytuacje, jak chociażby reagowanie na sygnały policjanta kierującego ruchem mimo czerwonego światła, stanowią o wartości szkoleniowej zbioru danych.
NomadicML proponuje platformę opartą na modelach wizyjno-językowych (VLM), która przekształca surowe nagrania w uporządkowane bazy danych. Zamiast przeglądać setki godzin materiału, inżynierowie mogą po prostu zapytać system o konkretne sytuacje, jak przejazdy pod określonym typem wiaduktu czy specyficzne interakcje na skrzyżowaniach. System nie tylko etykietuje dane, ale działa jako agent rozumiejący kontekst akcji.
Dostrzec to, co istotne dla fizyki robotów
Inwestycja, której przewodził fundusz TQ Ventures przy udziale m.in. Jeffa Deana (szefa Google DeepMind), ma pozwolić firmie na wyjście poza analizę czysto wizualną. Ambitnym celem zespołu jest integracja danych z sensorów LiDAR oraz innych trybów modalnych. Obecnie platforma Nomadic jest już wykorzystywana przez takich graczy jak Zoox (należący do Amazona), Mitsubishi Electric czy Zendar.
Krytycy zwracają uwagę, że rynek adnotacji danych jest nasycony przez gigantów takich jak Scale AI czy Kognic. Jednak założyciele NomadicML argumentują, że ich rozwiązanie to coś więcej niż cyfrowe „naklejanie etykiet”. To warstwa infrastruktury, która pozwala konstruktorom robotów skupić się na ich budowie i algorytmach sterowania, zamiast na budowaniu wewnętrznych działów *data science* do obsługi gigantycznych archiwów. Jak zauważa Schuster Tanger z TQ Ventures, analogia jest prosta: tak jak Netflix nie buduje własnych serwerowni od zera, tak twórcy autonomicznych systemów nie powinni tracić energii na budowanie własnych narzędzi do zarządzania szumem informacyjnym.
W stronę precyzyjnej inżynierii danych
Wyzwania techniczne stojące przed NomadicML są ogromne. Proces „zderzania” terabajtów wideo z modelami liczącymi ponad 100 miliardów parametrów wymaga nie tylko potężnej mocy obliczeniowej, ale przede wszystkim precyzji w wyciąganiu wniosków. Startup zatrudniający elitę inżynierów z Lyfta czy Snowflake’a, pracuje nad narzędziami, które potrafią analizować fizykę zmiany pasa ruchu czy precyzyjnie określać położenie chwytaków robota na nagraniu. Wyścig o dominację w sektorze fizycznej AI nie zostanie wygrany przez tego, kto ma najwięcej danych, ale przez tego, kto najszybciej wyłuska z nich te najbardziej wartościowe.
