BiznesData Science

Datacurve pozyskuje 15 milionów dolarów, rzucając wyzwanie ScaleAI w walce o dane dla AI

W miarę jak firmy działające w obszarze sztucznej inteligencji dojrzewają, dostęp do wysokiej jakości danych staje się jednym z najbardziej konkurencyjnych obszarów w branży. Powstają nowe firmy, takie jak Mercor, Surge i, przede wszystkim, ScaleAI Alexandra Wanga. Jednak po przejściu Wanga do Meta, wielu inwestorów dostrzega szansę i jest gotowych finansować firmy z nowymi strategiami pozyskiwania danych treningowych.

Datacurve, absolwent Y Combinator, jest jedną z takich firm, koncentrującą się na wysokiej jakości danych dla rozwoju oprogramowania. Firma ogłosiła pozyskanie 15 milionów dolarów w rundzie finansowania Serii A, prowadzonej przez Marka Goldberga z Chemistry, z udziałem pracowników DeepMind, Vercel, Anthropic i OpenAI. Runda Serii A następuje po rundzie seed o wartości 2,7 miliona dolarów, w której zainwestował były dyrektor ds. technologii Coinbase, Balaji Srinivasan.

Model „Bounty Hunter”

Datacurve wykorzystuje system „bounty hunter” (łowca nagród), aby przyciągnąć wykwalifikowanych inżynierów oprogramowania do tworzenia najtrudniejszych do zdobycia zbiorów danych. Firma płaci za te wkłady, wypłacając dotychczas ponad 1 milion dolarów w nagrodach. Jednak współzałożycielka Serena Ge twierdzi, że największą motywacją nie są finanse. W przypadku usług o wysokiej wartości, takich jak rozwój oprogramowania, wynagrodzenie za pracę z danymi zawsze będzie znacznie niższe niż w przypadku konwencjonalnego zatrudnienia – dlatego najważniejszą przewagą firmy jest pozytywne doświadczenie użytkownika.

„Traktujemy to jako produkt konsumencki, a nie operację etykietowania danych” – powiedziała Ge. „Poświęcamy dużo czasu na zastanawianie się nad tym: Jak możemy to zoptymalizować, aby osoby, których chcemy, były zainteresowane i weszły na naszą platformę?” Jest to szczególnie ważne, ponieważ potrzeby związane z danymi po treningu stają się coraz bardziej złożone.

Rosnące zapotrzebowanie na dane wysokiej jakości

O ile wcześniejsze modele były trenowane na prostych zbiorach danych, dzisiejsze produkty AI opierają się na złożonych środowiskach RL (uczenia ze wzmocnieniem), które muszą być tworzone poprzez konkretne i strategiczne zbieranie danych. Wraz ze wzrostem złożoności środowisk, wymagania dotyczące danych stają się bardziej intensywne zarówno pod względem ilości, jak i jakości – czynnik, który może dać firmom zajmującym się zbieraniem danych wysokiej jakości, takim jak Datacurve, przewagę.

Jako firma na wczesnym etapie rozwoju, Datacurve koncentruje się na inżynierii oprogramowania, ale Ge twierdzi, że model można równie łatwo zastosować w dziedzinach takich jak finanse, marketing, a nawet medycyna. „To, co robimy w tej chwili, to tworzenie infrastruktury do zbierania danych po treningu, która przyciąga i zatrzymuje wysoce kompetentnych ludzi w ich własnych dziedzinach” – mówi Ge.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *