Mira Murati stawia na specjalizację AI: Czy niestandardowe modele to przyszłość po OpenAI?
Decyzja Miry Murati, cenionej byłej dyrektor technologicznej OpenAI, o opuszczeniu giganta na rzecz własnego przedsięwzięcia, Thinking Machines Lab (TML), budzi wiele pytań i skłania do refleksji nad przyszłością sztucznej inteligencji. Zamiast kontynuować prace nad ogólną inteligencją (AGI), Murati, jak donosi The Information, skupia się na tworzeniu niestandardowych modeli AI, precyzyjnie dopasowanych do specyficznych potrzeb biznesowych.
Reinforcement learning kluczem do niestandardowych rozwiązań
TML koncentruje się na budowaniu modeli AI zoptymalizowanych pod kątem kluczowych wskaźników biznesowych klienta. Celem jest dostarczanie wyspecjalizowanych rozwiązań dla sektorów takich jak obsługa klienta, bankowość inwestycyjna czy handel detaliczny. Modele te mają być zaprojektowane tak, aby generować mierzalne rezultaty biznesowe i, co za tym idzie, być wyceniane na poziomie premium.
Według doniesień, fundamentem strategii TML jest uczenie ze wzmocnieniem (reinforcement learning, RL), gdzie modele są nagradzane za osiągnięcie ustalonych celów i karane za błędy. Ta technika, określana już przez inwestorów mianem „RL dla biznesu”, stoi za rozwojem modeli rozumowania, takich jak OpenAI o1. Zastosowanie RL dla specyficznych zastosowań jest zgodne z opiniami ekspertów, w tym badacza OpenAI, Rohana Pandeya, który uznaje paradygmat LLM-RL za szczególnie obiecujący dla pionowych startupów AI. Uczenie ze wzmocnieniem umożliwia głęboką specjalizację, co jest wyzwaniem nawet dla gigantów takich jak OpenAI.
Wykorzystanie otwartego kodu i doświadczony zespół
TML zamierza również wykorzystać warstwy sieci neuronowych z różnorodnych modeli open source, co przypomina technikę łączenia modeli, promowaną m.in. przez japoński startup Sakana AI. Choć modele open source dotychczas ustępowały komercyjnym systemom, takim jak GPT-4o, ostatnie projekty, jak Deepseek, wskazują na zmniejszającą się lukę. Murati liczy na to, że wykorzystanie otwartego oprogramowania pozwoli jej firmie szybciej wprowadzać produkty na rynek. Infrastruktura TML opiera się na serwerach Nvidia, dzierżawionych za pośrednictwem Google Cloud.
Ambicyjne plany Murati wykraczają poza klientów korporacyjnych. Rozważana jest również budowa chatbota dla konsumentów, który mógłby konkurować z ChatGPT. Zespół TML zasilają już topowi badacze i inżynierowie rekrutowani z OpenAI i Anthropic, w tym współzałożyciel OpenAI, John Schulman, oraz byli badacze OpenAI, Barret Zoph i Luke Metz. To wzmacnia spekulacje dotyczące potencjału TML i jej zdolności do rzucenia wyzwania ustanowionym graczom na rynku AI.
Dlaczego Murati opuściła OpenAI?
Odejście Murati z OpenAI nastąpiło po burzliwym okresie w firmie, a media spekulowały o jej rzekomych nieporozumieniach z dyrektorem generalnym Samem Altmanem, choć sama zainteresowana temu zaprzecza. Niemniej jednak, opuszczenie firmy, która według wielu jest na progu osiągnięcia AGI, rodzi pytania.
Dzięki wewnętrznej perspektywie na postępy OpenAI, Murati wybrała inną ścieżkę. Jednym z prawdopodobnych powodów jest model biznesowy. Choć AGI jest wizją odważną, niesie ze sobą istotne ryzyka i niepewność. Wyspecjalizowane modele, budowane z myślą o generowaniu przychodów i efektywności, mogą być rozwijane i skalowane znacznie szybciej, z mniejszą liczbą niewiadomych.
Istnieje również duża szansa, że Murati, podobnie jak wielu innych ekspertów w branży, nie uważa AGI za osiągalne przy obecnej technologii dużych modeli językowych (LLM). Jej strategia odzwierciedla to przekonanie: stawia na skoncentrowane, praktyczne rozwiązania, zamiast gonić za uniwersalną inteligencją. Czy to pragmatyczne podejście okaże się bardziej skuteczne niż wizja AGI, pokaże czas.
