Narzędzia

Prime Intellect chce zrewolucjonizować rozwój SI, oddając w ręce każdego narzędzia do uczenia ze wzmocnieniem

W obliczu rosnącej popularności otwartych modeli SI, zwłaszcza tych pochodzących z Chin, amerykański startup Prime Intellect proponuje śmiałą wizję: zdemokratyzować proces uczenia ze wzmocnieniem (reinforcement learning), umożliwiając każdemu tworzenie i dostosowywanie zaawansowanych modeli.

Prime Intellect, specjalizujący się w zdecentralizowanej sztucznej inteligencji, pracuje nad modelem językowym INTELLECT-3. Wykorzystuje on innowacyjne podejście do uczenia ze wzmocnieniem. Jak twierdzi CEO firmy, Vincent Weisser, celem jest stworzenie konkurencyjnego, otwartego modelu SI, który nie będzie zależny od zasobów i infrastruktury dużych korporacji technologicznych.

Demokratyzacja SI – alternatywa dla zamkniętych rozwiązań

Weisser zauważa, że obecny krajobraz SI zdominowany jest przez zamknięte modele amerykańskie i otwarte modele chińskie. Rozwijana przez Prime Intellect technologia ma stanowić alternatywę, demokratyzując dostęp do zaawansowanej SI.

Kluczem do poprawy jakości modeli SI nie jest już tylko zwiększanie ilości danych treningowych i mocy obliczeniowej. Dzisiejsze modele wykorzystują uczenie ze wzmocnieniem do dalszego doskonalenia po wstępnym etapie trenowania. Chcesz, aby Twój model był ekspertem w matematyce, odpowiadał na pytania prawne lub rozwiązywał Sudoku? Umożliw mu doskonalenie poprzez ćwiczenia w środowisku, w którym można mierzyć sukces i porażkę.

Wąskie gardło rozwoju SI

„Środowiska uczenia ze wzmocnieniem stanowią obecnie wąskie gardło dla dalszego skalowania możliwości SI” – mówi Weisser.

Prime Intellect stworzył framework, który pozwala każdemu na tworzenie środowisk uczenia ze wzmocnieniem, dostosowanych do konkretnych zadań. Firma łączy najlepsze środowiska stworzone przez swój zespół i społeczność, aby dostroić INTELLECT-3.

Autor artykułu miał okazję przetestować środowisko do rozwiązywania łamigłówek Wordle, stworzone przez Willa Browna, badacza z Prime Intellect. Model poradził sobie zaskakująco dobrze. Jak zauważa autor, gdyby był badaczem SI, wykorzystałby to rozwiązanie do ciągłego trenowania modelu na dużej liczbie GPU, aby uczynić go mistrzem Wordle.

Uczenie ze wzmocnieniem – domena gigantów

Mimo rosnącego znaczenia, uczenie ze wzmocnieniem jest wciąż domeną dużych firm, ze względu na wysokie wymagania dotyczące wiedzy specjalistycznej i zasobów. Weisser uważa, że udostępnienie tej technologii startupom może doprowadzić do powstania nowych, wartościowych produktów, w tym agentów wyspecjalizowanych w różnych zadaniach.

Zgadza się z tym Andrej Karpathy, były szef zespołu AI w Tesli, który określił środowiska uczenia ze wzmocnieniem Prime Intellect jako „wspaniały wysiłek [i] pomysł”. Zachęca on badaczy open source do adaptowania różnych środowisk do nowych zadań, aby udoskonalać umiejętności zaawansowanych modeli.

Wyzwanie dla tradycyjnych metod

Prime Intellect udowodnił już, że metody rozproszone – w tym dzielenie obliczeń i łączenie ich w celu stworzenia jednego, większego modelu – mogą stanowić wyzwanie dla konwencjonalnych sposobów budowania SI. Pod koniec 2024 roku firma ogłosiła INTELLECT-1, 10-miliardowy model, wytrenowany z wykorzystaniem rozproszonego sprzętu. W marcu zaprezentowała większy i bardziej zaawansowany model, INTELLECT-2, z możliwościami rozumowania, które zostały włączone dzięki rozproszonemu uczeniu ze wzmocnieniem.

Krajobraz SI zmienił się dramatycznie w ciągu ostatnich dwóch lat. Meta zapoczątkowała erę otwartej SI, wypuszczając pierwszą wersję swojego modelu Llama w 2023 roku. Tymczasem DeepSeek, mało znany chiński startup, zszokował świat, prezentując w styczniu 2025 roku wydajny i tani model rozumowania. Za nim poszło kilka innych chińskich modeli SI. OpenAI odpowiedziało na sukces DeepSeek w sierpniu tego roku, wypuszczając swój pierwszy model open source od kilku lat, ale chińskie modele, takie jak Qwen Alibaby, Kimi z Moonshot i R1 DeepSeek, okazały się popularniejsze, być może dlatego, że są łatwe do modyfikacji i adaptacji.

„Wygląda na to, że USA wyczerpały swoje możliwości, jeśli chodzi o otwarte modele graniczne” – powiedział Weisser. „To jedna z rzeczy, które staramy się zmienić”.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *