BiznesChatbotLLM

Grok 4 debiutuje z abonamentem SuperGrok Heavy i kontrowersjami

Firma xAI, należąca do Elona Muska, zaprezentowała swój najnowszy flagowy model sztucznej inteligencji, Grok 4. Wraz z nim ogłoszono wprowadzenie nowej, ekskluzywnej subskrypcji SuperGrok Heavy, której koszt ustalono na 300 dolarów miesięcznie. Model Grok ma być bezpośrednią odpowiedzią na rozwiązania takie jak ChatGPT OpenAI czy Gemini Google’a, oferując zdolność do analizy obrazów i interaktywnego odpowiadania na pytania. W ostatnich miesiącach Grok został głębiej zintegrowany z platformą X, co spotęgowało jego widoczność, ale również uwypukliło pewne incydenty związane z jego zachowaniem.

Przed Grokiem 4 stoją wysokie oczekiwania, zwłaszcza w kontekście zbliżającej się premiery GPT-5 od OpenAI, spodziewanej jeszcze tego lata. Elon Musk, podczas środowej transmisji na żywo, z entuzjazmem stwierdził, że „Grok 4 jest lepszy niż poziom doktorancki w każdym przedmiocie, bez wyjątku” w odniesieniu do pytań akademickich. Jednocześnie przyznał, że modelowi „czasem może brakować zdrowego rozsądku” i „nie wynalazł jeszcze nowych technologii ani nie odkrył nowej fizyki, ale to tylko kwestia czasu”.

Debiut Groka 4 zbiega się z burzliwym tygodniem dla firm Elona Muska. W środę Linda Yaccarino zrezygnowała ze stanowiska CEO platformy X po niemal dwóch latach. Jej odejście nastąpiło zaledwie kilka dni po tym, jak oficjalne, zautomatyzowane konto Groka na X odpowiedziało użytkownikom antysemickimi komentarzami, krytykującymi „żydowskich executive’ów Hollywood” i chwalącymi Hitlera. Incydent zmusił xAI do tymczasowego ograniczenia działania konta Groka i usunięcia obraźliwych wpisów. W odpowiedzi na to zdarzenie, xAI najwyraźniej usunęło niedawno dodaną sekcję z publicznych instrukcji systemowych Groka, która informowała chatbota, by nie unikał „politycznie niepoprawnych” stwierdzeń. Musk i inni przedstawiciele xAI w dużej mierze unikali dyskusji na temat incydentu, koncentrując się na wydajności i możliwościach Groka 4.

W środę xAI zaprezentowało dwa modele: Grok 4 oraz Grok 4 Heavy, przy czym ten drugi to „wieloagentowa wersja” firmy, oferująca zwiększoną wydajność. Musk podkreślił, że Grok 4 Heavy generuje wielu agentów, którzy jednocześnie pracują nad jednym problemem, a następnie porównują swoje wyniki „jak grupa studyjna”, aby znaleźć najlepszą odpowiedź.

Firma twierdzi, że Grok 4 osiąga „frontier-level performance” w kilku benchmarkach, w tym w teście Humanity’s Last Exam — wymagającym sprawdzeniu zdolności sztucznej inteligencji do odpowiadania na tysiące pytań crowdsourcingowych z różnych dziedzin, takich jak matematyka, nauki humanistyczne i przyrodnicze. Według xAI, Grok 4 uzyskał 25,4% w teście Humanity’s Last Exam „bez narzędzi”, przewyższając Google’a Gemini 2.5 Pro (21,6%) i OpenAI o3 (high) (21%). xAI twierdzi, że Grok 4 Heavy, „z narzędziami”, osiągnął wynik 44,4%, prześcigając Gemini 2.5 Pro z narzędziami, które uzyskało 26,9%.

Fundacja non-profit Arc Prize informuje, że Grok osiąga nowy, najnowocześniejszy wynik w teście ARC-AGI-2 — kolejnym trudnym benchmarku składającym się z zadań przypominających łamigłówki, w których sztuczna inteligencja musi identyfikować wzorce wizualne — uzyskując 16,2%. To niemal dwukrotnie więcej niż wynik najlepszego komercyjnego modelu AI, Claude Opus 4.

Obok Groka 4 i Groka 4 Heavy, xAI uruchomiło swój najdroższy plan subskrypcyjny AI, nazwany SuperGrok Heavy, kosztujący wspomniane 300 dolarów miesięcznie. Subskrybenci tego planu otrzymają wczesny podgląd Groka 4 Heavy, a także wcześniejszy dostęp do nowych funkcji. Plan jest zbliżony do ultra-premium tiers oferowanych przez OpenAI, Google i Anthropic, jednak xAI w tej chwili oferuje najdroższą subskrypcję wśród głównych dostawców AI.

Abonenci SuperGrok Heavy mogą również uzyskać wczesny dostęp do niektórych nowych produktów, które xAI planuje wprowadzić w nadchodzących miesiącach. Firma podała w środę, że model kodowania AI pojawi się w sierpniu, wielomodalny agent we wrześniu, a model generowania wideo w październiku.

xAI udostępnia Groka 4 poprzez swoje API, aby zachęcić deweloperów do tworzenia aplikacji z wykorzystaniem tego modelu. Firma zauważa, że sektor korporacyjny xAI ma zaledwie dwa miesiące; planuje jednak współpracować z dostawcami hiperskalerów, aby udostępnić Groka za pośrednictwem ich platform chmurowych. Mimo wysokiej wydajności Groka w benchmarkach, firmie xAI może być trudno przezwyciężyć niedawne wpadki, próbując jednocześnie przedstawić Groka jako realnego konkurenta dla ChatGPT, Claude’a i Gemini. Niezależnie od tego, czy biznesy będą gotowe zaakceptować Groka, z jego wadami i zaletami, okaże się w przyszłości.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *