Kimi-K2: Nowy otwarty model AI z Chin rzuca wyzwanie gigantom
Wraz z debiutem Kimi-K2, chiński startup Moonshot AI, założony w 2023 roku, po raz kolejny zaznacza swoją obecność na globalnej scenie sztucznej inteligencji. Model ten, bazujący na architekturze typu Mixture-of-Experts i posiadający bilion parametrów, z czego 32 miliardy aktywowane są podczas pojedynczej inferencji, stanowi próbę dorównania, a nawet przekroczenia możliwości czołowych, zamkniętych modeli językowych, takich jak Claude Sonnet 4 czy GPT-4.1.
Cechą wyróżniającą Kimi-K2 jest jego „otwartość” – otwarta waga modelu umożliwia badaczom i programistom dostęp do jego wewnętrznej struktury, co sprzyja rozwojowi, precyzyjnemu dostrajaniu i tworzeniu niestandardowych aplikacji. Udostępnienie takich zasobów, mimo braku dedykowanego modułu do rozumowania symbolicznego, przypomina wcześniejsze, przełomowe inicjatywy, jak chociażby model Deepseek.
Wydajność na miarę globalnych liderów
Wersja Kimi-K2-Instruct, zoptymalizowana pod kątem praktycznych zastosowań, osiąga wyniki porównywalne z najbardziej zaawansowanymi modelami na rynku. W testach SWE-bench Verified, mierzących zdolność modelu do identyfikacji i naprawiania błędów w kodzie open-source, Kimi-K2 uzyskał 65,8 procent w trybie agentowym, ustępując jedynie Claude Sonnet 4, ale przewyższając GPT-4.1 (54,6 procent). To rezultat godny uwagi, zwłaszcza w kontekście rosnącego zapotrzebowania na narzędzia wspierające rozwój oprogramowania.
Model Moonshot AI wykazuje również dominację w zadaniach programistycznych, niezależnie od braku wspomnianego modułu rozumowania. W testach LiveCodeBench oraz OJBench, mierzących zdolności rozwiązywania problemów związanych z programowaniem, Kimi-K2 osiągnął odpowiednio 53,7 procent i 27,1 procent. Wyniki te potwierdzają wszechstronność modelu w obszarze inżynierii oprogramowania.
Kimi-K2 wyróżnia się także w zadaniach matematycznych i naukowych, przewyższając konkurencję w benchmarkach takich jak AIME, GPQA-Diamond i MATH-500. Dodatkowo zajmuje czołowe miejsca w wielojęzycznych testach, np. MMLU-Pro, co podkreśla jego potencjał w globalnym, zróżnicowanym językowo środowisku. Zdolności kodowania Kimi-K2 były również demonstrowane publicznie, między innymi na platformie X, co dodatkowo buduje zaufanie do jego możliwości.
Niezależne testy, takie jak ten przeprowadzony przez Simona Willisona, gdzie Kimi-K2 z sukcesem wygenerował SVG pelikana na rowerze – zadanie, które często sprawia trudności innym modelom – potwierdzają jego elastyczność i zdolność do twórczego myślenia.
Agentowe zastosowania i dostępność
Moonshot AI podkreśla, że Kimi-K2 został zaprojektowany z myślą o zastosowaniach agentowych. Oznacza to, że model jest zdolny do samodzielnego wykonywania poleceń, korzystania z zewnętrznych narzędzi, generowania i debugowania kodu, a także radzenia sobie ze złożonymi, wieloetapowymi zadaniami. Przykładem może być demonstracja, w której Kimi-K2 analizował dane płacowe dotyczące pracy zdalnej, przeprowadzał analizy statystyczne i tworzył interaktywną stronę HTML z konfigurowalnym narzędziem do rekomendacji – wszystko w ramach jednego, zautomatyzowanego procesu agentowego.
Kimi-K2 dostępny jest w dwóch wersjach: Kimi-K2-Base przeznaczonej do badań i dostosowywania, oraz Kimi-K2-Instruct do ogólnych zadań czatowych i agentowych. Oba modele mogą być wykorzystywane poprzez API zgodne z OpenAI, dostępnym na platformie Moonshot AI. Cennik, oferujący zróżnicowane stawki za tokeny wejściowe i wyjściowe, sprawia, że model jest dostępny dla szerokiego grona deweloperów. Istnieje również możliwość lokalnego uruchomienia Kimi-K2 przy użyciu silników inferencyjnych, takich jak vLLM czy TensorRT-LLM, z instrukcjami dostępnymi w oficjalnym repozytorium GitHub.
Moonshot AI zdecydowało się na licencję opartą na MIT, z jednym interesującym szczegółem: w przypadku wdrożenia Kimi-K2 w produkcie z ponad 100 milionami aktywnych użytkowników miesięcznie lub przychodami przekraczającymi 20 milionów dolarów miesięcznie, nazwa „Kimi-K2” musi być wyraźnie widoczna w interfejsie użytkownika. Jest to zaskakujące, ale raczej nieszkodliwe dla większości firm, a dodatkowo może być formą promocji.
Potrzeba potężnej infrastruktury sprzętowej do uruchamiania Kimi-K2 na dużą skalę jest oczywista. Z bilionem parametrów model wymaga zaawansowanych procesorów graficznych, takich jak wielokrotne jednostki NVIDIA B200 lub wielowęzłowe konfiguracje oparte na architekturze Nvidia Hopper. Niemniej jednak, kwantyzowana 4-bitowa wersja modelu może działać na dwóch maszynach Apple M3 Ultra z 512 GB RAM każda, co otwiera drogę do bardziej przystępnych, choć nadal wymagających, zastosowań lokalnych.
Warto również wspomnieć, że wcześniej w tym roku Moonshot AI zaprezentowało model rozumowania zbliżony do OpenAI o1, a także wydany w kwietniu silny model wizyjny, co systematycznie buduje pozycję firmy jako innowatora na globalnym rynku AI.
