Gen AIGeopolitykaLLMR & D

Korea Południowa staje się potęgą LLM: HyperClova, AX, Solar Pro i inne

Korea Południowa intensywnie inwestuje w rozwój własnych dużych modeli językowych (LLM), by uniezależnić się od zagranicznych technologii AI. Rządowe dotacje, badania korporacyjne i otwarte inicjatywy mają na celu stworzenie modeli dostosowanych do języka koreańskiego i lokalnych zastosowań. To strategiczne podejście ma wzmocnić bezpieczeństwo danych i wesprzeć kluczowe sektory gospodarki, takie jak opieka zdrowotna, edukacja i telekomunikacja.

Rządowe wsparcie dla niezależnej AI

W roku 2025 Ministerstwo Nauki i ICT zainicjowało program o wartości 240 miliardów wonów, wybierając pięć konsorcjów (Naver Cloud, SK Telecom, Upstage, LG AI Research i NC AI) do stworzenia suwerennych LLM, zdolnych do działania w oparciu o lokalną infrastrukturę. Równolegle, Ministerstwo Bezpieczeństwa Żywności i Leków wprowadziło wytyczne dotyczące zatwierdzania medycznej AI generującej teksty, tworząc pierwsze tego typu ramy regulacyjne na świecie.

Innowacje korporacyjne i akademickie

SK Telecom zaprezentował AX 3.1 Lite, model z 7 miliardami parametrów, wytrenowany od podstaw na 1,65 biliona tokenów w wielu językach, z silnym naciskiem na język koreański. Model ten osiąga około 96% wydajności w teście KMMLU2 (rozumowanie w języku koreańskim) i 102% w CLIcK3 (rozumienie kulturowe) w porównaniu do większych modeli. AX 3.1 Lite jest dostępny jako open-source na Hugging Face, co umożliwia jego wykorzystanie w aplikacjach mobilnych i urządzeniach brzegowych.

Naver rozwinął swoją serię HyperClova, wprowadzając w czerwcu 2025 roku HyperClova X Think, który oferuje ulepszone możliwości wyszukiwania i konwersacji w języku koreańskim. Upstage Solar Pro 2 jest jedynym koreańskim modelem w rankingu Frontier LM Intelligence, demonstrując wydajność porównywalną z znacznie większymi modelami międzynarodowymi.

LG AI Research wprowadziło w lipcu 2025 roku Exaone 4.0, który z 30 miliardami parametrów osiąga konkurencyjne wyniki w globalnych testach. Z kolei Szpital Uniwersytecki w Seulu opracował pierwszy koreański medyczny LLM, wytrenowany na 38 milionach zanonimizowanych danych klinicznych. Model ten uzyskał wynik 86,2% na Koreańskim Egzaminie Licencjonującym dla Lekarzy, podczas gdy średni wynik dla ludzi wynosi 79,7%.

Mathpresso i Upstage połączyły siły, tworząc MATH GPT, mały LLM z 13 miliardami parametrów, który w testach matematycznych przewyższa GPT-4 (0,488 dokładności kontra 0,425), zużywając przy tym znacznie mniej zasobów obliczeniowych. Inicjatywy open-source, takie jak Polyglot-Ko (od 1,3 do 12,8 miliarda parametrów) i Gecko-7B, wypełniają luki, prowadząc ciągłe wstępne trenowanie na koreańskich zbiorach danych, aby obsługiwać niuanse językowe, takie jak przełączanie kodu.

Trendy techniczne

Koreańscy programiści kładą nacisk na efektywność, optymalizując stosunek tokenów do parametrów, zainspirowani skalowaniem Chinchilla. Pozwala to modelom o wielkości od 7 do 30 miliardów parametrów konkurować z większymi zachodnimi odpowiednikami, pomimo ograniczonych zasobów. Adaptacje do konkretnych dziedzin, takie jak medyczny LLM ze Szpitala Uniwersyteckiego w Seulu i MATH GPT do matematyki, przynoszą znakomite wyniki w ukierunkowanych obszarach. Postęp mierzy się za pomocą testów KMMLU2, CLIcK3 (znaczenie kulturowe) i rankingu Frontier LM, potwierdzając równorzędność z zaawansowanymi systemami globalnymi.

Perspektywy rynkowe

Rynek LLM w Korei Południowej ma wzrosnąć z 182,4 miliona USD w 2024 roku do 1 278,3 miliona USD do 2030 roku, co odzwierciedla złożoną roczną stopę wzrostu na poziomie 39,4%. Głównym motorem wzrostu będą chatboty, wirtualni asystenci i narzędzia do analizy sentymentu. Integracja LLM przetwarzanych brzegowo przez firmy telekomunikacyjne wspiera redukcję opóźnień i zwiększone bezpieczeństwo danych, zgodnie z inicjatywami takimi jak AI Infrastructure Superhighway.

Modele językowe w Korei Południowej

Rozwój ten podkreśla koreańskie podejście do tworzenia wydajnych, istotnych kulturowo modeli AI, które wzmacniają pozycję kraju w globalnym krajobrazie technologicznym.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *