Ant Group wkracza na arenę AI modelem Ling-1T z bilionem parametrów
Ant Group, operator Alipay, ogłosił wejście do grona firm rozwijających modele AI z bilionem parametrów prezentując Ling-1T. Model językowy open-source ma łączyć efektywność obliczeniową z zaawansowanymi możliwościami rozumowania. Firma podkreśla, że to ważny krok w rozwoju infrastruktury sztucznej inteligencji w różnych architekturach modeli. Czy rzeczywiście mamy do czynienia z przełomem?
Ling-1T osiągnął 70,42% dokładności w benchmarku AIME 2025 (American Invitational Mathematics Examination), który służy do oceny zdolności systemów AI do rozwiązywania problemów matematycznych. Imponujący wynik. Zgodnie ze specyfikacją techniczną Ant Group, Ling-1T utrzymuje ten poziom wydajności, zużywając średnio ponad 4000 tokenów wyjściowych na problem, co plasuje go, jak twierdzi firma, wśród „najlepszych w swojej klasie modeli AI” pod względem jakości.
Dyfuzja kontra autoregresja
Równocześnie z Ling-1T, Ant Group zaprezentował dInfer – framework przeznaczony do dyfuzji modeli językowych. To strategiczne posunięcie sugeruje, że firma dywersyfikuje swoje podejście technologiczne. Modele dyfuzyjne, w odróżnieniu od popularnych modeli autoregresyjnych (na których bazuje np. ChatGPT), generują wyniki równolegle, co jest powszechne w generowaniu obrazów i wideo, ale mniej w przetwarzaniu języka naturalnego.
Testy dInfer na modelu LLaDA-MoE (również produkcji Ant Group) wykazały generowanie 1011 tokenów na sekundę w benchmarku HumanEval. Dla porównania, Nvidia Fast-dLLM osiągnął 91 tokenów na sekundę, a Alibaba Qwen-2.5-3B działający na infrastrukturze vLLM – 294 tokeny. Czy to oznacza realną przewagę nowej architektury?
„Wierzymy, że dInfer stanowi zarówno praktyczny zestaw narzędzi, jak i ustandaryzowaną platformę, która przyspieszy badania i rozwój w szybko rozwijającej się dziedzinie dLLM” – podkreślają badacze z Ant Group.
Strategia Ant Group w obszarze AI
Ling-1T jest częścią szerszej rodziny systemów AI rozwijanych przez Ant Group. Portfolio firmy obejmuje trzy główne serie: modele Ling (do standardowych zadań językowych), Ring (modele rozumujące) i Ming (modele multimodalne, przetwarzające obrazy, tekst, audio i wideo). Eksperymentalny model LLaDA-MoE wykorzystuje architekturę Mixture-of-Experts (MoE), która aktywuje tylko wybrane fragmenty modelu dla konkretnych zadań, co ma zwiększać efektywność.
He Zhengyu, dyrektor technologiczny Ant Group, podkreśla, że firma wierzy, iż Artificial General Intelligence (AGI) powinno być dobrem publicznym i że udostępnienie open-source zarówno Ling-1T, jak i Ring-1T-preview, to krok w kierunku otwartego i opartego na współpracy rozwoju.
Konkurencja w Chinach i ograniczenia technologiczne
Premiera Ling-1T wpisuje się w specyfikę chińskiego sektora AI, gdzie firmy, ze względu na ograniczenia w dostępie do zaawansowanych półprzewodników, skupiają się na innowacjach algorytmicznych i optymalizacji oprogramowania. ByteDance (właściciel TikToka) również zaprezentował model dyfuzyjny Seed Diffusion Preview, obiecując pięciokrotny wzrost szybkości w porównaniu z architekturami autoregresyjnymi. Jednak przyszłość modeli dyfuzyjnych w komercyjnych zastosowaniach stoi pod znakiem zapytania. Modele autoregresyjne dominują ze względu na sprawdzone wyniki w przetwarzaniu języka naturalnego, kluczowe w aplikacjach skierowanych do klientów.
Open source jako strategia rynkowa
Udostępniając Ling-1T i dInfer na zasadach open source, Ant Group stawia na model rozwoju oparty na współpracy. Ma to przyspieszyć innowacje i pozycjonować technologie firmy jako fundament dla społeczności AI. Firma rozwija również AWorld, framework do ciągłego uczenia się agentów AI, mających samodzielnie wykonywać zadania w imieniu użytkowników. Czy te działania pozwolą Ant Group stać się graczem na globalnym rynku AI? To zależy od weryfikacji deklarowanych osiągów w praktyce i od adopcji technologii przez developerów szukających alternatyw dla obecnych rozwiązań.
Otwarta natura Ling-1T może ułatwić walidację i zbudować społeczność wokół technologii. Premiera modelu pokazuje, że chińskie firmy technologiczne postrzegają krajobraz AI jako elastyczny i otwarty na innowacje. Teraz czas na weryfikację możliwości modelu w praktycznych zastosowaniach.
