Geopolityka

Indie w wyścigu o niezależność AI: Odpowiedź na chińską dominację i lingwistyczne wyzwania

W Indiach, kraju znanym z dynamicznie rosnącego sektora technologicznego, ambicje rozwoju sztucznej inteligencji zderzają się z realiami niedoinwestowania i złożoności lingwistycznej. Entuzjazm młodych innowatorów, takich jak 20-letni Adithya Kolavi, założyciel CognitiveLab, kontrastuje z doświadczeniami pionierów, jak Abhishek Upperwal z Soket AI Labs, którego ambitny model Pragna-1B, mimo przełomowych rozwiązań, z trudem utrzymywał się na powierzchni z powodu niedofinansowania.

Chiński bodziec

Sukces chińskiego DeepSeek, które na początku 2025 roku zaprezentowało model językowy dorównujący zachodnim gigantom, zbudowany przy znacznie mniejszych nakładach, stał się dla Indii zimnym prysznicem. „Jeśli oni mogli to zrobić, dlaczego nie my?” – zastanawiał się Kolavi. Dla indyjskich decydentów, pojawienie się DeepSeek-R1 było sygnałem alarmowym, który uwydatnił zapóźnienia w infrastrukturze AI i wzmocnił pilną potrzebę reakcji.

Szybkość, z jaką zareagowało indyjskie Ministerstwo Elektroniki i Technologii Informacyjnych (MeitY), świadczy o powadze sytuacji. W styczniu 2025 roku, zaledwie 10 dni po premierze DeepSeek-R1, ogłoszono przetarg na budowę indyjskich modeli fundamentowych. Dzięki współpracy z prywatnym sektorem, MeitY uzyskało dostęp do niemal 19 000 procesorów graficznych (GPU) po subsydiowanych cenach, co zapoczątkowało lawinę propozycji od firm pragnących rozwijać własne modele AI. Do połowy marca liczba zgłoszeń potroiła się, osiągając imponujący wynik 67 propozycji w ciągu dwóch tygodni.

Krótko potem rząd ogłosił plany opracowania sześciu dużych modeli do końca 2025 roku oraz osiemnastu dodatkowych aplikacji AI w sektorach kluczowych dla kraju, takich jak rolnictwo, edukacja czy działania na rzecz klimatu. Kluczowym krokiem było zaangażowanie firmy Sarvam AI do budowy modelu z 70 miliardami parametrów, zoptymalizowanego pod kątem języków i potrzeb Indii. Ten przyspieszony rozwój, po latach chronicznego niedoinwestowania w badania i rozwój (gdzie Indie w 2024 roku przeznaczyły zaledwie 0,65% PKB, w porównaniu do 2,68% w Chinach i 3,5% w USA), jest wyrazem bezprecedensowej konwergencji ambicji, talentu i politycznej woli.

Wyzwanie językowe

Jednym z najpoważniejszych wyzwań w Indiach jest ogromna różnorodność językowa. Z 22 oficjalnymi językami i setkami dialektów, szkolenie modeli językowych jest o wiele bardziej skomplikowane niż w krajach anglojęzycznych czy nawet Chinach. Podczas gdy w Internecie dostępne są ogromne ilości wysokiej jakości danych w języku angielskim, indyjskie języki stanowią łącznie mniej niż 1% treści online. Brak zdigitalizowanych i uporządkowanych danych w językach takich jak Bhojpuri czy Kannada utrudnia tworzenie modeli, które mogłyby efektywnie przetwarzać lokalne dialekty i sposoby wyszukiwania informacji.

Standardowe tokenizatory, kluczowe dla przetwarzania tekstu przez modele AI, często zawodzą w przypadku skomplikowanych skryptów indyjskich, co prowadzi do błędnej interpretacji lub pomijania znaków. W efekcie, nawet w modelach wielojęzycznych, indyjskie języki często są słabo rozumiane i generowane z błędami.

Niemniej jednak, indyjscy badacze i start-upy podejmują te wyzwania. Sarvam AI stworzyło OpenHathi-Hi-v0.1, otwarty model języka hindi, bazujący na architekturze Llama 2 Meta, przeszkolony na 40 miliardach tokenów. Model Pragna-1B Upperwala zaś, mimo skromnego rozmiaru (1,25 miliarda parametrów), dzięki innowacyjnej technice „zrównoważonej tokenizacji”, był w stanie zachowywać się jak znacznie większe modele, co otworzyło drogę do efektywniejszego przetwarzania języków indyjskich o złożonej gramatyce aglutynacyjnej.

Ambicje i kontrowersje

Program IndiaAI Mission, o budżecie 1,25 miliarda dolarów, ma na celu wsparcie start-upów, zwłaszcza tych rozwijających modele fundamentowe w językach indyjskich i aplikacje AI dla kluczowych sektorów. Rząd udostępnia ponad 18 000 GPU, w tym prawie 13 000 wysokiej klasy chipów H100, wybranym start-upom, takim jak Sarvam i Soket Labs.

Mimo tych imponujących wysiłków, program IndiaAI budzi kontrowersje, zwłaszcza w kwestii otwartości modeli budowanych za publiczne pieniądze. Krytycy, tacy jak specjalista ds. polityki AI Amlan Mohanty, argumentują, że prawdziwa suwerenność AI powinna opierać się na otwartości i przejrzystości, wskazując na przykład DeepSeek-R1, udostępniony bezpłatnie do użytku komercyjnego. Jednakże MeitY nie narzuca konkretnych modeli biznesowych, pozostawiając decyzję o otwartości modelu samym zespołom.

Początkowe wyniki nie zawsze są zadowalające, czego przykładem jest Sarvam-M, wielojęzyczny LLM firmy Sarvam AI, którego premierowe pobrania były rozczarowujące. Nadal brakuje również łatwego dostępu do GPU dla wielu deweloperów, a cały ekosystem AI dla języków indyjskich jest w powijakach.

Niemniej jednak, Indie mają pewne atuty. Budowa centrów danych jest tu o połowę tańsza niż w USA czy Europie, dzięki niższym kosztom ziemi, budowy i pracy. Przewiduje się, że w ciągu najbliższych kilku miesięcy problem z dostępnością mocy obliczeniowej zostanie znacząco zredukowany.

Obecne ambicje Indii w dziedzinie AI wydają się koncentrować nie tyle na prześcignięciu OpenAI czy DeepSeek, ile na osiągnięciu strategicznej samowystarczalności. Nandan Nilekani, przewodniczący Infosys, jeszcze rok temu apelował, aby Indie nie ścigały się z gigantami, lecz skupiły się na adaptacji dostępnej technologii i tworzeniu niestandardowych rozwiązań dla własnych potrzeb. Czy to poprzez mniejsze, suwerenne modele, otwarte ekosystemy, czy hybrydy publiczno-prywatne, Indie stawiają na własną ścieżkę rozwoju AI, mając nadzieję, że uda im się przezwyciężyć długoletnie bariery w innowacjach technologicznych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *