Afrykańskie głosy w AI: Przełomowy zbiór danych zmieniający oblicze technologii
Narzędzia sztucznej inteligencji, takie jak ChatGPT, DeepSeek czy asystenci głosowi pokroju Siri i Google Assistant, stanowią filary współczesnego cyfrowego świata. Rozwijane głównie w krajach Globalnej Północy, ich algorytmy trenowane są w oparciu o ogromne zasoby danych w językach angielskim, chińskim czy europejskich. W tym kontekście języki afrykańskie pozostają w dużej mierze pominięte, co stwarza poważne wyzwania, ale i motywuje do innowacji.
Dlaczego język jest kluczowy dla AI?
Język stanowi fundamentalny element ludzkiej interakcji – to za jego pomocą komunikujemy się, poszukujemy pomocy, organizujemy myśli i dzielimy się ideami. W kontekście sztucznej inteligencji język jest medium, przez które przekazujemy nasze intencje i oceniamy, czy system AI nas zrozumiał. Wzrost liczby zastosowań AI, od edukacji po opiekę zdrowotną i rolnictwo, wymaga modeli trenowanych na obszernych zasobach danych, głównie lingwistycznych. Te tzw. duże modele językowe dominują jednak w zaledwie kilku językach świata.
Co więcej, języki są nośnikiem kultury, wartości i lokalnej mądrości. Jeśli AI nie „mówi” naszym językiem, nie jest w stanie rzetelnie zrozumieć naszych intencji, a my nie możemy zaufać jej odpowiedziom. Brak obecności danych w językach ojczystych wyklucza miliony ludzi z dostępu do technologii, prowadząc do pogłębiającej się przepaści cyfrowej i uniemożliwiając AI pełnienie roli użytecznego i sprawiedliwego narzędzia.
Brak języków afrykańskich i jego konsekwencje
Marginalizacja języków afrykańskich w cyfrowym świecie ma głębokie korzenie historyczne, często związane z kolonializmem, który promował języki kolonialne kosztem lokalnych. W rezultacie brakuje wysokiej jakości, zdigitalizowanych tekstów i mowy, niezbędnych do trenowania i oceny solidnych modeli AI. Problem wykracza poza same dane, obejmując również niedobór podstawowych narzędzi, takich jak słowniki, terminologie, a także kwestie techniczne – brak klawiatur, czcionek, sprawdzania pisowni czy narzędzi do tokenizacji, które radziłyby sobie ze specyfiką języków afrykańskich, w tym z ich różnorodnością dialektalną i tonacyjną.
Konsekwencją jest tworzenie systemów AI, które działają nieefektywnie, a czasem nawet niebezpiecznie, generując błędne tłumaczenia i transkrypcje. Miliony Afrykanów pozbawiane są w ten sposób dostępu do globalnych wiadomości, materiałów edukacyjnych czy informacji zdrowotnych, które mogłyby poprawić ich jakość życia.
African Next Voices: Odpowiedź na wyzwania
Projekt „African Next Voices” to dwuletnia inicjatywa, która ma na celu zebranie największego dotychczas zbioru danych językowych dla sztucznej inteligencji, koncentrującego się na językach afrykańskich. Zespoły składające się z informatyków, lingwistów i specjalistów językowych działają w Kenii, Nigerii i RPA, skupiając się na gromadzeniu danych mowy do automatycznego rozpoznawania mowy (ASR).
Celem projektu jest nie tylko stworzenie zbioru danych, ale także opracowanie metodologii ich zbierania, mając na uwadze jakość i różnorodność. Dane są gromadzone w sposób etyczny, z poszanowaniem praw uczestników i sprawiedliwym wynagrodzeniem. Projekt skupia się na mowie spontanicznej i czytanej, w różnych domenach, takich jak codzienne rozmowy, opieka zdrowotna, włączenie finansowe i rolnictwo, uwzględniając różnorodność wiekową, płciową i edukacyjną.
W Kenii zbierane są dane dla pięciu języków, w tym Dholuo, Maasai, Kalenjin, Somali i Kikuyu. W Nigerii projekt koncentruje się na pięciu szeroko używanych językach, takich jak Bambara, Hausa, Igbo, nigeryjski pidżyn i Yoruba. W RPA rejestrowane są dane dla siedmiu języków, odzwierciedlając bogactwo językowe kraju, w tym isiZulu, isiXhosa czy Sesotho.
Inicjatywa ta nie działa w izolacji, lecz buduje na fundamentach i ideach sieci Masakhane Research Foundation, Lelapa AI, Mozilla Common Voice oraz wielu innych podmiotów. Wspólnie tworzą one dynamicznie rozwijający się ekosystem, którego celem jest zapewnienie widoczności i użyteczności języków afrykańskich w erze AI.
Praktyczne zastosowania i przyszłość
Zebrane dane i opracowane modele znajdą szerokie zastosowanie, od automatycznego tworzenia napisów do mediów lokalnych, przez asystentów głosowych w rolnictwie i służbie zdrowia, po systemy obsługi klienta. Co więcej, dane będą archiwizowane w celach zachowania dziedzictwa kulturowego.
Większe, zrównoważone i publicznie dostępne zbiory danych językowych Afryki pozwolą na połączenie zasobów tekstowych i mowy, umożliwiając rozwój praktycznych rozwiązań AI, które wykraczają poza eksperymentalne demonstracje. Mowa tu o chatbootach, narzędziach edukacyjnych i lokalnie dostosowanych usługach.
„African Next Voices” to także krok w stronę szerszego ekosystemu narzędzi, takich jak sprawdzarki pisowni, słowniki, systemy tłumaczeniowe i silniki podsumowujące, które sprawią, że języki afrykańskie staną się żywą obecnością w przestrzeni cyfrowej. Długoterminowa wizja zakłada zapewnienie farmerom, nauczycielom czy lokalnym przedsiębiorcom możliwości korzystania z AI w językach takich jak isiZulu, Hausa czy Kikuyu, a nie tylko po angielsku czy francusku. Tym samym Afryka ma szansę nie tylko nadrobić zaległości, ale także wyznaczyć nowe standardy dla inkluzywnej i odpowiedzialnej sztucznej inteligencji na skalę globalną.
