Przedszkolaki deklasują sztuczną inteligencję w rozpoznawaniu obrazów
W świetle dynamicznego rozwoju sztucznej inteligencji, która coraz śmielej wkracza w obszary wcześniej zarezerwowane dla ludzkich umiejętności – od autonomicznej jazdy po diagnostykę medyczną – pojawiają się pytania o jej rzeczywiste granice. Szacowane na biliony dolarów perspektywy globalnego rynku AI mogą sugerować, że technologia ta jest gotowa sprostać każdemu wyzwaniu. Jednak najnowsze odkrycia badaczy z Temple University rzucają nowe światło na fundamentalne różnice między percepcją ludzką a możliwościami algorytmów.
Badanie, którego wyniki opublikowano w prestiżowym czasopiśmie „Science Advances” pod tytułem „Fast and robust visual object recognition in young children” (Szybkie i solidne rozpoznawanie obiektów wizualnych u małych dzieci), ukazuje znaczące ograniczenia zaawansowanych modeli komputerowych. Asystent profesora Vlad Ayzenberg, z wydziału Psychologii i Neurobiologii Temple University, wraz z zespołem, wykazał, że dzieci w wieku przedszkolnym – już od trzeciego roku życia – znacznie przewyższają stanowiącą obecnie szczyt technologii sztuczną inteligencję w zakresie rozpoznawania obiektów wizualnych.
„Nasze ustalenia jasno wskazują, że ludzki system wizualny operuje znacznie efektywniej pod względem danych niż obecne systemy AI. Percepcyjne zdolności nawet bardzo małych dzieci są niezwykle odporne i wydajne” – podkreśla prof. Ayzenberg. Badacze z Temple University i Emory University poddali testom zdolności percepcyjne dzieci w wieku od 3 do 5 lat oraz współczesne modele AI. Zaskakujące jest, że dzieci wypadły znacząco lepiej niż najlepsze dostępne algorytmy widzenia komputerowego. Jedynie modele, które przewyższały ludzkie możliwości, to te, które doświadczyły znacznie większej ekspozycji na dane wizualne, nieosiągalnej dla ludzkiego mózgu.
W ramach eksperymentu, dzieciom prezentowano obrazy obiektów przez zaledwie 100 milisekund, a ich uwagę dodatkowo rozpraszano poprzez elementy zakłócające. „Sądziliśmy, że zadanie to będzie niezwykle trudne dla tak małych dzieci, gdyż pierwotnie zostało zaprojektowane z myślą o dorosłych” – wyjaśnia Ayzenberg. Mimo to dzieci konsekwentnie radziły sobie z nim znakomicie.
Wyniki badania rzucają światło na paradoksy współczesnej AI. Choć algorytmy mogą wydawać się wszechstronne, w praktyce nadal popełniają błędy, których żaden człowiek by nie popełnił. Co więcej, ich szkolenie wymaga ogromnych zasobów energetycznych i danych, co ma swoje konsekwencje. „Modele AI są użyteczne, ale często wymagają nieporównywalnie więcej treningu i energii niż ludzie. Dla przykładu, wyszkolenie dużego modelu językowego, takiego jak ChatGPT, generuje ślad węglowy 17 razy większy niż roczny ślad węglowy przeciętnego człowieka” – zauważa Ayzenberg. „Jeśli zrozumiemy, w jaki sposób małe dzieci są w stanie wizualnie postrzegać obiekty, będziemy mogli projektować o wiele bardziej efektywne modele AI.”
Badanie to stanowi kluczowy punkt odniesienia dla dalszych prac nad sztuczną inteligencją. „Pokazuje, co potrafią przedszkolaki. Teraz pytanie brzmi: czy AI może osiągnąć tyle samo co trzylatek, zużywając przy tym znacznie mniej danych niż dotychczas?” – dodaje Ayzenberg, który niedawno otworzył Laboratorium Wizji, Uczenia się i Rozwoju na Temple University. Placówka ta ma za zadanie badać, w jaki sposób ludzki mózg rozwija zdolności poznawcze i percepcyjne, by w przyszłości tworzyć systemy AI bardziej przypominające ludzkie.
Kolejne etapy badań będą polegały na wykorzystaniu funkcjonalnego rezonansu magnetycznego (fMRI) do pomiaru aktywności mózgu u niemowląt podczas wykonywania określonych zadań poznawczych. „Niemowlęta i małe dzieci nie miały jeszcze okazji doświadczyć świata zbyt długo, a mimo to uczą się i adaptują niezwykle szybko” – zaznacza Ayzenberg. „Chcemy zrozumieć, jakie procesy neuronalne pozwalają im na tak gwałtowny rozwój złożonych umiejętności, pomimo braku rozległego doświadczenia. To właśnie te wglądy mogą w przyszłości odblokować potencjał dla prawdziwie inteligentnych algorytmów, mniej obciążających środowisko i bardziej przypominających ludzkie zdolności percepcyjne.”
