David Silver opuszcza Google DeepMind. Twórca AlphaGo stawia na uczenie przez wzmacnianie w wyścigu po superinteligencję
Świat sztucznej inteligencji obserwuje właśnie jeden z najistotniejszych transferów intelektualnych ostatnich lat. David Silver, człowiek stojący za sukcesami takich systemów jak AlphaGo, AlphaZero czy MuZero, zdecydował się opuścić struktury Google DeepMind. Jego nowy projekt, londyński startup Ineffable Intelligence, ma stać się platformą do budowy superinteligencji opartej na fundamentach radykalnie odmiennych od tych, które dominują w dzisiejszym nurcie technologii AI.
Koniec ery dominacji modeli językowych?
Nagłe odejście Silvera wpisuje się w szerszy trend sceptycyzmu wobec architektury Transformer i wielkich modeli językowych (LLM). Choć ChatGPT i jego konkurenci zrewolucjonizowali sposób, w jaki wchodzimy w interakcję z maszynami, Silver — podobnie jak Ilja Sutskever czy Yann LeCun — dostrzega ich strukturalny szklany sufit. Modele te są trenowane na statycznych zasobach ludzkiej wiedzy, co zdaniem badacza ogranicza je do bycia jedynie zaawansowanymi kompresorami danych, a nie autonomicznymi podmiotami inteligentnymi.
Kluczem do przełomu ma być uczenie przez wzmacnianie (ang. reinforcement learning). Wizja Silvera zakłada stworzenie systemów, które uczą się metodą prób i błędów, budując własne zrozumienie świata bez konieczności polegania na wskazówkach dostarczonych przez człowieka. To odejście od „nauki z podręcznika” na rzecz „nauki przez doświadczenie”.
Era doświadczenia i modele świata
Manifestem nowej drogi Silvera jest współautorstwo pracy z Richardem Suttonem, w której ogłosili nadejście „ery doświadczenia”. Autorzy argumentują, że superinteligencja wymaga ciągłego uczenia się (ang. continuous learning) w ramach tak zwanych modeli świata — symulacji pozwalających maszynie przewidywać skutki własnych działań. Zamiast jednorazowego procesu treningowego, algorytmy Ineffable Intelligence mają ewoluować przez miesiące i lata, adaptując się do otoczenia w sposób zbliżony do organizmów biologicznych.
Przejście Silvera „na swoje” jest również sygnałem narastającego napięcia między czystą nauką a komercyjną presją wewnątrz gigantów, takich jak Google czy OpenAI. Eksperci, jak niedawno Jerry Tworek, wskazują, że badania nad fundamentalnymi mechanizmami inteligencji są coraz trudniejsze do pogodzenia z modelem biznesowym nastawionym na szybkie wdrażanie produktów. David Silver wybiera zatem niepewność startupu, wierząc, że tylko całkowita swoboda badawcza pozwoli odkryć fundamenty wiedzy, których LLM nie są w stanie nawet dotknąć.
