NaukaR & D

GPT-5.2 Pro rozwiązuje kolejny problem Erdősa. Baza danych ujawnia jednak brutalną statystykę

Neel Somani, wykorzystując model GPT-5.2 Pro od OpenAI, dostarczył rozwiązanie problemu nr 281 z zakresu teorii liczb – jednego ze słynnych zagadnień Paula Erdősa. Osiągnięcie to zyskało rangę wydarzenia dzięki weryfikacji przez Terence’a Tao. Ten wybitny matematyk i laureat Medalu Fieldsa określił wynik jako „prawdopodobnie najbardziej jednoznaczny przypadek” rozwiązania otwartego problemu matematycznego przez sztuczną inteligencję. Choć wcześniejsze dowody z lat 30. XX wieku mogły wpłynąć na proces „wnioskowania” modelu, Tao zauważył, że dowód wygenerowany przez AI jest „dość odmienny” od klasycznych podejść, co nadaje mu walor oryginalności.

Entuzjazm warto jednak ostudzić analizą szerszego kontekstu, na co zwraca uwagę sam Tao. Ostrzega on przed skrzywionym postrzeganiem możliwości technologii, wynikającym z błędu przeżywalności: negatywne wyniki eksperymentów rzadko trafiają do publikacji, podczas gdy pojedyncze sukcesy natychmiast stają się wiralami. Tworzy to iluzję wszechmocy modeli językowych, która rzadko znajduje pokrycie w twardych danych.

Rzeczywisty obraz sytuacji rysuje nowa baza danych uruchomiona przez Paatę Ivanisviliego i Mehmeta Marsa Sevena, która śledzi próby rozwiązywania problemów Erdősa przez algorytmy AI. Statystyki są nieubłagane: wskaźnik sukcesu oscyluje w granicach zaledwie jednego do dwóch procent. Co więcej, nieliczne udane próby koncentrują się wokół zagadnień najłatwiejszych. Według Tao, problemy o choćby umiarkowanym stopniu trudności wciąż pozostają poza zasięgiem obecnych architektur.

Mimo tych ograniczeń, GPT-5.2 Pro ugruntowuje swoją pozycję jako użyteczne narzędzie wspomagające pracę badawczą, pod warunkiem zachowania krytycznego dystansu do jego sugestii. Pierwsze autonomiczne rozwiązanie problemu Erdősa, również zweryfikowane przez Tao, datuje się na 4 stycznia 2026 roku. Choć postęp jest zauważalny, droga do autonomicznego „matematyka AI” okazuje się znacznie bardziej wyboista, niż sugerowałyby nagłówki prasowe.