AI zdobywa złoto na Olimpiadzie Matematycznej, rozpala spór gigantów
Wydawać by się mogło, że Międzynarodowa Olimpiada Matematyczna (IMO), jedno z najtrudniejszych licealnych wyzwań naukowych, pozostanie domeną ludzkiego intelektu. Jednak rok 2025 przyniósł przełom: modele AI firm OpenAI i Google DeepMind zademonstrowały zdolności na poziomie złotych medalistów. Ten wynik, ogłoszony niezależnie przez obie firmy, nie tylko potwierdza dynamiczny postęp sztucznej inteligencji, ale również odsłania kulisy intensywnej rywalizacji w branży, gdzie 'wrażenia’ i postrzeganie lidera rynku bywają równie ważne, co rzeczywiste osiągnięcia.
AI dorównuje elitom matematyki
Najnowsze modele AI, w przeciwieństwie do zeszłorocznego systemu Google, który wymagał tłumaczenia problemów na format zrozumiały dla maszyny, operują w języku naturalnym. Są w stanie samodzielnie interpretować zadania i generować odpowiedzi oparte na dowodach, co stanowi znaczący krok naprzód w zdolnościach rozumowania sztucznej inteligencji. Obie firmy podkreślają, że ich systemy przekroczyły wyniki większości uczestników olimpiady, w tym zeszłorocznego modelu Google, eliminując potrzebę jakiejkolwiek interwencji człowieka w procesie rozwiązywania zadań.
Badacze stojący za projektami IMO w OpenAI i Google zgodnie twierdzą, że te złote medale stanowią przełom w modelach rozumowania AI, szczególnie w domenach niepewnych. O ile dotąd systemy AI doskonale radziły sobie z zadaniami o jednoznacznych odpowiedziach, takimi jak matematyka czy kodowanie, o tyle miały problemy z bardziej niejednoznacznymi problemami. Obecne osiągnięcia wskazują na potencjał w radzeniu sobie z bardziej złożonymi wyzwaniami.
Spór o etykietę i wizerunek
Nie obyło się jednak bez kontrowersji. Chociaż imponujące osiągnięcia AI w IMO są bezdyskusyjne, Google kwestionuje sposób, w jaki OpenAI ogłosiło swój sukces. Po ogłoszeniu przez OpenAI zdobycia złotego medalu, Demis Hassabis, CEO Google DeepMind, oraz inni badacze firmy, zarzucili OpenAI przedwczesne ogłoszenie wyników. Podkreślili brak oficjalnej weryfikacji ze strony IMO oraz fakt, że OpenAI nie uszanowało prośby rady IMO o wstrzymanie się z ogłoszeniem do czasu zweryfikowania wyników przez niezależnych ekspertów, a także do momentu uhonorowania uczniów.
Thang Luong, starszy badacz Google DeepMind i lider projektu IMO, w rozmowie z TechCrunch, wyjaśnił, że Google celowo wstrzymało się z ogłoszeniem wyników, aby uszanować uczestniczących w konkursie uczniów. Google od zeszłego roku współpracowało z organizatorami IMO w przygotowaniach do testu i oczekiwało na oficjalną zgodę oraz ocenę od prezydenta IMO, zanim ogłosiło swoje wyniki w poniedziałek rano. Luong zaznaczył, że bez zastosowania wytycznych oceniania IMO, ciężko mówić o osiągnięciu 'złotego medalu’.
Z kolei Noam Brown, starszy badacz OpenAI pracujący nad modelem IMO, tłumaczył, że IMO skontaktowało się z OpenAI kilka miesięcy temu w sprawie udziału w formalnym konkursie matematycznym. Firma jednak odmówiła, ponieważ skupiała się na systemach języka naturalnego. OpenAI twierdzi, że nie wiedziało o nieformalnym teście IMO z Google. Firma zatrudniła więc niezależnych ewaluatorów – trzech byłych medalistów IMO, którzy rozumieli system oceniania – do oceny wydajności ich modelu AI. Po osiągnięciu przez AI złotego medalu, OpenAI skontaktowało się z IMO, które poprosiło o wstrzymanie się z ogłoszeniem do piątku, po ceremonii wręczenia nagród.
Przyszłość AI i ludzki czynnik
Niezależnie od toczącej się debaty o etykietę, szerszy kontekst pozostaje niezmieniony: modele AI z wiodących laboratoriów rozwijają się w zawrotnym tempie. Zaledwie kilku procentom najzdolniejszych uczniów z całego świata udało się osiągnąć wyniki porównywalne z modelami OpenAI i Google AI. Choć do niedawna OpenAI wydawało się mieć wyraźną przewagę w branży, obecna sytuacja sugeruje, że wyścig stał się znacznie bardziej wyrównany. W obliczu nadchodzącej premiery GPT-5, OpenAI z pewnością będzie dążyć do utrzymania wrażenia lidera w branży AI. Pozostaje pytanie, czy tempo rozwoju AI będzie nadal wywoływać podobne spory, a także jak daleko posuną się granice między ludzkim, a maszynowym geniuszem.
