LLMR & D

GPT-5.2 od OpenAI. Nowy model ma być koniem pociągowym dla biznesu i nauki

OpenAI wprowadza na rynek GPT-5.2, swój najnowszy model AI, który ma zredefiniować standardy w profesjonalnych zastosowaniach. Firma odchodzi od narracji o uniwersalnym asystencie na rzecz wyspecjalizowanego narzędzia dla biznesu, inżynierii i nauki. Model debiutuje w trzech wariantach dostępnych zarówno w ChatGPT, jak i przez API: Instant (do codziennych zadań), Thinking (główny model do złożonej pracy) oraz Pro (wersja o zwiększonej mocy obliczeniowej do najtrudniejszych problemów analitycznych).

Nowy standard w pracy z wiedzą

Sercem nowej oferty jest GPT-5.2 Thinking, pozycjonowany jako wszechstronne narzędzie do pracy opartej na wiedzy. OpenAI chwali się imponującymi wynikami w benchmarku GDPval, który symuluje zadania z 44 różnych zawodów. Według firmy, model dorównuje lub przewyższa czołowych specjalistów w branży w 70,9% porównań, wykonując zadania ponad 11 razy szybciej i przy koszcie stanowiącym mniej niż 1% szacowanego wynagrodzenia eksperta. W praktyce ma to oznaczać zdolność do niezawodnego generowania złożonych dokumentów, takich jak prezentacje, arkusze kalkulacyjne czy harmonogramy, na podstawie ustrukturyzowanych poleceń.

Postęp widać również w bardziej niszowych, ale kluczowych dla biznesu dziedzinach. W wewnętrznym teście obejmującym zadania z modelowania finansowego dla początkujących analityków bankowości inwestycyjnej, GPT-5.2 Thinking osiągnął wynik 68,4%, a wersja Pro 71,7%, w porównaniu do 59,1% poprzednika. Mowa tu o zadaniach wymagających dużej precyzji, takich jak tworzenie modeli finansowych z uwzględnieniem ścisłych wymogów formatowania i cytowania źródeł.

Mistrz długiego kontekstu i złożonych zadań

Jednym z kluczowych ulepszeń w GPT-5.2 jest obsługa długiego kontekstu, co ma fundamentalne znaczenie dla tworzenia zaawansowanych agentów AI. Model ustanawia nowy rekord w benchmarku OpenAI MRCRv2, który testuje zdolność do odnajdywania precyzyjnych informacji (tzw. „igieł”) w bardzo długich i złożonych konwersacjach („stogach siana”). GPT-5.2 jest pierwszym modelem, który osiągnął blisko 100% dokładności w teście z czterema „igłami” przy kontekście sięgającym 256 tysięcy tokenów.

Dla zadań, które przekraczają nawet tak duże okno kontekstowe, model integruje się z nowym punktem końcowym API, który dokonuje tzw. kompakcji kontekstu. To mechanizm inteligentnego streszczania i zarządzania informacjami, pozwalający agentom na prowadzenie wieloetapowych operacji bez utraty kluczowych danych. OpenAI ilustruje to przykładem klienta linii lotniczych, którego lot został opóźniony, co spowodowało utratę połączenia, zagubienie bagażu i konieczność rezerwacji specjalnego miejsca. GPT-5.2 był w stanie zarządzić całą sekwencją zdarzeń – od zmiany rezerwacji po złożenie wniosku o odszkodowanie – podczas gdy jego poprzednik, GPT-5.1, nie kończył części zadań.

Lepsze widzenie i naukowa precyzja

Nowy model to także znaczący postęp w analizie wizualnej. GPT-5.2 Thinking niemal o połowę redukuje liczbę błędów w interpretacji wykresów i rozumieniu interfejsów użytkownika. Wykazuje również lepsze rozumienie przestrzenne obrazów – na przykład przy oznaczaniu komponentów na płycie głównej komputera potrafi precyzyjniej zidentyfikować i zlokalizować poszczególne elementy.

Największe wrażenie robią jednak jego zdolności w dziedzinach naukowych. Wersja Pro osiąga 93,2% w teście GPQA Diamond, obejmującym zadania z fizyki, chemii i biologii na poziomie studiów podyplomowych. Z kolei w zaawansowanej matematyce (benchmark FrontierMath) model rozwiązuje ponad 40% problemów. OpenAI podkreśla, że nie jest to tylko syntetyczny wynik – GPT-5.2 Pro, pod nadzorem człowieka, miał już przyczynić się do stworzenia dowodu w dziedzinie teorii uczenia statystycznego. To pokazuje, że model staje się nie tylko asystentem, ale potencjalnym partnerem w procesie badawczym. Mimo imponujących benchmarków, kluczowe pozostaje to, jak model sprawdzi się w realnych, nieustrukturyzowanych scenariuszach, gdzie ludzka intuicja i zdolność do nieszablonowego myślenia wciąż mogą okazać się niezastąpione.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *