OpenAI prezentuje GPT-5: Nowa era agentów AI i wyzwanie dla konkurencji
OpenAI ogłosiło premierę GPT-5, swojego najnowszego flagowego modelu sztucznej inteligencji, który posłuży jako rdzeń kolejnej generacji chatbota ChatGPT. Wprowadzony w czwartek, GPT-5 jest pierwszym „ujednoliconym” modelem AI firmy, łączącym zdolności rozumowania modeli serii O z szybkością reakcji serii GPT. Ta nowa generacja sygnalizuje znaczącą ewolucję dla ChatGPT i jego twórcy, wskazując na szersze ambicje OpenAI w rozwoju systemów AI, które mają funkcjonować bardziej jak agenci niż tradycyjne chatboty.
Od chatbota do agenta: Nowe możliwości GPT-5
Podczas gdy poprzednik, GPT-4, umożliwił chatbotom AI udzielanie inteligentnych odpowiedzi na szerokie spektrum pytań, GPT-5 rozszerza te możliwości, pozwalając ChatGPT na realizację złożonych zadań w imieniu użytkowników. Przykładem mogą być takie operacje jak generowanie aplikacji software’owych, zarządzanie kalendarzem, czy tworzenie rozbudowanych streszczeń badawczych. OpenAI, wraz z GPT-5, postawiło również na uproszczenie interfejsu użytkownika. Zamiast wymagać od użytkowników manualnego wyboru odpowiednich ustawień, GPT-5 wyposażony jest w router czasu rzeczywistego, który autonomicznie decyduje o optymalnym sposobie dostarczenia odpowiedzi – czy to poprzez szybką reakcję, czy też poprzez poświęcenie dodatkowego czasu na „przemyślenie” zapytania.
Sam Altman, CEO OpenAI, podczas briefingu z dziennikarzami, określił GPT-5 jako „najlepszy model na świecie” i „znaczący krok” na drodze firmy do stworzenia sztucznej inteligencji, która mogłaby przewyższyć ludzi w większości zadań o wartości ekonomicznej, czyli osiągnięcia sztucznej inteligencji ogólnej (AGI). Altman podkreślił również unikalny charakter obecnego momentu, dodając, że model taki jak GPT-5 byłby „niemal niewyobrażalny w jakimkolwiek wcześniejszym okresie historii”.
Dostępność i strategia rynkowa
Od czwartku GPT-5 stał się domyślnym modelem dla wszystkich bezpłatnych użytkowników ChatGPT. Nick Turley, wiceprezes OpenAI ds. ChatGPT, zaznaczył, że posunięcie to jest częścią misji firmy, mającej na celu zapewnienie szerokiego dostępu do zaawansowanych modeli AI, co wcześniej było zarezerwowane dla płatnych subskrybentów. Decyzja ta ma „przynieść korzyści ludziom”, co jest zgodne z długoterminową wizją OpenAI dystrybucji zaawansowanej AI na jak najszerszą skalę.
Oczekiwania wobec GPT-5 są wysokie. Jest to jedna z najbardziej wyczekiwanych premier produktów OpenAI od czasu, gdy ChatGPT ugruntował pozycję firmy w 2022 roku. Od tego czasu ChatGPT stał się jednym z najpopularniejszych produktów konsumenckich na świecie, docierając do ponad 700 milionów użytkowników tygodniowo – co stanowi blisko 10% globalnej populacji. Wielu postrzega GPT-5 jako swego rodzaju wyznacznik postępu w dziedzinie AI, a jego przyjęcie przez Dolinę Krzemową może mieć dalekosiężne konsekwencje dla dużych firm technologicznych, Wall Street oraz decydentów regulujących technologię. Zainteresowani obserwują, czy GPT-5 stanowi skok jakościowy w możliwościach AI, podobny do swojego poprzednika, GPT-4, który zmienił postrzeganie możliwości oprogramowania.
Wydajność i konkurencja: Analiza benchmarków
OpenAI twierdzi, że GPT-5 jest w stanie prześcignąć w niektórych dziedzinach wiodące modele AI konkurencji, takie jak te od Anthropic, Google DeepMind i xAI Elona Muska. W testach obejmujących kodowanie, GPT-5 osiągnął wynik 74.9% na pierwszej próbie w teście SWE-bench Verified (mierzącym realne zadania kodowania z GitHub), nieznacznie wyprzedzając model Claude Opus 4.1 firmy Anthropic (74.5%) oraz Gemini 2.5 Pro od Google DeepMind (59.6%). Ten rezultat ma potwierdzać skuteczność modelu w tzw. „vibe coding”, czyli dynamicznym tworzeniu aplikacji na żądanie.
Mimo tych sukcesów, GPT-5 nieco odstaje od innych czołowych modeli AI w niektórych obszarach. Na przykład, w teście „Humanity’s Last Exam”, mierzącym wydajność modeli AI w matematyce, naukach humanistycznych i przyrodniczych, wersja GPT-5 z rozszerzonym rozumowaniem (GPT-5 pro) osiągnęła wynik 42% (z użyciem narzędzi), podczas gdy Grok 4 Heavy firmy xAI uzyskał 44.4%. W teście GPQA Diamond, z naukowymi pytaniami na poziomie doktoranckim, GPT-5 pro zdobył 89.4% w pierwszej próbie, wyprzedzając Claude Opus 4.1 (80.9%) i Grok 4 Heavy (88.9%).
OpenAI podkreśla również znaczną poprawę GPT-5 w zakresie odpowiedzi na pytania związane ze zdrowiem. W teście mierzącym dokładność w odpowiedziach dotyczących opieki zdrowotnej (HealthBench Hard Hallucinations), GPT-5 (z uwzględnieniem „myślenia”) wykazał halucynacje jedynie w 1.6% przypadków. To znacznie mniej niż poprzednie modele firmy, GPT-4o (12.9%) i o3 (15.8%). Zważywszy, że miliony ludzi korzystają z chatbotów w celach zdrowotnych, OpenAI deklaruje, że GPT-5 jest bardziej proaktywny w wykrywaniu potencjalnych problemów zdrowotnych i pomaga użytkownikom interpretować wyniki badań medycznych.
Kreatywność, precyzja i bezpieczeństwo
OpenAI uważa, że GPT-5 jest również lepszy od innych modeli AI w trudniejszych do zmierzenia, subiektywnych dziedzinach, takich jak projektowanie kreatywne i pisanie. Nick Turley stwierdził, że GPT-5 reaguje bardziej naturalnie i wykazuje „lepszy gust” w zadaniach kreatywnych. Ważnym osiągnięciem jest także radykalne zmniejszenie liczby halucynacji – tendencji modeli AI do generowania fałszywych informacji. W testach wewnętrznych, GPT-5 (z „myśleniem”) halucynuje jedynie w 4.8% przypadków, co stanowi znaczną redukcję w porównaniu do o3 (22%) i GPT-4o (20.6%). To istotna poprawa, biorąc pod uwagę, że wcześniejsze modele OpenAI, takie jak o3, miały problemy z niekontrolowanymi halucynacjami, a firma przyznawała, że nie do końca rozumiała ich przyczyn.
Model wykazuje mieszaną wydajność w testach mierzących zdolność agentową AI do wykonywania symulowanych zadań online (Tau-bench). W części testu obejmującej nawigację po stronach internetowych linii lotniczych, GPT-5 osiągnął 63.5%, nieznacznie ustępując o3 (64.8%). W innej części testu, dotyczącej nawigacji po stronach handlowych, GPT-5 uzyskał 81.1%, jednak został prześcignięty przez Claude Opus 4.1 (82.4%).
OpenAI podkreśla również, że GPT-5 jest bezpieczniejszy od swoich poprzedników. Chociaż modele rozumowania AI sporadycznie wykazują tendencję do działań 'schematycznych’ przeciwko ludziom lub do fabrykowania informacji w celu realizacji własnych celów, GPT-5 wykazał niższy wskaźnik oszukiwania. Alex Beutel, szef zespołu badawczego ds. bezpieczeństwa OpenAI, zaznaczył, że zmniejszenie skłonności do oszustw nie tylko zwiększa bezpieczeństwo GPT-5, ale także poprawia doświadczenia użytkownika, tworząc model, który jest bardziej „przejrzysty i uczciwy w sposób, któremu użytkownicy mogą ufać”. Beutel dodał, że GPT-5 lepiej radzi sobie z rozróżnianiem między szkodliwymi próbami nadużywania ChatGPT a nieszkodliwymi zapytaniami, co pozwala mu odrzucać więcej niebezpiecznych pytań, jednocześnie rzadziej odrzucając nieszkodliwe prośby użytkowników.
Nowe funkcje i plany dla deweloperów
Wraz z premierą GPT-5, ChatGPT otrzymał kilka ulepszeń interfejsu użytkownika. Użytkownicy mogą teraz wybierać spośród czterech nowych osobowości dla ChatGPT: Cynik, Robot, Słuchacz i Nudziarz. Firma twierdzi, że te opcje pozwolą dostosować odpowiedzi ChatGPT bez konieczności bezpośredniego instruowania modelu. Abonenci płatnego planu ChatGPT Plus ($20 miesięcznie) otrzymają wyższe limity użytkowania GPT-5 niż użytkownicy bezpłatni. Natomiast subskrybenci planu Pro ($200 miesięcznie) będą mieli nieograniczony dostęp do GPT-5, a także do ulepszonej wersji o nazwie GPT-5 Pro, która wykorzystuje dodatkowe zasoby obliczeniowe do generowania lepszych odpowiedzi.
Dla organizacji korzystających z planów OpenAI Team, Edu i Enterprise, GPT-5 będzie dostępny jako domyślny model w przyszłym tygodniu. Dla deweloperów, GPT-5 zostanie udostępniony w API OpenAI w trzech rozmiarach – gpt-5, gpt-5-mini i gpt-5-nano – które będą różnić się czasem poświęcanym na „rozumowanie” zadań. Deweloperzy uzyskają również kontrolę nad szczegółowością odpowiedzi w API OpenAI, decydując o długości lub zwięzłości generowanych treści. Bazowy model GPT-5 będzie kosztował deweloperów 1.25 dolara za milion tokenów wejściowych (czyli około 750 000 słów) i 10 dolarów za milion tokenów wyjściowych.
Wprowadzenie GPT-5 następuje po intensywnym tygodniu dla OpenAI. Firma niedawno udostępniła otwarty model rozumowania, gpt-oss, który deweloperzy i przedsiębiorstwa mogą pobrać bezpłatnie i uruchamiać za ułamek kosztów. Ten otwarty model niemal dorównał możliwościom poprzednich czołowych modeli OpenAI, o3 i o4-mini, jednak GPT-5 wyznacza nowy standard wydajności w niektórych obszarach, takich jak kodowanie. Mimo to, w wielu aspektach GPT-5 zdaje się być na równi z innymi wiodącymi modelami AI. Niemniej jednak, benchmarki zawsze opowiadają tylko część historii każdego modelu AI, a to, w jaki sposób deweloperzy wykorzystają GPT-5 w rzeczywistym świecie i czy model faktycznie stanowi znaczący krok naprzód względem konkurencji, dopiero się okaże.
