BiznesLLMNarzędzia

OpenAI uruchomiło publicznie GPT-5: Nowa era AI od agentów po aplikacje

Najnowsze dzieło OpenAI, model GPT-5, ma ambicję przedefiniowania interakcji użytkownika ze sztuczną inteligencją. Zaprezentowany w czwartek, GPT-5 jest opisywany przez firmę jako ich pierwszy 'uśredniony’ model, zintegrowany z ChatGPT. Jego unikalność ma polegać na połączeniu precyzyjnych zdolności rozumowania znanych z poprzednich modeli serii 'o’ z szybkością reakcji charakterystyczną dla linii GPT. Ten ruch sygnalizuje szerszą strategię OpenAI – dążenie do tworzenia systemów AI, które działają bardziej jak niezależne agenty, a mniej jak proste chatboty.

Podczas gdy poprzednik, GPT-4, zrewolucjonizował możliwość udzielania inteligentnych odpowiedzi na szerokie spektrum pytań, GPT-5 idzie krok dalej, pozwalając ChatGPT na samodzielne wykonywanie złożonych zadań w imieniu użytkownika. Może to obejmować generowanie aplikacji, zarządzanie kalendarzem czy tworzenie kompleksowych podsumowań badań. Co więcej, OpenAI postawiło na maksymalne uproszczenie obsługi. Zamiast zmuszać użytkowników do manualnego wyboru ustawień, GPT-5 wyposażono w dynamiczny router, który w czasie rzeczywistym dobiera optymalny tryb odpowiedzi – od błyskawicznej reakcji po dogłębne 'przemyślenie’ zadania.

Ambicje na miarę AGI i dostępność dla wszystkich

Sam Altman, CEO OpenAI, nie kryje optymizmu, nazywając GPT-5 'najlepszym modelem na świecie’ i 'znaczącym krokiem’ w kierunku stworzenia sztucznej inteligencji ogólnego przeznaczenia (AGI), która przewyższy ludzi w większości zadań o wartości ekonomicznej. Podkreśla, że jeszcze niedawno istnienie takiego modelu jak GPT-5 byłoby 'nie do pomyślenia’. W duchu misji OpenAI, która zakłada demokratyzację dostępu do zaawansowanej AI, GPT-5 został udostępniony wszystkim darmowym użytkownikom ChatGPT jako domyślny model. Nick Turley, wiceprezes OpenAI odpowiedzialny za ChatGPT, zaznacza, że to pierwszy raz, kiedy tak zaawansowany model rozumiejący jest dostępny bezpłatnie, podkreślając zaangażowanie firmy w szerzenie korzyści płynących z AI.

Oczekiwania wobec GPT-5 są ogromne, zwłaszcza biorąc pod uwagę fenomenalny sukces ChatGPT, który od 2022 roku zdobył ponad 700 milionów użytkowników tygodniowo. Wyniki GPT-5 są postrzegane jako barometr postępu AI, a jego przyjęcie w Dolinie Krzemowej może mieć dalekosiężne konsekwencje dla gigantów technologicznych, Wall Street i ustawodawców. Rynek z uwagą obserwuje, czy GPT-5 dostarczy skok jakościowy, podobny do tego, który zaoferował GPT-4, zmieniając postrzeganie możliwości oprogramowania.

Wydajność i mierniki – gdzie GPT-5 wiedzie prym?

OpenAI twierdzi, że GPT-5 wyznacza nowy standard w kilku domenach, nieznacznie przewyższając czołowe modele AI od Anthropic, Google DeepMind i xAI Elona Muska w kluczowych testach. GPT-5 ma wyróżniać się w programowaniu, szczególnie w szybkim tworzeniu kompletnych aplikacji, co Altman określa mianem 'vibe codingu’. W teście SWE-bench Verified, symulującym rzeczywiste zadania kodowania z GitHub, GPT-5 osiągnął 74.9% skuteczności przy pierwszej próbie, minimalnie wyprzedzając model Claude Opus 4.1 firmy Anthropic (74.5%) i Gemini 2.5 Pro od Google DeepMind (59.6%).

Mimo tych sukcesów, GPT-5 nie wszędzie dominuje. W teście Humanity’s Last Exam, sprawdzającym modele AI z matematyki, nauk humanistycznych i przyrodniczych, wersja GPT-5 z rozszerzonym rozumowaniem (GPT-5 Pro) osiągnęła 42% (z użyciem narzędzi), co jest wynikiem nieco niższym niż 44.4% osiągnięte przez Grok 4 Heavy firmy xAI. Niemniej jednak, w teście GPQA Diamond, składającym się z pytań naukowych na poziomie doktoranckim, GPT-5 Pro uzyskał 89.4% przy pierwszej próbie, wyprzedzając zarówno Claude Opus 4.1 (80.9%), jak i Grok 4 Heavy (88.9%).

Co więcej, OpenAI podkreśla ulepszenia GPT-5 w zakresie odpowiedzi na pytania związane ze zdrowiem. W teście HealthBench Hard Hallucinations, mierzącym dokładność modelu w zakresie tematów medycznych, GPT-5 (z opcją 'myślenia’) wykazywał halucynacje jedynie w 1.6% przypadków. To znacząca poprawa w porównaniu do poprzednich modeli GPT-4o (12.9%) i o3 (15.8%). Mając na uwadze, że miliony ludzi korzystają z chatbotów w poszukiwaniu porad zdrowotnych, GPT-5 ma być bardziej proaktywny w sygnalizowaniu potencjalnych problemów zdrowotnych i pomaganiu użytkownikom w interpretacji wyników medycznych.

Redukcja halucynacji i ulepszenia w kreatywności

Jednym z kluczowych usprawnień w GPT-5 jest znaczące ograniczenie tzw. halucynacji – tendencji modeli AI do generowania fałszywych informacji. W poprzednich modelach, takich jak o3, problem ten wydawał się narastać. OpenAI podaje, że GPT-5 (z opcją 'myślenia’) generuje błędne odpowiedzi tylko w 4.8% przypadków, co stanowi drastyczną redukcję w porównaniu do o3 (22%) i GPT-4o (20.6%). To kluczowe dla zwiększenia zaufania i użyteczności modelu. OpenAI twierdzi również, że GPT-5 przewyższa inne modele AI w subiektywnych, trudniejszych do zmierzenia dziedzinach, takich jak projektowanie kreatywne i pisanie. Turley zauważa, że GPT-5 reaguje bardziej naturalnie i wykazuje 'lepszy gust’ w zadaniach kreatywnych.

W teście Tau-bench, mierzącym zdolność agentową AI do wykonywania symulowanych zadań online, GPT-5 wykazuje mieszane wyniki. W części testu dotyczącej nawigacji po stronie linii lotniczych, GPT-5 osiągnął 63.5%, nieznacznie niżej niż o3 (64.8%). W innej części, mierzącej nawigację po stronach detalicznych, GPT-5 uzyskał 81.1%, ustępując Claude Opus 4.1 (82.4%).

Bezpieczeństwo i nowe opcje interfejsu

OpenAI zapewnia, że GPT-5 jest również bezpieczniejszy niż jego poprzednicy. Eksperci firmy zauważyli mniejszą tendencję modelu do oszukiwania lub dążenia do własnych celów. Alex Beutel, szef działu badań nad bezpieczeństwem w OpenAI, podkreśla, że redukcja oszustw poprawia nie tylko bezpieczeństwo, ale i doświadczenie użytkownika, czyniąc model bardziej 'przejrzystym i uczciwym’. GPT-5 ma również lepiej rozróżniać użytkowników o złych intencjach od tych, którzy zadają nieszkodliwe pytania, co ma skutkować odrzucaniem większej liczby niebezpiecznych zapytań, jednocześnie redukując liczbę nieuzasadnionych odrzuceń dla nieszkodliwych próśb.

Wraz z uruchomieniem GPT-5, ChatGPT wzbogaca się o nowe funkcje interfejsu. Użytkownicy mogą teraz wybierać spośród czterech nowych 'osobowości’ dla ChatGPT: Cynic, Robot, Listener i Nerd. Mają one automatycznie dostosowywać styl odpowiedzi, bez konieczności manualnego wydawania zaleceń. Abonenci płatnego planu ChatGPT Plus (20 USD/miesiąc) otrzymają wyższe limity użytkowania GPT-5, natomiast subskrybenci planu Pro (200 USD/miesiąc) uzyskają nieograniczony dostęp do GPT-5 oraz do ulepszonej wersji GPT-5 Pro, wykorzystującej dodatkowe zasoby obliczeniowe.

Dla deweloperów, GPT-5 będzie dostępny w API OpenAI w trzech rozmiarach – gpt-5, gpt-5-mini i gpt-5-nano – różniących się 'czasem rozumowania’. Deweloperzy uzyskują również kontrolę nad szczegółowością odpowiedzi. Bazowa wersja GPT-5 będzie kosztować deweloperów 1.25 USD za milion tokenów wejściowych i 10 USD za milion tokenów wyjściowych.

Premiera GPT-5 wieńczy intensywny tydzień dla OpenAI, który wcześniej udostępnił otwarty model gpt-oss. Chociaż GPT-5 ustanawia nowe standardy w niektórych dziedzinach, takich jak kodowanie, w innych obszarach wydaje się być porównywalny z innymi czołowymi modelami AI. Niemniej jednak, pełny obraz możliwości GPT-5 wyłoni się dopiero w miarę jego realnego zastosowania przez deweloperów, co pokaże, czy model faktycznie stanowi znaczący krok naprzód względem konkurencji.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *