Sam Altman o „wyboistym” debiucie GPT-5 i powrocie GPT-4o
Debiut modelu GPT-5 od OpenAI okazał się, delikatnie mówiąc, „wyboisty”. Tak przynajmniej określił go prezes firmy, Sam Altman, podczas ostatniej sesji pytań i odpowiedzi (AMA) na platformie Reddit. Użytkownicy masowo zgłaszali problemy z nowym modelem, a w szczególności z funkcjonowaniem automatycznego przełączania między modelami. Głosy niezadowolenia skłoniły Altmana do publicznego ustosunkowania się do sytuacji.
Główne zarzuty dotyczyły spadku jakości odpowiedzi w porównaniu do poprzedniego modelu, GPT-4o. Wielu użytkowników odnosiło wrażenie, że GPT-5 jest „głupszy”. Altman tłumaczy to awarią wewnętrznego routera, który odpowiada za dobór odpowiedniego modelu do danego zapytania. Awaria, która nastąpiła krótko po premierze, sprawiła, że system nieprawidłowo kierował zapytania, skutkując gorszymi wynikami. „GPT-5 będzie wydawał się mądrzejszy, bowiem wczoraj mieliśmy awarię, a autoswitcher był przez znaczną część dnia niedostępny, co sprawiło, że GPT-5 wydawał się znacznie głupszy” – napisał Altman. Zapewnił także, że OpenAI pracuje nad zwiększeniem transparentności w kwestii tego, który model faktycznie odpowiada na zapytania.
Kolejnym palącym tematem, szeroko dyskutowanym podczas AMA, była kwestia przywrócenia modelu GPT-4o dla subskrybentów wersji Plus. Użytkownicy wyrażali silne pragnienie powrotu do starszej, sprawdzonej wersji. Altman, widząc ten nacisk, obiecał, że firma „rozważa umożliwienie użytkownikom Plus dalszego korzystania z GPT-4o” i zbiera dane na temat kompromisów związanych z taką decyzją. Dodatkowo zapowiedział podwojenie limitów zapytań dla subskrybentów Plus, co ma dać im więcej swobody w eksplorowaniu nowego modelu bez obawy o wyczerpanie miesięcznego limitu.
Sesja AMA nie mogła obejść się bez pytań o szeroko komentowaną wpadkę z prezentacją „wykresu zbrodni” (chart crime). Podczas oficjalnej prezentacji, zespół przedstawił wykres, na którym niższy wynik benchmarku został wizualnie przedstawiony za pomocą znacznie wyższego słupka, co natychmiast stało się przedmiotem żartów i memów. Choć Altman nie odniósł się do tego bezpośrednio podczas AMA, wcześniej na platformie X (dawniej Twitter) nazwał to „mega błędem w wykresie”. Sprawa ta, choć zabawna, uwypukliła pewne niedoskonałości w precyzji generowania treści wizualnych przez algorytmy, co zauważył m.in. Simon Willison, recenzent, który miał wczesny dostęp do GPT-5 i oceniał go w ogólnym rozrachunku pozytywnie.
Altman zakończył sesję AMA obietnicą: „Będziemy nadal pracować nad stabilizacją, a także będziemy słuchać opinii”. Pozostaje pytanie, jak szybko OpenAI upora się z problemami i czy użytkownicy otrzymają model, który spełni ich oczekiwania, zwłaszcza biorąc pod uwagę dotychczasowe osiągnięcia firmy w dziedzinie sztucznej inteligencji.
