Agenci AI

OpenAI wprowadza agenta ogólnego przeznaczenia do ChatGPT, zwiększając możliwości automatyzacji zadań

OpenAI po raz kolejny przesuwa granice możliwości sztucznej inteligencji, wprowadzając do swojego flagowego produktu, ChatGPT, wszechstronnego agenta AI. Narzędzie to, zgodnie z zapowiedziami firmy, ma zdolność do automatyzowania różnorodnych zadań komputerowych, wykraczając poza tradycyjne funkcje konwersacyjne chatbota.

Nowy agent, nazwany po prostu „ChatGPT agent”, łączy w sobie funkcjonalności znane z poprzednich eksperymentów OpenAI z inżynierią agentową. Potrafi na przykład nawigować po kalendarzu użytkownika, generować edytowalne prezentacje, a nawet uruchamiać kod, co znacząco rozszerza jego spektrum zastosowań. Integracja możliwości takich jak interakcja z interfejsami webowymi (znana z Operatora) oraz syntezowanie informacji z wielu źródeł (jak w przypadku Deep Research) ma zapewnić kompleksowe wsparcie w codziennych operacjach. Użytkownicy będą mogli aktywować agenta poprzez proste komunikaty tekstowe w ChatGPT, co ma ułatwić interakcję.

Dostępność i mechanizm działania

W czwartek OpenAI udostępniło nowego agenta subskrybentom planów Pro, Plus i Team. Aktywacja narzędzia odbywa się poprzez wybór „trybu agenta” w menu rozwijanym ChatGPT. To strategiczne posunięcie podkreśla ambicje OpenAI, by przekształcić ChatGPT z interaktywnego chatbota w proaktywnego asystenta, zdolnego do samodzielnego działania.

Od lat firmy z Doliny Krzemowej, w tym OpenAI, Google czy Perplexity, snuły wizje wszechstronnych agentów AI. Wczesne implementacje tych koncepcji często jednak napotykały trudności z obsługą złożonych zadań, co stawiało pod znakiem zapytania ich praktyczną użyteczność. OpenAI deklaruje jednak, że nowa iteracja agenta ChatGPT jest znacznie bardziej zaawansowana niż dotychczasowe rozwiązania firmy.

Kluczową nowością jest również dostępność „ChatGPT connectors”, systemu umożliwiającego agentowi integrację z zewnętrznymi aplikacjami, takimi jak Gmail czy GitHub. Dzięki temu agent może wyszukiwać i wykorzystywać istotne informacje z połączonych usług w odpowiedzi na zapytania użytkownika. Dodatkowo, agent ma dostęp do terminala oraz możliwość korzystania z API, co otwiera drogę do głębszej interakcji z aplikacjami.

Wydajność i kwestie bezpieczeństwa

Według OpenAI, model bazowy leżący u podstaw agenta ChatGPT wykazuje „stan sztuki” w kilku kluczowych benchmarkach. Jako przykład podano wynik 41,6% w teście „Humanity’s Last Exam” (pass@1) – trudnym zbiorze tysięcy pytań z ponad stu dziedzin, co stanowi niemal dwukrotnie lepszy wynik niż uzyskany przez modele o3 i o4-mini. Na jednym z najtrudniejszych testów matematycznych, FrontierMath, agent ChatGPT osiągnął 27,4% z dostępem do narzędzi (takich jak terminal do wykonywania kodu), w porównaniu do zaledwie 6,3% dla poprzedniego lidera, o4-mini.

OpenAI podkreśla, że rozwój agenta ChatGPT odbywał się z uwzględnieniem zasad bezpieczeństwa. Nowe możliwości narzędzia, choć obiecujące, niosą ze sobą ryzyko potencjalnego niewłaściwego użycia. Ostateczna ocena rzeczywistych możliwości i ograniczeń agenta ChatGPT zweryfikuje jego praktyczną wartość oraz poziom bezpieczeństwa w rękach użytkowników.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *