Nowe podejście do autonomii AI: Człowiek w pętli decyzyjnej z LangGraph i Streamlit
Współczesne systemy AI dynamicznie ewoluują. Agenci AI, którzy potrafią samodzielnie planować i wykonywać zadania, stają się coraz bardziej realni. Jednakże, wraz ze wzrostem ich autonomii, pojawiają się obawy dotyczące bezpieczeństwa, niezawodności i kontroli. Czy możemy w pełni ufać algorytmom podejmującym decyzje w naszym imieniu, zwłaszcza w obszarach o wysokiej stawce?
Michal Sutter, ekspert z Marktechpost, przedstawia nowe podejście do projektowania agentów AI, które rewolucjonizuje interakcję człowiek-maszyna. Zamiast dążyć do pełnej autonomii, jego propozycja skupia się na integracji człowieka w kluczowe etapy procesu decyzyjnego. To koncepcja „human-in-the-loop”, gdzie człowiek nie jest biernym obserwatorem, lecz aktywnym członkiem zespołu.
Planowanie, weryfikacja, wykonanie: trzy etapy współpracy
Sercem rozwiązania jest agent rezerwacji podróży, który działa w oparciu o trzystopniowy model. Na początku agent otwarcie, w sposób transparentny formułuje swój plan działania. Kluczowe jest to, że projektowany jest w schematyczny sposób, co kontrastuje z generowaniem swobodnego tekstu. To podejście umożliwia dogłębną weryfikację przez użytkownika. Po przygotowaniu propozycji agent celowo pauzuje, nie podejmując żadnych finalnych działań. Jest to moment, w którym proponowany plan jest prezentowany w specjalnie zaprojektowanym interfejsie.
Użytkownik zyskuje możliwość dokładnego przeanalizowania, edytowania, a nawet odrzucenia zaproponowanego planu. Dopiero po uzyskaniu wyraźnej zgody człowieka, agent ma pozwolenie na użycie narzędzi i wykonanie zaplanowanych działań. Taka architektura, łącząca mechanizmy przerywania (interrupts) z LangGraph oraz innowacyjny interfejs Streamlit, sprawia, że rozumowanie agenta staje się widoczne, kontrolowalne i budujące zaufanie, w przeciwieństwie do tradycyjnych, często nieprzejrzystych i w pełni autonomicznych systemów.
Architektura i bezpieczeństwo
Twórcy narzędzia szczególną uwagę poświęcili bezpieczeństwu i stabilności środowiska pracy. Klucz API OpenAI, niezbędny do działania systemu, jest zbierany dynamicznie w trakcie działania programu. Takie podejście gwarantuje, że nie jest on nigdy zaszyty w kodzie ani przypadkowo ujawniony w notatniku. Dodatkowo, model AI jest konfigurowany z góry, co zapewnia czystość i powtarzalność całego potoku przetwarzania.
Narzędzia, takie jak symulacje lotów, hoteli czy generowanie planów podróży, są zaprojektowane tak, by naśladować rzeczywiste interfejsy API, jednocześnie działając w środowisku Colab. Wszystkie wyniki generowane przez te narzędzia są ustrukturyzowane, co pozwala na ich audyt przed finalnym wykonaniem. Ustrukturyzowane podejście obejmuje również samo planowanie. Agent AI jest zobowiązany do generowania jawnego planu podróży, zamiast swobodnego tekstu. System automatycznie wstrzykuje wywołania narzędzi, jeśli model je pominie, co zapewnia kompletność ścieżki wykonania.
Zaufanie i odpowiedzialność
Konstrukcja LangGraph wyraźnie oddziela etapy planowania, zatwierdzania i wykonania. Celowe przerwanie grafa po etapie planowania daje użytkownikowi pełną kontrolę nad intencjami agenta. Narzędzia mogą zostać wykonane tylko po wyraźnym zatwierdzeniu przez człowieka.
Integracja z interfejsem Streamlit pozwala na edycję, zatwierdzanie oraz odrzucanie planów w czasie rzeczywistym. Stan systemu jest utrzymywany w toku kolejnych uruchomień za pomocą unikatowego identyfikatora wątku, co gwarantuje spójne zachowanie agenta podczas interakcji z użytkownikiem.
Pokazano, jak agenci działający w modelu „planuj i wykonuj” stają się znacznie bardziej niezawodni, gdy człowiek pozostaje w pętli decyzyjnej w odpowiednich momentach. Przerywanie procesów nie jest tylko funkcją techniczną, lecz fundamentalną zasadą projektową, która buduje zaufanie, odpowiedzialność i współpracę w systemach agentowych. Oddzielenie planowania od wykonania i wprowadzenie wyraźnej granicy zatwierdzenia gwarantuje, że narzędzia działają wyłącznie za zgodą i w kontekście ludzkim. Ten wzorzec wykracza poza planowanie podróży i może być zastosowany w każdej automatyzacji o wysokiej stawce, dając nam agentów, którzy myślą razem z nami, zamiast działać za nas.
