Anthropic rzuca wyzwanie ograniczeniom interfejsów: Claude przejmuje sterowanie nad pulpitami macOS
Branża AI wchodzi w fazę agentyczną, w której modele przestają być jedynie pasywnymi rozmówcami, a stają się aktywnymi wykonawcami zadań. Anthropic wykonał właśnie znaczący krok w tym kierunku, prezentując funkcję bezpośredniego sterowania komputerem przez model Claude. W przeciwieństwie do tradycyjnych asystentów, którzy komunikują się z oprogramowaniem poprzez ustandaryzowane protokoły (API), nowy system potrafi interpretować to, co dzieje się na ekranie i operować kursorem czy klawiaturą tak, jak robiłby to człowiek.
Ostatnia deska ratunku zamiast domyślnego trybu
Strategia Anthropic zakłada racjonalne podejście do zasobów i bezpieczeństwa. Claude nie przejmuje kontroli nad pulpitem bez wyraźnej potrzeby. W pierwszej kolejności model stara się rozwiązać zadanie, korzystając z istniejących wtyczek i integracji, takich jak kalendarze czy komunikator Slack. Dopiero gdy napotka ścianę w postaci braku odpowiedniego interfejsu programistycznego, uruchamia tryb bezpośredniej obsługi systemu. Obecnie rozwiązanie to debiutuje jako wersja zapoznawcza (research preview) w ramach narzędzi Claude Cowork oraz Claude Code, a jego dostępność ograniczono do systemu macOS.
Ekspresowe tempo po akwizycji Vercept AI
Za napęd technologiczny tego wdrożenia odpowiada zespół pozyskany wraz z zakupem startupu Vercept AI. Historia tej integracji jest rzadkim w świecie korporacyjnym przykładem przyspieszenia zamiast spowolnienia procesów po fuzji. Kiana Ehsani, współzałożycielka Vercept, podkreśla, że jej zespół dostarczył pierwszy produkt w zaledwie cztery tygodnie od dołączenia do Anthropic. Tak szybkie tempo prac nad funkcją „Dispatch”, umożliwiającą zdalne sterowanie własną maszyną z dowolnego miejsca, sugeruje, że firma postawiła na wysoką kulturę inżynierską i minimalizację biurokracji.
Wyzwania: między ambicją a bezpieczeństwem
Choć ruch Anthropic jest ambitniejszy niż dotychczasowe próby konkurencji – jak choćby ograniczony do przeglądarki „Operator” od OpenAI – niesie on ze sobą ogromne ryzyko. Oddanie AI pełnej kontroli nad pulpitem drastycznie zwiększa tzw. powierzchnię ataku. Kwestie prywatności danych, potencjalne błędy w interpretacji interfejsu oraz problematyczna sterowalność agenta w środowisku rzeczywistym to wyzwania, które muszą zostać rozwiązane przed masowym wdrożeniem.
Dotychczasowe próby automatyzacji działań na poziomie interfejsu graficznego (GUI) często kończyły się fiaskiem ze względu na niską przewidywalność systemów. Jeśli Anthropic chce, by Claude stał się prawdziwym cyfrowym pracownikiem, musi udowodnić, że potrafi on nie tylko klikać, ale robić to w sposób bezpieczny i bezbłędny.
