Agenci AI

Od biurka do niszowego problemu: Dlaczego startup Pig.dev porzucił automatyzację Windows i obrał nowy kierunek

Wydawać by się mogło, że to przełom: startup Pig.dev, uczestnik zimowej partii Y Combinator 2025, ambitnie dążył do stworzenia agentów AI zdolnych do pełnej kontroli pulpitu Microsoft Windows. Koncepcja ta, w idealnym świecie, mogłaby znacząco usprawnić interakcję człowieka z komputerem, otwierając nowe perspektywy dla automatyzacji zadań. Jednak w maju bieżącego roku Erik Dunteman, założyciel Pig.dev, ogłosił radykalną zmianę kierunku, porzucając dotychczasowe plany na rzecz Muscle Mem, systemu pamięci podręcznej zaprojektowanego dla agentów AI, który ma usprawnić przetwarzanie powtarzalnych zadań.

Pivot w początkowej fazie działalności startupu nie jest niczym niezwykłym. Uwagę analityków, w tym partnerów Y Combinator, przyciągnął jednak fakt, że Pig.dev zajmował się obszarem kluczowym dla rozwoju użytecznych agentów AI: automatyzacją interakcji z komputerem. To właśnie ten aspekt, w którym agenci AI muszą efektywnie operować systemami operacyjnymi i aplikacjami, jest często wskazywany jako bariera dla ich szerszego zastosowania w środowiskach biznesowych.

Podczas niedawnego podcastu Y Combinator, Tom Blomfield, partner YC, porównał Pig.dev do Browser Use – narzędzia, które zyskało popularność w kontekście chińskiego agenta Manus. Browser Use skanuje elementy stron internetowych, przekształcając je w format zrozumiały dla agentów AI, co ułatwia im nawigację i interakcję w środowisku przeglądarkowym. Dyskusja, w której uczestniczyli również Amjad Masad (CEO Replit) i David Lieb (partner YC), koncentrowała się na wyzwaniach związanych z długotrwałym, godzinnym, a nie minutowym, wykorzystaniem agentów AI. Wzrost okien kontekstowych dla procesów rozumowania AI skutkuje wprawdzie lepszą analityką, ale jednocześnie prowadzi do spadku precyzji działania agentów oraz wzrostu kosztów związanych z modelami językowymi (LLM).

Blomfield zasugerował, że dla twórców startupów optymalnym kierunkiem może być aplikowanie rozwiązań takich jak te opracowywane przez Browser Use czy Pig.dev (w zakresie automatyzacji Windows) do konkretnych branż i zastosowań korporacyjnych. Masad zgodził się z tą wizją, podkreślając potencjał sukcesu dla firm, które skutecznie rozwiążą te problemy. Mimo to, założyciel Pig.dev wycofał się z pierwotnego pomysłu, co świadczy o głębszych problemach rynkowych.

W maju Dunteman wyjaśniał, że jego pierwotna wizja produktu API w chmurze – typowy model dostarczania technologii AI – nie spotkała się z zainteresowaniem klientów. Próba sprzedaży jako narzędzia deweloperskiego również nie przyniosła spodziewanych rezultatów. Okazało się, że użytkownicy w sektorze automatyzacji aplikacji widzieli większą wartość w gotowych rozwiązaniach dostarczanych przez konsultantów, którzy konfigurowali i wdrażali automatyzację procesów robotycznych (RPA) w systemie Windows. Dunteman, niechcący angażować się w jednorazowe projekty i pragnąc skupić się na tworzeniu narzędzi deweloperskich, zrezygnował z Pig.dev na rzecz rozwoju narzędzia do buforowania AI.

Mimo że szczegóły tej decyzji pozostają objęte tajemnicą, a zasoby Pig.dev wciąż są dostępne online, Dunteman potwierdził, że jego nowe narzędzie Muscle Mem, jest bezpośrednio inspirowane problematyką efektywnego wykorzystania komputerów przez AI. Rozwiązanie to ma na celu odciążenie agentów AI od powtarzalnych zadań, umożliwiając im skupienie się na złożonych problemach i przypadkach brzegowych. „To, nad czym teraz pracujemy, jest bezpośrednio inspirowane i ma zastosowanie do problematyki 'computer use’, lecz na poziomie narzędzi deweloperskich” – powiedział Dunteman. „Pozostaję bardzo optymistyczny co do 'computer use’ jako 'ostatniej mili’.”

Oczywiście, Pig.dev nie był jedynym graczem na polu automatyzacji Windows. Microsoft sam intensywnie pracuje nad tym obszarem. W kwietniu firma zapowiedziała, że do Copilot Studio dla graficznych interfejsów użytkownika (takich jak Windows) dodano technologię „computer use”, dostępną do badań. Ponadto, na początku bieżącego miesiąca Microsoft ogłosił wprowadzenie narzędzia opartego na agentach AI w Windows 11, które ma pomagać użytkownikom zarządzać ustawieniami systemu. To pokazuje, że choć Pig.dev zrezygnował z konkretnego nurtu, problematyka efektywnej interakcji AI z systemami operacyjnymi pozostaje jednym z kluczowych wyzwań i obszarów rozwoju w świecie sztucznej inteligencji.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *