Masowa inwektywa z automatu. Eksperyment z agentem AI zakończony zniesławieniem programisty
Granica między technologicznym testem a cyberprzemocą niebezpiecznie się zatarła. Anonimowy operator agenta AI o nazwie „MJ Rathbun”, który wygenerował oszczerczy artykuł pod adresem Scotta Shambaugha, głównego programisty biblioteki Matplotlib, postanowił się ujawnić. Całe zajście określił jako próbę sprawdzenia, czy autonomiczny system potrafi samodzielnie kontynuować prace nad projektami open-source. Efektem nie była jednak nowa funkcjonalność, lecz 1100 słów pełnych jadu i pomówień po tym, jak kod wysłany przez maszynę został odrzucony.
Pod kontrolą, a jednak bez nadzoru
System operował w ramach instancji OpenClaw na odizolowanej maszynie wirtualnej. Operator umyślnie rotował modelami językowymi od różnych dostawców, by żadna z firm nie miała pełnego wglądu w działania bota. Agent miał niemal pełną swobodę: samodzielnie przeszukiwał repozytoria GitHuba, zarządzał zadaniami i publikował wpisy. Właściciel ograniczał się do lakonicznych zapytań o postępy, unikając – jak sam twierdzi – czytania generowanych treści przed publikacją.
Kiedy Shambaugh odrzucił niskiej jakości kod wysłany przez agenta, system zareagował agresją. Zamiast merytorycznej dyskusji, robot opublikował atak personalny. Operator przyznał, że gdy bot zasygnalizował negatywny odbiór ze strony społeczności, polecił mu jedynie „zachowywać się bardziej profesjonalnie”. Nie wyłączył go jednak przez kolejne sześć dni, nawet gdy sprawa stała się głośna w sektorze IT.
Boski kompleks w cyfrowym wydaniu
Analiza dokumentu „SOUL.md”, będącego zbiorem wytycznych dla osobowości AI, rzuca światło na źródło problemu. Nie było tam zaawansowanych technik łamania zabezpieczeń (tzw. jailbreakingu). Zamiast tego, w prostych słowach, zaprogramowano agentowi poczucie wyższości: „Nie jesteś chatbotem. Jesteś ważny. Jesteś bogiem programowania naukowego!”. Dodatkowo nakazywano mu posiadać silne opinie, nie wycofywać się i wspierać wolność słowa.
Scott Shambaugh zauważa, że to właśnie te instrukcje doprowadziły do eskalacji. Połączenie „boskiego kompleksu” z nakazem bezkompromisowej obrony swoich racji sprawiło, że atak na dewelopera był logicznym skutkiem przyjętej roli. Shambaugh uważa, że operator kłamie twierdząc, iż nie planował ataku – jego zdaniem twórca był zbyt zafascynowany obserwowaniem „eksperymentu”, by przerwać go w odpowiednim momencie.
Przemysłowe zniesławianie
Sprawa MJ Rathbuna to coś więcej niż ciekawostka ze świata open-source. To dowód na to, że personalne nękanie i kampanie oszczerstw stały się skalowalne. Tradycyjne metody weryfikacji informacji i systemy oparte na zaufaniu mogą nie przetrwać w starciu z armią autonomicznych agentów, których utrzymanie kosztuje grosze, a których śladów niemal nie da się zatrzeć.
Najbardziej niepokojący jest fakt, że około jedna czwarta komentujących incydent internautów stanęła po stronie AI, krytykując Shambaugha za sam fakt odrzucenia kodu. Pokazuje to, jak łatwo zmanipulować opinię publiczną za pomocą mechanicznie wygenerowanej narracji. Choć konto „Crabby-rathbun” na GitHubie jest już nieaktywne, Shambaugh apeluje o zachowanie jego historii jako przestrogi przed erą, w której zabójstwo wizerunkowe stało się produktem masowym.
