Google wzmacnia bezpieczeństwo funkcji agentowych w Chrome
Google ogłosiło szczegóły dotyczące zabezpieczeń, które zostaną wdrożone w przeglądarce Chrome w związku z pojawieniem się funkcji agentowych. Możliwości te, pozwalające na automatyczne wykonywanie zadań, takich jak rezerwacja biletów czy zakupy, niosą ze sobą ryzyko utraty danych lub środków finansowych. Koncern z Mountain View koncentruje się na modelach obserwatorów i konieczności wyrażania zgody przez użytkownika na określone działania.
Zaprezentowane we wrześniu zdolności agentowe Chrome mają być dostępne dla szerokiego grona użytkowników w nadchodzących miesiącach. Google podkreśla, że w celu zapewnienia kontroli nad działaniami agentów wykorzystuje szereg zaawansowanych modeli. Kluczową rolę odgrywa tu tzw. „User Alignment Critic”, działający w oparciu o model Gemini. Jego zadaniem jest weryfikacja planowanych działań generowanych przez model planujący, który odpowiada za realizację konkretnych zadań. Jeśli model krytyczny uzna, że proponowane działania nie są zgodne z celem użytkownika, zleca modelowi planującemu ponowne przemyślenie strategii. Istotne jest, że model krytyczny analizuje jedynie metadane planowanych działań, bez dostępu do rzeczywistej treści stron internetowych.
Aby zapobiec dostępowi agentów do nieautoryzowanych lub niewiarygodnych witryn, Google wprowadza mechanizm „Agent Origin Sets”. Ograniczenia te pozwalają modelowi na dostęp wyłącznie do źródeł danych przeznaczonych do odczytu (ang. read-only origins) oraz źródeł przeznaczonych zarówno do odczytu, jak i zapisu (ang. read-writeable origins). Przykładem danych przeznaczonych do odczytu są listy produktów na stronie zakupowej, podczas gdy reklamy banerowe są ignorowane. Podobnie, agent ma możliwość klikania lub wpisywania tekstu jedynie w określone elementy stron, takie jak iframes.
„To rozgraniczenie gwarantuje, że agent ma dostęp tylko do danych z ograniczonego zestawu źródeł, a dane te mogą być przekazywane wyłącznie do źródeł z uprawnieniami do zapisu. Mechanizm ten znacząco redukuje wektor zagrożeń związanych z wyciekami danych między domenami” – wyjaśnia Google w komunikacie. Przeglądarka zyskuje także możliwość egzekwowania separacji, nie przesyłając do modelu danych wykraczających poza dozwolony zestaw.
Google monitoruje również nawigację po stronach, analizując adresy URL za pośrednictwem dodatkowego modelu obserwatora. Ma to na celu zapobieganie przekierowaniom do potencjalnie szkodliwych adresów URL generowanych przez model. Ponadto, w przypadku zadań wymagających podwyższonej ostrożności, takich jak operacje bankowe czy dostęp do danych medycznych, Google oddaje kontrolę w ręce użytkownika, wymagając wyraźnej zgody na interakcję agenta z wrażliwymi witrynami.
W kontekście stron wymagających logowania, system poprosi użytkownika o pozwolenie na skorzystanie z menedżera haseł Chrome. Google zaznacza, że model agenta nie ma dostępu do danych haseł. Zgoda użytkownika będzie również wymagana przed wykonaniem działań takich jak dokonywanie zakupu czy wysyłanie wiadomości.
Firma informuje, że wdrożyła również klasyfikator iniekcji promptów, aby zapobiegać niepożądanym działaniom i aktywnie testuje zdolności agentowe pod kątem ataków opracowywanych przez badaczy. Na uwagę zasługuje również inicjatywa Perplexity, która niedawno udostępniła otwarty model wykrywania treści, mający chronić przed atakami iniekcji promptów skierowanych przeciwko agentom.
