Upublicznione rozmowy z ChatGPT indeksowane przez wyszukiwarki: Przypadek ujawnionych danych
Zdumiewające spojrzenie w ludzką naturę, a jednocześnie alarmujący sygnał dotyczący prywatności w sieci, staje się faktem. Okazuje się, że publiczne zapytania kierowane do ChatGPT, udostępniane przez samych użytkowników, są indeksowane przez wyszukiwarki takie jak Google czy Bing. Filtracja wyników wyszukiwania, ograniczająca je do domen z adresem „https://chatgpt.com/share”, otwiera wrota do cudzych rozmów z zaawansowanym modelem językowym OpenAI.
Analiza tych udostępnionych dialogów ujawnia szerokie spektrum ludzkich potrzeb i fantazji. Od prozaicznych zapytań o remont łazienki, przez próby zrozumienia astrofizyki, po poszukiwanie inspiracji kulinarnych. Niektóre rozmowy stają się bardziej intymne, jak w przypadku użytkownika proszącego ChatGPT o przepisanie CV. Ironia losu – lub raczej cyfrowa transparentność – sprawiła, że na podstawie szczegółów zawartych w rozmowie łatwo było odnaleźć profil LinkedIn tej osoby, a z niego wynikało, że poszukiwanej pracy nie otrzymała.
Co więcej, natrafić można na dialogi, których treść wydaje się być żywcem wyjęta z forów internetowych o wątpliwej reputacji, lub takie, w których użytkownicy celowo prowokują sztuczną inteligencję. Przykładem jest próba nakłonienia AI do potwierdzenia, czy widelec metalowy można podgrzewać w mikrofalówce. Kiedy model stanowczo odmawia, użytkownik kontynuuje zadawanie coraz bardziej absurdalnych i zaczepnych pytań, doprowadzając do powstania instrukcji pod tytułem „Jak używać mikrofalówki bez przyzywania Szatana: przewodnik dla początkujących”.
Warto podkreślić, że ChatGPT nie upublicznia tych rozmów domyślnie. Link z końcówką „/share” jest generowany tylko wtedy, gdy użytkownik świadomie kliknie przycisk „udostępnij” w swoim czacie, a następnie zatwierdzi utworzenie linku. Usługa OpenAI zapewnia również, że „twoje imię, niestandardowe instrukcje i wszelkie wiadomości dodane po udostępnieniu pozostają prywatne”. Problem w tym, że użytkownicy prawdopodobnie nie przewidują, że Google zindeksuje te udostępnione linki, potencjalnie zdradzając tym samym osobiste informacje.
Ta nieintencjonalna jednak ekspozycja danych ma swoje korzenie w pewnej normie wypracowanej częściowo przez samego giganta z Mountain View. Kiedy użytkownicy udostępniają publicznie pliki z Google Drive z ustawieniem „Każdy, kto ma link, może przeglądać”, Google również może je indeksować w wyszukiwarce. Zazwyczaj jednak Google nie wyświetla linków do dokumentów Drive, które nie zostały publicznie opublikowane w sieci – na przykład, dokument może pojawić się w wynikach wyszukiwania, jeśli zostanie podlinkowany na zaufanej stronie internetowej. Niemniej jednak, z logami ChatGPT dzieje się inaczej.
OpenAI nie skomentowało sprawy przed publikacją. Rzecznik Google w rozmowie z TechCrunch stwierdził: „Ani Google, ani żadna inna wyszukiwarka nie kontroluje, jakie strony są publicznie dostępne w sieci. Wydawcy tych stron mają pełną kontrolę nad tym, czy są one indeksowane przez wyszukiwarki”. Ta odpowiedź, choć formalnie poprawna, pomija specyfikę platformy ChatGPT i być może niedostateczną świadomość użytkowników co do konsekwencji dzielenia się swoimi interakcjami z AI.
