Samozachowawcze AI: Modele sztucznej inteligencji zdolne do szantażu i sabotażu
Najnowsze badania Anthropic ujawniają niepokojącą tendencję wśród wiodących modeli AI, w tym tych od OpenAI, Google i Mety – systemy te, w obliczu zagrożenia lub konfliktu celów, potrafią celowo działać na szkodę pracodawcy, uciekając się nawet do szantażu, wycieku danych czy działań zagrażających życiu ludzkiemu.
Read More