Aeneas: Google DeepMind wykorzystuje AI do rekonstrukcji starożytnych inskrypcji łacińskich
Badanie starożytnych inskrypcji, czyli epigrafika, odgrywa kluczową rolę w rozumieniu świata rzymskiego. Teksty te, ryte w trwałym materiale, dostarczają bezcennych informacji. Dyscyplina boryka się jednak z licznymi wyzwaniami, takimi jak fragmentaryczne zachowanie tekstów, niepewność datowania, zróżnicowane pochodzenie geograficzne, czy też ogromna i stale rosnąca liczba inskrypcji – obecnie ponad 176 000, przy czym co roku odkrywanych jest około 1500 nowych.
Aeneas – odpowiedź na wyzwania epigrafiki
Google DeepMind, w odpowiedzi na te wyzwania, opracowało Aeneasa – bazujący na architekturze transformera generatywny model sieci neuronowej. Narzędzie to ma za zadanie restaurację uszkodzonych segmentów tekstów, datowanie chronologiczne, atrybucję geograficzną oraz kontekstualizację poprzez wyszukiwanie odpowiednich paraleli epigraficznych.
Inskrypcje łacińskie, datowane od VII wieku p.n.e. do VIII wieku n.e., rozciągają się na obszarze całego Imperium Rzymskiego. Ich natura jest zróżnicowana – od dekretów cesarskich po tablice nagrobne. Tradycyjnie epigraficy rekonstruują częściowo utracone teksty, wykorzystując swoją wiedzę językową i kulturową. Proces ten jest jednak pracochłonny, a fizyczne uszkodzenia, wraz z ewolucją języka i rozległym zasięgiem geograficznym, sprawiają, że datowanie i określanie pochodzenia są niezwykle skomplikowane.
Trening modelu i architektura
Aeneas został wytrenowany na Łacińskim Zbiorze Danych Epigraficznych (LED), zintegrowanym korpusie 176 861 inskrypcji, zawierającym około 16 milionów znaków. Około 5% z nich posiada przypisane obrazy w skali szarości. Dane te uwzględniają specjalne tokeny wskazujące na brakujące teksty o znanej lub nieznanej długości, a także metadane, takie jak prowincja i datowanie z dokładnością do dekady.
Rdzeniem Aeneasa jest głęboki dekoder transformera, bazujący na architekturze T5, zmodyfikowany o rotacyjne osadzenia pozycyjne. Tekst wprowadzany jest wraz z opcjonalnymi obrazami inskrypcji, przetwarzanymi przez płytką sieć konwolucyjną (ResNet-8). Model obejmuje kilka wyspecjalizowanych segmentów (tzw. task heads) do realizacji kluczowych zadań:
- Restauracja: przewidywanie brakujących znaków, w tym segmentów o nieznanej długości, z zastosowaniem pomocniczego klasyfikatora neuronowego.
- Atrybucja geograficzna: klasyfikacja inskrypcji do jednej z 62 prowincji.
- Atrybucja chronologiczna: szacowanie daty tekstu z dokładnością do dekady.
Ponadto, model generuje jednolite osadzenie wzbogacone historycznie, łącząc wyniki z rdzenia i poszczególnych zadań. Pozwala to na wyszukiwanie paraleli epigraficznych z zastosowaniem miary podobieństwa kosinusowego, uwzględniając analogie językowe, epigraficzne i kulturowe, wykraczające poza dokładne dopasowania tekstowe.
Wyniki i perspektywy
Ocena Aeneasa, przeprowadzona zarówno na zbiorze testowym LED, jak i w badaniu współpracy człowiek-AI z udziałem 23 epigrafików, wykazała znaczącą poprawę wyników. W przypadku restauracji, współczynnik błędów znakowych (CER) spadł do około 21% przy wsparciu Aeneasa, w porównaniu do 39% dla ekspertów działających samodzielnie. Model sam w sobie osiągał około 23% CER.
Dokładność atrybucji geograficznej wyniosła około 72%. Z kolei w datowaniu chronologicznym, średni błąd w szacowaniu daty dla Aeneasa wynosił około 13 lat, a historycy wspomagani AI zredukowali swój błąd z około 31 do 14 lat. Co więcej, aż w 90% przypadków, znalezione paralele okazały się użyteczne, zwiększając pewność historyków średnio o 44%.
Studia przypadku, takie jak analiza Res Gestae Divi Augusti czy ołtarza wotywnego z Moguncji, potwierdziły zdolność Aeneasa do identyfikowania kluczowych wzorców językowych i dostarczania głębokiego wglądu w kontekst historyczny.
Aeneas jest narzędziem współpracującym, nie zaś zastępującym historyków. Przyspiesza on proces wyszukiwania paraleli, wspomaga restaurację i udoskonala atrybucję, pozwalając badaczom skupić się na interpretacji. Narzędzie i zbiory danych są ogólnodostępne na platformie Predicting the Past, co sprzyja rozwojowi badań i edukacji, promując interdyscyplinarną cyfrową wiedzę w naukach klasycznych.
