LLMR & D

FlexOlmo: Rewolucja w treningu modeli językowych zachowująca prywatność danych

Wraz z dynamicznym rozwojem dużych modeli językowych (LLM) rośnie zapotrzebowanie na dostęp do obszernych i różnorodnych zbiorów danych treningowych. W wielu sektorach, zwłaszcza w branżach regulowanych, przedsiębiorstwa dysponują cennymi danymi, które mogłyby wzbogacić modele AI, jednak rygorystyczne przepisy i kwestie bezpieczeństwa uniemożliwiają ich swobodne udostępnianie. Tej bariery dotyka właśnie FlexOlmo, opracowany przez Instytut Sztucznej Inteligencji Allena (AI2), oferując nowatorskie podejście do wspólnego treningu modeli językowych bez naruszania prywatności danych.

Centralnym elementem FlexOlmo jest architektura mieszanki ekspertów (mixture-of-experts, MoE), gdzie każdy „ekspert” jest niezależnie szkolony na zamkniętych, lokalnych zbiorach danych. Zamiast wymieniać surowe dane, uczestniczące organizacje trenują własnych ekspertów na swoich serwerach, a następnie udostępniają jedynie wagi wytrenowanych modeli. To kluczowa zmiana paradygmatu – przenosi ciężar z wymiany danych na wymianę wiedzy zakodowanej w parametrach modeli.

Wyzwanie związane z niezależnie szkolonymi ekspertami, jakim jest koordynacja i spójność, rozwiązano w FlexOlmo poprzez wykorzystanie zamrożonego, publicznego modelu jako punktu odniesienia. Ten bazowy element pozostaje niezmieniony w trakcie całego procesu treningowego, podczas gdy nowi eksperci są doszkalani na danych specyficznych dla danej organizacji. Dzięki temu wszyscy niezależni eksperci zachowują spójność z tym samym modelem referencyjnym i mogą być później bezproblemowo łączone w finalny, hybrydowy model bez konieczności dodatkowego retreningu.

Architektura FlexOlmo jest szczególnie efektywna w scenariuszach, gdzie wymagana jest ścisła kontrola dostępu do danych. Możliwość aktywowania lub dezaktywowania poszczególnych źródeł danych w zależności od konkretnej aplikacji otwiera drogę do elastycznego zarządzania treścią. Na przykład, dane zawierające toksyczne treści mogą być uwzględniane w celach badawczych, lecz wyłączane z ogólnego użytku. Zespół AI2 zademonstrował tę funkcjonalność, usuwając eksperta odpowiedzialnego za treści informacyjne, co naturalnie wpłynęło na spadek wydajności modelu w zadaniach związanych z newsami, lecz zachowało stabilność wyników w innych obszarach. Co więcej, w przypadku zmiany licencji lub wygaśnięcia praw do użytkowania danych, poszczególne źródła mogą być dezaktywowane bez potrzeby ponownego szkolenia całego modelu.

Ostateczny model FlexOlmo dysponuje 37 miliardami parametrów, z czego 20 miliardów jest aktywnych. Zespół badawczy ocenił jego wydajność, wykorzystując mieszankę danych publicznych oraz siedmiu specjalistycznych zbiorów danych, obejmujących wiadomości, teksty kreatywne, kod programistyczny, artykuły naukowe, treści edukacyjne, matematykę oraz dane z Reddita. Testy przeprowadzone na 31 zadaniach wykazały średni wzrost wydajności o 41% w porównaniu do modelu szkolonego wyłącznie na danych publicznych. Co warte podkreślenia, FlexOlmo osiągnął lepsze wyniki niż hipotetyczny model, który miał dostęp do wszystkich danych przy tym samym nakładzie obliczeniowym. Jedynie model trenowany na całym zbiorze danych, lecz z dwukrotnie większymi zasobami, nieznacznie przewyższał FlexOlmo.

Kwestia bezpieczeństwa i prywatności danych jest priorytetem w przypadku FlexOlmo. Ponieważ właściciele danych udostępniają jedynie wytrenowane wagi modeli, ryzyko wycieku danych jest minimalne. Testy wykazały, że ataki służące do odzyskania danych treningowych powiodły się jedynie w 0,7% przypadków. Dla organizacji dysponujących szczególnie wrażliwymi danymi FlexOlmo oferuje również wsparcie dla treningu z różnicową prywatnością, co zapewnia formalne gwarancje prywatności. Każdy uczestnik może niezależnie aktywować tę opcję.

Dodatkowym narzędziem, które zwiększa transparentność i kontrolę, jest OLMoTrace, również opracowane przez Instytut Allena. Umożliwia ono śledzenie danych wyjściowych modelu językowego z powrotem do ich źródeł treningowych, co stanowi istotne usprawnienie w zakresie odpowiedzialności i audytowalności modeli AI. FlexOlmo to znaczący krok naprzód w obszarze kolaboracyjnego tworzenia modeli językowych, oferując solidne podstawy dla rozwoju AI w środowiskach, gdzie prywatność i bezpieczeństwo danych są fundamentalne.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *