Naukowcy z Illinois tworzą s3: nowe podejście do systemów Retrieval-Augmented Generation
Naukowcy z Uniwersytetu Illinois Urbana-Champaign ogłosili niedawno premierę s3, otwarto źródłowego rozwiązania, które ma na celu optymalizację procesu tworzenia systemów Retrieval-Augmented Generation (RAG). To nowatorskie rozwiązanie ma usprawnić rozwijanie aplikacji opartych na dużych modelach językowych, poprzez uproszczenie i redukcję kosztów tworzenia modeli wyszukiwawczych w architekturach RAG.
Zasada działania systemów RAG opiera się na jakości ich komponentu wyszukiwawczego. W swojej publikacji, naukowcy przedstawili ewolucję podejść stosowanych w RAG, dzieląc je na trzy fazy. Pierwsza z nich – tradycyjne systemy RAG – korzystała z metod statycznych, gdzie jakość wyszukiwania była niepowiązana bezpośrednio z efektywnością generacji. Kolejna faza, Pre-RL-Zero, wprowadziła aktywniejsze zaangażowanie modeli językowych podczas wnioskowania, ale brakowało w niej komponentów umożliwiających trening systemów wyszukiwawczych za pomocą sygnałów wynikowych.
Najnowsza faza, RL-Zero, to wykorzystanie uczenia przez wzmocnienie (RL) do trenowania modeli jako agentów wyszukiwania, które ulepszają się dzięki informacji zwrotnej związanej z poprawnością odpowiedzi. Mimo postępów te podejścia miały swoje ograniczenia, związane z kosztownym i czasochłonnym dostrajaniem modeli językowych oraz nieoptymalnym wykorzystaniem narzędzi wyszukiwawczych.
Framework s3 proponuje nowe podejście poprzez modułową strukturę, która oddziela proces wyszukiwania od generowania treści, co pozwala na niezależną optymalizację ich jakości. Centralnym elementem innowacji jest sygnał nagrody, Gain Beyond RAG (GBR), który mierzy poprawę dokładności odpowiedzi generowanej na podstawie dokumentów, w porównaniu do bazowego modelu wyszukującego. To podejście motywuje do wyszukiwania dokumentów, które realnie poprawiają jakość generowanego tekstu.
„s3 odseparowuje wyszukiwarkę od generatora, co umożliwia włączenie dowolnego, dostępnego na rynku lub własnego modelu – takiego jak GPT-4, Claude czy model wewnętrzny – bez potrzeby jego dostrajania” – wyjaśnia Patrick Jiang, główny autor badania. Modułowość tego rozwiązania ma szczególne znaczenie dla firm, które muszą przestrzegać regulacji dotyczących modyfikacji modeli.
Testy wykazały, że s3 przewyższa inne systemy RAG w sześciu benchmarkach związanych z pytaniami ogólnej wiedzy. Zapotrzebowanie na dane w przypadku s3 jest minimalne, co czyni go atrakcyjnym dla przedsiębiorstw nieposiadających dużych, oznaczonych zbiorów danych do trenowania.
Ułomność systemów RAG wynikała z optymalizacji, która nie przynosiła odpowiednich rezultatów w zakresie uzyskanej treści, a s3 wykazał się zdolnością do utrzymania wysokiej jakości w różnych dziedzinach, co dowodzi jego elastyczności i przydatności w specjalistycznych zastosowaniach branżowych.
