Medycyna i zdrowieR & D

Biomni-R0: Nowa era sztucznej inteligencji w służbie badań biomedycznych

Sztuczna inteligencja coraz śmielej wkracza w obszar badań biomedycznych, a zapotrzebowanie na narzędzia potrafiące analizować dane genomiczne, wspierać diagnostykę kliniczną i rozumieć biologię molekularną dynamicznie rośnie. Modele te mają za zadanie nie tylko wyszukiwać informacje, ale przede wszystkim prowadzić złożone rozumowania, interpretować dane pacjentów i wyciągać wnioski z ogromnych baz danych.

Jednakże, osiągnięcie poziomu eksperckiego w tej dziedzinie jest wyzwaniem. Wiele dostępnych modeli językowych nie radzi sobie z niuansami i głębią rozumowania biomedycznego – potrafią przetwarzać informacje na poziomie podstawowym, ale zawodzą przy bardziej skomplikowanych zadania wymagających rozumienia kontekstowego i specjalistycznej wiedzy.

Naukowcy ze Stanford University i UC Berkeley opracowali nową rodzinę modeli o nazwie Biomni-R0, która ma wypełnić tę lukę. Biomni-R0-8B i Biomni-R0-32B to modele, które zostały wytrenowane z wykorzystaniem uczenia ze wzmocnieniem (RL) w środowisku specjalnie dostosowanym do potrzeb rozumowania biomedycznego. Połączenie platformy Biomni ze Stanford z infrastrukturą SkyRL z UC Berkeley miało na celu stworzenie agenta AI dorównującego, a nawet przewyższającego możliwościami ludzkich ekspertów.

Strategia treningowa Biomni-R0

Proces treningowy składał się z dwóch etapów. Pierwszy etap to nadzorowane dostrajanie (SFT) na wysokiej jakości danych z Claude-4 Sonnet. Kolejnym krokiem było dostrajanie modeli za pomocą uczenia ze wzmocnieniem, optymalizując dwa rodzaje nagród: za poprawność (np. wybór właściwego genu lub diagnozy) oraz za formatowanie odpowiedzi (np. używanie znaczników <think> i <answer>). Aby zapewnić efektywność obliczeniową, zespół opracował asynchroniczne planowanie, które zminimalizowało opóźnienia. Rozszerzono również długość kontekstu do 64 tys. tokenów, co pozwoliło agentowi na efektywne zarządzanie długimi rozmowami.

Wyniki robią wrażenie

Wyniki są imponujące. Model Biomni-R0-32B osiągnął wynik 0.669, co stanowi znaczny wzrost w porównaniu z modelem bazowym (0.346). Nawet mniejsza wersja, Biomni-R0-8B, uzyskała wynik 0.588, przewyższając ogólne modele, takie jak Claude 4 Sonnet i GPT-5. W analizie poszczególnych zadań, Biomni-R0-32B wypadł najlepiej w 7 z 10 zadań, podczas gdy GPT-5 był liderem w 2, a Claude 4 tylko w 1. Szczególnie widoczne jest to w diagnostyce rzadkich chorób, gdzie Biomni-R0-32B osiągnął wynik 0.67, w porównaniu do 0.03 dla Qwen-32B.

Skalowalność i precyzja

Szkolenie dużych modeli biomedycznych wymaga zasobów. Aby sobie z tym poradzić, system oddzielił wykonywanie zadań od wnioskowania modelu, co pozwoliło na elastyczne skalowanie i redukcję czasu bezczynności GPU. Dłuższe sekwencje rozumowania również okazały się korzystne – modele trenowane za pomocą RL generowały dłuższe, bardziej spójne odpowiedzi, co korelowało z lepszymi wynikami.

Kluczowe wnioski z badań

  • Agenci biomedyczni muszą prowadzić dogłębne rozumowanie, a nie tylko wyszukiwać informacje.
  • Tradycyjne metody często zawodzą pod względem niezawodności i zdolności adaptacji.
  • Uczenie ze wzmocnieniem z nagrodami opartymi na wiedzy eksperckiej i ustrukturyzowanym formatowaniem danych wyjściowych okazało się bardzo skuteczne.
  • Biomni-R0-8B osiąga dobre wyniki przy mniejszej architekturze, a Biomni-R0-32B ustanawia nowe standardy, przewyższając Claude 4 i GPT-5 w 7 z 10 zadań.
  • Uczenie ze wzmocnieniem umożliwiło agentowi generowanie dłuższych, bardziej spójnych śladów rozumowania, co jest kluczową cechą zachowania ekspertów.

Praca ta stanowi podstawę dla rozwoju „super-eksperckich” agentów biomedycznych, zdolnych do automatyzacji złożonych procesów badawczych z dużą precyzją.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *