Medycyna i zdrowie

Stanford przedstawia SleepFM Clinical: AI do przewidywania chorób na podstawie jednej nocy snu

Zespół badawczy ze Stanford Medicine zaprezentował SleepFM Clinical — multimodalny model sztucznej inteligencji, zdolny do analizy zapisu cyklu snu i na tej podstawie przewidywania ryzyka rozwoju ponad 130 chorób w długiej perspektywie. Osiągnięcie to, opublikowane w prestiżowym czasopiśmie Nature Medicine, stanowi znaczący krok w kierunku wczesnej diagnostyki i spersonalizowanej medycyny. Ponadto, twórcy udostępnili kod źródłowy projektu na platformie GitHub, w ramach licencji MIT, co umożliwia jego dalszy rozwój i implementację w praktyce klinicznej.

Od polisomnografii do kompleksowej reprezentacji fizjologicznej

Polisomnografia (PSG) to złoty standard w medycynie snu, oferujący szczegółowy wgląd w aktywność mózgu, ruchy gałek ocznych, sygnały serca, napięcie mięśniowe, wysiłek oddechowy oraz saturację tlenu podczas całonocnego badania. Tradycyjnie, dane z PSG wykorzystuje się głównie do oceny stadiów snu i diagnozy bezdechu sennego. Jednakże, naukowcy ze Stanford podeszli do tych wielokanałowych sygnałów jako do gęstej, fizjologicznej serii czasowej. Trenując model fundamentalny, nauczyli go tworzyć ujednoliconą reprezentację wszystkich modalności danych, znacznie poszerzając ich potencjał diagnostyczny.

Model SleepFM został wytrenowany na imponującej liczbie około 585 000 godzin nagrań snu, pochodzących od około 65 000 osób z wielu kohort. Największa część danych, blisko 35 000 badań, pochodzi z Stanford Sleep Medicine Center, obejmując dorosłych i dzieci badanych w latach 1999-2024. Kohorta ta jest powiązana z elektroniczną dokumentacją medyczną, co umożliwiło analizę przeżycia oraz ryzyka wystąpienia setek kategorii chorób.

Architektura modelu i cel przedtreningowy

W warstwie modelowania, SleepFM wykorzystuje konwolucyjną architekturę (convolutional backbone) do ekstrakcji lokalnych cech z każdego kanału sygnału, uzupełnioną przez agregację opartą na mechanizmach uwagi (attention-based aggregation) między kanałami oraz temporalny transformator przetwarzający krótkie segmenty nocy. Taka konstrukcja, znana z wcześniejszych prac nad SleepFM w kontekście klasyfikacji stadiów snu i wykrywania zaburzeń oddychania podczas snu, dowiodła swojej skuteczności w poprawie wydajności zadań szczegółowych poprzez uczenie się wspólnych osadzeń (joint embeddings) sygnałów mózgu, elektrokardiograficznych i oddechowych.

Cel przedtreningowy opierał się na kontrastowym uczeniu się z pominięciem jednego elementu (leave-one-out contrastive learning). Dla każdego krótkiego segmentu czasu, model tworzy odrębne osadzenia dla każdej grupy modalności (np. sygnały mózgowe, sercowe, oddechowe), a następnie uczy się je wyrównywać, tak aby dowolny podzbiór mógł przewidzieć wspólną reprezentację pozostałych modalności. Takie podejście zapewnia odporność modelu na brakujące kanały i heterogeniczne układy rejestracyjne, co jest powszechne w rzeczywistych laboratoriach snu.

Po etapie przedtreningu na nieoznaczonych danych PSG, główna architektura jest „zamrażana”, a następnie trenowane są małe, specyficzne dla zadań warstwy (task-specific heads). Dla standardowych zadań związanych ze snem, lekka warstwa rekurencyjna lub liniowa mapuje osadzenia na stadia snu lub etykiety bezdechu. W kontekście przewidywania ryzyka chorób klinicznych, model agreguje dane z całej nocy w jedno osadzenie na poziomie pacjenta, łączy je z podstawowymi danymi demograficznymi (takimi jak wiek i płeć), a następnie przekazuje tę reprezentację do warstwy proporcjonalnego modelu regresji Coxa, służącej do modelowania czasu do zdarzenia.

Prognoza 130 chorób i śmiertelności z jednej nocy snu

Kluczowym osiągnięciem pracy badawczej Stanford jest zdolność do przewidywania chorób. Zespół badawczy, mapując kody diagnoz z elektronicznej dokumentacji medycznej do tzw. fenotypów (phecodes), zidentyfikował ponad 1000 potencjalnych grup chorobowych. Dla każdego fenotypu obliczono czas do pierwszej diagnozy po badaniu snu i dopasowano model Coxa na podstawie osadzeń ze SleepFM.

SleepFM zidentyfikował 130 wyników chorobowych, których ryzyko można przewidzieć z wysoką dokładnością na podstawie jednej nocy polisomnografii. Obejmują one, między innymi, śmiertelność z dowolnej przyczyny, demencję, zawał mięśnia sercowego, niewydolność serca, przewlekłą chorobę nerek, udar, migotanie przedsionków, kilka rodzajów nowotworów oraz liczne zaburzenia psychiatryczne i metaboliczne. Dla wielu z tych schorzeń, metryki wydajności, takie jak wskaźnik zgodności (concordance index) i pole pod krzywą ROC (AUROC), są porównywalne z ustalonymi wskaźnikami ryzyka, mimo że model wykorzystuje jedynie nagrania snu i podstawowe dane demograficzne.

Raport wskazuje również, że dla niektórych nowotworów, powikłań ciążowych, chorób układu krążenia i zaburzeń psychicznych, prognozy oparte na SleepFM osiągają około 80-procentową dokładność dla wieloletnich okien ryzyka. Sugeruje to, że subtelne wzorce w koordynacji sygnałów mózgu, serca i oddechu niosą informacje o utajonych procesach chorobowych, które nie są jeszcze widoczne klinicznie.

Wartość dodana w porównaniu z prostszymi metodami

Aby ocenić wartość dodaną SleepFM, zespół badawczy porównał swoje modele ryzyka z dwoma bazowymi. Pierwszy z nich wykorzystywał jedynie cechy demograficzne, takie jak wiek, płeć i wskaźnik masy ciała (BMI). Drugi trenował model „end-to-end” bezpośrednio na danych polisomnograficznych i wynikach, bez etapu niekontrolowanego przedtreningu. Okazało się, że w większości kategorii chorób, wstępnie wytrenowana reprezentacja SleepFM, połączona z prostym modelem przeżycia, dawała wyższą zgodność i lepszą wartość AUROC dla długoterminowych prognoz niż oba modele bazowe.

Badanie to jasno dowodzi, że uzyskane korzyści wynikają w mniejszym stopniu ze złożoności warstwy przewidującej, a w większym z modelu fundamentalnego, który nauczył się ogólnej reprezentacji fizjologii snu. W praktyce oznacza to, że placówki kliniczne mogą ponownie wykorzystywać jedną wstępnie wytrenowaną architekturę, uczyć małe, specyficzne dla placówki warstwy z relatywnie skromnymi kohortami danych, a mimo to osiągać wyniki porównywalne z najnowszymi osiągnięciami w dziedzinie.