R & D

AlphaGenome DeepMind analizuje zagadkowe regiony DNA

Zrozumienie ludzkiego genomu to jedno z największych wyzwań współczesnej nauki. Chociaż sekwencja DNA jest znana od lat, interpretacja jej funkcji, szczególnie w obszarach niekodujących, pozostawała w dużej mierze zagadką. DeepMind, powszechnie uznawane za pioniera w dziedzinie sztucznej inteligencji, przedstawiło właśnie AlphaGenome – model AI zaprojektowany, by rozwikłać tę złożoną sieć zależności.

Przełom w interpretacji niekodującego DNA

Większość ludzkiego DNA, bo aż około 98 procent, to regiony niekodujące. Przez lata uważano je za „śmieciowe DNA”, pozbawione funkcji. Obecnie wiemy, że pełnią one kluczową rolę w regulacji ekspresji genów, decydując o tym, kiedy i jak geny są aktywowane lub dezaktywowane. To właśnie w tych obszarach kryje się wiele wariantów genetycznych związanych z chorobami.

AlphaGenome potrafi analizować do miliona zasad DNA jednocześnie, skupiając się właśnie na tych niekodujących segmentach. Model przewiduje szeroki zakres właściwości molekularnych dla każdej pozycji w sekwencji DNA – od lokalizacji początków i końców genów, poprzez ilość produkowanego RNA, aż po miejsca wiązania białek. Co istotne, identyfikuje również miejsca splicingu, czyli punkty, w których RNA jest cięte i ponownie łączone podczas ekspresji genów. Błędy w tym procesie bywają przyczyną poważnych schorzeń.

Technologia stojąca za AlphaGenome

DeepMind osiągnęło tę precyzję, łącząc kilka zaawansowanych technik AI. Model wykorzystuje warstwy splotowe do wykrywania krótkich wzorców DNA oraz transformery do zarządzania zależnościami długodystansowymi. Całość jest integrowana przez dodatkowe warstwy, generując precyzyjne prognozy z rozdzielczością pojedynczej zasady, obejmującą setki typów komórek i tkanek.

Według DeepMind, AlphaGenome deklasuje większość istniejących modeli w 22 z 24 testowanych benchmarków i wyprzedza narzędzia specjalistyczne do przewidywania efektów regulacyjnych wariantów genetycznych w 24 z 26 przypadków. Jest to również jedyny model zdolny do jednoczesnego przewidywania wszystkich testowanych właściwości molekularnych. Dane treningowe pochodzą z renomowanych publicznych projektów badawczych, takich jak ENCODE, GTEx czy FANTOM5.

Potencjalne zastosowania i ograniczenia

Jedną z kluczowych cech AlphaGenome jest jego efektywność w ocenie wariantów genetycznych. Model porównuje prognozy dla zmutowanych i niezmutowanych sekwencji, podsumowując różnice dla każdej właściwości. Może również wskazywać miejsca splicingu bezpośrednio z DNA, co otwiera nowe możliwości w badaniach nad chorobami genetycznymi. Przykładem jest analiza mutacji obserwowanej w ostrej białaczce limfoblastycznej komórek T (T-ALL), gdzie model poprawnie przewidział utworzenie nowego miejsca wiązania dla białka MYB, aktywującego pobliski gen rakowy – znany mechanizm chorobowy.

Poza badaniami chorób, AlphaGenome może znaleźć zastosowanie w biologii syntetycznej, np. przy projektowaniu sekwencji DNA do ukierunkowanej regulacji genów. Umożliwi również identyfikację funkcjonalnych elementów genomu kontrolujących specyficzne typy komórek.

Niemniej jednak, DeepMind podkreśla, że AlphaGenome nie jest obecnie narzędziem klinicznym i nie zostało do tego celu walidowane. Model nie jest w stanie w pełni uchwycić złożonych procesów chorobowych kształtowanych przez rozwój czy środowisko, a jego zdolność do przewidywania efektów odległych elementów regulacyjnych (ponad 100 000 zasad DNA) jest wciąż ograniczona. Obecnie AlphaGenome jest dostępne wyłącznie do niekomercyjnych badań poprzez API.

Pomimo obecnych ograniczeń, DeepMind widzi duży potencjał rozwoju. Wraz z większą ilością danych treningowych, AlphaGenome może objąć dodatkowe gatunki, typy komórek czy procesy molekularne. Architektura systemu jest elastyczna i skalowalna, co sugeruje obiecującą przyszłość dla tego narzędzia w świecie genetyki molekularnej.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *