3DMedycyna i zdrowieR & D

SYNCOGEN: Nowe horyzonty w projektowaniu leków dzięki syntezowalnym cząsteczkom 3D generowanym przez AI

Współczesne odkrywanie leków i materiałów w dużej mierze opiera się na generatywnych modelach sztucznej inteligencji zdolnych do eksploracji ogromnych przestrzeni chemicznych. Jednakże, wiele obiecujących cząsteczek generowanych przez AI napotyka na bariery praktyczne – ich synteza w laboratorium jest trudna lub wręcz niemożliwa. To ograniczenie znacząco spowalnia postęp, gdyż nawet najbardziej innowacyjne struktury pozostają jedynie teoretycznymi koncepcjami.

Tradycyjne metody, choć często bazują na szablonach syntezy, skupiają się przeważnie na dwuwymiarowych reprezentacjach molekuł, ignorując kluczowe informacje o ich trójwymiarowej strukturze. To właśnie geometria cząsteczki decyduje o jej interakcjach z układami biologicznymi i ostatecznej aktywności. Ostatnie postępy w modelowaniu 3D pozwoliły na bezpośrednie generowanie współrzędnych atomowych, co otwiera drogę do projektowania opartego na kształcie i precyzyjniejszego przewidywania właściwości.

SYNCOGEN: Most między teorią a praktyką

Luka między teoretycznym potencjałem AI a praktycznymi realiami syntezy zostaje wypełniona przez SYNCOGEN (Synthesizable Co-Generation) – innowacyjny framework opracowany przez badaczy z Uniwersytetu w Toronto, Uniwersytetu Cambridge, Uniwersytetu McGilla i innych instytucji. SYNCOGEN to pionierskie rozwiązanie, które jednocześnie modeluje ścieżki reakcji chemicznych oraz współrzędne atomowe podczas generowania cząsteczek. Dzięki temu każda proponowana molekuła jest nie tylko fizycznie sensowna, ale ma też opracowaną praktyczną drogę syntezy.

Kluczowe innowacje

Model SYNCOGEN wyróżnia się podejściem multimodalnym, łącząc dyfuzję maskowanych grafów (dla grafów reakcji) z dopasowaniem przepływu (dla współrzędnych atomowych). Pozwala to na próbkowanie ze wspólnego rozkładu bloków budulcowych, reakcji chemicznych i struktur 3D. Każda molekuła jest reprezentowana kompleksowo jako trójka (X, E, C), gdzie X to tożsamość bloku budulcowego, E to typy reakcji i centra połączeń, a C zawiera wszystkie współrzędne atomowe.

Istotnym aspektem jest równoczesne trenowanie obu modalności – graficznej i współrzędnościowej. Zastosowano funkcje strat łączące entropię krzyżową dla grafów, maskowany średni błąd kwadratowy dla współrzędnych oraz kary za odległości par, co zapewnia realizm geometryczny generowanych struktur.

SYNSPACE: Fundament dla syntezowalnych molekuł

Aby przeszkolić SYNCOGEN, badacze stworzyli unikatowy zbiór danych SYNSPACE. Składa się on z ponad 600 000 cząsteczek, które są weryfikowalnie syntezowalne. Każda z nich została zbudowana z 93 komercyjnych bloków budulcowych i 19 sprawdzonych szablonów reakcji. Co więcej, każda cząsteczka w SYNSPACE jest opatrzona wieloma zoptymalizowanymi energetycznie konformacjami 3D (łącznie ponad 3.3 miliona struktur), co dostarcza niezwykle bogate i wiarygodne źródło danych, odzwierciedlające realia syntezy chemicznej.

Proces tworzenia SYNSPACE polegał na systematycznym budowaniu cząsteczek poprzez iteracyjne łączenie, zaczynając od początkowego bloku i wybierając kompatybilne centra reakcji. Dla każdego wynikowego grafu molekularnego generowano i optymalizowano wiele konformerów o niskiej energii za pomocą metod chemii obliczeniowej, co gwarantuje zarówno chemiczną wiarygodność, jak i stabilność energetyczną każdej struktury.

Wydajność i praktyczne zastosowania

SYNCOGEN osiąga światowej klasy wyniki w zadaniach nieuwarunkowanego generowania molekuł 3D, przewyższając wiodące ramy generatywne oparte na wszystkich atomach i grafach. Ponad 96% generowanych cząsteczek okazuje się chemicznie ważnych. Co kluczowe, oprogramowanie do retrosyntezy (AiZynthFinder, Syntheseus) wskazuje na syntezowalność w高达 72% przypadków, znacznie przewyższając konkurencyjne metody. Generowane konformery precyzyjnie odwzorowują długości wiązań, kąty i rozkłady dwuścienne danych eksperymentalnych.

Zdolność SYNCOGEN do generowania ścieżek syntezy równocześnie ze współrzędnymi 3D stanowi unikalny most między chemią obliczeniową a syntezą eksperymentalną. Model ten wykazuje również konkurencyjne wyniki w wypełnianiu luk molekularnych, kluczowym zadaniu w projektowaniu leków, umożliwiając generowanie łatwo syntezowalnych analogów złożonych leków.

Przyszłe kierunki i perspektywy

SYNCOGEN to fundamentalny krok naprzód w dziedzinie generacji molekuł z uwzględnieniem możliwości ich syntezy. Potencjalne rozszerzenia obejmują: generowanie warunkowane właściwościami (np. optymalizacja dla pożądanych cech fizykochemicznych lub biologicznych), warunkowanie względem kieszeni białkowych (tworzenie ligandów dostosowanych do konkretnych miejsc wiążących), rozszerzenie przestrzeni reakcji (dywersyfikacja bloków budulcowych i szablonów reakcji) oraz integrację z robotyką laboratoryjną dla automatyzacji procesu odkrywania leków i materiałów.

SYNCOGEN ustanawia nowy punkt odniesienia dla generacji molekuł zintegrowanej z ich syntezowalnością, umożliwiając naukowcom i farmaceutom projektowanie cząsteczek, które są zarówno strukturalnie znaczące, jak i wykonalne eksperymentalnie. Przez połączenie modeli generatywnych ze ścisłymi ograniczeniami syntetycznymi, SYNCOGEN znacząco przybliża projektowanie obliczeniowe do realizacji laboratoryjnej, otwierając nowe możliwości w odkrywaniu leków, materiałoznawstwie i poza nimi.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *