Nalazite se
Članak
Objavljeno: 09.04.2025. 13:34

MIT 

AI će otkriti nove revolucionarne lijekove

Nova metoda omogućuje korisnicima da jednostavnim jezikom traže novu molekulu s određenim svojstvima i dobiju detaljan opis kako je sintetizirati.

AI će otkriti nove revolucionarne lijekove

Proces otkrivanja molekula koje imaju svojstva potrebna za stvaranje novih lijekova i materijala težak je i skup, zahtijeva goleme računalne resurse i mjesece ljudskog rada kako bi se suzio ogroman prostor potencijalnih kandidata.

Veliki jezični modeli (LLM) poput ChatGPT-a mogli bi pojednostaviti ovaj proces, ali omogućavanje LLM-u da razumije i razmišlja o atomima i vezama koje tvore molekulu, na isti način na koji to čini s riječima koje tvore rečenice, predstavljalo je znanstveni kamen spoticanja.

Istraživači s MIT-a i MIT-IBM Watson AI Laba stvorili su obećavajući pristup koji proširuje LLM s drugim modelima strojnog učenja poznatim kao modeli temeljeni na grafovima, koji su posebno dizajnirani za generiranje i predviđanje molekularnih struktura.

Njihova metoda koristi osnovni LLM za tumačenje upita prirodnog jezika koji specificiraju željena molekularna svojstva. Automatski se prebacuje između osnovnog LLM-a i modula umjetne inteligencije koji se temelje na grafovima kako bi se dizajnirala molekula, objasnilo obrazloženje i generirao korak-po-korak plan za njezinu sintezu. Isprepliće tekst, grafikon i generiranje koraka sinteze, kombinirajući riječi, grafikone i reakcije u zajednički vokabular koji LLM može koristiti.

U usporedbi s postojećim pristupima koji se temelje na LLM-u, ova multimodalna tehnika generirala je molekule koje su bolje odgovarale korisničkim specifikacijama i vjerojatnije je da će imati valjani plan sinteze, poboljšavajući omjer uspjeha s 5 posto na 35 posto.

Također je nadmašila LLM-ove koji su više od 10 puta veći od njega i koji dizajniraju molekule i rute sinteze samo s tekstualnim prikazima, što sugerira da je multimodalnost ključ uspjeha novog sustava.

"Nadajmo se da bi ovo moglo biti end-to-end rješenje gdje bismo, od početka do kraja, automatizirali cijeli proces dizajniranja i izrade molekule. Kad bi vam LLM mogao dati odgovor u nekoliko sekundi, to bi bila velika ušteda vremena za farmaceutske tvrtke", kaže Michael Sun, diplomirani student MIT-a i koautor rada o ovoj tehnici .

Veliki jezični modeli nisu izgrađeni za razumijevanje nijansi kemije, što je jedan od razloga zašto se bore s inverznim molekularnim dizajnom, procesom identificiranja molekularnih struktura koje imaju određene funkcije ili svojstva.

LLM pretvaraju tekst u prikaze koji se nazivaju tokeni, koje koriste za sekvencijsko predviđanje sljedeće riječi u rečenici. Ali molekule su "strukture grafikona", sastavljene od atoma i veza bez posebnog reda, što ih čini teškim kodirati kao sekvencijalni tekst.

S druge strane, moćni modeli umjetne inteligencije temeljeni na grafovima predstavljaju atome i molekularne veze kao međusobno povezane čvorove i rubove u grafu. Iako su ovi modeli popularni za inverzni molekularni dizajn, zahtijevaju složene ulaze, ne razumiju prirodni jezik i daju rezultate koje je teško protumačiti.

Istraživači MIT-a kombinirali su LLM s modelima umjetne inteligencije temeljenim na grafikonima u jedinstveni okvir koji dobiva najbolje od oba svijeta.

Primjer1

Llamole, što je kratica za veliki jezični model za molekularno otkriće, koristi osnovni LLM kao vratara za razumijevanje korisničkog upita — zahtjev na jednostavnom jeziku za molekulu s određenim svojstvima.

Na primjer, možda korisnik traži molekulu koja može prodrijeti kroz krvno-moždanu barijeru i inhibirati HIV, s obzirom na to da ima molekularnu težinu od 209 i određene karakteristike veze.

Jedan modul koristi model difuzije grafa za generiranje molekularne strukture uvjetovane ulaznim zahtjevima. Drugi modul koristi neuronsku mrežu grafikona za kodiranje generirane molekularne strukture natrag u tokene koje LLM-ovi mogu konzumirati. Završni modul grafa je prediktor reakcije grafa koji kao ulaz uzima međumolekularnu strukturu i predviđa korak reakcije, tražeći točan skup koraka za izradu molekule od osnovnih građevnih blokova.

Istraživači su stvorili novu vrstu okidačkog tokena koji govori LLM-u kada treba aktivirati svaki modul. Kada LLM predvidi "dizajn" token okidača, prebacuje se na modul koji skicira molekularnu strukturu, a kada predvidi "retro" token okidača, prebacuje se na modul retrosintetičkog planiranja koji predviđa sljedeći korak reakcije.

"Ljepota ovoga je u tome što se sve što LLM generira prije aktiviranja određenog modula unosi u sam modul. Modul uči raditi na način koji je u skladu s onim što je bilo prije", kaže Sun.

Na isti način, izlaz svakog modula je kodiran i vraćen u proces generiranja LLM-a, tako da razumije što je svaki modul napravio i nastavit će predviđati tokene na temelju tih podataka.

Na kraju, Llamole ispisuje sliku molekularne strukture, tekstualni opis molekule i plan sinteze korak po korak koji daje pojedinosti o tome kako to napraviti, sve do pojedinačnih kemijskih reakcija.

U eksperimentima koji uključuju dizajniranje molekula koje odgovaraju korisničkim specifikacijama, Llamole je nadmašio 10 standardnih LLM-ova, četiri fino podešena LLM-a i najsuvremeniju metodu specifičnu za domenu. Istodobno je povećao stopu uspješnosti retrosintetičkog planiranja s 5 posto na 35 posto generiranjem molekula koje su više kvalitete, što znači da su imale jednostavnije strukture i jeftinije građevne blokove.

"Sami, LLM-i se bore dokučiti kako sintetizirati molekule jer to zahtijeva puno planiranja u više koraka. Naša metoda može generirati bolje molekularne strukture koje je također lakše sintetizirati", kaže Liu.

Kako bi trenirali i evaluirali Llamole, istraživači su ispočetka izradili dva skupa podataka jer postojeći skupovi podataka o molekularnim strukturama nisu sadržavali dovoljno detalja. Proširili su stotine tisuća patentiranih molekula opisima prirodnog jezika generiranim umjetnom inteligencijom i prilagođenim predlošcima opisa.

Skup podataka koji su napravili za fino podešavanje LLM-a uključuje predloške koji se odnose na 10 molekularnih svojstava, tako da je jedno ograničenje Llamolea to što je obučen za dizajn molekula uzimajući u obzir samo tih 10 numeričkih svojstava.

U budućem radu, istraživači žele generalizirati Llamole kako bi mogao uključiti bilo koje molekularno svojstvo. Osim toga, planiraju poboljšati module grafova kako bi povećali Llamoleovu stopu uspješnosti retrosinteze.

Dugoročno, nadaju se da će koristiti ovaj pristup kako bi otišli dalje od molekula, stvarajući multimodalne LLM-ove koji mogu rukovati drugim vrstama podataka temeljenih na grafikonima, kao što su međusobno povezani senzori u električnoj mreži ili transakcije na financijskom tržištu.

Čitav znanstveni rad možete pronaći na ovoj poveznici.

Vezani sadržaji
Komentari

Učitavam komentare ...

Učitavam