Un Algoritm Mai Bun pentru Prognozarea Comportamentului Culelor

0
(0)

Într-un preprint publicat pe arXiv, cercetătorii de la Altos Labs au descris un algoritm de învățare automată care realizează predicții de la cap la coadă privind modul în care va răspunde expresia genelor celulelor la intervenții.

Simularea proceselor biologice pe un computer este o sarcină incredibil de dificilă. În timp ce algoritmi avansati precum AlphaFold de la Google au revoluționat plierea proteinelor, biochimia completă a unei celule este de ordinul zecilor de mii mai complexă.

Un mod de a ocoli aceasta problemă este pur și simplu să folosim celule vii. Tehnicile moderne de secvențiere ARN fac relativ simplu testarea efectelor perturbațiilor genetice și a intervențiilor cu molecule mici. Cu toate acestea, chiar și cu această tehnologie, există încă un spațiu de posibilități enorm, diferite tipuri de celule răspund diferit, iar schimbarea modului în care o celulă se comportă necesită adesea mai multe perturbații simultane.

Algoritmii de învățare automată sunt, prin urmare, meniți să prezică ce fel de perturbații ar putea fi valoroase pentru domeniu în silico, după care aceste predicții pot fi testate in vitro înainte ca aceste cercetări să poată continua către animale și oameni. Ultimele cercetări au arătat că algoritmii mai simpli sunt în mare parte mai utili în aplicațiile ample și că eliminarea constrângerilor suplimentare îmbunătățește capacitatea acestor modele de a generaliza.

În acest sens, cercetătorii au creat PRiMeFlow, un algoritm care lucrează direct în spațiul de expresie genetică în loc să comprime informațiile în spații de dimensiune inferioară, cum făceau algoritmii anteriori. Acest algoritm folosește probabilitățile învățate pentru a transforma informația cunoscută în configurații anterior necunoscute.

Autorii observă că arhitectura lor de alegere, un U-net, este în mod normal considerată suboptimală pentru sarcina în cauză; ordonarea expresiei genelor este arbitrară, iar un U-net este orientat către sarcini orientate spațial care implică măsurarea relației între punctele de date din apropiere. Un perceptron cu mai multe straturi (MLP) ar fi în mod normal considerat opțiunea mai bună, dar eliminarea datelor de flux U-net într-un MLP a deteriorat doar predicțiile modelului lor. Ei recunosc că nu știu de ce este acest lucru, și sugerează o investigație care să implice mecanisme de atenție încrucișată care ar putea să agregheze mai bine informațiile fără biasuri spațiale.

În cea mai bună configurație, PRiMeFlow a obținut performanțe de top în trei benchmark-uri cheie care fac parte din platforma PerturBench. Două dintre aceste benchmark-uri reprezintă transferul de covariate: capacitatea modelului de a prezice impactul perturbațiilor în condiții diferite, cum ar fi tipurile de celule care nu au fost incluse în datele de antrenament. La al treilea, care măsoară predicțiile combinate, a depășit multe alte modele în toate metricile, cu excepția uneia.

În fața unui set de testare privat de celule stem embrionare umane, PRiMeFlow a obținut rezultate excepționale, iar aceste performanțe au fost consolidate prin ajustări suplimentare. Cel mai bun model PRiMeFlow ajustat fin s-a dovedit a fi cel mai apropiat de rezultatele in vitro printre toate modelele.

Sursa informatiei: https://www.lifespan.io

Cat de utila a fost aceasta pagina?

Click pe o steluta sa votezi

Vot mediu 0 / 5. Numar de voturi: 0

Nu sunt voturi pana acum. Fii primul care voteaza.

Ne pare rau ca nu ti-a fost util acest articol

Ajuta-ne sa ne imbunatatim

Cum putem sa ne imbunatatim?

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *