Combinarea asistenței de la CURAtor cu inteligența artificială (AI-CURA) și cele mai recente modele de limbaj extinse (LLMs) ar putea simplifica diagnosticul bolilor genetice rare.
Sistemul de lucru, descris în revista Science Translational Medicine, s-a comportat la fel de bine ca experții clinici în clasificarea a 150 de variante, respectând reguli complexe ale experților.
De asemenea, a fost capabil să categorizeze 150 de variante cu clasificări conflictuale.
„Acest studiu împinge limitele interpretării automate a variantelor,” a comentat editorul șef Catherine Charneski, PhD, de la Universitatea din Bath.
Secvențierea întregului genom (WGS) s-a dovedit crucială în încheierea odiseei diagnostice prelungite a multor pacienți cu tulburări genetice rare.
Pentru a gestiona numărul uriaș de variații identificate prin WGS, au fost făcute încercări de asociații de experți și grupuri de lucru pentru a stabili ghiduri și recomandări.
Acestea formează acum un sistem de clasificare larg adoptat care categorizează dovezi asociate variantelor în categorii distincte bazate pe reguli.
Dar, în timp ce unele reguli pot fi automatizate ușor, majoritatea dovezilor necesită încă interpretare manuală a literaturii. Acest lucru necesită ca persoanele care se ocupă de variante să dețină cunoștințe vaste în diferite aspecte ale biologiei moleculare și geneticii, precum și o înțelegere profundă a recomandărilor experților pentru a interpreta și evalua precis variantele.
Wei Ma, PhD, și colegii săi de la Proiectul Genomului Hong Kong (HKGP) au dezvoltat, așadar, AI-CURA, un cadru complet automatizat pentru clasificarea variantelor care integrează LLMs pentru a gestiona atât dovezi independente de literatură, cât și cele dependente de literatură.
Instrumentul integrează evaluarea dovezilor pentru criterii bazate pe non-literatură, care pot fi automatizate folosind instrumente standard de bioinformatică, cu o evaluare separată, susținută de LLMs, a dovezilor bazate pe literatură.
Două LLM-uri de ultimă generație – DeepSeek-R1 și o3-mini-high – au fost testate pentru abilitatea lor de a rezuma dovezi derivate din literatură relevante pentru clasificarea variantelor.
Echipa a constatat că DeepSeek-R1, sursă deschisă, a depășit o3-mini-high și a avut o sensibilitate ridicată și o specificitate de 100% în interpretarea regulilor de la Colegiul American de Genomică Medicală și Genomică (ACMG) care necesită înțelegerea dovezilor bazate pe literatură.
Apoi, a fost testat folosind 150 de variante curate de experți ClinGen, cu 150 de variante curate de experți și 150 de variante cu clasificări conflictuale din Resursa Genomului Clinic.
LLM-ul cu sursă deschisă DeepSeek-R1 a prezentat o concordanță ridicată cu experții ClinGen în stabilirea unui diagnostic final.
„În acest studiu, DeepSeek-R1 a demonstrat o precizie ridicată (89,3 până la 100%) în determinarea aplicării a șapte reguli ACMG bazate pe literatură,” au raportat autorii.
Ei au adăugat: „Folosirea noastră a LLM-urilor a simplificat semnificativ procesul de analiză și interpretare a variantelor. LLM-urile pot finaliza rezumatul literaturii…
Sursa articol https://insideprecisionmedicine.com

Senior Editor RevistaSanatatii.ro. Pasionat de lifespan, fan David Sinclair.











