Un nou AI pentru modelarea codului genetic
În colaborare cu Nvidia, echipe de cercetători de la Universitatea Stanford, UC Berkeley și UC San Francisco au dezvoltat Evo 2, cel mai mare model AI dedicat biologiei. Acesta a fost antrenat pe ADN-ul a peste 100.000 de specii din întregul arbore al vieții, având capacitatea de a identifica modele în secvențele genetice, ceea ce ar putea dura ani de zile pentru cercetători să descopere.
Evo 2 se distinge prin abilitatea de a detecta cu precizie mutațiile cauzatoare de boli în genele umane și de a proiecta noi genomuri inspirate din genomurile bacteriilor simple. Modelul poate procesa simultan secvențe genetice de până la 1 milion de nucleotide, facilitând înțelegerea relațiilor dintre părți îndepărtate ale aceluiași genom.
Construit pe baza predecesorului său, Evo 1, care a fost antrenat doar pe genomuri unicelulare, Evo 2 este un model impresionant, antrenat cu peste 9,3 trilioane de nucleotide și 128.000 de genomuri complete. Acesta a fost dezvoltat pe platforma NVIDIA DGX Cloud AI, utilizând o putere de calcul considerabilă, cu peste 2.000 de plăci video NVIDIA H100.
Codul sursă al Evo 2 a fost publicat pe contul de GitHub al institutului, oferind oportunitatea de a fi utilizat și în alte domenii pentru a accelera cercetarea științifică.