Les prediccions de l'estructura 3D de les proteïnes realitzades per una intel·ligència artificial poden revolucionar la investigació del càncer i el descobriment de fàrmacs
Un grup d'investigadors entre els quals hi ha el Dr. Eduard Porta, líder del Grup d'Immunogenòmica del Càncer de l'Institut de Recerca contra la Leucèmia Josep Carreras, acaba de publicar els resultats de la seva investigació sobre com aprofitar els resultats d'AlphaFold2 al món real. Aquest algorisme, basat en la intel·ligència artificial Deep Mind desenvolupada per Google, permet predir l'estructura 3D de proteïnes basant-se simplement en informació genòmica.
En un ésser viu, les proteïnes ho constitueixen pràcticament tot: des de les màquines moleculars que executen el metabolisme de cada cèl·lula, fins a la punta dels teus cabells. Codificades a l'ADN, una proteïna es pot representar com un fil de centenars de molècules individuals anomenades aminoàcids, unides entre si. Depenent de la seva combinació particular d'aminoàcids, una proteïna es plega d'una forma o una altra, donant com a resultat una estructura 3D funcional. La forma fa la funció i, amb 20 aminoàcids diferents disponibles, les combinacions possibles són incontables.
Les tecnologies genòmiques actuals fan que sigui molt fàcil conèixer la seqüència d'aminoàcids d'una proteïna, però conèixer-ne la forma 3D exigeix procediments experimentals costosos i lents, que no sempre tenen èxit. Durant dècades, els investigadors han intentat comprendre què fa que una proteïna es plegui en una forma particular, per poder predir-ho a partir de la seva seqüència d'aminoàcids.
AlphaFold2 és una xarxa neuronal desenvolupada per Deep Mind, una empresa d'intel·ligència artificial propietat de Google, entrenada específicament per resoldre l'estructura 3D de les proteïnes precisament a partir de la seqüència d'aminoàcids. La seva precisió va impressionar la comunitat científica fa alguns anys després de les seves victòries al concurs internacional anual sobre modelatge d'estructures de proteïnes CASP, quan el seu equip va presentar el proteoma complet per a 11 espècies diferents, inclosos els humans.
Per posar en context totes les dades publicades de cop per AlphaFold2 (més de 300 mil models i creixent), una comunitat d'investigadors independents, entre els quals hi ha el Dr. Eduard Porta, cap del grup d'Immunogenòmica del Càncer a l'Institut de Recerca contra la Leucèmia Josep Carreras, va comparar les noves estructures predites amb les prèviament disponibles i va concloure que AlphaFold2 va contribuir amb un 25% addicional d'estructures proteiques d'alta qualitat per a les espècies analitzades. El treball ha estat publicat recentment a la prestigiosa revista Nature Structural Biology.
És conegut el paper clau que tenen moltes proteïnes en moltes malalties, com ara el càncer, però el desconeixement del seu funcionament a nivell molecular impedeix desenvolupar estratègies específiques contra elles. La informació estructural d'aquestes proteïnes ajudarà els científics a comprendre-les molt millor, saber amb quines altres molècules poden interaccionar dins la cèl·lula i dissenyar nous fàrmacs capaços d'interferir amb la seva funció quan s'alteren.
Hi ha limitacions, és clar, en les capacitats d'AlphaFold2. L'equip científic va descobrir que l'algorisme té problemes en intentar recrear complexos de proteïnes. Això és un problema ja que la majoria de proteïnes treballen juntament amb d’altres per a realitzar una funció biològica concreta, per la qual cosa seria molt desitjable predir com les diferents proteïnes podrien unir-se entre si. Una altra limitació identificada és la seva incapacitat per mostrar l'estructura de proteïnes mutades, amb aminoàcids alterats a la seqüència. Les mutacions sovint donen com a resultat una funció anormal de les proteïnes i són la causa de moltes malalties, com el càncer.
Tot i les seves limitacions, però, l'equip reconeix la destacada contribució d'AlphaFold2 a la biologia estructural i computacional, que tindrà un gran impacte en la recerca bàsica i biomèdica en els propers anys. No només per la seva aportació directa (milers de nous models proteics 3D molt fiables), sinó també per iniciar una nova era d'eines computacionals basades en intel·ligència artificial, capaces de donar resultats que encara ningú no pot anticipar.
De fet, aquesta era ja ha començat i, recentment, un equip de Meta (anteriorment Facebook) ha utilitzat una versió modificada del seu predictor de llenguatge natural per “autocompletar” proteïnes. Aquesta eina d'intel·ligència artificial, anomenada ESMFold, sembla menys precisa en comparació amb la seva contrapart de Google, però és 60 vegades més ràpida i pot superar algunes de les limitacions identificades d'AlphaFold2, com el processament de seqüències mutades.
En conclusió, tal i com admeten els autors de la publicació, “l'aplicació d'AlphaFold2 [i de les properes eines basades en intel·ligència artificial] tindrà un impacte transformador en les ciències de la vida”.
Article de referència:
Akdel, M., Pires, D.E.V., Pardo, E.P. et al. A structural biology community assessment of AlphaFold2 applications. Nat Struct Mol Biol (2022). https://doi.org/10.1038/s41594-022-00849-w