En 1970, el biólogo británico John Maynard Smith ideó un sencillo juego de palabras que describe uno de los problemas más complejos que existen. La evolución de las proteínas, las máquinas moleculares que realizan todas las funciones de la vida, sería comparable a la distancia entre dos palabras de cuatro letras, cambiando una sola letra cada vez. Por ejemplo: para llegar de mito a rayo en el mínimo número de pasos, se pasa por rito y rato; dejando de lado palabros como raho, que serían desechados por la mejora evolutiva.
De esta forma, todas las proteínas de interés estarían conectadas a mayor o menor distancia en un espacio continuo. El alfabeto tiene 27 letras, y las proteínas, 20 unidades básicas, los aminoácidos. En 2010, la ingeniera estadounidense Frances Arnold se dio cuenta de que aquel sencillo juego resumía un espacio inabarcable: el número de posibles variantes para crear una sola proteína pequeña, de 100 unidades, es 20 elevado a 100, más que todos los átomos del universo.
La naturaleza ha explorado solo una ínfima parte de todo el universo de proteínas posibles durante miles de millones de años de evolución. Hay un sinfín de ellas por descubrir, y “solo podemos soñar con la inmensidad de sus capacidades”, razonó Arnold, que ganó el Nobel de Química en 2018 por su trabajo en la evolución dirigida de estas moléculas.
Por primera vez, la inteligencia artificial (IA) hace posible explorar todo ese universo. Su creciente poder de cálculo ya ha descrito la forma tridimensional de todas las proteínas que la naturaleza ha inventado —unos 200 millones— e incluso predicho sus interacciones, un logro anunciado hace apenas tres meses por una empresa vinculada a Google.
Es inquietante que los razonamientos de esta inteligencia artificial —o el de cualquier otra— son inaccesibles para los humanos. La máquina da la respuesta correcta, pero no detalla cómo lo ha conseguido. Sus creadores tampoco consiguen averiguarlo; y el resto de científicos están vetados, pues la empresa tecnológica no desvela el código base de su máquina. La IA es una caja negra.
Esto no solo sucede con las preguntas inmensas de la ciencia, sino también con un coche autónomo que se salta una señal y acaba matando a un transeúnte, o una IA financiera que deniega una hipoteca a un prometedor candidato por su color de piel.
Noelia Ferruz, química especialista en bioinformática nacida en Zaragoza hace 36 años, acaba de ser elegida por el prestigioso Consejo Europeo de Investigación (ERC) para solucionar este problema creando una inteligencia artificial pública, abierta y capaz de explicarse a sí misma. Se llamará Athena.
“En la actualidad, la inteligencia artificial está ya al nivel de un doctorado en química”, explica la científica, que dirige su propio grupo de investigación en el Centro de Regulación Genómica (CRG), en Barcelona. Pero gracias a su capacidad de idear y estudiar compuestos que la naturaleza no ha inventado, pronto va a tener un poder “sobrenatural”, porque excederá los términos de la naturaleza.
La investigadora es hija de un ama de casa y un mecánico que tuvieron que ponerse a trabajar sin haber acabado el instituto. Ferruz acaba de recibir 1,5 millones de euros para desarrollar este sistema en cinco años. Será un “agente inteligente”, una nueva modalidad de IA capaz de analizar diferentes clases de información: el texto de la secuencia de una proteína, la imagen tridimensional de la molécula resultante, el vídeo de sus diferentes partes en movimiento. Junto a Ferruz, un equipo de tres bioinformáticos entrenará a la IA y dos biólogos moleculares probarán en el laboratorio las nuevas moléculas que diseñe. Los investigadores informarán al sistema si los experimentos han funcionado, de forma que aprenderá de sus errores. Es un paso más hacia una inteligencia más parecida a la humana.
El objetivo es diseñar proteínas nuevas que tengan una función determinada, sobre todo salvar vidas si se usan como fármaco, por ejemplo anticuerpos contra el cáncer más eficaces. Ferruz quiere centrarse en las enzimas, proteínas pequeñas que aceleran reacciones bioquímicas. “Un 25% de los medicamentos actuales presenta enlaces carbono-flúor, cuya síntesis es costosa y contaminante, lo que contribuye a que algunos cuesten 60.000 euros la dosis”, razona la investigadora. “Las enzimas tienen la capacidad de hacer ese enlace también, pero no se usan para este fin aún”. Otra posibilidad es crear una enzima que se una al bisfenol A, un compuesto del plástico que interfiere en la reproducción humana y animal, y lo neutralice.
Lo más difícil del proyecto no será crear este agente, sino entenderle. Los modelos de lenguaje actuales como ChatGPT están hechos de capas de neuronas artificiales. “Cada una hace una operación y se la pasa a la siguiente. Al final tenemos hasta un billón de neuronas en las últimas versiones. Nosotros vemos una constelación de neuronas activándose, pero no entendemos por qué; y el modelo no sabe explicárnoslo”, detalla Ferruz.
Su objetivo es entender cómo llega a su resultado, lo que en el campo se llama IA explicativa. “Es bastante laborioso, pero podemos ir abriendo capa a capa, ver qué neuronas se están activando ante ciertos estímulos, que nos enseñe qué ha aprendido y entender cómo genera secuencias de proteínas mejor que un humano”, expone. La investigación tiene un paralelismo sorprendente con el estudio del cerebro —100.000 millones de neuronas que establecen 100 billones de conexiones—, con la paradoja añadida de que, en este caso, esta inteligencia la hemos creado nosotros.
Sentada en un despacho acristalado, a pocos pasos de la orilla del Mediterráneo, Ferruz cuenta con una sonrisa que quería llamar a este sistema Pandora. Algún compañero le recordó que de esa caja salieron todos los males que azotan a la humanidad, según el mito. “Le pregunté a ChatGPT y me sugirió Athena [Atenea en inglés]. “Es la diosa griega de la sabiduría, así que pega bastante, aunque también es de la guerra”.
El ERC es el organismo de ciencia más prestigioso y exigente de la Unión Europea. Cada año, selecciona proyectos emergentes de investigadores jóvenes, que pueden luego continuar su trayectoria con nuevas rondas de financiación. El de Ferruz es uno de los 33 seleccionados en España, entre un total de 494.
Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.