La IA revoluciona la biología: crean proteína inédita tras 500 millones de años de evolución simulada

Científicos de EvolutionaryScale logran un avance sin precedentes al diseñar una nueva proteína fluorescente verde mediante inteligencia artificial

En un logro histórico para la biología y la inteligencia artificial (IA), investigadores de la empresa EvolutionaryScale han desarrollado una proteína completamente nueva llamada “esmGFP”, que no existe en la naturaleza. El asombroso avance equivale a simular 500 millones de años de evolución mediante su modelo de IA denominado ESM3. Este desarrollo marca un antes y un después en la capacidad de la tecnología para programar la vida y descifrar los secretos biológicos a niveles impensados.


Un salto evolutivo con IA

EvolutionaryScale, una compañía enfocada en el desarrollo de inteligencia artificial para la biología, ha creado un modelo de lenguaje de gran envergadura, ESM3, que puede diseñar proteínas desde cero siguiendo el “código de la vida”. Esta premisa parte de la idea de que la biología, al igual que un programa informático, es programable si se logra comprender su lenguaje molecular.

El ribosoma, una fábrica molecular presente en todas las células del planeta, traduce el código genético para sintetizar proteínas. Sin embargo, hasta ahora la ciencia no ha podido entender completamente su lenguaje. “La biología está escrita en un código que aún no comprendemos del todo”, explica un comunicado de EvolutionaryScale.

Creación de la proteína “esmGFP”

Los hallazgos de la compañía se publicaron recientemente en la revista Science, donde detallaron cómo el modelo ESM3 generó una nueva versión de una proteína fluorescente verde (GFP), similar a las que dotan de bioluminiscencia a medusas y corales.

Esta proteína diseñada por IA tiene apenas un 58% de semejanza con su contraparte más cercana en la naturaleza. Según los investigadores, para que la evolución natural generara una estructura semejante, habrían tenido que pasar alrededor de 500 millones de años.

Un modelo generativo sin precedentes

ESM3 es el primer sistema de IA generativa capaz de analizar simultáneamente las tres propiedades fundamentales de las proteínas: secuencia, estructura y función. El proceso para lograrlo fue complejo, comenzando por entrenar el sistema con datos de miles de millones de proteínas provenientes de entornos tan diversos como la selva amazónica y las profundidades oceánicas.

Cómo funciona ESM3

El modelo operó de manera similar a otros sistemas de lenguaje grande, desglosando secuencias de aminoácidos y transformándolas en códigos discretos. Esto permitió entrenar el sistema a gran escala y desbloquear capacidades generativas emergentes.

“ESM3 aprende a simular la evolución, entrenándose con un simple objetivo: predecir las posiciones enmascaradas en las secuencias, estructuras y funciones de las proteínas. Así logra comprender cómo estos aspectos se conectan en datos a escala evolutiva”, explicaron desde EvolutionaryScale.

Implicaciones científicas y éticas

Los expertos enfatizan que el avance supone un compromiso ético con la investigación responsable. Por ello, la compañía ha puesto a disposición de la comunidad científica sus datos, códigos y hallazgos.

“Nuestra misión es desarrollar inteligencia artificial para comprender la biología en beneficio de la salud humana y la sociedad, colaborando con la comunidad científica de manera abierta, segura y responsable”, destacaron desde la firma.

Posibles aplicaciones futuras

El desarrollo de herramientas como ESM3 podría transformar la investigación médica y biológica, facilitando el descubrimiento de curas para enfermedades complejas y revolucionando la industria de la biotecnología.

Este avance sugiere un futuro prometedor en el que la biología, finalmente descifrada y programada, podría ser el punto de partida para innumerables innovaciones. ¿Estamos ante una nueva era científica impulsada por la inteligencia artificial? Solo el tiempo lo dirá.

Deja un comentario

Tu dirección de correo electrónico no será publicada.

×