Este "ChatGPT de la biología" tiene 500 millones de años de adelanto sobre la evolución natural

Publicado por Adrien,
Fuente: bioRxiv
Otros Idiomas: FR, EN, DE, PT
Una nueva era comienza en el campo de las proteínas con la llegada de la inteligencia artificial (IA). Un modelo innovador, llamado ESM3, es capaz de generar proteínas totalmente nuevas. Al igual que ChatGPT, que predice la palabra siguiente en una secuencia, ESM3 puede crear secuencias proteicas desconocidas en la naturaleza. Una hazaña que genera tanto asombro como preguntas éticas.


La proteína esmGPF, generada por el modelo ESM3, es única en su género. Según los científicos, 500 millones de años de evolución habrían sido necesarios para crear una proteína de este tipo.
Crédito: EvolutionaryScale

Los investigadores han utilizado ESM3 para desarrollar una proteína fluorescente que solo comparte el 58 % de su secuencia con las presentes en la naturaleza. Este avance fue publicado el 2 de julio en la base de datos bioRxiv. La empresa EvolutionaryScale, fundada por exinvestigadores de Meta, también detalló este descubrimiento en un comunicado el pasado 25 de junio.

El modelo ESM3, similar al GPT-4 de OpenAI, fue entrenado con 2.78 mil millones de proteínas. Los investigadores extrajeron información sobre la secuencia, la estructura y la función de cada proteína, luego le pidieron al modelo que predijera la información faltante. Este método permite generar proteínas nuevas, pero su eficacia debe ser validada mediante pruebas experimentales.

EvolutionaryScale ha puesto a disposición una versión reducida del modelo ESM3 bajo una licencia no comercial, mientras que la versión completa será accesible para los investigadores industriales. Esta tecnología podría revolucionar diversos campos, desde el descubrimiento de medicamentos hasta la degradación de plásticos.

El equipo de investigación ya había dado que hablar en 2022 con EMSFold, un precursor del modelo ESM3, que predecía estructuras proteicas microbianas desconocidas. Paralelamente, el equipo de DeepMind de Google había anunciado predicciones para 200 millones de proteínas, subrayando los límites y desafíos de tales enfoques, especialmente la verificación de las predicciones mediante métodos experimentales tradicionales.

La verdadera innovación del modelo ESM3 reside en su capacidad para generar proteínas completamente nuevas. Utilizando miles de millones de datos sobre la estructura, la función y la secuencia de las proteínas, el modelo produjo una nueva proteína fluorescente llamada "esmGPF". Aunque menos brillante que sus homólogas naturales, iteraciones adicionales permitieron mejorar su luminosidad, alcanzando resultados inimaginables por la evolución natural.
Página generada en 0.127 segundo(s) - alojado por Contabo
Acerca de - Aviso Legal - Contacto
Versión francesa | Versión inglesa | Versión alemana | Versión portuguesa