Les bloqueurs de pubs mettent en péril la gratuité de ce site.
Autorisez les pubs sur Techno-Science.net pour nous soutenir.
▶ Poursuivre quand même la lecture ◀
Este "ChatGPT de la biología" tiene 500 millones de años de adelanto sobre la evolución natural
Publicado por Adrien, Fuente:bioRxiv Otros Idiomas: FR, EN, DE, PT
Una nueva era comienza en el campo de las proteínas con la llegada de la inteligencia artificial (IA). Un modelo innovador, llamado ESM3, es capaz de generar proteínas totalmente nuevas. Al igual que ChatGPT, que predice la palabra siguiente en una secuencia, ESM3 puede crear secuencias proteicas desconocidas en la naturaleza. Una hazaña que genera tanto asombro como preguntas éticas.
La proteína esmGPF, generada por el modelo ESM3, es única en su género. Según los científicos, 500 millones de años de evolución habrían sido necesarios para crear una proteína de este tipo. Crédito: EvolutionaryScale
Los investigadores han utilizado ESM3 para desarrollar una proteína fluorescente que solo comparte el 58 % de su secuencia con las presentes en la naturaleza. Este avance fue publicado el 2 de julio en la base de datos bioRxiv. La empresa EvolutionaryScale, fundada por exinvestigadores de Meta, también detalló este descubrimiento en un comunicado el pasado 25 de junio.
El modelo ESM3, similar al GPT-4 de OpenAI, fue entrenado con 2.78 mil millones de proteínas. Los investigadores extrajeron información sobre la secuencia, la estructura y la función de cada proteína, luego le pidieron al modelo que predijera la información faltante. Este método permite generar proteínas nuevas, pero su eficacia debe ser validada mediante pruebas experimentales.
EvolutionaryScale ha puesto a disposición una versión reducida del modelo ESM3 bajo una licencia no comercial, mientras que la versión completa será accesible para los investigadores industriales. Esta tecnología podría revolucionar diversos campos, desde el descubrimiento de medicamentos hasta la degradación de plásticos.
El equipo de investigación ya había dado que hablar en 2022 con EMSFold, un precursor del modelo ESM3, que predecía estructuras proteicas microbianas desconocidas. Paralelamente, el equipo de DeepMind de Google había anunciado predicciones para 200 millones de proteínas, subrayando los límites y desafíos de tales enfoques, especialmente la verificación de las predicciones mediante métodos experimentales tradicionales.
La verdadera innovación del modelo ESM3 reside en su capacidad para generar proteínas completamente nuevas. Utilizando miles de millones de datos sobre la estructura, la función y la secuencia de las proteínas, el modelo produjo una nueva proteína fluorescente llamada "esmGPF". Aunque menos brillante que sus homólogas naturales, iteraciones adicionales permitieron mejorar su luminosidad, alcanzando resultados inimaginables por la evolución natural.