Une IA en avance: elle a engendré ce que l'évolution n'a pas encore conçu 🧬

Publié par Adrien,
Source: Science
Autres langues: EN, DE, ES, PT
Restez toujours informé: suivez-nous sur Google Actualités (icone ☆)

Une équipe de chercheurs a récemment marqué une avancée significative dans le domaine de la biologie synthétique grâce à l'intelligence artificielle. Avec cette IA, ils ont pu devancer l'évolution naturelle.

Ils ont utilisé un modèle de langage génératif, ESM3, pour concevoir une protéine fluorescente totalement nouvelle, ouvrant des perspectives inédites en ingénierie des protéines.


Image d'illustration Pixabay

ESM3 se distingue par sa capacité à intégrer séquence, structure et fonction des protéines, offrant une approche holistique inédite. Ce modèle, entraîné sur des milliards de données protéiques, permet de simuler des évolutions biologiques sur des échelles de temps gigantesques, jusqu'à 500 millions d'années.

La création de cette protéine fluorescente, dont la séquence génétique diffère radicalement de toutes les protéines connues, illustre le potentiel d'ESM3. Ce succès ouvre la voie à des applications variées, allant de la médecine à la dépollution environnementale, en passant par la conception de matériaux innovants.

ESM3 est accessible en version bêta publique via une API, permettant aux scientifiques d'exploiter cet outil pour l'ingénierie des protéines. Cette accessibilité favorise une collaboration accrue entre chercheurs et accélère les découvertes dans le domaine.

L'entraînement d'ESM3 sur un vaste corpus de données protéiques, incluant séquences, structures et annotations fonctionnelles, a permis d'atteindre une précision sans précédent. Ce modèle, capable de gérer jusqu'à 98 milliards de paramètres, représente une avancée majeure dans la modélisation des protéines.

Les implications de cette technologie sont vastes, offrant des outils puissants pour explorer l'immense diversité des protéines. ESM3 permet non seulement de comprendre mieux les protéines naturelles mais aussi de créer des protéines aux propriétés uniques pour des applications spécifiques.

Cette innovation, publiée dans Science, marque un tournant dans l'utilisation de l'IA pour la biologie synthétique. Elle démontre comment les modèles de langage génératif peuvent transformer notre approche de la conception des protéines, en simulant des processus évolutifs complexes pour générer des molécules aux fonctionnalités inédites.

Comment ESM3 modélise-t-il les protéines ?

ESM3 utilise une approche innovante pour modéliser les protéines, en intégrant séquence, structure et fonction dans un modèle de langage génératif. Contrairement aux modèles précédents, ESM3 représente ces trois aspects à travers des alphabets de tokens discrets, permettant une génération plus précise et holistique des protéines.

Le modèle est entraîné sur un vaste ensemble de données, incluant des milliards de séquences protéiques, des millions de structures et des annotations fonctionnelles. Cette richesse de données permet à ESM3 de simuler des processus évolutifs complexes, offrant une compréhension approfondie des protéines naturelles et la capacité de concevoir des protéines nouvelles.

ESM3 peut gérer jusqu'à 98 milliards de paramètres, ce qui en fait l'un des modèles les plus puissants pour la modélisation des protéines. Cette capacité permet des simulations précises et détaillées, ouvrant de nouvelles perspectives pour la recherche en biologie synthétique.

Quelles sont les applications potentielles d'ESM3 ?

ESM3 ouvre des perspectives inédites dans divers domaines, notamment la médecine, où il pourrait permettre la conception de protéines thérapeutiques aux propriétés uniques. En environnement, il pourrait contribuer à la dépollution en créant des enzymes capables de dégrader des polluants spécifiques.

Dans le domaine des matériaux, ESM3 pourrait être utilisé pour concevoir des protéines aux propriétés mécaniques ou optiques particulières, utiles pour la création de nouveaux matériaux. Ces applications illustrent le potentiel transformateur d'ESM3 pour la science et la technologie.

L'accessibilité d'ESM3 via une API en version bêta publique facilite son adoption par la communauté scientifique. Cela permet une collaboration accrue et accélère les découvertes, en offrant un outil puissant pour l'ingénierie des protéines à un large éventail de chercheurs.
Page générée en 0.161 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique
Version anglaise | Version allemande | Version espagnole | Version portugaise