Biologie de synthèse: mieux comprendre la production de protéines et la croissance bactérienne
Publié par Isabelle le 28/09/2018 à 12:00
Source: INRA

© INRA
Grâce aux nouvelles technologies de synthèse et de séquençage de l'ADN, une équipe de chercheurs de l'Inra et de l'Université de Berkeley (Etats-Unis) a reprogrammé 244 000 séquences génétiques pour comprendre les impacts respectifs de différentes propriétés des gènes sur l'efficacité de leur propre traduction en protéines chez la bactérie (Les bactéries (Bacteria) sont des organismes vivants unicellulaires procaryotes, caractérisées par une absence de noyau et d'organites. La plupart des bactéries possèdent une paroi cellulaire glucidique, le peptidoglycane. Les...) modèle Escherichia Coli (Escherichia coli, également appelé colibacille ou E. coli, est une bactérie intestinale des mammifères très commune chez l'être humain....). Ces travaux, publiés dans la revue Nature Biotechnology le 24 septembre 2018, ont permis d'identifier des règles générales d'optimisation de l'expression protéique, une étape fondamentale (En musique, le mot fondamentale peut renvoyer à plusieurs sens.) pour la compréhension des systèmes vivants, et démontrent la possibilité de mettre en place de gigantesques plans expérimentaux à l'échelle moléculaire de l'ADN.

Le lien entre les séquences génétiques et leur manifestation phénotypique est longtemps resté limité à l'étude de variations naturelles. Le développement récent de technologies de synthèse et de séquençage (En biochimie, le séquençage consiste à déterminer l'ordre linéaire des composants d'une macromolécule (les acides aminés d'une protéine, les...) de l'ADN à très haut-débit ouvre de nouvelles perspectives. La biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des sciences naturelles et de l'histoire naturelle des êtres...) synthétique repose largement sur l'assemblage de composants génétiques standard, en faisant abstraction ( En philosophie, l'abstraction désigne à la fois une opération qui consiste a isoler par la pensée une ou plusieurs qualités d'un objet concret pour en former une représentation intellectuelle, et le produit...) des complexités de leur fonctionnement interne (En France, ce nom désigne un médecin, un pharmacien ou un chirurgien-dentiste, à la fois en activité et en formation à l'hôpital ou en cabinet...). Or certains éléments génétiques ne se prêtent pas à cette approche: leur fonctionnement doit alors être compris en détail. C'est notamment le cas des protéines, ces machines moléculaires qui assurent des fonctions très précises et doivent donc être adaptés à la finalité de chaque processus biologique ou application biotechnologique (production de molécule (Une molécule est un assemblage chimique électriquement neutre d'au moins deux atomes, qui peut exister à l'état libre, et qui...) d'intérêt, détection de signaux, détoxification). Or, on sait que la séquence codant une protéine (Une protéine est une macromolécule biologique composée par une ou plusieurs chaîne(s) d'acides aminés liés entre eux par des liaisons peptidiques. En général, on parle de protéine lorsque la...) influence grandement son niveau d'expression, sans pour autant que l'on sache l'expliquer.

L'étude de telles relations entre génotype (Le génotype est l'ensemble ou une partie donnée de la composition génétique (information génétique) d'un individu. Le génotype d'un individu est...) et phénotype est longtemps restée confiné à l'analyse de la variabilité naturelle ou générée au hasard (Dans le langage ordinaire, le mot hasard est utilisé pour exprimer un manque efficient, sinon de causes, au moins d'une reconnaissance de cause à effet d'un événement.) au laboratoire, limitant notre compréhension fine des mécanismes génétiques. Il est depuis peu possible de programmer précisément un très grand nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) de séquences d'ADN par synthèse chimique, ce qui offre la possibilité d'interroger le fonctionnement des systèmes vivants de manière plus précise que jamais.

244 000 séquences d'ADN synthétisées pour mieux comprendre la production des protéines

Une équipe de chercheurs de l'Inra et de l'Université de Berkeley (L'université de Californie, Berkeley (encore appelée UCB, Cal, Berkeley, ou UC Berkeley) est le premier campus de l'Université de Californie. Il est situé à Berkeley, en Californie, sur la rive est de la baie de San Francisco,...) (Etats-Unis) a ré-analysé génome (Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce codé dans son ADN (à l'exception de certains virus dont le génome est porté par des molécules d'ARN). Il contient en...) et données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) fonctionnelles publiquement disponibles sur Escherichia (Escherichia est un genre de bactéries de la famille des Enterobacteriaceae, qui colonise l'intestin de l'homme et d'autres animaux. L'espèce la plus répandue est E. Coli.) coli, principal modèle bactérien. Cela a permis aux scientifiques d'identifier huit propriétés de l'ADN susceptible d'influencer la traduction des protéines. Ils ont ensuite développé un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la simplification des actions...) informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des machines telles que les...) capable de générer automatiquement des séquences explorant exhaustivement toutes les combinaisons possibles de ces propriétés. Pas moins de 244 000 de ces séquences ont été traitées. Mises bout à bout, l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) de ces séquences représente près de 6 fois la taille du génome de la bactérie. Ces séquences ont ensuite été introduites chez E. coli, permettant ainsi l'obtention d'une population de bactéries variantes, dans laquelle chacune des séquences synthétiques est représentée.

D'astucieux recours au séquençage à haut-débit leur a alors permis de mesurer le phénotype associé à chacun de ces variants en une seule expérience, occasionnant ainsi un gain de coût, de temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) et de reproductibilité (La reproductibilité d'une expérience scientifique est une des conditions qui permet d'inclure les observations réalisées durant cette expérience dans le processus d'amélioration...). Les chercheurs ont ainsi pu mesurer l'influence des séquences synthétiques sur 1/la production et la stabilité d'ARN messagers, 2/le nombre de ribosomes qui leur sont associés, 3/la production protéique en résultant et enfin sur 4/l'impact de l'ensemble de ces phénomènes sur la croissance bactérienne.

Des règles pour optimiser la production de protéines

L'intégration et l'analyse du gigantesque jeu de données produit a permis de quantifier les contributions respectives et les relations de dépendances entre les propriétés de séquences identifiées lors de l'analyse initiale. En particulier, ces résultats montrent la très nette (Le terme Nette est un nom vernaculaire attribué en français à plusieurs espèces de canards reconnaissablent à leurs calottes. Le terme est un emprunt au grec ancien...) dominance des structures secondaires (issues du reploiement des ARN messagers sur eux-mêmes) sur l'ensemble des phénotypes observés, au détriment d'une autre propriété, l'usage (L’usage est l'action de se servir de quelque chose.) de codon, qui est pourtant généralement considérée comme primordiale. Ces analyses ont permis d'édicter un ensemble de règles pour optimiser la production de protéines à moindre coût pour la cellule.

Malgré la quantité (La quantité est un terme générique de la métrologie (compte, montant) ; un scalaire, vecteur, nombre d’objets ou d’une autre manière de dénommer la valeur d’une...) des données accumulées dans un cadre cohérent et contrôlé, les chercheurs notent qu'il reste difficile de prédire avec précision le comportement de l'ensemble des séquences. Cette observation (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les modifier, à l’aide de moyens d’enquête et d’étude appropriés. Le...) souligne l'extrême complexité (La complexité est une notion utilisée en philosophie, épistémologie (par exemple par Anthony Wilden ou Edgar Morin), en physique, en biologie (par exemple par Henri Atlan), en sociologie, en informatique ou...) des relations entre séquences, activité (Le terme d'activité peut désigner une profession.) biologique et physiologie (La physiologie (du grec φύσις, phusis, la nature, et λόγος, logos, l'étude, la science) étudie le rôle, le...). Le chemin menant à une biologie vraiment prédictive reste long, en raison notamment de la complexité des processus sous-jacents, et des limites actuelles en intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités intellectuelles comparables à celles des êtres...) par exemple.

Fort de leur expérience, les chercheurs de l'Inra envisagent désormais d'appliquer ce type d'approches à l'étude approfondie de petits virus (Un virus est une entité biologique qui nécessite une cellule hôte, dont il utilise les constituants pour se multiplier. Les virus existent sous une forme extracellulaire ou...) d'insecte (Les insectes (Insecta) font partie du sous-embranchement des hexapodes, elle-même incluse dans l'embranchement des arthropodes mais dans un sous-groupe : les mandibulates. On connaît un insecte marin, la punaise...) susceptibles d'être utilisés en lutte biologique contre des ravageurs de culture (La définition que donne l'UNESCO de la culture est la suivante [1] :) (chenille légionnaire d'automne (L'automne est l'une des quatre saisons des zones tempérées. Elle se place entre l'été et l'hiver.), Spodoptera frugiperda) et des vecteurs de maladies (moustique tigre (Le tigre (Panthera tigris) est un mammifère carnivore de la famille des félidés (Felidae) du genre Panthera. Aisément reconnaissable à sa fourrure...), Aedes albopictus).


© INRA

Contact scientifique:
- Guillaume (Guillaume est un prénom masculin d'origine germanique. Le nom vient de Wille, volonté et Helm, heaume, casque, protection.) Cambray, Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la production du savoir (recherche), sa conservation et sa transmission (études supérieures). Aux États-Unis, au moment...) mixte de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche scientifique désigne également...) "Diversité, Génomes et Interactions Microorganismes-Insectes" (Inra – Université de Montpellier)

Centre associé:
Occitanie-Montpellier

Référence publication:
Cambray, G, Guimaraes, J. & Arkin A.P. Evaluation of 244,000 synthetic sequences reveals design (Le design (la stylique en français) est un domaine visant à la création d'objets, d'environnements ou d'œuvres graphiques, à la fois fonctionnels, esthétiques et conformes...) principles to optimize translation in Escherichia Coli, Nature Biotechnology, https://doi.org/10.1038/nbt.4238
Page générée en 1.110 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique