Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Bons plans et avis Gearbest: Xiaomi Mi Mix2, OnePlus 5T
Code promo Gearbest: réduction, coupon, livraison...
Photo Mystérieuse

Que représente
cette image ?
Posté par Michel le Mercredi 12/03/2008 à 00:00
Découverte d'un alphabet structural génétique
Une équipe de bio-informaticiens de l’Université de Montréal rapportent dans la revue Nature une percée dans l’interprétation de l’information génétique. Les chercheurs y présentent la découverte d’un « alphabet structural » propre à l’acide (Un acide est un composé chimique généralement défini par ses réactions avec un autre type de composé chimique complémentaire, les bases.) ribonucléique (ARN) et le développement d’outils bio-informatiques capables de prédire la structure tridimensionnelle d’une molécule d’ARN à partir de la séquence de ses constituants.


Structure d'un ARN modélisé à partir de sa séquence

Compte tenu de l’importance des ARN dans la régulation de plusieurs processus cellulaires, cette percée ouvre la voie à une meilleure compréhension du métabolisme de la cellule, en plus d’illustrer l’avantage de combiner biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre...) et informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement...) pour déchiffrer l’information génétique.

Une nouvelle approche pour prédire la structure des ARN

Contrairement à son célèbre cousin, l’acide désoxyribonucléique (ADN), formé sur toute sa longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus éloignées. Lorsque l’objet est filiforme ou en forme de...) de deux brins complémentaires qui s’enroulent en une double hélice monotone, l’ARN n’est constitué que d’un seul brin capable de se replier en une multitude de structures complexes. Cette diversité structurale explique la multiplicité de rôles que joue (La joue est la partie du visage qui recouvre la cavité buccale, fermée par les mâchoires. On appelle aussi joue le muscle qui sert principalement à ouvrir et fermer la bouche et à mastiquer.) l’ARN à l’intérieur de la cellule, notamment dans la régulation de l’activité des gènes.

La structure d’un ARN est dictée en grande partie par l’appariement de ses constituants, les nucléotides A, G, C et U, sur de courtes régions de la molécule. Jusqu’ici, la structure des ARN était modélisée en recherchant la combinaison (Une combinaison peut être :) d’appariements la plus stable. Cette approche souffre toutefois d’une limitation importante: seuls les appariements classiques A:U et G:C, c’est-à-dire ceux où les nucléotides se font face, sont pris en considération. Les appariements non classiques, ceux où les nucléotides se côtoient ou se superposent, ne sont pas pris en compte par les algorithmes de prédiction conventionnels. Ceux-ci génèrent donc des modèles incomplets qui peuvent entraîner le chercheur (Un chercheur (fem. chercheuse) désigne une personne dont le métier consiste à faire de la recherche. Il est difficile de bien cerner le métier de chercheur tant les domaines de recherche sont diversifiés et...) sur une fausse piste.

C’est en voulant remédier à cette lacune que François Major, chercheur à l’Institut (Un institut est une organisation permanente créée dans un certain but. C'est habituellement une institution de recherche. Par exemple, le Perimeter...) de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche...) en immunologie (L'immunologie est la branche de la biologie qui s'occupe de l'étude du système immunitaire. Apparu très tôt dans l'échelle de l'évolution, ce système a...) et en cancérologie (IRIC) et professeur au département d’informatique et de recherche opérationnelle de l’Université de Montréal, Marc Parisien, étudiant au doctorat (Le doctorat (du latin doctorem, de doctum, supin de docere, enseigner) est généralement le grade universitaire le plus élevé. Le titulaire de ce grade est le docteur. Selon les pays et les époques, le...), et leur équipe ont été amenés à proposer une approche radicalement différente pour prédire la structure des ARN. Cette approche consiste à assembler la structure in silico à partir de motifs qui tiennent compte de l’ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude...) des interactions entre un nucléotide et ses voisins, indépendamment de la séquence de l’ARN. Les bio-informaticiens de l’Université de Montréal ont ainsi pu faire une découverte primordiale: un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) très restreint de petits motifs de huit nucléotides ou moins suffit pour reconstituer les structures des ARN répertoriées dans les banques de données expérimentales.

« Nous avons pensé que construire un langage structural à partir de mots déjà formés plutôt qu’à partir de lettres prises isolément permettrait de faire de meilleures prédictions quant à la structure qu’adopte une molécule d’ARN dans l’espace », explique François Major. « Notre hypothèse s’est avérée pleinement fondée; nous avons seulement été surpris par le peu de mots que comporte ce langage, dix-neuf pour être plus précis. Ce qui n’empêche pas que leurs différentes combinaisons dans l’espace génèrent un très grand nombre de structures tridimensionnelles, d’où l’intérêt de pouvoir maintenant prédire avec le plus d’exactitude possible celle qui correspond à une séquence donnée. Pour ce faire, un premier algorithme, MC-Fold, assigne de façon systématique les différents motifs à chaque segment de la séquence et retient la paire (On dit qu'un ensemble E est une paire lorsqu'il est formé de deux éléments distincts a et b, et il s'écrit alors :) la plus probable en fonction de sa fréquence d’apparition dans les structures déjà connues. Un deuxième algorithme, MC-Sym, assemble ensuite les motifs retenus en tenant compte des contraintes présentes dans les structures existantes. Notre approche est donc une approche statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une méthode statistique...) fondée sur des données expérimentales. »

De nombreuses applications

La prédiction de la structure des ARN n’est pas qu’un exercice académique. Au contraire, vus l’importance biologique et le potentiel thérapeutique des ARN, les algorithmes de prédiction de structure trouvent déjà plusieurs applications. Ainsi, François Major et Marc Parisien ont montré que les nouveaux outils bio-informatiques qu’ils ont mis au point (Graphie) pouvaient servir à mieux comprendre la biologie des virus (Un virus est une entité biologique qui nécessite une cellule hôte, dont il utilise les constituants pour se multiplier. Les virus existent sous une forme extracellulaire...) à ARN tels le VIH. Ils ont également montré leur utilité dans l’identification des microARN, ces molécules régulatrices qui font aujourd’hui l’objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui...) d’intenses recherches mais qui restent difficilement identifiables à partir de la seule séquence génomique. Les microARN, parce qu’ils sont capables de bloquer efficacement et spécifiquement l’activité de gènes-cibles, sont souvent considérés comme la prochaine génération d’agents thérapeutiques. Leur identification sur la base de traits structuraux représente une avancée importante.

Le professeur Major s’intéresse au problème de la prédiction de la structure des ARN depuis près de 20 ans, période au cours de laquelle il a fait plusieurs contributions importantes, en particulier l’idée que la prédiction de structures doit reposer sur les données expérimentales disponibles et non sur un a priori théorique. Les travaux de François Major et de son équipe s’inscrivent dans une tradition d’innovation en bio-informatique (On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de...) à l’Université de Montréal, qui remonte au travail de pionniers tels Robert Cedergren et David Sankoff à partir de la fin des années 1970.

Commentez et débattez de cette actualité sur notre forum Techno-Science.net. Vous pouvez également partager cette actualité sur Facebook, Twitter et les autres réseaux sociaux.
Icone partage sur Facebook Icone partage sur Twitter Partager sur Messenger Icone partage sur Delicious Icone partage sur Myspace Flux RSS
Source: Science, EurekAlert & Université de Montréal
Illustration: Université de Montréal