Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Posté par Michel le Mercredi 12/03/2008 à 00:00
Découverte d'un alphabet structural génétique
Une équipe de bio-informaticiens de l'Université de Montréal rapportent dans la revue Nature une percée dans l'interprétation de l'information génétique. Les chercheurs y présentent la découverte d'un "alphabet structural" propre à l'acide (Un acide est un composé chimique généralement défini par ses réactions avec un autre type de composé chimique complémentaire, les bases.) ribonucléique (ARN) et le développement d'outils bio-informatiques capables de prédire la structure tridimensionnelle d'une molécule (Une molécule est un assemblage chimique électriquement neutre d'au moins deux atomes, qui peut exister à l'état libre, et qui représente la plus petite quantité de matière possédant...) d'ARN à partir de la séquence de ses constituants.


Structure d'un ARN modélisé à partir de sa séquence

Compte tenu de l'importance des ARN dans la régulation (Le terme de régulation renvoie dans son sens concret à une discipline technique, qui se rattache au plan scientifique à l'automatique.) de plusieurs processus cellulaires, cette percée ouvre la voie à une meilleure compréhension du métabolisme (Le métabolisme est l'ensemble des transformations moléculaires et énergétiques qui se déroulent de manière ininterrompue dans la cellule ou l'organisme vivant. C'est un processus...) de la cellule, en plus d'illustrer l'avantage de combiner biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des sciences...) et informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de...) pour déchiffrer l'information génétique (La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l'hérédité et les...).

Une nouvelle approche pour prédire la structure des ARN

Contrairement à son célèbre cousin, l'acide désoxyribonucléique (ADN), formé sur toute sa longueur (La longueur d’un objet est la distance entre ses deux extrémités les plus éloignées. Lorsque l’objet est filiforme ou en forme de lacet, sa longueur est celle de l’objet...) de deux brins complémentaires qui s'enroulent en une double hélice (Hélice est issu d'un mot grec helix signifiant « spirale ». Un objet en forme d'hélice est dit hélicoïdal.) monotone, l'ARN n'est constitué que d'un seul brin capable de se replier en une multitude de structures complexes. Cette diversité structurale explique la multiplicité de rôles que joue (La joue est la partie du visage qui recouvre la cavité buccale, fermée par les mâchoires. On appelle aussi joue le muscle qui sert principalement à ouvrir et fermer la...) l'ARN à l'intérieur de la cellule, notamment dans la régulation de l'activité (Le terme d'activité peut désigner une profession.) des gènes.

La structure d'un ARN est dictée (La dictée est l'opération par laquelle une personne lit ou au moins énonce à haute voix un texte cohérent selon un rythme qui...) en grande partie par l'appariement de ses constituants, les nucléotides A, G, C et U, sur de courtes régions de la molécule. Jusqu'ici, la structure des ARN était modélisée en recherchant la combinaison (Une combinaison peut être :) d'appariements la plus stable. Cette approche souffre toutefois d'une limitation importante: seuls les appariements classiques A:U et G:C, c'est-à-dire ceux où les nucléotides se font face, sont pris en considération. Les appariements non classiques, ceux où les nucléotides se côtoient ou se superposent, ne sont pas pris en compte par les algorithmes de prédiction conventionnels. Ceux-ci génèrent donc des modèles incomplets qui peuvent entraîner le chercheur (Un chercheur (fem. chercheuse) désigne une personne dont le métier consiste à faire de la recherche. Il est difficile de bien cerner le métier de chercheur tant les domaines de recherche sont diversifiés et impliquent...) sur une fausse piste.

C'est en voulant remédier à cette lacune que François Major, chercheur à l'Institut (Un institut est une organisation permanente créée dans un certain but. C'est habituellement une institution de recherche. Par exemple, le Perimeter Institute for...) de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la...) en immunologie (L'immunologie est la branche de la biologie qui s'occupe de l'étude du système immunitaire. Apparu très tôt dans l'échelle de l'évolution, ce système a...) et en cancérologie (L'oncologie ou carcinologie ou cancérologie est la spécialité médicale d'étude, de diagnostic et de traitement des cancers. Un...) (IRIC) et professeur au département d'informatique et de recherche opérationnelle (La recherche opérationnelle (aussi appelée aide à la décision) peut être définie comme l'ensemble des méthodes et techniques rationnelles d'analyse et de...) de l'Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la production du savoir (recherche), sa conservation et sa transmission (études supérieures). Aux États-Unis, au moment...) de Montréal (Montréal est à la fois région administrative et métropole du Québec[2]. Cette grande agglomération canadienne constitue un centre majeur du commerce, de...), Marc Parisien, étudiant au doctorat (Le doctorat (du latin doctorem, de doctum, supin de docere, enseigner) est généralement le grade universitaire le plus élevé. Le titulaire de ce grade est le docteur. Selon les pays et les époques, le doctorat...), et leur équipe ont été amenés à proposer une approche radicalement différente (En mathématiques, la différente est définie en théorie algébrique des nombres pour mesurer l'éventuel défaut de dualité d'une application...) pour prédire la structure des ARN. Cette approche consiste à assembler la structure in silico à partir de motifs qui tiennent compte de l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) des interactions entre un nucléotide et ses voisins, indépendamment de la séquence de l'ARN. Les bio-informaticiens de l'Université de Montréal ont ainsi pu faire une découverte primordiale: un nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) très restreint de petits motifs de huit nucléotides ou moins suffit pour reconstituer les structures des ARN répertoriées dans les banques de données expérimentales.

"Nous avons pensé que construire un langage structural à partir de mots déjà formés plutôt qu'à partir de lettres prises isolément permettrait de faire de meilleures prédictions quant à la structure qu'adopte une molécule d'ARN dans l'espace", explique François Major. "Notre hypothèse s'est avérée pleinement fondée; nous avons seulement été surpris par le peu de mots que comporte ce langage, dix-neuf pour être plus précis. Ce qui n'empêche pas que leurs différentes combinaisons dans l'espace génèrent un très grand nombre de structures tridimensionnelles, d'où l'intérêt de pouvoir maintenant prédire avec le plus d'exactitude possible celle qui correspond à une séquence donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.). Pour ce faire, un premier algorithme, MC-Fold, assigne de façon systématique (En sciences de la vie et en histoire naturelle, la systématique est la science qui a pour objet de dénombrer et de classer les taxons dans un certain ordre, basé sur des principes divers. Elle ne doit...) les différents motifs à chaque segment de la séquence et retient la paire (On dit qu'un ensemble E est une paire lorsqu'il est formé de deux éléments distincts a et b, et il s'écrit alors :) la plus probable en fonction de sa fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un phénomène périodique se reproduit par unité de...) d'apparition dans les structures déjà connues. Un deuxième algorithme, MC-Sym, assemble ensuite les motifs retenus en tenant compte des contraintes présentes dans les structures existantes. Notre approche est donc une approche statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon. D'une façon générale, c'est le résultat de l'application d'une...) fondée sur des données expérimentales."

De nombreuses applications

La prédiction de la structure des ARN n'est pas qu'un exercice académique. Au contraire, vus l'importance biologique et le potentiel thérapeutique (La thérapeutique (du grec therapeuein, soigner) est la partie de la médecine qui étudie et applique le traitement des maladies.) des ARN, les algorithmes de prédiction de structure trouvent déjà plusieurs applications. Ainsi, François Major et Marc Parisien ont montré que les nouveaux outils bio-informatiques qu'ils ont mis au point (Graphie) pouvaient servir à mieux comprendre la biologie des virus (Un virus est une entité biologique qui nécessite une cellule hôte, dont il utilise les constituants pour se multiplier. Les virus existent sous une forme extracellulaire ou...) à ARN tels le VIH. Ils ont également montré leur utilité dans l'identification des microARN, ces molécules régulatrices qui font aujourd'hui l'objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui a une fonction précise, et qui peut être désigné par une étiquette...) d'intenses recherches mais qui restent difficilement identifiables à partir de la seule séquence génomique (La génomique est une discipline de la biologie moderne. Elle étudie le fonctionnement d'un organisme, d'un organe, d'un cancer, etc. à l'échelle du...). Les microARN, parce qu'ils sont capables de bloquer efficacement et spécifiquement l'activité de gènes-cibles, sont souvent considérés comme la prochaine génération d'agents thérapeutiques. Leur identification sur la base de traits structuraux représente une avancée importante.

Le professeur Major s'intéresse au problème de la prédiction de la structure des ARN depuis près de 20 ans, période au cours de laquelle il a fait plusieurs contributions importantes, en particulier l'idée que la prédiction de structures doit reposer sur les données expérimentales disponibles et non sur un a priori théorique. Les travaux de François Major et de son équipe s'inscrivent dans une tradition d'innovation en bio-informatique (On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans...) à l'Université de Montréal, qui remonte au travail de pionniers tels Robert Cedergren et David Sankoff à partir de la fin des années 1970.

Commentez et débattez de cette actualité sur notre forum Techno-Science.net. Vous pouvez également partager cette actualité sur Facebook, Twitter et les autres réseaux sociaux.
Icone partage sur Facebook Icone partage sur Twitter Partager sur Messenger Icone partage sur Delicious Icone partage sur Myspace Flux RSS
Source: Science, EurekAlert & Université de Montréal
Illustration: Université de Montréal