Exploiter le génome humain est une histoire de méthodes: les voici "revisitées" avec succès par le
logiciel (Un logiciel ou une application est un ensemble de programmes, qui permet à un ordinateur ou à un système informatique...) Exogean, un pur produit de la
bio-informatique (On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert...). En témoigne la conclusion d'un groupe international d'experts indépendants: sur vingt logiciels d'annotation (outils servant à définir les informations structurantes et fonctionnelles d'un gène), il arrive en tête par son efficacité. L'astuce ? Ce logiciel, qui intègre bien sûr comme informations de base toutes les séquences de l'ADN, modélise non pas les gènes, mais la réflexion et le savoir-faire du biologiste, soit la référence dans l'exploitation du génome humain.
Représentation d'une section de la double hélice d'ADN
Hugues Roest-Crollius, du groupe "Dynamique d'
organisation (Une organisation est) des génomes" (Dyogen) à
Paris (Paris est une ville française, capitale de la France et le chef-lieu de la région d’Île-de-France. Cette ville...), et un des concepteurs du logiciel, en précise les enjeux: "Après le séquençage, il faut annoter avec le plus de précision chaque gène codant. C'est une étape indispensable pour pouvoir exploiter le matériel biologique." Et ce travail titanesque se heurte à bon
nombre (Un nombre est un concept caractérisant une unité, une collection d'unités ou une fraction d'unité.) d'obstacles. Ne serait-ce que la succession d'introns et d'exons (des petits bouts de séquences codants ou non) au sein des gènes, qui les rend complexes et hautement variables. Ou bien encore la notion de "transcrits alternatifs", c'est-à-dire le fait bien connu désormais que des gènes codent non pas pour une mais pour plusieurs versions d'une même protéine.
Bref, le challenge, c'est donc de modéliser toute la gamme de ces transcrits. Mais aucun
programme informatique (Un programme informatique est une liste d'ordres indiquant à un ordinateur ce qu'il doit faire. Il se présente sous la...) – fondé sur un modèle
statistique (Une statistique (par opposition à la statistique) est, au premier abord, un nombre calculé à propos d'une population....) avec ou sans la comparaison de séquences de gènes connus – ne parvenait jusqu'alors à la
hauteur (La hauteur a plusieurs significations suivant le domaine abordé.) de l'annotation "à la main". Entendez un "expérimentateur humain ayant une compréhension globale de la biologie du génome et s'en servant pour trier les
données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose,...), éliminer la redondance et générer une ou plusieurs structures de transcrit par gène", précise le
chercheur (Un chercheur (fem. chercheuse) désigne une personne dont le métier consiste à faire de la recherche. Il est difficile...).
Hugues Roest-Crollius a donc joué et décortiqué ce rôle tandis que les informaticiens Sarah Djebali et Franck Delaplace, du laboratoire "Informatique, biologie intégrative et systèmes complexes" (Ibisc) en ont formalisé les règles. Résultat: une approche totalement novatrice et parfaitement efficace.
Comment fonctionne Exogean ? Schématiquement, ce logiciel intègre comme informations de base toutes les séquences de l'ADN et les gènes connus (ARN messagers et protéines) chez l'humain et chez les autres espèces, notamment la souris. Au cœur du processus, se trouve un cadre mathématique appelé "multi-graphes acycliques orientés colorés" (MAOC). Il permet de manipuler virtuellement les gènes et les relations entre eux comme le ferait un expert humain. Au final, on obtient des "objets-gènes" complexes qui synthétisent toutes les informations disponibles dans le logiciel: longueur totale de chaque gène, place des introns, des exons, gamme complète des transcrits, etc. De quoi "
booster (Le nom de booster (ou propulseur d'appoint) est donné au moteur-fusée qui est attaché aux navettes spatiales...)" la connaissance de notre patrimoine génétique.