Le big data à la recherche de nouvelles molécules naturelles bioactives
Publié par Isabelle le 11/08/2018 à 12:00
Source: CNRS-INC
Petit à petit, le big data, ou grand jeux de données, se répand dans toutes les sciences et la biologie moléculaire n'y fait pas exception. Plusieurs nouvelles molécules, inhibitrices d'une protéine jouant un rôle dans le développement de certains cancers, viennent d'être découvertes par l'Institut (Un institut est une organisation permanente créée dans un certain but. C'est habituellement une institution de recherche. Par exemple, le Perimeter Institute for Theoretical Physics...) de chimie (La chimie est une science de la nature divisée en plusieurs spécialités, à l'instar de la physique et de la biologie avec...) des substances naturelles grâce à l'emploi des "réseaux moléculaires", une méthode bio-informatique (On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de...) capable de dénicher de nouvelles molécules d'intérêt à partir de l'analyse simultanée de plusieurs centaines d'extraits naturels. Grâce au protocole expérimental développé par Marc Litaudon et ses collègues, il a été possible de révéler ces molécules bioactives au sein d'un mélange (Un mélange est une association de deux ou plusieurs substances solides, liquides ou gazeuses qui n'interagissent pas chimiquement. Le résultat de l'opération est une...) d'extraits contenant chacun plusieurs centaines de molécules.


Illustration d'une partie des réseaux moléculaires obtenus à partir de l'analyse de 300 extraits naturels d'Euphorbiaceae de Nouvelle-Calédonie. Les constellations sont formées de molécules (= nodes) appartenant spécifiquement à certains genres botaniques présents en Nouvelle Calédonie (chaque genre est représenté par une couleur)
©Marc Litaudon

La nature recèle encore une infinité de secrets inexplorés. Une chance mais aussi un problème car nombreux sont ces secrets qui se ressemblent comme deux gouttes d'eau (L’eau est un composé chimique ubiquitaire sur la Terre, essentiel pour tous les organismes vivants connus.). Ainsi, il n'est pas rare de "redécouvrir" une molécule (Une molécule est un assemblage chimique électriquement neutre d'au moins deux atomes, qui peut exister à l'état libre, et qui...) déjà connue. Pour ne pas tomber deux fois sur la même aiguille dans une botte de foin, les chimistes de l'Institut de chimie des substances naturelles, à Gif-sur-Yvette, ont sélectionné 300 extraits provenant de plantes de la famille des Euphorbiaceae, endémiques de Nouvelle-Calédonie pour la plupart. Ces extraits ont ensuite été analysé par spectrométrie de masse (La spectrométrie de masse est une technique d'analyse chimique permettant de détecter et d'identifier des molécules d’intérêt par mesure de leur masse monoisotopique. De plus, la spectrométrie de masse permet de caractériser...) (LC/MS2), une technique qui classe les molécules en fonction de leur rapport masse/charge. C'est à partir de là que le "Big Data" entre en jeu. Les chimistes se muent alors en détectives informatiques.

"La première étape consiste à regrouper ces molécules en fonction de leur similarité structurale, détaille l'ingénieur (« Le métier de base de l'ingénieur consiste à résoudre des problèmes de nature technologique, concrets et souvent complexes, liés à la conception, à la réalisation et à la mise en œuvre de produits, de systèmes ou de...) de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche scientifique...) Marc Litaudon. Cette étape est uniquement informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement automatique de l'information par des machines telles que les ordinateurs, les...). À partir de l'utilisation d'un logiciel (En informatique, un logiciel est un ensemble d'informations relatives à des traitements effectués automatiquement par un appareil informatique. Y sont inclus les instructions de...) en accès libre sur le site "Global natural (Natural est un langage de programmation semi-compilé, édité par la société allemande Software AG.) product social molecular networking" (GNPS http://gnps.ucsd.edu) nous regroupons les molécules selon leur structure pour les représenter dans un espace à 2 dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce sont sa longueur, sa largeur et sa profondeur/son épaisseur, ou bien son diamètre si c'est une pièce de révolution.). Un peu comme si on reconstituait les constellations dans un ciel (Le ciel est l'atmosphère de la Terre telle qu'elle est vue depuis le sol de la planète.) étoilé." Ces constellations forment les fameux "réseaux moléculaires" qui représentent l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être...) du contenu moléculaire des espèces étudiées. Une fois les molécules organisées, les chimistes commencent l'enquête. L'application de différents filtres, biologique, taxonomique ou autres, permet alors de faire ressortir les constellations d'intérêt. Il ne reste plus qu'à sélectionner et isoler les perles rares. Quatre perles pour plusieurs milliers de possibilités dans le cas d'une première publication parue le 22 août 2017 dans les pages d'ACS Chemical Biology, suivi de la découverte de 5 autres molécules originales dans une deuxième publication parue le 7 juin 2018 (Org. Chem. Frontiers). D'autres publications sont en cours.

Contact chercheur:
Marc Litaudon, UPR2301 ICSN
Page générée en 0.418 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique