Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Photo Mystérieuse

Que représente
cette image ?
Posté par Isabelle le Lundi 18/01/2016 à 12:00
Quand l'ordinateur facilite la découverte de nouveaux médicaments

Illustration: CGM webportal
En recherche, l'apprentissage automatique est de plus en plus utilisé pour détecter des tendances dans les ensembles de données complexes.

La découverte des médicaments de l'avenir pourrait reposer sur le travail des ordinateurs. Comme le démontre une étude de validation de principe publiée dans Cell Systems le 23 décembre dernier (1), un ordinateur (Un ordinateur est une machine dotée d'une unité de traitement lui permettant d'exécuter des programmes enregistrés. C'est un ensemble de circuits électroniques permettant de manipuler...) disposant de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) suffisantes sur les levures infectieuses peut apprendre à trouver des combinaisons de composés déjà connus ou jusqu'alors inconnus pouvant agir en synergie comme agents antifongiques. Bien qu'elle reste à perfectionner, cette méthode représente une nouvelle approche dans la lutte contre les maladies infectieuses, en permettant potentiellement de trouver rapidement les combinaisons d'agents qui contribueraient à vaincre la résistance aux médicaments.

Nous ignorons toujours dans quelle mesure les combinaisons de composés chimiques nouvellement découvertes agiront dans le traitement des infections aux levures chez les animaux ou les êtres humains. Toutefois, l'équipe de chercheurs a retenu 18 combinaisons potentielles pour traiter les infections aux levures pathogènes chez l'humain dans des récipients de laboratoire. Leur taux de réussite élevé confirme que ces combinaisons pourraient donner lieu à la mise au point (Graphie) de médicaments. Certaines des combinaisons se sont notamment avérées inoffensives pour les lignées cellulaires humaines.

"Notre étude montre qu'il est possible d'utiliser des modèles relativement simples, mais constitués d'éléments extrêmement complexes, comme les levures, pour mieux comprendre comment les composés chimiques et les médicaments interagissent avec des systèmes biologiques, indique Mike Tyers, professeur de biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des sciences naturelles et de l'histoire naturelle des êtres vivants...) des systèmes à l'Université (Une université est un établissement d'enseignement supérieur dont l'objectif est la production du savoir (recherche), sa conservation et sa transmission (études supérieures). Aux...) de Montréal (Montréal est à la fois région administrative et métropole du Québec[2]. Cette grande agglomération canadienne constitue un centre majeur du commerce, de l'industrie, de la culture, de la finance et des...) et auteur principal de l'étude. Ces concepts pourront certainement être appliqués à des problèmes plus épineux en santé (La santé est un état de complet bien-être physique, mental et social, et ne consiste pas seulement en une absence de maladie ou d'infirmité.) humaine."

Des ordinateurs qui apprennent

Dans plusieurs domaines de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension...), les équipes utilisent maintenant l'apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances, compétences, d'attitudes ou de valeurs culturelles, par l'observation, l'imitation,...) automatique (L'automatique fait partie des sciences de l'ingénieur. Cette discipline traite de la modélisation, de l'analyse, de la commande et, de la régulation des systèmes dynamiques. Elle a...) pour détecter des tendances dans les ensembles de données complexes, par exemple pour reconnaître des images sur le Web ou dans des systèmes de commande (Commande : terme utilisé dans de nombreux domaines, généralement il désigne un ordre ou un souhait impératif.) robotique.

"Cette façon de faire s'est accentuée récemment dans le secteur des sciences biologiques, où les chercheurs mettent de plus en plus à profit l'apprentissage automatique pour interpréter les énormes ensembles de données à l'échelle du génome (Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce codé dans son ADN (à l'exception de certains virus dont le génome est...), souligne Jan Wildenhain, développeur (En informatique, un développeur (ou programmeur) est un informaticien qui réalise des logiciels en créant des algorithmes et en les mettant en œuvre dans un...) de systèmes à l'Université d'Édimbourg et l'un des premiers auteurs de l'étude. Les données biologiques sont devenues tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) simplement trop nombreuses pour que nous puissions les traiter en nous en remettant seulement à l'intuition humaine."

Pour leur premier algorithme d'apprentissage automatique, les chercheurs ont utilisé la levure (Une levure est un champignon unicellulaire apte à provoquer la fermentation des matières organiques animales ou végétales. Les levures sont employées pour la fabrication du...) de bière (S. cerevisiae), car il s'agit de la seule levure dont le réseau (Un réseau informatique est un ensemble d'équipements reliés entre eux pour échanger des informations. Par analogie avec un filet (un réseau est un « petit rets », c'est-à-dire un petit filet), on appelle nœud (node) l'extrémité...) génétique (La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l'hérédité et...) est connu. Ainsi, bien que les bactéries (Les bactéries (Bacteria) sont des organismes vivants unicellulaires procaryotes, caractérisées par une absence de noyau et d'organites. La plupart des bactéries possèdent une paroi cellulaire...) résistantes aux médicaments représentent actuellement le principal enjeu de santé publique (La santé publique peut être définie de diverses manières. On peut en effet la présenter comme « l'étude, d'une part, des déterminants physiques, psychosociaux et...), le modèle des levures offre un ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un tout », comme...) de données beaucoup plus grand et informatif pour ce type d'étude.

Les chercheurs ont commencé par entrer dans l'ordinateur les données génétiques tirées des décennies de recherche sur les levures (soit un ensemble de 195 souches génétiquement différentes) et les réponses génétiques de ces souches soumises à des écrans chimiques (un ensemble diversifié de 4915 composés a été utilisé), de sorte que l'ordinateur puisse concevoir des modèles à partir des interactions entre les composés chimiques et les gènes. Les données n'étaient toutefois pas suffisantes, et l'algorithme initial avait un faible pouvoir prédictif.

"À cette étape du projet (Un projet est un engagement irréversible de résultat incertain, non reproductible a priori à l’identique, nécessitant le concours et l’intégration d’une grande diversité de contribution, et...), nous étions extrêmement déçus et nous sommes retournés à la planche à dessin, affirme Michaela Spitzer, boursière de recherche postdoctorale à l'Université McMaster et aussi première auteure de l'étude. Nous savions que les structures chimiques et le réseau génétique des cellules devaient jouer un rôle dans les effets synergiques chimiques que nous détections expérimentalement. Cependant, nous ne savions pas clairement comment procéder à la déconvolution de ces liens à partir de centaines de milliers de points de données. Finalement, nous avons dû revoir nos modèles plusieurs fois en fonction des ensembles de données servant à la préparation des algorithmes, puis mettre à l'essai les modèles dans différentes banques de composés que le modèle n'avait jamais obtenus auparavant."

La base de données ChemGRID, une ressource

Les algorithmes ont été préparés avec un ensemble de 1221 composés uniques ayant servi à créer et à tester 8128 combinaisons. Toutes les données de l'étude peuvent être téléchargées et examinées sans restriction à partir de la base de données ChemGRID.

"Nous espérons que d'autres groupes testeront nos modèles, tout comme nous continuerons très certainement de le faire. Peut-être même que quelqu'un en viendra à créer de meilleurs modèles, souhaitent Michaela Spitzer et Jan Wildenhain. Il serait très intéressant d'appliquer notre approche d'apprentissage automatique à des ensembles de données totalement différents pour prédire les synergies."

En plus de collaborer avec d'autres laboratoires, le groupe prévoit mettre en place une approche d'apprentissage automatique semblable pour se pencher sur les interactions entre les composés chimiques et les gènes dans les cellules humaines à l'aide de la technologie (Le mot technologie possède deux acceptions de fait :) d'édition génique CRISPR/Cas9. En recueillant ces données, l'équipe pourrait créer un algorithme qui prédirait les combinaisons de composés chimiques capables de distinguer les cellules saines de celles qui sont malades, comme les cellules cancéreuses.

Ces travaux ont été rendus possibles grâce au soutien des chaires de recherche du Canada en études moléculaires des antibiotiques, et en biologie des systèmes et biologie synthétique, à la subvention (Une subvention est une aide financière, c’est-à-dire une somme d’argent, qui est allouée par une institution publique ou privée à une personne ou une organisation privée ou...) International Research Scholar du Howard Hughes Medical Institute, à la subvention Royal Society Wolfson Research Merit Award, au soutien de la Scottish Universities Life Sciences Alliance Research Chair, à des bourses des Instituts de recherche en santé du Canada, du Conseil européen de la recherche, du Wellcome Trust, des National Institutes of Health, à une subvention du ministère de l'Éducation, de l'Enseignement (L'enseignement (du latin "insignis", remarquable, marqué d'un signe, distingué) est une pratique d'éducation visant à développer les connaissances d'un élève par le...) supérieur et de la Recherche du Québec par l'entremise de Génome Québec et à l'appui de l'Office of the Assistant Secretary of Defense for Health Affairs des États-Unis par l'entremise du Breast Cancer (Le cancer est une maladie caractérisée par une prolifération cellulaire anormalement importante au sein d'un tissu normal de l'organisme, de telle...) Research Program.

Note:
(1). J. Wildenhain et autres, "Prediction of Synergism from Chemical-Genetic Interactions by Machine Learning",Cell Systems,2015.


Commentez et débattez de cette actualité sur notre forum Techno-Science.net. Vous pouvez également partager cette actualité sur Facebook, Twitter et les autres réseaux sociaux.
Icone partage sur Facebook Icone partage sur Twitter Partager sur Messenger Icone partage sur Delicious Icone partage sur Myspace Flux RSS
Source: Université de Montréal