Bio-informatique - Définition et Explications

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Introduction

La bio-informatique est un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de résoudre un problème scientifique posé par la biologie. Le terme bio-informatique (La bio-informatique est un champ de recherche multi-disciplinaire où travaillent de concert...) peut également décrire (par abus de langage) toutes les applications informatiques résultant de ces recherches.

Le terme bioinformatics a été forgé en 1979 par Paulien Hogeweg de l'université (Une université est un établissement d'enseignement supérieur dont l'objectif est la...) d'Utrecht, Pays-Bas, conjointement avec Ben Hesper. La définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la...) qu'ils lui ont donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...) est la suivante : l'étude des procédés informatiques dans les systèmes biotiques.

Cela va de l'analyse du génome (Le génome est l'ensemble du matériel génétique d'un individu ou d'une...) à la modélisation de l'évolution d'une population animale dans un environnement (L'environnement est tout ce qui nous entoure. C'est l'ensemble des éléments naturels et...) donné, en passant par la modélisation moléculaire (La modélisation moléculaire est un ensemble de techniques pour modéliser ou imiter...), l'analyse d'image, le séquençage (En biochimie, le séquençage consiste à déterminer l'ordre linéaire des...) du génome et la reconstruction d'arbres phylogénétiques (phylogénie). Cette discipline constitue la « biologie in silico », par analogie avec in vitro ou in vivo.

Cartographie du chromosome X (Le chromosome X est l'un des deux chromosomes sexuels de l'être humain et de certains animaux...) humain (tirée du site internet (Internet est le réseau informatique mondial qui rend accessibles au public des services...) du NCBI) ; le séquençage du génome humain représente une des plus grandes réalisations de la bio-informatique.

Définitions et champs d'application

La bioinformatique est constituée par l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection...) des concepts et des techniques nécessaires à l'interprétation informatique (L´informatique - contraction d´information et automatique - est le domaine...) de l'information biologique. Plusieurs champs d'application ou sous-disciplines de la bioinformatique se sont constitués :

  • La bioinformatique des séquences, qui traite de l'analyse de données issues de l'information génétique (La génétique (du grec genno γεννώ = donner naissance) est...) contenue dans la séquence de l'ADN ou dans celle des protéines qu'il code. Cette branche s'intéresse en particulier à l'identification des ressemblances entre les séquences, à l'identification des gènes ou de régions biologiquement pertinentes dans l'ADN ou dans les protéines, en se basant sur l'enchaînement ou séquence de leurs composants élémentaires (nucléotides, acides aminés).
  • La bioinformatique structurale, qui traite de la reconstruction, de la prédiction ou de l'analyse de la structure 3D ou du repliement des macromolécules biologiques (protéines, acides nucléiques), au moyen d'outils informatiques.
  • La bioinformatique des réseaux, qui s'intéresse aux interactions entre gènes, protéines, cellules, organismes, en essayant d'analyser et de modéliser les comportements collectifs d'ensembles de briques élémentaires du Vivant. Cette partie de la bioinformatique se nourrit en particulier des données issues de technologies d'analyse à haut débit (Le terme de haut débit (ou large bande par traduction littérale de l'expression anglosaxonne...) comme la protéomique ou la transcriptomique pour analyser des flux (Le mot flux (du latin fluxus, écoulement) désigne en général un ensemble d'éléments...) génétiques ou métaboliques.
  • La bioinformatique statistique (Une statistique est, au premier abord, un nombre calculé à propos d'un échantillon....) et la bioinformatique des populations

La bioinformatique est donc une branche théorique de la biologie.

Il s'agit en fait d'analyser, modéliser ou prédire les informations issues de données biologiques expérimentales.

Dans un sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but...) encore plus étendu, on peut aussi inclure sous le concept de bio-informatique le développement d'outils de traitement de l'information basés sur des systèmes biologiques comme, par exemple, l'utilisation des propriétés combinatoires du code génétique (Le code génétique désigne le système de correspondance mis en jeu lors de la...) pour la conception d'ordinateurs à ADN permettant de résoudre des problèmes algorithmiques complexes.

La modélisation moléculaire

Les macromolécules biologiques sont en général de dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce...) trop petites pour être accessibles à des moyens d'observation (L’observation est l’action de suivi attentif des phénomènes, sans volonté de les...) directs tel que la microscopie (La microscopie est l'observation d'un échantillon (placé dans une préparation microscopique...). C'est par l'analyse de données indirectes ou composites que les chercheurs peuvent reconstituer un modèle moléculaire, c'est-à-dire une reconstruction tridimensionnelle présentant la meilleure adéquation avec les résultats expérimentaux. Ces données sont issues principalement d'analyses cristallographiques (étude des figures de diffraction (La diffraction est le comportement des ondes lorsqu'elles rencontrent un obstacle qui ne leur est...) des rayons X par un cristal), de résonance magnétique nucléaire (La résonance magnétique nucléaire (RMN), aussi dénommée par son...), de cryomicroscopie électronique ou de techniques de diffusion (Dans le langage courant, le terme diffusion fait référence à une notion de...) aux petits angles (diffusion des rayons X ou diffusion des neutrons). Les données issues de ces expériences constituent des données (ou contraintes) expérimentales qui sont utilisées pour calculer un modèle de la structure 3D. Le modèle moléculaire obtenu peut être est un ensemble de coordonnées cartésiennes des atomes (Un atome (du grec ατομος, atomos, « que l'on ne peut...) composant la molécule (Une molécule est un assemblage chimique électriquement neutre d'au moins deux atomes, qui...), on parle alors de modèle atomique, ou une "enveloppe", c'est à dire une surface (Une surface désigne généralement la couche superficielle d'un objet. Le terme a...) 3D décrivant la forme de la molécule, à plus basse résolution. L'informatique intervient dans toutes les étapes conduisant de l'expérimentation (L'expérimentation est une méthode scientifique qui consiste à tester par des expériences...) au modèle, puis ensuite dans l'analyse du modèle par la visualisation moléculaire (voir les protéines en 3D).

Un autre volet de la modélisation moléculaire concerne la prédiction de la structure 3D d'une protéine à partir de sa structure primaire (l'enchaînement des acides aminés qui la composent), en prenant en compte les différentes propriétés physico-chimiques des acides aminés. Cela a un grand intérêt car la fonction, l'activité (Le terme d'activité peut désigner une profession.) d'une protéine dépendent de sa forme. De même, la modélisation des structures 3D d'acides nucléiques (à partir de leur séquence nucléotidique) revêt la même importance que pour les protéines, en particulier pour les structures d'ARN.

La connaissance de la structure tri-dimensionnelle permet d'étudier les sites actifs d'une enzyme (Une enzyme est une molécule (protéine ou ARN dans le cas des ribozymes) permettant...), mettre au point (Graphie) informatiquement une série d'inhibiteurs potentiels pour cette enzyme, et ne synthétiser et ne tester que ceux qui semblent convenir. Cela permet de réduire les coûts en temps (Le temps est un concept développé par l'être humain pour appréhender le...) et en argent (L’argent ou argent métal est un élément chimique de symbole Ag — du...) de ces recherches.

De même la connaissance de cette structure permet de faciliter l'alignement de séquences protéiques.

La visualisation de la structure tridimensionnelle d'acides nucléiques (ARN et ADN) fait également partie de la palette (La Palette est un café-restaurant situé dans le 6e arrondissement de Paris, au croisement...) des outils bio-informatiques très utilisés.

Page générée en 0.077 seconde(s) - site hébergé chez Amen
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
Ce site est édité par Techno-Science.net - A propos - Informations légales
Partenaire: HD-Numérique