Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Partenaires
Organismes
 CEA
 ESA
Sites Web
Photo Mystérieuse

Que représente
cette image ?
 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | +
Bio-informatique

On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de résoudre un problème scientifique posé par la biologie. Tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) comme l'informatique (L´informatique - contraction d´information et automatique - est le domaine d'activité scientifique, technique et industriel en rapport avec le traitement...) peut être considérée, suivant les situations, comme une science (La science (latin scientia, « connaissance ») est, d'après le dictionnaire Le Robert, « Ce que l'on sait pour l'avoir appris, ce que l'on tient pour vrai au sens large. L'ensemble de...) ou comme une technologie (Le mot technologie possède deux acceptions de fait :), le terme bioinformatique (par abus de langage) peut décrire toutes les applications informatiques résultant de ces recherches. Cela va de l'analyse du génome (Le génome est l'ensemble du matériel génétique d'un individu ou d'une espèce codé dans son ADN (à l'exception de certains virus dont le génome est porté par des...) à la modélisation de l'évolution d'une population animale dans un environnement (L'environnement est tout ce qui nous entoure. C'est l'ensemble des éléments naturels et artificiels au sein duquel se déroule la vie humaine. Avec les enjeux écologiques actuels, le terme environnement tend actuellement à prendre...) donné, en passant par la modélisation moléculaire (La modélisation moléculaire est un ensemble de techniques pour modéliser ou imiter le comportement de molécules.), l'analyse d'image, le séquençage (En biochimie, le séquençage consiste à déterminer l'ordre linéaire des composants d'une macromolécule (les acides aminés d'une protéine, les nucléotides d'un acide nucléique comme l'ADN, les...) du génome, la reconstruction d'arbres phylogénétiques (phylogénie), etc.

D'après Claverie :

La bioinformatique est constituée par l'ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise comme un...) des concepts et des techniques nécessaires à l'interprétation de l'information génétique (La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l'hérédité et les...) (séquences) et structurale (repliement 3D). C'est le décryptage de la " bio-information ". La bioinformatique est donc une branche théorique de la biologie (La biologie, appelée couramment la « bio », est la science du vivant. Prise au sens large de science du vivant, elle recouvre une partie des sciences naturelles et de l'histoire naturelle des êtres vivants...)[1].

Dans un sens (SENS (Strategies for Engineered Negligible Senescence) est un projet scientifique qui a pour but l'extension radicale de l'espérance de vie humaine. Par une...) encore plus étendu, on peut aussi inclure sous le concept de bioinformatique le développement d'outils de traitement de l'information basés sur des systèmes biologiques comme, par exemple, l'utilisation des propriétés combinatoires du code génétique (Le code génétique désigne le système de correspondance mis en jeu lors de la transformation de l'information génétique...) pour la conception d'ordinateurs à ADN permettant de résoudre des problèmes algorithmiques complexes.

Note: L'orthographe bioinformatique, sans trait d'union, est abusive et est calquée de l'anglais bioinformatics.

On peut aussi appeler cette discipline "biologie in silico", par analogie avec les termes "biologie in vitro" ou "biologie in vivo".

L'analyse de séquence

Alors que de plus en plus de séquences de génome, de transcriptome ou de protéome sont disponibles, la signification de la plupart de ces séquences reste à comprendre. La première difficulté a été d'organiser cette énorme masse (Le terme masse est utilisé pour désigner deux grandeurs attachées à un corps : l'une quantifie l'inertie du corps (la masse...) d'information et de la rendre disponible à l'ensemble de la communauté des chercheurs. Cela a été rendu (Le rendu est un processus informatique calculant l'image 2D (équivalent d'une photographie) d'une scène créée dans un logiciel de...) possible grâce à différentes bases de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.), accessibles en lignes, comme GenBank, UniProt, PDB, etc. (cf. liens en fin d'article).

Il faut ensuite développer des outils d'analyse de séquences afin de pouvoir déterminer leurs propriétés.

  • Recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances...) de protéines à partir de la traduction de séquences nucléiques connues. Celle-ci passe par la détermination des phases ouvertes de lecture d'une séquence nucléique et de sa ou ses traduction(s) probables.
  • Recherche de séquences dans une banque de données à partir d'une autre séquence ou d'un fragment de séquence. La technique la plus commune est le BLAST (BLAST (acronyme de basic local alignment search tool) est un algorithme utilisé en bio-informatique permettant de trouver les régions similaires entre deux ou plusieurs séquences de nucléotides ou d'acides aminés. Ce programme permet...).
  • Alignement de séquences : pour trouver les ressemblances entre deux séquences et déterminer leurs éventuelles homologies. Les alignements sont à la base de la construction de parentés suivant des critères moléculaires, ou encore de la reconnaissance de motifs particuliers dans une protéine (Une protéine est une macromolécule biologique composée par une ou plusieurs chaîne(s) d'acides aminés liés entre eux par des liaisons peptidiques. En général, on parle...) à partir de la séquence de celle-ci.

La bio-informatique (On regroupe sous le terme de bioinformatique un champ de recherche multi-disciplinaire où travaillent de concert biologistes, informaticiens, mathématiciens et physiciens, dans le but de résoudre un problème...) intervient aussi dans le séquençage, avec par exemple l'utilisation de puces à ADN ou biopuce.

La modélisation moléculaire

Les molécules de par leurs dimensions (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une pièce sont sa longueur, sa largeur et sa profondeur/son...) sont invisibles à tout moyen d'investigation direct tel que la microscopie (La microscopie est l'observation d'un échantillon (placé dans une préparation microscopique plane de faible épaisseur) à travers le microscope. La microscopie permet de rendre visible des...). C'est par l'analyse de données indirectes que les chercheurs peuvent reconstituer un modèle moléculaire, c'est-à-dire une construction intellectuelle présentant la meilleure adéquation avec les résultats expérimentaux. Ces données sont issues principalement d'analyses cristallographiques (étude des figures de diffraction (La diffraction est le comportement des ondes lorsqu'elles rencontrent un obstacle qui ne leur est pas complètement transparent ; le phénomène peut être interprété par la diffusion d'une onde par les points de l'objet. La...) des rayons X par un cristal), ou de résonance magnétique nucléaire (La résonance magnétique nucléaire est une technique de spectroscopie appliquée aux particules ou ensembles de particules atomiques qui ont un spin nucléaire non nul.). Elles représentent les contraintes expérimentales exercées sur le modèle. Le modèle moléculaire obtenu ensuite est un ensemble de coordonnées atomiques dans l'espace. L'informatique intervient dans toutes les étapes conduisant de l'expérimentation (L'expérimentation est une méthode scientifique qui consiste à tester par des expériences répétées la validité d'une hypothèse et à obtenir des données quantitatives permettant de l'affiner. Elle est pratiquée par un ou des chercheurs mettant en...) au modèle, puis ensuite dans l'analyse du modèle par la visualisation moléculaire (voir les protéines en 3D).

Elle est utilisée par exemple pour étudier les sites actifs d'une enzyme, mettre au point (Graphie) informatiquement une série d'inhibiteurs possibles pour cette enzyme, et ne synthétiser et ne tester que ceux qui semblent convenir. Cela permet de réduire les coûts de recherche et d'accélérer ces recherches.

La visualisation de la structure tridimensionnelle d'acides nucléiques (ARN et ADN) fait également partie de la palette des outils bio-informatiques très utilisés.

Encore un autre aspect est la prédiction de la structure 3D d'une protéine à partir de sa structure primaire (la liste des acides aminés qui la composent), en modélisant les différentes caractéristiques des acides aminés. Cela a un grand intérêt car la fonction, l'activité (Le terme d'activité peut désigner une profession.) d'une protéine dépendent grandement de sa forme. De même, la modélisation des structures 3D d'acides nucléiques (à partir de leur séquence nucléotidiques) revêt la même importance que pour les protéines.

Construction d'arbres phylogénétiques

On appelle gènes homologues des gènes descendant d'un même gène (Un gène est une séquence d'acide désoxyribonucléique (ADN) qui spécifie la synthèse d'une chaîne de polypeptide ou d'un acide ribonucléique...) ancestral. De façon plus spécifique, on dit de ces gènes qu'ils sont orthologues s'ils se retrouvent dans des espèces différentes (spéciation sans duplication), ou qu'ils sont paralogues s'ils se retrouvent chez la même espèce (Dans les sciences du vivant, l’espèce (du latin species, « type » ou « apparence ») est le taxon de base de la systématique....) (duplication à l'intérieur du génome).

Il est alors possible de quantifier la distance génétique entre deux espèces en comparant leurs gènes orthologues. Cette distance génétique est représentée par le nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) et le type de mutations qui séparent les deux gènes.

Appliquée à un nombre plus important d'êtres vivants, cette méthode permet d'établir une matrice des distances génétiques entre plusieurs espèces. Les arbres phylogénétiques rapprochent les espèces qui ont la plus grande proximité. Plusieurs algorithmes différents sont utilisés pour tracer des arbres à partir des matrices de distance. Ils reposent chacun sur des modèles de mécanismes évolutifs différents. Les deux méthodes les plus connues sont la méthode UPGMA et la méthode du Neighbour Joining.

La construction d'arbres phylogénétiques est utilisée par les programmes d'alignements multiples de séquences afin d'éliminer une grande partie des alignements possibles et de limiter ainsi les temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.) de calcul.

La modélisation de population

Source: Wikipédia publiée sous licence CC-BY-SA 3.0.

Vous pouvez soumettre une modification à cette définition sur cette page. La liste des auteurs de cet article est disponible ici.