Maximum de Parcimonie - Définition

Source: Wikipédia sous licence CC-BY-SA 3.0.
La liste des auteurs de cet article est disponible ici.

Type de Données traitées par Maximum de Parcimonie

Les jeux de données de Maximum de Parcimonie sont sous la forme de caractères pour un ensemble de taxa donné. Il n'y a pas de consensus général sur ce qu'est un caractère phylogénétique, mais, pratiquement, un caractère peut être un attribut, un axe dans lequel les taxas observés varient. Ces attributs peuvent êtres morphologiques, moléculaires / génétiques, physiologiques, comportementaux, etc. Le seul consensus est de considérer des variations de caractères héritables, car l'on vise à inférer des patrons évolutifs entre les unités opérationnelles considérées. La question de savoir si cette héritabilité doit être directe (un allèle par exemple), ou indirecte (un comportement appris, ou culturel) n'est ni consensuelle, ni résolue.

Chaque caractère est divisé en catégories discrètes ou états de caractères, dans lesquelles les variations observées peuvent être catégorisées. Les états de caractères sont souvent descriptifs du substrat considéré pour le caractère. Par exemple, le caractère « couleur des yeux » peut avoir les états bleu, marron, noir, etc. Les caractères considérés peuvent avoir un ou plusieurs états (ils peuvent n'en posséder qu'un seul, mais dans ce cas précis aucune variation n'étant observable, aucune information ne peut en être extraite, et pour cette raison sont généralement exclus de l'analyse).

Les caractères d'une analyse phylogénétique ne sont pas une science exacte, et il y a souvent plusieurs façons de traiter le même jeu de données. Par exemple, deux taxa peuvent présenter le même état de caractère, s'ils sont entre eux extrêmement proches qu'ils ne le sont des autres taxa, dans leur ensemble. Il est problématique de coder certains états de caractères, dont l'attribution à telle ou telle classe est ambigüe, voire subjective (par exemple des yeux verts, dans l'exemple précédent). Souvent un codage, différent, mais approprié dans le contexte de l'étude peut permettre de résoudre sans ambiguïté ce problème, pour des états de caractères comme la couleur des yeux. Par exemple les yeux verts peuvent être classés dans une nouvelle catégorie yeux clairs, comprenant également les yeux bleus ; et l'on fera de même une nouvelle catégorie yeux foncés, qui regroupera noir, marron, etc.

Ce genre d'ambiguïtés pour des données morphologiques, ou continues, sont souvent une source majeure de querelle, de confusion et d'erreur dans le traitement du jeu de données. Pour pallier ce genre d'attributions, un nouvel état de caractère peut être défini, notons-le « ? ». L'algorithme qui traitera le jeu de donnée ne considèrera pas cet état de caractère, pour cet individu, et l'erreur possible, mais pas systématique, pourra être évitée.

Les données moléculaires ou génétiques, sont particulièrement adaptées pour l'analyse phylogénétique, par Maximum de Parcimonie. En effet les états de caractères d'une séquence nucléotidique sont discrets : 4 bases et éventuellement un 5e état de caractère : une insertion/délétion. Ainsi, les quatre états de caractères retrouvés seront les 4 bases nucléotidiques à savoir l'adénine, la thymine (ou l'uracile pour une séquence d'ARN), la guanine, et la cytosine. Une insertion délétion peut être observée lors de l'alignement de séquences, dans ce cas on code avec un 5e état de caractère, généralement noté « - ». Cet état de caractère ne doit pas être confondu avec le ? qui signale une incertitude ou une donnée manquante, ou une aberration, etc. Ici, un indel est une donnée évolutive à part entière, pouvant être héritée, partagée avec d'autres espèces dérivées, etc. Il n'y a pas de consensus strict sur la façon de coder les indels, cependant, on voit l'assignation pour chaque caractère (chaque position sur la séquence d'ADN ou d'ARN, d'un état, est rarement ambigüe).

Les états de caractères peuvent être traités en les ordonnant ou pas. Pour un caractère binaire, de type présence vs. absence, cela ne fait aucune différence. En revanche, si l'on considère un caractère multi-états, et si l'on dispose d'un contexte en termes de nombres de pas évolutifs, alors on peut coder cela. Par exemple, dans un groupe de plantes, si l'on sait que la séquence blanc → pourpre pour la corolle passe nécessairement par l'état de caractère rose, alors on peut tirer un signal phylogénétique substantif en considérant la transition blanc → rose comme un pas évolutif, comme pour la transition rose → pourpre . La transition blanc → pourpre sera donc plus coûteuse en termes évolutifs.

Page générée en 0.096 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales
Version anglaise | Version allemande | Version espagnole | Version portugaise