La génétique des populations traite des fluctuations des fréquences des différentes versions d'un gène (allèles) au cours du temps dans les populations d'êtres vivants, sous l'influence de la sélection naturelle, de la dérive génétique, des mutations et des migrations. Ces différents facteurs sont appelés des « pressions évolutives ». Les fluctuations de fréquence des allèles sont la première étape de l'évolution. En effet, la fixation de certains allèles peut conduire à des adaptations. Par la suite, l'accumulation d'adaptations différentes dans différentes populations peut conduire au processus de spéciation.
La génétique des populations est une application, commencée dans les années 1920 à 1940 par Ronald Fisher, J. B. S. Haldane et Sewall Wright, des principes fondamentaux de la génétique mendélienne à l'échelle des populations. Cette application a permis de faire la synthèse entre la génétique mendélienne et la théorie de l'évolution, donnant ainsi naissance au néo-darwinisme (théorie synthétique de l'évolution).
La génétique des populations a des applications en épidémiologie où elle permet de comprendre la transmission des maladies génétiques, mais aussi en agronomie, où des programmes de sélection modifient le patrimoine génétique de certains organismes pour créer des races ou variétés plus performantes, ou plus résistantes à des maladies. Elle permet également de comprendre les mécanismes de conservation et de disparition des populations et des espèces (Génétique de la conservation).
C'est une discipline des sciences de la vie faisant un fort usage d'outils mathématiques.
Les êtres vivants et les êtres humains en particulier possèdent tous de l'ADN. L'étude de cet ADN pour une population et la comparaison de cet ADN avec l'ADN d'autres populations constituent la base de la génétique des populations.
Nous possédons 22 paires de chromosomes dit homologues (ou autosomes) et deux chromosomes dit sexuels (ou gonosomes). Par ailleurs, nous possédons aussi de l'ADN dit mitochondrial (ADN-mt ou mt-DNA en anglais) qui n'est pas à proprement parler un chromosome. Cet ADN-mt se transmet intégralement de la mère aux enfants. En revanche, seuls les hommes possèdent le chromosome sexuel appelé Y (ADN-Y ou Y-DNA en anglais) qui se transmet donc intégralement du père aux fils.
Notre ADN peut parfois muter, c'est-à-dire qu'un des éléments de base (58 millions de paires de bases pour l'ADN-Y et 16000 paires de bases pour l'ADN-mt) qui le constitue se transforme lors de la recopie de cet ADN. Le résultat de cette mutation s'appelle polymorphisme nucléotidique simple (SNP en anglais). Cette mutation arrive très approximativement une fois toutes les 25 à 500 générations pour l'ADN-Y pour l'ADN-mt (il n'y a pas de consensus à ce sujet).
Comme nous allons le voir ci-dessous, les mutations de l'ADN-Y et de l'ADN-mt sont utilisées pour caractériser des groupes de populations. Par ailleurs, ces deux ADN sont peu sujets à la sélection naturelle. Ils sont par conséquent particulièrement bien adaptés pour suivre l'évolution des populations.
Au début des années 2000, Spencer Wells(en) a conclu que tous les êtres humains vivants avaient au moins un ancêtre mâle et un ancêtre femelle en commun. Le plus récent de ces ancêtres mâle est appelé Adam Y-chromosomique (Y-MRCA pour Most Recent Common Ancestor) et le plus récent ancêtre femelle est appelé Eve mitochondrial (mt-MRCA). Il faut souligner que contrairement à l'Eve et l'Adam de la Bible, l'Adam Y-chromosomique et l'Eve mitochondriale ne sont pas les premiers ancêtres de l'humanité actuelle. De plus, Y-MRCA n'est pas forcément le seul ancêtre de l'humanité puisqu'il peut exister un ancêtre mâle n'ayant eut que des filles. De même, il peut exister un ancêtre femelle commun à l'humanité actuelle n'ayant donné que des fils.
Enfin, Y-MRCA et mt-MRCA ne se sont jamais rencontrés.
Dans la suite du paragraphe il n'est fait référence qu'aux lignées paternelles mais les explications sont les mêmes pour les lignées maternelles.
Le chromosome Y de cet Adam s'est transmis à ses descendants mâles. Certains des chromosomes Y de ses descendants ont subi une mutation. Cette mutation définit une nouvelle branche à laquelle on peut associer un nouvel ancêtre commun. Si le chromosome Y d'un des descendants de cette branche subit une nouvelle mutation, cela crée une nouvelle sous-branche et ainsi de suite. On peut ainsi définir l'arbre de la filiation paternelle de l'humanité.
Pour caractériser un chromosome on utilise des marqueurs génétiques. Il existe différents types de marqueurs, les plus utilisés sont
Pour mettre en évidence ces marqueurs génétiques on extrait l'ADN et on lui fait subir différents processus physico-chimiques.
En génétique des populations, chaque branche majeure s'appelle haplogroupe et chaque sous-branche majeure sous-haplogroupe. Le terme haplogroupe ou sous-haplogroupe n'est pas absolu, il est relatif à l'endroit étudié de l'arbre. La définition de cet arbre est loin d'être achevée si bien que la dénomination des haplogroupes change régulièrement. Une branche prend parfois le terme biologique de clade.
La plupart des études utilisent maintenant cet arbre généalogique de l'ADN-Y avec sa nomenclature associée. Cette nomenclature a été définie une première fois en 2002 par le Y Chromosome Consortium (YCC). Cet arbre comprend 15 haplogoupes majeurs (A, B, C, D, E, G, H, I, J, L, M, N, O, Q et R). Chaque sous-haplogroupe associé à son haplogroupe est nommé par le nom de son haplogroupe plus un numéro de sous-branche (exemple R1). Puis les sous-haplogroupes des sous-haplogroupes sont nommés avec la dénomination de son haplogroupe parent plus une lettre minuscule (exemple R1b) et ainsi de suite en alternant lettres et chiffres.
Une cartographie des haplogroupes des ADN-Y de l'ensemble des populations est en train d'être réalisée. Elle permet de mieux comprendre les migrations et les affinités des patrimoines génétiques paternels des populations humaines. Nous donnons ci-dessous la version française de l'arbre sur wikipedia mais nous recommandons au lecteur intéressé de consulter la version anglaise qui est mise à jour régulièrement.
Haplogroupes du chromosome Y (Y-ADN) | ||||||||||||||||||||||||||
| | ||||||||||||||||||||||||||
A | | | |||||||||||||||||||||||||
B | | | |||||||||||||||||||||||||
C | | | F | ||||||||||||||||||||||||
D | E | G | H | I | J | K | ||||||||||||||||||||
L | M | | | P | |||||||||||||||||||||||
N | O | Q | R | |||||||||||||||||||||||
Puisque les marqueurs SNP définissent la mutation d'une base, ils sont particulièrement bien adaptés pour définir les haplogroupes. Afin d'illustrer ceci revenons à l'exemple du marqueur SNP M35 correspond à l'haplogroupe E1b1b1b (pour le savoir il faut consulter l'arbre des filiations paternels de l'humanité). Cet haplogroupe est particulièrement fréquent dans les populations berbères. Il possède des sous-haplogroupes définis par d'autres marqueurs SNP.
Cette nomenclature évoluant encore, on associe presque systématiquement le marqueur SNP caractérisant l'haplogroupe à l'haplogroupe correspondant.
Les lignées paternelles d'une population sont caractérisées par la distribution d'haplogroupes de l'ADN-Y c'est-à-dire par l'ensemble et la proportion des haplogroupes que l'on trouve en son sein et par les haplotypes les plus fréquents de cette population.
La signature complète de l'ADN-Y d'un homme s'appelle en théorie haplotype. Cependant, ce terme est souvent employé abusivement et ne se référe généralement qu'à la signature partielle de l'ADN-Y.
Il existe plusieurs façons de caractériser un haplotype mais la façon largement la plus répandue est l'utilisation des marqueurs STR.
On définit parfois des haplotypes modèles. Un des plus fameux est le CMH (Cohen Modal Haplotype). Celui-ci est obsolète mais nous l'utilisons pour illustrer le concept. Il est défini par 6 marqueurs DYS. Si l'on teste l'ADN-Y d'un homme avec ces 6 marqueurs et que le nombre de répétitions de séquences pour chacun des marqueurs est la suivante alors on dit que cet homme réagit positivement au CMH.
| | | | | |
| | | | | |
Il était sensé définir l'haplotype de tous les Cohen et uniquement des Cohen. Mais on s'est aperçu que sa résolution n'était pas assez grande et de ce fait un très grand nombre d'être humains répondaient positivement au test. Un CMH étendu a été redéfini, il correspond bien uniquement à des Cohen mais à une partie seulement des Cohen.
Il existe d'autres haplotypes modèles comme l'Atlantic Modal Haplotype (AMH) ou haplotype 15 qui est porté par une très grande majorité d'hommes habitant l'ouest de l'Europe. Il y a parfois un accord entre un haplotype et un haplogroupe. C'est le cas du AMH qui n'est porté que par l'haplogroupe R1b et particulièrement par le sous-haplogroupe R1b1b2.
Il existe encore des auteurs utilisant d'autres techniques pour classifier l'ADN-Y des populations. On peut citer le système p49a,f qui est un RFLP (Restriction Fragment Lengh Polymorphism) utilisant l'enzyme TaqI pour couper ("restreindre") l'ADN. Il est encore pratiqué par le Professeur Lucotte à Paris. Cette sonde permet de définir un certain nombre d'haplotypes mais il est souvent difficile de faire le lien entre ce système et le système du YCC.
Enfin, en plus des études sur l'ADN-mt et l'ADN-Y, il existe de nombreuses études sur les chromosomes homologues. Dans ce cas, on ne regarde que la signature génétique des populations. Il ne peut y avoir d'arbre généalogique des chromosomes homologues puisque ces chromosomes se mélangent lors de la meiose. Par ailleurs, les chromosomes homologues sont sujets à la sélection naturelle ce qui pose des problèmes lorsqu'on compare des populations vivant dans des milieux différents.