Les génomes de centaines d'espèces éteintes reconstruits automatiquement

Publié par Redbran le 20/01/2023 à 13:00
Source: CNRS INSB
...
Une publication dans la revue Nature Ecology and Evolution décrit comment les scientifiques ont développé un nouvel algorithme appelé AGORA pour explorer l'évolution des génomes. Nourri de centaines de génomes modernes, AGORA a reconstruit automatiquement la structure partielle de celui de leurs ancêtres. Ce travail établit un cadre robuste pour comprendre l'évolution des génomes.

Nous l'oublions parfois, mais la biologie est une science (La science (latin scientia, « connaissance ») est, d'après le dictionnaire...) dite "historique", car elle s'appuie sur l'histoire du vivant. Ainsi, les génomes d'espèces ancestrales sont des témoins du passé (Le passé est d'abord un concept lié au temps : il est constitué de l'ensemble...) des organismes, au même titre que les fossiles, et ils sont essentiels pour retracer les changements qui ont eu lieu au cours de l'évolution, que ce soit au niveau des mutations à petite échelle aussi bien qu'au niveau des génomes ou des espèces.


Le panneau central représente des fragments de génomes d'espèces de vertébrés modernes. Chaque flèche représente un gène (Un gène est une séquence d'acide désoxyribonucléique (ADN) qui spécifie la...), dont la couleur (La couleur est la perception subjective qu'a l'œil d'une ou plusieurs fréquences d'ondes...) dénote l'appartenance à une même famille. Les deux fragments de génomes en haut sont des reconstructions inférées par AGORA pour l'ancêtre des vertébrés à mâchoires (Gnathostomes) et des vertébrés à squelette (Le squelette est une charpente animale rigide servant de support pour les muscles. Il est à la...) osseux (Euteleostomi). Les deux gènes (surlignée en jaune), ELK3 et CDK17, sont voisins dans tous les génomes de vertébrés séquencés, et à ce titre représentent la paire de gènes dont l'adjacence est la plus conservée dans ce groupe au cours de l'évolution, probablement en raison de contraintes biologiques fortes.
© Hugues Roest-Crollius

Bien qu'il soit possible aujourd'hui de séquencer directement l'ADN d'organismes partiellement préservés dans des conditions particulières, comme le permafrost, seuls les organismes qui vivaient il y a moins d'un million d'année (Une année est une unité de temps exprimant la durée entre deux occurrences d'un évènement lié...) sont accessibles par cette approche. Par comparaison, l'ancêtre des humains et des chimpanzés vivait il y a plus de 6 millions d'années. Ainsi, pour remonter plus loin dans le temps, il est nécessaire de recourir à des reconstructions par des approches informatiques, à partir de génomes modernes. Cette discipline est encore en émergence, et les reconstructions sont peu nombreuses et difficiles à utiliser, ce qui limite les possibilités de réaliser des analyses à grande échelle (La grande échelle, aussi appelée échelle aérienne ou auto échelle, est un...) pour obtenir une vue précise et globale de l'évolution de l'architecture (L’architecture peut se définir comme l’art de bâtir des édifices.) des chromosomes et des génomes au cours de l'évolution.

Un grand pas en avant dans ce domaine a été franchi grâce à un nouvel algorithme appelé AGORA, pour Algorithm for Gene Order Reconstruction in Ancestors. Cette méthode s'appuie avant tout sur les génomes d'espèces modernes, dont des centaines sont aujourd'hui disponibles dans les bases de données (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent...). Les scientifiques utilisent d'abord la séquence des gènes identifiés dans ces génomes pour reconstruire des familles de gènes qui descendent d'un même gène ancestral apparu à un moment donné de l'évolution.

Chaque famille peut compter des milliers de gènes, qui sont répartis dans des centaines de génomes appartenant à des espèces couvrant des centaines de millions d'années d'évolution. Par exemple, un gène apparu chez l'ancêtre des vertébrés sera aujourd'hui encore représenté par des versions modernes chez les poissons, les oiseaux et les mammifères. Chaque version est légèrement différente (En mathématiques, la différente est définie en théorie algébrique des...) des autres par sa séquence d'ADN à cause des mutations qui se sont produite au cours du temps, mais elles sont néanmoins reconnaissables par des logiciels de comparaison de séquences. L'étape suivante consiste à reconstruire l'histoire évolutive de chaque famille, grâce à des logiciels s'appuyant sur un formalisme mathématique aujourd'hui bien maîtrisé. C'est ensuite qu'AGORA entre en jeu.

Grâce à cette histoire évolutive et à la position des gènes modernes dans leurs génomes respectifs, l'ordre des gènes le long des chromosomes des espèces ancestrales est déduit à partir de celui des espèces modernes, chez qui il est partiellement préservé. L'algorithme s'appuie sur une structure en forme de graphe qui est parcouru de manière très efficace afin de déterminer quel gène est voisin de quel autre gène dans le génome (Le génome est l'ensemble du matériel génétique d'un individu ou d'une...) ancestral.

Les résultats publiés dans la revue Nature Ecology and Evolution décrivent comment AGORA a ainsi pu reconstruire la structure partielle de centaines de génomes ancestraux, une première. Les scientifiques s'en sont ensuite servis pour calculer la fréquence (En physique, la fréquence désigne en général la mesure du nombre de fois qu'un...) des réarrangements de chromosomes avec une précision inégalée. Cette ressource permet également d'avoir rapidement accès aux régions des génomes modernes qui ont la même structure que celle d'ancêtres extrêmement anciens. Si ces régions restent inchangées, c'est la signature probable d'une grande importance biologique. Ces travaux établissent donc un cadre solide pour l'étude de l'évolution de la structure des génomes, et ce faisant permettent de mieux prendre en compte la dimension (Dans le sens commun, la notion de dimension renvoie à la taille ; les dimensions d'une...) "historique" de la biologie.

Pour en savoir plus:
Reconstruction of hundreds of reference ancestral genomes across the eukaryotic kingdom.
Muffato, M., Louis, A., Nguyen, N.T.T. et al.
Nat Ecol Evol (2023). DOI:https://doi.org/10.1038/s41559-022-01956-z
Cet article vous a plu ? Vous souhaitez nous soutenir ? Partagez-le sur les réseaux sociaux avec vos amis et/ou commentez-le, ceci nous encouragera à publier davantage de sujets similaires !
Page générée en 0.064 seconde(s) - site hébergé chez Contabo
Ce site fait l'objet d'une déclaration à la CNIL sous le numéro de dossier 1037632
A propos - Informations légales | Partenaire: HD-Numérique