Que nous apprennent nos arbres généalogiques ?

Arbre de consanguinité.

En séquençant l’ADN de plusieurs individus d’une population et en comparant les mutations génétiques (c’est-à-dire, les changements ponctuels dans la chaîne de lettres que constitue l’ADN) portées par certains et pas d’autres, on peut obtenir une information partielle sur l’arbre généalogique qui les relie. Mais à quoi sert donc de reconstruire les relations généalogiques au sein d’une population ?

Tout comme nombre d’entre nous cherchent à retracer leur histoire familiale, les chercheurs en génétique essaient d’établir les liens généalogiques entre des individus d’un échantillon pris au hasard dans une population (humaine, animale, végétale, etc.). Ces recherches permettent de comprendre  les forces en action et donc de prédire quels sont les mécanismes importants de l’évolution génétique de cette population et d’en repérer les dangers potentiels. Par exemple, le fait que les familles royales européennes aient eu pendant longtemps tendance à se marier (et donc se reproduire) entre elles a fait apparaître une forte consanguinité entre ses membres. On sait aujourd’hui que la consanguinité favorise le maintien de gènes ayant un impact très négatif sur la santé des individus. Au contraire, les populations des campagnes étant plus mélangées, seuls les gènes octroyant un certain avantage reproductif à leurs porteurs ont eu une chance de survivre jusqu’à aujourd’hui.

Une bonne compréhension de la proximité généalogique entre les individus permet donc de détecter l’influence de certain facteurs d’évolution génétique liés à la compétition pour les ressources disponibles, à l’environnement, etc. Par ailleurs, comprendre ce qui a mené à la diversité génétique aujourd’hui permet de prédire le comportement futur de la population. Ces recherches aideraient éventuellement à prévoir l’impact de certains changements, comme le fractionnement de son habitat à cause de l’activité humaine (construction de routes, déboisage, etc.), le réchauffement climatique ou la compétition avec une nouvelle espèce invasive.

Le modèle mathématique le plus classique pour représenter et comprendre ces relations ancestrales dans une grande population de taille stable est le coalescent de Kingman. Ce modèle fait trois hypothèses. D’abord, il part du principe que le nombre de descendants de chaque individu est très petit par rapport à la taille totale de la population. De ce fait, aucun individu ne peut être responsable d’une fraction importante de la génération suivante. Ensuite, la population n’est pas structurée en sous-populations dans lesquelles les individus interagiraient davantage entre eux qu’avec les individus des autres communautés. Enfin, aucun individu n’a d’avantages sélectifs sur les autres et aurait ainsi une plus grande tendance à se reproduire.

Sur la base de ces différentes hypothèses, on peut alors montrer que le nombre de générations à remonter pour que deux individus (pris au hasard dans la population) trouvent un ancêtre commun est de l’ordre de N, i.e. la taille de la population. Ainsi, en moyenne les individus mettent très longtemps à arriver à un ancêtre en commun. On sait également décrire la manière dont des mutations apparaissent sur les génomes ancestraux, créant ainsi une diversité génétique au sein de la population.

Un exemple de coalescent. Les 8 individus sont échantillonnés au temps présent et au fur et à mesure qu’on remonte dans le temps, ils trouvent un ancêtre en commun (fusion de deux lignes) ou subissent une mutation (les points colorés). Ainsi, la diversité génétique au sein de l’échantillon est le fruit de la compétition entre la rapidité avec laquelle les individus ont un ancêtre en commun et celle à laquelle les mutations apparaissent sur leur génome.

Malgré ces hypothèses bien restrictives, ce modèle est d’une robustesse étonnante et s’applique à de nombreuses populations. A contrario, des observations trop éloignées des prédictions de ce modèle impliquent qu’au moins l’une des hypothèses n’est pas satisfaite. Par conséquent, il est actuellement le modèle le plus utilisé en génétique des populations pour trouver l’empreinte de certains facteurs d’évolution à partir d’un échantillon de séquences ADN.

 

Brève rédigée par Amandine Veber (École Polytechnique).

Pour en savoir plus :

Crédits Images : Wikimedia Commons, A.Veber.

3 Commentaires

Leave a Reply

Your email address will not be published. Required fields are marked *

*