Évolution biologique et ADN ancien

Ambitions passées et avancées actuelles

Quand furent publiées au milieu des années 80 les deux premières séquences d’ADN ancien, respectivement celle d’une momie humaine vieille de 2 400 ans [ 1] et celle d’un quagga taxidermisé (équidé proche du zèbre disparu au cours du xix^e siècle) [ 2], l’enthousiasme de la communauté scientifique fut extrême. La paléogénétique allait remplir le même rôle à l’égard des phylogénies moléculaires que la paléontologie à l’égard des phylogénies morphologiques : elle offrait l’opportunité rare d’incorporer des représentants historiques réels (et non des hypothèses analytiques) dans la reconstitution de l’histoire des lignées évolutives. Les ambitions portaient même sur l’évolution des gènes au cours du temps et donc sur la possible compréhension de l’évolution des génomes.

Cependant, entre 1990 et 1994, pas moins d’une dizaine de publications spectaculaires paraissent : on prétend tour à tour avoir extrait de l’ADN de végétaux vieux de plusieurs millions d’années [ 3], d’insectes de l’ère secondaire piégés dans l’ambre [ 4], et même d’os de dinosaure vieux de 80 millions d’années [ 5]. Hélas, les vérifications ultérieures discréditeront ces résultats et entacheront durablement la réputation de cette discipline émergente [ 6– 8].

Le spectre de la contamination

En effet, l’efficacité de la méthode de PCR s’est rapidement révélée le plus grave facteur d’erreur d’une recherche dont les praticiens ont parfois cédé aveuglément à leur enthousiasme. Si la sensibilité de la PCR en fait un outil extrêmement puissant pour amplifier l’ADN à partir d’un nombre dérisoire de copies, cette efficacité s’exerce indifféremment sur les molécules d’ADN endogènes aux tissus anciens et sur les molécules exogènes contaminantes, qui les surclassent en nombre et dont l’amplification est consécutivement plus probable.

Aujourd’hui, les cas de contamination n’ont pas disparu, mais la communauté scientifique, échaudée par ces déconvenues, a revu ses exigences à la hausse. Une vérification et un tri plus rigoureux des séquences produites assurent un contrôle plus efficace de leur qualité. La légitimité scientifique doit répondre maintenant à différents critères, des règles propres aux méthodes d’investigation en paléogénétique qui ont été fixées dès le début des années 90 [ 9, 10], comme la reproduction des expérimentations dans des laboratoires différents ou, encore, la cohérence des résultats. Dans les faits, il demeure cependant impossible d’affirmer qu’une séquence d’ADN est issue de molécules endogènes au matériau ancien ; les règles instiguées permettent uniquement d’éliminer une part importante des risques d’erreurs pouvant être commises au cours du processus opératoire. La qualité des séquences produites peut donc être vue comme proportionnelle au degré de stringence des règles adoptées par leurs auteurs.

Malgré la rigueur des critères d’authenticité, le nombre de publications au cours des vingt dernières années est en constante augmentation. Ainsi, près de cent cinquante taxons spécifiques différents ont fait l’objet d’au moins une analyse (Figure 1).

Figure 1.

É volution de l’activité en ADN ancien en vingt ans (1984-2004). Histogrammes : nombre de publications en ADN ancien par an ; courbe : nombre cumulatif d’espèces soumises à des études d’ADN ancien.

Mammouths, Afrique et Asie…

La pertinence des phylogénies moléculaires est le fruit d’un équilibre délicat entre le nombre d’individus (ou d’espèces) et la taille des séquences considérées : plus le nombre de séquences prises en compte est élevé, plus on pourra espérer reconstruire efficacement la phylogénie du groupe d’intérêt. L’apport de séquences anciennes permet parfois de combler des échantillons biologiques dans des groupes qui ont été largement décimés au cours du temps. Néanmoins, augmenter le nombre de séquences ne supprime pas entièrement le problème : les tailles de séquences sont également déterminantes. La plupart des séquences anciennes disponibles jusqu’au début des années 2000 ne comportaient qu’un nombre réduit de sites, qui limitaient la portée des comparaisons avec les taxons actuels.

À cet égard, le cas des mammouths et de leurs relations avec les éléphants actuels est exemplaire de l’apport des séquences anciennes, mais aussi des limites liées à toute utilisation d’une partie seulement du génome. D’un point de vue morphologique, on les associe classiquement aux éléphants d’Asie. Toutefois, les premières séquences d’ADN des mammouths [ 11] semblaient plutôt les rapprocher des éléphants d’Afrique. Le mammouth laineux a ainsi « joué au yoyo », étant associé, au gré des publications, soit aux éléphants d’Asie [ 12], soit aux éléphants d’Afrique [ 13], soit aux deux [ 14– 15]. Au début des années 2000, grâce à des séquences plus nombreuses, à l’affinement des analyses et à la mise en évidence de contaminations dans les jeux de données précédents, l’hypothèse d’un rapprochement entre mammouth et éléphant d’Afrique s’est affirmée [ 16]. Cependant, la publication du génome mitochondrial complet du mammouth laineux [ 17] a relancé le débat en multipliant par 10 l’information génétique dont on disposait à propos de cet animal : les relations de parenté inférées à partir de ce génome associent le mammouth laineux aux éléphants d’Asie, conformément aux hypothèses des morphologistes du XIX^e siècle. Là encore, pourtant, l’échantillonnage taxinomique demeure très imparfait, l’écrasante majorité des proboscidiens¹ fossiles ne pouvant être intégrée à une phylogénie moléculaire, à l’exception des mastodontes, pour lesquels les données paléogénétiques se limitent, pour le moment, à une séquence douteuse de 230 paires de bases. Cet exemple souligne la nécessité de traiter les fragments d’ADN les plus longs possibles pour le matériel ancien, afin de produire des inférences phylogénétiques robustes. Ce débat, déclenché à propos des ADN modernes au cours des années 90, fait aujourd’hui son chemin parmi la communauté des paléogénéticiens, qui a parfois manqué de recul dans la discussion de la portée phylogénétique des séquences d’ADN ancien, tout exceptionnelles fussent-elles.

Après avoir longtemps été confinée à l’étude de petits fragments d’ADN de spécimens isolés, la paléogénétique affiche aujourd’hui fermement ses ambitions, qui reposent sur l’amélioration constante (au gré des perfectionnements techniques) des données analysées. Qualitativement d’abord, les progrès ont été spectaculaires, du fait de l’amélioration de notre compréhension des mécanismes à l’œuvre dans la dégradation post-mortem des molécules d’ADN en fonction des conditions du milieu. Quantitativement aussi, et surtout, puisque de fragments uniques de cent à trois cents nucléotides d’ADN mitochondrial, on est passé aujourd’hui à des gènes complets, voire à des génomes mitochondriaux, en mettant notamment à profit la méthode de PCR multiplex [17]. Le génome nucléaire n’est pas en reste, en dépit de la préservation médiocre de ce type d’ADN (présentant une seule copie par cellule, généralement dégradée par les nucléases endogènes) par rapport au génome mitochondrial (plusieurs centaines à plusieurs milliers de ces organites selon le type cellulaire considéré) : des gènes multicopies (protéines histones, [ 18]) et même simple copie sont désormais étudiés [ 19]. Bien plus, une approche de paléogénomique récente [ 20] a permis de séquencer plus de 28 millions de nucléotides du génome du mammouth, soit 100 000 fois plus que l’information disponible il y a quinze ans, et 5 000 fois plus que le contenu total du génome mitochondrial.

Ratites, moas et Nouvelle-Zélande

Les ratites constituent un groupe d’oiseaux terrestres de grande taille, incapables de voler, ayant un long cou et des pattes très puissantes adaptées à la course. Ce groupe comporte 10 espèces actuelles : l’autruche d’Afrique (Struthio camelus), 2 espèces de nandous en Amérique du Sud (Rhea), 3 de casoars (Casuarius) ainsi que l’émeu (Dromaius) en Nouvelle-Guinée et Australie, et 3 espèces de kiwis (Apteryx) en Nouvelle-Zélande.

À ces espèces actuelles, il convient d’ajouter des espèces récemment éteintes (quelques siècles) du fait de l’activité prédatrice humaine : les moas de Nouvelle-Zélande (11 espèces d’herbivores pouvant atteindre 3 m de haut pour 200 kg, et disparus au XV^e siècle) et les oiseaux-éléphant de Madagascar (2 espèces, Aepyornis mullerornis et surtout Aepyornis maximus, éteint dans les années 1600).

Dès les premières études d’ADN ancien [ 21] effectuées à partir de 400 pb de l’ARN ribosomique 12S de 4 espèces de moas, la monophylie des moas et des kiwis a été remise en cause, ouvrant des perspectives biogéographiques inédites (Figure 2). Les kiwis apparaissent plus proches des ratites d’Australie, de Nouvelle-Guinée et d’Afrique (autruches, émeus, casoars) que des moas. Les nandous et les moas forment chacun des groupes monophylétiques qui auraient rapidement divergé des autres ratites : les nandous d’Amérique du Sud se seraient séparés en premier, ce qui suggère une origine sud-américaine pour les ratites, hypothèse confirmée par la paléontologie. Par ailleurs, la colonisation de la Nouvelle-Zélande se serait faite par 2 lignées indépendantes d’ancêtres des ratites (moas et kiwis). Ce résultat initial a été confirmé par des études plus récentes et exhaustives [ 22], incluant le génome mitochondrial complet de deux espèces éteintes de moas, Emeus crassus et Dinornis giganteus.

Figure 2.

Phylogénie moléculaire des ratites. Les recherches en ADN ancien ont bouleversé notre idée de la parenté entre les lignées d’oiseaux aptères de Nouvelle-Zélande, en démontrant que les moas fossiles ne sont pas les plus proches parents des kiwis actuels. Cette hypothèse suppose une colonisation indépendante de l’archipel par ces deux lignées, celle des kiwis ayant atteint cette région secondairement.

Approches populationnelles

Depuis quelques années, l’augmentation des données de séquences a emprunté une autre voie en se focalisant non plus sur un (ou quelques) spécimen(s) isolé(s), mais sur l’échantillon d’individus le plus large et le plus représentatif de l’histoire récente d’une espèce. Les préoccupations de ces analyses, plutôt que la systématique d’un groupe, se concentrent donc sur l’histoire des « populations »².

Les représentants de la faune de la période glaciaire en sont des exemples récurrents. Les variations climatiques au cours du pléistocène sont interprétées comme des facteurs importants de vicariance (fragmentation de l’aire de répartition du groupe souche) et de divergence des espèces distribuées dans la zone d’influence glaciaire. Mais les restes actuels de cette faune sont souvent très épars, de sorte que la prise en compte exclusive des populations actuelles ne permet pas de recomposer efficacement leur histoire. C’est notamment le cas pour les bisons [ 23], les ours bruns [ 24], les manchots d’Adélie [ 25] et les moas [ 26], des espèces qui ont toutes été le sujet d’une analyse phylogéographique incluant plusieurs dizaines de représentants fossiles (respectivement plus de 400, 70, 96 et 125 individus) réparties entre - 150 000 ans et l’époque moderne.

Ces études ont démontré la nature dynamique des phénomènes de colonisation, d’extinction locale et de goulets d’étranglements qui ont produit la structure des populations modernes. Elles ont mis en évidence des trajectoires phylogéographiques beaucoup plus riches et complexes que ne le laissait présager l’examen des données relatives aux populations actuelles. Bouclant la boucle, ces analyses populationnelles apportent en retour des informations déterminantes pour la reconstitution des paléo-environnements.

Domestication animale et végétale

Le choix des espèces traitées dans les approches paléo-populationnelles peut également être orienté pour répondre à d’autres questions, notamment dans le cadre de l’étude de l’histoire de la domestication. La domestication des espèces animales et végétales est interprétée aujourd’hui comme un processus majeur dans la structuration socio-économique de l’homme moderne, depuis les chasseurs-cueilleurs du pléistocène jusqu’à la sédentarisation des fermiers du néolithique.

La paléogénétique peut apporter des réponses en relation à la fois avec l’évolution des espèces domestiquées et avec l’histoire des peuplements humains préhistoriques. L’étude du cas du cochon [ 27] a permis de révéler que cet animal a connu plusieurs phases de domestication en Eurasie, à partir d’un centre de dispersion sur les îles de l’est asiatique (Figure 3). Les données d’ADN ancien nous permettent de dresser un patron géographique : les centres de dispersion et de domestication des espèces sont identifiés, et les éventuelles extinctions de populations, voire d’espèces, sont documentées [ 28]. Les hypothèses classiques peuvent être testées : dans le cas du cochon, les données paléogénétiques identifient des centres de domestication en nombre bien supérieur aux hypothèses prévalentes, et démontrent que les populations domestiques européennes ne sont pas issues d’une importation de cochons domestiques du Proche-Orient, mais bien de la domestication de porcs européens.

Figure 3.

Histoire biogéographique des cochons sauvages et domestiques de l’Ancien Monde. Cette histoire est largement renseignée par les données génétiques obtenues à partir de spécimens subfossiles et de collection. À partir d’une origine indonésienne, la colonisation Europe-Asie s’est faite de façon séparée en deux ensembles est et ouest (modifié d’après [27]).

Le patron temporel que les données paléogénétiques sous-tendent est avant tout relatif : il permet d’ordonner les événements dans une séquence orientée dans le temps, mais leur datation précise demeure hautement spéculative, du fait de l’imprécision des horloges moléculaires et d’erreurs potentielles à ce niveau d’analyse [ 29].

Dans tous les cas, l’intégration des données obtenues sur différentes lignées animales et végétales nous renseigne sur les relations historiques entre les populations humaines du quaternaire.

Les études paléogénétiques menées sur les espèces domestiques nous permettent aussi, désormais, d’analyser ces lignées sous l’angle du phénotype. Une étude portant sur le maïs cultivé retrouvé dans un tombeau vieux de 4 400 ans [ 30] a permis de démontrer qu’il existait déjà, dans le génome de cette variété, des allèles comparables à ceux du maïs moderne pour des marqueurs moléculaires sélectionnés par l’homme dans les variétés cultivées… ce à peine deux mille ans après la domestication du maïs à partir de lignées sauvages de téosinte : après la phase de domestication, la sélection des variétés de maïs pour des traits phénotypiques avantageux s’est donc effectuée très rapidement. Là encore, l’argument biologique rejaillit sur notre connaissance de l’histoire de la lignée humaine.

Perspectives en évolution moléculaire

Le champ d’analyse de l’évolution moléculaire est sans doute celui qui a le moins profité des développements paléogénétiques à ce jour, un état de fait qui, néanmoins, pourrait rapidement changer. De façon inattendue, les analyses menées sur de vastes échantillons paléo-populationnels de la faune glaciaire ont révélé un patron de distribution de la variabilité génétique comparable entre les espèces, avec une accumulation de variants très au-delà des taux de polymorphisme à long terme attendus entre les espèces.

Autant dire que l’équipe d’Alan Cooper qui a dirigé ces études [29] n’est pas loin de remettre en cause la théorie de l’évolution moléculaire neutre de Motoo Kimura. Elle a démontré, de façon indépendante dans plusieurs lignées d’oiseaux et de primates, qu’il est possible de distinguer un taux de mutations à court terme (inférieur à un million d’années) très supérieur au taux de mutations classique, à long terme : une part non négligeable des variants produits à court terme seraient donc secondairement effacés du registre moléculaire. Cela signifierait que, à cette échelle de temps, la part des variants réellement neutres dans l’évolution moléculaire n’est pas aussi écrasante que le laisserait penser la théorie neutraliste : une fraction très importante du polymorphisme serait plutôt faiblement délétère, et succomberait donc au filtre de la sélection. David Penny [ 31] propose que la courbe en « J » du polymorphisme serait ainsi le fruit de l’élimination différentielle de mutants plus ou moins neutres : l’hécatombe moléculaire se ferait à un rythme d’autant plus rapide que les mutations seraient délétères, des mutants faiblement délétères (« quasi-neutres ») pouvant être maintenus dans les populations naturelles sur une échelle de temps relativement longue. Les mutants véritablement neutres, ignorés par cette hécatombe moléculaire, ne produiraient ainsi que le bruit de fond du polymorphisme des lignées maintenu sur le long terme.

Si les mécanismes à l’origine de cette diversité moléculaire en excès ne sont pas encore identifiés avec certitude, il paraît aujourd’hui invalide d’utiliser les taux d’évolution moléculaire classique à une échelle temporelle très courte. Plus encore, il semble pratiquement impossible de calibrer un taux d’évolution moléculaire pour un temps de divergence inférieur au million d’années : de fait, ce taux varie rapidement au cours de la période considérée, contrairement aux limites théoriques qui lui sont imposées par l’équilibre mutation/dérive dans un modèle de coalescence simple [ 32], décroissant rapidement jusqu’à atteindre le taux attendu entre espèces séparées au-delà d’un à deux millions d’années.

Conclusions

Malgré les progrès réalisés, la paléogénétique demeure un champ d’investigation extrêmement limité dans les dimensions de l’espace et du temps. Aussi, si certains s’enthousiasment quant à l’éventualité de la recherche d’ADN dans des roches martiennes, ou dans les corps d’insectes momifiés dans l’ambre du crétacé, il est bien peu probable que ces recherches dépassent un jour le niveau de vulgaires effets d’annonces.

En effet, les constats sont là : dans les conditions enregistrées dans l’environnement terrestre depuis l’apparition de la vie, on estime aujourd’hui qu’il est possible de retrouver des fragments amplifiables de macromolécules d’ADN jusqu’à 100 000 ans, voire 1 million d’années, soit durant une fraction de temps qui couvre le dernier 1/5000^e (0,0002 %) de l’histoire de la biosphère… une peccadille pour les biologistes évolutionnaires. Néanmoins, si l’on considère que c’est durant cette fraction de temps que l’impact de la lignée humaine a profondément modifié, à tous les niveaux, le macro-écosystème terrestre, on peut s’attendre à ce que la recherche future en ADN ancien continue d’enrichir la vision de notre existence passée.

Footnotes

Article reçu le 21 septembre 2005, accepté le 23 janvier 2006.

¹ Du grec proboskis qui signifie trompe

² L’emploi du terme population est ici un abus de langage, les lignées considérées étant intégrées à la fois dans l’espace et dans le temps.