Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 34(12): 1087–1091.
doi: 10.1051/medsci/2018300.

Des virus géants créateurs de leurs propres gènes ?

Jean-Michel Claverie,1* Chantal Abergel,1 and Matthieu Legendre1

1Aix-Marseille université et CNRS, Information génomique et structurale (IGS), UMR7256, Institut de microbiologie de la Méditerranée-IMM-FR 3479, parc scientifique de Luminy, 163, avenue de Luminy, case 934, 13288Marseille Cedex 09, France
Corresponding author.
 

inline-graphic msc180203-img1.jpg

Vignette (Photo © CNRS-IGS). Coupe ultrafine de particule de Pandoravirus (microscopie électronique).

L’histoire des virus géants a débuté en 2003, avec la publication de la nature virale et la description détaillée de Mimivirus [1, 2]. Par la taille de sa particule (0,7 µm de diamètre) et celle de son génome de plus d’un million de nucléotides, Mimivirus démontrait qu’aucune loi biologique n’interdisait à un virus d’être aussi complexe qu’une cellule bactérienne. Depuis, les découvertes successives ont constitué une véritable saga, avec l’apparition continuelle de nouveaux personnages, de familles (virales) sans cesse recomposées [3] () et de multiples épisodes de combats entre les chercheurs tentant de reconstruire leur évolution au travers de récits contradictoires [4-6]. Au-delà d’un simple tumulte interne à la virologie, les virus géants ont initié et continuent d’alimenter une réflexion profonde sur la notion même de virus, d’organisme vivant, et sur le rôle qu’ils auraient pu jouer dans l’émergence et l’évolution du monde cellulaire [4-9]. Au-delà des laboratoires, les virus géants deviennent l’objet de réflexions épistémologiques [10, 11].

(→) Voir la Synthèse de J.M. Claverie et al., m/s n° 12, décembre 2016, page 1087

Au sein des familles distinctes de virus géants connues à ce jour (Tableau I), l’une d’entre elles a récemment été l’objet d’une attention particulière, celle des Pandoraviridae1. Publiée en 2013 [12], la découverte des deux premiers membres de cette nouvelle famille (Pandoravirus salinus et P. dulcis) a eu un grand retentissement à plusieurs titres. Elle a d’abord démontré à la surprise générale que le gigantisme viral n’était pas l’apanage de la seule famille des Mimivirus, les Mimiviridae. Cette deuxième famille de virus géants laissait prévoir l’existence de plusieurs autres familles bien distinctes, dont la découverte ne s’est pas fait attendre [13-15], et dont la liste n’est probablement pas terminée. Les premiers pandoravirus ont aussi démontré que nous n’avions pas atteint la limite de taille des particules virales (plus d’un µm) ni celle de leur génome. Avec 2,5 millions de nucléotides, P. salinus atteignait la complexité génétique de certains parasites eucaryotes, comme les microsporidies. Il reste néanmoins tributaire, comme tous les virus, de la machinerie de traduction de son hôte amibien pour la synthèse de ses propres protéines.

Avec seulement deux membres de la famille des Pandoraviridae, il était néanmoins impossible d’aller plus loin dans l’étude des mécanismes évolutifs susceptibles d’engendrer de tels monstres au sein du monde viral. Nous sommes alors retournés sur le terrain, à la recherche d’échantillons environnementaux susceptibles de contenir d’autres souches de cette famille. Nous avons eu la chance d’en isoler 3 nouvelles, dont la comparaison avec nos deux souches initiales et avec une autre décrite par un laboratoire allemand [16] nous a permis de montrer l’insuffisance des scénarios évolutifs qui s’affrontent traditionnellement pour tenter de rendre compte de la complexité et de « l’étrangeté » du génome des virus géants.

Avec de nombreuses nuances, deux types de scénarios principaux s’affrontent : celui développé par les réductionnistes et celui des inflationnistes [4-9]. Les réductionnistes s’appuient sur une loi amplement documentée par de multiples exemples, qui veut que les organismes parasites (et en particulier les bactéries strictement intracellulaires) soient acculés à une dépendance de plus en plus marquée vis-à-vis de leur hôte, par la perte progressive et irréversible des gènes dont la fonction peut être assurée par la cellule qu’ils infectent [17-20]. Selon cette école de pensée, les virus sont le résultat d’une évolution réductive permanente qui les a conduits d’un stade ancestral quasi-cellulaire aux plus petits virus que nous connaissons actuellement. Dans ce contexte, les virus « géants » seraient ceux dont l’évolution a été particulièrement lente. Cette hypothèse rend particulièrement bien compte de la famille des Mimiviridae, dont le génome code de nombreuses fonctions liées à la traduction des protéines, un domaine d’activité considéré (depuis l’énoncé des critères de Lwoff)2 [21] comme le strict apanage du monde cellulaire. Selon cette école, les différentes familles de virus que nous connaissons seraient les résultats de pertes différentielles de gènes à partir de formes ancestrales plus complexes, elles-mêmes issues de lignées proto-cellulaires éventuellement différentes de l’ancêtre commun du monde cellulaire contemporain [4, 7].

Pour les inflationnistes, le scénario est exactement inversé. Les virus ont commencé par être des entités très simples et très petites, leur génome ne codant que les fonctions absolument nécessaires à leur réplication (i.e. une ADN polymérase) et à leur encapsidation. Selon cette école, les différentes familles de virus que nous connaissons sont les résultats d’acquisitions (dites « latérales ») de gènes provenant du monde cellulaire ou d’autres virus [5].

Une école « centriste », prône une théorie intermédiaire selon laquelle l’évolution des virus s’effectue en « accordéon » par une alternance de phases de réduction et d’inflation [22].

Chacune de ces théories, même si elles s’opposent, se situe dans un contexte historique dans lequel les gènes viraux proviennent d’une version ancestrale soit héritée d’un virus parent, soit acquise d’un organisme cellulaire. Pour des raisons différentes, ces deux scénarios ne fournissent pas d’explications satisfaisantes à l’existence des virus géants, ni à la composition de leur génome, en particulier à la proportion énorme de leurs gènes codant des protéines orphelines (ou ORFans), sans homologue dans le monde cellulaire ou viral connu à ce jour.

L’hypothèse « réductionniste » se heurte principalement à la difficulté de rendre compte de la grande diversité génétique observée entre différents membres de la même famille (dont moins de la moitié des gènes peuvent être partagés). Chaque génome viral contemporain étant vu comme un sous-ensemble de gènes sélectionnés à partir d’un génome ancestral plus complexe, la taille prédite de celui-ci devient difficilement soutenable lorsque qu’elle vient à dépasser le nombre de gènes (environ 260) qui sont nécessaires au métabolisme minimal d’une bactérie non parasite [23]. D’un autre côté, comme les nombreux gènes spécifiques à un seul virus sont majoritairement constitués d’ORFans, on ne peut pas non plus en attribuer l’origine à une acquisition latérale.

Selon l’école opposée des inflationnistes, les virus ont commencé tout petit (un ou deux gènes, qui forment le noyau des gènes communs à toutes les familles de virus). Ils ont ensuite évolué en acquérant des gènes de leurs hôtes ou d’autres organismes les environnant. Nous avons ici deux difficultés.

– La première est d’expliquer quelles forces pousseraient ces virus à évoluer à contresens de la réduction que l’on constate chez tous les parasites intracellulaires (et de la majorité des virus qui se satisfont d’une dizaine de gènes).

– La seconde est que l’origine des gènes supposément « acquis » serait passablement mystérieuse étant donné l’énorme proportion d’ORFans qui les caractérisent (jusqu’à 90 % pour les pandoravirus). Si la plupart de ces gènes avait été empruntée, ceux-ci devraient appartenir à des catégories d’organismes dont nous n’avons encore jamais rencontré le moindre représentant3.

L’hypothèse de l’évolution en accordéon ne résout en rien les difficultés précédentes, dont la principale est de rendre compte de l’énorme proportion d’ORFans dans les génomes viraux (de 65 % à 93 %, pour chaque nouvelle famille découverte). C’est à la solution de ce mystère que s’est attaqué notre récent travail sur les Pandoravirus [24].

Après avoir isolé et caractérisé en détail trois nouveaux membres de cette famille (Tableau II), nous avons entrepris une comparaison globale des 6 génomes disponibles. Ce travail a d’abord consisté en une ré-annotation rigoureuse de ces génomes (tirant partie d’analyses transcriptomiques et protéomiques complémentaires) qui a permis d’éliminer tous les gènes (et protéines correspondantes) dont la prédiction pouvait être douteuse, notamment en raison de la proportion inhabituellement élevée de G+C (> 60 %) dans le génome des Pandoravirus4.

Après avoir éliminé le risque de comptabiliser des gènes faussement prédits comme autant d’ORFans, nous avons procédé à une nouvelle analyse comparative du contenu génique des différents Pandoravirus, dont la famille semble déjà se diviser en deux branches (ou clades), une tendance confirmée par la position de 3 autres isolats décrits depuis la publication de notre étude (Figure 1) [25].

Nos analyses ont confirmé que le gigantisme du génome des Pandoravirus (deux fois plus grand que celui des Mimiviridae) n’était pas la conséquence d’une propension anormalement élevée à l’acquisition latérale de gènes, ni à la duplication de gènes préexistants. Pourtant, nous avons constaté que chaque nouvel isolat contribuait pour environ 50 nouveaux gènes (dont 95 % d’ORFans) au « pan génome » des Pandoraviridae. L’origine de ces gènes, bien que leur nombre ait été réduit de moitié par notre annotation très conservatrice, restait donc un mystère.

La solution de cette énigme est alors venue de la découverte d’un gradient de similarité (évalué par 3 statistiques indépendantes) entre les régions intergéniques et les gènes spécifiques d’un virus donné (95 % d’ORFans), puis les gènes spécifiques à chaque clade (90 % d’ORFans), puis les gènes communs à tous les isolats (65 % d’ORFans). En fait, plus un gène est orphelin (partagé uniquement par les Pandoravirus, ou seulement partagé au sein d’un des clades, ou spécifique d’un seul isolat) et plus sa « signature » ressemble à celle des régions non-codantes séparant des gènes successifs [24]. En l’absence d’autres hypothèses capables d’expliquer une telle relation, le scénario le plus plausible que nous proposons est que les gènes/protéines spécifiques à chaque Pandoravirus soient issus d’un processus de création de novo et in situ à partir de séquences d’ADN intergéniques initialement non-codantes.

Une telle hypothèse vient se heurter de plein fouet au paradigme actuel qui veut qu’un peptide résultant d’une séquence aléatoire n’ait qu’une probabilité infime d’exercer une fonction qui, de plus, confèrerait un avantage à son porteur. En l’absence du moindre avantage sélectif, ces nouveaux gènes devraient donc être éliminés avant d’avoir pu évoluer vers la moindre utilité. Le fait qu’ils ne le soient pas suggère que toutes les forces gouvernant l’évolution des Pandoravirus n’ont pas encore été identifiées ou comprises.

Ce scénario, qui rompt avec le concept fondamental que tous les gènes ont une histoire (c’est-à-dire qu’ils sont en continuité avec une forme ancestrale), semble pourtant le seul capable de rendre compte de l’extrême altérité et de la diversité du contenu génétique des Pandoravirus, et peut-être des autres virus géants.

Notons que cette boîte de Pandore conceptuelle a déjà été ouverte depuis longtemps par divers auteurs explorant les génomes d’organismes bien plus standard que les virus géants, comme la levure [26], la plante Arabidopsis thaliana [27], différent animaux [28-31], y compris les primates [32]. Quelle que soit notre incrédulité résiduelle devant le côté magique de ce scénario, il nous faut bien admettre qu’il a bien fallu qu’un jour soient créés de novo les ancêtres de nos gènes, dans des conditions certainement bien moins favorables que celles régnant dans le monde vivant d’aujourd’hui.

Nous ne pouvons qu’espérer que notre étude de la diversité des Pandoravirus et nos spéculations sur leur évolution contribuent à relancer des travaux sur un processus originel étonnamment absent des préoccupations des évolutionnistes contemporains, pour la plupart occupés à construire des arbres dont nous ne comprenons toujours pas les racines.

Liens d’intérêt

Les auteurs déclarent n’avoir aucun lien d’intérêt concernant les données publiées dans cet article.

 
Footnotes
1 Comme pour la plupart des autres familles de virus géants (à l’exception de Mimiviridae), cette dénomination n’a pas encore reçu de validation officielle par le comité international sur la taxonomie des virus (ICTV).
2 C’est en 1957 qu’André Lwoff a énoncé les trois caractères fondamentaux faisant des virus des entités originales : les virus ne contiennent qu’un seul type d’acide nucléique (ADN ou ARN) qui constitue le génome viral ; les virus se reproduisent à partir de leur matériel génétique et par réplication ; les virus sont doués de parasitisme intracellulaire absolu.
3 Expliquer la grande proportion d’ORFans par une divergence très accélérée des gènes acquis au sein des génomes viraux n’est pas recevable pour les virus géants à ADN dont les enzymes de réplications sont aussi fidèles que ceux des organismes cellulaires. La preuve en est que le noyau des gènes communs à différentes familles de virus, supposément très ancestraux, restent aisément détectables.
4 Les codons stop étant riches en A+T (TAA, TAG, TGA), leur rareté génère des phases de lecture aléatoire dont la longueur perturbe le fonctionnement des algorithmes d’annotation.
References
1.
La Scola B, Audic S, Robert C, et al. A giant virus in amoebae. Science. 2003; ; 299 : :2033..
2.
Raoult D, Audic S, Robert C, et al. The 1.2-megabase genome sequence of Mimivirus . Science. 2004; ; 306 : :1344.–1350.
3.
Claverie JM, Abergel C. Les virus géants. Etat des connaissances, énigmes, controverses et perspective . Med Sci (Paris). 2016; ; 32 : :1087.–1096.
4.
Abergel C, Legendre M, Claverie JM. The rapidly expanding universe of giant viruses : Mimivirus, Pandoravirus . Pithovirus and Mollivirus. FEMS Microbiol Rev. 2015; ; 39 : :779.–796.
5.
Krupovic M, Koonin EV. Self-synthesizing transposons: unexpected key player in the evolution of viruses and defense systems . Curr Opin Microbiol. 2016; ; 31 : :25.–33.
6.
Nasir A, Caetano-Anollés G. A phylogenomic data-driven exploration of viral origins and evolution . Sci Adv. 2015; ; 1 : :e1500527..
7.
Claverie JM, Abergel C. Open questions about giant viruses . Adv Virus Res. 2013; ; 85 : :25.–56.
8.
Filée J.. Multiple occurrences of giant virus core genes acquired by eukaryotic genomes: The visible part of the iceberg? . Virology. 2014; ; 466–7 : :53.–59.
9.
Takemura M, Yokobori S, Ogata H. Evolution of eukaryotic DNA polymerases via interaction between cells and large DNA viruses . J Mol Evol. 2015; ; 81 : :24.–33.
10.
Pradeu T, Kostyrka G, Dupré J. Understanding viruses: Philosophical investigations . Stud Hist Philos Biol Biomed Sci. 2016; ; 59 : :57.–63.
11.
Claverie JM, Abergel C. Giant viruses: The difficult breaking of multiple epistemological barriers . Stud Hist Philos Biol Biomed Sci. 2016; ; 59 : :89.–99.
12.
Philippe N, Legendre M, Doutre G, et al. Pandoraviruses : amoeba viruses with genomes up to 2.5 Mb reaching that of parasitic eukaryotes . Science. 2013; ; 341 : :281.–286.
13.
Legendre M, Bartoli J, Shmakova L, et al. Thirty-thousand-year-old distant relative of giant icosahedral DNA viruses with a pandoravirus morphology . Proc Natl Acad Sci USA. 2014; ; 111 : :4274.–4279.
14.
Legendre M, Lartigue A, Bertaux L, et al. In-depth study of Mollivirus sibericum, a new 30,000-y-old giant virus infecting Acanthamoeba . Proc Natl Acad Sci USA. 2015; ; 112 : :E5327.–E5335.
15.
Abergel C, Claverie JM. Diversité des virus géants . Virologie. 2016; ; 20 : :61.–63.
16.
Antwerpen MH, Georgi E, Zoeller L, et al. Whole-genome sequencing of a pandoravirus isolated from keratitis-inducing acanthamoeba . Genome Announc. 2015; ; 3 : :e00136.–e00115.
17.
Waters E, Hohn MJ, Ahel I, et al. The genome of Nanoarchaeum equitans: insights into early archaeal evolution and derived parasitism . Proc Natl Acad Sci USA. 2003; ; 100 : :12984.–12988.
18.
Corradi N, Pombert JF, Farinelli L, et al. The complete sequence of the smallest known nuclear genome from the microsporidian Encephalitozoon intestinalis . Nat Commun. 2010; ; 1 : :77..
19.
López-Madrigal S, Latorre A, Porcar M, et al. Complete genome sequence of “Candidatus Tremblaya princeps” strain PCVAL, an intriguing translational machine below the living-cell status . J Bacteriol. 2011; ; 193 : :5587.–5588.
20.
Moran NA, Bennett GM. The tiniest tiny genomes . Annu Rev Microbiol. 2014; ; 68 : :195.–215.
21.
Lwoff A.. The concept of virus . J Gen Microbiol. 1957; ; 17 : :239.–253.
22.
Filée J.. Route of NCLDV evolution: the genomic accordion . Curr Opin Virol. 2013; ; 3 : :595.–599.
23.
Pereyre S, Sirand-Pugnet P, Beven L, et al. Life on arginine for Mycoplasma hominis: clues from its minimal genome and comparison with other human urogenital mycoplasmas . PLoS Genet. 2009; ; 5 : :e1000677..
24.
Legendre M, Fabre E, Poirot O, et al. Diversity and evolution of the emerging Pandoraviridae family . Nat Commun. 2018; ; 9 : :2285..
25.
Aherfi S, Andreani J, Baptiste E, et al. A large open pangenome and a small core genome for giant Pandoraviruses . Front Microbiol. 2018; ; 9 : :1486..
26.
Carvunis AR, Rolland T, Wapinski I, et al. Proto-genes and de novo gene birth . Nature. 2012; ; 487 : :370.–374.
27.
Donoghue MT, Keshavaiah C, Swamidatta SH, Spillane C. Evolutionary origins of Brassicaceae specific genes in Arabidopsis thaliana . BMC Evol Biol. 2011; ; 11 : :47..
28.
Levine MT, Jones CD, Kern AD, et al. Novel genes derived from noncoding DNA in Drosophila melanogaster are frequently X-linked and exhibit testis-biased expression . Proc Natl Acad Sci USA. 2006; ; 103 : :9935.–9939.
29.
Heinen TJ, Staubach F, Häming D, Tautz D. Emergence of a new gene from an intergenic region . Curr Biol. 2009; ; 19 : :1527.–1531.
30.
Tautz D, Domazet-Lošo T. The evolutionary origin of orphan genes . Nat Rev Genet. 2011; ; 12 : :692.–702.
31.
Neme R, Tautz D. Phylogenetic patterns of emergence of new genes support a model of frequent de novo evolution . BMC Genomics. 2013; ; 14 : :117..
32.
Guerzoni D, McLysaght A. De novo genes arise at a slow but steady rate along theprimate lineage and have been subject to incomplete lineage sorting . Genome Biol Evol. 2016; ; 8 : :1222.–1232.
33.
Boyer M, Yutin N, Pagnier I, et al. Giant Marseillevirus highlights the role of amoebae as a melting pot in the emergence of chimeric microorganisms . Proc Natl Acad Sci USA. 2009; ; 106 : :21848.–21853.
34.
Reteno DG, Benamar S, Khalil JB, et al. Faustovirus, an asfarvirus-related new lineage of giant viruses infecting amoebae . J Virol. 2015; ; 89 : :6585.–6594.
35.
Nguyen LT, Schmidt HA, von Haeseler A, Minh BQ. IQ-TREE: A fast and effective stochastic algorithm for estimating maximum likelihood phylogenies . Mol Biol Evol. 2015; ; 32 : :268.–274.