Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2008 May; 24(5): 529–532.
Published online 2008 May 15. doi: 10.1051/medsci/2008245529.

Chroniques génomiques
Après Venter, Watson…

Bertrand Jordan*

Marseille-Nice Génopole, case 901, Parc Scientifique de Luminy, 13288 Marseille Cedex 9, France
Corresponding author.

MeSH keywords: ADN, Génome humain, Génomique, Histoire du 19ème siècle, Histoire du 20ème siècle, Histoire du 21ème siècle, Humains, Conformation d'acide nucléique

 

La séquence complète de l’ADN de Jim Watson, déjà disponible depuis quelques mois sur Internet, vient de faire l’objet d’une publication dans Nature [ 1]. Deuxième séquence intégrale d’un individu après celle de Craig Venter [ 2, 3], elle apporte des indications intéressantes à la fois par la manière dont elle a été obtenue et par les informations fournies.

Au niveau technique, il s’agit de la première séquence humaine intégralement lue grâce à l’une des nouvelles machines, en l’occurrence le Genome Sequencer FLX de l’entreprise 454 qui fait maintenant partie de Roche Diagnostics. Rappelons rapidement les trois systèmes actuellement sur le marché : en plus de celui-ci, la machine Solexa commercialisée par Illumina à déjà plus de deux cents exemplaires, et le système SOLiD d’Applied Biosystems qui est, lui, d’introduction plus récente. Ces appareils diffèrent dans leur principe et dans leurs résultats, notamment en ce qui concerne la longueur des segments lus : 200 nucléotides pour 454, 30 à 40 pour les deux autres. Cependant, ils sont tous capables de produire au moins une gigabase (un milliard de bases) de séquence brute par expérience, à un coût très inférieur à la classique méthode de Sanger. L’ensemble du travail, réalisé début 2007, a pris trois ou quatre mois et a coûté environ un million d’euros - on n’en est pas encore au « génome à 1 000 dollars », mais le coût est déjà inférieur au millième de celui de la première séquence publiée en 20031. Certes, ce résultat repose sur l’existence d’une séquence de référence, qui permet d’aligner les cent millions de lectures individuelles (reads) effectuées afin d’atteindre une redondance proche de dix - il n’en représente pas moins une étape importante.

Les résultats rapportés dans cet article (qui a apparemment été retardé en raison d’opinions très divergentes sur l’opportunité de sa publication) vont un peu moins loin que ceux concernant Craig Venter, en ce sens que les deux séquences que renferme ce génome diploïde ne sont pas individualisées : ceci empêche donc de comparer l’ADN paternel de Watson à son ADN maternel. C’est une faiblesse de la technique 454 (absence de continuité à longue distance) qui est en passe d’être dépassée grâce à une méthode dite de paired reads qui permet maintenant de lire des séquences dont on sait qu’elles sont séparées de précisément 1 000 (ou 2 000) bases dans le génome. Néanmoins, la comparaison de cette séquence avec la séquence de référence donne nombre d’indications utiles.

Entre Watson et cette dernière (qui, rappelons-le, est un patchwork provenant de différents individus au hasard des librairies employées), on constate 3,3 millions de différences ponctuelles - ce qui correspond bien au chiffre généralement annoncé de 0,1 % de divergence entre deux personnes. Plus intéressant, on peut déterminer combien de ces différences tombent à l’intérieur d’exons et modifient la séquence de la protéine (donc sont susceptibles d’avoir un effet physiologique) : un peu plus de dix mille, soit 0,3 %. La comparaison de Venter et de Watson donne une valeur assez comparable, près de huit mille différences portant sur la séquence des protéines. Ce nombre indique que plus d’un tiers des gènes présents chez ces deux individus codent pour des protéines légèrement différentes. Bien entendu, toute différence, même à ce niveau, n’entraîne pas forcément un phénotype distinct, car tout n’est pas critique dans une protéine… Outre les différences ponctuelles, on peut repérer plus de deux cents mille insertions et délétions (allant de quelques nucléotides à près de quarante mille) ; ce chiffre est nettement inférieur aux neuf cent mille détectées dans l’ADN de Venter, mais cela est probablement dû aux techniques employées. Seules trois cent cinquante de ces altérations touchent des gènes, ce qui est lié au fait que beaucoup d’entre elles concernent des séquences répétées de type Alu, généralement extragéniques. Enfin, plus d’un million de nucléotides présents chez Watson ne se retrouvent pas dans la séquence de référence, et semblent contenir quelques dizaines de gènes jusque là inconnus chez l’homme…

Que nous apprend cette séquence sur son porteur ? Bien peu de chose, en fait, comme le remarque Maynard Olson dans un commentaire très pertinent [ 4]. « Si Watson apportait sa séquence à un conseiller en génétique, ce dernier aurait bien peu de choses à discuter »2,, écrit-il. De fait, quelques allèles prédisposant à diverses affections sont présents, mais à l’état hétérozygote et, comme le dit encore Olson, on ne peut même pas prédire la taille de Watson d’après son ADN puisque le plus informatif des Snip3 affectant la stature joue sur quelques millimètres, alors sa déviation standard (au sein des populations d’origine européenne) est de près de dix centimètres. La médecine personnalisée fondée sur la séquence requiert non seulement la détermination de cette dernière, mais aussi une connaissance précise des rapports génotype/phénotype - connaissance que nous commençons seulement à acquérir de manière systématique. Voilà de quoi refroidir les promoteurs du « Génome personnel » [ 5] et déprimer le cours des actions de nombreuses entreprises qui se sont créées dans ce secteur très médiatisé…

 
Footnotes
1 Évalué à trois milliards de dollars ; le coût estimé de la séquence de Venter est d’environ 100 millions de dollars.
2 If Watson took his sequence to a genetic counsellor, there would be little to discuss (voir [4]).
3 Single Nucleotide Polymorphism, SNP ou Snip, polymorphisme de l’ADN portant sur un seul nucléotide.
References
1.
Wheeler DA, Srinivasan M, Egholm M, et al. The complete genome of an individual by massively parallel DNA sequencing. Nature 2008; 452 : 872–77.
2.
Levy S, Sutton G, Ng PC, et al. The diploid genome sequence of an individual human. PLoS Biol 2007; 5 : e254.
3.
Jordan B. Les révélations du « génome diploïde » de Craig Venter. Med Sci (Paris) 2007; 23 : 875–6.
4.
Olson MV. Dr Watson’s base pairs. Nature 2008; 452 : 819–20.
5.
Jordan B. « Génome personnel » : gadget ou révolution ? Med Sci (Paris) 2008; 24 : 91–4.