Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2010 May; 26(5): 452–454.
Published online 2010 May 15. doi: 10.1051/medsci/2010265452.

Le séquençage de l’exome au secours des maladies génétiques

Audrey Criqui and Sylvain Baulande*

PartnerChip-CEA, Bâtiment G2, 2, rue Gaston Crémieux, 91000 Évry, France
Corresponding author.

MeSH keywords: Analyse de mutations d'ADN, méthodes, Exons, génétique, Études d'associations génétiques, Maladies génétiques congénitales, Dépistage génétique, Génome humain, Humains, Polymorphisme génétique, Analyse de séquence d'ADN

 

Avec plus de 6 000 pathologies répertoriées, les maladies génétiques constituent un grand problème de santé publique affectant plus de 6 % de la population mondiale dont 25 millions d’Européens. La prise en charge de ces maladies demeure compliquée en raison de la difficulté tant du diagnostic que du développement de thérapies pour ces pathologies qui regroupent peu de malades. Actuellement, le diagnostic génétique est principalement fondé sur la recherche d’anomalies cytogénétiques, la mise en Ĺ“uvre d’analyses de liaison génétique ou encore le re-séquençage de gènes candidats. Malheureusement, l’identification des gènes en cause s’avère très difficile en raison de la diversité des mutations à mettre en évidence parmi les 3 milliards de bases qui composent le génome humain. Ainsi, beaucoup trop de patients restent sans diagnostic moléculaire bien que ce soit nécessaire à la prise en charge des familles, à la mise en place d’un diagnostic prénatal et que cela constitue une étape indispensable à l’élaboration de stratégies thérapeutiques.

L’émergence des technologies de séquençage de nouvelle génération (dites NGS pour next generation sequencing) [ 1] ouvre de nouvelles perspectives pour le diagnostic des maladies génétiques. Jusqu’à présent, en raison du coût important du séquençage conventionnel, seuls quelques privilégiés comme le prix Nobel James Watson [ 2] co-découvreur de l’ADN avec Francis Crick, ou encore Craig Venter [ 3], pionnier du séquençage du génome humain, ont vu leur génome entièrement séquencé. Ces nouvelles technologies, qui permettent une lecture massivement parallèle de plusieurs Gb par semaine, ont permis de réduire considérablement ces coûts et vont donc faciliter le séquençage complet de génomes à haut débit. Cette technologie a donc logiquement été retenue dans le cadre du 1 000 genomes project qui prévoit le séquençage du génome de 1 000 individus afin d’établir une nouvelle base de données plus complète des polymorphismes du génome humain [ 4, 5]. Malgré l’avancée significative apportée par le NGS, ces techniques restent encore trop onéreuses pour envisager le séquençage à grande échelle du génome entier d’individus atteints d’une même maladie génétique. De plus, les millions de polymorphismes ainsi révélés rendent la démarche de recherche de mutations particulièrement délicate et nécessitant donc une méthodologie adaptée.

Récemment, un consortium américain baptisé Exome Project a été créé afin de développer une approche centrée sur le séquençage exclusif de l’« exome » correspondant à l’ensemble des parties codantes du génome. Bien qu’il n’en représente qu’environ 1 % (soit près de 28 Mb selon la base CCDS [consensus coding DNA sequence project] du NCBI [National center for biotechnology information]), l’exome contient à lui seul 85 % des mutations mises en cause dans les maladies génétiques [ 6]. Une équipe de l’université de Washington impliquée dans ce consortium a donc isolé les 180 000 régions génomiques correspondantes par une technique de capture sur puce à ADN. Ces régions ont ensuite été amplifiées puis séquencées à l’aide d’une plate-forme Solexa d’Illumina [ 7]. Dans un premier temps, ces chercheurs ont étudié l’exome de huit personnes originaires de 3 populations différentes (4 Africains Yoruba, 2 Asiatiques et 2 Caucasiens) dont la séquence avait déjà fait l’objet d’investigations dans le cadre du projet HapMap [ 8].

Au total, 6,4 Gb de séquences ont été générées par individu, ce qui a permis d’obtenir une excellente couverture moyenne d’environ 50, correspondant au nombre de fois qu’une position donnée du génome a été séquencée. Ainsi, plus de 96 % des positions génomiques séquencées présentent une couverture supérieure à 8 fois, jugée suffisante pour une bonne fiabilité de lecture. La comparaison de la séquence des 8 exomes d’individus de référence avec les variations identifiées dans le cadre du projet HapMap permet d’observer 99,94 % de concordance pour les génotypes homozygotes et 99,57 % pour les hétérozygotes, reflétant un faible taux d’erreur.

En comparant avec la séquence de référence du génome humain, les auteurs ont retrouvé 56 240 SNP codants (cSNP) dont 13 347 non décrits dans la base de données de SNP du NCBI (dbSNP). Concernant les autres types de polymorphismes, chaque individu présente en moyenne 17 positions variantes situées sur des sites responsables de l’épissage et 166 insertions ou délétions (indels) codantes dont respectivement 30 % et 37 % non annotées dans la dbSNP. Ainsi, les nouveaux polymorphismes identifiés chez ces individus renforcent de manière significative le catalogue de la dbSNP.

Dans un second temps, les chercheurs ont étudié l’exome de 4 patients non apparentés atteints du syndrome de Freeman-Sheldon (SFS)1, [7], une maladie héréditaire dominante rare causée par des mutations du gène MYH3 (codant l’embryonic myosin heavy chain) [ 9]. Ils ont alors mis en place une stratégie de criblage des gènes afin de voir s’il était possible de retrouver le gène MYH3 muté chez ces patients. Ce criblage repose sur l’examen des différents variants portés par chacun des gènes et identifiés lors du séquençage exomique (Figure 1). La première étape consiste à rechercher les gènes qui présentent au moins un cSNP non synonyme, une indel ou un variant affectant l’épissage chez tous les patients. Ainsi, 2 479 gènes ont été sélectionnés à partir des 20 000 gènes codés par l’exome. Les gènes ne contenant que des polymorphismes déjà décrits dans la dbSNP ont été écartés, ce qui a permis de réduire le nombre de gènes variants en commun à 53. Ensuite, les gènes ne contenant que des variants identifiés lors du séquençage exomique des 8 individus HapMap ont aussi été rejetés. À l’issue de cette dernière étape, il ne restait alors qu’un seul gène, le gène MYH3, présentant chez chaque patient un variant (mutation causale) qui n’était répertorié ni dans la dbSNP, ni parmi les 8 exomes HapMap. L’approche par séquençage d’exome permet donc de retrouver la mutation causale déjà connue pour cette affection.

Plus récemment, cette même équipe a publié des travaux similaires basés sur le séquençage exomique du génome de 4 patients atteints du syndrome de Miller2 [ 10] pour lequel aucune mutation n’avait encore été décrite. En appliquant la même stratégie de criblage des gènes communs aux malades, le gène en cause, appelé DHODH (codant la dihydroorotate dehydrogenase), a pu être identifié et validé [ 11]. La méthode se montre donc capable de révéler le gène impliqué dans une pathologie en l’absence de toute indication préalable.

De qualité équivalente au séquençage conventionnel mais à moindre coût, l’approche du séquençage de l’exome s’avère très efficace pour identifier le gène et les mutations responsables de maladies monogéniques. La puissance de cette démarche s’appuie sur la qualité des bases de données des polymorphismes humains comme la dbSNP, la plus prometteuse étant celle en cours d’élaboration par le « 1 000 genomes project » [5]. Sachant que sur les 6 000 maladies génétiques connues seuls 1 600 gènes responsables ont été identifiés, l’émergence de ces nouvelles technologies est porteuse d’un réel espoir pour plus de 75 % des patients atteints de maladies génétiques chez lesquels aucun diagnostic génétique n’est possible à ce jour.

Conflit d’intérêts

Les auteurs déclarent n’avoir aucun conflit d’intérêts concernant les données publiées dans cet article.

 
Footnotes
1 Le syndrome de Freeman-Sheldon (SFS), aussi connu comme « syndrome de la face du siffleur », est un syndrome congénital rare caractérisé par une dysmorphie combinant des anomalies osseuses et des contractures articulaires avec un faciès typique (extrait du site Orphanet).
2 Syndrome de Miller : dysostose acrofaciale (DAF) post-axiale. Les DAF constituent un groupe hétérogène d’affections associant des anomalies des membres et du développement facial/mandibulaire (site Orphanet).
References
1.
Jordan B. La génération suivante, déjà… Med Sci (Paris) 2009; 25 : 649–50.
2.
Wheeler DA, Srinivasan M, Egholm M, et al. The complete genome of an individual by massively parallel DNA sequencing. Nature 2008; 452 : 872–6.
3.
Levy S, Sutton G, Ng PC, et al. The diploid genome sequence of an individual human. PLoS Biol 2007; 5 : e254.
4.
Siva N. 1 000 Genomes project. Nat Biotechnol 2008; 26 : 256.
5.
Jordan B. Un, deux, trois… mille génomes ? Med Sci (Paris) 2008; 24 : 237–8.
6.
Choi M, Scholl UI, Ji W, et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proc Natl Acad Sci USA 2009; 27 octobre (online).
7.
Ng SB, Turner EH, Robertson PD, et al. Targeted capture and massively parallel sequencing of 12 human exomes. Nature 2009; 461 : 272–6.
8.
International HapMap Consortium. A second generation human haplotype map of over 3.1 million SNPs. Nature 2007; 449 : 851–61.
9.
Toydemir RM, Rutherford A, Whitby FG, et al. Mutations in embryonic myosin heavy chain (MYH3) cause Freeman-Sheldon syndrome and Sheldon-Hall syndrome. Nat Genet 2006; 38 : 561–5.
10.
Miller M, Fineman R, Smith DW. Postaxial acrofacial dysostosis syndrome. J Pediatr 1979; 95 : 970–5.
11.
Ng SB, Buckingham K, Lee C, et al. Exome sequencing identifies the cause of a mendelian disorder. Nat Genet 2010; 42 : 31–6.