Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2014 November; 30: 14–17.
Published online 2014 November 17. doi: 10.1051/medsci/201430s203.

Génomique, de la recherche à la clinique
Questions autour d’un changement de perspective

Catherine Bourgain1*

1Cermes3 (Centre de recherche médecine, sciences, santé, santé mentale, société), Inserm U988, site CNRS, 7, rue Guy Môquet, 94801Villejuif Cedex, France
Corresponding author.
 

inline-graphic medsci2014302sp14-img1.jpg

Dans son numéro de fin d’année qui recense traditionnellement les découvertes scientifiques les plus remarquables des mois écoulés, le journal Science faisait, en 2007, les honneurs de sa « Une » aux « variations génétiques humaines » [ 1], célébrant en particulier l’identification par les études d’association sur tout le génome (GWAS) de variants génétiques associés à de nombreuses maladies complexes et fréquentes. L’hebdomadaire américain notait que cette année avait également vu « la naissance d’une nouvelle industrie : la génomique à usage personnel » (personal genomics), en référence aux sociétés vendant des tests génétiques sur internet (direct-to-consumer, DTC) [ 2]. Cette continuité entre résultats de recherche et informations vendues au consommateur sera d’ailleurs fortement mise en avant par les industriels du secteur au lancement de leur activité. Dans une lettre adressée à la communauté scientifique et publiée sur son site web en 2008, la société californienne 23andMe, emblématique de ce nouveau business, affirmait ainsi « il est aujourd’hui possible pour les individus d’obtenir leur propre génotype avec les mêmes technologies que celles utilisées dans les grandes études d’association, et de les comparer avec ceux présentés dans la littérature scientifique » [ 3]1. Cette idée d’une application rapide en clinique des résultats obtenus par les travaux de recherche en génomique humaine n’est alors pas iconoclaste dans les milieux académiques. Dans son adresse présidentielle à la société américaine de génétique humaine en 2005, l’actuel directeur du NIH (National institutes of health) Francis Collins, commentant la publication de la première étude GWAS, annonçait que « des prédictions de risque basées sur les génotypes seraient bientôt disponibles pour de nombreuses personnes dans un contexte de recherche pour commencer, mais ensuite dans les pratiques cliniques » [ 4].

Je voudrais apporter ici quelques éléments de réflexion sur ce passage de la recherche à la clinique des résultats obtenus à partir de données génomiques, notamment par les études GWAS. Pour cela, je replacerai brièvement les études GWAS dans leur contexte scientifique. Deux exemples emblématiques permettront ensuite d’illustrer les limites de l’utilisation des résultats obtenus par GWAS pour la prédiction individuelle de risque (maladie de Crohn), et les difficultés rencontrées pour introduire le recours à l’information génétique dans les décisions thérapeutiques (warfarine).

Les études d’association sur tout le génome dans leur contexte scientifique

Au milieu des années 1970 émerge une communauté scientifique de généticiens spécialisés dans l’étude des maladies complexes, qui s’organise notamment autour du journal Genetic Epidemiology et de la Société internationale de génétique épidémiologique (International Genetic Epidemiology Society, IGES). « Identifier la contribution de facteurs génétiques [si elle existe] au sein d’un mélange complexe de facteurs aboutissant au caractère d’intérêt » [ 5] est l’ambition de cette discipline nouvelle énoncée par James Neel, dans son éditorial du premier numéro du journal en 1984. « Le généticien épidémiologiste, poursuivait-il, est esclave du concept de causalité multifactorielle ». En première page de ce même numéro fondateur, D.C. Rao précise que la discipline « s’est constituée sur la base d’une interaction importante entre la génétique et l’épidémiologie. Elle diffère de l’épidémiologie parce qu’elle considère explicitement les facteurs génétiques et les ressemblances familiales ; elle diffère de la génétique des populations parce qu’elle se concentre sur les maladies ; elle diffère de la génétique médicale en s’intéressant à la dimension populationnelle » [ 6]. L’empreinte de l’épidémiologie se retrouve, notamment, dans le concept central de facteur de risque génétique. Contrairement au facteur de risque épidémiologique classique, exogène et potentiellement actionnable, le facteur de risque génétique est endogène et non modifiable. Dans ce contexte de « causalité multifactorielle » énoncée par J. Neel, l’objectif affiché n’est pas la prévision individualisée de risque basée sur les seuls facteurs de risque génétique. L’identification de tels facteurs est proposée comme stratégie pour ouvrir de nouvelles pistes d’étude de la physiopathologie des maladies complexes, avec, à la clé, le développement de traitements plus efficaces comportant, peut-être, moins d’effets secondaires [ 7, 8].

Les méthodes de la génétique épidémiologique vont évoluer au cours des trente années suivantes, sous l’effet conjoint des évolutions technologiques et des résultats de recherche (y compris souvent l’absence de résultats), qui modifient les hypothèses théoriques jugées pertinentes au sein de la communauté scientifique. À la vague des analyses de ségrégation va succéder celle des analyses de liaison dites paramétriques (méthode des lod scores), bientôt remplacées par les analyses de liaison dites non paramétriques (méthode des paires de germains atteints) sur tout le génome. Ces dernières ont été largement dépassées ensuite par les études GWAS, en passe d’être elles-mêmes rattrapées par les approches basées sur le séquençage complet de l’exome et bientôt du génome entier. C’est donc dans une évolution des pratiques scientifiques, parfois moquée pour ses effets de mode, que s’inscrivent les études GWAS. Dans ce mouvement général, pour maximiser la puissance de détection des facteurs de risque génétique, les stratégies d’échantillonnage centrées sur les données familiales ont cédé peu à peu le pas aux très grands échantillons de cas et de témoins non apparentés. L’individu, désormais « débarrassé de sa famille », est devenu l’unité de base des études. En conséquence, les mesures individualisées de risques ont pu être perçues comme des résultats « scientifiquement validés », découlant mécaniquement de ces études, et la causalité multifactorielle être reléguée au rang des concepts scientifiques rendus obsolètes par les progrès technologiques.

Dans ce contexte, il n’est pas étonnant que les résultats obtenus par les études GWAS depuis 2005 puissent être tour à tour célébrés comme de véritables succès ou décriés comme de coûteux échecs. Tournant le dos à trois décennies de maigres récoltes avec les méthodes précédemment utilisées, les GWAS ont permis une belle moisson de facteurs de risque génétique identifiés et confirmés, pour un grand nombre de pathologies complexes. De nouvelles voies métaboliques ont ainsi été identifiées et des travaux de recherche lancés pour comprendre les mécanismes moléculaires sous-tendant ces associations statistiques. Notons toutefois que la faiblesse quantitative de la plupart des effets génétiques identifiés complique considérablement la réalisation pratique de ces études et invite à la plus grande prudence quant aux futures retombées cliniques.

Les débats autour de l’héritabilité manquante [ 9] qui ont suivi cette moisson de publications ont toutefois éclairé d’une autre lumière ces mêmes résultats. L’héritabilité génétique est un concept complexe de génétique quantitative, qu’il n’est pas question de discuter en détail ici. Soulignons simplement que ce concept a été développé pour la sélection végétale et animale, et qu’il repose sur le degré de ressemblance entre apparentés. La validité de son utilisation en génétique humaine a été très largement remise en cause dans les années 1970 [ 10] et sa récente remise au goût du jour est certainement critiquable. Elle a néanmoins permis d’illustrer à quel point les résultats obtenus par GWAS étaient loin d’expliquer la part de ressemblance entre apparentés habituellement attribuée aux gènes et, par ricochet, de souligner l’inutilité des GWAS pour la prédiction individuelle de risque.

L’exemple de la maladie de Crohn

La maladie de Crohn, maladie inflammatoire chronique de l’intestin, constitue une bonne illustration de ce problème [ 11]. La composante génétique de cette maladie, qui présente une récurrence familiale importante, ainsi que des différences de taux de concordance entre paires de jumeaux monozygotes et dizygotes, est considérée aujourd’hui comme bien décrite. Depuis l’identification d’un premier gène impliqué dans la susceptibilité à la maladie par l’équipe de Jean-Pierre Hugot en 2001 [ 12], la liste n’a cessé de s’allonger. Une méta-analyse de résultats obtenus par GWAS [ 13] recense 71 facteurs de risque génétique différents dans tout le génome. Ces facteurs sont fréquents et leurs effets sont faibles ; les allèles à risque ont, pour la plupart, une fréquence supérieure à 10 %. L’odds-ratio (OR) maximum identifié est de 2,66, les autres OR variant de 1,05 à 1,37. Mais la capacité à prédire la maladie à partir de la seule information génétique est faible. L’effet cumulé des 71 variants identifiés explique moins de 25 % de la variance génétique totale de la maladie. Aucune prédiction solide n’est donc réalisable sur cette base.

Plusieurs éléments contribuent à expliquer cet état de fait. Les premiers ont à voir avec la méthodologie des GWAS à proprement parler. Les OR peuvent y être surestimés par manque de puissance des études. Par ailleurs, les SNP (single nucleotide polymorphism) utilisés ne sont souvent que des substituts aux variations d’ADN directement causales. Ils ne reflètent qu’imparfaitement l’effet de ces dernières sur la maladie. Mais, de façon plus générale, ces résultats soulignent la limite du modèle utilisé pour estimer et intégrer l’effet des différents SNP [ 14]. L’effet de chaque facteur génétique est ainsi estimé de façon indépendante de l’effet de tous les autres, sans tenir compte d’éventuelles interactions entre eux ou avec des facteurs de risque environnementaux. Le risque global est ensuite mesuré en additionnant tous ces petits effets jugés indépendants, sans intégrer d’effet environnemental.

À cet égard, il est intéressant de noter que les principales conséquences cliniques proposées par les promoteurs de ces prédictions génétiques de risque consistent à encourager les individus à modifier leurs habitudes de vie. Il s’agit donc de jouer sur des facteurs de risque environnementaux, alors même que ces derniers ne sont pas inclus dans les modèles utilisés pour réaliser les prédictions de risque, ni marginalement, ni sous forme d’interaction avec les facteurs de risque génétiques.

La warfarine : figure emblématique de la pharmacogénétique

La pharmacogénétique constitue un autre domaine où le passage de la recherche à la clinique des résultats de la génomique, bien que prometteur, pose un certain nombre de questions. La figure emblématique de la warfarine en est une bonne illustration.

La warfarine est l’anticoagulant le plus utilisé pour prévenir les risques de thromboses et d’événements thrombo-emboliques. La définition de la dose thérapeutiquement efficace pour chaque patient est un exercice délicat car les variations interindividuelles de réponse au traitement sont grandes (les doses efficaces varient d’un facteur quatre entre individus) et peu prévisibles, et un surdosage augmente le risque de saignements graves. De nombreux facteurs, dont l’âge, le poids, la taille, le régime alimentaire ou la compliance au traitement, sont connus pour influencer le taux de molécule active dans le sang. En pratique, cette dose est atteinte en adaptant graduellement la posologie à partir d’une dose initiale.

Au début des années 2000, des variants génétiques ont été identifiés dans deux gènes associés au métabolisme du médicament (VKORC1 [vitamin K epoxide reductase complex subunit 1] et CYP2C9 [cytochrome P450, family 2, subfamily C, polypeptide 9]) [ 15, 16], et les nombreuses GWAS publiées par la suite ont confirmé et précisé l’effet de ces deux gènes [ 17, 18]. À eux-seuls, les variants de VKORC1 et CYP2C9 expliquent près de 50 % des variations interindividuelles de doses efficaces.

Une série d’études observationnelles et de petits essais cliniques, publiés dans la foulée, ont suggéré que les tests génétiques ciblant ces deux gènes pouvaient apporter une information permettant de mieux adapter la dose initiale de warfarine aux patients. Sur cette base, en 2007, la FDA (food and drug administration) introduisait une référence aux tests pharmacogénétiques dans la notice du médicament, qu’elle mettait à jour en 2010 en précisant les doses initiales à prescrire en fonction des caractéristiques génétiques des patients. En 2008 pourtant, plusieurs sociétés savantes, dont le collège américain de génétique médicale [ 19], et quelques assurances santé [ 20], avaient considéré que les données cliniques disponibles n’étaient pas suffisamment convaincantes pour introduire de façon systématique le recours aux tests génétiques dans la pratique clinique, notamment au regard des coûts et des contraintes pratiques associés.

Pour trancher la controverse sur l’utilité clinique et évaluer l’apport de l’information génétique à la définition de la dose thérapeutique efficace, une série d’essais cliniques randomisés ont été financés par les autorités aux États-Unis et en Europe. Les résultats de trois essais ont été publiés en novembre 2013 dans le même numéro du New England Journal of Medicine.

Le premier [ 21] est un essai américain randomisé en double aveugle qui porte sur 1 015 patients. Dans le premier groupe, la dose initiale de warfarine prescrite au patient est estimée à partir d’un algorithme intégrant des données démographiques et cliniques. Dans le second groupe, la dose initiale est déterminée par un algorithme basé sur les mêmes données démographiques et cliniques, auxquelles sont ajoutées les données génétiques. L’étude conclut qu’intégrer l’information génétique ne permet pas de mieux contrôler le dosage de warfarine au cours des quatre premières semaines de traitement. La seconde étude [ 22], portant sur 548 patients traités avec deux autres anticoagulants proches de la warfarine, l’acénocoumarol et le phenprocoumone, conclut également à l’absence d’amélioration du contrôle des doses au bout de 12 semaines de traitement, selon que la dose initiale est fixée par un algorithme intégrant des données démographiques, cliniques et génétiques, ou uniquement des données démographiques et cliniques. Le troisième essai [ 23], portant sur 455 patients, ne teste pas exactement la même chose. Sont comparés dans cette étude, un groupe de patients pour lesquels la dose initiale de warfarine est estimée par un algorithme intégrant des données démographiques, cliniques et génétiques, et un groupe de patients traités selon la méthode standard en usage où la dose initiale de warfarine ne dépend que de l’âge du patient. Après douze semaines de traitement, les auteurs détectent un contrôle des doses significativement plus efficace lorsque la dose initiale est définie par l’algorithme, mais cette amélioration reste toutefois modeste. L’éditorial qui accompagne la publication de ces trois études [ 24] conclut ainsi que les tests pharmacogénétiques n’ont pas d’intérêt au regard des efforts et des coûts qu’ils engendrent, et que l’amélioration du traitement passera vraisemblablement par d’autres voies, plus centrées sur les conditions de la pratique clinique.

Conclusion

Maladie de Crohn et warfarine ne sont évidemment que des cas particuliers, quand bien même il s’agit de figures emblématiques, régulièrement mises en avant dans les débats. Mais ils illustrent bien un élément au cœur des difficultés du passage de la recherche à la clinique des données de génomique obtenues avec les GWAS. Les progrès technologiques récents ne sont pas les seuls facteurs expliquant le succès de ces travaux. Ces derniers ont été obtenus au prix d’une simplification des modèles causatifs des maladies ou des réponses aux médicaments étudiés. Si ce réductionnisme n’est pas un problème dans un contexte de recherche, par nature exploratoire, mis à l’épreuve de l’utilité clinique, il montre ses limites.

Liens d’intérêt

L’auteur déclare n’avoir aucun lien d’intérêt concernant les données publiées dans cet article.

 
Footnotes
1 Toutes les citations ont été traduites de l’anglais par l’auteur.
References
1.
Pennisi E . Breakthrough of the year. Human genetic variation . Science. 2007; ; 318 : :1842.–1843.
2.
Kaiser J . Breakthrough of the year. It’s all about me . Science. 2007; ; 318 : :1843..
3.
Open letter to the scientific community . 23andMe., 2008, available at: www.23andme.com/for/scientists ..
4.
Collins FS. 2005 William Allan award address . No longer just looking under the lamppost . Am J Hum Genet. 2006; ; 79 : :421.–426.
5.
Neel JV . Editorial . Genet Epidemiol. 1984; ; 1 : :5.–6.
6.
Rao DC . Editorial comments . Genet Epidemiol. 1984; ; 1 : :1.–3.
7.
Clerget-Darpoux F . La folle course au gène de la folie . La Recherche. 1998; ; 311 : :44.–47.
8.
Feingold J . Maladies multifactorielles : un cauchemar pour le généticien . Med Sci (Paris). 2005; ; 21 : :927.–933.
9.
Manolio TA , Collins FS , Cox NJ , et al. Finding the missing heritability of complex diseases . Nature. 2009; ; 461 : :747.–753.
10.
Lewontin RC . Annotation: the analysis of variance and the analysis of causes . Am J Human Genet. 1974; ; 26 : :400.–411.
11.
Baumgart DC , Sandborn WJ . Crohn’s disease . Lancet. 2012; ; 380 : :1590.–1605.
12.
Hugot JP , Chamaillard M , Zouali H , et al. Association of NOD2 leucine-rich repeat variants with susceptibility to Crohn’s disease . Nature. 2001; ; 411 : :599.–603.
13.
Franke A , McGovern DP , Barrett JC , et al. Genome-wide meta-analysis increases to 71 the number of confirmed Crohn’s disease susceptibility loci . Nat Genet. 2010; ; 42 : :1118.–1125.
14.
Quelle valeur accorder aux prédictions de risques pour les maladies multifactorielles ? Société française de génétique humaine., 2010.
15.
Takahashi H , Echizen H . Pharmacogenetics of CYP2C9 and interindividual variability in anticoagulant response to warfarin . Pharmacogenomics J. 2003; ; 3 : :202.–214.
16.
D’Andrea G , D’Ambrosio RL , Di Perna P , et al. A polymorphism in the VKORC1 gene is associated with an interindividual variability in the dose-anticoagulant effect of warfarin . Blood. 2005; ; 105 : :645.–649.
17.
Cooper GM , Johnson JA , Langaee TY , et al. A genome-wide scan for common genetic variants with a large influence on warfarin maintenance dose . Blood. 2008; ; 112 : :1022.–1027.
18.
Takeuchi F , McGinnis R , Bourgeois S , et al. A genome-wide association study confirms VKORC1, CYP2C9, CYP4F2 as principal genetic determinants of warfarin dose . PLoS Genet. 2009; ; 5 : :e1000433..
19.
Flockhart DA , O’Kane D , Williams MS , et al. Pharmacogenetic testing of CYP2C9 and VKORC1 alleles for warfarin . Genet Med. 2008; ; 10 : :139.–150.
20.
Blue cross and blue shield of Kansas . Genetic testing for warfarin dose . BCBSK; , 2010.
21.
Kimmel SE , French B , Kasner SE , et al. A pharmacogenetic versus a clinical algorithm for warfarin dosing . N Engl J Med. 2013; ; 369 : :2283.–2293.
22.
Verhoef TI , Ragia G , de Boer A , et al. A randomized trial of genotype-guided dosing of acenocoumarol and phenprocoumon . N Engl J Med. 2013; ; 369 : :2304.–2312.
23.
Pirmohamed M , Burnside G , Eriksson N , et al. A randomized trial of genotype-guided dosing of warfarin . N Engl J Med. 2013; ; 369 : :2294.–2303.
24.
Furie B . Do pharmacogenetics have a role in the dosing of vitamin K antagonists? N Engl J Med. 2013; ; 369 : :2345.–2346.