Logo of MSmédecine/sciences : m/s
Med Sci (Paris). 2008 August; 24(8-9): 771–775.
Published online 2008 August 15. doi: 10.1051/medsci/20082489771.

Le libre accès
Une opportunité pour la recherche biomédicale

Nathalie Duchange,* Delphine Autard, and Nicole Pinhas

Inserm, Département de l’information scientifique et de la communication (DISC), Hôpital Paul Brousse, Pavillon Leriche, BP 1000, 14, avenue Paul Vaillant-Couturier, 94817 Villejuif Cedex, France
Corresponding author.
 

Le mouvement du libre accès se développe différemment selon les domaines. Les premières archives ont concerné le domaine de la physique dans les années 1990 alors qu’il a fallu attendre les années 2000 pour voir émerger le mouvement de manière significative dans le domaine biomédical. Cela s’explique par l’influence des spécificités propres à chaque communauté scientifique, conséquence des modalités de communication et d’évaluation, et de l’impact de l’édition scientifique.

Dans le domaine de la physique, l’habitude qu’ont les chercheurs d’échanger de manière informelle leurs résultats avant publication et la maîtrise des ressources informatiques [ 1], ont conduit à la mise en place de la première archive ouverte, ArXiv, créée par Paul Ginsparg en 1991, organisant la communication directe entre les chercheurs. Le domaine des mathématiques s’en rapproche, comme le décrit Pierre Bérard dans un article récent de Médecine Sciences [ 21]. À l’inverse, dans le domaine biomédical, c’est la prise de conscience des difficultés économiques et de la fragilité d’accès à la littérature scientifique qui ont initié le mouvement. Harold Varmus, alors directeur des National Institutes of Health (NIH), élabore un projet à l’origine de la première archive dans le domaine biomédical, PubMed Central (PMC)1, lancée en février 2000 [ 2, 3]. PMC propose aux éditeurs d’assurer la mise en ligne et la pérennité des archives électroniques de leurs revues avec un délai de six mois à un an. On reprocha à H. Varmus de vouloir détruire l’industrie de l’édition ce qui causa son départ de la direction des NIH. Avec d’autres scientifiques de renom, il lance début 2001 la pétition de la Public Library of Science (PLoS)2 visant à promouvoir le libre accès à l’information et engageant les chercheurs à publier dans les revues participant à PMC. Malgré le relatif succès de cette pétition (plus de 30 000 signataires), cet engagement fut difficilement applicable. PLoS se lance alors dans la création de revues électroniques en libre accès, initiative soutenue et financée par la fondation américaine privée Gordon et Betty Moore. L’idée était de démontrer que des revues de haute notoriété, à fort facteur d’impact, pouvaient exister et être gérées selon un nouveau modèle économique où l’auteur paie la publication de son article si celui-ci est accepté et en conserve ainsi tous les droits.

Au niveau européen, les institutions de recherche s’engagent en octobre 2003, au travers de la déclaration de Berlin [ 4], dans le mouvement du libre accès avec le soutien aux chercheurs pour la publication dans des revues en libre accès et le développement d’archives ouvertes.

En France, les établissements d’enseignement supérieur et de recherche choisissent une solution originale en optant pour une archive nationale commune et signent en juillet 2006 un protocole d’accord en vue d’une approche coordonnée pour l’archivage ouvert de la production scientifique3 [ 5]. Cet article décrit le contexte et les particularités du domaine biomédical qui ont motivé la mise en place par l’Inserm d’un portail institutionnel dans l’archive ouverte pluridisciplinaire française HAL (Hyper Article en Ligne).

Le contexte scientifique de la communication
L’attachement au modèle du « peer reviewing »
Dans le domaine biomédical, la communication des résultats scientifiques s’est construite sur un système de validation par les pairs au travers des comités de lecture des revues et sur un système de valeur basé sur une hiérarchie des journaux établie à partir du taux de citations. Celui-ci a pris une importance grandissante pour l’évaluation des chercheurs, pour le positionnement de la recherche et des institutions au niveau national et international [ 6]. Le « peer reviewing » désigne l’activité de relecture des articles soumis à une revue afin d’en évaluer à la fois la qualité et l’adéquation à la politique éditoriale. Cette activité est le plus souvent réalisée gratuitement par les chercheurs car elle fait, traditionnellement, partie intégrante de leur métier. Le fait que cette activité chronophage ne soit ni reconnue ni rétribuée est cependant dénoncé [ 7].

Les tentatives pour proposer un modèle plus ouvert et participatif peinent à s’imposer. Dans l’« open peer reviewing », les documents sont soumis à l’ensemble de la communauté, sous forme de pré-publication, c’est-à-dire sans une relecture préalable par des personnes sélectionnées pour leur compétence dans le sujet. Après une première expérience, qui sera interrompue en raison de commentaires insuffisants [ 8], Nature lance en 2007 la plate-forme Nature Precedings 4,. Cette plate-forme se veut un lieu d’échange, entièrement gratuit, de données scientifiques. Il est intéressant de noter que Nature Precedings n’accepte pas le dépôt de résultats d’essais cliniques ou de textes comprenant des avis trop précis sur des thérapeutiques. Cela illustre combien il est difficile de s’abstenir de la validation par des pairs dans un domaine où l’information possède un impact potentiellement dangereux. PloS ONE 5,, revue en libre accès couvrant différentes disciplines scientifiques, propose également un nouveau mode d’évaluation des articles : les critères d’acceptation par le comité éditorial sont basés uniquement sur les aspects techniques et expérimentaux, la signification des résultats n’étant pas prise en compte. La publication est alors soumise en ligne aux commentaires et annotations par la communauté scientifique. Enfin, citons Biology Direct 6, journal lancé par BioMed Central, éditeur indépendant de plus de 170 journaux en libre accès. L’idée est de supprimer l’opacité du « peer reviewing » et l’anonymat des relecteurs : c’est l’auteur lui-même qui les choisit via le comité éditorial et les rapports de ces derniers sont publiés avec l’article s’il est accepté.

L’absence de facteur d’impact dans ces modèles de publication peut être un frein à leur implémentation sachant que la notoriété est un critère majeur pour les chercheurs dans leur choix d’une revue pour publier [ 9].

La confrontation de deux mondes
Le monde de l’édition scientifique est entré au moins en partie dans l’économie de marché : les regroupements entre éditeurs tendent à la création de multinationales. On peut distinguer deux grands types d’éditeurs : les éditeurs commerciaux qui représentent quelques sociétés aux portefeuilles de revues importants (Elsevier, Willey/Blackwell, Springer, Nature, Lippincott…), et de nombreux petits éditeurs qui appartiennent au monde des presses universitaires, des sociétés savantes, très spécialisées et représentant peu de titres.

Les bibliothèques numériques ont remplacé peu à peu celles des laboratoires et l’accès à distance aux sites web des éditeurs a remplacé la gestion matérielle de revues papier. Depuis les années 2000, tous les établissements de recherche et les universités ont mis en place, au niveau national ou local, des portails d’accès aux ressources électroniques permettant aux chercheurs de consulter, depuis n’importe quel lieu, des bibliothèques en ligne offrant les bases de données bibliographiques liées au texte intégral des revues dont l’inclusion dans la bibliothèque a été négociée. Le plus souvent les portails sont financés sur le budget général de l’établissement et les sommes engagées sont ignorées des chercheurs. Ainsi, l’Inserm a lancé le portail BiblioInserm7 avec l’appui technique de l’Inist/CNRS. Le rêve est devenu réalité : depuis son poste de travail, le chercheur peut naviguer de la référence au texte intégral, de PubMed à Nature ou Science. Il est devenu aussi naturel d’accéder aux revues essentielles que de voir couler l’eau du robinet. Aujourd’hui outil indispensable, le portail BiblioInserm reçoit de 60 à 80 000 visites par mois et regroupe en un point unique plus de 2 300 revues incluses après négociation auprès d’une cinquantaine d’éditeurs. La mise en place de ces portails, bien que rationalisant les achats et supprimant la multiplication des exemplaires papiers, n’a en rien diminué les coûts. Les négociations avec les éditeurs concernant les abonnements numériques sont le plus souvent basées sur le chiffre d’affaires papier réalisé avec l’établissement dans sa globalité, auquel s’ajoute un surcoût pour l’usage électronique. De plus, certains éditeurs obligent à souscrire à des collections entières - des bouquets - comportant à la fois les revues souhaitées, mais aussi des revues plus marginales. C’est ce qu’on a appelé le « big deal ». Face à des budgets limités, les centres de documentation sont conduits à supprimer les titres les moins utilisés et, pour compenser les pertes, les éditeurs augmentent les prix… la spirale des coûts continue, comme le montre une enquête réalisée en Angleterre [ 10].

Les éditeurs de revues prestigieuses détiennent un monopole, avec un marché captif qui, ces dernières années, a intéressé le monde de la finance. Ainsi les journaux des disciplines médicales ont vu leur coût augmenter de 317 % entre 1984 et 1998 et globalement, quel que soit le domaine, cette augmentation est d’environ 265 % alors que l’indice des prix à la consommation augmentait pour la même période de 54,5 % [ 11]. Si l’on regarde des données plus récentes, entre 2004 et 2008, l’augmentation moyenne du prix par revue se situe autour de 10 % par an [ 12]. Le marché de l’édition dans le domaine des sciences techniques et médicales est estimé entre 7 et 11 milliards de dollars US [ 13]. Le remplacement du papier par l’électronique pose aussi cruellement le problème de la pérennité des accès et de l’archivage électronique [ 14, 22] (→). Chaque année, nombre de titres changent d’éditeurs, ce qui résulte parfois en la perte de l’accès aux archives. On peut citer l’exemple de la revue Cardiovascular Research qui, en 2008, a quitté Elsevier pour Oxford University Press.

(→) m/s 2008, n° 6-7, p. 653

Accès à l’information, gratuité de Medline/Pubmed
Pour repérer l’information que l’on recherche parmi les millions d’articles publiés chaque année, il faut « un outil d’aiguillage » efficace. C’est le rôle des moteurs de recherche, mais surtout des bases de données de références bibliographiques qui structurent et analysent le contenu des revues de manière exhaustive. Il existe plusieurs centaines de bases de données généralistes ou spécialisées dans une thématique. Dans le domaine de la santé, une base de données est reconnue par la communauté des chercheurs comme faisant référence à la fois par son ancienneté et la qualité de son contenu et de son indexation : c’est Medline. Cette base, créée par la National Library of Medicine (NLM/NIH), comprend plus de 16 millions de références depuis 1950, issues d’environ 5 200 périodiques indexés à l’aide d’un thésaurus, le Medical Subject Headings (MeSH) riche de 25 000 descripteurs et dont l’Inserm assure la traduction française.

Dès 1997, le gouvernement américain, sous l’impulsion du vice-président Al Gore, a rendu gratuit l’accès à Medline via l’interface Pub Med. Al Gore déclara « Ce développement, en lui-même, fera peut-être plus pour réformer et améliorer la qualité des soins médicaux aux États-Unis que tout ce que nous avons pu faire depuis longtemps. Je le crois vraiment » [ 15]. La décision de rendre Medline accessible gratuitement à l’ensemble de la population mondiale au travers d’une interface conviviale et performante, eut un impact sans précédent. Aujourd’hui, plus de 3 millions de recherches par jour se font via Pub Med. Point d’entrée incontournable pour tout chercheur du domaine, c’est le socle sur lequel vont s’agréger d’autres ressources par des liens : bases de données génomiques, essais cliniques, archives ouvertes, portails des institutions et sites des éditeurs dans un continuum de l’information.

Le libre accès dans le domaine biomédical
Une notion encore confuse
La notion de libre accès est parfois confuse car le terme ne fait pas la distinction entre les articles disponibles sans restriction d’usage dans le modèle de l’auteur-payeur et les articles mis à disposition gratuitement sur les plateformes des éditeurs par ces derniers (voir Encadré 1). On pourrait qualifier la seconde situation d’articles en accès libre plutôt qu’en libre accès, mais l’usage de ces deux termes prête déjà à confusion dans la littérature. Peter Suber et Steven Harnad, deux leaders du mouvement, proposent de différencier les deux formes de libre accès par l’usage de termes appropriés dont le choix est actuellement débattu [ 16].

inline-graphic medsci2008248-9p771-img1.jpg

L’impact des revues en libre accès est aujourd’hui établi
Pour les revues en libre accès, les frais d’édition sont à la charge des auteurs et non plus des lecteurs. Les revues peuvent être en libre accès dans leur totalité ou pour une partie de leur contenu. On peut distinguer : les revues appliquant d’emblée le modèle du libre accès comme PLoS et BioMed Central, les revues qui ont basculé du modèle traditionnel au modèle auteur/payeur par exemple Nucleic Acids Research et les revues, de plus en plus nombreuses, qui proposent un modèle hybride, laissant le choix aux auteurs lors de l’acceptation de l’article. Le prix d’un article en libre accès varie entre 1 500 à 3 000 dollars US. Les premières revues en libre accès lancées par BioMed Central et PLoS ont dû attendre que leur notoriété soit établie pour devenir véritablement attractives pour les chercheurs. Aujourd’hui, leur rayonnement n’est plus en doute. Selon une étude réalisée en 2004 par la société Thomson sur l’impact des journaux en libre accès, plus de 200 sont répertoriés dans le Journal Citation reports (JCR) et possèdent de fait un facteur d’impact [ 17]. Dans le JCR 2006, dans le domaine « biochimie, biologie moléculaire », Plos Biology est au cinquième rang (FI = 14,101) derrière des titres comme Cell (FI = 29,194) et Nature Medicine (FI = 28,588).

Le nombre de revues en libre accès ne cesse de croître. Plus de 1 000 titres sont répertoriés dans le Directory of Open Access Journals (DOAJ)8 hébergé et réalisé par l’université de Lund en Suède, dont 259 en médecine, et 119 en biologie, avec une progression d’une centaine de titres par mois, tout domaine confondu.

Le domaine biomédical définit sa politique en matière d’archives ouvertes
Parallèlement au développement des publications en libre accès (golden road), celui des archives ouvertes (green road) a également pris de l’importance (voir Encadré 2).

inline-graphic medsci2008248-9p771-img2.jpg

En France, HAL voit le jour en 2001, créé par le Centre de la communication scientifique directe (CCSD) du CNRS. D’abord principalement utilisé dans les disciplines de la physique et des mathématiques, son usage va s’étendre à d’autres domaines et à un grand nombre d’organismes français d’enseignement et de recherche, particulièrement à la suite de la signature du protocole d’accord national [5]. Au HAL originel dit « générique », viennent alors s’ajouter différents portails thématiques (HAL-SHS pour les sciences humaines et sociales par exemple) et institutionnels HAL-INRIA, HAL-Inserm, HAL-Pasteur pour les sciences de la vie et bien d’autres encore. La création de ces portails permet de répondre à la politique des organismes et/ou aux besoins et spécificités des différentes disciplines. Néanmoins, chaque dépôt effectué à partir de n’importe quel portail rejoint le même réservoir de dépôts : HAL (pour une revue du sujet, voir [ 18]).

HAL-Inserm est le premier portail français dédié au domaine biomédical ; fruit d’une collaboration avec le CCSD, il ouvre en février 2006. Il répond à la politique définie par l’Inserm en matière d’auto-archivage et offre des fonctionnalités spécifiques. La direction de l’Inserm choisit de suivre la politique des NIH, et de rendre HAL compatible (interopérable) avec PMC. Ainsi, ne sont acceptés dans HAL-Inserm que les articles déjà publiés ou acceptés pour publication dans des revues à comité de lecture. Dans les archives ouvertes, c’est la dernière version de l’auteur (et non la version éditée) qui est déposée de manière générale. Pour faciliter le dépôt, HAL-Inserm fait le lien avec l’identifiant unique PubMed (PMID) et importe les données de référencement de la base PubMed vers HAL (auteurs, titre, résumé, journal, volume, pages…). Cette importation automatique permet d’assurer une grande qualité aux données bibliographiques accompagnant le dépôt et une cohésion des données entre HAL, PubMed et PMC. Cette fonctionnalité appréciée a été intégrée dans HAL générique pour tout dépôt dans le domaine des sciences du vivant.

Au niveau de chaque interface, des modérateurs vérifient la qualité des dépôts. Pour HAL-Inserm, ces contrôles s’effectuent autour de deux axes principaux : la qualité des informations accompagnant les dépôts et la mise en ligne des textes intégraux. Contrairement à HAL générique, où le déposant choisit lui-même la date de mise en ligne de son article, de façon immédiate ou avec embargo, dans HAL-Inserm, ce sont les modérateurs qui assurent ce rôle en respectant les conditions des éditeurs répertoriées pour la plupart sur le site SHERPA/RoMEO9. Cette « fonctionnalité » de HAL-Inserm a suscité la confiance des déposants vis-à-vis des éditeurs, le domaine du biomédical étant particulièrement sensible à cette problématique.

Les contrôles sont nécessaires pour permettre l’interconnexion avec PMC. En effet, le reversement des dépôts de HAL vers PMC, opérationnel depuis le printemps 2007, est le fruit d’une collaboration étroite avec le NCBI dont l’Inserm est partenaire depuis 1969. Les dépôts de HAL doivent être transformés au format XML structuré de PMC respectant la Journal publishing Tag Library [ 19]. Le reversement dans PMC a nécessité la mise en place d’un outil, développé avec le CCSD, qui permet la gestion du flux des articles entre HAL, la société américaine en charge de la conversion des fichiers en XML, et PMC. L’ensemble du processus a un coût non négligeable aussi bien financier qu’en temps humain, et il serait intéressant, dans un contexte européen, d’envisager des accords avec les éditeurs pour que ceux-ci déposent directement dans les archives. En moyenne, un article transféré à PMC coûte ainsi 35 € et 30 minutes de temps de personnel. À ce jour, plus de 300 articles ont été transférés.

Conclusion

Après quelques années d’expériences et de mesures prises pour inciter les chercheurs à rendre leurs travaux disponibles en libre accès, nombre d’organismes financeurs de la recherche adoptent des politiques plus implicites. Ainsi, une étape essentielle vient d’être amorcée aux États-Unis avec l’adoption début 2008 d’une loi qui rend obligatoire le dépôt dans PMC des résultats des recherches financées tout ou partie par les NIH, au plus tard 12 mois après publication. Les auteurs sont invités à vérifier, pour chaque article, que l’éditeur est en accord avec cette politique. Si tel n’est pas le cas, ils sont chargés d’informer celui-ci que l’article est soumis à la NIH Public Access Policy et sera déposé dans PMC.

En Angleterre, l’obtention de financements par le Wellcome Trust est conditionnée au dépôt des publications dans UK PMC, miroir de PMC. L’ANR incite les chercheurs français à déposer leurs publications dans HAL. On pourrait citer encore bien d’autres exemples.

Le mouvement du libre accès dans le domaine biomédical semble ainsi entrer dans l’ère d’une politique internationale commune. Les manières de procéder varient quelque peu, mais l’objectif est clairement affiché de rendre la recherche publique accessible dans l’intérêt de tous, ceci sans remettre pour autant en question le rôle fondamental joué par les éditeurs. Les institutions et les organismes financeurs peuvent ainsi avoir accès à la production scientifique issue de leurs laboratoires, données indispensables pour la planification de la recherche et la stratégie de gouvernance. Les chercheurs y ont un double intérêt : accéder à toute la littérature dont ils ont besoin et augmenter la visibilité de leurs travaux. Enfin, l’accès à l’information des étudiants, des patients, des associations de malades, des professionnels de santé et de la société dans son ensemble, est facilité. L’accès aux données biomédicales s’inscrit dans une forte demande sociétale comme en témoigne la popularité de la consultation des sites médicaux sur la Toile.

 
Footnotes
References
1.
De la Vega J. La communication scientifique à l’épreuve de l’internet : l’émergence d’un nouveau modèle. Collection « Référence » Presses de l’ENSSIB, Villeurbanne.
2.
Kleiner K. Freedom fighter. NewScientist 2003 : 2419.
3.
Poynder R. Open and shut. Interview with Harold Varmus, juin 2006 :
4.
Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, octobre 2003 : http://oa.mpg.de/openaccess-berlin/berlindeclaration.html.
5.
Protocole d’accord en vue d’une approche coordonnée, au niveau national, pour l’archivage ouvert de la production scientifique, juillet 2006 : http://www.archives-ouvertes.fr/spip.php ?article7.
6.
Baudoin L, Haeffner-Cavaillon N, Pinhas N, Mouchet S, et al. Indicateurs bibliométriques. Réalités, mythes et prospective. Med Sci (Paris) 2004; 20 : 909–15.
7.
Tite L, Schroter S. Why do peer reviewers decline to review ? A survey. J Epidemiol Community Health 2007; 61 : 9–12.
8.
Nature’s trial of open peer review, 2006 : http://www.nature.com/nature/peerreview/debate/index.html
9.
Warlick S, Vaughan K. Factors influencing publication choice : why faculty choose open access. Biomedical Digital Libraries 2007; 4: 1–12.
10.
Creaser C, Maynard S, White S. Featuring trend analysis of UK public and academic libraries 1995-2005. Lisu annual library statistics, 2006 :http://www.lboro.ac.uk/departments/ls/lisu/downloads/als06.pdf
11.
An Economic Analysis of Scientific Research Publishing. A report commissioned by the Wellcome Trust, 2003 : http://www.wellcome.ac.uk/About-us/Publications/Books/Biomedical-science/WTD003181.htm
12.
Van Orsdel LC, Born K. Periodicals Price Survey 2008: Embracing Openness. Library Journal, 2008 : http://www.libraryjournal.com/article/CA6431958.html
13.
Study of the economic and technical evolution of the scientific publication markets in Europe. Report from the European Commission, janvier 2006 : http://ec.europa.eu/research/science-society/pdf/scientific-publication-study_en.pdf.
14.
Lalöe F. Attention, l’humanité perd la mémoire. Le Monde, 27 janvier 2008.
15.
Kotzin S. La sélection des périodiques pour Medline. World Library and Information Congress : 71st IFLA General Conference and Council, août 2005 : http://www.ifla.org/IV/ifla71/papers/174-Kotzin-trans-fr.pdf
16.
Suber P. Strong ans weak OA, 29 avril 2008 : http://www.earlham.edu/~peters/fos/2008/04/strong-and-weak-oa.html
17.
The Impact of Open Access Journals. A Citation Study from Thomson ISI, 2004 : http://scientific.thomson.com/media/presentrep/acropdf/impact-oa-journals.pdf
18.
Baruch P. Open access developments in France : the HAL Open Archives System. Learned Publishing, 2007 : 20 : 267–82.
19.
Journal Publishing Tag Set Tag Library, mars 2007 : http://dtd.nlm.nih.gov/publishing/tag-library/2.3/index.html
20.
Bethesda Statement on Open Access Publishing, juin 2003 : http://www.earlham.edu/~peters/fos/bethesda.htm
21.
Bérard P. Le rôle des publications en mathématiques. Med Sci 2008.
22.
Huc C. la pérennisation des infomrations sous forme numérique : risque, enjeux, et élémetns de solution. Med Sci 2008; 24 : 653–7.