Paul de Brem
Le 11 septembre 2001, quatre avions s’écrasaient aux États-Unis. Certains ont considéré que ce drame aurait pu être évité. Les services de renseignements disposaient en effet des informations relatives à cet attentat. Ils n’ont cependant pas été capables de repérer ces données au sein de l’ensemble des informations recueillies. L’existence d’un déluge d’informations a peutêtre été à l’origine de cette situation. Cet événement peut-il être comparé au travail des biologistes, qui seraient également submergés par une abondance de données ?
Bruno J. Strasser
Selon de nombreux commentateurs, un véritable « déluge informationnel » (data deluge) s’abattrait aujourd’hui sur le monde, et la condition moderne se caractériserait par une surabondance de données (information overload), représentant à la fois une menace et une opportunité (Figures 1 et 2). The Economist, par exemple, a avancé l’idée selon laquelle notre incapacité à donner sens aux abondantes données économiques serait à l’origine des crises financières et le magazine Wired est allé jusqu’à annoncer la fin de la science basée sur des hypothèses, des théories, et des expériences, remplacée aujourd’hui par une science fondée sur l’analyse de données (data-driven science). L’émergence de cette nouvelle notion a enthousiasmé l’industrie, en particulier l’industrie informatique et l’industrie du logiciel. Microsoft a ainsi popularisé l’idée de l’avènement d’une nouvelle science correspondant à un « quatrième paradigme » dans la production du savoir scientifique.
C’est dans le domaine de la génomique que les conséquences de ce déluge informationnel ont suscité le plus de discussions. Dès la fin des années 1990, le biologiste moléculaire David Botstein annonçait la naissance d’une nouvelle science dont l’objet était la collection et l’analyse des données1. Cette science nous permettrait de découvrir dans les données expérimentales des choses que nous ne suspections même pas. La science n’aurait alors plus pour fondement de tester des théories et des modèles, mais de produire des connaissances à partir de données (data-driven science). Néanmoins, des débats existent sur la valeur et l’intérêt de cette nouvelle approche. Elle suscite les critiques, voire le scepticisme de certains scientifiques, et des philosophes avancent souvent l’idée qu’il est impossible de produire de nouvelles connaissances sans définir d’hypothèse préalable.