La reproductibilité de la recherche a trait à la capacité par un tiers à reproduire le résultat d’un travail scientifique publié par exemple dans une revue. C’est un élément clé de toute démarche scientifique qui permet d’une part une vérification et d’autre part une amélioration continue de l’état des connaissances dans un domaine. Néanmoins la technicité et la rapidité avec laquelle la recherche opère désormais semble avoir mis à mal cette capacité et nous avons assisté ces dernières années à une “crise de la reproductibilité” de la science, largement mondialisée et transdisciplinaire, qui concourt à la défiance de la société à l’égard du monde de la recherche. Cette crise conduit l’ensemble des disciplines à revoir leurs méthodologies et leurs pratiques de publications et provoque une mutation profonde.

La capacité à reproduire des résultats peut s’entendre de façon plus ou moins restrictive selon le contexte. Lorsque l’on parle de reproductibilité en science computationnelle par exemple, on se concentre avant tout sur la capacité à reproduire le résultat d’un calcul. Pour cela il est essentiel de disposer d’un accès aux données d’entrée, au programme utilisé, à son environnement, à la façon dont il a été exécuté, aux informations permettant de justifier l’emploi de telle ou telle méthode statistique, etc. L’absence fréquente de ces informations dans les articles publiés est une des causes sous-tendant cette crise de la reproductibilité et les exigences des processus d’évaluation sont donc en train d’évoluer en conséquence.

Dans de nombreuses disciplines computationnelles telles que la physique des particules ou la génomique, la reproductibilité passe par la mise à disposition et l’utilisation commune de bases de données et de logiciels open source.  Le journal Science demande par exemple désormais à ce que les données des articles soumis soient déposées dans une banque :

“Therefore, before publication, large data sets must be deposited in an approved database and an accession number or a specific access address must be included in the published paper.”

Si l’informatique, et en particulier ses aspects infrastructures, sont moins exposés médiatiquement que des domaines comme l’économie, la santé, ou la psychologie, elle n’en reste pas moins tout autant concernée. La communauté Réseau et Système Distribué est en effet loin d’être exemplaire en ce qui concerne la mise à disposition et la robustesse des statistiques présentées.

Animateurs 

Événements