https://frosthead.com

La grande majorité des données brutes provenant d’anciennes études scientifiques peuvent maintenant manquer

L'un des fondements de la méthode scientifique est la reproductibilité des résultats. Dans un laboratoire du monde entier, un chercheur devrait être en mesure d'étudier le même sujet qu'un autre scientifique et de reproduire les mêmes données, ou d'analyser les mêmes données et d'observer les mêmes tendances.

C'est pourquoi les résultats d'une étude publiée aujourd'hui dans Current Biology sont si inquiétants. Lorsqu'un groupe de chercheurs a tenté d'envoyer par courrier électronique aux auteurs de 516 études biologiques publiées entre 1991 et 2011 et de demander les données brutes, ils ont été consternés de constater que plus de 90% des données les plus anciennes (issues de documents écrits il y a plus de 20 ans) étaient inaccessible. Au total, même en incluant les articles publiés en 2011, ils n’ont pu retrouver les données que pour 23%.

"Tout le monde sait en quelque sorte que si vous demandez à un chercheur des données d'anciennes études, il vous tracassera, car il ne sait pas où il se trouve", déclare Timothy Vines, zoologiste à l'Université de la Colombie-Britannique, qui a dirigé l'effort. "Mais il n'y avait jamais eu d'évaluation systématique de la rapidité avec laquelle les données détenues par les auteurs disparaissaient."

Pour faire son estimation, son groupe a choisi un type de données relativement cohérent dans le temps - mesures anatomiques de plantes et d'animaux - et a extrait entre 25 et 40 papiers pour chaque année impaire au cours de la période qui utilisait ce type de données. s'ils pouvaient traquer les chiffres bruts.

Un nombre surprenant de demandes de renseignements ont été interrompues au tout début: pour 25% des études, les adresses e-mail actives étaient introuvables, les adresses obsolètes apparaissant sur le document lui-même et les recherches sur le Web ne faisant apparaître aucune adresse actuelle. Pour 38% des études, leurs requêtes n'ont abouti à aucune réponse. 7% des ensembles de données ont été perdus ou inaccessibles.

"Parfois, par exemple, il était sauvegardé sur des disquettes de trois pouces et demi, de sorte que personne ne pouvait y accéder, car ils ne disposaient plus des lecteurs appropriés", explique Vines. Étant donné que l'idée de conserver les données est telle qu'elle peut être utilisée par d'autres dans des recherches futures, cette sorte d'obsolescence rend les données inutiles.

Cela peut sembler être un obstacle banal, mais les scientifiques sont comme tout le monde - ils changent d’adresses électroniques, ils obtiennent de nouveaux ordinateurs avec des disques différents, ils perdent leurs sauvegardes de fichiers - ces tendances reflètent donc de sérieux problèmes systémiques en science.

Et la préservation des données est si importante qu'il convient de la rappeler car il est impossible de prédire dans quelle direction la recherche évoluera à l'avenir. Vines, par exemple, a mené ses propres recherches sur une paire d’espèces de crapaud originaires d’Europe de l’Est qui semblent être en cours d’hybridation. Dans les années 1980, a-t-il expliqué, une équipe distincte de chercheurs travaillait sur le même sujet et est tombée sur un vieil article qui documentait la distribution de ces crapauds dans les années 1930. Sachant que leur distribution avait relativement peu changé au cours des décennies, les scientifiques ont pu effectuer toutes sortes de calculs qui n'auraient pas été possibles autrement. "Les données originales disponibles, issues d'une très petite étude ancienne écrite en polonais, ont été incroyablement utiles aux chercheurs arrivés 70 ans plus tard", a-t-il déclaré.

Il y a aussi le fait qu'une grande partie de cette recherche est financée par un financement public, une grande partie provient de subventions qui stipulent que les données résultantes doivent être mises à la disposition du public. De plus, les données de champ sont affectées par les conditions de l'environnement dans lequel elles sont collectées. Il est donc impossible de reproduire parfaitement une réplique ultérieure, lorsque les conditions ont changé.

Quelle est la solution? Certaines revues, y compris Molecular Ecology, dont Vines est l'éditeur principal, ont adopté des règles qui obligent les auteurs à soumettre des données brutes avec leurs articles, ce qui permet à la revue elle-même de les archiver à perpétuité. Bien que les revues, comme les personnes, soient susceptibles de changer d'adresse électronique et de devenir obsolètes, ces problèmes peuvent être gérés beaucoup plus facilement à l'échelle institutionnelle.

La grande majorité des données brutes provenant d’anciennes études scientifiques peuvent maintenant manquer