« Il faudra garder en mémoire ce cas d’école qui concentre tout ce qu’il ne faut pas faire en science ». En une phrase, le Pr Mahmoud Zureik, directeur du groupement d’intérêt scientifique EPI-PHARE (ANSM, CNAM) et professeur d’épidémiologie et de santé publique à l’Université de Versailles-Saint Quentin, résume l’invraisemblable cocktail d’erreurs et de précipitation qui ont conduit le « Lancet » puis le « New England Journal of Medecine » à rétracter deux études fondées sur des données de patients assemblés par la start-up américaine Surgisphere.
Entre le 22 mai et le 4 juin, la prestigieuse revue britannique du « Lancet » a publié puis retiré des résultats tendant à démontrer que la prescription d’hydroxychloroquine, associée ou non à un macrolide, ne semblait pas efficace pour traiter le Covid-19 et était associée à un surrisque de décès de plus de 30 %. Ces résultats issus des données de plus de 96 000 patients ont eu un retentissement énorme, poussant l’OMS à demander la suspension des essais cliniques évaluant l’efficacité de l’hydroxychloroquine dans cette indication.
Simultanément, ces travaux s’attiraient les foudres des méthodologistes. « Quand j’ai lu l’article, je me suis demandé comment il était possible de rassembler les données d’un si grand nombre d’hôpitaux, avec une qualité en apparence quasi parfaite », se souvient notamment Rodolphe Thiebaut, directeur de recherche du centre « Épidémiologie et Biostatistiques » et médecin attaché à l’unité de soutien méthodologique à la recherche clinique et épidémiologique du CHU de Bordeaux.
Mis face à des incohérences, trois des quatre auteurs se sont rétractés avant que l’étude ne soit finalement retirée par le « Lancet » lui-même. Un phénomène rare pour la prestigieuse revue britannique : le plus célèbre précédent étant l’étude frauduleuse du Dr Wakefield de 1998 établissant un lien entre vaccination et risque d’autisme. Dans la foulée de ces révélations, une autre étude publiée était retirée par le « New England Journal of Medicine ». Cette dernière s’appuyait sur les données de près de 9 000 patients, également rassemblées par Surgisphere, pour analyser les liens entre traitement par l’enzyme de conversion et mortalité chez les patients Covid+.
La frénésie de publication
La rapidité avec laquelle les études sur le Covid-19 sont actuellement publiées est souvent évoquée pour expliquer cette débâcle. « La recherche clinique pendant l’épidémie de Covid n’est pas, à de rares exceptions près, de très bonne qualité, et cet article n’est pas un cas unique, regrette le Pr Zureik. Les relecteurs reçoivent beaucoup de papiers et n’ont pas le temps de valider la provenance des données. »
Les articles traitant de sujets relatifs au Covid-19 passent par des procédures « Fast Track » dans le « Lancet ». Cette procédure est utilisée quand retarder une publication fait courir un risque aux patients. La procédure de revue accélérée vise à accepter ou non un papier en moins de dix jours ouvrables, et de le publier moins de dix jours après cette décision. Des durées encore racourcies en période de Covid-19 : « l’évaluation a duré deux ou trois jours contre un à deux mois en temps normal », explique le Pr Zureik. Des échelles de temps propices aux erreurs, parfois même de bonne foi.
L’état d’urgence et le manque de temps sont-ils seuls responsables ? « La fraude scientifique existe en dehors des crises, nuance Rodolphe Thiebaut. Cette affaire est caricaturale car il s’agit d’un problème de fraude caractérisée dans un article qui a eu un impact énorme et immédiat. Mais un tel événement doit inciter à davantage de vigilance sur les questionnements éthiques au quotidien. » Il cite en cela les constatations du rapport Corvol de 2016, qui a été à l’origine de la création de plusieurs comités et de chartes d’intégrité scientifique. Selon ce rapport, si la fraude proprement dite reste rare, les arrangements méthodologiques à la marge sont fréquents.
Quelle place pour les données de la vie réelle
Le cas Surgisphere soulève aussi des questions sur la place et le traitement à réserver au Big Data dans la recherche. « C’est l’un des nouveaux challenges : comment extraire des connaissances scientifiques depuis des données qui ne sont pas faites pour ça à l’origine ? questionne Rodolphe Thiebaut. Cela nécessite de nouvelles méthodologies, et de se donner les moyens d’une intégrité scientifique, même en période de crise. »
Dans le cas de l’entrepise Surgisphere, basée à Chicago, la rigueur attendue n’était pas au rendez-vous. Dans des réponses adressées au « Lancet », plusieurs observateurs constatent des erreurs dans les données d’origine australienne. Par la suite, les journalistes de plusieurs rédactions, dont nos confrères du « Parisien », ont contacté les hôpitaux de Melbourne et de Sydney supposés avoir participé à la base de données. Tous ont nié avoir eu un rôle dans cette publication. Surgisphere refuse par ailleurs de dévoiler sa méthodologie de collecte des données, invoquant un risque juridique mais aussi pour l’anonymat.
« Les données proviennent probablement de sociétés qui collectent des données hospitalières pour permettre aux établissements d’avoir un retour sur leurs activités et aux industriels d’avoir des informations sur leurs produits. On ignore tout de la manière dont ils travaillent : Comment les données sont-elles aspirées ou récupérées ? Quel type de contrat lie Surgisphere aux établissements ? Les données ont-elles été retouchées ? s’interroge le Pr Zureik. Je ne crois pas que ces données aient été inventées, mais nous avons affaire à des données malmenées. »
Ce besoin d’intégrité se heurte à la problématique de la propriété des données, surtout celles des nouveaux acteurs tels que Google, Microsoft ou même les opérateurs téléphoniques. « On ne parviendra pas à une transparence totale si un acteur comme Google ne communique pas ses algorithmes, juge Rodolphe Thiebaut. Tous les professionnels du domaine veulent travailler dans un cadre éthique et légal, empêchant l’exploitation à mauvais escient des données de santé. À ce titre, le règlement européen RGPD est une véritable avancée. »