Voici une conférence donnée à l’invitation de Consilium Scientific le 18 mai 2023, organisée par Leeza Osipenko. Consilium joue un rôle essentiel dans la remise en question de la qualité des preuves dont nous disposons en médecine, en particulier pour ce qui concerne les essais cliniques randomisés contrôlés (ECR). Ces derniers mois, ils ont été à l’origine d’excellentes contributions, consultables sur leur site web. Mon intervention a été suivie d’un temps de questions/réponses qui a comporté son moment de suspense.

Comme nous le faisons habituellement, Bill James et moi avons aussi enregistré une version de cette conférence qui me semble assez efficace.

Cette conférence reprend des idées que l’on retrouve plus développées dans le travail de Sander Greenland, qui contient cette phrase mémorable : D’abord, ne pas nuire au savoir.

Adaptée par nos soins, cela donnerait :  Ne transforme pas ce qui est bon en poison.

Ariane Denoyel, l’auteur de Génération Zombie, est l’auteur de la version française de cette conférence avec l’aide de Bruno Harle de qui vient la phrase originale – Evident Based Medicine – Voir False Friends.   La version anglaise de cette conférence est ici –  God Does not Play Dice.

Abel Novoa, de No Gracias, a rédigé une version espagnole et ajouté quelques diapositives supplémentaires – Dios no juega a los dados ¿Deberían hacerlo los médicos?

Nous parlons souvent de ce qui peut être perdu dans la traduction, mais la traduction peut également découvrir des choses et nécessite souvent bien plus que la traduction de mots – en conséquence, j’ai utilisé le mot l’auteur plutôt que traducteur.

Einstein

On sait qu’Einstein a déclaré un jour : “Dieu ne joue pas aux dés.” En France, le jeu de dés a donné naissance à la théorie des probabilités, laquelle a ensuite contribué à créer ce que nous appelons aujourd’hui les statistiques médicales. Il y a 75 ans, nous avons appliqué les statistiques médicales à la création d’essais contrôlés randomisés (ECR). Ces essais servent à évaluer les paris que nous prenons sur les médicaments. Les ECR ont conduit à la “médecine fondée sur les preuves”, Evidence-Based Medicine (EBM). Lorsqu’ils prescrivent un medicament – donc lorsqu’ils lancent un dé – les médecins se fient à l’EBM.

Ont-ils raison d’avoir ainsi confiance en elle ?

Slide 2:             Cinquante ans après le premier ECR, en 1998, Don Schell, un solide retraité du pétrole vivant dans le Wyoming, a été mis sous paroxétine pour un problème de sommeil mineur. Quarante-huit heures plus tard, il a tiré sur sa femme, sa fille et sa petite-fille, puis a retourné l’arme contre lui-même. Son gendre survivant a intenté une action en justice contre GlaxoSmithKline (GSK) – le procèsTobin contre SmithKline.

Dans l’affaire Tobin, on a demandé à Ian Hudson, directeur chargé de la sûreté du médicament chez GSK : “Les ISRS – la famille d’antidépresseurs à laquelle appartient la paroxétine, la fluoxétine (Prozac), etc. – peuvent-ils provoquer le suicide ?” Il a botté en touche en évoquant les règles de l’EBM, règles auxquelles GSK se plie, ce qui signifie que l’entreprise fonde ses opinions sur des essais contrôlés randomisés (ECR) – qui utilisent les probabilités pour déterminer la vérité.

Un jury de 12 personnes ordinaires, sans expérience dans le domaine de la santé, a fait primer l’évidence sur la “médecine fondée sur les preuves” brandie par Ian Hudson. Leur diagnostic, leur verdict, était : il était évident que la paroxétine était responsable et que GSK était coupable de négligence. Le jury a préféré la médecine fondée sur l’évidence plutôt que l’Evidence-based medicine.

Pourtant, c’est le point de vue de Hudson qui s’est imposé. Il reste aujourd’hui dominant, jusqu’aux plus hautes sphères du régulateur britannique des médicaments, dont Ian Hudson est par la suite devenu directeur général – ainsi qu’au sommet des autorités sanitaires : la FDA, l’EMA et autres régulateurs.

 

Slide 3:           L’argument brandi par Hudson trouve son origine 70 ans plus tôt, dans le travail d’un homme étrange – Ronnie Fisher. Sur cette photo, vous voyez Fisher fumant une pipe. Plus tard, quand un lien a été établi entre le tabagisme et le cancer du poumon, Fisher ne l’a pas cru. Les preuves n’étaient pas son point fort.

C’est donc encore plus étonnant que ses opinions, proférées voici plusieurs décennies, aient encore un impact si fort sur la façon dont nous pensons et vivons aujourd’hui. C’est à cause de deux facteurs : la randomisation et la significativité statistique.

Fisher n’était pas médecin et n’a jamais dirigé d’essai clinique randomisé. Les essais contrôlés et la randomisation étaient là avant lui, mais son livre The Design of Experiments (Les méthodes statistiques adaptées à la recherche scientifique) les a rendus incontournables.

Fisher essayait de déterminer les caractéristiques de la connaissance, de l’expertise. Nous disposons tous d’expertise. Par exemple, sur les parachutes : tout le monde sait que si on embarque 40 personnes dans un avion, en ne donnant un parachute qu’à 20 d’entre eux, et qu’on les pousse tous dans le vide, ceux qui portent des parachutes survivront et les autres mourront. Fisher confirme que c’est vrai et notre expertise commune en la matière est validée.

Mais des facteurs auxquels on n’a pas pensé pourraient entrer en jeu, par exemple la présence dans le groupe dépourvu de parachute d’une personne dotée de pieds palmés pourrait faire une petite différence sur le résultat final : une personne du groupe sans parachute pourrait survivre.

De même, si une bourrasque providentielle permet à un participant sans parachute d’atterrir sain et sauf sur des arbres couverts de neige – c’est arrivé – cela peut changer le résultat. Mais même si, parmi les 20 personnes sans parachute, l’une survit, nous ne dirons pas que l’expert s’est trompé et que les parachutes ne servent à rien. Alors il faudrait peut-être décider d’une valeur à partir de laquelle les fluctuations liées au hasard ont peu de chances d’expliquer la différence entre les deux groupes.

On doit donc procéder à une randomisation : une répartition aléatoire des participants dans les groupes, pour tenir compte des facteurs comme les pieds palmés ou la bourrasque salvatrice. Le livre de Fisher a érigé cette randomisation en une méthode d’une puissance presque mystique – qui prétend nous aider à vaincre l’ignorance. Et nous faisons confiance à cette méthode pour nous faire connaître la vérité en matière de médicaments.

Mais la randomisation ne peut pas faire disparaître l’effet de la variable « ignorance ».

 

Slide 4:            L’expert vu par Fisher est un Robin des Bois qui 19 fois sur 20 peut fendre une flèche déjà logée au cœur de la cible. L’expertise est précise.

 

Slide 5:          Les essais cliniques randomisés réalisés pour homologuer des médicaments, en particulier des antidépresseurs, ressemblent à ceci plutôt qu’au cœur de cible transpercé par Robin des Bois. Rater la cible à ce point-là indique que nous n’avons pas affaire à de l’expertise.

Slide 6:          Tony Hill a dirigé le premier essai randomisé contrôlé de l’histoire de la médecine en 1947, pour voir ce que donnait l’antibiotique streptomycine sur la tuberculose. Hill a ensuite fait connaître le rôle du tabagisme dans le cancer du poumon. Il n’avait pas de temps à perdre avec Fisher et ses théories. Il savait aussi que les médecins n’étaient pas des experts. Son essai clinique n’était pas la démonstration d’une expertise. Il a utilisé la randomisation comme méthode d’allocation équilibrée au sein des groupes – et non pour tenter de maîtriser des inconnues improbables.

L’essai clinique de Hill en a découvert moins sur la streptomycine qu’un essai antérieur non randomisé de la clinique Mayo, qui a montré qu’elle peut provoquer la surdité et qu’une tolérance se développe rapidement.

Slide 7:          Dans une conférence de 1965, Hill a fait un sort aux essais randomisés. Il a remarqué que ceux qui les promeuvent le plus activement sont les firmes pharmaceutiques.

Hill ne pensait pas que les essais devaient être randomisés. Il pensait que le fait d’instaurer un « double aveugle » – le patient ignore s’il reçoit la substance active ou le placebo et le médecin qui le suit n’en sait rien non plus – pouvait empêcher les médecins d’évaluer un médicament. Il croyait en la médecine basée sur l’évidence plutôt qu’en la médecine basée sur les preuves.

Quinze ans auparavant, en 1950, le même Hill avait déclaré que nous avions besoin d’essais randomisés pour déterminer si quelque chose fonctionnait. Pourtant, dès 1960, nous disposions de beaucoup de nouveaux médicaments très efficaces, mais aucun n’avait été découvert par des essais randomisés. Il aurait fallu déterminer quel médicament marchait le mieux. Or ce n’est pas une réponse que les essais randomisés peuvent donner – et d’ailleurs la notion de meilleur médicament n’a pas vraiment de sens. La panacée n’existe pas, il faut toujours un parti-pris clinique pour estimer quel médicament va vous convenir à vous.

Hill a également déclaré que les ECR produisent des effets moyens, qui ne sont pas très utiles pour aider le médecin à décider ce qu’il faut faire pour le patient en face de lui. Ils peuvent être utiles pour savoir si un médicament a ou non un effet sur un problème bien ciblé.

Hill dit bien cela, dans la citation que vous voyez : les essais randomisés peuvent aider à évaluer un effet d’un médicament, ce qui signifie qu’ils ne sont pas un bon moyen d’évaluer un médicament dans son ensemble. Tous les ECR génèrent de l’ignorance, mais nous pouvons tirer le meilleur parti de ce défaut si nous le gardons bien à l’esprit. Hill n’a jamais envisagé que les ECR remplaceraient le jugement clinique.

Slide 8:           Cet essai de 1960 dirigé par Louis Lasagna illustre parfaitement la réflexion de Hill. L’essai montre que la thalidomide a une efficacité thérapeutique en tant que somnifère, mais il n’a pas repéré qu’elle provoque des dysfonctions sexuelles – comme celles qui surviennent à cause des antidépresseurs ISRS – des tendances suicidaires, de l’agitation, des nausées et des neuropathies périphériques.

Deux ans plus tard, Lasagna était à l’origine de l’exigence d’essais randomisés dans une loi – le  FDA Act de 1962 – afin d’éviter que ne survienne un autre scandale comme celui de la thalidomide. Il est donc devenu le premier responsable de l’utilisation des ECR. Paradoxalement, le mécanisme qu’il a imposé pour éviter un nouveau scandale de la thalidomide est celui même qui a permis à cette molécule d’arriver sur le marché. Plus que quiconque, Louis Lasagna est responsable de la généralisation des ECR dans le médicament.

 

Slide 9:           Beaucoup de gens prétendent que rien ne vaut un essai clinique randomisé pour démontrer un lien de causalité entre une substance et un effet.

Pourtant on a vu apparaître pendant les années 1950 les meilleurs antihypertenseurs, hypoglycémiants, antibiotiques et psychotropes de l’histoire de la médecine – le tout sans l’apport d’ECR.

L’imipramine, le premier antidépresseur, est beaucoup plus puissant que les ISRS. Il peut traiter la dépression grave, dite « mélancolique » – les ISRS en sont incapables. Cette dépression s’accompagne d’un risque de suicide multiplié par 80.

L’imipramine a été lancée en 1958. Lors d’un colloque en 1959, des experts ont fait remarquer que même s’il s’agissait d’un traitement merveilleux, il rendait certaines personnes suicidaires. Arrêtez le médicament et la tendance suicidaire disparaît. Réintroduisez-le et la suicidalité revient. C’était ça, la médecine fondée sur l’évidence.

Voici une synthèse de résultats d’un essai clinique comparant l’imipramine à un placebo dans la dépression mélancolique. On s’attendrait à ce que les points rouges indiquant les tentatives de suicide soient moins nombreux avec l’imipramine, parce que même si l’imipramine peut provoquer des suicides, elle améliore l’état des personnes atteintes de cette maladie à haut risque. Cette image pourrait ainsi être interprétée comme une preuve que l’imipramine ne peut pas provoquer le suicide.

 

Slide 10:         Dans les essais sur la dépression légère à modérée qui ont permis de mettre les ISRS sur le marché, on voit une augmentation des événements suicidaires par rapport au placebo. En effet, chez ces personnes présentant un risque de suicide faible voire inexistant, l’effet suicidogène du médicament apparaît plus clairement.

Slide 11:         Dans ces essais sur la dépression légère, quand on utilise l’imipramine comme comparateur, on peut observer que l’imipramine provoque, elle aussi, des suicides.

Ces conclusions diamétralement opposées découlent de la différence entre les essais cliniques de traitement, sur des personnes déprimées, et les essais de médicaments, sur des volontaires sains. Si la maladie et le traitement produisent des effets assez similaires, les essais randomisés créent de la confusion au lieu de clarifier la situation. Ce principe se vérifie pour la plupart des maladies et pour leurs traitements.

Lorsqu’un patient devient suicidaire dans un essai, vous devez utiliser votre jugement clinique pour comprendre ce qui se passe. Sauf que dans les ECR, les cliniciens ne sont pas censés utiliser leur jugement.

Slide 12:          Voici à quoi ressemble un essai de médicament, mené sur des « volontaires sains », des gens qui ne sont pas malades. En menant des études sur des volontaires sains dans les années 1980, les entreprises ont découvert que les ISRS rendaient les volontaires suicidaires, créaient des dépendances et provoquaient des dysfonctionnements sexuels. Lorsque ces médicaments ont été lancés, personne ne nous a parlé de ces problèmes. C’est en partie parce que les essais de médicaments – donc sur les volontaires sains – ont permis aux entreprises de concevoir les essais de traitement – donc sur les malades – pour masquer ces problèmes.

Slide 13:         Il y a plus de décès sous ISRS que sous placebo dans les essais, mais les ECR, comme Ian Hudson vous l’a dit, montrent que les médicaments fonctionnent. C’est parce que leur efficacité est mesurée par des critères de substitution, des paramètres secondaires. Pour les antidépresseurs, c’est l’échelle d’évaluation de la dépression de Hamilton. Quinze ans après l’avoir créée, Max Hamilton a commenté sa propre échelle :

« Il se peut que nous assistions à un changement aussi révolutionnaire que l’était l’introduction de la standardisation et de la production de masse dans l’industrie manufacturière. Les deux ont leurs côtés positifs et négatifs. »

Hamilton considérait son échelle comme une liste rassemblant les questions à poser lors d’un entretien – ce qui comporte du positif et du négatif.

Leave a Reply

Your email address will not be published. Required fields are marked *