Quand on compare les statistiques concernant deux groupes différents (par exemple deux catégories de la population : vaccinés/non vaccinés), il faut faire attention à savoir si leurs caractéristiques ne sont pas trop éloignées, pour ne pas interpréter les résultats de manière erronée. Lucas Benjamin, Unsplash, CC BY
  • The Conversation

Le paradoxe de Simpson illustré par des données de vaccination contre le Covid-19

L’utilisation de statistiques peut être la source de résultats complètement contre-intuitifs, bien que démontrés rigoureusement. C’est ce que l’on appelle des paradoxes : un paradoxe n’est pas un résultat faux ou incompatible avec un autre résultat mais un résultat incompatible avec notre intuition.

Le paradoxe de Simpson

L’un des paradoxes de statistique les plus troublants est le paradoxe de Simpson, qui stipule qu’il est possible qu’un même phénomène ait lieu à l’intérieur de différents groupes, mais que ce phénomène s’inverse lorsque les groupes sont rassemblés. Il est à l’origine de nombreuses erreurs d’interprétations, même pour des mathématiciens aguerris.

En voici un exemple marquant, que nous avons trouvé dans les données d’hospitalisation et de vaccination en Angleterre.

Dans ces rapports, qui donnent les statuts de vaccinations des

personnes hospitalisées du variant Delta du Covid entre juin et septembre 2021 (les données, les références complètes et les calculs sont donnés dans cet annexe), on observe que :

  1. parmi les moins de 50 ans, le taux de mortalité est environ 1,8 fois plus élevé chez les non-vaccinés que chez les vaccinés (ou partiellement vaccinés) ;

  2. parmi les plus de 50 ans, le taux de mortalité est environ 6,3 fois plus élevé chez les non-vaccinés que chez les vaccinés (ou partiellement vaccinés) ;

  3. par contre, dans la population prise dans son ensemble, le taux de mortalité est environ 1,3 fois moins élevé chez les non-vaccinés que chez les vaccinés (ou partiellement vaccinés).

Deux observations s’imposent. Premièrement, la dernière affirmation semble contredire les deux précédentes : comment expliquer que le vaccin abaisse le taux de mortalité à la fois parmi les plus de 50 ans et parmi les moins de 50 ans, mais l’augmente si l’on considère la population dans son ensemble ?

Deuxièmement (et de manière plus inquiétante), si l’on se base sur les moins de 50 ans et les plus de 50 ans séparément (c’est-à-dire si on regarde les points 1 et 2) ou si l’on considère la population prise dans son ensemble (c’est-à-dire si on regarde le point 3, sans différencier les plus ou moins de 50 ans), on aboutit à des conclusions complètement opposées quant à l’efficacité du vaccin. Plus précisément, si on regarde les points 1 et 2, le vaccin semble efficace pour réduire la mortalité, à la fois chez les moins de 50 ans et chez les plus de 50 ans. Tandis que si l’on considère la population dans son ensemble (c’est-à-dire le point 3), il paraît tout à fait légitime de conclure que le vaccin n’est pas du tout efficace, voire dangereux.

Explication du paradoxe

Les chiffres précis que l’on a donnés plus haut sont présentés en annexe, mais donnons ici une explication générale de la façon dont ce paradoxe peut se produire.

L’idée principale est que la proportion de personnes vaccinées est très différente chez les plus de 50 ans (environ 95 % sur la période juin-septembre d’après la NHS) et chez les moins de 50 ans (environ 40 % sur la période juin-septembre).

En effet, parmi les personnes non vaccinées, une grande proportion a moins de 50 ans et possède un taux de mortalité faible en raison de leur âge). En revanche, parmi les personnes vaccinées une grande proportion a plus de 50 ans et possède un taux de mortalité plus élevé (même en étant vacciné). Cela explique que, dans la population totale, le taux de mortalité des non-vaccinés puisse être inférieur au taux de mortalité des vaccinés.

Voici une représentation visuelle où le paradoxe apparaît de manière claire, avec des données caricaturales pour rendre le phénomène plus apparent :

Illustration du paradoxe de Simpson avec des données caricaturales : chaque personne est représentée par un carré, la couleur du carré correspondant à une classe d’âge, la teinte foncée ou claire au statut de vaccination ; une petite croix représente un décès. On peut comparer facilement les taux de mortalité dans chaque classe d’âge et par statut de vaccination. Quentin Berger et Francesco Caravenna, Fourni par l'auteur

Si l’on considère les personnes de moins de 50 ans ou de plus de 50 ans comme deux groupes séparés, il est clair que les taux de mortalité sont moins élevés dans la population vaccinée :

Pour le groupe des moins de 50 ans (bleu), le taux de mortalité est plus élevé chez les non-vaccinés (2,2 %) que chez lez vaccinés (0 %). Pour le groupe des plus de 50 ans (rouge), le taux de mortalité est plus élevé chez les non-vaccinés (40 %) que chez les vaccinés (13,3 %). Quentin Berger et Francesco Caravenna, Fourni par l'auteur

Toutefois, si l’on considère la population dans son ensemble, le taux de mortalité devient plus élevé parmi les vaccinés que parmi les non-vaccinés, comme on le voit sur la figure suivante :

Pour la population dans son ensemble, le taux de mortalité est plus élevé parmi les vaccinés (bleu foncé et rouge foncé, 12 %) que parmi les non-vaccinés (bleu clair et rouge clair, 6 %). Quentin Berger et Francesco Caravenna, Fourni par l'auteur

On voit que cela est dû au fait que parmi les personnes vaccinées, la plupart sont âgées de plus de 50 ans.

Quelles conclusions en tirer ?

Que conclure alors de ce paradoxe et de son explication ? Tout d’abord, qu’il faut prendre des précautions lorsque l’on manipule des statistiques et notamment lorsque l’on considère des groupes aux caractéristiques très différentes. En quelques mots, le paradoxe de Simpson tient dans le fait que le taux de vaccination est très variable d’une classe d’âge à l’autre : il est donc important de comparer l’efficacité du vaccin à l’intérieur de chaque classe d’âge, qui possède des caractéristiques plus homogènes.

Rassembler les différentes classes d’âge introduit ce que l’on appelle un « biais de sélection » : la population vaccinée est biaisée du côté de la population fragile (plus âgée) tandis que la population non vaccinée est biaisée du côté de la population moins fragile (plus jeune). Par conséquent, comparer le taux de mortalité chez les vaccinés et chez les non-vaccinés revient de facto à comparer une population plutôt âgée et une population plutôt jeune. L’affirmation que le taux de mortalité dans la population est plus élevé chez les vaccinés est donc foncièrement faussée par la grande variabilité du taux de vaccination pour les différentes tranches d’âge.

De la difficulté d’interpréter les statistiques

De façon plus générale, la problématique du biais de sélection est bien connue en statistique et fait partie des erreurs d’interprétation les plus courantes.

Un exemple classique est celui du statisticien Abraham Wald qui, durant la Seconde Guerre mondiale, après avoir observé tous les avions revenus du combat, recommanda de blinder les endroits où ceux-ci avaient été le moins touchés par des impacts de balles… Le raisonnement était que ces endroits constituaient les points les plus critiques pour le fonctionnement des avions et que ceux qui y étaient touchés avaient moins de chance de revenir du combat. Il s’agissait d’une manière de corriger ce qui est connu comme le « biais des survivants », qui consiste à faire des statistiques en ne conservant que les données de ceux qui survivent.

Les biais de sélection, qu’ils soient conscients ou non, font d’ailleurs souvent partie intégrante du procédé de récolte de données statistiques, ce qu’on voit bien dans l’exemple précédent. Il est important de savoir quels biais sont présents, pour corriger leur effet. Ainsi, le fait de comparer les taux de mortalité parmi les non-vaccinés et parmi les vaccinés comporte des biais d’âge, comme expliqué plus haut : une façon de corriger ce biais est de considérer les taux de mortalité pour les non-vaccinés et pour les vaccinés pour des tranches d’âge restreintes, à l’intérieur desquelles le taux de vaccination est stable.

Pour conclure, les paradoxes sont là pour nous rappeler, de manière particulièrement saisissante, les écueils à éviter. Grâce à leur côté surprenant, ils nous marquent et nous aident à aiguiser notre intuition, ou au moins à s’en méfier. Ils nous rappellent que personne n’est infaillible et qu’il n’est pas toujours facile ni immédiat de démêler certains problèmes, même simples : ils nous poussent à entraîner et approfondir notre réflexion, avec humilité.

Pour les amateurs de paradoxes, en voici quelques-uns parmi les plus classiques dans le domaine des probabilités : le paradoxe des anniversaires, le paradoxe de Bertrand, le problème de Monty Hall, le paradoxe des prisonniers, le paradoxe des enfants


Quentin Berger, Maître de conférence, Sorbonne Université et Francesco Caravenna, Full Professor of Mathematics (Probability and Statistics), University of Milano-Bicocca

Cet article est republié à partir de The Conversation sous licence Creative Commons. Lire l’article original.

The Conversation

Préparer ma rentrée 2023-2024

Retrouvez toutes les étapes pour bien préparer votre rentrée, du dépôt de vos candidatures jusqu'au début de votre année universitaire.

Préparer ma rentrée slider

Candidater en première année de licence sur Parcoursup

Les candidatures en licence s'effectuent sur la plateforme nationale en ligne Parcoursup. Retrouvez le calendrier ainsi que nos fiches conseil pour vous accompagner lors des différentes étapes de la procédure.

Candidater en première année de master

Les candidatures en master s'effectuent à partir de cette année sur la plateforme nationale en ligne Mon Master. Retrouvez toutes les étapes à suivre pour effectuer vos recherches et candidater aux formations qui vous intéressent.

candidater première année de master


Quand nous nous sommes réveillés

Par Luba Jurgenson

Nuit du 24 février 2022 : invasion de l'Ukraine

La ville des enfants

Par Sophie Corbillé

Fantasmagorie du capital dans un parc d'attractions globalisé

Graduate

25 000

Étudiantes et étudiants

193

Parcours de licence

192

Parcours de master

13

Sites et campus

Formations

Découvrez toute notre offre de formation

Médecine

La faculté de Médecine assure l’enseignement des 3 cycles d’études médicales : de la PASS (intégrée à la faculté) au 3e cycle incluant des DES, DESC, DU et DIU. Les enseignements sont dispensés principalement sur deux sites : Pitié-Salpêtrière et Saint-Antoine. La faculté dispense également des enseignements paramédicaux : l’orthophonie, la psychomotricité et l’orthoptie. Le site Saint-Antoine intègre une école de sage-femme.

Etudier à | la faculté de Médecine

La diversité des étudiants et de leurs parcours est l’une de nos richesses. Sorbonne Université s’engage pour la réussite de chacun de ses étudiants et leur propose une large offre de formations ainsi qu’un accompagnement adapté à leur profil et à leur projet.

La vie associative

La diversité des étudiants et de leurs parcours est l’une de nos richesses. Sorbonne Université s’engage pour la réussite de chacun de ses étudiants.

21 393

usagers

17 527

étudiants

715

hospitalo-universitaires

12

centres de recherche

Chiffres-clés


Découvrir les dernières parutions

Toutes les parutions

Dans les pas de Jonas

Par Serge Uzan

L’algorithme de Jonas

Dupuytren

Par /Sous la direction de Julie Cheminaud et de Claire Crignon

Ou le musée des maladies

Sexe et violences

Par Danièle Tritsch, Jean Mariani

Comment le cerveau peut tout changer

Les extraordinaires pouvoirs du ventre

Par Harry Sokol

Un fabuleux voyage à la découverte des pouvoirs de notre microbiote.

Le Grand Livre des pratiques psychomotrices

Par Anne Vachez-Gatecel, Aude Valentin-Lefranc

La Psychomotricité

Par Françoise Giromini-Mercier, Suzanne Robert-Ouvray, Cécile Pavot-Lemoine, Anne Vachez-Gatecel

Apologie de la discrétion

Par Lionel Naccache

Comment faire partie du monde ?

Le Grand Livre des pratiques psychomotrices

Par Anne Vachez-Gatecel, Aude Valentin-Lefranc

Fondements, domaines d'application, formation et recherche

Je marche donc je pense

Par Roger-Pol Droit et Yves Agid

La recherche en temps d'épidémie

Par Patrice Debré

Du sida au Covid, histoire de l'ANRS

Neurosciences cognitives

Par / Sous la direction de Mehdi Khamassi

La médecin

Par Karine Lacombe, Fiamma Luzzati

Une infectiologue au temps du corona

Le Cinéma intérieur

Par Lionel Naccache

Projection privée au cœur de la conscience

Des formations riches et exigeantes

La faculté accompagne plus de 20 000 étudiantes et étudiants vers le monde professionnel grâce à une très large offre de formations adossées à la recherche, disciplinaires et interdisciplinaires, afin de répondre à tous les défis, scientifiques, technologiques et sociétaux.

Son cycle d’intégration pluridisciplinaire et son dispositif majeure-mineure en licence, ses 80 parcours de masters, ses formations internationales, ses cursus en apprentissage et son offre de formation continue permettent de proposer des parcours riches et exigeants, adaptés aux projets de chacun, nourris par les recherches de ses enseignantes-chercheuses, enseignants-chercheurs, chercheurs et chercheuses.

Recherche

Couvrant tous les champs de la connaissance en sciences et ingénierie, la Faculté des Sciences et Ingénierie soutient la recherche au cœur des disciplines, la recherche aux interfaces, le développement de partenariat avec les entreprises, et favorise l'émergence de nouvelles thématiques pour répondre aux grands enjeux  du XXIe siècle.

La vie à | la Faculté des Sciences et Ingénierie

Que ce soit sur le campus Pierre et Marie Curie, ou dans ses trois stations biologiques, à Banyuls, Roscoff et Villefranche, la Faculté des Sciences et Ingénierie constitue à la fois un lieu d'enseignement, de recherche et d'épanouissement intellectuel, où cours, conférences, colloques, congrès, expositions et autres manifestations scientifiques rythment la vie de ses étudiants et de ses personnels.

La vie associative à la faculté des Sciences et Ingénierie

Vie associative

Découvrez la vie associative de la Faculté des Sciences et Ingénierie.



Les mondes de Saturne

Par Sébastien Charnoz, Sandrine Vinatier, Sandrine Guerlet, Alice Le Gall

Les mystères de Saturne révélés !

Du Laboratoire Arago à l'Observatoire océanologique de Banyuls

Par / Sous la direction de Guy Jacques et de Yves Desdevises

Une épopée humaine et scientifique

Stem Cell Biology and Regenerative Medicine

Par Charles Durand & Pierre Charbord

River Publishers Series in Biotechnology and Medical Technology Forum