Archives de catégorie : Statistiques

Études statistiques : les limites du contrôle

 “– Are you interested in science, by any chance?”
The Limits of Control (Jim Jarmusch, 2009)

La notion de contrôle statistique est omniprésente dans les sciences de la vie et les sciences humaines. Chaque individu différant des autres par de très nombreux facteurs (âge, catégorie socio-professionnelle, couleur des cheveux, etc.), les scientifiques qui s’intéressent à un aspect particulier ont besoin de s’assurer que les variables non pertinentes ne parasitent pas leur mesure. C’est ici que le contrôle statistique entre en jeu : il s’agit d’un outil mathématique qui a pour objectif d’estimer l’effet propre d’une variable particulière en éliminant l’effet d’autres facteurs.

Pourtant, cet outil est très souvent mal utilisé, au point de produire des résultats erronés – voire même paradoxaux comme on le verra plus loin. Aujourd’hui, nombre de scientifiques estiment, à tort, que le moyen le plus efficace pour obtenir une estimation fiable consiste simplement à « contrôler » toutes les variables disponibles. Dans certaines branches des sciences cognitives ou de l’économétrie, on rencontre ainsi couramment des études affichant une très longue liste de facteurs intégrés pêle-mêle dans un modèle statistique : sexe, âge, niveau d’éducation, statut socio-économique, religiosité, niveau d’intérêt politique, degré de conviction idéologique, degré de conservatisme, fréquence d’exposition aux informations télévisées, taille du réseau relationnel…1 Cette tendance, que j’ai déjà évoquée au détour de ma critique du dernier ouvrage de Steven Pinker2, est si hégémonique qu’un nom lui a été attribué : « salade causale » [2] (d’autres préférant le terme de « régression-poubelle » [3]).

Continuer la lecture de Études statistiques : les limites du contrôle

Âge et pertes d’intelligibilité chez les personnes presbyacousiques appareillées – Retour sur le projet Genopath

La publication, le mois dernier, de l’article « Contributions of Age-Related and Audibility-Related Deficits to Aided Consonant Identification in Presbycusis: A Causal-Inference Analysis » dans la revue Frontiers in Aging Neuroscience vient clôturer 1 an et demi de travail d’analyse sur un projet qui, lui, court depuis 2009 (intitulé « Projet Genopath »). Cette collaboration de longue haleine entre l’équipe de la professeure Christine Petit (avec Sophie Boucher et Crystel Bonnet) et la nôtre (composée de Christian Lorenzi, Agnès Léger et moi-même) portait sur une étude statistique à grande échelle des pertes d’audition liées à l’âge. Le texte de l’article est disponible en accès ouvert sur le site de l’éditeur. Visant un public scientifique, il est rédigé en anglais et dans un langage technique. Néanmoins, je pense que les résultats obtenus sont susceptibles d’intéresser un plus large public, et j’en propose donc ici un résumé en français.
Continuer la lecture de Âge et pertes d’intelligibilité chez les personnes presbyacousiques appareillées – Retour sur le projet Genopath

Études observationnelles et fausses corrélations : le paradoxe de Berkson

La période de crise sanitaire actuelle est marquée par un regain d’intérêt pour l’analyse de données épidémiologiques. Elle a porté sur le devant de la scène médiatique certains concepts clés de l’expérimentation scientifique, telle la notion d’essai clinique. De façon liée, on a pu entendre de nombreux appels à la prudence dans l’interprétation de résultats issus d’études observationnelles – c’est-à-dire portant sur l’analyse de caractéristiques d’un groupe de patients et patientes sans aucune intervention particulière de la part des scientifiques (p.ex. l’administration d’un traitement particulier)3. Je voudrais ici insister sur les limites inhérentes aux études observationnelles, en illustrant à quel point il est facile d’obtenir une corrélation fallacieuse entre deux pathologies (ou plus généralement deux conditions médicales) lorsque l’on s’intéresse à des données recueillies chez des personnes admises à l’hôpital.
Continuer la lecture de Études observationnelles et fausses corrélations : le paradoxe de Berkson