“– Are you interested in science, by any chance?”
The Limits of Control (Jim Jarmusch, 2009)
La notion de contrôle statistique est omniprésente dans les sciences de la vie et les sciences humaines. Chaque individu différant des autres par de très nombreux facteurs (âge, catégorie socio-professionnelle, couleur des cheveux, etc.), les scientifiques qui s’intéressent à un aspect particulier ont besoin de s’assurer que les variables non pertinentes ne parasitent pas leur mesure. C’est ici que le contrôle statistique entre en jeu : il s’agit d’un outil mathématique qui a pour objectif d’estimer l’effet propre d’une variable particulière en éliminant l’effet d’autres facteurs.
Pourtant, cet outil est très souvent mal utilisé, au point de produire des résultats erronés – voire même paradoxaux comme on le verra plus loin. Aujourd’hui, nombre de scientifiques estiment, à tort, que le moyen le plus efficace pour obtenir une estimation fiable consiste simplement à « contrôler » toutes les variables disponibles. Dans certaines branches des sciences cognitives ou de l’économétrie, on rencontre ainsi couramment des études affichant une très longue liste de facteurs intégrés pêle-mêle dans un modèle statistique : sexe, âge, niveau d’éducation, statut socio-économique, religiosité, niveau d’intérêt politique, degré de conviction idéologique, degré de conservatisme, fréquence d’exposition aux informations télévisées, taille du réseau relationnel…1 Cette tendance, que j’ai déjà évoquée au détour de ma critique du dernier ouvrage de Steven Pinker2, est si hégémonique qu’un nom lui a été attribué : « salade causale » [2] (d’autres préférant le terme de « régression-poubelle » [3]).
Continuer la lecture de Études statistiques : les limites du contrôle