Fausse corrélation
Quest-ce quune fausse corrélation
Dans les statistiques, une fausse corrélation, ou fausse corrélation, fait référence à une connexion entre deux variables qui semble causale mais ne lest pas. Les fausses relations ont souvent lapparence dune variable affectant une autre. Cette corrélation fausse est souvent causée par un troisième facteur qui nest pas apparent au moment de lexamen, parfois appelé facteur de confusion.
Points à retenir
- La fausse corrélation, ou faux, se produit lorsque deux facteurs semblent liés de manière nonchalante mais ne le sont pas.
- Lapparition dune relation causale est souvent due à un mouvement similaire sur un graphique qui savère être une coïncidence ou causée par un troisième facteur de « confusion ».
- Une corrélation erronée peut souvent être causée par des échantillons de petite taille ou des points de terminaison arbitraires.
Comment fonctionne la fausse corrélation
Lorsque deux variables aléatoires se suivent de près sur un graphique, il est facile de suspecter une corrélation, ou une relation entre les deux facteurs, où un le changement affecte lautre. Mis à part la «causalité», autre sujet, cette observation peut amener le lecteur du diagramme à croire que le mouvement de la variable A est lié au mouvement de la variable B ou vice versa. mais parfois, après un examen statistique plus approfondi, les mouvements alignés sont fortuits ou causés par un troisième facteur qui affecte les deux premiers. Cest une corrélation fallacieuse. Les recherches effectuées avec des échantillons de petite taille ou des points de terminaison arbitraires sont des particularités susceptibles dêtre faussées.
Exemple de fausses corrélations
Il nest pas trop difficile de découvrir des corrélations intéressantes. Beaucoup savéreront cependant faux. Pour les espèces mâles de Wall Street, deux fausses corrélations populaires impliquent les femmes et le sport. La théorie de la longueur de la jupe est née dans les années 1920, selon laquelle les longueurs de jupe et la direction du marché boursier sont corrélées. Si les longueurs de jupe sont longues, cela signifie que le marché boursier est en baisse; sils sont courts, le marché est à la hausse. Vers la fin du mois de janvier, on parle du soi-disant indicateur du Super Bowl, ce qui suggère quune victoire de léquipe AFC signifie probablement que le marché boursier baissera lannée prochaine, alors quune victoire de léquipe NFC laisse présager une hausse de la marché. Depuis 1966, lindicateur a un taux dexactitude de 80%. Cest une conversation amusante, mais probablement pas quelque chose quun conseiller financier sérieux recommanderait comme stratégie dinvestissement pour les clients.
Voici quelques exemples de corrélations fausses courantes:
- Les noyades augmentent lorsque les ventes de crème glacée augmentent. Il peut sembler que laugmentation des ventes de crème glacée cause plus de noyades, mais en réalité, la hausse de la chaleur peut inciter plus de gens à nager, ainsi quà acheter plus de crème glacée.
- Le taux de meurtres aux États-Unis de 2006 à 2011 a chuté à le même taux dutilisation de Microsoft Internet Explorer.
- Les dirigeants qui disent merci et merci apprécient plus souvent de meilleures performances de partage.
- Les personnes qui portent léquipement de léquipe des Oakland Raiders sont plus susceptibles de commettre des crimes .
Comment repérer les fausses corrélations
Les statisticiens et autres scientifiques qui analysent les données doivent être constamment à laffût de fausses relations. Ils utilisent de nombreuses méthodes, notamment:
- Assurer un échantillon représentatif approprié.
- Obtenir une taille déchantillon adéquate.
- Se méfier des points de terminaison arbitraires.
- Contrôler autant de variables externes que possible.
- Utiliser une hypothèse nulle et vérifier une valeur p forte.