Valse correlatie


Wat is onechte correlatie

In statistieken verwijst een onechte correlatie, of onechtheid, naar een verband tussen twee variabelen die oorzakelijk lijkt maar dat niet is. Valse relaties hebben vaak de indruk dat de ene variabele de andere beïnvloedt. Deze onechte correlatie wordt vaak veroorzaakt door een derde factor die niet duidelijk is op het moment van onderzoek, ook wel een verstorende factor genoemd.

Key Takeaways

  • Valse correlatie, of onechtheid, is wanneer twee factoren terloops verband lijken, maar dat niet zijn.
  • Het optreden van een oorzakelijk verband is vaak te wijten aan een vergelijkbare beweging op een kaart wat toevallig blijkt te zijn of wordt veroorzaakt door een derde “verstorende” factor.
  • Valse correlatie kan vaak worden veroorzaakt door kleine steekproeven of willekeurige eindpunten.

Hoe onechte correlatie werkt

Wanneer twee willekeurige variabelen elkaar nauwkeurig volgen in een grafiek, is het gemakkelijk een correlatie of een verband tussen de twee factoren te vermoeden, waarbij een verandering heeft invloed op de ander. Afgezien van causaliteit, een ander onderwerp, kan deze waarneming de lezer van de kaart doen geloven dat de beweging van variabele A verband houdt met de beweging in variabele B of omgekeerd. maar soms, bij nader statistisch onderzoek, zijn de uitgelijnde bewegingen toevallig of worden ze veroorzaakt door een derde factor die de eerste twee beïnvloedt. Dit is een onechte correlatie. Onderzoek gedaan met kleine steekproeven of willekeurige eindpunten is bijzonder vatbaar voor onechtheid.

Voorbeeld van onechte correlaties

Het is niet al te moeilijk om interessante correlaties te ontdekken. Velen zullen echter onecht blijken te zijn. Voor de mannelijke soort op Wall Street hebben twee populaire onechte correlaties betrekking op vrouwen en sport. Ontstaan in de jaren 1920 is de roklengte-theorie, die stelt dat roklengtes en aandelenmarktrichting gecorreleerd zijn. Als roklengtes lang zijn, betekent dit dat de aandelenmarkt naar beneden gaat; als ze kort zijn, gaat de markt omhoog. Rond eind januari is er sprake van de zogenaamde Super Bowl-indicator, die suggereert dat een overwinning door het AFC-team waarschijnlijk betekent dat de aandelenmarkt het komende jaar zal dalen, terwijl een overwinning door het NFC-team een stijging van de markt. Sinds 1966 heeft de indicator een nauwkeurigheidspercentage van 80%. Het is een leuk gespreksonderwerp, maar waarschijnlijk niet iets dat een serieuze financieel adviseur zou aanbevelen als beleggingsstrategie voor klanten.

Hier zijn nog enkele voorbeelden van veelvoorkomende onechte correlaties:

  • Verdrinkingen stijgen wanneer de verkoop van ijs stijgt. Het lijkt misschien dat een grotere verkoop van ijs meer verdrinking veroorzaakt, maar in werkelijkheid kan stijgende hitte ertoe leiden dat meer mensen gaan zwemmen en meer ijs kopen.
  • Het moordcijfer in de VS van 2006-2011 daalde met hetzelfde percentage als het gebruik van Microsoft Internet Explorer.
  • Leidinggevenden die alsjeblieft en bedankt vaker zeggen, genieten van betere deelprestaties.
  • Mensen die teamkleding van Oakland Raiders dragen, zullen eerder misdaden begaan .

Hoe valse verbanden te ontdekken

Statistici en andere wetenschappers die gegevens analyseren, moeten voortdurend op hun hoede zijn voor onechte verbanden. Er zijn talloze methoden die ze gebruiken, waaronder:

  • Zorgen voor een juiste representatieve steekproef.
  • Verkrijgen van een geschikte steekproefomvang.
  • Op hun hoede zijn voor willekeurige eindpunten.
  • Controleren op zoveel mogelijk externe variabelen.
  • Een nulhypothese gebruiken en controleren op een sterke p-waarde.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *