Störkorrelation
Was ist Störkorrelation
In der Statistik bezieht sich eine Störkorrelation oder Störkorrelation auf eine Verbindung zwischen zwei Variablen, die kausal erscheint, aber nicht kausal ist. Falsche Beziehungen haben oft das Aussehen einer Variablen, die eine andere beeinflusst. Diese falsche Korrelation wird häufig durch einen dritten Faktor verursacht, der zum Zeitpunkt der Untersuchung nicht erkennbar ist und manchmal als Störfaktor bezeichnet wird.
Key Takeaways
- Falsche Korrelation oder Falschheit ist, wenn zwei Faktoren zufällig zusammenhängen, aber nicht.
- Das Auftreten eines Kausalzusammenhangs ist häufig auf eine ähnliche Bewegung in einem Diagramm zurückzuführen Dies stellt sich als zufällig heraus oder wird durch einen dritten „Störfaktor“ verursacht.
- Falsche Korrelation kann häufig durch kleine Stichprobengrößen oder beliebige Endpunkte verursacht werden.
Funktionsweise der falschen Korrelation
Wenn sich zwei Zufallsvariablen in einem Diagramm genau verfolgen, ist es leicht, eine Korrelation oder eine Beziehung zwischen den beiden Faktoren zu vermuten, wobei a Veränderung wirkt sich auf den anderen aus. Abgesehen von „Kausalität“, einem anderen Thema, kann diese Beobachtung den Leser des Diagramms zu der Annahme führen, dass die Bewegung der Variablen A mit der Bewegung in Variable B verbunden ist oder umgekehrt. Bei näherer statistischer Untersuchung sind die ausgerichteten Bewegungen jedoch zufällig oder werden durch einen dritten Faktor verursacht, der die ersten beiden beeinflusst. Dies ist eine falsche Korrelation. Untersuchungen, die mit kleinen Stichprobengrößen oder beliebigen Endpunkten durchgeführt wurden, sind besonders störanfällig.
Beispiel für falsche Korrelationen
Es ist nicht allzu schwierig, interessante Korrelationen zu entdecken. Viele werden sich jedoch als falsch herausstellen. Bei den männlichen Arten an der Wall Street betreffen zwei beliebte falsche Korrelationen Frauen und Sport. In den 1920er Jahren entstand die Rocklängentheorie, die besagt, dass Rocklängen und Börsenrichtung korrelieren. Wenn die Rocklängen lang sind, bedeutet dies, dass der Aktienmarkt sinkt. Wenn sie kurz sind, steigt der Markt. Gegen Ende Januar wird über den sogenannten Super Bowl-Indikator gesprochen, der darauf hindeutet, dass ein Sieg des AFC-Teams wahrscheinlich dazu führen wird, dass der Aktienmarkt im kommenden Jahr sinken wird, während ein Sieg des NFC-Teams einen Anstieg des Markt. Seit 1966 hat der Indikator eine Genauigkeitsrate von 80%. Es ist ein lustiger Gesprächsstoff, aber wahrscheinlich nicht etwas, das ein seriöser Finanzberater als Anlagestrategie für Kunden empfehlen würde.
Hier einige weitere Beispiele für häufig auftretende falsche Korrelationen:
- Ertrinken steigt, wenn der Eisverkauf steigt. Es mag den Anschein haben, dass erhöhte Eisverkäufe mehr Ertrinken verursachen, aber in Wirklichkeit kann steigende Hitze dazu führen, dass mehr Menschen schwimmen und mehr Eis kaufen.
- Die US-Mordrate von 2006-2011 sank auf Dies entspricht der Nutzung von Microsoft Internet Explorer.
- Führungskräfte, die bitte und danke sagen, genießen häufiger eine bessere Leistung beim Teilen.
- Personen, die Teamausrüstung von Oakland Raiders tragen, begehen häufiger Straftaten
So erkennen Sie falsche Korrelationen
Statistiker und andere Wissenschaftler, die Daten analysieren, müssen ständig nach falschen Beziehungen Ausschau halten. Es gibt zahlreiche Methoden, die sie verwenden, darunter:
- Sicherstellen einer geeigneten repräsentativen Stichprobe.
- Erhalten einer angemessenen Stichprobengröße.
- Vorsicht vor beliebigen Endpunkten.
- Kontrolle auf so viele externe Variablen wie möglich.
- Verwenden einer Nullhypothese und Überprüfen auf einen starken p-Wert.