Spurious Correlation


Hvad er Spurious Correlation

I statistikker refererer en falsk korrelation eller falskhed til en forbindelse mellem to variabler, der synes kausal, men som ikke er. Rosende forhold ser ofte ud som en variabel, der påvirker en anden. Denne falske sammenhæng er ofte forårsaget af en tredje faktor, der ikke er tydelig på tidspunktet for undersøgelsen, undertiden kaldet en forvirrende faktor.

Key Takeaways

  • Skræmmende korrelation eller falskhed er, når to faktorer forekommer tilfældigt relaterede, men ikke er.
  • Udseendet af et årsagsforhold skyldes ofte en lignende bevægelse på et diagram hvilket viser sig at være tilfældigt eller forårsaget af en tredje “forvirrende” faktor.
  • Ondskrænkende sammenhæng kan ofte være forårsaget af små stikprøvestørrelser eller vilkårlige slutpunkter.

Hvordan oprørende korrelation fungerer

Når to tilfældige variabler sporer hinanden tæt på en graf, er det let at mistænke sammenhæng eller et forhold mellem de to faktorer, hvor en ændring påvirker den anden. Ved at afsætte “årsagssammenhæng”, et andet emne, kan denne observation få læseren til diagrammet til at tro, at bevægelsen af variabel A er knyttet til bevægelsen i variabel B eller omvendt. men undertiden ved nærmere statistisk undersøgelse er de justerede bevægelser tilfældige eller forårsaget af en tredje faktor, der påvirker de to første. Dette er en falsk sammenhæng. Forskning udført med små stikprøvestørrelser eller vilkårlige slutpunkter er specificitet, der er modtagelig for falskhed.

Eksempel på uhyggelige korrelationer

Det er ikke for udfordrende at finde interessante korrelationer. Mange vil dog vise sig at være falske. For de mandlige arter på Wall Street involverer to populære falske sammenhænge kvinder og sport. Oprindelsen i 1920erne er nederdelens længde teori, som hævder, at nederdelens længde og aktiemarkedets retning er korreleret. Hvis nederdelens længder er lange, betyder det, at aktiemarkedet går ned; hvis de er korte, går markedet op. Omkring slutningen af januar er der tale om den såkaldte Super Bowl-indikator, som antyder, at en sejr fra AFC-holdet sandsynligvis betyder, at aktiemarkedet vil falde i det kommende år, mens en sejr fra NFC-holdet antyder en stigning i marked. Siden 1966 har indikatoren haft en nøjagtighed på 80%. Det er en sjov samtale, men sandsynligvis ikke noget, som en seriøs finansiel rådgiver vil anbefale som en investeringsstrategi for kunder.

Her er nogle flere eksempler på almindelige falske korrelationer:

  • drukninger stiger, når salget af is stiger. Det ser ud til, at øget salg af is forårsager mere drukning, men i virkeligheden kan stigende varme få flere til at svømme samt købe mere is.
  • Den amerikanske mordrate fra 2006-2011 faldt kl. den samme hastighed som Microsoft Internet Explorer-brug.
  • Ledere, der ofte siger tak og tak, nyder bedre deling.
  • Folk, der bærer Oakland Raiders teamudstyr, er mere tilbøjelige til at begå forbrydelser .

Sådan finder du uhyggelige korrelationer

Statistikere og andre forskere, der analyserer data, skal være på udkig efter falske forhold hele tiden. Der er adskillige metoder, de bruger, herunder:

  • Sikring af en korrekt repræsentativ prøve.
  • Opnåelse af en passende stikprøvestørrelse.
  • Vær forsigtig med vilkårlige slutpunkter.
  • Styring af så mange eksterne variabler som muligt.
  • Brug af en nulhypotese og kontrol af en stærk p-værdi.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *