Väärinkorrelaatio


Mikä on väärennöskorrelaatio

Tilastossa väärä korrelaatio tai väärinkäyttötarkoitus viittaa kahden muuttujan väliseen yhteyteen, joka näyttää olevan kausaalinen mutta ei. Väärät suhteet näyttävät usein siltä, että yksi muuttuja vaikuttaa toiseen. Tämä väärä korrelaatio johtuu usein kolmannesta tekijästä, joka ei ole näkyvissä tutkimushetkellä, jota kutsutaan joskus sekoittavaksi tekijäksi.

Tärkeimmät takaisinot

  • Väärät korrelaatiot tai väärennökset ovat silloin, kun kaksi tekijää näyttävät olevan rennosti yhteydessä toisiinsa.
  • Syy-yhteyden esiintyminen johtuu usein samankaltaisesta liikkumisesta kaaviossa mikä osoittautuu sattumalta tai johtuu kolmannesta ”sekoittavasta” tekijästä.
  • Väärät korrelaatiot voivat usein johtua pienistä otoskooista tai mielivaltaisista päätepisteistä.

Kuinka väärä korrelaatio toimii

Kun kaksi satunnaista muuttujaa seuraa toisiaan tiiviisti kuvaajassa, on helppo epäillä korrelaatiota tai suhdetta näiden kahden tekijän välillä, jos muutos vaikuttaa toiseen. ”Syy-yhteyden”, toisen aiheen syrjäyttäminen, tämä havainto voi saada kaavion lukijan uskomaan, että muuttujan A liike liittyy liikkeeseen muuttujassa B tai päinvastoin. mutta joskus tarkemman tilastollisen tarkastelun jälkeen kohdistetut liikkeet ovat sattumanvaraisia tai johtuu kolmesta tekijästä, joka vaikuttaa kahteen ensimmäiseen. Tämä on väärä korrelaatio. Pienillä otoskooilla tai mielivaltaisilla päätepisteillä tehty tutkimus on epätarkkuutta herkkää.

Esimerkki vääristä korrelaatioista

Mielenkiintoisten korrelaatioiden löytäminen ei ole liian haastavaa. Monet osoittautuvat kuitenkin vääriksi. Wall Streetin uroslajeille kaksi suosittua väärää korrelaatiota liittyy naisiin ja urheiluun. 1920-luvulla on alkanut hameen teoria, jonka mukaan hameen pituudet ja pörssisuunta korreloivat. Jos hameen pituudet ovat pitkiä, osakemarkkinat laskevat; jos ne ovat lyhyitä, markkinat nousevat. Tammikuun loppupuolella puhutaan niin kutsutusta Super Bowl -indikaattorista, joka viittaa siihen, että AFC-tiimin voitto tarkoittaa todennäköisesti, että osakemarkkinat laskevat tulevana vuonna, kun taas NFC-joukkueen voitto merkitsee nousua. markkinoida. Vuodesta 1966 lähtien indikaattorin tarkkuusaste on ollut 80%. Se on hauska keskustelukappale, mutta luultavasti ei jotain, jota vakava talousneuvoja suositteli sijoitusstrategiaksi asiakkaille.

Tässä on muutamia esimerkkejä yleisimmistä vääristä korrelaatioista:

  • Hukkuminen nousee, kun jäätelön myynti kasvaa. Voi tuntua, että lisääntynyt jäätelömyynti aiheuttaa enemmän hukkumista, mutta todellisuudessa nouseva lämpö voi aiheuttaa enemmän ihmisiä uimaan sekä ostaa lisää jäätelöä.
  • Yhdysvaltain murhaprosentti vuosina 2006–2011 laski sama nopeus kuin Microsoft Internet Explorer -käyttö.
  • Kiitos ja kiitolliset johtajat nauttivat useammin paremmasta jakamisesta.
  • Oakland Raiders -tiimivarusteita käyttävät ihmiset tekevät todennäköisemmin rikoksia. .

Kuinka havaita väärät korrelaatiot

Tilastotieteilijöiden ja muiden tietoja analysoivien tutkijoiden on oltava jatkuvasti etsimässä väärennettyjä suhteita. He käyttävät useita menetelmiä, mukaan lukien:

  • Oikean edustavan otoksen varmistaminen.
  • Riittävän otoskoon saaminen.
  • Varovaisuus mielivaltaisista päätepisteistä.
  • Hallinta mahdollisimman monelle ulkopuoliselle muuttujalle.
  • Nollahypoteesin käyttäminen ja vahvan p-arvon tarkistaminen.

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *