Rušivá korelace
Co je to Rušivá korelace
Rušivá korelace neboli falešnost ve statistikách označuje spojení mezi dvěma proměnnými, které se jeví jako kauzální, ale není. Rušné vztahy mají často vzhled jedné proměnné, která ovlivňuje druhou. Tato falešná korelace je často způsobena třetím faktorem, který není v době zkoumání zjevný, někdy se nazývá matoucí faktor.
Klíčové výhody
- Podvržená korelace neboli podvrženost nastává, když se dva faktory zdají ležérně související, ale nesouvisí.
- Vzhled příčinné souvislosti je často způsoben podobným pohybem v grafu což se ukázalo být náhodné nebo způsobené třetím „matoucím“ faktorem.
- Rušivá korelace může být často způsobena malou velikostí vzorku nebo libovolnými koncovými body.
Jak funguje falešná korelace
Když se dvě náhodné proměnné navzájem v grafu vzájemně úzce sledují, lze snadno předpokládat korelaci nebo vztah mezi těmito dvěma faktory, kde změna ovlivňuje toho druhého. Odložením „příčinné souvislosti“, jiného tématu, může toto pozorování vést čtenáře grafu k přesvědčení, že pohyb proměnné A je spojen s pohybem v proměnné B nebo naopak. ale někdy, při bližším statistickém zkoumání, jsou zarovnané pohyby náhodné nebo způsobené třetím faktorem, který ovlivňuje první dva. Toto je falešná korelace. Výzkum prováděný s malými velikostmi vzorků nebo libovolnými koncovými body je zvláštnost náchylná k falešnosti.
Příklad falešných korelací
Objevování zajímavých korelací není příliš náročné. Mnohé se však ukáží jako podvržené. U mužských druhů na Wall Street se dvě populární falešné korelace týkají žen a sportu. Ve 20. letech 20. století pochází teorie délky sukně, která tvrdí, že délky sukně a směr akciového trhu jsou v korelaci. Pokud jsou délky sukní dlouhé, znamená to, že akciový trh klesá; pokud jsou krátké, trh jde nahoru. Kolem konce ledna se hovoří o takzvaném indikátoru Super Bowl, který naznačuje, že vítězství týmu AFC pravděpodobně znamená, že akciový trh v příštím roce poklesne, zatímco vítězství týmu NFC předznamenává růst trh. Od roku 1966 má ukazatel přesnost 80%. Je to zábavná konverzace, ale pravděpodobně to není něco, co by seriózní finanční poradce doporučil jako investiční strategii pro klienty.
Zde je několik dalších příkladů běžných falešných korelací:
- Utopení stoupá, když roste prodej zmrzliny. Může se zdát, že zvýšený prodej zmrzliny způsobuje větší utonutí, ale ve skutečnosti může stoupající teplo způsobit, že více lidí bude plavat a kupovat více zmrzliny.
- Míra vražd v USA v letech 2006–2011 klesla na stejná míra jako v aplikaci Microsoft Internet Explorer.
- Vedoucí pracovníci, kteří říkají, prosím a děkuji, si častěji užívají lepší výkon sdílení.
- Lidé, kteří nosí vybavení týmu Oakland Raiders, se více dopouštějí zločinů .
Jak odhalit falešné korelace
Statistici a další vědci, kteří analyzují data, musí neustále hledat falešné vztahy. Existuje mnoho metod, které používají, včetně:
- Zajištění správného reprezentativního vzorku.
- Získání odpovídající velikosti vzorku.
- Dávejte si pozor na libovolné koncové body.
- Řízení co největšího počtu vnějších proměnných.
- Používání nulové hypotézy a kontrola silné hodnoty p.