Corelația falsă
Ce este corelația falsă
În statistici, o corelație falsă sau falsitate se referă la o conexiune între două variabile care pare cauzală, dar nu este. Relațiile false au adesea aspectul unei variabile care o afectează pe alta. Această corelație falsă este adesea cauzată de un al treilea factor care nu este evident în momentul examinării, numit uneori un factor de confuzie.
Key Takeaways
- Corelația falsă sau falsitatea este atunci când doi factori apar în mod casual, dar nu sunt.
- Apariția unei relații cauzale se datorează adesea mișcării similare pe o diagramă care se dovedește a fi întâmplător sau cauzat de un al treilea factor „confuz”.
- Corelația falsă poate fi adesea cauzată de dimensiuni mici ale eșantionului sau de puncte finale arbitrare.
Cum funcționează corelația falsă
Atunci când două variabile aleatorii se urmăresc îndeaproape pe un grafic, este ușor de suspectat o corelație sau o relație între cei doi factori, unde un schimbarea îl afectează pe celălalt. Lăsând deoparte „cauzalitatea”, un alt subiect, această observație poate duce cititorul graficului să creadă că mișcarea variabilei A este legată de mișcarea din variabila B sau invers. dar uneori, la o examinare statistică mai atentă, mișcările aliniate sunt coincidente sau cauzate de un al treilea factor care afectează primii doi. Aceasta este o corelație falsă. Cercetările efectuate cu eșantioane mici sau puncte finale arbitrare sunt particularități susceptibile de falsificare.
Exemplu de corelații falsificate
Nu este prea dificil să descoperim corelații interesante. Mulți se vor dovedi a fi falsi, totuși. Pentru speciile masculine de pe Wall Street, două corelații false false implică femei și sport. Cu originea în anii 1920 este teoria lungimii fustei, care susține că lungimile fustei și direcția pieței bursiere sunt corelate. Dacă lungimea fustei este lungă, înseamnă că piața de valori este în scădere; dacă sunt scurte, piața crește. Aproximativ la sfârșitul lunii ianuarie se vorbește despre așa-numitul indicator Super Bowl, ceea ce sugerează că o victorie a echipei AFC înseamnă probabil că piața de valori va scădea în anul următor, în timp ce o victorie a echipei NFC prevede o creștere a piaţă. Din 1966, indicatorul a avut o rată de precizie de 80%. Este o piesă de conversație amuzantă, dar probabil nu este un lucru pe care un consilier financiar serios l-ar recomanda ca strategie de investiții pentru clienți.
Iată câteva exemple de corelații false frecvente:
- Înecurile cresc atunci când crește vânzările de înghețată. Se poate părea că creșterea vânzărilor de înghețată provoacă mai multă înecare, dar în realitate, creșterea căldurii poate face ca mai mulți oameni să înoate, precum și să cumpere mai multe înghețate.
- Rata uciderilor din SUA din 2006-2011 a scăzut la aceeași rată ca și utilizarea Microsoft Internet Explorer.
- Directorii care spun vă rog și vă mulțumesc se bucură mai des de performanțe mai bune.
- Persoanele care poartă echipamentul echipei Oakland Raiders sunt mai predispuse să comită infracțiuni. .
Cum se identifică corelațiile falsificate
Statisticienii și alți oameni de știință care analizează datele trebuie să fie mereu în căutarea unor relații false. Există numeroase metode pe care le folosesc, inclusiv:
- Asigurarea unui eșantion reprezentativ adecvat.
- Obținerea unei dimensiuni adecvate a eșantionului.
- Atenție la punctele finale arbitrare.
- Controlul pentru cât mai multe variabile externe posibil.
- Folosirea unei ipoteze nule și verificarea unei valori p puternice.