Correlação espúria
O que é correlação espúria
Em estatística, uma correlação espúria, ou espúria, refere-se a uma conexão entre duas variáveis que parece causal, mas não é. Relacionamentos espúrios freqüentemente têm a aparência de uma variável afetando outra. Essa correlação espúria é freqüentemente causada por um terceiro fator que não é aparente no momento do exame, às vezes chamado de fator de confusão.
Principais conclusões
- Correlação espúria, ou espúria, é quando dois fatores parecem casualmente relacionados, mas não estão.
- O aparecimento de uma relação causal é frequentemente devido a movimentos semelhantes em um gráfico que acaba sendo coincidente ou causado por um terceiro fator de “confusão”.
- Correlação espúria pode frequentemente ser causada por tamanhos de amostra pequenos ou pontos finais arbitrários.
Como funciona a correlação espúria
Quando duas variáveis aleatórias acompanham uma a outra de perto em um gráfico, é fácil suspeitar de correlação ou de uma relação entre os dois fatores, onde um a mudança afeta o outro. Deixando de lado a “causalidade”, outro tópico, essa observação pode levar o leitor do gráfico a acreditar que o movimento da variável A está ligado ao movimento da variável B ou vice-versa. mas às vezes, após um exame estatístico mais detalhado, os movimentos alinhados são coincidentes ou causados por um terceiro fator que afeta os dois primeiros. Esta é uma correlação espúria. Pesquisas feitas com tamanhos de amostra pequenos ou desfechos arbitrários são particularmente suscetíveis a espúrias.
Exemplo de correlações espúrias
Não é muito desafiador descobrir correlações interessantes. Muitos se revelarão espúrios, entretanto. Para a espécie masculina em Wall Street, duas correlações espúrias populares envolvem mulheres e esportes. Originada na década de 1920 está a teoria do comprimento da saia, que afirma que o comprimento da saia e a direção do mercado de ações estão correlacionados. Se as saias forem compridas, isso significa que o mercado de ações está caindo; se estiverem vendidos, o mercado está subindo. No final de janeiro, fala-se sobre o chamado indicador do Super Bowl, o que sugere que uma vitória da equipe AFC provavelmente significa que o mercado de ações cairá no próximo ano, enquanto uma vitória da equipe NFC pressagia uma alta no mercado. Desde 1966, o indicador apresenta uma taxa de acerto de 80%. É uma conversa divertida, mas provavelmente não algo que um consultor financeiro sério recomendaria como uma estratégia de investimento para clientes.
Aqui estão mais alguns exemplos de correlações espúrias comuns:
- Os afogamentos aumentam quando as vendas de sorvete aumentam. Pode parecer que o aumento das vendas de sorvete causa mais afogamentos, mas, na realidade, o aumento do calor pode fazer com que mais pessoas nadem, bem como comprem mais sorvete.
- A taxa de homicídios nos EUA de 2006-2011 caiu para a mesma taxa de uso do Microsoft Internet Explorer.
- Executivos que dizem por favor e obrigado com mais frequência desfrutam de um melhor desempenho de compartilhamento.
- Pessoas que usam equipamentos da equipe do Oakland Raiders têm maior probabilidade de cometer crimes .
Como detectar correlações espúrias
Estatísticos e outros cientistas que analisam dados devem estar sempre atentos a relações espúrias. Existem vários métodos que eles usam, incluindo:
- Garantir uma amostra representativa adequada.
- Obter um tamanho de amostra adequado.
- Desconfie de endpoints arbitrários.
- Controle de tantas variáveis externas quanto possível.
- Uso de uma hipótese nula e verificação de um valor p forte.