Correlación espuria


¿Qué es la correlación espuria

En estadística, una correlación espuria, o falsedad, se refiere a una conexión entre dos variables que parece causal pero no lo es. Las relaciones espurias a menudo tienen la apariencia de que una variable afecta a otra. Esta correlación falsa a menudo es causada por un tercer factor que no es evidente en el momento del examen, a veces llamado factor de confusión.

Conclusiones clave

  • La correlación espuria, o falsedad, es cuando dos factores aparecen casualmente relacionados pero no lo están.
  • La apariencia de una relación causal a menudo se debe a un movimiento similar en un gráfico que resulta ser una coincidencia o causada por un tercer factor de «confusión».
  • La correlación espuria a menudo puede ser causada por tamaños de muestra pequeños o puntos finales arbitrarios.

Cómo funciona la correlación espuria

Cuando dos variables aleatorias se rastrean de cerca en un gráfico, es fácil sospechar una correlación o una relación entre los dos factores, donde un el cambio afecta al otro. Dejando a un lado la «causalidad», otro tema, esta observación puede llevar al lector del gráfico a creer que el movimiento de la variable A está vinculado al movimiento de la variable B o viceversa. pero a veces, tras un examen estadístico más detallado, los movimientos alineados son coincidentes o son causados por un tercer factor que afecta a los dos primeros. Ésta es una correlación falsa. La investigación realizada con tamaños de muestra pequeños o puntos finales arbitrarios es particularmente susceptible a la falsedad.

Ejemplo de correlaciones espurias

No es demasiado difícil descubrir correlaciones interesantes. Sin embargo, muchos resultarán falsos. Para la especie masculina en Wall Street, dos correlaciones falsas populares involucran a las mujeres y los deportes. La teoría de la longitud de la falda se originó en la década de 1920, que sostiene que la longitud de la falda y la dirección del mercado de valores están correlacionadas. Si las faldas son largas, significa que el mercado de valores está bajando; si son cortos, el mercado está subiendo. A finales de enero se habla del llamado indicador del Super Bowl, que sugiere que una victoria del equipo de la AFC probablemente signifique que el mercado de valores bajará el próximo año, mientras que una victoria del equipo de la NFC presagia un aumento en la mercado. Desde 1966, el indicador ha tenido una tasa de precisión del 80%. Es un tema de conversación divertido, pero probablemente no sea algo que un asesor financiero serio recomendaría como estrategia de inversión para los clientes.

A continuación, se muestran algunos ejemplos más de correlaciones falsas comunes:

  • Los ahogamientos aumentan cuando aumentan las ventas de helados. Puede parecer que el aumento de las ventas de helados causa más ahogamientos, pero en realidad, el aumento del calor puede hacer que más personas naden y compren más helados.
  • La tasa de homicidios en EE. UU. De 2006 a 2011 se redujo a la misma tasa que el uso de Microsoft Internet Explorer.
  • Los ejecutivos que dicen por favor y gracias más a menudo disfrutan de un mejor rendimiento de acciones.
  • Las personas que usan el equipo del equipo de los Oakland Raiders tienen más probabilidades de cometer delitos .

Cómo detectar correlaciones falsas

Los estadísticos y otros científicos que analizan datos deben estar atentos a las relaciones falsas todo el tiempo. Existen numerosos métodos que utilizan, que incluyen:

  • Asegurar una muestra representativa adecuada.
  • Obtener un tamaño de muestra adecuado.
  • Tener cuidado con los puntos finales arbitrarios.
  • Controlar tantas variables externas como sea posible.
  • Usar una hipótesis nula y verificar un valor p fuerte.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *