5 ejemplos de distribuciones bimodales (ninguna de las cuales es altura humana)
De todas las cosas extrañas sobre la educación estadística en el Estados Unidos (y otros países, por lo que sé) es la forma en que enseñamos a los niños sobre la distribución bimodal. Una distribución bimodal es un conjunto de datos que tiene dos picos (modos) que están al menos tan separados como la suma de las desviaciones estándar. Se ve así:
Es una distribución importante que debe conocer, porque si sus datos se ven así, sus cálculos para el promedio serán totalmente inútiles. Para la distribución anterior, por ejemplo, obtendríamos un promedio de (alrededor de) cero, lo que no nos diría casi nada sobre los datos en sí, y perdería por completo ambos picos. Hasta ahora tan bueno. Sin embargo, cuando esto se enseña en las clases de estadísticas, el ejemplo del «mundo real» que se les da a la mayoría de los niños es la altura humana … y la altura humana no es bimodal. Qué lástima.
Dado que es el comienzo del año escolar y todo, pensé que sería un buen momento para proporcionar a los profesores algunos ejemplos nuevos. Ahora, según el conjunto de datos subyacente que pueda utilizar, es posible que algunos de estos ejemplos no hagan que los «picos estén separados por la longitud de las desviaciones estándar combinadas ”Corte tampoco… ..pero al menos te equivocarás en nuevas formas. Eso tiene que contar para algo, ¿verdad?
- Salarios iniciales de los abogados En promedio, los abogados nuevos obtienen buenos resultados. En realidad, hay grandes ganadores y perdedores en todo el juego de «conseguir un buen trabajo después de la graduación», y esto se refleja en las distribuciones salariales. Lea aquí la demanda sobre la ley.
- Precios de los libros Los precios de los libros se agrupan alrededor diferentes puntos de precio, dependiendo de si miras libros de bolsillo o de tapa dura, como explica God Plays Dice. Si la brecha entre los libros de bolsillo y las tapas duras no es lo suficientemente amplia para ti, imagina que puedes obtener datos de precios para cada libro disponible en Amazon.com. terminaría con dos modos, uno para libros normales y otro para libros de texto.
- Horas pico del restaurante Si traza un histograma de cuándo cada cliente ingresó a un restaurante en un día determinado, terminaría con una distribución bimodal alrededor de 2 puntos: almuerzo y cena. Este tipo de histograma también tiende a aparecer cuando mapea el uso de la carretera (horas pico de la mañana y la tarde) y el uso residencial de agua / electricidad (antes y después del trabajo).
- Límites de velocidad Este en realidad no pude encontrar muchos datos, pero supongo que si trazara todos los límites de velocidad en cada milla de carretera en los EE. UU. (o tal vez solo en su estado), su distribución terminaría agrupada alrededor de 30/35 y luego nuevamente alrededor de 60/65. Básicamente carreteras o caminos regulares. Esta distribución también tendría la arruga adicional de sesgar de manera diferente en función de si usamos millas de carretera o número de carreteras, pero eso es un asunto completamente diferente.
- Patrones de enfermedades Hay una publicación de blog bastante fascinante de Jules en dos partes J Berman que analiza los patrones de cáncer bimodal aquí y aquí. Básicamente, estos son cánceres que parecen similares pero tienden a afectar a grupos de edades bastante diferentes. Por ejemplo, el sarcoma de Karposi afecta a los hombres jóvenes con SIDA y a los hombres mayores que no tienen SIDA, y Berman sostiene que ver estos patrones debería darnos pistas importantes sobre las enfermedades en sí. Posibles explicaciones de la publicación de Berman: 1. Múltiples causas ambientales dirigidas a diferentes edades 2. Múltiples causas genéticas con diferentes latencias 3. Múltiples enfermedades clasificadas bajo un nombre 4. Datos defectuosos o insuficientes 5. Combinaciones de 1, 2, 3 y 4.
Las distribuciones bimodales también son una gran razón por la cual la regla número uno del análisis de datos es SIEMPRE echar un vistazo rápido a un gráfico de sus datos antes de hacer nada. Como puede ver en los ejemplos anteriores, los picos casi siempre contienen sus propios conjuntos importantes de información, y deben entenderse tanto por separado como en conjunto para que se entiendan en absoluto.
Entonces, ¿cuál es su favorito no humano? ejemplo de altura?