5 exemplos de distribuições bimodais (nenhuma das quais tem altura humana)
De todas as coisas estranhas sobre a educação estatística no Os EUA (e outros países, pelo que sei) são a forma como ensinamos as crianças sobre a distribuição bimodal. Uma distribuição bimodal é um conjunto de dados que tem dois picos (modos) que são pelo menos tão distantes quanto a soma dos desvios padrão. Tem a seguinte aparência:
É uma distribuição importante de se saber, porque se seus dados forem assim, seus cálculos para a média serão totalmente inúteis. Para a distribuição acima, por exemplo, obteríamos uma média de (em torno de) zero, o que não nos diria quase nada sobre os dados em si e deixaria de lado ambos os picos. Até agora tudo bem. No entanto, quando isso é ensinado em aulas de estatísticas, o exemplo do “mundo real” que a maioria das crianças recebe é a altura humana … e a altura humana não é bimodal. Que chatice.
Dado que é o início do ano letivo e tudo, achei que seria um bom momento para fornecer aos professores alguns novos exemplos. Agora, dependendo do conjunto de dados subjacente que você pode usar, alguns desses exemplos podem não apresentar os “picos separados pelo comprimento dos desvios-padrão combinados ”Corte qualquer um … mas pelo menos você estará errado de novas maneiras. Isso tem que contar para alguma coisa, certo?
- Salários iniciais para advogados Em média, os novos advogados se dão bem. Na realidade, existem grandes vencedores e perdedores em todo o jogo “conseguir um bom emprego após a formatura”, e isso se mostra na distribuição de salários. Leia a reclamação da Lei Acima.
- Preços dos livros Os preços dos livros se agrupam ao redor preços diferentes, dependendo se você está olhando para brochuras ou capas duras, conforme explica God Plays Dice. Se a diferença entre brochuras e capas duras não for grande o suficiente para você, imagine que você possa obter dados de preços para cada livro disponível na Amazon.com. acabaria com dois modos, um para livros normais e outro para livros didáticos.
- Horário de pico do restaurante Se você traçasse um histograma de quando cada cliente entrava em um restaurante em um determinado dia, acabaria com uma distribuição bimodal em torno de 2 pontos: almoço e jantar. Este tipo de histograma também tende a aparecer quando você mapeia o uso da estrada (horas de ponta da manhã e da tarde) e o uso residencial de água / eletricidade (antes e depois do trabalho).
- Limites de velocidade Este eu realmente não consegui encontrar muitos dados, mas suponho que se você mapeasse todos os limites de velocidade em cada quilômetro de estrada nos EUA (ou talvez apenas em seu estado), sua distribuição acabaria agrupada em torno de 30/35 e novamente em torno de 60/65. Basicamente, rodovias ou estradas regulares. Essa distribuição também teria a complicação adicional de distorção diferente com base em se usamos quilômetros de estrada ou número de estradas, mas isso é uma questão completamente diferente.
- Padrões de doença Há uma postagem de blog fascinante em duas partes por Jules J Berman que discute padrões de câncer bimodal aqui e aqui. Basicamente, são cânceres que parecem semelhantes, mas tendem a atingir grupos de idades bastante diferentes. Por exemplo, o sarcoma de Karposi atinge homens jovens com AIDS e homens mais velhos que não têm AIDS, e Berman argumenta que ver esses padrões deve nos dar pistas importantes sobre as próprias doenças. Possíveis explicações da postagem de Berman: 1. Múltiplas causas ambientais visando diferentes idades 2. Múltiplas causas genéticas com diferentes latências 3. Múltiplas doenças classificadas sob um nome 4. Dados defeituosos ou insuficientes 5. Combinações de 1,2,3 e 4.
As distribuições bimodais também são um grande motivo pelo qual a regra número um da análise de dados é SEMPRE dar uma olhada rápida em um gráfico de seus dados antes de fazer qualquer coisa. Como você pode ver nos exemplos acima, os picos quase sempre contêm seus próprios conjuntos importantes de informações e devem ser compreendidos separadamente e em conjunto para serem compreendidos.
Então, qual é o seu não humano favorito exemplo de altura?