5 esempi di distribuzioni bimodali (nessuna delle quali è ad altezza umana)
Di tutte le cose strane sulleducazione statistica nel Gli Stati Uniti (e altri paesi per quanto ne so) sono il modo in cui insegniamo ai bambini la distribuzione bimodale. Una distribuzione bimodale è un insieme di dati che ha due picchi (modalità) distanti almeno quanto la somma delle deviazioni standard. Ha questo aspetto:
È una distribuzione importante da conoscere, perché se i tuoi dati hanno questo aspetto, i tuoi calcoli per la media saranno totalmente inutili. Per la distribuzione di cui sopra, ad esempio, avremmo una media di (circa) zero, che non ci direbbe quasi nulla sui dati stessi e perderebbe completamente entrambi i picchi. Fin qui tutto bene. Tuttavia, quando questo viene insegnato nelle lezioni di statistica, lesempio del “mondo reale” che viene fornito alla maggior parte dei bambini è laltezza umana … e laltezza umana non è bimodale. Peccato.
Dato che è linizio dellanno scolastico e tutto, ho pensato che sarebbe stato un buon momento per fornire agli insegnanti alcuni nuovi esempi. Ora, a seconda del set di dati sottostante che potresti utilizzare, alcuni di questi esempi potrebbero non rendere i “picchi separati dalla lunghezza delle deviazioni standard combinate “Cutoff o … ..ma almeno ti sbaglierai in modi nuovi. Questo deve contare qualcosa, giusto?
- Stipendi iniziali per gli avvocati In media i nuovi avvocati vanno bene. In realtà ci sono grandi vincitori e vinti nel gioco “ottenere un buon lavoro dopo la laurea”, e si vede nella distribuzione degli stipendi. Leggi qui il reclamo Above The Law.
- Prezzi dei libri I prezzi dei libri si raggruppano intorno fasce di prezzo diverse, a seconda che tu stia guardando i tascabili o le copertine rigide come spiega God Plays Dice. Se il divario tra tascabile e copertina rigida non è abbastanza ampio per te, immagina di poter estrarre i dati sui prezzi per ogni libro disponibile su Amazon.com. finirebbe con due modalità, una per i libri normali e una per i libri di testo.
- Ore di punta dei ristoranti Se tracciassi un istogramma di quando ogni cliente entrava in un ristorante in un dato giorno, finiresti per con una distribuzione bimodale intorno a 2 punti: pranzo e cena. Questo tipo di istogramma tende a comparire anche quando si mappa lutilizzo della strada (ore di punta mattutine e pomeridiane) e lutilizzo residenziale di acqua / elettricità (prima e dopo il lavoro).
- Limiti di velocità Questo in realtà non sono riuscito a trovare molti dati, ma immagino che se rilevassi tutti i limiti di velocità su ogni miglio di strada negli Stati Uniti (o forse solo il tuo stato), la tua distribuzione finirebbe per raggrupparsi intorno a 30/35 e poi di nuovo intorno a 60/65. Fondamentalmente autostrade o strade regolari. Questa distribuzione avrebbe anche la piega aggiuntiva di inclinare in modo diverso in base al fatto che abbiamo utilizzato miglia di strada o numero di strade, ma questa è una questione completamente diversa.
- Modelli di malattia Cè un post sul blog in due parti piuttosto affascinante di Jules J Berman che discute i modelli di cancro bimodale qui e qui. Fondamentalmente si tratta di tumori che sembrano simili ma tendono a colpire fasce di età piuttosto diverse. Ad esempio, il sarcoma di Karposi colpisce i giovani con lAIDS e gli uomini più anziani che non hanno lAIDS, e Berman sostiene che vedere questi schemi dovrebbe darci importanti indizi sulle malattie stesse. Possibili spiegazioni dal post di Berman: 1. Molteplici cause ambientali mirate a diverse età 2. Molteplici cause genetiche con differenti latenze 3. Molteplici malattie classificate sotto un nome 4. Dati difettosi o insufficienti 5. Combinazioni di 1,2,3 e 4.
Le distribuzioni bimodali sono anche unottima ragione per cui la regola numero uno dellanalisi dei dati è SEMPRE dare una rapida occhiata a un grafico dei dati prima di fare qualsiasi cosa. Come puoi vedere dagli esempi precedenti, i picchi contengono quasi sempre i loro importanti set di informazioni e devono essere compresi sia separatamente che insieme per essere compresi.
Allora qual è il tuo non umano preferito esempio di altezza?