5 Exemple de distribuții bimodale (niciuna dintre acestea nu sunt înălțimea umană)

Dintre toate lucrurile ciudate despre educația statistică în SUA (și alte țări pentru tot ce știu) este modul în care îi învățăm pe copii despre distribuția bimodală. O distribuție bimodală este un set de date care are două vârfuri (moduri) care sunt cel puțin la fel de îndepărtate ca suma abaterilor standard. Arată așa:

Este o distribuție importantă de știut, deoarece dacă datele dvs. arată astfel, calculele dvs. pentru medie vor fi total inutile. De exemplu, pentru distribuția de mai sus, am obține o medie (aproximativ) zero, ceea ce nu ne-ar spune aproape nimic despre datele în sine și ne-ar lipsi complet ambele vârfuri. Până acum, bine. Cu toate acestea, atunci când acest lucru este predat la cursurile statistice, exemplul „lumii reale” pe care majoritatea copiilor îl oferă este înălțimea umană … și înălțimea umană nu este bimodală. Bummer.

Având în vedere că este începutul anului școlar și toate, m-am gândit că ar fi un moment bun să ofer profesorilor câteva exemple noi. Acum, în funcție de setul de date de bază pe care l-ați putea folosi, este posibil ca unele dintre aceste exemple să nu facă „vârfurile separate de lungimea abaterilor standard combinate ”Fie tăiere … dar măcar te vei înșela în moduri noi. Trebuie să contăm pentru ceva, nu?

  1. Începerea salariilor pentru avocați În medie, avocații noi se descurcă bine. În realitate, există câștigători și pierzători mari în tot jocul „obținerea unui loc de muncă bun după absolvire” și se arată în distribuția salariilor. Citiți aici reclamația „Deasupra legii”.
  2. Prețurile cărților diferite puncte de preț, în funcție de faptul că vă uitați la broșuri sau la Hardcover, așa cum explică God Plays Dice. Dacă diferența dintre broșură și Hardcover nu este suficient de mare pentru dvs., imaginați-vă că puteți extrage datele despre prețuri pentru fiecare carte disponibilă pe Amazon.com Ați avea două moduri, unul pentru cărți obișnuite și unul pentru manuale.
  3. Orele de vârf ale restaurantului Dacă ați trasat o histogramă a momentului în care fiecare client a intrat într-un restaurant într-o zi dată, ați ajunge cu o distribuție bimodală în jurul a 2 puncte: prânz și cină. Acest tip de histogramă tinde să apară și atunci când hărțiți utilizarea drumurilor (orele de vârf dimineața și după-amiaza) și consumul de apă / electricitate rezidențială (înainte și după serviciu).
  4. Limite de viteză Pe acesta nu am putut găsi prea multe date, dar presupun că dacă ați tras toate limitele de viteză pe fiecare kilometru de drum din SUA (sau poate doar statul dvs.), distribuția dvs. ar ajunge grupată în jurul valorii de 30/35 și apoi din nou în jurul valorii de 60/65. Practic autostrăzi sau drumuri regulate. Această distribuție ar avea, de asemenea, ridul suplimentar de înclinare diferit în funcție de faptul dacă am folosit kilometri de drum sau numărul de drumuri, dar asta este cu totul altceva diferit.
  5. Modele de boală Există o postare pe blog în două părți destul de fascinantă a lui Jules J Berman, care discută despre modelele de cancer bimodal aici și aici. Practic, acestea sunt tipuri de cancer care par similare, dar care tind să afecteze grupe de vârstă destul de diferite. De exemplu, sarcomul lui Karposi lovește tinerii cu SIDA și bărbații mai în vârstă care nu au SIDA, iar Berman susține că vizualizarea acestor tipare ar trebui să ne ofere indicii importante despre bolile în sine. Explicații posibile din postarea lui Berman: 1. Cauze multiple de mediu care vizează vârste diferite 2. Cauze genetice multiple cu latențe diferite 3. Boli multiple clasificate sub un singur nume 4. Date defecte sau insuficiente 5. Combinații de 1,2,3 și 4.

Distribuțiile bimodale sunt, de asemenea, un motiv excelent pentru care regula numărul unu de analiză a datelor este să aruncăm MEREU o privire rapidă asupra unui grafic al datelor dvs. înainte de a face ceva. După cum puteți vedea din exemplele de mai sus, vârfurile conțin aproape întotdeauna propriile lor seturi importante de informații și trebuie înțelese atât separat, cât și împreună, pentru a fi înțelese deloc.

Deci, care este non-omul tău preferat exemplu de înălțime?

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *