5 przykładów rozkładów bimodalnych (z których żaden nie jest wzrostem człowieka)

Ze wszystkich dziwnych rzeczy związanych z edukacją statystyczną w Stany Zjednoczone (i inne kraje, o ile wiem) to sposób, w jaki uczymy dzieci o dystrybucji bimodalnej. Rozkład bimodalny to zestaw danych, który ma dwa piki (mody), które są co najmniej tak daleko od siebie, jak suma odchyleń standardowych. Wygląda to tak:

To ważna dystrybucja, o której należy wiedzieć, ponieważ jeśli Twoje dane wyglądają tak, to obliczenia średniej będą całkowicie bezużyteczne. Na przykład dla powyższego rozkładu otrzymalibyśmy średnią (około) zera, co nie mówiłoby nam prawie nic o samych danych i całkowicie pomijałoby oba piki. Na razie w porządku. Jednak kiedy uczy się tego na zajęciach ze statystyk, przykładem „prawdziwego świata”, który podaje większość dzieci, jest wzrost człowieka… a wzrost człowieka nie jest dwumodalny. Bummer.

Biorąc pod uwagę, że jest to początek roku szkolnego i wszystko, pomyślałem, że to dobry moment, aby przedstawić nauczycielom kilka nowych przykładów. Teraz, w zależności od podstawowego zestawu danych, którego możesz użyć, niektóre z tych przykładów mogą nie tworzyć „szczytów oddzielonych długością połączonych odchyleń standardowych ”Przerywa… ..ale przynajmniej będziesz się mylić w nowy sposób. To się musi na coś liczyć, prawda?

  1. Początkowe pensje dla prawników Nowi prawnicy przeciętnie radzą sobie dobrze. W rzeczywistości w całej grze o „zdobycie dobrej pracy po ukończeniu szkoły” są wielcy zwycięzcy i przegrani, co widać w rozkładzie wynagrodzeń. Przeczytaj skargę Above The Law tutaj.
  2. Ceny książek Ceny książek skupiają się wokół różne punkty cenowe, w zależności od tego, czy patrzysz na książki w miękkiej, czy w twardej oprawie, jak wyjaśnia God Plays Dice. Jeśli różnica między twardą a miękką oprawą nie jest dla Ciebie wystarczająco duża, wyobraź sobie, że możesz pobrać dane o cenach dla każdej książki dostępnej na Amazon.com. skończyłoby się na dwóch trybach, jednym dla zwykłych książek i jednym dla podręczników.
  3. Szczytowe godziny otwarcia restauracji Jeśli sporządzisz histogram pokazujący, kiedy każdy klient wchodził do restauracji w danym dniu, z rozkładem bimodalnym około 2 punktów: obiad i kolacja. Ten typ histogramu pojawia się również podczas tworzenia mapy wykorzystania dróg (poranne i popołudniowe godziny szczytu) oraz zużycia wody / energii elektrycznej w mieszkaniach (przed i po pracy).
  4. Ograniczenia prędkości W tym przypadku nie mogłem znaleźć zbyt wielu danych, ale zgaduję, że gdybyś wyznaczył wszystkie ograniczenia prędkości na każdej mili drogi w USA (lub może tylko w Twoim stanie), Twoja dystrybucja zakończyłaby się skupieniem wokół 30/35, a następnie ponownie około 60/65. Zasadniczo autostrady lub zwykłe drogi. Ta dystrybucja miałaby również dodatkową zmarszczkę w postaci skrzywienia w różny sposób w zależności od tego, czy wykorzystaliśmy kilometry drogi, czy liczbę dróg, ale to zupełnie inna sprawa.
  5. Typy chorób Jest dość fascynujący dwuczęściowy wpis na blogu Julesa J. Bermana, który omawia tu i tutaj bimodalne wzory raka. Zasadniczo są to nowotwory, które wydają się podobne, ale mają tendencję do dotykania raczej różnych grup wiekowych. Na przykład mięsak Karposiego dotyka młodych mężczyzn z AIDS i starszych mężczyzn, którzy nie chorują na AIDS, a Berman twierdzi, że zobaczenie tych wzorców powinno dać nam ważne wskazówki dotyczące samych chorób. Możliwe wyjaśnienia z postu Bermana: 1. Wiele przyczyn środowiskowych w różnym wieku 2. Wiele przyczyn genetycznych z różnymi opóźnieniami 3. Wiele chorób sklasyfikowanych pod jednym nazwiskiem 4. Błędne lub niewystarczające dane 5. Kombinacje 1, 2, 3 i 4.

Rozkłady bimodalne są również świetnym powodem, dla którego zasadą numer jeden w analizie danych jest ZAWSZE szybkie spojrzenie na wykres danych, zanim cokolwiek zrobisz. Jak widać na powyższych przykładach, piki prawie zawsze zawierają własne ważne zestawy informacji i muszą być rozumiane zarówno oddzielnie, jak i razem, aby w ogóle mogły być zrozumiane.

Więc jakie jest twoje ulubione nie-ludzkie przykład wysokości?

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *