5 przykładów rozkładów bimodalnych (z których żaden nie jest wzrostem człowieka)
Ze wszystkich dziwnych rzeczy związanych z edukacją statystyczną w Stany Zjednoczone (i inne kraje, o ile wiem) to sposób, w jaki uczymy dzieci o dystrybucji bimodalnej. Rozkład bimodalny to zestaw danych, który ma dwa piki (mody), które są co najmniej tak daleko od siebie, jak suma odchyleń standardowych. Wygląda to tak:
To ważna dystrybucja, o której należy wiedzieć, ponieważ jeśli Twoje dane wyglądają tak, to obliczenia średniej będą całkowicie bezużyteczne. Na przykład dla powyższego rozkładu otrzymalibyśmy średnią (około) zera, co nie mówiłoby nam prawie nic o samych danych i całkowicie pomijałoby oba piki. Na razie w porządku. Jednak kiedy uczy się tego na zajęciach ze statystyk, przykładem „prawdziwego świata”, który podaje większość dzieci, jest wzrost człowieka… a wzrost człowieka nie jest dwumodalny. Bummer.
Biorąc pod uwagę, że jest to początek roku szkolnego i wszystko, pomyślałem, że to dobry moment, aby przedstawić nauczycielom kilka nowych przykładów. Teraz, w zależności od podstawowego zestawu danych, którego możesz użyć, niektóre z tych przykładów mogą nie tworzyć „szczytów oddzielonych długością połączonych odchyleń standardowych ”Przerywa… ..ale przynajmniej będziesz się mylić w nowy sposób. To się musi na coś liczyć, prawda?
- Początkowe pensje dla prawników Nowi prawnicy przeciętnie radzą sobie dobrze. W rzeczywistości w całej grze o „zdobycie dobrej pracy po ukończeniu szkoły” są wielcy zwycięzcy i przegrani, co widać w rozkładzie wynagrodzeń. Przeczytaj skargę Above The Law tutaj.
- Ceny książek Ceny książek skupiają się wokół różne punkty cenowe, w zależności od tego, czy patrzysz na książki w miękkiej, czy w twardej oprawie, jak wyjaśnia God Plays Dice. Jeśli różnica między twardą a miękką oprawą nie jest dla Ciebie wystarczająco duża, wyobraź sobie, że możesz pobrać dane o cenach dla każdej książki dostępnej na Amazon.com. skończyłoby się na dwóch trybach, jednym dla zwykłych książek i jednym dla podręczników.
- Szczytowe godziny otwarcia restauracji Jeśli sporządzisz histogram pokazujący, kiedy każdy klient wchodził do restauracji w danym dniu, z rozkładem bimodalnym około 2 punktów: obiad i kolacja. Ten typ histogramu pojawia się również podczas tworzenia mapy wykorzystania dróg (poranne i popołudniowe godziny szczytu) oraz zużycia wody / energii elektrycznej w mieszkaniach (przed i po pracy).
- Ograniczenia prędkości W tym przypadku nie mogłem znaleźć zbyt wielu danych, ale zgaduję, że gdybyś wyznaczył wszystkie ograniczenia prędkości na każdej mili drogi w USA (lub może tylko w Twoim stanie), Twoja dystrybucja zakończyłaby się skupieniem wokół 30/35, a następnie ponownie około 60/65. Zasadniczo autostrady lub zwykłe drogi. Ta dystrybucja miałaby również dodatkową zmarszczkę w postaci skrzywienia w różny sposób w zależności od tego, czy wykorzystaliśmy kilometry drogi, czy liczbę dróg, ale to zupełnie inna sprawa.
- Typy chorób Jest dość fascynujący dwuczęściowy wpis na blogu Julesa J. Bermana, który omawia tu i tutaj bimodalne wzory raka. Zasadniczo są to nowotwory, które wydają się podobne, ale mają tendencję do dotykania raczej różnych grup wiekowych. Na przykład mięsak Karposiego dotyka młodych mężczyzn z AIDS i starszych mężczyzn, którzy nie chorują na AIDS, a Berman twierdzi, że zobaczenie tych wzorców powinno dać nam ważne wskazówki dotyczące samych chorób. Możliwe wyjaśnienia z postu Bermana: 1. Wiele przyczyn środowiskowych w różnym wieku 2. Wiele przyczyn genetycznych z różnymi opóźnieniami 3. Wiele chorób sklasyfikowanych pod jednym nazwiskiem 4. Błędne lub niewystarczające dane 5. Kombinacje 1, 2, 3 i 4.
Rozkłady bimodalne są również świetnym powodem, dla którego zasadą numer jeden w analizie danych jest ZAWSZE szybkie spojrzenie na wykres danych, zanim cokolwiek zrobisz. Jak widać na powyższych przykładach, piki prawie zawsze zawierają własne ważne zestawy informacji i muszą być rozumiane zarówno oddzielnie, jak i razem, aby w ogóle mogły być zrozumiane.
Więc jakie jest twoje ulubione nie-ludzkie przykład wysokości?