5 példa a bimodális eloszlásokra (amelyek egyike sem emberi magasságú)
A statisztikai oktatás minden furcsa tényezője a Amerikai Egyesült Államok (és minden más ország, amit csak tudok) az a mód, ahogyan megtanítjuk a gyerekeket a bimodális eloszlásra. A bimodális eloszlás olyan adatkészlet, amelynek két csúcsa (módja) van, amelyek legalább olyan távolságra vannak egymástól, mint a szórások összege. A következőképpen néz ki:
Fontos megoszlás erről tudni, mert ha az adatai így néznek ki, akkor az átlagra vonatkozó számításai teljesen haszontalanok lesznek. Például a fenti eloszláshoz átlagosan nulla körüli értéket kapnánk, ami szinte semmit sem mondana magáról az adatról, és teljesen kihagyná mindkét csúcsot. Eddig jó. Ha azonban ezt statisztikaórákon tanítják, akkor a legtöbb gyerek számára a “valós világ” példája az emberi magasság … és az emberi magasság nem bimodális. Bummer.
Tekintettel arra, hogy itt a tanév kezdete és mindezt úgy gondoltam, hogy jó idő lenne néhány új példával szolgálni a tanároknak. Most, az alapul szolgáló adatsortól függően, ezek közül néhány nem biztos, hogy a csúcsokat elválasztja a kombinált szórások hossza ”Cutoff sem … .. de legalább új szempontból téved. Ennek számítania kell valamire, igaz?
- Az ügyvédek fizetésének megkezdése Átlagosan az új ügyvédek járnak jól. A valóságban nagy nyertesek és vesztesek vannak az egész “jó munkát kapnak a diploma megszerzése után” játékban, és ez a fizetések eloszlásában is megmutatkozik. Olvassa el itt a törvény feletti panaszt.
- Könyvárak A könyvárak csoportosulnak különböző árpontok, attól függően, hogy a papírkötéseket vagy a keménytáblákat nézi, ahogy az Isten játékszer kocka megmagyarázza. Ha a papírkötésű és a keménytáblák közötti különbség nem elég széles az Ön számára, akkor képzelje el, hogy az Amazon.com minden könyvének áradatait lehívhatja. két módot eredményezne, egyet a szokásos könyvek és egyet a tankönyvek számára.
- Az éttermi csúcsidőszakok Ha megrajzolná a hisztogramot, amikor minden ügyfél egy adott napon belépett egy étterembe, akkor a végén 2 pont körüli bimodális eloszlással: ebéd és vacsora. Ez a típusú hisztogram általában akkor is megjelenik, ha feltérképezi az úthasználatot (reggeli és délutáni csúcsforgalom), valamint a lakossági víz- és villamosenergia-felhasználást (munka előtt és után).
- Sebességkorlátozások, amelyről valójában nem találtam sok adatot, de feltételezem, ha feltérképezné az összes sebességkorlátozást az Egyesült Államok minden egyes mérföldjén (vagy talán csak az Ön államában), akkor a terjesztése 30/35 körül, majd ismét 60/65 körül csoportosulna. Alapvetően autópályák vagy szokásos utak. Ez a megoszlás további ráncokat okozna, ha másképp torzulna, attól függően, hogy mérföldnyi utat használtunk-e, vagy utak száma volt, de ez teljesen más kérdés.
- Betegségminták Van egy meglehetősen lenyűgöző, két részből álló blogbejegyzés Jules által J Berman, aki itt és itt tárgyalja a bimodális rákmintákat. Alapvetően ezek rákos megbetegedések, amelyek hasonlónak tűnnek, de meglehetősen különböző korcsoportokat sújtanak. Például Karposi szarkóma AIDS-es fiatal férfiakat és idősebb férfiakat sújt, akiknek nincs AIDS-je, és Berman szerint ezeknek a mintáknak a látása fontos nyomokat adhat nekünk magukról a betegségekről. Lehetséges magyarázatok Berman hozzászólásából: 1. Több környezeti ok különböző korosztályt céloz meg 2. Többszörös genetikai okok különböző latenciákkal 3. Több betegség egy név alatt osztályozva 4. Hibás vagy elégtelen adat 5. 1,2,3 és 4 kombinációi.
A bimodális eloszlások szintén nagyszerű ok, amiért az adatelemzés első számú szabálya, hogy MINDIG gyorsan megnézze az adatok grafikonját, mielőtt bármit is tenne. Amint a fenti példákból látható, a csúcsok szinte mindig tartalmazzák a saját fontos információkészleteiket, és külön-külön és együtt is meg kell érteni őket, hogy egyáltalán megértsék őket.
Tehát mi a kedvenc nem emberi magasság példa?