5 példa a bimodális eloszlásokra (amelyek egyike sem emberi magasságú)

A statisztikai oktatás minden furcsa tényezője a Amerikai Egyesült Államok (és minden más ország, amit csak tudok) az a mód, ahogyan megtanítjuk a gyerekeket a bimodális eloszlásra. A bimodális eloszlás olyan adatkészlet, amelynek két csúcsa (módja) van, amelyek legalább olyan távolságra vannak egymástól, mint a szórások összege. A következőképpen néz ki:

Fontos megoszlás erről tudni, mert ha az adatai így néznek ki, akkor az átlagra vonatkozó számításai teljesen haszontalanok lesznek. Például a fenti eloszláshoz átlagosan nulla körüli értéket kapnánk, ami szinte semmit sem mondana magáról az adatról, és teljesen kihagyná mindkét csúcsot. Eddig jó. Ha azonban ezt statisztikaórákon tanítják, akkor a legtöbb gyerek számára a “valós világ” példája az emberi magasság … és az emberi magasság nem bimodális. Bummer.

Tekintettel arra, hogy itt a tanév kezdete és mindezt úgy gondoltam, hogy jó idő lenne néhány új példával szolgálni a tanároknak. Most, az alapul szolgáló adatsortól függően, ezek közül néhány nem biztos, hogy a csúcsokat elválasztja a kombinált szórások hossza ”Cutoff sem … .. de legalább új szempontból téved. Ennek számítania kell valamire, igaz?

  1. Az ügyvédek fizetésének megkezdése Átlagosan az új ügyvédek járnak jól. A valóságban nagy nyertesek és vesztesek vannak az egész “jó munkát kapnak a diploma megszerzése után” játékban, és ez a fizetések eloszlásában is megmutatkozik. Olvassa el itt a törvény feletti panaszt.
  2. Könyvárak A könyvárak csoportosulnak különböző árpontok, attól függően, hogy a papírkötéseket vagy a keménytáblákat nézi, ahogy az Isten játékszer kocka megmagyarázza. Ha a papírkötésű és a keménytáblák közötti különbség nem elég széles az Ön számára, akkor képzelje el, hogy az Amazon.com minden könyvének áradatait lehívhatja. két módot eredményezne, egyet a szokásos könyvek és egyet a tankönyvek számára.
  3. Az éttermi csúcsidőszakok Ha megrajzolná a hisztogramot, amikor minden ügyfél egy adott napon belépett egy étterembe, akkor a végén 2 pont körüli bimodális eloszlással: ebéd és vacsora. Ez a típusú hisztogram általában akkor is megjelenik, ha feltérképezi az úthasználatot (reggeli és délutáni csúcsforgalom), valamint a lakossági víz- és villamosenergia-felhasználást (munka előtt és után).
  4. Sebességkorlátozások, amelyről valójában nem találtam sok adatot, de feltételezem, ha feltérképezné az összes sebességkorlátozást az Egyesült Államok minden egyes mérföldjén (vagy talán csak az Ön államában), akkor a terjesztése 30/35 körül, majd ismét 60/65 körül csoportosulna. Alapvetően autópályák vagy szokásos utak. Ez a megoszlás további ráncokat okozna, ha másképp torzulna, attól függően, hogy mérföldnyi utat használtunk-e, vagy utak száma volt, de ez teljesen más kérdés.
  5. Betegségminták Van egy meglehetősen lenyűgöző, két részből álló blogbejegyzés Jules által J Berman, aki itt és itt tárgyalja a bimodális rákmintákat. Alapvetően ezek rákos megbetegedések, amelyek hasonlónak tűnnek, de meglehetősen különböző korcsoportokat sújtanak. Például Karposi szarkóma AIDS-es fiatal férfiakat és idősebb férfiakat sújt, akiknek nincs AIDS-je, és Berman szerint ezeknek a mintáknak a látása fontos nyomokat adhat nekünk magukról a betegségekről. Lehetséges magyarázatok Berman hozzászólásából: 1. Több környezeti ok különböző korosztályt céloz meg 2. Többszörös genetikai okok különböző latenciákkal 3. Több betegség egy név alatt osztályozva 4. Hibás vagy elégtelen adat 5. 1,2,3 és 4 kombinációi.

A bimodális eloszlások szintén nagyszerű ok, amiért az adatelemzés első számú szabálya, hogy MINDIG gyorsan megnézze az adatok grafikonját, mielőtt bármit is tenne. Amint a fenti példákból látható, a csúcsok szinte mindig tartalmazzák a saját fontos információkészleteiket, és külön-külön és együtt is meg kell érteni őket, hogy egyáltalán megértsék őket.

Tehát mi a kedvenc nem emberi magasság példa?

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük