5 Voorbeelden van bimodale verdelingen (die geen menselijke lengte zijn)
Van alle vreemde dingen over statistiekonderwijs in de Voor zover ik weet, is de VS (en andere landen) de manier waarop we kinderen leren over de bimodale distributie. Een bimodale verdeling is een set gegevens met twee pieken (modi) die minstens zo ver uit elkaar liggen als de som van de standaarddeviaties. Het ziet er als volgt uit:
Het is een belangrijke verdeling om te weten, want als uw gegevens er zo uitzien, zullen uw berekeningen voor het gemiddelde totaal nutteloos zijn. Voor de bovenstaande verdeling zouden we bijvoorbeeld een gemiddelde van (rond) nul krijgen, wat ons bijna niets zou vertellen over de gegevens zelf, en beide pieken volledig zouden missen. Tot zover goed. Wanneer dit echter wordt onderwezen in statistiekenklassen, is het echte voorbeeld dat de meeste kinderen krijgen de menselijke lengte … en de menselijke lengte is niet bimodaal. Jammer.
Aangezien het het begin van het schooljaar is en alles, ik dacht dat het een goed moment zou zijn om docenten wat nieuwe voorbeelden te geven. Nu, afhankelijk van de onderliggende dataset die je zou kunnen gebruiken, maken sommige van deze voorbeelden de pieken mogelijk niet gescheiden door de lengte van de gecombineerde standaarddeviaties ”Ofwel… ..maar je zult tenminste ongelijk hebben op nieuwe manieren. Dat moet toch ergens voor tellen?
- Beginsalarissen voor advocaten Gemiddeld doen nieuwe advocaten het goed. In werkelijkheid zijn er grote winnaars en verliezers in het hele spel “een goede baan krijgen na afstuderen”, en dat blijkt uit de salarisverdelingen. Lees hier de klacht Above The Law.
- Boekprijzen Boekprijzen clusteren rond verschillende prijspunten, afhankelijk van of je naar paperbacks of hardcovers kijkt, zoals God Plays Dice uitlegt. Als de kloof tussen paperback en hardcovers niet groot genoeg voor je is, stel je dan voor dat je prijsgegevens kunt opvragen voor elk boek dat beschikbaar is op Amazon.com. zou eindigen met twee modi, een voor gewone boeken en een voor schoolboeken.
- Piekuren van restaurants Als je een histogram zou uitzetten van wanneer elke klant op een bepaalde dag een restaurant binnenkwam, zou je eindigen met een bimodale verdeling rond 2 punten: lunch en diner. Dit type histogram verschijnt ook vaak wanneer u het weggebruik (ochtend- en middagspits) en huishoudelijk water- / elektriciteitsverbruik (voor en na het werk) in kaart brengt.
- Snelheidslimieten Hier kon ik eigenlijk niet veel gegevens over vinden, maar ik vermoed dat als je alle snelheidslimieten op elke kilometer weg in de VS (of misschien alleen je staat) in kaart zou brengen, je distributie rond 30/35 en dan weer rond 60/65 zou eindigen. In principe snelwegen of gewone wegen. Deze verdeling zou ook de extra rimpel van scheeftrekken hebben, afhankelijk van of we kilometers weg of aantal wegen gebruikten, maar dat is een heel andere zaak.
- Ziektepatronen Er is een nogal fascinerende tweedelige blogpost van Jules J Berman die hier en hier bimodale kankerpatronen bespreekt. In wezen zijn dit kankers die op elkaar lijken, maar de neiging hebben om nogal verschillende leeftijdsgroepen te treffen. Het sarcoom van Karposi treft bijvoorbeeld jonge mannen met aids en oudere mannen die geen aids hebben, en Berman stelt dat het zien van deze patronen ons belangrijke aanwijzingen moet geven over de ziekten zelf. Mogelijke verklaringen uit de post van Berman: 1. Meerdere omgevingsoorzaken gericht op verschillende leeftijden 2. Meerdere genetische oorzaken met verschillende latenties 3. Meerdere ziekten onder één naam geclassificeerd 4. Foutieve of onvoldoende gegevens 5. Combinaties van 1,2,3 en 4.
Bimodale distributies zijn ook een goede reden waarom de belangrijkste regel van data-analyse is om ALTIJD snel een grafiek van je data te bekijken voordat je iets doet. Zoals je aan de bovenstaande voorbeelden kunt zien, bevatten de pieken bijna altijd hun eigen belangrijke informatie, en moeten ze zowel afzonderlijk als samen worden begrepen om überhaupt begrepen te worden.
Dus wat is je favoriete niet-menselijke hoogte voorbeeld?