Het verjaardagsprobleem beantwoorden in de statistieken

Het verjaardagsprobleem in statistieken vraagt: hoeveel mensen heb je nodig in een groep om een kans van 50% te hebben dat ten minste twee mensen een verjaardag delen? Ga je gang en denk daar even over na. Het antwoord verrast veel mensen. Daar komen we binnenkort op terug.

In dit bericht zal ik niet alleen de verjaardagsparadox beantwoorden, maar ik zal je ook laten zien hoe je de waarschijnlijkheden kunt berekenen voor groepen van elke grootte, door een computersimulatie uit te voeren ervan, en leg uit waarom het antwoord op het verjaardagsprobleem zo verrassend is.

Kansen berekenen voor het verjaardagsprobleem

Veel mensen raden 183 omdat dat de helft is van alle mogelijke verjaardagen, wat intuïtief lijkt. Helaas werkt intuïtie niet goed om dit probleem op te lossen. Laten we dus meteen beginnen met het berekenen van kansen voor mensen die verjaardagen delen.

Voor deze berekeningen maken we een paar aannames. Ten eerste laten we schrikkeljaar buiten beschouwing. Dat vereenvoudigt de wiskunde en het verandert de resultaten niet veel. We gaan er ook van uit dat alle verjaardagen even waarschijnlijk voorkomen.

Laten we beginnen met één persoon en vervolgens mensen één voor één toevoegen om te illustreren hoe de berekeningen werken. Voor deze berekeningen is het gemakkelijker om de kans te berekenen dat niemand een verjaardag deelt. We nemen dan die kans en trekken deze van één af om de kans af te leiden dat ten minste twee mensen een verjaardag delen.

1 – Kans op geen overeenkomst = kans op ten minste één overeenkomst

Voor de eerste persoon zijn er nog geen verjaardagen gedekt, wat betekent dat er 365/365 kans is dat er geen gedeelde verjaardag is. Dat is logisch. We hebben maar één persoon.

Laten we nu de tweede persoon toevoegen. De eerste persoon dekt één mogelijke verjaardag, dus de tweede persoon heeft een kans van 364/365 om niet op dezelfde dag te delen. We moeten de kansen van de eerste twee personen vermenigvuldigen en er één aftrekken.

Voor de derde persoon, de vorige twee mensen behandelen twee dates. Daarom heeft de derde persoon een kans van 363/365 omdat hij geen verjaardag deelt.

Nu zie je het patroon voor het berekenen van de waarschijnlijkheid voor een bepaald aantal mensen. Dit is de algemene vorm van de vergelijking:

Gerelateerd bericht: Basisprincipes van waarschijnlijkheid

Het verjaardagsprobleem in kaart brengen Waarschijnlijkheden

Met behulp van Excel kan ik de kansen voor elke groottegroep berekenen en grafisch weergeven. Download mijn Excel-bestand: BirthdayProblem.

Door de waarschijnlijkheden te beoordelen, is het antwoord op het verjaardagsprobleem dat je een groep nodig hebt van 23 personen met een kans van 50,73% dat mensen een verjaardag delen! De meeste mensen verwachten niet dat de groep zo klein is. Merk ook op op de kaart dat een groep van 57 een kans van 0,99 heeft. Het is vrijwel gegarandeerd!

Maak je geen zorgen. Ik zal dit verrassende resultaat binnenkort uitleggen. Laten we eerst het verjaardagsopgave-antwoord van 23 verifiëren met een andere methode.

Simulatie van de verjaardagsparadox

Met kansberekeningen verwachten we dat een groep van 23 mensen overeenkomende verjaardagen heeft 50,73% van de tijd. Vervolgens gebruik ik een statistisch simulatieprogramma om de verjaardagsparadox te simuleren en te bepalen of de werkelijke kansen overeenkomen met de voorspelde kansen. Voor deze simulatie gebruik ik Statistics101, een giftware-programma, hoewel ze donaties op prijs stellen.

Het programma wordt geleverd met een voorbeeldscript dat de waarschijnlijkheid voor een groep van 25 weergeeft. Ik heb hun script zodat het 100.000 groepen van 23 mensen verzamelt en willekeurig een verjaardag aan elke persoon toewijst. Het programma bepaalt of verjaardagen overeenkomen binnen elke groep van 23 en berekent vervolgens het percentage van die 100.000 groepen die een match hebben. Op basis van de kansberekeningen verwachten we dat ongeveer 50% van de groepen overeenkomsten heeft. Ik laat het programma ook een histogram maken van het aantal wedstrijden binnen elke groep. Download mijn script: BirthdayProblem.

De simulatiesoftware ontdekte dat 50.586% van de 100.000 groepen overeenkomende verjaardagen had. Dat is extreem dicht bij de berekende kans van 50,73%. Deze simulatie verifieert de kansberekeningen.

De onderstaande grafiek toont de verdeling van het aantal overeenkomsten in deze groepen van 23.

De meest linkse balk geeft aan dat 49,41% van de groepen geen overeenkomsten heeft. De volgende balken laten zien dat 37% één match heeft, 11,4% twee, 1,9% drie en 0,31% meer dan drie matches.

Waarom is de groepsgrootte zo klein voor het verjaardagsprobleem?

Net als het Monty Hall-probleem, denken de meeste mensen dat het antwoord op het verjaardagsprobleem verrassend is en dat het hun hersenen een beetje pijn doet!Het antwoord is echter helemaal correct, en we vonden het met behulp van twee verschillende methoden: kansberekeningen en computersimulatie. Laten we eens kijken waarom het antwoord niet intuïtief is.

Vaak denken mensen aan hun verjaardag en de kans dat iemand overeenkomt met die specifieke datum. Het probleem vraagt echter naar twee personen die een verjaardag delen. Dat betekent dat je alle mogelijke paren individuen moet vergelijken. Door alle paren te beoordelen, neemt het aantal vergelijkingen snel toe – en daarin ligt de bron van verwarring.

De formule voor het aantal vergelijkingen tussen paren van N-personen is: (N * (N-1)) / 2. Zoals je in de onderstaande tabel kunt zien, vergelijkt het aantal sneeuwballen met 253 voor slechts 23 mensen!

Voor het delen van een verjaardag , heeft elk paar een vaste waarschijnlijkheid van 0,0027 om te matchen. Dat is laag voor slechts één paar. Omdat het aantal paren echter snel toeneemt, neemt ook de kans op een match toe. Met 23 personen moet u 253 paren vergelijken. Met zoveel vergelijkingen wordt het moeilijk voor geen van de verjaardagsparen om te matchen.

Als er 57 mensen zijn, zijn er 1.596 paren om te vergelijken, en het is vrijwel gegarandeerd met een kans van 0,99 dat ten minste één paar komt overeen met verjaardagen.

Ik hou van dit soort problemen waarbij intuïtie je op een dwaalspoor brengt, maar wiskunde de dag redt!

Omdat we het over verjaardagen hebben, kan een statisticus zeggen dat leeftijd slechts een nummer?

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *