Rispondere al problema del compleanno nelle statistiche
Il problema del compleanno nelle statistiche chiede, di quante persone hai bisogno in un gruppo per avere il 50% di possibilità che almeno due persone condividano un compleanno? Vai avanti e pensaci per un momento. La risposta sorprende molte persone. Ci arriveremo a breve.
In questo post, non solo risponderò al paradosso del compleanno, ma ti mostrerò anche come calcolare le probabilità per gruppi di qualsiasi dimensione, eseguire una simulazione al computer e spiega perché la risposta al problema del compleanno è così sorprendente.
Calcolo delle probabilità per il problema del compleanno
Molte persone indovinano 183 perché questa è la metà di tutti i compleanni possibili, il che sembra intuitivo. Sfortunatamente, lintuizione non funziona bene per risolvere questo problema. Quindi, passiamo subito al calcolo delle probabilità per le persone che condividono i compleanni.
Per questi calcoli, faremo alcune ipotesi. Innanzitutto, ignoreremo lanno bisestile. Ciò semplifica la matematica e non cambia di molto i risultati. Supponiamo inoltre che tutti i compleanni abbiano la stessa probabilità di verificarsi.
Cominciamo con una persona, quindi aggiungiamo le persone una alla volta per illustrare come funzionano i calcoli. Per questi calcoli, è più facile calcolare la probabilità che nessuno condivida un compleanno. Quindi prenderemo quella probabilità e sottrarre se da uno per ricavare la probabilità che almeno due persone condividano un compleanno.
1 – Probabilità di non corrispondenza = Probabilità di almeno una corrispondenza
Per la prima persona, non ci sono compleanni già coperti, il che significa che cè una probabilità 365/365 che non ci sia un compleanno condiviso. Questo ha senso. Abbiamo solo una persona.
Ora, aggiungiamo la seconda persona. La prima persona copre un possibile compleanno, quindi la seconda persona ha 364/365 possibilità di non condividere lo stesso giorno. Dobbiamo moltiplicare le probabilità delle prime due persone e sottrarre da una.
Per la terza persona, le due precedenti le persone coprono due date. Quindi, la terza persona ha una probabilità di 363/365 per non condividere un compleanno.
Ora, vedi il modello su come calcolare la probabilità per un dato numero di persone. Ecco la forma generale dellequazione:
Post correlato: Fondamenti di probabilità
Rappresentare graficamente il problema del compleanno Probabilità
Utilizzando Excel, posso calcolare e rappresentare graficamente le probabilità per qualsiasi gruppo di dimensioni. Scarica il mio file Excel: Problema del compleanno.
Valutando le probabilità, la risposta al problema del compleanno è che hai bisogno di un gruppo di 23 persone di avere una probabilità del 50,73% che le persone condividano un compleanno! La maggior parte delle persone non si aspetta che il gruppo sia così piccolo. Inoltre, nota sul grafico che un gruppo di 57 ha una probabilità di 0,99. È praticamente garantito!
Non preoccuparti. Spiegherò tra breve questo sorprendente risultato. Verifichiamo prima la risposta del problema del compleanno di 23 utilizzando un metodo diverso.
Simulazione del paradosso del compleanno
Usando i calcoli di probabilità, ci aspettiamo che un gruppo di 23 persone abbia compleanni corrispondenti 50,73% del tempo. Successivamente, userò un programma di simulazione statistica per simulare il paradosso del compleanno e determinare se le probabilità effettive corrispondono alle probabilità previste. Per questa simulazione, sto utilizzando Statistics101, che è un programma di articoli da regalo, sebbene apprezzino le donazioni.
Il programma viene fornito con uno script di esempio che fornisce la probabilità per un gruppo di 25. Ho modificato il loro in modo che raccolga 100.000 gruppi di 23 persone e assegni casualmente un compleanno a ciascuna persona. Il programma determina se i compleanni corrispondono allinterno di ciascun gruppo di 23 e quindi calcola la percentuale di quei 100.000 gruppi che hanno una corrispondenza. Sulla base dei calcoli di probabilità, ci aspettiamo che circa il 50% dei gruppi abbia corrispondenze. Farò anche creare al programma un istogramma del numero di corrispondenze allinterno di ciascun gruppo. Scarica il mio script: BirthdayProblem.
Il software di simulazione ha rilevato che il 50,586% dei 100.000 gruppi aveva compleanni corrispondenti. È estremamente vicino alla probabilità calcolata del 50,73%. Questa simulazione verifica i calcoli di probabilità.
Il grafico seguente mostra la distribuzione del numero di corrispondenze in questi gruppi di 23.
La barra più a sinistra indica che il 49,41% dei gruppi non ha corrispondenze. Le barre successive mostrano che il 37% ha una corrispondenza, l11,4% due, l1,9% tre e lo 0,31% ha più di tre corrispondenze.
Perché le dimensioni del gruppo sono così piccole per il problema del compleanno?
Come il problema di Monty Hall, la maggior parte delle persone pensa che la risposta al problema del compleanno sia sorprendente e faccia un po male al cervello!Tuttavia, la risposta è del tutto corretta e labbiamo trovata utilizzando due metodi diversi: calcoli di probabilità e simulazione al computer. Esaminiamo perché la risposta è controintuitiva.
Spesso le persone pensano al loro compleanno e alla probabilità che qualcuno corrisponda a quella data specifica. Tuttavia, il problema chiede se due persone condividono un compleanno. Ciò significa che devi confrontare tutte le possibili coppie di individui. La valutazione di tutte le coppie fa aumentare rapidamente il numero di confronti, e qui sta la fonte della confusione.
La formula per il numero di confronti tra coppie di N persone è: (N * (N-1)) / 2. Come puoi vedere nella tabella seguente, il numero confronta le palle di neve con 253 per sole 23 persone!
Per condividere un compleanno , ogni coppia ha una probabilità fissa di 0,0027 di corrispondenza. È basso per una sola coppia. Tuttavia, poiché il numero di coppie aumenta rapidamente, aumenta anche la probabilità di una corrispondenza. Con 23 persone, devi confrontare 253 coppie. Con così tanti confronti, diventa difficile che nessuna delle coppie di compleanno corrisponda.
Quando ci sono 57 persone, ci sono 1.596 coppie da confrontare ed è praticamente garantito con una probabilità di 0,99 che almeno una coppia corrisponderà ai compleanni.
Adoro problemi come questo in cui lintuizione ti porta fuori strada ma la matematica salva la giornata!
Poiché stiamo parlando di compleanni, uno statistico può dire che letà è solo un numero?