Répondre au problème de lanniversaire dans les statistiques
Le problème de lanniversaire dans les statistiques demande, de combien de personnes avez-vous besoin dans un groupe pour avoir 50% de chances quau moins deux personnes partagent un anniversaire? Allez-y et réfléchissez-y un instant. La réponse surprend de nombreuses personnes. Nous y reviendrons sous peu.
Dans cet article, je répondrai non seulement au paradoxe de lanniversaire, mais je vous montrerai également comment calculer les probabilités pour nimporte quel groupe de taille, lancer une simulation informatique et expliquez pourquoi la réponse au problème de lanniversaire est si surprenante.
Calcul des probabilités pour le problème de lanniversaire
Beaucoup de gens devinent 183 parce que cest la moitié de tous les anniversaires possibles, ce qui semble intuitif. Malheureusement, lintuition ne fonctionne pas bien pour résoudre ce problème. Alors, allons directement au calcul des probabilités pour les personnes partageant des anniversaires.
Pour ces calculs, nous allons faire quelques hypothèses. Premièrement, nous ne tiendrons pas compte de l’année bissextile. Cela simplifie les calculs et ne change pas beaucoup les résultats. Nous supposerons également que tous les anniversaires ont une probabilité égale de se produire.
Commençons par une personne, puis ajoutons des personnes lune après lautre pour illustrer le fonctionnement des calculs. Pour ces calculs, il est plus facile de calculer la probabilité que personne ne partage un anniversaire. Nous allons ensuite prendre cette probabilité et soustraire si de un pour dériver la probabilité quau moins deux personnes partagent un anniversaire.
1 – Probabilité de non-correspondance = Probabilité dau moins une correspondance
Pour la première personne, il ny a pas danniversaires déjà couverts, ce qui signifie quil y a une chance 365/365 quil ny ait pas danniversaire partagé. Ça a du sens. Nous navons quune seule personne.
Maintenant, ajoutons la deuxième personne. La première personne couvre un anniversaire possible, donc la deuxième personne a 364/365 chances de ne pas partager le même jour. Nous devons multiplier les probabilités des deux premières personnes et en soustraire une.
Pour la troisième personne, les deux précédentes les gens couvrent deux dates. Par conséquent, la troisième personne a une probabilité de 363/365 de ne pas partager son anniversaire.
Maintenant, vous voyez le modèle de calcul de la probabilité pour un nombre donné de personnes. Voici la forme générale de léquation:
Article connexe: Principes de base des probabilités
Représentation graphique du problème de lanniversaire Probabilités
En utilisant Excel, je peux calculer et représenter graphiquement les probabilités pour nimporte quel groupe de taille. Téléchargez mon fichier Excel: BirthdayProblem.
En évaluant les probabilités, la réponse au problème danniversaire est que vous avez besoin dun groupe sur 23 personnes pour avoir 50,73% de chances que des personnes partagent un anniversaire! La plupart des gens ne sattendent pas à ce que le groupe soit aussi petit. Notez également sur le graphique quun groupe de 57 a une probabilité de 0,99. Cest pratiquement garanti!
Ne vous inquiétez pas. Je vais vous expliquer ce résultat surprenant sous peu. Vérifions dabord la réponse au problème danniversaire de 23 en utilisant une méthode différente.
Simulation du paradoxe danniversaire
En utilisant des calculs de probabilité, nous nous attendons à ce quun groupe de 23 personnes ait des anniversaires correspondants à 50,73% du temps. Ensuite, jutiliserai un programme de simulation statistique pour simuler le paradoxe de lanniversaire et déterminer si les probabilités réelles correspondent aux probabilités prédites. Pour cette simulation, jutilise Statistics101, qui est un programme de cadeaux, bien quils apprécient les dons.
Le programme est livré avec un exemple de script qui affiche la probabilité pour un groupe de 25. Jai modifié leur script afin quil rassemble 100 000 groupes de 23 personnes et attribue au hasard un anniversaire à chaque personne. Le programme détermine si les anniversaires correspondent dans chaque groupe de 23, puis calcule le pourcentage de ces 100 000 groupes qui ont une correspondance. Sur la base des calculs de probabilité, nous nous attendons à ce quenviron 50% des groupes aient des correspondances. Je vais également demander au programme de créer un histogramme du nombre de correspondances dans chaque groupe. Téléchargez mon script: BirthdayProblem.
Le logiciel de simulation a constaté que 50,586% des 100 000 groupes avaient des anniversaires correspondants. C’est extrêmement proche de la probabilité calculée de 50,73%. Cette simulation vérifie les calculs de probabilité.
Le graphique ci-dessous montre la distribution du nombre de correspondances dans ces groupes de 23.
La barre la plus à gauche indique que 49,41% des groupes nont aucune correspondance. Les barres suivantes montrent que 37% ont une correspondance, 11,4% en ont deux, 1,9% en ont trois et 0,31% ont plus de trois correspondances.
Pourquoi la taille du groupe est-elle si petite pour le problème de lanniversaire?
Comme le problème de Monty Hall, la plupart des gens pensent que la réponse au problème de lanniversaire est surprenante et que cela leur fait un peu mal au cerveau!Cependant, la réponse est tout à fait correcte et nous lavons trouvée en utilisant deux méthodes différentes: les calculs de probabilité et la simulation informatique. Voyons pourquoi la réponse est contre-intuitive.
Souvent, les gens penseront à leur anniversaire et à la probabilité que quelquun corresponde à cette date spécifique. Cependant, le problème concerne deux personnes partageant un anniversaire. Cela signifie que vous devez comparer toutes les paires possibles dindividus. Lévaluation de toutes les paires entraîne une augmentation rapide du nombre de comparaisons – et cest là que réside la source de confusion.
La formule du nombre de comparaisons entre des paires de N personnes est: (N * (N-1)) / 2. Comme vous pouvez le voir dans le tableau ci-dessous, le nombre de boules de neige compare à 253 pour seulement 23 personnes!
Pour partager un anniversaire , chaque paire a une probabilité fixe de 0,0027 pour lappariement. Cest faible pour une seule paire. Cependant, à mesure que le nombre de paires augmente rapidement, la probabilité dune correspondance augmente également. Avec 23 personnes, vous devez comparer 253 paires. Avec autant de comparaisons, il devient difficile pour aucune des paires danniversaire de correspondre.
Quand il y a 57 personnes, il y a 1596 paires à comparer, et il est pratiquement garanti avec une probabilité de 0,99 quau moins une paire correspondra aux anniversaires.
Jaime les problèmes comme celui-ci où lintuition vous égare mais les maths sauvent la journée!
Parce que nous parlons danniversaires, un statisticien peut-il dire que lâge est juste un nombre?