Respuesta al problema del cumpleaños en estadísticas
El problema del cumpleaños en estadísticas pregunta, ¿cuántas personas se necesitan en un grupo para tener un 50% de probabilidad de que al menos dos personas compartan un cumpleaños? Continúe y piense en eso por un momento. La respuesta sorprende a mucha gente. Llegaremos a eso en breve.
En esta publicación, no solo responderé la paradoja del cumpleaños, sino que también te mostraré cómo calcular las probabilidades para grupos de cualquier tamaño, ejecutar una simulación por computadora y explique por qué la respuesta al problema del cumpleaños es tan sorprendente.
Cálculo de probabilidades para el problema del cumpleaños
Mucha gente adivina 183 porque eso es la mitad de todos los cumpleaños posibles, lo que parece intuitivo. Desafortunadamente, la intuición no funciona bien para resolver este problema. Por lo tanto, vayamos directamente a calcular las probabilidades de las personas que comparten cumpleaños.
Para estos cálculos, haremos algunas suposiciones. Primero, ignoraremos el año bisiesto. Eso simplifica las matemáticas y no cambia mucho los resultados. También asumiremos que todos los cumpleaños tienen la misma probabilidad de ocurrir.
Comencemos con una persona y luego agreguemos personas de una en una para ilustrar cómo funcionan los cálculos. Para estos cálculos, es más fácil calcular la probabilidad de que nadie comparta un cumpleaños. Luego, tomaremos esa probabilidad y restaremos si de uno para derivar la probabilidad de que al menos dos personas compartan un cumpleaños.
1 – Probabilidad de no coincidencia = Probabilidad de al menos una coincidencia
Para la primera persona, no hay cumpleaños ya cubiertos, lo que significa que existe una probabilidad de 365/365 de que no haya un cumpleaños compartido. Eso tiene sentido. Solo tenemos una persona.
Ahora, agreguemos a la segunda persona. La primera persona cubre un posible cumpleaños, por lo que la segunda persona tiene una posibilidad de 364/365 de no compartir el mismo día. Necesitamos multiplicar las probabilidades de las dos primeras personas y restar de una.
Para la tercera persona, las dos anteriores la gente cubre dos fechas. Por lo tanto, la tercera persona tiene una probabilidad de 363/365 de no compartir un cumpleaños.
Ahora, estás viendo el patrón de cómo calcular la probabilidad para un número dado de personas. Aquí está la forma general de la ecuación:
Publicación relacionada: Fundamentos de probabilidad
Graficando el problema del cumpleaños Probabilidades
Con Excel, puedo calcular y graficar las probabilidades para grupos de cualquier tamaño. Descargue mi archivo Excel: BirthdayProblem.
Al evaluar las probabilidades, la respuesta al problema del cumpleaños es que necesita un grupo de 23 personas para tener un 50,73% de posibilidades de que las personas compartan un cumpleaños. La mayoría de la gente no espera que el grupo sea tan pequeño. Además, observe en el gráfico que un grupo de 57 tiene una probabilidad de 0,99. ¡Está prácticamente garantizado!
No se preocupe. Llegaré a explicar este sorprendente resultado en breve. Primero verifiquemos la respuesta del problema de cumpleaños de 23 usando un método diferente.
Simulación de la paradoja del cumpleaños
Usando cálculos de probabilidad, esperamos que un grupo de 23 personas tengan cumpleaños iguales 50.73% del tiempo. A continuación, usaré un programa de simulación estadística para simular la paradoja del cumpleaños y determinar si las probabilidades reales coinciden con las probabilidades predichas. Para esta simulación, estoy usando Statistics101, que es un programa de regalo, aunque aprecian las donaciones.
El programa viene con un script de ejemplo que genera la probabilidad para un grupo de 25. He modificado su script para que reúna 100.000 grupos de 23 personas y asigne aleatoriamente un cumpleaños a cada persona. El programa determina si los cumpleaños coinciden dentro de cada grupo de 23 y luego calcula el porcentaje de esos 100.000 grupos que tienen una coincidencia. Según los cálculos de probabilidad, esperaríamos que alrededor del 50% de los grupos tuvieran coincidencias. También haré que el programa cree un histograma del número de coincidencias dentro de cada grupo. Descargue mi script: BirthdayProblem.
El software de simulación encontró que el 50.586% de los 100,000 grupos tenían cumpleaños coincidentes. Eso está muy cerca de la probabilidad calculada del 50,73%. Esta simulación verifica los cálculos de probabilidad.
El siguiente gráfico muestra la distribución del número de coincidencias en estos grupos de 23.
La barra más a la izquierda indica que el 49,41% de los grupos no tienen coincidencias. Las siguientes barras muestran que el 37% tiene una coincidencia, el 11,4% tiene dos, el 1,9% tiene tres y el 0,31% tiene más de tres coincidencias.
¿Por qué el tamaño del grupo es tan pequeño para el problema del cumpleaños?
Al igual que el problema de Monty Hall, la mayoría de la gente piensa que la respuesta al problema del cumpleaños es sorprendente y les duele un poco el cerebro.Sin embargo, la respuesta es completamente correcta y la encontramos usando dos métodos diferentes: cálculos de probabilidad y simulación por computadora. Examinemos por qué la respuesta no es intuitiva.
A menudo, las personas pensarán en su cumpleaños y en la probabilidad de que alguien coincida con esa fecha específica. Sin embargo, el problema se refiere a dos personas que comparten un cumpleaños. Eso significa que debe comparar todos los posibles pares de individuos. La evaluación de todos los pares hace que el número de comparaciones aumente rápidamente, y ahí radica la fuente de confusión.
La fórmula para el número de comparaciones entre pares de N personas es: (N * (N-1)) / 2. Como puede ver en la tabla siguiente, ¡las comparaciones numéricas aumentan a 253 para solo 23 personas!
Por compartir un cumpleaños , cada par tiene una probabilidad fija de 0,0027 de coincidencia. Eso es bajo para solo un par. Sin embargo, como el número de pares aumenta rápidamente, también lo hace la probabilidad de una coincidencia. Con 23 personas, necesitas comparar 253 pares. Con tantas comparaciones, se vuelve difícil que ninguno de los pares de cumpleaños coincida.
Cuando hay 57 personas, hay 1596 pares para comparar, y está prácticamente garantizado con una probabilidad de 0,99 de que al menos un par coincidirá con los cumpleaños.
Me encantan los problemas como este, en los que la intuición te lleva por mal camino, ¡pero las matemáticas te salvan el día!
Como estamos hablando de cumpleaños, ¿puede un estadístico decir que la edad es un número?