통계의 생일 문제에 대한 답
통계의 생일 문제는 한 그룹에 몇 사람이 최소 두 사람이 생일을 공유 할 확률을 50 % 가질 필요가 있는지 묻습니다. 잠시 생각해보십시오. 그 대답은 많은 사람들을 놀라게합니다. 곧 설명하겠습니다.
이 게시물에서는 생일 패러독스에 답할뿐만 아니라 모든 규모 그룹의 확률을 계산하고 컴퓨터 시뮬레이션을 실행하는 방법도 보여 드리겠습니다. 생일 문제에 대한 답이 왜 그렇게 놀라운 지 설명해주세요.
생일 문제에 대한 확률 계산
많은 사람들이 183을 추측합니다. 183은 가능한 모든 생일의 절반입니다. 직관적으로 보입니다. 안타깝게도 직감은이 문제를 해결하는 데 적합하지 않습니다. 이제 생일을 공유하는 사람들의 확률을 계산해 보겠습니다.
이 계산을 위해 몇 가지 가정을 할 것입니다. 먼저 윤년을 무시합니다. 이는 수학을 단순화하고 결과를 크게 변경하지 않습니다. 또한 모든 생일이 발생할 확률이 같다고 가정합니다.
한 사람부터 시작한 다음 한 번에 한 사람을 추가하여 계산 방식을 설명하겠습니다. 이러한 계산에서는 아무도 생일을 공유하지 않을 확률을 계산하는 것이 더 쉽습니다. 그런 다음 그 확률을 취하고 적어도 두 사람이 생일을 공유 할 확률을 도출하기 위해 1에서 빼겠습니다.
1 – 일치하지 않을 확률 = 적어도 하나의 일치 확률
첫 번째 사람에게는 이미 보장 된 생일이 없습니다. 즉, 공유 된 생일이 없을 가능성이 365/365 일 가능성이 있습니다. 말이 되네요. 한 사람 만 있습니다.
이제 두 번째 사람을 추가하겠습니다. 첫 번째 사람은 가능한 한 생일을 포함하므로 두 번째 사람은 같은 날을 공유하지 않을 확률이 364/365입니다. 처음 두 사람의 확률을 곱하고 하나에서 빼야합니다.
세 번째 사람의 경우 이전 두 사람 사람들은 두 개의 날짜를 다룹니다. 따라서 세 번째 사람은 생일을 공유하지 않은 경우 363/365 일 확률이 있습니다.
이제 주어진 수의 사람들에 대한 확률을 계산하는 방법에 대한 패턴. 방정식의 일반적인 형식은 다음과 같습니다.
관련 게시물 : 확률 기초
생일 문제 그래프 작성 확률
Excel을 사용하여 모든 크기 그룹의 확률을 계산하고 그래프로 표시 할 수 있습니다. 내 Excel 파일 다운로드 : BirthdayProblem.
확률을 평가하여 생일 문제에 대한 답은 그룹이 필요하다는 것입니다. 23 명 중 50.73 %가 생일을 함께 할 확률이 있습니다! 대부분의 사람들은 그룹이 그렇게 작을 것이라고 기대하지 않습니다. 또한 차트에서 57 인 그룹의 확률은 0.99입니다. 사실상 보장됩니다!
걱정하지 마십시오. 이 놀라운 결과에 대해 곧 설명하겠습니다. 먼저 다른 방법을 사용하여 23의 생일 문제 답을 확인하겠습니다.
생일 역설 시뮬레이션
확률 계산을 사용하여 23 명의 그룹이 생일이 일치 할 것으로 예상합니다. 50.73 % 시간의. 다음으로 통계 시뮬레이션 프로그램을 사용하여 Birthday Paradox를 시뮬레이션하고 실제 확률이 예측 된 확률과 일치하는지 확인합니다. 이 시뮬레이션에서는 기부에 감사하지만 기프트웨어 프로그램 인 Statistics101을 사용하고 있습니다.
프로그램에는 25 명의 그룹에 대한 확률을 출력하는 예제 스크립트가 함께 제공됩니다. 스크립트는 23 명으로 구성된 100,000 개의 그룹을 수집하고 각 사람에게 무작위로 생일을 할당합니다. 프로그램은 생일이 23 개 그룹 내에서 일치하는지 확인한 다음 일치하는 100,000 개 그룹의 백분율을 계산합니다. 확률 계산에 따르면 그룹의 약 50 %가 일치 할 것으로 예상합니다. 또한 프로그램에서 각 그룹 내 일치 수에 대한 히스토그램을 생성하도록 할 것입니다. 내 스크립트 다운로드 : BirthdayProblem.
시뮬레이션 소프트웨어는 100,000 개 그룹 중 50.586 %가 생일이 일치하는 것을 발견했습니다. 계산 된 확률 인 50.73 %에 매우 가깝습니다. 이 시뮬레이션은 확률 계산을 확인합니다.
아래 그래프는 이러한 23 개 그룹의 일치 수 분포를 보여줍니다.
가장 먼 왼쪽 막대는 그룹의 49.41 %가 일치하는 항목이 없음을 나타냅니다. 다음 막대는 37 %가 1 개, 11.4 %가 2 개, 1.9 %가 3 개, 0.31 %가 3 개 이상 일치했음을 보여줍니다.
생일 문제에 대해 그룹 규모가 왜 그렇게 작습니까?
몬티 홀 문제와 마찬가지로 대부분의 사람들은 생일 문제에 대한 답이 놀랍고 뇌가 조금 아파요!그러나 답은 전적으로 정확하며 확률 계산과 컴퓨터 시뮬레이션이라는 두 가지 방법을 사용하여 답을 찾았습니다. 대답이 직관적이지 않은 이유를 살펴 보겠습니다.
사람들은 종종 자신의 생일과 특정 날짜와 일치 할 확률을 생각합니다. 그러나 문제는 생일을 공유하는 두 사람에 대해 묻습니다. 즉, 가능한 모든 개인 쌍을 비교해야합니다. 모든 쌍을 평가하면 비교 횟수가 급격히 증가하고 혼란의 원인이 여기에 있습니다.
N 명 쌍 간의 비교 수 공식은 다음과 같습니다. (N * (N-1)) / 2. 아래 표에서 볼 수 있듯이 숫자는 23 명에 대해서만 253 개로 눈덩이를 비교합니다!
생일을 공유하는 경우 에서 각 쌍의 일치 확률은 0.0027입니다. 한 쌍으로는 낮습니다. 그러나 쌍의 수가 급격히 증가함에 따라 일치 가능성도 증가합니다. 23 명과 253 쌍을 비교해야합니다. 이렇게 많은 비교를하면 생일 쌍이 일치하지 않는 것이 어려워집니다.
57 명이 있으면 1,596 쌍을 비교할 수 있으며, 적어도 한 쌍이 될 확률은 0.99입니다. 생일과 일치 할 것입니다.
직감이 당신을 잘못된 길로 인도하지만 수학이 하루를 구하는 문제를 좋아합니다!
우리가 생일에 대해 이야기하고 있기 때문에 통계학자가 나이는 숫자?