A születésnapi probléma megválaszolása a statisztikákban

A születésnapi probléma a statisztikában azt kérdezi, hány emberre van szüksége egy csoportban, hogy 50% esélye legyen arra, hogy legalább ketten megosszák születésnapját? Menj előre, és gondolkodj el ezen egy pillanatig. A válasz sok embert meglep. Rövidesen eljutunk erre.

Ebben a bejegyzésben nemcsak a születésnapi paradoxonra válaszolok, hanem megmutatom, hogyan számolhatja ki bármilyen méretcsoport valószínűségét, futtasson számítógépes szimulációt és magyarázza el, miért olyan meglepő a válasz a születésnapi problémára.

A születésnapi probléma valószínűségének kiszámítása

Sokan 183-at sejtenek, mert ez az összes lehetséges születésnap fele, ami intuitívnak tűnik. Sajnos az intuíció nem működik jól ennek a problémának a megoldásában. Tehát térjünk rá egyenesen a születésnapot megosztó emberek valószínűségének kiszámítására.

Ehhez a számításhoz néhány feltevést fogunk tenni. Először figyelmen kívül hagyjuk a szökő évet. Ez leegyszerűsíti a matematikát, és nem sokat változtat az eredményeken. Feltételezzük azt is, hogy minden születésnap azonos eséllyel fordul elő.

Kezdjük egy emberrel, majd adjunk hozzá embereket egyenként, hogy szemléltessük a számítások működését. Ezekhez a számításokhoz könnyebb kiszámítani annak valószínűségét, hogy senki sem osztozik születésnapon. Ezután kivesszük ezt a valószínűséget, és kivonjuk az egyikből annak a valószínűségét, hogy legalább két embernek közös születésnapja legyen.

1 – Nem megfelelő meccs = Legalább egy meccs valószínűsége

Az első személy számára nincsenek már lefedett születésnapok, ami azt jelenti, hogy 365/365 esély van arra, hogy ne legyen közös születésnap. Ennek van értelme. Csak egy személyünk van.

Most tegyük hozzá a második személyt. Az első személy egy lehetséges születésnapot ölel fel, így a második személynek 364/365 esélye van arra, hogy ne ossza meg ugyanazon a napon. Meg kell szorozni az első két ember valószínűségét, és levonni az egyikből.

Harmadik személy esetében az előző kettő az emberek két dátumot fednek le. Ezért a harmadik személy 363/365 valószínűséggel nem oszt meg születésnapot.

Most látja a valószínűség kiszámításának mintája egy adott számú ember számára. Itt található az egyenlet általános formája:

Kapcsolódó bejegyzés: A valószínűség alapjai

A születésnapi probléma ábrázolása Valószínűségek

Az Excel használatával kiszámolhatom és ábrázolhatom bármilyen méretcsoport valószínűségét. Töltse le az Excel fájlt: BirthdayProblem.

A valószínűségek felmérésével a Születésnapi problémára az a válasz, hogy szükség van egy csoportra 23 emberből 50,73% az esély arra, hogy születésnapot osztanak meg! A legtöbb ember nem várja, hogy a csoport ennyire kicsi legyen. Figyelje meg a grafikonon, hogy egy 57 fős csoport valószínűsége 0,99. Gyakorlatilag garantált!

Ne aggódjon. Rövidesen el fogom magyarázni ezt a meglepő eredményt. Először ellenőrizzük a 23-as születésnapi probléma válaszát egy másik módszerrel.

A születésnapi paradoxon szimulációja

Valószínűségi számítások használatával azt várjuk, hogy egy 23 fős csoportnak 50,73% -os születési ideje van az idő. Ezután egy statisztikai szimulációs program segítségével szimulálom a születésnapi paradoxont, és meghatározom, hogy a tényleges valószínűségek megegyeznek-e az előre jelzett valószínűségekkel. Ehhez a szimulációhoz a Statistics101-et használom, amely egy ajándék program, bár nagyra értékelik az adományokat.

A program egy példa szkriptet tartalmaz, amely egy 25 tagú csoport valószínűségét adja ki. szkriptet, hogy 100 000 23 fős csoportot gyűjtsön össze, és véletlenszerűen hozzárendeljen egy születésnapot. A program meghatározza, hogy a születésnapok megegyeznek-e minden 23 fős csoporton belül, majd kiszámítja annak a 100 000 csoportnak a százalékos arányát, amelyik egyezik. A valószínűségszámítások alapján a csoportok körülbelül 50% -ára számíthatunk. Felkérem a programot, hogy készítsen hisztogramot az egyes csoportok közötti mérkőzések számáról. Töltse le a szkriptemet: BirthdayProblem.

A szimulációs szoftver azt találta, hogy a 100 000 csoport 50,586% -ának megfelelő születésnapja volt. Ez rendkívül közel van a számított 50,73% -os valószínűséghez. Ez a szimuláció ellenőrzi a valószínűségszámításokat.

Az alábbi grafikon mutatja a 23 csoportban található egyezések számának eloszlását.

A legtávolabbi bal sáv azt jelzi, hogy a csoportok 49,41% -ának nincs egyezése. A következő oszlopok azt mutatják, hogy 37% -nak egy mérkőzése van, 11,4% -ának kettő, 1,9% -ának három, és 0,31% -ának több mint három mérkőzése van.

Miért olyan kicsi a csoportméret a születésnapi problémához?

A Monty Hall-problémához hasonlóan a legtöbben úgy gondolják, hogy a születésnapi problémára adott válasz meglepő, és kissé fáj az agyuk!A válasz azonban teljesen helytálló, és két különböző módszerrel találtuk meg – valószínűségszámítás és számítógépes szimuláció. Vizsgáljuk meg, miért nem ellentmondó a válasz.

Az emberek gyakran gondolnak a születésnapjukra és annak valószínűségére, hogy valaki megfelel az adott dátumnak. A probléma azonban arra vonatkozik, ha két személy születésnapot oszt meg. Ez azt jelenti, hogy össze kell hasonlítania az összes lehetséges egyedpárot. Az összes pár értékelése az összehasonlítások számának gyors növekedését eredményezi – és ebben rejlik a zűrzavar forrása.

Az N ember párjainak összehasonlításának képlete a következő: (N * (N-1)) / 2. Amint az alábbi táblázatból látható, a szám csak 23 ember esetén hasonlítja össze a hógolyókat a 253-zal!

Születésnap megosztásáért , minden párnak fix valószínűsége 0,0027 az egyezéshez. Ez csak egy pár esetében alacsony. Ahogy azonban a párok száma gyorsan növekszik, úgy nő a mérkőzés valószínűsége is. 23 emberrel 253 párot kell összehasonlítani. Ennyi összehasonlítással egyik születésnapi párnak sem lesz nehéz megfelelnie.

Amikor 57 ember van, 1596 párot kell összehasonlítani, és gyakorlatilag 0,99 valószínűséggel garantált, hogy legalább egy pár illeszkedik a születésnapokhoz.

Szeretem az ilyen problémákat, ahol az intuíció tévútra visz, de a matematika megmenti a napot!

Mivel születésnapokról beszélünk, mondhatja-e egy statisztikus, hogy az életkor csak egy szám?

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük