A népesség átlagának becslése
A legalapvetőbb pont- és intervallumbecslési folyamat a népesség átlagának becslését foglalja magában. Tegyük fel, hogy érdekes számszerűsíteni a populáció átlagát (μ) egy kvantitatív változó esetében. Egy egyszerű véletlenszerű mintából összegyűjtött adatok felhasználhatók az x the mintaátlag kiszámításához, ahol az x̄ értéke μ pontértéket ad.
Ha a mintaátlagot használjuk a populáció pontbecsléséhez Ez azt jelenti, hogy némi hiba várható annak a ténynek köszönhető, hogy a minta becsléséhez a mintát vagy a sokaság részhalmazát használják. A mintaátlag, x̄ és a populációátlag, μ különbség abszolút értékét | x written – μ | írva mintavételi hibának nevezzük. Az intervallumbecslés a mintavételi hiba nagyságrendjére vonatkozóan tartalmaz egy valószínűségi nyilatkozatot. Az x̄ mintavételi eloszlása adja az alapot egy ilyen állításra.
A statisztikusok kimutatták, hogy az x̄ mintavételi eloszlásának átlaga megegyezik a μ populáció átlagával, és hogy a szórást σ adja meg /√n négyzetgyöke, ahol σ a populáció szórása. A mintavételi eloszlás szórását szokásos hibának nevezzük. Nagy mintanagyság esetén a központi határtétel azt jelzi, hogy az x̄ mintavételi eloszlása normál valószínűségi eloszlással közelíthető. Gyakorlatilag a statisztikusok általában a 30-as vagy annál nagyobb mintákat tekintik nagynak.
A nagy minta esetében a populáció átlagának 95% -os konfidencia intervallum becslését x̄ ± 1,96σ adja meg. /√n négyzetgyöke. Ha a populáció szórása, σ nem ismert, a minta szórását használják a σ becsléséhez a konfidencia intervallum képletében. Az √n 1,96σ / négyzetgyöke mennyiséget gyakran hívják a becslés hibahatárának. A σ / σ négyzetgyöke mennyisége a standard hiba, az 1,96 pedig a standard hibák száma az átlagtól, amely szükséges az értékek 95% -ának normál eloszlásba való beépítéséhez. A 95% -os konfidencia intervallum értelmezése az, hogy az így kialakított intervallumok 95% -a tartalmazza a populáció átlagát. Így bármely ilyen módon kiszámított intervallum 95% -os megbízhatósággal rendelkezik a populáció átlagának megadásával. Az állandó 1,96-ról 1,645-re történő változtatásával 90% -os konfidenciaintervallum érhető el. Az intervallumbecslés képletéből meg kell jegyezni, hogy a 90% -os konfidenciaintervallum szűkebb, mint a 95% -os konfidenciaintervallum, és mint ilyen, valamivel kisebb a konfidencia a populációs átlag beszámításával. Az alacsonyabb szintű bizalom még szűkebb időközökhöz vezet. A gyakorlatban a 95% -os konfidenciaintervallum a legszélesebb körben használt.
Az n1 / 2 tag jelenléte miatt az intervallumbecslés képletében a minta mérete befolyásolja a hibahatárt. A nagyobb mintaméretek kisebb hibahatárokhoz vezetnek. Ez a megfigyelés képezi a minta méretének kiválasztására alkalmazott eljárások alapját. A mintaméretek úgy választhatók, hogy a konfidencia intervallum kielégítse a hibahatár nagyságával kapcsolatos kívánatos követelményeket.
Az imént leírt eljárás a populáció átlagának intervallumbecsléseinek kidolgozására egy nagy méret használatán alapul. minta. A kis minta esetében – vagyis amikor az n minta mérete kisebb, mint 30 – a t eloszlást alkalmazzuk a hibahatár megadásakor és a konfidencia intervallum becslésének összeállításakor. Például 95% -os megbízhatósági szint mellett a t eloszlás értéke, amelyet n értéke határoz meg, felváltaná a normál eloszlásból kapott 1,96 értéket. A t értékek mindig nagyobbak lesznek, ami nagyobb konfidencia intervallumokat eredményez, de amint a minta mérete nagyobb lesz, a t értékek normális eloszlásból közelebb kerülnek a megfelelő értékekhez. 25 mintaméret esetén az alkalmazott t érték 2,064 lenne, összehasonlítva a nagy minta esetén a normál valószínűségi eloszlás 1,96 értékével.