Estimering af et populationsgennemsnit

Den mest grundlæggende estimering af punkt og interval involverer estimering af et populationsgennemsnit. Antag, at det er af interesse at estimere befolkningens gennemsnit, μ, for en kvantitativ variabel. Data indsamlet fra en simpel tilfældig stikprøve kan bruges til at beregne stikprøvens gennemsnit, x̄, hvor værdien af x̄ giver et punktestimat på μ.

Når stikprøvernes gennemsnit bruges som et pointestimat for populationen middel, der kan forventes en fejl på grund af det faktum, at en stikprøve eller delmængde af populationen bruges til at beregne punktestimatet. Den absolutte værdi af forskellen mellem stikprøvernes gennemsnit, x̄ og populationsgennemsnittet, μ, skrevet | x̄ – μ |, kaldes prøveudtagningsfejlen. Intervalestimering indeholder en sandsynlighedserklæring om størrelsen af prøveudtagningsfejlen. Samplingsfordelingen af x̄ giver grundlaget for en sådan udsagn.

Statistikere har vist, at gennemsnittet af samplingfordelingen af x̄ er lig med populationsgennemsnittet, μ, og at standardafvigelsen er givet ved σ / Kvadratrod af√n, hvor σ er populationsstandardafvigelsen. Standardafvigelsen for en samplingsfordeling kaldes standardfejl. For store stikprøvestørrelser indikerer den centrale grænsesætning, at samplingsfordelingen af x̄ kan tilnærmes med en normal sandsynlighedsfordeling. Som praksis skal statistikere normalt betragte prøver af størrelse 30 eller mere for at være store.

I storprøvesagen gives et 95% konfidensintervalestimat for populationsgennemsnittet ved x̄ ± 1,96σ / Kvadratrod af √n. Når populationsstandardafvigelsen, σ, er ukendt, bruges stikprøven standardafvigelse til at estimere σ i konfidensintervalformlen. Mængden 1,96σ / Kvadratrod af √n kaldes ofte fejlmargenen for estimatet. Størrelsen σ / kvadratroden af √n er standardfejlen, og 1,96 er antallet af standardfejl fra det gennemsnit, der er nødvendigt for at inkludere 95% af værdierne i en normalfordeling. Fortolkningen af et 95% konfidensinterval er, at 95% af intervallerne konstrueret på denne måde vil indeholde populationsgennemsnittet. Således har ethvert interval beregnet på denne måde en 95% tillid til at indeholde populationsgennemsnittet. Ved at ændre konstanten fra 1,96 til 1,645 kan der opnås et konfidensinterval på 90%. Det skal bemærkes fra formlen for et intervalestimat, at et 90% konfidensinterval er snævrere end et 95% konfidensinterval og som sådan har en lidt mindre tillid til at inkludere befolkningens gennemsnit. Lavere niveauer af tillid fører til endnu mere snævre intervaller. I praksis er et 95% konfidensinterval det mest udbredte.

På grund af tilstedeværelsen af n1 / 2-udtrykket i formlen for et intervalestimat påvirker stikprøvestørrelsen fejlmarginen. Større stikprøvestørrelser fører til mindre fejlmargener. Denne observation danner grundlaget for procedurer, der anvendes til at vælge prøveens størrelse. Prøvestørrelser kan vælges således, at konfidensintervallet tilfredsstiller de ønskede krav til størrelsen af fejlmargenen.

Den procedure, der netop er beskrevet til udvikling af intervalestimater for et populationsgennemsnit, er baseret på brugen af en stor prøve. I tilfælde af lille prøve – dvs. hvor stikprøvestørrelsen n er mindre end 30 – anvendes t-fordelingen ved angivelse af fejlmargenen og konstruktion af et konfidensintervalestimat. For eksempel, på et 95% konfidensniveau, ville en værdi fra t-fordelingen, bestemt af værdien af n, erstatte 1,96-værdien opnået fra normalfordelingen. T-værdierne vil altid være større, hvilket fører til bredere konfidensintervaller, men når prøvestørrelsen bliver større, kommer t-værdierne tættere på de tilsvarende værdier fra en normalfordeling. Med en stikprøvestørrelse på 25 ville den anvendte t-værdi være 2,064 sammenlignet med den normale sandsynlighedsfordelingsværdi på 1,96 i storprøvesagen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *