Uppskattning av ett populationsmedelvärde

Den mest grundläggande uppskattningsprocessen för punkt och intervall innefattar uppskattning av ett populationsmedelvärde. Antag att det är av intresse att uppskatta populationsmedlet, μ, för en kvantitativ variabel. Data som samlats in från ett enkelt slumpmässigt urval kan användas för att beräkna provets medelvärde, x̄, där värdet av x̄ ger en poänguppskattning av μ.

När provmedlet används som en poänguppskattning av populationen medelvärde, vissa fel kan förväntas på grund av det faktum att ett urval eller delmängd av populationen används för att beräkna poänguppskattningen. Det absoluta värdet av skillnaden mellan provmedlet, x̄ och populationsmedlet, μ, skrivet | x̄ – μ |, kallas samplingsfelet. Intervalluppskattning innehåller ett sannolikhetsuttalande om storleken på samplingsfelet. Provtagningsfördelningen av x̄ utgör grunden för ett sådant uttalande.

Statistiker har visat att medelvärdet för samplingsfördelningen av x̄ är lika med populationsmedlet, μ, och att standardavvikelsen ges av σ / Kvadratrot av √ n, där σ är populationsstandardavvikelsen. Standardavvikelsen för en samplingsfördelning kallas standardfelet. För stora provstorlekar anger den centrala gränssatsen att samplingsfördelningen av x̄ kan approximeras med en normal sannolikhetsfördelning. Som en fråga om praxis anser statistiker vanligtvis att prover av storlek 30 eller mer är stora.

I storprovfallet ges en uppskattning på 95% konfidensintervall för medelvärdet av populationen med x̄ ± 1,96σ / Kvadratrot av √ n. När populationens standardavvikelse, σ, är okänd, används standardavvikelsen för att uppskatta σ i konfidensintervallformeln. Mängden 1,96σ / kvadratrot av√n kallas ofta felmarginalen för uppskattningen. Kvantiteten σ / kvadratrot av√n är standardfelet, och 1,96 är antalet standardfel från det medelvärde som krävs för att inkludera 95% av värdena i en normalfördelning. Tolkningen av ett 95% konfidensintervall är att 95% av intervallen konstruerade på detta sätt kommer att innehålla populationsmedelvärdet. Således har varje intervall som beräknas på detta sätt 95% konfidens för att innehålla populationsmedelvärdet. Genom att ändra konstanten från 1,96 till 1,645 kan ett konfidensintervall på 90% erhållas. Det bör noteras från formeln för en intervalluppskattning att ett 90% konfidensintervall är smalare än ett 95% konfidensintervall och som sådant har en något mindre konfidens för att inkludera populationsmedelvärdet. Lägre nivåer av självförtroende leder till ännu smalare intervall. I praktiken är ett 95% konfidensintervall det mest använda.

På grund av närvaron av n1 / 2-termen i formeln för en intervalluppskattning påverkar provstorleken felmarginalen. Större provstorlekar leder till mindre felmarginaler. Denna observation utgör grunden för procedurer som används för att välja provstorlek. Provstorlekar kan väljas så att konfidensintervallet uppfyller alla önskade krav på storleken på felmarginalen.

Det förfarande som just beskrivits för att utveckla intervallskattningar för ett populationsmedelvärde baseras på användningen av en stor prov. I det lilla samplingsfallet – dvs där provstorleken n är mindre än 30 – används t-fördelningen när felmarginalen anges och en uppskattning av konfidensintervallet konstrueras. Till exempel, vid en konfidensnivå på 95%, skulle ett värde från t-fördelningen, bestämt av värdet n, ersätta 1,96-värdet erhållet från normalfördelningen. T-värdena kommer alltid att vara större, vilket leder till bredare konfidensintervall, men när samplingsstorleken blir större kommer t-värdena närmare motsvarande värden från en normalfördelning. Med en provstorlek på 25 skulle det använda t-värdet vara 2,064, jämfört med det normala sannolikhetsfördelningsvärdet på 1,96 i fallet med stort urval.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *