Oszacowanie średniej populacji

Najbardziej fundamentalny proces estymacji punktowej i przedziałowej obejmuje estymację średniej populacji. Załóżmy, że interesujące jest oszacowanie średniej populacji, μ, dla zmiennej ilościowej. Dane zebrane z prostej próby losowej można wykorzystać do obliczenia średniej z próby x̄, gdzie wartość x value daje oszacowanie punktowe μ.

Gdy średnia z próby jest używana jako oszacowanie punktowe populacji Oznacza to, że można spodziewać się pewnego błędu ze względu na fakt, że do obliczenia oszacowania punktowego wykorzystuje się próbę lub podzbiór populacji. Wartość bezwzględna różnicy między średnią próbki, x̄, a średnią populacji, μ, zapisaną | x̄ – μ |, nazywana jest błędem próbkowania. Estymacja przedziałowa obejmuje stwierdzenie prawdopodobieństwa dotyczące wielkości błędu próbkowania. Podstawą takiego stwierdzenia jest rozkład próbkowania x̄.

Statystycy wykazali, że średnia rozkładu próbkowania x̄ jest równa średniej populacji μ, a odchylenie standardowe jest wyrażone przez σ / Pierwiastek kwadratowy z√n, gdzie σ jest odchyleniem standardowym populacji. Odchylenie standardowe rozkładu próbkowania nazywane jest błędem standardowym. W przypadku dużych prób centralne twierdzenie graniczne wskazuje, że rozkład próbkowania x̄ można przybliżyć normalnym rozkładem prawdopodobieństwa. W praktyce statystycy zwykle uważają, że próbki o wielkości 30 lub większej są duże.

W przypadku dużej próby oszacowanie 95% przedziału ufności dla średniej populacji wynosi x by ± 1,96σ / Pierwiastek kwadratowy z√n. Gdy odchylenie standardowe populacji σ jest nieznane, odchylenie standardowe próby jest używane do oszacowania σ we wzorze na przedział ufności. Wielkość 1,96σ / pierwiastek kwadratowy z√n jest często nazywana marginesem błędu oszacowania. Wielkość σ / pierwiastek kwadratowy z√n to błąd standardowy, a 1,96 to liczba błędów standardowych ze średniej niezbędnej do uwzględnienia 95% wartości w rozkładzie normalnym. Interpretacja 95% przedziału ufności jest taka, że 95% przedziałów skonstruowanych w ten sposób będzie zawierało średnią populacji. Zatem każdy przedział obliczony w ten sposób ma 95% pewność, że zawiera średnią populacji. Zmieniając stałą z 1,96 na 1,645, można uzyskać 90% przedział ufności. Na podstawie wzoru na oszacowanie przedziału należy zauważyć, że 90% przedział ufności jest węższy niż 95% przedział ufności i jako taki ma nieco mniejsze przekonanie uwzględnienia średniej populacji. Niższe poziomy zaufania prowadzą do jeszcze węższych przedziałów. W praktyce najpowszechniej stosowany jest 95-procentowy przedział ufności.

Ze względu na obecność składnika n1 / 2 we wzorze na oszacowanie przedziału wielkość próby wpływa na margines błędu. Większe rozmiary próbek prowadzą do mniejszych marginesów błędu. Obserwacja ta stanowi podstawę dla procedur stosowanych przy doborze wielkości próby. Rozmiary prób można dobrać tak, aby przedział ufności spełniał dowolne wymagania dotyczące wielkości marginesu błędu.

Procedura właśnie opisana w celu opracowania oszacowań przedziałów średniej populacji opiera się na zastosowaniu próba. W przypadku małej próby – tj. Gdy wielkość próby n jest mniejsza niż 30 – rozkład t jest używany przy określaniu marginesu błędu i konstruowaniu szacunku przedziału ufności. Na przykład przy 95% poziomie ufności wartość z rozkładu t, określona przez wartość n, zastąpiłaby wartość 1,96 uzyskaną z rozkładu normalnego. Wartości t zawsze będą większe, co prowadzi do szerszych przedziałów ufności, ale wraz ze wzrostem wielkości próby wartości t zbliżają się do odpowiednich wartości z rozkładu normalnego. Przy wielkości próby 25, użyta wartość t wyniosłaby 2,064, w porównaniu z wartością rozkładu normalnego prawdopodobieństwa 1,96 w przypadku dużej próby.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *