Schätzung eines Populationsmittelwerts
Der grundlegendste Punkt- und Intervallschätzungsprozess umfasst die Schätzung eines Populationsmittelwerts. Angenommen, es ist von Interesse, den Populationsmittelwert μ für eine quantitative Variable zu schätzen. Daten, die aus einer einfachen Zufallsstichprobe gesammelt wurden, können verwendet werden, um den Stichprobenmittelwert x̄ zu berechnen, wobei der Wert von x̄ eine Punktschätzung von μ liefert.
Wenn der Stichprobenmittelwert als Punktschätzung der Population verwendet wird Im Mittel kann ein gewisser Fehler erwartet werden, da eine Stichprobe oder Teilmenge der Grundgesamtheit zur Berechnung der Punktschätzung verwendet wird. Der Absolutwert der Differenz zwischen dem Stichprobenmittelwert x̄ und dem Populationsmittelwert μ, geschrieben | x̄ – μ |, wird als Stichprobenfehler bezeichnet. Die Intervallschätzung enthält eine Wahrscheinlichkeitsangabe über die Größe des Abtastfehlers. Die Stichprobenverteilung von x̄ liefert die Grundlage für eine solche Aussage.
Statistiker haben gezeigt, dass der Mittelwert der Stichprobenverteilung von x̄ gleich dem Populationsmittelwert μ ist und dass die Standardabweichung durch σ gegeben ist / Quadratwurzel von √n, wobei σ die Populationsstandardabweichung ist. Die Standardabweichung einer Stichprobenverteilung wird als Standardfehler bezeichnet. Für große Stichprobengrößen gibt der zentrale Grenzwertsatz an, dass die Stichprobenverteilung von x̄ durch eine normale Wahrscheinlichkeitsverteilung angenähert werden kann. In der Praxis betrachten Statistiker Stichproben mit einer Größe von 30 oder mehr normalerweise als groß.
Im Fall einer großen Stichprobe wird eine 95% -Konfidenzintervallschätzung für den Populationsmittelwert durch x̄ ± 1,96σ angegeben / Quadratwurzel von √n. Wenn die Populationsstandardabweichung σ unbekannt ist, wird die Stichprobenstandardabweichung verwendet, um σ in der Konfidenzintervallformel zu schätzen. Die Größe 1,96σ / Quadratwurzel von √n wird häufig als Fehlergrenze für die Schätzung bezeichnet. Die Größe σ / Quadratwurzel von √n ist der Standardfehler, und 1,96 ist die Anzahl der Standardfehler aus dem Mittelwert, der erforderlich ist, um 95% der Werte in eine Normalverteilung einzubeziehen. Die Interpretation eines 95% -Konfidenzintervalls lautet, dass 95% der auf diese Weise konstruierten Intervalle den Populationsmittelwert enthalten. Somit hat jedes auf diese Weise berechnete Intervall eine 95% ige Sicherheit, den Populationsmittelwert zu enthalten. Durch Ändern der Konstante von 1,96 auf 1,645 kann ein 90% -Konfidenzintervall erhalten werden. Aus der Formel für eine Intervallschätzung sollte hervorgehen, dass ein 90% -Konfidenzintervall enger als ein 95% -Konfidenzintervall ist und als solches ein etwas geringeres Vertrauen in die Einbeziehung des Populationsmittelwerts aufweist. Geringere Vertrauensniveaus führen zu noch engeren Intervallen. In der Praxis wird am häufigsten ein 95% -Konfidenzintervall verwendet.
Aufgrund des Vorhandenseins des Ausdrucks n1 / 2 in der Formel für eine Intervallschätzung wirkt sich die Stichprobengröße auf die Fehlerquote aus. Größere Stichproben führen zu kleineren Fehlergrenzen. Diese Beobachtung bildet die Grundlage für Verfahren zur Auswahl der Stichprobengröße. Die Stichprobengrößen können so gewählt werden, dass das Konfidenzintervall alle gewünschten Anforderungen hinsichtlich der Größe der Fehlergrenze erfüllt.
Das gerade beschriebene Verfahren zum Entwickeln von Intervallschätzungen eines Populationsmittelwerts basiert auf der Verwendung eines großen Intervalls Stichprobe. Im Fall einer kleinen Stichprobe, d. H. Wenn die Stichprobengröße n kleiner als 30 ist, wird die t-Verteilung verwendet, wenn die Fehlergrenze angegeben und eine Konfidenzintervallschätzung erstellt wird. Beispielsweise würde bei einem Konfidenzniveau von 95% ein Wert aus der t-Verteilung, der durch den Wert von n bestimmt wird, den aus der Normalverteilung erhaltenen Wert von 1,96 ersetzen. Die t-Werte sind immer größer, was zu größeren Konfidenzintervallen führt. Wenn die Stichprobengröße jedoch größer wird, nähern sich die t-Werte den entsprechenden Werten aus einer Normalverteilung an. Bei einer Stichprobengröße von 25 würde der verwendete t-Wert 2,064 betragen, verglichen mit dem normalen Wahrscheinlichkeitsverteilungswert von 1,96 im Fall einer großen Stichprobe.