母平均の推定
最も基本的な点と区間の推定プロセスには、母平均の推定が含まれます。量的変数の母平均μを推定することに関心があるとします。単純ランダムサンプルから収集されたデータを使用して、サンプル平均x̄を計算できます。ここで、x̄の値はμの点推定を提供します。
サンプル平均が母集団の点推定として使用される場合つまり、サンプルまたは母集団のサブセットが点推定の計算に使用されるため、ある程度の誤差が予想されます。 | x̄−μ |と書かれた標本平均x̄と母平均μの差の絶対値は、サンプリング誤差と呼ばれます。区間推定には、サンプリング誤差の大きさに関する確率ステートメントが組み込まれています。 x̄のサンプリング分布は、そのようなステートメントの基礎を提供します。
統計学者は、x̄のサンプリング分布の平均が母平均μに等しく、標準偏差がσで与えられることを示しました。 /√nの平方根。ここで、σは母標準偏差です。サンプリング分布の標準偏差は、標準誤差と呼ばれます。サンプルサイズが大きい場合、中心極限定理は、x̄のサンプリング分布を正規確率分布で近似できることを示しています。実際問題として、統計学者は通常、サイズ30以上のサンプルを大きいと見なします。
大きなサンプルの場合、母平均の95%信頼区間推定値はx̄±1.96σで与えられます。 /√nの平方根。集団の標準偏差σが不明な場合、サンプルの標準偏差を使用して、信頼区間の式でσを推定します。 √nの1.96σ/平方根の量は、推定の許容誤差と呼ばれることがよくあります。 √nの量σ/平方根は標準誤差であり、1.96は、正規分布に値の95%を含めるために必要な平均からの標準誤差の数です。 95%信頼区間の解釈は、この方法で構築された区間の95%に母平均が含まれるというものです。したがって、この方法で計算された区間は、母平均を含む95%の信頼度があります。定数を1.96から1.645に変更することにより、90%の信頼区間を取得できます。区間推定の式から、90%の信頼区間は95%の信頼区間よりも狭く、母集団の平均を含める信頼度がわずかに小さいことに注意してください。信頼度が低いと、間隔がさらに狭くなります。実際には、95%の信頼区間が最も広く使用されています。
区間推定の式にn1 / 2項が存在するため、サンプルサイズは許容誤差に影響します。サンプルサイズが大きいほど、許容誤差が小さくなります。この観察は、サンプルサイズを選択するために使用される手順の基礎を形成します。サンプルサイズは、信頼区間が許容誤差のサイズに関する任意の要件を満たすように選択できます。
母集団平均の区間推定を作成するために説明した手順は、大規模な使用に基づいています。サンプル。小さいサンプルの場合、つまりサンプルサイズnが30未満の場合、t分布は、許容誤差を指定し、信頼区間の推定値を作成するときに使用されます。たとえば、95%の信頼水準では、nの値によって決定されるt分布の値が、正規分布から取得された1.96の値に置き換わります。 t値は常に大きくなり、信頼区間が広くなりますが、サンプルサイズが大きくなると、t値は正規分布から対応する値に近づきます。サンプルサイズが25の場合、使用されるt値は2.064になります。これに対して、大規模なサンプルの場合の正規確率分布値は1.96です。