Estimación de la media de una población

El proceso de estimación de punto e intervalo más fundamental implica la estimación de la media de una población. Suponga que es de interés estimar la media poblacional, μ, para una variable cuantitativa. Los datos recopilados de una muestra aleatoria simple se pueden utilizar para calcular la media de la muestra, x̄, donde el valor de x̄ proporciona una estimación puntual de μ.

Cuando la media de la muestra se utiliza como una estimación puntual de la población Es decir, se puede esperar algún error debido al hecho de que se utiliza una muestra, o un subconjunto de la población, para calcular la estimación puntual. El valor absoluto de la diferencia entre la media muestral, x̄, y la media poblacional, μ, escrita | x̄ – μ |, se denomina error de muestreo. La estimación de intervalo incorpora una declaración de probabilidad sobre la magnitud del error de muestreo. La distribución muestral de x̄ proporciona la base para tal afirmación.

Los estadísticos han demostrado que la media de la distribución muestral de x̄ es igual a la media poblacional, μ, y que la desviación estándar viene dada por σ / Raíz cuadrada de√n, donde σ es la desviación estándar de la población. La desviación estándar de una distribución muestral se denomina error estándar. Para tamaños de muestra grandes, el teorema del límite central indica que la distribución muestral de x̄ puede aproximarse mediante una distribución de probabilidad normal. En la práctica, los estadísticos suelen considerar que las muestras de tamaño 30 o más son grandes.

En el caso de una muestra grande, una estimación del intervalo de confianza del 95% para la media de la población viene dada por x̄ ± 1,96σ / Raíz cuadrada de√n. Cuando se desconoce la desviación estándar de la población, σ, se utiliza la desviación estándar de la muestra para estimar σ en la fórmula del intervalo de confianza. La cantidad 1,96σ / raíz cuadrada de√n a menudo se llama margen de error para la estimación. La cantidad σ / raíz cuadrada de√n es el error estándar y 1,96 es el número de errores estándar de la media necesaria para incluir el 95% de los valores en una distribución normal. La interpretación de un intervalo de confianza del 95% es que el 95% de los intervalos construidos de esta manera contendrán la media de la población. Por tanto, cualquier intervalo calculado de esta manera tiene un 95% de confianza de contener la media de la población. Al cambiar la constante de 1,96 a 1,645, se puede obtener un intervalo de confianza del 90%. Cabe señalar a partir de la fórmula para una estimación de intervalo que un intervalo de confianza del 90% es más estrecho que un intervalo de confianza del 95% y, como tal, tiene una confianza ligeramente menor de incluir la media de la población. Los niveles más bajos de confianza conducen a intervalos aún más estrechos. En la práctica, el intervalo de confianza del 95% es el más utilizado.

Debido a la presencia del término n1 / 2 en la fórmula para una estimación de intervalo, el tamaño de la muestra afecta el margen de error. Los tamaños de muestra más grandes dan lugar a márgenes de error más pequeños. Esta observación forma la base de los procedimientos utilizados para seleccionar el tamaño de la muestra. Se pueden elegir tamaños de muestra de modo que el intervalo de confianza satisfaga los requisitos deseados sobre el tamaño del margen de error.

El procedimiento que se acaba de describir para desarrollar estimaciones de intervalo de una media de población se basa en el uso de una gran muestra. En el caso de una muestra pequeña, es decir, donde el tamaño de la muestra n es menor que 30, la distribución t se usa al especificar el margen de error y construir una estimación del intervalo de confianza. Por ejemplo, a un nivel de confianza del 95%, un valor de la distribución t, determinado por el valor de n, reemplazaría el valor de 1,96 obtenido de la distribución normal. Los valores de t siempre serán mayores, lo que dará lugar a intervalos de confianza más amplios, pero a medida que el tamaño de la muestra aumenta, los valores de t se acercan a los valores correspondientes de una distribución normal. Con un tamaño de muestra de 25, el valor t utilizado sería 2,064, en comparación con el valor de distribución de probabilidad normal de 1,96 en el caso de muestra grande.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *