Estimativa de uma média populacional
O processo de estimativa de ponto e intervalo mais fundamental envolve a estimativa de uma média populacional. Suponha que seja de interesse estimar a média da população, µ, para uma variável quantitativa. Os dados coletados de uma amostra aleatória simples podem ser usados para calcular a média da amostra, x̄, onde o valor de x̄ fornece uma estimativa pontual de μ.
Quando a média da amostra é usada como uma estimativa pontual da população média, algum erro pode ser esperado devido ao fato de que uma amostra, ou subconjunto da população, é usada para calcular a estimativa pontual. O valor absoluto da diferença entre a média da amostra, x̄, e a média da população, μ, escrita | x̄ – μ |, é chamado de erro de amostragem. A estimativa de intervalo incorpora uma declaração de probabilidade sobre a magnitude do erro de amostragem. A distribuição amostral de x̄ fornece a base para tal afirmação.
Os estatísticos mostraram que a média da distribuição amostral de x̄ é igual à média da população, µ, e que o desvio padrão é dado por σ / Raiz quadrada de√n, onde σ é o desvio padrão da população. O desvio padrão de uma distribuição de amostragem é chamado de erro padrão. Para tamanhos de amostra grandes, o teorema do limite central indica que a distribuição de amostragem de x̄ pode ser aproximada por uma distribuição de probabilidade normal. Por uma questão de prática, os estatísticos geralmente consideram as amostras de tamanho 30 ou mais como grandes.
No caso de amostras grandes, uma estimativa de intervalo de confiança de 95% para a média da população é dada por x̄ ± 1,96σ / Raiz quadrada de√n. Quando o desvio padrão da população, σ, é desconhecido, o desvio padrão da amostra é usado para estimar σ na fórmula do intervalo de confiança. A quantidade 1,96σ / raiz quadrada de√n é freqüentemente chamada de margem de erro para a estimativa. A quantidade σ / raiz quadrada de√n é o erro padrão e 1,96 é o número de erros padrão da média necessária para incluir 95% dos valores em uma distribuição normal. A interpretação de um intervalo de confiança de 95% é que 95% dos intervalos construídos dessa maneira conterão a média da população. Assim, qualquer intervalo calculado dessa maneira tem uma confiança de 95% para conter a média da população. Alterando a constante de 1,96 para 1,645, um intervalo de confiança de 90% pode ser obtido. Deve-se observar a partir da fórmula para uma estimativa de intervalo que um intervalo de confiança de 90% é mais estreito do que um intervalo de confiança de 95% e, como tal, tem uma confiança ligeiramente menor de incluir a média da população. Níveis mais baixos de confiança levam a intervalos ainda mais estreitos. Na prática, um intervalo de confiança de 95% é o mais amplamente usado.
Devido à presença do termo n1 / 2 na fórmula para uma estimativa de intervalo, o tamanho da amostra afeta a margem de erro. Tamanhos de amostra maiores levam a margens de erro menores. Esta observação forma a base para os procedimentos usados para selecionar o tamanho da amostra. Os tamanhos das amostras podem ser escolhidos de forma que o intervalo de confiança satisfaça quaisquer requisitos desejados sobre o tamanho da margem de erro.
O procedimento que acabamos de descrever para desenvolver estimativas de intervalo de uma média populacional é baseado no uso de um grande amostra. No caso de amostra pequena – ou seja, onde o tamanho da amostra n é menor que 30 – a distribuição t é usada ao especificar a margem de erro e construir uma estimativa de intervalo de confiança. Por exemplo, em um nível de confiança de 95%, um valor da distribuição t, determinado pelo valor de n, substituiria o valor 1,96 obtido da distribuição normal. Os valores t serão sempre maiores, levando a intervalos de confiança mais amplos, mas, à medida que o tamanho da amostra aumenta, os valores t se aproximam dos valores correspondentes de uma distribuição normal. Com um tamanho de amostra de 25, o valor t usado seria 2,064, em comparação com o valor de distribuição de probabilidade normal de 1,96 no caso de amostra grande.