Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Qual a prova mais elegante da Correção de Bessel?

+2 votos
483 visitas
perguntada Fev 9, 2016 em Estatística por Guilherme Jardim Dua (11 pontos)  
editado Fev 9, 2016 por Guilherme Jardim Dua

A Correção de Bessel corresponde à divisão por \( n - 1 \) e não por \( n \), no cálculo da variância amostral. Isso corrigiria o viés para a estimação da variância populacional.

Quais seriam algumas das provas mais elegantes para essa correção?

Compartilhe

1 Resposta

+2 votos
respondida Fev 10, 2016 por danielcajueiro (5,251 pontos)  

Essa é uma excelente pergunta que confunde muita gente. É trivial provar matematicamente que a correção funciona, mas mais interessante em minha opinião é entender porque se precisa de uma correção.

Intuição:

Seja \(X_i, \; i=1, \cdots, n\) independentes, uma amostra de uma variável aleatória \(X\) com média amostral dada por \(\overline X=\frac{1}{n}\sum_{i=1}^{n}X_i\).

Considere a soma dos quadrados dada por \(S_m=\frac{1}{n}\sum_{i=1}^{n}(x_i-m)^2\). Note que o valor que minimiza \(S_m\) é exatamente \(m=\frac{\sum_{i=1}^{n} x_i}{n}\) (para ver isso, você precisa apenas derivar e igualar a zero).

Para o cálcular a variância, gostaríamos de utilizar a soma \(S=\frac{1}{n}\sum_{i=1}^{n}(X_i-E[x])^2\), por \(E[S]=var(X)\).

Entretanto, como no mundo real não temos valor de \(E[x]\), o cálculo da variância é feito através da seguinte soma dos quadrados dada por \(S_{m=\overline{X}}=\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline X)^2\).

Embora \(\overline X\) seja em geral proximo de \(E[X]\), \(E[X]\) não é o valor que minimiza \(S_m\). Portanto, \(\frac{1}{n}\sum_{i=1}^{n}(X_i-E[x])^2 \ge \frac{1}{n}\sum_{i=1}^{n}(X_i-\overline X)^2\).

Conclusão: Faz sentido dividir a soma \(\sum_{i=1}^{n}(X_i-\overline X)^2\) por um valor menor.

Por que a divisão é feita exatamente usando \(n-1\)? Ou seja, por que a diferença entre as duas contas é dado pelo fator \(\frac{n-1}{n}=1 -\frac{1}{n}\), isto é, \(S_{m=\overline X}=\frac{n-1}{n}S=(1-\frac{1}{n})S\)? Por que \(S_{m=\overline X}\) é uma fração \(\frac{1}{n}\) menor que \(S\)?

Seja \(Y=\sum_{i=1}^{n} X_i\).

Note que \(E[Y]=nE[X]\) e \(var(Y)=n\; var(X)\).

Portanto, \(n\; var(X)=var(Y)=E[(Y-E[Y])^2]=E[(n\overline X-nE[X])^2\)

Finalmente, utilizando a primeira, a última equaçao acima e o fato que \(E[S]=var(X)\), temos que

\[\frac{1}{n} E[S]=(\overline X-E[X])^2\]

Por outro lado,

\[E[S_{m=\overline X}]=E[\frac{1}{n}\sum_{i=1}^{n}(X_i-\overline X)^2]=\]

\[=E\left[\frac{1}{n}\sum_{i=1}^{n}[(X_i-E[X])+(E[X]-\overline X)]^2\right]=\]

\[=\frac{1}{n}\sum_{i=1}^{n}E\left[(X_i-E[X])^2 +2(X_i-E[X])(E[X]-\overline X))+ (E[X]-\overline X)^2 \right]\]

\[=E[\frac{1}{n}\sum_{k=1}^n [(X_i-E[X])^2-(\overline X-E[X])^2]]=\] \[=E[S]-\frac{1}{n}E[S]=(1-\frac{1}{n})E[S].\].

...