Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Estimação via bootstrap do erro padrão do quantil estimado

+1 voto
23 visitas
perguntada Mai 19 em Estatística por Caio Oliveira Dantas (16 pontos)  
editado Mai 19 por Caio Oliveira Dantas

Exercício 15 do capítulo 8 do livro "Mathematical Statistics and Data Analysis" de John A. Rice Terceira Edição.

O quartil superior de uma distribuição acumulada F é o ponto \(q_{,25}\) tal que \(F(q_{,25}) = 0,75\). Para uma distribuição gama, o quartil superior depende de \(\alpha\) e \(\lambda\), então denote-o por \(q(\alpha, \lambda)\). Se uma distribuição gama for fitada aos dados como no exemplo C da Seção 8.5 e os parâmetros \(\alpha\) e \(\lambda\) forem estimados por \(\hat{\alpha}\) e \(\hat{\lambda}\), o quartil superior poderá ser estimado por \(\hat{q}= q(\hat{\alpha}, \hat{\lambda})\). Explique como usar o bootstrap para estimar o erro padrão de \(\hat{q}\).

Compartilhe

1 Resposta

+1 voto
respondida Mai 19 por Caio Oliveira Dantas (16 pontos)  

Passo-a-passo:

1) Simular N amostras independentes do tamanho da amostra original usando uma distribuição gama com parâmetros \(\hat{\alpha}\) e \(\hat{\lambda}\).
2) Para cada amostra simulada, estimar \(\tilde{\alpha}_{i}\) e \(\tilde{\lambda}_{i}\). \(i \in \{1,...,N\}\).
3) Calcular \(\tilde{q}_{i}= q(\tilde{\alpha}_{i}, \tilde{\lambda}_{i})\) para todo i.
4) O erro padrão de \(\hat{q}\) será o desvio padrão dos \(\tilde{q}_{i}\).

comentou Mai 22 por Ricardo Saldanha (1 ponto)  
Parabéns, Dantas! Perfeita a resposta.
Os passos são exatamente esses. Não tenho melhorias a sugerir.
Aos leitores que estão entrando em contato com o método, vale reforçar o sentido do mesmo. A distribuição bootstrap permite obter uma boa estimativa da distribuição amostral a partir da distribuição empírica, que é dada pela amostra inicial.
Em situações práticas, o caso mais comum é que tenhamos restrição de amostra. Pense, por exemplo, numa pesquisa custosa ou que envolve risco aos participantes. É impraticável retirar múltiplas amostras diretamente da população. Já as subamostras são obtidas computacionalmente.
Para mim permanece uma dúvida sobre o cálculo do quantil. Eu entendo que seja o ponto que satisfaz  \(F(q,25)=0,75\). Mas não sei como seria o cálculo na prática. Eu pensei em usar algo como "quantil = gamma.ppf(0.75,hat_alpha)", da biblioteca scipy.stats do Python. Os valores retornados parecem ser coerentes com o quantil. Nesse caso, porém, a conta não está dependendo de \(\lambda\).
...