Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Suponha que uma amostra i.i.d. de tamanho 15 de uma distribuição normal tem média \(\overline{X}= 10\) e variância \(s^2 = 25\). Encontre os intervalos de confiança de \(90\)% para \(μ\) e \(σ^2\).

0 votos
126 visitas
perguntada Abr 5 em Estatística por Luiz Guilherme Hass (11 pontos)  
editado Mai 18 por Luiz Guilherme Hass

Exercício 46- Capítulo 8 do livro Mathematical Statistics and Data Analysis - John A. Rice (2ª edição)

Compartilhe

1 Resposta

0 votos
respondida Abr 6 por Luiz Guilherme Hass (11 pontos)  
editado Abr 7 por Luiz Guilherme Hass

Primeiro, vamos calcular o intervalo de confiança para a média \(μ\).

A variância populacional \(σ\) é desconhecida. Assim, temos que usar a distribuição t de student com \(n - 1\) graus de liberdade.

Dados:

Tamanho da amostra = graus de liberdade da amostra : \(n\) = 15

Média amostral: \(\overline{x}\) = \(10\)

Variância amostral: \(s^2 = 25\)

Intervalo de confiança = \(90\)%, então, \((1 - α) = 0,90\) e \(n - 1\) = \(14\).

Consultando a tabela t de student , \(t_{((n-1) α/2)}\) = \(t_{((14)0,95)}\) = \(1,76\)

O intervalo de confiança será dado por:

\(\overline{x}\) - \(t_{((n-1) α/2)}\) \(\frac{s}{\sqrt{n}}\) \(≤ μ ≤\) \(\overline{x}\) + \(t_{((n-1) α/2)}\) \(\frac{s}{\sqrt{n}}\)

Substituindo os valores:

\(\overline{x}\) - \(1,76\) \(\frac{s}{\sqrt{n}}\) \(≤ μ ≤\) \(\overline{x}\) + \(1,76\) \(\frac{s}{\sqrt{n}}\)

\(10 - 1,76\) \(\frac{5}{\sqrt{15}}\) \(≤ μ ≤\) \(10 + 1,76\) \(\frac{5}{\sqrt{15}}\)

\(7,73\) \(≤ μ ≤\) \(12,27\)

\(IC_{0,90}\) = (\(7,73\) ; \(12,27\))

A interpretação deste intervalo de confiança é que, com \(90\)% de chance, o parâmetro verdadeiro, que é a média populacional, vai pertencer ao intervalo entre \(7,73\) e \(12,27\).

Agora, vamos calcular o intervalo de confiança para a variância \(σ^2\).

A variável tem uma distribuição qui-quadrado com \(n-1\) graus de liberdade.

O intervalo de confiança será dado por:

\(IC\) (\(σ^2, 1 - α)\) = \(( \frac{(n-1)s^2}{Q_{1-α/2}}\) , \(\frac{(n-1)s^2}{Q_{α/2}} )\)

Consultando a tabela da distribuição qui-quadrado com 14 graus de liberdade, temos:

\(Q_{1-α/2}\) = \(Q_{0,95}\) = \(31,319\) e \(Q_{α/2}\) = \(Q_{0,05}\) = \(6,571\)

Substituindo os valores:

\(IC\) (\(σ^2, 1 - α)\) = \(( \frac{(15-1)25}{31,319}\) , \(\frac{(15-1)25}{6,571} )\)

\(IC\) (\(σ^2, 1 - α)\) = \((11,17 ; 53,26)\)

A interpretação deste intervalo de confiança é que, com \(90\)% de chance, o parâmetro verdadeiro, que é a variância populacional, vai pertencer ao intervalo entre \(11,17\) e \(53,26\).


RESPOSTAS PARA O COMENTÁRIO:

Olá Gustavo. Tudo bem e você?

Agradeço pelos comentários. Conforme bem apontado, minha resolução precisa de algumas alterações.

Em relação ao IC da variância, o valor realmente está incorreto. O valor apontado por mim refere-se a um valor crítico de 0,5% e não 5%. Um erro de atenção que alterou o resultado final do exercício. O valor correto é 23,685 , conforme apontado.

Na tabela de distribuição qui-quadrado, temos:

\(Q_{0,995}\) = \(31,319\) e \(Q_{0,95}\) = \(23,685\) . O valor que deve ser utilizado na resolução é \(Q_{0,95}\).

Refazendo os cálculos:

Consultando a tabela da distribuição qui-quadrado com 14 graus de liberdade, temos:

\(Q_{1-α/2}\) = \(Q_{0,95}\) = \(23,685\) e \(Q_{α/2}\) = \(Q_{0,05}\) = \(6,571\)

Substituindo os valores:

\(IC\) (\(σ^2, 1 - α)\) = \(( \frac{(15-1)25}{23,685}\) , \(\frac{(15-1)25}{6,571} )\)

\(IC\) (\(σ^2, 1 - α)\) = \((14,77 ; 53,26)\)

Portanto, o IC correto é o intervalo entre \(14,77\) e \(53,26\).

Em relação à interpretação do conceito de intervalo de confiança, realmente há uma diferença entre a interpretação frequentista e a bayesiana.

A ideia do uso de intervalo de confiança (IC) é indicar a confiabilidade de uma estimativa. A amplitude do IC está associada à incerteza em relação ao parâmetro. Um intervalo de confiança menor é entendido como mais confiável quando comparado a um intervalo maior.

A abordagem bayesiana entende que há um parâmetro verdadeiro e fixo. É atribuída uma distribuição de probabilidade sobre o valor verdadeiro do parâmetro. Essa distribuição de probabilidade é uma probabilidade a posteriori.

Já na abordagem frequentista o parâmetro é fixo e o intervalo de confiança é aleatório. Por exemplo, em um intervalo de confiança de 90%, trabalhando com um grande número de amostras repetidas, a ideia é que 90% dos intervalos de confiança encontrados incluirão o verdadeiro valor do parâmetro.

A diferença entre as abordagens bayesiana e frequentista é um tema recorrente na literatura acadêmica de Estatística.

comentou Abr 7 por gustavobrangel (6 pontos)  
editado Abr 7 por gustavobrangel

Oi, Luiz, tudo bem?

Seu cálculo do intervalo de confiança (IC) para a média bateu com o meu, acho que estão certos.

No caso do IC para a variânicia, divergimos quanto ao valor da estatística da qui-quadrado para o 95º percentil (ou seja, quando tem 5% de área para a direta do valor crítico). Seu valor é 31,319, enquanto o que eu encontro na tabela abaixo é 23,685.

A imagem será apresentada aqui.

Inclusive, a scipy.stats do Python fornece valor idêntico ao da tabela:

import scipy.stats as st
print(f'Chi-square statistic for the 95th percentile is {st.chi2.ppf(0.95, 14):0.3f}')

Chi-square statistic for the 95th percentile is 23.685

Assim, acaba que divergimos quanto ao limite inferior do IC para a variância.

Em segundo lugar, eu só teria cuidado com a interpretação do intervalo de confiança. Um IC de 90% não significa que há 90% de chance de ele conter o parâmetro verdadeiro, como seria o mais intuitivo pensar.
O parâmetro já existe (apesar de desconhecido), assim como o intervalo de confiança, ou seja, o parâmetro já está contido (probabilidade = 1) ou não (probabilidade = 0) no IC. É como se perguntar qual a probabilidade de estar chovendo agora. Ou é 0, ou é 1.

Pra entendermos melhor o significado de um IC, devemos nos lembrar da definição frequentista do conceito de probabilidade, que é a ocorrência relativa de um determinado resultado caso o experimento que o gerou fosse repetido infinitamente.
Assim, a interpretação mais comum de um intervalo de confiança de 90% para um determinado parâmetro é: caso retirássemos infinitas amostras da população e, para cada uma das amostras, construíssemos um IC de 90% para esse parâmetro, seu valor verdadeiro estaria contido nesses intervalos 90% das vezes.

Se eu não tiver sido muito claro, eu sugeriria ler a seção 8.6 e a conclusão do capítulo 8 do livro do John Rice, onde ele compara as abordagens bayesianas e frequentistas quanto à estimação da incerteza do parâmetro. Há ainda uma outra interpretação relacionada a considerações pré-experimentais, algo como se a pergunta agora fosse a respeito da probabilidade de chover no dia seguinte, isto é, sobre a chance de um IC construído a partir de um experimento futuro conter o valor verdadeiro do parâmetro populacional. Mas acaba que ambas as visões são bem parecidas, com a diferença de que a última não se baseia na hipótese de repetições infinitas de um experimento. O livro do John Rice cita essa interpretação no início da seção 8.5.3.

Para ser sincero, todas essas diferenças de significado, inclusive a da resposta, na prática, não mudam muita coisa. Não importa muito como você define um intervalo de confiança, já que, desde que seu cálculo esteja correto, ele vai transmitir a mesma mensagem a respeito da incerteza em torno do parâmetro.

...