Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Sendo \(X_{1}, \ldots, X_{20}\) variáveis aleatórias independentes com função de densidade:

0 votos
55 visitas
perguntada Abr 1 em Estatística por Rodrigo Fernandes (61 pontos)  

Sendo \(X_{1}, \ldots, X_{20}\) variáveis aleatórias independentes com função de densidade:
\(f(x)=2 x, \quad 0 \leq x \leq 1\)
Sendo \(S=X_{1}+\cdots+X_{20}\), use o Teorema do Limite Central para aproximar \(P(S \leq 10)\).

Questão do livro "Mathematical statistics and data analysis", do Rice J.A. Capítulo 5, exercício 16 (página 189).

Compartilhe

2 Respostas

+1 voto
respondida Abr 1 por Rodrigo Fernandes (61 pontos)  

Primeira coisa que devemos fazer é achar \(E(x_{i})\) e \(E(x_{i}^2)\), que serão iguais para as 20 variáveis aleatórias. Assim, temos:
\(E(x_{i}) = \int_{0}^{1} 2x^2 \,dx = \frac {2}{3}\)
\(E(x_{i}^2) =\int_{0}^{1} 2x^3 \,dx = \frac {1}{2}\)
Logo, \(var(x_{i}) = E(x_{i}^2) - E^2(x_{i}) = \frac{1}{2} - (\frac {2}{3})^2 = \frac {1}{18}\)

Com essas informações, podemos aplicar o Teorema do Limite Central (TLC). Sua ideia é que com uma quantidade grande de amostra, nossas funções somadas se aproximam de uma distribuição normal, desde que suas variâncias e primeiro momento sejam finitos. A fórmula para o cálculo será:
\( \frac {S- 20*\frac{2}{3}}{\sqrt \frac {20}{18}}\)

O que estamos fazendo é multiplicar a \(E(x_{i})\) e dividindo sua variância por \(20\) (número de \(x_{i}'s\) somados) e tirando a raíz dessa divisão, com objetivo de obter uma distribuição normal, com média 1 e variância 0. Dessa forma, achamos a normal padronizada e resolvemos o que a questão pede, ou seja, probabilidade de S ser menor que 10:

\(P(S \leq 10) = P(\frac {S- \frac{40}{3}}{ \frac {\sqrt 10}{3}} \leq \frac {10- \frac{40}{3}}{ \frac {\sqrt 10}{3}})\\
= P(N(0,1) \leq \frac {- \frac{10}{3}}{ \frac {\sqrt 10}{3}})\\
= P(Z \leq -\sqrt{10})\\
\approx P(Z \leq -3.16)\)
Pela Tabela da Normal tiramos:
\(\approx 1 - 0.9921 = .00079\)
Ou seja, aproximadamente \(0,079\%\)

0 votos
respondida Abr 28 por Vinícius Oliveira (11 pontos)  
editado Abr 28 por Vinícius Oliveira

Ótima resposta feita pelo Rodrigo, pois ele utilizou adequadamente os conceitos necessários para resolver o exercício. De fato, as ferramentas chave para a solução são estas: valor esperado e variância de variáveis aleatórias contínuas e a utilização correta do Teorema do Limite Central

Nesse sentido, a resolução do Rodrigo está correta e completa. Irei apenas complementar a discussão em torno do exercício a partir de 2 pontos:

1. Teorema do Limite Central

O Teorema do Limite Central pode ser apresentado de mais de uma forma, mas todas elas são equivalentes. Em particular, denotando \( Var(X_i) = \sigma^{2} \) e \(E(X_i) = \mu \), o Rodrigo utilizou esta forma:

\( \left( \dfrac{S - n \mu}{ \sigma \sqrt{n} } \right) \sim N(0,1) \hspace{0,1cm} ; \hspace{0,1cm} S = \displaystyle \sum_{i=1}^{20} X_i \hspace{0,3cm} (1)\)

Agora suponha que o estudante que se depara com essa questão só conhecesse o Teorema do Limite Central por esta outra forma:

\( \sqrt{n} \left( \dfrac{\bar{X} - \mu }{\sigma} \right) \sim N(0,1) \hspace{0,1cm} ; \hspace{0,1cm} \bar{X} = \dfrac{1}{n} \displaystyle \sum_{i=1}^{20} X_i \hspace{0,3cm} (2) \)

Como a partir de \((2)\) chegar em \((1)\)? Basta fazermos algumas manipulações algébricas. Para checar isso, substitua \( \dfrac{S}{n} = \bar{X}\) em \((2)\):

\( \sqrt{n} \left( \dfrac{\frac{S}{n} - \mu }{\sigma} \right) = \left( \dfrac{\sqrt{n}S}{n} - \mu \sqrt{n} \right) \dfrac{1}{\sigma} = \left( \dfrac{S}{\sqrt{n}} - \mu \sqrt{n} \right) \dfrac{1}{\sigma} = \)

= \( \left( \dfrac{S - \mu n}{\sqrt{n}} \right) \dfrac{1}{\sigma} = \left( \dfrac{S - n \mu}{ \sigma \sqrt{n} } \right) \)

2. Cálculo de Probabilidades com um Normal Padrão

Quando podemos fazer uma transformação em uma variável aleatória, de modo que o resultado é normalmente distribuído, é possível calcular probabilidades associadas a variável original usando a função de densidade acumulada da Normal Padrão. Nesse sentido, ao invés de usar uma tabela que mapeia os valores dessa distribuição e as respectivas probabilidades associadas, uma alternativa é checar esse valor no Python.

De fato, no caso deste exercício, consoante resolução do Rodrigo, \(P(S \le 10 ) = P(Z \le -3.16) \), em que \( Z \sim N(0,1) \). Nesse caso, no Python, duas linhas de código realizam essa tarefa:

import scipy.stats as st    
st.norm.cdf(-3.16)

No código acima, a primeira linha importou a biblioteca necessária, e a segunda reporta a probabilidade desejada. O resultado, no Console do Python, deve ser este:

0.0007888456943755722

Caso o estudante prefira usar o R , é possível também fazer essa checagem com poucas linhas de código

library(tigerstats)
pnormGC(-3.16, region="below", mean=0,
        sd=1,graph=FALSE)

No código acima, a primeira linha carrega a biblioteca necessária, e a segunda reporta a probabilidade desejada. O resultado, no Console do R , deve ser este:

 0.0007888457

No caso do R, se o usuário estiver utilizando o RStudio, é possível que a biblioteca "tigerstats" não esteja instalada, o que ocasionaria um erro na execução do código. Se isso acontecer, basta instalar primeiro essa biblioteca com esta linha de código:

 install.packages("tigerstats")
...