Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Questão 2, Problemas do Capítulo 3 do Livro "Mathematical Statistics and Data Analysis" de John A. Rice (3ª Edição)

+1 voto
46 visitas
perguntada Mar 26 em Estatística por Matheus Cintrão (11 pontos)  

Uma urna contém p bolas pretas, q bolas brancas e r bolas vermelhas. Uma amostra de n bolas será selecionada sem reposição. Encontre:
a) A distribuição conjunta do número de bolas pretas, brancas e vermelhas na amostra.
b) A distribuição conjunta do número de bolas pretas e brancas na amostra
c) A distribuição marginal do número de bolas pretas.

Compartilhe

1 Resposta

+1 voto
respondida Mar 26 por Matheus Cintrão (11 pontos)  
editado Mar 31 por Matheus Cintrão

Temos aqui uma distribuição hipergeométrica. O que estamos procurando é a probabilidade de uma certa combinação de bolas ser retirada considerando todas as possíveis combinações que podem ser obtidas. Uma observação é que aqui vamos considerar varias bolas de mesma cor como sendo diferentes entre si. Isso ocorre porque se temos duas opções de bolas da mesma com para formar um conjunto este conjunto tem maior de probabilidade de acontecer.
Segue o exemplo:
Digamos que temos 2 bolas pretas, 1 branca e 1 vermelha (p = 2, q = 1, r = 1) e queremos escolher 3 bolas(n = 3). Seja B, W e R, respectivamente, o número de bolas pretas, brancas e vermelhas na amosta. Note que existem apenas 3 conjuntos deferentes (caso a ordem não importe):
(B, W, R) = (1, 1, 1)
(B, W, R) = (2, 1, 0)
(B, W, R) = (2, 0, 1)

No entanto, o conjunto (1, 1, 1) é mais provável de ocorrer, pois pode ser formado de duas maneiras distintas, enquanto os outros só ocorrem em uma hipótese de seleção. Desta forma para fins de probabilidade e necessário que 2 conjuntos (1, 1, 1), formados por cada uma das bolas pretas, sejam contabilizados. Desta forma o total de conjuntos pode ser uma combinação de 4 itens de 3 em 3, \( {4 \choose 3} = \frac{4!}{1!\cdot3!} = 4 \).
De forma geral teremos que o total de combinações possíveis é:
\[ {{p+q+r} \choose n} = \frac{(p+q+r)!}{(p+q+r - n)!n!}\]

a) distribuição conjunta para o número de bolas pretas, brancas e vermelhas.

Já temos o número total de amostras com n bolas que está urna pode gerr, agora resta saber o número de formas possíveis de uma certa combinação de bolas ser gerada. Aqui a resposta é mais simples. É o número de formas de escolher de B bolas pretas entre as p da urna, multiplicado pelo número formas de escolher W brancas as q da urna, multiplicado pelo número formas de escolher R vermelhas entre as r da urna. Ou seja, o número de combinações possíveis de bolas para gerar uma amostra com\( (B, W, R) = (x, y, z)\) é:
\[{p \choose x}\cdot {q \choose y} \cdot {r \choose z}\]

Com isso, a distribuição conjunta de (P, B, V) = (x, y, z) é:

\[ P(B = x, W = y, R = z) = \frac{{p \choose x}\cdot {q \choose y} \cdot {r \choose z}}{{{p+q+r} \choose n}}\]

b) Distribuição conjunta para o número de bolas pretas e brancas.

Aqui temos, na prática, a mesma solução do item anterior, pois havendo um número determinado n de bolas na amostra que só podem ser pretas, brancas ou vermelhas, ao determinar o número de bolas pretas e brancas também estamos, indiretamente, determinando o número de bolas vermelhas. A combinação \((B, W, R) = (x, y, z) = (x, y, n-x-y)\), pois sempre teremos \(x+y+z = n\). Basta, portando substituir \(z= n -x - y\) na equação do item a:

\[ P(B = x, W = y) = \frac{{p \choose x}\cdot {q \choose y} \cdot {r \choose {n-x-y}}}{{{p+q+r} \choose n}}\]

c)Distribuição marginal do número de bolas pretas.

Aqui basta considerar as bolas brancas e vermelhas como se fossem uma coisa só. Teremos portanto uma urna com p bolas pretas e (q+r) bolas não-pretas. Aqui vamos cair na versão mais simples da probabilidade anterior. O número total de combinações que a urna é capaz de produzir continua o mesmo, mas agora o número de combinações com \(B = x\) é:
\[{p \choose x}\cdot {{q+r} \choose {n-x}}\]

Ou seja, o número de possibilidades de se escolher x pretas entre as p da urna multiplicado pelo número de possibilidades de escolher (n-x) não-pretas entre as (q+r) da urna.

A distribuição marginal de B é portanto:

\[ P(B = x) = \frac{{p \choose x}\cdot {{q+r} \choose {n-x}}}{{{p+q+r} \choose n}}\]

comentou Mai 19 por Ricardo Saldanha (1 ponto)  
editado Mai 19 por Ricardo Saldanha
Parabéns, Cintrão. Excelente resposta.
Vale destacar que o fato de as retiradas serem sem reposição implica que os lances não são independentes. Assim a sua identificação da distribuição como uma hipergeométrica (multivariada) é correta; em oposição à distribuição multinomial, referente ao caso com reposição (lances independentes).
A parte da resposta antes mesmo de iniciar o item (a) fornece um exemplo simples do motivo da abordagem por combinação. Acredito que você conseguiu explicar essa parte praticamente sem demandar pré-requisitos. Isso é muito bem vindo e difícil de realizar. Ainda assim, eu aconselharia a um estudante que vai precisar dominar exercícios desse tipo que procure estar confortável com análise combinatória e distribuição binomial.
Você conseguiu dar a intuição da expressão da distribuição conjunta (denominador na introdução e numerador no item (a)). Explicou de forma curta e clara a ideia do item (b) com o trecho " \( (B,W,R)=(x,y,z)=(x,y,n−x−y) \)". E também deu uma boa intuição da distribuição marginal ao escrever "... considerar as bolas brancas e vermelhas como se fossem uma coisa só."
Embora seja claro que não há frações de bolas ou bolas negativas e esteja presente na explicação que \( x+y+z = n \), eu deixaria explícitas nas expressões as seguintes restrições:
\( x, y, z \in \mathbb{N_{0}} \) com \( x+y+z = n \), no item (a);
\( x, y \in \mathbb{N_{0}} \) com \( x+y \leq n \), no item (b);
e \( x \in \mathbb{N_{0}} \) com \( x \leq n \), no item (c).
As restrições garantem que as combinações tenham sentido e que os resultados sejam consistentes com o número de lances.
...