Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

O que é o teorema de Bayes? Qual a relevância desse teorema em áreas aplicadas?

+2 votos
161 visitas
perguntada Mai 17, 2015 em Estatística por danielcajueiro (5,171 pontos)  

A imagem será apresentada aqui.

Compartilhe

1 Resposta

+1 voto
respondida Out 11, 2015 por danielcajueiro (5,171 pontos)  

Utilizando o jargão utilizado na estatística bayesiana, o Teorema de Bayes que é uma equação matemática que relaciona a medida condicional da incerteza \(P(E/D)\) associada a ocorrência de um evento \(E\), chamada de distribuição à posteriori, com a crença que se tinha antes sobre o evento \(P(E)\), conhecida como distribuição à priori, a evidência dada pela distribuição dos dados coletados \(P(D/E)\), chamada de verossimilhança, e \(P(D)\), chamada de verossimilhança marginal:

\[P(E/D)=\frac{P(E\cap D)}{P(D)}=\frac{P(D/E)P(E)}{P(D)}\]

\[=\frac{P(D/E)P(E)}{P(D/E)P(E)+P(D/E^c)P(E^c)},\]

onde \(E^c\) é o evento complementar.

É muito fácil entender o Teorema de Bayes usando o Diagrama de Venn apresentado abaixo:

A imagem será apresentada aqui.

No diagrama abaixo, o círculo grande é o universo \(\Omega\), onde ocorre todos os eventos. As duas circunferências menores representam a ocorrência dos eventos \(E\) e \(D\). Você pode associar a probabilidade de um evento a área da figura geométrica associada ao evento, onde \(P(\Omega)=1\), por definiçao.

Logo,

\[P(E)=\frac{\text{Área de }E}{\text{Área de }\Omega}=\text{Área de }E\]

e

\[P(D)=\frac{\text{Área de }D}{\text{Área de }\Omega}=\text{Área de }D\]

Adicionalmente, a probabilidade dos dois eventos ocorrerem simultâneamente é \(P(E\cap D)\).

Logo, temos

\[P(E/D)=\frac{P(E\cap D)}{P(D)}\]

Por que fazemos a divisão por \(P(D)\)? Note que estamos interessados na relação entre os tamanhos das áreas \(P(E\cap D)\) e \(P(D)\).

Por outro lado, temos

\[P(D/E)=\frac{P(E\cap D)}{P(E)},\]

onde aqui estamos interessados na relação entre as áreas \(P(E\cap D)\) e \(P(E)\).

Adicionalmente, pode-se escrever a área \(P(D)\) como

\[P(D)=P(D\cap E)+P(D\cap E^c)\] \[=(P(D/E)P(E)+P(D/E^c)P(E^c).\]

Fazendo, as substituições necessárias chegamos ao teorema de Bayes.

Na versão acima do Teorema de Bayes consideramos que \(\Omega\) foi particionada de forma que \(E\cap E^c=0\) e \(E\cup E^c=\Omega\). Poderiamos generalizar esse resultado para o caso em que fazemos uma partição de \(\Omega\) tal que \(E_i\cap E_j=0,\; \forall i\ne j\) e \(\cup_i E_i=\Omega\). Nesse caso, o teorema de Bayes pode ser escrito como

\[P(E_i/D)=\frac{P(D/E_i)P(E_i)}{\sum_i P(D/E_i)P(E_i)}.\]

Uma outra generalização possível é a versão do teorema de Bayes para densidades de probabilidade. Suponha que se observa uma variável aleatória \(X=x\). Seja \(f(x/\theta)\) a função de verossimilhança, e \(h(\theta)\) a distribuição a priori, então o teorema de Bayes pode ser escrito como

\[h(\theta/x)=\frac{f(x/\theta)h(\theta)}{\int_\Theta f(x/\theta)h(\theta)d\theta},\theta\in\Theta,\]

onde \(h(\theta/x)\) é a distribuição a posteriori de \(\theta\).

Como usar o teorema de Bayes?

Exemplo: Qual a chance de uma pessoa que deu HIV positivo, realmente possuir HIV?

Sabemos que o erro do teste é muito pequeno e em torno de 0.25%. Isso significa:

a) 0.25% das pessoas que foram identificadas como HIV positivo, não tem HIV;

b) 0.25% das pessoas que foram identificadas como HIV negativo, tem HIV.

Se você fizer essa pergunta, a maioria das pessoas responderá que a resposta é 99.75%. Essa resposta está correta?

Não! Intuitivamente, perceba que como a grande maioria das pessoas na população, não possui HIV, o erro terá mais efeito para a maioria da população do que para a minoria que realmente possui HIV.

Como calcular corretamente?

Suponha que a parcela da população que realmente possui HIV é 0.2% e use diretamente a fórmula de Bayes:

\[P(HIV/POS)=\frac{P(POS/HIV)P(HIV)}{P(POS)}\] \[=\frac{P(POS/HIV)P(HIV)}{P(POS/HIV)P(HIV)+P(POS/HIV^c)P(HIV^c)},\]

onde \(HIV\) é o evento do paciente ter HIV e \(POS\) é o evento do teste ter dado positivo.

Logo,

\[P(HIV/POS)=\frac{0.9975\times 0.002}{0.9975\times 0.002 + 0.0025\times 0.998}=44\%,\]

que é muito menor que a probabilidade de 99.75%.

O Teorema de Bayes é um resultado muito útil, pois é um ingrediente fundamental no desenvolvimento da Estatística Bayesiana e também a intuição por detrás dele é a Aprendizagem com Experiência.

...