É bastante comum para os estudiosos tentar descrever um determinado fenômeno através do estudo da probabilidade de ocorrência de um evento a ele associado.

Afinal de contas, é exatamente isto que acontece quando em um projeto Seis Sigma estudamos um processo e tentamos estimar a probabilidade de ocorrência de um determinado tipo de defeito.

Mas você sabe o que é uma distribuição estatística? Para que serve ou como utilizar? Sabe também o que é o Teorema de Bayes?

Começando a responder tais questionamentos, o Teorema de Bayes nada mais é do que um tipo de probabilidade estatística. Foi desenvolvida pelo pastor protestante e matemático inglês Thomas Bayes no século XVIII.

Para encontrar as respostas para as demais perguntas aqui expressas e outras curiosidades, não deixe de ler esse post.

 

O que é o Teorema de Bayes?

 

O Teorema de Bayes é uma fórmula matemática usada para o cálculo da probabilidade de um evento dado que outro evento já ocorreu, o que é chamado de probabilidade condicional.

A grande questão do Teorema de Bayes é que eu preciso ter alguma informação anterior, ou seja, preciso saber que um determinado evento já ocorreu e qual a probabilidade desse evento.

É baseado nessa inferência bayesiana que surge a expressão “grau de crença”, que é esse confiança em algum evento anterior, essa suposição inicial.

Se você ainda não conseguiu compreender, fique tranquilo, pois com alguns exemplos práticos, tenho certeza de que ficará mais simples.

 

Como calcular o Teorema de Bayes?

 

Para o cálculo da probabilidade de um evento A dado que um evento B ocorreu, “P(A|B)”, pelo Teorema de Bayes temos que:

 

 

Ou seja, precisamos de alguns dados, que são:

 

  • P(B|A): probabilidade de B acontecer dado que A ocorreu

  • P(A): probabilidade de A ocorrer

  • P(B): probabilidade de B ocorrer

 

Para esclarecer mais, nada melhor que um exemplo, não é mesmo?

 

Exemplo 1

 

Imagine que um casal tem dois filhos. Qual a probabilidade dos dois filhos serem meninos dado que um deles é menino?

Para calcular essa probabilidade, precisamos definir alguns eventos e probabilidades. Vamos definir os eventos:

 

  • A: dois filhos meninos (evento desejado)

  • B: um dos filhos é um menino (evento dado)

 

Definidos os eventos, vamos definir algumas das probabilidades que precisamos para o cálculo:

 

  • P(A): probabilidade de que os dois filhos sejam meninos

  • P(B): probabilidade de que um filho seja um menino

 

Com cálculos simples, chegamos à conclusão de que a probabilidade de que dois filhos sejam meninos é ¼. Assumindo que a probabilidade de que uma criança seja menino seja ½, então a probabilidade de que pelo menos um dos filhos do casal seja um menino é ¾.

Podemos concluir também que P(B|A), ou seja, a probabilidade de que um dos filhos seja menino dado que os dois são meninos é 1.

Sendo assim, temos:

 

  • P(A) = ¼

  • P(B) = ¾

  • P(B|A) = 1

 

Logo, aplicando o Teorema de Bayes:

 

 

E aí, pegou o jeito? Esse foi um exemplo muito simples, certo? Vamos a um mais completo.

 

Exemplo 2

 

Antes de começar esse exemplo, você precisa ter conhecimento sobre uma coisa: testes não são 100% precisos, portanto não conseguem descrever com perfeição os eventos reais.

Uma das aplicações do Teorema de Bayes é a solução desse problema de interpretação do resultado de um teste de positividade sobre uma doença. Entendido isso, voltemos ao exemplo.

Imaginemos que o teste de mamografia se comporte da seguinte forma:

 

  • 1% das mulheres têm câncer de mama (portanto, 99% não tem)

  • 80% das mamografias detectam o câncer quando ele existe (portanto, 20% falha)

  • 9,6% das mamografias detectam o câncer quando ele não existe (portanto, 90,4% retornam corretamente um resultado negativo)

 

Colocando isso em uma tabela, temos:

 

 

Como ler essa tabela?

 

  • 1% das mulheres tem o câncer de mama, logo 99% não tem

  • Quem tem câncer está na segunda coluna e há 80% de chance que você testará positivo e 20% que você testará negativo.

  • Quem não tem câncer está na terceira coluna e há 9,6% de chance que você testará positivo e 90,4% que você testará negativo.

 

Dadas todas essas informações, imagine que você se submeteu ao teste de mamografia e esse teste apresentou um resultado positivo. Quais são as chances de realmente se ter câncer, dado que o teste deu positivo?

Vamos aos cálculos:

Se o teste deu positivo, logo você se encontra na linha de cima da tabela. Vamos nos concentrar nessa linha então. Se você olhar de forma descuidada, vai com certeza achar que sua vida acabou, mas calma, o Teorema de Bayes pode te ajudar nessa.

Agora, precisamos estabelecer os dados:

 

  • P(A|B) = probabilidade de ter câncer (A) dado que o teste deu positivo (B).

  • P(B|A) = probabilidade de testar positivo (B) dado que tem câncer (A). Essa é a chance de um positivo verdadeiro, que é 80%.

  • P(A) = probabilidade de ter câncer (1%).

  • P(AC) = probabilidade de não ter câncer (99%), representado por AC (complementar de A, ou seja, “não A”).

  • P(B|AC) = probabilidade de testar positivo (B) dado que não tem câncer (AC), que é 9,6% nesse caso.

 

Vamos dar uma olhada na fórmula:

 

 

Como faríamos para encontrar P(B) (probabilidade de qualquer teste positivo)? Bem, exatamente por isso que precisamos da informação sobre todas as possibilidades de um teste dar positivo.

Um teste pode dar positivo tanto se a mulher tiver câncer como se não tiver. Essas possibilidades são exatamente P(B|A) e P(B|AC). Assim, temos que P(B) é igual a:

 

 

Logo, nossa fórmula fica desse jeito:

 

 

Para facilitar os cálculos, você pode utilizar uma calculadora científica, embora seja possível fazer essa conta com qualquer calculadora. Substituindo pelos números, ficamos com:

 

 

Ou seja, a probabilidade de se ter câncer de mama dado que a mamografia deu positivo é de apenas 7,8%. Esse valor, que pode parecer contrário a sua intuição, é obtido graças ao cálculo de todas as possibilidades de um teste positivo.

A grande questão é o peso que a proporção de pessoas que não possuem câncer exercem na fórmula. O fato de que a cada 100 pessoas apenas 1 tem a doença faz toda a diferença.

Com esse exemplo, ficou muito mais clara a importância e explicação do Teorema de Bayes nas probabilidades condicionais, certo? O entendimento de que dois eventos independentes, ao serem considerados como condicionados, nos darão uma nova visão das chances de ocorrência desses eventos.

 

O famoso problema de Monty Hall

 

Uma das aplicações do Teorema de Bayes é no famoso problema de Monty Hall. Esse problema, ou paradoxo, controverso e contra intuitivo reflete bem essa mudança das probabilidades baseada em um grau de crença.

O que é esse problema? Bem, se trata do famoso jogo das portas, comum em muitos game shows, em que o convidado tem que escolher 1 de 3 portas, pois essa contêm um prêmio. Assim que você escolhe, uma outra porta é aberta revelando estar vazia e, então, é perguntado se você deseja trocar de porta.

O grau de crença assumido é que o apresentador do programa sabe exatamente onde está o prêmio. Sendo assim, independente se você escolheu a porta certa de primeira, ele abrirá uma porta que está vazia e te perguntará se deseja trocar.

Partindo-se dessa informação dada, de que o apresentador sabe onde está o prêmio, você deve trocar ou não de porta? Já te adianto a resposta: sim, trocar de porta dobra suas chances de ganhar o prêmio. Talvez você esteja chocado agora, mas calma, a matemática assume daqui em diante.

Vamos supor que você escolha a porta número 1. O apresentador abre a porta número 2, que está vazia. Lembre-se de que ele sabe onde está o prêmio. Ele então te pergunta se você deseja trocar de porta.

Vamos aos dados:

Quando você escolhe a porta número 1, você tem 1/3 de chance de ganhar, pois temos 3 portas, com somente uma contendo o prêmio. Então, o que acontece com suas chances quando o apresentador abre uma porta vazia? Elas se mantêm na mesma. Como assim?

Definindo os eventos:

 

  • A = a porta escolhida (nº 1) tem o prêmio

  • B = o apresentador abre uma porta vazia

 

Assim, vamos partir para o Teorema de Bayes:

 

 

Sabemos que P(A) = 1/3. Para calcular P(B), precisamos cobrir todas as possibilidades de o apresentador abrir uma porta vazia. Ou seja, quais são as probabilidades de o apresentador abrir uma porta vazia tendo você escolhido ou não a porta certa.

Assim, o Teorema fica dessa forma:

 

 

Assim, vamos definir as probabilidades:

 

  • P(A) = probabilidade de o prêmio estar na porta número 1.

  • P(B|A) = probabilidade de o apresentador escolher uma porta vazia dado que o prêmio está na porta número 1.

  • P(B|AC) = probabilidade de o apresentador escolher uma porta vazia dado que o prêmio NÃO está na porta número 1.

  • P(AC) = probabilidade de o prêmio NÃO estar na porta número 1.

 

Podemos afirmar que probabilidade de o apresentador abrir uma porta vazia (o prêmio estando ou não na porta número 1) é 1, ou seja, P(B|A) = P(B|AC) = 1. Por quê? Porque essa informação foi dada previamente, isto é, o apresentador sempre escolherá uma vazia, pois ele sabe atrás de qual porta se encontra o prêmio.

Quanto a P(AC), temos uma probabilidade de 2/3, pois essa é a chance de errarmos a porta na primeira escolha. Sendo assim, se você mantiver sua escolha pela primeira porta, terá uma probabilidade de:

 

 

Ou seja, se você não mudar de porta, sua chance de ganhar permanece em 1/3, enquanto se você trocar, dobra suas chances para 2/3. Isso não garante que você ganhará o prêmio, pois pode acontecer que você tenha acertado de primeira, mas na maioria das vezes, o prêmio estará atrás da outra porta.

Um jeito simples de constatar isso é através de uma tabela. Assumindo que você tenha escolhido a porta número 1, temos as seguintes possibilidades:

 

 

Lembrando que o apresentador abrirá uma porta vazia, quando você troca de porta, você ganha em 2 de 3 vezes. Percebeu agora? Embora pareça estranho e nada intuitivo, você logo pode notar que, baseado na informação de que o apresentador sabe onde está o prêmio, trocar é a melhor opção.

 

E aí, viu como as probabilidades mudam?

 

Agora que você sabe o que é o Teorema de Bayes e quais são as suas aplicações, conte para nós o que achou desse artigo. Não seria nada incomum que você fique surpreso com alguns resultados, pois a probabilidade condicional costuma ter esse efeito.

Então, se surgiu alguma dúvida, basta escrever nos comentários que ficaremos felizes em te ajudar. Aguardamos seu feedback!