You are on page 1of 2

El Teorema de Bayes y sus Aplicaciones

EMBA Analisis Cuantitativo


Prof. Tito Homem-de-Mello

El uso de probabilidades condicionales amplia enormemente las posibilidades de aplicacion de herramien-


tas analticas. En esa nota describimos algunas propiedades importantes.
1. Una regla importante a recordar es la siguiente: considere un evento A y dos eventos B1 y B2 tales
que B1 y B2 son complementarios, o sea, uno de los eventos B1 o B2 siempre ocurre pero nunca los
dos simult
aneamente (por ejemplo, los eventos B1 ={llueve} y B2 ={no llueve} son complementarios).
Muchas veces conocemos las probabilidades condicionales P (A | B1 ) y P (A | B2 ), y queremos calcular
P (A). Siempre se puede escribir
P (A) = P (A y B1 ) + P (A y B2 ) = P (A | B1 )P (B1 ) + P (A | B2 )P (B2 ). (1)

Por ejemplo, considere los datos del caso Freemark Winery, y suponga que queremos calcular la proba-
bilidad del evento A ={ganancia es menor que $34.200} cuando se decide esperar por la lluvia (recuerde
que $34.200 es el monto que se gana cuando se decide cosechar inmediatamente). Conforme visto en
clase, hay dos escenarios en que A ocurre: si llueve, la ganancia es menor que $34.200 si no se forma
el hongo; si no llueve, la ganancia es menor que $34.200 si las uvas tienen baja acidez. O sea, sabemos
que
P (A | B1 ) = P (no hay hongo | llueve) = 0, 6
P (A | B2 ) = P (uvas tienen baja acidez | no llueve) = 0, 2
Utilizando la regla en la ecuaci
on (1), calculamos
P (A) = P (A | B1 )P (B1 ) + P (A | B2 )P (B2 ) = 0, 60, 5 + 0, 20, 5 = 0, 4.
O sea, si decidimos esperar por la lluvia, hay un 40% de chance que ganemos menos que si cosechamos
inmediatamente (y de la misma forma, hay un 60% de chance que ganemos mas que si cosechamos
inmediatamente).
2. Un uso bastante importante de la ecuacion (1) es para calcular la probabilidad condicional P (B1 | A)
cuando uno conoce las probabilidades P (A | B1 ) y P (A | B2 ). Tenemos
P (A y B1 ) P (A | B1 )P (B1 )
P (B1 | A) = = . (2)
P (A) P (A | B1 )P (B1 ) + P (A | B2 )P (B2 )

La f
ormula (2) se llama el Teorema de Bayes. Un ejemplo de aplicacion es el siguiente problema:

Un examen (por ejemplo para el virus HIV) da falso positivo cuando acusa una enfermedad que la
persona no tiene. El examen da falso negativo cuando no acusa una enfermedad que la persona tiene.
Supongamos que una prueba para HIV tiene
Probabilidad de falso positivo = 2%
Probabilidad de falso negativo = 0%
Supongamos que usted hace un examen para HIV y el resultado sale positivo. Su doctor dice que, con-
secuentemente, hay 98% de chances que usted tenga el virus. Esta correcto el doctor? Pienselo...antes
de mirar la respuesta en la pr
oxima pagina!

1
Podemos estudiar el problema arriba de manera formal utilizando el Teorema de Bayes. Consideremos
los eventos

TP = examen da positivo
E = persona tiene la enfermedad
NE = persona no tiene la enfermedad

La confiabilidad del examen dice que P (T P | E) = 100%, P (T P | N E) = 2%. La incidencia de HIV en


adultos en Chile es aproximadamente 0,4%, entonces P (E) = 0, 4%, P (N E) = 99, 6%. A nosotros nos
interesa calcular P (E | T P ) = probabilidad que la persona tenga la enfermedad dado que examen dio
positivo. Utilizando el Teorema de Bayes, calculamos

P (T P y E)
P (E | T P ) =
P (T P )
P (T P | E)P (E) 100%0, 4% 0, 4%
= = =
P (T P | E)P (E) + P (T P | N E)P (N E) 100%0, 4% + 2%99, 6% 2, 392%
= 16, 7%.

O sea, en ese contexto la probabilidad de que uno tenga la enfermedad, dado que el examen dio positivo,
es apenas un 16,7%, y no 98%!

Para entender el resultado de manera mas intuitiva, supongamos que hay una poblacion de 1 mill
on de
personas. Considerandose que la incidencia de HIV es un 0,4%, eso implica que 4000 personas tienen
HIV, 996000 no lo tienen. Si todas las personas hiciesen el examen, 2%996000 = 19920 daran (falsos)
positivos. Adem as, 100%4000 = 4000 daran (verdaderos) positivos. Total 23920 positivos. O sea, la
proporcion de ex
amenes positivos que corresponden a personas que realmente tienen HIV es apenas
4000
= 16, 7%,
23920
o sea, el mismo resultado obtenido con el Teorema de Bayes. La ventaja del teorema es que hace el
c
alculo de manera sistem
atica y utiliza apenas las probabilidades disponibles, no hay ningun supuesto
sobre el tama
no de poblaci
on, etc.

La distorsi
on en ese ejemplo se debe a que la probabilidad de falso positivo (2%) es mucho mayor que
la incidencia de la enfermedad (0,4%), entonces la gran mayora de los examenes positivos son falsos
positivos. Por ejemplo, si la incidencia de la enfermedad fuese 40% en vez de 0,4%, basta rehacer
los c
alculos para concluir que la probabilidad que uno tenga la enfermedad dado que el examen dio
positivo pasara a ser de un 97,1%!

You might also like