You are on page 1of 39

Probabilidades y distribuciones de probabilidad..

Captulo 2

PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD

2.1. Introduccin.
J. Bernoulli fue el primero en estudiar este tema en forma sistemtica con un enfoque
cientfico. Observando los resultados del lanzamiento de una moneda un nmero grande
de veces, not que el nmero de caras y sellos tenda a igualarse. Es decir, que la
frecuencia relativa de la obtencin de caras se acercaba ms al nmero de sellos, cuanto
mayor era el nmero de lanzamientos. O bien, ambas frecuencias relativas se parecan
cada vez ms a 0.5. Otro tanto le ocurra en el lanzamiento de dados: la frecuencia
relativa es un 1 tenda a 1/6. Repiti una y otra vez este tipo de experimentos con
monedas, dados y cartas, y siempre llegaba a la misma conclusin. Imagin haber
encontrado un fenmeno ms general y as dio comienzo la teora de probabilidades.
Sus resultados tericos se corresponden razonablemente con la realidad. Sin embargo,
debe marcarse siempre una clara distincin entre los resultados empricos y los tericos.
El uso comenz en la teora de juegos de azar, en el siglo XVII en Francia, y gracias a
estos se hizo popular entre los gemetras de aquel entonces. Hoy se emplea en el
campo de los seguros, control de calidad, gentica, investigacin operativa y muchos
ms.

En la ciencia experimental se presenta tambin un tipo similar de incertidumbre y de
regularidad a largo plazo. Por ejemplo en gentica es incierto saber si un descendiente
ser hembra o macho, sin embargo, a largo plazo podremos determinar el porcentaje
que sern machos y los que sern hembras y posteriormente cuando ocurre un hecho en
las mismas condiciones podremos predecir dicho resultado.

En el lenguaje corriente se utiliza el termino "probabilidad" para designar el grado de
confianza que una persona tiene sobre la ocurrencia de un determinado suceso
futuro.

La probabilidad es una parte de nuestra vida cotidiana. Por ejemplo, Cuando
escuchamos una prediccin de un 70% de posibilidades de lluvia, cambiamos nuestros
planes de salir el da de campo y nos quedamos viendo televisin o escuchando msica.
En el campo de la salud pblica los indicadores tales como tasas y porcentajes que son
expresados en tanto por uno se pueden interpretar como la probabilidad de la ocurrencia
de un hecho o evento. Por ejemplo:

- La tasa bruta de mortalidad en el Per es aproximadamente 9 defunciones por mil
habitantes (9/1000). Si la tasa mencionada se expresa en tanto por uno, se puede
interpretar como que la probabilidad de morir por cualquier causa de una persona
elegida al azar es de 0.009.

- La tasa de incidencia de cncer de pulmn en una determinada poblacin es de 70.6/
100,000, es decir, que en un determinado periodo de cada 100,000 personas
aproximadamente 71 hicieron cncer de pulmn en dicha poblacin. Otra
interpretacin que se podra dar si esta tasa se expresa en tanto por uno sera que la
Probabilidades y distribuciones de probabilidad..

probabilidad de que una persona elegida al azar se enferme de cncer de pulmn es
de 0.000706.

2.2. Definicin de algunos trminos.

A continuacin se da a conocer una serie de definiciones (para poder usar un idioma
comn) que posteriormente van a permitir dar una definicin de la probabilidad de la
ocurrencia de un evento.

2.2.1. Experimento aleatorio. Es todo proceso que consiste de la ejecucin de un acto
(o prueba) una o ms veces, cuyo resultado en cada prueba depende del azar y en
consecuencia no se puede predecir con certeza.

Ejemplo 2.1. Son experimentos aleatorios:


1
: Lanzar una moneda no cargada sobre una superficie plana y se observa la parte
superior.

2
: Evaluar el estado nutricional de un nio menor de 5 aos elegido al azar de una
comunidad.

3
: Un Bilogo realiza un anlisis de laboratorio para ayudar a efectuar un
diagnstico correcto en los pacientes, de una enfermedad cualquiera (como
puede ser la Diabetes).

2.2.2. Elemento. Es uno de los resultados posibles del experimento o prueba clnica. A
veces se lo llama resultado o dato.

Ejemplo 2.2. Consideremos los experimentos aleatorios del ejemplo 2.1.

- En el experimento
1
, el fenmeno se presenta de dos maneras y que puede ser
cara (

C

) sello (S).
- En el experimento
2
, como resultado de la evolucin del nio se le puede
clasificar como Nutrido (N) o desnutrido (D).
- En el experimento
3
, el bilogo empleando diversas tcnicas de laboratorio, se
puede llegar a uno de dos diagnsticos: el paciente tiene diabetes (D ) no tiene
Diabetes (ND)..

2.2.2. Espacio muestral. Est formado por el conjunto de todos los resultados
posibles de un experimento aleatorio. Este conjunto se denota por O.
Cada resultado posible de un experimento aleatorio es un elemento del espacio
muestral y se denomina tambin punto muestral.

Ejemplo 2.3. Sea el experimento aleatorio de lanzar una moneda y un dado a la vez,
y observar los resultados posibles. En este caso espacio muestral es el conjunto:
O
1
= {1C, 2C, 3C, 4C, 5C, 6C, 1S, 2S, 3S, 4S, 5S, 6S

}

Ejemplo 2.4. El experimento consiste en observar en un determinado periodo, el
nmero de casos de una enfermedad que se presentan en una comunidad de 1000
habitantes. Estos resultados pueden ser:
O
2
= { 0, 1, 2, 3, 4,, 1000} enfermos

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.5. El experimento consiste en evaluar el estado nutricional de tres nios
menores de 5 aos elegidos al azar de una comunidad. En esta situacin, el
experimento se repite tres veces, y en cada repeticin hay dos resultados posibles (N
D). El espacio muestral puede escribirse como el conjunto de ternas ordenadas:

O
2
= {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}

NOTA. Los espacios muestrales de experimentos aleatorios que consisten de dos o
ms pruebas sucesivas se obtienen tambin de un diagrama tipo rbol, como el la
figura 2.1, para O
2


1. Evaluacin 2. Evaluacin 3. Evaluacin Resultados Posibles
N NNN
N
N D NND
N NDN
D
D NDD

N DNN
N
D D DND
N DDN
D
D DDD
Figura 2.1. Diagrama del rbol.


2.2.3. Eventos. Se denomina evento a cualquier subconjunto de un espacio muestral
y lo denotaremos por A, B, C, D, E, etc. As si A es un evento entonces A c O.
En particular O y | (conjunto vaco) son eventos. Al espacio muestral O se le llama
evento seguro y a | evento imposible.

Ejemplo 2.3. Consideremos el espacio muestral asociado al experimento definido
en el ejemplo 2.4 ( O
3 ).

O
3
= {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}

De este experimento podemos estar interesados en la ocurrencia de una serie de
eventos, por ejemplo:
A
:
Que ocurra exactamente un nio desnutrido.,
B

: Que ocurra al menos dos nios desnutridos.
El listado de los elementos que le corresponden a estos eventos son:
Probabilidades y distribuciones de probabilidad..

A = {NND, NDN, DNN}
B = {NDD, DND, DDN, DDD}


2.3. Principios bsicos de probabilidades.
Cuando se hacen afirmaciones como "Juan probablemente ganara la partida de tenis",
"tengo el 50% de posibilidad de obtener un nmero par al lanzar un dado". En cada caso
se expresa un resultado del cual no se tiene plena certeza, pero en virtud de la
informacin que se tiene del pasado o de la compresin de la estructura del
experimento, se logra cierto grado de confianza en la validez de la aseveracin.


2.3.1. Probabilidad terica de la ocurrencia de un Evento.
Si los resultados del experimento aleatorio son igualmente probables, el espacio
muestral asociado a este experimento se denomina espacio equiprobable y la
probabilidad de la ocurrencia de un evento A se define como el cociente entre el
nmero esperado de veces que ocurra el evento A y el nmero total de casos posibles en
que el experimento puede ocurrir.

ocurrir puede o experiment el que en total de total Numero
A a favorable ocurre o experiment el que en veces de esperado Numero
) ( = A P


Esta definicin primaria de probabilidad se calcula en forma terica.

La probabilidad de un evento vara entre 0 y 1 (siempre est expresado en tanto por
uno). Una probabilidad igual a 1 indica nuestra absoluta certeza de que el evento
ocurrir, mientras que una probabilidad nula indica nuestra absoluta certeza de que el
evento no ocurrir. Valores intermedios sealan estados de mayor o menor confianza en
la ocurrencia del suceso.

2.3.2. Probabilidad emprica.
La probabilidad que se ha estado considerando estn basadas en un conocimiento a
priori de las frecuencias favorables de un evento y de todos los resultados posibles que
puede ocurrir.
En algunas ocasiones, la nica forma de determinar una probabilidad es repitiendo un
experimento muchas veces, para ver la frecuencia con que ocurriran los posibles
resultados. Mientras ms se repita el experimento aparece un modelo de regularidad,
esto es, habr una estabilidad de la fraccin Fr
A
(frecuencia relativa).

La probabilidad emprica de ocurrencia de un evento A es igual a su frecuencia
relativa (Fr
A
). O sea, el cociente entre el nmero de veces en que ocurri el evento A
(F
A
y el nmero total de experimentos (Ft).

Ft F Fr A A / =

Ejemplo 2.4. De la poblacin de pacientes de un laboratorio se eligieron N = 1000
personas al azar, y se encontr que 38 padecan de hipoglucemia. Calcular la
probabilidad de que si se escoge un paciente al zar este padezca la enfermedad.

Solucin.
Frecuencia emprica = 38/1000 = 0.038 Probabilidad terica = prevalencia
Probabilidades y distribuciones de probabilidad..

Ejemplo 2.5. Al realizar una comprobacin de los valores predichos por la
CPK(creatino

- fosfo kinasa), se encontr que 64 de ellos fueron mal clasificados como
positivos y 36 como falsos negativos, del total de 400 historias clnicas analizadas.
Calcular la probabilidad de acertar en el pronstico.

Solucin.
Frecuencia emprica de aciertos = (VP + VN)/ Total = (400 -64 36)

/

400 = 0.75

Ejemplo 2.6. Se efecta un diagnstico a partir de los anlisis clnicos del paciente. Los
resultados posibles son (+) con una probabilidad p y (-) con una probabilidad q. Se
cumple la relacin p + q =1 pues p

=

TP/

N y q

=

TN/

N, de all p

+

q = (TP + TN)/

N =1.
Se efecta otro diagnstico a otro paciente, las probabilidades p y q se mantienen
iguales y constantes y el espacio muestral formado por este segundo caso es
O

= {(+ , +) (+ , -), (- , +), (- , -)}

con P( +, +) = p
2
; P( +, -) = P( -, +) = p.q y P( - -) = q
2
. (

TP: Total de positivos; TN:
Total de negativos).
Se cumple que P(O) = p
2
+p.q +q.p + q
2
=(

p + q

)
2
= 1. Lo anterior se cumple pues la
ocurrencia de un resultado no incide en el siguiente ni es influenciado por el anterior.

Observaciones.

1. La probabilidad de que ocurra un evento seguro es una certeza y vale 1.

1 ) ( = O P

2. La probabilidad de un evento imposible o nulo es cero, es decir,
0 ) ( = | P
De (1) y (2) se dice que 1 ) ( 0 s s A P

3. Si A y B son dos eventos cualesquiera, entonces la probabilidad de que tenga lugar
uno de los dos eventos, es:

) ( ) ( ) ( ) ( B A P B P A P B A P + =

4. Si A y B son eventos mutuamente excluyentes, entonces:

) ( ) ( ) ( B P A P B A P + = | = B A

5. Si B Ac entonces ) ( ) ( B P A P s

6. Si A
1
, A
2
,..., A
n
son eventos excluyentes o disjuntos dos a dos, es decir | =
j i
A A
j i = , entonces:
) ( .... ) ( ) ( ) ... (
2 1 2 1 n n
A P A P A P A A A P + + + =

7. Para tres eventos A, B y C cualesquiera,

) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( C B A P C B P C A P B A P C P B P A P B A P + + + =

Probabilidades y distribuciones de probabilidad..

8. Si A y A' son dos eventos complementarios, entonces:
1 ) A P( P(A) = ' + ) A P( - 1 P(A) ' =

Ejemplo 2.7. Los empleados de una cierta compaa han elegido a cinco de ellos para
que les representen en el consejo administrativo y de personal sobre productividad. Los
perfiles de los cinco elegidos son:

1. hombre edad 30
2. hombre 32
3. mujer 45
4. mujer 20
5. hombre 40

Este grupo decide elegir un vocero, la eleccin se efecta sacando de un sombrero uno
de los nombres impresos. Nuestra pregunta es, cul es la probabilidad de que el vocero
sea mujer o cuya edad est por arriba de 35 aos?-

Utilizando el teorema 1, podemos establecer la respuesta a nuestra pregunta como:

P(mujer o mayor de 35 aos) = P(mujer) + P(mayor de 35 aos) - P(mujer y mayor
de 35) =
=
5
2
+
5
2
-
5
1
=
5
3



Ejemplo 2.8. Suponga que en un sorteo la probabilidad de ganar el primer premio es
2/5 y la de ganar el segundo premio es 3/8. Si la probabilidad de ganar al menos uno de
los 2 premios es 3/4, calcular la probabilidad de ganar:
a) slo uno de los dos premios,
b) ninguno de los dos premios.

Solucin.
Sean los eventos: A: " ganar el primer premio" y B: "ganar el segundo premio".
Se tiene P(A) = 2/5 , P(B) = 3/8 , y P(AB) = 3/4.
Sustituyendo estos valores en: ) ( ) ( ) ( ) ( B A P B P A P B A P + =
Resulta:
40
1
4
3
8
3
5
2
) ( = + = B A P

Las probabilidades de cada una de las partes de O se indican en la figura siguiente:






O
A B





A

B

Probabilidades y distribuciones de probabilidad..

a) la probabilidad de ganar slo uno de los dos premios es:
| |
40
29
40
14
40
15
) ( ) ( = + = ' ' B A B A P

b) La probabilidad de no ganar ninguno de los premios es:
| |
40
10
) ( = ' ' B A P

Ejemplo 2.9. En un concurso para auxiliar de la ctedra de Bioestadstica se presentan 3
candidatas. La primera: A por ser profesional tiene dos veces ms posibilidades de
ganar que una alumna avanzada B. Y esta a su vez el triple de ganarle a C que es de otra
especialidad. Se pide calcular las respectivas probabilidades de ganar y la probabilidad
de que A no gane.

Solucin.
- Si P( C) = p entonces P(B) =3 P( C) = 3p y P(A) = 2 P(B) = 6 p
El evento seguro es que alguna de las tres va a ganar:
1 = P(A) + P(B) + P( C) = 6p + 3p + p = 10p
Y no es posible que gane ms de una, por lo tanto los tres eventos son mutuamente
excluyentes.
De donde se obtiene p =1/10 y con eso se pueden obtener:
P(A) = 6/10; P(B) =3/10 y P( C) = 1/10


- La probabilidad de que no gane A es igual a la de que ganen B o C. Esto es:

P(A) =1 P(A)= 1 - 6/10 = 4/10 =0.4

o P(B U C) = P( B) + P( C) = 3/10 + 1/10 = 4 / 10 = 0.4

2.3.3. ndices clnicos como probabilidades.
Sean los cuatro eventos posibles al efectuar un diagnostico:

Tabla 2.1. Eventos posibles al realizar un diagnostico o tabla de diagnostico.
Diagnstico verificado
Test clnico Enfermo: C
1
Sano: C
2

Total


(

+

) VP: verdadero positivo FP: falso positivo

TP:

(

-

) FN: falso negativo VN: verdadero negativo

TN


Total

TE

TS


N

Donde N es el nmero de sujetos investigados y

TP = vp +fp: Total de sujetos diagnosticados positivos
TN = vn +fn: Total de sujetos diagnosticados negativos
Probabilidades y distribuciones de probabilidad..

TE = vp +fn: Total de sujetos enfermos,
TS = fp +vn: Total de sujetos no enfermos (sanos).

La tabla 2.1 es un Diagrama de Venn, donde los eventos sano C
2
y enfermo C
1

particionan al universo, igual que positivo y negativo. Y a su vez, los cuatro eventos
posibles VP, FP, VN, FN tambin particionan al universo. Notar que si el evento es VP
su valor observado o medido es la frecuencia vp, y lo mismo con los tres casos
restantes.

FP =(

C
2
TP ) VP =(

C
1
TP ) FN =(

C
1
TN ) VN =(

C
2
TN )

P(VP) = nmero de casos posibles / nmero total de casos

P(C
1
) = TE / N = p es la probabilidad llamada la prevalencia de la enfermedad.

Por lo tanto el cociente entre ambas probabilidades ser:

Sensibilidad (S) = vp / TP = P(VP )/ P( C
1
)
De donde se deduce que la sensibilidad es un cociente de probabilidades. Anlogamente
para la especificidad (E) = vn / TS, pues:

P(VN) = vn

/

N y P(

C
2
)=TS

/

N es igual al complemento de la prevalencia; o sea que el
cociente entre ambas probabilidades ser la Especificidad = P(VN)

/

P(

C
2
)

Puede verse que los ndices clnicos principales S y E son en realidad un cociente de
probabilidades, cuyo significado se explicar mejor en secciones posteriores. Lo mismo
ocurre con los valores predictivos. En efecto:

P(TP) = TP/N y por su lado P(TN) = TN / n

Valor predictivo de positivos: VPP = P(VP) / P(TP) = (vn

/

N) / (TP

/

N) = vp

/

TP

Valor predictivo de negativos: VPN = P(VN) / P(TN) = (vn

/

N) / (TN

/

N) = vn

/

TN

Por su parte la Eficiencia (A) se puede obtener con la unin de dos tipos de xitos:

P(n de xitos)

=

A

=

P(VP U VN

) = P(VP) + P(VN) = (vp

/

N) + (vn

/

N) = (vp

+

vn)

/

N

En resumen, mientras que la prevalencia y eficiencia son probabilidades simples y
directas, los ndices tales como la sensibilidad, especificidad y valores predictivos son
un cociente de probabilidades directas.


2.3.4. Odds.
Este concepto, que no tiene an una traduccin del idioma ingles, se puede definir como
un cociente de probabilidades de la manera siguiente:

Odds: es el cociente entre la probabilidad de ocurrencia de un evento A y la de su
complemento.
Odds = P(A) / P(A) = P(A) / [1 - P(A)]
Probabilidades y distribuciones de probabilidad..


Se pueden definir tipos de Odds como los de Enfermos o Sanos con:

Odds de enfermos = P(Enfermo) / P(Sano)
Si se considera a la poblacin total, entonces la Prevalencia de la enfermedad es la
cantidad de enfermos que est tiene y la relacin anterior se puede expresar como:





Proporcin de enfermos: es la probabilidad de contraer la enfermedad (Prevalencia)

Se puede encontrar la relacin siguiente:

Prevalencia = P(E ) = TE / N = TE / (TS + TE) (TE / TS ) / [1 + (TE / TS)]




Para entender el significado clnico de estos conceptos se dan algunos ejemplos como
sigue:

Caso 1. Si la probabilidad de enfermos (Prevalencia) es de 0.8, entonces la probabilidad
de no enfermarse (1- prevalencia) ser de 0.2. Por lo tanto, el Odds de enfermos es 4 a
1, lo que significa que hay 4 chances entre 5 de enfermarse.

Caso 2. Si se sabe que el Odds de enfermedad es de 5 a 1, entonces la prevalencia (o
riesgo) se puede calcular como p

= 5

/

(1

+

5) = 5

/

6 = 0.83

Caso 3. Si se tiene una sensibilidad del 60% y una especificidad del 80%. Se pueden
calcular sus respectivos Odds con:

Odds de sensibilidad = S / (1 S) = 0.6 / 0.4 = 1.5

Odds de especificidad = E / (1 E) =0.8 / 0.2 = 4.

El producto de ambos Odds ser igual a 6. Por otro lado, se pueden calcular los
Likelihood ratios (razones de verosimilitud):

Likelihood Ratio de positivos: LR

+ = S / (

1


E

) = 0.6 /

(1 - 0.8) = 0.6 /

0.2 = 3
Likelihood Ratio de negativos: LR

- = (

1


S

) / E =

(1 - 0.8) / 0.8 = 0.4 /

0.8 = 0.5

Entonces, el cociente de ambos Likelihood Ratios es igual al producto de los Odds de
Sensibilidad y Especificidad. En efecto,
LR

+ /

LR

- = S

x

E / [(1 - S) (1

-

E)] = Odds sensibilidad x Odds especificidad = 6 =
Odds ratio

A este ndice se lo denomina Odds ratio y se lo puede entender como un cociente entre
el producto de los xitos, dividido el producto de los fracasos.
Odds de enfermos = Prevalencia / [1 - Prevalencia]
Prevalencia = Odds / (1 + Odds)
Probabilidades y distribuciones de probabilidad..

2.3.5. Probabilidad condicional.
A la probabilidad de que ocurra un evento B luego de que ha sucedido un evento A , se
se llama "probabilidad condicional" y se escribe P(B/A). Est expresin, se lee: "
probabilidad de que B ocurra dado que ocurri A.

Definicin. La probabilidad condicional de B, dado A, se define

) (
) (
) / (
A P
B A P
A B P

= , si 0 ) ( > A P


Ejemplo 2.10. En un estudio sanitario se ha llegado a la conclusin de que la probabilidad de
que una persona sufra problemas coronarios es el 0.10. Adems, la probabilidad de que una
persona sufra problemas de obesidad es el 0.25 y la probabilidad de que una persona sufra a
la vez problemas de obesidad y coronarios es del 0.05. Calcular la probabilidad de que una
persona sufra problemas coronarios si est obesa.

Solucin. Definamos los siguientes eventos:
A: Que una persona sufra problemas coronarios
B: Que una persona sufra problemas de obesidad
A B: Que una persona sufra a la vez problemas coronarios y de obesidad.

P (A B ) = 0.05 P (B) = 0.25
Entonces, P (A /B) = 0.05 / 0.25 = 0,20
2.3.5.1. Regla de la multiplicacin de probabilidades.

Teorema 1. Si en un experimento pueden ocurrir los eventos A y B, entonces

) / ( ) ( ) ( A B P A P B A P =

As, la probabilidad de que se presenten ambos es igual a la de que se d A multiplicada
por la de que ocurra B, dado que ocurri A.

Tambin se puede escribir: ) / ( ) ( ) ( B A P B P A B P =


Teorema 2. Si en un experimento, los eventos A
1
, A
2
,..., A
K
, pueden ocurrir, entonces:

) ... / ( )... / ( ) / ( ) ( ) ... (
2 1 2 1 3 1 2 1 3 2 1 K K k
A A A A P A A A P A A P A P A A A A P =


Probabilidades y distribuciones de probabilidad..

Ejemplo 2.11. El resultado de la evaluacin nutricional de 100 nios, se da a
continuacin:

Diagnstico
Nutricional
Nmero de
nios
Normal
Desnutrido
60
40
Total 100
Si de este grupo, seleccionamos dos
nios al azar sin reposicin, Cul es la
probabilidad de que el primer nio sea
normal y el segundo sea desnutrido?.-


Solucin. Definamos los siguientes eventos:
A: Que el primer nio sea normal
B: Que el segundo nio sea desnutrido
A B: Que el primer nio sea normal y el segundo desnutrido
B / A : Que el segundo nio sea desnutrido dado que el primer fue normal

De acuerdo a la regla de la multiplicacin de probabilidades se tiene:

24 . 0 ) 99 / 40 ( ) 100 / 60 ( ) / ( ) ( ) ( = = = A B P A P B A P

2.3.6. Independencia.
Se dice entonces que dos eventos son independientes cuando la ocurrencia de uno de
ellos, no modifica la ocurrencia del otro, ni esta influenciado por este. Si se realiza una
serie de pruebas repetidas, las pruebas son independientes, cuando el resultado de una
de ellas no est influenciado por el resultado de la prueba anterior, ni tampoco
influenciar el resultado de la prueba siguiente.

Se dice que dos eventos A y B son independientes cuando la probabilidad de que ambos
ocurran es igual al producto de sus probabilidades mutuas (independencia estadstica).
O sea:
Si se cumple, ) ( ) ( ) ( B P A P B A P = entonces son independientes.

- Se puede generalizar con: Sean k eventos A
1
, A
2
,..., A
K
todos independientes entre s,
entonces se cumple que:
) ( ) ( ) ( ) ( ) ... (
3 2 1 3 2 1 K k
A P A P A P A P A A A A P =

Si se realiza una prueba k veces, donde cada resultado es un evento independiente de los
dems, la probabilidad de ocurrencia de un resultado comn a todos ellos es el producto
de sus probabilidades.

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.12. En un grupo de diez de dos aos de edad, siete estn vacunados contra
una enfermedad especfica y tres no lo estn. Si se eligen dos nios al azar, cul es la
probabilidad de que el primero est vacunado y el segundo tambin lo est? , si:
a) La eleccin se hace con reposicin,
b) La eleccin se hace sin reposicin.

Solucin. Empecemos definiendo los siguientes eventos:
A: El primer nio elegido est vacunado
B: El segundo nio elegido est vacunado

a) Si la eleccin es con reposicin, tenemos:
P(A) = 7 /10 (es la probabilidad que el primer nio elegido est vacunado)
P(B) = 7 /10 (es la probabilidad que el segundo nio elegido est vacunado)
P(B

/

A) = 7/10 (es la probabilidad que el segundo nio elegido est vacunado
dado que el primer nio tambin lo estuvo)

Por consiguiente: 49 . 0 100 / 49 10 / 7 10 / 7 ) / ( ) ( ) ( = = = = A B P A P B A P

Como vemos, el haber elegido en primer lugar un nio vacunado no afecta la
probabilidad de que el segundo nio elegido sea vacunado, es decir se cumple:

) ( ) / ( B P A B P =
Tambin, la probabilidad de que ambos nios elegidos sean vacunados cumplen
con la regla:
) ( ) ( ) ( B P A P B A P =
Luego se dice que los eventos A y B son independientes.


b) En cambio, si la eleccin es sin reposicin se tiene:

P(A)

=

7

/

10, P(B

/

A) = 6

/

9

Por lo tanto
90 / 42 9 / 6 10 / 7 ) / ( ) ( ) ( = = = A B P A P B A P (1)

Adems, se tiene que:
100 / 49 10 / 7 10 / 7 ) ( ) ( = = B P A P (2)

De (1) y (2) se tiene que:
) ( ) ( ) ( B P A P B A P =

Por consiguiente los eventos A y B no son independientes.





2.3.7. Teorema de Probabilidad total y de Bayes.

Probabilidades y distribuciones de probabilidad..

Teorema 1. (Probabilidad total)
Si los eventos B
1
, B
2
, ... , B
k
constituyen una particin del espacio muestral O, de tal forma
que P(B
i
) >0 para i =1, 2, ..., k, entonces para cualquier evento A en O,

=
=
K
i
i i
B A P B P A P
1
) / ( ) ( ) (

Ejemplo 2.13. En una sala de una clnica especializada solo se tratan tres tipos de
enfermedades. Se sabe que en promedio ingresan un 50% de pacientes con la afeccin
K, 30% con la enfermedad L y el resto con la afeccin M (datos obtenidos con las
estadsticas de los ltimos dos aos). Realizando un relevamiento de historias clnicas se
dedujo que un 70% de los ingresados con la enfermedad K se curan, mientras que para
L y M, se obtuvieron 80% y 90% respectivamente. Cul es la probabilidad que se haya
dado de alta a un paciente?

Solucin.
a) Sean: B
1
: pacientes con la enfermedad K , P(

B
1
) = 0.5 y la P(C

/

B
1
) = 0.7
B
2
: pacientes con la enfermedad L , P(

B
2
) = 0.3 y la P(C

/

B
2
) = 0.8
B
3
: pacientes con la enfermedad M , P(

B3) = 0.2 y la P(C

/

B
3
) = 0.9
C : pacientes curados y dados de alta
C

/

B
i
: pacientes curados y dados de alta que se internaron con la afeccin i.


P(C

/

B
1
) = 0.7 C
B
1
P(B
1
) = 0.5 C


P(C

/

B
1
) = 0.8 C
P(B
2
) = 0.3 B
2

C



P(B
3
) = 0.2 P(C

/

B
1
) = 0.9 C
B
3
C



Luego la probabilidad de que el paciente sea dado de alta es:

0.77 9 . 0 0.2 0.8 0.3 0.7 0.5
) )P(C/B P(B ) )P(C/B P(B ) )P(C/B P(B P(C)
3 3 2 2 1 1
= + + =
= + + =



Como una consecuencia del teorema anterior, haciendo substituciones adecuadas, se
obtiene el otro teorema. En efecto, de la definicin resulta:

/A) P(B P(A) A) P(B ) B P(A ) P(A/B ) P(B
i i i i i
= = =
Probabilidades y distribuciones de probabilidad..

Despejando,
{ } P(A) / ) / ( ) ( /A) P(B
i i i
B A P B P =

Y reemplazando P(A) con el teorema de probabilidad Total, se obtiene el Teorema de
Bayes.


Teorema 2. (Regla de Bayes)

Si los eventos B
1
, B
2
,..., B
k
constituyen una particin del espacio muestral O, de tal
forma que P(B
i
) >0 para i =1, 2, ..., k, entonces para cualquier evento A en O tal que
P(A) >0,

=
k
1 i
i i
i i
i
) B P(A / ) P(B
) B P(A / ) P(B
A) / P(B

Donde:
P(B
i
) : son las llamadas probabilidades a priori por ser las que tienen los
eventos B
i
antes de saber que ha ocurrido el evento A.

P(A B
i
) : son las probabilidades conjuntas.

P(A / B
i
) : son las probabilidades condicionales

P( B
i
/ A) : son las llamadas probabilidades a posteriori porque son las que
tienen los eventos B
i
, luego de saber que ha ocurrido el evento A.

Ejemplo 2.14. Con respecto al ejemplo 2.13, En la fecha, se dio de alta a un paciente:
Cul es la probabilidad que se haya internado por la enfermedad K

?

Solucin. Mediante la frmula de Bayes, tenemos:

4546 . 0
77 . 0
35 . 0
0.9 0.2 0.8 0.3 0.7 0.5
0.7 0.5

) B P(A / ) P(B ) B P(A / ) P(B ) B P(A / ) P(B
) B P(A / ) P(B
/A) P(B
3 3 2 2 1 1
1 1
1
= =
+ +

=
+ +

=


Esto es, la probabilidad de que el paciente dado de alta haya ingresado con la
enfermedad K es de 0.4546.

Ejercicio. En una bioterio existen tres razas de ratones (R 1
, R 2
, R 3
) en las
proporciones: 25%, 30% y 45% respectivamente. Sabemos que cierta enfermedad ataca
al 5% de los ratones de la raza R
1
, al 10% de R
2
y al 15% de los de R
3
. se elige un
ratn al azar. Si el ratn elegido est afectado de la enfermedad, Cul es la
probabilidad de que sea de la raza R
3
?.

Probabilidades y distribuciones de probabilidad..

2.4. Diagnstico y el Teorema de Bayes.

Los cuatro casos posibles al efectuar un diagnstico, basndose en la evidencia
suministrada por el resultado de un anlisis clnico, fueron presentados en la Tabla 2.1
(apartado 2.3.3). A la luz de los nuevos conceptos, conviene volver a revisar tal
deduccin, pero tratando de entender el significado de los ndices clnicos, usando el
concepto de la probabilidad condicional.

VPP: Se calcula con la formula del Teorema de Bayes. O sea, es una
probabilidad bayesiana a posteriori y se puede imaginar como la probabilidad de
diagnosticar al paciente en forma correcta un resultado positivo, sabiendo que el
resultado de su anlisis dio +. Permite discriminar de entre todos los resultados
positivos, la fraccin de resultados correctos.
) / ( P
) P(
) P(
2
1 i
i
1
TP B
TP B
TP B
VPP
i
=

=


) / ( P
) / P( ) P( ) / P( ) P(
) / P( ) P(
1
2 2 1 1
1 1
TP B
B TP B B TP B
B TP B
VPP =
+

=

Sensibilidad : es la probabilidad condicional ) / ( P
1
B TP de que un paciente sea
diagnosticado como enfermo, cuando se sabe que en realidad est enfermo.

Prevalencia : es la probabilidad de enfermarse P(B
1
). O sea, es la probabilidad de
encontrar la enfermedad en la poblacin.

Sensibilidad

Prevalencia : El producto de ambos ndices es ) ( P
1
TP B , una
probabilidad conjunta que significa, la probabilidad de que un paciente este enfermo y
al mismo tiempo su diagnstico haya dado positivo. Difiere del concepto anterior, pues
no se parte de un hecho condicionante conocido. Es la probabilidad de obtener un
verdadero positivo.

) ( P ) / ( P ) ( P ) ( P
1 1 1
C C TP TP C a prevalenci ad Sensibilid VP = = =

Especificidad : Es la probabilidad condicional ) / ( P
2
C TS de que un paciente sea
diagnosticado como sano, cuando se sabe que en realidad est sano.

Probabilidad de estar sano: Es el complemento de la Prevalencia ) ( 1 ) (
1 2
C P C P = .
Adems:

TS TS TS N TS N C FP C TP C C TP / ) n v ( / p f ) / /( ) / n f ( ) ( P / ) ( P ) ( P / ) ( P ) / ( P
2 2 2 2
= = = = =

) dad especifici 1 ( / n v 1 ) / ( P
2
= = TS C TP : Complemento de Especificidad

Entonces, ) dad especifici 1 ( ) a prevalenci 1 ( ) / ( P ) ( P
2 2
= C TP C

O bien, ) ( P ) 1 ( ) Pr 1 ( ) ( P
1
FP dad Especifici evalencia TP C = =
Probabilidades y distribuciones de probabilidad..


El Teorema de Bayes para los ndices clnicos se puede escribir como:

| |
| | | | ) dad Especifici 1 )( evalencia Pr 1 ( ad Sensibilid evalencia Pr
ad Sensibilid evalencia Pr
+

= VPP
2.4.1. Odds a posteriori.

Aplicando el Teorema de Bayes a los nueves ndices clnicos, se pueden calcular los
Odds a posteriori. Esto es, el Odds de la enfermedad luego de hacer el test clnico. Ya
sea que los resultados encontrados modifiquen o no los Odds a priori disponibles. Esto
se usa cuando hay un dilema en el diagnstico a efectuarle al paciente y no se est
seguro de cmo proceder. Es virtualmente imposible recordar la Sensibilidad y
Especificidad de cada test clnico efectuado para hacer un diagnstico. Sin embargo,
cuando hay un dilema con el diagnstico a efectuar, es muy til usar la informacin de
Sensibilidad, Especificidad, LR+, LR- y los Odds a priori como gua a seguir. En
especial cuando se hacen varios tests clnicos en secuencia y el Odds a posteriori del
primero, se usa como a Odds a priori para la segunda prueba clnica y as
sucesivamente. Un cuidadoso anlisis de la informacin contenida en un Odds a priori,
arroja luz sobre cual debera ser el paso siguiente hacia el diagnstico. O sea, cul
debera ser la prueba clnica a ordenar.

Como se vio en la seccin 2.3.4, el Odds de la enfermedad se calcula como el cociente
entre la probabilidad de la enfermedad y su complementaria. Como esta informacin se
dispone al armar la tabla de decisin para el diagnstico, se define como:

Odds a priori = TE / TS (para la enfermedad)

El Odds a posteriori se calcula con el Odds del valor predictivo de positivos:
Odds a posteriori = VPP / (1 VPP), simplificando la expresin resulta:

a) Prevalenci (1
a Prevalenci
dad) Especifici (1
ad Sensibilid
a) Prevalenci (1 dad) Especifici (1
a Prevalenci ad Sensibilid
posteriori a Odds

=


=





Concepto mucho ms sencillo a recordar y usar que el Teorema de Bayes. El uso de los
Odds a posteriori tanto en el caso de positivos como de negativos, se ejemplifica a
continuacin:


Ejemplo 2.15. Para diagnosticar una enfermedad en la arteria coronaria, un cardilogo
realiza un test de tolerancia a un ejercicio fsico programado. De sus historias clnicas
con resultados verificados escoge a 147 pacientes con problemas coronarios y los
clasifica de acuerdo a su diagnstico, junto con el estado real que se pudo verificar
despus. De esta forma, arma una Tabla de diagnstico para ver que tan bien trabaja
(datos tomados del trabajo de Simel). Los resultados fueron:


Probabilidades y distribuciones de probabilidad..









Enfermedad Coronaria

Test de tolerancia al
ejercicio fsico.

Si


No

Total


(

+

) 73 9

82

(

-

) 28 37

65


Total

101

46


147

Se pueden calcular los principales ndices clnicos como:

Sensibilidad = vp

/

TE = 73

/

101 = 0.72

Especificidad = vn

/

TS = 37

/

46 = 0.80

LR

+ = Sensibilidad / (1

-

Especificidad) = 0.72 / 0.2 = 3.6

LR

- = (1


Sensibilidad) / Especificidad) = 0.28 / 0.80 =0.35

Prevalencia = TE / N = 101 /147 = 0.69

Eficiencia =

(vp + vn)

/

N = (73 + 37) /147= 0.75

PPV= vp / T+ = 73 / 82 = 0.89

NPV= vn / T- = 37 / 65 = 0.57


Ejemplo 2.16. Luego de este trabajo, viene un paciente de 52 aos de edad que tiene
antecedentes familiares importantes de enfermedades coronarias y presenta los sntomas
de una tpica angina inducida por esfuerzo. Se desea saber si el test de tolerancia al
ejercicio fsico influir en el diagnstico. El cardilogo estima en un 89% la sospecha
de que tenga esta enfermedad y usando la informacin obtenida en el ejemplo anterior,
calcula:
Solucin.
Su estimacin de un 80% implica un Odds de enfermedad = 0.80/0.2 = 4, es decir, 4 a 1
de que tenga la enfermedad. Y usando sus antecedentes vistos en el ejemplo anterior
como referencia poblacional, deduce que:

- Si el paciente da (+) con el test, el Odds a posteriori ser de 4 x 3.6

=

14.4 su
chance de estar enfermo. Esto implica que el Odds sube de 4 a 1 hasta 14.4 a 1
(o sea, de un 80% a un 93.5%).
- Si el paciente da (-) con el test, el Odds a posteriori ser de 4 x 0.35

=

1.4. Esto
implica que el Odds baja de 4 a 1 hasta 1.4 a 1 (o sea, de un 80% a un 58%).

Probabilidades y distribuciones de probabilidad..

Se concluye que un resultado (+) no influye mucho en el diagnstico de enfermedad
coronaria y adems, un resultado (-) tampoco aade mucha ms informacin. Por lo
tanto, no conviene indicarle que se haga un test de tolerancia al ejercicio fsico porque
no ayuda mucho al diagnstico. La probabilidad pre-test no varia demasiado y no
agregar informacin importante.


Ejemplo 2.17. Otro hombre de 52 aos de edad, robusto en apariencia tiene dolores en
el pecho desde hace unos meses. No encuentra relacin entre dolor y esfuerzo fsico,
adems carece de los sntomas asociados. Puede un test de tolerancia al ejercicio fsico
ser de utilidad para diagnosticar una enfermedad coronaria, al sospechar que el dolor es
una seal de una angina no tpica?. Se sabe de los libros de texto que la Prevalencia para
una angina no tpica es del 48%.

Solucin.
La estimacin de un 48% implica a priori un Odds de 0.92 a 1 de que tenga una angina
no tpica. Los LR no varan porque Sensibilidad y especificidad no dependen del
paciente sino de la poblacin tomada como referencia. Usando la informacin contenida
en el ejemplo 2.15 como referencia, se deduce que:

- Si el paciente da (+) con el test, el Odds a posteriori ser de 0.92 x 3.6

=

3.3. Esto
implica que el Odds sube de 0.92 a 1 hasta 3.3 a 1 (o sea, de un 48% a un 77%).

- Si el paciente da (-) con el test, el Odds a posteriori ser de 0.92 x 0.35

=

0.32.
Esto implica que el Odds baja de 0.92 a 1 hasta 0.32 a 1 (o sea, de un 48% a un
24%).

Se concluye que un resultado (+) o (-) influye mucho en el diagnstico de enfermedad
coronaria. Por lo tanto, conviene indicarle que se haga un test de tolerancia al ejercicio
fsico porque sera de gran ayuda para el diagnstico. En este caso la informacin pre-
test resultar enriquecida y se ve la conveniencia de efectuar el ejercicio a la tolerancia
fsica en ese paciente.

2.4.2. ndices de riesgo o dao.

En la problemtica del contagio cabe mencionar a dos reas en particular: los estudios
sobre infecciones de tipo hospitalaria y sobre la inmunodeficiencia humana con el virus
tipo 1 (HIV-1). Muchas investigaciones se estn realizando para estudiar la historia
natural de la HIV-1 y los factores asociados con el desarrollo de la adquisicin del
sndrome de esta (SIDA). Por su parte, ya es aceptado universalmente que las
infecciones hospitalarias no son causadas por un nico factor de riesgo, sino que se
originan en una compleja interaccin entre factores relacionados con el infectado, el
agente infeccioso y el medio ambiente que lo rodea. En esta seccin se presentan las
medidas de asociacin ms usuales en este tipo de estudios: el riesgo relativo (relative
risk) y la eficacia (Odds ratio), en su forma ms elemental, aplicados a diseos con
tablas de contingencia de 2

x

2, dejando la regresin logstica para estudios ms
avanzados.

Los resultados obtenidos en las cuestiones de terapia, daos y prognosis se pueden
agrupar en una tabla de riesgo como se muestra a continuacin:

Probabilidades y distribuciones de probabilidad..







Tabla 2.2. Tabla de riesgo
Resultados observados
Factor de riesgo Enfermos

Sanos Total
Expuesto a b a + b
No expuesto c d c + d

Total

a + c

b + d

N

Donde:
N = a + b + c + d : Total de sujetos investigados.
a + b : Total de sujetos expuestos al factor de riesgo, inmunizados, o protegidos.
c + d : Total de sujetos no expuestos, o bien sin inmunizar o sin proteger.
a + c : Total de sujetos enfermos, o que poseen la condicin buscada.
b + d : Total de sujetos no enfermos (sanos), o que no poseen la condicin buscada.
a / (a + b ) : Es el riesgo de tener la enfermedad en aquellos sujetos expuestos al factor.
c / (c + d ) : Es el riesgo de tener la enfermedad en aquellos sujetos no expuestos al factor.

Usando la informacin de esta tabla se pueden calcular los dos ndices clnicos bsicos
para poder cuantificar el concepto de riesgo o dao:

Odds Ratio (OR)
1
: El Odds Ratio se define como el cociente entre dos Odds, el
numerador es el Odds de un evento (ocurrencia de la enfermedad o la aparicin del
sntoma (efecto) buscado en la investigacin) en el grupo de individuos expuestos,
dividido por el Odds del mismo evento entre los individuos no expuestos.


1
Odds Ratio, su traduccin al espaol tiene mltiples nombres como: Razn de productos cruzados,
razn de disparidades, razn de predominio, razn de oposiciones, oposiciones de probabilidades
contrarias, cociente de probabilidades relativas, oportunidades relativas (Determinaciones de factores de
riesgo).
Probabilidades y distribuciones de probabilidad..

c b
d a
d c
b a
OR

= =
/
/



a

/

b y c

/

d son considerados como los
Odds a favor de la ocurrencia de un
evento.
Caractersticas del OR:
No tiene dimensiones.
Rango de 0 a infinito.
OR = 1 si no hay asociacin entre la presencia del factor y la enfermedad.
OR > 1 si la asociacin es positiva. Indica que existe un incremento del riesgo de
presentacin del evento entre los expuestos al factor, en este caso se denomina Factor
de Riesgo. OR < 1 si la asociacin es negativa. Indica un descenso del riesgo de
presentacin del evento entre los expuestos al factor, en este caso el factor se denomina
Factor de Proteccin.

Si se trata de un estudio del tipo caso-control, generalmente el RR no puede calcularse y
se necesita del OR como medida de asociacin entre ambos factores analizados.


Riesgo Relativo (RR): Compara la frecuencia con que ocurre un evento (enfermedad o
aparicin del sntoma) entre los que tienen expuesto el factor de riesgo y los que no
tienen.
El RR se estima mediante el cociente entre la incidencia (I) en los expuestos al factor de
riesgo y la incidencia en los no expuestos.

) (
) (
) /(
) /(
expuestos no
expuestos
b a c
d c a
d c c
b a a
I
I
RR
+
+
=
+
+
= =

El RR toma valores entre 0 a infinito. Si RR = 1 significa que no hay asociacin entre
la presencia del factor y el evento. El RR solo puede ser estimado con estudios
prospectivos.
RR: Mide la fuerza de asociacin entre la exposicin del factor y la enfermedad.
Indicando la probabilidad de que se desarrolle la enfermedad en los expuestos a un
factor de riesgo en relacin al grupo de los no expuestos.


Los estudios epidemiolgicos pueden ser clasificados como sigue:

Experimentales (ensayos clnicos: Clinical trials o RCT)
Estudios
Por Cohorte
Observacionales
Caso Control

En los estudios experimentales, el investigador controla ciertos factores escogidos que
podran tener alguna importancia en el desarrollo de la enfermedad. Las ms comn es
que se manipule el factor (por ejemplo la aplicacin de una vacuna en estudios
inmunolgicos, etc).

Probabilidades y distribuciones de probabilidad..

En los estudios observacionales el investigador no manipula los factores, estos ocurren
en forma natural. Los estudios por Cohorte enrolan a todos los individuos que
estuvieron expuestos a un agente a un agente de exposicin (por ejemplo HIV-1), tanto
como el seguimiento de la historia natural que tuvo la enfermedad en los individuos
(por ejemplo casos de SIDA). En cambio, en los estudios del tipo Caso-control, los
individuos son seleccionados en base a la exposicin para ver si resultaron enfermos o
no. El objetivo central de todos estos estudios, es la comparacin del riesgo y las
cuantificaciones de este concepto se hacen a travs de dos ndices el RR y el OR. En los
estudios por Cohorte y Ensayos clnicos, el RR puede calcularse directamente. En
cambio, el OR solo puede estimarse con estudios prospectivos como en el Caso-control,
donde RR no puede ser calculado.


Ejemplo 2.18. A 360 pacientes que tuvieron cesreas en sus partos, 170 de ellas
tuvieron una cateterizacin umbilical durante la ciruga y las dems no. Entre ellas se
observaron 60 que desarrollaron una bacteremia con 50 cateterizadas. Los datos se
presentan en la tabla siguiente:


Factor de riesgo
Resultados observados
Infectados

No infectados Total
cateterizacin 50 120 170
No cateterizacin 10 180 190

Total

60

300

360

En este caso el Odds de enfermarse en las cateterizadas es de 50 versus las 120 que no
se infectaron, o sea 50

/

120 = 0.42. Mientras que el Odds de infectarse en las no
cateterizadas es de 10 versus las 180 que no se enfermaron, esto es 10

/

180 = 0.056.
Por lo tanto, el cociente entre estos dos Odds resulta:

5 . 7
120 10
180 50
=

= OR
Esto significa que se tiene 7.5 veces ms posibilidad de conseguir la infeccin que de no
conseguirla, cuando se sufre de una cateterizacin umbilical con respecto a no sufrir de
una cateterizacin durante la cesrea.
Por su parte el RR muestra la proporcin del riesgo de enfermarse al cateterizadas, que
est an presente cuando las pacientes no fueron cateterizadas. En el ejemplo, el riesgo
de enfermarse al ser cateterizadas es de 50 casos entre las 170 en total (50

/

170),
mientras que el riesgo de enfermarse sin haber sufrido una cateterizacin es de 10 casos
entre las 190 en total (10 / 190).
Por lo tanto, el cociente entre ambos riesgos es:

6 . 5
190 / 10
170 / 50
= = RR

Esto significa que el hecho de sufrir una cateterizacin durante la cesrea incrementa el
riesgo de infectarse 5.6 veces. Intuitivamente, uno puede pensar que no conviene la
Probabilidades y distribuciones de probabilidad..

cateterizacin en cesreas, pero clnicamente se sabe que hay otros factores que pueden
producir una infeccin en una ciruga, los que deben ser analizados cuidadosamente si
lo que se busca es reducir el nmero de infectadas.

Ejercicio.- Supongamos que estamos interesados en estudiar, en un periodo
determinado, si la edad joven de la madre es un factor de riesgo del bajo peso al nacer.

Edad de la madre: 20 aos (Edad joven de la madre)
Peso al nacer: : 2500 gramos (bajo peso al nacer)

En dicha asociacin podra influir el nivel socio-econmico, y para controlarlo
solamente consideramos madres del nivel socio-econmico bajo.
De los registros disponibles de la Maternidad de Lima, en un determinado periodo,
seleccionamos una muestra sistemtica aleatoria de 200 historias, obtenindose los
resultados en la siguiente tabla. Se pide calcular e interpretar el Odds Ratio.


Edad de la madre
Peso al nacer

Total
2500 gramos

> 2500 gramos
20 aos 10 40 50
> 20 aos 15 1350 150
Total 25 175 200


2.5. Variables aleatorias.
Definicin. Una funcin X definida sobre un espacio muestral O, donde cada elemento
w e O le corresponde un nmero real x = X(w), se denomina variable aleatoria.
Una variable aleatoria puede ser:
- Discreta, si el rango de X es un conjunto finito o infinito numerable, es decir,
{ } ,..... ..., , ,
2 1 k X
x x x R =
- Continua, si el rango de X, R
X
, es un intervalo sobre la recta de los nmeros
reales.

Ejemplo 2.19. Sea el experimento que consiste en evaluar el estado nutricional
(N = Normal, D = Desnutrido) de tres nios menores de 5 aos elegidos al azar de
una comunidad. En esta situacin el espacio muestral puede escribirse as:

O

= {NNN, NND, NDN, NDD, DNN, DND, DDN, DDD}

Sea X: nmero de nios desnutridos que aparecen, entonces X as definida es una
variable aleatoria que toma los siguientes valores:

X(NNN) = 0
X(NND) =.X(NDN) = X(DNN) = 1
X(NDD) =.X(DND) = X(DDN) = 2
X(DDD) = 3

Probabilidades y distribuciones de probabilidad..

Luego R
X
= { 0, 1, 2, 3 }.

Ejemplo 2.20. Un lote de artculos grande contiene artculos defectuosos D, y no
defectuosos N. Se extrae sucesivamente artculos hasta lograr un artculo defectuoso y
definimos X como el nmero de extracciones. Determinar el rango de la v.a X.

Solucin.-







2.6. Distribuciones de Probabilidad de tipo discreto. Caracterstica. Aplicaciones.

2.6.1. Distribucin Binomial.

La distribucin binomial es una distribucin de probabilidad discreta aplicable como
modelo a diversas situaciones de toma de decisiones, siempre y cuando pueda suponerse
que el proceso de muestreo se ajuste a un proceso Bernoulli. Un proceso Bernoulli es un
proceso de muestreo en el que:

1) Slo son posibles dos resultados mutuamente excluyentes en cada ensayo u
observacin. Por conveniencia, a estos resultados se les denomina xito y
fracaso.
2) Los resultados del conjunto de ensayo u observaciones, constituyen eventos
independientes.
3) ) La probabilidad de xito, que se denota mediante p, permanece constante de un
ensayo a otro.

Puede utilizarse la distribucin binomial para determinar la probabilidad de obtener un
nmero determinado de xitos en un proceso Bernoulli. Se requieren tres valores: el
nmero especifico de xitos (X), el nmero de ensayos u observaciones (n) y la
probabilidad de xito en cada uno de los ensayos ( p). La frmula para determinar la
probabilidad de un nmero determinado de xitos X para una distribucin binomial es:

x n x
q p
x
n
x) P(X

|
|
.
|

\
|
= = , donde q = 1 - p

X = 0, 1, 2, , n

Teorema. Si X.~ B(n ,p), entonces,

a) np E(X) = = , b) p) np(1 V(X)
2
= =


Probabilidades y distribuciones de probabilidad..

Ejemplo 2.21. Suponga que en una poblacin el 51 por ciento de todos los nacimientos
son varones. Si de esta poblacin se selecciona aleatoriamente cinco registros de
nacimientos. Cul es la probabilidad de que:
a) Ninguno de los registros sea varn?.
b) Exactamente dos de los registros sean varones?.

Solucin.
Sea la variable aleatoria X: nmero de registros de nacimientos varones que pueden
ocurrir en 5 registros.
La distribucin binomial de esta variable queda definida como:

x 5 x
(0.49) (0.51)
x
5
x) P(X

|
|
.
|

\
|
= = R
X
= { 0, 1, 2, 3, 4, 5 }
Luego:
a) 0282 . 0 ) 49 . 0 ( 1 1 ) 49 . 0 ( ) 51 . 0 (
0
5
) 0 (
5 5 0
= =
|
|
.
|

\
|
= = X P

b) 306 . 0 117649 . 0 2601 . 0 10 ) 49 . 0 ( ) 51 . 0 (
2
5
) 2 (
3 2
= =
|
|
.
|

\
|
= = X P

Ejemplo 2.22. La proporcin de fumadores en una ciudad es 4 de cada 10 personas. Si
de esta ciudad se seleccionan aleatoriamente 10 personas, se pide:
a) Cul es la probabilidad de que al menos cuatro personas sean fumadores?-
b) Cul es la probabilidad de que a los mucho tres personas sean fumadores?-
c) determinar el nmero esperado de personas que fuman?

Solucin. Sea la v.a X: "nmero de fumadores que pueden ocurrir en 10 personas

x 10 x
(0.6) (0.4)
x
10
x) P(X

|
|
.
|

\
|
= =
X
= 0, 1, 2, 3, 4, ..., 10. Entonces X ~ B(15, 0.3)

a) Se pide encontrar 6177 . 0 4) P(X = >
b) 6331 . 0 3669 . 0 1 ) 5 ( P 1 ) 4 P(X = = > = s X
c) El nmero esperado de personas que fuman esta dado por: E(X) = n p = 10x0.4= 4.
2.6.2. Distribucin de Poisson.

La distribucin de Poisson fue desarrollado en Paris por el francs Simen Denis
Poisson (1781 - 1840), en los inicios del siglo XVII, como un caso particular de la
Binomial aplicado a los casos raros.

Se denominan procesos de tipo Poisson, o poissonianos, a todo experimento consistente
en una serie de pruebas repetidas dentro de un continuo (espacio o tiempo),
caracterizado por tener resultados que se pueden clasificar en si verifican o no, cierta
propiedad o atributo, siendo aleatorios e independientes del lugar que ocurren dentro del
espacio o tiempo.

Probabilidades y distribuciones de probabilidad..

Son ejemplos de este tipo de proceso, un recuento celular en cmara de Neubauer o
Homocitmetro, la llegada de pacientes a una cola o lnea de espera, los accidentes
ocurridos en una carretera, el nmero de piezas defectuosas por lote en un proceso de
produccin y muchos otros casos. Esta distribucin se aproxima a la Binomial cuando la
probabilidad de xito es muy pequea, por eso muchos la llaman: la Binomial de los
eventos o sucesos raros.

Para imaginar casos de la vida real donde se le puede encontrar, se debe considerar un
medio continuo como la sangre, orina, agua de mar o de ro, el aire, el tiempo, dentro
del cual ocurre un nmero total elevado de pequeas cantidades discretas tales como los
glbulos blancos, rojos o plaquetas en la sangre, residuos en orina, plancton en el agua
de mar, partculas de tierra en la de ro, ralladura de limn en la pasta de una torta, etc.

Otro modelo que produce casos poisson son los que ocurren en el tiempo, como las
llamadas telefnicas que llegan a la central telefnica de la UNP entre las 8 a.m a 12
a.m., emisin de partculas radioactivas, la demanda diaria de los pacientes esperando
ser atendidos en el hospital "Cayetano Heredia"- Piura, autos que llegan a una estacin
de combustible, etc. En estos casos, se debe suponer: (a) los eventos ocurren en forma
independiente, (b) la probabilidad que un evento ocurra en un corto intervalo de tiempo
sea proporcional a la longitud del intervalo, y (c) la duracin del evento es tan pequea
que hace insignificante a su probabilidad de ocurrencia. Entonces, si se cumplen estos
tres supuestos la probabilidad de que ocurran exactamente x eventos o sucesos en un
intervalo de tiempo finito es la de Poisson.

En trminos generales, cuando un proceso del tipo Poisson tiene una intensidad
promedio ( > 0) en el medio continuo, la probabilidad de que ocurran exactamente x
sucesos eventos, se obtiene con:

x!
e
x) P(X p(x)
x
= = = , x = 0, 1, 2, ... ,

donde es el promedio eventos para el tiempo o dimensin especifico de inters.


Un proceso es de tipo Poisson, cuando los eventos puntuales se producen individual o
colectivamente al azar dentro de un continuo (espacio o tiempo).

Teorema. Si X ~ P(), entonces: a) E(X) = b) V(X) =

Ejemplo 2.23. La escasez de glbulos rojos se puede determinar examinando al
microscopio una muestra de sangre. Suponiendo que un volumen pequeo determinado
contenga por termino medio 4 glbulos rojos en personas normales, cual es la
probabilidad de que una muestra de personas normales,
a) Contenga exactamente tres glbulos rojos
b) No tenga glbulos rojos?

Solucin.
a) Sea X el nmero de glbulos rojos que tiene una persona normal en un volumen
pequeo determinado.

Probabilidades y distribuciones de probabilidad..

X ~ P(), donde = 4 es el promedio de glbulos rojos. La distribucin de Poisson
quedar definida en este caso como:

x!
4 e
x) P(X
x 4
= = x = 0, 1, 2, ... ,

La probabilidad de que exactamente contenga 3 glbulos rojos en el volumen pequeo
determinado es:
1953 . 0
3!
4 e
) 3 P(X
3 4
=

= =



Utilizando la tabla de la distribucin probabilidad acumulada de poisson, se tiene:
195 . 0 238 . 0 433 . 0 ) 2 ( ) 3 ( ) 3 P(X = = s s = = X P X P


b) La probabilidad de que no tenga glbulos rojos es:

018 . 0
0!
4 e
) 0 P(X
0 4
=

= =




Ejemplo 2.24. Se sabe que en cierta rea de una ciudad el nmero promedio de
homicidios es de 4 por da. Suponiendo que el nmero de homicidios sigue una
distribucin de Poisson, encuentre la probabilidad de que en un da dado halla:
a) No ms de un homicidio.
b) Ms de dos homicidios

Solucin.
a) Se tiene que: 1) P(X 0) P(X ) 1 P(X = + = = s
Para encontrar el valor de esta probabilidad acumulada se utiliza la tabla de la
distribucin de Poisson acumulada, para

=

4 y X

=

1. Entonces el valor que le
corresponde a dicha probabilidad es:
091 . 0 ) 1 P(X = s

b) Se pide encontrar 2) P(X> .
0.762 0.238 - 1 2) P( - 1 2) P(X = = s = >


La distribucin de Poisson como una aproximacin de la distribucin binomial

En algunas ocasiones, si deseamos evitar la tediosa tarea de calcular distribuciones
binomiales de probabilidad, podemos utilizar la distribucin de Poisson. La distribucin
de Poisson puede ser una razonable aproximacin en forma de lmite de la Binomial
cuando el nmero de ensayos n es grande y la probabilidad p Binomial de tener xito es
pequea (Es decir, si n , 0 p y np permanece constante). De aqu que, si n es
grande y p es cercano a 0, la distribucin de poisson puede utilizarse, con np = , para
aproximar distribuciones binomiales.
Probabilidades y distribuciones de probabilidad..


La distribucin de Poisson es una buena aproximacin de la distribucin binomial
cuando n > 20 y p s 0.05. En los casos en que se cumplen esta condicin la formula de
Poisson resulta ser:
x!
(np) e
x) P(X
x np
= =

Ejemplo 2.25. Si la probabilidad de un individuo sufra una reaccin por una inyeccin
de un determinado suero es 0.01. Determinar la probabilidad de que de un total de 1000
individuos, ms de dos individuos sufran una reaccin.

Solucin.

Sea X el nmero de individuos que sufren una reaccin por una inyeccin de un suero
en los 1000 individuos. Los posibles valores de X son 0, 1, 2, 3,..., 1000 y se distribuyen
segn el modelo binomial: B(1000, 0.01), esto es:

x 1000 x
(0.99) (0.01)
x
1000
x) P(X

|
|
.
|

\
|
= = x = 0, 1, 2,..., 1000

La probabilidad de que ms de dos individuos tengan una reaccin por una inyeccin de
un determinado suero es:
00268 . 0 1 (0.99) (0.01)
x
1000
1 ) 2 P(X 1 ) 3 P(X ) 2 P(X
2
0
x 1000 x
=
|
|
.
|

\
|
= s = > = >

=

x

= 0.99732
Si utilizamos la distribucin de Poisson como aproximacin a la distribucin
binomial, se tiene: = np = 1000(0.01) = 10


x!
(10) e
(0.99) (0.01)
x
1000
x) P(X
x 10
x 1000 x

~
|
|
.
|

\
|
= =

Luego,
99723 . 0 00277 . 0 1 ) 2 P(X 1 ) 2 P(X = ~ s = >

Como podemos darnos cuenta, diferencia entre las dos distribuciones de probabilidad es
pequea.


2.7. Distribuciones de Probabilidad de tipo continuo.

2.7.1. Distribucin Normal.

Hasta este del captulo, nos hemos ocupado por el anlisis de las distribuciones de
probabilidad discretas. En la presente seccin fijaremos nuestra atencin a los casos en
que la variable puede tomar cualquier valor que ste en un intervalo de valores dado, y
en los cuales la distribucin de probabilidad es continua (Tal como ocurre con la
Probabilidades y distribuciones de probabilidad..

mayora de las magnitudes clnicas que son del tipo continuo, cuya distribucin terica
de la variable se llama funcin de densidad ).

Una distribucin de probabilidad continua que es muy importante es la distribucin
normal. Varios matemticos han contribuido a su desarrollo, entre los que podemos
contar al astrnomo -matemtico del siglo XIX Karl Gauss. En honor a su trabajo, la
distribucin de probabilidad normal a menudo tambin se le lama distribucin
gaussiana.

Existen dos razones bsicas por las cuales la distribucin normal ocupa un lugar tan
prominente en la estadstica. Primero, tiene algunas propiedades que la hacen aplicable
a un gran nmero de situaciones en las que es necesario hacer inferencias mediante la
toma de muestras. Segundo, la distribucin normal casi se ajusta a las distribuciones de
frecuencias reales observadas en muchos fenmenos, incluyendo caractersticas
humanas (pesos, alturas, IQ, nivel de colesterol, presin sangunea, etc.).

2.7.1.1. Definicin. Se dice que la variable aleatoria X tiene distribucin normal con
media y varianza o
2
, y se escribe X ~ N(,o
2
), si su funcin de densidad es dada por:

2
2
2
) (x
e
2
1
f(x)

= < < x

donde < < , o > 0. Su grfica es la figura siguiente.



f(x)





X
Figura 2.2. Grfica de la funcin de densidad normal

Observe durante un momento la figura 2.2. Este grfico pone de manifiesto varias
caractersticas importantes de una distribucin normal de probabilidad.
1. La curva tiene un pico, por tanto, es unimodal. Tiene la forma de campana.
2. La curva es simtrica con respecto al eje vertical X =

.
3. El rea total bajo la curva normal es igual a uno, por lo tanto a cada lado del eje
de eje de simetra es igual a 0.5.
4. La curva normal tienen dos puntos de inflexin simtricos en X

=


.
5. Debido a la simetra de la distribucin normal, la media coincide con la mediana
y con la moda.
Probabilidades y distribuciones de probabilidad..

6. Los dos extremos de la distribucin normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.

2.7.1.2. Distribucin normal estndar y uso de la tabla normal.
Considerando la diversidad de variables cuya distribucin es aproximadamente normal,
se hace necesario emplear una funcin densidad normal que sea independiente de los
valores y unidades que puedan tomar dichas variables. Para esto se define la variable
estandarizada, z, de la siguiente forma:
o

=
X
Z
que mide el nmero de desviaciones estndares que un valor x se desva de la media .

Para est variable estandarizada, se define la funcin de densidad estandarizada:

2
2
e
2
1
f(z)
z

= < < z

La variable estndar Z tiene media igual a cero y la varianza igual a 1.

|(z)





0 z
Figura 2.3. Curva normal estandarizada.

Adems, funcin de distribucin acumulada de la normal estndar es:
dt e z Z P z
t
z 2
2

2
1
) ( ) (


}
= s =
t
|



| (z)

0 z Z
Figura 2.4. rea bajo la curva normal estandarizada.

No es necesario tener una tabla distinta para cada curva normal posible. En lugar de ello
podemos utilizar la distribucin de probabilidad normal estndar para encontrar
reas (probabilidades) bajo cualquier curva normal.

Probabilidades y distribuciones de probabilidad..

Si la variable aleatoria X tiene distribucin N( , o
2
), entonces, la variable aleatoria
Z = ( X - ) / o tiene distribucin N( 0, 1).

Luego,
) ( ) ( ) (
o

|
o

|
o

=
(


s s

= s s
a b b
Z
a
P b X a P

Ejemplo 2.26. Utilizando la tabla de probabilidad normal estndar, hallar:

a) P( Z s 1.2) b) P(0.81 s Z s 1.94) c) P(Z s -1.28) d) P(-0.46 s Z s 2.21)
e) P(-2.04 s Z s-1.98) f) P(Z > -0.68)

Solucin.
a) Directamente de la tabla normal estndar se obtiene:
P( Z s 1.2) = 0.5 + P( 0 s Z s 1.2) = 0.5 + 0.38849 = 0.8849



0.8849

0 1.2 Z

b) P(0.81 s Z s 1.94) = P(0 s Z s 1.94) - P( 0 s Z s 0.81) =





-3 0 0.81 1.94 3 Z

c) P(Z s -1.28) =





-3 -1.28 0 3 Z

d) P(-0.46 s Z s 2.21) =



Probabilidades y distribuciones de probabilidad..



-3 -0.46 0 2.21 3 Z

e) P(-2.5 s Z s-1.98) =




-3 - 2.5 -1.98 0 3 Z



f) P(Z > -0.68) =




-3 - 0.68 0 3 Z


Ejemplo 2.27. Hallar el valor de Z
o
tal que 95 . 0 ) z P(Z
o
= s .

Solucin.
El inters en este caso, es encontrar el valor de z
o
dado que se conoce la probabilidad


95 . 0 ) z P(Z
o
= s .
De acuerdo a la definicin del evento, z
o
es positivo y el rea de 0.95 que le
corresponde lo ilustrado en la figura 2.5



0.95

0 z
0
Z
Figura 2.5.

El rea que corresponde entre 0 y z
o
es de 0.95 0.50 = 0.45. En el cuerpo de la tabla
de una distribucin normal estndar, ubicamos la probabilidad 0.45 y el valor ms
prximo por defecto a este valor es 0.4495 y le corresponde un valor de Z igual a 1.64.

Por lo tanto, z
o
= 1.64.

Probabilidades y distribuciones de probabilidad..

Ejemplo 2.28. Supngase que se sabe que los niveles de glucosa en sangre extrada a
150 nios en ayunas estn distribuidos normalmente con una media de 66 mg

/

dl y una
desviacin estndar de 42 mg

/

dl.
a) Cul es la probabilidad de un nio seleccionado al azar presente un nivel de
glucosa en sangre mayor o igual a 72 mg

/

dl?
b) Cuantos nios presentan un nivel de glucosa en sangre entre 62 mg

/

dl y
72 mg

/

dl?.
c) Debajo de que valor se encuentra el 10% de los niveles de glucosa en sangre
extrada a los nios en ayunas?

Solucin.

Sea la v.a X: nivel de glucosa en sangre extrada a nios en ayuna. Se sabe adems que
X ~ N [66 mg

/

dl , (42 mg

/

dl)
2
] . Donde los valores poblacionales son =66 mg

/

dl y
= 42 mg

/

dl.
a)
4013 . 0 0987 . 0 5 . 0 ) 25 . 0 0 ( 5 . 0 ) 25 . 0 (
42
66 72
) 72 ( = = s s = > =
(


>

= > Z P Z P
X
P X P
o



b) 1662 . 0 ) 25 . 0 17 . 0 (
24
66 72
24
66 62
) 72 62 ( = < < =
(


<

<

= s s Z P
X
P X P
o



Luego el nmero esperado de nios en ayunas que presentan un nivel de glucosa en
sangre entre 62 mg

/

dl y 72 mg

/

dl es aproximadamente de: 150 x 0.1662 = 25 nios.

c) Sea x
0
el valor de nivel de glucosa en sangre debajo del cual se encuentra el 10% de
los valores. Es decir 1 . 0 ) (
0
= s X X P




X
0
66 X

-1.28 0 Z

Luego:

1 . 0
24
66
24
66
24
66
) (
0 0
0
=
(


s =
(


>

= s
x
Z P
x X
P x X P

Se observa en la tabla de la normal estandarizada que
24
66
28 . 1
0

=
x
, de donde
resulta: =
0
x 35.28 mg

/

dl

Ejercicio. Los lmites de tolerancia del componente Sulfato de Neomicina en un
antibitico fueron fijados en (40 ; 60) mg. Se sabe que el valor promedio histrico de
Probabilidades y distribuciones de probabilidad..

fabricacin 50 mg con una desviacin estndar de 4 mg y adems los valores del
componente de sulfato estn distribuidos aproximadamente en forma normal. Calcular
el nmero esperado de comprimidos defectuosos en un lote de 9000.


2.7.1.3. Aproximacin Normal a probabilidades Binomiales.

Cuando el nmero de observaciones o ensayos n es relativamente grande, puede
utilizarse la distribucin normal para aproximar las probabilidades binomiales. Una
regla aceptable para determinar cuando puede utilizarse la aproximacin normal
a las probabilidades binomiales es tener en cuenta que tanto np > 5 como nq > 5.
Hemos visto que cuando p es muy pequea y n es grande, la aproximacin de Poisson a
la Binomial es buena.


Ejemplo 2.29. La probabilidad de que un paciente se recupere de una rara enfermedad
de la sangre es 0.4. Si se sabe que 100 personas han contrado est enfermedad, cul es
la probabilidad de que menos de 30 sobrevivan?-

Solucin.
Sea la variable aleatoria binomial X que representa el nmero de pacientes que
sobreviven.

Los posibles valores de X son 0, 1, 2, 3, ..., 100. en este caso la distribucin binomial es:

x 100 x
(0.6) (0.4)
x
100
x) P(X

|
|
.
|

\
|
= = x = 0, 1, 2,..., 100
La probabilidad exacta calculada por la frmula Binomial es = s = < ) 29 ( ) 30 ( X P X P
0.0147753

Dado que n =100 es grande, deben obtenerse resultados bastantes precisos utilizando la
aproximacin de la curva normal con:

40 4 . 0 100 = = = np y 899 . 4 6 . 0 4 . 0 100 = = = npq o

Entonces la probabilidad de que menos de 30 pacientes de 100 sobrevivan, es:
0162 . 0 ) 14 . 2 ( )
899 . 4
40 5 . 29
899 . 4
40
(
) 5 . 29 ( ) 2 / 1 29 ( ) 29 ( ) 30 (
= s =

~
s = + s = s = <
Z P
X
P
X P X P X P X P


La probabilidad aproximada obtenida 0.0162 es muy parecida a la exacta 0.01477


2.7.2. Distribucin Chi-Cuadrado.

Definicin.- Se dice que la variable aleatoria continua X se distribuye segn Chi-
cuadrado con r grados de libertad, y se representa por X ~ _
2
(r), si su funcin de
densidad es:
Probabilidades y distribuciones de probabilidad..


0 x si ,
0 x si , 0

) 2 / (
2
) (
2 / 1 2 /
2 /
>

<
I
=

x r
r
e X
r
X f

donde r es un nmero entero positivo.






f(_
2
)
r=1
r=6
r=15



0 10 20 _
2


Figura 2.6. Grfica de la distribucin chi-cuadrado.

Si X ~ _
2
(r) entonces, su media y su varianza respectivamente son:
= E(X) = r y o
2
= V(X) = 2r

Si la variable aleatoria X ~ _
2
(r), entonces, en la tabla de probabilidades chi-cuadrado se
puede encontrar una probabilidad 1 - o o un valor _
2
(1-o, r)
, mediante la relacin

1 ) P(X
2
r) , (1
= s



f(_
2
)

Figura 2.7. rea bajo la curva
1 - o chi - cuadrado.


0 _
2
(1-o, r)
_
2


Probabilidades y distribuciones de probabilidad..

Ejemplo 2.30. Si X ~ _
2
(26), determinar:

a) | | 29 . 17 s X P , b) | | 89 . 38 > X P , c) | | 64 . 45 84 . 13 s s X P d) | | 40 s X P

Solucin.-
a) | | 29 . 17 s X P = 0.10

b) | | 89 . 38 > X P =

c) | | 64 . 45 84 . 13 s s X P =

d) | | 40 s X P =



Ejemplo 2.31. Si X ~ _
2
(r), hallar:

a) a tal que | | 005 . 0 = > a X P , si r = 30

b) a y b tales que | | 95 . 0 = s s b X a P , | | 975 . 0 = s b X P , si r = 13

c) a tal que | | 015 . 0 = s a X P , si r = 8

Solucin.

a) Directamente se observa de la tabla chi, que a = 53.672

b) De | | 975 . 0 = s b X P , se tiene | | 025 . 0 = > b X P resultando b = 24.7356

Por otra parte, | | ) ( ) ( 95 . 0 b X P a X P b X a P > > = s s = , de donde resulta,

975 . 0 025 . 0 95 . 0 ) ( = + = > a X P , entonces, a = 5.01.

c) Por interpolacin se tiene a = 1.8267


2.7.3. Distribucin t de Student.

Definicin. La variable aleatoria continua T se distribuye segn t-student con r grados
de libertad y se representa por T ~ t (r), si su funcin de densidad es,

| |
2 / ) 1 (
2
1
r ) 2 / (
2 / ) 1 (
) (
+
|
|
.
|

\
|
+
I
+ I
=
r
r
t
r
r
t f < < t ,

donde r es un nmero positivo.

La grfica de la distribucin t se representa en la figura 2.8.

Probabilidades y distribuciones de probabilidad..



T
0
Figura 2.8. Grfica de la distribucin t - Student.






La distribucin t- Student tiene las siguientes propiedades:
- Si la v.a T ~ t (r), entonces su media y su varianza son respectivamente:
0 E(T) = =
2 r
r
V(T)
2

= = , r > 2.
- Su grfica tiene forma de campana de Gauss, simtrica en cero.
- La varianza de la distribucin t es mayor que de la distribucin N(0, 1). Pero
cuando + r , la varianza de la t tiende a 1.
- La distribucin t se aproxima a una distribucin N(0, 1), cuando + r . La
aproximacin es buena, si 30 > r .

Si la v.a T ~ t(r), en la tabla de probabilidades t-Student se puede encontrar una
probabilidad 1-o o un valor t
(1-o, r)
, mediante la relacin

1 ) P(
, 1
= s
r
t T
o



1 - o
o
T
0 t
(1-o, r)


Figura 2.9. rea de la distribucin t.


Ejemplo 2.32. Si T tiene distribucin t-Student con 18 grados de libertad, hallar:

a) ) 734 . 1 ( > T P b) ) 10 . 2 ( s T P c) ) 878 . 2 ( s T P d) ) 552 . 2 330 . 1 ( s s T P
e) ) 2 ( > T P

Solucin.
a) ) 734 . 1 ( > T P = 0.05

" Si Z y V son dos variables aleatorias independientes tales que Z est normalmente
distribuida con media cero y varianza 1, y V est distribuida como chi-cuadrado con r
grados de libertad, entonces, la variable aleatoria

tiene distribucin t- Student con r grados de libertad"
Probabilidades y distribuciones de probabilidad..

b) ) 10 . 2 ( s T P = 1- ) 10 . 2 ( > T P =


c) ) 878 . 2 ( s T P = ) 878 . 2 ( > T P =


d) ) 552 . 2 330 . 1 ( s s T P =


e) Por interpolacin resulta 968 . 0
0
= p





Ejemplo 2.33. Si X tiene distribucin t con 10 grados de libertad, hallar el valor c tal
que:
a) 01 . 0 ) ( = > c X P b) 995 . 0 ) ( = s c X P c) 05 . 0 ) ( = s c X P
d) 95 . 0 ) ( = s s c X c P e) 08 . 0 ) ( = > c X P

Solucin.
a) 01 . 0 ) ( = > c X P , entonces, c = 2.764


b) 995 . 0 ) ( = s c X P , implica, 005 . 0 ) ( = > c X P , luego c = 3.169



c) 05 . 0 ) ( = s c X P ,

d) 95 . 0 ) ( = s s c X c P , implica, 025 . 0 ) ( = > c X P , luego c =

e) Por interpolacin se obtiene c = 1.548

2.7.4. Distribucin F.
Definicin. Se dice que una variable aleatoria contina X tiene distribucin F con r
1
y
r
2
grados de libertad y se representa por X ~ F(r
1
, r
2
), si su funcin de densidad es:

)/2 r (r
2
1
1 /2 r
2 1
/2 r
2
1 2 1
2 1
1
1
x
r
r
1
x

2
r

2
r

r
r

2
r r

) (
+

|
|
.
|

\
|
+
|
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
|
.
|

\
| +
= x f , < s x 0

donde r
1
y r
2
, son nmeros enteros positivos. Su grfica es la figura 3.8.

Probabilidades y distribuciones de probabilidad..


f(x)
1.0
F(2,4)
F(10,2)
0.5 F(12, 15)


X
0 1 2 3 4 5

Figura 2.10. Grfica de la distribucin F.










Si la variable aleatoria X ~ F(r
1
, r
2
), en la tabla de probabilidades F se puede encontrar
una probabilidad 1-o o un valor
) 1 (
2
,
1
, r r
F
o
, mediante la relacin:

o =
(

s

1
2
r
1,
r , (1
F X P

Para determinar valores de F correspondientes a reas 1- o = 0.005, 0.01, 0.025, 0.05, o
para determinar valores de 1
) 1 (
2
,
1
,
<
r r
F
o
se usa el teorema siguiente:


Teorema. Si X ~ F(r
1
, r
2
), entonces, 1/ X tiene distribucin F con grados de libertad r
2

y r
1
, es decir,
)
1
,
2
, (
)
2
,
1
,
1
1 (
r r
r r
F
F
o
o
=



Ejemplo 2.34. Si X ~ F
(4, 5)
hallar:

a) ) 4 . 11 ( > X P b) ) 39 . 7 ( s X P c) ) 8 ( s X P d) ) 0645 . 0 ( s X P

Solucin.
Si U y V son dos variables aleatorias independientes tales que
y , entonces, la variable aleatoria:



tiene distribucin F con r
1
y r
2
grados de libertad.


Probabilidades y distribuciones de probabilidad..

a) ) 4 . 11 ( > X P = 0.01

b) ) 39 . 7 ( s X P = 1- ) 39 . 7 ( > X P =


c) Por interpolacin: resulta 977 . 0 ) 8 ( = s X P


d) ) 0645 . 0 ( 1 ) 0645 . 0 ( > = s X P X P
Debemos calcular ) 0645 . 0 ( > X P . En efecto, tenemos:

99 . 0 010 . 0 1 ) 50 . 15 ( 1 ) 50 . 15 (
0645 . 0
1 1
) 0645 . 0 ( = = > ' = s ' =
(

s = > X P X P
X
P X P

donde ) 4 , 5 ( ~
1
F
X
X = ' . Luego 01 . 0 99 . 0 1 ) 0645 . 0 ( 1 ) 0645 . 0 ( = = > = s X P X P


Ejemplo 2.35. Si X ~ F
(6, 10)
, hallar el valor de c tal que:
a) 01 . 0 ) ( = > c X P b) 95 . 0 ) ( = s c X P c) 025 . 0 ) ( = s c X P

Solucin.
a) 01 . 0 ) ( = > c X P , entonces c = 5.39

b) De 95 . 0 ) ( = s c X P , se obtiene 05 . 0 ) ( = > c X P , luego se tiene, c =

c) 025 . 0 ) ( = s c X P , implica que 975 . 0 ) ( = > c X P .

1831 . 0
46 . 5
1 1
,6) ,10 (0.025
10) 6, 0.975, (
= = = =
F
F c

You might also like