You are on page 1of 20

INSTITUTO TECNOLGICO DE MRIDA

INGENIERA INDUSTRIAL

SIMULACIN

GENERACIN DE 5 VALORES DE
VARIABLE ALEATORIA

6IV

JUAN ANTONIO BAEZA KINIL






INSTITUTO TECNOLGICO DE MRIDA

INGENIERA INDUSTRIAL

SIMULACIN

INVESTIGACIONES DISTRIBUCIONES DE
PROBABILIDAD

6IV

JUAN ANTONIO BAEZA KINIL







DISTRIBUCIONES DE PROBABILIDAD
CALCULO DE PROBABILIDADES

Uno de los objetivos de la estadstica es el conocimiento cuantitativo de una determinada parcela de la
realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio,
partiendo de la premisa de que lo real es siempre ms complejo y multiforme que cualquier modelo
que se pueda construir. De todas formas, la formulacin de modelos aceptados por las instituciones
responsables y por los usuarios, permite obviar la existencia del error o distancia entre la realidad y el
modelo.
Uno de los conceptos ms importantes de la teora de probabilidades es el de variable aleatoria que,
intuitivamente, puede definirse como cualquier caracterstica medible que toma diferentes valores con
probabilidades determinadas. Toda variable aleatoria posee una distribucin de probabilidad que
describe su comportamiento (vale decir, que desagrega el 1 a lo largo de los valores posibles de la
variable). Si la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su
distribucin de probabilidad especifica todos los valores posibles de la variable junto con la
probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar
cualquier valor de un intervalo, la distribucin de probabilidad permite determinar las probabilidades
correspondientes a con subintervalos de valores. Una forma usual de describir la distribucin de
probabilidad de una variable aleatoria es mediante la denominada funcin de densidad, en tanto que lo
que se conoce como funcin de distribucin representa las probabilidades acumuladas.
En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley binomial o
la de Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo
para representar las distribuciones empricas ms frecuentes.
As, por ejemplo, la variable talla de un recin nacido puede tener valores entre 47 cm y 53 cm, pero
no todos los valores tienen la misma probabilidad, porque las ms frecuentes son las tallas prximas a
los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribucin de probabilidad
emprica, que se obtendra con una muestra grande de casos.
Epidat 3.1 ofrece, en este mdulo, procedimientos usuales para calcular probabilidades y sus inversas,
para un conjunto bastante amplio de funciones de distribucin, discretas y continuas, que son
habituales en el proceso de modelacin. Por ejemplo, el conjunto de distribuciones pertenecientes a la
familia exponencial es de uso frecuente en metodologas como el anlisis de supervivencia o el Modelo
Lineal Generalizado. Otras distribuciones son comunes y habituales en el campo de actuacin de
disciplinas tales como la economa, la biologa, etc.
Cuando la opcin elegida es el clculo de una probabilidad dado un punto x de la distribucin, se
presentan en todos los casos dos resultados: la probabilidad acumulada hasta ese punto, o la
probabilidad de que la variable tome valores inferiores o iguales a x (cola izquierda) y la probabilidad
de valores superiores a x (cola derecha). En el caso continuo, la probabilidad de que la variable sea
igual a cualquier punto es igual a cero; por tanto, no influye en las colas el hecho de incluir o excluir el
punto x. Hay un tercer resultado que el programa presenta slo para las distribuciones continuas
simtricas (normal, logstica y t de Student): la probabilidad de dos colas, es decir, la probabilidad que
queda a ambos lados del intervalo (-x, x) (x, -x), segn el punto sea positivo o negativo,
respectivamente.
Asimismo, los resultados de Epidat 3.1 incluyen la media y la varianza de la correspondiente
distribucin, as como la mediana y/o la moda en el caso de las distribuciones continuas.
Epidat 3.1 tambin ofrece la posibilidad de representar, grficamente, las funciones de distribucin y
densidad.

DISTRIBUCIONES DISCRETAS

Las distribuciones discretas incluidas en el mdulo de Clculo de probabilidades son:
- Uniforme discreta
- Binomial
- Hipergeomtrica
- Geomtrica
- Binomial Negativa
- Poisson
Distribucin Uniforme discreta (a,b)
Describe el comportamiento de una variable discreta que puede tomar n valores distintos con la misma
probabilidad cada uno de ellos. Un caso particular de esta distribucin, que es la que se incluye en este
mdulo de Epidat 3.1, ocurre cuando los valores son enteros consecutivos. Esta distribucin asigna
igual probabilidad a todos los valores enteros entre el lmite inferior y el lmite superior que definen el
recorrido de la variable. Si la variable puede tomar valores entre a y b, debe ocurrir que b sea mayor
que a, y la variable toma los valores enteros empezando por a, a+1, a+2, etc. hasta el valor mximo b.
Por ejemplo, cuando se observa el nmero obtenido tras el lanzamiento de un dado perfecto, los
valores posibles siguen una distribucin uniforme discreta en {1, 2, 3, 4, 5, 6}, y la probabilidad de cada
cara es 1/6.
- Valores:
x: a, a+1, a+2, ..., b, nmeros enteros
- Parmetros:
a: mnimo, a entero
b: mximo, b entero con a < b
Distribucin Binomial (n,p)
La distribucin binomial es una distribucin discreta muy importante que surge en muchas aplicaciones
bioestadsticas.
Esta distribucin aparece de forma natural al realizar repeticiones independientes de un experimento
que tenga respuesta binaria, generalmente clasificada como xito o fracaso.
Por ejemplo, esa respuesta puede ser el hbito de fumar (s/no), si un paciente hospitalizado desarrolla
o no una infeccin, o si un artculo de un lote es o no defectuoso. La variable discreta que cuenta el
nmero de xitos en n pruebas independientes de ese experimento, cada una de ellas con la misma
probabilidad de xito igual a p, sigue una distribucin binomial de parmetros n y p. Este modelo se
aplica a poblaciones finitas de las que se toma elementos al azar con reemplazo, y tambin a
poblaciones conceptualmente infinitas, como por ejemplo las piezas que produce una mquina,
siempre que el proceso de produccin sea estable (la proporcin de piezas defectuosas se mantiene
constante a largo plazo) y sin memoria (el resultado de cada pieza no depende de las anteriores).
Un ejemplo de variable binomial puede ser el nmero de pacientes ingresados en una unidad
hospitalaria que desarrollan una infeccin nosocomial.
Un caso particular se tiene cuando n=1, que da lugar a la distribucin de Bernoulli.
- Valores:
x: 0, 1, 2, ..., n
- Parmetros:
n: nmero de pruebas, n > 0 entero
p: probabilidad de xito, 0 < p < 1
Distribucin Hipergeomtrica (N,R,n)
La distribucin hipergeomtrica suele aparecer en procesos muestrales sin reemplazo, en los que se
investiga la presencia o ausencia de cierta caracterstica. Pinsese, por ejemplo, en un procedimiento
de control de calidad en una empresa farmacutica, durante el cual se extraen muestras de las cpsulas
fabricadas y se someten a anlisis para determinar su composicin.
Durante las pruebas, las cpsulas son destruidas y no pueden ser devueltas al lote del que provienen.
En esta situacin, la variable que cuenta el nmero de cpsulas que no cumplen los criterios de calidad
establecidos sigue una distribucin hipergeomtrica. Por tanto, esta distribucin es la equivalente a la
binomial, pero cuando el muestreo se hace sin reemplazo.
Esta distribucin se puede ilustrar del modo siguiente: se tiene una poblacin finita con N elementos,
de los cuales R tienen una determinada caracterstica que se llama xito (diabetes, obesidad, hbito
de fumar, etc.). El nmero de xitos en una muestra aleatoria de tamao n, extrada sin reemplazo
de la poblacin, es una variable aleatoria con distribucin hipergeomtrica de parmetros N, R y n.
Cuando el tamao de la poblacin es grande, los muestreos con y sin reemplazo son equivalentes, por
lo que la distribucin hipergeomtrica se aproxima en tal caso a la binomial.
- Valores:
x: max{0,n-(N-R)}, ..., min{R,n}, donde max{0,n-(N-R)} indica el valor mximo entre 0 y n- (N-R) y
min{R,n} indica el valor mnimo entre R y n.
- Parmetros:
N: tamao de la poblacin, N>0 entero
R: nmero de xitos en la poblacin, R0 entero
n: nmero de pruebas, n>0 entero
Distribucin Geomtrica (p)
Supngase, que se efecta repetidamente un experimento o prueba, que las repeticiones son
independientes y que se est interesado en la ocurrencia o no de un suceso al que se refiere como
xito, siendo la probabilidad de este suceso p. La distribucin geomtrica permite calcular la
probabilidad de que tenga que realizarse un nmero k de repeticiones hasta obtener un xito por
primera vez. As pues, se diferencia de la distribucin binomial en que el nmero de repeticiones no
est predeterminado, sino que es la variable aleatoria que se mide y, por otra parte, el conjunto de
valores posibles de la variable es ilimitado.
Para ilustrar el empleo de esta distribucin, se supone que cierto medicamento opera exitosamente
ante la enfermedad para la cual fue concebido en el 80% de los casos a los que se aplica; la variable
aleatoria intentos fallidos en la aplicacin del medicamento antes del primer xito sigue una
distribucin geomtrica de parmetro p=0,8. Otro ejemplo de variable geomtrica es el nmero de
hijos hasta el nacimiento de la primera nia.
La distribucin geomtrica se utiliza en la distribucin de tiempos de espera, de manera que si los
ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria proporciona el tiempo
transcurrido hasta el primer xito.
Esta distribucin presenta la denominada propiedad de Harkov o de falta de memoria, que implica
que la probabilidad de tener que esperar un tiempo t no depende del tiempo que ya haya transcurrido.
- Valores:
x: 0, 1, 2, ...
- Parmetros:
p: probabilidad de xito, 0<p<1



Distribucin Binomial negativa (r,p)

Una generalizacin obvia de la distribucin geomtrica aparece si se supone que un experimento se
contina hasta que un determinado suceso, de probabilidad p, ocurre por r-sima vez. La variable
aleatoria que proporciona la probabilidad de que se produzcan k fracasos antes de obtener el r-simo
xito sigue una distribucin binomial negativa de parmetros r y p, BN(r,p). La distribucin geomtrica
corresponde al caso particular en que r=1. Un ejemplo es el nmero de lanzamientos fallidos de un
dado antes de obtener un 6 en tres ocasiones, que sigue una BN(3,1/6).
En el caso de que los sucesos ocurran a intervalos regulares de tiempo, esta variable proporciona el
tiempo total para que ocurran r xitos, por lo que tambin se denomina distribucin binomial de
tiempo de espera.
La distribucin binomial negativa fue propuesta, originalmente, como una alternativa a la distribucin
de Poisson para modelar el nmero de ocurrencias de un suceso cuando los datos presentan lo que se
conoce como variacin extra-Poisson o sobredispersin. En estas situaciones, la varianza es mayor que
la media, por lo que se incumple la propiedad que caracteriza a una distribucin de Poisson, segn la
cual la media es igual a la varianza. La primera aplicacin en bioestadstica la realiz Student (William S.
Gosset) a principios de siglo cuando propuso esta distribucin para modelar el nmero de glbulos
rojos en una gota de sangre. En este caso, la variabilidad extra se debe al hecho de que esas clulas no
estn uniformemente distribuida en la gota, es decir, la tasa de intensidad no es homognea.
Por ejemplo, la distribucin binomial negativa es ms adecuada que la de Poisson para modelar el
nmero de accidentes laborales ocurridos en un determinado lapso. La distribucin de Poisson asume
que todos los individuos tienen la misma probabilidad de sufrir un accidente y que sta permanece
constante durante el perodo de estudio; sin embargo, es ms plausible la hiptesis de que los
individuos tienen probabilidades constantes en el tiempo, pero que varan de unos sujetos a otros; esto
es lo que se conoce en la literatura como la propensin a los accidentes (accident proneness)8,9.
Esta hiptesis se traduce en una distribucin de Poisson mixta, o de efectos aleatorios, en la que se
supone que las probabilidades varan entre individuos de acuerdo a una distribucin gamma y esto
resulta en una distribucin binomial negativa para el nmero de accidentes.
- Valores:
x: 0, 1, 2, ...
- Parmetros:
p: probabilidad de xito, 0<p<1
r: nmero de xitos, r0

Distribucin Poisson (lambda)
La distribucin de Poisson, que debe su nombre al matemtico francs Simen Denis Poisson (1781-
1840), ya haba sido introducida en 1718 por Abraham De Moivre como una forma lmite de la
distribucin binomial que surge cuando se observa un evento raro despus de un nmero grande de
repeticiones 10. En general, la distribucin de Poisson se puede utilizar como una aproximacin de la
binomial, Bin(n, p), si el nmero de pruebas n es grande, pero la probabilidad de xito p es pequea;
una regla es que la aproximacin Poisson-binomial es buena si n20 y p0,05 y muy buena si n100
y p0,01.
La distribucin de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente en
el espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un intervalo o
espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros de 0 en
adelante (0, 1, 2,...). As, el nmero de pacientes que llegan a un consultorio en un lapso dado, el
nmero de llamadas que recibe un servicio de atencin a urgencias durante 1 hora, el nmero de
clulas anormales en una superficie histolgica o el nmero de glbulos blancos en un milmetro cbico
de sangre son ejemplos de variables que siguen una distribucin de Poisson. En general, es una
distribucin muy utilizada en diversas reas de la investigacin mdica y, en particular, en
epidemiologa.
El concepto de evento raro o poco frecuente debe ser entendido en el sentido de que la probabilidad
de observar k eventos decrece rpidamente a medida que k aumenta. Supngase, por ejemplo, que el
nmero de reacciones adversas tras la administracin de un frmaco sigue una distribucin de Poisson
de media lambda=2. Si se administra este frmaco a 1.000 individuos, la probabilidad de que se
produzca una reaccin adversa (k=1) es 0,27; los valores de dicha probabilidad para k=2, 3, 4, 5, 6
reacciones, respectivamente, son: 0,27; 0,18; 0,09; 0,03 y 0,01. Para k=10 o mayor, la probabilidad es
virtualmente 0. El rpido descenso de la probabilidad de que se produzcan k reacciones adversas a
medida que k aumenta puede observarse claramente en el grfico de la funcin de densidad obtenido
con Epidat 3.1


Para que una variable recuento siga una distribucin de Poisson deben cumplirse varias condiciones:
1. En un intervalo muy pequeo (p. e. de un milisegundo) la probabilidad de que ocurra un evento
es proporcional al tamao del intervalo.
2. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo estan
reducida que, a efectos prcticos, se puede considerar nula.
3. El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier
otro intervalo pequeo que no se solape con aqul.

Estas propiedades pueden resumirse en que el proceso que genera una distribucin de Poisson es
estable (produce, a largo plazo, un nmero medio de sucesos constante por unidad de observacin) y
no tiene memoria (conocer el nmero de sucesos en un intervalo no ayuda a predecir el nmero de
sucesos en el siguiente).
El parmetro de la distribucin, lambda, representa el nmero promedio de eventos esperados por
unidad de tiempo o de espacio, por lo que tambin se suele hablar de lambda como la tasa de
ocurrencia del fenmeno que se observa.
A veces se usan variables de Poisson con "intervalos" que no son espaciales ni temporales, sino de otro
tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un perodo dado, el
nmero de enfermos en cierta poblacin, dividida en "intervalos" de, por ejemplo, 10.000 habitantes.
Al nmero de personas enfermas en una poblacin de tamao prefijado, en un instante dado, se le
denomina prevalencia de la enfermedad en ese instante y es una variable que sigue una distribucin de
Poisson. Otra medida para la frecuencia de una enfermedad es la incidencia, que es el nmero de
personas que enferman en una poblacin en un periodo determinado. En este caso, el intervalo es de
personas tiempo, habitualmente personas-ao, y es tambin una variable con distribucin de Poisson.
Habitualmente, ambas medidas se expresan para intervalos de tamao unidad o, dicho de otro modo,
en lugar de la variable nmero de enfermos, se usa el parmetro lambda (el riesgo, en el caso de la
prevalencia, y la densidad de incidencia, en el de incidencia).
La distribucin de Poisson tiene iguales la media y la varianza. Si la variacin de los casos observados en
una poblacin excede a la variacin esperada por la Poisson, se est ante la presencia de un problema
conocido como sobre dispersin y, en tal caso, la distribucin binomial negativa es ms adecuada.
- Valores:
x: 0, 1, 2, ...
- Parmetros:
lambda: media de la distribucin, lambda > 0


































DISTRIBUCIN UNIFORME DISCRETA.
Esta es la distribucin de una variable aleatoria discreta cuyos valores posibles son equiprobables.
Definicin: Una variable aleatoria X, discreta, se distribuye uniformemente sobre n puntos
1
x ,
2
x ,...,
n
x
, si su funcin de probabilidad es:

1/n i=1,2,3....
P(X=x
i
) =
0 resto

Propiedades:
* Media : =(n+1)/2
* Varianza : VAR[X] =
12
1
2
n

Ejemplo: la v.a. asociada al experimento de tirar un dado sigue una distribucin uniforme discreta,
cuya media es 3,5 y varianza 5,8.


2. DISTRIBUCIN DE BERNOUILLI

Un experimento aleatorio se dice que es de Bernouilli cuando nicamente puede tener dos resultados
mutuamente excluyentes; uno de ellos se denomina "xito" y el otro "fracaso".

Definicin: Una v.a. X asociada a un experimento de Bernouilli y que toma los valores:
X(xito) = 1 ; X (fracaso) = 0
entonces se dice que X sigue una distribucin de Bernouilli, X~B(p) y su funcin de probabilidad es:
P (X = 1 ) = p ; P ( X = 0 ) = 1 - p = q

o de forma genrica :
P ( X = x ) = p
x
(1-p)
1 x
; x = 0 , 1.
Propiedades:
* Media: =p
* Varianza: VAR[X]=pq

Ejemplo:
Un agente de seguros realiza visitas a posibles clientes para contratar seguros de vida. En el 60% de las
visitas, se sabe que tiene xito. Definir la variable aleatoria asociada a este experimento y obtener la
esperanza y la varianza.
Solucin: X=1 vende seguro, X=0 no vende seguro. La media es 0,6 y la varianza 0,24.

3. DISTRIBUCIN BINOMIAL

Este tipo de distribucin se da cuando se repite varias veces la prueba de Bernouilli. La probabilidad de
xito ser la misma en todas las repeticiones.

Definicin: La v.a. X= nmero de xitos en n pruebas se dice que sigue una distribucin binomial de
parmetros n y p, X~B(n,p).
La variable puede tomar los valores { 0,1, 2,..., n} y su funcin de probabilidad es :

P(X=k)=P(k exitos en n pruebas)=
|
|
.
|

\
|
k
n
p
k
q
n-k

donde
|
|
.
|

\
|
k
n
=
)! ( !
!
k n k
n

, p la probabilidad de xito y q = 1-p.



Propiedades:
* Media : =np
* Varianza : VAR[X]=npq
* Propiedad reproductiva (para 2 variables): Si
1
X y
2
X son dos v.a. independientes distribuidas segn
una B(
1
n ,p) y B(
2
n ,p) respectivamente, entonces la v.a. X=
1
X +
2
X se distribuye segn una B(
1
n +
2
n ,p)

Ejemplo:
El nmero de veces que aparece cara al lanzar una moneda 10 veces sigue una distribucin binomial de
media 5 y varianza 2,5.



4. DISTRIBUCIN GEOMTRICA

Definicin: En un proceso de Bernoulli con probabilidad p de xito en cada prueba, la variable aleatoria
X= n de pruebas en la que aparece el primer xito decimos que sigue una distribucin geomtrica de
parmetro p, X~G(p).

Los valores que puede tomar esta variable son X=1,2,...con probabilidades:

P(X=k)=q
k -1
p

Propiedades:
* Media : =1/p
* Varianza : VAR[X]=q/p

Ejemplo: Sabiendo que un jugador de parchs podr empezar a mover sus fichas una vez obtenido un 5
al lanzar un dado:
Cul es la probabilidad de que comience a mover sus fichas en su cuarto lanzamiento de dado?.
Cul es el nmero esperado de turnos consumidos por un jugador de parchs para poder comenzar a
mover sus fichas?.
Solucin: P[X=4]=0,096 y el nmero medio de lanzamientos de dado sera 6.





5. DISTRIBUCIN BINOMIAL NEGATIVA.

Definicin: En un proceso de Bernoulli con probabilidad p de xito en cada prueba, la variable aleatoria
X= n de prueba en la que aparece el xito r-simo decimos sigue una distribucin binomial negativa
de parmetros r y p, X~ BN(r,p) y su funcin de probabilidad es:
P(X=k)=
|
|
.
|

\
|

1
1
r
k
q
k-r
p
r
donde k=r,r+1,......
Propiedades:
* Media: =r/p
* Varianza: VAR[X]=rq/p
* Si r=1 tenemos la funcin de probabilidad de una distribucin Geomtrica.

Ejemplo:
a) Cul es la probabilidad de tener que lanzar 10 veces el dado para obtener cuatro veces el nmero
cinco?.
b) Cul sera el nmero medio de veces que tendramos que lanzar un dado para obtener cuatro cincos y
as tener todas las fichas del parchs en juego?.
Solucin: P[X=10]=0,0217 y el nmero medio de veces sera 24 veces.


6. DISTRIBUCIN HIPERGEOMTRICA

Consideramos una poblacin de tamao N, dividida segn la caracterstica a estudiar, en dos
subpoblaciones disjuntas de tamaos
1
N y
2
N respectivamente, N =
1
N +
2
N . Por ejemplo una urna
con N bolas, donde N = 1,2,3,... de las cuales
1
N son blancas y
2
N son negras. Tomamos una muestra
aleatoria sin reemplazamiento de tamao n, siendo n N.

Definicin: la v.a. X= nmero de elementos que pertenecen a una de las subpoblaciones
(consideramos la primera) cuando tomamos una muestra aleatoria sin reemplazamiento de tamao n,
de la poblacin total decimos que sigue una distribucin hipergeomtrica de parmetros N, N
1
,n,
X~H(N,N
1
,n) y su funcin de probabilidad es:

P(X=k)=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
n
N
k n
N N
k
N
1 1

Propiedades:
* Media: =n p
* Varianza: VAR[X]=
1
N n
npq
N


* Aproximacin a la binomial: Sea X una v.a. con distribucin hipergeomtrica H (N,n,p ). Entonces si N
es muy grande en comparacin con n, la distribucin hipergeomtrica se aproxima a la binomial. Es
decir: H(N,n,p) B(n,p) si N. Se considerar una buena aproximacin cuando N >50 y n 0,1N

Ejemplo:
En una convencin nacional, hay 50 representantes de un partido poltico, de los cuales 30 apoyan al
candidato A y 20 apoyan al candidato B. Si seleccionamos aleatoriamente cinco representantes, cul
es la probabilidad de que entre esos cinco, dos apoyen al candidato A?
Solucin: P[X=2]= 0,234


7. DISTRIBUCIN DE POISSON.

La distribucin de Poisson suele emplearse para representar experimentos en los que se analiza el
nmero
de veces que ocurre cierto evento en un intervalo (en general de tiempo).

Definicin: La variable aleatoria X= nmero de veces que ocurre un evento por unidad de tiempo
decimos que sigue una distribucin de Poisson de parmetro (>0), X~P(). Los valores de la variable
son {0,1,2,...} con probabilidades:
P(X=k)=
!
k
e
k




Propiedades:
* Media: =
* Varianza: VAR*X+=
* Propiedad reproductiva: Si
1
X y
2
X son 2 v.a. independientes distribuidas segn una ley de
Poisson, P(
1
) y P(
2
) respectivamente , entonces la v.a. X=
1
X +
2
X se distribuye segn una
distribucin de Poisson de parmetro
1 2
+ .
* Distribucin de Poisson como lmite de la Binomial. Considerando un nmero n grande de
pruebas de Bernouilli independientes, con probabilidad de xito p, pequea y haciendo =np, llegamos
a obtener la distribucin de Poisson como lmite de la binomial cuando n . Es decir, si n, p0
y =np permanece constante, entonces se verifica:
lim
n
B(n,p)=P()
En la prctica la distribucin binomial se puede aproximar a una Poisson cuando n>30 y p0,1, y
como la media en la distribucin binomial es np y en la de Poisson es , entonces en esta aproximacin
se considera que la media es =n p.

Ejemplo:
El promedio de llamadas telefnicas atendidas en la centralita de una cierta Facultad es de 36 llamadas
por hora. Calcular la probabilidad de que en un perodo de 5 minutos :
Se atiendan 5 llamadas
Se atiendan ms de 2 llamadas
Solucin: P[X=5]=0,1008 y P[X>2]=0,5768





8. DISTRIBUCIN MULTINOMIAL

La distribucin multinomial es una generalizacin de la distribucin binomial, la cual se presentar
cuando el experimento aleatorio en cuestin no slo d lugar a dos posibles resultados, xito y fracaso,
como ocurra en la binomial, sino que d lugar a tres o ms posibles resultados.

Definicin: Decimos que v.a. r-dimensional (
1 2
, ,...,
r
X X X )= nmero de veces que se presentan cada
uno de los sucesos
1 2
, ,...
r
A A A cuando se realizan las n-repeticiones independientes del experimento
sigue una distribucin multinomial de parmetros n,
1, 2
,...
r
p p p , (
1 2
, ,...,
r
X X X )~M(n,
1, 2
,...
r
p p p ) y
su funcin de probabilidad es :

1
1 1 2 2 1
1
!
( , ,..., )
! !
r
k k
r r r
r
n
P X k X k X k p p
k k
= = = =

con 0,1,...,
i
k n = y
1
r
i
i
k n
=
=


Propiedades:
* Media:
| |
i i
E X n p =
* Varianza: Var(
i
X )=
( ) 1
i i
np p

Ejemplo:
Si lanzamos un dado 50 veces. Cul es la probabilidad de obtener 25 unos, 10 veces el dos y 15 veces
el cinco?
Solucin: P[X
1
=25,X
2
=10, X
3
=0, X
4
=0, X
5
=15]=5,1*10
-19


DISTRIBUCIONES CONTINUAS
Las distribuciones continuas incluidas en el mdulo de Clculo de probabilidades son:
Uniforme Normal
Lognormal Logstica
Beta Gamma
Exponencial Ji-cuadrado
t de Student F de Snedecor

Distribucin Uniforme (a,b)
La distribucin uniforme es til para describir una variable aleatoria con probabilidad constante sobre
el intervalo [a,b] en el que est definida. Esta distribucin presenta una peculiaridad importante: la
probabilidad de un suceso depender exclusivamente de la amplitud del intervalo considerado y no de
su posicin en el campo de variacin de la variable.
Cualquiera sea la distribucin F de cierta variable X, la variable transformada Y=F(X) sigue una
distribucin uniforme en el intervalo [0,1]. Esta propiedad es fundamental por ser la base para la
generacin de nmeros aleatorios de cualquier distribucin en las tcnicas de simulacin.
- Campo de variacin:
a x b
- Parmetros:
a: mnimo del recorrido
b: mximo del recorrido

Distribucin Normal (Mu, Sigma)
La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del Clculo de
probabilidades y de la Estadstica. Fue descubierta por De Moivre (1773), como aproximacin de la
distribucin binomial. De todas formas, la importancia de la distribucin normal queda totalmente
consolidada por ser la distribucin lmite de numerosas variables aleatorias, discretas y continuas,
como se demuestra a travs de los teoremas centrales del lmite. Las consecuencias de estos teoremas
implican la casi universal presencia de la distribucin normal en todos los campos de las ciencias
empricas: biologa, medicina, psicologa, fsica, economa, etc. En particular, muchas medidas de datos
continuos en medicina y en biologa (talla, presin arterial, etc.) se aproximan a la distribucin normal.
Junto a lo anterior, no es menos importante el inters que supone la simplicidad de sus caractersticas
y de que de ella derivan, entre otras, tres distribuciones (Ji-cuadrado, t y F) que se mencionarn ms
adelante, de importancia clave en el campo de la contrastacin de hiptesis estadsticas.
La distribucin normal queda totalmente definida mediante dos parmetros: la media (Mu) y la
desviacin estndar (Sigma).
- Campo de variacin:
- < x <
- Parmetros:
Mu: media de la distribucin, - < Mu <
Sigma: desviacin estndar de la distribucin, Sigma > 0
Distribucin Lognormal (Mu, Sigma)
La variable resultante al aplicar la funcin exponencial a una variable que se distribuye normal con
media Mu y desviacin estndar Sigma, sigue una distribucin lognormal con parmetros Mu (escala) y
Sigma (forma). Dicho de otro modo, si una variable X se distribuye normalmente, la variable lnX, sigue
una distribucin lognormal.
La distribucin lognormal es til para modelar datos de numerosos estudios mdicos tales como el
perodo de incubacin de una enfermedad, los ttulos de anticuerpo a un virus, el tiempo de
supervivencia en pacientes con cncer o SIDA, el tiempo hasta la seroconversin de VIH+, etc.
- Campo de variacin:
0 < x <
- Parmetros:
Mu: parmetro de escala, - < Mu <
Sigma: parmetro de forma, Sigma > 0

Distribucin Logstica (a, b)
La distribucin logstica se utiliza en el estudio del crecimiento temporal de variables, en particular,
demogrficas. En biologa se ha aplicado, por ejemplo, para modelar el crecimiento de clulas de
levadura, y para representar curvas de dosis-respuesta en bioensayos.
La ms conocida y generalizada aplicacin de la distribucin logstica en Ciencias de la Salud se
fundamenta en la siguiente propiedad: si U es una variable uniformemente distribuida en el intervalo
[0,1], entonces la variable X = ln|U/U-1|sigue una distribucin logstica. Esta transformacin,
denominada logit, se utiliza para modelar datos de respuesta binaria, especialmente en el contexto de
la regresin logstica.
- Campo de variacin:
- < x <
- Parmetros:
a: parmetro de posicin, - < a <
b: parmetro de escala, b > 0
Distribucin Beta (p,q)
La distribucin beta es posible para una variable aleatoria continua que toma valores en el intervalo
[0,1], lo que la hace muy apropiada para modelar proporciones. En la inferencia bayesiana, por
ejemplo, es muy utilizada como distribucin a priori cuando las observaciones tienen una distribucin
binomial.
Uno de los principales recursos de esta distribucin es el ajuste a una gran variedad de distribuciones
empricas, pues adopta formas muy diversas dependiendo de cules sean los valores de los parmetros
de forma p y q, mediante los que viene definida la distribucin.
Un caso particular de la distribucin beta es la distribucin uniforme en [0,1], que se corresponde con
una beta de parmetros p=1 y q=1, denotada Beta(1,1).
- Campo de variacin:
0 x 1
- Parmetros:
p: parmetro de forma, p > 0
q: parmetro de forma, q > 0

Distribucin Gamma (a,p)
La distribucin gamma se puede caracterizar del modo siguiente: si se est interesado en la ocurrencia
de un evento generado por un proceso de Poisson de media lambda, la variable que mide el tiempo
transcurrido hasta obtener n ocurrencias del evento sigue una distribucin gamma con parmetros a=
nlambda (escala) y p=n (forma). Se denota Gamma(a,p).
Por ejemplo, la distribucin gamma aparece cuando se realiza el estudio de la duracin de elementos
fsicos (tiempo de vida).
Esta distribucin presenta como propiedad interesante la falta de memoria. Por esta razn, es muy
utilizada en las teoras de la fiabilidad, mantenimiento y fenmenos de espera (por ejemplo en una
consulta mdica tiempo que transcurre hasta la llegada del segundo paciente).
- Campo de variacin:
0 < x <
- Parmetros:
a: parmetro de escala, a > 0
p: parmetro de forma, p > 0

Distribucin Exponencial (lambda)
La distribucin exponencial es el equivalente continuo de la distribucin geomtrica discreta.
Esta ley de distribucin describe procesos en los que interesa saber el tiempo hasta que ocurre
determinado evento; en particular, se utiliza para modelar tiempos de supervivencia.
Un ejemplo es el tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley
que sigue este evento se utiliza, por ejemplo, para la datacin de fsiles o cualquier materia orgnica
mediante la tcnica del carbono 14.
Una caracterstica importante de esta distribucin es la propiedad conocida como falta de memoria.
Esto significa, por ejemplo, que la probabilidad de que un individuo de edad t sobreviva x aos ms,
hasta la edad x+t, es la misma que tiene un recin nacido de sobrevivir hasta la edad x. Dicho de
manera ms general, el tiempo transcurrido desde cualquier instante dado t0 hasta que ocurre el
evento, no depende de lo que haya ocurrido antes del instante t0.
La distribucin exponencial se puede caracterizar como la distribucin del tiempo entre sucesos
consecutivos generados por un proceso de Poisson; por ejemplo, el tiempo que transcurre entre dos
heridas graves sufridas por una persona. La media de la distribucin de Poisson, lambda, que
representa la tasa de ocurrencia del evento por unidad de tiempo, es el parmetro de la distribucin
exponencial, y su inversa es el valor medio de la distribucin.
Tambin se puede ver como un caso particular de la distribucin gamma(a,p), con a=lambda y p=1.
El uso de la distribucin exponencial ha sido limitado en bioestadstica, debido a la propiedad de falta
de memoria que la hace demasiado restrictiva para la mayora de los problemas.
Campo de variacin:
0 < x <
Parmetros:
lambda: tasa, lambda > 0
Distribucin Ji-cuadrado (n)
Un caso especial, muy importante, de la distribucin Gamma se obtiene cuando a=1/2 y
p=n/2. La distribucin resultante se conoce con el nombre de Ji-cuadrado con n grados de libertad. Es
la distribucin que sigue la suma de los cuadrados de n variables independientes N(0,1).
La Ji-cuadrado es una distribucin fundamental en inferencia estadstica y en los tests estadsticos de
bondad de ajuste. Se emplea, entre muchas otras aplicaciones, para determinar los lmites de confianza
de la varianza de una poblacin normal, para contrastar la hiptesis de homogeneidad o de
independencia en una tabla de contingencia y para pruebas de bondad de ajuste.
La distribucin Ji-cuadrado queda totalmente definida mediante sus grados de libertad n.
- Campo de variacin:
0 x <
- Parmetros:
n: grados de libertad, n>0

Distribucin t de Student (n)
La distribucin t de Student se construye como un cociente entre una normal y la raz de una
Ji-cuadrado independientes. Esta distribucin desempea un papel importante en la inferencia
estadstica asociada a la teora de muestras pequeas. Se usa habitualmente en el contraste de
hiptesis para la media de una poblacin, o para comparar las medias de dos poblaciones, y viene
definida por sus grados de libertad n.
A medida que aumentan los grados de libertad, la distribucin t de Student se aproxima a una normal
de media 0 y varianza 1 (normal estndar).
- Campo de variacin:
- < x <
- Parmetros:
n: grados de libertad, n>0

Distribucin F de Snedecor (n,m)
Otra de las distribuciones importantes asociadas a la normal es la que se define como el cociente de
dos variables con distribucin Ji-cuadrado divididas por sus respectivos grados de libertad, n y m. En
este caso la variable aleatoria sigue una distribucin F de Snedecor de parmetros n y m. Hay muchas
aplicaciones de la F en estadstica y, en particular, tiene un papel importante en las tcnicas del anlisis
de la varianza y del diseo de experimentos.
- Campo de variacin:
0 x <
- Parmetros:
n: grados de libertad del numerador, n>0
m: grados de libertad del denominador, m>0
VARIABLES ALEATORIAS CONTINUAS
Una variable aleatoria X es continua si su funcin de distribucin es una funcin continua.
En la prctica, se corresponden con variables asociadas con experimentos en los cuales la variable
medida puede tomar cualquier valor en un intervalo: mediciones biomtricas, intervalos de tiempo,
reas, etc.
Ejemplos
Resultado de un generador de nmeros aleatorios entre 0 y 1. Es el ejemplo ms sencillo que
podemos considerar, es un caso particular de una familia de variables aleatorias que tienen una
distribucin uniforme en un intervalo [a, b]. Se corresponde con la eleccin al azar de cualquier valor
entre a y b.
Estatura de una persona elegida al azar en una poblacin. El valor que se obtenga ser una medicin
en cualquier unidad de longitud (m, cm, etc.) dentro de unos lmites condicionados por la naturaleza de
la variable. El resultado es impredecible con antelacin, pero existen intervalos de valores ms
probables que otros debido a la distribucin de alturas en la poblacin. Ms adelante veremos que,
generalmente, variables biomtricas como la altura se adaptan un modelo de distribucin
denominado distribucin Normal y representada por una campana de Gauss.
Dentro de las variables aleatorias continuas tenemos las variables aleatorias absolutamente
continuas.
Diremos que una variable aleatoria X continua tiene una distribucin absolutamente continua si existe
una funcin real f, positiva e integrable en el conjunto de nmeros reales, tal que la funcin de
distribucin F de X se puede expresar como Una variable aleatoria con distribucin
absolutamente continua, por extensin, se clasifica como variable aleatoria absolutamente continua.
En el presente manual, todas las variables aleatorias continuas con las que trabajemos pertenecen al
grupo de las variables absolutamente continuas, en particular, los ejemplos y casos expuestos.
Una variable aleatoria es continua cuando puede tomar cualquier valor de un intervalo real de la forma
(a, b),(a,),(, b),(, +) o uniones de ellos. Por ejemplo, el peso de una persona, el tiempo de
duracin de un suceso, etc.
En las variables continuas, hay que observar que la probabilidad de que la variable tome un valor
particular se considera igual a cero. Se supone que no es posible conocer el valor exacto de una
variable continua, ya que medir su valor consiste en clasicarlo dentro de un intervalo.
Las variables aleatorias continuas se describen por medio de una funcin real de variable real, a la que
se denomina funcin de densidad, que surge como la generalizacin de las curvas de frecuencias
asociadas a los histogramas, cuando la amplitud de los intervalos se considera innitamente pequea.
Llamaremos funcin de densidad de una variable aleatoria X a una funcin real f(x) no negativa (f(x) 0)
tal que y de forma que es posible calcular la probabilidad de que X tome valores en un
cierto intervalo [a, b], por integracin Conviene resaltar de nuevo que en
variables aleatorias continuas se mide la probabilidad de intervalos y que la probabilidad de que la
variable tome un valor concreto se considera cero. Por lo tanto,

La funcin de distribucin de X se dene igual que para variables discretas. Viene dada por F(x) = P(X
x), ahora bien, la forma de acumular probabilidades est ahora asociada a acumular reas de la
funcin de densidad Las caractersticas de la funcin de distribucin para variables
continuas son similares a las del caso discreto, con la diferencia fundamental de que en el caso
continuo, la funcin de distribucin es una funcin continua en todo IR.
Si pensamos en el teorema Fundamental del Clculo, obtenemos cmo recuperar la funcin de
densidad, conociendo la de distribucin f(x) = F(x).
Lo que implica, si aplicamos la regla de Barrow,
En el caso continuo, la frmula del valor esperado o esperanza matemtica queda
Donde f(x) es la funcin de densidad de la variable aleatoria X.
Anlogamente, para la varianza .


Variable aleatoria
Este proceso de cuanticacion nos lleva de manera natural a considerar la siguiente
denicion:
Denicion 4.1 (Variable aleatoria). Dado un espacio de probabilidad (, A,Pr), una variable aleatoria es
cualquier funcion, X,
X : R
X()
que asocia a cada suceso elemental un nmero real, vericando que
PrX(B) = Pr[X B+ = Pr, | X() B} B R.
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria.
Para caracterizar la distribucin de probabilidad inducida por una v.a. X deniremos una nueva funcion
ms sencilla de manejar:
Denicion 4.2 (Funcin de distribucin). Dada la v.a. X se denomina funcin de distribucin asociada a
X, a la funcin F : R R denida por:
F(t) = Pr*X t+ = Pr(X (, t+) t R.
Las propiedades mas importantes de las funciones de distribucin son:
1. F() = lm t
Pr*X t+ = 0.
2. F() = lmt
Pr*X t+ = 1.
3. La funcion es continua por la derecha, es decir, lm
h0+
F(t + h) = F(t).
4. F es no decreciente, es decir, si t1 < t2 entonces F(t1) F(t2).
Teorema 4.1. Una funcin F : R R se dice que es de distribucin si y slo si verica las cuatro
propiedades anteriores.

Variables discretas
Denicion 4.3 (Variable discreta). Una variable aleatoria discreta es aquella que slo puede tomar
valores dentro de un conjunto nito o innito numerable.
Denicion 4.4 (Funcin de probabilidad). Sea X una v.a. discreta que toma los valores xi con
probabilidades pi = Pr(X = xi), con Pi
pi = 1. Se denomina funcin de probabilidad de la variable X a la funcin que asigna a cada xi su
probabilidad pi
En las variables aleatorias discretas la funcin de distribucin viene dada por la siguiente expresion:
F(t) = Pr*X t] = X
xit
Pr(xi).
Esta funcin es escalonada, no decreciente, con saltos de discontinuidad en los puntos xi . El valor del
salto en xi coincide con la probabilidad, pi , de dicho valor.

Variables continuas
Denicion 4.5 (Variable continua). Una variable aleatoria continua es aquella que toma valores en uno
o varios intervalos de la recta real.
En las v.a. continuas la funcin de distribucin no se puede calcular como la suma de las probabilidades
de ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar
esta nueva situacin necesitamos la nocin de funcin de densidad.
Denicion 4.6 (Funcin de densidad). Dada una v.a. continua X, su funcin de densidad es la funcin
real de variable real
f(x) = lm
h0+
Pr(x h X x + h) 2h.
De este modo, surge el concepto de funcin de densidad como la funcin lmite a la cual se aproxima el
histograma. As, la probabilidad de un intervalo (a, b) ser el rea limitada por esta funcin de
densidad, las rectas x = a, x = b y el eje de abscisas. Aunque, de acuerdo con la anterior, la probabilidad
de que la variable aleatoria tome un valor concreto es igual a cero, tiene sentido analizar lo
densamente que est repartida la probabilidad en torno a ese valor.
De la denicion anterior, se deduce que la funcin de densidad verica las siguientes propiedades:
1. f(x) 0 x R.
2. f(x)dx = 1.
En general, cualquier funcin real que verica las propiedades anteriores es la funcin de densidad de
alguna v.a. continua X.
La funcin de distribucin de una v.a. continua X se expresa a partir de la funcin de densidad como:
F(t) = Z t
f(x)dx t R.
Esta funcin es continua.
Por lo tanto, la funcin de densidad de una v.a. continua es la derivada de su funcin de distribucin,
f(x) = F0(x).
Por otro lado, las v.a. continuas verican las siguientes propiedades:
1. Pr(t1 < X t2) = Z t2t1f(x)dx = F(t2) F(t1).
2. Pr(t1 X t2) = Pr(t1 < X t2) = Pr(t1 X < t2) = F(t2) F(t1).
3. Pr(X = t) = Z ttf(x)dx = 0 x R







BIBLIOGRAFIA

1. Kolmogorov AN. Grundbegrif e der Wahrscheinlichtkeitsrechnung. Berlin: Springer-Verlag;
1933. (Traducido al ingls: Morrison N. Foundations of the Theory of Probability. New York:
Chelsea; 1956).

2. Martn Pliego FJ, Ruiz-Maya L. Estadstica I: Probabilidad. Madrid: Editorial AC; 1997.

3. Meyer PL. Probabilidad y Aplicaciones Estadsticas. Mxico: Addison-Wesley
Iberoamericana; 1986.

3. Pea D. Modelos y mtodos. 1. Fundamentos. Madrid: Alianza Universidad Textos; 1993.

4. Katz DL. Epidemiology, Biostatistics and Preventive Medicine Review. USA: W.B. Saunders
Company; 1997.

5. Domnech JM. Mtodos Estadsticos en Ciencias de la Salud. Barcelona: Signo; 1997.

6. Hospital Ramn y Cajal. Material docente de la unidad de bioestadstica clnica.
Disponible en: http://www.hrc.es/bioest/M_docente.html