You are on page 1of 36

BIOESTADÍSTICA

Modelos de Probabilidad

Facultad de Ingeniería Ambiental - UNI


MSc. Beatriz Castañeda S.
Distribución de Bernoulli
X: Número de éxitos en una prueba con dos resultados
posibles (éxito o fracaso)
P(éxito)= P P(fracaso)=1-P
Valores que puede asumir x: 0, 1; donde 0  fracaso y 1  éxito
1  P, si x  0
f (x )   ;   P ;  2  P(1  P )
 P, si x  1
a) Instituciones que solicitan un préstamo pueden acceder o no acceder
al préstamo
b) Un cliente puede adquirir un nuevo producto o no adquirirlo
c) Un producto puede ser defectuoso o no defectuoso
d) Individuos pueden fumar o no fumar
e) A la exposición a un contaminante los trabajadores pueden
desarrollar cierta enfermedad o no desarrollarla.

Bioestadística Mg. Beatriz Castañeda S. 2


Distribución Binomial
El experimento consiste en realizar n pruebas independientes, cada una con 2
resultados posibles (éxito o fracaso)
Donde P(éxito)= P P(fracaso)=1-P constante para todas las pruebas

X: Número de éxitos en n pruebas independientes, cada una


con dos resultados posibles (éxito o fracaso)

Valores que puede asumir x: 0, 1, 2, ..., n

 n x
P ( X  x )    P (1  P )n x ;   nP ;  2  nP (1  P )
 x

Bioestadística Mg. Beatriz Castañeda S. 3


Distribución Binomial

1.10 Supóngase que se sabe que la probabilidad de recuperación de cierta


enfermedad es de 0,40. Si 15 personas contraen la enfermedad (considérese
esto como una muestra aleatoria), ¿ cuál es la probabilidad de que
a) Tres o más se recuperen?
b) Cuatro o más se recuperen?
c) Cinco o más se recuperen?
d) Menos de tres se recuperen?

Bioestadística Mg. Beatriz Castañeda S. 4


Distribución Hipergeométrica
Población N

A Ac
P= T Proporción poblacional
T N-T N

Muestra n
A Ac
P = x proporción muestral
x n-x n

X: Número de elementos A en la muestra

La selección de la muestra es sin reposición


Bioestadística Mg. Beatriz Castañeda S. 5
Distribución Hipergeométrica
El experimento consiste en extraer, sin reposición, una muestra de n elementos
de un conjunto que tiene N elementos, de los cuales T son de tipo A y el resto
son no A

X: Número de elementos A en la muestra


T  N  T 
    
  x   n  x 
f ( x)   N x : 0, 1, 2, ..., n si n  T y n  N  T
  
 n
0 para otro valor x

T  T   N  T  N  n   N  n
  E( X )  n ;  2  n     nP (1  P )  
N  N   N  N  1   N 1 
Bioestadística Mg. Beatriz Castañeda S. 6
Distribución Hipergeométrica
 Ejemplo 1.11
Mecanismos de dirección defectuosos han sido montados por
error en 3 de un grupo de 9 misiles. No se sabe que misiles tienen
los mecanismos defectuosos. Si se toma una muestra al azar de 4
misiles ¿cuál es la probabilidad de que:
a) La muestra no contenga misiles defectuosos?
b) La muestra contenga 2 misiles defectuosos?

 Ejemplo 1.12.
Ciertos componentes para ensamble se envían en lotes de 25
unidades, para la aceptación de un lote se seleccionan 3
componentes al azar y si ninguno de ellos tiene defectos se
acepta el lote. ¿Cuál es la probabilidad de que se acepte el lote si
contiene:
a) cinco defectuosos?
b) Dos defectuosos?
Bioestadística Mg. Beatriz Castañeda S. 7
Aproximación de la Distribución
Hipergeométrica a la binomial
 T  N  T 
  
 x  n  x   n  x T
Lím    P (1  P ) n  x ; haciendo P 
N  N  x N
 
n
P( X  x)  P( X  x)
Hipergeométrica Binomial

 N n
  nP ;  2  nP (1  P )   nP (1  P )
 N 1 
n
Para N tal que  0.10 decimos que N es grande
N
o que la población es grande

Bioestadística Mg. Beatriz Castañeda S. 8


Distribución Hipergeométrica
 Ejemplo 1.13
 Supóngase que el 24% de los individuos de una población
utiliza cierto producto B. Para una muestra de tamaño 20
extraída de esta población, encuentre la probabilidad de que
 a) Se encuentren exactamente tres personas que utilizan el
producto B
 b) Se encuentren tres o más personas que lo utilicen.
 c) Se encuentren menos de tres
 d) Se encuentren exactamente cinco

 Ejemplo 1.14
De un lote de 200 unidades de las cuales 10 son defectuosas se obtiene
una muestra aleatoria de tamaño 4. Halle la probabilidad de que esta
contenga un artículo defectuoso.

Bioestadística Mg. Beatriz Castañeda S. 9


Distribución de Poisson
X: Número de “hechos” por unidad especificada (de tiempo,
longitud, superficie o volumen)

 x
Donde X: 0, 1, 2, ..... P( X  x)  e ;   ;  2 
x!

 es el número promedio o esperado de “hechos”por unidad especificada.


Este modelo es aplicable sobre todo cuando:
 Las ocurrencias de los eventos en cada unidad de observación son
independientes
 Teóricamente, debe ser posible un número muy grande de ocurrencias del
evento.
 La probabilidad de que se presente una sola vez el evento en una
determinada unidad es proporcional a la longitud de la unidad.
 Si consideramos una unidad infinitesimalmente pequeña, la probabilidad de
que el hecho ocurra más de una vez es despreciable.

Bioestadística Mg. Beatriz Castañeda S. 10


Distribución de Poisson
 Ejemplo 1.14.
Supóngase que durante un período de varios años el número promedio
de accidentes graves en una planta de montaje ha sido de diez. Si el
número de accidentes sigue la distribución de Poisson, ¿cuál es la
probabilidad de que durante el año que transcurre?
a) Tengan accidentes graves exactamente siete trabajadores de la
planta de montaje.
b) Se accidenten diez o más trabajadores.
c) No haya accidentes.
d) Haya menos de cinco accidentes

 Ejemplo 1.15.
Un proveedor de películas produce al año 10 rollos de película
especialmente sensible. La película debe descartarse si no se vende
dentro del año. Experiencias anteriores indican que D, la demanda
(pequeña) para la película es una variable con distribución de Poisson
con media 8. Si se obtiene una utilidad de $7 en cada rollo vendido,
mientras que ocurre una pérdida de $3 en cada rollo que debe ser
descartado. Calcular la utilidad esperada que el fabricante puede
obtener con los 10 rollos que produce.
Bioestadística Mg. Beatriz Castañeda S. 11
Aproximación de la Distribución
binomial a la Poisson

 n x n x e   x
Lím   P (1  P )  ; haciendo   nP
n   
x x !
p 0

P( X  x)  P( X  x)
Binomial Poisson

Se asume n grande si n  100


y P pequeño si P  0.05

Bioestadística Mg. Beatriz Castañeda S. 12


Aproximación de la Binomial a la Poisson

 Ejemplo 1.16.
Una compañía de seguros halla que el 0.005% de la población fallecía cada
año debido a cierto tipo de accidente, ¿cuál es la probabilidad de que tenga
que pagar a más de 3 de 10 000 asegurados contra tales accidentes en un
año?

 Ejemplo 1.17.
El número de defectos superficiales que os paneles de plástico utilizados en
los interiores de los automóviles ocurre a una tasa de 0.5 defectos por pie
cuadrado de panel. Suponga que el interior de un automóvil contiene 10 pies
cuadrados de material.
a) ¿Cuál es la probabilidad de que no haya defectos superficiales en los
interiores de un automóvil?
b) Si se venden 10 automóviles a una compañía, ¿cuál es la probabilidad de
que máximo dos de ellos tengan a lo más 1 defecto superficial en sus
interiores?
c) Si se venden 100 automóviles a una compañía, ¿cuál es la probabilidad de
que máximo dos de ellos tengan a lo más un defecto superficial en sus
interiores?

Bioestadística Mg. Beatriz Castañeda S. 13


Modelo Exponencial
 e  x ; si x  0
f ( x)   ; con   0
0 para otro valor x

1 1 1
 ;  
2
;  
 2 

La distribución exponencial se aplica para el estudio del


tiempo de vida o duración de productos y en procesos de
fenómenos de tiempos espera

Bioestadística Mg. Beatriz Castañeda S. 14


Relación entre el modelo
Exponencial y el modelo de Poisson
Modelo de Poisson

X: nº de hechos ocurridos en un periodo de tiempo T

x
f ( x)  e 
x!

Modelo Exponencial

T: Tiempo transcurrido entre 2 hechos consecutivos

f (t )   e t

Bioestadística Mg. Beatriz Castañeda S. 15


Distribución normal
Dada una variable X con distribución normal de
media  y varianza 2, denotamos X es N(,2)

1 x  
2

  
2  
e
f ( x)  ;  x
2

E( x)   y V ( x)   2 X
-k  +k
Me
Mo

Bioestadística Mg. Beatriz Castañeda S. 16


Distribución normal N(,2)

68%

X
-   +

95% 99%

X X
-2   + 2  - 3   +3 

Bioestadística Mg. Beatriz Castañeda S. 17


Propiedades del modelo
Normal
1. Si X es N(x, x2), entonces Y = a + b X es normal

Con y = a + b x

 2 y = b2  2 x

2. Si X1, X2, ...Xn son n variables independientes cada una


con distribución normal N(i, i2), entonces

Y= a1 X1 + a2 X2 + ...... + an Xn es normal

Con y = a1 1 + a2 2 + ..... + an n

2y = a12 12 + a22 22 + .... + an2 n2


Bioestadística Mg. Beatriz Castañeda S. 18
Propiedades del modelo Normal

x  x
3. Si X es N(x, x2), entonces Z 
x

Se denomina variable estandarizada y


tiene distribución normal con

Z  0 y  Z2  1

y simbolizamos Z es N(0,1)
Bioestadística Mg. Beatriz Castañeda S. 19
Distribución normal estándar
Si X es N(,2) y Z = X -  entonces Z es N(0,1)

Z
-3 -2 -1 0 1 2 3
Z indica las distancias respecto a la media en unidades de desviación estándar

Bioestadística Mg. Beatriz Castañeda S. 20


Distribución normal

1. En la realización de una prueba los alumnos tardan en


promedio 2,1 minutos en examinar y comprender cada
pregunta. Suponga que el tiempo que se tardan se distribuye
en forma normal y que la desviación estándar es de 0,6
minutos.

a) ¿Qué porcentaje de los alumnos tardan entre 2,45 y 3,55


minutos?

b) Si el tema consiste de 5 preguntas ¿qué porcentaje de los


alumnos comprenderá el tema en un lapso entre 5 y 15
minutos?

c) ¿Qué tiempo necesitarán, para comprender el tema, el 10%


más hábil y el 10% menos hábil?
Bioestadística Mg. Beatriz Castañeda S. 21
Distribución normal
2. Las vidas útiles de las pilas de cierta marca
están distribuidas normalmente con una media de
80 horas y una desviación estándar de 10 horas.
El fabricante garantiza que reemplazará cualquier
pila que falle antes de cumplirse la garantía.
¿cuánto tiempo debe dar de garantía de modo que
no más del 5% de las pilas fallen antes de este
tiempo?

Bioestadística Mg. Beatriz Castañeda S. 22


Teorema del límite Central
Sean x1, x2, …., xn una sucesión de variables aleatorias
independientes tales que tienen la misma distribución f(x), entonces
la variable
X =  xi
tiene distribución que se aproxima al modelo normal conforme n
crece
x =  E(xi) 2x =  V(xi)
Luego
X  x
Z  N (0,1) conforme n  
x
Para esta aproximación se asume n grande si n  30

Bioestadística Mg. Beatriz Castañeda S. 23


Aproximación de la distribución
Binomial a la Normal
Modelo Binomial
X: Número de éxitos en n pruebas independientes de Bernoulli
  nP ;  2  nP (1  P )

Sea Xi : Número de éxitos en la i-ésima prueba de Bernoulli


Entonces cada Xi tiene distribución de Bernoulli E ( X i )  P ; V ( X i )  P (1  P )
n
Luego podemos definir a la variable binomial como X   X
i
1

Por consiguiente por el TLC X  N (   nP ,  2  nP (1  P ) )


n 
Bioestadística Mg. Beatriz Castañeda S. 24
Aproximación de la distribución
Binomial a la Normal

Dada una variable X con distribución Binomial (n,p), donde p = 0.50


Se cumple que las probabilidades de valores de X son simétricas
para valores alrededor de su media  = np

0 np n
x
Si np > 5 y n(1-p) > 5, entonces X se aproxima a la normal con  = np
y 2 = np(1-p)

P( X = xo )  P[ xo – 0,5 < X < xo + 0,5]


Binomial Normal factor de corrección
de continuidad
Bioestadística Mg. Beatriz Castañeda S. 25
Aproximación de la distribución
Binomial a la Normal

1. Según los archivos el 15% de los trabajadores de las plantas de cemento son
afectados por el sílice, desarrollando neumoconiosis.
a) Si un organismo estatal selecciona, al azar, 16 trabajadores de una planta de
cemento para evaluar su estado de salud, ¿cuál es la probabilidad de que a lo
más el 25% de los trabajadores, de la muestra, haya desarrollado
neumoconiosis?. La planta tiene 500 trabajadores.
b) ¿Cuál sería la probabilidad en a) si se elige una muestra de 40 trabajadores para
ser evaluados por el servicio de salud?

2. Dado que no todos los pasajeros de una aerolínea abordan el vuelo para el que
han reservado un lugar, la aerolínea vende 125 boletos para un vuelo de 120
pasajeros. La probabilidad de que un pasajero no aborde el vuelo es 0.10 y el
comportamiento de los pasajeros es independiente.
a) ¿Cuál es la probabilidad de que se tenga que transferir pasajeros para otro
vuelo?
b) ¿Cuál es la probabilidad de que el avión despegue con hasta el 10% de los
asientos vacíos?
Bioestadística Mg. Beatriz Castañeda S. 26
Distribución de funciones de
variables aleatorias

1. Propiedad del Modelo Normal

Si X1, X2, ...Xn son n variables independientes cada


una con distribución normal N(i, i2), entonces

Y = a1 X1 + a2 X2 + ...... + an Xn es normal, con

y = a1 1 + a2 2 + ..... + an n

2y = a12 12 + a22 22 + .... + an2 n2

Bioestadística Mg. Beatriz Castañeda S. 27


Distribución de funciones de
variables aleatorias
2. Teorema del límite Central
Sean x1, x2, …., xn una sucesión de variables aleatorias
independientes tales que tienen la misma distribución f(x), entonces
la variable
X =  xi
tiene distribución que se aproxima al modelo normal conforme n
crece
x =  E(xi) 2x =  V(xi)
Luego
X  x
Z  N (0,1) conforme n  
x
Para esta aproximación se asume n grande si n  30
Bioestadística Mg. Beatriz Castañeda S. 28
Distribución de funciones de
variables aleatorias
3. Distribución Ji-Cuadrado

1 ( k / 2 ) 1  x / 2
f ( x)  x e , para x  0
2  ( k / 2)
k/2

  E( X )  K ;  2 V ( X )  2 K
0 K
 (k2 )

K es denominado grados de libertad

Bioestadística Mg. Beatriz Castañeda S. 29


Propiedades

a) Si Z es normal N(0, 1) , entonces Z2 tiene


distribución Ji- Cuadrado con un grado de libertad,
y denotamos

Z2 es 2 (1)

b) Si X es normal N(, 2) , entonces

X 
2

Z 
2
 es  (21)
  

Bioestadística Mg. Beatriz Castañeda S. 30


Propiedades

c) Si Y1, Y2, …., Yn son variables aleatorias independientes cada una


con distribución Ji- Cuadrado con ki grados de libertad entonces la
variable aleatoria

n
X  Y1  Y2  . . . .  Yn es  (2r ) donde r  k
1
i

d) Si X1, X2, …., Xk son variables aleatorias independientes cada una


con distribución normal N( , 2), entonces la variable aleatoria

x 
k 2

Y   i  es  (k2 )
1   
Bioestadística Mg. Beatriz Castañeda S. 31
Uso de tablas

Sea la v.a. Ji-Cuadrado con k = 12 , entonces

0.70
P(2 (12)  14) = 0.70
0 14
 (212)

Dada la probabilidad p = 0.90, ubicamos la cuantila X0.90 = 18.5

0.90
0 18.5
 (212)

Bioestadística Mg. Beatriz Castañeda S. 32


Distribución t-Student

( k  1) / 2 1
f ( x)  para    x  
 
. ( k 1) / 2
,
k ( k / 2) ( x / k )  1
2

  E( X )  0 ;
k
 2 V ( X ) 
k2
para k  2
X
-t 0 t

El parámetro K es denominado grados de libertad, y decimos que X es t-Student


con k grados de libertad y denotamos: X es t(k)

Bioestadística Mg. Beatriz Castañeda S. 33


Propiedad

Si Z es normal N(0, 1) y Y es Ji- Z


cuadrada con k grados de libertad, y si T es t(k )
Y
Z y Y son variables independientes,
entonces la variable k

USO DE TABLAS

P(t (12)  1.782) = 0.95 0.95


Sea la v.a. t-Student
con k = 12 , entonces t(12)
1.782

0.01
0.01
Dada la probabilidad p = 0.99, 0.98
ubicamos la cuantila X0.99 = 2.681 t(12)
-2.681 2.681

Bioestadística Mg. Beatriz Castañeda S. 34


Distribución F
u/ 2
u  v  u  ( u / 2 ) 1
    x
 2  v
f ( x)  , para 0  x  
(u / 2) (v / 2) ( u / v ) x  1
( u v ) / 2

v 2v 2
(u  v  2)
  E( X )  ; 2  , para v  4
v2 u(v  2) (v  4)
2

0 K
F( u ,v )

Decimos que X tiene distribución F con grados de libertad (u,v) y


denotamos: X es F(u,v)
Bioestadística Mg. Beatriz Castañeda S. 35
Propiedad

Sean W y Y variables aleatorias Ji-Cuadrada con grados de libertad, u y v,


respectivamente, entonces el cociente

W /u
F es F( u,v )
Y /v
Uso de tablas
(3,5)  0.415) = 0.25
Sea la v.a. F(3,5) , entonces P(F

0.25
F( 3 ,5 )
0.425

Bioestadística Mg. Beatriz Castañeda S. 36

You might also like