You are on page 1of 28

La distribución de probabilidad

Distribuciones acumuladas
La distribución normal
DISTRIBUCIÓN DE PROBABILIDAD

La distribución de probabilidad de una variable aleatoria discreta es


una tabla, gráfica, fórmula o cualquier otro medio que se use para
especificar todos los valores posibles de una variable aleatoria
discreta junto con sus posibilidades respectivas
EJEMPLO
Se tiene un lote de 50 peces parasitados. Construyamos la
distribución de probabilidad de X. Considerando el número de
parásitos por pez para la población.

Se puede construir una tabla


Valores posibles de x Frecuencia de P(X)=x Probabilidad de
ocurrencia que X tome un valor
particular, x
X F (x) P(X)
0 1 1/50
1 4 4/50
2 6 6/50
3 4 4/50
4 9 9/50
5 10 10/50
6 7 7/50
7 4 4/50
8 2 2/50
9 2 2/50
10 1 1/50
50 50/50
Esta distribución de probabilidad se puede expresar gráficamente

P
r
o
10/50
b
a
b
i
l
i 5/50
d
a
d

0 1 2 3 4 5 6 7 8 9 10 X

Los valores de p(X=x) son todos positivos, menores a 1 y su suma es


igual a 1. Lo anterior es una característica de las distribuciones de
probabilidad de variables discretas y por lo tanto a continuación se
emiten las propiedades esenciales de una distribución de
probabilidad de una variable discreta
1.- 0  P(X=x)  1
2.- P(X=x) = 1
Usando la distribución de probabilidad pueden hacerse proposiciones
de probabilidad referentes a la variable aleatoria X. Supóngase que
se elige un pez al azar ¿Cuál es la probabilidad de que el pez
elegido al azar tenga 3 parásitos?
P(X=3)= 4/50= 0.08
¿Cuál es la probabilidad de que el pez elegido al azar tenga 3 o 4
parásitos?

P(X=3)= 4/50= 0.08


P(X=4)= 9/50= 0.18
P(X=3 ó 4)= P(X=3) + P(X=4)= 0.08 + 0.18= 0.26
A veces es mejor trabajar con la distribución de probabilidad
acumulada de una variable aleatoria. Esto puede obtenerse sumando
sucesivamente las probabilidades de P(X=x). La probabilidad
acumulada para el ejemplo anterior será:
F (x) P(X) P(X) acum.
1 1/50 1/50
4 4/50 5/50
6 6/50 11/50
4 4/50 15/50
9 9/50 24/50
10 10/50 34/50
7 7/50 41/50
4 4/50 45/50
2 2/50 47/50
2 2/50 49/50
1 1/50 50/50
50 50/50
¿Cuál es la probabilidad de que el pez elegido al azar del grupo de los 50
tenga menos de 5 parásitos?
P(X < 5)
Se obtiene determinando el valor de la probabilidad acumulada para los
valores de X=0 hasta X=4. El valor es 24/50=0.48
¿Cuál es la probabilidad de que el pez elegido al azar del grupo de los 50
tenga 5 o más parásitos? . Esto es el complemento del grupo anterior y
como la probabilidad total es 1 y si conocemos el valor de P(X< 5), le
restamos a 1, 0.48 y el valor es 0.52
P(X  5)= 1-0.48= 0.52
¿Cuál es la probabilidad de que el pez elegido al azar del grupo de los 50
tenga entre 3 y 6 parásitos?
P(3 ≤X 6)= P(X 3) - P(X  6). La probabilidad de que X sea menor o igual
que 6 es igual a la probabilidad acumulada hasta X=6, que es 41/50=0.82 y
la probabilidad de que X sea menor a 3 es la probabilidad acumulada hasta
X=2. 11/50= 0.22.. Entonces: P(3 X  6)= 0.82-0.22= 0.60
La distribución normal
La formula fue publicada por primera vez por Abraham De Moivre en
1733, aunque Carl F. Gauss realizó muchas aportaciones y a menudo a
esta distribución se le conoce como distribución gaussiana
La densidad normal esta dada por:

1 2 2
f(x)= e –(-) /2 , - ∞<  < ∞
2

 y e son las constantes 3.14159 y 2.71828. Los parámetros de la distribución


son y 
Las características más importantes de la distribución son
1.-Es simétrica con respecto a su media, , la curva hacia cualquiera de los
dos lados de  es igual.
2.-La media, la mediana y la moda son iguales.
3.-El área total debajo de la curva por encima del eje x es una unidad
cuadrada. El 50% del área está a la derecha de una perpendicular
levantada en la media y el 50% hacia la izquierda.
4.-Si se levantan perpendiculares a una distancia de una desviación
estándar de la media, en ambas direcciones, el área encerrada será
aproximadamente el 68% del total. Si extienden hasta dos desviaciones
estándar, se encerrará aproximadamente el 95% del área y si se extiende a
tres desviaciones el área corresponderá al 99.7% del total
aproximadamente.
5.-La distribución normal queda completamente determinada por los
parámetros  y . Esto es, se define una distribución diferente para cada
valor diferente de  y .
La distribución normal unitaria.- es la distribución que tiene una media
de cero y una desviación de 1. Esta distribución puede obtenerse a
partir de la ecuación anterior,asignando a = 0 y = 1. La variable
aleatoria que resulta , (- )/ , generalmente se designa por la letra
z, de modo que, la ecuación para la distribución normal unitaria queda
como sigue

1 2
f(z)= e-z /2
, - ∞< z < ∞
2
Para encontrar la probabilidad de que z tome un valor entre dos puntos
cualesquiera del eje z, digamos z0 y z1debemos encontrar el área limitada por
las perpendiculares levantadas en esos puntos, la curva y el eje horizontal.

z1 1
z =
2
z
e -z /2
dz
0 2
La tabla F presenta las áreas bajo la curva entre 0 (media) y los valores de z. El
área sombreada en la figura representa el área dada en la tabla.
Dada la distribución normal unitaria, encontrar el área bajo la curva, por encima
del eje z, entre 0 y z=2. UN primer paso puede ser sombrear el área bajo la
curva. Se busca en la tabla el valor para z= 2.0 y este es 0.4772. Este valor se
puede interpretar de diferentes formas:
Como la probabilidad de que una z elegida al azar de la población z tenga un
valor entre 0 y 2
Como la frecuencia relativa de la ocurrencia de los valores de z entre 0 y 2
El 47.72% de las z tiene un valor entre 0 y 2.

¿Cuál es la probabilidad de que una z elegida al azar de entre la población de


z tenga un valor entre -2.55 y +2.55?
La tabla F indica un valor de 0.4946, pero debe duplicarse ya que ese valor
solo corresponde a una parte de la curva.
¿Qué proporción de los valores de z están entre -2.74 y 1.53?

En tabla se busca el área entre 0 y 1.53= 0.4370 y también el área entre 0 y -2.74
que es = 0.4949. Luego se suman y el área total es 0.9339

Dada la distribución normal unitaria, encontrar P(z 2.71)


Dado que se requiere conocer el área hacia la derecha de 2.71, y se obtiene
restando el área entre 0 y 2.71 a 0.5.
P(z 2.71)= 0.5-0.4996= 0.0034
Dada la distribución normal unitaria, encontrar P(0.84  z 2.45)
Primero se obtiene el área entre 0 y 2.45 y de esta se resta el área entre 0 y 0.84

P(0.84  z 2.45)= P(0  z 2.45) - P(0  z 0.84)= 0.4929-0.2996= 0.1933

Aplicaciones
Muchas de las variables tiene una distribución normal y en otros casos
se supone que se distribuyen normalmente

La talla promedio de una almeja es de 10 cm con una desviación de 2.5 cm. Si


elegimos una almeja al azar de esa población ¿Cuál es la probabilidad de que
mida 15 cm o más?
Para solucionar debemos transformar la distribución de la variable x en la normal
unitaria, estoes transformar todos los valores de x en los correspondiente valores
de z. Estoes que la media debe hacerse 0, como la media de z. Para lo cual
usamos la formula siguiente:

- 
Z= 
15- 10
Z= =2
2.5

Entonces el valor de zo que se busca en la tabla es 2.0 y el


área bajo la curva es 0.0228 y esta es la probabilidad
solicitada

NOTA: La distancia desde la media (10) hasta el valor de x que interesa (15)
es 15-10 =5, la cual equivale a una distancia de dos veces la desviación
estándar. Cuando se transforman los valores de x a z, la distancia del valor
de z que interesa hasta su media, 0, es igual a la distancia del valor x
correspondiente hasta su media, 10 en unidades de desviación estándar.

P(x 15)= P(z  15-10/2.5)= P(z 2)=0.0228


Los pesos de una población de monos están distribuidos normalmente
con un a media de 70 Kg y una desviación estándar e 12.5 Kg ¿Cuál es
la probabilidad de que un mon0 elegido al azar de esa población pese
entre 50 y 85 Kg?

50- 70 85- 70
Z= = -1.6 Z= = 1.2
12.5 12.5
Se busca en tabla F el área entre 0 y -1.6 = 0.4452 y el área entre 0 y 1.2=
0.3849 y luego se suman. El resultado es 0.8301 que corresponde a la
probabilidad requerida.

P(50  x  70)= P( 50-70/12.5  z  85-70/12.5)

P(-1.6  z  1.2)=
P(-1.6  z  0.) + P(0  z  1.2)
0.4452+ 0.3849 = 0.8301
Distribución de frecuencias Distribución de probabilidad

Datos observados (muestra) Probabilidad teórica


(población)
Dada por la frecuencia con La que presenta el conjunto
que se observan realmente de todos los valores que
los valores de una variable teóricamente puede tomar
tomados a partir de una una variable, junto con sus
muestra probabilidades
correspondientes calculadas
de acuerdo al principio de la
ley de Laplace u otras
análogas

Ejercicio de lanzamiento de monedas, 10, 20, 50 y 100 veces.


Elaboración de un histograma de frecuencias de cada evento y
compararla con la distribución de probabilidad
La distribución binomial se refiere a sucesos donde solo existen dos
posibilidades, por ejemplo el lanzamiento de una moneda, el sexo en seres
vivos, la presencia de banda negra en corales. Estos son sucesos
mutuamente excluyentes.

Al lanzar una moneda, la probabilidad de que caiga a águila es 0.5 y de que


caiga sol es 0.5. Cuando lanzamos dos monedas a la vez, existen cuatro
posibilidades teóricas de 0.25 o ¼ (Cuadro)

Distribución teórica de la probabilidad de Distribución teórica de la probabilidad de obtener un cierto


obtener una combinación de águilas o soles al número de águilas al lanzar dos monedas
lanzar dos monedas
P (águila= k) No. águilas Probabilidad
Resultado Probabilidad
P( águilas=0) 0 ¼
2 águilas ¼
P( águilas=1) 1 águila ¼ + ¼ = 1/2
1 águila y un sol ¼
P( águilas=2) 2 águilas ¼
1 sol y 1 águila ¼
2 soles ¼
Hay dos características que definen los posibles resultados de una distribución
binomial; una es el número de intentos o unidades (tirada de moneda,
ejemplares observados) y la otra es la probabilidad de cada intento para obtener
un resultado.
La información para aplicar una distribución binomial es:
n= número de intentos o ensayos
π=probabilidad esperada o teórica de éxito
k=número de éxitos o sucesos favorables

Si en una población de peces arrecifales (Thalassoma bifasciatum), la probabilidad


de encontrar un macho es del 20% ¿Cuál es la probabilidad de que al realizar un
muestreo de dos peces, ambos sean machos?
k= 2; n= 2 y π=0.2 La probabilidad de que ambos sean
0.2 también es ♂ machos es=0.2 x 0.2= 0.04
0.2 es ♂
0.8 es ♀
¿Es ♂ el
primero?
0.2 es ♂

0.8 es ♀
0.8 es ♀
Cuando tenemos muchos ensayos y sucesos favorables, es
necesario aplicar una fórmula:
p(k)= πk (1- π) n-k n!
(n-k)! k!

La distribución binomial, simbolizada como B (n,π ) permite modelizar la distribución


de frecuencias de un cierto carácter dicotómico (éxito o fracaso) que se observan al
extraer aleatoriamente muestras (con reposición) de tamaño n de una población en
la que conocemos la proporción π de dicho carácter. Siempre que se conozca la
probabilidad de obtener un resultado, la expresión matemática nos indica cual es la
probabilidad p de obtener k resultados (éxitos = k) después de n intentos.

¿Cuál es la probabilidad de que al capturar 10 peces arrecifales (Thalassoma


bifasciatum), encontremos a 3 ♂?
K=3; n=10; π =0.2

p(k=3)= 0.23 (1- 0.2) 10-3 10!


(10-3)! 3!
10! 0.2013
p(k=3)= 0.23 (0.8) 7
7! 3!
¿Cuál es la probabilidad de que al capturar 10 peces arrecifales (Thalassoma
bifasciatum), encontremos cuando mucho a 3 ♂? Para esto, tendremos que
sumar a 0.2013, la probabilidad de encontremos 2 ♂ y la probabilidad de que
capturemos 1 ♂ y la probabilidad de que no encontremos ni 1 ♂
k=3; n=10; π =0.2
p(k≤3)= p (k=0) + p (k=1)+ p (k=2)+ p (k=3)

¿Cuál es la probabilidad de que al capturar 10 peces arrecifales (Thalassoma


bifasciatum), encontremos cuando mucho a 2 ♂? k=3; n=10; π =0.2

¿Cuál es la probabilidad de que al capturar 10 peces arrecifales (Thalassoma


bifasciatum), encontremos cuando mucho a 1 ♂? k=3; n=10; π =0.2

¿Cuál es la probabilidad de que al capturar 10 peces arrecifales (Thalassoma


bifasciatum), encontremos cuando mucho a ningún ♂? k=3; n=10; π =0.2
Distribución binomial para n=10 y π =0.2
n!
k p(k)= πk (1- π) n-k Σp(k)
(n-k)! k!

0 0.107 0.107
1 0.268 0.376
2 0.302 0.678
3 0.201 0.879
4 0.088 0.967
5 0.026 0.994
6 0.0055 0.999
7 0.0008 ≈1.000
8 0.0001 ≈1.000
9 0.000004 ≈1.000
10 0.0000001 1
Si graficamos estos datos, obtendremos una figura asimétrica, que tenderá a la
simetría a medida que la proporción teórica se aproxime a 0.5 y también a medida
que se aumente el tamaño de muestra.
Cuando una distribución binomial tiene un tamaño grande (n≥100) y la
característica de interés es poco frecuente (π≤0.05) existe una aproximación a
la distribución de Poisson cuya expresión es:

p (k)= λ
k
e-λ Donde,
k!

λ=nπ y e es la base de los logaritmos naturales e=2.71828, por lo cual para


aplicar la distribución de Poisson se requiere conocer dos datos: número de
sucesos observados (k) y número de sucesos esperados (λ)

Ejemplo
¿Cuál es la probabilidad de encontrar entre 200 colonias coralinas, 1 con
enfermedad de banda roja cuya probabilidad (π) es de 0.01?
λ= 200 x 0.01= 2 que se interpreta como el número de sucesos esperados

21 La probabilidad de encontrar una colonia


p (k=1)= e-2 0.271
1! enferma entre las 200 estudiadas es de
0.271 o del 27.1%
Si se hubieran encontrado 20 colonias enfermas entre las 200, la probabilidad
de explicar este hallazgo solo por el azar sería muy pequeña y podría decirse
que hay una gran diferencia entre lo observado y lo esperado

230 5.8 x 10-14


p (k=20)= e-2
20!

Esto indica que la probabilidad de explicar este hallazgo al azar es mínima, lo


cual hace sospechar de que el valor asumido (π=0.01) sea incorrecto en la
población muestreada. Por lo que el procedimiento para calcular lo esperado de
acuerdo al a distribución Poisson, se aplica siempre que:
El tamaño de muestra sea grande (n≥100)
El suceso sea poco frecuente (π=0.05)
En cambio, la binomial se aplica siempre y proporciona resultados exactos
Distribución binomial para n= 10 y π= 0.2. Las áreas sombreadas corresponden a las aproximaciones
donde no se cumple n grande y π pequeña
Parámetros Binomial Poisson Error de la aprox.
n k p de Poisson

50 1 0.1 0.0286 0.0337 0.0051

50 1 0.1 0.0779 0.0842 0.0063

50 1 0.1 0.1386 0.1755 0.0369

100 1 0.1 0.0003 0.0005 0.0002

100 2 0.1 0.0016 0.0023 0.0007

100 5 0.1 0.0339 0.0378 0.0039

100 1 0.05 0.0312 0.0337 0.0025

100 2 0.05 0.0812 0.0842 0.0030

100 5 0.05 0.1800 0.1755 -0.0045

170 2 0.05 0.0065 0.0074 0.0009

170 5 0.05 0.0735 0.0752 0.0017

170 10 0.05 0.1130 0.1104 -0.0026

170 0 0.01 0.1811 0.1827 0.0016

170 2 0.01 0.2655 0.2640 -0.0015

En la distribución Poisson su media y varianza coinciden. Como esta distribución se aproxima bien a una
binomial cuando n es grande y π pequeña, la Poisson está indicada cuando hay sucesos raros, como
ocurrencia de enfermedades por unidad de tiempo (se asume que ocurre homogeneamente en un tiempo) o
número de partículas en el medio (se asume que están repartidas al azar en todo el medio)

You might also like