You are on page 1of 21

DISTRIBUCIÓN NORMAL

La distribución normal es, sin duda, la distribución de probabilidad más importante


del Cálculo de probabilidades y de la Estadística. Fue descubierta por De Moivre
(1773), como aproximación de la distribución binomial. De todas formas, la
importancia de la distribución normal queda totalmente consolidada por ser la
distribución límite de numerosas variables aleatorias, discretas y continuas, como
se demuestra a través de los teoremas centrales del límite. Las consecuencias de
estos teoremas implican la casi universal presencia de la distribución normal en
todos los campos de las ciencias empíricas: biología, medicina, psicología, física,
economía, etc. En particular, muchas medidas de datos continuos en medicina y
en biología (talla, presión arterial, etc.) se aproximan a la distribución normal.

Junto a lo anterior, no es menos importante el interés que supone la simplicidad de


sus características y de que de ella derivan, entre otras, tres distribuciones (Ji-
cuadrado, t y F) que se mencionarán más adelante, de importancia clave en el
campo del contraste de hipótesis estadísticas.

La distribución normal queda totalmente definida mediante dos parámetros: la


media (Mu) y la desviación estándar (Sigma). Campo de variación:
-∞ < x < ∞

Parámetros:
µ=Mu: media de la distribución, -∞ < Mu < ∞
=Sigma: desviación estándar de la distribución, Sigma > 0

La distribución continua de probabilidad más importante en todo el campo de la


estadística es la distribución normal.

Su gráfica, que recibe el nombre de curva normal, es la curva en forma de


campana, la cual describe en forma aproximada muchos fenómenos que ocurren
en la naturaleza, la industria y la investigación.
A la distribución normal, frecuentemente se le llama distribución Gaussiana. Una
variable aleatoria continua X que tiene la distribución en forma de campana de la
figura, se le llama variable aleatoria normal.

La ecuación matemática para la distribución de probabilidad de la variable normal


depende de los parámetros µy , su media y su desviación estándar. Por lo que
representan los valores de densidad de X por n(X; µ, )

Una vez que se especifican la media y la varianza, la curva normal se determina


completamente.
Ejemplo si la media es igual a 50 y la varianza igual a 5, entonces las ordenadas
n(x;50,5) pueden calcularse.
1. La moda, que es el punto sobre el eje horizontal donde la curva tiene su
máximo, ocurre en x= µ.
2. La curva es simétrica alrededor de su eje vertical donde se tiene la media µ.
3. La curva tiene sus puntos de inflexión en x= µ, + , es cóncava hacia abajo si
µ- <X< µ + , y es cóncava hacia arriba en cualquier otro punto.
4. La curva normal se acerca al eje horizontal en forma asintótica en cualquiera
de las dos direcciones, alejándose de la media.
5. El área total bajo la curva y arriba del eje horizontal es igual a 1.

La distribución de una variable aleatoria normal con media cero y varianza 1 recibe
el nombre de distribución normal estándar.

La función de densidad de la variable aleatoria normal X, con media µ y


Desviación estándar σ es

Dónde :y e: 2.71828

Una vez que se especifican µ y σ, la curva normal queda determinada por


completo.
En Figura trazamos dos curvas normales con la misma media pero con diferentes
desviaciones estándar (la curva de color roja tiene menos desviación estándar que
la curva azul).
En la primera figura vemos que las dos curvas están centradas exactamente en
la misma posición sobre el eje horizontal, pero la curva azul es más baja y se
extiende más lejos. Recordemos que el área bajo la curva de probabilidad debe
ser igual a 1, y entre más variable sea el conjunto de observaciones más baja y
ancha será la curva correspondiente.

En la segunda figura trazamos dos normales que tienen la misma desviación


estándar pero diferentes medias. Las curvas son idénticas en forma pero están
centradas en diferentes posiciones a lo largo del eje horizontal.

En la tercera figura se muestra el resultado de trazar dos curvas normales que


tienen deferentes medias y distintas desviaciones estándar. Claramente, están
centradas en posiciones diferentes sobre el eje horizontal y sus formas reflejan los
dos valores distintos de σ.

De una inspección de las figuras anteriores y al examinar la primera y segunda


derivada de n(x;µ,σ) se cumple:

1. La moda (punto sobre el eje horizontal donde la curva es un máximo) ocurre en x=µ.
2. La curva es simétrica alrededor de un eje vertical a través de la media µ.
3. La curva tiene sus puntos de inflexión en x=µ ± σ, es cóncava hacia abajo si µ-σ<X<
µ+σ, y es cóncava hacia arriba en cualquier otro punto.
4. La curva normal se aproxima al eje horizontal de manera asintótica conforme nos
alejamos de la media en cualquier dirección.
5. El área total bajo la curva y sobre el eje horizontal es igual a 1.
6. Los parámetros µ y σ son realmente la media y la desviación estándar de la distribución
normal.

Muchas variables aleatorias tienen distribuciones de probabilidad que se pueden


describir de manera adecuada mediante la curva normal una vez que se
especifiquen μ y σ. Por ahora supondremos que se conocen estos dos
parámetros, quizás de investigaciones previas. Más adelante haremos inferencias
estadísticas cuando se desconozcan μ y σ y se estimen a partir de datos
experimentales disponibles.
Áreas bajo la curva. La curva de cualquier función de densidad se construye de
modo que el área bajo la curva limitada por las dos ordenadas x=x1 y x=x2 es igual
a la probabilidad de que la variable aleatoria X tome un valor entre x=x1 y x=x2. De
esta forma la probabilidad está dada por:
En la figura está representada por el área de la región sombreada

La dificultad que se encuentra al resolver las integrales de funciones densidades


normales necesita de la tabulación de las áreas de la curva normal para una
referencia rápida. Sin embargo, sería una tarea difícil intentar establecer tablas
separadas para cada valor de μ y σ.
Afortunadamente, podemos transformar todas las observaciones de cualquier
variable aleatoria normal X a un nuevo conjunto de observaciones de una variable
normal Z con media 0 y desviación estándar 1. Esto se logra por la transformación

N( μ, σ)

X= valor de la variable aleatoria de interés.


µ = media de la distribución de la variable aleatoria.
Sigma = desviación estándar de la distribución.
z = número de desviaciones estándar que hay desde x a la media de la
distribución. (El uso de z es solamente un cambio de escala de medición del eje
horizontal)

Siempre que X tome un valor x, el valor correspondiente de Z está dado por


z=(X- μ)/σ. Por lo tanto, si X cae entre los valores x=x1 y x=x2, la variable aleatoria
Z caerá entre los valores z1=(X1-μ)/σ y z2=(X2-μ)/σ.

Por lo tanto la probabilidad se puede escribir como

Donde Z se ve como una variable aleatoria normal con media 0 y varianza 1.

 La distribución de una variable aleatoria normal con media cero y varianza


1 se llama distribución normal estándar.
Las distribuciones original y transformada se ilustran en la figura Como todos los
valores de X caen entre x1 y x2 tienen valores z correspondientes entre z1 y z2, el
área bajo la curva X entre las ordenadas x =x1y x=x2 de la figura es igual al área
bajo la curva Z entre las ordenadas transformadas z =z1 y z=z2. Con esto hemos
reducido el número de tablas que se requiere a una, la de la distribución normal
estándar.

Toda esta información de la probabilidades de la distribución normal se


encuentra recopilada en tablas que nos permiten encontrar con facilidad el valor
del área bajo la curva de la normal.
Las Tablas, indican el área bajo la curva normal estándar que corresponde a
P(Z<z) para valores de z que van desde -3.49 a 3.49.
Para mostrar el uso de las Tablas
Ejemplos: Calculemos la probabilidad de que Z sea menor que 1.64.

Primero localizamos un valor de z igual a 1.6 en la primera columna (izquierda),


después nos “movemos” a lo largo de la fila hasta encontrar la columna
correspondiente a 0.04, donde leemos 0.9495.
Por lo tanto P(Z<1.64)=0.9495.
Ejemplo: Calculemos la probabilidad de que Z sea mayor que 1.24
Probabilidad p ( z > 1,24)
En este caso la probabilidad pedida no está en las tablas.
Sin embargo, si tenemos en cuenta que el área total bajo la curva.

p (z > 1,24) = 1 – p (z ≤ 1,24) = 1 – 0,8925 = 0,1075

Ejemplo: Hallar la probabilidad p ( z ≤ 0,45 )

P(Z<=0.45)=0.6736

Ejemplo: Calculemos la probabilidad de que Z sea menor igual que -0.72


Probabilidad ( z ≤ - 0,72 )
Como la gráfica es simétrica respecto al eje de ordenadas, p ( z ≤ - 0,72 ) = p (
z ≥ + 0,72 )

Calculamos p (z ≥ + 0,72 ) igual que en el caso anterior


p ( z ≥ + 0,72 ) = 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358
p ( z ≤ - 0,72 ) = p ( z ≥ + 0,72 )= 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

Ejemplo: Probabilidad entre dos valores positivos p ( 0,5 ≤ z ≤ 1,76 )

Miremos en la tabla la p ( z ≤ 1,76 )

p ( z ≤ 1,76 )=0.9608

Miremos en la tabla la p ( z ≤ 0,5 ).

p ( z ≤ 0,5 )= 0,6915
Que se desea encontrar

Conclusión la diferencia entre ellas es la probabilidad que nos piden.

p ( 0,5 ≤ z ≤ 1,76 ) = p ( z ≤ 1,76 ) - p ( z ≤ 0,5 ) = 0,9608 - 0,6915 = 0,2693

Ejemplo: Probabilidad entre dos valores negativos p ( - 1,76 ≤ z ≤ - 0,5 )

Por simetría cambiamos los dos valores negativos a positivos y calculamos sus
probabilidades.

p ( - 1,76 ≤ z ≤ - 0,5 ) = p ( 0,5 ≤ z ≤ 1,76 ) = 0,9608 - 0,6915 = 0,2693

Ejemplo: Probabilidad entre un valor positivo y uno negativo p(- 0,53 ≤ z ≤ 2,46)
p ( z ≤ 2,46)= 0.9931

p ( z ≤ - 0,53 )= p ( z ≥ 0,53 ) = 0.7019

p ( z ≤ - 0,53 ) = p ( z ≥ 0,53 ) = 1 - p ( z < 0, 53)= 1 - 0,7019 = 0,2981

p(- 0,53 ≤ z ≤ 2,46) = p ( z ≤ 2,46) - p ( z ≤ - 0,53 ) = 0,9931 - 0,2981 = 0,695

Para encontrar un valor de z que corresponda a una probabilidad dada, el proceso


se invierte.

Ejemplo: hallar el valor de z que tiene un área de 0.7019 bajo la curva

El Z correspondiente es 0.53

Ejemplo: hallar el valor de z que tiene un área de 0.8997 bajo la curva


El Z correspondiente es 1.28

Ejemplo:

Imaginemos que los retornos anuales de un mercado cualquiera durante los


últimos 25 años sigue una distribución aproximadamente Normal, con una media
anual del 10% y una desviación estándar del 7%. ¿Cuál es la probabilidad de que
un año obtenido al azar tenga un retorno superior al 15%?

X=15%
μ =10%
σ=7%
N(15;10,7)
Z=(15-10)/7
Z=0.714

Se busca en la tabla
P(Z=0,714) = 0,7612

El área total bajo la curva es 1. Por lo tanto la probabilidad de que un año


podemos alcanzar un retorno superior al 15% es de 1-0,7612= 0,2388. La
probabilidad es aproximadamente del 23,88%.

Ejemplo: Del ejemplo anterior obtener la probabilidad de obtener retornos anuales


entre el 5% y el 15%.

z1=(5-10)/7 y z2=(15-10)/7.
z1=(-5)/7 y z2=(5)/7.
z1=-0.714
z2=0.714
P(Z=0,714)= 0,7612

P(5<=X<=15) = P((5-10)/7 <= Z <= (15-10)/7 ) = P(-0,714 <= Z <= 0,714)


p ( z1 ≥ + 0,7612 ) = 1 - p ( z < + 0,7612 ) = 1 - 0,7612 = 0,2388

Utilizando las tablas y la propiedad de que la curva es simétrica, tenemos que la


probabilidad de obtener un retorno entre el 5% y el 15% es de 0,7612 – 0,2388 =
0,5224. Aproximadamente 52,24%

Ejemplo: El tiempo medio en realizar una misma tarea por parte de los empleados
de una empresa se distribuye según una distribución normal, con media de 5 días
y desviación típica 1 día. Calcular el porcentaje de empleados que realizan la tarea
en un tiempo inferior a 7 días.
X=7
μ =5
σ=1
Z=(7-5)/1
Z=2
Buscando en la tabla
P(Z<=0.9772)
Esta probabilidad es 0,9772. Por lo tanto, el porcentaje de empleados que realizan
la tarea en un tiempo inferior a 7 días es del 97,7%.

Ejemplo: La vida media de una lámpara, según el fabricante, es de 68 meses, con


una desviación típica de 5. Se supone que se distribuye según una distribución
normal En un lote de 10.000 lámparas.
a) ¿Cuántas lámparas superarán previsiblemente los 75 meses?
X=75
μ =68
σ=5
Z=(75-68)/5=1.4
P (X > 75)=(Z > 1,4) = 1 - P (z ≤ 1,4)
= 1 - 0,9192 = 0,0808

Por lo tanto el 8,08% de las lámparas (808 lámparas) superarán los 75 meses

b) ¿Cuántas lámparas se estropearán antes de 60 meses?

z = (60 -68)/5 = -1,6


P (X ≤ 60) = (z ≤ -1,6) = P (z> 1,6) = 1 - P (z ≤ 1,6) = 0,0548
Luego, el 5,48% del lote (548 lámparas) no llegarán probablemente a durar 60
meses.

Aproximación de la distribución binomial a la normal

Una distribución binomial variable discreta la podemos aproximar a una normal


variable continua cuando n es grande.

You might also like