You are on page 1of 10

Actividad 2: La distribucin Normal

ACTIVIDAD 2: La distribucin Normal


CASO 2-1: CLASE DE BIOLOGA______________________________________
El Dr. Saig es profesor de Biologa en una prestigiosa universidad. Est preparando una clase en la que pretende mostrar con ejemplos el hecho de que la distribucin normal es muy til a la hora de describir el comportamiento de muchas variables fisiolgicas de los seres vivos. As, p.e., se sospecha que la longitud de una determinada planta sigue un comportamiento aproximadamente normal con media = 64 cm y desviacin estndar = 3,1 cm. El Dr. Saig pretende comparar los resultados obtenidos en una prctica de campo, en la que sus alumnos midieron 60 plantas de la especie anterior, con una simulacin por ordenador realizada a partir de una normal. 1. Simular con Minitab la medicin de 60 plantas de la especie anterior. A fin de que todos obtengamos los mismos datos, usar como base para la generacin de datos aleatorios provenientes de una normal el nmero 333. Seleccionamos Calc > Set Base :

Ahora usamos la opcin Calc > Random Data > Normal :

A2 - 1

Estadstica Aplicada con Minitab Habremos generado 60 valores aleatorios procedentes de una distribucin normal con los parmetros indicados.

2.

Mostrar un resumen descriptivo y grfico (histograma + grfico de normalidad) de los datos obtenidos en el apartado anterior mediante simulacin. Seleccionar Stat > Basic Statistics > Display Descriptive Statistics > Graphs :

El programa nos dar el siguiente output:

Descriptive Statistics
Variable SIMULADO Variable SIMULADO N 60 Minimum 58,051 Mean 64,584 Maximum 70,316 Median 64,523 Q1 62,734 TrMean 64,635 Q3 66,640 StDev 2,931 SE Mean 0,378

Histogram of SIMULADOS, with Normal Curve


10

Frequency

0 60 65 70

SIMULADOS

A2 - 2

Actividad 2: La distribucin Normal

Ahora queremos un grfico de normalidad: Normality Test:

Stat

>

Basic

Statistics

>

Normal Probability Plot

,999 ,99 ,95

Probability

,80 ,50 ,20 ,05 ,01 ,001 60 65 70


Anderson-Darling Normality Test A-Squared: 0,236 P-Value: 0,780

SIMULADOS
Av erage: 64,5844 StDev : 2,93060 N: 60

Observar que los puntos se aproximan bastante a la lnea roja, lo cual era de esperar puesto que esto ocurrir siempre que los datos sean aproximables por una distribucin normal (y de hecho estos datos provienen de una normal).

A2 - 3

Estadstica Aplicada con Minitab 3. Hacer lo mismo que en el apartado 2 pero ahora con los datos obtenidos en el campo, los cuales se encuentran en el archivo campo.mtw . Qu podran concluir los alumnos del Dr. Saig?. Repitiendo los pasos anteriores con estos nuevos datos, obtendremos los siguientes resultados:

Descriptive Statistics
Variable Longitud Variable Longitud N 60 Minimum 57,200 Mean 65,357 Maximum 71,300 Median 66,000 Q1 62,425 TrMean 65,402 Q3 68,225 StDev 3,472 SE Mean 0,448

Histogram of Longitud, with Normal Curve


8 7 6

Frequency

5 4 3 2 1 0 60 65 70

Longitud

Normal Probability Plot

,999 ,99 ,95

Probability

,80 ,50 ,20 ,05 ,01 ,001 60 65 70


W-test f or Normality R: 0,9853 P-Value (approx): > 0,1000

Longitud
Av erage: 65,3567 StDev : 3,47155 N: 60

Si bien ahora los puntos se alejan ms que antes de la lnea roja, siguen estando lo suficientemente prximos a la misma como para que consideremos que se distribuyen de forma aproximadamente normal. Parece pues que los dos conjuntos de datos son bastante similares. A2 - 4

Actividad 2: La distribucin Normal

CASO 2-2: SALARIOS MEDIOS_______________________________________


Segn viene publicado en una prestigiosa revista de economa, el salario semanal medio de los profesores universitarios europeos es de 406,15 . Se estima adems que la desviacin estndar de dichos salarios es de 55,50 . Supongamos ahora que pretendemos tomar una muestra aleatoria de 100 profesores para estudiar sus salarios. Calcular las siguientes probabilidades referentes a la media de dicha muestra: 1. La probabilidad de que la media de la muestra sea menor de 400 . En primer lugar, observar lo siguiente: como n = 100 >> 30, por el Teorema Central del Lmite tendremos que la distribucin de las medias muestrales X se podr aproximar por una normal con media 406,15 y desviacin estndar 5,50. Hemos de hallar P ( X < 400) :

Seleccionamos: Calc > Probability Distributions > Normal :

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000 x 400,0000 P( X <= x) 0,1339

A2 - 5

Estadstica Aplicada con Minitab

2.

La probabilidad de que la media de la muestra est entre 400 y 410 . Sabemos que P (400 < X < 410) = P ( X < 410) P ( X < 400) probabilidades ya la hemos calculado en el apartado anterior. Para calcular la primera se razona anlogamente, obteniendo que: . La segunda de stas

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000 x 410,0000 P( X <= x) 0,7561

Por tanto, tendremos: P (400 < X < 410) = P ( X < 410) P ( X < 400) = 0,6222

3. La probabilidad de que la media de la muestra sea mayor de 415 . En este caso, P ( X > 415) = 1 P ( X < 415) . Hemos de calcular pues esta ltima probabilidad, lo cual haremos de forma anloga a los apartados anteriores. Obtendremos lo siguiente:

Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000 x 415,0000 P( X <= x) 0,9446

Por consiguiente, P ( X > 415) = 1 P ( X < 415) = 0,0554

4. Hallar el valor del salario medio c tal que P ( X < c ) = 0,95 .

Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero ahora elegiremos la opcin Inverse Cumulative Probability , con lo que obtendremos :

Inverse Cumulative Distribution Function


Normal with mean = 406,150 and standard deviation = 5,55000 P( X <= x) 0,9500 x 415,2789

A2 - 6

Actividad 2: La distribucin Normal

CASO 2-3: APROXIMACIN NORMAL A UNA BINOMIAL__________________


Para muchas combinaciones de n y p es posible aproximar bastante bien una distribucin binomial B(n,p) mediante una distribucin normal de media = np y varianza 2 = np(1-p). Generalmente, esta aproximacin tiende a ser tanto mejor cuanto mayor es el nmero de pruebas n. 1. Introducir en la columna C1 de una hoja de trabajo los nmeros 0, 1, 2, ..., 16. En la columna C2 calcular P(X = 0), P(X = 1), ..., P(X = 16), siendo X una binomial de parmetros n = 16 y p = 0,5. Seleccionamos: Calc > Make Patterned Data > Simple Set of Numbers :

Ahora hacemos: Calc > Probability Distributions > Binomial :

A2 - 7

Estadstica Aplicada con Minitab El resultado ser el siguiente:

Data Display
Row 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 C1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 C2 0,000015 0,000244 0,001831 0,008545 0,027771 0,066650 0,122192 0,174561 0,196381 0,174561 0,122192 0,066650 0,027771 0,008545 0,001831 0,000244 0,000015

2.

Introducir en la columna C3 el valor de la funcin de densidad de probabilidad (f.d.p.) asociada a los valores de la C1 para una distribucin normal que aproxime a la binomial anterior. Observar que: = n*p = 8 y 2 = n*p*(1-p) = 4 Hacemos: Calc > Probability Distributions > Normal :

A2 - 8

Actividad 2: La distribucin Normal 3. Dibujar un diagrama de barras con los datos de las columnas C1 (en eje x) y C2 (en eje y). Superpuesto a l, dibujad la funcin de densidad que se obtiene a partir de las columnas C1 (en eje x) y C3 (en eje y). Qu observas?. A fin de superponer ambos grficos, elegimos la opcin: Graph > Layout :

Seleccionamos: Graph > Chart :

Finalmente hacemos: Graph > Plot :

A2 - 9

Estadstica Aplicada con Minitab

Para representar los grficos superpuestos basta con hacer: Graph > End Layout :

Aproximacin normal a una binomial


0,2 binomial

C2 y C3

fdp normal 0,1

0,0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

C1

A partir del grfico anterior se comprende mejor el hecho de que podemos aproximar la probabilidad de que una variable binomial tome un determinado valor mediante la f.d.p. de una distribucin normal. As, p.e., podemos estimar P(X = 7) (rea en azul) por P(6,5 < X < 7,5) (rea comprendida entre la curva roja y ambos puntos). En el primer caso estamos considerando que la variable X es binomial, mientras que en el segundo consideramos que es normal (y por tanto hacemos uso de la aproximacin por continuidad, puesto que para cualquier variable continua la probabilidad puntual es cero).

A2 - 10

You might also like