You are on page 1of 17

Prueba de normalidad

Prueba de Anderson-Darling

Lpez Beltrn Miguel Armando

Noviembre 2011
La prueba de Anderson-Darling es utilizada para probar si
un conjunto de datos mustrales provienen de una
poblacin con una distribucin de probabilidad continua
especfica (por lo general la distribucin normal). La prueba
de Anderson-Darling se basa en la comparacin de la
distribucin de probabilidades acumulada emprica
(resultado de los datos) con la distribucin de
probabilidades acumulada terica (definida en H0).
HIPTESIS:

H0: Las variables aleatorias en un estudio siguen


una distribucin normal (, ).

Ha: Las variables aleatorias en un estudio no


siguen una distribucin normal (, ).
ESTADSTICO DE PRUEBA:

El estadstico de A2 esta dado por la siguientes formula:


EJEMPLO
Basado en Excel
Procedimiento:
20 nmeros al azar: Sacar media y desviacin
estndar:
19 45
55 16
30 57
= 58.75
79 66
97 30 = 26.83
75 91
= 0.05
65 88
90 58 Valor critico = 0.752
77 29
22 86
Creacin de la primera y segunda columna:
1 2
i (2i-1)
1 1
2 3
3 5
4 7
5 9
6 11
7 13
8 15
9 17
10 19
11 21
12 23
13 25
14 27
15 29
16 31
17 33
18 35
19 37
20 39
3 4
Yi Yn+1-i
16 97
19 91
22 90
29 88
30 86
30 79
45 77 Los datos se ordenan de
55 75 menor a mayor (3) y de
57 66
58 65 mayor a menor (4).
65 58
66 57
75 55
77 45
79 30
86 30
88 29
90 22
91 19
97 16
5 6
Zi Zn+1-i
Determinar Z de las -1.5117 1.3934
-1.4041 1.1782
columnas 3 y 4. -1.2965 1.1423
-1.0455 1.0706
-1.0096 0.9989
-1.0096 0.7478
-
_______
Z = -0.4716
-0.1130
0.6761
0.6043
-0.0412 0.2815
Donde: -0.0054 0.2457
0.2457 -0.0054
: dato muestral. 0.2815 -0.0412
0.6043 -0.1130
: media muestral. 0.6761 -0.4716
0.7478 -1.0096
: desviacin estndar. 0.9989 -1.0096
1.0706 -1.0455
1.1423 -1.2965
Nota: los valores de la columna 6 son los 1.1782 -1.4041
1.3934 -1.5117
mismos que la columna 5, solo estn
ordenados inversamente.
Los valores para las columnas de 7 y 8, son obtenidos de la
tabla de distribucin normal acumulada.

En Excel utiliza la funcin:


= DISTR.NORM (valor, media, desviacin estndar, Acum)

Valor: valor cuya distribucin se desea obtener.


Media: media aritmtica de la distribucin.
Desviacin estndar: desviacin estndar de la distribucin.
Acum: Valor lgico que determina la forma de la funcin.
Argumento VERDADERO para obtener la distribucin
acumulada.
7 8
F(Yi) F(Yn+1-i)
0.0653 0.9182
0.0801 0.8806 ** Con la utilizacin de un
0.0974 0.8733
0.1479 0.8578 software ya no es
0.1563 0.8411
0.1563 0.7727 necesario las columnas 5
0.3186 0.7505
0.4550 0.7272 y 6.
0.4836 0.6109
0.4979 0.5970
0.5970 0.4979
0.6109 0.4836
0.7272 0.4550
0.7505 0.3186
0.7727 0.1563
0.8411 0.1563
0.8578 0.1479
0.8733 0.0974
0.8806 0.0801
0.9182 0.0653
9 10
Las columna 9 y 10 se LN(F(Yi)) LN(1-F(Yn+1-i))
-2.7288 -2.5041
determina con logaritmos -2.5240 -2.1256
-2.3290 -2.0662
neperiano, para columna 9 -1.9112 -1.9507
-1.8557 -1.8393
se determina directo -1.8557 -1.4815
-1.1438 -1.3883
(LN(<valor columna 7>)) y -0.7874 -1.2990
-0.7266 -0.9438
columna 10 se determina -0.6974 -0.9089
-0.5158 -0.6889
-0.4929 -0.6608
LN((1 - <valor columna 8>)) -0.3186 -0.6070
-0.2870 -0.3836
posteriormente se -0.2579 -0.1700
-0.1731 -0.1700
determina el resultado del -0.1534 -0.1601
-0.1354 -0.1025
logaritmo neperiano. -0.1271 -0.0835
-0.0853 -0.0675
11
Si
-0.2616 La ultima columna de la tabla se
-0.6974
-1.0988 determina con la siguiente formula:
-1.3517
-1.6628
-1.8355
-1.6459
-1.5648
-1.4198
-1.5260
-1.2649
-1.3267
-1.1570
-0.9053
-0.6204
-0.5318
-0.5171
-0.4163
-0.3897
-0.2980
1 2 3 4 5 6 7 8 9 10 11
i (2i-1) Yi Yn+1-i Zi Zn+1-i F(Yi) F(Yn+1-i) LN(F(Yi)) LN(1-F(Yn+1-i)) Si
1 1 16 97 -1.5117 1.3934 0.0653 0.9182 -2.7288 -2.5041 -0.2616
2 3 19 91 -1.4041 1.1782 0.0801 0.8806 -2.5240 -2.1256 -0.6974
3 5 22 90 -1.2965 1.1423 0.0974 0.8733 -2.3290 -2.0662 -1.0988
4 7 29 88 -1.0455 1.0706 0.1479 0.8578 -1.9112 -1.9507 -1.3517
5 9 30 86 -1.0096 0.9989 0.1563 0.8411 -1.8557 -1.8393 -1.6628
6 11 30 79 -1.0096 0.7478 0.1563 0.7727 -1.8557 -1.4815 -1.8355
7 13 45 77 -0.4716 0.6761 0.3186 0.7505 -1.1438 -1.3883 -1.6459
8 15 55 75 -0.1130 0.6043 0.4550 0.7272 -0.7874 -1.2990 -1.5648
9 17 57 66 -0.0412 0.2815 0.4836 0.6109 -0.7266 -0.9438 -1.4198
10 19 58 65 -0.0054 0.2457 0.4979 0.5970 -0.6974 -0.9089 -1.5260
11 21 65 58 0.2457 -0.0054 0.5970 0.4979 -0.5158 -0.6889 -1.2649
12 23 66 57 0.2815 -0.0412 0.6109 0.4836 -0.4929 -0.6608 -1.3267
13 25 75 55 0.6043 -0.1130 0.7272 0.4550 -0.3186 -0.6070 -1.1570
14 27 77 45 0.6761 -0.4716 0.7505 0.3186 -0.2870 -0.3836 -0.9053
15 29 79 30 0.7478 -1.0096 0.7727 0.1563 -0.2579 -0.1700 -0.6204
16 31 86 30 0.9989 -1.0096 0.8411 0.1563 -0.1731 -0.1700 -0.5318
17 33 88 29 1.0706 -1.0455 0.8578 0.1479 -0.1534 -0.1601 -0.5171
18 35 90 22 1.1423 -1.2965 0.8733 0.0974 -0.1354 -0.1025 -0.4163
19 37 91 19 1.1782 -1.4041 0.8806 0.0801 -0.1271 -0.0835 -0.3897
20 39 97 16 1.3934 -1.5117 0.9182 0.0653 -0.0853 -0.0675 -0.2980
Se suman los valores de Si (Columna 11):

= -20.4916

Aplicacin del estadstico de Anderson-Darling:

A2 = - N S
A2 = -(20) (-20.4916) = 0.491563
CONCLUSIONES:

El valor estadstico (A2 = 0.4916 ) es menor al valor critico


(A2critico = 0.752), por lo tanto no se rechaza la hiptesis
nula.

Por lo tanto los datos observados tienen una naturaleza de


distribucin normal.
Referencias:
http://es.scribd.com/doc/57801491/Metodos-de-ajuste-de-curvas
http://www.elosiodelosantos.com/sergiman/div/tablnorm.html
http://www.spcforexcel.com/anderson-darling-test-for-normality
http://www.theriac.org/DeskReference/viewDocument.php?id=60&Se
ctionsList=3
http://www.itl.nist.gov/div898/handbook/eda/section3/eda35e.htm
Marqus dos Santos, Mara Jos; Estadstica Bsica: un enfoque no
parametrico, Universidad Nacional Autonoma de Mxico, Facultad de
Estudios Superiores Zaragoza.

You might also like