You are on page 1of 6

DECISIONES ESTADSTICAS Y CONTROL DE CALIDAD

PRUEBAS DE BONDAD DE AJUSTE

AO 2014

_______________________________________________________________
Hasta ahora nos ocupamos de pruebas de hiptesis estadsticas acerca de
parmetros de una poblacin como , y . En este punto consideraremos pruebas
para analizar si una poblacin tiene una distribucin terica especfica.

Las hiptesis que se plantean en una prueba de bondad de ajuste son las siguientes:
Ho) La distribucin de la variable es una distribucin especfica, postulada por el que
realiza la prueba.
Ha) La distribucin de la variable es diferente de la postulada en Ho.

PRUEBA JI-CUADRADA
Extractado del libro Probabilidad y Estadstica para ingenieros, 6ta. Edicin.

Autores:

Walpole, R; Myers, R y Myers, S. - Editorial Prentice Hall, 1999

La prueba se basa en qu tan buen ajuste tenemos entre la frecuencia con que
ocurren las observaciones en cada clase de una muestra observada y las frecuencias
esperadas para las mismas clases obtenidas a partir de una distribucin hipottica.

Para ilustrar, considere el lanzamiento de un dado. Elaboramos la hiptesis de que el


dado es legal, lo que equivale a probar la hiptesis de que la distribucin de los
resultados es la distribucin uniforme discreta.
Es decir, si X representa el puntaje de cada cara del dado,
Ho) P(X = x) = 1/6,

x = 1,2, ... , 6

Ha) La distribucin de los resultados es diferente de la propuesta en Ho

Suponga que el dado se lanza 120 veces y que se registra cada resultado
obtenindose las frecuencias que se dan en la Tabla 1. Tericamente, si el dado est
balanceado, la frecuencia esperada para

cada valor de la variable sera 20. Al

comparar las frecuencias observadas con las frecuencias esperadas correspondientes,


debemos decidir si es posible que las discrepancias que aparecen ocurran como
resultado de las fluctuaciones del muestreo, aunque el dado est balanceado o que
ste no es legal y la distribucin de los valores de la variable no es uniforme.

Tabla 1 Frecuencias observadas y esperadas de 120 lanzamientos de un dado


Cara
Frecuencia
observada
(oi)
Frecuencia
esperada
(ei)

1
20

2
22

3
17

4
18

5
19

6
24

20

20

20

20

20

20

Una prueba de la bondad de ajuste entre las frecuencias observadas y esperadas


para un experimento que incluye k clases, se basa en el estadstico
i=k

=
2

i =1

(oi - ei )2 / ei

donde 2 es un valor de una variable aleatoria cuya distribucin muestral se


aproxima muy de cerca con la distribucin ji cuadrada con v = k - 1 grados de
libertad. Los smbolos oi y e representan las frecuencias observada y esperada,
respectivamente, para la i-sima clase.

El nmero de grados de libertad que se asocia con la distribucin ji cuadrada que aqu
se utiliza es igual a (k 1), pues solo hay (k 1) frecuencias de celdas libremente
determinadas. Es decir, una vez que se determinan las frecuencias de (k 1) celdas,
queda determinada la frecuencia para la k-sima celda.

Si

las

frecuencias

observadas

estn

cerca

de

las

frecuencias

esperadas

correspondientes, el valor de X2 ser pequeo, e indicar un buen ajuste. Si las


frecuencias observadas difieren de manera considerable de las frecuencias
esperadas, el valor X2 ser grande, e indicar un ajuste pobre. Un buen ajuste
conduce al no rechazo de Ho, mientras que un ajuste pobre conduce a su rechazo. La
regin crtica caer, por tanto, en la cola derecha de la distribucin ji cuadrada. Para
un nivel de significacin , encontramos el valor crtico X2 de la tabla y la regin de
rechazo queda formada entonces por todos los valores X2 > X2. El criterio de
decisin que aqu se describe no se debe usar a menos que cada una de las
frecuencias esperadas sea al menos igual a 5. Esta restriccin puede requerir la
combinacin de celdas adyacentes lo que tiene como resultado una reduccin
en el nmero de grados de libertad.

Para la tabla 1, encontramos que el valor X2 observado es:

2 obs =

(20 - 20)2 (22 - 20)2 (17 - 20)2 (18 - 20)2 (19 - 20)2 (24 - 20)2
+
+
+
+
+
= 1,7
20
20
20
20
20
20

De la tabla encontramos X2= 0,05 = 11.070 para v = 5 grados de libertad.


Como 1.7 es menor que el valor crtico, no se rechaza Ho. Concluimos que no hay
suficiente evidencia para afirmar que el dado no est balanceado.

Como segunda ilustracin probemos la hiptesis de que la distribucin de frecuencia


de las duraciones de bateras dadas en la Tabla 2 se puede aproximar mediante una
distribucin normal con media = 3,5 y desviacin estndar = 0,7.
Si X indica la duracin de bateras,
Ho) X tiene distribucin N (3,5 ; 0,7)
Ha) La distribucin de X es diferente de la propuesta en Ho.

Las frecuencias esperadas para las siete clases que se listan en la tabla, se obtienen
al calcular las reas bajo la curva normal hipottica que caen entre los diversos lmites
de clase. Por ejemplo, los valores z que corresponden a los lmites de la cuarta clase
son:
z1 =

2, 95 - 3,5
= - 0,79
0,7

z2 =

3, 45 - 3,5
= - 0,07
0,7

De la tabla encontramos que el rea entre z1 = - 0.79 y z2 = - 0.07 es:


P( -0.79 < Z < -0.07) = P(Z < -0.07) P(Z < -0.79) = 0.4721 - 0.2148 = 0.2573.
De aqu, la frecuencia esperada para la cuarta clase es
e4 = (0.2573) (40) = 10.3.

(Se acostumbra redondear estas frecuencias a un decimal).

La frecuencia esperada para el primer intervalo de clase se obtiene al utilizar el rea


total bajo la curva normal a la izquierda del lmite 1.95. Para el ltimo intervalo de
clase, usamos el rea total a la derecha del lmite 4.45. Todas las dems frecuencias
esperadas se determinan mediante el mtodo que se describe para la cuarta clase.
Ntese que combinamos clases adyacentes en la Tabla 2, donde las frecuencias
esperadas eran menores que cinco. En consecuencia, el nmero total de intervalos se
reduce de siete a cuatro, lo que tiene como resultado v = 3 grados de libertad.

Tabla 2 Frecuencias observadas y esperadas de las duraciones de las bateras suponiendo


normalidad
Lmites de

1,45-1,95

clase
Frecuencia
observada
(oi)
Frecuencia
esperada
(ei)

1,95-2,45

2,45-2,95

2,95-3,45

3,45-3,95

15

10

3,95-4,45

7
0,5

2,1

4,45-4,95

8
5,9

10,3

10,7

8,5

3,5

10,5

El valor X2 est dado entonces por


2 obs =

(7 - 8,5)2 (15 - 10,3)2 (10 - 10,7)2 (8 - 10,5)2


+
+
+
= 3, 05
8,5
10,3
10, 7
10,5

Como el valor X2 calculado es menor que X2=

0,05

= 7.815 para v = 3 grados de

libertad, no tenemos razn para rechazar la hiptesis nula.

Cambios a introducir cuando se estiman los parmetros


Extractado del libro Probabilidad y Aplicaciones Estadsticas, Autor: Meyer, P. Editorial :
Fondo Educativo Interamericano1973

En muchas situaciones slo tenemos razones para suponer que la variable aleatoria
que se est muestreando tiene una distribucin de cierto tipo, sin que podamos
especificar los valores de los parmetros (como se hizo en el ejemplo de las bateras).
Por ejemplo, podemos saber que ciertas condiciones del problema en estudio pueden
conducirnos a un tipo de distribucin para la variable de inters (Poisson, Exponencial,
Normal, etc.) pero no tenemos especificados los valores de los parmetros de dichas
distribuciones.

Si no conocemos esos valores, el planteo obvio es estimar primero los parmetros


desconocidos, luego usar esas estimaciones para calcular (o mejor dicho, estimar) las
probabilidades de cada clase bajo la hiptesis nula y con ellas obtener las frecuencias
esperadas de dichas clases para aplicar la prueba de bondad de ajuste. Este hecho
afecta la distribucin del estadstico de prueba de la siguiente manera: si el nmero de
parmetros estimados es r (r < k), entonces, para un tamao de muestra grande, el
estadstico de prueba tiene tambin una distribucin ji-cuadrada esta vez con k 1 r
grados de libertad. Es decir que disminuye un grado de libertad por cada parmetro
que sea necesario estimar.

OBSERVACION IMPORTANTE
A diferencia de las pruebas de hiptesis referidas a parmetros, en las pruebas de
bondad de ajuste la hiptesis de inters es la nula y no la alternativa. En
consecuencia, la probabilidad de error tipo II () cobra especial inters.
Si el tamao muestral es pequeo o si hay muchas clases (celdas), puede resultar
muy elevada, aunque se satisfaga la regla general de que todas las frecuencias
esperadas sean al menos 5. Por ese motivo, la prueba de bondad de ajuste
presentada puede resultar poco potente.

OTRAS PRUEBAS DE BONDAD DE AJUSTE

Existen otras pruebas de bondad de ajuste basadas en criterios para medir las
distancias entre las frecuencias observadas y esperadas diferentes al que se usa en
la prueba ji-cuadrada.

Cuando se trata de probar la normalidad de una variable, una prueba ms potente que
la ji-cuadrada es la prueba de Anderson-Darling (AD), que es la que utiliza Minitab.

El estadstico de prueba se basa en la comparacin de las frecuencias acumuladas


muestrales y las frecuencias acumuladas esperadas (calculadas suponiendo Ho cierta,
es decir, suponiendo normalidad).

El procedimiento a utilizar es:


- Se postulan las hiptesis:
Ho) X tiene distribucin Normal
Ha) X tiene otra distribucin diferente a la Normal
- Se obtiene una muestra aleatoria simple de la variable X y, por medio del software,
el valor del estadstico de prueba la AD y su correspondiente valor p.
-Entonces: si valor p < , se rechaza Ho
si valor p > , no se rechaza Ho

RECORDAR:
Cuando queremos saber si la distribucin de donde proviene la muestra observada es
normal, antes de llevar adelante la prueba de Anderson Darling debemos aplicar
herramientas de anlisis de datos como:

graficar los datos: se pueden construir diagramas de puntos (dotplot),


diagramas de caja y bigotes (boxplot) o histogramas.

verificar valores de la regla emprica; comparar los valores de la media, la


mediana y la moda.

construir el diagrama de probabilidad normal que permite evaluar de manera


grfica la posibilidad de que la muestra provenga de una distribucin normal,
observando si los puntos se encuentran alineados.

llevar adelante la prueba de Anderson-Darling, si a partir de los pasos


anteriores es razonable considerar que la muestra proviene de una distribucin
normal.

Minitab brinda en la opcin


GRAPH > PROBABILITY PLOT, el grfico de probabilidad normal, acompaado por el
valor del estadstico AD y su correspondiente valor - p

You might also like