Professional Documents
Culture Documents
8. ANALISIS DE VARIANZA
2 2 2
Y1 ~ N ( 1, ) , Y2 ~ N ( 2, ), , Yk ~ N ( k, ).
Sea
y k1 , y k 2 , , yknk m.a.s. de Yk
2
Ahora bien, bajo la hiptesis nula se tendr que un estimador de basado en la muestra
conjunta est dado por
k ni
( y ij Y )2
i 1 j 1
2
n 1
donde
k ni
y ij
k
i 1 j 1
n ni y Y .
i 1
n
k ni
SCT = ( yij Y )2 .
i 1 j 1
ni
yij
j 1
Yi , i 1,2,..., k
ni
k ni k ni
SCT ( yij Y )2 ( yij Yi Yi Y )2
i 1 j 1 i 1 j 1
k k ni
2
ni (Yi Y) ( yij Yi ) 2
i 1 i 1 j 1
donde
k
SCE ni (Yi Y ) 2 se denomina suma de cuadrados entre grupos,
i 1
y
k ni
SCD ( yij Yi ) 2 se denomina suma de cuadrados dentro de grupos o
i 1 j 1
suma de cuadrados residual o suma de cuadrados del error
es decir
SCT = SCE+SCD
ni
k
2 Y..2 k ni
SCT y ij con Y.. yij
i 1 j 1 n i 1 j 1
ni
k
Yi.2 Y..2
SCE con Yi. yij
i 1 ni n j 1
ni
k
2
k
Yi .2
SCD y ij
i 1 j 1 i 1 ni
SCE
(k 1)
F0 ~ F( k 1, n k )
SCD
(n k )
F0 F( k 1,n k , )
Los clculos para probar la hiptesis nula se resumen en la siguiente tabla de anlisis de
varianza (ANDEVA)
ANDEVA
Comparaciones Mltiples
H0 : i j , i j
Existen diversos mtodos de comparaciones mltiples para probar estas hiptesis, de entre
los que se pueden destacar los siguientes mtodos: Tukey, Scheff, Duncan, Newman-
Keuls, la menor diferencia significativa, mtodo t-student, etc.
Yi Yj
t0 ~ t(n k)
SCD 1 1
(n k ) ni nj
H0 : i j v/s HA : i j
Yi Yj
t0 t(n k ,1 2)
SCD 1 1
( n k ) ni nj
Ejemplo 5.15
Sea
H0 : 1 2 3 4
v/s
H A : Alguna diferencia existe
los clculos;
Y.. 110 .6, Y 5.82
4 ni
Y..2 110.6 2
SCT yij2 652.26 8.45158
i 1 j 1 19 19
4
Yi.2 Y..2 30.4 2 32.2 2 23.9 2 24.12 110.6 2
SCE 7.83608
i 1 ni 19 5 5 5 4 19
ANDEVA
Comparaciones mltiples
H0 : 1 2 v/s H A : 1 2
Y1 Y2 6.08 6.44
t0 2.81
1 1 0.1281
0.04103
5 5
H0 : 1 3 v/s H A : 1 3
Y1 Y3 6.08 4.78
t0 10.15 ,
1 1 0.1281
0.04103
5 5
H0 : 1 4 v/s H A : 1 4
Y1 Y4 6.08 6.025
t0 0.405 ,
1 1 0.1359
0.04103
5 4
en este caso 0.405<2.1314, por lo tanto no existe diferencia significativa entre los
contenidos medios de oxgeno disuelto de los lugares 1 y 4.
H0 : 2 3 v/s H A : 2 3
Y2 Y3 6.44 4.78
t0 12.96 ,
1 1 0.1281
0.04103
5 5
existe diferencia significativa entre los contenidos medios de oxgeno disuelto de los lugares
2 y 3.
H0 : 2 4 v/s HA : 2 4
Y2 Y4 6.44 6.025
t0 3.05 ,
1 1 0.1359
0.04103
5 4
tambin existe diferencia significativa en los contenidos medios de oxgeno disuelto entre
los lugares 2 y 4.
H0 : 3 4 v/s HA : 3 4
Y3 Y4 4.78 6.025
t0 9.16 ,
1 1 0.1359
0.04103
5 4
9. PRUEBAS CHI-CUADRADO
Casos como los ejemplos anteriores tienen las siguientes caractersticas que definen
un experimento multinomial:
k
pi 1.
i 1
4. Las pruebas son independientes.
5. Se est interesado en los valores n1 , n2 , , n k en donde ni es igual al nmero de
pruebas cuyo resultado pertenece a la clase i-sima,
k
ni n.
i 1
Ahora bien, en 1900 Karl Pearson propuso el siguiente estadstico de prueba, que es
una funcin de los cuadrados de las desviaciones de los nmeros observados
(frecuencias observadas) con respecto a los nmeros esperados (frecuencias esperadas),
ponderados por el recproco de sus nmeros esperados:
k 2
ni npi
J
i 1 npi
a. Dada una muestra aleatoria simple x1, x2 , , xn de una poblacin con distribucin
F se desea probar la hiptesis nula
H0 : F F0
ei npi
k
(oi ei ) 2 2
J0 ~ (k 1)
i 1 ei
2 2
Se rechazar la hiptesis nula al nivel de significacin si J 0 ( k 1,1 ) , donde (k 1,1 )
Ejemplo 5.16
AB : 48 AB : 18 A B : 21 A B : 13
Probar la hiptesis de que las cuatro categoras, en el orden antes indicado ocurren en la
proporcin 5:2:2:1 (es decir con probabilidades 0.5, 0.2, 0.2, 0.1 respectivamente).
Si se define p1 P( AB) , p2 P( AB ) , p3 P ( A B ) y p4 P( A B ) se desea
probar la hiptesis
p1 0.5
p 0.2
H0 : 2
p3 0.2
p4 0.1
o1 48, o2 18, o3 21 y o4 13
y las frecuencias esperadas para cada una de estas clases estn dadas por
4
(oi ei ) 2 (48 50) 2 (18 20) 2 (21 20) 2 (13 10) 2
J0 1.23
i 1 ei 50 20 20 10
el percentil 95% de la distribucin chi-cuadrado con tres grados de libertad est dado por
2
( 3, 0.95 ) 7.8147 . Por lo tanto no se rechaza H 0 al nivel 0.05 y las clases ocurren en la
proporcin planteada.
b. Dada una muestra aleatoria simple x1, x2 , , xn de una poblacin con distribucin
F se desea probar la hiptesis nula
H0 : F
ei np i
k
(o i ei ) 2 2
J0 ~ ( k r 1) ,
i 1 ei
2
Se rechazar la hiptesis nula al nivel de significacin si J 0 ( k r 1,1 ) , donde
2
( k r 1,1 es el percentil (1
) ) 100 de la distribucin chi-cuadrado con (k - r - 1)
grados de libertad.
Ejemplo 5.17
2
en este caso r 2 , los estimadores de y estn dados por;
242
10 10
ni C i ni (C i X )2
X i 1
497 y 2 S X2 i 1
2275.8
150 149
A continuacin se determinan las probabilidades estimadas para cada una de las 12 clases o
intervalos;
370 497
p 1 P ( ,370 ) P ( X 370) P ( Z ) ( 2.6625) 0.0038781
47.7
Anlogamente;
p 3 P ( 395,420 ) 0.03699
p 4 P ( 420,445 0.08459
p 5 P ( 445,470 ) 0.14786
p 6 P ( 470,495 ) 0.19759
p 7 P ( 495,520 ) 0.20189
p 8 P ( 520,545 ) 0.1577
p 9 P ( 545,570 ) 0.09418
p 10 P ( 570,595 ) 0.0423
p 11 P ( 595,620 ) 0.015
p 12 P ( 620 , ) 0.005658
Una vez calculadas las probabilidades estimadas se deben determinar las frecuencias
esperadas ei np i , listadas en la siguiente tabla
243
Horas de
sobrevivencia
- 370 0 0.5817
370 395 2 1.8546
395 420 7 5.5485
420 445 15 12.6885
445 470 16 22.179
470 495 28 29.6385
495 520 39 30.2835
520 545 17 23.655
545 570 17 14.127
570 595 7 6.345
595 620 2 2.25
620 - 0 0.8487
150 150
Se debe notar que se tienen clases con frecuencias esperadas menores que 5. Por lo tanto se
deben agrupar las clases de tal forma de lograr frecuencias esperadas mayores que 5. En la
siguiente tabla se reagrupan las clases y se detallan las desviaciones de las frecuencias
observadas respecto de las esperadas y las desviaciones cuadrticas ponderadas por los
recprocos de las frecuencias esperadas.
i -e (o -e i
9 7,98 1,02 0,129
15 12,69 2,31 0,421
16 22,18 -6,18 1,721
28 29,64 -1,64 0,091
39 30,28 8,72 2,509
17 23,66 -6,66 1,872
17 14,13 2,87 0,584
9 9,44 -0,44 0,021
150 150 0,00 7,35
2
Por lo tanto el estadstico de prueba de H 0 : X ~ N ( , ) toma el valor
8
(o i ei ) 2
J0 7.35
i 1 ei
el valor del estadstico de prueba se compara con el valor tabular de la distribucin chi-
cuadrado con (8 2 1) grados de libertad (ocho clases y dos parmetros estimados). El
percentil 95% de la distribucin chi-cuadrado con 5 grados de libertad est dado por
244
2
11.071, como 7.35 <11.071 no se rechaza H 0 : X ~ N ( , 2 ) y se concluye con
( 5 , 0.95 )
un 95% de confianza, de que la distribucin de los tiempos de sobrevivencia; en horas; de
las ratas tiene una distribucin normal.
A / B B1 B2 Bj Bm Total
A1 n11 n12 n1j n1m n1
A2 n21 n22 n2j n2m n2
H 0 : P ( Ai B j ) P ( Ai ) P ( B j ); (i,j)
v/s
H 0 : P ( Ai B j ) P ( Ai ) P ( B j ); algn par(i,j)
Donde
k m
P( Ai B j ) 1
i 1j 1
k m
P( Ai ) 1 y P( B j ) 1
i 1 j 1
ni n j
P ( Ai Bj) P ( Ai ) P ( B j )
n n
245
ni n j n i n j
eij nP ( Ai Bj) n
n n n
en consecuencia el estadstico de prueba de la hiptesis nula
H 0 : P ( Ai B j ) P ( Ai ) P ( B j ); (i,j)
2
J0 (( k 1)( m 1),1 )
2 2
donde (( k 1)( m 1),1 ) es el percentil (1 ) 100 de la distribucin (( k 1)( m 1)) .
Ejemplo 5.18
Hbito de fumar
Grupo etreo Total
Menos de 2 entre 2 y 10 ms de 10
Joven 21 26 25 72
Adulto Joven 39 15 20 74
Adulto 13 5 11 29
Adulto Mayor 6 11 6 23
Tercera Edad 10 11 13 34
Total 89 68 75 232
Se est interesado en averiguar si el hbito de fumar depende del grupo etreo del fumador,
utilizar 5% de significacin.
Es conveniente notar que se obtuvo una muestra aleatoria de 232 personas fumadoras y
que la clasificacin se realiz segn los atributos A y B. Por lo tanto se desea probar la
hiptesis nula
5 3 (nij eij ) 2 2
J0 ~ ( 8)
i 1 j 1 eij
En la siguiente tabla se detallan las frecuencias observadas y las esperadas para cada
una de las celdas en la clasificacin anterior, todas las frecuencias esperadas son mayores
que 5:
Tamao de la ciudad
Grupo Etreo Total
Menos de 2 Entre 2 y 5 Ms de 5
Joven 21 26 25 72
27.62 21.10 23.28
Adulto Joven 39 15 20 74
28.39 21.69 23.92
Adulto 13 5 11 29
11.13 8.5 9.38
Adulto Mayor 6 11 6 23
8.82 6.74 7.44
Tercera Edad 10 11 13 34
13.04 9.97 10.99
Total 89 68 75 232
5 3 (nij eij ) 2
J0 1.587 + 1.136 + 0.128 + 3.967 + 2.063 + 0.643 + 0.316 +
i 1j 1 eij
1.441 + 0.282 + 0.903 + 2.690 + 0.277 + 0.710 + 0.107 +
0.367 = 16.618.
2
Comparando 16.618 con el valor tabular (8,0.95) 15.507 se rechaza la hiptesis nula y se
concluye con un 95% de confianza que existe alguna asociacin entre el Hbito de Fumar y
el Grupo Etreo del fumador. Observando la descomposicin de J 0 se tiene que las celdas
Adulto Joven, menos de 2, Adulto Joven, Entre 2 y 5 y Adulto Mayor, Entre 2 y 5
son las celdas que ms contribuyen al valor de J 0 .
247
k
en cada poblacin j , se cumple que pij 1.
i 1
Se quiere verificar si cada clase Ci tiene la misma probabilidad en todas las poblaciones. Es
decir se desea probar la hiptesis
p11 p1 j p1m
p21 p2 j p2 m
H0 :
pi1 pij pim
pk 1 pkj p km
v/s
Para probar la hiptesis nula, se toma una muestra de cada poblacin y los
elementos de estas muestras se clasifican segn las clases Ci . Si n j es el tamao de la
muestra en la poblacin j , se obtiene la siguiente tabla de doble entrada:
Poblacin
Total
Clase 1 2 j m
C1 n11 n12 n1j n1m n1
C2 n21 n22 n2j n2m n2
ni
p ij
n
ni
e ij nj ,
n
k m (nij eij ) 2 2
J0 ~ (( k 1)( m 1))
i 1j 1 eij
2
Se rechazar la hiptesis nula al nivel de significacin si J 0 (( k 1)( m 1),1 ) .
Ejemplo 5.19
N de
Ciudad
Infectados
1 16
2 24
3 9
En este caso se tienen tres poblaciones; las personas infectadas en cada ciudad. Por
lo tanto se tienen tres muestras cada una de tamao 400 resultando la clasificacin en la
siguiente tabla:
p11 p 21 p31
H0 :
p12 p 22 p 32
v/s
49
e11 400 16.3 , e21 16.3 , e31 16.3
1200
2 3 ( nij eij ) 2
J0 7.192
i 1j 1 eij
El valor tabular de la distribucin chi-cuadrado con 2 grados de libertad al nivel 0.05 est
dado por (22,0.95) 5.9915 . Como 7.192>5.9915 se rechaza la hiptesis nula al nivel 0.05 y
se concluye con un 95% de confianza que las tres ciudades no tienen la misma proporcin
de personas infectadas con el virus.