You are on page 1of 8

5.

ANALISIS DE VARIANZA
1. INTRODUCCION

Vamos a presentar en esta prctica una generalizacin de las tcnicas de contraste de hiptesis presentadas en la Prctica 4. En esa Prctica presentamos, entre otras cosas, una serie de contrastes de hiptesis encaminados a contrastar la hiptesis nula de igualdad de medias poblacionales de dos poblaciones. En esta Prctica vamos a generalizar las tcnicas all presentadas. En particular, vamos a aprender a contrastar la hiptesis nula de igualdad de medias de ms de dos poblaciones. Supongamos el siguiente e emplo! se desea evaluar la capacidad de tres tipos de "ertilizante para acelerar el proceso de crecimiento de tomates. #enominaremos "ertilizante $, % & ' a los tres tipos de producto. (na posible "orma de proceder es tomar diez terrenos en los )ue se estn cultivando tomates & dividir cada terreno en tres zonas. En cada zona se utiliza un tipo determinado de "ertilizante. $l "inal, se estiman los *ilogramos de tomates por metro cuadrado de terreno )ue se han producido en cada sector, para cada uno de los +, terrenos estudiados. Estos datos son la muestra de la poblacin )ue usaremos para nuestro anlisis. $ntes de continuar, lo )ue hemos dicho hasta ahora pone &a de mani"iesto un hecho importante! al proceder como hemos dicho, es decir, al dividir cada terreno en tres zonas, )ue son "ertilizadas independientemente con un "ertilizante de cada tipo, estamos eliminando en nuestro estudio la in"luencia de algunos "actores no deseados, como el tipo de terreno, la densidad de plantas por unidad de super"icie )ue ha& en cada terreno, etc. -o anterior tiene sentido si indicamos otra posible "orma de proceder! tomar ., terrenos & separarlos aleatoriamente en tres grupos de diez terrenos cada uno. En cada uno de los diez terrenos pertenecientes a un grupo se utiliza el mismo tipo de "ertilizante. -a medida )ue se utiliza para comparar es la misma! /ilogramos de tomates por metro cuadrado en cada terreno. Esta "orma de proceder presenta algunos inconvenientes. Puede suceder, por e emplo, )ue la produccin de tomates de un terreno sea grande, pero )ue no sea debido exclusivamente al tipo de "ertilizante, sino a di"erencias en los tipos de terreno, en la densidad de plantacin de las matas, a "actores climatolgicos, etc. -a venta a )ue tiene la primera "orma de proceder es )ue, al actuar los tres "ertilizantes en tres sectores de un mismo tipo de terreno, la in"luencia de los otros "actores ser la misma en cada terreno para los tres sectores, & por tanto, en principio, las di"erencias en las tres medidas )ue en este caso se toma de cada terreno sern debidas 0nicamente a los tipos de "ertilizante 1mas di"erencias residuales debidas a la aleatoriedad intrnseca de las medidas, )ue son inevitables2.

Este e emplo pone de mani"iesto la importancia del diseo de experimentos en la realizacin de estudios estadsticos. #e "orma general, se entiende por dise3o de e4perimentos al procedimiento utilizado para obtener las observaciones o medidas )ue componen la muestra. -as bases del procedimiento de contraste de hiptesis son las siguientes!. Si la variabilidad de los datos alrededor de cada media muestral es pe)ue3a comparada con la variabilidad )ue se observa entre las medias, ser una evidencia en contra de la hiptesis nula de igualdad de las medias poblacionales. Por el contrario, si la variabilidad de los datos alrededor de cada media muestral es relevante comparada con la variabilidad observada entre las medias muestrales, decidiremos )ue los datos no presentan evidencias importantes contra la hiptesis nula. #ebido a )ue la varianza de los datos es importante en la decisin de rechazo o no rechazo de la hiptesis nula, el procedimiento de anlisis se denomina anlisis de la varianza.

2.

DESARROLLO TEORICO
En esta Prctica e4plicaremos los siguientes conceptos!

$nlisis de la varianza de un "actor $nlisis de la varianza con dos "actores Anlisis de la varianza c n !n "ac# r

2.1.

Supongamos )ue tenemos K poblaciones & )ueremos comparar un determinado parmetro en cada una de ellas. #icho parmetro se modelar, para cada una de las poblaciones, como una variable aleatoria. -lamaremos 1 , 2 ,K , K a las correspondientes medias poblacionales para cada poblacin. #e cada poblacin e4traemos una muestra aleatoria de tama3o n+ , n 5 ,K , n K , respectivamente. #enominaremos x ij al valor de la observacin j6sima en la ,K n i . -a hiptesis nula )ue deseamos poblacin i6sima. $s, i = +,K , K & j = 1 contrastar es la de igualdad de medias poblacionales, es decir,
H 0 : 1 = 2 = L = K

El procedimiento comienza por obtener las medias poblacionales de los datos correspondientes a cada poblacin, es decir!

xi =

+ ni

x
j =+

ni

ij

i = +,K , K

El siguiente paso es obtener la media com0n de todos los datos a partir de la muestra completa. Es decir!

x=

+ K ni xij n i =+ j =+

siendo n = ni el n0mero total de datos de la muestra completa. (na "orma alternativa para x es! x= EJERCICIO: #emostrar )ue ambas e4presiones de x son e)uivalentes. 7a hemos dicho en la introduccin )ue la base del procedimiento de anlisis de varianza es la comparacin entre los dos tipos de variabilidad )ue se pueden observar en los datos! #enominaremos variabilidad dentro de los grupos a la variabilidad en torno a los valores muestrales de la media para cada una de las K poblaciones. #enominaremos variabilidad entre grupos a la variabilidad entre las medias de los K grupos. + K ni xi n i =+
i =+

Vamos a estimar esas dos "uentes de variabilidad. En primer lugar, obtendremos una medida de la variabilidad dentro de los grupos. Para cada grupo sumaremos los valores de las di"erencias al cuadrado de los valores en ese grupo & la media muestral del grupo. Es decir!

S' i = (x ij xi )
j =+

ni

-a variabilidad total dentro de los grupos la obtendremos como la suma de los K valores anteriores, es decir!

S'# = S' i = (xij x i )


K K i =+ i =+ j =+

ni

En segundo lugar, vamos a estimar la variabilidad entre grupos. (na "orma razonable de proceder sera evaluar las di"erencias entre la media muestral de cada 5 grupo & la media muestral global. Es decir! (x i 8 x ) . -lamaremos a la medida total de variabilidad entre grupos suma total de cuadrados entre grupos! S'9. $l calcularla, habr )ue tener en cuenta )ue se debe dar ms peso a las discrepancias )ue se observen en los grupos en los )ue ha&a ms medidas!

S'9 = ni (x i x )
i =+

$ veces es 0til calcular la suma de cuadrados total. es la suma d los cuadrados de las di"erencias de las observaciones & la media global. -a e4presamos como S':.

S': = (x ij x )
K i =+ i =+

ni

7 se puede demostrar )ue


S': = S'# + S'9

Vamos a establecer nuestro contraste de hiptesis para la igualdad de medias de las poblaciones. $ctuaremos ba o la suposicin de )ue todas las poblaciones tienen la misma varianza. En ese caso puede demostrarse )ue se puede obtener una estimacin insesgada de la varianza poblacional, )ue es!
';# = S'# n-K

';# se denomina cuadrado medio dentro de los grupos. Slo ba o la hiptesis de )ue las medias poblacionales son iguales, otro estimador insesgado de la varianza poblacional es lo )ue se denomina cuadrado medio entre grupos!
';9 = S'9 +

Si las medias poblacionales no son iguales, este valor tender a presentar valores superiores al anterior, &a )ue incorporar in"ormacin sobre las verdaderas di"erencias entre las medias. Pero si la hiptesis nula es cierta, ';9 & ';# son dos estimadores de la misma cantidad. El contraste de hiptesis est basado en la razn de ambas cantidades!
=
';9 ';#

Si la hiptesis nula es verdadera, la razn anterior ser apro4imadamente igual a +. En caso contrario, tender a ser ma&or )ue +. Se puede demostrar )ue si la hiptesis nula es cierta, F tiene una distribucin F con K6+ grados de libertad en el numerador & n < K grados de libertad en el denominador.

Estamos por tanto en disposicin de establecer el contraste de hiptesis para la igualdad de medias poblacionales. Supongamos )ue tenemos K muestras aleatorias independientes de K poblaciones, con tama3os muestrales respectivamente de n+ , n 5 ,K , n K . n = ni es
i =+ K

el tama3o muestral total. 'alcular la suma de cuadrados dentro de los grupos!

S'# = ( x ij xi )
K i =+ j =+

ni

+ donde xi = ni

x
j =+

ni

ij

'alcular los cuadrados medios dentro de los grupos!


';# = S'# n-K

'alcular la suma de cuadrados entre grupos! S'9 = ni (x i x )


i =+ K 5

donde x =

+ K ni xij n i =+ j =+

'alcular los cuadrados medios entre grupos!


';9 = S'9 +

El contraste de hiptesis con un nivel de signi"icacin de tiene la siguiente regla de decisin! =echazar H , si
';9 > FK +,n K , ';#

Anlisis de varianza c n d s "ac# res $ !na %servaci&n ' r celda

En el contraste )ue hemos visto en la seccin anterior, se ha supuesto )ue la variabilidad puede ser debida a dos "actores! la propia di"erencia entre medias poblacionales & la aleatoriedad intrnseca. Pero en ciertos casos, puede ser posible e4plicar parte de esa aleatoriedad por un determinado "actor. En el e emplo )ue utilizbamos en la introduccin sobre tres tipos de "ertilizantes, aparte de la variabilidad debida al tipo de "ertilizante, puede haber otros "actores, como el tipo de terreno, las condiciones climatolgicas, etc. En los casos en los )ue es posible identi"icar esos "actores, se puede intentar utilizar esa in"ormacin para reducir esa variabilidad adicional, no debida a las causas )ue estamos estudiando, & dise3ar as un contraste ms potente. 'onsideremos el caso en el )ue slo ha& un "actor adicional. -lamaremos variable de bloque a la variable )ue da cuenta de este "actor adicional. En nuestro e emplo, si suponemos )ue en cada terreno se prueban los tres tipos de "ertilizante en tres sectores del terreno, la variable de blo)ue sera el tipo de terreno. Este tipo de dise3o de e4perimentos se denomina diseo por bloques aleatorizados. El nombre se debe a )ue se escoge aleatoriamente un representante del primer blo)ue 1en nuestro e emplo, un terreno de un tipo determinado2, un representante del segundo blo)ue, etc., & sobre ellos se prueba cada tipo de "ertilizante. >ormulamos a continuacin nuestro contraste de hiptesis! Sea K el n0mero de grupos o poblaciones & H el n0mero de blo)ues. Sea x ij la muestra del grupo i6simo 1 i = +,K , K 2 & del blo)ue j 1 j = +,K , H 2. ?uestro inters es desarrollar un contraste para igualdad de las medias poblacionales de los K grupos. 'alcularemos en primer lugar las medias muestrales. #enotaremos por media del grupo i6simo!

x i

a la

+H xi = xij i = +,K , K H i=+


7 denotaremos por x j a la media del blo)ue i6simo! x j = + K

x
i =+

ij

7, "inalmente, llamando n al n0mero total de observaciones, tenemos la media global!

x=

+ K H + K + H x = x = x j ij K i n i =+ j =+ H i =+ j =+

-a idea clave para el anlisis de la varianza de dos "actores es )ue se puede demostrar 1ver te4to bsico )ue se cumple la siguiente relacin entre las desviaciones respecto de la media muestral global involucradas!

()= ( )+ ()xxKxxHxx + ( xxxx )


Si denominamos! Suma de cuadrados total!
S': = ( xij x )
K H i =+ j =+ 5

KH K H KH 5 5 5 5 ij i j ij i j i=+ j=+ i=+ j=+ i=+ j=+

Esta ecuacin e4presa )ue la desviacin total de los datos respecto a la media global total se puede e4presar como la suma de las desviaciones de los grupos respecto a la media global, de los blo)ues respecto a la media global, & la desviacin de error residual

Suma de cuadrados entre grupos!

S'9 = H (xi x)
i=+
Suma de cuadrados entre blo)ues!
K i =+

S'% = K ( x j x ) Suma de cuadrados de error!

S'E= (xijxixjx)
KH i=+ j=+
la ecuacin anterior se puede e4presar as!

S': @ S'9 A S'% A S'E -o )ue resta por hacer es algo mu& similar a lo )ue hicimos en la seccin anterior. Bbtendremos los cuadrados medios dividiendo la correspondiente suma de cuadrados por el n0mero de grados de libertad! Para la suma total de cuadrados los grados de libertad son n < +. Para la suma de cuadrados entre grupos, los grados de libertad son K < +. Para la suma de cuadrados entre blo)ues los grados de libertad son H < +. Para la suma de cuadrados de errores tendremos los grados de libertad restantes, es decir!

(n 8 +)8 (K 8 +)8 (H 8 +) @ (K 8 +)(H 8 +)


en donde la igualdad anterior se obtiene por simple manipulacin algebraica sin ms )ue tener en cuanta )ue n = KH .

You might also like