Professional Documents
Culture Documents
El anlisis de la varianza permite contrastar la hiptesis nula de que las medias de K poblaciones (K >2) son
iguales, frente a la hiptesis alternativa de que por lo menos una de las poblaciones difiere de las dems en
cuanto a su valor esperado. Este contraste es fundamental en el anlisis de resultados experimentales, en
los que interesa comparar los resultados de K 'tratamientos' o 'factores' con respecto a la variable
dependiente o de inters.
Las K muestras sobre las que se aplican los tratamientos son independientes.
El ANOVA se basa en la descomposicin de la variacin total de los datos con respecto a la media global
(SCT), que bajo el supuesto de que H0 es cierta es una estimacin de
Variacin dentro de las muestras (SCD) o Intra-grupos, cuantifica la dispersin de los valores de
cada muestra con respecto a sus correspondientes medias.
Variacin entre muestras (SCE) o Inter-grupos, cuantifica la dispersin de las medias de las
muestras con respecto a la media global.
Las expresiones para el clculo de los elementos que intervienen en el Anova son las siguientes:
Media Global:
Variacin Total:
Variacin Intra-grupos:
Variacin Inter-grupos:
su media.
Cuando la hiptesis nula es cierta SCE/K-1 y SCD/n-K son dos estimadores insesgados de la varianza
poblacional y el cociente entre ambos se distribuye segn una F de Snedecor con K-1 grados de libertad en
el numerador y N-K grados de libertad en el denominador. Por lo tanto, si H0 es cierta es de esperar que el
cociente entre ambas estimaciones ser aproximadamente igual a 1, de forma que se rechazar H0 si dicho
cociente difiere significativamente de 1.
Analizar
Comparar medias
ANOVA de un factor
Se selecciona la variable que se considera Dependiente y la variable Factor y con el botn Opciones se
activan EstadsticosDescriptivos y Homogeneidad de varianzas.
Descriptivos. Recoge la media, la desviacin tpica, el intervalo de confianza del 95% (por defecto)
para la media correspondientes a la variable dependiente para cada uno de los grupos definidos por
el factor.
Prueba de homogeneidad de varianzas. Contiene el valor del estadstico de Levene del contraste de
la hiptesis de homoscedasticidad con el nivel de significacin crtico.
ANOVA. Contiene las sumas de cuadrados inter-grupos, intra-grupos y total, sus correspondientes
grados de libertad y el valor del estadstico de prueba F junto con el nivel de significacin crtico.
Como complemento grfico de este anlisis, para obtener una primera aproximacin acerca de si es
razonable o no la hiptesis nula, se selecciona Grficos > Barras de error y se activa la opcin Simple. Con el
botn Definir se abre el siguiente cuadro de dilogo:
Se selecciona en Variable la variable dependiente del ANOVA y en el Eje de categoras la variable factor. El
intervalo
de
confianza
para la media se calcula por defecto al 95% de confianza. Al aceptar aparece en el visor de resultados los
puntos que respresentan a la media de cada grupo junto con los lmites del correspondiente intervalo de
confianza para la media poblacional. Si los puntos que representan las medias estn desigualmente
distribuidos en el grfico se tiene un indicio de que a nivel poblacional no puede sostenerse la hiptesis de
igualdad de medias; es decir, por lo menos uno de los niveles del factor influye significativamente sobre la
variable dependiente.
EJEMPLOS
Con los datos de la encuesta sobre transporte, Enctrans.sav, razonar si puede aceptarse que el tipo de
transporte utilizado, Trans, influye sobre la variable tiempo.
Con la opcin de men Grficos > Barras de error > Simple y con el botn Definir se selecciona
como Variable Tiempo y en Eje de categoras la variable Trans; al aceptar se obtiene la siguiente
representacin grfica:
Como puede observarse, los puntos que representan a las medias de cada grupo aparecen dispersos a
diferentes niveles; sobre todo la media del grupo definido por el factor Tren. El intervalo de confianza para la
media correspondiente al grupo definido por el factor Metro est contenido dentro del intervalo
correspondiente al grupo definido por el factor Bus, as como, el intervalo correspondiente al factor Coche
est contenido dentro de los intervalos correspondientes definidos por los factores Metro y Otros. El grfico,
por tanto, parece sugerir no una nica poblacin sino tres poblaciones con distintas medias.
Para realizar el anlisis de la varianza propiamente dicho la secuencia es Analizar > Comparar medias >
ANOVA de un factor. En el cuadro de dilogo se selecciona Tiempo como variable Dependiente y Trans
como Factor. Para contrastar la hiptesis de igualdad de varianzas se abre con el botn correspondiente el
cuadro de dilogo ANOVA de un factor: Opciones y se activa Homogeneidad de varianzas. Si se desea un
anlisis descriptivo del comportamiento de la variable dependiente dentro de cada grupo se activa tambin la
opcin Descriptivos. Al aceptar se obtienen los siguientes cuadros de resultados:
Este cuadro contiene un anlisis descriptivo de la variable dependiente por grupos, as como, los lmites
superior e inferior para la media de cada grupo al 95% de confianza.
En el cuadro de resultados del ANOVA, el valor del estadstico de prueba, F=6,450, es significativamente
distinto de 1 para cualquier nivel de significacin y, por lo tanto, se rechaza la hiptesis nula de igualdad de
medias y queda confirmada la primera impresin proporcionada por el grfico de barras de error.
ANLISIS DE LA VARIANZA
V. Abraira
Bibliografa:
V. Abraira, A. Prez de Vargas
Mtodos Multivariantes en Bioestadstica.
Ed. Centro de Estudios Ramn Areces. 1996.
Anlisis de la varianza
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar
dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos
medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por
dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente varios
contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar
aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo
que, en la hiptesis nula, hay una probabilidad . Si se realizan m contrastes
independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere
el valor crtico es (1 - )m, por lo tanto, la probabilidad de que alguno lo supere es 1 (1 - )m, que para valores de prximos a 0 es aproximadamente igual a m. Una
primera solucin, denominada mtodo de Bonferroni, consiste en bajar el valor de ,
usando en su lugar /m, aunque resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen
de la misma poblacin, por lo tanto, cuando se hayan realizado todas las
comparaciones, la hiptesis nula es que todas las muestras provienen de la misma
Fuente de
variacin
G.L.
SS
MS
Entre grupos
Tratamientos
k-1
SSA
Dentro
Error
(n-1)k
SSE
SSE /k(n1)
Total
kn-1
SST
Algunas propiedades
Es fcil ver en la tabla anterior que
GLerror+ GLtrata = (n - 1) k + k - 1 = k + k - 1 = nk - 1 = GLtotal
No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad,
llamada identidad o propiedad aditiva de la suma de cuadrados:
SST = SSA + SSE
El anlisis de la varianza se puede realizar con tamaos muestrales iguales o distintos,
sin embargo es recomendable iguales tamaos por dos motivos:
1) La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el
tamao es igual.
2) Igual tamao minimiza la probabilidad de error tipo II.
Ejemplo 1
Se quiere evaluar la eficacia de distintas dosis de un frmaco contra la hipertensin
arterial, comparndola con la de una dieta sin sal. Para ello se seleccionan al azar
25 hipertensos y se distribuyen aleatoriamente en 5 grupos. Al primero de ellos no
se le suministra ningn tratamiento, al segundo una dieta con un contenido pobre
en sal, al tercero una dieta sin sal, al cuarto el frmaco a una dosis determinada y
al quinto el mismo frmaco a otra dosis. Las presiones arteriales sistlicas de los 25
sujetos al finalizar los tratamientos son:
Grupo
1
180
172
163
158
147
173
158
170
146
152
175
167
158
160
143
182
160
162
171
155
181
175
170
155
160
Fuente de
variacin
GL
SS
MS
Tratamiento
2010,64
502,66
11,24
Error
20
894,4
44,72
Total
24
2905,04