You are on page 1of 6

ANLISIS DE LA VARIANZA ANOVA DEFINICIN El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias.

Es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. En resumen, el anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El mtodo para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. El ANOVA parte de algunos supuestos que han de cumplirse:

La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de la variable dependiente debe ser normal. Homocedasticidad: homogeneidad de las varianzas.

Existen tres tipos de modelos:

El modelo de efectos fijos asume que el experimentador ha considerado para el factor todos los posibles valores que ste puede tomar. Ejemplo: Si el gnero del individuo es un factor, y el experimentador ha incluido tantos individuos masculinos como

femeninos, el gnero es un factor fijo en el experimento.

Los modelos de efectos aleatorios asumen que en un factor se ha considerado tan slo una muestra de los posibles valores que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir sobre el nivel de aprendizaje y se ha

considerado en el experimento slo tres de los muchos ms mtodos posibles, el mtodo de enseanza es un factor aleatorio en el experimento.

Los modelos mixtos describen situaciones donde estn presentes ambos tipos de factores: fijos y aleatorios.

La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal). SSTotal = SSError + SSFactores El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribucin chi-cuadrado describe la suma de cuadrados asociada. glTotal = glError + glFactores Nota: Por grados de libertad "degrees of freedom" entendemos el nmero efectivo de observaciones que contribuyen a la suma de cuadrados en un ANOVA, es decir, el nmero total de observaciones menos el nmero de datos que sean combinacin lineal de otros. Del mismo modo que la t de Student, la prueba ANOVA es una prueba paramtrica y como tal requiere una serie de supuestos para poder ser aplicada correctamente. Denominada ANOVA o anlisis de la varianza, en realidad nos va a servir no solo para estudiar las dispersiones o varianzas de los grupos, sino para estudiar sus medias y la posibilidad de crear subconjuntos de grupos con medias iguales. Se puede decir que la prueba ANOVA es la generalizacin de la t de Student, ya que si realizamos una prueba ANOVA en la comparacin de solo dos grupos, obtenemos los mismos resultados. Al igual que la t de Student, se requiere que cada uno de los grupos a comparar tenga distribuciones normales, o lo que es ms exacto, que lo sean

sus residuales. Los residuales son las diferencias entre cada valor y la media de su grupo. Adems debemos estudiar la dispersin o varianzas de los grupos, es decir estudiar su homogeneidad. Cuando mayor sean los tamaos de los grupos, menos importante es asegurar estos dos supuestos, ya que el ANOVA suele ser una tcnica bastante robusta comportndose bien respecto a transgresiones de la normalidad. No obstante, si tenemos grupos de tamao inferior a 30, es importante estudiar la normalidad de los residuos para ver la conveniencia o no de utilizar el anlisis de la varianza. Si no fuera posible utilizar directamente el ANOVA, podemos recurrir al uso de pruebas no paramtricas, como la de Kruskal-Wallis. Como ya hemos dicho, el ANOVA es la generalizacin de la t de Student, y sus hiptesis nula y alternativa se pueden formular del siguiente modo: Hiptesis nula (Ho): 1= 2== k Las medias de los k grupos son iguales y por tanto las diferencias encontradas pueden explicarse por el azar. Dicho de otro modo, los grupos proceden de poblaciones con medias iguales. Hiptesis alternativa (H1): al menos uno de los grupos tiene una media distinta del resto de grupos. En la prueba ANOVA las comparaciones son siempre bilaterales (a dos colas) ya que estudiamos globalmente si los grupos tienen medias distintas, y no si un grupo tiene una media menor o mayor que otro por separado. Si se rechaza la hiptesis nula, no sabremos entre qu grupos estn las diferencias. EJEMPLOS: 1. Los miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan con mtodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado, el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Despus de un mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido cronometrado de 9 Km. Los tiempos empleados fueron los siguientes:

A un nivel de confianza del 95% Puede considerarse que los tres mtodos producen resultados equivalentes? O por el contrario Hay algn mtodo superior a los dems?

Solucin: Comenzamos calculando los totales y los cuadrados de los totales divididos por el nmero de observaciones:

A continuacin calculamos los cuadrados de las observaciones y su total:

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados: SC(total) = 2984 - 2940 = 44 SC(intra) = 2984 2966,8 = 17,2 SC(entre) = 2966,8 2940 = 26,8

Los cuadrados medios sern: CM(entre) = 26,8/2 = 13,4 CM(intra) = 17,2/12 = 1,43 Por consiguiente el estadstico de contraste vale:

F = 13,4/ 1,43 = 9,37

El valor de la F terica con 2 y 12 grados de libertad, a un nivel de confianza del 95% es 3,89. Por consiguiente se rechaza la hiptesis nula y se concluye que los tres mtodos de entrenamiento producen diferencias significativas.

2. Una lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro procedimientos diferentes, asignados al azar a un grupo de sujetos. Posteriormente se les realiza una prueba de recuerdo de dichas palabras, obtenindose los siguientes resultados:

Qu conclusiones pueden sacarse acerca de las cuatro formas de presentacin, con un nivel de significacin del 5%?

Solucin:

Comenzamos calculando los totales y los cuadrados de los totales divididos por el nmero de observaciones:

A continuacin calculamos los cuadrados de las observaciones y su total:

A partir de estas cantidades bsicas calculamos las Sumas de Cuadrados: SC(total) = 988 819,8 = 168,2 SC(intra) = 988 902 = 86 SC(entre) = 902 819,8 = 82,2

Los cuadrados medios sern: CM(entre) = 82,2/3 = 27,4 CM(intra) = 86/22 = 3,9

Por consiguiente el estadstico de contraste vale: F = 27,4/ 3,9 = 7,03

El valor de la F terica con 3 y 22 grados de libertad, a un nivel de confianza del 95% es 3,05. Por consiguiente se rechaza la hiptesis nula y se concluye que los cuatro procedimientos de presentacin producen diferencias significativas.

You might also like