You are on page 1of 16

Repblica Bolivariana de Venezuela Ministerio para el Poder Popular para la Educacin Superior Universidad Bicentenaria de Aragua San Joaqun

de Turmero

Anlisis de la Varianza

Integrantes: Daniel Rodriguez; C.I.: 20.696.766

Jueves 28 de Enero de 2010

Indice

Introduccin El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. por dos motivos: En primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad . Si se realizan m contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere el valor crtico es (1 - )m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - )m, que para valores de prximos a 0 es aproximadamente igual a m. Una primera solucin, denominada mtodo de Bonferroni, consiste en bajar el valor de , usando en su lugar /m, aunque resulta un mtodo muy conservador. Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la misma poblacin y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas. El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante.

Desarrollo El anlisis de la varianza o anlisis de varianza (ANOVA, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza esta particionada en ciertos componentes debidos a diferentes variables explicativas. Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como Anova de Fisher o anlisis de varianza de Fisher, debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis. El anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El procedimiento para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. Se quiere hacer un test sobre los efectos de k tratamientos que han sido administrados a n 1 , n 2 , ... , n k individuos respectivamente. En el anlisis de varianza, el parmetro que puede influir sobre los datos se llama un factor, y sus valores las modalidades (en este caso los diferentes tratamientos). En el modelo probabilista, cada modalidad corresponde a una muestra. Para
h=1, 2,... , k , denotamos por:

a las variables aleatorias que modelan los datos del h-simo grupo, que se

suponen independientes y con una misma ley N h , 2 . Se supone que en particular la varianza 2 es constante, hiptesis que puede ser validada a travs de un test. Se quiere saber si la variabilidad que se observa en los datos se debe solamente al azar o si existen efectivamente diferencias significativas entre las clases, imputables al factor. Para esto vamos comparar las varianzas empricas de cada muestra con la varianza de la muestra global, de tamao n 1n 2...nk = n . La media de las varianzas (ponderada por los efectivos) resume la variabilidad en el interior de las clases, de ah el nombre de varianza intra-clases o varianza residual. La varianza de las medias describe las diferencias entre las clases que pueden deberse al tratamiento, de aqu el nombre de varianza nter-clases, o varianza explicada. Si los tratamientos tienen efectivamente un efecto, se espera que la varianza explicada sea grande en comparacin con la varianza residual. Existen tres clases conceptuales de los modelos de Anlisis de Varianza: El Modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias. (Modelo 1) El Modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua. Ejemplo: El experimentador ha aprendido y ha considerado en el experimento slo tres de muchos ms mtodos

posibles, el mtodo de enseanza es un factor aleatorio en el experimento. (Modelo 2) El Modelo de efectos mixtos describen situaciones que ste puede tomar. Ejemplo: Si el mtodo de enseanza es analizado como un factor que puede influir donde estn presentes ambos tipos de factores: fijos y aleatorios. (Modelo 3) El ANOVA parte de algunos supuestos que han de cumplirse: La variable dependiente debe medirse al menos a nivel de intervalo. Independencia de las observaciones. La distribucin de los residuales debe ser normal. Homocedasticidad: homogeneidad de las varianzas. La tcnica fundamental consiste en la separacin de la suma de cuadrados (SS, 'sum of squares') en componentes relativos a los factores contemplados en el modelo. Como ejemplo, mostramos el modelo para un ANOVA simplificado con un tipo de factores en diferentes niveles. (Si los niveles son cuantitativos y los efectos son lineales, puede resultar apropiado un anlisis de regresin lineal) SSTotal = SSError + SSFactores El nmero de grados de libertad (gl) puede separarse de forma similar y se corresponde con la forma en que la distribucin chi-cuadrado describe la suma de cuadrados asociada. glTotal = glError + glFactores El anlisis de la varianza de un factor es el modelo ms simple: una nica

variable nominal independiente, con tres o ms niveles, explica una variable dependiente continua. Otra alternativa, que aparentemente es ms lgica e intuitiva, consiste en comparar, en todas las posibles combinaciones de dos en dos, las medias de todos los subgrupos formados. Esto trae parejo, fundamentalmente, dos tipos de problemas: a).- Se incrementa el riesgo de dar un resultado falso positivo, al realizar ms de un anlisis sobre un mismo conjunto de datos. b).- Es difcil interpretar la verdadera influencia de la variable que acta como factor de clasificacin, porque genera diferentes niveles de significacin (p), resultantes de las comparaciones entre sus subgrupos. Mediante el ANOVA se eliminan estos inconvenientes. Con estas tcnicas se analiza globalmente la influencia de cada variable independiente, generndose un nico nivel de significacin. Con el anlisis de la varianza se puede analizar simultneamente la influencia de dos o ms factores de clasificacin (variables independientes) sobre una variable respuesta continua. Esto se conoce como anlisis factorial de la varianza. El efecto de un factor puede aadirse al de otro factor (modelo aditivo) o bien puede potenciarse (modelo multiplicativo). En este ltimo caso, aparece y se analiza un nuevo factor de interaccin sobre la variable respuesta, como resultado de la accin conjunta de dos o ms factores. Este posible efecto es detectado en el anlisis de la varianza por la significacin de su estadstico de contraste correspondiente.

Las tcnicas del anlisis de la varianza, basadas en la particin de la variabilidad (suma de cuadrados) de la respuesta estudiada, sirven de base para el anlisis de distribuciones de datos generados, en diseos ms complejos, como es el anlisis de covarianza. En este ltimo tipo de anlisis se combinan variables explicativas discretas y continuas. La variabilidad de la respuesta es analizada como en el anlisis factorial de la varianza, una vez que se ha eliminado la posible influencia de la o las variables continuas explicativas. Sera un anlisis anlogo al de la varianza de los residuales; esto es, se analizan los residuos de la regresin en lugar de los datos iniciales. Otros modelos ms complejos son el anlisis de medidas repetidas sobre las mismas unidades experimentales, el anlisis de diseos cruzados, anlisis anidados o el anlisis de la varianza factorial con informacin incompleta. En el ANOVA se comparan medias, no varianzas: medias de los subgrupos o estratos originados por los factores de clasificacin estudiados. En esta tcnicas, la hiptesis alternativa es mltiple, puesto que engloba diferentes hiptesis, todas ellas referidas al hecho de que alguna de las medias de los estratos sea diferente de las dems. Cuando se alcanza la significacin en alguno de los factores estudiados, es lgico preguntarse cul de las hiptesis alternativas es la que origina la significacin. Esto es equivalente a preguntarse qu media o medias son diferentes entre s. Estos enigmas se resuelven mediante procedimientos "a posterior" para comparar ms de dos medias. Funcionan eficientemente, si previamente el factor en estudio ha resultado significativo en alguna tcnica multivariante previa, como el ANOVA.

Anlisis de Varianza con una Poblacin

A veces, los analistas investigan la variabilidad de una poblacin, en lugar de su media o proporcin. Esto es debido a que la uniformidad de la produccin muchas veces es crtica en la prctica industrial. La variabilidad excesiva es el peor enemigo de la alta calidad y la prueba de hiptesis est diseada para determinar si la varianza de una poblacin es igual a algn valor predeterminado. La desviacin estndar de una coleccin de datos se usa para describir la variabilidad en esa coleccin y se puede definir como la diferencia estndar entre los elementos de una coleccin de datos y su media. La varianza de un conjunto de datos se define como el cuadrado de su desviacin estndar; y la varianza muestral se utiliza para probar la hiptesis nula que se refiere a la variabilidad y es til para entender el procedimiento de anlisis de la varianza. La hiptesis nula; para la prueba de la varianza, es que la varianza poblacional es igual a algn valor previamente especificado. Como el aspecto de inters, por lo general es si la varianza de la poblacin es mayor que este valor, siempre se aplica una de una cola. Para probar la hiptesis nula, se toma una muestra aleatoria de elementos de una poblacin que se investiga; y a partir de esos datos, se calcula el estadstico de prueba. Para este clculo se utiliza la siguiente ecuacin: ( n 1 ) s2 c2 = ---------------d2

Donde: * n-1 = Grados de libertad para la prueba de tamao n. * s2 = Varianza muestral. * d2 = Varianza poblacional si y solo si suponemos que la hiptesis nula es cierta.

Conclusiones El ANOVA se fundamenta en el estudio de las varianzas. Como establece diferencia entre las medias poblacionales, es un mtodo matemtico creado para probar la hiptesis de que las medias aritmticas de ms de dos grupos poblacionales son iguales. No obstante que el anlisis de varianza permite obtener una conclusin que se refiere a la poblacin contenda en una muestra. En otros temas de estadstica que hemos tomado, aprendiste que la mejor manera de estudiar un conjunto de datos es formar una tabla de distribucin para obtener sus elementos descriptivos (como son media, varianza, desviacin estndar). En Contraste, durante el ANOVA se emplearn tablas para organizar valores estadsticos que son el resultado de la aplicacin de formulas y que nos faciliten el anlisis e interpretacin del ANOVA.

Bibliogrfica http://ayuda-en-estadistica.blogspot.com/ http://definicion-del-anova.blogspot.com/ http://www.monografias.com/trabajos7/anva/anva.shtml http://www.mitecnologico.com/Main/AnalisisDeVarianza http://es.wikipedia.org/wiki/Anlisis_de_la_varianza http://html.rincondelvago.com/analisis-de-la-varianza_1.html

Cierto investigador lleva a cabo un experimento con el propsito de determinar el impacto que produce el ruido en el nivel de comprensin de lectura. Especficamente se quieren identificar las consecuencias de las distracciones y perturbaciones auditivas en los Estudiantes de una universidad. Para realizar la investigacin, selecciona al azar 30 alumnos de la institucin. Posteriormente los agrupa en tres conjuntos de 10 estudiantes cada uno. A los individuos del grupo I les da 35 minutos para que lean una historia en una sala de lectura en la que no hay ruido ni ninguna distraccin. Simultneamente, a los sujetos del grupo II les da la misma historia y el mismo tiempo que a los del grupo I, slo que ellos realizan la lectura en una sala donde se puede identificarla presencia de ruido moderado. Por ltimo, a los estudiantes del grupo III se les da la misma narracin y el mismo tiempo que a los otros dos grupos. nicamente que ellos realizan la lectura en la cafetera de la universidad, en la que hay mucho ruido y muchas posibles causas de distraccin auditiva. Es decir, a los 3 grupos de estudiantes se les dio un tratamiento distinto. Transcurridos los 35 minutos que destinaron los alumnos a leer la historia. se junta a los tres grupos y se les aplica un mismo examen de comprensin de lectura. La idea del investigador es medir (de alguna manera), la retencin de los alumnos respecto a la historia que acaban de leer, Posteriormente se califican los 30 exmenes, se clasifican por grupo y se determina la calificacin promedio que se obtuvo de cada una de las tres muestras.

Puesto que, a los tres conjuntos de alumnos se les dio un tratamiento diferente. La pregunta inmediata que el investigador desear contestar, es: - La intensidad del ruido y posibles distracciones auditivas tienen efecto en el nivel de comprensin de lectura de los estudiantes? En caso de que la respuesta sea afirmativa, se puede esperar que la calificacin promedio de cada uno de los tres grupos sea distinta. Esto es, si la calificacin promedio de los grupos se representa por: xa, xb y xc respectivamente, y la respuesta a la pregunta anterior es afirmativa, entonces estas tres cantidades sern Diferentes. En caso contrario, si la intensidad del ruido y posibles distracciones auditivas no producen ningn efecto en el nivel de comprensin de lectura de los alumnos de las tres muestras, entonces se podr esperar que esas tres cantidades? sean iguales (xa = xb = xc). En sentido estricto, el analisis de varianza se refiere a la actividad de comparar los valores promedio de una poblacin que ha sido divida en varios subconjuntos. Esta divisin se hace de acuerdo con los distintos tratamientos que se da a los elementos de la poblacin. No obstante que el anlisis de varianza permite obtener una conclusin que se refiere a la poblacin, ste procedimiento se lleva a acabo a partir de la informacin contenida en una muestra.

Retomamos el caso de nuestro ejemplo. La poblacin es el total de alumnos de la universidad y sta se divide en tres subconjuntos : Subconjunto 1: Los alumnos que comnmente realizan sus tareas de estudio en una sala de lectura que se encuentra en la biblioteca de la universidad. Subconjunto 2:Los escolares generalmente hacen sus tareas en un auditorio con ruido moderado. Subconjunto 3:Los alumnos que llevan a cabo sus tareas de estudio en la cafetera de la universidad en la que hay mucho ruido. Supongamos por un momento que a todos los estudiantes de la universidad les dan 35 minutos para leer una historia e inmediatamente despus se les aplica el mismo examen de comprensin de lectura. Supongamos tambin que dicho examen se aplica a los estudiantes cuando estn en cualquiera de los tres lugares antes mencionados. Transcurridos los 30 minutos destinados a responder el examen, stos se recogen, se clasifican (de acuerdo con el lugar donde lo contestaron), se califican y se obtiene la nota promedio de cada uno de los tres subconjuntos de la poblacin. Un mtodo para determinar la calificacin promedio de los tres subconjuntos de la poblacin es mediante un procedimiento de muestreo. Pongamos por caso que se obtiene una muestra de cada uno de los tres subconjuntos. Si (las muestras) x1, X2 y x3 representan las calificaciones promedio de las muestras y (las medias pob) u1, u2 y u3 las calificaciones promedio de los subconjuntos de la poblacin, entonces se puede esperar que x1, sea un valor aproximado a u1 (que x2 sea un valor aproximado a u2 y x3 se

aproxime u3): se dice que la media muestral x es un estimador de la media poblacional(u). Un estimador es una frmula o procedimiento estadstico que permite calcular un valor (aproximado) de un parmetro o caracterstica poblacional. En el ejemplo, u1 u2, u3 son parmetros y x1, x2, x3 son estimadores. Siguiendo con la narracin de nuestro ejemplo; si las medias de los tres subconjuntos de la poblacin son iguales (u1, =u2 =u3), cabe esperar que las tres medias de las muestras Se aproximen entre s (x1 diferente a x2 diferente x3 ). De hecho, mientras ms prximas estn las medias de las tres muestras, se tendr mayor evidencia de que las medias poblacionales son iguales. En contraposicin, a medida que los valores de las medias mustrales sean diferentes, habr mayor evidencia de que las medias poblacionales son tambin diferentes.

You might also like