Professional Documents
Culture Documents
ANALISIS DE VARIANZA
El anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una
coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est
particionada en ciertos componentes debidos a diferentes variables explicativas.
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R.
A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis
de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de
hiptesis.
El anlisis de varianza se sigue para facilitar una prueba de hiptesis, mediante la cual la variacin
total presente en un conjunto de datos se particiona en varias componentes, algunas se atribuyen
a variables explicativas o factores y otra al azar (error inmerso en el modelo) de modo que en el
anlisis es posible averiguar la magnitud de las contribuciones de cada una de las fuentes a la
variacin total.
El anlisis de varianza tiene su aplicacin ms amplia en anlisis de los datos obtenidos a
partir de experimentos.
El anlisis de varianza se utiliza en dos fines:
Estimar y probar la hiptesis acerca de las varianzas de las poblaciones.
Estimar y probar la hiptesis acerca de las medias de las poblaciones.
El anlisis de varianza para los diversos diseos, sigue el siguiente procedimiento:
1. Modelo.- El modelo insistir de una representacin simblica de un
valor tpico tomado de los datos que se estn analizando.
2. Suposiciones.- Especificaciones que fundamentan el modelo.
3. Hiptesis.- Se indicarn las hiptesis que puedan probarse de acuerdo
al modelo se formular H0 y H1 .
I.
Un diseo completamente aleatorizado (DCA), es el diseo en el cual las unidades son asignadas
completamente al azar a los tratamientos, o viceversa. Esto es un diseo que no supone
restricciones tales como bloqueo en la distribucin de los tratamientos a las unidades
experimentales.
Este diseo debe limitarse su uso a casos en los cuales se dispone de unidades
experimentales homogneas. Si no pueden obtenerse tales unidades, debe utilizarse algn
bloqueo para incrementar la eficiencia del diseo.
MODELO.
Suponga que se tiene K niveles de un solo factor que se desean comparar.
La respuesta observada a partir de cada uno de los K niveles o tratamientos es una
variable aleatoria. Los datos aparecen en la tabla. Yij representa la i_sima
observacin tomada bajo el tratamiento j.
Es posible describir las observaciones de la tabla mediante el modelo estadstico lineal.
Yij = u + j +
i j
i = 1, 2, ... , n
j = 1, 2, ... , k
OBSERVACIONES
TOTAL
Medias
VARIANZAS
1
y11
y21
.
.
.
yn1
TRATAMIENTOS
2
. . .
K
y12
. . .
y1k
y22
. . .
y2k
.
.
.
.
.
.
yn2
. . .
ynk
T.1
T.2
.1
.2
2
.1
. . .
. . .
T.k
.k
2
S .2
. . .
S .k
. j = T. j / n j media del j-simo TT0 .
Suposiciones.
El modelo a efectos fijos implica que se est interesado solo en k poblaciones representados
por los datos de la muestra. Cualquier inferencia que pueda hacerse se aplica solo a estas
poblaciones.
...
2
k
Si H0 es verdadero y si 1 = 2 =
=
situacin se observa como fig. 1
2
2
...
2
1= 2= = k
Fig: 1
1=2= . . . =k
Si H0 es falso pueda serlo debido a que una de las medias de las poblaciones difiere del resto que
son iguales entre si, o bien puede ocurrir que todas las medias poblacionales sean diferentes. Es
decir al menos una de las j para cualquier valor de j=1,,k ; sea diferente del resto
4. CALCULOS.
Se Desarrollar el anlisis de varianza para el modelo de efectos fijos, clasificacin en un sentido,
aqui:
k
SCT =
(y
j 1
i 1
ij
y )
nj
T2
y
N
j
1
k
nj
2
ij
( y
SCT =
j 1 1
y j y j y ) 2
ij
SCT=
( y
j 1 1
y j )
ij
nj
( y
j 1 1
SCE
y ) 2
SCTR
nj
SCE =
( y
j 1 1
Donde:
nj
j 1 1
(T j ) 2
j 1
nj
SCTR =
( y
SCTR =
y j )
ij
nj
M YY =
y )
T2
(T j ) 2
j 1
nj
(T j ) 2
j 1
nj
(T j ) 2
j 1
nj
2
ij
E yy
T2
TYY
N
M YY
T2
N
nj
y
j
2
ij
- MYY - TYY
Suma de cuadrados
SCTR =
k
SCE=
2
.J /n
nj
-T.. /N
k
(T j ) 2
j 1
nj
y
2
ij
1
2
SCT=yij T.. /N
Grados
de
libertad
k-1
N-K
N-1
Media de cuadrados
CMTR = SCTR/(k-1)
CME = SCE/(N-K)
F0
F0 = CMTR/CME
RRH0
RAH0
, k-1, N-k
Se rechaza Ho si F> F
, k-1, N-k
Ejemplo 1: Un ingeniero desea mejorar la resistencia a la compresin del concreto. Sospecha que
la resistencia es una funcin de la concentracin de la concentracin de un aditivo. Decide
investigar con distintas concentraciones:
5, 10, 15, 20 y 25 %.
Han de tomarse cinco
observaciones para cada concentracin de aditivo, empleando una planta piloto.
Las 25
observaciones necesarias se realizan en forma aleatoria, y los datos obtenidos se muestran en la
tabla.
2
5%
7
7
15
11
9
49
5
9.8
TOTALES(Ti)
Numero de observaciones
Medias(i)
TRATAMIENTOS
Concentracin del aditivo
10%
15%
20%
12
14
19
17
18
25
12
18
22
18
19
19
18
19
23
77
88
108
5
5
5
15.4
17.6
21.6
TOTAL
25%
7
10
11
15
11
54
5
10.8
376
25
15.04
Donde: Totales = T = Ti
Numero de observaciones = n
= T/ n
1.
Modelo:
yij = +
+ ij
2. Suposiciones:
Se tiene 5 muestras independientes
2
Cada provisin N(j , j).
2
2
2
2
Poblaciones con variaciones homogneas: 1 = 2 = ... = 5 =
2
j = 0 y ij
DNI(O, )
F0 =
Tyy
(suma de cuadrados entre tratamientos)
-------- ----------------------------------------------------------- = F0.05,4,20
Eyy
(suma de cuadrados del error experimental)
6. Regla de decisin:
Si Fc > F,(k - 1),(n - k)
H0 se rechaza a un nivel de
Si Fc F,(k - 1),(n - k)
H0 no se rechaza.
7. Clculos: se realizan los clculos para obtener las estimaciones en la tabla ANOVA; es decir:
El ANOVA resultante se muestra en la siguiente tabla:
Tabla : anlisis de resistencia para los datos de resistencia a la tensin.
Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Cuadrados
medios
Tratamientos
Error experi.
total
475.76
161.20
636.96
4
20
24
118.94
8.06
---------
Cuadrado
medio
esperado
14.76
F0
0.00001
RESULTADOS
En
Comparisons
indicar los
mtodos de
comparacin
mltiples de
Tukey y Fisher
CONCLUSIONES
Como p value = 0.000< 0.05, Se
Rechaza H0 y Se concluye que la
concentracin del aditivo influye de
manera
significativa
en
la
resistencia a la compresin del
concreto.
COMPARACIONES MULTIPLES
Boxplot of Resistencia
25
4
20
Resistencia
15
10
5
5.00%
10.00%
15.00%
20.00%
25.00%
Concentracin
Resistencia a la Tensin
1
15
5
8
15
20
12
17
12
25
17
18
18
30
19
25
22
35
7
10
11
FUENTE: Diseo y Anlisis de Experimentos de Montgomery
11
18
19
19
15
9
18
19
23
11
SOLUCION EJEMPLO 2
a) Cul es el objetivo del anlisis de los datos de este experimento?
El objetivo es saber Cmo influye el porcentaje de algodn en la Resistencia a la
tensin de las fajas?.
b) Cul es el diseo experimental que se emplear en este caso?Cul es el
modelo estadstico que le corresponde a dicho diseo? Bajo que supuestos?.
Enumrelos
El diseo experimental a emplear es el Diseo Completamente Aleatorizado, al cual le
corresponde el siguiente modelo:
Yij = u + j + ei j ;
i = 1, 2, ... , n
j = 1, 2, ... , k
Donde :
: Es una constante e indica el efecto medio verdadero; parmetro comn a todos TT 0S.
ei j : incluye los efectos de todos los otros factores extraos. Es un trmino de error ,
considerado como variable aleatoria
Puede probarse la hiptesis:
H0 : 1=2= . . . =k
H1 : No todas las j son iguales
Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a
cero, de modo que alternativamente la hiptesis puede enunciarse como:
H0 : j = 0;
H1 : j
0
j=1, 2, . . . k
Indicar la variable
respuesta que es la
Resistencia a la
tensin y el Factor o
variable respuesta
es el % de
Algodn.
En
Comparisons
indicar los
mtodos de
comparacin
mltiples de
Tukey y Fisher
RESULTADOS
CONCLUSIONES
Como p value = 0.000< 0.05, Se
Rechaza H0 y Se concluye que el
porcentaje de algodn influye de
manera
significativa
en
la
resistencia a la tensin de las fajas.
10
Resistencia Tensin
25
20
15
10
5
15.00%
20.00%
25.00%
30.00%
35.00%
% de algodn
f)
11
Fuente de
Variacin
Suma de
Cuadrados
Grados de
Libertad
12
Cuadrado Medio
F0
Ejemplo 3:
Se realiz un experimento para determinar el efecto de cuatro sustancias qumicas diferentes
sobre la resistencia de un material. Estas sustancias qumicas se usan como parte del proceso de
acabado del planchado permanente. Se seleccionaron cinco tipos de material, y se corri un
diseo de bloques completos aleatorizados para probar cada tipo de sustancia qumica sobre cada
tipo de material de forma aleatoria. Se muestran a continuacin los datos, lo que se desea probar
es las diferencias de las medias utilizando el anlisis de varianza con =0.01.
Tabla 1: Datos de la Resistencia del material: Diseo de Bloques completos Aleatorios
Tipo de
Sustancia
qumica
1.3
1.6
0.5
1.2
1.1
2.2
2.4
0.4
2.0
1.8
1.8
1.7
0.6
1.5
1.3
3.9
4.4
2.0
4.1
3.4
Tipo de Material
13
RESULTADOS
I)
III.
14