You are on page 1of 8

ANLISIS DE LA VARIANZA

Esta es una tcnica estadstica que se utiliza para separar y estimar las diferentes causas de variacin.
Fuentes de variacin:
Error aleatorio en la medicin
Factor controlado o de efecto fijo
En general, el anlisis de varianza se puede aplicar a situaciones en donde hay ms de un factor y ms
de una fuente de variacin aleatoria. A continuacin se explora la tcnica ANOVA de un factor y
posteriormente el caso de dos factores.
Es necesario organizar los datos de manera que puedan aplicarse frmulas generales para su
tratamiento. Se considera que existen h muestras, cada una con n repeticiones, organizadas de la
siguiente manera:
Muestra 1
Muestra 2

x11
x21

x12
x22

x1j
x2j

x1n
x2n

<x>1
<x>2

Muestra i

xi1

xi2

xij

xin

<x>i

xh2
Muestra h
xh1
Nmero total de medidas = N = nh
Los datos de diferentes experimentos
efectuados bajo las mismas condiciones
constituyen un grupo. El nmero total de
grupos es t. Cada grupo posee un nmero
de datos ni. El total de datos es n. Para
estudiar la varianza se construyen sumas
de cuadrados designadas con la letra Q. Q
es la suma de cuadrados total. QA es la
suma de cuadrados entre los grupos y QW
es la suma de cuadrados dentro de los
grupos. Q = QA + QW.

xhj

xhn
<x>h
Media global = <x>

( x x)
n ( x x)
(x x )
2

Q =
i

Q
Q

ij

ij

t 1

; sW =
2

nt

;s =
2

Q
n 1

Se acostumbra a resumir la informacin en una tabla, tal como la siguiente:


Fuente de la
SS (suma de
DF (grados de
MS (cuadrado
variacin
cuadrados)
libertad)
promedio)
Entre grupos
QA
t-1
s2 A
Dentro de
QW
n-t
s2W
grupos
Suma
Q
n-1
s2

Ejemplo 1

F
s2A/s2W

Se estudi la influencia de tres condiciones experimentales diferentes sobre el tamao de los cristales
del hidrato de procrastinina. Las condiciones experimentales se llaman condiciones I, II y III. La
siguiente tabla contiene las longitudes de cristal mximas (m) halladas en 10 experimentos. En la
tabla tambin aparecen, a continuacin de las filas de datos de experimentos, valores de promedios y
sumas de cuadrados que son necesarios para el anlisis de varianza, los cuales usted tiene que
identificar.
Experimento
1
2
3
4
5
6
7
8
9
10

I
19
45
26
23
36
23
26
33
22

condicin experimental
II
40
28
15
24
26
35
27
28
19
26

III
32
26
30
17
23
24
29
20

Con base en estos datos, se construy la siguiente tabla de anlisis de varianza, segn la cual las
diferentes condiciones no tuvieron un efecto significativo sobre el tamao mximo del cristal.
Fuente
SS
DF
MS
F
Entre grupos
38
2
19.0
0.377
Dentro de
1209
24
50.4
grupos
Suma
1247
26
47.8
Ejemplo
En la siguiente tabla aparecen los resultados de una investigacin sobre la estabilidad de un reactivo
fluorescente en diferentes condiciones de almacenamiento. Los valores son las seales de
fluorescencia de soluciones diluidas de la misma concentracin.
Medidas repetidas
Media
Condiciones
A recientemente preparada
102, 100, 101
101
B una hora en la oscuridad
101, 101, 104
102
C una hora con luz tenue
97, 95, 99
97
D una hora con luz brillante
90, 92, 94
92
Media global 98

ANOVA DE DOS FACTORES CON UNA LECTURA POR MUESTRA


Organizacin de los datos: x son los resultados de cada experimento, segn los valores de los factores
A y B.
Factor A
Factor B A1
A2
Ai
AI
x21
x31
... xi1
xI1
x11

x12
x22
x1j

x2j

BJ

x1J

x2J

x i .=

1
xij
J j

QB= I
j

( x x)

Q A = J x i . x
i
2

.j

SS
Factor A
Factor B
Dentro de grupos
Suma

QA
QB
QW
Q

Grados de
libertad
I-1
J-1
(I-1)(J-1)
IJ-1

=
i

xIJ

(xij xi. x. j + x)

Cuadrado promedio
S2A=QA/(I-1)
S2B=QB/(J-1)
S2W=QW/[(I-1)(J-1)]
S2=Q/(IJ-1)

F
F(A) =S2A/S2W
F(B) =S2B/S2W

ANOVA DE DOS FACTORES CON MS DE UNA LECTURA POR MUESTRA

SS
Factor A
Factor B
Interaccin
Dentro de grupos
Suma

Grados de
libertad
I-1
J-1
(I-1)(J-1)
IJ(K-1)
IJK-1

QA
QB
QAB
QW
Q

Cuadrado promedio
S2A=QA/(I-1)
S2B=QB/(J-1)
S2AB=QAB/[(I-1)(J-1)]
S2W=QW/[IJ(K-1)]
S2=Q/(IJK-1)

El subndice k corresponde a las rplicas.

Q =
i

(x

(x

. j. x

= IK

Q
Q

AB

(x

= K
i

ijk x

(x

ijk x ij.

ij.+ x xi.. x. j.

= JK
i

F(A) =S2A/S2W
F(B) =S2B/S2W
F(AB) =S2AB/S2W

( x x)

i..

Ejercicio:
En un experimento para comparar el porcentaje de eficiencia en la extraccin de iones metlicos en
solucin acuosa por agentes quelantes, se obtuvieron los siguientes resultados:
AGENTE QUELANTE
Das
A
B
C
D
1
84
80
83
79
2
79
77
80
79
3
83
78
80
78
Cada da se prepararon soluciones del ion metlico (con concentracin especificada) y se realiz la
extraccin con cada uno de los agentes quelantes, tomados de una manera aleatoria.
Ejercicio:
En un experimento de colaboracin entre laboratorios sobre la determinacin de arsnico en carbn, se
enviaron muestras de carbn de tres regiones diferentes a tres laboratorios. Cada laboratorio realiz un
anlisis por duplicado de cada muestra con los resultados que se muestran en la tabla siguiente
(medidos en g/g). Compruebe que no existe interaccin significativa laboratorio-muestra y pruebe las
diferencias significativas entre laboratorios.
Muestra
A
B
C

1
5.1, 5.1
5.8, 5.4
6.5, 6.1

2
5.3, 5.4
5.4, 5.9
6.6, 6.7

3
5.3, 5.1
5.2, 5.5
6.5, 6.4

Objetivo del experimento: Determinar si una solucin de un compuesto particular es apropiada para
ser usada como estndar de absorbancia.
Metodologa:
Se midi el valor de la absortividad molar, , de soluciones de tres
concentraciones diferentes a cuatro longitudes de onda diferentes. Dos mediciones por cada pareja
concentracin-longitud de onda. Se aleatoriz el orden en que se hicieron las mediciones.
Resultados: En cada casilla aparecen los valores de multiplicados por 100.
240
270
300
Concentracin (g/L)
\ (nm)
0.02
94 96
106 108
48 51
0.06
93 93
106 105
47 48
0.10
93 94
106 107
49 50

350
78 81
78 78
78 79

APLICAR MTODO DE LAS SUMAS Q


Resultados de los clculos:
Fuente de variacin Suma de cuadrados
Entre filas
12.34
Entre columnas
11059.506
Interaccin
1.994
Residual
16
Total
11089.84

Grados de libertad
2
3
6
12
23

Interpretacin:
1.
Determinar si las fuentes de variacin son significativas.

Cuadrado medio
6.17
3686.502
0.3323
1.3333

Para esto se compara el cuadrado medio de la fuente de variacin con el cuadrado medio residual. Si el
primero es mayor, la fuente es significativa. La variacin residual es la debida al error aleatorio,
obtenida al examinar la variacin entre rplicas. Al hacer la comparacin se encuentra que
- la interaccin no es significativa (0.3323 < 1.3333).
- la variacin entre columnas es significativa. O sea, la respuesta () depende de la longitud de onda.
El factor F para 3 y 12 grados de libertad y una probabilidad del 95% tiene un valor crtico de 3.49. Al
usar los datos del problema:
F3,12 = 3686.502/1.3333 = 2765 > 3.49
- la variacin entre filas es significativa. El factor F para 2 y 12 grados de libertad y una probabilidad
del 95% tiene un valor crtico de 3.885. Al usar los datos del problema:
F3,12 = 6.17/1.3333 = 4.63 > 3.885
O sea que la solucin no sirve como estndar de absorbancia porque hay mucha variacin entre filas.
La respuesta depende de la concentracin.

Absortividad molar

El siguiente grfico ilustra la situacin:

120
100
80
60
40
20
0

240 nm
270 nm
300 nm
350 nm

0.05

0.1

0.15

Concentracin, g/L

Notar lo siguiente sobre el grfico:


-

Las lneas son paralelas, lo que indica ausencia de interaccin.


Las lneas no son muy horizontales, lo que indica que la absortividad molar vara con la
concentracin.
Las lneas se encuentran a diferente altura en la grfica, lo que indica que la absortividad molar
depende de la longitud de onda.

EJEMPLO DE DISEO CON TRES FACTORES Y DOS NIVELES

Notacin para las combinaciones: La presencia de la letra en minscula correspondiente al factor indica que ste
se halla en su nivel superior, y su ausencia, que el factor est en el nivel inferior. Cuando todos los factores est en
el nivel bajo, aparece el nmero 1.
Combinacin
A
B
C Respuesta
1
y1
a
+
y2
b
+
y3
c
+
y4
bc
+
+
y5
ac
+
+
y6
ab
+
+
y7
abc
+
+
+
y8
Objetivo del experimento: Determinar cmo es afectado el parmetro de retencin k' de HPLC por el pH, la
concentracin de un contrain y la concentracin de un solvente orgnico en la fase mvil.
Metodologa: Observable = k'; Factores = P (pH), T (conc. contrain) y C (conc. solvente).
Se utilizaron dos niveles para cada factor y se realizaron dos mediciones, una rplica de la otra, para cada
combinacin. Las mediciones se aleatorizaron.
Resultados experimentales: La siguiente tabla da el valor medio de k' para cada par de rplicas.
Combinacin
k'
1
4.7
p
9.9
t
7.0
c
2.7
pt
15.0
pc
5.3
tc
3.2
ptc
6.0

Tratamiento de datos e interpretacin:


1.
Efecto de cada factor por separado: El efecto de cambiar los niveles de P se puede hallar de la diferencia
media en respuesta cuando P cambia de nivel alto a bajo y los niveles de C y T se mantienen fijos. En la tabla
siguiente aparecen los cuatro casos correspondientes.
Nivel de P
Nivel de C

Nivel de T
+
+

+
+

+
9.9
5.3
15.0
6.0

4.7
2.7
7.0
3.2

Diferencia
5.2
2.6
8.0
2.8
Total = 18.6

El efecto promedio de alterar P es 18.6/4 = 4.65. Similarmente se construyen tablas para C y T para encontrar que
sus efectos promedios son: para C = -4.85 y para T = 2.15.
2.

Interaccin entre dos factores: Considerando primero la pareja de factores P y T, si no hubiera interaccin
se esperara que el cambio de respuesta al variar P fuera independiente de T. En la tabla anterior, las dos
primeras filas corresponden a la variacin de P de alto a bajo, estando T en bajo. El promedio del cambio
en respuesta ( k') es (5.2 + 2.6)/2 = 3.9. Las siguientes dos filas de la tabla son para T en nivel alto. El
promedio en respuesta es (8.0 + 2.8)/2 = 5.4. El efecto de la interaccin PT se expresa como el promedio
de la variacin en estas dos diferencias: (5.4 - 3.9)/2 = 0.75. Esta cantidad expresa la falta de aditividad
de los efectos de P y T actuando individualmente. Sigiendo un proceso similar, se puede encontrar:
efecto de interaciin CP = -1.95
efecto de interaccin CT = -1.55

3.
Interaccin entre tres factores: La interaccin PT se puede dividir en dos partes con respecto al nivel de C.
Con C bajo, la interaccin sera (8.0 - 5.2)/2 = 1.4. Con C alto sera (2.8 - 2.6)/2 = 0.1. Si no hubiera interaccin
entre los tres factores ni error aleatorio, estas estimaciones de la interaccin PT deberan ser iguales. La
interaccin de los tres factores se estima como la mitad de la diferencia entre estos dos resultados: (0.1 - 1.4)/2 = 0.65.
Resumiendo, los efectos hallados son:
Efecto
Un nico factor (efecto principal)
P
T
C
Interaccin de dos factores
TP
CT
CP
Interaccin de tres factores
PTC

4.65
2.15
-4.85
0.75
-1.55
-1.95
-0.65

4.
Determinar si los efectos hallados son significativos: Para esto se usa el cociente F entre el cuadrado
medio del efecto y el cuadrado medio residual (el cual estima la contribucin del error aleatorio). Estos clculos
requieren disponer previamente de las sumas de cuadrados. Se puede demostrar que para experimentos de dos
niveles, siendo N el nmero total de mediciones, incluyendo rplicas:
Suma de cuadrados = N * (efecto estimado)2/4
Para este ejemplo, N = 16. Las sumas de cuadrados son:
Factor
P
T
C
PT
TC
PC
PTC
Suma de cu86.49
18.49
94.09
2.25
9.61
15.21
1.69
Tambin puede demostrarse que cada suma de cuadrados tiene un grado de libertad. Por lo tanto, cada cuadrado
medio es igual a la suma de cuadrados (cuad.medio = suma de cuad/ grad.libert.).
El cuadrado medio del error residual se obtiene de las diferencias entre las rplicas. Para este problema = 0.012,
con 8 grados de libertad.
Aplicando el parmetro F a la interaccin PTC: F1,8 = 1.69/0.012 = 141. Este resultado es mucho mayor que el
umbral. Por lo tanto, la interaccin es significativa. Necesariamente, los dems efectos tambin lo sern.

You might also like