You are on page 1of 34

54

V.- EXPERIMENTOS FACTORIALES.



Los experimentos factoriales son aquellos en los que se
prueban varios niveles de dos o ms factores. El nmero de
tratamientos es el resultado de combinar los diferentes
niveles de los factores. Un factor es un ingrediente que
interviene en un tratamiento, mientras que el nivel es cada
una de las dosis o categoras de cada factor. Por ejemplo, el
factor A podra ser RAZA con cuatro categoras (las razas de
ganado Holstein, Suizo, Charolais y Ceb) y el factor B, DIETA
con tres categoras (dieta testigo, una dieta con Canavalia y
otra con pollinaza), en este experimento el nmero de
tratamientos es de 12. Todo experimento con dos o ms factores
tiene un arreglo de tratamientos y un diseo experimental;
as, p.e.; hablamos de un experimento con un arreglo factorial
en un diseo completamente al azar o en un diseo de bloques
al azar.
La aleatorizacin de los tratamientos se lleva a cabo de
acuerdo con el diseo experimental de que se trate. Recuerde
que aqu el nmero de tratamientos es la combinacin de los
niveles de cada uno de los factores.

Las tres razones principales para realizar Experimento
Factorial son:

1.- Para obtener informacin de los efectos medios de todos
los factores de un experimento simple de tamao moderado.
2.- Para ampliar la base de las inferencias de un factor para
probarlo bajo condiciones variadas de otros.
3.- Para evaluar la manera en la cual los efectos de los
factores
interactan con cada uno.

Obviamente las razones no son independientes y el nfasis
vara con el tipo de experimento.
En general un experimento factorial es ms completo
porque se puede obtener ms informacin y un grado de
precisin mayor del mismo nmero de observaciones. Suponga que
desea realizar dos experimentos. En el primero se compararan
tres niveles de protena usando 36 cerdos en total, en un DCA.
En el segundo experimento se desea comparar tres niveles de
energa tambin en un DCA con 36 cerdos. El total de cerdos
sera de 72 y en cada experimento la varianza de las medias de
las dietas (tratamientos) sera igual al cuadrado medio entre
12 (hay 12 cerdos por dieta). Si se hiciera un experimento
factorial (de dos vas) con los 72 cerdos, en cada una de las
combinaciones habran 8 cerdos, y por eso en cada nivel de
energa y de protena un total de 24 observaciones. La
varianza de las medias de las dietas sera el cuadro medio


55
entre 24, es decir, se reduce la varianza de las medias de
inters de CM/12 a CM/24 simplemente por combinar los dos
experimentos, y al mismo tiempo, se generaliza el experimento
debido a la estimacin de algunas interacciones entre niveles
de protena y niveles de energa.

5.1 Modelo estadstico.

a)El modelo estadstico para un experimento factorial, con dos
factores A y B, en un diseo completamente al azar sera,

Y
ijk
= + +
i
+
j
+
ij
+ e
ijk


donde:
Y
ijk
= es la ijk-esima observacin en el i-esimo nivel del
factor A y j-esimo nivel del factor B; = es la media general;

i
= es el efecto del j-esimo nivel del factor A;
j
= es el
efecto del k-esimo nivel del factor B;
ij
= es la interaccin
del i-esimo nivel del factor A con el j-esimo nivel del factor
B; y e
ijk
= es el error aleatorio NID (0,
2
).


b) El modelo estadstico para un experimento factorial, con
dos factores A y B, en un diseo en bloques al azar sera,

Yijk= +
i
+
j
+
k
+
jk
+ e
ijk


donde:
Y
ijk
= es la ijk-esima observacin en el i-esimo bloque que
contiene el j-simo nivel del factor A y el k-esimo nivel del
factor B; = es la media general;
i
= es el efecto del i-simo
bloque;
j
= es el efecto del j-simo nivel del factor A;
k
= es
el efecto del k-esimo nivel del factor B;
jk
= es la
interaccin del j-esimo nivel del factor A con el k-esimo
nivel del factor B; y e
ijk
= es el error aleatorio NID (0,
2
).

5.2 Ejemplo de un Diseo de Bloques al Azar con un arreglo
factorial 2 x 3.

Se desea determinar el efecto de dos niveles de protena
(alto y bajo) y tres fuentes de protena (res, cerdo y
vegetal) sobre el aumento de peso (g) de ratas.
Los resultados se presentan a continuacin,




56


CUADRO 23
Resultados de un experimento factorial.

Alta Protena Baja Protena
Res Cerdo Vegetal Res Cerdo Vegetal

73 94 98 90 49 108
102 79 74 76 82 95
118 96 56 90 73 97
104 98 111 64 86 80
81 102 95 86 81 98
107 102 88 51 97 74
100 108 82 72 106 74
87 91 77 90 70 67
117 120 86 95 61 89
111 105 92 78 82 58

Total 1000 995 859 792 787 839

Clculo de las sumas de cuadrados.

FC= 5272/60 = 463233.07;

SCtotal = (73 + 102 + 118 +...+ 58) - FC
= 479431.77 - 463233.07 = 16198.7;

1000 + 995 + 859 + 792 + 787 + 839
SCtrat = - FC
10

= 467846.00 - 463233.07 = 4612.93;

SCerror= SCtotal - SCtrat = 16198.70 - 4612.93 = 11585.77;


CUADRO 24
Anlisis de varianza para un diseo factorial 2x3.

FV GL SC CM Fc



57
Tratamiento: 5 4612.93
Protena 1 3168.23 3168.23 14.8**
Grasa 2 266.50 133.20 0.62ns
Interaccin 2 1178.20 589.10 2.7ns
Error 54 11585.77 214.60
Total 59 16198.70

** P<0.01

El ANOVA indica que existe diferencia entre los niveles
de protena pero no en las fuentes de la misma, ni en la
interaccin.

5.3 Comparaciones entre tratamientos.
La naturaleza del experimento indica que era mejor haber
realizado un anlisis de contrastes ortogonales de los datos.
En este caso algunas comparaciones lgicas o hiptesis a
probar son,
Ho: No existe diferencia entre los niveles de protena;
Ho: No existe diferencia entre la fuente de protena animal
(res y cerdo) comparado con la fuente vegetal.
Ho: No existe interaccin entre nivel de protena y fuente de
protena (animal o vegetal).
Ho: No existe diferencia entre las protenas del cerdo y res.
Ho: No existe interaccin entre el nivel de protena y la
fuente de protena animal.


CUADRO 25
Clculo de los contrates ortogonales.


Alta Protena Baja Protena
Res Cerdo Veg. Res Cerdo Veg.
1000 995 859 792 787 839 L rc
SCtrat


1) Niveles 1 1 1 -1 -1 -1 436 10(6)
3168.3
2) Animal vs
Vegetal 1 1 -2 1 1 -2 188 10(12)
264.0
3) Int. 1 y 2 1 1 -2 -1 -1 2 376 10(12)
1178.1
4) Res vs Cerdo 1 -1 0 1 -1 0 10 10(4)
2.5
5) Int. 1 y 4 1 -1 0 -1 1 0 0 10(4)
0.0


58


r= Nmero de rplicas= 10;

1) L =1000(1) + 995(1)+ 859(1) + 792(-1) + 787(-1)+ 839(-1)=
436

c = 1 + 1 + 1 + (-1) + (-1) + (-1) =6;

SC = L/rc = 436/10(6)= 3168.3;

2) L= 1000(1) + 995(1) + 859(-2)+ 792(1) + 787(1) + 839(-2)=
188

c = 1 + 1 + (-2) + 1 + 1 + (-2) = 12;

SC= 188/10(12) = 264.0;

3) L =1000(1) + 995(1)+ 859(-2) + 792(-1) + 787(-1)+ 839(2)=
376

c = 1 + 1 + (-2) + (-1) + (-1) + (2) = 12;

SC = L/rc = 3766/10(12)= 1178.1;

4) L= 1000(1) + 995(-1) + 859(0)+ 792(1) + 787(-1) + 839(0)=
10

c = 1 + (-1) + (0) + 1 + (-1) + (0) = 4;

SC= 10
2
/10(4) = 2.5;

5) L= 1000(1) + 995(-1) + 859(0)+ 792(-1) + 787(1) + 839(0)= 0

c
2
= 1
2
+ (-1)
2
+ (0)
2
+ 1
2
+ (-1)
2
+ (0)
2
= 4;

SC= 0.0;



CUADRO 26
Subdivisin y significancia de la suma de cuadrados de
tratamientos para los efectos principales e interacciones.

GL SC CM

Tratamiento: 5 4613.0
1)Niveles de Prot. 1 3168.3 3168.3**
2)Animal vs Veg. 1 264.0 264.0ns


59
3)Interaccin 1 y 2 1 1178.1 1178.1*
4)Res vsd Cerdo 1 2.5 2.5ns
5)Interaccin 1 y 4 1 0.0 0.0ns
Error 54 11585.7 214.6



La subdivisin de la SCtrat muestra efecto significativo
de niveles de protena como el ANOVA del Cuadro 22. Sin
embargo, este anlisis muestra adems efecto de la interaccin
nivel de protena y fuente animal o vegetal de protena. Esta
interaccin se puede entender mejor con el siguiente diagrama,

Nivel de Fuente de protena
protena Animal Vegetal Diferencia E.E.
Alto 99.8 85.9 + 13.9* 5.67
Bajo 79.0 83.9 - 4.9 5.67
Diferencia +20.8** + 2.0
E.E. 4.6 6.5

donde:
99.8= (1000 + 995)/20; 85.8= 859/10;
79.0= (792 + 787)/20; 83.9= 839/10;

Los errores estandar (EE) de las diferencias se obtienen como,

EE
CM
r
CM
r
error error
= +
1 2


Dif. entre fuentes, nivel alto=
214 6
20
214 6
10
567
. .
. + =
Dif. entre fuentes, nivel bajo=
214 6
20
214 6
10
567
. .
. + =
Dif. entre niveles, fuente animal=
214 6
20
214 6
20
4 63
. .
. + =
Dif. entre fuentes, fuente vegetal=
214 6
10
214 6
10
6 55
. .
. + =

Nota: La interaccin se debi al hecho de que la media
para fuente animal fue mejor en el nivel alto de protena; sin
embargo, la protena vegetal lo fue en el nivel bajo. Esta
interaccin no podra haberse descubierto utilizando el ANOVA
convencional del Cuadro 20.



60
5.4 Programa SAS para comparaciones pre-planeadas.

Data uno;
Input Nivel 1 Fuente 2 a1 4-6 a2 8-10 a3 12-14 a4 16-18 a5 20-
22 a6 24-26 a7 28-30 a8 32-34 a9 36-38 a10 40-42 trat 1-2;
drop a1-a10;
Pesog= a1; a=1; output;
Pesog= a2; a=2; output;
Pesog= a3; a=3; output;
Pesog= a4; a=4; output;
Pesog= a5; a=5; output;
Pesog= a6; a=6; output;
Pesog= a7; a=7; output;
Pesog= a8; a=8; output;
Pesog= a9; a=9; output;
Pesog= a10; a=10; output;
*** NIVEL 1=alto 2= bajo FUENTE 1=res 2=cerdo 3=vegetal;
Cards;
11 73 102 118 104 81 107 100 87 117 111
12 94 79 96 98 102 102 108 91 120 105
13 98 74 56 111 95 88 82 77 86 92
21 90 76 90 64 86 51 72 90 95 78
22 49 82 73 86 81 97 106 70 61 82
23 108 95 97 80 98 74 74 67 89 58
Title " ANVA para un diseo factorial";
Proc GLM;
classes Nivel Fuente;
Model Pesog= Nivel Fuente Nivel*Fuente;
run;
Title "Comparaciones ortogonales para un experimento
factorial;
Proc GLM;
classes trat;
Model Pesog= trat;
*** T R A T A M I E N T O S;
CONTRAST 'ALTA vs BAJA PROTEINA' TRAT 1 1 1 -1 -1
-1;
CONTRAST 'PROT. ANIMAL vs VEGETAL' TRAT 1 1 -2 1 1
-2;
CONTRAST 'INT. NIVEL-PROT. ANIMAL y VEG.' TRAT 1 1 -2 -1 -1
2;
CONTRAST 'RES vs CERDO' TRAT 1 -1 0 1 -1
0;
CONTRAST 'INT. NIVEL-PROT. RES y CERDO' TRAT 1 -1 0 -1 1
0;
RUN;





61
Ejercicio. Realizar el ANOVA y probar las siguientes hiptesis
para los resultados dados abajo.
Ho: No existe diferencia entre el control y las semillas
tratadas con productos qumicos.
Ho: No existe diferencia entre productos qumicos.


Nota ver ANVA en Apndice.

El modelo estadstico para un experimento factorial, con
dos factores A y B, en un diseo en bloques al azar sera,

Yijk= +
i
+
j
+
k
+
jk
+ e
ijk


donde:
Y
ijk
= es la ijk-esima observacion en el i-esimo bloque, j-esimo
nivel del factor A y k-esimo nivel del factor B; = es la
media general;
i
= es el efecto del i-esimo bloque;
j
= es el
efecto del j-esimo nivel del factor A;
k
= es el efecto del k-
esimo nivel del factor B;
jk
= es la interaccin del j-esimo
nivel del factor A con el k-esimo nivel del factor B; y e
ijk
=
es el error aleatorio NID (0,
2
).



CUADRO 27
ANALISIS DE VARIANZA PARA UN EXPERIMENTO FACTORIAL EN UN
DISEO DE BLOQUES AL AZAR.


FV GL SC CM Fc



Bloque r-1
Y
ab
FC
i ..
2


SM
r
bloque
1

CM
CM
bloque
error


Factor A a-1
Y
rb
FC
j . .
2


SC
a
A
1

CM
CM
A
error


Factor B b-1
Y
ra
FC
k . .
2


SC
b
B
1

CM
CM
B
error




62
Interaccin (a-1)(b-1)
Y
r
SC SC FC
jk
A B
.
2



SC
a b
AxB
( )( ) 1 1


CM
CM
AxB
error


Error ab(r-1) DIFERENCIA
SC
ab r
error
( ) 1


Total abr-1 Y
ijk
2
- FC


FC= (Y
ijk
)
2
/abr; r= nmero de bloques; a= niveles del factor
A; b= niveles del factor B;


Ejemplo.

VI.- EXPERIMENTOS DE PARCELAS DIVIDIDAS.

Los experimentos de parcelas divididas se utilizan cuando
se quiere dar mayor precisin o importancia a un factor en
comparacin con otro. Este diseo se divide en parcelas
denominadas grande y chicas correspondiendo a estas ltimas la
mayor precisin. En algunas ocasiones este es el diseo ptimo
a elegir ya sea porque un factor requiere de reas grandes
para su evaluacin o por razones econmicas; p.e. Lminas de
riego y variedades de arroz, sistemas de cultivo y
fertilizacin, etc.
Cabe mencionar que la diferencia entre un experimento
factorial y uno de parcelas divididas est en el proceso de
aleatorizacin de los tratamientos. As mientras que en un
diseo factorial se hacen todas las combinaciones de
tratamientos y se distribuyen aleatoriamente a las unidades
experimentales, en el experimento de parcelas divididas
primero se distribuyen aleatoriamente los tratamientos de las
parcelas grandes y luego los tratamientos de las parcelas
chicas dentro de las parcelas grandes.
Analice este experimento con un ejemplo.
Se desea estudiar el efecto de la frecuencia de corte
(parcela grande) y tres alturas de corte (parcela chica ) en
la produccin de materia seca del pasto Estrella de Africa.
El primer paso es localizar el rea donde se realizar el
experimento. Si el terreno es homogneo entonces es factible
utilizar un diseo completamente al azar; si el terreno
muestra un gradiente de variacin la solucin pudiera ser un
diseo de bloques al azar.


63
Suponga que el terreno es homogneo, entonces se trazan
las parcelas grandes y se asignan cada una de las frecuencias
de corte a estudiar (Figura 6). Luego se asignan al azar cada
una de las alturas de corte dentro de cada una de las parcelas
grandes (Figura 6).


64
Figura 6. Ejemplo hipottico de distribucin de tratamientos
en un experimento de Parcelas Divididas.
















































65





































CUADRO 28
Resultados del experimento en parcelas divididas.

Frecuencia Altura
de corte de corte R E P L I C A S
(das) (cm) I II III IV

5 5.69 5.98 5.37 6.30 23.34
20 10 3.72 3.20 3.90 4.51 15.33
15 3.66 2.85 2.60 3.83 12.94

Total PG 13.07 12.03 11.87 14.64 51.61


66

5 6.48 7.92 4.74 6.30 25.44
40 10 3.86 4.54 4.42 5.06 17.88
15 11.15 3.54 3.91 3.66 22.26

Total PG 21.49 16.00 13.07 15.03 65.58

5 4.90 5.73 12.00 8.56 31.19
60 10 5.34 4.28 6.16 6.34 22.12
15 3.40 5.47 4.78 3.75 17.40

Total PG 13.64 15.48 22.94 18.65 70.71



Tabla de doble entrada para totales de tratamiento.

Frecuencia
de corte Altura de corte

5 10 15 Total

20 23.34 15.33 12.94 51.61
40 25.44 17.88 22.26 65.68
60 31.19 22.12 17.40 70.71
Total 52.60 55.33 79.97 187.90


a) Factor de correccin:

(187.90) 35,306.41
F.C. = = = 980.73
36 36

b) Suma de cuadrados debida a las rplicas:

(48.20) + (43.51) + (47.88) + (48.31)
SC
Rep
= - FC
9

8,842.71
= - 980.73 = 982.52 - 980.73 = 1.79
9

c) Suma de cuadrados debida a las parcelas grandes (Frecuencia
de corte):

(51.61) + (65.58) + (70.71)
SC
PG
= - FC


67
12

2663.59 + 4300.74 + 4999.90
= - FC
12

11,964.23
= - 980.73 = 16.29
12

d) Suma de cuadrados debida a las parcelas chicas (Altura de
corte):

(79.97) + (55.33) + (52.60)
SC
PCH
= - FC
12

6,395.20 + 3,061.40 + 2,766.76
= - FC
12

12,223.36
= - 980.73 = 1018.61 - 980.73 = 37.88
12


e) Suma de cuadrados debida a la interaccin de los
tratamientos (frecuencia de corte y altura de corte):


23.34 + 15.33 + ... + 17.40
SC
Int
= - FC - SC
PG
- SC
PCH

4

4,174.45
= - FC - SC
PG
- SC
PCH

4

= 1,043.61 - 980.73 - 16.29 - 37.88 = 8.71


13.07 + 12.03 + ... + 22.94 + 18.65
SC
PG x Replica
= - FC
3

3084.74
= - FC = 1028.25 - 980.73 = 47.52
3



68
SC
error PG
= 47.52 - SC
Rep
- SC
PG


= 47.52 - 1.79 - 16.29 = 29.44


SC
Total
= 5.69
2
+ 5.98
2
+ ... + 4.78
2
+ 3.75
2
- FC

= 1129.74 - 980.73 = 149.01


SC
error PCH
= SC
Total
- SC
PG x Replica
- SC
PCH
- SC
Int


= 149.01 - 47.52 - 37.88 - 8.71 = 54.9



CUADRO 29
Anlisis de varianza para un diseo de Parcelas
Divididas con cuatro bloques (rplicas).

FV GL SC CM F
c


Rplica 3 1.79 0.60
Frec. corte 2 16.29 8.15 1.65
error PG 6 29.44 4.90
Atura corte 2 37.88 18.94 6.21**
Interaccin
(Frec. x Alt) 4 8.71 2.19 0.72
error PCH 18 54.90 3.05

Total 35 149.01

** P<0.01


Nota: Los efectos de bloque (rplica) y frecuencia de corte se
prueban utilizando la SCE
PG
; mientras que los efectos de Altura
de corte (parcela chica) y de la interaccin de Frecuencia de
corte por Altura de corte se prueban utilizando la SCE
PCH
, i.e.

CM
Frec. corte
8.15
Fc = = = 1.65
CM
error PG
4.90

CM
Alt. corte
18.94
Fc = = = 6.21
CM
error PCH
3.05




69
CM
Int.
2.19
Fc = = = 0.72
CM
error PCH
3.05


6.3 programa SAS para un experimento completamente al azar con
arreglo de parcelas divididas.

Data parcela;
Input Frec 1-2 Altura 4-5 r1 7-11 r2 13-17 r3 19-23 r4 25-29;
Drop r1 r2 r3 r4;
ms= r1; r=1; output;
ms= r2; r=2; output;
ms= r3; r=3; output;
ms= r4; r=4; output;
cards;
20 5 5.69 5.98 5.37 6.30
20 10 3.72 3.20 3.90 4.51
20 15 3.66 2.85 2.60 3.83
40 5 6.48 7.92 4.74 6.30
40 10 3.86 4.54 4.42 5.06
40 15 11.15 3.54 3.91 3.66
60 5 4.90 5.73 12.00 8.56
60 10 5.34 4.28 6.16 6.34
60 15 3.40 5.47 4.78 3.75
Title " Diseo completamente al azar con arreglo de parcelas";
proc anova;
classes frec altura;
model ms= frec r(frec) altura frec*altura;
test H=frec E=r(frec);
means frec /duncan tukey alpha=0.01 E= r(frec);
means altura /duncan tukey; run;


6.4.- Programa SAS para un Diseo de bloques al Azar con
arreglo de Parcelas Divididas.

Title " Diseo de bloques con arreglo de parcelas;
Proc anova;
classes pg bloque pch;
model Y= pg bloque pg*bloque pch pg*pch;
Test H=pg bloque E=pg*bloque;
means pg bloque/ duncan E=pg*bloque;
means pch pg*pch/duncan; run;



70
VII. ANLISIS DE COVARIANZA (ANCOVA).

Este anlisis es un procedimiento de gran importancia en
experimentacin y combina el anlisis de varianza y de
regresin para remover la variabilidad que existe debida a una
o ms variables cuantitativas, denominadas variables
concomitantes o covariables; ajusta las medias de los
tratamientos y as estima mucho mejor el efecto de los
factores (tratamiento) sobre la variable dependiente o
variable de respuesta. En otras palabras, el ANCOVA permite
ajustar las respuestas de las unidades experimentales al
promedio de un factor medible, que se llama covariable y de
esa manera se controlan los factores medibles que no puedan
controlarse experimentalmente.

Por ejemplo, se quiere probar el efecto de cinco dietas
en el aumento de peso en cerdos pero se tiene diferente peso
inicial de las unidades experimentales. Aqu el factor peso
inicial es medible y no puede utilizarse como un criterio de
clase (nivel de un factor) por lo que es mejor utilizar un
diseo completamente al azar con peso inicial de las unidades
experimentales como covariable. De esta manera se ajusta
respecto a peso inicial, se tienen ms grados de libertad para
el cuadrado medio del error y se maneja un diseo ms
sencillo. Si adems del peso inicial, la edad de los animales
fuese otro factor de importancia podra incluirse teniendo as
un diseo completamente al azar con dos covariables.

Usos del ANCOVA. Los ms importantes usos del ANCOVA son:
1.- Para controlar el error y aumentar la precisin, al
reducir la variacin entre tratamientos debido al efecto de
variables concomitantes.
2.- Para ajustar las medias de tratamientos de la variable
dependiente por diferencias en conjuntos de valores de la
correspondientes variables independientes, es decir como s el
efecto de la variable concomitante no hubiera existido.
3.-Para ayudar en la interpretacin de datos, especialmente
con respecto a la naturaleza de los efectos de los
tratamientos.
4.- Para dividir una covarianza total o suma de productos
cruzados en sus componentes.
5.- Para estimar datos perdidos.


Suposiciones del ANCOVA:

1.- Tanto la variable independiente X (covariable) como la
variable de respuesta (Y) deben tener varianzas homogneas.
2.- Las variables X e Y deben tener distribucin normal.


71
3.- La regresin de Y sobre X debe de ser lineal.
4.- El error debe estar normal e independientemente
distribuido con media cero y varianza comn.


7.1. Modelos estadsticos.

El modelo estadstico para un diseo completamente al azar
est dado por la ecuacin,

Y
ij
= +
i
+ b(X
ij
- .. X ) + e
ij


Para el diseo de bloques al azar,

Y
ij
= +
i
+
j
+ b(X
ij
- .. X ) + e
ij


Para el diseo cuadro latino,

Y
ij(k)
= +
i
+ H
j
+ C
k
+ b(X
ij(k)
- .. X ) + e
ij(k)


Como se podr apreciar a cada modelo del diseo
correspondiente se le agreg el trmino de ajuste, b(X
ij
- .. X )
y donde:

Y = variable dependiente o de respuesta;
= media general de Y;
X
ij
o X
ij(k)
= variable independiente o covariable;
.. X = media general de X;
= efecto de tratamientos;
= efecto de bloques;
H = efecto de hilera;
C = efecto de columna;
e
ij
o e
ij(k)
= error experimental.


7.2.- Ejemplo de un anlisis de covarianza.

Se presentan los resultados de un diseo de bloques al
azar con cinco cerdos (repeticiones) y cuatro dietas
(tratamientos), donde:

X= peso inicial de los cerdos (variable independiente);
Y= peso final de los cerdos (variable dependiente).


72




73

-
TRATAMIENTOS
A B C D Total
# cerdo X Y X Y X Y X Y X Y
-
1 4 10 1 5 2 5 3 5 10 25
2 3 7 3 7 6 12 1 7 13 33
3 4 8 2 5 4 10 4 6 14 29
4 6 15 1 1 6 10 2 9 15 35
5 4 12 3 5 2 8 1 3 10 28
-
21 52 10 23 20 45 11 30 62 150


CUADRO 27
Anlisis de covarianza para un diseo de bloques al azar


F.V. G.L. SC(X) SP(XY) SC(Y)



Bloques r-1
X
t
FC
j
X
.
2

X Y FC
j j XY . .

Y
t
FC
j
Y
.
2



Tratamiento t-1
X
r
FC
i
X
.
2

X Y FC
i i XY . .

Y
r
FC
i
Y
.
2



Error (t-1)(r-1) D I F E R E N C I A

Total tr-1 X
ij
2

- FC
X
X Y
ij ij
-FC
XY
Y
ij
2

-FC
Y





FC
X
=
( )
X
N
ij
2
FC
XY
=
X Y
N
ij ij
FC
Y
=
( )
Y
N
ij
2



CUADRO 28
ANOVA para las variables X e Y.

ANOVA Y ANOVA X
F.V. G.L. SC CM G.L. S.C. C.M.



74
Bloque 4 16 4.0 4 5.2 1.3
Trat. 3 85 28.3 3 18.2 6.1
Error 12 122 10.2 12 29.6 2.5
Total 19 223 19 53.0



Estos ANOVAs se analizaron como un diseo de bloques al
azar normal; uno para X y otro para Y.
No se encontr efecto significativo de los tratamientos
sobre el peso inicial y final de los cerdos.

Clculo del ANCOVA.
Calculamos slo los trminos que faltan en la tabla del
anlisis de covarianza ya que las SC(X) y SC(Y) ya las
conocemos.

SP(XY):

Total= 4(10) + 2(5) + ... + 2(9) + 1(3) - FC
= 85.5

donde:
62(150) 9,300
FC= = = 465;
4(5) 20


10(25) + 12(33) +...+ 10(28)
Bloque= - FC
4
= 6.89;

21(50) + 10(25) +...+ 11(30)
Trat = - FC
5
= 38.5

Error = Total - Bloque - Trat.
= 85.3 - 6.89 - 38.5 = 40.23;


CUADRO 29
Anlisis de covarianza

Y ajustado por
X
FV GL SC(X) SP(XY) SC(Y) GL SC CM F


75


Total 19 52.95 85.50 223.0
Bloque 4 5.20 6.75 16.0
Trat. 3 18.15 38.50 85.0 3 9.85 3.28
0.54
Error 12 29.60 40.25 122.0 11 67.27 6.12


Trat+Error 15 47.75 78.75 207.0 14 77.12

La reduccin en la SCerror de Y debido a la regresin es


[SP(XY)]
2
40.25
2

SCerror(corregido)= SC(Y) - ---------- = 122.0 - ------- =
67.27;
SC(X) 29.60

[SP(XY)]
2
78.75
2

SC(trat+error)= SC(Y) - -------- = 207.0 - ------- = 77.12
SC(X) 47.75

SC(trat. ajustados) = 77.12 - 67.27 = 9.85;

Fc= 3.28/6.12 = 0.54 No significativo ya que Fc < Ft.


El ANCOVA confirma el ANOVA que no hay diferencia
significativa entre tratamientos, pero no dice si debemos
ajustar las medias de tratamientos.

Antes de analizar si existe la necesidad de ajustar las
medias de tratamientos se calcula el coeficiente de regresin
b,

b= SP(XY)/SC(X) = 40.25/29.60 = 1.36

es decir, que por cada aumento de una unidad en el peso
inicial X hay un aumento de 1.36 unidades en el peso final Y.

Luego se prueba la homogeneidad de la regresin, Ho: b=0;
si el valor de F es significativo, o sea si se acepta la
hiptesis alterna Ha: b 0 entonces se ajustan las medias.


[SP(XY)]
2
40.25
2

SC(Reg) = = = 54.73;
SC(X) 29.60


76


CM(Reg) = 54.73/1 =54.73;

Fc= CM(Reg)/CMerror= 54.73/6.12 = 8.94;
Ft (1,11; 0.05)=

Por lo tanto, se acepta Ha: b 0. Las lneas no son
paralelas, no son homogneas y se deben de hacer los ajustes
de medias.

Ajuste de medias.

ai
Y =
. i
Y - b( . i X - .. X )

donde:
. ai
Y = media ajustada para cada tratamiento;

.. i
Y = media de cada grupo de tratamiento sin ajustar;
i.e.; 10, 5, 9 y 6.

b= coeficiente de regresin = 1.36;
_
X
i
. = media de la covariable para cada tratamiento;
i.e.; 4,2,4 y 2.2;
_
X.. = media general = 62/20= 3.10.
_ _ _ _
Tratamiento Y
i
. - b (X
i
. - X..) = Ya
i
.
A 10 - 1.36(4.0-3.10) = 8.71
B 5 - 1.36(2.0-3.10) = 6.43
C 9 - 1.36(4.0-3.10) = 7.71
D 6 - 1.36(2.2-3.10) = 7.16


Si se encuentra que las medias de los tratamientos no
ajustadas resultan significativas, pero no las ajustadas, sto
quiere decir que las diferencias encontradas entre las no
ajustadas slo reflejara diferencias entre la covariable, ms
no entre los tratamientos.
La desviacin estndar de la diferencia entre dos medias
ajustadas es:

( )
S S
r
X X
SC X
d YX
i
=
+
2
2 2
. .
( )




77
Por ejemplo la desviacin estndar de la diferencia entre las
medias de los tratamientos A y B es,

( )
S
d
=
+
= 612
2
5
4 0 2 0
29 6
328
2
.
. .
.
. =1.81

Esta ecuacin indica que cada S
d
es diferente para cada par de
medias de tratamientos que se estn comparando.

Ganancia en precisin por covarianza.

CM
E(Y)
antes del ajuste = 122/12 =10.16 con 12 GL;
CM
E(Y)
despus del ajuste = 6.12 con 11 GL;

Ajustamos este valor (6.12) con la ecuacin:

CM
E
despus del ajuste * ( 1 + CM(X)/SCE)=
6.12 * ( 1 + 6.05/29.60) = 7.37;

10.16/7.37 * 100 = 138%

Cien repeticiones con ANCOVA, son tan eficientes como 138
sin covarianza.


78
7.3 Programa SAS para Anlisis de Covarianza.

Data ancova;
Input Cerdo 1-2 Trat$ 4 X 6 Y 8-9;
cards;
1 A 4 10
2 B 1 5
3 C 2 5
4 D 3 5
5 A 2 5
6 B 3 9
7 C 6 12
8 D 1 7
9 A 4 8
10 B 2 5
11 C 4 10
12 D 4 6
13 A 6 15
14 B 1 1
15 C 6 10
16 D 2 9
17 A 4 12
18 B 3 5
19 C 2 8
20 D 1 3
PROC GLM;
CLASSES TRAT;
MODEL Y= X TRAT ;
LSMEANS TRAT/PDIFF STDERR;
MEANS TRAT;
RUN;

Nota: La covariable debe ir primero en el modelo.




79
BLOQUES INCOMPLETOS, CUADROS DE YOUDEN Y LATICES.

Lo imprctico e inconveniente del diseo cuadro latino es
que el nmero de parcelas por tratamiento debe ser igual al
nmero de hileras y columnas. Esta limitante condujo al
desarrollo del diseo de bloques incompletos. Aqu el nmero
de bloques es menor que el nmero de tratamientos. Sin
embargo, cada bloque contiene el mismo nmero de tratamientos
y cada tratamiento aparece con igual frecuencia en el mismo
bloque.

Cuadro x. Ejemplo de la distribucin de tratamientos en un
diseo de bloques incompletos aleatorios.

Bloque 1 2 3 4

Tratamiento A C A B
D B C C
B A D D

En este diseo el nmero de observaciones es igual al
nmero de bloques (b) por el nmero de observaciones por
bloque (k) o al nmero de tratamientos por el nmero de
repeticiones (r). h es el nmero de veces que pares de
tratamientos aparecen juntos en el mismo bloque, es decir,

r (k-1)= h (t-1)

En el ejemplo de arriba, t=4, r=3, b=4, k=3 y h=2; por lo
tanto,
tr=bk= 12 y r(k-1)=6.

Como el nmero de tratamientos y el tamao del bloque
normalmente se especifican por las circunstancias
experimentales, los valores de los otros parmetros estn
escogidos para satisfacer los puntos 1 a 3 mencionados
anteriormente.

Como los bloques son incompletos en estos diseos, las
medias observadas por los tratamientos deben ajustarse por las
diferencias entre bloques.
La media ajustada del i-simo tratamiento sera

_ _
Xt
i
= X + (kt
j
- b
i
)/ht

donde: t
j
es el total del j-esimo tratamiento, bi es el total
del i-esimo bloque.



80
La media del i-esimo bloque ajustado esta dado por:

Xb
i
= X +


El ANVA es diferente al normal porque las SC de tratamientos,
bloque y residual no suman la SC del total. En el cuadro 2 los
trminos ajustados y no ajustados se refieren a las SC
calculadas usando las medias ajustadas y no ajustadas,
respectivamente. FC se refiere al factor de correccin. La
suma de cada una de las observaciones al cuadrado divido entre
el nmero total de observaciones.

FC= (Y
ij
)
2
/kr


Cuadro 2. Anlisis de varianza de un diseo de bloques
incompletos.


81
VIII.- ALTERNATIVAS PARA MEJORAR LA PRECISIN DE LOS
EXPERIMENTOS.

Por precisin se entiende que tan lejos o cerca se
encuentra un estimador del parmetro; por ejemplo., si se toma
una muestra y se encuentra que su media es de 7.8 kg, cuando
el valor del parmetro (media de la poblacin) es de 8.3,
entonces hay un error de 8.3-7.8=0.5 kg. Recuerde que para
poblaciones grandes la precisin se define como d= Z*EE.
En el anlisis de experimentos, uno de los objetivos es
estimar la diferencia entre dos medias y por lo tanto la
precisin se entendera como que tan cerca o lejos se
encuentra la diferencia entre dos medias de la diferencia real
(diferencia entre las dos poblaciones de las cuales se tomaron
las muestras).
Hay varias alternativas para mejorar la precisin de los
experimentos, de las cuales las principales son las
siguientes:

1.- La agrupacin de las unidades experimentales.
2.- El uso de mayor nmero de repeticiones.
3.- La seleccin de tratamientos.
4.- Seleccin de unidades experimentales.
5.- Tomar mediciones adicionales.

8.1.- Agrupacin de las unidades experimentales.

La agrupacin de las unidades en grupos o bloques de tal
manera que la variacin entre grupos sea mayor que dentro de
ellos, reduce la variacin. Esta es la base de la comparacin
de los diseos: por ejemplo: los diseos completamente al azar
y bloques al azar con sus varianzas del error: V
CA
y V
BA
,
respectivamente.
En el Diseo de Bloques al Azar, la varianza de la media
de un tratamiento o raz cuadrada del error estndar (EE) es:

= V
BA
/b; donde b= al nmero de bloques.

Mientras que para obtener la misma varianza en el Diseo
Completamente al Azar, el nmero de repeticiones, r, debe ser:

V
CA
/r = V
BA
/b o r/b=V
CA
/V
BA


Entonces si se usa V
CA
/V
BA
para medir la eficiencia
relativa de los bloques en los diseos. Se tiene que:

V
CA
(b-1)CMbloque + b(t-1)CMerror
=
V
BA
(bt-1)CMerror


82

Por ejemplo:

V
CA
(5-1)12.46 + 5(5-1)5.41
= = 1.22
V
BA
(25-1)5.41

donde:
CMbloque=12.46
CMerror=5.41
G.L. bloques= 5-1
G.L. del error= (5(5-1).


Es decir, en el Diseo Completamente al Azar se necesitan
1.22 ms repeticiones (1.22*5= 6) para obtener el mismo EE.
Tambin se debe considerar los GL del error, p.e. se necesitan
20 G.L. con el DCA y 16 para el DBA, para obtener la misma
precisin.
Una modificacin de este mtodo es la aplicacin de la
frmula de Fisher que se aplica en los experimentos con pocas
observaciones.

V
CA
(GL
DBA
+1)(GL
DCA
+3) V
DCA

=
V
BA
(GL
DBA
+3)(GL
DCA
+1) V
DBA


En el ejemplo:


V
CA
(16+1)(20+3)
= * 1.22= 1.87
V
BA
(16+3)(20+1)



8.2.- El uso de ms repeticiones.

En general un experimento es ms preciso con ms
repeticiones, pero el grado de mejoramiento disminuye a medida
que aumentan el nmero de repeticiones. Por ejemplo, para
duplicar la precisin de la estimacin de las medias de un
experimento con cuatro repeticiones, se necesitan 16
repeticiones.

El nmero de repeticiones requerido para estimar
descubrir una diferencia verdadera entre medias se estima a
partir de la frmula:



83
r = 2
CV
d

2
(t
1
+ t
2
)

donde:

CV
DE
X
= 100= Coeficiente de variacin
t
1
= el valor de "t" de tablas al 5 o 1 % y los GL del error del
ANVA del diseo a utilizar.
t
2
= El valor de "t" para los GL del error y una probabilidad de
(1-P), donde P es la probabilidad de descubrir un
resultado significativo en un experimento. Si P=0.80,
entonces (1-P)=0.20 en la distribucin de "t" de
una cola. d=/-X/= es la precisin requerida. En
las ciencias biolgicas se utiliza normalmente el 10% de
precisin.

Para usar la ecuacin, se especifica el nmero de
repeticiones que se cree son necesarios (r). Luego se resuelve
la ecuacin utilizando el valor de r encontrado en cada
ocasin esta que este permanezca estable.

Ejemplo:
Estime el nmero de rplicas para un diseo completamente
al azar con 5 tratamientos, y con los niveles de error tipo I
y II de 5 y 10 % respectivamente. Elija segn su criterio el
coeficiente de variacin y la diferencia mnima a detectar
(d).

Solucin:

r = 2(CV/d) (t
1
+ t
2
)

gl DCA= t(r-1)
t= nmero de tratamientos a comparar= 5
=5%
=10%
1-= 90%
CV=15%
d=10%

Tome arbitrariamente r=7 rplicas, lo que da 30 gl para el
error, es decir t(r-1)= 5(7-19)=30.


t
1
(30 gl, =0.05)= 2.042 (Nota: valor de t de dos colas)
t
2
= (30 gl, =0.10)= 1.310 (Nota: valor de t de una cola)



84
r= 2(15/10) (2.042+1.310)=2(2.25)(11.22)= 50.5

A continuacin se utiliza el valor de r= 50.5 = 51 estimado y
se realiza la operacin de nuevo:

gl= t(r-1)= 5(51-1)= 250


b) r= 2(15/10) (1.96 + 1.282)

r= 2(2.25) (10.51)= 47.29

c) si se utilizara r= 48 y se realizara la operacin de nuevo
se encontrara que r= 48; es decir, se estabiliza; por lo
tanto,

d) De acuerdo a los valores proporcionados se requieren 48
repeticiones.

Otro ejemplo.
a) Estime el nmero de rplicas para un diseo de bloques al
azar con cuatro tratamientos, y con los niveles de error tipo
I y II de 5 y 20 % respectivamente. El coeficiente de
variacin es del 10% y la diferencia mnima a detectar (d) es
tambin del 10%.

b) Estime el nmero de rplicas para el caso a) pero con
una diferencia a detectar del 50% menor que la elegida en a).
Que sucedi? Cmo lo explica?.


Solucin:
Primer clculo;

r = 2(CV/d) (t
1
+ t
2
)

gl DBA= (t-1)(r-1)
t=4
=5%
=20%
1-= 80%
CV=10%
d=10%

Considerando arbitrariamente 10 rplicas, dara 30 GL para el
error


t
1
(30 gl, =0.05)= 2.042 (Nota: valor de t de dos colas)


85
t
2
= (30 gl, =0.20)= 0.854 (Nota: valor de t de una cola)

r= 2(10/10) (2.042+0.854)=2(1)(2.896)= 16.774 = 17

gl= (t-1)(r-1)= 3(17-1)= 48

Segundo clculo:

r= 2(10/10) (2.011 + 0.850)

r= 2(1) (8.185)= 16.37 = 17

Por lo tanto, de acuerdo a los valores proporcionados se
requieren 17 repeticiones.


b) en este caso el valor de d=5%, todos los dems valores
permanecen iguales.

Considerando arbitrariamente 10 rplicas, dara 30 GL para el
error


t
1
(30 gl, =0.05)= 2.042 (Nota: valor de t de dos colas)
t
2
= (30 gl, =0.20)= 0.854 (Nota: valor de t de una cola)

r>= 2(10/5) (2.042+0.854)=2(2)(2.896)= 16.774 = 34

gl= (t-1)(r-1)= 3(34-1)= 99

Segundo clculo:

r= 2(10/5) (1.982 + 0.846)

r= 2(2) (7.997)= 32

Por lo tanto, de acuerdo a los valores proporcionados se
requieren 32 repeticiones. Aproximadamente el doble que se
requiere para una precisin del 10%.



8.3.- Seleccin de tratamientos.

La seleccin cuidadosa de los tratamientos puede aumentar
la precisin del experimento. Por ejemplo, al estudiar la
curva de respuesta a niveles diferentes de protena en una
dieta, la curva es ms importante que la significancia de la
diferencia entre dos niveles adyacentes. As mismo se sabe,


86
que niveles con intervalos iguales son ms eficientes para
estimar una curva de respuesta. El arreglo de los tratamientos
aumenta la precisin en la estimacin de los factores
principales en los experimentos factoriales. Por ejemplo, la
precisin es mayor, si en vez de realizar un experimento en
donde se comparan tres niveles de protena en la dieta, por
ejemplo, 16, 17 y 18% se comparan niveles de 16,20 y 24% de
protena. Es decir mientras mayor sea la distancia entre
niveles o tratamientos, mayor ser la precisin y el
coeficiente de determinacin (R
2
) del anlisis de varianza.
As mismo, el incluir otros factores puede mejorar el R
2
y
la precisin, por ejemplo, en experimentos con pollos, el R
2
es
mayor cuando se utilizan aves machos y hembras (por separado),
que si se utilizaran aves mixtas o slo animales machos o
hembras.





8.4.- Seleccin de las unidades experimentales.

La uniformidad de las unidades experimentales es deseable
para aumentar la precisin ya que se reduce la variacin. Por
ejemplo, al utilizar animales con pesos aproximados o
distribuirlos de tal manera que la media de los pesos de los
tratamientos al inicio del experimento sean lo ms
aproximados. Tambin se puede mejorar el experimento
aumentando el nmero de unidades experimentales. Es mejor
realizar un experimento en donde haya 10 corrales con 2
animales cada uno que un experimento con 5 corrales y 4
animales en cada uno. Aun cuando es el mismo nmero de
animales, el nmero de repeticiones es menor en el segundo
caso. En experimentos agrcolas, la forma y tamao de la
parcela, as como la eliminacin de los efectos de borde son
importantes para mejorar la precisin.


8.5.- El uso de mediciones adicionales.

Se pueden tomar mediciones adicionales de covariables
para aumentar la precisin de la estimacin de los efectos de
tratamientos. Es el uso principal del Anlisis de covarianza.
Normalmente se mide la covariable antes de aplicar los
tratamientos. Se ajustan las observaciones de la variable de
respuesta (dependiente) por las diferencias iniciales de la
covariable. El ajuste reduce el error experimental y da
comparaciones ms precisas entre tratamientos.



87
Ejemplo


REFERENCIAS

Cochran, W.G. y G.M. Cox. 1976. Diseos Experimentales. Ed.
Trillas, Mxico.
Little, T.M. y F.J. Jackson Hills. 1985. Mtodos Estadsticos
para la Investigacin en Agricultura. Trillas. Mxico.
Montgomery, D.C. 1991. Diseo y Anlisis de Experimentos.
Grupo Editorial Iberoamrica. Mxico.
Snedecor, G.W. y G.W. Cochran. 1981. Mtodos Estadsticos. Ed.
CECSA. Mxico.
Steel R.D.G. y J.H Torrie. 1985. Bioestadstica. Principios y
Procedimientos. 2a. Ed. McGraw-Hill. Mxico.
SAS Institute Inc. 1985. SAS Guide User's: Statistics. Cary,
North Carolina, USA.

You might also like