You are on page 1of 37

5 Semestre

Asignatura:
Estadstica Inferencial II
Profesor:
Lic. Isaac Vzquez Esqueda
Unidad 5
Diseo Experimental con bloques al azar y diseos
factoriales.

Alumna:
Arantza Aquino Prado
Cd. Lzaro Crdenas, Mich. A 30 de noviembre del 2013.

Instituto Tecnolgico De Lzaro Crdenas



Diseo experimental que sirve para estudiar el efecto individual y de interaccin de
varios factores sobre una o varias respuestas .Es decir lo que se busca es estudiar
la relacin entre factores y la respuesta, con la finalidad de conocer mejor como es
esta relacin y generar conocimiento que permita tomar acciones y decisiones que
mejoren el desempeo de proceso.2Estadistica II Diseo factorial
Uno de los objetivos particulares ms importantes que en general tiene un diseo
factorial es determinar una combinacin de niveles de los factores en la cual el
desempeo del proceso sea mejor que en las condiciones de operacin actuales,
es decir, encontrar nuevas condiciones de operacin que eliminen o disminuyan
cierto problema de calidad en la variable de salida.



















Contenido temtico

Unidad 5: Diseo experimental con
bloques al azar y diseos factoriales.

5.1 Metodologa del diseo experimental de bloques al
azar.
5.2 Diseo de experimentos factoriales.
5.3 Diseo factorial 2
k

5.4 Diseo de cuadrados latinos.
5.5 Diseo de cuadrados grecolatinos.
5.6 Aplicaciones.












Unidad 5
5.1 METODOLOGA DEL DISEO EXPERIMENTAL DE BLOQUES AL AZAR.
En muchos problemas de diseo experimental es necesario disear el
experimento de modo que sea posible controlar la variabilidad generada por un
factor indeseable. El procedimiento general para el diseo aleatorizado por
bloques completos consiste en seleccionar b bloques y realizar una rplica
completa del experimento en cada uno de ellos. En cada bloque existen a
observaciones (una por cada nivel del factor), y el orden en que se toman estas
observaciones se asigna de manera aleatoria dentro del bloque.
Suponga que tiene inters en un solo factor que tiene a niveles, y que el
experimento se efecta en b bloques. Las observaciones pueden presentarse con
el modelo estadstico lineal
Donde es la media global, i es el efecto del i-simo tratamiento, j es el efecto
del j simo bloque y ji es el trmino de error aleatorio, el cual se supone que tiene
una distribucin normal e independiente con media cero y varianza ().En principio,
los efectos de los tratamientos y de bloques son considerados como factores fijos.
Por otro lado, los efectos de los tratamientos y de los bloques son definidos como
desviaciones de la media global.
Modelo Estadstico
Para este diseo el modelo lineal esta dado por

Donde es la media global de los tratamientos, es el efecto
del tratamiento el cual es constante para todas las observaciones
dentro del tratamiento, es el efecto del bloque, es el
trmino del error aleatorio, el cual se distribuye normal e independiente con media
0 y varianza . Las restricciones del modelo son


Estimacin de parmetros
Al aplicar el mtodo de mnimos cuadrados, se obtiene como estimadores de los
parmetros

Tabla Anova - Anlisis de Varianza
La tabla de anlisis de varianza para este diseo se presenta a continuacin:
Tabla 02. Anlisis de varianza para un diseo de bloques completos al azar
Causa de
variacin
Grados de
libertad
Suma de
cuadrados
Cuadrado
medio
Valor esperado
de
cuadrados
medios
Tratamient
os




Bloques




Error




Total




Para contrastar las hiptesis de no efectos de tratamientos


Se puede utilizar el cociente

ya que si es cierta y as , lo cual quiere decir
que es un estimador intestado de y como adems es tambin un
estimador de entonces de tienen dos estimadores intestados de y por
tanto su cociente deber ser un valor estadsticamente cercano a 1.
Supuestos del modelo
El residual en un diseo de bloques completos al azar es dado por

Los supuestos del modelo son:
El modelo es aditivo, es decir no existe interaccin entre bloques y tratamientos
Las variables aleatorias error se distribuyen normal con media cero
Las variables aleatorias error son no correlacionadas (independientes)
Otra manera de enunciar los supuestos es:
. Los efectos de tratamientos y bloques son aditivos; las respuestas dentro de
los bloques tienen la misma tendencia con respecto a los efectos de los
tratamientos.
Las observaciones en las celdas constituyen muestras aleatorias de
tamao 1 de cada una de las poblaciones Todas las poblaciones son
normalmente distribuidas,
Las varianzas de cada una de las poblaciones son iguales

Si la primera condicin se tiene se dice que los efectos de bloques y tratamientos
no interactan y una prueba para la no aditividad es debida a Tukey (1949) y
Ascombe.
Validacin de los supuestos del modelo
Antes de conocer los mtodos de validacin de supuestos es importante hacer las
siguientes observaciones:
1. La desviacin relativamente grande del supuesto de homogeneidad de
varianzas tiene muy poco efecto sobre el nivel de significancia, aunque este puede
ser mayor que el nivel dado, el poco efecto es debido a que los tratamientos son
igualmente replicados.
2. La no actividad puede ser ms seria ya que puede aumentar el estimado del
error experimental (CM resultando en posibles fallas para detectar diferencias
reales de los tratamientos.
3. Antes de probar cualquier supuesto se debe asegurar que no existan valores
outlier en los datos. Algunos trabajos han venido desarrollndose para detectar
outlier en clasificaciones a dos vas que incluyen el DBC. Cuando el diseo tiene
residuales con varianza comn, como podra ser el caso de diseos balanceado,
la mejor prueba para detectar un solo outlier es basada en el mximo residuo
normalizado (MRN)
Stefansky (1972) describe un mtodo general para calcular valores crticos del
MRN y provee tablas para el caso de dos vas de clasificacin con una
observacin por celda. Para algunos valores de solamente acotados para
valores crticos pueden ser obtenidos. Esas tablas son reproducidas en Martin
Tablas C- 6a y C- 6b. Las clasificaciones filas y columnas son intercambiables.
El mximo residuo normalizado es dado por:

Donde: y es el mayor residual en valor
absoluto. Si este valor excede el valor crtico de tabla, la observacin es declarada
como un outlier potencial. Estas deben ser localizadas y examinadas para buscar
causas asignables. La eliminacin arbitraria de valores extremos debe evitarse.

Homogeneidad de varianza
La prueba grfica de igualdad de varianza es graficar los residuales contra los
valores predichos ( si existe algn patrn especial que
muestre mayor dispersin para un lado de la grfica se puede decir que no hay
homogeneidad de varianza.
Las pruebas analticas para igualdad de varianza dadas por el DCA no son
aplicables a bloques ya que no se tienen estimadores independientes de las
varianzas de los tratamientos. Existen algunos procedimientos, pero quiz el ms
simple es el desarrollado por Han ( . Esta prueba es especialmente para un
DBC y asume:
Las poblaciones muestreadas sean normalmente distribuidas
Los errores son igualmente correlacionados dentro de los bloques, pero son
independientes entre bloques.
La prueba estadstica es:

Donde el estimado de la varianza para el tratamiento es:

Donde es el nmero de bloques y los son los residuales en el tratamiento .
Note que la varianza no es calculada directamente de los datos, por ello la no
independencia de las varianzas. Observe que para el calculo de la varianza del
tratamiento 1 utiliza a la medias de los bloques, , y para el
tratamiento 2 utiliza tambin a a la medias de los bloques .

Los valores crticos de la prueba estadstica son basados sobre puntos de
porcentaje de la distribucin rango estudentizado en vez de la distribucin
Fmax.
Se rechaza la hiptesis de homogeneidad de
varianzas si . Los puntos de porcentaje
de han sido tabulados por Harter (1960) y pueden ser obtenidos en la tabla
C-7 de Martin.
Ejemplo
Los datos presentados son tomados de Graybill (1954) de ensayos de variedades
de trigo. Cuatro variedades de trigo crecieron en cada una de trece localidades del
estado de Oklahoma. Las respuestas en bushels por acre, son dadas en la tabla.
variedades
Loc. 1 2 3 4
1 43.60 24.05 19.47 19.41
2 40.40 21.76 16.61 23.84
3 18.08 14.19 16.69 16.08
4 19.57 18.61 17.78 18.29
5 45.20 29.33 20.19 30.08
6 25.87 25.60 23.31 27.04
7 55.20 38.77 21.15 39.95
8 55.32 34.19 18.56 25.12
9 19.79 21.65 23.31 22.45
10 46.24 31.52 22.48 29.28
11 14.88 15.68 19.79 22.56
12 7.52 4.69 20.53 22.08
13 41.17 32.59 29.25 43.95

33.29 24.05 20.70 26.16
Las varianzas mustrales de los tratamientos son:

Por consiguiente . Tomando
, y el aproximado percentil cinco de . Bajo esta
prueba la hiptesis nula de igualdad de varianzas es rechazada.

La Aditividad del modelo
Este es un problema ms serio que la homogeneidad de varianzas. Cuando no
existe aditividad el estimado del error experimental es inflado resultando as un
sesgo negativo para la prueba de tratamientos. Aunque una prueba significante
para tratamientos implicara diferencias entre las medias de los tratamientos, una
prueba no significativa no necesariamente implica que no hay efecto de las
medias de los tratamientos.
Para detectar la no aditividad grficamente, se debe realizar un grfico de
dispersin entre los residuales (eje Y) y los valores predichos (eje X). Una
tendencia cuadrtica en el grfico indica la presencia de no aditividad
transformable, esto es, no aditividad que puede ser removida por la aplicacin de
una transformacin. Para determinarla naturaleza de la no aditividad, considere el
modelo para el diseo de bloques completos al azar con interaccin

Donde es la componente de interaccin (no aditividad). Existe aditividad
cuando se cumple que para todo y .
TUKEY(1949a), desarroll una prueba de un solo grado de libertad para
determinar si existe el efecto de interaccin, asumiendo un modelo de la forma


Es decir, este procedimiento supone que la forma de interaccin es
particularmente simple o sea

Donde es una constante desconocida.
Note que cada celda contiene exactamente observaciones que en el caso de
bloques completos es una. Si se define la interaccin de esta forma, puede usarse

el mtodo de regresin para probar la significancia de este trmino, al probar la
hiptesis .
La tabla de ANOVA es dada por:
Causa de
variacin

Grados de
libertad

Suma de
cuadrados

C.M
Tratamientos t-1
SC

Bloques b-1
SC

Residual (t-1)(b-1)


Error (t-1)(b-1)-1
SC

No aditividad 1
SC

TOTAL N-1

Acombe (1961) propuso una prueba general que puede ser usada para cualquier
modelo lineal, incluyendo modelos de regresin


Donde es dado en la instruccin


Utilizando SAS
Data TRIGO;
Input LOC VAR Y;
Cards;

;
PROC GLM;
CLASS Bloque Ttos;
MODEL Y= Bloque Ttos;
OUTPUT OUT= VALIDA PREDICTED (o P)=PRE RESIDUAL (o R)= RES;
DATA NUEVO;
SET VALIDA;
Y2= PRE*PRE;
Z= RES*Y2;
DROP PRE RES;/*excluye las variables PRE y RES*/
PROC MEANS DATA= NUEVO SUM;
VAR Z;
PROC ANOVA;
CLASS Bloque Ttos;
MODEL Y2=Bloque Ttos/SS1;
RUN;
El numerador de la suma de cuadrados de la no aditividad es el cuadrado del total
de SUM de Z = 15957.55 y el denominador es la Suma de cuadrados del error
para el ANOVA obtenido en la instruccin MODEL Y2=Bloque Ttos/SS1 dado por

SC = 265419.94079804. Luego la suma de cuadrados de no aditividad es
dado por

Causa de
variacin

Grados de
libertad

Suma de
cuadrados

Cuadrado
medio

F Valor p
Tratamientos 3 1106.6 368.9 6.55 0.001
Bloques 12 3118.2 259.8 4.62 0.000
Residual 36 2026.91 56.3

Error* 35


No aditividad 1
SC


TOTAL 51 6251.6

Donde


La hiptesis a probar es

La hiptesis de aditividad es rechazada al nivel 5%.

Ejercicio
Suponga la siguiente tabla de un BC

Tratamientos
Bloques
1
2
3

A
4
4
2

B
7
4
5

C
4
4
2

Qu hacer si no se cumple el supuesto de aditividad
Cuando no se cumple del supuesto de aditividad se pueden presentar los
siguientes problemas: si el investigador quiere comparar y hacer recomendaciones
sobre los tratamientos, la presencia de interaccin entre los bloques y los
tratamientos implica que tales comparaciones no son la misma para todos los
bloques. Por consiguiente hacer comparaciones de la manera usual; por medio
de las medias de tratamientos , puede representar una idea equivocada.
Tambin, como lo mostr Kempthorne (1952, Seccin 8.3), con la no aditividad no
es posible obtener un ``razonable'' error estndar para la comparacin de los
tratamientos. Y finalmente, la no aditividad en una tabla a dos vas puede ser
debida a interaccin o a la no homogeneidad de varianzas.
La no aditividad puede conllevar a diferentes acciones dependiendo de la forma de
construccin de los bloques: aquellos construidos de manera ``natural''
dividendo las unidades experimentales heterogneas existentes en grupos
homogneos y aquellos donde los bloques son introducidos por el
investigador en la forma de factores de bloqueo, principalmente para ampliar las
inferencias acerca de los tratamientos. Como una ilustracin del primer caso
puede ser que las unidades experimentales sean las hojas de las plantas y que las
plantas sean los bloques. El segundo caso puede ser representado como por un
experimento con plantas como unidades experimentales y los bloques las
diferentes variedades de plantas.
En el primer caso claramente cualquier intento por explicar o modelar la no
aditividad no es de valor con respecto a la comparacin de los tratamientos. En
vez de esto se puede remover tal no aditividad a travs de una transformacin
disponible usando los mtodos de transformacin. En este caso es til realizar un

grfico del valor absoluto de los residuales contra las
observaciones para tener alguna idea sobre la transformacin apropiada de los
datos.
En el segundo caso puede ser muy importante modelar la posible no aditividad
como un significado de la interpretacin diferencial de los efectos de tratamientos.
En efecto, en este caso las interacciones entre bloques y tratamientos pueden ser
ms importantes que los mismos efectos de tratamientos. Se puede sugerir
entonces que en lo posible se utilice un diseo diferente como el diseo de
bloques generalizado.
5.2 DISEO DE EXPERIMENTOS FACTORIALES.
En cualquier experimento diseado, es siempre importante examinar los residuos
y verificar si se violan las suposiciones bsicas (Normalidad, Independencia,
Aditivita e Igualdad de varianzas) que pueden invalidar los resultados.
Los valores de los residuos del diseo aleatorizado por bloques completos se
obtienen, como es usual, por la diferencia entre los valores observados y los
estimados
El anlisis de varianza del modelo supone que las observaciones estn
distribuidas de manera normal e independiente, con la misma varianza para cada
tratamiento o nivel del factor. Estas suposiciones deben verificarse mediante el
anlisis de los residuos.
La suposicin de normalidad puede verificarse mediante la construccin de una
grfica de probabilidad normal de los residuos. Para esto, los residuos se agrupan
en una tabla de distribucin de frecuencias, se calcula la frecuencia relativa
acumulada para cada valor y se grafican en una hoja de papel de probabilidad
normal. Si la suposicin es vlida los puntos tendern a agruparse sobre una lnea
recta que pasa por el punto medio.
As, por ejemplo, si el diseo experimental es bloques al azar, el modelo es:
yij = + i + j + ij
Respuesta = media general + efecto de tratamiento + efecto de bloque + error
Si se trata de un diseo factorial, los tratamientos se forman combinando los
niveles de los factores en estudio, de manera que el efecto del tratamiento i se
considera a su vez compuesto de los efectos de los factores y sus interacciones.
Por ejemplo, si son dos factores en estudio se tiene:
i = kl = k + l + kl

Tratamiento = factor A + factor B + interaccin AB
Haciendo una equivalencia entre los valores de i y los de k y l suponiendo que el
factor A tiene K niveles y el factor B L:
i k l
1 1 1
2 1 2
3 1 3
.. .. ..
t K L
Y el modelo resultante es: yklj = + k + l + kl + j + klj
Es poco usual tener diseos experimentales muy complicados en los
experimentos factoriales, ya que se discuta el anlisis y la interpretacin.
Las ventajas de los experimentos factoriales son:
1. Economa en el material experimental al obtener informacin sobre varios
factores sin aumentar el tamao del experimento. Todas las u.e.se utilizan para la
evaluacin de los efectos.
2. Se ampla la base de la inferencia en relacin a un factor, ya que se estudia en
las diferentes condiciones representadas por los niveles de otros factores. Se
ampla el rango de validez del experimento.
3. Permite el estudio de la interaccin, esto es, estudiar el grado y forma en la cual
se modica el efecto de un factor por los niveles de los otros factores.
Una desventaja de los experimentos factoriales es que requiere un gran nmero
de u. E., sobre todo cuando se prueban muchos factores o muchos niveles de
algunos factores, es decir, se tiene un nmero grande de tratamientos.
(Factoriales fraccionales)
Suponga un diseo con dos factores: A con a niveles y B con b niveles, en diseo
completamente al azar. (Factorial a b completo, balanceado, efectos jos)
Sea yijk la respuesta para la k-simau.e. del nivel i de A y j de B.
yijk = + i + j + ij + ijk

i = 1,. . ., a j = 1, . . ., b k = 1, . . ., n
Las hiptesis que se prueban son:
H01 :ij = 0 i, j
H02 :i + i. = 0 i
H03 : j + .j = 0 j
Tipo de Temperatura (F)
Material 15 70 125
1 130 155 34 40 20 70
74 180 80 75 82 58
2 150 188 136 122 25 70
159 126 106 115 58 45
3 138 110 174 120 96 104
168 160 150 139 82 60
El ingeniero quiere contestar las siguientes preguntas:
1. Qu efectos producen el material y la temperatura en la vida de la batera?
2. Existe un material que produzca uniformemente ms larga vida a la batera sin
importar la temperatura? diseo completamente al azar, experimento balanceado,
completo, factores jos.
Una observacin por celda
Suponga un experimento con dos factores A con a niveles y B con b niveles y una
sola repeticin en cada celda (tratamiento).
El modelo con interaccin es:
yij = + i + j + ()ij + iji = 1, . . ., a j = 1, . . ., b
F.V. g.l. E(CM)
A a 1 2 + b2
B b 1 2 + a2b

AB (a 1)(b 1) 2 + 2ab
Error 0 2
Total ab 1
2 no se puede estimar, por lo tanto no hay prueba para los efectos principales a
menos que no haya interaccin, y entonces el modelo es
yij = + i + j + ij
ESTE ES EL CASO DE BLOQUES AL AZAR.
El Diseo Factorial General. Balanceado
El diseo factorial de dos factores se puede generalizar atener p factores:
A con a niveles
B con b niveles
..............
En general, habr abc n observaciones si hay n repeticionesdel experimento
completo.
Debe haber por lo menos 2 repeticiones (n 2) para podercalcular 2 si todas las
posibles interacciones estn incluidas en el modelo.
Tres factores
El modelo para un factorial de tres factores en diseo completamente al azar:
yijkl = +i+j +k+()ij +()ik+()jk+()ijk+ijkl
i = 1,. . ., a; j = 1, . . ., b; k = 1, . . ., c; l = 1, . . ., n
Ejemplo:
Se desea obtener ms uniformidad en el llenado de botellas de refresco. La
mquina de llenado tericamente llena cada botella a la altura correcta, pero en la
prctica hay variacin, y
la embotelladora desea entender mejor las fuentes de esta variabilidad para
eventualmente reducirla.
El ingenio de procesos puede controlar tres factores durante el proceso de
llenado:

El % de carbonato (A), la presin del llenado (B) y las botellas llenadas por minuto
(velocidad de la lnea) (C).
5.3 DISEO FACTORIAL 2^k
En ocasiones, cuando se utiliza un diseo aleatorizado por bloques completos,
alguna de las observaciones en uno de los bloques puede faltar. Esto sucede
debido algn descuido o error, o por razones fuera del control del experimentador,
como sera el caso de la prdida de alguna unidad experimental. Una observacin
faltante introduce un nuevo problema en el anlisis, ya que los tratamientos dejan
de ser ortogonales a los bloques.
En otras palabras, cada tratamiento no ocurre en cada bloque. Existen dos formas
generales de resolver el problema de los valores faltantes. La primera es un
anlisis aproximado en el que se estima la observacin faltante. A continuacin se
efecta el anlisis de varianza usual como si la observacin estimada fuera un
dato real, disminuyendo los grados de libertad del error en uno. La segunda es un
anlisis exacto usando la prueba de significancia de regresin general.
Suponga que falta la observacin correspondiente al tratamiento i y al bloque j.
Esta observacin se representa mediante x el gran total con una observacin
faltante se representar mediante y los totales del tratamiento y del bloque con un
dato faltante como y, respectivamente. Supongamos, adems, que para estimar la
observacin faltante se elige x, de manera que tenga una contribucin mnima a la
suma de cuadrados del error. Como la suma de cuadrados del error est dada en
donde R incluye todos los trminos que no contienen a x. Al derivar la SCE con
respecto a x e igualar a cero se obtiene
Como un estimador para la observacin faltante.
El efecto de un factor se define como el cambio en la respuesta producida por un
cambio en el nivel del factor. Con frecuencia, ste se conoce como efecto
principalporque se refiere a los factores de inters primordial del experimento. Por
ejemplo, consideremos los datos de la tabla 1. El efecto principal del factor A
podra interpretarse como la diferencia entre la respuesta promedio en el primer y
segundo nivel de ese factor. Numricamente
21
2
30 20
2
52 40
A =
+

+
=

Tabla 1 Un experimento factorial

En otras palabras incrementar el factor A del nivel 1 al 2 produce un cambio en la
respuesta promedio de 21 unidades. Similarmente, el efecto principal de B es:
11
2
40 20
2
52 30
B =
+

+
=

Si los factores tienen ms de dos niveles, el procedimiento anterior debe ser
modificado ya que las diferencias entre las respuestas promedio pueden
expresarse de muchas formas.
En algunos experimentos puede encontrarse que la diferencia en la respuesta
entre los niveles de un factor no es la misma en todos los niveles de los otros
factores. Cuando esto ocurre existe una interaccin entre los factores. Por
ejemplo, considrense los datos de la Tabla 2.





Tabla 2. Un experimento factorial con interaccin
En el primer nivel del factor B, el efecto de A es:
A = 50 - 20 = 30
Mientras que en el segundo nivel de B, el efecto de A es:
A = 12 - 40 = 28
Puede observarse que existe una interaccin entre los factores A y B porque el
efecto de A depende del nivel elegido de B.
20 40
50 12
B1 B2
A1
A2
Factor B
Factor A
20 40
50 12
B1 B2
A1
A2
Factor B
Factor A

Estas ideas pueden ilustrarse grficamente. En la Fig. 1 se muestra una grfica de
la respuesta de los datos de la Tabla 1 contra los niveles del factor A para ambos
niveles del factor B. Se observa que las rectas B
1
y B
2
son, aproximadamente,
paralelas. Esto indica que no hay interaccin entre los factores. De manera similar,
en la Fig. 2 se presenta una grfica de la respuesta de los datos de la Tabla 2.




Figura 1 Un experimento factorial sin interacciones
En este caso se ve que las rectas B
1
y B
2
no son paralelas. Esto muestra que
existe una interaccin entre A y B. Sin embargo, no debe ser la nica tcnica para
analizar los datos, porque su interpretacin es subjetiva y su apariencia, a
menudo, es engaosa.




Figura 2 Un experimento factorial con interacciones
Hay que notar que cuando una interaccin es grande los correspondientes efectos
principales tienen poco significado prctico. Una estimacin del efecto principal de
A de los datos de la Tabla 2 es:
1
2
40 20
2
12 50
A =
+

+
=
10
20
30
40
50
60
A1 A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a

Factor A
10
20
30
40
50
60
A1 A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a

Factor A
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a

Factor A
10
20
30
40
50
60
A1
A2
B1
B2
B1
B2
R
e
s
p
u
e
s
t
a

Factor A

El cual resulta ser muy pequeo corrindose el riesgo de concluir que no existe un
efecto debido a A. Sin embargo, cuando se examin el efecto de A en niveles
diferentes de B se concluy que ste no era el caso. El factor A tiene un efecto,
pero depende del nivel del factor B. En otras palabras, es ms til conocer la
interaccin AB que el efecto principal. Una interaccin significativa oculta a
menudo el significado de los efectos principales.
Ventajas de los diseos factoriales
Las ventajas de los diseos factoriales pueden ilustrarse fcilmente. Supongamos
que se tienen dos factores, A y B, cada uno con dos niveles. Estos niveles se
representan mediante A
1
, A
2
, B
1
y B
1
. La informacin acerca de ambos factores
puede obtenerse variando un factor a la vez como aparece en la tabla 3. El efecto
de variar el factor A est dada por A
2
B
1
-A
1
B
2
. A causa de que existe error
experimental, es conveniente realizar, por ejemplo, dos observaciones de cada
combinacin de tratamientos y hacer una estimacin de los efectos de los factores
usando las respuestas promedio. Por lo tanto, se requiere un total de seis
observaciones.




Tabla 3 El mtodo de un factor a la vez
Los diseos factoriales poseen algunas ventajas.
Son ms eficientes que los experimentos de un factor a la vez.
Los diseos factoriales son necesarios cuando alguna interaccin puede
estar presente, para evitar hacer conclusiones engaosas.
A1B1 A1B2
A2B1 12
B1 B2
A1
A2
Factor B
Factor A
A1B1 A1B2
A2B1 12
B1 B2
A1
A2
Factor B
Factor A

Los diseos factoriales permiten estimar los efectos de un factor en
diversos niveles de los otros factores, produciendo conclusiones que son
vlidas sobre toda la extensin de las condiciones experimentales.
2. Diseo factorial de dos factores
El
primer diseo de la serie 2
2
es aquel en el que solo dos factores, A y B, cada
uno con dos niveles. Este diseo se conoce como diseo factorial 2
2
.
Arbitrariamente, los niveles del factor pueden llamarse bajo y alto.
Ejemplo 1 Considrese una investigacin llevada a cabo para estudiar el efecto
que tiene la concentracin de un reactivo y la presencia de un catalizador sobre el
tiempo de reaccin de un proceso qumico. Sea la concentracin del reactivo el
factor A con dos niveles de inters, 15% y 20%. El catalizador constituye el factor
B; el nivel alto o superior denota el uso de dos sacos de catalizador y el nivel bajo
o inferior denota el uso de un solo saco. El experimento se realiza (replica o
repite) tres veces, y los datos son como sigue:

En la figura 4 siguiente se presentan grficamente las combinaciones de
tratamiento para este diseo, el efecto de un factor se denota por la letra latina
minscula. De este modo, A se refiere al efecto del factor A, y B se refiere al
efecto del factor B, y AB se refiere a la interaccin entre AB. En el diseo 2
2
los
niveles bajo y alto de A y B se denotan por - y + respectivamente, en los ejes A
y B. As en el eje B representa el nivel bajo de catalizador mientras que + denota
el nivel alto.
Combinacin de
tratamientos
Replica
I II III Total
A baja, B baja 28 25 27 80
A alta, B baja 36 32 32 100




Las cuatro combinaciones de tratamientos en el diseo pueden representarse por
letras minsculas, cono se muestra en la figura 3. En esta figura se aprecia que el
nivel superior de cualquier factor de una combinacin de tratamientos esta
representado por la presencia de la letra minscula correspondiente, mientras que
la ausencia de esta ultima representa el nivel inferior del factor.
As
a representa la combinacin de tratamientos, en la que A se encuentra en
el nivel superior y B en el nivel inferior;
b representa aquella en la que A se halla en el nivel inferior y B en el
superior, y
ab representa a ambos factores en el nivel superior.
Por convencin (1) se usa para representar a ambos factores en el nivel
inferior.
El efecto promedio de un factor se define como el cambio en la respuesta
producida por un cambio en el nivel de ese factor, promediado sobre los
niveles del otro factor.
Como se ilustra en la figura 3, las letras minsculas (1), a, b y ab tambin se usan
para representar los totales de las n replicas de las combinaciones de tratamientos
correspondientes. Ahora bien, el efecto de A en el nivel B es {a-(1)}/n. Mientras
que el nivel superior B es {ab-b}/n. Tomando el promedio de estas dos cantidades
se obtiene:
| | | | { } | | (1) b a ab
2n
1
(1) a b ab
2n
1
A = + =
A baja, B alta 18 19 23 60
A alta, B alta 31 30 29 90






El efecto promedio de B se determina a partir de su efecto en el nivel inferior de A
(esto es, {b-(1)}/n, y de su efecto en el nivel superior de A (que es igual a [ab-a]/n
obtenindose:
| | | | { } | | (1) a - b ab
2n
1
(1) b a ab
2n
1
B + = + =
El efecto de la interaccin AB se define como la diferencia promedio entre el
efecto de A en el nivel superior de B y su efecto en el nivel inferior de B, as:
| | | | { } | | (b) a (1) ab
2n
1
(1) a b ab
2n
1
AB + = =

Por otro lado se puede definir AB como la diferencia promedio entre el efecto de B
en el nivel superior de A y el efecto de B en el nivel inferior de A.
Las formulas para los efectos de A, B y AB pueden deducirse por otro mtodo. El
efecto de A puede hallarse como la diferencia en la respuesta promedio de las dos
combinaciones de tratamiento en la mitad derecha (que llamaremos Y
A+
, puesto
que es la respuesta promedio para las combinaciones de tratamientos a las que A
que se encuentra en el nivel alto) y las dos combinaciones de tratamientos en la
mitad izquierda (o YA
). Esto es,
+ = A Y A Y A
2n
(1) b
2n
a ab +

+
=

Alto (2 sacos) +
bajo (1 saco) -
-
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
C
a
n
t
i
d
a
d

d
e

c
a
t
a
l
i
z
a
d
o
r

B
b = 60(18+19+23) ab = 90(31+30+19)
(1) = 80(28+25+27) a = 100(36+32+32)
Figura 1: Combinaciones de tratamiento en el diseo factoriall
Alto (2 sacos) +
bajo (1 saco) -
-
bajo (15%)
+
alto (20%)
Concentracion de reactivo A
C
a
n
t
i
d
a
d

d
e

c
a
t
a
l
i
z
a
d
o
r

B
b = 60(18+19+23) ab = 90(31+30+19)
(1) = 80(28+25+27) a = 100(36+32+32)
Figura 1: Combinaciones de tratamiento en el diseo factoriall

| | (1) b a ab
2n
1
+ =
Este es exactamente el mismo resultado, el efecto de B se encuentra como la
diferencia entre el promedio de las dos combinaciones de tratamientos en la parte
superior del cuadrado (
YB+
) y el promedio de las dos combinaciones de
tratamientos en la parte inferior ( YB-
), o
+ = B Y B Y B

2n
(1) a
2n
b ab +

+
=

| | (1) a b ab
2n
1
+ =

Finalmente el efecto de interaccin AB es el promedio de las combinaciones de
tratamientos en la diagonal de derecha a izquierda del cuadrado |ab y (1)| menos
el promedio de las combinaciones de tratamientos en la diagonal de izquierda a
derecha (a y b), o
2n
b a
2n
(1) ab
AB
+

+
=

| | b a (1) ab
2n
1
+ =

Con los datos que aparecen en la figura 1, las estimaciones de los efectos
promedio son:
( ) 8.33 80 60 100 90
2(3)
1
A = + =
( ) 5.00 80 100 60 90
2(3)
1
B = + =

( ) 1.67 60 100 80 90
2(3)
1
AB = + =

El efecto de A (concentracin de reactivo) es positivo; esto sugiere que al elevar A
del nivel bajo (15%) al nivel alto (25%) incrementar el rendimiento. El efecto de B
(catalizador) es negativo; esto sugiere que elevar la cantidad del catalizador
agregada al proceso reducir el rendimiento. Al parecer, el efecto de
interacciones es pequeo comparado con los dos efectos principales.
En muchos experimentos que implican diseos 2
K
se examina la magnitud y la
direccin de los efectos de los factores para determinar cuales variables es
probable que sean importantes. Por lo general puede emplearse el anlisis de
varianza para confirmar esta interpretacin. En el diseo 2
k
existen algunos
mtodos rpidos especiales para realizar los clculos del anlisis de varianza.
Consideremos la suma de cuadrados para A, B y AB. Obsrvese la primera
ecuacin que se utiliza un contraste para estimar A; esto es,
(1) b a ab ContrasteA + =

Este contraste suele llamarse efecto total de A. A partir de la segunda y tercera
ecuacin, puede apreciarse que tambin se utilizan contraste para estimar B y AB.
Adems, estos tres contrastes son ortogonales. La suma de cuadrados de
cualquiera de ellos puede calcularse usando la siguiente ecuacin:
( ) =
a
a
2
ci n
2
a
1
ciyi. SSc .
Esta ecuacin establece que la suma de cuadrados de contraste es igual al
contraste elevado al cuadrado entre el producto del nmero de las observaciones
de cada total del contraste por la suma de cuadrados de los coeficientes del
mismo. En consecuencia, se obtiene que las sumas de cuadrados de A, B y AB
sean:

| |
| |
| |
4 * n
2
b a (1) ab
SS
4 * n
2
(1) a b ab
SS
4 * n
2
(1) b a ab
SS
AB
B
A
+
=
+
=
+
=

Con los datos de la figura 1, las sumas de cuadrados se pueden calcular aplicando
las ecuaciones anteriores, obtenindose:

8.33
4(3)
2
10
SS
75.00
4(3)
2
30
SS
208.33
4(3)
2
50
SS
AB
B
A
= =
=

=
= =

La suma total de cuadrados se determina de la manera usual mediante:

=

=

=
=
2
1 i
2
1 j
n
1 k
4n
...
2
Y
i j k
2
Y SST

En general SS
T
tiene 4n 1 grados de libertad. La suma de cuadrados del error,
con 4(n-1) G.L. se puede calcular en la forma usual, por diferencia, mediante.
323.00 9075.00 9398.00
4(3)
2
Y 2
1 i
2
1 j
3
1 k
2
i j k
Y
E
SS = =
=

=

=
=

AB
SS
B
SS
A
SS
T
SS
E
SS =
31.34 8.33 75.00 208.33 323.00 = =



El anlisis de varianza completo se presenta en la tabla siguiente. Ambos efectos
principales son significativos al 1%.
A menudo se es conveniente escribir las combinaciones de tratamientos en el
orden (1), a, b, y ab. Este orden se conoce como orden estndar. Cuando se
utiliza es posible apreciar que los coeficientes de los contrastes usados para
estimar los efectos son

Efectos (1) a b Ab
A:
B:
AB:
-1
-1
+1
+1
-1
-1
-1
+1
-1
+1
+1
+1
Tabla ANOVA para los datos del ejemplo 3.1 es la siguiente:

Fuente de
variacin SS G.L. MS Fo
A
B
AB
Error
Total
208.33
75.00
8.33
31.34
323.00
1
1
1
8
11
208.33
75.00
8.33
3.92
53.15
a
19.13
a
2.13

a
significativo al 1%

Signos algebraicos para calcular los efectos en un diseo 2
2









Observe que los coeficientes de los contrastes usados para estimar la interaccin
son iguales al producto de los coeficientes correspondientes a los dos efectos
principales. Los coeficientes de los contrastes siempre son +1 o 1 y se puede
usar una tabla de signos positivos y negativos como la mostrada en la de signos
algebraicos para determinar el signo apropiado de cada combinacin de
tratamientos. En el encabezado de las columnas de tabla y se encuentran los
efectos principales (A y B), la interaccin AB, e I, que representa el total el total o
el promedio de todo el experimento. Se observa que la columna encabezada por I
se compone de solo de signos positivos. Los renglones corresponden a las
combinaciones de tratamientos.
Para encontrar un contraste con el fin de estimar cualquier efecto, simplemente se
multiplican los signos de la columna apropiada de la tabla por la correspondiente
combinacin de tratamientos, y se suma. Por ejemplo, el contraste para estimar A
es (1) + a b + ab, lo cual concuerda con la ecuacin.
| | | | { } | | (1) b a ab
2n
1
(1) a b ab
2n
1
A = + =

Combinacin
De
Tratamientos
Efecto Factorial
I A B AB
(1)
a
b
ab
+ - - +
+ + - -
+ - + -
+ + + +

Los tipos ms sencillos de diseos factoriales implican slo dos factores o
conjuntos de tratamientos. Haya a niveles del factor A y b niveles del factor
B,dispuestos en un diseo factorial; esto es, cada A repeticin o rplica del
experimento contiene todas las combinaciones de tratamiento ab. En general, hay
nrepeticiones.
5.4 DISEO DE CUADROS LATINOS.
Un diseo cuadrado latino para p factores, o un cuadrado latino p x p, es un
cuadrado que contiene p renglones y p columnas. Cada una de las p2 celdas
contiene una de las p letras que corresponde a un tratamiento, y cada letra
aparece una sola vez en cada rengln y columna. El diseo cuadrado latino se usa
para eliminar dos fuentes de variabilidad problemticas; en otras palabras, permite
analizar sistemticamente por bloques en dos direcciones. A continuacin se
presentan algunos ejemplos de cuadrados latinos.
En donde:
Kjiy= observacin correspondiente al i-simo rengln, la k-sima columna y el j-
simo tratamiento
= la media general
I= es el i-simo efecto de rengln
J= es el j-simo efecto de tratamiento
K= es el k-simo efecto de la columna
Kji= es el error aleatorio
El modelo es completamente aditivo, en otras palabras, no existe interaccin entre
los renglones, las columnas y los tratamientos. Slo dos de los subndices i, j y k
se requieren para especificar una observacin en particular porque nicamente
hay una observacin en cada celda.
El anlisis de varianza consiste en descomponer la suma total de cuadrados de
las observaciones en sus componentes de rengln, columna, tratamiento y error
Cuyos grados de libertad.
Bajo la suposicin de que el error aleatorio se distribuye en forma normal e
independiente, cada una de las sumas de cuadrados es al dividir entre, variables
aleatorias independientes con distribucin ji-cuadrada.
Los diseos en cuadrados latinos son apropiados cuando es necesario controlar
dos fuentes de variabilidad. En dichos diseos el nmero de niveles del factor

principal tiene que coincidir con el nmero de niveles de las dos variables de
bloque o factores secundarios y adems hay que suponer que no existe
interaccin entre ninguna pareja de factores.
Supongamos que el nmero de niveles de cada uno de los factores es K. El
diseo en cuadrado latino utiliza K2bloques, cada uno de estos bloques
corresponde a una de las posibles combinaciones de niveles de los dos factores
de control. En cada bloque se aplica un solo tratamiento de manera que cada
tratamiento debe aparecer con cada uno de los niveles de los dos factores de
control.
Si consideramos una tabla de doble entrada donde las las y las columnas
representan cada uno de los dos factores de bloque y las celdillas los niveles del
factor principal o tratamientos, el requerimiento anterior supone que cada
tratamiento debe aparecer una vez y slo una en cada la y en cada columna.
Recibe el nombre de cuadrado latino de orden K a una disposicin en las y
columnas de K letras latinas, de tal forma que cada letra aparece una sola vez en
cada Fila y en cada columna.
A continuacin vamos a dar una forma simple de construccin de cuadrados
latinos.
Se parte de una primera Fila con las letras latinas ordenadas alfabticamente
Columna1 Columna 2 Columna 3 Columna k
Fila 1 A B C K
Laposicin (construccin por permutacin cclica), el cuadrado as obtenido es un
cuadrado latino estndar. Un cuadrado latino se denomina estndar cuando las
letras de la primera
Fila y la primera columna estn ordenadas alfabticamente. A parte de los
cuadrados latinos as obtenidos existen otros cuadrados latinos diferentes,
estndares y no estndares. En el
Apndice B se muestran algunos cuadrados latinos estndares para los rdenes
3, 4, 5, 6, 7, 8 y 9.
El procedimiento para construir un diseo en cuadrado latino es el siguiente:
1) Se elige aleatoriamente un cuadrado latino de los disponibles.
2) Se asigna aleatoriamente el orden de las las y columnas.

3) Se asignan aleatoriamente los tres factores a las las, columnas y letras,
respectivamente.
Ilustremos este procedimiento con el ejemplo del rendimiento de la semilla de
trigo. Al plantear este experimento se pens que podra conseguirse mayor
precisin si se controlaba la variabilidad introducida por los tipos de abono e
insecticida. El instituto de experimentacin agrcola est interesado en estudiar 4
tipos de semilla de trigo, (s1, s2, s3, s4) y decide realizar el experimento utilizando
un diseo en cuadrado latino. Para ello selecciona 4 niveles para cada una de las
variables de bloque: abono, (a1, a2, a3, a4), e insecticida, (i1, i2, i3, i4).
La seleccin de uno de los cuadrados se hace al azar. Supongamos que el
cuadrado latino elegido es el siguiente
A B C D
B A D C
C D A B
D C B A
A continuacin, se asigna tambin al azar, el orden de las las y las columnas.
Supongamos que el orden seleccionado para las las sea (2, 3, 1, 4), entonces el
cuadrado latino anterior se convierte en
B A D C
C D A B
A B C D
D C B A
Se vuelven a generar otros 4 nmeros aleatorios que se idntica con el orden de
las columnas de este ltimo cuadrado. Supongamos que los nmeros obtenidos
son (4, 3, 1, 2), obtenindose el siguiente cuadrado latino
C D B A
B A C D
D C A B
A B D C

Por ltimo, se asignan al azar las las, las columnas y las letras latinas a los tres
factores. Por ejemplo, supongamos que las las, las columnas y las letras se
asignan, respectivamente, a los tipos de insecticidas, semillas y abonos, de tal
forma que el diseo resultante es
Table 5-1.
Semillas
Insecticidess1 s2 s3 s4
i1 a3 a4 a2 a1
i2 a2 a1 a3 a4
i3 a4 a3 a1 a2
i4 a1 a2 a4 a3

Por convenio, se suele situar el factor principal, en este caso el tipo de semilla, en
las
Celdillas. Reordenando el diseo anterior se obtiene la siguiente tabla:7.2 Diseos
en cuadrados latinos 5
Tabla 5-2.
Abonos
Insecticidas a1 a2 a3 a4
i1 s4 s3 s1 s2
i2 s2 s1 s3 s4
i3 s3 s4 s2 s1
i4 s1 s2 s4 s3
En resumen, podemos decir que un diseo en cuadrado latino tiene las siguientes
caractersticas:
1o) Se controlan tres fuentes de variabilidad, un factor principal y dos factores de
bloque.
2o) Cada uno de los factores tiene el mismo nmero de niveles, K.

3o) Cada nivel del factor principal aparece una vez en cada la y una vez en cada
columna.
4o) No hay interaccin entre los factores.

5.5 DISEO DE CUADROS GRECOLATINOS.
Consideremos un cuadrado latino p p al que se le sobrepone un segundo
cuadrado latino cuyos tratamientos se designan por letras griegas. Se dice que los
dos son ortogonales si al sobreponerse poseen la propiedad de que cada letra
griega aparece solamente una vez con cada letra latina.
El diseo cuadrado greco-latino puede utilizarse para controlar sistemticamente
tres fuentes extraas devariabilidad. En otras palabras, se usa para hacer un
anlisis por bloques en tres direcciones. El diseo permite analizar cuatro factores
(rengln columna, letra griega y letra latina), cada uno con p niveles, usando
solamente p2 ensayos. Los cuadrados grecolatinos existen para toda excepto para
p = 6.
En donde:
lkjiy la observacin que corresponde al rengln i, la columna k, la letra latina j y la
letra griega k.
= La media general
i= Es el efecto del i-simo rengln
j= Es el j-simo efecto de tratamiento de las letras latinas
k= Es el k-simo efecto de tratamiento de las letras griegas
l= Es el efecto de la columna l
lkji= Es la componente del error aleatorio
Slo dos de los cuatro subndices son necesarios para identificar completamente
cualquier observacin.
El anlisis de varianza es muy similar al de un cuadrado latino. El factor
representado por las letras griegas es ortogonal a los renglones, las columnas y
los tratamientos de la letra latina porque cada letra griega ocurre una sola vez en
cada rengln, en cada columna y para cada letra latina. Por lo tanto la suma de
cuadrados debida al factor letra griega puede calcularse usando los totales de la

letra griega. El error experimental se reduce en esta cantidad. Las hiptesis nulas
de igualdad entre los renglones, entre las columnas, entre los tratamientos de la
letra latina y entre los tratamientos de la letra griega pueden probarse dividiendo la
media de cuadrados correspondiente entre la media de cuadrados del error
Los cuadrados greco-latinos se obtienen por superposicin de dos cuadrados
latinos del mismo orden y ortogonales entre s, uno de los cuadrados con letras
latinas el otro con letras griegas. Dos cuadrados reciben el nombre de ortogonales
si, al superponerlos, cada letra latina y griega aparecen juntas una sola vez en el
cuadrado resultante.
En el Apndice C se muestra una tabla de cuadrados latinos que dan lugar, por
superposicin de dos de ellos, a cuadrados greco-latinos. Notamos que no es
posible formar cuadrados greco-latinos de orden 6. La Tabla 5-8 ilustra un
cuadrado greco-latino para K = 4
Tabla 5-8.
Cuadrado greco-latino
A B C D
D C B A
B A D C
C D A B
Planteamiento del modelo
En un diseo en cuadrado greco-latino la variable respuesta yij(hp) viene descrita
por la siguiente ecuacin
yij(hp) = + i + j + h + p + ij(hp)
i = 1, 2 . . . , K
j = 1, 2 . . . , K
h = 1, 2 . . . , K
p = 1, 2 . . . , K , (8.1)
Donde

es un efecto constante, comn a todas las unidades. i es el efecto producido
por el i-simo nivel del factor la. Dichos efectos estn sujetos a la restriccin
ii = 0.
j es el efecto producido por el j-simo nivel del factor columna. Dichos efectos
estn sujetos a la restriccin
jj = 0.
h es el efecto producido por el h-simo nivel del factor letra latina. Dichos efectos
estn sujetos a la restriccin
hh = 0.
p es el efecto producido por el p-simo nivel del factor letra griega. Dichos
efectos estn sujetos a la restriccin
p p = 0.
ij(hp) son variables aleatorias independientes con distribucin N(0, ).
La notacin yij(hp) indica que los niveles i y j determinan los niveles h y p para un
cuadrado greco-latino especicado. Es decir, los subndices h y p toman valores
que dependen de la celdilla (i, j).
Se utiliza la siguiente notacin:
N = K2 es el nmero total de observaciones.
El total y el promedio de todas las observaciones.

You might also like