You are on page 1of 428

UNIVERSIDAD AUTNOMA DE QUERTARO

CENTRO DE INVESTIGACIN EN MATEMTICAS, A. C.

M. en A. Ral Iturralde Olvera


Rector

Dr. Oscar Adolfo Snchez Valenzuela


Director General

Dr. Guillermo Cabrera Lpez


Secretario Acadmico

Dr. Daniel Hernndez Hernndez


Coordinador del rea de Probabilidad y Estadstica

Rest. en Arte Roberto Gonzlez Garca


Secretario de Extensin Universitaria

Mara Laura Rincn Gallardo Andrade


Directora de Planeacin e Informacin

Q.B. Magali Aguilar Ortiz


Directora de la Facultad de Qumica

L.D.G. Odalmira Elvira Soto Alvarado


Diseo Grfico

M. en H. Sergio Rivera Guerrero


Coordinador de Publicaciones

D.R. Universidad Autnoma de Quertaro,


Centro Universitario, Cerro de las Campanas s/n,
Cdigo Postal 76010, Quertaro, Qro., Mxico
ISBN: 978-607-7740-56-8
Primera edicin, Diciembre de 2010.
Hecho en Mxico
Made in Mexico

Diseo de Experimentos: Estrategias y Anlisis en


Ciencia y Tecnologa
Eduardo Castao Tostado(1)
(1)

Jorge Domnguez Domnguez(2)

Universidad Autnoma de Quertaro, Facultad de Qumica, Posgrado


Centro Universitario Quertaro, Quertaro, Mxico 76010
e-mail: ecastano@uaq.mx
(2)

Centro de Investigacin en Matemticas


Callejn de Jalisco s/n Valenciana, Guanajuato, Mxico 36027
e-mail: jorge@cimat.mx

ii

Contenido
Prefacio

vii

1 Planeacin de un diseo experimental


1.1 Introduccin . . . . . . . . . . . . . . . .
1.2 Propsito del diseo experimental . . . .
1.3 Estructuras del diseo experimental . .
1.4 Estrategia del plan experimental . . . .
1.5 El razonamiento estadstico de contraste
1.6 Inferencia estadstica y prctica . . . . .
1.7 Exactitud de tcnicas experimentales . .
1.8 Ejercicios . . . . . . . . . . . . . . . . .

. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
de hiptesis
. . . . . . .
. . . . . . .
. . . . . . .

2 Diseo con un factor


2.1 Factor con dos niveles . . . . . . . . . . . . . . . . .
2.2 Un factor con k 2 niveles . . . . . . . . . . . . . .
2.2.1 Anlisis de varianza . . . . . . . . . . . . . .
2.2.2 Modelo estadstico . . . . . . . . . . . . . . .
2.2.3 Formalizacin del ANDEVA . . . . . . . . . .
2.3 Validacin del modelo estadstico . . . . . . . . . . .
2.3.1 Anlisis de Residuales . . . . . . . . . . . . .
2.3.2 Vericacin del supuesto de homogeneidad de
2.3.3 Transformaciones . . . . . . . . . . . . . . . .
2.3.4 Determinacin del nmero de rplicas . . . .
2.4 Manejo de estructuras de diseo . . . . . . . . . . .
2.4.1 Restricciones a la aleatorizacin . . . . . . . .
2.5 Anlisis de Covarianza . . . . . . . . . . . . . . . . .
2.5.1 Caso general del anlisis de covarianza . . . .
2.6 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . .
iii

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

1
1
1
3
10
14
16
17
17

. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
varianzas
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

21
21
26
27
32
33
36
36
40
42
43
45
45
52
56
59

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

iv

CONTENIDO

3 Comparaciones mltiples
3.1 Recomendaciones iniciales . . . . . . . . . . . . . . . . . .
3.2 Intervalos de conanza: diferencia de tratamientos . . . .
3.3 Comparaciones planeadas entre dos medias . . . . . . . .
3.3.1 Prueba de Tukey . . . . . . . . . . . . . . . . . . .
3.3.2 Prueba de Dunnett: comparaciones con un control
3.3.3 Comparaciones mltiples con el mejor . . . . . . .
3.4 El estadstico de prueba de Sche . . . . . . . . . . . . .
3.4.1 Contrastes ortogonales . . . . . . . . . . . . . . . .
3.5 Formalizacin estadstica de la pruebas . . . . . . . . . . .
3.5.1 Prueba de Tukey . . . . . . . . . . . . . . . . . . .
3.5.2 Prueba de Dunnett . . . . . . . . . . . . . . . . . .
3.5.3 Intervalos de conanza de Sche para contrastes .
3.6 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

73
73
74
75
75
77
78
83
85
86
86
88
89
91

4 Estructura de tratamientos factorial


4.1 Anlisis con un solo factor . . . . . . .
4.2 Diseos con ms de un factor . . . . .
4.3 Factorial 22 . . . . . . . . . . . . . . .
4.3.1 Clculo de efectos . . . . . . .
4.3.2 Inferencia estadstica . . . . . .
4.4 Factorial 23 . . . . . . . . . . . . . . .
4.4.1 Clculo de efectos . . . . . . .
4.4.2 Inferencia estadstica . . . . . .
4.5 Factorial general de dos factores . . .
4.5.1 El anlisis de varianza para dos
4.5.2 Modelo estadstico . . . . . . .
4.6 Ejercicios . . . . . . . . . . . . . . . .

. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
factores
. . . . .
. . . . .

5 Estructura factorial fraccionada


5.1 Conceptos bsicos . . . . . . . . . . . .
5.2 Factorial 23 fraccionado . . . . . . . . .
5.3 Alias y resolucin . . . . . . . . . . . . .
5.4 Factorial 24 fraccionado . . . . . . . . .
5.5 Fracciones ms pequeas . . . . . . . . .
5.6 Criterio de aberrancia mnima . . . . . .
5.7 Anlisis de efectos confundidos . . . . .
5.7.1 Adicin de corridas . . . . . . . .
5.7.2 Tcnica de desdoble . . . . . . .
5.8 Generadores de fracciones en diseos 2k
5.9 Diseos de Plackett y Burman . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

95
95
98
100
100
105
107
107
109
120
121
125
127

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

139
139
140
144
146
149
152
153
153
158
163
164

CONTENIDO
5.9.1 Construccin del diseo PB . . .
5.10 Contribuciones de Taguchi . . . . . . . .
5.10.1 Cocientes seal a ruido . . . . .
5.10.2 Diseo robusto de parmetros . .
5.10.3 Arreglos ortogonales . . . . . . .
5.10.4 Doble arreglo ortogonal . . . . .
5.10.5 Un arreglo ortogonal combinado
5.10.6 Sistemas de seal - respuesta . .
5.11 Ejercicios . . . . . . . . . . . . . . . . .

v
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

201
. 201
. 209
. 209
. 212
. 214
. 216

7 Algunos diseos especiales


7.1 Diseo en parcelas divididas . . . . . . . . . . . . . .
7.1.1 Estimacin de varianzas con aleatorizacin en
7.1.2 Cundo debe aplicarse este tipo de diseo? .
7.2 Experimentos con mediciones repetidas en el tiempo
7.3 Diseos que involucran anidamiento . . . . . . . . .
7.4 Sobre errores de restriccin en la aleatorizacin . . .
7.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . .

. . . . . . .
dos etapas
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .

225
. 225
. 227
. 231
. 234
. 240
. 247
. 249

8 El modelo de anlisis de regresin


8.1 Introduccin . . . . . . . . . . . . . . . . . .
8.2 Modelos de primer y segundo orden . . . .
8.3 Estimacin de los Parmetros del Modelo .
8.4 Signicancia global de un modelo ajustado .
8.5 La vericacin de falta de ajuste . . . . . .
8.6 Tipos de diseos para optimizacin . . . . .
8.6.1 Diseos de primer orden . . . . . . .
8.6.2 Diseos de segundo orden . . . . . .
8.7 Ejercicios . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

6 Estructura de tratamientos factoriales 3k


6.1 Diseo factorial 3k y su anlisis estadstico . . . .
6.2 Factorial 3k fraccionado . . . . . . . . . . . . . .
6.2.1 Fraccin un tercio del factorial 33 . . . . .
6.2.2 Fraccin de un 3k por medio del cuadrado
6.2.3 Diseo Plackett - Burman para factoriales
6.3 Ejercicios . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

. . . .
. . . .
. . . .
latino
3k . .
. . . .

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

164
166
167
168
169
171
174
175
187

257
257
259
262
274
277
281
282
282
290

vi
9 Optimizacin estadstica del proceso
9.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . .
9.2 Ubicando a la regin ptima . . . . . . . . . . . . . .
9.3 Procedimiento de optimizacin . . . . . . . . . . . .
9.4 Caracterizacin del punto estacionario . . . . . . . .
9.5 Anlisis de lomas . . . . . . . . . . . . . . . . . . . .
9.6 Optimizacin de varias respuestas . . . . . . . . . . .
9.6.1 Mtodo de superposicin de curvas de nivel .
9.6.2 Funciones de deseabilidad . . . . . . . . . . .
9.7 Optimizacin aplicada al diseo robusto . . . . . . .
9.7.1 Optimizacin en funcin de factores de ruido
9.7.2 Esperanza de (y T )2 . . . . . . . . . . . . .
9.8 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . .

CONTENIDO

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

303
303
304
316
319
321
324
324
326
334
335
338
338

10 Diseos de experimentos con mezclas


10.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2 Denicin del problema . . . . . . . . . . . . . . . . . . . .
10.3 Diseos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10.3.1 Diseo smplex reticular (ltice) . . . . . . . . . . .
10.3.2 Diseos smplex centroide . . . . . . . . . . . . . . .
10.3.3 Diseos axiales . . . . . . . . . . . . . . . . . . . . .
10.4 Anlisis de experimentos con mezclas: el polinomio cannico
10.5 Diseos con restricciones factoriales . . . . . . . . . . . . . .
10.6 Preguntas en un experimento con mezclas . . . . . . . . . .
10.7 Factores de proceso . . . . . . . . . . . . . . . . . . . . . . .
10.8 Otros anlisis para diseos con mezclas . . . . . . . . . . .
10.8.1 Coecientes polinomiales . . . . . . . . . . . . . . .
10.8.2 Estimacin de parmetros en los polinomios {q; m} .
10.8.3 Vericar el grado del modelo ajustado . . . . . . . .
10.8.4 Carencia de Ajuste . . . . . . . . . . . . . . . . . . .
10.9 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

357
357
358
359
359
361
361
361
366
369
370
370
370
372
375
377
384

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

Apndices tcnicos
391
10.10Apndice Tcnico D . . . . . . . . . . . . . . . . . . . . . . . . . . 401
Referencias

405

Tablas

411

Prefacio
...Pues las causas me andan cercando
cotidianas, invisibles.
Y el azar se me viene enredando
poderoso, invencible.
Silvio Rodrguez

La planeacin es una actividad que permite ecacia, eciencia y efectividad


en el trabajo. En la investigacin experimental, la planeacin implica disear
el experimento. Pretendemos que al estudiar este libro, el estudiante adquiera
habilidades bsicas pero esenciales en el diseo de experimentos y en el anlisis
estadstico de los resultados generados.
Este libro surge de la experiencia de los autores tanto a nivel de enseanza
de la materia propia del texto, como de la experiencia prctica en el diseo de
experimentos en la investigacin experimental tanto a nivel industrial como a
nivel de ciencia y tecnologa. Esto ltimo se ve reejado en algunos ejemplos y
ejercicios. Est dirigido a usuarios de Estadstica y no a estudiantes de alguna
ciencia matemtica. Por ello, el nivel matemtico recomendado en general para
estudiar este libro es el de un estudiante tpico de ingeniera o de ciencias qumico
biolgicas, despus de haber tomado cursos de lgebra y de clculo. En el texto
principal no hay derivaciones matemticas, algunas de ellas se presentan en el
apndice tcnico. Por otra parte, no se presentan enfoques matemticos alternativos en el manejo de los datos; slo se presenta la mejor alternativa segn la
experiencia de los autores.
El nfasis es en los conceptos, objetivos por lograr y suposiciones, as como
en la interpretacin de resultados.
El contenido del texto est dividido en diez captulos, para un curso de 120
horas. El primer captulo desarrolla ideas y presenta conceptos importantes en la
prctica de disear experimentos reales. El segundo y tercer captulos presentan

viii

Prefacio

diseos adecuados cuando se estudia un solo factor, considerando o no restricciones en la aleatorizacin de tratamientos, as como el manejo de covariables.
Los captulos del cuatro al seis, presentan la teora sobre los diseos factoriales,
de manera esencial, factoriales con factores de dos y tres niveles y el uso de
fracciones correspondientes, as tambin se presentan los elementos de lo que se
conoce como diseo robusto de parmetros. En el captulo siete, se presentan
tres diseos de mucha importancia prctica, como el diseo en parcelas divididas, experimentos con mediciones repetidas en el tiempo y bsicos de diseos
anidados. En el captulo ocho se da una introduccin bsica al importante tema
del modelo de anlisis de regresin, que servir como herramienta en el captulo
nueve donde se presenta los elementos esenciales de la metodologa de supercie
de respuesta. Finalmente en el captulo diez se presentan elementos bsicos del
tema importante de diseo en experimentos con mezclas.
Como todo trabajo, este texto resulta de la unin de esfuerzos; agradecemos a todos aquellos que aportaron a este modesto texto, que pretende difundir
ms sobre una de las herramientas ms poderosas desarrollada por la comunidad
estadstica a lo largo de su historia. A nosotros nos toca agradecer a nuestros
maestros, tanto en la UNAM como en el IPN, que nos formaron. Agradecemos el
valioso aporte de nuestros estudiantes de la Maestra en Ciencia y Tecnologa de
Alimentos, del Programa de Posgrado de Alimentos del Centro de la Repblica
Mexicana (PROPAC) con sede en la Universidad Autnoma de Quertaro y de
la maestra en Ingeniera de Calidad de la Universidad Iberoamericana campus
Len.
Agradecemos a los experimentadores y empresas que han pensado como til
nuestra asesora.
Finalmente, pero no por ltimo, agradecemos profundamente a nuestros centros de trabajo, la Universidad Autnoma de Quertaro y el Centro de Investigacin en Matemticas, por dar el espacio para la escritura del presente texto.

Eduardo Castao Tostado


Jorge Domnguez Domnguez

Captulo 1

Planeacin de un diseo
experimental
La experiencia es la nica fuente de la verdad: slo ella puede
ensearnos algo nuevo; slo ella puede darnos la certeza.
H. Poincar

1.1

Introduccin

La planeacin es una actividad que permite ecacia, eciencia y efectividad en


el trabajo. En la investigacin experimental, la planeacin implica disear el
experimento. El diseo estadstico de un experimento da la posibilidad de que
ste sea realizado de una manera eciente, es decir, con el mnimo de recursos
materiales y tiempo. El diseo estadstico de experimentos se debe usar como
una metodologa que permite plantear distintas estrategias para seleccionar,
controlar, analizar e interpretar diferentes condiciones de estudio en un fenmeno
de una manera objetiva y sistemtica.

1.2

Propsito del diseo experimental

En el trabajo experimental se tiene en general una doble tarea; en primer lugar se deben disear e interpretar los experimentos propios; en segundo lugar
es necesario evaluar de manera crtica la informacin ya generada en trabajos
experimentales ajenos al propio. As, para esta doble tarea resulta esencial saber
si un experimento es propiamente concebido, controlado de la forma correcta,
adecuadamente analizado y correctamente interpretado.
Un buen diseo experimental es uno en el que los efectos de las condiciones
seleccionadas y manipuladas en el sistema experimental pueden ser cuanticados

1. Planeacin de un diseo experimental

Fig. 1.1: Esquema simplicado de un extrusor


y entendidos sin confusin con efectos ruidosos operando en el sistema experimental.
Con el n de motivar algunos conceptos, se considera como ejemplo al proceso
de extrusin, que en la actualidad se emplea en industrias como la de alimentos, de
plsticos y de la construccin, entre otras. Varios cientcos e ingenieros utilizan
este proceso a nivel de laboratorio para el desarrollo de nuevos productos. En
la Fig. 1.1 se puede observar el esquema de un extrusor; un producto extrudido
sufre alteraciones en sus caractersticas de calidad de acuerdo a las condiciones
de operacin del extrusor; entre las condiciones de operacin se puede mencionar
la temperatura de coccin, la velocidad de los tornillos sin n, la cantidad del
producto que entra al extrusor, el tipo o variedad del producto, el tiempo de
operacin, la forma de la placa de salida, el tipo de materia prima utilizada, el
operador y las condiciones ambientales.

Todos estas condiciones y otras an no consideradas debido al estado actual del conocimiento tecnolgico del proceso, dan lugar a mediciones de ciertas
caractersticas denominadas variables respuesta. Por ejemplo, en un producto
extrudido alimenticio, las respuestas podran ser un coeciente de textura, una
cantidad de protena, un porcentaje de humedad, todas medidas en el producto
nal de la extrusin. En este punto se plantea la necesidad de evaluar las condiciones de operacin que tienen un efecto signicativo en alguna de las respuestas
de inters. La variabilidad en las caractersticas del producto bajo produccin, y

1.3. Estructuras del diseo experimental

por lo tanto su calidad, es as dependiente de esas condiciones de operacin, y se


requiere cuanticar tal dependencia.
Una estrategia eciente para seleccionar, manipular e identicar las condiciones de operacin que tengan efectos en las caractersticas de calidad del producto requiere del diseo experimental.

1.3

Estructuras del diseo experimental

Estructura de Tratamiento
Factor. Una variable de inters controlada hasta cierto punto por el experimentador, de la que se desea estudiar sus efectos en una o varias respuestas.
Ejemplo: se desea medir la dimensin de un cilindro para evaluar su efecto sobre
la friccin en un sistema mecnico. Los factores pueden ser concebidos como
cualitativos o cuantitativos.
Nivel. Modalidad especca dentro de un factor. Ejemplo: si el factor es
el tiempo de operacin, el inters puede ser estudiar la respuesta del proceso
durante tres periodos diferentes, a saber 10, 30 y 50 seg. En este caso se dice que
el factor tiene tres niveles.
Tratamiento. Se reere a cada una de las combinaciones de los niveles de
varios factores aplicados conjuntamente a las unidades experimentales.
Estructura de tratamientos de un diseo experimental : Consiste en el conjunto
de tratamientos que el experimentador ha seleccionado para estudiar y/o comparar. Puede haber estructuras con un factor (OFAT) o varios factores; pueden
considerarse todos los tratamientos (diseo factorial) o un subconjunto del total
de tratamientos segn el inters (diseo factorial incompleto).
Efecto Principal. Indica la contribucin que cada factor tiene sobre las variables respuesta. sta se mide evaluando el cambio que se produce en la respuesta
al modicar los niveles del factor. Los efectos se pueden clasicar en efectos de
localizacin (sobre la media de una variable respuesta) y efectos de dispersin
(sobre la variabilidad de una variable respuesta). Si en el sistema experimental
se tiene un factor que tenga efectos de localizacin pero no de dispersin, se le
llama factor de ajuste.
Interaccin. Considerando los efectos sobre las variables respuesta bajo
estudio, la interaccin implica una relacin o dependencia entre los efectos de dos
o ms factores; por ejemplo para el caso de dos factores, si hay interaccin entre
stos, el efecto sobre la respuesta de uno de ellos depender del nivel del segundo
factor.
Ahora revisemos algunas deniciones y conceptos respecto a la estructura de
diseo.

1. Planeacin de un diseo experimental

Estructura de Diseo: manejo de ruido experimental


En trminos generales siempre hay ruidos circundantes al sistema experimental;
el ruido se reeja en la respuesta variante de lo que se conoce como unidad experimental. Unidad Experimental (UE): individuo, objeto o unidad de material
a la que se le aplica de manera independiente un tratamiento, a sta se le miden
las variables respuesta bajo estudio.
Conceptualmente el ruido se compone de tres fuentes: el error experimental,
el error de medicin y el error ambiental.
El error experimental es aquel que cada unidad experimental aporta de manera natural en un estudio. Este error experimental, inherente a cada unidad experimental, no es observable, pero se maniesta claramente al comparar unidades
experimentales igualmente tratadas, ya que stas mostrarn diferencias en sus respuestas.
El error de medicin tambin siempre presente, se caracteriza y acota mediante buenas prcticas de evaluacin de sistemas de medicin (ver por ejemplo
Burdick et al., 2003). Validado el sistema de medicin requerido en el estudio, al
error de medicin se le considera entonces como parte del error experimental.
Si se piensa que el ruido ambiental es slo error experimental, sus efectos
no deseados se pueden evitar mediante lo que se conoce como aleatorizacin de
tratamientos.
Aleatorizacin de tratamientos. Experimentar tiene como nalidad entender causas de por qu un fenmeno vara. La aleatorizacin es la base para
establecer si las variaciones observadas se deben al error experimental o a efectos
debidos potencialmente a factores de control en un sistema experimental. Si no
hay aleatorizacin en un experimento, se corre el riesgo de que las interpretaciones
de las variaciones no sean correctas. Dado que en todo sistema experimental existen efectos potenciales de factores de control y efectos del error experimental, y
se desea entender prioritariamente cmo los factores de control afectan, se debe
tener cuidado de no confundir efectos debidos al error con efectos de los factores
de control. Una forma de enfrentar esta confusin es mediante lo que se conoce
como aleatorizacin, es decir la asignacin aleatoria (objetiva) de los niveles de
factores de control (cada tratamiento) a cada unidad experimental.
Si se piensa que en el sistema experimental opera ruido ambiental importante
ms all del error experimental, es necesario su manejo eciente. En general hay
dos formas de manejar el ruido ambiental:
Acotar sus efectos no deseados, formando grupos de unidades experimentales (bloqueo) o midiendo covariables.
Utilizarlo para propsitos de robusticacin / generalizacin de los efectos
de factores de inters.

1.3. Estructuras del diseo experimental

Bloqueo Si el ruido ambiental tiene potencialmente efectos importantes en el


sistema experimental la aleatorizacin no podra garantizar la validez experimental, por lo que hay que acotar efectos nocivos del ruido formando grupos
de UE, cada grupo de UE con el mismo nivel de ruido ambiental antes de la
aleatorizacin de tratamientos. Ya formados los grupos aplicar los tratamientos
de manera aleatoria dentro de cada grupo. En este caso se dice que se realiza
una aleatorizacin con restricciones (dentro de los grupos homogneos de UE).
As, la estructura de diseo debe buscar el agrupamiento de UE, de tal manera que las condiciones bajo las que los diferentes tratamientos se asignen, sean
lo ms uniforme posible para permitir que slo las diferencias (potenciales) entre tratamientos se perciban con facilidad. Lo ideal es que todas las UE sean
homogneas antes de aplicarles el tratamiento. Alejndose de este ideal la estructura de diseo tender a complicarse para evitar que el ruido oscurezca las
comparaciones entre tratamientos de inters. Para ello se debe utilizar todo el
conocimiento disponible del ruido circundante a las UE. A esta estrategia de
acotamiento del ruido experimental se le denomina bloqueo.
Bloqueo: agrupacin de unidades experimentales de acuerdo al nivel del ruido
ambiental que reciben y por ende con relativa homogeneidad en su respuesta antes
de ser tratadas.
Dos suposiciones importantes de la agrupacin (bloquear) de UE son: primera,
se considera que los criterios para formar bloques de UE son tales que stos se
consideran provenientes de una poblacin hipottica de bloques, y por ende potencialmente los efectos de bloques son aleatorios. Es decir, no le interesan al
experimentador estos efectos por s mismos. Segunda suposicin: no hay interaccin entre los criterios para formar bloques y los tratamientos. Es decir, se
supone que las diferencias potenciales entre los tratamientos sern consistentes
de grupo a grupo (salvo variacin aleatoria).
Covariables La formacin de bloques representa una manera de acotar los
efectos del ruido circundante. Una alternativa para la formacin de bloques, es
medir el ruido ambiental durante el experimento, siguiendo un enfoque denominado anlisis de covarianza, donde se miden variables (denominadas en general
covariables) que covaran con la variable respuesta de las unidades exprimentales
antes de ser tratadas.
Robusticacin Si componentes del ruido ambiental no son slo medidos sino
son manipulados durante el experimento para poder cuanticar sus efectos, se
les estar dando un carcter de factores, as denominados "factores de ruido"; en
el captulo cinco se presentan diseos experimentales que involucran factores de
ruido. Dados factores de ruido en el sistema experimental, las interacciones se

1. Planeacin de un diseo experimental

pueden presentar entre factores de control, o entre factores de control y factores


de ruido, o entre factores de ruido, orden de importancia decreciente, respectivamente. Las interacciones entre factores de control se consideran ya sea para
entenderlas o para determinar la mejor combinacin de niveles de los factores
de control involucrados. La consideracin de las interacciones entre factores de
control y factores de ruido es ya sea para entender cmo afectan los factores de
ruido en los efectos de factores de control, o para seleccionar la mejor condicin
de control a pesar de los efectos de los factores de ruido. Esto constituye una
estrategia de robusticacin.

DISEO EXPERIMENTAL

8
>
>
>
>
>
>
<
>
>
>
>
>
>
:

Estructura de tratamientos
l
aleatorizacin (error experimental)
l
Estructura de diseo (ruido ambiental)
(bloqueo, covariable o factores de ruido)

La Tabla 1.1 muestra una breve clasicacin de los diseos experimentales de


acuerdo a sus estructuras, los cuales sern denidos y analizados a lo largo del
libro.
Estructura de tratamiento
un factor : (k niveles)
arreglo factorial : (dos o ms factores)
arreglo factorial fraccionado
arreglo factorial en parcelas divididas
arreglo factorial anidado

Estructura de diseo
completamente aleatorizado
bloques completamente aleatorizado
cuadro latino, grecolatino
bloques incompletos
parcelas divididas

Tabla 1.1 Diseos Experimentales de acuerdo a sus estructuras


Variacin experimental
Supongamos el caso de una variable respuesta denotada por y y que el experimento tiene como objetivo comparar k tratamientos en sus efectos sobre la media
de la variable respuesta. Para determinar si tales tratamientos son estadsticamente diferentes entre s, es decir vericar si la media de la variable respuesta
cambia al cambiar el tratamiento, se realizara un experimento: y11 ; y12 ; :::; y1n1 ;
y21 ; y22 ; :::; y2n2 ; :::; yk1 ; yk2 ; :::; yknk ; donde yij denota la respuesta en el tratamiento
i en la UE j que la recibi. Supongamos inicialmente que las UE son homogneas
en su respuesta antes de ser tratadas. A continuacin se escriben cuatro expresiones estadsticas tiles.

1.3. Estructuras del diseo experimental

Promedio del tratamiento i:

yi =

ni
P

yij

j=1

; i = 1; :::k

ni

Desviacin estndar del tratamiento i :


v
uP
u ni
u (yij y i )2
t j=1
Si =
;
ni 1

i = 1; :::; k

Promedio total:

ni
k P
P

yij

i=1 j=1
k
P

ni

i=1

Desviacin estndar combinada total:


v
u k
uP
u (ni 1)Si2
u i=1
Sp = u
u P
t k
(ni 1)
i=1

As las diferencias de inters por analizar seran de la forma (y i


y ); i =
1; :::; k: Numricamente hablando los k tratamientos se consideran iguales en sus
efectos sobre la variable respuesta, si sus diferencias versus el promedio total
y son iguales. Sin embargo que sean exactamente iguales no es posible en
experimentacin, por ello la pregunta relevante para el experimentador es:
Ms all del error experimental, hasta dnde considerar que las diferencias
(y i y ); i = 1; :::; k, indican diferencias entre tratamientos?
Para responder a esta pregunta se usan modelos estadsticos. Uno muy til
es el modelo estadstico lineal
yij =

+ "ij

(1.1)

para modelar a la variacin en y11 ; y12 ; :::; y1n1 ; y21 ; y22 ; :::; y2n2 ; :::; yk1 ; yk2 ; :::;
yknk ; donde i representa el valor medio de y en el tratamiento i y "ij representa

1. Planeacin de un diseo experimental

un error experimental correspondiente a la UE j que recibi aleatoriamente el


tratamiento i. Note que el componente representa los factores a ser manipulados
en el experimento representando as el componente sistemtico de y; mientras que
el componente " representa la parte no sistemtica, natural, pero no importante
de y. Con este modelo, la pregunta anterior se plantea contrastando la hiptesis
H0 :

= ::: =

con los datos. Es decir, observando qu tanto apoyan los datos a la hiptesis de
que las respuestas medias de los k tratamientos son iguales (la llamada hiptesis
nula).
Para realizar tal contraste exitosamente, se debe manejar adecuadamente al
ruido ambiental. Si el diseo identica factores de control y de ruido pertinentes
en el sistema experimental a travs de i ; el trmino "ij representa al error
experimental y entonces es una perturbacin pequea y con variacin independiente del tratamiento aplicado o del ruido del ambiente circundante. Con ello
es plausible suponer "ij es una variable aleatoria con media 0 y varianza 2
constante.
En el modelo (1.1) lo que no se reconozca como parte de i ir a "ij : Este
trabajo de reconocimiento y uso de fuentes de variacin es la esencia de un buen
diseo experimental. As, si tal reconocimiento de fuentes de variacin es exitoso,
2

V (y i ) =

ni

; i = 1; :::; k:

(1.2)

Es decir, la variabilidad de cada promedio slo depender de la variabilidad del


error experimental y del nmero de rplicas del tratamiento correspondiente. Si
en el experimento por realizar la identicacin de fuentes de variacin importantes no es exitoso, la estimacin de (1.2) por medio de los datos experimentales
ser inada, con consecuencias en la precisin para detectar diferencias entre
tratamientos.
Entonces, a la vista de V (y i ); un buen diseo experimental debe primordialmente controlar la variacin experimental por medio de la estimacin eciente de
2 a travs del reconocimiento a priori, y de manera adecuada, de las fuentes de
variacin presentes en el experimento, materia sobre la que versa este texto.
En segundo lugar un diseo experimental controlar la variacin experimental
a partir del nmero de rplicas. Una rplica consiste en la aplicacin repetida
e independiente de un tratamiento a distintas UEs. Contar con rplicas da las
siguientes ventajas:
El experimentador tiene una estimacin de 2 , necesaria para realizar contrastes de hiptesis y construir intervalos de conanza para comparar sus
tratamientos.

1.3. Estructuras del diseo experimental

Permite reducir la variabilidad de los promedios, ya que, como se vio en


(1.2), la varianza de yi depende del nmero de replicaciones ni .
Puede incrementar el rango de inferencia del experimento, seleccionando
y usando apropiadamente UE menos homogneas, o no controlando condiciones ruidosas circundantes. Este aspecto es clave en la diferencia entre
un experimento cientco bsico y uno tecnolgico o ingenieril.
Posibilita ejercer control sobre la variabilidad del error, ya que la rplica
nos impone restricciones que nos llevan a agrupar UE de acuerdo a su respuesta esperada en ausencia de tratamiento y as asignar la variacin total
entre UE de tal manera que sea maximizada la variabilidad entre grupos y
simultneamente minimizada dentro de grupos.
Las condiciones que determinan el nmero de rplicas son:
La precisin requerida en el experimento, es decir, qu tan pequeas son
las diferencias entre medias que se desea detectar por medio de ste. Entre
menor sea la desviacin de la hiptesis nula a ser medida o detectada, mayor
el nmero de rplicas requeridas.
Respecto al material que compone a las unidades experimentales, la variabilidad en algunos materiales es mayor que en otros. Entre ms variable,
ms replicaciones, y viceversa. Por ejemplo, experimentos con materiales
vivos requerirn en general el uso de un mayor nmero de rplicas.
El nmero de tratamientos afecta la precisin de un experimento. Si el
nmero de tratamientos aumenta y el nmero de rplicas por tratamiento
se mantiene constante, de cualquier manera incrementa el tamao del experimento, as como los grados de libertad para estimar 2 . En este caso la
precisin del estimador mejora.
Si la precisin alcanza un grado ms alto del requerido, se puede bajar el
nmero de rplicas. Si el nmero de tratamientos aumenta pero se mantiene
constante el tamao del experimento, es decir el mismo nmero de rplicas
a repartirse entre los diferentes tratamientos, habr obviamente menos por
tratamiento y menos grados de libertad para el estimador de 2 , con lo que
la precisin ser ms pobre.
El diseo experimental tambin puede afectar la precisin de un experimento y el nmero de rplicas requeridas. Dependiendo del diseo se
puede disminuir o aumentar el nmero de rplicas.

10

1. Planeacin de un diseo experimental

En el Captulo 2 se dar un mtodo para el clculo del nmero de rplicas.


Desafortunadamente el nmero de rplicas est en muchos casos determinado por
consideraciones econmicas y de tiempo para llevar a cabo el experimento. Sin
embargo, no tiene caso realizar un experimento si la precisin requerida no es
obtenible con los recursos a la mano. La solucin es posponerlo hasta reunir
los fondos necesarios, o reducir el nmero de tratamientos de tal forma que sucientes replicaciones (precisin) estn disponibles para los tratamientos restantes.
El nmero prctico de replicaciones es cuando el costo del material no es compensado por el incremento en la informacin ganada. De cualquier manera, ms
adelante tambin se presentar una forma de analizar experimentos sin rplicas
de tratamientos.
Muchas veces los investigadores usan muestras duplicadas o partidas para
generar rplicas, cuando en realidad son submuestras o mediciones repetidas.
Por ejemplo, comparando la capacidad de tres conservadores para inhibir el crecimiento de hongos sobre cierto tipo de pastel, el investigador prepara un pastel
mezclado con cada conservador. Despus de 9 das de almacenamiento, el nmero
de esporas de hongo por cm3 de pastel es medido. El investigador requiere de 10
rplicas por lo que pudiera partir el pastel en 10 partes. Sin embargo estas 10
mediciones no son resultado de 10 aplicaciones independientes del conservador,
reejando slo la variabilidad dentro de cada pastel. Para tener 10 rplicas (y
captar as la variacin entre pasteles con el mismo tratamiento), el investigador
necesita cocinar 10 pasteles con cada conservador, cada uno mezclado de manera
independiente del resto. Una forma de determinar la diferencia entre una submuestra y una rplica: si el experimentador pudiera obtener ms replicaciones
slo particionando ms a una UE, entonces lo que se tiene son submuestras y no
rplicas verdaderas.
Es muy importante distinguir entre replicaciones y submuestras ya que, observando (1.2), si ni representara al nmero de submuestras, la varianza de cualquier
promedio sera subestimada, con lo que se dira, errneamente, que la precisin de
yi aument. Esto tendra consecuencias en el proceso de determinar diferencias
estadsticamente. A las submuestras tambin se les conoce como pseudoreplicaciones.

1.4

Estrategia del plan experimental

La ausencia de diseo estadstico es una consecuencia de una planeacin experimental descuidada o ausente, no slo de la ignorancia de mtodos estadsticos.
Vivimos en una cultura que, a la fecha, no ve con buenos ojos los procesos de
planeacin. Las razones que se argumentan son variadas: lo impredecible del
medio circundante muy cambiante en que vivimos, las polticas inestables del

1.4. Estrategia del plan experimental

11

gobierno, cambios repentinos de clientes, proveedores, etctera.


Sin embargo, y quizs paradjicamente, planear es en un sentido amplio,
generar de una manera ordenada alternativas ante la incertidumbre de los futuros acontecimientos; de esta manera ante mayor incertidumbre, es necesario un
esfuerzo eciente y ecaz de planeacin.
Estos problemas culturales se traducen en la prctica cientca y/o tecnolgica
en un pobre, si no ausente, esfuerzo de diseo experimental.
Un enfoque sistemtico para planear y realizar un experimento consta de los
siguientes pasos:
Reconocimiento y/o planteamiento del problema.
Seleccin de los factores de estudio y determinacin de los niveles.
Seleccin de la variable de respuesta.
Plantear y efectuar el diseo experimental.
Anlisis de datos.
Conclusiones y recomendaciones.
Los primeros tres pasos constituyen la etapa de planeacin previa al experimento. Para el diseo eciente de experimentos es recomendable tener clara
explcitamente, mediante el dilogo en un equipo de trabajo multidisciplinario,
la siguiente informacin por escrito en el protocolo experimental:
1. Ttulo del experimento: en donde se exprese de manera sinttica el cuerpo
sustancial de la experimentacin.
2. Objetivos: bsqueda de consensos claros y operables. Esto es ms difcil de
lo que parece inicialmente. Los objetivos deben reunir ciertas caractersticas, entre stas se citan las siguientes: deben ser establecidos a partir de
perspectivas diversas, para que cuando los datos sean generados, hablen
por s mismos. Deben ser especcos y medibles, es decir, deben ser claros
y operables. Deben tener consecuencias prcticas, esto es, que algo se podr llevar a cabo de manera diferente como consecuencia de los resultados
experimentales. Es decir un experimento es un gasto de recursos para algo.
Por ejemplo, un mal objetivo se describe mediante la siguiente situacin:
mostrar que el catalizador z14 trabaja mejor que el catalizador z12, si el
operador ajusta el voltaje del electrodo exactamente. Un mejor objetivo
consiste en cuanticar la diferencia en eciencia A, entre el catalizador z14
y el catalizador z12 con voltajes de electrodos 7, 8 y 9 en el proceso de

12

1. Planeacin de un diseo experimental


conversin X, y evaluar el signicado estadstico (al 95%) y el signicado
prctico (A>3%), quizs justicando econmicamente un catalizador sobre
otro.
3. Apoyos relevantes para los objetivos: estos se reeren a la informacin de
experimentos previos, datos rutinariamente recolectados, informacin sobre leyes fsicas o informacin proveniente de opiniones de expertos. Estos
tipos de informacin son tiles para establecer un contexto y entender qu
conocimiento y/o tecnologa nuevos pueden ser adquiridos. Adems permitir motivar un dilogo acerca del conocimiento del rea que pueda cambiar
consensos previos y as posiblemente cambiar el experimento.
4. Consideraciones sobre la variable respuesta: reconociendo los objetivos de
la experimentacin. Estudie e identique los mecanismos fundamentales
que afecten a los objetivos. Finalmente seleccione las respuestas que incrementen la posibilidad de entender los mecanismos. De ser bien seleccionada la variable respuesta, se tendrn mayores posibilidades de que la
relacin con los factores bajo estudio sea simple y de orden bajo, posibilitando que la informacin obtenida por el experimento, sea clara respecto a
los efectos principales a travs de mtodos simples de anlisis. En general
se recomienda que la variable respuesta sea:
Numrica, ya que aporta mayor informacin.
Completa, en el sentido que provea toda la informacin requerida para
entender los mecanismos bsicos que conlleven al cumplimiento de las metas
del experimento.
Por ejemplo, si el problema es eliminar el bajo peso de barras de jabn
producidas en un proceso, si se selecciona al peso de las barras como respuesta, no se identicar a los mecanismos y leyes fsicas para controlar
el peso de la barra durante su produccin. El peso es el producto de la
densidad y el tamao; la densidad se debe al proceso de mezclado con aire
y el tamao se debe a las coordenadas x-y-z que impone el instrumento de
corte del lote de jabn. Las variables respuesta adecuadas son entonces la
densidad y las dimensiones x-y-z de las barras de jabn, y no el peso.
Prctica, en el sentido que sea fcil de medir con una frecuencia razonable.
Elemental, es decir, que no tenga fuerte inuencia de condiciones que se
encuentren fuera del sistema experimental especicado.
Independiente de valores impuestos, es decir, si no est confundida con
cualquier valor que no sea inherente a la fsica del sistema. Dos ejemplos

1.4. Estrategia del plan experimental

13

de esta situacin son: 1. Valores objetivos de acuerdo a especicaciones


del producto requeridos por el comprador. 2. Como respuesta el tomar
% de defectuosos depende de especicaciones sobre qu es un defectuoso.
Variables respuesta dependientes en su cmputo de condiciones ajenas al
sistema experimental especicado, pueden provocar la presencia de interacciones y de curvatura espuria en la relacin de la respuesta con los factores
en juego en el experimento.
5. Consideraciones sobre factores. En general es importante diferenciar entre
dos diferentes tipos de factores. Un factor se considera de un cierto tipo
atendiendo a la magnitud de su inuencia sobre la variable respuesta y a
su grado de controlabilidad en la prctica real. Podemos hablar en general
de dos tipos de factores:
Factores de control: aquellos de los que se piensa que son muy inuyentes en la variable respuesta y son controlables en la prctica; son
los factores que interesa manipular explcitamente en el experimento
en regiones experimentales de utilidad al experimentador.
Factores de ruido: factores que son inuyentes, pero que no pueden
ser controlados en la vida real. Es decir, estn en el ambiente pero son
considerados a lo largo del experimento, ya sea para bloquear sus efectos, o para explcitamente cuanticarlos (covariables). Tambin son
considerados para aprovechar sus efectos de interaccin con factores
de control en una estrategia de robusticacin, esto es, para ubicar a
los factores de control en donde el efecto del ruido se vea aminorado.
6. Consideraciones sobre interacciones. Las siguientes preguntas son tiles:
En general, dos factores interactan, si los efectos de uno sobre la
variable respuesta dependen de los niveles del otro.
Hay interacciones que estn justicadamente ausentes en el experimento?
Hay interacciones que deban ser estimadas sin confusiones con efectos
principales?
Existen ciertos niveles de los factores de control en los que el efecto
en la respuesta de los factores de ruido es reducido?
7. Restricciones sobre el experimento. Preocupaciones sobre: facilidad de cambios en factores de control (hard to change factors), mtodos de medicin
/ adquisicin de datos, materiales, nmero de pruebas, tipo de unidad experimental, regiones experimentales ilegales o irrelevantes, lmites a la

14

1. Planeacin de un diseo experimental


aleatorizacin, orden de las pruebas, costos asociados a cambios en los factores de control durante el experimento, etc.
8. En funcin de las estructuras de tratamiento y diseo se escoge un esquema
experimental. Considere si por algn criterio existen preferencias en los diseos estadsticos y sus razones. Por ejemplo, en el rea de experimentacin
con animales de granja es muy utilizado el diseo de bloques en parcelas
divididas.
9. Una vez revisado lo anterior se procede a generar una propuesta de anlisis
y tcnicas de presentacin de datos.

10. Responsable del experimento.


11. Pruebas iniciales o piloto, si las habr o no y sus razones. Generalmente
se utilizan para estimar de manera preliminar la varianza del error experimental y/o anar el uso de tcnicas experimentales.
12. Experimento. Se realiza el trabajo experimental y con ello se obtienen los
datos.
13. Anlisis de datos e inferencia estadstica / cientca / tecnolgica a partir
de datos.
14. Conclusiones y recomendaciones. Como producto del anlisis, no es difcil
imaginar que nuevas cuestiones pueden surgir, por lo que, se puede plantear
la necesidad de realizar nuevas investigaciones.

1.5

El razonamiento estadstico de contraste de hiptesis

Es de suma importancia entender el razonamiento estadstico para poder realizar


inferencia estadstica. Un procedimiento conable en la estadstica inferencial es
el llamado contraste de hiptesis. Un investigador est interesado en la diferencia entre la respuesta producida por un sistema intacto y la respuesta del mismo
sistema pero modicado en algn sentido de inters. l necesita saber si tal
diferencia observada se debe al error experimental o si es debida a la modicacin realizada. As, de manera retrospectiva, si se recolecta la informacin de
experimentos realizados
En sistemas anlogos.
Con la misma modicacin.

1.5. El razonamiento estadstico de contraste de hiptesis

15

En los que se sepa que tal modicacin no produjo diferencias.


Con esta informacin se podra construir un histograma de referencia como
el que se muestra en la Fig. 1.2. Ante este histograma la diferencia observada
por el investigador puede ser comparada: si es muy chica o muy grande, esto
es evidencia de que en el experimento actual la diferencia es diferente de cero.
Por ejemplo, si la diferencia observada actualmente fuera 3, sera indicativo de
una diferencia real (diferencia de cero estadsticamente), entre el sistema intacto
y el sistema modicado, ya que en un contexto experimental un valor de 3 es
muy poco frecuente en el conjunto de datos de referencia. Pero si sta es 0.3
sera indicativo, comparando con el histograma, de que la modicacin actual no
produjo una diferencia signicativamente diferente de cero.

Histograma de porcentajes del conjunto de experimentos de referencia en los


que la modicacin no implica diferencia importante (no signicativa)
En este sentido, el contar con un histograma de referencia con tales caractersticas, dara la posibilidad de que se pueda conducir un experimento y de que
raramente se falle al juzgar su resultado, al compararse con tal histograma, como
estadsticamente signicativo o no. Hablando de manera realista, el conseguir
tales histogramas de referencia es imprctico por las siguientes razones:
Se requiere que tal conjunto tenga un gran nmero de experimentos similares, en general ms de 30.
La obtencin de tal conjunto es retrospectiva, es decir que muchos de los
experimentos en tal conjunto habrn sido generados bajo condiciones no totalmente comparables con el experimento actual, por lo que podran sesgar
las conclusiones.
En muchos casos no existen experimentos previos similares.

16

1. Planeacin de un diseo experimental

Suponiendo aleatorizacin en el experimento, y con base en la teora de la


probabilidad, matemticos destacados han ideado leyes de probabilidad que sirven para construir histogramas de referencia vlidos prospectivamente para
una gran variedad de tipos de experimentos. Tales son, por ejemplo, las leyes
de probabilidad Normal de Gauss, t de Student y F de Fisher. Estas leyes,
entre otras disponibles, sirven entonces para determinar, segn las condiciones
experimentales, si un resultado es estadsticamente signicativo o no, y permiten
adems cuanticar una probabilidad de ocurrencia de tal resultado bajo la hiptesis de nulidad de efecto de la modicacin del sistema, tarea que es parte de lo
que se conoce como inferencia estadstica.

1.6

Inferencia estadstica y prctica

Existen dos tipos de inferencias (generalizaciones) necesarias en todo trabajo


experimental, la inferencia estadstica y la inferencia prctica (tecnolgica / cientca) en el contexto. Para explicar estos dos tipos de inferencias consideremos
las siguientes deniciones:
Poblacin o proceso objetivo: poblacin o proceso sobre el que se quieren
generalizar las conclusiones del experimento.
Poblacin o proceso bajo estudio: poblacin o proceso sobre el que se pueden
generalizar estadsticamente los resultados de un experimento.
Por ejemplo, en un estudio de desarrollo tecnolgico de optimizacin de una
aleacin de latn para recubrimientos de inters para varias empresas, se sabe
en teora que en tal aleacin se deben contemplar las proporciones adecuadas
entre sus componentes (proceso objetivo); sin embargo, si slo se puede trabajar
con un proceso de aleacin en particular, debido a la gran gama de dicultades
para estudiar tales procesos en diferentes empresas, el proceso bajo estudio es el
de la empresa en la que se realicen los experimentos. La inferencia estadstica
se circunscribir a las condiciones de tal proceso particular ya que este proceso
difcilmente ser una muestra representativa de todos los procesos de todas las
empresas interesadas. Entonces la inferencia estadstica (inductiva) slo podr
hacer armaciones sobre el tipo de proceso particular. La inferencia estadstica
se apoya en la aleatorizacin que permite construir un contexto probabilstico de
referencia para juzgar los resultados experimentales en relacin a una hiptesis.
Como ya se mencion, por fortuna, tales contextos de referencia son bien aproximados por distribuciones de probabilidad conocidas en el campo estadstico.
Por otro lado, la inferencia prctica es aquella que intentar generalizar los re-

1.7. Exactitud de tcnicas experimentales

17

sultados del proceso bajo estudio a todos los procesos de las empresas interesadas
del ramo. Por supuesto esta generalizacin, que en principio no es estadstica,
tendr que considerar aspectos que estn fuera de la estandarizacin propia del
proceso originalmente estudiado.

1.7

Exactitud de tcnicas experimentales

Las tcnicas en un experimento deben ser cuidadosamente estandarizadas antes


de realizar cualquier experimento. Ningn anlisis estadstico o de otro tipo
puede mejorar los datos obtenidos de un experimento pobremente realizado.
En general, la variacin proveniente de tcnicas descuidadas, no obedece leyes
aleatorias en las que la inferencia estadstica est basada. Este tipo de variacin
puede llamarse inexactitud, en contraste con una carencia de precisin (o sensibilidad).
Es recomendable observar sobre la tcnica experimental lo siguiente:
Que sea aplicada de manera estandarizada.
Que se ejerza control sobre inuencias ambientales de tal manera que todos los tratamientos produzcan sus efectos bajo condiciones comparables y
deseables.
Que est basada en un sistema de medicin conable.
Error de medicin acotado y controlado.
Errores gruesos sistemticos poco problables.
Por ello, a pesar de que con la aleatorizacin se garantiza la validez de las
pruebas estadsticas, para efectos prcticos hay que asegurarse de que la tcnica
experimental y el sistema de medicin estn correctamente aplicados durante el
experimento.

1.8

Ejercicios

Ejercicio 1.1 En una empresa de 50 empleados, un gerente tiene inters en


aumentar el rendimiento de trabajo de los stos. Para lograr este objetivo, se
establece un programa de capacitacin por dos meses. La evaluacin del xito de
sta se consigue comparando los rendimientos antes y despus del programa. La
evaluacin del rendimiento se obtiene mediante la aplicacin de un cuestionario
apropiado para las actividades que se desarrollan en la empresa; en ste tambin se
considera la eciencia. La variable de respuesta es el nmero de puntos alcanzados
en el cuestionario, y se calica de 0 a 100.

18

1. Planeacin de un diseo experimental


1. Seale dos estrategias experimentales que le permitan evaluar el xito del
programa.
2. Cul es la hiptesis estadstica que permite evaluar la eciencia del programa? La hiptesis es la misma en ambos casos? Interprete su planteamiento.
3. Qu procedimiento seguira para contrastar la hiptesis? Es el mismo en
ambos casos?

Ejercicio 1.2 A continuacin se da una serie de planteamientos donde interviene alguna cuestin experimental. Indique la estrategia experimental que usara
para los siguientes cinco casos, d sus razones, observen caractersticas especiales
en estos ejemplos:
1. En un estudio de ausentismo en una fbrica, los tratamientos son los tres
cambios de turno.
2. Para estudiar la productividad de los empleados en una compaa grande,
los tratamientos son aplicados a grupos de 10 de un gran nmero de stos.
3. Se estudia los retiros anticipados como prstamos de salario mensual, los
tratamientos son cuatro planes de prstamo para los empleados.
4. En el estudio del desgaste de las 16 llantas de un camin, los tratamientos
son cuatro marcas de llantas aplicados a 4 seleccionadas de stas al azar.
5. Supngase que una compaa tiene inters en ahorrar consumo de energa
elctrica.
Ejercicio 1.3 Proponga una situacin considerando el rea de trabajo o de
inters que requiera la utilizacin de un procedimiento experimental con la nalidad de resolver un problema. Ilustre su procedimiento, siguiendo los primeros 9
pasos descritos en la seccin 1.4.
Ejercicio 1.4 Busque en una revista de su rea de trabajo algn artculo donde
describan la realizacin de un experimento. Verique los siguientes puntos.
1. Se dene y plantea el problema a estudiar?
2. Es clara la hiptesis de investigacin?
3. Se puede percibir con claridad el diseo experimental?

1.8. Ejercicios

19

4. Se describe la unidad experimental, seala el proceso de aleatorizacin y


el nmero de replicaciones?
5. Se muestra con claridad el procedimiento de anlisis estadstico?
6. Haga un comentario general sobre el artculo.
Ejercicio 1.5 Redacte con sus propias palabras los elementos que se deben
considerar para realizar un buen experimento.
Ejercicio 1.6 (Hinkelmann y Kempthorne, 1994) Se desea realizar un experimento exploratorio con el propsito de estudiar y comparar el efecto de cuatro
contaminantes en arbolitos de pino. Un contaminante de carbn (C1 ) se us
como control, adems se incluyeron los siguientes contaminantes: ozono (C2 ),
dixido de sulfuro (C3 ) y dixido de nitrgeno (C4 ). Se cuenta con 16 arbolitos y
se asignarn 4 a cada contaminante. Suponga que los arbolitos tienen la misma
edad, una altura uniforme y se les fumiga con una misma cantidad, razonable, de
contaminante. Proponga algunos diseos experimentales que resulten adecuados
para evaluar ese efecto.
Ejercicio 1.7 Un ingeniero industrial desea conocer el efecto que tienen en la
preferencia del pblico consumidor cinco procedimientos para elaborar helado.
La variable de respuesta es un valor numrico que se obtiene a travs de una
evaluacin sensorial. A partir de este planteamiento proponga varios diseos
experimentales, segn los factores que puedan ser importantes. Argumente sus
respuestas.
Ejercicio 1.8 En el tratamiento del cncer de pecho, cul es el tratamiento
preferido para cncer de pecho que es detectado tempranamente? El tratamiento
ms comn fue alguna vez la mastectoma (removerlo del pecho). Ahora lo usual
es remover el tumor y nodos linfticos cercanos, seguido por radiacin. Para
estudiar cualquiera de estos tratamientos que dieren en su efectividad, un grupo
mdico examina los registros de 25 hospitales grandes y compara los tiempos de
sobrevivencia despus de que todas las mujeres hayan recibido algn tratamiento.
1. Cules son los factores y la variable respuesta?
2. Explique cuidadosamente, por qu este estudio no es un experimento?
3. Piensa que este estudio mostrar si la mastectoma causa un promedio de
vida ms grande? Explique su respuesta cuidadosamente.

20

1. Planeacin de un diseo experimental

Ejercicio 1.9 Mejor maz? Nuevas variedades de maz con contenido de


aminocido alterado pueden tener un valor nutricional ms alto que el maz estndar, el cual es bajo en aminocido. Un experimento compara dos nuevas
variedades, llamadas opaque-2 y oury-2, con maz normal. Los investigadores
mezclan dietas con maz, usando cada tipo de ste en tres niveles de protena:
12% protena, 16% protena y 20% protena. Ellos dan cada dieta a 10 pollos
machos y recogen sus pesos despus de 21 das. El peso del pollo es una medida
del valor nutricional de su dieta.
1. Cules son las unidades experimentales y las variables respuesta en este
experimento?
2. Cuntos factores son?, cuntos tratamientos? Use un diagrama para
describir los tratamientos.
3. Cuntas unidades experimentales requiere el experimento?

Captulo 2

Diseo con un factor


Lo conocido es nito, lo desconocido innito; desde el punto de
vista intelectual estamos en una pequea isla en medio de un ocano
ilimitable de inexplicabilidad. Nuestra tarea en cada generacin es
recuperar algo ms de tierra.
T.H. Huxley
El objetivo principal en este captulo es plantear diseos experimentales y
su correspondiente anlisis estadstico, cuando se tiene una situacin en donde se
considera estudiar los efectos que sobre una variable respuesta tienen los niveles de
un solo factor. Esta estructura unifactorial presenta una variedad de posibilidades
de diseos experimentales atendiendo a la estructura de diseo apropiada.

2.1

Factor con dos niveles

El primer diseo experimental que discutiremos atiende a una estructura de diseo en la que se supone que durante el experimento por realizar no habr inuencias importantes del ruido experimental, ms all del error experimental, que
hagan necesario el agrupamiento de UE o medicin de covariables. Con esto se
considerar en este diseo que las UE se pueden tener en cuenta como un solo
grupo homogneo, por lo que no ser necesario sujetar la aleatorizacin de los
tratamientos (en este caso los niveles del factor) a restricciones, es decir, se llevara
a cabo la aleatorizacin sin restricciones en la forma de asignar los tratamientos a las UE. A este tipo de diseo se le denomina unifactorial completamente
aleatorizado.

22

2. Diseo con un factor

Ejemplo 2.1
Debido a la importancia de las propiedades que tiene un plstico para conservar
alimentos, una compaa alimentaria tiene inters en disminuir la transferencia
de humedad entre el alimento y el ambiente en funcin del plstico. Se propone
a nivel de laboratorio estudiar un nuevo plstico elaborado con zenas. Entonces
se puede plantear la siguiente hiptesis:
El nuevo plstico disminuir la transferencia de humedad en comparacin con
el plstico actualmente utilizado.
La permeabilidad al vapor de agua (pva) es la variable respuesta que caracteriza a la transferencia de humedad; por consideraciones tecnolgicas pva debe
tener un valor lo ms bajo posible. Suponga que en promedio el plstico actual
tiene un pva de 1 ; pensemos que el nuevo plstico tenga un pva en promedio
de 2 : Se requiere entonces determinar empricamente si la diferencia de medias
1
2 es igual a cero o no. El planteamiento estadstico correspondiente es
contrastar las siguientes hiptesis:
Hiptesis Nula (no hay efectos diferentes de los dos tratamientos)
H0 :

2 (=

) (o equivalentemente,

= 0)

(2.1)

Hiptesis Alternativa (los dos tratamientos producen diferentes medias)


H1 :

6=

2:

(2.2)

En el ejemplo se puede observar que el factor de control es el tipo de plstico,


e interesa comparar el plstico actual y el propuesto en relacin al pva; en general
se desea estudiar una variable respuesta en relacin al efecto de dos niveles de un
factor.
La estrategia experimental en esta situacin es sencilla, consiste en elaborar
diferentes pelculas de plstico considerando el tratamiento actual y el propuesto
de manera independiente. Con cada uno de ellos se realizan aleatoriamente 14
muestras de pelculas. Las 14 mediciones de pva que se generaron en los dos
tratamientos se presentan en la Tabla 2.1, donde yij representa la pva medida en
la j-sima UE del tratamiento i; i = 1; 2; j = 1; 2; :::; 14.

Despus de realizar el experimento, un resumen estadstico de los datos que se


obtuvieron se muestra en la Tabla 2.2; con esta informacin se podr probar

2.1. Factor con dos niveles

23

estadsticamente si existe diferencia signicativa entre los dos tratamientos.


Plstico actual
y11 = 32
y18
y12 = 31
y19
y13 = 31 y1;10
y14 = 38 y1;11
y15 = 43 y1;12
y16 = 41 y1;13
y17 = 28 y1;14

= 31
= 39
= 43
= 37
= 34
= 34
= 32

Plstico nuevo
y21 = 22
y28
y22 = 21
y29
y23 = 25 y2;10
y24 = 36 y2;11
y25 = 34 y2;12
y26 = 30 y2;13
y27 = 15 y2;14

= 30
= 24
= 29
= 34
= 25
= 36
= 31

Tabla 2.1 pva con plstico actual y plstico nuevo

ni
yi
Si2
Si

Plstico actual
14:00
35:29
23:76
4:87

Plstico nuevo
14:00
28:00
38:92
6:24

Tabla 2.2 Resumen estadstico


Para contrastar la hiptesis (2.1) vs (2.2), es necesario hacer algunos supuestos,
sobre los cuales se construye el estadstico de prueba. Los supuestos son:
La variable respuesta (pva) correspondiente a cada uno de los dos tratamientos tiene medias 1 y 2 respectivamente, potencialmente diferentes.
Si yi representa a la respuesta ante el tratamiento i, se supone un modelo
tal que
yi = i + "; i = 1; 2
representa la parte sistemtica del modelo, y " el llamado error experimental.
i

As se supone de " que:


Tiene media igual a 0.
Su varianza en cualquier tratamiento es constante, digamos igual a
2 (homogeneidad de varianzas).
Como variable aleatoria es descrita adecuadamente por la funcin de
densidad Normal. Bajo los supuestos anteriores, ya con los datos, se
tendr el modelo
yij =

+ "ij ; "ij

N 0;

; i = 1; 2; j = 1; 2; :::ni :

24

2. Diseo con un factor


Otro supuesto adicional es entonces que los "ij son mutuamente independientes. Esto equivale a decir que cmo se maniesta el error
experimental en una UE, no tiene que ver con cmo se maniesta en
otra UE.

A partir de los supuestos anteriores se ha podido desarrollar el procedimiento


de prueba de hiptesis. El estadstico de prueba de H0 versus H1 ; evala la diferencia de promedios y 1 y 2 (la diferencia entre tratamientos). Como estudiamos
en el captulo anterior, la variabilidad debida al error experimental, denotada
por 2 ; es la variabilidad que no es posible explicar; as 2 denota a la variacin
mnima de referencia para evaluar la importancia de la variacin debida a las
diferencias entre tratamientos (y 1
y 2 ).
Si (y 1
y 2 ) es grande relativamente a 2 , entonces tendremos bases para
armar que los tratamientos no tienen efectos iguales sobre la respuesta. Como
los errores experimentales "ij s no pueden medirse directamente, 2 se estima
mediante las diferencias observadas en la respuesta de UE tratadas de la misma
manera, es decir mediante Sp2 , en este caso
^ 2 = Sp2 =

(n1

1)S12 + (n2 1)S22


(n1 + n2 2)

(2.3)

As tiene sentido intuitivo comparar la variabilidad debida a los tratamientos


con la variabilidad estimada del error experimental, mediante
tc =

y1

y
( 1
2)
q2
Sp n1 1 + n2 1

(2.4)

Si los datos satisfacen las suposiciones antes mencionadas, y asumiendo que


se cumple la hiptesis H0 , tc se distribuye como una variable aleatoria con distribucin t de Student con n1 +n2 2 grados de libertad. Resumiendo, por medio
del cociente tc se compara la diferencia debida a la posible diferencia entre los
dos tratamientos con la variacin estimada del error experimental.
La conclusin estadstica da evidencia para rechazar la hiptesis nula H0 ; si
jtc j > t(n1 + n2

2; 1

=2)

donde t(n1 + n2 2; 1
=2); es el cuantil de orden 1
=2 de la distribucin
de probabilidad t de Student con n1 + n2 2 grados de libertad. Donde es
el nivel de signicancia, y es el riesgo aceptable por el investigador para obtener
una conclusin equivocada. Se interpreta como la probabilidad de que el experimentador inera de manera errnea, diciendo que existe efecto de tratamiento
cuando realmente no es as. Por lo general, en la prctica se proponen valores de
= 0:05, = 0:01 o = 0:005:

2.1. Factor con dos niveles

25

Para el ejemplo 2:1, los clculos son los siguientes:


tc =
donde

35:29 28:0
7:29
y
y2
q1
q
=
=
= 3:44
2:12
1
1
5:6 14
+ 14
S p n1 1 + n2 1

1)23:76 + (14 1)38:92 p


= 31:34 = 5:60
14 + 14 2
Por otro lado, se propone un nivel = 0:05; entonces el valor del cuantil de
orden 1
=2 es
Sp =

t(n1 + n2

(14

2; 1

=2) = t(14 + 14

2; 0:975) = t(26; 0:975) = 2:06:

Una vez realizados los clculos y con base en la conclusin estadstica, se


comparan los valores de tc y t(n1 + n2 2; 1
=2); se observa que:
tc = 3:44 > 2:06:
Esto indica rechazar estadsticamente la hiptesis nula H0 a un nivel 1
de conanza.
La probabilidad PH0 (t 3:44) = 0:002, se conoce como el nivel de signicancia descriptivo o valor p, este valor muestra que la diferencia observada entre los
tratamientos es muy poco probable bajo H0 , evidencia para rechazar H0 : Entre
ms pequeo sea este valor, mayor evidencia de diferencia.
La interpretacin de estos resultados en el contexto del Ejemplo 2.1, indican
que la permeabilidad al vapor de agua es mayor en el plstico actual, lo que
implica que el nuevo plstico tiene mejores propiedades. Con esta conclusin se
da lugar a consideraciones que permitan tomar decisiones prcticas. Por otro
lado, es importante considerar que este resultado se obtuvo en el laboratorio,
as que si se desea llevarlo a nivel industrial es necesario escalar / robusticar
los resultados. Dentro de la estadstica existen mtodos que permiten llevar los
resultados de laboratorio a la industria.
En este ejemplo se ha considerado una sencilla comparacin de dos plsticos en
sus efectos sobre la variable respuesta que representa una caracterstica especial
de inters; en general en muchas reas de trabajo ya sea a nivel de laboratorio
o industrial se requiere comparar dos tratamientos, estos pueden incluir, entre
otras, las siguientes situaciones:
Obtener nuevas formulaciones para mejorar la vida de anaquel de un producto entre otras caractersticas.
Practicar nuevos mtodos de trabajo con la nalidad de incrementar la
productividad,

26

2. Diseo con un factor


estudiar diferentes materias primas para elevar la capacidad nutritiva de
producto alimenticio.
Evaluar programas de capacitacin de operadores.
Observar si existe un mayor rendimiento en nuevos equipos de trabajo.
Investigar a nivel de laboratorio diferentes procesos naturales.

Existen muchas situaciones similares a las mencionadas. La caracterstica


principal en este planteamiento es que slo se tiene un factor de control (por
ejemplo, formulaciones, mtodos de trabajo, materia prima, operadores, equipos
de trabajo).

2.2

Un factor con k

2 niveles

En muchos casos puede existir el inters por contrastar ms de dos tratamientos.


Veamos algunos ejemplos.
Ejemplo 2.2
Una compaa decide cambiar las formulaciones para aumentar la resistencia de
un papel para envolver caramelos. Las nuevas formulaciones se basan en el uso de
un slido al cual se le agregan alternativamente cuatro diferentes concentraciones
(en %), de una sustancia qumica; se consideraron cuatro porcentajes. La tensin
del papel es la respuesta y se mide en unidades psi.
Factor: La formulacin.
Niveles: Las cuatro concentraciones de sustancias.
Respuesta: Tensin del papel.
El objetivo es evaluar el efecto de las nuevas concentraciones sobre la resistencia del papel.
Ejemplo 2.3
El objetivo es evaluar el efecto que la temperatura de fundicin tiene sobre la
soldadura en un circuito electrnico montado en una tarjeta. En el ensamble
nal, un ingeniero evala la efectividad de la soldadura considerando el nmero
de falsos contactos en cada circuito.
Factor: Temperatura (diferentes temperaturas)
Niveles: (120 C, 140 C, 180 C)
Respuesta: Nmero de falsos contactos

2.2. Un factor con k

2 niveles

27

Como se puede notar del planteamiento de los ejemplos 2.2 y 2.3, la comparacin se puede extender a ms de dos tratamientos, es decir, considerar un factor
con dos o ms niveles, si as se considera que un factor inuye en la respuesta de
una caracterstica de inters para el producto.

2.2.1

Anlisis de varianza

En este subapartado, se presentar el procedimiento del anlisis estadstico denominado anlisis de la varianza (anlisis de las diferencias entre medias de
tratamientos) que permite probar la hiptesis que se plantea en un diseo de
un factor con dos o ms niveles.
Cuando un factor tiene k niveles, el problema de comparacin de los k efectos
se plantea como el contraste de dos hiptesis:
H0 :

H1 :

6=

i0

= ::: =

k (=

(2.5)
0

para al menos un par i 6= i

en donde representa la respuesta media antes de cualquier tratamiento, suponiendo


que i = + i , donde i es entonces lo que aade el tratamiento i a la . Note
as que i = i
, el llamado efecto del i simo nivel.
En el caso de dos niveles el objetivo principal al desarrollar un diseo experimental fue evaluar estadsticamente la diferencia de promedios, tal como se
mostr en (2.1). En el caso de k niveles, en lugar de considerar la comparacin
0
entre todos los contrastes (y i
y i0 ); i 6= i , se puede pensar como ms eciente
el analizar slo diferencias
^i = (y
i

y ); i = 1; :::; k;

donde y es un estimador de ; en lugar de los


informacin ya que
(y i

y i0 ) = (y i

y )

k
2

(2.6)

pares de diferencias, sin perder

(y i0

y )

Denamos el efecto estimado del i-simo nivel del factor como


^i = (y
i

y ) i = 1; 2; :::; k:

Si ^i es pequea se dir que el efecto es bajo. As si todas las ^i 0 s son cercanas


a cero, se apoyara a la hiptesis H0 . Tomando en cuenta la posibilidad de que
las ^i 0 s se cancelen entre s positivas con negativas, la variacin debida a las

28

2. Diseo con un factor

diferencias entre tratamientos se cuantica mediante el llamado Cuadrado Medio


de tratamientos:
Pk
^2
i=1 ni i
CMtrat =
(2.7)
k 1
Si CMtrat es grande implica que las ^i 0 s son considerablemente diferentes de
cero; el punto es saber desde qu valor de CMtrat se puede considerar que tales
diferencias no son slo producto del error experimental. Para ello es necesario
tener un estimador de 2 : Tenga presente que para el caso de dos niveles, la expresin (2.3) es un estimador de la varianza 2 , la varianza del error experimental
que, como se recordar, se estima mediante las diferencias en respuesta de UE
tratadas de la misma manera, es decir mediante las Si2 0 s; entonces anlogamente
en el caso de k niveles, 2 es estimada mediante:
Pk
1)Si2
i=1 (ni
CMerror = P
= Sp2
(2.8)
k
(n
1)
i
i=1

el as llamado Cuadrado Medio del Error.


Si ni es igual en cada tratamiento se dice que el diseo es balanceado, en caso
contrario, se dice que el diseo est desbalanceado; en el caso de que los niveles
del factor se desbalanceen no habr consecuencias de importancia.
Como se ver ms adelante, las cantidades CMtrat y CMerror desempean un
papel importante para inferir sobre la signicancia de los i 0 s. Para realizar la
inferencia estadstica con sentido, los supuestos requeridos son fundamentalmente
los mismos que en el caso k = 2 :
Si yi representa a la respuesta ante el tratamiento i, se supone que
yi =

+ "; i = 1; :::; k;

donde " representa el error experimental; respuestas medias ante cada


tratamiento denotadas por 1 ; :::; k ; potencialmente diferentes.
Del trmino de error se supone que:
" tiene media igual a 0.
La varianza de " en cualquier tratamiento es constante, digamos igual
a 2 (homogeneidad de varianzas).
" como variable aleatoria es descrita adecuadamente por la funcin de densidad Normal. Bajo los supuestos anteriores, ya con los datos, se tendr
entonces que
yij = i + "ij ; i = 1; :::; k; j = 1; 2; :::ni

2.2. Un factor con k

2 niveles

29

Otro supuesto adicional es entonces que los "ij son mutuamente independientes. Esto equivale a decir que cmo se maniesta el error experimental en una
UE no tiene que ver con cmo se maniesta en otra UE.
Ahora,
CMtrat
(2.9)
Fc =
CMerror
compara CMtrat ; la variabilidad aportada por las diferencias entre tratamientos, con CMerror , la variabilidad aportada por el error experimental. Bajo los
supuestos antes mencionados, Fc ( el cociente F ), resulta ser un estadstico cuya
ley de probabilidad es manejable como distribucin de referencia para contrastar
H0 (expresin (2.5)) versus H
P1k; ya que Fc ; como variable aleatoria, sigue una
distribucin F con (k 1) y i=1 (ni 1) grados de libertad respectivamente:
En trminos de los i 0 s para probar que hay efecto de tratamiento, una
propuesta hipottica equivalente a la planteada por la expresin (2.5) es: H0 :
^ 0
1 = 2 = ::: = k = 0; versus H1 : i 6= 0, para alguna i, donde i s son los
efectos tericos.
Con los datos del experimento del ejemplo 2.1, k = 2, se tienen los siguientes
resultados:
^1 = y
y = (35:26 31:64)
1

^2 = y
2
CMtrat =

= (28:0

14 (35:29

31:64)
31:64)2 + (28:0
1

31:64)2

= 371:57

814:86
= 31:34
26
371:57
Fc =
= 11:86
31:34
Buscando en tablas de una distribucin F con 1 y 26 grados de libertad y
= 0:05, se tiene F (1; 26; 0:95) = 4:23, Fc > 4:23; la conclusin es la misma:
Fc desempea el papel del estadstico tc en la expresin
Pk(2.4) con k = 2, pero
2
permite el anlisis para el caso de k
2. Note que t ( i=1 (ni 1)) es igual a
P
F (1; ki=1 (ni 1)): Alternativamente, el valor p = P (F
11:856) = 0:002 se
compara con el valor del nivel de signicancia : Si p < ; se rechaza la hiptesis
nula H0 ; y si p > , no se rechaza H0 : Esta ltima es la referencia que reportan
los paquetes estadsticos.
CMerror =

Ejemplo 2.4
En un proceso de renacin se tiene el inters en mejorar la viscosidad de un
aceite, durante la manufactura se tiene que la temperatura en la torre de destilacin afecta la viscosidad. Como existe la posibilidad de controlar la temperatura

30

2. Diseo con un factor

a nivel del proceso, el ingeniero qumico encargado de la operacin propone cuatro


temperaturas. Se plantean diez das en el primer turno de trabajo para evaluar
la viscosidad del aceite considerando las diferentes temperaturas. La hiptesis es:
Es posible mejorar la viscosidad del aceite al cambiar la temperatura del
proceso.
La hiptesis nula plantea que las cuatro poblaciones tienen la misma media,
lo que se interpreta diciendo que las temperaturas producen la misma viscosidad.
Esto es:
H0 :

4;

(2.10)

La hiptesis alternativa indica que al menos una temperatura produce una


viscosidad diferente a las dems, es decir:
H1 :

6=

para alguna i 6= j

(2.11)

Hay que asignar los tratamientos T1 ; T2 ; T3 ; y T4 de temperatura al material


a procesarse en la torre de destilacin. Esto se puede realizar en los diez das,
por lo que se toman aleatoriamente temperaturas para cada uno de stos. El
procedimiento es como sigue: para el da uno se toma al azar un nmero (suponga
que sale el 3) entonces ese da se controla la torre a la temperatura T3 ; se procesa
y se muestrea el aceite y se anota la viscosidad; luego para el da dos, si aparece
el 2, la temperatura de la torre es T2 ; nuevamente se mide la viscosidad de la
muestra de ese da. As sucesivamente se van seleccionando los nmeros hasta
completar los diez das. Se supone que las mediciones no se ven afectadas al
cambiar de da. Las viscosidades obtenidas durante los diez das se reportan en
la Tabla 2.3.
Temperatura
T1 T2 T3 T4
80 71 71 88
78 77 73 86
82
72
Tabla 2.3 Resultados del experimento de temperaturas y viscosidad
De la Tabla 2.3 se calcula la media general de las diez observaciones, el promedio y la varianza dentro de tratamientos. Los resultados aparecen en la Tabla

2.2. Un factor con k

2 niveles

31

2.4.

y1

T1
80
78
82
= 80

y2

S12 = 4

Temperatura
T2
T3
71
71
77
73
72
= 74 y 3 = 72

S22 = 18

S32 = 1

T4
88
86
y 4 = 87

= 77:8

S42 = 2

Tabla 2.4 Clculos de promedios y varianzas


As los valores del CMtrat y CMerror ; vase expresiones (2.7) y (2.8), y a
partir de la Tabla 2.4, son:
CMtrat =

3(80

77:8)2 + 2(74

Sp2 =

77:8)2 + 3(72
4 1

77:8)2 + 2(87

77:8)2

= 104:5

30
2(4) + 1(18) + 2(1) + 1(2)
=
=5
3+2+3+2 4
6

El estadstico de prueba para contrastar las hiptesis (2.10),


Fc =

104:5
= 20:9 > F (3; 6; 0:05) = 4:76
5

que indica que al menos una de las temperaturas inuye de manera diferente en
la viscosidad del aceite.
En general, los resultados del anlisis se presentan en forma resumida en
una tabla de anlisis de la varianza (ANDEVA). En la Tabla 2.5 se muestra la
distribucin de la tabla del ANDEVA, observe que la cuarta columna contiene
las expresiones (2.7) y (2.8).
Fuente de
variacin

Grados de
libertad

Tratamientos

Error
Total

N
N

1
k
1

Suma de
cuadrados
k
P
2
nibi
i=1
ni
k P
P

i=1 j=1
ni
k P
P

(yij

y i )2

(yij

y )2

Cuadrado
medio

Fc

Valor p

SCtrat
k 1

CMtrat
CMerror

SCerror
N k

i=1 j=1

Tabla 2.5 Descripcin general del anlisis de la varianza

32

2. Diseo con un factor


En la Tabla 2.5 N =

k
P

ni ; y p es el valor p del contraste de hiptesis. El

i=1

tercer rengln de esta tabla corresponde a la variabilidad (total) respecto a y


de todas las yij 0 s.
Los resultados que se calcularon para el Ejemplo 2.3 se muestran para su
anlisis en la Tabla 2.6.
Fuente de
variacin
Tratamiento
Error
Total

Grados de
libertad
3
6
9

Suma de
cuadrado
313:6
30:0
343:6

Cuadrado
medio
104:53
5:0

Fc

Valor p

20:91

0:0014

Tabla 2.6 ANDEVA del Ejemplo 2.4


El valor p muestra lo improbable que es la observacin de Fc = 20:91 bajo la
hiptesis nula, lo que lleva a inclinarse por rechazar H0 .

2.2.2

Modelo estadstico

En el experimento y anlisis de los ejemplos anteriores se han considerado k


2 tratamientos; dentro de cada tratamiento se tienen ni rplicas, cada rplica
resulta en una medicin denotada por yij , donde i es el ndice que identica al
tratamiento y j el que representa la rplicas de cada tratamiento, i = 1; 2; :::; k;
j = 1; 2; :::; ni . El modelo estadstico que describe a las yij , con sus suposiciones
es:
yij = i + "ij ;
"ij N (0; 2 )
(2.12)
i = 1; :::; k; j = 1; :::; ni ; f"ij g independientes
Recuerde que asumimos que i = + i , dado que denota a una media
general de la respuesta y antes de la aplicacin de cualquier tratamiento y i el
efecto esperado del tratamiento i; as
i

(2.13)

Despejando i en (2.13) y sustituyendo en (2.12), el modelo se puede expresar


en trminos de la media general y del efecto i , es decir:
yij =

+ "ij

(2.14)

As, los parmetros ; i y i caracterizan el diseo unifactorial completamente al azar; para comparar los tratamientos, es necesario estimarlos. El criterio

2.2. Un factor con k

2 niveles

33

P 2
de minimizar la suma de los errores cuadrados
"ij es el utilizado para estimar
estos parmetros; este procedimiento se ilustra en el apndice tcnico A al nal
del libro. Los estimadores
ptimos bajo este criterio, de estos parmetros, son
P
(imponiendo que i ^i = 0)
^=y
^ i = yi
^i = y
i

(2.15)
y

Con estos valores estimados, los datos estimados bajo el modelo (2.14) son:

2.2.3

ybij = y i

Formalizacin del ANDEVA

Cuando un factor tiene k niveles, el problema de comparacin es confrontar dos


hiptesis:
H0 : 1 = 2 = ::: = k
(2.16)
o equivalentemente
H0 :

= ::: =

=0

versus
H1 :

6=

i`

para al menos un par i 6= i

o equivalentemente
H1 :

6= 0 para al menos un i

Con el propsito de formalizar matemticamente la tabla de anlisis de la


varianza correspondiente, se sustituye (2.13) en (2.14),
yij =

+(

) + "ij

(2.17)

De la ecuacin (2.12) se puede observar que "ij es la diferencia entre el valor


observado yij y el promedio i ; as (2.17) se puede escribir como:
yij =

+(

) + (yij

i)

(2.18)

Esta ltima expresin se puede reescribir como:


(yij

)=(

) + (yij

i)

(2.19)

As la diferencia (yij
) que es la desviacin de las observaciones con respecto
a la media total, se puede descomponer en dos trminos como se muestra en la
expresin anterior. Si se sustituyen los estimadores (2.15) en (2.19) se tiene que
(yij

y ) = (y i

y ) + (yij

yi )

34

2. Diseo con un factor

De esta ltima expresin se puede obtener la tabla del ANDEVA; para ello
se elevan al cuadrado ambos lados y se suman todos los valores dentro y entre
tratamientos. Se obtiene
Pk
P P
Pk Pni
y )2 =
y )2 + ki nj i (yij y i )2
i ni (y i
i
j (yij
P P
+2 ki nj i (y i
y ) (yij y i )
El ltimo trmino de la expresin anterior es cero, de esta manera la suma de
cuadrados del total (SCtotal ) se descompone en dos partes, la suma de cuadrados
entre tratamientos (diferencia entre tratamientos) y la suma de cuadrados dentro
de tratamientos (variacin estimada del error experimental), es decir:
ni
k X
X
i

(yij

y ) =

ni
k X
X
i

(y i

y ) +

ni
k X
X
i

(yij

y i )2

(2.20)

Se puede observar que la suma de cuadrados del primer miembro de la ecuacin


(2.20), se ha descompuesto en dos trminos y describe la variacin total de los
datos alrededor de y : Los elementos de (2.20) son los elementos que componen
la columna de la suma de cuadrados de la Tabla 2.6, los grados de libertad para
k tratamientos son gltrat = k 1; los grados de libertad para el total de observaciones es gltotal = N 1. Los grados de libertad correspondientes a la suma de
cuadrados del error se obtienen por diferencia
glerror = gltotal

gltrat = (N

1)

(k

1) = N

Note que (2.20) es equivalente a la siguiente expresin de acuerdo a la notacin


manejada anteriormente.
SCtotal =

ni
k X
X
i

(yij

y )2 =

ni
k X
X
i

^2 +
i

ni
k X
X
i

e2ij = SCtrat + SCerror ;

(2.21)
donde eij = (yij y^ij ) = (yij y i ) son los denominados residuales; residuales
porque representan la parte residual que no es explicable por los efectos de los
tratamientos (en general, un residual es la parte del dato que no es explicada por
el modelo especicado).
Ejemplo 2.5
Un ingeniero industrial realiz un estudio para determinar el tiempo de coccin
de una variedad de frijol. El procedimiento consisti en poner a remojar siete
lotes de frijol durante diez horas, donde el agua de remojo contena una de cuatro

2.2. Un factor con k

2 niveles

35

diferentes cantidades de cloruro de sodio NaCl (% PV). Siete rplicas (lotes) por
cada uno de cuatro tratamientos (cantidades de sal) fueron utilizadas. Despus de
diez horas se enjuag a los frijoles y con agua libre de sal se pusieron a cocer. El
tiempo de cocimiento se registr como se muestra en la Tabla 2.8. El experimento
fue realizado asumiendo un diseo de un factor completamente aleatorizado. El
objetivo del experimentador es lograr un menor tiempo de coccin para reducir
el consumo de gas.

yi

1
0
108
109
99
103
107
95
102
103:29

Tratamientos
2
3
1:0
2:0
84
76
82
85
85
74
92
78
87
82
78
75
90
82
85:43 78:86

4
3:0
57
67
64
61
63
55
63
61:43

Si2

26:24

22:62

17:48

17:29

21:04

3:18

3:39

NaCl

efecto bi = y i

82:25

20:82

Tabla 2.8 Tiempo de coccin del frijol

La hiptesis resulta ser que es posible reducir el tiempo de coccin a travs


de la adicin juiciosa de cloruro de sodio. La estadstica traduce la pregunta en
un planteamiento hipottico como sigue:
H0 :

Son iguales los tiempos de coccin medios para los cuatro tratamientos?
La hiptesis alternativa es:
H1 :

6=

para alguna i 6= j

Al menos uno de los tratamientos provoca un tiempo de coccin diferente de


los dems?
Utilizando (2.21) se obtiene el ANDEVA mostrado en la Tabla 2.9. Comparando el valor de la razn Fc =100.19 (ver Tabla 2.9) con un cuantil de la
distribucin de probabilidad F con 3 gl para el numerador y 24 gl para el denominador con un nivel 1
= 0:95, es decir, F (3; 24; 0:95) = 3:009 se rechaza H0 ,
esto signica que alguno de los tratamientos es diferente.

36

2. Diseo con un factor

Equivalentemente, el nivel de signicancia descriptivo (o valor p) es cero hasta


la cuarta cifra decimal, as p < .
Fuente de
variacin
Tratamiento
Error
Total

Grados de
libertad
3
24
27

Suma de
cuadrados
6283:54
501:71
6785:25

Cuadrado
medio
2094:51
20:91

Fc
100:19

Valor p
0:0000

Tabla 2.9 ANDEVA para el tiempo de coccin

2.3

Validacin del modelo estadstico

Las suposiciones implicadas por el modelo (2.12) no deben ser rutinariamente


aceptadas; la vericacin de stas se traduce en la validacin del modelo estadstico. Este modelo representa al diseo de un factor en k niveles completamente aleatorizados. As el modelo (2.12) indica que la j-sima observacin del
tratamiento i est alrededor de la media i ms el error "ij que constituye la
parte aleatoria de la yij , y se expresa por ende como "ij = yij
i:

2.3.1

Anlisis de Residuales

Como todo modelo, (2.12) es slo una aproximacin a lo real y como tal siempre
debe diagnosticarse el ajuste de los datos al modelo; para el diagnstico de manera
esencial se computan los residuales
eij = yij

ybij = yij

yi ; i = 1; :::; k; j = 1; :::; ni

(2.22)

Los residuales eij representan buenas estimaciones de los errores "ij si el


modelo (2.12) se ajusta a los datos observados experimentalmente. Entonces se
analizan los residuales para observar si se parecen o no a los errores tericos, o
dicho de otra manera, para comprobar si los supuestos en el modelo se cumplen
de manera adecuada.
En general mediante el anlisis de residuales se busca detectar:
1. Si existen dentro del conjunto de datos valores atpicos (valores muy pequeos o muy grandes) respecto al patrn general sugerido por el modelo.
2. Si la variabilidad de los errores se muestra no constante.
3. Si hay evidencia de que la distribucin de los errores se desve con respecto
a la normalidad.

2.3. Validacin del modelo estadstico

37

4. Otras suposiciones.
El enfoque actual dominante para el anlisis de residuales es por medio de
grcas ad hoc.
Histograma de residuales
El histograma es una herramienta sencilla para representar de manera grca
los residuales (2.22). Con un nmero grande de observaciones, el histograma de
residuales permite indagar si no hay desviaciones de una apariencia que distinga
a una distribucin normal centrada en cero. Con el histograma se podran detectar tambin residuales atpicos respecto al grupo principal. Los residuales en el
Ejemplo 2.5 se muestran en la Tabla 2.10, y en la Fig. 2.1 su grca.
Tratamientos
NaCl

1
0
4.71
5.71
-4.28
-0.28
3.71
-8.28
-1.28

2
1
-1.43
-3.42
-0.42
6.57
1.57
-7.42
4.57

3
2
-2.85
6.14
-4.85
-0.85
3.14
-3.85
3.14

4
3
-4.42
5.57
2.57
-0.43
1.57
-6.42
1.57

Tabla 2.10 Residuales en el Ejemplo 2.5


Grca de probabilidad Normal de los residuales
Si la variable E es una variable cuyo comportamiento es bien descrito por la
distribucin N ( ; 2 ); sabemos que
Z=

N (0; 1)

Por medio de la distribucin acumulativa de probabilidad de Z; se dene a


sus cuantiles, denotados por zq como funcin de q: zq es el cuantil de orden q
para Z si
(zq ) P (Z < zq ) = q
Estos cuantiles se pueden encontrar en las tablas de la distribucin Normal o
a travs de mltiples programas de cmputo estadstico. A partir de zq se puede
encontrar el cuantil terico correspondiente en la escala original de e; como
Eq =

+ zq

38

2. Diseo con un factor

Fig. 2.1: Histograma que describe los residuales del Ejemplo 2.5
Es claro as que si se cree que un conjunto de datos eq s proviene de E; al
1 (q)s resultar una lnea recta; a tal
gracar el conjunto de eq s versus zq =
gracado se le llama grca probabilstica Normal.
Aplicado este tipo de grca a los residuales eij ; servir para vericar el
supuesto de Normalidad de los errores del modelo (2.12). As, a este grco lo
constituyen dos ejes perpendiculares: el eje de las ordenadas corresponde a los
1 (b
residuales, y el eje de las abcisas tiene la escala correspondiente a Zq =
q)
donde qb es la proporcin de residuales ordenados de menor a mayor. Estos ejes
trazados de tal forma, mostrarn un patrn rectilneo aproximado si los feij g son
normales.
A continuacin se enumeran los pasos que se deben seguir para gracar los
residuales en un grco de probabilidad normal:
1. Ordenar residuales de menor a mayor.
2. Calcular para el l-simo residual ordenado su qbl =

3. Obtener

1 (b
ql ):

4. Gracar

1 (b
ql )

l 0:5
N :

versus el correspondiente residual.

En la Fig. 2.2 se muestra un grco probabilstico Normal para los residuales del Ejemplo 2.5. En este caso no se aprecia una desviacin marcada de lo
rectilneo, por lo que no hay evidencia marcada para dudar de la suposicin de
normalidad de los errores.
Gracar feij g versus fb
yij = yi g
Si al gracar cada pareja de puntos (eij , ybij ), aparecen sin algn patrn y claramente dispersos, se puede inferir de manera intuitiva que no existe incumplimiento

2.3. Validacin del modelo estadstico

39

Zq

-1

-2
-10.0

-7.5

-5.0

-2.5
0.0
residual

2.5

5.0

Fig. 2.2: Grca probabilstica Normal de residuales del Ejemplo 2.5

de los supuestos del modelo (2.12). Sin embargo, si los puntos muestran algn
patrn entonces existe la posibilidad de una falla en alguno de los supuestos. En
la Fig. 2.3 se muestra la grca correspondiente al Ejemplo 2.5, de la que no se
aprecian desviaciones de los supuestos.

Fig. 2.3: Valores respuesta estimados versus residuales en el ejemplo 2.5

40

2. Diseo con un factor

Fig. 2.4: Residuales en el orden de experimentacin del Ejemplo 2.5


Gracar los residuales en el orden de experimentacin
Si a medida que se realiza el experimento existen sesgos a pesar de la aleatorizacin, es posible que stos se reejen en los datos generados. Es por ello importante gracar a los residuales en el orden en el que experimentalmente fueron
producidos. Si se aprecia que los residuales en ese orden muestran asociaciones
alejadas de lo aleatorio, entonces estaramos potencialmente ante la desviacin
del supuesto de que los errores son mutuamente independientes. Esta violacin es
grave y requiere de mtodos estadsticos ms complejos. En la Fig. 2.4 se muestran los residuales en el orden de generacin del Ejemplo 2.5, no aprecindose
patrones de preocupacin.

2.3.2

Vericacin del supuesto de homogeneidad de varianzas

Prueba de Hartley
Para probar de manera formal la hiptesis de igualdad de varianzas existen varios
estadsticos propuestos; primero se presentar el estudiado por Hartley. Este tema
de homogeneidad es importante porque frecuentemente en la naturaleza o en los
procesos, aparecen datos que tiene el error experimental con una variabilidad
no homognea entre tratamientos. Ante la presencia de heterogeneidad algunos
ajustes a los datos, o la aplicacin de otros procedimientos, se deben emplear
para su anlisis. El planteamiento estadstico es realizar la prueba de hiptesis
sobre la igualdad de varianzas, esto es:
2
1

Ho :
H1 :

2
i

6=

2
j

= ::: =

2
k

; para alguna i 6= j:

(2.23)

2.3. Validacin del modelo estadstico

41

El estadstico propuesto por Hartley es el siguiente:


H=

mx(S12 S22 :::Sk2 )


mn(S12 S22 :::Sk2 )

La decisin es rechazar H0 si H > Htablas para algn valor establecido de ;


considerando el nmero de tratamientos y los grados de libertad para el error.
Los valores de H aparecen en la tabla generada por Hartley, se anexa al nal del
libro. Considerando los datos de coccin del frijol (vase Tabla 2.8),
H=

26:24
= 1:5176
17:29

Si = 0:05; este valor de H es menor que el valor Htablas (4; 24; 0:95) ' 3:2 por
lo que se concluye que los datos no dan evidencia para rechazar H0 ; se considera
que hay homogeneidad en las varianzas.
Prueba de Bartlett
La estadstica de prueba para este procedimiento debido a Bartlett, es la siguiente:
B = 2:3026
donde
que:

= ni

Pk
2
2
i=1 i log10 Si
i=1 i ) log10 (Sp )
P
P
f ki=1 (1= i ) 1= ki=1 i g=f3(k 1)g

Pk

1+

1; i = 1; :::; k: As, si B evaluado con los datos generados resulta


B>

(k

1; 1

Se rechaza la hiptesis de homogeneidad de las varianzas.


Para los datos de la Tabla 2.8 sobre el tiempo de coccin de frijol para diferentes tratamientos, B = 0:354 < 2 (3; 0:95) = 7:81; de hecho el nivel de signicancia descriptivo para este conjunto de datos es p = 0:949, habiendo as fuerte
evidencia a favor de la hiptesis de homogeneidad de varianzas. Esta prueba
es poco til dado que en muchos casos leves desviaciones del supuesto de normalidad en los errores, lleva a rechazar la hiptesis (2.23), a pesar de que haya
homogeneidad en los tratamientos.
Prueba de Levene
Esta prueba es recomendable cuando se parte de que los trminos de error en
el modelo pudieran no seguir tan elmente una distribucin Normal, siendo una
alternativa ms robusta que la prueba de Bartlett. Los cmputos requeridos

42

2. Diseo con un factor

para esta prueba consideran las distancias de las observaciones dentro de cada
tratamiento con respecto a su mediana muestral. Su estadstica de prueba es:
P
P
( ki=1 i ) ki=1 ni (li
l )2
L=
P P i
(k 1) ki=1 nj=1
(lij li )2

donde lij = jyij y~i j ; y~i representando la mediana de las observaciones en el


P
tratamiento i; i = 1; :::; k; i = ni 1; y P ki=1 i grados de libertad del error.
Si con los datos observados, L > F (k 1;
), se rechaza la hiptesis de
i; 1
homogeneidad de varianzas. Con los datos del ejemplo de la Tabla 2.8, L = 0:159;
consultando en tablas de la distribucin F , se llega a la conclusin de no rechazar
la hiptesis de homogeneidad de varianzas.
El lector interesado en conocer ms sobre los estudios de investigacin estadstica sobre la homogeneidad de las varianzas, puede consultar a Conover, Johnson
y Johnson (1981).

2.3.3

Transformaciones

Puede haber casos en que se sepa de antemano que la distribucin de probabilidad


asociada a la variable respuesta y no es Normal; algunos ejemplos de esta situacin
son:
Si y representa a nmeros enteros pequeos, por ejemplo al nmero de
colonias de bacterias en un plato, de insectos o plantas de una especie
especca en un rea, o de defectos por unidad.
Si y representa una variable positiva con sesgo importante, por ejemplo
cuando se tienen datos de una prueba de vida en estudios de conabilidad.
Si y representa a fracciones de un fenmeno binario con probabilidad ja
de xito.
Transformaciones tiles correspondientes, para acercarse, respectivamente, a
la normalidad, son las siguientes:
p
p
y conteos 7 ! y o 1 + y
y tiempo de vida 7 ! log(y)
y fracciones binarias 7 ! sen

1 (py)

Por otra parte, si de antemano no se sabe si se cumple con la Normalidad


u otro supuesto del modelo, pero a travs del anlisis de los residuales de ste

2.3. Validacin del modelo estadstico

43

se detecta una desviacin en ese sentido, una estrategia til es tambin una
transformacin a los datos originales con el n de remediar la violacin a los
supuestos. Por ejemplo, si hay evidencia de que hay relacin funcional entre
las medias y las varianzas de los tratamientos, en el sentido de, supongamos a
mayor respuesta media mayor variabilidad o viceversa, y por ende presencia de
heterogeneidad en las varianzas, si se aplica logaritmo a los datos observados, es
posible que se corrija la desviacin de tal supuesto.
Si y es no negativa, una familia de transformaciones que resulta de mucha
utilidad ante la violacin de supuestos es la propuesta por Box y Cox (1964);
sta se expresa por
8
y
1
>
>
; 6= 0
>
<
1
( )
y
y =
(2.24)
>
>
>
:
y ln y; = 0
P
donde y = ln 1 ( n1
ln y); la a escoger es aquella que minimiza la SCerror ( ):
En Haaland (1989, Cap. 6) se describe un ejemplo interesante de la aplicacin de
transformaciones Box - Cox en diseo de experimentos. Hay que notar que para
que una transformacin tenga efecto en un conjunto de datos, cuando y tiene un
cero natural, se debe tener que:
ymax
>3
ymin
o que:
ymax
ymin

frontera natural
>3
frontera natural

Para mayor informacin sobre el uso de transformaciones en modelos lineales


estadsticos se puede consultar, por ejemplo, a Atkinson y Riani (2000).

2.3.4

Determinacin del nmero de rplicas

Formalmente, las condiciones que determinan el nmero de rplicas son:


El nmero de tratamientos k.
Un estimador de

2:

El tamao de la diferencia mnima a ser detectada

La conanza para detectar tal diferencia, medida en funcin de la potencia


(1
). sta es la probabilidad de que un investigador concluya rechazando
H0 de manera correcta bajo una hiptesis alternativa cierta.

44

2. Diseo con un factor


El nivel de signicancia

a ser usado en el experimento real.

Si importa el signo de las diferencias entre efectos promedio de tratamientos


(una o dos colas).
En la Tabla 2.11 se enlistan diferentes nmeros de tratamientos k en la primera
columna, la otra entrada en la tabla depende de la diferencia en los tratamientos
que un investigador desee detectar y de , es decir, por
= . La entrada
correspondiente en la Tabla 2.11 indica el nmero de rplicas que se requiere
para realizar un diseo completamente al azar balanceado (n1 = n2 = ::: = nk );
esta tabla est construida considerando un = 0:05 y una potencia (1
) de al
menos 0:90. El procedimiento es como sigue:
1. Determine la menor diferencia entre la media ms chica y la media ms
grande que se desea detectar, . Procure no sobreestimar
ya que un
grande produce un nmero de replicaciones pequeo.
2. Estime

mediante una de las siguientes propuestas:

Haciendo un anlisis de la varianza a travs de un estudio inicial.


Tomando una muestra aleatoria del proceso.
Usando el conocimiento previo del proceso.
Esto debe realizarse con mucho cuidado con el propsito de no inar el nmero
de rplicas, lo que da lugar a hacer gastos innecesarios.
=
k
2
3
4
5
6
7
8
9
10
11
12

0:50
85
103
115
125
133
141
147
154
160
165
171

0:75
39
46
52
56
60
63
66
69
72
74
77

1:00
22
27
30
32
34
36
38
39
41
42
44

1:25
15
18
20
21
22
24
25
26
27
28
28

1:50
11
13
14
15
16
17
18
18
19
20
20

1:75
8
10
11
12
12
13
13
14
14
15
15

2:00
7
8
9
9
10
10
11
11
11
12
12

2:50
5
6
6
6
7
7
7
8
8
8
8

3:00
4
5
5
5
5
5
6
6
6
6
6

Tabla 2.11 Nmero de replicaciones para un diseo completamente al azar

2.4. Manejo de estructuras de diseo

45

Por ejemplo, si se desea detectar una diferencia mnima de


= 12:5 y se
tiene una varianza estimada de b = 4:5, entonces = 2:78; se aproxima a 2:75.
Si k = 5; ser necesario realizar el experimento con n = 6 o n = 5 replicaciones.

2.4

Manejo de estructuras de diseo

Como se mencion en el primer captulo, un diseo experimental comprende la estructura de tratamientos y la estructura de las UE o de diseo. Si por la presencia
de ruido experimental se espera que las UE no sean homogneas en su respuesta
antes de ser tratadas, se tienen en general dos estrategias experimentales para
acotar los efectos de ruido. Una primera estrategia es imponer restricciones a la
aleatorizacin, que equivale a formar bloques o grupos de unidades experimentales para controlar de manera explcita (cuanticable) la variabilidad ruidosa
aportada. La otra estrategia no forma bloques de UE0 s, sino que se circunscribe
a medir caractersticas, las llamadas covariables, a las unidades experimentales;
tales covariables consideradas como factores de ruido por el investigador, cuantican caractersticas que potencialmente diferencian de manera importante a las
unidades experimentales.

2.4.1

Restricciones a la aleatorizacin

Diseo en bloques completamente al azar


El diseo en bloques completamente al azar es un concepto muy importante dentro de la estrategia experimental, porque permite tener una mayor homogeneidad
de las UE a las que se les aplican los tratamientos. En el Ejemplo 2.5 se estudi
el tiempo de coccin del frijol bajo cuatro tratamientos diferentes; los lotes de
frijol utilizados pueden ocasionar una variabilidad grande en el tiempo de coccin. Tambin los aparatos de medicin para determinar el grado de coccin,
as como las personas involucradas en la medicin, pueden inuir en los resultados
al comparar los tratamientos. Cada uno de los aspectos mencionados se puede
considerar como parte del ruido experimental, y por ende no se tendra propiamente inters en sus efectos, sino ms bien en evitar que sus efectos diculten el
anlisis y las interpretaciones de los efectos de las diferentes cantidades de sal,
cuya comparacin es la razn del experimento.
El diseo en bloques se construye de la siguiente manera:
Suponga que tiene un nmero de UE mltiplo del nmero de tratamientos
k, digamos n k.
Forme n grupos de k UE cada uno.

46

2. Diseo con un factor


Aplique de manera aleatoria los k tratamientos a las k UE de cada bloque.

Por qu formar bloques antes de aplicar en orden aleatorio los tratamientos


(la restriccin a la aleatorizacin)? Para evitar que efectos de ruido hagan poco
clara la comparacin de medias de respuesta ante tratamientos. Por ello el ruido
hay que manipularlo mediante la formacin de bloques de UE, ya que al aplicar
en cada bloque todos los tratamientos, el ruido presente se supone que afectar de
la misma forma a todas las UE del mismo bloque sin dar una ventaja o desventaja
a ningn tratamiento. As podemos pensar que cada bloque corresponde a un
nivel de ruido presente en el experimento. Tantos bloques como niveles de ruido
en el experimento.
Dado lo anterior, para la formacin juiciosa de bloques primero hay que identicar previo al experimento, qu ruidos habr en ste, cules de stos son de
mayor importancia respecto a la variable respuesta, a criterio del experimentador; si estos ruidos de mayor importancia se pueden pensar y aglutinar como
niveles de un factor de ruido, entonces forme tantos bloques como el nmero de
niveles.
Supngase que en el contexto del Ejemplo 2.5 se tienen tres personas que
miden el tiempo de coccin del frijol. El objetivo es por supuesto determinar si
existe diferencia entre los efectos de las cantidades de sal (tratamientos), sobre el
tiempo de coccin del frijol, sin embargo se cree que al cambiar de persona puede
haber cambios (ruidos) que afecten la respuesta antes de tratamiento; en este
caso el factor persona sera de ruido con tres niveles, personas 1, 2 y 3. Las UE
manipuladas por cada persona se conforman como un grupo o bloque, con lo que
se conformaran tres bloques de UE (correspondiendo a las tres personas). As los
tratamientos en el bloque uno recibirn el mismo nivel de ruido (la manipulacin
de la persona 1), etctera.
Cada uno de los tratamientos se aleatoriza en cada persona, por ejemplo,
por cuestiones de azar, la persona 1 realiza los tratamientos T3 ; T2 ; T4 ; T1 ; otros
rdenes aleatorios para las otras dos personas. Los resultados y el esquema del
diseo de bloque se muestran en la Tabla 2.12.
Bloques (B)
persona 1
persona 2
persona 3
yi
bT = y
y
i

0
213
207
200
206:67
98:59

Tratamientos (T )
1:0
2:0
3:0
76
57
84
82
67
85
75
61
90
77:67
61:67
86:33
30:41

46:41

y j
107:5
110:25
106:5
= 108:08

21:75

Tabla 2.12 Esquema del diseo de bloques

bB =
j
y j y
0:59
2:17
1:59

2.4. Manejo de estructuras de diseo

47

y y bBj = y j y representan los efectos de


En la Tabla 2.12 bTi = y i
tratamiento i y bloque j; respectivamente, en este caso i = 4 y j = 3:
El modelo matemtico correspondiente al diseo de bloques completamente
al azar es:
yij

Ti

Bj

+ "ij ;

"ij

N (0;

) e independientes,

(2.25)

i = 1; :::; k; ; j = 1; :::; b;
Note que este modelo es la extensin del modelo (2.14) pero donde, de haber
2:
efectos por los bloques, se tiene 2
Los bloques formados contienen tantas UE como tratamientos, y cada UE
recibi slo uno de stos; por ello a estos bloques se les denomina bloques completos.
Por otra parte, note tambin que no estn los trminos T Bij de interaccin,
los cuales en este diseo se consideran nulos. Es importante sealar que esto es
debido a la suposicin en este modelo (diseo) de que no hay interaccin entre
el bloqueo y el factor de control. De haber interaccin las pruebas estadsticas se
veran invalidadas. Si hubiera duda sobre esta suposicin deber usarse el diseo
conocido como de bloques generalizados, en donde cada tratamiento se repite al
menos en una ocasin dentro de cada bloque; por lo que entonces sera posible
estudiar interacciones entre el bloqueo y el factor de control.
Enfatizamos de nuevo que las hiptesis a contrastar son iguales a las contrastadas cuando se tiene un factor sin restricciones en la aleatorizacin, presentadas en (2.10) y (2.11). Lo adicional e importante estriba en la estimacin de la
varianza del error de una manera ms na al sustraerle los efectos potenciales de
bloques.
El procedimiento para construir la tabla ANDEVA correspondiente a este
diseo en bloques (completos) completamente al azar, ilustrado con los datos del
Ejemplo 2.5, es el siguiente:
1. La diferencia de cada tratamiento con respecto a la media general es bTi =
yi
y : La suma de cuadrados de tratamientos (SCtrat ) con k 1 grados
de libertad es:
SCtrat =

k
P
2
bbTi = 3((98:59)2 + ( 30:41)2 + ( 46:41)2 + ( 21:75)2 )

i=1

= 39815:12
CMtrat =

39815:12
3

= 13271:71

48

2. Diseo con un factor


2. La suma de cuadrados para el bloque (SCbloq ) con b
es:
SCbloq =

1 grados de libertad

b
P
2
kbBj = 4(( 0:59)2 + (2:16)2 + ( 1:58)2 ) = 30:22

j=1

CMbloq =

30:22
2

= 15:08

3. La suma de cuadrados total SCtotal con kb


SCtotal =

k X
b
X

(yij

1 grados de libertad es

y )2 = 39998:9

i=1 j=1

4. La suma de cuadrados del error con kb


grados de libertad es:
SCerror = SCtotal

SCtrat

a+1

b + 1 = (k

1)(b

1)

SCbloq = 153:56

5. La tabla del ANDEVA queda indicada en la Tabla 2.13.


Fuente de
variacin
Tratamientos
Bloque (per.)
Error
Total

Grados de
libertad
3
2
6
11

Suma de
cuadrados
39814:25
30:17
154:5
39998:92

Cuadrado
medio
13271:42
15:08
25:75

Fc

Valor p

515:39

0:000

Tabla 2.13 Anlisis de varianza para el diseo en bloques


6. Puesto que el valor p es muy pequeo se concluye que al menos uno de los
tratamientos es distinto del resto.
Cuadrado latino
El diseo en cuadrado latino es una extensin del modelo anterior de bloques
completamente aleatorizados. Suponga que se tiene inters en un solo factor de
control con p niveles (cambiemos por conveniencia la notacin en este diseo de k
a p). En el caso de bloques, slo se tiene conceptualizado un tipo de ruido y, por
ende, una restriccin a la aleatorizacin de tratamientos. El diseo en cuadrado
latino se construye de la siguiente manera:

2.4. Manejo de estructuras de diseo

49

Piense en un arreglo de p renglones y p columnas. Con ello se tendr p2


celdas en tal arreglo.
p2 UE se pueden distribuir una en cada una de las p2 celdas, de tal forma
que se puede considerar que las UE de una misma la reciben el mismo
nivel del primer tipo de ruido, y las UE de una misma columna reciben el
mismo nivel del segundo tipo de ruido.
Formado este arreglo de p2 UE, proceda a la aplicacin aleatoria de tratamientos, pero atendiendo a dos restricciones:
Aleatorice los p tratamientos en cada la (primera restriccin).
Aleatorice los p tratamientos en cada columna pero de tal manera
que en cada la y en cada columna slo aparezca una sola vez cada
tratamiento.
Este diseo a qu circunstancias corresponde?
Cuando se pueden agrupar a priori los ruidos en el experimento en dos
tipos, en el mismo espritu del diseo en bloques, y sus efectos indeseables
sobre la respuesta antes de tratamientos se pueden evitar al agrupar las UE
segn ambos tipos de ruido identicados en el experimento.
El nmero de niveles identicados para los dos factores de ruido son ambos
iguales al nmero de tratamientos p: Con ello se tendrn p2 celdas y una
UE en cada uno de esos cruces.
Por ejemplo, en una parcela de terreno las UE podran agruparse por altitud
en el terreno pero tambin por su latitud en el mismo, si se piensa que tanto
la altitud como la latitud ejercen efectos sobre la respuesta de las parcelas previamente a la aplicacin de fertilizantes. Otro ejemplo sera: en un auto para
comparar llantas de p = 2 diferentes marcas, factor de control; podra pensarse
que si hay un efecto de posicin, trasera o delantera (p = 2) y derecha o izquierda
(p = 2), debera evitarse su efecto ruidoso antes de considerar cul marca es
mejor.
As las restricciones en la aleatorizacin para este diseo son tales que un
tratamiento deber aplicarse una sola vez en cada tipo de ruido identicado.
En los casos ms simples p = 2 y 3, posibles resultados de aleatorizacin
seran:
r1nr2 1 2 3
r1/r2 1 2
1
1 2 3
1
1 2
2
2 3 1
2
2 1
3
3 1 2

50

2. Diseo con un factor

donde cada la correspondera a un nivel de ruido del primer tipo y cada columna
correspondera a un nivel de ruido del tipo dos.
Note que el objetivo experimental sigue siendo comparar los niveles de un factor de control pero ahora con un esquema de aleatorizacin que permite el ltrado
de dos tipos de ruido, cualquier cosa que estos dos tipos de ruido signiquen en
el contexto de aplicacin.
Las ventajas del diseo de cuadro latino son las siguientes:
Requiere de pocas unidades experimentales.
Reduce de manera sistemtica el sesgo de los tratamientos mediante su
asignacin balanceada.
Permite estimar con ms exactitud la varianza del error experimental, debido al doble bloqueo.
En este caso la variable respuesta estar representada por yijl , que reproduce
la respuesta al tratamiento i, en el nivel del primer factor de ruido j y en el nivel
k del segundo factor de ruido, i; j; l = 1; :::; p. El modelo estadstico respectivo
es:
yijl = + Ti + Aj + Ll + "ijl ; "ijl N (0; 2 ) independientes,
donde Ti ; Aj y Ll son respectivamente los efectos del nivel i del factor de
control, del nivel j del primer factor de ruido y l nivel del segundo factor de
ruido. Anlogamente al caso de bloques la identicacin de dos tipos de ruido
implica cuanticar sus efectos bAj y bLl ; respectivamente, estimados por:
bA

bL

= (y
= (y

); j = 1; :::p;

); l = 1; :::p

Los efectos de tratamientos se estiman como se hizo en los procedimientos


anteriores.
De nuevo es importante sealar que este diseo no supone efectos de interaccin entre cualesquier par formado con un tipo de ruido y el factor de control
bajo estudio. Una discusin muy amplia sobre los cuadrados latinos se puede
encontrar en Preece (1983).
Ejemplo 2.6
Un ingeniero industrial est probando cuatro formulaciones en un proceso de
mezclado con la nalidad de estudiar la dureza de un producto que fabrica su
empresa. Las frmulas representan cuatro tratamientos que denotaremos A,B,C
y D respectivamente. El objetivo es contrastar las formulaciones para conocer si

2.4. Manejo de estructuras de diseo

51

hay alguna diferencia en la dureza del producto si utilizamos un tratamiento en


particular. Pueden existir otras condiciones, tales como proveedor, das de produccin, etc., que hagan que la homogeneidad en las UE se vea afectada. Dado
que los tratamientos son comprados indistintamente a cuatro proveedores, pero
que por lo pronto no interesa evaluar a stos, se considera que los proveedores
(P ) son un factor de ruido para la comparacin de tratamientos. Otro factor de
ruido que se considera importante es el operador (O) que aplique los tratamientos. De esta manera el arreglo experimental que se sigui para una comparacin
precisa entre formulaciones, evitando sobreestimar la varianza del error con la
variabilidad debida a proveedores y a operadores, fue un cuadrado latino de 4 4
con los datos resultantes en la Tabla 2.14.

Proveedor
Operador
O1
O2
O3
O4

y
y

P1

P2

P3

P4

j:

(y

l
l

bL =
l
(y l y

26, A
3, B
3, C
21, D
53
13.25

24, B
4, C
8, D
28, A
64
16

16, C
9, D
11, A
12, B
48
12

18, D
12, A
6, B
23, C
59
14.75

-0.75

-2

0.75

84
28
28
84

21
7
7
21

bA

7
-7
-7
7

= 14

efecto de tratamiento
^T = (y1
y ) = 5:25
1
^T = (y2
y ) = 2:75
2
^T = (y3
y ) = 2:5
3
^T = (y4
y )=0
4

Tabla 2.14 Cuadrado latino: datos y efectos estimados


As:

CMf orm =

p
P
2
p^Ti

i=1

CMoper =

p
P
2
pbAj

j=1

4(5:252 + ( 2:75)2 + ( 2:5)2 + 02 )


165:5
=
= 55:17
4 1
3

4(72 + ( 7)2 + ( 7)2 + (7)2 )


4(196)
=
= 261:33
4 1
3

52

2. Diseo con un factor


p
P
2
pbLk

4(( 0:75)2 + (2)2 + ( 2)2 + (0:75)2 )


36:5
=
= 12:17
p 1
4 1
3
cada uno con p 1 grados de libertad respectivamente. La suma de cuadrados
del error, con p2 1 3(p 1) = (p 2)(p 1) grados de libertad se obtiene por:
CMprov =

l=1

SCerror = SCtotal
Fuente de
variacin
Frmula (tratamientos)
Bloque oper.(altitud)
Bloque prov.(latitud)
Error
Total

SC

Grados de
libertad
3
3
3
6
15

SC

Suma de
cuadrados
165:5
784:0
36:5
88:0
1074:0

SC

= 88

Cuadrado
medio
55:17
261:33
12:17
14:66

Fc
3:76

Valor p
0:079

Tabla 2.15 ANDEVA del cuadrado latino del ejemplo 2.6


Encuentre el valor correspondiente de la distribucin F y a partir de la Tabla
2.15, obtenga sus conclusiones.

2.5

Anlisis de Covarianza

En el mismo sentido de identicar el error experimental de manera dedigna y


as incrementar la precisin experimental para detectar diferencias de medias de
tratamientos, el anlisis de covarianza es una estrategia alternativa o complementaria a la restriccin de aleatorizacin de tratamientos.
La diferencia estriba en que hay que identicar una(s) variable(s) x, denominada covariable, que se presume tiene un efecto sobre la variabilidad en la
variable respuesta distinta a los efectos aportados por los tratamientos y por el
error experimental, pero que no es controlable sino slo medible durante el experimento y que no depende de alguno de los tratamientos. As, la observacin
en el experimento consiste en una terna de valores (y; x; i) en cada UE, donde y
es la variable de inters en el experimento y x es la covariable en un tratamiento
particular i. La covariable corresponde a una inuencia de ruido que hace diferente a la UE particular, por lo que la comparacin entre tratamientos, sin tomar
en cuenta a x; sera potencialmente invlida.
Ejemplo 2.7
Un investigador est estudiando tres tcnicas diferentes de deshidratacin con el
propsito de industrializar una fruta. Utiliza un diseo completamente al azar

2.5. Anlisis de Covarianza

53

para evaluar el ndice de recuperacin del agua en cada fruta tratada. Debido a
que el tamao del fruto estudiado vara, se pesa cada uno de ellos al asignarlo
al tratamiento porque se piensa que el peso cambia el ndice de recuperacin del
agua de por s. As en este caso el peso es una covariable en el proceso. De esta
forma, el factor de control es la tcnica de deshidratacin con niveles denotados
por i, la respuesta y representa el ndice de rehidratacin y la covariable x el
peso de la fruta antes de ser tratada. Los datos que resultaron al realizar el
experimento se reproducen en la Tabla 2.16.
i
1
1
1
1
1
1
medias
Pxy

yij
57:00
60:00
69:00
71:00
81:00
83:00
70:17
132:17

xij
11:50
13:00
15:00
14:00
17:00
18:50
14:83

i
2
2
2
2
2
2

yij
77:00
89:00
90:00
92:00
104:00
101:00
92:17
141:33

xij
15:50
16:50
18:00
19:50
23:00
22:50
19:17

i
3
3
3
3
3
3

yij
58:00
64:00
73:00
75:00
78:00
80:00
71:33
90:83

Pxx

33:35

47:85

23:85

Pyy

560:85

462:85

367:35

SXY
SCXtotal

237:70
161:78

317:43
SCY total

82:08

xij
14:50
15:00
18:00
17:50
19:00
20:00
17:33

3229:79

Tabla 2.16 Resultados del Ejemplo 2.7


P
P
donde Pxy = i;j (xij xi )(yij yi ) = 364:33, Pxx = i;j (xij xi )2 = 105:05,
P
P
Pyy = i;j (yij yi )2 = 1390:05, SCXY = i;j (xij x )(yij y ) = 637:21,
P
P
SCXtotal = i;j (xij x )2 , SCY total = i;j (yij y )2 :
Los datos de la Tabla 2.16 se muestran en la Fig. 2.5. Los nmeros en la
grca corresponden a observaciones bajo los tres distintos tratamientos; observe
que dentro de un mismo tratamiento hay una tendencia lineal de y en x; lo que
provoca que una media de y independiente de x no tenga sentido ya que en
realidad la media de y cambia dependiendo del valor de x. Sin embargo, como el
inters sigue siendo comparar medias, si se lograra tener medias ajustadas por la
variabilidad en x, entonces se podran comparar entre s.
Denote por x :
X xij
n
i;j

54

2. Diseo con un factor

Fig. 2.5: Grco de dispersin entre el peso y la hidratacin, con tres tcnicas de
deshidratacin.
el promedio global de todos los valores xij medidos en el experimento, donde:
n

nij

i;j

y a xi :
xi =

ni
X
xij
j

ni

el promedio de las xij en el tratamiento i; i = 1; :::; k: Se puede demostrar


que los promedios (ajustados) a ser utilizados en la comparacin de medias de
tratamientos sern, usando la covariable x :
yi

(ajustado)

^ (xi

= yi

x ); i = 1; :::; k

(2.26)

donde:
^=

i;j (xij

xi )(yij

i;j (xij

xi

yi )
)2

(2.27)

Intuitivamente estos promedios son plausibles, ya que son promedios de cada


tratamiento pero ajustados por una cantidad que es proporcional a la diferencia

2.5. Anlisis de Covarianza

55

xi
x , la variabilidad aportada por x dentro del tratamiento i; i = 1; :::; k: As
el modelo es:
yij

"ij

N (0;

+ xij + "ij
2

) independientes

Para contrastar las hiptesis (2.10) y (2.11), se requiere de las siguientes


cantidades:
(Pxy )2
Pxx

Serror = Pyy
con N

1 grados de libertad,
(SCXY )2
SCXtotal

Serror = SCYtotal

con N 2 grados de libertad. De este modo, se puede demostrar que el criterio


para rechazar la hiptesis (2.5) es mediante la comparacin del valor de
0

Fc =

(Serror Serror )=(k 1)


Serror =(N k 1)

(2.28)

con Fc > F (k; N


k 1; ): Todo esto descrito en una tabla de anlisis de
varianza resulta como en la Tabla 2.17.
Fuente de
variacin
Tratamiento

Grados de
libertad
k 1

Suma de
cuadrados
0
Strat = Serror

Error

Serror

Cuadrados
medios
Serror

Strat
k 1
Serror
N k 1

Tabla 2.17 Descripcin del anlisis de covarianza (ancova)


El valor estimado de
(2.27),

para el Ejemplo 2.7 se obtiene mediante la expresin

^ = 3:47
Los promedios sin y con ajuste son, mediante (2.26):
yi
y i (ajustado)

70:17
78:07

92:17
85:03

71:33
70:56

56

2. Diseo con un factor

As para contrastar la hiptesis de igualdad de efectos de tratamientos, mediante (2.28), se tiene que:
Fc = 32:53
Como ejercicio construya la parte numrica que corresponde a la Tabla 2.17.
El anlisis de covarianza se puede generalizar a ms de una covariable, a relaciones
de segundo orden entre la covariable y la respuesta; estas ideas se presentarn
en los ejercicios del Captulo 8. El ancova se puede aplicar a cualquier diseo de
experimentos, de manera similar a la discutida en este subapartado.

2.5.1

Caso general del anlisis de covarianza

Se analizar el modelo de un factor con una covariable y cada tratamiento con n


replicaciones. El modelo general es:

yij

"ij

+
N (0;

+
2

i xij

+ "ij

) independientes

La parte del modelo que corresponde a + i se reere al anlisis de varianza


que se realiza comnmente (ANDEVA). La parte i xij corresponde a un anlisis
de regresin lineal simple, donde xij es la covariable. El trmino i puede sugerir
interaccin de la covariable con el factor de control. Supongamos que k = 2;
entonces podemos tener los siguientes cuatro casos:
No hay interaccin y no hay efectos de tratamiento (

30
20
10

-5

-4

-3

-2

-1

-10

-20

No hay efectos de tratamiento en xij = 0,

pero

6=

2)

2.5. Anlisis de Covarianza

57

y
20
10

-5

-4

-3

-2

-1

-10
-20

6=

6=

30
20
10

-5

-4

-3

-2

-1

-10
-20

6=

30
20
10

-5

-4

-3

-2

-1
-10
-20

58

2. Diseo con un factor

A este ltimo caso se le conoce como el anlisis de covarianza tpico.


Partiendo del modelo general yij = + i + i xij + "ij podemos hacer la
minimizacin de los errores al cuadrado va mnimos cuadrados como sigue:

min
i;

i;

k X
n
X

"2ij = min
i;

i;

(yij

i xij )

i=1 j=1

P P
2
Si a ki=1 nj=1 (yij
i
i xij ) le llamamos s, obtenemos el sistema
de ecuaciones normales igualando las derivadas parciales con respecto a cada
parmetro a cero.
@s
@

@s
@ i

@s
@ i

k X
n
X
i=1 j=1
n
X

yij

j=1
n
X

bi

b xij = 0
i

@bi

b xij = 0
i

yij

bi

xij yij

j=1

b xij = 0
i

Suponiendo b = 0 :
@s
@ i
@s
@ i

n
X

yij

j=1

n
X

bi

xij yij

j=1

b xij = 0
i

bi

b xij = 0:
i

Por lo tanto

b xi
bi = y
i
i
b = [Pxy ]i
i
[Pxx ]i

Sustituyendo los valores en s tenemos

i = 1; :::; k
i = 1; :::; k

2.6. Ejercicios

59

smin =

k X
n
X

yij

i=1 j=1

k X
n h
X
(yij

y i + b i xi

b (xij
i

yi )

i=1 j=1

2
k
r
X
X
4
=
(yij
i=1

yi )

j=1

k h
X

[Pyy ]i

b 2 [Pxx ]
i

i=1

Luego entonces

b xij
i

r
2X
i

xi )

i2

xi )2 5

(xij

j=1

E ([smin ]i ) =

(n 2) =)
X
E [smin ] =
E ([smin ]i ) =

k(n

2)

smin
es un estimador insesgado de 2 :
k(n 2)
Teniendo este anlisis podemos comparar los diferentes modelos que se pueden
usar dependiendo de los cuatro casos anteriores, y as juzgar cul debemos utilizar,
usando la suma de cuadrados de residuales del modelo completo como lnea base
para hacer las pruebas correspondientes.
Y por lo tanto

2.6

Ejercicios

Ejercicio 2.1 Un ingeniero est estimando el tiempo de falla de un equipo


elctrico de dos marcas diferentes, este equipo se somete a una prueba de esfuerzo.
El tiempo de falla medido en horas se muestran a continuacin:
equipos
equipo 1

equipo 2

yi
83
66

58
59

83
81

65
75

67
70

73
55

66
68

67
79

59
82

84
74

Si2

gl

1. Pruebe la hiptesis de igualdad de dos varianzas. Use =0.05.

60

2. Diseo con un factor


2. Con los resultados en el punto anterior pruebe la hiptesis de que el tiempo
de falla en ambos equipos es el mismo.
3. Analice la suposicin de normalidad.

Ejercicio 2.2 Una compaa desea estudiar la potencia de un recolector solar, y


por ello prueban dos conguraciones diferentes de ste; se prueba en seis ocasiones
cada conguracin. Los resultados se presentan a continuacin. La cantidad
medida fue la energa en (Watts).
Conguracin
A
B

y
13:7
13:5

14:1
14:0

13:4
13:2

14:2
13:7

15:6
13:3

S2

gl

14:4
13:1

Los datos fueron recolectados en doce diferentes perodos (comparables) de


tiempo.
1. Indique cmo realizara usted este experimento.
2. Cul es su hiptesis estadstica? Cul es su estadstico de prueba?
3. Existe alguna diferencia entre las conguraciones para generar energa?
4. Es aceptable el supuesto de normalidad para hacer la prueba?
Ejercicio 2.3 La ductilidad de una barra de metal es una propiedad muy importante de la materia prima que se emplea en las compaas que manufacturan
por extrusin, tal como la fabricacin de cables elctricos. Es de importancia
que el metal no sea muy ni poco dctil. Dos proveedores prueban su materia
prima en una compaa. Una muestra de diez barras se toma del almacn de
cada proveedor, los valores de las diez ductibilidades se muestran en la tabla de
abajo.
Proveedor
1
2

2:72
2:51

3:01
2:73

2:71
3:22

2:56
3:17

2:37
2:98

2:93
3:14

3:34
2:95

2:85
3:17

2:67
3:08

3:02
3:23

1. Indique el proceso que seguira para seleccionar la muestra de cada proveedor.


2. Se requiere averiguar si existe diferencia en la ductibilidad de los productos
para ambos proveedores.

2.6. Ejercicios

61

Plantear la hiptesis estadstica que le permitira probar esa diferencia.


Cul es el estadstico de prueba que usara para vericar la hiptesis?
Mencione los supuestos estadsticos que se deben satisfacer para probar la
hiptesis, bosqueje grcamente estas ideas.
Realice la prueba e indique su conclusin.

Ejercicio 2.4 Una compaa desea probar el efecto de venta de un nuevo producto empacado en cuatro diferentes presentaciones. Para el estudio se seleccionan doce tiendas con igual volumen de ventas mensual. Cada tienda se asigna
aleatoriamente a cada una de las presentaciones, tal como se muestra en los datos
descritos abajo. Otras variables que son relevantes para el estudio son: el precio,
la localizacin y cantidad de productos en el estante, y esfuerzos de especiales de
promocin. La variable de respuesta fue el volumen de ventas en el periodo de
estudio.
Presentacin

1
12
18
16

2
14
12
13

3
19
17
21

4
24
30
28

Total
n
Media
Varianza
1. Repase la estrategia experimental.
2. Cul es la hiptesis que se prueba?
3. Construya la tabla del ANDEVA y pruebe la hiptesis.
4. Calcule los residuales y haga una grca de los ei versus ybij : Qu concluye?
Ejercicio 2.5 Para comparar la viscosidad de cuatro diferentes marcas de aceite
casero se realizaron las pruebas de evaluacin en un laboratorio. Los resultados

62

2. Diseo con un factor

registrados en cinco muestras de cada marca son los siguientes:


marca

m1
59
60
58
71
48

m2
90
71
83
76
90

m3
77
66
64
75
80

m4
98
69
93
89
97

total
media
varianza
n
1. Explique cmo efectuara este experimento.
2. Plantee la hiptesis que se prueba, construya la tabla del ANDEVA y pruebe
la hiptesis.
3. Estime los efectos para cada marca de aceite, describa un diagrama de caja
para cada marca de aceite, qu observa?
4. El nivel de viscosidad presente en cada marca es el mismo?
5. Calcule los residuales, trace un grco probabilstico Normal para representarlos, y haga una grca de los ei versus ybij , qu observa?

Ejercicio 2.6 Una compaa de computadoras somete a tres tipos de esfuerzo


a sus equipos. Las computadoras son idnticas tanto en forma como en modelo,
pero son sujetas a diferentes grados de uctuacin de voltaje. El gerente desea
probar si el tiempo promedio de operacin antes que la computadora falle, es
el mismo para los tres sistemas de esfuerzo. Los datos que a continuacin se
proporcionan representan el tiempo (en horas) de falla y de las computadoras.
tipo de esfuerzo

total
n
media
varianza

A
115
7
96
214
20

B
65
48
33
17
4

C
87
141
185
32
219

2.6. Ejercicios

63

1. Trace un grco probabilstico Normal para representar estos datos, qu


observa?
2. Escriba la hiptesis que permita comparar si los tres tipos de fuerza son
diferentes.
Nota: Cuando alguno de los supuestos falla, o alguna transformacin de la
variable de respuesta no resulta adecuada, existen las pruebas llamadas noparamtricas que permiten llevar a cabo la inferencia sobre la igualdad de
tratamientos. En el caso del diseo completamente al azar, el estadstico
de prueba Kruskall - Wallis (KW ) es una alternativa para comparar los
tratamientos. El procedimiento consiste en ordenar de menor a mayor todas
las observaciones de la variable de respuesta yij , luego escribir el valor
del orden (rango Rij ) que le toc a cada observacin en el tratamiento
correspondiente. Para tratamientos cuyo tamao de muestra es cinco o
ms, el estadstico se expresa por la siguiente frmula:
"
#
k
X
12
2
KW =
3(N + 1)
ni R i
N (N + 1)
i=1

donde Ri es el promedio de rangos en cada tratamiento y N es el nmero


total de observaciones. Para saber si los datos apoyan la hiptesis de igualdad de tratamientos, el valor obtenido de KW se compara con un cuantil
de la 2 ; con k 1 grados de libertad.
3. Realice la prueba estadstica aplicando este estadstico.
Ejercicio 2.7 Una empresa fabricante de productos para mejorar la productividad de la agricultura, realiza un estudio experimental para determinar cul de seis
tratamientos es el que muestra mejores resultados en el contenido de nitrgeno
en ciertas plantas de inters. El experimento se lleva a cabo en un invernadero,
hecho que permite realizarlo con un diseo completamente al azar asignando 5
plantas para cada tratamiento. Los datos obtenidos se muestran a continuacin.
tratamiento
1
2
3
4
5
efecto y i
y

1
19:4
32:6
27:0
32:1
33:0

2
17:7
24:8
27:9
25:2
24:3

3
17:0
19:4
9:1
11:9
15:8

4
20:7
21:0
20:5
18:8
18:6

1. Realice el anlisis de varianza correspondiente.

5
14:3
14:4
11:8
11:6
14:2

6
17:3
19:4
19:1
16:9
20:9

64

2. Diseo con un factor


2. Realice anlisis de residuales. Identique si existen observaciones atpicas.
Si las hay omtalas de una en una y en conjunto del anlisis, y vea qu
inuencia tiene esto en la interpretacin de resultados. Tome la decisin de
dejarlas en el anlisis o de reportarlas de manera separada.

Ejercicio 2.8 Una compaa farmacutica est desarrollando un nuevo tipo


de sustancia estrognica: con el objetivo de ir claricando la dosis teraputica
necesaria para humanos, se realizan experimentos con ratas wistar de laboratorio, utilizando 6 dosis y un control negativo (sin dosis alguna). Para observar el
efecto de las diferentes dosis se mide el peso del tero de las ratitas despus de
ser administradas las dosis por un perodo de inters. Las condiciones experimentales permiten correr el experimento bajo un diseo completamente aleatorizado,
utilizando cuatro ratitas por cada tratamiento. Los datos son los siguientes.
Dosis

efecto y i

0(control)
89:8
112:6
88:4
93:8

1
84:4
116:0
84:0
68:6

2
64:4
79:8
88:0
69:4

3
75:2
62:4
62:4
73:8

4
88:4
90:2
73:2
87:8

5
56:4
83:2
90:4
85:6

6
65:6
79:4
65:6
70:2

Realice el anlisis de varianza correspondiente y el anlisis de residuales. Identique si existen observaciones atpicas. Si las hay, omtalas de una en una y en
conjunto del anlisis, y vea qu inuencia tiene esto en la interpretacin de resultados. En su caso, tome la decisin de dejarlas en el anlisis o de reportarlas
de manera separada.
Ejercicio 2.9 En un estudio de vida acelerada, se estudia la duracin efectiva
de 4 tipos de focos, los cuales se someten a una carga acelerada de 40 kV. En
la siguiente tabla se muestran los datos que se han obtenido al someter a ese
esfuerzo a cuatro tipos de ellos. La variable de respuesta es la duracin en horas
de los focos.
Tipo de foco
f1
f2
f3
f4
25:6 22:9 18:4 10:5
12:9
3:6 12:6
9:6
10:9
5:3
4:5 20:3
28:3 11:6
2:5 15:8
17:8
8:5 10:5
9:7
efecto y i
y
1. Se puede armar que el tiempo de vida promedio de los focos diere segn
su tipo?

2.6. Ejercicios

65

2. Verique los supuestos para tal armacin.


Ejercicio 2.10 Los siguientes datos se obtuvieron de la calibracin en una
prueba no destructiva de tensin en seis muestras de cable, realizada por tres
diferentes laboratorios, denominados A, B y C. Cada laboratorio repiti dos veces
la medicin. Las mediciones se recogen en la siguiente tabla:
muestra / laboratorio
1
2
3
4
5
6

A
48
49
50
52
52
48

49
49
52
49
51
48

B
50
50
48
52
51
49

C
51
51
49
53
51
50

51
52
50
53
52
50

51
53
50
52
52
51

1. Describa a detalle cmo debe realizarse el experimento para que el anlisis


ayude a averiguar cundo hay una diferencia apreciable en las medias de
las pruebas realizadas por los laboratorios.
2. Construya la tabla del ANDEVA.
3. Escriba la hiptesis y realice la prueba.
Ejercicio 2.11 Se desea seleccionar un nuevo tipo de llantas de entre cuatro tipos disponibles (A, B, C, D). Aunque las condiciones de uso pueden ser
simuladas en un laboratorio, se desea probar las llantas en condiciones reales de
manejo. La variable a ser medida como variable de respuesta es la diferencia
de grosor mxima de la llanta despus de 20000 kms. Proponga al menos tres
diferentes diseos experimentales para realizar el experimento, argumentando
razones y posibles ventajas entre los diseos propuestos. Considere que tiene a
su disposicin cuatro automviles, y por ende cuatro choferes, as como cuatro
llantas para cada tipo.
Ejercicio 2.12 En un estudio sobre la efectividad de publicidad subliminal, un
grupo de sujetos se someten a un estudio en el que se les muestran tres pelculas
con la publicidad subliminal de un producto. Se evalan en cada sujeto, antes y
despus de la pelcula, las actitudes u opinin sobre el producto.
1. Cmo realizara el experimento?
2. Para esta situacin, se debera proponer un tratamiento control? Explique
su respuesta.
3. Considera que pueden existir otros factores en el estudio?

66

2. Diseo con un factor

Ejercicio 2.13 En Nelson (1982), aparece un estudio de prueba de vida acelerada realizada en un cierto tipo de calentadores. Los tratamientos son cuatro
diferentes temperaturas a las que se sometieron esos calentadores para estimar su
periodo de vida. Seis de stos se utilizaron en cada temperatura, y en este caso la
variable de respuesta es el nmero de horas en el que fallaron. Las temperaturas
y las respuestas se muestran en la siguiente tabla:
Temperatura

efecto y i

1520
1953
2135
2471
4727
6134
6314

1620
1190
1286
1550
2125
2557
2845

1660
651
837
848
1038
1361
1543

1708
511
651
651
652
688
729

1. Usando las tcnicas de gracacin descritas en este captulo, diga si se


satisfacen los supuestos para realizar el anlisis de la varianza.
2. Proponga una transformacin para los datos de este diseo y repita el anlisis grco para vericar los supuestos.
Ejercicio 2.14 Un mdico y un nutrilogo se dedican a investigar qu tipo de
dieta produce una reduccin en los niveles de colesterol (mg/dl). Ellos suponen que la edad puede ser un factor que ocasione unidades experimentales no
homogneas en sus tres dietas, por lo que consideran quince sujetos divididos
en cinco grupos de edad. Miden el nivel de colesterol de las personas al inicio
de la investigacin y al cabo de seis semanas los resultados (cambios debidos)
reportados son:
Dietas
Grupos de edad
entre 16 y 25
entre 26 y 35
entre 36 y 45
entre 46 y 55
entre 56 y 65

D1

D2

D3

28:6
15:5
21:5
17:8
14:5

13:8
4:8
10:8
16:1
9:4

6:5
5:1
6:2
8:8
7:9

1. Est usted de acuerdo en que la edad deber ser usada como bloque? Argumente su respuesta.
2. Realice el anlisis de la varianza.

2.6. Ejercicios

67

3. Obtenga los residuales y haga las grcas correspondientes para vericar


los supuestos.
4. Se puede concluir que alguna de las dietas reduce signicativamente el colesterol, cul? Justique su respuesta.
Ejercicio 2.15 Se proponen cuatro diferentes tipos de sensores (S1; S2; S3;
S4) para controlar la temperatura de refrigeradores de uso domstico. Se desea
establecer cul de estos sensores hacen que un refrigerador haga el tiempo (minutos) de paro en el menor tiempo, y que las condiciones de enfriamiento sean las
mismas en todos los casos. En el estudio previo que llev a cabo el ingeniero del
proyecto, identic dos fuentes de variacin: el proveedor y el tipo de refrigerador.
La estrategia experimental que se plantea para comparar estos sensores corresponde a un diseo en cuadrado latino. Los datos que le gener el experimento
son:
RnP 1
2
3
4
1
S2 : 6:65 S4 : 4:63 S1 : 9:79 S3 : 8:54
2
S1 : 8:84 S2 : 7:01 S3 : 9:05 S4 : 5:10
3
S3 : 8:36 S1 : 9:93 S4 : 4:03 S2 : 6:47
4
S4 : 4:78 S3 : 9:13 S2 : 6:20 S1 : 9:50
R: Tipo de Refrigerador, P : Proveedor
1. Indique cmo llevara a cabo el proceso de aleatorizacin.
2. Plantee la pruebas de hiptesis estadsticas.
3. Haga un anlisis de residuales e interprete las grcas.
4. Pruebe la hiptesis, interprete y sugiera recomendaciones.
Ejercicio 2.16 Un ingeniero industrial est probando cuatro formulaciones en
un proceso de mezclado con la nalidad de estudiar la dureza de un producto.
Las frmulas representan los tratamientos, stos se designan con A, B, C, D respectivamente. El objetivo es contrastar los promedios de las formulaciones para
conocer la existencia de alguna diferencia en la dureza del producto. El experimento se realiz aleatorizando las formulaciones. Por ejemplo, con la frmula
resultante de la primera aleatorizacin se lleva a cabo el proceso, se toma una
muestra del producto y se mide la dureza; este procedimiento se repiti 16 veces de tal manera que cada uno los tratamientos tuviera cuatro mediciones. Los
resultados se presentan en la siguiente tabla.

68

2. Diseo con un factor

A
45
48
31
33

B
23
45
27
32

C
36
24
23
43

D
30
37
28
41

total yi
yi
Si2
bi
ni
gli

Planteamiento estadstico: escriba la hiptesis estadstica para corroborar si


hay una diferencia entre tratamientos.
H0 :
H1 :
Desarrolle la prueba de hiptesis, para ello escriba la tabla del ANDEVA.
Fuente de
variacin
Tratamientos
Error
Total

Suma de
cuadrados

Gl

Cuadrados
medios

Valor p

Qu concluye? Calcule el residual e21 :


Diseo en bloques
El ingeniero observ que los operadores que realizaron la formulacin eran
un factor de ruido, as que consider homogenizar las unidades experimentales,
para ello decidi que cada operador deba hacer cada una de las frmulas. El
experimento en este caso se realiza aleatorizando los cuatro tratamientos para
cada uno de los operadores. Aleatorice tratamientos.
Tratamientos
O1
O2
O3
O4
En trminos estadsticos cuando los niveles de un factor se utilizan para homogeneizar las unidades experimentales se reere como bloques, en este ejemplo

2.6. Ejercicios

69

se dice que los operadores desempean el papel del bloque. Los resultados de
realizar el experimento homogenizando las unidades experimentales en bloques
son:

O1
O2
O3
O4
y
yi
bi

A
45
33
31
48

B
45
23
27
32

C
36
23
24
43

D
37
30
28
41

bj

Planteamiento estadstico: escriba la hiptesis estadstica para probar la existencia de una diferencia en este experimento.
H0 :
H1 :
En qu radica la diferencia con el experimento anterior?
Desarrollo de la prueba de hiptesis, complete la tabla del ANDEVA.
Fuente de
variacin
Tratamientos
Bloques
Error
Total

Suma de
cuadrados

gl

Cuadrado
medio

Valor p

Qu concluye?
Cmo calcula el cuadrado medio de bloques y del error?
Calcule el residual e21 :
Diseo en Cuadrado latino
Pueden existir otros factores de ruido como proveedores o das. En ese caso
es necesario realizar un doble bloqueo con el n de homogenizar las unidades
experimentales (UE). En el caso del ejemplo que se estudia, se considera que los
proveedores son otro tipo de ruido. De esta manera el arreglo experimental que
se requiere es el siguiente:
O1
O2
O3
O4

P1
A
B
C
D

P2
B
C
D
A

P3
C
D
A
B

P4
D
A
B
C

70

2. Diseo con un factor

O1
O2
O3
O4

P1
45
23
24
41

P2
45
23
28
48

P3
36
30
31
32

P4
37
33
27
43

El planteamiento estadstico sigue siendo probar la igualdad de tratamientos,


ahora bajo este esquema de homogenizacin de las UE por proveedores y operadores. El clculo que se agrega a este esquema es el cuadrado medio del segundo
bloqueo o tipo de ruido, que en este caso son los proveedores; c es el tamao del
bloque 2.
Obtenga el Cuadrado Medio de este bloqueo. La tabla del anlisis de la
varianza es:
Fuente de
variacin
Tratamientos
Bloque oper.
Buque prov.
Error
Total

Suma de
cuadrados

gl

Cuadrado
medio

Valor p

Obtenga sus conclusiones.


Calcule el residual e212 :
Observe estos resultados en un paquete estadstico.
Proponga un ejemplo en su rea de trabajo donde sea de inters un diseo en
cuadrado latino.

Ejercicio 2.17 (Montgomery 1984). Se usan tres mquinas distintas para producir bras monolamentares para una compaa textil. Existe inters por determinar si hay diferencia en la resistencia a la ruptura de la bra producida por las
tres mquinas. La resistencia de una bra depende de su grosor, y se considera
que son ms resistentes las de mayor grosor. Se realiza un diseo completamente
al azar, cada tratamiento tiene cinco UE, donde la unidad experimental es un
fragmento de bra. La variable de respuesta (y) es resistencia a la ruptura de
una bra, la covariable (x) el grosor de la bra, independiente del factor tipo de
mquina que la produce. Los datos se recogen en la tabla siguiente:

2.6. Ejercicios

71

Mquina

1
y
36
41
39
42
49

2
x
20
25
24
25
32

y
40
48
39
45
44

3
x
22
28
22
30
28

y
35
37
42
34
32

x
21
23
26
21
15

1. Graque los datos. Bosqueje una lnea en cada tratamiento, stas tienen
la misma pendiente?
2. Obtenga la tabla del ancova e interprtela.
3. Obtenga la tabla del ANDEVA sin considerar la covariable, saque sus conclusiones con referencia a la igualdad de mquinas. Qu diferencias puede
detectar en ambas tablas?
4. Estime el parmetro (2.27) que representa la pendiente en el modelo.
5. Obtenga las medias para los tratamientos sin considerar la covariable y
ajustadas por la covariable, qu observa?
6. Seale algunas ventajas del anlisis de covarianza.
Ejercicio 2.18 En una industria qumica, un ingeniero aplica tres diferentes
concentraciones de un catalizador para aumentar la produccin de un proceso.
Se cree que una cierta cantidad de impurezas en la materia prima afecta la produccin. Se realiza un diseo completamente al azar y en cada unidad experimental
se mide la cantidad de impurezas (X) y la produccin (y). El registro de la
informacin se muestra en la siguiente tabla.
Catalizador: i

%1
y1j
21:5
19:4
18:2
21:8
20:4

X1j
5:2
4:1
2:6
5:0
3:2

%2
y2j
20:6
17:5
20:5
17:8
16:3

X2j
7:7
3:8
7:3
6:4
4:8

%3
y3i
13:6
14:7
15:8
15:2
16:6

X3j
3:3
4:6
7:6
5:5
6:7

1. Graque los datos. Bosqueje una lnea en cada tratamiento, stas tienen
la misma pendiente?

72

2. Diseo con un factor


2. Obtenga la tabla del ancova e interprtela.
3. Estime el parmetro (2.27) que representa la pendiente en el modelo.
4. Obtenga las medias para los tratamientos sin considerar la covariable y
ajustadas por la covariable, qu observa?

Ejercicio 2.19 En la seccin 2.5 se describen cuatro situaciones que pueden


ocurrir en el anlisis de covarianza, a continuacin se presentan cuatro casos que
caracterizan esas situaciones. En un proceso donde se manufacturan lminas de
hule se tienen dos tratamientos (T1 y T2 ) para un sistema de pegado. Como
covariable se mide el ujo inyeccin (x) y la variable de respuesta es la resistencia
al despegado (y). La tabla de datos reporta cuatro situaciones, haga un diagrama
de dispersin en cada caso y discuta sus apreciaciones.
Caso 1

Caso 2

T1
y
30
32
37
27

T2
y

5
12
14
16

24
30
16
24

T1
y

5
11
13
16

35
31
38
34

Caso 3

T2
y

4
6
7
10

26
22
14
23

11
12
13
15

Caso 4

T1
y

T2
y

T1
y

T2
y

26
28
27
32

5
7
8
11

29
34
33
36

10
13
14
16

28
24
22
18

5
7
8
10

38
35
32
30

12
14
15
17

Captulo 3

Comparaciones mltiples
No debo buscar mi dignidad en el espacio, sino en el gobierno de
mi pensamiento. No tendr ms aunque posea muchos mundos. Si
fuera por el espacio, el universo me rodeara y me tragara como un
tomo; pero por el pensamiento yo abrazo al mundo.
Blaise Pascal

3.1

Recomendaciones iniciales

Un objetivo inicial de un experimento fue detectar estadsticamente diferencias


globales entre medias de tratamientos. En general, el resultado del ANDEVA si
bien es informativo, en aplicaciones no basta, ya que es necesario mayor detalle
con el n de identicar cul(es) tratamiento(s) es(son) mejor(es) o peor(es). Es
por ello necesario realizar pruebas especcas con tal n.
Los mtodos estadsticos son de ayuda para responder de manera eciente a
preguntas relevantes de la experimentacin; tales preguntas en una buena investigacin deben traducirse, antes de ver los datos, a hiptesis estadsticas para
su vericacin. A tales hiptesis se les llama planeadas. Una vez jadas estas
preguntas, no ser vlido, despus de ver los datos, el cambiar de parecer para
decir que las preguntas de inters corresponden a las diferencias observadas
ms grandes.
Dado lo anterior, en este captulo presentamos tres pruebas para detallar respuestas a preguntas planeadas sobre los tratamientos: la prueba de Tukey para
comparar todos los tratamientos por pares, la prueba de Dunnett para comparar
todos los tratamientos versus un control, y una prueba derivada de la Tukey para
el caso en que el inters sea identicar al mejor tratamiento en el sentido que
corresponda en el experimento. Adicionalmente se presenta la prueba de Sche

74

3. Comparaciones mltiples

que es til cuando ya se han visto los datos generados en el experimento, lo que
se llama comparaciones no planeadas, en las que se desea responder a preguntas
sugeridas por los datos.
Por otra parte, es recomendable que el nmero de comparaciones entre medias
(hiptesis) por realizar en el experimento, sea reducido, ya que en la medida
que este nmero crezca, adems de perder precisin para detectar diferencias
pequeas, se corren mayores riesgos de cometer errores inferenciales (por ejemplo,
decir que un tratamiento es mejor que otro cuando no lo es, o viceversa). Recuerde
que una prueba estadstica de una hiptesis lleva asociada el riesgo de rechazar
cuando no se debera, o de no rechazar la hiptesis cuando se debera. As,
para cualquier comparacin entre las medias se podra decidir que son diferentes
cuando realmente no lo son: el llamado error tipo I. Anlogamente, el error tipo
II, si se decidiera que las medias no son diferentes cuando lo son.
Si las comparaciones por hacer se conceptualizan como una familia de comparaciones, entonces al error tipo I correspondiente se le denomina error por
familia, y se denota su probabilidad por (F C); si las comparaciones fueran independientes entre s, se tiene que
(F C) = 1

(1

(P C))c

donde (P C) es la probabilidad de cometer el error tipo I en una comparacin,


y c es el nmero de comparaciones ortogonales (independientes).
Un ejemplo numrico de esta situacin es el siguiente, suponga que c = 6 y
(P C) = 0:05 con lo que (F C) = 0:265; que indica una posibilidad alta de
cometer un error inferencial. En el caso de dependencia entre comparaciones se
tienen los mismos problemas.
Las pruebas estadsticas presentadas en este captulo para comparar mltiples
medias entre s tienen la virtud de que jando una probabilidad de error tipo I
(F C), permiten explcitamente realizar todas las comparaciones de inters, sin
que crezca el riesgo de cometer un error inferencial.

3.2

Intervalos de conanza: diferencia de tratamientos

Hasta ahora hemos usado de manera intensiva el procedimiento estadstico de


prueba de hiptesis para contrastar diferentes hiptesis globales sobre respuestas
medias de tratamientos; en las comparaciones entre medias de tratamientos, que
en este captulo revisaremos, se utilizar otra de las herramientas fundamentales
de la inferencia estadstica, los denominados intervalos de conanza.
Un intervalo de conanza, aunque en esencia persigue el mismo objetivo que
una prueba de hiptesis, es decir hacer armaciones sobre un parmetro de in-

3.3. Comparaciones planeadas entre dos medias

75

ters, ste permite expresar por medio de un intervalo la incertidumbre sobre el


valor del parmetro. Por ejemplo, un parmetro de inters en el diseo experimental es = i
j , es decir la diferencia entre las respuestas medias de dos
tratamientos.
En general al construirse un intervalo de conanza para un parmetro , se
arma que con un nivel de conanza 100(1
)% se espera que 2 I(b); donde
I(b) representa un intervalo construido a partir de ^; una estimacin de ; por
ejemplo, si = i
j ; un estimador respectivo es
^=^
i

^ j = yi

Tpicamente el intervalo de conanza para


2b

Q(b; )

yj ;
ser de la forma
(ESb)

(3.1)

donde ESb representa el error estndar estimado de ^, Q(b; ) representa un


cuantil de orden de la distribucin muestral asociada a ^; y dependiente del
tipo de comparacin por realizar.
Debe sealarse que los intervalos representan una cuanticacin mnima de la
incertidumbre presente en el proceso de realizar armaciones sobre los parmetros
de inters. Otras incertidumbres en el contexto de experimentacin que no hayan
sido cuanticadas, obviamente no son consideradas.
Una ayuda visual en los paquetes estadsticos para facilitar la visualizacin de
las diferencias entre medias es el uso de letras como superndices: si dos promedios
tienen letras diferentes denota que son diferentes estadsticamente.

3.3
3.3.1

Comparaciones planeadas entre dos medias


Prueba de Tukey

Esta prueba permite comparar dos a dos todos los tratamientos. Potencialmente
en total se tendrn k2 comparaciones.
El estadstico propuesto por Tukey - Kramer se muestra en la expresin (3.2):
s
q(k; f; )
1
1
p
T =
CMerror
+
(3.2)
ni nj
2
donde q(k; f; ) es el rango estudentizado que vara para k tratamientos, f gl
para el error y el nivel de signicancia. Este valor aparece en la seccin de
Tabla F al nal del libro. CMerror como se recordar, representa al estimador de
la varianza del error experimental; ni y nj son los tamaos de muestra para cada
tratamiento.

76

3. Comparaciones mltiples
As las hiptesis por contrastar son
Ho :

=0

H1 :

6= 0

Si los datos apoyan a H1 , se dice que existe diferencia signicativa estadsticamente entre tratamientos.
Los intervalos de conanza correspondientes para comparar i y j resultan
ser
yi

yj

T <

< yi

yj + T

La prueba de Tukey est diseada para garantizar que todas las comparaciones
tengan en global una conanza del 100(1
(F C))%:
Ejemplo 3.1
Para los datos en el Ejemplo 2.5 los promedios se ordenan de mayor a menor,
luego se verica la hiptesis nula de igualdad de promedios
y 1 = 103:29

y 2 = 85:43

y 3 = 78:86

y 4 = 61:43:

El valor del estadstico de Tukey es:


3:90
T =(p )
2

2
20:91( ) = 6:74
7

donde q(4; 24; 0:05) = 3:90 (ver en la tabla de rangos estudentizados, Tabla F en
la seccin de Tablas).
(
(
(
(
(
(

1
1
1
2
2
3

4)

2
3) 2
2) 2
3) 2
4) 2
4) 2

(35:12;
(17:51;
(11:07;
( 0:17;
(17:26;
(10:68;

48:60)
31:17)
24:60)
13:31)
30:74)
24:16)

Se puede observar que las comparaciones del tratamiento 1 con los dems
tratamientos no contienen el valor cero, lo que indica que existe una diferencia
signicativa del tratamiento 1 con los otros tratamientos. Dentro del contexto del
Ejemplo 2.5 se ve que el tiempo de coccin cuando no se agregan las soluciones

3.3. Comparaciones planeadas entre dos medias

77

NaCl crece de manera importante. Otra conclusin en este caso es que los promedios en el tratamiento 2 y 3 son iguales, y diferentes en las otras comparaciones
esta situacin se representa por:
y4a
y3b
y2b
y1c
El tratamiento 4 es el que tiene un menor tiempo de coccin.

3.3.2

Prueba de Dunnett: comparaciones con un control

En muchos experimentos el inters es comparar con la respuesta media 0 de un


tratamiento control. Para estos casos se tiene la prueba de Dunnett. Desafortunadamente esta prueba tiene un potencial grande de abuso, ya que los investigadores al examinar sus datos pueden rpidamente concluir que las diferencias
entre el control y los grupos experimentales son las nicas de inters (porque las
medias de los grupos experimentales son similares); ello conduce a usar la prueba
de Dunnett, alcanzar signicancia y publicar sus resultados.
Suponga entonces que las diferencias de inters planeadas son:
0; i

= 1; :::; k

es decir en este caso slo hay k 1 comparaciones. El cmputo requerido en la


prueba de Dunnett es muy parecido al de la prueba de Tukey. En el caso de la
prueba de Dunnett computaremos una cantidad denotada por D como:
r
1
1
D = d(k 1; f; ) CMerror ( + )
ni n0
donde el cuantil d(k 1; f; ); f es igual a los gl correspondiente al error y los
valores del estadstico se encuentran en la Tabla G, en la seccin de tablas. As
si el intervalo i :
yi:

y0

D;

i = 1; :::k

contiene el valor cero, se considerar que:


i

Estos intervalos de Dunnett permiten que las k 1 armaciones realizadas


cuenten de manera simultnea con una conanza de 100(1
(F C))%:

78

3. Comparaciones mltiples

Ejemplo 3.2
Para los datos en el Ejemplo 2.5, pero ahora suponiendo que a priori slo interesa
comparar versus el tratamiento 1 como control) sin adicin de sal, se tiene que el
valor del estadstico de Dunnett es:
r
2
D = 2:51
20:91( ) = 6:14;
7
y tres comparaciones de inters:
(
(
(

1
1
1

2)

2 17:86
3 ) 2 24:43
4 ) 2 41:86

6:14
6:14
6:14

Se puede observar que los intervalos para las comparaciones con el tratamiento
1 no contienen el valor cero, lo que indica que existe una diferencia signicativa
del tratamiento 1 (control) con los otros tratamientos.
Es oportuno sealar que en general es recomendable que el nmero de replicaciones para el tratamiento control, n0 ; sea mayor que para los tratamientos
experimentales. Como regla prctica considere que, si n representa el promedio
de replicaciones por tratamiento, entonces es conveniente que
n0 p
= k:
n

3.3.3

Comparaciones mltiples con el mejor

Suponga que el inters planeado es determinar cul es el mejor tratamiento.


El mejor tratamiento, en un contexto numrico, puede ser aquel que produzca
la respuesta ms grande. Las comparaciones de medias a realizar se pueden
representar por:
i

maxj6=i (

j );

i = 1; :::; k

(3.3)

Si el mejor tratamiento es aquel que produce la menor respuesta, entonces las


comparaciones de inters seran:
i

minj6=i (

j );

i = 1; :::; k

(3.4)

Caso balanceado
Cuando el mejor tratamiento es aquel cuya media es ms grande, en el caso balanceado, Hsu (1996) mostr que el siguiente conjunto de intervalos simultneamente logran una conanza al menos de 1
:

3.3. Comparaciones planeadas entre dos medias


h

^i

maxj6=i ( ^j )

^i

maxj6=i ( ^j ) +

79

(3.5)

q
error
con i = 1; : : : ; k; donde = d 2 CM
, d es el valor crtico para la prueba de
n
una cola de Dunnett, d ( ; k 1; gl CM error) (ver Tabla G), y
= min f0; xg =

x si x < 0
;
0 otro caso

x+ = max f0; xg =

x si x > 0
:
0 otro caso

Para el caso entre ms pequeo mejor ser el tratamiento, el siguiente conjunto


de intervalos simultneamente logran una conanza al menos de 1
:
h

donde
para

q
=d 2

^i

minj6=i ( ^j )

CMerror
;
n

; ^i

minj6=i ( ^j ) +

(3.6)

con i = 1; : : : ; k; que son intervalos correspondientes


(

minj6=i (

j ))

(3.7)

Como ya se mencion, todos estos intervalos simultneamente garantizan un


nivel de conanza de al menos (1
)100%, es decir sern conservadores.
Caso desbalanceado
Para el caso desbalanceado (ni 6= nj ), cuando el inters es detectar el tratamiento
mejor con mayor media, los intervalos con una conanza simultnea de al menos
1
, estarn dados por:
Di ; Di+ ; i = 1; : : : ; k

(3.8)

donde:
Di+ = + minj6=i

^i

^j + di

q
CMerror (ni 1 + nj 1 )

identique:
G = i : Di+ > 0
y con ste compute:

80

3. Comparaciones mltiples

Di =

8
<

: minj

G;j6=i

^i

^j

0
si G = fig
q
o
otro caso
dj CMerror (ni 1 + nj 1 )

donde di es el valor crtico del mtodo de Dunnett de una cola suponiendo que
el tratamiento control es el i-simo. El cmputo de estos intervalos es como
sigue. Como primer paso identique a un tratamiento como el control, digamos
el i-simo. Obteniendo de la tabla del mtodo de Dunnett para una sola cola a
di , compute las cotas superiores para:
maxj6=i (

como
^i

^j + di

para toda j 6= i: Entonces


Di+ = + minj6=i

j );

q
CMerror (ni 1 + nj 1 )
^j + di

^i

i = 1; :::; k

q
CMerror (ni 1 + nj 1 )

la parte positiva del mnimo de tales cotas. Si cualquiera de las ^ i


^j +
q
1
1
i
d CMerror (ni + nj ) es negativa, indicar que el i-simo tratamiento no es

el mejor, entonces Di+ = 0: As G = i : Di+ > 0 es el conjunto de tratamientos posibles con la media ms grande. Si G = fM g, entonces el M simo
tratamiento slo es declarado el mejor tratamiento. As la cota inferior para el
M -simo tratamiento es 0 y:
Dj = ^ j

^M

dM

q
CMerror (nj 1 + nM1 )

para el j-simo tratamiento, j 6= M:


Si G contiene ms de un elemento, entonces compute cotas inferiores usando
slo tratamientos j que sean candidatos a ser el mejor tratamiento, como:
^i

^j

dj

q
CMerror (ni 1 + nj 1 )

y sea la parte negativa del mnimo de tales cotas:


Di = minj

G j6=i

^i

^j

dj

q
CMerror (ni 1 + nj 1 )

3.3. Comparaciones planeadas entre dos medias

81

la cota inferior de conanza para i maxj6=i ( j ): Para el caso de que el mejor


tratamiento es el ms pequeo, donde los parmetros de inters son i minj6=i ( j );
i = 1; : : : ; k; se obtienen anlogamente los intervalos a partir de:
q
i
Di =
maxj6=i ^ i
^j d CMerror (ni 1 + nj 1 )
G =

Di+

i : Di < 0
8
<

: maxi

G;j6=i

^i

0
si G = fig
q
o
otro caso
^j + dj CMerror (ni 1 + nj 1 )

Ejemplo 3.3

Una empresa procesadora de cereales est preocupada por apoyar a sus proveedores agrcolas de cereales; un problema es la presencia de escarabajos de hoja de
cereal que producen grandes mermas en la produccin. Una forma de combatir
la presencia daina de tales insectos es a travs de pizarrones recubiertos de una
sustancia pegajosa. Sin embargo existe la duda sobre cul es el color ms atractivo, de cuatro disponibles, para los insectos. En una parcela se distribuyen seis
pizarrones para cada color de manera aleatoria durante el mes de julio (en total
24 pizarrones, 6 de cada color). Despus de un perodo de espera razonablemente
conable se obtiene la respuesta; los resultados se muestran en la Tabla 3.1.
Tratamiento(color)
Niveles

^i

amarillo blanco rojo


azul
1
2
3
4
45
21
37
16
59
12
32
11
48
14
15
20
46
17
25
21
38
13
39
14
47
17
41
7
47:17 15:67 31:50 14:83

Tabla 3.1. Insectos atrapados por color


El diseo es de un factor en 4 niveles, y con aleatorizacin completa de
tratamientos. Despus de realizar la ANDEVA correspondiente, CMerror =
46:02: En este ejemplo k = 4; n = 6, gl = 20 y asumimos = 0:01: Por ende,
r
2CMerror
=d
= 2:97 3:917 = 11:633
6

82

3. Comparaciones mltiples

y con ello
1
2
3
4

maxj6=1 (
maxj6=2 (
maxj6=3 (
maxj6=4 (

j)
j)
j)
j)

( 0;
( 43:13;
( 27:30;
( 43:97;

27:30)
0)
0)
0)

amarillo
blanco
rojo
azul

Estos intervalos tienen simultneamente una conanza del 99%. Se concluye que
el color ms atractivo es el color amarillo. Para el primer intervalo, observe que
max(^ j ) = ^ 3 = 31:50
i6=j

entonces
max(^ j )) +

(^ 1

i6=j

= (^ 1

^3) +

= 15:67 + 11:63 = 27:30

similarmente para construir los siguientes intervalos.


Para el caso desbalanceado (ni 6= nj ) tenemos el siguiente ejemplo.
Ejemplo 3.4
En un estudio de propaganda sobre un producto alimenticio, se est estudiando
el grado de positividad para calicarlo despus de ver un anuncio publicitario
sobre las bondades del mismo. Tres segmentos del mercado objetivo se determinaron sujetos de promocin. Se recolect de personas de los tres segmentos
calicaciones en una escala de positividad (entre ms grande, mejor calicado).
De modo correspondiente, en el segmento 1 n1 = 103 sujetos, en el segmento 2
con n2 = 31 y en el segmento 3 con n3 = 122. La pregunta es cul de los tres
segmentos calic mejor al producto despus de recibir el mensaje publicitario?
Los resultados ya resumidos son los siguientes.
Segmento
ni
yi
Si

1
103
619
86

2
31
629
67

3
122
575
83

Por lo tanto,
CMerror =

102(86)2 + 30(67)2 + 121(83)2


= 6808:818
103 + 31 + 122 3

Aplique la expresin (3.8) con ( = 0:10) ; para este nivel de signicancia los
valores de crticos dj son: 1.605, 1.505 y 1.612.

3.4. El estadstico de prueba de Sche

1
2
3

maxj6=1 (
maxj6=2 (
maxj6=3 (

j)

83

( 35:44;
( 17:14;
( 78:98;

j)
j)

17:14)
35:44)
0)

El segmento que mejor respondi a la publicidad no es el 3, por otro lado,


los segmentos 1 y 2 son estadsticamente igual de positivos acerca del producto
promocionado.
Mndez Albores et al. (2003) aplicaron los mtodos descritos para comparar
procesos de nixtamalizacin de maz utilizado para la elaboracin de tortilla.

3.4

El estadstico de prueba de Sche

Para poder construir la respuesta especca a las preguntas planteadas, se formulan los contrastes entre las medias de tratamientos; un contraste se dene como
una combinacin lineal de las medias:
C=

k
X

ci

= c1

+ c2

+ ::: + ck

(3.9)

i=1

donde los coecientes de la combinacin c1 ; c2; :::; ck son tales que

k
P

ci = 0: Note

i=1

que un contraste de suma importancia y trabajado en la seccin anterior es


Sin embargo puede haber otros contrastes de inters.

j:

Ejemplo 3.5
En un proceso industrial se usan las maltodextrinas como sustituto de grasas en
la elaboracin de galletas o en harinas preparadas. Un ingeniero bioqumico produce maltodextrinas a partir de semillas de amaranto y tiene inters en comparar
las protenas que se obtienen de su producto con otros tres productos de maltodextrinas que generan los siguientes tratamientos: (1) comerciales, (2) almidn
de maz, (3) almidn de yuca. El nmero de UEs en cada tratamiento es igual a
tres. El resumen estadstico de su experimento se muestra en la Tabla 3.2.
Las preguntas que se ha hecho el ingeniero sobre el contenido de protena:
1. Tiene mayor contenido de protena la maltodextrina elaborada con semilla
de amaranto con respecto a las otras tres?
2. La maltodextrina producida con semilla de amaranto contiene mayor protena que la comercial?

84

3. Comparaciones mltiples
3. La protena contenida en la maltodextrina elaborada con semilla de amaranto es mayor que la producida con los almidones?
tratamiento
bi = y i
Si2

amaranto
34:5
3:3

comercial
30:0
9:0

a. maz
34:0
7:0

a. yuca
27:0
7:0

Tabla 3.2. Resumen estadstico del contenido de protena


La tabla del anlisis de la varianza se describe en la Tabla 3.3.

Fuente de
variacin
Tratamiento
Error
Total

Grados de
libertad
3
8
11

Suma de
cuadrados
113:06
52:50
165:56

Cuadrado
medio
37:69
6:56

Fc

Valor p

5:74

0:0215

Tabla 3.3 ANDEVA para el problema de maltodextrinas


Los contrastes para el ejemplo se plantean mediante:
Primera pregunta: C1 =

1
(
3

4)

=0

si el efecto del tratamiento 1 es igual al promedio de 2, 3 y 4.


Segunda pregunta: C2 =

=0

si el tratamiento 1 es igual al 2.
Tercera pregunta: C3 =

1
(
2

4)

=0

si el tratamiento 1 es igual al promedio de los tratamientos 3 y 4.


En el primer caso los coecientes del contraste son c1i = (1; 13 ; 31 ; 13 ), en
el segundo c2i = (1; 1; 0; 0); nalmente el tercero c3i = (1; 0; 21 ; 12 ): La idea
es responder a las preguntas planteadas, nuevamente mediante un procedimiento
estadstico se hace inferencia sobre estos contrastes, construyendo intervalos de
conanza o haciendo pruebas de hiptesis sobre ellos.
Para tal n, se propone un estimador del contraste y se calcula su error
estndar, a partir de estos resultados se obtiene la estimacin de los intervalos de

3.4. El estadstico de prueba de Sche

85

conanza y la prueba de hiptesis sobre el contraste. Entonces un estimador del


contraste poblacional representado por la ecuacin (3.9) es:
b=
C

3.4.1

k
X

ci y i = c1 y 1 + c2 y 2 + ::: + ck y k

(3.10)

i=1

Contrastes ortogonales

Suponga que tiene dos contrastes como los indicados por la ecuacin (3.10), estos
son:
k
X
b
C=
ci y i = c1 y 1 + c2 y 2 + ::: + ck y k
i=1

b=
D

k
X

di y i = d1 y 1 + d2 y 2 + ::: + dk y k

i=1

b yD
b son ortogonales si la suma de los productos de los coeLos contrastes C
cientes es igual con cero, es decir:
k
X

ci di = c1 d1 + c2 d2 + ::: + ck dk = 0

i=1

En un experimento se pueden planear k 1 contrastes ortogonales, que as


tienen la propiedad de que la suma de cuadrados entre tratamientos es la suma
de las sumas de cuadrados correspondientes a cada uno de estos contrastes. La
ortogonalidad indica que la informacin que genera un contraste es independiente
de los otros.
Es importante resaltar que la seleccin de contrastes en un estudio no debe estar dictada slo por la ortogonalidad, sino que tambin stos se deben seleccionar
en funcin de las preguntas interesantes para el experimentador. Por ejemplo, en
el Ejemplo 3.3, los contrastes de inters no son ortogonales. Verifquelo.
Es conveniente no caer en la tentacin de construir contrastes con la nalidad
de reportar una diferencia signicativa.
Tambin, se pueden construir contrastes entre tratamientos con diferente
nmero de replicaciones.
Sche propuso un mtodo para construir intervalos de conanza de todos los
posibles contrastes, ortogonales o no; el mtodo opera adems garantizando una
conanza de 100(1
(F C))%. En consecuencia, el mtodo se considera muy
conservador por lo que generalmente se usa en comparaciones no planeadas.

86

3. Comparaciones mltiples
El intervalo de conanza para un contraste (3.9); es entonces:

donde:

b
C2C

p
p
CMerror (k

b=
C

k
X

1)F (k

v
u k
uX c2
i
1; v; (P C))t
ni

(3.11)

i=1

ci y i = c1 y 1 + c2 y 2 + ::: + ck y k

(3.12)

i=1

y F (k 1; v; (P C)) es el cuantil de orden (P C) de una distribucin de probabilidad F con k 1 y = gl de SCerror grados de libertad.
En el Ejemplo 3.3 los intervalos de conanza del 95% para los contrastes de
inters son:
C1 2 4:16
C2 2 4:50
C3 2 4:00

5:96;
7:30;
6:33:

Interprete los intervalos y saque sus conclusiones.


Existen otros mtodos estadsticos para realizar comparaciones mltiples, en
algunas situaciones, stos pueden tener alguna ventaja sobre los que hemos presentado en este captulo. Amplias discusiones terico estadsticas del uso de
estos mtodos vienen reportados en Chew (1980), Jones (1984), Carmer y Walter
(1985), Saville (1990) y Hsu (1996).

3.5

Formalizacin estadstica de la pruebas

En este apartado se vern los detalles tcnicos de las pruebas de comparaciones


mltiples a partir de Mndez (1976). En este sentido se recomienda al lector verlo
como consulta.

3.5.1

Prueba de Tukey

Los cuantiles utilizados corresponden a los de la distribucin de lo que se conoce


como amplitud estudentizada.
Modelo:
yij
"ij

+
N (0;

+ "ij
2

) independientes

3.5. Formalizacin estadstica de la pruebas

yi

87

y i0

(y i

y i0 )

i0 )

(y i

y i0 )

i0 )

N 0;

y i0 )

i0 )]

1=2

[2]

y i0 ) (
s
y i0 ) (
s

i0 )j

i0 )j

2
n

2
n

N [0; 1]

2 1=2
n

n1=2 [(y i

i0 ;

t[gl(s)]

Lo que se desea:
j(y i
max
i;i0

j(y i

8i; i0

Si
x1 ; :::; xt
iid N (0; 1)
max fxi g min fxi g
i
i
! amplitud estudentizada
h
i1=2
2 =v
(v)
Ya se obtuvo su distribucin (ver por ejemplo Hsu, 1996) y sus cuantiles, por
ende q( jf; v); mostrados en la Tabla F descrita en el anexo de tablas, donde
= nk k.
N( +

yi
p

(y i

i)

1
n

N (0; 1)

k)s2

(nk

i;

2
(nk k)

Luego entonces:
p

n max
i

yi

n max fy i
i

min
i

(nk k)s2
nk k

ig

i1

min fy i
i

yi

ig

q(k; nk

k)

88

3. Comparaciones mltiples
Bajo H0 :

n max fy i

= ::: =
ig

min fy i

ig

n max fy i g
i

min fy i g
i

Por lo tanto:
P

maxfy i g minfy i g
i
p i
s= n

P max fy i g
i

P max jy i

=)

ps q 1
n k;nk 1

min fy i g
i

y i0 j

i;i0

1
qk;nk

ps q 1
n k;nk 1

=)

La ltima expresin nos dice entonces que la probabilidad de cometer el error


tipo I est ja. Por lo tanto la prueba de Tukey queda como sigue:
Se rechaza H0 si:
jy i

3.5.2

y i0 j

s 1
p qk;nk
n

para

6=

i0 ;

a un nivel

8i; i0

Prueba de Dunnett

La prueba de Dunnett es utilizada para comparaciones mltiples versus un control, por lo tanto se tendrn k 1 comparaciones del tipo i
0 , i = 1; 2; :::; k 1
donde 0 representa el control. Un intervalo para i
0 es:
I(

0)

(y i

y i0 )

d1

(k

1; f ) s2

1
1
+
n1 n0

1=2

donde d1 (k 1; f ) son los cuantiles de una cierta distribucin. Si I( i


0)
contiene al 0 entonces i = 0 a un nivel : As la formalizacin de esta prueba
se basa en la distribucin de Dunnett, cuyos cuantiles se muestran en la Tabla G
en el anexo de tablas.
Sea x0 ; x1 ; :::; xk 1 una muestra aleatoria independiente distribuida por una
normal cero, uno, luego entonces:
maxxi x0
i
p
2
1=2
2
(v)

distribucin Dunnet

3.5. Formalizacin estadstica de la pruebas

89

Por lo tanto:
2

6
6
P6
4

Debido a que:

maxxi x0
i
p
2
1=2
2

7
7
1;v 7 =
5

dk1

(v)

yi

N( +

(y i

i)

i;

Adems, si hacemos:
xi =

N (0; 1)

Y sabiendo que:
k)s2

(nk

2
nk k

Llegamos al siguiente resultado:


8
>
ip y 0 +
< jyi
2
max
h i1=2
i >
2
s
:

= ::: =

k 1

U Dunnet

se tiene que:

y0 j

P max jy i

9
>
=
>
;

Bajo H0 :

0j

dk1

1;nk k

s
2p
=
n

Por lo tanto con la Prueba de Dunnett armamos que


2 1=2
s; i = 1; :::; k 1:
n

d1k 1;nk k

3.5.3

6=

si jy i

y0 j

Intervalos de conanza de Sche para contrastes

El intervalo de conanza de Sche tiene la siguiente forma:


b
c

1=2

[CM error]

(k

1) Fk1 1;v

i1=2 P c2
i
ni

1=2

La justicacin de por qu este intervalo es de esta manera, surge de la reparametrizacin del modelo yij = + i + "ij , donde los errores son independientes

90

3. Comparaciones mltiples
2:

distribuidos con media 0 y varianza constante


modelo con la siguiente forma:
yij =

La reparametrizacin deja al

+ "ij

En forma matricial tenemos:


Y = X + " con "

N (0;

I)

La solucin por mnimos cuadrados es:


b = (X 0 X)

XY

La distribucin muestral del estimador cumple con lo siguiente:


b

s2 =
p)s2

(n

(X X) 1
0
bX0 Y
Y Y
; donde E[s2 ] =
n p

N( ;

2
n p

b y s2 independientes

Sea b un subconjunto de b ; b 2 Rd ; d < p; entonces:

1
2

(b

) w (b
0

(b
h
P (b

) w (b

) w (b
ds2
)

ds2 F

N (0;

2
d

)
;n p

N( ;

); w > 0 =)

) =)

=)
;n p

=)

= 1

Por la desigualdad de Cauchy-Schwarz extendida

(b

) w (b

(b

) w (b

h 0
u (b

i2
)

para cualquier u =)
[u0 wu]
h 0
i2
u (b
)
) = max
[u0 wu]
u2Rd

3.6. Ejercicios

91

Luego entonces:
"

P max

u2Rd

"

i2
)

u (b

[u0 wu]
0

P max

u (b

0
u2Rd [u wu]

"

u (b

1=2

u (b

P ub

1
ds2 Fd;n

i1=2

1
dFd;n
p

h
1
s dFd;n

[u0 wu]

3.6

1=2

)
h
1
s dFd;n

=1

; 8u = 1
0

pu

i1=2
p u wu

i1=2

h
1
s dFd;n

=1

i1=2
wu
; 8u = 1

Ejercicios

h
1
u b + s dFd;n
0

i1=2
; 8u = 1
p u wu
0

Ejercicio 3.1 Considere el Ejercicio 7 del Captulo 2. Realice comparaciones


mltiples para determinar el mejor tratamiento.
Ejercicio 3.2 Se compilan los datos de ventas que se realizaron en diferentes
establecimientos que producen equipo electrnico, estos permitirn evaluar si
existe una mejora en la productividad con respecto al ltimo ao, la productividad
se mide en una escala de 0 a 100. Se toma una muestra de establecimientos, los
cuales se clasican por su nivel promedio de ventas en los siguientes niveles:
bajo, moderado, alto; se ha considerado la informacin de ventas obtenida en
aos anteriores.
Establecimiento

bajo(1)
79
82
68
59
67
65
62

medio(2)
70
81
95
86
78
79
83

alto(3)
87
97
98
78
96
95
86

1. Obtenga los promedios y varianzas, haga un anlisis descriptivo.

92

3. Comparaciones mltiples
2. Obtenga la tabla ANDEVA y pruebe la hiptesis correspondiente Cul es
su conclusin?
3. Estime un intervalo de conanza para L =

3(

= 0:05)

4. Graque los residuales. Qu observa? Se satisfacen los supuestos?


5. Obtenga todas las comparaciones dos a dos de las medias.
Ejercicio 3.3 Retome el Ejercicio 4 del Captulo 2. Diga si existen diferencias
entre cada una de las presentaciones. Calcule los intervalos de conanza.
Ejercicio 3.4 Con los resultados del Ejercicio 5 del captulo anterior, realice
las comparaciones mltiples con el mejor.
Ejercicio 3.5 Determine el efecto de varios mtodos de enseanza en el aprendizaje en matemticas, 30 alumnos se asignan a cinco tratamientos empleados
en diferentes grupos escolares, de cada grupo se seleccionan seis estudiantes. Los
tratamientos son como sigue:
Tratamiento
1
2
3
4
5

Descripcin
Libro: cuaderno de trabajo
Libro A con maestro
Libro A con computadora
Libro B con maestro
Libro B con computadora

Al nalizar el semestre se registran los siguientes resultados:


Tratamiento
Totales
Fuente de
variacin
Tratamiento
Error
Total

Grados de
libertad

1
120

2
600

Suma de
cuadrados
408

3
720

Cuadrado
medio

458
Tabla del ANDEVA

1. Discuta cmo realizara el experimento.

4
240

5
420
Fc

Valor p

3.6. Ejercicios

93

2. Complete la tabla ANDEVA y pruebe la hiptesis correspondiente Cul


es su conclusin?
3. Proponga un conjunto de contrastes ortogonales que le parezcan razonables
para los tratamientos descritos.
4. Construya el intervalo de conanza para
5. Estime el error estndar de L =

k
P

i=1

signica que L = 0?

ci

2:

(ci = 4; 1; 1; 1; 1 ) Qu

Ejercicio 3.6 Considere el Ejercicio 8 del Captulo 2. Con la informacin


disponible sugiera qu tipo de comparaciones mltiples seran adecuadas de realizar y llvelas a cabo.
Ejercicio 3.7 Dada la creciente necesidad de estudiar la vida de anaquel, un
bioqumico planea un experimento en un diseo unifactorial completamente al
azar para conocer el tiempo de vida (en das) de un jarabe envasado en una botella
de plstico biodegradable. Adems del tiempo de vida el bioqumico desea saber
el costo por unidad del tiempo de vida. As que la variable de respuesta es el
tiempo de vida por costo de unidad, sta se obtuvo dividiendo el tiempo de vida
por el costo unitario. l plantea cuatro tratamientos con la caracterstica de que
los dos primeros corresponden a un idntico proceso de elaboracin del producto.
Los tratamientos tres y cuatro son un nuevo sistema de conservacin. As que su
experimento tiene por metas probar las diferencias entre s de los primeros dos
tratamientos, la diferencia entre los ltimos dos tratamientos, y la diferencia que
existe entre el primero y segundo con respecto al tercero y cuarto tratamientos.
Los resultados experimentales son:

1
2
3
4
62 93 45 48
54 79 49 57
52 83 41 48
59 90 38 46
Tiempo de vida por unidad de costo
1. Plantee la hiptesis a probar para los cuatro tratamientos.
2. Calcule la tabla del ANDEVA.

94

3. Comparaciones mltiples
3. Plantee las hiptesis para que el bioqumico verique sus metas.
4. Describa las hiptesis en trminos de contrastes.
5. Verique si estos son ortogonales.
6. Pruebe las hiptesis del inciso 3, indique en cada caso qu prueba de comparaciones es ms adecuada.

Ejercicio 3.8 (Adaptado de Wu y Hamada, 2000). En una planta productora


de papel, la operacin de la planta se juzga de acuerdo a la brillantez de la pulpa
medida por un medidor de reectancia. Se tomaron muestras de cada uno de los
cuatro operadores que hacan hojas a partir de pulpa sin blanquear. Se realizaron
las mediciones de brillantez de cada una de las hojas producidas como se muestra
en la tabla siguiente.
operador
1
2
3
4
59:8 59:8 60:7 61
60:0 60:2 60:7 60:8
60:8 60:4 60:5 60:6
59:9 60:9 60:5
60:0
60:5
Uno de los objetivos del experimento era determinar si existan diferencias en
brillantez dependiendo del operador, con el n de identicar capacitadores. Si
se considera que entre ms brillantez mejor, realice las comparaciones de medias
adecuadas y obtenga sus recomendaciones.

Captulo 4

Estructura de tratamientos
factorial
La ciencia se basa en dos actividades: percepcin y reexin.
Las dos cosas tienen que ver con la realidad de este mundo
y las dos son, en el fondo, dos formas de conversacin. La percepcin de la realidad empieza por ver, mirar (detener la vista) y observar (detener la mirada),pero suele acabar en algo ms comprometido:
experimentar. Para experimentar, el investigador provoca a la naturaleza, la naturaleza contesta lo que puede estimular al cientco a una
nueva provocacin, es decir una nueva pregunta, es una conversacin
genuina en la que cada nuevo experimento depende del resultado anterior. Experimentar es conversar con la naturaleza. La reexin es
la actividad que media entre cada experimento y la creacin de un
resultado.

Jorge Wagensberg

4.1

Anlisis con un solo factor

En cualquier proceso de manufactura, en un desarrollo tecnolgico o en la explicacin de algn fenmeno, es muy comn que intervengan dos o ms factores de
inters. Si el conocimiento del rea hace necesario estudiar experimentalmente
los efectos que tales factores tienen sobre una o varias variables de respuesta, es

96

4. Estructura de tratamientos factorial

necesario disear estrategias ecientes para el estudio de dos o ms factores mediante los llamados diseos factoriales. Sin embargo, en muchos casos por falta de
conocimiento de estos diseos factoriales el experimentador se siente ms seguro
con una estrategia conservadora denominada OFAT por las siglas en ingls de
one - factor - at - a - time. Sobre este conservadurismo en la investigacin
experimental, R. Fisher coment: En exposiciones del uso cientco de experimentacin es frecuente encontrar un nfasis excesivo sobre la importancia de
variar condiciones de una en una. El experimentador interesado en las causas
que contribuyen a un cierto efecto supone, por un proceso de abstraccin, aislar
estas causas en un nmero de ingredientes elementales, o factores; adems supone,
al menos para propsitos de exposicin, que establecer condiciones controladas
en las que estos factores excepto uno puedan ser mantenidos constantes, y entonces estudiar los efectos de este factor, es esencialmente el enfoque cientco
a una investigacin experimental. Esta doctrina ideal parece estar ms cercanamente relacionada a exposiciones de teoras fsicas elementales que a la prctica
laboratorial en cualquier rama de la investigacin; en el estado de conocimiento
o ignorancia en el que la investigacin genuina, con el objetivo de avanzar el
conocimiento, es realizada, esta frmula simple no es muy til. Ms recientemente, Wu y Hamada (2000) comentan lo siguiente: Un enfoque comnmente
usado en investigaciones cientcas o ingenieriles es: i. identicar el factor ms
importante, ii. investigar este factor por s mismo, ignorando otros factores, iii.
hacer recomendaciones sobre cambios (o no) de este factor, y iv. moverse hacia el
siguiente factor ms importante y repetir pasos ii. y iii. Las iteraciones nalizan
cuando una solucin satisfactoria es encontrada. En la situacin ms afortunada,
puede terminar despus de estudiar slo un factor o puede estudiar varios factores
al mismo tiempo. Por comparacin con un diseo factorial, el OFAT tiene las
siguientes desventajas:
1. Requiere ms corridas (pruebas experimentales) para la misma precisin en
la estimacin de efectos.
2. No puede estimar interacciones.
3. Las conclusiones de su anlisis no son generales.
4. Puede perder condiciones ptimas de factores.
Por medio de un ejemplo ilustremos lo anterior en el contexto de un experimento hipottico sobre un proceso de moldeo por extrusin que est generando
un porcentaje inaceptable de productos quemados. Suponga un diseo 23 en
un experimento que estudia a tres factores. Los factores y sus niveles son P :
presin de inyeccin (1200 - 1400 psi), R: control de rpm del tornillo (0.3 - 0.6

4.1. Anlisis con un solo factor

97

vueltas contrareloj), S: velocidad de inyeccin (lento - rpido). La tabla siguiente


muestra el diseo y porcentajes de productos quemados en cada condicin.
P
1200
1200
1200
1200
1400
1400
1400
1400

R
0.3
0.3
0.6
0.6
0.3
0.3
0.6
0.6

S
lento
rpido
lento
rpido
lento
rpido
lento
rpido

y % quemado
11
17
25
29
02
09
37
40

Con el n de ilustrar las cuatro desventajas anteriores, seguimos la versin


bien denida del OFAT para propsitos de comparacin, descrita en la Fig. 4.1.
Paso 1. Factor P se piensa que es el ms importante. Fijando los otros dos
factores en condiciones estndar (R = 0:6, S=rpido), dos niveles de P en 1200 y
1400 son comparados. Aqu P = 1200 es seleccionado dado que da un porcentaje
menor al de P = 1400.
Paso 2. El siguiente factor ms importante se piensa es R. Fijando P = 1200
del paso 1 y S =rpido (condicin estndar), los dos niveles de R 0.3 y 0.6 son
comparados. Aqu R = 0:3 es mejor que R = 0:6 dado que tiene menor porcentaje
de producto quemado.
Paso 3. Se siente que puede haber ganancias adicionales si consideramos el
factor S. Los dos niveles de S son comparados con P = 1200 y R = 0:3 jados
por los dos pasos anteriores. El nivel S = lento es seleccionado debido a que
muestra un porcentaje menor de quemados que S = rpido.
Para explicar la primera desventaja de OFAT versus el factorial, se puede
mostrar que con OFAT se requiere tomar cuatro observaciones en el nivel bajo
y en el nivel alto de P (con R = 0:6, S = rpido), para que el efecto de P tenga
la misma precisin (i.e. varianza) que el efecto estimado de P mediante el diseo
factorial. Lo mismo ocurre con las precisiones de los efectos de R y S por OFAT
respecto a las precisiones logradas por el factorial. As en total se tendran 16
observaciones por tomar usando OFAT.
La segunda desventaja del enfoque OFAT se puede apreciar de manera evidente, ya que ninguna de las interacciones se puede estimar de las observaciones
obtenidas con este enfoque experimental. Por ejemplo para estimar la interaccin de P con R se requieren observaciones en (1200,0.3), (1200,0.6), (1400,0.3)
y (1400,0.6); no se tendra dato en (1400,0.3) y por lo tanto no es estimable la
interaccin mencionada. Expertos del rea pueden saber a priori cules son los

98

4. Estructura de tratamientos factorial

Fig. 4.1: Estrategia para analizar slo un factor


efectos principales importantes pero difcilmente podrn anticipar interacciones.
Los diseos factoriales s dan la posibilidad de estimarlas.
La regin experimental no es explorada de manera completa por la estrategia
OFAT; los efectos estimados de un factor en un diseo factorial son promedios
en mltiples combinaciones de los otros factores, lo que no sucede en OFAT pues
el efecto es estimado con niveles jos de otros factores de control. Esto ltimo
resta generalidad a las conclusiones puesto que es una situacin no realista.
Finalmente, en el ejemplo, dado que hay una interaccin importante entre
P y R, la seleccin va OFAT no es la ptima ya que la condicin P = 1400,
R = 0:3, S = lento o rpido, da mejores resultados que los obtenidos por OFAT.

4.2

Diseos con ms de un factor

A continuacin se presentan algunos ejemplos en donde es necesario estudiar los


efectos de varios factores, ya que los diseos factoriales responden a una estructura
de tratamientos producto de todas las combinaciones de los niveles de los factores
de inters. En este captulo se estudiar la forma de estimar efectos y contrastar
hiptesis sobre los efectos, partiendo de diseos factoriales. Cabe mencionar que
se supondr, por lo pronto, que la estructura de diseo no contempla la presencia
de factores de ruido de importancia. Se presentar material sobre algunos diseos

4.2. Diseos con ms de un factor

99

factoriales considerando factores de ruido en un captulo posterior.


Por otra parte, se presentarn diseos factoriales balanceados, es decir que
cada tratamiento es aplicado aleatoriamente en el mismo nmero n de UE.
A continuacin se presentan algunos ejemplos en donde es necesario estudiar
los efectos de varios factores.
Ejemplo 4.1
En la produccin de tarjetas con circuitos impresos interviene ms de un factor,
la meta es determinar cules de estos factores que conforman el proceso en la
mquina soldadora inuyen en la aparicin de defectos de soldadura.
El grupo de ingenieros del proceso han considerado los siguientes factores:
temperatura de la soldadura, temperatura de precalentado, velocidad de la banda
transportadora, tipo de fundente, ngulo de la banda transportadora, densidad
relativa del fundente.
Ante esta situacin, el objetivo es establecer una estrategia experimental con
los diferentes factores para averiguar cules de ellos tienen una mayor inuencia
en el porcentaje de puntos de soldadura o en la produccin de tarjetas defectuosas.
Ejemplo 4.2
La adhesividad de un pegamento depende de la presin y de la temperatura al
ser aplicado. La presin (N/m2 10 4 ) puede ser (174:0; 188:5; 203:0 o 217:5),
y la temperatura (o C) puede ser (50; 60 o 70). De este modo se tiene un diseo
factorial con 3 4 = 12 tratamientos.
Se puede observar que el nmero de tratamientos aumenta cuando se tienen
ms factores o crece el nmero de niveles de los factores. As por ejemplo, con
cuatro factores de cuatro niveles cada uno, implicara 4 4 4 4 = 256 tratamientos y la aplicacin prctica de esta estructura de tratamientos resulta demasiado
laboriosa, adems de que el gasto econmico sera muy alto.
El tipo de diseo factorial que se utilice ser muy importante para lograr
la precisin deseada al costo mnimo. En etapas iniciales es frecuente que un
gran nmero de factores sean de importancia para el experimentador. En tal
caso es recomendable una estrategia experimental que se concentre en determinar
econmicamente cules factores son los ms importantes.
Una posible estrategia es experimentar slo con dos niveles de cada factor.
Por supuesto tales niveles deben ser seleccionados de manera que se obtenga
la mayor informacin. Por ejemplo, si un factor es la temperatura, habr de
seleccionar dos temperaturas (dos niveles) que se piense causan efectos diferentes
de importancia sobre la respuesta de inters. Denote por k el nmero de factores
con dos niveles; los diseos que atienden a esta estructura de tratamientos se

100

4. Estructura de tratamientos factorial

denotan por diseos 2k (dos a la k). Sea N = 2k que representa el nmero de


todas las combinaciones de los k factores con dos niveles. N es as el nmero de
tratamientos que se requieren para efectuar el experimento. Por ejemplo si k = 4
se tendrn N = 16 tratamientos.

4.3
4.3.1

Factorial 22
Clculo de efectos

El diseo 22 es un esquema adecuado para introducir y motivar los principales


conceptos estadsticos en los diseos factoriales 2k : Por medio de un ejemplo se
presentan estos conceptos.
Ejemplo 4.3
En varias empresas tienen como requerimiento de la normatividad correspondiente, considerar la contaminacin que producen. Para tratar esta situacin
una compaa decide evaluar su contaminacin; sta se mide por el nmero de
partculas emitidas al ambiente, siendo el objetivo reducirlas. Los factores que se
consideran importantes para disminuir las partculas son el tipo de combustible
y el ltro. El primer factor denotado por A se reere a dos tipos de combustible;
el factor tipo de ltro consiste en comparar el ltro existente con uno nuevo, a
este factor se le denominar B. La descripcin de los factores se muestra a continuacin, donde el primer nivel de cada factor se describir por 1 y el segundo
nivel de cada factor por 1.
Factores/Niveles
A: combustible
B: ltro

1
A1
B1

1
A2
B2

La estrategia experimental consiste en combinar los dos niveles de los factores


A y B y realizar las actividades de la compaa bajo esas combinaciones. Esto
da lugar a cuatro tratamientos, estos son, combustible 1 con el ltro 1 y 2, y
combustible 2 con ltro 1 y 2, donde el ltro 1 es ltro nuevo, la ejecucin de
cada uno de ellos se hace en forma aleatoria.
Denotemos por yijl la medicin de la respuesta ante el nivel i del factor A,
i = 1; 2; nivel j del factor B, j = 1; 2 en su replicacin l; l = 1; :::; n: En este
ejemplo n = 2; es decir, cada tratamiento fue aplicado de manera independiente
en 2 UE; los resultados se muestran en la Tabla 4.1.
Anlogamente como en el Captulo 2, los niveles de cada factor tienen efectos
en la respuesta, computados como

4.3. Factorial 22

101

^A

(yi

(y

^B

); i = 1; 2;

(4.1)

); j = 1; 2:

(4.2)

La diferencia de tales efectos estima el efecto principal del factor A y el efecto


principal del factor B respectivamente, es decir,
^A = ^A
2
^B = ^B

^A = (y2
1
^B = (y 2

B:
B1
y111
y112
y 11
2
S11

24
28
26
8

B2
y121
y122
y 12
2
S12

42
46
44
8

y211
y212
y 21
2
S21

34
38
36
8

y221
y222
y 22
2
S22

55
59
57
8

31

50:5

Factores
A

Niveles
A1

A2

y1 )
y

(4.3)

yi

y1

35

y2

46:5

40:75

Tabla 4.1 Resultados del experimento del Ejemplo 4.3


Con los datos del Ejemplo 4.3, se tiene:
^A

= 35:00

40:75 =

^A

= 46:50

40:75 = 5:75;

^B

= 31:00

40:75 =

^B

= 50:50

40:75 = 9:75;

1
2

5:75;
9:75;

Finalmente, los efectos de los factores A y B son


^A = 5:75
^B = 9:75

( 5:75) = 11:5
( 9:75) = 19:5

102

4. Estructura de tratamientos factorial

Fig. 4.2: Efectos de combustible y ltro en el Ejemplo 4.3


que se muestran grcamente en la Fig. 4.2. Observe cmo la respuesta cambia
como efecto del cambio del nivel 1 al nivel 2 de cada factor. El cambio en ambos
factores es importante pero de manera ms marcada con el factor B.
Por otra parte, cuando se tiene ms de un factor y otro tipo de efectos por
estimar que son de suma importancia, stos son los llamados efectos de interaccin
entre dos o ms factores. En particular, la interaccin entre dos factores indica
que el efecto sobre la respuesta de un primer factor depende de los niveles de otro
factor presente en el experimento. Con objeto de comprender intuitivamente el
efecto de interaccin entre dos factores, siguiendo con el ejemplo de combustible
y ltro en su efecto sobre el nmero de partculas, considere la Fig. 4.3; el
eje vertical representa a los valores del nmero de partculas y el eje horizontal
los niveles del factor A (combustible). Los puntos gracados corresponden a las
respuestas promedio a los cuatro tratamientos. Trazando una lnea recta que una
los puntos correspondientes a un mismo nivel del factor B, se tienen dos lneas
en la grca. Fije su atencin en el nivel 1 de ltro B; observe la diferencia en
respuesta de ir del nivel 1 de combustible A a nivel dos de combustible B, es
decir,
^AB = (y21
1

y11 )

(4.4)

el efecto del combustible (factor A), jo el nivel uno de ltro (nivel 1 del factor
B). Ahora je su atencin en el nivel 2 de ltro, observe la diferencia de ir de
nivel uno a nivel dos de combustible, es:
^AB = (y22
2

y12 )

Intuitivamente si no hubiera interaccin entre A y B, se debe tener que:

(4.5)

4.3. Factorial 22

103

^AB

^AB

Entonces, denimos el efecto de interaccin AB sobre la respuesta como:


^AB

(^AB2

^AB )=2
1

(4.6)

^AB

(^A2 B

^A

(4.7)

o,
a partir de ^AB , la pregunta es:
^AB

(^AB2

AB

1B

)=2

es cero? Sustituyendo ^AB2 y ^AB1 se tiene

^AB )=2 = [(y22


1

y12 )

(y21

y11 )]=2

(4.8)

Para los datos del ejemplo la estimacin del efecto de interaccin es,
^AB = ((57

44)

(36

26))=2 = (13

10)=2 = 3=2 = 1:5

que es pequea en referencia a ^A y ^B . Esto equivale a decir que numricamente


el efecto por cambio de combustible no depende del tipo de ltro, esto es, que
no hay efecto de interaccin entre el tipo de ltro y el tipo de combustible. En
resumen el efecto de interaccin es:

A1
A2

B1
26
36
^AB = 10
1

B2
44
57
^AB = 13
2

^A B = 18
1
^A B = 21
2
^AB = 1:5

Grcamente tambin se puede identicar la presencia de interacciones a


travs de las pendientes de las dos rectas en la Fig. 4.3. En este caso, la pendiente de la recta que une la respuesta promedio de (combustible 1, ltro 1) a la
respuesta promedio de (combustible 1, ltro 2), es casi igual a la pendiente de la
recta anloga que une la respuesta promedio de (combustible 2, ltro 1) con la
respuesta promedio de (combustible 2, ltro 2).
La Tabla 4.1 muestra la descripcin clsica que se emplea para representar el
diseo factorial 22 y sus resultados. Sin embargo, esta presentacin se complica
cuando el nmero de factores va en aumento. A continuacin se propone la Tabla
4.2 que describe de una manera econmica la estructura del diseo y los datos
experimentales, esta presentacin se hace extensiva a diseos con ms de dos
factores en dos niveles. Como ya se mencion, el nivel uno de ambos factores se
representa por nmero 1 y el nivel dos por el 1.
Se ha mostrado que el efecto de los factores se obtiene a travs de contrastes
de promedios, concepto que no debe perderse de vista. Con las expresiones (4.3)

104

4. Estructura de tratamientos factorial

Fig. 4.3: Efecto de Interaccin de los factores A y B, para el ejemplo 4.3


se obtiene el efecto de los factores, los cuales se presentan en el ltimo rengln
de la Tabla 4.2.
A
1
1
1
1

B
1
1
1
1

yij1
y111
y211
y121
y121

y1

= (y 11 + y 12 )=2

= (y 11 + y 21 )=2

y2

= (y 21 + y 22 )=2

= (y 12 + y 22 )=2

^A = y
2

^B = y

y1

yij2
y112
y212
y122
y222

y ij
y 11
y 21
y 12
y 22

2
Sij
2
S11
2
S21
2
S12
2
S22

Tabla 4.2 Resumen estadstico para calcular los efectos de los factores
La interaccin se obtiene usando la
xiliar:
B1
A1 y 11
A2 y 21
^AB
1

expresin (4.8) y el siguiente cuadro auB2


y 12
y 22
^AB

^A B
1
^A B
2
^AB

(4.9)

Es decir :
^AB

(^AB2

^AB )=2 = [(y22


1

y12 )

(y21

y11 )]=2

Nota: En la Tabla 4.2 cada rengln con valores 1 y 1 estn apilados en lo


que se conoce como el orden estndar: primera columna alternando signos de uno
en uno, segunda columna alternando signos de dos en dos.

4.3. Factorial 22

4.3.2

105

Inferencia estadstica

Una vez computados numricamente efectos principales y efectos de interaccin,


en el contexto de inferencia estadstica se requiere saber si tales efectos son estadsticamente signicativos. Para ello supongamos que las respuestas yijl ante
cada uno de los tratamientos son descritas adecuadamente por una distribucin de
probabilidad normal, con media determinada principalmente por el tratamiento
(i; j); denotada por ij ; y con varianza 2ij , es decir yijl
N ( ij ; 2ij ); i = 1; 2;
j = 1; 2; l = 1; :::; n: Se supondr adems que 2ij = 2 ; i = 1; 2; j = 1; 2; con
2 la varianza del error experimental, la llamada homogeneidad de varianzas.
Note que suponer este modelo para las yijl implica que habr un manejo fsico
homogneo en el experimento, libre de efectos de ruido importantes.
La Tabla 4.3 muestra la descripcin general del diseo 22 con respecto a las
medias tericas por comparar. Los efectos toricos de los niveles del factor A
son A1 = 1
y A2 = 2
; donde es la media general de la respuesta
sin tratamiento alguno. Anlogamente para el factor B son B1 = 1
y
: El efecto de interaccin se deriva de la comparacin entre las
B2 =
2
diferencias AB1 = 21
11 y AB2 = 22
12 :

Niveles
uno
dos

Factor A
media marginal

Factor B
uno dos

media
marginal

11

12

21

22

(media global)

Tabla 4.3. Notacin para medias del diseo 22


El siguiente paso es contrastar las siguientes hiptesis con base en los datos
generados en el experimento:
H01 :

AB1

AB2

versus

H11 :

AB1

6=

AB2

H01 :

BA1

BA2

versus

H11 :

BA1

6=

BA2

o:

y:
H02 :

A1

A2

versus

H12 :

A1

6=

A2

H03 :

B1

B2

versus

H13 :

B1

6=

B2

y:

106

4. Estructura de tratamientos factorial

H01 representa la hiptesis de no interaccin, H02 la hiptesis de que no hay


diferencias de efectos de los niveles del factor A; y H03 la hiptesis de que no hay
diferencias de efectos de los niveles del factor B.
En general H01 debe estar sujeta a comprobacin estadstica en primer lugar,
porque de rechazarse (es decir, declarar as la presencia de efectos de interaccin),
no tiene sentido probar H02 o H03 : As en el caso en que H01 se rechace, lo que
procede es contrastar hiptesis de igualdad de efectos de los niveles de un factor,
pero jando un nivel en turno del otro factor (ver para interesantes comentarios
Fabian, 1991).
Usando las expresiones (4.3) y (4.8) para construir el ANDEVA correspondiente a un diseo 22 ; se puede demostrar que las sumas de cuadrados son:
2
SCA = c^A
2
SCB = c^

SCAB =

(4.10)

B
2
c^AB

con:
c = 22 n=4 = n
Estas sumas de cuadrados son estimaciones ptimas de lo que contribuye cada
factor y su interaccin a la variabilidad total en el experimento. SCA y SCB
tienen 2 1 = 1 grados de libertad, mientras que SCAB tiene (2 1) (2 1) = 1
grados de libertad. La obtencin del valor c aparece en el Apndice C al nal del
libro. Con los datos del Ejemplo 4.3, estas cantidades resultan ser,
SCA = 2(11:5)2 = 264:5;
SCB = 2(19:5)2 = 760:5;
SCAB = 2( 1:5)2 =

4:5:

De igual manera que en los captulos anteriores, el tamao de las sumas de


cuadrados, en este caso, SCA ; SCB ; SCAB ; debe ser juzgado contra un estimador
de la varianza del error experimental, es decir un valor estimado de 2 . Partiendo
de la misma lgica del Captulo 2, se tiene que,
^ 2 = CMerror =

(n

2 + S2 + S2 + S2 )
1)(S11
SCerror
12
21
22
=
2
2 (n 1)
glerror

donde:
2
Sij

l (yijl

yij )2
1

(4.11)

4.4. Factorial 23

107

Con los datos del Ejemplo 4.3, se tiene que


^ 2 = CMerror = 8
La suma de cuadrados total se calcula por,
XXX
SCtotal =
(yijl
i

)2

As la ANDEVA correspondiente se muestra en la Tabla 4.4.


Fuente de
variacin

Grados
libertad

Suma
de cuadrados

Cuadrados
medios

SCA

CMA

SCB

CMB

AB

SCAB

Error

22 (n

Total

22 n

1)
1

(n

1)

SCtotal

CMAB
P

ij

2
Sij

Fc

Valor p

CMA
CMerror
CMB
CMerror
CMAB
CMerror

CMerror

Tabla 4.4. Tabla ANDEVA general para el diseo 23


Con los datos del Ejemplo 4.3 la ANDEVA correspondiente se muestra en la
Tabla 4.5. Con esto se puede apreciar que los efectos principales de A y de B son
importantes en la variabilidad de la respuesta, mientras que su interaccin no lo
es.
Fuente de
Grados Suma
Cuadrados Fc
Valor p
variacin
libertad cuadrados medios
Combustible 1
264:5
264:5 33:06 0:005
Filtro
1
760:5
760:5 95:06 0:001
Comb Filtro 1
4:5
4:5 0:56 0:495
Error
4
32:0
8
Total
7
1061:5
Tabla 4.5. Tabla ANDEVA para el diseo 22 con los datos del Ejemplo 4.3

4.4
4.4.1

Factorial 23
Clculo de efectos

El objetivo en esta seccin es analizar un diseo factorial de tres factores con dos
niveles; los conceptos y estrategias usadas en el apartado anterior, se extienden de

108

4. Estructura de tratamientos factorial

manera natural. En este caso las observaciones sern denotadas por yijlm donde
i denota el nivel i; i = 1; 2 del primer factor A, j denota el nivel j; j = 1; 2 del
segundo factor B, l denota el nivel l; l = 1; 2 del tercer factor C y m denota la
replicacin m de tal combinacin de niveles, m = 1; :::; n. Los efectos principales
y de interaccin se estiman como sigue:
Efectos de niveles:
^A

= (y1

^B

= (y

^C

= (y

1
1

); ^A2 = (y2
); ^B2 = (y 2
); ^C = (y 2

y
y

(4.12)

Efectos principales:
^A = ^A
2
^B = ^B

^A = y2
1
^B = y 2

y1

^C

^C = y
1

= ^C2

(4.13)
1
1

Efectos de B dado un nivel de A:


^A

1B

= (y12

y11 ); ^A2 B = (y22

y21 )

(4.14)

Efectos de C dado un nivel de A:


^A

1C

= (y1

y1

); ^A2 C = (y2

y2

(4.15)

); ^B2 C = (y

22

21

(4.16)

Efectos de C dado un nivel de B:


^B

1C

= (y

12

11

Efecto de interaccin AB:


^AB = (^A B
2

^A

1B

)=2

(4.17)

1C

)=2

(4.18)

)=2

(4.19)

Efecto de interaccin AC:


^AC = (^A C
2

^A

Efecto de interaccin BC:


^BC = (^B C
2

^B

1C

Efecto de B en niveles jos de A y jo un nivel de C:

4.4. Factorial 23

109

^A

1 BC1

= (y121

^A

1 BC2

= (y122

y111 ); ^A2 BC1 = (y221


y112 ); ^A2 BC2 = (y222

y211 )

(4.20)

y212 )

Efecto de interaccin AB jo un nivel de C:


^ABC = (^A BC
2
1
1

^A

1 BC1

)=2

^ABC = (^A BC
2
2
2

^A

1 BC2

)=2

Efecto de interaccin ABC:


^ABC = (^ABC
2

4.4.2

^ABC )=2:
1

(4.21)

Inferencia estadstica

La tabla ANDEVA, en lo esencial, que corresponde al diseo 23 se muestra en la


Tabla 4.6.
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

2
3
SCA = ( n 42 )^A

2
3
SCB = ( n 42 )^B

2
3
SCC = ( n 42 )^C

AB

2
3
SCAB = ( n 42 )^AB

AC

2
3
SCAC = ( n 42 )^AC

BC

2
3
SCBC = ( n 42 )^BC

ABC

Error

23 (n

Total

23 n

1)
1

2
3
SCABC = ( n 42 )^ABC
P
2
SCerror = (n 1) ijl Sijl
P
SCtot = ijlm (yijlm y

)2

Tabla 4.6 Suma de cuadrados y grados de libertad para el diseo 23


donde:
2
Sijl

yijl )2

m (yijlm

110

4. Estructura de tratamientos factorial

Ejemplo 4.4
En un proceso industrial se tiene inters en extraer aceite de cacahuate, la tcnica
usada es mediante el dixido de carbono a presin muy alta. Se consideraron los
siguientes factores: A: temperatura, B: mezcla de cacahuate y C: razn de ujo.
La nalidad del proyecto es mejorar la produccin total de aceite (y). Los dos
niveles de cada factor se describen en la Tabla 4.7.
FactoresnNiveles
A:temperatura
B:mezcla
C:ujo

1
50o C
10g
35g=min

1
90o C
20g
50g=min

Tabla 4.7 Produccin de aceite de cacahuate del Ejemplo 4.4


Los datos que se obtuvieron al realizar este experimento se muestran en la
Tabla 4.8 (en el orden estndar ahora para tres factores). Los efectos correspondientes al experimento se obtienen usando las expresiones (4.13) y (4.21). Las
estimaciones de los promedios se muestran en las siguientes tablas.
Factores

y1
y2
^A

A
1
1
1
1
1
1
1
1
= 62:25
= 75:75
= 13:50

Respuesta

y 1
y 2
^B

B
1
1
1
1
1
1
1
1
= 67:50
= 70:50
= 3:00

y 1
y 2
^C

C
1
1
1
1
1
1
1
1
= 63:25
= 74:75
= 11:5

y111 = 65
y211 = 62
y121 = 58
y221 = 68
y112 = 64
y212 = 79
y122 = 62
y222 = 94
y
= 69

Tabla 4.8. Datos de produccin de aceite de cacahuate


Observe que se han asignando los nmeros 1 y 1 a los dos niveles de los
tres factores con el mismo criterio establecido en el ejemplo anterior, es decir, los
niveles en el factor A se alternan uno a uno, en el factor B dos a dos y en el factor
C cuatro a cuatro. Se realiza el experimento llevando a cabo los tratamientos,
stos se obtienen de hacer todas las combinaciones posibles de los tres niveles
de los factores, en este caso resultan 8 tratamientos; por supuesto en la prctica
stos se corren en orden aleatorio.

4.4. Factorial 23

111

Los efectos de interaccin entre los factores se estiman a continuacin:


AB
B1
64:5
70:5

A1
A2
^AB = [(y22
^AC = [(y2 2
^BC = [(y 22

y12 )
y1 2 )
y 12 )

B2
60
81
(y21
(y2 1
(y 21

A1
A2

AC
C1
61:5
65

C2
63
86:5

B1
B2

BC
C1
63:5
63

y11 )]=2 = [(81 60) (70:5


y1 1 )]=2 = [(86:5 63) (65
y 11 )]=2 = [(78 71:5) (63

C2
71:5
78
64:5)]=2 = 7:5
61:5)]=2 = 10
63:5)]=2 = 3:5

Finalmente el efecto de interaccin triple se estima por


ABC
BC1
(y121
(y221

BC2
A1
y111 ) = 58 65 = 7 (y122
(y222
A2
y211 ) = 68 62 = 6
^ABC = [(15 ( 2)) (6 ( 7))]=2 = 1

y112 ) = 62
y212 ) = 58

64 = 2
65 = 15

En la Tabla 4.9 se muestran los efectos estimados.


Efecto
A
B
C
AB
AC
BC
ABC

Estimacin
bA
=
bB
=
bC
=
bAB
=
bAC
=
bBC
=
bABC =

13:5
3:0
11:5
7:5
10:0
3:5
1:0

Tabla 4.9. Estimacin de los efectos de factores e interacciones


Usando los resultados de la Tabla 4.9 se obtiene la tabla ANDEVA correspondiente a este ejemplo, la cual se muestra en la Tabla 4.10.
Estimacin de

Note que en este ejemplo cada tratamiento slo es aplicado en una sola UE,
es decir que n = 1, no habiendo entonces rplicas, con lo que, recordando el
Captulo 1, no se puede estimar 2 ; la varianza del error, ya que la SCerror = 0
y sus grados de libertad son cero: Esto siempre ocurre en diseos sin rplicas, lo

112

4. Estructura de tratamientos factorial

que ocasiona que no se puedan obtener razones Fc para contrastar las hiptesis.
Existen algunos remedios para esta situacin:

Fuente de
variacin
A
B
C
AB
AC
BC
ABC
Error
Total

Grados de
libertad
1
1
1
1
1
1
1
0
7

Suma de
cuadrados
364:5
18:0
264:5
112:5
200:0
24:5
2:0
0:0
986:0

Cuadrado
medio
364:5
18:0
264:5
112:5
200:0
24:5
2:0

Fc

Valor p

Tabla 4.10 Tabla ANDEVA para el Ejemplo 4.4


1. Realizar una vez ms el experimento para tener una rplica completa de
ste; como se sabe esto ocasiona ms trabajo, gasto de material, consume
tiempo, y puede inducir variabilidad por no homogeneidad en la conduccin
fsica de experimento, haciendo necesario considerar bloques (uno por cada
rplica completa de ste).
2. Asumiendo un principio de jerarqua, despreciar el efecto de interaccin
triple (la interaccin ms alta) y asignar la suma de cuadrados correspondiente a la suma de cuadrados del error; de este modo se puede construir
el cociente de varianza F . Vase la Tabla 4.11. En este caso se dice que el
efecto de interaccin triple se confundi con el error. Con la informacin
resumida en la Tabla 4.11, se concluye que el factor A es signicativo con
los efectos ms importantes sobre produccin total de aceite.
3. Tomar en cuenta el porcentaje de contribucin a la suma de cuadrados,
como se muestra en la Tabla 4.12. Esta alternativa realmente no tiene una
fundamentacin estadstica, slo permite evaluar en porcentaje la contribucin a la explicacin de la variacin total; arbitrariamente se puede jar
un porcentaje de referencia para decidir qu factores tienen un efecto importante. Por ejemplo, si se ja el 25.0 como nivel de referencia, se puede
observar que los factores A y C pueden tener un efecto importante en el
proceso.

4.4. Factorial 23

113

Fuente de
variacin
A
B
C
AB
AC
BC
Error(ABC)
Total

Grados de
libertad
1
1
1
1
1
1
1
7

Suma de
cuadrados
364:5
18:0
264:5
112:5
200:0
24:5
2:0
986:0

Cuadrado
medio
364:5
18:0
264:5
112:5
200:0
24:5
2:0

Fc
182:25
9:00
132:25
56:25
100:00
12:25

Valor p
0:0471
0:2048
0:0552
0:0844
0:0635
0:1772

Tabla 4.11 Tabla ANDEVA para el Ejemplo 4.4,


confundiendo ABC con el error
Fuente de
variacin
A
B
C
AB
AC
BC
ABC
total

Suma de
cuadrados
364:5
18
264:5
112:5
200
24:5
2
986

porcentaje
36:97
1:82
26:82
11:41
20:28
2:48
0:20

*
*

Tabla 4.12 Clculo de porcentajes de la suma de cuadrados


4. Uso del grco probabilstico Normal o semi Normal: si los efectos, denotados en general como ^i ; i = 1; :::; I, que son diferencias de medias de
observaciones normales, indicaran que los efectos reales fueran no signicativos, se comportarn de manera aproximada como una muestra proveniente
de una distribucin de probabilidad Normal con media cero.
Grco probabilstico Normal y semi Normal
A cada elemento de una muestra proveniente de una distribucin Normal, al ser
ordenada de menor a mayor, se le puede asociar el cuantil terico de la distribucin
1 i 0:5 ; ^
Normal, formando una pareja de valores, esto es
(i) ; i = 1; :::; ne ;
ne
donde ^(i) s representan a los efectos estimados ordenados de menor a mayor y
1
nor (q)

114

4. Estructura de tratamientos factorial

Fig. 4.4: A la izquierda Grco Normal de efectos. A la derecha Grco SemiNormal de efectos
es la funcin que genera cuantiles de una N ormal(0; 1) como funcin de una
proporcin q. Estas parejas al gracarse sobre un sistema coordenado producen
lo que se conoce como grco de probabilidad Normal. Si todos los efectos se
ubicaran sobre una recta que pasa por el origen, no habra efectos declarados
como signicativos; aquellos que salieran de tal patrn rectilneo seran declarados
como signicativos.
1 i 0:5 ; ^
Si en lugar de ubicar
(i) ; i = 1; :::; ne , se ubican
ne
1

0:5 + 0:5

0:5
ne

; ^(i)

; i = 1; :::; ne

se produce lo que se conoce como grco probabilstico semi Normal (half Normal
Plot); este ltimo para la deteccin de efectos signicativos es ms eciente que el
grco probabilstico Normal. Hay que notar que el nmero de efectos estimados
ne es pequeo, hace difcil la interpretacin de este tipo de grcos para detectar
signicancia.
Al gracar los efectos de todos los factores y todas sus interacciones, se tiene
en mente un principio general de parsimonia que dicta que se esperara que slo
algunos efectos fueran los ms importantes; los no importantes entonces se esperara que se agruparan alrededor de una recta imaginaria que pase por la mayora
de los efectos.
A continuacin se presentan en la Fig. 4.4 dos grcos probabilsticos de
efectos de un experimento; el primero es un grco Normal, el segundo un grco
semi Normal. En el caso del grco Normal no se ve con claridad qu efectos son
los ms importantes; en el caso semi Normal es ms claro.

4.4. Factorial 23

115
100

85.714286

57.142857

71.428571

100

85.714286

2
1

2
1

71.428571
57.142857
100

85.714286

2
1

71.428571

57.142857
1.1

1.65

1.1

1.65

1.1

1.65

Fig. 4.5: Grcas que ilustran los efectos de interaccin dobles entre los factores
A, B y C
En la Fig. 4.5 se pueden apreciar los efectos de interaccin correspondientes,
especialmente AB y AC.
Mtodo de Lenth
El mtodo de Lenth (1989) y Wu y Hamada (2000) es un mtodo formal de signicancia de efectos para experimentos no replicados. Sean ^1; ; ^I los efectos
factoriales estimados de 1; ; I ; donde I denota el nmero de efectos a ser contrastados. En este mtodo es importante la suposicin de que los efectos tienen
la misma desviacin estndar, denotada por . Lenth (1989) consider un estimador robusto de la desviacin estndar de ^i ; el cual fue llamado el pseudo error
estndar o P SE
P SE = 1:5 medianafj^i j<2:5S0 g ^i
donde la mediana es computada entre los ^i < 2:5S0 con
S0 = 1:5

mediana ^i :

El error estndar inicial S0 ; que usa al factor de escala 1.5, es un estimador


consistente de la desviacin estndar de ^ cuando las 0i s son cero y la distribucin
subyacente del error es normal (es decir que S0 n ! cuandoo n ! 1): Ahora,
dado que si Z s N (0; 1); Pr [jZj 2:57] = 0:01, ^i < 2:5S0 trunca a cerca del

116

4. Estructura de tratamientos factorial


0

1% de los ^i s si todos los i fueran cero. Entonces P SE es todava un estimador


0
consistente. De manera ms importante, el truncamiento intenta remover los ^i s
asociados con efectos activos o no cero. Usando la mediana en combinacin con
truncamiento, P SE es entonces un estimador robusto de la desviacin estndar
0
de los ^i s. Aqu un estimador robusto signica que su operacin no es sensible a
0
los ^i s que estn asociados con efectos no cero o activos. Con ello, usando
tP SE;i =

^i
P SE

i es declarado signicativo si jtP SE;i j excede un valor crtico de la distribucin


tabla dada por Lenth (1989) o por Wu y Hamada (2000, apndice H). En tales
tablas se presentan cuantiles atendiendo a si se usa un criterio de tasa de error
individual o si se usa una tasa de error por experimento. Se recomienda, en
general, el uso del primer criterio de error, dados los objetivos descriptivos de los
experimentos factoriales. En el ejemplo anterior

S0 = 1:5(7:5) = 11:25;
el valor de truncado es 2:5 S0 = 28:125; con lo que P SE = 1:5 7:5 = 11:25;
con = 0:05 (tasa de error individual) se tiene un valor en tablas de 2:30, con
lo que ningn efecto es declarado estadsticamente signicativo. Ver la Fig. 4.6.
El mtodo de Lenth alternativamente se puede ver como una forma de estimar la
pendiente de la recta de regresin a trazarse en un grco probabilstico Normal
o seminormal; la recta resultante de la funcin cuantil de una Normal, es una
cuya pendiente es la desviacin estndar correspondiente.
Con objeto de ampliar el panorama del anlisis en un diseo factorial 23 , se
presenta un ejemplo con rplicas (n > 1):
Ejemplo 4.5
Debido a que en el mercado se produce un nuevo polmero, un ingeniero industrial
desea probar si ste mejora la elasticidad del plstico que se obtiene en un proceso
de extrusin. l considera que la cantidad de aditivo y el concentrado de polmero
son factores importantes. En resumen, la tabla de factores y niveles es:
FactoresnNiveles
A: Aditivo
B: Concentrado
C: Tipo de polmero

1
40g
30%
M1

1
120g
45%
M2

Cabe observar que el factor C es cualitativo, mientras los otros factores son
cuantitativos; as, el ingeniero plantea llevar a cabo un diseo 23 , aleatoriza los 8

4.4. Factorial 23

117

Fig. 4.6: Signicancia de efectos por el mtodo de Lenth, ejemplo 4.4


tratamientos y realiza el experimento con dos replicaciones por tratamiento. Al
nal evala la elasticidad del plstico. Los resultados se asientan en la Tabla 4.14.
Los efectos de cada factor y sus interacciones se obtienen aplicando nuevamente
las expresiones de la (4.12) a la (4.21).

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

yijl1
66
68
88
63
73
37
38
57

yijl2
62
63
80
65
71
42
39
48

y ijl
64:0
65:5
84:0
64:0
72:0
39:5
38:5
52:5

2
Sijl
8:0
12:5
32:0
2:0
2:0
12:5
0:5
40:5

Tabla 4.14. Resultados del experimento del Ejemplo 4.5, y


Estimacin de los efectos de los factores A; B, y C :

= 60

118

4. Estructura de tratamientos factorial

y1 = 64:63
y2 = 55:38
^A = 9:25

y 1 = 60:25
y 2 = 59:75
^B = 0:50

y 1 = 69:38
y 2 = 50:63
^C = 18:75

Los efectos de interaccin entre los factores se estiman a continuacin:

A1
A2

AB
B1
68:00
52:50

^AB = [(y22
^AC = [(y2 2
^BC = [(y 22

B2
61:25
58:25
y21 )
y2 1 )
y 21 )

A1
A2
(y12
(y1 2
(y 12

AC
C1
74:00
55:25

C2
64:75
46:00

B1
B2

BC
C1
64:75
74:00

C2
55:75
45:50

y11 )]=2 = [5:75 ( 6:75)]=2


= 6:25
y1 1 )]=2 = [ 18:75 ( 18:75)]=2 = 0:00
y 11 )]=2 = [9:25 ( 10:25)]=2
= 9:75

Finalmente el efecto de interaccin triple se estima por


BC1
(y121
(y221

ABC
BC2
) = 20
(y122
) = 1:5 (y222

y112 ) = 33:5
y212 ) = 13

( 1:5

( 20))]=2 = 17

A1
y111
A2
y211
^ABC = [(13 ( 33:5))=2
Los efectos en resumen son:
Efecto
A
B
C
AB
AC
BC
ABC

Estimacin
bA
=
bB
=
bC
=
bAB
=
bAC
=
bBC
=
bABC =

9:25
0:50
18:75
6:25
0:00
9:75
17:00

A partir de la ltima columna de la Tabla 4.14 se calcula el cuadrado medio


del error, ver expresin 4.11. Es decir:
b2 = CMerror =

8 + 12:5 + ::: + 40:5


= 13:75
8

4.4. Factorial 23

119

Fig. 4.7: Diagrama de Pareto que describe los efectos e interaciones signicativos
en el Ejemplo 4.5
Para observar la importancia de los efectos de los factores existen otros mtodos grcos. Por ejemplo, el diagrama de Pareto es una alternativa grca que
complementa al anlisis de varianza, como se puede observar en la Fig. 4.7.
Cada barra en el diagrama representa el efecto estandarizado de cada factor, que
se obtiene mediante la expresin:
q
abs(ef ecto)
; yQ=
CMerror = (n 2k 2 )
Q
donde abs() denota el valor absoluto, n es el nmero de rplicas. Los efectos
as estandarizados se ordenan de mayor a menor y se comparan con el valor
t(glerror ; =2): la lnea punteada en la grca representa este valor. Para el
ejemplo 4.5, Q = 1:85 y t(8; 0:025) = 2:31. As por ejemplo, para estimar el
efecto estandarizado del factor C se tiene, 18:75=1:85 = 10:14; dado que este valor
es mayor que 2:31, se concluye que el efecto C es signicativo. Similarmente se
obtienen los efectos estandarizados para el resto de los factores e interacciones.
La cantidad Q se conoce como el error estndar del efecto de un factor. Una
ventaja de estos clculos es que a partir de ellos se pueden estimar los intervalos
de conanza para los efectos de los factores, es decir: b t(glerror ; =2)Q:
Con la estimacin de los efectos de los factores y de 2 , la tabla ANDEVA
correspondiente al Ejemplo 4.5 se muestra en la Tabla 4.15.
Los procedimientos aqu descritos se pueden generalizar para diseos factoriales en dos niveles y cualquier nmero de factores k
1(diseo 2k ). La estimacin de efectos es anloga a la presentada en secciones anteriores; no se

120

4. Estructura de tratamientos factorial

muestran en detalle los cmputos requeridos, pero se cree que seran fcilmente
derivados por el interesado, computando promedios y diferencias adecuadas. Si
de las tablas del ANDEVA se observan las expresiones para obtener las sumas de
cuadrados correspondientes a los efectos en los diseos 22 y 23 , se ver que los
efectos se elevan al cuadrado y se multiplican por n 2k =4, esto es:
SCef ecto =

n
4

2
2k bef ecto

(4.22)

donde n es el nmero de rplicas. Sin embargo actualmente, con la ayuda de


paquetes de cmputo estadstico, en general no es necesario preocuparse mucho
por los cmputos de efectos si se entienden los supuestos del mtodo y cmo
interpretar los resultados estadsticos.
Grados de
libertad

Suma de
cuadrados
2
3
( 2 2 )^ = 342:25

AB

AC

BC

ABC

A
4
2 23 ^2
( 4 ) B = 1:00
2
3
( 2 42 )^C = 1406:25
2
3
( 2 42 )^AB = 156:25
2
3
( 2 42 )^AC = 0:00
2
3
( 2 42 )^BC = 380:25
2
3
( 2 42 )^ABC = 1156:00

Error

SCerror = 110:00

Total

15

Cuadrado
medio

Fc

Valor p

342:25

24:89

0:000

1:00

0:07

0:794

1406:25

102:27

0:000

156:25

11:36

0:010

0:00

0:00

1:000

380:25

27:65

0:000

1156

84:07

0:000

13:75

3552

Tabla 4.15 Anlisis de la varianza para el Ejemplo 4.5

4.5

Factorial general de dos factores

El objetivo en esta parte es obtener los estimadores de los efectos principales e


interaccin en un diseo con dos factores A y B, considerando que los factores A
y B tienen a niveles y b niveles respectivamente. Con las ideas mostradas previamente, se puede notar que ahora se tiene ab combinaciones, lo que da lugar a
tener ab tratamientos. Como en el caso de los factoriales 2k ; supongamos que las
respuestas yijl ante cada uno de los tratamientos son descritas adecuadamente por
una distribucin de probabilidad normal con media determinada principalmente
por el tratamiento (i; j); denotada por ij ; y con varianza 2ij , es decir yijl
N ( ij ; 2ij ); i = 1; :::; a; j = 1; :::; b; l = 1; :::; n: Se supondr adems que 2ij =

4.5. Factorial general de dos factores

121

2;

i = 1; 2; j = 1; 2; con 2 la varianza del error experimental, la llamada


homogeneidad de varianzas. Note que suponer este modelo para las yijl , implica
que habr un manejo fsico homogneo en el experimento libre de efectos de ruido
importantes. Derivado de las suposiciones anteriores, los efectos simples de los
niveles del factor A son:
Ai

; i = 1; :::; a

Anlogamente para el factor B son:


Bj

; : j = 1; :::; b

Los efectos tericos conjuntos del nivel i de A y del nivel j de B son:


ABij

; i = 1; :::; a; j = 1; :::; b

ij

Hay que sealar que el efecto principal de un factor con ms de dos niveles no
es posible conceptualizarlo como se hizo en el caso de un factor con dos niveles.

4.5.1

El anlisis de varianza para dos factores

El planteamiento del apartado anterior da lugar a proponer las siguientes hiptesis


para establecer si existe efecto de los factores sobre la variable de respuesta o si
existe efecto de interaccin. Con la nalidad de estudiar la presencia del efecto
del factor A sobre la respuesta, las hiptesis estadsticas son:
HAo :

A1

A2

= ::: =

Aa

HAa : algn par es diferente al menos


Si los datos no apoyan a la hiptesis nula se dice que existe efecto del factor A;
anlogamente para el factor B se establece
HBo :

B1

B2

= ::: =

Bb

HBa : algn par es diferente al menos


Finalmente para el efecto de interaccin se tiene:
HAo :

A1 B 1

A1 B 2

= ::: =

Aa Bb

HAa : alguno es diferente a otro por lo menos


El objetivo es contrastar las hiptesis anteriores. Observe que la discrepancia
entre los valores observados yijl y el promedio y
se puede descomponer como:

122

4. Estructura de tratamientos factorial

(yijl

) = (y ij

Adems observe que (y ij


(y ij

) = (y i

y
y

) + (yijl

y ij )

) se puede descomponer en
) + (y

) + (y ij

yi

+y

Elevando al cuadrado esta expresin y efectuando la suma sobre cada uno de los
ndices, se puede demostrar que
Pa

i=1

an
+

Pb

j=1

Pb

Pn

l=1 (yijl

j=1 (y j

)2 + n

yij )2

i;j;l (yijl

)2 = bn
Pa

i=1

Pb

Pa

i=1 (y i

j=1 (y ij

y
yi

)2 +
y

)2

+y

En la notacin manejada anteriormente esta ltima expresin se reexpresa como

a X
b X
n
X

(yijl

= bn

i=1 j=1 l=1

a
X
i=1

^2 + an
Ai

X
(yijl

b
X

^2 + n
Bi

j=1

a X
b
X

^2

Ai Bj (4.23)

i=1 j=1

yij )2

i;j;l

Donde el efecto de interaccin estimado es: ^Ai Bj = y ij


ecuacin (4.23) se resume por:

yi

SCtotal = SCA + SCB + SCAB + SCerror

+y

: La

(4.24)

Con la nalidad de evaluar la signicancia de los factores cada una de las sumas
de cuadrados correspondientes a la derecha de la ecuacin (4.24), se divide por sus
grados de libertad, el resultado de esta divisin da lugar a los cuadrados medios,
nalmente el cuadrado medio de cada factor se divide con el cuadrado medio del
error, cada uno de estos valores se compara con el valor de una distribucin F
considerando un nivel de signicancia y los grados de libertad para el numerador

4.5. Factorial general de dos factores

123

y el denominador de esa divisin. Estos resultados se resumen en la Tabla 4.16.

Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

(a

1)

(b

1)

AB

(a

1)(b

Error

ab(n

Total

abn

^2
i=1 Ai
P
2
SCB = an bj=1 ^Bi
P P
2
SCAB = n ai=1 bj=1 ^Ai Bj
P
SCerror = ijl (yijl y ij )2
SCA = bn

1)
1

1)

SCtotal =

Pa

ijl (yijl

Cuadrado
medio

Fc

SCA
a 1
SCB
b 1
SCAB
(a 1)(b 1)
SCerror
ab(n 1)

CMA
CMerror
CMB
CMerror
CMAB
CMerror

)2

Tabla 4.16 Resumen del ANDEVA para un factorial general de dos factores

Ejemplo 4.6

El teido es muy importante en la industria textil y en la elaboracin de pieles,


ellas requieren de cierto tipo de tintes, que a la vez son fabricados por otras industrias qumicas. As, una empresa que fabrica pieles para asientos de automvil,
tiene inters en estudiar la consistencia del teido en unas muestras de pieles; la
evaluacin del teido se hace a nivel de laboratorio usando un equipo apropiado.
Para ello se prueba un nuevo tinte y se desea compararlo con el existente, lo que
se denominar como factor A; tambin se decide usar como factor B diferentes
contenidos del tinte. Los resultados obtenidos al realizar el experimento con dos
replicaciones se muestran en la Tabla 4.17.
Se puede observar que se tienen dos factores de dos y tres niveles respectivamente y dos rplicas, as los ndices son i = 1; 2; j = 1; 2; 3 y r = 1; 2: En la
Tabla 4.18, se muestra la estimacin de los efectos para los diferentes niveles de
los factores A, B e interaccin, luego se aplican las frmulas (4.23) y (4.24) para
construir la tabla del anlisis de la varianza, que se resume en la Tabla 4.19.

124

4. Estructura de tratamientos factorial

A
1
1
1
1
1
1
y1
y2

y1
y2
y3

= 13:37
= 14:08

B
1
1
0
0
1
1
= 5:33
= 12:10
= 23:75

yij1
5:2
5:1
12:3
12:1
22:4
25:2

yij2
5:4
5:4
12:1
11:9
22:6
24:8

y ij
5:4
5:25
12:2
12:0
22:5
25:0

2
Sij
0:080
0:045
0:020
0:020
0:020
0:080

= 13:73

Tabla 4.17. Resultados del experimento en el Ejemplo 4.6


Entonces las sumas de cuadrados considerando los resultados en las Tabla
4.18a y Tabla 4.18b, son:
SCA = 3(2)[( 0:358)2 + (0:358)2 ] = 6(0:257) = 1:54
SCB = 2(2)[( 8:4)2 + ( 1:625)2 + (10:025)2 ] = 4(173:70) = 694:80
SCAB = (2)[(0:43)2 + ::: + (0:895)2 ] = 2(2:385) = 4:77
SCerror = (0:08 + 0:02 + 0:02 + 0:045 + 0:02 + 0:08)=6 = 0:27=6 = 0:04:
bA = 13:37 13:725 = 0:358
1
bA = 14:04 13:725 = 0:358
2
bB = 5:325 13:725 = 8:4
1
bB = 12:1
13:725 = 1:625
2
bB = 23:75
13:725
= 10:025
3

Tabla 4.18a Estimacin de los efectos en los niveles de los


factores del Ejemplo 4.6
bA B
1 1
bA B
1 2
bA B
1 3
bA B
2 1
bA B
2 2
bA B
2

= 5:4 13:37 5:325 + 13:725 = 0:43


= 12:2 13:37 12:1 + 13:725 = 0:46
= 22:5 13:37 23:75 + 13:725 = 0:90
= 5:25 14:08 5:325 + 13:725 = 0:43
= 12:0 14:08 12:1 + 13:725 = 0:46
= 25:0 14:08 23:75 + 13:725 = 0:90

Tabla 4.18b Estimacin de los efectos en los niveles de los


factores del Ejemplo 4.6

4.5. Factorial general de dos factores

125

Finalmente la tabla del ANDEVA se muestra en la Tabla 4.19.


Fuente de
variacin
A
B
AB
Error
Total

Grados de
libertad
1
2
2
6
11

Suma de
cuadrados
1:54
694:80
4:77
0:27
701:38

Cuadrados
medios
1:54
347:40
2:39
0:04

Fc

Valor p

34:89
7865:72
54:02

0:0010
0:0000
0:0001

Tabla 4.19 Tabla ANDEVA del Ejemplo 4.6


Con estos resultados se contrastan las siguientes hiptesis estadsticas:
Ho :
H1 :
Ho :
H1 :

B1
Bi

=
6=

B2
Bj

A1
A1

=
6=

A2
A2

no hay efecto del factor A.


hay efecto del factor A.

= B3 no hay efecto del factor B.


para algn i y j; hay efecto del factor B.

Ho : Ai B j todos iguales.
H1 : al menos una Ai B j es diferente de otra.

(4.25)

(4.26)
(4.27)

Con la informacin proporcionada en la Tabla 4.19, se puede concluir que existen


efectos de los factores A y B, adems existe efecto de interaccin. La grca de
la Fig. 4.7 auxilia en la interpretacin de esta interaccin dado que es relevante
en las conclusiones del ejemplo.

4.5.2

Modelo estadstico

El modelo estadstico para un diseo factorial de dos factores, sin restricciones


en la aleatorizacin de tratamientos, es

yijl =
"ijk
i = 1; 2; :::; a

ij

+ "ijl

N (0;

(4.28)

); independientes

j = 1; 2; :::; b

l = 1; 2; :::n

Observe que "ijl = yijl


ij ; indica la discrepancia entre el valor observado y
el promedio en el tratamiento ij para la l-sima replicacin. Con la nalidad de

126

4. Estructura de tratamientos factorial

Fig. 4.8: Efecto de interacin entre A y B


obtener los estimadores de los ij parmetros en el modelo se utiliza el principio
de mnimos cuadrados, el cual consiste en
mn
ij

a X
b X
n
X

"2ijl

i=1 j=1 l=1

a X
b X
n
X
= mx
(yijl
ij

ij )

i=1 j=1 l=1

es
Los estimadores de ij son resultado de optimizar esta expresin; as y
el estimador de la media general ; y i estima a la media marginal en el nivel
i-simo del factor A i ; y anlogamente y j estima a la media marginal en el
nivel j simo del factor B j :
El trmino ij en el modelo (4.28) se puede modelar de manera aditiva, es
decir, sin considerar el efecto de interaccin AB, esto es:
ij

Ai

donde i es el efecto i-simo nivel del factor A, ste se dene por Ai = i


.
Anlogamente el efecto j-simo del factor B es j = j
: As ij se puede
reescribir como:
+( i
)+( j
)
ij =
el efecto de la combinacin ij es ! ij =
(

ij

)=(

ij

; esto es:
)+(

El efecto conjunto del tratamiento ij (i de A y j de B) se denota por Ai Bj ; ste


es
) [( i
)+( j
)] = ij
Ai Bj = ( ij
i
j +

4.6. Ejercicios

127

El modelo (4.28), se puede expresar por

yijl =
"ijl

+
N (0;

i = 1; 2; :::; a

4.6

Ai
2

Ai Bj

+ "ijl ;

); independientes,

j = 1; 2; :::; b

(4.29)
(4.30)

l = 1; 2; :::n:

Ejercicios

Ejercicio 4.1 Por medio de un grasmo esboce lo sucedido en el ejemplo que


ilustr la comparacin del OFAT con un diseo factorial, al inicio de este captulo.
Ejercicio 4.2 En el laboratorio de pruebas de una empresa petroqumica, un
grupo de ingenieros aplic un diseo de experimentos factorial para evaluar el
rendimiento (y) de gasolina en un automvil. Ellos seleccionaron dos factores, el
factor A: tipo de gasolina con los niveles magna y premium, y el factor B: la
marca del aditivo; los niveles son marca 1 y marca 2. El experimento se realiz
con tres UE en cada tratamiento. Los datos son:

magna

premium

marca 1
16:5
15:3
15:8

marca 2
12:8
12:2
13:1

14:7
14:3
14:5

11:6
11:4
12:0

1. Estime el efecto de los factores A y B:


2. Estime los efectos de interaccin de los factores AB.
3. Represente mediante una grca los efectos computados, qu observa?
4. Escriba la tabla del ANDEVA, realice su planteamiento estadstico, cules
son sus conclusiones?
5. Con auxilio del paquete de cmputo estadstico realice el trabajo anterior,
con ayuda de las grcas complete el anlisis estadstico.

128

4. Estructura de tratamientos factorial

Ejercicio 4.3 En la tabla de abajo se presenta el promedio de los resultados


al realizar un experimento con tres replicaciones. Graque la interaccin entre el
factor A: concentracin de bicarbonato de sodio (0 ppv, 20 ppv) y el factor B:
tiempo de remojo (8 hr, 12 hr). Se mide el tiempo de coccin de una variedad
de frijol considerando los factores A y B.

A1
A2
y j

B1
y 11 = 74
y 21 = 68

B2
y 12 = 59
y 22 = 55

yi

1. A partir de la grca, parece signicativa la interaccin?


2. Estime los efectos de los factores A, B y la interaccin AB.
3. En la tabla del ANDEVA, qu hiptesis se probara?
Ejercicio 4.4 En una investigacin para disminuir el efecto de la contaminacin
se elabor un combustible sinttico; los ingenieros del proceso realizaron un experimento controlando tres factores en dos niveles, factor A: extracto de una
semilla (5% y 10%), factor B: concentracin de etileno (15% y 25%), y factor
C : la temperatura de destilacin. La emisin es la variable respuesta. El esquema experimental es un 23 en tres rplicas, y los resultados se muestran a
continuacin.
Trat
A
B
C y1 y2 y3
1
1
1
1 29 24 30
2
1
1
1 20 21 24
3
1
1
1 22 25 20
4
1
1
1 16 19 18
5
1
1
1 43 45 40
6
1
1
1 51 49 52
7
1
1
1 39 40 37
8
1
1
1 49 48 50
1. Suponga que a usted le encomiendan realizar este experimento, indique los
detalles de cmo lo realizara.
2. Haga la grca del efecto de interaccin de AB. Explique paso a paso cmo
la elabora.
3. Estime los efectos de los tres factores y sus respectivas interacciones para
la primera realizacin.

4.6. Ejercicios

129

4. Elabore un diagrama de Pareto para indicar la signicancia de los factores.


5. Graque en grcos Normal y semi Normal los efectos de los factores e
interacciones e interprtelo.
6. Realice el anlisis grco de los residuales y obtenga sus conclusiones.
7. Construya la tabla del ANDEVA para la primera realizacin.
8. Obtenga sus conclusiones a partir de sus anlisis.
Ejercicio 4.5 La produccin de una reaccin qumica se realiza mediante la funcin de las siguientes tres factores, temperatura (T ), velocidad de la mezcladora
(V ), y formulacin (F ).
FactoresnNiveles
Temperatura
Velocidad
Formulacin

1
70o C
60rpm
A

1
85o C
70rpm
B

Se tienen los siguientes resultados (una sola replicacin)


Trat
1
2
3
4
5
6
7
8

T
1
1
1
1
1
1
1
1

V
1
1
1
1
1
1
1
1

F
1
1
1
1
1
1
1
1

y
96:0
91:2
97:3
94:0
91:4
89:7
86:0
84:2

1. Estime los efectos de los factores T, V, F y las de interaccin. Indique


cules efectos son signicativos, previo planteamiento estadstico.
2. Realice un anlisis grco.
3. Aplique la prueba de Lenth.
4. En una segunda realizacin del experimento se tiene la siguiente informacin: 95.3, 91.0, 95.8, 95.0, 91.0, 88.4, 85.0, 88.5. Junte estos resultados con
los anteriores y haga el trabajo planteado en los incisos 1 y 2 vericando
los supuestos para hacer el anlisis.

130

4. Estructura de tratamientos factorial

Ejercicio 4.6 En un experimento para mejorar el rendimiento de una variedad


de cacahuate se estudiaron cuatro factores, cada uno con dos niveles y una sola
realizacin. Los factores del diseo son: tiempo (A), concentracin (B), presin
(C), y temperatura (D).
FactoresnNiveles
A
B
C
D

1
15min
10%
130u
65o C

1
25min
15%
150u
80o C

1. Use el grco de probabilidad Normal o semi Normal para indicar qu


efectos pueden dar evidencia de ser signicativos.
2. Haga la prueba de Lenth.
3. Complete el anlisis estadstico interpretando sus resultados.
Los datos que se obtuvieron al correr el experimento son:
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

y
12
18
13
16
17
15
20
15
10
25
13
24
19
21
13
14

Ejercicio 4.7 A continuacin se describe uno de los ejemplos que Lenth utiliz
para ilustrar su mtodo. Un ingeniero desea estudiar la produccin de una sustancia qumica, los factores que l considera que afectan esta respuesta son: la
fuerza del cido (A), el tiempo (B), la cantidad de cido (C) y la temperatura

4.6. Ejercicios

131

(D), es decir, es un diseo 24 sin rplicas. Los resultados experimentales presentados en el orden estndar son: 0.08, 0.04, 0.53, 0.43, 0.31, 0.09, 0.12, 0.36, 0.79,
0.68, 0.73, 0.08, 0.77, 0.38, 0.49, 0.23.
1. Estime los efectos y el pseudo error estndar (P SE).
2. Pruebe la signicancia de los efectos. D sus conclusiones.
3. Graque en un diagrama de barras vertical los efectos de los factores e
interacciones. Trace en esa grca las lneas t(gl; =2)P SE; las cuales
son paralelas al eje horizontal.
Ejercicio 4.8 La nalidad de este ejemplo es repasar la estrategia experimental
de un diseo 2k , as como su anlisis e interpretacin. Para ello usamos una
aplicacin refrescante.
Cuatro factores tienen inuencia en el sabor de una bebida, estos son: el tipo
de endulzante (A), la razn de agua a jarabe (B), el nivel de carbonatacin (C),
y la temperatura (D). El experimento se realiz considerando dos niveles de cada
factor, la bebida resultante de cada combinacin de los niveles de los factores se
dio a probar a 20 personas, a cada prueba se le asign un valor en la escala de
1 a 10. Se reporta la calicacin total como variable de respuesta, el objetivo
nal del experimento es encontrar un valor mximo. El experimento se realiz
dos veces. Los resultados son:
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

A
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

y1
190
174
181
183
177
181
188
173
198
172
187
185
199
179
187
180

y2
193
178
185
180
178
180
182
170
195
176
183
186
190
175
184
180

132

4. Estructura de tratamientos factorial

1. Estime los parmetros del modelo y sus interacciones, identique los factores que son signicativos.
2. Haga el anlisis grco del efecto de los factores y las interacciones.
3. Elimine los efectos que no son signicativos, haga el anlisis de varianza de
estos datos experimentales y obtenga sus conclusiones.
4. Comente las grcas de residuales y d sus observaciones.
5. Considere que nicamente se pueden realizar 8 tratamientos por da, cmo
realizara el experimento? Haga el anlisis considerando este hecho.
Ejercicio 4.9 Operacin evolutiva (EVOP), una estrategia de mejora de un
proceso mediante experimentacin secuencial, tiene dos metas principales: 1. Realizar experimentos en procesos industriales que estn en operacin. 2. Escalar a
nivel planta, mediante experimentacin, los resultados (parmetros del proceso)
obtenidos en el laboratorio. En esta estrategia (ver por ejemplo Box y Draper,
1969) originalmente se propuso una hoja de clculo que permita ir evaluando
el efecto de los factores, su interaccin y la curvatura en un diseo 22 o 23 a lo
largo de la secuencia experimental. El procedimiento de EVOP consiste, identicando dos o tres factores relevantes del proceso, en llevar a cabo experimentos
secuenciales de bloques completos con 22 o 23 tratamientos ms una realizacin
al centro (la parte factorial representando alternativas de combinaciones de los
factores relevantes del proceso en donde presumiblemente no hay posibilidades
de producir fuera de especicaciones; adems generalmente el centro del diseo
representa la condicin actual de operacin del proceso). Idealmente se corre el
proceso en tantos bloques como sea necesario mientras no se reporte signicancia
de alguno de los efectos. A cada bloque as corrido se le da el nombre de ciclo en
la literatura de EVOP. Los resultados alcanzados permiten mejorar gradualmente
el proceso.
Los conceptos aprendidos en este captulo se pueden aplicar para obtener los
resultados que se generan en la hoja de clculo presentada por Box y Draper,
pero sin usarla. Para ello siga el siguiente algoritmo:
1. Estime los efectos principales y de interaccin en el primer ciclo.
2. Estime el efecto de curvatura y su suma de cuadrados para el anlisis.
Aplique las siguientes frmulas:
SCcurvatura

2
N nobT
=
N + no

4.6. Ejercicios

133

donde bT = y trat y o ; cambio en el efecto de la media. N = r2k (r rplicas,


k = 2, o 3) y no = puntos en el centro del diseo.

3. Cada uno de los siguientes ciclos se va incorporando al anlisis como bloque


y se repiten los pasos 1 y 2.

4. En cada ciclo se determina la signicancia de cada efecto, de cada factor,


de su interaccin y de posible curvatura. La secuencia de ciclos se puede
parar cuando el efecto de un factor o de las interacciones es signicativa en
uno o varios de stos (r 2).
5. Si cambian las condiciones del proceso, se puede seguir investigando sobre
el desarrollo de ste. Para ello habr que incorporar un nuevo conjunto de
condiciones experimentales (y as nuevos ciclos).
Se aplic el algoritmo anterior en el siguiente ejemplo. Se tiene un proceso
funcionando a una temperatura de 150 o C, con un tiempo de proceso de 30
minutos (condicin al centro en este ejemplo). Se aplica un diseo 22 (alternativas
conservadoras de operacin), con el propsito de intentar mejorar las condiciones
de operacin actual. Se mide como variable de respuesta el rendimiento del
equipo, el objetivo es incrementarlo.
Niveles

145
28

150
30

155
32

(3)#
71:4
72:5

(4)#
74:5
75:4

Factores
A : X1 :Temperatura (o C)
B : X2 :tiempo (min)
cicloncondiciones
1
2

(1)#
72:3
70:1

(2)#
73:6
74:4

(5)
73:1
71:2

# tratamientos 22 en el orden estndar propuesto y


valor en el centro
Con estos datos realice lo siguiente:
1. Estime los efectos de los factores y su interaccin en cada ciclo, e interprete
los resultados.
2. En cada ciclo elabore la tabla del ANDEVA.
3. Cmo interpreta que el cambio en el efecto de la media sea signicativo?
4. En funcin de este procedimiento (EVOP), qu puede concluir?

134

4. Estructura de tratamientos factorial

5. A partir de sus resultados, se nota un cambio en un efecto? Cul? Ese


puede ser el motivo para cambiar a otro grupo de ciclos?
6. Bosqueje una grca que ilustre intuitivamente el proceso del EVOP.
Ejercicio 4.10 Con el objeto de mejorar la resistencia de unas bolsas de celofn,
en un proceso se consideran dos factores, a saber: temperatura (alta, moderada,
baja) y tiempo de calentamiento (10 y 20 minutos). La variable de respuesta es
la resistencia. A continuacin se presenta la tabla de ANDEVA para que conteste
las siguientes preguntas:
Fuente de
variacin
A:tem
B:tiem
AB
Error
Total

Grados de
libertad
2
1

Suma de
cuadrados
3843

Cuadrado
medio

Fc

Valor p

504
651
540

6
11

1. Complete la tabla.
2. Escriba las hiptesis nulas que se deben probar.
3. Cules hiptesis nulas se rechazan?
4. Bosqueje la grca que describa el efecto de interaccin segn sus resultados.
5. Si el diseo es balanceado, diga cul es el valor de la desviacin estndar S.
6. Si y 2

= 10; d un intervalo de conanza del 95% para

7. Entre los valores de n

; n2 ; y n

, cul es ms grande?

Ejercicio 4.11 Dado un diseo 2 4 y con una tabla del ANDEVA que reporta
la suma de cuadrados siguiente:
SCtotal = 100; SCA + SCB + SCAB = 50;
SCA = 25; SCB = 10:
1.2.3.4.-

Cul es la SCerror ?
Cul es la SCA B ?
Cules son los grados de libertad para AB?
Cul es el cuadrado medio de AB?

4.6. Ejercicios

135

Ejercicio 4.12 En un estudio realizado por un grupo de estudiantes para mejorar la consistencia en unas galletas, stos realizaron el experimento controlando
dos factores en dos niveles, el factor A: material del molde (aluminio, vidrio),
factor B: mtodo de batido (batidora, a mano usando pala) y un tercer factor
con tres niveles, C: la marca de harina (comercial, propia, nutri). Cada una de
las doce formulaciones fue evaluada por tres jueces con una escala de 0 a 70. El
esquema experimental y los resultados se muestran a continuacin.
Trat
1
2
3
4
5
6
7
8
9
10
11
12

A
1
1
1
1
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
0
0
0
0
1
1
1
1

y1
60
57
53
51
65
61
57
54
58
56
53
51

y2
55
46
34
28
70
58
46
37
49
43
34
28

y3
58
54
50
47
64
59
54
51
56
53
50
47

1. Suponga que a usted le encomiendan realizar este experimento, indique los


detalles de cmo lo realizara.
2. Haga las grcas de los efectos para cada factor y las de interaccin.
3. Calcule la tabla ANDEVA.
4. Estime la desviacin estndar en cada tratamiento. De manera intuitiva
indique si algn factor tiene efecto de dispersin (efecto sobre desviaciones
estndar).
Ejercicio 4.13 Los siguientes datos representan los resultados al realizar un
experimento con 3 replicaciones en un proceso qumico. En ste se desea obtener
un nuevo fertilizante, el cual se usar para mejorar el rendimiento en la produccin
de un fruto. El factor A es el mtodo de fabricacin (estndar, nuevo), el factor
B concentracin de un agente qumico (10%, 20%, 30%).
Factores
a1
a2

b1
y 11 = 16
y 21 = 4
y 1 = 10

b2
y 12 = 11
y 22 = 9
y 2 = 10

b3
y 13 = 16
y 23 = 14
y 3 = 10

y1
y2
y

= 14:3
= 9
= 10

136

4. Estructura de tratamientos factorial

Plantee sus hiptesis y verifquelas. Haga la grca para ilustrar el efecto de


interaccin entre los factores A y B.
Ejercicio 4.14 Un pigmento es disuelto en un lquido mediante un dispositivo
de rodillos. La efectividad de la molienda es evaluada pasando el lodo a travs de
un ltro para un periodo jo de tiempo, se mide la presin de la gota que pas
por el ltro. El experimento consiste en un factorial 4 3. A la velocidad (rpm)
y B el volumen del lquido (l) en el dispositivo son los factores del proceso. Los
niveles de los factores y la presin se describen a continuacin:
Trat
1
2
3
4
5
6
7
8
9
10
11
12

A
15
25
35
45
15
25
35
45
15
25
35
45

B
90
90
90
90
110
110
110
110
130
130
130
130

yij
16:5
11:1
8:4
5:6
20:3
16:3
11:5
8:8
12:9
11:0
7:9
6:1

1. Haga un grco para describir los datos en cada factor, diga lo que observa.
2. Plantee las hiptesis de inters para el proceso, construya la tabla del ANDEVA y pruebe las hiptesis.
3. Obtenga sus conclusiones a partir de sus resultados.
Ejercicio 4.15 Considere el ejercicio 7.7, haga el anlisis estadstico como si
fuera un diseo factorial 25 : Interprete los diagramas de Pareto y normal para los
efectos de los factores e interacciones.
Ejercicio 4.16 Se plantea un programa para evaluar la calidad en tubos de
bra de vidrio. Para ejecutar el programa se llev a cabo un experimento. El
programa requiere de 16 tubos, la mitad fueron manufacturados en la planta A
y la otra mitad en la planta B. Cada tubo se fabric bajo dos condiciones de
operacin y en dos temperaturas. Las condiciones que dan lugar al esquema
experimental se describen en la siguiente tabla.

4.6. Ejercicios

Trat
1
2
3
4
5
6
7
8

Planta
2
2
2
1
2
2
1
2

137

Condiciones
de operacin
Normal
Normal
Severa
Severa
Normal
Normal
Normal
Severa

Temp.
175
150
150
175
175
150
150
175

Trat
9
10
11
12
13
14
15
16

Planta
1
1
1
2
1
1
2
1

Condiciones
de operacin
Normal
Severa
Normal
Severa
Severa
Severa
Severa
Normal

Temp.
175
150
150
175
175
150
150
175

1. Proponga diferentes estrategias para realizar el experimento.


2. En funcin de su planteamiento, identique cul de los siguientes conceptos
estadsticos est incluido en el programa de prueba:
1. Factores
2. Niveles
3. Bloque
4. UE
5. Estructura
de diseo

6. Mediciones repetidas
7. Tratamientos
8. Covariables
9. Respuesta
10. Estructura de
tratamiento

138

4. Estructura de tratamientos factorial

Captulo 5

Estructura factorial
fraccionada
Consultar a un estadstico despus de que un experimento ha sido
terminado, en general puede no ser ms que pedirle un examen post
mortem. l puede quizs decir de qu muri el experimento.

Ronald A. Fisher

5.1

Conceptos bsicos

En muchas situaciones industriales o de investigacin puede ocurrir que una gran


cantidad de factores estn presentes para explicar el proceso; es importante en
una primera aproximacin, determinar cules de los varios factores son realmente
los ms relevantes en su efecto sobre la variable respuesta bajo estudio. En un
experimento con muchos factores, el problema del gasto de recursos econmicos y
tiempo impone una serie de preguntas; entre ellas, se pueden citar las siguientes:
Cmo elucidar qu factores y cules de sus interacciones son los ms importantes? Cmo realizar lo anterior con un costo y manejo experimental ecientes?
La idea estadstica es aplicar slo una parte o fraccin de todos los tratamientos, de tal manera que la fraccin seleccionada genere la suciente informacin
para estimar los efectos de mayor inters para el experimentador. Los factoriales
2k fraccionados constituyen una alternativa eciente en estas situaciones.
En este captulo se presentarn diseos factoriales fraccionados bajo el criterio
de reducir el tamao del experimento.

140

5.2

5. Estructura factorial fraccionada

Factorial 23 fraccionado

Ejemplo 5.1

En una empresa existe la necesidad de mejorar el tiempo de ltrado de aire, dado


que el sistema actual ocasiona algunos problemas en el rendimiento del proceso
y aumenta los costos de operacin. Con la ayuda del diagrama de causa efecto
que describe el sistema de ltrado, el ingeniero del proceso selecciona 8 factores
que l considera pueden ser importantes para reducir el tiempo de ltrado. Se
considera que en este estudio inicial cada factor tiene dos niveles, de esta manera
el nmero de tratamientos que se requieren para realizar este experimento son
28 = 256: Tal situacin resulta poco operativa, por lo que se plantea la necesidad
de reducir el nmero de tratamientos para llevar a cabo el experimento.
El caso que se estudiar en el presente captulo es el de los diseos factoriales
con dos niveles, esto es, un diseo en donde todos los factores de inters tengan
dos niveles cada uno. Primero se presentarn las ideas esenciales para fraccionar
un experimento, es decir, un procedimiento para seleccionar tratamientos, de tal
manera que permita estimar los efectos de mayor inters para el experimentador
pero con un experimento ms pequeo. En este captulo utilizaremos primordialmente la codicacin de los niveles ( 1; 1) de los factores en un 2k , presentada
en el captulo anterior, para identicar y seleccionar una fraccin de un factorial
2k :
Enunciando un principio de jerarqua en los fenmenos estudiados, se esperara que las interacciones de orden superior tuvieran, de manera relativa, un
menor efecto sobre la respuesta que el efecto de interacciones de orden menor, o
que el efecto principal de cada factor. Asumiendo este principio de jerarqua en
el modelaje, por ejemplo, en un diseo factorial 23 ; se podra pensar a priori que
el efecto de la interaccin ABC es de menor importancia que los efectos de A, de
B y de C y de sus interacciones dobles, y con ello manejar a la interaccin ABC
como nula en la regin experimental de inters.
Operativamente, manejar as la interaccin ABC implica que se est dispuesto
a no estimar su efecto con los datos generados por la fraccin seleccionada. Aqu
surge la pregunta de cmo seleccionar esa fraccin de tal manera que cumpla con
lo requerido.

5.2. Factorial 23 fraccionado


Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

141
C
1
1
1
1
1
1
1
1

AB
1
1
1
1
1
1
1
1

AC
1
1
1
1
1
1
1
1

BC
1
1
1
1
1
1
1
1

ABC
1
1
1
1
1
1
1
1

yijl
y111
y211
y121
y221
y112
y212
y122
y222

Tabla 5.1 Esquema completo codicado de un factorial 23

Observe la Tabla 5.1, consideremos la columna de ABC. Leyndola resulta


que hay cuatro tratamientos con 1 en la columna ABC y cuatro tratamientos
con ( 1) en esta misma. Si la fraccin se congura considerando slo a los
tratamientos con 1 en la columna ABC, es decir, los tratamientos 2, 3, 5 y 8, no
estaramos en posibilidad de estimar el efecto de ABC; sin embargo veremos que
s estaramos en posibilidad de estimar el efecto de A, el efecto de B y el efecto
de C.
Esta fraccin de tratamientos seleccionados result en la mitad del nmero
inicial de 8(= 23 ), por lo que se denota por factorial 21 23 o por factorial 23 1 :
Hay que sealar que as como conguramos la fraccin con elementos 1 en la
columna ABC, pudimos congurar otra fraccin tomando a los tratamientos con
1 en sta. Desde el punto de vista del anlisis estadstico ambas fracciones son
equivalentes. En el primer caso se dice que el generador de la fraccin es

I = +ABC:

(5.1)

Si hubiramos congurado la otra fraccin, el generador respectivo sera denotado


por

I=

ABC:

(5.2)

En resumen, se puede decir que la no estimacin de la interaccin triple


permiti la generacin de dos fracciones para asignar estratgicamente cuatro
tratamientos en cada una. En la prctica se selecciona aleatoriamente cualquiera
de las dos fracciones generadas, mostradas en la Tabla 5.2 y 5.3.

142

5. Estructura factorial fraccionada


Trat
1
4
6
7

A
1
1
1
1

B
1
1
1
1

C
1
1
1
1

AB
1
1
1
1

AC
1
1
1
1

BC
1
1
1
1

Tabla 5.2 Fraccin de un factorial 23 ; I =


Trat
2
3
5
8

A
1
1
1
1

B
1
1
1
1

C
1
1
1
1

AB
1
1
1
1

AC
1
1
1
1

BC
1
1
1
1

Tabla 5.3 Fraccin de un factorial 23

1;

ABC
1
1
1
1

yijl
y111
y221
y212
y122

ABC
ABC
1
1
1
1

yijl
y211
y121
y112
y222

I = +ABC:

Ejemplo 5.2
En el desarrollo de nuevos productos, un ingeniero industrial tiene por objetivo
evaluar la protena de un jarabe que se obtiene usando semilla de amaranto. El
proceso se realiza en varias etapas, en la ltima de stas se obtiene la glucosa
mediante un sistema de ltracin. Los factores importantes para este proceso
son la temperatura, la cantidad de una enzima y el porcentaje de sustrato; la
descripcin de estos factores y sus niveles se muestran a continuacin en la Tabla
5.4.
FactoresnNiveles
A: temperatura
B: enzima
C: sustrato

1
650 C
10v=w
10%

1
800 C
30v=w
30%

Tabla 5.4 Factores y niveles del Ejemplo 5.2


Por las caractersticas de este proceso el ingeniero slo tena la posibilidad de
realizar la mitad del experimento, y para ello estuvo dispuesto a no estimar el
efecto de la interaccin triple. El esquema resultante es como el que se muestra en
la Tabla 5.5. Para realizar su experimento seleccion aleatoriamente la fraccin
con I = +ABC; al aplicar cada tratamiento se evalu la protena del jarabe, los
resultados se describen en la Tabla 5.5.

5.2. Factorial 23 fraccionado

Trat
2
3
5
8

A
1
1
1
1

143

B
1
1
1
1

C
1
1
1
1

AB
1
1
1
1

AC
1
1
1
1

BC
1
1
1
1

Tabla 5.5 Resultados del Ejemplo 5.2, 23

1;

yijl
24
36
34
30
I = +ABC

Una vez realizado el experimento, el objetivo es estimar los efectos de los


factores y de las interacciones dobles. Los clculos para cada factor e interaccin
se resumen en la Tabla 5.6.
Trat
2
3
5
8
y+
y
b=

1
1
1
1
27
35
8

1
1
1
1
33
29
4

1
1
1
1
32
30
2

AB
1
1
1
1
32
30
2

AC
1
1
1
1
33
29
4

BC
1
1
1
1
27
35
8

Tabla 5.6 Estimacin de efectos en un 23

1,

yijl
24
36
34
30

I = +ABC

En la Tabla 5.6 se puede observar que las columnas que representan al factor
A y a la interaccin BC son iguales, esto implica que los efectos de A y BC se
calculan de la misma forma, y as:
^A = ^BC
De manera semejante, se tiene que las columnas de los factores B y C coinciden con las columnas de las interacciones AC y AB respectivamente, con lo que
sus efectos sern computados de la misma manera, es decir:
^B = ^AC
^C = ^AB
Estas tres ltimas igualdades muestran que los efectos principales estn confundidos con efectos de interaccin doble; esta confusin se denota como se mues-

144

5. Estructura factorial fraccionada

tra en la Tabla 5.7. El efecto en cada uno de los factores se representa por:
^A = ^BC = 8
^B = ^AC = 4
^C = ^AB = 2
Tabla 5.7 Efectos principales e interaccin estimados para el Ejemplo 5.2
Entonces, cuando en un factorial 23 se sacrica la estimacin de la interaccin
ABC para poder generar fracciones del experimento, como se ha mostrado en este
caso, se dice que el diseo 23 1 es una estructura de tratamientos de resolucin
3 1
. En
III. Para identicarlo se escribe la resolucin como subndice, es decir 2III
los factoriales fraccionados de resolucin III se dice que los factores A, B y C
son alias de las interacciones AC; BC y AB; respectivamente.

5.3

Alias y resolucin

En general, se dice que un factorial fraccionado es de resolucin III cuando los


efectos principales no se confunden con otros efectos principales, sin embargo los
efectos principales se confunden con efectos de interaccin doble.
Cuando un factorial se fracciona, existe una estructura llamada alias, que
indica cmo los efectos estn confundidos con otros efectos, los alias. Determinar
tal estructura alias es simple; se multiplica el generador de la fraccin por el
factor o la interaccin de la que se quiera determinar su alias. Por ejemplo si el
factor A se multiplica por el generador I = +ABC; el resultado es:
AI = A2 BC
Observe que el factor A est elevado al cuadrado en el segundo miembro de la
ecuacin anterior. Dado que en la estructura de tratamientos que se estudia, los
factores tienen dos niveles, los elementos de las columnas al multiplicarse por s
mismos siempre resultan en una columna de 10 s (la columna de 10 s se ha denotado
por I), es decir, A2 = I:De esta manera,
A = IBC = BC
Esta expresin indica que el factor A es alias de la interaccin BC; como
mostraron los resultados que se obtuvieron numricamente en el Ejemplo 5.2;
de modo anlogo este producto se tiene para los otros factores al realizar la
multiplicacin correspondiente, o sea
BI = AB 2 C = AIC = AC

5.3. Alias y resolucin

145
CI = ABC 2 = AB

En general la estructura alias del factorial 23


la Tabla 5.8.

se escribe como se muestra en

A ! BC
B ! AC
C ! AB
Tabla 5.8 Estructura alias del factorial 23

1 con

I = +ABC

Se puede observar que se obtuvieron los efectos estimados de los factores. Para
evaluar la signicancia estadstica de stos se construye la tabla del ANDEVA
como se hizo en el captulo anterior.
Suponga que por cuestiones de azar el ingeniero seleccion la segunda fraccin
con generador I = ABC, cuyo esquema y los resultados de la protena para esos
4 tratamientos se describe en la Tabla 5.9.
Trat
1
4
6
7

B
1
1
1
1

C
1
1
1
1

AB
1
1
1
1

1
1
1
1

AC
1
1
1
1

Tabla 5.9. Resultados Ejemplo 5.2, 23

BC
1
1
1
1
1,

yijl
34
46
54
58

I=

ABC

La estimacin de los efectos se realiza en forma similar a lo hecho en la fraccin


I = +ABC; los resultados se describen a continuacin:

y+
y
^

A
50
46
4

B
52
44
8

C
56
40
16

AB
40
56
-16

AC
44
52
-8

BC
46
50
-4

En resumen, la estimacin de los efectos principales y sus alias con los efectos
de interaccin es:
^A =
^B =
^C =

^BC = 4
^AC = 8
^AB = 16

146

5. Estructura factorial fraccionada

De esta manera la estructura alias es similar a la mostrada en la Tabla 5.8,


slo cambia el signo, como se muestra en la Tabla 5.10.
A ! BC
B ! AC
C ! AB
Tabla 5.10 Estructura alias en un 23

1 con

I=

ABC

El factorial fraccionado 23III1 tiene otra caracterstica de inters; sta se genera


a partir de la relacin que existe entre los grados de libertad y el nmero de
tratamientos. Observe que el factorial 23III1 tiene 4 tratamientos y por lo tanto
tres grados de libertad (4 1); con estos ltimos, slo se puede estimar la suma de
cuadrados para cada efecto principal y no da lugar a tener grados de libertad para
estimar la suma de cuadrados del error. Como resultado de esta situacin, se dice
que el factorial 23III1 es saturado y se satisface la relacin: nmero de factores ms
uno = nmero de tratamientos. Existen otros factoriales fraccionados que son
saturados, para detectarlos es necesario vericar si se cumple la relacin general
k + 1=N; donde k es nmero de factores y N es nmero de tratamientos. Una
denicin alternativa de diseo saturado es aquella donde se enuncia como aquel
diseo en el que el nmero de efectos por estimar es uno menos que el nmero de
corridas del mismo.

5.4

Factorial 24 fraccionado

El plan presentado para fraccionar un factorial 23 se puede generalizar para estructuras de tratamiento con ms de tres factores en dos niveles. Veamos el caso
para el factorial 24 con 16 tratamientos originales. Nuevamente la idea es separar
en fracciones los 16 tratamientos. Suponga que en primera instancia se pueden
slo experimentar con 8 tratamientos y por ello una fraccin 12 del 24 (= 24 1 ) se
requiere; si I = +ABCD; esto es, una fraccin sera con valores 1 en la columna
ABCD.

Ejemplo 5.3
En un proceso de moldeo por inyeccin se obtienen paneles estructurales de pelculas de plstico. El grado de delgadez de la hoja es una caracterstica de calidad

5.4. Factorial 24 fraccionado

147

crtica para el proceso. Los factores y sus niveles se muestran en la Tabla 5.11.
FactoresnNiveles
A: velocidad de inyeccin (seg)
B: tiempo de cura (seg)
C: temperatura de molde o C
D: temperatura de fundido o C

1
10:0
150:0
40:0
250:0

1
22:5
200:0
80:0
300:0

Tabla 5.11 Factores y niveles del Ejemplo 5.3


Se tuvo que fraccionar el factorial 24 a la mitad para poder realizar el experimento; en este caso, el generador es I = +ABCD, vea la seccin 5.8 de este
captulo. La respuesta considerada es la delgadez (mm) de la pelcula de plstico.
Observe que el generador I = +ABCD se puede escribir como D = +ABC:
En la Tabla 5.12 se presenta al factorial 24 1 en el orden estndar, nicamente
con los factores A; B; C; a continuacin se completa la columna referente al factor
D con el producto de los factores ABC: Por ejemplo, si el producto es menos uno
( 1), entonces el signo que le corresponde al nivel del factor D es menos uno, de
tal manera que el producto entre ABC y D sea positivo.
Trat
1
2
3
4
5
6
7
8

I
1
1
1
1
1
1
1
1

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D = ABC
1
1
1
1
1
1
1
1

Tabla 5.12 Esquema del factorial 24

1,

y
46
54
45
50
55
30
46
24

con I = +ABCD

Previo a estimar los efectos de los factores, es conveniente establecer la estructura alias de los efectos. Por ejemplo, si se desea conocer con qu efecto est
confundido el factor A, entonces se multiplica este factor con el generador I, el
producto es:
AI = A2 BCD = BCD
Con lo que el efecto del factor A est confundido con el efecto de interaccin triple
BCD. De modo similar se realiza con los otros factores, considere la interaccin
entre los factores B y D, el producto de estos factores con el generador I. Se
tiene el siguiente resultado:
BDI = AB 2 CD2 = AC

148

5. Estructura factorial fraccionada

Se puede observar que para este caso la interaccin doble BD est confundida
con la interaccin doble AC, la estructura alias para la fraccin del factorial 24
se muestra en la Tabla 5.13.
A ! BCD
B ! ACD
C ! ABD
D ! ABC
AB ! CD
AC ! BD
AD ! BC
Tabla 5.13 Estructura alias en un 24

1 con

I = +ABCD

El diseo cuya estructura se presenta en la Tabla 5.13 tiene resolucin IV , as


4 1
. Una denicin formal
el factorial 24 1 es de resolucin IV , y se denota por 2IV
sobre esta resolucin de un diseo se menciona a continuacin.
Estructura de tratamiento de resolucin IV
Una estructura de tratamiento es de resolucin IV , si los efectos principales no
se confunden con otros efectos principales, sin embargo, stos se confunden con
efectos de interaccin triple, y efectos de interaccin doble se confunden con otros
efectos de interaccin doble.
Estructura de tratamiento de resolucin V
Siguiendo de esta manera, un diseo de mayor resolucin es el V , el cual se
puede denir como sigue. Una estructura de tratamiento es de resolucin V , si
los efectos principales no se confunden con otros efectos principales y estos se
confunden con efectos de interaccin de alto orden, y los efectos de interaccin
doble estn confundidos con efectos de interaccin triple.
Continuacin del ejemplo 5.3
En el proceso de moldeo por inyeccin, los resultados que se obtuvieron se
mostraron en la Tabla 5.12. A continuacin se presentan los efectos estimados y
sus cuadrados medios, as como el cuadrado medio del error. Vea la Tabla 5.14,
las expresiones para el clculo de estos cuadrados se presentaron en el captulo
anterior. De manera similar a la explicada en el Captulo 4, se puede llevar a cabo

5.5. Fracciones ms pequeas

149

el anlisis de varianza para estudiar la signicancia estadstica de los efectos.

y
y+
b=y
y
+
SCb
CMerror

A
48:0
39:5
8:5
144:5
0

B
46:0
41:0
5
50

C
48:8
38:8
10
200

D
43:0
44:5
1:5
4:5

AB
43:8
43:8
0
0

AC
51:3
36:3
15
450

AD
45:0
42:5
2:5
12:5

Tabla 5.14 Efectos estimados y sus respectivas sumas de cuadrados, y


cuadrado medio del error para el Ejemplo 5.3

5.5

Fracciones ms pequeas

En el Ejemplo 5.1, la mitad del factorial 28 tiene an una buena cantidad de


tratamientos, por ello conviene hacer un mayor fraccionamiento de este factorial,
as en lugar de separar los tratamientos en dos fracciones, se pueden considerar
cuatro, ocho o 2p fracciones ms pequeas. En general los factoriales 2k fraccionados en dos o ms fracciones se denominan 2k p ; cuando es p = 1 se tendr
un medio del experimento (un generador), si p = 2 es necesario un cuarto del
experimento (dos generadores) y as sucesivamente; la fraccin que se requiera es
el inverso a una potencia de 2 (la potencia p denota al nmero de generadores).
Entonces, al realizar un mayor fraccionamiento de un experimento se requiere de
ms generadores.

Ejemplo 5.4
En una empresa existe un proceso que tiene por objetivo remover el material que
se crea en el sistema de produccin. La mquina limpiadora se compone de una
brocha de acero cilndrica. El equipo de trabajo compuesto por varios empleados
identic cinco factores que afectan la eciencia de la operacin en la limpieza,
sta se evala mediante la razn del material que se remueve. Los factores y sus
niveles se describen en la Tabla 5.15.

150

5. Estructura factorial fraccionada

FactoresnNiveles
A: dimetro del lamento
B: longitud del lamento
C: nmero de lamentos
D: ancho de la brocha
E: profundidad de entrada

1
30mm
2cm
18000
4cm
250mm

1
35mm
7cm
23000
8cm
500mm

Tabla 5.15 Factores y niveles del Ejemplo 5.4


De los 25 = 32 tratamientos, el grupo de trabajo decidi realizar slo ocho de
ellos. En tal situacin, del factorial 25 se tiene que obtener una fraccin de 14 , es
5
5
decir, 24 = 222 = 25 2 ; lo cual da lugar a cuatro posibles fracciones; resulta que se
requieren dos generadores. Para ello es necesario sacricar dos efectos en lugar
de uno, como en el caso 2k 1 . Suponga que se puede pensar en sacricar ABD y
ACE; con ello tendramos dos generadores, cada uno con dos posibilidades:
I1 =

ABD

I2 =

ACE

Con objeto de obtener la fraccin deseada, se procede de la siguiente manera:


se construye el esquema experimental 25 representando los niveles de los factores
con unos y menos unos; en ste se representan todas las posibles combinaciones
de los niveles de los factores presentadas en el orden estndar. Se representan
tambin las cinco columnas correspondientes a los factores; se agregan dos columnas, una representa el producto de los factores ABD; denomnela I1 , la otra el
producto de los factores ACE; denomnela I2 ; en cada una de estas hay 10 s y
10 s. En una primera fraccin denotada por f (+; +), se escriben los tratamientos que tienen en comn el 1 en las columnas I1 e I2 , la siguiente fraccin que se
denota por f (+; ), corresponde a los tratamientos que en la columna I1 est el
1 y en la columna I2 est el 1. En la tercera fraccin f ( ; +), se representan
los tratamientos cuando en las columnas I1 e I2 estn el 1 y 1 respectivamente;
en la ltima fraccin f ( ; ) estn los tratamientos que tienen en comn el 1
en las columnas I1 e I2 :
El experimento se realiza seleccionando aleatoriamente una de estas cuatro
fracciones; suponga que se ha seleccionado f (+; +):
La meta principal de este factorial 25 2 es aplicar slo un cuarto de los
tratamientos para estimar los efectos principales, por ello se han propuesto dos
generadores; dado que cada uno de ellos genera dos fracciones, la combinacin
de ambos da lugar a cuatro fracciones, cada una de ellas con ocho tratamientos.
Se llama fraccin principal a la fraccin f (+; +); sta se obtiene a partir de

5.5. Fracciones ms pequeas

151

los generadores I1 = +ABD (D = +AB); I2 = +ACE (E = +AC): Utilizando


los tres factores A, B, y C, el diseo correspondiente a f (+; +) se describe en la
Tabla 5.16.
Observe que los productos AB y AC en la Tabla 5.16, para los ocho tratamientos, son siempre 1 y 1 respectivamente. Con referencia al Ejemplo 5.4, el experimento se realiza aleatoriamente, poniendo la mquina limpiadora bajo estos
tratamientos. El anlisis estadstico se realiza aplicando la expresin (4.24) para
estimar los efectos, y los clculos apropiados para construir la tabla del ANDEVA.
Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D = +AB
1
1
1
1
1
1
1
1

E = +AC
1
1
1
1
1
1
1
1

Tabla 5.16 Esquema del factorial factorial 25

Para conocer qu efectos estn confundidos es necesario establecer la estructura alias; sta se logra mediante el mecanismo operativo indicado anteriormente, es decir, multiplicando los generadores por los factores e interacciones.
A continuacin se ilustra la obtencin de la estructura alias para los generadores
I1 = +ABD y I2 = ACE, el proceso se inicia multiplicando entre s estos
generadores:
I1 I2 = (ABD)( ACE) =

A2 BCDE =

BCDE

As, el alias de cada factor se obtiene multiplicando, la letra del factor por I1 ; I2
y BCDE. Por ejemplo, los alias del factor A son:
AI1 = A(ABD) = A2 BD = BD
AI2 = A( ACE) =
A( BCDE) =

A2 CE =
ABCDE

CE

152

5. Estructura factorial fraccionada

En forma anloga se obtienen los alias de los dems factores; en resumen los
resultados se muestran en la Tabla 5.17.
I1 = ABD
A
B
C
D
E
BC
BE

I2 = ACE
BD
AD
AE
AB
AC
DE
CD

BCDE
CE
CDE
BDE
BCE
BCD
ACD
ABC

ABCDE
ABCE
ABCD
ACDE
ABDE
ABE
ADE

Tabla 5.17 Estructura alias del factorial 25III2 en la fraccin (+,)


Esta estructura de tratamientos es de resolucin III porque existen efectos
principales confundidos con efectos de interaccin doble.

5.6

Criterio de aberrancia mnima

El cmo escoger una buena fraccin 2k p tiene una respuesta por el criterio de
mxima resolucin, que en general implica que si la resolucin de un diseo es R,
ningn efecto que involucre a l factores est aliado con efectos conformados por
menos de R l factores. Sin embargo el criterio de mxima resolucin no dice
nada respecto a cmo diferenciar entre dos fracciones con la misma resolucin.
Entre dos fracciones alternativas, cul es mejor? En ltima instancia siempre la
seleccin de una fraccin depender de cules efectos son de inters estimar. Sin
embargo, un criterio adicional al de resolucin, que a continuacin se presenta, se
enfoca sobre el nmero de efectos confundidos. Como vimos, la fraccin 2 p de
un 2k es determinada por los p efectos confundidos o, alternativamente llamados,
las p palabras de denicin. El nmero de letras en una palabra en particular
es llamado longitud de la palabra. Al grupo de p palabras, sus interacciones
generalizadas e I se le llama relacin de denicin o subgrupo de contrastes de
denicin; ste contiene 2p 1 palabras ms I.
En una fraccin 2k p denotaremos por Ai al nmero de palabras de longitud i
en el subgrupo de contrastes de denicin correspondiente; sea W = (A3 ;
; Ak )
el llamado patrn de longitudes de palabra (slo a partir de palabras de longitud
tres).
Criterio de aberrancia mnima: para cualesquiera dos fracciones 2k p , denotadas por d1 y d2 respectivamente, sea r el entero ms pequeo, tal que
Ar (d1 ) 6= Ar (d2 )

5.7. Anlisis de efectos confundidos

153

Entonces d1 se dice que tiene menos aberrancia que d2 si


Ar (d1 ) < Ar (d2 )
si el nmero de palabras de longitud r de d1 es menor que el correspondiente
en d2 : La fraccin d1 ser de mnima aberrancia si no existe otra que tenga una
menor.
As, el criterio de mnima aberrancia operacionaliza el cmo seleccionar entre
fracciones de acuerdo al nmero de palabras de cierta longitud en el subconjunto de contrastes de denicin. Para mayores detalles y tablas de diseos que
contemplan el criterio de mnima aberrancia, ver Wu y Hamada (2000).
Debe sealarse que tanto el criterio de mxima resolucin como el criterio de
aberrancia mnima para seleccionar una fraccin, son guas generales de seleccin; sin embargo, si bien una fraccin con resolucin alta y menor aberrancia es
deseable, en ltima instancia la fraccin seleccionada tiene que dar la posibilidad
de estimar los efectos de inters para el experimentador. Por ejemplo, considere
un experimento con siete factores en dos niveles cada uno, en una fraccin 1=4;
es decir 27 2 ; para el cual se proponen dos diseos:
d1
d2

I = 4567 = 12346 = 12357


I = 1236 = 1457 = 234567

W (d1 ) = (0; 1; 2; 0; 0)
W (d2 ) = (0; 2; 0; 1; 0)

El diseo d1 sera preferible.

5.7

Anlisis de efectos confundidos

Cuando se realiza el anlisis estadstico en los factoriales fraccionados de resolucin III o IV , puede ocurrir que un efecto de interaccin doble sea importante,
y que sin embargo, ste no se distinga debido a que est confundido con un efecto
principal u otra interaccin. Por ejemplo, si AB est confundido con C en algn
caso, cabe la posibilidad de que el efecto de C no sea importante y que el efecto
de AB s lo sea. En principio tal tipo de disyuntivas deben ser resueltas con
base en opiniones de expertos del rea, con las que se descarte cules efectos son
los importantes. Si las opiniones estn divididas o se basan en argumentaciones
dbiles, se requiere realizar ms experimentacin para esclarecer los efectos confundidos de inters. Se presentan a continuacin dos enfoques alternativos para
analizar efectos confundidos.

5.7.1

Adicin de corridas

Con objeto de identicar cul de los efectos en una cadena de alias corresponde al
efecto cuanticado, se puede optar por adicionar algunas corridas experimentales
extras. El siguiente ejemplo ilustra este enfoque.

154

5. Estructura factorial fraccionada

Ejemplo 5.5
En un proceso que se reere a un ciclo de mezclado, se hace una lista de las
causas y efectos que intervienen en l. En la Tabla 5.18 se muestran 11 factores
de control y las variables de respuesta del proceso. Se propone como estrategia la
seleccin de factores importantes en el proceso, considerando la viscosidad como
variable de respuesta.

Factores de control
A: temperatura de inicio
B: temperatura de descarga
C: velocidad de rotores
D: energa consumida
E: adicin de componentes
F : capacidad de llenado
G: tiempo de mezclado
H: tipo de formulacin
I: agua de enfriamiento
J: sistema de lubricacin
K: extraccin de polvos

Variables de calidad
viscosidad
gravedad especca
dureza
propiedades fsicas
color

Tabla 5.18 Factores y variables respuesta en el Ejemplo 5.5


El esquema experimental que se plantea para seleccionar las variables importantes en el proceso es un factorial fraccionado 211 7 ; en este caso se tienen 7
generadores; estos se muestran en la Tabla 5.19.
Generadores

I1
I2
I3
I4
I5
I6
I7

= ABCE
= BCDF
= ACDG
= ABDH
= ABCDI
= ABJ
= ACK

Tabla 5.19 Generadores propuestos para un factorial 211

La estructura alias considerando slo hasta efectos de interaccin doble se


muestran en la Tabla 5.20.

5.7. Anlisis de efectos confundidos

A=
B=
C=
D=
E=
F =
G=
H=
I=
J=
K=
AD =
AE =
AG =
AH =

BJ
AJ
AK
EI
BK
AI
BI
CI
AF
AB
AC
BH
BC
BF
BD

=
=
=
=
=
=
=
=
=
=
=
=
=
=
=

155

CK =
EK =
EJ =
GK =
CJ =
GJ =
DK =
DJ =
BG =
CE =
BE =
CG =
DF =
CD =
CF =

FI
GI
HI
HJ
DI
HK
FJ
FK
DH =
DH =
DG =
EF
GH =
EH =
EG =

DE
FG
FH
JK
IJ
IK

Tabla 5.20 Estructura de alias con base en los generadores en la Tabla 5.19
Los datos que se emplean para ilustrar el proceso en este ejemplo son simulados y se muestran en la Tabla 5.21.
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1

-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1

-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1

-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1

-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1

-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1

-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1

-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1

1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1

1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1

1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1

23
50
70
44
30
48
76
45
38
94
77
86
75
92
79
86

Tabla 5.21 Resultados del experimento Ejemplo 5.5

156

5. Estructura factorial fraccionada

Anlisis del diseo experimental


Se aplican los conceptos estadsticos presentados con anterioridad para estimar los
efectos de los factores y de las interacciones. Ordenando estos efectos y usando
una grca probabilstica seminormal, se puede detectar cules de los efectos
principales y de los cuatro de interaccin doble, son signicativos. Con la informacin proporcionada por la grca probabilstica normal identicamos efectos
importantes.
En la ltima columna de la Tabla 5.22 se ha sealado con s o ns la signicancia
o no de los efectos.
Factor

y+

A
B
C
D
E
F
G
H
I
J
K
AD
AE
AG
AH

68.13
76.38
63.38
78.38
65.88
61.13
61.66
66.13
65.38
53.25
59.88
69.63
61.38
64.88
58.88

y
58.5
56.25
60.25
48.25
60.75
65.50
65.00
60.50
61.25
73.38
66.75
57.00
65.25
61.75
66.75

9.63
14.13
6.13
30.13
5.13
-4.38
-3.38
5.63
4.13
-19.88
-6.88
12.63
-3.88
3.13
-6.88

CMb

370.56
798.06
150.06
3630.06
105.06
76.56
45.56
126.56
68.06
1580.06
189.06
637.56
60.06
39.06
180.06

2
S+

S2

532.7
282.6
497.9
312.8
484.9
580.9
566.3
337.3
591.4
637.1
615.8
773.7
658.8
560.1
645.0

566.6
755.6
632.8
320.8
652.2
560.3
579.4
796.9
551.1
289.4
509.4
287.4
484.8
586.5
480.2

s
s
ns
s
ns
ns
ns
ns
ns
s
ns
s
ns
ns
ns

Tabla 5.22 Resultados del anlisis estadstico Ejemplo 5.5


De la tabla que describe la estructura alias para el diseo bajo estudio, se
observa que el efecto del factor J es alias de la interaccin AB. Cabe notar que
los factores A y B tienen un efecto importante; tal situacin llama la atencin
porque existe la posibilidad de que el efecto del factor J sea realmente provocada
por la interaccin AB.
Para averiguar esa situacin conviene hacer en mayor detalle el anlisis del
experimento, siendo el propsito romper la estructura alias entre el factor J y la
interaccin AB. Para ello basta con agregar un tratamiento extra, el 17 en la
Tabla 5.23. Note que con el nuevo tratamiento ya no se confunde el efecto de J
con el de AB, debido a que en este tratamiento adicional J tiene 1; mientras
que en AB se tiene 1.

5.7. Anlisis de efectos confundidos

157

Al realizar este nuevo ensayo pueden surgir condiciones no contempladas en el


experimento que impliquen cambios en las condiciones o en el material con que se
realiza ste, por ejemplo, el da que se lleva a cabo el tratamiento adicional. Para
aminorar estos efectos de ruido se identicara un efecto de bloque correspondiente. Por otra parte, para interpretar los efectos de los factores y sus respectivas
sumas de cuadrados, es conveniente que se siga satisfaciendo la ortogonalidad
de los efectos con el efecto de bloque. En ese sentido se requiere que al sumar
el producto elemento a elemento, entre las columnas de los factores, y el ruido
sea cero. De manera inmediata, en este ejemplo uno se da cuenta que esto no se
cumple slo con haber realizado el tratamiento 17, por lo que es necesario agregar
tres tratamientos extras, 18, 19 y 20 en la Tabla 5.23.
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

AB

AD

-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1

-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1

-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
-1
-1
1
1

1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
-1
1
1
-1

1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1

1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
1
-1
-1
1

bloque
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
-1
-1
-1

y
23
50
70
44
30
48
76
45
38
94
77
86
75
92
79
86
33
50
84
87

Tabla 5.23 Resultados con cuatro tratamientos adicionales del Ejemplo 5.5
en los efectos signicativos
En resumen, con estos cuatro nuevos tratamientos, se verica que el factor J
y la interaccin AB ya no son alias, adems se satisface la ortogonalidad entre
los factores y el bloque. La nalidad de emplear el bloque es evitar efectos de
condiciones diferentes de experimentacin de los primeros 16 tratamientos y los
ltimos 4.

158

5. Estructura factorial fraccionada

El anlisis subsecuente, despus de aumentar estos tratamientos, se describe


en la Tabla 5.24.
^ef ecto

A
9:70

B
14:08

D
30:08

J
0:13

AB
19:75

AD
12:62

Tabla 5.24 Resultados con tratamientos adicionales Ejemplo 5.5


Claramente se puede notar que el efecto del factor J result, en magnitud,
ser ms pequeo con respecto a la interaccin AB, as que el efecto mostrado
en el primer experimento se debi al efecto de interaccin AB: Sin embargo hay
que notar que, a partir de la Tabla 5.23, los pares de efectos (B; D), (J; AB),
(J; AD), (AB; AD) ya no son ortogonales, por lo que no debe intentarse trabajar
con su signicancia estadstica - ya sea por el grco Normal o semi Normal o por
procedimientos anteriores que suponen ortogonalidad de efectos-, sino por medio
de mtodos de seleccin de variables, como en el modelo de regresin.
Como se puede apreciar este mtodo es un tanto ad hoc ya que depende de
la habilidad del experimentador, por lo que no puede ser aplicado de manera
general. Se describe a continuacin un enfoque ms general para estudiar efectos
confundidos.

5.7.2

Tcnica de desdoble

Otra alternativa para romper estructuras alias es la llamada tcnica de desdoble.


Desdoble total
Una estructura desdoblada, por ejemplo, consiste en construir una estructura de
resolucin IV a partir de una estructura de resolucin III.
A partir de la estructura de resolucin III se lleva a cabo otro experimento
cambiando los signos (niveles) en el esquema experimental del primero. Por
ejemplo, considere un factorial 23III1 ; donde el generador es I = ABC (d1 ) tal
como se muestra en la Tabla 5.25. Con este diseo C estar confundido con AB.
Se realiza el experimento con estos cuatro tratamientos.
Trat.
5
2
3
8

B
1
1
1
1

C
1
1
1
1

1
1
1
1

Tabla 5.25 Primer diseo d1 factorial 23III1

5.7. Anlisis de efectos confundidos

159

Considere la Tabla 5.26. Un segundo experimento, d2 , se lleva a cabo con un


esquema similar al anterior, slo que ahora se cambian los signos de los factores
(niveles); este recurso genera lo que se denomina estructura desdoblada. Considere que la lnea doble que divide a las dos tablas funciona como un doblez y
en la tabla de la derecha se ha puesto un espejo cuyo reejo de la tabla de la
izquierda corresponde pero con signos contrarios. Note que ambas tablas juntas
representan a los 8 tratamientos de un diseo factorial 23 pero en dos experimen4 1
tos separados. El diseo aumentado consiste de ocho tratamientos 2IV
con un
factor para identicar los dos bloques (d1 y d2 ).

Trat.
5
2
3
8

bloque

-1
1
-1
1

-1
-1
1
1

1
-1
-1
1

1
1
1
1

donde C = A B
Primer experimento d1

Trat.
1
6
7
4

1
-1
1
-1

1
1
-1
-1

-1
1
1
-1

bloque
-1
-1
-1
-1

Segundo experimento d2

3 1
Tabla 5.26 Diseo aumentado 24IV 1 a partir de un 2III

Otro ejemplo del uso de la tcnica de desdoble se presenta a continuacin para


el caso de un diseo 27III4 con generadores

d1 : D = AB; E = AC; F = BC; G = ABC

En la Tabla 5.27 se muestra el diseo aumentado. Se puede mostrar que los


generadores para d2 son:

d2 : D =

AB; E =

AC; F =

BC; G = ABC:

Con ello, juntando ambos grupos de generadores de d1 y d2 ; se aprecia que


slo se mantiene G = ABC y que las interacciones dobles se vuelven estimables
con el diseo aumentado d (= d1 d2 ) :

160

5. Estructura factorial fraccionada

d1
1
2
3
4
5
6
7
8
d2
9
10
11
12
13
14
15
16

A
1
1
1
1
1
1
1
1
A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1
B
1
1
1
1
1
1
1
1

C
D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
C
D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

E
1
1
1
1
1
1
1
1

F
1
1
1
1
1
1
1
1
E
1
1
1
1
1
1
1
1

G
1
1
1
1
1
1
1
1
F
1
1
1
1
1
1
1
1

Bloque
1
1
1
1
1
1
1
1
G Bloque
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

7 4
(d1 ) aumentado
Tabla 5.27 Estructura de doblez a partir de un 2III
7 3
a un 2IV (d = d1 d2 )

Estructuras de desdoble alternativas


Li y Mee (2002) discuten sobre la tcnica de desdoble en casos en los que no
representa necesariamente la mejor forma de aumentar un diseo de resolucin
impar a uno de resolucin par, ya que el cambio de signo de todas las columnas
de la fraccin original slo elimina efectos confundidos formados por un nmero
impar de factores. Mejores esquemas de desdoble los podemos identicar por
medio del examen de las palabras de longitud tres en los generadores de la fraccin
original (incluidas sus interacciones generalizadas), que conforman el llamado
subgrupo de contrastes de denicin, por medio del siguiente algoritmo (en el
que a los factores que resulten circulados se les cambiar el signo y a los tachados
no se les cambiar el signo).
Algoritmo de Li y Mee
1. Enliste todas las palabras de longitud tres en la relacin de denicin. Si
existen factores que aparecen en el subgrupo de contrastes de denicin pero

5.7. Anlisis de efectos confundidos

161

que no estn en alguna palabra de longitud tres, entonces necesariamente


existen desdobles mltiples que incrementan la resolucin.
2. Trabajando sobre tal lista, tache los k p factores bsicos, esto es, los
factores usados para generar los p factores adicionales.
3. Circule cualquier factor que aparezca en cualquier palabra de longitud tres
con dos factores bsicos. Circule este factor cuando aparezca en las otras
palabras de longitud tres.
4. Tache cualquier factor que aparezca en una palabra de longitud tres con un
factor ya tachado y uno ya circulado. Tache este factor cuando aparezca.
Contine circulando o tachando cualquier factor que aparezca en una palabra formada con todos los factores marcados excepto uno, siguiendo las
siguientes dos reglas: si un nmero par de factores est circulado, entonces
circule el factor restante; si slo un factor est circulado, entonces tache el
factor restante.
5. Si todos los factores estn ya marcados, existe slo una fraccin de despliegue para incrementar la resolucin. Sin embargo, si quedan factores sin
marca, cada uno de ellos puede ser circulado o tachado. Cualquier arreglo
resultante para el que un nmero impar de factores est circulado en cada
palabra de longitud tres, incrementar la resolucin a IV o ms.
Ejemplos usando el algoritmo
1. Un diseo 28

generado por E = AB; F = AC; G = AD y H = ABCD:

(a) Paso 1: palabras de longitud tres son ABE; ACF; ADG, despus de
haber obtenido interacciones generalizadas entre los 4 generadores iniciales. En estas tres palabras de longitud tres no aparece el factor H;
indicando que hay mltiples posibilidades de desdoble.
(b) Paso 2: de la lista anterior se tachan A; B; C; y D dado que con ellos
se generan los E; F; G y H:
(c) Paso 3: se circula ahora a E; F y G porque aparecen en palabras de
longitud tres con dos factores bsicos: ABE; ACF; ADG:
(d) Como ya todos estn marcados salvo H; los esquemas de desdoble son
cambiar signos a E; F y G; o alternativamente a E; F; G y H:
2. Un diseo 29
J = ABCD:

generado por E = AB; F = AC; G = AD; H = BCD y

162

5. Estructura factorial fraccionada


(a) Paso 1: palabras de longitud tres son cuatro: ABE; ACF; ADG;
AHJ: Aparecen todos los factores en ellas.
(b) Paso 2: en tal lista tache A; B; C y D porque son los bsicos.
(c) Paso 3: como E; F y G aparecen en ABE; ACF y ADG; respectivamente, palabras de longitud tres junto con dos factores bsicos, son
circulados.
(d) Paso 4: en la lista no hay factores que cumplan con las condiciones de
este paso.
(e) Paso 5: como H y J no han sido marcados circulando uno y tachando
el otro, o viceversa, se generan dos esquemas de desdoble: cambiar el
signo a E; F; G y H; cambiar el signo a E; F; G y J:

3. Un diseo 210 6 generado por E = AB; F = AC; G = BC; H = AD;


J = BCD; L = ABCD:

(a) Paso 1: las palabras de longitud tres son ABE; ACF; BCG; ADH;
AJL; DGJ; EF G y GHL: Todos los factores aparecen entonces en
estas palabras de longitud tres.
(b) Paso 2: tache A; B; C y D en la lista anterior.
(c) Paso 3: dado que E; F; G y H aparecen en palabras de longitud tres
con dos factores bsicos, circularlos.
(d) Paso 4: dado que J aparece en la lista en DGJ; palabra de longitud
tres formada con un factor ya circulado y un factor tachado, tacharlo.
Dado que L aparece en GHL; G y H ya marcados, ambos circulados,
circule a L:
Todos los factores ya estn marcados, la nica alternativa de desdoble
es cambiar el signo de E; F; G; H y L: En general ningn diseo de 16
corridas con k > 9 puede ser aumentado con una fraccin de desdoble
para incrementar la resolucin a IV sin eliminar todas las palabras de
longitud impar.

Para mayores detalles sobre tal algoritmo y otros resultados interesantes, consulte a Li y Mee (2002).

5.8. Generadores de fracciones en diseos 2k

5.8

163

Generadores de fracciones en diseos 2k

A continuacin se presentan unas tablas que muestran los generadores para fraccionar diseos experimentales con diferente nmero de factores.

no. de
factores
3
4
5

no. de
UE
4
8
16
8

fraccin

resolucin

1=2
1=2
1=2
1=4

III
IV
V
III

16

1=4

IV

1=8

III

1=4

IV

16

1=8

IV

1=16

III

64

1=4

32

1=8

IV

16

1=16

III

32

generador
C=
D=
E=
D=
E=
E=
F =
D=
E=
F =
F =
G=
E=
F =
G=
D=
E=
F =
G=

AB
ABC
ABCD
AB
AC
ABC
BCD
AB
AC
BC
ABCD
ABDE
ABC
BCD
ACD
AB
AC
BC
ABC

G=
H=
F =
G=
H=
E=
F =
G=
H=

ABCD
ABEF
ABC
ABD
BCDE
BCD
ACD
ABC
ABD

164

5. Estructura factorial fraccionada

no. de
factores
9

5.9

no. de
UE
64

fraccin

resolucin

1=8

IV

32

1=16

IV

16

1=32

generador
G=
H=
J=
F =
G=
H=
J=
E=
F =
G=

ABCD
ACEF
ABCE
BCDE
ACDE
ABDE
ABCE
ABC; H =
BCD; J =
ACD

ABD
ABCD

Diseos de Plackett y Burman

Una clase de diseos ortogonales que permiten una gran eciencia en la estimacin insesgada de muchos efectos principales al realizarla con un nmero relativamente pequeo de pruebas experimentales, fueron propuestos por Plackett y
Burmann (1946); stos son de mucha utilidad cuando se puede suponer que todas
las interacciones son despreciables ya que son de resolucin III. Si T denota al
nmero total de pruebas experimentales (tratamientos), los diseos de Plackett Burmann son tales que
T = k (# de niveles de cada factor

1) + 1

(5.3)

donde k es el nmero de factores; en el caso de factoriales 2k , estos diseos


permiten en T = k + 1 pruebas, estimar k efectos.
Plackett y Burman (1946) inspirados en algunos resultados matriciales proporcionan diseos con T tratamientos, stos pueden usarse desde T = 4 hasta
T = 100; en mltiplos de 4, excepto el caso de T = 92: Coinciden en el caso
de la serie 2k con diseos 2k p : Sin embargo, una complicacin de este tipo de
diseos es que su estructura alias es generalmente complicada. Para el caso de
T = 12; 20; 24; 36 y 44; estos autores generaron diseos que en la literatura estadstica se denominan diseos Placket - Burman.

5.9.1

Construccin del diseo PB

El aporte principal de Plackett y Burman fue proporcionar diferentes contrastes.


Cada uno de ellos da origen a un esquema experimental, por ejemplo para 11

5.9. Diseos de Plackett y Burman

165

factores el contraste es:


1 1

1 1 1 1

1 1

El esquema experimental que produce este contraste se muestra en la Tabla


5.28, y se denota por PB12 (11); 12 indica el nmero de tratamientos (corridas)
y 11(k) los factores. El PB12 (11) se crea de manera cclica mediante el siguiente
procedimiento; el contraste propuesto se escribe en el rengln 1 para representar la
primera corrida. El siguiente rengln se construye quitando el ltimo elemento de
la primera corrida y poniendo al nal el primer elemento de la corrida anterior.
Este procedimiento continua hasta que se cubre todo el ciclo, es decir, ste se
repite T 1 veces. Finalmente en el ltimo rengln se agrega un tratamiento
donde todos los factores estn en su nivel bajo. El mismo procedimiento cclico,
a excepcin del ltimo tratamiento aadido, se puede realizar por columnas.
El anlisis estadstico para los diseos PB es similar al expuesto para factores
con dos niveles. Es factible aplicar el esquema experimental PB12 (11) desde 7
factores. Las columnas no ocupadas pueden utilizarse para construir la suma de
cuadrados del error en el ANDEVA correspondiente. En general, esto se puede
decir de cualquier diseo que no ocupe todos sus grados de libertad para estimar
efectos de inters.

Trat
1
2
3
4
5
6
7
8
9
10
11
12

1
1
1
1
1
1
1
1
1
1
1
1
1

2
1
1
1
1
1
1
1
1
1
1
1
1

3
1
1
1
1
1
1
1
1
1
1
1
1

4
1
1
1
1
1
1
1
1
1
1
1
1

5
1
1
1
1
1
1
1
1
1
1
1
1

6
1
1
1
1
1
1
1
1
1
1
1
1

7
1
1
1
1
1
1
1
1
1
1
1
1

8
1
1
1
1
1
1
1
1
1
1
1
1

9
1
1
1
1
1
1
1
1
1
1
1
1

10
1
1
1
1
1
1
1
1
1
1
1
1

11
1
1
1
1
1
1
1
1
1
1
1
1

Tabla 5.28 Diseo de Plackett-Burman para 11 factores


Los generadores para el diseo Plackett-Burman con 20 tratamientos son:
1

166

5. Estructura factorial fraccionada

Los diseos Plackett - Burman cuentan con propiedades proyectivas tiles


cuando se detecta un nmero pequeo de efectos principales como signicativos,
propiedades que permiten explorar interacciones de inters; para mayor detalle
consulte Wu y Hamada (2000).

5.10

Contribuciones de Taguchi

Entre las actividades que desarrolla el ser humano siempre van surgiendo ideas
interesantes e innovadoras, los nuevos resultados se pueden contrastar con los
ya existentes para evaluar la bondad de las nuevas ideas. En el contexto de
experimentacin industrial, algunas de ellas fueron sugeridas por Genichi Taguchi,
a travs de su prctica en el anlisis de la mejora de procesos de produccin; stas
se conocieron con detalle en el mundo occidental a partir de la dcada de mil
novecientos ochenta.
Conviene resaltar que dentro de la investigacin que se realiza en estadstica
existen varios trabajos que destacan las debilidades de la metodologa desarrollada por Taguchi. Sin embargo, las tcnicas estadsticas propuestas por l, sin ser
la panacea, fueron motivadas por demandas peculiares de los procesos industriales
a nivel piloto o en piso.
El tener lneas de produccin ecientes y ecaces involucra a tres tipos de
diseo:
Diseo del sistema
En este tipo de diseo se tiene como componente fundamental la innovacin a
partir del conocimiento del contexto de aplicacin en electrnica, qumica, fsica,
etc. Incluye el establecimiento del producto por lograr y de la forma para producirlo, incluyendo la seleccin de materiales, as como los equipos de produccin
y medicin.
Diseo de "parmetros"
En este tipo de diseo se determinan los valores ptimos de los parmetros
(factores) del sistema. Este tipo de diseo es de suma importancia porque constituye la puesta en marcha del sistema en las condiciones actuales y especcas. En
esta etapa se usan de manera intensiva metodologas experimentales que permitan
tal optimizacin, y en las que se utilizan de manera fundamental las relaciones
no lineales entre factores y variables respuesta de inters.
Diseo de tolerancias
Determinados los niveles ptimos de los parmetros (factores) del sistema,
se tendrn que determinar tolerancias a variaciones en tales niveles ptimos, as
como inuencias de factores de ruido; todo con el objetivo de robusticar las
variables respuesta de inters bajo condiciones ruidosas. Esto puede reducir los
intervalos de las tolerancias del proceso.

5.10. Contribuciones de Taguchi

5.10.1

167

Cocientes seal a ruido

Las ideas aportadas por Taguchi en la mejora de procesos se ubican en el diseo


de parmetros y en el de tolerancias. Tales ideas se orientan en tres grandes
direcciones.
En una primera direccin, Taguchi establece una denicin de calidad de un
producto manufacturado: La calidad de un producto es la mnima prdida que
se le ocasiona a la sociedad desde que el producto es embarcado.Esto dio lugar a
pensar en consecuencias globales de procesos / productos a travs de funciones de
prdida sobre la variabilidad respecto a un valor objetivo de la caracterstica bajo
estudio; al hablar de prdida, plantea que sta debe ser continuamente reducida,
sin importar que la caracterstica se encuentre dentro de especicaciones. sta
fue una idea importante en la evolucin del aseguramiento de calidad.
La prdida, plantea Taguchi, debe representarse a travs de variables respuesta que la reejen. Para ello propone varios tipos de cocientes seal - a ruido para ser tratados como respuesta. Suponiendo que en cada corrida experimental hay rplicas, los cocientes seal a ruido propuestos por Taguchi fueron
los siguientes.

Objetivo
Tipo: Diferencia del valor objetivo
Nombre: Desviacin respecto a una valor objetivo
Tipo: Menor es mejor
Nombre: Respuesta es no negativa y el valor
objetivo ideal es cero
Tipo: Nominal es mejor
Nombre: El valor objetivo estimado por la
media de la respuesta, es ptimo
Tipo: Mayor es mejor
Nombre: Respuesta es no negativa y el valor
objetivo ideal innito es ptimo
Tipo: Respuesta positiva o negativa
Nombre: Respuesta puede tomar valores
positivos y negativos

Cociente seal a ruido


S=Rdi = (y
S=Rme =

T )2
10 log10

S=Rno = 10 log10

yi2
n

y 2
S
P

S=Rma =

10 log10

S=Rpn =

10 log10 S 2

1
y2
i

Seleccionando uno de ellos segn el contexto, se buscan combinaciones de factores que lo optimicen y con ello se reduzca la prdida as representada. Factores
que no muestran efectos sobre tal tipo de respuesta seran entonces usados para
ajustar el valor medio de la variable original segn lo requerido (a tales factores
se les llama factores de ajuste). Sin embargo, debe sealarse:

168

5. Estructura factorial fraccionada


Los cocientes seal - a - ruido propuestos no son en absoluto universalmente
aplicables; un cociente seal - a - ruido no necesariamente corresponde a
la funcin de prdida de los consumidores o del siguiente proceso. As son
vlidos slo en ciertos contextos. Por ejemplo, en el caso de nominal es
mejor, slo cuando la varianza de la respuesta es proporcional a su valor
esperado al cuadrado, es til el cociente seal - a - ruido respectivo.
El uso de tales cocientes como variables respuesta en un modelo estadstico
puede inducir no linealidades innecesarias y difciles de modelar.
Los factores de ajuste no son fcilmente encontrados en las aplicaciones.

5.10.2

Diseo robusto de parmetros

En una segunda direccin, Taguchi ide una estrategia experimental que se conoce
como diseo robusto de parmetros, que es una metodologa estadstico / ingenieril que busca reducir la variacin en el desempeo de un sistema, medido a
travs de cocientes de seal a ruido, mencionados antes.
El diseo robusto de parmetros es un paso ms en la bsqueda de reduccin
de la variabilidad aportada por ruido experimental; su estrategia principal es seleccionar condiciones en los factores de control que hagan al sistema menos sensible (ms robusto) a los efectos de ruido. Es decir, no se pretende directamente
desterrar los efectos de ruido. Por ello en este enfoque se explotan intensivamente
las interacciones existentes entre los factores de control y los factores extrados
del ruido experimental. Siguiendo a Wu y Hamada (2000) suponga que y es una
respuesta que se puede modelar por:
y = f (x; z)
donde x representa a los factores de control y z a los factores de ruido; si x y z
interactan sobre y, la variacin sobre y puede tambin ser reducida al cambiar
los niveles de los factores en x; ya que alguna combinacin de stos puede inuir
en la relacin de y con z: Por ejemplo, si
y =
=

+ x1 + z + x2 z + "
+ x1 + ( + x2 ) z + "

La estrategia es escoger el valor de x2 tal que ( + x2 ) 0:


Las interacciones de factores de control con factores de ruido tienen entonces
una importancia capital en el diseo robusto. En ese sentido un aspecto importante a sealar es que en el diseo robusto de parmetros, Taguchi sugiere que no
es deseable que en el experimento por realizar existan interacciones entre factores
de control ya que:

5.10. Contribuciones de Taguchi

169

Implican en general que sea necesario un nmero mucho mayor de corridas


experimentales para estimar los efectos de los factores de control.
Hacen difcil dividir la tarea de diseo de un producto complejo en varias
tareas pequeas a ser trabajadas por distintos equipos de trabajo.
Hacen difcil la transferencia entre laboratorio - manufactura - campo. Si
hay fuertes interacciones en el laboratorio, lo ms seguro es que se maniesten igual o ms fuertemente en las etapas posteriores.
El evitar en lo ideal la presencia de interacciones de factores de control entre
s hace necesario la juiciosa seleccin de la regin experimental; por otra parte,
tambin la adecuada seleccin de la variable respuesta, siguiendo los lineamientos
que aparecen en el Captulo 1 de este trabajo, los cocientes seal - a - ruido, o una
transformacin de la respuesta, debe en lo posible analizarse desde la perspectiva
de si inducen aditividad entre factores de control. Sin embargo esto no se da en
automtico en los experimentos reales.

5.10.3

Arreglos ortogonales

Tenemos un diseo ortogonal cuando cada combinacin de los niveles de cualesquiera dos factores aparece el mismo nmero de veces en el diseo experimental.
La tercera orientacin de los aportes del Prof. Taguchi se enfoca a la experimentacin. Para poder realizar un diseo robusto usa diseos experimentales que
corresponden a los denominados arreglos ortogonales (AO) porque las columnas
que los componen tienen la propiedad de ortogonalidad; en stos se tiene a los
arreglos ortogonales para el caso de estructuras 2k ; en general, los arreglos ortogonales los denotamos por AOp (2k ), donde p representa el nmero de tratamientos.
La notacin original propuesta para representar los arreglos ortogonales y que
aparece en los textos que tratan el tema a la Taguchi, es Lp (2k ):
m
1
Un arreglo
ortogonal AO N; sm
de fuerza t es una matriz N
1 ;:::;s
P
m; m =
mi en el que mi columnas tienen si smbolos o niveles tales que para
cualesquiera t columnas todas las posibles combinaciones de smbolos aparecen
con la misma frecuencia en la matriz (Wu y Hamada, 2000). Tpicamente t = 2:
Un caso particular de AO son diseos factoriales fraccionados. Sin embargo,
la popularidad del uso de los AO propuestos por Taguchi radica en que stos se
describen en tablas ya establecidas, las cuales se componen de k columnas y p
renglones; los niveles de los factores se denotan por los nmeros 1 y 2. Recuerde
que stos son equivalentes al 1 y 1. Estos AO aparecen acompaados de unas
grcas lineales y una tabla de interaccin con las que se podr asignar a las
columnas del arreglo a los factores y a las interacciones de inters.

170

5. Estructura factorial fraccionada

Fig. 5.1: Grcas lineales para el arreglo ortogonal AO8 (27 )


Conviene notar que los AO presentados por Taguchi a pesar de ser fracciones
a las que no se les identica su estructura alias, por lo general, son de resolucin
III. Es por ello que Taguchi ubica el uso de estos AO en experimentos en donde
se pueda pensar que interacciones entre factores de control son despreciables.
El primer diseo que se abordar en este apartado es el AO8 (27 ); el esquema
permitir jar ideas sobre su aplicacin en la estrategia experimental. La descripcin del arreglo se presenta en la Tabla 5.29.

Trat
1
2
3
4
5
6
7
8

1
1
1
1
1
2
2
2
2
grupo 1

2
1
1
2
2
1
1
2
2
grupo 2

Columnas
3
4
1
1
1
2
2
1
2
2
2
1
2
2
1
1
1
2
grupo 3

5
1
2
1
2
2
1
2
1

6
1
2
2
1
1
2
2
1

7
1
2
2
1
2
1
1
2

Tabla 5.29 Descripcin del arreglo ortogonal AO8 (27 )


Para completar la interpretacin del AO es necesario presentar las grcas
lineales y la tabla de interaccin descrita en la Tabla 5.28. Las grcas lineales
correspondientes al AO8 (27 ) se muestran en la Fig. 5.1:

5.10. Contribuciones de Taguchi

171

El arreglo mostrado en la Tabla 5.29 consta de ocho corridas (tratamientos)


y puede ser utilizado, de acuerdo a la grca lineal en la Fig. 5.1(a), con 7
efectos como mximo. Por ejemplo, en el caso de cuatro factores A, B, C y
D, se asignaran a las columnas 1, 2, 4 y 7 respectivamente, mientras que las
interacciones AD, DB, AB a las columnas 5, 6 y 3, respectivamente. La Fig. 5.1
(b) se usa en un experimento en donde las interacciones entre un factor y algunos
otros son importantes. Suponga que B va a la columna 1, C a la columna 2, D
a la columna 4, y a la columna 7 va A, con lo que las interacciones BC; BD y
BA van a las columnas 3, 5 y 6, respectivamente. Las columnas no ocupadas
pueden utilizarse para construir la suma de cuadrados del error en el ANDEVA
correspondiente.
Columnas
1
2
3
4
5
6
7

1
(1)

2
3
(2)

3
2
1
(3)

4
5
6
7
(4)

5
4
7
6
1
(5)

6
7
4
5
2
3
(6)

7
6
5
4
3
2
1
(7)

Tabla 5.30 Tabla de interacciones para el AO8 (27 )


4 1
;
El AO8 (27 ) puede representar tambin a los diseos factorial fraccionado 2IV
7 4
2III ; el primero tendr los cuatro factores en las columnas y habr lugar
para tres interacciones, en el segundo arreglo se ocupan cinco columnas para los
factores y dos para interacciones, en el 27III4 slo aplican los factores:
Otros arreglos ortogonales para diseos factoriales con dos niveles son AO4 (23 );
AO12 (211 ), AO16 (215 ); AO32 (231 ): Los esquemas, las grcas lineales y las tablas
de interaccin para estos arreglos ortogonales se pueden consultar en Phadke
(1989) y Peace(1993). Se pensara, sin embargo, que ante las posibilidades de
cmputo vigentes el uso de tablas y guras como la Tabla 5.30 y Fig. 5.1 ya no
son de relevancia actualmente.

25III2 ;

5.10.4

Doble arreglo ortogonal

Para la reduccin en variabilidad, Taguchi propone un tipo de anlisis, novedoso


en su momento, como parte de la metodologa de diseo robusto: el uso de un
diseo doble ortogonal, uno para estudiar efectos de localizacin y otro, ligado
al primero, para estudiar efectos de dispersin (a travs de cocientes seal - a ruido). Dado que el promedio y la variabilidad deben tambin ser estudiados ante

172

5. Estructura factorial fraccionada

factores de ruido, este arreglo doble consiste en separar los factores de control
del proceso en un arreglo ortogonal, llamado interno, y por ejemplo un AO8 (27 )
y los factores de ruido (no controlados en la vida real por el experimentador
pero s susceptibles de controlarse en un experimento), en otro arreglo ortogonal,
denominado externo. El esquema general de este tipo de experimentos es como
se describe en la Tabla 5.31.

Arreglo interno / externo


AOn (2k )
factores de control
A

:::

AOm (2z )
factores de ruido
corrida

M
N
..
.

S2

S=R

Z
corrida
1
..
.
n

y11
..
.
yn1

y12
yn2

y1m
..
.
ynm

y1
..
.
yn

S12
..
.
Sn2

Tabla 5.31 Doble Arreglo ortogonal

Como se muestra en la Tabla 5.31, se tienen m valores de la respuesta en cada


corrida del arreglo interno, como consecuencia de las m combinaciones de ruido.
El siguiente ejemplo ilustra la aplicacin del arreglo doble ortogonal, donde se
usa el arreglo ortogonal AO8 (27 ) para los factores de control, y un solo factor de
ruido con dos niveles.

Ejemplo 5.5
El moldeo por inyeccin es un proceso utilizado en varias industrias. En una
compaa que produce material de hule tienen problemas porque est sufre de un
encogimiento despus del curado; se sabe que esto da lugar a un incremento en
la variabilidad, por lo que es necesario conocer qu factores afectan al producto.
En la tabla de abajo se describen los siete factores de control que intervienen en
el proceso, los expertos responsables de la elaboracin del producto consideran

S=R1
..
.
S=Rn

5.10. Contribuciones de Taguchi

173

que la mezcla (M1 : mezcla 1, M2 : mezcla 2) es un factor de ruido.


Factores de controlnNiveles
A: tamao de la puerta (cm)
B: temperatura de moldeo (o C)
C: contenido de humedad (%)
D: tamao de la cavidad (cm)
E: tiempo de ciclo
(min)
F : presin
(MPa)
G: velocidad de inyeccin mm/s

1
15
85
20
40
10
60
10

1
30
125
30
50
15
80
20

Se realiz el experimento aleatorizando los tratamientos. El esquema experimental es un doble arreglo ortogonal, los factores de control se asignan en un
diseo factorial fraccional 27III4 : Los resultados del encogimiento del hule se muestran en la Tabla 5.32, y el esquema 27III4 est escrito de acuerdo al orden estndar.
Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

E
1
1
1
1
1
1
1
1

F
1
1
1
1
1
1
1
1

G
1
1
1
1
1
1
1
1

M1
y1
2:8
2:3
1:8
1:9
1:6
1:4
3:0
2:5

M2
y2
2:3
2:5
1:7
1:5
1:7
1:9
2:4
2:6

S2

lnS 2

2:55
2:40
1:75
1:70
1:65
1:65
2:70
2:55

0:125
0:020
0:005
0:080
0:005
0:125
0:180
0:005

2:079
3:912
5:298
2:526
5:298
2:079
1:715
5:298

Tabla 5.32 Resultados del encogimiento del hule


La estrategia de diseo propuesta por Taguchi mediante el arreglo doble ortogonal permite estudiar los efectos de los factores de control sobre un cociente
seal a ruido adecuado, por ejemplo ln(s2 ); efectos importantes se les llamar
efectos de dispersin. A los efectos de factores de control que sean importantes
sobre el promedio de las rplicas en este tipo de diseos, se les llamar efectos de
localizacin. En la Tabla 5.33 se muestran los efectos en este ejemplo.

sobre y
sobre ln(S 2 )

-0.088
-0.14

0.113
0.36

0.038
0.14

-0.013
-0.54

-0.013
-0.32

-0.863
0.54

-0.063
1.43

Tabla 5.33 Resumen para determinar el cuadrado medio de los efectos


de localizacin en el Ejemplo 5.5

174

5. Estructura factorial fraccionada

Con lo que G tiene un efecto potencial de dispersin y F un efecto potencial


de localizacin.
En general, para el anlisis estadstico exploratorio de efectos estimados en
este contexto experimental se recomienda que se realice mediante un grco Normal o semi Normal.

5.10.5

Un arreglo ortogonal combinado

Una estrategia experimental alternativa al doble arreglo ortogonal es el uso de un


arreglo ortogonal combinado en el que se incluyan tanto los factores de control
como los factores de ruido. En este caso la variable respuesta es analizada directamente explorando todos los efectos principales de inters, adems de permitir
explorar efectos principales de factores de ruido, interacciones control - ruido,
control - control - ruido. Del estudio de los efectos de interaccin entre factores
de control y factores de ruido, se seleccionan combinaciones de factores de control en las que y sea robusta respecto a factores de ruido. Esta estrategia de un
arreglo combinado es en general ms eciente que el doble arreglo ortogonal y
permite detallar interacciones mencionadas. Sin embargo, debe sealarse que la
deteccin de interacciones ruido - control medianamente importantes estimadas
a partir de un arreglo ortogonal combinado puede verse dicultada cuando los
efectos de los factores de ruido son muy importantes.
Cuando el arreglo externo es un factorial completo, entonces el arreglo doble
se puede analizar como un arreglo combinado. En el ejercicio 5.11 se solicita el
anlisis de un conjunto de datos utilizando ambas estrategias experimentales, y se
apreciarn las diferencias mencionadas entre ellas en lo relativo a las interacciones
entre factores de control y factores de ruido, de suma importancia en diseo
robusto. Para mayores detalles consulte Wu y Hamada (2000).
En el anlisis y deteccin de efectos de dispersin y efectos de localizacin es
muy importante contar con rplicas. En los casos de experimentos sin rplicas
actualmente no es claro cmo realizar el anlisis estadstico de efectos de dispersin. Un procedimiento en esta direccin lo propusieron Box y Meyer (1986).
Empleando los valores residuales al ajustar un modelo en un experimento sin
rplicas proponen estudiar efectos de dispersin mediante el algoritmo siguiente:
1. Ajustar un modelo yb.

2. Calcular los residuales e = y

yb:

3. Determinar la varianza de esos residuales en cada nivel de los factores utilizados, esto es: Se2 ( ) y Se2 (+):
4. Evaluar Zc = ln(Se2 (+)=Se2 ( )):

5.10. Contribuciones de Taguchi

175

5. Decidir descriptivamente sobre la signicancia de cada factor en funcin de


Zc :

Si bien la propuesta de Box y Meyer ha sido utilizada, Brenneman y Nair


(2001) realizan un anlisis crtico de este mtodo y otros alternativos, a la fecha
propuestos para analizar efectos de dispersin en experimentos sin rplicas. Concluyen que el anlisis conjunto de efectos de localizacin y de efectos de dispersin
en experimentos sin rplicas es virtualmente un campo minado, por lo que se requiere cuidado y arrojo.

5.10.6

Sistemas de seal - respuesta

Un sistema seal - respuesta es aquel en el que el esfuerzo radica en que la relacin


entre la variable respuesta Y y un factor M muy signicativo en ella, al menos
en teora en un ambiente no ruidoso, opere claramente. A tal factor se le llama
factor seal. En este sentido el inters est en
Y = g(M )
donde M denota al factor seal. Tpicamente g es montona. El problema es
evaluar cmo tal dependencia entre Y y M depende de factores de control y de
ruido.
Hay varios tipos de sistema seal - respuesta:

Sistemas con mltiples objetivos, cuya operacin requiere que el valor de


una respuesta sea ajustado por medio del cambio del nivel de un factor de
control. Por ejemplo, en el sistema de frenado de un auto, la respuesta Y
es la cantidad de torque generado mientras se frena; el factor seal M es la
fuerza del pedalazo, y otros factores de control son el material de las balatas,
su forma y el material del rotor; factores de ruido son las condiciones de
la supercie de rodamiento, la velocidad y la habilidad del chofer. Aqu el
objetivo sera encontrar niveles de los factores de control (un nuevo diseo
del sistema de frenado) de tal forma que la relacin torque (M ) - fuerza
(Y ) satisfaga algunos requerimientos y sea robusta a variaciones por ruido.
Para obtener una mayor informacin sobre el manejo del factor seal M ,

176

5. Estructura factorial fraccionada


consultar Lunani et al. (1997).
Sistemas de objetivos mltiples

m o ld e o p o r inye c c i n

p e so d e la p ie z a

p re si n a lta d e inye c c i n

m o ld e o p o r inye c c i n

ta m a o d e la p ie z a

ta m a o d e l m o ld e

m a q u in a d o d e p a rte s

d i m e tro d e p a rte

p ro fu n d id a d d e c o rte

m a q u in a d o d e su p e rc ie

ru g o sid a d d e su p e rc ie

ta sa d e a lim e nta c i n

re c u b rim ie nto s

p e so d e l re c u b rim ie nto

re a re c u b ie rta

fre n o s d e a u to

to rq u e g e n e ra d o e n e l fre n a d o

fu e rz a d e l p e d a la z o

fo to g ra fa

im a g e n fo to g r c a

ve rd a d e ra im a g e n

a lim e nta d o r d e p a p e l

d ista n c ia q u e v ia ja e l p a p e l

ro ta c i n d e l ro d illo

Sistemas de medicin, para obtener el estimado de alguna cantidad de inters para una muestra o unidad dada. La cantidad verdadera puede ser
considerada como una seal de entrada M; la cual el sistema convierte
en un valor medido o respuesta Y: La precisin con la que M puede ser
estimada basndose en Y es determinada por la relacin Y = g(M ): Identicando factores de control y de ruido, el propsito del experimento es el
de identicar condiciones de los factores de control que hagan a Y sensible
ante cambios en el factor seal, pero insensible ante cambios en los factores
de ruido.
Sistemas de medicin

d e sb a la n c e o e n e ch a a u to m o triz

le c tu ra d e m q u in a

d e sb a la n c e

c o rrie nte p a r sita e n m e d ic i n

inte n sid a d d e fe e d b a ck

d u re z a d e la su p e rc ie

vo lta je d e sa lid a

te m p e ra tu ra d e l a ntic o n g e la nte

d e d u re z a d e u n a su p e rc ie
se n so r d e l e n fria d o r d e m o to r

Sistemas de control usado en control feed - forward o feedback.


Sistema de control

m a n io b ra b ilid a d d e u n ve h c u lo

ra d io d e la v u e lta d e u n ve h c u lo

n g u lo d e l vo la nte

te m p e ra tu ra d e a g u a d e la re g a d e ra

te m p e ra tu ra d e l a g u a

c a ntid a d d e a ju ste

te rm o sta to

on/o

te m p e ra tu ra

tra n sd u c to re s p a ra c o ntro l a d a p ta tivo

fu e rz a

vo lta je

En general la experimentacin en sistemas seal - respuesta debe intentar


encontrar condiciones en las que el efecto del factor seal sea grande en relacin al
ruido circundante. Un enfoque experimental para el estudio y mejora de sistemas
seal - ruido es el denominado Response Function Modeling (RFM) propuesto
por Wu y Hamada (2000) en los dos siguientes pasos:

5.10. Contribuciones de Taguchi

177

Para cada combinacin de factores de control / ruido en el experimento


ajuste un modelo de regresin lineal o no lineal de los valores de la respuesta
sobre los niveles del factor seal.
Obtenga modelos para cada uno de los parmetros estimados del modelo
en el paso anterior, como funciones de los factores de control y de ruido.

Ejemplo 5.6 El sistema (una mquina de moldeo por inyeccin) fue requerido
para inyectar cantidades diferentes de material para aplicaciones distintas. Entonces se requiere de un mtodo conable de control de la cantidad de material
inyectado que sea necesario. Este ejemplo se estudia en Wu y Hamada (2000),
aqu se reproduce para presentar algunos aspectos de anlisis no considerados por
ellos.
El peso de la pieza fue identicado como la variable respuesta y la presin alta
de inyeccin como el factor de seal (M ), debido a que se sabe de su capacidad
para cambiar la cantidad de material inyectado.
Siete factores de control A; B; C; D; E; F; G, cada uno a dos niveles, fueron
adems incluidos en el experimento porque se pens que tenan efectos potenciales
en la variabilidad del peso de la parte.

Factor de control
A : velocidad de inyeccin
B : tiempo de presin(seg)
C : tiempo de alta iny(seg)
D : tiempo de baja iny(seg)
E : cantidad de presin (psi)
F : enfriamiento por agua( F )
G : presin de baja iny (psi)

1
0:0
44
6:3
17
1700
70
550

+1
2:0
49
6:8
20
1900
80
650

Tabla 5.37 Factores y niveles del Ejemplo 5.6

Cuatro factores de ruido fueron identicados pero se eligieron niveles de tal


manera que se conformara un factor de ruido combinado N , de la siguiente forma,

178

5. Estructura factorial fraccionada

evitando experimentacin excesiva respecto a factores de ruido:

XN =

Factores de ruido
ndice de fundido
% de remolido
operador
humedad de resina

Nivel
18
5%
nuevo
alto

XN = 1

Factores de ruido
ndice de fundido
% de remolido
operador
humedad de resina

Nivel
22
0%
Experto
baja

Tabla 5.38 Factor compuesto y sus niveles del Ejemplo 5.6


El experimento fue corrido en dos das; en el primer da el factor de ruido
compuesto fue ubicado en su nivel bajo y entonces los factores de control fueron
variados usando un diseo 27 4 :

Trat
1
2
3
4
5
6
7
8

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

F
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1

G
1
1
1
1
1
1
1
1

Tabla 5.39 Diseo para factores de control del Ejemplo 5.6


Para cada combinacin de factores de control, el factor seal fue variado de
650 a 1000 psi en incrementos de 50 psi. Cuatro partes fueron hechas y pesadas
en cada presin. En el segundo da, el procedimiento fue replicado en el nivel
alto del factor de ruido combinado. Los datos se muestran en las Tablas 5.40a y
5.40b.
Para cada combinacin del factor de ruido con el diseo 27 4 de los factores
de control, se ajustaron polinomios cuadrticos de la respuesta versus el factor
seal:
Y =

1M

2 (M

cM )2 + "

(5.4)

porque as lo sugieren los datos, vase las Fig. 5.2 en cada una las 16 corridas.

5.10. Contribuciones de Taguchi

179

seal 650
fila
639.7
1
640.5
636.2
637.2

700
642.3
641.7
643.6
644

750
645.5
644.8
646.1
644.3

800
653.9
655.1
654.7
654.2

850
666.6
665.8
667.1
665.4

900
672.1
670.8
673.3
671.1

950
692.2
690.6
689.7
689.8

1000 X N
711.6
710.8 -1
711.1
710.5

634.4
632.9
633.7
635.8

639.9
640.8
641.1
642.4

642.6
640.4
643.1
641.9

650.2
651.6
650.9
653.2

659.9
660.3
657.9
662.1

666.8
660.3
659.8
661.5

678.4
682.6
681.8
683.2

708.3
710.1 -1
707.7
706.6

640.2
638.1
637.3
639.1

646.1
644.4
644.4
641.2

647.2
646
647.5
644.3

655.5
654
653.8
652.8

666.2
667.3
669.1
664.7

671
673.6
672.4
672.2

688.6
687.5
691
693.1

708.9
710 -1
711.3
708.4

641.1
642.1
642
641.8

644.5
647.3
642.8
643.9

647.2
644.8
646
646.3

652
654.6
653.8
651.7

665.3
661
659.7
662.4

669.2
671.1
670.1
671.1

688.7
690.4
686.3
685.8

709.8
710.1 -1
707.7
706.4

640.8
641.1
641.2
641.6

644.7
645.3
644.6
645

647.6
646.8
647.3
647.5

652.3
654.5
653.9
653.6

661.1
662.8
659.2
659.9

673
673.2
672.5
673.7

685.7
686.7
686.2
686.1

706.4
707.7 -1
706.9
706.3

650.4
650.8
651.2
650.7

655.4
655
654.6
654.9

659.7
660.2
660.3
659.3

665.8
665.9
665.9
666.4

671
670.8
671.2
670.5

677.7
677.5
678.2
677.8

695.6
696.8
694.3
696.1

716.5
717 -1
718.3
717.6

639.6
639.4
639.9
640

643.8
644.2
644.1
644.4

648.2
647.3
647.2
647.8

655.7
656
655.5
656.2

665.2
664.8
664.3
663.9

674.8
675.3
675
675.1

691.7
691.4
691.8
692.3

710.1
711.4 -1
710.3
711.1

636.5
636.2
635.7
636.1

641.8
640.6
640.5
640.3

645.2
646.1
645.5
645

653.8
653.9
653.9
653.6

662.8
662.3
662.1
662.4

671.8
671.6
671.6
671.6

689.4
689.1
689.6
689.3

709.7
709.6 -1
709.7
709.3

Tabla 5.40a Datos del Ejemplo 5.6

180

5. Estructura factorial fraccionada

seal 650
fila
640.1
1
641.2
633.6
638.2

700
644.4
646.2
642.8
643.9

750
647.6
646.3
647.2
647.8

800
655.2
657.3
656.4
658

850
664.8
669.7
668.3
669.2

900
674.4
671.3
676.7
675.1

950
693.2
689.4
691.1
695.3

1000 X N
709.8
714.2 1
717.2
704.5

638.6
636.3
634.4
638.2

645.3
640.2
641.8
641.1

645.5
642.1
642.1
644.3

655.1
654.3
653.3
654.6

662.1
663.6
660.7
667.1

670.8
668.2
672.3
674.3

692.3
691.1
690.5
686.7

711.8
712.3 1
714.6
710.1

642.6
640.2
641.6
639.9

648.3
642.9
646.1
645.2

650
648.2
647.9
649.9

657.3
659.4
658.1
660

666.3
667.3
670.1
671.5

675.2
674.4
676.6
678.2

695.2
691.4
689.9
699.2

714.6
713.7 1
714.2
709.9

643.8
641.6
642.2
643.6

649.8
646.3
645.2
647.2

650.6
649.7
648.2
650.1

658.3
657.9
659.1
660

666.2
666.8
670.2
671.8

673.2
675.8
675.8
678.2

696.6
691.2
690.2
690.6

713.8
711.7 1
711.8
712.2

642.6
641.8
642
642.3

645.6
645.8
645.7
646

647.9
648.2
648
647.8

654.6
655.2
654.7
654.9

666.8
665.7
665.8
669.2

672.3
674.6
673.9
675.4

687.9
688.8
689.3
688.6

709.8
710.2 1
711.3
710.7

650.6
650.2
651.3
650.1

655.7
656.2
655.5
656

660.2
659.7
659.4
658.9

667.8
666.5
666.7
666.6

671.1
672
671.7
671.4

678.9
679.3
679.1
678.6

694.7
693.3
696.8
692.1

718.4
720.2 1
716.6
717

639.9
640.2
640.3
640.1

644.1
644.6
645
644.7

647.6
648
648.2
647.8

656.3
656
656.4
656.7

664.8
665.2
665.1
665.5

675.3
674.7
674.9
675.2

693.1
692.8
691.9
692.4

709.9
711.4 1
712.2
711.6

637.7
638.1
638.2
638.4

642.9
643.4
643
642.9

647.3
647.3
646.8
647

651.1
655.4
655.4
655.2

665
664.7
664.5
664.8

673.2
672.8
673.4
672.8

689.6
689.9
690.7
690.2

710.9
709.3 1
708.6
709.1

Tabla 5.40b Datos del Ejemplo 5.6

5.10. Contribuciones de Taguchi

Fig. 5.2: Relacin respuesta y versus factor seal M; para los casos de N =
yN =1

181

Dado que se cuenta en este ejemplo con rplicas, es posible separar dos tipos
de variabilidad del error: la variabilidad debida a posible carencia de ajuste del
modelo propuesto a los datos y la variabilidad debida al llamado error puro que
representa la variabilidad entre rplicas, respectivamente denotadas por 2l y 2p ;
que se estiman por un mtodo presentado en el Captulo 8. 2l representa un
comportamiento sistemtico en los datos no explicado por el modelo propuesto,
que se estima mediante (detalles en el Captulo 8 de este texto)

mientras que

ni (b
yij

2;
p

y i )2 =(# total de corridas - # de tratamientos),

la variabilidad pura de una UE, es estimada mediante

XX
(yij

y i )2 =(# de tratamientos - # de efectos estimados)

182

5. Estructura factorial fraccionada

Fig. 5.3: Grca semi Normal del Ejemplo 5.6 para el caso de ln

2
l

Ajustando el modelo (5:4) ; resultan los siguientes coecientes estimados:

1
2
3
4
5
6
7
8

N=
^

1
^

493:45
497:31
497:93
505:89
509:49
523:92
497:02
490:97

:1995
:1878
:1947
:1821
:1786
:1734
:1968
:2011

5:3
5:9
5:1
6:2
5:6
5:5
5:2
5:2

^ 2l

^ 2p

27:38
107:25
25:39
14:57
10:19
53:12
7:23
15:77

1:21
3:21
2:70
2:64
0:56
0:30
0:18
0:12

N =1
^
0

494:58
487:68
497:43
504:60
505:52
524:64
497:09
496:71

:2010
:2048
:1993
:1957
:1863
:1732
:1971
:1960

4:7
5:8
4:9
5:0
5:5
5:3
5:3
5:9

^ 2l
22:48
28:42
17:15
19:25
19:74
59:14
9:23
12:85

^ 2p
7:78
4:45
4:99
3:53
0:67
1:00
0:21
0:75

Tabla 5.41. Coecientes estimados para el modelo (5.5)


del Ejemplo 5.6
Ahora en una segunda etapa se pretende estudiar los efectos de los factores de
control sobre tales valores estimados. Para los casos de ^ 2l y ^ 2p su estudio tpicamente requiere de usar la transformacin logaritmo para minimizar desviaciones
de los supuestos del modelo lineal utilizado. As para ln ^ 2l se puede apreciar qu
factores son importantes en la carencia de ajuste del modelo cuadrtico propuesto,
a partir de la Fig. 5.3.

5.10. Contribuciones de Taguchi

183

Fig. 5.4: Grco semi Normal del Ejemplo 5.6 para el caso de ln

2
p

Por lo que el modelo resultante es


ln ^ 2l = 3:06

0:41xB + 0:31xD :

Este tipo de variabilidad por carencia de ajuste se puede reducir en el nivel alto
de B y en el nivel bajo de D.
Para ln ^ 2p , observando la Fig. 5.4, los factores importantes son A, B, C, E,
N E y N , por lo que el modelo ajustado es:
ln ^ 2p = 0:12 + 1:10xA

0:22xB + 0:22xC + 0:04xE

0:28xN E

0:41xN

Al poner A como su nivel bajo, B alto, C bajo y dada la interaccin N E (vea


la Fig. 5.5), observando los efectos de interaccin suponiendo A, B y C como se
mencion, se tiene que es mejor poner a E en su nivel bajo porque la variacin
entre partes del mismo diseo ser menor al cambiar el nivel del factor combinado
de ruido.
Para ^ 1 a partir de la Fig. 5.6, se aprecia que C es importante en sus efectos
sobre el parmetro del efecto lineal del factor seal, con lo que el modelo
ajustado es:
^ = 0:1914
1

0:0066xC

El factor C puede ser usado para aumentar la sensibilidad (lineal) ante el


factor seal: en su nivel bajo elevar tal sensibilidad.

184

5. Estructura factorial fraccionada

Fig. 5.5: Grca de interaccin N E sobre ln

2
p

en el Ejemplo 5.6

Fig. 5.6: Grco semi Normal para efectos sobre b 1 en el Ejemplo 5.6

5.10. Contribuciones de Taguchi

185

Fig. 5.7: Grco semi Normal de efectos sobre b 2 en el Ejemplo 5.6

Para ^ 2 de la Fig. 5.7 se puede observar que no hay efectos claramente


importantes.
Por lo tanto la curvatura no es resultado de los tratamientos manipulados en
el experimento, sino al parecer slo es propia de la relacin entre la respuesta y
el factor seal.
Finalmente para ^ 0 ; observando la Fig. 5.8, resulta que A; B; C; D y G son
importantes en sus efectos sobre la ordenada al origen, por lo que el modelo
ajustado es:
^ = 501:51
0

4:15xA

3:06xB + 7:16xC + 2:45xD + 3:64xG

De lo anterior se puede sugerir lo siguiente:

Factor
A:
B:
C:
D:
E:
F :
G:

Nivel recomendado
bajo
alto
bajo
bajo
bajo
segn el requerimiento sobre
segn el requerimiento sobre

0
0

186

5. Estructura factorial fraccionada

Fig. 5.8: Grco semi Normal de efectos sobre b 0 en el Ejemplo 5.6

Seleccin de esquema experimental

En este tipo de sistemas seal - respuesta, como se ha visto, se tienen tres tipos de
factores: control (C), seal (S) y de ruido (N ). En general dos tipos de arreglos
son los cruzados y los nicos; por ejemplo, A B denota un arreglo cruzado
que consiste en todas las combinaciones de niveles entre aquellos factores que se
encuentren en A; y aquellos factores en B (a la Taguchi inner - outer array). Un
arreglo nico, denotado por (A; B) es un arreglo con las combinaciones de niveles
de A y B; pero en el que se pueden aplicar patrones de confusin - resolucin
econmicas, eventualmente. Los arreglos cruzados generalmente implican costos
de experimentacin altos y por ello se usan factores de ruido combinados en
dos niveles; estos factores combinados de ruido sin embargo, no se garantiza en
general que representen condiciones extremas de ruidos de inters.
En el contexto de sistemas seal - respuesta, las posibilidades de seleccin de
esquemas experimentales son las siguientes:
1. C N S arreglo cruzado: todas las combinaciones de niveles de todos los
tipos de factores.
2. (C; N ) S arreglo nico de factores de control y de ruido; una vez seleccionado un esquema econmico correspondiente, se cruzan todos los
tratamientos con todas los niveles del factor seal.
3. C (N; S) arreglo nico de factores de ruido y el factor seal; una vez
seleccionado un esquema econmico correspondiente, se cruza con todos los
tratamientos de factores de control.

5.11. Ejercicios

187

4. (C; S) N arreglo nico de factores de control y el factor seal; una vez


seleccionado un esquema econmico correspondiente, se cruza con todos las
condiciones de las combinaciones de niveles de factores de ruido.
El esquema del experimento de moldeo por inyeccin corresponde a 1. En general el esquema ms recomendable es 1 si no hay problemas por costo implicado;
si el costo es importante la estrategia 2 sera la opcin.
Adems, la seleccin de un esquema experimental debe tomar en cuenta las
restricciones en el manipuleo de factores que se sean difciles de cambiar en sus
niveles, llevndonos a consideraciones de diseos de parcelas divididas en donde
efectos de tales factores sean los candidatos naturales a ser confundidos.
Para mayores detalles consulte a Wu y Hamada (2000). Finalmente, el estudio
de sistemas seal - respuesta puede ser realizado como un caso particular de
modelos lineales funcionales (Ramsay y Silverman, 2005).

5.11

Ejercicios

Ejercicio 5.1 En un proceso de moldeo por inyeccin se obtienen paneles estructurales de pelculas de plstico. El grado de delgadez de la hoja (mm) es una
variable respuesta de calidad crtica para el proceso. Los factores son:
FactoresnNiveles
A: velocidad de inyeccin (m/seg)
B: tiempo de cura (seg)
C: temperatura del molde (o C)
D: temperatura de fundido (o C)

1
1:0
150
40
250

1
2:25
200
80
300

El generador es I = +ABCD. A continuacin se muestran los resultados


que se obtienen al realizar el experimento, stos representan a los tratamientos
escritos en el orden estndar: 37, 42, 29, 39, 44, 21, 35, 12.
Escriba el diseo. Indique la estructura alias del diseo. Realice el anlisis
y obtenga sus conclusiones. Verique los supuestos estadsticos que se requieren
para hacer la inferencia.

Ejercicio 5.2 Un ingeniero est interesado en mejorar la eciencia de una operacin de limpieza. La mquina limpiadora usa una brocha de acero para remover el material. Se identican cinco factores como posibles causas que afectan

188

5. Estructura factorial fraccionada

la razn del material removido.


FactoresnNiveles
A: dimetro del lamento (mm)
B: longitud del lamento (cm)
C: nmero de lamentos
D: ancho de la brocha (cm)
E: profundidad de entrada (cm)

1
20
3
15000
2
25

1
25
6
20000
5
40

Se plante un diseo fraccionando 25 2 , los generadores son I = ABD;


I = +ACE: Escriba la tabla que muestre el diseo. Los resultados que se obtienen
al realizar el experimento son: 145, 184, 125, 147, 170, 132, 123, 96, representan
a los tratamientos escritos en el orden estndar. La variable de respuesta es
el volumen
10 7 rev. Cules fueron los factores ms signicativos? Cul
combinacin tiene el mejor resultado?
Ejercicio 5.3 Los siguientes datos se obtuvieron en un estudio de un sistema
solar de calefaccin de agua; los factores analizados fueron A: la intermitencia
en la radiacin solar, B: el ujo del agua a travs del sistema, C: capacidad
de almacenamiento del agua, D: total de insolacin diaria; cada factor tiene
dos niveles. Se construy un modelo y con ello se midi Y : la eciencia de la
distribucin de energa. Los datos se muestran siguiendo el orden estndar, para
un diseo 24 :
tratamiento
Y
tratamiento
Y

1
45
9
63

2
82
10
79

3
50
11
46

4
68
12
64

5
63
13
62

6
81
14
80

7
47
15
40

8
65
16
64

1. Estime los efectos principales y de interaccin, interprtelos con las grcas


de probabilidad semi Normal y Pareto.
2. Realice el anlisis de varianza e interprete. Auxliese con otras grcas.
3. Fraccione el experimento usando como generador I =
mismo anlisis anterior e indique sus conclusiones.

ABCD, haga el

Ejercicio 5.4 Se desea realizar un experimento que sea un cuarto del diseo
25 , es decir 25 2 ; se proponen como generadores I1 = +ABD y I2 = +CDE:
1. Indique qu tratamientos aparecern en la fraccin (+; +).
2. Escriba la estructura alias.

5.11. Ejercicios

189

3. Indique cul es la resolucin de ese diseo y por qu.


4. Es ste un diseo saturado?, por qu?
5. Escriba la expresin para estimar el efecto del factor C.
Ejercicio 5.5 En la extrusin de un polmero fundido para fabricar bras y
pelculas de plstico. Se considera que los factores que se citan abajo provocan
cambios estructurales que afectan la resistencia del polmero a la foto-oxidacin.
FactoresnNiveles
A: control de la tensin manual automtica
B: temperatura (o C)
C: velocidad de alimentacin (cm/seg)
D: mezclado
E: mquina
F : humedad (%)

1
1
100
25
simple
#1
20

1
2
140
35
doble
#2
30

El experimento se realiz mediante un diseo de Plackett - Burman, los resultados de la resistencia que se obtuvieron al efectuar el experimento son: 82,
96, 65,67, 58, 67, 46, 90, 88, 42, 99, 50; este orden corresponde al generador del
diseo Plackett-Burman, en este caso es: 11 1111 1 1 11 1, generado
por renglones.
Describa el diseo. Estime los efectos y represente mediante una grca estos
efectos. Use un grco probabilstico Normal o semi Normal para ver qu efectos
son signicativos. Realice el anlisis de varianza de estos datos.
Ejercicio 5.6 Produccin de aceite de cacahuate. Se realiz una investigacin
para extraer aceite de cacahuate usando dixido de carbn (CO2 ) a presiones
muy altas. El investigador considera que cinco factores son importantes y se
propuso manejar cada uno en dos niveles, pero debido a la lentitud para realizar
el experimento fue necesario usar una fraccin de ste. As se propuso un diseo
25 1 ; los factores propuestos son: A: presin CO2 , B: temperatura CO2 , C:
mezcla de cacahuate, D: razn de ujo del CO2 y E: tamao del cacahuate. El
generador que se emple para construir la fraccin I = +ABCDE.
Las respuestas son la Y1 = solubilidad y la Y2 = produccin. A continuacin
se muestran las respuestas experimentales siguiendo el orden estndar:
Y1 = 29:2; 23; 37; 139:7; 23:3; 38:3; 42:6; 141:4; 22:4; 37:2; 31:3; 48:6;
22:9; 36:2; 33:6; 172:6:
Y2 = 63; 21; 36; 99; 24; 66; 71; 54; 23; 74; 80; 33; 63; 21; 44; 96:
1. Describa el esquema experimental. Estime los efectos para cada respuesta
y represntelos en una grca.

190

5. Estructura factorial fraccionada

2. Construya un grco probabilstico Normal o semi Normal con las observaciones Y1 y Y2 , interprete estas grcas.
3. Bosqueje mediante una grca las observaciones y determine intuitivamente
un ptimo comn.
4. Realice el anlisis de varianza para ambas respuestas.
Ejercicio 5.7 En un diseo experimental con cinco factores de dos niveles se
desea estudiar Y : la profundidad de corte medida en mm. En el cuadro de abajo
se muestran los cinco factores con sus respectivos niveles. Existe el inters por
conocer los factores que inuyen en la profundidad de corte y se desea controlar
el efecto de dispersin. Dada la cantidad de pruebas experimentales se decidi un
diseo factorial fraccionado 25 2 . Las fracciones consideradas son: I1 = +ABD
y I2 = ACE: Explique cmo hara el experimento.
FactoresnNiveles
A: tipo de herramienta
B: ngulo de corte
C: velocidad de corte (cm/seg)
D: tipo de corte
E: material a cortar (elasticidad)

Trat
1
2
3
4
5
6
7
8

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1

D = +AB
1
1
1
1
1
1
1
1

E=

1
1
15
25
continuo
poca

AC
1
1
1
1
1
1
1
1

y1
24:3
27:6
28:2
20:2
18:7
30:5
21:8
33:1

1
2
30
35
interrumpido
mediana

y2
25:2
26:6
27:1
20:6
17:8
34:4
22:0
33:0

y3
26:3
27:4
25:5
22:1
20:7
36:7
24:5
34:4

lnS 2

1. Identique la estructura alias de este diseo.


2. Calcule la media y la desviacin estndar de cada tratamiento.
3. Estime los efectos de localizacin y de dispersin y grafquelos.
4. Use un grco semi Normal en cada caso para evaluar la signicancia de
los efectos.

5.11. Ejercicios

191

Ejercicio 5.8 En la industria del calzado se desea lanzar al mercado una nueva
suela. Antes de llevarla al proceso se hacen varias pruebas en el laboratorio con el
objetivo de minimizar el encogimiento de la suela, medido en mm 10 2 . Cinco
factores se consideran como apropiados para probar la respuesta.
FactoresnNiveles
A: temperatura (o C)
B: presin mquina
C: tiempo de ciclo (min)
D: humedad de solventes
E: formulacin

1
120
65
25
15%
mezcla 1

1
160
80
35
25%
mezcla 2

El diseo propuesto es un diseo 25 1 ; con el generador I = ABCDE: Los


resultados del experimento siguiendo el orden estndar son: 59, 98, 318, 580, 41,
149, 261, 590, 79, 120, 342, 585, 162, 50, 368, 520.

1. Describa el diseo. Estime los efectos de los factores. Ajuste e interprete el


modelo.
2. Estime los residuales e : y

yb: Verique si hay efectos de dispersin.

Ejercicio 5.9 Una industria vende un producto qumico a una empresa que
elabora pinturas; esta ltima le pide a la compaa qumica que desarrolle un
producto con el menor nmero de impurezas. Las pruebas se hacen a nivel laboratorio para alcanzar un producto con menos impurezas, y para ello los factores
que se consideran importantes en este proceso se muestran en la tabla, entre stos existe un factor de ruido el cual corresponde a dos diferentes proveedores. El
experimento se realiza para estos proveedores.

FactoresnNiveles
A: temperatura (o C)
B: concentracin
C: catalizador
D: tiempo de operacin (min)
E: proveedor

1
180
20
C1
30
prov 1

1
220
40
C2
45
prov 2

192

5. Estructura factorial fraccionada

trat
1
2
3
4
5
6
7
8

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D=
1
1
1
1
1
1
1
1

ABC
1
1
1
1
1
1
1
1

prov 1
41
50
50
54
26
19
31
21

prov 2
39
46
42
56
30
15
33
19

S2

1. Calcule la media y la desviacin estndar de cada tratamiento.


2. Estime y graque los efectos para la localizacin y dispersin.
Comente y concluya.
Ejercicio 5.10 Evaluacin de la productividad. Un ingeniero desea evaluar la
productividad, la cual se mide mediante el nmero de piezas producidas por un
empleado en una semana. Para ello considera el factor A, aos de experiencia,
con dos niveles, (nivel -1: regular, nivel 1: suciente) y el factor B, uso de tres
equipos diferentes, con tres niveles (nivel -1: Bo, nivel 0: Me, nivel 1: To). Los
resultados se muestran en la siguiente tabla:
A

B
1
1
1
1
1
1

1
1
0
0
1
1

y1
56
55
71
76
50
51

y2
52
49
77
80
48
55

S2

1. Haga las grcas para representar los promedios de cada factor, qu observa?
2. Graque la interaccin.
3. Estime los efectos del factor A y del factor B.
4. Realice el anlisis de la varianza, qu hiptesis estadsticas prueba? Obtenga sus conclusiones.

5.11. Ejercicios

193

Ejercicio 5.11 El proceso de teido se emplea en la industria textil, curtidura,


vinlicas; la nalidad de stas es tener productos con un teido adecuado, la
adherencia es una respuesta de inters en estos casos. A continuacin se presenta
un experimento en un doble arreglo ortogonal, se tienen 5 factores de control y
dos factores de ruido como se describe en la siguiente tabla.
1

1
30
75
35
70
20
40
nuevo actual
7
8

Factores de controlnNiveles
A: contenido de sal u.
B: razn de lquido u/s
C: temperatura de teido o C
D: clases de tinte
E: pH
Factores de ruidonNiveles
L: cantidad de tinta
M : sustancia de jacin

1
1%
sin

1
3%
con

El arreglo ortogonal para los factores de control es 25 2 ; empleando los generadores D = AB y E = AC se construye el arreglo. Por la estructura alias
que se genera tambin se puede y se desea estimar los efectos de las interacciones
BC y BE. El otro arreglo es un diseo factorial 22 ; la estructura del diseo con
sus resultados se muestran en la siguiente tabla.
L
M
tra t

1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

E
1
1
1
1
1
1
1
1

BC
1
1
1
1
1
1
1
1

BE
1
1
1
1
1
1
1
1

1
1
y1
7:8
8:6
7:6
8:8
7:7
9:4
8:3
9:5

1
1
y2
14:9
17:0
13:1
18:5
14:7
17:9
15:0
19:6

1
1
y3
8:5
8:4
8:1
9:0
8:0
9:5
8:7
9:4

1
1
y4
15:1
18:0
12:6
18:7
14:1
17:6
15:1
19:3

1. Utilizando el doble arreglo ortogonal determine efectos de localizacin y de


dispersin a partir del estudio de efectos de A; B; C; D; E; BC y BE:
2. Utilizando un solo arreglo ortogonal en donde se incluya a L y a M como
columnas adicionales, incluya en el modelo por supuesto a A; B; C; D; E;
BC; BE; pero adems a L; M y todas las interacciones de estos dos ltimos
con A; B; C; D; E; BC y BE:

194

5. Estructura factorial fraccionada

3. Compare resultados de ambas estrategias y obtenga sus conclusiones.


Ejercicio 5.12 Con base en los resultados del ejercicio 5.10, estime (ln S 2 ) para
cada tratamiento, haga el anlisis estadstico que permita conocer la existencia
de algn efecto de dispersin, realice una evaluacin conjunta de las respuestas y
y (ln S 2 ):
Ejercicio 5.13 Una empresa automotriz requiere de un tipo de piel para forrar asientos; entre las caractersticas de inters que necesita est la resistencia al
rasgado. Uno de sus proveedores realiza un experimento para estudiar tal caracterstica, cinco son los factores que inuyen en la resistencia al rasgado, los cuales
se muestran a continuacin.
Factores de controlnNiveles
A: velocidad de planchado
B: tiempo de evaporacin
C: temperatura de planchado o C
D: mezcla de resinas
E: mezcla de solventes
Cada factor se maneja experimentalmente en dos niveles. Se utiliz un diseo factorial fraccionado 25 1 ; con el generador I = ABCDE; los resultados al
realizar el experimento se muestran en la siguiente tabla:
trat

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1

-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1

-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1

-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1

1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1

75
87
81
78
56
35
51
52
63
57
59
60
63
51
53
56

yb

-5.25
6.75
0.75
-2.75
7.50
-13.5
2.50
3.50
3.25
-2.75
-0.75
0.25
7.25
-4.75
-2.75
0.25

5.11. Ejercicios

195

1. Estime los efectos de cada factor y de sus interacciones siguiendo el procedimiento sealado en los apartados anteriores.
2. Realice el anlisis de varianza para establecer qu factores son signicativos.
Ejercicio 5.14 En un proceso en el que se pintan piezas metlicas, se quiere
alcanzar una delgadez de 0.500mm en el espesor de la capa de pintura con la menor
variacin posible. Esto benecia al resultado nal en la lnea de produccin por
varios motivos, entre ellos el ahorro de pintura y la presentacin nal del producto.
Cuatro factores de control y dos de ruido se consideran importantes para su efecto
en la respuesta, los factores y sus niveles se describen a continuacin:
Factores de controlnNiveles
A: sustancia qumica.
B: presin del uido
C: temperatura de quemado o C
D: proveedor
Factores de ruidonNiveles
P : velocidad de la cadena
Q: proporcin de esmaltes

1
10
15
68
1

1
v1
e1

1
20
30
78
2

1
v2
e2

El experimento se realiz en un doble arreglo ortogonal. El arreglo interno en


un diseo 24IV 1 y el arreglo externo en un diseo 22: . Los datos se presentan en
la tabla de abajo.
P
Q
Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

1
1
y1
:640
:495
:492
:756
:659
:549
:843
:875

1
1
y2
:478
:509
:532
:508
:623
:456
:909
:898

1
1
y3
:497
:494
:528
:633
:636
:387
:658
:910

1
1
y4
:539
:514
:561
:565
:584
:605
:953
:913

lns2

S=Rno

S=Rno = 10 log10 ( Sy )2
1. Estime y graque los efectos para y, lns2 y S=Rno : Reporte lo que observa.

196

5. Estructura factorial fraccionada

2. Realice el anlisis de la varianza para la media de la delgadez.


3. Realice el anlisis de varianza para lns2 :
4. Escriba el modelo para lns2 a partir de los efectos que resultaron signicativos, recuerde que la estimacin de los parmetros del modelo igual al
efecto entre dos. Indique en qu niveles de los factores signicativos se tiene
la menor variabilidad.
5. Escriba el modelo para y a partir de los efectos que resultaron signicativos. Establezca los valores de los factores donde la delgadez tenga el valor
requerido. Nota: Observe que al minimizar lns2 se maximiza S=Rno :
6. Una de las aplicaciones de los resultados experimentales es evaluar la capacidad del proceso. La expresin para sta es: Cpk = min(LES 3 ; LEI) ,
donde
se estima por y; ste se obtiene a partir del modelo del inciso
5, en nuestro caso y = 0:500; y
se estima por el modelo del inciso 4,
b = 0:0212: Los lmites de especicacin inferior y superior son 0.530 y
0.470 respectivamente. Interprete el valor de Cpk :
Ejercicio 5.15 Lo ms pequeo es lo mejor. En un proceso de moldeo por
inyeccin un ingeniero tiene problemas asociados al encogimiento del producto
despus del curado. Este encogimiento contribuye a una creciente variabilidad
del producto. El objetivo es determinar qu factores contribuyen a disminuir
el encogimiento y reducir la variabilidad del producto. Se tienen 11 factores en
dos niveles: A: tiempo de ciclo, B: temperatura del molde, C: contenido de la
mezcla, D: razn de mezclado, E: temperatura en el estado de precalentamiento,
F : grosor del liberador del molde, G: tamao de la puerta, H: curva del liberador
del molde, I: presin de inyeccin, J: velocidad del tornillo, K:densidad. Existe
un factor de ruido, ste es la instalacin y se denota por M ; se emplea un doble
arreglo ortogonal. El arreglo interno es un diseo Plackett - Burman que coincide
con el diseo AO12 :
1. Estime el efecto de cada uno de los factores para la respuesta S=Rme =
10 log10

3
P
1

yi2

2. Indique en qu niveles de los factores se produce el menor encogimiento.


3. Cul es el valor de S=Rme queP
produce el menor encogimiento? Sugerencia:
use la expresin S=Rme = y + i (factori y), donde factori corresponde al
promedio del i-simo factor que result signicativo en el experimento.

5.11. Ejercicios

197

Los resultados del experimento son:

exp
1
2
3
4
5
6
7
8
9
10
11
12

A
1
1
1
1
1
1
2
2
2
2
2
2

B
1
1
1
2
2
2
1
1
1
2
2
2

C
1
1
2
1
2
2
2
2
1
2
1
1

D
1
1
2
2
1
2
2
1
2
1
2
1

E
1
1
2
2
2
1
1
2
2
1
1
2

F
1
2
1
1
2
2
1
2
2
1
2
1

G
1
2
1
2
1
2
2
2
1
1
1
2

H
1
2
1
2
2
1
2
1
2
2
1
1

I
1
2
2
1
1
2
1
1
2
2
1
2

J
1
2
2
1
2
1
2
1
1
1
2
2

K
1
2
2
2
1
1
1
2
1
2
2
1

M1
:13
:25
:08
:08
:17
:09
:24
:18
:19
:22
:24
:08

M2
:18
:27
:12
:11
:22
:18
:32
:19
:20
:25
:18
:10

M3
:14
:22
:12
:11
:13
:19
:28
:11
:30
:22
:16
:11

S=Rme
16:4
12:1
19:3
19:9
15:0
15:9
11:0
15:7
12:6
12:7
14:1
20:2

Ejercicio 5.16 Se desea mejorar la densidad de color en un aparato electrodomstico, en ese sentido se realiza un experimento. En este proceso de pintado
se tiene como factor seal la cantidad de pintura que se usar, y se plantea en
tres niveles (5,10,15). La variable de respuesta es la densidad de color. En el experimento se consideraron cinco factores de control cada uno en dos niveles, y un
factor de ruido que describe en dos niveles las condiciones generales del proceso.
La descripcin de los factores se muestra en la tabla siguiente.

Factores de ControlnNiveles
A: Tipo de pintura
B: Posicin de quemado
C: Cantidad de xido H
D: Cantidad de xido M
E: Espesor de la aplicacin

-1
nueva
d
10%
15%
4mm

1
actual
r
20%
20%
6mm

Factor de Ruido
P: Condiciones generales
p1 : malas
p2 : buenas

198

5. Estructura factorial fraccionada

Los resultados que se obtuvieron al realizar el experimento son:


Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

E
1
1
1
1
1
1
1
1

M1
p1
7:0
6:5
6:5
6:0
7:0
7:0
9:0
9:0

=5
p2
5:5
8:5
8:0
8:5
6:5
7:5
8:5
9:5

M2
p1
13:5
16:0
13:5
16:5
14:5
13:5
16:5
17:0

= 10
p2
15:5
13:5
16:0
13:5
14:0
14:0
16:0
16:6

M3
p1
19:0
22:5
21:0
20:5
20:0
20:5
24:0
23:5

= 15
p2
21:0
20:0
23:5
24:0
21:0
21:5
23:0
24:5

El esquema global del diseo consiste en un doble arreglo ortogonal, y la tabla


anterior es la forma tpica para representarlo. Los Yijk denotan las observaciones
correspondientes, i es la i-sima combinacin de los factores de control, j describe
a los valores de los factores seal, y k es la k-sima combinacin de los factores
de ruido. Bajo el supuesto de una funcin lineal (linealidad) ideal sin intercepto,
se tiene el siguiente modelo:
Yijk =

i Mj

+ "ijk ;

donde i es la medida de sensibilidad (la magnitud de la pendiente del modelo),


y 2i = V ("ijk ) ambos dependen de los factores de control. La linealidad indica
qu tan cercana es la relacin (lineal) entre la respuesta Yijk y la seal Mj . La
dispersin (variabilidad) es la desviacin de las lneas causada por los factores de
ruido.
Aplicando este modelo a cada uno de los tratamientos se tendrn ocho lneas
rectas, una para cada combinacin de los factores de control. As para evaluar
este sistema seal respuesta es deseable tener una pequea dispersin ( 2i ) y un
valor grande de i : Un valor grande de la sensibilidad permitir identicar si hay
un cambio grande en la respuesta Yijk debido a un cambio en la seal Mj : Una
medida que relaciona la sensibilidad y la dispersin se establece mediante:
= 10 log

2
i

CMerror(i)

donde CMerror (b2i = CMerror(i) ) es la suma de los cuadrados del residual entre
sus respectivos grados de libertad. Esta medida se conoce como la razn seala - ruido para el sistema seal respuesta y fue propuesta por Taguchi.
1. Estimar la sensibilidad, la dispersin y el cociente seal - a - ruido para cada
tratamiento (ver el Captulo 8). Para nes de este captulo, a continuacin

5.11. Ejercicios

199

se proporcionan los clculos para este proyecto.

Trat
1
2
3
4
5
6
7
8

A
1
1
1
1
1
1
1
1

B
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1

E
1
1
1
1
1
1
1
1

0:828
0.658
1:664
0:986
8:661
9:890
7:073
5:324

p
CMerror(i)

1:239
1:336
1:219
1:664
0:505
0:447
0:707
0:889

1:361
1:439
1:479
1:486
1:382
1:396
1:596
1:641

2. Construya la tabla del ANDEVA para la sensibilidad, dispersin y seal a


ruido. Para cada caso establezca qu factores e interacciones son signicativas. En funcin de su anlisis indique sus conclusiones.
3. Elabore las grcas para diferenciar el efecto que tienen los factores con
respecto a la sensibilidad y dispersin. Para ello tome
p logaritmos en base
10 para la sensibilidad ^ i y la desviacin estndar CMerror(i) en cada
tratamiento, considere estos valores como una pareja ordenada y represntelos en un plano cartesiano. Escriba lo que observa de estas grcas y
contraste estas observaciones con los resultados de las tablas del ANDEVA.

200

5. Estructura factorial fraccionada

Captulo 6

Estructura de tratamientos
factoriales 3k
No tengo dones especiales. Slo soy apasionadamente curioso.
Albert Einstein
Una estructura factorial 3k indica que interesa experimentar con k factores
pero con tres niveles cada uno de ellos; esto signica que se tienen 3k tratamientos,
todas las posibles combinaciones de los factores con tres niveles; por ejemplo, en
el caso de un diseo con dos factores, k = 2, se tendrn 9 tratamientos.
A diferencia de los diseos 2k ; los diseos 3k no se utilizan para seleccionar a
los ms importantes, entre muchos factores. Es claro que al aumentar el nmero
de factores, la cantidad de tratamientos que se realiza en un experimento crece
de manera considerable.
Cuando los factores son continuos en su escala de medicin, los diseos 3k permiten, de existir, estimar efectos de curvatura sobre la variable respuesta. Estos
diseos junto con diseos Box - Behnken, de composicin central, cbicos, entre
otros, forman parte de los diseos apropiados para la optimizacin de las condiciones que inuyan en la respuesta. En general, los experimentos con factores de
ms de dos niveles tienen mayor precisin en la estimacin de los efectos.

6.1

Diseo factorial 3k y su anlisis estadstico

Un diseo factorial 3k representa una estructura de tratamientos que puede aplicarse sobre las UE sin restriccin alguna en la aleatorizacin. Sin embargo,
aunque no es visto en detalle en este captulo, tambin como en los diseos factoriales en general, en la estrategia experimental con diseos 3k se puede tomar
en cuenta ruido experimental adicional al error experimental.
En el siguiente ejemplo se muestra la estructura de tratamientos y de anlisis

6. Estructura de tratamientos factoriales 3k

202

de un diseo 32 : Sin embargo el inters en el anlisis de esta estructura es resaltar


el procedimiento para identicar cundo un factor tiene efecto, ya sea lineal,
cuadrtico, o ambos. Para este ltimo punto se utilizar la tcnica de codicacin
expuesta en el Captulo 5.
Ejemplo 6.1 En el laboratorio de una empresa se tiene inters en estudiar
cmo la cantidad de un gas nocivo que emite una mquina puede ser reducido;
la variable de respuesta es la cantidad de gas medida en ppm. Se considera que
dos factores, el tiempo de inyeccin y la razn del volumen de la cmara, inuyen
en la emisin del gas; se consideran tres niveles en cada factor. Dos mquinas se
utilizaron para evaluar el efecto de los factores, suponga en primera instancia que
las mquinas son totalmente homogneas tal que no inuyen en los resultados.
Los factores y niveles se describen a continuacin.
Factores/Niveles
T : tiempo (min)
V : volumen(uv)

1
50
30

2
60
35

3
70
40

Tabla 6.1 Factores y sus valores en cada nivel


Observe que los nmeros 1, 2 y 3 se han asignado para identicar de manera
abstracta los niveles de los factores de un 3k , esta notacin se utiliza con frecuencia
en la literatura de diseos. Como cada factor tiene tres niveles, todas las posibles
combinaciones generan nueve tratamientos. Se aleatorizan sin restricciones los
nueve tratamientos y se aplican a cada mquina previamente preparadas. Los
resultados y respectivos promedios se exhiben en la Tabla 6.2.
La Fig. 6.1 muestra los valores de la respuesta en cada uno de los niveles para
los factores en estudio, en ella se describe la dispersin de los datos; se observa
que para el factor tiempo existe mayor variabilidad en la emisin.
La Fig. 6.2 permite observar que entre promedios, en cada nivel de cada
factor, en apariencia hay diferencias. Si estas diferencias son estadsticamente
signicativas, sabremos que existe un efecto del factor correspondiente sobre la
variable respuesta. Mediante una prueba de hiptesis estadstica se verica lo
anterior. Las hiptesis son las siguientes:
H0T :

T1

T2

T3

H0V :

V1

V2

V3

H0T V :

T1 V1

T1 V2

= ::: =

T3 V3

6.1. Diseo factorial 3k y su anlisis estadstico

203

Fig. 6.1: Diagrama de dispersin de la emisin de gas nocivo versus el tiempo de


inyeccin

Trat
1
2
3
4
5
6
7
8
9

T : tiempo
1
2
3
1
2
3
1
2
3
y 1 = 13:17
y 2 = 13:88
y 3 = 14:68

V : volumen
1
1
1
2
2
2
3
3
3
y 1 = 12:57
y 2 = 14:47
y 3 = 14:70

y1
12:3
12:9
13:2
14:1
14:5
14:7
13:3
14:6
16:0

y2
11:4
12:5
13:1
14:0
14:5
15:0
13:9
14:3
16:1

y ij
11:85
12:7
13:15
14:05
14:5
14:85
13:6
14:45
16:05

= 13:91

Tabla 6.2 Esquema del factorial 32 ; con los resultados experimentales


y promedios
Las hiptesis indican que no hay efecto del tiempo, ni volumen en la emisin
de gas, ni de su interaccin, respectivamente. Para probar las hiptesis, primero
es necesario estimar el efecto de los factores en cada nivel. Recuerde que tal
efecto se obtiene contrastando los promedios en cada nivel de los factores con el
y
promedio de todas las observaciones del experimento. Es decir bTi = y i
b
los efectos para el factor tiempo y Vj = y j y
son efectos del factor volumen.
De la Tabla 6.2 se estiman los efectos en cada nivel de cada factor; para el

6. Estructura de tratamientos factoriales 3k

204

Fig. 6.2: Diagrama de dispersin de la emisin de gas nocivo versus la razn del
volumen de la cmara
factor T(tiempo), los resultados son:
Efecto T : tiempo
bT = 13:17 13:91 =
1

bT = 13:88
2

13:91 =

bT = 14:68
3

0:74
0:03

13:91 = 0:77

Similarmente para estudiar el efecto del factor V (volumen) se tiene


Efecto V : volumen
bV = 12:57 13:91 =
1

bV = 14:47
2

1:34

13:91 = 0:56

bV = 14:70
3

13:91 = 0:79

El efecto de interaccin se estima a travs de las cantidades


bT V = y
ij
i j

Por ejemplo,
bT

1 V2

= 14:05

yi

13:17

+y

14:47 + 13:91 = 0:33

6.1. Diseo factorial 3k y su anlisis estadstico

205

A continuacin se muestran todas las cantidades bTi Vj :


Factores
T1

T2

T3

V1
0:03

V2
0:33

V3
0:36

2
S1j

0:41

0:01

0:18

bT

0:16

0:06

2
S2j

0:08

bT

0:19

bT

1 Vj

2 Vj

3 Vj

2
S3j

0:05

0:39

0:01

0:22

0:05

0:58
0:01

Los estadsticos de prueba para estas hiptesis se construyen mediante el


clculo de los cuadrados medios. stos se obtienen por el siguiente procedimiento:
se eleva al cuadrado cada uno de los resultados bTi y bVj ; luego se suman estos
cuadrados y se multiplican por 6. Note que 6 se produce multiplicando el nmero
de replicaciones por el nmero de niveles del otro factor, es decir:
SCT = (3

2)

3
X
i=1

b2 = 6:90
Ti

con dos grados de libertad. Para el otro factor, se tiene:


SCV = 6

3
X
i=1

b2 = 16:43
Vj

con dos grados de libertad. El efecto de interaccin es


SCT V = 2

3 X
3
X
i=1 j=1

b2

Ti Vj

= 1:67

con cuatro grados de libertad. Anlogamente a otros casos presentados, la suma


de cuadrados del error es:
SCerror =

3 X
3
X

2
Sij
= 0:77

i=1 j=1

con nueve grados de libertad. Estos resultados se resumen en la Tabla 6.3.

6. Estructura de tratamientos factoriales 3k

206

Fuente de
variacin
T
V
TV
error
total

Grados de
libertad
2
2
4
9

Suma de
cuadrados
6:92
16:43
1:67
0:77
25:78

Cuadrado
medio
3:45
8:23
0:42
0:09

Fc

Valor p

40:37
96:03
4:88

0:0000
0:0000
0:0228

Tabla 6.3 Resultados del ANDEVA del Ejemplo 6.1


Se aprecia una fuerte evidencia en contra de las hiptesis H0T y H0V y en
menor medida contra H0T V :
Efecto cuadrtico
Si se observa la Fig. 6.2 se puede observar, en las emisiones de gas promedio, que
el volumen tiene potencialmente un efecto de curvatura sobre la cantidad de gas
nocivo, no as el tiempo. De aqu surge la necesidad de plantear un procedimiento
que permita evaluar la signicancia estadstica del efecto de curvatura de algn
factor continuo.
En el Captulo 5 se estim por medio de contrastes el efecto de un factor para
un diseo 2k : La expresin para estimar ese efecto es: bcolumna = y + en la columna
y - en la columna ; sta se puede reescribir por: y nivel 2 y nivel 1 : La grca de este
contraste se interpreta como la pendiente de la recta que une los promedios en esos
niveles, los valores de los coecientes que representan al contraste de la expresin
anterior son f 1; 1g y corresponden a los niveles de los factores.
Los diseos factoriales 3k , cada factor tiene tres niveles, con lo cual se tienen
dos grados de libertad; estos grados de libertad ofrecen la posibilidad de evaluar la
existencia de efectos lineal y cuadrtico de un factor cuantitativo. Para detectar
la presencia de estos efectos el procedimiento es como sigue, suponiendo que los
tres niveles son equidistantes entre s:
1. Se contrastan los promedios del nivel uno y dos del factor, es decir : y nivel 2
y nivel 1 ; y luego se contrastan los promedios del nivel dos y tres del factor,
es decir: y nivel 3 y nivel 2 . Cada uno de estos contrastes equivale al efecto
lineal.
2. Entonces, el efecto lineal total para un factor se obtiene por la suma de los
contrastes en 2, es decir :
b(l) = y
nivel 2

y nivel 1 + y nivel 3

y nivel 2

6.1. Diseo factorial 3k y su anlisis estadstico


= y nivel 3

207

y nivel 1

(6.1)

Los coecientes del contraste anterior representan el efecto lineal del factor
y son los niveles del factor, es decir: fc1 = 1; c2 = 0; c3 = 1g.
3. El efecto cuadrtico se obtiene comparando las pendientes representadas
por los contrastes en 2, lo que equivale a probar la diferencia entre las
pendientes, es decir:
b(c) = fy
nivel 3

o:

y nivel 2 g

b(c) = y
nivel 1

fy nivel 2

y nivel 1 g

2y nivel 2 + y nivel 3

(6.2)

con lo que los coecientes del contraste anterior representan el efecto cuadrtico del factor y son los niveles del factor, es decir: fc1 = 1; c2 = 2; c3 = 1g.
Observe que en cada caso la suma de los coecientes es cero, esto es:
X
cl = 0
l

Existe una tcnica matemtica conocida como polinomios ortogonales que


permite establecer los coecientes de los contrastes para factores con diferente
nmero de niveles. stos permitirn contrastar los promedios entre los niveles
de un factor para determinar la existencia de efectos lineales o cuadrticos en el
caso de diseos 3k ; o de mayor orden para diseos cuyos factores tengan niveles
mayores a 3, por ejemplo en el diseo 4k hasta el efecto cbico. En la Tabla 6.4
se describen los coecientes para los diseos 2k ; 3k que se tratan en este captulo,
y se anexa el de cuatro niveles que se dejar como ejercicio.
El lector interesado en conocer ms sobre el tema de polinomios ortogonales
puede consultar los libros Hinkelman y Kempthorne (1994), y Draper y Smith
(1998).
Niveles
Efecto
c1
c2
c3
c4
P 2
ci

2
lineal
1
1

lineal
1
0
1

3
cuadrado
1
2
1

lineal
3
1
1
3
20

4
cuadrado
1
1
1
1
4

Tabla 6.4 Coecientes de los contrastes ortogonales


para diseos de 2, 3 y 4 niveles

cubo
1
3
3
1
20

6. Estructura de tratamientos factoriales 3k

208

A nivel de comentario se puede decir que, aplicando las expresiones (6.1) y


(6.2) se estiman los efectos lineal y cuadrtico de un factor. La estimacin de
los efectos de interaccin se obtiene aplicando expresiones similares, slo hace
falta identicar los coecientes que permitirn comparar las medias. Identicar
los efectos cuadrticos de un factor y las interacciones entre la parte lineal y
cuadrtica es importante en la modelacin matemtica del proceso, ya que enriquece la interpretacin en la variable de respuesta y permite determinar valores
de sta que resulten apropiados para operar mejor el proceso. Sin embargo, la
metodologa para construir un modelo se ver con detalle en un captulo posterior.
A continuacin se ilustran los clculos necesarios para evaluar la signicancia
estadstica de un efecto cuadrtico. Estimacin de los efectos lineales para los
factores tiempo y volumen, vea la Tabla 6.2:
bT (l) = 14:683
bV (l) = 14:7

13:167 = 1:516
12:568 = 2:132

Los efectos cuadrticos son:

bT (c) = 13:167

2(13:883) + 14:683 = 0:084

bV (c) = 12:568

2(14:467) + 14:7 =

1:667

La suma de cuadrados SC tanto para el efecto lineal como cuadrtico, se


obtiene por la expresin
2
rbef ecto
SC = P 2
cij

(6.3)

donde r es el nmero de observaciones utilizadas en cada uno de los promedios


empleados. En este caso r = 3 2 = 6: Los resultados se muestran en la siguiente
tabla:

efecto

Tl
1:516

Tc
0:084

Vl
2:13

Vc
1:667

La suma de cuadrados para los efectos lineales, cuadrticos y las de interaccin


se reproducen en la Tabla 6.5.

Factorial 3k fraccionado

6.2.

Fuente de
variacin
Tiempo
Tl
Tc
Volumen
Vl
Vc
Interaccin
Error
Total

Grados de
libertad
2
1
1
2
1
1
4
9
17

209

Suma de
cuadrados
6:91
6:90
0:01
16:43
13:65
2:78
1:67
0:77
25:78

Cuadrado
medio

Fc

Valor p

6:90
0:01

32:47
0:08

0:0003
0:7851

13:65
2:78
0:42
0:09

159:58
80:66
4:87

0:0000
0:0000
0:0228

Tabla 6.5 Anlisis de la varianza para los efectos lineales y cuadrticos


Se saba que los efectos de los factores eran signicativos, sin embargo con el
procedimiento desarrollado se ha detectado que el efecto del factor volumen es
signicativo tanto en su componente lineal como en el cuadrtico.

6.2

Factorial 3k fraccionado

Cuando el nmero de tratamientos del factorial 3k es grande, la realizacin del


experimento puede resultar complicado, debido a que se requiere ms material,
es ms costoso y es necesario invertir mayor tiempo. Por ejemplo, si k = 4, se
requieren 81 tratamientos para llevar a cabo el experimento . En primera instancia se puede efectuar el experimento en varias partes, para ello, ser necesario
establecer una estrategia con el n de obtener fracciones del factorial. Realizar
el experimento en fracciones (bloques) de un factorial 3k tiene la ventaja de que
el experimento se puede efectuar en diferentes das, por distintos operadores y en
varios laboratorios, entre otras posibles consideraciones.
Aqu se presentarn los lineamientos generales para fraccionar un diseo 3k ;
para jar las ideas del procedimiento, se considera nicamente el caso de un diseo
con tres factores, esto es 33 : Este plan se puede extender de manera idntica para
k > 3. Slo se trata el hecho de fraccionar en tercios, este tema se puede extender
a fracciones menores. En la Tabla 6.6, se describe el diseo para los primeros
nueve tratamientos, los niveles se han denotado por 1, 2 y 3.

6.2.1

Fraccin un tercio del factorial 33

El procedimiento para fraccionar un factorial 3k es parecido al que se utiliza en los


factoriales 2k : Antes de plantear ste, es importante notar que en los factoriales

210

6. Estructura de tratamientos factoriales 3k

3k los efectos principales tienen 2 gl, las interacciones dobles 4 gl, las interacciones
triples 8 gl y as de manera sucesiva. Dado que el nmero de gl en cada caso es
distinto, resulta imposible tener efectos principales completamente confundidos
con interacciones de diferente grado.
Para poder abordar esta situacin, las interacciones se deben separar en grupos de tal manera que sus grados de libertad sean igual al de los efectos principales. Por ejemplo, en la interaccin doble se deben tener dos grupos de 2 gl
cada uno, entonces un grupo se puede confundir con efectos principales, de igual
forma se hace con interacciones de orden mayor.
Pensando que el factorial 33 es un diseo ortogonal, la interaccin doble AB
se puede descomponer en A1 B 1 ; A1 B 2 ; A2 B 1 y A2 B 2 ; cada una de stas tiene
un gl. Para formar los grupos existen varias posibilidades, sin embargo, por
conveniencia se tomar el grupo que contiene al factor A con exponente 1, as se
puede escoger el grupo compuesto por A1 B 1 ; A1 B 2 con dos grados de libertad.
Escribimos a propsito el 1 como exponente para diferenciarlo de la interaccin
completa.
Con esta idea se puede plantear el procedimiento para dividir en tres fracciones el factorial 3k ; de esa manera cada fraccin ser un tercio del factorial y
se denota por 3k 1 . Suponga que los k factores son A; B; : : : ; K, con tres niveles,
en particular se propone el siguiente generador:
I = A1 B 2 :::K

(6.4)

i = 0; 1; 2, i = 2; 3; :::; k el valor de i ser el exponente del factor que interviene


para formar las fracciones. Cada efecto principal o aquel que se compone de
interacciones estimado por el factorial 3k 1 tiene dos alias, stos se determinan
multiplicando el efecto por I e I 2 mdulo 3 para el exponente.
La estrategia para formar las fracciones consiste en observar el valor del
residuo que deja la divisin de L entre 3; es decir:

L
residuo( )
3
donde L = a + 2 b + ::: + k k, las letras minsculas representan niveles del factor
correspondiente.
A continuacin, se describe el procedimiento para fraccionar el factorial 33 ;
la idea es considerar el efecto de interaccin triple ABC: Los tres posibles grupos
(con 2 gl) que se forman por la convencin adoptada son: A1 B 1 C 1 , A1 B 2 C 1 ,
A1 B 2 C 2 : El generador que se propone es I = A1 B 2 C 1 , de esta manera los exponentes de los factores A; B y C tienen el valor de 1, 2 y 1, as los valores de
1 = 3 = 1, 2 = 2; entonces L = a + 2b + c: Aplicando la operacin mdulo 3

6.2.

Factorial 3k fraccionado

211

a L se producen las fracciones, esto es:


8
< 0 para la fraccin 1
a + 2b + c
1 para la fraccin 2
residuo(
)=
:
3
2 para la fraccin 3

El n de esta expresin es repartir los 33 = 27 tratamientos en tres fracciones.


Note que se generan tres nmeros, con stos se formarn tres fracciones, en la
primera irn los tratamientos cuyo residuo es el cero, en la siguiente se asignan los
de residuo uno, los restantes en la fraccin tres. La Tabla 6.6 ejemplica nueve
casos y en la Tabla 6.7 se exhiben las tres fracciones.
Trat
1
2
3
4
5
6
7
8
9

Factor
A
1
2
3
1
2
3
1
2
3

Factor
B
1
1
1
2
2
2
3
3
3

Factor
C
1
1
1
1
1
1
1
1
1

Suma
a + 2b + c
4
5
6
6
7
8
8
9
10

Criterio
residuo a+2b+c
3
1
2
0
0
1
2
2
0
1

Tabla 6.6 Estrategia para fraccionar el diseo 3k , ilustracin de


nueve tratamientos
Trat
3
4
8
11
15
16
19
23
27

Fraccin 1 (0)
A B C
3 1 1
1 2 1
2 3 1
2 1 2
3 2 2
1 3 2
1 1 3
2 2 3
3 3 3

Trat
1
5
9
12
13
17
20
24
25

Fraccin (1)
A B C
1 1 1
2 2 1
3 3 1
3 1 2
1 2 2
2 3 2
2 1 3
3 2 3
1 3 3

Trat
2
6
7
10
14
18
21
22
26

Fraccin 3 (2)
A B C
2 1 1
3 2 1
1 3 1
1 1 2
2 2 2
3 3 2
3 1 3
1 2 3
2 3 3

Tabla 6.7 Asignacin de fracciones del factorial 33

6. Estructura de tratamientos factoriales 3k

212

Cada una de estas fracciones representa una parte del factorial 33 , la cual corresponde a un tercio. Si slo se requiere llevar a cabo una parte del experimento,
se selecciona aleatoriamente una de las tres fracciones.
Por otro lado, si es necesario realizar el experimento en tres das, se van
seleccionando cada una de las fracciones restantes de manera aleatoria. En esta
situacin el da desempea el papel de factor de ruido y se usa como bloque, en
ese caso el efecto de AB 2 C est confundido con el efecto del bloque.
Como se sabe, al fraccionar un factorial existen efectos principales que se confunden parcial o completamente con efectos de interaccin, o algunos efectos de
interaccin entre ellos. Para conocer cmo se presentan esos efectos confundidos
es necesario plantear la estructura alias. Los alias se obtienen a partir de los
generadores I e I 2 y multiplicando cada uno de ellos por los factores y algunas
interacciones hasta completar ocho efectos, que es el nmero de grados de libertad disponible. Para determinar el exponente se tiene que aplicar la operacin
mdulo 3. En la siguiente tabla se describen los alias resultantes para el caso que
estamos tratando.
Generadores

I = AB 2 C
A(AB 2 C) = A2 B 2 C
B(AB 2 C) = AC
C(AB 2 C) = AB 2 C 2
AB(AB 2 C) = A2 C

I 2 = A2 BC 2
A(A2 BC 2 ) = BC 2
B(A2 BC 2 ) = A2 B 2 C 2
C(A2 BC 2 ) = A2 B
AB(A2 BC 2 ) = B 2 C 2

Slo cuatro efectos se pueden estimar usando los ocho gl, stos son: A !
! BC 2 ; B ! AC ! A2 B 2 C 2 ; C ! AB 2 C 2 ! A2 B; AB ! A2 C !
2
2
B C : De aqu se desprende que los efectos principales estn confundidos con
efectos dobles, por lo que una fraccin de 31 del factorial 33 es de resolucin III:
Existe una amplia gama de estrategias para fraccionar diseos factoriales,
stas consideran los casos en que los factores tienen un nmero primo de niveles.
McLean y Anderson (1984) presentan varios esquemas de factoriales fraccionados
que tratan con factores de 2 y 3 niveles.
A2 B 2 C

6.2.2

Fraccin de un 3k por medio del cuadrado latino

Otro procedimiento para generar un 3k fraccionado es la aplicacin del cuadrado


latino; por ejemplo suponga que se tienen tres factores A, B y C, cuyos niveles
son 1, 2 y 3 el esquema de cuadrado latino en esta situacin es:
B
A
1
2
3

1
2
3

2
3
1

3
1
2

6.2.

Factorial 3k fraccionado

213

Observe que las columnas describen los niveles del factor A, en los renglones
los niveles del factor B, y dentro del cuadro los niveles de C; la presentacin del
diseo anterior se describe en un arreglo ortogonal:
Trat
1
2
3
4
5
6
7
8
9

A
1
1
1
2
2
2
3
3
3

B
1
2
3
1
2
3
1
2
3

C
1
2
3
2
3
1
3
1
2

Este arreglo describe una fraccin de un diseo 33 ; el mismo arreglo se obtiene


aplicando la expresin (6.4). Esta es una manera eciente y econmica para
generar una fraccin de un factorial 33 , este modo de originar la fraccin no lleva
consigo implcito un generador tal y como lo hemos establecido en el subapartado
anterior. Se debe tomar en cuenta que est presente una estructura alias, la
cual da lugar a tener efectos principales confundidos con efectos de interaccin
doble sin embargo, el n principal de estas fracciones es proporcionar informacin
sobre el efecto de los factores en la respuesta, sin la necesidad de realizar muchas
pruebas experimentales. Adems, al contar los factores con tres niveles existe la
posibilidad de identicar la presencia de un efecto no lineal.
Otra extensin importante se reere al caso de un diseo con cuatro factores
A, B, C y D, donde se usa un diseo de cuadrado latino cbico o greco - latino; el
arreglo es similar al anterior, slo que en este nuevo esquema se combinan dentro
del cuadrado los niveles de los factores C, D, y entre parntesis se escriben los
niveles del factor D.

B
A
1
2
3

1(1)
2(3)
3(2)

2(2)
3(1)
1(3)

3(3)
1(2)
2(1)

Por consiguiente, el arreglo ortogonal de este nuevo esquema que representa

6. Estructura de tratamientos factoriales 3k

214

un diseo factorial fraccionado 34 es:


trat
1
2
3
4
5
6
7
8
9

A
1
1
1
2
2
2
3
3
3

B
1
2
3
1
2
3
1
2
3

C
1
2
3
2
3
1
3
1
2

D
1
3
2
2
1
3
3
2
1

Tabla 6.8 Esquema experimental para la fraccin del diseo 34


Observacin: Como se ha mencionado en el captulo anterior, Taguchi propuso
una serie de arreglos ortogonales, entre otros propsitos sus arreglos permiten
facilitar la estrategia experimental, en particular el arreglo ortogonal de la Tabla
6.8 es exactamente el descrito por Taguchi para factores con tres niveles, el cual
se denota por AO9 (34 ): Recuerde que en la presentacin Taguchi las columnas
se enumeran y cada una de ellas representa a los factores, en la Tabla 6.8 se
han puesto los factores. Existen otros arreglos ortogonales para factores con tres
niveles, entre los que tienen mayor aplicacin se encuentra el arreglo AO27 (313 );
sta presentacin incrementa los casos de arreglos ortogonales que se han ido
discutiendo a lo largo del trabajo.
Como ya se ha discutido, cada uno de los arreglos ortogonales propuestos
por Taguchi tiene una tabla de interacciones con la nalidad de colocar las de
mayor importancia para el experimentador en columnas del arreglo. Para el caso
especco del arreglo AO9 (34 ) la tabla es:
1
(1)

6.2.3

2
3
4
(2)

3
2
4
1
4
(3)

4
2
3
1
3
1
2

Diseo Plackett - Burman para factoriales 3k

Los diseos propuestos por Plackett - Burman tambin permiten tener fracciones de esquemas experimentales en factoriales 3k : Para obtener los esquemas
de estos diseos se establece una frmula que permita relacionar los nmeros

6.2.

Factorial 3k fraccionado

215

t 1
;
ni 1
por ejemplo si se tienen 9 tratamientos y 3 niveles, as el nmero de factores es:
9 1
k=
= 4: El generador propuesto por Plackett - Burman para esta situacin
3 1
es: f1; 2; 3; 3; 1; 3; 2; 2g, donde cada nmero representa el nivel de los factores: En
el captulo anterior se mostr el procedimiento para construir el esquema experimental cuando ni = 2, en esta nueva situacin la estrategia es similar, es
decir:
de factores (k) tratamientos (t) y niveles (ni), tal expresin es: k =

1. En la columna correspondiente al factor A se pone el generador tal cual.


2. En la siguiente etapa se quita el ltimo nmero del generador pasndolo al
primer lugar, los dems nmeros se recorren un lugar, este nuevo orden del
generador se escribe en la columna correspondiente al factor B.
3. El paso anterior se repite para el resto de los factores, en cada nueva columna
se van recorriendo los lugares, tomando el orden del generador en la columna
previa.
4. En el ltimo rengln que corresponde al tratamiento nueve se colocan todos
los factores en su nivel 1.
Siguiendo el procedimiento descrito, el esquema experimental es:
trat
1
2
3
4
5
6
7
8
9

A
1
2
3
3
1
3
2
2
1

B
2
1
2
3
3
1
3
2
1

C
2
2
1
2
3
3
1
3
1

D
3
2
2
1
2
3
3
1
1

Tabla 6.9 Esquema experimental Plackett-Burman


Observaciones:
1. El esquema Plackett - Burman descrito en la Tabla 6.9 se puede ordenar de
tal manera que se obtiene el arreglo ortogonal AO9 (34 ) de Taguchi.

6. Estructura de tratamientos factoriales 3k

216

2. Existen generadores para otros diseos de factores con tres niveles; a continuacin slo se presenta el que en la prctica tiene mayor posibilidad de ser
usado, por ello se escribe el generador del caso de T = 27:
f1; 1; 2; 1; 2; 3; 2; 2; 3; 1; 2; 2; 2; 1; 1; 3; 1; 3; 2; 3; 3; 2; 1; 3; 3; 3g
En la situacin de que un experimentador necesite realizar un experimento
con esta cantidad de factores, la construccin del esquema sigue el procedimiento citado en la elaboracin de la Tabla 6.9. Este esquema es
equivalente al arreglo AO27 (313 ), razn por la que no se escribe la tabla
correspondiente al arreglo Taguchi.

6.3

Ejercicios

Ejercicio 6.1 Tiempo de coccin. Se desea conocer el tiempo de coccin del


frijol para tres variedades (var) de frijol, con tres diferentes concentraciones (con)
de sal en el remojo, en este proceso se tienen dos factores con tres niveles. Se
hicieron tres rplicas del experimento, el tiempo se determin cuando el 90 %
de las unidades experimentales estaban cocidas. Los resultados se muestran a
continuacin:
A:con.
1
2
3
1
2
3
1
2
3

B: var
1
1
1
2
2
2
3
3
3

Y1
62
51
59
57
61
58
59
55
47

Y2
48
57
65
45
58
63
53
58
56

Y3
63
45
55
39
70
70
67
50
51

S2

1. Haga las grcas para representar los promedios de cada factor, qu observa?
2. Graque la interaccin.
3. Estime los efectos lineal y cuadrtico para los factores A y B.
4. Realice el anlisis de la varianza, qu hiptesis estadsticas se prueban?
Obtenga sus conclusiones.
5. Haga una evaluacin estadstica del modelo.

6.3. Ejercicios

217

Ejercicio 6.2 En la actualidad es muy comn hacer estudios sobre la contaminacin generada por diferentes equipos o mquinas. Un ingeniero desea estudiar
el gas emitido por una mquina, ste se mide en partes por milln de monxido de
carbono (Y ). Los factores que afectan son la razn del volumen de la cmara (V ),
y tiempo de inyeccin (I), ambos considerados en tres niveles igualmente espaciados. Se realiza el experimento poniendo a funcionar la mquina aleatoriamente
en los diferentes tratamientos, cuntos son?, los datos arrojados se describen a
continuacin (dos rplicas por tratamiento):
trat
1
2
3
4
5
6
7
8
9

tiempo
1
2
3
1
2
3
1
2
3

volumen
1
1
1
2
2
2
3
3
3

y1
26
30
31
35
37
41
34
34
31

y2
27
29
32
37
38
40
33
36
32

1. Realice el ANDEVA indicando qu hiptesis se prueban.


2. Construya el intervalo de conanza para el volumen en el nivel intermedio.
Interprtelo.
3. Construya el intervalo de conanza para el tratamiento 6, es decir, cuando
el volumen est en el nivel intermedio y el tiempo en el nivel alto.
4. Estime los efectos lineales y cuadrticos de los factores.
5. Estime las interacciones respectivas.
6. Construya el ANDEVA que represente los efectos lineales y cuadrticos con
sus interacciones.
Ejercicio 6.3 Con el objeto de encontrar las condiciones ptimas de germinacin de semilla de amaranto Mora (1989), se realiz un diseo experimental
32 ; los factores que se consideran en el estudio son: concentracin (%) de NaCl y
temperatura (o C) a un tiempo jo de 20 minutos. La respuesta es el porcentaje
de semillas germinadas. Los resultados al realizar el experimento se muestran en
la tabla siguiente (tres rplicas):

6. Estructura de tratamientos factoriales 3k

218

Temp (o C)nNaCl (%)


25
30
35

0
80; 81; 80
90; 90; 90
93; 92; 90

0:1
89; 89; 89
90; 90; 92
92; 92; 93

0:3
90; 91; 90
92; 96; 96
94; 95; 95

1. Describa en una grca los efectos de cada factor.


2. Estime los efectos de los factores.
3. Complete el anlisis estadstico.

Ejercicio 6.4 En referencia al ejercicio 4.11 descomponga el efecto del factor


C en su parte lineal y cuadrtica; verique la signicancia de estos efectos.

Ejercicio 6.5 Considere el ejercicio 4.13, use los contrastes de la Tabla 6.4 para
estudiar los efectos lineal, cuadrtico y cbico del factor A; y el lineal y cuadrtico
para el factor B, as como las interacciones respectivas que esta descomposicin
genere. Reconstruya la tabla del ANDEVA para estos efectos y obtenga sus
conclusiones. Cmo puede reconstruir la suma de cuadrados para el error en
funcin de sus resultados de la tabla ANDEVA?

Ejercicio 6.6 En un proceso que simula un ciclo de mezclado se tienen identicados cuatro factores de control que se describen en la tabla. Se plante realizar
un experimento siguiendo un esquema AO9 . Al llevar a cabo este experimento,
se midi la dureza del material. Cabe destacar que en el proceso se consider
como factor de ruido a dos condiciones de operacin diferentes relacionadas al
mantenimiento preventivo, stas se denominaron M1 y M2 :
Factor
A:
B:
C:
D:

Temperatura de inicio
Temperatura de carga
Energa consumida
Tipo de formulacin

Los resultados experimentales

1
baja
baja
baja
actual

Nivel
2
media
media
media
actual+S1

3
alta
alta
alta
actual+S2

6.3. Ejercicios

219

Trat
1
2
3
4
5
6
7
8
9

A
1
1
1
2
2
2
3
3
3

Factores
B C D
1 1 1
2 2 2
3 3 3
1 2 3
2 3 1
3 1 2
1 3 2
2 1 3
3 2 1

M1
y1
44
41
53
74
87
51
55
32
50

M2
y2
58
83
80
78
84
98
74
42
83

1. Estime los promedios en cada nivel para cada factor.


2. Considere las respuestas y y log(S 2 ); realice un bosquejo grco para ambas
respuestas para identicar efectos signicativos. D sus comentarios.
3. Realice el ANDEVA para los efectos principales e interprete sus resultados.
4. Obtenga la mejor condicin para alcanzar una dureza entre 60 y 65.
Ejercicio 6.7 (Wu y Hamada, 2000) Considere un experimento para estudiar
el efecto de cuatro factores sobre la fuerza de jale de cinturones de asiento de
carro que se producen parcialmente durante una operacin de rizado en la que
se une un sujetador a un cable. Los cuatro factores son presin hidrulica de
la mquina de rizado (A), ancho de dado (B), longitud del rizo (C) y lote del
sujetador (D), cada uno de ellos en tres niveles como se muestra a continuacin:
Factor
A:
B:
C:
D:

Presin (psi)
Dado (mm)
Longitud de rizo (mm)
Lote de sujetador (nmero)

1
1100
10
18
P74

Nivel
2
3
1400 1700
10:2 10:4
23
27
P75 P76

El diseo experimental fue un factorial fraccionario 34 1 mostrado a continuacin junto con los resultados de tres rplicas, midiendo dos respuestas: fuerza
de tensin del rizo en libras (que debe ser mayor a 4000 lb por especicaciones
de seguridad) y lo denominado ash, es decir, el exceso de metal del rizo (el
cual por especicaciones no debe exceder a 14mm).
1. Considerando que el generador de la fraccin utilizada es I = ABCD2 ;
identique la estructura alias correspondiente.

6. Estructura de tratamientos factoriales 3k

220

2. Identique factores de localizacin y dispersin en ambas variables respuesta


como lo mencionado en el captulo 5.
3. De acuerdo a los objetivos del experimento seleccione para cada respuesta
un cociente seal a ruido como los mencionados en el captulo 5 y realice el
anlisis correspondiente.
4. Compare resultados de 2 y 3 y proponga recomendaciones prcticas.

Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

Factores
A B C D
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3

1
1
1
2
2
2
3
3
3
1
1
1
0
2
2
3
3
3
1
1
1
2
2
2
3
3
3

1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3

1
2
3
2
3
1
3
1
2
2
3
1
3
1
2
1
2
3
3
1
2
1
2
3
2
3
1

Fuerza
5164
5356
3070
5547
4754
5524
5684
5735
5744
6843
6538
6152
6854
6799
6513
6473
6832
4968
7148
6905
6933
7227
7014
6215
7145
7161
7060

6615
6117
3773
6566
4401
4050
6251
6271
4797
6895
6328
5819
6804
6703
6503
6974
7034
5684
6920
7068
7194
7170
7040
6260
6868
7263
7050

Flash
5959
5224
4257
6320
5436
4526
6214
5843
5416
6957
4784
5963
6907
6792
6568
6712
5057
5761
6220
7156
6667
7015
7200
6488
6964
6937
6950

12.89
12.83
12.37
13.29
12.64
12.76
13.17
1302
12.37
13.28
12.62
13.19
14.65
13.00
13.13
13.55
14.86
13.00
16.70
14.70
13.51
15.54
13.97
14.35
15.70
15.21
13.51

12.70
12.73
14.47
12.86
12.50
12.72
13.33
13.11
12.67
13.65
14.07
12.94
14.98
13.35
13.40
14.10
13.27
13.58
15.85
13.97
13.64
16.16
14.09
13.56
16.45
13.77
13.42

12.74
13.07
12.44
12.70
12.61
12.94
13.98
12.67
12.54
13.58
13.38
13.15
14.40
12.87
13.80
14.41
13.64
13.45
14.90
13.66
13.92
16.14
14.52
13.00
15.85
14.34
13.07

6.3. Ejercicios

221

Ejercicio 6.8
El objetivo de este ejercicio es considerar el anlisis de un experimento en el que
la variable de respuesta es cualitativa. En este caso particular se inspeccionan
n artculos, la respuesta es 0 si el artculo es defectuoso y 1 si el artculo es no
defectuoso; es decir:
yi =

0; si el artculo es defectuoso
1; si el artculo es no defectuoso

En esta situacin yi sigue una distribucin Bernoulli, para este tipo de datos
se deduce de la funcin de ruido nominal es mejor, la expresin:
S=R =

10 log

1
p

1 ;

n
; n : nmero de artculos. Nota: en los ejercicios del
donde p = y1 +y2 +:::+y
n
Captulo 8 se presenta un ejercicio cuyo anlisis estadstico es una alternativa a
esta propuesta.
Un experimento se realiza para detectar el nmero de productos de plstico
no defectuosos en un proceso de inyeccin. Si un defecto es encontrado en el
plstico al terminar la inyeccin, el producto es considerado defectuoso. Cuatro
factores se consideraron en tres niveles como se describe a continuacin.

FactoresnNiveles
A: Temperatura de secado (o C)
B: Temperatura de proceso (o C)
C: Presin de inyeccin (ud)
D: Tipo de formulacin

1
100
220
70
1

2
110
230
75
2

3
120
235
80
3

En cada tratamiento se probaron 150 plsticos, los resultados experimentales


en un arreglo AO9 (34 ) son:
Trat
1
2
3
4
5
6
7
8
9

A
1
1
1
2
2
2
3
3
3

B
1
2
3
1
2
3
1
2
3

C
1
2
3
2
3
1
3
1
2

D
1
2
3
3
1
2
2
3
1

no defectos
117
110
136
144
108
118
110
140
133

S=R

6. Estructura de tratamientos factoriales 3k

222

1. Calcule la seal razn a ruido, encuentre los promedios de los factores en


cada uno de sus niveles, haga las grcas e indique en que niveles hay mayor
respuesta.

2. Cul es el valor de S=R P


produce la mayor respuesta? Sugerencia, use la
expresin S=Rme = y + i (factori y), donde el factori corresponde al
nivel de los factores que resultaron signicativos en el experimento. Segn
este valor diga cul es el porcentaje de no defectuosos?

Ejercicio 6.9
Los diseos en parcelas divididas tienen aplicacin en procesos industriales, en
particular en diseos factoriales 2k y sus fracciones. Considere que se lleva a cabo
un experimento para estudiar la resistencia de un plstico, se identica que hay
cuatro factores importantes para este proceso como se muestra en la tabla de
abajo, entre ellos la temperatura que es difcil estar varindola. El diseo es un
24 y se realiza dos veces.

FactoresnNiveles
A: Temperatura (o C)
B: Aditivo (%)
C: Razn de agitacin (m/seg)
D: Tiempo del proceso (min)

1
150
10
30
15

1
180
15
35
20

El experimento se organiza formando 4 grupos: parcela en funcin de la


temperatura (Tem) baja - alta, y el diseo 23 .

Parcela
Diseo

Tem baja
23

Tem alta
23

Tem alta
23

Tem baja
23

6.3. Ejercicios

223

El esquema del diseo y los resultados son:


Parcela
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2

B
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

y
72:7
77:0
62:7
75:0
65:5
56:1
63:7
70:4
61:6
61:7
60:7
68:1
60:6
62:3
57:4
63:7

Parcela
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4

B
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

y
70:8
68:1
66:8
67:4
60:3
67:5
66:9
69:2
63:7
68:2
72:2
69:8
62:8
77:5
65:7
68:4

1. Realice el anlisis para la parcela.


2. Construya la tabla del anlisis de la varianza para la parcela dividida.
3. Determine las desviaciones estndar del diseo y de la parcela.
4. Solucin posterior. Usando las tcnicas del Capitulo 8 estime el modelo de
regresin.

224

6. Estructura de tratamientos factoriales 3k

Captulo 7

Algunos diseos especiales


...la verdad sobre la naturaleza, que yo haba rechazado y echado
de casa, volvi sigilosamente por la puerta trasera, y se present
disfrazada para que yo la aceptara...Ah, qu pjaro ms necio he sido!
Johannes Kepler

7.1

Diseo en parcelas divididas

Hasta ahora, en todos los diseos estudiados se ha denido de manera nica a


la UE; hay que recordar que una UE se dene como aquella porcin del material experimental que recibe de modo independiente un tratamiento, sin embargo en muchos experimentos por restricciones prcticas no es posible aplicar el
tratamiento completo a una UE, sino que ste se debe aplicar en una secuencia.
Ilustremos con un ejemplo esta situacin.
Ejemplo 7.1
En Mxico el jamn cocido de pierna de cerdo es uno de los alimentos ms consumidos por la poblacin urbana; en la prctica industrial, en general, se utilizan
gomas de grado alimenticio mezcladas con carne con el n de bajar el costo, pero
a costa de la calidad para el consumidor. Un tecnlogo en alimentos preocupado
por esta prctica industrial, cree que la substitucin de tales gomas por protenas miobrilares de pollo, puede generar jamn mejorado en sus caractersticas
de calidad (elasticidad, cohesividad, masticabilidad, gomosidad y rmeza) y de
rendimiento (prdida de peso por coccin y capacidad de retencin de agua).
As desea realizar un experimento para comparar un jamn control (formulacin comercial) con goma en un 2% del total, con jamones elaborados con 2,
5 y 10% de protena miobrilar de pollo. Adicionalmente, dadas las condiciones

226

7. Algunos diseos especiales

del proceso de produccin, se desea estudiar los efectos de la posible interaccin


existente entre las cuatro formulaciones y la variabilidad debida al usar uno de
los tres mtodos de coccin, por lo que se considera como otro factor al mtodo
de coccin en tres niveles para simular en el laboratorio tales variaciones. As el
inters principal son las diferencias en las formulaciones pero interesan los efectos
de interaccin con los mtodos de coccin. Sin embargo, por cuestiones prcticas es difcil hacer cambios de mtodo de coccin, por lo que es deseable en una
primera etapa, antes que nada formar UE grandes llamadas parcelas, cada una
formada por cuatro jamones que se asignen de manera aleatoria a los mtodos
de coccin, una vez asignados habr que aleatorizar las formulaciones sobre las
cuatro UE pequeas (subparcelas), que integran a la parcela grande.
El manejo de este experimento implic dos restricciones en la aleatorizacin:
identicar parcelas antes de aleatorizar los mtodos de coccin e identicar subparcelas antes de aleatorizar formulaciones.
Factor/Nivel
A: mtodo de coccin
B: formulacin

Bloque 1 (da 1)
Bloque 2 (da 2)
Bloque 3 (da 3)

A2
B4 ; B1 ; B2 ; B3
A3
B3 ; B1 ; B2 ; B4
A1
B4 ; B2 ; B1 ; B3

A1
B1

A2
B2

A3
B3

A1
B4 ; B2 ; B1 ; B3
A2
B4 ; B1 ; B3 ; B2
A2
B3 ; B1 ; B2 ; B4

B4

A3
B2 ; B1 ; B4 ; B3
A1
B2 ; B1 ; B3 ; B4
A3
B1 ; B3 ; B2 ; B4

Tabla 7.1 Descripcin del principio de parcelas divididas


Esta forma de aplicar los tratamientos responde al conocido principio de
parcelas divididas: parcelas o unidades grandes a las que los niveles de uno o
ms de los factores pueden ser aplicados son divididas en subparcelas o unidades
chicas, a las que los niveles de uno o ms factores adicionales son aplicados.
El principio se ilustra en el Ejemplo 7.1 para el caso de dos factores uno,
mtodos de coccin a parcelas y el otro, formulaciones de jamn a las subparcelas. Es generalizable a un mayor nmero de restricciones en la aleatorizacin
con la consecuente divisin de factores: a las parcelas, a las subparcelas, a las
subsubparcelas, etctera.
Siguiendo con el Ejemplo 7.1, los recursos existentes permiten realizar por
triplicado cada formulacin en cada mtodo de coccin, esto nos lleva a considerar 36 (= 4 3 3) unidades experimentales o lotes de jamn a ser fabricados

7.1. Diseo en parcelas divididas

227

durante el experimento. Suponga que slo es posible producir 12 lotes de jamn


al da, por lo que se considera que en tres das debe ser efectuado el experimento
completo, esto impone considerar el efecto posible por la diferencia de das de
experimentacin, que se traduce en una restriccin adicional (diferente a las consideradas en el principio anterior) para agrupar lotes de jamn por da (bloque),
y as garantizar una estimacin ms precisa del error experimental; de esta forma
se tendra un diseo en bloques, pero divididos en parcelas (niveles: mtodos de
coccin) y stas divididas en subparcelas (niveles: formulaciones).
A partir de este ltimo planteamiento y de la Tabla 7.1 se ve que hay r = 3
replicaciones en cada mtodo de coccin y 9 = 3r replicaciones en cada formulacin, entonces note que habr precisiones diferentes en la comparacin entre los
mtodos de coccin y las diferentes formulaciones; adems, los dos factores estn
asociados a diferentes tamaos de UE, lo que da lugar a diferentes varianzas del
error experimental asociadas con estas comparaciones.

7.1.1

Estimacin de varianzas con aleatorizacin en dos etapas

Como se recordar, en general la estimacin de la varianza del error se da a travs


de las replicaciones, es decir, con al menos dos UE bajo el mismo tratamiento.
En el diseo en bloques en parcelas divididas, por causa de la aleatorizacin en
dos etapas de los factores, resultan UE de diferentes tamaos - recuerde que una
UE tiene asociado un trmino de error experimental -, entonces en el caso de
un diseo en parcelas divididas, al haber dos tipos de UE se tendrn dos tipos
de trmino de error experimental y por ende dos varianzas a ser estimadas. La
estimacin de las varianzas de estos dos tipos de errores requieren de rplicas,
el nmero de rplicas de cada tipo de UE ser en general diferente si la UE
corresponde a una parcela o a una subparcela.
Para estimar la varianza del error asociado a UE parcelas se usan las replicaciones de los niveles del factor que van a las parcelas que se repiten slo al
cambiar de bloque. Lo que corresponde a la primera etapa de aleatorizacin, que
no es otra cosa mas que un diseo en bloques completamente al azar, por lo que se
tienen a tratamientos (a niveles del factor que se aplica en las parcelas denotado
por A), y r =nmero de replicaciones (igual en este caso al nmero de bloques).
La estimacin de la varianza de UE subparcelas surge con las replicaciones
de los niveles del factor que van a las subparcelas que se repiten obviamente al
cambiar de bloque pero tambin dentro de cada bloque, en este caso tambin se
tiene un diseo en bloques completamente al azar, con b tratamientos (b niveles del factor que se aplica a subparcelas, denotado por B) y ra =nmero de
replicaciones.
Esto hace que para la estimacin de la varianza del error experimental en
las parcelas se cuente con menos replicaciones que en el caso de la estimacin

228

7. Algunos diseos especiales

de la varianza del error de las subparcelas, desde luego, tales replicaciones son
concebibles suponiendo la no interaccin entre el efecto de bloques con cualquiera
de los efectos de los factores de inters.
Con esta informacin tenemos para la primera estructura de diseo, la siguiente particin de los grados de libertad ra 1 en la parcela:
Fuente de
variacin
Bloques
Factor A: Parcela
Error (A)
Parcela completa

Grados de
libertad
r 1
a 1
(r 1)(a 1)
ra 1

Si se considera la segunda estructura de diseo, los grados de libertad disponibles son: rab 1 y la particin de stos se muestra a continuacin:
Fuente de
variacin
replicaciones
Factor B: Subparcela
Error (B)
Total

Grados de
libertad
ra 1
b 1
(ra 1)(b
rab 1

1)

La descripcin de la estructura de diseo bosquejada en las tablas anteriores


proporciona los elementos conceptuales del diseo experimental y con ellos se
podr establecer el modelo y la tabla del ANDEVA.
El modelo estadstico correspondiente al ejemplo 7.1 se muestra en (7:1) inicialmente pensado como un diseo bifactorial pero con dos tipos de restricciones
a la aleatorizacin, por un lado la que da nombre al diseo en parcelas divididas respondiendo a la facilidad del manejo de los tratamientos, y por el otro,
la restriccin correspondiente al bloqueo del ruido debido a los das distintos de
elaboracin.

yijk =

Ri

Aj

+
ijk

RAij

N (0;

Bk
2

RBik

ABjk

RABijk

ijk

(7.1)

) independientes,

i = 1; : : : ; r; j = 1; : : : ; a; k = 1; : : : ; b;
donde representa un efecto medio general a todas las condiciones experimentales,
Ri representa el efecto de bloque(da); Aj el efecto del factor asignado a la
parcela (mtodo de coccin), RAij el efecto de interaccin R con A; Bk el efecto

7.1. Diseo en parcelas divididas

229

del factor que va a la subparcela (formulacin); RBik el efecto de interaccin de


R con B; ABjk el efecto de interaccin entre A y B; RABijk la interaccin triple
y ijk el error experimental.
Como se puede observar el trmino de error ijk est totalmente confundido
con el trmino de interaccin triple RABijk dado que no hay rplicas en este
0
contexto. Los efectos de bloque Ri s no se comparan entre s por las mismas
razones que en el caso de un diseo en bloques completamente aleatorizados. Por
otra parte, todos los trminos de interaccin del modelo que involucran al efecto
de bloque, es decir, RAij ; RBik y nuevamente RABijk , no son estrictamente
estimables dado que no existen replicaciones de cada bloque (de hecho esto no es
posible), y por ende, las sumas de cuadrados correspondientes pueden ser usadas
para estimar la variabilidad debida a los tipos de errores experimentales.
Si se denota por eij al error experimental de las parcelas en el bloque i se
puede mostrar que su varianza 2e es adecuadamente estimada por el cuadrado
medio derivado de la suma de cuadrados de la interaccin de bloque con el factor
que va a la parcela. Respecto a la varianza del error experimental de las subparcelas, denotada por 2" ; ser adecuadamente estimada mediante el cuadrado
medio derivado a partir de las sumas de cuadrados correspondientes a RBik y
RABijk . As el modelo correspondiente a un diseo en parcelas divididas en
bloques es:
yijk =

Ri

Aj

+ eij +

Bk

ABjk

"ijk

N (0;

2
")

independientes

eij

N (0;

2
e)

independientes

+ "ijk

(7.2)

i = 1; : : : ; r; j = 1; : : : ; a; k = 1; : : : ; b
De acuerdo a lo anterior, desde el punto de vista de cmputo de la tabla de
anlisis de varianza, se debe operar como un diseo trifactorial (bloque, factor A y
factor B); la diferencia estriba en que, si es plausible suponer que las interacciones
de cualquier factor con el factor bloque no existen, la suma de cuadrados de
bloque con el factor cuyos niveles se asignan a parcela se utiliza como la suma de
cuadrados de residual de la parcela. Las sumas de cuadrados de las interacciones
de bloque con el factor B y de bloque - factor A - factor B, ambas se suman y se
usan como la suma de cuadrados de residuales para la subparcela. Anlogamente
para los grados de libertad correspondientes. As la tabla de anlisis de varianza

230

7. Algunos diseos especiales

se muestra en la Tabla 7.2.


Fuente de
variacin
B lo q u e R
Fa c to r A
E rro r (p a rc e la )

Fa c to r B
Inte ra c c i n A B
E rro r (su b p a rc e la )

Grados de
libertad

Suma de
cuadrados

Cuadrado
medio

r 1
a 1
(r 1)(a

SCbloque
SCA
SCbloque

CMbloque
CMA
CMe

CMB
CMAB
CM"

1)

b 1
(a 1)(b 1)
a(b 1)(r 1)

SCB
SCAB
SCbloque

+ SCbloque

AB

Tabla 7.2 ANDEVA para el modelo de diseo de bloques


en parcelas divididas
Las hiptesis por contrastar son iguales a las de un bifactorial, las cuales se
muestran a continuacin junto con los cocientes F correspondientes:
Hiptesis

Fc

H0 :

A1

= ::: =

Aa

CMA
CMe

H0 :

B1

= ::: =

Bb

CMB
CM"

H0 :

AB11
2
"

La estimacin adecuada de
^ 2" = CM" =

= ::: =

ABab

CMAB
CM"

es

SCbloque
a(b

+ SCbloque
1)(r 1)

AB

Con el n de realizar inferencias para los parmetros en el modelo (7.2) es


necesario tener un estimador para la varianza 2e ; para ello se requiere obtener
las esperanzas de los cuadrados medios mostradas en la Tabla 7.2. La Tabla 7.3
proporciona estas esperanzas, estos resultados se pueden vericar utilizando los
procedimientos que se presentan en el apndice tcnico D. Con la informacin
proporcionada en la Tabla 7.3 se puede estimar la varianza debida a la parcela
2 ;a partir de E(CM ) = 2 + b 2 :
e
e
"
e
b2e =

CMe b2"
b

7.1. Diseo en parcelas divididas

Fuente de
variacin
Fa c to r A
E rro r

e (p a rc e la )

Fa c to r B
Inte ra c c i n A B
E rro r

"(su b p a rc e la )

231

E(CM )

Grados de
libertad

a 1
(r 1)(a

1)

b 1
(a 1)(b 1)
a(b 1)(r 1)

2
"
2
"

+b
+b

2
"
2
"
2
"

+
+

2
e
2
e

ra
b 1

rb
a 1

2
i Ai

2
i BiP

r
(a 1)(b 1)

2
Ai Bj

Tabla 7.3 Esperanzas de cuadrados medios para el modelo (7:2)

7.1.2

Cundo debe aplicarse este tipo de diseo?

El principio de parcelas divididas debe ser aplicado en las siguientes situaciones:


1. Cuando los tratamientos asociados con los niveles de uno o ms factores
requieren mayores cantidades de material experimental del que requieren
tratamientos de otros factores. Esto puede ser porque as se precisa por
cuestiones experimentales o por cuestiones prcticas en la realizacin fsica
del experimento. Tambin equivale en ciertos contextos a factores que son
difciles de cambiar durante el experimento (hard - to - change factors),
como el factor mtodo de coccin del Ejemplo 7.1.
2. Cuando un factor adicional es incorporado en un experimento para incrementar la base inferencial. Tal factor es asignado a las parcelas grandes.
Por ejemplo, en diseo robusto, un factor de ruido ira a la parcela. En el
Ejemplo 7.1 el mtodo de coccin as fue incluido en el experimento.
3. Cuando con informacin previa pueden conocerse diferencias grandes entre
los niveles de ciertos factores que las correspondientes entre otros. En este
caso, los tratamientos para los efectos donde diferencias grandes son esperadas pueden ser asignados al azar a las parcelas grandes simplemente como
una cuestin de conveniencia.
4. Cuando mayor precisin es deseada para las comparaciones entre ciertos
factores que para los otros. Esto es esencialmente lo mismo que en 3, pero
las razones pueden ser diferentes.
De esta forma a las subparcelas o subunidades se les asignan tratamientos
que:
Requieren menor cantidad de material experimental.

232

7. Algunos diseos especiales


Se espera que muestren diferencias menores.
Se desea mayor precisin en su anlisis.

En el Ejemplo 7.1, debido a lo anterior, los mtodos de coccin se asignaran


a las parcelas completas y las formulaciones a las subparcelas.
Ejemplo 7.1(continuacin)
Ilustremos lo anterior con datos, tomemos como referencia al Ejemplo 7.1 planteado al inicio de este captulo. Los datos se muestran en la Tabla 7.4, la variable
respuesta corresponde a la prdida de peso por coccin en gramos. La codicacin
es la siguiente: bloques (das) 1, 2, 3 (das); mtodos de coccin 1, 2, 3 (parcelas);
formulaciones 1 (control comercial), 2, 3 y 4 (subparcelas).
Bloque
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2

frmula
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2

mtodo
coccin
1
1
1
1
2
2
2
2
3
3
3
3
1
1
1
1
2
2

yijk

Bloque

frmula

30
35
37
36
34
41
38
42
29
26
33
36
28
32
40
41
31
36

2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3

3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

mtodo
coccin
2
2
3
3
3
3
1
1
1
1
2
2
2
2
3
3
3
3

yijk
42
40
31
30
32
40
31
37
41
40
35
40
39
44
32
34
39
45

Tabla 7.4 Prdida de peso por coccin de distintas


formulaciones y mtodos de coccin de jamn

yi

La estimacin del efecto de bloque (das) se obtiene por la expresin ^bloquei =


y , el efecto del mtodo de coccin (A) por: ^Aj = y j
y
y el efecto

7.1. Diseo en parcelas divididas

233

de formulacin (B) por: ^Ak = y k y , nalmente la interaccin entre bloque


y mtodo de coccin (residual parcela) se usa ^bloquei Aj = y ij
yi
y j +y
y entre mtodo de coccin y formulacin se obtiene con ^Aj Bk = y jk y j
y k +y . Con la nalidad de evaluar signicancias de estos efectos se construye
la tabla del ANDEVA como se muestra en la Tabla 7.5 sta se obtiene aplicando
las expresiones de suma de cuadrados a estos efectos, stas se presentaron en los
captulos 2 y 4, aqu slo nos interesa su adecuada interpretacin. La construccin
de sta se solicita en el Ejercicio 7.2.
Fuente de
variacin
Bloques (das)
Mtodo de coccin
Residual parcela (e)
Formulacin
Interaccin
Residual subparcela (")

Grados de
libertad

Suma
de cuadrados

Cuadrado
medio

2
2
4
3
6
18

77:556
128:389
36:278
434:083
75:167
71:500

38:778
64:194
9:069
144:694
12:528
3:972

Fc

Valor p

7:07

0:049

36:43
3:15

0:000
0:027

Tabla 7.5 ANDEVA para datos de formulaciones y


mtodos de coccin de jamn
Existen cinco posibilidades de continuar con la inferencia estadstica en un
diseo en parcelas divididas, si resulta que no se detect efecto de interaccin
entre los dos factores de inters, corresponde entonces comparar medias de cada
factor en lo individual, para ello utilice los resultados de la Tabla 7.6.

Diferencia
k0

k
j

Intervalo de conanza

y
y

k
j

y
y

k0
j0

t(a(b
t((r

1)(r
1)(a

q
"
1); =2) 2CM
ra
q
e
1); =2) 2CM
rb

Tabla 7.6 Intervalos de conanza para comparaciones de medias


en parcelas divididas
Si resulta que estadsticamente existe interaccin entre los dos factores de inters, las comparaciones de medias se juzgan a travs de los intervalos de conanza
en la Tabla 7.7.

234

7. Algunos diseos especiales

Fig. 7.1: Grca de interacciones entre formulacin y mtodo de coccin

Diferencia

Intervalo de conanza

jk

jk0

jk

jk0

jk

j0k

jk

j0k

jk

j 0 k0

jk

j 0 k0

t(a(r 1)(b 1); =2; )


q
2(CMe +(b 1)CM" )
t
rb
q
2CMe +(b 1)CM"
t
rb

2CM"
r

Tabla 7.7 Intervalos de conanza para comparaciones de medias en


parcelas divididas en bloques con interaccin
donde
t =

(b

1)CM" t(gl" ; =2) + CMe t(gle ;


(b 1)CM" + CMe

=2)

y gl" = a(b 1)(r 1); y gle = (a 1)(r 1): Por supuesto si son muchas
comparaciones por realizar es preferible utilizar los cuantiles de la estadstica de
la prueba de Tukey mencionada en el captulo 3.
En las Figs.7.1, 7.2 y 7.3 se muestran las grcas de interaccin y de efectos
principales del Ejemplo 7.1. Analice tales grcas y realice las comparaciones de
inters.

7.2

Experimentos con mediciones repetidas en el tiempo

En muchos experimentos el inters fundamental es comparar los efectos de distintos tratamientos sobre una variable respuesta pero a lo largo de un intervalo

7.2. Experimentos con mediciones repetidas en el tiempo

Fig. 7.2: Grca de efectos principales de formulaciones

Fig. 7.3: Grca de efectos principales de mtodos de coccin

235

236

7. Algunos diseos especiales

de tiempo, esto equivale a medir repetidamente la respuesta en cada una de las


UE en el experimento. Para jar ideas consideremos el siguiente ejemplo.
Ejemplo 7.2
El crecimiento de galletas durante su cocinado est inuenciado por el tipo de
harina y el edulcorante utilizado en la masa de la galleta, la cual gradualmente
crece en dimetro durante el cocinado hasta alcanzar su dimetro mximo. La
tasa de crecimiento es de inters en este estudio; los datos se muestran en la Tabla
7.8. Representan mediciones de tres galletas por tipo de producto realizadas
cada minuto, empezando en cero minutos y terminando al minuto 6. Cada galleta de cada producto fue independientemente formulada, es decir cada galleta
proviene de un lote de produccin diferente, pero las mediciones en el tiempo son
mediciones repetidas sobre la misma galleta. Antes de resolver este ejemplo, se
mostrar la metodologa del anlisis.
Corrida

t0
t1
t2
producto control

1
2
3

t4

t5

t6

62:10 63:08 66:99 72:86


61:72 62:21 67:31 72:90
61:98 63:19 67:59 74:18
producto con fructuosa

76:28
76:79
78:08

80:68
79:95
81:74

85:57
84:08
85:89

1
2
3

59:41 63:78 67:66 72:51


60:62 62:31 66:65 72:21
60:62 62:31 67:39 72:69
producto con glucosa

77:36
76:79
78:00

79:78
79:93
81:14

80:75
82:11
82:83

1
2
3

59:65 62:08 65:47 70:81


61:34 63:27 66:17 70:76
61:23 62:92 68:00 74:29
producto con trigo

76:14
76:55
78:89

80:02
80:90
82:04

81:96
82:35
83:97

1
2
3

60:61 62:05 65:42 70:71


60:94 62:62 65:49 71:19
61:74 63:21 67:13 72:52
producto con sacarosa

74:79
74:57
76:19

76:96
77:44
79:13

78:40
79:35
81:83

1
2
3

62:02
60:98
60:11

78:81
77:20
76:88

83:94
82:28
81:91

87:59
87:36
85:50

63:19
61:47
61:79

68:07
64:85
65:14

t3

72:96
71:15
71:13

Tabla 7.8 Dimetros (mm) para el experimento de crecimiento de galletas


(Milliken, 1990)

7.2. Experimentos con mediciones repetidas en el tiempo

237

Fig. 7.4: Tendencias en el tiempo del crecimiento del dimetro de galletas, por
frmulacin
Anlisis de la varianza
El ANDEVA se puede construir usando las suposiciones estndar correspondientes a un diseo en parcelas divididas, donde la parcela es una galleta y las
subparcelas pueden pensarse como producto de las mediciones realizadas en el
tiempo. El tratamiento de la parcela es el tipo de edulcorante, el tratamiento de
la subparcela el tiempo - note que el tiempo en este caso no puede ser aleatorizado dentro de la parcela -. Por otra parte, hay que notar que la suposicin
de independencia entre los errores dentro de la parcela puede ser no realista,
dado la posible correlacin temporal de las mediciones sobre la misma galleta.
Sin embargo si se supone que la correlacin temporal de errores dentro de cada
parcela se mantiene constante, el anlisis estndar tipo parcelas divididas ser
adecuado. Si tal supuesto no es razonable, aun tomando en cuenta los ajustes a
las pruebas estadsticas correspondientes (vase Milliken, 1990), dado el inters
por comparar tendencias en el tiempo se cree que es ms conveniente otro enfoque
para el anlisis estadstico de este tipo de experimentos.
Observando la Fig. 7.4 se puede apreciar que el crecimiento promedio del
dimetro en el tiempo es aproximadamente lineal en todos los tipos de productos,
y por ende el inters sera comparar los interceptos y las pendientes de las lneas
de crecimiento. As, si denotamos por yijk al dimetro de la gallega j bajo el
edulcorante i al tiempo k, se puede pensar que
yijk =

ij

ij Tk

+ sij +

ijk

donde i = 1; :::; m, j = 1; :::; n, k = 1; :::; d, Tk representa el k-simo tiempo, sij


representan los errores del sujeto (que induce la llamada variacin intraindividual,
pero dados los alcances de este libro, se supone como no importante; de ser

238

7. Algunos diseos especiales

importante la variacin intraindividual se requiere un tratamiento especco, ver


por ejemplo: Verbeke y Molenberghs, 2000), ijk los errores correspondientes a
los intervalos de tiempo, ij y ij denotan el intercepto y la pendiente de la recta
de regresin para el sujeto j del tratamiento i, cuyo manejo se ver con mayor
detalle en
n elocaptulo 8. Utilizando los interceptos y las pendientes estimados,
f^ ij g y ^ ij ; respectivamente, se puede pensar que
^ ij =

+ uij ; ^ ij =

+ rij

donde i representa el efecto medio del edulcorante i sobre la pendiente del crecimiento estimado de la galleta j, i el efecto del edulcorante i sobre el intercepto
del crecimiento estimado de la galleta j, con fuij g y frij g errores con varianzas
constantes respectivamente. As, vericar estadsticamente
H0 :

= ::: =

vs Ha : no H0

es equivalente a vericar la hiptesis de nula interaccin del tratamiento con el


tiempo, dado que la relacin entre la respuesta y el tiempo es lineal. Si las lneas
son paralelas (pendientes iguales, H0 se acepta),
H0 :

= ::: =

vs Ha : no H0

equivalente a vericar estadsticamente si hay igualdad de efectos de tratamientos.


De esta manera para cada galleta (sujeto) de cada tipo de producto (tratamiento)
se puede estimar los parmetros de la recta correspondiente, va estimacin por
mnimos cuadrados como se muestra a continuacin:

ij

d
P

(Tk

T )(yijk

k=1
d
P

yij )
; i = 1; :::; m; j = 1; :::; n

(Tk

T )2

k=1

^ ij = yij

^ T ; i = 1; :::; m; j = 1; :::; n
ij

Solucin del ejemplo 7.2


Los resultados se muestran en la Tabla 7.9.

7.2. Experimentos con mediciones repetidas en el tiempo


Producto(i)
Control

Fructuosa

Glucosa

Trigo

Sacarosa

Galleta(j)
1
2
3
1
2
3
1
2
3
1
2
3
1
2
3

Pendiente( ^ ij )
4:10357
4:00143
4:26143
3:77571
3:92321
4:10357
4:05286
3:88107
4:19107
3:30571
3:35536
3:61321
4:60536
4:75393
4:57679

239

Intercepto(^ ij )
60:1979
60:1329
60:4514
60:2800
59:7475
59:8293
58:7171
59:9768
60:4754
59:9314
60:1625
60:8389
59:9811
57:9225
58:0496

Tabla 7.9 Pendientes e interceptos estimados


Realizando los cmputos, las ANDEVA correspondientes se muestran en las
Tablas 7.10 y 7.11.
Fuente de
variacin
Producto
Error
Total
Fuente de
variacin
Producto
Error
Total

Grados de
libertad
4
10
14

Suma de
cuadrados
2:2882
0:2091
2:4973

Cuadrados
medios
0:5720
0:0209

Fc

Valor p

27:36

0:000

Tabla 7.10 ANDEVA para pendientes


Grados de Suma de
Cuadrados Fc
libertad
cuadrados medios
4
5:461
1:365
2:75
10
4:970
0:497
14
10:431

valor p
0:089

Tabla 7.11 ANDEVA para interceptos


Como se aprecia en las tablas anteriores, s existen diferencias estadsticas
entre las pendientes de los diferentes productos. Slo para completar el anlisis
la Tabla 7.11 se presenta. La Tabla 7.12 contiene los intervalos de conanza
construidos con el estadstico de Tukey, con una tasa de error por familia
=
0:05, tasa de error individual = 0:00815, valor crtico = 4:65.

240

7. Algunos diseos especiales

Fructuosa
Glucosa
Trigo
Sacarosa

Control
0:2002
0:5762
0:3077
0:4687
0:3092
1:0856
0:9114
0:1350

Fructuosa

Glucosa

Trigo

0:4957
0:2807
0:1212
0:8976
1:0994
0:3230

0:2287
1:0051
0:9919
0:2155

1:6088
0:8324

Tabla 7.12 Intervalos de conanza de comparaciones mltiples mediante la prueba de Tukey

Como se puede apreciar en la Tabla 7.12 la sacarosa se considera diferente


de los dems con una pendiente ms grande; el control, la glucosa y la fructuosa
se consideran estadsticamente similares y el trigo con una tasa estadsticamente
diferente y menor de crecimiento.
En lo anterior se ha supuesto que la relacin entre la variable respuesta y
el tiempo para todos los tratamientos es aproximadamente una lnea recta. Si
resultara que la relacin entre la variable respuesta y el tiempo para todos los
tratamientos fuera no lineal en el tiempo, pero comn a todos los tratamientos, mediante el uso de polinomios de orden mayor a uno se podra intentar el
ajuste; el enfoque de anlisis estadstico presentado en esta seccin es directamente aplicable comparando los coecientes correspondientes al mismo orden.

7.3

Diseos que involucran anidamiento

Efectos anidados pueden ocurrir tanto en la estructura de tratamientos como en


la estructura de un diseo experimental. En general el anidamiento est presente
cuando en la estructura existe una jerarqua tal que los niveles inferiores de la
jerarqua no siempre son los mismos al cambiar en el nivel superior de la misma.
As, para que exista anidamiento en la estructura de tratamientos, en primer
lugar debe haber al menos dos factores, digamos A y B, pero tales que cada nivel
de A ocurra con slo un nivel del factor B. En este caso se dice que los niveles del
factor A estn anidados en los niveles del factor B. Por otro lado, en la estructura
de diseo el anidamiento se da cuando existen al menos dos tamaos de UE, como
fue el caso del diseo en parcelas divididas mencionado anteriormente.

7.3. Diseos que involucran anidamiento

241

Fig. 7.5: Descripcin de un experimento anidado.


Ejemplo 7.3
Suponga que se tienen cuatro lotes: L1 , L2 , L3 , L4 , de cada uno de tres conservadores comerciales: C1 , C2 y C3 ; la variable respuesta de inters es la acidez
de un producto alimenticio al que es adicionado un conservador. Cada combinacin conservador - lote es adicionada a n unidades de producto. El diseo
esquemticamente Fig 7.5.
En este caso se tienen dos factores, el factor jo conservador y el factor aleatorio lote. Las diferencias entre los efectos de C1 , C2 y C3 se debern en parte a
las diferencias entre los efectos especcos de los lotes; sin embargo, los efectos
de lote estn anidados en un nivel del factor conservador, ya que el lote L1 del
conservador 1 no es el lote L1 del conservador C2 y C3 , etc. El anidamiento implica en este caso que no sea posible pensar en evaluar la interaccin entre lotes
y conservadores, si esto fuera el inters del experimentador.
Metodologa del anlisis estadstico
Denotemos por Ci el efecto del conservador i, y por Lj(i) el efecto anidado
del lote j en el conservador i. De esta manera el trmino correspondiente a la
interaccin CLi;j(i) no aparecer en el modelo correspondiente al diseo de este
tipo de experimentos.
El modelo estadstico para el ejemplo 7.3 es representado como:

yijk =

Ci

Lj(i)

k(ij)

i = 1; : : : ; a; j = 1; : : : ; b; k = 1; : : : ; n

La tabla de anlisis de varianza correspondiente involucra el cmputo de las

242

7. Algunos diseos especiales

siguientes cantidades:
X 2
SCC = n
bbCi ; a

1 grados de libertad

SCL(C) = n

a X
b
X

^2

^L

Lj(i) ;

j(i)

= yij

yi

a(b

1) grados de libertad

i=1 j=1

SCerror =

(yijk

yij )2 ;

(yijk

ab(n

1) grados de libertad

i;j;k

SCtotal =

)2 ;

abn

1 grados de libertad

i;j;k

Hay que sealar, dado que en este ejemplo el conservador se considera como
un factor jo, mientras que el factor lote se considera aleatorio, las esperanzas de
cuadrados medios correspondientes son:
2
"
2
"
2
"

Ci
Lj(i)
"k(ij)

2
L(C)
2
L(C)

+n
+n

Las hiptesis globales a contrastar sern:


H01 :

C1

H02 :

C2

2
L(C)

C3

=0

As la tabla de anlisis de varianza se muestra en la Tabla 7.12.


Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Cuadrados
medios

Fc

SCC
(a 1)
SC
CML(C) = a(bL(C)
1)
SCerror
CMerror = ab(n
1)

CMC
CML(C)
CML(C)
CMerror

C(H01 )

(a

1)

SCC

L(C) (H02 )

a(b

1)

SCL(C)

Error

ab(n

1)

SCerror

Total

abn

SCtotal

CMC =

Tabla 7.12 ANDEVA para un factor anidado en otro


La Tabla 7.12 es aplicable tambin en el caso en que el factor no anidado se
considere aleatorio, slo anlogamente modicando la interpretacin de H01 . En

7.3. Diseos que involucran anidamiento

243

el caso en que ambos factores bajo estudio se consideren jos, los cocientes F
tendrn como denominador al CMerror . Vanse los apndices tcnicos B y D;
otra referencia para calcular las sumas de cuadrados es Neter, et al. (1996).
Solucin del ejemplo 7.3
Continuando con el ejemplo introductorio, suponga que al realizar el experimento
los datos generados sobre la acidez del producto son los siguientes (n = 3):

C1

C2

C3

L1

L2

L3

L4

L1

L2

L3

L4

L1

L2

L3

L4

111
109
110

108
107
106

108
110
111

111
114
110

111
108
107

110
114
112

109
110
108

110
113
112

112
114
110

108
110
112

109
109
112

113
112
111

La tabla de anlisis de varianza correspondiente es la Tabla 7.13.


Fuente de
variacin
C
L anidado en C
error
total

Grados de
libertad
2
9
24
35

Suma de
cuadrados
12:06
72:916
64:666
149:639

Cuadrados
medios
6:03
8:10
2:69

Fc

Valor p

0:74
3:00

0:502
0:015

Tabla 7.13 ANDEVA para el Ejemplo 7.3


Se aprecia que estadsticamente no es fuerte la diferencia de efectos de los
conservadores; sin embargo en cada conservador se aprecian ciertas indicaciones
sobre diferencias entre los lotes correspondientes. En este sentido, cualquier conservador es bueno para controlar la acidez, pero habr que cuidar la homogeneidad
de los lotes recibidos.
Finalmente, el ejemplo presentado representa a dos factores que son, uno
anidado en otro. Cuando hay ms factores, si el anidamiento se da en un subconjunto de los factores y una estructura factorial sin anidamiento en los restantes,
el anlisis estadstico es similar al anlisis de diseos factoriales, slo teniendo
cuidado en las interacciones presentes. Para ms detalles vea Hicks (1986) o
Montgomery (1991).

244

7. Algunos diseos especiales

Ejemplo 7.4
Un experimento fue realizado para estudiar los efectos de tres niveles de temperatura ambiente (18, 23 y 28 grados centgrados) y del gnero (femenino y
masculino) sobre el confort personal. Las tres temperaturas fueron aleatoriamente asignadas a tres de nueve cmaras ambientales disponibles. Una cmara
es entonces la UE para la temperatura, teniendo as un diseo experimental de
un factor (la temperatura) completamente aleatorizado en las cmaras. Por otra
parte se tuvieron 36 voluntarios, 18 mujeres y 18 hombres para realizar el experimento; ellos fueron asignados a las cmaras de tal forma que ambos sexos siempre
estuvieran presentes en cada cmara con dos rplicas, es decir, en cada cmara 2
mujeres y 2 hombres. La UE para gnero es una persona y el diseo experimental
correspondiente para el gnero es un diseo experimental de un factor (gnero)
completamente aleatorizado en bloques (cmaras). Realizado el experimento, la
variable respuesta midi el confort personal en una escala del 1 al 15, 1 representando sensacin de fro, 8 sensacin confortable y 15 sensacin de calor. Los
datos se muestran en la Tabla 7.14.
T : Temp
18
23
28

G: Gnero
hombre
mujer
hombre
mujer
hombre
mujer

C: Cmara
5
4
1
2
8
8
10 7
12 8
11 13

C1

Cmara
5 4
5 5
6 3
8 8
8 7
8 8

C2

Cmara
4 2
1 3
5 7
8 8
6 6
6 7

C3

Tabla 7.14 Datos del Ejemplo 7.4


Planteamiento del anlisis estadstico
En este experimento hay dos anidamientos, las cmaras anidadas en temperaturas
y las personas del mismo gnero anidadas en cmaras. Por otra parte el factor
temperatura y el factor gnero son factores jos, mientras que las cmaras se
consideran como un factor aleatorio. Se pueden visualizar dos UEs y por ende
surgirn dos trminos de error. Por lo tanto, el modelo estadstico es el siguiente:
yijlm =

Ti

Gl

T Gil

Cj(i)

m(ijl)

i = 1; 2; 3; l = 1; 2; j = 1; 2; 3; m = 1; 2
donde Ti representa el efecto de la temperatura i;
gnero l; T Gil representa el efecto de interaccin;

representa el efecto del


Cj(i) el efecto anidado de la
Gl

7.3. Diseos que involucran anidamiento

245

cmara j con la temperatura i, y m(ijl) el efecto de la persona m del gnero l en


la cmara j sujeta a temperatura i: Ntese que no est incluido en el modelo el
trmino de interaccin GClj(i) , suponindolo no importante. Se supone adems
el efecto de cmara es aleatorio, es decir, que los trminos Cj(i) son tales que:
2
C)

N (0;

Cj(i)

independientes e idnticamente distribuidos, y que los trminos


que,
N (0; 2 )
m(ijl)

m(ijl)

son tales

independientes e idnticamente distribuidos; tambin se supone que: f Cj(i) g y


o
n
m(ijl) son independientes entre s. Las hiptesis globales a contrastar son:
H01 :

T1

H02 :

G1

H03 :
H04 :

T2

T Gil

2
C

G2

T3

temperaturas

gnero

iguales para cada il interaccin temperatura - gnero

= 0 cmaras

Del modelo presentado, es entonces fcil derivar las esperanzas de los cuadrados medios correspondientes a cada trmino en el modelo (ver Apndice D); stas
resultan ser como se muestran a continuacin:

Ti
Gl
T Gil
Cj(i)
m(ijl)

+4

+4

2
C

G
TG
2
C

La tabla ANDEVA correspondiente se construye con las expresiones siguientes:


SCT = cbr

a
X
i=1

donde:

b2

Ti

SCG = acr

b
X
l=1

bC

j(i)

b2

= y ij

SCC(T ) = br

Gl

a X
c
X
i=1 j=1

yi

b2

Cj(i)

(7.3)

246

7. Algunos diseos especiales

SCT G =

a X
b
X
i=1 l=1

donde:
bT G = y
i
i l

b2

yi

(7.4)

Ti Gl

yi

+ yi

En el Ejemplo 7.4, los cmputos son los siguientes:


T
yi
G
y l
TG
yi l
C(T1 )y 1j
C(T2 )y 2j
C(T3 )y 3j
y

1
3:42
1
6:00
11
4:00
3:00
8:25
11:0
6:31

2
7:17
2
6:61
12
2:83
4:75
6:25
7:75

3
8:33

yi

y
21
6:16
2:50
7:00
6:25

22
8:16

31
7:83

32
8:83
y 1j
y 2j
y 3j

y1
y2
y3

Tabla 7.15 Promedios en los niveles de los factores


Aplicando las expresiones (7.3) y (7.4) para el efecto de cmara anidado en
tratamiento, se tiene:

SCC(T ) = 2
=

2(0:18 + 1:77 + 0:85 + 1:17 + 0:85 + 0:03 + 7:13 + 0:34 + 4:33)

4(16:63) = 66:50; con (3-1)(3) = 6 grados de libertad

As la ANDEVA se muestra en la Tabla 7.16.


Fuente de
variacin
Temperatura T
Gnero G
TG
Cmara(C)
Error
Total

Grados de
libertad
2
1
2
6
24
35

Suma de
cuadrados
158:07
3:35
15:72
66:50
40:00

Cuadrados
medios
79:04
3:35
7:86
11:08
1:67

Fc

Valor p

7:14
2:17
4:75
6:71

0:0200
0:1200
0:0200
0:0003

Tabla 7.16 ANDEVA para el modelo de diseo de lote anidado en conservador.

7.4. Sobre errores de restriccin en la aleatorizacin

247

Los grados de libertad de esta tabla: en el error 24= 18+6. 18 grados de


libertad del trmino m(ijl) [(2 1) (3 2 3) = 18] y 6 del trmino GClj(i)
[(2 1) (3 1) 3 = 6] :
Ntese que a partir de las esperanzas de cuadrados medios, se pueden estimar
(por el mtodo de momentos) las varianzas 2 y 2C (componentes de varianza).
En este caso stas se estiman como:
^ 2 = 1:65

^ 2C = 2:36

Ntese adems que el error de las unidades pequeas incluye en sus 24 grados
de libertad a 8 grados de libertad de la interaccin GClj(i) y su suma de cuadrados
a la suma de cuadrados correspondiente. Interprete los resultados de la tabla
anterior y saque conclusiones.

7.4

Sobre errores de restriccin en la aleatorizacin

Los errores de restriccin son trminos que deben ser incluidos en los modelos
estadsticos correspondientes a diseos experimentales en los que existan restricciones en la aleatorizacin de tratamientos para poder realizar inferencia estadstica correcta. As deben incluirse tantos trminos de error de restriccin, como
tipos de UE resultantes de las restricciones presentes. Por ejemplo, como ya
se ha visto, en un diseo en bloques completamente aleatorizados se tendr un
error de restriccin debido a cada bloque, mientras que en un diseo en bloques
en parcelas divididas se tendrn trminos de error para cada bloque y para cada
parcela.
As un error de restriccin es comn a un grupo de UE aisladas por el procedimiento experimental. Es aleatorio en el sentido de que si el experimentador
quisiera recrear el mismo grupo de UE, este grupo sera diferente. La inclusin
de los errores de restriccin pertinentes permite claricar qu hiptesis son contrastables bajo el diseo experimental considerado. Recuerde que identicar las
hiptesis que son contrastables requiere del clculo de las esperanzas de cuadrados
medios; cuando hay restricciones en la aleatorizacin de tratamientos, pero no se
identican a los errores de restriccin en el modelo, las esperanzas de cuadrados
medios identicarn incorrectamente qu hiptesis son contrastables en general.
Para jar ideas consideremos un experimento realizado como un diseo de un
factor completamente aleatorizado en bloques completos. En este caso hay una
restriccin, la formacin de bloques de UE homogneas en su respuesta, antes de
aplicar aleatoriamente a los tratamientos. El modelo estadstico sin errores de
restriccin como se recordar es:

248

7. Algunos diseos especiales

yij

"(ij)

+
N (0;

Bi + Aj + "(ij)
2
" ); i = 1; :::; b;

j = 1; :::; t

donde Bi representa el efecto del bloque i y Aj representa el efecto del nivel j del
factor de inters. Utilizando las reglas para calcular las esperanzas de cuadrados
medios resultara que la hiptesis:
H0 :

B1

= ::: =

(7.5)

Bb

sera contrastable, sin embargo, si consideramos el modelo estadstico con los


errores debidos a la restriccin de formar previamente los bloques:
yij

Bi

i = 1; :::; b;

j(i)

Al

+ "k(ijl)

l = 1; :::; t;

j = 1; k = 1

donde l(Bi ) es el error de restriccin debido al bloque i, las esperanzas de cuadrados medios:

Bi

a
R
i
1

1
R
j
1

t
F
l
t

1
R
k
1

j(i)

Al

"k(ijl)

esperanza de cuadrados medios


2+t 2+t 2
"
B
2
"
2
"
2
"

+t

+a

indicarn claramente que la hiptesis (7.5) no es vericable con este diseo experimental.
En el caso de un experimento pensado como un diseo de dos factores (A y
T ) en parcelas divididas y en bloques (B), el modelo con errores de restriccin
es:
yijk =

+
Tk

i = 1; :::; a;

Bi

l = 1;

BTik

Aj

ATjk

l(Bi )

j = 1; :::; b;

BAij

BATijk

+ ! p(ij) +
+

(7.6)

m(ijk)

k = 1; :::; c; p = 1; m = 1

En este caso l(Bi ) es el error de restriccin l de las unidades en el bloque


i; mientras que ! p(ij) corresponde al error de restriccin p de las unidades en el
bloque i; a las que les fue asignado el nivel j de A aplicado a la parcela.

7.5. Ejercicios

249

En la Tabla 7.17 se muestra el clculo de la esperanza de los cuadrados medios


para el modelo (7.6). En el apndice D se presentan las reglas para obtener estas
esperanzas.

Bi

a
R
i
1

b
F
j
b

1
R
l
1

1
R
p
1

c
F
k
c

Aj

l(Bi )

BAij

$p(ij)

Tk

BTik

ATjk

BATijk

"(ijk)

Esperanza de cuadrados medios


2 + c 2 + bc 2 + bc 2
"
$
B
2
"
2
"
2
"
2
"
2
"
2
"
2
"
2
"
2
"

2 +
$
bc 2

+c
+

+c
+c
+b
+b
+
+

2
BA

+ ac

2 +c 2
$
BA
2
$
2 + ab
T
BT
2
BT
2
BAT
2
BAT

+a

AT

Tabla 7.17 Esperanzas de los cuadrados medios en


un diseo en parcelas divididas
De la Tabla 7.16 se puede apreciar que B (bloques) y todas las interacciones
en las que se involucra no son contrastables. Suponiendo que las interacciones que
involucran bloques son nulas, A debe ser contrastada versus el cuadrado medio
de AB; T versus el de BT , y AT versus el de BAT: En algunos contextos es
costumbre sumar las sumas de cuadrados y los grados de libertad nominalmente
pertenecientes a BT y BAT para usar el cuadrado medio resultante como el
denominador para contrastar T y AT .

7.5

Ejercicios

Ejercicio 7.1 Los datos en la tabla siguiente muestran las tasas cardacas (pulsos por minutos) de pacientes sujetos a cuatro drogas. A los 20 sujetos masculinos les fueron asignadas aleatoriamente una droga de las cuatro, lo que nos da
cinco sujetos por droga. El tiempo de medicin fue cada cinco minutos, siendo
la primera medicin a los cinco minutos de la administracin. Existe interaccin entre el factor tratamiento y el tiempo? Los tratamientos son diferentes
estadsticamente?

250

7. Algunos diseos especiales

Tratamiento
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4

Sujeto
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

t1
73
78
73
75
75
72
77
72
77
74
79
73
68
75
72
78
78
78
71
80

t2
74
77
73
72
74
74
77
74
80
75
80
76
68
77
74
82
81
80
75
83

t3
74
76
74
73
73
76
78
78
78
75
81
74
74
80
81
83
81
81
76
86

t4
78
79
78
74
78
80
81
80
83
80
83
81
75
81
79
87
85
82
80
86

t5
79
84
81
79
82
81
85
84
85
84
83
79
76
85
82
91
89
87
85
90

t6
81
88
81
82
84
83
86
86
86
85
83
82
78
89
83
92
92
87
85
90

t7
79
86
79
80
82
81
84
84
84
83
82
81
77
88
82
87
87
82
80
85

Datos de tasas cardiacas medidas cada cinco


minutos en siete intervalos de tiempo
Ejercicio 7.2
1. Construya la Tabla 7.4. A continuacin se proporcionan las expresiones. La
tabla ANDEVA correspondiente se construye con las expresiones siguientes:
SCB = a

r
X
i=1

donde bf actor = y niveles


SCAB = r

a X
b
X
l=1 k=1

y
b2

b2

Ri

SCA = r

l=1

Al Bk

a
X

bA B = y
lk
l k

b2

Al

yl

+y

Ejercicio 7.3. Usando los datos presentados en el Ejemplo 7.2, estime los intervalos conanza descritos en la Tabla 7.5 y 7.6 para comparaciones de inters.

7.5. Ejercicios

251

Ejercicio 7.4 En el estudio de un sistema de medicin se seleccionan al azar


seis botellas. A continuacin se realizan las mediciones de la concentracin de
una substancia en tres muestras aleatorias que se toman en cada botella. Los
datos reportados por el operador se describen en la siguiente tabla:
Botellas

1
7:86
6:45
7:68

2
16:25
15:98
15:70

3
10:87
10:40
8:45

4
9:50
5:83
7:45

5
7:12
7:45
7:12

6
9:05
11:10
7:80

Observe que en este caso no es de inters comparar la diferencia entre las


botellas. Aqu la medicin de la substancia est anidada en la botella. Esto da
lugar a un modelo de componentes de varianza, as la pregunta a responder es
sobre la signicancia estadstica de la componente relacionada con la muestra,
entonces la hiptesis estadstica es:
Ho :
H1 :

2
B
2
B

=0
6= 0

1. Presente en la siguiente tabla un resumen estadstico de la medicin en cada


botella.
Botella
1
2
3
4
5
6
Promedio total
Varianza total

Repeticiones

Media

Varianza

2. Complete la siguiente Tabla del ANDEVA para contrastar la hiptesis mencionada.


Fuente de
variacin
Botellas
Error
Total

Grados de
libertad

Suma de
cuadrados

Cuadrado
medio

Componentes
de varianza

Porcentaje

Tabla del ANDEVA y las componentes de varianza


3. Interprete sus resultados.

252

7. Algunos diseos especiales

Ejercicio 7.5 En una tenera llevan un control en el sistema de medicin para


la elongacin de la piel. De cada uno de los once lotes (L) de produccin diarios
toman tres muestras de piel (P ) de manera aleatoria y le hacen dos mediciones
(M 1 y M 2). Los resultados reportados por el laboratorio de mediciones son:

L
1
1
1
2
2
2
3
3
3
4
4

P
1
2
3
1
2
3
1
2
3
1
2

M1
69
66
51
62
68
60
71
53
65
53
51

M2
70
65
48
61
70
61
69
51
61
54
52

L
4
5
5
5
6
6
6
7
7
7
8

P
3
1
2
3
1
2
3
1
2
3
1

M1
59
53
60
63
55
48
57
60
65
58
73

M2
60
50
61
62
51
52
59
61
66
56
75

L
8
8
9
9
9
10
10
10
11
11
11

P
2
3
1
2
3
1
2
3
1
2
3

M1
71
63
64
63
49
51
57
55
78
50
59

M2
75
65
65
60
47
50
58
56
78
52
58

En esta situacin se tienen datos en un esquema balanceado en dos estratos


de anidamiento. Las mediciones estn anidadas en las pieles y stas en lotes.

1. Presente en una tabla el resumen estadstico, en cada rengln represente un


lote y en cada columna una muestra de piel.
2. Construya una tabla del ANDEVA similar a la del ejercicio anterior.
3. Interprete sus resultados.

Ejercicio 7.6 Una aplicacin de los diseos anidados se presenta en los estudios
de medicin para evaluar la repetibilidad y reproducibilidad. Este tipo de estudio
se denomina R&R. En un estudio R&R dos ingenieros qumicos (operadores: O)
realizan 10 pruebas (P ) para medir el volumen (peso agua/densidad), adems
realizan una repeticin (R) en cada medicin. El rango de especicaciones es:
0-30, es decir que la tolerancia es 30. Por lo tanto decimos que las mediciones
(repeticiones) estn anidadas en el operador y el operador anidado en las pruebas.
Los resultados del experimento de medicin son:

7.5. Ejercicios

P
1
1
1
1
2
2
2
2
3
3

O
1
1
2
2
1
1
2
2
1
1

R
1
2
1
2
1
2
1
2
1
2

253

M
19
21
24
19
16
15
16
15
10
12

P
3
3
4
4
4
4
5
5
5
5

O
2
2
1
1
2
2
1
1
2
2

R
1
2
1
2
1
2
1
2
1
2

M
13
13
12
12
12
13
24
28
26
27

P
6
6
6
6
7
7
7
7
8
8

O
1
1
2
2
1
1
2
2
1
1

R
1
2
1
2
1
2
1
2
1
2

M
21
20
18
20
13
10
13
15
15
16

P
8
8
9
9
9
9
10
10
10
10

O
2
2
1
1
2
2
1
1
2
2

R
1
2
1
2
1
2
1
2
1
2

M
17
17
19
16
16
15
22
24
24
23

1. Complete la siguiente Tabla del ANDEVA:


Fuente de
variacin
Piezas
Operadores
Error
Total

Grados de
libertad

Suma de
cuadrados

Cuadrado
medio

Fc

Valor p

2. Con el propsito de mostrar la terminologa en los estudios R&R se describen las componentes de varianza que son relevantes en este tipo de
estudio.
Componentes de varianza Estimadores
2 repetibilidad
"
2
P
2
o
2
2
2
R&R = o + "

CMerror
CMP

CMerror
qt
CMo CMerror
nt
CMo +(nt 1)CMerror
nt

3. Por lo general, los estudios R&R se representan en porcentaje. Con la


informacin de los incisos anteriores complete la siguiente informacin:
%Repetibilidad = 100

5:15(b" )
=
T olerancia

%Reproducibilidad = 100
%R&R= 100

5:15(bO )
=
T olerancia

5:15(bR&R )
=
T olerancia

254

7. Algunos diseos especiales

Ejercicio 7.7 En la industria de la curtidura se tiene una frmula para evaluar


la adherencia de una sustancia a la piel. Con n de encontrar una nueva frmula
que resulte ms eciente y a un menor costo, una empresa curtidora se plantea
desarrollar una nueva formulacin. Cuatro factores son relevantes en este nuevo
desarrollo y se considera que cada factor tienen dos niveles. La combinacin de
los niveles de estos factores dan lugar a la frmula, sta se aplica a dos diferentes
tipos de piel, ste da lugar a un quinto factor. En el experimento primero se
aleatorizaron los tratamientos del diseo completo, cada uno de stos se aplic
aleatoriamente a cada tipo de piel. Esta estrategia es un caso particular del
principio de parcelas divididas. En la tabla se muestra el diseo y los resultados:
Tratamiento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

B
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

C
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

D
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1

y [E :

1]
4:5
9:9
6:6
8:2
5:3
8:8
5:1
9:0
8:7
8:1
9:6
9:4
7:8
8:6
8:8
8:9

y [E : 1]
5:8
9:6
7:3
7:8
6:4
8:3
6:4
8:8
9:7
7:8
10:3
9:1
8:4
8:5
9:5
8:4

Comente sobre las implicaciones del uso de este diseo sobre la inferencia
estadstica, atendiendo al error de restriccin involucrado. Haga recomendaciones
para que este diseo pueda utilizarse evitando las consecuencias en la inferencia
comentadas.
Ejercicio 7.8 Es frecuente encontrar experimentos para mejorar o desarrollar
nuevos productos en los que es difcil o costoso mover los niveles de un factor. Box
(1996) describe un ejemplo con esa caracterstica, el cual se propone aqu como
ejercicio. El experimento tiene por objetivo mejorar la resistencia a la corrosin
en barras de acero, para ello se aplican diferentes tipos de revestimiento en la
supercie de cada barra y luego se hornean a un tiempo jo. Se prueban cuatro
revestimientos (R1 ; R2 ; R3 y R4 ) a tres temperaturas 360o C; 370o C y 380o C;

7.5. Ejercicios

255

cada prueba se realiz dos veces, conformadas en dos bloques completos. El


experimento se llev a cabo en un arreglo en parcelas divididas, donde de manera
aleatoria se jaron las tres temperaturas, en cada una de ellas se aleatoriz el
tipo de revestimiento de las barras. El esquema experimental y los resultados de
la resistencia a la corrosin de las 24 barras tratadas se muestran en la siguiente
tabla.
Bloque
1

Parcela
temperatura
360
370
380

380
370
360

R2
73
R1
65
R3
147
R4
153
R4
150
R1
33

Subparcelas
R3 R1
83 67
R3 R4
87
86
R1 R2
155 127
R3 R2
90
100
R1 R3
140 121
R4 R2
54
8

R4
89
R2
91
R4
212
R1
108
R2
142
R3
46

Construya la tabla del anlisis de la varianza, intreprete resultados y obtenga


conclusiones.
Ejercicio 7.9
(Lorenzen y Anderson, 1993). Un experimento fue diseado
para medir la fuerza de una pieza de metal remachada en un dado. Cuatro
factores fueron considerados: lubricante (L) en tres niveles, ancho del acero (T )
en tres niveles, tipo de acero (S) en dos niveles, y tipo de rizo (C) en dos niveles.
Diez piezas fueron remachadas para cada combinacin de factores. Pero, dado
que es laboriosa la limpieza de dados, un lubricante fue seleccionado y todas las
combinaciones de los dems factores fueron corridas antes de que otro lubricante
fuera utilizado. Estos tres factores fueron completamente aleatorizados para cada
pieza por remachar. Como una medida de conrmacin el experimento completo
fue replicado una semana despus usando diferentes aleatorizaciones y diferente
metal. Qu diseo experimental fue utilizado en este experimento? Cmo se
modicara el diseo si se supiera que en cada combinacin de factores las 10
piezas fueron remachadas antes de cambiar de combinacin?
Ejercicio 7.10 (Loske et al. 2002) Con el objetivo de estudiar los efectos bactericidas de ondas de choque bajo el agua sobre un microorganismo (E. Coli), se

256

7. Algunos diseos especiales

prepar una suspensin con el mismo, suspensin que se deposita en viales experimentales los cuales son tratados por medio de cinco factores potencialmente
importantes: A, la temperatura del agua; B, el voltaje de generacin de ondas
de choque; C, el nmero de ondas de choque; D, la radiacin lumnica y E, el
nivel de llenado del vial. Todos estos factores tenan dos niveles. La estructura
de tratamientos correspondi a un diseo factorial 25 1 : La variable respuesta
meda la reduccin en viabilidad del microoorganismo despus de tratamiento.
El experimento de 16 corridas fue replicado tres veces y en tres das diferentes,
cada da se corrieron las 16 corridas experimentales, cada una en una ocasin.
Finalmente, el factor A; temperatura del agua, dado que era difcil modicarlo
para permitir una aleatorizacin sin restriccin, fue jado aleatoriamente en uno
de sus dos niveles, y los dems factores fueron aleatorizados en su aplicacin antes
de cambiar a otra temperatura. Con esta informacin proponga un diseo experimental y construya la tabla de anlisis de varianza correspondiente indicando los
cocientes F adecuados.

Captulo 8

El modelo de anlisis de
regresin
Todos los modelos son incorrectos. Algunos son tiles.
G.E.P. Box

8.1

Introduccin

A lo largo de los captulos anteriores la labor fundamental ha sido la comparacin


de tratamientos a travs de las respuestas promedio correspondientes. Esta labor
es fundamental, pero en muchas situaciones no es lo nico por hacer. Por ejemplo, en el estudio de produccin de enzimas mediante procesos de fermentacin
microbiana, suponga que se ha realizado un experimento en donde se determin
que el medio con que se alimenta a los microorganismos afecta a la actividad
enzimtica, ya que al pasar de un nivel bajo a un nivel alto de nitrgeno en el
medio las actividades promedio correspondientes dieren estadsticamente. Sin
embargo, otras preguntas adicionales de inters para el investigador podran ser:
En otros niveles de nitrgeno no experimentados, qu sucede con la actividad enzimtica?
En qu nivel exacto de nitrgeno se tendr un actividad mxima?
La primera pregunta plantea un problema de extrapolacin (fuera del intervalo comprendido entre los dos niveles de nitrgeno experimentados), y/o un
problema de interpolacin (dentro del intervalo comprendido entre los dos niveles
de nitrgeno experimentados).

258

8. El modelo de anlisis de regresin

La segunda pregunta plantea en general lo que se conoce como un problema


de optimizacin emprica del proceso de fermentacin - actividad enzimtica.
Para responder a estas preguntas, hay que notar que se requiere del conocimiento de una funcin que de manera continua y suave relacione a una respuesta (en
el ejemplo, a la actividad enzimtica) con no slo unos cuantos niveles experimentados de un factor, sino en otros valores no experimentados de ste.
Los modelos que se manejan genricamente como de anlisis de regresin son
de utilidad para responder a las preguntas planteadas.
En forma general la relacin entre la respuesta y los factores que intervienen
en un proceso se describe mediante la expresin:
y = f (X1 ; :::; Xp ) + "; "

N (0;

(8.1)

donde f describe una relacin suave entre los factores X1 ; :::; Xp que explican el
fenmeno o proceso que se estudia, e y la respuesta; como en casos anteriores "
denota al trmino de error experimental. La forma especca de f depender del
conocimiento que tenga el experimentador sobre el campo de experimentacin;
si hay mucho conocimiento acumulado f podra ser generada de la solucin de
ecuaciones diferenciales que relacionen a y con X1 ; :::; Xp ; si el conocimiento no
permitiera lo anterior, tpicamente f ser un polinomio en X1 ; :::; Xp ; por ejemplo:

y=

1 X1

+ ::: +

p Xp

+ "; "

N (0;

(8.2)

donde 0 ; 1 ; :::; p representaran las cantidades que parametrizan la relacin y


por eso llamados parmetros. En este captulo nos abocaremos a cmo estimar
y contrastar hiptesis relativas a los parmetros de este tipo de modelos polinomiales.
Ejemplo 8.1
En un proceso de moldeo por inyeccin, la variable que mide el encogimiento del
producto resultante es vital para la parte de ensamble en otras etapas del proceso.
Controlar esta variable ha resultado ser complicado, el ingeniero responsable del
proceso tiene el propsito de reducir tanto como sea posible el encogimiento, para
lo cual propone efectuar un experimento.
Dos factores son importantes para este proceso: la temperatura y la velocidad del tornillo de la mquina. Los rangos de operacin respectivos se encuentran
entre (160 o C, 200 o C) y de (300 rpm, 500 rpm). Los valores de la regin experimental quedan determinados por el cuadrante que dene la temperatura y
velocidad. Se designa X1 como el primer factor de temperatura y X2 como el
factor de velocidad.

8.2. Modelos de primer y segundo orden

259

Se puede observar que tanto la temperatura como la velocidad tienen diferentes escalas de medicin, tal situacin complica la construccin y anlisis de los
modelos. Para evitar este problema se propone codicar la regin experimental.
La codicacin se obtiene considerando los valores mximo, mnimo y promedio de cada factor, enseguida a cada nivel del factor elegido se le resta su promedio
y se divide por el semi - rango, mediante esta operacin se obtiene el valor codicado, la cual se repite para los otros factores. La transformacin se describe en
la siguiente expresin en el caso de que los valores estn equiespaciados:
xkl =

Xkl
1
2 (maxl fXkl g

Xk
minl fXkl g)

(8.3)

donde k = 1; 2 representa el factor y l = 1; 2 el nivel del factor, el valor codicado


se denota por la letra minscula de la variable factor. Si no estn equiespaciados
se sustituye en lugar de Xk el valor central del intervalo total considerado. En el
ejemplo 8.1 la codicacin resulta como se muestra a continuacin:
nivel xkl
Factor Xkl
X1 : Temperatura o C
X2 : Velocidad (rpm)

X11 = 160
X21 = 300

X12 = 200
X22 = 500

Cabe observar que cuando un factor es cualitativo con dos niveles no se puede
usar la expresin anterior, entonces se asigna de manera econmica el valor 1 y
1 para representar los niveles del factor en cuestin.
Los valores de prediccin, optimizacin o las mejores condiciones de operacin
se encontrarn en la regin experimental codicada, la interpretacin en la regin
original se obtiene por la siguiente ecuacin:
1
Xkl = (maxl fXkl g
2

minl fXkl g)xkl + X k

Si los datos originales no son simtricos o equiespaciados entonces para obtener


valores codicados entre 1 y 1 en la expresin (8.3) se sustituye X k por (max(Xk )+
min(Xk ))=2:

8.2

Modelos de primer y segundo orden

El modelo clsico de regresin lineal que describe una relacin entre una variable
respuesta y con un factor x est dado por:
y=

1x

+ "; "

N (0;

(8.4)

260

8. El modelo de anlisis de regresin

donde 0 y 1 son los parmetros que dan forma a la relacin entre y y x, "
representa al trmino de error experimental del que se supone que en promedio
es cero y que tiene una varianza que no depende del valor de y o de x. De la
misma manera un modelo de regresin lineal de y en x y x2 es:
y=

1x

11 x

+ "; "

N (0;

(8.5)

Hay que notar que a ambos modelos se les llama lineales porque los parmetros entran sin transformacin alguna al modelo; para muestra, un ejemplo de un
modelo no lineal en los parmetros es:
1
+
0

y=

1x

+ "; "

N (0;

Aunque en el modelo se manejen funciones no lineales de x o de y, mientras los


parmetros entren linealmente, el modelo ser considerado lineal. Sin embargo el
modelo (8.4) es de primer orden en x, mientras que el modelo (8.5) es de segundo
orden en x.
Una vez realizado el experimento se tendrn en general n parejas de datos
(yi ; xi ); i = 1; :::; n. Con ellas entonces el modelo estadstico se representa por
yi =

1 xi

+ "i ; "i

N (0;

); i = 1; :::; n; independientes

en el caso del modelo de primer grado en x; y


yi =

1 xi

2
11 xi

+ "i ; "i

N (0;

); i = 1; :::; n, independientes

para el modelo de segundo grado en x:


Cuando se tienen dos factores en el experimento, los modelos de regresin
lineales de primer y segundo orden son:

yi =

1 x1i

yi =

+
"i

2 x2i
1 x1i

+ "i ; "i

N (0;

2 x2i
2

N (0;
2
11 x1i

); i = 1; :::; n; independientes
2
22 x2i

12 x1i x2i

+ "i

(8.6)

); i = 1; :::; n, independientes

En este caso 12 representa el aporte del trmino cruzado x1i x2i o de interaccin.
En la Fig. 8.1 se muestra dos posibles comportamientos esperados de y en
funcin de estos dos modelos en x1 y en x2 . Note como el modelo de segundo
orden supone comportamientos curvilneos de y:

8.2. Modelos de primer y segundo orden

261

En general un modelo estadstico lineal en p factores se expresa:


yi =

0+

p
X

k xki +

"i

N (0;

p X
p
X
k

kl xki xli

+ "i

(8.7)

); i = 1; :::; n, independientes

donde k ; k = 1; ::; p son los parmetros del modelo que explican en cuanto
contribuye de manera lineal cada factor a la respuesta, los kl (k; l = 1; ::; p)
indican la curvatura; es decir, kk son los trminos cuadrticos y los kl para
k 6= l describen la interaccin.
El orden de un modelo est determinado por el grado mximo observado en
los factores, as el modelo (8.7) si todos los kl son cero, entonces el modelo
ser de primer orden, si al menos uno de los parmetros kl es diferente de cero,
entonces el modelo ser de segundo orden.
Denotemos por g el nmero de parmetros en un modelo lineal de regresin.
Con respecto al nmero de parmetros en el modelo (8.7),
g = 1(constante) + p(lineal) + p(cuadrtica) +

p(p

1)
2

(interacciones dobles)

es decir:

(p + 1)(p + 2)
(8.8)
2
Suponiendo un modelo, una vez realizado el experimento, los objetivos que se
plantean son:
g=

1. Estimar los parmetros en el modelo.


2. Evaluar si el modelo representa de manera signicativa a la variabilidad
observada en la variable respuesta.
3. Evaluar si existen desviaciones en los datos que invaliden algunos de los
supuestos del modelo.
4. Realizar predicciones de interpolacin y/o extrapolacin del comportamiento de y como funcin de valores no experimentados de los factores.
5. Encontrar los niveles de los factores en que se optimice el valor de la variable
respuesta.
En las siguientes secciones se presentan procedimientos estadsticos para alcanzar los objetivos 1, 2, 3 y 4. El quinto objetivo ser la materia del captulo
siguiente.

262

8. El modelo de anlisis de regresin

Fig. 8.1: Modelos de primer orden izquierda y segundo orden derecha

8.3

Estimacin de los Parmetros del Modelo

Los parmetros del modelo (8.7) se estiman estadsticamente por medio de la


informacin que se obtiene al conducir el experimento, despus se prueba si los
parmetros son iguales a cero estadsticamente, de ser as se dice que los factores
en su parte lineal, cuadrtica o interaccin correspondiente a tales parmetros no
contribuyen en la explicacin de la respuesta.
Al efectuar el experimento la respuesta se denota por el vector y; ste contiene
los valores de todas las pruebas experimentales n, incluyendo las rplicas de
tratamientos en el experimento. Los parmetros tambin se representan en forma
vectorial por 01 k = [ 0 ; 1 ; 2 ; 11 ; 22 ; 12 ]0 : En la i-sima prueba experimental
los factores toman valores (xi1 ; xi2 ; x2i1 ; x2i2 ; xi1 xi2 ); de esta forma se genera la
llamada matriz de diseo:
0
1
1; x11 ; x21 ; x211 ; x221 ; x11 x21
B
C
B 1; x21 ; x22 ; x221 ; x222 ; x21 x22 C
B
C
X=B
C
..
@
A
.
2
2
1; xn1 ; xn2 ; xn1 ; xn2 ; xn1 xn2

donde los unos en la primera columna resultan de la presencia en el modelo del


parmetro 0 : As X es una matriz de orden n g, y se denota por Xn g :
Para mostrar las ideas bsicas en la estimacin de los parmetros, se propone
ilustrar el procedimiento considerando un diseo factorial 32 ; recuerde que este
diseo tiene dos factores en tres niveles, en primera instancia el modelo que se
propone toma en cuenta la parte lineal y cuadrtica como se indica en la expresin
(8.7), en este caso ser necesario estimar g = 6 parmetros.
Dada la codicacin de los factores expresin (8.3), el esquema del diseo rep-

8.3. Estimacin de los Parmetros del Modelo

263

resentado por la matriz X para el caso de un diseo factorial 32 se muestra en la


Tabla 8.1. Note que en la primera columna aparecen unos y esto corresponde al
trmino constante, las siguientes columnas describen las partes lineales, cuadrticas y de interaccin.
3
2
I x1 x2 x21 x22 x1 x2
7
6
1
1
1
1
1 7
6 1
7
6
0
1
0
1
0 7
6 1
7
6
6 1
1
1
1
1
1 7
7
6
6
1
0
1
0
0 7
X9 6 = 6 1
7
6 1
0
0
0
0
0 7
7
6
6 1
1
0
1
0
0 7
7
6
7
6 1
1
1
1
1
1
7
6
4 1
0
1
0
1
0 5
1
1
1
1
1
1
Tabla 8.1 Matriz que representa el esquema experimental 32
El modelo descrito en la ecuacin (8.7) se escribe en forma resumida mediante
la siguiente expresin matricial:
y =X +"

(8.9)

donde " es un vector aleatorio con vector de medias cero, matriz de varianzas covarianzas 2 I con distribucin de probabilidad normal, " v N (0; 2 I), donde "
es la discrepancia entre las observaciones y el modelo, esto es: " = y X :
El procedimiento matemtico para estimar
consiste en minimizar el pro0
ducto " " con respecto a , es decir:
min "0 " = min(y

X )0 (y

X )

este principio es conocido como el criterio de minimizar la suma de errores al


cuadrado (mnimos cuadrados). Para obtener el mnimo se deriva la expresin
anterior para cada parmetro en ; dando lugar a un sistema de ecuaciones, la
solucin de este sistema genera el ptimo (mnimo), el cual representa al vector
de los valores estimados que corresponden a los parmetros:
b = (X0 X)

X0 y

(8.10)

A continuacin se propone un ejemplo para mostrar numricamente el procedimiento estadstico para estimar parmetros, el ejemplo corresponde al caso
de un slo factor y un modelo de primer orden.

264

8. El modelo de anlisis de regresin

Ejemplo 8.2(regresin lineal simple) Se realiza un experimento para probar


la vida de anaquel. ste consiste en efectuar una prueba de vida acelerada para
estimar el tiempo en el que el producto puede estar a la venta. El material se
someti a condiciones extremas de temperatura y se evalu su descomposicin
en horas. Estos resultados permitirn determinar la vida de anaquel. Los datos
para siete pruebas se presentan en la Tabla 8.2a.
Temperatura (X) (o C)
17:0
23:5
31:0
42:0
56:0
61:0
77:0

Tiempo (y)(hrs)
240
216
209
210
206
155
131

Tabla 8.2a Valores de la vida de anaquel para diferentes temperaturas


El objetivo es encontrar la mejor relacin lineal entre las variables X y y; la
cual se establece mediante la estimacin de los parmetros del modelo, que en
este caso se plantea por:
(8.11)
y = 0 + 1X + "
0
Para aplicar el estimador de mnimos cuadrados b = (X0 X)
caso de una sola X en el modelo resulta ser:
!0
P
X
X
y
i
i
^ = y ^ 1 X; P
2
Xi X

La matriz de diseo X transpuesta es:


X02

1
17

1
23:5

1
31

1
42

1
56

1
61

1
77

con lo que:
X0 X =

7
307:5
307:5 16352:25

X0 y =

la inversa de X0 X es:
(X0 X)

0:82133
0:01544

0:01544
0:00035

1367
55533:0

1 X0 y

(que en el

8.3. Estimacin de los Parmetros del Modelo

265

con lo que:
0

es

b = (X X)
0

P
^ x; ^ = P(xi
1
1
(xi

X y = ^0 = y
0

x) yi
x)2

b 0 = (265:06; 1:59)

Con estos valores estimados se escribe el modelo estimado:


yb = 265:06

1:59X

(8.12)

En la Fig. 8.2 se presenta este modelo conjuntamente con los valores observados.
Trabajando con la valores codicados, en este caso, el intervalo de recorrido
de X va de 17 a 77; pero los valores no estn equiespaciados, entonces X k =
(max(Xk ) + min(Xk ))=2 (k = 1), por lo que el semi rango del intervalo es (77
17)=2 = 30. Se sustituye en la expresin (8.3), con ello se obtienen los valores
codicados:

sin codicar X
codicado x

17
1

23:5
0:783

31
0:533

42
0:166

56
0:3

61
0:466

77
1

con lo que el modelo ajustado resulta ser


yb = 190:41

47:65x

Sustituyendo el valor codicado x = X3047 en este ltimo modelo ajustado y


haciendo aritmtica, se recupera el modelo ajustado a los datos no codicados de
la ecuacin (8.12).
Como ya se coment en captulos anteriores, los residuales (e = y yb) miden
la discrepancia entre la respuesta observada y el modelo ajustado en cada punto
de la variable X o x; los de este ejemplo se muestran en la Tabla 8.2b y en la
Fig. 8.3 se gracan los valores ajustados versus los residuales.
y
yb
r

240
238:1
1:9

216
227:7
11:7

209
215:8
6:8

210
198:3
11:7

206
176:1
29:9

155
168:2
13:2

131
142:8
11:8

Tabla 8.2b Valores observados, ajustados y residuales para las diferentes temperaturas

266

8. El modelo de anlisis de regresin

Fig. 8.2: Descripcin del modelo ajustado, datos observados y residuales

Fig. 8.3: Valores ajustados y residuales

8.3. Estimacin de los Parmetros del Modelo

267

Una vez estimados los parmetros del modelo, el objetivo es conocer si los factores en sus componentes lineales, cuadrticos o interacciones son importantes en
sus efectos sobre la variable respuesta, adems, evaluar la capacidad del modelo
ajustado para poder estimar con precisin a la variable respuesta con propsitos
de extrapolacin o interpolacin. Este conocimiento se obtiene mediante el estudio de la signicancia estadstica de los parmetros, para ello se contrasta el valor
de cada parmetro con cero a travs de un contraste de hiptesis estadsticas.
Contraste de hiptesis sobre parmetros individuales del modelo de
regresin
Las hiptesis que se contrastan en la parte lineal son:
Hlo :
Hl1 :

= 0;
6= 0

i
i

i = 0; :::; p

En la parte cuadrtica o interacciones son:


Hco :
Hc1 :

ij
ij

= 0;
6= 0

i; j = 1; :::; p

El estadstico que se emplea tradicionalmente para contrastar estas hiptesis


es
tc =

E( b ij )
ES( b )

ij

(8.13)

ij

donde tc - suponiendo que se cumple la hiptesis nula respectiva - tiene una


distribucin de probabilidad t de Student con n g grados de libertad t(n g).
Dos resultados que son importantes para la inferencia estadstica de los parmetros y del modelo, son la media y la varianza del estimador b . stas se obtienen
por la esperanza de b ; E( b ) = , la matriz de varianzas y covarianzas de b es
igual 2 (XX) 1 ; en resumen:
E( b ) =

y V ar( b ) =

(X0 X)

(8.14)

El error estndar ES de cada parmetro del modelo se obtiene por:


p
ES( b i ) =
mii ;

(8.15)

donde mii es i simo elemento de la diagonal en la matriz (X0 X) 1 y 2 es


la varianza del error. Un estimador insesgado de sta se obtiene mediante la
siguiente expresin si el modelo es el adecuado a los datos:
S2 =

(y

b )0 (y
y
n g

b)
y

y0 y

y0 X(X0 X)
n g

1 X0 y

(8.16)

268

8. El modelo de anlisis de regresin

Nota: observe el siguiente resultado:

n
P

i=1

e2i =

n
P

(yi

i=1

bi )2 = (y
y

b )0 (y
y

b)
y

La inferencia sobre un parmetro se realiza sustituyendo E( b ij ) = ij = 0 en


(8.13), si el valor del estadstico tc resulta ser ms grande que el valor del cuantil
t(n g; =2) se rechaza H0 : ij = 0.
Intervalos de conanza sobre el parmetro de regresin para la respuesta media y la respuesta individual
En el anlisis del modelo de regresin es importante estimar mediante intervalos
de conanza a los parmetros del modelo y a la respuesta media en un valor
especco de x, y mediante un intervalo de prediccin para la respuesta individual
para un valor especco de la variable x.
Intervalo de conanza para 1 :
b

t(n

g; =2)ES( b 1 )

t(n

p
g; =2)S m11

donde m11 es el segundo elemento de la diagonal en la matriz (X0 X)


Intervalo de conanza para la media de la variable de respuesta
q
yb
t(n g; =2)S (1; x0 ) (X0 X) 1 (1; x0 )0

(8.17)
1:

en x0 :
(8.18)

donde yb = x0 b ; el vector de parmetros b = ( b 0 ; b 1 ) y el vector (1; x0 ); donde


x0 representa a los niveles de los factores donde se requiere estimar la media de
y.
Intervalo de conanza para un valor de la variable de respuesta (predicho):
yb

t(n

g; =2)S

p
1 + (1; x0 )(X0 X)

1 (1; x

0
0)

(8.19)

Ejemplo 8.2, contina, contraste de hiptesis El objetivo en este ejemplo


es ilustrar la inferencia estadstica sobre los parmetros del modelo utilizando los
datos del Ejemplo 8.2. La hiptesis estadstica que se plantea para conocer si la
temperatura tiene inuencia en el tiempo de vida de anaquel es la siguiente:
H0 :
H1 :

1
1

=0
6= 0

como se indic en la expresin (8.13) el estadstico para probar esta hiptesis es:
tc =

ES( b 1 )

t(n

g; =2)

8.3. Estimacin de los Parmetros del Modelo

269

donde ES( b 1 ) es el error estndar, ste se obtiene por la raz cuadrada de la


varianza estimada de ( b 1 ); es decir:
p
ES( b 1 ) =
m11

Nota: observe los valores de (X0 X) 1 en el Ejemplo 8.4 e identique m11 : El valor
calculado de este estadstico tc se obtiene efectuando las siguientes operaciones:
1. Se estima la varianza
S2 =

2;

esto es:

y0 y y0 X b
275659 274130:32
=
= 305:74
n g
5

2. El valor del error estndar es:

ES( b 1 ) = (S 2 m11 )1=2 = ((305:74)(0:00035))1=2 = 0:33

3. Se sustituyen los valores en el estadstico:

1:59 0
= 4:844
0:33
Para contrastar las hiptesis se compara el valor de tc con el valor de t(n
g; =2) = t(5; 0:025) = 2:571: Se concluye que los datos no apoyan H0 : 1 = 0
por lo que sta se rechaza, esto se interpreta diciendo que el modelo que representa
la relacin entre la temperatura y el tiempo de vida de anaquel es signicativo.
Los resultados de la estimacin se presentan en resumen en la Tabla 8.3, en
ella se sealan los valores estimados, el error estndar de cada parmetro, el valor
del estadstico calculado y el nivel de signicancia descriptivo.
tc =

Parmetro
o
1

Estimacin
265:06
1:59

Error estndar
15:84
0:33

tc
16:73
4:84

Valor p
< 0:0001
0:0047

Tabla 8.3 Resumen estadstico de la estimacin de los parmetros


Intervalo de conanza
El intervalo de 95% de conanza para la media de la respuesta y el valor individual
de la respuesta predicho en x = 25; se obtienen sustituyendo en las expresiones
(8.18) y (8.19).
s
265:06
0:821
0:015
1
1 25
1 25
2:571 17:49
1:588
0:015 0:00036
25
225:35

23:31:

270

8. El modelo de anlisis de regresin

Intervalo de prediccin
Con un 95 % de conanza se dice que el nmero de horas en promedio en las que
el producto durara en anaquel sometido a una temperatura de 250 o C est entre
202.04 y 248.65. El intervalo de prediccin con un 95 % para el valor individual
para la respuesta en x = 25 se tiene:
225:35

50:64

Ejemplo 8.3
En un estudio de teora de color un ingeniero qumico tiene inters en estudiar
el efecto de un solvente en el acabado de un tapiz automotriz, su variable de
respuesta la obtiene mediante una prueba de color. El factor codicado y las
observaciones despus de realizar unas pruebas experimentales se muestran en la
Tabla 8.4. El objetivo es construir un modelo de segundo orden.

X6

I
1
1
= 1
1
1
1

x2
1
0
1
1
0
1

x
1
0
1
1
0
1

y
3:6
7:1
3:7
7:6
3:4
7:5

Tabla 8.4 Observaciones de la prueba de color


El modelo de segundo orden con un factor es como el que se muestra en
la expresin (8.5), de esta manera se requiere estimar los parmetros 1 3 =
[ 0 ; 1 ; 2 ]0 :
El procedimiento para estimar el vector de parmetros se obtiene aplicando
la expresin (8.10); primero se calcula el producto de X0 X; considerando a la
matriz X que representa el esquema experimental, ste es:

X0 X = 4

1 1 1
1 0 1
1 0 1

la inversa de X0 X es:

36
1 1 1 6
6
1 0 1 56
6
1 0 1 6
4

1
1
1
1
1
1

1
0
1
1
0
1

1
0
1
1
0
1

7 2
3
7
6 0 4
7
7 = 4 0 4 0 5;
7
7
4 0 4
5

8.3. Estimacin de los Parmetros del Modelo

(X0 X)

3
6 0 4
=4 0 4 0 5
4 0 4

2
1 4
=
32

16 0
0 8
16 0

271

3 2
16
0 5=4
24

3
1=2
0 5;
3=4

1=2
0
0 1=4
1=2
0

el producto de esta inversa por la matriz traspuesta X es:

(X0 X)

X0 = 4
2
4

32
1=2
0 54
3=4

1=2
0
0 1=4
1=2
0

0
1=4
1=4

1=2
0
0 1=4
1=2 1=4

1 1 1
1 0 1
1 0 1

0
1=4
1=4

3
1 1 1
1 0 1 5=
1 0 1
3

1=2
0
0 1=4 5
1=2 1=4

nalmente se multiplica la ltima expresin por y, se obtiene:

(X0 X)

X0 y = 4

0
1=4
1=4

1=2
0
0 1=4
1=2 1=4

0
1=4
1=4

es decir:
(X0 X)

36
1=2
0 6
6
0 1=4 5 6
6
1=2 1=4 6
4

3:6
7:1
3:7
7:6
3:4
7:5

3
7
7
7
7
7
7
5

X0 y = [5:25; 0; 0:35]

Estos valores son los estimadores de los parmetros


esta manera el modelo se representa por:
yb = 5:25

1x3

=[

0;

1;

0
2] .

De

0x + 0:35x2

En el siguiente ejemplo se estima el modelo para las observaciones realizadas


al llevar a cabo un diseo factorial 23 ; para este esquema no se pueden obtener
los trminos cuadrticos, slo se estiman los efectos lineales (primer orden) y los
efectos de interaccin.
En general, la importancia de estudiar este tipo de modelos radica en que se
pueden estudiar trayectorias de optimizacin o buscar otras regiones de experimentacin. Este tipo de estudios es muy recomendable al inicio de una investigacin, en el desarrollo de nuevos productos o para mejorar procesos bajo control
estadstico. Antes de aplicar esquemas experimentales tal cual, como los reportados en otros estudios, vale la pena hacer un poco de esfuerzo para descubrir
nuevas o mejores condiciones de operacin.

272

8. El modelo de anlisis de regresin

Ejemplo 8.4
Un ingeniero desea conocer varias propiedades del amaranto en la elaboracin
de masa o harina mediante el proceso de nixtamalizacin, para ello lleva a cabo
un diseo factorial 23 con dos rplicas. En este estudio inicial se quiere conocer
cmo los factores que caracterizan este proceso inuyen en el pH, los factores son:
X1 : A temperatura; X2 : B tiempo; X3 : C concentracin de Cal. En la tabla de
abajo se muestran los valores reales y codicados de los factores:
FactoresnNiveles
X1 : A tem
X2 : B tiem
X3 : C cal

1
60o C
50min
20uds

1
90o C
60min
40uds

El diseo y las observaciones del pH que obtienen al realizar el experimento,


se describen en la Tabla 8.5. Hay que notar que en este diseo no se incluyen
columnas correspondientes a los trminos cuadrticos dado que son idnticas a la
columna I; es decir que los efectos cuadrticos estn confundidos con el de 0 :
I
1
1
1
1
1
1
1
1

x1
1
1
1
1
1
1
1
1

x2
1
1
1
1
1
1
1
1

x3
1
1
1
1
1
1
1
1

x1 x2
1
1
1
1
1
1
1
1

x1 x3
1
1
1
1
1
1
1
1

x2 x3
1
1
1
1
1
1
1
1

y1
2:7
3:5
6:0
7:1
2:7
3:7
3:9
7:6

y2
2:7
4:4
3:6
5:0
2:7
3:4
4:4
7:5

Tabla 8.5 Resultados del proceso de nixtamalizacin


Nuevamente para estimar los parmetros en el modelo
y=

1 x1

2 x2

3 x3

12 x1 x2

13 x1 x3

23 x2 x3

+"

se aplica la frmula descrita por la expresin (8.10), la matriz que va en esta


expresin es: X16 7 ; en sta 16 representa todas las combinaciones de los niveles
de los factores y la rplica, 7 muestra el nmero de parmetros que se van a
estimar, as:
b = (X0 X)

X0 y = (4:43; :84; 1:21; :06; :32; :22; :16)0

por lo tanto el modelo estimado es:

8.3. Estimacin de los Parmetros del Modelo

273

yb = 4:43 + :84x1 + 1:21x2 + :06x3 + :32x1 x2 + :22x1 x3 + :16x2 x3

(8.20)

este modelo permitir analizar con detalle el proceso de nixtamalizacin dentro


de la regin experimental.
En la Tabla 8.6 se reportan los resultados que permiten completar el anlisis
sobre el modelo. La columna 1 reproduce los coecientes del modelo, la segunda
corresponde al error estndar de los estimados parmetros del modelo (vase
expresin 8.14), la tercera el valor del estadstico suponiendo que la hiptesis
nula correspondiente es cierta.
b

^ = 4:43
0
^ = :84
1
^ = 1:21
2
^ = :06
3
^ = :32
12
^ = :22
13
^ = :16
23

ES( b )
:225
:225
:225
:225
:225
:225
:225

t=

ES(b)

19:69
3:75
5:36
0:25
1:42
0:97
0:69

Valor p
:000
:005
:000
:808
:190
:356
:505

Tabla 8.6 Resumen de la estimacin de los parmetros y su signicancia


para el proceso descrito en el ejemplo 8.5
Estos resultados permiten sugerir que no existen efectos de interaccin y que
los factores signicativos son X1 la temperatura y X2 el tiempo, es decir estos inuyen en explicar el pH de la masa. De esta manera, el modelo queda simplicado
por:
yb = 4:43 + :844x1 + 1:21x2
(8.21)

Estimemos el intervalo de 95% conanza para el parmetro


ecuacin (8.17) y la informacin de la Tabla 8.6, se tiene:
b

t(n

g; =2)ES( b 1 ) = 0:84

a partir de la

2:262(0:225)

(0:331; 1:349)

De manera anloga al ejemplo anterior, en ste tambin se puede realizar


inferencia sobre los parmetros del modelo y estimar los intervalos de conanza
para la media de la respuesta media y la respuesta individual.

274

8.4

8. El modelo de anlisis de regresin

Signicancia global de un modelo ajustado

Recordemos el modelo base que se propuso fue el de la expresin (8.7). El inters


en este apartado es conocer si este modelo es adecuado. Es decir, si tanto la parte
lineal como la de segundo orden permiten explicar la variabilidad observada en la
respuesta. De no ser as, los parmetros 0 ; 1 ; :::; p ; 11 ; :::; ij , son todos igual
con cero, en caso contrario alguno de ellos es diferente de cero. Para vericar si
el modelo es adecuado es necesario probar la siguiente hiptesis:
H0 :

= ::: =

11

= ::: =

pp

=0
(8.22)

H1 : no todos los

ni

ij

son igual a cero, i; j = 1; :::; p

Para realizar esta prueba se deben satisfacer los supuestos que se han planteado sobre la variable aleatoria ": Si la hiptesis nula H0 se rechaza se dice que el
modelo es til.
El mtodo que se emplea para probar H0 es el de anlisis de la varianza
(ANDEVA). La idea principal es descomponer la suma de cuadrados total en dos
componentes. Uno de esos componentes indica qu tanto contribuye el modelo
a explicar la variabilidad de la respuesta y es la suma de cuadrados del modelo
(SCreg ) y la otra la suma de cuadrados debida al residual o error, sta se denota
b )0 (y y
b ). Retomemos la expresin:
por SCerror = (y y
SCerror = (y

b )0 (y
y

b ) = y0 y
y

y0 X b

(8.23)

si a esta expresin le sumamos y restamos la cantidad y 2 =n se tiene :


SCerror = SCtotal

SCreg = (y0 y

(y0 X b

y 2 =n)

y 2 =n)

(8.24)

la cantidad que corresponde al primer parntesis de la expresin anterior representa la suma de cuadrados total SCtotal y la cantidad en el segundo es la suma
de cuadrados del modelo SCreg :
n
n
2
P
P
Nota: observe el siguiente resultado: SCtotal =
(yi y i )2 =
yi2 yn =
i=1

y0 y

i=1

y2
n.

Estas sumas de cuadrados permite probar la hiptesis global de que todos los
parmetros del modelo (8.22) son igual a cero (excepto 0 ), si dicha hiptesis
es rechazada se concluye que al menos uno de los parmetros es distinto de cero.
En este caso el estadstico de prueba es:
Fc =

SCreg
g 1

SCerror
y0 X b
=
n g
g

y 2 =n
1

y0 y y0 X b
n g

8.4. Signicancia global de un modelo ajustado

275

Fc vista como variable aleatoria sigue una distribucin de probabilidad F con g 1


y n g grados de libertad para el numerador y denominador respectivamente,
F (g 1; n g; ).
Anlisis de la Varianza
En forma esquemtica el procedimiento para contrastar la hiptesis global se
muestra en la Tabla 8.7. En la columna suma de cuadrados se representan los
componentes de la expresin (8.24), nalmente en la quinta columna se presenta
el valor calculado del estadstico.
Fuente de
variacin

Grados de
libertad

Suma de
cuadrados

Regresin

Error

SCreg = (y0 X b

SCerror = y0 y

Total

SCtotal = (y0 y

y 2 =n)
y0 X b

Cuadrados
medios

Fc

SCreg
g 1

CMreg
CMerror

Valor p

SCerror
n g

y 2 =n)

Tabla 8.7 Descripcin del anlisis de la varianza


Coeciente de determinacin R2
El reporte sobre la bondad del modelo se completa mediante el clculo del coeciente de determinacin, el cual indica qu porcentaje de los datos son explicados
por el modelo, ste se estima por la siguiente expresin:
R2 =

SCreg
=1
SCtotal

SCerror
=1
SCtotal

y0 y
y0 y

y0 X b
y 2 =n

con la informacin presentada en la tabla del ANDEVA se obtiene el valor estimado de R2 .


Nota: observe que el coeciente de determinacin se puede obtener por la
expresin:
n
P
(yi ybi )2
R2 = 1 i=1
n
P
(yi y i )2
i=1

Este coeciente se puede ajustar considerando el nmero de variables y datos


en el experimento, es decir, mediante los grados de libertad del error y total,

276

8. El modelo de anlisis de regresin

2
entonces Rajustada
se obtiene por:

2
Rajustada

y0 y y0 X b
n g
y0 y y 2 =n
n 1

=1

Ejemplo 8.4, contina


Finalidad en esta parte es ilustrar con los datos del Ejemplo 8.4 el anlisis de
la varianza y la estimacin del coeciente de determinacin. El proceso descrito
en el Ejemplo 8.4 se ajusta al modelo (8.20), una vez que se tiene planteado el
modelo, el propsito es evaluar globalmente si ste es adecuado para el proceso
estudiado, eso equivale a contrastar las hiptesis (8.22). Mediante la tabla del
ANDEVA se obtienen las conclusiones de esa prueba. En la Tabla 8.8 se presenta
el resumen de los clculos.
Fuente de
variacin
Modelo
Error
Total

Grados de
libertad
6
9
15

Suma de
cuadrados
37:50
7:29
44:79

Cuadrados
medios
6:25
0:81

Fc

Valor p

7:71

0:004

Tabla 8.8 ANDEVA para el Ejemplo 8.4


Se puede concluir que en el modelo al menos uno de los parmetros es diferente de cero. Observe que en este caso se han considerado los seis parmetros
correspondientes a las variables; con la informacin en la Tabla 8.8, el anlisis
global se puede reducir al modelo (8.21).
El coeciente de determinacin es:
R2 = 1

7:29
= 0:84;
44:79

se concluye que aproximadamente el 84% de la variabilidad de los datos es explicada por el modelo (8.20). El coeciente de determinacin ajustado por lo grados
de libertad es:
2
Rajustada
=1

7:29
9
44:79
15

= 0:73

En la estimacin de parmetros por intervalo de conanza se requiere del


conocimiento de la varianza 2 ; entonces un estimador de sta se obtiene mediante
el cuadrado medio del error, es decir b2 = 0:81; la raz cuadrada de este valor se
reere como el error estndar del modelo estimado.

8.5. La vericacin de falta de ajuste

8.5

277

La vericacin de falta de ajuste

Se puede dar el caso en que aun cuando estadsticamente un modelo sea signicativo deje de explicar un patrn importante de la relacin entre la variable
respuesta y los factores en el experimento, en tal caso se dice que existe falta de
ajuste del modelo a los datos.
Comprobar estadsticamente si existe o no falta de ajuste es posible slo
cuando hay replicaciones (genuinas) en alguno de los tratamientos derivados de
los factores que intervienen en el experimento.
Las hiptesis por contrastar son en este caso:
H0 : El modelo se ajusta adecuadamente a los datos (no hay carencia de ajuste)
H1 : El modelo no se ajusta adecuadamente a los datos
(8.25)
Para presentar el procedimiento estadstico para contrastarlas se requiere
volver a utilizar notacin utilizada anteriormente, es decir, en lugar de considerar
yi ; i = 1; :::; n manejaremos yij ; i = 1; :::; m; j = 1;
P:::; ni , suponiendo en general
que se tienen m tratamientos diferentes en n = i ni corridas experimentales.
Recuerde que todas las observaciones se usan para estimar la variabilidad debida
al error experimental mediante:
SCerror =

XX
(yij

ybij )2 ;

sin embargo, las observaciones que son rplicas de un mismo tratamiento se


pueden utilizar para estimar a un componente de la varianza del error experimental (el llamado error puro). Tal variabilidad estimada del error puro(ep), se
construye a partir de:
XX
SCep =
(yij y i )2
P
con i ni m grados de libertad. Se puede demostrar que:
SCerror = SCep +

ni (b
yij

y i )2

El segundo sumando de la expresin anterior se le denomina suma de cuadrados de falta de ajuste y con grados de libertad resultantes de la diferencia entre los
grados de libertad de SCerror y los grados de libertad de SCep , es decir m g. Denotemos por SCf a a la suma de cuadrados de falta de ajuste. Con esta expresin
se puede entonces estudiar la siguiente cantidad:
Fc =

SCf a =(m g)
SCep =(n m)

(8.26)

278

8. El modelo de anlisis de regresin

Se puede demostrar que (8.26) como variable aleatoria sigue una distribucin
F (m g; n m) bajo H0 (no hay carencia de ajuste): Si el valor p respectivo es
pequeo sugiere rechazar la hiptesis H0 de ausencia de falta de ajuste y entonces
el modelo no es aceptable en la explicacin de la variacin en los datos.
Ejemplo 8.5
En un estudio que simula la calibracin realizada por impulso completo se obtienen las tensiones pico de las pruebas que se realizan, manteniendo ja una
polaridad y en un divisor resistivo (a 300 kv) y a diferentes niveles de tensin
pico (kv). Los datos se presentan en la Tabla 8.9.
Un (kv)
Tensiones

X
y

125
165

100
115

200
122

75
32

150
153

175
152

75
46

175
122

125
155

200
104

100
137

Tabla 8.9 Datos que simulan el proceso de calibracin


El modelo estimado aplicando el procedimiento de mnimos cuadrados es:
^

y = 58:969 + 0:436x:
Ambos parmetros del modelo son no signicativos, donde los errores estndar
de estos son 39:4 y 0:0275 respectivamente. En la Tabla 8.10 se presenta el anlisis
de la varianza global para este modelo.
Fuente de
variacin
Regresin
Error
Total

Grados de
libertad
1
9
10

Suma de
cuadrados
4130:31
15004:42
19134:73

Cuadrados
medios
4130:31
1667:16

Fc

Valor p

2:48

0:1499

Tabla 8.10 ANDEVA para el modelo de primer orden


2
Este modelo tiene un coeciente de determinacin R2 = 0:216, (Rajustada
=
0:129): Dado que el valor p = 0:1499 indica que el modelo es no signicativo, la
prueba indica que el modelo de primer orden (lineal en x) no es el ms adecuado.
Observando la Fig. 8.4 se ve que existe una evidente falta de ajuste, tal
situacin da pie para tratar de ajustar algn otro modelo, en este caso el modelo
de segundo orden sera el adecuado, cuyo anlisis de varianza se muestra en la
Tabla 8.11. Mediante un contraste de hiptesis estadsticas se puede vericar la
evidencia de la falta de ajuste del modelo de primer orden.

8.5. La vericacin de falta de ajuste

279

Fig. 8.4: Modelo ajustado yb = 58:97 + 0:44x

Para vericar la falta de ajuste del modelo de primer orden, se tiene que
SCerror = 15004
SCep = 1002
y por lo tanto:
SCf a = 14002
mediante (8.26):
Fc =

14002
1002

6 2
= 17:47
11 6

con valor p = :004, con lo que se sugiere rechazar H0 , por lo que se concluye que
el modelo de primer orden no se ajusta adecuadamente a los datos.
Fuente de
variacin
Modelo
Error
Total

Grados de
libertad
2
8
10

Suma de
cuadrados
17079:90
2054:80
19134:73

Cuadrados
medios
8539:97
256:85

Fc

Valor p

33:2492

< :0000

Tabla 8.11 ANDEVA del ejemplo 8.5 para el modelo de segundo orden
Nuevamente estos resultados se resumen en una tabla del ANDEVA, juntando
la Tabla 8.11 de signicancia global con los resultados del ANDEVA de falta de

280

8. El modelo de anlisis de regresin

ajuste. stos se presentan en la Tabla 8.12. Observe que se puede obtener la


conclusin mencionada.

Fuente de
variacin
Modelo
falta de ajuste
error puro
Error
Total

Grados de
libertad
1
4
5
9
10

Suma de
cuadrados
4130:31
14002:42
1002:00
15004:42
19134:73

Cuadrados
medios
4130:31
3500:61
200:40

Fc

Valor p

18:10
17:47

0:0032
0:0038

Tabla 8.12 ANDEVA para vericar la falta de ajuste


En el siguiente ejemplo se realiza el anlisis anterior en un caso en donde hay
dos factores en el experimento.
Ejemplo 8.6
Un investigador estudia el efecto de la razn de carga (X1 ) y temperatura (X2 ) en
la vida de un nuevo tipo de celda de poder. Se realiza un experimento factorial
32 y con tres rplicas al centro, el objetivo de evaluar el nmero de ciclos de
la celda antes de fallar, los tres niveles para el primer factor X1 son (0:6; 1:0 y
1:4) medidos en amperes y otro factor X2 tiene los niveles (10; 20; 30) en o C. La
respuesta y mide la descarga de la celda, sta se midi en trminos del nmero
de ciclos de carga - descarga. Los datos se muestran en la Tabla 8.13.
Se propone el modelo:
y=

1 x1

2 x2

2
11 x1

2
22 x2

12 x1 x2

+ ":

Obtenga:
1. La tabla de coecientes.
2. La tabla de ANDEVA.
3. Haga la prueba de falta de ajuste, es decir verique si los datos apoyan la
hiptesis nula en (8.25). Observe que los siguientes clculos: la media de los
tres valores repetidos en cero, esto es: x = (157 + 131 + 184)=3 = 157:33;
luego la suma de la diferencia, de cada valor repetido con respecto a la
media al cuadrado:

8.6. Tipos de diseos para optimizacin

SCep = (157

157:33)2 + (131

SCf a = SCerror
Fc =

281

157:33)2 + (184

SCep = 5240:44
3835:77
3

157:33)2 = 1404:67

1404:67 = 3835:77

1404:67
= 1:82
2

Fc = 1:82 < F (0:05; 3; 2) = 19:2 (valor p = :428).


Hay que notar que de cualquier manera es til siempre analizar residuales de
modelos propuestos.
Razn de
carga
X1
0:6
1:0
1:4
0:6
1:0
1:0
1:0
1:4
0:6
1:0
1:4
X1 = 1

Tem
X2
10
10
10
20
20
20
20
20
30
30
30
X 2 = 20

x1
1
0
1
1
0
0
0
1
1
0
1

x2
1
1
1
0
0
0
0
0
1
1
1

Nmero
de ciclos
y
150
86
49
288
157
131
184
109
279
235
224

Tabla 8.13 Resultados del experimento

8.6

Tipos de diseos para optimizacin

Existen diseos apropiados para ajustar modelos de regresin de primer y segundo


orden. Una vez ajustado un modelo a los datos de la variable respuesta de manera
satisfactoria (signicancia global, R2 relativamente grande, no falta de ajuste),
ste se convierte en una herramienta til para buscar tratamientos en donde la
variable respuesta est optimizada (mxima o mnima segn el caso). En esta
seccin comentamos sobre los diseos ms usados en la bsqueda de un ptimo.
La estrategia completa ser presentada en el siguiente captulo.

282

8.6.1

8. El modelo de anlisis de regresin

Diseos de primer orden

Los diseos factoriales 2k ; los diseos factoriales fraccionados 2k , los diseos


Plackett-Burman y los arreglos ortogonales AOn (2k ) son diseos de primer orden, en el sentido de que presuponen que el comportamiento de y puede ser
descrito por medio de un polinomio de primer grado en la regin experimental
en la que actualmente se experimenta. As estos diseos se utilizan para determinar mejores tratamientos en trminos de aumentar o decrementar el valor de
la respuesta y, adicionalmente, agregando tratamientos formados con los niveles
intermedios de los factores, vericando la existencia de curvatura si hay carencia
de ajuste. Si la curvatura se detecta, probablemente se encuentre prximo un
tratamiento ptimo para la variable respuesta.

8.6.2

Diseos de segundo orden

La deteccin de curvatura alrededor de un ptimo requiere que los niveles de


los factores involucrados sean al menos tres. Despus de haber establecido la
proximidad de una regin ptima, los diseos denominados de segundo orden son
apropiados para encontrar una solucin ptima. Adems, los modelos ajustados a
partir de estos diseos permitirn plantear diferentes escenarios de optimizacin.
Existen varios diseos de segundo orden, en este apartado slo se abordarn los
diseos propuestos por Box - Behnken y Box - Wilson.
Diseo de Box - Behnken
An cuando se pueda fraccionar un diseo 3k el nmero de pruebas puede ser
muy alto. Existe una serie de factoriales con tres niveles que tienen caractersticas
estadsticas apropiadas para ser un buen esquema experimental, ms adelante se
har una breve descripcin de algunas propiedades.
Un tipo de diseo factorial incompleto con tres niveles en cada factor fue
desarrollado por Box y Behnken (1960). Este diseo se forma combinando un
diseo 22 con bloques incompletos balanceados. Por ejemplo, considere un experimento cuyo inters est en tres factores cada uno con tres niveles; una alternativa
de diseo es un factorial 33 que implica 27 tratamientos; un diseo tipo Box Behnken permite tener un menor nmero de tratamientos. El procedimiento de
construccin es como sigue: primero, se obtienen las posibles combinaciones de
los 3 factores en bloques de 2 factores, las posibles combinaciones representan el
nmero de bloques y se obtienen mediante la expresin:
3
2

3!
1 2 3
=
=3
2!(3 2)!
1 2 (1)

8.6. Tipos de diseos para optimizacin

283

lo que da lugar a tener tres bloques. En el segundo paso, se pone el diseo 22


en cada uno de los bloques, para jar ideas considere que el 22 se coloc en el
primer bloque, suponga que el 22 corresponde al primer y segundo factor, en este
caso para el tercer factor del bloque se escribe una columna con cuatro ceros
que representa el nivel intermedio. Esta disposicin se realiza en los dos bloques
restantes alternando los factores, es decir 22 en el segundo bloque se utiliza para
los factores 1 y 3, la columna con cuatro ceros para el factor 2; por ltimo, en el
tercer bloque el 22 se utiliza para los factores 2 y 3, la columna de ceros se asigna
al factor 1. El diseo Box - Behnken se completa agregando en cada bloque un
tratamiento extra que es la combinacin de los tres factores en su nivel intermedio
y es referido como tratamiento al centro.
Para enfatizar la construccin del diseo considere a c1 y c2 como las columnas del diseo 22 ; es decir, c1 = ( 1; 1; 1; 1)0 y c2 = ( 1; 1; 1; 1)0 ; el nivel
intermedio en cualquiera de los factores se indicar por una columna de ceros
ic = (0; 0; 0; 0)0 ; los valores que se muestran en estas columnas corresponden a
los codicados. Con xi ; i = 1; :::; k se indicar a las variables codicadas para
los factores en estudio. La estructura del diseo Box - Behnken se presenta en la
Tabla 8.14, los tres factores se han denotado por A; B y C.

Bloque
b1
b2
b3

A
c1
0
ic
0
c1
0

B
c2
0
c1
0
ic
0

C
ic
0
c2
0
c2
0

Tabla 8.14 Arreglo de un diseo Box - Behnken para tres factores

Finalmente se sustituyen los valores de c1 ; c2 e ic en los bloques, lo cual da


lugar al esquema experimental que se describe en la Tabla 8.15.

284

Trat
1
2
3
4
5

8. El modelo de anlisis de regresin

Bloque 1
A
B
1
1
1
1
1
1
1
1
0
0

C
0
0
0
0
0

Trat
11
12
13
14
15

Bloque 2
A B
0
1
0
1
0
1
0
1
0
0

Trat
6
7
8
9
10

1
1
1
1
0

Bloque 3
A
B
1 0
1 0
1 0
1 0
0 0

C
1
1
1
1
0

Tabla 8.15 El arreglo codicado del diseo de Box - Behnken


El diseo Box - Behnken construido de esta manera es vlido slo para k = 3;
4 y 5, el nmero de bloques para k factores se obtienen por la expresin: B =
k
k!
2 = 2!(k 2)! ; el nmero de tratamientos que se realizan en el diseo es igual a
22 B + R, donde R son las rplicas cuando todos los factores estn en su nivel
intermedio.
Nmero de
factores
3

Esquema
experimental
x1 x2 x3
c1 c2 ic
c1 ic c2
ic c1 c2
0 0 0
x1
c1
ic
0
c1
ic
0
c1
ic
0

x2
c2
ic
0
ic
c1
0
ic
c1
0

x3
ic
c1
0
ic
c2
0
c2
ic
0

x4
ic
c2
0
c2
ic
0
ic
c2
0

Nmero de
tratamientos
4
4
4
3;
n = 15
4
4
1
4
4
1
4
4
1
n = 27

Tabla 8.16 Diseo Box - Behnken para 3 y 4 factores


El diseo Box - Behnken tambin es un diseo de segundo orden porque es
adecuado para estimar un modelo de segundo orden, por ello es de gran util-

8.6. Tipos de diseos para optimizacin

285

idad para optimizar procesos como se ilustrar en el captulo de optimizacin.


Los bloques utilizados en la construccin de este tipo de diseos Box - Behnken
pueden utilizarse como bloques en el experimento. Sin embargo, como se ha visto
anteriormente, siempre es bueno que los efectos de bloque sean ortogonales a los
estimados de los parmetros de inters en el modelo. Para que un diseo Box Behnken sea un diseo ortogonalmente bloqueado se requiere del cumplimiento
de ciertas condiciones.
Para el caso general de diseos con bloques, Box y Hunter (1957) muestran
dos condiciones que deben satisfacer los bloques para que sean ortogonales a los
efectos en el modelo. Considere que nw representa el nmero de tratamientos del
bloque w; entonces las dos condiciones son:
1. Cada bloque debe ser un diseo ortogonal de primer orden, as para cada
bloque se satisface la siguiente relacin considerando un par de factores xj
y xl en el diseo codicado.
nw
X

xjl xhl = 0

l=1

j 6= h = 0; 1; 2; :::; k para toda w

(8.27)

2. La suma de los cuadrados de los tratamientos en cada bloque para cada


variable dividido por la suma de los cuadrados en todos los tratamientos
para cada variable, es igual a la fraccin del nmero de observaciones en
cada bloque entre el total de corridas N , es decir:
nw
P

l=1
N
P

l=1

x2jl
=
x2jl

nw
; j = 1; : : : ; k; para toda w:
N

(8.28)

Se puede decir que un diseo es deseable que sea corrido en bloques ortogonales a los efectos de inters cuando se espera que los efectos de bloque sean
grandes.
Aplicando estas condiciones a los diseos Box - Behnken, para k = 3 no se
satisface la segunda propiedad. En el caso k = 4, el diseo como se muestra
en la Tabla 8.16 satisface las dos propiedades anteriores. Adems, este diseo
tiene la propiedad de rotabilidad, propiedad que se describe en el siguiente subapartado. El diseo Box - Behnken para k = 5 en la Tabla 8.17 cumple con
las dos condiciones de ortogonalidad en los bloques mostrados. Si se requiere de
otros esquemas de bloqueo ortogonal diferentes a los dados directamente por los
diseos Box - Behnken, se pueden usar dos mtodos propuestos por Box y Draper
(1987) pginas 518 - 520.

286

8. El modelo de anlisis de regresin

El lector interesado en conocer los diseos para ms de 5 factores puede


consultar el artculo de Box y Behnken (1960). Ellos hacen una lista de diseos
hasta para k = 16, exceptuando el caso de k = 8.
Conviene puntualizar que el diseo Box - Behnken, k = 3 o 4; es de mucha
utilidad porque permite realizar con relativamente pocas corridas la estimacin
de un modelo de segundo orden, el cual permitir explicar el desempeo de la
variable respuesta, predecir resultados y obtener condiciones (tratamientos) ptimas de operacin. Por otro lado hay que notar que este tipo de diseos no
considera condiciones experimentales extremas, por ejemplo con k = 3 no considera la corrida ( 1; 1; 1) o la corrida (1; 1; 1) : Se recomienda utilizar este
diseo cuando el usuario tiene muy claro cmo funciona el proceso y despus de
haber realizado estudios experimentales preliminares para establecer qu factores
y niveles son importantes en la variable respuesta.
k nmero de
factores
5

Esquema
experimental
x1 x2 x3 x4
c1 c2 ic ic
ic ic c1 c2
ic c1 ic ic
c1 ic c2 ic
ic ic ic c1
0
0 0
0
ic c1 c2 ic
c1 ic ic c2
ic ic c1 ic
c1 ic ic ic
ic c1 ic c2
0
0 0
0

Nmero de
tratamientos
x5
ic
ic
c2
ic
c2
0
ic
ic
c2
c2
ic
0

4
4
4
4
4
3
4
4
4
4
4
3
n = 46

Tabla 8.17 Diseo Box - Behnken para 5 factores


Diseo Central Compuesto
El diseo central compuesto (dcc) fue propuesto por Box y Wilson (1951); este
diseo desempea un papel relevante en la investigacin que se realiza en el laboratorio, en el desarrollo de nuevos productos y para optimizar procesos industriales. El dcc abre la posibilidad de trabajar un proceso en una regin experimental
ms detallada, dado que considera a cada factor con cinco niveles. Por otro lado,
el diseo puede tener propiedades estadsticas importantes que se explicarn en

8.6. Tipos de diseos para optimizacin

287

este apartado.
El diseo central compuesto es adecuado para ajustar modelos de segundo
orden, es decir permiten evaluar la no linealidad de la respuesta, por ello se le
clasica como diseo de segundo orden. En el diseo dcc se tiene la ventaja de que
a pesar de que la regin experimental est descrita por factores con cinco niveles,
el nmero de corridas experimentales extras no crece demasiado. Es un diseo
ms eciente que los diseos factoriales construidos a partir del factorial 3k ; y es
ms eciente que el diseo Box - Behnken. Una discusin muy interesante sobre
la eciencia de los diseos dcc y factorial 3k se muestra en Myers y Montgomery
(1995).
Recuerde que una manera prctica de analizar los diseos, es pasar de la
regin de operacin real a una regin experimental codicada, as la descripcin
codicada de un factor en cinco niveles ser:
niveles

codicados

1 0 1

Para describir el mecanismo de codicacin imagine que en un proceso tiene


entre otros factores, el factor porcentaje de mezcla de una materia prima, considere que los valores mximo y mnimo de esas mezclas son 40% y 10 %, asigne
estos valores a y
en la escala codicada, respectivamente. Entonces el valor
intermedio no codicado es el promedio ((40 + 10)=2 = 25), de esta manera los
niveles codicados y reales son:
Niveles codicados
Valores reales

10

1
25

0
25

La obtencin del valor


depende del valor para
mediante la siguiente razn:
40 25
25 +
=
1:5 0
1

25
0

entonces:

1
25 +

40

; por ejemplo, si

= 1:5;

15
= 10
1:5

y as:
Niveles codicados
Valores reales

1:5
10

1
15

0
25

1
35

1:5
40

Empleando este mecanismo para los diferentes factores del experimento, se


construye un diseo central compuesto.
El dcc est formado por un diseo factorial 2k completo o fraccionado, al
que se le agregan 2 tratamientos a una misma distancia,
a ambos lados del
centro de cada factor (y as 2k en total), con lo que tales niveles sern
y
en la escala codicada. El diseo se completa con uno o ms tratamientos en el
punto intermedio de los niveles de cada factor (rplicas al centro). Con objeto de

288

8. El modelo de anlisis de regresin

Fig. 8.5: Diseo central compuesto para dos factores


establecer ideas considere un diseo con dos factores, en la Fig. 8.5 se describen
las caractersticas del diseo central compuesto para dos factores. El cuadrado
representa el diseo 22 ; en el centro del cuadrado estn los tratamientos en el
nivel intermedio y los puntos que representan a los cuatro tratamientos a una
distancia del centro son: ( ; 0); ( ; 0); (0;
) y (0; ); a estos ltimos se les
llama puntos axiales o estrella.
En la Tabla 8.18 se describe un diseo central compuesto para tres factores
en dos casos, el primero representa un diseo 23 completo y el otro se tiene una
fraccin 1=2, es decir 23 1 :
En el caso 1 se tienen 20 tratamientos, 8 corresponden al diseo 23 ; 6 a los
puntos estrellas, y 6 a los centrales. El segundo caso se muestra un dcc de 13
tratamientos.
La recomendacin general del nmero de puntos centrales es que oscile entre
dos y cinco, pero nada se pierde si se incrementa un poco ms, considerando slo
restricciones de costo.
El nmero de tratamientos en un diseo central compuesto queda dada por
T = 2k p + 2k + 1: Los T tratamientos se dividen en:
1. Los 2k p vrtices ( 1; 1; :::; 1) de un hipercubo k - dimensional, de resolucin V. Esta parte es un diseo con varianza ptima para estimar tr-

8.6. Tipos de diseos para optimizacin

289

minos lineales y de interaccin.


2. Los 2k puntos estrella ( ; 0; :::; 0); (0
; :::; 0); (0; 0; :::;
). Estos puntos
contribuyen en gran medida en la estimacin de los trminos cuadrticos,
sin ellos, los efectos cuadrticos no seran estimables en lo individual.
3. Un punto al centro (0; 0; :::; 0).
Caso 1
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

A
1
1
1
1
1
1
1
1

0
0
0
0
0
0
0
0
0
0

23
B
1
1
1
1
1
1
1
1
0
0

0
0
0
0
0
0
0
0

C
1
1
1
1
1
1
1
1
0
0
0
0

Caso 2
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13

23
B

A
1
1
1
1

0
0
0
0
0
0
0

C
1
1
1
1
0
0

0
0
0
0
0

1
1
1
1
0
0
0
0

0
0
0

0
0
0
0
0
0

Tabla 8.18 Esquema experimental de un diseo central compuesto


El nmero total de corridas ser entonces nc + ns + n0 ; donde nc = rc 2k p
(rc nmero de rplicas en cada punto de la parte factorial del dcc), ns = rs 2k
(rs nmero de rplicas en cada punto de la parte estrella del dcc), n0 rplicas al
centro que proveen de ser genuinas rplicas de una estimacin del error puro y
contribuyen tambin en la estimacin de los trminos cuadrticos.
La varianza del valor yb depende del punto donde se observe respecto a la
regin experimental y sta se calcula tomando la suma ponderada de las varianzas
de los estimadores. Un diseo es rotable si la varianza del valor predicho y^ es

290

8. El modelo de anlisis de regresin

igual en todos los puntos (tratamientos) de la regin experimental que estn a


la misma distancia del centro del diseo. Entonces se dice que la varianza de la
respuesta estimada depende nicamente de la distancia de los puntos en la regin
experimental al centro. Esta propiedad permite una estabilidad en la varianza de
yb(x); por ejemplo, si x1 y x2 son dos puntos en la regin experimental a la misma
distancia del centro, se tiene que la V ar(b
y (x1 )) y V ar(b
y (x2 )) son iguales, dando
lugar a homogeneidad en las predicciones independientemente de las direcciones
de stas. Por ello se considera importante tener diseos rotables o casi rotables.
El criterio para que un dcc que no se corra en bloques sea rotable se establece
mediante el valor :
1
= (2k p ) 4 :
(8.29)
Si se desea correr un dcc en bloques, uno por la parte factorial y otro formado
por los tratamientos estrella, pero sin que sea necesariamente rotable, se debe
satisfacer que:
1 + ns0 =ns
2
=k
1 + nc0 =nc
donde ns0 es el nmero de puntos al centro corridos junto a los puntos estrella
(ns ) y nc0 es el nmero de puntos al centro corridos juntos a los puntos de la
parte factorial (nc ). Para obtener rotabilidad y ortogonalidad simultneamente
se debe satisfacer que
rs
2k p 1 + nc0 =nc
= 2
:
rc
k
1 + ns0 =ns
Para mayores detalles consulte a Box y Draper (1987).

8.7

Ejercicios

Ejercicio 8.1 En un estudio de cocinado por extrusin de cierto cereal con alto
grado de protena, se tiene inters por conocer la textura del producto nal. En
la siguiente tabla se muestran los resultados parciales del estudio.
Temperatura (X)
Textura
(y)

125
1:4
1:6

150
2
2:2

175
4
3:1

200
4:2
4:8

225
3:4
3

1. Estime un modelo de primer orden, es decir: y =


2. Construya la tabla del ANDEVA.
3. Verique si existe la falta de ajuste en el modelo.

250
1:8
2
+

1X

275
1:2
1
+"

8.7. Ejercicios

291

Ejercicio 8.2 Se somete un material a cierta temperatura, se desea conocer


las impurezas generadas en un proceso qumico. A continuacin se muestran los
datos.
Temperatura (X)(o C)
90
100
110
120
130

Impurezas (y)(%)
18:4; 17:6; 18
11:7; 10:3
7:7; 8:3
6:5; 6:7
6:6; 7:2; 6:7

Los resultados estadsticos al ajustar el modelo lineal se muestran en las siguientes tablas:
Parmetro
intercepto
pendiente X

Coeciente
40:254
0:271

Error estndar
4:646
0:042

Estadstico t
8:664
6:471

Valor p
0:00001
0:00007

la Tabla del anlisis de la varianza:


Fuente de
variacin
Regresin
falta de ajuste
error puro
Error
Total

Grados de
libertad
1
3
7
10
11

Suma de
cuadrados
205:21
47:29
1:71
49:00
254:203

Cuadrados
medios
205:21
15:77
0:24
4:90

Fc

Valor p

41:88
64:66

0:00007
0:00002

Tabla . ANDEVA para la falta de ajuste del modelo


Coeciente de determinacin R2 = :8072 y error estndar estimado del error=
2:21362.
Preguntas:
1. Escriba el modelo lineal y diga si es signicativo.
2. Plante y contraste las hiptesis de ajuste del modelo, qu puede concluir?
3. Interprete el coeciente de determinacin.
4. Interprete el valor de la estimacin del parmetro para la temperatura.

292

8. El modelo de anlisis de regresin

5. Estime el error estndar del parmetro estimado de la temperatura.


6. Observe la grca de residuales, qu puede concluir?
A continuacin se muestran los resultados estadsticos agregando al modelo
el trmino cuadrtico:

Parmetro
constante
X
X2

Estimado
176:83
2:80
0:012

Error estndar
11:85
0:22
0:0009

Estadstico t
14:92
12:81
11:59

Valor p
0:000
0:000
0:000

2
= 0:985; ES = 0:5848
Rajustada
La hiptesis estadstica que se prueba es:

H0 :
H1 :

11
11

=0
6= 0

la tabla del ANDEVA:

Fuente de
variacin
Regresin
Error
Total

Grados de
libertad
2
9
10

Suma de
cuadrados
251:13
3:08
254:20

Cuadrados
medios
125:56
0:34

Fc

Valor p

367:12

0:000

R2 = 0:988 error std = 0:585 R2 (Adj) = 0:985


1. Compare los resultados de los dos modelos. Observe que en este caso se ha
agregado al ltimo modelo el trmino cuadrtico, se pueden considerar los
modelos lineal y cuadrtico como los modelos reducido y completo, en este
caso se prueba la hiptesis de la existencia del trmino cuadrtico, es decir
H1 : 11 6= 0; qu puede concluir?
2. Estime puntualmente su intervalo para el valor de las impurezas si la temperatura est a 95o C.
3. Observe el grco de residuales, qu observa?

8.7. Ejercicios

293

Ejercicio 8.3 Se ha probado que el tiempo de vida de un acumulador se puede


predecir midiendo la carga que se le proporciona a la batera (en volts). Se realiza
un prueba de vida acelerada, en este caso los acumuladores se sometieron a ciertas
condiciones ambientales de calor (entre otras posibles pruebas). Los datos para
seis acumuladores son :
Corriente X
17:9
23:6
30:9
56:1
61
77

Tiempo de vida y
245
220
215
211
161
135

Realce un anlisis completo.


Ejercicio 8.4 En referencia al Ejemplo 8.3, estime los coecientes de determinacin y correlacin, escriba la tabla del anlisis de varianza. Escriba los
intervalos de conanza para el parmetro 1 ; para la media de la variable de
respuesta y para predecir un valor de la variable de respuesta.
Ejercicio 8.5 (Myers y Montgomery (1995), cap. 2) Se realiz un estudio
para conocer el desgaste de un metal y y su relacin con la viscosidad del aceite
V X1 y su carga CX2 . En la tabla se muestran los resultados:
y
193
230
172
91
113
125

V X1
1:6
15:5
22:2
43:0
33:0
40:0

CX2
851
816
1058
1201
1357
1115

1. Ajustar un modelo de regresin lineal mltiple a estos datos; codique las


variables x1 y x2 tal que 1 xi 1; i = 1; 2.
2. Convierta el modelo del inciso anterior a un modelo usando las variables
V X1 y CX2 .
3. Use el modelo en 2 para predecir el desgaste cuando V X1 = 25 y CX2 =
1000.

294

8. El modelo de anlisis de regresin

4. Ajustar un modelo de regresin lineal con el trmino de interaccin. Use


las variables codicadas.
5. Use el modelo 4 para predecir el desgaste cuando V X1 = 25 y CX2 = 1000.
Compare su prediccin con el valor predicho en la parte 2.
6. Contraste la signicancia global del modelo de regresin en 1.1.Cules son
sus conclusiones?
7. Estime

para el modelo de no-interaccin.

8. Use el estadstico t para contrastar la signicancia de cada coeciente. Qu


conclusiones se pueden obtener?
Ejercicio 8.6 (Myers y Montgomery, 1995, cap. 2) Un ingeniero en una
industria que manufactura semiconductores desea establecer la relacin entre la
ganancia o h FE (y) y tres variables: emisin -RS :X1 , base -RS : X2 y emisin
a base -RS : X3 . Vea la tabla.
1. Ajuste un modelo de regresin lineal a los datos.
2. Prediga h FE cuando X1 = 14:5; X2 = 220 y X3 = 5:0:
3. Realice el contraste de signicancia, obtenga sus conclusiones.
4. Estime

para el modelo ajustado.

5. Indique los errores estndar de los coecientes de regresin.


6. Realice el contraste de signicancia individual para cada parmetro del
modelo.
7. Encuentre un intervalo de conanza para los coecientes de regresin.
8. Encuentre un intervalo de prediccin de 99%, para h FE cuando X1 = 14:50;
X2 = 220 y X3 = 5:0.
9. Encuentre un intervalo de conanza para la media de h FE, cuando X1 =
14:5; X2 = 220 y X3 = 5:0
10. Analice los residuales en el modelo.

8.7. Ejercicios

295

X1
14:620
15:630
14:620
15:000
14:500
15:250
16:120
15:130
15:500
15:130
15:500
16:120
15:130
15:630
15:380
15:500
14:250
14:500
14:620

X2
226:00
220:00
217:40
220:00
226:50
224:10
220:50
223:50
217:60
228:50
230:20
226:50
226:50
225:60
234:00
230:00
224:30
240:50
223:70

X3
7:000
3:375
6:375
6:000
7:625
6:000
3:375
6:125
5:000
6:625
5:750
3:750
6:125
5:375
8:875
4:000
8:000
10:870
7:375

y
128:40
52:62
113:90
98:01
139:90
102:60
48:14
109:60
82:68
112:60
97:52
59:06
111:80
89:09
171:90
66:80
157:10
208:40
133:40

Ejercicio 8.7 Un modelo de regresin:


y=

1 x1

2 x2

3 x3

+"
^

se ajust a una muestra de n = 25 observaciones. Los valores de tc =


para j = 1; 2; 3 son los siguientes:
Coeciente
1
2
3

Estadstico
tc = 4:82
tc = 8:12
tc = 0:98

Valor p

1. Encuentre el valor p para estos valores de t.


2. Obtenga las conclusiones sobre los coecientes de regresin.
Ejercicio 8.8 Considere los siguientes datos:

ES( ^ j )

296

8. El modelo de anlisis de regresin

x
1:0
2:0
3:3
4:0
4:5
5:0
5:6
6:0
6:5
6:9

10:84
16:35
22:88
24:56
24:59
22:25
25:9
25:45
21:03
21:46

y
9:3
24:35
25:86

27:2
26:56

29:46

25:61

1. Analice los residuales y obtenga sus conclusiones.


2. Realice la prueba del ANDEVA. Qu puede decir?
3. El modelo se ajusta adecuadamente?
Ejercicio 8.9 En la fabricacin de hule se combinaron dos factores, el primero
consisti de una X1 concentracin de silicato hidratado, el otro un X2 agente
qumico de selenio. En el proceso se mantuvo ja una concentracin de sulfuro.
El objetivo del experimento era medir la dureza (y) del hule. La descripcin del
rango de los factores se muestra a continuacin:
FactoresnNiveles
X1
X2

2
0:06
30

2
2:2
70

En diseo central compuesto con = 2, dos factores y cuatro replicaciones al


centro, se obtuvieron las siguientes respuestas:
Trat
1
2
3
4
5
6
7
8
9-12

x1
1
1
1
1
2
2
0
0
0

x2
1
1
1
1
0
0
2
2
0

y
39
75
70
71
48
75
66
73
75; 79; 83; 82

8.7. Ejercicios

297

1. Ajuste un modelo lineal, construya el ANDEVA y analice sus residuales.


2. Ajuste un modelo de segundo orden, indique la contribucin de la suma de
cuadrados de la contribucin en los trminos cuadrticos. Existe falta de
ajuste?
Ejercicio 8.10 El gerente de planta en una industria qumica tiene inters en
conocer cmo afecta la pureza de la concentracin de hexanol (pch) en el tiempo
de reaccin (tr) en varias tandas del proceso. Los datos registrados en 12 tandas
son los siguientes:
Tanda
1
2
3
4
5
6

pch
10
13
10
11
7
14

tr
300
380
350
320
280
400

Tanda
7
8
9
10
11
12

pch
9
13
10
9
12
14

tr
330
370
330
350
310
360

Obtenga un modelo que establezca la relacin entre estas variables y realice un anlisis estadstico para vericar si el modelo explica signicativamente
la relacin entre las variables, pruebe si el modelo se ajusta adecuadamente,
interprete el coeciente de determinacin.
Ejercicio 8.11 En un proceso se quiere conocer la relacin que existe entre
el tiempo de mezclado y la velocidad del equipo con la densidad. Un ingeniero
realiza varias pruebas sus resultados se muestran en la siguiente tabla:
Prueba
1
2
3
4
5
6
7
8
9
10

tm
5
5
5
5
7
7
7
7
8
8

vel
100
100
200
200
100
100
200
200
100
100

den
3:1
3:3
2:6
2:4
2:5
2:6
3:0
3:3
2:4
2:3

Prueba
11
12
13
14
15
16
17
18
19
20

tm
8
8
9
9
9
9
10
10
10
10

vel
200
200
100
100
200
200
100
100
200
200

den
3:2
3:5
2:8
2:6
3:1
3:0
3:2
3:4
2:5
2:4

Proponga un modelo de primer orden y pruebe estadsticamente si existe


falta de ajuste. Realice un anlisis estadstico completo para evaluar el modelo.

298

8. El modelo de anlisis de regresin

Proponga el modelo de segundo orden y pruebe la falta de ajuste. Finalmente,


agregue al modelo el efecto de interaccin del trmino cuadrtico de la primera
variable con la segunda variable. Comente los resultados.
Ejercicio 8.12 Jurez et al. (1991) investig sobre la conservacin y aprovechamiento agroindustrial de la jcama. Emple la tcnica de la deshidratacin osmtica para estudiar la conservacin de la jcama, su objetivo era encontrar las
condiciones que permitieran recuperar a la jcama el 100% de agua despus de
haberla deshidratado considerando el tiempo de almacenamiento. El diseo propuesto fue de Box - Behnken, considerando tres factores en el estudio:

Bloque
1

A
x1
1
1
1
1
0
1
1
1
1
0
0
0
0
0
0

B
x2
1
1
1
1
0
0
0
0
0
0
1
1
1
1
0

C
x3
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0

y
97
74
100
77
87
99
75
99
76
86
84
88
83
89
86

1. Describa en una grca los efectos de cada factor.


2. Estime los efectos de los factores tanto lineal como cuadrtico.
3. Haga la prueba de falta de ajuste.
4. Complete el anlisis estadstico.
5. Estime el modelo regresin considerando el bloqueo y sin considerar el
mismo. Al compararlos, qu se observa y por qu?
Ejercicio 8.13 En la elaboracin de protena vegetal texturizada a partir de
harina desengrasada de cacahuate mediante un proceso de extrusin Trejo (1984)

8.7. Ejercicios

299

tuvo inters en estudiar el comportamiento del ndice de absorcin del agua (iaa),
y determinar el contenido de protena, entre otras caractersticas. Se consider
que tres factores tienen una fuerte inuencia en las respuestas, para evaluar el
efecto de estos factores se utiliz el diseo Box - Behnken. Los factores y sus
niveles se describen a continuacin:
FactoresnNiveles
Humedad de la harina X1 (%)
:
Temperatura del extrusor X2 (o C)
Velocidad del tornillo X3 (rpm)

1
20
100
400

0
25
125
600

1
30
150
800

Se aleatorizan sin restricciones los tratamientos y se efecta el experimento,


los resultados se muestran en la tabla siguiente:
Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

x1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
0

x2
1
1
1
1
0
1
1
1
1
0
0
0
0
0
0

x3
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0

iaa
9:6
16:9
15:1
8:7
16:3
8:8
8:4
7:3
8:7
16:9
9:1
9:5
7:3
6:4
12:1

1. Describa en una grca los efectos de cada factor.


2. Estime los efectos de los factores tanto lineal como cuadrtico.
3. Complete el anlisis estadstico con bloques y sin ellos. Al compararlos,
qu se observa y por qu?
Ejercicio 8.14 La produccin de jarabes glucosados a partir de harina integral
de amaranto es estudiada por Barba (1989). En resumen el objetivo es conocer la
produccin de hidrlisis de almidn en la enzima glucoamilasa bajo los factores
de concentracin de sustrato (%) y tiempo (min).

300

8. El modelo de anlisis de regresin

En esta investigacin se us un diseo central compuesto para encontrar las


condiciones de optimalidad en la produccin de hidrlisis. La descripcin de los
factores y la estructura del experimento considerada se muestran a continuacin:
FactoresnNiveles
A : X1 :sustrato
B : X2 :enzima
C : X3 :tiempo
=2

0:05
10
15

Trat
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

x1
1
1
1
1
1
1
1
1
2
2
0
0
0
0
0
0

1
0:1
15
30

x2
1
1
1
1
1
1
1
1
0
0
2
2
0
0
0
0

1
0:15
20
45

x3
1
1
1
1
1
1
1
1
0
0
0
0
2
2
0
0

0:2
25
60

0:25
30
75

y
11.5
11.9
12.7
11.1
15.5
11.7
15.3
12.7
14.9
10.4
11.9
9.0
13.6
15.1
15.0
17.2

1. Describa en una grca los efectos de cada factor.


2. Estime los efectos de los factores tanto lineal como cuadrtico.
3. Desarrolle la prueba de hiptesis para el trmino cuadrtico del segundo
factor.
4. Escriba el intervalo de conanza para el parmetro lineal del primer factor.
5. Contraste la signicancia global del modelo mediante el anlisis de la varianza.
6. Explique los resultados en funcin del coeciente de determinacin.
7. Verique si hay falta de ajuste del modelo.

8.7. Ejercicios

301

Ejercicio 8.15 Considere el ejercicio 6.4. Dado que A; B y C son factores


cuantitativos y D es cualitativo, proceda a su anlisis tpico de covarianza como
el comentado en la seccin 2.5.2 de este texto para ambas variables respuesta.
Qu implica en el modelo estadstico por ajustarse? Realice el anlisis y compare
resultados con aquellos obtenidos en el ejercicio 6.4.
Ejercicio 8.16 Se llev a cabo un experimento en un proceso textil en el que
se consider la cantidad de tinte como un factor seal. La densidad de color fue
la caracterstica dinmica en este estudio.
Se tiene un factor control (A) el tipo de tinte con dos niveles, nuevo y actual.
Un factor de ruido (R), recoge las condiciones no controladas del proceso tales
como la limpieza de la prenda, las condiciones ambientales y la temperatura de
teido, as los niveles de este factor 1: condiciones adecuadas, 2: condiciones
normales, 3: condiciones no adecuadas. Los datos que se obtienen al realizar el
experimento son:

A
1

R
1
2
3
1
2
3

M1
1%
10:7
10:8
10:5
10:6
10:9
10:5

M2
2%
13:6
13:2
13:1
13:5
13:4
13:2

1. Estime el modelo de regresin y =


para cada nivel del factor A.

0+

M3
3%
16:8
16:1
16:0
16:6
16:4
16:1

M4
4%
19:1
19:0
18:7
19:5
19:4
19:0

M5
5%
21:9
21:7
21:5
21:9
21:5
21:3

M + , el cuadrado medio del error

2. Compare los resultados para cada nivel de A. Es preferible cambiar a la


nueva pintura? Por qu? Qu decisin toma a partir de los valores de las
pendientes?
3. Los lectores interesados en conocer ms sobre este tema conocido como
Diseo con Caractersticas Dinmicas pueden consultar los siguientes dos
artculos: Lunani et. al (1997) y Miller (2002).

302

8. El modelo de anlisis de regresin

Captulo 9

Optimizacin estadstica del


proceso
Las personas que maniestan mayor desprecio por la teora, encuentran
en ella, sin sospecharlo, un alimento cotidiano, si estuviramos privados
de este alimento el progreso se detendra.
Henri Poincar

9.1

Introduccin

En los captulos anteriores hemos presentado diseos experimentales que permiten


estimar efectos que sobre una variable respuesta tienen factores individuales y/o
sus interacciones, as como la estimacin de la variable respuesta.
Otro objetivo de suma importancia es el identicar qu condiciones hacen que
la variable respuesta estimada alcance un valor ptimo. Para el cumplimiento de
este objetivo es necesario un enfoque metodolgico que combine el uso de los
diseos experimentales antes vistos y las tcnicas de modelaje del anlisis de
regresin del captulo anterior, pero adicionando tcnicas matemticas de optimizacin. A esta combinacin se le ha dado el nombre general de Metodologa
de Supercie de Respuesta (MSR).
La MSR se desarroll inicialmente por Box y Wilson (1951). Hill y Hunter
(1966) llevan a cabo una excelente revisin de sus fundamentos. Myers (1971)
fue el primer libro sobre este tema. La evolucin de la computacin hizo que esta
tcnica cobrara un gran impulso y as, en estudios ms recientes Khuri y Cornell
(1987), Box y Draper (1987) y Myers y Montgomery (1995) publicaron notables
trabajos acerca de la metodologa.
La MSR es una herramienta que se ha utilizado ampliamente en el desarrollo de procesos industriales y en el desarrollo tecnolgico, por ejemplo en la

304

9. Optimizacin estadstica del proceso

elaboracin de alimentos. Beetner (1974) emplea un diseo 23 en el estudio de la


degradacin en el cocinado de extrusin de tiamina y riboavina. Con el objetivo
de optimizar la produccin de jamn, Motycka et al. (1984) aplican en una etapa
inicial un diseo 23 con replicaciones al centro, y en la etapa de optimizacin emplean un diseo central compuesto. En la produccin de jarabes de glucosados a
partir de harina integral de amaranto, Barba (1989) lleva a cabo un experimento
factorial central compuesto. Para elaborar alimentos de soya por extrusin Aguilera y Kosikowski (1976) propusieron un diseo de Box - Behnken. Este ltimo
esquema experimental ha servido como modelo a otros estudios como el de Trejo
(1984) en el estudio de harina desengrasada de cacahuate; Mora (1989) lo utiliza
para investigar las condiciones apropiadas para la germinacin del amaranto; Petres y Czukor (1989) lo emplean para estudiar los efectos de la coccin - extrusin
sobre factores antinutricionales. En la misma lnea de estos diseos, Jurez (1991)
estudia condiciones de optimizacin para la conservacin de la jcama aplicando
la tcnica de deshidratacin osmtica. Guzmn (1991) realiza un estudio que
tiene como objetivo la optimizacin de un proceso enzimtico para producir maltodextrinas, ah emplea una combinacin de diseos cubo - octaedro. Mullen y
Ennis (1979) proponen un esquema experimental para estudiar propiedades sensoriales y de calidad nutricional en la elaboracin de un producto. Shih et al.
(1997) realizaron un estudio de optimizacin para tofu o queso de soya. Ilo et al.
(1999) utilizan la MSR para estudiar el efecto del cocimiento en un proceso de
extrusin de productos hechos de mezclas de harinas de arroz y de amaranto.

9.2

Ubicando a la regin ptima

La MSR requiere identicar inicialmente una regin experimental en donde se


sospeche que la respuesta sea factible optimizar. El investigador debe inicialmente
seleccionar la variable respuesta y los factores de estudio (X1 ; :::; Xp ) e identicar
la combinacin de stos que a la fecha se conozca como la mejor (ptima en
esta etapa inicial) en la respuesta; tal combinacin se piensa como el centro de
un diseo experimental. En general se utilizan inicialmente diseos factoriales
2k o sus fracciones con tratamientos al centro (ptimo actual), diseos de
primer orden, de tal manera que se pueda ajustar un modelo de primer orden
para determinar cules son los factores importantes en su efecto lineal y vericar
estadsticamente si existe o no falta de ajuste del modelo de primer grado. Si no
hay evidencia de falta de ajuste se utiliza el modelo ajustado de primer grado
para trasladarse de manera secuencial a travs de una trayectoria optimizante
correspondiente a este modelo hasta encontrar un tratamiento en el que se detecte estadsticamente falta de ajuste de la supercie de primer orden, es decir,
un cambio en la curvatura de la variable respuesta observada. Al ubicarse en

9.2. Ubicando a la regin ptima

305

tal tratamiento, en la regin circundante a ste se realiza experimentacin adicional con un diseo experimental que permita estimar los efectos cuadrticos
potencialmente responsables de la curvatura encontrada.
Ejemplo 9.1
En el proceso de nixtamalizacin se consideran los factores tiempo, temperatura
y la concentracin de cal en 0.8%, se desea encontrar una regin de operacin de
tal manera que el ndice de absorcin de agua (iia) se incremente. Como esta era
una investigacin inicial en donde no exista mucha informacin a priori sobre
las mejores condiciones para lograr tal reduccin, se tomaron dos niveles de los
primeros dos factores, para el tiempo 10 y 20 minutos y para la temperatura 80
o C y 90 o C, la concentracin de cal fue jada en 0.8.
FactornNiveles
t: tiempo min
T : temperatura o C

1
10
80

1
20
90

La codicacin de los factores de la regin experimental original a la regin


codicada se expresa por las siguientes frmulas primero la del factor tiempo y
luego la de temperatura:
x1 =

x2 =

1
2 amplitud

1
2 amplitud

15
5

85
5

t
5

(9.1)

T
5

(9.2)

El diseo inicial que se realiz fue un diseo factorial 22 con dos replicaciones
tanto en la parte factorial como al centro (niveles intermedios de los factores).
La Tabla 9.1 muestra los resultados.
tpo
10
20
10
20
15

temp
80
80
90
90
85

x1
1
1
1
1
0

x2
1
1
1
1
0

iia1
2:3
3:7
4:6
5:3
3:8

iia2
2:5
3:2
4:9
5:8
3:8

Tabla 9.1 Resultados del diseo 22 con replicaciones al centro


Con esta informacin se ajusta por mnimos cuadrados un modelo de primer
orden, resultando:
yb = 3:99 + 0:463x1 + 1:113x2:
(9.3)

306

9. Optimizacin estadstica del proceso

Se observa de la Tabla 9.2 que el efecto de los factores tiempo y temperatura es


signicativo. El porcentaje de la variabilidad total explicada por el modelo es
R2 = 0:964; y el modelo se ajusta adecuadamente a los datos, la prueba de falta
de ajuste que se presenta en la Tabla 9.2 lo conrma.
Fuente de
variacin
Tiempo
Temperatura
Error total
Falta de ajuste lineal
Error puro
Total

Grados de
libertad
1
1
7
2
5
9

Suma de
Cuadrados
1:711
9:901
0:437
0:122
0:315
12:049

Cuadrados
medios
1:711
9:901
0:0624
0:061
0:063

Fc

Valor p

27:4
158:7

0:001
0:000

0:96

0:4424

Tabla 9.2 Anlisis de falta de ajuste del modelo lineal del Ejemplo 9.1
Por ende, se presume que la regin experimental vigente indica la posibilidad
de seguir en la bsqueda del ptimo por medio del modelo de primer orden
ajustado: se observa que al aumentar el tiempo y la temperatura el iia aumenta,
ya que sus coecientes estimados son positivos; esto se muestra grcamente en
la Fig. 9.1, donde se trazan las curvas (lneas en este caso) de nivel y la recta
perpendicular a esas lneas, que representa la trayectoria optimizante. Observe
que las curvas de nivel se obtiene a partir de la ecuacin (9.3), por ejemplo
suponga que yb = 3:99, entonces x1 = 1:113
0:463 x2 , en este caso el coeciente de x2
corresponde a la pendiente de las curvas de nivel y el recproco de esta cantidad
corresponde a la pendiente de la trayectoria optimizante.
Del modelo (9.3) la direccin de ascenso o trayectoria optimizante es la que
sigue a (0:463; 1:113) o de manera equivalente a (1; 2:4) ; es decir que las curvas
de nivel de la respuesta se mueven 1.113 unidades en la direccin de x2 para cada
0.463 unidades en la direccin de x1 ; o por una unidad en x1 hay que recorrer 2.4
unidades en x2 ; esto es:
0:463x1 = 1:113x2
x1 = 2:4x2

(9.4)

La ltima relacin en (9.4) equivale a la trayectoria optimizante ya que es


usada como gua para encontrar nuevos puntos que permitan realizar nuevos
experimentos secuenciales hasta encontrar cambios importantes en la respuesta
observada. As, al jar un cambio en uno de los factores codicados, se obtiene

9.2. Ubicando a la regin ptima

307

Fig. 9.1: Curvas de nivel y trayectoria optimizante en el primer experimento del


Ejemplo 9.1

308

9. Optimizacin estadstica del proceso

el otro: suponga que el ingeniero del proceso decide incrementar secuencialmente


el tiempo en dos minutos, t = 2 a partir del centro del diseo. De la expresin
(9.4) se tiene que:
t
2
x1 =
= = 0:4
(9.5)
5
5
y usando (9.4) x2 = 2:4 0:4 = 0:96 que corresponde a una temperatura de
T = 5x2 + 85 = 89:8 ' 90 utilizando (9.2). Estos resultados se interpretan
diciendo que al incrementar el tiempo en dos minutos corresponde incrementar
la temperatura en 5 grados para as estar sobre la trayectoria optimizante (9.4).
De tal manera se plantea una estrategia secuencial de experimentacin como se
muestra en la Tabla 9.3; ah se muestran los nuevos puntos experimentales, tanto
codicados como originales, con incremento codicado = (0:4; 0:96):
x1
0
0:4
0:6
0:8
1:2
1:6

base
base +
base + 1:5
base + 2
base + 3
base + 4

x2
0
0:96
1:44
1:92
2:88
3:84

tpo
15
17
18
19
21
23

temp
85
90
92
95
100
104

iia
3:5
5:4
5:9
6:3
6:5
6:1

Tabla 9.3 Estrategia experimental secuencial en la trayectoria


optimizante del Ejemplo 9.1
Observe que la respuesta va aumentando hasta 3 con un valor de 6.5, pero
que con 4 existe un cambio en la respuesta 6.5 a 6.1, tal situacin abre la
posibilidad de realizar un nuevo diseo factorial 22 + n0 (n0 = 2) circundante a la
condicin original (23,104). Tal diseo se muestra en la Tabla 9.4:
x1
1
1
1
1
0

x2
1
1
1
1
0

tpo
18
28
18
28
23

temp
100
100
110
110
105

iia1
6:3
6:7
5:5
6:5
7:0

iia2
6:1
7:0
5:7
6:3
6:2

Tabla 9.4 Segundo diseo experimental del Ejemplo 9.1


El modelo de primer grado estimado es:
yb = 6:33 + 0:36x1

0:26x2 ;

con R2 = 0:722, su anlisis de falta de ajuste se muestra en la Tabla 9.5.

9.2. Ubicando a la regin ptima

Fuente de
variacin
Tiempo
Temperatura
Error total
Falta de ajuste lineal
Error puro
Total

Grados de
libertad
1
1
7
2
5
9

309

Suma de
cuadrados
1:051
0:551
0:619
0:193
0:425
2:221

Cuadrados
medios
1:051
0:551
0:088
0:097
0:085

Fc

Valor p

11:94
6:26

0:011
0:0411

1:14

0:391

Tabla 9.5 Anlisis de carencia de ajuste del modelo de primer grado


del segundo diseo experimento del Ejemplo 9.1
Nuevamente no hay evidencia de falta de ajuste del modelo de primer grado,
por lo que es necesario determinar la trayectoria optimizante correspondiente,
0:26
que resulta ser: x2 = 0:36
x1 = 0:73x1 . Ahora se propone un incremento
de 5 minutos, por lo que el decremento en la temperatura es aproximadamente
de 4 grados, ( T = 5x2 = 5( 0:73x1 ) = 5( 0:73 1) 3:63). Los resultados
de la experimentacin secuencial se muestran en la Tabla 9.6 pero ahora con
= (1; :73) :

base
base +
base + 2
base + 3

x2
0
1
2
3

x2
0
0:73
1:45
2:18

tpo
23
28
33
38

temp
105
101
97
93

iia
6:5
6:9
7:1
6:7

Tabla 9.6 Tercer diseo experimental del Ejemplo 9.1


Como se ha dicho anteriormente, el cambio del iia; de 7.1 a 6.7 da lugar a
una nueva experimentacin para vericar curvatura. Esta se muestra en la Tabla
9.7.
x1 x2 tpo temp iia1 iia2
1
1 25
95 5:9 6:2
1
1 39
95 5:4 5:7
1
1 25
105 6:0 5:9
1
1 39
105 6:2 6:3
0
0 32
100 7:4 7:5
Tabla 9.7 Cuarto experimento en el Ejemplo 9.1

310

9. Optimizacin estadstica del proceso

Con estos resultados se estima el modelo de primer grado y se concluye que


el modelo no es adecuado ya que R2 = 0:12 y que la carencia del ajuste lineal es
evidente observando la Tabla 9.8.
Fuente de
variacin
Falta de ajuste lineal
Error puro
Error total

Grados de
libertad
2
5
7

Suma de
cuadrados
3:92
0:11
4:025

Cuadrados
medios
1:96
0:021

Fc

Valor p

93:33

0:0001

Tabla 9.8 Anlisis de falta de ajuste para el cuarto experimento


del Ejemplo 9.1
Esto sugiere que el modelo de primer grado no es suciente por posible curvatura en la respuesta, por lo que se propone un diseo experimental que permita estimar tambin los efectos cuadrticos responsables del cambio observado
en iia. Una alternativa a esta situacin es realizar la prueba de curvatura, donde
la hiptesis nula plantea: H0 : no hay curvatura. Esta hiptesis se contrasta
estimando la suma de cuadrados del efecto de curvatura utilizando la siguiente
expresin:
2
N nobC
SCcurvatura =
;
(9.6)
N + no

donde C = y o y t que el cambio de la media del centro con respecto a los


tratamientos. N = r2k (r rplicas) y no puntos en el centro del diseo. El valor
generado por la ecuacin (9.6) se incorpora al anlisis de la varianza y el resumen
se describe en la Tabla 9.9. A partir del estadstico de prueba F se verica que
el efecto de curvatura es signicativo.
Fuente de
variacin
Modelo
Curvatura
Error total
Total

Grados de
libertad
3
1
5
9

Suma de
cuadrados
0:52
3:6
0:10
4:22

Cuadrados
medios
0:173
3:60
0:021

Fc

Valor p

8:254
171:43

0:0221
0:0000

Tabla 9.9 Anlisis de varianza que incluye la suma de cuadrados para la curvatura.
Donde C = y o 41 (y 1 + y 2 + y 3 + y 4 ) = 7:45 5:95 = 1:5; y i (i cada tratamiento).
En este contexto, un diseo central compuesto (dcc) resulta ser apropiado,
as que se realiza un experimento utilizando el esquema de un dcc, el diseo y los

9.2. Ubicando a la regin ptima

311

resultados se muestran en la Tabla 9.10.


x1

x2

1
1
1
1
1:41
1:41
0
0
0
0
0

1
1
1
1
0
0
1:41
1:41
0
0
0

tpo
27
37
27
37
25
39
32
32
32
32
32

temp
95
95
105
105
100
100
88
112
100
100
100

iia
6:3
5:4
5:8
6:5
4:9
5:6
5:9
6:8
7:5
7:3
7:8

Tabla 9.10 dcc y resultados experimentales del Ejemplo 9.1

El modelo de segundo orden por ajustar es el siguiente:

yi =
"i

N (0;

1 x1i
2

2 x2i

2
11 x1i

2
22 x2i

12 x1i x2i

+ "i ;

); independientes.

Del proceso de estimacin de los parmetros se tienen los siguientes resultados:

^
0
^
1
^
11
^
2
^
22
^
12

Estimado
7:530
0:099
1:092
0:234
0:542
0:400

Valor p
< :001
0:3951
0:0003
0:0783
0:0079
0:0444

2
con una Rajustada
= 0:8959: El anlisis de la varianza se presenta en la Tabla
9.10, en sta se observa que este modelo cuadrtico no muestra falta de ajuste.

312

9. Optimizacin estadstica del proceso

Fig. 9.2: Modelo y curvas de nivel para el modelo cuadrtico del iia

Fuente de
variacin
Modelo cuadrtico
Error
Falta del ajuste cuadrtico
Error puro
Total corregido

gl
5
5
3
2
10

Suma de
cuadrados
8:18
0:45
0:32
0:13
8:63

Cuadrados
medios
1:64
0:09
0:11
0:07

Fc

Valor p

18:21

0:0032

1:57

0:41

Tabla 9.10 Anlisis de la varianza ajustando un modelo cuadrtico

En la Fig. 9.2 se puede ver en la grca que est a la derecha la supercie


que corresponde a este modelo y la de la izquierda indica las curvas de nivel en la
supercie; estas curvas de nivel son particularmente tiles porque permiten crear
varios escenarios en donde la respuesta del proceso sea cercana al ptimo. Por
ejemplo, si el investigador decide que un ndice de absorcin de agua es adecuado
en 7.0, entonces en cualquier punto de la segunda elipse concntrica en las curvas
de nivel en la Fig. 9.2 se tendrn soluciones adecuadas para este proceso. En
trminos prcticos esto quiere decir que se podr ajustar el proceso a diferentes
temperaturas y tiempos, tal decisin depender de los intereses del investigador.

9.2. Ubicando a la regin ptima

313

Procedimiento para estimar las condiciones de optimizacin


En la regin experimental actual y con el modelo cuadrtico ajustado se puede
proceder a estimar las condiciones de optimizacin de la respuesta. As, en general
la MSR plantea los siguientes pasos:
Diseo y modelo de primer orden: plantear y ajustar un modelo de primer
orden en la regin experimental de las variables x1 ; x2 ; :::; xp , es decir:
yb = b 0 +

p
X
i

b xi
i

En el caso de que la falta de ajuste sea no signicativa se procede a establecer


la trayectoria optimizante.
Determinar trayectoria optimizante:
Sin restricciones: la direccin de la trayectoria optimizante est determinada por los coecientes estimados correspondientes del modelo de
primer grado ( ^ 1 ; ^ 2 ; :::; ^ p ). El investigador propone un incremento
en uno de los p factores del experimento, por ejemplo, suponga que
el incremento codicado en el j-simo factor a lo largo de la trayectoria optimizante se denota por xO
j ; computado a partir del incremento
deseado j en la escala original del factor j a travs de:
xO
j =

Rj

donde:
1
Rj = (max valores de xj
2

min valores de xj )

Los incrementos correspondientes a los otros factores son:


O
xO
i = xj

^
^

i
j

; i = 1; :::; p; i 6= j

(9.7)

Estos incrementos al trasladarse a las escalas no codicadas indicarn


al experimentador qu pruebas experimentales deben realizarse.
Con restricciones: sin embargo, existen situaciones en las que a lo largo
de la trayectoria optimizante pueden generarse valores de los factores
que no tengan sentido en la experimentacin por alguna razn, esto

314

9. Optimizacin estadstica del proceso


hace que cada prueba experimental a lo largo de la trayectoria optimizante tenga que satisfacer restricciones. Esto equivale a utilizar una
trayectoria optimizante dada nuevamente por los coecientes estimados del modelo:
p
X
b xi
yb = b 0 +
i
i

pero sujeta a que slo se mueva en una regin experimental de inters,


digamos R. Por ejemplo podra ser que R fuera una hiperesfera de rap
P
x2i
r2 . El planteamiento
dio r. Esta restriccin se traduce como
i

matemtico para la determinacin de la trayectoria optimizante requiere formalmente optimizar:


L(x1 ; x2 ; :::xp ) = b 0 +

p
X
i

b xi
i

p
X
(
x2i

r2 )

(9.8)

El ptimo se obtiene de las derivadas parciales de L con respecto a


x = (x1 ; x2 ; :::; xp ) y :
@L
= bi
@xi

2 xi

@L
=
@

p
X
(
x2

r2 )

donde i = 1; :::; n, igualando con cero la primer ecuacin tenemos:


xO
i =

2xO
i

(9.9)

Observe que las componentes de xO estn relacionadas con los estimadores de los parmetros y depende del parmetro de Lagrange ;
ste ltimo llamado as porque el planteamiento en la expresin (9.8)
se debe al gran matemtico francs Lagrange. Si la trayectoria es de
ascenso es positiva y si la trayectoria es de descenso es negativa.
Ahora el objetivo es encontrar los valores de las coordenadas xO para
determinar los nuevos puntos de experimentacin, siempre dentro de la
regin R. Primero se ja un incremento en algn factor ya codicado;
por supuesto tal incremento depender de los valores que se puedan
tomar en la regin experimental original. As si el incremento deseado
ya codicado en el j-simo-factor es xO
j , al sustituirlo en (9.9) se tiene
que:
b
j
^= O
2xj

9.2. Ubicando a la regin ptima

315

Finalmente, se emplea el valor de ^ para encontrar las coordenadas


O
restantes xO
i ; i = 1; :::; p; i 6= j: Estos valores xi se decodican y se
toman como base para ir realizando una experimentacin secuencial,
hasta que la respuesta observada muestre un cambio en su tendencia.
En el siguiente ejemplo se muestran los clculos de este procedimiento
para un proceso reportado en la literatura industrial.
Ejemplo 9.2
En el estudio de procesamiento de jamn reportado por Motycka et al. (1984), se
escogieron tres factores para el proceso: revoluciones por minuto de la revolvedora
(3000 rpm y 4000 rpm), texturacin mecnica (100% y 150% ) y la temperatura
del proceso (8 o C y 16 o C); una de las variables de respuesta fue el rendimiento
de jamn en porcentaje. Se emple un diseo 23 con cuatro replicaciones en el
centro (3500 rpm, 125% ,12 o C). El modelo de primer grado:
yb = 90:04

0:06x1

0:88x2 + 0:99x3

considerado estadsticamente signicativo (y sin carencia de ajuste). El procedimiento para encontrar las condiciones experimentales a lo largo de la trayectoria
optimizante (en este caso ascendente):
Se plante un decremento de
Entonces
x1 =
donde Ri = 12 (4000

= 68 rpm para el factor 1.

68
=
500

0:136 '

0:14

3000) = 500

El valor de ^ , se estima como:


^=
.

2x1

0:06
= 0:214
2( 0:14)

Para completar, se encuentran los incrementos para los otros factores como:
x2 =
x3 =

2
b
2

0:88
=
2(0:214)

0:99
2(0:214)

2:06 '

= 2:31 ' 2

316

9. Optimizacin estadstica del proceso


Los valores decodicados son:
X2 =

25 =

50

X3 = 2

4 = 8;

es decir la texturacin mecnica tambin se decrementa y la temperatura


se incrementa en 8. Entonces el siguiente experimento se realiz en los
niveles 3432 rpm, 75% y 21C respectivamente, para cada uno de los factores
considerados el valor de la respuesta se redujo. Este cambio en el valor de
la respuesta nos puede sugerir la realizacin de un nuevo experimento con
la posibilidad de encontrar un ptimo.
En el siguiente apartado describiremos la estrategia matemtica de cmo encontrar una condicin o tratamiento (combinacin de los factores involucrados)
donde la supercie de respuesta estimada alcance su ptimo .

9.3

Procedimiento de optimizacin

Ya habiendo agotado las trayectorias optimizantes, se presume que en la regin


experimental actual se estar cercano a una regin donde la supercie de respuesta alcance su valor ptimo. Habr entonces que plantear un diseo de segundo
orden que permita corroborarlo; esto se hace a travs de estimar los efectos lineales, pero primordialmente a los efectos de segundo orden. As, el diseo debe
permitir estimar y contrastar hiptesis referentes al modelo cuadrtico:
y=

p
X

i x1

p X
p
X
i

ij xi xj

+ ";

"

N (0;

(9.10)

El modelo (9.10) ya ajustado a los datos del experimento se representa como:


yb = b 0 +

p
X
i

b xi +
i

p X
p
X
i

b xi xj
ij

(9.11)

si el ajuste es satisfactorio (9.11) se utilizar para encontrar el valor ptimo.


Con el objetivo de facilitar el lgebra involucrada en la determinacin del punto
potencial con el valor ptimo en la respuesta, escribamos el modelo (9.11) en
forma matricial:
b
yb = b 0 + x0 b + x0 Bx

(9.12)

donde b representa al vector cuyas componentes son los estimadores de los


parmetros del modelo correspondientes a los coecientes de los trminos lineales
de los factores, es decir:
b 0 = ( b ; b ; :::; b )
1
2
p

9.3. Procedimiento de optimizacin

317

b representa una
x representa el vector de factores con valores codicados y B
matriz cuyos elementos son los coecientes del modelo estimado que corresponden
a la parte no lineal, es decir:
0

b =B
B
@

11

p1

:::
:::

1p

2 C
::: A
::: b pp

Se deriva parcialmente la expresin (9.12) con respecto a x = (x1 ; x2 ; :::xp ) e


igualamos con cero, la solucin de la ecuacin resultante es el punto:
1
B 1b
(9.13)
2
al cual se le llama punto estacionario de la supercie de respuesta. Los valores
de los factores en este punto determinan potencialmente las condiciones ptimas
con respuesta ybS , el valor de (9.12) al substituir x por xS . As el valor de la
respuesta predicha en el punto estacionario xS es:
xS =

b s
ybs = b 0 + x0s b + x0s Bx
1 0b
b
= 0 + 2 xs

Ejemplo 9.3

En una investigacin que se realiz con harinas de amaranto se tena inters en


determinar las condiciones de temperatura (X1 ) y tiempo (X2 ) de tal manera
que se pudiera obtener la mejor consistencia de la masa. Los valores reales y
codicados de la temperatura y tiempo en el dcc se muestran en la Tabla 9.11.
X1
80
90
80
90
78
92
85
85
85
85

X2
50
50
60
60
55
55
48
62
55
55

x1
1
1
1
1
1:41
1:41
0
0
0
0

x2
1
1
1
1
0
0
1:41
1:41
0
0

y
0:36
0:17
0:29
0:47
0:35
0:48
0:27
0:29
0:70
0:64

Tabla 9.11 dcc y resultados del Ejemplo 9.3

318

9. Optimizacin estadstica del proceso


El modelo ajustado es:
0:134x21

yb = 0:67 + 0:022x1 + 0:032x2

0:201x22 + 0:093x1 x2

(9.14)

A partir del resumen de los resultados del anlisis de varianza efectuado para
ajustar el modelo, se concluye que es un modelo adecuado con un R2 = 0:95: El
ANDEVA correspondiente se muestra en la Tabla 9.12, donde el Fc se obtuvo
dividiendo los cuadrados medios de esta tabla entre el cuadrado medio del error
de la Tabla 9.13.
Fuente de
variacin
Lineal
Cuadrtico
Interaccin
Total modelo

Grados de
libertad
2
1
2
5

Suma de
cuadrados
0:012
0:034
0:267
0:313

Cuadrados
medios
0:006
0:034
0:134
0:063

Fc

Valor p

2:00
11:34
44:60
21:00

0:274
0:002
0:035
0:005

Tabla 9.12 ANDEVA en el Ejemplo 9.3


La prueba de falta de ajuste resulta no signicativa, tal como se muestra en
la Tabla 9. 14.
Fuente de
variacin
Falta de ajuste
Error puro
Error

Grados de
libertad
0:011
0:002
0:013

Suma de
cuadrados
3
1
4

Cuadrado
medio
0:004
0:002
0:003

Fc

Valor p

2:00

0:459

Tabla 9.13 Prueba de falta de ajuste del Ejemplo 9.3


El punto estacionario se obtiene aplicando la expresin (9.13), esto es:

xS =

1b
B
2

1b

1
2

8:114
1:877

1:877
5:409

0:0217
0:0323

0:118
0:108

En trminos de las variables originales esto signica que:


0:118 =

2(X1 85)
10

0:108 =

2(X2 55)
10

Se despejan las variables X1 y X2 con objeto de obtener el valor ptimo


para la temperatura, el cual es igual a 85:59 y en el tiempo es X2 = 55:39. En

9.4. Caracterizacin del punto estacionario

319

Fig. 9.3: Descripcin del modelo de regresin ajustado y las curvas de nivel en el
Ejemplo 9.3
la Fig. 9.3 de manera aproximada podemos observar que efectivamente en el
punto (0:118; 0:108) se alcanza un mximo. El valor de yb en el ptimo es ybS =
yb(0:118; 0:108) = 0:673.

9.4

Caracterizacin del punto estacionario

El valor del punto xS obtenido en la ecuacin (9.13) no indica en s su naturaleza,


es decir, si corresponde a un mximo, un mnimo o un punto silla de la supercie
yb. Cuando el nmero de factores p es mayor a dos es difcil visualizar y entender a
la supercie de respuesta, haciendo necesario utilizar herramientas matemticas
para determinar con precisin la naturaleza de puntos estacionarios y de la supercie de respuesta. Suponga que se tienen p factores por lo que la grca de la
supercie de respuesta estar en p+1 dimensiones, para lograr tal caracterizacin
es conveniente reexpresar el modelo ajustado (9.11) en una forma simplicada.
La simplicacin deseada implica que desaparezcan primordialmente los trminos correspondientes a trminos cruzados (interacciones), as la reexpresin del
modelo ajustado equivale a sustituir (x1 ; :::; xp ) por (w1 ; :::; wp ), un nuevo sistema
de factoresarticiales con la propiedad de no tener interacciones entre ellos en
su efecto sobre la respuesta, facilitando as su caracterizacin (la desaparicin
de interacciones se debe a que el sistema de coordenadas ha sido rotado). De

320

9. Optimizacin estadstica del proceso

esta forma, si el centro del diseo de segundo orden nalmente utilizado en la


optimizacin es cercano al punto estacionario xS ; se puede mostrar que una representacin adecuada de la supercie de respuesta (9.11) es (la llamada forma
cannica B, ver detalle en Box y Draper, 1987):
yb = ybS +

p
X

2
i wi

(9.15)

i=1

donde ybS es el valor estimado de y en el punto estacionario xS de la supercie


de respuesta, las wi representan las nuevos factores y las i son constantes. Note
que en esta representacin desaparecen tanto los trminos de primer grado como
trminos de interacciones.
Desde el punto de vista matemtico, los fwi g se relacionan con fxi g mediante
la expresin:
H(x xS ) = w;
(9.16)
donde H representa a la matriz que contiene a los vectores caractersticos o pro^ asociados a los valores propios i : Los valores caractersticos
pios de la matriz B
^
I = 0.
i son las races de la llamada ecuacin caracterstica B
Los signos de los valores caractersticos

s dan la siguiente informacin:

1. Si todas i < 0 en cualquier direccin que nos movamos de xS , yb decrecer,


por lo tanto se tendr un punto mximo en xS :

2. Si todas i > 0 en cualquier direccin en que nos movamos de xS , crecer


yb, as que xS ser un punto mnimo.

3. Si hay combinaciones de 0i s positivas y negativas; yb va a decrecer o crecer


en alguna direccin del sistema (w1 ; : : : ; wp ), tal situacin depender de
cmo se d el movimiento, con lo que xS es un punto llamado silla.
Ejemplo 9.3 (continuacin)

Determinar la naturaleza del punto estacionario xS = (0:118; 0:108) que se gener


en el Ejemplo 9.3, donde ybs = 0:673. Los valores propios se obtienen resolviendo:
0:134
0:047

0:047
0:201

= ( 0:134

)( 0:201

(0:047)(0:047) = 0

Los valores de que satisfacen esta ltima ecuacin son 1 = 0:225 y 2 =


0:110, entonces en el punto estacionario se alcanza un mximo. Los vectores

9.5. Anlisis de lomas

321

Fig. 9.4: Curvas de nivel para el modelo (9.14), coordenadas x = (x1 ; x2 ) y de


w = (w1 ; w2 ):
0

caractersticos correspondientes son: h1 = ( 0:45; 0:89) y h2 = (0:89; 0:45): El


sistema de coordenadas wi se obtienen por:
H(x

xS ) =

0:45 0:89
0:89 0:45

x1
x2

0:118
0:108

=w

(9.17)

La descripcin de los sistemas de coordenadas del diseo x = (x1 ; :::; xk ) y de


w = (w1 ; :::; wk ) se describe en la Fig. 9.4.

9.5

Anlisis de lomas

Dentro del estudio que se realiza para encontrar mejores condiciones de operacin
del proceso, muy frecuentemente en la regin experimental nal, las combinaciones de factores correspondientes no determinan de manera clara una respuesta
ptima, ya que se necesita conocer cmo es la respuesta estimada en la regin
circundante al punto crtico.
Esta situacin hace necesario el estudio de lomas en la supercie de respuesta estimada. Los tipos de lomas ms usuales pertenecen a las llamadas
lomas estacionarias y lomas crecientes. Las lomas estacionarias tpicas son por
ejemplo como la mostrada en la Fig. 9.5, cuyo modelo es yb = 80 4x21 4x22 :

322

9. Optimizacin estadstica del proceso

Fig. 9.5: Ejemplo de loma estacionaria


Note en la Fig. 9.5 que en la supercie de respuesta estimada existe una gran
cantidad de puntos muy cercanos al punto con una respuesta mxima. Gracando
en el caso de dos factores es relativamente fcil entender esta situacin, pero para
el caso de tres o ms factores no hay ayudas visuales al caso. Por ejemplo,
una loma ascendente se muestra en la Fig. 9.6, el modelo en este caso es yb =
87:69 9:02x21 + 2:97x22 :
Sin embargo, mediante la re - expresin del modelo con factores sin interaccin, como fue desarrollado anteriormente, es posible analizar con mayor claridad
lomas an en situaciones de tres o ms factores. Las lomas o cordilleras en la supercie de respuesta estimada corresponden a las dependencias entre los factores
involucrados, tales dependencias son reejo en muchos casos de variables, digamos, fundamentales, que no son medidas ni controladas durante el experimento,
pero que son funciones de los factores experimentales. As muchas combinaciones
de niveles de los factores podran dar lugar a un mismo valor de la(s) variable(s)
fundamental(es). Un ejemplo clsico es el estudio de la contraccin de un msculo a partir de cambios de la resistencia y corriente elctricas. A partir de la ley
de Ohm, experimentando, se podra encontrar que la multiplicacin de corriente
y resistencia, es decir el voltaje, explica mejor el fenmeno. El voltaje sera una
variable fundamental funcin (no lineal) de la resistencia y la corriente.
Al estudiar tales tipos de dependencias entre los factores experimentales se
dan las siguientes posibilidades:
Encontrar un conjunto de puntos donde se tiene optimalidad en la supercie

9.5. Anlisis de lomas

323

Fig. 9.6: Ejemplo de loma ascendente


Al haber ptimos alternativos, si se desea optimizar otra respuesta se da
una exibilidad mayor para encontrar regiones donde ambas respuestas se
vean cercanamente optimizadas de manera simultnea.
Encontrar regiones de insensibilidad al alejarse de las condiciones ptimas.
Sugerir posibles leyes naturales apoyndose en la teora del rea de aplicacin.
Tales dependencias factoriales se pueden entender mediante el anlisis de las
ya que como se coment antes:

wi0 s;

wi = hi x =hi1 x1 +

+ hip xp

es decir que cada wi es una combinacin lineal de los factores experimentales. As


cada wi puede ser interpretada de manera fundamental, apoyndose en la teora
a la mano, de acuerdo a los pesos (hip ) respecto a las x0 s.
Por otra parte, resulta ser que la longitud del eje i de la supercie estimada,
1
dado ste en la direccin del wi , es proporcional a j i j 2 : As, atendiendo a la
magnitud de los valores caractersticos, a mayor valor absoluto de i menor la
longitud del eje correspondiente y viceversa. Un i muy grande respecto a los
dems valores caractersticos indica que en la direccin correspondiente la supercie se adelgaza, con lo que en esa direccin la wi sera una variable fundamental
en la que alejndose del punto estacionario cambia mucho la respuesta. Por otra
parte, una i pequea indica que la supercie de respuesta en la direccin del wi
correspondiente cambia muy gradualmente y al alejarse del punto estacionario
en esa direccin poco se perder en la respuesta, creando as una cordillera de
ptimos.

324

9. Optimizacin estadstica del proceso

Ejemplo 9.3 (continuacin)


Interpretacin del sistema descrito en las ecuaciones (9.17). El eje ms grande de
la supercie correspondiente a w2 = 0:89x1 + 0:45x2 , con lo que en esa direccin
bajar el valor de la respuesta al crecer o decrecer conjuntamente los valores de
los dos factores. El eje menor es en la direccin de w1 = 0:45x1 + 0:89x2 ; que
indica que bajar el valor de la respuesta en la medida que x1 suba y que x2 baje
o viceversa. En la direccin del eje menor al alejarse del ptimo se tendrn cadas
ms rpidas en la respuesta que las mostradas al alejarse en la direccin del eje
mayor.
El modelo ajustado y re - expresado es:
yb = ybS

0:225w12

0:110w22 :

La magnitud de los coecientes de los trminos cuadrticos de las wi se ven


descritos en los ejes de la elipses concntricas en la Fig. 9.4.

9.6
9.6.1

Optimizacin de varias respuestas


Mtodo de superposicin de curvas de nivel

En esta parte mostraremos mediante un ejemplo la utilidad de las curvas de


nivel para determinar un ptimo comn cuando existen dos respuestas medidas de
manera simultnea. La idea es ajustar un modelo para cada una de las respuestas,
enseguida se muestran las grcas que describen las curvas de nivel de cada
modelo. En stas se podrn observar los ptimos individuales, posteriormente
sobreponemos estas curvas de cada grca con el propsito de buscar un ptimo
global para ambas respuestas.
Ejemplo 9.4
En un estudio a nivel de laboratorio se hace un experimento para encontrar condiciones adecuadas en las propiedades mecnicas de un plstico. En la elaboracin
del plstico se consideran dos factores, stos son la polaridad de un solvente (X1 )
y el porcentaje de protena (X2 ), otros factores tales como la temperatura, el tipo
de plasticante y el pH se mantuvieron jos. Se llev a cabo un diseo central
compuesto, en la Tabla 9.22 se presentan nicamente los valores codicados de
los factores y las respuestas que miden la resistencia a la penetracin (y1 ) y la
elongacin (y2 ) del plstico. Lo que se pretende es establecer un ptimo general
para las respuestas.

9.6. Optimizacin de varias respuestas

x1
1
1
1
p1
p2
2
0
0
0
0
0
0

x2
1
1
1
1
0
p0
p2
2
0
0
0
0

325

Resistencia y1
21
15
16
40
16
21
13
25
30
34
33
29

Elongacin y2
8:5
13:4
16:8
15:6
14:6
15:8
9:3
16:8
16:9
17:7
17:2
17

Tabla 9.22 Resultados del experimento en el Ejemplo 9.4


El modelo ajustado para la respuesta 1 es:
yb1 = 31:5 + 3:13x1 + 4:62x2

5:44x21

5:18x22 + 7:5x1 x2

el modelo es adecuado, no tiene falta de ajuste y tiene un coeciente de determinacin R2 = 0:918; con un error estndar ES = 3:40: El valor ptimo es
xo = (1:19; 1:31) y es un mximo ( 1 = 9:06; 2 = 1:56) y yb1 (xo ) = 36:37: Las
curvas de nivel de este modelo se describen a la izquierda en la Fig. 9.7, el punto
xo representa el ptimo.
De manera anloga para la respuesta 2 se tienen los resultados siguientes, el
modelo ajustado es:
yb2 = 17:2 + 0:68x1 + 2:64x2

1:14x21

2:21x22

1:53x1 x2

el modelo es adecuado, no tiene falta de ajuste y tiene un coeciente de determinacin R2 = 0:986; con un error estndar ES = 0:50: El valor ptimo es
xo = ( 0:13; 0:64) y es un mximo ( 1 = 2:61; 2 = 0:74) y yb2 (xo ) = 18:0:
Las curvas de nivel de este modelo se describen a la derecha en la Fig. 9.8, el
punto xo representa el ptimo.
A partir de las curvas de nivel para ambas respuestas en la Fig. 9.8 se puede
notar que los puntos ptimos para ambas respuestas estn separados. En la prctica, si el proceso se pone en el ptimo de la respuesta 1, entonces la elongacin
disminuye aproximadamente hasta 15. De manera similar si el proceso se adapta
al ptimo en la respuesta 2, resulta que disminuye la resistencia a la penetracin
a 32.

326

9. Optimizacin estadstica del proceso

Fig. 9.7: A la izquierda curvas de nivel para y1 resistencia a la penetracin y a


la izquierda y2 elongacin

9.6.2

Funciones de deseabilidad

Cuando se tienen tres o ms respuestas la tcnica de superposicin puede no dar


una idea clara de optimizacin conjunta. Existen varios mtodos matemticos
para optimizar procesos con ms de una respuesta, conocidos como mtodos de
optimizacin multirespuesta. Entre stos estn la funcin de distancia propuesto
por Khuri y Colon (1981), la funcin de prdida estudiado por Ames et. al.
(1996) y la funcin de deseabilidad de cada variable respuesta que presentaron
Derringer y Suich (1980).
Los mtodos de optimizacin multirespuesta no necesariamente generan una
solucin ptima para cada respuesta individual, pero intentan cumplir con los
requerimientos de cada respuesta de la mejor manera posible.
Si se tienen m variables respuestas, supongamos que se ajustaron modelos
polinomiales de segundo orden en trminos de p factores de control (x1 ; x2 ; :::; xp )
(ya codicados),

9.6. Optimizacin de varias respuestas

yb1

= b 01 +

yb2 = ^ 02 +
ybm

p
X

i=1
p
X

= ^ 0m +

^ xi +
i1
^ xi +
i2

i=1

p
X

p
X

i=1
p
X

327

2
ii1 xi

2
ii2 xi

i=1

..
.
^

im xi

i=1

p
X

p
XX

i<j
p
XX

ij1 xi xj

ij2 xi xj

(9.18)

i<j

2
iim xi

i=1

p
XX

ijm xi xj :

i<j

2 altos y de no carencia
tales que muestren ajustes adecuados en trminos de Raj
de ajuste.
Aqu se presentar en cierto detalle el mtodo de la funcin de deseabilidad
de Derringer y Suich (1980). Es una propuesta que la mayora de los paquetes
estadsticos la incluyen tomando en cuenta su facilidad operativa y su alta eciencia para encontrar un ptimo ad hoc, a travs de especicar una funcin de
deseabilidad para cada variable respuesta, por lo que las prioridades de la investigacin experimental explcitamente se incluyen en el proceso de optimizacin
simultnea.

Ejemplo 9.5
Salcedo et al.(2002) llevaron a cabo un estudio para evaluar y optimizar el efecto
del pH de extraccin (7.8-9.2) y del pH de precipitacin (4.3-5.7) en cuatro caractersticas para obtener aislados proteicos usando una variedad de semilla de
amaranto. Los aislados proteicos se utilizan en pequeas cantidades como ingredientes en la formulacin de alimentos. La nalidad es optimizar este proceso
para elevar el valor nutrimental de varios productos alimenticios elaborados a base
de granos. Se desea obtener el mximo de las cuatro variables de respuesta, estas
son el contenido de protena (cp), ndice de blancura (ib), empata de transmisin
(et) y temperatura de desnaturalizacin (td).
Despus de realizar unos experimentos exploratorios, se propuso un diseo
central compuesto. Los factores y sus niveles son:
FactoresnNiveles
Extraccin (pH)
Precipitacin (pH)

E(X1 )
P (X2 )

1:41
7:8
4:3

1
8:0
4:5

0
8:5
5:0

1
9:0
5:5

1:41
9:2
5:7

Los resultados que se alcanzaron al realizar el experimento se muestran en la


Tabla 9.23.

328

9. Optimizacin estadstica del proceso

Tratamiento
1
2
3
4
5
6
7
8
9
10

Factor (x1 )
1
1
1
1
1:41
1:41
0
0
0
0

Factor (x2 )
1
1
1
1
0
0
1:41
1:41
0
0

y1: cp
81:26
83:35
78:26
81:72
78:08
81:90
80:30
78:00
75:82
75:93

y2: ib
26:90
25:24
24:29
18:12
29:34
21:17
30:10
27:27
28:34
27:68

y3: et
2:66
2:38
6:32
6:73
4:12
4:07
1:55
6:85
3:21
3:21

y4: td
100:23
99:63
99:20
99:43
101:82
99:70
99:39
99:71
99:82
99:82

Tabla 9.23 Respuestas de las cuatro variables en cada uno de los 10 tratamientos
El propsito es encontrar un ptimo comn para las cuatro variables de respuesta. Los modelos - ver Tabla 9.24 - para el contenido de protena y entalpa
de transicin resultaron signicativos para un valor p < 0:01. El modelo para
ndice de blancura es signicativo con un p < 0:05 sin el trmino cuadrticos de la
precipitacin e interaccin entre extraccin y precipitacin, adems en este caso
el coeciente de determinacin es R2 = 0:73 y no hay falta de ajuste. Observe que
para la respuesta 2, los coecientes de los factores precipitacin y el cuadrtico
de la extraccin apenas son signicativos con un nivel de signicancia descriptivo
aproximado de 0.09. Aun ante esta situacin, la signicancia del modelo con
p < 0:05 y el R2 = 0:73 nos alcanza para el anlisis de multi - respuesta aplicando la funcin de deseabilidad. Sin embargo, el modelo para la temperatura de
desnaturalizacin es no signicativo y ninguno de los factores tiene efecto. Para
efectos del proceso un valor adecuado para este modelo es yb4 (x) = 100, por lo
tanto este modelo no se incluye en la estimacin de la funcin de deseabilidad.
Antes de estimar la deseabilidad global, conviene destacar algunas caractersticas que presentan en este ejemplo las variables de respuesta. El ptimo
individual de la respuesta y1: cp est en el punto ( 0:29; 0:26) y ste es un mnimo y1: ( 0:29; 0:26) = 75:53, as que se puede usar la tcnica de anlisis de
lomas para encontrar valores mayores para el contenido de protena. La respuesta y3: et tambin tiene un mnimo en (0:26; 1:68) y se observa que este punto est
fuera de la regin experimental, y3: (0:26; 1:68) = 1:57: Nuevamente la tcnica
de lomas permitir encontrar valores de inters para el experimentador. Para
estas dos respuestas se puede aplicar la tcnica de sobreposicin para identicar un ptimo comn. La respuesta y2 : ib (considerando todos los trminos
del modelo) tiene un punto ptimo mximo fuera de la regin de experimental,

9.6. Optimizacin de varias respuestas

329

y2: ( 0:15; 1:55) = 29:53: Estas tres respuestas equivalen a los modelos de la
expresin (9.18).
FactoresnVariables
Constante
Lineal
x1
x2
Segundo Orden
x21
x22
x1 x2
R2

y1: cp+
75:88

y2: ib++
28:01

y3: et+
3:21

y4: td#
99:82

1:37
0:99

2:42
1:72&

0:01
1:94

0:42
0:10

2:45
2:03
0:34
0:91

2:21&
0:50
1:13
0:78

0:54
0:59
0:17
0:99

0:34
0:27
0:21
0:64

Tabla 9.24 Modelos signicativos ( + ) para p < 0:01.y ( + +) para p < 0:05
sin los coecientes ( ). (#) Modelo no signicativo
Coecientes de regresin signicativos para p < 0:05 excepto ( )
y los coecientes (&) son signicativos para p < 0:1
Los cuatro modelos ajustados se pueden evaluar en cualquier punto X =
(x1 ; x2 ) de la regin experimental y resultan 4 valores predichos para cada modelo,
es decir: yb1 ; yb2 ; yb3 ; yb4 :
Clculo de la funcin de deseabilidad

Un vez que se tienen los modelos ajustados adecuados se realiza el clculo de


la funcin de deseabilidad, en este caso considere como referencia la expresin
(9.18). El siguiente paso es explicitar lo que el investigador desea por medio de
una funcin di ; i = 1; : : : ; m; los valores deseables de cada una de las variables
respuesta; el valor de di estar en el intervalo [0; 1], si di = 1 cuando el valor de
la respuesta i-sima es lo ms deseable, en cambio si di = 0 se tiene una valor de
la i -sima respuesta no deseado.
Una funcin de deseabilidad puede especicarse con una o dos colas de deseabilidad, dependiendo de si la respuesta tiene un valor ms deseable o si se
desea maximizar o minimizar.
Dos colas
Supongamos que un producto medido a travs de la i-sima variable respuesta,
es aceptable si:
yLIE < y^i < yLSE

330

9. Optimizacin estadstica del proceso

Fig. 9.8: Funcin de deseabilidad transformada en dos lados


yLIE lmite de especicacin inferior y yLSE lmite de especicacin superior, y
que en ese intervalo Ti es su valor ms deseable. La cantidad di , se puede denir
como:
8
s
y^ yLIE
>
yLIE y^ Ti
>
< Ti yLIE
t
y^ yLSE
di =
(9.19)
Ti y^ yLSE
>
Ti yLSE
>
:
0
y^ > yLSE o y^ < yLIE
donde s y t son exponentes que sirven para elegir la forma requerida de la deseabilidad. Los valores que se den a s y t se reejan en la forma de la deseabilidad
de cada respuesta. Si se toman grandes (digamos s; t 10) signica que la deseabilidad di slo toma valores grandes cuando y^i cae cerca de su valor objetivo.
Si se toman valores pequeos para s y t (s; t 0:1) signica que cualquier valor
de y^i adentro del intervalo [LIEi ; LSEi ] es igualmente deseable. Finalmente,
cuando no se tiene idea de grados de deseabilidad, se recomienda asignar el valor
1 a los exponentes, lo que sugiere un incremento lineal de la deseabilidad hacia
el valor objetivo, Fig. 9.9.

Una cola
Si la respuesta debe ser maximizada, pero se escoge un valor Ti tal que di = 1 para
cualquier y^ > Ti : Supongamos adems que cualquier y^ < yLIE es inaceptable, es

9.6. Optimizacin de varias respuestas

331

decir, di = 0: Entonces la funcin de deseabilidad est dada por:


(
s
y^ yLIE
si yLIE y^
Ti yLIE
di =
0
si y^ < yLIE

(9.20)

Para el ejemplo 9.5 se requiere que las cuatro variables respuesta tengan un
valor mximo. Considere la respuesta 1: contenido de protena, un valor poco
deseado es yLIE = 70 y un contenido de protena mayor a Ti = 75 es ideal. En
este caso, d1 es:
yb1 70
yLIE = 70 y^1
75 70
d1 =
0 si y^1 < yLIE = 70
En el caso en que la respuesta deba ser minimizada y un valor Ti se selecciona
de tal forma que si y^ < Ti , di = 1; adems yLSE es valor a lo ms considerado
como aceptable. As la funcin de deseabilidad est dada por:
(
s
y^ yLSE
si y^i yLSE
Ti yLSE
di =
(9.21)
0
si y^i > yLSE
Optimizacin
Si se tienen m respuestas simultneas por optimizar la deseabilidad global D
que tome en cuenta a todas las variables respuesta a travs de sus funciones
de deseabilidad. El procedimiento propuesto por Derringer y Suich (1980) es
maximizar D entendida como la media geomtrica de d1 , d2 , :::, dm , es decir:
1

max D = max (d1 d2


x

(9.22)

dm ) m

mediante tcnicas de optimizacin numrica.


Una generalizacin de la deseabilidad global es:
D=

d1W1

2
dW
2

m
dW
m

1=

Wi

(9.23)

donde los pesos Wi son constantes que permiten balancear la importancia relativa
de cada variable respuesta; mientras ms grande es el peso dado a una variable
en relacin a las restantes, ms grande ser su peso en la optimizacin. Si todas
son igualmente importantes, Wi = 1 para i = 1; 2; :::; k: Note que los exponentes
s y t se pueden introducir como parte de los pesos Wi :
El punto de mayor deseabilidad es el punto x00 = (x10 ; x20 ; :::; xp0 ) sobre el
cual la funcin D es mxima (Derringer, 1994). Cabe decir que este mtodo no
toma en cuenta la aleatoriedad de y^i , ni la calidad de los modelos, ni la habilidad
del proceso para cumplir con las especicaciones. Por ello, se recomienda que
una vez que haya sido encontrado x que maximice a D se realicen corridas de
conrmacin.

332

9. Optimizacin estadstica del proceso

Ejemplo 9.6 (Aplicacin de la funcin deseabilidad al ejemplo 9.5)


Utilizando (9.22) se desea maximizar la deseabilidad en la regin experimental
comn a las cuatro variables respuesta en el Ejemplo 9.9. Sin embargo, como se
observ los modelos en la segunda y cuarta variable respuesta no resultaron estadsticamente signicativos, y por ello se eliminaron del anlisis de maximizacin
de la deseabilidad. En las restantes variables respuesta el objetivo del investigador es maximizarlas y por ello se utilizar la expresin (9.20). En las columnas
de la Tabla 9.25 se presentan las deseabilidades globales D en cada uno de los
tratamientos, tanto los datos observados de las variables respuesta (DO ) como en
los datos predichos (Dp ) por cada uno de los modelos correspondientes.
Tratamiento
1
2
3
4
5
6
7
8
9
10

y1 :cp
81:26
83:35
78:26
81:72
78:08
81:90
80:30
78:00
75:82
75:93

y2 :ib
26:90
25:24
24:29
18:12
29:34
21:17
30:10
27:27
28:34
27:68

y3 :et
2:66
2:38
6:32
6:73
4:12
4:07
1:55
6:85
3:21
3:21

DP
0:338
0:335
0:458
0:804
0:454
0:688
0:115
0:602
0:048
0:048

DO
0:389
0:396
0:540
0:875
0:381
0:620
0:0
0:538
0:0
0:068

Tabla 9.25 Clculos de las funcin de deseabilidad predicha Dp


y observada Do
Para jar ideas, se presenta el clculo de la funcin deseabilidad predicha y
observada en el tratamiento 1. Los valores mximos y mnimos observados en el
proceso son los que se usarn como referencia y estos son:
Valores
Y1 : cp
Y3 : et

Mnimo
75:82
1:55

Mximo
83:35
6:85

Las deseabilidades individuales para los valores predichos en las respuestas


son:
d1 =

80:318 75:82
2:562 1:55
= 0:597; d3 =
= 0:191:
83:35 75:82
6:85 1:55

De esta manera, la deseabilidad predicha para el primer tratamiento es:


DP = (0:114)1=2 = 0:338:

9.6. Optimizacin de varias respuestas

333

Fig. 9.9: Curvas de nivel para la funcin de deseabilidad


Las deseabilidades individuales para los valores observados en las respuestas
son:

81:26 75:82
2:66 1:55
= 0:722; d3 =
= 0:209:
83:35 75:82
6:85 1:55
As, la deseabilidad observada en el caso del tratamiento 1 es:
d1 =

DO = (0:151)1=2 = 0:389:

En este caso la DP representa a las tres respuestas a la vez, y el objetivo


es optimizar sta para obtener mxima deseabilidad simultnea. Aplicando un
algoritmo de optimizacin matemtica se obtiene la mxima deseabilidad que
es 1:0 y su valor correspondiente en la regin experimental es el punto ptimo
(x1 ; x2 ) = (1:309; 1:284): Los valores de las respuestas 1 y 3 en el punto ptimo
es y1 : cp = 84:526, y y3 : et = 7:886. Con el n de completar la informacin, el
valor en las otras dos respuestas evaluadas en el ptimo son y2 : ib = 23:648, y4 :
td = 99:82, sta ltima representa su valor promedio.
Tambin se puede encontrar el ptimo de esta funcin mediante las curvas de
nivel, tal como se describe en la Fig. 9.10.

Ejemplo 9.7 (continuacin Ejemplo 9.4)


En este ejemplo como se vio se desea maximizar ambas variables respuesta por
lo que se utiliza la funcin de deseabilidad (9.20). Supongamos que para y^1 <
13 es inaceptable y T = 25; para y^2 supongamos que y^2 < 8:5 es inaceptable
y T = 14: Resolviendo el problema de optimizacin (9.22) se tiene que x1 =

334

9. Optimizacin estadstica del proceso

Fig. 9.10: Supercie y curvas de nivel para la funcin deseabilidad del Ejemplo
9.4
0:7071, x2 = 0:7071, condiciones de optimalidad aproximada simultneamente:
xo (0:7071; 0:7071), los valores correspondientes para las respuestas en esos puntos
son: y1 (xo ) = 35:42 y y2 (xo ) = 17:1; Fig. 9.11. Las condiciones individuales de
optimizacin eran para y^1 (1:19; 1:31) y para y^2 ( :13; :64): Observando la Fig.
9.10 se puede apreciar el compromiso logrado a travs de la optimizacin conjunta
de ambas funciones de deseabilidad.

9.7

Optimizacin aplicada al diseo robusto

Vimos en el Captulo 5 las ideas principales sobre el diseo robusto, en particular


el diseo de parmetros que introdujo Taguchi (1986). Estas ideas se pueden
considerar desde el punto de vista de la metodologa seguida en este captulo.
Con referencia al doble arreglo ortogonal como se muestra en la Tabla 9.26, con
la informacin experimental se ajustan por mnimos cuadrados los modelos de
regresin para la media: yb1 = y y la varianza o desviacin estndar: yb2 = ln S 2 ,
stos se expresan por:

9.7. Optimizacin aplicada al diseo robusto

335

b
yb1 = b 0 + x0 b + x0 Bx
b
yb2 = b0 + x0 b + x0 Dx

(9.24)

donde x0 =(x1 ; :::; xk ) k factores, b 0 la constante estimada, b = ( b 1 ; :::; b k )0 un


b = ( b 11 ; :::; b 1k ; b k1 ; :::; b kk ) matriz de estimadores de
vector de estimadores, B
segundo orden, ^ 0 la constante estimada , ^ = (^ 1 ; :::; ^ k ) un vector de estimadores, D = ( 11 ; :::; 1k ; k1 ; :::; kk ) matriz de estimadores de segundo orden.
El siguiente paso es optimizar ambas respuestas y por consiguiente se aplica las
funciones de deseabilidad respectivas. Cabe notar que como regla general se desea que yb2 sea mnima. Una aplicacin de este procedimiento se plantea en el
Ejercicio 9.14.
Z1
:
Zq
X1
x11
:
xn1

:::
:::
:::
:::

z11
:
z1q

Xk
x1k
:
xnk

y11
:
yn1

:::
:::
:::
:::
:::
:::

zr1
:
zrq
M edia yb1 = y
y1

yr1
:
ynr

yn

yb2 = ln S 2
ln S12
ln Sn2

Tabla 9.26. Estructura experimental en un arreglo doble ortogonal

9.7.1

Optimizacin en funcin de factores de ruido

Sin embargo, como fue mencionado en el Captulo 5, una extensin relevante en


esta direccin es considerar el modelo de regresin en funcin de factores de ruido.
En ese sentido, usar un diseo experimental combinado como se muestra en la
Tabla 9.27, resulta mucho ms eciente que el doble arreglo ortogonal porque se
reducen de manera importante el nmero de pruebas experimentales - corridas.
Adems permite estudiar posibles efectos de interaccin entre los factores de
control y ruido.
A
x11
..
.

:::
:::
..
.

K
x1k
..
.

P
z11
..
.

xn1

:::

xnk

zn1

:::
:::
:::
:::

Q
z1q
..
.

y
y11
..
.

znq

yn1

Tabla 9.27. Arreglo experimental combinado de factores de control y ruido

336

9. Optimizacin estadstica del proceso

Los datos que se generan al llevar a cabo esta segunda estrategia experimental
permiten obtener un modelo en funcin de los factores de control y ruido, ste se
puede representar por una expresin como la que sigue:
y=

+ x0 + z 0 + x0 x + x0

z + ";

(9.25)

donde x0 = (x1 ; :::; xk ) k factores de control, z0 = (z1 ; :::; zq ) q factores de ruido,


= ( 1 ; :::; k ); = ( 1 ; :::; q ):
0 una constante, los vectores de los parmetros
= ( 11 ; :::; 1k ; k1 ; :::; kk ) y
= ( 11 ; :::; 1q ; :::; k1 ; :::; kq ) son las matrices
de parmetros de segundo orden, y " N (0; 2" ). Bajo el supuesto de que z es
una vector aleatorio con media cero (E(z) = 0); y V ar(z) = V = diag( 2z ):
Para tener modelos equivalentes a los de la expresin (9.24) se calcula la
esperanza y la varianza de la expresin (9.25), esto es:
E(y) =

+ x0 + x0 x

(9.26)

y
V ar(y) = ( + x0 ) V ( + x0 ) +

2
":

(9.27)

En este caso y1 y y2 representan a E(y) y ln(V ar(y)) respectivamente. Por


b
mnimos cuadrados se ajusta el modelo (9.25), se tienen los estimados yb1 = E(y)
\
y yb2 = ln
V ar(y): Un mnimo para la respuesta yb2 , se tiene cuando:
b + x0 b = 0

(9.28)

La idea es buscar un ptimo comn para la media y la varianza.


Ejemplo 9.6
En proceso de densicacin mecnica ofrece la posibilidad de utilizar residuos
agrcolas en la elaboracin de alimento para ganado. Con el propsito de encontrar los factores que reduzcan el efecto del consumo de energa del proceso; se
realiz un experimento con un diseo factorial 24 , se consideraron tres factores
de control: la humedad, presin y tamao de partcula y un factor de ruido: la
temperatura. Los factores y sus niveles se muestran en la Tabla 9.28.
Factores y Niveles
x1 : Humedad (%)
x2 : Presin (MPa)
x3 : Tamao de partcula (pulg)
z : Temperatura o C

Nivel uno (-1)


10
30
1=8
Ambiente

Nivel dos (1)


22
90
3=4
100

Tabla 9.28 Factores y niveles en el experimento

9.7. Optimizacin aplicada al diseo robusto

337

Se realiz el experimento con los resultados presentados en la Tabla 9.29.

Tabla 9.29 Diseo combinado de factores de control y ruido


Se ajust por mnimos cuadrados el modelo (9.25) y se obtuvo:
ybxz = 19:45 + 1:3x1 + 0:5x3

0:74z

0:96x1 x3

1:09x1 z + 1:9x3 z

(9.29)

Un modelo signicativo con p = 0:0004; el cuadrado medio del error sin el


factor 2 que no result signicativo es: CMerror = 0:2507 y con R2 = 0:98. Se
aplica la ecuacin (9.26) al modelo anterior y se tiene:
E(b
y ) = 19:45 + 1:3x1 + 0:5x3

0:96x1 x3

(9.30)

Con el supuesto de que 2z = V ar(z) = 1; la varianza de yb se tiene con la


expresin (9.27) para este modelo es:
V ar(b
y) =

2
z(

0:74

1:09x1 + 1:9x3 )2 + 0:2507

(9.31)

El objetivo es encontrar un ptimo comn para las expresiones (9.30) y (9.31)


en este caso mnimo para ambas respuestas. Considere yb1 = E(b
yxz ) y yb2 =
V ar(b
yxz ); aplicando la funcin de deseabilidad para estos modelos con yb1LIE =
15; y yb2LIE = 0:5, se tiene que una solucin mnima comn en xo = ( 1; 1), los
valores ptimos son: yb1 (xo ) = 16:69 y yb2 (xo ) = 1:56:

338

9. Optimizacin estadstica del proceso


Caso sin rplicas modelando los residuales.

En este ltimo esquema experimental se pueden presentar casos en los que


no existan factores de ruido o que no haya rplicas. Ante esa situacin el modelo
para Yb2 se propone Yb2 = log(abs(Y1i Yb1i )); Chan y Mak (1995), donde Y1i los
son los resultados experimentales de cada tratamiento.
Los objetivos que comnmente se plantean en la estrategia experimental son:
Encontrar valores (niveles) de x1 ; :::; xk en una regin Rx que produzcan
condiciones de operacin ptimas, es decir que y alcance un valor mximo
(mnimo). Es importante en la industria saber qu tan cerca est y de un
valor objetivo o nominal T ideal, ste es determinado por el desarrollo
tecnolgico y caractersticas del proceso.
Por otro lado, es importante minimizar la varianza en torno a esa respuesta ptima o valor objetivo. Para ello, es necesario estudiar los factores
z1 ; :::; zq en una regin Rz :

9.7.2

Esperanza de (y

T )2

En un proceso es muy deseable que la respuesta y est lo ms cerca posible a un


valor de referencia T , en esta situacin si se aplica la esperanza a (y T )2 se
tiene un resultado interesante como el siguiente:
E(y

T )2 = V ar(y) + (E(y)

T )2

esta relacin tambin conocida como criterio de prdida del error cuadrado y
cuyo objetivo es optimizar esta expresin se tiene cuando se minimiza la varianza
y la media tiende al valor objetivo T . El modelo matemtico para optimizar esta
esperanza se describe para tres situaciones diferentes como:
Minimizar
Sujeto a

9.8

Yb2
Yb1 = T
X R

Minimizar
Sujeto a

Yb1
Yb2 =
X R;

2
0

Maximizar
Sujeto a

Yb1
Yb2 =
X R;

2
0

Ejercicios

Ejercicio 9.1 En un estudio experimental realizado en un laboratorio no cuentan con un paquete estadstico para analizar los resultados del experimento. Pero
se sabe que usted tiene habilidad para calcular los efectos para la variable solucin X1 en dos niveles y el tiempo de reaccin X2 en tres niveles, as que se le
solicita estime los efectos que se piden a continuacin. En la columna uno se da

9.8. Ejercicios

339

la respuesta (caracterstica de calidad) y en las siguientes columnas los niveles


codicados de las variables.
1. Estime grcamente el efecto del factor x1 ; x2 y x22 :
2. Indique grcamente si la variable dos tiene efecto de variabilidad.
x1
1
1
1
1
1
1
1
1
1
1
1
1

x2
1
1
1
1
0
0
0
0
1
1
1
1

y
5:23
6:42
1:38
1:94
11:57
12:16
5:72
4:69
12:68
13:31
8:28
7:73

Ejercicio 9.2
1. Se decide que usted tienen que realizar un estudio exploratorio para encontrar la regin experimental en un nuevo producto, se realiza un diseo
factorial 22 con dos rplicas, el modelo encontrado y que se ajusta adecuadamente es el siguiente:
yb = 42:875 + 10:38X1 + 5:86X2
Concentracin
Tiempo

X1
X2

3%
10

5%
15

Indique cul es la trayectoria ascendente, si se requiere incrementar el


rendimiento para ese nuevo producto. Si se propone un incremento en la
concentracin de X1 = 0:5% cunto variar el tiempo?
2. Dada la funcin de respuesta:
Z = 72:0 + 3:6x1

2:5x2

Trace una grca de contornos de la respuesta y en el plano (x1 ; x2 ).


Trace la trayectoria optimizante generada por esta funcin.

340

9. Optimizacin estadstica del proceso

Ejercicio 9.3 Un experimentador inicia un procedimiento considerando dos


variables (X1 ,X2 ) en el punto central (90,20) y efecta cinco ensayos con los
resultados anotados:
X1
X2
y

80
10
11

100
10
0

80
30
29

100
30
6

90
20
12

codique las variables (X1 ; X2 ) y ajuste un modelo de primer orden a las datos.
Determine la direccin de escalamiento ascendente. El experimentador realiza
seis ensayos ms:
X1
X2
y

64:5
38
43

47:5
50
58

39
56
72

30:5
62
62

43:25
53
65

34:75
59
68

Cul de estos puntos est en la trayectoria ascendente determinada anteriormente? El experimentador decide hacer la siguiente combinacin y las realiza:
X1
X2
y

43:25
53
65

34:75
59
68

34:75
53
71

43:25
59
68

39
56
71

39
56
72

39
56
72

39
56
73

Ajuste este modelo a los ocho ensayos y use las observaciones replicadas para
probar la falta de ajuste. Evale con una grca el modelo con las ocho corridas.
Qu le recomendara usted al experimentador para los siguientes pasos a realizar?
Va en una nueva direccin el escalamiento ascendente? Se ajusta un modelo
de segundo orden?
Ejercicio 9.4 Con referencia al ejemplo 9.3:
Encuentre el valor ptimo xs y los valores correspondientes en la escala
original de los factores en ese punto.
Encuentre los valores propios y la ecuacin cannica correspondiente.
Ejercicio 9.5 El experimento realizado en una industria de plstico tiene por
meta incrementar el rendimiento de la produccin considerando el tiempo y
la temperatura del proceso. Se realiz un experimento central compuesto, el
siguiente modelo se ajust adecuadamente con un coeciente de determinacin
R2 = 0:92. El modelo es:
yb = 82:17

1:01x1

8:61x2 + 1:40x21

8:76x22

7:2x1 x2

9.8. Ejercicios

341

los valores codicados se representan por las siguientes expresiones:


(tiempo(hr) 12)
8
Los valores caractersticos son:
x1 =

x2 =

9:91

(temp(o C)
30

250)

= 2:55

el valor crtico:
XS = ( 0:439; 0:311);
yb = 83:73

con b
y S = 83:73

9:91w12 + 2:55w22

Un amigo de esa industria le pide una asesora para encontrar un valor de x1


y x2 que aumente el rendimiento cmo le ayudara? Recuerde que x0 x
R2 :
:303
0:953
; escriba la relacin
La matriz de vectores caractersticos es:
0:953 0:303
entre las variables w y las codicadas.
Ejercicio 9.6 Un amigo en una universidad realiz un experimento para probar unas pelculas de plstico con la nalidad de estudiar sus propiedades en la
envoltura de alimentos. l estudi la dureza y la elasticidad de ese plstico, los
modelos 1 y 2 describen los resultados. l solicita que se encuentre un ptimo
comn si la dureza debe estar entre 1.2 y 1.4 unidades, y la elasticidad debe ser
mxima. Usted le puede auxiliar usando las curvas de nivel que describen los
modelos, las ecuaciones de estas curvas se dan a continuacin:
Modelo 1:
y^1 = 1:53

0:57x1

0:52x2 + :32x1 x2

0:17x21

0:1x22

Informacin del reporte estadstico:


R2 = 0:95. No se rechaza la hiptesis nula: el modelo se ajusta adecuadamente con = 0:01: Todos los coecientes de regresin son signicativos. Los
valores caractersticos son:
1

0:30

= 0:03

Modelo 2:
yb2 = 1:78

0:25x1

0:08x2

Informacin del reporte estadstico:

0:16x21

0:08x22

342

9. Optimizacin estadstica del proceso

R2 = 0:98. No se rechaza la hiptesis nula: el modelo se ajusta adecuadamente con


= 0:05. No es signicativo el efecto de interaccin. Los valores
caractersticos son:
1

0:18

0:08

Ejercicio 9.7 En un proceso se tienen como factores principales x1 el voltaje


y x2 el tiempo de funcin. Se evala el rendimiento (y) del equipo. El diseo
que se utiliz es uno central compuesto con dos replicaciones y los resultados se
muestran enseguida:
Voltaje
50
120
50
120
13:5
134:5
85
85
85

Tiempo
150
150
250
250
200
200
12:9
271
200

x1
1
1
1
1p

p 2
2
0
0
0

x2
1
1
1
1
0
0p

p 2
2
0

y(rep1)
7:5
12:4
13:6
16:5
8:6
14:2
7:9
16:5
15:7

y(rep2)
8:1
11:8
12:4
15:3
9:4
12:6
7:3
17:4
17

1. Ajuste un modelo de segundo orden para las variables codicadas y realice


el anlisis correspondiente con la tabla del ANDEVA.
2. Prueba la falta de Ajuste del Modelo en 1.
3. Determine las coordenadas del punto crtico y determine su naturaleza.
4. Para qu valores del voltaje y tiempo se obtiene la respuesta mxima.
Ejercicio 9.8 El modelo que obtuvo un experimentador es el siguiente:
Y = 80 + 0:1x1 + 0:2x2 + 0:2x21 + 0:1x22 + x1 x2
Justique que el punto crtico es un punto silla, cul es el valor de Y en el
punto crtico? Encuentre un valor de x1 y x2 si se desea un valor mayor de la
respuesta, evale Y en estos valores de x1 y x2 .

9.8. Ejercicios

343

Ejercicio 9.9 En una empresa se determina el siguiente modelo para la produccin (%):
5x21

Yp = 82 + 4x1 + 8x2

9x22

4x1 x2

tambin se modela el costo de produccin en pesos (por 10 en unidad producida):


Yc = 80 + 4x1 + 8x2 + 2x21

12x22

12x1 x2

Encuentre un ptimo comn usando las curvas de nivel sobrepuestas. En qu


valores se debe operar el proceso si se desea que la produccin no sea menor de
80% y el costo no sea mayor de 74 (740) pesos.
Ejercicio 9.10 (Box y Draper, 1987) Se desea estudiar el tiempo de falla (ciclos)
de un equipo, se sabe tericamente que la relacin de falla es ciclo de f alla =
k'4 5 '3 3 . El diseo efectuado es un 33 ; siguiendo el orden estndar de este diseo
se dan las respuestas: 674, 1414, 3636, 338, 1022, 1568, 170, 442, 1140, 370, 1198,
3184, 266, 620, 1070, 118, 332, 884, 292, 634, 2000, 210, 438, 566, 90, 220, 360.
'1 = longitud(mm)
x1 =

'1 300
90

'2 = amplitud de carga(mm)


x2 =

'2 9
1

'3 = carga(g)
x3 =

'3 45
5

Ajuste el modelo:
Y = logY =
donde '4 =

'2
'1

1 log'3

2 log'4

+"

y pruebe la hiptesis
H0 :

3;

contra la alternativa H1 : no se satisface H0 . Esto justica el modelo terico


descrito anteriormente?
Ejercicio 9.11 Un estudiante quiere averiguar el rendimiento de germinacin de
una semilla, en el laboratorio somete las semillas a un proceso donde intervienen
el tiempo (X1 ) en un rango 30 a 40 minutos, la temperatura (X2 ) entre 150 y
160 o C, la concentracin de hipoclorito de sodio la deja ja al 0.30. Despus
pone a germinar las semillas en unas charolas apropiadas, el porcentaje obtenido
en el estudio inicial se representa en la siguiente tabla, las variables tiempo y
temperatura estn codicadas.

344

9. Optimizacin estadstica del proceso

x1
1
1
1
1
0
0
0
0
0

x2
1
1
1
1
0
0
0
0
0

y
37:8
38:5
39:4
40:0
38:8
39:0
39:2
38:7
39:1

1. Escriba el modelo, pruebe la hiptesis de falta de ajuste.


Con esta informacin y el modelo el estudiante aplic la tcnica de escalamiento
ascendente para aumentar el rendimiento de germinacin, una vez que encontr
un cambio en el crecimiento de la respuesta consider una nueva regin experimental (el tiempo entre 80 y 90 y la temperatura entre 170 y 180), en sta realiz
un nuevo experimento, los datos obtenidos de esta nueva situacin son:
x1
1
1
1
1
0
0
0
0
0

x2
1
1
1
1
0
0
0
0
0

y
77:6
78:2
79:1
80:4
80:5
80:7
80:5
81:1
80:8

1. Pruebe las hiptesis de falta de ajuste, cmo interpreta su respuesta?


2. En el men de resultados estadsticos del paquete se encuentra el de curvatura, ese valor comparado con sus resultados de la tabla del ANDEVA,
qu le indica?
Considerando la ltima regin propuesta el estudiante llev a cabo un experimento central compuesto 2k + 2k + no (factorial, ms pruebas en los ejes y
replicaciones al centro) con los siguientes resultados:
77:4; 79:2; 78:1; 80:6; 76:4; 79:4; 78; 79:9; 81:9; 81:5; 81:5; 81:7; 82:
1. Estime el modelo y determine las condiciones ptimas para este estudio.

9.8. Ejercicios

345

Ejercicio 9.12 Se realiza un estudio con el propsito de medir qu efecto tiene


un ablandador de carne sobre la prdida de peso en cada bistec, stos tienen
los mismos pesos iniciales (precocidos). Los factores principales X1 el tiempo de
cocimiento y X2 la temperatura de cocimiento. Se evala la prdida de peso (y) en
gramos. El experimento se llev a cabo empleando un diseo central compuesto
con dos replicaciones y los resultados se muestran enseguida:
Temp
1
1
1
p1
p2
2
0
0
0
0
0
0
0

Tpo
1
1
1
1
0
p0
p2
2
0
0
0
0
0

y1
4:26
1:34
1:10
1:02
2:64
1:39
3:49
1:51
3:26
3:22
3:84
3:06
3:49

y2
3:68
1:98
1:63
1:28
2:19
2:11
3:44
1:59
3:76
3:17
3:55
3:29
3:28

1. Ajuste un modelo de segundo orden para las variables codicadas y realice


el anlisis correspondiente con la tabla del ANDEVA.
2. Prueba la falta de Ajuste del Modelo en 1.
3. Determine las coordenadas del punto crtico y determine su naturaleza.
4. Para qu valores del tiempo y temperatura se obtiene la respuesta mxima?
Ejercicio 9.13 En una planta qumica se produce una sustancia que se emplear para la manufactura de vinlico, los factores que inuyen en la pureza de
esta substancia son la temperaturas (temp) de la torre y la presin. Con los datos
que se proporcionan en la siguiente tabla:
1. Proporcione el modelo lineal para explicar la pureza de la sustancia.
2. Plante las hiptesis para vericar la falta de ajuste y haga la prueba.
3. Haga una evaluacin del modelo.

346

9. Optimizacin estadstica del proceso

4. Determine la trayectoria optimizante.


Temp (X1 )
150
190
150
190
170
170
170
170

Presin (X2 )
1:1
1:1
1:3
1:3
1:2
1:2
1:2
1:2

Pureza (y)
82:8
84:7
83:5
85
84:1
84:5
83:9
84:3

Ejercicio 9.14 Con el objeto de reducir el tiempo de coccin (ahorro de gas) de


una variedad de frijol, se usaron como factores una concentracin de bicarbonato
de sodio NaHCO3 (% PV) y una concentracin de cloruro de sodio NaCl (% PV),
el tiempo de remojo se dej jo en ocho horas. Los datos reportados son:
NaHCO3 (X1 )
1
1
1
1
1:4142
1:4142
0
0
0
0
0
0
0

NaCl (X2 )
1
1
1
1
0
0
1:4142
1:4142
0
0
0
0
0

Tiempo
54
32
45
47
53
50
51
47
40
42
44
39
41

1. Proponga el modelo que mejor explique la respuesta.


2. Obtenga el ptimo y explique su naturaleza.
3. Con sus resultados que puede sugerir.
Ejercicio 9.15 Un diseo de Box - Behnken se utiliz para evaluar un proceso
qumico, el nmero de impurezas generadas por el proceso tienen que ver con
tres factores temperatura (x1 ), concentracin de un catalizador (x2 ), y la funcin

9.8. Ejercicios

347

de un agente (x3 ). En este proceso se consideraron dos factores de ruido un


reagente qumico (z1 ) proporcionado por una empresa y el tipo de limpieza (z2 )
de las columnas de destilacin. As que se realiz un doble arreglo ortogonal que
consiste en el diseo Box - Behnken y un factorial 22 : En la tabla se muestran los
resultados para la respuesta promedio de impurezas (se desea que tenga un valor
mnimo) y la desviacin estndar.

x1
-1
1
-1
1
-1
1
-1
1
0
0
0
0
0
0
0

x2
-1
-1
1
1
0
0
0
0
-1
1
-1
1
0
0
0

x3
0
0
0
0
-1
-1
1
1
-1
-1
1
1
0
0
0

z1
z2

:-1
:-1

57.81
24.89
13.21
13.39
27.71
11.40
30.65
14.94
42.68
13.56
50.60
15.21
19.62
20.60
20.15

1
-1
37.29
4.35
9.21
9.15
20.24
4.48
18.40
2.24
22.42
10.08
13.19
7.44
12.29
11.49
12.20

-1
1
47.07
14.69
11.19
11.23
24.32
8.23
24.45
8.49
30.30
11.38
30.97
11.82
14.54
13.49
13.89

1
1
42.87
8.23
10.10
10.30
22.28
5.44
20.24
5.44
21.64
9.85
18.84
9.78
13.14
12.06
14.06

yi
46:26
13:04
11:00
11:02
23:64
7:39
23:49
7:51
29:26
11:22
28:4
11:06
14:9
14:41
15:08

Si
8:68
8:98
1:63
1:80
3:19
3:11
5:44
5:59
9:76
1:70
16:55
3:29
3:28
4:21
3:49

1. Haga un estudio descriptivo preliminar para identicar el menor valor de


impurezas con la menor variacin.
2. Escriba el modelo de segundo orden completo para la media.
3. Haga la evaluacin estadstica del modelo estimado en el punto anterior y
encuentre el valor ptimo para la media.
4. Escriba el modelo de segundo orden completo para la desviacin estndar.
Encuentre el valor ptimo para la desviacin estndar.
5. Indique en qu punto se tiene una menor cantidad de impurezas, aydese
con las curvas de nivel.
6. Determinar el valor ptimo del proceso considerando la menor cantidad de
impurezas y menor variabilidad.

348

9. Optimizacin estadstica del proceso

7. Considere el diseo como un factorial completo, el BB combinado con los


niveles de los factores de ruido, ver Captulo 5, apartado 5.10.4. Para
homogeneizar la notacin referirse a los de control con x; a los factores de
ruido con z:

8. A partir de este esquema, ahora puede detectar los efectos de interaccin


entre los factores de control y ruido. Encuentre el mejor modelo de segundo
orden en funcin de los factores de control y ruido, pero adems agregue
los trminos z1 x22 y z1 x23 , qu observa? Idea: escriba el modelo:
b + b0 + z0b + z0Dx
b
yb = b 0 + x0 b + x0Bx

donde x0 = (x1 ; x2 ; x3 ) ; z0 = (z1 ; z2 ) ; b y b son los estimadores de los


parmetros de primer orden para los factores de control y ruido respectivab yD
b son los estimadores de los parmetros de segundo orden para
mente. B
los factores de control y ruido. Suponga que z es una variable aleatoria con
esperanza E(z) = 0, y V ar(z) = z :

(a) Determine la esperanza de este modelo yb y optimice el modelo.

(b) Encuentra la varianza de este modelo yb y optimice el modelo.


(c) Encuentre el ptimo comn para la media y la varianza.

9. Haga el anlisis descriptivo mediante curvas, je los valores de z1 y z2 donde


considere que son ms adecuados. Justique su consideracin.

Ejercicio 9.16 Se realiz un estudio en un laboratorio con la nalidad de optimizar el ndice de absorcin de agua en la elaboracin de hojuelas de trigo.
Despus de un trabajo previo de identicacin de factores, el ingeniero consider
tres factores descritos aqu como X1 , X2 , y X3 , el esquema experimental es un
diseo central compuesto 23 + 2(3) + n0 , es decir:

9.8. Ejercicios

349

no

Trat X1 X2 X3 y
1
1
1
1 11.28
2
1
1
1 8.44
3
1
1
1 13.19
4
1
1
1 7.71
5
1
1
1 8.94
6
1
1
1 10.9
7
1
1
1 11.85
8
1
1
1 11.03
9
0
0 8.26
10
0
0 7.87
11
0
0 12.08
12
0
0 11.06
13
0
0
7.98
14
0
0
10.43
= 6, replicaciones al centro:
10.14, 10.22, 10.53, 9.50,11.53, 11.02

siguiendo el orden acostumbrado, la respuesta y:


Regin de operacin original.
FactoresnNiveles
X1
X2
X3

1
2:03
1:07
1:35

1
5:21
2:49
3:49

Obtenga el reporte estadstico al ajustar un modelo de segundo orden y optimizar ese modelo. Con esa informacin conteste las siguientes preguntas:

1. Si el punto estrella

3; encuentre el valor original de la variable X3 :

2. Plante el modelo para los parmetros ms signicativos.


3. Evale e interprete el modelo. Justique sus respuestas.
4. Plante y desarrolle la prueba de hiptesis sobre el parmetro

11

5. Determine el valor ptimo de la respuesta.


6. Construya la ecuacin (9.14) e interprete su naturaleza. Bajo esta situacin
diga dnde se encuentra la respuesta mxima.

350

9. Optimizacin estadstica del proceso

7. Qu variable cambia ms rpido su valor? Explique en qu se basa para


tomar su decisin.
8. Cul es el valor codicado de las variables en el tratamiento 10 ?
9. Encuentre el valor residual para el tratamiento 10.
10. Cul es la importancia de vericar si en un modelo existe falta de ajuste?
Informacin: el punto crtico o el valor de x que determinan las mejores
condiciones de operacin son:
x0 = ( 0:39; 0:17; 0:36)
los valores caractersticos son:
( 1:17; 0:65; 0:13)

Ejercicio 9.17 En el desarrollo de una llanta, se consideran tres ingredientes


X1 : nivel de slica hidratado, X2 : nivel de un agente de selenio, X3 : nivel de
azufre, es decir:

X1
X2
X3

Nivel bajo
0:7
40
1:8

Nivel alto
1:7
60
2:8

Las propiedades que se consideran con sus respectivas restricciones son las
siguientes:
Respuestas
Y1 : ndice de abrasin
Y2 : Mdulo 200
Y3 : Elongacin a la ruptura
Y4 : Dureza

Restricciones
120 < Y1
1000 < Y2
400 < Y3 < 600
60 < Y4 < 75

Se propuso un diseo de composicin central, el diseo y los resultados se


muestran a continuacin:

9.8. Ejercicios

Tratamiento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

351

x1
1
1
1
1
1
1
1
1
1:63
1:63
0
0
0
0
0
0
0
0
0
0

x2
1
1
1
1
1
1
1
1
0
0
1:63
1:63
0
0
0
0
0
0
0
0

x3
1
1
1
1
1
1
1
1
0
0
0
0
1:63
1:63
0
0
0
0
0
0

y1
102
120
117
198
103
132
132
139
102
154
96
163
116
153
133
133
140
142
145
142

y2
900
860
800
2294
490
1289
1270
1090
770
1690
700
1540
2184
1784
1300
1300
1145
1090
1260
1344

y3
470
410
570
240
640
270
410
380
590
260
520
380
520
290
380
380
430
430
390
390

y4
67:5
65:0
77:5
74:5
62:5
67:0
78:0
70:0
76:0
70:0
63:0
75:0
65:0
71:0
70:0
68:5
68:0
68:0
69:0
70:0

1. Ajuste cada uno de los modelos por el mtodo de mnimos cuadrados.


2. Encuentre el ptimo individual de cada respuesta.
3. Aplique la funcin de deseabilidad para encontrar un ptimo comn.
4. Utilizando curvas de nivel discuta las posibilidades de un ptimo.
5. Para la variable 2 identique si algunos de los factores tiene efecto en la
variabilidad.
Ejercicio 9.18 Box y Draper (1987) presentan un ejemplo sobre la capacidad
de una imprenta para imprimir tinta de color en unas etiquetas. Se considera que
tres factores en tres niveles tienen efecto en la impresin de la tinta, estos son:
Factores
X1 : velocidad
X2 : presin
X3 : distancia

Nivel bajo
30
90
12

Nivel intermedio
45
110
20

Nivel alto
60
130
28

352

9. Optimizacin estadstica del proceso

Este diseo ha servido como referencia a diferentes autores para ilustrar los
resultados que se obtienen al aplicar el mtodo que proponen en la optimizacin de
la media y la variabilidad, luego los compararn con los resultados obtenidos por
otros autores. Aqu los usamos para hacer una comparacin global de todos los
resultados. El diseo es un factorial completo 33 con tres replicaciones denotadas
por y1 ; y2 ; y y3 : Los datos se muestran en la Tabla de abajo:
x1

x2

x3

y1

y2

y3

-1
0
1
-1
0
1
-1
0
1
-1
0
1
-1
0
1
-1
0
1
-1
0
1
-1
0
1
-1
0
1

-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1
-1
-1
-1
0
0
0
1
1
1

-1
-1
-1
-1
-1
-1
-1
-1
-1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1

34
115
192
82
44
322
141
259
290
81
90
319
180
372
541
288
432
713
364
232
408
182
507
846
236
660
878

10
116
186
88
178
350
110
251
280
81
122
376
180
372
568
192
336
725
99
221
415
233
515
535
126
440
991

28
130
263
88
188
350
86
259
245
81
93
376
154
372
396
312
513
754
199
266
443
182
434
640
168
403
1161

y
24.0
120.3
213.7
86.0
136.7
340.7
112.3
256.3
271.7
81.0
101.7
357.0
171.3
372.0
501.7
264.0
427.0
730.7
220.7
239.7
422.0
199.0
485.3
673.7
176.7
501.0
1010.0

Sx
12.5
8.4
42.8
3.7
80.4
16.2
27.6
4.6
23.6
0.0
17.7
32.9
15.0
0.0
92.5
63.5
88.6
21.1
133.8
23.5
18.5
29.4
44.6
158.2
55.5
138.9
142.5

Como antecedente se sabe que un valor ideal para el proceso (objetivo) es de


500, con mnima variacin. Antes de contestar, lea primero las preguntas para
que se organice mejor en su respuesta.
1. Escriba el modelo de segundo orden completo para la media.

9.8. Ejercicios

353

2. Haga la evaluacin estadstica del modelo estimado en el punto 1.


3. Escriba el modelo de segundo orden completo para la desviacin estndar.
4. Si la matriz inversa B en el modelo ajustado en el inciso 1 es:

0:00143
= @ 0:01443
0:01266

0:01443
0:01907
0:00444

1
0:01266
0:00444 A
0:01463

Encuentre el ptimo x0 . Recuerde que la matriz B contiene los trminos


de segundo orden en el modelo estimado.
5. Evale en ese ptimo el modelo que ajust en inciso 1, es decir: yb(x0 ) .

6. Trace las curvas de nivel en el paquete estadstico y bosqujelas en su hoja


de respuestas, identique la respuesta en el inciso 4. Qu comentarios
tiene al respecto si se quiere que la respuesta est alrededor de 500?
7. Sobreponga las curvas de nivel de los modelos ajustados en los incisos 1 y 3.
Indique cules podran ser escenarios adecuados para obtener en promedio
500 y variacin mnima.
8. Si los valores caractersticos para el modelo ajustado en el punto 1 son:
vc = ( 49:6; 37:1; 67:2); diga la naturaleza del ptimo encontrado en el
inciso 4. Escriba la ecuacin cannica e interprtela.
9. Ajuste un mejor modelo para la media.

10. Ajuste un mejor modelo (hasta de segundo orden) para la desviacin estndar y optimcelo.
11. Sustituya el ptimo encontrado en el inciso 10 en el modelo ajustado en el
inciso 9. Optimice ese nuevo modelo.
12. Con la informacin en 10 (si es necesaria) y usando el modelo generado en
el inciso anterior bosqueje las curvas de nivel.
13. Encuentre un intervalo de conanza para yb en el punto x0 = (1; 0; 0), considerando el modelo ajustado en el inciso 9.

354

9. Optimizacin estadstica del proceso

Ejercicio 9.19
Se realiza un proyecto para la elaboracin de un queso y se desea conocer la
combinacin de los efectos de la cistina (cuajo): X1 y el cloruro de calcio: X2
en la texturizacin y en las caractersticas de agua - caliente dialisada en una
concentracin de protena de suero en un gel. En este proceso experimental se
aplic un diseo central compuesto, cada factor X tiene cinco valores como se
muestran en los renglones 2 y 3 en la Tabla A. Las caractersticas de la textura
son medidas por la dureza: Y1 , cohesividad: (coherencia) Y2 , elasticidad: Y3 , y
un ndice de agua: Y4 : Este estudio fue desarrollado por Schmidt et. al. (1979) y
el experto en este tipo de proceso consider como objetivo alcanzar los mximos
simultneos para las cuatro variables. El diseo que se utiliz en este estudio fue
el central compuesto.

Xnx
X1
X2

Caractersticas reales de los


p factores de control X.
p
=
2
1
0
1
= 2
Cloruro de calcio
2:6
8:0 21:0 34:0
39:4
Texturizacin
2:5
6:5 16:2 25:9
29:9

En la tabla siguiente se describe en las columnas correspondientes a x1 y x2 el


diseo central compuesto para dos factores y en este caso no = 5; en las ltimas
cuatro columnas se muestran los valores de las cuatro respuestas para cada uno
de los tratamientos.
Esquema experimental y las respuestas en
cte.
x1
x2 x1 x2 x21 x22
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
p
1
2
0
0
2
0
p
1
2
0
2
0
p0
1
0
2
0
0
2
p
1
0
2
0
0
2
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0
1
0
0
0
0
0

Tratamiento
1
2
3
4
5
6
7
8
9
10
11
12
13

cada tratamiento
Y1
Y2
Y3
2:48 0:55 1:95
0:91 0:52 1:37
:71 0:67 1:74
:41 0:36 1:20
2:28 0:59 1:75
0:35 0:31 1:13
2:14 0:54 1:68
0:78 0:51 1:51
1:50 0:66 1:80
1:66 0:66 1:79
1:48 0:66 1:79
1:41 0:66 1:77
1:58 0:66 1:73

Y4
0:22
0.67
0:57
0:69
0:33
0:67
0:42
0:57
0:44
0:50
0:50
0:43
0:47

1. Escriba el modelo para cada respuesta y haga el anlisis estadstico respectivo con todo detalle.

9.8. Ejercicios

355

2. Haga un diagrama de dispersin en conjunto para todas las respuestas y


obtenga sus conclusiones.

3. Encuentre el ptimo individual para cada respuesta, suponga que el investigador desea obtener un mximo en cada una de las respuestas.

4. Ubique en un plano que comprende la regin experimental cada ptimo,


qu se puede concluir?

5. D una solucin ptima comn para las cuatro respuestas usando la funcin
de deseabilidad.

6. Haga un anlisis grco para encontrar un ptimo comn. Realice una


discusin de lo que observa.

7. Describa la relacin por pares de las variables de respuesta.

Ejercicio 9.20
Se realiz un experimento para extraer aceite de cacahuate, la meta era encontrar
la mayor produccin. Se consideraron dos factores control X1 y X2 y dos de ruido
Z1 y Z2 :

X1 : Presin
X2 : Razn de uido
Z1 : Temperatura
Z2 : Tamao partcula

Nivel bajo
450
40
45
1:3

Nivel alto
550
60
95
4:0

Se propuso un diseo de factorial 24 , el diseo y los resultados se muestran a


continuacin.

356

9. Optimizacin estadstica del proceso

Tratamiento

x1

x2

z1

z2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1

-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1

-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1

-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1

55.5
75.0
42.7
70.1
43.4
65.3
32.0
56.2
68.1
81.0
61.2
74.6
58.0
71.0
49.8
62.7

1. Escriba el modelo similar al de la expresin (9.25)


2. Encuentre las expresiones para la media (9.26) y la varianza (9.27) respectivamente y optimice.

Captulo 10

Diseos de experimentos con


mezclas
La experiencia ms bella que podemos tener es lo misterioso[. . . ] Aqul que es
ajeno a las emociones, aqul que ya no puede detenerse y mirar con reverencia
est muerto. Sus ojos estn cerrados.
Albert Einstein

10.1

Introduccin

Muchos productos son resultado de un proceso de mezclado de varios ingredientes.


Como un ejemplo inicial suponga que una empresa preocupada por mejorar sus
productos alimenticios se ha comprometido en la revisin de la formulacin de
uno de los alimentos que produce. Suponga que una de las caractersticas de
calidad de tal producto es su viscosidad nal, denotada sta por y: Suponga que
una formulacin est constituda de la mezcla de tres ingredientes (X1; X2 ; X3 ).
Sucede que la viscosidad y depende no tanto de la cantidad de cada uno de los
ingredientes en la formulacin, sino de las proporciones (o porcentajes) de cada
uno de los tres ingredientes como componentes de una unidad de producto (o
100%), es decir que y depende las proporciones respectivas de los tres ingredientes
X1 ; X2 ; X3 tales que X1 + X2 + X3 = 1(o 100% como porcentajes). El objetivo es
estudiar entonces el efecto de cada componente sobre la viscosidad, las posibles
interacciones sobre la viscosidad y por supuesto encontrar la mejor mezcla de
un conjunto propuesto de mezclas. Cumplir tal objetivo implica responder dos
preguntas: qu mezclas deben ser elaboradas y cmo analizar los datos de estas
mezclas para obtener de manera eciente informacin.
Lo anterior es un ejemplo real de aplicacin de lo que se conoce como el diseo

358

10. Diseos de experimentos con mezclas

y anlisis estadsticos de experimentos con mezclas. Estos experimentos son muy


comunes en mltiples contextos, como seala Cornell (2002) para formulaciones
de pasteles, concretos para construir edicaciones, bebidas de frutas, recubrimiento de pelculas fotogrcas, produccin de cigarros, entre otras muchas posibilidades. En cada uno de estos ejemplos hay una o ms propiedades del producto
resultante que dependen crticamente de las proporciones de los ingredientes y de
sus cantidades, especcamente: la esponjosidad del pastel, la dureza o fuerza de
compresin del concreto, el sabor afrutado de la bebida, la estabilidad del color
de las fotografas cuando son expuestas al calor y a la luz, el sabor y aroma de la
mezcla de tabaco.
El trabajo estadstico inicial para el desarrollo de esta rea del diseo de
experimentos se debe a Sche (1958).

10.2

Denicin del problema

Sea y que represente una caracterstica de importancia medida sobre el producto


con el mezclado de los ingredientes X1 ; X2; : : : ; Xk que representan en general a
las proporciones de k componentes a ser mezclados tales que:

Xi

1, i = 1; :::; k;

k
X

Xi = 1

(10.1)

i=1

Como se mencion anteriormente, se debe de responder a dos preguntas, la


primera corresponde al diseo del experimento, dada la restriccin sobre las mezclas es intuitivamente clara la diferencia con el uso de los diseos factoriales
presentada en captulos anteriores. Los diseos de experimentos con mezclas
siguen manteniendo el nfasis en una estructura factorial y no OFAT; sin embargo, la condicin (10.1) implica restricciones sobre la ubicacin de las corridas
experimentales debido a la dependencia entre las X 0 s. Desde un punto de vista
geomtrico, (10.1) impone que el espacio factorial de mezclas de k componentes
consista de todos los puntos sobre las fronteras o internos de lo que es llamado un
smplex regular de (k 1) dimensiones. Ejemplos de lo que son smplex regulares
para k = 2; 3 y 4 se muestran en la Figura 10.1.
Para k = 2, as si X1 = x1 ; X2 = 1 x1 ; dado que el ltice es el intervalo [0; 1] :
Note que la mezcla (X1 = 0; X2 = 1) o la mezcla (X1 = 1; X2 = 0) corresponden
a las que se llaman mezclas puras, (X1 = x1 ; X2 = 1 x1 ) con x1 6= 0; 1; son
llamadas mezclas binarias. Para k = 4; que el ltice regular es una pirmide
tetradrica y en la misma lgica tendramos:

10.3. Diseos

359

Fig. 10.1: Descripcin geomtrica del espacio factorial de mezclas para q = 2; 3


y4

Puras Xi = 1; Xj = 0, j 6= i
Binarias (Xi = xi ; Xj = xj ) ;
(xi ; xj ) (0; 1) (0; 1) ; xi + xj = 1
Ternarias(Xi = xi ; Xj = xj ; Xk = xk ) ;
(xi ; xj; xk ) (0; 1) (0; 1) (0; 1) ; xi + xj + xk = 1
Cuaternarias (X1 = x1 ; X2 = x2 ; X3 = x3 ; X4 = x4 ) ;
(x1 ; x2; x3 ; x4 ) (0; 1) (0; 1) (0; 1) (0; 1) ; x1 + x2 + x3 + x4 = 1
En la Fig. 10.2 se muestra el smplex para el caso de k = 3, donde se muestra
el sistema coordenado respectivo para ubicar muestras dentro del smplex.
El problema de diseo de este tipo de experimentos es seleccionar las mezclas
ms adecuadas para responder al objetivo de este tipo de experimentos.

10.3

Diseos

Los tres tipos de diseo que son ms usados son el diseo smplex - ltice, el
diseo smplex - centroide y el diseo axial.

10.3.1

Diseo smplex reticular (ltice)

El nombre diseo smplex reticular se reere a una coleccin de mezclas uniformemente espaciadas en un smplex. Con este diseo smplex reticular se corresponde

360

10. Diseos de experimentos con mezclas

Fig. 10.2: Coordenadas dentro de un simplex k = 3


un polinomio especco a ser ajustado mediante los datos generados en el experimento respectivo. Esto es, para poder estimar un polinomio de grado m en k
componentes, el diseo smplex reticular denotado como fk; mg consiste de mezclas cuyas coordenadas estn denidas para cada componente tomando m + 1
valores equiespaciados de 0 a 1, esto es:
1 2
; ; :::; 1; i = 1; 2; :::; k
m m
sujetos a la restriccin (10.1). Ejemplos: el smplex reticular (3; 2) consiste de los
puntos:
Xi = 0;

(X1 ; X2 ; X3 ) =

1 1
1 1
1 1
(1; 0; 0); (0; 1; 0); (0; 0; 1); ( ; ; 0); ( 0; ); (0; ; )
2 2
2; 2
2 2)

estos puntos estn en los vrtices y en los lados del smplex; con este diseo se
puede estimar un polinomio de grado dos. Para el smplex reticular (3; 3) los
puntos son:

(X1 ; X2 ; X3 ) =

(1; 0; 0); (0; 1; 0); (0; 0; 1); ( 3;2 3;1 0); ( 3;2 0; 13 ); ( 3;1
( 3;1 0; 23 ); (0; 3;2 13 ); (0; 3;1 23 ); ( 3;1 3;1 13 )

2
3;

0);

con el que se puede estimar hasta un polinomio de grado tres. En general el


nmero de mezclas de un diseo smplex reticular fk; mg es:

10.4. Anlisis de experimentos con mezclas: el polinomio cannico

361

(k + m 1)!
m!(k 1)!
que permitirn estimar hasta un polinomio de grado m:

10.3.2

Diseos smplex centroide

Un diseo smplex centroide para k componentes es un diseo con mezclas de uno,


de dos, . . . , o de k componentes con proporciones que sean iguales. As el diseo
smplex centroide consiste de 2k 1 puntos: k permutaciones de (1; 0; :::; 0); (k2 )
permutaciones de ( 2;1 2;1 0; :::; 0); :::; (k3 ) permutaciones de ( 31 ; 13 ; 13 ; 0; :::; 0); :::; etc.,
1 1
1
y el centroide ( k;
k; :::; k ): Todas sus mezclas estn localizadas en el centroide
del ltice (k 1)-dimensional y en centroides de todos los smplex de menor
dimensionalidad contenidos en el smplex (k 1) -dimensional. Este diseo
permite estimar polinomios que tengan tantos parmetros como el nmero de
mezclas incluidas en ste.

10.3.3

Diseos axiales

Mientras que para el diseo smplex ltice y diseos smplex centroide las mezclas
en el diseo (excepto en el centroide) estn localizadas en las fronteras del espacio
factorial smplex, las mezclas en un diseo axial son principalmente mezclas de
k componentes, es decir, la mayora de las mezclas estn dentro del smplex. Las
mezclas en un diseo axial se muestran para el caso k = 3 en la Fig. 10.3.
En la Fig. 10.3 se aprecia un diseo axial especial en el que sus mezclas se
1 1
1
encuentran localizadas a una misma distancia
del centroide ( k;
k; :::; k ) sobre
los ejes del sistema coordenado del smplex. El eje de un componente i es la lnea
imaginaria que se extiende del punto base xi = 0; xj = 1=(q 1); para toda j 6= i;
al vrtice donde xi = 1; xj = 0; para toda j 6= i: Este tipo de diseo es utilizado
principalmente para estimar polinomios que no contengan interacciones entre los
componentes de las mezclas.

10.4

Anlisis de experimentos con mezclas: el polinomio cannico

Como hemos repasado en los captulos anteriores, a un diseo experimental le


corresponde un modelo estadstico para su correcto anlisis. En general los diseos recin presentados permiten estimar parmetros desde polinomios lineales
sin trminos de interacciones, hasta polinomios que incluyen trminos de interaccin triple, que resultan sucientes en general en las aplicaciones. Antes de

362

10. Diseos de experimentos con mezclas

Fig. 10.3: Diseo axial en k = 3 componentes

10.4. Anlisis de experimentos con mezclas: el polinomio cannico

363

presentar diversos modelos es necesario aclarar que el polinomio tradicional debe


asumir cambios debidos a la estructura de dependencia (10.1), que implica que los
parmetros estimados no sean nicos. Para visualizar tales cambios sin prdida
de generalidad, pensemos en el polinomio de primer orden sin interacciones
y=

0+

k
X

i Xi

+"

(10.2)

i=j

Tomando en cuenta (10.1), por ejemplo:


X
Xi

Xk = 1

(10.3)

i6=k

que sustituido en (10.2) se tiene que:


y=

k
X

Xi

k
X

i Xi

+"=

k
X

i Xi

+"

(10.4)

con i = 0 + i (i = 1; 2; :::; k): El modelo (10.4) retiene la forma en los k


componentes y cada i tiene un claro signicado. A este polinomio se le llama
polinomio cannico, en el que el parmetro de ordenada al origen desaparece.
Este hecho puede confundir de entrada, pero esto ocurre en clara referencia a
que y no depende de cantidades, sino de proporciones de los componentes de la
mezcla.
Para obtener la forma cannica a partir de un modelo que incluya interacciones de dos componentes, se procede similarmente, pero agregando:
Xi2

= Xi

k
X

Xj

El modelo cannico es:


y=

k
X

i Xi

XX

ij Xi Xj

+"

(10.5)

i<j

con i = 0 + i + ij y ij = ij
ii
jj (i; j = 1; 2; :::; k; i < j): El modelo
(10.5) se puede simplicar ms multiplicando
Xi de la siguiente
i Xi por
manera:
y=

XX
i j

ij Xi Xj

+"

(10.6)

364

10. Diseos de experimentos con mezclas

con ii = i y ij = ij + i + j (i; j = 1; 2; :::; k; i < j): Los modelos (10.5) y


(10.6) son equivalentes y contienen el mismo nmero de parmetros. Otros dos
modelos tiles en aplicaciones son el modelo cbico completo (sin asteriscos a
partir de ahora):

y=

k
X
i=1

k
XX
X
+
i
i
i<j

k
XX
X
X
+
i
j
ij

ij Xi Xj (Xi

i<j

k
XX X
Xj )+

ijk Xi Xj Xk +"

i<j<k

(10.7)
y el modelo cbico especial:
y=

k
X
i=1

i Xi +

k
XX
i<j

ij Xi Xj +

k
XX X

ijk Xi Xj Xk

+"

i<j<k

La interpretacin de los coecientes en cada uno de estos polinomios es simple.


Los coecientes de componentes individuales representan el efecto de la "mezcla
pura" respectiva. As, si Xj = 0 j 6= i;
i representa el efecto del componente
i de la mezcla. Todos los dems coecientes representan efectos no lineales de la
mezcla de componentes; as, por ejemplo, si se desean valores grandes de y; si ij
(de una mezcla binaria) fuera positivo implicara un efecto sinrgico sobre y al
mezclar el componente i con el componente j; pero si ij fuera negativo entonces
resultara un efecto antagnico entre el componente i y el componente j sobre y,
es decir que al mezclarse el componente i con el componente j reduciran a y al
comprarse con mezclas puras del componente i y del componente j:
Los procedimientos de estimacin de parmetros, validacin y diagnstico de
los modelos polinomiales utilizados para estudiar experimentos con mezclas, son
similares a los utilizados en el caso de los modelos polinomiales de la regresin
clsica revisados en el Captulo 8. Para el caso de pruebas de hiptesis de efectos
principales de cada elemento de la formulacin slo es necesario notar que las
hiptesis a contrastar para los parmetros i en los polinomios cannicos es de
igualdad y no de nulidad, es decir, se prueba si stos son iguales entre s (y
no si son iguales a cero). Sin embargo para todos los parmetros asociados a
interacciones, las hiptesis a contrastar s se reeren a la nulidad de stos.
Ejemplo 10.1
Este ejemplo es un clsico de la literatura de diseo de mezclas y lo propuso Cornell (1990). El experimento incluye a tres componentes: polietileno (X1 ), poliestireno (X2 ) y polipropileno (X3 ). Estos componentes se mezclan para formar
una bra de hilado que se utilizar en el estambre para el pao. Los diseadores
del producto slo estn interesados en las mezclas puras y en las binarias para

10.4. Anlisis de experimentos con mezclas: el polinomio cannico

365

estos tres materiales. La respuesta de inters es la enlongacin del estambre medido en kilogramos de la fuerza aplicada. Un diseo smplex reticular se us en
este estudio. Los datos se muestran a continuacin:
X1
Punto
1
2
3
4
5
6

X2

1
0
0

0
1
0

1
2

1
2
1
2

0
1
2

X3
y
11.0, 12.4
8.8, 10.0
16.8, 16.0
15.0, 14.8, 16.1
10.9, 9.7, 11.8
17.7, 16.4, 16.6

0
0
1
0
1
2
1
2

(10.8)

El anlisis estadstico de este ejemplo est a continuacin. El modelo a estudiar es:


y=

1 x1

2 x2

3 x3

12 x1 x2

13 x1 x3

23 x2 x3

+"

Las hiptesis nula y alternativa para contrastar y as vericar si la respuesta


depende de los componentes de la mezcla son:
H0 :
H1 :

0;

12

13

23

=0

Al menos una de las igualdades no se cumple

La tabla de anlisis de varianza se muestra en la Tabla 10.1 para contrastar


a estas hiptesis es
Fuente gl Suma de cuadrados Cuadrado medio
Modelo 5
123:0
24:6
Error
9
6:2
0:68
Total
14
129:2
Tabla 10.2 Tabla ANDEVA para el Ejemplo 10.1

donde el modelo bajo la hiptesis nula es:


y=

+"

F
35:7
p < :0001

366

10. Diseos de experimentos con mezclas

con lo que ^ 0 = y: Respecto a la signicancia de cada uno de los parmetros en


el modelo, se tienen los siguientes resultados:
Coeciente
1
2
3
12
13
23

Estimado
11.7
9.4
16.4
19
11.4
-8.4

Error estndar
0.59
0.59
0.59
2.54
2.54
2.54

t
19.94
16.02
27.94
7.49
4.5
-3.31

Valor p
<.0001
<.0001
<.0001
<.0001
.0015
.0090

Aparentemente el modelo ajustado es adecuado. Por otro lado si se ajusta el


modelo sin interacciones se tiene que es signicativo en lo global y con coecientes
signicativos como muestra lo siguiente:
Coeciente
1
2
3

estimado
14.95
9.95
15.91

error estndar
1.37
1.37
1.37

t
10.91
7.26
11.61

Valor p
<.0001
<.0001
<.0001

Sin embargo, el modelo sin interacciones tiene carencia de ajuste como lo


muestra lo siguiente:
Fuente
Carencia ajuste
Error puro
Error total

gl
3
9
12

SC
66:67
6:2
72:87

CM
22:2
0:69

F
32:3

Valor p
< :0001

por lo que el modelo con interacciones es preferible.

10.5

Diseos con restricciones factoriales

En muchos casos son necesarias restricciones adicionales a (10.1), para garantizar


factibilidad no slo en el smplex sino en el contexto de aplicacin. As, en general,
las restriccin para el problema de mezclas son:
X1 + X2 + ::: + Xk = 1
y restricciones bilaterales:
Li
donde:

Xi

Ui ;

i = 1; 2; :::; k

10.5. Diseos con restricciones factoriales

Li

0 y Ui

367

1, i = 1; 2; :::; k

Tambin se pueden plantear restricciones unilaterales por ejemplo con cotas


inferiores para cada componentes:
Li

Xi

1;

i = 1; 2; :::; k

o restricciones unilaterales con cotas superiores:


0

Xi

Ui ;

i = 1; 2; :::; k:

Ejemplo 10.5
Suponga que en un diseo en mezclas de tres componentes se requiere que:
0:3

X1 ;

0:4

X2 ;

y 0:1

X3

Esto hace necesaria una redenicin de las componentes, llamados ahora Lseudocomponentes, de la siguiente forma:
Wi =

Xi
1

Li
L

donde:
L=

k
X

Li < 1

i=1

la suma de todas las cotas inferiores. En este ejemplo las seudocomponentes son:
0:3
X2 0:4
X3 0:1
W2 =
W3 =
0:2
0:2
0:2
Las componentes originales se pueden expresar como:
W1 =

X1

Xi = Li + (1

L)Wi

Aplicando esta expresin se tiene:


X1 = 0:3 + 0:2W1
X2 = 0:4 + 0:2W2
X3 = 0:1 + 0:2W3

368

10. Diseos de experimentos con mezclas

Para ilustrar considere el punto W1 = 21 ;


de las componentes originales, este punto es:

W2 = 12 ; y W3 = 0: En trminos

W1 = 0:3 + 0:2

1
2

= 0:4

W2 = 0:4 + 0:2

1
2

= 0:5

W3 = 0:1 + 0:2 (0) = 0:1


Ejemplo 10.6
El ejemplo incluye una mezcla de combustible X1 , un oxidante X2 y un aditivo
X3 se juntan estos componentes para formar una sustancia que se utilizar en
el sistema de escape de un avin. En este proceso se tienen tres variables de
respuesta. Primero la razn de quemado, la desviacin estndar de esta razn e
ndice de manufactura que reeja el costo y la dicultad asociada con producir
una mezcla particular.
Las condiciones:
X1 + X2 + X3 = 0:9
0:3

X1

0:2

X2

0:2

X3

Las tres componentes hacen el 90 % de la mezcla. El sistema para las seudocomponentes es:
Wi =

Xi
0:9

Li
P3

i=1 Li

Retornando a las componentes originales:


Xi = Li + (0:9

3
X

Li )Wi

i=1

es decir:

W1 = 0:3 + 1(0:2) = 0:5


W2 = 0:2 + 1(0:2) = 0:2
W3 = 0:2 + 0(0:2) = 0:2:
Es necesario siempre vericar que las restricciones no induzcan regiones inconsistentes; en alguno de los ejercicios al nal de este captulo se presentan formas
de vericar esta consistencia. Adems, dadas las restricciones sobre los componentes, es complejo identicar cules mezclas cumplen con todas las restricciones

10.6. Preguntas en un experimento con mezclas

369

impuestas y de stas seleccionar un subconjunto que permita la estimacin del


modelo polinomial de inters. Actualmente en los paquetes estadsticos ya existen algoritmos computarizados para realizar estas tareas. Para mayores detalles
consulte a Cornell (2002) que comenta un amplio conjunto de referencias al respecto.

10.6

Preguntas en un experimento con mezclas

En el contexto particular:
1. Cmo se denen las mezclas factibles?
2. Hay mezclas que consisten de ingredientes individuales, por s mismos as
como cualquier combinacin de los k ingredientes?
3. Hay al menos 2
cero?

r < k de los componentes con proporciones distintas de

4. Algunos componentes pueden estar ausentes (xi = 0) pero no ms de k


pueden estar ausentes en cualquier mezcla?

5. Hay mezclas con todos los componentes? En otras palabras: ninguno de


los componentes puede estar ausente en cualquier mezcla (forzando a las
cotas inferiores 0 < Li xi para toda i = 1; 2; :::; k:
6. Cules son los objetivos del experimento?, se sabe cules componentes
son los ms activos y los menos activos? Si no: se debe correr primero
un experimento de tamizaje? Si se sabe cules son los ms activos: se
sabe cules son sus propiedades cuando son mezclados?, se sabe cmo
cada uno afecta a las respuestas de inters tanto de manera conjunta como
individualmente?
7. Es razonable suponer que la supercie mezcla es suave de tal forma que
algn modelo polinomial puede ser ajustado? Qu tipo de polinomio ajustar, Sche en proporciones componentes o modelo estndar en un conjunto
de variables independientes? Otros modelos de mezclas?
8. Cmo se dene la regin de mezclas factibles? Vale la pena una regin
smplex completa, y si as lo es, un diseo ltice puede usarse? Si la
regin no es un smplex completo sino ms bien slo una subregin del
smplex, cmo escoger a las mezclas?, se deben considerar los llamados
seudocomponentes?

370

10. Diseos de experimentos con mezclas

9. Hay otros factores tales como variables de proceso o cantidades de la mezcla que podran tener inuencia en las propiedades de la mezcla de componentes y, por lo tanto, que deban ser incluidas en el modelaje y en el
diseo?
10. En la planeacin del nmero total de mezclas para correr, otras mezclas
adicionales deben considerarse? Si as lo es, dnde deben ubicarse?, se
pueden replicar algunas mezclas?, es necesario el uso de bloques?

10.7

Factores de proceso

Tambin se pueden incluir factores de control de proceso que puedan tener un


efecto en la respuesta : De esta manera las variables de mezclas Xi s y los
factores de control Z1; Z2 ; :::; Zp se pueden modelar:
= (X1 ; X2 ; :::; Xk ; Z1 ; Z2 ; :::; Zp ;

1 ; 2 ; :::; s );

el modelo anterior se aproximar por un polinomial de bajo grado para detectar


efectos de X; Z y sus interacciones. Para mayores detalles consulte Cornell (2002)
captulo 7.
Finalmente, tambin es posible considerar el diseo y anlisis de experimentos
con mezclas incorporando factores de control del proceso y factores de ruido a la
Taguchi, como se desarrolla en Goldfarb et al. (2003).

10.8

Otros anlisis para diseos con mezclas

10.8.1

Coecientes polinomiales

Existe una correspondencia entre las mezclas en un diseo smplex reticular y


el polinomio correspondiente por ajustar. Para estudiar esta correspondencia se
presenta la siguiente notacin especca:

i
ij
ijk

respuesta esperada a una mezcla pura (i)


respuesta esperada a una mezcla binaria (ij) con proporciones iguales 50% : 50%
respuesta esperada a una mezcla ternaria (ijk) en iguales proporciones 33.3%, 33:3%, 33:3%

Los subndices de una respuesta esperada designan tres caractersticas:


1. El nmero de subndices es igual al denominador en las fracciones usadas
en la mezcla.

10.8. Otros anlisis para diseos con mezclas

371

2. El nmero de subndices distintos indica cuntos componentes estn presentes en proporciones no cero en la mezcla.
3. El nmero de veces que un subndice aparece indica la proporcin relativa
supuesta por el componente correspondiente en la mezcla.
Por ejemplo: 112 tres subndices, mezclas de fracciones componentes de
tamao 31 ; 1, 2 aparecen; slo componentes 1 y 2 aparecen en mezclas; dos 1s y
un 2 implica x1 = 32 y x2 = 13 :
Similarmente se tiene:
x1
1
0

x2
0
1

12

1
2

23

3
4
1
4

1
2
1
2
1
3
1
3
1
3
1
4
1
2

1
2

112

1
3
2
3

233

123

1112
1223
1144
2344
1234

x3
0
0
0

x1
1
0

x2
0
1

1
2
1
3

1
2

1
2
1
2
1
3
1
3
1
3
1
4
1
2

1
3
2
3

0
2
3

0
3
4
1
4
1
2

0
1
4

0
1
4

x3
0
0
0
1
2
1
3

0
2
3

0
1
4

1
4
1
4

1
4
1
4

x4
0
0
0
0
0
0
0
0
0
1
2
1
2
1
4

Por ejemplo {3; 2} implica:


=

1 x1

2 x2

en

i,

xi = 1;

3 x3

12 x1 x2

13 x1 x3

23 x2 x3

Sustituyendo:

en

ij ,

1
xi = ;
2

xj = 0;
1
xj = ;
2

i; j = 1; 2; 3;
xk = 0;

j 6= i

i < j;

Se tiene:
1

12

1
2

1
2

12

1
4

k 6= i; j

372

10. Diseos de experimentos con mezclas

13

1
2

1
2

13

1
4

23

1
2

1
2

23

1
4

Que resolvindolas resulta:


= 1
2 = 2
=
| 3 {z }3
"
Mezclas puras
P"
1

13

23

2
2
2

12
13
23

2
2
2

1
1
2

2
3

{z
}3
"
Desviaciones de la planaridad
|

(10.9)

Mezcla aditiva

i i

q general

=4
=4
=4

12

i;

ij

=4

ij

2(

j)

Para el caso m > 2 consulte a Gorman y Hinman (1962).

10.8.2

Estimacin de parmetros en los polinomios {q; m}

Como vimos, los parmetros de polinomios fq; mg son expresables como funciones
simples de respuestas esperadas en los puntos de los diseos smplex reticular.
De ello se puede conjeturar que los parmetros se pueden estimar usando las
mismas funciones pero ahora de las respuestas observadas. Para ver que as es,
consideremos la estimacin de los coecientes de un polinomio f3; 2g a partir del
diseo smplex reticular correspondiente, es decir, estimar los parmetros de:
=

1 x1

2 x2

3 x3

12 x1 x2

13 x1 x3

23 x2 x3

Denotemos por yu las respuestas observadas, y supongamos que:


yu =

+ "u

Utilizando la nomenclatura para


tas observadas:
yi !
yij !

"u N (0; 2 )
independientes
antes vista podemos escribir a las respues-

(puras)

i
ij

(binarias 50 : 50)

10.8. Otros anlisis para diseos con mezclas

373

Con lo que igualando las expresiones (10.9) a los datos respectivos (10.8) se
tiene:
^ = yi
i
^
^

ij
ij

= 4yij

2(yi + yj ),

i; j = 1; 2; :::; q

i<j

yi +yj
2

= yij

Si ri ; rj y rij representan el nmero de rplicas en los puntos de diseo respectivos:


^
^

ij

= 4y ij

yi =

yi0 s
ri

i = 1; 2; :::; q

2 (yi + yj )

i; j = 1; 2; :::; q

i<j

Para el caso de un modelo cbico y curtico (o polinomio de grado cuatro)


las frmulas son presentadas en Cornell (2002).
Caso general:
=

y
N 1

+ " ,

N pp 1

b = (X0 X)

Residual
Total

2)

N ( ; (X0 X)

1 2)

gl
p
N
N

1
p
1

SSR =
SSE =

N
P

(b
yu

u=1
N
P

SST =

2 I)

1 2

b
V [y(x)]
= x0 (X0 X)

Fuente
Regresin

N (0;

(0;

1 X0 y

V ( b ) = (X0 X)

Si "

"

N 1

(yu

u=1
N
P

(yu

u=1

1x 2

SC
y)2 = b0 X0 y
ybu )2 = y0 y

y)2 = y0 y

CM
(10 y)2
N

SSR=(p

b0 X0 y

SSE=(N

(10 y)2
N

Tabla 10.2 ANDEVA del modelo de regresin de un diseo en mezclas

1)
p)

374

10. Diseos de experimentos con mezclas

Comparacin de un modelo con


el siguiente modelo:

E[y] =

y un modelo sin

p
X

Con

0;

i zj

suponga

(10.10)

j=1

donde cada zj ; j = 1; :::; p puede ser una funcin lineal cuadrtica u otra de las
proporciones componentes xi ; i = 1; :::; k: As p = k en el caso del modelo lineal,
p = k(k+1)
si el modelo es de segundo orden, etc. La hiptesis nula tpica es que
2
la respuesta no depende de las zj0 s:
H0 :

= 0 8i = 1; 2; :::; p:

(10.11)

Bajo H0 :
E[y] =

0:

(10.12)

Por mnimos cuadrados ^ 0 = y; promedio de las N observaciones. Note que


p
P
E[y] = 0 es un caso particular de E[y] = 0 +
i zi :Dado que para estimar
i=1

(10.12) slo se usa una sola combinacin lineal de las N observaciones:


SST =

N
X

(yu

y)2

(^
yu

y)2 ;

u=1

que tiene (N

1) grados de libertad:
SSR =

N
X
u=1

la suma de cuadrados de la regresin es la contribucin explicada por el ajuste


de (10.10). Los grados de libertad de esta suma de cuadrados son el nmero
de parmetros independientes estimados para el modelo (10.10) despus de que
(10.12) ha sido ajustado.
Si las xi ; i = 1; 2; :::; p en (10.10) son linealmente independientes, los grados
de libertad de SSR sern p.
Sin 0 :
E[y] =

p
X

i xi

primer grado

(10.13)

i=1

La hiptesis nula apropiada es que la respuesta no depende de la mezcla (al


cambiar de una a otra):

10.8. Otros anlisis para diseos con mezclas

H0 :

= ::: =

375

(10.14)

Bajo H0 :
E[y] =

p
X
i=1

p
X
xi =
0 xi = 0

(10.15)

i=1

Por mnimos cuadrados ^ 0 = y; promedio de las N observaciones.


N
X

SSR =

y)2

(^
yu

u=1

la suma de cuadrados de la regresin; el modelo (10.13) contiene (q 1) parmetros


independientes y as SSR asociada tiene (q 1) grados de libertad. Si:

E[y] =

p
X

i xi

i=1

XpX

ij xi xj

(10.16)

i<j

modelo de segundo orden. Una hiptesis relevante de corroborar es:


H0 :

= ::: =

ij

= 0;

i < j:

(10.17)

1)
De nuevo los grados de libertad de la SSR correspondiente seran (p+2)(p
:
2
De esta forma si se est probando (10.14), (10.17) por medio del ajuste de
(10.13), (10.16) respectivamente, el anlisis de varianza apropiado es el dado
en la Tabla 10.2.

10.8.3

Vericar el grado del modelo ajustado

Dependiendo del diseo utilizado es posible que varios modelos atendiendo a


un grado puedan ser ajustados. La pregunta relevante es: con cul modelo
quedarse? Obviamente, por parsimonia siempre el modelo ms simple es el mejor,
si ste provee de una explicacin satisfactoria del fenmeno modelado.
Una medida de bondad de ajuste de un modelo es:
R2 =
con:

SSR
SST

376

10. Diseos de experimentos con mezclas

SSR =

(^
yu

y)2 = b0 X 0 y

(yu

y)2 = y0 y

(10 y)2
N

SST

(10 y)2
N

Sin embargo, hay muchas caractersticas del proceso de recoleccin de datos


que pueden inuir en el valor de R2 : Aunque los polinomios ajustados (de Sche)
no contienen un trmino constante, la SSR y la SST son corregidas ambas por
el promedio global, que es un estimado de la respuesta esperada cuando las componentes de la mezcla no afectan a la respuesta.
Aun cuando SSR y SST no sean corregidos por el promedio global, el valor
de R2 asociado con el ajuste de polinomios cannicos se ve inado. Se propone
entonces:
SSE=(N
SST =(N

2
=1
RA

p)
1)

con
SSE =

y^u )2 = y0 y

(yu

b0 X 0 y

SSE
N p

estima la varianza del error del modelo y = 0 + ":


2 = 0:379 y
Para las pastas de pescado el modelo de segundo grado tiene RA
2
el modelo de tercer grado especial RA = 0:929: Una prueba que compara dos
modelos en los que uno de ellos contiene como subconjunto al otro, digamos que
un modelo reducido a partir de otro se da mediante:
F =

(SSEreducido SSEcompleto )=r


SSEcompleto =(N p)

Fr;N

r es la diferencia en el nmero de parmetros en el modelo completo y en el


modelo reducido. Si F es poco probable bajo Fr;N p el modelo completo sera
preferible.
Equivalentemente se puede pensar en una hiptesis general por constatar:
C

= m

donde es el vector de parmetros del modelo completo y C es una matriz


que operacionaliza la reduccin del modelo completo; por ejemplo, si
=(

1;

2;

3;

12 ;

13 ;

0
23 )

10.8. Otros anlisis para diseos con mezclas


y se desea ver si:

12

13

C
1
0

377

1 0 0 0
0 0 1 0

=m
0
1

0
0

Se puede demostrar que:


F

(Cb m)0 [C(X0X) 1 C0 ] 1 (Cb m)


rfSSEc o m p le to =(N p)g

Fr;N

En el ejemplo de pastas de pescado, habiendo ajustado un modelo de segundo


orden y deseando constatar H0 : 12 = 13 = 23 = 0;
3
2 3
2
0
0 0 0 1 0 0
C = 4 0 0 0 0 1 0 5; m = 4 0 5
0
0 0 0 0 0 1
)

F = 0.16
F3; 8; :05 = 4.07

No se rechaza H0 , por lo que el modelo de primer grado es preferible al de


segundo grado.

10.8.4

Carencia de Ajuste

En el caso de las pastas de pescado el modelo de primer orden aparece como


preferible al de segundo orden. Puede haber casos en que un modelo de orden
superior es mejor que un modelo de orden inferior, por ello es importante que el
diseo contenga corridas que permitan vericar tales casos, en general se habla
as de carencia de ajuste.
Varios enfoques para vericar carencia de ajuste
1. Rplicas en puntos del diseo. Obtener rplicas en uno o ms puntos del
diseo, llevando a la particin de SSE en error puro y en carencia de ajuste.
Este es el enfoque revisado en los captulos anteriores.
2. Puntos de vericacin adicionales a los puntos del diseo inicial. En este
enfoque se consideran tres etapas:
I. Ajuste un modelo al diseo inicial.

378

10. Diseos de experimentos con mezclas


II. Observar al fenmeno en puntos de vericacin diferentes a los del
diseo inicial.
III. Compare valores observados en los puntos de vericacin con los valores generados por el modelo ajustado en la etapa I, si son muy diferentes es indicativo que el modelo ajustado muestra carencia de ajuste.

Cmo seleccionar los puntos de vericacin?


Un criterio es seleccionarlos de tal forma que se maximice la probabilidad de
rechazar (potencia) la no carencia de ajuste.
Esto depende de cmo se estime a 2
Si 2 se estima por datos externos o por rplicas en unos puntos del diseo
inicial 7! b2ext
y=X

+"

E(y) = X

F =

reducido

+ X2

2
(N p2 )

d0 V 1 d=k
b2ext

completo

FR;

b ; y valores en k puntos de vericacin y y


b los estimados
con d = y
y
correspondientes por modelo reducido ajustado con el diseo inicial y grados
de libertad de b2ext . Ahora:
E

con A1 = (X2

X (X0 X)

d0 V 1 d
k

1 X0 X )0 V 1 (X
2
2

0
2 A1

X (X0 X)

1 X0 X

2)

Si p2 = 1

A1 es un escalar con k jo, hay que seleccionar los k puntos


de vericacin de tal forma que A1 se vea maximizada.

Si p2 > 1

rango (A1 ) = p2
Cota inferior para la potencia es:
0
2
min eigenvalor de A1
min
2 / 2 ; min
Seleccionar los k puntos para maximizar min :
rango (A1 ) < p2
Sea +
min el eigenvalor positivo ms pequeo de A1 :
Entonces seleccionar los k puntos de vericacin que maximicen

+
min :

10.8. Otros anlisis para diseos con mezclas

379

Si 2 no se puede estimar de manera externa.


El cuadrado medio de residuales (M SE) se usa para estimar 2 ; siendo este
cuadrado medio de residuales tomado de la tabla ANDEVA del modelo
y=X

+ ":

La estadstica de prueba de carencia de ajuste es:


d V 1d
k M SE

F =
donde:
E(dV

d=k) =

0
2 A1

2 =k

Para el denominador:
2

E(M SE) =

0
2

A2
N p

donde:
A2
(p2 p2 )

= (X2

X(X0 X)

X0 X2 )0 (X2

X(X0 X)

X0 X2 ):

0
A2
FR;N p : Si
Deniendo 2 = 2 2 2 , entonces cuando: 1 = 2 = 0 F
2
1 > 0 y 2 > 0; entonces el cociente F tiene como distribucin muestral una F
doblemente no central con parmetros de no centralidad 1 y 2 : La prueba F
puede ser tanto unilateral como bilateral dependiendo de las propiedades de A1
y A2 en 1 y 2 respectivamente, as como en los grados de libertad k y N p.
Sea:

R=

A1
k

A2
N p

Si R > 0, la prueba F de carencia de ajuste tiene una regin de rechazo en la


cola superior de la distribucin muestral. Si R < 0, la regin de rechazo se ubica
en la cola inferior de la distribucin muestral. Los puntos para vericar carencia
de ajuste en el primer caso (R > 0) deben ser tales que maximicen 1 :Los puntos
para vericar carencia de ajuste en el segundo caso (R < 0) deben ser tales
que minimicen 1 : Ver Shelton et al. (1983) para detalles en lo anterior, y Price
(1977) para un algoritmo de bsqueda de puntos de vericacin.

380

10. Diseos de experimentos con mezclas

Ejemplo 10.7 Para ilustrar el uso de puntos de vericacin para probar carencia de ajuste.
Tres componentes en la mezcla para determinar si un edulcorante articial
puede ser usado en una bebida atltica deportiva.
Los edulcorantes son glicina, sacarina y un realzador. La cantidad fue jada
en 4% del volumen total (250 ml).

Mezcla
1
2
3
4
5
6

Glicina
x1
1
0
0

Sacarina
x2
0
1
0

1
2
1
2

1
2

Realzador
x3
0
0
1
0
1
2
1
2

0
1
2

10:1
5:8
4:2
14:5
12:9
11:6

y
10:7
6:5
3:6
15:4
12:0
13:0

15:0
11:6
12:2

yb
10:4
6:15
3:9
14:97
12:17
12:27

Con estos datos se ajusta el modelo de segundo grado, resultando:

yb(x) = 10:40x1 + 6:15x2 + 3:90x3 + 26:77x1 x2 + 20:07x1 x3 + 28:97x2 x3


(0:40)

(0:40)

(0:40)

(1:73)

(1:73)

b2ext = 0:3206 (Error puro de rplicas)

(1:73)

con 15 6 = 9 grados de libertad. Las predicciones usando tal modelo coinciden


con los promedios de la respuesta en cada punto del diseo dado que con seis
puntos se estiman seis parmetros en el modelo.
Carencia de ajuste dentro del smplex? Puntos de vericacin:

7
8
9
10

x1

x2

x3

1
3
2
3
1
6
1
6

1
3
1
6
2
3
1
6

1
3
1
6
1
6
2
3

7
8
9
10

Centroide
Mitad entre centroide y vrtices
(note que son puntos axiales vistos
estos conceptualmente ms adelante).
yb
y (20 personas)
15.24
8.2
14.62
17
13.23
6
11.55
7.2

10.8. Otros anlisis para diseos con mezclas

d=y

381

b = ( 7:04; 2:38; 7:23; 4:35)


y
= fI4 + X (X0 X)

F =

d0 V 1 d
96:7714
=
= 75:26
4(0:3206)
1:2824

X g

F4;9 ; = 0:01 = 6:42 se rechaza que no haya carencia de ajuste en el interior del
smplex. Utilizando todos los puntos se tiene el siguiente ajuste cuadrtico.
yb = 11:52x1 + 5:80x2 + 3:99x3 + 20:39x1 x2 + 13:99x1 x3 + 21:91x2 x3
(1:92)

(1:92)

(1:92)

(8:07)

(8:07)

(8:07)

con M SE = 99:6567 con 19 6 gl. Error puro 2.8854 con 9 gl. Suma de
cuadrados de carencia de ajuste es: 99.6567 - 2.8854 = 96.7713, 13 - 9 gl = 4 gl.
Con lo que:
F = 75:46

>

F4;9 ;

= 0:01 = 6:42

detectndose as carencia de ajuste. Se ajusta entonces el modelo cbico especial:


yb = 11:25x1 + 5:54 x2 + 3:73 x3 +26:93x1 x2 +20:52x1 x3 +28:44x2 x3 180:68x1 x2 x3
(1:39)

(1:39)

(1:39)

(6:09)

(6:09)

(6:09)

(50:09)

an con carencia de ajuste.


Ejemplo 10.8

0:3

X1 ; 0:4

X2 ; 0:1

X3

Esta redenicin de las componentes se llama L-seudocomponentes. stas


seudocomponentes Wi se denen usando la siguiente transformacin:
Wi =

Xi
1

Li
L

donde:
L=

k
X

Li < 1

i=1

sta es la suma de todas las cotas inferiores. Use la situacin descrita para
ilustrar la relacin entre estas dos ltimas expresiones. Las seudocomponentes
son:

382

10. Diseos de experimentos con mezclas

0:3
X2 0:4
; W2 =
;
0:2
0:2
Las componentes originales son:
W1 =

X1

Xi = Li + (1

W3 =

X3

0:1
0:2

L)Wi

Aplicando esta expresin se tiene:


X1 = 0:3 + 0:2W1
X2 = 0:4 + 0:2W2
X3 = 0:1 + 0:2W3
Para ilustrar considere el punto W1 = 12 ;
de las componentes originales este punto es:

W2 = 12 ; y W3 = 0: En trminos

W1 = 0:3 + 0:2

1
2

= 0:4

W2 = 0:4 + 0:2

1
2

= 0:5

W3 = 0:1 + 0:2 (0) = 0:1


Ejemplo 10.9 El ejemplo incluye una mezcla de combustible X1 , un oxidante
X2 y un aditivo X3 ; se juntan estos componentes para formar una sustancia que
se utilizar en el sistema de escape de un avin. En este proceso se tienen tres
variables de respuesta: primero la razn de quemado, la desviacin estndar de
esta razn y el ndice de manufactura que reeja el costo y la dicultad asociada
con producir una mezcla particular.
Las condiciones:
X1 + X2 + X3 = 0:9
0:3

X1

0:2

X2

0:2

X3

Las tres componentes hacen el 90 % de la mezcla. El sistema para las seudocomponentes es:
Wi =

Xi
0:9

Li
P3

i=1 Li

Retornando a las componentes originales,

10.8. Otros anlisis para diseos con mezclas

3
X

Xi = Li + (0:9

383

Li )Wi

i=1

es decir:
W1 = 0:3 + 1(0:2) = 0:5
W2 = 0:2 + 1(0:2) = 0:2
W3 = 0:2 + 0(0:2) = 0:2
Restricciones en la cota superior en las componentes. Considere la siguiente
situacin:
X1

0:4 X2

0:5 X3

0:3

Un caso particular se describe en la siguiente situacin:


X1

0:7 X2

0:5 X3

0:8

En este caso se tiene un smplex invertido.


En general cuando la restriccin de la cota superior est presente X1 U , la
regin factible ser un smplex invertido que est apoyado completamente dentro
del smplex original o en el smplex sin restricciones si y slo si:
k
X

Ui

Umin

i=1

Aplique esta ltima expresin a los casos expuestos:


k
X

Ui = 0:4 + 0:5 + 0:3 = 1:2

k
X

Ui

i=1

Umin = 1:2

0:3 < 1

i=1

La regin factible es un smplex invertido.


k
X

Ui = 0:7 + 0:5 + 0:8 = 2:0

i=1

k
X
i=1

Ui

Umin = 2:0

0:5 = 1:5 > 1

384

10. Diseos de experimentos con mezclas

La regin factible no es un smplex invertido. La relacin entre las u-seudocomponentes


y las originales se dan mediante las siguientes dos expresiones:
Ui
ui = Pk

Xi

i=1 Ui

i = 1; 2; :::; k

Ui > 1

i=1

k
X

Xi = Ui

Ui

1 ui

i=1

10.9

donde

k
X

Ejercicios

Ejercicio 10.1 El smplex es conocido en trminos geomtricos como una gura


regular. Qu es una gura regular?
Polgono: Una porcin de un plano limitado por segmentos de recta (lados
del polgono). Los polgonos se pueden clasicar por los ngulos:
Equingulo: cuando todos sus ngulos son iguales.
Conexo: cuando no tiene ngulos internos entrantes.
Cncavo: cuando tiene ngulos internos entrantes.
Polgono regular (conexo): es el que a la vez es equingulo y equiltero.
Ejercicio 10.2 Lista los componentes mezclas en un smplex ltice {2,4}. Lista
las 20 mezclas de un smplex ltice {4,3}.
1. {k; m}, k componentes cada uno en m + 1 valores equiespaciados de 0 a
1
1 2
1, xi = 0; m
; m ; :::; 1 i = 1; :::; k con k+m
puntos de diseo. {2,4} 2
m
componentes cada uno en 5 valores equiespaciados, xi = 0; 14 ; 42 ; 34 ; 1 i =
1; 2; 2+44 1 = 54 = 5
1
2
3
4
5
{4,3}, xi = 0; 13 ; 23 ; 1;

4+3 1
3

6
3

1
4
2
4
3
4

3
4
2
4
1
4

= 20:

10.9. Ejercicios

385

1
2
3
4
5
6
7
8
9
10

1
3

1
3
1
3

1
3
1
3
1
3

0
1
3
1
3

1
0
0
0

0
1
0
0

1
3
1
3

2
3

0
0
1
0
0

1
3

2
3

1
3
1
3
1
3

11
12
13
14
15
16
17
18
19
20

0
0
0
0
1
0
0

1
3

0
0
0
2
3
2
3
2
3

0
0
0

1
3
1
3

2
3

0
1
3

1
3

0
0

2
3
2
3

1
3
1
3

0
2
3

2
3

0
1
3
2
3

0
0
1
3

0
1
3
1
3

Ejercicio 10.3 Gasolina A, Gasolina B y una mezcla 50% : 50% A : B.


1. Determine si la mezcla A : B es Sinrgica, Antagnica o Aditiva.

1
2
3
4
5

A
17
12
6
10
9

B
10
18
6
20
12

A:B
15
15
4
12
12

La lgica aqu es: si el promedio simple de las respuestas de cada componente


es mayor al de la mezcla se dice que la mezcla es antagonista, y si viceversa se
dice que la mezcla es sinrgica.
1.
1
2
3
4
5

A
17
12
6
10
9

B
10
18
6
20
12

(A + B)=2
13:5
15
6
15
10:5

<
=
>
>
<

A:B
15
15
4
12
12

A : B es
sinrgica
aditiva
antagnica
antagnica
sinrgica

Ejercicio 10.4 Muestre que para k = 3 el modelo cbico especial es:


=

k
X
i=1

i xi +

XkX
i<j

ij xi xj +

XXX

ijk xi xj xk

i<j<k

Ajustado a un smplex ltice {3,2} con un punto centroide en


tonces:

1 1 1
3; 3; 3

; en-

386

10. Diseos de experimentos con mezclas

123

= 27

12(

123

12

13

23 )

+ 3(

23 x2 x3

3)

k=3

1 x1

1
2
3

=
=
=

2 x2

12

13

23

123

1
= (
3

3 x3

= 12 (
= 12 (
= 12 (
1

12 x1 x2

+
1+
2+

2)

+
)
3 +
3) +

3)

13 x1 x3

1
4 12
1
4 13
1
4 23

1
+ (
9

12

123 x1 x2 x3

1
123 = 3 ( 1 + 2 + 3 )+
1
+ 9 ( 12 + 13 + 23 )+
1
27 123

13

23 )

1
27

123 :

Entonces:
123

= 27
= 27

"

123

1
(
9

123

1
(
9

12

12

13

23 )

1
(
3

23 )

1X
3

12

1
= (
2

13

i=1

2)

1
4

12

2)

1
4

13

3)

1
4

23

3)

Entonces:
12

=4

13

1
= (
2

1
(
2

12

3)

Entonces:
13

=4

23

1
= (
2

1
(
2

13

3)

Entonces:
23

=4

23

1
(
2

+
#
i

3)

10.9. Ejercicios

387

por lo que:

123

= 27

= 27

123

1
4
9
12[

123

12

12 +

13 +

13

1
(2
2

23

23 ] + 12

3
X

+2

+ 2 3)

1X
3
i=1

i=1

3
X

i=1

Respecto al ejemplo de elongacin de tela en base a tres componentes, prediga


la elongacin en x = (0:40; 0:30; 0:30)0 y establezca un intervalo de conanza para
en x:
yb = 11:7x1 + 9:4x2 + 16:4x3 + 19x1 x2 + 11:4x1 x3

9:6x2 x3

y^(0:40; 0:30; 0:30) = 15:20

1
0
3
2
X3X a2ij
X
a
i
A
+
V [^
y ] = s2 @
ri
rij
i<j

i=1

V [^
y ] = 0:1565
ai = xi (2xi
ri

1);

aij = 4xi xj

rplicas en mezcla para i, rij rplicas en mezcla binaria (i; j):

= tf;

yb(x)
< < yb(x) +
fVb [^
y (x)]g1=2 f grados de libertad de la estimacin de

Con los datos:

= 0:895
Y
yb(x0 )
r CHECK
~tf
V [VbCHECK ] + Vb [^
y]
k

Supuesta como 2 =2:


{3,2} smplex ltice

388

10. Diseos de experimentos con mezclas

b1 = 5:5 = b1
^ = 7:0 = b
2
2
^ = 8:0 = b
3

1^
4 12
1^
4 13
1^
4 23

= 8:75 =
= 2:25 =
= 4:5 =

12
13
23

1
2
1
2

(
(

+ 2)
1 + 3)
1
2 ( 2 + 3)
1

Usando (2.16) del texto: 12 corridas en (x1 ; x2 ; x3 ) tres componentes. El


modelo propuesto es:
y=

1 x1

2 x2

3 x3

12 x1 x2

13 x1 x3

23 x2 x3

+ ":

Separando grados de libertad del error en LOF + error puro. Observe la


varianza de b ij :

Ejercicio 10.5 En un experimento de tecnologa de alimentos (Gonzlez Catao,


2008) se desea estudiar formulaciones alternativas de los denominados anlogos de
queso. El inters radica en comprender cmo la substitucin de casena de leche
por suero de leche wpc / almidn afecta caractersticas de calidad del queso. La
formulacin bsica del producto consta de cuatro componentes: casena, grasa,
cierta combinacin de suero de leche con almidn y agua. Se propuso un diseo de
mezclas para estudiar los efectos principales de cada elemento de la formulacin y
sus interacciones dobles. El conjunto de datos abajo corresponde al diseo y a una
de las variables respuesta medidas en el producto nal denominada "fundido".
Realice el ajuste del modelo e interprete los resultados.
caseina
0.26
0.26
0.18
0.26
0.26
0.18
0.21
0.22
0.24
0.26
0.20
0.22
0.25
0.26
0.21
0.23
0.23
0.18
0.20
0.20
0.25
0.21
0.18
0.18
0.23
0.19
0.22
0.18
0.18
0.26
0.24
0.19
0.18
0.23
0.18

grasa
0.18
0.15
0.22
0.18
0.17
0.20
0.22
0.22
0.20
0.20
0.19
0.19
0.21
0.15
0.18
0.19
0.15
0.21
0.22
0.17
0.15
0.15
0.18
0.19
0.15
0.22
0.15
0.22
0.22
0.15
0.22
0.22
0.20
0.19
0.15

agua
0.52
0.50
0.54
0.50
0.52
0.58
0.53
0.50
0.50
0.50
0.52
0.54
0.50
0.55
0.58
0.50
0.55
0.57
0.52
0.58
0.56
0.58
0.58
0.54
0.58
0.51
0.54
0.56
0.51
0.52
0.50
0.50
0.56
0.55
0.58

Mezcla (wpc-almidon)
0.04
0.09
0.07
0.07
0.06
0.04
0.04
0.07
0.07
0.04
0.09
0.06
0.04
0.04
0.04
0.09
0.07
0.04
0.07
0.06
0.04
0.07
0.07
0.09
0.04
0.09
0.09
0.04
0.09
0.07
0.04
0.09
0.07
0.04
0.09

Fundido
8.25
8.35
3.1
8.25
7.9
6.9
3.7
3.95
5.55
7.2
3.05
4.7
6.75
8.35
4.65
5.55
6.5
5
2.8
4.25
7.65
4.15
3.05
2.5
6.35
2.05
5.05
3.975
2
8.8
4.4
2
1.75
4.25
2.8

10.9. Ejercicios

389

Ejercicio 10.6
Pastas de pescado fueron formuladas a partir de tres tipos de pescados marinos,
denotas sus proporciones por: x1 ; x2 ; x3: Para estudiar el comportamiento en la
textura (y) de las mezclas se utiliz un diseo smplex centroide como el que se
muestra a continuacin, con dos rplicas por mezcla.
x1
1
0

x2
0
1

1
2

1
2

0
0

1
2

0
1
3

1
2
1
3

x3
0
0
0
1
1
2
1
2
1
3

y
2:02
1:47
1:91
1:93
1:98
1:80
1:46

2:08
1:37
2:00
1:83
2:13
1:71
1:50

Ajuste un modelo de segundo orden con trminos en (x1 ; x2 ; x3 ; x1 x2 ; x1 x3 ;


x2 x3 ); verique su signicancia global y de cada parmetro. Compare contra el
modelo sin interacciones. Interprete y exprese recomendaciones prcticas en el
contexto de la elaboracin de pastas de pescado.
Ejercicio 10.7
Tres componentes en la mezcla para determinar si un edulcorante articial puede
ser usado en una bebida atltica deportiva. Los edulcorantes son glicina, sacarina
y un realzador. La cantidad fue jada en 4% del volumen total (250 ml). Se utiliz
un diseo smplex reticular como el que se muestra a continuacin.

Mezcla
1
2
3
4
5
6

Glicina
x1
1
0
0

Sacarina
x2
0
1
0

1
2
1
2

1
2

0
1
2

Realzador
x3
0
0
1
0
1
2
1
2

10:1
5:8
4:2
14:5
12:9
11:6

y
10:7
6:5
3:6
15:4
12:0
13:0

15:0
11:6
12:2

Con estos datos realice los ajustes de modelos pertinentes e interprete resultados.
Ejercicio 10.8 Se realiz un proceso qumico atacado con cido para la fabricacin de semiconductores. La solucin para el grabado es una mezcla de tres
tipos de cido diferente. El objetivo es evaluar el efecto que provoca esta mezcla en la razn de grabado. El diseo fue un smplex aumentado. Se hicieron

390

10. Diseos de experimentos con mezclas

repeticiones en las mezclas puras y en el centroide. Los datos que resultaron del
experimento se muestran a continuacin:

Punto
1
2
3
4
5
6
7
8
9
10

X1
cido A
1
0
0

X2
cido B
0
1
0

1
2

1
2
1
2

0
1
2
2
3
1
6
1
6
1
3

X3
cido C
0
0
1
0
1
2
1
2
1
6
1
6
2
3
1
3

0
1
6
2
3
1
6
1
3

y(A=m)
540; 560
330; 350
295; 260
610
330
425
710
640
460
800; 850

Ajuste el modelo lineal y cuadrtico. Pruebe la signicancia del modelo, la


falta de ajuste, el efecto de las variables, el anlisis de residuales y la optimizacin.
Pruebe la hiptesis:
H0 :
H1 :

= ;

12

13

Al menos una igualdad es falsa

23

=0

Apndices Tcnicos
Apndice Tcnico A
Estimadores por mnimos cuadrados para un modelo de un factor
En esta seccin derivamos la forma de obtener los estimadores de los parmetros
del modelo (2.12);

yij

+ "ij ;

"ij

(0;

) e independientes

i = 1; :::; k; j = 1; :::; ni ;
es decir, un modelo correspondiente a un diseo unifactorial con k niveles y
ni replicaciones y sin restricciones en la aleatorizacin de tratamientos. Los
estimadores se obtendrn utilizando el principio de mnimos cuadrados:
min

( i)

"2ij =

i;j

(yij

i)

i;j

Utilizando clculo diferencial, los estimadores deben cumplir con las siguientes
(k + 1) ecuaciones simultneas:
X

^i ) = 0

(10.18)

^i ) = 0; i = 1; :::k

(10.19)

(yij

i;j

ni
X
(yij

j=1

Estas ecuaciones son linealmente dependientes por lo que es necesario para


encontrar una solucin nica a tal sistema una condicin sobre los estimadores
que permita encontrar tal solucin. Generalmente la condicin que se aade es:
k
X
i=1

^i = 0

(10.20)

392

Apndices
De (10.18) se obtiene que:
^=

i;j

yij ni
P
k i ni

P ^
i
i

Utilizando la restriccin (10.20), se tiene entonces que:


P
i;j yij
=y :
^= P
a i ni
De (10.19) se tiene:

^i = yi:

^ = yi:

y :

Utilizando los estimadores obtenidos, el criterio de optimalidad equivale entonces a


X
X
e2ij =
(yij yi )2
(10.21)
i;j

i;j

donde en este caso eij s representan a los residuales correspondientes al modelo


postulado. Note que (10.21) es la suma de cuadrados del error que estima a la
varianza 2 de los trminos de error en el modelo.
Este procedimiento es aplicable a cualquiera de los modelos correspondientes
a los diseos estadsticos revisados en este libro.
Finalmente hay que notar que la restriccin adicional impuesta sobre los ^i s
no sera necesaria si en lugar del modelo (2.12) se hubiera postulado el llamado
modelo de medias por celda (cell means model ).

yij

+ "ij ; "ij

(0;

) independientes

i = 1; :::; k; j = 1; :::; ni
En tal caso los estimadores requeridos por mnimos cuadrados slo seran los
correspondientes a las i s.

Apndice Tcnico B
Valores esperados de las sumas de cuadrados en un modelo con
un factor
SCtotal = SCerror + SCtrata
(dentro)

(entre)

Apndices

393
SCerror
(dentro de cada tratamiento)
N a
N=

a
X

ni

i=1

puede suponerse como un estimador de la varianza del error experimental

estima a

2.

SCtrata
a 1
si las medias de tratamiento son iguales entre s.
SCerror
= 2
N a
"
X
m
2
=
+
E
(
a 1
E

SCtrata
E
a 1

Caso balanceado:

yij =
SCtrat = n

a
X

i0 2

+ "ij
y )2

(y i

i=1

yi =

1
n

n
X

1
n

yij =

j=1

n
X

yi

i=1

(y i

y )2 = (

y )2 = n

X
(
i

+ "i

+ "ij )

1 XX
"ij =
i+
na
j

+ "i

)2 + ("i

j=1

a
1 X
n
na
i=1

a
X

1X
"ij =
n

1 XX
1 XX
Yij =
(
na
na

i+

j=1

(y i

i + "ij ) =

)2 + n

"

" )2 + 2(

X
i

("i

+" :

" )2 + 2

)("i
X
i

" )

)("i

" )

394

Apndices

E [SCtrat ] =

nE

"

a
X

)2 + nE

i=1

"
X

" )2 + 2n

("i

a
X

)E

i=1

"
X

("i

" )

donde:

nE

"
X

" )2

("i

"

= nE
= n

"2i + a"

2"

(
X

E["2i ]

aE["2 ]

= a

(a

"
X
SCtrat
n
E
=
E
(
(a 1)
a 1
1

= ::: =

"i

SCtrat
=
(a 1)

SCerror
yij =

yi

yij

yi

(yij

=
2

yi )

+ "ij

= ("ij

"i )

= ("ij

"i ) 2

+ "ij

"i =

=n a

1)

Bajo H0 :

+ ("ij

"i )

na

Apndices

395

XX
i

(yij

XX

y i )2 =

XX

hP P
i

j (yij

y i )2 = na

+n

"2ij + n
n

X
2

SCerror
=
na 1
E

XX
i

"2i

"i

"2i

2n

"ij "i

"ij

"2i

"2i

Por lo tanto:

"2ij

n n = na

"2i

Bajo H0 .

"2ij

XX

2"ij "i )

XX

XX

"2ij +

XX

("2ij + "2i

XX

"i ) 2

("ij

SCtrat
a 1

2 (na

1)

SCerror
na 1

i =1

Apndice Tcnico C
Valores esperados de suma de cuadrados en un modelo bifactorial
El valor esperado de una variable aleatoria es el promedio de su valor. En el
anlisis de la varianza son importantes los valores esperados para el cuadrado
medio del error y el cuadrado medio de los factores. Considere el siguiente modelo:
yijk =
i = 1; :::; a

Ai

Bj

j = 1; :::; b

ABij

+ "k(ij)

k = 1; :::; n

donde A y B son los factores con a y b niveles respectivamente. En este apndice


se presentan el valor de los cuadrados medios correspondientes a algunos modelos
estudiados en el texto. Se han considerado factores con niveles jos o aleatorios.

396

Apndices
P
A jo,
A =0
B aleatorio
SCA = nb

a
X

(y i:: y:::)2

i=1

y i::= +

Ai

1X
b

Bj

y ::: =

1X
a

Ai

1X
b

(y i::

y ::: )2 = nb

= nb

donde:

2
Ai

Ai

ABij

1 XXX
"l(ij)
abn

1 XX
ab

ABij

bn

ABij

1 XX
"l(ij)
bn
j

1 XX
"l(ij)
bn
j

2
A

X X "l(ij)

XX
j

1 XXX
"l(ij) )2
abn
i

12
X
X
X
1
"l(ij) A
abn
i

1 XXX
"l(ij)
abn
i

0
12
!2
XX 1
X
X
X
1 @
"l(ij) +
"l(ij) A
2
bn
(abn)
i
i
j
l
l
0
10
1
XX 1
X
X
X
A@ 1
"
"l(ij) A
2@
bn l(ij)
abn
j

"l(ij)

1 XX
+@
"l(ij)
bn

ABij

1 XX
ab
i

8
X<

Ai

nb

Bj

1X
1X
Ai +
a
b
j
1 XXX
"l(ij)
abn

(y i:: y ::: ) =

1X
b

Ai A

9
=
;

Apndices

397

XX

XXX

1 @
1 2
2 "l(ij) + cruzados +
(bn)
(abn)2
j
i
l
1
0
X
X
2 @
"2l(ij) + cruzados y simplesA
ab2 c2
i

"2l(ij) + cruzadosA

E [SCA ] = nb

(
X

2
Ai

= nb

2
Ai

(
X

= nb

2
Ai

= nb

E(

a 2
+ "
abn
a
a
+ nb
nb abn

Ai E( A )

abn
2
" +
(abn)2

a
+
bn

2bn
ab2 n2

2
"

2a
abn

2
"

2
"

2
Ai

+ nb

a2 a
abn

2
Ai

+ (a

1)

2
Ai

= nb

X
i

bn
+
(bn)2

2
Ai

2
A)

(
X

= nb

2
"

2
"

= nb

X
i

abn(a 1)
abn

2
"

Finalmente,
E(

SCA
) = E(CMA ) =
gl

2
"

nb X
a 1

2
Ai :

As si el modelo es:
yijk =
i = 1; 2; :::; a

Ai

Bj

ABij

j = 1; 2; :::; b

+ "k(ij)
l = 1; 2; :::; n

2
"

398

Apndices

es jo
"l(ij)

NID(0;

NID: normal e idnticamente distribuidos. Notacin


Suposiciones
Fijos(1) P
Aleatorios(2)
Ai = 0
Ai 0 s NID 0;
Ai 0 s jos,
P
Bj = 0
Bj 0 s jos,
Bj 0 s NID 0;
P
ABij jos,
ABij = 0
ABij NID 0;

2
2
2

nb
a 1

Mixtos(3) P
Ai 0 s jos

Bj 0 s

Pero
P
Pi

AB

2
i Ai :

Ai

=0
2

v NID 0; AB
ABij
ABij

=0
6= 0

Cuadrados medios esperados e hiptesis

Ai

Grados libertad
a 1

Bj

ABij

Fijos
2 + nb
"
2
"

(a

1)(b

2
"

1)

A
B

2
"

AB

2
"

+ na
+n

Aleatorios
2 + n 2 + nb
"
AB
+n

2
AB

+n

2
AB

+ na

2
A
2
B

Mixtos
2+n
"
+n

2
AB
2
AB

+nb 2A
2+n
"

2
AB

2
"

+nb
"l(ij)

ab(n

1)

H(1) :

Ai

2
"

= 08i

H(1) :

Bj

= 08j

H(1) :

ABij

= 08ij

2
"

2
"

Hiptesis que se prueban


H(2) : 2A = 0 H(3) : Ai
H(2) :
H(2) :

2 =0
B
2
AB = 0

H(3) :
H(3) :

2
A

= 08i

2 =0
B
2
AB = 0

Dependiendo de tales valores esperados el experimento inicialmente pensado


podr ser cambiado, por ejemplo, la prueba indicada por EMSs puede tener
grados de libertad insucientes o no, habr pruebas conservadoras en donde el
efecto no ser claramente contrastable.
Reglas para calcular esperanzas de cuadrados medios
yijk =
donde

es jo y

aleatorio.

Ai

Bj

ABij

+ "k(ij)

Apndices

399

1. Escriba los trminos del modelo con subndices asociados hacia abajo en el
lado izquierdo de una tabla, es decir, cada trmino del modelo como cabeza
de la en la tabla.
Ai
Bj
ABij

"k(ij)
2. Escriba los subndices individuales en el modelo como cabezas de columnas
de la tabla; sobre cada subndice escriba F si los niveles del factor son
jos, R si son aleatorios. Arriba de tal denominacin, escriba el nmero de
niveles de cada subndice:
a
F
i

b
R
j

n
R
l

Ai
Bj
ABij

"l(ij)

3. Escriba 1 en cada casilla donde el subndice en la cabeza de la columna est


contenido dentro de parntesis en el trmino en la izquierda.

a
F
i

b
R
j

n
R
l

Ai
Bj
ABij

"l(ij)

4. Escriba 0 en cada casilla donde el subndice en la cabeza de columna sea


jo y est tambin contenido en el trmino a la izquierda. Escriba 1 en
cada casilla donde el subndice en la cabeza de columna sea aleatorio y est
tambin contenido en el trmino a la izquierda.

400

Apndices

Ai

a
F
i
0

Bj
ABij

"l(ij)

0
1

b
R
j

n
R
l

1
1
1

5. Rellene las casillas restantes con el nmero de niveles en la cabeza de


columna correspondiente.

Ai
Bj
ABij

"l(ij)

a
F
i
0
a
0
1

b
R
j
b
1
1
1

n
R
l
n
n
n
1

6. Para encontrar el valor esperado el cuadrado medio de cada trmino que


tenga grados de libertad mayores a cero en el modelo:

Slo considere trminos cuyossubndices incluyan todos los subndices


en el trmino cuyo valor esperado se est calculando. Calcule el coeciente de este trmino cubriendo las columnas que contengan subndices no en parntesis en el trmino considerado (para Ai cubra
columna i, para "l(ij) cubra columna l).
Multiplique los valores restantes en cada la. Cada uno de estos productos es el coeciente para el trmino correspondiente en el modelo, si
el subndice sobre el trmino es tambin un subndice sobre el trmino
del cual el valor esperado del cuadrado medio est siendo calculado, la
suma de estos coecientes multiplicados por la varianza de sus trminos correspondientes ( si es jo (todos los subndices jos) o si es
aleatorio (al menos algn subndice es aleatorio) es el valor esperado

10.10. Apndice Tcnico D

401

del cuadrado medio del trmino bajo consideracin.

Ai

a
F
i
0

b
R
j
b

n
R
l
n

bn

Bj

an

ABij

"l(ij)

10.10

A
2
B

2
AB

2
AB

2
"

2
"
2
"

2
"

Apndice Tcnico D

Contrastes
En la estimacin del efecto de los factores y anlisis de los diseos experimentales, los contrastes desempean un papel importante. Por ello es importante
presentar el desarrollo matemtico para obtener las frmulas que justican el
anlisis estadstico. Un contraste permite contrastar los promedios de diferentes
poblaciones y se establece mediante:
= c1

+ c2

+ ::: + ck

tal que

k
X

ci = 0

(10.22)

i=1

A partir de los datos que se obtienen al realizar el experimento, se estima el


contraste por la siguiente expresin:
b = c1 y + c2 y + ::: + ck y
1
2
k

tal que

k
X

ci = 0

(10.23)

i=1

La varianza del contraste se calcula por:


V ar(b) = V ar(c1 y 1 + c2 y 2 + ::: + ck y k ) =

k
X

c2i V

ar(y i ) =

i=1

k
X
c2
i

i=1

ni

(10.24)

Con el propsito de construir el estadstico de prueba es necesario estimar la


suma de cuadrados del contraste, sta se dene mediante:
SCcontraste =

b2

V ar(b)
2

b2

=P
k

c2i
i=1 ni

(10.25)

402

Apndices

Nota 1. Para un diseo 2k se puede considerar como un caso particular


el
P
clculo en la diferencia de promedios, poniendo c1 = 1 y c2 = 1, as 2i=1 ci = 0;
entonces el contraste es: b = c1 y 1 + c2 y 2 = y 2 y 1 : Observe que b representa el
efecto del k-simo factor o de una interaccin.
Se aplica la frmula (10.25) para generalizar el contraste para el efecto de un
factor o de la interaccin:
SCef ecto =

12
n1

b2

( 1)2
n2

en el caso tratado n1 = n2 = n = 2k
tos por rplicas, es decir N = t r:

N
2;

nb
2

2
N b
4

(10.26)

donde N es el nmero de tratamien-

Nota 2. Suponga un diseo 23 con tres rplicas, tambin se puede obtener


el efecto de un factor o su interaccin multiplicando la columna del promedio de
respuestas por la columna que representa al factor o su interaccin.
ef ectoef ecto =

1
23 1

(d1 y 1 + d2 y 2 + ::: + d8 y 8 ) =

y la suma de cuadrados del factor es:


b2

3 2
= b
8

SCef ecto = P
8

c2i
i=1 3

1 b

23 1

(10.27)

(10.28)

El resultado anterior es equivalente al indicado en la expresin (10.26). Note


b
que bf actor = k 1 . En general para un factorial 2k con r rplicas (10.28) se
2
expresa por:
b2

SCef ecto = P
t

c2i
i=1 r

r b2
2k

(10.29)

Estimacin por intervalo de conanza. El intervalo de conanza para estimar


el efecto o interaccin de un factor se establece por:
b

t( ; glerror )ESi (b)


2

(10.30)

entonces es necesario estimar el error estndar ESi (b): Para obtener ste ltimo,
considere un diseo factorial 2k , el efecto de los factores o interacciones se expresa:
bf actor =

2k

10.10. Apndice Tcnico D

403

La varianza de esta ecuacin es:


V ar(bf actor ) = V ar(

2k 1

)=

V ar(b)
(2k 1 )2

La varianza de b se estim en la expresin (10.24). Sustituyendo sta en la


ecuacin anterior se obtiene:
Pk 2
2 Pk
2
2
2 2k
2
c
i
i=1
r
i=1 ci
V ar(bf actor ) =
=
=
=
(10.31)
k
1
2
k
1
2
2k
2
k
(2 )
r(2 )
r(2
)
r(2 2 )
donde r es el nmero de rplicas, as el error estndar ESi (b) es:
s
s
2
CMerror
=
ESi (b) =
r(2k 2 )
r(2k 2 )

(10.32)

404

Apndices

Referencias
Abramowitz, M. y Stegun, I.A. (Eds.). Handbook of Mathematical Functions.
7th Ed., Dover, New York, 1970.
Aguilera, J.M. y Kosikowski, F. Soyben Extruded Product: A Response Analysis. Journal of Food Science, 1976 Vol. 41, p.p. 647-651.
Ames, A. E., Mattucci, M., Stephen, M., Szonyi, G. y Hawkins, D. M.
(1997). Quality Loss Functions for Optimization Across Multiple Response Surfaces. Journal of Quality Technology 29, p.p. 339-346.
Atkinson, A.C. y Riani, M. Robust Diagnostic Regression Analysis. Springer
Verlag. 2000.
Barba, A. P. Procedimiento Enzimtico para Producir Harinas de Amaranto
de alto Contenido Protena y Jarabes con Potencial Edulcorante. Tesis de Maestra.
CINVESTAV, IPN. Irapuato, Gto., 1989.
Barker, T. B. Quality by Experimental Design. Marcel Dekker. New York,
1989.
Bates, D.M. y Watts, D.G. Nonlinear Regression Analysis and its Applications, Wiley, New York, 1988.
Beetner, G., Tasao, T. Frey, A. y Harper. Degradation of Thiamine and
Riboavin During Extrusion Processing. Journal of Food Science, 1974, 39, 207208.
Box, G. (1996). Split Plot Experiments. Quality Engineering, 8(3), 515-520.
Box, G.E.P. and Behnken, D.W. Some New Three Level Desings for the Study
of Quantitative Variables. Technometrics, 1960, 2, 455-475. Correcciones, 1961,
3, 576.
Box, G.E.P. y Cox, D.R. An Analysis of Transformations (with discussion)
J. Rotal Stat. Soc., B, 1964, 26, 211-246.
Box, G.E.P. y Draper, N.R. Empirical Model Building and Response Surface,
John Wiley & Sons, New York, 1987.
Box, G.E.P., y Hunter, W.G. y Hunter, J.S. Statistics for Experiments, John
Wiley & Sons, New York 1978.
Box, G.E.P. y Meyer, R.D. Dispersion E ects From Fractional Design. Technometrics, 1986 28(1), 19-27.

406

Referencias

Box, G.E.P. y Wilson, K.B. On the Experimental Attaimment of Optimum


Conditions. Journal of the Royal Statistical Society, Ser. B, 1951, 13, 1-45.
Burdick, R.K., Borror, C.M., y Montgomery, D.C. A review of methods for
measurement systems capability analysis. Journal of Quality Technology, 35, 342354.
Conover, W.J., Johnson, M.E. y Johnson, M.M. A Comparative Study of Tets
for Homogeneity of Variances, with Applications to the Outer Continental Shelf
Bidding Data. Technometrics, 1981, 23, 351-361.
Carmer, S.G., y Walter, W.M. Pairwise Multiple Comparisons of Treatment
Means in Agronomic Research. Journal of Agronomic Education, 1985 14, 19-26.
Chan, L.K. and Mak, T.K.(1995). A Regression Approach for Discovering
Small Variation around a Target. Appl. Statist. 44, No. 3, pp. 369-377.
Chew, V. Testing Di erences among Means: Correct Interpretation and Some
Alternatives. Hort Science, 1980, 15(4), 467-470.
Derringer, G.C. y Suich, R. Simultaneous optimization of several response
variables. Journal of Quality Technology, 1980, 12, 214-219.
Derringer, G.C. A Balancing Act: Optimizing a Products Properties. Quality
Progress, 1994, 51-58.
Draper, N.R. y Smith H. Applied Regression Analysis. 3rd.ed., John Wiley &
Sons, New York, 1998
Fabian, V. On the problem of interactions in the analysis of variance. Journal
of the American Statistical Association, 199, 86, No. 414, 362-367.
Gonzlez Catao, F. Determinacin de la estabilidad de mezclas de almidn
de maz y concentrado de protena de suero modicadas por extrusin a travs
del clculo de las isotermas de sorcin, y desarrollo de un anlogo de queso tipo
asadero utilizando una de estas mezclas. Tesis de licenciatura en Qumico en
Alimentos. Facultad de Qumica, Universidad Autnoma de Quertaro. 2008.
Gorman J.W. y Hinman J.E. Simplex - lattice designs fro multicomponent
systems. Tecnometrics, 4, 463-487,1962.
Guzmn, M.H., Paredes-L.O. and Domnguez-D.J. Optimization of an Enzymatic Procedure for the Hydrolytic Depolimerization of Starch by Response Surface Methodology. Food Science and Technology, 1993, 26, 28-33
Haaland, P.D. Experimental Design in Biotechnology. Marcel Dekker, New
York, 1989.
Harrington, E. C. JR. (1965). The Desirability Function. Industrial Quality
Control, 21, 494-498.
Hicks, C. R. Fundamental Concepts in the Design of Experiments. 2th, ed.
Holt Rinehart and Winston, New York, 1986.
Hill, W. y Hunter, W. A Review of Response Surface Methodology. Technometrics, 1966, 18(4).

Referencias

407

Hinkelman, K. y Kempthorne, O. Design and analysis of experiments. Vol 1.


Wiley-Interscience Publication, New York, 1994.
Hsu, J.C. Multiple Comparison: Theory and Methods. Chapman & Hall,
London, 1996.
Ilo, S., Berghofer, E. y Liu, Y. Extrusion Cooking of Rice Flour and Amaranth
Blends. Lebensm. Wiss.u. Technol., 1999 32, p.p. 79-88. Academic Press.
Jones, D. Use, misuse, and role of Multiple-Comparison Procedures in Ecological and Agricultural Entomology. Environmental Entomology, 1984, 13, 635649.
Jurez, G.M. Conservacin y Aprovechamiento Agroindustrial de la Jcama.
Reporte Interno. CINVESTAV, IPN. Irapuato, Gto, 1991.
Kennedy, Jr. W.J. y Gentle, J.E. Statiscal Computing. Marcel Dekker, Inc.
New York, 1980.
Khuri, A. y Colon, M. Simultaneus Optimization of Multiple Responses Represented by Polynomial Regression Functions. Technometrics 1981, 23, 363-375.
Khuri, A. Y. y Cornell, J.A Response Surface Design and Analysis Marcel
Dekker, Inc. New York, 1987.
Lenth, R.V. Quivk and easy analysis of unreplicated factorials. Technometrics, 1989, 31, 469-473.
Len - Gonzlez, F., Castao - Tostado E. y Mercado - Silva E. Modelaje
estadstico de ajo bajo diferentes condiciones de almacenamiento. Reporte interno
2002, Universidad Autnoma de Quertaro, Posgrado de Alimentos.
Li H. y Mee R.W. Better foldver fractions for resolution III 2k p designs.
Technometrics, 2002, 44(3), 278-283.
Logothetis N. y Wayn H.P. Quality Through Design. Oxford Science Publications, Great Britain, 1989.
Loske A.M., Alvarez, U. M., Hernndez - Galicia C., Castao - Tostado E.
y Prieto, F.E. Bactericidal e ect of underwater shock waves on Escherichia Coli
ATCC 10536 suspensions. Innovative Food Sci. and Emerging Technol. , 2002,
3(4), 321-327, Elsevier. ISSN 1466-8564
Lunani, M, Nair, V.N. y Wasserman, G.S. Graphical Methods for Robust Design with Dynamic Characteristics. Journal of Quality Technology, 1997, 29,
327-338.
McLean, R.A. y Anderson, V.L. Applied Factorial and Fractional Designs.
Marcel Dekker, New York, 1984.
Mndez Albores J.A., Armbula Villa G., Loarca Pia G., Castao Tostado E.
y Moreno Martnez E. Aatoxins fate during the nixtanalization of contaminated
corn by two tortilla - making processes. Journal of Stored Products Research
40(1): 87-94. 2003.
Mndez Ramrez, I. Comparacin de medias de poblacin. Comunicaciones

408

Referencias

Tcnicas vol. 3 Serie Azul no. 17. Instituto de Investigaciones en Matemticas


Aplicadas y en Sistemas, UNAM, 1976.
Milliken, G. A. Analysis of Repeated - Measures Designs. In Statistical Methodology in the Pharmaceutical Sciences. Ed. D.A. Berry, Statistics: textbooks and
Monographs, vol. 104. Marcel Dekker, Inc., New York, 1990.
Miller A. Analysis of Parameter Design Experiments for Signal-Response Systems. Journal of Quality Technology, 2002, 139-151.
Montgomery, D. Desing and Analysis of Experiments. 2nd. ed., John Wiley
& Sons,. New York, 1984.
Montgomery, D. y Peck, E.A. Introduction to linear Regression Analysis. John
Wiley & Sons, New York, 1982.
Mora E. R., Paredes L.O. and Domnguez D.J. Optimization of a Germanation Procedure by Response Surface Methodology. H. Agrie. Food Chem. 1991
39, 851-854
Motycka R., Richards D., and Bechtel P. Response Surface Methodology. Approach to the Optimization of Boneless Ham Yield. Journal of Food Science,
1984 49, 1386-1389.
Myres, R. H. Response Surface Methodology. Allyn and Bacon, Inc. Boston,
1971.
Myres, R. H. Rotatable Design in Product Development. Food Tech. 1979 33,
p.p. 74.
Myres, R. H. y Montgomery, D. Response Surface Methodology. John Wiley
& Sons, New York, 1995.
Mullen, K. y Ennis, D.M. Rotable Designs in Product Development. Food
Technol., 1979 33(7), 74-75.
Nelson, W. Applied Life Data Analysis. John Wiley, New York, 1982.
Neter, J., Kutner, M.H., Nachtsheim, Ch. J. and Wasserman, W. Applied
Linear Statistical Models. 4th Ed., Irwin, Chicago, 1996.
Peace, G. S. Taguchi Methods: A Hands-on Approach. Addison-Wesley Publishing Company, New York, 1993.
Petres, J. y Czukor, B. Investigation of E ects of Extrusions on Antinutritional Factors in Soybeans Employin Response Surface Analysis. die Nahrung,
1989 33, 275-281. Hungary.
Phadke, M.S. Quality Engineering Using Robust Design. Prentice Hall. New
Jersey, 1993.
Preece, D.A. Latin Squares, Latin cubes, Latin Rectangles, etc. In Encyclopedia of Statistical Sciences, 4, 504-510. Kotz, S. and Johnson, N.L. (Eds.). John
Wiley & Sons. New York, 1993.
Price W.L. A controlled random search procedure for global optimization.
Computer Journal, 1977 20, 367-370.

Referencias

409

Salcedo, Ch. B. Osuna, C. J. Guevara, L. F. Domnguez D. J. y Paredes,


L. O. Optimization of Isoelectric Precipitation Method to Obtain Protein Isolates
from Amaranth Seeds. J.Agric. Food Chem., 2002, 50, 6515-6520.
Saville, D.J. Multiple Comparison Procedures: The Practical Solution. The
American Statistician, 1990, 44, 174-180.
Schmidt, R.H., Illingworth, B.L., Deng J.D. and Cornell J.A. Multiple Regression and Response Surface Analysis of the Eects of Calcium Chloride and
Cysteine on Heat-Induced Whey Protein Gelation, J. Agric. Food Chem., 1979,
27, 529-532.
Seber G.A.F. Linear Regression Analysis. John Wiley & Sons. New York,
1978.
Shelton, J.T., Khuri A.I. y Cornell J.A. Selecting check points for testing lack
of t in response surface models. Technometrics, 1983 25, 357-365.
Shih, M.C., Hou, H.J. and Chang, K.C. Process Optimization for Soft Tofu.
Journal Food Science, 1997 62(4), 333-337.
Sprott, D.A. Statistical Inference in Science. Springer Verlag. New York,
2000.
Taguchi, G. Introduction to Quality Enginnering. Asian Productivity Organization, 1986.
Taguchi, G. System of Experimental Design. Vols. 1 and 2 Traduccin publicada por UNIPUB, 1987.
Trejo, C.E. Elaboracin por Extrusin de Proteina Vegetal Texturizada a partir de Harina Desengrasada de Cacahuate. Tsis UNAM, 1984.
Vargas, J.M., Hernndez, D., Paredes, O., Domnguez, J. y Carabez, A. Efecto
del Tratamiento Trmico - alcalino sobre Almidn de Amaranto. Un Anlisis de
Supercie de Respuesta. Reporte Congreso de ATAM, S.L.P., Mxico, 1988.
Verbeke G. y Molenberghs G. Linear Mixed Models for Longitudinal Data.
Springer Verlag, 2000.
Wu, C.F. J. y Hamada, M. Experiments: Planning, Analysis, and Parameter
Design Optimization. John Wiley & Sons, 2000.
Yandell, B.S. Practical Data Analysis for Designed Experiments. Chapman
& Hall, London, 1997.

410

Referencias

Tablas
1. Tabla A Distribucin normal estndar; 1

(z) = P (Z

2. Tabla B Distribucin t-Student; para P (t


3. Tabla C Distribucin

para P (

t(gl; 1

2 (gl; 1

z) =

)) =

)) =

4. Tabla D Distribucin F para P (F


0:05

F ( 1;

2; 1

)) = , slo para

5. Tabla E Distribucin H para P (H

H( 1 ;

2; 1

)) =

6. Tabla F Rangos estudentizados q para P (q


7. Tabla G Prueba de Dunnett d para P (d

q(k; f; 1
d(k; f; 1

)) =
)) =

Nota. Las tablas se generaron aplicando el lenguaje de programacin Gauss


(1997)(1) para windows nt/95 versin 3.2.35, y el paquete estadstico Statgraphics(2)
plus (1995) versin 2 en windows. A continuacin se citan las referencias donde
el lector interesado puede consultar las frmulas o algoritmos para obtener los valores correspondientes a las distribuciones: Kennedy y Gentle (1980). Las tablas
se presentan en forma sinttica, como hemos indicado con anterioridad, los paquetes estadsticos proporcionan el nivel de signicancia descriptivo o valor p y a
partir de ese se pueden sacar las conclusiones estadsticas. Tambin, a partir de
los paquetes se puede estimar la probabilidad de referencia.
(1) Gauss. Mathematical and Statistical System, Volume II. Command Reference. Aptech Systems, Inc. Maple Valley Wa.
(2) Statgraphics Plus. Version 2. Manugistics.

412

Tablas

z
0.0
0.5
1.0
1.5
2.0
2.5
3.0

.00
.500
.309
.159
.067
.029
.006
.001

.01
.496
.301
.156
.066
.022
.006
.001

.05
.480
.291
.147
.061
.020
.005
.001

.09
.464
.278
.138
.056
.018
.005
.001

Tabla A Distribucin normal estndar; 1

(z) = P (Z

z) =

ngl
0.05
0.025
0.01

1
6.31
12.71
31.82

2
2.90
4.30
6.97

3
2.35
3.18
4.54

4
2.13
2.78
3.75

5
2.02
2.57
3.37

6
1.94
2.45
3.14

7
1.90
2.37
3.00

8
1.86
2.31
2.90

9
1.83
2.26
2.82

10
1.81
2.23
2.76

11
1.80
2.20
2.72

ngl
0.05
0.025
0.01

12
1.78
2.18
2.68

13
1.77
2.16
2.65

14
1.76
2.15
2.62

15
1.75
2.13
2.60

16
1.75
2.12
2.58

17
1.74
2.11
2.57

18
1.73
2.01
2.55

19
1.73
2.09
2.54

20
1.73
2.09
2.53

21
1.72
2.08
2.52

22
1.72
2.07
2.51

ngl
0.05
0.025
0.01

23
1.71
2.07
2.50

24
1.71
2.06
2.49

25
1.71
2.06
2.49

26
1.71
2.06
2.48

27
1.70
2.05
2.47

28
1.70
2.05
2.47

29
1.70
2.05
2.46

30
1.70
2.04
2.46

40
1.68
2.02
2.42

60
1.67
2.00
2.39

120
1.66
1.98
2.36

Tabla B t-Student; para P (t

t(gl; 1

)) = . redondeada a dos decimales

Tablas

413

ngl
0.05
0.025
0.01

1
3.84
5.02
6.63

2
5.99
7.38
9.21

3
7.81
9.35
11.3

4
9.49
11.1
13.3

5
11.1
12.8
15.1

6
12.6
14.4
16.8

7
14.1
16.0
18.5

8
15.5
17.5
20.1

9
16.9
19.0
21.7

10
18.3
20.5
23.2

ngl
0.05
0.025
0.01

11
19.7
21.9
24.7

12
21.0
23.3
26.2

13
22.4
24.7
27.7

14
23.7
26.1
29.1

15
25.0
27.5
30.6

16
26.3
28.8
32.0

17
27.6
30.2
33.4

18
28.9
31.5
34.8

19
30.1
32.9
36.2

20
31.4
34.2
37.6

ngl
0.05
0.025
0.01

21
32.7
35.5
38.9

22
33.9
36.8
40.3

23
35.2
38.1
41.6

24
36.4
39.4
43.0

25
37.7
40.6
44.0

26
38.9
41.9
45.6

27
40.1
43.2
47.0

28
41.3
44.5
48.3

29
42.6
45.7
49.6

30
43.8
47.0
50.9

para P (

Tabla C Distribucin

gl2 ngl1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

1
161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45

2
199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59

3
215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20

4
224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96

2 (gl; 1

5
230.2
19.30
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81

)) =

6
234.0
19.33
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70

Tabla D Distribucin F para P (F F ( 1 ; 2 ; 1


)) = 0:05
gl1 : grados de libertad numerador, gl2 para el denominador

414

Tablas

gl2 ngl1
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

1
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84

2
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00

3
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.76
2.68
2.60

4
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37

5
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21

6
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.34
2.25
2.17
2.10

Tabla D (Contina). Distribucin F para P (F F ( 1 ; 2 ; 1


)) = 0:05
gl1 : grados de libertad numerador, gl2 para el denominador
glnk
2
3
4
5
6
7
8
9
10
12
15
20
30
60

2
39.0
15.4
9.60
7.15
5.82
4.99
4.43
4.03
3.72
3.28
2.86
2.46
2.07
1.67
1.00

3
87.5
27.8
15.5
10.8
8.38
6.94
6.00
5.34
4.85
4.16
3.54
2.95
2.40
1.85
1.00

4
142
39.2
20.6
13.7
10.4
8.44
7.18
6.31
5.67
4.79
4.01
3.29
2.61
1.96
1.00

5
202
50.7
25.2
16.3
12.1
9.70
8.12
7.11
6.34
5.30
4.37
3.54
2.78
2.04
1.00

6
266
62.0
29.5
18.7
13.7
10.8
9.03
7.80
6.92
5.72
4.68
3.76
2.91
2.11
1.00

Tabla E Distribucin H para P (H H(k; ; 1


)) = 0:05
k : tratamientos, gl grados de libertad. Prueba de Harley.

Tablas

415

glnk
1
2
3
4
5
6
7
8
9
10
12
15
20
24
30
60

2
18.1
6.09
4.50
3.93
3.64
3.46
3.34
3.26
3.20
3.15
3.08
3.01
2.95
2.92
2.89
2.83
2.77

3
26.7
8.28
5.88
5.00
4.60
4.34
4.16
4.04
3.95
3.88
3.77
3.67
3.58
3.53
3.48
3.40
3.32

4
32.8
9.80
6.83
5.76
5.22
4.90
4.68
4.53
4.42
4.33
4.20
4.08
3.96
3.90
3.84
3.74
3.63

5
37.2
10.9
7.51
6.31
5.67
5.31
5.06
4.89
4.76
4.66
4.51
4.37
4.24
4.17
4.11
3.98
3.86

6
40.5
11.7
8.04
6.73
6.03
5.63
5.35
5.17
5.02
4.91
4.75
4.59
4.45
4.37
4.30
4.16
4.03

7
43.1
12.4
8.47
7.06
6.33
5.89
5.59
5.40
5.24
5.12
4.95
4.78
4.62
4.54
4.46
4.31
4.17

Tabla F Rango Studentizado; P (q q(k; ; 1


)) = 0:05
k : tratamientos, gl. grados de libertad
glnk
5
6
7
8
9
10
12
15
20
24
30
60

P (d

2
3.03
2.86
2.75
2.67
2.61
2.57
2.50
2.44
2.38
2.35
2.32
2.27
2.21

3
3.29
3.10
2.97
2.88
2.81
2.76
2.68
2.61
2.54
2.51
2.47
2.41
2.35

4
3.48
3.26
3.12
3.02
2.95
2.89
2.81
2.73
2.65
2.61
2.58
2.51
2.44

5
3.62
3.39
3.24
3.13
3.05
2.99
2.90
2.82
2.73
2.70
2.66
2.58
2.51

6
3.73
3.49
3.33
3.22
3.14
3.07
2.98
2.89
2.80
2.76
2.72
2.64
2.57

7
3.82
3.57
3.41
3.29
3.20
3.14
3.04
2.95
2.86
2.81
2.77
2.69
2.61

Tabla G Valores para la prueba bilateral de Dunnett


d(k; ; 1
)) = 0:05 k: tratamientos, gl: grados de libertad

ndice
aumentado, 165
balanceado, 30
Box - Behnken, 290
central compuesto, 295
desbalanceado, 30
rotable, 298
sin rplicas, 118
pseudo error, 122

aberrancia
criterio de, 159
mnima, 158
aleatorizacin, 4
anlisis de varianza, 29
arreglo
externo, 177
interno, 177
uno solo, 181

efecto, 4, 29
anidado, 247
bloque
confundido, 149
ortogonal, 293
cuadrtico, 213
bloqueo, 5
de dispersin, 180
de localizacin, 180
caracterstico
estandarizado, 126
valor, 328
estimado, 29
vector, 328
interaccin, 4
cociente seal a ruido, 173
control - ruido, 174
codicacin, 267
lineal,
213
coeciente
principal, 4
determinacin, 283
error
comparaciones
de restriccin, 254
planeadas, 77
experimental, 8
contraste, 88
parcelas divididas, 233
ortogonal, 90
por familia de comparaciones, 78
cuadrado medio
puro, 285
de tratamientos, 30
estructura,
3
del error, 30
alias, 150
curvas de nivel, 320
de tratamientos
descomposicin de suma de cuadrados,
factorial, 101
36
desdoblada, 164
alternativa, 166
diseo, 23
416

NDICE
diseo, 4
tratamientos, 3
factor, 3
control de, 13
de ajuste, 173
de ruido, 13
compuesto, 185
seal, 182
falta de ajuste, 285
forma cannica, 327
fraccin, 147
generador, 147
principal, 156
grco
de probabilidad
Normal, 120
semi Normal, 120
lineal de efectos, 176

417
de jerarqua, 146
de mnimos cuadrados, 132
de parcelas divididas, 232
de parsimonia, 120
protocolo, 12
prueba
de Bartlett, 43
de Box - Meyer, 181
de Dunnett, 82
de Hartley, 43
de Hsu, 84
de Kruskal Wallis, 66
de Lenth, 122
de Levene, 44
de Sche, 88
de Tukey, 80
punto
axial, 296
estacionario, 325

rplica, 9
al centro, 296
rplicas
determinacin del nmero, 46
submuestra, 11
residual, 38
resolucin
mxima, 158
metodologa de supercie de respuesta, restricciones
311
a la aleatorizacin, 48
inexactitud, 18
inferencia
estadstica, 17
prctica, 17
intervalo de conanza
en parcelas divididas, 239
Intervalos de Conanza, 78

nivel, 3
objetivo, 12
orden estndar, 111
palabra
de denicin, 158
patrn de, 158
polinomios
ortogonales, 213
principio

subgrupo de contrastes, 158


suma de cuadradados
de falta de ajuste, 285
suma de cuadrados
del modelo, 282
Taguchi, 172
tratamiento, 3
trayectoria
optimizante, 314

418
unidad experimental, 4
valor p, 27
variable
fundamental, 331
respuesta, 12
variacin intraindividual, 244

NDICE

Este libro termin de imprimir en el mes de diciembre de 2010 en los talleres grficos de la
Universidad Autnoma de Quertaro
(Prolongacin Pino Surez 467-E, Col. Ejido Modelo, Quertaro, Qro.)
Se tiraron 1000 ejemplares, ms sobrantes para su reposicin.