Professional Documents
Culture Documents
Diseo factorial
Diseo de experimentos
Docente: Marlon Angulo
tratamientos diferentes a cada bloque. Con frecuencia se puede obtener un diseo balanceado
con menos de bloques.
1.1 Anlisis estadstico del diseo de bloques incompletos balanceados
diseo es simtrico.
(1)
.
1
El parmetro debe ser un entero. Para deducir la relacin para , se considera cualquier
tratamiento. Si el tratamiento i aparece en r bloques y hay otros k-1 tratamientos en cada uno
de esos bloques, entonces existen r(k-1) observaciones en los bloques que contiene al
tratamiento i. Estas r(k-1) observaciones tambin representan a los a-1 tratamientos restantes
veces, es decir, (a-1)=r(k-1).
El modelo estadstico del BIDB es: =++ + donde es la observacin i-sima en el
bloque j-simo, es la media global, es el efecto del tratamiento i-simo, es el efecto del
bloque j-simo y es el componente NID(0, 2 ) del error aleatorio. La variabilidad total en
2
los datos se expresa por la suma de cuadrados totales corregida: =
-
la cual se
2
=
= () + +
Donde la suma de cuadrados de los tratamientos est ajustada para separar los efectos de los
tratamientos y de los bloques. Este ajuste es necesario porque cada tratamiento est
representado en un conjunto diferente de r bloques. Por lo tanto las diferencias entre los
totales de los tratamientos no ajustados 1. , 2. , , . tambin son afectadas por las
diferencias entre los bloques. La suma de cuadrado de los bloques es:
1
..2
= .2
=1
Donde . es el total del bloque j-simo. tiene b-1 grados de libertad. La suma de
cuadrados de los tratamientos ajustada es:
3
=1 2
= . =1 . i=1, 2,, a
estadstico apropiado para probar la igualdad de los efectos de los tratamientos es:
()
=
Fuente de
Suma de
Grados de
Cuadrado medio
variacin
cuadrados
libertad
()
()
Tratamientos
a-1
2
(ajustados)
1
Bloques
1
b-1
..
.2
1
Error
(por
N-a-b+1
sustraccin)
+1
2
Total
N-1
..
2
Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales
pueden ser de inters. Si se emplean contrastes ortogonales, los contrastes deben hacerse
sobre los totales de los tratamientos ajustados, las { } en lugar de las {. }. La suma de
cuadrados de los contrastes es:
(=1 )2
=
=1 2
Donde { } son los coeficientes de los contrastes. Pueden usarse otros mtodos de
comparacin mltiple para comparar todos los pares de efectos de los tratamientos ajustados
los cuales se estiman con =
Aqu la suma de cuadrados de los tratamientos est sin ajuste. Si el diseo es simtrico, si a=b
puede obtenerse una frmula simple para la () . Los totales de los bloques
ajustados son:
= . =1 .
j=1,2,,b
Fuente de
variacin
Tratamientos
(ajustados)
Tratamientos
(sin ajustes)
Bloques
(sin ajustes)
Bloques
(ajustados)
Error
Total
() =
Suma de
cuadrados
=1 2
1
..2
.2
=1
1
..2
.2
=1
2
=1
..2
=1
Grados de
libertad
a-1
a-1
Cuadrado
medio
()
1
()
b-1
b-1
N-a-b+1
(N-1)
()
1
+1
()
40
50
60
300
Operador
1
2
23
27
24
28
25
26
36
34
35
38
36
39
28
35
24
35
27
34
Temperatura
3
31
32
29
33
34
35
26
27
25
350o
Operador
1
2
24
38
23
36
28
35
37
34
39
38
35
36
26
36
29
37
25
34
3
34
36
39
34
36
31
28
26
24
= 1, 2, ,
= 1, 2, ,
Fuen
de
varia
A
Suma de cuadrados
2
1
.
2
=
=1
2
1
.
2
=
...
C
AB
=
AC
b-1
=1
c-1
=1
(a-1)(b-1)
2
1
.
2
=
...
a-1
=
1
2
.
1
2
..
=1 =1
= ()
2
1
.
2
=
..
(a-1)(c-1)
=1 =1
BC
= ()
ABC
Total
(b-1)(c-1)
2
.
1
2
..
=1 =1
= ()
Error
2
.
1
2
.
=1 =1 =1
= ()
= ()
=
2
=1 =1 =1 =1
2
.
(a-1)(b1)(c-1)
abc(n-1)
abcn-1
Cuadrado medio
esperado
2 +
2 +
2
1
2
1
2
1
()2
( 1)( 1)
()2
+
( 1)( 1)
( 1)( 1)
2 +
( 1)( 1)
()2
=
( 1)( 1)( 1) + ( 1)( 1)( 1)
( 1)
( 1)( 1)
()2
+
( 1)( 1)
Fo
Duracin del
ciclo (A)
1
40
50
60
Totales BxC ..
Totales B ...
Totales C ...
23
24 72
25
36
35 107
36
28
24 79
27
258
Temperatura (B)
300o
350o
Operador (C)
Operador (C)
2
3
1
2
27
31
24
38
34
28 81 32 92
23 75 36 109 36
26
29
28
35
39
34
33
37
34
34
38 111 34 102
39 111 38 108 36
39
35
35
36
31
35
26
26
36
28
35 104 27 78
29 80 37 107 26
34
25
25
34
24
296
272
266
324
826
878
Operador 1: 524
Operador 2: 620
Totales A
3
109
538
101
640
78
526
288
. =1704
Operador 3: 560
Totales AxB: ..
B
o
300
350o
40
245
293
50
320
320
60
261
265
A
Totales AxC: ..
C
1
2
3
40 147 190 201
50 218 219 203
60 159 211 156
A
(1704)2
= 436
54
(1704)2
2 +(878) 2 ]
[(826)
= 50.07
1
=27
54
(1704)2
2
2
2
= 261.33
1 [(538)
=18
=6
1 [(258)
=9
2 +(640) 2 +(526) 2 ]
2 +(296)2 +(272) 2
(1704)2
436 261.33 = 355.67
54
261.33 = 11.27
(1704)2
50.07
54
8
1 [(72)
=3
2 +(81) 2 +(92)2
(1704)2
54
=1239.33
9
En las siguientes figuras se grafican las interacciones AB, AC y BC. Para la duracin del
ciclo se obtiene un mayor promedio con el valor 50 y el menor con 40 ambos
correspondientes a una temperatura de 300, con la temperatura de 350 se presenta
una situacin similar aunque hay una diferencia con el ciclo de 40; con el operador se
observa una situacin parecida a la anterior en donde el mximo valor de teido de la
tela se da con el primer y el segundo operador; en la interaccin temperaturaoperador no se cruzan las lneas en el intervalo estudiado y existe un mayor teido con
la temperatura de 350 correspondiente al segundo operador.
Grfico de Interacciones
Teido de la tela
37
temperatura
300
350
35
33
31
29
27
40
50
Duracin del ciclo
60
Grfico de Interacciones
Operador
1
2
3
Teido de la tela
39
36
33
30
27
24
40
50
Duracin del ciclo
60
Grfico de Interacciones
Operador
1
2
3
Teido de la tela
36
34
32
30
28
300
350
temperatura
10
Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la
grfica de probabilidad normal, que los residuos tienden hacia la lnea recta
(comprobado tambin con el p-valor de shapiro-wilks= 0.2707>0.05); la grfica de
varianza constante muestra un comportamiento donde no cambia de magnitud
exceptuando dos datos que parecen atpicos para la duracin del ciclo de 40 y 50; la
grfica de independencia no presenta una tendencia en los residuos; por lo tanto se
cumplen los supuestos necesarios en la solucin del problema.
99,9
99
95
porcentaje
80
50
20
5
1
0,1
-3
-2
-1
RESIDUOS
residuos
2
1
0
-1
-2
-3
40
50
Duracin del ciclo
60
11
residuos
2
1
0
-1
-2
-3
0
10
20
30
nmero de fila
40
50
60
Adems con la prueba de rangos mltiples se cumple que existe una mayor media
correspondiente a la duracin de ciclo de 50 y por lo tanto existe una diferencia
significativa.
Duracin del ciclo
60
40
50
Sig.
*
*
Diferencia
-5,66667
0,666667
6,33333
+/- Lmites
1,22393
1,22393
1,22393
Con la prueba de rangos mltiples se cumple que existe una diferencia significativa
entre los dos grupos de temperaturas.
Temperatura
300
350
Sig.
*
Diferencia
-1,92593
+/- Lmites
0,999337
12
Con la prueba de rangos mltiples se cumple que existe una diferencia significativa
entre los tres grupos de operadores.
Operador
1
3
2
Operador
1
3
2
Casos
18
18
18
Sig.
*
*
*
Diferencia
-5,33333
-2,0
3,33333
+/- Lmites
1,47537
1,47537
1,47537
Contraste
1-2
1-3
2-3
Sig.
*
*
*
Diferencia
-5,33333
-2,0
3,33333
+/- Lmites
1,22393
1,22393
1,22393
13
Histograma
Datos/Variable: RESIDUOS
Recuento = 54
Promedio = -1,66667E-7
Desviacin Estndar = 1,49212
Coeficiente de Variacin = -8,95271E8%
Mnimo = -3,0
Mximo = 3,0
Rango = 6,0
Sesgo Estandarizado = -0,0471838
Curtosis Estandarizada = -1,13024
18
15
frecuencia
12
9
6
3
0
-3,3
-1,3
0,7
2,7
RESIDUOS
4,7
-3
-2
-1
0
1
RESIDUOS
porcentaje
RESIDUOS
0
-1
-2
-3
0
10
20
30 40
Fila
50
60
-3
-2
-1
0
1
RESIDUOS
14
3.
Da 1
Presin
Temperatura
Baja
Intermedia
Alta
250
86.3
88.5
89.1
260
84
87.3
90.2
Da 2
Presin
270
85.8
89
91.3
250
86.1
89.4
91.7
260
85.2
89.9
93.2
270
87.3
90.3
93.7
= + + + () + +
= 1, 2, ,
= 1, 2, ,
Donde
= 1, 2, ,
es el efecto del k-simo bloque.
15
La tabla de anlisis de varianza es:
Fuen
de
varia
A
B
AB
Bloq
ues
Error
Total
Suma de cuadrados
1
...2
=
..2
Grados
de
libertad
a-1
=1
1
...2
2
=
..
=1
1
2
2
= .
(a-1)(b-1)
=1 =1
1
2
2
=
..
=1
Sustraccin
b-1
2
=1 =1 =1
n-1
(ab-1)(n1)
abn-1
Cuadrado medio
=
=
2 +
( 1)( 1)
Cuadrado medio
esperado
( 1)( 1)
2
1
2
1
()2
+
( 1)( 1)
Fo
2 + 2
2
Los valores del modelo lineal para este experimento son: a=3, b=3, n=2.
Temperatura
Baja
Intermedia
Alta
..
..
Da 1
Presin
250
260
86.3
84
88.5
87.3
89.1
90.2
250 = 531.1
Da 2
Presin
270
250
85.8
86.1
89
89.4
91.3
91.7
260 = 529.8
Da 1= 791.5
260
270
85.2
87.3
89.9
90.3
93.2
93.7
270 = 537.4
..
514.7
534.4
549.2
=1598.3
Da 2= 806.8
2
..
= 851554.01
=1
2
2
..
= 1277398.49
=1
16
3
2
= 142047.23
=1 =1 =1
Da 1+ Da 2
Presin
Temperatura
250
172.4
177.9
180.8
Baja
Intermedia
Alta
3
260
169.2
177.2
183.4
270
173.1
179.3
185
2
.
= 284059.95
=1 =1
1
6
= [852120.09]
1
6
1598.32
18
= [851554.01]
1
2
= [284059.95]
1598.32
18
1598.32
18
=99.85
=5.51
99.85-5.51=4.45
1598.32
1
= [1277398.49]
= 13.00
9
18
= [142047.23]
1598.32
= 127.07
18
Fuente de variacin
Temperatura (A)
Presin (B)
AB
Bloques
Error
Total
Suma de
cuadrados
99.85
5.51
4.45
13.00
4.26
127.07
Grados de
libertad
2
2
4
1
8
17
Cuadrado
medio
49.92
2.75
1.11
13.00
0.53
Fo
Valor P
94.19 2,75404E-06
5.19 0,035890369
2.09 0,174049506
17
Se observa que la temperatura y la presin afectan significativamente el rendimiento
del proceso qumico. El coeficiente F de la interaccin temperatura-presin tiene un
valor P =0.1733> 0.05 lo cual indica que la interaccin entre estos dos factores no es
significativa al nivel de confianza del 95%.
Suma de Cuadrados
Gl
Cuadrado Medio
Razn-F
Valor-P
99,8544
5,50778
13,005
2
2
1
49,9272
2,75389
13,005
93,98
5,18
0,0000
0,0360
4,45222
4,25
127,069
4
8
17
1,11306
0,53125
2,10
0,1733
Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la
grfica de probabilidad normal, que los residuos tienden hacia la lnea recta
(comprobado tambin con el p-valor de shapiro-wilks= 0.9155>0.05); la grfica de
varianza constante muestra un comportamiento donde parece que no cambia de
magnitud aunque se observa un poco ms pequea para la temperatura intermedia; la
grfica de independencia parece indicar una tendencia en los residuos.
porcentaje
95
80
50
20
5
1
0,1
-1
0,6
18
0,2
-0,2
-0,6
-1
Alta
Baja
Temperatura
Intermedia
residuos
residuos
0,6
0,2
-0,2
-0,6
-1
0
9
nmero de fila
12
15
18
19
Proyecto de Secado
Wednesday, 23 April 2008 14:52:44 -0500
Sergio Mandini <gerencia@cgris.com.co>
Consultor Desesperado <usted@uninorte.edu.co>
'Mara Cementowski' <produccion@cgris.com.co>
Flujo
Apreciado Consultor,
Segn lo conversado, adjunto los
datos. Sergio
40
80
120
160
200
25
26.66 25.11
23.93 25.15
23.78 22.65
20.95 21.39
20.42 21.12
Motor Frequency
35
45
25.75 26.02 25.21 24.76
25.32 25.06 24.50 25.00
23.83 23.80 23.30 23.67
22.26 20.75 21.36 22.24
20.64 20.99 19.64 20.77
55
24.99 25.49
24.47 23.84
22.76 22.06
21.56 21.37
20.53 19.02
20
Fuente
EFECTOS PRINCIPALES
A:Frec
B:Flujo
INTERACCIONES
AB
RESIDUOS
TOTAL (CORREGIDO)
Suma de Cuadrados Gl
Cuadrado
Medio
Razn-F Valor-P
3,5249
145,083
3
4
1,17497
36,2709
3,24
100,13
0,0437
0,0000
2,88365
7,2446
158,737
12 0,240304
20 0,36223
39
0,66
0,7652
residuos
0,4
0
-0,4
-0,8
0
10
20
nmero de fila
30
40
21
residuos
0,4
0
-0,4
-0,8
25
35
45
55
Frec
residuos
0,4
0
-0,4
-0,8
40
80
120
Flujo
160
200
Distribucin
Normal
frecuencia
10
8
6
4
2
0
-0,9
-0,6
-0,3
0
RESIDUOS
0,3
0,6
0,9
22
Histograma
Datos/Variable: RESIDUOS
Recuento = 40
Promedio = 0,0
Desviacin Estndar = 0,430998
Coeficiente de Variacin = %
Mnimo = -0,775
Mximo = 0,775
Rango = 1,55
Sesgo Estandarizado = 0,0
Curtosis Estandarizada = -0,954281
12
frecuencia
10
8
6
4
2
0
-0,9 -0,6 -0,3 0 0,3
RESIDUOS
0,6
0,9
-0,8
-0,4
0
0,4
RESIDUOS
0,8
0,8
porcentaje
RESIDUOS
0,4
99,9
99
95
80
50
20
5
1
0,1
-0,8
-0,4
-0,8
0
10
20
Fila
30
40
-0,4
0
0,4
RESIDUOS
0,8
23
Como se observa en la tabla de mltiples rangos para humedad por flujo, no hay zonas
homogneas entre grupos y adems la media va disminuyendo a medida que aumenta
el flujo. Por lo tanto, debo aumentar en: 200gpm-40gpm=160 gpm ya que con ste se
alcanza la menor humedad (=20,3912).
c) Si estamos operando a 80 gpm y 35 Hz, vale la pena aumentar la frecuencia
para reducir la humedad?
Con la tabla de medias por mnimos cuadrados para humedad se extraen las medias
para un flujo de 80 y frecuencias de 35, 45, 55:
35
45
55
25,19
24,75
24,155
24
25,200
35,40
35,80
35,120
35,160
35,200
45,40
45,80
45,120
45,160
45,200
55,40
55,80
55,120
55,160
55,200
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
20,77
25,885
25,19
23,815
21,505
20,815
24,985
24,75
23,485
21,8
20,205
25,24
24,155
22,41
21,465
19,775
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
19,8823
24,9973
24,3023
22,9273
20,6173
19,9273
24,0973
23,8623
22,5973
20,9123
19,3173
24,3523
23,2673
21,5223
20,5773
18,8873
21,6577
26,7727
26,0777
24,7027
22,3927
21,7027
25,8727
25,6377
24,3727
22,6877
21,0927
26,1277
25,0427
23,2977
22,3527
20,6627
35
45
55
23,215
23,815
23,485
22,41
En este caso el LSD es igual al anterior con un rango correspondiente de: 23,2151,255=
(21,96
e) Si cada gpm adicional nos cuesta $250, cada % de reduccin de humedad nos
da ingresos por $3,900/hora, y estamos operando a 120 gpm y 45 Hz, cunto
ganamos (o perdemos) en un da de produccin si el combustible lo aumentamos
a 200 gpm?
Con la tabla de medias para mnimos cuadrados se extrae la informacin
correspondiente a una frecuencia de 45 y flujos de 120 y 200:
25
45,120 23,485
45,200 20,205
%Reduccin de humedad=23,485-20,205=3,28
Como 3,28>LSD=1,255 entonces si hay un incremento en el ingreso y por lo tanto se realiza el
siguiente anlisis:
Los costos de operacin (C) por 1 da son:
C=80gal/min*$250/gal*60min/1h*24h/da=$28 800 000/da
Los ingresos (I) obtenidos por un da son:
I=3,28%*$3 900/%h*24h/da=$307 008/da
Entonces la utilidad (U) es:
U=I-C=-$28 492 992/da
Perdemos $28 492 992 por da, por lo tanto no se recomiendan estos cambios.
26
2268
0,1546
1,52
2284
0,1472
1,49
2307
0,1506
1,48
2238
0,1493
1,47
2261
0,1542
0,01
0,0000101320
b
3
alpha 0,05
Regin de Experimentacin
Factor Inf Sup Niveles
RPM 2000 2500
2
Par
1
3
3
2 =
naD 2
2b 2
fi2
fi
v1
v2
beta
6,580
2,565
0,180
12
9,870
3,142
12
0,022
18
27
nbD 2
=
2a 2
2
fi2
fi
v1
v2
beta
14,805
3,848
< 0,01
12
22,207
4,712
12
< 0,01
18
Por ltimo el valor que corresponde a una diferencia entre dos efectos de interaccin en
donde 1 es el grado de libertad de ab ((a-1)(b-1)=2) y v2 es el grado de libertad del error
(v2=ab(n-1))
nD 2
= 2
2 [(a 1)(b 1) + 1]
2
fi2
fi
v1
v2
beta
3,290
1,814
0,450
12
4,935
2,221
12
0,180
18
6,580
2,565
18
0,040
24
Luego de probar las tres ecuaciones para hallar el nmero de rplicas se escoge la tercera
frmula dado que el cociente de los grados de libertad es menor (1/3), esto es, genera un nivel
crtico. Por lo anterior se requieren cuatro rplicas para obtener un <0,1 equivalente a 24
corridas.
Debido a que el gerente solamente aprueba 20 rplicas para el experimento, entonces se
seleccionan 3 de estas haciendo la observacin de que con esta seleccin se obtiene un de
0,18 lo cual conlleva a un riesgo de no detectar la interaccin de los factores como significativa
dado que si lo sea.
Realizando la corrida del experimento se obtuvieron las siguientes observaciones:
28
RPM
2000
2500
2000
2500
2000
2500
2000
2500
2500
2000
2000
2500
2000
2000
2000
2500
2500
2500
Suma de
Cuadrados
Gl
Cuadrado
Medio
Razn-F Valor-P
0,040328
0,043003
1
2
0,040328
0,0215015
21,82
11,64
0,0005
0,0016
0,00705033
0,0221747
0,112556
2 0,00352517
12 0,00184789
17
1,91
0,1908
29
Se observa que son significativos los factores RPM y PAR (P_value<0,05), mientras que su
interaccin no lo es (P_value=0,1908>0,05). Lo anterior es correcto siempre y cuando se
cumplan los supuestos.
b. PRUEBA DE SUPUESTOS
1. Normalidad de Residuales
SnapStat: Anlisis de Una Muestra
Histograma
Datos/Variable: Residuos C
Recuento = 18
Promedio = 1,66667E-9
Desviacin Estndar = 0,0361164
Coeficiente de Variacin = 2,16698E9%
Mnimo = -0,056
Mximo = 0,0646667
Rango = 0,120667
Sesgo Estandarizado = 0,302127
Curtosis Estandarizada = -1,04316
frecuencia
5
4
3
2
1
0
-0,08
-0,04
0
0,04
Residuos C
0,08
-0,06 -0,03
0,09
porcentaje
Residuos C
0,06
99,9
99
95
80
50
20
5
1
0,1
-0,06 -0,03
0,03
0
-0,03
-0,06
0
9 12
Fila
15
18
30
Como en la prueba de shapiro-Wills el P_value=0,2234>0,05, se acepta la normalidad en los
residuos.
2. Igualdad de Varianzas
residuos
0.05
0.02
-0.01
-0.04
-0.07
2000
2500
RPM
residuos
0.05
0.02
-0.01
-0.04
-0.07
1
2
PAR
En las grficas se observa una amplitud aproximadamente igual y por lo tanto no existe
evidencia que indique varianza no constante.
31
3. Independencia de Residuales
residuos
0.05
0.02
-0.01
-0.04
-0.07
0
9
nmero de fila
12
15
18
Se observa que los residuos se encuentran dispersos. Por lo tanto no hay razn para sospechar
la violacin del supuesto de independencia. Lo anterior conlleva a confirmar los supuestos y la
validez del modelo.
32
Histograma
Datos/Variable: RESIDUOS
Recuento = 18
Promedio = 0,0
Desviacin Estndar = 0,5
Coeficiente de Variacin = %
Mnimo = -0,95
Mximo = 0,95
Rango = 1,9
Sesgo Estandarizado = 0,0
Curtosis Estandarizada = -0,523898
frecuencia
5
4
3
2
1
0
-1,1 -0,7 -0,3 0,1 0,5 0,9 1,3
RESIDUOS
-1
-0,6
-0,2 0,2
RESIDUOS
0,6
porcentaje
RESIDUOS
0,6
0,2
-0,2
-0,6
-1
0
9 12
Fila
15
18
-1
-0,6
-0,2 0,2
RESIDUOS
0,6