You are on page 1of 32

1

Diseo factorial

Diseo de experimentos
Docente: Marlon Angulo

Universidad del Norte


Maestra en Estadstica Aplicada

1. DISEO DE BLOQUES INCOMPLETOS BALANCEADOS


Se entiende por diseo de bloques incompletos aleatorizados a un diseo de bloques
aleatorizados en el cual no es posible correr todas las combinaciones de los tratamientos en
cada bloque. Cuando adems dos tratamientos cualesquiera aparecen conjuntamente el
mismo nmero de veces, recibe el nombre de diseo de bloques incompletos balanceados
(BIBD: balanced incomplete block design). Si hay a tratamientos en cada bloque y cada bloque
puede tener exactamente k tratamientos (k<a), un diseo de bloques incompletos
balanceados puede construirse tomando bloques asignando una combinacin de

tratamientos diferentes a cada bloque. Con frecuencia se puede obtener un diseo balanceado
con menos de bloques.
1.1 Anlisis estadstico del diseo de bloques incompletos balanceados

Si existen a tratamientos y b bloques, cada bloque contiene k tratamientos, cada tratamiento


ocurre r veces en el diseo y hay N=ar=bk observaciones en total, el nmero de veces que
cada par de tratamiento aparece en el mismo bloque es: =

diseo es simtrico.

(1)
.
1

Si a=b se dice que el

El parmetro debe ser un entero. Para deducir la relacin para , se considera cualquier
tratamiento. Si el tratamiento i aparece en r bloques y hay otros k-1 tratamientos en cada uno
de esos bloques, entonces existen r(k-1) observaciones en los bloques que contiene al
tratamiento i. Estas r(k-1) observaciones tambin representan a los a-1 tratamientos restantes
veces, es decir, (a-1)=r(k-1).
El modelo estadstico del BIDB es: =++ + donde es la observacin i-sima en el

bloque j-simo, es la media global, es el efecto del tratamiento i-simo, es el efecto del
bloque j-simo y es el componente NID(0, 2 ) del error aleatorio. La variabilidad total en
2
los datos se expresa por la suma de cuadrados totales corregida: =
-

puede descomponer en:

la cual se

2
=
= () + +

Donde la suma de cuadrados de los tratamientos est ajustada para separar los efectos de los
tratamientos y de los bloques. Este ajuste es necesario porque cada tratamiento est
representado en un conjunto diferente de r bloques. Por lo tanto las diferencias entre los
totales de los tratamientos no ajustados 1. , 2. , , . tambin son afectadas por las
diferencias entre los bloques. La suma de cuadrado de los bloques es:

1
..2
= .2

=1

Donde . es el total del bloque j-simo. tiene b-1 grados de libertad. La suma de
cuadrados de los tratamientos ajustada es:

3
=1 2

Donde es el total ajustado del tratamiento i-simo, el cual se calcula como:


() =
1

= . =1 . i=1, 2,, a

Con = 1 si el tratamiento i aparece en el bloque j y = 0 en caso contrario. Los totales


de los tratamientos ajustados siempre sumarn cero. () tiene a-1
grados de libertad. La suma de cuadrados del error se calcula por sustraccin como:
= () y tiene N-a-b+1 grados de libertad. El

estadstico apropiado para probar la igualdad de los efectos de los tratamientos es:
()
=

Fuente de
Suma de
Grados de
Cuadrado medio

variacin
cuadrados
libertad
()
()
Tratamientos
a-1
2
(ajustados)
1

Bloques
1

b-1

..
.2
1

Error

(por
N-a-b+1
sustraccin)
+1
2
Total

N-1
..
2

Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales
pueden ser de inters. Si se emplean contrastes ortogonales, los contrastes deben hacerse
sobre los totales de los tratamientos ajustados, las { } en lugar de las {. }. La suma de
cuadrados de los contrastes es:
(=1 )2
=
=1 2
Donde { } son los coeficientes de los contrastes. Pueden usarse otros mtodos de
comparacin mltiple para comparar todos los pares de efectos de los tratamientos ajustados
los cuales se estiman con =

tratamiento ajustado es:

. La desviacin estndar en el error del efecto de un

En el anlisis que acaba de describirse, se ha hecho la particin de la suma de cuadrados total


en una suma de cuadrados de tratamientos ajustados, una suma de cuadrados de los bloques
sin ajuste y una suma de cuadrados del error. En ocasiones se tiene inters en evaluar los
efectos de los bloques. Para ello se requiere hacer una particin alternativa de , es decir:
= + () +

Aqu la suma de cuadrados de los tratamientos est sin ajuste. Si el diseo es simtrico, si a=b
puede obtenerse una frmula simple para la () . Los totales de los bloques
ajustados son:

= . =1 .

j=1,2,,b

Fuente de
variacin
Tratamientos
(ajustados)
Tratamientos
(sin ajustes)
Bloques
(sin ajustes)
Bloques
(ajustados)
Error
Total

() =

Suma de
cuadrados
=1 2

1
..2
.2

=1

1
..2
.2

=1
2
=1

..2

=1

Grados de
libertad
a-1
a-1

Cuadrado
medio
()
1

()

b-1
b-1
N-a-b+1
(N-1)

()
1

+1

()

2. DISEO FACTORIAL DE TRES FACTORES


El departamento de control de calidad de una planta de acabados textiles estudia el
efecto de varios factores sobre el teido de una tela de algodn y fibras sintticas
utilizada para fabricar camisas para caballero. Se seleccionaron tres operadores, tres
duraciones del ciclo y dos temperaturas y se tieron tres ejemplares pequeos de la
tela bajo cada conjunto de condiciones. La tela terminada se compar con un patrn y
se le asign una evaluacin numrica. Los datos se presentan enseguida. Analizar los
datos y sacar conclusiones. Comentar la adecuacin del modelo.

Duracin del ciclo

40

50

60

300
Operador
1
2
23
27
24
28
25
26
36
34
35
38
36
39
28
35
24
35
27
34

Temperatura

3
31
32
29
33
34
35
26
27
25

350o
Operador
1
2
24
38
23
36
28
35
37
34
39
38
35
36
26
36
29
37
25
34

3
34
36
39
34
36
31
28
26
24

Para los tres factores:


A: Duracin del ciclo con los niveles 40, 50 y 60 (a=3)
B: Temperatura con los niveles 300o y 350o (b=2)
C: Operador con los niveles 1, 2 y 3 (c=3)
Y para cada uno de ellos se realizan tres rplicas (n=3)
El modelo del anlisis de varianza de los tres factores es:
= + + + + () + () + () + () +
= 1, 2, ,
= 1, 2, ,
Donde

= 1, 2, ,
= 1, 2, ,

Fuen
de
varia
A

Suma de cuadrados

2
1
.
2
=

=1

2
1
.
2
=
...

C
AB

=
AC

b-1

=1

c-1

=1

(a-1)(b-1)

2
1
.
2
=
...

La tabla de anlisis de varianza es:


Grados
Cuadrado medio
de
libertad

a-1
=
1

2
.

1
2
..

=1 =1


= ()

2
1
.
2
=
..

(a-1)(c-1)

=1 =1

BC


= ()

ABC

Total

(b-1)(c-1)

2
.

1
2
..

=1 =1


= ()

Error

2
.

1
2
.

=1 =1 =1



= ()


= ()
=

2

=1 =1 =1 =1
2
.

(a-1)(b1)(c-1)

abc(n-1)
abcn-1

Cuadrado medio
esperado
2 +

2 +

2
1

2
1

2
1

()2
( 1)( 1)

()2
+
( 1)( 1)

( 1)( 1)

2 +

( 1)( 1)

()2
=
( 1)( 1)( 1) + ( 1)( 1)( 1)

( 1)

( 1)( 1)

()2
+
( 1)( 1)

Fo

Duracin del
ciclo (A)
1

40

50

60
Totales BxC ..
Totales B ...

Totales C ...

23
24 72
25
36
35 107
36
28
24 79
27
258

Temperatura (B)
300o
350o
Operador (C)
Operador (C)
2
3
1
2
27
31
24
38
34
28 81 32 92
23 75 36 109 36
26
29
28
35
39
34
33
37
34
34
38 111 34 102
39 111 38 108 36
39
35
35
36
31
35
26
26
36
28
35 104 27 78
29 80 37 107 26
34
25
25
34
24
296
272
266
324
826

878

Operador 1: 524

Operador 2: 620

Totales A

3
109

538

101

640

78

526

288

. =1704

Operador 3: 560

Totales AxB: ..
B
o
300
350o
40
245
293
50
320
320
60
261
265
A

Totales AxC: ..
C
1
2
3
40 147 190 201
50 218 219 203
60 159 211 156
A

(1704)2
= 436
54
(1704)2
2 +(878) 2 ]
[(826)
= 50.07

1
=27
54
(1704)2
2
2
2
= 261.33

1 [(524) +(620) +(560) ]


=18
54
(1704)2
436
1 [(245)2 +(293)2 +(320)2 + (320)2 +(261)2 +(265)2 ]
=9
54
50.07 = 78.82
2
1 [(147) +(190)2 +(201)2 + (218)2 +(219)2 +(203)2

1 [(538)
=18

=6

1 [(258)
=9

2 +(640) 2 +(526) 2 ]

+ (159)2 +(211)2 +(156)2 ]

2 +(296)2 +(272) 2

(1704)2
436 261.33 = 355.67
54

+ (266)2 +(324)2 +(288)2 ]

261.33 = 11.27

(1704)2
50.07
54

8
1 [(72)
=3

2 +(81) 2 +(92)2

+ (75)2 +(109)2 +(109)2 + (107)2 +(111)2 +(102)2

+ (111)2 +(108)2 +(101)2 + (79)2 +(104)2 +(78)2


(1704)2
+ (80)2 +(107)2 +(78)2 ]
436 50.07 261.33
54
78.82 355.67 11.27 = 46.17

()=1 [(72)2 +(81)2 +(92)2 + (75)2 +(109)2 +(109)2 +


3

(107)2 +(111)2 +(102)2 + (111)2 +(108)2 +(101)2 + (79)2 +(104)2 +(78)2 +


(80)2 +(107)2 +(78)2 ]

(1704)2
54

=1239.33

= [(23)2 +(27)2 +(31)2 + (24)2 +(38)2 +(34)2 + (24)2 +(28)2 +(32)2


+ (23)2 +(36)2 +(36)2 + (25)2 +(26)2 +(29)2
+ (28)2 +(35)2 +(39)2 + (36)2 +(34)2 +(33)2
+ (37)2 +(34)2 +(34)2 + (35)2 +(38)2 +(34)2
+ (39)2 +(38)2 +(36)2 + (36)2 +(39)2 +(35)2
+ (35)2 +(36)2 +(31)2 + (28)2 +(35)2 +(26)2
+ (26)2 +(36)2 +(28)2 + (24)2 +(35)2 +(27)2
+ (29)2 +(37)2 +(26)2 + (27)2 +(34)2 +(25)2
(1704)2
+ (25)2 +(34)2 +(24)2 ]
= 1357.33
54
= () = 1357.33 1239.33 = 118

En la siguiente tabla se resume el anlisis de varianza con las hiptesis a probar:


Ho: Efecto A=0, Ho: Efecto B=0, Ho: Efecto C=0, Ho: Efecto AB=0, Ho: Efecto AC=0, Ho:
Efecto BC=0, Ho: Efecto ABC=0 cada una aparejada con su correspondiente hiptesis
alternativa.
Fuente de variacin
Suma de
Grados de
Cuadrado
Fo
Valor P
cuadrados
libertad
medio
Duracin del ciclo (A)
436
2
218
66.46 8,22594E-13
Temperatura (B)
50.07
1
50.07
15.26 0,000395815
Operador (C)
261.33
2
130.66
39.83 7,51878E-10
AB
78.82
2
39.41
12.01 0,000100953
AC
355.67
4
88.92
27.11 1,99917E-10
BC
11.27
2
5.63
1.72 0,193455331
ABC
46.17
4
11.54
3.52 0,015922463
Error
118
36
3.28
Total
1357.33
53
Se observa que la duracin del ciclo, la temperatura y el operador afectan
significativamente el teido de una tela de algodn y fibras sintticas utilizadas en la
fabricacin de camisas para caballeros. El coeficiente F de la interaccin temperaturaoperador tiene un valor P de 0.1934>0.05 lo cual indica la no significancia de la
interaccin entre estos dos factores.

9
En las siguientes figuras se grafican las interacciones AB, AC y BC. Para la duracin del
ciclo se obtiene un mayor promedio con el valor 50 y el menor con 40 ambos
correspondientes a una temperatura de 300, con la temperatura de 350 se presenta
una situacin similar aunque hay una diferencia con el ciclo de 40; con el operador se
observa una situacin parecida a la anterior en donde el mximo valor de teido de la
tela se da con el primer y el segundo operador; en la interaccin temperaturaoperador no se cruzan las lneas en el intervalo estudiado y existe un mayor teido con
la temperatura de 350 correspondiente al segundo operador.
Grfico de Interacciones

Teido de la tela

37

temperatura
300
350

35
33
31
29
27
40

50
Duracin del ciclo

60

Grfico de Interacciones
Operador
1
2
3

Teido de la tela

39
36
33
30
27
24
40

50
Duracin del ciclo

60

Grfico de Interacciones
Operador
1
2
3

Teido de la tela

36
34
32
30
28
300

350
temperatura

10
Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la
grfica de probabilidad normal, que los residuos tienden hacia la lnea recta
(comprobado tambin con el p-valor de shapiro-wilks= 0.2707>0.05); la grfica de
varianza constante muestra un comportamiento donde no cambia de magnitud
exceptuando dos datos que parecen atpicos para la duracin del ciclo de 40 y 50; la
grfica de independencia no presenta una tendencia en los residuos; por lo tanto se
cumplen los supuestos necesarios en la solucin del problema.

Grfico de Probabilidad Normal

99,9
99
95

porcentaje

80
50
20
5
1
0,1
-3

-2

-1

RESIDUOS

Grfico de Residuos para Teido de la tela


3

residuos

2
1
0
-1
-2
-3
40

50
Duracin del ciclo

60

11

Grfico de Residuos para Teido de la tela


3

residuos

2
1
0
-1
-2
-3
0

10

20

30
nmero de fila

40

50

60

Adems con la prueba de rangos mltiples se cumple que existe una mayor media
correspondiente a la duracin de ciclo de 50 y por lo tanto existe una diferencia
significativa.
Duracin del ciclo
60
40
50

Mtodo: 95,0 porcentaje Tukey HSD


Casos Media LS
Sigma LS Grupos Homogneos
X
18
29,2222
0,42673
X
18
29,8889
0,42673
X
18
35,5556
0,42673

Contraste Sig. Diferencia


+/- Lmites
40 - 50
*
-5,66667
1,47537
40 - 60
0,666667
1,47537
50 - 60
*
6,33333
1,47537
Mtodo: 95,0 porcentaje LSD
Duracin del ciclo Casos Media LS
Sigma LS Grupos Homogneos
X
60
18
29,2222
0,42673
X
40
18
29,8889
0,42673
X
50
18
35,5556
0,42673
Contraste
40 - 50
40 - 60
50 - 60

Sig.
*
*

Diferencia
-5,66667
0,666667
6,33333

+/- Lmites
1,22393
1,22393
1,22393

Con la prueba de rangos mltiples se cumple que existe una diferencia significativa
entre los dos grupos de temperaturas.

Temperatura
300
350

Mtodo: 95,0 porcentaje Tukey HSD


Casos Media LS
Sigma LS
Grupos Homogneos
X
27
30,5926
0,348424
X
27
32,5185
0,348424

Contraste Sig. Diferencia


+/- Lmites
300 - 350
*
-1,92593
0,999337
Mtodo: 95,0 porcentaje LSD
Temperatura
Casos Media LS
Sigma LS
Grupos Homogneos
X
300
27
30,5926
0,348424
X
350
27
32,5185
0,348424
Contraste
300 - 350

Sig.
*

Diferencia
-1,92593

+/- Lmites
0,999337

12

Con la prueba de rangos mltiples se cumple que existe una diferencia significativa
entre los tres grupos de operadores.
Operador
1
3
2

Mtodo: 95,0 porcentaje Tukey HSD


Casos Media LS
Sigma LS Grupos Homogneos
X
18
29,1111
0,42673
X
18
31,1111
0,42673
X
18
34,4444
0,42673
Contraste
1-2
1-3
2-3

Operador
1
3
2

Casos
18
18
18

Sig.
*
*
*

Diferencia
-5,33333
-2,0
3,33333

+/- Lmites
1,47537
1,47537
1,47537

Mtodo: 95,0 porcentaje LSD


Media LS
Sigma LS Grupos Homogneos
X
29,1111
0,42673
X
31,1111
0,42673
X
34,4444
0,42673

Contraste
1-2
1-3
2-3

Sig.
*
*
*

Diferencia
-5,33333
-2,0
3,33333

+/- Lmites
1,22393
1,22393
1,22393

Anlisis de Varianza para Teido de la tela - Suma de Cuadrados Tipo III


Fuente
Suma de Cuadrados
Gl Cuadrado Medio
Razn-F
Valor-P
EFECTOS PRINCIPALES
A:Duracin del ciclo
436,0
2
218,0
66,51
0,0000
B:Temperatura
50,0741
1
50,0741
15,28
0,0004
C:Operador
261,333
2
130,667
39,86
0,0000
INTERACCIONES
AB
78,8148
2
39,4074
12,02
0,0001
AC
355,667
4
88,9167
27,13
0,0000
BC
11,2593
2
5,62963
1,72
0,1939
ABC
46,1852
4
11,5463
3,52
0,0159
RESIDUOS
118,0
36 3,27778
TOTAL (CORREGIDO)
1357,33
53
Todas las razones-F se basan en el cuadrado medio del error residual

13

SnapStat: Anlisis de Una Muestra

Histograma

Datos/Variable: RESIDUOS
Recuento = 54
Promedio = -1,66667E-7
Desviacin Estndar = 1,49212
Coeficiente de Variacin = -8,95271E8%
Mnimo = -3,0
Mximo = 3,0
Rango = 6,0
Sesgo Estandarizado = -0,0471838
Curtosis Estandarizada = -1,13024

18
15
frecuencia

12
9
6
3
0
-3,3

Grfico de Caja y Bigotes

-1,3

0,7
2,7
RESIDUOS

4,7

Intervalos de confianza del 95%


Media: -1,66667E-7 +/- 0,407271 [-0,407271, 0,40727]
Sigma: [1,25431, 1,84204]
Diagnsticos
Valor-P de Shapiro-Wilks = 0,2707
Autocorrelacin en Retraso 1 = -0,269303 +/- 0,266718

-3

-2

-1
0
1
RESIDUOS

Grfico Secuencias Cronolgicas

Grfico de Probabilidad Normal


99,9
99
95
80
50
20
5
1
0,1

porcentaje

RESIDUOS

0
-1
-2
-3
0

10

20

30 40
Fila

50

60

-3

-2

-1
0
1
RESIDUOS

14
3.

FORMACIN DE BLOQUES EN UN DISEO FACTORIAL

Se estudia el rendimiento de un proceso qumico. Los dos factores de inters son la


temperatura y la presin. Se seleccionan tres niveles de cada factor; sin embargo, slo es
posible hacer nueve corridas en un da. El experimentador corre una rplica completa en cada
da. Los datos se muestran en la tabla siguiente. Analizar los datos, suponiendo que los das
son bloques.

Da 1
Presin

Temperatura
Baja
Intermedia
Alta

250
86.3
88.5
89.1

260
84
87.3
90.2

Da 2
Presin
270
85.8
89
91.3

250
86.1
89.4
91.7

260
85.2
89.9
93.2

270
87.3
90.3
93.7

Para los dos factores:


A: Temperatura con los niveles baja, intermedia y alta (a=3)
B: Presin con los niveles 250, 260 y 270 (b=3)
Y para cada uno de ellos se realizan dos rplicas (n=2)
El modelo del anlisis de varianza de los dos factores con bloques es:

= + + + () + +
= 1, 2, ,
= 1, 2, ,
Donde

= 1, 2, ,
es el efecto del k-simo bloque.

15
La tabla de anlisis de varianza es:

Fuen
de
varia
A
B
AB

Bloq
ues
Error
Total

Suma de cuadrados

1
...2
=
..2

Grados
de
libertad
a-1

=1

1
...2
2
=
..

=1

1
2
2
= .

(a-1)(b-1)

=1 =1

1
2
2
=
..

=1

Sustraccin

b-1

2

=1 =1 =1

n-1
(ab-1)(n1)
abn-1

Cuadrado medio

=
=

2 +

( 1)( 1)

Cuadrado medio
esperado

( 1)( 1)

2
1

2
1

()2
+
( 1)( 1)

Fo

2 + 2
2

Los valores del modelo lineal para este experimento son: a=3, b=3, n=2.

Temperatura
Baja
Intermedia
Alta
..
..

Da 1
Presin
250
260
86.3
84
88.5
87.3
89.1
90.2
250 = 531.1

Da 2
Presin
270
250
85.8
86.1
89
89.4
91.3
91.7
260 = 529.8

Da 1= 791.5

260
270
85.2
87.3
89.9
90.3
93.2
93.7
270 = 537.4

..
514.7
534.4
549.2
=1598.3

Da 2= 806.8

3=1 ..2 =852120.09


3

2
..
= 851554.01
=1
2

2
..
= 1277398.49

=1

16
3

2

= 142047.23
=1 =1 =1

Da 1+ Da 2
Presin

Temperatura
250
172.4
177.9
180.8

Baja
Intermedia
Alta
3

260
169.2
177.2
183.4

270
173.1
179.3
185

2
.
= 284059.95
=1 =1

1
6

= [852120.09]
1
6

1598.32
18

= [851554.01]
1
2

= [284059.95]

1598.32
18

1598.32
18

=99.85
=5.51

99.85-5.51=4.45

1598.32
1
= [1277398.49]
= 13.00
9
18
= [142047.23]

1598.32
= 127.07
18

= 127.07 99.85 5.51 4.45 13 = 4.26

En la siguiente tabla se resume el anlisis de varianza con las hiptesis a probar:


Ho: Efecto A=0, Ho: Efecto B=0, Ho: Efecto AB=0, cada una aparejada con su
correspondiente hiptesis alternativa.

Fuente de variacin
Temperatura (A)
Presin (B)
AB
Bloques
Error
Total

Suma de
cuadrados
99.85
5.51
4.45
13.00
4.26
127.07

Grados de
libertad
2
2
4
1
8
17

Cuadrado
medio
49.92
2.75
1.11
13.00
0.53

Fo

Valor P

94.19 2,75404E-06
5.19 0,035890369
2.09 0,174049506

17
Se observa que la temperatura y la presin afectan significativamente el rendimiento
del proceso qumico. El coeficiente F de la interaccin temperatura-presin tiene un
valor P =0.1733> 0.05 lo cual indica que la interaccin entre estos dos factores no es
significativa al nivel de confianza del 95%.

El Statgraphics arroja los siguientes resultados:


Fuente
EFECTOS PRINCIPALES
A:Temperatura
B:Presin
Bloques
INTERACCIONES
AB
RESIDUOS
TOTAL (CORREGIDO)

Suma de Cuadrados

Gl

Cuadrado Medio

Razn-F

Valor-P

99,8544
5,50778
13,005

2
2
1

49,9272
2,75389
13,005

93,98
5,18

0,0000
0,0360

4,45222
4,25
127,069

4
8
17

1,11306
0,53125

2,10

0,1733

Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la
grfica de probabilidad normal, que los residuos tienden hacia la lnea recta
(comprobado tambin con el p-valor de shapiro-wilks= 0.9155>0.05); la grfica de
varianza constante muestra un comportamiento donde parece que no cambia de
magnitud aunque se observa un poco ms pequea para la temperatura intermedia; la
grfica de independencia parece indicar una tendencia en los residuos.

Grfico de Probabilidad Normal


99,9
99

porcentaje

95
80
50
20
5
1
0,1
-1

-0,6 -0,2 0,2


RESIDUOS

0,6

18

Grfico de Residuos para Rendimiento


1

0,2
-0,2
-0,6
-1
Alta

Baja
Temperatura

Intermedia

Grfico de Residuos para Rendimiento


1
0,6

residuos

residuos

0,6

0,2
-0,2
-0,6
-1
0

9
nmero de fila

12

15

18

19

4. DISEO FACTORIAL CON DOS FACTORES


En la planta de secado de la empresa Cemento Gris, hay dos variables que han sido
tradicionalmente ajustadas para lograr una humedad de salida apropiada: el flujo de
combustible (FF) y la frecuencia de los ventiladores (MF). El gerente lo ha contactado como
consultor especialista en anlisis de datos para resolver inquietudes respecto a
condiciones de operacin. Un ingeniero en pasanta dise una prueba, cuyos datos se
encuentran en el siguiente email:
Subject:
Date:
From:
To:
CC:

Proyecto de Secado
Wednesday, 23 April 2008 14:52:44 -0500
Sergio Mandini <gerencia@cgris.com.co>
Consultor Desesperado <usted@uninorte.edu.co>
'Mara Cementowski' <produccion@cgris.com.co>

Flujo

Apreciado Consultor,
Segn lo conversado, adjunto los
datos. Sergio

40
80
120
160
200

25
26.66 25.11
23.93 25.15
23.78 22.65
20.95 21.39
20.42 21.12

Motor Frequency
35
45
25.75 26.02 25.21 24.76
25.32 25.06 24.50 25.00
23.83 23.80 23.30 23.67
22.26 20.75 21.36 22.24
20.64 20.99 19.64 20.77

55
24.99 25.49
24.47 23.84
22.76 22.06
21.56 21.37
20.53 19.02

Consultor(a), con base en lo anterior, estamos interesados en saber:

a) Las variables significativas y sus p-values:


Las variables de este experimento son: frecuencia del motor, flujo de combustible y porcentaje
de humedad, es decir hay 2 factores de diseo y 1 variable respuesta. Con el ANOVA se
obtienen como significativas la frecuencia del motor y el flujo de combustible con p-values de
0,0437 y menor que 0,0001 respectivamente; la interaccin flujo-frecuencia resulta no
significativa con p-value 0,7652 (ver la siguiente tabla).

20

Fuente
EFECTOS PRINCIPALES
A:Frec
B:Flujo
INTERACCIONES
AB
RESIDUOS
TOTAL (CORREGIDO)

Suma de Cuadrados Gl

Cuadrado
Medio

Razn-F Valor-P

3,5249
145,083

3
4

1,17497
36,2709

3,24
100,13

0,0437
0,0000

2,88365
7,2446
158,737

12 0,240304
20 0,36223
39

0,66

0,7652

Para corroborar lo anterior se verifican los supuestos:


1. Independencia: se comprueba analizando la grfica de residuos versus nmero de fila.
No se observa patrn conocido es decir los datos son aleatorios; por lo tanto se
cumple este supuesto.

Grfico de Residuos para Hum


0,8

residuos

0,4
0
-0,4
-0,8
0

10

20
nmero de fila

30

40

2. Homocedasticidad: se analiza con la grfica de residuos versus frecuencia y residuos


versus flujo; en ambos casos se aprecia que no hay variaciones extremas con respecto
a los niveles de las variables lo cual conlleva al cumplimiento de la igualdad de
varianzas

21

Grfico de Residuos para Hum


0,8

residuos

0,4
0
-0,4
-0,8
25

35

45

55

Frec

Grfico de Residuos para Hum


0,8

residuos

0,4
0
-0,4
-0,8
40

80

120
Flujo

160

200

3. Normalidad: analizando los residuos de la grfica de distribucin normal se observa


que tienden a la recta; por lo tanto no se rechaza la hiptesis nula de que proviene de
una distribucin normal lo cual se confirma aplicando Shapiro-Wills.
Histograma para RESIDUOS
12

Distribucin
Normal

frecuencia

10
8
6
4
2
0
-0,9

-0,6

-0,3

0
RESIDUOS

0,3

0,6

0,9

22

SnapStat: Anlisis de Una Muestra

Histograma

Datos/Variable: RESIDUOS
Recuento = 40
Promedio = 0,0
Desviacin Estndar = 0,430998
Coeficiente de Variacin = %
Mnimo = -0,775
Mximo = 0,775
Rango = 1,55
Sesgo Estandarizado = 0,0
Curtosis Estandarizada = -0,954281

12

frecuencia

10
8
6
4
2
0
-0,9 -0,6 -0,3 0 0,3
RESIDUOS

Grfico de Caja y Bigotes

0,6

0,9

Intervalos de confianza del 95%


Media: 0,0 +/- 0,13784 [-0,13784, 0,13784]
Sigma: [0,353056, 0,553416]
Diagnsticos
Valor-P de Shapiro-Wilks = 0,2928
Autocorrelacin en Retraso 1 = -0,358215 +/- 0,309898

-0,8

-0,4

0
0,4
RESIDUOS

0,8

Grfico Secuencias Cronolgicas

Grfico de Probabilidad Normal

0,8

porcentaje

RESIDUOS

0,4

99,9
99
95
80
50
20
5
1
0,1
-0,8

-0,4
-0,8
0

10

20
Fila

30

40

-0,4

0
0,4
RESIDUOS

0,8

b) Si estamos operando a 40 gpm, qu tanto debe aumentar el flujo para alcanzar la


menor humedad posible?

Pruebas de Mltiple Rangos para Humedad por Flujo


Mtodo: 95,0 porcentaje LSD
Flujo Casos Media LS Sigma LS Grupos
Homogneos
200 8
20,3912 0,212788 X
160 8
21,485
0,212788 X
120 8
23,2313 0,212788 X
80
8
24,6588 0,212788 X
40
8
25,4988 0,212788 X

23
Como se observa en la tabla de mltiples rangos para humedad por flujo, no hay zonas
homogneas entre grupos y adems la media va disminuyendo a medida que aumenta
el flujo. Por lo tanto, debo aumentar en: 200gpm-40gpm=160 gpm ya que con ste se
alcanza la menor humedad (=20,3912).
c) Si estamos operando a 80 gpm y 35 Hz, vale la pena aumentar la frecuencia
para reducir la humedad?
Con la tabla de medias por mnimos cuadrados para humedad se extraen las medias
para un flujo de 80 y frecuencias de 35, 45, 55:
35

45

55

25,19

24,75

24,155

Calculando el LSD=t/2, gl*RAIZ (2*MSE/n)=t0, 025,20*RAIZ (2*MSE/n)=


2,08596344*RAIZ (2*0,36223/2)= 1,2554485.
El rango correspondiente al LSD es: 25,191,255= (23,935

26,445) lo cual nos

representa igualdad de medias con un flujo de 80 y frecuencias de 35, 45 y 55, es decir


no se observa un cambio significativo; por lo tanto no se recomienda aumentar la
frecuencia.
Tabla de Medias por Mnimos Cuadrados para Humedad con intervalos de
confianza del 95,0%
Nivel
Casos Media
Error
Lmite
Lmite
Estndar
Inferior
Superior
MEDIA
40
23,053
GLOBAL
Frecuencia
25
10
23,116 0,190323
22,719
23,513
35
10
23,442 0,190323
23,045
23,839
45
10
23,045 0,190323
22,648
23,442
55
10
22,609 0,190323
22,212
23,006
Flujo
40
8
25,4988 0,212788
25,0549
25,9426
80
8
24,6588 0,212788
24,2149
25,1026
120
8
23,2313 0,212788
22,7874
23,6751
160
8
21,485 0,212788
21,0411
21,9289
200
8
20,3912 0,212788
19,9474
20,8351
Frecuencia por Flujo
25,40
2
25,885 0,425576
24,9973
26,7727
25,80
2
24,54
0,425576
23,6523
25,4277
25,120
2
23,215 0,425576
22,3273
24,1027
25,160
2
21,17
0,425576
20,2823
22,0577

24
25,200
35,40
35,80
35,120
35,160
35,200
45,40
45,80
45,120
45,160
45,200
55,40
55,80
55,120
55,160
55,200

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

20,77
25,885
25,19
23,815
21,505
20,815
24,985
24,75
23,485
21,8
20,205
25,24
24,155
22,41
21,465
19,775

0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576
0,425576

19,8823
24,9973
24,3023
22,9273
20,6173
19,9273
24,0973
23,8623
22,5973
20,9123
19,3173
24,3523
23,2673
21,5223
20,5773
18,8873

21,6577
26,7727
26,0777
24,7027
22,3927
21,7027
25,8727
25,6377
24,3727
22,6877
21,0927
26,1277
25,0427
23,2977
22,3527
20,6627

d) Si estamos operando a 120 gpm y 25 Hz, hasta qu valor podemos aumentar la


frecuencia sin afectar la humedad?
Con un anlisis similar al del tem (c) tomando 120 gpm y variando las frecuencias se
obtiene para las medias:
25

35

45

55

23,215

23,815

23,485

22,41

En este caso el LSD es igual al anterior con un rango correspondiente de: 23,2151,255=
(21,96

24,47) lo cual nos representa igualdad de medias con un flujo de 120 y

frecuencias de 25, 35, 45 y 55, es decir no se observa un cambio significativo; por lo


tanto se recomienda no aumentar la frecuencia.

e) Si cada gpm adicional nos cuesta $250, cada % de reduccin de humedad nos
da ingresos por $3,900/hora, y estamos operando a 120 gpm y 45 Hz, cunto
ganamos (o perdemos) en un da de produccin si el combustible lo aumentamos
a 200 gpm?
Con la tabla de medias para mnimos cuadrados se extrae la informacin
correspondiente a una frecuencia de 45 y flujos de 120 y 200:

25
45,120 23,485
45,200 20,205
%Reduccin de humedad=23,485-20,205=3,28
Como 3,28>LSD=1,255 entonces si hay un incremento en el ingreso y por lo tanto se realiza el
siguiente anlisis:
Los costos de operacin (C) por 1 da son:
C=80gal/min*$250/gal*60min/1h*24h/da=$28 800 000/da
Los ingresos (I) obtenidos por un da son:
I=3,28%*$3 900/%h*24h/da=$307 008/da
Entonces la utilidad (U) es:
U=I-C=-$28 492 992/da
Perdemos $28 492 992 por da, por lo tanto no se recomiendan estos cambios.

26

5. DISEO FACTORIAL: CONSUMO DE COMBUSTIBLE


1. Se desea analizar el comportamiento del consumo de combustible con el par y la velocidad
de giro de un motor.

Pruebas en Condicin Constante


Par (N.m) N (rpm) m. fuel (Kg/hr)
1,51

2268

0,1546

1,52

2284

0,1472

1,49

2307

0,1506

1,48

2238

0,1493

1,47

2261

0,1542

Diferencia relevante (m. fuel)


D

0,01

Se requiere inicialmente de las siguientes tablas para hallar el nmero de rplicas.


Var

0,0000101320

b
3
alpha 0,05
Regin de Experimentacin
Factor Inf Sup Niveles
RPM 2000 2500
2
Par
1
3
3

Se usa la curva de operacin caracterstica para determinar el tamao de la muestra.


Empezando con la diferencia de medias de dos renglones en donde 1 es el grado de libertad
de a (a-1=1) y v2 es el grado de libertad del error (v2=ab(n-1))

2 =

naD 2
2b 2

fi2

fi

v1

v2

beta

6,580

2,565

0,180

12

9,870

3,142

12

0,022

18

27

Continuando con la diferencia de medias de dos columnas en donde 1 es el grado de libertad


de b (b-1=2) y v2 es el grado de libertad del error (v2=ab(n-1))

nbD 2
=
2a 2
2

fi2

fi

v1

v2

beta

14,805

3,848

< 0,01

12

22,207

4,712

12

< 0,01

18

Por ltimo el valor que corresponde a una diferencia entre dos efectos de interaccin en
donde 1 es el grado de libertad de ab ((a-1)(b-1)=2) y v2 es el grado de libertad del error
(v2=ab(n-1))

nD 2
= 2
2 [(a 1)(b 1) + 1]
2

fi2

fi

v1

v2

beta

3,290

1,814

0,450

12

4,935

2,221

12

0,180

18

6,580

2,565

18

0,040

24

Luego de probar las tres ecuaciones para hallar el nmero de rplicas se escoge la tercera
frmula dado que el cociente de los grados de libertad es menor (1/3), esto es, genera un nivel
crtico. Por lo anterior se requieren cuatro rplicas para obtener un <0,1 equivalente a 24
corridas.
Debido a que el gerente solamente aprueba 20 rplicas para el experimento, entonces se
seleccionan 3 de estas haciendo la observacin de que con esta seleccin se obtiene un de
0,18 lo cual conlleva a un riesgo de no detectar la interaccin de los factores como significativa
dado que si lo sea.
Realizando la corrida del experimento se obtuvieron las siguientes observaciones:

28
RPM
2000
2500
2000
2500
2000
2500
2000
2500
2500
2000
2000
2500
2000
2000
2000
2500
2500
2500

Par Consumo Temperatura


1
0,214
192
1
0,359
216
2
0,224
224
2
0,289
252
3
0,279
256
3
0,374
284
1
0,194
205
1
0,309
222
2
0,354
248
2
0,279
220
3
0,329
249
3
0,478
282
1
0,12
199
2
0,279
224
3
0,329
248
3
0,388
287
1
0,279
228
2
0,269
253

Llevando a cabo el diseo del experimento nos queda:

a. ANOVA PARA LA VARIABLE RESPUESTA CONSUMO:


Fuente
EFECTOS PRINCIPALES
A:RPM
B:Par
INTERACCIONES
AB
RESIDUOS
TOTAL (CORREGIDO)

Suma de
Cuadrados

Gl

Cuadrado
Medio

Razn-F Valor-P

0,040328
0,043003

1
2

0,040328
0,0215015

21,82
11,64

0,0005
0,0016

0,00705033
0,0221747
0,112556

2 0,00352517
12 0,00184789
17

1,91

0,1908

Todas las razones-F se basan en el cuadrado medio del error residual

29
Se observa que son significativos los factores RPM y PAR (P_value<0,05), mientras que su
interaccin no lo es (P_value=0,1908>0,05). Lo anterior es correcto siempre y cuando se
cumplan los supuestos.
b. PRUEBA DE SUPUESTOS

1. Normalidad de Residuales
SnapStat: Anlisis de Una Muestra

Histograma

Datos/Variable: Residuos C
Recuento = 18
Promedio = 1,66667E-9
Desviacin Estndar = 0,0361164
Coeficiente de Variacin = 2,16698E9%
Mnimo = -0,056
Mximo = 0,0646667
Rango = 0,120667
Sesgo Estandarizado = 0,302127
Curtosis Estandarizada = -1,04316

frecuencia

5
4
3
2
1
0
-0,08

Grfico de Caja y Bigotes

-0,04
0
0,04
Residuos C

0,08

Intervalos de confianza del 95%


Media: 1,66667E-9 +/- 0,0179603 [-0,0179603, 0,0179603]
Sigma: [0,0271013, 0,0541436]
Diagnsticos
Valor-P de Shapiro-Wilks = 0,2234
Autocorrelacin en Retraso 1 = 0,0453269 +/- 0,461969

-0,06 -0,03

0 0,03 0,06 0,09


Residuos C

Grfico Secuencias Cronolgicas

Grfico de Probabilidad Normal

0,09

porcentaje

Residuos C

0,06

99,9
99
95
80
50
20
5
1
0,1
-0,06 -0,03

0,03
0

-0,03
-0,06
0

9 12
Fila

15

18

0 0,03 0,06 0,09


Residuos C

30
Como en la prueba de shapiro-Wills el P_value=0,2234>0,05, se acepta la normalidad en los
residuos.

2. Igualdad de Varianzas

Grfico de Residuos para Consumo


0.08

residuos

0.05
0.02
-0.01
-0.04
-0.07
2000

2500
RPM

Grfico de Residuos para Consumo


0.08

residuos

0.05
0.02
-0.01
-0.04
-0.07
1

2
PAR

En las grficas se observa una amplitud aproximadamente igual y por lo tanto no existe
evidencia que indique varianza no constante.

31

3. Independencia de Residuales

Grfico de Residuos para Consumo


0.08

residuos

0.05
0.02
-0.01
-0.04
-0.07
0

9
nmero de fila

12

15

18

Se observa que los residuos se encuentran dispersos. Por lo tanto no hay razn para sospechar
la violacin del supuesto de independencia. Lo anterior conlleva a confirmar los supuestos y la
validez del modelo.

32

SnapStat: Anlisis de Una Muestra

Histograma

Datos/Variable: RESIDUOS
Recuento = 18
Promedio = 0,0
Desviacin Estndar = 0,5
Coeficiente de Variacin = %
Mnimo = -0,95
Mximo = 0,95
Rango = 1,9
Sesgo Estandarizado = 0,0
Curtosis Estandarizada = -0,523898

frecuencia

5
4
3
2
1
0
-1,1 -0,7 -0,3 0,1 0,5 0,9 1,3
RESIDUOS

Grfico de Caja y Bigotes

Intervalos de confianza del 95%


Media: 0,0 +/- 0,248645 [-0,248645, 0,248645]
Sigma: [0,375194, 0,749572]
Diagnsticos
Valor-P de Shapiro-Wilks = 0,9155
Autocorrelacin en Retraso 1 = -0,608824 +/- 0,461969

-1

-0,6

-0,2 0,2
RESIDUOS

0,6

Grfico de Probabilidad Normal

Grfico Secuencias Cronolgicas


99,9
99
95
80
50
20
5
1
0,1

porcentaje

RESIDUOS

0,6
0,2

-0,2
-0,6
-1
0

9 12
Fila

15

18

-1

-0,6

-0,2 0,2
RESIDUOS

0,6

You might also like