You are on page 1of 36

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD.

APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Actividad 6
Tema6

TRABAJO REALIZADO POR: CARMEN M SNCHEZ CAMPOY

PROFESORES:

RAMN GUTIRREZ SNCHEZ


MARIA DOLORES RUIZ MEDINA

CURSO: DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD.


APLICACIONES EN BIOCIENCIAS E INGENIERA

- MASTER ESTADSTICA APLICADA 1

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

A1. CUESTIONES TERICAS


Resolver cuatro actividades tericas.
1.- Deducir el clculo de las cantidades SSAB y SSE en trminos de las cantidades
SST , SSA y
a

SS subtotales =

yij2.

y...2

n abn

i =1 j =1

Continuando con los datos facilitados en el tema 6, sabemos que se cumple la


siguiente igualdad:

( y
a

ijk

i =1 j =1 k =1
a

y...

+ yijk y ij .
i =1 j =1 k =1

= bn y i.. y...
i =1

+ an y. j . y ...
j =1

+ n y ij . y i.. y. j . + y...
i =1 j =1

Puesto que los productos cruzados son cero, se tiene que:

SST = SS A + SS B + SS AB + SS E
Siendo:
Suma de cuadrados totales: con abn-1 grados de libertad, su expresin viene dada
por:

y...2
SST = y
abn
i =1 j =1 k =1
a

2
ijk

Sumas de cuadrados de los efectos principales, con a-1 y b-1 grados de libertad
cada una, sus expresiones vienen dadas por:

y...2
1 b 2
SS B =
y. j. abn
an j =1

1 a 2 y...2
SS A = yi..
bn i =1
abn

Sumas de cuadrados debida a la interaccin entre A y B, con (a-1)(b-1) grados de


libertad, su expresin viene dada por:
a

SS AB =
i =1 j =1

yij2.

y...2
1 a 2 1 b 2
yi.. y. j .
n bn i =1
an j =1
abn

Sumas de cuadrados debida al error, con ab(n-1) grados de libertad, su expresin


viene dada por:
a

2
SS E = yijk

i =1 j =1 k =1

1 a b 2
yij.
n i =1 j =1

Para obtener otra expresin, consideramos la suma de cuadrados entre los totales de
las ab celdas, a la que se denomina suma de cuadrados debida a los "subtotales" y
cuya frmula viene dada en el enunciado:
a

SS subtotales =
i =1 j =1

yij2.

y...2

n abn

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Entonces:
a

SS subtotales SS A SS B =
i =1 j =1

=
i =1 j =1

yij2.
n

yij2.
n

y...2 1 a 2 y...2 1 b 2
y...2
yi..

=
. j.
abn bn i =1
abn an j =1
abn

y...2
1 a 2 1 b 2
y

= SS AB
i.. an
. j.
bn i =1
abn
j =1

Luego:

SS AB = SS subtotales SS A SS B
Si hacemos un sistema de ecuaciones con las dos expresiones de las sumas de
cuadrados que hemos obtenido, obtenemos que:

SS AB = SS subtotales SS A SS B

SST = SS A + SS B + SS AB + SS E
Sustituyendo SS AB en la segunda ecuacin:

SST = SS A + SS B + SS subtotales SS A SS B + SS E = SS subtotales + SS E


Luego: SS E = SST SS subtotales
As pues:

SS AB = SSsubtotales SS A SS B

SS E = SST SS subtotales

2.- Determinar el tamao muestral en un diseo bifactorial a partir de la curva


caracterstica de operacin del anlisis de la varianza en el modelo de efectos
fijos. Dicha curva viene dada por:

nbD 2
=
2a 2
naD 2
2 =
2b 2
2

nD 2
=
2 2 [ (a 1)(b 1) + 1]
2

(1)

(2)

(3)

donde D denota la diferencia entre dos efectos medios del factor A (ecuacin (1)),
entre dos efectos medios del factor B (ecuacin (2)) y entre dos efectos medios
del factor de interaccin (ecuacin (3)). La curva operativa se obtiene
representando la probabilidad de aceptar la hiptesis nula frente a los diferentes
tamaos muestrales, para un error tipo I, = 0, 05 en este caso. Considerar
diferentes valores de los parmetros a y b que determinan los grados de libertad
del numerador y denominador en las ecuaciones anteriores.
Para determinar el tamao de la muestra (es decir, el nmero de rplicas, n) apropiado
en un diseo factorial de dos factores, podemos hacer uso de las curvas de operacin
3

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

caracterstica. Estas curvas se utilizan del mismo modo que las tablas de las
distribuciones. Fijados unos parmetros se busca el valor deseado de la respuesta, en
este caso el tamao de la muestra. Las podemos encontrar dibujadas en los
apndices de ciertos libros (por ejemplo: apndice V del libro de Douglas C.
Montgomery).
Esencialmente, para calcular el tamao de la muestra se necesita fijar el nivel de
significacin = 0, 05 , el tamao del efecto y la potencia deseada. En el caso de las
curvas de operacin los parmetros son: el nivel de significacin, los grados de
libertad 1 (grados de libertad del numerador) y 2 (grados de libertad del error) y del
parmetro .
2

Una forma de emplear estas curvas consiste en encontrar el valor menor de que
corresponde a una diferencia especificada entre las medias de dos tratamientos
cualesquiera:
2

Si la diferencia en las medias de dos renglones cualesquiera es D, entonces


el valor mnimo de es:
2

nbD 2
=
2a 2
2

donde D denota la diferencia entre dos efectos medios del factor A


Si la diferencia en las medias de dos columnas cualesquiera es D, entonces
el valor mnimo de es:
2

2 =

naD 2
2b 2

donde D denota la diferencia entre dos efectos medios del factor B

Si la diferencia corresponde a una diferencia entre dos factores de interaccin


cualesquiera, entonces el valor mnimo de es:
2

2 =

nD 2
2 2 [ (a 1)(b 1) + 1]

donde D denota la diferencia entre dos efectos medios del factor de interaccin

La curva operativa se obtiene representando la probabilidad de aceptar la hiptesis


nula frente a los diferentes tamaos muestrales, para un error tipo I, = 0, 05 en este
caso.
En la tabla siguiente se muestra el valor apropiado del parmetro , as como los
grados de libertad del numerador y el denominador:
2

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

FACTOR

GRADOS DE LIBERTAD
DEL NUMERADOR

GRADOS DE LIBERTAD
DEL DENOMINADOR

a-1

ab(n-1)

b-1

ab(n-1)

(a-1)(b-1)

ab(n-1)

nb i2

i =1

na 2j

j =1

b
a

AB

n ( )ij2
i =1 j =1

[ (a 1)(b 1) + 1]
2

En los grficos siguientes ponemos como ejemplo las curvas de operacin


caracterstica obtenidas del apndice V del libro de Douglas C. Montgomery, para el
caso de grados de libertad del numerador (v1) 1 y 2, y diferentes valores de grados de
libertad del denominador, en dicho apndice podemos encontrar ms grficas para los
distintos valores de v1.

Ejemplo:
Para ilustrar con un ejemplo, como podemos obtener el tamao muestral mediante el
uso de estas curvas podemos poner un ejemplo, para un caso en el que consideramos
la expresin (1) de las curvas de operacin caracterstica, una desviacin tpica de 5,
un valor de D=8 y en el que los parmetros a y b toman el valor de 3, en tal caso, se
tendra que:

nbD 2 n382
=
=
= 1, 28n = 1, 28n
2a 2 2352
v1 = a 1 = 2 Grados de libertad del numerador
2

v2 = ab(n 1) = 9(n 1) Grados de libertad del denominador


5

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Dando distintos valores a n y buscando en el cuadro para v1 = 2 , se tiene que:


-Para n=2:

= 1, 6
v1 = 2

v2 = 9(n 1) = 9
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.45
(buscamos que esta probabilidad sea pequea).
= 1,96
-Para n=3:

v1 = 2
v2 = 9(n 1) = 18
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.18
(buscamos que esta probabilidad sea an ms pequea).
= 2, 26
-Para n=4:

v1 = 2
v2 = 9(n 1) = 27
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.06
(podemos aceptar esta probabilidad).
Podemos concluir que con 4 rplicas se obtiene una sensitividad deseada.
Para terminar con el ejercicio terico-prctico, presentamos un cuadro donde
consideramos diferentes valores de los parmetros a y b que determinan los grados de
libertad del numerador y denominador y que pueden servir para futuros ejemplos como
el anterior:
Para a=2 y b=3:
GRADOS DE LIBERTAD
NUMERADOR

FACTOR

nbD 2
=
2a 2

naD 2
=
2b 2

AB

2 =

nD 2
2 2 [ (a 1)(b 1) + 1]

GRADOS DE LIBERTAD
DENOMINADOR

6
12
18
6
12
18
6
12
18

(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....

Para a=4 y b=3:

FACTOR

GRADOS DE LIBERTAD
NUMERADOR

2 =

nbD 2
2a 2

2 =

naD 2
2b 2

nD 2
2 2 [ (a 1)(b 1) + 1]

AB

2 =

GRADOS DE LIBERTAD
DENOMINADOR

12
24
36
12
24
36
12
24
36

(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

3.- Desarrollar el anlisis de la varianza en el modelo bifactorial de efectos fijos,


cuando se considera una observacin por celda.
Un experimento de dos factores, tiene por modelo estadstico:

yij = + i + j + ( )ij + ij
Con:

i = 1,..., a

j = 1,..., b

efecto medio general


i efecto del i-simo nivel del factor A
j efecto del j-simo nivel del factor B
( )ij efecto de la interaccin entre i y j
ij componentes de error aleatorio.
a

Considerando los efectos fijos, se tiene:

i =1

=0

j =1

=0

En un experimento de dos factores con una sola rplica, es decir, en los que slo hay
una observacin por celda, se tendra este modelo con ab observaciones.
Ahora bien, al examinar los cuadrados medios esperados, se observa que la varianza
2
del error no es estimable, es decir, que el efecto de la interaccin de los dos
factores ( )ij y el error experimental no pueden separarse de alguna manera obvia.
Por este motivo, no se cuenta con pruebas para los efectos principales a menos que el
efecto de la interaccin sea cero. Luego entonces, ( )ij = 0 para cualquier valor de i
y j.
Consecuente con lo anterior, tenemos que un experimento de dos factores, con una
sola rplica, es decir, en los que slo hay una observacin por celda, tiene por
modelo estadstico plausible:

yij = + i + j + ij

i = 1,..., a

j = 1,..., b

Correspondera a un diseo en bloques aleatorizados, en su caso.


Es de inters contrastar la igualdad entre los efectos de los tratamientos del factor A,
as como la igualdad entre los tratamientos del factor B. Adicionalmente, es importante
contrastar si existen interacciones significativas entre los tratamientos de los dos
factores. Es decir, ser conveniente realizar aquellos contrastes con hiptesis nulas:

H 0 : 1 = = a = 0
H 0 : 1 = = b = 0
H 0 : ( )ij = 0 i = 1,..., a

j = 1,..., b

Teniendo en cuenta que para este caso:


b

yi. = yij
j =1

y. j = yij
i =1

y.. = yij
i =1 j =1

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Podemos resumir el anlisis de la variancia para un modelo bifactorial con una


observacin por celda, en el cuadro siguiente:
FUENTE DE
VARIACIN

SUMA DE CUADRADOS

y2 y2
SS A = i. ..
ab
i =1 b

GRADOS DE
LIBERTAD

CUADRADO
MEDIO

CUADRADO MEDIO
ESPERADO
a

SS B =

j =1

MS A

a-1

2 +

b i2
b

y.2j

y2
..
a ab

MS B

b-1

2 +
a

Residual o AB

Sustraccin

Total

(a-1)(b-1)

y..2
SST = y
ab
i =1 j =1
a

i =1

a 1

MS Re sidual

2 +

a j2
j =1

b 1
b

( )
i =1 j =1

2
ij

(a 1)(b 1)

2
ij

ab-1

Se tiene que:

SST = SS A + SS B + SS Re sidual
Si el modelo es apropiado, entonces la media de cuadrados residuales es un
estimador insesgado de 2 y los efectos principales pueden probarse mediante la
comparacin de MS A y de MS B contra MS Re sidual . Una prueba desarrollada por Tukey
(1949) resulta til para determinar si existe el efecto de interaccin. Este procedimiento
supone que la forma de la interaccin es particularmente simple, es decir:

( )ij = i j

En donde

es una constante desconocida.

Si se define la interaccin de esta forma, puede usarse el mtodo de regresin para


probar la significancia de ste trmino. La prueba consiste en descomponer la suma
de cuadrados residuales en un componente de un solo grado de libertad debido a la
no aditividad del modelo (interaccin) y en un componente para el error con:
(a 1)(b 1) 1 grados de libertad
Matemticamente se tiene:

a b

y..2
y
y
y

y
SS
+
SS
+
ij i. . j

..
A
B
ab
i =1 j =1

SS N =
abSS A SS B

con un grado de libertad, y

SS Error = SS Re sidual SS N
Con (a1)(b1)1 grados de libertad. Para probar la presencia de la interaccin debe
calcularse:

F0 =

SS Error

SS N
/ [ (a 1)(b 1) 1]

Si F0 > F ,1,( a 1)( b 1) 1 , la hiptesis de interaccin nula debe rechazarse.

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

4.- Extender el anlisis de la varianza bifactorial, desarrollado en el tema 6, al


caso de trifactorial.
Se considera el caso de diseos trifactoriales, donde hay tres factores A, B y C, con a,
b y c niveles, respectivamente, que influyen sobre la respuesta. El modelo estadstico
viene dado por:

yijkl = + i + j + k + ( )ij + ( )ik + ( ) jk + ( )ijk + ijkl


i = 1,..., a ; j = 1,..., b ; k = 1,..., c ; l = 1,..., n

con
Donde:

efecto medio general


i efecto del i-simo nivel del factor A
j efecto del j-simo nivel del factor B
k efecto del k-simo nivel del factor A
( )ij efecto de la interaccin entre i y j
( )ik efecto de la interaccin entre i y k
( ) jk efecto de la interaccin entre j y k
( )ijk efecto de la interaccin entre i , j y k
ijkl componentes de error aleatorio.

Suponemos el caso en que A, B y C son fijos, cada rplica del experimento contiene
todas las posibles combinaciones de tratamientos, es decir, contiene los abc
tratamientos posibles, luego se tiene abcn observaciones.
Es de inters contrastar la igualdad entre los efectos de los tratamientos del factor A, B
y C, adicionalmente, es importante contrastar si existen interacciones significativas
entre los tratamientos de dos o de los tres factores. Las hiptesis que normalmente
interesan contrastar son:

H 0 :1 = = a = 0
H 0 : 1 = = b = 0
H0 : 1 = = c = 0
H 0 : ( )ij = 0 i = 1,..., a

j = 1,..., b

H 0 : ( )ik = 0 i = 1,..., a k = 1,..., c


H 0 : ( ) jk = 0 j = 1,..., b k = 1,..., c
H 0 : ( )ijk = 0 i = 1,..., a

j = 1,..., b k = 1,..., c

frente a:

H1 : al menos existe un i con i 0


H1 : al menos existe un j con j 0
H1 : al menos existe un k con k 0
9

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

H1 : al menos existe un (i, j ) con ( )ij 0


H1 : al menos existe un (i, k ) con ( )ik 0
H1 : al menos existe un (j, k ) con ( ) jk 0
H1 : al menos existe un (i, j , k ) con ( )ijk 0
ANLISIS ESTADSTICO:

En la descomposicin de la variacin global en el modelo trifactorial de efectos fijos,


as como en la construccin de los estadsticos para el contraste de las hiptesis
anteriores, se considerar la siguiente notacin:
b

yi... = yijkl
j =1 k =1 l =1
c

i =1 k =1 l =1
b

k =1 l =1

y. jk . = yijkl

j =1 l =1

i =1 j =1 l =1

yi.k . = yijkl

yij.. = yijkl

y..k . = yijkl

y. j.. = yijkl

i =1 l =1

y.... = yijkl

yijk . = yijkl
l =1

i =1 j =1 k =1 l =1

La suma de cuadrados total se obtiene de la forma:


a

SST = y
i =1 j =1 k =1 l =1

SS Subtotales ( ABC )

2
ijkl

y....2

abcn

y....2
1 a b c 2
= yijk .
n i =1 j =1 k =1
abcn

Se tiene que:

SST = SS A + SS B + SSC + SS AB + SS AC + SS BC + SS ABC + SS E

SS Subtotales ( ABC ) = SS A + SS B + SSC + SS AB + SS AC + SS BC + SS ABC


Siendo:
Sumas de cuadrados de los efectos principales, con a-1, b-1 y c-1 grados de
libertad cada una, sus expresiones vienen dadas por:

y....2
1 b 2
SS B =
y. j.. abcn
acn j =1

y....2
1 a 2
SS A =
yi... abcn
bcn i =1

y....2
1 c 2
SSC =
y..k . abcn
abn k =1

Sumas de cuadrados debida a las interacciones entre AyB, AyC, y ByC, sus
expresiones vienen dadas por:
a

SS AB =
i =1 j =1

SS AC =
i =1 k =1
b

SS BC =
j =1 k =1

yij2..
cn

y....2
SS A SS B = SS Subtotales ( AB ) SS A SS B
abcn

yi2.k .
y2
.... SS A SSC = SS Subtotales ( AB ) SS A SSC
bn abcn
y.2jk .
an

y....2
SS B SSC = SS Subtotales ( AB ) SS B SSC
abcn
10

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY
Sumas de cuadrados debida a la interaccin entre los tres factores, A, B y C
tiene por expresin:
a

SS ABC =

2
yijk
.

i =1 j =1 k =1

y....2
SS A SS B SSC SS AB SS AC SS BC =
abcn

= SS Subtotales ( ABC ) SS A SS B SSC SS AB SS AC SS BC


Sumas de cuadrados debida al error, con abc(n-1) grados de libertad, su expresin
viene dada por:

SS E = SST SS Subtotales ( ABC )


La tabla del anlisis de varianza se presenta en el cuadro siguiente, las pruebas F
para los efectos principales y las interacciones se siguen directamente de los
cuadrados medios esperados:
FUENTE DE
VARIACIN

SUMA DE
CUADRADOS

GRADOS DE
LIBERTAD

CUADRADO
MEDIO

SS A

v1 = a 1

MS A =

SS A
a 1

F0 =

MS A
MS E

SS B

v1 = b 1

MS B =

SS B
b 1

F0 =

MS B
MS E

SSC

v1 = c 1

MSC =

SSC
c 1

F0 =

MSC
MS E

AB

SS AB

v1 = (a 1)(b 1)

MS AB =

SS AB
(a 1)(b 1)

F0 =

MS AB
MS E

AC

SS AC

v1 = (a 1)(c 1)

MS AC =

SS AC
(a 1)(c 1)

F0 =

MS AC
MS E

BC

SS BC

v1 = (b 1)(c 1)

MS BC =

SS BC
(b 1)(c 1)

F0 =

MS BC
MS E

ABC

SS ABC

v1 = (a 1)(b 1)(c 1)

Error

SS E

v2 = abc(n 1)

Total

SST

MS ABC =

SS ABC
(a 1)(b 1)(c 1)

MS E =

F0

F0 =

MS ABC
MS E

SS E
abc( n 1)

abcn-1

De los contrastes planteados, se rechaza la hiptesis nula a un nivel de significacin ,


cuando F0 > F ,v1 ,v2 .

11

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

En el cuadro siguiente tenemos los cuadrados medios esperados:


FUENTE DE
VARIACIN

CUADRADOS MEDIOS
ESPERADOS
a

E [ MS A ] = + bcn
2

i =1
b

E [ MS B ] = + acn
2

j =1
c

E [ MSC ] = 2 + abn
k =1

AB

i =1 j =1
a

AC

k2
c 1

(a 1)(b 1)

( )ik2
k =1 ( a 1)(c 1)
c

E [ MS BC ] = 2 + an
j =1 k =1

E [ MS ABC ] = + n

( ) 2jk
(b 1)(c 1)
2
( )ijk

i =1 j =1 k =1

Error

b 1

ABC

2j

E [ MS AC ] = 2 + bn
i =1

BC

a 1

( )ij2

E [ MS AB ] = + cn

i2

(a 1)(b 1)(c 1)

E [ MS E ] = 2

Bajo las hiptesis nulas planteadas, todas estas cantidades coinciden con la varianza

2 de la componente de error. En cambio, cuando dichas hiptesis no se cumplen la


magnitud de estas cantidades aumenta. De hecho, si se considera el cociente entre
cada una de las variabilidades debidas a los factores principales y las interacciones y
la media de cuadrados debida al error, se obtiene que dichos cocientes aumentan en
magnitud cuando nos alejamos de la hiptesis nula.

12

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

A2. TRABAJO
Elaborar un resumen sobre: Ajuste de curvas y superficies de respuesta.
1.- INTRODUCCIN
Resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo para
que el investigador cuente con una ecuacin que relacione la respuesta con el factor.
Esta ecuacin podra utilizarse para hacer interpolaciones, es decir, para predecir la
respuesta en niveles intermedios entre los factores, respecto de los que se utilizaron
realmente en el experimento. Cuando al menos dos de los factores son cuantitativos,
puede ajustarse una superficie de respuesta para predecir y con varias combinaciones
de los factores del diseo. En general, se usan mtodos de regresin lineal para
ajustar estos modelos a los datos experimentales. Se suele utilizar un paquete de
software para generar los modelos de regresin, como SPSS, R, etc.
Cabe destacar la metodologa de superficies de respuesta (RSM), como el enfoque de
optimizacin ms exitoso y generalizado. En general, se usan mtodos de regresin
lineal para ajustar estos modelos a los datos experimentales. Adems, los efectos de
los factores cuantitativos pueden representarse con efectos polinomiales con un solo
grado de libertad. De manera similar, es posible hacer la particin de las interacciones
de factores cuantitativos en componentes de interaccin con un solo grado de libertad.
El enfoque usual es utilizar el diseo de experimentos para determinar cules
variables estn influenciando la respuesta de inters. Una vez que dichas variables
son identificadas, se obtiene un estimado aproximado de la superficie de respuesta por
medio de modelos factoriales especiales. Esta superficie de respuesta se usa como
gua para variar gradualmente los factores controlables que afectan la respuesta de
manera tal que se mejore el valor de la respuesta. Una vez que el cambio de los
factores controlables no origine una mejora predecible en la variable de la respuesta,
se puede aplicar un mtodo de experimentacin ms sofisticado para encontrar la
superficie de respuesta operativa final del proceso de inters.
2.- AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA. MODELOS DE
PRIMER Y SEGUNDO ORDEN
Definicin:
La Metodologa para el Ajuste de Curvas y Superficies de Respuesta es un conjunto
de tcnicas matemticas y estadsticas utilizadas para modelar y analizar problemas
en los que una variable de inters es influenciada por otras.
El objetivo es optimizar la variable de inters. Esto se logra al determinar las
condiciones ptimas de operacin del sistema.
Definicin:
Los factores son las condiciones del proceso que influencian la variable de respuesta.
Estos pueden ser cuantitativos o cualitativos.

13

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Definicin:
La Respuesta, es una cantidad medible cuyo valor se ve afectado al cambiar los
niveles de los factores. El inters principal es optimizar dicho valor.
Al decir que un valor de respuesta Y depende de los niveles x1 ,..., xk de k
factores, A1 ,..., Ak , estamos diciendo que existe una funcin matemtica de

x1 ,..., xk (que llamaremos funcin de respuesta), cuyo valor para una combinacin
dada de los niveles de los factores corresponde a Y, es decir:

Y = f ( x1 ,..., xk )
La funcin de respuesta se puede representar con una ecuacin polinomial. El xito
depende de que la respuesta se pueda ajustar a un polinomio de primer o segundo
grado.
Supongamos que la funcin de respuesta para los niveles de dos factores se puede
expresar utilizando un polinomio de primer grado:

Y = 0 + 1 X 1 + 2 X 2
donde 0 , 1 y 2 son los coeficientes de regresin a estimar, X 1 y X 2 representan
los niveles de A1 y A2 respectivamente. Suponiendo que se recolectan N 3 valores
de respuesta (Y), con

 ,
 y
 se obtienen , y
los estimadores
0
1
2
0
1
2

respectivamente. Al remplazar los coeficientes de regresin por sus estimadores


obtenemos:

 +
 X +
 X
Y =
0
1
2
1
2
donde Y denota el valor estimado de Y dado por X 1 y X 2 .
La relacin Y = f ( X 1 ,..., X K ) entre Y y los niveles de los k factores A1 ,..., Ak
representa una superficie. Con k factores la superficie est en k+1 dimensiones. Por
ejemplo cuando se tiene Y = f ( X 1 ) la superficie esta en dos dimensiones:

Si tenemos Y = f ( X 1 , X 2 ) la superficie est en tres dimensiones:

14

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Nota:
La grfica de contornos facilita la visualizacin de la forma de una superficie de
respuesta en tres dimensiones. En sta las curvas de los valores iguales de respuesta
se grafican en un plano donde los ejes coordenados representan los niveles de los
factores. Cada curva representa un valor especfico de la altura de la superficie, es
decir un valor especfico de Y .
La regin experimental especifica la regin de valores para los niveles de los
factores. Esto se puede hacer empleando los niveles actuales de operacin para cada
factor, si se desea explorar el vecindario se incrementa y disminuye el valor del nivel
en una cantidad determinada.
2.1. - MODELOS DE PRIMER ORDEN
Generalmente se desconoce la relacin entre la respuesta y las variables
independientes, por ello requerimos un modelo que aproxime la relacin funcional
entre Y y las variables independientes. Si la respuesta se describe
adecuadamente por una funcin lineal de las variables independientes se utiliza el
modelo de primer orden (Cornell (1990)):

Y = 0 + 1 X 1 + + k X k +
Los parmetros del modelo se estiman mediante el mtodo de mnimos cuadrados.
Una vez que se tienen los estimadores se sustituyen en la ecuacin y obtenemos el
modelo ajustado (Cornell (1990)):

 +
 X + +
 X
Y =
0
1
k
1
k
Este modelo se utiliza cuando queremos estudiar el comportamiento de la variable
de respuesta nicamente en la regin y cuando no conocemos la forma de la
superficie.

15

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Prueba de la significancia de los coeficientes estimados en el modelo ajustado:


De acuerdo a Cornell (1990), para estimar los coeficientes se requieren
N k + 1 valores de respuesta (Y). Se necesita del siguiente anlisis de varianza:
La variacin total, suma de cuadrados total SST, se calcula de la forma:
N

SST = (Yi Y ) 2
i =1

Donde Yi es el valor i-simo observado.


La suma de cuadrados se compone por la suma de cuadrados debido a la regresin
y la suma de cuadrados no tomada en cuenta por el modelo ajustado. La frmula de
la suma de cuadrados debido a la regresin es (Cornell (1990)):
N

SS R = (Y i Y ) 2
i =1

La suma de cuadrados residual, se calcula de la siguiente forma (Cornell (1990)):


N

SS E = (Y i Yi ) 2
i =1

En
la
siguiente
tabla,
se
tiene
el
anlisis
en ella a representa el nmero de trminos del modelo ajustado:

de

FUENTE

GRADOS DE
LIBERTAD

SUMA DE
CUADRADOS

MEDIA DE
CUADRADOS

Regresin

a-1

SS R

SS R
a 1

Residuo

N-a

SS E

SS E
N a

Total

N-1

SST

varianza,

La prueba de significacin de la ecuacin de regresin ajustada tiene la siguiente


hiptesis nula:

H 0 : 0 = 1 = = k = 0
Contra la alternativa:

H1 : al menos existe un j con j 0


La prueba supone que el error se comporta normalmente, en sta se utiliza el
estadstico de prueba F, el cul se calcula de la forma:

SS R
SS ( N a )
F = a 1 = R
SS E
SS E (a 1)
N a

16

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Este se compara con una Fa 1, N a . Si F calculada excede este valor la hiptesis nula
se rechaza con un nivel de confianza .
Esto significa que la variacin explicada por el modelo es significativamente mayor
que la variacin inexplicable.
Adems de esta prueba se puede hacer un anlisis del ajuste del modelo con la R2,
que es la proporcin total de la variacin de las observaciones con respecto a la media
que se puede explicar con la ecuacin de regresin ajustada. Esta se calcula de la
siguiente manera:

R2 =

SS R
SST

Prueba de falta de ajuste:


La falta de ajuste se presenta por la no planaridad o la curvatura de la superficie de
respuesta. Requiere que el diseo del experimento satisfaga una serie de requisitos:
1. El nmero de los distintos puntos del diseo, n, debe exceder el nmero de
trminos en el modelo ajustado, es decir n > k + 1 .
2. Al menos 2 rplicas deben encontrarse en uno o ms puntos del diseo para
estimar la varianza del error.
Adems, los valores del error aleatorio, deben asumir una distribucin normal e
independiente con una varianza comn .
Al cumplirse las condiciones 1 y 2, la suma de cuadrados residual se compone de
dos fuentes de variacin. La primera es la falta de ajuste del modelo ajustado (debido
a la exclusin de trminos de mayor orden) y la segunda es la variacin del error puro.
Para calcularlas necesitamos la suma de cuadrados calculada de las rplicas que
recibe el nombre de error puro de la suma de cuadrados y sustraer de la suma de
cuadrados residual ste para obtener la suma de cuadrados de la falta de ajuste. Es
decir (Cornell (1990)):
2

rl

SS EPURO = (Yil Y l ) 2
l =1 i =1

Donde Yil es la i-sima observacin del l-simo punto del diseo, Y l es el promedio
de las rl observaciones del l-simo punto del diseo. Se tiene:

SS FALTA _ AJUSTE = SS E SS EPURO


n

SS FALTA _ AJUSTE = rl (Y l Y l ) 2


l =1

Y l es el valor predicho de la respuesta en el l-simo punto del diseo. La prueba de


adecuacin del modelo ajustado es:

SS FALTA _ AJUSTE
F=

na
SS EPURO
N n

SS FALTA _ AJUSTE ( N n)
SS EPURO (n a )
17

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

La hiptesis de suficiencia de ajuste con un nivel a de significancia se rechaza cuando


el valor calculado del estadstico es mayor a Fn a , N n , .
Cuando la F calculada no es mayor el cuadrado medio residual es utilizado para
estimar y para probar la significancia del modelo ajustado. Si hiptesis de
suficiencia de ajuste se rechaza, se debe de elevar el grado del modelo aumentando
2

trminos de producto cruzado y/o trminos de mayor grado en x1 ,..., xk . Si se


requieren puntos adicionales para estimar todos los coeficientes stos se aaden. Se
colectan los datos y se vuelve a hacer el anlisis.
Si no se rechaza la hiptesis podemos inferir que la superficie es plana. Una vez
que se tiene la ecuacin y se ha probado el ajuste se buscan niveles que mejoren los
valores de respuesta.
Mtodo de mxima pendiente en ascenso.
Frecuentemente la estimacin inicial de las condiciones de operacin ptimas est
alejada del ptimo real, en este caso se desea moverse rpidamente a la vecindad del
ptimo. El mtodo de mxima pendiente en ascenso es un procedimiento para
recorrer secuencialmente la trayectoria de la mxima pendiente, que nos lleva en
direccin del mximo aumento de la respuesta. Cuando se desea la minimizacin se
habla de mnima pendiente en descenso.
De acuerdo a Montgomery (1991), la direccin de ascenso mximo es en la que Y
aumenta ms rpido, sta es paralela a la normal de la superficie de respuesta
ajustada.
Los incrementos a lo largo de la trayectoria son proporcionales a los coeficientes de
regresin 0 , 1 , , k .
Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la
respuesta, entonces se ajusta un nuevo modelo de primer orden con el que se
determina una nueva trayectoria y se continua con el procedimiento. Finalmente, se
consigue llegar a la cercana del ptimo, esto ocurre cuando existe falta de ajuste del
modelo de primer orden.
2.2. - POLINOMIO DE SEGUNDO ORDEN
El modelo de segundo orden es el siguiente (Cornell (1990)):
k

i =1

i =1

Y = 0 + i X i + ii X i2 + + ij X i X j +
j =1 i < j

Los i son los coeficientes de regresin para los trminos de primer orden, los ii
son los coeficientes para los trminos cuadrticos puros, los ij son los coeficientes
para los trminos de producto cruzado y es el trmino del error aleatorio.
Los trminos cuadrticos puros y los de producto cruzados son de segundo orden. El
nmero de trminos en la ecuacin esta dado por:

18

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

a=

(k + 1)(k + 2)
2

Los parmetros del modelo se estiman mediante el mtodo de mnimos


cuadrados. Una vez que se tienen los estimadores se sustituye n en la ecuacin y
obtenemos el modelo ajustado en el vecindario del valor ptimo de la respuesta:
k

i =1

i =1

 +
Y =
 i X i +  ii X i2 + +  ij X i X j
0
j =1 i < j

La significancia de los coeficientes estimados y el ajuste del modelo se prueban con


el estadstico F, con la frmula ya vista anteriormente.
Una vez que se ha verificado que el modelo tiene suficiencia de ajuste y que los
coeficientes son significativos, se procede a localizar las coordenadas del punto
estacionario y se lleva a cabo un anlisis ms detallado del sistema de respuesta.
Localizacin del punto estacionario
Suponiendo que se desea maximizar la respuesta, el mximo (si es que existe), ser
el conjunto x1 ,..., xk tal que las derivadas parciales

Y
Y
= =
=0
x1
xk
Dicho punto, se denomina punto estacionario. El punto estacionario puede ser:
a) Un punto de respuesta mxima
b) Un punto de respuesta mnima
c) Un punto silla.
Podemos obtener el punto estacionario usando la notacin matricial para el modelo de
segundo orden (Montgomery (1991)):

 + x ' b + x ' Bx
Y =
0
donde:

x1

x
x= 2


xk

1


b= 2


k


11

21
B= 2

k1

 12

 22

 k 2
2

 1k

2
 2 k


kk

La derivada de Y con respecto al vector x igualada a cero es:

Y
= b + 2 Bx = 0
x
El punto estacionario es la solucin de la ecuacin es decir:
19

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

1
x0 = B 1b
2
Sustituyendo sta en la ecuacin matricial para el modelo de segundo orden, tenemos:

 + 1 x' b
Y 0 =
0
0
2
Caracterizacin de la superficie de respuesta
Encontrado el punto estacionario, es necesario caracterizar la superficie de respuesta,
es decir, determinar si se trata de un punto de respuesta mximo, mnimo o silla. La
forma directa de hacer esto es mediante la grfica de contornos del modelo ajustado,
sin embargo es til un anlisis ms formal.
3. DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA.
El ajuste y anlisis de una superficie de respuesta se facilita con la eleccin apropiada
de un diseo experimental.
Un diseo es el conjunto especfico de combinaciones de los niveles de las k variables
que se utilizar al llevar a cabo el experimento.
3.1 DISEOS PARA AJUSTAR MODELOS DE PRIMER ORDEN.

 , son
Una clase nica de diseos que minimizan la varianza de los coeficientes de
i
los diseos ortogonales de primer orden. Por ortogonal se entiende que los elementos
fuera de la diagonal de la matriz x ' x son iguales a cero, lo cual implica que los
productos cruzados de las columnas de la matriz x es igual a cero.
En esta clase de diseos ortogonales de primer orden se incluyen:
1. Diseos factoriales 2k
2. Fracciones de la serie 2k
3. Diseos simplex
4. Diseos Placket-Burman
3.2 DISEOS PARA AJUSTAR MODELOS DE SEGUNDO ORDEN.
Un diseo experimental para ajustar un modelo de segundo orden debe tener al
menos tres niveles de cada factor (-1, 0, +1). As como en el diseo de primer orden
se desea la ortogonalidad, en ste se desea que sea un diseo rotable. Se dice que un
diseo es rotable cuando la varianza de la respuesta predicha en algn punto es
funcin slo de la distancia del punto al centro y no es una funcin de la direccin.
Dentro de los diseos rotables de segundo orden se incluyen:
1. Diseo central compuesto
2. Diseo equirradial
3. Diseos Box-Behnken
Documentacin: Cornell (1990) y Montgomery (1991).

20

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

A3. ANLISIS DE DATOS

El modelo matemtico que planteamos es el siguiente:

yijk = + i + j + ( )ij + ijk


Con:

i = 1, 2

j = 1, 2, 3, 4,5

k = 1, 2

efecto medio general


i efecto del i-simo nivel del factor Tratamiento
j efecto del j-simo nivel del factor Material
( )ij efecto de la interaccin entre i y j
ijk componentes de error aleatorio.

Considerando los efectos fijos, se tiene:


a

i =1

=0 ;

j =1

=0 ;

( )
j =1

ij

=0 ;

( )
i =1

ij

=0

Realizamos el ejercicio utilizando el software SPSS, para ello utilizamos el archivo


ejercicio1.sav donde se recogen los datos del enunciado y en donde se definen las
variables EFEC_MATERIAL y EFEC_TRATAMIENTO como los efectos del problema y
la variable DESGASTE como variable dependiente.
Comenzamos en el men principal, Analizar/Modelo lineal general/ Univariante . Es
un modelo de dos factores donde se quiere estudiar la posible interaccin entre ambos
factores, por lo que se realiza el modelo completo donde aparezca dicha interaccin,
mediante esta accin se obtiene la siguiente tabla de ANOVA, en donde podemos
encontrar por una lado, las filas de , EFEC_MATERIAL, EFEC_TRATAMIENTO y
(EFEC_MATERIAL*EFEC_TRATAMIENTO) que corresponde a la variabilidad debida
a los efectos de cada uno de los factores y de la interaccin entre ambos.
Las preguntas que nos planteamos y que podemos dar respuesta con la tabla de
ANOVA obtenida son: Son los materiales igual de resistentes? Y los tratamientos
son igual de efectivos? La efectividad de los tratamientos, es la misma para todos los
materiales?.
Para ello observamos el valor del estadstico (Fexp= 0.541) que contrasta la hiptesis
correspondiente a la interaccin entre ambos factores:

21

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

H 0 : ( )ij = 0 i = 1, 2

j = 1, 2, 3, 4,5

Dicho valor deja a la derecha un Sig. = 0.71, mayor que el nivel de significacin 0.05.
Por lo tanto la interaccin entre ambos factores no es significativa y debemos
eliminarla del modelo.

Construimos de nuevo la Tabla ANOVA en la que slo figurarn los efectos principales.
Para ello en la ventana Univariante, pinchamos en Modelo e indicamos en la salida
correspondiente que es un modelo aditivo. Se obtiene la siguiente Tabla:

Esta tabla muestra dos nicas fuentes de variacin, los efectos principales de los dos
factores, y se ha suprimido la interaccin entre ambos. Se observa que el valor de la
Suma de Cuadrados del error de este modelo es de 74,2. Observando los valores de
los p-valores, 0.000 y 0.01 asociados a los contrastes principales, se deduce que los
dos efectos son significativos a un nivel de significacin del 5%. Deducimos que ni el
material utilizado es el mismo, ni la efectividad de los tratamientos, pero dicha
efectividad no depende del tipo de material con el que se trabaje ya que la interaccin
no es significativa.

22

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Con el fin de determinar qu material es el mejor utilizamos el mtodo de Tukey, para


ello en la ventana Univariante seleccionamos Post_hoc, se obtiene la siguiente tabla:

La tabla nos muestra tres subconjuntos homogneos, el primero est formado por los
materiales E y A; esto nos indica que no se aprecian diferencias significativas entre
ellos. El segundo subconjunto homogneo est formado por el material C y el tercero
por los materiales D y B, indicndonos, como en el primero caso que no hay
diferencias significativas entre estos dos tipos de materiales. Sin embargo si hay
diferencias significativas entre todos los subconjuntos, siendo los materiales D y
B significativamente ms efectivo que el resto (sus desgastes presentan cantidades de
44 y 45.25 respectivamente, superior a los obtenidos con los otros materiales).

ESTUDIO DE LOS RESIDUOS


En este apartado vamos a comprobar que se verifican los supuestos de normalidad,
homocedasticidad (igualdad de varianzas) y linealidad, estos supuestos resultan
necesarios para validar el diseo. Utilizaremos el anlisis de los residuos para realizar
los contrastes a posteriori de dichas hiptesis del modelo.
Normalidad
Podemos comprobarla de forma grfica o analticamente, grficamente podemos
estudiar el grfico probabilstico normal, Para obtener dicho grfico
seleccionamos Analizar/Estadsticos descriptivos/Grficos Q-Q... , obtenemos lo
siguiente:

23

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

El Grfico representa las funciones de distribucin terica y emprica de los residuos


tipificados. Desviaciones de los puntos del grfico respecto de la diagonal indican
alteraciones de la normalidad. Observamos la ubicacin de los puntos del grfico,
estos puntos se aproximan razonablemente bien a la diagonal lo que confirma la
hiptesis de normalidad. Lo conformamos de forma analstica mediante el contraste de
Kolmogorov-Smirnov:

Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.53) y el valor del pvalor asociado (0.942). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:

24

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Los residuos son independientes, puesto que el grfico correspondiente a la relacin


entre los valores pronosticados y los residuos tipificados no muestran ninguna pauta
de variacin sistemtica. Por otro lado, podemos confirmar la homogeneidad de las
varianzas puesto que, como se observa en el grfico, la dispersin de los residuos
tipificados es similar a lo largo de todos los valores pronosticados, no apreciamos
tendencia clara en este grfico, los residuos no presentan estructura definida respecto
de los valores predichos por el modelo por lo que no debemos rechazar la hiptesis de
homocedasticidad.
Luego, podemos confirmar que se cumplen las hiptesis de idoneidad del modelo.

25

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

El modelo matemtico que planteamos es el siguiente:

yijk = + i + j + ( )ij + ijk


Con:

i = 1, 2

j = 1, 2,3

k = 1, 2,...,10

efecto medio general


i efecto del i-simo nivel del factor Antigedad
j efecto del j-simo nivel del factor Tamao Departamento
( )ij efecto de la interaccin entre i y j
ijk componentes de error aleatorio.

Considerando los efectos fijos, se tiene:


a

i = 0 ;
i =1

j = 0 ;
j =1

( )ij = 0 ;
j =1

( )
i =1

ij

=0

Realizamos el ejercicio utilizando el software SPSS, para ello utilizamos el archivo


ejercicio2.sav donde se recogen los datos del enunciado y en donde se definen las
variables EFEC_ANTIG y EFEC_DEPART como los efectos del problema y la variable
ABSENTISMO como variable dependiente.
Comenzamos en el men principal, Analizar/Modelo lineal general/ Univariante . Es
un modelo de dos factores donde se quiere estudiar la posible interaccin entre ambos
factores, por lo que se realiza el modelo completo donde aparezca dicha interaccin,
mediante esta accin se obtiene la siguiente tabla de ANOVA, en donde podemos
encontrar por una lado, las filas de , EFEC_ANTIG, EFEC_DEPART y
(EFEC_ANTIG*EFEC_DEPART) que corresponde a la variabilidad debida a los
efectos de cada uno de los factores y de la interaccin entre ambos.
Observamos el valor del estadstico correspondiente a la interaccin entre ambos
factores es Fexp= 2.192 que contrasta la hiptesis correspondiente a la interaccin
entre ambos factores:

H 0 : ( )ij = 0 i = 1, 2

j = 1, 2,3

Dicho valor deja a la derecha un Sig. = 0.122, mayor que el nivel de significacin 0.05.
Por lo tanto la interaccin entre ambos factores no es significativa y debemos
eliminarla del modelo.

26

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Construimos de nuevo la Tabla ANOVA en la que slo figurarn los efectos principales.
Para ello en la ventana Univariante, pinchamos en Modelo e indicamos en la salida
correspondiente que es un modelo aditivo. Se obtiene la siguiente Tabla:

Esta tabla muestra dos nicas fuentes de variacin, los efectos principales de los dos
factores, y se ha suprimido la interaccin entre ambos. Se. Observando los valores de
los p-valores, 0.000 y 0.014 asociados a los contrastes principales, se deduce que los
dos efectos son significativos a un nivel de significacin del 5%. Deducimos as que la
interaccin entre la antigedad y el tamao de los departamentos no es significativa.
Con el fin de determinar qu Departamento influye ms en el absentismo, utilizamos el
mtodo de Tukey, para ello en la ventana Univariante seleccionamos Post_hoc, se
obtiene la siguiente tabla:

La tabla nos muestra dos subconjuntos homogneos, el primero est formado por los
Departamentos pequeos y medianos; esto nos indica que no se aprecian diferencias
significativas entre ellos. El segundo subconjunto homogneo est formado por el
Departamento grande, indicndonos, que hay diferencias significativas entre los
subconjuntos, siendo el Departamento grande significativamente ms efectivo que el
resto (su absentismo es de 11.05, superior a los obtenidos con los otros
departamentos de 2.45 y 5 respectivamente).
27

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

ESTUDIO DE LOS RESIDUOS


En este apartado vamos a comprobar que se verifican los supuestos de normalidad,
homocedasticidad (igualdad de varianzas) y linealidad, estos supuestos resultan
necesarios para validar el diseo. Utilizaremos el anlisis de los residuos para realizar
los contrastes a posteriori de dichas hiptesis del modelo.
Normalidad
Podemos comprobarla de forma grfica o analticamente, grficamente podemos
estudiar el grfico probabilstico normal, Para obtener dicho grfico
seleccionamos Analizar/Estadsticos descriptivos/Grficos Q-Q... , obtenemos lo
siguiente:

El Grfico representa las funciones de distribucin terica y emprica de los residuos


tipificados. Desviaciones de los puntos del grfico respecto de la diagonal indican
alteraciones de la normalidad. Observamos la ubicacin de los puntos del grfico,
estos puntos se aproximan razonablemente bien a la diagonal lo que confirma la
hiptesis de normalidad. Lo conformamos de forma analstica mediante el contraste de
Kolmogorov-Smirnov:

28

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.721) y el valor del
p-valor asociado (0.676). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:

Los residuos son independientes, puesto que el grfico correspondiente a la relacin


entre los valores pronosticados y los residuos tipificados no muestran ninguna pauta
de variacin sistemtica. Por otro lado, podemos confirmar la homogeneidad de las
varianzas puesto que, como se observa en el grfico, la dispersin de los residuos
tipificados es similar a lo largo de todos los valores pronosticados, no apreciamos
tendencia clara en este grfico, los residuos no presentan estructura definida respecto
de los valores predichos por el modelo por lo que no debemos rechazar la hiptesis de
homocedasticidad.
Luego, podemos confirmar que se cumplen las hiptesis de idoneidad del modelo.

29

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

El modelo matemtico que planteamos es el siguiente:

yijk = + i + j + ( )ij + ijk


Con:

i = 1, 2,3

j = 1, 2,3

k = 1, 2,3, 4

efecto medio general


i efecto del i-simo nivel del factor Material
j efecto del j-simo nivel del factor Temperatura
( )ij efecto de la interaccin entre i y j
ijk componentes de error aleatorio.

Considerando los efectos fijos, se tiene:


a

i = 0 ;
i =1

j = 0 ;
j =1

( )ij = 0 ;
j =1

( )
i =1

ij

=0

Realizamos el ejercicio utilizando el software SPSS, para ello utilizamos el archivo


ejercicio3.sav donde se recogen los datos del enunciado y en donde se definen las
variables EFEC_MATERIAL y EFEC_TEMP como los efectos del problema y la
variable DURACION_BAT como variable dependiente.
Comenzamos en el men principal, Analizar/Modelo lineal general/ Univariante . Es
un modelo de dos factores donde se quiere estudiar la posible interaccin entre ambos
factores, por lo que se realiza el modelo completo donde aparezca dicha interaccin,
mediante esta accin se obtiene la siguiente tabla de ANOVA, en donde podemos
encontrar por una lado, las filas de , EFEC_MATERIAL, EFEC_TEMP y
(EFEC_MATERIAL * EFEC_TEMP) que corresponde a la variabilidad debida a los
efectos de cada uno de los factores y de la interaccin entre ambos:

30

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Observamos en el cuadro anterior los valores obtenidos de los estadsticos y p-valores


correspondiente a los contrastes con hiptesis nulas:

H 0 :1 = = 3 = 0
H 0 : 1 = = 3 = 0

H 0 : ( )ij = 0 i = 1, 2,3

j = 1, 2,3

Todos los p-valores obtenidos son menores que el nivel de significacin 0,05. Por lo
tanto se rechazan las hiptesis nulas anteriores y todos son significativos para el
modelo. Deducimos as que la interaccin entre el material y la temperatura es
significativa.
Con el fin de determinar qu Material influye ms en el tiempo de duracin, utilizamos
el mtodo de Tukey, para ello en la ventana Univariante seleccionamos Post_hoc,
se obtiene la siguiente tabla:

La tabla nos muestra dos subconjuntos homogneos, el primero est formado por los
Materiales 1 y 2; esto nos indica que no se aprecian diferencias significativas entre
ellos. El segundo subconjunto homogneo est formado por el 2 y 3, indicndonos,
31

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

que hay diferencias significativas entre los materiales 1 y 3, siendo el material 3


significativamente ms efectivo que el resto (su tiempo de duracin es de 125.08,
superior a los obtenidos con los otros materiales).
Con el fin de determinar qu Temperatura influye ms en el tiempo de duracin,
utilizamos el mtodo de Tukey, para ello en la ventana Univariante seleccionamos
Post_hoc, se obtiene la siguiente tabla:

La tabla nos muestra tres subconjuntos homogneos, el primero est formado por la
temperatura de 125 grados, el segundo subconjunto homogneo est formado por la
temperatura de 70 grados y el ltimo subconjunto por la de 15 grados, indicndonos,
que hay diferencias significativas entre las tres temperaturas, siendo la temperatura de
15 grados significativamente ms efectiva que el resto (su tiempo de duracin es de
144.83, superior a los obtenidos con las otras temperaturas).
Para realizar un estudio de la interaccin conjunta de los dos factores representamos
el grfico de perfil:

32

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Aparecen representadas las medias en horas de la duracin de las bateras,


calculadas en cada subgrupo resultante de combinar cada nivel de la variable material
con cada nivel de la variable temperatura. En la grfica queda claro que el nmero
medio de hora es mayor cuando la temperatura es de 15, siendo mayor para el
material 2, por el contrario el menor nmero de horas lo presenta la temperatura 125 y
menor an para el material 2. Este grfico nos proporciona informacin del significado
de esta interaccin
ESTUDIO DE LOS RESIDUOS
En este apartado vamos a comprobar que se verifican los supuestos de normalidad,
homocedasticidad (igualdad de varianzas) y linealidad, estos supuestos resultan
necesarios para validar el diseo. Utilizaremos el anlisis de los residuos para realizar
los contrastes a posteriori de dichas hiptesis del modelo.
Normalidad
Podemos comprobarla de forma grfica o analticamente, grficamente podemos
estudiar el grfico probabilstico normal, Para obtener dicho grfico
seleccionamos Analizar/Estadsticos descriptivos/Grficos Q-Q... , obtenemos lo
siguiente:

El Grfico representa las funciones de distribucin terica y emprica de los residuos


tipificados. Desviaciones de los puntos del grfico respecto de la diagonal indican
alteraciones de la normalidad. Observamos la ubicacin de los puntos del grfico,
estos puntos se aproximan razonablemente bien a la diagonal lo que confirma la
hiptesis de normalidad. Lo conformamos de forma analstica mediante el contraste de
Kolmogorov-Smirnov:

33

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.631) y el valor del
p-valor asociado (0.821). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:

Los residuos son independientes, puesto que el grfico correspondiente a la relacin


entre los valores pronosticados y los residuos tipificados no muestran ninguna pauta
de variacin sistemtica. Por otro lado, podemos confirmar la homogeneidad de las
varianzas puesto que, como se observa en el grfico, la dispersin de los residuos
34

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

tipificados es similar a lo largo de todos los valores pronosticados, no apreciamos


tendencia clara en este grfico, los residuos no presentan estructura definida respecto
de los valores predichos por el modelo por lo que no debemos rechazar la hiptesis de
homocedasticidad.
Luego, podemos confirmar que se cumplen las hiptesis de idoneidad del modelo.

Consideremos la misma situacin anterior pero ahora los datos son incompletos
puesto que slo tenemos disponible una muestra aleatoria, vamos a trabajar en el
SPSS pero ahora con el tipo IV para las sumas de cuadrados se obtiene los mismos
resultados.
Comenzamos en el men principal, Analizar/Modelo lineal general/ Univariante . Es
un modelo de dos factores donde se quiere estudiar la posible interaccin entre ambos
factores, por lo que se realiza el modelo completo donde aparezca dicha interaccin,
mediante esta accin se obtiene la siguiente tabla de ANOVA, en donde podemos
encontrar por una lado, las filas de , EFEC_MATERIAL, EFEC_TEMP y
(EFEC_MATERIAL * EFEC_TEMP) que corresponde a la variabilidad debida a los
efectos de cada uno de los factores y de la interaccin entre ambos:

Observamos en el cuadro anterior que los valores obtenidos son los mismos que en el
ejercicio 3, por lo que:
Todos los p-valores obtenidos son menores que el nivel de significacin 0,05. Por lo
tanto se rechazan las hiptesis nulas anteriores y todos son significativos para el
modelo. Deducimos as que la interaccin entre el material y la temperatura es
significativa.

35

DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA


- MASTER EN ESTADSTICA APLICADA AUTORA: CARMEN MARA SNCHEZ CAMPOY

Las conclusiones que obtengamos son las mismas que para el ejercicio 3, con lo cual
llegamos a la conclusin que podemos trabajar con muestras aleatorias simples para
hacer inferencia sobre datos de los que no conocemos todos los valores que los
compone.

36