Professional Documents
Culture Documents
Actividad 6
Tema6
PROFESORES:
SS subtotales =
yij2.
y...2
n abn
i =1 j =1
( y
a
ijk
i =1 j =1 k =1
a
y...
+ yijk y ij .
i =1 j =1 k =1
= bn y i.. y...
i =1
+ an y. j . y ...
j =1
+ n y ij . y i.. y. j . + y...
i =1 j =1
SST = SS A + SS B + SS AB + SS E
Siendo:
Suma de cuadrados totales: con abn-1 grados de libertad, su expresin viene dada
por:
y...2
SST = y
abn
i =1 j =1 k =1
a
2
ijk
Sumas de cuadrados de los efectos principales, con a-1 y b-1 grados de libertad
cada una, sus expresiones vienen dadas por:
y...2
1 b 2
SS B =
y. j. abn
an j =1
1 a 2 y...2
SS A = yi..
bn i =1
abn
SS AB =
i =1 j =1
yij2.
y...2
1 a 2 1 b 2
yi.. y. j .
n bn i =1
an j =1
abn
2
SS E = yijk
i =1 j =1 k =1
1 a b 2
yij.
n i =1 j =1
Para obtener otra expresin, consideramos la suma de cuadrados entre los totales de
las ab celdas, a la que se denomina suma de cuadrados debida a los "subtotales" y
cuya frmula viene dada en el enunciado:
a
SS subtotales =
i =1 j =1
yij2.
y...2
n abn
Entonces:
a
SS subtotales SS A SS B =
i =1 j =1
=
i =1 j =1
yij2.
n
yij2.
n
y...2 1 a 2 y...2 1 b 2
y...2
yi..
=
. j.
abn bn i =1
abn an j =1
abn
y...2
1 a 2 1 b 2
y
= SS AB
i.. an
. j.
bn i =1
abn
j =1
Luego:
SS AB = SS subtotales SS A SS B
Si hacemos un sistema de ecuaciones con las dos expresiones de las sumas de
cuadrados que hemos obtenido, obtenemos que:
SS AB = SS subtotales SS A SS B
SST = SS A + SS B + SS AB + SS E
Sustituyendo SS AB en la segunda ecuacin:
SS AB = SSsubtotales SS A SS B
SS E = SST SS subtotales
nbD 2
=
2a 2
naD 2
2 =
2b 2
2
nD 2
=
2 2 [ (a 1)(b 1) + 1]
2
(1)
(2)
(3)
donde D denota la diferencia entre dos efectos medios del factor A (ecuacin (1)),
entre dos efectos medios del factor B (ecuacin (2)) y entre dos efectos medios
del factor de interaccin (ecuacin (3)). La curva operativa se obtiene
representando la probabilidad de aceptar la hiptesis nula frente a los diferentes
tamaos muestrales, para un error tipo I, = 0, 05 en este caso. Considerar
diferentes valores de los parmetros a y b que determinan los grados de libertad
del numerador y denominador en las ecuaciones anteriores.
Para determinar el tamao de la muestra (es decir, el nmero de rplicas, n) apropiado
en un diseo factorial de dos factores, podemos hacer uso de las curvas de operacin
3
caracterstica. Estas curvas se utilizan del mismo modo que las tablas de las
distribuciones. Fijados unos parmetros se busca el valor deseado de la respuesta, en
este caso el tamao de la muestra. Las podemos encontrar dibujadas en los
apndices de ciertos libros (por ejemplo: apndice V del libro de Douglas C.
Montgomery).
Esencialmente, para calcular el tamao de la muestra se necesita fijar el nivel de
significacin = 0, 05 , el tamao del efecto y la potencia deseada. En el caso de las
curvas de operacin los parmetros son: el nivel de significacin, los grados de
libertad 1 (grados de libertad del numerador) y 2 (grados de libertad del error) y del
parmetro .
2
Una forma de emplear estas curvas consiste en encontrar el valor menor de que
corresponde a una diferencia especificada entre las medias de dos tratamientos
cualesquiera:
2
nbD 2
=
2a 2
2
2 =
naD 2
2b 2
2 =
nD 2
2 2 [ (a 1)(b 1) + 1]
donde D denota la diferencia entre dos efectos medios del factor de interaccin
FACTOR
GRADOS DE LIBERTAD
DEL NUMERADOR
GRADOS DE LIBERTAD
DEL DENOMINADOR
a-1
ab(n-1)
b-1
ab(n-1)
(a-1)(b-1)
ab(n-1)
nb i2
i =1
na 2j
j =1
b
a
AB
n ( )ij2
i =1 j =1
[ (a 1)(b 1) + 1]
2
Ejemplo:
Para ilustrar con un ejemplo, como podemos obtener el tamao muestral mediante el
uso de estas curvas podemos poner un ejemplo, para un caso en el que consideramos
la expresin (1) de las curvas de operacin caracterstica, una desviacin tpica de 5,
un valor de D=8 y en el que los parmetros a y b toman el valor de 3, en tal caso, se
tendra que:
nbD 2 n382
=
=
= 1, 28n = 1, 28n
2a 2 2352
v1 = a 1 = 2 Grados de libertad del numerador
2
= 1, 6
v1 = 2
v2 = 9(n 1) = 9
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.45
(buscamos que esta probabilidad sea pequea).
= 1,96
-Para n=3:
v1 = 2
v2 = 9(n 1) = 18
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.18
(buscamos que esta probabilidad sea an ms pequea).
= 2, 26
-Para n=4:
v1 = 2
v2 = 9(n 1) = 27
Lo que implica una probabilidad de aceptar la hiptesis nula de 0.06
(podemos aceptar esta probabilidad).
Podemos concluir que con 4 rplicas se obtiene una sensitividad deseada.
Para terminar con el ejercicio terico-prctico, presentamos un cuadro donde
consideramos diferentes valores de los parmetros a y b que determinan los grados de
libertad del numerador y denominador y que pueden servir para futuros ejemplos como
el anterior:
Para a=2 y b=3:
GRADOS DE LIBERTAD
NUMERADOR
FACTOR
nbD 2
=
2a 2
naD 2
=
2b 2
AB
2 =
nD 2
2 2 [ (a 1)(b 1) + 1]
GRADOS DE LIBERTAD
DENOMINADOR
6
12
18
6
12
18
6
12
18
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
FACTOR
GRADOS DE LIBERTAD
NUMERADOR
2 =
nbD 2
2a 2
2 =
naD 2
2b 2
nD 2
2 2 [ (a 1)(b 1) + 1]
AB
2 =
GRADOS DE LIBERTAD
DENOMINADOR
12
24
36
12
24
36
12
24
36
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
(n=2)
(n=3)
(n=4).....
yij = + i + j + ( )ij + ij
Con:
i = 1,..., a
j = 1,..., b
i =1
=0
j =1
=0
En un experimento de dos factores con una sola rplica, es decir, en los que slo hay
una observacin por celda, se tendra este modelo con ab observaciones.
Ahora bien, al examinar los cuadrados medios esperados, se observa que la varianza
2
del error no es estimable, es decir, que el efecto de la interaccin de los dos
factores ( )ij y el error experimental no pueden separarse de alguna manera obvia.
Por este motivo, no se cuenta con pruebas para los efectos principales a menos que el
efecto de la interaccin sea cero. Luego entonces, ( )ij = 0 para cualquier valor de i
y j.
Consecuente con lo anterior, tenemos que un experimento de dos factores, con una
sola rplica, es decir, en los que slo hay una observacin por celda, tiene por
modelo estadstico plausible:
yij = + i + j + ij
i = 1,..., a
j = 1,..., b
H 0 : 1 = = a = 0
H 0 : 1 = = b = 0
H 0 : ( )ij = 0 i = 1,..., a
j = 1,..., b
yi. = yij
j =1
y. j = yij
i =1
y.. = yij
i =1 j =1
SUMA DE CUADRADOS
y2 y2
SS A = i. ..
ab
i =1 b
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
CUADRADO MEDIO
ESPERADO
a
SS B =
j =1
MS A
a-1
2 +
b i2
b
y.2j
y2
..
a ab
MS B
b-1
2 +
a
Residual o AB
Sustraccin
Total
(a-1)(b-1)
y..2
SST = y
ab
i =1 j =1
a
i =1
a 1
MS Re sidual
2 +
a j2
j =1
b 1
b
( )
i =1 j =1
2
ij
(a 1)(b 1)
2
ij
ab-1
Se tiene que:
SST = SS A + SS B + SS Re sidual
Si el modelo es apropiado, entonces la media de cuadrados residuales es un
estimador insesgado de 2 y los efectos principales pueden probarse mediante la
comparacin de MS A y de MS B contra MS Re sidual . Una prueba desarrollada por Tukey
(1949) resulta til para determinar si existe el efecto de interaccin. Este procedimiento
supone que la forma de la interaccin es particularmente simple, es decir:
( )ij = i j
En donde
a b
y..2
y
y
y
y
SS
+
SS
+
ij i. . j
..
A
B
ab
i =1 j =1
SS N =
abSS A SS B
SS Error = SS Re sidual SS N
Con (a1)(b1)1 grados de libertad. Para probar la presencia de la interaccin debe
calcularse:
F0 =
SS Error
SS N
/ [ (a 1)(b 1) 1]
con
Donde:
Suponemos el caso en que A, B y C son fijos, cada rplica del experimento contiene
todas las posibles combinaciones de tratamientos, es decir, contiene los abc
tratamientos posibles, luego se tiene abcn observaciones.
Es de inters contrastar la igualdad entre los efectos de los tratamientos del factor A, B
y C, adicionalmente, es importante contrastar si existen interacciones significativas
entre los tratamientos de dos o de los tres factores. Las hiptesis que normalmente
interesan contrastar son:
H 0 :1 = = a = 0
H 0 : 1 = = b = 0
H0 : 1 = = c = 0
H 0 : ( )ij = 0 i = 1,..., a
j = 1,..., b
j = 1,..., b k = 1,..., c
frente a:
yi... = yijkl
j =1 k =1 l =1
c
i =1 k =1 l =1
b
k =1 l =1
y. jk . = yijkl
j =1 l =1
i =1 j =1 l =1
yi.k . = yijkl
yij.. = yijkl
y..k . = yijkl
y. j.. = yijkl
i =1 l =1
y.... = yijkl
yijk . = yijkl
l =1
i =1 j =1 k =1 l =1
SST = y
i =1 j =1 k =1 l =1
SS Subtotales ( ABC )
2
ijkl
y....2
abcn
y....2
1 a b c 2
= yijk .
n i =1 j =1 k =1
abcn
Se tiene que:
y....2
1 b 2
SS B =
y. j.. abcn
acn j =1
y....2
1 a 2
SS A =
yi... abcn
bcn i =1
y....2
1 c 2
SSC =
y..k . abcn
abn k =1
Sumas de cuadrados debida a las interacciones entre AyB, AyC, y ByC, sus
expresiones vienen dadas por:
a
SS AB =
i =1 j =1
SS AC =
i =1 k =1
b
SS BC =
j =1 k =1
yij2..
cn
y....2
SS A SS B = SS Subtotales ( AB ) SS A SS B
abcn
yi2.k .
y2
.... SS A SSC = SS Subtotales ( AB ) SS A SSC
bn abcn
y.2jk .
an
y....2
SS B SSC = SS Subtotales ( AB ) SS B SSC
abcn
10
SS ABC =
2
yijk
.
i =1 j =1 k =1
y....2
SS A SS B SSC SS AB SS AC SS BC =
abcn
SUMA DE
CUADRADOS
GRADOS DE
LIBERTAD
CUADRADO
MEDIO
SS A
v1 = a 1
MS A =
SS A
a 1
F0 =
MS A
MS E
SS B
v1 = b 1
MS B =
SS B
b 1
F0 =
MS B
MS E
SSC
v1 = c 1
MSC =
SSC
c 1
F0 =
MSC
MS E
AB
SS AB
v1 = (a 1)(b 1)
MS AB =
SS AB
(a 1)(b 1)
F0 =
MS AB
MS E
AC
SS AC
v1 = (a 1)(c 1)
MS AC =
SS AC
(a 1)(c 1)
F0 =
MS AC
MS E
BC
SS BC
v1 = (b 1)(c 1)
MS BC =
SS BC
(b 1)(c 1)
F0 =
MS BC
MS E
ABC
SS ABC
v1 = (a 1)(b 1)(c 1)
Error
SS E
v2 = abc(n 1)
Total
SST
MS ABC =
SS ABC
(a 1)(b 1)(c 1)
MS E =
F0
F0 =
MS ABC
MS E
SS E
abc( n 1)
abcn-1
11
CUADRADOS MEDIOS
ESPERADOS
a
E [ MS A ] = + bcn
2
i =1
b
E [ MS B ] = + acn
2
j =1
c
E [ MSC ] = 2 + abn
k =1
AB
i =1 j =1
a
AC
k2
c 1
(a 1)(b 1)
( )ik2
k =1 ( a 1)(c 1)
c
E [ MS BC ] = 2 + an
j =1 k =1
E [ MS ABC ] = + n
( ) 2jk
(b 1)(c 1)
2
( )ijk
i =1 j =1 k =1
Error
b 1
ABC
2j
E [ MS AC ] = 2 + bn
i =1
BC
a 1
( )ij2
E [ MS AB ] = + cn
i2
(a 1)(b 1)(c 1)
E [ MS E ] = 2
Bajo las hiptesis nulas planteadas, todas estas cantidades coinciden con la varianza
12
A2. TRABAJO
Elaborar un resumen sobre: Ajuste de curvas y superficies de respuesta.
1.- INTRODUCCIN
Resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo para
que el investigador cuente con una ecuacin que relacione la respuesta con el factor.
Esta ecuacin podra utilizarse para hacer interpolaciones, es decir, para predecir la
respuesta en niveles intermedios entre los factores, respecto de los que se utilizaron
realmente en el experimento. Cuando al menos dos de los factores son cuantitativos,
puede ajustarse una superficie de respuesta para predecir y con varias combinaciones
de los factores del diseo. En general, se usan mtodos de regresin lineal para
ajustar estos modelos a los datos experimentales. Se suele utilizar un paquete de
software para generar los modelos de regresin, como SPSS, R, etc.
Cabe destacar la metodologa de superficies de respuesta (RSM), como el enfoque de
optimizacin ms exitoso y generalizado. En general, se usan mtodos de regresin
lineal para ajustar estos modelos a los datos experimentales. Adems, los efectos de
los factores cuantitativos pueden representarse con efectos polinomiales con un solo
grado de libertad. De manera similar, es posible hacer la particin de las interacciones
de factores cuantitativos en componentes de interaccin con un solo grado de libertad.
El enfoque usual es utilizar el diseo de experimentos para determinar cules
variables estn influenciando la respuesta de inters. Una vez que dichas variables
son identificadas, se obtiene un estimado aproximado de la superficie de respuesta por
medio de modelos factoriales especiales. Esta superficie de respuesta se usa como
gua para variar gradualmente los factores controlables que afectan la respuesta de
manera tal que se mejore el valor de la respuesta. Una vez que el cambio de los
factores controlables no origine una mejora predecible en la variable de la respuesta,
se puede aplicar un mtodo de experimentacin ms sofisticado para encontrar la
superficie de respuesta operativa final del proceso de inters.
2.- AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA. MODELOS DE
PRIMER Y SEGUNDO ORDEN
Definicin:
La Metodologa para el Ajuste de Curvas y Superficies de Respuesta es un conjunto
de tcnicas matemticas y estadsticas utilizadas para modelar y analizar problemas
en los que una variable de inters es influenciada por otras.
El objetivo es optimizar la variable de inters. Esto se logra al determinar las
condiciones ptimas de operacin del sistema.
Definicin:
Los factores son las condiciones del proceso que influencian la variable de respuesta.
Estos pueden ser cuantitativos o cualitativos.
13
Definicin:
La Respuesta, es una cantidad medible cuyo valor se ve afectado al cambiar los
niveles de los factores. El inters principal es optimizar dicho valor.
Al decir que un valor de respuesta Y depende de los niveles x1 ,..., xk de k
factores, A1 ,..., Ak , estamos diciendo que existe una funcin matemtica de
x1 ,..., xk (que llamaremos funcin de respuesta), cuyo valor para una combinacin
dada de los niveles de los factores corresponde a Y, es decir:
Y = f ( x1 ,..., xk )
La funcin de respuesta se puede representar con una ecuacin polinomial. El xito
depende de que la respuesta se pueda ajustar a un polinomio de primer o segundo
grado.
Supongamos que la funcin de respuesta para los niveles de dos factores se puede
expresar utilizando un polinomio de primer grado:
Y = 0 + 1 X 1 + 2 X 2
donde 0 , 1 y 2 son los coeficientes de regresin a estimar, X 1 y X 2 representan
los niveles de A1 y A2 respectivamente. Suponiendo que se recolectan N 3 valores
de respuesta (Y), con
,
y
se obtienen , y
los estimadores
0
1
2
0
1
2
+
X +
X
Y =
0
1
2
1
2
donde Y denota el valor estimado de Y dado por X 1 y X 2 .
La relacin Y = f ( X 1 ,..., X K ) entre Y y los niveles de los k factores A1 ,..., Ak
representa una superficie. Con k factores la superficie est en k+1 dimensiones. Por
ejemplo cuando se tiene Y = f ( X 1 ) la superficie esta en dos dimensiones:
14
Nota:
La grfica de contornos facilita la visualizacin de la forma de una superficie de
respuesta en tres dimensiones. En sta las curvas de los valores iguales de respuesta
se grafican en un plano donde los ejes coordenados representan los niveles de los
factores. Cada curva representa un valor especfico de la altura de la superficie, es
decir un valor especfico de Y .
La regin experimental especifica la regin de valores para los niveles de los
factores. Esto se puede hacer empleando los niveles actuales de operacin para cada
factor, si se desea explorar el vecindario se incrementa y disminuye el valor del nivel
en una cantidad determinada.
2.1. - MODELOS DE PRIMER ORDEN
Generalmente se desconoce la relacin entre la respuesta y las variables
independientes, por ello requerimos un modelo que aproxime la relacin funcional
entre Y y las variables independientes. Si la respuesta se describe
adecuadamente por una funcin lineal de las variables independientes se utiliza el
modelo de primer orden (Cornell (1990)):
Y = 0 + 1 X 1 + + k X k +
Los parmetros del modelo se estiman mediante el mtodo de mnimos cuadrados.
Una vez que se tienen los estimadores se sustituyen en la ecuacin y obtenemos el
modelo ajustado (Cornell (1990)):
+
X + +
X
Y =
0
1
k
1
k
Este modelo se utiliza cuando queremos estudiar el comportamiento de la variable
de respuesta nicamente en la regin y cuando no conocemos la forma de la
superficie.
15
SST = (Yi Y ) 2
i =1
SS R = (Y i Y ) 2
i =1
SS E = (Y i Yi ) 2
i =1
En
la
siguiente
tabla,
se
tiene
el
anlisis
en ella a representa el nmero de trminos del modelo ajustado:
de
FUENTE
GRADOS DE
LIBERTAD
SUMA DE
CUADRADOS
MEDIA DE
CUADRADOS
Regresin
a-1
SS R
SS R
a 1
Residuo
N-a
SS E
SS E
N a
Total
N-1
SST
varianza,
H 0 : 0 = 1 = = k = 0
Contra la alternativa:
SS R
SS ( N a )
F = a 1 = R
SS E
SS E (a 1)
N a
16
Este se compara con una Fa 1, N a . Si F calculada excede este valor la hiptesis nula
se rechaza con un nivel de confianza .
Esto significa que la variacin explicada por el modelo es significativamente mayor
que la variacin inexplicable.
Adems de esta prueba se puede hacer un anlisis del ajuste del modelo con la R2,
que es la proporcin total de la variacin de las observaciones con respecto a la media
que se puede explicar con la ecuacin de regresin ajustada. Esta se calcula de la
siguiente manera:
R2 =
SS R
SST
rl
SS EPURO = (Yil Y l ) 2
l =1 i =1
Donde Yil es la i-sima observacin del l-simo punto del diseo, Y l es el promedio
de las rl observaciones del l-simo punto del diseo. Se tiene:
SS FALTA _ AJUSTE
F=
na
SS EPURO
N n
SS FALTA _ AJUSTE ( N n)
SS EPURO (n a )
17
i =1
i =1
Y = 0 + i X i + ii X i2 + + ij X i X j +
j =1 i < j
Los i son los coeficientes de regresin para los trminos de primer orden, los ii
son los coeficientes para los trminos cuadrticos puros, los ij son los coeficientes
para los trminos de producto cruzado y es el trmino del error aleatorio.
Los trminos cuadrticos puros y los de producto cruzados son de segundo orden. El
nmero de trminos en la ecuacin esta dado por:
18
a=
(k + 1)(k + 2)
2
i =1
i =1
+
Y =
i X i + ii X i2 + + ij X i X j
0
j =1 i < j
Y
Y
= =
=0
x1
xk
Dicho punto, se denomina punto estacionario. El punto estacionario puede ser:
a) Un punto de respuesta mxima
b) Un punto de respuesta mnima
c) Un punto silla.
Podemos obtener el punto estacionario usando la notacin matricial para el modelo de
segundo orden (Montgomery (1991)):
+ x ' b + x ' Bx
Y =
0
donde:
x1
x
x= 2
xk
1
b= 2
k
11
21
B= 2
k1
12
22
k 2
2
1k
2
2 k
kk
Y
= b + 2 Bx = 0
x
El punto estacionario es la solucin de la ecuacin es decir:
19
1
x0 = B 1b
2
Sustituyendo sta en la ecuacin matricial para el modelo de segundo orden, tenemos:
+ 1 x' b
Y 0 =
0
0
2
Caracterizacin de la superficie de respuesta
Encontrado el punto estacionario, es necesario caracterizar la superficie de respuesta,
es decir, determinar si se trata de un punto de respuesta mximo, mnimo o silla. La
forma directa de hacer esto es mediante la grfica de contornos del modelo ajustado,
sin embargo es til un anlisis ms formal.
3. DISEOS EXPERIMENTALES PARA AJUSTAR SUPERFICIES DE RESPUESTA.
El ajuste y anlisis de una superficie de respuesta se facilita con la eleccin apropiada
de un diseo experimental.
Un diseo es el conjunto especfico de combinaciones de los niveles de las k variables
que se utilizar al llevar a cabo el experimento.
3.1 DISEOS PARA AJUSTAR MODELOS DE PRIMER ORDEN.
, son
Una clase nica de diseos que minimizan la varianza de los coeficientes de
i
los diseos ortogonales de primer orden. Por ortogonal se entiende que los elementos
fuera de la diagonal de la matriz x ' x son iguales a cero, lo cual implica que los
productos cruzados de las columnas de la matriz x es igual a cero.
En esta clase de diseos ortogonales de primer orden se incluyen:
1. Diseos factoriales 2k
2. Fracciones de la serie 2k
3. Diseos simplex
4. Diseos Placket-Burman
3.2 DISEOS PARA AJUSTAR MODELOS DE SEGUNDO ORDEN.
Un diseo experimental para ajustar un modelo de segundo orden debe tener al
menos tres niveles de cada factor (-1, 0, +1). As como en el diseo de primer orden
se desea la ortogonalidad, en ste se desea que sea un diseo rotable. Se dice que un
diseo es rotable cuando la varianza de la respuesta predicha en algn punto es
funcin slo de la distancia del punto al centro y no es una funcin de la direccin.
Dentro de los diseos rotables de segundo orden se incluyen:
1. Diseo central compuesto
2. Diseo equirradial
3. Diseos Box-Behnken
Documentacin: Cornell (1990) y Montgomery (1991).
20
i = 1, 2
j = 1, 2, 3, 4,5
k = 1, 2
i =1
=0 ;
j =1
=0 ;
( )
j =1
ij
=0 ;
( )
i =1
ij
=0
21
H 0 : ( )ij = 0 i = 1, 2
j = 1, 2, 3, 4,5
Dicho valor deja a la derecha un Sig. = 0.71, mayor que el nivel de significacin 0.05.
Por lo tanto la interaccin entre ambos factores no es significativa y debemos
eliminarla del modelo.
Construimos de nuevo la Tabla ANOVA en la que slo figurarn los efectos principales.
Para ello en la ventana Univariante, pinchamos en Modelo e indicamos en la salida
correspondiente que es un modelo aditivo. Se obtiene la siguiente Tabla:
Esta tabla muestra dos nicas fuentes de variacin, los efectos principales de los dos
factores, y se ha suprimido la interaccin entre ambos. Se observa que el valor de la
Suma de Cuadrados del error de este modelo es de 74,2. Observando los valores de
los p-valores, 0.000 y 0.01 asociados a los contrastes principales, se deduce que los
dos efectos son significativos a un nivel de significacin del 5%. Deducimos que ni el
material utilizado es el mismo, ni la efectividad de los tratamientos, pero dicha
efectividad no depende del tipo de material con el que se trabaje ya que la interaccin
no es significativa.
22
La tabla nos muestra tres subconjuntos homogneos, el primero est formado por los
materiales E y A; esto nos indica que no se aprecian diferencias significativas entre
ellos. El segundo subconjunto homogneo est formado por el material C y el tercero
por los materiales D y B, indicndonos, como en el primero caso que no hay
diferencias significativas entre estos dos tipos de materiales. Sin embargo si hay
diferencias significativas entre todos los subconjuntos, siendo los materiales D y
B significativamente ms efectivo que el resto (sus desgastes presentan cantidades de
44 y 45.25 respectivamente, superior a los obtenidos con los otros materiales).
23
Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.53) y el valor del pvalor asociado (0.942). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:
24
25
i = 1, 2
j = 1, 2,3
k = 1, 2,...,10
i = 0 ;
i =1
j = 0 ;
j =1
( )ij = 0 ;
j =1
( )
i =1
ij
=0
H 0 : ( )ij = 0 i = 1, 2
j = 1, 2,3
Dicho valor deja a la derecha un Sig. = 0.122, mayor que el nivel de significacin 0.05.
Por lo tanto la interaccin entre ambos factores no es significativa y debemos
eliminarla del modelo.
26
Construimos de nuevo la Tabla ANOVA en la que slo figurarn los efectos principales.
Para ello en la ventana Univariante, pinchamos en Modelo e indicamos en la salida
correspondiente que es un modelo aditivo. Se obtiene la siguiente Tabla:
Esta tabla muestra dos nicas fuentes de variacin, los efectos principales de los dos
factores, y se ha suprimido la interaccin entre ambos. Se. Observando los valores de
los p-valores, 0.000 y 0.014 asociados a los contrastes principales, se deduce que los
dos efectos son significativos a un nivel de significacin del 5%. Deducimos as que la
interaccin entre la antigedad y el tamao de los departamentos no es significativa.
Con el fin de determinar qu Departamento influye ms en el absentismo, utilizamos el
mtodo de Tukey, para ello en la ventana Univariante seleccionamos Post_hoc, se
obtiene la siguiente tabla:
La tabla nos muestra dos subconjuntos homogneos, el primero est formado por los
Departamentos pequeos y medianos; esto nos indica que no se aprecian diferencias
significativas entre ellos. El segundo subconjunto homogneo est formado por el
Departamento grande, indicndonos, que hay diferencias significativas entre los
subconjuntos, siendo el Departamento grande significativamente ms efectivo que el
resto (su absentismo es de 11.05, superior a los obtenidos con los otros
departamentos de 2.45 y 5 respectivamente).
27
28
Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.721) y el valor del
p-valor asociado (0.676). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:
29
i = 1, 2,3
j = 1, 2,3
k = 1, 2,3, 4
i = 0 ;
i =1
j = 0 ;
j =1
( )ij = 0 ;
j =1
( )
i =1
ij
=0
30
H 0 :1 = = 3 = 0
H 0 : 1 = = 3 = 0
H 0 : ( )ij = 0 i = 1, 2,3
j = 1, 2,3
Todos los p-valores obtenidos son menores que el nivel de significacin 0,05. Por lo
tanto se rechazan las hiptesis nulas anteriores y todos son significativos para el
modelo. Deducimos as que la interaccin entre el material y la temperatura es
significativa.
Con el fin de determinar qu Material influye ms en el tiempo de duracin, utilizamos
el mtodo de Tukey, para ello en la ventana Univariante seleccionamos Post_hoc,
se obtiene la siguiente tabla:
La tabla nos muestra dos subconjuntos homogneos, el primero est formado por los
Materiales 1 y 2; esto nos indica que no se aprecian diferencias significativas entre
ellos. El segundo subconjunto homogneo est formado por el 2 y 3, indicndonos,
31
La tabla nos muestra tres subconjuntos homogneos, el primero est formado por la
temperatura de 125 grados, el segundo subconjunto homogneo est formado por la
temperatura de 70 grados y el ltimo subconjunto por la de 15 grados, indicndonos,
que hay diferencias significativas entre las tres temperaturas, siendo la temperatura de
15 grados significativamente ms efectiva que el resto (su tiempo de duracin es de
144.83, superior a los obtenidos con las otras temperaturas).
Para realizar un estudio de la interaccin conjunta de los dos factores representamos
el grfico de perfil:
32
33
Esta tabla muestra la mayor diferencia entre los resultados esperados en caso de que
los residuos surgieran de una distribucin normal y los valores observados. Se
distingue entre la mayor diferencia en valor absoluto, la mayor diferencia positiva y la
mayor diferencia negativa. Se muestra el valor del estadstico Z (0.631) y el valor del
p-valor asociado (0.821). Por lo tanto no se puede rechazar la hiptesis de normalidad
de los residuos.
Homocedasticidad e Independencia
Mediante la grfico de los residuos:
Consideremos la misma situacin anterior pero ahora los datos son incompletos
puesto que slo tenemos disponible una muestra aleatoria, vamos a trabajar en el
SPSS pero ahora con el tipo IV para las sumas de cuadrados se obtiene los mismos
resultados.
Comenzamos en el men principal, Analizar/Modelo lineal general/ Univariante . Es
un modelo de dos factores donde se quiere estudiar la posible interaccin entre ambos
factores, por lo que se realiza el modelo completo donde aparezca dicha interaccin,
mediante esta accin se obtiene la siguiente tabla de ANOVA, en donde podemos
encontrar por una lado, las filas de , EFEC_MATERIAL, EFEC_TEMP y
(EFEC_MATERIAL * EFEC_TEMP) que corresponde a la variabilidad debida a los
efectos de cada uno de los factores y de la interaccin entre ambos:
Observamos en el cuadro anterior que los valores obtenidos son los mismos que en el
ejercicio 3, por lo que:
Todos los p-valores obtenidos son menores que el nivel de significacin 0,05. Por lo
tanto se rechazan las hiptesis nulas anteriores y todos son significativos para el
modelo. Deducimos as que la interaccin entre el material y la temperatura es
significativa.
35
Las conclusiones que obtengamos son las mismas que para el ejercicio 3, con lo cual
llegamos a la conclusin que podemos trabajar con muestras aleatorias simples para
hacer inferencia sobre datos de los que no conocemos todos los valores que los
compone.
36