Professional Documents
Culture Documents
Muchos experimentos se llevan a cabo para estudiar los efectos producidos por
dos o ms factores. Ningn factor se considera extrao; todos tienen el mismo
inters. En el experimento factorial o arreglo factorial, se investigan todas las
posibles combinaciones de los niveles de los factores en cada ensayo completo o
rplica del experimento. El experimento factorial afecta al diseo de tratamientos,
que se refiere a la eleccin de los factores a estudiar, sus niveles y la combinacin
de ellos.
Razones para estudiar conjuntamente varios factores
(2.1)
Con la cual se quiere decidir si los tratamientos son iguales estadsticamente en
cuanto a sus medias, frente a la alternativa de que al menos dos de ellos son
diferentes. La estrategia natural para resolver este problema es obtener una
muestra representativa de mediciones en cada uno de los tratamientos, y construir
un estadstico de prueba para decidir el resultado de dicha comparacin
Se podra pensar que una forma de probar la hiptesis nula de la expresin (2.1)
es mediante la prueba T de Student aplicadas a todos los posibles pares de
medias; sin embargo, esta manera de proceder incrementara de manera
considerable el error tipo I (rechazar H0 siendo verdadera).
El diseo estadstico de experimentos es precisamente la forma ms eficaz de
hacer pruebas. El diseo de experimentos consiste en determinar cules pruebas
se deben realizar y de qu manera, para obtener datos que, al ser analizados
estadsticamente, proporcionen evidencias objetivas que permitan responder las
interrogantes planteadas, y de esa manera clarificar los aspectos inciertos de un
Al analizar los resultados del experimento se obtienen las pautas a seguir, que
muchas veces se concretan en mejoras sustanciales del proceso. En este sentido,
experimentar es mejor que sentarse a esperar a que el proceso nos indique por s
solo cmo mejorarlo. El diseo de experimentos es un conjunto de tcnicas
activas, en el sentido de que no esperan que el proceso mande las seales tiles,
sino que ste se manipulan para que proporcione la informacin que se requiere
para su mejora.
El saber diseo de experimentos y otras tcnicas estadsticas, en combinacin
con conocimientos del proceso, sitan al responsable del mismo como un
observador perceptivo y proactivo que es capaz de proponer mejoras y de
observar algo interesante (oportunidades de mejora) en el proceso y en los datos
donde otra persona no ve nada.
que
se prueba con
la
tcnica estadstica llamada Anlisis de Varianza (ANOVA)con uno, dos, tres o
cuatro criterios de clasificacin, dependiendo del nmero de factores de bloques
incorporados al diseo.
a0 b1
a1
a2
b0 b1
b0 b1
a1 b0
a1 b1
a2b0
a2 b1 } tratamientos
a0 b0
a0 b1
a1 b0
a1 b1
a1b0
a2 b1
1
2
3
4
6
Donde
verdadero del
es el efecto
variables aleatorias
varianza constante
Estimacin de Parmetros
Al aplicar el mtodo de mnimos cuadrados se obtienen los estimadores de los
parmetros
Anlisis de Varianza
La tabla de ANOVA para este caso est dada por:
Tabla 1. ANOVA para un factorial de dos factores en un DCA
Causa de
Grados de
Suma
Cuadra
Cuadrado Medio
8
variacin
libertad
de
cuadrad
os
dos
medios
CM
C
M
esperado
C
M
B
CM
C
M
C
M
AB
CM
C
M
C
M
Error
experime
ntal
CM
Total
Para el factor A:
donde
y
es
la
media
poblacional
Como
del
y si
es la media global
nivel
es cierta
y como
que
Para el factor B:
donde
media
poblacional
del
nivel
es
la
media
es la
global.
10
Como
como
si
es
cierta
que son
y
, por ello se utiliza como prueba
para probar la
hiptesis. Esta estadstica de prueba debe tomar valores estadsticamente
cercanos a uno cuando
es cierta.
Para la interaccin de los factores
Como
cierta
si
es
Primero se deben obtener los residuales, los cuales para el caso de dos factores
se determina de la siguiente manera:
1. El residual es dado por
11
2. La respuesta estimada
es
42
45
64
56
39
46
61
55
45
50
62
39
55
59
43
58
60
Resistencia
caracterstica a 48
compresin fck
(Mpa)
43
44
12
Normalidad
Independencia
Para los que queris saber qu ha pasado con nuestro experimento con las
amasadas, os dir que que el ANOVA di como resultado el rechazo de la
igualdad de medias, es decir, que la resistencia media se ve afectada por la
dosificacin. Sin embargo, las cuatro dosificaciones no son igual de efectivas,
pues existen diferencias significativas entre las resistencias medias de cada una
de ellas. De hecho, las dosificaciones A y B no presentan diferencias significativas
entre s, tampoco entre la C y la D, sin embargo, entre ambos grupos s que hay
diferencias significativas. Asimismo, se ha podido comprobar que se cumplieron
los supuestos de normalidad, varianza constante e independencia.
DISEOS COMPLETAMENTE ALEATORIOS
Se supone que el experimentador cuenta con los resultados de k muestras
aleatorias independientes, cada una de tamao n, de k diferentes poblaciones
(datos relativos a k tratamientos, k grupos, k mtodos de produccin, etc.).
13
Interesa probar la hiptesis de que las medias de esas k poblaciones son todas
iguales.
Se denota a la j-sima observacin de la i-sima muestra por y ij. El esquema
general para un criterio de clasificacin es:
Medias
Muestra
1
Muestra
2
.
Muestra i
.
Muestra
k
y11
y12
y1j
y1n
y21
y22
y2j
y 2n
yi1
yi2
yij
yin
yk1
yk2
ykj
ykn
i 1
14
i 1
i 1
1
k
k k
i 1
n 1
y
ij
i
j 1
Cada una de las varianzas mustrales si2 est basada en (n-1) grados de libertad
y entonces
est basada en k.(n-1) grados de libertad.
Por otro lado, la varianza de las k medias mustrales est dada por:
15
son estimaciones
, exceda la varianza
Demostracin:
16
i1 j 1
k
y y y y
ij
i
i
.
i 1 j1
i 1 j1
k
2
y y 2
ij
i 1
y y
i
y y
ij i
n
j1
2 y y y y
y y
ij
ij
i 1
y y
i
.
y y
i .
y como:
n
j1
y y
ij
i
SST
y
ij
.
i 1 j 1
SS ( Tr )
k 1
SSE
k ( n 1)
17
Grado
s
de
Liberta
d
k-1
Suma
de
Cuadra
dos
SS(Tr)
k.(n-1)
n.k-1
SSE
SST
Media Cuadrada
MS(Tr)=SS(Tr)/
MS(Tr)/M
(k-1)
SE
MSE=SSE/k.(n-1)
.
2
5
.
1
8
.
1
9
.
2
3
.27 .22 .
3
0
.28 .21 .
2
3
.25 .27 .
2
4
.30 .28 .
2
8
.
2
7
.
2
5
.
1
8
.
2
4
.
2
8
.
2
0
.
2
6
.
3
4
.32 .
2
4
.27 .
1
9
.28 .
2
4
.20 .
1
8
Total
11.6
9
Del que se quiere probar que las medias obtenidas por cada uno de ellos es
significativamente igual (Hiptesis Nula) con =0.05. Construir una Tabla de
anlisis de varianza.
Para facilitar clculos, se utilizan las frmulas:
k
SST
i1 j1
yij
SS ( Tr)
Ti C
i 1
Demostracin:
18
y y
ij
SST
i1 j 1
k
yij
i 1 j 1
1
2 y ( k n )
.
( k n )
( k n )
i 1 j 1
( k n )
2
y k n y
ij
i1 j 1
i1 j1
2
y
2
y
2
yij kn
i 1 j1
2
k n y
2
yij 2 yijy.
y y
ij
.
ij
1
k n
i1 j1
ij
2
yij C
SST
i1 j1
i 1
SS( Tr)
i 1
SS( Tr)
i 1
j1
i1
yi y .
2
2
y ( n k) y
i 1
C
ij
1
n
yi
ij
j 1
2 y
.
2
y k y
i 1
2
Ti C
i 1
k n
i 1 j 1
yij
Ti
yij
j 1
Grado
s
de
Liberta
d
3
Suma
de
Cuadra
dos
0.0130
Media Cuadrada
0.0043
2.87
44
47
0.0679
0.0809
0.0015
Ya que F (2.87) excede a F0.05= 2.82, se rechaza la Hiptesis Nula, luego los
laboratorios no estn logrando resultados consistentes.
20
NI
1.65
1.72
1.50
1.35
1.60
7.84
1.568
1.70
1.85
1.46
2.05
1.80
8.86
1.772
1.40
1.75
1.38
1.65
1.55
7.73
1.546
21
2.10
1.95
1.65
1.88
2.00
9.58
1.916
TOTAL: N = 20
Antes de realizar el anlisis de varianza se debe trazar el diagrama de cajas
mltiple para determinar si existen casos extraordinarios y si se cumple el
supuesto de varianzas iguales:
g.l.
Trat.
4- 1=3
Suma
cuadrados
de Cuadrados
medios
Fcalculada
Ftablas
"Planta
s"
Error
20- 4=1
6
20- 1=1
9
Total
22
Conclusin: Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay
diferencia significativa (al 5%) entre las cantidades medias de contaminantes para
las diferentes plantas.
PRUEBA DE DIFERENCIA SIGNIFICATIVA MNIMA (DSM).DE FISHER
Cuando el anlisis de varianza indica la existencia de una diferencia significativa
se desea conocer cul de los pares de medias causa la diferencia. Cuando las
muestras son de igual tamao la Diferencia Significativa Mnima (DSM) de Fisher
nos ayuda a localizar esta fuente.
La Diferencia Significativa Mnima (DSM) se define como la diferencia mnima que
podra existir entre dos medias de muestras significativamente diferentes. Para
obtener la frmula para la DSM, se usa la prueba t de Student para la diferencia
entre dos medias cuando las varianzas no son diferentes cuyo estadstico de
contraste es:
Donde
, es decir,
del ejemplo 1 se
del ejemplo
23
0.204
0.022
0.348
0.226
0.144
0.370
Como se puede observar, las diferencias que exceden (DSM) estn entre las
medias
de m 3.
, y
Es importante tener presente que la prueba DSM slo se debe emplear cuando
el ANOVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamao no se debe usar DSM.
[13.7]
Ejemplo 3: Para los datos del ejemplo 1 y a = 0.05,
del ejemplo 1 se
del ejemplo 1
24
0.204
0.022
0.348
0.226
0.144
0.370
Como se puede observar, las diferencias que exceden (DSH) estn entre las
medias
de m 3.
, y
Es importante tener presente que la prueba DSH slo se debe emplear cuando
el ANDEVA ha conducido al rechazo de H0. Si las muestras no son del mismo
tamao no se debe usar DSH.
25
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del
error de 141.6, los grados de libertad del error son 48 - 8 =40.
Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:
El rango entre las medias mxima y mnima se compara con D8, esto
es,
7.
, entonces
Nuevamente stos exceden D6, entonces stos se subdividen en subconjuntos de
cinco medias
, entonces
, entonces
, entonces
, entonces
Como las medias para las grasas 3, 2, 6 y 1 estn incluidos en el conjunto 43261
que fue no significativo, los rangos de las medias en el subconjunto 3261 no se
comparan con D4; solamente los rangos de las medias en el subconjunto 2615 se
comparan con D4; por lo tanto,
, entonces
Los otros subconjuntos de cuatro medias (3, 2, 6,1) y (6, 1, 5,3) no se comparan
con D4 porque ya fueron declarados no significativos en los conjuntos de cinco
medias. Por lo tanto, el proceso termina.
Los resultados se muestran grficamente en la siguiente figura, donde las medias
que estn debajo de una lnea no son significativamente diferentes.
El investigador puede concluir que las cantidades absorbidas usando las grasas 4
y 3 son significativamente mayores que las 5, 8 y 7, y que la 2 es
significativamente mayor que las 8 y 7 y las dems grasas no son
significativamente diferentes en relacin con la cantidad absorbida.
PRUEBA DE DUNNETT
En muchos experimentos uno de los tratamientos es el control, y el investigador
est interesado en comparar cada una de las otras K- 1 medias de los
tratamientos contra el control, por lo tanto, existen K- 1 comparaciones. Un
procedimiento para realizar estas comparaciones es la prueba de Dunnett
(desarrollada en 1964). Si se supone que el control es el tratamiento a, entonces
se desea probar las hiptesis
27
,
donde la constante
se busca en la tabla T-10. Observe que f es el nmero
de grados de libertad del error y a es el nivel de significacin asociado con todos
las K- 1 pruebas y utilizado en el anlisis de varianza.
28
Esta prueba es similar a la prueba de Tukey, difiere de ella en que en vez de usar
la tabla T-8 para obtener valores "studentizados" q utiliza la tabla F de Fisher (T-7)
para obtener el factor
donde K es el nmero
de tratamientos y a el nivel de
significacin.
Este factor
Si la diferencia entre cualquier par de medias excede este valor se dice que hay
diferencia significativa entre las medias comparadas. Las diferencias entre las
ocho medias se muestran en la siguiente tabla.
Tabla Valores absolutos de las diferencias entre
del ejemplo 4
13
20
23
24
10
17
20
21
13
16
17
29
11
14
15
10
11
En este ejemplo todas las diferencias entre los pares de medias son menores que
27.3, por lo que no hay diferencia significativa entre los pares de grasas.
NOTA: Todas las pruebas estudiadas para comparar pares de medias requieren
que todos los tratamientos tengan el mismo nmero de observaciones n. Algunos
autores, entre ellos Snedecor y Cochran, han recomendado usar la media
armnica nh entre los tamaos de muestra nj cuando el nmero de observaciones
no es el mismo. Aparentemente esta aproximacin no altera el error de Tipo I.
Veamos
Recordemos que el modelo que se espera describa los datos en el DCA
est dada por:
IJ =
Y +Ti+ ij
Donde:
Y IJ
: es la media global
Ti: es el efecto del tratamiento i
ij: representa el error asociado con la observacin Yij
Cuando se realiza el ANOVA, y slo cuando ste resulta significativo,
entonces se procede a estimar el modelo ajustado o modelo de trabajo
dado por:
31
32
Figura 2.3 Grafica de la varianza constante para los cuatro tipos de cuero
Independencia
La suposicin de independencia en los residuos puede verificarse si se grafica el
orden en que se colect un dato contra el residuo correspondiente. De esta
manera, si al graficar en el eje horizontal el tiempo (orden de corrida) y en el eje
vertical los residuos, se detecta una tendencia o patrn no aleatorio claramente
definido, esto es evidencia de que existe una correlacin entre los errores y, por lo
tanto, el supuesto de independencia no se cumple. Si el comportamiento de los
puntos es aleatorio dentro de una banda horizontal, el supuesto se est
cumpliendo. La violacin de este supuesto generalmente indica deficiencias en la
planeacin y ejecucin del experimento; asimismo, puede ser un indicador de que
no se aplic en forma correcta el principio de aleatorizacin, o de que conforme se
fueron realizando las pruebas experimentales aparecieron factores que afectaron
la respuesta observada. Por ello, en caso de tener problemas con este supuesto,
las conclusiones que se obtienen del anlisis son endebles y por ello es mejor
revisar lo hecho y tratar de investigar por qu no se cumpli con ese supuesto de
independencia, a fin de reconsiderar la situacin
33
34
El valor de n arrojado por esta frmula dar una idea del nmero de rplicas por
tratamiento, de acuerdo con las consideraciones iniciales que se reflejan a travs
de (K,n0, , dt), y sobre todo por el nmero total de corridas experimentales, n,
que es lo que muchas veces interesa ms al experimentador debido a los costos y
tiempos. Si N est fuera del presupuesto se podrn revisar algunas
consideraciones y quiz pensar en un nmero menor de tratamientos. Al aplicar
esta expresin al caso de los cuatro mtodos del ensamble obtenemos con un
nivel se significancia del 0,05:
K= 4
n0= 5
= 1,5
dt= 2
= 0,05
Por lo tanto n=5 se debera utilizar como tamao de muestra (nmero de pruebas
por tratamiento).
35
36
Minitab
En la hoja de clculo que despliega Minitab capturar nuestra tabla de
datos indicando sus correspondientes rtulos en la primera fila que no
est numerada.
En el cintillo superior indicar con el mouse Estadsticas.
Del men desplegado seleccionar ANOVA, en el men desplegado
seleccionar Un solo factor (Desapilado) y dar clic con el mouse.
37
38
Si queremos las grficas del supuesto del modelo entonces, damos clic
a grficas (antepenltima ventana) y sealamos tres en uno y damos
clic en aceptar
39
70
130
74
155
180
34
80
40
75
20
82
70
58
150
159
188
126
126
106
122
115
25
58
70
45
138
168
110
160
174
150
120
139
96
82
104
60
Tipo de
material
125
40
Grado
s de
libertad
Suma de
cuadrados
Cuadrados
medios
Tipo
de 2
material
Temperatur 2
a
Interaccin 4
10633.167
Error
experimental
17980
5316,58333
3
19541,5833
3
2359,41666
7
665,953703
7
27
39083.167
9437.66
ValorP
Ftabla
0.0018884
8
1.6944E07
0.0189730
6
3.35
F
7.98
29.3
4
3.54
3.35
2.727
7
Total
37
77134.75
De la tabla de Anova se puede observar que al nivel de significacin de 0.05 todas
las causa de variacin resultan significativas, pero no se debe tener encuenta para
el anlisis los factores individuales sino la interaccin, ya que esta interaccin nos
41
dice que la repuesta se potencia cuando se combinan los niveles de los factores y
no cuando se aplican por separado. Por tanto lo que sigue en el anlisis es aplicar
los procedimiento de comparacin mltiple para los niveles de tipo de material en
cada nivel de temperatura.
Derecho
I. Caminos
48
37
24
18
37
43
19
13
31
29
16
40
40
26
21
31
24
22
24
51
35
31
26
36
38
10
30
49
33
13
24
39
41
25
24
36
39
12
12
11
15
24
55
16
21
35
40
30
26
Solucin:
Se calcula la media y desviacin tpica de cada una de las facultades y del
total:
42
'
'
scT
(facultad)
=
= 10
4
i=1
+ 12
+ 15
4
i=1
i
2
+ 13
+
2
= 4101 33
'
La tabla ANOVA es
ij
eij2 =
ij
+ ... +
=
+
+ ... +
+ ... +
+ ... +
= 2553 47
'
31 44 =
'
46
<
46
<
46
= 62 83
'
44
40 64 =
<
'
<
= 81 22
'
n-I
- 1 68 = t
'
<
46
46
<t
= 1 68
'
46
35 4 2 36 . 1 68 = 35 4 3 96 =
'
'
'
'
'
IC
IC
- 1 68 = t
'
46
<
n-I
46
<t
46
= 1 68
'
45
16 65 3 19 . 1 68 = 16 65 5 36 =
'
'
'
'
'
Figura 4.27. Grfico de cajas mltiple para los datos del problema 2.8.
46
Figura 4.28. Grfico de medias condicionadas para los datos del problema 2.8.
47
Oper.1.
Oper.2.
Oper.3.
Oper. 4.
Oper.5.
72
75
78
69
65
75
70
79
65
60
71
77
84
61
63
69
73
72
75
68
67
79
83
70
70
71
77
77
68
64
75
72
80
67
62
73
78
83
63
64
69
73
71
76
69
65
69
85
72
62
Solucin:
De donde
48
scT(operador)
5
i=1
4
i=1
= 10
= 1224 2.
'
Finalmente, se obtiene la
La tabla ANOVA es
que el factor operador es significativo, esto es, hay variabilidad entre los
diferentes operadores.
Se estiman las varianzas del modelo:
49
Figura 4.30. Grfico de cajas mltiple para los datos del problema 2.9.
50
Figura 4.32. Grfico de residuos frente a predicciones para los datos del
problema 2.9.
ELECCIN DE MUESTRA
En un lote de frascos para medicina, con una poblacin de 8000 unidades, se
desea estimar la media de la capacidad en centmetros cbicos de los mismos.
A travs de un premuestreo de tamao 35 se ha estimado que la desviacin
estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms3,
y un nivel de significancia del 5% . De que tamao debe de ser la muestra?
DATOS:
S = 2 cms3 ; N = 8000 ; d = 0.25 cms3 ; a = 0.05 (5%)
Za/2= 1.96
N Za/2S
8000(1.96)(2)
8000(0.25) + (1.96)(2)
Solo faltara muestrear 203 frascos, pues los datos de los 35 frascos del
premuestreo siguen siendo vlidos.
de un censo de los registros puede llevar mucho tiempo. Cullen (1994) realizo una
muestra de los 580 nios a los que da servicio una clnica familiar, en Auckland
para estimar la proporcin de inters.
Que tamao de muestra sera necesario con una muestra aleatoria simple (sin
reemplazo) para estimar la proporcin con el 95% de confianza y un margen de
error de 0.10 .
DATOS:
N = 580 Nios
En realidad, Cullen realizo una muestra aleatoria simple con reemplazo de tamao
120, de los cuales 27 resultaron como no retrasados para la vacuna. De un
intervalo de confianza al 95% para la proporcion de nios no retrasados.
Solucin:
Za/2 pq
1500 (1.96)(0.5)(0.5)
n = ----------------- = ------------------------------d + Za/2 pq 1500(0.1) + (1.96)(0.5)(0.5)
91
BIBLIOGRAFA
53
http://www.virtual.unal.edu.co/cursos/ciencias/2000352/html/un5/cont_50583.html
ioestadistica Principios y Procedimientos. Steel and Torrie. 2Edicin. Mc
Graw Hill,1988. ..
Diseo y Anlisis de Experimentos. Douglas Montgomery. Grupo Editorial
Iberoamerica.1991.
Bioestadstica. William C. Schefler. Fondo Educativo Interamericano, S.A.,
1981.
http://victoryepes.blogs.upv.es/2013/04/27/diseno-completamente-al-azar-yanova/
http://colposfesz.galeon.com/disenos/teoria/cap13bmj/cap13bmj.htm
54