You are on page 1of 20

Tarea 1 Diseno de Experimentos

Sergio Benitez 2514969


Luis Enciso 25141017
Jhonathan Medina 2514112
Sandra Socadagui 25141026
Tatiana Yara 25141014
February 27, 2016

Ejercicios Captulo 2
(Design and Analysis of Experiments.Eighth Edition. MONTGOMERY)
2.1.Computer output for a random sample of data is shown below. Some of the quantities are
missing. Compute the values of the missing quantities.

SE Mean = n =

3.12
3

= 1.04

Variance = 2 = 9.734
2.4. Suppose that we are testing
H0 : = 0 vs H0 : 0
Calculate the P-value for the following observed values of the test statistic:
a)Z0 = 2.45
p = 1 (Z0 ) = 1 0.9928572 = 0.007142811

b)Z0 = 1.53
p = 1 (Z0 ) = 1 0.06300836 = 0.9369916
c)Z0 = 2.15
p = 1 (Z0 ) = 1 0.9842224 = 0.01577761
d)Z0 = 1.95
p = 1 (Z0 ) = 1 0.9744119 = .02558806
e)Z0 = 0.25
p = 1 (Z0 ) = 1 0.4012937 = 0.5099725

2.7. Suppose that we are testing H0 : 1 = 2 v.s H1 : 1 > 2 where the two sample sizes are
n1 = n2 = 10. Both sample variances are unknown but assumed equal. Find bounds on the P-value
for the following observed values of the test statistic.
a) t0 = 2.31
2.101 < 2.31 < 2.552
0.025 > P (t > 2.31) > 0.01
0.01 < P valor < 0.025
b) t0 = 3.6
2.878 < 3.6 < 3.610
0.005 > P (t > 3.6) > 0.001
0.001 < P valor < 0.005
c) t0 = 1.95
1.734 < 1.95 < 2.101
0.05 > P (t > 1.95) > 0.025
0.025 < P valor < 0.05
d) t0 = 2.19
2.101 < 2.19 < 2.552
0.025 > P (t > 2.19) > 0.01
0.01 < P valor < 0.025

2.10. A computer program has produced the following output for a hypothesis-testing problem:

to =
r
Sp
r
Sp

y y2
q1
Sp n11 + n12

1
y1 y2
1
+
=
n1 n2
to

1
1
11.5
+
=
= 6.117
n1 n2
1.88

a) What is the missing value for the standard error?


to =
r
Sp
r
Sp

y y2
q1
Sp n11 + n12

1
y1 y2
1
+
=
n1 n2
to

1
11.5
1
+
=
= 6.117
n1 n2
1.88

b) Is this a two-sided or a one-sided test?


t(1.88, 24) = 0.0361
2(0.0361) = 0.0723
Por lo tanto se hizo una prueba a dos colas.
c) If 0.05, what are your conclusions?
Como 0.05 < 0.0723, se rechaza la hipotesis que la media de las poblaciones sean iguales.
d)Find a 95% two-sided CI on the difference in means.
(11.5 (2.0638)(6.117), 11.5 + (2.0638)(6.117))
IC95%(1.12; 24.1242)

2.13. Consider the computer output shown below.


a) Fill in the missing values in the output. Can the null hypothesis be rejected at the 0.05 level?
Why?
S
SEy =
N

S = SEy N
S = 0.4673 5
S = 2.3365

y + t/2,24 S N
2.3365
= 935449
5
-Rechazaremos la hipotesis nula si |t0 | > t/2,n1 , donde t/2,n1 denota el punto porcentual superior

de la distribucion t con n 1 grados de libertad.


2
92.5805 + 2.0638

t0 =

y 0
S
N

92.5805 91
2.3365
5

= 3.3821
t/2,n1 = t0.025 24 = 2.0638
Se tiene por tanto que |t0 | > t/2,n1 , y rechazamos la hipotesis nula.
b) Is this a one-sided or a two-sided test?
p = P (t0 tc )
= 1 P (t0 < tc )
= 1 0.9987
0.0013
Como en la salida se tiene P = 0.002 y P = 2 p, la prueba es a dos colas.

c)If the hypotheses had been H0 : = 90 versus H1 : 6= 90 would you reject the null hypothesis at
the 0.05 level? Calculando t0 se tiene
t0 =

92.5805 90
2.3365
5

= 5.5221
En este caso se tiene que |t0 | = 505221 > t/2 n 1 = 2.0638, por lo tanto se rechaza la hipotesis nula.
d) Use the output and the t table to find a 99 percent twosided CI on the mean.
y

P (t/2,n1

S
N

t/2,n1 ) = 1

S
S
P (y t/2,n1 y + t/2,n1 ) = 1
N
N
Un intervalo de confianza del 99% para es
(92.5805 2.7964

0.4673
0.4673
, 92.5805 + 2.7964
)
5
5

(91.2737, 93.8872)
e) What is the P-value if the alternative hypothesis is H1 : > 91? La salida muestra un P-valor de
una prueba a dos colas, por lo tanto si la hipotesis alternativa es
H1 : > 91
P =

0.002
= 0.001
2

2.16. The breaking strength of a fiber is required to be at least 150 psi. Past experience has indicated
that the standard deviation of breaking strengths is = 3psi. A random sample of four specimens
is tested and the results are y1 = 145, y2 = 153, y3 = 150 and y4 = 147.
a) State the hypotheses that you think should be tested in this experiment.
H0 : = 150 vs. H1 : > 150
Se rechaza H0 si Zc > Z1
Donde Zc =

Y 0

b) Test these hypotheses using = 0.05. What are your conclusions ?


Y = 148.25
Luego, Zc = 0.833
Si se especifica un = 0.05 Z1 = 1.645
De esta forma, se concluye que no hay evidencia estadstica para rechazar H0 .
c)Find the P-value for the test in part (b).
p-value = 1 - (0.833) = 0.7967
d) Construct a 95 percent confidence interval on the mean breaking strength.

[
y Z 2 y + Z 2 ]
n
n
3
3
[146.75 1.96 ; 146.75 + 1.96 ]
n
n
[145.81; 151.69]
2.19. A normally distributed random variable has an unknown mean and a known variance
2 = 9. Find the sample size required to construct a 95 percent confidence interval on the mean that
has total length of 1.0.
Confidence interval on the mean:
3
3
(Y 1.96 , Y + 1.96 )
n
n
3
1.96 = 0, 5
n
1.96 3
= n
0, 5
n = 138.2976 139
2.22. The time to repair an electronic instrument is a normally distributed random variable measured
in hours. The repair times for 16 such instruments chosen at random are as follows:

a) You wish to know if the mean repair time exceeds 225 hours. Set up appropriate hypotheses for
investigating this issue.
H0 : = 225
H1 : > 225
b) Test the hypotheses you formulated in part (a). What are your conclusions? Use = 0.05.
Y = 241.5
t0 =

S = 98.725

Y 0
= 0.668
S/ n

t0.95,15 = 1.753

Como t0 no es mayor a t0.95,15 no se rechaza H0 , es decir, no se rechaza que = 225


c) Find the P-value for the test.
P-valor P (t 0.668) = 0.257
d) Construct a 95 percent confidence interval on mean repair time.

Y t0.975,15 S/ n
(241.5 52.6)
(188.9; 294.1)
2.25. Two types of plastic are suitable for use by an electronic calculator manufacturer. The breaking strength of this plastic is important. It is known that 1 = 2 = 1.0 psi. From random samples of
n1 = 10 and n2 = 12 we obtain y1 = 162.5 and y2 = 155.0. The company will not adopt plastic 1 unless its breaking strength exceeds that of plastic 2 by at least 10 psi. Based on the sample information,
should they use plastic? In answering this question, set up and test appropriate hypotheses using
= 0.01. Construct a 99 percent confidence interval on the true mean difference in breaking strength.
Dado que se conocen las dos varianzas poblacionales, utilizaremos un Z-test de dos muestras.
Ho : 1 2 = 10
Ha : 1 2 > 10
Zo =

(y1 y2 ) (1 2 )
q
1
1
+ 12
10
Zo = 5.83

Z0.01 = 2.32
5.83 < 2.32
r

r
1
1
1
1
(y1 y2 (2.326)(
+ ); y1 y2 + (2.326)(
+ ))
10 12
10 12
IC 99%(6.504, 8.496)
Por lo tanto, no hay suficiente evidencia estadstica para rechazar la hipotesis nula. En consecuencia, no se aconseja usar el plastico n
umero 1.

2.28. A new filtering device is installed in a chemical unit. Before its installation, a random sample
yielded the following information about the percentage of impurity: y1 = 12.5, S12 = 101.17, and
n1 = 8. After installation, a random sample yielded y2 = 10.2, S22 = 94.73, n2 = 9.
a) Can you conclude that the two variances are equal? Use = 0.05
Se quieren contrastar las hipotesis
H0 : 12 = 22
vs
H1 : 12 =6= 22
El estadstico de prueba es
F0 =
=

S12
S22

101.17
= 1.067
94.73

y
F/2,n1 1,n2 1=F0.025,7,8=4.52
Como no se tiene
F0 > F/2,7,8
no se rechaza la hipotesis nula.
b) Has the filtering device reduced the percentage of impurity significantly? Use = 0.05.
En este caso se desea contrastar las hipotesis
H0 : 1 = 2
vs
H1 : 1 > 2

Se puede suponer que 12 = 22 = 2 , por la prueba anterior, siendo as, el estadstico de prueba para
este sistema de hipotesis sera
y1 y2
to = q
Sp n11 + n12
con
Sp2 =

(n1 1)S12 + (n2 1)S22


n1 + n2 2

una estimacion de la varianza 2 . Reemplazando los distintos valores en las ecuaciones anteriores se
tiene
t0 = 0.4625
Con un nivel de significancia del 5% se tiene
t/2,n1 +n2 2
t0.975,14 = 2.1447
Como no se tiene t0 > t0.975,14 no se rechaza la hipotsis nula y se concluye que no hay evidencia
estadstica que indique que con el nuevo dispositivo de filtrado se ha reducido significativamente el
porcentaje de impurezas.

2.31. Twenty observations on etch uniformity on silicon wafers are taken during a qualification
experiment for a plasma etcher.The data are as follows:

Construct a 95 percent interval estimate of 2


(n1)S 2
2 ,n1

(201)(0.88907)2
32.852

(n1)S 2
21 ,n1
2

(201)(0.88907)2
8.907

(0.457, 1.686)

Test the hypotheses that 2 = 1.0. Use = 0.05 . What are your conclusions ?
2 = 1
vs.
2
6= 1
Regla de decision: Rechazar si 20 > 2 ,n1
2

20 = (n1)S
= (201)(0.88907)
= 15.01846383
1
02
2
Y se sabe que ,n1 = 32.852
2
Luego, no se rechaza la hipotesis nula.
Discuss the normality assumption and its role in this problem.
El supuesto de normalidad es fundamental en este problema, ya que es el punto de partida para
el estadstico usado en la prueba de varianza y su intervalo de confianza. En dado caso, que
el supuesto de normalidad no sea valido, la prueba hecha y el intervalo de confianza realizados
anteriormente no seran correctos. Cabe destacar que en el siguiente numeral se verificara este
supuesto.
Check normality by constructing a normal probability plot. What are your conclusions?

De la grafica anterior, se concluye que el supuesto de normalidad planteado anteriormente es


correcto; de esta manera, las pruebas aplicadas en los numerales anteriores son validas, ademas,
se podra hacer un t-test sobre la media si se requiere.
2.34 An article in the Journal of Strain Analysis compares several procedures for predicting the
shear strength for steel plate girders. Data for nine girders in the form of the ratio of predicted to
observed load for two of these procedures, the Karlsruhe and Lehigh methods, are as follows:

Viga Metodo Karlsruhe Metodo Lehigh


S1/1
1.186
1.061
S2/1
1.151
0.992
S3/1
1.322
1.063
S4/1
1.339
1.062
S5/1
1.200
1.065
S2/1
1.402
1.178
S2/2
1.365
1.037
S2/3
1.537
1.086
S2/4
1.559
1.052
a)Is there any evidence to support a claim that there is a difference in mean performance between
the two methods?. Use = 0, 05.

H0 : d = 0 vs H1 : 0 6= 0
t0 =

d0

sd / n

0.274
0.045

= 6.08

d = 0.274
t0.025,8 = 2.306
Sd = 0.135
t0.975,8 = 2.306
Como t0 > t0,975,8 se rechaza H0 .
Por lo tanto se puede concluir que hay diferencia entre los dos metodos.

b) What is the P-value for the test in part (a)?

p = 2(1 P (t0 < t)) = 0.0002959286

c) Construct a 95 percent confidence interval for the difference in mean predicted to observed load.

(d t1/2,

Sd
n1

< d < d + t1/2,

Sd
n1

(0.274 0.10377; 0.274 + 0.10377)


(0.1702; 0.377)
d) Investigate the normality assumption for both samples.
Al observar los siguientes datos, los cuales representan la muestra 1 y la muestra 2 respectivamente se puede decir que se cumple el supuesto de normalidad en las dos muestras.

(a) Gr
afico QQ muestra 1 - Metodo Karlsruhe

(b) Gr
afico QQ muestra 2 - Metodo Leihgh

e) Investigate the normality assumption for the difference in ratios for the two methods.
Al igual que los datos del literal anterior se puede afirmar el supuesto en la diferencia de las dos
muestras.

f) Discuss the role of the normality assumption in the paired t-test.

Una propiedad importante de la prueba t es su robustez ante los supuestos de normalidad de la


poblacion. Las pruebas t suelen ser validas incluso cuando se viola el supuesto de normalidad pero
solo si la distribucion no es muy asimetrica.
2.37 In semiconductor manufacturing wet chemical etching is often used to remove silicon from
the backs of wafers prior to metalization. The etch rate is an important characteristic of this process. Two different etching solutions are being evaluated. Eight randomly selected wafers have been
etched in each solution, and the observed etch rates (in mils/min) are as follows:

a) Do the data indicate that the claim that both solutions have the same mean etch rate is valid?
Use = 0.05 and assume equal variances.
Y1 = 9.95

Sp2 =

S1 = 9.95

1.7962
(n1 1)S12 + (n2 )S22
=
= 0.1283
n1 + n2 2
14

Y2 = 10.3625, S2 = 0.2326

t0 =

Y Y2
0.4125
q1
= 6.4302
=
0.06415
Sp n11 + n12
t0.025,14 = 2.01444

Como |t0 | > t 2 ,v se rechaza la hipotess nula de igualdad de medias.


b) Find a 95 percent confidence interval on the difference in mean etch rates.



q
1
1

Y1 Y2 t1 2 ,v Sp n1 + n2
(0.4125 2.1447(0.06415))
(0.55; 0.274)

c) Use normal probability plots to investigate the adequacy of the assumptions of normality and
equal variances.

Como se observa en los graficos las observaciones estan ubicadas cerca a la recta, lo que indica que
las poblaciones de las que vienen las muestras presentan distribucion normal.

2.40.Suppose we are testing


Ho : 1 = 2
H1 : 1 6= 2
where 12 > 22 are known. Our sampling resources are constrained such that n1 + n2 = N . Show
that an allocation of the observation n1 n2 to the two samp that lead the most powerful test is in
the ratio n1 /n2 = 1 /2 .
Dado que conocemos las varianzas poblacionales, usaremos la estadstica Z.
y1 y2
Zo = q 2
1
2
+ n22
n1
Como tenemos restricciones sobre los tama
nos de las muestras en cada poblacion, entonces debemos maximizar la estadstica Z bajo n1 + n2 = N . Por la restriccion, maximizar Z puede verse como
2
2
2
22
minimizar n11 + n22 = n11 + N n
.
1

( n11 +

22
)
N n1

12
22
= 2 +
=0
n1
(N n1 )2

n1

22
12
=
n21
n22
Como la varianza es positiva y el tama
no de la muestra tambien, sacamos raiz cuadrada a ambos
lados.
1
2
=
n1
n2
Con lo cual obtenemos que se deben elegir tama
nos de muestra para cada poblacion proporcional
a la desviacion estandar de cada poblacion.

2.43. Develop Equation 2.50 for a 100(1 ) percent confidence interval for the ratio
and 22 are the variances of two normal distributions.
Se sabe que
S 2 [( 2 /n 1)] 2n1
Por tanto

12
,
22

where 12

2n1
S2

2
n1

Luego
S22
22
S12
12

Fn2 1,n1 1

Con base en lo anterior, un intervao de confianza de 100(1 %) para

P (F1/2,n2 1,n1 1

= P(

S22
22
S12
12

12
22

es

F/2,n2 1,n1 1 ) = 1

S12
12
S12
F

F/2,n2 1,n1 1 ) = 1
1/2,n
1,n
1
2
1
S22
22
S22

2.46. Consider the experiment described in Problem 2.26. If the mean burning times of the two
flares differ by as much as 2 minutes, find the power of the test. What sample size would be required
to detect an actual difference in mean burning time of 1 minute with a power of at least 0.90?

Ejercicios Captulo 1
(Dise
no de Experimentos [Metodos y Aplicaciones])
1. Comente que importancia tienen los dise
nos experimentales en la investigacion experimental y
que aspectos se deben considerar dentro de la metodologa experimental.
Una correcta elaboracion del dise
no experimental le va permitir al investigador hacer inferencia
sobre la poblacion con respecto a su experimento, de lo contrario todo su experimento no tendra
validez cuando se quiera generalizar a la poblacion.
Los aspectos que se deben considerar dentro de la metodologa experimental son:
Identificacion y enunciacion del problema.
Eleccion de los factores, los niveles y los rangos.
Seleccion de la variable de respuesta.
Eleccion del dise
no experimental.
Realizacion del experimento.
Analisis estadstico de los datos.
Conclusiones y recomendaciones,
3. Cuales seran las unidades experimentales, replicas, unidades observacionales, tratamientos y el
modelo matematico en las siguientes situaciones?
a) Un experimento en el que se examina la efectividad de varios antiboticos en animales de laboratorio.
Unidades experimentales: Animales de laboratorio.
Unidades observacionales: Animales de laboratorio.
Tratamientos: Antiboticos
Modelo matematico:
Yij = + Ai + ej(i)

donde Ai es el i-esimo antibotico.


ej(i) N (0, 2 )

b) Un estudio de la fisiologa de los ejercicios con voluntarios humanos, en donde estos se someten a
una prueba respiratoria y cardiovascular despues de estar en una banda caminadora.
Unidades experimentales: Humanos voluntarios
Unidades observacionales: Humanos voluntarios
Tratamientos: Tiempo en la banda caminadora
Modelo matematico:
Yij = + Ti + ej(i)
Donde Ti es el i-esimo tiempo aplicado a un voluntario.
ej(i) N (0, 2 )

c) Se plantea un experimento con la finalidad de comparar tres metodos de ense


nanza. Cada uno se
aplica en un salon con 30 estudiantes.

Unidades experimentales: Salones.


Unidades observacionales: Estudiantes.
Tratamientos: 3 metodos de ense
nanza.
Modelo matematico:
Yij = + Mi + ej(i)
Donde Mi es el i-esimo metodo de ense
nanza aplicado en un salon.
ej(i) N (0, 2 )
5. Se investigo la perdida de peso en porcentaje del peso inicial de la carne de res tipo milanesa, despues de cinco das de empacada en cuatro tipos de envolturas: Icopor, Biopak, Cry-0-Pak y Shopak.
Para tal finalidad se realizaron cinco replicaciones de cada una.
a) Describa los factores, niveles, unidades experimentales, unidades observacionales, tratamientos y
la variable respuesta.

Factores: Envoltura.
Niveles: Icopor, Biopak, Cry-0-Pak y Shopak
Unidades experimentales: Porciones de carne que son empacadas.
Unidades observacionales: Porciones de carne que son empacadas.
Tratamientos: Icopor, Biopak, Cry-0-Pak y Shopak
variable respuesta: Peso perdido en porcentaje.
b) Dise
ne una aleatorizacion correcta para este experimento y proponga el modelo lineal asociado.
Es recomendable para el experimento que hayan por lo menos 4n porciones de carne (con condiciones de homogeneidad), donde n > 1 para garantizar la replicacion de cada envoltura. Por otro
lado, para determinar que tipo de envoltura se le asigna a cada porcion de carne, se realiza un
coordinado negativo para garantizar aleatorizacion.
7. Se midio la concentracion de calcio en hojas de cinco especies de arboles para saber si el nitrogeno
en tres niveles diferentes afectaba el porcentaje de peso seco de la hoja (esta es una forma de medir la
concentracion de calcio). Dentro de cada arbol, se tomaron aleatoriamente cuatro hojas y se hicieron
cuatro lecturas de cada hoja.

a) Lleve a cabo una descripcion completa del experimento especificando: Objetivos, poblacion, factores, unidades experimentales, unidades observacionales, tratamientos y variable respuesta.
Objetivo: Observar si los niveles de nitrogeno afectan la concentracion de calcio en los arboles.

Poblacion: Arboles.
Factores:Nitrogeno.

Unidades Experimentales: Arboles.

Unidades Observacionales:Las cuatro hojas.


Tratamientos: Cada nivel de nitrogeno
Variables Respuesta: Concentracion de calcio.

b) Indique un metodo de aleatorizacion apropiado para el experimento y el modelo lineal asociado.


Es recomendable para el experimento que de cada especie de arbol haya por lo menos 3n arboles
(con condiciones de homogeneidad), donde n > 1 para garantizar la replicacion. Por otro lado, para
determinar que tratamiento se le aplica a cada arbol, se realiza un coordinado negativo para seleccionar alg
un nivel de nitrogeno.

9. Proponga un problema de investigacion en alg


un area de su interes donde se pueda realizar un
muestreo aleatorio de los tratamientos en el estudio de una poblacion grande de tratamientos.

a) Describa el estudio y como lo realizara.


Se quiere realizar un estudio para analizar el efecto que tiene un determinado tipo de combustible
y de aceite sobre el n
umero de millas recorridas en el momento en que este se agota. Este se realizara
sobre un conjunto de carros garantizando condiciones de homogeneidad agrupandolos por gama alta,
media y baja. Por otra parte todas los carros tendran el mismo tiempo de uso.
Se cuenta con tres tipos de combustibles y dos tipos de aceite que seran aplicados aleatoriamente
a cada vehculo garantizando que cada tratamiento sea aplicado a por lo menos dos vehculos de la
misma gama.
Se tomara el registro de las millas recorridas por cada vehculo.

b) Presente el modelo lineal para su estudio; identifique los factores, los tratamientos y las unidades
experimentales.
Factores: Tipo de aceite y tipo de combustible.
Tratamientos: Todas las combinaciones entre los dos tipos de aceite y los tres tipos de combustible.
Unidades experimentales: Vehculo

Modelo lineal:
Yijkm = + Ci + Aj + Ci Aj + Gk + el(ijk)

Donde Ci es el i-esimo tipo de combustible.


Aj es el j-esimo tipo de combustible.
Gk es el control local dado por la gama de vehculo.

c) Que suposiciones tendra que hacer sobre su estudio para tener inferencias validas?
el(ijk) N (0, 2
Homogeneidad de varianza y normalidad.
.

You might also like