You are on page 1of 23

UNIVERSIDAD JUÁREZ AUTÓNOMA DE TABASCO

Maestría en Ciencias en Ingeniería

Diseño de experimentos

Manuel Olán Ramos

PROBLEMARIO

1
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
30 de octubre de 2018.
1-. Explique en que consiste y cuando se debe aplicar el diseño
completamente al azar con un solo criterio de clasificación.
R: El diseño completamente al azar consiste en hacer un estudio de las medidas
poblacionales de cada tratamiento y hacer una comparación entre ellas, y se puede
aplicar cuando se necesitan comparar mas de dos tratamientos.
2-. Supongamos que se desea probar la igualdad entre si de cinco medidas.
Una alternativa para hacer esto seria comparar de dos en dos las medidas,
utilizando la prueba T de Student y al final tomar una decisión. Explique por
que esto aumenta el error tipo I.
R: si la probabilidad de aceptar la hipótesis nula debe de ser 1-α y el valor de
significancia del 5%, entonces la probabilidad de aceptar la hipótesis nula seria de
multiplicar 10 veces el resultado de 1-α y esto provocaría un aumento en el error
tipo I.
3-. ¿Qué mide el cuadrado medio del error en el ANOVA de un experimento?
R: es una suma de cuadrados y divididos entre cada uno de sus grados de libertad.
4-. ¿Qué son los grados de libertad para una suma de cuadrados en un análisis
de varianza?
R: son los números de observaciones menos el número de parámetros que hay en
los datos.
5-. A continuación, se muestra parte del ANOVA para comparar cinco
tratamientos con cuatro replicas cada uno.
Fuente de Suma de Grados de Cuadrado Razón F Valor -p
variación cuadrados libertad medio

Tratamiento 800 4 200 7.50 3.055


Error 400 15 26.666
Total 1200 19
Datos:
K= 5
N= 20
a) Agregue en esta tabla los grados de libertad, el cuadrado medio y la razón
F para cada una de las fuentes de variación.
5−1=4 20 − 5 = 15 20 − 1 = 19
2
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
𝑆𝐶𝑡𝑟𝑎𝑡 800 𝑆𝐶𝑒 400
𝐶𝑀𝑡𝑟𝑎𝑡 = = = 200 𝐶𝑀𝑒 = 𝑁−𝑘 = = 26.6666
𝑘−1 4 15
𝐶𝑀𝑡𝑟𝑎𝑡 200
= 26.6666 = 7.50
𝐶𝑀𝑒

b) Anote el modelo estadístico y formule la hipótesis pertinente al problema.


𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖𝑗 + £𝑖𝑗
H0= μk
HI= μij
c) Con el apoyo de la función DISTR.F.INV (α, k-1, N-k) de Excel calcule el valor-
p o la significancia observada para ver si hay diferencia entre los tratamientos.
−𝑝 = 3.055568

d) ¿Hay diferencias significativas entre los tratamientos? Argumente su


respuesta.
R: si hay diferencia significativa entre los tratamientos, se puede ver en la tabla y
con los valores dados de N y K con ellas sacamos los grados de libertad de los
tratamientos con respecto a la media de cada variable.
6-. Si desea investigar el efecto del pH en el crecimiento de cierto
microorganismo en un medio especifico. Para ello se realiza un experimento,
teniendo como punto de partida la misma cantidad de microorganismos. Se
hace cuatro repeticiones y se obtienen los siguientes resultados. ¿Estos
datos son evidencia suficiente para afirmar que los niveles de pH en los que
se logra menor y mayor crecimiento son el 3 y el 2, respectivamente? Explique
su respuesta.

Nivel de pH Crecimiento promedio (en %)


1 80
3
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
2 105
3 75

R: No, estos datos no son evidencia suficiente para hacer tal afirmación, ya que hay
otros factores que intervienen en el crecimiento de los microorganismos, deberían
de proporcionarse mas datos para entonces poder hacer una respuesta mas
concreta.
7-. Se desea investigar la influencia de la temperatura en el rendimiento de un
proceso químico, en particular interesa investigar un rango de temperatura
entre 60 y 120°C. Se tienen recursos para realizar 20 corridas experimentales.
a) Los niveles de temperatura con los que se experimenta son 60, 65, 70, y
120; se hacen cinco repeticiones con cada nivel. ¿Considera que es adecuado
el diseño experimental usado? Argumente su respuesta y, de ser necesario,
proponga alternativas.
R: seria mejor hacer una distribución de las temperaturas de forma mas uniforme
ya que la propuesta no esta uniformemente repartida, lo mejor sería dividir ese
rango de temperatura entre los cuatro tratamientos.
b) El orden en el que decidieron hacer las corridas para facilitar el trabajo
experimental fue: primero las cinco del nivel bajo de temperatura, luego las
cinco del siguiente, y así hasta finalizar. ¿Es correcto lo que hicieron?
Argumente su respuesta.
R: debería de ser completamente al azar, así que no es correcto hacerlo en ese
orden.
c) Para hacer el análisis estadístico se comparan, mediante una T de Student,
de dos en dos niveles de temperatura, y con base a esto se obtuvieron
conclusiones. ¿Es adecuado tal análisis? Argumente y, en su caso, proponga
alternativas.
R: este análisis no es muy adecuado, ya que si se rechaza una hipótesis nula que
es verdadera aumentaría el error tipo I.
8-. Describa en que consiste cada uno de los supuestos del modelo en un
análisis de varianza, y explique la forma típica en la que estos supuestos se
verifican.
R: 1-. Varianza Constante: esta consiste en comprobar que los residuos de cada
tratamiento tienen la misma varianza, es verificado graficando los predichos contra
los residuos y si los puntos en esta grafica se distribuyen de manera aleatoria en
una banda horizontal (sin ningún patrón claro y contundente) entonces es señal de
que se cumple el supuesto de que los tratamientos tienen igual varianza.
4
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
2-. Normalidad: Consiste en verificar que los residuos sigan una distribución normal
con media cero y se verifica graficando los residuos en una escala X-Y de tal manera
que si los residuos siguen una distribución normal al graficarlos tienden a quedar
alineados en una línea recta.
3-. Independencia: Probar que los residuos son independientes entre sí, se verifica
si se grafica el orden en que se colecto un dato contra el residuo correspondiente,
de esta manera si al graficar en el eje horizontal el tiempo (orden de corrida) y en el
eje vertical los residuos, se detecta una tendencia o patrón no aleatorio claramente
definido, esto es evidencia de que existe una correlación entre los errores y, por lo
tanto el supuesto de independencia no se cumple.
9.- ¿Qué son y cuándo se aplican las pruebas para comparar medias?
R: Son métodos que nos permiten hacer comparaciones entre todos los posibles
pares de medias, dependiendo del número de tratamientos para identificar cuales
resultaron diferentes, Se aplican cuando es rechazada la hipótesis nula. Estos
métodos son:
1- Método de LSD (Diferencia Mínima Significativa)
2- Método de Tukey
3- Método de Duncan

10.- En una industria química se prueban diferentes mezclas para ver si


difieren en cuanto al peso molecular final. Se prueban cuatro diferentes
mezclas, con cinco repeticiones cada una. A continuación, se muestra una
parte de la tabla del análisis de varianza y los promedios obtenidos para cada
mezcla.

Mezcla Peso promedio


Fuente de variación Valor p
Mezcla 0.01 A 10 000
Error B 7 000
C 8 000
D 7 500
a) ¿Las mezclas difieren de manera significativa en cuanto a su peso
molecular?

R: las mezclas B, C y D no difieren mucho, en cambio la mezcla A si difiere un


poco mas de las otras.

b) Con el análisis de varianza y de acuerdo con el promedio. ¿Se puede


asegurar que con la mezcla B se logra un menor peso molecular? Argumente
su respuesta.
5
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
R: si, ya que fue la que presento el promedio mas bajo, eso quiere decir que en esta
mezcla es donde estaban los pesos mas bajos.
c) Si al verificar los supuestos de varianza constante (igual varianza entre las
mezclas), éstos no se cumplen, ¿Qué significa eso? ¿Se puede seguir
apoyando la conclusión del inciso a)?

R: si, como dijimos, existe una diferencia entre los tratamientos.

11.- Se hace un estudio sobre la efectividad de tres marcas de spray para


matar moscas. Para ello cada producto se aplica a un grupo de 100 moscas, y
se cuenta el número de moscas muertas expresado en porcentajes. Se hacen
seis réplicas y los resultados obtenidos se muestran a continuación.

Marca Número de réplica


de spray 1 2 3 4 5 6
1 72 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69

a) Formule la hipótesis adecuada y el modelo estadístico.

b) ¿Existe diferencia entre la efectividad promedio de los productos en spray?


R: si hay una diferencia muy notable entre los tres tipos de spray. La marca 1= 69,
la marca 2= 59.16 y la marca 3= 62.83, aquí se muestra que la marca 1 tiene una
ventaja sobre los otros dos.

6
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
c) ¿Hay algún spray mejor? Argumente su respuesta.
R: si, el spray 1 será el mejor, ya que presenta una mejor media y eso quiere decir
que el numero de moscas muertas es el mayor.

d) Dé un intervalo al 95% de confianza para la efectividad promedio


(porcentaje) de cada una de las marcas.

e) Dibuje las gráficas de medias y los diagramas de caja simultáneos, e


interprételos.

7
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
8
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Gráfica de caja de Num. de replica
75

70
Num. de replica

65

60

55

50

1 2 3
Marca de spray

9
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
f) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

12-. En un centro de investigación se realiza un estudio para comparar varios


tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su
tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio
(NaHCO3) y cloruro de sodio o sal común (NaCI). El primer tratamiento es de
control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es
mejorar en agua con bicarbonato de sodio, el T 3 es remojar en agua con sal
común y el T4 es remojar en agua con una combinación de ambos ingredientes
en proporciones iguales. La variable de respuesta es el tiempo de cocción en
minutos. Los datos se muestran en la siguiente tabla:
Control T2 T3 T4
213 76 57 84
214 85 67 82
204 74 55 85
208 78 64 92
212 82 61 87
200 75 63 79
10
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
207 82 63 90

a) De qué manera el experimentador debe aleatorizar los experimentos y el


material experimental?
R: tiene que elegir completamente al azar el orden en que se deben realizar los
experimentos.
b) Dé ejemplos de factores que deben de estar fijos durante las pruebas
experimentales, para que no afecten los resultados y las conclusiones.
R: 1- la temperatura que se usara al cocer
2- la especie de los frijoles
3- el tipo de recipiente que se usara para cocer
4- la cantidad de agua que se utilizara
c) Formule y pruebe la hipótesis de que las medias de los tratamientos son
iguales.
𝐻ₒ = ẌT2= XT3 𝐻ₒ = ẌT2= XT4 𝐻ₒ = ẌT3= XT4
HI = XT2 = XT3 HI = XT2 = XT4 HI = XT3 = XT4

Promedio del tratamiento 2= 78.85


Promedio del tratamiento 3= 61.42
Promedio del tratamiento 4= 85.57

d) Obtenga el diagrama de caja y el grafico de medias después; interprételos.

11
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Gráfica de caja de control

90

80

70

60
control

50

40

30

20

10

1 2 3 4
tratamiento

12
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
R: como se pueden ver en la caja, el mejor tratamiento será el 3 ya que presenta un
menor tiempo de respuesta.
e) ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para
el mejor tratamiento?
R: el mejor tratamiento es el 3 porque es el que tiene menor tiempo. El tiempo de
cocción es de 61.42 minutos.
f) Algo importante a cuidar en un experimento es que no haya efectos
colaterales no deseados, causados por el tratamiento ganador; en este caso,
piense en los posibles efectos colaterales que podrían causar el mejor
tratamiento.
R: algunos de los materiales con los cuales se realizan los tratamientos causan
daños a la salud.
g) ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
R: si se cumplen

h) Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que


corresponde a un supuesto).

13
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
R: Las varianzas difieren muy poco, respecto a lo que se observa en la gráfica

13-. Para estudiar la contabilidad de ciertos tableros electrónicos para


automóviles se someten a un envejecimiento acelerado durante 100 horas a
determinada temperatura, y como variable de interés se mide la intensidad de
la corriente que circula entre dos puntos, cuyos valores aumentan con el
deterioro. Se probaron 20 módulos repartidos de manera equitativa de en
cinco temperaturas, y los resultados obtenidos fueron los siguientes:
20ºC 40ºC 60ºC 80ºC 100ºC
15 17 23 28 45
18 21 19 32 51
13 11 25 34 57
12 16 22 31 48

a) Formule la hipótesis y el modelo estadístico para el problema

b) Realice el análisis de varianza para estos datos, a fin de estudiar si la


temperatura afecta la intensidad de la corriente promedio.

Información del factor


Factor Niveles Valores
Temperatura 5 20, 40, 60, 80, 100

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Temperatura 4 3411.8 852.95 68.05 0.000
Error 15 188.0 12.53
Total 19 3599.8

14
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Medias
Temperatura N Media Desv.Est. IC de 95%
20 4 14.50 2.65 (10.73, 18.27)
40 4 16.25 4.11 (12.48, 20.02)
60 4 22.25 2.50 (18.48, 26.02)
80 4 31.25 2.50 (27.48, 35.02)
100 4 50.25 5.12 (46.48, 54.02)
Desv.Est. agrupada = 3.54024

15
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Gráfica de caja de I
60

50

40
I

30

20

10
20 40 60 80 100
Temperatura

c) ¿la temperatura afecta la variabilidad de las intensidades? Es decir,


verifique si hay igual varianza entre los diferentes tratamientos.
R: la temperatura si afecta a la intensidad de corriente de los tableros, lo podemos
ver en las cajas más gráficamente como a mayor temperatura la intensidad de
corriente aumenta más que en las otras temperaturas.
14. En una empresa de manufactura se propone un tratamiento para reducir el
porcentaje de productos defectuosos. Para validar esta propuesta se diseñó
un experimento en el que se producía con o sin la propuesta de mejora. Cada
corrida experimental consistió en producir un lote y la variable de respuesta
es el porcentaje de producto defectuoso. Se hicieron 25 réplicas para cada
tratamiento. Los datos obtenidos se muestran a continuación:
Porcentaje de producto defectuoso
Con tratam. 5.3 4.0 4.0 4.0 2.6 2.1 5.1 4.1 4.1 3.2 5.1 2.2 4.1 2.2 1.1 2.0
3.0 3.1 2.1 1.2 3.3 2.1 4.0 2.0 3.0
Sin tratan. 8.0 13.2 7.2 8.2 9.4 6.7 12.2 16.3 9.2 6.4 7.2 17.2 12.3 8.7 11.3
4.5 6.6 9.2 10.2 10.6 13.3 5.2 6.2 8.0 4.8

16
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
a) ¿Las diferencias son significativas estadísticamente?
R: si, así es, gráficamente podemos ver como el porcentaje en los productos sin
tratamiento aumenta mucho en comparación con los que si se les aplica el
tratamiento.
b) ¿Cuál es el porcentaje de defectos que se espera con el nuevo tratamiento?
R: el porcentaje obtenido con el nuevo tratamiento fue de 3.160
c) Cuantifique el nivel de reducción que se logró con el tratamiento propuesto.
R: ST= 9.272 CT= 3.160 9.272-3.160= 6.112
d) Analice la diferencia de medidas de estos tratamientos mediante la prueba
T de Student del capítulo 2, expresión (2.14), y verifique que se obtienen las
mismas conclusiones que con el ANOVA.

Información del factor


Factor Niveles Valores
Tratam. 2 CT, ST

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Tratam. 1 467.0 466.957 73.14 0.000
Error 48 306.5 6.385
Total 49 773.4

17
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Gráfica de caja de Porcentaje
18

16

14

12
Porcentaje

10

0
CT ST
Tratam.

18
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
15-. Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad
de almidón en la dureza de las tabletas. Se decidió producir lotes con una
cantidad determinada de almidón, y que las cantidades de almidón a aprobar
fueran 2, 5 y 10%. La variable de respuesta sería el promedio de la dureza de
20 tabletas de cada lote. Se hicieron cuatro réplicas por tratamiento y se
obtuvieron los siguientes resultados:

% de almidón Dureza
2 4.3 5.2 4.8 4.5
5 6.5 7.3 6.9 6.1
10 9.0 7.8 8.5 8.1

a) ¿Hay evidencia suficiente de que el almidón influye en la dureza de las


tabletas? Halle el ANOVA.
R: si, en las cajas podemos ver claramente como el porcentaje de almidón influye
en la dureza de las tabletas.

ANOVA de un solo factor: Dureza vs. % Almidon


Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05
Se presupuso igualdad de varianzas para el análisis.

Información del factor


Factor Niveles Valores
% Almidon 3 2, 5, 10
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
% Almidon 2 26.727 13.3633 58.10 0.000
Error 9 2.070 0.2300
Total 11 28.797
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
19
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
0.479583 92.81% 91.21% 87.22%
Medias
% Almidon N Media Desv.Est. IC de 95%
2 4 4.700 0.392 (4.158, 5.242)
5 4 6.700 0.516 (6.158, 7.242)
10 4 8.350 0.520 (7.808, 8.892)
Desv.Est. agrupada = 0.479583

Gráfica de caja de Dureza


9

7
Dureza

4
2 5 10
% Almidon

b) Realice los análisis complementarios necesarios.


c) Si se desea minimizar la dureza de las tabletas ¿Qué recomendaría al
fabricante?
20
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
R: yo recomendaría bajar el porcentaje de almidón.

d) Verifique los supuestos.

16.- Los datos que se presentan en seguida son rendimientos en toneladas


por hectárea de un pasto con tres niveles de fertilización nitrogenada. El
diseño fue completamente aleatorizado, con cinco repeticiones por
tratamiento.

Niveles de Nitrógeno
1 2 3
14.823 25.151 32.605
14.676 25.401 32.460
14.720 25.131 32.256
14.5141 25.031 32.669
15.065 25.267 32.111

a) ¿Las diferencias muestrales hacen obvia la presencia de diferencias


poblacionales?

21
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
R: si, las diferencias son muy grandes, talvez afecto los niveles de nitrógeno o los
tipos de pastos.

b) Obtenga el análisis de varianza e interprételo.

ANOVA de un solo factor: Rendimiento T. vs. Niveles N.


Método
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05
Se presupuso igualdad de varianzas para el análisis.

Información del factor


Factor Niveles Valores
Niveles N. 3 1, 2, 3
Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Niveles N. 2 788.341 394.170 10131.62 0.000
Error 12 0.467 0.039
Total 14 788.808
Resumen del modelo
R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
0.197243 99.94% 99.93% 99.91%
Medias
Niveles
N. N Media Desv.Est. IC de 95%
1 5 14.7596 0.2038 (14.5674, 14.9518)
2 5 25.1962 0.1419 (25.0040, 25.3884)
3 5 32.420 0.235 (32.228, 32.612)
Desv.Est. agrupada = 0.197243

22
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería
Gráfica de caja de Rendimiento T.
35

30
Rendimiento T.

25

20

15

1 2 3
Niveles N.

c) Analice los residuos, ¿Hay algún problema?


23
Manuel Olán Ramos
Diseño de Experimentos
Maestría en Ciencias en Ingeniería

You might also like