You are on page 1of 40

Análisis de diseños experimentales de un factor, univariante.

Realizada por: Ing. Leal

Diseño Experimentales Clásicos.

Diseñar estadísticamente un experimento, es realizar una prueba o una serie de


pruebas, buscando caracterizar las variables explicativas o factores Xi de mayor
influencia en un ensayo de interés, y que es evaluado a través de variables
respuestas tal que, si deliberadamente se introducen cambios controlados en
algunas de las variables explicativas del proceso, es posible observar y cuantificar los
cambios que estos generan en las variables respuesta, además de buscar el minimizar
los efectos de las variables no controlables (co-variables), procurando con ello
estabilizar y minimizar la variabilidad de las respuestas.
Aunque la aplicación del diseño experimental se da en cualquier área del
conocimiento, este debe cumplir las siguientes fases:
1. Caracterización de un proceso. En esta fase, se busca determinar los rangos de
las variables o factores controlables de mayor influencia en las variables respuesta
que a la vez minimizan el efecto de las variables no controlables (factores o co-
variables).
2. Depuración y optimización de un proceso ya caracterizado. En esta fase se
hallan los niveles de los factores estudiados que proporcionan la respuesta óptima a la
solución del proceso caracterizado en la fase anterior.
En cualquier aplicación de la estadística en el diseño y su posterior análisis, es
necesario que quienes lo desarrollen entiendan claramente el problema, objeto de
estudio, que posean un amplio conocimiento del material experimental a usar, que
conozcan las posibilidades existentes para coleccionar los datos y además posean el
conocimiento estadístico necesario para direccionar e interpretar adecuadamente los
resultados del experimento.
El diseño estadístico de experimentos es entonces esencialmente el plan para poner a
funcionar el experimento, especificando el arreglo de las unidades experimentales en

Realizado por: Ing. G leal


el tiempo y/o espacio y el patrón de observaciones que van a reportar la información
deseada.
Por lo tanto, es una secuencia compleja de etapas tomadas para garantizar que los
datos serán obtenidos de la forma que permitan un análisis objetivo, soportado en
inferencias validas respecto al planteamiento del problema, el cual debe ser lo más
preciso posible y además viable económicamente.
Un buen diseño experimental, es aquel que proporciona la información requerida con
el mínimo esfuerzo experimental.
Muchos criterios han sido propuestos para contar con un experimento
estadísticamente valido. En general, los requisitos estadísticos para el buen diseño de
experimentos son:
 Proveer estimaciones insesgadas para los efectos del tratamiento.
 Las comparaciones de tratamientos, deben de ser lo suficientemente precisas para
detectar las mínimas diferencias de importancia práctica para el investigador, la
precisión de un determinado experimento dependerá de: La variabilidad intrínseca
del material experimental y de la precisión del trabajo experimental; la cantidad de
replicaciones del tratamiento, y del diseño del experimento.
 Las conclusiones tienen un rango amplio de validez.
 El diseño debe ser lo mas simple posible, pero que permita alcanzar los objetivos
del experimento.
Un buen diseño de experimentos puede ser obtenido al aplicar los principios básicos
establecidos por Fisher en 1935. Ellos son:
1. Replicaciones de algunos o todos los tratamientos, para estimar la magnitud del
error experimental.
2. Aleatorización de los tratamientos a las unidades experimentales, para tener así
una estimación válida del error experimental y estimaciones insesgadas de los efectos
de los tratamientos.
3. El uso del control local de fuentes de variación extrañas conocidas.
En la tabla mostrada a continuación se muestran los diseños clásicos o los diseños de
Control del Error, los cuales tienen como principal objeto el de minimizar las

Realizado por: Ing. G leal


variaciones en las respuestas introducidas por efectos de co-variables, que se hayan
previsto o no controlar.

Diseño Completamente Aleatorizado: en este diseño no existe restricción en la asignación


de los tratamientos a las unidades experimentales (UE), requiriendo que las mismas sean lo
mas homogéneas posibles, es decir, el material experimental tiene que poseer
características similares.

Diseño de Bloques al Azar: la asignación de los tratamientos a las UE obedecen a la


existencia de una fuente de variación externa, en función a la cual las UE se agrupan en
estratos homogéneos (bloques) dentro de sí y en heterogéneos entre ellos.

Diseño Cuadrado Latino: los tratamientos se aleatorizan en función a una doble


estratificación o bloqueo (filas y columnas), las cuales se realizan por la sospecha de la

Realizado por: Ing. G leal


existencia de dos fuentes de variación externa, obteniéndose una distribución donde un
tratamiento aparece una sola vez por fila y por columna. El doble bloqueo se realiza por
diferencia en la secuencia de aplicación de los tratamientos o por características de las
unidades experimentales.

Realizado por: Ing. G leal


D.C.A. (Diseño completamente aleatorizado)
Ejercicio 01. (3-6 del libro):

Una empresa fabricante de televisores esta interesada en probar cuatro diferentes


recubrimientos para cinescopios de color sobre la conductividad del mismo, para lo
cual se obtienen los siguientes datos

Desde el punto de visto de diseño de experimento, realice los análisis y


recomendaciones al fabricante si se desea es minimizar la conductividad en los
cinescopios.
Resolución:
1.1) Presentación del planteamiento del diseño experimental.
Por la estructura en que se presentan los datos del problema y lo que se requiere del
mismo, se infiere que el diseño más idóneo para su análisis es el de DCA.
Variables:
Independiente: Tipo de Recubrimiento. (1, 2, 3, 4)
Dependiente: Conductividad.
Experimento:
Tratamientos: t=4.
Repeticiones: r= 4.
Unidades Exp.: N=t.r=16.

Realizado por: Ing. G leal


T. de Recubrimiento repetición Conductividad
1 1 143
1 2 141
1 3 150
1 4 146
2 1 152
2 2 149
2 3 137
2 4 143
3 1 134
3 2 136
3 3 132
3 4 127
4 1 129
4 2 127
4 3 132
4 4 129

La matriz de datos para el DCA según los datos recabados se muestra a continuación,
en la cual se pueden observar los valores promedios por tratamiento y los totales y
promedios generales del experimento en estudio.

o Repeticiones Total Promedio


a mient
Tr at 1 2 3 4
1 143 141 150 146 580 145,00
2 152 149 137 143 581 145,25
3 134 136 132 127 529 132,25
4 129 127 132 129 517 129,25
2207 137,94
G.T.: Gran total G.T. M.G.
M.G.: Media general

Realizado por: Ing. G leal


1.2) Diagnostico de los datos, empleando representación grafica.
Figura 1.1. Diagrama de caja de la conductividad contra los tipos de recubrimientos.

De la figura 1.1 se puede deducir que existe una variabilidad entre las medias de los
diferentes tratamientos, hecho evidenciado por la franja en la cual se mueven las
mismas, que va desde una conductividad de 125 a una un poco menor de 150, esta
variación entre medias es indicativo de que posiblemente si exista una relación entre
el tipo de recubrimiento y la variable en estudio la conductividad, adicionalmente no
se perciben solapamientos entre los cuartiles y esto induce a que se esperen
diferencias entre las medias de los tipos de recubrimiento 1 y 2 respecto a los de
numero 3 y 4, y entre estos pares, se deben esperar los resultados analíticos para ver
si existen o no diferencias.
Además es evidente que no existen valores atípicos o lejanos a los cuartiles del
diagrama, lo que evidencia que se realizaron buenas tomas de la variable
conductividad a diferentes tipos de recubrimientos. Por otro lado, es de notar que el
recubrimiento dos posee mayor variabilidad entre sus datos que el resto y por el
contrario el tipo de recubrimiento cuatro resulto con la variación mas baja. Y también

Realizado por: Ing. G leal


se puede inducir a que los datos presentan simetría cuanto la media esta próxima al
centro de la caja.
Del misma figura 1.1, se puede observar que la tendencia a minimizar esta claramente
hacia el tipo de recubrimiento 4, por lo que si el fabricante desea es minimizar la
conductividad con el tipo de recubrimiento se debe emplear el mismo, claro si la
correspondiente cuota económica lo permite así, pero es evaluación de otro tipo de
problemas.

1.3) Modelo de un DCA y descripción de los términos.


En cuadro siguiente se muestra el modelo lineal general que describe un DCA y
además se detallan para este problema que significa cada una de las variables en
cuestión.

1.4) Pruebas de Supuestos de normalidad e igualdad de varianzas.


Antes de proceder al análisis de Varianza (ANAVAR) en este problema, se deben
realizar pruebas a los supuestos de Normalidad e igualdad de Varianzas (varianzas
homogéneas), para el diseño en estudio.
Para comprobar la normalidad, se uso primero el criterio de comprobar la normalidad
de los datos por separados, es decir de la conductividad sin tomar en cuenta los
tratamientos, por tener números de muestras menores a 30, se usa la prueba de
Shapiro-Wilk, que resulta mas eficiente para números de muestras pequeñas.

Prueba de Shapiro-Wilk

Realizado por: Ing. G leal


normalidad Estadístico gl Sig.

Conductividad 0,928 16 0,230

H0= los datos siguen una tendencia normal.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,230
-Conclusión: se acepta la H0, por lo que los datos siguen una tendencia normal.

Si para los datos totales se cumplen la condición de normalidad, es de esperar que


para los datos discriminados por tratamientos también cumplan con este supuesto,
para fines académicos se realizo la prueba de normalidad, lo como se evidencia en la
tabla mostrada a continuación, donde todos los valores de Sig. > 0.05, con lo que se
demuestra que cada uno de los datos por tratamiento siguen a su vez la tendencia
normal.

Pruebas de Tipo de Recubrimiento Shapiro-Wilk


normalidad
Estadístico gl Sig.

Recubrimiento 1 ,971 4 ,850

Recubrimiento 2 ,963 4 ,798


Conductividad
Recubrimiento 3 ,949 4 ,712

Recubrimiento 4 ,926 4 ,572

Ahora el otro supuesto es la igualdad de varianzas o la homogeneidad de las


varianzas del experimento en estudio, esta se realiza con la prueba de Levene
respecto a las medias y se muestra el resultado de dicha prueba a continuación y da
como resultado un Valor de Sig = 0.122>0.05, con lo cual se concluye que las
varianzas son significativamente homogéneas.

Realizado por: Ing. G leal


Prueba de homogeneidad de la varianza Estadístico de gl1 gl2 Sig.
Levene
Basándose en la media 2,370 3 12 ,122

Basándose en la mediana. 2,207 3 12 ,140


Conductividad
Basándose en la mediana y con gl corregido 2,207 3 9,938 ,151

Basándose en la media recortada 2,375 3 12 ,121

H0= las varianzas son homogéneas.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,122
-Conclusión: se acepta la H0, por lo que las varianzas son homogéneas.

Para este experimento ya se realizaron las comprobaciones de los supuestos dando


como resultados que se cumplen los dos, por lo que se puede realizar un ANAVAR
sin incurrir a errores por violar los supuestos sobre los cuales reposa la teoría a
emplear.

1.5) Comprobación de las medias de la matriz de datos con el programa


SPSS20.
En los estadísticos descriptivos se da una tabla que contienen las medias del
experimento y se muestra a continuación.

Estadísticos descriptivos
Variable dependiente: Conductividad
Tipo de Recubrimiento Media Desviación Media de
típica matriz

Recubrimiento 1 145,00 3,916 145.00


Recubrimiento 2 145,25 6,652 145.25
Recubrimiento 3 132,25 3,862 132.25
Recubrimiento 4 129,25 2,062 129.25
Total 137,94 8,489 137.94

Realizado por: Ing. G leal


Como se puede observar las medias del programa concuerdan con las calculadas
inicialmente en la matriz de datos de Excel ®, por lo que se evidencia un buen
manejo de los mismos al cargarlos en el sistema.
Figura 1.2. Línea de tendencia de las medias de tratamientos contra la conductividad.

De la figura 1.2, se puede apreciar que existe una disminución significativa de las
medias entre los tratamientos 2 y 3, aunque no es tan marcado como en los
tratamientos 1 respecto al 2 y del 3 respecto al 4.
1.6) ANAVAR.

Pruebas de los efectos inter-sujetos


Variable dependiente: Conductividad
Origen Suma de gl Media F Sig.
cuadrados tipo cuadrática
III

Recubrimiento 844,688 3 281,563 14,302 ,000288


Error 236,250 12 19,688
Total 1080,938 15

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Realizado por: Ing. G leal
Sig= 0,000288
-Conclusión: se rechaza la H0, por lo que al menos un par de medias son diferentes.
Por el valor de Sig. (0.000288<0.01) Se puede decir que existen al menos un par de
las medias del experimento que son diferentes, aun no sabemos cuales, pero este
resultado ya se esperaba una vez analizado el diagrama de caja y de medias
marginales de los tratamientos (Figuras 1.1 y 1.2), esto indica que se justifica el
estudio debido a que si tiene incidencia significativa el tipo de recubrimiento sobre la
conductividad a un nivel inferior del 1 % de significación.

1.7) Conclusiones:

- No existen datos atípicos en la corrida experimental.


- Existe una tendencia clara de disminución de la conductividad en relación a los
tipos de recubrimiento que justifican el estudio.
- El tratamiento con mayor variación fue el tipo de recubrimiento 2 y el de menor
variación fue el 4.
- El tratamiento con menor conductividad fue el tipo de recubrimiento 4 y el de
mayor conductividad fue el 2.
- Se acepta la normalidad en los datos del problemas según Shapiro-Wilk
(P>0.05).
- Comprobando la normalidad de los datos pero discriminados por tratamientos
nos da el mismo resultados, los datos por tratamiento son todos normales
(P>0.05).
- Para la Prueba de Levene para igualdad de varianzas según las medias (P>0.123)
dio como resultado que se acepta la hipótesis nula con un valor de significación
mayor al 5%, es decir son homogéneas las varianzas del experimento.
- Se cumplieron los supuestos de Normalidad y Homogeneidad de Varianzas, por
lo que se puede realizar un ANAVAR.

Realizado por: Ing. G leal


- Se pudo constatar las conclusiones del diagrama de caja, con la distribución de
las medias de tratamiento contra la conductividad.
- Del ANAVAR, se concluye que existe una alta diferencia significativa en al
menos un par de medias de tratamiento, (P<0.01) debido al hecho que se rechaza
la hipótesis con un nivel de significancia inferior al 1%.
- Por el ANAVAR, se puede inferir que si existe una influencia del tipo de
recubrimiento sobre la conductividad del cinescopio a color.

Realizado por: Ing. G leal


Ejercicio 02. (3-17 del libro):

Un fabricante de semiconductores esta interesado en probar tres métodos que


desarrollo para reducir el conteo de partículas en las obleas, para lo cual se obtienen
los siguientes datos

Desde el punto de visto de diseño de experimento, realice los análisis y


recomendaciones al fabricante si se desea es minimizar el conteo de partículas en las
obleas.

3.1) Presentación del planteamiento del diseño experimental.


Por la estructura que presentan los datos del problema y lo que se requiere del mismo,
se infiere que el diseño más idóneo para su análisis es el de DCA, ya que no se tienen
variables externas que no se puedan controlar o que sean conocidas. A continuación
se presentan la descripción de las variables y la matriz de datos para el programa.

Variables:
Independiente: Tipo de método. (1, 2, 3)
Dependiente: Conteo de Partículas en las Obleas.
Experimento:
Tratamientos: t=3.
Repeticiones: r= 5.
Unidades Exp.: N=t.r=15.

Realizado por: Ing. G leal


Método de fabricación repetición Conductividad
1 1 31
1 2 10
1 3 21
1 4 4
1 5 1
2 1 62
2 2 40
2 3 24
2 4 30
2 5 35
3 1 53
3 2 27
3 3 120
3 4 97
3 5 68

La matriz de datos para el DCA, realizada en EXCEL ®, según los datos recabados se
muestra a continuación, en la cual se pueden observar los valores promedios por
tratamiento y los totales y promedios generales del experimento en estudio, esto se
realiza a fines de verificar la manipulación del SPSS 20 ® y además con fines
académicos.

ento Repeticiones Total Promedio


a mi
Tr at 1 2 3 4 5
1 31 10 21 4 1 67 13,40
2 62 40 24 30 35 191 38,20
3 53 27 120 97 68 365 73,00
623 41,53
G.T.: Gran total G.T. M.G.
M.G.: Media general

Realizado por: Ing. G leal


3.2) Diagnostico de los datos, empleando representación grafica.
Figura 2.1. Diagrama de caja del conteo de partículas contra los métodos de fabricación.

De la figura 2.1 se puede deducir que existe una variabilidad entre las medias de los
diferentes tratamientos, hecho evidenciado por la franja en la cual se mueven las
mismas, que va desde un conteo de partículas por obleas de casi 10 a una un poco
menor de 80, esta variación entre las medias es indicativo de que posiblemente si
exista una relación entre el tipo de método para reducir el conteo de partículas en las
obleas y la variable en estudio el conteo de partículas en las obleas, adicionalmente
no se perciben solapamientos entre los tratamientos con lo cual se esperaría
diferencias entre los pares de medias una vez realizados los análisis correspondientes.
Además existe un valor atípico o lejano a los cuartiles del diagrama, en el método 2,
el cual hay que tener en cuenta a la hora de realizar los análisis posteriores y evaluar
la posibilidad y justificación para proceder a eliminarlo como dato del experimento,
lo que nos dejaría un DCA desbalanceado. Por otro lado, es de notar que el método
con mayor variabilidad es el numero 3 y los dos primeros poseen una variabilidad
mucho menor.
Igualmente de la figura se puede deducir que si el fabricante desea es la disminución
del conteo de partículas en las obleas el método a emplear seria el numero 1,

Realizado por: Ing. G leal


confiando en que los factores de medición y costo de aplicar el mismo no sea
considerablemente mayor al de los otros 2.

3.3) Modelo de un DCA y descripción de los términos.


En cuadro siguiente se muestra el modelo que describe un DCA y además se detallan
para este problema que significa cada una de las variables en cuestión.

3.4) Pruebas de Supuestos de normalidad e igualdad de varianzas.


Antes de proceder al análisis de Varianza (ANAVAR) en este problema, se deben
realizar pruebas a los supuestos de Normalidad y a que se tienen igualdad de
Varianzas o que las varianzas son homogéneas, si se cumplen ambos supuestos se
puede realizar un análisis paramétrico de los datos del experimento.
Para comprobar la normalidad, se procedió a comprobar la normalidad de los datos
por separados, es decir los datos de conteo de partículas, sin tomar en cuenta los
tratamientos; además por tener números de muestras menores a 30, se usa la prueba
de Shapiro-Wilk, que es mas adecuada para muestras pequeñas.

Pruebas de normalidad Shapiro-Wilk

Estadístico gl Sig.

Conteo de partículas 0,906 15 0,118

H0= los datos siguen una tendencia normal.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,118
-Conclusión: se acepta la H0, por lo que los datos siguen una tendencia normal.por: Ing. G leal
Realizado
Confines académicos se procedió a comprobar la normalidad para los datos
discriminados por tratamientos aunque se sabe que si para los datos totales se
cumplen la condición de normalidad, para los datos vistos por tratamiento también
deben cumplirlo, como se evidencia en la tabla mostrada a continuación, donde todos
los valores de Sig. > 0.05.

Pruebas de Método de Fabricación Shapiro-Wilk


normalidad
Estadístico gl Sig.

Método de Fabricación 1 ,931 5 ,600

Conteo de partículas Método de Fabricación 2 ,902 5 ,421

Método de Fabricación 3 ,985 5 ,960

Ahora el otro supuesto es la igualdad de varianzas o la homogeneidad de las


varianzas del experimento en estudio, esta se realiza con la prueba de Levene
respecto a las medias.

Prueba de homogeneidad de la varianza Estadístico de gl1 gl2 Sig.


Levene
Basándose en la media 3,844 2 12 0,051
Basándose en la mediana. 2,700 2 12 ,108

Basándose en la mediana y
Conteo de partículas 2,700 2 7,201 ,133
con gl corregido

Basándose en la media
3,826 2 12 ,052
recortada

H0= las varianzas son homogéneas.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,051
-Conclusión: se acepta la H0, por lo que las varianzas son homogéneas.
Realizado por: Ing. G leal
Las varianzas son iguales u homogéneas, pero a un nivel de significancia baja, casi
del 5%, esto puede deberse al valor atípico del método 2, habría que saber más del
problema en si para poder decidir si eliminar ese dato de la matriz o dejarlo.
Por otro lado este experimento cumple con los supuestos, por lo que se puede realizar
un ANAVAR sin incurrir a errores por violar los supuestos sobre los cuales reposa la
teoría a emplear.

3.5) Comprobación de las medias de la matriz de datos con el programa


SPSS20.
En los estadísticos descriptivos se da una tabla que contienen las medias del
experimento y se muestra a continuación.

Estadísticos descriptivos
Variable dependiente: Conteo de partículas

Método de Fabricación Media Desviación Medias


típica de matriz

Método de Fabricación 1 13,40 12,462 13.40


Método de Fabricación 2 38,20 14,567 38.20
Método de Fabricación 3 73,00 36,490 73.00
Total 41,53 33,551 41.53

Como se puede observar las medias del programa concuerdan con las calculadas
inicialmente en la matriz de datos (EXCEL ®), por lo que se evidencia un buen
manejo de los mismos al cargarlos en el sistema.

Figura 2.2. Línea de tendencia de las medias de tratamientos contra el conteo de partículas.

Realizado por: Ing. G leal


3.6) ANAVAR.
Pruebas de los efectos inter-sujetos
Variable dependiente: Conteo de partículas

Origen Suma de gl Media F Sig.


cuadrados tipo cuadrática
III
M.F. 8963,733 2 4481,867 7,914 ,006
Error 6796,000 12 566,333
Total corregida 15759,733 14

H0= Medias iguales.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,006
Por el-Conclusión:
valor de Sig.=0.006<0.01, se puede
se rechaza la H0, por decir
lo que al queunexisten
menos al menos
par de medias sonun par de las
diferentes.
medias del experimento que son significativamente diferentes, aun no sabemos
cuales, pero este resultado ya se esperaba una vez analizado el diagrama de caja y de
medias marginales de los tratamientos (Figuras 2.1 y 2.2), esto indica que se justifica

Realizado por: Ing. G leal


el estudio debido a que si tiene incidencia el método desarrollado para el conteo de
partículas en las obleas a un nivel inferior al 1 % de significación.

3.7) Conclusiones:

- Se posee un valor atípico en los datos del método de medición 2.


- Se evidencia una tendencia en las medias de los tratamientos.
- Existe variación entre las medias de los tratamientos, por lo que se espera den
diferencias significativas entre las mismas.
- Según Shapiro-Wilk con un nivel de significancia superior al 5%, se acepta que
los datos tanto generales como discriminados por tratamientos siguen una
distribución normal.
- Según Levene (P>0.05) se acepta que la igualdad de varianza en el experimento
estudiado.
- se cumplen los dos supuestos por lo que se puede realizar el ANAVAR.
- Por la figura 2.2 se puede inferir que el conteo de partículas en las obleas se
aumenta si se emplea el método 1, 2 o 3, viéndose mas marcada la diferencia
entre las medias de los métodos 1 y 2 respecto a la 3.
- Del ANAVAR (P<0.01) se puede concluir que existe una diferencia inferior al
1% de significancia entre al menos un par de medias del experimento.
- Por rechazar la hipótesis nula de que las medias son todas iguales se puede
concluir que si existe un efecto de los métodos de medición desarrollados y el
conteo de partículas en las obleas a un nivel de significancia inferior al 1%.

Realizado por: Ing. G leal


D.B.A. (Diseño de Bloques aleatorizado)
Ejercicio 03. (4-13 del libro):
Un ingeniero realizo un experimento sobre el tiempo de enfoque del ojo, le interesa
en concreto el efecto de la distancia del objeto sobre el tiempo de enfoque, por lo que
empleo para la evaluación 4 distancias diferentes que son de su interés, además
cuanta con5 sujetos para realizar esta operación. Debido a la diferencia que puede
haber entre los sujetos, se realiza una discriminación de los datos en función de los
mismos, obteniendo los siguientes resultados.

Empleando un nivel de significancia del 5%, se solicita analizar los resultados


obtenidos.
3.1) Presentación del planteamiento del diseño experimental.
Por la estructura que presentan los datos del problema y lo que se requiere del mismo,
se infiere que el diseño más idóneo para su análisis es el de DBA, ya que se bloquea
así el efecto de los sujetos sobre la respuesta, es decir el tiempo de enfoque del ojo. A
continuación se muestra la descripción de las variables y aparte la matriz de datos
para ingresar al SPSS 20 ®.
Variables
*-Independiente: Distancia (pies).
( 4, 6,8,10)
*-Dependientes: tiempo de enfoque del ojo
*- Bloqueo por: sujetos
Diseño de Experimento
*-Tratamiento (t) : 4
*-Bloques (r) : 5
*-Unidades Exp. (N): 20

Realizado por: Ing. G leal


Distancia ( pies) Sujeto Tiempo de
enfoque del ojo
1 1 10
1 2 6
1 3 6
1 4 6
1 5 6
2 1 7
2 2 6
2 3 6
2 4 1
2 5 6
3 1 5
3 2 3
3 3 3
3 4 2
3 5 5
4 1 6
4 2 4
4 3 4
4 4 2
4 5 3

La matriz de datos para el DBA, según los datos recabados se muestra a continuación,
en la cual se pueden observar los valores promedios por tratamiento, bloques y los
totales y promedios generales del experimento en estudio.

Tratamiento Bloques (sujetos) Total Promedio


(distancia Pies) 1 2 3 4 5
4 10 6 6 6 6 34 6,8
6 7 6 6 1 6 26 5,2
8 5 3 3 2 5 18 3,6
10 6 4 4 2 3 19 3,8
Total 28 19 19 11 20 97 X
Promedio 7 4,75 4,75 2,75 5 X 4,85
GT: 97
MG: 4,85

3.2) Diagnostico de los datos, empleando representación grafica.

Realizado por: Ing. G leal


Figura 3.1. Diagramas de caja para el ejercicio 4-13.

De la figura 3.1, se puede analizar la situación que senos planteara en lo subsiguiente;


la de figura 3.1-A salta a la vista es la existencia de valores atípicos para el tiempo de
enfoque contra las distancias de estudio, pero aparte de eso por las medias se puede
inferir que hay tendencia en las mismas, por lo que se podría esperar diferencias entre
las mismas.
De la figura 3.1-B, se puede decir que no hay valores atípicos y además que existe
una clara variación entre las medias del tiempo de enfoque en función de los sujetos
empleados en la evaluación, por lo que a primera vista se puede decir que si se ve
efectivo el bloqueo, pues esta variable interfiere en la respuesta obtenida.

3.3) Modelo de un DBA y descripción de los términos.

Realizado por: Ing. G leal


En cuadro siguiente se muestra el modelo que describe un DBA y además se detallan
para este problema que significa cada una de las variables en cuestión.
Modelo

Donde:
: es el tiempo de enfoque del ojo observada en la
i-esima distancia y el j-esimo sujeto.
Media General del experimento.
: Efecto real de la i-esima distancia.
Efecto real del j-esimo sujeto.
Error Experimental asociado a la i-esima
distancia y el j-esimo sujeto.

3.4) Pruebas de Supuestos de normalidad e igualdad de varianzas.


Antes de proceder al análisis de Varianza (ANAVAR) en este problema, se deben
realizar pruebas a los supuestos de Normalidad y a que se tienen igualdad de
Varianzas o que las varianzas son homogéneas, si se cumplen ambos supuestos se
puede realizar un análisis paramétrico de los datos del experimento.
Para comprobar la normalidad, se uso primero el criterio de comprobar la normalidad
de los datos por separados, es decir los datos de conteo de partículas, sin tomar en
cuenta los tratamientos; además por tener números de muestras menores a 30, se usa
la prueba de Shapiro-Wilk.

Pruebas de normalidad Shapiro-Wilk

Estadístico gl Sig.

Tiempo de Enfoque del ojo ,921 20 ,104

H0= los datos siguen una tendencia normal.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,104
-Conclusión: se acepta la H0, por lo que los datos siguen una tendencia normal.

Realizado por: Ing. G leal


En este caso, por interés académico, se verifico que para los datos globales se cumple
el principio de normalidad al discriminar por el tratamiento de interés (distancia)
resulta que los primeros tratamientos no dan normales, pero, los dos restantes si y con
alto nivel de significancia, sin embargo al dar los datos globales con tendencia
normal, basta para decir que se cumple con este supuesto, sin embargo es un hecho
interesante lo que estos datos para los primeros tratamientos están arrojando.

Pruebas de Distancia Shapiro-Wilk


normalidad
(pies) Estadístico gl Sig.

4 pies ,552 5 ,000

Tiempo de 6 pies ,697 5 ,009


Enfoque del ojo 8 pies ,852 5 ,201

10 pies ,956 5 ,777

Ahora el otro supuesto es la igualdad de varianzas o la homogeneidad de las


varianzas del experimento en estudio, esta se realiza con la prueba de Levene
respecto a las medias.

Prueba de homogeneidad de la varianza Estadístico de gl1 gl2 Sig.


Levene
Basándose en la media ,368 3 16 ,777
Basándose en la mediana. ,054 3 16 ,983
Tiempo de Enfoque del ojo Basándose en la mediana y con
,054 3 11,420 ,983
gl corregido

Basándose en la media recortada ,244 3 16 ,864

H0= las varianzas son homogéneas.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,777
-Conclusión: se acepta la H0, por lo que las varianzas son homogéneas.
Las varianzas son iguales u homogéneas, por un nivel de significancia mayor al 5%.

Realizado por: Ing. G leal


Por otro lado este experimento cumple con los supuestos, por lo que se puede realizar
un ANAVAR sin incurrir a errores por violar los supuestos sobre los cuales reposa la
teoría a emplear.

3.5) Comprobación de las medias de la matriz de datos con el programa


SPSS20.
En los estadísticos descriptivos se da una tabla que contienen las medias del
experimento y se muestra a continuación.

1. Distancia (pies)
Variable dependiente: Tiempo de Enfoque del ojo

Distancia (pies) Media Error típ. Medias de Matriz

4 pies 6,800 ,505 6.8


6 pies 5,200 ,505 5.2
8 pies 3,600 ,505 3.6
10 pies 3,800 ,505 3.8

2. Sujeto
Variable dependiente: Tiempo de Enfoque del ojo

Sujeto Media Error típ. Medias de Matriz

Sujeto 1 7,000 ,565 7.00


Sujeto 2 4,750 ,565 4.75
Sujeto 3 4,750 ,565 4.75
Sujeto 4 2,750 ,565 2.75
Sujeto 5 5,000 ,565 5

Como se puede observar las medias del programa concuerdan con las calculadas
inicialmente en la matriz de datos, por lo que se evidencia un buen manejo de los
mismos al cargarlos en el sistema.
Figura 3.2. Línea de tendencia de las medias del ejercicio 4-13.

Realizado por: Ing. G leal


De la figura 3.2, se interpretar que si hay efectos entre los factores distancia y sujeto,
en el tiempo de enfoque del ojo, por lo que se justifica por las medias de los
tratamientos el bloqueo por sujeto que se realizo en el experimento. Cabe destacar
que para los sujetos, los números 2 y 3 exhiben las mismas medias y a su vez se
puede expresar que estos mismos junto con el sujeto 5 se comportaron de manera
similar, caso contario de lo ocurrido con los sujetos 1 y 4, que si difieren de los otros
en observación. En cuanto a la distancia la tendencia es una marcada disminución del
tiempo de enfoque a medida que se ve incrementando la misma, además se puede
notar una leve estabilidad después de los 8 pies de distancia, ahora se tendría que
evaluar que tan cerca se puede colocar al sujeto del proceso o maquinaria para poder
incrementar el enfoque del ojo del mismo, lo cual daría fruto a una nueva
investigación para poder mejorar aun mas los datos recabados.

3.6) ANAVAR.

Una vez que se verificaron y cumplieron los supuestos, se puede dar paso a realizar el
análisis de las varianzas de forma paramétrica, teniendo plena confianza de que el
modelo lineal general si cumple con las bases sobre las cuales se creo el mismo.

Realizado por: Ing. G leal


Pruebas de los efectos inter-sujetos
Variable dependiente: Tiempo de Enfoque del ojo

Origen Suma de gl Media F Sig.


cuadrados cuadrática
tipo III
distancia 32,950 3 10,983 8,614 ,003
sujeto 36,300 4 9,075 7,118 ,004
Error 15,300 12 1,275
Total corregida 84,550 19

H0= las medias son iguales.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig (distancia)= 0.003
Sig (Sujeto)=0.004
-Conclusión: se rechaza la H0, por lo que, al menos un par de medias son diferentes.

Del ANAVAR, se tiene que existe diferencia altamente significativas para el factor de
los tratamientos, la Distancia y para los bloques, los sujetos, con un nivel de
significación menor al 1% (p<0.01) lo cual implica que existe al menos un par de
medias en el estudio que son diferentes, por lo que la distancia y los sujetos si tienen
un influencia significativa sobre la variable en estudio, el tiempo de enfoque del ojo.
Además esto nos da la certeza de que se realizo de forma acertada el bloqueo por
sujeto en el diseño del experimento, puesto que el mimo si es fuente de variabilidad
para los resultados del estudio. Es de notar, que la variable distancia es la que ofrece
mayor diferencia significativa sobre la variable “sujeto”, por lo que se comprueba
fehacientemente que esta es la que debe ser la principal variable en estudio.

3.7) Conclusiones:

- Del diagrama de caja, se infiere que existe una tendencia en las medias.

Realizado por: Ing. G leal


- Se puede concluir que se espera diferencia significativa entre los pares de medias
del experimento.
- Se comprobaron que las medias calculadas por Excel® y las arrojadas por el
sistema SPSS 20 ® son iguales, lo cual denota un buen manejo de los datos al
transferirlos al mismo.
- De la grafica de medias de las distancias, se aprecia que a medida que se
incrementa la distancia se disminuye el tiempo de enfoque del ojo y se estabiliza
luego de 8 pies de distancia.
- De la grafica de medias de sujetos, se ve que se esperan diferencias e interacción
entre los sujetos y el tiempo de enfoque del ojo.
- Se corroboraron los supuestos de normalidad ( para todos los datos y
discriminados por tratamientos) y de igualdad de varianzas, ante las cuales los
datos del estudio, fueron aceptadas con un nivel de significancia superior al 5 %
(P>0.05).
- Del análisis de varianza realizado, se puede concluir que existen diferencias
altamente significativas para los tratamientos, distancia, y para los bloques,
sujetos, lo cual conduce a que existe al menos un par de medias de tratamientos
que son diferentes, significando esto que si hay interacción entre los factores
distancia y sujetos en la respuesta de interés, tiempo de enfoque del ojo, a un
nivel de significancia menor del 1% (P<0.01).
- Se corroboro con el ANAVAR, las conclusiones extraídas gráficamente, tanto
del diagrama de caja, como del grafico de medias de tratamientos, por lo cual
estas representaciones dan buena base para poder realizar análisis de que se
espera de los datos del estudio.

Realizado por: Ing. G leal


D.C.L. (Diseño Cuadrado Latino)
Ejercicio 04. (4-14 del libro):
Una empresa de productos químicos esta interesada en evaluar el tiempo de reacción
de un proceso de polimerización, para esto desean verificar que efecto tiene el utilizar
5 diferentes monómeros de partida, los cuales se denotan como A,B,C,D y E. Se
cuentan con lotes para cada monómero y los mismos alcanzan para 5 corridas de la
reacción, además la preparación y puesta en marcha del proceso lleva
aproximadamente 2 horas, por lo que en producción solo pueden realizar 5 corridas
por día. Se solicita que se analice los efectos de los monómeros iniciales sobre el
tiempo de reacción.

4.1) Presentación del planteamiento del diseño experimental.


Se puede apreciar que el efecto o factor principal del estudio es el posible efecto que
puede introducir los monómeros iniciales ( A, B, C, D y E) en el tiempo de reacción,
pero, se sabe que al tener que hacer la experimentación en días distintos se pude tener
una fuente de variabilidad, que debe ser compensada por un bloqueo en este sentido,
pero además se cuentan con 5 lotes diferentes de cada monómero, y entre lote, se
puede tener también variabilidad, por lo que seria conveniente evaluar si ejerce un
efecto externo y bloquear en ese sentido, de lo cual que el diseño mas adecuado para
tratar este estudio experimental es un Cuadrado latino, debido a que con el mismo se
bloquea en fila y columna y además p=t=f=c= 5, condición necesaria para realizar
dicho arreglo. A continuación se muestra la descripción de las variables del diseño de
experimentos.

Realizado por: Ing. G leal


Variables
*-Independiente: INGREDIENTES.
( A,B,C,D,E)
*-Dependientes: tiempo de reaccion
*- Bloqueo por: Dias
Lotes
Diseño de Experimento
*-Tratamiento (t) : 5
*-Bloques (r) : 5
*-Unidades Exp. (N): 25

lote Día Monómero Tiempo de reacción.


1 1 1 8
1 2 2 7
1 3 4 1
1 4 3 7
1 5 5 3
2 1 3 11
2 2 5 2
2 3 1 7
2 4 4 3
2 5 2 8
3 1 2 4
3 2 1 9
3 3 3 10
3 4 5 1
3 5 4 5
4 1 4 6
4 2 3 8
4 3 5 6
4 4 2 6
4 5 1 10
5 1 5 4
5 2 4 2
5 3 2 3
5 4 1 8
5 5 3 8

Se muestra adicionalmente, la matriz de datos a ingresar en el SPSS 20 ®, donde el


tipo de monómero se etiqueto como 1, 2, 3, 4 y 5 para el monómero A, B, C, D y E,
respectivamente.

Realizado por: Ing. G leal


La matriz de datos para el DCL, según los datos recabados se muestra a continuación,
en la cual se pueden observar los valores promedios por tratamiento, bloques y los
totales y promedios generales del experimento en estudio.

LOTES DE Dias Total Promedio Tratamiento Total promedio


MP. 1 2 3 4 5 Yi.. Y..k
A B D C E
1 26 5,2 A=1
8 7 1 7 3 42 8,4
C E A D B
2 31 6,2 B=2
11 2 7 3 8 28 5,6
B A C E D
3 29 5,8 C=3
4 9 10 1 5 44 8,8
D C E B A
4 36 7,2 D=4
6 8 6 6 10 17 3,4
E D B A C
5 25 5 E=5
4 2 3 8 8 16 3,2
TOTAL 33 28 27 25 34 147 X X 147 X

PROMEDIO 6,6 5,6 5,4 5 6,8 X 5,88 X X 5,88

GT: 147
MG: 5,88

4.2) Diagnostico de los datos, empleando representación grafica.


Figura 4.1. Diagramas de caja para el ejercicio 4-14.

Realizado por: Ing. G leal


De la figura 4.1, se puede deducir que existen una variabilidad marcada entre las
medias de los tratamientos respecto al tipo de monómero y el tiempo de reacción,
teniendo una tendencia a disminuir a medida que se pasa del monómero A al E, por
que se esperaría un efecto de esta variable sobre el estudio, además no se observan
valores atípicos o fuera de los cuartiles.
En cuanto a los bloques, para el caso de los días, no es apreciable una gran
variabilidad entre las medias de los tratamientos, por lo que se puede decir es un
proceso estable que no posee variación entre sus días, pero, hay que realizar el
análisis de las varianzas para poder corroborar esta información, al igual sucede con
los tipos de lotes, donde no se ve una diferencia tan grande entre las medias
estudiadas.
No se observan valores atípicos o fuera de los cuartiles entre los datos de los bloques.

4.3) Modelo de un DCL y descripción de los términos.


En cuadro siguiente se muestra el modelo que describe un DCL y además se detallan
para este problema que significa cada una de las variables en cuestión.
Modelo
𝑘 𝑘 𝛼
Donde:
𝑘:
es el tiempo de reacción observado con el

I-esimo lote, j-esimo Día y el k-esimo ingrediente.


Media General del experimento.
𝛼: Efecto real del i-esimo lote.
: Efecto real del j-esimo día.
𝑘:
Efecto real del k-esimo ingrediente.
Error Experimental asociado al i-esimo lote,
el j-esimo día y el k-esimo ingrediente.

4.4) Pruebas de Supuestos de normalidad e igualdad de varianzas.

Realizado por: Ing. G leal


Antes de proceder al análisis de Varianza (ANAVAR) en este problema, se deben
realizar pruebas a los supuestos de Normalidad y a que se tienen igualdad de
Varianzas o que las varianzas son homogéneas, si se cumplen ambos supuestos se
puede realizar un análisis paramétrico de los datos del experimento.
Para comprobar la normalidad, se uso primero el criterio de comprobar la normalidad
de los datos por separados, es decir los datos de tiempo de reacción, sin tomar en
cuenta los tratamientos; además por tener números de muestras menores a 30, se usa
la prueba de Shapiro-Wilk.

Pruebas de Shapiro-Wilk
normalidad Estadístico gl Sig.

Tiempo de Reacción ,951 25 ,258

a. Corrección de la significación de Lilliefors

H0= los datos siguen una tendencia normal.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,258
-Conclusión: se acepta la H0, por lo que los datos siguen una tendencia normal.

Para fines académicos, se verifico que para los datos globales se cumpliera el
principio de normalidad al discriminar por el tratamiento de interés, el tipo de
monómero, resultando que todos los tratamientos siguen tendencias normales, y con
alto nivel de significancia, como se muestra en la tabla que se muestra a continuación.

Monómeros Shapiro-Wilk
Pruebas de normalidad
Estadístico gl Sig.

Realizado por: Ing. G leal


Monómero A ,961 5 ,814

Monómero B ,952 5 ,754

Tiempo de Reacción Monómero C ,914 5 ,490

Monómero D ,952 5 ,754

Monómero E ,979 5 ,928

a. Corrección de la significación de Lilliefors

Ahora el otro supuesto es la igualdad de varianzas o la homogeneidad de las


varianzas del experimento en estudio, esta se realiza con la prueba de Levene
respecto a las medias.

Prueba de homogeneidad de la varianza Estadístico de gl1 gl2 Sig.


Levene
Basándose en la media ,797 4 20 ,541

Basándose en la mediana. ,444 4 20 ,775

Basándose en la mediana y
Tiempo de Reacción ,444 4 18,788 ,775
con gl corregido

Basándose en la media
,782 4 20 ,550
recortada

H0= las varianzas son homogéneas.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig= 0,541
-Conclusión: se acepta la H0, por lo que las varianzas son homogéneas.

Las varianzas son iguales u homogéneas, por un nivel de significancia mayor al 5%.
Por otro lado este experimento cumple con los supuestos, por lo que se puede realizar
un ANAVAR sin incurrir a errores por violar los supuestos sobre los cuales reposa la
teoría a emplear.
4.5) Comprobación de las medias de la matriz de datos con el programa
SPSS20.

Realizado por: Ing. G leal


En los estadísticos descriptivos se da una tabla que contienen las medias del
experimento y se muestra a continuación.

1. Monómeros
Variable dependiente: Tiempo de Reacción

Monómeros Media Error típ. Matriz de datos

Monómero A 8,400 ,791 8.4


Monómero B 5,600 ,791 5.6
Monómero C 8,800 ,791 8.8
Monómero D 3,400 ,791 3.4
Monómero E 3,200 ,791 3.2

2. Días
Variable dependiente: Tiempo de Reacción

Días Media Error típ. Matriz de datos

Día 1 6,600 ,791 6.6


Día 2 5,600 ,791 5.6
Día 3 5,400 ,791 5.4
Día 4 5,000 ,791 5
Día 5 6,800 ,791 6.8

3. Lote de MP
Variable dependiente: Tiempo de Reacción

Lote de MP Media Error típ. Matriz de datos

Lote N 1 5,200 ,791 5.2


Lote N 2 6,200 ,791 6.2
Lote N 3 5,800 ,791 5.8
Lote N 4 7,200 ,791 7.2
Lote N 5 5,000 ,791 5

Realizado por: Ing. G leal


Como se puede observar las medias del programa concuerdan con las calculadas
inicialmente en la matriz de datos, por lo que se evidencia un buen manejo de los
mismos al cargarlos en el sistema.

Figura 4.2. Línea de tendencia de las medias del ejercicio 4-14.

En la figura 4.2 se pueden apreciar las tendencias de las medias tanto para los
bloques, como para el tratamiento de interés, se puede apreciar que los rangos de
variación de las medias no son tan marcados en los bloques como lo es en los
tratamientos, por lo que se puede esperar que el efecto sobre el tiempo de reacción

Realizado por: Ing. G leal


solo se vea afectado de forma significativa por el tipo de monómeros y no por los
lotes de los mismos, ni el día en que se realiza la operación.
Además se puede apreciar como el monómero c es el que da mayor tiempo de
reacción promedio y el E da el menor tiempo de buscar, seguido muy cerca del
Monómero D, si se desea es la disminución de este tiempo se podría recomendar el
uso de cualquiera de estos dos monómeros.
4.6) ANAVAR.

Una vez que se verificaron y cumplieron los supuestos, se puede dar paso a realizar el
análisis de las varianzas de forma paramétrica, teniendo plena confianza de que el
modelo lineal general si cumple con las bases sobre las cuales se creo el mismo.

Pruebas de los efectos inter-sujetos


Variable dependiente: Tiempo de Reacción

Origen Suma de gl Media F Sig.


cuadrados tipo cuadrática
III

lote 15,440 4 3,860 1,235 ,348


días 12,240 4 3,060 ,979 ,455
Monómeros 141,440 4 35,360 11,309 ,00049
Error 37,520 12 3,127
Total 206,640 24

H0= las medias son iguales.

Rechazo Aceptación
0,05 > >= 0,05
Sig o p-valor
Sig (T. Monómero)= 0.00049
Sig (Lote)=0.348
Sig (Días)=0.455
Del ANAVAR,
-Conclusión: se tienen
se rechaza la diferencias altamentealsignificativas
H0, para tratamiento, menos un par en
de al menos
medias un par de
son
tipo de momero
diferentes, pero,(Sig. <0.01),
se acepta Pero,
para en los bloque
los bloques, dio como resultado que los mismos
días y lote.
no tienen diferencias entre sus medias que sean significativas.
Estos resultados se pueden interpretar que el tipo de monómero tiene influencia sobre
el tiempo de reacción de forma significativa, además los lotes y días de producción no

Realizado por: Ing. G leal


son fuente de variación en el proceso evaluado, es mas se puede decir que el proceso
es estable y no hay variación de resultados en referencia al día donde se haga la
producción, por otro lado no se justifica el bloqueo por días y lotes, ante lo cual el
experimento en otra ocasión se puede realizar como un DCA.

4.7) Conclusiones:

- Del diagrama de caja, se infiere que existe una tendencia en las medias y que
existe muchos valores fuera de los cuartiles.
- Se puede concluir que se espera diferencia significativa entre los pares de medias
del experimento.
- Se comprobaron que las medias calculadas por Excel® y las arrojadas por el
sistema SPSS 20 ® son iguales, lo cual denota un buen manejo de los datos al
transferirlos al mismo.
- De la grafica de medias, se aprecia que el monómero C tiene mayor tiempo de
reacción y el E el menor tiempo de todos.
- De la grafica de medias de sujetos, se ve que se esperan diferencias e interacción
entre los sujetos y el tiempo de enfoque del ojo.
- Se corroboraron los supuestos de normalidad (para todos los datos y
discriminados por tratamientos) y de igualdad de varianzas, ante las cuales los
datos del estudio, fueron aceptadas con un nivel de significancia superior al 5 %
(P>0.05).
- Del análisis de varianza realizado, se puede concluir que existen diferencias
altamente significativas para los tratamientos (Sig < 0.01), tipo de monómero, y
no existe diferencias para los bloques (Sig >0.05), lotes y día de producción, por
lo que se concluye que el tipo de monómero es la única fuente de variación en el
tiempo de reacción y no los lotes y días, por lo que el diseño de DCL no se
justifica estadísticamente.

Realizado por: Ing. G leal

You might also like