You are on page 1of 16

SEP DGEST SNEST

TECNOLÓGICO NACIONAL DE MÉXICO


INSTITUTO TECNOLÓGICO DE CERRO
AZUL
ESTADÍSTICA INFERENCIAL II

UNIDAD 5” DISEÑO EXPERIMENTAL CON


BLOQUES AL AZAR Y DISEÑOS
FACTORIALES”

Presentado por:
Arenas Bautista Astrid Adhara 16500567
Arteaga Roque Ana Rocío 16500568
Castro Roque Daniela Estrella 16500
González Gómez Alma Ruth 16500581
Gómez Ascencio Francisco Javier 16500580
Sánchez Jiménez Dulce Isabel 15500593

ING. EN GESTIÓN EMPRESARIAL

Catedrático(a):
Lic: Eglantina Chue Rubio.

Cerro Azul, Ver Fecha: 21/11/2018


Unidad 5: Diseño experimental con
bloques al azar y diseños
factoriales.

5.1Metodología del diseño


experimental de bloques al azar.
5.2Diseño de experimentos
factoriales.
5.3Diseño factorial 2ⴷk
5.4Diseño de cuadrados latinos.
5.5Diseño de cuadrados grecolatinos.
5.6 Aplicaciones.

Diseño experimental con bloques al azar y diseños factoriales .


Cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor,
es deseable que las posibles diferencias se deban principalmente al factor de interés
y no a otros factores que no se consideran en el estudio. Cuando esto no ocurre y
existen otros factores que no se controlan o nulifican para hacer la comparación, las
conclusiones podrían ser afectadas sensiblemente.
Por ejemplo, supongamos que se quieren comparar varias máquinas, si cada
máquina es manejada por un operador diferente y se sabe que éste tiene una
influencia en el resultado, entonces es claro que el factor operador debe tomarse en
cuenta si se quiere comparar a las máquinas de manera justa. Un operador más
hábil puede hacer ver a su máquina (aunque ésta sea la peor) como la que tiene el
mejor desempeño, lo cual impide hacer una comparación adecuada de los equipos.
Para evitar este sesgo hay dos maneras de anular el posible efecto del factor
operador: la manera lógica es utilizar el mismo operador en las cuatro máquinas;
sin embargo, tal estrategia no siempre es aconsejable, ya que utilizar el mismo
sujeto elimina el efecto del factor operador pero restringe la validez de la
comparación con dicho operador, y es posible que el resultado no se mantenga al
utilizar a otros operadores.
La otra forma de anular el efecto operador en la comparación consiste en que cada
operador trabaje durante el experimento con cada una de las máquinas. Esta
estrategia es la más recomendable, ya que utilizar a todos los operadores con todas
las máquinas permite tener resultados de la comparación que son válidos para todos
los operadores. Esta forma de nulificar el efecto de operadores, recibe el nombre de
bloque.

5.1Metodología del diseño experimental de bloques al azar.


Los factores de bloque entran al estudio en un nivel de importancia secundaria con
respecto al factor de interés y, en este sentido, se puede afirmar que se estudia un
solo factor, porque es uno el factor de interés. En un diseño en bloques completos
al azar (DBCA) se consideran tres fuentes de variabilidad:
 El factor de tratamientos
 El factor de bloque
 El error aleatorio
Es decir, se tienen tres posibles ¨culpables¨ de la variabilidad presente en los datos.
La palabra completo en el nombre del diseño se debe a que en cada bloque se
prueban todos los tratamientos, o sea, los bloques están completos. La
aleatorización se hace dentro de cada bloque; por lo tanto, no se realiza de manera
total como en el diseño completamente al azar.
Los factores de bloqueo que aparecen en la práctica son: Turno, lote, día, tipo de
material, línea de producción, operador, maquina, método, etc. Supongamos una
situación experimental con k tratamientos y b bloques. El aspecto de los datos para
este caso se muestra en la tabla. Considerando una repetición en cada combinación
de tratamiento y bloque.

Modelo estadístico: Cuando


se decide utilizar un DBCA, el
experimentador piensa que
cada medición será el
resultado del efecto del
tratamiento donde se
encuentre, del efecto al que
pertenece y de cierto error
que se espera sea aleatorio.
El modelo estadístico para
este diseño está dado por:
Hipótesis a probar
La hipótesis de interés es la
misma para todos los diseños
comparativos, y está pada
por:
Que también se puede
expresar como

En cualquiera de estas hipótesis la afirmación a probar es que la respuesta media


poblacional lograda con cada tratamiento es la misma para los k tratamientos y que,
por lo tanto, cada respuesta media µi es igual a la media global poblacional µ. De
manera alternativa, es posible afirmar que todos los efectos de tratamiento sobre la
variable de respuesta son nulos, porque cuando el efecto Ti= µi- µ=0, entonces
necesariamente la respuesta media del tratamiento es igual a la media global (µi=µ).
Análisis de varianza
La hipótesis dada se prueba con un análisis de varianza con dos criterios de
clasificación, porque se controlan dos fuentes de variación: el factor de tratamientos
y el factor de bloque. Los cálculos necesarios pueden ser manuales, pero siempre
es más práctico hacerlos con un software estadístico, porque además proporciona
muchas otras opciones gráficas y tabulares útiles (no sólo el ANOVA).
EJEMPLO

Se comparan cuatro métodos


de ensamble, ahora se va a
controlar activamente en el
experimento a los operadores
que realizaran el ensamble, lo
que da lugar al siguiente
diseño en bloques
completamente al azar.
La variable de respuesta son
los minutos en que se realiza
el ensamble. Para comparar
los cuatro métodos se plantea
la hipótesis:
La cual se prueba mediante el
análisis de varianza dado en
la siguiente tabla

5.2Diseño de experimentos factoriales.

Es frecuente que en muchos procesos existan varios factores de los que es


necesario investigar de manera simultánea su influencia sobre una o varias
variables de respuesta, donde cada factor tiene la misma importancia a priori desde
el momento que se decide estudiarlo, y es poco justificable suponer de antemano
que los factores no interactúan entre sí. Los diseños experimentales que permiten
estudiar de manera simultánea el efecto de varios factores son los llamados diseños
factoriales.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una
o varias respuestas o características de calidad y determinar una combinación de
niveles de los factores en la cual el desempeño del proceso sea mejor que en las
condiciones de operación actuales; es decir, encontrar nuevas condiciones de
operación del proceso que eliminen o disminuyan ciertos problema de calidad en la
variable de salida.
Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador,
la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo
(temperatura, humedad, velocidad, presión, etc.). Para poder estudiar la manera en
que incluye cada factor sobre la variable respuesta, es necesario elegir al menos
dos niveles de prueba para cada uno de ellos (tres máquinas, dos operadores, tres
velocidades, dos temperaturas, etc.). Con el diseño factorial completa se corren
aleatoriamente en el proceso todas las posibles combinaciones que pueden
formarse con los niveles seleccionados. Un diseño de experimentos factorial o
arreglo factorial es el conjunto de puntos experimentales o tratamientos que pueden
formarse considerando todas las posibles combinaciones de los niveles de los
factores. Por ejemplo, con k = 2 factores, ambos con dos niveles de prueba, se
forma el diseño factorial 2x2=22, que consiste de cuatro combinaciones o puntos
experimentales.
Considerando otra vez k = 2 factores, pero ahora uno con tres niveles y el otro con
dos niveles, se pueden construir 3 x 2 combinaciones que dan lugar al diseño
factorial 3 x 2. Observe que en el nombre del diseño factorial va implícita el número
de tratamientos que lo componen. Para obtener el número de corridas
experimentales se multiplica el número de tratamientos por el número de réplicas,
donde una réplica se lleva a cabo cada vez que se repite el arreglo completo. Más
en general, la familia de diseños factoriales 2k consiste de k factores, todos con dos
niveles de prueba; y la familia de diseños factoriales consiste de k factores.
Cada uno con tres niveles de prueba. Es claro que si los k factores no tienen la
misma cantidad de niveles, entonces no se puede factorizar de esta forma, y debe
escribirse el producto de manera más explícita: por ejemplo con k = 3 factores, el
primero con cuatro niveles y los dos restantes con dos niveles, se tiene el diseño
factorial 4x2x2=4x22, que consiste de 16 combinaciones de niveles diferentes.

5.3Diseño factorial 2ⴷk


El experimento factorial más sencillo es en el que intervienen solamente dos
factores, por ejemplo, A y B. Hay niveles del factor A y niveles del factor B. El
experimento tiene réplicas y cada réplica contiene todas las combinaciones de
tratamientos ab.
Considere los factores A y B con a y b (a,b≥2) niveles de prueba, respectivamente.
Con ellos se puede construir el arreglo o diseño factorial axb, que consiste de
tratamientos. Se llama réplica cada repetición completa del arreglo factorial. Los
diseños factoriales que involucran menos de cuatro factores se corren replicados
para poder tener la potencia necesaria en las pruebas estadísticas sobre los efecto
de interés, de tal forma que si se hacen réplicas, el número total de corridas
experimentales es (axb).
Efecto principal y efecto de interacción
El efecto de un factor se define como el cambio observado en la variable de
respuesta debido a un cambio de nivel de tal factor. En particular, los efectos
principales son los cambios en la media de la variable de respuesta que se deben
a la acción individual de cada factor. En términos matemáticos, el efecto principal
de un factor con dos niveles es la diferencia entre la respuesta media observada
cuando tal factor estuvo en su primer nivel, y la respuesta media observada cuando
el factor estuvo en su segundo nivel.
EJEMPLO
Diseño factorial 22. Suponga que en un proceso de fermentación tequilera, se tienen
dos factores A: tipo de levadura y B: temperatura, cada uno con dos niveles
denotados por respectivamente A 1=1, A2=2, A3=3. La respuesta de interés es el
rendimiento del proceso de fermentación. En la tabla 4.1 se muestran los cuatro
tratamientos o puntos del diseño factorial 22, y entre paréntesis se ha indicado cada
nivel con los códigos (1, -1). En el experimento original cada tratamiento se corrió
tres veces (tres réplicas), lo cual da un total de 12 corridas del proceso pero, por
simplicidad, en la última columna de la tabla siguiente sólo se anotaron los
resultados de la primera réplica.

Por lo que en términos absolutos el efecto principal de B es mayor. Por otra parte,
se dice que dos factores interactúan entre sí o tienen un efecto de interacción sobre
la variable de respuesta, cuando el efecto de un factor depende del nivel en que se
encuentra el otro. Por ejemplo, los factores A y B interactúan si el efecto de A es
muy diferente en cada nivel de B, o viceversa. Efecto A (con B bajo) = 41 - 28 = 13
y cuando la temperatura es alta, el efecto de A es Efecto A (con B alta) = 45 - 63 =
13.
Como estos dos efectos de A en función del nivel de B son muy diferentes, entonces
es evidencia de que la elección más conveniente del nivel de A depende del nivel
en que esté B, y viceversa. Es decir, eso es evidencia de que los factores de A y B
interactúan sobre Y. En la práctica, el cálculo del efecto A en cada nivel de B no se
hace, y más bien se calcula el efecto global de la interacción de los dos factores,
que se denotan por AB y se calculan como la diferencia entre la respuesta media
cuando ambos factores se encuentran en el m ismo nivel: (-1, -1); (1, 1), y la
respuesta media cuando los factores se encuentran en niveles opuestos: (-1, 1) (1,
-1). Para el ejemplo, el efecto de interacción levadura x temperatura está dado por

Los valores absolutos (sin importar el signo) de los efectos principales y del efecto
de interacción son una medida de importancia de su efecto sobre la variable de
respuesta. Sin embargo, como se tienen estimaciones muéstrales, para saber si los
efectos son estadísticamente significativos (diferentes de coro).

5.4Diseño de cuadrados latinos.

En el diseño en cuadro latino (DCL) se controlan dos factores de bloque y se estudia


un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que
pueden afectar la respuesta observada, estas son:
 Los tratamientos
 El factor de bloque I (renglones)
 El factor de bloque II (columnas)
 El error aleatorio

Se llama cuadro latino por dos razones: es un cuadro debido a que tiene la
restricción adicional de que los tres factores involucrados se prueban en la misma
cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los
tratamientos o niveles del factor de interés. Sean A, B, C, …, K, los k tratamientos
a comparar, por lo tanto ambos factores de bloques tienen también k niveles cada
uno. El aspecto de los datos se muestra en la siguiente tabla.
Ahora se necesitan al menos tres subíndices, por ejemplo, la respuesta Y313 se
generó en el tratamiento tres (C), en el primer nivel del factor renglón y en el tercer
nivel del factor columna. El modelo estadístico para describir el comportamiento de
las observaciones está dado por

Donde Yijl es la observación del tratamiento i , en el nivel j , del factor renglón y en


el nivel del factor columna; Ɛijl el error atribuible a dicha observación. De acuerdo
con este modelo, la variabilidad total presente en los datos se puede descomponer
como

Y los grados de libertad correspondientes son

El ANOVA para el diseño en cuadro latino se muestra en la tabla siguiente. En él se


prueba la hipótesis sobre los efectos de tratamiento del factor renglón y del factor
columna. Otra vez, la hipótesis fundamental es la de los tratamientos; las otras dos
proporcionan un adicional al objetivo inicial y permiten comprobar la relevancia de
controlar los factores de bloque.
Selección y aleatorización de un cuadro latino. No cualquier arreglo de letras latinas
en forma de cuadro es cuadro latino, la regla fundamental es que cada letra debe
aparecer sólo una vez en cada renglón y en cada columna. Un cuadro latino
estándar es aquel en el que en la primera columna y en el primer renglón aparecen
las letras en orden alfabético. Por ejemplo, un cuadro latino estándar de tamaño
cuatro está dado por:

Existen además los siguientes tres cuadros latinos de dimensión cuatro:

Para cuatro tratamientos se pueden construir un total de 576 cuadros latinos de los
cuales cuatro son estándar. La selección del diseño debería ser elegir uno al azar
de los 576 posibles; no obstante, es prácticamente imposible construirlos a todos
para seleccionar uno al azar. Sin embargo, ocurre que dado un cuadro latino,
cualquier intercambio de columnas o de renglones es también cuadro latino, por eso
la estrategia de selección y aleatorización recomendada en la práctica es la
siguiente:
 Se construye el cuadro latino estándar más sencillo.
 Se aleatoriza el orden de los renglones (o columnas) y posteriormente se
aleatoriza el orden de las columnas (o renglones).
 Por último, los tratamientos a comparar se asignan en forma aleatoria a las
letras latinas.
El cuadro latino tiene dos restricciones a la aleatorización debido a los dos factores
de bloque, lo que implica que a la hora de correr el experimento no hay ningún
margen de aleatorización. Es decir, se puede correr por columna o por renglón
según convenga. Lo que no es correcto es hacer todas las pruebas de un
tratamiento, y luego todas las de otro, y así sucesivamente, puesto que se puede
introducir ruido adicional debido a factores no controlables que cambian con el
tiempo.
EJEMPLO Comparación de cuatro marcas de llantas
Una compañía de mensajería está interesada en determinar cuál marca de llantas
tiene mayor duración en términos del desgaste. Para ello se planea un experimento
en cuadro latino, en el que se comparan las cuatro marcas de llantas sometiéndolas
a una prueba de 32 000 kilómetros de recorrido, utilizando cuatro diferentes tipos
de auto y las cuatro posiciones posibles de las llantas en el auto. Así, el factor de
interés es el tipo de llantas o marca, y se controlan dos factores de bloque: el tipo
de carro y la posición de la llanta en el auto. Estos factores de bloque se controlan
ya que, por experiencia, se sabe que el tipo de carro y la posición de la llanta tienen
efecto en el desgaste de la misma. La elección del cuadro latino a utilizar se hace
antes de obtener los datos. Para ello, a partir de un cuadro latino inicial se
aleatorizan las columnas y los renglones; después, las diferentes marcas de llantas
se asignan de manera aleatoria a las letras latinas que denotan los niveles del factor
de interés.

Las pruebas se hacen al mismo tiempo con choferes, a quienes se les instruye para
que manejen de manera similar sobre el mismo terreno para los cuatro automóviles.
Al hacer las pruebas de los cuatro autos al mismo tiempo se evita el efecto del
ambiente en el desgaste; asimismo, el conductor y el tipo de terreno podrían influir,
pero se considera suficiente mantenerlos lo más homogéneo posible durante el
experimento. El diseño y los datos observados se muestran en la tabla anterior. Se
mide la diferencia máxima entre el grosor de la llanta nueva y el grosor de la llanta
después de recorrido los 32 000 kilómetros. Obviamente, a mayor diferencia en
grosor mayor desgaste. Las unidades de medición son milésimas de pulgada.

Se observa que nuestro punto crítico tanto para la posición, el tipo de carro y las
marcas es de 4,76. Concluimos que en las marcas y posición no existe evidencia
de que esta influya por lo que se acepta la hipótesis nula de que son iguales a un
nivel de significancia de a = 0.05. En cuanto al tipo de carro observamos que este
si influye en el desgaste de las llantas por lo que rechazamos la hipótesis nula.
5.5Diseño de cuadrados grecolatinos
Con el diseño en cuadro grecolatino (DCGL) se controlan tres factores de bloque,
además del factor de tratamiento. Se llama cuadro grecolatino porque los cuatro
factores involucrados se prueban en la misma cantidad de niveles, de aquí que se
pueda escribir como un cuadro (ver tabla 3.5); además, se utilizan letras latinas para
denotar a los tratamientos y letras griegas para nombrar a los niveles del tercer
factor de bloque.
Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer sólo
una vez en cada renglón y en cada columna. Además, cada par de letras debe
aparecer sólo una vez en todo el arreglo. El modelo estadístico que describe a las
mediciones en un cuadro grecolatino está dado por
Al igual que en el cuadro latino, cada letra (latinas y griegas) debe aparecer sólo
una vez en cada renglón y en cada columna. Además, cada par de letras debe
aparecer sólo una vez en todo el arreglo. El modelo estadístico que describe a las
mediciones en un cuadro grecolatino está dado por

Donde Y ijlm es la observación o respuesta que se encuentra en el tratamiento (i-


ésima letra latina), en el renglón j , en la columna y en la m-ésima letra griega Ti ;
es el efecto del tratamiento i , Y i es el efecto del renglón Si, representa el efecto de
la columna y representa el efecto de la -ésima letra griega, que son los niveles del
tercer factor de bloque; el término representa el error aleatorio atribuible a la
medición . Es importante no confundir las letras griegas del modelo que representan
efectos, con las letras griegas en el diseño que simbolizan a los niveles del tercer
factor de bloque. La variabilidad total presente en los datos se puede partir de la
manera usual como

Donde las sumas SCb1, SCb2, SCb3 miden la variabilidad debida a los factores de
bloque renglón, columna y de letras griegas, respectivamente. Para k tratamientos,
los grados de libertad correspondientes a cada suma son

Un bosquejo del análisis de varianza se muestra en la tabla 3.6, en la cual se


prueban las hipótesis de igualdad de letras latinas (tratamientos), de renglones, de
columnas y de letras griegas
EJEMPLO
En el caso del ejemplo donde se comparan los cuatro métodos de ensamble y se
tiene el factor de bloque operador, se podrían tener dos factores de bloque
adicionales:
 Orden en el que se hace el ensamble
 Lugar donde se hace De acuerdo con esto, el diseño en cuadro grecolatino
se observa en la siguiente tabla.

Resultado arrojado en Minitab


Modelo lineal general: promedio vs. Método; operador; orden; lugar
El análisis de varianza para el ejemplo se aprecia que el único efecto significativo
son los tratamientos (métodos), y ninguno de los factores de bloque tiene un efecto
significativo sobre el tiempo de ensamble. El factor operador tiene un valor-p bajo,
lo cual indica que podría tener un efecto significativo; sin embargo, en este
experimento fue imposible detectarlo. Si contrastamos con respecto a F critica para
los cuatro casos F en tablas es F = 9,28, por lo cual se rechaza la hipótesis nula
para método, en cuanto para operador, orden y lugar se acepta.

You might also like