You are on page 1of 66

Nombre:

Matrcula:

Daniela Fernanda Sandoval Velsquez

2703632

Mara Eugenia Carrin Garca

2705090

Nombre del curso:

Nombre del profesor:

Diseo de Experimentos

Octavio Trujillo Santisteban

Mdulo: Todo el Curso

Actividad: CL6, A6, E3

Fecha: 23 de Noviembre del 2015


Bibliografa:
Universidad TecMilenio. (2015). Diseo de Experimentos. 20 de noviembre del
2015,
de
BlackBoard
Learn
Sitio
web:
http://bbsistema.tecmilenio.edu.mx/webapps/portal/frameset.jsp?
tab_tab_group_id=_2_1&url=%2Fwebapps%2Fblackboard%2Fexecute
%2Flauncher%3Ftype%3DCourse%26id%3D_222409_1%26url%3D

Resumen:

Tema 1. Introduccin al diseo de experimentos


Para resolver situaciones de falla en un proceso industrial, es cada da ms
frecuente realizar una planeacin de mantenimiento predictivo basado en
mediciones y estadsticas generadas a partir de los datos recabados. Para
determinar el proceso a seguir en este tipo de mantenimiento es necesario
determinar los parmetros del proceso con base en el diseo de algn
experimento.
Un experimento es una serie de pasos a travs de los cuales se trata de probar
una o varias posibilidades en la que se encuentra una determinada situacin.
A travs de una o varias pruebas se determinan los parmetros estadsticos que
nos muestren la aproximacin entre el modelo supuesto del proceso (industrial u
otro) y el mundo real, conocido aproximadamente a travs de datos obtenidos por
mediciones.
El modelo puede ser:
a. Una relacin funcional, en general a travs de una ecuacin que aproxime
la relacin entre las variables (x, y), de tal forma que y = f(x) y algn

indicador que nos muestra qu tan ajustada es la aproximacin del modelo


con el proceso fsico.
b. Simplemente un conjunto de indicadores estadsticos, como la media, la
varianza, la propia distribucin de probabilidad de la poblacin estudiada,
etc.

Un diseo estadstico de experimentos se refiere al proceso que hay que seguir


para determinar las relaciones entre el modelo supuesto y el fenmeno fsico real.
Para realizar el experimento es necesario tomar en cuenta las variables que son
relevantes en el fenmeno en cuestin sin olvidar que estas variables
probablemente son la causa de la variabilidad del proceso:

Variables de control (de entrada al proceso)

Variables del proceso

Variables aleatorias externas al proceso, que interfieren con el resultado


esperado y que no son controlables al 100%; por ejemplo, aspectos
ambientales como la temperatura, la humedad, el ruido, etc.

Cuando hablamos de Diseo de experimentos nos referimos al proceso de


plantear un experimento de tal forma que se recaben los datos adecuados que
puedan ser analizados por medios de mtodos estadsticos los cuales llevaran a
conclusiones validad y objetivas.
Esta planeacin debe de tener tambin las siguientes caractersticas:
1. Que sea desde un enfoque cientfico
2. Que llegue a conclusiones nuevas
3. Que incluya mtodos propios de ingeniera

Un Experimento es un cambio en las condiciones de operacin de un sistema o


proceso, que se hace con el objetivo de medir el efecto del cambio sobre una o
varias propiedades del producto o resultado.
El proceso (estocstico) es aquel que es influido por variables (de entrada y
salida), factores (que influyen en el estudio) y perturbaciones aleatorios.
Una unidad experimental se refiere al conjunto de elementos de muestra, los
equipos para tomar dicha muestra y la metodologa que se sigue para que los
resultados sean confiables.
Variables:
Existen dos tipos de variables unas de entrada y unas de salida, las variables son
aquellas en las que se busca una relacin y=f(x) en las de salida es necesario
identificar las variables dependientes y en las de entrada es necesario identificar
las variables independientes
Factores:
Al igual que las variables existen diferentes tipos factores como los controlables
que son todas las variables que pueden llegar a ser un motivo de estudio ya que
forman parte del proceso de investigacin y los mensurados que son variables en
particular que van a ser motivo de estudio durante del experimento
Perturbaciones:
Existen 3 tipos ruido, interferencia y distorcin
Factores:
a. Niveles: son los coeficientes que acompaan a cada variable o factor
involucrado en el proceso, y que va ser estudiado en un diseo
experimental.
Por ejemplo, si tenemos los elementos del proceso compuesto de las
variables v1 y v2 y los factores f1 y f2, cada uno de ellos puede ser

acompaado de un factor a, b, c o d, quedando las variables: av1 y bv2 y


los factores cf1 y df2.
b. Tratamientos: una combinacin de niveles de todos los factores.
Por ejemplo, si el proceso est determinado por la funcin y = f(x), y es una
funcin lineal, entonces la combinacin de variables y factores puede
quedar como y = av1 + bv2 + cf1 + df2.
Ejemplo: determinar las variables y factores, a diversos niveles, que intervienen en
el proceso de la extrusin del plstico:

Figura 1.2 Mquina extrusora


Proceso: mquina extrusora
Variable
Factor
controlable
Velocidad del husillo
SI
Temperatura del can SI
Presin en el molde
SI
Color
SI
Calidad del plstico
NO

Factor de ruido

Nivel

NO
NO
NO
NO
SI

Dado por el proceso


Dado por el proceso
Dado por el proceso
Dado por el proceso
Dentro de las especificaciones
del proveedor
Semicontrolada
por
ventiladores
Sin control

Temperatura ambiental

NO

SI

Humedad ambiental

NO

SI

Otro concepto clave en la medicin es la incertidumbre esta es un parmetro que


nos indica la variabilidad del proceso, debida a varios factores involucrados.
Una caracterstica de un experimento bien realizado es que sigue un modelo de
diseo, el cual se sebe de escoger de acuerdo a las caractersticas que se deben
observar tomando en cuenta los siguientes cuestionamientos:

Los factores a diversos niveles, qu efecto tienen sobre las variables de


salida?

Al utilizar varios factores, se van a comparar entre s?

Coinciden el valor mximo o mnimo del modelo con los valores del
proceso?

Se desea redisear el modelo?

Se desea controlar factores, no ruido?

Tema 2. Modelos experimentales


7 etapas para el diseo de experimentos:
Etapa 1. Reconocer y establecer el problema: Identificar el problema a resolver
para lograrlos objetivos propuestos.
Etapa 2. Seleccin de factores, niveles y rangos.
Etapa 3. Seleccin de la variable de respuesta.
El experimentador identifica las variables de salida del proceso para elegir aquella
o aquellas que sean ms significativas y procede a la seleccin de factores que
influyan a las variables; a continuacin se han de asignar los niveles y rangos que
deben tener los factores.
Etapa 4. Seleccin del diseo experimental
Determinar el tamao de la muestra, el orden de la ejecucin y sus respectivas
restricciones.
El diseo experimental tambin puede ser realizado utilizando algn paquete
estadstico, que decidir el mejor diseo en funcin de datos de entrada como
son los factores, niveles y rangos.
Etapa 5. Realizar el experimento
Al realizar el experimento se ha de seguir el plan previamente realizado; sin
embargo, si al realizar el experimento se ve conveniente redefinir el plan, este
debe ser redefinido.
Etapa 6. Anlisis estadstico de los datos

Como en la etapa 4, para realizar el anlisis estadstico de los datos el diseo


experimental puede utilizar algn paquete estadstico, que realizar clculos y
grficas de forma automtica.
Etapa 7. Conclusiones y recomendaciones
Para concluir es necesario que el experimentador que particip en la realizacin
del experimento muestre sus propias conclusiones, y de acuerdo a estas y a
problemas que quedaron pendientes de especificar realice las recomendaciones
que crea conveniente.
Principios bsicos del diseo experimental
1. Observabilidad: Cualquier cosa observada se aprecia con variabilidad, as
lo que se observa una vez no puede ser observado de la misma manera en
una segunda o tercera vez.
2. Aleatorizacin
3. Repeticin: Es correr ms de una vez un tratamiento o combinacin de
factores,
4. Bloqueo: ya seleccionados los factores que se relacionan con la variable de
salida, hay que controlar los niveles de ellos, desde el mnimo nivel de cero
(la anulacin del factor) hasta el mximo nivel.
Tema 3. Conceptos bsicos para la prueba de hiptesis
Media o valor esperado:
a. Para un conjunto de datos discretos x1, x2, ..., xn, con probabilidad p(xi ), se
calcula con la sumatoria mostrada a continuacin:

b. Para un conjunto de datos continuos representados por su funcin de


probabilidad, f(x), se calcula con la integral mostrada a continuacin:

c. Para un conjunto de datos mustrales x1, x2, ..., xn se calcula como la suma
de todos los valores dividida entre n grados de libertad (donde n es el
nmero de datos):

Varianza: equivale a la media del error cuadrtico; el error cuadrtico de cada isimo valor est dado por (xi - )2
a. Para un conjunto de datos discretos x1, x2, ..., xn con probabilidad p(xi ), se
calcula como la suma de todos los errores respecto a la media poblacional
(donde n es el nmero de datos):

b. Para un conjunto de datos continuos representados por su funcin de


probabilidad f(x), se calcula con la integral mostrada a continuacin:

d. Para un conjunto de datos mustrales x1, x2, ..., xn, se calcula como la suma
de todos los errores respecto a la media muestral , dividida entre n - 1
grados de libertad (donde n es el nmero de datos):

Desviacin estndar: es la raz cuadrada de la varianza


Histograma: es una grfica en forma de barras, en la que el rea de cada barra es
proporcional a la frecuencia con que se repite una variable.

Distribucin de probabilidad contina:


Caractersticas:
1. Es generada por una variable continua (x).
x Es una variable que puede tomar tanto valores enteros como fraccionarios.
x 1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, ...,
2. f(x) 0 Las probabilidades asociadas a cada uno de los valores que toma x
deben ser mayores o iguales a cero.
3.

La sumatoria de las probabilidades asociadas a cada uno de los valores


que toma x debe ser igual a 1. El rea definida bajo la funcin de densidad
de probabilidad deber ser de 1.

Muestreo aleatorio es el proceso en el cual una muestra de tamao n puede ser


sacada de una poblacin de tamao N con un nmero de combinaciones sin
repeticin:

Por ejemplo: deseamos obtener la media y la desviacin estndar de una muestra


n = 20:
x 1

y 2
8

3
3

2
6

2
6

2
7

2
7

2
8

2
8

3
0

1
0
2
5

1
1
3
2

1
2
2
6

1
3
2
5

1
4
3
0

1
5
2
9

1
6
2
7

1
7
3
2

1
8
2
7

1
9
3
1

2
0
3
1

Obtenemos
= 28.4
S = 2.458
La distribucin normal:
Distribucin normal de una variable aleatoria x, perteneciente a una poblacin de
media y varianza 2:

Si la media = 0 y la varianza 2 = 1 tenemos la distribucin normal estndar. Si


sustituimos:

Queda la siguiente frmula:

Teorema del lmite central: si x1, x2, ..., xn, es una muestra de n variables aleatorias
e independientes, con media , extradas de una poblacin con media y varianza
2, entonces existe una variable aleatoria z que tiende a la normalidad (distribucin
gaussiana) cuando n :

La distribucin Ji cuadrada (

):

Distribucin Ji cuadrada para una muestra de tamao n: x1, x2, ..., xn

La distribucin t para dos muestras, es:

Tema 4. Pruebas de hiptesis 2


Un paso muy importante en el anlisis y diseo de experimentos, despus de la
planeacin pre experimental, es la seleccin del diseo experimental, en el cual
hay que seleccionar la prueba de hiptesis que ms convenga para el caso en
estudio.
Este anlisis se realiza de acuerdo a si queremos comparar la media con un valor
preestablecido o si lo queremos hacer comparando dos medias.
Pruebas de hiptesis sobre dos medias
Para realizar las pruebas de hiptesis sobre dos medias, existen dos
procedimientos en general, las que se refieren a las pruebas con varianza
conocida y con varianza desconocida.
Suponiendo que tomamos dos muestras, desde diferentes poblaciones,
calculamos sus medias y sus desviaciones estndar. Iniciamos nuestro modelado
suponiendo que tienen distribucin normal, as que graficamos ambas
distribuciones para ver grficamente sus relaciones:

Llamamos la hiptesis nula a la igualdad entre las medias en estudio: 1 = 2


Llamamos la hiptesis alterna o alternativa a la desigualdad entre las medias en
estudio.
Puede ser de tres tipos:

Cuando suponemos que son simplemente diferentes


Cuando suponemos que una de ellas es mayor que la otra
Cuando suponemos que una de ellas es menor que la otra

Despus hay que fijar un criterio para aceptar o rechazar la hiptesis nula. Si
aceptamos la hiptesis nula significa que rechazamos la alterativa y viceversa.

Aceptamos Ho
y esta es
verdadera
No tiene
Rechazamos
Ho y esta es
falsa.
Error

Tipo a:
Rechazamos
Ho y esta es
verdadera.

Si tiene

Tipo B:
Aceptamos Ho
y esta es falsa.

Intervalo de confianza:
Se fija de acuerdo al coeficiente de confianza (1 -

).

El intervalo de confianza est dado por la expresin:

Pruebas de hiptesis sobre dos medias con varianza conocida


El estadstico de prueba, sobre una media poblacional 0, con varianza
2 conocida respecto a otra media , de una muestra de tamao n:

Esta frmula se utiliza en las siguientes pruebas:


Prueba sobre una media
Prueba
H0:
1
= 0
2
3

H1:
0
> 0
< 0

Criterio de rechazo

El estadstico de prueba, sobre una media 1, de tamao n1 con varianza


12 conocida, respecto a otra media 2, de tamao n2 con varianza, 22 conocida:

Se utiliza en las siguientes pruebas:

Prueba sobre dos medias


Prueba
H0:
1
1 = 2
2
3

H1:
1 2
1 > 2
1 < 2

Criterio de rechazo

Ejemplo: probar la hiptesis de que H0: 1 = 2 y H1: 1 > 2 respecto a dos


poblaciones de varianzas conocidas 12 = 8.4 y 22 = 7.2.
Solucin:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.
2. Se calculan las medias muestrales:

= 102.5 y

= 99.6

3. Se calcula:
4. Se determina:

para

= 0.05

5. Se realiza la comparacin:

>

Pruebas de hiptesis sobre dos medias con varianza desconocida


El estadstico de prueba sobre una media poblacional , con varianza desconocida
respecto a otra media , de tamao n, se representa con la siguiente frmula:

Esta frmula se utiliza en las siguientes pruebas:


Prueba sobre una media
Prueba
H0:
1 (dos colas)
= 0
2 (una cola)
3 (una cola)

H1:
0
> 0
< 0

Criterio de rechazo

El estadstico de prueba, sobre una muestra de media 1, de tamao n1 y con


varianza S12, respecto a otra muestra de media 2, de tamao n2 y con
varianza, S22, representa los grados de libertad.

Esta frmula se utiliza en la siguiente prueba:


Prueba sobre dos medias
Prueba
H0:
1
1 = 2
2

H1:
1 < 2
1 > 2

Criterio de rechazo

Si en el caso anterior S12 = S22 = S el estadstico de prueba, sobre una muestra de


media 1, de tamao n1 respecto a otra muestra de media 2, de tamao n2,
representa los grados de libertad.

= n1 + n2 - 2
Esta frmula se utiliza en la siguiente prueba:
Prueba sobre dos medias
Prueba
H0:
1
1 = 2

H1:
1 2

Criterio de rechazo

Ejemplo: probar la hiptesis de que H0: 1 = 2 y H1: 1 > 2 respecto a dos


poblaciones de varianzas desconocidas.
Solucin:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10.
2. Se calculan las medias muestrales:

= 102.5 y

= 99.6

3. Se calculan las varianzas muestrales: S1 = 8.4 y S2 = 7.2

4. Se calcula:
5. Se determina:

para

6. Se realiza la comparacin:

= 0.05
<-

Tema 5. Pruebas de hiptesis 3


Pruebas de hiptesis sobre una varianza
El estadstico de prueba, sobre una varianza poblacional, 02 conocida, respecto a
otra varianza S2, obtenida de una muestra de tamao n:

Esta frmula se utiliza en las siguientes pruebas:


Prueba sobre una media
Prueba
H0:
1
2 = 02
2

H1:
02
2 > 02

2 < 02

Criterio de rechazo

Ejemplo: probar la hiptesis de que H 0: 2 = 02 y H1: 2 > 02 respecto a una


poblacin con distribucin normal con varianza 2 = 2.4 si 02 = 1.3.
Solucin:
1. Se toman una muestras: n = 10
2. Se calcula la varianza muestral: S2 = 1.9

3. Se calcula:
4. Se determina:

para

5. Se realiza la comparacin:

= 0.05

Prueba de hiptesis sobre dos varianzas


El estadstico de prueba, sobre una varianza S 12, obtenida de una muestra de
tamao n1, respecto a otra varianza S22, obtenida de una muestra de tamao n2 es:

Esta frmula se utiliza en las siguientes pruebas:


Prueba sobre una media
Prueba
H0:
1

H1:

Criterio de rechazo

2
3

Ejemplo: probar la hiptesis de que H0: 12 = 22 y H1: 12 > 22 respecto a dos


poblaciones con distribucin normal.
Solucin:
1. Se toman dos muestras iguales: n1 = 10 y n2 = 10
2. Se calculan las varianzas mustrales: S1 = 8.4 y S2 = 7.2

3. Se calcula
4. Se determina

para

= 0.05

5. Se realiza la comparacin

Prueba de hiptesis sobre dos poblaciones


El objetivo de este tema tiene dos partes:
1. Recapitular, en forma de diagramas de flujo, las pruebas de hiptesis
estudiadas en los temas anteriores.
2. Reflexionar sobre la dependencia e independencia de las variables, as
como de su correspondiente intervalo de confianza.

Parte 1. Diagramas de flujo de las pruebas de hiptesis:

Parte 2. Reflexionar sobre la dependencia e independencia de las variables, as


como de su correspondiente intervalo de confianza:
a. Definicin: dos o ms muestras son dependientes si se han obtenido de
entre los mismos individuos.
b. Diferencia de medias en dos muestras dependientes: El intervalo de
confianza a nivel de confianza = 1 - , para d = A - B viene dado por la
ecuacin:

c. Diferencia de medias en dos muestras independiente: El intervalo de


confianza, a nivel de confianza = 1 - , para A - B viene dado por la
ecuacin:

Tema 6. Diseo completamente aleatorio 1


El diseo completamente aleatorio se ha popularizado en ambientes de la
industria qumica, con animales y con produccin de plantas de diversas ndoles.
Actualmente, ha tomado impulso en otras clases de ambientes industriales, como
productoras de derivados del polipropileno o la industria metalmecnica, ya que en
ellas tambin se pueden hacer los arreglos necesarios para aplicar sus tcnicas:

La asignacin de los tratamientos completamente al azar a las muestras del


experimento, ya sean elementos individuales o grupos de individuos (de
animales, plantas, tornillos o parmetros mtricos).

La homogeneidad de las muestras para disminuir el error inherente al


experimento.

La aplicacin de tcnicas del anlisis de covarianza.

La utilizacin con arreglos de tratamiento de tipo factorial.

Tres secciones y once etapas para el diseo de experimentos


Seccin 1: Planeacin y diseo
1. Definir el problema o el objetivo.
2. Hacer un esquema del estudio donde se seale el problema planteado.
3. Determinar los factores que deben investigarse, de acuerdo a su
posible impacto en el problema.
4. Elegir las variables de respuesta que sern medidas en cada punto del
diseo, y verificar que se miden de manera confiable.
5. Seleccionar el diseo experimental adecuado a los factores que se
tienen y al objetivo del experimento.
6. Planear y organizar el trabajo experimental.
7. Realizar el experimento.
Seccin 2: Anlisis e interpretacin

8. Hacer un anlisis detallado de los resultados experimentales.


9. Interpretar resultados.
10. Hacer corridas confirmatorias del proceso en el mejor tratamiento.
Seccin 3: Conclusiones finales
11. Cerrar y concluir el proyecto adecuadamente.

Notacin
Existe un tipo de notacin consistente en colocar en el subndice un punto. En este
tipo de notacin significa que se est, el punto realizando la suma sobre la variable
mostrada en el mismo subndice.
Algunas de estas representaciones son las siguientes:

i es el nmero del tratamiento que se est realizando de entre k


tratamientos y puede tener el valor: i = 1, 2, , k.

j es el nmero de observacin que se est tomando de entre las


ni observaciones a llevar a cabo dentro de cada uno de los k tratamientos;
esto es, estamos dentro del i-simo tratamiento, y puede tener el valor: j =
1, 2, , ni.

Yij es la j-sima observacin en el tratamiento i.

Yi es la suma de las observaciones del tratamiento i, y se calcula con la


frmula siguiente:

es la media de las observaciones del i-simo tratamiento, y se calcula


con la frmula siguiente:

Y es la suma total de las N = n1 + n2 + + nk mediciones, y se calcula con


la frmula siguiente:

es la media global o promedio de todas las observaciones, y se calcula


con la frmula siguiente:

Ejemplo
Para realizar un experimento, se toman 3 tratamientos. Para cada tratamiento
existen las observaciones mostradas en la siguiente tabla:
Tratamiento
1
2
3

Observaciones
10
7, 1, 3, 5, 8, 2, 3, 5, 6, 1
12
4, 4, 3, 2, 1, 5, 7, 1, 1, 8, 2, 5
8
1, 6, 8, 4, 4, 2, 3, 1

1. Qu valor tiene k?
2. Si consideramos el tratamiento i = 3, qu valor tiene n?
3. Qu valor tiene Y36?
4. Para las condiciones de la pregunta 2, qu valor tiene Yi?
Solucin:
1. Dado que existen 3 tratamientos, k = 3.
2. Dado que el tratamiento i = 3, tiene o observaciones, n = 8
3. Dado que en el tratamiento k = 3, el 6 elemento es un 2, Y36 = 2
4. Dado que la suma de todos los elementos de la muestra del tratamiento
k = 3: 1+ 6+ 8+ 4+ 4+ 2+ 3+ 1 = 29, resulta que Y3 = 29

Modelo de un factor de efectos fijos balanceados


Tambin podemos realizar nuestras comparaciones, si consideramos no ya dos
factores a comparar, sino un solo factor pero con dos o ms niveles.

As, cuando las observaciones , que siguen el modelo


, se
observan despus de utilizar todos los tratamientos posibles, decimos que se trata
de un modelo de efectos fijos.
Este modelo se utiliza cuando son pocos los tratamientos, de tal forma que se
puedan utilizar todos ellos. Al utilizar todos los tratamientos, los parmetros de
nuestra ecuacin se ajustarn mejor a la realidad.
Notacin
SSTr es la varianza del error entre tratamientos, y se obtiene con la expresin:

SSE es la varianza del error dentro de los tratamientos, y se obtiene con la


expresin:

SST = SSTr + SSE


MSTr = SSTr / (a - 1) donde a - 1 son los grados de libertad.
MSE = SSE / (N - a) donde N - a son los grados de libertad.

Ejemplo
Una empresa productora de bolsas de plstico est interesada en probar si una
nueva cantidad de carbonato de calcio (CaCO3) para una nueva aplicacin
hace que aumente la dureza (Mohs) de las bolsas. En pruebas anteriores se ha
observado que la modificacin en la cantidad de carbonato hace variar la dureza, y
se sospecha que a mayor cantidad de carbonato, la dureza aumenta. Por la
experiencia se sabe que para el tipo de bolsa realizada hasta el momento (PEANAPM) una cantidad del 8% al 15% es suficiente, pero para el nuevo tipo de bolsa
(PEBDL) aumentar la dureza de 14 al 20%.
Solucin:
Se decide realizar un experimento con:
1. Cuatro niveles a = 4.
2. Tres pruebas n = 3, para cada uno de los cuatro niveles, a*n = 12.

3. Esto nos da que hay que realizar 12 corridas, a*n = 12, como se muestra en
las columnas 2, 3 y 4 de la Tabla 2.
4. En orden aleatorio, como se muestra en las columnas 5, 6 y 7 de la misma
tabla. As, la corrida experimental 12 ser la primera en ser realizada,
despus ser la corrida 6, etc., y al final la corrida 11.
La generacin de nmeros aleatorios se realiz utilizando Minitab: Calc >
Datos aleatorios > Muestreo por columnas.
% de CaCO3

Corrida Experimental

14
16
18
20

1
4
7
10

2
5
8
11

3
6
9
12

Orden
de
(aleatorio)
3
5
11
8
4
9
10
12

ejecucin
7
2
6
1

Resultados
% de CaCO3
14
16
18
20
Suma:

Prueba
1
9
8
5
9

2
10
3
16
4

3
4
12
3
11

Total
23
23
24
24
94

Promedio
7.667
7.667
8
8
7.834

Estimacin puntual de los efectos y de la variable de respuesta


Una poblacin se define por sus parmetros estadsticos:
1. La media.
2. La desviacin estndar.
3. La proporcin de artculos defectuosos.
Si estos son desconocidos la alternativa es realizar una estimacin, para lo cual se
cuenta con dos procedimientos.

1. Estimacin puntual
Se estiman los parmetros por medio de una muestra de tamao n, siguiendo los
siguientes procedimientos:

La media se estima por medio de la media de la muestra , que se


representa con el smbolo .

La varianza
se estima por medio de la varianza de la muestra S2, que se
representa con el smbolo .

La proporcin p se estima por medio de la proporcin de elementos


defectuosos x, tomados de una muestra de tamao n, en la que
.

Ejemplo: se cuenta con una mquina de empaquetado de caf en bolsas de 1 kg,


pero no se conocen los parmetros estadsticos, por lo que se desea realizar un
experimento para conocerlos.
Solucin:
Para conocer los datos estadsticos de la mquina de empaquetado automtico de
caf, se sigui el siguiente procedimiento:
a. Se registr el peso de 100 paquetes de caf: n = 100.
b. Se calcul la media de la muestra: = 1.00382 kg. Esta media se puede
utilizar como una estimacin puntual de la media del proceso.
c. Se calcul la varianza de la muestra: S2 = 0.000545 kg, la cual se puede
utilizar como una estimacin puntual de la varianza del proceso.
d. Se registr el nmero de bolsas defectuosas x = 2. Se hace una estimacin
puntual de la proporcin de defectuosos del proceso = x/n = 2/100 = 0.02

2. Estimacin por intervalo

Para verificar los datos estadsticos de la mquina de empaquetado automtico de


caf se repiti el procedimiento, registrando el peso de 100 paquetes de caf: n =
100, obteniendo los siguientes resultados:

Se calcul la media de la muestra: =1.00243 kg., as como la varianza de la


misma: S2 =0.000504 kg.
Como se puede observar, al repetir el procedimiento anterior para estimar
puntualmente los estadsticos, es probable que no se obtengan los mismos
resultados. El propsito es generar un parmetro desconocido , de tal forma que
este se encuentre dentro de un intervalo de confianza 100(
) %, y determinar
dos valores (L y U), de tal forma que la probabilidad de que se encuentre entre
estos dos valores sea igual a
, que puede ser expresado por medio de la
ecuacin:

Tema 7. Diseo completamente aleatorio 2


En el tema anterior se analiz el modelo de un factor de efectos fijos balanceados,
considerando un solo factor con dos o ms niveles y con diversos
tratamientos. Para ellos hay tres formas de representar los resultados del anlisis:
1. Utilizando
una tabla, como se vio
en
el tema
anterior.
2. Determinando una ecuacin que nos relacione las variables dependientes con
las independientes. Este tema se enfoca en esta representacin y, a su vez, sirve
como una introduccin analtica al concepto de anlisis de varianza.
3. Utilizando diagramas. En matemticas por lo general las grficas nos presentan
las relaciones funcionales de las variables y=f(x), ya en el campo de la
probabilidad y estadstica. Esta representacin grfica va ms all, como se
analizar en la segunda y tercer seccin de este tema.
Anlisis de varianza (One Way ANOVA)
Aparte de presentar los resultados del anlisis en una tabla o por medio de una
grfica, es posible representarlos con un modelo, una ecuacin que relacione los
resultados. Por ejemplo, se toma una muestra y, y se presenta en la siguiente
tabla:
x
y

1
1

2
2

3
4

4
8

5
16

Se analizan los datos y se determina que y es una funcin de x dada por la


ecuacin y=0.5 (2x), la cual puede ser representada con la siguiente grfica:

Si queremos relacionar la ij_sima observacin yij con la media obtenida en el


tratamiento i y con la muestra j, la forma ms sencilla de realizar esta relacin est
dada por medio de la siguiente ecuacin:
Ecuacin lineal 1 Modelo de medias

En la que

es el error aleatorio de la medicin.

Si consideramos que la media de los errores es cero, entonces el valor esperado


de la ij_sima observacin ser:

Una forma alternativa es relacionar la observacin con , el efecto del i_simo


tratamiento, en lugar del error aleatorio.
Tomando esto en consideracin, otra forma lineal y, por lo tanto, la forma ms
sencilla de realizar esta relacin est dada con la siguiente ecuacin:
Ecuacin lineal 2 Modelo de efectos

Desde luego, esta ecuacin supone que:

Dado que en estas ecuaciones lineales, 1 y 2, la variable dependiente yij depende


de una sola variable independiente, son llamadas como anlisis de varianza de un
solo factor (tratamiento) o de una sola va.

En estos modelos
observamos:

La media (m) que viene a


ser el valor esperado de la
observacin.

El error aleatorio(Eij) de la
medicin (yij), que es la
diferencia entre
medicin(yij)y el valor
esperado y los parmetros
asociados a los
tratamientos(Ti).

El anlisis de varianza (ANOVA) es el mtodo ms utilizado en el anlisis


experimental. Est basado en el estadstico F, que viene a ser la relacin entre dos
variables aleatorias ji cuadradas divididas entre sus correspondientes grados de
libertad. A su vez, el estadstico ji cuadrado depende de un solo parmetro: sus
grados de libertad. Por lo que se concluye que ANOVA simplifica mucho las
decisiones.

Diagrama de cajas

Metricos
Media
Varianza

Ordenad
os por
rango
Proporcio
nes

Los datos
pueden
ser

Categri
cos
Mediana
Cuartiles

Un diagrama de caja es una forma grfica de representar la mediana, los cuarteles


y los extremos de los datos. La distancia entre la media y los cuarteles se
representan por un rectngulo o caja, y la distancia entre los cuarteles y los
valores extremos se representan por lneas rectas que se conocen como bigotes
por la apariencia que da en los diagramas.
Ejemplo:
Sobre una tabla:
1. Registramos los datos.
2. Ordenamos por rango (de menor a mayor).
3. Observamos y registramos el mnimo, el mximo y la mediana.
4. Para el tratamiento 1, observamos y calculamos Q1=2-0.25=1.75 y
Q3=6+0.25=6.25.
5. Para el tratamiento 2, observamos y calculamos Q1=1.5-0.25=1.25 y Q3=5.
6. Para el tratamiento 3, observamos y calculamos Q1 = 1.5-0.25=1.25 y
Q3=5.

7. Copiamos los datos a Minitab, generando tres columnas.


8. Comprobamos los resultados: Estadsticas > Estadsticas bsicas > Mostrar
estadsticas descriptivas.
9. Generamos el diagrama de caja: Grfica > Grfica de caja.
Tratamiento

Datos

Ordenados por rango Mnimo

Q1

1
2
3

135823561
443215711825
16844231

11233 | 55678 =
111 | 223 | 445 | 578
11 | 23 | 44 | 68

1.75
1.25
1.25

1
1
1

10. Estadsticas descriptivas generadas con Minitab:

11. Diagrama de caja:

Grficas de medias

Q2:
Mediana
4
3.5
3.5

Q3

Mximo

6.25
5
5

8
8
8

Los datos mtricos adems de


presentarse en tablas o con
formulas lineales se pueden
representar por medio de
graficas:

De intervalos

se utiliza para graficar medias e


intervalos de confianza o barras
de error para una o ms
variables. Ilustra una medida de
la tendencia central y la
variabilidad de los datos.

Ejemplo de Grfica de intervalos

Ejemplo de Grfica de valores individuales

De valores individuales

se utiliza para evaluar y


comparar las distribuciones de
muestra, al graficar valores
individuales para cada variable o
grupo en una columna vertical,
con lo cual resulta ms fcil
detectar valores atpicos y ver la
distribucin.

La utilizacin de tablas, ecuaciones o diagramas para representar nuestros datos


es muy importante, pero hay que recordar que la interpretacin de los datos
involucrados es el objetivo principal del investigador. No hay que perderse en el
proceso, sino ir al fondo del contenido de la informacin.

Tema 8. Pruebas de rangos mltiples

Cuando se trata de comparar pares de medias de tratamientos, disponemos de


las siguientes pruebas:
1. De comparaciones mltiples (LSD-Least Significant Difference)
2. De Tukey
3. De rangos de Duncan
Pruebas de comparaciones mltiples (LSD).
La prueba de comparaciones mltiples tambin conocida como mtodo
Fisher de diferencia mnima significativa consiste en probar que las medias de
dos poblaciones con a tratamientos son significativamente diferentes.

Ejemplo: Si desean compararse dos medias 1 y 2, en caso de que sean


iguales: 1 = 2 Esto puede escribirse tambin del modo: L = 1 - 2 = 0
Cuyos coeficientes son 1 y -1, y por tanto suman 0.

Prueba de Tukey
La prueba de Tukey consiste en probar que las medias de dos poblaciones
con a tratamientos son significativamente diferentes.
La frmula que se utiliza es la siguiente:
Donde:
q es una valor que se obtiene de una tabla (Tabla de Tukey)
, de manera parecida a la tabla de F . Horizontalmente se
colocan los grados de libertad de los tratamientos y verticalmente los grados de
libertad del error. Solamente existen tablas para niveles de significancia del 5% y
del 1%.
El trmino que est dentro de la raz cuadrada se llama error estndar de la
media y es igual al cuadrado medio del error (obtenido en el ANDEVA), dividido
entre el nmero de repeticiones.
Si la diferencia entre dos promedios es mayor que el comprador, se
concluye que los dos promedios no son iguales, en caso contrario se concluye que
s son iguales.
Se utiliza el mismo comparador para todos los pares de promedios que se
comparan.
Pero sta frmula solamente es vlida para el caso de experimentos con igual
nmero de repeticiones (balanceado).

Un experimento puede ser desbalanceado (desiguales repeticiones) por


varios motivos: por causa de los tratamientos, por fallas en el manejo del
experimento, o por causas desconocidas que el experimentador no pudo controlar.
El anlisis de un experimento desbalanceado se complica.
Ejemplo:
Comparacin de 4 concentrados para engorde de pollos. Diseo: completamente
al azar, unidad experimental: pollos machos, de 1 mes de nacidos, de la misma
raza y criados en las mismas condiciones. Se les aliment con los concentrados
en las dosis recomendadas por los fabricantes por el sistema ad livitum (comer
todo lo que quieran), y la variable de inters fue: incremento de peso en 4
semanas (en libras).
Datos finales:
A
B
C
D

2.1
1.5
2.0
MURI

1.8
1.4
1.8
1.5

2.0
1.6
1.9
1.6

MURI
1.4
2.1
1.6

1.9
1.5
2.1
1.5

2.0
1.7
2.0
1.4

Los animales murieron por causas naturales (no por efecto de los
tratamientos) deben ser excluidos del anlisis, por lo que el experimento se
convierte en desbalanceado.
El anlisis de varianza al 5% de significancia elaborado con Excel es el
siguiente:
Anlisis de varianza de un factor
RESUMEN
Sum

Promedi

Grupos
A

Cuenta
5

a
9.8

o
Varianza
1.96
0.013
1.516666 0.013666

B
C

6
6

9.1
11.9

67
67
1.983333 0.013666

33
1.52

7.6

67
0.007

ANLISIS DE VARIANZA
Grad Promedi
Suma de os de o de los
Origen de las cuadrad
variaciones

libert

Valor

cuadrad

os
ad
1.137878

Probabili

os
F
dad
para F
0.379292 31.51048 2.2348E- 3.159907

Entre grupos
79
3
Dentro de los 0.216666

93
95
0.012037

grupos

04

67

crtico

18

07

59

1.354545
Total

45

21

Los resultados muestran que s existe diferencia significativa entre los


concentrados al 5%, por lo que debe procederse a la prueba de medias.
El valor de la tabla se obtiene con 3 grados de libertad en la horizontal y 18 en la
vertical

con

un

alfa

del

5%

3.118

Por ejemplo, los clculos para la primera comparacin (A contra B) se realizan as:
Diferencia:

1.96-1.516=0.4433

error estndar=

comparador=

3.118*0.047=0.1465

Las comparaciones se realizan as:


r1

r2

diferenci

error

comparado conclusi

estndar r

A contra

n
no

son

B
5
A contra

0.4433

0.0470

0.1465

iguales
son

C
5
A contra

0.0233

0.0470

0.1465

iguales
no
son

D
5
B contra

0.4400

0.0491

0.1530

iguales
no
son

C
6
B contra

0.4667

0.0448

0.1397

iguales
son

D
6
C contra

0.0033

0.0470

0.1465

iguales
no
son

0.4633

0.0470

0.1465

iguales

Finalmente, se realiza la presentacin, en el formato usual de Tukey:


1.983
1.960
1.520
1.517

A
A

B
C
C

CONCLUSION: LOS MEJORES TRATAMIENTOS FUERON A Y C, SE DEBE


UTILIZAR EL QUE RESULTE MS ECONMICO
Prueba de rangos de Duncan
Fue desarrollado por primera vez por Duncan en 1951 pero posteriormente
l mismo modific su primer mtodo generando el que ahora se denomina Nuevo
mtodo de Rango Mltiple de Duncan. Esta prueba no requiere de una prueba
previa de F, como sucede con la DMS o sea que an sin ser significativa la prueba
F puede llevarse a cabo.
La prueba de rangos de Duncan consiste en probar que las medias de dos
poblaciones con a tratamientos son significativamente diferentes a travs de los
rangos mnimos.

Al aplicar el mtodo de Duncan a los datos del ejemplo del algodn se tiene:
1. El error estndar de la media es

2. Determinacin de los intervalos significativos como

Utilizacin la tabla VII del Apndice de Montgomery se tiene:

3. Los rangos mnimos significativos son:

4. Las medias ordenadas ascendentemente son:

5. Comparacin de las medias

se
compara con

porque entre

hay inclusive medias.Ver numeral 4 .

Al presentar en u diagrama de lneas los resultados se tiene

Tema

Pruebas

para

la

adecuacin

del

modelo

Normalidad
Es la cualidad o condicin de normal (que se ajusta a las normas o que se
halla en su estado natural). En un sentido general, la normalidad hace referencia a
aquel o aquello que se ajusta a valores medios.
Para verificar si nuestros residuos siguen el supuesto de normalidad podemos
realizar dos acciones:
1. Comprobar, a travs de un histograma con su correspondiente ajuste, a la
normal:
a. Que tan ajustado est un conjunto de observaciones con la normal.

b. Que la media sea aproximadamente igual a cero: x=-0.00987 0.


c. Que la varianza sea constante, para lo cual hay que realizar varias
veces el muestreo y as comprobar este supuesto.

2. Comprobar a travs de una grfica de probabilidades de residuos,


adems de que la media sea aproximadamente igual a cero y que la
varianza sea constante la aproximacin a la normalidad a travs del
coeficiente de Anderson-Darling, o el de Ryan-Joiner o el de KolmogorovSmirnov.

Para realizar una prueba para saber si los datos de una muestra provienen de
una distribucin especfica se utiliza la prueba de Anderson-Darling. Esta es una
prueba no paramtrica que se obtiene con la frmula:

El valor de AD se puede obtener fcilmente desde algn software como Minitab


Varianza constante e independencia
Para verificar el supuesto de varianza constante, se puede realizar la prueba de
hiptesis:

.
La prueba de Bartlett se utiliza para comprobar la hiptesis anterior y consiste en
el siguiente procedimiento:

1. Calcular la varianza de cada tratamiento.


2. Calcular el Sp, la estimacin combinada con la frmula:

3. Calcular b, el valor de una variable aleatoria B (con distribucin de Bartlett)


con la frmula:

4. Obtener el valor crtico

de alguna tabla, por ejemplo la tabla A.10 de

Walpole (2012).
5. Comparar

rechazamos H0 y aceptamos H1.

Residuos
Para ilustrar un posible anlisis de residuos, lo iremos haciendo a travs de un
ejemplo directamente:
1. Tomamos los datos de la seccin anterior, ver las columnas 1 a 6 de la
Tabla 2 (datos y resultados parciales).
2. Calculamos la media de cada tratamiento, ver la columna 7 de la Tabla 2
(Datos

resultados

parciales).

Sabiendo que MSE =11.5833

i=
1
2
3

j=
A
B
C

1
14
10
10

2
17
10
19

n=
3
12
16
10

Paso 2:
Media
14.33
12
13

Paso 3:
ei1
ei2
-0.330 2.67
-2
-2
-3
6

Paso 4:
ei3
di1
di2
-2.33 -0.097 0.785
4
-0.588 -0.588
-3
-0.882 1.76

di3
-0.685
1.18
-0.882

a=

17

18

19

18

-1

-0.294 0

0.294

Tabla 2. Datos y resultados parciales


3. Calculamos los residuos (el error eij de cada elemento yij respecto a su
correspondiente media):

Ver las columnas 8 a 10 de la Tabla 2 (Datos y resultados parciales).


La siguiente grfica nos presenta los residuos respecto al orden de observacin:

Grfica 1. Residuos contra orden de observacin: R = f [ k ]

4. Calculamos los residuos estndar

; observamos que el mayor

valor atpico d32 = 1.76 es menor que 3 o 4 desviaciones estndar, por lo


que no nos debe de preocupar.
Ver d32 en la columna 12 de la Tabla 2. (Datos y resultados parciales).

5. Finalmente, podemos observar grficamente en la Grfica 4. Residuos


contra valor ajustado, que no hay alguna concentracin de residuos, lo que
nos hace ver que se cumple muy probablemente la condicin

Grfica 4. Residuos contra valor ajustado


Tema 10. Tamao de la muestra
Curvas caractersticas
Podemos determinar el tamao de las corridas necesarias de un
experimento, obteniendo el valor de la potencia de la prueba
la

probabilidad

de

error

, en la que
tipo

, por lo que la potencia de la prueba:

El valor de

lo obtenemos a travs de curvas caractersticas, ejemplo:

es
II:

Se desea estudiar la resistencia de fluencia del acero A36 producido,

utilizando cuatro tcnicas diferentes A, B, C y D; rechazamos la hiptesis


utilizando un nivel de significancia

Solucin:
Paso 1. Se realiza el experimento con los cuatro tratamientos (tcnicas),
obteniendo los resultados mostrados en las columnas 3 a 6 de la Tabla 1.
Resultados preliminares.

Tcnica Sy

(resistencia

de

fluencia

(MPa)
1
2
3
4

1
2
3
4

285
254
250
252

250
251
253
253

254
250
251
253

251
254
254
252

260
252.25
252
252.5
=

5.8125
-1.9375
-2.1875
-1.6875
=4

1016.75 5.172
= 254.2
Paso 2. Calculamos:
a)
b)

La
La

media
suma

de

cada
de

todas

tratamiento
ellas

c) La media de las medias , obteniendo los resultados mostrados en la columna 7


de la Tabla 1 (resultados preliminares).
Paso 3. Calculamos:
a)
b) La suma de todas ellas, obteniendo los resultados mostrados en la columna 7
de la Tabla 1 (Resultados preliminares).

Paso 4. Suponiendo que

obtenemos que:

Y calculamos, para valores de n = 2 en adelante, aquel valor obteniendo los


resultados mostrados en la columna 2 de la Tabla 2 (Resultados finales).
n
2
3
4
5

2.52
3.78
5.04
6.3

1.5875
1.9442
2.245
2.51

3
3
3
3

4
8
12
16

0.6
0.29
0.054
0.032

0.4
0.71
0.946
0.968

Paso 5. B
Buscamos en la curva caracterstica de la Tabla V de Montgomery (2012) para
con [
libertad, ver Curvas 1.

grados de

Paso 6. Observamos en la Tabla 2 (Resultados finales) que con valores de


, por lo que rechazamos H0.
Paso 7. Observamos que con valores de
que tomamos como tamao mnimo n = 4 (

, y aceptamos H0, as
).

10.2 Desviacin estndar


La desviacin tpica o desviacin estndar (denotada con el smbolo o s,
dependiendo de la procedencia del conjunto de datos) es una medida de
dispersin para variables de razn (variables cuantitativas o cantidades
racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la
variable. El clculo de

es con la siguiente frmula:

Ejemplo:
Si tomamos los datos de la resistencia de fluencia del acero A36, y calculamos el
valor de

suponiendo que se desea detectar un incremento de 20%, con una

probabilidad de al menos 0.90 y utilizando un nivel de significancia

Solucin:
Paso 1. Realizar el experimento; ver tabla 1 del ejemplo anterior.
Paso 2. Calculamos:
a)

La

b)

media

La

de

suma

cada
de

tratamiento.

todas

ellas.

c) La media de las medias, - ; ver tabla 1 del ejemplo anterior.


Paso 3. Calculamos:
a)

b) La suma de todas ellas: Ver Tabla 1 del ejemplo anterior.


Paso 4. Suponiendo que

obtenemos que:

Y con esto calculamos valores de

para n = 8, 9, 10 y 11, obteniendo los

resultados mostrados en la columna 2 de la Tabla 3 (resultados finales):


n
8
9
10

1.8668
1.98
2.0871

3
3
3

28
32
36

0.21
0.12
0.083

0.79
0.88
0.917

11

2.189

40

0.053

0.947

Paso 5. Buscamos en la curva caracterstica de la Tabla V de Montgomery (2012)


para
con

grados

de

libertad.
Ver Curvas 2

Paso 6. Observamos en la Tabla 3 (resultados finales), que con valores de


, por lo que rechazamos H0.
Paso 7. Observamos que con valores de
que tomamos como tamao mnimo n = 10 (

, y aceptamos H0, as
).

Observamos que al considerar la desviacin estndar, aumenta el tamao de la


muestra.

Intervalo de confianza
La probabilidad de xito en la estimacin se representa con 1 - y se
denomina nivel de confianza. En estas circunstancias, es el llamado error
aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar
en la estimacin mediante tal intervalo. [1]
El nivel de confianza y la amplitud del intervalo varan conjuntamente, de
forma que un intervalo ms amplio tendr ms probabilidad de acierto (mayor nivel
de confianza), mientras que para un intervalo ms pequeo, que ofrece una
estimacin ms precisa, aumenta su probabilidad de error
Tema 11. Diseos de bloques completos
Los diseos de bloques completos se utilizan en casos en donde dos o ms
factores influyen en la respuesta.
El diseo de bloques completos es muy til para resolver este tipo de
problemas con multi-parmetros.
Diseos de bloques completos aleatorios
El diseo de bloques completos aleatorios se utiliza cuando queremos
comparar tratamientos o determinar el efecto de un factor en especial.
Ejemplo: Un ingeniero desea probar el efecto de colocar cuatro diferentes tipos de
capacitores en la frecuencia de oscilacin de un oscilador, que espera sea de 100
MHz. Para la prueba, el ingeniero decide realizar un anlisis de varianza para el
diseo de bloques completos aleatorios que consiste en utilizar cada tipo de
capacitor en cinco osciladores diferentes y realizar la decisin con un nivel de
significancia
Solucin.

Paso 1. El orden en que se elige el amplificador y su correspondiente capacitor es


al azar.
En la siguiente tabla (Tabla 3) se muestra la frecuencia de oscilacin (en MHz) de
los cinco amplificadores con los cuatro capacitores:

Caacitor
1
2
3
4

Amplificador
1
2
98.9 97.3
104.0 103.4
98.3 101.3
104.4 101.5

3
102.6
100.5
101.2
98.7

4
104.1
97.0
95.5
101.8

5
103.2
98.0
100.9
97.0

Paso 2. Para simplificar el procedimiento le restamos 100 a cada valor medido y


calculamos

(Tabla 4).

Amplificador (a=5)
Capacitor (b=4) 1
2
3
1
-1.1
-2.7
2.6
2
4.0
3.4
0.5
3
-1.7
1.3
1.2
4
4.4
1.5
-1.3
5.6
3.5
3.1
31.5 12.3 9.3

4
4.1
-3.0
-4.5
1.8
-1.6
2.6

5
3.2
-2.0
0.9
-3.0
-0.9
0.81

6.2
2.9
-2.8
3.4

38.36
8.17
7.77
11.71
66.0

56.51

Paso 3. Realizamos los clculos utilizando las frmulas de las tablas 1 y 2. Las
operaciones y los resultados se muestran en la siguiente tabla (Tabla 5):

Fuente
de
variacin
Tratamie
ntos

Suma de cuadrados

Grados
libertad

de
Cuadrados medios F0

Bloques

Error

Total

Paso 4. Dado que

es mayor que

concluimos que los

diferentes tipos de capacitores no afectan a la frecuencia de oscilacin.


Diseo de cuadro latino
Se le llama cuadro latino, ya que adems de los dos factores a comparar se
realiza un tercer cotejo de acuerdo a la letra latina correspondiente.
Ejemplo: uno para p=4: cuadro 4 X 4 y otro para p=5: cuadro 5 X 5.
4X4
A
B
C
D

B
C
D
A

C
D
A
B

5X5
A
B
C
D
E

D
A
B
C

B
C
D
E
A

C
D
E
A
B

D
E
A
B
C

E
A
B
C
D

.
Diseo de cuadro grecolatino
El diseo de cuadro grecolatino se utiliza cuando se desea comparar cuatro
factores, dos de ellos (

) llamados de bloque y los otros dos (

de tratamiento y se identifican con letras griegas y latinas

) llamados

Se le llama cuadro grecolatino ya que adems de los dos factores a


comparar se realiza una tercera comparacin de acuerdo a la combinacin de letra
griega y latina correspondiente.

A continuacin se incluyen dos ejemplos de dicho orden (que puede ser diferente):
uno para p=4: cuadro 4 X 4 y otro para p=5: cuadro 5 X 5.

4X4

5X5

Al utilizar los bloques completos, disponemos de una buena variedad de


mtodos: de inicio el diseo de bloques completos y en general para determinar la
relacin que dos factores tienen con la variable de respuesta.
Si deseamos aumentar un factor, podemos utilizar los diseos de cuadro
latino y basados en los bloques completos incluimos en ellos un nuevo parmetro,
indicado a base de letras latinas.

Y si deseamos aumentar un factor ms, podemos utilizar los diseos de


cuadro grecolatino, que basados en los diseos de cuadro latino incluimos en ellos
un nuevo parmetro, indicado a base de letras griegas.
Tema 12. Diseos factoriales 2k y 3k
Si deseamos aumentar la eficiencia en los experimentos en los que se
desea estudiar los efectos de dos o ms factores, el diseo factorial es una
alternativa.
En este tipo de diseo no solo se estudian las relaciones funcionales de la
respuesta en relacin con los factores sino tambin las interacciones entre ellos.
Diseo factorial: Es el diseo ms eficiente para los experimentos en los que se
desea estudiar los efectos de dos o ms factores.
Factores cruzados: el factor A tiene a niveles y el factor B tiene b niveles, entonces
cada rplica contiene ab combinaciones.
Efecto principal:se le llama al cambio en la respuesta producido por un cambio en
el nivel del factor.
Incremento de la respuesta promedio es la operacin anterior, decimos que hay
un incremento de la respuesta promedio de A = 21, cuando el factor A cambia del
nivel bajo al nivel alto o decimos que hay un incremento de la respuesta promedio
de B = 21, cuando el factor B cambia del nivel bajo al nivel alto.
Interaccin: ocurre cuando en un experimento encontramos que la diferencia en la
respuesta entre los niveles de un factor no es la misma que entre los niveles del
otro factor, por ejemplo, el experimento de la Figura 2 en el nivel bajo del factor B
(B-) el efecto A es:
A = 50 20 = 30

Y en el nivel alto del factor B (B+) el efecto A es:


A = 12 40 = -28
La magnitud del efecto de interaccin: Se calcula con el promedio de los dos
efectos anteriores:
Factor cuantitativo, son las variables las que se les puede asignar una cantidad
analgica, como a la temperatura, presin, tiempo, etc.
Modelo de regresin, un factor cuantitativo que puede ser representado con una
funcin:

Grfica de superficie de respuesta: Se le llama as a la representacin grfica de


un modelo de regresin.
Ventajas del diseo factorial

Puede ser estudiado el efecto individual y de interaccin de cada factor.

Pueden cambiar de tamao sobre la marcha a medida que el experimento


lo requiera.

Se pueden correr los diseos factoriales en forma fraccionada.

Se pueden combinar con diseos de bloques si as lo requiere el


experimento.

No requiere de matemticas complicadas, la mayora de las veces se


trabajan con base en representaciones de funciones lineales.

Estimacin puntual de los efectos promedio y de las variables de respuesta


En la estimacin puntual, se evalan los parmetros por medio de una muestra
de tamao, p, siguiendo los siguientes procedimientos:
a. La media,

, se estima a travs de la media de la muestra,

, que se

representa con el smbolo .


b. El parmetro

, se estima a travs de la media de la muestra

, que se representa con el smbolo


c. El parmetro

, dado por

, se estima a travs de la media de la muestra

, dado por

, que se representa con el smbolo .


d. El parmetro

, se estima a travs de la media de la muestra

, que se representa con el smbolo


e. El parmetro

, se estima a travs de la media de la muestra

, que se representa con el smbolo

, dado por

, dado por

Tema 13. Diseos factoriales 2k


Diseos factoriales 22
El caso ms general, conocido como 22, es cuando tenemos solo dos factores, A y
B, de tal suerte que la combinacin de ellos estar dada por su correspondiente
producto:

De aqu que este tipo de diseo experimental es llamado diseo factorial

Como en todo sistema binario, los niveles pueden ser designados como0 (cero)
o 1 (uno), alto o bajo, + o -, A o B, etc.
Dado que los diseos factoriales 2 2 suponen que k=2, asignamos a cada factor la
siguiente notacin estandarizada:
Factor

Efecto Efecto medio

Factor A

Factor B

Interaccin del factor A con


el factor B

AB

Para realizar la prueba de un experimento a base de diseos factoriales 2 2 se


utiliza la tabla ANOVA mostrada a continuacin:
Fuente

deSuma

varianza
A
B
AB
Error
Total

deGrados

deCuadrados

cuadrados libertad

medios

Ejemplo: Se desea estudiar el efecto del dimetro de un cilindro neumtico (factor


A) y la presin (factor B) sobre la fuerza de carga del cilindro (respuesta). La
prueba ser con 3 rplicas. Se utilizar para la prueba cilindros de 20mm y 25mm
y presiones de 400kPa y 600kPa.
Solucin:
Factor
Niveles
A Dimetro 20 25
B Presin 400 600

A:

B:

Unidad
mm
kPa

x1

X2

Fuerza, N

Total

Dimetro Presin
20mm
400kPa
25mm
400kPa
20mm
600kPa
25mm
600kPa

+
+

+
+

-1
+1
-1
+1

-1
-1
+1
+1

113
174
145
244

104
151
169
226

116
162
138
276

333
487
452
746

Aunque contamos con todas las frmulas para los clculos, podemos hacer uso
del software Design Expert 7.0.0 Trial
Name Units
A
A
B
B

Type

Low
Numeric
Numeric

High
-1
-1

1
1

Continue
Responses: 1

Name

Units
R1

Introducir los datos en la columna R1:


Std

Run

Factor 1 Factor 2 Response 1


A:A
1
7
-1.00
2
1
-1.00
3
4
-1.00
4
2
1.00
5
3
1.00
6
11
1.00
7
8
-1.00
8
6
-1.00
9
10
-1.00
10
9
1.00
11
12
1.00
12
5
1.00

B:B
-1.00
-1.00
-1.00
-1.00
-1.00
-1.00
1.00
1.00
1.00
1.00
1.00
1.00

R1
113
104
116
174
151
162
145
169
138
244
226
276

Se presentan los resultados, traducidos los encabezados y anexando la columna


Contraste:

Suma de Grados de Cuadrados Valor Valor_p


Fuente Contraste

Modelo

cuadrados libertad

Medios

Prob > F

40098.00 3.00

13366.00 39.07 < 0.0001 significant

A-A

430.00

15408.33 1.00

15408.33 45.04 0.0002

B-B

526.00

23056.33 1.00

23056.33 67.40 < 0.0001

AB

140.00

1633.33

1.00

1633.33

Error

2736.67

8.00

342.08

Total

42834.67 11.00

4.77

0.0604

Conclusiones:
1. Dado que el valor_p del modelo es menor a 0.05 es significante.
2. Dado que el valor_p de A es menor a 0.05 es significante.
3. Dado que el valor_p de B es menor a 0.05 es significante.
4. Dado que el valor_p de AB es mayor a 0.05 no es significante.
13.2 Diseos factoriales 23
Aunque el caso ms general es cuando tenemos solo dos factores, A y B, se
pueden dar dos situaciones:
1. Se puede desear estimar la respuesta al aumentar un factor adicional.

2. De origen el problema presenta no dos sino tres factores.


De tal suerte que la combinacin de ellos estar dada por su correspondiente
producto:

De aqu que este tipo de diseo experimental es llamado diseo factorial 23.
Como en todo sistema binario, los niveles pueden ser designados como 0 (cero)
o 1 (uno), alto o bajo, + o -, A o B, etc.

Fuente
variacin

A
B
C
AB
AC
BC
ABC
Error

de
Suma

deGrados

deGrados

cuadrados libertad

medios

F0

Valor_P

Total

Diseos factoriales
Este es el diseo factorial
Significa

en la que se supone que k es mayor a tres.

factores

efectos.
1
2
3
4
5
6

Estima los efectos de los factores


Forma el modelo inicial
Realiza la prueba estadstica
Refina el modelo
Analiza resultados
Interpreta resultados

con

niveles

cada

uno.

El clculo del k_simo contraste se calcula con la frmula:

La fuente de variacin, la suma de cuadrados y los grados de libertad para el


diseo

se presentan en la siguiente tabla:

Fuente de variacin

Suma de cuadrados

Grados

de

libertad

Ejemplo: Kandaswamy y Selvaraj (2000) nos presentan un ejemplo del diseo


factorial 2k para k=4 a travs de un diseo experimental que determina los factores
que afectan el tiempo para andar en bicicleta a travs de un experimento
bicicletero.
Solucin:
Los factores y sus niveles estn descritos en la siguiente tabla:
Niveles
Bajo
Presin en las llantas40
Engranaje
Bajo
Altura del asiento
36
Direccin del viento En contra

Factor
A
B
C
D

Unidad
Alto
60
psi
Alto
42
Pulgadas
A favor

La ecuacin de regresin obtenida con el Design Expert se muestra a


continuacin:

Tiempo = 134.55 - 6.34*A 9.69*B 4.49*C 2.16*D 2.41*AB 1.52*BD


Suma de

Grados

de
Fuente Cuadrados
libertad
Bloque 6.5664063
1
Modelo 2674.1984
6
A
644.01751
1
B
1502.1438
1
C
322.83106
1
D
74.952306
1
AB
93.074256
1
BD
37.179506
1
Residuos 40.6274
8
Total
2721.3922
15
Tema 14. Diseos factoriales 3k

Cuadrados

Valor

Medios
6.56640625
445.6997396
644.0175063
1502.143806
322.8310563
74.95230625
93.07425625
37.17950625
5.078425

F
87.76338
126.8144
295.7893
63.56913
14.75897
18.32739
7.32107

Prob > F

< 0.0001 significant


< 0.0001
< 0.0001
< 0.0001
0.0049
0.0027
0.0268

Un diseo factorial en el que se tengan ms de 2 factores con ms de 3 niveles,


puede ser resuelto con un diseo factorial 3 k. Igual que con el diseo 2 k los
diseos factoriales 3k se utilizan s:
1. Hay ms factores que en el 2k.
2. Deseamos conocer la respuesta en funcin de la combinacin de varios
factores.
3. Si existen factores cuantitativos y cualitativos.

Si consideramos tres niveles en cada factor y tomamos k factores en


consideracin, la combinacin de ellos estar dada por su correspondiente
producto:
Diseos factoriales 32
significa que el experimento se realiza con 2 factores (A y B) y con 3 niveles
cada uno (0, 1 y 2).
Para este diseo el nmero de efectos se calcula con la frmula:

.
Para este tipo de diseo en la siguiente tabla se presentan los grados de libertad:

Fuente

Grados de
libertad

A-A

B-B

AB

Error
Total
Las sumas de cuadrados A-A, B-B y AB pueden ser calculadas con las frmulas
presentadas en temas anteriores.
14.2 Diseos factoriales 33
significa 3 factores con 3 niveles cada uno,

efectos.

Observamos que existen 27 combinaciones de tratamientos lo que nos da 26


grados de libertad.
1. Cada efecto medio tiene 2 grados de libertad.
2. Cada interaccin de dos factores tiene 4 grados de libertad.
3. Cada interaccin de tres factores tiene 8 grados de libertad.
4. En total existen

grados de libertad para n rplicas.

5. Para el error existen

grados de libertad.

Ejemplo: Purvis y Gallagher (2000) nos presentan el siguiente ejemplo del diseo
factorial 33 a travs de un diseo experimental para establecer unos valores
nuevos de la potencia, la presin y la relacin de gas que sern utilizados en un
nuevo ajuste de 1.2cm.
Solucin:
Se establecen los niveles bajo, medio y alto:

Factor

Niveles
Bajo

Unidad
Medio

Alto

Potencia

600

750

900

Presin

300

385

470

mT

CF4:CHF3

1.8

2.2

2.6

Se introducen los datos en el Design Expert obteniendo el siguiente resultado:


Fuente deSuma

deGrados deCuadrados

Valor_p

variacin

cuadrados libertad

medios

Bloque

43560.00

43560.00

4.657E+006 242.93

< 0.0001

1.674E+006 87.34

0.0002

7.640E+006 398.53

< 0.0001

Modelo

9.315E+00
6
1.674E+00

6
7.640E+00

significativ
o

NO
Curvatura 4120-90

4120-90

0.21

0.6624

significativ
o

Residuos 95855.00
Cor Total

9.458E+00
6

19171.00

Se genera el modelo de regresin:

Conclusiones:
1. Dado que (Valor_p del Modelo) < 0.01 se concluye que es significativo.
2. Dado que (Valor_p de A) < 0.01 se concluye que es significativo.
3. Dado que (Valor_p de B) < 0.01 se concluye que es significativo.

4. Dado que (Valor_p de la Curvatura) > 0.01 se concluye que es no es


significativo.
Diseos factoriales 3k
significa k factores con 3 niveles cada uno.

efectos.

Lo estudiado en los diseos 32 y 33 puede ser utilizado para el diseo factorial 3 k.


En el caso de k = 4, se utiliza la notacin 0120 para la combinacin de
tratamientos con los factores A y D a los niveles bajos, B al nivel medio y C al nivel
alto.
Existen
Existen

combinaciones de tratamientos.
grados de libertad entre ellos.

Tema 15. Diseos factoriales fraccionados


Fraccin del diseo 2k
Cuando crece el nmero de factores, de tal forma que por ejemplo si k = 6 se
necesitan 64 corridas con 63 grados de libertad distribuidos de la siguiente forma:
1. 6 para los efectos medios.
2. 15 para las interacciones entre dos factores.
3. 42 para las interacciones entre tres factores.
Podemos observar que la mayora de los grados de libertad corresponden a las
interacciones entre tres factores (42), de tal forma que el diseador puede llegar a
considerar que no son significativos y realizar el diseo solo con los efectos

medios y las interacciones entre dos factores; a este tipo de diseo se le conoce
como fraccin del diseo 2k
Debido a que la fraccin del diseo 2 k contiene 2k-1 corridas se le conoce como
diseo factorial fraccionado 2k-1.
Otro diseo factorial para un gran nmero de factores es el de la fraccin del
diseo 2k.
Debido a que la fraccin del diseo 2 k contiene 2k-2 corridas se le conoce como
diseo factorial fraccionado 2k-2.
Diseo factorial fraccionado general 2k-p
del diseo 2k contiene 2k-p corridas se le conoce

Debido a que la fraccin

como diseo factorial fraccionado 2k-p.


Ejemplo: Se desea realizar un diseo experimental para simular la manufactura de
semiconductores.
Solucin:
Rasmidatta, Tseng y Rastogi (2013) identifican los siguientes 8 factores con sus
correspondientes niveles:

1
2
3
4
5
6
7
8

Factor
Operador
OP_DIFF
OP_PHOTO
OP_ETCH
OP_WET
OP_MOVE
Release Rate
Dispatching
Rules
Stockers Qty.

Nivel Rango
2
2
2
2
2
2

2
2
3
2
35
18k

4
4
5
4
55
19k

FIFO

Same Setup

Tabla 3. Factores con sus correspondientes niveles.


Dado que k=8, se decide disminuir a 4 el exponente del diseo, por lo que se
realizar el experimento basado en un diseo factorial fraccionado 2 8-4 ( 2k-p con
k=8 y p=4).
Adems se decide tomar como variables de salida:
1. El tiempo promedio por ciclo.
2. El rendimiento.
Se introducen los datos del experimento y se realizan los clculos, dando los
siguientes resultados en las tablas:
1. ANOVA para el tiempo promedio por ciclo.
2. ANOVA para el rendimiento.
Fuente deSuma
variacin
Modelo
A
G
AG

deGrados deCuadrados

cuadrados libertad
3094696.403
2440544.151
510956.81 1
143195.44 1

F
medios
1031565.47 2238.82
2040544.15 5296.75
510956.81 1108.94
143195.44 310.78

Curvatura 852.64

852.64

Residuos 7832.96
Falta
de
5791.66
ajuste
Error puro 2041.30
Total
3103382

17

460.76

13

445.51

4
21

510.33

1.85
0.87299645
4

Valor_p
<0.0001 significativo
<0.0001
<0.0001
<0.0001
NO
0.1915
significativo
0.6215

Tabla 4. ANOVA para el tiempo promedio por ciclo

Suma

de

Valor_p

NO
significativo

Fuente de
variacin

cuadrados

14050525.5

Modelo

5
13028404.5

AG

Grados deCuadrados
libertad

medios

7025262.77 4574.10

1022121.00 1

13028404.5
5

<0.0001

0.36

0.5533

0.52

0.8373

560.48

Residuos 27645.79

18

1535.88

14

1274.79

2449.67

ajuste

de
17847.12

Error puro 9798.67

Cor total

14078731.8
2

21

significativo

<0.0001

1022121.00 665.50

Curvatura 560.48

Falta

8482.71

<0.0001

NO
significativo

NO
significativo

You might also like