You are on page 1of 97

DISEÑO COMPLETAMENTE AL AZAR

• Es el diseño más sencillo


• Consiste en asignar los niveles de un factor de
interés a unidades experimentales previamente
aleatorizadas.
• Las unidades experimentales deben ser
homogéneas

CASOS DE ACUERDO AL NÚMERO DE


OBSERVACIONES POR CADA NIVEL
• BALANCEADO: igual número de observaciones por cada
nivel del factor de interés
• DESBALANCEADO: el número de observaciones varía
por cada nivel del factor de interés
¿Cuál es el objetivo en un
DCA de un solo factor?

Probar si la media de cada nivel


del factor de interés es igual para
todos, o bien, si el efecto de cada
nivel del factor es nulo sobre la
verdadera media poblacional.
DISEÑO COMPLETAMENTE AL AZAR

1. Consideraciones Previas

Definición del Problema/objetivo del experimento(


Identificación de la Variable de Respuesta
Selección del Factor de Interés
Selección de los Niveles del Factor de Interés(fijos o aleatorios)
Definición de las Unidades Experimentales
Estimar o Decidir el Tamaño de Muestra por cada nivel
EJEMPLO
1. En el siguiente experimento: EMPAQUE DE CARNES
• Defina el problema objeto de estudio
•Identifique la variable de respuesta (VD), unidad experimental
• Identifique el factor de interés (VI) y sus niveles
• Número de observaciones por cada nivel

La vida de anaquel de las carnes almacenadas es el tiempo que un corte previamente


empacado es sano y vendible. Un paquete normal expuesto al aire ambiental tiene
una vida aproximada de 48 horas, después de las cuales la carne comienza a
deteriorarse por contaminación de microbios, degradación del color y encogimiento.
El empaque al vacío es efectivo para suprimir el desarrollo de microbios, sin
embargo, continúan siendo un problema los otros aspectos.

Algunos estudios recientes sugieren las atmósferas controladas de gas, como


alternativa a los empaques actuales. Dos atmósferas que prometen combinar la
capacidad de suprimir el desarrollo de microbios con la conservación de las
cualidades de la carne son: dióxido de carbono puro (CO2) y mezcla de monóxido de
carbono (CO), oxígeno (O2) y nitrógeno (N).
Continuación………….
Con base en esta nueva información , el investigador plantea la hipótesis de que
alguna forma de atmósfera controlada proporcionará un entorno más efectivo de
empaque para el almacenamiento de carne.
El diseño desarrollado por el investigador para evaluar la hipótesis incluyó empaques
con:
1. Aire del ambiente con un empaque comercial de plástico
2. Empaque al vacío
3. Una mezcla de gases con 1% CO, 40% O2, y 59% N
4. 100% CO2
A cada conjunto de condiciones de empaque se le asignaron al azar 3 cortes del
mismo tamaño (75 kg). Cada corte se empacó por separado en las condiciones
asignadas y cada uno se le midió el número de bacterias sicotrópicas en la carne (el
crecimiento bacterial se expresa como el logaritmo del número de bacterias por
centímetro cuadrado). Las bacterias sicotrópicas se encuentran en la superficie de la
carne y se asocian con la carne deteriorada
Ejemplo 1
Problema Determinar si hay diferencias significativas en el
número promedio de bacterias sicotrópicas en la carne
para diferentes condiciones de empaque.
Variable de respuesta Número de bacterias sicotrópicas en cada paquete de
carne.
Factor de interés Condiciones de Empaque
Niveles 1. Aire del ambiente con un empaque comercial de
plástico
2. Empaque al vacío
3. Una mezcla de gases con 1% CO,40% O2, y 59% N
4. 100% CO2
Número de observaciones 3 cortes del mismo tamaño (75 kg)
por nivel
Unidad experimental Cortes de Carne
COMO PLANTEA EN TERMINOS
ESTADISTICO LA HIPOTESIS
FORMULADA POR EL
INVESTIGADOR?

COMO CONTRASTA ESA


HIPOTESIS?
2. LA ADICCION AL CELULAR

El problema es real. La adicción al celular no es una teoría nueva o producto de la


imaginación de algunas personas.

Las personas adictas al celular padecen de una dependencia irracional que al momento de
ser separadas del móvil sienten inseguridad, miedo, angustia, vacío interno, que si no
reciben un mensaje, o un like o una llamada comienzan a deprimirse. El uso que le dan al
dispositivo móvil es realmente excesivo, ya que no solo lo utilizan para llamar o
enviar/recibir mensajes/redes sociales, sino también para otras actividades. Todos estos
factores y otros son los que identifican a un adicto al celular.

Vivimos en una sociedad donde la tecnología se desarrolla cada vez más y toma un lugar
importante en la vida de cada individuo, todos los días somos bombardeados de
información por los medios de comunicación pidiéndonos a gritos ser consumidores de los
productos que anuncian, ante esto, pareciera imposible no actualizarse en cuanto a
tecnología se trata, pero debemos tener bien en claro que el problema no es usar el celular,
sino la reacción que el uso de éste dispositivo genera en la persona.
Debemos darle el uso indicado a nuestro móvil, utilizarlo
solamente cuando realmente se necesita y poder entender
perfectamente la diferencia entre una necesidad y una adicción,
si usted como lector cree que padece de alguno de los síntomas
de la adicción al móvil o cualquier tecnología, se le recomienda
tome las medidas necesarias para romper ese mal hábito.

A pesar de que la cantidad de dinero utilizado en tarjetas de


saldo para el celular no es un factor determinante para poder
decir si una persona es adicta o no al teléfono móvil, si puede
indicar el tiempo que le dedican a éste y la importancia que le
dan.

En la siguiente tabla se muestran los resultados de un sondeo


aplicado a 21 personas: 7 estudiantes de nivel secundaria, 7
estudiantes de nivel media superior y 7 estudiantes de nivel
superior.
DINERO INVERTIDO EN TARJETAS PARA EL CELULAR
MENSUALMENTE

NIVEL DE ESTUDIOS
OBSERVACIONES SECUNDARIA PREPARATORIA UNIVERSIDAD
1 100 200 200
2 200 100 300
3 500 100 100
4 300 100 200
5 100 200 100
6 200 300 200
7 100 100 100

• Defina el problema objeto de estudio


• Identifique la variable de respuesta (VD), unidad experimental
• Identifique el factor de interés (VI) y sus niveles
• Número de observaciones por cada nivel
Ejemplo 2
Problema Determinar si hay diferencias significativas en el
número promedio del dinero invertido en tarjetas para el
celular mensualmente para diferentes niveles
académicos de estudio.
Variable de respuesta Dinero invertido en tarjetas para el celular
mensualmente
Factor de interés Niveles académicos de estudio
Niveles 1. Secundaria
2. Preparatoria
3. Universidad
Número de observaciones 7 estudiantes por nivel académico
por nivel
Unidad experimental Tarjetas de celular
COMO PLANTEA VERBALMENTE
LA HIPOTESIS EN ESTA
SITUACION?

EN TERMINOS ESTADISTICOS LA
HIPOTESIS ?

COMO CONTRASTA ESA


HIPOTESIS?
Ejemplo 3
• Un ingeniero de desarrollo de productos tiene interés en
investigar la resistencia a la tensión de una fibra sintética nueva
que se usará para hacer tela de camisas para caballero. El
ingeniero sabe por experiencia previa que la resistencia a la
tensión se afecta por el peso porcentual del algodón utilizando
en la mezcla de materiales de la fibra. Además, sospecha que al
aumentar el contenido de algodón se incrementará la resistencia,
al menos en un principio. Sabe así mismo que el contenido de
algodón deberá variar entre 10 y 40 por ciento para que el
producto final tenga otras características de calidad que se
desean (como la capacidad de ser sometido a un tratamiento de
planchado permanente). El ingeniero decide probar ejemplares
en cinco niveles del peso porcentual del algodón: 15, 20, 25, 30
y 35 por ciento. También decide probar cinco ejemplares en
cada nivel del contenido de algodón.
Ejemplo 3
Datos (lb/plg2) del experimento de la resistencia a la tensión
Peso % del Observaciones
algodón 1 2 3 4 5
15 7 7 15 11 9
20 12 17 12 18 18
25 14 18 18 19 19
30 19 25 22 19 23
35 7 10 11 15 11
Ejemplo 3
Problema Determinar si hay diferencias significativas en el
número promedio de la resistencia a la tensión de una
fibra sintética nueva para diferentes pesos porcentuales
del algodón.
Variable de respuesta Resistencia a la tensión (lb/plg2)
Factor de interés Peso porcentual del algodón
Niveles 1. 15% de algodón
2. 20% de algodón
3. 25% de algodón
4. 30% de algodón
5. 35% de algodón
Número de observaciones cinco ejemplares en cada nivel del contenido de algodón
por nivel
Unidad experimental Tela de camisas para caballero
No es una ecuación matemática, es una expresión simbólica
que trata de llevar el fenómeno biológico hacia una
expresión matemáticas que ayude a operativizar lo que esta
ocurriendo a través de las matemáticas y las estadísticas
Se utilizará i para las filas y j para las columnas

Yij =  +  j +  ij
Utilizando las COLUMNAS para
representar los niveles del factor j = 1...... k
i = 1...... n

Utilizando las FILAS para


Yij =  +  i +  ij
representar los niveles del factor
i = 1...... k
j = 1...... n
Utilizando las COLUMNAS para representar los niveles del factor

Modelo Estadístico Lineal


Yij =  +  j +  ij
j = 1...... k
i = 1...... n
Yij es la i-ésima observación para el j-ésimo nivel del factor de
interés

 media total

j
es el efecto del j-ésimo nivel del factor de interés sobre la
variable de respuesta

 ij representa el residuo que se distribuye normalmente con


media cero y varianza σ2
Si se utilizan las filas para representar los niveles del factor
como se escribe el modelo?

Modelo Estadístico Lineal


Yij =  +  i +  ij
i = 1...... k
j = 1...... n

Yij es la j-ésima observación para el i-ésimo nivel del factor de


interés

 media total

i es el efecto del i-ésimo nivel del factor de interés sobre la


variable de respuesta
 ij es el error experimental
Cualquiera que sea la forma en que se escribe el modelo se puede representar
en una tabla:

NIVELES DEL FACTOR DE INTERES


Yij =  +  +  ij
OBSERVACIONES
1 2 3 . . k
j
1 Y11 Y12 Y13 . . Y1k
2 Y21 Y22 Y23 . . Y2k j = 1...... k
. . . . . . .
. . . . . . . i = 1...... n
. . . . . . .
n Yn1 Yn2 Yn3 . . Ynk

OBSERVACIONES
NIVELES DEL FI
Yij =  +  i +  ij
1 2 . . . n
1 Y11 Y12 . . . Y1n

i = 1...... k
2 Y21 Y22 . . . Y2n
3 Y31 Y31 . . . Y3n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
j = 1...... n
K Yk1 Yk2 . . . Ykn
Recordando la sesión 1…
Los factores pueden ser:
• Fijos
• Aleatorios
• Mixto

El tipo de factor influye en como se plantean


las hipótesis

En el caso de un DCA de un solo factor el modelo solo


puede ser de efecto fijo o de efecto aleatorio
COMO SE PLANTEA EL CONTRASTE DE HIPOTESIS
DE ACUERDO AL TIPO DE FACTOR?

En este punto es importante conocer


o establecer que NIVEL DE
SIGNIFICANCIA se usará para
realizar el Análisis Estadístico:
Los más utilizados son 5% y 1%, sin
embargo depende del analista y del
diseñador.
También es posible utilizar otro que
no sean los mencionados
anteriormente
Contraste de Hipótesis (Factor de Efectos Fijos)
H o : 1 =  2 = .........  k
H1 = al menos una de las medias de los niveles del factor de
interés es diferente

Regla de Decisión
Fc  F , g ln,gld
Descartar Ho si donde
g ln = k − 1
gld = k (n − 1)
Región de Rechazo

F
F , g ln,gld
DE QUE OTRA MANERA SE PUEDE ESCRIBIR EL
CONTRASTE DE HIPOTESIS?

H0 : τ1 = τ2 = τ3 = ….. = τk =0

H1 : τi 0 Al menos para una i


Contraste de Hipótesis (Factor Efectos aleatorios)

H 0 :  =  = .........
2
1
2
2
2
k
H1 : al menos una de las varianzas de los niveles del factor
de interés es diferente

Regla de Decisión
Descartar Ho si
Fc  F , g ln,gld Región de Rechazo

donde 

g ln = k − 1
FF , g ln,gld

gld = k (n − 1)
NOTA IMPORTANTE

Si se planteó el modelo estadístico con los niveles


en las filas, las hipótesis se plantean de la misma
forma, ya que siempre se utilizara k para los
niveles y n para las observaciones

Yij =  +  j +  ij Yij =  +  i +  ij
j = 1...... k niveles
i = 1...... k niveles

i = 1...... n observaciones j = 1...... n observaciones


Como se realiza el procedimiento
de Aleatorización en un DCA?

• Codificar las unidades experimentales desde 1


hasta nk
• Establecer un orden aleatorio para las pruebas
que serán realizadas sobre las unidades
experimentales, utilizando la tabla de números
aleatorios
• Asignar los niveles del factor de interés a las
unidades experimentales aleatorizadas

Los pasos son los mismos independientemente de cómo se haya


escrito el modelo
PROCEDIMIENTO DE ALEATORIZACION
ASIGNACION
CODIFICACION DE LAS
NUMEROS DE LOS
UNIDADES
ALEATORIOS NIVELES DEL
EXPERIMENTALES
FI
1 1
2 1
. .
. .
. 2
. 2
. .
. .
. .
. .
. .
. .
. .
. k
nk k
Toma de datos: medición de la variable

NIVELES DEL FACTOR DE INTERES


OBSERVACIONES
1 2 3 . . k
1 Y11 Y12 Y13 . . Y1k
2 Y21 Y22 Y23 . . Y2k
. . . . . . .
. . . . . . .
. . . .
Y
. . .
n Yn1 Yn2 Yn3 . ij . Ynk
TOTALES/NIVEL Y.1 Y.2 Y.3 Y.k
GRAN TOTAL Y..

Yij =  +  j +  ij
j = 1...... k
i = 1...... n
Toma de datos: medición de la variable

OBSERVACIONES
NIVELES
1 2 . . . n TOTALES/NIVEL
1 Y11 Y12 . . . Y1n Y1.
2 Y21 Y22 . . . Y2n Y2.
3 Y31 Y31 .
Yij. . Y3n Y3.
. . . . . . .
. . . . . . .
K Yk1 Yk2 . . . Ykn YK.
GRAN TOTAL Y..

Yij =  +  i +  ij
i = 1...... k
j = 1...... n
A.Verificación de los Supuestos del Modelo
1. Normalidad
2. Homocedasticidad
3. Independencia

B. Análisis de Varianzas
1. Prueba F de Fisher

C. Otros Análisis
1. Calculo de Indicadores
2. Calculo de Intervalos de Confianza
A. VERIFICACION DE LOS SÚPUESTOS DEL MODELO

Esta variación total se descompone para probar si hay diferencias entre las
medias de los niveles. Es un requisito que se satisfagan los siguientes
supuestos, para que el ANOVA sea una prueba exacta de Hipótesis:

1. NORMALIDAD se refiere a que los datos de la variable de respuesta o los


residuos deben tener una distribución aproximadamente normal.

2. INDEPENDENCIA: los datos de la variable de respuesta o los residuos no


deben estar correlacionados. A través de la aplicación de un minucioso
procedimiento de aleatorización se puede asegurar el cumplimiento de este
supuesto

3. HOMOCEDASTICIDAD: las varianzas de cada nivel del factor de interés


deben ser aproximadamente iguales. A través de la selección de unidades
experimentales homogéneas se puede garantizar el cumplimiento de este
supuesto

No es saludable confiar en el resultado del ANOVA si estos


supuestos no han sido verificados
Los supuestos pueden verificarse a través del examen de los residuales. En un DCA
unifactorial los residuos se estiman a partir de :


eij = Yij − Yij

Yij Estimación de los valores de la variable de respuesta
correspondiente que se obtiene por:


Yij =  + i

Yij = Y.. + (Yi. − Y.. )

Yij = Yi.

eij = Yij − Yi.


COMO SE VERIFICA EL SUPUESTO DE NORMALIDAD

a. HISTOGRAMA DE RESIDUALES
Si se cumple el supuesto este grafico debe aparecer en forma de campana con
centro en cero
Lamentablemente dado que se trabaja con muestras pequeñas pueden ocurrir
fluctuaciones significativas
Si la desviación es moderada no implica necesariamente que el supuesto se esta
violando
También este gráfico es de utilidad para detectar datos atípicos(outliers)

b. GRAFICO DE PROBABILIDAD NORMAL

Se puede hacer con los datos originales pero es más eficaz hacerlo con los residuales

Si la distribución de los errores es normal el grafico será un ajuste aproximadamente a una línea recta, o sea,
es una evidencia para indicar que los datos provienen de una distribución normal. Es bueno complementar con
las pruebas analíticas

Las desviaciones moderadas de la normalidad no representan preocupación en el análisis e varianza de efectos


fijos, a diferencia del modelo de efectos fijos

En este grafico también se pueden detectar outliers, que es un punto atípico. Si hay varios puede
ocasionar distorsiones en el ANDEVA
c. PRUEBAS ESTADISTICAS PARA VERIFICAR LA NORMALIDAD

PRUEBA ESTADISTICA DE SHAPIRO WILK: se utiliza para muestras


pequeñas

PRUEBA ESTADISTICA DE RYAN-JOINER: se utiliza para muestras pequeñas

PRUEBA ESTADISTICA DE ANDERSON-DARLING

PRUEBA ESTADISTICA DE SMIRNOF-KOLMOROF: se utiliza para muestras


mayores de 50. Se puede aplicar a datos que son normales o no.

Todas estas pruebas se pueden realizar con el apoyo de un software estadístico, como
por ejemplo el MINITAB o el PASW
2. COMO SE VERIFICA EL SUPUESTO
DE HOMOCEDASTICIDAD
GRAFICA DE RESIDUOS VERSUS VALORES AJUSTADOS
GRAFICA DE NIVELES DE FACTRO VS RESIDUOS

PRUEBA ESTADISTICA DE BARLETT: es la más usada. Compara la varianza entre grupos.


Si hay confianza de que los datos de la variable de respuesta tienen una distribución normal, es la
más recomendable.

PRUEBA ESTADISTICA DE LEVENE: es robusta al supuesto de normalidad. Si los datos no son


normales y se cuenta con un tamaño de muestra grande es la recomendada

Todas estas pruebas se pueden realizar con el apoyo de un software estadístico, como
por ejemplo el MINITAB o el PASW
3. COMO SE VERIFICA EL SUPUESTO
DE INDEPEDENCIA

Gráfico de residuos versus el


orden en que se colectaron los
datos

Prueba de Durbin Watson


¿QUÉ SON LOS DIAGRAMAS
DE CAJAS SIMULTÁNEOS?

¿PARA QUÉ SIRVEN?

¿CÓMO SE INTERPRETAN?
¿CÓMO SE HACEN LOS GRAFICOS Y
PRUEBAS ANTERIORES?

¿CÓMO SE INTERPRETAN LOS


RESULTADOS DE AMBAS
HERRAMIENTAS?
B. ANALISIS DE VARIANZA
(ANOVA)

Es la técnica en el análisis estadístico de datos experimentales


A través de la descomposición de la variabilidad se calcula la prueba
estadística F de Fisher que se utiliza para comprobar los contrastes de
hipótesis de los modelos de los diseños experimentales.

Es una potente herramienta estadística, de gran provecho para:

Industria
Control y mejora de los procesos
Laboratorio de análisis
Control de métodos analíticos
ANALISIS DE VARIANZA EN
UN DCA
En términos generales separa la variabilidad total en las partes con
las que contribuye cada fuente de variación en el experimento

En un DISEÑO COMPLETAMENTE AL AZAR, tanto para un


experimento balanceado como para uno desbalanceado la siguiente
ecuación es la base del ANALISIS DE VARIANZA es:

Variacion = Variacion+ Variacion


Total Entre dentro
de
Niveles
Niveles
Variabilidad debido al Nivel Variabilidad inherente de los datos
SCTo = SCN + SCEE
ECUACION DE SUMATORIAS

NIVELES DEL FACTOR DE INTERES


OBSERVACIONES
1 2 3 . . k
1 Y11 Y12 Y13 . . Y1k
2 Y21 Y22 Y23 . . Y2k
. . . . . . .
. . . . . . .
. . . . . . .
n Yn1 Yn2 Yn3 . . Ynk
TOTALES/NIVEL Y.1 Y.2 Y.3 Y.K
GRAN TOTAL Y..
Medias por nivel Y.1/n Y.2/n Y.3/n Y.k/n
MEDIA TOTAL
ANALISIS DE VARIANZA

Variacion = Variacion+ Variacion


Entre dentro
Total
de
Niveles Niveles
SUMA DE CUADRADOS
TOTAL: mide la variabilidad
SUMA DE CUADRADOS DE SUMA DE CUADRADOS DEL
total en los datos. Es la suma
LOS NIVELESD E FI: mide la ERROR EXPERIMENTAL: mide la
de los cuadrados de las
variabilidad en los datos variabilidad que no es debida a las
desviaciones de cada dato
asociada al efecto del factor de diferencias entre los niveles del
respecto a la media general del
interés sobre la media. Se factor(variabilidad interna de cada
experimento
obtiene hallando la suma de los nivel, errores de medida, etc). Se
cuadrados de las desviaciones de obtiene hallando la suma de cuadrados
la media de cada nivel respecto de las desviaciones de cada dato
de la media general. respecto ala media del nivel
correspondiente

Cada suma de cuadrados tiene asociados


los grados de libertad correspondiente
Análisis de Varianza Yij =  +  j +  ij
Grados de Suma de Cuadrado
Fuente de Libertad Cuadrados Medio
Fc F
Variación
gl SC CM
FV
SCN CMN F
Entre
Niveles
k- 1 SCN  , g ln,gld
k −1 CMEE
(N)
Error
Experimental SCT0 − SCN SCEE
(EE) k (n − 1) k (n − 1)

Total
nk −1 SCT0
To
n k 2
Y
SCT0 = Y −
2 2
Y Y..
SCN =  j=1 −
k 2 ..
.j
ij
n nk i =1 j =1 nk
Yij =  +  i +  ij
Análisis de Varianza
Grados de Suma de Cuadrado
Fuente de Libertad Cuadrados Medio
Fc F
Variación
gl SC CM
FV
SCN CMN F
Entre
Niveles
k- 1 SCN  , g ln,gld
k −1 CMEE
(N)
Error
Experimental SCT0 − SCN SCEE
(EE) k (n − 1) k (n − 1)

Total
nk −1 SCT0
To
k n 2
Y
SCT0 = Y −
2 2
Y Y
= i =1
k 2 ..
SCN − i. ..
ij
n nk i =1 j =1 nk
En el caso de experimentos unifactoriales el cálculo
de Fc es igual para un modelo de efectos fijos y uno
de efectos aleatorios

COMO SE INTERPRETAN LOS RESULTADOS OBTENIDOS EN UN


ANALISIS DE VARIANZA PARA UN DCA UNIFACTORIAL?

a. Si el Factor es FIJO
b. Si el Factores ALEATORIO
¿QUÉ SON LOS
GRÁFICOS DE
MEDIAS?

¿PARA QUÉ SIRVEN?

¿CÓMO SE
INTERPRETAN?
C. Otros Análisis

Cálculo de Parámetros
n k Los cálculos son los
 Y ij mismos
= i =1 j =1 independientemente
nk del formato que se
haya elegido para el

 = CMEE
2 modelo

Conclusiones
Cálculo del Coeficiente de Determinación

R = SCN
2
  1
2
0 R
SCTo

Interpretación
Es la variabilidad en los valores observados
en la variable de respuesta, explicada por el
modelo estadístico

Nota: el cálculo es el mismo para las dos


formas del modelo
Cálculo del Intervalo de Confianza del 100( 1 – α) % para
la Media μj del j-ésimo nivel del factor de interés

Yij =  +  j +  ij
Para Modelo j = 1...... k
i = 1...... n

IC j = y . j  t / 2 , k ( n −1) CMEE n

Cálculo de los estimadores de los efectos de


los niveles

 = y. j − y..
.j
Cálculo del Intervalo de Confianza del 100( 1 – α) % para
la Media μi del i-ésimo nivel del factor de interés

Yij =  +  i +  ij
Para Modelo i = 1...... k
j = 1...... n

IC i = y i .  t / 2, k ( n −1) CMEE n

Cálculo de los estimadores de los efectos de los niveles

 = yi. − y..
i.
¿QUÉ UTILIDAD TIENEN LOS
INTERVALOS DE CONFIANZA EN
EL ANALISIS DE DATOS DE UN
DCA?
Ejemplo:
Un fabricante de calzado de zapatos folclóricos (ZAPATOS ELISA)
desea mejorar la calidad de las suelas, las cuales se pueden hacer
con uno de los cuatro tipos de cuero A, B, C y D disponibles en el
mercado.
Para ello, prueba los cueros con una máquina que hace pasar los
zapatos por una superficie abrasiva, la suela de los zapatos se
desgasta al pasarla por dicha superficie.
Como criterio de desgaste se usa la pérdida de peso después de un
número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos,
seis de cada tipo de cuero.
Al hacer las pruebas en orden completamente al azar se evitan
sesgos y las mediciones en un tipo de cuero resultan
independientes de las demás.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero
se anotan en la hoja de verificación previamente diseñada
Cual es la primera interrogante
en este experimento?
DEFINICIÓN DEL PROBLEMA
Determinar si hay diferencias significativas
en la pérdida de peso promedio para cuatro
tipos de cuero (A,B,C y D).
o
Determinar el efecto de cuatro tipos de cuero
en la pérdida de peso promedio de la suela
de un zapato.
Yij =  +  i +  ij
Modelo Estadístico i = 1...... k
j = 1...... n

Yij = es la j-ésima pérdida de peso de la suela


TIPO
del zapato para el i-ésimo tipo de cuero DE Observaciones
CUERO
 = desgaste promedio (perdida de peso
promedio) A
B
i = es el efecto del i-ésimo tipo de cuero
sobre la perdida de peso de la suela del C
zapato
D
ij = es el error experimental
Yij =  +  j +  ij
Modelo Estadístico j = 1...... k
i = 1...... n

TIPO DE
Yij = es la i-ésima pérdida de peso del zapato CUERO A B C D
para el j-ésimo tipo de cuero O
B

 = desgaste promedio (perdida de peso


S
E
promedio) R
V
A
j = es el efecto del j-ésimo tipo de cuero C
sobre la perdida de peso I
O
N
ij = es el error experimental E
S
Planteamiento de Hipótesis
H o : 1 =  2 = 3 =  4
H1 : al menos una de las pérdidas promedio es diferente
Regla de Decisión:

Fc  F0.05,3, 20
donde
g ln = 4 − 1 = 3
gld = 4(6 − 1) = 20
Región de Rechazo

F = 3.09
F0.05,3, 20
0.05,3,20
ALEATORIZACIÓN
Orden de las pruebas Números aleatorios Asignación
1 3 A
2 10 A
3 14 A
Tipo de
4 8 A
Orden de las pruebas
5 15 A Cuero
6 1 A
7 11 B A 3 10 14 8 15 1
8 18 B
9 23 B B 11 18 23 7 22 12
10 7 B
11 22 B C 2 24 4 6 13 5
12 12 B
13 2 C D 17 16 19 9 20 21
14 24 C
15 4 C
16 6 C
17 13 C
18 5 C
19 17 D
20 16 D
21 19 D
22 9 D
23 20 D
24 21 D
Toma de datos: Medición de la variable de respuesta

ZAPATOS ELISA
FORMULARIO DE EXPERIMENTOS
NOMBRE DEL EXPERIMENTADOR FECHA CALIBRACION DEL APARATO

TIPO DE
OBSERVACIONES
CUERO SUMA PROMEDIOS

A 264 260 258 241 262 255 1540 256.7


B 208 220 216 200 213 206 1263 210.5
C 220 263 219 225 230 228 1385 230.8
D 217 226 215 224 220 222 1324 220.7

Luego se procede a verificar los supuestos del ANOVA


Verifique los supuestos del
ANOVA
Supuesto de Normalidad
MINITAB
FUNCIONES DE MINITAB RESULTADO INTERPRETACIÓN
MEDIA Si son aproximadamente
MEDIANA iguales es simétrica
MOSTRAR
Puede ser positiva
ESTADÍSTICA SESGO
negativa o cero
BÁSICA
Puede ser positiva
CURTOSIS
negativa o cero.
ESTADÍSTICA Para que se verifique el
ESTADÍSTICA
BASICA supuesto el gráfico debe
GRÁFICO
ser aproximadamente una
PRUEBA DE línea recta.
NORMALIDAD PRUEBA DE RYAN JOINER Muestras menores de 50
(SHAPIRO WILK)
PRUEBA DE KOLMOROV- Muestras mayores de 50
SMIRNOV
HISTOGRAMA FORMA CAMPANA
GRÁFICA
TALLO Y HOJA FORMA CAMPANA
Verificación de supuestos y
ANOVA (MINITAB)
FUNCIONES DE MINITAB RESULTADO INTERPRETACIÓN
ANOVA Rechazar o no la Ho.
HISTOGRAMAS DE Supuesto de normalidad
RESIDUOS
GRAFICA NORMAL
RESPUESTA
GRÁFICAS DE RESIDUOS
Y FACTOR
RESIDUOS VS Supuesto de
AJUSTES homocedasticidad
ANOVA UN
RESIDUOS VS Supuesto de
ESTADISTICA SOLO
ORDEN independencia
FACTOR
COMPARACIÓN POR Rechazar o no la Ho.
TUKEY
COMPARACI PARES
ONES COMPARACIÓN POR Rechazar o no la Ho.
DUNNET
PARES
PRUEBA DE GRÁFICO Comparar ancho de los
BARLETT
VARIANZAS ESTADISTICA DE interv
IGUALES LEVINE PRUEBA Y PVALUE Rechazar o no la Ho.
Analisis de Varianza

FV SC GL CM Fc Probabilidad F
Entre tipos de cuero 7072.33 3 2357.44 23.24 1.0018E-06 3.098
Error Experimental 2029 20 101.45
Total 9101.33 23
Cálculo de los Parámetros del Modelo

Perdida de Peso Promedio


 = Y = 5512/ 24 = 229.67

VARIANZA Y DESVIACION
ESTANDAR
 2
= CMEE = 101.45
= 101.45
ESCRIBA UNA FRASE QUE DESCRIBA LA
INTERPRETACION DE CADA RESULTADO
Cálculo del Intervalo de Confianza del 100( 1 – α) % para la Pérdida
de peso promedio de cada tipo de cuero

IC i = y i.  t / 2, k ( n −1) CMEE n

IC 1 = 256.7  t0.025, 20 101.45 6

IC  2 = 210.5  t0.025, 20 101.45 / 6

IC 3 = 230.8  t0.025, 20 101.45 / 6

IC  4 = 220.7  t0.025, 20 101.45 / 6


CONCLUSIONES
Fc es mayor que Fα, por lo
tanto se descarta Ho.
Se concluye que existen
diferencias significativas en
la pérdida promedio de peso
(miligramos) de la suela de
los zapatos para los tipos de
cuero en estudio
ESRIBA UN PARRAFO QUE DESCRIBA LA
INTERPRETACIÓN DE CADA RESULTADO
DE LOS INTERVALOS DE CONFIANZA
• EN ALGUNOS EXPERIMENTOS, POR
DIVERSAS RAZONES NO ES POSIBLE
RECOLECTAR IGUAL CANTIDAD DE
OBSERVACIONES EN CADA NIVEL

• EXISTEN LIGERAS VARIACIONES EN CUANTO


AL ANÁLISISDE VARIANZA UTILIZADO PARA EL
DISEÑO COMPLETAMENTE AL AZAR
BALANCEADO
Definición del problema

Modelo Estadístico DCA


Yij =  +  j +  ij
j = 1...... k
i = 1...... nk

es la i-ésima observación para el j-ésimo nivel del


Yij factor de interés

 media total

j es el efecto del j-ésimo nivel del factor de interés sobre la


variable de respuesta

 ij es el error experimental
73
Si se utilizan las filas para representar los niveles del factor el
modelo cambia a la siguiente expresión

Modelo Estadístico
Yij =  +  i +  ij
i = 1...... k
j = 1...... nk

Yij es la j-ésima observación para el i-ésimo nivel del factor de


interés

 media total

i es el efecto del i-ésimo nivel del factor de interés sobre la


variable de respuesta
 ij es el error experimental
Contraste de Hipótesis
Factor de Efectos Fijos
H o : 1 =  2 = .........  k
H1 = al menos una de las medias de los niveles del factor de
interés es diferente

Regla de Decisión Fc  F , g ln,gld


Descartar Ho si
donde
g ln = k − 1
k
gld =  n j − k
j =1
Región de Rechazo

F
F , g ln,gld
Aleatorización
Codificar los elementos de la población de 1 hasta N
Donde N = n + n + ......... n
1 2 k

Definir el tamaño de la muestra n


Codificar las unidades experimentales
Orden aleatorio
Asignar los niveles del factor de interés a las
unidades experimentales o a las corridas
PROCEDIMIENTO DE ALEATORIZACION

CODIFICACION DE LAS UNIDADES NUMEROS ASIGNACION DE LOS


EXPERIMENTALES ALEATORIOS NIVELES DEL FI

No desigual de observacicones

1 1
2 1
n1
.
.
2
2
n2
.
.
. .

. .

. .

.
.
nk
k
nk k
Formato para el Registo de los Datos

Yij =  +  j +  ij

NIVELES DEL FACTOR DE INTERES


OBSERVACIONES
1 2 3 . . k
1 Y11 Y12 Y13 . . Y1k
2 Y21 Y22 Y23 . . Y2k
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Yij .
.
.
.
.
.
nj Y(n1)1 Y(n2)2 Y(n3)3 . . Y(nk)k
TOTALES/NIVEL Y.1 Y.2 Y.3 Y.K
GRAN TOTAL Y..
Formato para el Registo de los Datos

Yij =  +  i +  ij

OBSERVACIONES
NIVELES
1 2 . . . nj TOTALES/NIVEL
1 Y11 Y12 . . . Y1(n1) Y1.
2 Y21 Y22 . . . Y2(n2) Y2.
3
.
Y31
.
Y31
.
.
.
.
.
Yij .
.
Y3(n3)
.
Y3.

. . . . . . .
K Yk1 Yk2 . . . Yk(nj) YK.
GRAN TOTAL Y..
Yij =  +  +  ij
Análisis de Varianza j

Fuente de
Variación
Grados de
Libertad
Suma de
Cuadrados
Cuadrado
Medio FC F
FV gl SC CM
Entre
SCN CMN F
k −1
Niveles
SCN  , g ln,gld
(N) k −1 CMEE

Error SCEE

k
Experimental n −k SCTO − SCN

k
j =1 k
j =1
nk − k


k
Total j =1
nk − 1 SCTO

n 2
Y 2 2 k Y
SCTo =   Yij2 − ..
k
Y
SCN =  j =1
k
− k .j ..
n k  nk i =1 j =1 N
j =1
Yij =  +  i +  ij
Análisis de Varianza
Fuente de
Variación
Grados de
Libertad
Suma de
Cuadrados
Cuadrado
Medio FC F
FV gl SC CM
Entre
SCN CMN F
k −1
Niveles
SCN  , g ln,gld
(N) k −1 CMEE

Error SCEE

k
n −k SCTO − SCN

Experimental k
j =1 k
j =1
nk − k


k
Total j =1
nk − 1 SCTO

n 2
k Y
SCTo =   Yij2 − ..
2 2 k
Y Y
SCN = i =1
k
− k i. ..
n k  nk i =1 j =1 N
i =1
Conclusiones

Cálculo de Parámetros
n k

 Y
=
ij
i =1 j =1


k
j =1
nk

 2
= CMEE
Cálculo del Coeficiente de Determinación

R = SCN
2
0  R 1
2

SCTo

Interpretación
Es la cantidad de variabilidad en los datos,
explicada o proporcionada por el modelo de
regresión
Cálculo del Intervalo de Confianza del 100( 1 – α) % para
la Media μj del j-ésimo nivel del factor de interés

Yij =  +  j +  ij

IC  j = y . j  t / 2, n CMEE nk
k −k
Cálculo del Intervalo de Confianza del 100( 1 – α) % para
la Media μj del j-ésimo nivel del factor de interés

Yij =  +  i +  ij

IC i = y i.  t / 2, n CMEE nk
k −k
EJEMPLO
Para determinar la mejor disposición de los instrumentos
sobre un Tablero de control de un aeroplano, se prueban
tres distintos arreglos simulando una situación de
emergencia y observando el tiempo de reacción requerido
para corregir la avería. Los tiempos de reacción (en
décimas de segundo) de 28 pilotos aleatoriamente asignados
a los diversos arreglos son los siguientes:

Disposición 1: 14, 13, 9, 15, 11, 13, 14, 11


Disposición 2: 10, 12, 9, 7, 11, 8, 12, 9, 10, 13, 9, 10
Disposición 3: 11, 5, 9, 10, 6, 8, 8, 7

Compare los tiempos promedio para las diferentes


disposiciones.

Use  = 0.05
Definición del Problema
Determinar si hay diferencia significativa en los
tiempos de reacción promedio para tres arreglos
diferentes de los instrumentos del tablero de control
de un aeroplano.

Variable de Respuesta: Tiempo de reacción de los


pilotos

Factor de interés: Los tres arreglos diferentes:


Disposición 1, Disposición 2 y Disposición 3

Niveles: D1, D2, D3

Unidades experimentales: los pilotos


Modelo Estadístico
Yij =  +  j +  ij
i = 1...... nk
j = 1..3

Yij = es el i-ésimo tiempo de reacción de un piloto para la


j-ésima disposición

 = es el tiempo de reacción promedio

j = es el efecto de la j-ésima disposición sobre el tiempo de


reacción de cada piloto

ij = es el error experimental


Contraste de Hipótesis
H o : 1 =  2 = 3
H1 = al menos uno de los tiempos de reacción promedio
para cada disposición es diferente

Regla de Decisión: Descartar Ho si Fc  F0.05, 2, 25 = 3.385

glN = k-1 = 3-1 = 2 Región de Rechazo

glD = 28 – 3 = 25 95%  =0.05

F=3.385
PROCEDIMIENTO DE ALEATORIZACION
CODIFICACION DE
NUMEROS ASIGNACION DE LOS
LAS UNIDADES
ALEATORIOS NIVELES DEL FI
EXPERIMENTALES
1 10 D1
2 1 D1
3 11 D1
4 20 D1
5 16 D1
6 17 D1
7 2 D1
8 23 D1
9 24 D2
10 19 D2
11 13 D2
12 4 D2
13 22 D2
14 15 D2
15 21 D2
16 3 D2
17 6 D2
18 12 D2
19 5 D2
20 9 D2
21 8 D3
22 27 D3
23 18 D3
24 14 D3
25 26 D3
26 28 D3
27 7 D3
28 25 D3
MEDICION DE LA VARIABLE DE RESPUESTA

COPAPA SA
NIVELES DEL FACTOR DE INTERES
OBSERVACIONES
1 2 2
1 14 10 11
2 13 12 5
3 9 9 9
4 15 7 10
5 11 11 6
6 13 8 8
7 14 12 8
8 11 9 7
9 10
10 13
11 9
12 10
TOTALES/NIVEL 100 120 64
GRAN TOTAL 284
Medias/Nivel 12.5 10 8
Verifique los supuestos del
ANOVA
Análisis Estadístico
Fuente de Grados Suma de Cuadrados Cuadrado FC F
de Medio
Variación
Libertad

Entre 2 (1/8*1002+1/12*1202+ 81.43/2 40.42/3 3.385


Disposicione 1/8*642) – 2842/28 = =40.42 .6
s 81.43 =11.31
Error 25 90.00 90.00/25
=3.60

Total 27 (142+132+...+82+72) –
2842/28 = 171.43
Análisis Estadístico
Hipótesis nula Todas las medias son iguales
Hipótesis alterna No todas las medias son iguales
Nivel de significancia α = 0.05

Factor Niveles Valores


Disposición 3 A; B; C

Fuente GL SC Ajust. MC Ajust. Valor F Valor p


Disposición 2 81.43 40.714 11.31 0.000
Error 25 90.00 3.600
Total 27 171.43

R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.89737 47.50% 43.30% 33.73%
Cálculo de parámetros
 = 284 = 10.14
28
2 = 3.60
σ= 1.8974

Conclusión
𝑺𝒊 𝑭𝒄 > 𝑭𝜶 𝒆𝒏𝒕𝒐𝒏𝒄𝒆𝒔 𝒔𝒆 𝒓𝒆𝒄𝒉𝒂𝒛𝒂 𝒍𝒂 𝑯𝟎
Se rechaza Ho y se concluye que los tiempos de
reacción promedio de los pilotos para las tres
disposiciones del tablero de control de un aeroplano,
no son iguales o al menos uno es diferente.
¿Qué otros análisis se pueden
hacer?

You might also like