You are on page 1of 54

UNIVERSIDAD PRIVADA DE

TACNA
Diseños experimentales
Unidad II
Profesor: Ing. J.C. Romaina
Semestre 2019-I
ANALISIS DE VARIANZA
• Técnica que comprende una serie de modelos estadísticos y sus
procedimientos asociados, en el cual la varianza está particionada en
ciertos componentes debido a diferentes variables predictivas.
• A pesar del nombre, esta técnica puede utilizarse para decidir si las
medias de dos o más poblaciones son iguales.
• El ANVA, es una técnica que se emplea para comparar varios grupos
de muestras en una variable cuantitativa. En consecuencia, se trata
de generalizar la prueba t para muestras independiente o pareadas a
diseños con más de dos muestras.
• En esta técnica a las variables categóricas se les denomina factor de
entrada o variables causales. Mientras que a las cantidades que se
registran como resultados son las variables cuantitativas o factores de
salida o respuesta a la causa.
• Análisis de una factor: corresponde al análisis más sencillo, ya que
consiste en comparar la variación total de un conjunto de muestras y
plantear la siguiente ecuación:
• 𝑆𝐶𝑇 = 𝑆𝐶𝑓𝑎𝑐𝑡𝑜𝑟 + 𝑆𝐶𝑖𝑛𝑡𝑟𝑎
Supuestos del ANVA
• Esta técnica parte de algunos supuestos que deben darse para realizar
el análisis.
• La variable independiente o factor de salida debe ser medido al
menos como una variable a nivel de intervalo.
• Las observaciones que se obtienen deben ser independientes.
• Así mismo, la distribución de los resultados del experimento debe ser
normal o aproximadamente normal.
• Las varianzas deben presentar una homogeneidad de tal modo que se
cumpla la propiedad de homocedasticidad
• El análisis de varianza culmina cuando se realiza la prueba de
significación de F.
• Ejemplo
• Un investigador desea comparar el efecto de cuatro alimentos
proporcionados a ratones de experimentación, para lo cual se
seleccionan 32 ratones y se les asigna cuatro alimentos diferentes
para tomar el peso a cada uno de ellos un tiempo después, los datos
son los siguientes:
Modelo del ANOVA
Fuente de Grados de libertad Suma de cuadrado Cuadrado medio 𝑭𝒄
variablidad
Entre tratamientos 𝑡−1 𝑆𝐶𝑡 𝑆𝐶𝑡/𝑡 − 1 CMt/CME
Dentro de
tratamientos 𝑡(𝑟 − 1) SC𝐸 SCE/t(r-1)
Total 𝑡𝑟 − 1 𝑆𝐶𝑇
1. Diseño Completamente al azar
• El uso del diseño DCA, es más simple y fácil de realizar, en el cual los tratamientos o
muestras se asignan aleatoriamente entre las unidades experimentales (UE). Este diseño
tiene su mayor aplicación, cuando las unidades experimentales son muy homogéneas,
es decir, la mayoría de los factores actúan de modo similar entre las unidades
experimentales. Este escenario se puede observar, en los experimentos de laboratorio
donde todos los factores bajo experimento están controlados. También en ensayos clínicos y
en experimentos industriales. En ensayos de invernaderos es muy útil. Ha sido
ampliamente utilizado en experimentos agrícolas.
• Uno de los aspecto de interés es procurar La homogeneidad de las unidades experimentales.
Esto puede lograrse ejerciendo un control local apropiado de las unidades
experimentales(seleccionando, por ejemplo, sujetos, animales o plantas de una misma edad,
raza, variedad o especie). Pero debe tenerse presente que todo material biológico, por
homogéneo que sea, presenta una cierta fluctuación cuyos factores no se conocen y son, por
lo tanto, incontrolables. El nombre del diseño se deriva del hecho que existe una completa e
irrestricta aleatorización, la cual valida como ya se dijo la prueba F de Fisher -Snedecor.
También se le conoce como Diseño de una Vía o un sólo criterio de clasificación en virtud de
que las respuestas se hallan clasificadas únicamente por los tratamientos. Una ventaja del
diseño DCA es que no se ve afectado en su estructura por el número igual o desigual de
observaciones por tratamiento.
Modelo Aditivo Lineal del diseño
El modelo aditivo lineal es el modelo estadístico del DCA. Es una
expresión algebraica que condensa todos los factores o variables que
están presentes en la investigación. Resulta útil para sintetizar qué
factores son independientes o dependientes, cuáles son fijos o
aleatorios, cuáles son cruzados o anidados.
El modelo se puede expresar como: 𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝜖𝑖𝑗
Donde:
𝑌𝑖𝑗 : 𝑒𝑠 𝑙𝑎 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎 𝑜 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑞𝑢𝑒 𝑠𝑒 𝑚𝑖𝑑𝑒
𝜇: 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 𝑑𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
𝜏𝑖 : 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝜖𝑖𝑗 : 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎 𝑙𝑎 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎
Modelo I (o Modelo de Efectos Fijos)

• Cuando los factores son fijos el investigador ha escogido los


factores en forma no aleatoria y sólo está interesado en ellos.
• En este caso el investigador asume que σ 𝜏𝑖 =0, lo cual refleja la
decisión del investigador de que únicamente está interesado en los
𝑡 tratamientos presentes en el experimento. La mayor parte de los
experimentos de investigación comparativa pertenecen a este
modelo.
Modelo II (Modelo de efectos aleatorios o modelo de
componentes de varianza)

• Cuando los factores son aleatorios, el investigador,


selecciona al azar los tratamientos de interés de varios que
dispone y los asigna a las unidades experimentales.
• En este caso el investigador asume que los 𝜏𝑖 tratamientos
están distribuidos normal e independientemente con
media cero y varianza 𝜎 2 , lo cual refleja la decisión del
investigador de que sólo está interesado en una población
de tratamientos, de los cuales únicamente una muestra al
azar (los t tratamientos) están presentes en el experimento
Diseño con igual numero de observaciones

Repeticiones Tratamientos
𝑡1 𝑡2 𝑡3 … 𝑡𝑡
𝑟1 𝑌11 𝑌21 𝑌31 … 𝑌𝑡1
𝑟2 𝑌12 𝑌22 𝑌32 … 𝑌𝑡2
𝑟3 𝑌13 𝑌23 𝑌33 … 𝑌𝑡3
… … … … … …
𝑟𝑛 𝑌1𝑛 𝑌2𝑛 𝑌3𝑛 … 𝑌𝑡𝑛
Total 𝑌1. 𝑌2. 𝑌3. … 𝑌𝑡.
Cuadro de análisis de varianza
• El cuadro de análisis de varianza (ANOVA) es un arreglo dado
por las fuentes de variación, seguido de los grados de libertad,
de las sumas de cuadrados, de los cuadrados medios de cada
componente, así como del valor F y su probabilidad de
significación (valor P).
• El esquema es como sigue
• F. de V. GL SC CM 𝐹𝑐
• Tratamiento 𝑡−1 𝑠𝑐𝑡 CMt
• Error exp. 𝑡(𝑛 − 1) SCE CME
• Total 𝑛𝑡 − 1 SCT ------- ---
Cálculos
• Término de corrección=
• SCTotal=
• Sctratamiento=
• SCError
ejemplo
• Un experimentador está interesado en probar cuatro raciones orgánicas (R1, R2,
R3, R4) en animales vacunos jóvenes. Registrando el aumento de peso, en
kilogramos, después de seis meses.
• Los datos se observan seguidamente:
• T1 T2 T3 T4 T5
30 25 42 39 39
29 23 45 44 37
31 26 40 43 42
28 24 46 41 34
27 20 41 38 39
32 27 39 40 35

Realizar el análisis de varianza y manifestar sus conclusiones, si existen diferencias


significativas entre el aumento de peso registrado por los animales bajo diferentes
raciones.
Ventajas del diseño completamente al azar

• (1) Su flexibilidad. Puesto que permite una total libertad en el


dispositivo experimental, por un lado, se puede probar
cualquier número de tratamiento y, por otro lado, el número de
observaciones por tratamiento puede ser igual o desigual.
• (2) Maximiza los grados de libertad para estimar el error
experimental.
• (3) Permite observaciones perdidas y no se dificulta el análisis
estadístico.
• (4) Muy fácil de usar en experimentación.
Desventajas del diseño completamente al azar

• (1) Es apropiado para un número pequeño de tratamientos.


• (2) Es apropiado sólo en caso de disponer de material experimental
homogéneo.
• (3) En comparación con otros dispositivos experimentales donde se pueda ejercer
control local es menos sensible y tiene un poder analítico débil. Esta falta de
sensibilidad se debe a que todos los factores que no se controlaron se acumulan en
el error experimental, provocando que éste aumente y no permita detectar
diferencias significativas entre los tratamientos. Este es el motivo por el cual los
investigadores estadígrafos se dedicaron a buscar diseños experimentales más
complejos, pero que fueran capaz de estimar el error experimental con mayor grado
de precisión.
• Supuestos del anova completamente al azar
• Son cuatro los supuestos que debe cumplir el ANOVA,, que se pueden
abreviar con la nemotécnia: HINA. La H de Homogeneidad de las varianzas, I de
independencia de los errores, la N de normalidad de los efectos y la A de
aditividad de los efectos:
• Homogeneidad de las varianzas
• se refiere a que cada respuesta Yij debe poseer dentro de cada
tratamiento una variación parecida o igual a la de otro tratamiento.
Este supuesto puede ser probado postulando como hipótesis nula y
alterna las siguientes:
• 𝐻0 : 𝜎12 = 𝜎22 = 𝜎32 = 𝜎42 = 𝜎52 (Los t tratamientos tienen igual varianza)
• 𝐻1 : 𝜎12 ≠ 𝜎22 ≠ 𝜎32 ≠ 𝜎42 ≠ 𝜎52 No todos los tratamientos tienen igual
varianza)
• Para verificar el cumplimiento de este supuesto se utiliza la prueba
de Bartlett o de Levene. La aplicación de estas pruebas debe
conducir a un no rechazo de Ho para que exista la homogeneidad
de varianzas.
• Independencia de los errores de un tratamiento a otro:
• Es decir, se calculan los errores residuales para cada grupo de
tratamiento a través de la fórmula:
• 𝐸𝑅𝑅𝑂𝑅 𝑅𝐸𝑆𝐼𝐷𝑈𝐴𝐿 = 𝑌𝑡 − 𝑌ത𝑡
• Las hipótesis son:
• Ho: Hay independencia de errores
• H1: Hay dependencia de errores
• El supuesto de independencia se verifica su cumplimiento utilizando la
prueba de aleatoriedad o de las rachas que es una prueba del ámbito
no paramétrico
• La Normalidad de los efectos: esta referido a que las respuestas Yij
deben poseer una distribución normal dentro de cada grupo de
tratamiento.
• Para verificar su cumplimiento se plantean las hipótesis:
• Ho: La distribución de cada tratamiento es normal
• H1: La distribución de cada tratamiento no es normal
• La prueba que utilizamos en este caso es la de Shapiro-Wilk
para muestras pequeñas y Kolmogorov-Smirnov para
muestras grandes. Aunque la Prueba de Shapiro-Francia
es equivalente a la de Kolmogorov-Smirnov.
• Aditividad de los efectos : las respuestas de cada grupo de
tratamiento es la suma de la media general más un efecto
aleatorio asociado a la respuesta. El sistema hipotético es:
• Ho: Los efectos son aditivos
• H1: Los efectos no son aditivos
• La prueba estadística apropiada es la Prueba de Tukey para la
aditividad. Esta prueba debe conducir a un no rechazo de Ho para que
el supuesto se cumpla
DCA con desigual numero de observaciones
por tratamiento
Esquema:

Tratamiento
Repeticione 𝑡1 𝑡2 𝑡3 … 𝑡𝑡
s
𝑟1 𝑌11 𝑌21 𝑌31 … 𝑌𝑡1
𝑟2 𝑌12 𝑌22 𝑌32 … 𝑌𝑡2
𝑟3 𝑌13 𝑌23 𝑌33 … 𝑌𝑡3
… … … … … …
𝑟𝑛𝑖 𝑌𝑛1 𝑌𝑛2 𝑌𝑛3 … 𝑌𝑛𝑡
Total
ANOVA
f. DE v GL SC CM F
TRATAMIENTO 𝑡−1 𝑆𝐶𝑡 𝐶𝑀𝑡 𝐶𝑀𝑡
𝐶𝑀𝐸
ERROR 𝑆𝐶𝐸 𝐶𝑀𝐸
෍ 𝑛𝑖 − 𝑡

TOTAL 𝑆𝐶𝑇 𝐶𝑀𝑇


෍ 𝑛𝑖 − 1
Ejemplo: Un investigador desea comparar el efecto de cuatro alimentos proporcionados
a cuyes de experimentación, para lo cual se seleccionan 38 cuyes y se les asigna cuatro
alimentos diferentes para tomar el peso a cada uno de ellos un tiempo después, realizar
el análisis estadístico y probar las diferencias de pesos(en gramos), los datos son los
siguientes:
Alimento 1 Alimento 2 Alimento 3 Alimento 4

10 6 10 12
12 9 12 14
9 7 11 16
8 5 9 13
7 8 11 11
9 6 10 10
12 8 9 9
10 7 14 8
8 6 12
9 13
11
Diseño de bloques completos al azar
• Esquema de un diseño es: el modelo de un diseño de bloques es:
• 𝑌𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝜖𝑖𝑗
Bloque Tratamiento Total
1 2 ... t bloques

1 𝑌11 𝑌21 ... 𝑌𝑡1 𝑌.1


2 𝑌12 𝑌22 ... 𝑌𝑡2 𝑌.2
b 𝑌1𝑏 𝑌2𝑏 ... 𝑌𝑡𝑏 𝑌.𝑏
T tratamientos 𝑌1. 𝑌2. 𝑌𝑡. 𝑌..
Medias 𝑌ത1. 𝑌ത2. 𝑌ത𝑡. 𝑌ത..
• Una industria algodonera, interesada en maximizar el rendimiento de
la semilla de algodón, quiere comprobar si dicho rendimiento
depende del tipo de fertilizante utilizado para tratar la planta. A su
disposición tiene 5 tipos de fertilizantes. Como puede haber
diferencia entre las parcelas, el experimentador decide efectuar un di-
seño en bloques aleatorizados.
• Para ello, divide el terreno en 4 bloques y cada bloque en 5 parcelas,
fumigando dentro de cada bloque cada una de las parcelas con un
fertilizante. Al recoger la cosecha se mide el rendimiento de la
semilla, obteniéndose las siguientes observaciones.
Ejemplo: La industria algodonera, considerado producto bandera del Perú, está interesada en
maximizar el rendimiento de la semilla de algodón. Desea comprobar si dicho rendimiento depende
del tipo de fertilizante utilizado para tratar la planta. A su disposición tiene 5 tipos de fertilizantes.
Como puede haber diferencia entre las parcelas, el experimentador decide efectuar un diseño en
bloques aleatorizados. Para ello, divide el terreno en 4 bloques y cada bloque en 5 parcelas,
fumigando dentro de cada bloque cada una de las parcelas con un fertilizante. Al recoger la cosecha
se mide el rendimiento de la semilla, obteniéndose las siguientes observaciones.

Bloques Fertilizantes(tratamientos)
A B C D E
I 1000 900 1500 850 1100 5350
II 900 850 1450 750 1150 5100
III 1200 950 1400 600 950 5100
IV 1100 850 1600 700 850 5100
V 1400 1000 1300 800 1200 5700
5600 4550 7250 3700 5250 26350
Pruebas de significación
1° Prueba de DMS, esta basada en la distribución t, en la cual se estudian las
diferencias entre medias de tratamientos. Se calcula un valor DMS igual a:
𝐷𝑀𝑆
𝑇𝑐 =
𝜎𝑑ത
2𝑐𝑚𝑒
𝐷𝑀𝑆 = 𝑡(𝛼,𝑔𝑙𝑒) ∗
𝑏
t: valor de la tabla student, con un nivel de significación, b: número de
repeticiones
Regla de decisión: Si la diferencia de medias es mayor que DMS se rechaza la
hipótesis nula, por tanto existen diferencias significativas.
Comparación de las medias
• 𝑋ത1 − 𝑋ത2
• 𝑋ത1 − 𝑋ത3
• 𝑋ത1 − 𝑋ത4
• 𝑋ത2 − 𝑋ത3
• 𝑋ത2 − 𝑋ത4
• 𝑋ത3 − 𝑋ത4
2° Prueba de Tukey
Se plantean las hipótesis
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5
El estadístico de prueba es: el alcance crítico:
𝐶𝑀𝐸
𝑇 = 𝑞(𝛼), (𝑡,𝑛−𝑡) ∗
𝑟
Donde: t: número de tratamientos
n: número de unidades experimentales
Regla de decisión: Si la diferencia de medias es mayor que T de tukey
existen diferencias significativas.
Ejemplo: Se ha conducido un experimento en un DBCA para
comparar la contaminación de los pozos por sectores agrícolas,
empleando como bloques la antigüedad de los mismos. Los
datos es el registro de arsénico. Realizar el anova.

Sectores
Bloque Yarada Magollo Los Palos Valle viejo
I( 5 años) 0.20 0.48 0.30 0.29
II(10 años) 0.09 0.07 0.29 0.31
III(15 años) 0.05 0.02 0.17 0.19
IV(20 años) 0.07 0.09 0.09 0.18
V(25años) 0.15 0.09 0.12 0.15

Total
Promedio
Datos perdidos en DBCA
• 1. Un dato perdido: t: N° de tratamiento, T total trata unidad
perdida, b: n° de bloques, B:total bloque perdido, G: gran total

𝑡𝑇+𝑏𝐵−𝐺
•𝑌=
𝑏𝑡−𝑡−𝑏+1
• Ejemplo: Un ing. Agroindustrial está interesado en probar
sensorialmente cinco variedades de pisco Mosto verde. Para tal fin
conduce un experimento en laboratorio bajo un DBCA. Para evitar
posibles riesgos en la cata, selecciona seis expertos en cata los
mismos que representan a los bloques. Sin embargo, en los registros
de la datos en la tabla accidentalmente se perdió un dato.
Datos
• Cuando existe un datos perdido, en el ANOVA, se tiene que hacer una
corrección en los grados de libertad del error, disminuyendo en una
unidad los grados del libertad del error y del total

Bloque P1 P2 P3 P4 P5
I 26 30 24 22 26
II 27 31 20 23 30
III 25 32 23 19 30
IV 24 Y 24 18 28 94+Y
V 26 30 21 25 27
VI 25 32 20 22 29
156+Y
EFICIENCIA DEL DBCA RESPECTO AL DCA

𝑏−1 ∗𝐶𝑀𝐵+𝑏∗ 𝑡−1 ∗𝐶𝑀𝐸


෣ 𝐷𝐶𝐴 =
• 𝐶𝑀𝐸
𝑏𝑡−1

෣ 𝐷𝐶𝐴 )
(𝐺𝐿𝐸+1)(𝐺𝐿𝐵+𝐺𝐿𝐸+3)(𝐶𝑀𝐸
• 𝐸. 𝑅. = ∗ 100
(𝐺𝐿𝐵+𝐺𝐿𝐸−1)(𝐺𝐿𝐸+3)(𝐶𝑀𝐸𝐷𝐵𝐶𝐴 )
DISEÑO EN CUADRADO LATINO
• Estos diseños son apropiados cuando se desea controlar dos fuentes
de variabilidad. El número de niveles del factor principal tiene que
coincidir con el numero de niveles de columnas y filas.
• El modelo del diseño es:
• 𝑌𝑖𝑗𝑘 = 𝜇 + 𝐶𝑖 + 𝑓𝑗 + 𝜏𝑖𝑗(𝑘) + 𝜖𝑖𝑗𝑘
• En consecuencia un DCL, constituye el agrupamiento de las unidades
experimentales en dos direcciones (filas y columnas) y la asignación
de los tratamientos al azar en las unidades, de tal forma que en cada
fila y en cada columna se encuentren todos los tratamientos.
Características del DCL

1. Las unidades experimentales en el experimento se distribuyen en grupos


, de acuerdo a los criterios de homogeneidad dentro de la columnas y
filas y criterios de heterogeneidad.
2. El número de tratamientos es igual en cada fila y en cada columna, y por
tanto el mismo numero de repeticiones.
3. Los tratamientos son asignados al azar en las unidades experimentales de
cada columna y fila.
4. El número de filas = número de columnas = número de tratamientos.
5. Los análisis estadísticos T-student, Duncan, Tuckey y en pruebas de
contraste se procede de manera similar que en un diseño completamente al
azar y el diseño de bloques. La desviación estándar de la diferencia de
promedios y la desviación estándar del promedio, están en función del
cuadrado medio del error experimental.
• Procedimiento
• 1° Se elige aleatoriamente un DCL
• 2° Se asigna al azar el orden de las filas y columnas
• 3° Se asigna al azar el factor principal a las celdas
Esquema de un diseño cuadrado latino
FILAS COLUMNA Total
1 2 3 4 filas

1 A B C D
2 B C D A
3 C D A B
4 D A B C
Tot columna
Tot tratam
Ejemplo
• Se ha realizado un experimento a fin de comparar seis variedades de Pisco
peruano, con la finalidad de promocionar en el mercado americano. Con este
propósito se seleccionó seis operadores y seis días de la semana. La unidad de
medida es el grado alcohólico de las seis variedades.
Filas Columnas Total
1 2 3 4 5 6 filas

1 42 A 44 B 44 C 38 D 38 E 35 F

2 44 B 47 C 39 D 41 E 39 F 38 A

3 47 C 41 D 46 E 37 F 41 A 37 B
4 38 D 46 E 44 F 42 A 42 B 45 C
5 50 E 35 F 40 A 47 B 43 C 42 D
6 49 F 38 A 41 B 43 C 44 D 41 E
T. colum
Experimentos factoriales
• Estos experimentos se emplean con el objetivo de conducir experimentos
en la cual se estudian dos o mas factores. Es decir, que, en cada ensayo
completo o replica del experimento se investigan todas las posibles
combinaciones de los niveles de los factores.
• El efecto de una característica o factor se define como el cambio en la
respuesta producido por un cambio en el otro factor. A esto se lo define
como efecto principal. Por tanto el objetivo del experimento factorial es:
• 1° determinar si la variable dependiente Y es afectada por los niveles de los
factores bajo estudio(𝐴 𝑦 𝐵) que contienen 𝑎 𝑦 𝑏 tratamientos.
• 2° En este estudio, es probable que los factores de entrada A y B, no son
independientes entre si, la misma que se puede observar, en la interacción
de ambos.
• 3° Cuando existe interacción entre los factores bajo estudio, ya no es
necesario analizar los efectos de los factores por separado sobre la variable
dependiente 𝑌
Ventajas
• 1° Se dispone de mayor precisión adicional
• 2° Permite detectar la presencia de efectos importantes como la
interacción
• Hipótesis
• A) Del factor A
• 𝐻0 : 𝑁𝑜 ℎ𝑎𝑦 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐴
• 𝐴1 = 𝐴2 = 𝐴3 = ⋯ = 𝐴𝑡
• 𝐻1 : No todas son iguales
• B) del factor B
• 𝐻0 : 𝑁𝑜 ℎ𝑎𝑦 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐵
• 𝐵1 = 𝐵2 = 𝐵3 = ⋯ = 𝐵𝑡
• 𝐻1 : No todas son iguales
• C) De la interacción A*B
• 𝐻0 : 𝑁𝑜 ℎ𝑎𝑦 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑖𝑛𝑡𝑒𝑟𝑎𝑐𝑐𝑖ó𝑛
• 𝐴∗𝐵 =0
• 𝐻1 : 𝐴𝐵 ≠ 0
Esquema de un experimento factorial con dos factores y
réplicas
Factor A
Factor B 1 2 …a
1 𝑌111 𝑌211 𝑌𝑎11
2 𝑌112 𝑌212 𝑌𝑎12
. . . .
. . . .
. . . .
n 𝑌11𝑛 𝑌21𝑛 𝑌𝑎1𝑛
Sub total 𝑌11. 𝑌21. 𝑌𝑎1. 𝑌.1.
1
2
.
.
.
n
El modelo factorial

• 𝑌 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼𝛽𝑖𝑗 ) + 𝜖𝑖𝑗𝑘
• 𝛼: 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐴, 𝑠𝑏𝑟𝑒 𝑌
• 𝛽: 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒𝑙 𝑓𝑎𝑐𝑡𝑜𝑟 𝐵, 𝑠𝑜𝑏𝑟𝑒 𝑌
• 𝛼𝛽: 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝐴 𝑦 𝐵 𝑠𝑜𝑏𝑟𝑒 𝑌
• 𝜖: 𝑒𝑟𝑟𝑜𝑟 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑜 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑜 𝑎𝑙 𝑚𝑢𝑒𝑠𝑡𝑟𝑒𝑜
ANALISIS DE VARIANZA

f. DE v GL SC CM Fc
Factor A 𝑎−1 𝑆𝐶𝐴 𝐶𝑀(𝐴)
Factor B 𝑏−1 𝑆𝐶𝐵 𝐶𝑀(𝐵)
Interacción AB (𝑎 − 1)(𝑏 − 1 𝑆𝐶(𝐴𝐵) 𝐶𝑀(𝐴𝐵)
Error 𝑎𝑏(𝑛 − 1) 𝐶𝑀𝐸
Análisis estadístico
• Ejemplo : Se realizó un experimento en la cual se desea probar un
producto lácteo de naturaleza orgánica, para lo cual se consideran dos
factores: Temperatura de escaldado y dosis de leche en el producto.
El experimento se llevó a cabo en la UPT, y se midió el resultado
sensorial:
• Objetivos
• Hipótesis
Factor B Factor A( temperatura)
(dosis leche) 70° 75° 80° 85°
50% 24 21 21 31
25 22 22 32
26 24 24 33
30 23 26 30

60% 23 21 27 29
25 20 20 28
26 19 24 30
22 21 26 30

70% 23 24 29 26
22 22 28 30
20 20 24 31
21 18 27 31

80% 20 20 24 29
19 21 27 31
24 22 29 30
22 21 26 28
Cálculos de las SC
𝑌…2
1° 𝑇𝐶 =
𝑎𝑏𝑛
2
2° 𝑆𝐶𝑇 = σ 𝑌𝑖𝑗𝑘 − 𝑇𝐶
σ 𝑌𝑖..2
3° 𝑆𝐶𝐹𝑎𝑐𝑡𝑜𝑟 𝐴 = − 𝑇𝐶
𝑏𝑛
2
σ 𝑌.𝑗.
4° 𝑆𝐶𝐹𝑎𝑐𝑡𝑜𝑟 𝐵 = − 𝑇𝐶
𝑎𝑛
2
σ 𝑌𝑖𝑗.
5° 𝑆𝐶𝐼𝑛𝑡𝑒𝑟𝑎𝑐 𝐴𝐵 = − 𝑇𝐶 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵
𝑛
6° 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − 𝑆𝐶𝐴 − 𝑆𝐶𝐵 − 𝑆𝐶𝐴𝐵
• ¿Qué efecto tienen la temperatura de escaldado de la lecha y dosis de
leche empleado para la elaboración del producto?
• ¿Existe alguna temperatura de escaldado y dosis de leche con el que
el producto orgánico resulte más agradable al paladar de los clientes?
• Construir un ANOVA
ejemplo
• Se ha conducido un experimento con dos factores, controlado en
invernadero, para medir el rendimiento de una variedad de
espárrago, bajo la influencia de temperatura y humedad. Los niveles
de las variables son:
• Humedad: 50, 60 , 70
• Temperatura: 15-20-25
• Los rendimientos en Tn/ha se presentan a continuación:
Temperatura
Humedad 15 20 25 30
50 30 25 20 20
1 60 35 20 25 16
70 38 30 23 24
Subtotal 103 75 68 60 306
2 50 26 26 29 28
60 28 28 32 24
70 30 29 36 26
Subtotal 84 83 97 78 342
3 50 43 36 36 30
60 40 35 39 32
70 42 40 40 31
Subtotal 125 111 115 93 444
Total 312 269 280 231 1092
Objetivos del experimento
1° Evaluar el rendimiento del espárrago orgánico a diferentes niveles del factor
temperatura
2° Evaluar el rendimiento del espárrago orgánico bajo la influencia de diferentes
niveles de humedad.
3° Evaluar el rendimiento del espárrago orgánico bajo influencia combinada de la
temperatura y humedad.
Hipótesis
1° Hipótesis nula: No se observa efecto de la temperatura en el rendimiento del
espárrago orgánico.
2° No se observa efecto de la humedad en el rendimiento del espárrago orgánico
3° No se observa el efecto combinado de la temperatura y humedad en el
rendimiento del espárrago orgánico.
ANOVA
F de V GL SC CM Fc Ft
Temperatura 3
Humedad 2
Inter(T yH) 6
Error exp. 24
Total 35

You might also like