Professional Documents
Culture Documents
BIOTECNOLOGIA AMBIENTAL
9 "A y B"
Clase No.9
Riobamba
O17- M18
CONTENIDOS:
4
B.- DISEÑO COMPLETAMENTE AL AZAR (DCA) y ANOVA
• El más simple de los diseños utilizados para comparar 2 o más tratamientos,
sólo consideran 2 fuentes de variabilidad: tratamientos y error aleatorio
• Se llama completamente al azar porque todas las corridas experimentales se
realizan en orden aleatorio completo.
• Supongamos que se tienen k poblaciones o tratamientos, independientes y con
medias desconocidas μ1, μ 2, …, μ k, así como varianzas también desconocidas
pero que se suponen iguales σ21= σ22 = … = σ2k = σ2
• Las poblaciones pueden ser k métodos de producción, tratamientos, grupos, etc., y
sus medias, son medidas en términos de la variable de respuesta.
• Para para concluir si hay un efecto (es decir, los tratamientos son diferentes en
base a sus medias), se utiliza el Análisis de Varianza (ANOVA).
7
C.- ANOVA
para el Diseño Completamente al Azar (DCA)
• Técnica central en el análisis de datos experimentales, que separa la variación total
en las partes que intervienen como fuentes de variación en el experimento.
• El DCA separa la
variabilidad de los
tratamientos, y la
del error.
10
1. Yi • = Suma de las observaciones del tratamiento i.
11
• Para probar una hipótesis mediante ANOVA; primero: descomponer la
variabilidad total de los datos en sus dos componentes
𝑘 𝑛𝑖 𝑘 𝑛𝑖
Ȳ••2
• Suma total de 𝑺𝑪𝑻 = 𝒀𝒊𝒋 − Ȳ•• 2 = 𝒀𝒊𝒋𝟐 −
cuadrados 𝑁
𝑖=1 𝑗=1 𝑖=1 𝑗=1
12
• Suma total de cuadrados o variabilidad total de los datos:
4 4 𝟐 Ȳ𝟐.. 1562
𝑆𝐶𝑇 = 𝑖=1 𝑗=1 𝒀𝒊𝒋 − 𝑵 = 1620- = 99,0
16
14
• Las sumas de cuadrados divididas entre sus respectivos grados
de libertad se llaman cuadrados medios.
• Los dos que más interesan son el cuadrado medio de
tratamientos:
• y el cuadrado medio del error, que se denotan por
𝑺𝑪𝑻𝑹𝑨𝑻 𝑺𝑪𝑬
𝑪𝑴𝑻𝑹𝑨𝑻 = 𝑪𝑴𝑬 =
k–1 N–k
• Los valores esperados de los
cuadrados medios están dados por: 𝐸(𝐶𝑀𝐸) =σ2
𝐾
𝑖=1 𝑛𝑖 τ i
2
𝐸(𝐶𝑀𝑇𝑅𝐴𝑇) = σ2 +
N−k
15
• Si se sabe que SCE y SCTRAT son independientes, por lo que SCE /σ2 y SCTRAT /σ2
son dos variables aleatorias independientes con distribución ji-cuadrada con N
– k, y k – 1 grados de libertad, respectivamente.
• Entonces, bajo el supuesto de Ho es verdadera, el estadístico es:
𝑪𝑴𝑻𝑹𝑨𝑻
𝑭𝒐 =
𝑪𝑴𝑬
• Sigue una distribución F con (k – 1) grados de libertad en el numerador, y (N –
k) grados de libertad en el denominador
• Si Fo es grande, se contradice la hipótesis de que no hay efectos de tratamientos;
• Si Fo es pequeño se confirma la validez de Ho, para un nivel de significancia
prefijado
• Se rechaza Ho si Fo > Fα, k – 1, N – k, donde: F α, k – l, N – k es el percentil (1 – α) × 100
de la distribución F.
• También se rechaza Ho si el valor-p < α, donde el valor-p: área bajo la distribución
Fk – l, N – k a la derecha del estadístico Fo, es decir:
valor-p = P(F > Fo).
16
• En la distribución F, se lee que el valor crítico para α = 0.05 es
• F0.05, 3, 12 = 3.49.
• Como Fo = 9.42 > 3.49, se rechaza Ho, entonces sí hay diferencia o
efecto en al menos dos de los métodos de ensamble en cuanto a su
tiempo promedio
• El valor-p es el área bajo la curva de la distribución F 3,12 a la derecha
de F0 = 9.42, es 0.0018, lo cual es difícil de calcular de forma manual
https://www.easycalculation.com/es/statistics/f-test-p-value.php
17
• Tabla de Análisis de Varianza (ANOVA)
• Incluye la información necesaria para calcular el estadístico Fo hasta
llegar al valor-p,
HO : μA = µB = μC = µD = µ
HA : μi ≠ µj ≠ para algún i ≠ j
19
• F0.05, 3, 20 = 3.10; como Fo = 23.24 > 3.10, se rechaza Ho.
• En el software se tiene un valor-p < 0.001, el cual es menor que la
significancia prefijada α = 0.05, por lo que se rechaza Ho, y se
acepta que al menos un par de tipos de cuero tienen un desgaste
promedio diferente.
• En la tabla se observa que la variación total en 24 datos de este
experimento fue de 9.101,33. De estos 7 072 se debe a las
diferencias entre tipos de cuero, y 2.029,0 a la diferencia entre los
cueros del mismo tipo.
• Si las diferencias de los cuadrados debido al tipo de cuero es de
2.357,44, y el error es de 101,45; se tiene que la primera es 23.2
veces más grande que la segunda, lo que indica que las diferencias
observadas entre los tipos de cuero son significativas, y no se deben
a pequeñas variaciones muestrales (error).
20