Professional Documents
Culture Documents
Ejemplo
En los experimentos agrcolas, los bloques puede estar constituido por grupos de parcelas
relativamente homogneas que puede ser agrupados de acuerdo a gradiente de fertilidad,
otro porque se encuentra en una pendiente.
Ventajas
Este diseo tiene muchas ventajas, tales como
1.- En general es posible agrupar las unidades experimentales de modo que se logre mayor
precisin con respecto a un Diseo completamente al azar
2.- La nica restriccin sobre el nmero de tratamiento por bloque y tratamiento es la
disponibilidad de unidades experimentales
3.- Si se pierde informacin de todo un bloque o por contratiempo los datos de un bloque
completo es inutilizable estos datos puede omitirse, porque el resto mantiene la misma
estructura de un diseo de bloques completos al azar.
4.- Si se pierde informacin de algunas de las unidades estas puede estimarse.
Modelo Aditivo Lineal
El modelo aditivo Lineal del Diseo de Bloques Completo al Azar con una observacin por
unidad experimental, La observacin Yij puede representarse por el modelo siguiente:
Yij i j ij ; i 1, 2,
, t y j 1, 2,
,b
donde:
Yij : es la respuesta obtenida de la unidad experimental del j -simo bloque sujeta al
tratamiento i .
i 1
0,
j 1
i 1
0;
y los j son variables aleatorias independientes distribuidas normalmente con media cero y
variancia 2 ,
Cuadro de Datos
Bloques
tratamientos
1
1
Y11
2
Y12
b
Y1b
Total
Y1
Y21
Y22
Y2b
Y2
Yt1
Yt 2
Ytb
Yt
Total
Y1
Y2
Y2
Yi Yij , para i 1, 2,
Donde :
j 1
, t ; Y j Yij , para j 1, 2,
, b;
i 1
Y Yij
i 1 j 1
Y 1 t b
Yij ; i Yi Y , para i 1, 2,
tb tb i 1 j 1
j Y j Y , para j 1, 2,
,t;
,b
Siendo:
b
Y
Yi i
b
Yij
j 1
, Y j
Y j
t
Y
i 1
ij
Residual o residuo
eij Yij Yi Y j Y
ANLISIS DE VARIANCIA
La variacin total puede ser descompuesta de la siguiente forma:
t
(Y
i 1 j 1
ij
Y ) (Yi Y ) (Y j Y ) (Yij Yi Y j Y ) 2
2
i 1 j 1
i 1 j 1
i 1 j 1
donde:
t
Y2
es la medida de la variacin total.
bt
i 1 j 1
i 1 j 1
Yi2 Y2
es una medida de la variacin entre
bt
i 1 b
tratamientos.
SCTrat (Yi Y )2
i 1 j 1
Y2j
j 1
SCBloq (Y j Y )
2
i 1 j 1
Y2
es una medida de la variacin existente
tb
entre bloques
SCE
SCBloq
SCTrat
,
, CME
CMTrat
b 1
t 1
b 1 t 1
Luego, se tiene el siguiente cuadro de ANVA
CMBloq
Fuente de
Variacin
Bloques
SC
GL
CM
SCBloq
b-1
CMBloq
Tratamientos SCTrat
t-1
CMTrat
Error
Total
(b-1)(t-1)
bt-1
CME
SCE
SCTotal
j
b 1 j 1
b t 2
i
t 1 i 1
2 b 2
2
t 0
H a : i 0 , para al menos un i
Nivel de Significacin
El cual es equivalente H p : 1 2
Fc
CMTrat
~ Ft 1,b 1t 1 / si la Hp es cierta
CME
Nota: Como los bloques son fijados y no cumple con el principio de aleatorizacin no se
puede realizar pruebas de hiptesis sobre los efectos de bloques. En lugar de esto se puede
encontrar eficiencia relativa respecto a un diseo completamente al azar, el cual se define:
Tratamiento
Gasolina
A
B
C
D
E
Total
Bloques (vehculo)
2
3
4
5
Total
8
10
8
9
10
45
7
9
8
8
9
41
6
8
9
8
8
39
6
7
9
8
7
37
7
9
10
7
9
42
34
43
44
40
43
204
Donde:
Yij : es rendimiento en Km/litro obtenido del j -simo vehculo con el
1.36
5
25
41 204
2 Y2 Y
0.04
5 25
e12 Y12 Y1 Y2 Y 7 6.8 8.2 8.16 0.16
1 Y1 Y
Cuadro de ANVA
Yij2 82 72
92 1696 ,
i 1 j 1
5
Y
j 1
2
j
452 412
b
SCBloq
j 1
i 1
2
i
342 432
422 8360
Y2 8360 204
7.36
t
tb
5
25
2
Y2j
13.36
bt
5
25
i 1 b
2
SCTrat
204 31.36
Y2
SCTotal Yij 1696
bt
25
i 1 j 1
SCE SCTotal SCTrat SCBloq 31.36 7.36 13.36 10.64
t
Fuente de
Variacin
Carros
Gasolinas
Error
Total
SC
GL
CM
Fc
7.36
13.36
10.64
31.36
4
4
16
24
1.84
3.34
0.665
5.0226
H p : 1 2 3 4 5
H a : al menos dos i son diferentes
0.05
Fc
CMTrat 3.34
5.0226
CME
0.665
432 8390 ,
12
3
A
6
13
3
B
8
14
3
D
8
15
3
E
8
16
4
A
6
17
4
C
9
18
4
E
7
19
4
B
7
20
4
D
8
21
5
E
9
22
5
D
7
23
5
A
7
24
5
C
10
25
5
B
9
> str(planb)
'data.frame':
25 obs. of 3 variables:
$ block
: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 2 2 2 2
2 ...
$ treatment : Factor w/ 5 levels "A","B","C","D",..: 4 2 3 5 1 2 4 3 5
1 ...
$ rendimiento: num 9 10 8 10 8 9 8 8 9 7 ...
> mod<-lm(rendimiento~block+treatment,planb)
> anva<-anova(mod)
> anva
Analysis of Variance Table
Response: rendimiento
Df Sum Sq Mean Sq F value
Pr(>F)
block
4
7.36
1.840 2.7669 0.063664 .
treatment 4 13.36
3.340 5.0226 0.008138 **
Residuals 16 10.64
0.665
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 >
cm<-anva$Mean
sc<-anva$Sum
rendimiento<-planb$rendimiento
vehiculo<-planb$block
tipos<-planb$treatment
nt<-tapply(rendimiento,vehiculo,length)
t<-nt[1]
nb<-tapply(rendimiento,tipos,length)
b<-nb[1]
ER<-((sc[1]+b*(t-1)*cm[3])/(t*b-1))/cm[3]
ER
1
1.294486
Como ER>1 el uso de bloques ha sido efectivo para reducir el error experimental
Comparaciones Mltiples (Modelo I)
Si se define que i i entonces un estimador de i esta dado por
i Yi
1 b
Yij ,
b j 1
cm<-
la variancia de Yi , para i 1, 2,
var Yi
2
b
la variancia de Yi Yl , para i l y i, l 1, 2,
CME
b
2 2
2CME
y su estimado est dado por SY2i Yl
var Yi Yl
b
b
Prueba de t
Hiptesis
Caso A Bilateral
H p : i l k
H p : i l k
H p : i l k
H a : i l k
H a : i l k
H a : i l k
Para i l ; i, l 1, 2,
,t
Nivel de significacin
Estadstica de prueba:
tc
Decisin
Se Acepta
Yi Yl k
~ t gle / H p es verdadera
SYi Yl
Caso A
Hp
Se Rechaza
, gle
2
tc t
tc t
Hp
, gle
2
1 , gle
2
tc t
1 , gle
2
Caso B
Caso C
tc t1 ; gle
tc t ; gle
tc t1 ; gle
tc t ; gle
H p : i l
H a : i l
Para i l , i, l 1, 2,
,t
Nivel de significacin
Entonces si definimos
DMS i, l t
Yi Yl
1 ,GLE
2
Para i l , i, l 1, 2,
,t
Ejemplo: Con los datos del ejemplo de gasolina, suponga que fue planeado realizar la
comparacin entre la gasolina D y E. Realice la prueba de t aun nivel de significacin
0.05 , para realizar esta comparacin
Las medias de los rendimientos est dado por:
YA 6.8 ,
H p : D E o H p : D E 0
H a : D E o H a : D E 0
0.05
tc
2CME 2 0.665
0.266
b
5
YD YE k 8 8.6 0
-1.16335 . Se acepta H p
SYD YE
0.266
Con lenguaje R
modeg<-lm(rendimiento~vehiculo+tipos)
El lenguaje R da unos estimados de efectos para los dos factores. Para el caso de gasolina
viene hacer la diferencia de la medias de tratamientos de B, C, D y E con respecto a la
media de tratamiento de A, respectivamente.
> mediat<-tapply(rendimiento,tipos,mean)
> mediat
a
b
c
d
e
6.8 8.6 8.8 8.0 8.6
> mediaD<-mediat[4]
> mediaE<-mediat[5]
> esdmedia<-sqrt(2*(deviance(modeg)/df.residual(modeg))/5)
> esdmedia
a
0.5157519
> tc<-(mediaD-mediaE-0)/esdmedia
> tc
d
-1.16335
> pvalue<-2*pt(tc,df.residual(modeg))
> pvalue
d
0.2617441
Se acepta Hp
Para i l , i, l 1, 2,
,t
Nivel de significacin
Clculo del Valor Crtico:
w q t , GLE
1
SY Y
2 i l
donde:
q t , GLE =amplitud estudiantizada para la prueba de Tukey
Ejemplo: Con los datos del ejemplo de gasolina, realice la prueba de Tukey a un nivel de
significacin 0.05 , para realizar esta comparacin
H p : i i
H a : i i para i, i A, B, C, D, E, i i
0.05 ,
q 0.95,5,16 4.34
CME 0.665
CME
0.665
w q 0.95,5,16
4.34
1.582762
5
5
Comparacin
B-A
C-A
D-A
E-A
C-B
D-B
E-B
D-C
E-C
E-D
Yi Yi
SYi Yl
1.8
2
1.2
1.8
0.2
0.6
0
0.8
0.2
0.6
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
w
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
Significancia
significativo
significativo
No significativo
significativo
No significativo
No significativo
No significativo
No significativo
No significativo
No significativo
>
>
>
>
library(multcomp)
amod<-aov(rendimiento~vehiculo+tipos)
comptipos<-glht(amod,linfct=mcp(tipos="Tukey"))
confint(comptipos)
Simultaneous Confidence Intervals
lwr
upr
0.2199 3.3801
0.4199 3.5801
-0.3801 2.7801
0.2199 3.3801
-1.3801 1.7801
-2.1801 0.9801
-1.5801 1.5801
-2.3801 0.7801
-1.7801 1.3801
-0.9801 2.1801
> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0
1.8000
0.5158
3.490
0.0219 *
c - a == 0
2.0000
0.5158
3.878
0.0100 *
d - a == 0
1.2000
0.5158
2.327
0.1871
e - a == 0
1.8000
0.5158
3.490
0.0217 *
c - b == 0
0.2000
0.5158
0.388
0.9947
d - b == 0 -0.6000
0.5158 -1.163
0.7712
e - b == 0
0.0000
0.5158
0.000
1.0000
d - c == 0 -0.8000
0.5158 -1.551
0.5467
e - c == 0 -0.2000
0.5158 -0.388
0.9947
e - d == 0
0.6000
0.5158
1.163
0.7712
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)
A
6.8
D
8.0
B
8.6
E
8.6
C
8.8
De acuerdo a estos resultados se puede recomendar las gasolina tipo B, E y C por tener los
mayores rendimientos
Prueba de Dunnett (comparaciones de todas las medias de tratamientos con un control o
testigo)
H p : i 1
H a : i 1 , para i 2,
,t
,t
donde :
tDunnet , t , GLE = t de Dunnett con un nivel de significacin .
p = nmero de tratamiento a comparar con el control
GLE = Grados de libertad del error
Yi Y1 d , para i 2,
,t
H a : i A , para i B, C, D, E
YA 6.8 ,
SY2i YA
2CME 2 0.665
0.266
b
5
Comparacin
Yi YA
B-A
C-A
D-A
E-A
1.8
2.0
1.2
1.8
1.206859
1.206859
1.206859
1.206859
> amod<-aov(rendimiento~vehiculo+tipos)
> comptipos<-glht(amod,linfct=mcp(tipos="Dunnett"))
> confint(comptipos)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Estimated Quantile = 2.7086
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr
upr
b - a == 0 1.8000
0.4030 3.1970
c - a == 0 2.0000
0.6030 3.3970
d - a == 0 1.2000 -0.1970 2.5970
e - a == 0 1.8000
0.4030 3.1970
> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0
1.8000
0.5158
3.490 0.01017 *
c - a == 0
2.0000
0.5158
3.878 0.00465 **
d - a == 0
1.2000
0.5158
2.327 0.10292
e - a == 0
1.8000
0.5158
3.490 0.01026 *
significativo
significativo
No significativo
significativo
La prueba de Duncan
Planteamiento de hiptesis
H 0 : i i
Para i i , i, i 1, 2,
H a : i i
,t
Nivel de significacin
Clculo del Valor Crtico:
vd d p, GLE
1
SY Y
2 i i
donde:
d p, GLE =amplitud estudiantizada para la prueba de Duncan
H p : i i
H a : i i para i, i A, B, C, D, E, i i
0.05 ,
CME 0.665
2CME
2*0.665
SYi Yi
0.5157519
b
5
p
2
3
4
5
3.00
3.15
3.23
3.30
d0.05 p,16
Comparacin
B-A
C-A
D-A
E-A
Yi Yi
SYi Yl
1.8
2
1.2
1.8
0.5157519
0.5157519
0.5157519
0.5157519
d0.05 p,16
3
5
2
4
3.15
3.30
3.00
3.23
vd
1.148779
1.203482
1.094075
1.177954
Significancia
significativo
significativo
significativo
significativo
C-B
D-B
E-B
D-C
E-C
E-D
0.2
0.6
0
0.8
0.2
0.6
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
3
2
2
4
2
3
3.15
3.00
3.00
3.23
3.00
3.15
> library(agricolae)
> anva<-aov(modeg)
> compd<-duncan.test(anva,"tipos")
> compd
$statistics
Mean
CV MSerror
8.16 9.99357
0.665
$parameters
Df ntr
16
5
$Duncan
Table CriticalRange
2 2.997999
1.093345
3 3.143802
1.146519
4 3.234945
1.179757
5 3.297445
1.202550
$means
rendimiento
a
6.8
b
8.6
c
8.8
d
8.0
e
8.6
std
0.8366600
1.1401754
0.8366600
0.7071068
1.1401754
r Min Max
5
6
8
5
7 10
5
8 10
5
7
9
5
7 10
$comparison
NULL
$groups
trt means
1
c
8.8
2
b
8.6
3
e
8.6
4
d
8.0
5
a
6.8
M
a
a
a
a
b
> compd<-duncan.test(anva,"tipos",group=FALSE)
> compd
$statistics
Mean
CV MSerror
8.16 9.99357
0.665
$parameters
Df ntr
16
5
1.148779
1.094075
1.094075
1.177954
1.094075
1.148779
No significativo
No significativo
No significativo
No significativo
No significativo
No significativo
$Duncan
Table CriticalRange
2 2.997999
1.093345
3 3.143802
1.146519
4 3.234945
1.179757
5 3.297445
1.202550
$means
rendimiento
a
6.8
b
8.6
c
8.8
d
8.0
e
8.6
std
0.8366600
1.1401754
0.8366600
0.7071068
1.1401754
$comparison
Difference
a - b
-1.8
a - c
-2.0
a - d
-1.2
a - e
-1.8
b - c
-0.2
b - d
0.6
b - e
0.0
c - d
0.8
c - e
0.2
d - e
-0.6
r Min Max
5
6
8
5
7 10
5
8 10
5
7
9
5
7 10
pvalue sig.
LCL
UCL
0.004810
** -2.9797573 -0.6202427
0.002516
** -3.2025505 -0.7974495
0.033440
* -2.2933451 -0.1066549
0.004019
** -2.9465185 -0.6534815
0.703287
-1.2933451 0.8933451
0.245475
-0.5465185 1.7465185
1.000000
-1.0933451 1.0933451
0.144077
-0.3797573 1.9797573
0.460428
-0.9465185 1.3465185
0.261744
-1.6933451 0.4933451
$groups
NULL
A
6.8
D
8.0
B
8.6
E
8.6
C
8.8
H 0 : Ci i k
i 1
t
H1 : Ci i k
i 1
H 0 : Ci i k
i 1
t
H1 : Ci i k
i 1
H 0 : Ci i k
i 1
t
H1 : Ci i k
i 1
a un nivel de significacin
Estadstica de Prueba
Qk
bCME Ci2
i 1
i 1
i 1
Luego,
Decisin
Se Acepta
Caso A
Hp
Se Rechaza
, gle
2
tc t
1 , gle
2
tc t
Hp
, gle
2
tc t
1 , gle
2
Caso B
Caso C
tc t1 ; gle
tc t ; gle
tc t1 ; gle
tc t ; gle
Prueba de Scheff
t
H 0 : Ci i 0 contra
i 1
t
H a : Ci i 0
i 1
Nivel de significacin
Valor Crtico de la prueba
VCS SL
donde:
t
L CiYi.
i 1
S L
t
1
CME Ci2
b
i 1
Se acepta H 0 , si
L VCS
Se rechaza H 0 , si
L VCS
El Mtodo de Bonferroni
Hiptesis:
H 0 : i l
H a : i l , para i l , y i, l 1, 2,
.t
VCB i, l t
Y Y
,GLE i . l .
1
2 nc
donde:
SYi . Yl .
Se rechaza H 0 para i l , y i, l 1, 2,
2CME
b
. t , si
Yi. Yl . VCB i, l
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de t para probar el siguiente
contraste a un nivel de significacin 0.05 : ( B, C, D, E) versus A.
H p : B C D E 4 A
H a : B C D E 4 A
0.05
tc
Q
t
bCME C
i 1
Como
2
i
34
5 0.665 4
1 1 1 1
2
tc 2.12 , se rechaza H p .
Con lenguaje R
>
>
>
>
>
vmedia<-tapply(rendimiento,tipos,mean)
ci<-c(-4,1,1,1,1)
q<-5*ci%*%vmedia
tc<-q/sqrt(5*(deviance(modeg)/16)*sum(ci^2))
tc
[,1]
[1,] 4.169348
> pvalue<-2*(1-pt(tc,16))
4.16934
> pvalue
[,1]
[1,] 0.000723429
Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de Scheff para probar el
siguiente contraste a un nivel de significacin 0.05 : ( B, C, D, E) versus A
H p : B C D E 4 A 0
H a : B C D E 4 A 0
0.05
F 0.95,4,16 3.01
t
L 6.8
S L
VCS SL
Como
t
1
1
2
CME Ci2
0.665 4 12 12 12 12 1.630951
b
5
i 1
L VCS , se rechaza H p .
Con Lenguaje R
> absl<-abs(ci%*%vmedia)
> absl
[,1]
[1,] 6.8
> sl<-sqrt((1/5)*(deviance(modeg)/16)*sum(ci^2))
> sl
[1] 1.630951
> vcs<-sl*sqrt(4*qf(0.95,4,16))
> vcs
[1] 5.656289
Anlisis de residuales
gasolina<-read.table("c:/datos1/gasolina.txt",T)
rendimiento<-gasolina[,1]
vehiculo<-factor(gasolina[,2])
tipos<-gasolina[,3]
modeg<-lm(rendimiento~vehiculo+tipos)
par(mfrow=c(2,2))
plot(modeg)
7.5
9.0
23
24
-2 -1
Theoretical Quantiles
Scale-Location
Constant Leverage:
Residuals vs Factor Levels
6.0
7.5
9.0
Fitted values
23
-1
-3
1.0
24
23
Standardized residuals
Fitted values
0.0
Standardized residuals
6.0
Normal Q-Q
-2
24
Standardized residuals
0.5
23
-1.5
Residuals
Residuals vs Fitted
vehiculo :
4 3 2
24
5 1
ri<-rstandard(modeg)
shapiro.test(ri)
Shapiro-Wilk normality test
data: ri
W = 0.9362, p-value = 0.1207
> library(car)
> ncvTest(modeg)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 3.160140
Df = 1
p = 0.07545673
De acuerdo al grfico de los valores predicho (o valores ajustado) versus los residuos, se
puede observar que conforme los valores predichos aumenta la variabilidad de los residuos
tambin aumenta (en forma de embudo), y tambin se puede observar que el lowes de la
raz cuadrada de valores absolutos de residuales estandarizados (estudentizados
internamente) en funcin de los valores predichos tiene una tendencia sistemtica creciente.
Por ltimo, en el cuarto grfico se puede observar que el nico residuo estandarizado que
sobrepasa los lmites 2 es el de la observacin 3, siendo este el nico valor extremo Todo
esto indica que es probable que no se cumpla con el supuesto de homogeneidad de
variancia. Tambin, el grfico de probabilidad normal de los residuos estandarizado en da
evidencia de que posiblemente el supuesto de normalidad no se cumpla causado
posiblemente por los valor extremo o de las observaciones con residuos estandarizados
cercanos al lmite 2 , pero al realizar la prueba de Shapiro Wild esta se acepta para niveles