You are on page 1of 22

Diseo de Bloques Completos Randomizado

Un diseo de Bloques Completos Randomizado es aquel cumple con las siguientes


condiciones:
1) Las unidades experimentales se distribuyen en grupos o bloques, de manera tal que
las unidades experimentales dentro de cada bloque sean relativamente homogneas
y que el nmero de unidades experimentales dentro de un bloque sea igual al
nmero de tratamientos por investigar; y
2) Los tratamientos se asignan al azar a las unidades experimentales dentro de cada
bloque.

Ejemplo
En los experimentos agrcolas, los bloques puede estar constituido por grupos de parcelas
relativamente homogneas que puede ser agrupados de acuerdo a gradiente de fertilidad,
otro porque se encuentra en una pendiente.
Ventajas
Este diseo tiene muchas ventajas, tales como
1.- En general es posible agrupar las unidades experimentales de modo que se logre mayor
precisin con respecto a un Diseo completamente al azar
2.- La nica restriccin sobre el nmero de tratamiento por bloque y tratamiento es la
disponibilidad de unidades experimentales
3.- Si se pierde informacin de todo un bloque o por contratiempo los datos de un bloque
completo es inutilizable estos datos puede omitirse, porque el resto mantiene la misma
estructura de un diseo de bloques completos al azar.
4.- Si se pierde informacin de algunas de las unidades estas puede estimarse.
Modelo Aditivo Lineal
El modelo aditivo Lineal del Diseo de Bloques Completo al Azar con una observacin por
unidad experimental, La observacin Yij puede representarse por el modelo siguiente:
Yij i j ij ; i 1, 2,

, t y j 1, 2,

,b

donde:
Yij : es la respuesta obtenida de la unidad experimental del j -simo bloque sujeta al

tratamiento i .

: El efecto de la media comn.


i : El verdadero efecto del i -simo tratamiento.
j : El verdadero efecto del j -simo bloque.
ij : Es una variable aleatoria no observable llamado error
Para el proceso de inferencia se asume que ij son variables aleatorias independientes que
se distribuye normalmente con media cero y variancia comn 2 .
Modelo I (efectos fijos)
Se asume que los niveles de los factores son fijados por el investigador y estos efectos son
desviaciones con respecto a la media. Entonces se cumple:
t

i 1

0,

j 1

Modelo II (efectos aleatorios)


Los niveles de los factores son elegidos aleatoriamente de poblaciones grandes. Entonces
los i son variables aleatorias independientes distribuidas normalmente con media cero y
variancia 2 , los j son variables aleatorias independientes distribuidas normalmente con
media cero y variancia 2 ,
Modelo III (Modelo mixto)
Los niveles de los tratamientos son fijados por el investigador y los niveles de los bloques
son elegidos al azar en este caso se cumple que
t

i 1

0;

y los j son variables aleatorias independientes distribuidas normalmente con media cero y
variancia 2 ,

Cuadro de Datos
Bloques

tratamientos
1

1
Y11

2
Y12

b
Y1b

Total
Y1

Y21

Y22

Y2b

Y2

Yt1

Yt 2

Ytb

Yt

Total

Y1

Y2

Y2

Yi Yij , para i 1, 2,

Donde :

j 1

, t ; Y j Yij , para j 1, 2,

, b;

i 1

Y Yij
i 1 j 1

Estimacin de Parmetro para el Modelo I


Los estimadores de los parmetros pueden ser encontrados aplicando el mtodo de los
mnimos cuadrados. Con este mtodo se obtiene:

Y 1 t b
Yij ; i Yi Y , para i 1, 2,
tb tb i 1 j 1

j Y j Y , para j 1, 2,

,t;

,b

Siendo:
b

Y
Yi i
b

Yij
j 1

, Y j

Y j
t

Y
i 1

ij

Residual o residuo

eij Yij Yi Y j Y
ANLISIS DE VARIANCIA
La variacin total puede ser descompuesta de la siguiente forma:
t

(Y
i 1 j 1

ij

Y ) (Yi Y ) (Y j Y ) (Yij Yi Y j Y ) 2
2

i 1 j 1

i 1 j 1

i 1 j 1

donde:
t

SCTotal (Yij Y )2 Yij2

Y2
es la medida de la variacin total.
bt

i 1 j 1

i 1 j 1

Yi2 Y2
es una medida de la variacin entre

bt
i 1 b
tratamientos.

SCTrat (Yi Y )2
i 1 j 1

Y2j

j 1

SCBloq (Y j Y )
2

i 1 j 1

Y2
es una medida de la variacin existente
tb
entre bloques

SCE (Yij Yi Y j Y )2 SCTotal SCTrat SCBloq , es la variacin


i 1 j 1

debido a otros factores no considerados en el


modelo.
Cuadrados Medios
Los cuadrados Medios se definen como el cociente entre la suma de los cuadrados y sus
respectivos grados de libertad:

SCE
SCBloq
SCTrat
,
, CME
CMTrat
b 1
t 1
b 1 t 1
Luego, se tiene el siguiente cuadro de ANVA
CMBloq

Fuente de
Variacin
Bloques

SC

GL

CM

SCBloq

b-1

CMBloq

Tratamientos SCTrat

t-1

CMTrat

Error
Total

(b-1)(t-1)
bt-1

CME

SCE
SCTotal

Cuadrados Medios Esperados


Modelo I
Modelo II
b
t
2 t 2
2
2

j
b 1 j 1
b t 2
i
t 1 i 1

2 b 2
2

Prueba de Hiptesis (Modelo I)


H p : 1 2

t 0

H a : i 0 , para al menos un i
Nivel de Significacin

El cual es equivalente H p : 1 2

H a : al menos dos i son diferentes

Fc

CMTrat
~ Ft 1,b 1t 1 / si la Hp es cierta
CME

Nota: Como los bloques son fijados y no cumple con el principio de aleatorizacin no se
puede realizar pruebas de hiptesis sobre los efectos de bloques. En lugar de esto se puede
encontrar eficiencia relativa respecto a un diseo completamente al azar, el cual se define:

SCBloq b(t 1)CME


tb 1
ER
CME
Si ER 1 entonces el Diseo de Bloques Completos al Azar es ms eficiente que un
Diseo Completamente al azar.
Ejemplo: Se llev a cabo un experimento para sealar los mritos de 5 gasolinas. Debido a
que es inevitable la variacin en eficiencia de vehculo a vehculo, la prueba se realiz un
experimento con 5 automviles, que de aqu en adelante llamaremos bloques. Se dispone de
las siguientes descripciones de las 5 gasolinas:
A: Control
B: Control + aditivo X elaborado por la compaa I
C: Control + aditivo Y elaborado por la compaa I
D: Control + aditivo U elaborado por la compaa II
E: Control + aditivo V elaborado por la compaa II
Los tipos de gasolinas fueron probadas en cada carro en orden aleatorio. Los datos, en
Km/litros, se dan continuacin:

Tratamiento
Gasolina
A
B
C
D
E
Total

Bloques (vehculo)
2
3
4
5
Total

8
10
8
9
10
45

7
9
8
8
9
41

6
8
9
8
8
39

6
7
9
8
7
37

7
9
10
7
9
42

34
43
44
40
43
204

Modelo Aditivo Lineal:


Yij i j ij ; i 1, 2, 3, 4 y 5 y j 1, 2, 3, 4 y 5

Donde:
Yij : es rendimiento en Km/litro obtenido del j -simo vehculo con el

i -simo tipo de de gasolina.

: El efecto de la media comn.


i : El verdadero efecto del i -simo tipo de gaslina
j : El verdadero efecto del j -simo vehculo.
ij : Son los efectos no observado del j-simo vehculo con el i-simo tipo de
gasolina llamado error
Una posible aleatorizacin de los tratamientos dentro de los bloques sera:
> library(planor)
> Design <data.frame(block=rep(1:5,rep(5,5)),treatment=rep(c("A","B","C","D","E"),5
))
> planor.randomize(~block/UNITS, data=Design)
block treatment
1
1
D
2
1
B
3
1
C
4
1
E
5
1
A
6
2
B
7
2
D
8
2
C
9
2
E
10
2
A
11
3
C
12
3
A
13
3
B
14
3
D
15
3
E
16
4
A
17
4
C
18
4
E
19
4
B
20
4
D
21
5
E
22
5
D
23
5
A
24
5
C
25
5
B

Ejemplo de clculo de algunos efectos estimado y residual


34 204

1.36
5
25
41 204
2 Y2 Y
0.04
5 25
e12 Y12 Y1 Y2 Y 7 6.8 8.2 8.16 0.16

1 Y1 Y

Cuadro de ANVA

Yij2 82 72

92 1696 ,

i 1 j 1
5

Y
j 1

2
j

452 412
b

SCBloq
j 1

i 1

2
i

342 432

422 8360

Y2 8360 204

7.36
t
tb
5
25
2

Y2j

Yi2 Y2 8390 204

13.36
bt
5
25
i 1 b
2

SCTrat

204 31.36
Y2
SCTotal Yij 1696
bt
25
i 1 j 1
SCE SCTotal SCTrat SCBloq 31.36 7.36 13.36 10.64
t

Fuente de
Variacin
Carros
Gasolinas
Error
Total

SC

GL

CM

Fc

7.36
13.36
10.64
31.36

4
4
16
24

1.84
3.34
0.665

5.0226

H p : 1 2 3 4 5
H a : al menos dos i son diferentes
0.05

Fc

CMTrat 3.34

5.0226
CME
0.665

F 0.95,4,4 3.01 , como Fc F 0.95,4,4 , se rechaza la H p .


> fix(planb)
> planb
block treatment rendimiento
1
1
D
9
2
1
B
10
3
1
C
8
4
1
E
10
5
1
A
8
6
2
B
9
7
2
D
8
8
2
C
8
9
2
E
9
10
2
A
7
11
3
C
9

432 8390 ,

12
3
A
6
13
3
B
8
14
3
D
8
15
3
E
8
16
4
A
6
17
4
C
9
18
4
E
7
19
4
B
7
20
4
D
8
21
5
E
9
22
5
D
7
23
5
A
7
24
5
C
10
25
5
B
9
> str(planb)
'data.frame':
25 obs. of 3 variables:
$ block
: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 2 2 2 2
2 ...
$ treatment : Factor w/ 5 levels "A","B","C","D",..: 4 2 3 5 1 2 4 3 5
1 ...
$ rendimiento: num 9 10 8 10 8 9 8 8 9 7 ...
> mod<-lm(rendimiento~block+treatment,planb)
> anva<-anova(mod)
> anva
Analysis of Variance Table
Response: rendimiento
Df Sum Sq Mean Sq F value
Pr(>F)
block
4
7.36
1.840 2.7669 0.063664 .
treatment 4 13.36
3.340 5.0226 0.008138 **
Residuals 16 10.64
0.665
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1 >
cm<-anva$Mean
sc<-anva$Sum
rendimiento<-planb$rendimiento
vehiculo<-planb$block
tipos<-planb$treatment
nt<-tapply(rendimiento,vehiculo,length)
t<-nt[1]
nb<-tapply(rendimiento,tipos,length)
b<-nb[1]
ER<-((sc[1]+b*(t-1)*cm[3])/(t*b-1))/cm[3]
ER
1
1.294486

Como ER>1 el uso de bloques ha sido efectivo para reducir el error experimental
Comparaciones Mltiples (Modelo I)
Si se define que i i entonces un estimador de i esta dado por

i Yi

1 b
Yij ,
b j 1

cm<-

la variancia de Yi , para i 1, 2,

var Yi

2
b

, t est dado por:

, y su estimado est dado por: SY2i

la variancia de Yi Yl , para i l y i, l 1, 2,

CME
b

, t , est dado por:

2 2
2CME
y su estimado est dado por SY2i Yl
var Yi Yl
b
b
Prueba de t
Hiptesis
Caso A Bilateral

Caso B Unilateral a la Derecha

Caso C Unilateral a La Izquierda

H p : i l k

H p : i l k

H p : i l k

H a : i l k

H a : i l k

H a : i l k

Para i l ; i, l 1, 2,

,t

Nivel de significacin
Estadstica de prueba:

tc
Decisin
Se Acepta

Yi Yl k
~ t gle / H p es verdadera
SYi Yl

Caso A

Hp

Se Rechaza

, gle
2

tc t

tc t

Hp

, gle
2

1 , gle
2

tc t

1 , gle
2

Caso B

Caso C

tc t1 ; gle

tc t ; gle

tc t1 ; gle

tc t ; gle

Diferencia Mnima de Significacin (DMS), tambin se le conoce con el nombre de


diferencia lmite de significacin

H p : i l
H a : i l

Para i l , i, l 1, 2,

,t

Nivel de significacin
Entonces si definimos

DMS i, l t

Yi Yl
1 ,GLE
2

Luego, un criterio para examinar si existe diferencia significativa entre medias de


tratamiento se puede usar este criterio de la diferencia mnima significante DMS i, l .
Esto es, se rechaza H 0 si
Yi Yl DMS i, l

Para i l , i, l 1, 2,

,t

Ejemplo: Con los datos del ejemplo de gasolina, suponga que fue planeado realizar la
comparacin entre la gasolina D y E. Realice la prueba de t aun nivel de significacin
0.05 , para realizar esta comparacin
Las medias de los rendimientos est dado por:
YA 6.8 ,

YB 8.6 , YC 8.8 , YD 8.0 , YE 8.6

H p : D E o H p : D E 0

H a : D E o H a : D E 0

0.05
tc

T 0.975,16 2.22 , SY2D YE

2CME 2 0.665

0.266
b
5

YD YE k 8 8.6 0

-1.16335 . Se acepta H p
SYD YE
0.266

Con lenguaje R
modeg<-lm(rendimiento~vehiculo+tipos)

El lenguaje R da unos estimados de efectos para los dos factores. Para el caso de gasolina
viene hacer la diferencia de la medias de tratamientos de B, C, D y E con respecto a la
media de tratamiento de A, respectivamente.
> mediat<-tapply(rendimiento,tipos,mean)
> mediat
a
b
c
d
e
6.8 8.6 8.8 8.0 8.6
> mediaD<-mediat[4]
> mediaE<-mediat[5]
> esdmedia<-sqrt(2*(deviance(modeg)/df.residual(modeg))/5)
> esdmedia
a
0.5157519
> tc<-(mediaD-mediaE-0)/esdmedia
> tc
d
-1.16335
> pvalue<-2*pt(tc,df.residual(modeg))
> pvalue
d
0.2617441
Se acepta Hp

Prueba de Tukey-Cramer (Tukey HSD)


Planteamiento de hiptesis
H p : i l
H a : i l

Para i l , i, l 1, 2,

,t

Nivel de significacin
Clculo del Valor Crtico:

w q t , GLE

1
SY Y
2 i l

donde:
q t , GLE =amplitud estudiantizada para la prueba de Tukey

t = nmero de tratamiento a comparar


GLE = Grados de libertad del error
Se rechaza H 0 aun nivel de significacin , si
Yi Yl w

Ejemplo: Con los datos del ejemplo de gasolina, realice la prueba de Tukey a un nivel de
significacin 0.05 , para realizar esta comparacin
H p : i i

H a : i i para i, i A, B, C, D, E, i i
0.05 ,

q 0.95,5,16 4.34
CME 0.665
CME
0.665
w q 0.95,5,16
4.34
1.582762
5
5
Comparacin
B-A
C-A
D-A
E-A
C-B
D-B
E-B
D-C
E-C
E-D

Yi Yi

SYi Yl
1.8
2
1.2
1.8
0.2
0.6
0
0.8
0.2
0.6

0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519

w
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762
1.582762

Significancia
significativo
significativo
No significativo
significativo
No significativo
No significativo
No significativo
No significativo
No significativo
No significativo

>
>
>
>

library(multcomp)
amod<-aov(rendimiento~vehiculo+tipos)
comptipos<-glht(amod,linfct=mcp(tipos="Tukey"))
confint(comptipos)
Simultaneous Confidence Intervals

Multiple Comparisons of Means: Tukey Contrasts


Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Estimated Quantile = 3.0637
95% family-wise confidence level
Linear Hypotheses:
Estimate
b - a == 0 1.8000
c - a == 0 2.0000
d - a == 0 1.2000
e - a == 0 1.8000
c - b == 0 0.2000
d - b == 0 -0.6000
e - b == 0 0.0000
d - c == 0 -0.8000
e - c == 0 -0.2000
e - d == 0 0.6000

lwr
upr
0.2199 3.3801
0.4199 3.5801
-0.3801 2.7801
0.2199 3.3801
-1.3801 1.7801
-2.1801 0.9801
-1.5801 1.5801
-2.3801 0.7801
-1.7801 1.3801
-0.9801 2.1801

> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0
1.8000
0.5158
3.490
0.0219 *
c - a == 0
2.0000
0.5158
3.878
0.0100 *
d - a == 0
1.2000
0.5158
2.327
0.1871
e - a == 0
1.8000
0.5158
3.490
0.0217 *
c - b == 0
0.2000
0.5158
0.388
0.9947
d - b == 0 -0.6000
0.5158 -1.163
0.7712
e - b == 0
0.0000
0.5158
0.000
1.0000
d - c == 0 -0.8000
0.5158 -1.551
0.5467
e - c == 0 -0.2000
0.5158 -0.388
0.9947
e - d == 0
0.6000
0.5158
1.163
0.7712
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
(Adjusted p values reported -- single-step method)

Se ha encontrados diferencias significativas entre las siguientes comparaciones de medias


de rendimientos:
- Entre la media de los rendimientos obtenidos con la gasolina tipo B y A
- Entre la media de los rendimientos obtenidos con la gasolina tipo C y A
- Entre la media de los rendimientos obtenidos con la gasolina tipo E y A
Entre las otras comparaciones no se ha encontrados diferencias significativas a un nivel de
significacin del 10%

A
6.8

D
8.0

B
8.6

E
8.6

C
8.8

De acuerdo a estos resultados se puede recomendar las gasolina tipo B, E y C por tener los
mayores rendimientos
Prueba de Dunnett (comparaciones de todas las medias de tratamientos con un control o
testigo)
H p : i 1
H a : i 1 , para i 2,

,t

Donde: 1 = es la media del tratamiento testigo o de control


Nivel de significacin
Valor Crtico:

d tDunnet , p, GLE SYi Y1 , para i 2,

,t

donde :
tDunnet , t , GLE = t de Dunnett con un nivel de significacin .
p = nmero de tratamiento a comparar con el control
GLE = Grados de libertad del error

Se rechaza H 0 aun nivel de significacin , si

Yi Y1 d , para i 2,

,t

Ejemplo: En el ejemplo de la gasolina suponga que A es el tratamiento Control. Realice la


prueba de Dunnett a un nivel 0.05
H p : i A

H a : i A , para i B, C, D, E

YA 6.8 ,

SY2i YA

YB 8.6 , YC 8.8 , YD 8.0 , YE 8.6 ;

2CME 2 0.665

0.266
b
5

d tDunnet 0.5, 4,16 SYi YA (2.34)( 0.266) 1.206859

Comparacin

Yi YA

d tDunnet 0.5, 4,16 SYi YA

B-A
C-A
D-A
E-A

1.8
2.0
1.2
1.8

1.206859
1.206859
1.206859
1.206859

> amod<-aov(rendimiento~vehiculo+tipos)
> comptipos<-glht(amod,linfct=mcp(tipos="Dunnett"))
> confint(comptipos)
Simultaneous Confidence Intervals
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Estimated Quantile = 2.7086
95% family-wise confidence level
Linear Hypotheses:
Estimate lwr
upr
b - a == 0 1.8000
0.4030 3.1970
c - a == 0 2.0000
0.6030 3.3970
d - a == 0 1.2000 -0.1970 2.5970
e - a == 0 1.8000
0.4030 3.1970
> summary(comptipos)
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Dunnett Contrasts
Fit: aov(formula = rendimiento ~ vehiculo + tipos)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
b - a == 0
1.8000
0.5158
3.490 0.01017 *
c - a == 0
2.0000
0.5158
3.878 0.00465 **
d - a == 0
1.2000
0.5158
2.327 0.10292
e - a == 0
1.8000
0.5158
3.490 0.01026 *

significativo
significativo
No significativo
significativo

--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1


(Adjusted p values reported -- single-step method)

La prueba de Duncan
Planteamiento de hiptesis
H 0 : i i
Para i i , i, i 1, 2,
H a : i i

,t

Nivel de significacin
Clculo del Valor Crtico:

vd d p, GLE

1
SY Y
2 i i

donde:
d p, GLE =amplitud estudiantizada para la prueba de Duncan

p = nmero de medias muestrales ordenadas de menor a mayor comprendidas entre


ellas inclusive.
GLE = Grados de libertad del error
2CME
SYi Yi
b
Se rechaza H 0 a un nivel de significacin , si
Yi Yi vd

H p : i i

H a : i i para i, i A, B, C, D, E, i i
0.05 ,
CME 0.665
2CME
2*0.665
SYi Yi

0.5157519
b
5
p
2
3
4
5
3.00
3.15
3.23
3.30
d0.05 p,16

Comparacin
B-A
C-A
D-A
E-A

Yi Yi

SYi Yl
1.8
2
1.2
1.8

0.5157519
0.5157519
0.5157519
0.5157519

d0.05 p,16

3
5
2
4

3.15
3.30
3.00
3.23

vd
1.148779
1.203482
1.094075
1.177954

Significancia
significativo
significativo
significativo
significativo

C-B
D-B
E-B
D-C
E-C
E-D

0.2
0.6
0
0.8
0.2
0.6

0.5157519
0.5157519
0.5157519
0.5157519
0.5157519
0.5157519

3
2
2
4
2
3

3.15
3.00
3.00
3.23
3.00
3.15

> library(agricolae)
> anva<-aov(modeg)
> compd<-duncan.test(anva,"tipos")
> compd
$statistics
Mean
CV MSerror
8.16 9.99357
0.665
$parameters
Df ntr
16
5
$Duncan
Table CriticalRange
2 2.997999
1.093345
3 3.143802
1.146519
4 3.234945
1.179757
5 3.297445
1.202550
$means
rendimiento
a
6.8
b
8.6
c
8.8
d
8.0
e
8.6

std
0.8366600
1.1401754
0.8366600
0.7071068
1.1401754

r Min Max
5
6
8
5
7 10
5
8 10
5
7
9
5
7 10

$comparison
NULL
$groups
trt means
1
c
8.8
2
b
8.6
3
e
8.6
4
d
8.0
5
a
6.8

M
a
a
a
a
b

> compd<-duncan.test(anva,"tipos",group=FALSE)
> compd
$statistics
Mean
CV MSerror
8.16 9.99357
0.665
$parameters
Df ntr
16
5

1.148779
1.094075
1.094075
1.177954
1.094075
1.148779

No significativo
No significativo
No significativo
No significativo
No significativo
No significativo

$Duncan
Table CriticalRange
2 2.997999
1.093345
3 3.143802
1.146519
4 3.234945
1.179757
5 3.297445
1.202550
$means
rendimiento
a
6.8
b
8.6
c
8.8
d
8.0
e
8.6

std
0.8366600
1.1401754
0.8366600
0.7071068
1.1401754

$comparison
Difference
a - b
-1.8
a - c
-2.0
a - d
-1.2
a - e
-1.8
b - c
-0.2
b - d
0.6
b - e
0.0
c - d
0.8
c - e
0.2
d - e
-0.6

r Min Max
5
6
8
5
7 10
5
8 10
5
7
9
5
7 10

pvalue sig.
LCL
UCL
0.004810
** -2.9797573 -0.6202427
0.002516
** -3.2025505 -0.7974495
0.033440
* -2.2933451 -0.1066549
0.004019
** -2.9465185 -0.6534815
0.703287
-1.2933451 0.8933451
0.245475
-0.5465185 1.7465185
1.000000
-1.0933451 1.0933451
0.144077
-0.3797573 1.9797573
0.460428
-0.9465185 1.3465185
0.261744
-1.6933451 0.4933451

$groups
NULL

A
6.8

D
8.0

B
8.6

E
8.6

C
8.8

Prueba de t con contraste:


Suponga que se desean probar la Hiptesis
Caso A Bilateral
t

H 0 : Ci i k
i 1
t

H1 : Ci i k
i 1

Caso B Unilateral a la Derecha


t

H 0 : Ci i k
i 1
t

H1 : Ci i k
i 1

Caso C Unilateral a La Izquierda


t

H 0 : Ci i k
i 1
t

H1 : Ci i k
i 1

a un nivel de significacin
Estadstica de Prueba

Qk

bCME Ci2

i 1

i 1

~ tGLE / H 0 es verdadera, siendo Q CiYi. bCiYi.

i 1

Luego,
Decisin
Se Acepta

Caso A

Hp

Se Rechaza

, gle
2

tc t

1 , gle
2

tc t

Hp

, gle
2

tc t

1 , gle
2

Caso B

Caso C

tc t1 ; gle

tc t ; gle

tc t1 ; gle

tc t ; gle

Prueba de Scheff
t

H 0 : Ci i 0 contra
i 1
t

H a : Ci i 0
i 1

Nivel de significacin
Valor Crtico de la prueba

VCS SL

GLTrat F1 ,GLTrat ,GLE

donde:
t

L CiYi.
i 1

S L

t
1
CME Ci2
b
i 1

Se acepta H 0 , si

L VCS
Se rechaza H 0 , si

L VCS

El Mtodo de Bonferroni
Hiptesis:
H 0 : i l
H a : i l , para i l , y i, l 1, 2,

.t

VCB i, l t

Y Y
,GLE i . l .
1
2 nc

donde:

SYi . Yl .
Se rechaza H 0 para i l , y i, l 1, 2,

2CME
b

. t , si

Yi. Yl . VCB i, l

Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de t para probar el siguiente
contraste a un nivel de significacin 0.05 : ( B, C, D, E) versus A.

H p : B C D E 4 A
H a : B C D E 4 A
0.05

T 0.975,16 2.11 , se acepta H p si: 2.12 tc 2.12 caso contrario se rechaza.


5

Q b CiYi 5 4 6.8 18.6 18.8 18.0 18.6 34


i 1

tc

Q
t

bCME C
i 1

Como

2
i

34

5 0.665 4

1 1 1 1
2

tc 2.12 , se rechaza H p .

Con lenguaje R
>
>
>
>
>

vmedia<-tapply(rendimiento,tipos,mean)
ci<-c(-4,1,1,1,1)
q<-5*ci%*%vmedia
tc<-q/sqrt(5*(deviance(modeg)/16)*sum(ci^2))
tc
[,1]
[1,] 4.169348
> pvalue<-2*(1-pt(tc,16))

4.16934

> pvalue
[,1]
[1,] 0.000723429

Ejemplo: Con los datos del ejemplo de gasolina, use la prueba de Scheff para probar el
siguiente contraste a un nivel de significacin 0.05 : ( B, C, D, E) versus A
H p : B C D E 4 A 0

H a : B C D E 4 A 0
0.05

F 0.95,4,16 3.01
t

L CiYi. 4 6.8 18.6 18.8 18.0 18.6 6.8


i 1

L 6.8

S L

VCS SL
Como

t
1
1
2
CME Ci2
0.665 4 12 12 12 12 1.630951
b
5
i 1

GLTrat F1 ,GLTrat ,GLE 1.630951 4 3.01 5.659188

L VCS , se rechaza H p .

Con Lenguaje R
> absl<-abs(ci%*%vmedia)
> absl
[,1]
[1,] 6.8
> sl<-sqrt((1/5)*(deviance(modeg)/16)*sum(ci^2))
> sl
[1] 1.630951
> vcs<-sl*sqrt(4*qf(0.95,4,16))
> vcs
[1] 5.656289

Anlisis de residuales
gasolina<-read.table("c:/datos1/gasolina.txt",T)
rendimiento<-gasolina[,1]
vehiculo<-factor(gasolina[,2])
tipos<-gasolina[,3]
modeg<-lm(rendimiento~vehiculo+tipos)
par(mfrow=c(2,2))
plot(modeg)

7.5

9.0

23

24

-2 -1

Theoretical Quantiles

Scale-Location

Constant Leverage:
Residuals vs Factor Levels

6.0

7.5

9.0

Fitted values

23

-1

-3

1.0

24
23

Standardized residuals

Fitted values

0.0

Standardized residuals

6.0

Normal Q-Q

-2

24

Standardized residuals

0.5

23

-1.5

Residuals

Residuals vs Fitted

vehiculo :
4 3 2

24

5 1

Factor Level Combinations

ri<-rstandard(modeg)
shapiro.test(ri)
Shapiro-Wilk normality test
data: ri
W = 0.9362, p-value = 0.1207
> library(car)
> ncvTest(modeg)
Non-constant Variance Score Test
Variance formula: ~ fitted.values
Chisquare = 3.160140
Df = 1

p = 0.07545673

De acuerdo al grfico de los valores predicho (o valores ajustado) versus los residuos, se
puede observar que conforme los valores predichos aumenta la variabilidad de los residuos
tambin aumenta (en forma de embudo), y tambin se puede observar que el lowes de la
raz cuadrada de valores absolutos de residuales estandarizados (estudentizados
internamente) en funcin de los valores predichos tiene una tendencia sistemtica creciente.
Por ltimo, en el cuarto grfico se puede observar que el nico residuo estandarizado que
sobrepasa los lmites 2 es el de la observacin 3, siendo este el nico valor extremo Todo
esto indica que es probable que no se cumpla con el supuesto de homogeneidad de
variancia. Tambin, el grfico de probabilidad normal de los residuos estandarizado en da
evidencia de que posiblemente el supuesto de normalidad no se cumpla causado
posiblemente por los valor extremo o de las observaciones con residuos estandarizados
cercanos al lmite 2 , pero al realizar la prueba de Shapiro Wild esta se acepta para niveles

de significacin menores a 0.1207. Tambin al realizar la prueba de Homogeneidad de


variancia esta resulta significativa a un nivel de significacin del 10%, esto es que se
encontrado suficiente evidencia para afirmar que no se cumple con este supuesto. Una
alternativa es realizar transformaciones para estabilizar la variancia y realizar el anlisis con
los datos transformados, ya que el incumplimiento de este supuesto hace que las pruebas de
hiptesis realizadas en el ANVA y pruebas de comparacin no tengan validez.

You might also like