You are on page 1of 52

Distribucin F

Esta distribucin probabilstica se utiliza como


estadstico de prueba en varias situaciones. Sirve para
demostrar si dos varianzas muestrales provienen de la
misma poblacin o de poblaciones iguales, y tambin se
aplica cuando se desean comparar simultneamente tres o
ms medias poblacionales. Esta comparacin simultnea de
varias medias poblacionales se denomina Anlisis de
varianza (de anlisis of variance). En estos dos casos, las
poblaciones deben ser normales y los datos deben estar al
menos medidos en escala de intervalo.

Caractersticas de la distribucin F

1. Existe una familia de distribuciones F. Un elemento especfico de la familia


est determinado por dos parmetros: los grados de libertad en el numerador y
los grados de libertad en el denominador.
2. El valor de F no puede ser negativo.
3. La distribucin F es una distribucin continua.
4. La curva que representa una distribucin F tiene un sesgo positivo.
5. Sus valores varan de 0 a . A medida que aumenta el valor de F, la curva se
aproxima al eje X, pero nunca lo toca.

La distribucin F se utiliza para demostrar la hiptesis de que la


varianza de una poblacin normal es igual a la varianza de otra
poblacional normal. As, la prueba es til para determinar si una
poblacin normal tiene o no ms variacin que otra. En los siguientes
ejemplo se muestra el uso de esta prueba:

Dos cizallas se ajustan para producir elementos de acero de la misma


longitud. Por tanto, los elementos tener la misma longitud. Se desea
estar seguro que adems de tener la misma longitud, tengan una
variacin similar.
La tasa media de rendimiento a la inversin de dos tipos de acciones
puede ser la mismo, pero hay ms variacin en el rendimiento de una
que de otra. Una muestra de 10 acciones de industria aeroespacial y 10
acciones de servicios podran mostrar la misma tasa media de
rendimiento, pero es probable que haya ms variacin en el rendimiento
de las acciones aeroespaciales.

Consideraciones de validacin

Al comparar las varianzas de dos poblaciones usaremos datos


reunidos de dos muestras aleatorias independientes, una de la
poblacin 1 y la otra de la poblacin 2. Las dos varianzas de las
muestras, s y s sern la base para hacer inferencias acerca de las
dos varianzas poblacionales y . Siempre que las dos varianzas
poblacionales sean iguales ( = ), la distribucin de la relacin de
las dos varianzas de las muestras s / s es la siguiente:
2
1

2
2

2
1

2
1

2
2

2
2

2
1

2
2

Distribucin muestral de s / s cuando =


2
1

2
2

2
1

2
2

Siempre que se seleccionan muestras aleatorias simples de


tamao n1 y n2 a partir de poblaciones normales con
varianzas iguales, la distribucin de las muestras
s
(9)
s
2
1
2
2

tiene distribucin F con n1 1 grados de libertad para el


numerador y n2 1 grados de libertad para el denominador;
es la varianza de la muestra de los n1 artculos
s
procedentes de la poblacin 1 y s es la de los n2 artculos
procedentes de la poblacin 2.
2
1

2
2

EJEMPLO
La Escuela bancaria va a renovar su contrato de servicio de
autobs escolar para el ao prximo, y debe seleccionar entre
las empresas Transportes rpidos, S.A. y Transportes eficaces,
S.A.. Usaremos la varianza de los tiempos de recepciones que
se tarda en recoger y entregar alumnos como medida principal
de la calidad del servicio. Los valores bajos de varianza indican
que el servicio es ms consistente y de mayor calidad. Si las
varianzas de los tiempos de llegada asociadas con los dos
servicios son iguales, los administradores de la Escuela
bancaria seleccionarn la empresa que ofrezca mejores
condiciones financieras. Sin embargo, si los datos de las
muestras de tiempos de llegada para las dos empresas indican
que hay una gran diferencia entre las varianzas, los
administradores tendrn muy en cuenta a la que tenga menor
varianza del servicio

Las hiptesis de prueba son las siguientes:


H 0 : 12 22
H 1 : 12 22

Si se puede rechazar H , es adecuada la conclusin


de distinta calidad en los servicios. En tal caso, se
preferir a la empresa con menor varianza de la
muestra.
0

Suponga que se har la prueba de hiptesis con =


0.10 y que se obtienen muestras de tiempos de
llegada con escuelas que actualmente usan los
servicios de los dos transportistas. Se obtiene una
muestra de 25 tiempos para los rpidos (poblacin
1) y una de 16 para los eficaces (poblacin 2). La
figura 3 es la grfica de la distribucin F con n1
1 = 24 grados de libertad en el numerador y n2 1
= 15 grados de libertad en el denominador.

Observe que la regin bilateral de rechazo se caracteriza por los valores crticos en F0.95 y F0.05 .
Fig. 3: Regin de rechazo para el ejemplo del autobs para la escuela bancaria con = 0.05

s12
F 2
s2
0.05

F0.95
Se rechaza H0

0.05

F0.05
Se rechaza H0

Suponga que las dos muestras de tiempos de


llegada del autobs produjeron las varianzas s =
48 para los rpidos y s = 20 para los eficaces.
Qu conclusin es la adecuada? Se supone que
las dos poblaciones de tiempos de llegada tienen
distribuciones normales de probabilidad, y que H
es verdadera si = . Se puede aplicar la
distribucin F para llegar a una conclusin.
Especficamente, se calcula F s / s y se emplea la
regin de rechazo que vemos en la figura 3.
2
1

2
2

2
1

2
2

2
1

2
2

De este modo, llegamos a:


s12
48
F 2
2.40
20
s2
Consultando la tabla, vemos que el valor crtico
unilateral superior (de la cola superior) con 24
grados de libertad en el numerador y 15 en el
denominador es F 2.29 . Aunque la tabla no
indica valores F observamos que no es necesaria
la determinacin de este valor crtico unilateral
inferior. Se puede observar que F = 2.40 es mayor
que F 2.29 . Entonces, con un nivel de
significancia de 0.10 se rechaza H0.
0.05

0.95

0.05

Este resultado conduce a la conclusin de que los


dos servicios de autobs son distintos en lo
concerniente a varianzas de tiempos de recepcin
y de llegada. Nuestra recomendacin es que los
administradores de la Escuela bancaria den
consideracin especial al mejor servicio, con
menor varianza, que ofrecen los Transportes
eficaces, S.A.
Tambin se puede usar el criterio del valor p
para una prueba de hiptesis acerca de dos
varianzas poblacionales. Se aplica la regla de
rechazo comn: rechazar H0 si el valor p < . Sin
embargo, al igual que con la distribucin ji
cuadrada, es difcil determinar el valor p
directamente de las tablas de la distribucin F.

Prueba
bilateral
poblaciones

de

la

varianza

H 0 : 12

2
2

H 1 : 12

2
2

de

Se denota la poblacin que tiene la


varianza de la muestra como poblacin 1.

dos

mayor

Estadstico de prueba
s12
F
2
s2

Regla de rechazo
Con el estadstico de prueba: Rechazar

H0

si

F F / 2

Con el valor p
: Rechazar H 0 si el
valor p<
Donde el valor F
se basa en una distribucin F
con n1 1 grados de libertad en el numerador y n2
1 grados de libertad en el denominador.
/2

Prueba unilateral sobre las varianzas de dos poblaciones


H 0 : 12 22
H 1 : 12 22
Se denota la poblacin que tiene la mayor varianza de la muestra como
poblacin 1.

Estadstico de prueba

s12
F 2
s2
Regla de rechazo
Con el estadstico de prueba: Rechazar H 0 si F F
Con el valor p : Rechazar H 0 si el valor p<
Donde el valor F se basa en una distribucin F con n1 1 grados de
libertad en el numerador y n2 1 grados de libertad en el denominador.

Anova
Nocin general
El segundo uso de la distribucin F comprende la tcnica
del anlisis de varianza, que se simboliza por ANOVA.
Bsicamente, en ese anlisis se emplea informacin muestral
para determinar si tres o ms tratamientos producen o no
resultados diferentes. El uso de la palabra tratamiento tiene su
origen en la investigacin agrcola. Se trataron campos con
distintos fertilizantes o fumigantes, para determinar si haba o no
una diferencia global en la productividad. Se probar si cinco
aditivos para la gasolina (los tratamientos) dan o no como
resultado una diferencia en el rendimiento en millas por galn.
Adems se explotar la siguiente pregunta: Los cuatros mtodos
de entrenamiento (los tratamientos) son igualmente efectivos?

Tratamiento: Causa o fuente especfica de


variacin en un conjunto de datos.

Consideraciones en que se basa la prueba


ANOVA
Antes de realizar una prueba utilizando la tcnica ANOVA se
examinarn las consideraciones en que se basa la prueba. Si no
pueden cumplirse las consideraciones siguientes, es posible
aplicar otra tcnica de anlisis de varianza (que desarrollaron
Kruskal y Wallis).

1.Las tres o ms poblaciones de inters estn distribuidas


normalmente.
2.Tales poblaciones tienen desviaciones estndar iguales.
3.Las muestras que se seleccionan de cada una de las
poblaciones son aleatorias e independientes, es decir, no estn
relacionadas entre s.

Ejemplo
Suponga que renunci el gerente de la sucursal de
Los Olivos de la cadena de tiendas comerciales Metro, y
se considera que tres vendedores pueden ocupar este
puesto. Los tres tienen la misma antigedad, educacin,
etc. Para tomar una decisin, el gerente de personal, sugiri
examinar los registros de ventas mensuales de cada uno.

En la siguiente tabla se muestran los resultados maestrales de las ventas por mes:
Ventas mensuales ($ 000)

Media muestral:

Sr. Quiroz

Sr. Huarote

Sr. Martnez

15
10
9
5
16
11

15
10
12
11
12
12

19
12
16
16
17
16

En este problema los vendedores son los tratamientos.

H 0 : 1 2 3

La hiptesis nula expresa que no


hay diferencia significativa entre las ventas
medias de los tres vendedores.
H 1 : Plantea

que al menos una media es diferente.

Se seleccion un nivel de significancia =


0.05.
El estadstico de prueba adecuado es la
distribucin F. Este procedimiento se basa en
varias consideraciones: 1) Los datos deben estar al
menos en nivel de intervalo; 2) La seleccin real
de las ventas debe hacerse utilizando un
procedimiento de tipo probabilstico; 3) La
distribucin de las venta mensuales para cada una
de las poblaciones es normal y 4) Las varianzas de
las tres poblaciones son iguales, es decir,
.
2
1

2
2

2
3

F es la razn de dos varianzas:


F

Varianza poblaciona l estimada segn var iacin entre medias muestrales


Varianza poblaciona l estimada segn la var iacin en las muestras

La terminologa comn para el numerador es


varianza entre muestras. Para el denominador
es varianza en las muestras. El numerador
tiene k 1 grados de libertad. El denominador tiene
N k grados de libertad; donde k es el nmero de
tratamientos y N es el nmero de observaciones.

Para este problema relativo a un nuevo gerente de


almacn, hay tres tratamientos (vendedores), por lo que
se tiene k 1 = 3 1 = 2 g.l. en el numerado. Hay 15
observaciones (tres muestras de cinco cada una), por
tanto, hay N k = 15 3 = 12 g.l. en el denominador.
El valor crtico, esto es, el punto divisorio entre la regin de
aceptacin y la de rechazo, se obtiene consultando la
tabla correspondiente. Ese nmero es 3.89, y es el valor
crtico de F para el nivel 0.05.

Al utilizar el nivel predeterminado de 0.05, la regla de


decisin es aceptar la hiptesis nula si el valor calculado de
F es menor que o igual a 3.89; se rechaza la hiptesis nula
y se acepta la alternativa, si el valor calculado de F es
mayor que 3.89.
Para calcular F y tomar una decisin, el primer paso
es organizar una tabla ANOVA. Esta es slo una forma
conveniente de registrar la suma de cuadrados y otros
clculos. El formato general para un problema de anlisis
de varianza en un sentido se muestra en la siguiente tabla:

Fuente de
variacin
Entre
tratamientos
Error (en los
tratamientos)
Total

Grados
Suma de
de
Cuadrados
cuadrados libertad
medios
SST/k-1=
SST
k-1
MSTR
SSE/N-k =
SSE
N-k
MSE
Total SS
SST
MSTR
F k 1
SSE
MSE
N k

en donde:
MSTR: cuadrado medio entre tratamientos.
MSE : cuadrado medio debido al error. Tambin se denomina cuadrado
medio dentro de tratamiento.
SST : suma de cuadrados de tratamiento.

Se obtiene mediante la siguiente frmula:


2
Tc2 ( X )
SST

N
nc

en donde:
: indica elevar al cuadrado el total de cada columna
(el subndice c se refiere a la columna)
es el nmero de observaciones para cada
n :
tratamiento respectivo (columna). Hay cinco cifras de
ventas para el Sr. Quiroz, cinco para el Sr. Huarote y
cinco para el Sr. Martnez.
X : es la suma de todas las observaciones (ventas). Es
$ 195.
k : es el nmero de tratamientos (vendedores). Hay
tres.
N : es el nmero total de observaciones. Hay 15.
Tc2

Sr. Quiroz

Totales de columna:
Tamao de muestra
Suma de cuadrados

Sr. Huarote

X1

2
1

15
10
9
5
16
55
5

225
100
81
25
256

687

Sr. Martnez

X2

2
2

X3

X 32

15
10
12
11
12
60
5

225
100
144
121
144

19
12
16
16
17
80
5

361
144
256
256
289

734

1306

Total
195
15
2727

Clculo de SST

Tc2 ( X )
(55) 2 (60) 2 (80) 2 (195)
SST

2,605 2,535 70

n
N
5
5
5
15

c
2

Clculo de SSE

Tc2
SSE X 2,727 2,605 122
nc
2

La variacin total (Total SS) es la suma de la variacin entre columnas y entre renglones; es decir,
Total SS = SST + SSE = 70 + 122 = 192.

Verificacin

( X 2 )

(195) 2
Total SS X
2,727
2,727 2,535 192
N
15
Las tres sumas de cuadrados y los clculos necesarios para determinar F, se presentan en el
siguiente cuadro:
2

Fuente de
variacin
Entre tratamientos
Error (en los tratamientos)
Total SS

Suma de
cuadrados
SST= 70
SSE=122
Total SS=192

Grados de
libertad
k 1=3-1=2
N k=15-3=12

Clculo de F

SST
MSTR 35
F k 1

3.44
SSE
MSE 10.17
N k

Cuadrados
medios
70/2=35 = MSTR
122/12 =10.17= MSE

La regla de decisin indica que si el valor calculado de F es


menor que o igual al valor crtico de 3.89, la hiptesis nula
se acepta. Si el valor de F es mayor que 3.89, la hiptesis
nula se rechaza y la hiptesis alternativa se acepta. Puesto
que 3.44 < 3.89, la hiptesis nula se acepta al nivel 0.05. En
otras palabras, las diferencias en las ventas medias
mensuales ($11,000, $12,000 y $16,000) se atribuyen al azar
(muestreo). Desde el punto de vista prctico, los niveles de
ventas de los tres vendedores que se consideran para el
puesto de gerente de almacn son iguales. No puede tomarse
una decisin respecto al puesto, con base en las ventas
mensuales

Ejemplo
Un profesor pidi a los estudiantes de un grupo grande del curso de
estadstica que evaluara su desempeo en el curso como 1 (excelente),
2 (bueno), 3 (aceptable) o 4 (deficiente). Un ayudante del profesor
recolect las evaluaciones y asegur a los estudiantes que el profesor
no las recibira hasta despus que las calificaciones del curso se
hubieran ingresado en la Direccin Acadmica. La evaluacin (el
tratamiento) que un estudiante asign al profesor se compar con su
calificacin final del curso. Lgicamente, se esperara que en general, el
grupo de estudiantes que pens que el profesor era excelente tuvieran
una calificacin promedio final del curso significativamente ms alta que
los alumnos que lo evaluaron como bueno, aceptable o regular, o
deficiente. Tambin se esperara que los alumnos que lo evaluaron
como deficiente tuvieran las calificaciones promedio ms bajas.

Se seleccionaron muestras de cada grupo de evaluacin. Los resultados son:


Excelente
94
90
85
80

Bueno
75
68
77
83
88

Regular
70
73
76
78
80
68
65

Deficiente
68
70
72
65
74
65

La pregunta es si existe o no una diferencia estadstica entre la puntuacin media de los


cuatro grupos.

Se seleccion el nivel de significacin 0.01.

La regla de decisin es que la hiptesis nula, que plantea que no


hay diferencia entre las medias, no se rechazar si el valor
calculado de F es menor que el valor crtico. De otra manera, la
hiptesis nula se rechazar y se aceptar la hiptesis alternativa.

Recurdese que los grados de libertad en el numerador de la


razn F se obtienen por k 1, donde k es el nmero de
tratamientos (grupos de evaluacin del profesor). Hay cuatro
tratamientos, de manera que 4 1 = 3 g.l. Los grados de libertad
en el denominador son en total 18, que se obtienen mediante N
k, en donde N es el nmero total de estudiantes en la muestra.
Hay 22 estudiantes, por lo que 22 4 = 18 g.l.
Obsrvese que el valor crtico de F es 5.09, de acuerdo al
valor indicado en la tabla correspondiente. La regla de decisin
ser: acepte la hiptesis nula al nivel 0.01 si el valor calculado de
F es menor que o igual a 5.09, y rechace la hiptesis nula si el
valor calculado es mayor que 5.09.

Los clculos necesarios para determinar la razn F se muestran en la siguiente tabla:

Excelente

X1
94
90
85
80

Tc

8836
8100
7225
6400

Bueno

X2
75
68
77
83
88

Aceptable
2
2

5625
4624
5929
6889
7744

X3
70
73
76
78
80
68
65

2
3

4900
5329
5776
6084
6400
4624
4225

Deficiente

X4

X 42

68
70
72
65
74
65

4624
4900
5184
4225
5476
4225

349

391

510

414

nc

2
1

30561

30811

37338

28634

Ntese que la suma de los totales por columna ( xi ) es 1 664; el total de los tamaos de
muestras (N) es 22; y la suma de los cuadrados 127344.
Calculando SST, SSE y total SS, se obtiene:
2
Tc2 ( X )
(349) 2
(391) 2
(510) 2
(414) 2 (1664) 2
SST

890.68

N
4
5
7
6
22

nc
T 2
SSE X 2 c 127344 126749.59 594.41
nc

Total SS = SST + SSE = 890.68 + 594.41 = 1485.09


Como verificacin:

Total SS

( X 2 )
N

127344

(1664) 2
127344 125858.9 1485.09
22

Estos valores se colocan en la tabla ANOVA:


Fuente de
variacin
Tratamiento (entre columnas)
Error (entre renglones)
Total SS

Suma de
cuadrados
SST= 890.68
SSE=594.41
Total SS=1485.09

Grados de
Cuadrados
libertad
medios
k 1=4-1=3 890.68/3=296.89 MSTR
N k=22-4=18 594.41/18 =33.02= MSE

Introduciendo los cuadrados medios en la frmula de F, se obtiene:


F

MSTR 296.89

8.99
MSE 33.02

La decisin: como el valor calculado de F de 8.99 es


mayor que el valor crtico de 5.09, la hiptesis nula de
que no existe diferencia entre las medias se rechaza al
nivel 0.01. Bsicamente esto indica que es muy
probable que las diferencias observadas entre las
medias no se deban al azar. Desde el punto de vista
prctica, se sugiere que las calificaciones que
obtuvieron los estudiantes en un curso estn
relacionadas con las opiniones que tienen de la
capacidad general y la forma como se conduce en clase
el profesor.

Inferencias acerca de las medias de


tratamiento
Supngase que al aplicar el procedimiento ANOVA,
se decide rechazar la hiptesis nula. Esto permite concluir
que todas las medias de tratamiento no son iguales. Algunas
veces esta conclusin puede considerarse satisfactoria, pero
en otros casos se desea saber cules medias de tratamiento
son diferentes.
En este ejemplo, la hiptesis nula se rechaz y la
alternativa se acept. Si las opiniones de los estudiantes
son en realidad diferentes, la pregunta es: Entre qu
grupos difieren las medias de tratamiento?
Existen varios procedimientos para responder esta
pregunta. Tal vez el ms sencillo es mediante el uso de
niveles de confianza.

La distribucin t se utiliza como base para esta


prueba. Recurdese que una suposicin bsica
de ANOVA es que las varianzas poblacionales
son iguales para todos los tratamientos. Como
se observ, este valor poblacional comn se
denomina error cuadrado medio (MSE) que
se obtiene mediante SSE/(N-k).

Un intervalo de confianza para la diferencia entre dos medias poblacionales


se logra mediante:
1 1
( x1 x2 ) t MSE
n1 n2

: es la media del primer tratamiento.


x 2 : es la media del segundo tratamiento
t : se obtiene a partir del la tabla t. Los grados de libertad son N k.
MSE : es el error cuadrado medio que se obtiene a partir de la tabla
ANOVA.
n1 : es el nmero de observaciones en el primer tratamiento.
n2 : es el nmero de observaciones en el segundo tratamiento.
x1

Si el intervalo de confianza incluye al 0, se


concluye que no hay diferencia en el par de medias de
tratamiento. Sin embargo, si ambos extremos del intervalo
de confianza tienen el mismo signo, esto indica que las
medias de tratamiento son diferentes.
Utilizando el ejemplo anterior acerca de las
opiniones de estudiantes y el nivel de confianza de 0.95,
los extremos del intervalo de confianza son 10.46 y 26.04,
que se obtienen por:

1 1
( x1 x2 ) t MSE
n1 n2
1 1
(87.25 69.00) 2.101 33.0
4 6
18.25 7.79
10.46 y 26.04
Se conoce que el intervalo de confianza de 95% vara de 10.46 hasta 26.04. Ambos extremos
son positivos; en consecuencia, podemos concluir que estas medias de tratamiento difieren
significativamente. Es decir, los estudiantes que evaluaron al profesor como excelente tienen
calificaciones ms altas que los que lo evaluaron como malo.

Precaucin
La investigacin de diferencias de medias
de tratamiento es un proceso secuencial. El
paso inicial es realizar la prueba ANOVA.
Slo si se rechaza, la hiptesis nula de que
la medias de tratamiento son iguales, debe
intentarse llevar a cabo cualquier anlisis
de las medias de tratamiento

ANOVA en dos sentidos


Una compaa de autobuses, est ampliando el
servicio desde el centro de Lima al Aeropuerto por cuatro
rutas diferentes. La Empresa realiz recorridos de prueba
para determinar si hay diferencia significativa en los tiempos
medios del trayecto en las cuatro rutas. Los tiempos del
trayecto en minutos en cada una de las cuatro rutas se
muestran a continuacin:

Da
Lunes
Martes
Mircoles
Jueves
Viernes

Tiempo del recorrido del Centro al Aeropuerto


Ruta 1
Ruta 2
Ruta 3
Ruta 4
18
20
20
22
21
22
24
24
20
23
25
23
25
21
28
25
26
24
28
25

Al nivel de significancia 0.05, puede concluirse que hay diferencia en las cuatro rutas?
Existe una diferencia dependiendo de qu da de la semana se trata?

En este caso, el da de la semana se denomina variable de bloque. En consecuencia, se tiene


variacin debida al tratamiento y debida a los bloques. La suma de cuadrados debida a los bloques
(SSB) se calcula como sigue:
2
Br2 ( x)
SSB
N
k
en donde Br se refiere al total del bloque, es decir, al total de cada rengln, y k es el nmero de
elementos en cada bloque.
El mismo formato que sirve para el caso de ANOVA en un sentido se utiliza para la tabla
ANOVA en dos sentidos. Los totales de SST y SS se calculan igual que antes. SSE se obtiene por
sustraccin (SSE = Total SS SST SSB). En la siguiente tabla se muestran los clculos necesarios:

Tiempo de viaje, por ruta (minutos)


Da
Lunes
Martes
Mircoles
Jueves
Viernes
Totales por
columna, Tc
Suma de
cuadrados
Tamao de la
muestra nc

Suma de
renglones Br
80
91
91
99
103

Ruta 1
18
21
20
25
26

Ruta 2
20
22
23
21
24

Ruta 3
20
24
25
28
28

Ruta 4
22
24
23
25
25

110

110

125

119

464

2446

2430

3169

2839

10904

20

Totales

Anlogo a la tabla ANOVA para un anlisis en un sentido, el formato general en dos sentidos
es:
Fuente de variacin

Suma de cuadrados

Grados libertad

Tratamientos

SST

k-1

Bloque

SSB

n -1

Error

SSE

(k-1)(n-1)

Total

Total SS

Cuadrado medio

SST
MSTR
k 1
SSB
MSB
n 1
SSE
MSE
(k 1)(n 1)

Como antes, para calcular SST:


2
Tc2 ( X )
(110) 2 (110) 2 (125) 2 (119) 2 (464) 2
SST

32.4

n
N
5
5
5
5
20

SSB se obtiene mediante:


2
Br2 ( x)
(80) 2 (91) 2 (91) 2 (99) 2 (103) 2 (464) 2
SSB

78.2
N
4
4
4
4
4
20
k

Los dems trminos de suma de cuadrados son:

( X 2 )

(464) 2
Total SS X
10904
139.2
N
20
SSE = Total SS SST SSB=139.2 32.4 78.2 = 28.6
2

Los valores para los diferentes componentes de la tabla ANOVA se calculan de la siguiente manera:
Fuente de variacin

Suma de cuadrados

Grados libertad

Tratamientos

32.4

Bloque

78.2

Error

28.6

12

Total

139.0

Cuadrado medio

32.4
10.8
3
78.2
19.55
4
28.6
2.38
12

1.- H 0 : 1 2 3 4 . Las medias de tratamiento son iguales.

H 1 : Las medias de tratamiento no son iguales.

2.- H 0 : 1 2 3 4 5 . Las medias de bloques son iguales.


H 1 : Las medias de bloques no son iguales.

Primero se demostrar la hiptesis sobre las medias de tratamiento. Hay k 1 = 4 1 = 3 grados de


libertad en el numerador y (k 1) (n 1) = (4 1) (5 1) = 12 grados de libertad en el
denominador. Al nivel de significancia 0.05, el valor crtico de F es 3.49. La hiptesis nula de que
los tiempos medios para las cuatro rutas son iguales se rechaza si la razn F es mayor que 3.49.
MSTR 10.8
F

4.54
MSE 2.38

La hiptesis nula se rechaza y se acepta la hiptesis alternativa. Se concluye que el tiempo


promedio de trayecto no es igual para todas las rutas. La empresa desea efectuar algunas pruebas
para determinar qu medias de tratamiento difieren.

A continuacin, se hace una prueba para determinar si el tiempo del trayecto es igual para
diferentes das de la semana. Los grados de libertad en el numerador para bloques es n 1 = 5 1 =
4. Los grados de libertad en el denominador son igual que antes, es decir, 12. La hiptesis nula de
que las medias de bloques son iguales se rechaza si la razn F es mayor que 3.26.
MSB 19.55
F

8.21
MSE 2.38
La hiptesis nula se rechaza, y la hiptesis alternativa se acepta. El tiempo promedio del
trayecto no es igual para los diferentes das de la semana.

En MINITAB los resultados son los siguientes:


Two-way Analysis of Variance
Analysis of Variance for Tiempos
Source
DF
SS
MS
rutas
3
32.40
10.80
dias
4
78.20
19.55
Error
12
28.60
2.38
Total
19
139.20
rutas
1
2
3
4

Mean
22.00
22.00
25.00
23.80

F
4.53
8.20

P
0.024
0.002

Individual 95% CI
----+---------+---------+---------+------(---------*---------)
(---------*---------)
(---------*---------)
(---------*---------)
----+---------+---------+---------+------21.00
22.50
24.00
25.50

dias
1
2
3
4
5

Mean
20.00
22.75
22.75
24.75
25.75

Individual 95% CI
-------+---------+---------+---------+---(------*------)
(------*------)
(------*------)
(------*------)
(------*------)
-------+---------+---------+---------+---20.00
22.50
25.00
27.50

Estadstica para Administracin y Economa, Mason y Lind

You might also like