You are on page 1of 74

Análisis de Varianza (ANOVA)

Dr. Edwin Asnate Salazar

11-1
Objetivos del Aprendizaje
En este Capítulo aprenderemos:
 Conceptos básicos de diseño experimental.
 Como usar ANOVA de Una Vía para probar diferencias entre
medias de varias poblaciones (conocido tambien como “grupos” )
 Como usar ANOVA de Dos Vías e interpretar el efecto de la
interaccón
 Cómo realizar comparaciones múltiples en Anova de una y dos
vías.

Dr. Edwin Johny Asnate Salazar-UNASAM 11-2


Resumen
Análisis de Varianza (ANOVA)

Diseño de
ANOVA Bloques ANOVA
Una Vía Aleatorios Dos Vías
Prueba F
Comparaciones Efecto de las
múltiples Interacciones
Tukey-
Kramer De Tukey
Comparaciones
Comparaciones
múltiples
múltiples
Prueba de De Tukey
Levene para
Homogeniedad
de Varianza
Dr. Edwin Johny Asnate Salazar-UNASAM 11-3
Marco General del ANOVA

 El Investigador controla una o más factores de interés


 Cada factor tiene dos o más niveles

 Los niveles pueden ser numéricas o categóricas

 Diferentes niveles producen diferentes grupos

 Pensar de cada grupo como una muestra de una

población diferente
 Observar efectos sobre la variable dependiente
 ¿Los grupos son los mismos?

 Diseño experimental: El plan usado para recoger los


datos.

Dr. Edwin Johny Asnate Salazar-UNASAM 11-4


Diseño completamente aleatorizado

 Las unidades experimentales (Sujetos) se


asignan aleatoriamente a los grupos.
 Se asume homogeniedad entre los Sujetos.
 Solo un factor o variable independiente
 Con dos o más niveles
 Conocido como Análisis de varianza de un
factor (ANOVA)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-5


Análisis de Varianza de un factor
 Evaluar la diferencia entre las medias de tres o más
grupos
Ejemplo: Un limpiador multiusos es exhibido en tres lugares (Cerca
del pan, Cerca de las cervezas, Con otros limpiadores) dentro de
varios supermercados (en botellas de 12 onzas), se quiere ver la
diferencia entre el número medio de botellas vendidas en los tres
lugares.
 Supuestos
 Las poblaciones se distribuyen normalmente

 Las poblacionese tienen varianzas iguales

 Las muestras son seleccionadas aleatoriamente

y de manera independiente
Dr. Edwin Johny Asnate Salazar-UNASAM 11-6
Supuestos del ANOVA

Dr. Edwin Johny Asnate Salazar-UNASAM 11-7


Hipótesis de ANOVA de un factor

 H0 : μ1  μ2  μ3    μc
 Todas las medias poblacionales son iguales
 i.e., No hay efecto del factor (no hay variación entre
las medias de los grupos)

 H1 : No todas las medias poblacionales son iguales


 Por lo menos una media de la población es diferente
 i.e., Hay un efecto del factor
 Eso no significa que todas las medias poblacionales
son diferentes (algunos pares pueden ser iguales)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-8


ANOVA de una Factor
H0 : μ1  μ2  μ3    μc
H1: No todas las μ j son iguales
La Hipótesis Nula es
verdadera
Todas las medias son iguales:
(No hay efecto del Factor)

μ1  μ 2  μ 3
Dr. Edwin Johny Asnate Salazar-UNASAM 11-9
ANOVA de una Factor
(continua)
H0 : μ1  μ2  μ3    μc
H1: No todas las μ j son iguales
La Hipótesis Nula no es verdadera
Al menos una de las medias es diferente
(Esta presente el efecto del Factor)

μ1  μ2  μ3 μ1  μ2  μ3
Dr. Edwin Johny Asnate Salazar-UNASAM 11-10
Partición de la Variación

 La Variación Total se puede dividir en dos partes:

SST = SSA + SSW

SST = Suma de cuadrados total


(Variación Total)
SSA = Suma de cuadrados entre los grupos
(Variación entre-grupos)
SSW = Suma de cuadrados dentro de los Grupos
(Variación intra-grupos)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-11


Partición de la Variación
(continua)

SST = SSA + SSW


Variación Total = La variación total de los valores de los
datos individuales a través de los diversos niveles del
factor (SST)
Variación Entre-Grupos = Variación entre las medias
muestrales del factor (SSA)

Variación Intra-Grupos = Variación que existe entre los


valores de los datos dentro de un nivel del factor (SSW)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-12


Partición de la Variación Total

Variación Total (SST)

Variación Debido Variación debido a un


= al Factor (SSA) + Error Aleatorio (SSW)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-13


Suma de Cuadrados Total
SST = SSA + SSW
c nj

SST   ( Xij  X) 2

Donde: j1 i1

SST = Suma de cuadrados Total


c = número de grupos o niveles
nj = número de observaciones en el grupo j
Xij = isima observación del grupo j
X = gran media (media de todos los valores de los datos)
Dr. Edwin Johny Asnate Salazar-UNASAM 11-14
Variación Total
(continua)

2 2 2
SST  ( X 11  X )  ( X 12  X )      ( X cn  X )
c

Respuesta, X

Grupo 1 Grupo 2 Grupo 3

Dr. Edwin Johny Asnate Salazar-UNASAM 11-15


Variación Entre-Grupos
SST = SSA + SSW
c
SSA   n j ( X j  X) 2

j1
Donde:
SSA = Suma de cuadradores entre grupos
c = número de grupos
nj = Tamaño de muestra del grupo j
Xj = Media de la muestra del grupo j
X = gran media (media de todos los valores)
Dr. Edwin Johny Asnate Salazar-UNASAM 11-16
Variación Entre-Grupos
(continua)
c
SSA   n j ( X j  X) 2

j1

SSA
Variación debido a la
MSA 
diferencia entre Grupos
c 1
Cuadrado medio entre
grupos = SSA/grados de
libertad

i j

Dr. Edwin Johny Asnate Salazar-UNASAM 11-17


Variación Entre -Grupos
(continua)

SSA  n1 (X1  X)  n 2 (X 2  X)      n c (Xc  X)


2 2 2

Respuesta, X

X3
X2 X
X1

Grupo 1 Grupo 2 Grupo 3


Dr. Edwin Johny Asnate Salazar-UNASAM 11-18
Variación Intra-Grupo
SST = SSA + SSW
c nj

SSW    ( Xij  X j ) 2

j1 i1
Donde:
SSW = Suma de cuadrados intra grupos
c = número de grupos
nj = Tamaño de muestra del grupo j
Xj = Media muestral del grupo j
Xij = isima observacion en el grupo j
Dr. Edwin Johny Asnate Salazar-UNASAM 11-19
Variación Intra-Grupo
(continua)

c nj

SSW    ( Xij  X j )2
j1 i1
SSW
En resume la variación dentro
MSW 
de cada grupo sumados en
forma conjunta nc
Cuadrado medio intra-
grupos = SSW/grados de
libertad

μj
Dr. Edwin Johny Asnate Salazar-UNASAM 11-20
Variación Intra-Grupo
(continua)

SSW  (X11  X1 )  (X12  X 2 )      (X cn c  X c )


2 2 2

Respuesta, X

X3
X2
X1

Grupo 1 Grupo 2 Grupo 3


Dr. Edwin Johny Asnate Salazar-UNASAM 11-21
Obteniendo los cuadrados medios
Los cuadrados medios se obtienen dividiendo las sumas
de cuadrados medios y sus grados de libertad asociados

SSA Cuadrado medio entre


MSA  (d.f. = c-1)
c 1
SSW
MSW  Cuadrado medio Intra
nc (d.f. = n-c)

SST
MST  Cuadrado Medio Total
n 1 (d.f. = n-1)
Dr. Edwin Johny Asnate Salazar-UNASAM 11-22
Tabla ANOVA de un factor

G.L Suma de Cuadrado


Fuente de medio F
Variación Cuadrados
(Varianza)

Entre SSA FSTAT =


c-1 SSA MSA =
Grupos c-1
MSA
Intra SSW
n-c SSW MSW = MSW
Grupos n-c

Total n–1 SST

c = número de grupos
n = suma de los tamaños muestrales de todos los grupos
G.L = grados de libertad
Dr. Edwin Johny Asnate Salazar-UNASAM 11-23
ANOVA de una Factor:
Prueba F
H0: μ1= μ2 = … = μc
H1: Al menos dos medias poblacionales son diferentes

 Estadístico F MSA
FSTAT 
MSW
MSA es el cuadrado medio entre grupos
MSW es el cuadrado medio intra grupos
 Grados de libertad
 G.L1 = c – 1 (c = número de grupos)
 G.L2 = n – c (n = suma de tamaños muestrales de las poblaciones)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-24


Interpretando ANOVA de un factor
Prueba F
 El estadístico F es el cociente entre la
estimacion de la varianza entre y intra de
los grupos
 Este cociente siempre debe ser positivo
 GL1 = c -1 típicamente será pequeña
 GL2 = n - c típicamente será grande

Regla de Decisión:
 Rechazar H0 si FSTAT > 
Fα, otros casos no
rechazar H0 0 No
Rechazar H0
rechazar H0


Dr. Edwin Johny Asnate Salazar-UNASAM 11-25
ANOVA de una factor, ejemplo:

Queremos ver si tres campos Club 1 Club 2 Club 3


de golf diferentes producen 254 234 200
diferentes distancias. Se 263 218 222
selecciona al azar 5 241 235 197
mediciones realizadas por 237 227 206
una maquina automatica de 251 216 204
cada club. al 5% de nivel de
significancia, ¿hay alguna
diferencia en la distancia
media?

Dr. Edwin Johny Asnate Salazar-UNASAM 11-26


Anova de un factor, Ejemplo:
Gráfico de dispersión
Distancia
Club 1 Club 2 Club 3 270
254 234 200 260 •
263 218 222 ••
241 235 197
250 X1
240 •
237 227 206 • ••
251 216 204 230
• X
220
••
X2 •
210
x1  249.2 x 2  226.0 x 3  205.8
•• X3
200 ••
x  227.0 190

1 2 3
Dr. Edwin Johny Asnate Salazar-UNASAM Club 11-27
Anova de un factor, Ejemplo:
Cálculos:
Club 1 Club 2 Club 3 X1 = 249.2 n1 = 5
254 234 200 X2 = 226.0 n2 = 5
263 218 222
X3 = 205.8 n3 = 5
241 235 197
237 227 206 n = 15
X = 227.0
251 216 204 c=3
SSA = 5 (249.2 – 227)2 + 5 (226 – 227)2 + 5 (205.8 – 227)2 = 4716.4
SSW = (254 – 249.2)2 + (263 – 249.2)2 +…+ (204 – 205.8)2 = 1119.6

MSA = 4716.4 / (3-1) = 2358.2 2358.2


FSTAT   25.275
MSW = 1119.6 / (15-3) = 93.3 93.3

Dr. Edwin Johny Asnate Salazar-UNASAM 11-28


Anova de un factor, Ejemplo:
Solución:
H0: μ1 = μ2 = μ3 Prueba estadística:
H1: μj no todos son iguales
MSA 2358.2
 = 0.05 FSTAT    25.275
df1= 2 df2 = 12 MSW 93.3

Valor Decisión:
crítico:
Rechazar H0 con  =0.05
Fα = 3.89
 = .05 Conclusión:
Existe evidencia de que
0 No
Rechazar H
Rechazar H 0 al menos un μj difiere
0

FSTAT = 25.275 del resto


Fα = 3.89
Dr. Edwin Johny Asnate Salazar-UNASAM 11-29
El procedimiento de Tukey-Kramer

 Asumimos que los promedios poblacionales


son significativamente diferentes
 Es decir: μ1 = μ2  μ3
 Se realiza después de rechazar la hipotesis de
igualdad en el ANOVA
 Permite comparaciones por pares
 Compara las diferencias medias absolutas con un
valor crítico

μ1= μ2 μ3 x

Dr. Edwin Johny Asnate Salazar-UNASAM 11-30


Valor Crítico Tukey-Kramer

MSW  1 1 
Valor Crítico  Q   
2  n j n j' 

Donde:
Qα = Valor crítico de la cola superiros de la distribución T-
Studen con c y n - c G.L
MSW = Cuadrado medio Intra-grupos
nj y nj’ = Tamaño de muestra de los grupos j and j’

Dr. Edwin Johny Asnate Salazar-UNASAM 11-31


Procedimiento de Tukey-Kramer:
Ejemplo
1. Cáclulo de las diferencias
Club 1 Club 2 Club 3 absolutas de las medias:
254 234 200
263 218 222 x1  x 2  249.2  226.0  23.2
241 235 197 x1  x 3  249.2  205.8  43.4
237 227 206
251 216 204 x 2  x 3  226.0  205.8  20.2

2. Encontrar Qα valor con c = 3 y (n – c) = (15 – 3) = 12


grados de libertad:

Qα  3.77
Dr. Edwin Johny Asnate Salazar-UNASAM 11-32
Procedimiento de Tukey-Kramer:
Ejemplo
(continua)
3. Calcular Valor crítico:
MSW  1 1  93.3  1 1 
Valor Crítico  Q     3.77     16.285
2  n j n j'  2 5 5

4. Comparar:
5. Todas las diferencias medias
absolutas son mayores que el valor x1  x 2  23.2
crítico. Por lo tanto hay una diferencia
significativa entre cada par de x1  x 3  43.4
promedio a un 5% de nivel de
significancia. Así, con una confianza de x 2  x 3  20.2
95% podemos concluir que la distancia media
para el club 1 es mayor al del club 2 y 3, y del
club 2 es mayor al club 3.

Dr. Edwin Johny Asnate Salazar-UNASAM 11-33


Supuestos del ANOVA

 Aleatoriedad y Independencia
 Selección aleatoria de las muestras de los c grupos
(o asignar al azar a los niveles)
 Normalidad
 Los valores muestrales para cada grupo son de una
población normal
 Homogeniedad de Varianza
 Todas las poblaciones muestreadas tienen la misma
varianza
 Puede ser probado con la pueba de Levene

Dr. Edwin Johny Asnate Salazar-UNASAM 11-34


Supuestos de la prueba de
Levene en ANOVA

 El supuesto para la prueba es que las varianzas de


cada población son iguales.
 Primero definir la Hipótesis Nula y Alterna:
 H0: σ21 = σ22 = …=σ2c
 H1: No todas las σ2j son iguales
 En segundo lugar, calcular el valor absoluto de la
diferencia entre cada valor y la mediana de cada grupo.
 En tercer lugar, realizar un ANOVA de una factor de
estas diferencias absolutas.

Dr. Edwin Johny Asnate Salazar-UNASAM 11-35


Ejemplo de Prueba de
Homogeneidad con Levene Ejemplo

H0: σ21 = σ22 = σ23


H1: No todas las σ2j son iguales

Calcular las Medianas Calcular las diferencias Absolutas

Club 1 Club 2 Club 3 Club 1 Club 2 Club 3


237 216 197 14 11 7
241 218 200 10 9 4
251 227 204 Mediana 0 0 0
254 234 206 3 7 2
263 235 222 12 8 18

Dr. Edwin Johny Asnate Salazar-UNASAM 11-36


Ejemplo de Prueba de
Homogeneidad con Levene Ejemplo
(continua)
Anova: De un Factor
Resumen
Grupos Count Sum Average Variance
Puesto que el
Club 1 5 39 7.8 36.2 p-valor es
Club 2 5 35 7 17.5 mayor que
Club 3 5 31 6.2 50.2 0.05, No hay
suficiente
evidencia de
Source of Variation SS df MS F P-valor F crit
una
Between Groups 6.4 2 3.2 0.092 0.912 3.885
diferencias en
Within Groups 415.6 12 34.6 las varianzas

Total 422 14

Dr. Edwin Johny Asnate Salazar-UNASAM 11-37


Diseño Factorial:
ANOVA de dos Vías

 Examina el efecto de:


 Los dos factores de interes sobre la variable
dependiente
 Ejemplo:, Porcentaje de carbonatación y la velocidad
de embotellamiento de un refresco.
 Interacción entre los diferentes niveles de estos
dos factores
 Ejemplo, ¿Tiene efecto un nivel de carbonatación en
particular sobre un nivel de velocidad de
embotellamiento?

Dr. Edwin Johny Asnate Salazar-UNASAM 11-38


ANOVA de Dos Vías
(continua)

 Aleatoriedad y Independencia
 Selección aleatoria de las muestras.
 Normalidad
 Los valores muestrales para cada grupo son de una
población normal
 Homogeniedad de Varianza
 Todas las poblaciones muestreadas tienen la misma
varianza

Dr. Edwin Johny Asnate Salazar-UNASAM 11-39


Fuentes de Variación en un
ANOVA de Dos Vías
Dos Factores de interes: A y B
r = número de niveles del factor A
c = número de niveles del factor B
n’ = número de replicas para cada celda
n = número total de observaciones en todas
las celdas n = (r)(c)(n’)
Xijk = valor de la kesima observación en el
nivel i del factor A y nivel j del factor B
Dr. Edwin Johny Asnate Salazar-UNASAM 11-40
Fuentes de Variación en un
ANOVA de Dos Vías (continua)
SST = SSA + SSB + SSAB + SSE Grados de
Libertad:
SSA r–1
Variación en el Factor A

SST SSB c–1


Variación en el Factor B
Variación
Total SSAB
Variación debido a la (r – 1)(c – 1)
Interacción entre A y B
n-1
SSE rc(n’ – 1)
Variación aleatoria (Error)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-41


Formulas en ANOVA de dos Vías

VariaciónTotal : r c n
SST   ( Xijk  X) 2

i1 j1 k 1

Variación del Factor A: r


SSA  cn  ( Xi..  X)
 2

i1

Variación del Factor B:


c
SSB  rn  ( X. j.  X)
 2

j1

Dr. Edwin Johny Asnate Salazar-UNASAM 11-42


Formulas en ANOVA de dos Vías
(continua)

Variación de la Interacción:
r c
SSAB  n ( Xij.  Xi..  X.j.  X)2
i1 j1

Suma de Cuadrados del Error:


r c n
SSE   ( Xijk  Xij. )2
i1 j1 k 1

Dr. Edwin Johny Asnate Salazar-UNASAM 11-43


Formulas en ANOVA de dos Vías
(continua)
r c n

Donde:  X
i 1 j 1 k 1
ijk

X  Gran Media
c n
rcn
 X
j 1 k 1
ijk

X i..   Media del i mo nivel del factor A (i  1, 2, ..., r)


cn
r n

 X ijk
X . j.  i 1 k 1
 Media del jmo nivel del factor B (j  1, 2, ..., c)
rn
n
X ijk
X ij .  
r = número de niveles del factor A
 Media de la celda ij
k 1 n
c = número de niveles del factor B
n’ = número de replicas en cada celda
Dr. Edwin Johny Asnate Salazar-UNASAM 11-44
Cálculo de los Cuadrados Medios
SSA
MSA  Cuadradro medio del factor A 
r 1

SSB
MSB  Cuadrado medio del factor B 
c 1

SSAB
MSAB  Cuadrado medio de la interacción 
(r  1)(c  1)

SSE
MSE  Cuadrado medio del error 
rc(n ' 1)
Dr. Edwin Johny Asnate Salazar-UNASAM 11-45
Prueba F para
ANOVA de Dos Vías:
Prueba F para el efecto del factor A
H0: μ1..= μ2.. = μ3..= • • = µr..
MSA Rechazar H0
H1: No todas las μi.. Son FSTAT 
MSE si FSTAT > Fα
iguales

Prueba F para el efecto del factor B


H0: μ.1. = μ.2. = μ.3.= • • = µ.c.
MSB Rechazar H0
H1: No todas las μ.j. son FSTAT 
MSE si FSTAT > Fα
iguales

H0: la interacción de A y B es Prueba F para el efecto de la


igual a cero interacción
MSAB
H1: La interacción de A y B no FSTAT  Rechazar H0
es igual a cero
MSE si FSTAT > Fα
Dr. Edwin Johny Asnate Salazar-UNASAM 11-46
Resume de la tabla ANOVA de
Dos Vías
Fuente de Suma de Cuadrado
G.L F
Variación Cuadrados medio

MSA MSA
Factor A SSA r–1
= SSA /(r – 1) MSE
MSB MSB
Factor B SSB c–1
= SSB /(c – 1) MSE

AB MSAB MSAB
SSAB (r – 1)(c – 1)
(Interación) = SSAB / (r – 1)(c – 1) MSE

MSE =
Error SSE rc(n’ – 1)
SSE/rc(n’ – 1)
Total SST n–1

Dr. Edwin Johny Asnate Salazar-UNASAM 11-47


Caracteristicas de la Prueba F en
el ANOVA de Dos Vías
 Los G.L Siempre suman:
 n-1 = rc(n’-1) + (r-1) + (c-1) + (r-1)(c-1)
 Total = error + factor A + factor B + interacción

 Los denominadores de la prueba F son siempre


los mismos pero los numeradores cambian.
 La suma de los cuadrados siempre suman:
 SST = SSE + SSA + SSB + SSAB
 Total = error + factor A + factor B + interacción

Dr. Edwin Johny Asnate Salazar-UNASAM 11-48


Ejemplos:
Interacción vs. No Interacción
 No Hay interacción  La Interaccion esta
cuando los segmentos presente en algunos
de linea son paralelas segmentos de linea no
paralelas
Nivel 1 del Factor B
Respuesta Media

Respuesta Media
Nivel 1 del Factor B
Nivel 3 del Factor B

Nivel 2 del Factor B


Nivel 2 del Factor B
Nivel 3 del Factor B

Niveles del Factor A Niveles del Factor A

Dr. Edwin Johny Asnate Salazar-UNASAM 11-49


ANOVA de Dos Vías, Ejemplo
 Eysenck asignó al azar a 100 sujetos (50 adultos y 50 jovenes) a uno de cinco grupos.
cuatro grupos de aprendizaje incidental-y un grupo de aprendizaje intencional.
 Grupo Contando-GC (se le pidió que lea una lista de palabras y simplemente contar el
número de letras de cada palabra)
 Grupo Rima-GR (leer cada palabra y pensar en una palabra que rima con ella)
 Grupo Adjetivo-GA (procesar las palabras en la medida de dar un adjetivo que,
razonablemente, podría ser utilizado para modificar cada palabra de la lista)
 Grupo Imágenes-GIM (se le instruyó para tratar de formar imágenes vívidas de cada
palabra)
 Grupo Intencional-GIN (se le dijo a leer una de la lista de palabras y memorizarlas
para su posterior recuperación)
Después se les paso una lista de 27 items a los sujetos tres veces, se les dio una hoja y
papel y se les pidió que escriba todas las palabras que podían recordar. Si el aprendizaje
implica nada más que estar expuesto al material (la forma en la mayoría de nosotros leer
un periódico o, una clase). a continuación, los cinco grupos que han demostrado la
igualdad de recuperación, después de todo, todos vieron todo el
palabras. Si el nivel de procesamiento del material es importante, entonces no debería
haber sido notables diferencias entre las medias del grupo.

Dr. Edwin Johny Asnate Salazar-UNASAM 11-50


Aprendizaje
Edad
ANOVA de GC GR GA GIM GIN Medias
Dos Vías, 9 7 11 12 10
8 9 13 11 19
Ejemplo: 6 6 8 16 14
8 6 6 11 5
10 6 14 9 10
Adulto
4 11 11 23 11
n
X ijk 6 6 13 12 14
X ij .   5 3 13 10 15 c n

k 1 n
7
7
8
7
10
11
19
11
11
11  Xj 1 k 1
ijk
Medias 7,0 6,9 11,0 13,4 12,0 10,06 X i.. 
8
6
10
7
14
11
20
16
21
19
cn
r=2 4 8 18 16 17
6 10 14 15 15
c=5 7 4 13 18 22
Joven
6 7 22 16 16
n’ = 10 5 10 17 20 22 r c n

 X
n = (2)(5)(10)=100 7 6 16 22 22
9 7 12 14 18 ijk
i 1 j 1 k 1
Xijk = Número de 7 7 11 19 21
X
rcn
palabras Medias 6,5 7,6 14,8 17,6 19,3 13,16
Medias 6,75 7,25 12,90 15,50 15,65 11,61
r n

 X ijk
X . j.  i 1 k 1
Dr. Edwin Johny Asnate Salazar-UNASAM
rn 11-51
Formulas en ANOVA de dos Vías
r c n
VariaciónTotal : SST   ( Xijk  X) 2

i1 j1 k 1

SST = (9 – 11,61)2 + (8 – 11,61)2 + (6 – 11,61)2 + (8 – 11,61)2 + (10 – 11,61)2 +


(4 – 11,61)2 + (6 – 11,61)2 + (5 – 11,61)2 + (7 – 11,61)2 + (7 – 11,61)2 +
(7 – 11,61)2 +…+ (22 – 11,61)2 + (18 – 11,61)2 + (21 – 11,61)2
SST = 2667,79

Dr. Edwin Johny Asnate Salazar-UNASAM 11-52


Formulas en ANOVA de dos Vías
r
Variación del Factor A: SSA  cn  ( Xi..  X)
 2

i1

SSA =5*10[ (10,06 – 11,61)2 + (13,06 – 11,61)2 ]


SST = 240,25

Dr. Edwin Johny Asnate Salazar-UNASAM 11-53


Formulas en ANOVA de dos Vías
c
Variación del Factor B:
SSB  rn  ( X. j.  X)
 2

j1

SSB =2*10[ (6,75 – 11,61)2 + (7,25 – 11,61)2 +(12,90 – 11,61)2 +


(15,50 – 11,61)2 + (15,65 – 11,61)2 ]
SSB = 1514,94

Dr. Edwin Johny Asnate Salazar-UNASAM 11-54


Formulas en ANOVA de dos Vías
(continua)
Variación de la Interacción:

r c
SSAB  n  ( Xij.  Xi..  X.j.  X)
 2

i1 j1

SSB =10[ (7,0-10,06-6,75+11,61)2 +(6,9-10,06-7,25+11,61)2 +(11,0-6,75+11,61)2 +


(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +
(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +
(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +
(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2 +(7-10,06-6,75+11,61)2]
SSB = 1514,94

Dr. Edwin Johny Asnate Salazar-UNASAM 11-55


Formulas en ANOVA de dos Vías
(continua)

Variación de la Interacción:
r c
SSAB  n ( Xij.  Xi..  X.j.  X)2
i1 j1

Suma de Cuadrados del Error:


r c n
SSE   ( Xijk  Xij. )2
i1 j1 k 1

Dr. Edwin Johny Asnate Salazar-UNASAM 11-56


Comparaciones Múltiplee:
Procedimiento de Tukey
 Determina los niveles que son
significativamente diferentes
 Tiene en cuenta las diferencias absolutas de
medias y compara con el Valor crítico
 Ejemplo: Diferencia absoluta para el factor A,
asumiendo tres niveles: X X
1.. 2..

X1..  X 3..

X 2..  X 3..
Dr. Edwin Johny Asnate Salazar-UNASAM 11-57
Comparaciones Múltiplee:
Procedimiento de Tukey
 Valor Crítico para el Factor A:
MSE
Valor Crítico  Q
c n'
(Donde Qα es de la tabla r y rc(n’–1) G.L.)

 Valor Crítico para el Factor B:

MSE
Valor Crítico  Q
r n'
(donde Qα es de la tabla con c y rc(n’–1) G.L)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-58


Diseño de Bloques al Azar

 Es similar al ANOVA de una Vía...

 ...Pero queremos controlar la variación posible


de un segundo factor (con dos o más niveles)

 Los niveles del segundo factor se denominan


bloques

Dr. Edwin Johny Asnate Salazar-UNASAM 11-59


Partición de la Variación

 La variación total se puede dividir en tres partes:

SST = SSA + SSBL + SSE

SST = Variación Total


SSA = Variación entre-Grupos
SSBL = Variación entre-Bloques
SSE = Variación aleatoria

Dr. Edwin Johny Asnate Salazar-UNASAM 11-60


Suma de Cuadrados para
los Bloques
SST = SSA + SSBL + SSE

r
SSBL  c  ( Xi.  X) 2

i1
Donde:
c = número de grupos
r = número de bloques
Xi. = media de todos los valores en el bloque i
X = gran media (media de todos los valores)
Dr. Edwin Johny Asnate Salazar-UNASAM 11-61
Partición de la Variación
 La variación total se divide en tres partes:

SST = SSA + SSBL + SSE

SST y SSA son SSE = SST – (SSA + SSBL)


cálculos similares al
ANOVA de una vía

Dr. Edwin Johny Asnate Salazar-UNASAM 11-62


Cuadrados Medios

SSBL
MSBL  Cuadrado medio entre bloques 
r 1

SSA
MSA  Cuadrado medio entre grupos 
c 1

SSE
MSE  Cuadrado medio del error 
(r  1)(c  1)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-63


Tabla del ANOVA con bloques

Fuente de SS G.L MS F
variación
Entre MSBL
Bloques SSBL r-1 MSBL
MSE
Entre SSA c-1 MSA MSA
Grupos
MSE
Error SSE (r–1)(c-1) MSE

Total SST rc - 1
c = número de poblaciones rc = número total de observaciones
r = número de bloques
Dr. Edwin Johny Asnate Salazar-UNASAM 11-64
Prueba para efecto
del Factor
H 0 : μ .1  μ .2  μ .3      μ . c
H1: No todas las medias poblacionales son iguales

MSA
FSTAT =
MSE  Prueba del Factor principal:
G.L1 = c – 1
G.L2 = (r – 1)(c – 1)

Rechazar H0 si FSTAT > Fα

Dr. Edwin Johny Asnate Salazar-UNASAM 11-65


Prueba para efecto de los
Bloques
H 0 : μ1.  μ2.  μ3.  ...  μ r.
H1: No todas las medias de los bloques son iguales

MSBL
FSTAT =
MSE  Prueba para Bloques:
G.L1 = r – 1
G.L2 = (r – 1)(c – 1)

Rechazar H0 si FSTAT > Fα

Dr. Edwin Johny Asnate Salazar-UNASAM 11-66


Diseño de Bloques al Azar:
Ejemplo
 Supongamos que una cadena de comida rápida
quiere evaluar el servicio en cuatro restaurantes.
El director de servicio al cliente de la cadena
contrata a seis evaluadores con experiencias
variadas en las evaluaciones de servicio de
alimentos para actuar como evaluadores. Para
reducir el efecto del variabilidad de un evaluador a
otro evaluador, se utiliza un diseño de bloques al
azar, con los evaluadores en calidad de
bloques. Los cuatro restaurantes son los grupos de
interés.
Dr. Edwin Johny Asnate Salazar-UNASAM 11-67
Diseño de Bloques al Azar:
Ejemplo
 Los seis evaluadores evalúan el servicio en cada uno de los cuatro
restaurantes en un orden aleatorio. Con Una calificación de 0 (bajo) a
100 (alto).
Restaurantes
Evaluadores Total Medias
A B C D
1 70 61 82 74 287 71,75
2 77 75 88 76 316 79,00
3 76 67 90 80 313 78,25
4 80 63 96 76 315 78,75
5 84 66 92 84 326 81,50
6 78 68 98 86 330 82,50
Total 465 400 546 476 1887
Medias 77,50 66,67 91,00 79,33 78,63

Dr. Edwin Johny Asnate Salazar-UNASAM 11-68


Diseño de Bloques al Azar:
Solución
Restaurantes
Evaluadores Total Medias
A B C D
1 70 61 82 74 287 71,75 X1. = 71,75
2 77 75 88 76 316 79,00 X2. = 79,00
3 76 67 90 80 313 78,25
X3. = 78,25
4 80 63 96 76 315 78,75
5 84 66 92 84 326 81,50 X4. = 78,75
6 78 68 98 86 330 82,50 X5. = 81,50
Total 465 400 546 476 1887
X6. = 82,50
Medias 77,50 66,67 91,00 79,33 78,63

X.1 = 77.50 X.2 = 66.67 X.3 = 91,00 X.4 = 79.33 c r

r= 6  X
j 1 i 1
ij
X
1887
 78,63
c=4 X 24
n = r x c=24
rc
Dr. Edwin Johny Asnate Salazar-UNASAM 11-69
Diseño de Bloques al Azar:
Solución
SSBL= 4[(71,57 – 78,63)2 + (79,00 – 78,63)2 +…+ (82,50 – 78,63)2 ] = 283,375

SSA = 6(77,50 – 78,63)2 + 6(66,67 – 78,63)2 +6(91,00 – 78,63)2 + 6(79,33 – 78,63)2


SSA = 1787,458

SSE = (70 – 77,75-77,50+78,63)2 + (77 – 77,75-79,00+78,63)2 + (76 – 78,25-77,50+78,63)2


+ (80 – 78,75-77,50+78,63)2 + (84 – 81,50-77,50+78,63)2 + (78 – 82,50-77,50+78,63)2 +…+
+ (76 – 79,33-78,75+78,63)2 + (84 – 79,33-81,50+78,63)2 + (86 – 79,33-82,50+78,63)2
SSE = 224,792
SST = (70 – 78,63)2 + (77 – 78,63)2 +(76 – 78,63)2 + (80 – 78,63)2 + (84 – 78,63)2 +
(78 – 78,63)2 +…+(74 – 78,63)2 + (76 – 78,63)2 (80 – 78,63)2 + (76 – 78,63)2
+(84 – 78,63)2 + (86 – 78,63)2
SST = 2295,625

Dr. Edwin Johny Asnate Salazar-UNASAM 11-70


Cuadrados Medios

SSBL 283,375
MSBL    56, 675
r 1 6 1

SSA 1787, 458


MSA    595,819
c 1 4 1

SSE 224, 792


MSE    14,986
(r  1)(c  1) (6  1)(4  1)

Dr. Edwin Johny Asnate Salazar-UNASAM 11-71


Tabla del ANOVA con bloques

Fuente de SS G.L MS F
variación
Entre 56,675
Bloques 283,375 5 56,675
14,986
Entre 1787,458 3 595,819 595,819
Grupos
14,986
Error 224,792 15 14,986

Total 2295,625 23
c = número de restaurantes rc = número total de observaciones
r = número de evaluadores
Dr. Edwin Johny Asnate Salazar-UNASAM 11-72
Prueba para efecto
del Factor
H 0 : μ .1  μ .2  μ .3      μ . c
H1: No todas las medias poblacionales son iguales

595,819
FSTAT = =39,758 Fα =3,29
14,986
 Prueba del Factor principal:
G.L1 = c – 1=4-1=3
 G.L2 = (r – 1)(c – 1)=(6-1)(4-1)=15

0 No
rechazar H0 Rechazar H0
Se Rechaza H0
Fα=3,29 porque FSTAT > Fα
Dr. Edwin Johny Asnate Salazar-UNASAM 11-73
Prueba para efecto de los
Bloques
H 0 : μ1.  μ2.  μ3.  ...  μ r.
H1: No todas las medias de los bloques son iguales

56,675
FSTAT = =3,782 Fα =2,90
14,986
 Prueba para Bloques:
G.L1 = r – 1=6-1=5
 G.L2 = (r – 1)(c – 1)=(6-1)(4-1)=15

0 No Se Rechazar H0
rechazar H0 Rechazar H0
porque FSTAT > Fα
Fα=2,90
Dr. Edwin Johny Asnate Salazar-UNASAM 11-74

You might also like