You are on page 1of 34

UNIVERSIDAD NACIONAL DE

TUMBES

TEMA:
ANALISIS DE VARIANZA DE DOS
FACTORES O DOS VIAS

ASIGNATURA:
ESTADISTICA APLICADA

DOCENTE:
CASTAÑEDA GUZMAN WALTER

INTEGRANTE:
 CARRILLO URBINA MILTON
 CHUQUIHUANGA OCAMPOS KEIKO
 ESPINOZA ALBURQUEQUE ERICK
 IMAN PEÑA ANGIE
 LOPEZ SILVA MIKSY

CICLO:
V

TUMBES - PERU
INDICE

INTRODUCCION………………………………………………………………………3

ANALISIS DE VARIANZA DE DOS FACTORES O DOS VIAS……………….... 4

ANOVA DE DOS VÍAS CON UNA OBSERVACIÓN POR CELDA………….......6

EJEMPLO………………………………………………………………………………8

ANOVA DE DOS VÍAS CON MAS DE UNA OBSERVACIÓN POR CELDA….11

EJEMPLO……………………………………………………………………………..13

EJERCICIOS PROPUESTOS………………………………………………………17

BIBLIOGRAFIA……………………………………………………………………….34

2
INTRODUCCION
Hasta ahora se ha visto el modelo de análisis de la varianza con un factor que
es una variable cualitativa cuyas categorías sirven para clasificar las medidas
de otra variable cuantitativa en grupos cuyas medias se desea comparar. Así,
podremos comparar el peso medio de aves agrupándolas por especies, la
variable de clasificación o factor es la especie y la variable dependiente es el
peso. En el tema actual se ampliará el modelo para incluir dos factores en lugar
de uno solo. Por ejemplo, cuando se pretenda comparar el peso medio de aves
agrupándolas por especie y por sexo.

La inclusión de un factor más no es trivial, el problema de la comparación de


las medias de grupos inducidos por dos factores cualitativos no se resuelve por
la simple ampliación del modelo de un factor a uno más, pues es posible que
ambos factores sean fijos (Modelo I), ambos aleatorios (Modelo II) o uno fijo y
otro aleatorio (Modelo III), pero además es posible que ambos factores actúen
de modo independiente o que la acción combinada de ambos factores potencie
o inhiba la acción de cada uno por separado, en este segundo caso diremos
que existe interacción, por lo que podremos hablar de modelo con o sin
interacción.

3
ANALISIS DE VARIANZA DE DOS FACTORES O DOS VIAS

Es un diseño de ANOVA que permite estudiar simultáneamente los efectos de


dos fuentes de variación.

La ANDEVA de dos vías permite evaluar la respuesta del grupo experimental al


efecto combinado de dos factores. Normalmente cada factor provee dos o más
tratamientos. Por ejemplo, podemos evaluar la respuesta en crecimiento de
plántulas de pochote a los siguientes factores:

 Factor 1: dos formulaciones de fertilizante (1 y 2). Cada formulación es


un tratamiento.
 Factor 2: tres tipos de envases (A, B, C). Cada tipo de envase es un
tratamiento.

En el análisis de varianza de dos vías el investigador(a) debe tener claridad del


modelo de ANDEVA que está utilizando. Por ejemplo, ¿representan los niveles
de los factores una muestra de” n” posibles niveles? o por el contrario ¿son los
únicos niveles de importancia para el experimento? La respuesta a esta
pregunta permite definir los factores o efectos principales como fijos o
aleatorios.

Factor fijo: Los niveles incluidos en el experimento son los únicos relevantes
para la investigación. Por ejemplo, extracción con bueyes, chapulín y tractor de
orugas; medición de diámetros con forcípula y cinta diamétrica; medición de pH
con dos instrumentos.

Factor aleatorio: Los niveles del factor incluidos en el experimento


representan una muestra aleatoria de “n” posibles niveles. Por ejemplo, tres
niveles de N (nitrógeno) en un ensayo de fertilizante o dos procedencias de
semilla de “n” posibles sitios.

Las combinaciones de los dos tipos de factores brindan los siguientes modelos
de ANDEVA:

4
Una observación individual se representa como:

𝒀𝒊𝒋𝒌 𝒊 = 𝟏, …𝒂 𝒋 = 𝟏, … 𝒃 𝒌 = 𝟏, … 𝒏

El primer subíndice indica el nivel del primer factor, el segundo el nivel del
segundo factor y el tercero la observación dentro de la muestra. Los factores
pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos
aleatorios (modelo II) o uno de efectos fijos y el otro de efectos
aleatorios (modelo mixto). El modelo matemático de este análisis es:

𝑌𝑖𝑗𝜇 = 𝜇 + 𝛼𝑖 + 𝛽𝑗 + (𝛼 𝛽)𝑖𝑗 + 𝜀𝑖𝑗𝑘 Modelo I

𝑌𝑖𝑗𝜇 = 𝜇 + 𝐴𝑖 + 𝐵𝑗 + (𝐴 𝐵)𝑖𝑗 + 𝜀𝑖𝑗𝑘 Modelo II

𝑌𝑖𝑗𝜇 = 𝜇 + 𝛼𝑖 + 𝐵𝑗 + (𝛼 𝐵)𝑖𝑗 + 𝜀𝑖𝑗𝑘 Modelo mixto

Dónde:
𝛍 Es la media global,

𝜶𝒊 𝒐𝑨𝒊 Esel efecto del nivel i del 1º factor

𝜷𝒋 𝒐𝑩𝒋 Ese efecto del nivel j del 2º factor

𝜺𝒊𝒋𝒌 Las desviaciones aleatorias alrededor de las medias, que también

se asume que están normalmente distribuidas, son independientes y tienen


media 0 y varianza s2.

5
A las condiciones de muestreo aleatorio, normalidad e independencia, este
modelo añade la de aditividad de los efectos de los factores.

A los términos (𝜶𝜷)𝒊𝒋 , (𝑨𝑩)𝒊𝒋 , (𝜶𝑩)𝒊𝒋 , se les denomina interacción entre

ambos factores y representan el hecho de que el efecto de un determinado


nivel de un factor sea diferente para cada nivel del otro factor.

 ANDEVA DE DOS VÍAS CON UNA OBSERVACIÓN POR CELDA

La tabla de análisis de varianza de dos vías con una observación por celda al
igual que en el análisis de varianza de una vía, el objetivo del diseño es repartir
la varianza total, en tres componentes: efecto de filas (tratamiento 1), columnas
(tratamiento 2) y error. Los supuestos del análisis son los mismos que para el
diseño de una vía, a saber: errores independientes; con una distribución
normal, varianzas homogéneas y aditividad en los efectos principales.

El modelo lineal que describe la relación entre los componentes del diseño es:

𝑿𝒊𝒋 = 𝝁 + 𝜷𝒋 + 𝝅𝒊 + 𝜺𝒊𝒋 → 𝒊 = 𝟏, … 𝒏 ; 𝒋 = 𝟏, … 𝒏 ; 𝜺𝒊𝒋 = (𝟎, 𝝈𝟐 )

En donde:

𝝁: representa la media de la población, constante para todas las


observaciones.

𝜷𝒋 : representa el efecto del tratamiento j, constante para todas las


observaciones en tratamiento j.

𝝅𝒊 : representa el efecto del tratamiento i, constante para todas las


observaciones en tratamiento i.

𝜺𝒊𝒋 : representa el error experimental, independiente y con una distribución


normal para cada tratamiento (𝟎, 𝝈𝟐 ).

PASOS:

6
Hipótesis:
Ho: Hipótesis Nula
H1: Hipótesis Alternativa

Nivel de significancia:
∝ =?

Estadísticas:
𝑇2
FACTOR: 𝐶 = 𝑟𝑥𝑘

SUMA DE CUADRADOS TOTALES: 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶


1
SUMA DE CUADRADOS DE COLUMNAS: 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
1
SUMA DE CUADRADOS POR FILA: 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶

SUMA DE CUADRADOS DEL ERROR:𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐶 + 𝑆𝐶𝐹)

 GRAFICO:

𝐹𝐶
𝐶𝑀𝐶
=
𝐶𝑀𝐸

 CONCLUSIÓN:
• Decisión
• Interpretación.

7
EJEMPLO:
Suponga que usted haya experimentado con levadura para una receta de
panes dulces. Parece ser que la cantidad de azúcar y la temperatura del
agua afectan el tamaño de los panes. Basándose en los siguientes datos,
usted realiza un análisis de varianza para averiguar lo que es significativo
de estas recetas (utilizar α=0.05).

Levadura: Tamaño de los panes


dulces
Agua Agua Agua
Fría Tibia Caliente
Poco 75 87 60
Azúcar
Azúcar 74 82 55
Normal
Mucho 70 79 53
Azúcar

SOLUCION:
• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: La temperatura de agua afecta el tamaño de los panes de manera igual.
H1: La temperatura de agua afecta el tamaño de los panes de manera
diferente.

HIPOTESIS PARA LAS FILAS


Ho: La cantidad de azúcar afecta el tamaño de los panes de manera igual.
H1: La cantidad de azúcar afecta el tamaño de los panes de manera
diferente.

• NIVEL DE SIGNIFICANCIA:
α = 0.05

8
Levadura: Tamaño de los panes dulces Sumas x
Agua Agua Agua
Fría Tibia Caliente
Poco Azúcar 75 87 60 222 74
Azúcar Normal 74 82 55 211 70.33
Mucho Azúcar 70 79 53 202 67.33
Sumas 219 248 168 T = 635
x 73 82.67 56 X = 70.56

• GLOBAL:
T = 635 T2 = 403225 N=9

2
ƩƩ𝑋𝑖𝑗 =752 + 742 +… + 552 + 532 = 45969
𝑇2 403225
C= = = 44802.78
𝑁 9

• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 45969 – 44802.78
SCT = 1166.22

1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
2192 + 2482 +1682
𝑆𝐶𝐶 = − 44802.78
3
SCC= 𝟏𝟎𝟗𝟑. 𝟓𝟓

1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
2222 + 2112 +2022
𝑆𝐶𝐹 = − 44802.78
3
SCF = 66.87

• 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐶 + 𝑆𝐶𝐹)


SCE = 1166.22 – (1093.55 + 66.87) = 5.8

9
CUADRO DE ANOVA
ANOVA
Origen de Suma de Grados Promedio F Valor
Variaciones Cuadrados Libertad Cuadrados Crítico
Columnas 1093.55 2 546.78 377.09 6.94
Filas 66.87 2 33.44 23.06 6.94
Error 5.8 4 1.45

Total 1166.22 8

• CONCLUSION:
• Para el caso del agua que son las columnas:
Decisión: Dado que Fo> Ft , no se rechaza la Ho
Interpretación: Se puede concluir que no existe diferencia significativa en
el tamaño de los panes respecto a la temperatura del agua.

• Para el caso del azúcar que son los renglones:


Decisión: Dado que Fo> Ft , no se rechaza la Ho
Interpretación: Se puede concluir que no existe diferencia significativa en
el tamaño de los panes respecto a la cantidad de azúcar.

10
 ANDEVA DE DOS VÍAS CON MAS DE UNA OBSERVACIÓN POR
CELDA

Conocido también como diseño completamente aleatorizado de dos


factores, se basa en un arreglo rectangular de las observaciones, en el que
las c columnas representan los niveles o tratamientos del factor A y las r
filas los niveles o tratamientos del factor B. cada combinación de
tratamiento define una celda en la tabla. Se tiene entonces rc celdas. Cada
celda contiene n (n≥2) observaciones (replicas).

PASOS:

Las hipótesis

En el análisis de varianza de dos factores con replicación interesa realizar


tres pruebas de hipótesis. Estas son: para columnas, para filas y para
interacción. Las hipótesis malas y alternativas son las siguientes.

𝑯𝑪𝟏 : 𝛼𝑖 = 0, 𝑖 = 1,2, … … 𝑐. (Los efectos de todos los tratamientos del factor A


o de todas las columnas son nulos)

𝑯𝑪𝟏 𝛼𝑖 ≠ 0, 𝑖 = 1,2, … … 𝑐 Para algunas columnas

𝑯𝑭𝟎 : 𝛽𝑗 = 0, 𝑗 = 1, 2, … . . 𝑟 (Los efectos de todos los tratamientos del factor


B o de todas las filas son nulos)

𝑯𝑭𝟎 : 𝛽𝑗 ≠ 0 Para algunas filas

𝑯𝑰𝟎 : 𝑖𝑗 = 0, 𝑖 = 1, 2, … . . 𝑐, 𝑗 = 1,2 … … 𝑟 (Los efectos conjuntos es todas


las celdas son nulos, o no hay interacción entre filas y columnas)

𝑯𝑰𝟎 : 𝑖𝑗 ≠ 0 Para algunas celdas

11
Para calcular las sumas des cuadrados se ejecutan las siguientes
equivalencias

SUMA DE CUADRADOS TOTALES

𝑺𝑪𝑻 = ∑𝒄𝒊=𝟏 ∑𝒓𝒋=𝟏 ∑𝒏𝒌=𝟏( 𝒙𝒊𝒋𝒌 − 𝒙


̅ ... )𝟐 = ∑𝒄𝒊=𝟏 ∑𝒓𝒋=𝟏 ∑𝒏𝒌=𝟏 (𝒙𝟐𝒊𝒋𝒌 − 𝑪) ,
⋯ 𝑻𝟐
donde 𝑪 = 𝒂𝒃𝒏

SUMA DE CUADRADOS POR COLUMNAS


𝟏
𝑺𝑪𝑪 = 𝒃𝒏 ∑𝒄𝒊=𝟏( 𝒙 ̅𝒊𝒋. )𝟐= ∑𝒄𝒊=𝟏 𝑻𝟐𝒊.. − 𝑪
̅𝒊𝒋𝒌 − 𝒙
𝒃𝒏

SUMA DE CUADRADOS POR FILAS


𝒓 𝒓
𝟏
̅.𝒋. − 𝒙
𝑺𝑪𝑭 = 𝒂𝒏 ∑( 𝒙 ̅... ) = ∑ 𝑻𝟐.𝒋. − 𝑪
𝟐
𝒂𝒏
𝒋=𝟏 𝒊=𝟏

SUMA DE CUADRADOS DEL ERROR


𝒄 𝒓 𝒏 𝒄 𝒓 𝒏 𝒓
𝟏
̅ 𝒊𝒋. ) =
𝑺𝑪𝑬 = ∑ ∑ ∑( 𝒙𝒊𝒋𝒌 − 𝒙 𝟐
∑∑∑ (𝒙𝟐𝒊𝒋𝒌 − ∑ 𝑻𝟐𝒊𝒋. )
𝒏
𝒊=𝟏 𝒋=𝟏 𝒌=𝟏 𝒊=𝟏 𝒋=𝟏 𝒌=𝟏 𝒋=𝟏

SUMA DE CUDRADOS DE INTERACCION


𝑺𝑪𝑰 = 𝑺𝑪𝑻 − (𝑺𝑪 + 𝑺𝑪𝑭 + 𝑺𝑪𝑬)

GRAFICO:

CONCLUSIÓN:
• Decisión
• Interpretación

12
EJEMPLO:
La empresa P&C realiza una investigación para determinar si el rendimiento de
sus empleados está influenciado por el nivel de capacitación y el turno de
trabajo. Para realizar este estudio, se diseñó un experimento de dos factores: el
factor A: capacitación del personal con tres niveles, 𝐴1 = Buena𝐴2 =
Regular𝐴3 = Ninguna y el factor B: turno de trabajo con tres niveles, 𝐵1 =
Mañana𝐵2 = Tarde𝐵3 = Noche. En cada combinación de los niveles de
capacitación y de turno, se midieron los rendimientos de 4 empleados
(replicas).
En la medición de los rendimientos se utilizó un procedimiento cuyos resultados
son tiempos en minutos, indicando que a menor tiempo mayor rendimiento. Los
tiempos de rendimientos observados se dan en la tabla:

a) Realice una gráfica de líneas de las medias muéstrales, ¿indica la


gráfica presencia de interacción entre los dos factores considerados?
b) Al nivel de significancia =0.05 ¿existe interacción entre los niveles de
los factores capacitación y turnos de trabajo?
c) Si no existe interacción entre los factores de capacitación y turnos de
trabajo, determine si los niveles de cada variable no producen algún
efecto en la variabilidad del rendimiento.

13
Solución:
La variable respuesta o dependiente es X= rendimientos de los
empleados en minutos

Hallamos las hipótesis

 Para los turnos

𝐻0 = El promedio del rendimiento de los empleados en minutos de los


diferentes turnos de las diferentes capacitaciones es igual.

𝐻1 = Algunos de los promedios del rendimiento de los empleados en


minutos de los diferentes turnos de las diferentes capacitaciones son
diferentes.

 Para las capacitaciones:

𝐻0 = El promedio de los rendimientos de los trabajadores en minutos de


las diferentes capacitaciones en los diferentes turnos es igual

14
𝐻1 = Algunos de estos promedios de los rendimientos de los
trabajadores en minutos de las diferentes capacitaciones en los
diferentes turnos son diferentes.

 Para la interacción:

𝐻0 = Si existe interacción entre los turnos y en las capacitaciones

𝐻1 = No existe interacción entre los turnos y en las capacitaciones.

Tabla ANOVA

De los datos se obtienen

(𝑋… )2 (223)2
𝐶= = = 1381.361
𝑎𝑏𝑛 3𝑥3𝑥4

3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (4)2 + (5)2 + ⋯ + (6)2 + (7)2  − 1381.361
𝐼=1 𝐽=! 𝑘=1

𝑆𝐶𝑇 = 37.639

3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = (65)2 + (76)2 + (82)2  − 1381.361 = 12.389
3𝑥4 12
𝑖=!

3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = (71)2 + (77)2 + (75)2  − 1381.361 = 1.556
3𝑥4 12
𝑖=!

2
(𝑋 )
𝑆𝐶𝐴𝐵 = ∑3𝐼=1 ∑3𝑗=! 𝑖𝑗. − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛

(20)2 + (23)2 + ⋯ + (28)2


= − (1381.361 + 12.389 + 1.556) = 0.444
4

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐴𝐵)

𝑆𝐶𝐸 = 37.639 − (12.389 + 1.556 + 0.444) = 23.25

15
Región critica
 Para los turnos:
𝑅𝐶 = 𝐹0.95 (2.27)⦌ = 3.35

 Para las capacitaciones:


𝑅𝐶 = 𝐹0.95 (2.27)⦌ = 3.35

 Para la interacción:
𝑅𝐶 = 𝐹0.95 (4.27)⦌ = 2.73

Conclusión:

 Para los turnos:

Decisión: dado que 𝐹𝐵 = 0.903 < 3.35 se acepta la hipótesis nula


Interpretación: con el 95% de confianza se concluye, que los
rendimientos de los trabajadores en minutos de las diferentes
capacitaciones, en los diferentes turnos son iguales.

 Para las capacitaciones:

Decisión: dado que 𝐹𝐴 = 7.194 > 3.35 se rechaza la hipótesis nula


Interpretación: con el 95% de confianza se concluye que los
rendimientos de los trabajadores en minutos de las diferentes
capacitaciones en los diferentes turnos son diferentes.

 Para la interacción:

Decisión: dado que 𝐹𝐴𝑥𝐵 = 0.129 < 2.73 aceptamos la hipótesis nula
Interpretación: con el 95% de confianza se concluye que si existe
interacción entre los turnos y en las capacitaciones.

16
EJERCICIOS PROPUESTOS

PROBLEMA N° 1:
Un comerciante de automóviles realiza una prueba para determinar si la
cantidad de tiempo en minutos que necesita para una afinación de motor
depende de si se emplea un analizador computarizado o un analizador
electrónico.

ANALIZADOR
COMPUTARIZADO ELECTRONICO
COMPACTO 50 42
AUTOMOVIL MEDIANO 55 44
GRANDE 63 46

Use α= 0.05 y realice una prueba para determinar si existe una diferencia
significativa entre los tratamientos.

SOLUCION:

1. OBTENCION DE MEDIAS

Media del automovil compacto:


50+42= 92
92
= 46
2

Media de automovil mediano:


55+44= 99
99
= 49.5
2

Media de automoviles pequeños:


63+46 = 109
109
= 54.5
2

17
Media del analizador computarizado:
50+55+63 = 168
168
= 56
3

Media del analizador electronico:


42+44+46 = 132
132
= 44
3

Media global
50+55+63+42+44+46 = 300
300
= 50
6

2. OBTENCION DE LAS SUMATORIAS

SCT: (50 − 50)2 + (42 − 50)2 = 0 + 64


(55 − 50)2 + (44 − 50)2 = 25 + 36
(63 − 50)2 + (46 − 50)2 = 169 + 16
SCT: 310

SCTR: 3( (56 − 50)2 + (44 − 50)2 ) = 216

SUMATORIA DE CUADRADOS DE LOS BLOQUES


SCBL: 2( (46 − 50)2 + (49.5 − 50)2 ) = 73

SUMATORIA DEL CUADRADO DEL ERROR


310 - 216 - 73 = 21

18
3. TABLA DE ANOVA

Fuente de Suma de Grados de Cuadrado F Valor - p


variacion cuadrados libertad medio
Tratamientos 216 1 216 20.57 0.045331
Bloques 73 2 36.5 3.48
Error 21 2 10.5
Total 310 5 ---------------

PRUEBA DE VALOR:
VALOR-p <∝
0.045331 > 0.05

Se rechaza la hipotesis H0, nos indica que las medias son iguales.

5. CONCLUSION:
Se concluye que en base al analis realizado para este problema en
particular,se concluye que no importa el tipo de analizador, ya sea
computarizado o electronico, que se use para realizar una afinacion en un
auto, este no afectara los minutos correspondientes al proceso.

19
PROBLEMA N° 2:
Suponiendo que se quiere investigar si la producción de tres diferentes
máquinas es igual, tomando en cuenta la experiencia de los operadores a un
nivel de significancia del 5%.

Experiencia Máquinas
En años Maq 1 Maq 2 Maq 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45

Solución:

• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: El promedio de producción de las maquinas son iguales.
H1: El promedio de producción de las maquinas difiere en al menos una.

HIPOTESIS PARA LAS FILAS


Ho: Los años de experiencia de los operadores influyen en la producción de
igual forma.
H1: Los años de experiencia de los operadores influyen en la producción de
diferente forma.

• NIVEL DE SIGNIFICANCIA:
α = 0.05

20
Experiencia Máquinas

En años Maq 1 Maq 2 Maq 3 TOTAL Promedios

1 27 21 25 73 24.33

2 31 33 35 99 33

3 42 39 39 120 40

4 38 41 37 116 38.67

5 45 46 45 136 45.33

TOTAL 183 180 181 T= 544

Promedios 36.6 36 36.2 36.27

• GLOBAL:
T = 544 T2 = 295936 N = 15

2
ƩƩ𝑋𝑖𝑗 =272 + 312 +… + 372 + 452 = 20536
𝑇2 295936
C= = = 19729.07
𝑁 15

• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 20536 – 19729.07
SCT = 806.93

1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
1832 + 1802 +1812
𝑆𝐶𝐶 = − 19729.07
5
SCC = 0.93

1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
732 + 992 +1202 +1162 +1362
𝑆𝐶𝐹 = − 19729.07
3
SCF = 764.93

• 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐶 + 𝑆𝐶𝐹)


SCE = 806.93 – (0.93+ 764.93) = 41.07
TABLA ANOVA
21
ANOVA
Origen de Suma de Grados Cuadrados F Valor
Variaciones Cuadrados Libertad Medios Crítico
Columnas 0.93 2 0.465 0.91 4.46

Filas 764.93 4 191.23 37.25 3.84


Error 41.07 8 5.134

Total 806.93 12 ---------

CONCLUSION:

Para el caso de las maquinas que son las columnas:


Decisión: Dado que Fo> Ft , no se rechaza la Ho
Interpretación: Se puede concluir que no existe diferencia significativa en
la producción de las maquinas.

Para el caso de la experiencia que son los renglones:


Decisión: Dado que Fo< Ft , se rechaza la Ho
Interpretación: Se puede concluir que existe diferencia significativa en la
producción respecto a los años de experiencia de los operadores.

PROBLEMA N° 3:

22
Una academia de futbol realiza una investigación para determinar si el
rendimiento de sus deportistas está influenciado por su alimentación y por la
cantidad de horas de entrenamiento diarias. Para realizar el estudio, se
considera: el factor A: alimentación con tres niveles, A1 = Buena A2 = Regular
A3 = Mala y el factor B: horas de entrenamiento, B1 = 2 horas B2 = 4 horas B3
= 6 horas. En cada combinación de los niveles de alimentación y de horas de
entrenamiento, se midieron los rendimientos de 4 deportistas. En la medición
de los rendimientos se realizó una competencia individual cuyos resultados son
tiempos en minutos, indicando que a menor tiempo mayor rendimiento. Los
tiempos de rendimientos observados se dan en la tabla:
Al nivel de significancia =0.05 ¿existe interacción entre los niveles de los
factores capacitación y turnos de trabajo?

A = ALIMENTACION
B = HORAS A1 A2 A3
10 12 15 11 12 11
B1
8 16 10 13 12 14
11 9 11 12 14 16
B2
13 14 10 14 11 16
14 15 9 12 12 9
B3
10 9 11 10 9 11

HIPOTESIS:
 Para las horas de entrenamiento:

𝐻0 = El promedio del rendimiento de los deportistas en minutos de las


diferentes horas de entrenamiento de las diferentes alimentaciones es
igual.

𝐻1 = Algunos de los promedios del rendimiento de los deportistas en


minutos de las diferentes horas de entrenamiento de las diferentes
alimentaciones son diferentes.

 Para la alimentación:

23
𝐻0 = El promedio de los rendimientos de los deportistas en minutos de
la diferente alimentación en las diferentes horas de entrenamiento es
igual.

𝐻1 = Algunos de estos promedios de los rendimientos de los deportistas


en minutos de la diferente alimentación en las diferentes horas de
entrenamiento son diferentes.

 Para la interacción:

𝐻0 = Si existe interacción entre las horas de entrenamiento y la


alimentación.

𝐻1 =No existe interacción entre las horas de entrenamiento y la


alimentación.

Calculamos variables:

Factor A Factor B Total Media N


B1 46 11.5 4
A1 B2 47 11.75 4
B3 48 12 4
Total 141 11.75 12
B1 49 12.25 4
A2 B2 47 11.75 4
B3 42 10.5 4
Total 138 11.5 12
B1 49 12.25 4
A3 B2 57 14.25 4
B3 41 10.25 4
Total 147 12.25 12
B1 144 12
TOTAL B2 151 12.58
B3 131 10.92
TOTAL 426 11.83 12
Tabla ANOVA:

24
(𝑋… )2 (426)2
𝐶= = = 5041
𝑎𝑏𝑛 3𝑥3𝑥4
3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (10)2 + (8)2 + ⋯ + (9)2 + (11)2  − 5041
𝐼=1 𝐽=! 𝑘=1

𝑆𝐶𝑇 = 175

3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = [(141)2 + (138)2 + (147)2  − 5041 = 3.5
3𝑥4 12
𝑖=!

3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = [(144)2 + (151)2 + (131)2  − 5041 = 17.17
3𝑥4 12
𝑖=!

3 3 2
(𝑋𝑖𝑗. )
𝑆𝐶𝐴𝐵 = ∑ ∑ − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛
𝐼=1 𝑗=!

(46)2 + (47)2 + ⋯ + (41)2


𝑆𝐶𝐴𝐵 = − (5041 + 3.5 + 17.17)
4

𝑆𝐶𝐴𝐵 = 21.83

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐴𝐵)


𝑆𝐶𝐸 = 175 − (3.5 + 17.17 + 21.83)
𝑆𝐶𝐸 = 132.5

FV SC GL CM F F(0.05)
A = alimentación 3.5 2 1.75 0.36 3.35
B = horas de 17.17 2 8.59 1.75 3.35
entrenamiento
Interacción 21.83 4 5.46 1.11 2.73
Error 132.5 27 4.91

Total 175 35

Conclusión:

25
 Para las horas de entrenamiento:

Decisión: dado que 𝐹𝐵 = 1.75 < 3.35 se acepta la Ho


Interpretación: con el 95% de confianza se concluye, que los
rendimientos de los futbolistas en minutos de las diferentes horas de
entrenamiento, en las diferentes alimentaciones son iguales.

 Para la alimentación:

Decisión: dado que 𝐹𝐴 = 0.36 < 3.35 se rechaza la Ho


Interpretación: con el 95% de confianza se concluye que los
rendimientos de los trabajadores en minutos de las diferentes
capacitaciones en los diferentes turnos son iguales.

 Para la interacción:

Decisión: dado que 𝐹𝐴𝑥𝐵 = 1.11 < 2.73 aceptamos la Ho


Interpretación: con el 95% de confianza se concluye que si existe
interacción entre las horas de entrenamiento y la alimentación.

PROBLEMA N° 4:

26
En unos laboratorios se está estudiando los factores que influyen en la
resistencia de un tipo particular de fibra. Se eligen al azar cuatro máquinas y
tres operarios y se realiza un experimento factorial usando fibras de un mismo
lote de producción. Los resultados obtenidos se muestran en la tabla adjunta.
Analizar los resultados y obtener las conclusiones apropiadas.

A= MÀQUINAS
B= OPERARIOS A B C D

1 109 110 108 110

110 115 109 108

2 110 110 111 114

112 111 109 112

3 116 112 114 120

114 115 119 117

HIPOTESIS:
 Para los operarios:

𝐻0 = El promedio de la resistencia de las fibras influenciado por los


operarios es igual.

𝐻1 = Algunos de los promedios de la resistencia de las fibras


influenciado por los operarios son diferentes.

 Para las máquinas:

𝐻0 = El promedio de la resistencia de las fibras influenciado por las


máquinas es igual.

𝐻1 = Algunos de estos promedios de la resistencia de las fibras


influenciado por las máquinas son diferentes.

 Para la interacción:

27
𝐻0 = Si existe interacción entre los operarios y las máquinas.

𝐻1 =No existe interacción entre los operarios y las máquinas.

Calculamos variables:

Factor A Factor B Total Media N


1 219 54.75 2
A 2 222 55.50 2
3 230 57.5 2
Total 671 55.92 6
1 225 56.25 2
B 2 221 55.25 2
3 227 56.75 2
Total 673 56.08 6
1 217 54.25 2
C 2 220 55.00 2
3 233 58.25 2
Total 670 58.83 6
1 218 54.50 2
D 2 226 56.50 2
3 237 59.25 2
Total 681 56.75 6
TOTAL 1 879 219.75
2 889 222.25
3 927 231.75
TOTAL 2695 224.58 6

28
Tabla ANOVA:

(𝑋… )2 (2695)2
𝐶= = = 302626.04
𝑎𝑏𝑛 3𝑥2𝑥4
3 3 4
2
𝑆𝐶𝑇 = ∑ ∑ ∑(𝑋𝑖𝑗𝑘 ) − 𝐶 = (109)2 + (110)2 + ⋯ + (117)2  − 302626.04
𝐼=1 𝐽=! 𝑘=1

𝑆𝐶𝑇 = 262,97

3
1 1
𝑆𝐶𝐴 = ∑(𝑋𝑖.. )2 − 𝐶 = [(879)2 + (889)2 + (927)2  − 302626.04 = 12.46
3𝑥2 6
𝑖=!

3
1 1
𝑆𝐶𝐵 = ∑(𝑋.𝑗. )2 − 𝐶 = [(671)2 + (673)2 + (670)2 + (681)2  − 302626.04
4𝑥2 8
𝑖=!

𝑆𝐶𝐵 = 160.33

3 3 2
(𝑋𝑖𝑗. )
𝑆𝐶𝐴𝐵 = ∑ ∑ − (𝐶 + 𝑆𝐶𝐴 + 𝑆𝐶𝐵)
𝑛
𝐼=1 𝑗=!

(219)2 + (222)2 + ⋯ + (237)2


𝑆𝐶𝐴𝐵 = − (5302626.04 + 12.46 + 160.33)
4

𝑆𝐶𝐴𝐵 = 44.67

𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐴𝐵)


𝑆𝐶𝐸 = 262,97 − (12.46 + 160.33 + 44.67)
𝑆𝐶𝐸 = 45.50

FV SC GL CM F F(0.05)

29
A = máquinas 12.46 3 4.15 1.10 3.49
B = operarios 160.34 2 80.17 21.14 3.89
Interacción 44.67 6 7.45 1.96 3.00
Error 45.50 12 3.79

Total 262.97 23

Conclusión:

 Para los operarios:

Decisión: dado que 𝐹𝐵 = 21.14 < 3.89 se acepta la Ho


Interpretación: con el 95% de confianza se concluye, que la resistencia
de las fibras influenciado por los operarios es igual.

 Para las máquinas:

Decisión: dado que 𝐹𝐴 = 1.10 < 3.49 se acepta la Ho


Interpretación: con el 95% de confianza se concluye que la resistencia
de las fibras influenciado por las máquinas es igual.

 Para la interacción:

Decisión: dado que 𝐹𝐴𝑥𝐵 = 1.96 < 3.00 aceptamos la Ho


Interpretación: con el 95% de confianza se concluye que si existe
interacción entre los operarios y las máquinas.

30
PROBLEMA N° 5:
Suponiendo que se quiere investigar si la producción de tres diferentes
empresas es igual, tomando en cuenta la experiencia de los empleados a un
nivel de significancia del 5%.

Experiencia EMPRESAS
En años Emp1 Emp2 Emp3
1 29 23 27
2 33 35 37
3 44 41 41
4 40 43 39
5 47 48 47

Solución:

• HIPOTESIS:
HIPOTESIS PARA LAS COLUMNAS
Ho: El promedio de producción de las empresas son iguales.
H1: El promedio de producción de las empresas difiere en al menos una.

HIPOTESIS PARA LAS FILAS


Ho: Los años de experiencia de los empleados influyen en la producción de
igual forma.
H1: Los años de experiencia de los empleados influyen en la producción de
diferente forma.

• NIVEL DE SIGNIFICANCIA:
α = 0.05

31
Experiencia EMPRESAS

En años Emp1 Emp2 Emp3 TOTAL Promedios

1 29 25 28 82 27.33

2 35 36 39 110 36.67

3 44 41 41 126 42

4 40 43 42 125 41.67

5 47 49 47 143 47.67

TOTAL 195 194 197 T= 586

Promedios 39 38.8 39.4 39.07

• GLOBAL:
T = 586 T2 = 343396 N = 15

2
ƩƩ𝑋𝑖𝑗 =292 + 352 +… + 422 + 472 = 23622

𝑇2 343396
C= = = 22893.07
𝑁 15

• 𝑆𝐶𝑇 = ƩƩ𝑋𝑖𝑗2 − 𝐶
SCT = 23622– 22893.07
SCT = 728.93

1
• 𝑆𝐶𝐶 = 𝑟 Ʃ𝑘 𝑇𝑖2 − 𝑐
1952 + 1942 +1972
𝑆𝐶𝐶 = − 22893.07
5
SCC = 0.93

1
• 𝑆𝐶𝐹 = 𝐾 ∑𝑖𝑗=𝑖 𝑇𝐽2 − 𝐶
822 + 1102 +1262 +1252 +1432
𝑆𝐶𝐹 = − 22893.07
3
SCF = 698.26

32
• 𝑆𝐶𝐸 = 𝑆𝐶𝑇 − (𝑆𝐶𝐶 + 𝑆𝐶𝐹)
SCE = 728.93 – (0.93+ 698.26) = 29.74
TABLA ANOVA

ANOVA
Origen de Suma de Grados Cuadrados F Valor
Variaciones Cuadrados Libertad Medios Crítico
Columnas 0.93 2 0.465 0.47 4.46

Filas 698.26 4 87.28 88.07 3.84


Error 29.74 8 0.991

Total 728.93 12 ---------

CONCLUSION:

Para el caso de las empresas que son las columnas:


Decisión: Dado que Fo> Ft , no se rechaza la Ho
Interpretación: Se puede concluir que no existe diferencia significativa en
la producción en las empresas.

Para el caso de la experiencia que son los renglones:


Decisión: Dado que Fo< Ft , se rechaza la Ho
Interpretación: Se puede concluir que existe diferencia significativa en la
producción respecto a los años de experiencia de los empleados.

33
BIBLIOGRAFIA

 ANALISIS DE VARIANZA – JORGE VALLAS 2012


 ANOVA DE DOS VÍAS O DIRECCIONES (UN FACTOR BLOQUEADO) P.
Reyes / Sept. 2007

34