Professional Documents
Culture Documents
no Experimental de un Factor
Completamente Aleatorio
Juan Carlos Figueroa-Garca
Estadstica Inferencial - Ingeniera Industrial
Universidad Distrital
14/05/2015
Los Dise
nos de experimentos son modelos estadsticos clasicos cuyo objetivo
es averiguar si unos determinados factores influyen en una variable de interes,
y si existe influencia de alg
un factor, cuantificarla. Ejemplos donde habra que
utilizar estos modelos son los siguientes:
En el rendimiento de un determinado tipo de maquinas (unidades producidas por da) se desea estudiar la influencia del trabajador que la maneja
y la marca de la maquina.
Se quiere estudiar la influencia del tipo de pila electrica y de la marca en
la duraci
on de las pilas.
Se quiere estudiar el rendimiento de los alumnos en una asignatura y, para
ello se desean controlar diferentes factores: mtodo de enseanza; sexo del
alumno, etc.
Siempre se deben considerar los siguientes aspectos clave:
Se define una Variable de Inter
es a medir, que denotamos por y. Esa
variable es la que se mide y tabula con el fin de analizar los hallazgos.
Se establece un Factor o fuente de variacion que denotaremos pot .
Consideraremos un modelo que solamente considera un factor que tiene
diferentes niveles denotados por el subndice i a, donde cada uno de los
niveles del factor se conoce como Tratamiento. As pues, se tienen i
niveles del factor o a tratamientos.
Se deben definir una serie de Unidades Observacionales a las cuales se
les mide el efecto de uno de los tratamientos previamente establecidos. En
general se deben asignar el mismo nmero de unidades observacionales a
cada tratamiento con el fin de tener uniformidad en los grados de libertad.
De esta manera se tendran j n observaciones para cada tratamiento i,
en total tenemos a tratamientos y n observaciones por tratamiento, un
total de N = n a observaciones.
1
y11
y21
..
.
ya1
Observaciones
y11 y1n
y21 y2n
..
..
.
.
ya1
yan
Total
y1.
y2.
..
.
Promedio
y1.
y2.
..
.
ya.
y..
ya.
y..
y.. =
XX
i
yij ,
y.. =
y..
N
La idea principal del Analisis de Varianza se centra en evaluar si los tratamientos tienen efectos diferentes o no, lo cual implica que haya una diferencia entre
las medias de los tratamientos. Si las i medias son iguales, entonces no existe
variabilidad en la respuesta medida debido a los tratamientos, mientras que si
hay alguna media diferente a las dem
as, entonces existe un efecto debido a uno
de los tratamientos. Esto lo podemos expresar como la siguiente prueba de
hip
otesis:
H0 : 1 = 2 = = a
H1 : i 6= j
Si la hip
otesis nula se cumple, tenemos que la media global es igual a la
de los tratamientos i ya que no habra efecto alguno, se puede expresar como:
P
i
= i
a
Y adicionalmente se supone que bajo la hipotesis nula no existira efecto de
los tratamientos es cero:
X
i = 0
i
XX
=
=
XX
i
i
2
[(
yi. y.. ) + 2
2
(
yi. y.. ) +
XX
i
N
otese que:
2
(
yi. y.. )(yij yi. ) +
j
2
(yij yi. ) + 2
XX
i
XX
i
(yij yi. )2 ]
(
yi. y.. )(yij yi. )
XX
(
yi. y.. )(yij yi. ) = 0
i
[(
yi. y.. ) + (yij yi. )]2
XX
i
(2)
(3)
f0 =
M ST r
M SE
Suma de
Cuadrados
P
SST r =
yi. y.. )2
Pn Pi (
(yij yi. )2
SSE =
i
j
P P
.. )2
SST =
i
j (yij y
Grados de
Libertad
a1
N a
N 1
Cuadrado
Medio
MST r = SST r /a 1
MSE = SSE /N a
f0
f0 = MST r /MSE
Ejercicio de aplicaci
on.
La idea central del ejercicio es ver si existe alguna diferencia entre el n
umero
de llamadas abandonadas por hora a un Call center de acuerdo a alguna de 5
estrategias de enrutamiento que se probaron. As pues tenemos un u
nico factor
que es la estrategia de enrutamiento con 5 tratamientos que son cada una de
las estrategias adoptadas, donde se miden las llamadas perdidas por hora a 12
diferentes operadores por cada estrategia. Nuestra variable yij es en n
umero de
llamadas abandonadas y se asignaron 60 operadores (unidades observacionales)
en total, 12 por cada tratamiento.
Los datos se encuentran en el archivo anexo Call Center.txt. La primera
hiptesis que planteamos refiere a la idea que no existe efecto de las estrategias de
asignacion de llamadas a los operadores, es decir que en promedio las llamadas
perdidas son iguales para todos los tratamientos:
H0 : 1 = 2 = 3 = 4 = 5
H1 : i 6= j por lo menos para un par (i,j)
Dicha hip
otesis se constrasta con una Tabla ANOVA, cuyos resultados se
muestran a continuacion:
Fuente de
Variaci
on
Tratamientos
Error
Total
Suma de
Cuadrados
47.43
86.75
134.18
Grados de
Libertad
4
55
59
Cuadrado
Medio
11.86
1.58
f0
7.52