You are on page 1of 49

METODOLOGIA DE

INVESTIGACION
I Semestre 2012
Diseo completamente aleatorizado
Experimentos estadsticos
Los experimentos son parte natural en el proceso
de la toma de decisiones en la ingeniera y las
ciencias.

Montgomery define un experimento como una
prueba o serie de pruebas en las cuales se hacen
cambios controlados a las variables de entrada de
un proceso o sistema para observar e identificar
las razones de los cambios en la respuesta de
salida.

Experimentos estadsticos
Diseo estadstico de experimentos
o El diseo estadstico de experimentos es el
proceso de planear el experimento de tal manera
que se puedan analizar por mtodos estadsticos
los datos recolectados y que resulten en
conclusiones objetivas y vlidas.

El propsito de un diseo de experimentos es
ofrecer la mxima cantidad de informacin al
mnimo costo. Es decir, al planear un experimento
se debe esforzar por lograr eficiencia estadstica y
economizar recurso.


Elementos de un experimento
Factor: caracterstica cuyo efecto se quiere medir

Nivel: categora del factor

Tratamiento: combinacin de niveles de los
factores.

Unidad experimental: es la subdivisin menor del
material experimental que puede recibir un
tratamiento en forma independiente

Elementos de un experimento
El tamao de la muestra es el nmero de unidades
experimentales que reciben el mismo tratamiento.

Variable de respuesta: es lo que se va a medir en
cada unidad experimental.

Diseo experimental: es la forma de asignar los
tratamientos a las unidades experimentales.

El diseo determina el modelo y el anlisis
estadstico a seguir.

Elementos de un experimento
Aleatorizacin: sirve para controlar factores de
variacin no incluidos. Se busca eliminar sesgos
sistemticos y justificar la independencia de los
errores.

Bloque: grupo de unidades experimentales ms o
menos homogneos.

El uso de bloques es la inclusin en el diseo de
un factor que, aunque no es de inters, podra
causar una variacin en las unidades
experimentales.
Elementos de un experimento
El uso de bloques tiene como objeto el control de
factores de variacin en forma explcita,
disminuyendo la varianza de los errores.

En general son las posiciones en el tiempo y en el
espacio.

Las repeticiones (rplicas) son el nmero de
unidades experimentales a las que se aplica, en
forma independiente, un tratamiento.

Incrementan la precisin del experimento. A
mayor nmero de repeticiones menor la varianza
de los estimadores.




Elementos de un experimento
Error experimental: describe la variacin entre
unidades experimentales idntica e
independientemente tratadas.

Se origina por:

a) Variacin natural entre unidades experimentales.

b) Variabilidad en la medicin de la respuesta.

c) Incapacidad de reproducir las condiciones de los
tratamientos exactamente en las unidades
experimentales

Elementos de un experimento

d) Interaccin de tratamientos y unidades
experimentales.

e) Cualquier otro factor externo que afecte las
caractersticas medidas.

Pasos en el diseo de un experimento
1. Identificacin del problema

Solicitar aportes de todas las reas involucradas
para definir claramente los objetivos del
experimento.
Lista de los problemas o preguntas a abordarse en
el experimento o en una serie de experimentos.

2. Eleccin de factores, los niveles y los rangos
Factores que pueden influir en el desempeo de un
proceso. Factores que el experimentador desee
hacer variar en el experimento. Factores que se
mantiene constante. Factores no controlables o de
ruido
Pasos en el diseo de un experimento
3. Seleccin de la variable de respuesta
La variable de respuesta debe proporcionar
informacin til sobre el proceso. Se debe tener en
consideracin la precisin del instrumento de
medicin.

4. Eleccin del Diseo del experimento
Se debe tener en cuenta:
Nmero de rplicas
La seleccin de un orden de corridas adecuado para
los ensayos experimentales
Si es necesario formar bloque u otras restricciones
en la aleatorizacin
Pasos en el diseo de un experimento
5. Realizacin del experimento:
Es importante monitorear el experimento de
acuerdo a lo planeado. Muchas veces es necesario
realizar corridas de prueba.

6. Anlisis Estadstico de los datos
Uso de paquetes estadstico y chequeo de
supuestos.

7. Conclusiones y Recomendaciones:
Una vez analizado los datos, se debe obtener
conclusiones prcticas acerca de los resultados.
Ejemplo
Suponga que un ingeniero desea probar el efecto
de ltex en la resistencia del cemento.

Se tienen 10 observaciones de la resistencia para
la frmula con ltex (modificada) y otras 10 para
la frmula usual.

Este experimento podra usarse para determinar la
frmula que consiga la resistencia a la compresin
media mxima.
Ejemplo











Ejemplo











Ejemplo
En este caso se tiene un solo factor de inters (el
ltex) y slo hay 2 tratamientos o niveles del
factor (modificada y usual) con 10 observaciones
o repeticiones.

Ejemplo
Veamos otro ejemplo. En un proceso industrial la
purificacin de un producto puede realizarse
mediante 5 procedimientos distintos, midindose
el resultado a travs de un residuo.

Se desea probar que los 5 procedimientos son
igualmente eficaces.

Las cantidades de residuos (en gr.) medidas en
m.a. del producto fueron:
Ejemplo
I II III IV V
Observacio
nes
Procedimientos
Medias
51, 8 71, 3 50, 2 51, 5 71, 3
50, 9 50, 4 51,1 49, 6 70, 0
48,1 67, 0 49, 6 50, 6 60, 3
51, 3 69, 7 50, 3 50, 0 69, 3
50, 2 50, 7 48, 7
68, 4 49, 6
49, 2
50, 46 62, 92 50, 3 49,89 67, 73
1
2
3
4
5
6
7
Ejemplo
Este es un ejemplo de un experimento con un solo
factor completamente aleatorizado con 5 niveles
del factor.

Se obtienen los 26 resultados en orden aleatorio.
El papel de la aleatorizacin es disminuir el efecto
de cualquier variable perturbadora que pueda
influir.

Cada nivel (o tratamiento) tiene un nmero de
observaciones o repeticiones distinto.

Para determinar si las medias son iguales o no se
utiliza el anlisis de varianza.

El Anlisis de varianza
El Anlisis de varianza es una tcnica estadstica
para comprobar si son iguales las medias de ms
de dos poblaciones mediante el anlisis y la
comparacin de diversos tipos de varianzas
muestrales.

Tcnica introducida por R. Fisher (1920) originada
en aplicaciones agrcolas.

El nombre de Anlisis de Varianza (ANOVA) de
esta prueba de varias medias proviene de que el
mtodo se basa en la comparacin de varianzas
estimadas de diversas fuentes.


El Anlisis de varianza
Cada mtodo de anlisis de varianza est
asociado a un modelo matemtico especfico.

Los modelos se clasifican segn el nmero de
variables que se deben probar.

Si es una variable, el modelo se llama de
clasificacin simple o de un solo factor.

Si son dos variables, el modelo se llama de
clasificacin doble o de dos factores.
Anlisis de Varianza de un factor
Diseo completamente aleatorizado

Este diseo se caracteriza por la suposicin de
que las unidades experimentales son muy
homogneas.

Sea X una caracterstica que se mide en k
poblaciones (tratamientos) diferentes.

Con medias respectivas y
varianzas respectivas
k
..., , ,
2 1
2 2
2
2
1
..., , ,
k
o o o
Anlisis de Varianza de un factor
Las suposiciones del ANOVA son:

1. Las k poblaciones son independientes (o las k
muestras son independientes)
2. Cada una de las poblaciones tiene distribucin
normal
3. Las k varianzas son iguales a la varianza comn

Las k poblaciones juntas forman una poblacin
mayor cuya media (media total o gran media) es
) , (
2
i i
N o
2
o
k
k
i
i
=
=
1

Anlisis de Varianza de un factor


Para cada sea una
muestra aleatoria simple de tamao
escogida en la i-sima poblacin.

Estas k muestras forman los subgrupos
que se suponen son independientes.

Es decir, con los supuestos hechos, cada
una de estas k muestras consiste de
variables aleatorias independientes
supuestas normales
k i ..., , 2 , 1 =
i
in i i
X X X ..., , ,
2 1
i
n
i
n
) , (
2
o
i
N
Anlisis de Varianza de un factor
Por lo tanto, las variables aleatorias que
denotan la j-sima observacin de la i-sima
muestra son
independientes y tienen cada una
distribucin normal

En el modelo de clasificacin de un factor
completamente aleatorizado los valores
de las k muestras se registran en un arreglo
como la siguiente tabla
) ..., , 2 , 1 , ..., , 2 , 1 (
i
n j k i = =
ij
X
) , (
2
o
i
N
ij
X
Anlisis de Varianza de un factor
Tratamientos
Total
Medias
k i 2 1
- - - - k i
T T T T
2 1
- - - - k i
x x x x
2 1
k i
n n n n
2 1
i
n
- -
T
n
- -
x
k i
kn in n n
k i
k i
x x x x
x x x x
x x x x




2 1
2 1
2 2 22 12
1 1 21 11
Anlisis de Varianza de un factor
Donde:

es la suma de datos de la muestra i
es el total de datos de las k muestras
es el total observado en
las k muestras
es la media de la muestra i
media total muestral

- i
T
- -
T
n n n n
k
= + + +
2 1
- -
x
- i
x
Anlisis de Varianza de un factor
El modelo del ANOVA

Cada observacin de la muestra se
expresa en la forma:

Donde mide la desviacin del dato
observado con respecto a la media

Esta desviacin se llama error o residuo.
ij
X
ij i ij
X c + =
ij
c
ij
X i

Anlisis de Varianza de un factor


Como las variables aleatorias son
independientes y tienen cada una distribucin
normal , las son variables aleatorias
independientes con distribucin normal

Por otro lado, cada media se desva de la
media total una cantidad

Este desvo se llama efecto del i-simo
tratamiento.

Ntese que
ij
X
ij
c
i

) , (
2
o
i
N
) , 0 (
2
o N
o =
i i

=
=
k
i
i
1
0 o
Anlisis de Varianza de un factor
En resumen, para el modelo de clasificacin
de un factor completamente aleatorizado


Donde

son variables aleatorias independientes y
normales
son variables aleatorias independientes y
normales
es la media total
es el efecto del tratamiento i.
ij i ij i ij
X c o c + + = + =
ij
c
ij
X

i
n j k i ..., , 2 , 1 , ..., , 2 , 1 = =

=
=
k
i
i
n n
1
) , (
2
o
i
N
) , 0 (
2
o N
o =
i i
Anlisis de Varianza de un factor
Las hiptesis del ANOVA

La hiptesis nula (H
0
) consiste en afirmar que las
medias de las k poblaciones (tratamientos) son
iguales (o las k muestras provienen de la misma
poblacin)

Dado que es equivalente a la
hiptesis nula consiste tambin en afirmar que no
hay efecto en los tratamientos.

La hiptesis alterna es,
H
1
: no todas las medias son iguales.
H
1
: al menos una de las no es igual a cero.

k
H = = =
2 1 0
:
=
i
0 =
i
o
i
o
Anlisis de Varianza de un factor
El anlisis

Suma de cuadrados total (SCT):

De la relacin
se obtiene la identidad de suma de cuadrados



Que se representa por:

SCT = SCE + SCC

- -

2
) ( x x
ij
- - - - - -
+ = x x x x x x
i i ij ij

= =
- - -
= =
-
= =
- -
+ =
k
i
n
j
i
k
i
n
j
i ij
k
i
n
j
ij
i i i
x x x x x x
1 1
2
1 1
2
1 1
2
) ( ) ( ) (
Anlisis de Varianza de un factor
Donde
SCE es la suma de cuadrados del error
(o dentro de los tratamientos)
SCC es la suma de cuadrados de las columnas
(o entre los tratamientos)

Se puede demostrar que

=
+ =
k
i
i i
n k SCC E
1
2 2
) 1 ( ) ( o o

=
+ =
k
i
i i
n n SCT E
1
2 2
) 1 ( ) ( o o
2
) ( ) ( o k n SCE E =
Anlisis de Varianza de un factor
De la primera esperanza se tiene que
es una estimacin insesgada de la varianza
(independiente que H
0
sea verdadera o falsa)

Si la hiptesis nula es verdadera,
entonces de la segunda y tercera esperanza, se
tiene que y son
estimaciones insesgadas de

Las tres estimaciones insesgadas de la varianza
comn se denominan cuadrados medios y
son llamados respectivamente para el error, para
las columnas y para el total, CME, CMC y CMT
2
o
) ( k n SCE
0 :
0
=
i
H o
) 1 ( k SCC ) 1 ( n SCT
2
o
2
o
Anlisis de Varianza de un factor
Es decir:

Cuadrados medios para el error (CME):


Cuadrados medios para las columnas (CMC):


Cuadrados medios para el total (CMT):
) ( k n SCE
) 1 ( k SCC
) 1 ( n SCT
Anlisis de Varianza de un factor
Luego, es de esperar que el cociente CMC/CME
sea cercano a uno si la hiptesis nula es
verdadera.

Pero, si la hiptesis nula no es verdadera CME no
cambia, mientras que CMC ser mayor. O sea, que
el cociente ser mayor que la unidad.

De aqu se concluye que si CMC/CME es
significativamente grande las medias de las
poblaciones son distintas.
Anlisis de Varianza de un factor
La variable aleatoria se distribuye como
chi-cuadrado con k-1 grados de libertad

La variable aleatoria se distribuye como
chi-cuadrado con n-k grados de libertad

Por lo tanto si la hiptesis nula es verdadera el
cociente


se distribuye segn
es decir, la variable aleatoria F tiene distribucin F
con k-1 y n-k grados de libertad.
2
o SCC
( )
2
1 k
_
2
o SCE
( )
2
k n
_
| |
| | CME
CMC
k n SCE
k SCC
F =

=
) (
) 1 (
2
2
o
o
( ) k n k F , 1
Anlisis de Varianza de un factor
Dado el nivel de significacin para los grados
de libertad k-1 y n-k, en la tabla F se encuentra
el valor crtico

Por otro lado, a partir de los datos observados
de la muestra se calcula:

La regla de decisin es: rechazar la hiptesis
nula H
0
si

En caso contrario no rechazar H
0



o
k n k
F
, 1 , 1 o
CME
CMC
F =
k n k
F F

>
, 1 , 1 o
Anlisis de Varianza de un factor
La regin de rechazo de H
0
de la prueba es la
regin sombreada en el grfico.

k n k
F
, 1 , 1 o
Regin de
rechazo
Anlisis de Varianza de un factor
Las sumas de cuadrados del total, de las columnas
y del error se calculan con las sgtes equivalencias:







Las sumas de cuadrados, los grados de libertad,
los cuadrados medios y la F se resumen en una
tabla llamada de anlisis de varianza o tabla
ANOVA.
n
T
x x x SCT
k
i
n
j
ij
k
i
n
j
ij
i i
2
1 1
2
1 1
2
) (
- -
= = = =
- -

|
|
.
|

\
|
= =

n
T
n
T
x x SCC
k
i
i
i
k
i
n
j
i
i
2
1
2
1 1
2
) (
- -
=
-
= =
- - -

|
|
.
|

\
|
= =

SCC SCT SCE =
Anlisis de Varianza de un factor
Tabla ANOVA de un factor completamente
aleatorizado.
) 1 ( = k SCC CMC
Fuente de
variacin
Suma de
Cuadrados
grados de
libertad
Cuadrados
medios
F
Tratamientos
(columnas)
SCC K-1
Error SCE n-k
Total SCT n-1
) ( k n SCE CME =
CME
CMC
F =
Anlisis de Varianza de un factor: ejemplo
Veamos el ejemplo anterior. En un proceso
industrial la purificacin de un producto puede
realizarse mediante 5 procedimientos distintos,
midindose el resultado a travs de un residuo.

Se desea probar, a un nivel de significancia del
5%, que los 5 procedimientos son igualmente
eficaces.

Las cantidades de residuos (en gr.) medidas en
m.a. del producto fueron:
Anlisis de Varianza de un factor: ejemplo
I II III IV V
Observacio
nes
Procedimientos
Total
Media
51, 8 71, 3 50, 2 51, 5 71, 3
50, 9 50, 4 51,1 49, 6 70, 0
48,1 67, 0 49, 6 50, 6 60, 3
51, 3 69, 7 50, 3 50, 0 69, 3
50, 2 50, 7 48, 7
68, 4 49, 6
49, 2
50, 46 62, 92 50, 3 49,89 67, 73
1
2
3
4
5
6
7
252, 3 377, 5 201, 2 349, 2 270, 9
1451,1 T
--
=
Anlisis de Varianza de un factor: ejemplo
Sea la media de los residuos del grupo i,
i=1,2,3,4,5.

1. Hiptesis:
: No todas las medias son iguales
2. Clculos:



0 1 2 3 4 5
: H = = = =
i

1
H
2 2
2 2 2 2 2
1 1
1451,1
51,8 50, 9 60, 3 69, 3 1940, 2865
26
i
n
k
ij
i j
T
SCT x
n
--
= =
| |
= = + + + + =
|
\ .

2 2 2 2 2 2
1
252, 3 377, 5 270, 9 1451,1
... 1381,1301
5 6 4 26
k
i
i
i
T T
SCC
n n
- --
=
| |
= = + + + =
|
\ .

1940, 2865 1381,1301 559,1564 SCE SCT SCC = = =


Anlisis de Varianza de un factor: ejemplo
adems k=5, n=26 y







3. Decisin: de la tabla

como se rechaza H
0


Estos datos se resumen en la tabla siguiente:
1381,1301
345, 283
1 4
SCC
CMC
k
= = =

345, 0325
12, 968
559,1564
CMC
F
CME
= = =
559,1564
26, 626
26 5
SCE
CME
n k
= = =

1 , 1, 0,95, 4,21
2, 84
k n k
F F
o
= =
05 , 0 = o
0,95, 4, 21
12, 97 2, 84 F F = > =
Anlisis de Varianza de un factor: ejemplo
Tabla ANOVA para el ejemplo
Fuente de
variacin
Suma de
Cuadrados
grados de
libertad
Cuadrados
medios
F
Procedimientos 1381,1301 4 345,283
12,968
Error 559,1564 21 26,626
Total 1940,2865 25
Anlisis de Varianza de un factor: ejemplo
Anlisis de Varianza de un factor: ejemplo

You might also like