You are on page 1of 12

Capitulo 3

3.1

Experimentos de Factor Simple: Anlisis de Varianza

Un Ejemplo
Un ingeniero de materiales esta interesado en maximizar la resistencia a la traccin de una
nueva fibra sinttica que ser empleada en la industria textil. Por experiencia previa, el
ingeniero sabe que el contenido de algodn afecta la resistencia. Es ms, el sospecha que un
incremento en el contenido de algodn, incrementar la mencionada resistencia; por ello, decide
llevar a cabo pruebas de resistencia con fibras que contienen 15, 20, 25, 30 y 35 % de algodn
(niveles de contenido de algodn). Para ejecutar las pruebas, decide emplear cinco muestras por
cada nivel de contenido.
Lo arriba mencionado es un ejemplo de un experimento de factor simple con a = 5 niveles del
factor y n = 5 replicas. Los 25 experimentos deben ser ejecutados en un orden totalmente
aleatorio. Para controlar la aleatoriedad de los experimentos, se procede de la siguiente manera:
1.

Se enumeran las muestras como se muestra en la Tabla 3.1


Contenido
de Algodn
(%)
15
20
25
30
35
Tabla 3.1

2.

Nmero de Muestra
1
6
11
16
21

2
7
12
17
22

3
8
13
18
23

4
9
14
19
24

5
10
15
20
25

Identificacin de los Experimentos por el Contenido de Algodn

Con la ayuda de una calculadora se seleccionan nmeros aleatorios del 1 al 25 como se


ve en la Tabla 3.2. Los nmeros aleatorios corresponden al nmero de muestra cuya
resistencia ser probada. Por ejemplo, si el primer nmero aleatorio obtenido en la
calculadora fue el ocho, entonces la muestra con 20 % de algodn ser la primera en ser
analizada y as sucesivamente.
Esta secuencia aleatoria de pruebas es necesaria para prevenir efectos de variables
desconocidas. Para ilustrar lo dicho, supngase que los 10 primeros experimentos se
llevaron a cabo de la manera indicada en la Tabla 3.1. En estas condiciones, la maquina
empleada puede mostrar un comportamiento "dirigido"; es decir, mostrar mayores
valores de deformacin cuanto mayor sea el tiempo que funcione o reaccionar de
manera lenta cuando ocurre un cambio en la composicin de la muestra.

Jaime Ortega PhD

26

Secuencia de las pruebas


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
17
19
20
21
22
23
24
25

Contenido de Algodn

8
18
10
23
17
5
14
6
15
20
9
4
12
7
1
24
21
11
2
13
22
16
25
19
3
Tabla 3.2

3.

Nmero de muestra

20
30
20
35
30
15
25
20
25
30
20
15
25
20
15
35
35
25
15
25
35
30
35
30
15

Secuencia de Experimentos

Se ejecutan los experimentos y los resultados se registran como se muestra en la Tabla


3.3
De la Tabla 3.3 se extraen dos conclusiones: (i) el contenido de algodn afecta a la
resistencia a la traccin y (ii) alrededor de un 30 % de algodn otorga la mayor
resistencia; sin embargo, el anlisis debe ser ms objetivo y detallado: se debe analizar
si las diferencias observadas de las medias son realmente significativas y el nivel de
confianza con el que se dan dichas diferencias. En otras palabras, el investigador est
interesado en probar la igualdad de las cinco medias. Aparentemente, este problema
podra resolverse haciendo un anlisis de Pares de Comparacin.

Contenido
de Algodn
(%)

Observaciones
(en kg/cm2)
1
7
12
14
19
7

15
20
25
30
35
Tabla 3.3

2
7
17
18
25
10

3
15
12
18
22
11

4
11
18
19
19
15

5
9
18
19
23
11

total
49
77
88
108
54
376

media
9.8
15.4
17.6
21.6
10.08
15.04

Resultados del Experimento con Cinco Niveles de Contenido de Algodn

Tal solucin sera incorrecta. Existen 10 posibles pares los que, examinados a un nivel de
confianza del 95 % cada uno (1 0.95), arrojaran en conjunto un nivel de significacin
del (0.95)10 0.60. Es decir, existira un substancial incremento del error del tipo I.
El
procedimiento apropiado para examinar la igualdad de varias medias es el Anlisis de Varianza.
3.2

Anlisis de Varianza
En general, la Tabla 3.3 pude ser escrita en trminos de la Tabla 3.4
Tratamiento
(nivel)

Observaciones
1

...

total

media
muestral

media
poblacional

y11

y12

...

y1n

Y1

y21

y22

...

y2n

Y2

.
.

.
.

.
.

...
...

.
.

.
.

.
.

.
.

ya1

ya2

...

yan

Ya

Tabla 3.4

Datos de un Experimento de Factor Simple

Una entrada u observacin en la Tabla 3.4 representa la j-sima observacin bajo el tratamiento
i. Las observaciones de la Tabla 3.4 pueden ser descritas por un modelo estadstico lineal :
i
1,2,......a
j

1,2,......n

y ij i
ij

donde

(3.1)

y ij es la i - esima, j - esima observacin

es la media total (global)


i es un efectodebido al tratamiento i
ij es el error aleatorio con media 0 , varianza i 2 ,
independiente y distribuido normal
A este modelo se le llama " Anlisis de Varianza de Factor Simple" pues se investiga un slo
factor. Con respecto a los tratamientos o niveles, la Eq. 3.1 describe dos situaciones diferentes:
1. Los niveles o tratamientos ha sido escogidos por el investigador. Este modelo se conoce
como "Modelo de Efectos Fijos".
2. Los niveles o tratamientos ha sido escogidos al azar. Este modelo se conoce con el nombre
de "Modelo de Efectos Aleatorios" o "Modelo de Varianza de Componentes".
3.3

Anlisis del Modelo de Efectos Fijos


En este modelo, los efectos de tratamientos i , se definen como desviaciones de la media total,
es decir que se cumple:
a

i 1

Ahora, considrense las siguientes definiciones:


Yi = total de observaciones bajo el tratamiento i
y i = media de las observaciones bajo el tratamiento i
Y = gran total de las observaciones
Y = media total de las observaciones

(3.2)

Expresado simblicamente se tiene:


n

Yi y ij

y i Yi /
n

j 1

Y
i 1

ij

i 1,2,......., a

Y Y/N

j 1

(3.3)
donde N = an , es el numero total de observaciones.
La media o valor esperado del tratamiento i es:
Ei ( yij ) i
i

i 1, 2,.......,
a

(3.4)

La Eq. 3.4 indica que la media del tratamiento i es la suma de la media global y del efecto de
dicho tratamiento.
El investigador esta interesado en probar la igualdad de medias. Esto es:
Ho : 1 2 3 ........... a
H1 : i
j

para al menos un
par

i, j
(3.5)

Por efecto de la Eq. 3.4 lo anterior puede ser re-escrito como:


Ho : 1 2 3 ........... a
H1: i
j

para al menos un
par

i, j
(3.6)

De la Eq. 3.6 se concluye que se puede probar la igualdad de medias mediante el examen de la
igualdad de los efectos de tratamiento. El procedimiento apropiado para probar " igualdad de
efectos de tratamiento " es el Anlisis de Varianza.
3.3.1 Descomposicin de la Suma Total de Cuadrados
El nombre de Anlisis de Varianza se deriva de la particin de la variabilidad total en sus
componentes. La suma total de cuadrados
a

SCT

(y

ij

Y )

2
i 1 j 1

(3.7)

se utiliza como una medida de la variabilidad total.1 La Eq. 3.7 puede ser re-escrita como sigue:

y
a

i 1 j 1

2
Y [( yi Y ) ( yij yi )]
a

ij

i 1 j 1

ordenando:
a

(y

Y ) 2 n ( y i Y2
)

ij

i 1 j 1

i 1

(y

ij

yi )
2

i 1 j 1

(3.8)
La Eq. 3.8 indica que la variabilidad total de los datos es igual a la suma de los cuadrados de las
diferencias entre las medias de los tratamientos y la media total; mas la suma de los cuadrados
de las diferencias entre las observaciones y las medias de cada tratamiento. La Eq. 3.8 se puede
escribir como:
SCT SCt
SCe
donde SCt es la suma de cuadrados debido a los tratamientos (niveles) y SCe es la suma de
cuadrados debido al error.
Considere ahora la suma de cuadrados debido al error:
a

SCe
yi )

( y ij

i 1 j 1

i 1

(y

ij

y i2)

j 1

(3.9)

De esta manera, se ve que el trmino dentro de los parntesis cuadrados dividido entre n-1, es la
varianza muestral del tratamiento i . Es decir:
n

2
i

(y

ij

yi 2
i 1,2,......., a

j 1

n1
Substituyendo en la Eq. 3.9 se tiene:

SCe
( N a)

(y

i 1

j 1
a

ij


y i )2

(n
1)

i 1(n 1) S i

i 1

CM

( N a)

1Esto

(3.10)

es razonable pues, se se divide SCT entre el nmero de grados de libertad, an - 1 = N - 1 ,se estara en presencia de la
varianza muestral misma que es una medida estndar de variabilidad.

La Eq. 3.10 es una estimacin de la varianza comn dentro de cada uno de los a tratamientos.
De manera similar, el termino
a

SCt
(a 1)

n ( yi Y2)
i 1

(a 1)

CM t
(3.11)

Es una estimacin de la variabilidad entre tratamientos.


Si no hubiesen diferencias entre las medias de los tratamientos, yi , ambas estimaciones
debieran ser muy similares. Si no lo fueran, se debe sospechar que la diferencia observada debe
ser una consecuencia de las diferencias entre las medias de los tratamientos. Los trminos de las
ecuaciones 3.10 y 3.11 se conocen como "cuadrados medios". Es posible demostrar que los
valores esperados de estos cuadrados medios son:
a

E(CM e ) 2 y E(CM t )
2

n i
i 1

a1

(3.12)

Como se dijo antes, los cuadrados medios son estimaciones de la varianza poblacional y por
tanto, si no existen diferencias entre las medias de los tratamientos ( i 2 0) , entonces los
valores esperados de ambos estimadores sern idnticos e iguales a la varianza poblacional.
3.3.2 Anlisis Estadstico
En base al anlisis anterior, en esta seccin se investigar de manera formal el examen de
hiptesis de la Eq. 3.6. Dado que se asumi que el error ij es independiente y se distribuye
normal con media 0 y varianza 2 , entonces las observaciones yij son independientes y se
distribuyen normal con media i y varianza 2 .
En virtud del Teorema de Cochran , si el termino SCT es una suma de cuadrados de variables
aleatorias normales y la hiptesis nula Ho : i 0 es verdadera, entonces se cumple lo siguiente:
1.

SCT / 2 se distribuye Chi-cuadrado con N-1 grados de libertad.

2.

SCe / 2 se distribuye Chi-cuadrado con N-a grados de libertad.

3.

SCt / 2 se distribuye Chi-cuadrado con a-1 grados de libertad.

4. Fo CMt /
CMe

se distribuye F con a-1 y N-a grados de libertad.

Sin embargo, si la hiptesis nula es falsa, el termino E (CMt ) es mayor a 2 (Eq. 3.12) y Ho
deber ser rechazada cuando Fo F, a 1, N a .
Ejemplo
Para ilustrar el anlisis de varianza, considrese la Tabla 3.3.
Contenido
de Algodn
(%)

15
20
25
30
35

Observaciones
(en kg/cm2)
1

7
12
14
19
7

7
17
18
25
10

15
12
18
22
11

11
18
19
19
15

9
18
19
23
11

totales
Yi
49
77
88
108
54
Y =376

medias
yi
9.8
15.4
17.6
21.6
10.08
Y = 15.04

La sumas de cuadrados se calculan mediante:


5

SCT
Y
i 1

j 1

yij 2

636.96

Yi 2 Y 2
475.76

N
i 1 n
5

SCt

SCe SCT SCt 161.20


Adems: Fo 118.94 / 8.06 14.76. Si se adopta un F0.01,4,20 4.43 , entonces se rechaza Ho
y se concluye que el contenido de algodn en las fibras afecta significativamente su resistencia
a la traccin.
3.3.3 Estimacin de los Parmetros del Modelo
En esta seccin se desarrollaran estimadores de los parmetros del Modelo de Factor Simple
(Eq. 3.1) empleando el mtodo de mnimos cuadrados. Cuando se estiman y i mediante
mnimos cuadrados, ya no es necesario asumir que los errores ij son independientes y que se
distribuyen normalmente. Para encontrar los estimadores mnimos cuadrados de y i se
desarrolla la suma de los cuadrados de los errores .....

i 1 j 1

2
ij

( y

i 1 j 1

ij

2i )

(3.13)
y i , estimadores de y i , que minimicen L. Es decir, se resuelve

....y se eligen valores

el sistema de ecuaciones que se origina de:


L

,
i

L
i

, i

El sistema es:
N n1 n2 ... n
a

n1
n
n2

.
n

Y1
Y2
. .
Ya

(3.14)

Las a+1 ecuaciones arriba expresadas se llaman ecuaciones normales de mnimos cuadrados
mismas que no son linealmente independientes y por tanto no tienen un sola solucin. Esta
problema puede solucionarse mediante la Eq. 3.2 que establece que los efectos de los
tratamientos son desviaciones de la media. Con dicha condicin, las soluciones a la Eq. 3.14
son:

Y

i y i Y

i
1,2,.....a

(3.15)

Esta solucin establece que la media global es estimada por la media total de las observaciones
y que cualquier efecto de tratamiento es la diferencia entre la media del tratamiento y la media
total de las observaciones.
Puede demostrarse que un intervalo de confianza de la media de un tratamiento esta dado por:

yi t / 2, N a CM e / n
y de la diferencia de medias entre dos tratamientos por:
yi y j t / 2, N a 2CM e / n

3.4

Comparacin de Medias de Tratamiento Individuales


Supngase que al llevar a cabo un anlisis de varianza en el modelo de efectos fijos se rechaza
la hiptesis nula lo que implica la existencia de diferencias entre las medias de tratamientos. En
estas circunstancias, otras comparaciones entre grupos de medias de tratamientos suelen ser
muy tiles. Comparaciones entre medias de tratamientos son hechas en trminos de totales de
Tratamientos, Y i , o medias de tratamientos, yi .Los procedimientos para llevar a cabo
estas comparaciones se denominan "Mtodos de Comparacin Mltiple".

3.4.1 Comparacin Grfica de Medias


Supngase que el factor de inters tiene a niveles (tratamientos) y que por tanto existen a (
y1 , y2 , y3 ,.... ya ) medias de tratamiento. Si se conociera , cualquier media de tratamiento
tendra un desviacin estndar igual a / n . En consecuencia, si todas la medias de los
distintos niveles fuesen idnticas, las media muestrales observadas, yi , se comportaran como si
fuesen un grupo de observaciones extrado al azar de una distribucin normal con media Y y
desviacin / n . Si no se conoce , se la puede reemplazar por su estimador expresado en la
Eq. 3.12, es decir por CMe , siendo por tanto la desviacin estndar (factor de escala) igual a
CM e / y "t" la distribucin a emplearse. El procedimiento consiste en multiplicar valores de
n
la absisa (factor en estudio) por el factor de escala y reconstruir la curva "t" con dichos valores
de absisa (valores de ordenadas puede extraerse de Box, Hunter y Hunter. 1978). Luego, en la
"nueva" absisa, se localizan los valores medios observados y se observa si dichas medias se
comportan como tpicas observaciones tomadas al azar de la poblacin. Es decir, si las
ordenadas de las medias estn dentro de la grfica, estn prximas y no muestran una secuencia
definida.

You might also like