You are on page 1of 10

3-7 DETERMINACIN DEL TAMAO DE LA MUESTRA

3~7

107

DETERMINACIN DEL TAMAO D LA MUESTRA

En cualquier problema de diseo experimental, una decisin crtica es la eleccin del tamao de la muestra; es decir, determinar el nmero de rplicas que deben correrse. En general, si el experimentador tiene
inters en detectar efectos pequeos, se necesitan ms rplicas que cuando el experimentador se interesa
en detectar efectos grandes. En esta seccin se analizan varios enfoques para determinar el tamao de la
muestra. Aun cuando la revisin se centra en un diseo con un solo factor, la mayora de los mtodos pueden usarse en situaciones experimentales ms complejas.
3~7.1

Curvas de operacin caracterstica

Recuerde que una curva de operacin caracterstica es una grfica de la probabilidad del error tipo II de
una prueba estadstica para un tamao de la muestra particular contra un parmetro que refleja la medida en que la hiptesis nula es falsa. El experimentador puede usar estas curvas como gua en la seleccin
del nmero de rplicas para que el diseo sea sensible a diferencias potenciales importantes en los tratamientos.
Se considera la probabilidad del error tipo II del modelo con efectos fijos para el caso en que se usa el
mismo tamao de las muestras en cada tratamiento, por ejemplo

f3 = 1- p{Rechazar H oIH o es falsa}

= 1- p{ Fo > Fa ,a-l,N-al H o es falsa}

(3-47)

Para evaluar el enunciado de probabilidad de la ecuacin 3-47, es necesario conocer cul es la distribucin del estadstico de pruebaFosi la hiptesis nula es falsa. Puede demostrarse que, si H oes falsa, el estadstico F o = MSTralamienloJMSE se distribuye como una variable aleatoria F no central con a - 1 YN - a
grados de libertad y parmetro de no centralidad 15. Si 15 = O, la distribucinF no central se convierte en la
distribucin F (central) comn.
Las curvas de operacin caracterstica que se presentan en la parte V del apndice se usan para evaluar el enunciado de probabilidad de la ecuacin 3-47. En estas curvas se grafica la probabilidad del error
tipo II (/3) contra un parmetro <1>, donde

<1>2

n! T

= ----,-i 1-::-_
= -'C

aa 2

(3-48)

La cantidad <lJ2 est relacionada con el parmetro de no centralidad 15. Se cuenta con curvas para a = 0.05
Ya = 0.01 Y un rango de grados de libertad para el numerador y el denominador.
Al usar las curvas de operacin caracterstica, el experimentador debe especificar el parmetro <1>.
Con frecuencia es difcil hacer esto en la prctica. Una manera de determinar <1> es elegir los valores reales
de las medias de los tratamientos para los que querra rechazarse la hiptesis nula con una alta probabilidad. Por lo tanto, si /-l1' /-l2' .oo, /-la son las medias de los tratamientos especificadas, la Ti de la ecuacin 3-48
se encuentra como Ti = /-li - , donde = (l/a)~ :=1 =lf-li es el promedio de las medias de los tratamientos
individuales. Se requiere asimismo una estimacin de 02. En ocasiones se cuenta con este valor por experiencia previa, un experimento anterior o una prueba preliminar (como se sugiri en el captulo 1), o por
una estimacin discrecional. Cuando no se tiene la seguridad acerca del valor de 02, los tamaos de las
muestras podran determinarse para un rango de valores posibles de 02, a fin de estudiar el efecto de este
Parmetro sobre el tamao de la muestra requerido, antes de hacer la eleccin final.

108

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

EJEMPLO 3~11

Considere el experimento de la resistencia a la tensin descrito en el ejemplo 3-1. Suponga que el experimentador est interesado en rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las medias de los cinco tratamientos son

,u1=11
Planea utilizar a

= 0.01.

,uz=12

,u3=15

,u4=18

En este caso, puesto que "Li=1,u

= 75,

,us=19

se tiene ji

= (1/5)75 = 15 Y

=,u1-;U=11-15=-4
'l' 2 = ,u 2 -;U = 12 -15 =- 3
'l' 3 = ,u 3 - ;U = 15- 15 = O
'l' 4 = ,u 4 -;U = 18- 15 = 3
'l's=,u5-;U=19-15= 4
'l'1

Por lo tanto, "Li=1 'l'; = 50. Suponga que el experimentador piensa que la desviacin estndar de la resistencia a la tensin con cualquier nivel particular del peso porcentual del algodn no ser mayor que 0=3
psi. Entonces, al utilizar la ecuacin 3-48, se tiene

Se usa la curva de operacin caracterstica para a -1 = 5 -1 = 4 con N -a = a(n ~ 1) = 5(n -1) grados de
libertad del error y a = 0.01 (ver la parte V del apndice). Como primera conjetura para el tamao de la
muestra requerido, se prueba con n = 4 rplicas. Esto produce ep2 = 1.11(4) = 4.44, ep = 2.11 Y5(3) = 15
grados de libertad del error. Por consiguiente, en la parte V se encuentra que fJ =0.30. Por lo tanto, la potencia de la prueba es aproximadamente 1- fJ = 1- 0.30 = 0.70, que es menor que el 0.90 requerido, por
lo que se concluye que n = 4 rplicas no son suficientes. Procediendo de manera similar, puede construirse la siguiente tabla:
n

I>2

4.44
5.55
6.66

5
6

Potencia (1- [3)

a(n -1)
15

2.11
2.36
2.58

Por lo tanto, deben realizarse al menos n

20
25

0.30
0.15
0.04

0.70
0.85
0.96

= 6 rplicas para obtener una prueba con la potencia requerida.

El nico problema con este enfoque para usar las curvas de operacin caracterstica es que por lo general
es difcil seleccionar el conjunto de las medias de los tratamientos en el que se basar la decisin del tamao de la muestra. Un enfoque alternativo es seleccionar un tamao de la muestra tal que si la diferencia
entre las medias de dos tratamientos cualesquiera excede un valor especificado, la hiptesis nula deber
rechazarse. Si la diferencia entre las medias de dos tratamientos cualesquiera es tan grande como D, puede demostrarse que el valor mnimo de ep2 es
ep2

nD
2a0 2

(3-49)

3-7 DETERMINACIN DEL TAMAO DELA MUESTRA

109

puesto que ste es un valor mnimo de <1>2, el tamao de la muestra correspondiente que se obtiene de la
curva de operacin caracterstica es un valor conservador; es decir, proporciona una potencia al menos
tan grande como la que especific el experimentador.
Para ilustrar este enfoque, suponga que en eL experimento de la resistencia a la tensin del ejemplo
3-1, el experimentador quisiera rechazar la hiptesis nula con una probabilidad de al menos 0.90 si las medias de dos tratamientos cualesquiera difieren hasta en 10 psi. Entonces, suponiendo que o = 3 psi, se encuentra que el valor mnimo de <1>2 es
<1>2 = n(10)2 = 1.11n

2(5)(3 2 )
y, por el anlisis del ejemplo 3-11, se concluye que se necesitan n
deseada cuando a = 0.01.

3,7.2

= 6 rplicas para obtener la sensibilidad

Especificacin de un incremento de la desviacin estndar

Este enfoque es til en ocasiones para elegir el tamao de la muestra. Si las medias de los tratamientos no
difieren, la desviacin estndar de una observacin elegida al azar es o. Sin embargo, si las medias de los
tratamientos son diferentes, la desviacin estndar de una observacin elegida al azar es

Si se escoge un porcentaje P para el incremento de la desviacin estndar de una observacin, ms all del
cual quiera rechazarse la hiptesis de que las medias de todos los tratamientos son iguales, esto es equivalente a escoger
2

+(t 7: /a) =
1=1

1 +O.01P

(P = por ciento)

de donde

7: / a

<1>= --'--'-'i=1=--------::~= ~(1 + 0.01P)2 -1(..Jn)

o/..Jn

(3-50)

Por lo tanto, para un valor especificado de P, <1> puede calcularse con la ecuacin 3-50 y despus usar las
curvas de operacin caracterstica de la parte V del apndice para determinar el tamao de la muestra requerido.

110

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

Por ejemplo, en el experimento de la resistencia a la tensin del ejemplo 3-1, suponga que se desea
detectar un incremento de la desviacin estndar de 20% con una probabilidad de al menos 0.90 y a =
0.05. Entonces
cI>= ~(1.2)2 -1(.Jii) = 0.66.Jii

La referencia a las curvas de operacin caracterstica indica que'se necesita n


lidad deseada.
3~7.3

= 9 para obtener la sensibi-

Mtodo para estimar el intervalo de confianza

En este enfoque se supone que el experimentador quiere expresar los resultados finales en trminos de
intervalos de confianza y que est dispuesto a especificar por anticipado cul es el ancho que desea para
estos intervalos de confianza. Por ejemplo, suponga que en el experimento de la resistencia a la tensin
del ejemplo 3-1 se quiere que un intervalo de confianza de 95% para la diferencia en la resistencia a la
tensin media de dos pesos porcentuales del algodn cualesquiera sea 5 psi y una estimacin previa de a
es 3. Entonces, al utilizar la ecuacin 3-13, se encuentra que la precisin del intervalo de confianza es
t

a/2,N-a

~2MSE
n

Suponga que se prueba con n = 5 rplicas. Entonces, al usar a2 = 3 2 = 9 como una estimacin de MSE , la
precisin del intervalo de confianza es

2.086~2~) = 3.96
que es ms preciso que el requerimiento. Al probar con n

= 4 se

obtiene

2.132~2~) = 4.52
Al probar con n

3 se obtiene

2.22~2~) = 5.46
Evidentemente, n = 4 es el tamao de la muestra menor que llevar a la precisin deseada.
El nivel de significacin consignado en el ejemplo anterior se aplica a un solo intervalo de confianza.
Sin embargo, puede usarse el mismo enfoque general si el experimentador desea especificar de antemano
un conjunto de intervalos de confianza acerca del cual se hace un enunciado de confianza simultneo o
conjunto (ver los comentarios acerca de los intervalos de confianza simultneos de la seccin 3-3.3). Adems, los intervalos de confianza podran construirse con respecto a contrastes ms generales en las medias de los tratamientos, que la comparacin por pares ilustrada antes.

3~8

IDENTIFICACIN DE EFECTOS DE DISPERSIN

Nos hemos enfocado aqu en el uso del anlisis de varianza y de otros mtodos relacionados para determin.ar los niveles del factor que resultan en diferencias entre las medias de los tratamientos o los niveles del
factor. Se acostumbra referirse a estos efectos como efectos de localizacin. Cuando ocurri la desigual-

111

3-8 IDENTIFICACIN DE EFECTOS DE DISPERSIN

Tabla 3-12 Datos del experimento de fundicin

Observaciones

Algoritmo para
controlar la
proporcin

1
2
3
4

4.93(0.05)
4.85(0.04)
4.83(0.09)
4.89(0.03)

4.86(0.04)
4.91(0.02)
4.88(0.13)
4.77(0.04)

4.75(0.05)
4.79(0.03)
4.90(0.11)
4.94(0.05)

4.95(0.06)
4.85(0.05)
4.75(0.15)
4.86(0.05)

4.79(0.03)
4.75(0.03)
4.82(0.08)
4.79(0.03)

4.88(0.05)
4.85(0.02)
4.90(0.12)
4.76(0.02)

dad de la varianza con los diferentes niveles del factor, se utilizaron transformaciones para estabilizar la
varianza y mejorar as las inferencias hechas sobre los efectos de localizacin. Sin embargo, en algunos
problemas el inters se centra en descubrir si los diferentes niveles del factor afectan la variabilidad; es
decir, el inters est en descubrir efectos de dispersin potenciales. Esto ocurrir siempre que la desviacin estndar, la varianza o cualquier otra medida de la variabilidad se use como variable de respuesta.
Para ilustrar estos conceptos, considere los datos de la tabla 3-12, los cuales se obtuvieron de un experimento diseado en una fundicin de aluminio. El aluminio se produce combinando almina con otros
ingredientes en una celda de reaccin y aplicando calor al hacer pasar una corriente elctrica a travs de
la celda. La almina se agrega de manera continua a la celda para mantener la proporcin apropiada de la
misma con respecto a los otros ingredientes. En este experimento se investigaron cuatro algoritmos para
controlar la proporcin. Las variables de respuesta estudiadas se relacionaron con el voltaje de la celda.
Especficamente, un sensor registra el voltaje de la celda varias veces cada segundo, produciendo miles de
mediciones del voltaje durante cada corrida del experimento. Los ingenieros del proceso decidieron usar
como variables de respuesta el voltaje promedio y la desviacin estndar del voltaje de la celda (indicado
entre parntesis) en la corrida experimental. El voltaje promedio es importante porque afecta la temperatura de la celda, y la desviacin estndar del voltaje (llamada "ruido del crisol" por los ingenieros del
proceso) es importante porque afecta la eficiencia global de la celda.
Se llev a cabo un anlisis de varianza para determinar si los diferentes algoritmos para controlar la
proporcin afectan el voltaje promedio de la celda. ste revel que el algoritmo para controlar la proporcin no tuvo ningn efecto de localizacin; es decir, al cambiar los algoritmos para controlar la proporcin no hubo ningn cambio en el voltaje promedio de la celda. (Referirse al problema 3-28.) .
Para investigar los efectos de dispersin, lo mejor suele ser utilizar
log(s)

log(s2)

como variable de respuesta, ya que la transformacin logartmica es eficaz para estabilizar la variabilidad
en la distribucin de la desviacin estndar muestral. Puesto que todas las desviaciones estndar del voltaje del crisol son menores que la unidad, se usar

y= -ln(s)
como la variable de respuesta. En la tabla 3-13 se presenta el anlisis de varianza para esta respuesta, el
logaritmo natural del "ruido del crisol". Observe que la eleccin de un algoritmo para controlar la proporcin afecta el ruido del crisol; es decir, el algoritmo para controlar la proporcin tiene un efecto de disTabla 3-13 Anlisis de varianza del logaritmo natural del ruido del crisol

Fuente de variacin
Algoritmo para controlar la proporcin
Error
Thtal

Suma de
cuadrados
6.166
1.872
8.038

Grados de
libertad
3
20
23

Cuadrado
medio
2.055
0.094

Valor P
21.96

<0.001

112

CAPTULO 3

2.00

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

I~

3.00

4.00

Ruido del crisollogartmco promedio [-1 n (5)]

Figura 3-16 Ruido del crisol logartmico promedio [-ln(s)] de


cuatro algoritmos para controlar la proporcin en relacin con una
distribucin t escalada con factor de escalamiento ~ MS E / II =
,",,0.094/ 6 =0.125.

persin. Las pruebas estndares de la adecuacin del modelo, incluyendo las grficas de probabilidad

normal de los residuales, indican que no hay problemas con la validez del experimento. (Referirse al problema 3-29.)
En la figura 3-16 se grafica el logaritmo promedio del ruido del crisol de cada algoritmo para controlar
la proporcin y se presenta tambin una distribucin t escalada que se usa como distribucin de referencia
para discriminar entre los algoritmos de la proporcin. Esta grfica revela con toda claridad que el algoritmo 3 para controlar la proporcin produce ms ruido del crisolo una desviacin estndar del voltaje de la
celda mayor que los otros algoritmos. No parece haber gran diferencia entre los algoritmos 1, 2 Y 4.

3..9

EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

Se ha ofrecido un desarrollo intuitivo o heurstico del anlisis de varianza. Sin embargo, es posible presentar un desarrollo ms formal. El mtodo ser de utilidad ms adelante para entender los fundamentos
del anlisis estadstico de diseos ms complejos. Llamada la prueba general de significacin de la regresin, el procedimiento consiste en esencia en encontrar la reduccin en la suma de cuadrados total para
ajustar el modelo con todos los parmetros incluidos y la reduccin en la suma de cuadrados cuando el
modelo se restringe a la hiptesis nula. La diferencia entre estas dos sumas de cuadrados es la suma de
cuadrados de los tratamientos con la que puede realizarse la prueba de la hiptesis nula. El procedimiento requiere los estimadores de mnimos cuadrados de los parmetros en el modelo del anlisis de varianza. Se dieron ya (en la seccin 3-3.3) las estimaciones de estos parmetros; sin embargo, ahora se presenta
un desarrollo formal.

3..9.1

Estimacin de mnimos cuadrados de los parmetros del modelo

Se desarrollan ahora los estimadores de los parmetros en el modelo con un solo factor

utilizando el mtodo de mnimos cuadrados. Para encontrar los estimadores de mnimos cuadrados de fl y
primero se forma la suma de cuadrados de los errores

'C,

(3-51)
;=1 j=l

=1 j=l

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

113

y se eligen despus los valores de,t Y, por ejemplo lyf, que minimicenL. Los valores adecuados seran

las soluciones de las a + 1 ecuaciones simultneas

aLI
a,t

=0
.

.t,T

aLI

=O

i=1, 2, ..., a

a . .

fl.T:

Al derivar la ecuacin 3-51 con respecto a ,t y

-2!!

Y al igualar con cero se obtiene

(Yij-l-f)=O

=1 j=1

-2!

i=1, 2, ..., a

(Yij-l-f)=O

j=1

de la que, despus de simplificar, se obtiene


Nl+nf 1 +nf z + .. , +nf a

= Y..

nl+nf 1

= Yi

nl

+nr z

nl

(3-52)

= Yz.

+nf a

= Ya.

A las a + 1 ecuaciones (ecuacin 3-52) con a + 1 incgnitas se les llama las ecuaciones normales de
mnimos cuadrados. Observe que si se suman la ltimas a ecuaciones normales, se obtiene la primera
ecuacin normal. Por lo tanto, las ecuaciones normales no son linealmente independientes, y no existe una
solucin nica para,t, 1, ..., a Esta dificultad puede superarse mediante varios mtodos. Puesto que los
efectos de los tratamientos se han definido como desviaciones de la media global, parece razonable aplicar la restriccin

(3-53)

f=O

=1

Utilizando esta restriccin, se obtiene como solucin de las ecuaciones normales

Y..
f = Y. - Y..

l=

(3-54)
i=1, 2, ..., a

Evidentemente, esta solucin no es nica y depende de la restriccin (ecuacin 3-53) que se ha elegido. Al principio esto puede parecer desafortunado porque dos experimentadores diferentes podran analizar los mismos datos y obtener resultados diferentes si aplican restricciones diferentes. Sin embargo,
ciertas funciones del parmetro del modelo son estimadas de manera nica, independientemente de la
y la media del tratamienrestriccin. Algunos ejemplos son - J., que se estimara con r. - f . = y. - y..,
J.
to i-simo ,ti = ,t + , que se estimara con l = l + f = y..
Puesto que el inters se encuentra generalmente en las diferencias entre los efectos de los tratamientos y no en sus valores reales, no produce preocupacin alguna que no pueda estimarse de manera ni1

l.

114

CAPTULO 3 EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

ca. En general, cualquier funcin de los parmetros del modelo que sea una combinacin lineal del
miembro del lado izquierdo de las ecuaciones normales (ecuaciones 3-52) puede estimarse de manera
nica. A las funciones que se estiman de manera nica independientemente de la restriccin que se use se
les llama funciones estimables. Para ms informacin, ver el material suplementario del texto de este captulo. Nos encontramos listos para usar estas estimaciones de los parmetros en un desarrollo generl
del anlisis de varianza.

3~9.2

Prueba general de significacin de la regresin

Una parte fundamental de este procedimiento es escribir las ecuaciones normales del modelo. Estas
ecuaciones siempre podrn obtenerse formando la funcin de mnimos cuadrados y derivndola con respecto a cada parmetro desconocido, como se hizo en la seccin 3-9.1. Sin embargo, se cuenta con un mtodo ms sencillo. Las reglas siguientes permiten escribir directamente las ecuaciones normales del
modelo de cualquier diseo experimental:
REGLA 1. Hay una ecuacin normal para cada parmetro del modelo que va a estimarse.
REGLA 2. El miembro derecho de cualquier ecuacin normal es slo la suma de todas las observaciones que contienen el parmetro asociado con esa ecuacin normal particular.
Para ilustrar esta regla, considere el modelo con un solo factor. La primera ecuacin normal
corresponde al parmetro fl; por lo tanto, el miembro derecho es y.., ya que todas las observaciones incluyen a fl.
REGLA 3. El miembro izquierdo de cualquier ecuacin normal es la suma de todos los parmetros
del modelo, donde cada parmetro est multiplicado por el nmero de veces que aparece en el
total del miembro derecho. Los parmetros se escriben con un acento circunflejo (A) para indicar
que son estimadores y no los verdaderos valores de los parmetros.

Por ejemplo, considere la primera ecuacin normal en un experimento con un solo factor. De acuerdo con las reglas anteriores, sta sera
Nfi, + ni 1 + ni 2

+ ... + ni a = Y..

porque fl aparece en las N observaciones, r 1 slo aparece en las n observaciones hechas bajo el primer tratamiento, r 2 aparece slo en las n observaciones tomadas bajo el segundo tratamiento, etc. Por la ecuacin 3-52 se verifica que la ecuacin presentada arriba es correcta. La segunda ecuacin normal
correspondera a r 1 y es
nfi,+ni 1 = YL

porque slo las observaciones del primer tratamiento contienen a r 1 (esto daYL como miembro derecho),
fl Yr 1 aparecen exactamente n veces enYL, y todas las dems r i aparecen cero veces. En general, el miem-

bro izquierdo de cualquier ecuacin normal es el valor esperado del miembro derecho.
Ahora bien, considere encontrar la reduccin en la suma de cuadrados ajustando un modelo particular a los datos. Al ajustar un modelo a los datos se "explica" parte de la variabilidad; es decir, la variabilidad no explicada se reduce en cierta cantidad. La reduccin en la variabilidad no explicada es siempre la
suma de las estimaciones de los parmetros, cada una de ellas multiplicada por el segundo miembro de la

3-9 EL ENFOQUE DE REGRESIN PARA EL ANLISIS DE VARIANZA

115

ecuacin normal que corresponde al parmetro especfico. Por ejemplo, en un experimento con un solo
factor, la reduccin debida al ajuste del modelo completo Yij = fl + 7: + cij es
(3-55)

= r"...
1y + L.,
"

f.y.
1
l.

1=1

La notacin R(1" 7:) significa la reduccin en la suma de cuadrados a partir del ajuste del modelo que contiene afl Y{7:}. AR(1" 7:) se le llama en ocasiones la suma de cuadrados "de regresin" del modelo completo Yj = fl + 7: + cij. El nmero de grados de libertad asociado con una reduccin en la suma de
cuadrados, tal como R(1" 7:), siempre es igual al nmero de ecuaciones normales linealmente independientes. El resto de la variabilidad no explicada por el modelo se encuentra con
SSE

= ~}: Y~ -R(fl,7:)

(3-56)

i=l j=l

Esta cantidad se usa en el denominador del estadstico de prueba de H O:7: 1 = 7: 2 = ... = 7:a = O.
A continuacin se ilustra la prueba general de significacin de la regresin para un experimento con
un solo factor y se demuestra que produce el anlisis de varianza de un solo factor comn. El modelo es
Yij = fl + 7: + cij' y las ecuaciones normales se encuentran con las reglas anteriores como
Nft+nf 1 +nf 2

+ ... +nf a =

Y.

Yl

nft+nf 1
nft

=h

+nf 2

nft

Compare estas ecuaciones normales con las que se obtuvieron en la ecuacin 3-52.
Al aplicar la restriccin 2: ~=1 f 1 = O, los estimadores de fl y 7:i son
ft=

i=l, 2, ..., a

Y..

La reduccin en la suma de cuadrados debida al ajuste de este modelo completo se encuentra con la ecuacin 3-55 como
R(fl, 7:) = fty..

+~

f i Yi.

i=l

;=1

= ~+

;=1

=
i=l

Yi.

Yi.Yi. - Y..

;=1

Yi.

116

CAPTULO 3

EXPERIMENTOS CON UN SOLO FACTOR: EL ANLISIS DE VARIANZA

que tiene,a, grados de libertad porque haya ecuaciones normales:linealmenteindependientes. La suma de


cuadradosl:del errores, por la ecuacin 3-56,
SSE

!:! Y~

- R(Jl, 7:)

=;1 j=l

y tiene N - a grados de libertad.


Para encontrarla.suma de cuadrados que resulta de los efectos de los tratamientos (el {7:}), se considera que el modelo se restringe ala,hiptesis nula; es decir, 7: = Opara todai. El modelo reducido eSYij =
Jl + f.ij' Hay ,una sola,ecuacinnormalpara este modelo:

NA = Y..
y el estimador de l esA = y.. . Por lo tanto, la reduccin enla suma de cuadrados que resulta de ajustar el
modelo, reducido que slo contiene a Jl es
2

R(')-()'( )-L
Jl-Y.Y.N
Puesto que hay una sola ecu<;lein normal para este modelo reducido, R(t) tiene un grado de libertad. La
suma de cuadrados debida al \"}, dado que Jl ya est incluida en el modelo, es la diferencia entre R(t, 7:) Y
R(t), que es
R(rl Jl) = R.(l, r) - R(Jl)
,= R(Modelo Completo) - R(Modelo Reducido)
1,:

y2

=;; Yi. - N
?

1=1

con a -1.grados de libertad, queporla ecuacin 3-9 se identifica como SS1tatamientos' Estableciendo el supuesto de normqlidadusual, elestadstico apropiado para probar H o: 7: 1 = r 2 = ... = r a = O es
F=
o

R(rIJl)/(a-l)
'[

a
~#
Y~ -R(Jl,
11

7:) I(N-a)

que se distribuye como Fa~l,N-a bajo la hiptesis nula. Se trata, desde luego, del estadstico de prueba para
el anlisis de varianza de un solo factor.

3..10
3..10.1

MTODOS NOPARAMTRICOS EN EL ANLISIS DE VARIANZA


La prueba de Kruskal..Wallis

En situaciones en las que el supuesto de normalidad no est justificado, el experimentador quiz quiera
usar un procedimiento alternativo del anlisis de varianza con la prueba F que no dependa de este su-

You might also like