You are on page 1of 35

Suma de Cuadrados SC (entre)

Sujetos Ramss Jeque Troyano Sin nombre


1 4 5 7 2
2 4 5 8 1
3 5 6 7 2
4 5 6 9 3
5 6 7 6 3
6 3 6 3 4
7 4 4 2 5
8 4 5 2 4
9 3 6 2 4
10 4 3 3 3
Suma 42 53 49 31
Media 4,2 5,3 4,9 3,1
Gran media
4,375
G
De esta tabla se obtiene la Suma de Cuadrados
(entre) que es el cuadrado de la desviacin entre
la media de cada grupo con la gran media G .
Debido a que cada grupo posee 10 muestras de
valores, dicho valor final queda multiplicado por
10. En resumen se obtiene:

2
=
Suma de cuadrados SC (dentro)
El siguiente paso para el anlisis es la obtencin
de la suma de cuadrados dentro que es la
desviacin al cuadrado entre los valores
individuales de cada grupo con la media de dicho
grupo. Un ejemplo del clculo seria la media
Ramss menos la el valor individual del primer
individuo elevado al cuadrado: (4,2 4)2 = (0,2)2 =
0.04, cuyo valor se observa en el ngulo superior
izquierdo de la siguiente tabla. El resto de los
valores que se observa en la tabla sigue el mismo
procedimiento.
Diferencia al cuadrado por grupo
0,04 0,09 4,41 1,21
0,04 0,09 9,61 4,41
0,64 0,49 4,41 1,21
0,64 0,49 16,81 0,01
3,24 2,89 1,21 0,01
(Xj- )2
1,44 0,49 3,61 0,81
0,04 1,69 8,41 3,61
0,04 0,09 8,41 0,81
1,44 0,49 8,41 0,81
0,04 5,29 3,61 0,01
Suma 7,6 12,1 68,9 12,9
Suma
101,5
La sumatoria del clculo para la obtencin se
observa en la siguiente ecuacin.


= 4 4.2 2 + 4 4.2 2 + 4 4.2 2 + 5 5.3 2 + 5 5.3 2

+ 3 5.3 2 + 7 4.9 2 + 3 4.9 2 + 2 3.1 2


+ 3 3.1 2 40 = 101.5

2
=
Grados de libertad (df o gl)
gl: Para calcular un estadstico, es necesario emplear observaciones
obtenidas de una muestra y tambin ciertos parmetros
poblacionales. Si estos parmetros no se conocen, es necesario
estimarlos a partir de la muestra. El nmero de grados de libertad
de un estadstico, que por lo general se denota , se define como la
cantidad n de observaciones en la muestra (es decir, el tamao de
la muestra) menos la cantidad k de parmetros poblacionales que
tengan que estimarse a partir de las observaciones muestrales. En
smbolos, = n k. En el caso del la media, la cantidad de
observaciones independientes en la muestra es N, y a partir de ellas
se calculan . Como se necesita estimar , k = 1 y por lo tanto = n
1.
El siguiente paso de es determinar los grados de libertad para los
dos trminos anteriores (Suma de cuadrados entre y dentro) para
determinar la media de cuadrados de ambos trminos.
Tenemos 4 grupos para SC entre, pero un grado de libertad se ha
perdido en el clculo de la gran media. Luego el gl para la SC entre
es:
= 4 1 = 3
Para la SC dentro se tiene 40 trminos (datos):
4 grupos y 10 individuos por grupo. Pero
empleamos 1 gl por cada media determinada
y por tanto perdemos un total de 4. Luego el
gl para la SC entre es:
= 40 4 = 36
Finalmente para determinar el gl totales
vendrn dados por los 40 trminos y uno
perdido al determinar la gran media. Luego el
gl para el total es:
= 40 1 = 39
Medias de cuadrados
Ahora determinamos la media de cuadrados
de la suma de cuadrados entre y dentro
dividiendo por sus respectivos grados de
libertad, en este caso 3 y 36 y obtenemos la
media cuadrada. Debido a que el gl es casi
igual al nmero de trminos de la suma.
Cociente de las medias cuadradas F
Finalmente obtenemos el cociente de las medias
cuadradas, el valor F, que es la relacin seal-
ruido de la diferencia entre grupos y dentro de
los grupos.
Todo esto se resume en la tabla de ANOVA que se
muestra a continuacin. Podemos ver si el valor F
calculado es significativo o no lo es.
Al comparar los valores F calculado con F crtica
que sale de la Tabla se encuentra que Fcalculada >
Fvc.
Quien haya hecho la marca sin nombre uso
diferente tipo de receta para elaborar su
producto.
El resultado se expresa mejor realizando una
comparacin entre las medias utilizando un grfico de
barras. Como se observa en el siguiente grfico.
Decisin
El punto crtico para un contraste con
= 0.05 es aproximadamente 2,866.
El valor observado de F es 3,296 es
mayor que 2,866.
Tenemos prueba estadstica de que
los tres tratamientos difieren en el
efecto medio.
Tamao y Potencia del Test
Tamao y potencia del test
Tendremos en cuenta el efecto tamao, d, que
expresa el efecto del tratamiento en unidades de
desviacin estndar, S. consideramos dos puntos:
Hay varias medias.
Las medias pueden estar distribuidas de varias formas.
Por tanto, tendremos que hacer un par
estimaciones:
Una sobre la media de las diferencias entre las medias.
La otra sobre la probable distribucin.
Llamamos entre la mayor y la menor de las medias y d es la
razn / /S llamada efecto tamao. Tenemos que distribuir
las medias entre .
Hay una posibilidad que se presenta cuando tenemos tres grupos;
dos medicamentos y un placebo. Presumiblemente, los dos
medicamentos deben estar prximos en uno de los extremos de la
distribucin de medias y el placebo en otro.
Pero si tenemos un montn de tratamientos, medias, una primera
conjetura es que deberan de estar distribuidos por igual a lo largo
de la lnea.
Una tercera variacin puede consistir en que hay un tratamiento
claramente ganador, el otro no hace nada, y el ltimo se halla en el
centro.
Para determinar el tamao de la muestra se multiplica el valor d por
una frmula (f) que vara dependiendo de la distribucin de las
medias:
Dispersin mnima
Dispersin mxima
Dispersin intermedia
Tamao y Potencia del Test
1
=
2
+1
=
3 1

2 1
= =
2

= = 1
Supongamos que estamos comparando cinco
medias de un tratamiento, y basadas en a)
investigaciones previas, b) la intuicin o c) por
una imaginacin planificada; conjeturamos:
Una diferencia de 10 mm entre la mejor y la
peor.
Que las medias individuales estn distribuidas
por igual a lo largo de los 10 mm de
diferencia.
La desviacin estndar S, es de 8 mm.
Qu tamao de muestra necesito para
detectar esta distribucin de diferencia?
d es igual:
10
= = = 1.25
8

f para una distribucin intermedia es:

1 +1 1 5+1 1
= = 1.25 = 1.25 0.5 = 0.442
2 3 1 2 3 51 2

Las siguientes dos tablas muestran el tamao y


potencia de la muestra por grupo tras elegir los
valores adecuados de y .
ANOVA de dos Factores
Propsito
Estudiar si los valores de una variable
dependiente (VD) dependen de los niveles de dos
variables independientes (VI) (factores) o de la
interaccin entre ambas. La primera VI se
denomina A y tiene J niveles. a segunda VI es B y
tiene K niveles. En los diseos de ANOVA de dos
factores, se prueban tres Ho por vas separadas; la
prueba F:
La Ho para el efecto principal A,
La H0 para el efecto principal B y
La H0 para interaccin entre los factores A y B.
Interaccin
Existe interaccin entre dos factores cuando el efecto
de un factor sobre la VD depende de cul sea el nivel
del otro factor.
Hiptesis Nula H0
H0(A): 1 = 2 = = j. Las J medias poblacionales
correspondientes a los J niveles del factor A son
iguales.
H0(B): 1 = 2 = = .Las K medias poblacionales
correspondientes a los K niveles del factor B son
iguales.
H0(AB): jk jk = j j. No hay efecto de interaccin.
Hiptesis Alternativa HA
H1(A): j j. El factor A influye o afecta a la VD.
H1(B): k k. El factor B influye o afecta a la VD.
H1(AB): jk jk j j Hay interaccin.
Se prueban tres hiptesis nulas separadas e
independientes, y cada una es rechazada o
fundamentada independientemente de las
otras dos.
Las H0 para los factores A y B pueden probarse
con dos ANOVAS de un factor separadas.
El ANOVA de dos factores se relaciona con la
interesante pregunta concerniente a la
interaccin; es decir, hay ciertas
combinaciones de los factores que tengan
efectos sobre los que serian evidentes si los
dos factores se consideraran de manera
separada, independientes y aditivamente?
Ejemplo
Considerando el ejemplo anterior, que
fue el ndice de satisfaccin para
diferentes marcas de preservativos,
ahora tendremos en cuenta las A) marcar
de preservativos usados por B) varones
circuncidados y no circuncidados. El
resultado del ndice de satisfaccin de
ambos factores est descrito en la
siguiente tabla.
Ramss Jeque Troyano Desconc. Media Media

4 5 7 2 4,50
4 5 8 1 4,50
No circuncidados 5 6 7 2 5,00 5,05
5 6 9 3 5,75
6 7 6 3 5,50
Media del grupo 4,8 5,8 7,4 2,2

3 6 3 4 4,00
4 4 2 5 3,75
Con circuncisin 4 5 2 4 3,75 3,70
3 6 2 4 3,75
4 3 3 3 3,25
Media del grupo 3,6 4,8 2,4 4,0

Media de la
4,2 5,3 4,9 3,1 4,375
marca
Anlisis de varianza de dos factores con varias muestras por grupo

RESUMEN Ramss Jeque Troyano Desconc. Total

Sin circuncisin
Cuenta 5 5 5 5 20
Suma 24 29 37 11 101
Promedio 4,8 5,8 7,4 2,2 5,05
Varianza 0,7 0,7 1,3 0,7 4,471

Con circuncisin
Cuenta 5 5 5 5 20
Suma 18 24 12 20 74
Promedio 3,6 4,8 2,4 4 3,7
Varianza 0,3 1,7 0,3 0,5 1,378

Total
Cuenta 10 10 10 10
Suma 42 53 49 31
Promedio 4,2 5,3 4,9 3,1
Varianza 0,844 1,344 7,655 1,433

ANLISIS DE VARIANZA
Origen SC GL MC F p VC F
Condicin 18,225 1 18,225 23,516 0,000 4,149
Marcas 27,875 3 9,292 11,989 0,000 2,901
Interaccin 58,475 3 19,492 25,151 0,000 2,901

Dentro del grupo 24,800 32 0,775

Total 129,375 39
Suma de Cuadrados de Condicin
Igual a la sumatoria de de las medias de los no
circuncidados menos la gran media elevado al
cuadrado.
2 2
= 20 5.05 4.375 + 3.70 4.375 = 18.225

Suma de Cuadrados de Marcas


Igual a la sumatoria de las medias de las marcas
menos la gran media elevado al cuadrado.
2 2 2 2
= 10 4.2 4.375 + 5.3 4.375 + 4.9 4.375 + 3.1 4.375 = 27.875
Suma de Cuadrados de Interaccin
Esto es un poco ms complicado y por lo tanto necesitamos una
aclaracin ms detallada de la misma.
Cada media de las marcas (4.2, 5.3, 4.9, y 3,1) tiene una desviacin
respecto a la gran media y cada media de la condicin (5.05 y 3.70) tiene
otra desviacin respecto a la gran media.
La sumatoria de cada de ambas desviaciones corresponder a la media
conjeturada o estimada de la media de marca por condicin.
Por ejemplo, la media conjeturada de 4.8 de Ramss con respecto a la
gran media ser (44.2-4.375), es decir 0.172 por debajo de la gran media
y para los hombres no circuncidados ser de (5.05-4.375) que da 0.675
por arriba de la gran media, as podemos predecir que los hombres no
circuncidados que usan la marca Ramss estaran 0.675 por encima de la
gran media y por debajo de ella 0.175 puntos, es decir, estaran (0.675-
0.175) = 0.500 por encima de la gran media; es decir (4.375+0.500) =
4.875 que es un valor muy prximo a lo esperado.
Al final la sumatoria estar formada por 8 trminos. La sumatoria queda
igual a la desviacin de la media de cada grupo menos la media
conjeturada elevada al cuadrado. Dicha sumatoria se observa en la
siguiente ecuacin:
Suma de Cuadrados de Interaccin
2 2 2 2 2
= 5 4.8 4.875 + 3,6 4.875 + 5.8 5.975 + 4.8 4.8 + 7.4 5.575
2 2
+ 2.4 4.225 + 2.2 3.775 + 4.0 2.425 2 += 58.475

Los grados de libertad, la media de cuadrados


y el cociente de la media de cuadrados (F)
siguen el mismo patrn que el ANOVA de una
va.
Suma de Cuadrados dentro del grupo (error)
Se obtiene entre el valor individual de cada dato y su correspondiente
media elevada al cuadrado y se suma los 40 valores obtenidos como se
observa en la siguiente tabla :
(X- )^2 0,64 0,64 0,16 0,04
(X- )^2 0,64 0,64 0,36 1,44
(X- )^2 0,04 0,04 0,16 0,04
(X- )^2 0,04 0,04 2,56 0,64
(X- )^2 1,44 1,44 1,96 0,64
(X- )^2 0,36 1,44 0,36 0
(X- )^2 0,16 0,64 0,16 1
(X- )^2 0,16 0,04 0,16 0
(X- )^2 0,36 1,44 0,16 0
(X- )^2 0,16 3,24 0,36 1

Media de cada grupo 0,4 0,96 0,64 0,48


Media del grupo 0,62
Media Cuadrada 24,80
Resultado ANOVA 2 Factores: EXCEL.
Origen SC GL MC F p VC F

Condicin 18,225 1 18,225 23,516 0,000 4,149

Marcas 27,875 3 9,292 11,989 0,000 2,901

Interaccin 58,475 3 19,492 25,151 0,000 2,901

Dentro del
24,800 32 0,775
grupo
Regla de decisin
Rechazar H0(A) si el estadstico FA cae en la
zona crtica. Mantener H0(A) en caso
contrario.
Rechazar H0(B) si el estadstico FB cae en la
zona crtica. Mantener H0(B) en caso
contrario.
Rechazar H0(AB) si FAB cae en la zona
crtica. Mantener H0(AB) en caso contrario.
Resultado
Se rechazar la H0(A) de igualdad entre las medias en la
condicin (no circuncidado/circuncidado) debido a que
el estadstico FA cae en la zona crtica, FA 23,516>FAC
4,149. Hay diferencia significativa entre los no
circuncidados y circuncidados.
Se rechazar la H0(B) (marcas de preservativos) debido a
que el estadstico FB cae en la zona crtica, FB
11,989>FBC 2,901. Hay diferencia significativa entre las
marcas de preservativos.
Se rechazar H0(AB) debido a la presencia de una
interaccin entre los factores A y B debido a que
estadstico FAB cae en la zona crtica, FAB 25,151>FABC
2,901. Existe una interaccin entre los factores A y B.
Suma de cuadrados e interacciones
determinadas por factores e interaccin
Estatus de
Dentro del circuns
grupo, 24,8 A, 18,225

Estatus de circuns A

Marca Marca B
B, 27,875 Interaccin AxB
Dentro del grupo

Interaccin
AxB, 58,475
Grado de satisfaccin y situacin respecto a la circuncisin

Sin circuncisin Con circuncisin


8,0
Grado de satisfaccim (media)

7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
Ramss Jeque Troyano Desconocido

Marca

Si consideramos las marcas Pero los valores medios de Troyano y


Ramss y Jeque, el ms preferido Desconocido presentan un cuadro diferente.
Por alguna razn inexplicable los varones no
es la marca Jeque, y los no
circuncidados expresan una clara preferencia
circuncidados disfrutan ms del por la marca Desconocida y los circuncidados
sexo, por el Troyano.
Interaccin entre marcas y situacin con respecto a la
circuncisin
El hecho de que las lneas no sean paralelas es un ndice de la presencia de una
interaccin. El concepto de interaccin es sinnimo de sinergia, el todo es mayor o
menor que la suma de sus partes. Para comprender, un fosforo tiene poca energa
libre, un bidn de gasolina tiene poca energa libre. Jntalos y, de repente, tienes
una gran cantidad de energa (y tambin de sinergia).
Sin circuncisin Con circuncisin

8,0
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
Troyano Desconocido

You might also like