Professional Documents
Culture Documents
AUTORES:
Clemente Rodrguez Sabiote
Jos Gutirrez Prez
Teresa Pozo Llorente
Los autores
Edita: Grupo Editorial Universitario
ISBN:
Depsito Legal:
Imprime: Lozano Impresores S.L.L.
Distribuye: Grupo Editorial Universitario
Telf: 958 800580 Fax: 958 291615
http://www.editorial-geu.com
E-mail: grupoeditorial@terra.es
No est permitida la reproduccin total o parcial de esta obra, ni su tratamiento informtico, ni la
transmisin de ninguna forma o por ningn medio, ya sea electrnico, mecnico, por fotocopia, u
otros medios, sin el permiso previo y por escrito de los titulares del Copyright.
INDICE
Pag.
BASES CONCEPTUALES DE LOS PRINCIPALES CONTRASTES DE HIPTESIS
1. Introduccin
2. Anlisis inferencial
2.1. Aspectos generales del contraste de hiptesis.
2.2. Pruebas de significacin estadstica..
2.2.1. Principales pruebas de contraste de hiptesis de tipo paramtrico..
2.2.1.1. Pruebas relacionadas con la igualdad de medias de dos grupos...
2.2.1.2. Pruebas relacionadas con la igualdad de varianzas de dos o ms
grupos
2.2.2. Principales pruebas de contraste de hiptesis de tipo no paramtrico
5
7
8
8
14
18
18
24
Bibliografa.
59
33
PRIMERA PARTE:
Bases conceptuales
de los principales
contrastes de
hiptesis
1. INTRODUCCIN
La Estadstica es una herramienta de reconocido valor al servicio de la
investigacin
educativa.
Mediante
los
procedimientos
estadsticos
se
2. ANLISIS INFERENCIAL
2.1. Aspectos generales del contraste de hiptesis
El propsito fundamental de los anlisis estadsticos de tipo inferencial
es el conocimiento de poblaciones a partir del estudio de muestras o
subconjuntos representativos y suficientes de dichas poblaciones (Fernndez,
Garca, Fuentes y Asensio, 1992; Tejedor y Etxeberria, 2006).
En este tipo de anlisis, amn de la probabilidad, el muestreo y la
estimacin de parmetros (de tipo puntual e interval) destaca el importante
papel que juegan los contrastes de hiptesis. Para Martn (2001:9) los trminos
contraste de hiptesis son sinnimos de pruebas de significacin y se
refieren a los procedimientos estadsticos mediante los cuales aceptamos o
rechazamos una hiptesis nula (Ho) lo que automticamente nos habilita para
rechazar o aceptar otra hiptesis denominada hiptesis alternativa (H1).
Mientras la primera postula la ausencia de diferencias estadsticamente entre
dos medidas o ms (las que existen se deben al azar), la segunda postula todo
lo contrario, o sea, la existencia de diferencias estadsticamente significativas
entre dos o ms medidas.
Teniendo en cuenta que una hiptesis es una relacin potencial entre dos o
ms variables, por ejemplo, los alumnos que utilizan calculadora de bolsillo
obtienen un mayor rendimiento acadmico que aquellos que no lo hacen,
podemos afirmar que el contraste de hiptesis es el procedimiento que nos
permite verificar y confirmar si esa relacin potencial es verdadera o no y con
qu margen de error. A continuacin explicitamos otro ejemplo ms actual para
tratar de comprender mejor el concepto de contraste de hiptesis.
Por ejemplo, un estudiante de doctorado ha recogido datos sobre el fenmeno del botelln en Granada. Le
interesa, tomando como objeto de estudio varias Facultades, determinar el grado de acuerdo que tienen los
estudiantes universitarios sobre este tipo de eventos tomando en consideracin diferentes variables de
agrupacin: titulacin, curso En este caso, resultara til comparar si la variable opinin sobre este tipo de
eventos resulta ms o menos importante dependiendo de la titulacin a la que pertenece el alumnado, el
curso en el que est
Hiptesis nula (Ho): no se postulan diferencias estadsticamente significativas entre las medidas y si las hay se deben al azar.
Bilateral:
Contraste con una muestra (Ho): = k
Contraste con ms de una muestra (Ho): 1 = 2 o tambin 1 - 2 = 0
Unilateral:
Contraste con una muestra (Ho): k o tambin (Ho): k
Contraste con ms de una muestra Ho): 1 2 y tambin H1): 1 2
Bilateral: se postulan diferencias estadsticamente significativas entre las medidas, pero se desconoce a favor de cual de ellas:
Contraste con una muestra (H1): k
Contraste con ms de una muestra (H1): 1 2 o tambin 1 - 2 0
Unilateral: se postulan diferencias estadsticamente significativas entre las medidas y, adems, se contemplan a favor de alguna de
ellas:
Contraste con una muestra: (H1): < k o tambin (H1): > k
Contraste con ms de una muestra H1): 1 < 2 o tambin 1 > 2
H0 cierta
H0 falsa
Error tipo I ()
Decisin correcta
Potencia de contraste (1-)
Decisin correcta
Nivel de confianza
(1-)
Error tipo II ()
hiptesis nula con un cierto grado de error. Este resultado se denomina valor
emprico o terico y se compara con un valor crtico o tabular (valores de tabla)
asumiendo un determinado nivel de error (generalmente 5% o = 0.05) y en
algunas ocasiones unos determinados grados de libertad. La norma general, es
que si el valor emprico de la prueba calculada (el que se produce como
resultado de aplicar una expresin matemtica) es menor que el crtico se
acepta la hiptesis nula, ya que entrara dentro de la regin de aceptacin de la
misma.
11
-2
1,64
12
-2
1,96
13
Riesgo
Lateralidad
10%
5%
1%
Contraste unilateral
1,28
1,64
2,33
Contraste bilateral
1,64
1,96
2,58
14
Normalidad
Homoscedasticidad
Independencia
TCNICA/ESTRATEGIA
Representaciones grficas: histograma con
curva normal, grfico P-P o de proporciones,
grfico Q-Q o de cuantiles
Valores de asimetra y apuntamiento
Constraste de Shapiro y Wilk
Contraste de
Contraste
de
Kolmogorov-Smirnov
con
correccin de Lilliefors
Contraste de Bartlett
Contraste de Lehman
Contraste de Hartley
Contraste de Cochran
Contraste de Levene
Prueba
con
los
logaritmos
de
las
cuasivarianzas (para ANOVA)
Coeficiente de correlacin serial de separacin
1 (prueba de autocorrelacin)
Contraste de rachas
Tabla 3.
Tcnicas y estrategias para verificar los distintos supuestos
paramtricos
Finalmente, proponemos una serie de pasos para implementar una
prueba de significacin estadstica en el campo educativo, bien sea de forma
manual o informatizada:
1. Exposicin (formulacin) de las hiptesis estadsticas: nula y alternativa.
2. Establecimiento de un nivel de significacin alfa o error.
3. Clculo de la probabilidad de que nuestros resultados puedan haberse
obtenido bajo la hiptesis nula (Ho):
3.1. Seleccin de la prueba estadstica adecuada, dependiendo de la escala de
medida de las variables del estudio, el nmero de participantes en el mismo...
3.2. Ejecucin de la prueba, bien mediante estrategia manual o informatizada.
4. Toma de decisiones teniendo en cuenta que:
4.1. Si el valor obtenido tras la aplicacin de la prueba se encuentra localizado
en la regin de aceptacin de la hiptesis nula se acepta dicha hiptesis, si por
el contrario cae fuera de dicha regin, bien por debajo o por encima se acepta
la hiptesis alternativa.
15
16
PRUEBAS PARAMTRICAS
PRUEBAS NO
PARAMTRICAS
Prueba Z (N>30)
Prueba T (N30)
Pruebas relacionadas con la igualdad de
medias de dos grupos
Prueba Z (N>30)
Prueba T (N30)
Pruebas relacionadas con la igualdad de
varianza de dos o ms grupos
ANOVA simple
Para una sola muestra
Prueba de Kolmogorov-Smirnov
Prueba de Ji cuadrado ()
Prueba binomial
Para dos muestras
17
18
Z=
x1 x2
S1/N1 + S2/N2
t=
x1 x2
Sd / N
donde:
x1: media muestral del grupo 1
x2: media muestral del grupo 2
S1: cuasivarianza o varianza poblacional del grupo 1
S2: cuasivarianza o varianza poblacional del grupo 2
N1: Nmero de participantes del grupo 1
N2: Nmero de participantes del grupo 2
N: Nmero de participantes del estudio (N1+N2)
Sd: Cuasidesviacin o desviacin tpica poblacional de la diferencia entre
puntuaciones del grupo 1 y 2.
19
Z=
x1 x2
S1/N1 + S2/N2
20
Z=
0,87
4,791/16 + 3,53/16
Z=
0.29 + 0,22
= 1,21
3. Interpretacin y decisin
Asumiendo un error = 0,05 bilateral y, por tanto, unos valores crticos
de zeta 1,96 podemos apreciar como el valor de Ze (1,21) se sita en la
regin de aceptacin de Ho. Cualquier lateralidad supuesta, as como errores
asumidos daran lugar a una decisin similar a la tomada.
-1,96
1,96
1,21
21
Despus de
ACI
3
3
5
4
3
4
5
4
3
3
Xa = 3,7
5
5
6
7
5
8
7
6
7
8
Xd = 6,4
-2
-2
-1
-3
-2
-4
-2
-2
-4
-5
Sd =1,25
22
t=
xa xd
Sd / N
t=
1,25 / 10
-2,7
t=
= -6,92
0,39
3. Interpretacin y decisin
Asumiendo un error = 0,05 bilateral y unos grados de libertad (n de parejas1), es decir, 10-1 = 9 situamos la regin de aceptacin de Ho entre las
puntuaciones t = [-2,26, 2,26] . Claramente el valor de te est situado fuera de
la regin de aceptacin de la hiptesis nula (Ho), razn por la cual la decisin
es aceptar H1. A colacin de la determinacin de los grados de libertad (gl)
debemos recordar que stos se calculan de tres formas diferentes dependiendo
de las caractersticas del tipo de contraste:
Grados de libertad = N1 + N2 2
donde N1 y N2 son el nmero de participantes de uno y otro grupo
23
-6,92
-2,26
2,26
A) EL ANOVA simple
Tambin hay situaciones en que el nmero de muestras y/o grupos a
comparar exceden de dos. En este caso, la opcin ms vlida es el clculo del
ANOVA o ANVA (Anlisis de la varianza). En esencia, el anlisis de varianza
intenta determinar las variaciones que se generan entre los participantes u
observaciones de cada grupo (fuente de variacin entre o inter) y entre los
sujetos de un mismo grupo y las achacables al error (fuente de variacin intra o
de error). Puede consultarse la obra de Arnal y otros (1994: 107-110) para un
24
t y z en el
25
N!
C n(m) =
m * (N-m)!
donde:
m: nmero de elementos que se combinan
N!: factorial de n-elementos
N y/o n: nmero de elementos
tomando como ejemplo el caso de los programas de tcnicas de estudio y
sustituyendo cada elemento por su valor en la expresin anterior tenemos que:
3!
3*2*1
C 3(2) =
=3
2* (1)!
2 * (3-2)!
Podemos determinar que son tres las combinaciones necesarias para denotar
las posibles diferencias entre los tres grupos tomados de dos a dos, ya que las
otras tres son imagen de la matriz resultante y, por tanto, idnticas
combinaciones. Grficamente podra mostrarse de la siguiente forma:
A
B
C
A
-
B
A*B
-
C
A*C
B*C
-
la
probabilidad
de
encontrar
alguno
estadsticamente
26
27
Fuentes de
variacin (FV)
Sumas de cuadrados
(SC)
SCe
Grados de
libertad
(GL)
t-1
Medias
cuadrticas
(MC)
MCe
Entre grupos
Intragrupos o
Error
Total
SCi
N-t
MCi
SCt
N-1
Valor de F
MCe / MCi
siendo:
28
SCe =
(xi)
N
(xi)
C=
N
t-1 (grados de libertad entre): nmero de grupos/tratamientos 1
N-t (grados de libertad intra): nmero de participantes total menos el nmero
de grupos/tratamientos
N-1 (grados de libertad del total): nmero de participantes 1
MCe (media cuadrtica entre) = SCe / t-1
MCi (media cuadrtica intra) = SCi / N-t
29
xi
xi
Media
M1
4
3
4
3
3
17
59
3,4
(17/5)
M2
F
G
H
I
J
M2
5
4
5
5
6
25
127
5
(25/5)
M3
K
L
M
N
O
M3
7
8
9
8
9
41
339
8,2
(41/5)
TOTAL
83
525
30
(xi)
C=
N
Por tanto, el trmino de correccin sustituyendo cada elemento por su valor es:
(83)
C=
= 459,266
15
31
SCe/ SCt
SCe / SCt
59,73/65,73
= 0,95
Sumas de cuadrados
(SC)
59,73
Grados de
libertad (GL)
3-1
Medias
cuadrticas
29,86
15-3
0,5
65,73
15-1
Valor de F
59,73
3. Interpretacin y decisiones
32
m = gl/entre
n = gl/intra
Evidentemente Femp. > Fcrt., motivo por el cual se acepta H1; ello
implica que se reportan diferencias estadsticamente significativas entre los tres
tipos de metodologas de enseanza del ingls. En este sentido, la observacin
de los resultados obtenidos a nivel de medias resulta elocuente, ya que
aquellos alumnos instruidos con la metodologa 3 (M3) han alcanzado un
rendimiento acadmico en ingls muy superior a los instruidos mediante las
metodologas M2 y M3.
Adems
de
verificar
que
existen
diferencias
estadsticamente
= (fo-fe)
fe
33
donde:
definindose fe como:
Ho: fo = fe
H1 : fo fe
34
Ho: fo = fe
H1 : fo fe
2. Clculo de la prueba
Las caractersticas del ejemplo planteado (variable nominal y que slo
admite valores enteros) aconsejan el uso de la prueba . Aplicando su
expresin de clculo y sustituyendo cada miembro de la expresin por su valor
tenemos que:
(9-5)
(3-5)
(3-5)
= 4,8
3. Interpretacin y decisin
Tomando el nivel de significacin habitual, es decir, = 0,05 unilateral,
por ejemplo, y 2 grados de libertad (nmero de categoras 1) tenemos que el
35
valor de crit.= 5,99. Ya que emp < crit, es decir, 4,8 < 5,99 aceptamos la
hiptesis nula. Desde estas coordenadas, podemos afirmar que a pesar de que
la alternativa ms respondida ha sido buena (60%) frente al 20% de las otras
dos alternativas mala y regular no podemos afirmar que esta diferencia sea
estadsticamente
significativa
y,
por
ende,
tener
en
cuenta
para
interpretaciones posteriores.
b) Prueba de Kolmogorov-Smirnov para una muestra
Sn (xi)
Ho: Fo = Sn
H1: Fo Sn
36
Frecuencia
4
3
2
8
8
Ho: Fo = Sn
H1: Fo Sn
OBSERVADAS
4
3
2
8
8
TERICAS
5
5
5
5
5
OBS.ACUM.
4
7
9
17
25
TE.ACUM.
5
10
15
20
25
Sn (xi)
4/25 (0,16)
7/25 (0,28)
9/25 (0,36)
17/25 (0,68)
25/25 (1)
Fo (xi)
5/25 (0,2)
10/25 (0,4)
15/25 (0,6)
20/25 (0,8)
25/25 (1)
Sn - Fo
- 0,04
-0,12
-0,24
-0,12
0
37
3. Interpretacin y decisin
As pues, tenemos que el K-S emp. < K-S crt., es decir, que l0,24l <
0,29 razn por la cual aceptamos Ho y podemos afirmar que existe una cierta
unanimidad en las respuestas efectuadas.
Los resultados suministrados por paquete estadstico SPSS 11.0 son los
siguientes:
38
Media
Desviacin tpica
Absoluta
Positiva
Negativa
Z de Kolmogorov-Smirnov
Sig. asintt. (bilateral)
VAR00001
25
3,5200
1,4754
,268
,158
-,268
1,338
,056
Para un N 25:
39
18
P=
8
N-x
0,5 *
donde:
(x 0,5) N*p
Z=
N* p * q
40
18
P=
10
0,5 *
18
+ .
18
0,5 *
3. Interpretacin y decisin
Comparando esta probabilidad con la mitad de (dado que el contraste
es bilateral) comprobamos que: P emp. > /2
debe aceptar la hiptesis nula pudiendo ocurrir que la proporcin de nios que
han mejorado tras el programa sea igual a 0,5. Desde estas coordenadas,
podemos afirmar que dicho programa, pues, posee una efectividad que no ha
resultado estadsticamente superior y, por ende, puede ser considerarse
cuestionable.
Grupo 1
Grupo 2
Total
MEJORAN
NO
MEJORAN
Proporcin
observada
,44
10
,56
18
1,00
Prop. de
prueba
,50
Sig. exacta
(bilateral)
,815
41
42
Gnero
Gnero
Mujer
Hombre
Marginal
Opinin
A favor
En
contra
20
10
15
5
35
15
Mujer
Hombre
Marginal
Opinin
A favor
En
contra
40%
20%
30%
10%
70%
30%
A
Marginal
B
30
20
50
I1
I2
Marginal
J1
Ni1j1
Ni2j1
Nj1
Mujer
Hombre
Marginal
Opinin
A favor
En
contra
0,4
0,2
0,3
0,1
0,7
0,3
Marginal
60%
40%
100%
Gnero
J2
Ni1j2
Nij2
Nj2
Marginal
Ni1
Ni2
N
Marginal
0,6
0,4
1
A la vista de las anteriores tablas en las que, por cierto, se muestran los
diversos tipos de representacin de esta tcnica, es decir: notacin estadstica,
frecuencias, porcentajes y proporciones, destacamos los cuatro elementos de
toda tabla de contingencia:
43
1. Frecuencias observadas
2. Frecuencias esperadas
Gnero
Mujer
Hombre
Marginal
Opinin
A favor
35*30/50 (21)
35*20/50 (14)
35
En contra
15*30/50 (9)
15*20/50 (6)
15
Marginal
30
20
50
3. Frecuencias marginales
Las frecuencias marginales (fm) son la suma por filas (I) y columnas (J)
de las frecuencias observadas (fo). Obviamente el sumatorio, en este caso, las
cuatro frecuencias observadas debe ser igual a N o nmero total de
frecuencias observadas.
Opinin
Gnero
Mujer
Hombre
Marginal
A favor
20
15
35
En contra
10
5
15
Marginal
30
20
50
46
Opinin
Gnero
A favor
20
15
35
Mujer
Hombre
Marginal
En contra
10
5
15
Marginal
30
20
50
I1
I2
A
J1
J2
a*c / t b*c / t
a*d/ t b*d /t
Marginal
Marginal
Gnero
Mujer
Hombre
Marginal
Opinin
A favor
35*30/50 (21)
35*20/50 (14)
En contra
15*30/50 (9)
15*20 (6)
Marginal
(15-14)
(20-21)
+
21
= 0,39
14
48
la
variable
opinin como
columnas.
Despus
activamos
GNERO
hombre
mujer
Marginal
OPININ
a favor
en contra
20
10
15
5
35
15
Marginal
30
20
50
Pruebas de chi-cuadrado
Estadstico
Chi-cuadrado de Pearson*
N de casos vlidos
Valor
,397
50
gl
1
* 0 casillas (0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 6.
Medidas simtricas
Tipos
Nominal x
Nominal
N de casos
vlidos
Medidas de asociacin
Phi
V de Cramer
Coeficiente de contingencia
Valor
,089
,089
,089
50
Sig. aproximada
,529
,529
,529
49
V = / mn (I-1),(J-1)
donde:
n1 y n2: nmero de sujetos de cada grupo
R1 y R2: suma de rangos correspondientes a cada grupo
50
U (n1 * n2) /2
Z
n *n
1
2 * (n1
+ n2 + 1) /12
donde:
U: menor valor de las dos U calculadas
n1 y n2: nmero de sujetos de cada grupo
Secuencia de clculo
1. Se ordenan conjuntamente de menor a mayor las puntuaciones de ambas
muestras.
2. Se asigna un rango de orden a cada puntuacin.
3. Se suman los rangos de cada muestra.
4. Se calculan los valores U de cada muestra tomndose el menor de ellos.
51
Grupo de
maana
Grupo de tarde
Rango de
maana
Rango de
tarde
14
18
11,5
15
12
16
14
13
15
10
13
10
14
11,5
19
5,5
16
3,5
5,5
Media =
9,42
3,5
Media =
11,77
Rm =
Rt = 86,5
49,5
Antes estos resultados, podemos afirmar que alguno de los dos grupos ha
obtenido un mayor rendimiento estadsticamente significativo que el otro, o
por el contrario las diferencias entre ambos pueden atribuirse al azar?
52
Ho: m = t tambin m - t = 0
H1: m t tambin m - t 0
2. Clculo de la prueba
U1 = 7 * 9 + [7 * (7+1)/ 2] - 49,5 = 41,5
U2 = 7 * 9 + [9 * (9+1)/ 2] - 86,5 = 21,5
3. Interpretacin y decisin
53
rendimiento
grupo
Rangos
N
maana
tarde
Total
7
9
16
Rango
promedio
7,07
9,61
Suma de
rangos
49,50
86,50
Estadsticos de contraste**
U de Mann-Whitney
Z
Sig. asintt. (bilateral)
Sig. exacta [2*(Sig. unilateral)]
rendimiento
21,500
-1,061
,289
,299*
contempla
tambin
la
magnitud
de
las
mismas.
El
54
W = [ S (+)] - [ S (-)]
donde:
55
Antes programa
4
3
6
2
5
4
3
3
1
2
Media = 3,4
R(+)
R(-)
8,5
8,5
2
8,5
2
2
8,5
5,5
4
5,5
R(+) =
4
R(-) = 51
56
2*
8**
0***
10
Rango
promedio
2
6,37
Suma de
rangos
4
51
57
Estadsticos de contraste**
DESPUES - ANTES
Z
-2,325*
Sig. asintt. (bilateral)
,020
* Basado en los rangos positivos.
** Prueba de los rangos con signo de Wilcoxon
58
BIBLIOGRAFA
59
BIBLIOGRAFA
Abraira, V. y Prez, A. (1996). Mtodos multivariantes en bioestadstica.
Madrid. CERA.
Aguilera del Pino, A.M. (2001). Tablas de contingencia bidimensionales.
Madrid. La Muralla.
Arnal, J. y otros (1994). Investigacin educativa. Fundamentos y metodologa.
Barcelona. Labor.
Fernndez, M.J.; Garca, J.M.; Fuentes, A. y Asensio, A. (1992). Resolucin de
problemas de estadstica aplicada a las Ciencias Sociales. Gua prctica
para profesores y alumnos. Madrid. Sntesis.
Gil, J.; Rodrguez, G. y Garca, E. (1995). Estadstica bsica aplicada a las
Ciencias de la Educacin. Sevilla. Kronos.
Martn, Q. (2001). Contrastes de hiptesis. Madrid. La Muralla.
60