Professional Documents
Culture Documents
Se debe sealar que hay varias desventajas asociadas con las pruebas no
paramtricas. En primer lugar, no utilizan toda la informacin que
proporciona la muestra, y por ello una prueba no paramtrica ser menos
eficiente que el procedimiento paramtrico correspondiente, cuando se
pueden aplicar ambos mtodos.
En consecuencia, para lograr la misma potencia, una prueba no
paramtrica requerir la correspondiente prueba paramtrica cuando sea
posible.
Como se indic antes, ligeras divergencias de la normalidad tienen como
resultado desviaciones menores del ideal para las pruebas paramtricas
estndar. Esto es cierto en particular para la prueba t. En este caso, el
valor P puede ser ligeramente errneo si existe una violacin moderada de
la suposicin de normalidad.
En resumen, si se puede aplicar una prueba paramtrica y una no
paramtrica al mismo conjunto de datos, debemos hacerlo.
Sin embargo, se debe reconocer que las suposiciones de normalidad a
menudo no se pueden justificar, y que no siempre se tienen mediciones
cuantitativas por lo que las pruebas paramtricas estaran fuera de alcance.
Pruebas de Correlacin.
Paramtrica.
Pearson, Coeficiente de Correlacin (r) o Coeficiente de Determinacin
(r2).
No-Paramtricas.
Spearman, Coeficiente de Correlacin (r).
Kendall. Coeficiente de Concordancia (w). Coeficiente de Correlacin (r).
Coeficiente de acuerdo (u) para comparaciones apareadas por rangos.
PRUEBAS NO PARAMTRICAS
Vamos a ver algunas de las pruebas no-paramtricas, las cuales, como
especificamos, no requieren suponer normalidad de la poblacin y que en su
mayora se basan en el ordenamiento de los datos.
Todas las pruebas que veremos requieren que la poblacin sea continua. El
parmetro que se usa comnmente para hacer las pruebas estadsticas noparamtricas es la Mediana y no la Media, aunque se pueden usar otros
parmetros.
metros
En MINITAB, para las pruebas noparamtricas se elige la secuencia
STAT 4Nonparametrics.
= o
< o
Supngase que se toman datos X1, X2, . . . , Xn para conformar una muestra
aleatoria tomada de la poblacin de inters.
Frmense las diferencias
Xi -
o ,
para i =1,2,...n
Z=
X (.5)n
(.5) n
= o
> o
= o
o
Ejemplos
1. Los tiempos de sobrevivencia (en aos) de 12 personas que se han
sometido a un transplante de corazn son los siguientes:
Paciente
Tiempo
3.1
.9
2.8
4.3
6.0
1.4
5.8
9.9
6.3
10.4
11.5
Probar con 95% de confianza si los datos del tiempo de vida despus del
transplante sugieren que la mediana sea distinta de 5 aos.
Solucin: Primero se calculan las diferencias contra el valor de prueba
(Mediana) y se cuentan los signos positivos y negativos:
TOTAL
7 negativos (-) y
5 positivos (+) este es r +
3.1
-5
-1.9
.9
-5
-4.1
2.8
-5
-2.2
4.3
-5
-0.7
.6
-5
-4.4
1.4
-3.6
+0.8
5.8
-5
-5
9.9
-5
+4.9
6.3
-5
+1.3
10.4
+5.4
-5.0
-5
-5
11.5
-5
+6.5
0.05
0.016
0.0029
0.0002
Interpretacin:Como
Como elel valor-P
valor-P es
es
Interpretacin:
mayor que
que .05
.05 se
se aceptar
aceptar lala hiptesis
hiptesis
mayor
nula. Es
Es decir
decir que
que lala mediana
mediana del
del
nula.
tiempo de
de vida
vida despus
despus del
del transplante
transplante
tiempo
noes
esdiferente
diferentede
de55aos.
aos.
no
Si usamos aproximacin normal a la binomial
el valor-P = 2P (X 5) = .77728
prcticamente igual
Solucin.
Ponemos los datos en forma de tabla para facilitar el procedimiento, en caso
de que haya un aumento en la atencin se agrega un signo +, si hay una
disminucin, se pone un signo -.
Los casos donde no exista cambio se eliminan del anlisis.
Paciente
Antes
Despus
Signo
mala
regular
regular
buena
mala
mala
eliminar
mala
peor
regular
malo
mala
peor
regular
buena
mala
buena
mala
regular
regular
mala
regular
buena
mala
buena
mala
peor
regular
excelente
mala
regular
0.1833
0.1222
0.0611
0.0222
0.0056
0.0009
0.0001
Mayor que
Decisin:
Como el nmero de signos positivos (r+ = 9) es menor a 11, entonces no
podemos decir que hay una diferencia y no se rechaza la hiptesis nula.
Es decir que la terapia no funcion (no hay un cambio significativo) a un
nivel de 5% de significancia.
RangosEmpatados
# RangosEmpatados
EJEMPLO.Usandolosdatosdelospacientesdetrasplantealcorazn.
3.1
5
1.9
1.9
4
.9
5
4.1
4.1
7
2.8 5
2.2
2.2
5
4.3 5
0.7
0.71
.6
5
4.4
4.4
8
1.4 5
3.6
3.6
6
5.8 5
+0.8
0.8
2
9.9 5
+4.9
4.9
9
6.3 5
+1.3 1.3
3
10.4 5
+5.4
5.4
11
0
5
5.0
5.0
10
11.5 5
+6.5
6.512
SUMADERANGOSPOSITIVOS=2+9+3+11+12=37
SUMADERANGOSNEGATIVOS=4+7+5+1+8+6+10=41
Comosoncasiiguales
SEACEPTALAHIPTESISNULA
(NOhaydiferenciaconlaMediana)
EJEMPLO
Caso de muestras dependientes o relacionadas.
2. Se efectu una prueba a unos pacientes para saber si su nivel de ansiedad
ha bajado despus de una terapia. Se les ha calificado en un escala de 1 a
20, siendo 20 el nivel mximo de ansiedad. Efectuar una prueba para saber si
la terapia ha tenido un resultado positivo, usar una significancia de 0.05
Los datos son los que se muestran en la tabla, las columnas siguientes son las
diferencias entre los dos valores (antes y despus), las diferencias absolutas y
el rango asignado a cada diferencia absoluta:
Paciente
Antes
Despus
Dif
Dif Abs
Rango
14
12
16
-8
18
14
14
13
20
12
16
16
Eliminar
14
16
-10
10
11
19
10
18
10
16
13
18
16
16
14
13
-9
14
-7
16
12
12
12
Suma de rangos
positivos
r+ = 75
Suma de rangos
negativos
r- = 30
Se emplea el menor
de los rangos como
estadstico de
prueba.
Los rangos para los
empates se
calcularon como se
muestra a
continuacin.
10
10
11
12
12
14
13
16
14
5+6+7
=6
3
8 + 9 + 10
=9
3
Rango asignado a
los valores
empatados
Se busca en una tabla o con software el valor crtico del estadstico W, usando
n=14 (se elimin un paciente que no mostr cambio) y el nivel de
= 0.05.
00.01
0.005
Pruebas dedosColas
N
0.05
0.02
0.01
10
11
11
12
14
10
13
17
13
10
14
21
16
13
15
25
20
16
16
30
24
20
17
35
28
23
18
40
33
28
19
46
38
32
20
52
43
38
21
59
49
43
22
66
56
49
23
73
62
55
24
81
69
61
25
89
77
68
Tabladevalorescrticosparalapruebade
Wilcoxon.Elvalorobtenido(delamenorsuma
derangos)esestadsticamentesignificativosies
igualomenorqueelvalordelatabla.
n1 (n1 + n2 + 1)
W
2
z=
~ N (0,1)
n1 n2 (n1 + n2 + 1)
12
z=
n1 (n1 + n 2 + 1)
2
~ N (0,1)
3
g
ti ti
n1 n 2
[n1 + n 2 + 1
12
i =1 ( n1 + n 2 )( n1 + n 2 1)
W
Ejemplo
Usando los datos probar si el rendimiento en la prueba de
aprovechamiento matemtico de los estudiantes de escuela pblica y privada
es el mismo. Los datos son como siguen:
privada pblica
642 580
767 638
641 704
721 694
625 615
689 617
623
689
Solucin
Mann-Whitney Test and CI: privada, pblica
N Median
privada 6 665.5
pblica 8 630.5
Point estimate for ETA1-ETA2 is 26.5
95.5 Percent CI for ETA1-ETA2 is (-47.0,104.0)
W = 56.5
Test of ETA1 = ETA2 vs ETA1 not = ETA2 is significant at 0.1556
The test is significant at 0.1551 (adjusted for ties)
k
Ri2
12
H=
3(n + 1)
n(n + 1) i =1 ni
donde,
n es el total de datos.
H '=
3
t
i ti
i =1
n3 n
Se puede mostrar que si los tamaos de cada grupo son mayores que 5
entonces, H se distribuye como una Ji-Cuadrado con, k-1 grados de libertad.
Luego, la hiptesis nula se rechaza si
.
Para hacer la prueba de Kruskal-Wallis en
H MINITAB,
> k 1,1 los datos de la variable
cuantitativa deben ir en una columna y los niveles del factor en otra. No se
permite en este caso entrar los grupos en columnas separadas.
2
Ejemplo
Se trata de comparar 3 mtodos de
enseanza (a, b y c) pero tomando
en cuenta adems el factor turno
(m, t y n), es decir el tiempo del da
al cual se da clase. Los datos son
como siguen:
a
b
c
m 80.000 65.000 66.000
78.000 79.000 49.000
t
Interpretacin: Como el p-value es 0.016 menor que .05, se rechaza la hiptesis nula
y se concluye que los mtodos no son todos iguales. Es decir; al menos uno de los
mtodos tiene mediana distinta a los otros.
rs = 1
6 d 2
n( n2 1)
el Coeficiente de Spearman
Si el valor de rs:
... es -1, hay una correlacin negativa perfecta.
... se encuentra entre -1 y -0.5, hay una fuerte correlacin negativa.
... se encuentra entre -0.5 y 0, hay una dbil correlacin negativa.
... es 0, no hay correlacin
... se encuentra entre 0 y 0.5, hay una dbil correlacin positiva.
... se encuentra entre 0.5 y 1, hay una fuerte correlacin positiva.
... es 1, hay una correlacin positiva perfecta.
entre los 2 juegos de datos.
# Si el valor de rs es 0, podemos decir que la hiptesis nula se acepta. De
otra forma se rechaza.
Ejemplos:
1. Una asociacin de profesores universitarios quiere determinar si la
satisfaccin en el trabajo es independiente del rango acadmico. Para ello
realiz un estudio nacional entre los acadmicos universitarios y encontr los
resultados mostrados son la tabla siguiente. Con un =0.05, hacer una
prueba para saber si la satisfaccin en el trabajo es independiente del rango.
RANGO
Profesor
Titular
Profesor
asistente
Profesor
asociado
Ayudante
Satisfaccin MUCHA
en el
REGULAR
Trabajo
40
78
57
60
87
63
52
82
66
63
88
64
POCA
Solucin:
Ho; La satisfaccin en el trabajo y el rango son independientes.
H1; La satisfaccin en el trabajo y el rango son dependientes.
Grados de libertad: (r-1)(c-1) = (3-1)(4-1)=(2)(3) = 6
Regla de decisin:
Si X2 12.592 no se rechaza Ho.
Si X2 > 12.592 se rechaza Ho.
Se proceder a calcular los valores esperados de cada celda. Como los grados
de libertad son 6, esto quiere decir que necesitamos calcular nicamente 6
frecuencias esperadas, y las faltantes se encuentran por diferencia con el
total.
Se calcularn los valores esperados E11, E12, E13, E21, E22 y E23.
Se requieren los totales de rengln y columna que se aaden a la tabla:
RANGO
Satisfaccin
en el
Trabajo
Profesor
Titular
Profesor
asistente
Profesor
asociado
Ayudante
TOTAL
RENGLN
MUCHA
REGULAR
POCA
40
78
57
60
87
63
52
82
66
63
88
64
215
335
250
TOTAL
COLUMNA
175
210
200
215
800
RANGO
Satisfaccin
en el
Trabajo
MUCHA
REGULAR
POCA
TOTAL
COLUMNA
Profesor
Titular
Profesor
asistente
Profesor
asociado
Ayudante
TOTAL
RENGLN
40
(47.03)
78
(73.28)
57
(54.69)
60
(56.44)
87
(87.94)
63
(65.62)
52
(53.75)
82
(83.75)
66
(62.50)
63
(57.78)
88
(90.03)
64
(67.19)
215
175
210
200
215
800
335
250
Decisin y justificacin:
Como el valor de 2.75 es menor que el crtco de 12.592, por lo tanto no
se rechaza Ho y se concluye con un =0.05 que la satisfaccin en el
trabajo y el rango son independientes.