You are on page 1of 36

Definimos:

T: n de casos en los que (+)


T
(-)
: n de casos en los que (-)
PRUEBA DE SIGNO DE UNA MUESTRA
Se usa para hacer pruebas de hiptesis acerca de la
mediana de una poblacin de una variable continua.
Esta prueba estadstica est basada en la distribucin
Binomial con probabilidad de xito p=, puesto que la
probabilidad de que un dato sea mayor o menor que la
mediana es .
Dada una m.a simple de tamao n definida por (X
1
,..,X
n
)
extrada de una poblacin con distribucin continua, se
quiere contrastar si su mediana es igual a cierto valor
0
~

0
0
>
~
i
X
0
0
<
~
i
X
Profesora : Lic. Rita Guzmn
Para calcularla se determinan las diferencias de los
datos con respecto al valor dado y se cuentan los
signos positivos y negativos.
a) Cuando:
T(nmero de diferencias positivas) >T
(-)
(nmero de diferencias negativas) , entonces
el "p-valor" se calcula por :
0

~
n
c
i
i
n
P )
2
1
(
0
1
=

=
Donde:
c: nmero de diferencias positivas.
n: nmero de datos menos la cantidad de datos iguales al
valor asumido.
0

~
Para muestras pequeas (n<20) tenemos:
Profesora : Lic. Rita Guzmn
b) Cuando:
T(nmero de diferencias positivas) <T
(-)
(nmero de diferencias negativas) ,
entonces el "p- valor" se calcula por :
n
n
c i
i
n
P )
2
1
(
2
=

=
Donde:
c: nmero de diferencias positivas.
n: nmero de datos menos la cantidad de datos iguales al
valor asumido.
0

~
Profesora : Lic. Rita Guzmn
a) H
0
:
H
1
:
a.2)
entonces el p-valor se calcula con P
1
, es decir con:
0

~ ~

0

~ ~
<
Hiptesis de la prueba para el caso:
a.1) T(nmero de diferencias positivas) >T
(-)
(nmero de diferencias negativas)
n
c
i
i
n
P )
2
1
(
0
1
=

=
T(nmero de diferencias positivas) <T
(-)
(nmero de diferencias negativas)
entonces el p-valor se calcula con P
2
, es decir con:
n
n
c i
i
n
P )
2
1
(
2
=

=
Profesora : Lic. Rita Guzmn
b) H
0
:
H
1
:
b.2)
entonces el p-valor se calcula con P
2
, es decir con:
0

~ ~

0

~ ~
>
b.1)
T(nmero de diferencias positivas) >T
(-)
(nmero de diferencias negativas)
n
c
i
i
n
P )
2
1
(
0
1
=

=
T(nmero de diferencias positivas) <T
(-)
(nmero de diferencias negativas)
entonces el p-valor se calcula con P
1
, es decir con:
n
n
c i
i
n
P )
2
1
(
2
=

=
Profesora : Lic. Rita Guzmn
c) H
0
:
H
1
:
c.2)
entonces el p-valor se calcula con P
2
, es decir con:
0

~ ~
=
0

~ ~

c.1)
T(nmero de diferencias positivas) >T
(-)
(nmero de diferencias negativas)
n
c
i
i
n
P ) (
2
1
2
0
1
=

=
T(nmero de diferencias positivas) <T
(-)
(nmero de diferencias negativas)
entonces el p-valor se calcula con P
1
, es decir con:
n
n
c i
i
n
P ) (
2
1
2
2
=

=
c.2) T(nmero de diferencias positivas) =T
(-)
(nmero de diferencias negativas)
entonces el p-valor=1
Profesora : Lic. Rita Guzmn
Para muestras de tamao n ( ) y p=0.5, la
distribucin binomial esta bien aproximada por la
distribucin normal
20 n
Por tanto, dado que la media de la distribucin
binomial es np y la varianza es npq, la distribucin de
T
(nmero de signos de mayor frecuencia)
es aproximadamente
normal con media 0.5n y varianza 0.25n, cada vez
que n es moderadamente grande( ). Por
consiguiente las hiptesis pueden probarse con el
estadstico:
20 n
n
n T
Z
c
5 . 0
5 . 0
=
Profesora : Lic. Rita Guzmn
Profesora : Lic. Rita Guzmn
Regla de Decisin :
i)Para el caso de una cola:
Si: Z
c
|Z

| rechazamos H
0
.
Tambin:
Si p-valor rechazamos H
0
.
ii)Para el caso de dos colas:
Si : Z
c
-Z
/2
o Z
c
Z
/2
rechazamos H
0
.
Tambin:
Si p-valor /2 rechazamos H
0
.
Aplicativo:
Un artculo informa cerca de un estudio en el que se
modela el motor de un cohete reuniendo el combustible y
la mezcla de encendido dentro de un contenedor metlico.
Una caracterstica importante es la resistencia al esfuerzo
cortante de la unin entre los dos tipos de sustancias. En
la siguiente tabla se muestran los resultados obtenidos al
probar 20 motores seleccionados al azar. Se desea probar
la hiptesis de que la mediana de la resistencia al esfuerzo
cortante es 2000 psi, utilizando =0.05
Profesora : Lic. Rita Guzmn
Solucin:
Se muestra la tabla del ejercicio y los signos
asignados con respecto a la comparacin de la
mediana dada, entonces para un =0.05,
planteamos las hiptesis:
psi H
psi H
2000
~
:
2000
~
:
1
0

, (la mediana de la resistencia al esfuerzo


cortante es 2000 psi).
, (la mediana de la resistencia al esfuerzo
cortante es diferente al valor 2000 psi).
Profesora : Lic. Rita Guzmn
Tabla para el ejercicio:
Observacin
Resistencia
al esfuerzo
cortante
x
i
Signo de la
diferencia
x
i
-2000
Observacin
Resistencia
al esfuerzo
cortante
x
i
Signo de la
diferencia
x
i
-2000
1 2158.70 + 11 2165.20 +
2 1678.15 - 12 2399.55 +
3 2316.00 + 13 1779.80 -
4 2061.30 + 14 2336.75 +
5 2207.50 + 15 1765.30 -
6 1708.30 - 16 2053.50 +
7 1784.70 - 17 2414.40 +
8 2575.10 + 18 2200.50 +
9 2357.90 + 19 2654.20 +
10 2256.70 + 20 1753.70 -
Profesora : Lic. Rita Guzmn
T(nmero de diferencias positivas) = 14
T
(-)
(nmero de diferencias negativas) = 6
Como n es 20 se utilizar la aproximacin normal.
De la tabla se observa que el estadstico de prueba
asociado a H
0
es T
(nmero de signos de mayor frecuencia)
= 14.
Profesora : Lic. Rita Guzmn
Calculando el estadstico de prueba:
1789 0
20 5 0
20 5 0 14
5 0
5 0
.
) ( .
) ( . ) (
.
.
=

=
n
n T
Z
Conclusin:
Concluimos con un nivel de significancia del 5% que la
mediana es de 2,000 psi.
Profesora : Lic. Rita Guzmn
Regla de Decisin:
Si Z
c
-Z
/2
=-1.96 si Z
c
Z
/2
=1.96 , Se rechazar H
0
como 0.1789 < 1.96 entonces se rechaza H
o
Prueba de Wilcoxon de los rangos con
signo para una muestra
Hemos visto que con mnimos supuestos sobre la
distribucin de la poblacin de la que se ha hecho el
muestreo, supuestos slo de distribucin continua, la
prueba del signo es una prueba potente para pruebas
de posicin.
Pero si agregamos la hiptesis de simetra, es
posible aplicar una prueba ms potente que la prueba
de signo, siendo este una prueba basado en rangos.
Profesora : Lic. Rita Guzmn
La prueba de Wilcoxon de los rangos con signo
contrasta la hiptesis nula (H
o
) de que:
Una distribucin continua es simtrica entorno a
una mediana hipottica M
o
.
Profesora : Lic. Rita Guzmn
Bajo H
o
, el estadstico de prueba de rangos puede
ser representado como una suma de v.a.
independientes pero no idnticamente distribuidas
y, bajo H
1
, se pierde inclusive la independencia.
Entonces:
Sea una m.a X
1
,,X
n
de tamao n de una
distribucin continua con mediana M
0
, y asumiendo
que la poblacin es simtrica bajo la hiptesis nula.
H
0
: M=M
0
Donde : M=Mediana Poblacional
y si mediante la aplicacin de la prueba de wilcoxon
de los rangos con signo probramos que fuera dicha
hiptesis nula cierta consideraramos que las
diferencias D
i
=X
i
-M
0
se distribuiran de forma
simtrica entorno a cero.
Profesora : Lic. Rita Guzmn
Para aplicar la Prueba de Wilcoxon del rango con
signo, necesitamos calcular el estadstico de
prueba, para lo cual seguimos los siguientes pasos:
1) Se calculan las diferencias respecto a la mediana
hipottica o terica (M
0
) : D
i
=X
i
M
0
2) Ordenar de menor a mayor las n diferencias en
valor absoluto .
3) Se asignan rangos a las diferencias absolutas de
menor a mayor (sin tener en cuenta el signo, si hay
empates se asignan los rangos medios).
0
M X D
i i
=
Profesora : Lic. Rita Guzmn
4) A cada rango R
i
se le asigna el signo algebraico de
la diferencia correspondiente.
5) Se calculan:
) , (
+

+
=
=
=

W W mn W
R W
R W
Negativos
Rangos
i
positivos
rangos
i
Profesora : Lic. Rita Guzmn
Como se puede observar, se trata de contrastar si la menor de las sumas de
rangos es excesivamente pequea para ser atribuida al azar, o, lo que es
equivalente, si la mayor de las dos sumas de rangos es excesivamente
grande.
Hiptesis a Probar:
a) Unilateral Derecha
H
0
: M M
0
H
1
: M > M
0
b) Unilateral Izquierda
H
0
: M M
0
H
1
: M < M
0
c) Bilateral
H
0
: M = M
0
H
1
: M M
0
Profesora : Lic. Rita Guzmn
Regla de Decisin:
Rechazamos H
0
, si:
1) Para la prueba unilateral:
W W
n;
para H
1
: M > M
0
H
1
: M <M
0

P[W w]=p donde: p= p-valor


2) Para la prueba bilateral:
W W
n;/2
para H
1
: M M
0

P[W w]=p /2 donde: p= p-


valor
Profesora : Lic. Rita Guzmn
Para el caso de muestras grandes (n 20), W
+ -
se
aproxima a una normal con:
4
1) ( +
=
n n
W

24
1 2 1 ) )( ( + +
=
n n n
W

) 1 , 0 ( N
W
Z
W
W
c


Profesora : Lic. Rita Guzmn
Profesora : Lic. Rita Guzmn
Regla de Decisin :
i)Para el caso de una cola:
Si: Z
c
|Z

| rechazamos H
0
.
Tambin:
Si p-valor rechazamos H
0
.
ii)Para el caso de dos colas:
Si : Z
c
-Z
/2
o Z
c
Z
/2
rechazamos H
0
.
Tambin:
Si p-valor /2 rechazamos H
0
.
Aplicacin:
El tiempo mediana de supervivencia de los pacientes de
leucemia con los que se logra una remisin completa a
partir de un tratamiento convencional, es de 21 meses. Se
esta estudiando un nuevo tratamiento, del cual se espera
que aumente la mediana del tiempo de supervivencia. Se
anota este tiempo para 10 pacientes a los que se le ha
aplicado el nuevo tratamiento:
24.1 25.8 20.5 20.9 27.3
21.5 20.1 28.9 19.2 26.3
Profesora : Lic. Rita Guzmn
Solucin:
Planteamos las hiptesis:
H
0
: M = 21 (La mediana del tiempo de supervivencia con el
nuevo tratamiento no ha variado)
H
1
: M > 21 (La mediana del tiempo de supervivencia con el
nuevo tratamiento es mayor)
Luego: formamos el conjunto de 10 diferencias que se
obtienen restando 21 de cada una de las observaciones.
X
i
24.1 21.5 25.8 20.1 20.5 28.9 20.9 19.2 27.3 26.3
X
i
- 21 3.1 0.5 4.8 -0.9 -0.5 7.9 -0.1 -1.8 6.3 5.3
Ordenamos, de menor a mayor los valores absolutos de
las diferencias, para luego asignarle un rango R
i
de 1 a 10
y a cada rango se le asigna el signo de la diferencia que le
corresponda.
Profesora : Lic. Rita Guzmn
|X
i
- 21| 0.1 0.5 0.5 0.9 1.8 3.1 4.8 5.3 6.3 7.9
Rango R
i
1 2.5 2.5 4 5 6 7 8 9 10
signos -1 -2.5 2.5 -4 -5 6 7 8 9 10
Entonces los valores observados de de W
+
y |W
-
| son:
5 12 5 4 5 2 1
5 42 10 9 8 7 6 5 2
. ) ( ) ( ) . (
. .
= + + + = =
= + + + + + = =

+
negativos
rangos
i
positivos
rangos
i
R W
R W
Seleccionamos el estadstico W=mn{ W
+
y |W
-
|}:
W=|W
-
|=12.5
Profesora : Lic. Rita Guzmn
Hallamos el valor critico de la dcima:
Donde para una muestra de tamao 10, W
n;
=11
Entonces observamos que W=12.5 > 11, por lo tanto no se
rechaza H
0
con un nivel de significacin del 5%.
Concluimos con un 5% de riesgo, que no tenemos prueba
suficiente, en base a la muestra, de que el nuevo
tratamiento haya aumentado el tiempo medio de
supervivencia.
Profesora : Lic. Rita Guzmn
DOCIMAS PARA DOS
MUESTRAS RELACIONADAS
Profesora : Lic. Rita Guzmn
Prueba de Signos
Prueba aplicable a experimentos en muestras pareadas o
muestras relacionadas, contrasta la hiptesis de que ambos
tratamientos no difieren o que pertenecen a poblaciones
idnticas.
Consiste en datos u observaciones de m.a. bivariadas esto
es n pares de observaciones , cada par (x
i
,y
i
) es comparado
colocndole signos:
+ si x
i
> y
i
entonces x
i
y
i
> 0
0 si x
i
= y
i
entonces xi yi = 0
- si x
i
< y
i
entonces x
i
y
i
< 0
Por lo tanto la escala de medida es la ordinal.
Profesora : Lic. Rita Guzmn
a) Unilateral Izquierda (1 cola):
H
0
: La diferencia de las medianas 0
P(+) P(-)
H
1
: La diferencia de las medianas < 0
P(+) < P(-)
b) Unilateral Derecha (1 cola):
H
0
: La diferencia de las medianas 0
P(+) P(-)
H
1
: La diferencia de las medianas > 0
P(+) > P(-)
c) Bilateral (2 colas):
H
0
: La diferencia de las medianas = 0
P(+) = P(-)
H
1
: La diferencia de las medianas ( / ) 0
P(+) ( / ) P(-)
El resultado de cada par se considera como un experimento
de Bernoulli con p=1/2.
Profesora : Lic. Rita Guzmn
Estadstico de contraste o prueba:
a) El estadstico de prueba para muestras pequeas (N < 20), se
basa en la distribucin Bernoulli de parmetros, y se calcula :
Donde:
N=nmero de pares cuyas diferencias son diferentes de cero(0).
p = probabilidad asociada con la ocurrencia de H
0
de valores tan pequeos como x.
x = frecuencia del signo menos frecuente.
( )
N
x
i
N
i
x X P p

= =

=
2
1
) (
0
Profesora : Lic. Rita Guzmn
b) El estadstico de prueba para muestras grandes (N 20), puede
aproximar a una normal, con esta distribucin se tiene que:
Donde:
N=nmero de pares cuyas diferencias son diferentes de cero(0).
x = frecuencia del signo menos frecuente.
La aproximacin se hace excelente cuando se aplica una correccin de
continuidad.
) 1 , 0 (
2
2
N
N
N
x
x
Z
x
x


4
2
2
N
Varianza
N
Media
x
x
= =
= =

Profesora : Lic. Rita Guzmn


La correccin se hace reduciendo la diferencia entre el nmero de
observados de ms (o menos) conforme a H
0
, en 0.5, con la
correccin de continuidad tendremos que:
2
2
) 5 . 0 (
N
N
x
Z

=
2
N
x <
Donde
X + 0.5 para
X - 0.5 para
2
N
x >
Profesora : Lic. Rita Guzmn
Profesora : Lic. Rita Guzmn
Regla de Decisin :
i)Para el caso de una cola:
Si: Z
c
|Z

| rechazamos H
0
.
Tambin:
Si p-valor rechazamos H
0
.
ii)Para el caso de dos colas:
Si : Z
c
-Z
/2
o Z
c
Z
/2
rechazamos H
0
.
Tambin:
Si p-valor /2 rechazamos H
0
.
Aplicativo:
En un estudio diseado para determinar la eficacia de una nueva
dieta, una compaa de seguros selecciona una muestra de 12
sujetos con sobre peso entre 40 y 50 aos. Toma la medida de los
pesos antes de iniciar la dieta y 60 das despus.
Formular y contrastar la hiptesis nula apropiada con =0.05
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
Antes 90 105 76 71 82 93 92 85 84 84 78 81
Despus 84 98 77 71 80 87 91 85 82 83 76 82
Enunciar el problema en trminos estadsticos apropiados.
Profesora : Lic. Rita Guzmn
Solucin:
Planteamos las hiptesis:
H
0
: La dieta no disminuye el sobre peso, P(+) = P(-)
H
1
: La dieta disminuye el sobre peso, P(+) < P(-)
se evaluar con un nivel de significancia de =0.05
Comparando los resultados antes y despues de la aplicacin de la
nueva dieta, y se asignara los signos ms y menos segn corresponda:
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
Antes 90 105 76 71 82 93 92 85 84 84 78 81
Despus 84 98 77 71 80 87 91 85 82 83 76 82
- - + 0 - - - 0 - - - +
Entonces tenemos N=10 (no se consideran los ceros) y
X=2 (frecuencia del signo menos frecuente)
Profesora : Lic. Rita Guzmn
Calculamos el estadstico de prueba:
como N<20, calculamos la probabilidad a travs de la distribucin de
Bernoulli:
Luego p> 0.05, no rechazamos H
0
y concluimos que con un riesgo
del 5% no existe evidencia suficiente para decir que la dieta
disminuye de peso.
0542 . 0 )
2
1
)( ( ) 2 (
2
0
10
= = =

=
N
i
i
X P p
Profesora : Lic. Rita Guzmn

You might also like