You are on page 1of 42

16.

PRUEBAS DE HIPTESIS
CONCEPTOS BSICOS PARA EL PROCEDIMIENTO
Etapas bsicas en pruebas de hiptesis. Al realizar pruebas de hiptesis, se parte de
un valor supuesto (Hipottico) en parmetro poblacional. Despus de recolectar una
muestra aleatoria, se compara la estadstica muestral, as como la media, con el
parmetro hipottico, se compara con una supuesta media poblacional. Despus se
acepta o se rechaza el valor hipottico, segn proceda. Se rechaza el valor hipottico
slo si el resultado muestral resulta muy poco probable cuando la hiptesis es cierta.
- Etapa 1. Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H
0
)
es el valor hipottico del parmetro que se compra con el resultado muestral
resulta muy poco probable cuando la hiptesis es cierta.
- Etapa 2. Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hiptesis nula solamente si el
resultado muestral es tan diferente del valor hipottico que una diferencia de esa
magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o
menos.
- Etapa 3. Elegir la estadstica de prueba. La estadstica de prueba puede ser la
estadstica muestral (el estimador no segado del parmetro que se prueba) o una
versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor
hipottico de una media poblacional, se toma la media de una muestra aleatoria de
esa distribucin normal, entonces es comn que se transforme la media en un valor
z el cual, a su vez, sirve como estadstica de prueba.
Consecuencias de las Decisiones en Pruebas de Hiptesis.
Decisiones Posibles Situaciones Posibles
La hiptesis nula es
verdadera
La hiptesis nula es falsa
Aceptar la Hiptesis Nula Se acepta correctamente Error tipo II o Beta
Rechazar la Hiptesis
Nula
Error tipo I o Alfa Se rechaza correctamente
- Etapa 4. Establecer el valor o valores crticos de la estadstica de prueba.
Habiendo especificado la hiptesis nula, el nivel de significancia y la estadstica
de prueba que se van a utilizar, se produce a establecer el o los valores crticos de
1
estadstica de prueba. Puede haber uno o ms de esos valores, dependiendo de si se
va a realizar una prueba de uno o dos extremos.
- Etapa 5. Determinar el valor real de la estadstica de prueba. Por ejemplo, al
probar un valor hipottico de la media poblacional, se toma una muestra aleatoria
y se determina el valor de la media muestral. Si el valor crtico que se establece es
un valor de z, entonces se transforma la media muestral en un valor de z.
- Etapa 6. Tomar la decisin. Se compara el valor observado de la estadstica
muestral con el valor (o valores) crticos de la estadstica de prueba. Despus se
acepta o se rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa; a
su vez, esta decisin tendr efecto sobre otras decisiones de los administradores
operativos, como por ejemplo, mantener o no un estndar de desempeo o cul de
dos estrategias de mercadotecnia utilizar.
La distribucin apropiada de la prueba estadstica se divide en dos regiones: una
regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima
regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que el
proceso funciona correctamente.
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor
crtico en la distribucin estadstica que divide la regin del rechazo (en la cual la
hiptesis nula no se puede rechazar) de la regin de rechazo. A hora bien el valor
crtico depende del tamao de la regin de rechazo.
Pasos de la Prueba de Hiptesis
- Expresar la hiptesis nula
- Expresar la hiptesis alternativa
- Especificar el nivel de significanca
- Determinar el tamao de la muestra
- Establecer los valores crticos que establecen las regiones de rechazo de las de no
rechazo.
- Determinar la prueba estadstica.
- Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica
apropiada.
- Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no
rechazo.
- Determinar la decisin estadstica.
- Expresar la decisin estadstica en trminos del problema.
Hiptesis Estadstica. Al intentar alcanzar una decisin, es til hacer hiptesis (o
conjeturas) sobre la poblacin aplicada. Tales hiptesis, que pueden ser o no ciertas,
2
se llaman hiptesis estadsticas. Son, en general, enunciados acerca de las
distribuciones de probabilidad de las poblaciones.
Hiptesis Nula. En muchos casos formulamos una hiptesis estadstica con el nico
propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est
trucada, formulamos la hiptesis de que la moneda es buena (o sea p=0,5, donde p es
la probabilidad de cara). Analgicamente, si deseamos decidir si un procedimiento es
mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea.
Que cualquier diferencia observada se debe simplemente a fluctuaciones en el
muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se
denotan por H
o
.
Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer
una hiptesis nula. La hiptesis nula es aquella que nos dice que no existen
diferencias significativas entre los grupos. Por ejemplo, supongamos que un
investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo
de natacin, stos sern mejores nadadores que aquellos que no recibieron
entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y
tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el
cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que
llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo
de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo
recibi.
Una hiptesis nula es importante por varias razones:
- Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin.
- El hecho de contar con una hiptesis nula ayuda a determinar si existe una
diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al
azar.
- No toda investigacin precisa de formular hiptesis nula. Se recomienda que la
hiptesis nula es aquella por la cual indicamos que la informacin a obtener es
contraria a la hiptesis de trabajo.
Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se
enuncia que la causa determinada como origen del problema flucta, por tanto, debe
rechazarse como tal.
Hiptesis Alternativa: Toda hiptesis que difiere de una dada se llamar una
hiptesis alternativa. Una hiptesis alternativa a la hiptesis nula se denotar por H
1
.
Al responder a un problema, es muy conveniente proponer otras hiptesis en que
aparezcan variables independientes distintas de las primeras que formulamos. Por
3
tanto, para no perder tiempo en bsquedas intiles, es necesario hallar diferentes
hiptesis alternativas como respuesta a un mismo problema y elegir entre ellas cules
y en qu orden vamos a tratar su comprobacin.
Las hiptesis, naturalmente, sern diferentes segn el tipo de investigacin que se
est realizando. En los estudios exploratorios, a veces, el objetivo de la investigacin
podr ser simplemente el de obtener los mnimos conocimientos que permitan
formular una hiptesis. Tambin es aceptable que, en este caso, resulten poco
precisas, como cuando afirmamos que "existe algn tipo de problema social en tal
grupo", o que los planetas poseen algn tipo de atmsfera, sin especificar de qu
elementos est compuesto.
Los trabajos de ndole descriptiva generalmente presentan hiptesis del tipo "todos
los X poseen, en alguna medida, las caracterstica Y". Por ejemplo, podemos decir
que todas las naciones poseen algn comercio internacional, y dedicarnos a describir,
cuantificando, las relaciones comerciales entre ellas. Tambin podemos hacer
afirmaciones del tipo "X pertenece al tipo Y", como cuando decimos que una
tecnologa es capital - intensiva. En estos casos, describimos, clasificndolo, el objeto
de nuestro inters, incluyndolo en un tipo ideal complejo de orden superior.
Por ltimo, podemos construir hiptesis del tipo "X produce (o afecta) a Y", donde
estaremos en presencia de una relacin entre variables.
Errores de tipo I y de tipo II. Si rechazamos una hiptesis cuando debiera ser
aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos
una hiptesis que debiera ser rechazada, diremos que se cometi un error de tipo II.
En ambos casos, se ha producido un juicio errneo. Para que las reglas de decisin (o
no contraste de hiptesis) sean buenos, deben disearse de modo que minimicen los
errores de la decisin; y no es una cuestin sencilla, porque para cualquier tamao de
la muestra, un intento de disminuir un tipo de error suele ir acompaado de un
crecimiento del otro tipo. En la prctica, un tipo de error puede ser ms grave que el
otro, y debe alcanzarse un compromiso que disminuya el error ms grave. La nica
forma de disminuir ambos a la vez es aumentar el tamao de la muestra que no
siempre es posible.
Niveles de Significacin. Al contrastar una cierta hiptesis, la mxima probabilidad
con la que estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama
nivel de significacin. Esta probabilidad, denota a menudo por se, suele especificar
antes de tomar la muestra, de manera que los resultados obtenidos no influyan en
nuestra eleccin.
4
En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une
otros valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al
disear una regla de decisin, entonces hay unas cinco (05) oportunidades entre 100
de rechazar la hiptesis cuando debiera haberse aceptado; Es decir, tenemos un 95%
de confianza de que hemos adoptado la decisin correcta. En tal caso decimos que la
hiptesis ha sido rechazada al nivel de significacin 0,05, lo cual quiere decir que tal
hiptesis tiene una probabilidad 0,05 de ser falsa.
Prueba de 1 o 2 Extremos. Cuando estudiamos ambos valores estadsticos es decir,
ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de
una y dos colas. Con frecuencia no obstante, estaremos interesados tan slo en
valores extremos a un lado de la media (o sea, en uno de los extremos de la
distribucin), tal como sucede cuando se contrasta la hiptesis de que un proceso es
mejor que otro (lo cual no es lo mismo que contrastar si un proceso es mejor o peor
que el otro) tales contrastes se llaman unilaterales, o de un extremo. En tales
situaciones, la regin crtica es una regin situada a un lado de la distribucin, con
rea igual al nivel de significacin.
Curva Caracterstica Operativa y Curva de Potencia. Podemos limitar un error
de tipo I eligiendo adecuadamente el nivel de significancia. Es posible evitar el riesgo
de cometer el error tipo II simplemente no aceptando nunca la hiptesis, pero en
muchas aplicaciones prcticas esto es inviable. En tales casos, se suele recurrir a
curvas caractersticas de operacin o curvas de potencia que son grficos que
muestran las probabilidades de error de tipo II bajo diversas hiptesis. Proporcionan
indicaciones de hasta que punto un test dado nos permitir evitar un error de tipo II;
es decir, nos indicarn la potencia de un test a la hora de prevenir decisiones errneas.
Son tiles en el diseo de experimentos por que sugieren entre otras cosas el tamao
de muestra a manejar.
Inferencias acerca de la Media Poblacional (varianza conocida). Supongamos que
de una poblacin normal con media desconocida . y varianza conocida
2
se extrae
una muestra de tamao n, entonces de la distribucin de la media muestral x se
obtiene que:
n /
x
Z
o

Se distribuye como una normal estndar. Luego,


( ) < <

1 Z Z Z P
2 / 2 /
5
Donde Z
/2
es un valor de la normal estndar tal que el rea a la derecha de dicho
valor es /2, como se muestra en la figura
Sustituyendo la frmula de z se obtiene:




,
_

<

< 1 Z
n /
x
Z P
2 / 2 /
Haciendo un despeje algebraico, se obtiene

,
_


+ < <



1
n
Z
x
n
Z
P
2 / 2 /
De lo anterior se puede concluir que un Intervalo de Confianza del 100(1-)% para la
media poblacional , es de la forma:

,
_


n
Z
x ,
n
Z
x
2 / 2 /
Usualmente =0.1, 0.05 0.01, que corresponden a intervalos de confianza del 90,
95 y 99 por ciento respectivamente. La siguiente tabla muestra los Z
/2
ms usados.
Nivel de Confianza Z
/2
90 1.645
95 1.96
99 2.58

En la prctica si la media poblacional es desconocida entonces, es bien probable que
la varianza tambin lo sea puesto que en el clculo de
2
interviene . Si sta es la
situacin, y si el tamao de muestra es grande (n>30, parece ser lo ms usado),
entonces
2
es estimada por la varianza muestral s
2
y se puede usar la siguiente
frmula para el intervalo de confianza de la media poblacional:
6

,
_

n
s Z
x ,
n
s Z
x
2 / 2 /
Por otro lado, tambin se pueden hacer pruebas de hiptesis con respecto a la media
poblacional . Por conveniencia, en la hiptesis nula siempre se asume que la media
es igual a un valor dado. La hiptesis alterna en cambio, puede ser de un slo lado:
menor mayor que el nmero dado, de dos lados: distinto a un nmero dado.
Existen dos mtodos de hacer la prueba de hiptesis: el mtodo clsico y el mtodo
del P-Value.
a. En el mtodo clsico, se evala la prueba estadstica de Z y al valor obtenido se le
llama Z calculado (Z
calc
). Por otro lado el nivel de significacin dado determina
una regin de rechazo y una de aceptacin. Si Z
calc
cae en la regin de rechazo,
entonces se concluye que hay suficiente evidencia estadstica para rechazar la
hiptesis nula con base en los resultados de la muestra tomada. Las frmulas
estn resumidas en la siguiente tabla:
Caso I Caso II Caso III
H
o
: =
0
H
o
: =
0
H
o
: =
0
H
a
: <
0
H
a
:
0
H
a
: >
0
Prueba Estadstica:
n /
x
Z
o

Aqu Z

es el valor de la normal estndar tal que el rea a la derecha de dicho


valor es . Recordar tambin que puede ser sustituido por s, cuando la muestra
es relativamente grande (n>30). Los valores de ms usados son 0.01 y 0.05. Si
se rechaza la hiptesis nula al .01 se dice que la hiptesis alterna es altamente
significativa y al .05 que es significativa.
b. Trabajar slo con esos dos valores de simplificaba mucho el aspecto
computacional, pero por otro lado creaba restricciones. En la manera moderna de
probar hiptesis se usa una cantidad llamada P-Value. El P-Value llamado el
nivel de significacin observado, es el valor de al cual se rechazara la hiptesis
nula si se usa el valor calculado de la prueba estadstica. En la prctica un P-
Value cercano a 0 indica un rechazo de la hiptesis nula. As un P-Value menor
que .05 indicar que se rechaza la prueba estadstica.
Frmulas para calcular P-Value:
- Si H
o
: >
o,
entonces P-value = 1*Prob(Z>Z
calc
).
7
- Si H
o
: <
o,
entonces P-value = 1*Prob(Z<Z
calc
).
- Si H
o
:
o,
entonces P-value = 2*Prob(Z>|Z
calc| |).
Los principales programas estadsticos dan los P-Value para la mayora de las
pruebas estadsticas. A travs de todo el texto usamos el mtodo del P-Value
para probar hiptesis.
Concepto. Afirmacin acerca de los parmetros de la poblacin.
PRUEBAS DE HIPTESIS PARA LA MEDIA Y PROPORCIONES
Debido a la dificultad de explicar este tema se enfocar un problema basado en un
estudio en una fbrica de llantas. En este problema la fbrica de llantas tiene dos
turnos de operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria
de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones
de cada una de las siguientes preguntas
- Es la duracin promedio de las llantas producidas en el turno de da igual a 25
000 millas?
- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25
000 millas?
- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de
las 10 000 millas?
Prueba de Hiptesis para la media. En la fbrica de llantas la hiptesis nula y
alternativa para el problema se plantearon como,
H
o
: = 25 000 H
1
: 25 000
Si se considera la desviacin estndar las llantas producidas en el turno de da,
entonces, con base en el teorema de limite central, la distribucin en el muestreo de la
media seguira la distribucin normal, y la prueba estadstica que esta basada en la
diferencia entre la media Xde la muestra y la media hipottica se encontrara como
n /
x
Z
o

Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran


determinar los valores crticos de la distribucin. Dado que la regin de rechazo esta
dividida en las dos colas de la distribucin, el 5% se divide en dos partes iguales de
2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar
en unidades de desviacin. Una regin de rechazo de 0.25 en cada cola de la
8
distribucin normal, da por resultado un rea de .475 entre la media hipottica y el
valor crtico. Si se busca est rea en la distribucin normal, se encuentra que los
valores crticos que dividen las regiones de rechazo y no rechazo son + 1.96 y - 1.96
Por tanto, la regla para decisin sera rechazar H
o
si Z > +1.96 o s z < -1.96, de lo
contrario, no rechazar H
o.
No obstante, en la mayor parte de los casos se desconoce la
desviacin estndar de la poblacin. La desviacin estndar se estima al calcular
S, la desviacin estndar de la muestra. Si se supone que la poblacin es normal la
distribucin en el muestreo de la media seguira una distribucin t con n-1 grados de
libertad.
En la prctica, se a encontrado que siempre y cuando el tamao de la muestra no sea
muy pequeo y la poblacin no este muy sesgada, la distribucin t da una buena
aproximacin a la distribucin de muestra de la media. La prueba estadstica para
determinar la diferencia entre la media x de la muestra y la media

de la
poblacin cuando se utiliza la desviacin estndar S de la muestra, se expresa
n / s
X
t
1 n

Para una muestra de 100, si se selecciona un nivel de significanca de 0.05, los


valores crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener
como se indica en la siguiente tabla tenemos el valor de 1.9842. Como esta prueba de
dos colas, la regin de rechazo de 0.05 se vuelve a dividir en dos partes iguales de
0.025 cada una. Con el uso de las tablas para t, los valores crticos son 1.984 y
+1.984. La regla para la decisin es,
Rechazar H
o
si
9842 . 1 t o 9842 . 1 t
99 99
< + >
de lo contrario, no rechazar H
o
Los resultados de la muestra para el turno de da (en millas) fueron
100 n y 000 . 4 S , 430 . 25 X
da da da
millas. Puesto que se esta probando si
la media es diferente a 25 000 millas, se tiene con la ecuacin
9
075 . 1
100 / 000 . 4
00 . 25 430 . 25
t
n / S
X
t
1 100 1 n


Dado que t
100-1
=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza
Ho.
Por ello, la decisin de no rechazar la hiptesis nula Ho. En conclusin es que la
duracin promedio de las llantas es 25 000 millas. A fin de tener en cuenta la
posibilidad de un error de tipo II, este enunciado se puede redactar como no hay
pruebas de que la duracin promedio de las llantas sea diferente a 25 000 millas en
las llantas producidas en el turno de da.
PRUEBA DE HIPTESIS PARA PROPORCIONES
El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin
con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de
llantas quera determinar la proporcin de llantas que se reventaban antes de 10.000
millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a
conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica
particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo
bastante alta para que muy pocas se revienten antes de las 10.000 millas. Si ms de un
8% de las llantas se revientan antes de las 10.000 millas, se llegara a concluir que el
proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar
como sigue:
08 . 0 P H
0

(Funciona correctamente)
08 . 0 P H
1
> (No funciona correctamente)
La prueba estadstica se puede expresar en trminos de la proporcin de xitos como
sigue:
n
X
P
n
Pq
P P
Z
s
s

siendo X y N el nmero de xitos de la muestra y n el tamao de la muestra, P la


proporcin de xitos de la hiptesis nula. Ahora se determinar si el proceso funciona
correctamente para las llantas producidas para el turno de da. Los resultados del
turno de da indican que cinco llantas en una muestra de 100 se reventaron antes de
10,000 millas para este problema, si se selecciona un nivel de significancia 05 . 0 ,
las regiones de rechazo y no rechazo se estableceran como a continuacin se
10
muestra. Y la regla de decisin sera: Rechazar Ho si z> + 1.645; de lo contrario no
rechazar H
o
. Con los datos que se tienen,
107 . 1
n
Pq
P P
Z 05 . 0 P
s
s



una vez reemplazado, recuerde p+q=1
Z=-1.107 +1.645; por tanto no rechazar H
o
.
La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la
regin de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del
8% de las llantas producidas en el turno de da se revienten antes de 10,000 millas. El
gerente no ha encontrado ninguna prueba de que ocurra un nmero excesivo de
reventones en las llantas producidas en el turno de da.
Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de
distribucin de una variable aleatoria. Para establecer la verdad o falsedad de una
hiptesis estadstica con certeza total, ser necesario examinar toda la poblacin. En
la mayora de las situaciones reales no es posible o practico efectuar este examen, y el
camino mas aconsejable es tomar una muestra aleatoria de la poblacin y en base a
ella, decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significacin y se declara falsa si la probabilidad calculada es menor que el valor
tabular. La prueba a realizar depender del tamao de las muestras, de la
homogeneidad de las varianzas y de la dependencia o no de las variables. Si las
muestras a probar involucran a ms de 30 observaciones, se aplicar la prueba de Z, si
las muestras a evaluar involucran un nmero de observaciones menor o igual que 30
se emplea la prueba de t de student. La frmula de clculo depende de si las varianzas
son homogneas o heterogneas, si el nmero de observaciones es igual o diferente, o
si son variables dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se
divide por la menor, este resultado es un estimado de la F de Fisher. Luego se busca
en la tabla de F usando como numerador los grados de libertad (n-1) de la varianza
mayor y como denominador (n-1) de la varianza menor para encontrar la F de Fisher
tabular. Si la F estimada es menor que la F tabular se declara que las varianzas son
homogneas. Si por el contrario, se declaran las varianzas heterogneas. Cuando son
variables dependientes (el valor de una depende del valor de la otra), se emplea la
tcnica de pruebas pareadas.
11
Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para
referirse a ellas, as entenderemos por:
- n
a
al nmero de elementos de la muestra a
- n
b
al nmero de elementos de la muestra b
- x
b
al promedio de la muestra b
- s
2
a
la varianza de la muestra a
- Y as sucesivamente
Entonces se pueden distinguir 6 casos a saber:
- Caso de muestras grandes (n>30)
- Caso de n
a
= n
b
y s
2
a
= s
2
b

- Caso de n
a
= n
b
y s
2
a
s
2
b

- Caso de n
a
n
b
y s
2
a
= s
2
b

- Caso de n
a
n
b
y s
2
a
s
2
b

- Caso de variables dependientes
1.-Cuando las muestras a probar involucran 2.-Caso de nmero igual de
observaciones y a ms de 30 observaciones varianzas homogneas
) n / 2 (
bs as
2
X b X a
t
nb
bs
na
as
X b X a
z
2 2
c
2 2
c
+

3.-Caso de igual nmero de observaciones 4.-Caso de diferente nmero de


observacio-
y varianzas heterogneas. nes y varianzas homogneas
bn
cs
an
cs
X b X a
t
n
bs as
X b X a
t
2 2
c
2 2
c
+

5.- Caso de diferente nmero de observaciones y varianzas heterogneas. En este


caso, la t
c
es comparada con la t
g
(t generada), que a diferencia de los casos anteriores,
hay que calcularla.
12
n
2
b
a
2
a
b a
c
n
2
b
a
2
a
b
2
b
b
a
2
a
a
g
n
s
n
s
X X
t
n
s
n
s
n
s
t
n
s
t
t
+

+
+

Donde: t
a
y t
b
son los valores de la tabla con n-1 grados de libertad para a y b
respectivamente
6.- Caso de muestras pareadas (de variables dependientes). En este caso, se asume
que las muestras han sido distribuidas por pares.
n
1 n
) D D (
n
D
t
2
c

TEST DE HIPTESIS ESTADSTICA


En la seccin anterior tratamos la estimacin y precisin de los estimadores, que
conforman una de las dos reas principales de la Inferencia estadstica. En esta
seccin presentaremos una forma diferente de obtener inferencia acerca de
parmetros poblacionales, probando hiptesis respecto a sus valores. Un test de
hiptesis es una metodologa o procedimiento que permite cuantificar la probabilidad
del error que se cometera cuando se hace una afirmacin sobre la poblacin bajo
estudio, es decir, nos permite medir la fuerza de la evidencia que tienen los datos a
favor o en contra de alguna hiptesis de inters sobre la poblacin.
Ejemplo. Una industria usa como uno de los componentes de las mquinas de
produccin una lmpara especial importada que debe satisfacer algunas exigencias.
Una de esas exigencias est relacionada a su vida til en horas. Esas lmparas son
fabricadas por dos pases y las especificaciones tcnicas varan de pas a pas. Por
ejemplo el catlogo del producto americano afirma que la vida til media de sus
lmparas es de 15500 horas, con un SD de 1200. Mientras que para el producto
europeo la media es de 16500, y el SD es de 2000.
Un lote de esas lmparas de origen desconocido es ofrecido a un precio muy
conveniente. Para que la industria sepa si hace o no una oferta ella necesita saber cual
es el pas que produjo tales lmparas. El comercio que ofrece tales lmparas afirma
que ser divulgada la vida til media de una muestra de 25 lmparas del lote antes de
la oferta. Que regla de decisin deben usar los responsables de la industria para decir
13
que las lmparas son de procedencia americana o europea?. Una respuesta que surge
inmediatamente es la de considerar como pas productor aquel en la cual la media de
la muestra se aproxima ms a la media de la poblacin. As, la decisin sera si
16000 x (el punto medio entre 15500 y 16500) diremos que es de procedencia
americana; en caso contrario diremos que es de procedencia europea.
Suponga que en el da de la licitacin se inform que, de acuerdo con la regla de
decisin diramos que las lmparas son de origen americano. Podemos estar
herrados en esa conclusin?. O en otras palabras, es posible que una muestra de 25
lmparas de origen europeo presente una media de 15800? Si, es posible. Entonces,
para un mejor entendimiento de la regla de decisin adoptada, es interesante estudiar
los tipos de errores que podemos cometer y las respectivas probabilidades de cometer
esos errores.
Los tests de hiptesis consisten en confrontar dos hiptesis, una llamada hiptesis
nula que denotamos con H
o
y otra llamada hiptesis alternativa denotada con H
1
.
En el ejemplo las hiptesis que se plantean son:
En el ejemplo las hiptesis consideradas son
H
o
Las lmparas son de origen europeo, esto equivale a decir que la vida til X de
cada lmpara sigue una distribucin con media =16500 horas y un SD=2000 horas.
H
1
; Las lmparas son de origen americano, es decir la media poblacional = 15500
horas con un SD=1200 horas.
Bajo este planteo un test de hiptesis estadstica no es otra cosa que un
procedimiento para tomar una decisin, bajo incertidumbre, sobre la validez de
la hiptesis nula usando la evidencia de los datos. Puesto que trabajamos bajo
incertidumbre es claro que cualquiera sea la decisin que tomemos siempre existe una
probabilidad de cometer error. A fin de clarificar esto podemos presentar el siguiente
esquema:
Esquema del procedimiento
Decisin Realidad sobre H
o
Cierta Falsa
Rechazar H
o
Error Tipo I Decisin correcta
No rechazar H
o
Decisin correcta Error Tipo II
Como se puede ver en el esquema, con cada tipo de decisin que se tome hay
asociado una posibilidad de cometer un error. Un procedimiento de este tipo sera
ptimo cuando las probabilidades de cometer un error, cualquiera sea la decisin que
se adopte, sean pequeas. Lamentablemente, en la mayora de los tests de hiptesis
slo es posible controlar una de ellas, con la circunstancia agravante de que estos
14
errores son competitivos, es decir, cuando se disminuye mucho la probabilidad de
uno aumenta la probabilidad del otro.
Puesto que, el inters generalmente es rechazar H
o
la probabilidad de error que se
controla durante este procedimiento, es justamente el error asociado a esta decisin
(Probabilidad del Error Tipo I), es decir, la probabilidad de rechazar H
o
cuando es
cierta. La mxima probabilidad de error tipo I se denota con y recibe el nombre de
nivel de significacin del test y l debe ser prefijado de antemano. La probabilidad
de Error Tipo II se denota con y es til para encontrar la bondad del test que se
mide en trminos de la cantidad 1- denominada Poder del Test.
El nivel de significacin que se usa generalmente es =0.05 lo que corresponde a un
5% en trmino de porcentaje.
Retomando el ejemplo vamos a indicar por RC una regin determinada por los
valores de X menores que 16000, es decir RC={X 16000}. El valor 16000 se
denomina punto crtico y se denotar como x
c
.
Con las notaciones indicadas arriba, la probabilidad de cometer cada uno de los
errores puede ser escrito del siguiente modo:
- P[Error Tipo I] = P[ X pertenezca a RC | H
0
es verdadera] = .
- P[Error Tipo II] = P[ X no pertenezca a RC | H
0
es falsa ] =
Ejemplo. En el ejemplo anterior, cuando H
0
es verdadera, es decir, las lmparas son
de origen europea, sabemos del teorema central del lmite que x , o sea la media de
las muestras de tamao 25, tendrn distribucin aproximadamente normal con media
16500 y =
400
25
2000

, es decir X N(16500, 1600). Entonces,


P[Error Tipo I] = P[ X RC | H
0
es verdadera] =
= P[ X 16000 | X N(16500, 1600)] = P[ Z (16000 16500)/
400]
= P[ Z -1.25] = 0.106 = 10.6%.
Para cada regla de decisin adoptada, es decir, para cada valor crtico x
c
se obtiene un
valor de probabilidad de error tipo 1. Por otra parte, si x
c
se elige menor que 15000
disminuye pero aumenta.
15
Sin embargo, se puede proceder de manera inversa, es decir, fijado encontramos la
regla de decisin que corresponder a una probabilidad de error 1 igual a .
Ejemplo. Si se toma = 5%, y se procede a encontrar la regla de decisin
correspondiente:
5%= P[Error Tipo I]= P[ X x
c
| X N(16500, 1600)] = P[Z < -1.645],
pero se sabe que, para una distribucin normal estndar
400
16500 x
645 . 1
c


de donde x
c
= 15842 horas. Entonces, la regla de decisin ser
Si X fuera inferior a 15842 se dice que el lote es americano, en caso contrario se
dice que es europeo.
Con esta regla la probabilidad de error tipo II ser
P[Error Tipo II] = P[ X > 15842 | X N(16500, 1600)] = P[Z > 1.425] = 7.93%
Procedimiento general de un test de hiptesis basado en la regin de rechazo. Se
da ahora una secuencia de pasos que puede ser usada sistemticamente para cualquier
test de hiptesis.
- Iniciar el procedimiento estableciendo, de manera clara y explcita, cul es la
hiptesis nula, es decir, H
0
.
- Usar la teora estadstica para construir un indicador de concordancia entre los
datos y la hiptesis nula. Este indicador denominado estadstico del test ser
usado para juzgar la hiptesis H
0
.
- Fijar el nivel de significacin deseado , que es el mximo error aceptable cuando
se rechaza H
0
, y usar este valor para construir la regin crtica.
- Calcular el valor del estadstico a partir de la muestra.
- Si el valor del estadstico pertenece a la regin crtica, entonces rechazar H
0
. En
caso contrario, lo que se puede afirmar es que no hay suficiente evidencia para
rechazar H
0
.
- Si se dispone de una hiptesis alternativa y de la distribucin del estadstico del
test bajo la suposicin que vale la hiptesis alternativa, se puede calcular la
probabilidad de error Tipo II.
Procedimiento general de un test de hiptesis basado en el P-value. Otro
procedimiento general de un test de hiptesis ms usado en la actualidad debido a la
disponibilidad de paquetes de programas estadsticos, consiste en tomar la decisin a
partir de la probabilidad del error Tipo I que brindan las salidas de tales paquetes de
programas, denominado P-value o simplemente P. Este procedimiento lo podemos
resumir en los siguientes pasos:
- Suponer que H
o
es cierta.
16
- Para confrontar esta suposicin con la informacin (parcial) que proveen los datos
sobre la realidad de H
o
, se forma una especie de indicador de concordancia,
denominado estadstico del test, el cual es funcin del de los datos.
- Como el estadstico depende de la informacin de los datos, con cada muestra
posible hay asociado un valor de este estadstico y en consecuencia se genera una
nueva variable aleatoria. Asociada a esta variable hay una cierta distribucin de
probabilidad, a partir de la cual se determina la probabilidad de que la informacin
de los datos concuerde con la hiptesis nula, denominado P-Value. De esta
manera, el P-Value representara la probabilidad de cometer un error cuando se
toma la decisin de rechazar H
o
.
- Es claro que si de antemano se fija que la mxima probabilidad de error al
rechazar H
o
debe ser igual a , otra manera de tomar la decisin es comparar el
valor del P- value con . As
- Si P entonces la decisin es Rechazamos H
o
- Si P > la decisin es No hay evidencia suficiente para rechazar H
o
PRUEBAS DE HIPTESIS UNILATERALES Y BILATERALES
Las pruebas o test de hiptesis se relacionan con los parmetros poblacionales
(medias o proporciones, etc.). Se puede utilizar los estimadores puntuales de los
parmetros poblacionales como estadstico del test en cuestin. Supongamos, como
ilustracin que se utiliza el smbolo para denotar el parmetro poblacional de
inters, por ejemplo, puede ser , (
1
-
2
), p (p
1
-p
2
), y el smbolo

para denotar
el estimador puntual insesgado correspondiente.
Desde el punto de vista prctico se puede tener inters en contrastar la hiptesis nula
H
0
: =
0
, contra la alternativa de que el parmetro poblacional es mayor que
0
, o
sea H
1
: >
0.
En esta situacin, se rechazar H
0
cuando

sea grande, o sea cuando


el estadstico del test sea mayor que un cierto valor llamado valor crtico, que separa
las regiones de rechazo y no rechazo del test.
La probabilidad de rechazar la hiptesis nula cuando es cierta ser igual al rea bajo
la curva de la distribucin muestral del estadstico del test sobre la regin de rechazo.
En el caso que estemos trabajando con una distribucin normal, y un = 0,05, se
rechaza la hiptesis nula cuando

se encuentre a ms de 1,645

a la derecha de

0
. De esta manera, se puede definir como
Una prueba estadstica de una cola o unilateral es aquella en la que la regin de
rechazo se localiza solamente en una cola o extremo de la distribucin muestral del
estadstico del test.
17
Para detectar >
0
, se sita la regin de rechazo en la extremidad de valores
superiores a

. Para detectar <


0
se ubica la regin de rechazo en la extremidad
izquierda de la distribucin de

, o sea para valores inferiores a

. Si hay que
detectar diferencias mayores o menores de
0
, la hiptesis alternativa ser
H
1
: 0

es decir
>
0
o bien <
0
En este caso la probabilidad de error Tipo I se repartir entre las dos colas de la
distribucin muestral del estadstico, y se rechazar H
0
para valores de

mayores
que un valor crtico (
0
+ C) o menor que (
0
- C). Esta prueba se llama prueba
estadstica bilateral o de dos colas.
CONTRASTES DE HIPTESIS
Pueden presentarse en la prctica, situaciones en las que exista una teora
preconcebida relativa a la caracterstica de la poblacin sometida a estudio. Tal sera
el caso, por ejemplo si pensamos que un tratamiento nuevo puede tener un porcentaje
de mejora mayor que otro estndar, o cuando nos planteamos si los nios de las
distintas comunidades espaolas tienen la misma altura. Este tipo de circunstancias
son las que nos llevan al estudio de la parcela de la Estadstica Inferencial que se
recoge bajo el ttulo genrico de Contraste de Hiptesis. Implica, en cualquier
investigacin, la existencia de dos teoras o hiptesis implcitas, que denominaremos
hiptesis nula e hiptesis alternativa, que de alguna manera reflejarn esa idea a priori
que tenemos y que pretendemos contrastar con la realidad.
De la misma manera aparecen, implcitamente, diferentes tipos de errores que
podemos cometer durante el procedimiento. No podemos olvidar que, habitualmente,
el estudio y las conclusiones que obtengamos para una poblacin cualquiera, se
habrn apoyado exclusivamente en el anlisis de slo una parte de sta. De la
probabilidad con la que estemos dispuestos a asumir estos errores, depender, por
ejemplo, el tamao de la muestra requerida. Desarrollamos en este captulo los
contrastes de hiptesis para los parmetros ms usuales que venimos estudiando en
los captulos anteriores: medias, varianzas y proporciones, para una o dos
poblaciones. Los contrastes desarrollados en este captulo se apoyan en que los datos
de partida siguen una distribucin normal.
Los contrastes de significacin se realizan:
- suponiendo a priori que la ley de distribucin de la poblacin es conocida.
- Se extrae una muestra aleatoria de dicha poblacin.
18
- Si la distribucin de la muestra es diferente de la distribucin de probabilidad que
hemos asignado a priori a la poblacin, concluimos que probablemente sea errnea
la suposicin inicial.
Ejemplo, Supongamos que debemos realizar un estudio sobre la altura media de los
habitantes de cierto pueblo. Antes de tomar una muestra, lo lgico es hacer la
siguiente suposicin a priori, (hiptesis que se desea contrastar y que
denotamos H
0
):
H
0
: la altura media no difiere del resto del pas
Al obtener una muestra de tamao n=8, podramos encontrarnos ante uno de los
siguientes casos:
1. Muestra = {1,50 ;1,52; 1,48; 1,55; 1,60; 1,49; 1,55; 1,63}
2. Muestra = {1,65; 1,80; 1,73; 1,52; 1,75; 1,65; 1,75; 1,78}
19
Sistema recreado para rechara la hiptesis nula o inicial H
0
Nombre H
0
Prueba H
1
: H
1
:> H
1
:<
Media con
varianza
desconocida
Media para
varianza
desconocida
Dos medias
Normales con
varianzas
conocidas
Dos medias
Normales con
varianzas
desconocidas *
Observaciones
pareadas
Varianza Normal
con media
desconocida
Dos distribuciones
con varianza
Normal
Probabilidad de p
xitos
*
Intuitivamente, en el caso a sera lgico suponer que salvo que la muestra obtenida
sobre los habitantes del pueblo sea muy poco representativa, la hiptesis H
0
debe ser
rechazada. En el caso b tal vez no podamos afirmar con rotundidad que la hiptesis
H
0
sea cierta, sin embargo no podramos descartarla y la admitimos por una cuestin
de simplicidad.
Este ejemplo sirve como introduccin de los siguientes conceptos: En un contraste de
hiptesis (tambin denominado test de hiptesis o Contraste de significacin) se
decide si cierta hiptesis H
0
que denominamos hiptesis nula puede ser rechazada o
no a la vista de los datos suministrados por una muestra de la poblacin. Para realizar
el contraste es necesario establecer previamente una hiptesis alternativa (H
1
) que
20
ser admitida cuando H
0
sea rechazada. Normalmente H
1
es la negacin de H
0
,
aunque esto no es necesariamente as.
El procedimiento general consiste en definir un estadstico T relacionado con la
hiptesis que deseamos contrastar. A ste lo denominamos estadstico del contraste.
A continuacin suponiendo que H
0
es verdadera se calcula un intervalo de
denominado intervalo de aceptacin de la hiptesis nula, (T
i
,T
s
) de manera que al
calcular sobre la muestra T=T
exp
el criterio a seguir sea:
Si T
exp

(T
i,
T
s
), entonces aceptamos H
o
o rechazamos H
1
, y si T
exp

(T
i,
T
s
), entonces
rechazamos H
o
o aceptamos H
1
El intervalo de aceptacin o ms precisamente, de no rechazo de la hiptesis nula, se
establece fijando una cantidad suficientemente pequea denominada nivel de
significacin, de modo que la probabilidad de que el estadstico del contraste tome un
valor fuera del mismo - regin crtica- cuando la hiptesis nula es cierta sea inferior
o al 100-%; Esto se ha de entender como sigue:
Si H
0
es correcta el criterio de rechazo slo se equivoca con probabilidad , que es la
probabilidad de que una muestra d un valor del estadstico del contraste extrao
(fuera del intervalo de aceptacin). La decisin de rechazar o no la hiptesis nula est
al fin y al cabo basado en la eleccin de una muestra tomada al azar, y por tanto es
posible cometer decisiones errneas. Los errores que se pueden cometer se clasifican
como sigue:
Error de tipo I: Es el error que consiste en rechazar H
0
cuando es cierta. La
probabilidad de cometer este error es lo que anteriormente hemos denominado nivel
de significacin. Es una costumbre establecida el denotarlo siempre con la letra
: =P(Rechazar H
0
/H
0
es cierta)=P(Aceptar H
1
/H
0
es cierta)
Error de tipo II: Es el error que consiste en no rechazar H
0
cuando es falsa. La
probabilidad de cometer este error la denotamos con la letra : =P(Rechazar H
1
/H
1
es cierta)=P(Aceptar H
0
/H
1
es cierta)
1. Los errores de tipo I y II no estn relacionados ms que del siguiente modo:
Cuando decrece crece. Por tanto no es posible encontrar tests que hagan tan
pequeos como queramos ambos errores simultneamente. De este modo es
siempre necesario privilegiar a una de las hiptesis, de manera que no ser
rechazada, a menos que su falsedad se haga muy evidente. En los contrastes, la
hiptesis privilegiada es H
0
que slo ser rechazada cuando la evidencia de su
falsedad supere el umbral del 100*(1-)%.
21
2. Al tomar muy pequeo tendremos que se puede aproximar a uno. Lo ideal a la
hora de definir un test es encontrar un compromiso satisfactorio entre y
(aunque siempre a favor de H
0
). Denominamos potencia de un contraste a la
cantidad 1-, es decir
Potencia=1-=P(Rechazar H
0
/H
0
es falsa)
Aceptar Ho Rechazar Ho
Ho es Cierta Correcto
Probabilidad 1-

Error tipo I
Probabilidad
Ho es Falsa Error Tipo II
Probabilidad
Correcto
Probabilidad 1-

En el momento de elegir una hiptesis privilegiada podemos en principio dudar entre


si elegir una dada o bien su contraria. Criterios a tener en cuenta en estos casos son
los siguientes:
Simplicidad cientfica: A la hora de elegir entre dos hiptesis cientficamente
razonables, tomaremos como H
0
aquella que sea ms simple.
Las consecuencias de equivocarnos: Por ejemplo al juzgar el efecto que puede
causar cierto tratamiento mdico que est en fase de experimentacin, en principio se
ha de tomar como hiptesis nula aquella cuyas consecuencias por no rechazarla
siendo falsa son menos graves, y como hiptesis alternativa aquella en la que el
aceptarla siendo falsa trae peores consecuencias.
Volviendo al ejemplo de la estatura de los habitantes de un pueblo, un estadstico de
contraste adecuado es X. Si la hiptesis H
0
fuese cierta se tendra que X~N(,
2
/n)
(suponiendo claro est que la distribucin de las alturas de los espaoles siga una
distribucin normal de parmetros conocidos, por ejemplo N(1.74,100)
Denotemos mediante
0
el verdadero valor de la media en el pueblo que estudiamos.
Como la varianza de X es pequea para grandes valores de n, lo lgico es pensar
que si el valor obtenido con la muestra x X est muy alejado de =1.74 (regin
crtica), entonces
- o bien la muestra es muy extraa si H
0
es cierta (probabilidad );
- o bien la hiptesis H
0
no es cierta.
Concretamente en el caso a, donde la muestra es
(1.50,1.52,1.48,1.55,1.60,1.49,1.55,1.63)
el contraste de hiptesis conveniente es:
22
H
0
:=
0
H
1
:>
0
En este caso H
1
no es estrictamente la negacin de H
0
. Esto dar lugar a un contraste
unilateral, que son aquellos en los que la regin crtica est formada por un slo
intervalo: Intervalo re rechazo de H0: (T
i
,). Regin crtica: (,T
i
)
Contrastes paramtricos en una poblacin normal. Supongamos que la
caracterstica X que estudiamos sobre la poblacin sigue una distribucin normal y
tomamos una muestra de tamao n: X
1
,..,X
n
mediante muestreo aleatorio simple.
Vamos a ver cuales son las tcnicas para contrastar hiptesis sobre los parmetros que
rigen X. Vamos a comenzar haciendo diferentes tipos de contrastes para medias y
despus sobre las varianzas y desviaciones tpicas.
CONTRASTES PARA LA MEDIA
Test de dos colas con varianza conocida. Suponemos que X~N(,) donde es
conocido y queremos contrastar si es posible que (desconocida) sea en
realidad cierto valor
0
fijado. Esto es un supuesto terico que nunca se dar
en la realidad pero servir para introducir la teora sobre contrastes. El test se
escribe entonces como:
H
0
:=
0
H
1
:
0
Como hemos mencionado anteriormente, la tcnica para hacer el contraste consiste en
suponer que H
0
es cierta, y averiguar con esta hiptesis quien es la distribucin del
estadstico del contraste que este caso es lgico que deba estar muy relacionado con
X. Si al obtener una muestra concreta se tiene que x X es un valor muy alejado
de
0
, se debe rechazar H
0
. Veamos esto con ms detalle:
H
0
cierta X~N(
0
,) entonces,
) 1 , 0 ( N
n
X
Z
0
exp

Para poder acceder a las probabilidades de la normal, hemos tipificado (ya que los
valores para hacer la tipificacin son conocidos). Si H
0
es cierta, entonces esperamos
que el valor z
exp
obtenido sobre la muestra est cercano a cero con una gran
probabilidad. Esto se expresa fijando un nivel de significacin , y tomando como
regin crtica C, a los valores que son muy extremados y con probabilidad en total,
o sea,


1 ) z Z z ( P 2 / ) z Z ( P y 2 / ) z Z ( P
2 / 1 2 / 1 2 / 1 exo 2 / exo
Entonces la regin crtica consiste en
{ }
2 / 1 exp exp
z z : z C


Luego rechazaremos la hiptesis nula si 2 / 1 exp
z z

>
, aceptando en consecuencia la
hiptesis alternativa.
23
La regin de rechazo de la hiptesis nula es la sombreada. Se rechaza H
0
cuando el
estadstico z
exp
toma un valor comprendido en la zona sombreada de la grfica
pequea, N(0,1), o equivalentemente, cuando el estadstico X toma un valor en la
zona sombreada de la grfica grande, N(
0
,).
Tests de una cola con varianza conocida. Consideremos un contraste de hiptesis
donde ahora la hiptesis alternativa es compuesta:
H
0
:=
0
H
1
:<
0
Bajo la hiptesis nula la distribucin de la media muestral es
H
0
cierta X~N(
0
,) entonces,
) 1 , 0 ( N
n
X
Z
0
exp

y como regin crtica consideraremos aquella formada por los valores


extremadamente bajos de Z
exp
, con probabilidad , es decir
P(Z
exp
z
a
)=, entonces, P(z
a
z
exp
)=1-
Entonces la regin de aceptacin, o de modo ms correcto, de no rechazo de la
hiptesis nula es: z
exp
>z
a
Se rechaza la hiptesis nula, cuando uno de los estadstico Z
o X toma un valor en la zona sombreada (similar a la grfica anteriormente
mostrada).
Es evidente que si en el contraste de significacin, hubisemos tomado como
hiptesis alternativa su contraria, es decir
H
0
:=
0
H
1
:>
0
por simetra con respecto al caso anterior, la regin donde no se rechaza la hiptesis
nula es: z

>z
1
Test de dos colas con varianza desconocida. Sea X~N(,) donde ni ni son
conocidos y queremos realizar el contraste
24
H
0
:=
0
H
1
:
0
Al no conocer va a ser necesario estimarlo a partir de su estimador insesgado: la
cuasivarianza muestral,
2
s , Por ello la distribucin del estimador del contraste ser
una t-Student, que ha perdido un grado de libertad, segn el teorema de Cochran, y la
definicin de la distribucin de t-Student:
H
0
cierta 1 n
0
exp
t
n s
X
T

Consideramos como regin crtica C, a las observaciones de T


exp
extremas
P(T
exp
t
/2,n-1
)=/2, y P(T
exp
t
1-/2,n-1
)=/2 entonces, P(-t
1/2,n-1
zT
exp
t
1-/2,n-1
)=1-
Entonces la regin crtica consiste en
{ }
exp 1 n , 2 / 1 1 n , 2 / 1 exp
T T t T C < <

Para dar una forma homognea a todos los contrastes de hiptesis es costumbre
denominar al valor del estadstico del contraste calculado sobre la muestra como
valor experimental y a los extremos de la regin crtica, como valores tericos.
Definiendo entonces
1 n , 2 / 1 teo
0
exp
t T
n s
X
T

el resultado del contraste es el siguiente: Si teo exp


T T
no rechazamos H
0
, de
contrario si.
Tests de una cola con varianza desconocida. Si realizamos el contraste
H
0
:=
0
H
1
:<
0
por analoga con el contraste bilateral, definiremos
1 n , 1 teo
0
exp
t T
n s
X
T

y el criterio para contrastar al nivel de significacin a es:


Si teo exp
T T
no rechazamos H
0
, de contrario si.
Para el contraste contrario,
H
0
:=
0
H
1
:>
0
definimos T
exp
y T
teo
como anteriormente y el criterio a aplicar es:
Si teo exp
T T
no rechazamos H
0
, de contrario si.
Ejemplo. Conocemos que las alturas X de los individuos de una ciudad, se
distribuyen de modo gaussiano. Deseamos contrastar con un nivel de
25
significacin de =5% si la altura media es diferente de 174 cm. Para ello nos
basamos en un estudio en el que con una muestra de n=25 personas se obtuvo:
media 170 y desviacin 10
Solucin: El contraste que se plantea es:
H
0
:=174 H
1
:174
La tcnica a utilizar consiste en suponer que H
0
es cierta y ver si el valor que toma el
estadstico
24 exp
t
n s
174 X
T

es razonable o no bajo esta hiptesis, para el nivel de significacin dado.


Aceptaremos la hiptesis alternativa (y en consecuencia se rechazar la hiptesis
nula) si no lo es, es decir, si
06 . 2 t t T
24 , 975 . 0 24 , 2 / 1 exp


Para ello procedemos al clculo de T
exp
con s=10, y n=25
06 . 2 959 . 1
25 206 . 10
174 170
T
entonces 206 . 10
24
25
10
1 n
n
s s
exp

Luego, aunque podamos pensar que ciertamente el verdadero valor de no es 174, no


hay una evidencia suficiente para rechazar esta hiptesis al nivel de confianza del
95%. Es decir, no se rechaza H
0
.
El valor de T
exp
no est en la regin crtica (aunque ha quedado muy cerca), por tanto
al no ser la evidencia en contra de H
0
suficientemente significativa, sta hiptesis no
se rechaza.
26
CONTRASTES PARA LA VARIANZA
Consideremos que el carcter que estudiamos sobre la poblacin sea una variable
aleatoria normal cuya media y varianza son desconocidas. Vamos a contrastar
la hiptesis
H
0
:
2
=
0
2
,
donde
0
2
es un valor prefijado frente a otras hiptesis alternativas que podrn dar
lugar a contrastes bilaterales o unilaterales. La tcnica consiste en utilizar el teorema
de Cochran, para observar que el siguiente estadstico experimental que utiliza el
estimador insesgado de la varianza, posee una distribucin
2
, con n-1 grados de
libertad:
H
0
: cierta
2
1 n
2
0
2
2
exp
s
) 1 n (


Entonces construimos las regiones crticas que correspondan a las hiptesis
alternativas que se formulen en cada caso atendiendo a la ley de distribucin
2
.
Contraste bilateral. Cuando el contraste a realizar es
2
0
2
1
2
0
2
0
: H : H
entonces, definimos
2
1 n , 2 / 1 teo
2
1 n , 2 / teo
2
0
2
2
exp
b a
s
) 1 n (


y el criterio que suministra el contraste es el expresado en la figura:
27
Si teo
2
exp teo
b a
aceptamos a H
0
, de contrario lo rechazamos
Contrastes unilaterales. Para un contraste de significacin al nivel del tipo
2
0
2
1
2
0
2
0
: H : H <

Entonces,
2
1 n , teo
a


Si
2
exp teo
a
aceptamos a H
0
, de contrario lo rechazamos
Para el contraste contrario tenemos la formulacin anloga:
2
0
2
1
2
0
2
0
: H : H >

Entonces,
2
1 n , 1 teo
b


Si
2
exp teo
a >
aceptamos a H
0
, de contrario lo rechazamos
CONTRASTES DE UNA PROPORCIN
Supongamos que poseemos una sucesin de observaciones independientes, de modo
que cada una de ellas se comporta como una distribucin de Bernoulli de
parmetro p: X
1
,X
n
~Binomial de parmetro p.
La variable aleatoria X=X
1
+X
2
++X
n
~B(n,p). La proporcin muestral (estimador
del verdadero parmetro p a partir de la muestra) es
n / X p
Nos interesamos en el contraste de significacin de H
0
: p=p
0
, siendo p un valor
prefijado frente a otras hiptesis alternativas. Para ello nos basamos en un estadstico
(de contraste) que ya fue considerado anteriormente en la construccin de intervalos
de confianza para proporciones y que sigue una distribucin aproximadamente
normal para tamaos muestrales suficientemente grandes:
28

,
_


n
pq
, p N
n
X
P

Si la hiptesis H
0
es cierta se tiene
) 1 , 0 ( N Z
n q p
p P

n
q p
, p N
n
X
P

exp
0 0
0 0 0
0


,
_


Contraste bilateral. Para el contraste
0 1 0 0
p p : H p p : H

extraemos una muestra y observamos el valor X=x, entonces
n / x p
. Entonces se
define
2 / 1 teo
0 0
0
exp
z Z
n q p
p p
Z

siendo el criterio de aceptacin o rechazo de la hiptesis nula


Si teo exp
Z z
aceptamos a H
0
, de contrario lo rechazamos
Contrastes unilaterales. Consideremos un contraste del tipo
0 1 0 0
p p : H p p : H <

Definiendo a

z Z
n q p
p p
Z
teo
0 0
0
exp
siendo el criterio de aceptacin o rechazo de la hiptesis nula
Si teo exp
Z z
rechazamos a H
0
, de contrario lo aceptamos
Para el test unilateral contrario, se tiene la expresin simtrica:
0 1 0 0
p p : H p p : H >

Definiendo a

1 teo
0 0
0
exp
z Z
n q p
p p
Z
siendo el criterio de aceptacin o rechazo de la hiptesis nula
Si teo exp
Z z
aceptamos a H
0
, de contrario lo rechazamos
CONTRASTES PARA LA DIFERENCIA DE MEDIAS APAREADAS
29
Las muestras apareadas aparecen como distintas observaciones realizadas sobre los
mismos individuos. Un ejemplo de observaciones apareadas: Medir a un
conjunto de n personas el nivel de insulina en la sangre antes (X) y despus (Y)
del tratamiento
Paciente x
i
y
i
Diferencia
d
i
1 150 120 30

n 140 90 50

No es posible considerar a X y Y como variables independientes ya que va a existir
una dependencia clara entre las dos variables. Si queremos contrastar el que los
pacientes han experimentado o no una mejora con el tratamiento, llamemos d
i
a la
diferencia entre las observaciones antes y despus del tratamiento d
i
=x
i
-y
i.
Supongamos que la variable aleatoria que define la diferencia entre el antes y despus
del tratamiento es una variable aleatoria d que se distribuye normalmente, pero cuyas
media y varianza son desconocidas
d~N(
d
,
d
)
Si queremos contrastar la hiptesis de que el tratamiento ha producido cierto efecto
H
0
:
d
=
en el caso en que H
0
fuese cierta tendramos que el estadstico de contraste que nos
conviene es
1 n
d
exp
t
n s
d
T

donde d es la media muestral de las diferencias d


i
y d
s
es la cuasivarianza muestral
de las mismas. El tipo de contraste sera entonces del mismo tipo que el realizado
para la media con varianza desconocida.
Contraste bilateral. Consideramos el contraste de tipo
H
0
:
d
= 1:
d

Entonces se define
1 n
d
exp
t
n s
d
T

y se rechaza la hiptesis nula cuando 1 n , 2 / 1 exp


t T

<
1 n , 2 / 1 exp
t T

>

Contrastes unilaterales. Si el contraste es
H
0
:
d
= 1:
d
<
30
se rechaza la hiptesis nula cuando 1 n , 1 exp
t T

<
. Para el test contrario
H
0
:
d
= 1:
d
>
se rechaza la hiptesis nula cuando 1 n , 1 exp
t T

>
No supone ninguna dificultad el haber realizado el contraste con
d
2
conocida, ya que
entonces el estadstico del contraste es
) 1 , 0 ( N
n s
d
Z
d

y el tratamiento sera anlogo.


CONTRASTES DE DOS DISTRIBUCIONES NORMALES
INDEPENDIENTES
Consideramos a lo largo de toda esta seccin a dos poblaciones normales que
representamos mediante X
1
~N(
1
,
1
) y X
2
~N(
2
,
2
)
De las que de modo independiente se extraen muestras de tamao respectivo n
1
y n
2
.
Los tests que vamos a realizar estn relacionados con las diferencias existentes entre
ambas medias o los cocientes de sus varianzas.
CONTRASTE DE MEDIAS CON VARIANZAS CONOCIDAS
De manera similar al caso del contraste para una media, queremos en esta ocasin
contrastar la hiptesis de que las dos poblaciones (cuyas varianzas suponemos
conocidas) slo difieren en una cantidad
H
0
:
1
-
2
=
frente a hiptesis alternativas que darn lugar a contrastes unilaterales o bilaterales
como veremos ms tarde. Para ello nos basamos en la distribucin del siguiente
estadstico de contraste:
( ) ( )
( )
( )
) 1 , 0 ( N
n n
X X
Z
, entonces n s , n s , N X X
n , N X y n , N X cierta es H
2
2
2
1
2
1
2 1
2 2 1 1 2 1
2 2 2 2 1 1 1 1 0



Contraste bilateral. Consideremos en primer lugar el contraste de dos colas
H
0
:
1
-
2
= H
0
:
1
-
2

Se define entonces
31
( )
2 / 1 teo
2
2
2
1
2
1
2 1
exp
z Z
n n
X X
Z

y el test consiste en

teo exp
Z Z
aceptamos H
0
y rechazamos H
1
Contrastes unilaterales. Para el test
H
0
:
1
-
2
= H
0
:
1
-
2
<
y el test consiste en

teo exp 1 teo
Z Z si , entonces z z Z
aceptamos H
0
y rechazamos H
1
y para el contraste de significacin contrario
H
0
:
1
-
2
= H
0
:
1
-
2
>
y el test consiste en

teo exp 1 teo
Z Z si , entonces z Z
aceptamos H
0
y rechazamos H
1
CONTRASTE DE MEDIAS HOMOCEDTICAS
Ahora consideramos el problema de contrastar
H
0
:
1
-
2
=
cuando slo conocemos que las varianzas de ambas poblaciones son iguales, pero
desconocidas. El estadstico que usaremos para el contraste fue ya introducido en la
relacin, pues si suponemos que H
0
es cierta se tiene
( ) ( )
2 n n
2 1
2 1 2 1
exp
2 1
t
n
1
n
1
s
X X
T
+

donde
2
s
es la cuasivarianza muestral ponderada de
2
1
s
y de
2
2
s
donde
( ) ( )
2 n n
s 1 n s 1 n
s
2 1
2
2 2
2
1 1 2
+
+

32
Obsrvese que se han perdido dos grados de libertad a causa de la estimacin de
2
2
2
1
mediante
2
1
s
y de
2
2
s
.
Contraste bilateral. Para el contraste de significacin
H
0
:
1
-
2
= H
1
:
1
-
2

se tiene como en casos anteriores que el contraste adecuado consiste en definir


( ) ( )
2 n n , 2 / 1 teo
2 1
2 1 2 1
exp
2 1
t T
n
1
n
1
s
X X
T
+

y rechazar o admitir la hiptesis nula siguiendo el criterio



teo exp
T T
aceptar H
0
Contrastes unilaterales. Cuando el contraste es unilateral del modo
H
0
:
1
-
2
= H
1
:
1
-
2
<
y rechazar o admitir la hiptesis nula siguiendo el criterio

+ teo exp 2 n n , 2 / 1 teo
T T t T
2 1
aceptar H
0
y cuando el contraste de significacin es el contrario
H
0
:
1
-
2
= H
1
:
1
-
2
>
y rechazar o admitir la hiptesis nula siguiendo el criterio

+ teo exp 2 n n , 1 teo
T T t T
2 1
aceptar H
0
CONTRASTE DE MEDIAS NO HOMOCEDTICAS
Consideramos el contraste
H
0
:
1
-
2
=
en el caso ms problemtico, es decir cuando slo conocemos de las dos poblaciones
que su distribucin es normal, y que sus varianzas no son conocidas y
significativamente diferentes. En este caso el estadstico de contraste tendr una ley
de distribucin muy particular. Consistir en una distribucin t-Student, con un
nmero de grados de libertad que en lugar de depender de modo determinista de la
muestra (a travs de su tamao), depende de un modo aleatorio mediante las
varianzas mustrales. Concretamente, el estadstico que nos interesa es
33
( )

+

t
n
s
n
s
X X
T
2
2
2
1
2
1
2 1
donde es el nmero de grados de libertad que se calcula mediante la frmula de
Welch:
2
n
s
1 n
1
n
s
1 n
1
n
s
n
s
2
2
2
2
2
2
1
2
1
1
2
2
2
1
2
1

,
_

+
+

,
_

,
_

+

No desarrollamos en detalle los clculos a realizar, pues la tcnica para efectuar los
contrastes son anlogos a los vistos anteriormente cuando las varianzas son
desconocidas e iguales. Si lo que pretendemos contrastar es si las medias
poblacionales de dos muestras independientes obtenidas de poblaciones
normales son idnticas, esto se reduce a los casos anteriores tomando =0
CONTRASTES DE LA RAZN DE VARIANZAS
Consideramos dos muestras independientes de dos poblaciones que se distribuyen
normalmente (cuyas medias y varianzas son desconocidas). Vamos a abordar
cuestiones relacionadas con saber si las varianzas de ambas poblaciones son las
mismas, o si la razn (cociente) entre ambas es una cantidad conocida, R. La
igualdad entre las dos varianzas puede escribirse
1
2
-
2
2
=0 o bien, la existencia
de una diferencia entre ambas (), del modo
1
2
-
2
2
=. Este modo de escribir la
diferencia entre varianzas (que era el adecuado para las medias) no es sin
embargo fcil de utilizar para las varianzas, de modo que nos ser ms fcil
sacarle partido a las expresiones de las relaciones entre varianzas como
R
2
2
2
1

Por ejemplo, si R=1 tenemos que ambas varianzas son iguales. Consideramos
entonces la hiptesis nula
R : H
2
2
2
1
0

la cual vamos a contrastar teniendo en cuenta que:


34
2
1 n
2
2
2
2 2 2
1 n
2
1
2
1 1
2 1
s ) 1 n ( s ) 1 n (

que conlleva
1 n , 1 n 2
2
2
1
2
1
2
2
2
2
2
2
2
1
2
1
2
2
2
2 2
2
2
1
2
1 1
1
2 1
F
s
s
s
s
s ) 1 n (
1 n
1
s ) 1 n (
1 n
1

Por tanto el estadstico del contraste que nos conviene tiene una distribucin conocida
cuando H
0
es cierta. Vase la definicin de la distribucin de F-Snedecor:
1 n , 1 n
2
2
2
1
2 1
F
s
s
R
1
F


Contraste bilateral. El contraste bilateral para el cociente de varianzas se escribe
como:
R : H
2
2
2
1
0

R : H
2
2
2
1
0

Habida cuenta que la distribucin F-Snedecor no es simtrica sino que slo toma
valores positivos, se rechazar la hiptesis nula cuando el valor que tome el
estadstico del contraste al aplicarlo sobre una muestra sea muy cercano a cero, o
bien, muy grande. Es decir, se define el estadstico experimental y los lmites de la
regin crtica como:
1 n , 1 n , 2 / 1 teo 1 n , 1 n , 2 / teo
2
2
2
1
exp
2 1 2 1
F b F a
s
s
R
1
F


y el criterio de aceptacin o rechazo es:

teo exp teo
b F a si aceptamos a H
0
No se debe olvidar que para la funcin F-Snedecor,
1 n , 1 n , 2 / 1 1 n , 1 n , 2 /
2 1 2 1
F F



dada la no simetra de F. A la hora de usar una tabla de la distribucin podemos tal
vez encontrar que no est tabulada para los valores pequeos, pero si para 1-. Una
regla que es de bastante utilidad para estos casos es la siguiente (ojo, se invierten los
ordenes de los grados de libertad),
n , m , 1
m , n ,
F
1
F


Contrastes unilaterales. El primer contraste unilateral que consideramos es:
35
R : H
2
2
2
1
0

R : H
2
2
2
1
0
<

para el cual se tiene 1 n , 1 n , teo


2 1
F a

, si exp teo
F a
aceptamos a H
0
El tests unilateral opuesto es:
R : H
2
2
2
1
0

R : H
2
2
2
1
0
>

para el cual se tiene 1 n , 1 n , 1 teo


2 1
F b

, si teo exp
b F
aceptamos a H
0
Caso particular: Contraste de homocedasticidad. En la prctica un contraste de gran
inters es el de la homocedasticidad o igualdad de varianzas. Decimos que dos
poblaciones son homocedticas si tienen la misma varianza. El test de
homocedasticidad sera entonces el mismo que el de un cociente de varianzas,
donde R=1, es decir:
1 : H 1 : H
2
2
2
1
1
2
2
2
1
0
2
2
2
1


Una de las razones de la importancia de este contraste es la siguiente: Si queremos
estudiar la diferencia entre las medias de dos poblaciones normales, el caso ms
realista es considerar un contraste donde las varianzas de las poblaciones son
desconocidas. Ante esta situacin podemos encontrarnos dos situaciones:
1. Las dos varianzas son iguales. Este es el caso ms favorable pues utilizamos la
distribucin de Student para el contraste con un nmero de grados de libertad que
slo depende del tamao de la muestra.
2. Las varianzas son distintas. En este caso el nmero de grados de libertad es una
variable aleatoria (frmula de Welch) y por tanto al realizar el contraste se pierde
cierta precisin.
En esta situacin lo recomendable es
- En primer lugar realizar un test de homocedasticidad.
- Si la igualdad de varianzas no puede ser rechazada de modo significativo,
aplicamos un test de diferencia de medias suponiendo que las varianzas son
desconocidas pero iguales.
En otro caso se utiliza la aproximacin de Welch.
36
Al realizar el contraste bilateral sobre la igualdad de varianzas podemos tambin
economizar parte de trabajo definiendo F
exp
como el cociente entre la mayor varianza
muestral y la menor
1 F
s

F
exp
2
2
2
2
2
1
2
2
2
2
2
1
2
2
2
1
exp

'

>

ya que as no es necesario calcular el extremo inferior para la regin donde no se


rechaza H
0
, pues F
exp
nunca estar prxima a 0. Con esta definicin de F
exp
el criterio a
seguir frente al contraste de significacin para un valor dado es,

Criterio para el rechazo de la hiptesis nula sobre la homocedasticidad. Aunque en
realidad el test a realizar es bilateral, al elegir el estadstico del contraste de modo que
el numerador sea mayor que el numerador, podemos concentrar toda la probabilidad
del error de tipo I, , en la cola derecha de la distribucin.

'

>

'

>



0 teo exp
0 teo exp
2
1
2
2 1 n , 1 n , 1
2
2
2
1 1 n , 1 n , 1
teo
H rechazar b F
H aprobar b F
s

F
s

F
F
1 2
2 1
37
Ejemplo. Se desea comparar la actividad motora espontnea de un grupo de 25 ratas
control y otro de 36 ratas desnutridas. Se midi el nmero de veces que
pasaban delante de una clula fotoelctrica durante 24 horas. Los datos
obtenidos fueron los siguientes:
Ratas de control n
1
=25
1
x =869.
8
S
1
=106.7
Ratas Desnutridas n
2
=36
2
x =465
S
2
=153.7
Se observan diferencias significativas entre el grupo control y el grupo desnutrido?
Solucin: En primer lugar, por tratarse de un problema de inferencia estadstica, nos
sern ms tiles las cuasivarianzas que las varianzas. Por ello calculamos:
( ) ( ) 298 . 24 7 . 153
35
36
s
1 n
n
s 859 . 11 7 . 106
24
25
s
1 n
n
s
2 2
2
2
2 2
2
2 2
1
1
1 2
1

El contraste que debemos realizar est basado en el de la t-Student para la diferencia


de medias de dos poblaciones. Para ello conocemos dos estadsticos posibles, segn
que las varianzas poblacionales de ambos grupos de ratas puedan ser supuestas
iguales (homocedasticidad) o distintas (heterocedasticidad). Para ello realizamos
previamente el contraste:
1 : H 1 : H
2
2
2
1
1
2
2
2
1
0

Suponiendo H
0
cierta, tenemos que el estadstico del contraste conveniente es
38
1 F
s

F
exp
2
2
2
2
2
1
2
2
2
2
2
1
2
2
2
1
exp

'

>

ya que as no es necesario calcular el extremo inferior para la regin donde no se


rechaza H
0
. En este caso:
97 . 2 F F 049 . 2
s
s
F
teo 1 n , 1 n
2
1
2
2
exp
1 2


Como F
exp
T
teo
, no podemos concluir (al menos al nivel de significacin =5%) que
H
0
deba ser rechazada.

No hay evidencia significativa para rechazar la homocedasticidad. El estadstico del
contraste ha sido elegido modo que el numerador de F
exp
sea mayor que el
denominador, es decir, F
exp
>1.
Por lo tanto no rechazamos la hiptesis de homocedasticidad de ambas poblaciones, y
pasamos a contrastar la igualdad de las medias,
H
0
:
1
-
2
=0 H
1
:
1
-
2
0
utilizando el estadstico ms sencillo (el que no necesita aproximar los grados de
libertad mediante la frmula de Welch). Para ello calculamos en primer lugar la
cuasivarianza muestral ponderada y los valores del test:
238 . 19
2 n n
s ) 1 n ( s ) 1 n (
s
2 1
2
2 2
2
1 1 2

+
+

59 2 n n
2 1
2 1
exp
t t 210 . 11
n
1
n
1
s
x x
T
2 1

+

+
39
Como exp teo
T T
concluimos que se ha de rechazar la hiptesis de igualdad de las
medias, y por tanto aceptamos que las medias son diferentes. Adems, como se
aprecia en la figura, la evidencia a favor de la hiptesis alternativa es muy alta, y se
puede afirmar que con gran probabilidad la media poblacional de las ratas de control
es mayor que la de las ratas desnutridas.
Hay una gran evidencia en contra de la hiptesis de que ambas medias poblacionales
coincidan, y a favor de que la de la primera poblacin es mayor que la de la segunda.
CONTRASTES SOBRE LA DIFERENCIA DE PROPORCIONES
Supongamos que tenemos dos muestras independientes tomadas sobre dos
poblaciones, en la que estudiamos una variable de tipo dicotmico (Bernoulli):
2 1
n 2 21 2 n 1 11 1
X ,.., X X X ,..., X X

40
Si X
1
y X
2
contabilizan en cada caso el nmero de xitos en cada muestra se tiene que
cada una de ellas se distribuye como una variable aleatoria binomial:
) p , n ( B X X ) p , n ( B X X
2 2
n
1 i
i 2 2 1 1
n
1 i
i 1 1
1 1



de modo que los estimadores de las proporciones en cada poblacin tienen
distribuciones que de un modo aproximado son normales (cuando n
1
y n
2
son bastante
grandes)

,
_

,
_


2
2 2
2
2
2
2
1
1 1
1
1
1
1
n
q p
, p N
n
X
P

n
q p
, p N
n
X
P

El contraste que nos interesa realizar es el de si la diferencia entre las proporciones en


cada poblacin es una cantidad conocida
H
0
: p
1
-p
2
=
Si H
0
fuese cierta se tendra que

,
_

+
2
2 2
1
1 1
2 1 2 1
n
q p
n
q p
, p p N P

Desafortunadamente ni p
1
ni p
2
son conocidos de antemano y utilizamos sus
estimadores, lo que da lugar a un error que es pequeo cuando los tamaos mustrales
son importantes:
) 1 , 0 ( N Z
n
q p
n
q p
) p p (
exp
2
2 2
1
1 1
2 1

+

Contraste bilateral. El contraste bilateral sobre la diferencia de proporciones es
H
0
: p
1
-p
2
= H
1
: p
1
-p
2

Entonces se define
2
2 2
1
1 1
2 1
exp
n
q p
n
q p
) p p (
Z
+

y se rechaza la hiptesis nula si 2 / 1 exp


z Z

<
o si 2 / 1 exp
z Z

>

Contrastes unilaterales. En el contraste
H
0
: p
1
-p
2
= H
1
: p
1
-p
2
<
41
y se rechaza la hiptesis nula si 2 / 1 exp
z Z

<
y para el test contrario,
H
0
: p
1
-p
2
= H
1
: p
1
-p
2
>
y se rechaza la hiptesis nula si 2 / 1 exp
z Z

>

42

You might also like