You are on page 1of 25

PRUEBA DE HIPTESIS

INTRODUCCION
Dentro del estudio de la inferencia estadstica, se describe como se puede tomar
una muestra aleatoria y a partir de esta muestra estimar el valor de un parmetro
poblacional en la cual se puede emplear el mtodo de muestreo y el teorema del valor
central lo que permite explicar cmo a partir de una muestra se puede inferir algo
acerca de una poblacin, lo cual nos lleva a definir y elaborar una distribucin de
muestreo de medias mustrales que nos permite explicar el teorema del lmite central
y utilizar este teorema para encontrar las probabilidades de obtener las distintas
medias maestrales de una poblacin.
Pero es necesario tener conocimiento de ciertos datos de la poblacin como la media,
la desviacin estndar o la forma de la poblacin, pero a veces no se dispone de
esta informacin.
En este caso es necesario hacer una estimacin puntual que es un valor que se usa
para estimar un valor poblacional. Pero una estimacin puntual es un solo valor y se
requiere un intervalo de valores a esto se denomina intervalo de confianza y se espera
que dentro de este intervalo se encuentre el parmetro poblacional buscado. Tambin
se utiliza una estimacin mediante un intervalo, el cual es un rango de valores en el
que se espera se encuentre el parmetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una
aseveracin acerca de un parmetro poblacional este mtodo es denominado Prueba
de hiptesis para una muestra.
Hoy en da, muchos problemas de ingeniera, ciencia, y administracin, requieren que
se tome una decisin entre aceptar o rechazar una proposicin sobre algn parmetro.
Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles
de la inferencia estadstica, puesto que muchos tipos de problemas de toma de
decisiones, pruebas o experimentos en el mundo de la ingeniera, pueden formularse
como problemas de prueba de hiptesis.
HIPOTESIS Y PRUEBA DE HIPOTESIS
Tenemos que empezar por definir que es una hiptesis y que es prueba de hiptesis.
HIPTESIS es una aseveracin de una poblacin elaborado con el propsito de poner
a prueba, para verificar si la afirmacin es razonable se usan datos.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una
o ms poblaciones.
En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis,
despus se hacen las pruebas para verificar la aseveracin o para determinar que no
es verdadera.
Por tanto, LA PRUEBA DE HIPTESIS es un procedimiento basado en la evidencia
muestral y la teora de probabilidad; se emplea para determinar si la hiptesis es una
afirmacin razonable.
CUL ES LA UTILIDAD DE LAS HIPTESIS?
Es posible que alguien piense que con lo expuesto en este captulo queda claro cul
es el valor de las hiptesis para la investigacin del comportamiento. Sin embargo,
creemos que es necesario ahondar un poco ms en este punto, mencionando las
principales funciones de las hiptesis.
1. En primer lugar, y como ya se dijo, son las guas de una investigacin. El
formularlas nos ayuda a saber lo que estamos tratando de buscar, de probar.
Proporcionan orden y lgica al estudio. Son como los objetos de un plan
administrativo. Las sugerencias formuladas en las hiptesis pueden ser soluciones
a(los) problema(s) de investigacin, silo son o no, efectivamente es la tarea del
estudio (Selltiz, et al., 1965).
2. En segundo lugar, tienen una funcin descriptiva y explicativa, segn sea el
caso. Cada vez que una hiptesis recibe evidencia emprica en su favor o en su
contra, nos dice algo acerca del fenmeno al cual est asociado o hace referencia. Si
la evidencia es en su favor, la informacin sobre el fenmeno se incrementa; y aun si
la evidencia es en su contra, descubrimos algo acerca del fenmeno que no sabamos
antes (Black y Champion, 1976).
3. La tercera funcin es la de probar teoras, si se aporta evidencia en favor de
una. Cuando varias hiptesis de una teora reciben evidencia en su favor, la teora va
hacindose ms robusta; y cuanto ms evidencia haya en favor de aqullas, ms
evidencia habr en favor de sta.
4. Una cuarta funcin es la de sugerir teoras (Black y Champion, 1976). Algunas
hiptesis no estn asociadas con teora alguna; pero puede ocurrir que como resultado
de la prueba de una hiptesis, se pueda construir una teora o las bases para est.
Esto no es muy frecuente pero ha llegado a ocurrir.
OBJETIVO DE LA PRUEBA DE HIPTESIS.
El propsito de la prueba de hiptesis no es cuestionar el valor calculado del
estadstico (muestral), sino hacer un juicio con respecto a la diferencia entre
estadstico de muestra y un valor planteado del parmetro.
TIPOS DE HIPOTESIS
A. HIPTESIS NULA
Para todo tipo de investigacin en la que tenemos dos o ms grupos, se establecer
una hiptesis nula.
La hiptesis nula es aquella que nos dice que no existen diferencias significativas
entre los grupos.
Por ejemplo
Supongamos que un investigador cree que si un grupo de jvenes se somete a un
entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que
no recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra de
jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos
experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento
alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en
el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y
el que no lo recibi.
IMPORTACIA DE LAS HIPOTESIS NULAS
Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin. El
hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia
entre los grupos, si esta diferencia es significativa, y si no se debi al azar.
No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis
nula es aquella por la cual indicamos que la informacin a obtener es contraria a la
hiptesis de trabajo.
Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se
enuncia que la causa determinada como origen del problema flucta, por tanto, debe
rechazarse como tal.
Otro ejemplo:
Hiptesis: el aprendizaje de los nios se relaciona directamente con su edad.
Hiptesis nula: no existe diferencia significativa entre el aprendizaje en nios de
diversas edades.
B. HIPTESIS CONCEPTUAL.
Es la hiptesis que se formula como resultado de las explicaciones tericas aplicables
a nuestro problema. Nos ayuda a explicar desde el punto de vista terico el fenmeno
que estamos investigando.
Es la hiptesis orientadora de la investigacin, intenta enfocar el problema como base
para la bsqueda de datos. No puede abarcar ms de lo propuesto en los objetivos de
la investigacin o estar en desacuerdo con ellos.
Podemos enunciarla como una relacin causal o determinante proveniente del
planteamiento del problema, de donde se desprenden las variables.
C. HIPOTESIS DE TRABAJO O DE INVESTIGACION
Es aquella que le sirve al investigador como base de su investigacin, o sea, trata de
dar una explicacin tentativa al fenmeno que se est investigando. sta es la
hiptesis que el investigador tratar de aceptar como resultado de su investigacin,
rechazando la hiptesis nula.
Se dice que la hiptesis de trabajo es operacional por presentar cuantitativamente (en
trminos medibles) la hiptesis conceptual o general.
Tenemos los siguientes tipos de hiptesis de trabajo:
HIPTESIS DESCRIPTIVAS
Indican el valor de las variables que se va a observar en un contexto o en la
manifestacin de otra variable. Estas se utilizan en estudios descriptivos y
generalmente son afirmaciones generales.
Algunos autores consideran estas hiptesis como afirmaciones "univariadas"
HIPTESIS CORRELACIONALES
Especifican las relaciones entre dos o ms variables. Pueden establecer la asociacin
entre dos o variables. Corresponden a los estudios correlacionales.
HIPTESIS DE LA DIFERENCIA ENTRE GRUPOS
Estas hiptesis se formulan en investigaciones cuyo fin es comparar grupos.
HIPTESIS QUE ESTABLECEN RELACIONES DE CAUSALIDAD.
Este tipo de hiptesis no slo afirma las relaciones entre dos o ms variables, sino que
adems proponen un sentido de "entendimiento" de ellas. Establecen relaciones de
causa y efecto. Adems de establecer una relacin entre variables propone la
causalidad de esa relacin.
SIMBOLIZACIN DE LA HIPTESIS CAUSAL:
D. HIPTESIS ALTERNATIVAS
Son posibilidades alternas ante las hiptesis de investigacin y nula, ofrecen
otra descripcin o explicacin distintas a las que proporcionan estos tipos de hiptesis.
COMO SE PRUEBAN LAS HIPTESIS
Al realizar pruebas de hiptesis, se parte de un valor supuesto (hipottico) en
parmetro poblacional. Despus de recolectar una muestra aleatoria, se compara
la estadstica muestral, as como la media (x), con el parmetro hipottico, se compara
con una supuesta media poblacional (). Despus se acepta o se rechaza el valor
hipottico, segn proceda. Se rechaza el valor hipottico slo si el resultado muestral
resulta muy poco probable cuando la hiptesis es cierta.
Para mayor entendimiento a continuacin se detallan algunas etapas a cumplir
durante la prueba de las hiptesis
Etapa 1.- Planear la hiptesis nula y la hiptesis alternativa. La hiptesis nula (H0) es
el valor hipottico del parmetro que se compra con el resultado muestral resulta muy
poco probable cuando la hiptesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de
significancia del 5%, entonces se rechaza la hiptesis nula solamente si el resultado
muestral es tan diferente del valor hipottico que una diferencia de esa magnitud o
mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.
Etapa 3.- Elegir la estadstica de prueba. La estadstica de prueba puede ser la
estadstica muestral (el estimador no segado del parmetro que se prueba) o una
versin transformada de esa estadstica muestral. Por ejemplo, para probar el valor
hipottico de una media poblacional, se toma la media de una muestra aleatoria de
esa distribucin normal, entonces es comn que se transforme la media en un valor z
el cual, a su vez, sirve como estadstica de prueba.
Consecuencias de las Decisiones en Pruebas de Hiptesis.
Decisiones
posibles
Situaciones posibles
La hiptesis nula es
verdadera
La hiptesis nula es
falsa
Aceptar la
hiptesis nula
Se acepta
correctamente
Error tipo II
Rechazar la
hiptesis nula
Error tipo I Se rechaza
correctamente
Etapa 4.- Establecer el valor o valores crticos de la estadstica de prueba. Habiendo
especificado la hiptesis nula, el nivel de significancia y la estadstica de prueba que
se van a utilizar, se produce a establecer el o los valores crticos de estadstica de
prueba. Puede haber uno o ms de esos valores, dependiendo de si se va a realizar
una prueba de uno o dos extremos.
Etapa 5.- Determinar el valor real de la estadstica de prueba. Por ejemplo, al probar
un valor hipottico de la media poblacional, se toma una muestra aleatoria y se
determina el valor de la media muestral. Si el valor crtico que se establece es un valor
de z, entonces se transforma la media muestral en un valor de z.
Etapa 6.- Tomar la decisin. Se compara el valor observado de la estadstica muestral
con el valor (o valores) crticos de la estadstica de prueba. Despus se acepta o se
rechaza la hiptesis nula. Si se rechaza sta, se acepta la alternativa; a su vez, esta
decisin tendr efecto sobre otras decisiones de los administradores operativos, como
por ejemplo, mantener o no un estndar de desempeo o cul de
dos estrategias de mercadotecnia utilizar.
La distribucin apropiada de la prueba estadstica se divide en dos regiones: una
regin de rechazo y una de no rechazo. Si la prueba estadstica cae en esta ltima
regin no se puede rechazar la hiptesis nula y se llega a la conclusin de que
el proceso funciona correctamente.
Al tomar la decisin con respecto a la hiptesis nula, se debe determinar el valor crtico
en la distribucin estadstica que divide la regin del rechazo (en la cual la hiptesis
nula no se puede rechazar) de la regin de rechazo. A hora bien el valor crtico
depende del tamao de la regin de rechazo.
PASOS DE LA PRUEBA DE HIPTESIS
- Expresar la hiptesis nula
- Expresar la hiptesis alternativa
- Especificar el nivel de significancia
- Determinar el tamao de la muestra
- Establecer los valores crticos que establecen las regiones de rechazo de las de no
rechazo.
- Determinar la prueba estadstica.
- Coleccionar los datos y calcular el valor de la muestra de la prueba estadstica
apropiada.
- Determinar si la prueba estadstica ha sido en la zona de rechazo a una de no
rechazo.
- Determinar la decisin estadstica.
Expresar la decisin estadstica en trminos del problema.
Errores de tipo I y de tipo II. Si rechazamos una hiptesis cuando debiera ser
aceptada, diremos que se ha cometido un error de tipo I. Por otra parte, si aceptamos
una hiptesis que debiera ser rechazada, diremos que se cometi un error de tipo II.
En ambos casos, se ha producido un juicio errneo. Para que las reglas de decisin (o
no contraste de hiptesis) sean buenos, deben disearse de modo que minimicen los
errores de la decisin; y no es una cuestin sencilla, porque para cualquier tamao de
la muestra, un intento de disminuir un tipo de error suele ir acompaado de un
crecimiento del otro tipo. En la prctica, un tipo de error puede ser ms grave que el
otro, y debe alcanzarse un compromiso que disminuya el error ms grave. La nica
forma de disminuir ambos a la vez es aumentar el tamao de la muestra que no siempre
es posible.
Niveles de Significacin. Al contrastar una cierta hiptesis, la mxima probabilidad con
la que estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama nivel
de significacin. Esta probabilidad, denota a menudo por se, suele especificar antes de
tomar la muestra, de manera que los resultados obtenidos no influyan en nuestra
eleccin.
En la prctica, es frecuente un nivel de significacin de 0,05 0,01, si bien se une otros
valores. Si por ejemplo se escoge el nivel de significacin 0,05 ( 5%) al disear una
regla de decisin, entonces hay unas cinco (05) oportunidades entre 100 de rechazar la
hiptesis cuando debiera haberse aceptado; Es decir, tenemos un 95% de confianza de
que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido
rechazada al nivel de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una
probabilidad 0,05 de ser falsa.
Prueba de 1 o 2 Extremos. Cuando estudiamos ambos valores estadsticos es decir,
ambos lados de la media lo llamamos prueba de uno y dos extremos o contraste de una
y dos colas. Con frecuencia no obstante, estaremos interesados tan slo en valores
extremos a un lado de la media (o sea, en uno de los extremos de la distribucin), tal
como sucede cuando se contrasta la hiptesis de que un proceso es mejor que otro (lo
cual no es lo mismo que contrastar si un proceso es mejor o peor que el otro) tales
contrastes se llaman unilaterales, o de un extremo. En tales situaciones, la regin crtica
es una regin situada a un lado de la distribucin, con rea igual al nivel de significacin.
Curva Caracterstica Operativa y Curva de Potencia. Podemos limitar un error de
tipo I eligiendo adecuadamente el nivel de significancia. Es posible evitar el riesgo de
cometer el error tipo II simplemente no aceptando nunca la hiptesis, pero en muchas
aplicaciones prcticas esto es inviable. En tales casos, se suele recurrir a curvas
caractersticas de operacin o curvas de potencia que son grficos que muestran las
probabilidades de error de tipo II bajo diversas hiptesis. Proporcionan indicaciones de
hasta que punto un test dado nos permitir evitar un error de tipo II; es decir, nos
indicarn la potencia de un test a la hora de prevenir decisiones errneas. Son tiles en
el diseo de experimentos por que sugieren entre otras cosas el tamao de muestra a
manejar.
Inferencias acerca de la Media Poblacional (varianza conocida). Supongamos que
de una poblacin normal con media desconocida . Y varianza conocida
2
se extrae
una muestra de tamao n, entonces de la distribucin de la media muestral x se obtiene
que:
n /
x
Z
o


=
Se distribuye como una normal estndar. Luego, ( ) = < <

1 Z Z Z P
2 / 2 /
Donde Z/2 es un valor de la normal estndar tal que el rea a la derecha de dicho valor
es /2, como se muestra en la figura
Sustituyendo la frmula de z se obtiene:

<

< 1 Z
n /
x
Z P
2 / 2 /
Haciendo un despeje algebraico, se obtiene
=


+ < <



1
n
Z
x
n
Z
P
2 / 2 /
De lo anterior se puede concluir que un Intervalo de Confianza del 100(1-) % para la
media poblacional, es de la forma:


n
Z
x ,
n
Z
x
2 / 2 /
Usualmente =0.1, 0.05 0.01, que corresponden a intervalos de confianza del 90, 95
y 99 por ciento respectivamente. La siguiente tabla muestra los Z/2 ms usados.
Nivel de Confianza Z/2
90 1.645
95 1.96
99 2.58
En la prctica si la media poblacional es desconocida entonces, es bien probable que la
varianza tambin lo sea puesto que en el clculo de
2
interviene. Si sta es la
situacin, y si el tamao de muestra es grande (n>30, parece ser lo ms usado),
entonces
2
es estimada por la varianza muestral s
2
y se puede usar la siguiente frmula
para el intervalo de confianza de la media poblacional:

n
s Z
x ,
n
s Z
x
2 / 2 /
Por otro lado, tambin se pueden hacer pruebas de hiptesis con respecto a la media
poblacional. Por conveniencia, en la hiptesis nula siempre se asume que la media es
igual a un valor dado. La hiptesis alterna en cambio, puede ser de un slo lado: menor
mayor que el nmero dado, de dos lados: distinto a un nmero dado.
Existen dos mtodos de hacer la prueba de hiptesis: el mtodo clsico y el mtodo del
P-Value.
a. En el mtodo clsico, se evala la prueba estadstica de Z y al valor obtenido se le
llama Z calculado (Zcalc). Por otro lado el nivel de significacin dado determina una
regin de rechazo y una de aceptacin. Si Zcalc cae en la regin de rechazo,
entonces se concluye que hay suficiente evidencia estadstica para rechazar la
hiptesis nula con base en los resultados de la muestra tomada. Las frmulas estn
resumidas en la siguiente tabla:
Caso I Caso II Caso III
Ho: =0 Ho : =0 Ho : =0
Ha: <0 Ha : 0 Ha : >0
Prueba Estadstica:
n /
x
Z
o


=
Aqu Z es el valor de la normal estndar tal que el rea a la derecha de dicho valor
es. Recordar tambin que puede ser sustituido por s, cuando la muestra es
relativamente grande (n>30). Los valores de ms usados son 0.01 y 0.05. Si se
rechaza la hiptesis nula al .01 se dice que la hiptesis alterna es altamente
significativa y al .05 que es significativa.
b. Trabajar slo con esos dos valores de simplificaba mucho el aspecto
computacional, pero por otro lado creaba restricciones. En la manera moderna de
probar hiptesis se usa una cantidad llamada P-Value. El P-Value llamado el nivel
de significacin observado, es el valor de al cual se rechazara la hiptesis nula si
se usa el valor calculado de la prueba estadstica. En la prctica un P-Value cercano
a 0 indica un rechazo de la hiptesis nula. As un P-Value menor que .05 indicar
que se rechaza la prueba estadstica.
Frmulas para calcular P-Value:
- Si Ho: >o, entonces P-value = 1*Prob(Z>Zcalc).
- Si Ho: <o, entonces P-value = 1*Prob(Z<Zcalc).
- Si Ho: o, entonces P-value = 2*Prob(Z>|Zcalc ).
Los principales programas estadsticos dan los P-Value para la mayora de las
pruebas estadsticas. A travs de todo el texto usamos el mtodo del P-Value para
probar hiptesis.
PRUEBAS DE HIPTESIS PARA LA MEDIA Y PROPORCIONES
Debido a la dificultad de explicar este tema se enfocar un problema basado en un
estudio en una fbrica de llantas. En este problema la fbrica de llantas tiene dos turnos
de operarios, turno de da y turno mixto. Se selecciona una muestra aleatoria de 100
llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de cada
una de las siguientes preguntas
- Es la duracin promedio de las llantas producidas en el turno de da igual a 25 000
millas?
- Es la duracin promedio de las llantas producidas en el turno mixto menor de 25
000 millas?
- Se revienta ms de un 8% de las llantas producidas por el turno de da antes de
las 10 000 millas?
Prueba de Hiptesis para la media. En la fbrica de llantas la hiptesis nula y alternativa
para el problema se plantearon como,
Ho: = 25 000 H1: 25 000
Si se considera la desviacin estndar las llantas producidas en el turno de da,
entonces, con base en el teorema de limite central, la distribucin en el muestreo de la
media seguira la distribucin normal, y la prueba estadstica que est basada en la
diferencia entre la media Xde la muestra y la media hipottica se encontrara como
n /
x
Z
o


=
Si el tamao de la regin de rechazo se estableciera en 5% entonces se podran
determinar los valores crticos de la distribucin. Dado que la regin de rechazo esta
dividida en las dos colas de la distribucin, el 5% se divide en dos partes iguales de
2.5%.
Dado que ya se tiene la distribucin normal, los valores crticos se pueden expresar en
unidades de desviacin. Una regin de rechazo de 0.25 en cada cola de la distribucin
normal, da por resultado un rea de .475 entre la media hipottica y el valor crtico. Si
se busca est rea en la distribucin normal, se encuentra que los valores crticos que
dividen las regiones de rechazo y no rechazo son + 1.96 y - 1.96
Por tanto, la regla para decisin sera rechazar Ho si Z > +1.96 o s z < -1.96, de lo
contrario, no rechazar Ho. No obstante, en la mayor parte de los casos se desconoce la
desviacin estndar de la poblacin. La desviacin estndar se estima al calcular S,
la desviacin estndar de la muestra. Si se supone que la poblacin es normal la
distribucin en el muestreo de la media seguira una distribucin t con n-1 grados de
libertad.
En la prctica, se ha encontrado que siempre y cuando el tamao de la muestra no sea
muy pequeo y la poblacin no est muy sesgada, la distribucin t da una buena
aproximacin a la distribucin de muestra de la media. La prueba estadstica para
determinar la diferencia entre la media xde la muestra y la media de la poblacin
cuando se utiliza la desviacin estndar S de la muestra, se expresa
n / s
X
t
1 n

=

Para una muestra de 100, si se selecciona un nivel de significancia de 0.05, los valores
crticos de la distribucin t con 100-1= 99 grados de libertad se puede obtener como se
indica en la siguiente tabla tenemos el valor de 1.9842. Como esta prueba de dos colas,
la regin de rechazo de 0.05 se vuelve a dividir en dos partes iguales de 0.025 cada
una. Con el uso de las tablas para t, los valores crticos son 1.984 y +1.984. La regla
para la decisin es,
Rechazar Ho si 9842 . 1 t o 9842 . 1 t
99 99
< + > de lo contrario, no rechazar Ho
Los resultados de la muestra para el turno de da (en millas) fueron
100 n y 000 . 4 S , 430 . 25 X
da da da
= = = millas. Puesto que se est probando si la
media es diferente a 25 000 millas, se tiene con la ecuacin
075 . 1
100 / 000 . 4
00 . 25 430 . 25
t
n / S
X
t
1 100 1 n
=

=

=

Dado que t100-1=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza
Ho.
Por ello, la decisin de no rechazar la hiptesis nula Ho. En conclusin es que la
duracin promedio de las llantas es 25 000 millas. A fin de tener en cuenta la posibilidad
de un error de tipo II, este enunciado se puede redactar como no hay pruebas de que la
duracin promedio de las llantas sea diferente a 25 000 millas en las llantas producidas
en el turno de da.
PRUEBA DE HIPTESIS PARA PROPORCIONES
El concepto de prueba de hiptesis se puede utilizar para probar hiptesis en relacin
con datos cualitativos. Por ejemplo, en el problema anterior el gerente de la fbrica de
llantas quera determinar la proporcin de llantas que se reventaban antes de 10.000
millas. Este es un ejemplo de una variable cualitativa, dado que se desea llegar a
conclusiones en cuanto a la proporcin de los valores que tienen una caracterstica
particular.
El gerente de la fbrica de llantas quiere que la calidad de llantas producidas, sea lo
bastante alta para que muy pocas se revienten antes de las 10.000 millas. Si ms de un
8% de las llantas se revientan antes de las 10.000 millas, se llegara a concluir que el
proceso no funciona correctamente. La hiptesis nula y alternativa se pueden expresar
como sigue:
08 . 0 P H
0
= (Funciona correctamente)
08 . 0 P H
1
> = (No funciona correctamente)
La prueba estadstica se puede expresar en trminos de la proporcin de xitos como
sigue:
n
X
P
n
Pq
P P
Z
s
s
=

=
Siendo X y N el nmero de xitos de la muestra y n el tamao de la muestra, P la
proporcin de xitos de la hiptesis nula. Ahora se determinar si el proceso funciona
correctamente para las llantas producidas para el turno de da. Los resultados del turno
de da indican que cinco llantas en una muestra de 100 se reventaron antes de 10,000
millas para este problema, si se selecciona un nivel de significancia 05 . 0 = , las
regiones de rechazo y no rechazo se estableceran como a continuacin se muestra. Y
la regla de decisin sera: Rechazar Ho si z> + 1.645; de lo contrario no rechazar Ho.
Con los datos que se tienen,
107 . 1
n
Pq
P P
Z 05 . 0 P
s
s
=

= =
Una vez reemplazado, recuerde p+q=1
Z=-1.107 +1.645; por tanto no rechazar Ho.
La hiptesis nula no se rechazara por que la prueba estadstica no ha cado en la regin
de rechazo. Se llegara a la conclusin de que no hay pruebas de que ms del 8% de
las llantas producidas en el turno de da se revienten antes de 10,000 millas. El gerente
no ha encontrado ninguna prueba de que ocurra un nmero excesivo de reventones en
las llantas producidas en el turno de da.
Una hiptesis estadstica es una suposicin hecha con respecto a la funcin de
distribucin de una variable aleatoria. Para establecer la verdad o falsedad de una
hiptesis estadstica con certeza total, ser necesario examinar toda la poblacin. En la
mayora de las situaciones reales no es posible o practico efectuar este examen, y el
camino ms aconsejable es tomar una muestra aleatoria de la poblacin y en base a
ella, decidir si la hiptesis es verdadera o falsa.
En la prueba de una hiptesis estadstica, es costumbre declarar la hiptesis como
verdadera si la probabilidad calculada excede el valor tabular llamado el nivel de
significacin y se declara falsa si la probabilidad calculada es menor que el valor tabular.
La prueba a realizar depender del tamao de las muestras, de la homogeneidad de las
varianzas y de la dependencia o no de las variables. Si las muestras a probar involucran
a ms de 30 observaciones, se aplicar la prueba de Z, si las muestras a evaluar
involucran un nmero de observaciones menor o igual que 30 se emplea la prueba de t
de student. La frmula de clculo depende de si las varianzas son homogneas o
heterogneas, si el nmero de observaciones es igual o diferente, o si son variables
dependientes.
Para determinar la homogeneidad de las varianzas se toma la varianza mayor y se
divide por la menor, este resultado es un estimado de la F de Fisher. Luego se busca
en la tabla de F usando como numerador los grados de libertad (n-1) de la varianza
mayor y como denominador (n-1) de la varianza menor para encontrar la F de Fisher
tabular. Si la F estimada es menor que la F tabular se declara que las varianzas son
homogneas. Si por el contrario, se declaran las varianzas heterogneas. Cuando son
variables dependientes (el valor de una depende del valor de la otra), se emplea la
tcnica de pruebas pareadas.
Como en general estas pruebas se aplican a dos muestras, se denominarn a y b para
referirse a ellas, as entenderemos por:
- na al nmero de elementos de la muestra a
- nb al nmero de elementos de la muestra b
- xb al promedio de la muestra b
- s
2
a la varianza de la muestra a
- Y as sucesivamente
Entonces se pueden distinguir 6 casos a saber:
- Caso de muestras grandes (n>30)
- Caso de na = nb y s
2
a = s
2
b
- Caso de na = nb y s
2
a s
2
b
- Caso de na nb y s
2
a = s
2
b
- Caso de na nb y s
2
a s
2
b
- Caso de variables dependientes
1.-Cuando las muestras a probar involucran 2.-Caso de nmero igual de
observaciones y a ms de 30 observaciones varianzas
homogneas
) n / 2 (
bs as
2
X b X a
t
nb
bs
na
as
X b X a
z
2 2
c
2 2
c
+

=
+

=
3.-Caso de igual nmero de observaciones 4.-Caso de diferente nmero de
Y varianzas heterogneas. Varianzas homogneas
bn
cs
an
cs
X b X a
t
n
bs as
X b X a
t
2 2
c
2 2
c
+

=
+

=
5.- Caso de diferente nmero de observaciones y varianzas heterogneas. En este caso,
la tc es comparada con la tg (t generada), que a diferencia de los casos anteriores, hay
que calcularla.
n
2
b
a
2
a
b a
c
n
2
b
a
2
a
b
2
b
b
a
2
a
a
g
n
s
n
s
X X
t
n
s
n
s
n
s
t
n
s
t
t
+

=
+
+
=
Dnde: ta y tb son los valores de la tabla con n-1 grados de libertad para a y b
respectivamente
6.- Caso de muestras pareadas (de variables dependientes). En este caso, se asume
que las muestras han sido distribuidas por pares.
n
1 n
) D D (
n
D
t
2
c

PRUEBAS DE HIPTESIS UNILATERALES Y BILATERALES


Las pruebas o test de hiptesis se relacionan con los parmetros poblacionales (medias
o proporciones, etc.). Se puede utilizar los estimadores puntuales de los parmetros
poblacionales como estadstico del test en cuestin. Supongamos, como ilustracin que
se utiliza el smbolo para denotar el parmetro poblacional de inters, por ejemplo,
puede ser, (1- 2), p o (p1-p2), y el smbolo

para denotar el estimador puntual


indeseado correspondiente.
Desde el punto de vista prctico se puede tener inters en contrastar la hiptesis nula
H0: = 0, contra la alternativa de que el parmetro poblacional es mayor que 0, o sea
H1: > 0. En esta situacin, se rechazar H0 cuando

sea grande, o sea cuando el


estadstico del test sea mayor que un cierto valor llamado valor crtico, que separa las
regiones de rechazo y no rechazo del test.
La probabilidad de rechazar la hiptesis nula cuando es cierta ser igual al rea bajo la
curva de la distribucin muestral del estadstico del test sobre la regin de rechazo. En
el caso que estemos trabajando con una distribucin normal, y un = 0,05, se rechaza
la hiptesis nula cuando

se encuentre a ms de 1,645


a la derecha de 0. De esta
manera, se puede definir como
Una prueba estadstica de una cola o unilateral es aquella en la que la regin de rechazo
se localiza solamente en una cola o extremo de la distribucin muestral del estadstico
del test.
Para detectar > 0, se sita la regin de rechazo en la extremidad de valores superiores
a

. Para detectar < 0 se ubica la regin de rechazo en la extremidad izquierda de la


distribucin de

, o sea para valores inferiores a

. Si hay que detectar diferencias


mayores o menores de 0, la hiptesis alternativa ser
H1:
0

es decir
> 0 o bien < 0
En este caso la probabilidad de error Tipo I se repartir entre las dos colas de la
distribucin muestral del estadstico, y se rechazar H0 para valores de

mayores que
un valor crtico (0 + C) o menor que (0- C). Esta prueba se llama prueba estadstica
bilateral o de dos colas.
EJEMPLOS
Ejemplo 1.Si se supone que se conoce la varianza poblacional , entonces sobre la
base del Teorema Central del Lmite, la distribucin muestral de la media seguira una
distribucin normal y bajo la veracidad de la hiptesis nula, la estadstica de prueba es:
Que se distribuye normal estndar con media y varianza .
Ejemplo 2
Suponga que se est interesado en determinar si hay evidencia que el aumento de
peso promedio de unos animales a los dos meses de aplicar una determinada dieta es
de 20Kg. Se conoce que el aumento de peso sigue una distribucin normal con
varianza .
Paso 1.
Paso 2.
El nivel de significancia o probabilidad de cometer un error Tipo I en esta prueba
sera
Se tomar una muestra de animales. Los datos son:
16.5 16.4 18.5 19.5 20.2 21.0 18.5 19.3 19.8 20.3
Paso 3
Puesto que se conoce la varianza poblacional, la prueba estadstica a utilizar es la
prueba :
La cual bajo la hiptesis nula se distribuye normal estndar con media y varianza .
Paso 4.
Regin crtica para la hiptesis nula con varianza conocida
Los valores crticos se determinan buscando en la tabla de distribucin normal
estndar acumulada el valor de para un rea de 0.025, el valor obtenido es
, el valor de ser el mismo , luego la regla de decisin para la hiptesis
ser no rechazar si
Paso 5
Como entonces el valor de la estadstica de prueba est dado
por:
Se compara el valor calculado de la prueba con los valores crticos (obtenidos de la
tabla de distribucin normal estndar), para determinar si cae en la regin de rechazo
o de no rechazo. En este caso . Se encuentra dentro de la regin de no
rechazo puesto que . En este caso no se rechaza la hiptesis nula.
Paso 6
Se deben expresar las consecuencias de la decisin de la prueba de hiptesis en
trminos del problema real de que se trate. Por lo tanto, en este problema, se llega a la
conclusin de que hay evidencia de que el peso promedio de los animales sea 20Kg.
Ejemplo2. Un investigador de mercados y hbitos de comportamiento afirma que
el tiempo que los nios de tres a cinco aos dedican a ver la televisin cada semana se
distribuye normalmente con una media de 22 horas y desviacin estndar 6 horas.
Frente a este estudio, una empresa de investigacin de mercados cree que la media es
mayor y para probar su hiptesis toma una muestra de 64 observaciones procedentes
de la misma poblacin, obteniendo como resultado una media de 25. Si se utiliza un
nivel de significacin del 5%. Verifique si la afirmacin del investigador es realmente
cierta.
Datos:
n = 64
a = 5% = 0,05
Solucin:
H0: (= 22
H1: (> 22
a = 0,05
Se rechaza Ho, porque zprueba (4) es mayor que ztabla (1,645), por lo tanto el tiempo
que los nios de tres a cinco aos dedican a ver la televisin es mayor de 22 horas, lo
que implica que la empresa de investigacin de mercados tiene la razn.
En Excel
Ejemplo3. Un gerente de ventas de libros universitarios afirma que en promedio sus
representantes de ventas realizan 40 visitas a profesores por semana. Varios de estos
representantes piensan que realizan un nmero de visitas promedio superior a 40. Una
muestra tomada al azar durante 8 semanas revel un promedio de 42 visitas
semanales y una desviacin estndar de 2 visitas. Utilice un nivel de confianza del
99% para aclarar esta cuestin.
Datos:
(= 40
n = 8
Nivel de confianza del 99%
Nivel de significacin = (100%-99%)/2 = 0,5% = 0,005
Solucin:
H0: (= 40
H1: (> 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que estn realizando un nmero de visitas promedio superior a 40.
En Excel
Ejemplo4
1) Una empresa est interesada en lanzar un nuevo producto al mercado. Tras realizar
una campaa publicitaria, se toma la muestra de 1 000 habitantes, de los cuales, 25
no conocan el producto. A un nivel de significacin del 1% apoya el estudio las
siguientes hiptesis?
a. Ms del 3% de la poblacin no conoce el nuevo producto.
b. Menos del 2% de la poblacin no conoce el nuevo producto
Datos:
n = 1000
x = 25
Donde:
x = ocurrencias
n = observaciones
= proporcin de la muestra
= proporcin propuesta
Solucin:
a)
a = 0,01
H0 es aceptada, ya que zprueba (-0,93) es menor que ztabla (2,326), por lo que no es
cierto que ms del 3% de la poblacin no conoce el nuevo producto.
En Excel
b)
a = 0,01
H0 es rechazada, ya que zprueba (1,13) es menor que ztabla (2,326), por lo que es
cierto que menos del 2% de la poblacin no conoce el nuevo producto.
Ejemplo5 Cuando las ventas medias, por establecimiento autorizado, de
una marca de relojes caen por debajo de las 170,000 unidades mensuales, se
considera razn suficiente para lanzar una campaa publicitaria que active las ventas
de esta marca. Para conocer la evolucin de las ventas, el departamento
de marketing realiza una encuesta a 51 establecimientos autorizados, seleccionados
aleatoriamente, que facilitan la cifra de ventas del ltimo mes en relojes de esta marca.
A partir de estas cifras se obtienen los siguientes resultados: media = 169.411,8
unidades., desviacin estndar = 32.827,5 unidades. Suponiendo que las ventas
mensuales por establecimiento se distribuyen normalmente; con un nivel de
significacin del 5 % y en vista a la situacin reflejada en los datos. Se considerar
oportuno lanzar una nueva campaa publicitaria?
Datos:
n = 51
Solucin:
H0: (= 170000
H1: (< 170000
a = 0,05
Se rechaza Ho, porque zprueba (-0,12) es menor que ztabla (1,645), por lo tanto se
acepta H1: (< 170000, y se debe considerar oportuno lanzar una nueva campaa
publicitaria.
En Excel

You might also like