You are on page 1of 17

GUIA RESUMIDA SOBRE PRUEBA DE HIPOTESIS

DOCENTE
Ing. JAVIER DE LA HOZ MAESTRE

ESTADISTICA II
UNIVERSIDAD DEL MAGDALENA

Ing. Javier De la Hoz

TEMA

PRUEBAS DE HIPOTESIS
Los mtodos estudiados en el tema anterior usan la informacin proporcionada por los
estadsticos muestrales para estimar con cierta probabilidad el valor de un parmetro
poblacional. En ste captulo se introducir la prueba de hiptesis que es un enfoque diferente.
En ste caso, se supone a priori el valor del parmetro y sobre la base de la informacin
obtenida en una muestra se somete a prueba la suposicin, para luego tomar con cierta
probabilidad, la decisin de rechazar o no rechazar la hiptesis. En ste punto es importante
sealar que la expresin no rechazar pudiera ser sustituida por aceptar, sin embargo antes
de hacerlo es necesario atender cuidadosamente algunas explicaciones que se darn ms
adelante. La prueba de hiptesis tambin conocida como docimasia o contrastacin de hiptesis
es uno de los mtodos estadsticos ms usados en las ciencias e ingeniera por ser un
procedimiento que le proporciona al investigador un criterio objetivo para tomar decisiones
con base a un nmero limitado de observaciones. Frecuentemente un ingeniero tiene que
decidir: a) al comparar magnitudes de propiedades fsicas, qumicas o biolgicas en dos o ms
condiciones o categoras; b) al valorar los efectos de diferentes niveles de algn factor
ambiental como la temperatura, la humedad, el contenido de oxgeno sobre algn proceso, ; y c)
al relacionar dos o ms variables, . En ste captulo se trataran varios procedimientos para
probar hiptesis que dan respuesta a este tipo de problemas o a otros similares.

2.1 TERMINOS BSICOS


Ing. Javier De la Hoz

2.1.1. Hiptesis estadsticas.


(a) Hiptesis estadstica: afirmacin sobre uno o ms parmetros de una o ms poblaciones.
(b) La hiptesis nula H0: la hiptesis que se debe comprobar.
(c) La hiptesis alternativa H1: se establece como el complemento de H0.

2.1.2. Comentarios.
(a) H0 siempre se refiere a un valor especfico del parmetro de poblacin (como, porejemplo,
), no al estadstico muestral (como

x ).

(b) H0 siempre debe contener un signo igual respecto al valor especificado del parmetro
poblacional (por ejemplo, H0 : = 36, H0 : 36 o H0 : 36).
(c) H1 nunca debe contener un signo igual respecto al valor especificado de parmetro de
poblacin.

2.2 PROCEDIMIENTO GENERAL PARA LA PRUEBA DE HIPOTESIS


Se pueden identificar varias etapas fundamentales, las cuales se pueden reordenar e
identificar en la forma siguiente:
1. Formulacin de hiptesis
2. Especificacin de un valor de probabilidad crtico o nivel de significacin.
3. Eleccin de un estadstico de la muestra y de su distribucin para someter a prueba las
hiptesis.
4. Establecimiento de una zona de rechazo para Ho.
5. Cmputos necesarios.
6. Decisin.

Formulacin de hiptesis. Por lo general toda investigacin en el campo de las ciencias se

inicia a partir de una hiptesis la cual es una explicacin tentativa que se da a un hecho
observado. La misma puede surgir a partir de una teora general que explica cierta realidad a la
cual pertenece el fenmeno observado, o por la experiencia propia o de otros investigadores, o
por simple intuicin. Ahora bien, en la formulacin de cualquier hiptesis est implcita una
hiptesis alternativa. Estas hiptesis de investigacin para poderse someter a prueba deben
concretarse en trminos cuantitativos, transformndose en hiptesis estadsticas. En forma

Ing. Javier De la Hoz

general las hiptesis estadsticas son afirmaciones que involucran una propiedad de la
distribucin probabilstica de la variable aleatoria que se est estudiando, propiedades como
son la media (), la varianza (2), un valor de proporcin () o la forma de la distribucin. De
modo que el primer paso en un proceso de decisin es formular las hiptesis estadstica, las
cuales reciben el nombre de hiptesis nula (H0) e hiptesis alternativa (H1). La hiptesis nula se
dice que es una hiptesis simple, porque es una afirmacin de igualdad con un valor especfico,
mientras que las hiptesis alternativas se dicen que es compuesta porque puede asumir
diferentes valores.

Si se representa un parmetro poblacional por letra griega y con k un valor cualquiera del
parmetro, la forma genrica de la hiptesis nula sera una igualdad entre el parmetro y un
valor especfico del mismo,
H0 : = k
Por su parte la hiptesis alternativa se puede representar con una de las tres posibilidades
siguientes:
H1:
>k
<k
k
La expresin > k se interpreta como que el parmetro puede asumir cualquier valor mayor a
k y se dice que la prueba de hiptesis es de una cola a la derecha. Por su parte < k indica que
el parmetro puede ser cualquier valor menor a k y la prueba de hiptesis se llama de una
cola a la izquierda. Finalmente k representa la posibilidad que el parmetro asuma
cualquier valor diferente (mayor o menor) al valor k y la prueba de hiptesis se denomina de
dos colas. Ms adelante, cuando se trate lo referente al establecimiento de la zona de
decisin, se aclarar la razn de esta nomenclatura. Como vimos existen tres formas distintas
de planteamiento para la hiptesis alternativa. La seleccin de una de ellas depende de la
naturaleza del problema que se quiere docimar. Algunos ejemplos pueden ayudar a entender la
lgica para seleccionar una hiptesis alternativa

Ejemplo 2.1 Dada las siguientes situaciones, identifique las hiptesis nula y alternativa para la
hiptesis estadstica formulada en cada situacin.
(a) Un empresario afirma que el peso medio poblacional (en gramos) de lapiceros por caja
es de por lo menos 300 gramos
(b) Una empresa decide aceptar envos de piezas siempre y cuando no tenga evidencia para
sospechar que ms del 4% son defectuosas.
(c) Supongamos que la conjetura de una profesor es que la utilizacin de la tecnologa no
produce diferencias en el promedio de las calificaciones del examen final.

SOLUCION:

Ing. Javier De la Hoz

(a) Sea el peso medio poblacional (en gramos) de lapiceros por caja. Si la hiptesis es que
esta media es por lo menos 300 gramos, entonces, la hiptesis nula es
H0 : 300.
La alternativa obvia es que el verdadero peso medio es inferior a 300 gramos, es decir,
H1 : < 300.
(b) Sea la proporcin poblacional de piezas defectuosas. En este caso, la hiptesis nula es que
esta proporcin es cuando mucho 0,05, es decir,
H0 : 0, 05.
Basndose en la informacin muestral, se contrasta esta hiptesis frente a la alternativa
unilateral
H1 : > 0, 05.
(c) Sea la diferencia entre las calificaciones medias poblacionales para las dos partes del
curso, con y sin uso de la tecnologa. Entonces, la hiptesis nula es
H0 : = 0.
Sin embargo, el profesor puede sospechar que posiblemente el uso de la tecnologa produzca un
incremento en el promedio y, en consecuencia, querr contrastar la hiptesis nula frente a la
alternativa unilateral
H1 : > 0

Especificacin del nivel de significacin . Cualquier decisin dentro del proceso de prueba
de hiptesis lleva asociado cierto riesgo de fallar. Es decir que siempre existe la posibilidad de
tomar una decisin equivocada, slo que en este tipo de prueba se tiene la ventaja de conocer
de antemano la probabilidad de equivocarse. En la Tabla 2.1 se muestran las posibles
consecuencias de tomar una decisin con relacin a la hiptesis nula. Se dice que cometemos un
error de tipo I si rechazamos la hiptesis nula cuando en realidad es verdadera y que
cometemos un error de tipo II si aceptamos la hiptesis nula cuando es falsa.
Tabla 2.1. Situaciones derivadas de una decisin estadstica

La probabilidad de cometer estos errores est dada por


P(error de tipo I) = P(rechazar H0 |H0 es verdadera) =
P(error de tipo II) = P(aceptar H0 |H0 es falsa) =

Ing. Javier De la Hoz

La probabilidad se llama nivel de significancia, 1 es el llamado grado de confianza y la


probabilidad 1 se llama potencia de la prueba.
Comnmente los niveles de significacin usados son 0.05, 0.01 y 0.001.

Tabla 2.2 Errores de tipo I y II y sus correspondientes probabilidades

Como se puede notar tanto como son probabilidades condicionadas. Los valores de ambos
errores no pueden calcularse en un sentido absoluto. Para calcular es necesario asumir que H 0
es cierta y para calcular se asume que H1 es cierta.
En cualquier prueba de hiptesis lo ms conveniente ser que ambos tipos de errores sean lo
ms pequeo posible, pero esto no es fcil de lograr, porque al intentar disminuir uno el otro
aumenta proporcionalmente como se muestra en la siguiente figura.

Seleccin del estadstico de prueba. Para poder someter a prueba las hiptesis
formuladas, es necesario usar alguna propiedad o estadstico de las muestras que est
relacionado con el parmetro objeto de la inferencia. Estas propiedades muestrales reciben el
nombre genrico de estadsticos de prueba. En las Tablas 2.3; 2.4; 2.5 se muestra como se
seleccionan segn los parmetros los estadsticos de prueba correspondiente

Tabla 2.3 Estadsticos de prueba para la media poblacional

Ing. Javier De la Hoz

Tabla 2.4 Estadsticos de prueba para la diferencia de medias


poblacionales

Tabla 2.5 Estadsticos de prueba para la proporcin y diferencia de


proporciones poblacionales

Ing. Javier De la Hoz

Tabla 2.5 Estadsticos de prueba para la varianza y razn de varianzas


poblacionales

Establecer una zona de aceptacin para H0. Una vez conocido el estadstico de prueba a
utilizar, as como su distribucin, es necesario definir en la distribucin del estadstico
muestral una zona de aceptacin y una zona de rechazo de la hiptesis nula. La zona de
aceptacin de H0 est formada por todos los valores del estadstico de prueba con una
probabilidad de ocurrencia mayor al establecido en el nivel de significacin.. Por el contrario la
zona de rechazo est formada por todos los valores del estadstico de prueba cuya
probabilidad de ocurrencia es igual o menor al valor establecido en el nivel de significacin. La
zona de rechazo a diferencia de la zona de aceptacin y dependiendo de la hiptesis
alternativa planteada puede estar orientada en diferentes direcciones a lo largo del eje de
valores de la variable aleatoria.
Zona de rechazo a la derecha: esta formada por todos los valores del estadstico de prueba

ubicados a la derecha del parmetro cuya probabilidad de ocurrencia es menor a la del nivel
de significacin. Esta zona se especifica cuando H 1: > 0 y la docimasia se llama prueba de una
cola a la derecha (Figura 2.1 A)
Zona de rechazo a la izquierda: esta formada por todos los valores del estadstico de prueba

ubicados a la izquierda del parmetro cuya probabilidad de ocurrencia es menor a la del

nivel de significacin. Esta zona se especifica cuando H 1: <0 y la docimasia se llama prueba
de una cola a la derecha (Figura 2.1 B)
Zona de rechazo doble: La zona de rechazo puede ser dividida en dos partes iguales ubicadas a
cada lado del parmetro. La zona de la derecha y de la izquierda estn formadas por todos los
valores del estadstico de prueba

Ing. Javier De la Hoz

cuya probabilidad de ocurrencia es menor a la mitad de la

probabilidad del nivel de significacin . Esta zona se especifica cuando H 1: 0 y la


docimasia se llama prueba de dos colas (Figura 2.1C).

Figura 2.1: Posible ubicacin de la zona de rechazo de H0. A) A la derecha; B) A la


izquierda, y C) Ambos lados. = parmetro; 0=valor del parmetro y
Para concretar una decisin, es necesario encontrar un valor crtico

k = valor crtico.

k , que como se ve en la

Figura 2.1 es el valor del estadstico de prueba que separa la regin de aceptacin de la regin
de rechazo. Esto explica la importancia de conocer la distribucin del estadstico de prueba.
Este valor crtico por lo general se expresa en trminos de los estadsticos de prueba
derivados debido a la facilidad de encontrar el valor requerido usando las tablas de
probabilidad acumulada de las distribuciones de probabilidad que estos estadsticos siguen.
Como se observa en la Figura 2.1 y la Tabla 2.6 la cuanta del valor crtico depende, adems de
la distribucin de probabilidad, del valor de .
Tabla 2.6: Algunos valores crticos de Z usados en las pruebas de hiptesis.

El valor crtico del estadstico de prueba marca el punto de separacin de las zonas de
aceptacin y de rechazo de la hiptesis nula. En la figura 2.2 se muestra algunos de estos
valores cuando se somete a prueba la hiptesis nula = 0. Se seleccion como estadstico de
prueba a Z y el nivel de confianza especificado fue = 0.05.

Ing. Javier De la Hoz

Cmputos necesarios. Con los datos proporcionados por una muestra de tamao n se

calcula el estadstico de prueba. La mayora de las veces no se usa el estadstico de prueba


directamente sino alguna de sus formas equivalentes (Tabla 6.4), algunas de las cuales
requieren para su uso que tambin se calcule la desviacin estndar (s). La otra cantidad que
hay que cuantificar es el valor crtico el cual depende del nivel de significacin especificado y
de la distribucin probabilstica que siga el estadstico de prueba.

Decisin. En la ltima etapa en el procedimiento de prueba de hiptesis se debe tomar la

decisin de rechazar o no la hiptesis nula. Si el estadstico de prueba cae dentro de la regin


de rechazo, se considera que la diferencia entre el parmetro que se est docimando y el
estadstico de prueba es significativa y que la misma no puede atribuirse nicamente a las
variaciones aleatorias de las muestras, por lo tanto se rechaza la hiptesis nula y se declara
como falsa. Si por el contrario el estadstico de prueba se ubica en la zona de aceptacin se
considera que la diferencia entre el parmetro que se est docimando y el estadstico de
prueba es no significativa y que dicha diferencia es simplemente aleatoria, en consecuencia
se puede aceptar la hiptesis nula planteada. Aqu es necesario recordar que la decisin de
aceptar H0 es una forma corta de decir que no existe suficiente evidencia para rechazarla y
que en modo alguno se est concluyendo que la hiptesis nula es verdadera. Slo se est
aceptando temporalmente, hasta que se pruebe lo contrario.
Un aspecto importante, para la toma de una decisin esta relacionada con la escogencia del
nivel de significacin. Como hemos visto, los valores de son fijados previamente al clculo del
estadstico de prueba y usualmente los valores escogidos son 0.05 y 0.01. De modo que el
rechazo o la aceptacin de H0 dependen de que el estadstico de prueba se ubique o no dentro
de la regin de rechazo previamente definida. Sin embargo, un investigador puede tomar una
decisin diferente. Por ejemplo, si la probabilidad de ocurrencia de un estadstico de prueba es

muy cercana a la regin de rechazo, digamos que la P( ) = 0.0614, se debe aceptar H0 con un
= 0.05 si se acta estrictamente. Pero el investigador puede decidir rechazar H 0 puesto que la
probabilidad de cometer un error tipo I no aumento mucho, siempre y cuando quede explicito
en el informe de investigacin el valor del nivel de significacin usado. Actualmente, esta

Ing. Javier De la Hoz

forma de proceder es muy usada debido a la facilidad que ofrecen los paquetes estadsticos y
otros programas de aplicacin de calcular los valores de P para cualquier estadstico de prueba.
El p-valor o valor p es el mnimo nivel de significancia bajo la cual H 0 es rechazada.
Tenemos que

2.3 APLICACIONES
Ejemplo 2.1 Prueba de hiptesis acerca de la media poblacional cuando la muestra
proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de
muestra grande (n > 30).
Un entomlogo sospecha que en cierta zona endmica para el dengue el valor de la tasa neta
reproductiva (Ro) de una poblacin del mosquito Aedes aegypti vector de dicha enfermedad, ha
cambiado en relacin con el valor determinado hace 5 aos el cual era igual a 205 individuos.
Con tal propsito determin el valor de Ro a 40 hembras criadas en el laboratorio y
pertenecientes a una cepa desarrollada a partir de mosquitos capturados en la zona estudiada.
Los resultados fueron los siguientes:

El investigador sabe que la variable se distribuye normalmente y quiere someter a prueba su


hiptesis no queriendo equivocarse en ms del 5% de las veces.

SOLUCION:
a. Formulacin de hiptesis
Las hiptesis de investigacin son las siguientes:
Ho : La tasa neta de reproduccin no ha cambiado
H1 : La tasa neta de reproduccin de modific despus de cinco aos
Las hiptesis estadsticas

Ing. Javier De la Hoz

Ho : = 205
H1 : 205 (Analice porque la hiptesis alternativa es de diferencia)

b. Especificacin de un valor de probabilidad crtico o nivel de significacin.


El nivel de significacin especificado es = 0.05
c. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la variable se
distribuye normalmente con varianza desconocida y el tamao de la muestra es grande lo ms
conveniente es usar como estadstico a Z t (ver tabla 2.3)

x
s

d. Establecimiento de una zona de rechazo


Se trata de una prueba de dos colas, siendo la zona de rechazo la siguiente:

e. Cmputos necesarios.
e.1) Media: 202.9
e.2) Desviacin estndar: s = 36.17
e.3) Estadstico de prueba:

202,9 205
36,17

0,367

40
f. Decisin.
Como z = -0.367, el valor del estadstico de prueba se encuentra dentro de la zona de no
rechazo . Por lo tanto se concluye con una confianza del 95% que los datos no proporcionan
suficiente evidencia para rechazar Ho.

Ing. Javier De la Hoz

A la luz de la informacin proporcionada por la muestra, con un 95% de confianza la sospecha


del investigador de que la tasa de reproduccin de la poblacin de mosquito se haba
modificado no es cierta.

Ejemplo 2.2 Prueba de hiptesis acerca de la media poblacional cuando la muestra


proviene de una poblacin distribuida normalmente, con varianza desconocida y tamao de
muestra pequeo (n < 30).
Un ingeniero ambiental desea verificar si el contenido de nitrgeno en las hojas jvenes de la
especie Rhizophora mangle, es menor en las plantas que viven en una zona ambientalmente
protegida con relacin al de plantas que viven en una zona que est siendo afectada por la
contaminacin con fertilizantes y cuyo valor promedio se cuantific en 14.6 mg/g de nitrgeno.
El anlisis de 25 hojas jvenes provenientes de la zona protegida produjo los resultados
siguientes:

Si la concentracin de nitrgeno se distribuye normalmente, apoya la evidencia proporcionada


por la muestra la presuncin que las plantas de la zona protegida contienen menos nitrgeno?.
El error tipo I no debe ser mayor al 1%.

SOLUCION:
g. Formulacin de hiptesis
Las hiptesis de investigacin son las siguientes:
Ho : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es mayor
o igual en la zona protegida.
H1 : La concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle es menor
en la regin protegida.
Las hiptesis estadsticas
Ho : > 14.6

Ing. Javier De la Hoz

H1 : < 14.6
h. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.01
i. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es la media poblacional , y la
variable se distribuye normalmente con varianza desconocida y el tamao de la muestra
es pequeo lo ms conveniente es usar como estadstico de la t (ver tabla 2.3))

x
s

d. Establecer una zona de aceptacin para Ho.


Como H1: < o se trata de una prueba de una cola hacia la izquierda, siendo la zona de
aceptacin la siguiente:

ZA = {t / t > -t(1; n-1) }

e. Cmputos necesarios.
e.1) Media: x = 10.48
e.2) Desviacin estndar: s = 2.41
e.3) Estadstico de prueba:

10, 48 14, 6
2, 41

8,55

25
e.4) Zona de aceptacin:
ZA = {t / t > -t(; n-1) } = {t / t > -t(0.01; 24)} = {t/ t> -2.492}
f. Decisin.
Como t = - 8.55 < -t(0.01; 24) = -2.492 el valor del estadstico de prueba se encuentra
dentro de la zona de rechazo de Ho. Por lo tanto se concluye que los datos
proporcionan suficiente evidencia para rechazar Ho

De acuerdo a la informacin obtenida de la muestra se puede afirmar con un 99% de


confianza que la concentracin de nitrgeno en las hojas jvenes de Rhizophora mangle
en la regin ambientalmente protegida es menor al de la zona afectada.

Ejemplo 2.3 Prueba de hiptesis acerca de una proporcin


De una muestra aleatoria de 802 clientes de supermercados, suponga que 378 pagaron
sus artculos con tarjetas de crdito. Contrastar el nivel del 10%, la hiptesis nula de

Ing. Javier De la Hoz

que al menos la mitad de los compradores pagan sus artculos con tarjetas de crdito
frente a la alternativa de que la proporcin poblacional es menor de la mitad.

SOLUCION:
a. Formulacin de hiptesis
Sea la proporcin poblacional de compradores que pagan sus artculos con tarjetas de
crdito. Queremos probar la hiptesis
Las hiptesis estadsticas
Ho : > 0,5
H1 : <0,5
b. Especificacin de un valor de probabilidad crtico o nivel de significacin.
El nivel de significacin especificado es = 0.10
c. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es una proporcion lo ms
conveniente es utilizar como estadstico Z (ver tabla 2.4)

(1 )
n

d. Establecer una zona de rechazo para Ho.


H1 : p1 p2 > 0se trata de una prueba de una cola hacia la izquierda, siendo la zona
de rechazo la siguiente:

e. Cmputos necesarios.
e.1)

378
0, 471
802

e.2) Estadstico de prueba:

Z 1, 64

Ing. Javier De la Hoz

Entonces, como Z = -1,64 es menor que Z = -1,28, con una confianza del 90% al nivel de
se rechaza la hiptesis nula, lo que significa que la proporcin de compradores que
pagan sus artculos con tarjetas de crdito es menor a la mitad.

Ejemplo 2.4 Prueba de hiptesis para la diferencia de proporciones


Un rector de cierta universidad afirma que la proporcin de hombres que tienen auto
en el campus es mayor a la proporcin de mujeres que tienen auto. Un profesor de
estadstica se interesa en la afirmacin y entrevista aleatoriamente a 100 hombres y a
100 mujeres. Encuentra que 34 hombres y 27 mujeres tienen autos en el campus.
Puede concluirse con un nivel del 5% que la afirmacin del rector es falsa?

SOLUCION:
d. Formulacin de hiptesis
Sean p1 y p2 las proporciones poblacionales de hombres y mujeres, respectivamente,
que tienen auto en el campus. Entonces,
Las hiptesis estadsticas
Ho : p1 p2 0

H1 : p1 p2 > 0.

e. Especificacin de un valor de probabilidad crtico o nivel de significacin.


El nivel de significacin especificado es = 0.05
f. Eleccin de un estadstico de la muestra y de su distribucin.
Puesto que el parmetro involucrado en la docimasia es una diferencia de proporciones
lo mas conveniente es utilizar como estadstico Z(ver tabla 2.4)

p1 p2 p1 p2

p0 (1 p0 ) p0 (1 p0 ) donde

n1
n2

p0

n1 p1 n2 p2
n1 n2

d. Establecer una zona de aceptacin para Ho.


H1 : p1 p2 > 0se trata de una prueba de una cola hacia la dereha, siendo la zona de
aceptacin la siguiente:

ZA = {Z/ Z < Z() }


e. Cmputos necesarios.
e.1)

p1 = 0,34

Ing. Javier De la Hoz

p2 =0,27

p0 0,305

e.2) Estadstico de prueba:

0,34 0, 27

0,305(0, 695) 0,305(0, 695)

100
100

1, 075

e.4) Zona de aceptacin:

ZA = {Z/ Z < 1,64 }


Entonces, como
Z = 1, 075 es menor que Z = 1, 64, al nivel de significancia del 5%, no se rechaza la
hiptesis nula
de que la proporcin de hombres que tienen auto en el campus es menor o igual a la
proporcin de mujeres que tienen auto en el campus. Es decir, los datos muestran que
la afirmacin del rector es falsa.

Ing. Javier De la Hoz

You might also like