You are on page 1of 27

1.

Test de Hipotesis
Existen 3 tcnicas bsicas dentro de la inferencia estadstica clsica: 1. Estimacin puntual. 2. Estimacin por intervalos. 3. Test de hiptesis. Ya trabajamos con estimacin puntual y por intervalos. Hoy vamos a ver la aplicacin de los test de hipotesis, los cuales tambin nos ayudarn en nuestro objetivo ltimo, el cual es obtener conclusiones sobre determinados parmetros poblacionales.
Pablo M. Federico Clase 5

1. Test de Hipotesis
Un test de hiptesis puede ser entendido como un procedimiento estadstico simple cuya finalidad es corroborar o desmentir alguna afirmacin que se hace con relacin a un parmetro poblacional. En definitiva, es una regla de decisin sobre determinadas caractersticas de los parmetros poblacionales de nuestro inters. Recordemos entonces los principales elementos que se relacionan en la construccin de un test de hiptesis.

Hiptesis nula: Se llama as a una suposicin inicial sobre el parmetro poblacional bajo estudio que sirve para iniciar el procedimiento de prueba o verificacin. Generalmente se usa el smbolo H0 para denotar la hiptesis nula. Hiptesis alternativa: Es la hiptesis que se establece como alternativa de la hiptesis nula; si la H0 es rechazada, entonces ser la hiptesis alternativa la que se tomar tentativamente como vlida, y viceversa. Se usa el smbolo H1 o HA para denotar la hiptesis alternativa.
Pablo M. Federico Clase 5

1. Test de Hipotesis
Planteadas ambas hiptesis (H0 y H1), lo primordial al realizar el test es recordar que pueden darse 4 situaciones:

Los errores que pueden cometerse son Error de tipo I: Consiste en rechazar una hiptesis que es cierta y que, por lo tanto, debera haberse aceptado. Error de tipo II: Consiste en aceptar una hiptesis que es falsa y que, por lo tanto, debera haberse rechazado.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Un test de hiptesis debe ser construido de forma tal que la hiptesis nula sea o no rechazada. Se dice entonces que H0 es la hiptesis a ser probada. Sin embargo, con la inclusin de la hiptesis alternativa, puede ser mas descriptivo decir que probar una hiptesis estadstica es proporcionar una regla de decisin entre H0 y H1. Por ello, se debe ejercer una precaucin extrema al establecer las hiptesis nula y alternativa.
Recurramos a una analoga. En un proceso judicial, un acusado es inocente hasta que no se demuestre lo contrario. Si la hiptesis nula es inocente, entonces, con toda seguridad, la hiptesis alternativa es culpable. El rechazo de la hiptesis nula, implicara que el juicio ha sido capaz de proporcionar suficiente evidencia para garantizar un veredicto culpable. Por otro lado, si el juicio no presenta evidencia sustancial, el veredicto ser inocente. Esta decisin no implica necesariamente que el acusado sea inocente, ms bien hace nfasis en la falta de evidencia sustancial necesaria para condenar al acusado.
Pablo M. Federico Clase 5

1. Test de Hipotesis
Por lo tanto, en cierto sentido, un veredicto de culpabilidad ante un inocente (el rechazo de H0 cuando sta es verdadera) debe considerarse como una decisin ms fuerte que un veredicto de inocencia a un culpable (equivocarse al no rechazar H0 cuando es falsa), lo cual surge del principio judicial generalmente aceptado de que es peor condenar a una persona inocente que dejar libre a una culpable. Si el veredicto es culpable, se desear tener un grado muy alto de seguridad de que no se va a condenar a una persona inocente. Por lo tanto, en muchas situaciones, el error del tipo I se considera como un error mucho ms grave que el error de tipo II.

Pablo M. Federico

Clase 5

1. Test de Hipotesis

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Nivel de significacin de una prueba: Se llama as a la probabilidad mxima de cometer un error de tipo I. A dicha probabilidad se la suele denotar con la letra griega . Lo ms usual es que al principio uno establezca cul es el valor de que desea aplicar en la prueba. Es comn tomar los valores = 0,05 o bien = 0,01. A la probabilidad mxima de cometer un error de tipo II se le denota con la letra griega . Un test de hiptesis se llama bilateral (o de dos colas) cuando la hiptesis alternativa involucra el signo para el parmetro que se somete a prueba. Un test de hiptesis se llama unilateral (o de una cola) cuando la hiptesis alternativa involucra el signo < (test unilateral izquierdo) o bien el signo > (test unilateral derecho).
Pablo M. Federico Clase 5

1. Test de Hipotesis
A fin de realizar un test de hiptesis sobre un parmetro poblacional, es recomendable seguir los siguientes 5 pasos:

P1. Emitir una hiptesis nula (H0) relativa a algn parmetro de la poblacin. La hiptesis debe involucrar alguno de los signos =, o , pero no puede involucrar ninguno de los signos <, >, ni tampoco . P2. Especificar un nivel de significacin a emplear. Lo convencional es emplear los niveles del 5% ( = 0,05) o del 1% ( = 0,01). P3. Extraer de la poblacin una muestra aleatoria de tamao n, y calcular el estadstico de prueba apropiado (z, t, etc.). P4. Comparar el valor numrico obtenido para el estadstico de prueba con un valor tabulado (valor crtico -z*, t*, etc.-) de la distribucin estadstica terica correspondiente. P5. Decidir si se rechaza o no la hiptesis nula.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Veamos tres casos de tests para la media poblacional 1- Los paquetes de harina marca XYZ de medio kilogramo afirman contener en su etiqueta un contenido neto de 500 gr. Supongamos que deseamos evaluar dicha afirmacin a partir de nuestra creencia de que los paquetes contienen menor cantidad de harina. Para ello, se eligen al azar 50 paquetes y se los pesa con una balanza de precisin, obteniendo los siguientes datos muestrales: X = 492 gr. S = 34,4 gr. Planteamos entonces la hiptesis nula y alternativa: H0 : {m 500 gr.} H1 : {m < 500 gr.}. Para la realizacin del test, usaremos un nivel de significacin del = 0,05.
Pablo M. Federico Clase 5

1. Test de Hipotesis
Aunque desconocemos cmo se distribuye el peso de los paquetes, por tratarse de una muestra grande (n > 30) usaremos la distribucin normal estndar a fin de hallar nuestro valor crtico. Para un nivel de significacin de 0,05 la tabla correspondiente arroja un valor de z* = -1,645.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
El estadstico que utilizaremos es:

x m

n
Reemplazando en el mismo por los datos del ejercicio se obtiene que: z = (492 - 500) / (34,4 / 7,07) = -1,644 Dado que -1,645 < -1,6444 el valor calculado del estadstico de prueba no alcanza a caer en zona de rechazo. Por lo tanto, al nivel de significacin del 5% no se puede rechazar la hiptesis nula. Es decir, no existen argumentos para afirmar que los paquetes de harina XYZ contienen (en promedio) menos que lo anunciado en sus etiquetas.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
2- En cierto pas se estableci que hace 20 aos el promedio de vida de una persona era de 71,4 aos. Recientemente, se tom una muestra aleatoria de 100 muertes, y se obtuvo que: X = 73,8 aos. S = 9,8 aos. Se puede argumentar que actualmente la gente vive, en promedio, ms que hace 20 aos? Planteamos entonces la hiptesis nula y alternativa: H0 : {m 71,4 aos} H1 : {m > 71,4 aos}.

Para la realizacin del test, usaremos un nivel de significacin del =0,05.


Pablo M. Federico Clase 5

1. Test de Hipotesis
Para un nivel de significacin de 0,05 la tabla correspondiente arroja un valor de z* = 1,645. El estadstico que utilizaremos es, nuevamente:

x m

n Reemplazando en el mismo por los datos del ejercicio se obtiene que: z = (73,8 - 71,4) / (9,8 / 10) = 2,448
Dado que 2,448 > 1,645 el valor calculado del estadstico de prueba cae en zona de rechazo. Por lo tanto, al nivel de significacin del 5% se puede rechazar la hiptesis nula. Es decir, se rechaza H0 y se concluye que los resultados de la muestra son altamente significativos para argumentar que actualmente las personas viven, en promedio, ms que hace 20 aos.
Pablo M. Federico Clase 5

1. Test de Hipotesis
3- El departamento de seguridad de una fbrica desea saber si el tiempo promedio real que requiere un sereno para realizar su ronda nocturna es de 30 minutos. Se tom una muestra al azar de 32 rondas y el sereno promedi 30,8 minutos con una desviacin estndar de 1,7 minutos. X = 30,8 minutos. S = 1,7 minutos. Realicemos un test de hiptesis con = 0,01, que permita averiguar si hay evidencia suficiente para rechazar la hiptesis nula: H0: {m = 30 minutos} en favor de la hiptesis alternativa: H1: {m 30 minutos}
Pablo M. Federico Clase 5

1. Test de Hipotesis
A diferencia de los dos ejemplos anteriores, el test es un ensayo bilateral o a dos colas. Los valores de z crticos son aquellos con respectivas reas de 0,005 en sendas esquinas bajo la curva, es decir, z* 2.576. El estadstico de prueba es nuevamente: x m

Reemplazando en el mismo por los datos del ejercicio se obtiene que: z = (30,8 - 30) / (1,7 / 5,65) = 2,662 Este valor cae en zona de rechazo ya que es mayor que 2,576. Por lo tanto, se rechaza la hiptesis de que el tiempo promedio real que hace el sereno en sus rondas es de 30 minutos, en favor de la alternativa, por lo que concluimos que es muy probable que el sereno haga un tiempo promedio diferente a 30 minutos.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Al igual que en los casos de estimacin por intervalos, para muestras pequeas con varianza poblacional desconocida y poblacin supuestamente normal, se emplean las tablas de valores crticos de la distribucin t de Student con n1 grados de libertad.

Veamos un ejemplo. Supongamos que deseamos analizar el tiempo promedio para entregar pizzas en un barrio determinado ya que se cree que el responsable de la sucursal miente al decir que sus repartidores tardan, a lo sumo 40 minutos para cualquier entrega dentro de la zona de operaciones. Para realizar el test, se obtiene una muestra aleatoria de 10 pedidos de pizza (redondeados al minuto ms cercano): 38, 48, 37, 39, 46, 46, 43, 42, 44 y 40 minutos.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Si se supone distribucin normal y deseamos realizar el test de hiptesis con = 0,01, ensayaremos la hiptesis nula: H0:{m 40} contra la hiptesis alternativa H1:{m > 40} A partir de los datos, se sabe que: X = 42,3 minutos. S = 3,743 minutos. Reemplazando en el estadstico de prueba por los datos del ejercicio se obtiene que: t = (42,3 - 40) / (3,743 / 3,162) = 1,943 El valor crtico en la distribucin t de Student con = 10 1 = 9 grados es igual a 2,821. Como 1.943 es menor al t*, no se puede rechazar la afirmacin del responsable del local a un nivel de = 0,01.
Pablo M. Federico Clase 5

1. Test de Hipotesis
Supongamos que ahora deseamos realizar un test de hiptesis relativo a la varianza o la desviacin estndar poblacionales. Para ello, deberemos usar el estadstico de prueba llamado jicuadrado muestral, definido como sigue:

En un test unilateral a la derecha (o de cola derecha), la hiptesis nula ser: H0:{2 20} o bien H0:{2 = 20} y la hiptesis alternativa ser:H1:{2 > 20}
Para un nivel de significacin , la regin de rechazo se busca en tablas de la distribucin jicuadrada con = n 1 grados de libertad.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
En cambio, en un test unilateral a la izquierda (o de cola izquierda), la hiptesis nula es: H0:{2 20} o bien H0:{2 = 20}, y la hiptesis alternativa es: H1:{2 < 20}

Por ltimo, para un test bilateral (o de dos colas), se tiene:


H0:{2 = 20 },

y la hiptesis alternativa es: H1:{20 20}

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Veamos un ejemplo. Supongamos que estamos analizando el tiempo (en minutos) de espera de los clientes en la ventanilla de un banco. Antes de un curso de capacitacin para los empleados de atencin al pblico se saba que la desviacin estndar era 2,3 minutos. Luego del curso de capacitacin, el tiempo de espera de 10 clientes tomados al azar fue de: 1,8; 5,2; 4,3; 6,6; 2,5; 3,4; 2,6; 5,6; 4,7 y 4,0. Por lo tanto: H0:{2 (2,3)2} H1:{2 < (2,3)2} con = 0,05. Sirvi el curso de capacitacin para disminuir la varianza de los tiempos de espera?

Pablo M. Federico

Clase 5

1. Test de Hipotesis
De los datos muestrales, hallamos que S = 1,5166 minutos. A primera vista podramos sospechar que el curso s sirvi, pero veamos: el valor crtico para la distribucin jicuadrado con 9 grados de libertad es de 3,32. Si reemplazamos en el estadstico de prueba por los datos del ejercicio, obtendremos que: c =[9 . (1,5166)2 ] / 2,32 = 3,913 > 3,32 Por lo tanto, no existe suficiente evidencia estadstica en contra de la hiptesis H0, as que se concluye que probablemente el curso de capacitacin no sirvi para disminuir la varianza de manera perceptible (o significativa).

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Ejercicios Ej 1. Con el fin de estimar la rentabilidad diaria promedio del activo XXX se tom una muestra compuesta de 400 observaciones sobre sus precios de cierre, obtenindose los siguientes resultados: Rentabilidad promedio = 0.1563; Volatilidad muestral = 0.4795 Teniendo en cuenta las condiciones de mercado eficiente, se supone que las variables que componen la poblacin son independientes y todas con distribucin de probabilidades del tipo N(m, 2), siendo m y 2 desconocidos para el observador. a)Se pide construir el intervalo de confiabilidad para la rentabilidad diaria del activo XXX con un nivel de significacin del 90%.

b)La consultora A asegura a sus clientes que la rentabilidad diaria del activo XXX es en promedio 0.2, contra la opinin de la consultora B que asegura que la rentabilidad diaria promedio es menor que dicho valor. A partir de los resultados vistos, testear la hiptesis de la consultora A contra la de la consultora B con un nivel de significacin del 95%.
Pablo M. Federico Clase 5

1. Test de Hipotesis
c) La consultora A asegura a sus clientes que XXX tiene volatilidad y rentabilidad promedio diaria similar a YYY, contra la opinin de la consultora B que asegura que la rentabilidad diaria promedio de YYY es mayor que la de XXX. Con este fin se toma una muestra diaria de tamao 900 sobre las rentabilidades de YYY, obtenindose una rentabilidad diaria promedio igual a 0.1701 y una varianza de las rentabilidades diarias igual a 0.4924. Suponiendo que las variables que corresponden a las rentabilidades de YYY se distribuyen una normal N(m, 2), testear la hiptesis de la consultora A con un nivel de significacin del 90%.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Ej 2. Se tom una muestra de 15 observaciones sobre la evolucin de la accin ZZZ, cuyas rentabilidades son variables independientes con distribucin N(m, 2) de la que se obtuvo que la varianza de las rentabilidades es igual a 0.234. a) Se pide construir el intervalo de confianza para la volatilidad diaria de ZZZ con un nivel de significacin del 90%. b) La consultora A asegura a sus clientes que la volatilidad del activo ZZZ es igual a 0.17 contra la opinin de la consultora B que asegura que dicha volatilidad es mayor a 0.17. A partir de los resultados de la muestra, testear la hiptesis de la consultora A a un nivel de significacin del 95%.

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Ej 3. Se realiz un estudio para comparar el promedio del nmero de llamadas de emergencia a la policia por turno de 8 hs, en dos distritos de una ciudad. Se seleccionaron al azar muestras de los registros policiacos para cada una de las regiones, y se registro el numero de llamadas en cada turno. Las estadsticas muestrales son las siguientes: Regin 1 Tamao muestral 100 Regin 2 100

Media muestral
Varianza muestral

2.4
1.44

3.1
2.64

a) Verifique la hipotesis nula de que el promedio del numero de llamadas de emergencia por turno es igual en los dos distritos de la ciudad con una significacion del 5%
Pablo M. Federico Clase 5

1. Test de Hipotesis
Ej 5. Una agencia gubernamental recibe reclamos de algunos consumidores sobre ciertas botellas de amaretto vendidas por una empresa que contienen menos de los 20 grados de alcohol de producto publicados. Para verificar el reclamo de los consumidores, la agencia compra 9 botellas y encuentra que la media es de 18 grados y la desvicacin estndar de 3 grados. Como realizara el test esta agencia con un 5% de significacin?

Pablo M. Federico

Clase 5

1. Test de Hipotesis
Ej 6. Un gran comprador de lmparas de luz quiere decidir cual de dos marcas de igual precio va a comprar. Para ello, toma una muestra aleatoria de 100 lamparas de cada marca y encuentra que la marca A tiene una duracin media de 980 hs y un desvo estndar de la muestra de 80 hs. Para la marca B, la media es de 1010 hs y el devio estandar de 120 hs. Que marca debera comprar si quiere tomar la decision a un nivel de significacion del 5%? Y si el nivel de sifnificacion fuera del 1%?

Pablo M. Federico

Clase 5

You might also like