You are on page 1of 13

Pruebas de Hiptesis

Pedro J. Rodrguez Esquerdo pjrodriguez@uprrp.edu Departamento de Matemticas Universidad de Puerto Rico Recinto de Ro Piedras mayo de 2009

Contenido I.
A. B. C. D. E.
1. 2.

Pruebas de hiptesis ....................................................................................... 2


Premisas e hiptesis............................................................................................................ 2 Incertidumbre en las decisiones ......................................................................................... 2 Hiptesis nula y alternativa ................................................................................................ 3 Ejemplos .............................................................................................................................. 5 Tipos de error ...................................................................................................................... 6
Error tipo I.................................................................................................................................... 6 Error tipo II................................................................................................................................... 8

II. Pruebas de hiptesis para la media poblacional.............................................. 8


F. G. Valor p ............................................................................................................................... 13 Poder de la prueba............................................................................................................ 13

I.

Pruebas de hiptesis

A. Premisas e hiptesis
Con el fin de tomar alguna accin o decisin, en muchas ocasiones se parte de algunas premisas que son tomadas por ciertas mientras no se obtenga alguna evidencia o informacin que las contradiga. Por ejemplo, una persona arrestada y acusada de cometer algn delito es legalmente considerada inocente. Esto es as hasta el momento en que la evidencia presentada por la fiscala es considerada suficientemente fuerte para concluir, sin duda razonable, que la persona es en efecto culpable de cometer dicho crimen. Las premisas o hiptesis proveen una gua sobre qu tipo de comportamiento generalmente esperar. Se plantean las hiptesis sobre el comportamiento general del todo, de la poblacin, y mientras lo que se observa sea consistente con la premisa, no surge razn para cuestionarla. En estadsticas es de inters establecer y comprobar hiptesis sobre aquellos parmetros poblacionales que determinan o influyen en el comportamiento de lo que observamos. Las hiptesis estadsticas se establecen entonces para tomar decisiones sobre el valor de algn parmetro poblacional que denotaremos en general por la letra griega theta, . En la ciencia se parte de la premisa de que el experimento no resultar en lo que desea demostrar. Partir de premisas tal como: el tratamiento no es efectivo, no hay diferencia entre dos o ms tratamientos. Segn los datos observados en un experimento, que necesariamente contienen variabilidad, se toma la decisin de rechazar o no la premisa de la cual se parti. Si los datos observados llevan a la persona que investiga a rechazar la premisa de que, por ejemplo, el tratamiento no es efectivo, entonces ha demostrado que en efecto, el tratamiento es efectivo. En la ciencia social o natural las premisas o hiptesis planteadas forman parte de la metodologa de estudio de algn problema. Algunos ejemplos de premisas son: un maestro parte de la premisa de que el estudiante asiste al curso con el deseo de aprender; un electricista debe partir de la premisa de que la conexin elctrica que va a revisar est viva con corriente elctrica; la sociedad parte de la premisa de que una persona es inocente hasta tanto se pruebe lo contrario; dependiendo del lugar donde vivamos, podemos partir de la premisa de que la persona que maneja el otro vehculo en la interseccin respetar la seal de Pare o Alto; una investigadora parte de la premisa de que el nuevo medicamento no surtir efecto alguno; un siclogo parte de la premisa de que dos grupos de individuos sometidos a tratamientos distintos no mostrarn diferencias en su comportamiento. una persona que hace un experimento parte de la premisa de que no encontrar el resultado que desea.

B. Incertidumbre en las decisiones


Al partir de la premisa de que la conexin elctrica est viva, el electricista tomar las debidas precauciones para preservar su vida. Este usar una prueba sencilla para determinar de forma inequvoca si en efecto la conexin est viva. Luego de hacer esta determinacin podr trabajar con seguridad en la conexin.

Pruebas de Hiptesis

pgina 3

Sin embargo, el tomar una decisin sobre por ejemplo, la efectividad de un medicamento o sobre las diferencias de comportamiento de dos grupos, es una tarea un tanto ms compleja. Es poco comn obtener evidencia inequvoca de la efectividad del medicamento o diferencias entre los grupos, puesto que la reaccin o efecto no es idntico en todos los sujetos. Esta variabilidad implica que cualquier decisin que se tome sobre la efectividad del medicamento, sobre las diferencias, o sobre la premisa, necesariamente tendr elementos de incertidumbre. Medidas de peso, volumen, rea, concentracin, tiempo y otras mostrarn variabilidad cuando el mismo objeto se somete a medidas repetidas con el mismo instrumento. Esto se debe a que las respuestas de los individuos a los tratamientos y las medidas con instrumentos contienen elementos de variacin. Primero, un individuo puede reaccionar de forma distinta en distintas ocasiones, an ante el mismo estmulo. Segundo, aunque las reacciones pueden ser similares, los individuos no reaccionamos de forma idntica ante un estmulo particular. Tercero, los instrumentos tienen una precisin limitada. Finalmente, los individuos u objetos que participan del estudio son slo una muestra de la poblacin de todos los posibles individuos que podran potencialmente participar, lo cual aade variacin debido al muestreo. En esas ocasiones no observaremos evidencia inequvoca sobre el problema que intentamos resolver. Debemos entonces quedar satisfechos con decisiones que necesariamente contendrn una probabilidad pequea o controlada de ser errneas, pero que tienen una probabilidad grande de ser correctas.

C. Hiptesis nula y alternativa


Las hiptesis estadsticas son premisas sobre el parmetro de una poblacin tal como la media ( = ), mediana, proporcin ( = p) o varianza ( = 2) poblacionales. La premisa de la cual se parte sobre el valor del parmetro o parmetros de la poblacin se conoce como la hiptesis nula. Se le llama nula pues la misma generalmente indica, por ejemplo, que la media poblacional es cero, que no hay diferencia entre grupos en la poblacin, o que el tratamiento no es efectivo. La hiptesis nula se denota usualmente en smbolos por H0. El cero es un recordatorio que se parte de la premisa de que el efecto es nulo o que las diferencias entre los grupos es cero. Al hacer investigaciones es usual pensar en una hiptesis de investigacin, tal como: demostrar que el medicamento es efectivo; demostrar que hay una diferencia promedio significativa en la ejecucin en una prueba entre individuos que durmieron toda la noche e individuos que no durmieron, o que unas plantas tratadas con hormonas crecen en promedio ms que las plantas en el grupo control. Esta hiptesis, lo que el investigador desea demostrar sobre la poblacin, se conoce como la hiptesis alternativa y se denota por Ha. H0: premisa de la cual se parte sobre los parmetros poblacionales. La hiptesis nula generalmente tiene la forma H0: = 0, donde 0 es un nmero que denota un valor particular del parmetro . Ejemplos de hiptesis nulas son: H0: p = 0.75, H0: = 3.50, H0: 2 = 4.6, H0: px = py. Ha: aseveracin que se desea demostrar sobre los parmetros de la poblacin. La hiptesis alternativa generalmente tiene una de las formas Ha: > 0, Ha: < 0 o Ha: 0, dependiendo de lo que el investigador desea demostrar. Ejemplos de hiptesis alternativas son: Ha: p > 0.5, Ha: 2 < 6 o Ha: 0.

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 4

Lo que el investigador desea demostrar es parte de la hiptesis alternativa y no de la nula por varias razones. Una razn es que partir de una premisa contraria a lo que deseamos demostrar, y luego encontrar evidencia concreta que nos lleve a rechazarla es un argumento ms contundente que presumir que lo queremos demostrar es cierto, para luego encontrar evidencia que apoya nuestro reclamo. En este ltimo caso puede reclamarse que observamos esos resultados sencillamente porque de acuerdo con nuestra premisa, esperbamos que as fuera. Otra razn es que es podemos controlar matemticamente la probabilidad de cometer algunos tipos de error. Lgicamente hablando, el observar un resultado cnsono con la hiptesis nula no demuestra que es cierta, solo es evidencia a favor de que es cierta. Una persona coment que cierto tipo de fsil no existe, puesto que si existiera, ya alguien lo hubiera encontrado. Es muy difcil demostrar que algo no existe. Los mltiples intentos fallidos de encontrarlo son cnsonos con la hiptesis nula de que el fsil no existe, pues no se ha encontrado. Pero para demostrar que no existe sera necesario hacer una bsqueda exhaustiva de todo el planeta; lo que es esencialmente imposible. Por otro lado, el que una especie no haya dejado su huella fosilizada, no quiere decir que no haya existido. Seguramente hay una gran cantidad de especies de plantas y animales que existe o existi, que no dej huella en el record histrico. Si se encontrara un solo fsil del que se busca, es suficiente para demostrar la hiptesis alternativa, que el fsil existe. De la misma manera, es muy difcil demostrar la hiptesis nula de que una persona es inocente de algn cargo. Puede hacerse demostrando que no estaba presente durante ese periodo en la escena del crimen o demostrando que otra persona es verdaderamente culpable. Sin embargo, en la mayora de los casos eso es imposible de hacer. En estos, la evidencia que se presente a favor de la inocencia, tal como que la persona nunca haba cometido un crimen, que es pacfica, que va a la iglesia y muchas otras no demuestran la hiptesis nula de que la persona es inocente de lo que se le acusa. Esta es una de las razones por las cuales a las personas no se les requiere demostrar su inocencia, y se parte de la premisa de que lo es. Es el fiscal quien tiene la obligacin de demostrar la hiptesis alternativa de que la persona es culpable mas all de duda razonable. En la lgica matemtica, si una proposicin denotada por p se toma como la hiptesis nula H0 y la suponemos cierta, esperamos ver resultados experimentales denotados por q, tambin ciertos, que apoyen esa hiptesis nula. Esto es equivalente a la aseveracin p implica a q, la que se escribe p q. Si p es cierta, la implicacin p q es cierta solo cuando la proposicin q tambin es cierta. En resumen, si la hiptesis nula es cierta, entonces esperamos resultados experimentales q ciertos, dentro de lo que se esperara obtener. Esto se ve en la siguiente tabla, que define la relacin p q:
Tabla I-1 Tabla de veracidad para la implicacin p q

Tabla de verdad para p q p Cierto Cierto q Cierto Falso p q Cierto Falso

Falso Cierto Cierto

Falso Falso Cierto

Si p es cierta, para que la implicacin p q sea tambin cierta, la proposicin q necesariamente tiene que ser cierta. Algo distinto ocurre cuando se observa resultados experimentales q que contradicen la hiptesis nula. Suponga que la hiptesis nula H0 es cierta (la proposicin p se supone cierta), y que adems la implicacin p q tambin se supone cierta. Esto querra decir que se debe observar q, que la proposicin q debe ser cierta.

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 5

Pero si se parte de esas premisas y se hace un estudio donde se observe q; es decir, se observa que q es falso, se observa resultados contrarios a la prediccin de lo que se debiera observar, o que sera poco probable observar cuando la hiptesis nula (p) y la implicacin p q son ciertas. qu decisin se debe tomar entonces sobre p y sobre p q ? Ese resultado observado q es evidencia en contra de la hiptesis nula. En este caso se ha demostrado que la implicacin p q es probablemente falsa, que en este caso, la proposicin p cierta probablemente no implica que la proposicin q tiene que ser tambin cierta. A diferencia de la matemtica, la estadstica necesariamente incluye elementos de incertidumbre. Por esta razn, observar q no es muestra inequvoca de que la implicacin es falsa, sino que puede haberse obtenido ese resultado por operacin del azar, cometindose entonces un error tipo I.

D. Ejemplos
1. Un grupo de consumidores desea verificar el reclamo en la etiqueta de una marca de refrescos en botella. La etiqueta indica que la botella contiene 1 litro del refresco. Los consumidores creen que en promedio, las botellas contienen menos de 1 litro. H0: = 1 litro Ha: < 1 litro

La hiptesis nula es que la cantidad media de refresco en las botellas es (mayor o) o igual a un litro, pues es el reclamo en la etiqueta y los consumidores an no tienen evidencia para descartarla. La alternativa es que en promedio, las botellas contienen menos de 1 litro, pues el consumidor quiere proteger su dinero y no ser engaado. Ciertamente no protestar si el contenido promedio es mayor de un litro. 2. Por aos, un agricultor de Lares ha estado usando abono orgnico para cultivar el caf en su finca de 200 cuerdas. Su finca produce un promedio de 620 libras de caf por cuerda. Un comerciante le ofrece un abono qumico con la promesa de que producir ms de 650 libras de caf por cuerda. Si es cierto lo que dice el comerciante, el agricultor usar el nuevo abono. Por esto decide probarlo y selecciona 30 lotes de una cuerda cada uno. Las hiptesis de inters son: H0: = 650 libras por cuerda Ha: > 650 libras por cuerda

La hiptesis nula es que la cantidad media de libras de caf por cuerda producido por el nuevo abono es menor o igual a 650 libras. El agricultor parte de la premisa de que no dejar de usar el abono que ha usado por aos, a menos que demuestre que el nuevo producir un promedio de ms de 650 libras, lo que debe dejarle ms ganancia. 3. Se desea conocer si la proporcin de empleados de gobierno que son hombre ph, es distinta a la proporcin de empleados de gobierno que son mujer pm. Se selecciona una muestra aleatoria de 1,000 empleados del gobierno y se determina el sexo de cada sujeto. Las hiptesis de inters son: H0: ph = pm Ha: ph pm

La hiptesis nula es que la proporcin de hombres es igual a la proporcin de mujeres empleados en el gobierno. Como no hay evidencia en direccin alguna sobre las proporciones, se parte de la premisa de que son iguales, que no hay diferencia. Lo que desea conocer es si estas proporciones son distintas, no si una proporcin particular es mayor que la otra.

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 6

En el caso de una poblacin, es comn hacer pruebas de hiptesis para parmetros tal como la media poblacional , la correlacin poblacional , o la varianza poblacional 2. Por ejemplo, si se quiere demostrar que la media es mayor que un nmero fijo 0, es decir, la hiptesis alternativa es Ha: > 0, se parte de la hiptesis nula de que la media poblacional es menor o igual a = 0. La siguiente tabla muestra 0. Esta hiptesis nula, por razones matemticas1 se escribe H0: algunos ejemplos de hiptesis nula y alternativa para algunos parmetros. Tabla I-2 Ejemplos de hiptesis nula y alternativa Ejemplos de hiptesis nula y alternativa Media : Una poblacin 0 es un nmero fijo conocido. Media : Dos poblaciones Varianza 2: Una poblacin 20 es un nmero fijo conocido. Varianza 2: Dos poblaciones Correlacin : Una poblacin 0 es un nmero conocido H0: =
0

H0:

H0:

20

H0:

2x

2Y

H0: = 0

Ha: > 0 Ha: < 0 Ha: 0 Ha: x > y Ha: x < y Ha: x y Ha: 2 > 20 Ha: 2 < 20 Ha: 2 20 Ha: 2x > 2Y Ha: 2x < 2Y Ha: 2x 2Y Ha: > 0 Ha: < 0 Ha: 0

E. Tipos de error
Luego de disear el experimento, obtener datos y analizarlos, el investigador debe usar los resultados observados para tomar una decisin sobre sus hiptesis. Si se observa datos contrarios a la hiptesis nula, la decisin debe ser la de rechazarla a favor de la hiptesis alternativa. En el caso en que no se haya observado evidencia suficientemente fuerte en contra de la hiptesis nula, la decisin ser la de no rechazarla. La decisin tomada debe ser fiel expresin de los datos observados. Idealmente los datos y por lo tanto, la decisin tomada, deben reflejar y ser cnsonas con la realidad poblacional desconocida. Sin embargo esto no siempre ocurre, an en el experimento, encuesta o estudio mejor diseado y realizado. Las medidas que se tomen siempre muestran variabilidad, pues los instrumentos tienen precisin finita. Adems se introduce variabilidad al tomar una muestral. Por lo tanto, es posible que por mero accidente aleatorio, la muestra no refleje fielmente la poblacin. Por estas razones, al tomar cualquier decisin, siempre existe siempre la posibilidad de cometer algn tipo de error estadstico.

1. Error tipo I
La realidad poblacional tiene slo uno de dos posibles estados: la hiptesis nula es cierta; o la hiptesis nula es falsa. Si la hiptesis nula es cierta no debe ser rechazada a favor de la hiptesis alternativa. En el caso en que sea falsa debe ser rechazada a favor de la alternativa.
Las pruebas que usualmente se usan son ptimas cuando se presume que el parmetro es igual a un nmero. Vase Teorema de Neyman Pearson, DeGroot, estadsticas
1

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 7

Sin embargo, los datos contienen necesariamente elementos de variacin pues generalmente provienen de una muestra que puede ser o no representativa, los instrumentos de medicin tienen una precisin limitada y los materiales usados pueden cambiar por distintos factores tal como la humedad del aire, temperatura, manejo o reaccin con otros materiales. Una muestra, an tomada cientficamente siempre tendr una pequea probabilidad de no reflejar la realidad poblacional. An habiendo usado una metodologa cientfica para tomar la mejor muestra posible, obtenido datos con muy poco error experimental, y tomado una decisin cnsona a los datos observados, es posible que se cometa el error de tomar la decisin de rechazar la hiptesis nula an siendo cierta. Este tipo de error se conoce como error tipo I. La probabilidad de cometer un error tipo I se puede controlar y reducir, pero slo se puede eliminar si nunca se toma la decisin de rechazar la hiptesis nula. Esta ltima situacin no es deseable ya que llevara a nunca descartar premisa alguna, no importa cun irracional sea la misma o cunto los datos obtenidos contradigan esa premisa. El investigador es conservador cuando selecciona una probabilidad muy pequea de cometer error tipo I, pues slo rechazar el status quo, la hiptesis nula, si obtiene evidencia muy contundente en contra de esta hiptesis. La probabilidad mxima de cometer error tipo I se conoce como la significancia de la prueba y se denota usualmente por la letra griega alfa, . La probabilidad de cometer error tipo I se escribe de la siguiente manera: = Prob( Rechazar H0 | H0 es cierta). Los valores de uso ms comn para la significancia de una prueba son 0.01, 0.05 y 0.10. La significancia es en ocasiones presentada como un por ciento, tal como 1%, 5% o 10%. Esto quiere decir que con el fin de adelantar la ciencia, el investigador est dispuesto a permitir una probabilidad de 0.01, 0.05, o 0.10 de rechazar la hiptesis nula cuando es cierta, o de cometer un error tipo I. El valor de la significancia es seleccionado antes de comenzar a hacer el experimento en una de varias formas. El valor de puede estar dictado por el uso y costumbre de la disciplina, por ejemplo, de los artculos que se publican en revistas cientficas. Otra forma de seleccionarlo es que sencillamente sea impuesto por la persona o compaa para la cual se trabaja y que son quienes pagan el salario de los investigadores. Finalmente, puede ser seleccionado tomando en cuenta el costo de cometer un error tipo I. Mientras ms alto el costo, ms pequea debe ser la probabilidad de cometer error tipo I. El valor usual de en las ciencias naturales y sociales es de 0.05. La probabilidad de error tipo I no puede ser igual a cero ya que si se desea = 0, nunca se podra tomar la decisin de rechazar la hiptesis nula. Siempre que se tome la decisin de rechazar la hiptesis nula, ya que la decisin se basa en una muestra y no en la poblacin, existe una probabilidad positiva de cometer un error tipo I. Como ilustracin se puede pensar en la situacin en que un individuo es acusado de cometer un delito. La hiptesis nula en este caso es H0: la persona es inocente, la alternativa es Ha: la persona es culpable. Ocurre un error tipo I cuando la evidencia muestra que el individuo es culpable cuando es realmente inocente. La sociedad entiende que esta situacin es insostenible y aunque no se cuantifica, la probabilidad de error tipo I en estos casos debe ser muy pequea. Esta es una de las razones por la cual a un acusado, al igual que a todos nosotros, nos asisten muchos derechos.

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 8

La nica forma en que se puede eliminar toda posibilidad de enviar una persona inocente a la crcel es nunca rechazando la hiptesis nula, es decir, no importa la calidad y cantidad de la evidencia, ni la severidad del delito del que se le acusa, nunca se descarta la inocencia de la persona. En esta situacin nadie ira a la crcel, no importa lo que hubiera hecho. Claro, esto tendra algunos beneficios para la sociedad, por ejemplo, no existiran crceles, jueces ni fiscales, los legisladores no tendran que ocupar parte de su tiempo en revisar o redactar un cdigo penal, y la polica se usara para otras funciones. Pero nunca encontrar culpable a una persona tiene un costo que puede ser mucho ms alto que los beneficios. Las personas podran cometer cualquier tipo de fechora impunemente.

2. Error tipo II
En el caso en que la hiptesis nula sea falsa, cuando el valor del parmetro es consistente con la hiptesis alternativa, puede surgir la situacin de que los datos obtenidos llevan al investigador a no rechazarla, cometiendo entonces un error tipo II. Usualmente no se controla este tipo de error directamente. El Lema de Neyman-Pearson2 dice que una vez se decide el nivel de error tipo I aceptable para el problema, la probabilidad de cometer error tipo II asume su valor mnimo al usar las pruebas estadsticas que se estudian aqu. Este valor mnimo no es cero e incluso puede ser considerado muy alto por algunos. Es usual denotar la probabilidad de error tipo II por la letra griega . Entonces P(error tipo II) =

= P( No rechazar H0 | H0 es falsa).

Tabla I-3 Resumen de los tipos de error estadsticos Estado de la realidad H0 es cierta H0 es falsa Decisin correcta Error tipo I: Decisin correcta Error tipo II:

Decisin tomada

Rechaza H0 No rechaza H0

La cantidad () = 1 - se conoce como el poder de la prueba, concepto que se esturar ms adelante, es funcin del valor del parmetro desconocido , sin limitarse a valores de que hacen la hiptesis nula cierta o falsa.. El poder de la prueba es la probabilidad de rechazar H0, cuando en realidad debe ser rechazada, lo que representa una situacin deseada. Idealmente se quiere tener pruebas cuyo poder sea alto. As el poder de la prueba se escribe: () = 1

= P( Rechazar H0 | ).

II.

Pruebas de hiptesis para la media poblacional

Un estudio publicado en una revista profesional indica que la media del largo de las hojas adultas del rbol de Jobos es de 10 centmetros. El estudio tambin indica que la varianza del largo de esas hojas es de 1 centmetro. Un bilogo sospecha que por condiciones de clima y terreno particulares, las hojas del rbol de Jobos que crece en un bosque hmedo cercano son ms largas en promedio que lo indicado en el estudio. Sin embargo, el bilogo no tiene razn para creer que la variabilidad del largo sea distinta a la indicada en el estudio, por lo que supone que an para los

Vase la discusin en 6.1 de Bickel, Peter J. y Kjell Doksum, Mathematical Statistics: Basic Ideas and Selected Topics, Holden.Day, Inc., San Francisco 1977.
2

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 9

rboles que desea estudiar, la varianza poblacional estudio publicado.

es conocida e igual a 2 cm., igual que en el

Ya que no cuenta con evidencia al contrario, el bilogo parte de la premisa de que la media poblacional de las hojas de los rboles que desea estudiar en idntica al valor publicado en el estudio, = 10, es decir la media de las hojas de sus rboles no es distinta a la publicada. As desea comprobar las siguientes hiptesis: H0: = 10 cm. contra la hiptesis alternativa Ha: > 10 cm.

Para llevar a cabo este anlisis el bilogo selecciona 20 hojas de estos rboles en la misma manera en que se seleccionaron para el estudio publicado. Luego mide su largo y calcula la media de esa muestra de largos. Ya que la media muestral es un excelente estimador de la media poblacional del largo de las hojas de los rboles que le interesan y es la nica informacin que posee, debe comparar esa media obtenida de la muestra , con la media poblacional presumida de 10 centmetros. En realidad el bilogo desea rechazar su hiptesis nula a favor de la alternativa, lo cual demostrar su sospecha. Pero esta decisin depender exclusivamente de los datos que obtuvo. Si la hiptesis nula H0 es cierta, la media muestral tendr un valor cercano a = 10, aunque por la variabilidad natural de la naturaleza, por contar con una muestra y porque los instrumentos tienen una precisin fija, este valor calculado de sus datos puede ser un poco mayor de 10 o incluso menor de 10. Un valor observado de la media muestral mayor de 10 centmetros le dar alguna evidencia, que puede ser no muy contundente, para concluir que la media poblacional del largo de las hojas en ese lugar es mayor de 10 cm. En el caso en que la media muestral resulte ser menor de 10 cm. nunca podr descartar la hiptesis nula, ya que la alternativa slo incluye la posibilidad de que la media del largo de las hojas de la poblacin de rboles en el bosque hmedo sea mayor de 10 cm. Ahora, cunto mayor de 10 debe ser , el valor de la media muestral para concluir que la media poblacional del largo de la hojas en ese lugar es mayor de 10 cm.? Si presume que el largo de las hojas tiene una distribucin normal como en el estudio, y si la media poblacional es realmente 10, ya que la distribucin normal es simtrica alrededor de su media, la mitad de las veces observar valores de la media de la muestral que son mayores de 10. Es decir, an si la hiptesis nula es cierta, es muy comn observar datos con una media mayor de 10. El bilogo slo rechazar la hiptesis nula en el caso que el valor calculado de sea suficientemente mayor de 10 cm. Equivalentemente, para rechazar la hiptesis nula, debe ser mayor que un nmero seleccionado w que a su vez es suficientemente mayor de 10. As el bilogo rechazar H0 si de sus datos, encuentra que > w > 10. Para encontrar el valor de w, el bilogo deber seleccionar la significancia de la prueba, es decir, la probabilidad de error tipo I que es aceptable para su trabajo, y utilizar una tabla de la distribucin estadstica apropiada, en este caso, la distribucin normal. El bilogo lleva a cabo el estudio y obtiene un valor de la media muestral para el largo de las 20 hojas igual a 10.2 cm. Una diferencia de 2 dcimas de 1 centmetro en el largo promedio de las hojas parece ser muy pequea, lo que posiblemente inclinara inicialmente al investigador a no rechazar H0. Pero se debe adelantar, pues la comparacin tiene que tomar en cuenta la variabilidad de los datos. Por ejemplo, si la varianza fuera muy pequea y la hiptesis nula cierta, todas las hojas tendran esencialmente el mismo largo por lo que sera extremadamente raro observar hojas que
2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 10

tuvieran un largo mucho mayor (o mucho menor) que 10 cm. En esta situacin sera adems mucho ms raro observar un valor de X mayor de 10cm. pues el error estndar de la media muestral es mucho menor que la desviacin estndar de cualquier dato particular. En el caso de que sea igual a 10.2 cm., y si hay poca variabilidad, lo ms seguro es que se rechazara la hiptesis nula de que el largo promedio de las hojas es 10 cm. a favor de la alternativa de que el largo promedio es mayor de 10 cm. En el caso en que la varianza de los datos fuera muy grande y la hiptesis nula cierta, se podra observar hojas con una gran variedad de largos, por lo que obtener una media para el largo de 100 hojas mayor o igual a 10.2 sera un evento bastante comn. En esta situacin posiblemente no se rechazara la hiptesis nula. La Grfica II-1 muestra el significado que tiene el observar un valor de igual a 10.2 cm., an cuando ambas distribuciones tienen la misma media poblacional segn la hiptesis nula, = 10.2, y segn las premisas o informacin previas sobre la varianza poblacional. Si la varianza poblacional es 2 = 0.01, la distribucin N(10, ) muestra poca variabilidad, por lo que observar un valor de igual o mayor a 10.2 cm. es un evento muy raro, tal como ilustra el rea azul a la derecha del valor 10.2. El rea bajo esa curva de densidad a la derecha de 10.2 es muy pequea en comparacin con el rea bajo la densidad de una distribucin normal con varianza poblacional 2 = 0.04., ilustrada por el rea en rojo en la grfica de abajo. En esta ltima, la probabilidad de observar valores mayores que 10.2 es mucho ms alta. Grfica II-1 Comparacin de dos distribuciones normales con distinta varianza

Para realizar esta comparacin es necesario estandarizar el valor de , con los que se obtiene un nuevo valor que representa un mltiplo del error estndar, indicando el nmero de errores estndar a los que se encuentra de su media . Luego de estandarizar, al realizar la prueba, ya no es necesario comparar el valor obtenido de con w, sino se compara el valor estandarizado de con el valor z obtenido de la tabla de la distribucin normal estndar para el nivel de significancia deseado, 100%. El valor z representa un nmero real tal que el rea a su derecha bajo la distribucin normal estndar es igual a ; es decir, el valor z cumple con la ecuacin P( Z > z ) = , donde Z es una variable aleatoria estndar normal y es un nmero entre 0 y 1. Ese valor es un nmero

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 11

usualmente pequeo que representa el nivel de significancia preseleccionado por el investigador. Por ejemplo, si la significancia deseada es 2.5%, entonces = 0.025 y z.025.= 1.96. La definicin de probabilidad de error tipo I, , se utiliza para obtener una estadstica prueba que permite efectuar esta prueba de hiptesis con el nivel de significancia deseado: P(error tipo I= = P( Rechazar H0 | H0 es cierta) = P( >w| = 10).

Se parte de esta ecuacin y se estandariza la media muestral

para obtener :

Figura II-1 Probabilidad de error tipo I,

La estadstica prueba, que se obtiene de las ecuaciones anteriores es

. Si los datos

no tuvieran una distribucin normal, pero la cantidad de datos es grande3, Z tendr una distribucin aproximadamente normal estndar. La ltima igualdad en el desarrollo anterior se obtiene al usar la propiedad de que el rea a la derecha de z bajo la distribucin normal estndar es igual a y notar que esa probabilidad es la probabilidad de que una variable aleatoria Z con distribucin (aproximada) normal estndar sea mayor que es nmero z, es decir , o equivalentemente. P(Z > z) = . de Alternativamente, si se desea, se puede calcular el valor w con el cual se comparara el valor para efectuar la prueba. El valor de w se obtiene al resolver la ecuacin por w, de Debe notarse que el valor de w es mayor que la media propuesta en la

donde

El tamao de muestra suficientemente grande para que la aproximacin normal a la distribucin de la media de la muestra, sea buena no es un nmero fijo. En muchos casos, y dependiendo de la precisin que se desee, si los datos provienen de medidas de una variable continua, n = 30 puede ser suficientemente bueno. Por otro lado, si los datos originales provienen de observaciones de una variable discreta, podra requerirse un nmero mucho mayor que 30.
3

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 12

hiptesis nula de 10. Esto ltimo no es necesario pues solo basta comparar el valor de la estadstica prueba Z con el valor correspondiente de z, o equivalentemente, el valor p de la prueba con la significancia. El procedimiento de prueba es el de calcular el valor de Z y compararlo con z. Se rechaza la hiptesis nula H0 al nivel de significancia preseleccionado si Z > z . Para esta hiptesis alterna, el conjunto de valores reales Z mayores que z , es decir { Z; Z > z }, se conoce como la zona de rechazo o regin crtica de la prueba. La zona de rechazo depende directamente de la hiptesis alternativa. La estadstica prueba se aplica ahora al presente problema. Segn el estudio realizado por el bilogo, los valores que deben ser usados son: = 10,
2

= 2, n = 20,

= 0.05 y

= 10.2.

Los valores obtenidos del estudio son sustituidos en la estadstica prueba y se obtiene que

Este resultado quiere decir que la media obtenida en la muestra se encuentra a 0.632 errores estndar a la derecha de = 10. An se debe comparar el valor obtenido de z con z con el fin de tomar la decisin. Como la hiptesis alternativa es Ha: > 10, se rechaza H0 si es suficientemente ms grande que = 10; o equivalentemente, si el valor obtenido de la estadstica prueba z es suficientemente mayor que z . De la tabla de la distribucin normal estndar se obtiene que z.05 = 1.645. Por lo tanto, al nivel de significancia del 0.05, o del 5%, se rechaza la hiptesis nula H0: = 10 cm. a favor de la hiptesis alternativa Ha: > 10 cm. si el valor estandarizado de x se encuentra a ms de 1.645 errores estndar de = 10. En este caso, como la hiptesis alternativa es que la media de la poblacin de hojas de los rboles en el bosque hmedo es mayor de 10, esto equivale a rechazar H0 a favor de Ha si el valor obtenido para Figura II-2 Comparacin del valor obtenido de la es suficientemente mayor que 10.
estadstica prueba con el valor crtico

Como en esta situacin z = 0.632 es un valor menor que z.05 = 1.645, no se puede rechazar la hiptesis nula al nivel de significancia del 5%. A pesar de que = 10.2 es mayor que 10, es necesario concluir que no es significativamente mayor que 10 al nivel de significancia del 5%. Del estudio no se obtuvo evidencia suficientemente contundente en contra de la hiptesis nula, por lo cual no se puede descartar que la media poblacional del largo de las hojas de Jobos en el bosque hmedo es mayor de 10 cm. Este resultado dice que muy

2005-2009 PJ Rodrguez Esquerdo

Pruebas de Hiptesis

pgina 13

probablemente el valor observado de = 10.2 respondi a la mera operacin del azar y no a que verdaderamente las hojas de los rboles en el bosque hmedo tengan una media poblacional mayor de 10 cm.

F.

Valor p

Hay otra manera de efectuar esta prueba estadstica, la cual es usada cada vez con ms frecuencia en la literatura cientfica. Partiendo de la premisa que H0 es cierta, el bilogo puede tomar la decisin de rechazar o no la hiptesis nula H0 examinando si valores tan extremos de como el observado ocurren con una probabilidad muy pequea. Si la hiptesis nula se presume cierta, mientras ms pequea sea esa probabilidad, ms raro debe ser el obtener valores de como el obtenido y ms slida ser la evidencia para rechazar la hiptesis nula. La probabilidad de observar valores tan extremos como el observado si la hiptesis nula es cierta se conoce como el valor p de la prueba. El valor p depende directamente de la hiptesis alternativa. En el ejemplo del largo promedio de las hojas, la hiptesis alternativa es Ha: > 10. Por lo tanto, el valor p en este caso se encuentra al obtener la probabilidad de que si se hiciera el estudio nuevamente se obtuviera un valor de la estadstica prueba Z mayor que z = 0.632, es decir, Valor p = P ( Z > 0.632 ) = 0.2643. Este resultado se ilustra por el rea bajo la curva a la derecha de 0.632 y sombreada en rojo, que se extiende e incluye el rea sombreada en azul. Esto quiere decir que si la hiptesis nula es cierta, se observara un valor de Z tan grande o ms como el obtenido ms del 26% de las veces que se repitiera el estudio. Partiendo de la premisa de que la hiptesis nula es cierta, este evento ocurre muy comnmente y es consistente con la hiptesis nula, por lo cual no se rechazara. Cun pequeo debe ser el valor p para decidir entonces rechazar la hiptesis nula? En este caso es necesario comparar el valor p con una significancia que puede ser seleccionada luego de hacer la prueba. Se rechaza H0 si al suponer que es cierta, el evento que observamos es lo suficientemente raro. As se rechaza H0 para valores pequeos del valor p. Por otro lado, la significancia es la probabilidad de error tipo I ms pequea que se est dispuesto a permitir. Esto quiere decir que se rechaza la hiptesis nula si el valor p es menor que la significancia deseada.
Figura II-3 Valor p de la prueba

G. Poder de la prueba

2005-2009 PJ Rodrguez Esquerdo

You might also like