You are on page 1of 38

ESTADSTICA II

CLASE ||.- PRUEBA DE HIPTESIS


PRUEBA DE HIPTESIS DE UNA MUESTRA

Datzania Villao Burgos


datzaniavillao@gmail.com
Clase de hoy ( 26 de Enero del 2016)

Prueba de hiptesis de una muestra


(Introduccin)
Tipos de hiptesis
Mtodos para realizar pruebas de hiptesis.
Anlisis de CHI-CUADRADO
RESULTADO DE APRENDIZAJE

Realiza pruebas de hiptesis que


ayudan a confirmar y negar una
teora.
Que es una hiptesis
Declaracin relativa a una poblacin.

En el anlisis estadstico se establece una afirmacin,


una hiptesis, para lo cual se recogen datos que
posteriormente que se utilizan para probar la
asercin.

Afirmacin relativa a un parmetro de la poblacin


sujeta a verificacin.
Tipos de hiptesis
Hiptesis paramtricas
1.-Hiptesis sobre caractersticas paramtricas

Hiptesis no paramtricas
2.-Hiptesis sobre bondad de ajuste ( que tan bien se
ajusta una serie de datos a una distribucin normal,
binomial u otro tipo de distribucin).
3.-Hiptesis sobre dependencia entre dos variables.
( pruebas no paramtricas)
HIPTESIS PARAMTRICAS
La prueba de hiptesis comienza con una afirmacin sobre un parmetro
de la poblacin, proporcin, mediana o varianza.

Ej. La comisin mensual media de las comisiones de los vendedores de


tiendas del menudeo de aparatos electrnicos de Circuit City es de $
2000.

Para probar la validez de la afirmacin ( u= $2000) se debe seleccionar


una muestra de la poblacin de vendedores de aparatos electrnicos.

Una media muestral de $1000 para los vendedores de aparatos


electrnicos provocara con certeza el rechazo de la hiptesis
Prueba de hiptesis
Procedimiento basado en evidencia de la muestra y la teora de la
probabilidad para determinar si la hiptesis es una afirmacin
razonable.
Mtodos para la realizar prueba de hiptesis

Mtodo del intervalo


Mtodo del estadstico de
prueba
Mtodo utilizando el valor de P
Procedimiento para pruebas de hiptesis por intervalo
1.-
Se establece la hiptesis nula ( ) y la hiptesis alternativa ().
Hiptesis nula.- enunciado relativo al valor de un parmetro poblacional formulado con el fin
de probar evidencia numrica.
La hiptesis nula no se rechaza a menos que la informacin de la muestra ofrezca evidencia
convincente de que es falsa
no existe diferencia significativa
No es significativamente diferente de

Hiptesis alternativa.- afirmacin que se acepta si los datos de la muestra ofrecen suficiente
evidencia para rechazar la hiptesis nula. Tambin llamada hiptesis de la investigacin.
Ej. Un artculo reciente indic que el tiempo de uso medio de los aviones comerciales
estadounidense es de 15 aos.
= 15
2.- Se selecciona un nivel de significancia
Probabilidad de rechazar la hiptesis nula cuando es
verdadero.
Se representa por .
Aunque no existe un nivel de significancia que se aplique a
todas las pruebas, en general se utiliza el 0.05, 0.01, 0.10
cualquier otro nivel entre 0 y 1.

Error tipo I. rechazar la hiptesis nula , cuando es verdadera

Error tipo II. Aceptar la hiptesis nula cuando es falsa.


3.-Se
determina la desviacin estndar de la muestra.

4.-Determinar los valores del intervalo de confianza para el caso de una


prueba de dos colas.

+ z( s)
+ z( s)

5.- Tomar la decisin de rechazar o no la hiptesis nula. Se rechaza la hiptesis nula


solo si el valor observado de la media muestral esta fuera del intervalo encontrado. (
para prueba de dos colas. Para pruebas de dos colas, si el valor de la muestra es
menor o mayor que el valor determinado, se rechaza la hiptesis nula)
Ejemplo. PRUEBA DE HIPTESIS MTODO DEL INTERVALO

Un fabricante de llantas para automviles afirma que la duracin


promedio de determinado modelo de llanta en un coche de cierto
peso es de 40000 km bajo condiciones normales de manejo. Se
analiza una muestra aleatoria de 100 llantas de ese tipo bajo las
condiciones especificadas y se encuentra que la duracin
promedio fue de 39000 km con una desviacin estndar de 8500
km. Realice una prueba de hiptesis estadstica para decidir si la
afirmacin del fabricante es aceptable o nop.

1.-Se establece la hiptesis nula ( ) y la hiptesis alternativa ().
Ho: = 40000
H1: 40000

2.- Se selecciona un nivel de significancia

= 0.05 ( probabilidad de rechazar la hiptesis nula cuando


esta es verdadera)
3.-Se calcula la desviacin estndar


= == = 850

4.-Determinar los valores del intervalo de confianza para el caso


de una prueba de dos colas.

+ z( s) = 40000 + 1.96 ( 850) = 41666


+ z( s)= 40000 1.96 ( 850) = 38334
5.-tomar la decisin si rechazar o no la hiptesis nula
No se rechaza la hiptesis nula y se concluye que el promedio de
duracin de las llantas observado en la muestra es consistente con
la afirmacin del fabricante, lo cual quiere decir que si puede
afirmarse que la duracin promedio de este modelo de llanta es de
40000 km bajo condiciones normales de manejo en un automvil
de peso especificado.
Procedimiento para probar una hiptesis por el mtodo del estadstico de
prueba
1.-
Se establece la hiptesis nula ( ) y la hiptesis alternativa ().
Hiptesis nula.- enunciado relativo al valor de un parmetro poblacional formulado con el
fin de probar evidencia numrica.
La hiptesis nula no se rechaza a menos que la informacin de la muestra ofrezca evidencia
convincente de que es falsa
no existe diferencia significativa
No es significativamente diferente de

Hiptesis alternativa.- afirmacin que se acepta si los datos de la muestra ofrecen


suficiente evidencia para rechazar la hiptesis nula. Tambin llamada hiptesis de la
investigacin.
Ej. Un artculo reciente indic que el tiempo de uso medio de los aviones comerciales
estadounidense es de 15 aos.
= 15
2.- Se selecciona un nivel de significancia
Probabilidad de rechazar la hiptesis nula cuando es verdadero
Se representa por
Aunque no existe un nivel de significancia que se aplique a todas
las pruebas, en general se utiliza el 0.05, 0.01, 0.10 cualquier otro
nivel entre 0 y 1.

Error tipo I. rechazar la hiptesis nula , cuando es verdadera

Error tipo II. Aceptar la hiptesis nula cuando es falsa.


3.-Se selecciona el estadstico de prueba
Estadstico de prueba.- valor determinado a partir de la
informacin de la muestra para determinar si se rechaza la
hiptesis nula.

La prueba de hiptesis para la media , cuando se conoce ,


o el tamao de la muestra es grande, es el estadstico z que
se calcula de la siguiente manera.
Z=

=
4.- Se formula la regla de decisin

1.- El rea en que se acepta la hiptesis nula se localiza a la izquierda de 1.65.


2.-El rea de rechazo se encuentra a la derecha de 1.65
3.- Se aplica una prueba de una sola cola
4.- se eligi el nivel de significancia de 0.05
5.- La distribucin muestral del estadstico z tiene una distribucin normal.
6.- El valor 1.65 separa las regiones en que se rechaza la hiptesis nula y en la que se acepta
7.- El valor de 1.65 es el valor crtico.
Valor critico.- punto de divisin entre la regin en que se rechaza la hiptesis nula y aquella en la que se
acepta.
5.-Se toma una decisin
De acuerdo a la grfica anterior, si a partir de la informacin de la
muestra, se calcula que z tiene un valor de 2.34 , se rechaza la
hiptesis nula con un nivel de significancia de 0.05.
Ejemplo de mtodo usando el estadstico de prueba
Un fabricante de llantas para automvil afirma que la duracin
promedio de determinado modelo de llanta en un coche de cierto
peso es de 40000 km bajo condiciones normales de manejo. Se
analiza una muestra aleatoria de 100 llantas de ese tipo bajo las
condiciones especificadas y se encuentra que la duracin
promedio fue de 39000 km con una desviacin estndar de 8500
km. Pruebe la afirmacin del fabricante con un nivel de
significancia de 0.05.
1.- Plantear las hiptesis
Ho: = 40000
H1: 40000

2.- Nivel de significancia 0.05


3.- hallar el estadstico de prueba

z = = = -1.176
4.-Se formula la regla de decisin
5.- Tomar la decisin

No se rechaza la hiptesis nula porque es


estadstico de prueba cay en una zona de no
rechazo y se concluye que la afirmacin del
fabricante si tiene sustento. Es decir, s puede
afirmarse que la duracin promedio de este
modelo de llanta es de 40000 km.
PRUEBAS DE HIPTESIS NO PARAMTRICAS
Anlisis del estadstico Chi-cuadrado

Objetivo
1 Comprender las situaciones en las que chi-cuadrado es el
estadstico apropiado.
2 Uso de chi-cuadrado en una prueba de ajuste.
3 Uso de chi-cuadrado para determinar el grado de relacin entre
variables nominales).
4 Utilizar SPSS para calcular e interpretar chi cuadrado
Qu es chi-cuadrado?
La distribucin chi-cuadrado utiliza datos nominales tales como frecuencias dentro de categoras.
Muchas situaciones de negocios en el mundo real producen un conjunto de datos en los cuales se
encuentran categoras y frecuencias y el anlisis de chi cuadrado es muy comn y til.

Por ejemplo, los datos nominales pueden ser:

El nmero de personas que indican que una de tres marcas de pasta de dientes prefieren;
La membresa o no de un sindicato entre trabajadores tiempo completo y tiempo parcial;
Nmero de inversiones por categoras de inversin;
Diferentes categoras de respuestas hechas a una pregunta de una encuesta de investigacin de
mercado por parte de personas clasificadas por edad, sexo, clasificacin profesional o grupo de edad
y de ingresos;
vehculos registrados por el Departamento de Transporte, clasificados tales como autobuses,
vehculos livianos, vehculos pesados
Departamento de Inmigracin cuenta de los diferentes tipos de inmigrantes, tales como los residentes
que regresan a casa, con permiso de trabajo extranjera, los visitantes de negocios y turistas
Usos de chi-cuadrado

1.- Como una prueba de ajuste . cuando se nos dice qu tan bien una
distribucin observada se ajusta a una distribucin hipottica o
terica. Por ejemplo:
Algunas marcas de helados son mas preferidas que otras?
Son opciones en un pregunta con tres categoras en la respuesta
tales como "s", "no opina", "no", dividido en partes iguales, o hay
una preferencia significativa por una de las opciones?

2.- Para medir la relacin entre dos variables categoras, cada una de
las cuales se pueden dividir en dos o ms sub-categoras; por ejemplo,
la preferencia por tipo de msica (clsica, jazz, country y western,
rock) contra grupo de edad (por debajo de 21; 21-45; por encima de
45);
Ejemplo de prueba de ajuste con chi-cuadrado
Se desea probar la hiptesis de que la distribucin de opciones
de refresco es al azar, es decir, no hay una preferencia
significativa por cualquier bebida especfica.

Pregunta en la encuesta
Cul es su bebida favorita?
Pepsi
Coca cola
Sprite
Solo
H0= no hay diferencia significativa por alguna bebida especfica
H1= hay diferencia significativa por alguna bebida especfica
Procedimiento en Spss
1.- Analizar
2.-Pruebas no paramtricas
3.-Cuadros de dilogos antiguos
4.- Chi cuadrado
Resultados

Prueba de chi-cuadrado
Cul es su bebida favorita?

N observado N esperado Residual

pepsi 17 10,0 7,0

coca cola 11 10,0 1,0

sprite 7 10,0 -3,0

solo 5 10,0 -5,0

Total 40

Estadsticos de contraste
Cul es su bebida favorita?
Chi-cuadrado 8,400a
gl 3
Sig. asintt. 0,038

Interpretacin:
La columna residual muestra las diferencias entre las frecuencias observadas y esperadas.
El valor de chi cuadrado, sus grados de libertad y su significado se presentan en la segunda casilla.
Chi cuadrado es de 8,4, sus grados de libertad son 3 (es decir, 4-1) y su nivel de significacin es
0.038. Esta ltima cifra indica que hay una desviacin estadsticamente significativa de la
distribucin esperada de la igualdad ms all de p <0,05. Pepsi es la ms popular, mientras que Solo
y Sprite son mucho menos preferidas, es decir, no todas las bebidas son igualmente preferidas.
Por lo tanto, se rechaza la hiptesis nula de que no hay preferencias entre las bebidas y se acepta la
hiptesis alternativa de que si hay diferencias entre las preferencias en bebidas
Ejemplo para medir la relacin entre dos variables categricas

Se desea saber si existe una relacin entre el gnero de una persona y su


preferencia para fumar

H0= no hay relacin significativa entre genero y preferencia para


fumar
H1= hay una relacin significativa entre gnero y preferencia para
fumar
Preguntas en la encuesta
1.- genero
1.- masculino 2.-femenino
2.- Usted fuma?
1.-Si 2.- No
Resultados
Tabla de contingencia genero * usted fuma?
Recuento
usted fuma? Total
si no
masculino 12 10 22
genero
femenino 7 11 18
Total 19 21 40

Pruebas de chi-cuadrado
Valor gl Sig. asinttica Sig. exacta Sig. exacta
(bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson ,973a 1 0,324
Correccin por continuidadb ,447 1 ,504
Razn de verosimilitudes ,978 1 ,323
Estadstico exacto de Fisher ,360 ,252
Asociacin lineal por lineal ,949 1 ,330
N de casos vlidos 40
a. 0 casillas (0,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mnima esperada es 8,55.
b. Calculado slo para una tabla de 2x2.
Interpretacin de resultados
La siguiente tabla muestra el valor de chi cuadrado, sus grados de
libertad y su nivel de significacin. Chi cuadrado est en la lnea
denominada 'Pearson. El valor de chi cuadrado es 0.973. Sus
grados de libertad son 1 y su nivel de significancia es 0.324. Este
valor significa que no hay ninguna asociacin significativa entre
preferencia en fumar y su gnero (valor mayor a p < 0.05). Por lo
tanto no se rechaza la hiptesis nula
Thanks

You might also like