You are on page 1of 34

PRUEBA JI CUADRADA.

INTRODUCCION

•Hasta ahora hemos realizado pruebas de hipótesis acerca de los


parámetros poblacionales μ,σ2,ρ, utilizando mayormente datos
cuantitativos. Los métodos que veremos se relacionan mas con datos
cualitativos por lo que el análisis se basa en conteos, categorías, según
sea el caso de estudio.
•Utilizamos tablas de contingencia del tipo r x c (filas por columnas) para
aplicar los métodos que a continuación enunciaremos. Los mismos que
siempre suponen una hipótesis nula H0 y una alternativa H1 , la que se
utiliza para afirmar o negar la hipótesis nula H0 .
• A continuación veremos :

1. PRUEBA DE BONDAD DE AJUSTE.


2. PRUEBA DE INDEPENDENCIA.
3. PRUEBA DE HOMOGENEIDAD.
4. PRUEBA DE PROPORCIONES.
En estas pruebas, generalmente se usa categorías y se define las
frecuencias observadas (Oi) en la muestra y luego se compara con las
frecuencias que se esperarían (e1) , si fueran en realidad verdaderas, bajo
las condiciones hipotéticas de H0.

Oi ei
F. OBSERVADAS e1 <- H0 (Verdadero)
F. ESPERADAS
Si la diferencia entre las frecuencias observadas y esperadas es demasiada
grande, para atribuirlas a la casualidad; cuando la hipótesis nula H0 es
verdadera, la rechazamos, cuando:
(Oi - ei)  ∞ (Conduce al rechazo)
(Oi - ei)  0 (Aceptación)
Para tomar la decisión de aceptar o rechazar la hipótesis nula H0 , haremos
uso de la distribución Ji cuadrada.
FORMULACION DE LA HIPOTESIS NULA PARA LAS DIFERENTES PRUEBAS.
•Prueba de bondad de ajuste.
H0: Suponemos una distribución teórica (uniforme, Normal, Binomial, Poisson).
H1: No sigue la distribución supuesta.
•Prueba de independencia.
H0: Supone dos criterios de clasificación, excluyentes (independientes).
H1: Los criterios no son excluyentes.
•Prueba de Homogeneidad.
H0: Supone que las categorías son homogéneas o parecidas.
H1: Las categorías no son homogéneas.
•Prueba de Proporciones.
H0: Supone que las proporciones son iguales.
H1: No sean iguales las proporciones.
=(r-1)(c-1)
1.- PRUEBA DE BONDAD DE AJUSTE.-

Considera una prueba para determinar si una población tiene una distribución teórica
específica. La prueba se basa en que tan buen ajuste se tiene entre la frecuencia de
ocurrencia Oi de las observaciones en una muestra observada y las frecuencias
esperadas ei , que se obtiene de la distribución hipotética.
EJEMPLOS DE APLICACIÓN:
1.- Supongamos que se lanza un dado. Formulamos la hipótesis de que no está
cargado, la cual equivale a formular que la distribución de los resultados, es una
distribución uniforme discreta:

Supongamos que lanzamos 120 veces el dado, registrándose los resultados en la siguiente tabla:

Caras
rxc 1 2 3 4 5 6 ei = 120(⅙) = 20
Oi 20 22 17 18 19 24
ei 20 20 20 20 20 20

Determinar si el dado esta cargado. Usar el nivel de significancia α = 0.05.


Solución:
Paso 1: Planteamiento de la hipótesis.
H0 : Suponemos que el dado no está cargado (sigue una distribución uniforme).
H1 : El dado esta cargado (no sigue una distribución uniforme).
Paso 2: Nivel de significancia.
α = 0.05  X2 = X20.05 = 11.070
v = (2-1) (6-1) = 5
Paso 3: Estadístico de prueba.

2=(Oi-ei)2/ei =((20-20)2/20) +((22-20)2/20)+((17-20)2/20) +((18-20)2/20) +((19-20)2/20) +((24-20)2/20))

2=1.7

Paso 4: Decisión, como no se cumple que X2 > Xα2, ACEPTAMOS H0, es decir el dado no está cargado.
2.- Supongamos que el tiempo de vida de 40 baterías han sido clasificados en 7 intervalos:

0 Oi ei
1.45 – 1.95 2
1.95 – 2.45 1
2.45 – 2.95 4
2.95 – 3.45 15
3.45 – 3.95 10
3.95 – 4.45 5
4.45 – 4.95 3

Los datos de la tabla se pueden aproximarse a la distribución normal con:


μ = 3.5 y σ = 0.7. Utilice α = 0.05
¿LOS DATOS SIGUEN UNA DISTRIBUCION NORMAL?
Solución:
Paso 1: Planteamiento de la hipótesis.
H0: Supongamos que los datos siguen una distribución normal.
H1: Los datos no siguen una distribución normal.
Calculo de las frecuencias esperadas usando la distribución normal para cada intervalo.
ei = n.P(xi)
Intervalo I:

•P(-2.93 < z < -2.21) = P(z < -2.21) – P(z < -2.93) = 0.0136 – 0.0017 = 0.0119

e1 = (0.0119)(40) = 0.5

Intervalo II:

P(-2.21 < z < -1.5) = P(z < -1.5) – P(z < -2.21) = 0.0668 – 0.0136 = 0.0532

e2 = (0.0532)(40) = 2.1
Intervalo III: Intervalo VI:
P(2.45 ≤ X < 2.95) P(3.95 ≤ X < 4.45)
 P(-1.5 < Z < -0.79)  P(0.64 < Z < 1.36)
= 0.2148 – 0.0668 = 0.1480 = 0.9131 – 0.7389 = 0.1742
.ˈ. e3 = (0.1480)(40) = 5.9 .ˈ. e6 = (0.1742)(40) = 6.968 ≈ 7.0
Intervalo IV: Intervalo VII:
P(2.95 ≤ X < 3.45) P(4.45 ≤ X < 4.95)
 P(-0.79 < Z < -0.07)  P(1.36 < Z < 2.07)
= 0.4721 – 0.2148 = 0.2573 = 0.9808 – 0.9131 = 0.0677
.ˈ. e4 = (0.2573)(40) = 10.292 ≈ 10.3 .ˈ. e7 = (0.0677)(40) = 2.708 ≈ 3.0
Intervalo V:
P(3.45 ≤ X < 3.95)
 P(-0.07 < Z < 0.64)
= 0.7389 – 0.4721 = 0.2668
.ˈ. e5 = (0.2668)(40) = 10.672 ≈ 10.7

Luego obtenemos el cuadro siguiente: RECORDAR:


Nuestra nueva tabla r x c es:
0 Oi ei
1.45 – 1.95 2 0.5 Oi ei
1.95 – 2.45 1 7 2.1 8.5 7 8.5
15 10.3
2.45 – 2.95 4 5.9 10 10.7
2.95 – 3.45 15 10.3 8 10
3.45 – 3.95 10 10.7
La cual posee 4 filas por 2
3.95 – 4.45 5 8 7.0 10 columnas. Esto debido a la
4.45 – 4.95 3 3.0 observación antes mencionada.
Paso 2: Nivel de significancia.
De acuerdo a la observación hecha en el enunciado del
problema, tiene como consecuencia de que el número
total de intervalos se reduce de 7 a 4, lo que resultaría
que ahora tenemos 4 filas y 2 columnas es decir que v
= 3, veamos.
α = 0.05  X20.05 = 7.815
v= (4-1) (2-1) = 3
Paso 3: Estadístico de prueba
X2= (Oi-ei) 2/ei = (7-8.5) 2/8.5+ (15-10.3) 2/10.3+ (10-
10.7) 2/10.7 +(8-10) 2/10
X2= 2.8552
Paso 4: Decisión, como no se cum ple que X2 > Xα2 ,
entonces aceptamos la hipótesis nula H0 , es decir, la
distribución normal, proporciona un buen ajuste.
3. Se sacan tres cartas de un paquete común de cartas de juego, con reemplazo y se
registra el numero Y de espadas. Después de repetir el experimento 64 veces, se
obtuvieron los siguientes registros:

Y 0 1 2 3

f 21 31 12 0

Pruebe la hipótesis, con un nivel de significancia de 0.01, de que los datos registrados
pueden ser equiparados por la distribución binomial b (y; 3,1/4), y=0, 1, 2,3.

Solución:
PASO 1: PLANTEAMIENTO DE LA HIPÓTESIS.
H0: Los datos pueden ser equiparados por la distribución binomial.
H1: Los datos no siguen una distribución binomial.
Sabemos que:
b (y; n, p)  b(y;3,1/4)
Luego: n = 3 , p= ¼
Datos del problema: Según la observación realizada en la definición nos dice
que cuando los datos observados Oi son menores a 5, se puede agrupar las
frecuencias contiguas para reducir los intervalos. Es decir que:
P(Y = y) = (p)y (1 – p) n-y , y = 0,1,2,3 .

P (Y = 0)= (3 0) (1/4)0 (1 – ¼)3-0 = 0.4219


P (Y = 1)= (3 1) (1/4)1 (1 – ¼)3-1 = 0.4219
P (Y = 2)= (3 2) (1/4)2 (1 – ¼)3-2 = 0.1406
P (Y =3)= (3 3) (1/4)3 (1 – ¼)3-3 = 0.0156
El valor esperado es igual a:
Ei = P (Y = yi) *64, i = 0, 1, 2,3.
e0 = (0.4219)*64 = 27
e1 = (0.4219)*64 = 27
e2 = (0.1406)*64 = 9
e3 = (0.0156)*64 = 1 10

Y 0 1 2

Oi 21 31 12
rxc
ei 27 27 10
=

PASO 2: NIVEL DE SIGNIFICANCIA.


α = 0.01  X20.01 = 9.210
v= (2-1)(3-1) = 2

Paso 3: Estadístico de prueba.

X2 =

X2 = [1.3333 + 0.5926 + 0.4] = 2.3259 ≈ 2.326


Paso 4: Decisión, como no se cum ple que X2 > Xα 2 , entonces aceptamos H0 , es decir, que
los datos pueden ser equiparados por la distribución binomial.
2.- PRUEBA DE INDEPENDENCIA.-
En este método las marginales de las columnas y filas son obtenidas al azar, esto
surge porque la muestra se extrae al azar de la población.
H0: Se considera independencia.
H1: No se considera independencia.
EVENTOS
L M N MARGINALES
O O1 O2 O3 t1
EVENTOS

P O4 O5 O6 t2

Q 07 08 09 t3
MARGINALES m1 m2 m3 T

Observación:
Los totales marginales m y t son obtenidos al azar para un n fijado por el experimentador
ESTA TABLA LA PODEMOS Y TRANSFORMAR EN :
EVENTOS
L M N MARGINALES
O1(e1) O2 (e2) O3 (e3) t1
O
EVENTOS

O4 (e4) O5 (e5) O6 (e6) t2


P
07 (e7) 08 (e8) 09 (e9) t3
Q
MARGINALES m1 m2 m3 T

Posteriormente se siguen los mismos pasos establecidos en el caso general antes mencionado.
EJEMPLO DE APLICACIÓN:
Una muestra aleatoria de 90 adultos se clasifica de acuerdo al sexo de los
individuos y al numero de horas que ven televisión durante una semana.
SEXO
PARAMETRO
HOMBRE MUJER

Más de 25 horas 15 29

Menos de 25 horas 27 19

Utilice un nivel de significancia de 0.01 y pruebe la hipótesis de que el tiempo


utilizado para ver televisión es independiente de si el televidente es hombre o
mujer. SOLUCION
COMPLETAMOS LA TABLA

SEXO TOTAL
PARAMETRO
HOMBRE MUJER
44
Más de 25 horas 15 29
46
Menos de 25 horas 27 19
TOTAL 42 48 90
Solución:
Paso 1: Planteamiento de la hipótesis.
H0 : El tiempo utilizado para ver televisión es independiente del sexo.
H1 : No se considera independencia.
Paso 2: Nivel de significancia.
α = 0.01  X20.01 = 6.635
v= (2-1) (2-1) = 1
Cálculos de los valores esperados.
e1 = (44*42)/90 = 20.5 e2 = (48*44)/90 = 23.5
e3 = (42*46)/90 = 21.5 e4 = (48*46)/90 = 24.5

LUEGO TENEMOS: SEXO


PARAMETRO
HOMBRE MUJER
Más de 25 horas 15(20.5) 29(23.5)
Menos de 25 horas 27(21.5) 19(24.5)
Paso 4: Decisión, como no se cumple que X2 > Xα 2, entonces aceptamos H0, es decir
que el tiempo utilizado para ver televisión es independiente del sexo.
3.- PRUEBA DE HOMOGENEIDAD.-
En este método las marginales de las filas o columnas se prefijan, pudiéndose utilizar una
población o varias poblaciones.
H0: Las proporciones sobre el experimento tratados, son las mismas.
H1: Las proporciones no son iguales.

EVENTOS
L M N MARGINA
LES
O1 O2 O3 t1
O
O4 O5 O6 t2
EVENTOS

P
07 08 09 t3
Q
MARGINALES m1 m2 m3 T

ESTABLECIDAS LAS FRECUENCIAS ESPERADAS ei LA TABLA LA PODEMOS Y TRANSFORMAR EN :

EVENTOS
L M N MARGINALES
O O1(e1) O2 (e2) O3 (e3) t1
EVENTOS

P O4 (e4) O5 (e5) O6 (e6) t2


Q 07 (e7) 08 (e8) 09 (e9) t3
MARGINALES m1 m2 m3 T

Posteriormente se siguen los mismos pasos establecidos en el caso general antes mencionado.
EJEMPLO DE APLICACIÓN:
La enfermería de un colegio llevo a cabo un experimento para determinar el grado
de alivio proporcionado por tres remedios para la tos. Cada remedio se suministro
a 50 estudiantes y se registraron los siguientes datos

GRADO DE REMEDIOS PARA LA TOS


ALIVIO NYQUIL ROOXTUSIN TRIAMINIC
SIN ALIVIO 11 13 9
CIERTO ALIVIO 32 28 27
ALIVIO TOTAL 7 9 14

Pruebe la hipótesis con un nivel de significancia de 0.05, que los tres remedios para la tos
son igualmente efectivos ¿con que probabilidad P se acepta o rechaza H0?
Solución:
PASO 1: PLANTEAMIENTO DE LA HIPÓTESIS:
H0: Los tres remedios para la tos, son igualmente efectivos
H1: No son igualmente efectivos
Paso 2: Nivel de significancia
α = 0.05  X20.05 = 9.488
v=(3-1)(3-1) = 4
Calculo de los valores esperados:
e1 = (50*33)/150 =11 e4 = (50*87)/150 = 29 e7 = (50*30)/150 = 10
e2 = 11 y e3 = 11 e5 = 29 y e6 = 29 e8 = 10 y e9 = 10

GRADO DE ALIVIO REMEDIOS PARA LA TOS


TOTAL
NYQUIL ROOXTUSIN TRIAMINIC

SIN ALIVIO 11(11) 13(11) 9(11) 33

CIERTO ALIVIO 32(29) 28(29) 27(29) 87

ALIVIO TOTAL 7(10) 9(10) 14(10) 30

TOTAL 50 50 50 150
4.- PRUEBA PARA VARIAS PROPORCIONES.-
Este modelo es una extensión de lo anterior, en donde se estudio para el caso
de dos proporciones. Ahora lo extenderemos a K parámetros binomiales que
tienen el mismo valor:
H0: p1 = p2 = p3 =……….. = pk
H1: No todas las proporciones son iguales.
MUESTRAS
………………… nk
n1 N2 …
………………… Xk
EXITOS …
X1 X2
………………… nk –
FRACASOS … Xk
n1- X1 n2- X2
Si se depende, de si los tamaños de muestras aleatorias, se predeterminaron
(homogeneidad) o de si ocurrieron al azar (independencia), el procedimiento de
prueba es idéntico para la prueba de homogeneidad que para la independencia..
Las frecuencias esperadas ei se calculan como antes.
EJEMPLO DE APLICACIÓN:
En el estudio de un taller, se obtuvo un conjunto de datos para determinar si
la proporción de artículos defectuosos producidos por los trabajadores era la
misma durante el día, la tarde o la noche. Se encontrar los siguientes datos.

TURNO
SITUACION
DIA TARDE NOCHE
DEFECTUOSOS 45 55 70
NO DEFECTUOSOS 905 890 870

Utilice un nivel de significancia de 0.025 para determinar si la proporción de


artículos defectuosos es la misma para los tres turnos.
Solución.-
Sea que p1, p2, p3 representen las proporciones reales de artículos defectuosos para
los turnos del día, la tarde y la noche, respectivamente.
PASO 1: PLANTEAMIENTO DE LA HIPÓTESIS
H0: p1 = p2 = p3
H1: p1, p2 y p3 no son todas iguales.
PASO 2: NIVEL DE SIGNIFICANCIA.
α = 0.025  X20.025 = 7.378
v= (2-1) (3-1) = 2
Calculo de los valores esperados
e1 = (950*170)/2835 = 57.0 e3 = (940*170)/2835 = 56.3 e5 = (945*2665)/2835 = 888.3
e2 = (945*170)/2835 = 56.7 e4 = (950*2665)/2835 = 893.0 e5 = (940*2665)/2835 = 883.7

Paso 3: Estadístico de prueba.

PASO 4: DECISIÓN, como no se cumple que X2 > Xα 2 entonces aceptamos H0 , se


concluye que la proporción de artículos defectuosos producidos es la misma para
todos los turnos.
PROBLEMAS RESUELTOS

1.- La distribución siguiente es el número de fallas de energía que se registraron en una ciudad
de la Sierra Central del Perú a lo largo de 300 días.

Numero de fallas energía 0 1 2 3 4 5 6 7 8 9

Numero de días 9 43 64 62 42 36 22 14 6 2

Con un nivel de significancia de 0.05 pruébese si el numero diario de fallas de


energía de tal ciudad es una variable aleatoria que tiene distribución de Poisson
con λ = 3.2

SOLUCIÓN:
X: V.A. falla de energía
X  Poisson (x, λ) = e-λ λx / x! , x = 0, 1, 2,…, 9
∑oi

1. H0: Las fallas de energía siguen una distribución de Poisson.


H1: Las fallas de energía no siguen una distribución de Poisson.
2. α = 0.05  X20.05 = 15.5
v= (9-1) (2-1) = 8

3.

•Decisión: X2 = 11.535 < X20.05 = 15.5 aceptamos H0 es decir las fallas de energía
siguen una distribución de Poisson.
OBSERVACION: Cuando el enunciado del problema no proporciona el valor de λ se estima

mediante la media x̄ = (∑xioi)/∑oi


i
2. - Para determinar si en realidad existe una relación entre el aprovechamiento de un
empleado en el programa de capacitación y su rendimiento real en el trabajo,
consideramos una muestra de 400 casos de sus archivos que son muy detallados y
obtenemos los resultados que se advierten en la siguiente tabla.

Aprovechamiento Debajo del Promedio Sobre el promedio


promedio

Éxito en el trabajo
Deficiente 23 60 29
Promedio 28 79 60
Muy buena 9 49 63

a) Con el nivel de significancia 0.01 pruébese la hipótesis nula de que el aprovechamiento


en el programa de capacitación y el éxito en el trabajo son independientes.
b) Analizar los valores esperados o frecuencias esperadas ei en las celdas que influencian
en la dependencia del aprovechamiento del empleado en el programa de capacitación y el
éxito en el trabajo.
Solución:
Calculo de los ei .. i = 1,2,….,9
Asumiendo la independencia.
e1 = (112*60)/400 = 16.8 ; e2 = (112*188)/400 = 52.6 ; e3 = (112*152)/400 = 42.6
e4 = (167*60)/400 = 25.0 ; e5 = (167*188)/400 = 78.5 ; e6 = (167*152)/400 = 63.5
e7 = (121*60)/400 = 18.1 ; e8 = (121*188)/400 = 56.9 : e9 = (121*152)/400 = 46.0

a. PH
•H0: El aprovechamiento en un programa de capacitación y el éxito en el trabajo son
independientes.
H1: El aprovechamiento en el programa de capacitación y el éxito en el trabajo no son
independientes.
•Nivel de Significancia: α = 0.01  X20.01 = 13.3
v= (3-1) (3-1) = 4
•Estadístico de prueba:
4. Decisión: Si X2 = 20.34 > X20.01 = 13.3 rechazamos H0 es decir existe dependencia
entre el aprovechamiento en el programa de entrenamiento de un empleado en el
programa y su éxito en el trabajo.

b. Determinemos que elementos influyen en la dependencia; para ello veamos


los valores de cada elemento en la sumatoria en su respectiva celda.
X2 = 2.29 + 1.04 + 4.34 + 0.36 + 0.00 + 0.19 + 4.65 + 1.10 + 6.37 = 20.34
Como observamos existen tres celdas las que influencian en el rechazo de H0

Deficiente en el trabajo, pero sobre el promedio en el programa de


(o3 – e3)2 / e3 = 4.34; capacitación.

Muy bueno en el trabajo pero debajo del promedio en el programa


(o7 – e7)2 /e7= 4.65; de capacitación.

(o9 – e9)2 /e9= 6.37 Muy bueno en el trabajo pero sobre el promedio en el programa de
Capacitación.
3.- Los siguientes datos provienen de un estudio en que muestra aleatorias de
empleados de tres dependencias gubernamentales se les pregunto acerca de su
plan de pensiones.

Agencia 1 Agencia 2 Agencia 3


A favor del plan de pensión 63 84 109
En contra del plan de pensión 33 66 41

a. Empléese un nivel de significancia de 0.01 para probar la hipótesis nula de


que la proporción real de empleados que favorecen al plan de pensión es la
misma.
b. Determinar el intervalo de confianza del 99% para cada una de las
proporciones provenientes de las agencias.
c. ¿Cuál de las proporciones es la mejor?
Solución:
a.
1.- Planteamiento de la Hipotesis
H0: Las proporciones son iguales: p1 = p2 =p3
H1: Las proporciones son diferentes.
2.- α = 0.01  X20.01 = 9.210
v= (2-1) (3-1) = 2
e1 = 260*100 /400= 65,………., e6 = 140*150/400 =52.5
Ag1 Ag2 Ag3 Total
A favor 63 (65) 84 (97.5) 109 (97.5) 260
En contra 33 (35) 66 (52.5) 41 (52.5) 140
Total 100 150 150 500

3.- X2 = ∑ (oi – ei)/ ei = (63 -65)2 /65 +………… + (41 – 52.5)2 /52.5=9.3919

4.- Decisión: Si X2 = 9.3919 > X20.01 = 9.210 Rechazamos H0 , es decir las


proporciones son diferentes.
b. Como las muestras son grandes podemos determinar los intervalos para las
proporciones p1, p2 y p3 usando la distribución normal (Teorema de
aproximación de la Binomial la normal)

Podemos observar que la Agencia 3 seria la que con p3=0.727 elegiría el plan
de pensiones de los empleados

You might also like