You are on page 1of 10

Estadstica Inferencial

Ing. MSc Ramn Rincones

PRUEBAS NO PARAMETRICAS
Aplicaciones de ji cuadrada
Previamente se analizaron datos a escala de intervalo o de razn, como los pesos de
lingotes de acero, ingresos de minoras y aos de empleo. Se realizaron pruebas de hiptesis
respecto de una sola media de poblacin, dos medias de poblaciones y tres o ms medias de
poblaciones. Para estas pruebas supuso que las poblaciones siguen la distribucin de probabilidad
normal. Sin embargo, hay pruebas disponibles en las cuales no es necesaria una suposicin
respecto de la forma de la poblacin. A estas pruebas se les conoce como no paramtricas. Esto
significa que no es necesario suponer una poblacin normal.

Tambin hay pruebas exclusivas para datos a escala de medicin nominal. Recuerde que
los datos nominales son los ms bajos o ms primitivos. En este tipo de medicin, los datos se
clasifican en categoras donde no hay un orden natural, como el gnero de los representantes del
Congreso, el estado donde nacieron los estudiantes o la marca de mantequilla de man que
compr. En este captulo aparece un nuevo estadstico de prueba, el estadstico ji cuadrada, til
para datos medidos con una escala nominal.

Prueba de bondad de ajuste: frecuencias esperadas iguales


La prueba de bondad de ajuste es una de las pruebas estadsticas de uso ms comn. La
primera ilustracin de esta prueba supone el caso en que las frecuencias esperadas de las celdas
son iguales. Como su nombre lo indica, el propsito de la prueba de bondad de ajuste es comparar
una distribucin observada con una distribucin esperada. Un ejemplo describir la situacin de
una prueba de hiptesis.

Ejemplo:
La gerente de mercadeo de un diario deportivo planea iniciar la venta de una serie de
barajitas con fotografas y estadsticas de juego de ex jugadores de la Liga de Bisbol Venezolana
(LBV). Uno de los problemas es la seleccin de ex jugadores.

En una exhibicin de barajitas de bisbol en el Sambil de Valencia, donde est el Hall de


Bisbol Venezolano. Se vendieron 120 barajitas de los siguientes ex jugadores, mostrados en el
cuadro 1. Puede la gerente concluir que las ventas no son iguales para cada jugador?

Si no hay una diferencia significativa en la popularidad de los jugadores, se esperara que


las frecuencias observadas (fo) fueran iguales, o casi iguales. Es decir, se esperara vender igual
nmero de tarjetas de Luis Sojo que de Vctor Davalillo. Por tanto, cualquier discrepancia en las
frecuencias observada y esperada puede atribuirse al muestreo (casualidad). Qu sucede con el
nivel de medicin en este problema? Observe que, cuando se vende una barajita, la medicin
de la tarjeta se basa en el nombre del jugador. No hay un orden natural para los jugadores. Ningn
jugador es mejor que otro. En consecuencia, se utiliza una escala nominal para evaluar cada
observacin.
1/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Cuadro 1
Nmero de tarjetas vendidas de cada jugador

Jugador No. de barajitas


(cromos) vendida
Luis Sojo 13
David Concepcin 14
Luis Salazar 07
Luis Aparicio 36
Antonio Armas 17
Vctor Davalillo 33
TOTAL 120

Como hay 120 tarjetas en la muestra, se espera que fe sea 20 tarjetas, es decir, la frecuencia
esperada, (fe), aparecer en cada una de las seis categoras (cuadro 2). Estas categoras se
denominan celdas. Un anlisis del conjunto de frecuencias observadas en la tabla 1 indica que la
tarjeta de Luis Salazar no se vende con frecuencia, en tanto que las de Luis Aparicio y Vctor
Davalillo se venden con ms frecuencia. Se debe a la casualidad la diferencia en las
ventas, o es posible concluir que hay una preferencia por las tarjetas de ciertos
jugadores?

Cuadro 2
Frecuencias observadas y esperadas de las 120 tarjetas vendidas

Jugador Barajitas vendidas No. vendido esperado


(fo) (fe)
Luis Sojo 13 20
Vctor Davalillo 33 20
David Concepcin 14 20
Luis Salazar 07 20
Luis Aparicio 36 20
Antonio Armas 17 20
TOTAL 120 120

Solucin:

Emplee el mismo procedimiento sistemtico de cinco pasos de los captulos anteriores.

Paso 1: Formule las hiptesis nula y alternativa. La hiptesis nula, H0, es que no hay diferencia
entre el conjunto de frecuencias observadas y el conjunto de frecuencias esperadas; es decir,
cualquier diferencia entre los dos conjuntos de frecuencias se puede atribuir al muestreo
(casualidad).

2/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

La hiptesis alternativa, H1, es que hay una diferencia entre los conjuntos observado y esperado
de frecuencias. Si rechaza H0 y acepta H1, significa que las ventas no se distribuyen de igual forma
entre las seis categoras (celdas).
H0: fo = fe fo = Frecuencia observada
H1: fo fe fe = frecuencia esperada

Paso 2: Seleccione el nivel de significancia. Seleccione el nivel de significancia 5%. La probabilidad


de que rechace la hiptesis nula verdadera es 0,05.

Paso 3: Seleccione el estadstico de prueba. El estadstico de prueba sigue la distribucin ji


cuadrada, designada como 2.

con k 1 grados de libertad, donde:

k es el nmero de categoras.
fo es una frecuencia observada en una categora particular.
fe es una frecuencia esperada en una categora particular

Paso 4: Formule la regla de decisin. Recuerde que la regla de decisin en las pruebas de hiptesis
requiere determinar un nmero que separe la regin donde no se rechaza H0 de la regin de
rechazo. Este nmero se denomina valor crtico. Como ver, la distribucin ji cuadrada en realidad
es una familia de distribuciones. Cada distribucin tiene una forma un poco diferente, segn el
nmero de grados de libertad.

El nmero de grados de libertad en este tipo de problema se encuentra mediante k 1, donde k


es el nmero de categoras. En este problema en particular hay seis. Como hay seis categoras, hay
k 1 = 6 1 = 5 grados de libertad. Como se observ, una categora se denomina celda, por lo que
hay seis celdas. El valor crtico para 5 grados de libertad y el nivel de significancia 0,05, se encuentra
en la tabla respectiva de la ji cuadrada. Una parte de esa tabla aparece en el cuadro 3. El valor
crtico es 11.070, determinado al ubicar 5 grados de libertad en el margen izquierdo, y luego, por
la horizontal (a la derecha), y leyendo el valor crtico en la columna 0,05

La regla de decisin es rechazar H0 si el valor calculado de ji cuadrada es mayor que 11,070.


Si es menor o igual a 11.070, no se rechaza H0. En la grfica 1 se muestra la regla de decisin.

La regla de decisin indica que, si hay diferencias grandes entre las frecuencias observada
y esperada, lo que genera una 2 calculada mayor que 11,070, se debe rechazar la hiptesis nula.
Sin embargo, si las diferencias entre fo y fe son pequeas, el valor 2 calculado ser 11,070 o
menor, y no se debe rechazar la hiptesis nula. El razonamiento es que es probable que esas
diferencias pequeas entre las frecuencias observada y esperada se deban a la casualidad.
Recuerde que las 120 observaciones son una muestra de la poblacin.

3/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Cuadro 3
Parte de la tabla de la ji cuadrada

Grfica 1: Distribucin de probabilidad ji cuadrada para 5 grados de libertad, con la


regin de rechazo y un nivel de significancia de 0,05

Paso 5: Calcule el valor de ji cuadrada y tome una decisin. De las 120 tarjetas vendidas en la
muestra, se cuenta el nmero de veces que se vendieron Luis Aparicio, Luis Sojo y cada uno de los
dems jugadores Los conteos se registraron en el cuadro 3. Los siguientes son los clculos para ji
cuadrada. (Observe una vez ms que las frecuencias esperadas son las mismas para cada celda.)

Columna 1: Determine las diferencias entre cada fo y fe. Es decir, (fo fe). La suma de estas
diferencias es cero.

Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y esperada, es decir,
(fo fe)2.

Columna 3: Divida el resultado de cada observacin entre la frecuencia esperada. Es decir,


(fo fe)2 /fe . Finalmente, sume estos valores.
El resultado es el valor de 2, que es 34,40.

4/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Cuadro 3: Como calcular el estadstico de prueba

La 2 calculada de 34,40 est en la regin de rechazo ms all del valor crtico de 11,070.
Por tanto, la regla de decisin es rechazar H0 con un nivel de significancia de 0,05 y aceptar H1. La
diferencia entre las frecuencias observada y esperada no se debe a la casualidad. Ms bien, las
diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. La posibilidad de
que estas diferencias se deban a un error de muestreo es muy pequea. Por tanto, se concluye
que es improbable que las ventas de tarjetas sean las mismas entre los seis jugadores.

Notas Generales sobre la Distribucin ji Cuadrada


La distribucin ji cuadrada, tambin llamada Chi-Cuadrada, utilizada como el estadstico de prueba
en este captulo, tiene las caractersticas siguientes:

1. Los valores de ji cuadrada nunca son negativos. Esto se debe a que la diferencia entre fo y fe
se eleva al cuadrado, es decir, (fo fe)2.

2. Existe una familia de distribuciones de ji cuadrada. Hay una distribucin de ji cuadrada para 1
grado de libertad, otra para 2 grados de libertad, otra para 3 grados de libertad, etc. En este tipo
de problema, el nmero de grados de libertad se determina mediante k 1, donde k es el nmero
de categoras. Por tanto, la forma de la distribucin ji cuadrada no depende del tamao de la
muestra, sino del nmero de categoras. Por ejemplo, si clasifica a 200 empleados de una aerolnea
en una de tres categoras: personal de vuelo, apoyo terrestre y personal administrativo, tendra
k 1 = 3 1 = 2 grados de libertad.

3. La distribucin ji cuadrada tiene un sesgo positivo. Sin embargo, a medida que aumenta el
nmero de grados de libertad, la distribucin comienza a aproximarse a la distribucin normal. La
grfica 2 muestra las distribuciones para grados de libertad seleccionados. Observe que, para

5/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Grfica 2: Distribuciones ji cuadrada para grados de libertad seleccionados

TAREA-1: La directora de recursos humanos de la Universidad Yacamb (UNY), est preocupada


por el ausentismo entre los docentes por hora, por lo que decide tomar una muestra de los
registros de la compaa y determinar si el ausentismo est distribuido de manera uniforme en
toda la semana de seis das. Las hiptesis son:

H0: El ausentismo est distribuido de manera uniforme en toda la semana de trabajo.


H1: El ausentismo no est distribuido de manera uniforme en toda la semana de trabajo.

Los resultados de la muestra son:

a) Cmo se denominan los nmeros 12, 9, 11, 10, 9 y 9?


b) Cuntas categoras (celdas) hay?
c) Cul es la frecuencia esperada para cada da?
d) Cuntos grados de libertad hay?
e) Cul es el valor crtico de ji cuadrada con un nivel de significancia de 1%?
f ) Calcule el estadstico de prueba 2.
g) Cul es su regla de decisin respecto de la hiptesis nula?
h) Especficamente, qu le indica lo anterior a la directora de recursos humanos?

6/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Respuestas:

Prueba de bondad de ajuste:


frecuencias esperadas desiguales

Las frecuencias esperadas (fe) en la distribucin anterior de las barajitas de bisbol fueron
iguales (20). De acuerdo con la hiptesis nula, se esperaba que una fotografa de Luis Aparicio se
vendiera de manera aleatoria 20 veces, una de Vtor Davalillo, 20 veces de 120 intentos, etc. La
prueba ji cuadrada tambin es til si las frecuencias esperadas no son iguales.

El siguiente ejemplo ilustra el caso de frecuencias desiguales y tambin presenta un uso


prctico de la prueba de bondad de ajuste de ji cuadrada para determinar si una experiencia local
difiere de una experiencia ms amplia, es decir del resto del pas.

La Oficina Central del Instituto Venezolano de los Seguros Sociales (IVSS) reporta la
siguiente informacin con respecto del nmero de veces que los adultos mayores (3ra edad) son
admitidos en un hospital durante un periodo de un ao. Cuarenta por ciento no es admitido; 30%
es admitido una vez; 20% son admitidos dos veces y el 10% restante es admitido tres o ms veces.

Por su parte el Hospital Lpez Gmez del IVSS de Barquisimeto report de una encuesta de
150 residentes revel que 55 residentes no fueron admitidos durante el ao pasado, 50 fueron
admitidos en un hospital una vez, 32 fueron admitidos dos veces, y el resto en la encuesta fueron
admitidos tres o ms veces. Es posible concluir que la encuesta del Hospital Lpez Gmez es
consistente con la informacin publicada por la Oficina Central del IVSS? Utilice el nivel de
significancia del 5%.

Primero organice la informacin anterior en el cuadro 4. Es evidente que no se puede


comparar los porcentajes del estudio del Nivel Central del IVSS con las frecuencias reportadas por
el Hospital Lpez Gmez.

7/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Ntese que el IVSS Nacional presenta la informacin de manera porcentual. Mientras que
H. Lpez Gmez en forma de frecuencia. Sin embargo, puede convertirse estos porcentajes del
IVSS Nacional en frecuencias esperadas, fe. Vea el proceso de conversin en la ltima columna del
cuadro 4.

Cuadro 4
Resumen de conversin de porcentaje a frecuencia esperada
Cantidad de veces % del IVSS Nacional No. de pensionados No. esperado de
ingresados a un H. Lpez Gmez pensionados.
hospital (fo) (fe)
0 40 /100 = 0,40 55 (0,40) (150) = 60
1 30 /100 =0,30 50 (0,30) (150) = 45
2 20 /100 = 0,20 32 (0,20) (150) = 30
3 ms veces 10/100 = 0,10 13 (0,10) (150) = 15
Total: 100 % 150 150

Paso 1: establecer las hiptesis:

H0: fo = fe
H1: fo fe

H0: No hay diferencias entre la experiencia local y la nacional respecto de las admisiones en un
hospital

H1: Hay diferencias entre la experiencia local y la nacional respecto de las admisiones en un
hospital.

Paso 2: establecer el nivel de significancia:


Alfa es igual al 5%
Hay cuatro categoras de admisin, por lo cual los grados de libertad son gl = 4 -1 = 3. El
valor crtico es 7,815.

Paso 3: Seleccionar el estadstico de prueba:

Ntese que el estadstico es el mismo usado para frecuencias iguales, solo vara la forma de
calcularlos

Paso 4: establecer la regla de decisin:

Se rechaza Ho, solo y solo si la ji cuadrada cae en la zona de rechazo para un alfa del cinco por
ciento y un grado de libertad n 1. Y se acepta la hiptesis alterna.

Paso 5: Concluir e Interpretar


8/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

Ahora calcule el estadstico de prueba ji cuadrada: La mejor forma de hacer es mediante es forma
tabulada tal como se muestra en el cuadro 5.

Cuadro 5:
Determinacin de las frecuencias

Grfica 3: Curva de la ji-cuadrada, mostrando la ji-cuadrada tabulada.

Concluir: Como el estadstico de prueba cae dentro de la regin de aceptacin, no se


rechaza la hiptesis nula para 3 grados de libertad y nivel de significancia del cinco por ciento.

Interpretar: Como se acepta Ho, no hay evidencia de una diferencia entre la experiencia
local (H, Lpez Gmez) y el IVSS Nacional.

TAREA 2:
La Superintendencia de Bancos (SUDEBAR) clasifica las cuentas por cobrar como actuales,
atrasadas e irrecuperables. Las cifras de la industria muestran que 60% de las cuentas por
cobrar es actual, 30% atrasado y 10% irrecuperable. El Banco Bicentenario en Barquisimeto,
agencia Terepaima tiene 500 cuentas por cobrar: 320 son actuales, 120 estn atrasadas y 60 son
irrecuperables. Concuerdan estas cifras con la distribucin de la industria? Utilice el nivel de
significancia del 5%.

Respuesta: La ji cuadrada calculada es igual 9,33; mientras que la ji tabulada es igual a 5,991. En
consecuencia, se rechaza la hiptesis nula.
9/10
Estadstica Inferencial
Ing. MSc Ramn Rincones

TABLA CHI-CUADRADO
La tabla Chi-cuadrado es usada para realizar pruebas de independencia, que nos permite determinar si existe una
relacin entre dos variables categricas. La prueba nos indica si existe o no una relacin entre las variables, pero no
indica el grado o el tipo de relacin; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la
variable que causa la influencia.
La tabla tiene dos entradas:
Alfa (): este valor hace referencia al nivel de confianza que deseamos que tengan los clculos de la
prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo
cual corresponde al complemento porcentual de la confianza.
Grados de Libertad (k): Es un estimador del nmero de categoras independientes en la prueba de
independencia o experimento estadstico. Se encuentran mediante la frmula n-r, donde n=nmero de
sujetos y r es el nmero de grupos estadsticamente dependientes.

Probabilidad de un valor superior - Alfa ()


Grados
0,1 0,05 0,025 0,01 0,005
libertad
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17

Fuente: file:///C:/Users/RAMONR~1/AppData/Local/Temp/chi_cuadrado.Tabla_temahtml.htm
10/10

You might also like