Professional Documents
Culture Documents
PRUEBAS NO PARAMETRICAS
Aplicaciones de ji cuadrada
Previamente se analizaron datos a escala de intervalo o de razn, como los pesos de
lingotes de acero, ingresos de minoras y aos de empleo. Se realizaron pruebas de hiptesis
respecto de una sola media de poblacin, dos medias de poblaciones y tres o ms medias de
poblaciones. Para estas pruebas supuso que las poblaciones siguen la distribucin de probabilidad
normal. Sin embargo, hay pruebas disponibles en las cuales no es necesaria una suposicin
respecto de la forma de la poblacin. A estas pruebas se les conoce como no paramtricas. Esto
significa que no es necesario suponer una poblacin normal.
Tambin hay pruebas exclusivas para datos a escala de medicin nominal. Recuerde que
los datos nominales son los ms bajos o ms primitivos. En este tipo de medicin, los datos se
clasifican en categoras donde no hay un orden natural, como el gnero de los representantes del
Congreso, el estado donde nacieron los estudiantes o la marca de mantequilla de man que
compr. En este captulo aparece un nuevo estadstico de prueba, el estadstico ji cuadrada, til
para datos medidos con una escala nominal.
Ejemplo:
La gerente de mercadeo de un diario deportivo planea iniciar la venta de una serie de
barajitas con fotografas y estadsticas de juego de ex jugadores de la Liga de Bisbol Venezolana
(LBV). Uno de los problemas es la seleccin de ex jugadores.
Cuadro 1
Nmero de tarjetas vendidas de cada jugador
Como hay 120 tarjetas en la muestra, se espera que fe sea 20 tarjetas, es decir, la frecuencia
esperada, (fe), aparecer en cada una de las seis categoras (cuadro 2). Estas categoras se
denominan celdas. Un anlisis del conjunto de frecuencias observadas en la tabla 1 indica que la
tarjeta de Luis Salazar no se vende con frecuencia, en tanto que las de Luis Aparicio y Vctor
Davalillo se venden con ms frecuencia. Se debe a la casualidad la diferencia en las
ventas, o es posible concluir que hay una preferencia por las tarjetas de ciertos
jugadores?
Cuadro 2
Frecuencias observadas y esperadas de las 120 tarjetas vendidas
Solucin:
Paso 1: Formule las hiptesis nula y alternativa. La hiptesis nula, H0, es que no hay diferencia
entre el conjunto de frecuencias observadas y el conjunto de frecuencias esperadas; es decir,
cualquier diferencia entre los dos conjuntos de frecuencias se puede atribuir al muestreo
(casualidad).
2/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
La hiptesis alternativa, H1, es que hay una diferencia entre los conjuntos observado y esperado
de frecuencias. Si rechaza H0 y acepta H1, significa que las ventas no se distribuyen de igual forma
entre las seis categoras (celdas).
H0: fo = fe fo = Frecuencia observada
H1: fo fe fe = frecuencia esperada
k es el nmero de categoras.
fo es una frecuencia observada en una categora particular.
fe es una frecuencia esperada en una categora particular
Paso 4: Formule la regla de decisin. Recuerde que la regla de decisin en las pruebas de hiptesis
requiere determinar un nmero que separe la regin donde no se rechaza H0 de la regin de
rechazo. Este nmero se denomina valor crtico. Como ver, la distribucin ji cuadrada en realidad
es una familia de distribuciones. Cada distribucin tiene una forma un poco diferente, segn el
nmero de grados de libertad.
La regla de decisin indica que, si hay diferencias grandes entre las frecuencias observada
y esperada, lo que genera una 2 calculada mayor que 11,070, se debe rechazar la hiptesis nula.
Sin embargo, si las diferencias entre fo y fe son pequeas, el valor 2 calculado ser 11,070 o
menor, y no se debe rechazar la hiptesis nula. El razonamiento es que es probable que esas
diferencias pequeas entre las frecuencias observada y esperada se deban a la casualidad.
Recuerde que las 120 observaciones son una muestra de la poblacin.
3/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
Cuadro 3
Parte de la tabla de la ji cuadrada
Paso 5: Calcule el valor de ji cuadrada y tome una decisin. De las 120 tarjetas vendidas en la
muestra, se cuenta el nmero de veces que se vendieron Luis Aparicio, Luis Sojo y cada uno de los
dems jugadores Los conteos se registraron en el cuadro 3. Los siguientes son los clculos para ji
cuadrada. (Observe una vez ms que las frecuencias esperadas son las mismas para cada celda.)
Columna 1: Determine las diferencias entre cada fo y fe. Es decir, (fo fe). La suma de estas
diferencias es cero.
Columna 2: Eleve al cuadrado la diferencia entre cada frecuencia observada y esperada, es decir,
(fo fe)2.
4/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
La 2 calculada de 34,40 est en la regin de rechazo ms all del valor crtico de 11,070.
Por tanto, la regla de decisin es rechazar H0 con un nivel de significancia de 0,05 y aceptar H1. La
diferencia entre las frecuencias observada y esperada no se debe a la casualidad. Ms bien, las
diferencias entre fo y fe son lo bastante grandes para considerarse relevantes. La posibilidad de
que estas diferencias se deban a un error de muestreo es muy pequea. Por tanto, se concluye
que es improbable que las ventas de tarjetas sean las mismas entre los seis jugadores.
1. Los valores de ji cuadrada nunca son negativos. Esto se debe a que la diferencia entre fo y fe
se eleva al cuadrado, es decir, (fo fe)2.
2. Existe una familia de distribuciones de ji cuadrada. Hay una distribucin de ji cuadrada para 1
grado de libertad, otra para 2 grados de libertad, otra para 3 grados de libertad, etc. En este tipo
de problema, el nmero de grados de libertad se determina mediante k 1, donde k es el nmero
de categoras. Por tanto, la forma de la distribucin ji cuadrada no depende del tamao de la
muestra, sino del nmero de categoras. Por ejemplo, si clasifica a 200 empleados de una aerolnea
en una de tres categoras: personal de vuelo, apoyo terrestre y personal administrativo, tendra
k 1 = 3 1 = 2 grados de libertad.
3. La distribucin ji cuadrada tiene un sesgo positivo. Sin embargo, a medida que aumenta el
nmero de grados de libertad, la distribucin comienza a aproximarse a la distribucin normal. La
grfica 2 muestra las distribuciones para grados de libertad seleccionados. Observe que, para
5/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
6/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
Respuestas:
Las frecuencias esperadas (fe) en la distribucin anterior de las barajitas de bisbol fueron
iguales (20). De acuerdo con la hiptesis nula, se esperaba que una fotografa de Luis Aparicio se
vendiera de manera aleatoria 20 veces, una de Vtor Davalillo, 20 veces de 120 intentos, etc. La
prueba ji cuadrada tambin es til si las frecuencias esperadas no son iguales.
La Oficina Central del Instituto Venezolano de los Seguros Sociales (IVSS) reporta la
siguiente informacin con respecto del nmero de veces que los adultos mayores (3ra edad) son
admitidos en un hospital durante un periodo de un ao. Cuarenta por ciento no es admitido; 30%
es admitido una vez; 20% son admitidos dos veces y el 10% restante es admitido tres o ms veces.
Por su parte el Hospital Lpez Gmez del IVSS de Barquisimeto report de una encuesta de
150 residentes revel que 55 residentes no fueron admitidos durante el ao pasado, 50 fueron
admitidos en un hospital una vez, 32 fueron admitidos dos veces, y el resto en la encuesta fueron
admitidos tres o ms veces. Es posible concluir que la encuesta del Hospital Lpez Gmez es
consistente con la informacin publicada por la Oficina Central del IVSS? Utilice el nivel de
significancia del 5%.
7/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
Ntese que el IVSS Nacional presenta la informacin de manera porcentual. Mientras que
H. Lpez Gmez en forma de frecuencia. Sin embargo, puede convertirse estos porcentajes del
IVSS Nacional en frecuencias esperadas, fe. Vea el proceso de conversin en la ltima columna del
cuadro 4.
Cuadro 4
Resumen de conversin de porcentaje a frecuencia esperada
Cantidad de veces % del IVSS Nacional No. de pensionados No. esperado de
ingresados a un H. Lpez Gmez pensionados.
hospital (fo) (fe)
0 40 /100 = 0,40 55 (0,40) (150) = 60
1 30 /100 =0,30 50 (0,30) (150) = 45
2 20 /100 = 0,20 32 (0,20) (150) = 30
3 ms veces 10/100 = 0,10 13 (0,10) (150) = 15
Total: 100 % 150 150
H0: fo = fe
H1: fo fe
H0: No hay diferencias entre la experiencia local y la nacional respecto de las admisiones en un
hospital
H1: Hay diferencias entre la experiencia local y la nacional respecto de las admisiones en un
hospital.
Ntese que el estadstico es el mismo usado para frecuencias iguales, solo vara la forma de
calcularlos
Se rechaza Ho, solo y solo si la ji cuadrada cae en la zona de rechazo para un alfa del cinco por
ciento y un grado de libertad n 1. Y se acepta la hiptesis alterna.
Ahora calcule el estadstico de prueba ji cuadrada: La mejor forma de hacer es mediante es forma
tabulada tal como se muestra en el cuadro 5.
Cuadro 5:
Determinacin de las frecuencias
Interpretar: Como se acepta Ho, no hay evidencia de una diferencia entre la experiencia
local (H, Lpez Gmez) y el IVSS Nacional.
TAREA 2:
La Superintendencia de Bancos (SUDEBAR) clasifica las cuentas por cobrar como actuales,
atrasadas e irrecuperables. Las cifras de la industria muestran que 60% de las cuentas por
cobrar es actual, 30% atrasado y 10% irrecuperable. El Banco Bicentenario en Barquisimeto,
agencia Terepaima tiene 500 cuentas por cobrar: 320 son actuales, 120 estn atrasadas y 60 son
irrecuperables. Concuerdan estas cifras con la distribucin de la industria? Utilice el nivel de
significancia del 5%.
Respuesta: La ji cuadrada calculada es igual 9,33; mientras que la ji tabulada es igual a 5,991. En
consecuencia, se rechaza la hiptesis nula.
9/10
Estadstica Inferencial
Ing. MSc Ramn Rincones
TABLA CHI-CUADRADO
La tabla Chi-cuadrado es usada para realizar pruebas de independencia, que nos permite determinar si existe una
relacin entre dos variables categricas. La prueba nos indica si existe o no una relacin entre las variables, pero no
indica el grado o el tipo de relacin; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la
variable que causa la influencia.
La tabla tiene dos entradas:
Alfa (): este valor hace referencia al nivel de confianza que deseamos que tengan los clculos de la
prueba; es decir, si queremos tener un nivel de confianza del 95%, el valor de alfa debe ser del 0.05, lo
cual corresponde al complemento porcentual de la confianza.
Grados de Libertad (k): Es un estimador del nmero de categoras independientes en la prueba de
independencia o experimento estadstico. Se encuentran mediante la frmula n-r, donde n=nmero de
sujetos y r es el nmero de grupos estadsticamente dependientes.
Fuente: file:///C:/Users/RAMONR~1/AppData/Local/Temp/chi_cuadrado.Tabla_temahtml.htm
10/10