You are on page 1of 50

APLICACIONES DE JI-

CUADRADO 2

Curso: ESTADSTICA APLICADA

Docente : Dr. AUGUSTO FRANKLIN MENDIBURU ROJAS

Alumno : Walter Acua Len


RELACIN ENTRE Z Y 2
RECORDAMOS QUE:
Z = YI / ; DONDE YI ES CADA VALOR DE LA VARIABLE
Y
Y LA RELACIN ES:
2 (1) = (Y /) 2 = Z 2

CUANDO SON DOS MUESTRAS ENTONCES:


2 (2) = (Y1 /) 2 + (Y2 /) 2= Z 12 + Z 22

PARA CUALQUIER TAMAO DE MUESTRA N, LA SUMA


DE
LOS VALORES DE Z2 TENDR UNA DISTRIBUCIN 2
CON N
GRADOS DE LIBERTAD
2 (2) = Z12 + Z22 + Z32 + .+ ZN2
CARACTERSTICAS
DE LA DISTRIBUCIN DE 2
2 ES SIEMPRE POSITIVO PORQUE ES UNA
SUMA DE CUADRADOS.
VARIA DESDE 0 A (NO TIENE VALORES
NEGATIVOS)
DEPENDE DEL PARMETRO GRADOS DE
LIBERTAD.
MEDIA DE LA DISTRIBUCIN = GL = K
VARIANZA DE LA DISTRIBUCIN = 2GL = 2K
MODA = GL-2 PARA GL2 Y 0 PARA GL=1
LA DISTRIBUCIN TIENE SESGO POSITIVO Y
CUANDO LOS GL AUMENTAN SE APROXIMA A
LA DISTRIBUCIN NORMAL
gl=2

gl=3
gl=4
gl=5

0 2 Chi2 6 8
TIPOS DE PRUEBA

DISTRIBUCIN JI
CUADRADA

UNA VARIABLE DOS VARIABLES

PRUEBA PRUEBA PRUEBA DE


DE BONDAD DE AJUSTE DE HOMOGENEIDAD INDEPENCENCIA
DISTRIBUCION 2
BONDAD DE AJUSTE
SE UTILIZA PARA LA COMPARACIN DE LA
DISTRIBUCIN DE UNA MUESTRA CON ALGUNA
DISTRIBUCIN TERICA QUE SE SUPONE DESCRIBE
A LA POBLACIN DE LA CUAL SE EXTRAJO.
INDEPENDENCIA
LA HO INDICA QUE DOS VARIABLES O CRITERIOS
DE CLASIFICACIN SON INDEPENDIENTES CUANDO
SE APLICAN A UN CONJUNTO DE INDIVIDUOS
(UNIDADES DE OBSERVACIN)
HOMOGENEIDAD
SE EXTRAEN MUESTRAS INDEPENDIENTES DE
VARIAS POBLACIONES Y SE PRUEBAN PARA VER SI
SON HOMOGNEAS CON RESPECTO A ALGN
CRITERIO DE CLASIFICACIN.
PRUEBA DE BONDAD DE AJUSTE

Se trata de probar si los datos de una muestra tomada


difieren de cierta distribucin predeterminada.
Los n datos (valores) tomados deben estar divididos en
categoras o intervalos mutuamente excluyentes y
observar la frecuencia de ocurrencia de los valores de
cada categora.
Se comparan las frecuencias observadas con
frecuencias esperadas.
Se basa en la Distribucin de Probabilidad multinomial
PROPIEDADES DE LA DISTRIBUCIN DE
PROBABILIDAD MULTINOMIAL

1. LA SITUACIN CONSISTE EN N OPORTUNIDADES


IDNTICAS.
2. PARA CADA OPORTUNIDAD HAY K POSIBLES
RESULTADOS.
3. LA PROBABILIDAD DE K RESULTADOS SON P1,
P2, ...... PK Y SE MANTIENEN CONSTANTES DE
ENSAYO EN ENSAYO DONDE P1 + P2 + ...... + PK = 1
4. LOS ENSAYOS SON INDEPENDIENTES.
5. LA VARIABLE ALEATORIA DE INTERS SON LOS
CONTEOS N1, N2, ...... NK EN CADA UNA DE LA K
CATEGORAS.
TRADUCIENDO
1. LA TASA DE OCUPACIN DE PACIENTES INTERNOS EN UN
HOSPITAL VA A SER EVALUADA EN 250 HOSPITALES (N).
2. PARA CADA HOSPITAL LA POSIBLE TASA DE OCUPACIN
VA DESDE 0 HASTA 110.0. ESTA TASA SE RESUMEN EN 8
(K) CATEGORAS: 0-39.9; 40-49.9; 50 -59.9; 60-69.9; 70-
79.9; 80.0 A 89.9; 90.0-99.9; 100.0-110.0
3. LA PROBABILIDAD DE ESTAR EN CATEGORA EN
PARTICULAR EST DADO POR P. LA SUMA LAS
PROBABILIDADES DE TODAS LAS CATEGORAS ES 1.
4. LA TASA DE OCUPACIN DE UN HOSPITAL ES
INDEPENDIENTE DE LA TASA DE OCUPACIN DE OTRO
HOSPITAL.
5. LA VARIABLE ALEATORIA DE INTERS SON LOS EL
NMERO DE HOSPITALES EN CADA CATEGORA N 1,
N2, ...... N8.
Categora Frecuencia
observada

K1 n1
PRUEBA K2 n2
DE K3 n3
BONDAD
K4 n4
DE AJUSTE
K5 n5
K6 n6
K7 n7
K8 n8
Total 250
PRUEBA DE BONDAD DE
AJUSTE
Las probabilidades pi , de caer en la categora i estn dadas por
la H0 , son constantes entre ensayos y suman 1.

La hiptesis nula es H0: pi = valores dados, es decir los datos


siguen una distribucin determinada con la cual se calcularn
las frecuencias esperadas.

La hiptesis alternativa H1: al menos una de las pi es distinta de


la probabilidad dada en la H0.
PRUEBA DE BONDAD DE AJUSTE

Las pruebas de bondad de ajuste son


herramientas tiles para evaluar lo bien que se
aproxima un modelo de una situacin real a un
diseo descrito previamente (modelo terico).

Por ejemplo, asumamos que tenemos un


conjunto de datos que se distribuyen
normalmente, as es que una prueba estadstica
particular puede ser usada.

Cmo podemos decidir si la suposicin o


hiptesis es vlida?
El test X2 para bondad de ajuste, compara
valores observados y esperados.

H0 : ha sido seleccionado de una poblacin que


tiene una distribucin especfica.

H1 : la muestra no ha sido seleccionada de una


poblacin que tiene la distribucin especfica.

Nota:

La hiptesis alterna no indica como la verdadera


distribucin difiere de la hipottica.
PRUEBA DE BONDAD DE AJUSTE :
DATOS
Categora Frecuencia observada

00.0-39.9 16/250
40.0-49.9 18
50.0-59.9 22
60.0-69.9 51
70.0-79.9 62
80.0-89.9 55
90.0-99.9 22
100.0-109.9 4
Total 250
PRUEBA DE BONDAD DE AJUSTE SUPUESTOS PARA LA PRUEBA DE
2

EXPERIMENTO MULTINOMIAL. LO QUE SE


SATISFACE TOMANDO UNA MUESTRA
ALEATORIA DE LA POBLACIN DE INTERS.
EL TAMAO DE MUESTRA ES LO
SUFICIENTEMENTE GRANDE PARA QUE EL
NMERO ESPERADO EN LAS CATEGORAS SEA
5, PARA ASEGURAR QUE 2 SE APROXIME A
LA DISTRIBUCIN REAL (MULTINOMIAL).
SE PUEDE RECURRIR A COLAPSAR
CATEGORAS CONTIGUAS (CELDAS) CON
VALORES ESPERADOS MENORES DE 5.
PRUEBA DE BONDAD DE AJUSTE:
HIPTESIS

HO: LA POBLACIN DE LA QUE SE EXTRAJO LA MUESTRA,


LAS TASAS DE OCUPACIN SIGUEN UNA DISTRIBUCIN
NORMAL.
HA: LA POBLACIN DE LA QUE SE EXTRAJO LA MUESTRA, LAS
TASAS DE OCUPACIN NO SIGUEN UNA DISTRIBUCIN
NORMAL.
PRUEBA DE BONDAD DE AJUSTE:
ESTADISTICA DE PRUEBA

2
O E
2 r ij ij 2 2
X y rechazar H 0 si X X1- (r - 1)
i1 E
ij

r = k = nmero de categoras.
PRUEBA DE BONDAD DE AJUSTE:
REGLA DE DECISION

SI EL VALOR DE LA PRUEBA ESTADSTICA (2 CALCULADO) ES


MAYOR QUE EL VALOR CRTICO (2 DE LA TABLA) SE
RECHAZA LA HIPTESIS NULA.

2 = 18.5
PRUEBA DE BONDAD DE AJUSTE : CALCULO DE LA ESTADISTICA
DE PRUEBA
Frecuencia
Frecuencia (Oi-Ei)2/Ei
Categora observada
Esperada

00.0-39.9 16 14.55 .145


40.0-49.9 18 22.18 .788
50.0-59.9 22 38.65 7.173
60.0-69.9 51 49.62 .038
70.0-79.9 62 50.48 2.629
80.0-89.9 55 38.38 7.19
90.0-99.9 22 21.88 .001
100.0-109.9 4 9.92 3.533
110.0 y mas 0 4.35 4.35
Total 250 250.0 25.854
PRUEBA DE BONDAD DE AJUSTE

DECISION ESTADISTICA: RECHAZO


CONCLUSION: LAS TASAS DE OCUPACION HOSPITALARIA
NO SIGUEN UNA DISTRIBUCION NORMAL
VALOR P < 0.01
Calculemos en el ejemplo las frecuencias esperadas en caso de
independencia. Observamos que, una vez calculados los datos de la
primera columna, los de la segunda se deducen automticamente (es
decir no son libres). Lo mismo ocurre con la ltima fila, una vez
calculadas las dos primeras, queda automticamente fijada. Por tanto
los grados de libertad son (3-1)x(2-1)=2=k (denotamos como k. los
grados de libertad)
En la tabla 2 mostramos las frecuencias esperadas en caso de independencia.
Observamos que los grados de libertad son slo 2, pues una vez calculadas una
frecuencia esperada en la primera fila y otra en la segunda, las dems se
deducen automticamente, si no queremos variar los totales de filas y
columnas.
Observamos, al comparar las tablas 1 y 2 que en primer clase hay
mayor frecuencia observada que la esperada de supervivencia si no
hubiese relacin entre supervivencia y clase social. Mientras en
segunda clase hay unos pocos ms de lo esperado y en tercera casi
la mitad de lo esperado. El salvamento no fue entonces equitativo!
A continuacin llevamos a cabo los clculos del estadstico Chi-
cuadrado:
Los grados de libertad, en este caso son k= (3-1)x(2-1) = 2.

En la figura 1 mostramos la forma que toma el estadstico Chi-cuadrado, en caso de


variables independientes, para diverso nmero de grados de libertad. Como hemos
indicado, a mayor nmero de grados de libertad el valor ser mayor. As, para 4 grados
de libertad la moda (valor ms probable) se sita cerca del valor 5, mientras que para 32
grados de libertad se sita cerca de 39.

El valor obtenido 174,4 es muy poco probable en caso de independencia, pues


observamos que para 2 grados de libertad los valores mayores que 10 apenas aparece.
De hecho la probabilidad de obtener un valor mayor que 10,6 es slo 0,005. Deducimos
que el salvamento de los viajeros en el Titanic no fue independiente de su clase social.
PRUEBAS BASADAS EN LA DISTRIBUCION
CHI-CUADRADA

Las pruebas de independencia y de


homogeneidad estn entre las ms
comnmente usadas en los
procedimientos estadsticos.

Estos test estn basados en una tcnica


introducida por Karl Pearson en 1900,
quin ha sido llamado el "fundador de la
ciencia estadstica".
TABLAS DE CONTINGENCIA

INDEPENDENCIA
EXPERIMENTO MULTINOMIAL CON CLASIFICACIN
CON 2 FACTORES.
LOS DATOS SE PUEDEN RESUMIR EN UNA TABLA DE
2 DIMENSIONES.
LA HO INDICA QUE 2 VARIABLES O CRITERIOS DE
CLASIFICACIN SON INDEPENDIENTES CUANDO SE
APLICAN A UN CONJUNTO DE INDIVIDUOS. LA
PRUEBA DE INDEPENDENCIA SE EFECTA PARA
PROBAR SI HAY ASOCIACIN ENTRE LAS VARIABLES
CATEGRICAS A Y B
TOTALES MARGINALES ALEATORIOS
TABLAS DE CONTINGENCIA
HOMOGENEIDAD
SE EXTRAEN MUESTRAS INDEPENDIENTES DE
VARIAS POBLACIONES.

SE PRUEBAN PARA VER SI SON HOMOGNEAS


CON RESPECTO A ALGN CRITERIO DE
CLASIFICACIN.

LA PRUEBA DE HOMOGENEIDAD ES UNA


GENERALIZACIN DE LA PRUEBA DE IGUALDAD DE
DOS PROPORCIONES. SE TRATA DE PROBAR SI
PARA CADA NIVEL DE LA VARIABLE B, LA
PROPORCIN CON RESPECTO A CADA NIVEL DE LA
VARIABLE A ES LA MISMA
HIPTESIS
LAS HIPTESIS DE INDEPENDENCIA :

HO: LAS VARIABLES A Y B SON INDEPENDIENTES


P(AB)=P(A) P(B)

H1 : LAS VARIABLES A Y B ESTN ASOCIADAS


HIPTESIS
LAS HIPTESIS DE HOMOGENEIDAD:

HO: LAS PROPORCIONES DE CADA VALOR DE LA VARIABLE A SON IGUALES


EN CADA CATEGORA DE LA VARIABLE B.

HA: AL MENOS UNA DE LAS PROPORCIONES ES DIFERENTE.


PRUEBAS DE INDEPENDENCIA Y
HOMOGENEIDAD
AMBAS HIPTESIS SE PRUEBAN USANDO UNA PRUEBA DE
JI-CUADRADO:
r c (Oij Eij ) 2
2
i 1 j 1 Eij

DONDE OIJ ES LA FRECUENCIA OBSERVADA DE LA CELDA


QUE EST EN LA FILA I, COLUMNA J
ES LA FRECUENCIA ESPERADA DE LA CELDA (I, J). Eij c j ri
n

LA FRECUENCIA ESPERADA ES AQUELLA QUE SERA


ESPERABLE ENCONTRAR SI LA HIPTESIS NULA ES
VERDADERA.

.
PRUEBAS DE INDEPENDENCIA Y
HOMOGENEIDAD

EL ESTADSTICO DE LA PRUEBA SE
DISTRIBUYE COMO UNA
gl (r CHI-CUADRADA
1) (c 1)


2 2

LA HIPTESIS NULA SE RECHAZA SI,cal 1

DONDE LFA ES EL NIVEL DE SIGNIFICANCIA.


PRUEBA DE INDEPENDENCIA

SE PIENSA QUE CIERTO MEDICAMENTO ES UN FACTOR QUE EST


ASOCIADO A LA INCONTINENCIA URINARIA. A LOS EFECTOS DE
PROBAR SUS DICHOS REALIZ UN ESTUDIO EN UN HOSPITAL
DONDE LOS QUE USABAN EL MEDICAMENTO LOS CLASIFIC
COMO USUARIOS DEL MEDICAMENTO (M) Y NO USUARIOS DEL
MEDICAMENTOS (NM) Y CON INCONTINENCIA (IU) Y SIN
INCONTINENCIAS (NIU) URINARIAS OBTENIENDO LOS SIGUIENTES
RESULTADOS.
PRUEBA DE INDEPENDENCIA

C x F/ n = 41 X791/3225 3184 x 791/ 3225 = 780.9


=10.06
41 x 2434/3225 = 30.9 3184 X 2434 /3225 = 2403.

X = (34 -10.06)2/10.06 + ( 757-780.9)2/780.9 + (7-30.9)2/30.9 +


(2427-2403)2/2403 = 76.43
CUANDO SE USA CHI-
CUADRADA
PARA TABLAS 2 X 2
SI EL TOTAL DEL TAMAO DE MUESTRA ES
> 40, ENTONCES X2 PUEDE SER USADA.
SI N EST ENTRE 20 Y 40, Y EL VALOR
ESPERADO MS PEQUEO ES 5, X2 PUEDE
SER USADA.
DE OTRA FORMA, SE USA EL VALOR EXACTO
DE FISHER.
PARA TABLAS 2 X C
LA PRUEBA X2 ES VLIDA SI NO MS DEL
20% DE LOS VALORES ESPERADOS ES
MENOS DE 5, Y NINGUNO ES MENOS DE 1.
LA PRUEBA CHI-CUADRADO DE INDEPENDENCIA.

2.764 fueron clasificados de acuerdo a sus ingresos y el


tiempo transcurrido desde que ellos consultaron por
ltima vez a un mdico.

Ingresos Tiempo TOTAL


(en miles) < 6 meses 7 -12 meses > 12 meses

<200 186 38 35 259


200 - 300 227 54 45 326
301 - 300 219 78 78 375
501 - 800 355 112 140 607
>801 653 285 259 1.197

TOTAL 1.604 567 557 2.764


Proporcionan estos datos evidencia suficiente para
indicar que existe una asociacin entre el ingreso y el
tiempo transcurrido desde la ltima consulta al
mdico?.

Si no existe asociacin entre las dos


variables se dice que son independientes.

Dos variables son independientes cuando la


distribucin de una de ellas no depende de la
distribucin de la otra.

Dos variables son independientes si al conocer el


valor de una de ellas para un sujeto no ayuda para
determinar el valor de la otra variable para el mismo
sujeto.
H0 : LOS DOS CRITERIOS DE
CLASIFICACIN SON
INDEPENDIENTES.
H1 : LOS DOS CRITERIOS DE
CLASIFICACIN NO SON
Se comparan las celdas de frecuencias observadas con
INDEPENDIENTES.
las celdas de frecuencias esperadas y se usa la
estadstica :
2

Oij E ij
f c 2 2
x x f 1 c 1
x2 donde
il j1 E
ij


y la decisin es rechazar H0 a un nivel de significacin
si el valor calculado de la estadstica X2 excede el valor
de tabla :
x12 f 1 c 1
H0 : el ingreso y el tiempo transcurrido desde la ltima visita
al mdico son independientes.
H1: las dos variables no son independientes.

LA ESTADSTICA DE PRUEBA
CALCULADA ES DE 47.9 PARA 8
GRADOS DE LIBERTAD AL 95%. EL
VALOR CRTICO ES 15.507.

POR LO TANTO SE RECHAZA LA


HIPTESIS NULA
PRUEBA DE HOMOGENEIDAD.

Esta prueba se usa para comparar proporciones


en dos o ms muestras.

H0 : las k poblaciones son "homogneas" con


respecto a la proporcin de sujetos que
poseen la caracterstica de inters.

En general se selecciona una muestra de


cada poblacin en estudio y los sujetos se
clasifican de acuerdo a una caracterstica de
inters.
La estadstica que se usa en esta prueba es
la misma que se usa para la prueba de
independencia :

2

O E

f c ij ij
x2
il j1 E
ij

y se rechaza

2 2
H O si x x1 (r 1)(c 1)
Para determinar la conciencia pblica y preocupacin por
la contaminacin atmosfrica, se entrevist a una muestra
de 40 residentes en cada una de tres reas de Trujillo. La
pregunta fue :
es la contaminacin atmosfrica un problema en su
vecindario?.

AREA NO SI DUDA NO SABE TOTAL


NORTE 5 31 2 2 40
SUR 10 21 4 5 40
ORIENTE 11 20 7 2 40
TOTAL 26 72 13 9 120
H0 : las tres poblaciones de residentes son
homogneas con respecto al conocimiento de los
problemas de la polucin.
H1 : las tres poblaciones no son homogneas..

LA ESTADSTICA CALCULADA ES DE 10.97. EL


VALOR CRTICO ES 12.59. POR LO TANTO NO HAY
EVIDENCIA PARA RECHAZAR LA HIPTESIS NULA.
GRACIAS

You might also like