You are on page 1of 20

TEST Chi-Cuadrado

ASOCIACIN DE VARIABLES
CUALITATIVAS O CATEGRICAS

Carmen M. Cadarso-Surez
eicadar@usc.es

En ocasiones, el investigador est interesado en el estudio de una posible


Asociacin entre dos variables categricas A y B

A = { A1 , A2 ,......, Ai ,....., Ar }

B = { B1 , B2 ,......, B j ,....., Bs }

A, presentando r niveles de respuesta, y B con s niveles de respuesta.


EJEMPLOS:
1. Asociacin entre Sobrepeso (si,no) e Hipertensin (si,no).
2. Bajo peso del nio al nacer (2500 grs, >2500 grs) y edad de la madre
(<40 aos, 40 aos).
3. Tipo de patologa (inflamatoria, neoplasia, traumtica, otras) y tipo de
operacin (limpia, potencialmente contaminada, contaminada, sucia).
4. Estado del paciente aquejado de artrosis (peor, igual, mejor) y tipo de
tratamiento recibido ( T1, T2)......
En la prctica, contamos con una tabla de contingencia r x s
B
B1

B2

Bj

Bs

A1

n11

n12

n1j

n1s

n1.

A2

n21

n22

n2j

n2s

n2.

Ai

ni1

ni2

nij

nis

ni.

Ar

nr1

nr2

nrj

nrs

nr.

n.1

n.2

n.j

n.s

En un estudio de Infecciones post-operatorias, interesa estudiar la asociacin entre patologa


y tipo de operacin:
Recuento

PATOLOGA

inflam
neo
traum
otras

TIPO DE OPERACIN
pot_cont
contam
352
213
268
39
15
13
118
29
753
294

limpia
142
186
21
526
875

sucia
347
25
16
43
431

1054
518
65
716
2353

Para una mejor interpretacin, damos los porcentajes por filas o por columnas:
Tabla de contingencia PATOL * TIP_OPER

PATOL

inflam
neo
traum
otras

Total

Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER

TIP_OPER
pot_cont
contam
352
213
46.7%
72.4%
268
39
35.6%
13.3%
15
13
2.0%
4.4%
118
29
15.7%
9.9%
753
294
100.0%
100.0%

limpia
142
16.2%
186
21.3%
21
2.4%
526
60.1%
875
100.0%

sucia
347
80.5%
25
5.8%
16
3.7%
43
10.0%
431
100.0%

Total
1054
44.8%
518
22.0%
65
2.8%
716
30.4%
2353
100.0%

Resultados de una biopsia heptica, se distribuyen por igual en ambos sexos?


Tabla de contingencia SEXO * Biopsia Heptica
Biopsia Heptica
SEXO

mujer

Recuento

Esteatosis
3

Fibrosis
3

Hepatitis
23

Cirrosis
15

6.8%

6.8%

52.3%

34.1%

100.0%

45

24

47

24

140

32.1%

17.1%

33.6%

17.1%

100.0%

48

27

70

39

184

26.1%

14.7%

38.0%

21.2%

100.0%

% de SEXO
hombre

Recuento
% de SEXO

Total

Recuento
% de SEXO

Total
44

Fumar durante el embarazo es un factor de riesgo para el bajo peso nio al nacer?
madre fumadora y bajo peso del nio al nacer
PESO_N
FUMADORA

no

Recuento
% de FUMADORA

si

Recuento
% de FUMADORA

Total

Recuento
% de FUMADORA

>=2500 grs
86

<2500 grs
29

Total
115

74.8%

25.2%

100.0%

44

30

74

59.5%

40.5%

100.0%

130

59

189

68.8%

31.2%

100.0%

CONTRASTE DE ASOCIACIN

Planteamos las siguientes hiptesis de trabajo:


Ho : A y B son INDEPENDIENTES (no asociacin)
H1 : A y B son DEPENDIENTES

(asociacin)

1. Partimos de un total de n individuos.


2. La tabla de frecuencias OBSERVADAS es:

A1

B1
n11

B2
n12

Bj
n1j

Bs
n1s

n1.

A2

n21

n22

n2j

n2s

n2.

Ai

ni1

ni2

nij

nis

ni.

Ar

nr1
n.1

nr2
n.2

nrj
n.j

nrs
n.s

nr.
n

3. Bajo la hiptesis nula de NO ASOCIACIN se tendra


P(AI Bj )= P(AI ) X P(Bj )

i,j

y entonces la tabla de frecuencias ESPERADAS bajo Ho sera :

A1

B1
e11

B2
e12

Bj
e1j

Bs
e1s

n1.

A2

e21

e22

e2j

e2s

n2.

Ai

ei1

ei2

eij

eis

ni.

Ar

er1
n.1

er2
n.2

erj
n.j

ers
n.s

nr.
n

donde

eij = ( ni. x n.j )/n

4. Construimos el estadstico distancia entre la tabla de frecuencias observadas y


frecuencias esperadas:

(n e )
2 = 11 11

e11

(n e )
+ 12 12

(n e )
+ ......... + rs rs

e12

ers

=
i =1 j =1

(n

ij

eij )

eij

2
el cual, bajo la hiptesis nula sigue una distribucin
r

=
2

i =1 j =1

(n

ij

eij )
eij

(2r 1)( s 1)

5. Fijar un nivel de significacin ( p.e. , 0.05), y construir el valor crtico

12 .

Asumo H0

2

6. Regla de decisin:
Si

2 > 12

rechazamos H0 y existe asociacin significativa (p-value < )

Si

2 12

asumimos H0 (p-value ). El test es no significativo (n.s.)

p-value =p (rechazar H0 con nuestra muestra particular ) =

p ( (2r 1)( s 1) > 2 ) .

Ejemplo: Existe asociacin significativa entre presencia de hepatomegalia y


enfermedad heptica (segn resultado de la biopsia)?
Tabla de contingencia hepatomegalia * Biopsia Heptica
Biopsia Heptica
Esteatosis
hepatomegalia

no

Recuento
% de Biopsia Heptica

s
Total

Cirrosis

Total

29

25.0%

25.9%

8.6%

10.3%

15.8%

36

20

64

35

155

75.0%

74.1%

91.4%

89.7%

84.2%

Recuento
% de Biopsia Heptica

Hepatitis

12

Recuento
% de Biopsia Heptica

Fibrosis

48

27

70

39

184

100.0%

100.0%

100.0%

100.0%

100.0%

Aplicamos el test chi-cuadrado y la salida del SPSS es la siguiente:


Tabla de contingencia hepatomegalia * Biopsia Heptica
Biopsia Heptica
hepatomegalia

no

Esteatosis
12

Recuento
Frecuencia esperada

7.6

Recuento
Frecuencia esperada

Total

Fibrosis

Cirrosis

Total

29

4.3

11.0

6.1

29.0

36

20

64

35

155

40.4

22.7

59.0

32.9

155.0

Recuento
Frecuencia esperada

Hepatitis
7

48

27

70

39

184

48.0

27.0

70.0

39.0

184.0

gl

Sig. asinttica
(bilateral)
.032

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson

Valor
8.803a

N de casos vlidos

184

a. 1 casillas (12.5%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 4.3.
r

=
2

i =1 j =1

(n

ij eij )

eij

Fijado =0.05 , el valor crtico es

(12 7.6 )
=
7.6

( 35 32.9 )
+ .......... +
32.9

= 8.803

2
12 = 0.95
= 7.81

p value = 0.032

2 = 8 .8
2 03

2
Como el p-value = p ( 3 > 8.803) = 0.032 < 0.05

Existe asociacin significativa entre presencia de hepatomegalia y tipo de


enfermedad heptica (p=0.032, o tambin, p<0.05)

Ejemplo (estudio en pacientes VIH/SIDA):


Existe asociacin significativa entre la edad del paciente y sus niveles de linfocitos
CD4?
Tabla de contingencia CD4_CO * EDAD_CO
EDAD_CO
CD4_CO

<200

Recuento

<=30 aos
6

31-40 aos
30

>=41 aos
6

13.3%

19.9%

15.4%

17.9%

20

72

21

113

44.4%

47.7%

53.8%

48.1%

19

49

12

80

42.2%

32.5%

30.8%

34.0%

% de EDAD_CO
200-500

Recuento
% de EDAD_CO

>500

Recuento
% de EDAD_CO

Total

Recuento
% de EDAD_CO

Total
42

45

151

39

235

100.0%

100.0%

100.0%

100.0%

Pruebas de chi-cuadrado

Valor
2.508a

Chi-cuadrado de Pearson
N de casos vlidos

gl
4

Sig. asinttica
(bilateral)
.643

235

a.
r

2 =

(n

i =1 j =1

Fijado =0.05 , el valor crtico es

ij eij )

eij

= 2.508

2
12 = 0.95
= 9.49

p value = 0.643

2 =2.508

12

2
Como el p-value = p ( 4 > 2.508 ) = 0.643 > 0.05

No existe asociacin significativa entre edad del paciente y niveles de linfocitos


CD4 (p=0.643, o simplemente, n.s.)

CORRECCIN POR CONTINUIDAD (Yates)

En aquellos casos en que las frecuencias esperadas eij son <5


se recomienda realizar una correccin por continuidad del
estadstico
r

( nij eij )

2 =

(2r 1)( s 1)

eij

i =1 j =1

Correccin de Yates

=
2
c

i =1 j =1

(n

ij

eij 0.5
eij

(2r 1)( s 1)

INFEC.SAV
Objetivo del estudio:
Identificar los factores pronstico de infeccin post-quirrgica
EDAD (aos)
SEXO

1=varn ; 2=mujer

PATOL (Patologa)

1=inflamatoria; 2=neoplasia;3=trauma; 4=otras.

TIP_OPER (tipo operacin)


1=limpia; 2=potencialente contaminada; 3=contaminada; 4=sucia
ALB (albmina)
HB (Hemoglobina)
HCTO (Hematocrito)
LEUCOS (Leucocitos)
LINFOPCT (Linfocitos (%))
HEMAT (Hemates)
GLUC (Glucosa)
OBES (Obesidad)

1=si ; 2=no.

DESNUTR (Desnutricin)

1=si; 2=no.

DIABETES

1=si; 2=no.

INFEC = Infeccin post-quirrgica

0=no; 1=si

EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de
operacin (tip_oper)
Analizar...
Estadsticos descriptivos......
Tablas de contingencia......
Filas= infec , Columnas= tip_oper
Casillas......columna (as tenemos el porcentaje de infeccin por cada tipo de operacin )
Estadsticos.......Chi-cuadrado

Tabla de contingencia INFEC * TIP_OPER


TIP_OPER
limpia
INFEC

no

Recuento
% de TIP_OPER

si

sucia
247

1889

94.2%

80.6%

71.8%

57.3%

80.3%

Recuento

51

146

83

184

464

5.8%

19.4%

28.2%

42.7%

19.7%

875

753

294

431

2353

100.0%

100.0%

100.0%

100.0%

100.0%

Pruebas de chi-cuadrado

Chi-cuadrado de Pearson

Valor
263.828a

Sig. asinttica
(bilateral)
.000

Razn de verosimilitud

268.727

.000

Asociacin lineal por


lineal

262.198

.000

N de casos vlidos

Total

211

Recuento

% de TIP_OPER

contam

607

% de TIP_OPER
Total

pot_cont

824

gl

2353

a. 0 casillas (.0%) tienen una frecuencia esperada inferior a 5.


La frecuencia mnima esperada es 57.98.

REPRESENTACIN GRFICA
Grficos...
Diagramas de barras .....
agrupados....
Eje de categoras infec
Filas= infec , Columnas= tip_oper
Definir grupos por ........tip_oper

100

Porcentaje

80

60

TIP_OPER

40

limpia
pot_cont

20

contam
0

sucia
no

INFEC

si

EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de patologia
(patol):
Tabla de contingencia INFEC * PATOL
PATOL
inflam
INFEC

no

Recuento
% de PATOL

si

Recuento
% de PATOL

Total

Recuento
% de PATOL

neo

traum

otras

Total

829

379

45

636

1889

78.7%

73.2%

69.2%

88.8%

80.3%

225

139

20

80

464

21.3%

26.8%

30.8%

11.2%

19.7%

1054

518

65

716

2353

100.0%

100.0%

100.0%

100.0%

100.0%

EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y edad del
paciente (Nota: Trabajos previos indican que las personas con >=65 aos tienen ms
riesgo de infeccin ....)
La variable infec es binaria y la edad es contnua.
Podemos actuar de dos formas:
1) Utilizar el test de Mann-Whitney:
Informe
EDAD
INFEC

Media

Desv. tp.

Mnimo

Mximo

no

53.01

20.039

14

97

1887

si

61.21

18.509

15

96

464

Total

54.63

20.011

14

97

2351

120

Estadsticos de contrastea

100

EDAD

80

60

332239.5

W de Wilcoxon

2113568

40

-8.058

Sig. asintt. (bilateral)

.000

a. Variable de agrupacin: INFEC

20

EDAD

U de Mann-Whitney

0
N=

1887

464

no

si

INFEC

con lo que,
La infeccin post-quirrgica est significativamente asociada a la edad (p<0.001).

2) Categorizar edad en edad_co: 65 aos, <65aos ,


Edad_co = 1 si edad 65.
Edad_co = 2 si edad <65.
2

y contrastar la posible asociacin entre infec y edad_co con el test

.....

Cmo categorizar variables en el SPSS?

Transformar..
Recodificar.....
en distintas variables....
Variable numrica edad
Variable de resultado edad_co
Valores antiguos y nuevos ........
Antiguo nuevo
65 thru Highest 1
Lowest thru 64.9991

Entonces se crea la variable edad_co que el SPSS incorpora automticamente en la


base de datos.....

Antes de continuar, podemos ponerle etiquetas (labels) a los valores de edad_co

Vista de variables

Asociacin entre infec y edad_co....

Tabla de contingencia EDAD_CO * INFEC


INFEC
no
EDAD_CO

>=65 aos

Recuento
% de EDAD_CO

<65 aos

Recuento
% de EDAD_CO

Total

Recuento
% de EDAD_CO

651

si
245

Total
896

72.7%

27.3%

100.0%

1236

219

1455

84.9%

15.1%

100.0%

1887

464

2351

80.3%

19.7%

100.0%

Pruebas de chi-cuadrado
Valor

Sig. asinttica
(bilateral)

gl

Chi-cuadrado de Pearson

52.892b

.000

Correccin por
a
continuidad

52.119

.000

N de casos vlidos

2351

a.
b.

La edad esta significativamente asociada a la infeccin post-quirrgica (p-value<0.001):


La presencia de infeccin es de un 27% en pacientes 65 aos, frente a un 15.1% en
pacientes <65 aos.

EJEMPLO (infec.sav)

Comprobar si existe asociacin entre Linfocitos% (linfopct) e infeccin postquirrgica (infec), pero considerando la variable Linfopct (que es contnua) como
categrica.

1. Categorizamos la variable Linfopct en tres niveles:


1= Normal = 25% linfopct 33%
2=linfocitosis = linfopct > 33%
3=linfocitopenia = linfopct < 25%.
creando la variable categrica linf_co.

2. Obtenemos la siguiente tabla de contingencia de infec y linf_co:

Tabla de contingencia INFEC * LINF_CO


LINF_CO
normal
INFEC

no

Recuento
% de LINF_CO

si

Recuento
% de LINF_CO

Total

Recuento
% de LINF_CO

linfocitosis

linfocitopenia

443

460

959

1862

88.2%

90.7%

72.9%

80.1%

59

47

356

462

11.8%

9.3%

27.1%

19.9%

502

507

1315

2324

100.0%

100.0%

100.0%

100.0%

3. Aplicamos el test chi-cuadrado obteniendo un p-value<0.001.

Total

ANLISIS ESTRATIFICADOS
En ocasiones dos variables categricas estn (o no ) asociadas. Sin
embargo, puede existir una tercera variable , C, que modifica, confunde o
interacciona en la relacin entre A y B.
a) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES.
Tabla de contingencia DIABETES * INFEC
INFEC
no
DIABETES

si

97

si
45

Total
142

68.3%

31.7%

100.0%

1792

419

2211

81.0%

19.0%

100.0%

1889

464

2353

80.3%

19.7%

100.0%

Recuento
% de DIABETES

no

Recuento
% de DIABETES

Total

Recuento
% de DIABETES

En la muestra global, existe una asociacin estadsticamente significativa entre diabetes e


infeccin post-quirrgica (p<0.001).

Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 31.7% y en los no diabticos de un 19%.

b) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES, ESTRATIFICADA POR EDAD.

Como ya sabemos la edad_co y la diabetes, por separado, estn significativamente


asociadas a la infeccin post-operatoria.

En la siguiente tabla podemos comprobar que edad_co y diabetes estn asociadas:


Tabla de contingencia EDAD_CO * DIABETES
DIABETES
si
EDAD_CO

>=65 aos

Recuento
% de EDAD_CO

<65 aos

Recuento
% de EDAD_CO

Total

Recuento
% de EDAD_CO

no

Total

95

801

896

10.6%

89.4%

100.0%

47

1408

1455

3.2%

96.8%

100.0%

142

2209

2351

6.0%

94.0%

100.0%

p<0.0001

Observamos que la presencia de diabetes es mayor en pacientes 65 aos (10.6%) que en


pacientes <65 aos (3.2%).

Si eliminamos el efecto de la edad pdemos decir que la diabetes est asociada a la


infeccin post-quirrgica?en qu sentido?

Respondemos a estas preguntas, estratificando por edades (65, <65) y viendo en cada
subgrupo de edades la asociacin entre Infeccin post-quirrgica y diabetes.

ANLISIS ESTRATIFICADOS EN EL SPSS

Analizar...
Estadsticos descriptivos......
Tablas de contingencia......
Filas= diabetes , Columnas= infec
Casillas......filas (porcentaje de infeccin por diabetes si,no )
Capa 1 de 1=edad_co
Estadsticos.......Chi-cuadrado

obteniendo como resultados.......

Tabla de contingencia DIABETES * INFEC * EDAD_CO


INFEC
EDAD_CO
>=65 aos

no
DIABETES

si

Recuento
% de DIABETES

no
Total
<65 aos

DIABETES

29

95

69.5%

30.5%

100.0%

585

216

801

73.0%

27.0%

100.0%

651

245

896

72.7%

27.3%

100.0%

31

16

47

66.0%

34.0%

100.0%

1205

203

1408

85.6%

14.4%

100.0%

1236

219

1455

84.9%

15.1%

100.0%

Recuento
% de DIABETES
si

Recuento
% de DIABETES

no

Recuento
% de DIABETES

Total

Recuento
% de DIABETES

Total

66

Recuento
% de DIABETES

si

Pruebas de chi-cuadrado
EDAD_CO
>=65 aos

Valor

gl

Chi-cuadrado de Pearson

.542

.462

Correccin por
continuidad

.377

.539

N de casos vlidos
<65 aos

Sig. asinttica
(bilateral)

896

Chi-cuadrado de Pearson

13.700

.000

Correccin por
continuidad

12.208

.000

N de casos vlidos

1455

1) Para pacientes con 65 aos:


No existe asociacin significativa entre diabetes e infeccin post-quirrgica (p=0.539):
Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 30.5% y en los no diabticos de un 27%.
2) Para pacientes con <65 aos:
La relacin entre diabetes e infeccin post-quirrgica es significativa (p<0.001):
Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 34% y en los no diabticos de un 14%.

You might also like