Professional Documents
Culture Documents
ASOCIACIN DE VARIABLES
CUALITATIVAS O CATEGRICAS
Carmen M. Cadarso-Surez
eicadar@usc.es
A = { A1 , A2 ,......, Ai ,....., Ar }
B = { B1 , B2 ,......, B j ,....., Bs }
B2
Bj
Bs
A1
n11
n12
n1j
n1s
n1.
A2
n21
n22
n2j
n2s
n2.
Ai
ni1
ni2
nij
nis
ni.
Ar
nr1
nr2
nrj
nrs
nr.
n.1
n.2
n.j
n.s
PATOLOGA
inflam
neo
traum
otras
TIPO DE OPERACIN
pot_cont
contam
352
213
268
39
15
13
118
29
753
294
limpia
142
186
21
526
875
sucia
347
25
16
43
431
1054
518
65
716
2353
Para una mejor interpretacin, damos los porcentajes por filas o por columnas:
Tabla de contingencia PATOL * TIP_OPER
PATOL
inflam
neo
traum
otras
Total
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
Recuento
% de TIP_OPER
TIP_OPER
pot_cont
contam
352
213
46.7%
72.4%
268
39
35.6%
13.3%
15
13
2.0%
4.4%
118
29
15.7%
9.9%
753
294
100.0%
100.0%
limpia
142
16.2%
186
21.3%
21
2.4%
526
60.1%
875
100.0%
sucia
347
80.5%
25
5.8%
16
3.7%
43
10.0%
431
100.0%
Total
1054
44.8%
518
22.0%
65
2.8%
716
30.4%
2353
100.0%
mujer
Recuento
Esteatosis
3
Fibrosis
3
Hepatitis
23
Cirrosis
15
6.8%
6.8%
52.3%
34.1%
100.0%
45
24
47
24
140
32.1%
17.1%
33.6%
17.1%
100.0%
48
27
70
39
184
26.1%
14.7%
38.0%
21.2%
100.0%
% de SEXO
hombre
Recuento
% de SEXO
Total
Recuento
% de SEXO
Total
44
Fumar durante el embarazo es un factor de riesgo para el bajo peso nio al nacer?
madre fumadora y bajo peso del nio al nacer
PESO_N
FUMADORA
no
Recuento
% de FUMADORA
si
Recuento
% de FUMADORA
Total
Recuento
% de FUMADORA
>=2500 grs
86
<2500 grs
29
Total
115
74.8%
25.2%
100.0%
44
30
74
59.5%
40.5%
100.0%
130
59
189
68.8%
31.2%
100.0%
CONTRASTE DE ASOCIACIN
(asociacin)
A1
B1
n11
B2
n12
Bj
n1j
Bs
n1s
n1.
A2
n21
n22
n2j
n2s
n2.
Ai
ni1
ni2
nij
nis
ni.
Ar
nr1
n.1
nr2
n.2
nrj
n.j
nrs
n.s
nr.
n
i,j
A1
B1
e11
B2
e12
Bj
e1j
Bs
e1s
n1.
A2
e21
e22
e2j
e2s
n2.
Ai
ei1
ei2
eij
eis
ni.
Ar
er1
n.1
er2
n.2
erj
n.j
ers
n.s
nr.
n
donde
(n e )
2 = 11 11
e11
(n e )
+ 12 12
(n e )
+ ......... + rs rs
e12
ers
=
i =1 j =1
(n
ij
eij )
eij
2
el cual, bajo la hiptesis nula sigue una distribucin
r
=
2
i =1 j =1
(n
ij
eij )
eij
(2r 1)( s 1)
12 .
Asumo H0
2
6. Regla de decisin:
Si
2 > 12
Si
2 12
no
Recuento
% de Biopsia Heptica
s
Total
Cirrosis
Total
29
25.0%
25.9%
8.6%
10.3%
15.8%
36
20
64
35
155
75.0%
74.1%
91.4%
89.7%
84.2%
Recuento
% de Biopsia Heptica
Hepatitis
12
Recuento
% de Biopsia Heptica
Fibrosis
48
27
70
39
184
100.0%
100.0%
100.0%
100.0%
100.0%
no
Esteatosis
12
Recuento
Frecuencia esperada
7.6
Recuento
Frecuencia esperada
Total
Fibrosis
Cirrosis
Total
29
4.3
11.0
6.1
29.0
36
20
64
35
155
40.4
22.7
59.0
32.9
155.0
Recuento
Frecuencia esperada
Hepatitis
7
48
27
70
39
184
48.0
27.0
70.0
39.0
184.0
gl
Sig. asinttica
(bilateral)
.032
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Valor
8.803a
N de casos vlidos
184
=
2
i =1 j =1
(n
ij eij )
eij
(12 7.6 )
=
7.6
( 35 32.9 )
+ .......... +
32.9
= 8.803
2
12 = 0.95
= 7.81
p value = 0.032
2 = 8 .8
2 03
2
Como el p-value = p ( 3 > 8.803) = 0.032 < 0.05
<200
Recuento
<=30 aos
6
31-40 aos
30
>=41 aos
6
13.3%
19.9%
15.4%
17.9%
20
72
21
113
44.4%
47.7%
53.8%
48.1%
19
49
12
80
42.2%
32.5%
30.8%
34.0%
% de EDAD_CO
200-500
Recuento
% de EDAD_CO
>500
Recuento
% de EDAD_CO
Total
Recuento
% de EDAD_CO
Total
42
45
151
39
235
100.0%
100.0%
100.0%
100.0%
Pruebas de chi-cuadrado
Valor
2.508a
Chi-cuadrado de Pearson
N de casos vlidos
gl
4
Sig. asinttica
(bilateral)
.643
235
a.
r
2 =
(n
i =1 j =1
ij eij )
eij
= 2.508
2
12 = 0.95
= 9.49
p value = 0.643
2 =2.508
12
2
Como el p-value = p ( 4 > 2.508 ) = 0.643 > 0.05
( nij eij )
2 =
(2r 1)( s 1)
eij
i =1 j =1
Correccin de Yates
=
2
c
i =1 j =1
(n
ij
eij 0.5
eij
(2r 1)( s 1)
INFEC.SAV
Objetivo del estudio:
Identificar los factores pronstico de infeccin post-quirrgica
EDAD (aos)
SEXO
1=varn ; 2=mujer
PATOL (Patologa)
1=si ; 2=no.
DESNUTR (Desnutricin)
1=si; 2=no.
DIABETES
1=si; 2=no.
0=no; 1=si
EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de
operacin (tip_oper)
Analizar...
Estadsticos descriptivos......
Tablas de contingencia......
Filas= infec , Columnas= tip_oper
Casillas......columna (as tenemos el porcentaje de infeccin por cada tipo de operacin )
Estadsticos.......Chi-cuadrado
no
Recuento
% de TIP_OPER
si
sucia
247
1889
94.2%
80.6%
71.8%
57.3%
80.3%
Recuento
51
146
83
184
464
5.8%
19.4%
28.2%
42.7%
19.7%
875
753
294
431
2353
100.0%
100.0%
100.0%
100.0%
100.0%
Pruebas de chi-cuadrado
Chi-cuadrado de Pearson
Valor
263.828a
Sig. asinttica
(bilateral)
.000
Razn de verosimilitud
268.727
.000
262.198
.000
N de casos vlidos
Total
211
Recuento
% de TIP_OPER
contam
607
% de TIP_OPER
Total
pot_cont
824
gl
2353
REPRESENTACIN GRFICA
Grficos...
Diagramas de barras .....
agrupados....
Eje de categoras infec
Filas= infec , Columnas= tip_oper
Definir grupos por ........tip_oper
100
Porcentaje
80
60
TIP_OPER
40
limpia
pot_cont
20
contam
0
sucia
no
INFEC
si
EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y tipo de patologia
(patol):
Tabla de contingencia INFEC * PATOL
PATOL
inflam
INFEC
no
Recuento
% de PATOL
si
Recuento
% de PATOL
Total
Recuento
% de PATOL
neo
traum
otras
Total
829
379
45
636
1889
78.7%
73.2%
69.2%
88.8%
80.3%
225
139
20
80
464
21.3%
26.8%
30.8%
11.2%
19.7%
1054
518
65
716
2353
100.0%
100.0%
100.0%
100.0%
100.0%
EJEMPLO (infec.sav)
Comprobar si existe asociacin entre infeccin post-quirrgica (infec) y edad del
paciente (Nota: Trabajos previos indican que las personas con >=65 aos tienen ms
riesgo de infeccin ....)
La variable infec es binaria y la edad es contnua.
Podemos actuar de dos formas:
1) Utilizar el test de Mann-Whitney:
Informe
EDAD
INFEC
Media
Desv. tp.
Mnimo
Mximo
no
53.01
20.039
14
97
1887
si
61.21
18.509
15
96
464
Total
54.63
20.011
14
97
2351
120
Estadsticos de contrastea
100
EDAD
80
60
332239.5
W de Wilcoxon
2113568
40
-8.058
.000
20
EDAD
U de Mann-Whitney
0
N=
1887
464
no
si
INFEC
con lo que,
La infeccin post-quirrgica est significativamente asociada a la edad (p<0.001).
.....
Transformar..
Recodificar.....
en distintas variables....
Variable numrica edad
Variable de resultado edad_co
Valores antiguos y nuevos ........
Antiguo nuevo
65 thru Highest 1
Lowest thru 64.9991
Vista de variables
>=65 aos
Recuento
% de EDAD_CO
<65 aos
Recuento
% de EDAD_CO
Total
Recuento
% de EDAD_CO
651
si
245
Total
896
72.7%
27.3%
100.0%
1236
219
1455
84.9%
15.1%
100.0%
1887
464
2351
80.3%
19.7%
100.0%
Pruebas de chi-cuadrado
Valor
Sig. asinttica
(bilateral)
gl
Chi-cuadrado de Pearson
52.892b
.000
Correccin por
a
continuidad
52.119
.000
N de casos vlidos
2351
a.
b.
EJEMPLO (infec.sav)
Comprobar si existe asociacin entre Linfocitos% (linfopct) e infeccin postquirrgica (infec), pero considerando la variable Linfopct (que es contnua) como
categrica.
no
Recuento
% de LINF_CO
si
Recuento
% de LINF_CO
Total
Recuento
% de LINF_CO
linfocitosis
linfocitopenia
443
460
959
1862
88.2%
90.7%
72.9%
80.1%
59
47
356
462
11.8%
9.3%
27.1%
19.9%
502
507
1315
2324
100.0%
100.0%
100.0%
100.0%
Total
ANLISIS ESTRATIFICADOS
En ocasiones dos variables categricas estn (o no ) asociadas. Sin
embargo, puede existir una tercera variable , C, que modifica, confunde o
interacciona en la relacin entre A y B.
a) RELACIN ENTRE INFECCIN POST-QUIRRGICA Y DIABETES.
Tabla de contingencia DIABETES * INFEC
INFEC
no
DIABETES
si
97
si
45
Total
142
68.3%
31.7%
100.0%
1792
419
2211
81.0%
19.0%
100.0%
1889
464
2353
80.3%
19.7%
100.0%
Recuento
% de DIABETES
no
Recuento
% de DIABETES
Total
Recuento
% de DIABETES
Como se puede observar en la tabla de contingencia, la presencia de infeccin postoperatoria en diabticos es del 31.7% y en los no diabticos de un 19%.
>=65 aos
Recuento
% de EDAD_CO
<65 aos
Recuento
% de EDAD_CO
Total
Recuento
% de EDAD_CO
no
Total
95
801
896
10.6%
89.4%
100.0%
47
1408
1455
3.2%
96.8%
100.0%
142
2209
2351
6.0%
94.0%
100.0%
p<0.0001
Respondemos a estas preguntas, estratificando por edades (65, <65) y viendo en cada
subgrupo de edades la asociacin entre Infeccin post-quirrgica y diabetes.
Analizar...
Estadsticos descriptivos......
Tablas de contingencia......
Filas= diabetes , Columnas= infec
Casillas......filas (porcentaje de infeccin por diabetes si,no )
Capa 1 de 1=edad_co
Estadsticos.......Chi-cuadrado
no
DIABETES
si
Recuento
% de DIABETES
no
Total
<65 aos
DIABETES
29
95
69.5%
30.5%
100.0%
585
216
801
73.0%
27.0%
100.0%
651
245
896
72.7%
27.3%
100.0%
31
16
47
66.0%
34.0%
100.0%
1205
203
1408
85.6%
14.4%
100.0%
1236
219
1455
84.9%
15.1%
100.0%
Recuento
% de DIABETES
si
Recuento
% de DIABETES
no
Recuento
% de DIABETES
Total
Recuento
% de DIABETES
Total
66
Recuento
% de DIABETES
si
Pruebas de chi-cuadrado
EDAD_CO
>=65 aos
Valor
gl
Chi-cuadrado de Pearson
.542
.462
Correccin por
continuidad
.377
.539
N de casos vlidos
<65 aos
Sig. asinttica
(bilateral)
896
Chi-cuadrado de Pearson
13.700
.000
Correccin por
continuidad
12.208
.000
N de casos vlidos
1455