Professional Documents
Culture Documents
& '
( $ 2))
!" # $ %&
*
$ !" " ! ," ( $" $ - ( .$ !-
"" & + % . / $$ & ,-, $ ," .
- % # ," 0 # $ ! 0 1
" 2 3( . 4 $ 4 $ " "
( $" $ - . # !/ " . " " ( $
"$ % $ ( .$ 2 . 3 !- - * . 5 . +% $ !" $ ," $
( .$ 2 6 3 *7 . 5 "4 +% # ," 8 . . 9 $ $ .$ -
$ ," 7 6 8 $ " % $ ," $ % $ !" :7 # ;
- . 7 . # "4 < $ 8 $ 7 " %
," $ ;" = $ - $ ( .$ $> ! > $ ( *>>+ ?
@
" ," ( $ % $ > * >+ & 4 $ ! ! ( " $= $
! 0 A # " - $= $ 9$ ! ! *#
$ ; + 0 B # 0 1 C
1) Introducción
Vamos a trabajar con el ejemplo de un estudio de obesidad e hipertensión. En esta base de
datos, la variable “obesidad” es categórica (obeso / no obeso) y querríamos saber si está
relacionada con el “sexo” (otra variable categórica con dos posibles valores, hombre / mujer);
esto es, responder a la pregunta ¿hay diferente proporción de obesos entre hombres y
mujeres?
Tablas de contingencia
Esta primera tabla explica el total de casos analizados y si hubo casos perdidos (individuos
que no tuvieran un valor recogido en alguna de las dos variables analizadas en el contraste).
Luego aparece la tabla de contingencia, que en este caso concreto es una tabla 2x2. Si
previamente habíamos señalado la casilla correspondiente (filas) en la pestaña "Casillas..."
se nos mostrarán los recuentos en cada celda y sus porcentajes respecto a la fila:
E inmediatamente aparece la ventana con el contraste Chi cuadrado. SPSS realiza la Chi
cuadrado y aporta también la corrección por continuidad (corrección de Yates), la razón de
verosimilitud, el test exacto de Fisher y otro contraste que se llama Asociación Lineal por
Lineal.
Pruebas de chi-cuadrado
Sig. asintótica Sig. exacta Sig. exacta
Valor gl (bilateral) (bilateral) (unilateral)
Chi-cuadrado de Pearson 4,482(b) 1 ,034
N de casos válidos 50
a. Calculado sólo para una tabla de 2x2.
b. 0 casillas (,0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 7,48.
Por último, el programa SPSS -si se lo hemos indicado marcando “Riesgo”- nos hace una
evaluación de la fuerza que asocia (o no) a ambas variables, calculando OR y RR. En la
siguiente salida vemos que la OR que ha calculado es 3,667 (hombre/mujer), que se lee: "los
hombres tienen un riesgo 3,7 veces el de las mujeres para tener obesidad".
!" # $ %& " .; . !
Obeso No obeso
Hombre 22 6
Mujer 11 11
También nos aporta el IC95% para la OR, que se sitúa entre 1,072 y 12,547. Con ello
sabemos dos cosas: primero que el contraste de hipótesis debe ser significativo, esto es,
que se rechazará la hipótesis nula de la "no-asociación entre las dos variables", ya que la
OR no contiene el valor 1 (el riesgo de obesidad sería el mismo entre hombres y mujeres, y
por tanto no habría relación entre género y obesidad); segundo que el intervalo de confianza
es muy ancho y, por tanto, la estimación que hacemos de la verdadera OR (en la población)
muy imprecisa, llegando a concluir que el riesgo de obesidad es superior en hombres que en
mujeres, pero con un rango de incremento del riesgo que podría ir desde el 7% al 1.155%, o
lo que es lo mismo, que el riesgo de obesidad en hombres es entre 1,07 y 12,5 veces el de
las mujeres.
Estimación de riesgo
Por último podemos ver el gráfico de barras agrupadas para cada categoría de la variable
dependiente (en nuestro caso obesidad). A simple vista se aprecia la mayor proporción de
obesos entre los hombres.
Gráfico de barras
25 PR ESENC IA DE
OBESIDAD
obeso
no obeso
20
Recuento
15
10
0
hombre mujer
G ENE RO
Y ya en EPITABLE se activa la opción Describe > Proportion > Simple random sampling.
Numerator (numerador): individuos del grupo que tienen obesidad (en nuestro caso 22).
!" # $ %& " .; . !
Total Observations (denominador): total de individuos del grupo evaluado (en nuestro caso
28 hombres)
Vemos como para esta estimación puntual (78,57%) el programa EPIINFO calcula unos
intervalos de confianza (95% CI), por tres métodos. El más adecuado para muestras
pequeñas es el método exacto por la distribución binomial (Exact binomial 95% CI), que en
este caso da un valor entre 59,05% y 91,7%.
Ahora debe hacerse lo mismo en el grupo de mujeres. Abandonas (Quit) y vuelves a entrar,
para calcular la proporción de obesidad entre las mujeres, que es de 11 / 22 = 50%
Vemos que EPI-INFO calcula un IC95% para esta proporción que va de 28,22% a 71,78%.
Estos dos intervalos de confianza son muy grandes, por los pocos casos que hay en la
muestra analizada, y se superponen en un pequeño rango de valores (el que va desde
- $= D D" 7 - 0 A # ; . !%
$ ( 0 # 0 1 *+ - ( .$ !- #
7@ " *E +
59,05% a 71,78%), siendo muy difícil tomar una decisión con estos datos. La estimación de
la proporción verdadera de obesidad en la población de la que procede nuestra muestra es
muy imprecisa, por lo que aun siendo la estimación puntual muy diferente en el grupo de
hombres y de mujeres (78,6% versus 50%) no es posible asegurar con un bajo error a
equivocarse de que dicha diferencia no se deba al azar.
La segunda opción es la tradicional, con el contraste de hipótesis que nos permite adoptar
una decisión sobre la no-desigualdad (hipótesis nula) de dos proporciones. Entramos en
EPITABLE y activamos sucesivamente Compare > Proportion > Percentages
Y una vez dentro, debes seleccionar 2 en la pregunta ¿How many samples?, ya que
queremos comparar proporciones en dos grupos, los establecidos por la variable dicotómica
“sexo”. En el siguiente cuadro de diálogo debes introducir los porcentajes puntuales de
obesos en cada muestra (muestra 1 = hombres; muestra 2 = mujeres), y el número total de
observaciones en cada una de ellas. EPI-INFO calcula el test Chi cuadrado correspondiente,
que, como puedes comprobar, arroja idéntico resultado al obtenido con SPSS en la tabla de
contingencia.
En esta calculadora hemos de introducir nosotros directamente los valores de cada celdilla
de la tabla de contingencia, dándole a la tecla <enter> para pasar a la celdilla siguiente, y
finalmente a la tecla de función <F4> para calcular. Nos va a proporcionar tanto las medidas
de asociación (Odds ratio y Riesgo relativo) como sus intervalos de confianza (Límites de
Confianza), así como el test de hipótesis Chi cuadrado (Valor-Chi y Valor-P), con sus
correspondientes correcciones (de Mantel-Haenszel y de Yates).
- $= D D" 7 - 0 A # ; . !%
$ ( 0 # 0 1 *+ - ( .$ !- #
7@ " *E +
Enseguida se nos abre una pantalla que se titula “Tablas de contingencia: Tablas 2x2
simples”, donde debemos cumplimentar una serie de apartados:
Y las cuatro celdillas de la tabla, inicialmente vacías, donde vemos como en columnas están
los resultados, la Enfermedad, esto es, los efectos o variable dependiente, clasificados muy
“epidemiológicamente” como Enfermos y Sanos (en nuestro casos Obesos y No Obesos); y
en las filas el Factor de riesgo, la variable criterio o independiente, clasificados en Expuestos
y No expuestos (en nuestro caso se trataría de la variable “sexo”, y podríamos considerar
expuestos a los hombres y no expuestos a las mujeres, simplemente porque hay más
proporción de obesos entre los hombres y así la medida de asociación saldrá mayor de 1,
estaremos ante un factor de riesgo, y se leerá e interpretará mejor que si saliera menor de
1). Colocamos los recuentos que ya conocemos: 22, 6, 11, 11
Para que el programa realice los cálculos tenemos que recurrir al botón que simula una
pequeña calculadora de bolsillo en la barra de herramientas superior, y que ahora aparecerá
resaltada. Al pulsar sobre ella se abre la ventana de resultados, obteniéndose el siguiente
listado de texto:
- $= D D" 7 - 0 A # ; . !%
$ ( 0 # 0 1 *+ - ( .$ !- #
7@ " *E +
Tabla
Enfermos Sanos Total
------------ -------- -------- --------
Expuestos 22 6 28
No expuestos 11 11 22
------------ -------- -------- --------
Total 33 17 50
OR IC(95,0%)
--------- --------- ---------
3,666667 1,071564 12,546558 (Woolf)
1,097069 12,220558 (Cornfield)
ANEXO I
Tabla de datos “Bajo peso al nacer.xls”