You are on page 1of 26

Anlisis estadstico de datos epidemiolgicos

Curso pre-congreso Congreso de Microbiologa Universidad de Antioquia

Contenido
CLASIFICACIN DE VARIABLES SEGN ESCALA Y USO .................................................................. 3 Clasificacin de variables segn escala ..................................................................................... 3 Variables cualitativas............................................................................................................. 3 Variables numricas .............................................................................................................. 3 Clasificacin de variables segn uso ......................................................................................... 4 Variables de respuesta .......................................................................................................... 4 Variables independientes ...................................................................................................... 4 OPERACIONALIZACIN DE VARIABLES .......................................................................................... 5 Definicin conceptual................................................................................................................ 5 Definicin operacional .............................................................................................................. 5 CONSTRUCCIN DE BASES DE DATOS ........................................................................................... 6 ESTUDIOS EPIDEMIOLGICOS ....................................................................................................... 7 Definicin de epidemiologa, incidencia y prevalencia ............................................................. 7 Epidemiologa ........................................................................................................................ 7 Incidencia y prevalencia ........................................................................................................ 7 Medidas de riesgo ..................................................................................................................... 7 Tablas 22 ............................................................................................................................. 8 Riesgo relativo ....................................................................................................................... 8 Razn de odds ....................................................................................................................... 9 Tipos de estudios epidemiolgicos ......................................................................................... 10 Estudios observacionales .................................................................................................... 10 Estudios de intervencin ..................................................................................................... 20 Grupos paralelos ................................................................................................................ 21 Cross-over .......................................................................................................................... 22 Estudios secuenciales ........................................................................................................ 22 PRESENTACIN DE RESULTADOS EPIDEMIOLGICOS ................................................................ 23 VARIABLES DE CONFUSIN E INTERACCIN ............................................................................... 24 ANLISIS DE REGRESIN LOGSTICA ........................................................................................... 26 Modelo de regresin logstica con dos variables .................................................................... 26 Sin interaccin ..................................................................................................................... 26 Con interaccin ................................................................................................................... 26

CLASIFICACIN DE VARIABLES SEGN ESCALA Y USO


que admiten diferentes El trmino variable se define como las caractersticas o atributos que 1 valores como por ejemplo la estatura, edad, el cociente intelectual, la temperatura, la presin sistlica, etc. Existen diferentes formas para clasificar variables. A continuacin se ofrece una clasificacin segn la escala y otra segn el uso.

Clasificacin de variables segn escala

Variables cualitativas Si sus valores o niveles no se pueden asociar naturalmente a un nmero y por tanto no es posible realizar operaciones algebraicas con ellos. Este tipo de variables representan una cualidad o atributo que clasifica a cada elemento de estudio en una de varias categoras o niveles. La situacin ms sencilla corresponde a las variables dicotmicas o binarias donde se clasifica a cada elemento en una u de las dos posibles categoras. Por ejemplo el sexo (hombre/mujer), estatus de enfermedad (enfermo/sano), (enfermo/ uso de cigarrillo (fumador/no (fumador/ fumador), etc. En n muchas ocasiones ocas este tipo de clasificacin n no es suficiente exigiendo mayor nmero de categoras (color color de los ojos, ojos grupo sanguneo, neo, calidad de un servicio bueno/regular/malo, etc.). ). A su vez, las l variables cualitativas se pueden ser de dos tipos: 1. Variables nominales: cuando las categoras no mantienen una relacin relaci de orden entre s. Ejemplo: color de los ojos, sexo, profesin, profesin, presencia o ausencia de un factor de riesgo o enfermedad, etc. 2. Variables ordinales: cuando las categoras guardan un orden entre s. Ejemplo: calidad de un servicio (bueno/regular/malo), efectividad de un tratamiento (efectivo/no efectivo), calificacin del desempeo (alto/medio/bajo), etc. Entre este tipo de variables se encuentran escalas empleadas para medir caractersticas intangibles. Una de stas es por ejemplo la escala tipo Likert. Variables numricas Corresponde a variables que pueden medirse, cuantificarse o expresarse numricamente y por tanto tiene sentido realizar operaciones algebraicas con sus valores. Las variables de escala numrica pueden ser de dos tipos:

DAry Ary L, Jacobs Ch y Razavieh A (1982). Introduccin a la investigacin pedaggica, 2da Ed. Interamericana, Mxico.

1. Variables discretas: si toman valores enteros y en ningn caso tiene sentido un valor intermedio entre dos enteros consecutivos. Ejemplo: nmero de hijos nacidos vivos, nmero de embarazos durante toda la vida, nmero de hermanos, etc. 2. Variables continuas: si admiten cualquier valor real. Ejemplo: estatura, dimetro, velocidad, presin, peso, etc. Entre dos enteros consecutivos existen infinitos nmeros.

Clasificacin de variables segn uso

Variables de respuesta Se relacionan directamente con el e objetivo de la investigacin. . Este tipo de variables se conocen tambin como variables dependientes y suelen ser denotadas con la letra y. Variables independientes Corresponden a caractersticas asociadas a la variable respuesta. Tambin se conocen como variables explicativas y en ciertas ocasiones pueden ser consideradas como las causantes de la respuesta. Suelen ser denotadas con la letra x. En muchos estudios el objetivo principal es comprobar cundo ndo una o ms variables independientes influyen o alteran alteran a la variable respuesta, es decir, si la variable independiente produce algn cambio significativo en la variable respuesta. En el siguiente diagrama se esquematiza la relacin entre las variables de respuesta e las explicativas:

Donde k representa el nmero total de variables explicativas incluidas en el estudio.

OPERACIONALIZACIN DE VARIABLES
Una vez planteado el problema y establecido la(s) pregunta(s) de investigacin, es imprescindible definir las variables que sern analizadas en el estudio. Al respecto se debe clarificar lo que son definiciones conceptuales y definiciones operacionales.

Definicin conceptual
Las definiciones conceptuales o constitutivas corresponden a las contenidas en un diccionario o que se derivan de las teoras o de la literatura cientfica. Ejemplo. Inteligencia: (del latn intelligenta). 1) Capacidad de entender o comprender. 2) Capacidad de resolver problemas. 3) Conocimiento, comprensin, acto de entender.

Definicin operacional
Corresponde al significado de la variable en el contexto del estudio. La definicin operacional ayuda a especificar los procedimientos que describen las actividades que se deben registrar para obtener el dato de la variable. Con esto, se deja claro qu se est entendiendo por cada variable, qu tipo de variable se trata y cul sera la manera de resumir sus valores (cuantitativos o cualitativos). Ejemplo. Inteligencia (en determinado estudio): coeficiente intelectual medido con la prueba Stanfortd Binet. La operacionalizacin se puede completar ofreciendo informacin adicional como fuente de informacin, escala de medida, codificacin, tipo de variable segn el uso, momento de la medicin, etc. Ejemplo:
Id Variable 1 Sexo 2 Edad Defincin operacional Sexo del encuestado. Edad en aos cumplidos del encuestado. Escala Nominal Discreta Codificacin 0: Femenino 1: Masculino Valor entero positivo 0: Activo 1: Sedentario Tipo Explicativa Explicativa

3 Estado

Clasificacin de la persona segn su condicin en cuanto a la realizacin de actividad fsica. Siendo activo quien Nominal realice actividad fsica por lo menos tres veces a la semana, y sedentario en otro caso. Altura en centmetros, medida desde el taln hasta la parte Continua ms distal de la cabeza. Peso corporal en kilogramos. Continua

Explicativa

4 Estatura 5 Peso

Valor real positivo Valor real positivo Valor entero positivo

Explicativa Explicativa

Nmero de pulsaciones radiales en un minuto, tomadas en 6 Pulsaciones-Izq estado de reposo con los dedos ndice y corazn, por Discreta debajo del dedo pulgar de la mano izquierda.

Respuesta

CONSTRUCCIN DE BASES DE DATOS


Una base de datos (BD) es un arreglo de datos, donde corresponde al nmero de filas (normalmente igual al nmero de individuos2) y al nmero de columnas (normalmente igual al nmero de variables del estudio). A cada columna se le suele llamar vector y a cada fila registro. De este modo dos o ms vectores conforman una matriz llamada base de datos. En primer lugar, cada columna lleva el nombre corto de la respectiva variable o vector. En la primera columna se suele ubicar el identificador (Id) del individuo. ste puede ser un consecutivo o un registro nico para cada individuo. Los nicos valores contenidos en las BD corresponden a los definidos en la operacionalizacin de las variables (ver codificacin en el apartado anterior). Las BD suelen administrarse en archivos tipo MS Excel, MS Access, SPSS, bloc de notas, etc. El uso de un tipo de archivo determinado depende del tamao de la BD y de la habilidad de los usuarios para administrarla. Es muy comn, como es el caso del SPSS, anexar a las BD una hoja aparte con las definiciones operacionales de las variables. En el ejemplo, la hoja activa corresponde a la matriz de datos y la siguiente a la definicin de las variables:

Cuando son estudios que involucran medidas repetidas, varias filas pueden corresponder a un mismo individuo y en este caso no coincide con el nmero de individuos.

ESTUDIOS EPIDEMIOLGICOS
Definicin de epidemiologa, incidencia y prevalencia3
Epidemiologa La epidemiologa es el estudio de la distribucin y determinantes de enfermedades en poblaciones humanas. La distribucin de enfermedades se refiere a la carga de estas segn caractersticas como edad, sexo, clase social, estado civil, grupo racial, ocupacin, entre otras. Los determinantes son los factores que causan la enfermedad o se relacionan con sta. Estudiar la distribucin de la enfermedad es una descripcin de la misma, mientras que estudiar los determinantes se refiere a su etiologa. Por ejemplo, el hallazgo de que el nmero elevado de parejas sexuales se asocia al cncer cervical (descripcin) conlleva a investigar el porqu de esta asociacin descubrindose que la infeccin por el virus del papiloma humano (VPH) es el agente causal de este cncer (etiologa). En general los factores estudiados son particulares de cada enfermedad y stos pueden ser de diversas caractersticas como la polucin atmosfrica, estilos de vida (uso del cigarrillo, hbitos alimenticios, comportamiento sexual, etc.) o aspectos biolgicos (como el colesterol o la presin sangunea). Incidencia y prevalencia La incidencia es el nmero de de casos nuevos de la enfermedad dentro de un periodo especfico de tiempo. La prevalencia es el nmero de casos existentes de la enfermedad en punto determinado del tiempo. La prevalencia es una medida de la morbilidad mientras que la incidencia puede medir tanto la morbilidad como la mortalidad. Normalmente estas medidas suelen presentarse en forma relativa. Por ejemplo:

Medidas de riesgo
En epidemiologa a menudo se tiene el inters de evaluar el chance de que un individuo que presenta cierto atributo tenga una enfermedad especfica. La medida epidemiolgica ms bsica es la probabilidad condicional de que un individuo tenga la enfermedad dado que presenta dicho atributo. Esa probabilidad es llamada riesgo ( )de la enfermedad y el atributo factor de riesgo. Aunque el riesgo es una medida muy utilizada en la relacin entre el factor de riesgo y la enfermedad, no es suficiente para determinar la importancia del factor de riesgo
Tomado de Woodward M (2004). Epidemiology: Study Design and Data Analysis, 2th Ed. Chapman & Hall CRC, USA. (Acceso parcial en http://books.google.com/books?id=SD_61g8orgC&pg=PP1&dq=epidemiology+and+woodward&hl=es#v=onepage&q&f=false)
3

sobre el desarrollo de la enfermedad. Como en muchos procedimientos en epidemiologa, se requiere un grupo de comparacin el cual suele ser el grupo sin el factor de riesgo (los no expuestos). As, es posible definir el riesgo relativo (o razn de riesgo) como el cociente entre el riesgo de la enfermedad en el grupo expuesto al factor de riesgo y el grupo no expuesto. Si el riesgo relativo () es mayor a 1, entonces el factor considerado incrementa el riesgo de enfermedad, de lo contrario (si es menor a 1) reduce dicho riesgo. Un factor que tiene un riesgo relativo menor a 1 suele ser llamada factor protector. En muchos casos se har uso general del trmino factor de riesgo sin especificar la direccin de su efecto. El clculo del riesgo y del riesgo relativo es muy simple si usando una tabla 22. Tablas 22 En una tabla 22 (dos filas por dos columnas) se cruza el estatus del factor de riesgo (expuesto/no expuesto) vs. el estatus de la enfermedad (enfermo/no enfermo): Estatus del factor de riesgo Espuesto No expuesto Total Estatus de enfermedad Enfermo a c a+b No enfermo b d b+d

Total a+b c+d n

De la tabla se puede observar que individuos tienen la enfermedad y que no. En cuanto al estatus del factor de riesgo, estn expuestos, mientras que no lo estn. El nmero de personas enfermas pero no expuestas es c, y el nmero de personas no enfermas pero expuestas es , etc. Ntese que . Riesgo relativo # #

A partir de esta expresin es posible calcular el riesgo de enfermedad ( )segn estatus del factor de riesgo. Por ejemplo, el riesgo de enfermedad en los expuestos es / y en los no expuestos / . El riesgo relativo de enfermedad comparado entre los expuestos vs. no expuestos est dado por / /

Un intervalo de confianza aproximado al 95% para el RR est dado por . , . donde seln 1 1 1 1 El RR no es siempre una medida adecuada. Tal es el caso de los estudios caso-control, donde el RR no debe ser calculado. Sin embargo, es posible obtener una medida indirecta del riesgo (en cualquier caso), llamada odss.

Razn de odds El mide el nmero de veces que la respuesta ocurre por cada vez que no ocurre. La respuesta ocurre con una probabilidad , y no ocurre con una probabilidad 1 . Luego, el odds de que ocurra dicha respuesta (en este caso enfermedad) est dada por 1 A partir de esta expresin, es fcil demostrar que 1 Igual que con el riesgo, el odds se calcula tanto para el grupo de los expuestos como los no expuestos. El clculo de los odds se hace ms fcil a partir de la tabla 22. As, para los expuestos, el odds de enfermedad est dado por , y para los no expuestos por . De forma similar, la razn de odds () que compara el riesgo de enfermedad en expuestos vs. no expuestos est dada por

La OR tambin se conoce como la razn de productos cruzados por la forma de calcularse a partir de una tabla 22. Un intervalo de confianza aproximado al 95% para la OR est dado por . , . donde seln 1 1 1 1. En resumen, al comparar el riesgo/odds (de ahora en adelante sinnimos) de enfermedad entre expuestos vs. no expuestos para cierto factor de riesgo, la interpretacin ser: RR >1 =1 <1 OR >1 =1 <1 Interpretacin Asociacin (factor confiere riesgo) No asociacin (factor no confiere riesgo ni proteccin) Asociacin (factor confiere proteccin)

Para probar la hiptesis nula de que el RR o la OR es igual a uno vs. diferente, se puede proceder de dos maneras: 1. Chequeando si el intervalo de confianza para el RR o la OR contiene el uno (si lo contiene no se rechaza Ho, de lo contrario se rechaza). 2. Realizando bien sea una prueba Chi-cuadrado o una prueba exacta de Fisher.

Tipos de estudios epidemiolgicos


En el siguiente esquema se presenta un resumen de los tipos de estudios epidemiolgicos ms comunes. Posteriormente, se comentan.

Estudios observacionales Estudios descriptivos Caso Este tipo de estudio consiste en realizar una descripcin, a veces exhaustiva, de las caractersticas de un individuo que padece cierta enfermedad normalmente rara o muy poco frecuente (enfermedades nuevas por ejemplo). Los datos que se recolectan son de un solo paciente y cuando ste se monitorea en el tiempo, suelen sacarse estadsticas de mediciones repetidas. Por ejemplo: presin arterial media, estimada a partir de la observacin del paciente una vez por mes, durante un ao. Series de caso Se estudian 2, 3 ms individuos que padecen cierta enfermedad enfermedad normalmente poco frecuente en la poblacin. Un tipo de muestreo comnmente empleado en este tipo de estudio es el de bola de nieve el cual consiste en recolectar individuos contactados por medio de otros ya incluidos en el estudio. Mtodos bsicos de anlisis Los anlisis consisten bsicamente a la descripcin de variables de los casos (edad, sexo, peso, etc.), empleando medidas de tendencia central, dispersin y posicin para las variables de escala numrica y porcentajes para las de escala cualitativa. cualitati

Corte transversal Este tipo de estudio consiste en la observacin de las caractersticas de un conjunto de personas (en algunas veces una muestra aleatoria de cierta poblacin4) por medio de cuestionarios con el fin de buscar informacin sobre la exposicin a factores de riesgo o el padecimiento de cierta enfermedad. Usualmente estn enfocados a la estimacin de prevalencias segn caractersticas de la poblacin. Mtodos bsicos de anlisis Los anlisis se realizan mediante el riesgo relativo5 o la razn de odds estimados a partir de tablas 22 (anlisis crudo) o empleando regresin logstica (ante la necesidad de ajustar por variables de confusin o chequear interaccin). Ejemplo. A continuacin se presentan los datos del consumo de licor en hombres y mujeres recolectados en una muestra no probabilstica por estudiantes de Bioestadstica de la Escuela de Microbiologa: Consumo de alcohol S No 62 18 50 33 112 51

Total 80 83 163

Hombres Mujeres Total

Estime la razn de prevalencias y la razn de odds con sus respectivos intervalos de confianza del 95% para el consumo de alcohol comparado en hombres vs. mujeres. Concluya al respecto Ejemplo. De la base de datos Ejemplo Pulso Cardaco.xls tome el consumo de tinto como variable respuesta y relacinelo con el consumo de cigarrillo. Estime la razn de odds con su respectivo intervalo de confianza del 95% para el consumo de tinto comparando consumidores de cigarrillo vs. no consumidores y realice una prueba chi-cuadrado para dicha relacin.

Ecolgicos Las unidades de anlisis son regiones (barrios, comunas, municipios, departamentos, pases, etc.) de donde se obtienen medidas ya resumidas como tasas o medias. Mtodos bsicos de anlisis En este tipo de estudios es muy comn relacionar las medidas resumidas de las regiones con otros indicadores mediante regresin lineal. Ejemplo. Se cuentan con las tasas de mortalidad (por 100 mil mujeres) ajustadas por edad6 durante el periodo comprendido entre 2000-2006 y el porcentaje de poblacin en miseria, para cada subregin de Antioquia:
4 5

Conocidos como estudios de base poblacional. Llamado en este caso razn de prevalencias. 6 Utilizando el mtodo de estandarizacin directo.

Subregin Magdalena Medio Bajo Cauca Urab Nordeste Occidente Suroeste Norte Oriente Valle de Aburr

Tasa 21.8 21.3 18.5 15.1 14.2 12.7 9.4 7.7 7.2

% Miseria 58.6 75.5 68.3 49.3 50.5 25.5 36.2 17.9 8.2

Qu podra concluirse a partir de estos datos? Falacia ecolgica sta consiste en presumir que una relacin encontrada a partir de datos agrupados (ecolgicos), es decir, hallada entre las regiones de estudio, se mantenga individualmente. Por ejemplo, se ha observado que las tasas de mortalidad por cncer cervical ms altas se presentan en las regiones de mayor pobreza. As pues, es una falacia ecolgica inferir que ser pobre es causante de este cncer.

Estudios analticos Cohorte Un estudio de cohorte consiste en observar a un grupo de individuos libres del evento de inters, clasificados en expuestos y no expuestos al factor de riesgo. Al trmino del periodo de seguimiento, se observa cuntos (en cada grupo) desarrollaron el evento (incidencia). Ventajas 1. Ideales para mostrar causalidad. 2. Pueden estudiarse mltiples desenlaces (enfermedades) a la vez. Desventajas 1. Suelen ser costos. 2. No son adecuados cuando para estudiar enfermedades cuyo tiempo de desarrollo es largo. 3. No son adecuados para estudiar enfermedades muy raras (poco frecuentes) ya que requieren de cohortes muy grandes. 4. Las personas pueden cambiar estilos/hbitos de vida por el hecho de ser observadas lo que dificulta estudiar el riesgo de exposicin. 5. Se pueden presentar prdidas (no adherencia) lo que podra contribuir a sesgos. Existen dos tipos de cohortes: fijas y variables. En el primer caso, todos los individuos ingresan al estudio a la vez y son seguidos durante un tiempo x igual para todos. En el segundo caso, los individuos ingresan en momentos diferentes y el tiempo de seguimiento es variable entre ellos.

Mtodos bsicos de anlisis 1. Los anlisis para las cohortes fijas se realizan mediante el riesgo relativo o la razn de odds estimados a partir de tablas 22 (anlisis crudo) o empleando regresin logstica (ante la necesidad de ajustar por variables de confusin o chequear interaccin). Ejemplo.7 Shaper et al. (1988) describen un estudio de cohorte de una muestra aleatoria de 7729 hombres britnicos adultos. Cada hombre fue interrogado, al ingreso al estudio, sobre su consumo de alcohol (entre otras cosas). Durante los siguientes 7.5 aos fueron recolectados los certificados de defuncin de los hombres de la cohorte que murieron. Los datos se presentan a continuacin: Consumo de alcohol No consumo Ocasionalmente Levemente Moderadamente Empedernidamente Total Muertes 41 142 143 116 62 504 No muertes 425 1703 2401 1926 770 7225 Total 466 1845 2544 2042 832 7729

Tomando el no consumo como grupo de referencia, estime el RR y la OR con sus respectivos intervalos de confianza del riesgo de morir. 2. En el caso de las cohortes variables, se emplea el anlisis de supervivencia que consiste bsicamente en el uso de curvas de supervivencia Kaplan-Meier8 o el mtodo persona-ao9 (anlisis crudo) o de modelos de regresin Cox (ante la necesidad de ajustar por variables de confusin o chequear interaccin). Los anlisis para cohortes variables tienen en cuenta datos censurados. Ejemplo. Realizar anlisis de supervivencia para la base de datos de estudios de cohorte Ejemplo supervivencia.

Caso-control Lo primero en este tipo de estudios es detectar a las personas con la enfermedad de inters (casos) y luego seleccionar cierta cantidad de personas libres de la enfermedad (controles). Los casos y los controles son estudiados para investigar cules factores difieren entre ellos. La principal diferencia entre los estudios de cohorte y caso-control es que en estos ltimos los participantes se seleccionan segn el estatus de enfermedad y se mira en retrospectiva qu pudo haberla causado mientras que en los de cohorte se seleccionan participantes libres de la enfermedad y se mira si sta se desarrolla o no. (Woodward 2004).

Tomado de Woodward 2004. Prueba log-rank para probar si existen diferencias entre los niveles del factor de exposicin. 9 Se recomienda artculo de Fracisco Javier Daz Ceballos: Introduccin a los estudios de cohorte en epidemiologa y al anlisis de supervivencia, 2005.
8

Ejemplo.10 Autier et al. (1996) describen un estudio de melanoma cutneo en el que 420 casos adultos (seleccionados de cinco centros hospitalarios en Blgica, Francia y Alemania) fueron comparados con 447 controles adultos (seleccionados de las comunidades locales atendidas por los centros hospitalarios). 75% de los casos reportaron no haber recibido proteccin solar alguna (uso de gorras o bloqueador solar) durante la niez. Este porcentaje excede a lo reportado por los controles (69%). De este modo, ser un caso parece estar ms asociado a la falta de proteccin solar en la niez que ser un control, y la exposicin solar podra ser un factor de riesgo para melanoma. En la siguiente figura se esquematiza un diseo clsico de casos y controles11:

Ventajas 1. Son ms econmicos y ms rpidos especialmente en el estudio de enfermedades cuyo tiempo de desarrollo es muy largo (p. ej., enfermedades crnicas). 2. Muchos factores de riesgo pueden estudiarse simultneamente. 3. Son adecuados para estudiar enfermedades raras (muy poco frecuentes). 4. Generalmente requieren tamaos muestrales ms pequeos que en los estudios de cohorte. 5. Usualmente son ms balanceados que los estudios de cohorte lo cual permite manejar o controlar mejor las variables de confusin.

Tomado de Woodward. Tomado de Lazcano-Ponce E, Salazar-Martnez E, Hernndez-vila M. Estudios Epidemiolgicos de casos y controles. Fundamento terico, variantes y aplicaciones. Rev Salud Pbicla de Mxico 2001; 43(2):135-150.
11

10

Desventajas 1. No es posible mostrar causalidad porque no siempre se conoce la secuencia del evento en el tiempo. 2. Un caso (enfermo) puede ser el resultado de un proceso de supervivencia y no uno de morbilidad. 3. Slo permiten investigar una enfermedad a la vez. 4. No permiten estimar riesgos, odds ni riesgos relativos pero s razones de odds (recordar: cuando la enfermedad es rara la razn de odds es un buen estimador del riesgo relativo). 5. Son propensos a generar errores por sesgo (p. ej., seleccin de controles). Cuntos controles por cada caso? De la siguiente grfica12 se puede observar que hasta 4 controles por caso es lo mximo que se debe tomar, ya que se alcanza una adecuada potencia estadstica y ms de all sta no se incrementa significativamente.

Potencia vs. razn controles/casos. En la figura se muestra la potencia para detectar un riesgo relativo aproximadamente igual a 2 cuando el factor de riesgo tiene una prevalencia del 30%, en una prueba de dos colas con un nivel de significancia de 0.05 y 188 casos disponibles.

Seleccin de casos13 1. Utilizacin de casos incidentes con periodos de exposicin o latencia prolongados. La razn de odds tiende a parecerse al riesgo relativo cuando los casos del estudio son incidentes y la exposicin que la precede es de larga duracin. 2. Utilizacin de casos prevalentes con periodos de exposicin prolongados. La razn de odds se parece al riesgo relativo si, a pesar de utilizar casos prevalentes, el periodo de exposicin es muy largo y la enfermedad no afecta el estado de exposicin. Los casos prevalentes pueden ser incluidos especialmente cuando no se dispone de casos nuevos porque la enfermedad es muy rara y tiene baja letalidad, y cuando la exposicin no modifica el curso clnico (sobrevida) de la enfermedad, como es el caso de enfermedades de predisposicin gentica. 3. Utilizacin de casos prevalentes. La razn de odds se aproxima al riesgo relativo cuando la prevalencia de casos es muy pequea, slo si el evento resultado no est relacionado con la sobrevida antes de la seleccin, condicin o exposicin, y si la enfermedad no afecta el estado de exposicin.
12 13

Tomada de Woodward. Tomado de Lazcano-Ponce et al. 2001.

4. Utilizacin de casos o controles fallecidos. La inclusin de sujetos muertos slo se justifica en algunas exposiciones que se puedan cuantificar mediante el uso de fuentes secundarias de datos de alta calidad, como pudiera tratarse de historias clnicas o registros de fuentes de informacin ocupacional. Seleccin de controles14 1. Los controles deben ser seleccionados de la misma base poblacional de donde se originaron los casos. 2. Los controles deben ser seleccionados independientemente de su condicin de expuestos o no expuestos para garantizar que representen adecuadamente a la poblacin base. Esto ltimo se logra siempre y cuando la condicin de exposicin no determine la posibilidad de que un individuo sea o no incluido en el estudio como control. 3. La probabilidad de seleccin para los controles debe ser proporcional al tiempo que el sujeto permaneci elegible para desarrollar el evento o enfermedad en estudio. As, un individuo que migr o que falleci durante el estudio dejar de ser elegible como control. Una manera de operacionalizar este concepto es seleccionando un control del grupo de individuos elegibles cada vez que se detecta o selecciona un caso. 4. En la seleccin de los controles se debe evitar, en lo posible, factores de confusin. Se espera que el grupo control sea similar al grupo de casos en lo que se refiere a otras variables que pudieran ser factores de riesgo para el desarrollo del evento y al mismo tiempo estar asociados con la exposicin. Una estrategia frecuentemente utilizada para lograr este requisito es el apareamiento. La medicin de variables debe ser comparable entre los casos y los controles. Todos los procedimientos para medir la exposicin o los factores de confusin potenciales deben ser aplicados, reportados y registrados de la misma manera en casos y controles. Tipos de controles15 1. Controles poblacionales. Si los casos representan una muestra de todos los casos que ocurren en una poblacin identificada y definida claramente en tiempo y espacio, y los controles se muestrean directamente de esta misma poblacin. 2. Controles vecindarios. Si despus de que se identifica un caso se seleccionan al azar uno o ms controles que vivan en la misma zona de residencia que los casos. 3. Controles hospitalarios. Corresponden a controles que acuden al mismo hospital donde se realiz la seleccin de los casos, pero por un padecimiento diferente. Mtodos bsicos de anlisis Los anlisis se realizan mediante la razn de odds estimados a partir de tablas 22 (anlisis crudo) o empleando regresin logstica (ante la necesidad de ajustar por variables de confusin o chequear interaccin). Ejemplo.16 En un estudio caso-control sobre el uso de anticonceptivos orales (ACO) y cncer de seno en Nueva Zelanda, Paul et al. (1986) identific casos para un periodo de 2 aos usando el
14 15

Tomado de Lazcano-Ponce et al. 2001. Tomado de Lazcano-Ponce et al. 2001.

registro poblacional de tumores y seleccion controles aleatoriamente a partir de los padrones electorales. A partir de la informacin que se dispone en la siguiente tabla, estima la razn de odds de cncer de seno que compara a mujeres que usan vs. no usan ACO, con sus respectivos intervalos de confianza del 95%: Uso de ACO S No Total Casos 310 123 433 Controles 708 189 897 Total 1018 312 1330

Ejemplo.17 De la base de datos Infert estime la razn de odds con su respectivo intervalo de confianza del 95% y el valor P para el riesgo de infertilidad comparado entre mujeres con 4-6 hijos vs. 1-3 hijos. Estudios caso-control apareados En muchos estudios los controles se escogen de forma que sean similares a los casos con respecto a posibles variables de confusin. Por ejemplo, si la variable edad es una potencial variable de confusin, para cada caso se escoge uno o ms controles que tenga(n) edad similar a la del caso. Si se escogen c controles por cada caso, el apareamiento se llama 1:c (c=1, 2, ). Ventajas del apareamiento 1. Control directo de las posibles variables de confusin. 2. Seguridad de que se puede ajustar con respecto a las variables de confusin. Aunque en un estudio caso-control no apareado las variables de confusin pueden controlarse en la etapa de anlisis (regresin logstica), no siempre es posible hacerlo. Por ejemplo, cuando todos los casos son de edad avanzada y todos los controles son muy jvenes y la variable edad es de confusin. 3. Bajo ciertas condiciones de apareamiento se mejora la eficiencia del estudio. En general, el apareamiento mejora la eficiencia siempre y cuando la(s) variable(s) de apareamiento sea(n) de confusin. Si la o las variables de apareamiento no son de confusin, se puede perder eficiencia estadstica (aumenta el error). Desventajas del apareamiento 1. La recoleccin de los datos es ms compleja. 2. El anlisis de los datos debe tener en cuenta el apareamiento. El mtodo ms utilizado para este tipo de anlisis es la regresin logstica condicional. Una desventaja es que no todos los paquetes estadsticos ofrecen este procedimiento. 3. El ajuste proporcionado por la o las variables de apareamiento no puede ser removido y a veces el contraste del riesgo crudo vs. ajustado es de importancia epidemiolgica. 4. Puede presentarse sobre-apareamiento (overmatching) debido a que ste se realiz de manera incorrecta o innecesariamente (aparear por una variable que en realidad no era de confusin o de serlo, que estuviese altamente correlacionada con otra variable de apareamiento).

16 17

Tomado de Woodward 2004. Base de datos infert tomada de la librera survival, del paquete estadstico R.

Mtodos bsicos de anlisis En los estudios caso-control apareados, la presentacin tabular es diferente al igual que la estimacin de la razn de odds. Sin embargo, las hiptesis nula y alternativa son las mismas. Una estrategia es utilizar la regresin logstica condicional. El aspecto de la tabla en este tipo de estudios es: Est el caso expuesto? S No Total Est el control expuesto? S No c1 d1 d2 c2 c1+d2 d1+c2 d d Total c1+d1 c2+d2 n

Para probar la hiptesis nula de que la OR=1, se emplea la prueba de McNemar. Ejemplo.18 Un estudio de casos y controles de leucemia linfoblstica aguda entre nios espaoles hall 128 casos menores de 15 aos a partir de registros hospitalarios (InfanteRivard et al. 1991). Cada caso fue apareado a un control segn fecha de nacimiento, sexo y municipio. Los controles fueron poblacionales, seleccionados aleatoriamente usando las listas censales. En la siguiente tabla se presenta un anlisis de la exposicin de las madres a polvo de algodn, lana o fibras sintticas durante el embarazo: Caso expuesto al polvo? S No Total Control expuesto al polvo? S No 1 11 2 114 3 125 Total 12 116 128

Encuentre la razn de odds estimada que compara el riesgo de leucemia entre los expuestos vs. no expuestos. Pruebe la hiptesis nula de que la exposicin al polvo no est asociada a leucemia. Apareamiento en otro tipo de estudios Hasta ahora se ha comentado sobre las bondades de aparear segn variables de confusin en estudios de casos y controles. Esta estrategia tambin puede ser til o implementada en estudios de cohorte o de intervencin. Estudios caso-control anidados Es un estudio de caso-control realizado en el marco de un estudio de cohorte en ejecucin. Los casos son identificados en la medida que los individuos de la cohorte presentan el evento de inters (la enfermedad), y los controles un subconjunto de individuos que en el mismo momento no han presentado el evento.

18

Tomado de Woodward 2004.

Reproducibilidad Un estudio de reproducibilidad evala el grado de concordancia entre dos o ms lecturas independientes realizadas sobre el mismo objeto de estudio. El resultados de la lectura puede ser de escala cualitativa (positivo/negativo) o numrica. Mtodos bsicos de anlisis 1. Cuando la lectura es cualitativa, se suele calcular el porcentaje de concordancia y el ndice kappa. ste ltimo valora el grado de reproducibilidad (o concordancia). Segn Fleiss (1981), un ndice kappa menor a 0.4, la reproducibilidad es pobre, entre 0.4 y 0.75 es aceptable, y mayor a 0.75 es excelente. Una prueba de McNemar puede ser empleada para probar la hiptesis nula de que las 2 lecturas son equivalentes. Los datos se presentan en una tabla 22 como se muestran a continuacin:
Resultado lectura 1 Positivo Negativo a b c d a+c b+d

Resultado lectura 2 Positivo Negativo Total

Total a+b c+d n

Donde representa los pares concordantes con resultado positivo, los pares concordantes con resultado negativo, y los pares discordantes. El porcentaje de concordancia ser / 100%. Entre tanto tienda a 100, mayor ser el grado de reproducibilidad. Por otro lado, la estimacin del ndice kappa se realizar mediante software. Ejemplo.19 Dos patlogos leen placas de forma independiente y confidencial con el fin de clasificarlas en positivas o negativas para cierta condicin. De 294 placas, 79 fueron clasificadas como positivas y 167 como negativas por ambos patlogos, y 37 fueron clasificadas como positivas segn el patlogo 2 pero negativas segn el patlogo 1. Estime el porcentaje de concordancia y el coeficiente kappa. A partir de estos resultados, concluya si la lectura entre los dos patlogos es reproducible. 2. Cuando el resultado de la lectura es de escala numrica, se suele emplear el coeficiente de correlacin intraclase (CCI) y grficos tipo Bland-Altman20. Entre tanto el CCI est prximo a 1.0, mayor es la reproducibilidad entre el par de lectores. Pruebas diagnsticas En este tipo de estudios, se evala la capacidad de una prueba/estrategia para clasificar a un individuo en enfermo o sano. Esto se logra contrastando los resultados de la estrategia con la prueba de oro la cual se presume clasifica correctamente a los individuos. Mtodos bsicos de anlisis A partir de una tabla 22 como la presentada a continuacin, se estiman los parmetros sensibilidad (S), especificidad (E), valor predictivo positivo (VPP) y valor predictivo negativo (VPN). Entre tanto S, E, VPP y VPN tiendan a 1.0, mejor ser la capacidad de clasificacin de la prueba bajo estudio.
19 20

Tomado de Woodward 2004. Para ms detalle, remitirse a Epidemiologa intermedia: conceptos y aplicaciones de Szklo M y Nieto J.

Resultado prueba bajo estudio Positivo Negativo Total

Resultado prueba de oro Positivo Negativo a b c d a+c b+d

Total a+b c+d n

Donde representa los pares concordantes con resultado positivo, los pares concordantes con resultado negativo, y los pares discordantes. De este modo, / , / , / , y / . Ejemplo.21 Ditchburn & Ditchburn (1990) describen un nmero de pruebas para el diagnstico rpido de infecciones del tracto urinario (UTIs). Tomaron muestras de orina de 200 pacientes con sntomas de UTI las cuales fueron enviadas a un laboratorio microbiolgico para cultivo. A continuacin se presentan los resultados de la valoracin de una de las pruebas rpidas (prueba de tirilla para detectar piuria): Tirilla Positivo Negativo Total Positivo 84 10 94 Negativo 43 92 135 Total 127 102 229

Estime S, E, VPP y VPN. Qu podra concluirse de la prueba rpida?

Estudios de intervencin Un estudio de intervencin o ensayo clnico es un experimento aplicado en pacientes con el fin de valorar el efecto de una terapia, o en personas sanas para valorar el efecto de una estrategia de prevencin. Estos experimentos implican asignar sujetos (participantes) a diversos tratamientos o grupos que representan las diferentes condiciones para las cuales se desea valorar su efecto. Por ejemplo, en la prevencin de cncer de cuello uterino se puede estudiar la eficacia de la vacunacin de mujeres menores de 12 aos en cierta poblacin vacunando contra el VPH a la mitad de una cohorte y a la otra mitad contra hepatitis B (placebo), y al trmino de cierto tiempo comparar la incidencia en ambos grupos. La prueba estadstica depender del parmetro que se estime el cual a su vez depende de la escala de la variable de estudio (variable respuesta). En el ejemplo de la vacuna, por tratarse de una escala nominal (previene/no previene infeccin por el VPH), el parmetro de inters es una proporcin (incidencia). Ventajas Los estudios de intervencin son los ms apropiados para estudiar causalidad porque: 1. Hay seguridad de que la causa precede el efecto 2. Hay mayor control sobre las variables de confusin debido a la asignacin aleatoria de los sujetos a los diferentes grupos o tratamientos. Al ser aleatoria dicha asignacin, se espera que haya una distribucin uniforme de sesgos entre los grupos.

21

Tomado de Woodward 2004.

Desventajas 1. Por tratarse de estudios prospectivos, muchas de las desventajas expuestas en estudios de cohorte aplican para este tipo de estudios. 2. Algunas intervenciones pueden ir en contra de aspectos ticos. 3. Si el estudio es muy controlado, puede que las conclusiones no sean aplicables en la vida real. Las conclusiones de un estudio de intervencin se mencionan en el marco de las condiciones que ste fue realizado. Consideraciones ticas Consultar Declaracin de Helsinki22. Control de sesgos23 1. Uso de un grupo control. Como en los estudios de cohorte, los de intervencin deben ser comparativos. El grupo control podra tratarse de un grupo placebo o una estrategia estndar que exista en el momento. 2. Cegamiento. Se trata de evitar que alguien conozca cul es el tratamiento asignado. Un estudio de intervencin es ciego simple (single-blind) cuando el participante no sabe cul tratamiento le fue asignado. Es doble ciego cuando tanto el sujeto como el mdico, enfermero o quien est a cargo de evaluar la respuesta desconocen el tratamiento asignado. Triple ciego cuando no slo los anteriores sino tambin quien o quienes realizan los anlisis de los resultados desconocen cules son los tratamientos asignados. Por ejemplo, entre dos tratamientos A y B, se desconoce cul es el tratamiento control. No siempre es posible realizar estudios ciegos. 3. Aleatorizacin. Los sujetos deberan ser asignados a los tratamientos por medio de un mecanismo de aleatorizacin (generalmente una distribucin uniforme). Cuando esto ocurre, el estudio es llamado ensayo clnico controlado. La aleatorizacin es necesaria para evitar sesgos sistemticos. Grupos paralelos Son los ms comunes. Consisten en asignar aleatoriamente individuos que no presenten el evento de inters (respuesta) a los diferentes brazos o tratamientos. Al trmino de la intervencin se observan las respectivas incidencias. Mtodos bsicos de anlisis El anlisis se hace tal cual en los estudios de cohorte. Ejemplo.24 Un ensayo clnico fue realizado para valorar el efecto del suplemento mineral y vitamnico sobre el mejoramiento del racionamiento verbal y no verbal en escolares. Varias pruebas de razonamiento (IQ) fueron aplicadas a dos grupos de escolares con edades entre 11 y 13 aos. Un grupo (de tamao 42) recibi tabletas que contenan el suplemento mineral y vitamnico, y el otro (de tamao 44) recibi tabletas inactivas indistinguibles de las del primer grupo. Las tabletas fueron consumidas durante 7 meses. Al trmino de la intervencin se realizaron nuevamente las pruebas IQ. Los resultados se encuentran en el archivo Estudios de

22 23

Se anexa archivo Declaration of Helsinki - 2008.pdf Se remite al lector al texto del Woodward, pgina 344 para ampliar esta informacin. 24 Modificado de Woodward 2004.

intervencin - Ejemplo 1.xls. Recomienda el uso de suplementos minerales y vitamnicos para mejorar el racionamiento verbal o no verbal en escolares entre 11 y 13 aos? Cross-over Considere dos grupos de tratamiento A y B. Al trmino de las intervenciones, los sujetos del grupo A pasan al tratamiento B y viceversa, ejecutando el experimento nuevamente. As, todos los sujetos pasan tanto por el tratamiento A como por el B. El anlisis de este tipo de diseo no es tan sencillo como en los grupos paralelos ya que se tienen medidas repetidas. Estudios secuenciales Probar la hiptesis alternativa en la medida que entran sujetos hasta que se tome la decisin de rechazar o no la hiptesis nula.

PRESENTACIN DE RESULTADOS EPIDEMIOLGICOS


Se presentan los formatos de las tablas para presentar resultados de estudios epidemiolgicos. Bsicamente, se proponen dos tablas: 1. La primera que describe la distribucin de las caractersticas (variables explicativas) de la muestra. 2. La segunda que cruza la variable respuesta con las caractersticas de la muestra. Este cruce depende de la escala de la respuesta. Si es de escala cualitativa/categrica, el cruce consiste en tablas de contingencia y se calculan razones de odds o riesgos relativos (si es posible) con sus respectivos intervalos de confianza y valores p de pruebas para tablas de contingencia. Si es de escala numrica, el cruce consiste en estimar la media, mediana, desviacin estndar, y se calculan intervalos de confianza para la media con sus respectivos valores p del anlisis de varianza. Es obvio que posteriores anlisis conllevan a presentar otros tipos de tablas segn sea el caso. Para ilustrar este punto, se construirn las tablas 1 y 2 para: 1. La base de datos de estudios de corte transversal, tomando como respuesta: El consumo de licor (s/no), y Las pulsaciones por minuto de la mano izquierda 2. La base de datos de estudios de caso-control, tomando como respuesta: la infertilidad

VARIABLES DE CONFUSIN E INTERACCIN


A continuacin se ilustrar la definicin de variable de confusin25. Para ello, denotemos 1. D: enfermedad 2. F: factor de riesgo 3. C: variable de confusin C ser variable de confusin si se relaciona tanto con la enfermedad (pero no como consecuencia de la enfermedad) como con el factor de riesgo (pero no como consecuencia del factor de riesgo).

En la siguiente grfica se ilustran casos en que C no es variable de confusin:

25

Segn Woodward 2004.

Si en algn momento se identifica una variable de confusin, sta debe ser medida y tenida en cuenta en los anlisis. En la siguiente grfica se ilustra el efecto de la interaccin entre dos factores de riesgo:

Determinar si existe interaccin significativa entre dos o ms factores, es mucho ms fcil si se emplea el anlisis de regresin logstica.

ANLISIS DE REGRESIN LOGSTICA


Este es un anlisis de regresin donde la respuesta es una variable dictoma. La forma del modelo es:

donde ln . Si representa el estatus del factor de riesgo (1: expuesto, 0: no expuesto), entonces , y un intervalo de confianza del 95% para la OR est dado por

. , .
Modelo de regresin logstica con dos variables
Sin interaccin

Con interaccin Si es significativo, entonces la interaccin tambin lo es y los resultados del riesgo de enfermedad deben separarse/estratificarse. En SPSS, el anlisis de regresin logstica se ejecuta mediante el procedimiento Analizar/Regresin/Logstica binaria Ejemplo. Realizar anlisis de estudio de caso-control (base de datos Infert) mediante un modelo de regresin logstica entre la infertilidad y los diferentes factores de riesgo. Primero, hacerlo crudo para el factor nmero de hijos (1-3 vs. 4-6) y comparar con el ejemplo realizado previamente. Luego, hacer el anlisis mltiple.

You might also like