Professional Documents
Culture Documents
EPIDEMIOLOGA
PARA NO
EPIDEMILOGOS
Herramientas bsicas de epidemiologa
y bioestadstica para clnicos
y otros profesionales.
EPIDEMIOLOGA
PARA NO
EPIDEMILOGOS
Herramientas bsicas de epidemiologa
y bioestadstica para clnicos
y otros profesionales.
ISBN 958-95308-7-7
Impresin: Da Vinci Editores
Printed in Colombia
5 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Los autores.
6 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Indice
2. Introduccin.
5. Campana de Gauss.
Curvas ROC.
estudios.
15. Probabilidades.
16. Inferencias.
2. Introduccin.
5. Campana de Gauss.
Curvas ROC.
estudios.
15. Probabilidades.
16. Inferencias.
Presentacin
Agradecimientos
Hace algunos aos haba una chiste conocido entre los profesionales
de la medicina: Cmo se llama un mdico que no sabe de neurologa
ni de vas y lemniscos, ncleos, neuronas y clulas gliales?: Un tegua.
El libro exige
Hemos tratado de ser comunicantes y de que usted disfrute el libro.
Pero debemos advertir que algunos captulos exigirn toda su concen-
tracin y leerlos una y otra vez con todos los sentidos puestos. Por
momentos el esfuerzo doler. Hubiramos querido evitarlo y no pare-
cer pesados pero no siempre fue posible hacerlo sin correr el riesgo de
perderlo todo. El aprendizaje de la epidemiologa, como en todas las
ciencias y artes, exige trabajo consciente y persistente. Cualquier atajo es
prdida de tiempo.
Al igual que la primera vez, muchas personas han ledo los borra-
dores, los han criticado y han ayudado a modificar el texto sustan-
cialmente con la franqueza propia de los amigos de verdad. Den-
tro de ellos, los ms destacados son Carlos Eduardo Vasco, Luis
Fajardo y Fernando Arteaga. Por ello van como colaboradores.
Importancia de lo visual
Creemos que las grficas bien hechas y bien interpretadas, as como los
dibujos oportunamente usados, tienen un valor inmenso para comu-
nicar ideas y resultados. Ese lenguaje todava permanece inexplorado
porque a algunos no les parece suficientemente intelectual. Lo resienten
los acartonados, lo cual no debera preocuparnos. Estamos conscientes
de que hay que afinarlo, saberlo usar. Puede convertirse en una excusa
para la superficialidad. Todava nos da miedo.
Antes los lmites eran claros, bien artificiales o bien arbitrarios, pero
claros. Esto se deba en parte a nuestra ignorancia, pero tambin suce-
da por apropiacin de territorios y acciones que daban y siguen dando
poder. Hoy no hay territorios vedados para nadie. Pero ello exige que
los profesionales entiendan que deben ganarse su rol de liderazgo, que
sus opiniones deben contar pero solo si se diferencian de las opiniones
que surgen como resultado de la vulgarizacin prevalente, que no igua-
la, pero s puede hacer mucho dao.
Jairo Osorno,
josorno@etb.net.co
17 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
...hay un lmite ms all del cual la epidemiologa y la bioestadstica dejan de tener inters y utilidad prctica.
18 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
2. Introduccin
La epidemiologa
Implica un arte y ciencia matemticos. Sin matemticas no hay epide-
miologa. Cuantificar es pasar impresiones cualitativas al lenguaje
numrico para objetivar nuestros hallazgos bajo la presuncin de
que los nmeros son un lenguaje comn que no depende tanto de
variaciones culturales, regionales o personales.
Usos de la epidemiologa
Cuando usted le pregunta a alguien qu es un martillo, seguramente
le responda que es una herramienta que sirve, entre otras, para clavar
clavos y puntillas. De la misma manera, para definir la epidemiologa
es necesario saber cules son sus usos. De otra forma sera imposible
definirla. En 1955 Jerry Morris escribi un libro clave para entender el
uso de la epidemiologa1. A pesar del tiempo transcurrido, sus ideas
siguen siendo muy tiles hoy. Nancy Krieger, una epidemiloga, deca:
Los siete usos que propone Morris de la epidemiologa ofrecen una
forma muy lcida de pensamiento que se traduce en poderosas formas
de hacernos preguntas. Veamos cules son estos siete usos:
6. Existe alguna diferencia por clase social entre las madres lactantes
exitosas y las que no lo son?
Historia de la epidemiologa
Sin marco histrico no es posible entender la epidemiologa. Pierde
contexto. Algunos nombres son clave en la historia de esta disciplina
y los conceptos con que contribuyeron an persisten como puntos de
referencia. Se trata de nombres sin los cuales es difcil hablar de epide-
miologa.
Ejercicio 2
Primera parte del ejercicio: la mayora de las respuestas sobre las asocia-
ciones entre los primeros nombres de la columna de la izquierda y las
opciones de la derecha no han debido costarle trabajo.
Tales son los casos de Ignaz Semmelweis (A) y la fiebre puerperal (4),
Joseph Lister (B) y las medidas antispticas de la ciruga (10), Koch
(F) y sus postulados de causalidad de las enfermedades infecciosas (6),
John Graunt (C) y las tablas de vida (8), Edwin Chadwick (D) y su reco-
nocimiento como padre del movimiento sanitario y de la salud pblica
como estrategia para mejorar la salud de la poblacin (13), John Snow
(E) y la epidemia de clera de Londres (16).
Los casos de Sir Richard Doll y de Austin Bradford Hill siempre sern
un desafo mayor: es difcil evitar adjetivos y muy complicado asignarles
casillas, pues todas les quedan estrechas a sus aportes. Tocaron tantos
aspectos, que es posible atribuirle a otros contribuciones compartidas.
Si bien Richard Doll (I) es reconocido por todos como el Decano en-
tre Decanos de la epidemiologa moderna, sera imposible separarlo
de Austin Bradford Hill (J). A ambos se les asocia con los criterios de
causalidad (9) en este ejercicio atribuidos a Doll, pero como ver ms
adelante en este mismo libro, analizados por Rothman, por Susser y
por Hill. Doll y Hill son inseparables tambin en el estudio sobre el
uso de la estreptomicina para el tratamiento de la tuberculosis y el pri-
mer ensayo clnico controlado ocurrido en 1948 (2), o por haber sido
los primeros en demostrar la conexin entre el cigarrillo y el cncer
de pulmn (17), tema que por otra parte tambin ha sido ligado en el
ejercicio nuestro a Brian McMahon (L). Los responsables de la cohorte
de Framingham (K) en la columna de la izquierda se quedaron sin co-
lumna en la derecha, pero obviamente son los responsables de muchos
de nuestros conocimientos actuales sobre la influencia de los estilos
de vida, as como las variables antropomtricas y bioqumicas en las
enfermedades cardiovasculares. Mervin Susser, junto con su esposa Ida
Stein (M), han sido exponentes de los beneficios del acceso universal
a la salud (3), aunque no han sido los nicos, y Milton Terris (O), gran
promotor del cuidado preventivo, proponente del sistema de salud ni-
co para los Estados Unidos y de la idea de que los factores socioecon-
micos y otros no mdicos deben ser tenidos en cuenta en el estudio de
la salud pblica (3). Como vern, esto tambin es algo compartido por
Susser y Stein. Geoffrey Ross (N) es identificado por la mayora gracias
a su concepto de que las causas de la distribucin de la enfermedad no
25 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Por su parte, Luc Montaigner en el caso del HIV, y Harald zur Hausen
en el caso del Papiloma, fueron premiados con el Nobel en 2008. Basta,
sin embargo, leer los trabajos de Nubia Muoz sobre la distribucin
del virus del papiloma humano y su asociacin con el cncer de cuello
uterino para entender la importancia de su contribucin en el entendi-
miento del rol del virus en dicho cncer, o leer u or a lvaro Muoz
sobre su cohorte de Baltimore para saber cuntas luces dio a nuestra
comprensin del comportamiento del SIDA segn los niveles de carga
viral y la relacin entre CD4/CD8.
26 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Ejercicio 3
Ejercicio 4
Figura 1
Tendencias
Se refiere este trmino a que, al hablar de ciertos fenmenos, en epide-
miologa se deben considerar como unidades de anlisis tiempos que
son diferentes a los periodos de tiempo que se consideran cuando se
describe un solo fenmeno aislado. De all que la epidemiologa sea una
ciencia histrica. Estos periodos de tiempo a veces son largos, pues es
la nica manera de poder interpretar los cambios dentro de un contex-
to social e histrico para ver si permanecen y con ello darles, quizs, un
30 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
disminuyendo antes de
14 que estuviera dispo-
12 nible la penicilina,
10 Inglaterra y que despus de la
8 Australia introduccin de las
6
Nueva Zelanda sulfonamidas se pre-
sentaron algunos picos
4
de incremento de la
2
mortalidad?
0
40
42
44
47
50
19 1 19 1 19 19 1 19 1
19
19
19
19
19
19
19
31 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
X/Y
Perfil epidemiolgico
El perfil epidemiolgico es algo similar al perfil de las personas. En
stas el perfil bsico lo dan los genes, pero los perfiles son cambiantes
y hay que actualizarlos; a veces la gente cambia tanto que se vuelve irre-
conocible con el paso del tiempo. Una foto de una persona de 50 aos
no siempre deja ver cmo era de beb o de nio.
Vigilancia
La vigilancia epidemiolgica es una herramienta poderosa de la epide-
miologa y de la salud pblica.
Qu es? Qu se vigila
Se vigilia lo que pasa y
Hasta hace algn tiempo se hablaba exclusivamente de La vigilancia epi- sobre todo lo que uno
demiolgica, para diferenciar este tipo de vigilancia de otras que se hacen
con otros propsitos (como la inteligencia militar). La vigilancia epi- no quiere que pase.
demiolgica se define como la recoleccin sistemtica y permanente
de datos sobre una enfermedad o fenmeno, de manera que se identi-
fiquen tempranamente y as se pueda actuar de forma tan oportuna y
eficiente como sea posible. En la actualidad, se habla ms de vigilancia en
salud pblica con el fin de incorporar actividades de la salud pblica que
van ms all de la investigacin epidemiolgica y que incorporan otros
tipos de vigilancia: de laboratorio, de comportamientos y de oferta de
servicios.
Qu se vigila
Se vigilia lo que pasa y sobre todo lo que uno no quiere que pase. Por ejem-
plo, uno no quiere que se le entren los ladrones a la casa y por ello
le paga a los vigilantes. Uno debe vigilar permanentemente el estado
nutricional de las personas y celebrar cmo crecen las poblaciones sa-
nas, pero debe estar preparado para tomar medidas en aquellos casos
infortunados en que el equilibrio social se rompe, de manera que se
34 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
detecten y puedan ser solucionados, tan tempranamente como sea posible, los
casos en los cuales hay signos de alarma.
Epidemia
Versin tradicional
El concepto de epidemia estuvo tradicionalmente asociado con las en-
fermedades infecciosas. Pero incluso dentro de ellas aquel ha cambiado.
En el caso de las enfermedades transmisibles, un solo caso de una en-
fermedad que no se ha visto en un largo periodo, o la primera invasin
de una enfermedad no identificada antes en un sitio, es una epidemia.
Dichos casos requieren ser reportados de inmediato. Cualquier caso
de parlisis flcida de cualquier etiologa, en cualquier lugar, disparara
mltiples alarmas en todo el planeta, pues podra tratarse de polio, una
enfermedad a punto de ser erradicada en el mundo. Igual pasara con
un nuevo caso de viruela, una patologa ya erradicada, o un caso de
SARS o de gripa aviar, cuyas amenazas recientes han puesto a temblar
los servicios de salud de todos los continentes.
Versin nueva
En la actualidad, el concepto de epidemia no est confinado a las in-
fecciones sino que incluye muchas otras enfermedades, algunas de ellas
crnicas, como cncer, accidentes, suicidios, intoxicaciones, anorexia
nervosa, etc. Aqu la epidemia tambin se define por cualquier nmero
de casos ms all de lo esperado en una poblacin dada, segn el com-
portamiento histrico de dicho fenmeno.
Umbral de inmunidad
Inmunidad de Rebao
Comportamiento hipottico del sarampin
en una regin dada a lo largo de los aos.
Epidemia sobre
un pico estacional
Al acabar la
inmunidad de
rebao cada 4
aos hay picos
# Casos
estacionales
Epidemia
Pico por fuera
del estacional
Causalidad
La epidemiologa tiene que ver con la distribucin y los determinantes de
salud y enfermedad, morbilidad, lesiones, discapacidad y muerte en las
poblaciones; ayuda a formular la pregunta correcta y a encontrarle las
explicaciones ms plausibles a los fenmenos de salud y enfermedad;
tambin nos ayuda a determinar cules son los factores causales y en
qu proporcin estos pueden ser responsables de una enfermedad o
fenmeno.
37 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Por ello, los epidemilogos han gastado ya varios de sus aos pregun-
tndose: Qu es una causa? Cmo sabemos que estamos frente a
una?
Mervin Susser ofrece una definicin muy amplia de causa8: Todo aque-
llo que produzca un cambio. Y con ello admite que el sexo, la edad, el
sitio donde nacimos, a pesar de que son caractersticas que no podemos
modificar o someterlas a un experimento, pueden ser catalogadas como
causas. Observe que le hablamos de poder exponer nuestros factores a
un experimento (definicin de causa contrafactual). Es aqu donde los
epidemilogos se dividen entre aquellos que afirman que una relacin
puede ser causal si es posible someter el factor causal a un experimento,
y entre aquellos que no se fundamentan en el paradigma experimental
para darle piso a sus argumentos causales.
Ejercicio 5
Prevencin y promocin
La prevencin primaria tiene como objetivo lograr la reduccin de la
incidencia de la enfermedad (bsicamente que aparezcan nuevos casos)
por medio de inmunizaciones, el saneamiento, la educacin y diversas
formas de eliminar la contaminacin del medio ambiente con agentes
patgenos. Este concepto de prevencin primaria no se puede separar
del de promocin de la salud, que tiene como objetivo preservar el
nivel de salud de una comunidad, informarla y capacitarla para que ella
misma ejerza un mayor grado de control sobre su salud, as como esti-
mularla a practicar estilos de vida saludables.
Ejercicio 6
Ejercicio 7
Suponga que usted vive en una regin donde la carne de cerdo hace
parte de la dieta tradicional. Si usted tuviera que escoger la medida de
prevencin primaria ms efectiva (solo una) para evitar la aparicin de
nuevos casos de neurocisticercosis, cul escogera?
Ejercicio 8:
La epidemiologa es cambiante
Note todas las infecciones que han aparecido desde cuando uno de
nosotros se gradu de mdico (JO), hace ms de 30 aos:
Se caen todos los andamios que nos daban la falsa seguridad; el cono-
cimiento y la realidad se transforman y la epidemiologa tambin. Ah
est el desafo para quienes leen este libro y para las nuevas generacio-
nes.
Qu no es la epidemiologa
En muchos ambientes mdicos se ha querido desplazar la enseanza de
la epidemiologa tradicional y cambiarla por la epidemiologa clnica,
43 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Por fortuna, nos lleg la poca de la duda y el rescate del valor de las
ciencias sociales, que entre nosotros los mdicos haban sido miradas
con sospecha.
En resumen:
La epidemiologa:
Ordena.
Define.
Disea.
Bibliografa
2. Gakidou E., Oza S., Vidal Fuertes C., Li A.Y., Lee D.K., Sousa A.,
Hogan M.C., Vander Hoorn S., Ezzati M. (2007). Improving child
survival through environmental and nutritional interventions: the
importance of targeting interventions toward the poor. JAMA,
298 (16): 1 8761 887.
5. Davey Smith G., Ebrahim S., Lewis S., Hansell A.L., Palmer L.J.,
Burton P.R. (2005). Genetic epidemiology and public health: hope,
hype, and future prospects. Lancet, 366 (9 495): 1 4841 498.
Lecturas recomendadas
4. Lpez A.D., Mathers C.D., Ezzati M., Jamison D.T., Murray C.J.
Global and regional burden of disease and risk factors, 2001: sys-
tematic analysis of population health data. (2006). Lancet, 367 (9
524):1 7471 757.
Principio de parsimonia
La estadstica busca encontrar la forma ms simple de presentar los
fenmenos y la interrelacin ms directa entre las variables estudiadas
para poder dar explicaciones sobre los hechos observados y generar
hiptesis sobre mecanismos causales. Todo eso lo hace con un cierto
orden.
Estadstica descriptiva y estadstica de inferencias:
Dos tipos de estadstica?
Se dice que existe una estadstica descriptiva y una estadstica inferen-
cial, de igual forma que al hablar de diseos se habla de estudios des-
criptivos y de estudios analticos.
La inferencia estadstica
Si mediante la estadstica descriptiva se generan hiptesis, mediante el
proceso de inferencia estadstica estas hiptesis se ponen a prueba para confirmarlas
o rechazarlas.
Fjese bien que se trata de conjeturas lgicas que nos ayudan a tomar
decisiones estadsticas, pero nunca podremos estar seguros 100% de
las conclusiones.
Variabilidad
Solo entonces:
Se formulan hiptesis.
Distribuciones y frecuencias
Observe los siguientes datos de las pulsaciones por minuto de los estu-
diantes de grado 9 A de un colegio de Bogot, despus de darle cinco
vueltas a la manzana del colegio y descansar durante cinco minutos.
79 68 74 91 68 65 90 80 80
69 76 78 92 86 62 70 70 63
64 75 81 84 75 75 79 66 71
66 62 71 100 88 90 64 72 74
84 65 66 82 83 62 77 74 66
62 62 62 63 64 64 65 65 66
66 66 66 68 68 69 70 70 71
71 72 74 74 74 75 75 75 76
77 78 79 79 80 80 81 82 83
84 84 86 88 90 90 91 92 100
Medidas de dispersin
Las medidas de dispersin son aquellas que describen la variacin de
los datos de una distribucin. A travs de ellas se intenta describir qu
tanto se alejan los datos de las medidas centrales.
(x1 - ) 2
S= (coloque una __ encima de la segunda X. para significar promedio)
n-1
EE =
n
Medidas de posicin
Al describir las medidas de tendencia central mencionamos la media-
na. Aunque la mediana en realidad describe una tendencia central, en
sentido estricto tambin es una medida de posicin y como tal debera
ser considerada.
Percentil 5 indica que de los 100 datos, solamente 5 estn por de-
bajo de ese punto. Por supuesto, 95 estn por arriba.
Aclaracin importante:
Grficas
Para resumir los datos, apelamos a grficas y tablas.
Quienes leen los textos y los reportes ignoran cunto trabajo hay antes
de que les entreguen los datos organizados. No saben que detrs de la
recoleccin y organizacin de los datos est, en gran parte, el secreto
del aprendizaje. La organizacin de los datos para ver qu muestran en
la mirada inicial sirve para que uno se familiarice con ellos y se atreva
a exponer las primeras teoras. De ah tambin la importancia de lo
visual.
Asimetra: (Skewness)
Desviada a la izquierda
o desviada a la derecha Asimetra bimodal Simetra bimodal
Cada nmero de las hojas, separados por comas, identifica pues el pun-
taje (unidades) que alcanz cada alumno dentro de la decena corres-
pondiente. As, en la parte del tronco con la decena 50 solo hay un
alumno que obtuvo 50, el puntaje mximo, del cual tomamos el cero
final y lo ponemos como una nica hoja de esa parte del tronco. Si otro
alumno hubiera obtenido 50, hubiramos colocado en esa fila 0,0.
54 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Tronco Hojas
50 0
40 a 49 0, 0, 4, 4, 5, 5,6 , 7, 7,7,7, 8, 8, 8
30 a 39 1,1,1,2,4,5,5,5, 6, 6, 9,9,9
20 a 29 7,8, 8, 8, 9
10 a 19 9
0 a 9
Miremos ahora las hojas que se desprenden del tronco en la rama co-
rrespondiente a los estudiantes que consiguieron puntajes entre 40
y 49: hubo dos que obtuvieron 40, representados por 0,0; luego dos
alumnos con 44, representados por 4,4; en seguida dos que lograron
45, representados por 5,5; uno que obtuvo 46, representado por el 6;
cuatro con 47 representados por los cuatro 7, 7, 7, 7 y tres con 48, re-
presentados por 8, 8, 8. Podramos hacer el mismo ejercicio para cada
rama del tronco y sus hojas respectivas. Ya que nadie obtuvo puntajes
por debajo de 9, en la casilla correspondiente a esa rama no colocamos
ningn nmero.
Tronco Hojas
5 0
4 00445567777888
3 11124555 66999
2 78899
1 9
0
Note que en esta ocasin en el tronco hemos omitido los ceros de las
decenas. Esta manera de presentar los datos nos da ms detalles que los
que obtendramos con un grfico de barras en el cual los datos estn
organizados por grupos, pero uno no sabe cmo discriminar los valo-
res dentro de esos grupos.
50
40 - 49
30 - 39
20 - 29
10 - 19
0-9
55 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Acc
por
Ao
BoxWhiskers Plot
En espaol se conocen como cajas y bigotes.
Las cajas dividen los datos en cuartiles, una de las medidas de posicin.
Los cuartiles se construyen acomodando en cuatro grupos, de menor a
mayor. Dichos grupos no tienen por qu ser simtricos, pero s deben
tener igual cantidad de datos.
Q1 Q2 Q3
Mediana
56 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Rango Intercuartil: Q3Q1, es decir, los datos del medio, los que
estn dentro de la caja.
Resumen
Medidas de dispersin
Rango
Rango intercuartil
Desviacin estndar
Varianza
Medidas de posicin
Percentiles.
Hay unos tipos especiales de percentiles llamados cuartiles Q1 o
percentil 25, Q2 llamado percentil 50 o tambin mediana, Q3
llamado percentil 75.
Puntaje Z.
Un dato alejado: outlier Dos racimos con un espacio ente ellos. Peso
No hay pendiente clara
57 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
r=1 r = -1 r=0
4. Herramientas
Mrelo por todos los costados. Familiarcese con sus secretos. Hga-
lo parte suya. Evite presumir en algn momento, que por haber des-
cubierto algunos de sus secretos y haberle encontrado utilidad, podr
usarlo automticamente en situaciones concretas.
Columnas
Enfermedad o evento a estudiar
FILAS +
Al cruzar las columnas con las filas obtenemos las cuatro casillas. A
estas tambin las podemos llamar celdas.
a a= b b=
verdadero falso
positivo positivo
c= d=
falso verdadero
negativo negativo
c d
60 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Totales
de las
sumas
de las
hileras
Tablas de contingencia
Cuando se le agregan al cuadro de cuatro casillas ms columnas o ms
hileras, hablaremos de un derivado del cuadro de cuatro casillas, que
entonces no tendr cuatro sino ms casillas y se llamar Tabla de con-
tingencia. En realidad, los cuadros de cuatro casillas tambin son tablas
de contingencia denominadas 2 x 2 solo que por ser las ms usadas, les
hemos puesto un nombre aparte.
Grados de libertad
La frmula para calcular los grados de libertad en las tablas de contin-
gencia es la siguiente:
5. Herramientas 2
Campana de Gauss
Esto sera para la mayora de las personas una campana:
Campana de ......................
- +
infinito infinito
Mu
32.1 32.1
-3 -2 - =0 + +2 +3
34.1% 34%
2.5% 2.5%
13.5% 13.5%
-3 -2 - =0 + +2 +3
Entre 0 y menos 1= 34.1% Entre 0 y ms 1 = 34%
68%
-1 +1
rea entre
+1 y -1 34.1 + 34 68
95
rea entre
+1 y +2 , 13.5 + 13.5 27
sumada al rea
entre -1 y -2
rea entre
+2 y +3
sumada al rea 2.4 + 2.5 5 5
entre -2 y -3
13.5% 13.5%
2.5% 2.5%
-3 -2 -1 +1 +2 +3
Area entre -1 y -2 desviaciones estndar,
ms rea entre +1 y 2 desviaciones estndar = 27%
Area entre --2 y --3 desviaciones estndar,
ms rea entre +2 y +3 desviaciones estndar = 5%
0
68.2%
95%
99.7%
=1
0 1 2 Z
Z=1.645 Z=1,96
67 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Distribucin Z
Los valores arriba citados se refieren a los que toman ciertas reas bajo
la curva en la Tabla de Z o Tabla de Distribucin Normal Estndar.
Una de las distribuciones normales ms usadas es la distribucin Z.
Por ahora esperamos que en adelante cada vez que mire una curva
normal recuerde que 0.025 es el rea de un lado de la curva (una de
las colas), y 0.025 del otro lado de la curva, de las verticales sobre Z =
-1.96 y Z = +1.96. Al juntarlas, estas dos reas suman 0.05, es decir 5%,
un valor recurrente en el anlisis epidemiolgico.
=1
-1,96 +1,96 Z
rea de rechazo
+1,96 Z
-1,96 Mu +1,96
-1,96 0 +1,96
69 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Al rea en azul
la llamamos beta 1-
Al rea en rosado
la llamamos 1
menos beta o
poder
6. Herramientas 3
Uso del cuadro de cuatro casillas
en la evaluacin de pruebas
Note adems que para calcular la Exactitud del Examen nos mo-
vemos en sentido diagonal de la celda a, a la celda d.
71 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Sensibilidad
Proporcin
de verdaderos
positivos
72 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
a verdaderos positivos
Sensibilidad =
a + c verdaderos positivos + falsos negativos
d Verdaderos negativos
Especificidad = ------------ = --------------------------------------------------
d + b Verdaderos negativos + falsos positivos
Proporcin
de falsos
positivos
b falsos positivos
Proporcin de = ------------- = --------------------------------------------------
falsos positivos
b + d falsos positivos + verdaderos negativos
73 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Proporcin
de falsos
positivos
c falsos negativos
Proporcin de =
falsos
negativos
c + a falsos negativos + verdaderos positivos
a b
Valor
predictivo
positivo c d
a verdaderos positivos
Valor predictivo = =
positivo a + b verdaderos positivos + falsos positivos
a b
Valor
predictivo
negativo c d
d verdaderos negativos
Valor predictivo = =
negativo
d + c verdaderos negativos + falsos negativos
75 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Esperamos que haya notado cmo para el clculo de los valores predic-
tivo positivo y negativo nos hemos movido en el sentido horizontal y
no en el vertical, como lo hicimos para las primeras cuatro frmulas.
Observe los siguientes esquemas grficos de una diana con los patro-
nes posibles; luego preste atencin a los dibujos:
Ni es preciso,
ni es exacto
77 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
a b
Exactitud
c d
78 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Por ejemplo, para ser clasificado como diabtico del tipo I, la OMS
requiere que los niveles de azcar en el plasma venoso sean mayores de
8mol/L. La Asociacin Norteamericana de Diabetes (ADA) requiere
que esos mismos niveles sean mayores de 140 mg/dl. Se trata, claro
est, de unidades de medicin diferentes y los 140 mg/dl equivalen a
7.8 mol/L. Pero si la medicin se hace en la sangre capilar venosa y
no en el plasma, la OMS requiere valores mayores de 7 mol/L, y la
ADA valores mayores de 120 mg/dl. La cifra de 120 mg/ dl equivale a
6.7mol/L. Se supone que en todos los casos las muestras se toman en
ayunas. Los rangos de referencia ms comnmente usados para deter-
minar si una glicemia es normal, en los laboratorios que miden en mg/
dl, son 80120 mg/dl.
-2 -1 Promedio +1 +2
Normal
Se define como rango normal aquel comprendido entre los dos puntos
que representan los valores de desviaciones estndar del promedio +2
y -2.
0 1 6 9
80 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Ejemplo:
10 10 10
6 mg/dl 7.6 mg/dl 10 mg/dl
grfica, podemos afirmar que todas las personas que estn por encima
de 9 mg/ dl y algunas de las que estn por encima de 6 mg/dl son go-
tosos, pero no sern considerados como tales porque el punto de corte
establecido fue muy exigente.
Este captulo pretenda, esencialmente, hacerle ver uno de los usos del
cuadro de cuatro casillas. A medida que avancemos notar cmo su
interpretacin se complementa y se enriquece con otras herramientas,
por ejemplo con la curva de distribucin normal, una herramienta tan
verstil y omnipresente, ya discutida en detalle en otro captulo.
7. Herramientas 4
ROC
Hemos pintado primero un cuadro lleno del color rosa plido para re-
cordarle que en el caso de las curvas ROC, al igual que en la campana
de Gauss, el valor que se mide es el rea debajo de la curva. Luego le
hemos quitado dos lneas, la superior y la de la derecha al segundo, para
que tenga presente que en la representacin usual de las curvas ROC
se usan como referencias las lneas que constituyen las ordenadas Y y
las abscisas X.
La curva ROC se llama as por sus siglas en ingls Receiver Operating Cha-
racteristics (caractersticas operativas del receptor de radio).
Sensibilidad
0 1 - Especificidad 1
1-E
Positivo Negativo
punto de
corte F- V-
V- V+
NO hay color rojo porque en este punto de corte no hay falsos elegidos
Podramos ver que no hay color rojo porque no hay falsos positivos.
Pero con colores o sin ellos, para la mayora de personas las curvas
ROC dan una informacin visual ms fcil de entender.
1- Especificidad
1- Especificidad
X Y
1. F+ = 1 - E V+ = S
2. V- = E V+ = S
3. V- = E F- = 1-S
4. F+ = 1 - E F- = 1-S
1
0.9 8/9 9/10
6/7 7/8
0.8
0.7 4/5
0.6 3/4
0.5
2/3
0.4
0.3
0.2
0.1
0
0 0.05 0.1 0.15 0.2 0.25 0.3
8. Herramientas 5
Cuadro de Cuatro Casillas y Clculo de Riesgos
Factor de riesgo +
Factor de riesgo -
Esta vez, al igual que en las otras oportunidades, usaremos color azul
para la columna de la enfermedad, pero en vez de rojo usaremos el
amarillo para la fila positiva del factor de riesgo. La combinacin de
los dos colores, el verde, significar que quienes estn incluidos en esa
casilla tienen simultneamente la enfermedad y el factor de riesgo.
+ -
+ a b
Factor de riesgo
- c d
90 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
a
Riesgo Absoluto entre los Expuestos = Incidencia =
[ a + b]
+ a b
Factor de riesgo
- c d
Riesgo Absoluto Nmero de individuos sin el factor de riesgo que tienen la enfermedad
para No expuestos =
# Individuos con la enfermedad pero + # individuos sin la enfermedad
sin el factor de riesgo y sin el factor de riesgo
Riesgo Relativo
El Riesgo Relativo RR es simplemente la Razn de dos probabilidades
condicionales.
Riesgo Atribuible
El Riesgo Atribuible se define como la Tasa de Incidencia en el grupo
sometido al riesgo, menos la Tasa de Incidencia en el grupo NO expuesto
al riesgo. Se trata de una resta.
a c
Riesgo Atribuible = -
[a + b] [c + d]
Riesgo Atribuible = Riesgo Absoluto entre los expuestos Riesgo Absoluto entre los NO expuestos
OR (Odds Ratio)
El OR es una manera de comprobar si la probabilidad de ocurrencia de
un evento determinado es la misma en dos grupos.
92 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Entonces, el Odds Ratio es una medida del efecto del tamao. Se define
como la Razn de que un evento ocurra en un grupo contra la razn de
que el evento ocurra en otro grupo. Dichos grupos pueden hacer parte
de un todo en el cual una clasificacin los divide dicotmicamente, por
ejemplo entre grupo experimental y grupo de control, o un grupo ex-
puesto a un factor de riesgo y otro no expuesto a dicho factor.
a/b axd
OR = =
c/d bxc
93 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
a b
c d
En este libro hemos separado el uso del cuadro de cuatro casillas para
el clculo de riesgos del captulo correspondiente a las pruebas diag-
nsticas. Ni la separacin ni el uso de colores, como est aqu plantea-
do, son universales, se trata nicamente de una sugerencia didctica no
siempre til ni necesaria.
9. Herramientas 6
Cuadro de cuatro casillas
en la prueba de hiptesis
Decisin Error
Aceptar H0 correcta Tipo II
Decisin
Sigamos:
No rechaza la H0 Rechaza la H0
Mu 0
Habamos dicho que toda curva normal se puede definir por una medi-
da de dispersin y una medida de tendencia central; tambin habamos
dicho que entre las medidas de tendencia central estn: la mediana, la
moda y la media o promedio -esta ltima la ms usada y la mejor com-
prendida-. Las medidas de dispersin se representan bsicamente por
la desviacin estndar (o por su cuadrado, la varianza).
Distribucin Normal:
1. Los valores positivos, a la
derecha, se dispersan de manera
simtrica con relacin a los
negativos, a la izquierda.
-3 -2 -1 0 +1 +2 +3
98 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
+2
+1
-1
-3 -2 -1 0 +1 +2 +3 -2
Valores negativos Valores positivos
-3
Los centiles
Ya est dicho, pero no sobra repetirlo. En una poblacin terica de 100
personas:
Percentil 1 significa que de las 100 personas solamente 1 est por
debajo de ese punto.
Percentil 5, que de las 100 personas solamente 5 estn por debajo
de ese percentil. Por supuesto, 95 estn por arriba.
Percentil 50 indica que exactamente la mitad de las personas
estn por encima de ese punto y la mitad por debajo. Es el punto
99 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
P50
P50
Permetro
en cm
Peso en kg
Del mismo modo, sucede que muchos interpretan los percentiles como
si se tratara de desviaciones estndar. O a las medidas de posicin como
si fueran medidas de dispersin. No obstante, se equivocan.
Los centiles -entre ellos la mediana- no fueron hechos slo para medir
poblaciones con distribuciones normales.
Q1 Q2 Q3
Mediana
101 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Curvas de crecimiento
Examine el siguiente dibujo:
Con un poco de imaginacin, podra ser una carretera de una sola di-
reccin en una regin desarrollada. Mire cmo hay una lnea en el cen-
tro para orientar a los conductores. Y por fuera de las lneas por donde
circulan los carros hay dos bermas de seguridad pintadas de gris.
Este es un esquema del modelo de Morley. Note que elimin las ber-
mas de los extremos.
Percentil 50
Percentil 95
Peso en
Grfica de crecimiento. kg
Peso sobre talla
Percentil 5
6 12
Edad en meses
Morley le dio especial nfasis al uso del peso para la edad ms que al
uso del peso para la talla o el de la talla para la edad, porque crey que
el peso para la edad solo daba informacin suficientemente buena, fcil
de usar y de interpretar, a menor costo. No menospreci la utilidad de
la medicin de la talla en cada evaluacin del nio, ni el uso de grficas
en las cuales se contrastaban el peso con la talla, pero saba cun difcil
es tallar bien y hacerlo consistentemente. De la experiencia haba apren-
dido cuntos errores se cometen en la medicin de la talla rutinaria de
los nios. Por otra parte, Morley y otros se haban dado cuenta de que
a veces la talla de los nios pareca esttica por ciertos periodos sin que
los nios dejaran de ganar peso o estuvieran mal clnicamente, tambin
cmo en otros momentos de la vida del nio la talla daba saltos ines-
perados entre mediciones -como si los nios se estiraran mgicamente
de un da para otro- . Al contrario de lo que ocurra con el peso, la talla
no se encoga, a no ser que estuviera mal medida, y para detectar cam-
bios, especialmente el dficit de talla, habra que esperar meses.
Hay otro punto importante: Morley, que saba de los errores cometidos
antes por Gmez, quiso evitar interpretar los carriles inferiores de la
grfica como si fueran carriles siempre peligrosos y, sobre todo, siem-
pre diagnsticos de desnutricin.
Tambin era obvio que en cada caso individual, todo nio debera
tener su propia grfica de crecimiento para vigilar si segua por su
carril o si se desviaba y, al comenzar a hacerlo, tomar las medidas
pertinentes. La luz de los semforos
solo se aplica para un
momento dado.
El problema es que para hacer su clasificacin de grados de desnu-
tricin, Gmez apel al uso de grficas de crecimiento individuales
construidas a partir de poblaciones de referencia. Quienes iban por
los carriles del centro estaban relativamente seguros y a medida que se
alejaban de l hacia abajo en esa poca no se insista con la fuerza de
hoy en los riesgos de la obesidad se clasificaban en Desnutridos I,
Desnutridos II o Desnutridos III.
Peso
en kg
Edad en meses
105 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
En el modelo con los colores del semforo, todo lo que estuviera por
debajo de una franja verde ideal se calificaba como de riesgo: el ama-
rillo era para estar alerta y el rojo definitivamente condenaba, mientras
ms abajo, peor. Los nios prematuros estaran siempre condenados
y sus mams seran castigadas cada vez que vinieran a la consulta de
seguimiento de sus bebs.
Desnutricin I
Desnutricin II
Desnutricin III
Es decir, Gmez fall al no identificar que haba que pasar del lenguaje
de los percentiles y las distribuciones que no eran enteramente nor-
males, al lenguaje de las distribuciones normales, los puntajes Z y las
desviaciones estndar.
106 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Clasificacin de Waterlow
Grados de Desnutricin
ndice usado: Normal Leve Moderado Grave
% con relacin al
percentil 50
Peso para la talla 90110 8089 7079 <70
Talla para la edad 95105 9094 8589 <85
107 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Qu se recomienda hoy
Ms que clasificar a los nios en grados de desnutricin, hoy se reco-
mienda tener en cuenta dos indicadores que todos entienden muy bien
y deberan poner a funcionar todas las alarmas, as como todos los re-
cursos mdicos, nutricionales y sociales en individuos y poblaciones.
Hambre
Enflaquecimiento (wasting)
Suponga que debe usted construir una nueva grfica de referencia para
Bogot. Cmo escogera a los nios para construir esa nueva grfica y
decidir si estn creciendo bien o mal?
Hay varias cosas que usted ya sabe, entre otras, que tendr que seguir a
los nios durante el tiempo necesario para construir la grfica. Es una
verdad de Perogrullo.
El expositor re. Una vez ms los participantes del curso se han dejado
traicionar por su espritu de justicia y democracia.
Del Percentil 5 para abajo estaran los flacos. Pero no hay que olvidar
que por flacos que nos parezcan, si se toma un solo punto de corte, es-
tos individuos son los ms flacos de una poblacin tericamente ideal.
El Percentil 50 seguira siendo el punto exacto por encima del cual es-
tn 50% de los valores superiores y por debajo del cual estn 50% de
los valores inferiores de una poblacin.
110 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
3 5 10 25 50 75 90 95 98
Para que los valores de los percentiles se puedan usar de manera equi-
valente a los de una curva normal, es preciso transformarlos en algo
ms parecido a la campana anterior, es decir, hay que normalizarlos.
Puntaje Z
(X - P50)
Z = ----------------
DS
sino que los valores positivos (azules) quedan por debajo de los nega-
tivos (rojo).
Al rotar la campana 90o los valores negativos (en rojo) quedan arriba,
algo que no encaja en la logica visual de la mayora de nosotros.
Z=0
Primero rotamos 180o sobre el eje vertical la y ahora si, rotamos la grfica 90o a la derecha,
parte azul, y 90o la parte roja, de manera que los con lo cual los valores positivos quedan por arri-
valores negativos queden transitoriamente a la ba y los negativos por debajo del punto en que
derecha. Z=0
Z=0
Valores
negativos:
-1, -2, -3
112 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
O con colores, que sugieren que los puntajes dentro de los cuales se
debe encontrar la mayora de valores en una poblacin normal, deben
estar en el rango comprendido entre +1 y -1. Mientras ms se alejen los
valores de Z = 0, menos normales son.
Ms 3
Ms 2
Ms 1
Z=0
Menos 1
Menos 2
Menos 3
Haba notado ya que los carriles donde estn situados los valores ne-
gativos con relacin al percentil cincuenta estn en la parte de abajo, es
decir a la derecha, donde deberan estar los valores positivos? Y que
una campana como la que va montada en las curvas de crecimiento no
podra ser una campana de Gauss?
Transformacin de una distribucin
Z en un puntaje Z. Ejemplo de la
grfica de crecimiento.
Percentil 50
Percentil 5
Note que los carriles con huellas en rojo que corresponderan a los
percentiles bajos, en la campana de Gauss, antes de transformarla,
corresponderan a los valores positivos en azul
113 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Z=0
Puntajes negativos de Z
por debajo de la lnea
de Z = 0
Z=0 representara
el crecimiento de
la poblacin ideal
aqu en azul
Z=0
1 2 3 4 5 6 7 8 9 10 11 12 meses
La lnea roja representara los puntajes z de los nios amamantados
Z=0
1 2 3 4 5 6 7 8 9 10 11 12 meses
Cada persona tiene derecho a 15 litros de agua por da para aseo y co-
mida. La racin diaria por persona no es mayor de 1 500 kcal. Escasa-
mente para sobrevivir. El desierto no produce mucho.
A pesar de que las mams son estimuladas para que lacten, y muchas
lo hacen, otras caen en la tentacin de darles frmula infantil a sus
bebs. Y estos, por supuesto, se desnutren y mueren si las mams no
logran relactarlos. A los ms enfermos hay que remitirlos a los Centros
Teraputicos de Recuperacin Nutricional. Pero estos viven llenos. No
hay espacio para tantos. Y no se debe admitir a todos, pues se pueden
infectar ms fcilmente cuando estn admitidos.
Cuando se usa por fuera del contexto en que podra ser realmente til,
por ejemplo en situaciones de emergencias y desastres, y en hambru-
nas, quienes usan dicho modelo:
Propuesta
1. Peso para la edad: til especialmente en periodos cortos de tiempo
para vigilar la evolucin de un nio que parece ir bien, se ve bien,
es bonito, gil, canta, es alegre. Es una propuesta que sigue la filo-
sofa de Morley. Se empieza a quedar corta cuando el nio entra
en el mundo soficisticado de la pediatra de las sociedades comple-
jas, aquellas donde habiendo toda la comida, sera imperdonable
no detectar en el nio cualquier asomo de retraso, especialmente
entre quienes van por los carriles de abajo. Aqu, cuando el nio
se enflaquece, la mejor grfica de seguimiento, bien sensible a los
cambios, es la del peso para la talla.
2. Peso para la talla. El bajo peso para la talla refleja una prdida de
peso ya sea reciente, como correspondera a lo que han llamado
una desnutricin aguda, o de ms larga duracin, como sera el caso
de nios descuidados por largo tiempo; algo que se ve en familias
disfuncionales o en situaciones econmicas difciles en todas las
sociedades. Lo cierto es que el nio se est enflaqueciendo. Y hay
que detectarlo a tiempo para que no lo siga haciendo. Seran los
nios de madres con dietas raras; aquellas que esconden sus nios
bajo las ropas o que persisten en lactar sin aumentar la produccin
de leche, o aquellas que persisten con la lactancia exclusiva en eda-
des en que el nio ya debe recibir alimentacin complementaria;
aquellas que con razn o sin ella sienten odio por el establecimien-
to profesional y no consultan aun cuando estn llenas de dudas.
Para que sea til en el seguimiento y para que refleje cambios, la
talla debe ser impecablemente medida. Sobre todo en el nio que
se estir y no ech carnes. Para que sean usadas adecuadamente,
los pediatras y otros profesionales deben estar actualizados en las
nuevas grficas de crecimiento, como la recientemente desarrolla-
da para todo el mundo por la OMS, en la cual el patrn ideal es
tomado de nios lactados segn las recomendaciones.
Bibliografa
Bengoa J. M., Jelliffe D. B., Prez C. (1959). Some indicators for a broad
assessment of the magnitude of protein calorie malnutrition in young
children in population groups. Am. Jr. Clin. Nutr,7: 714.
http://journals.cambridge.org/
journals.cambridge.org/production/action/cjoGetFulltext?fulltextid=
653300
Gmez, F., Ramos Galvn, R., Frenk, S., Muoz, J. C., Chvez, R., and
Vzquez, J. (1956). Mortality in second and third degree malnutrition.
Journal of Tropical Pediatrics, 2, 7783.
Sykes P.A. Errors arising through using the Harvard tables and percen-
tage levels of median weightforage in assessing nutritional status.
(1977). Archives of Disease in Childhood, 52, 391394.
120 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Dewey K.G., Peerson J.M., Brown K.H. et al. (1959). Growth of breas-
tfed infants deviates from current reference data: A pooled analysis of
US, Canadian and European data sets. Pediatrics 96: 495.
Lecturas recomendadas
http//www.who.int/childgrowth/standards/en.
http//www.who.int/childgrowth/en.
121 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Fuentes
Podemos obtener las medidas de ocurrencia de enfermedad y mor-
talidad de los registros de estadsticas vitales, de los registros de los
servicios de salud, o como resultado de la vigilancia de fenmenos o
eventos, pero tambin como resultado de estudios epidemiolgicos o
clnicos.
Medidas de Frecuencia (Medidas de ocurrencia
de enfermedad y mortalidad)
Las medidas de frecuencia se dividen en dos grandes grupos:
*Nota: algunos usan trminos que pueden llegar a confundir a los lec-
tores que comienzan. Riesgo, por ejemplo es llamado por algunos Pro-
porcin de incidencia. No esperamos que lo entienda totalmente ahora,
pero s que est alerta ante las variaciones del lenguaje.
Prevalencia e Incidencia: lo que usted ya saba
El concepto con que probablemente usted llega a ojear este libro es que
por un lado existe la Prevalencia y por otro la Incidencia, as a secas.
Ejemplo:
Usted ha sido contratado como experto para que establezca si existe
una emergencia sanitaria en un campo de refugiados de Dadaab, en el
oriente de Kenia. El da siguiente a su llegada hace una encuesta para
establecer cuntas personas tienen diarrea. Visita entonces cada una
de las tiendas donde se ubican las familias y le pregunta a cada uno de
sus habitantes si ha tenido ms de tres deposiciones en el da, pues esa
es la definicin que usted y otros expertos han aceptado para determi-
nar los casos. Usted encuentra que de las 1 000 personas entrevistadas
(que constituyen el total de personas en el campo, aunque tambin
podran haber sido escogidas al azar si se tratara de un campo de refu-
giados ms grande), 200 llenan sus criterios de episodio de diarrea. La
Prevalencia de Punto de diarrea en este lugar ser el nmero de perso-
nas que llenaron los criterios de diarrea, es decir 200, sobre el nmero
de personas que usted entrevist, o el total de personas en el campo
de refugiados, es decir 1 000; P = 20 por 100 personas = 20%.
124 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Nota aclaratoria
Como la diarrea es un evento recurrente, usualmente usted podra in-
cluir los 50 casos nuevos de los casos prevalentes en su numerador, y
tomar como poblacin de riesgo las 1 000 personas. Para enfermedades
126 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
que solo se presentan una sola vez, como sera el caso de la diabetes,
su poblacin a riesgo estar siempre constituida por aquellos que no
han desarrollado la enfermedad. No siempre es fcil definir cul es la
poblacin a riesgo porque las poblaciones estn en movimiento (como
las 150 personas que se han marchado del campo de refugiados en
nuestros tres meses, y de quienes no sabemos si sufrieron o no de dia-
rrea). En muchos de estos casos (cuando es difcil definir la poblacin
a riesgo) vamos a preferir utilizar otra medida de incidencia, como lo
veremos ms adelante.
(P = I x D)
Incidencia
Inmigracin
Prevalecencia
Curacin
Muerte
Emigracin
Entonces,
Riesgos y tasas
Hasta hace poco los epidemilogos haban intercambiado los trminos
riesgos y tasas. Lo cual da origen a algo de confusin.
Pero los dos conceptos estn entrelazados debido a que tomamos pro-
medios de las poblaciones para calcular el riesgo de los individuos y
con frecuencia usamos los dos trminos como si fueran sinnimos.
Cuando las poblaciones que definimos son fijas y sabemos que habr
varias personas que abandonarn el estudio, tenemos otras posibilida-
des para definir nuestro denominador: 1) la poblacin a riesgo son to-
dos lo que entraron en el estudio, 2) la poblacin a riesgo son solo los
que quedan cuando acabamos el estudio, 3) la poblacin a riesgo es una
poblacin promedio (igual que lo que calculamos para la prevalencia de
periodo) o 4) la poblacin de riesgo son los que acaban ms la mitad
de los que no acaban (aquellos que no acaban son contados como la
mitad).
Fig. 2a Fig. 2b
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
Tiempo Tiempo
Desarrollan el evento Emigran o se mueren
Pocos cnceres tienen un contenido emocional tan alto para las muje-
res y sus familias como el cncer de mama. La gente sabe que el cncer
de mama suele ser mortal y que es necesario hacer algo para prevenirlo.
Pero nadie le ha dicho que no es lo mismo prevencin primaria o se-
cundaria y menos que para que la prevencin primaria sea til, debe ser
de toda la vida, y tampoco le han dicho que algunos de los factores de
riesgo no seran controlables, tales como la historia familiar, es decir,
los genes. Lo que s le han dicho es que se hagan peridicamente una
mamografa o que se examinen los pechos todos los meses. Les han
vendido la idea de la necesidad de usar servicios que cuestan. Mamo-
grafas para todas a partir de los cuarenta o cuarenta y cinco todos los
aos y auto examen de mama todos los meses a partir de edades cada
vez ms tempranas. Nadie habla de la sensibilidad y de especificidad o
del valor predictivo positivo o negativo de las pruebas, algo de lo cual
hablamos en el captulo correspondiente.
Pero sobre todo, no le han dicho a las mujeres que, a parte de cualquier
consideracin, el riesgo (la proporcin de incidencia) es distinto segn
la edad. El riesgo de 1:8 sera el que le correspondera a mujeres por encima de los
65 aos cuando ya han ido eliminando otros riesgos y no han fallecido por in-
farto, por enfermedades cardiovasculares, diabetes, accidentes, suicidio,
no han sido asesinadas o no han muerto como consecuencia de enfer-
medades relacionadas con las gestaciones, sepsis, aborto o enfermedad
hipertensiva del embarazo.
Tampoco les han aclarado que por puro proceso de eliminacin, el cn-
cer de mama es una de las enfermedades por las que se pueden morir
las mujeres, especialmente despus de la menopausia, y que morirn
ms de dicho cncer si son obesas, si fuman, si no han tenido hijos, si
en su familia hay historia de cncer de mama, si han estado expuestas
sin descanso a la accin de los estrgenos durante largo tiempo, o han
tomado estrgenos despus de la menopausia. Menos les han dicho
que hay maneras naturales de descansar de esta influencia negativa de
los estrgenos adhirindose a sus receptores todos los meses, nmero
de hijos y tiempo de mamadas, y aos acumulados de experiencia de
lactancia (aqu viene el concepto de personatiempo).
Y jams les han dicho a todas esas mujeres que entraron en pnico y se
contaron como una de las ocho que iban en aquel vagn del tren a las
que les dara cncer, que a los cincuenta ese riesgo es de 1:150; a los 35
aos 1:1 500 pero de ninguna manera de 1 en 8.
134 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Poblaciones abiertas
Figura 3
Para el clculo del numerador de estas medidas se utilizan (al igual que
en las cohortes) el nmero de casos registrados en un periodo X (1 ao,
por lo general): nmero de nacidos vivos, nmero de consultas, nme-
ro de muertes por enfermedad X, nmero total de muertes. Y para el
denominador se usan: la poblacin censada o la poblacin estimada a la
mitad de periodo (la poblacin al 1 de julio). Con ello obtendramos la
tasa de nacimiento, la tasa de consultas, la tasa especfica de mortalidad
por una enfermedad X y la tasa total de mortalidad. Note que en el
caso de estas tasas se asume que la poblacin es estable (la poblacin es
la misma porque las entradas son iguales a las salidas) y que quitar del
numerador los casos nuevos hace muy poca diferencia en la tasa porque
la enfermedad es generalmente rara (el denominador es muy grande
toda la poblacin de Colombia). El gran desafo de estas medidas
es la definicin de caso y tener un denominador confiable. La interpre-
tacin de tasa de mortalidad es la misma que la de incidencia.
No todo lo que se llama tasa es tasa, como pudo haber deducido al leer
el ltimo prrafo. Observe los siguientes ejemplos:
Para finalizar este captulo, le hablaremos de lo til que puede ser para
usted y para quienes toman las decisiones de polticas de salud de su
pas, el saber que la mortalidad tiene una relacin directa con la inci-
dencia y la fatalidad.
Ejercicio
70
65
Mortalidad por 100.000 habitantes
Hombres
60
55 Enfermedades
50 isqumicas
45 Mujeres
40
35 Hombres
30 Enfermedades
25 cerebrovasculares
20 Mujeres
15
10
5
0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Dichas medidas son indicadores que buscan evaluar la fuerza con que
un evento (enfermedad) se asocia con un determinado factor o causa,
es decir, son medidas que comparan el riesgo de que una enfermedad
se desarrolle en el grupo de personas expuestas al factor bajo sospecha,
con aquellos no expuestos.
La comparacin ideal sera con uno mismo, tal como se hace en los
estudios de entrecruzamiento o un modelo en el cual todo fuera igual
excepto el factor de exposicin. Esta situacin no es real en la mayora
de diseos y de estudios. Ni siquiera uno es igual a s mismo entre un
momento y otro del estudio.
Ie -I0
RD = R1 - R0 /R0= RR - 1.
Resumen:
Los riesgos no se pueden comparar con las tasas que tienen diferentes
unidades de medidas, por la misma razn que las diferencias de riesgos
cuyo resultado es una resta, no se pueden comparar con las diferencias
de tasas cuyo resultado es una divisin.
se pueda aplicar.
RD/R1 = R1 - R0/R1
= 1 - 1/RR = RR-1/RR
Bibliografa
2. Ghafoor A., Jemal A., Ward E., Cokkinides V., Smith R., Thun
M. (2003). Trends in Breast Cancer by Race and Ethnicity. CA Cancer
J Clin., 53 (6): 342355.
Lecturas recomendadas:
http://hp2010.nhlbihin.net/atpiii/calculator.asp
http://www.who.int/whosis/en/
145 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
12. Epidemias
Qu es una epidemia
En general, se habla de epidemia cuando se presentan nmeros eleva-
dos de nuevos casos que exceden los esperados en un momento
y en un lugar limitado. En las enfermedades infecciosas esto se aplica Una epidemia es en-
tanto en los casos que provienen de una fuente comn, como cuando tonces la ocurrencia
se trata de epidemias propagadas.
inusualmente alta de
Una epidemia es entonces la ocurrencia inusualmente alta de una en- una enfermedad.
fermedad. La decisin de llamarla inusualmente alta en el caso de las
infecciones depende de las circunstancias; por ejemplo, en el caso de
grmenes causantes de pandemias o de enfermedades reemergentes,
un solo caso podra ser tratado como el comienzo de una epidemia.
Qu es un brote
Epidemias y brotes son sinnimos, sin embargo, el trmino brote se
suele reservar para el aumento sbito, por encima de la lnea de base,
de casos de enfermedades infecciosas. Un brote puede ser, como ya lo
dijimos, un solo caso de una enfermedad comunicable, en especial si
esta es grave, no se ha visto por un largo periodo de tiempo en un lugar
dado y, por lo tanto, requerira de un reporte inmediato. Tal sera un
solo caso de polio o de una parlisis flcida de cualquier naturaleza, u
otro ms dramtico como sera la aparicin de un solo caso de viruela;
tambin podra tratarse de la aparicin de un solo caso de influenza de
cepas como la H5N1, o la H9N2 (la cepa responsable de las pandemias
ocurridas en Hong Kong durante 1997 y 1999), en las que todas las
alarmas de todos los sistemas de salud del mundo se prendieron ante la
posibilidad de una pandemia, tal como sucede en el momento en que
este libro va a impresin con la cepas AH1N1.
Endemia
Se habla de endemia cuando la enfermedad se presenta en forma cons-
tante e ilimitada en el tiempo, pero es limitada con respecto al lugar. Cuando la
prevalencia de una enfermedad es elevada, hay que pensar en enfermedades
endmicas.
Pandemia
Se trata de elevaciones inusuales de una enfermedad en un periodo de
tiempo limitado pero en un espacio geogrfico ilimitado. Se dice que cuando una
enfermedad sobrepasa un continente, estamos ante una pandemia.
Tipos de Epidemias
Epidemias de Origen Comn
# de
casos
B A
Tiempo
La curva Lognormal
En la curva Lognormal la parte ascendente representa el nmero de
casos nuevos (la proporcin de incidencia), la parte descendiente mues-
148 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
# de Caso ndice
casos
Casos Secundarios
Tiempo
La curva de las epidemias progresivas tiende a mostrar un ascenso ms
gradual debido a que se propaga de persona a persona, tambin cuenta
con una forma ms simtrica que la de origen comn. El modo de
transmisin puede ser directo o indirecto, segn la transmisin se haga a
travs del contacto humano o sus fomitas (gotas de aerosol del tracto
respiratorio, orina, sudor, heces), a travs de vectores (artrpodos) o
del aire. En las epidemias progresivas adquiere especial importancia
identificar el caso ndice.
Caso ndice
Primer caso identificado a partir del cual se infectan los dems, como
sera el caso del asistente de vuelo de la compaa americana que infec-
t a tantas personas con el virus del HIV.
149 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Tasas de ataque
La tasa de ataque es una forma de medir la incidencia en la que el pe-
riodo de riesgo es limitado. Dichas tasas se usan cuando se calculan las
tasas de incidencia durante una semana, un mes o por el tiempo que
dure la epidemia, siempre y cuando tal duracin sea menor a un ao.
# casos nuevos durante un periodo especfico
Tasa de ataque =
# personas expuestas a riesgo durante el mismo periodo
Tasa de ataque secundario
P=IxD
D= Duracin promedio
I = Tasa de Incidencia
A la cantidad P
se le llama ODDS de Prevalencia.
I-P
151 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
152 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
0.75
Los ODDS de que el caballo gane = = 3:1
(1- 0.75)
Objetivo
Los estudios epidemiolgicos son ejercicios de medicin cuyo objetivo
es obtener estimativos de las medidas epidemiolgicas ya menciona-
das.
Maneras de separarlos
Estudios observacionales
Los estudios observacionales pueden ser analticos o descriptivos.
Recuadro 1.
Cohortes
Piense en las cohortes como si se tratara de dos ejrcitos que salen para
una larga marcha que los llevar a la misma guerra, son iguales en todo
excepto en las caractersticas que usted quiere analizar. Los puede mirar
continuamente desde el comienzo, como si se tratara de una pelcula,
o les puede hacer un seguimiento peridico cada determinado tiempo,
156 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
como si se tratara de unas fotos (note que, de hecho, unos y otros son
parecidos, ya que las pelculas simplemente son muchas fotos puestas a
continuacin una tras de otra), o puede usted de antemano decidir en
qu momento deja de hacer mediciones y alcanza el punto final; tam-
bin podra, para plantearlo de otra manera, intervenirlos exponiendo
a unos a ciertas condiciones de batalla, es decir, estara usted haciendo
un experimento; o simplemente todo lo que hara sera mirar a ver qu
pasa segn lo que vaya sucediendo, sin intervencin, en cuyo caso se
tratara de cohortes observacionales.
Expuestos Efecto
Poblacin Tiempo
a riesgo
No Expuestos Efecto
Tiempo
La exposicin
Poblacin a riesgo
Por otro lado, existen enfermedades que uno tiene y luego no las puede
volver a tener porque ya las adquiri y desde ese momento las tendr
para siempre. No pueden, por ello, ser sujetos susceptibles de ellas los
pacientes que ya sufren de la enfermedad de Louis Goerig (esclerosis
lateral amiotrfica) o la diabetes tipo 1. En este tipo de enfermedades
usted podr determinar la primera aparicin de la misma, en cuyo caso
la poblacin a riesgo es aquella que todava no la ha desarrollado. Pero
hay otras afecciones en las cuales los eventos pueden ser recurrentes, y
en este caso la poblacin a riesgo depender del objetivo de su estudio
(esto ya lo habamos visto en el captulo de medidas de frecuencia, pero
se lo repetimos aqu); por ejemplo, si el estudio est diseado para esti-
mar los factores asociados con el riesgo del primer episodio de infarto
de miocardio, la poblacin a riesgo ser aquella que nunca ha tenido un
infarto; pero si en esa misma poblacin se buscan los factores asocia-
dos con la recurrencia de un infarto de miocardio, la poblacin a riesgo
estar constituida por aquellos con infarto previo.
159 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
El efecto
Para poder contar estos eventos hay que definir con precisin qu sig-
nifica un nuevo caso, y a partir de qu momento se cuenta la enferme-
dad. Tomemos el caso de la bomba de Hiroshima. Por supuesto, ese
seguimiento uno no lo comienza a hacer en el periodo inmediato al
accidente. ste, por definicin, no fue algo planeado sino que sucedi
inesperadamente y uno todava se est reponiendo del susto. Pero si
se iniciara el seguimiento ah mismo, imposible logsticamente, y se
diagnosticara un carcinoma de tiroides en la primera semana despus
de la cada de la bomba, por lo que sabemos es poco probable que se
pueda atribuir (plausibilidad biolgica) a la explosin, asumimos que
ese cncer lo traa dicha persona desde antes de la explosin, si acaso la
baja masiva de defensas lo hizo consciente de ese problema. Lo mismo
sucedera en el caso de los pilotos y los ayudantes de cabina, en cuyas
circunstancias sera imposible atribuirle a la exposicin csmica cual-
quier cncer que aparezca en el primer ao de trabajo. En general, para
que se desarrolle la enfermedad de manera que pueda ser detectada
clnicamente, hay que dejar pasar un periodo conocido como periodo
de induccin y un periodo de latencia (ver recuadro).
Cohortes retrospectivas
Los objetivos de los estudios de casos y controles son los mismos que
los de los estudios de cohortes, pero pretenden hacerlo con ms efi-
ciencia. Cuando se llevan a cabo de manera adecuada y cuando estn
indicados, los estudios de casos y controles proporcionan informacin
comparable con la que produciran los estudios de cohortes, por lo ge-
neral en menos tiempo y con menos costo. Infortunadamente, aunque
son ms fciles de llevar a cabo, tambin es ms fcil que terminen mal,
ya que los estudios de casos y controles tienden a ser ms susceptibles
que otros a los sesgos.
Poblacin
fuente
Expuestos Casos
No Expuestos Controles
Los Casos
Un caso puede ser una persona con cierta o ciertas enfermedades a
quien queremos comparar con otra que nunca la(s) ha tenido; una per-
sona que recibi una vacuna con otra que no la ha recibido; una per-
sona que fue sometida a una prueba de tamizaje de una enfermedad a
quien queremos comparar con otra que no fue tamizada. Lo que ha-
cemos en los estudios de Casos y Controles es comparar personas con
un evento, con otras con otro evento o sin el evento, y en general ese
evento es una enfermedad. Observe los siguientes ejemplos clsicos de
estudios de Casos y Controles.
Estudio Autores y publicacin Casos Controles
El hbito de fumar y el Richard Doll y Austin Bra- Cncer de pulmn de 743 enfermos con
carcinoma del pulmn. dford Hill. entre 1 732 pacientes patologas no malignas
British Medical Journal, 30 entrevistados de un total hospitalizados en las sa-
de septiembre de 1950. de 2 370 casos de cncer las de medicina y ciruga
de pulmn, estmago o general.
intestino grueso reporta-
dos entre 1948 y 1949 en
Inglaterra.
Adenocarcinoma de la vagi- Arthur I. Herbst, Howard Ocho pacientes naci- Cuatro testigos pareadas
na: relacin entre la terapia Ulfelder y David C. Pos- das entre 1946 y 1951 por cada paciente.
materna con Estilbestrol y kanzer en hospitales de Nueva Comentario: se encon-
la aparicin de tumores en The New England Jour- Inglaterra en quienes se tr que las madres de las
mujeres jvenes. nal of Medicine 248 (16): diagnostic adenocarcino- pacientes con carcinoma
878881, 1971. ma de vagina, una entidad vaginal haban sido tra-
muy rara. tadas a partir del primer
Comentario: la presen- trimestre del embarazo
tacin de solamente 8 con dietil etilbestrol.
casos de una enfermedad Este es el estudio ms
tan rara se trataba de una clsico de cmo con
verdadera epidemia. pocos datos y un buen
diseo es posible llegar a
conclusiones valiosas.
Edad al primer parto y ries- Brian MacMahon, P. Cole, Cncer de mama. 13 000 personas con-
go de cncer de mama. T.M. Lin, C.R. Lowe et al. 4 000 casos de cncer de trol.
Bulletin of the World mama en 7 pases.
Health Organization,
43:209221, 1970.
Poblacin fuente
Los estudios de casos y controles se entienden mejor si se toma como
punto de partida a una poblacin fuente que representara hipottica-
mente (o de hecho) una poblacin en la cual se hubiera llevado a cabo
(o se realiz) un estudio de cohortes. De esta poblacin fuente se toman
los casos y los controles que se incluyen en el estudio. Al igual que para
los estudios de cohorte, las poblaciones fuente pueden ser trabajado-
res de una empresa, una poblacin geogrfica definida o un grupo de
personas expuestas a las mismas condiciones: una guerra, un accidente
nuclear, entre otras.
Es decir, para que los estudios de Casos y Controles sean eficientes, nos
obligamos a definir con gran precisin y sentido prctico la poblacin
fuente. En el ltimo ejemplo escogemos como poblacin fuente a la
poblacin que va a consulta a la Clnica Shaio, y elegimos como casos
dentro de ellos a los que sufren de enfermedad coronaria.
El grupo control
El propsito del grupo de control es determinar el tamao relativo
de los componentes de la exposicin y de la no exposicin de la poblacin
fuente.
Las fuentes usadas con frecuencia para las series de controles son:
Por ejemplo, cuando se hace una entrevista nueva sobre un detalle es-
pecfico, un tema para preguntarles a los miembros de la cohorte casos
sobre una exposicin especfica no considerada en las primeras entre-
vistas.
Tiempo (edad)
A
B
Formacin de la cohorte
Estudios de CasosCohorte
Por el contrario, los estudios de CasosCohorte son estudios en los
cuales:
dio unos bellos ojos negros. Pero s se podran estudiar los efectos
del consumo de alcohol o del alquiler de pelculas pornogrficas
sobre la salud de los mismos viejitos que consumen Viagra.
Los experimentos
Los experimentos son estudios de cohortes. (No todas las cohortes son
experimentos).
Ensayos de campo
En los ensayos de campo (field trials) el objetivo es estudiar la preven-
cin primaria de una enfermedad, por ejemplo mediante una vacuna,
es decir que este tipo de experimentos se hacen en personas sanas. Los
elementos que describimos para los ensayos clnicos se aplican de la
misma manera para este tipo de estudios.
Protocolos de investigacin
Para qu se hacen los protocolos de investigacin? Los protocolos
de investigacin se hacen con muchos propsitos: buscar financiacin,
ayudar al investigador a aclarar las ideas, someter a escrutinio la ca-
pacidad de investigar de un estudiante en formacin, y ms que todo
para garantizar que los aspectos ticos involucrados sean consi-
derados seriamente de antemano. Cada vez se hace ms nfasis en
la importancia de que los resultados que se publican concuerden con
los protocolos, y que usen menos los estudios con distintos objetivos
primarios para evaluar hiptesis que no se plantearon desde un prin-
cipio o hallazgos e interpretaciones que a uno se le ocurren cuando
ya tiene los datos a la mano y que no haba considerado antes. Sacados
del sombrero del mago y usualmente resultado de decisiones tomadas
con la excusa de: YA QUE contamos con estos datos, pues utili-
cmoslos. Suele ser receta de muchos desastres.
Para resumir
La dinmica de transicin epidemiolgica nos ha llevado como inves-
tigadores a tratar de responder preguntas sobre las enfermedades que
causan una gran carga de la enfermedad en el mundo. Las enfermeda-
des cardiovasculares (Colombia es uno de los 23 pases que produce el
80% de la carga de enfermedad por estas condiciones) y los cnceres
estn entre las principales causas de muerte. Los estudios de cohorte
han aportado importantes hallazgos que han permitido conocer los
principales factores de riesgo de estas patologas. Los estudios de co-
horte se siguen haciendo, predominan ahora sobre los otros tipos de
diseos analticos, y se seguirn necesitando en muchos contextos para
responder nuevas hiptesis. Sin embargo, aunque los investigadores
ven los estudios de Casos y Controles con mucha reticencia (por sus
posibilidades de sesgos), estos estudios, cuando son bien diseados, le
ayudan al investigador a responder hiptesis etiolgicas a menor costo
y le quitan menos tiempo a la persona entrevistada. Con un estudio
de Casos y Controles es posible responder mucho ms rpido a pre-
guntas etiolgicas de estas enfermedades, mientras que con la cohorte
tardaramos mucho tiempo en hacerlo (aunque no sera impensable que
lo hiciramos). Lo invitamos a que no los desprecie y que, ms bien,
aprenda a hacerlo de manera correcta. Otro mensaje importante que
quisiramos dejarle es que un estudio de prevalencia bien diseado, y
en lo posible que le permita comparar diferentes poblaciones, es de una
riqueza investigativa nica.
Bibliografa
3. Paridou A., Velonakis E., Langner I., Zeeb H., Blettner M., Tzo-
nou A. Mortality among pilots and cabin crew in Greece, 19601997.
(2003). Int J Epidemiol, 32 (2): 244247.
178 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
9. Ridker P.M., Manson J.E., Buring J.E., Shih J., Matias M., Hen-
nekens C.H. Homocysteine and Risk of Cardiovascular Disease Among
Postmenopausal Women. (1999). JAMA, 281 (19): 1 8171 821.
Lecturas recomendadas:
Clinical Trials
http://clinicaltrials.gov/ct2/info/index
Estudios de prevalencia
CARMELA
http://www.interamericanheart.org/?mod=carmela
SABE
http://www.icpsr.umich.edu/cocoon/ICPSR/STUDY/03546.xml
World Health Survey
http://www.who.int/healthinfo/survey/en/
Encuestas de demografa y salud
http://www.measuredhs.com/
Ensayos clnicos:
http://www.consort-statement.org/
Estudios observacionales:
http://www.strobe-statement.org/
179 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Usted ha sido advertido: dichos enemigos estn por todas partes y ade-
ms son astutos y escurridizos. Entonces, usted y todos los epidemi-
logos se preguntan cmo hacer para evitarlos. Esa es una tarea a la
cual los estadsticos y los epidemilogos le dedican gran parte de sus
esfuerzos, no siempre con xito.
Sabemos que hay tcnicas que pueden aumentar la validez de los estu-
dios, por ejemplo la aleatorizacin (asignacin al azar) mencionada con
anterioridad, pero no la garantizan.
2. Los sesgos
Los sesgos son variaciones que se repiten sistemticamente.
Los sesgos son errores repetidos que no son producto del azar
Las grandes categoras de sesgos, con los que usted estar ms familia-
rizado, son los:
Sesgos de seleccin, y
Sesgos de medicin.
Sesgos de seleccin
Sesgos de Medicin
Los sesgos de medicin dependern de qu tan bien calibrados estn
los instrumentos o de las expectativas de los participantes, ya que estos
le darn al investigador una u otra respuesta segn les convenga, de
igual forma que los evaluadores darn uno u otro puntaje segn lo que
183 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
quieran demostrar. Por ello, una manera de evitar los sesgos de medicin es
esencialmente mediante el enmascaramiento de los participantes (un ciego), de los
diseadores del estudio y de los participantes (dos ciegos) o de los anteriores ms los
evaluadores de pruebas (tres ciegos). Los sesgos de medicin se relacionan
tambin con la validez de los instrumentos de medicin de la exposi-
cin y de la enfermedad. Los sesgos de medicin se pueden evitar (o disminuir)
con instrumentos que sean confiables, es decir, que midan lo que quieren medir. El
uso de instrumentos poco sensibles o poco especficos puede alterar la
magnitud de nuestras asociaciones, como lo veremos ms adelante.
Nota: entre los autores y colaboradores del libro hubo una discusin
acalorada sobre la conveniencia y la relevancia de incluir esta contribu-
cin ligera en un libro tan serio; tambin les preocupaba a dos de ellos
el tono machista y el uso de un lenguaje tan ajeno a la correccin pol-
tica del momento. Finalmente, se mantuvo la nota de Yosimiro como
reconocimiento al desarrollo propiciado por los inmigrantes japoneses
llegados a Palmira a comienzos del siglo XX (Palmira es una hermosa
ciudad del Valle del Cauca, en Colombia, al menos eso dicen los pal-
mireos).
185 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Sesgo del observador: se supone que por ser hombres de ciencia, los
investigadores (mdicos y otros) usan criterios objetivos en las valora-
ciones clnicas. Eso est lejos de ser verdad.
Los sesgos causados por quienes endiosan las pruebas: Los endiosa-
dores de pruebas suelen ir camuflados de mdicos jvenes de hos-
pitales universitarios, con ms frecuencia entre quienes han hecho re-
cientemente alguna rotacin en el extranjero. An andan intoxicados
de libros a medio digerir y carecen de experiencia en la vida real. Basta
entonces que aparezca un artculo que anuncie una nueva prueba para
que ellos la abracen entusiasmados. La utilidad de una nueva prueba
diagnstica depende de si cumple con los mismos criterios de las prue-
bas ampliamente usadas, es decir, la Sensibilidad (capacidad de demos-
trar los verdaderos positivos), la Especificidad (capacidad de descubrir
los verdaderos negativos), y del Valor Predictivo. El problema que tienen
las pruebas nuevas es que se suelen ensayar primero en pacientes entre
quienes hay una prevalencia elevada de la enfermedad que se desea de-
tectar. En esas condiciones el Valor Predictivo de un test es ms elevado
que en condiciones normales.
Lepra
Presente + Ausente - Total
Prueba 62 4 66
+
Prueba
6 53 59
-
68 57 125
Lepra
Presente + Ausente - Total
Prueba 67 32 99
+
Prueba
6 425 431
-
73 457 530
nor nmero que antes. Unos aos ms tarde se aclarara el rol del Heli-
cobacter Pylori tanto en la gnesis de algunas formas de gastritis como
en las lceras y carcinomas gstricos.
Sesgos de anlisis
tales como edad y sexo, estn igualmente distribuidos entre los casos
y los controles. Por lo tanto, este apareamiento remueve el efecto de
confusin original de estos factores, pero puede introducir nuevos ses-
gos, en especial cuando se aparea tanto que al final los estudios no son
capaces de reconocer la presencia de una asociacin verdadera, usual-
mente la ms importante. En sentido estricto, el sobreapareamiento
no sesga los resultados pero hace que el anlisis sea ineficiente, con lo
cual desaparece la principal virtud del apareamiento.
Descansen Ar!
EC + EC - Total
Diabetes
72 134 206
+
Diabetes 408 4251 4659
-
408 4385
No se presentan los clculos, pero el lector ms interesado puede encontrar las fr-
mulas en libros de epidemiologa ms avanzados). Observe que el nmero de casos de
enfermedad coronaria no cambia, pero s el nmero de casos de diabetes que ahora
ha aumentado por el posible subreporte de diabetes cuando se hizo la encuesta. El
RR es ahora de 5.13
Miremos un ejemplo:
Factores de Confusin
Qu es un factor de confusin? Es un factor asociado con el resultado
que nos interesa, pero que por estar distribuido desigualmente entre
los grupos de estudio, invalida los hallazgos o hace difcil su interpre-
tacin.
Factor de confusin
Tambin, hace varios aos se dijo que el caf era causa del cncer de
pncreas porque los consumidores de caf tenan una incidencia mayor
de cncer de pncreas (los datos eran ciertos) pero se olvido considerar
que quienes tomaban mucho caf eran los fumadores.
Una pequea aclaracin: esta nota fue escrita antes de que el sistema de transporte MIO estuviera
funcionando.
Qu es la estratificacin?
Es la tabulacin cruzada de los datos de exposicin de un factor de
riesgo con un resultado por categoras, de una o ms variables, que po-
dran actuar como factores de confusin. Se hacen estimativos de los
efectos no influenciados por los factores de confusin y los IC de los
datos estratificados.
Es decir, primero se analizan los datos dentro de cada estrato por sepa-
rado y luego se juntan.
RR=3.38
Sin embargo, sabemos que las personas diabticas son muy diferentes
de las personas no diabticas de muchas maneras; por ejemplo, se sabe
que existen desigualdades sociales en la prevalencia de diabetes, es decir
que las personas con bajos niveles de educacin tienen mayores niveles
de prevalencia de diabetes que las personas con alto nivel educativo. La
educacin, adems, es un determinante importante de la incidencia de
ACV, en otras palabras, que independientemente de su relacin con la
diabetes, las personas de ms baja escolaridad tienen mayor riesgo de
ACV. Sus mecanismos son mltiples y podran incluir las pocas oportu-
nidades que tienen para hacer ejercicio, el mayor estrs social y la mala
calidad de la dieta. Nuestra figura conceptual sera la siguiente:
Dibetes ACV
Educacin
RR=2.38
199 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
12 aos de educacin
RR=2.96
Ms de 12 aos de educacin
RR=5.05
Estandarizacin de tasas
Qu es
Mtodo indirecto.
200 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Mtodo directo
Da como resultado la Tasa de Mortalidad/Incidencia Estandarizada
por edad (TEM) o en ingls (SDR).
Pasos a seguir:
Tasa ajustada
Incidencia en el grupo Incidencia en el grupo Incidencia en el grupo
de < 12 aos de 12 aos de > 12 aos
de escolaridad de escolaridad de escolaridad
Incidencia ajustada = 18571457 / = 13041698 / = 13033413 /
91143615 91143615 91143615
= 0.20 = 0.14 = 0.14
202 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Manera de calcularlas
Deseo comparar la mortalidad de una regin con la de todo el pas, o la
de un municipio con la de todo el departamento.
Lo cual quiere decir que los mineros mueren dos y media ms veces de
tuberculosis que la poblacin general.
Estimativo Puntual
Los estudios epidemiolgicos son ejercicios de medicin mediante los
cuales obtenemos estimativos (datos). En estadstica el clculo del estima-
tivo puntual conlleva el uso de los datos de una muestra para obtener
un valor nico - conocido como estadstico - que nos servir como la
mejor adivinanza posible de un parmetro de la poblacin.
Qu es un Intervalo de Confianza.
Un Intervalo de Confianza (IC) es un rango de valores que indica el
grado de precisin estadstica del estimativo. Los estadsticos usan di-
cho intervalo de confianza para describir numricamente la falta de
certeza asociada con el estimativo muestral que nos interesa.
Para calcular los IC es suficiente con que tengamos una frmula expl-
cita o una tabla para la distribucin del estimador.
Entienda que esto es algo ilusorio ya que aunque los ingleses an valo-
ran la puntualidad, los trenes en el Reino Unido pueden ser tan incum-
plidos como los buses en Colombia.
Necesitamos los IC para que quepa el mundo tal como es. En la esta-
dstica, al ser el estimativo un valor nico, necesitamos los IC porque
un valor nico tomado de manera aislada no logra expresar la varia-
cin estadstica o el error debido al azar subyacente en este estimativo.
Cuando los estudios son grandes, el proceso de estimacin es relativa-
mente preciso y habr poco error debido al azar. Si el estudio es peque-
o tiene menos precisin y el estimativo, por ende, est sujeto a ms
error debido al azar.
Implicaciones
Eso quiere decir que lo nico que cambiaran estas repeticiones hipo-
tticas del estudio, seran los elementos estadsticos debidos al azar,
tambin implica que las variaciones posibles de los datos se pueden
describir de manera adecuada por el modelo estadstico, y que no hay
sesgos. Ese es un mundo ideal que no existe ni en el estudio ms cuida-
dosamente diseado y ejecutado. Esa definicin de los IC, en especial
en los estudios no experimentales, pertenece al mundo de la ficcin,
que en el mejor de los casos nos proporciona un estimativo burdo de la
variabilidad estadstica de un conjunto de datos.
Significativo o no significativo?
(To p or not to p?) (Importa la p?)
Poder y Confianza
Para explicar estos difciles temas de la estadstica de inferencias, he en-
contrado que es mejor distinguir dos momentos: el del diseo (a priori
o antes de la observacin), y el clculo del estadstico con los valores
encontrados en la muestra (a posteriori o despus de la observacin).
El alfa del 0.05 en fracciones entre cero y uno, y 100 veces ese valor
cuando se quiere expresar como porcentaje, la explico diciendo que se
piense en una serie larga de pruebas positivas sobre la misma poblacin
y con el mismo diseo, por ejemplo cien pruebas en las cuales las di-
ferencias fueron lo suficientemente grandes para que se concluya que
211 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Explico la beta del 0.05 diciendo que en una serie larga de pruebas ne-
gativas sobre la misma poblacin y con el mismo diseo, por ejemplo
cien pruebas en las cuales las diferencias fueron tan pequeas que se
concluya que hay que seguir aceptando la hiptesis nula, la probabilidad
de equivocarse aceptndola aunque sea verdad que s hay diferencias es
slo del 5%, o sea que se equivoca uno en cinco de las cien pruebas
negativas, es decir en una de veinte; dicho de otra manera, acierta en
95 de ellas, o sea que el poder a priori es del 95%. La beta es la pro-
babilidad a priori de un falso negativo entre todos los exmenes del
mismo diseo que dan negativos.
p = 0.00
Explique qu pudo haber pasado. Ser que el diseo del test fue per-
fecto? Ser que hay cero duda, es decir que no hay duda con respecto a
que las diferencias son significativas? Ser que hay 100% de confianza
en rechazar la hiptesis nula?
212 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
No es que el diseo del test fuera perfecto, pues si hubiera puesto alfa
igual a cero para asegurarme contra falsos positivos, quedara prctica-
mente seguro de equivocarme por falsos negativos.
Todava queda duda de que este caso sea ese fatdico uno equivocado
contra los 199 en que, a la larga, yo acierte; nunca tengo el 100% de
confianza, aunque esta vez s puedo decir que tengo el 99.5% de con-
fianza.
Carlos E. Vasco U.
Qu es una p o un valor de p
La p es solo un estadstico (valor numrico o estimador) usado para po-
ner a prueba una hiptesis. El valor de p indica la probabilidad de
que los hallazgos observados podran haber ocurrido solamente como
resultado del azar. Lo opuesto no es verdad: una diferencia no signifi-
cativa no puede ser atribuida nica y necesariamente al azar.
0.8
0.6
Valor de p
0.4
Note bien los elementos que constituyen esta curva con forma de tipi,
como se llama la tienda de los indios norteamericanos:
Esta curva:
Ahora, mire superpuestas estas dos curvas que representan dos bases
de datos diferentes:
1
Valor de p 0.5
0.1 1 10 100
Riesgo Relativo
Al fin qu?
Cualitativo o cuantitativo. Importa tanto?
O parodiando a Hamlet: To p or not to p?
Valor de p 0.5
0.2 80%
90%
IC 95%
0.1 1 10 100
Riesgo Relativo
Por supuesto que no. Rara vez se hace en los artculos cientficos, pero
su valor grfico es innegable para entender cules son los conceptos
que hay detrs de estos datos.
219 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Probabilidades
Por convencin, en estadstica se llama Probabilidad a un valor com-
prendido en un rango que va de 0 a 1,dicho valor describe la probabili-
dad de que un evento ocurra.
Si la Probabilidad de que un evento A, P (A) es igual a 0, no hay
ninguna probabilidad de que el evento ocurra.
Si P (A) es cercano a 0, hay poca probabilidad de que ocurra.
Si P (A) es cercano a 1, hay bastante probabilidad de que el even
to ocurra.
Si P (A) es igual a 1, el evento ocurrir eventualmente.
Distribuciones
El concepto de probabilidades es inseparable del concepto de distri-
buciones. Las distribuciones de las probabilidades describen, como lo
mencionamos, los valores que toman las probabilidades asociadas con
que un evento ocurra.
Por ahora, lo que interesa es que recuerde que al estudiar las aplicacio-
nes de las herramientas estadsticas, para hacer inferencias:
Ejercicio 1
Respuestas:
Solo se dan a manera de ejemplo. Las suyas no tienen por qu ser estas
mismas.
Ejercicio 2
Distribucin Muestral
(en ingls se conoce como Sampling Distribution)
La distribucin de la poblacin,
Variabilidad
La variabilidad de la distribucin de las muestras se mide por su varian-
za o por su desviacin estndar.
Dicha condicin muy general del enunciado tiene por objetivo dis-
minuir la probabilidad de que un sumando contribuya excesivamente
al resultado total del estadstico calculado, imprimiendo as una mar-
cadamente influencia en el resultado final, tal como pasara cuando en
una muestra pequea hay un individuo anormalmente alto, o bajo,
o pesado o flaco
Muestreo
El muestreo y la aleatorizacin son dos conceptos ntimamente ligados
con el Teorema del Lmite Central, ellos son los pilares sobre los cuales se
ha construido gran parte de la teora estadstica.
Qu es el muestreo
Reglas del juego: antes de comenzar a lanzar los dados, cada participante
debe escribir en un papel cuntas veces en promedio cree (l o ella),
tendrn que echar los dados los jugadores antes de obtener un par de
seis.
Desarrollo del juego: todos han escrito en el papel una cifra y los ms atre-
vidos han hecho jugosas apuestas.
Series de Jugador
lanzamientos A B C D
Serie # 1 25 72 32 52
Serie # 2 40 52 6 72
Serie # 3 5 3 99 1
Serie # 4 8 7 47 81
Series de Jugador
lanzamientos E F G H
Serie #1 44 50 29 27
Serie #2 11 45 38 46
Serie #3 5 10 71 65
Serie # 4 17 71 7 2
Series de Jugador
lanzamientos I J K L
Serie #1 171 4 63 9
Serie #2 1 54 22 13
Serie #3 151 9 20 10
Serie # 4 3 49 13 16
a) Por una parte, les pide tomar las tres hileras de la primera gene-
racin de promedios y obtener en cada hilera el promedio de los
promedios, es decir, una segunda generacin de promedios.
19.4+44.0+36.2+35.0 134.6
Hilera 2 = = = 33.5
4 4
81.5+29.0+29.5+12 152
Hilera 3 = = = 38
4 4
Corolario
Por dispares que parezcan los resultados y las muestras, con frecuencia
es posible hacerles correcciones y ajustes a los datos mediante proce-
dimientos estadsticos. La base de toda esta teora y sus aplicaciones
227 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Aleatorizacin
Cualquiera que sea la manera de obtener una muestra y organizar los
datos, existe en todos nosotros una tendencia muy humana a caer en
sesgos. (Ver captulo sobre los enemigos de la validez interna de los
estudios epidemiolgicos).
Ya sea porque uno no ordena los datos, porque los ordena demasiado
o porque tiende a escoger a los primeros de la lista, a los ltimos o a
los ms altos, etc., si no se toman las precauciones necesarias, terminar
aplicndole a una poblacin unas conclusiones errneas.
Talla en cm:
Promedio de todo el grupo.
Promedio de los hombres.
Promedio de las mujeres.
Promedio del grupo, excluyendo los extremos.
Ahora, haga con este grupo los mismos clculos que hizo con la lista
anterior.
Peso en kg:
Promedio de todo el grupo.
Promedio de los hombres.
Promedio de las mujeres.
Promedio del grupo, excluyendo los extremos.
Talla en cm:
Promedio de todo el grupo.
Promedio de los hombres.
231 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Edad:
Promedio de todo el grupo,
Promedio de los hombres,
Promedio de las mujeres,
Promedio del grupo, excluyendo los extremos.
Respuestas:
Resumen
Lo que hemos dicho hasta aqu en este captulo, se puede resumir de la
siguiente manera:
1. El promedio de los promedios de todas las muestras es el pro-
medio real de toda la poblacin.
2. La varianza de los promedios de todas las muestras es la varianza
real dividida por el tamao de las muestras.
3. La distribucin de los promedios de todas las muestras es normal
(gaussiana), si el tamao de la muestra es suficientemente grande.
Muestreo probabilstico
Es aquel en el cual cada uno de los elementos de la poblacin tiene una
probabilidad conocida de ser seleccionado como parte de la muestra, y
esta probabilidad no es cero (0).
233 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Muestreo probabilstico
1. Muestreo Aleatorio Simple MAS. En este tipo de muestreo, cada
uno de los elementos de la poblacin tiene la misma probabilidad
de ser escogido. Para ello se requiere que el grupo sea homogneo
en trminos de varianza. Sera el tipo de muestreo usado en proce-
sos industriales, en donde se esperara que cualquier muestra esco-
gida al azar fuera representativa, pues todos los elementos seran,
tericamente, iguales. Para la muestra un botn. En estudios
adelantados con seres humanos, para lograr este tipo de muestreo
es necesario hacer primero un listado de los elementos, asignarles
un nmero y luego escoger la muestra mediante el uso de una
tabla de nmeros aleatorios. Dichas tablas se hicieron por com-
putador, con el objetivo de que los nmeros que la componen se
hayan escogido al azar y cada uno de los dgitos, de 0 a 9, tenga una
probabilidad 0.1 de ser escogidos. Antes de profundizar en la tabla
se necesita que el investigador haya decido de antemano la forma
en que la va a usar, es decir, a partir de qu nmero y siguiendo qu
orden completar el tamao de muestra previamente calculado.
Tercer paso: Seleccionar el marco o marcos muestrales de tal manera que con-
cuerden la lista de las unidades muestreadas y la poblacin objetivo.
Quinto paso: Definir los mtodos de medicin. Cada uno conlleva sus riesgos
y tiene sus tcnicas: las entrevistas personales libres o semiestructu-
radas, los formularios de autollenado, las entrevistas telefnicas, por
correo, la observacin directa, etc.
236 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Tamao de la muestra
Este tema se tratar ms en profundidad en otro captulo. Por ahora,
baste con decir lo siguiente:
Inferencias
Para quienes comienzan, este captulo suele ser territorio minado! Es
verdad: en el aprendizaje de las inferencias hay muchas minas quie-
brapatas, la ms daina de todas es la facilidad con que parece que se
comprenden los conceptos aqu expresados, que solo es proporcional a
la facilidad con que se olvidan. Por ello le pedimos que vaya con mucho
cuidado, paso a paso, muy despacio.
Tanto para los estimativos puntuales como para los intervalos de con-
fianza es indispensable entender de qu se trata la distribucin Z y la
distribucin t, es decir, las distribuciones normales. Veremos cundo se
debe usar la una o la otra, o cundo da lo mismo usar Z o usar t.
Advertencia:
Aqu viene una GRAN MINA:
EL CONCEPTO DE DISTRIBUCIN MUESTRAL
Distribucin muestral
La Distribucin Muestral es una distribucin terica virtual que re-
sultara de todos los valores estadsticos (o estadsticos simplemente) de
la muestra, computados a partir de un nmero infinito de muestras del
mismo tamao tomadas al azar de la misma poblacin.
Distribuciones concretas
La distribucin de una poblacin determinada describe la forma,
la tendencia central y la dispersin de N (todos los valores de la
poblacin).
Estudiantes de epidemiologa
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9
Muestra 2
Estudiante 1 2 3 4 5 6 7 8 9
Estudiante 70 60 48 52 66 120 72 88 71
Muestra 1 1 70 70,70 70,60 70,48 70,52 70,66 70,120 70,72 70,88 70,71
2 60 60,70 60,60 60,48 60,52 60,66 60,120 60,72 60,88 60,71
3 48 48,70 48,60 48,48 48,52 48,66 48,120 48,72 48,88 48,71
4 52 52,70 52,60 52,48 52,52 52,66 52,120 52,72 52,88 52,71
5 66 66,70 66,60 66,48 66,52 66,66 66,120 66,72 66,88 66,71
6 120 120,70 120,60 120,48 120,52 120,66 120,120 120,72 120,88 120,71
7 72 72,70 72,60 72,48 72,52 72,66 72,120 72,72 72,88 72,71
8 88 88,70 88,60 88,48 88,52 88,66 88,120 88,72 88,88 88,71
9 71 71,70 71,60 71,48 71,52 71,66 71,120 71,72 71,88 71,71
Muestra 2
Estudiante 1 2 3 4 5 6 7 8 9
Estudiante 70 60 48 52 66 120 72 88 71
Muestra 1 1 70 70 65 59 61 68 95 71 79 71
2 60 65 60 54 56 61 90 66 74 66
3 48 59 54 48 50 57 84 60 68 60
4 52 61 56 50 52 59 86 62 70 62
5 66 68 63 57 59 66 93 69 77 69
6 120 95 90 84 86 93 120 96 104 96
7 72 71 66 60 62 69 96 72 80 72
8 88 79 74 68 70 77 104 80 88 80
9 71 71 66 60 62 69 96 72 80 71
Ahora, fjese cmo luce esta distribucin muestral en una tabla de fre-
cuencias:
246 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Promedio Frecuencia
45-50 3
50-55 3
55-60 8
60-65 13
65-70 16
70-75 10
80-85 4
90-95 8
100-105 6
105-109 4
110-115 2
115 y ms 1
18
16
14
12
10
Imagnese que usted tuviera que hacer este mismo ejercicio para una
muestra de 1 500 habitantes de la ciudad de Bogot. Desesperante!
Por ello se ha creado la estadstica de inferencias, para que de una sola
muestra podamos estimar los parmetros de la poblacin. Pero es po-
sible, como sucede con nuestros estudiantes, que esa muestra difiera
en los promedios, que encontremos en alguna oportunidad promedios
ms bajos o promedios ms altos.
El Teorema del lmite central tambin nos dice que en el caso de la dis-
tribucin de la poblacin, siempre y cuando esta sea normal:
- 68% de los datos caen entre 1 del verdadero promedio.
- 95 % de los datos caen entre 2 s.
- 99% de los datos caen entre 3 .
En cambio, en el caso de la distribucin muestral, aunque la poblacin no
sea normalmente distribuida:
- 68% de los datos caen entre /n.
- 95% de los datos caen entre 2 / n.
- 99% de los datos caen entre 3 / n.
En el ejemplo anterior, de los 9 alumnos de la maestra de la cohorte
del 96, en la Universidad del Valle, se puede decir lo siguiente:
- 68% de los pesos caen entre 71.88 21.58 = 50.3-93.46.
- 95% de los pesos caen entre 71.88 2 * 21.58 = 28.72-115.04.
- 99% de los pesos caen entre 71.88 3 * 21.58 = 7.14-136.62.
Dichos datos son tan vagos como decir que los pesos pueden ser cual-
quiera. Eso sucede porque la poblacin es tan pequea que no se le
pueden aplicar las estadsticas de la distribucin normal.
248 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Interpretacin:
IC 95% = 1.96. n
Nueva advertencia!
Otra mina que lo obliga a detener el paso:
Ya lo habamos dicho antes, pero lo repetimos: la distribucin
normal tambin se llama distribucin Z si = 0, y = 1.
Desde ya debe saber que existe una distribucin alternativa de
la distribucin Z: la distribucin t.
Es importante que entienda cundo usar Z o cundo la t.
Distribucin t:
La distribucin t es una distribucin alternativa de la distribucin Z que
se usa cuando no se conoce la desviacin estndar de la poblacin .
IC 95% = . /n
Sin embargo, aqu nos encontramos con un problema: usualmente se dice que
los intervalos de confianza que pasan por 1 no tienen valor. Los dos
valores de los intervalos de confianza pueden ser negativos -2.8 y -3.5,
o ambos pueden ser positivos +3.5, +9.3, pero no pueden pasar por el
punto 1. Este 1 es un problema de la escala logartmica porque sta no
tiene cero (0). En las escalas no logartmicas, en vez de no darle valor a
1, no se le da valor a los IC que pasan por cero.
IC 95% = Z 0.05 /2 x / n
5= 1.96 / n
1.96 x 10 2
n = = 15.4
52
Para decidir cul es el tamao de la muestra para calcular los IC del 95% de
una proporcin nica, seguimos un procedimiento similar al del promedio.
Supongamos que queremos estimar la verdadera proporcin de pesos
mayores de 60 kg dentro de un IC de 3%.
Si IC 95 % = 1.96 . / n
Nomenclaturas distintas
Para seguir leyendo sin sobresaltos, recuerde una vez ms que usamos
una nomenclatura para hablar de las medidas que describen poblacio-
nes (universos) y otra nomenclatura para las muestras.
Parmetros. Cuando hablamos de poblaciones, nos referimos a
parmetros.
Estadsticos. Cuando hablamos de muestras, hablamos de esta
dsticos.
Muestras Poblaciones
(Estadsticos) (Parmetros)
Hagamos un ejercicio:
La hiptesis nula H0
= 0
/2 /2
Decisin estadstica
Ahora debemos tomar una decisin estadstica:
0 A
Regin de aceptabilidad. Esta es Esta es una distribucin centrada
una distribucin centrada en en de A de la hiptesis alter-
de 0 de la hiptesis nula. nativa.
258 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Estas son pues nuestras dos apuestas, que las hacemos, por supuesto a
priori, una que est centrada en los valores promedios de la hiptesis
nula 0, y otra que est centrada en los valores promedio de la hiptesis
alternativa A.
El poder est representado por el rea en rosado a la derecha de la lnea que limita beta
259 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Y se calcula:
(X - 0)
t=
S/n
(p - p0)
Si se usa Z =
p -q
0 0
n
Razonamiento:
Regin Crtica
Cuando uso la tabla de
Z, la Z calculada est
ubicada en la zona de
rechazo.
= 0.05
/2 = 0.025 /2 = 0.025
-1.96 0 +1.96
Rechazo la H0 0.095 Rechazo la H0
No logro rechazar la H0
Una cola
Caso contrario sera si tomramos la muestra de una poblacin de adultos
diabticos.
es p < 0.005.
Se calcula un estadstico.
(H0 1-2 = 0)
266 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
XA es = 216 y XB es = 150
SA ~50 y SB ~ 34
Y expresamos:
T = 8.67
Al caer en -1.98 en
la regin de rechazo,
rechazamos la H0
0.025 0.025
XA es = 45y XB es = 47
SA ~12 y SB ~ 16
0.05
= = 1.98 -1.98> 0.79 No se rechaza la H0
2
269 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Aqu diramos:
Nota:
( - d )
t=
Sd
n
t = Se incluyen aqu las cifras correspondientes. Si mira con atencin
ver que si d es 0, todo se reduce a un test para una muestra. Solo que
aqu se trata de una muestra de las diferencias en vez de tratarse de una
muestra de las observaciones.
En nuestro ejemplo,
Pruebas no paramtricas
Ahora que hemos mencionado la prueba del Chi2 una prueba no
paramtrica haremos una pausa mayor antes de dar el cuarto paso.
Durante dicha pausa hablaremos someramente de las pruebas no pa-
ramtricas.
De qu trata el captulo:
De calcular el Chi2.
Pregunta inicial
Para comenzar, hagmonos una pregunta: Por qu al examinar dos
grupos, escogemos mirar las diferencias entre proporciones, en lugar
de examinar las diferencias entre sus promedios, si los promedios pro-
porcionan ms informacin?
Respuesta:
Ejemplo:
Obtenemos una tabla como la siguiente. Los nmeros son, todos, hi-
potticos.
Al mirar dicha tabla es obvio, con una sola mirada, que quienes to-
maron la mefloquina sufrieron sntomas psiquitricos colaterales con
mucha ms frecuencia que quienes tomaron el otro medicamento.
0.90 - 0.33
La diferencia relativa es = 1.72
0.33
3= 0.75
0.75
Los ODDS de que el caballo gane = --------------- = 3
(1- 0.75)
ODDS, como sucede al hablar de ODDS RATIO (OR) es una pala-
bra difcil de traducir con toda la sutileza y posibilidades que tiene el
trmino en ingls. Algunos traducen el OR, la medida que se usa para
hablar de riesgos en los estudios de CasosControles, como Razn de
Desigualdades. Estn en lo cierto al llamarla Razn o Relacin, pero no
creo que se hagan entender mejor. Como no lo harn quienes llamen al
OR Razn de Momios o cualquiera de los tantos nombres usados para
definirlo, pues siempre terminan aclarando que se trata de los OR.
100 0.9
ODDS mefloquina = = = 9
10 0.1
--------
100
20
-----------
180 0.1
ODDS doxiciclina = -------------------- = ------------ = 0.1
160 0.9
-----------
180
9
Los ODDS de complicaciones entre mefloquina y doxiciclina = ------- = 90
0.1
Comparemos las tablas con los conteos de los observados y los espe-
rados:
Conteo de los OBSERVADOS Conteo de los ESPERADOS
Tratamiento S No Total Tratamiento S No Total
Mefloquina 90 10 100 Mefloquina 39 61 100
Doxiciclina 20 160 180 Doxiciclina 70.2 109.8 180
Total 110 170 280 Total 109.2 170.8 280
Estas tablas son diferentes. Entre los casos observados hay muchos
ms pacientes con sntomas entre los que toman mefloquina que entre
los que toman doxiclina.
(O-E1)2
2 = k [ ]
E
a b
Recuerde el cuadro
de cuatro casillas
para calcular el Chi2 c d
a= b=
90.50 10.50
c= d=
20.90 160.90
(El grado de libertad se calcul del nmero de filas del cuadro r menos
1 multiplicado por el nmero de filas menos 1).
k=2
k=1
1
X2
En el caso de las cuatro casillas existen otros test, adems del Chi2,
algunos de ellos ya los vimos:
Test de Z de la diferencia de las proporciones entre dos grupos.
La prueba exacta de Fisher.
El IC para la verdadera diferencia de las proporciones entre dos
grupos.
El OR e IC.
El Estadstico de MantelHaenzel.
Todos ellos prueban las diferencias entre dos grupos para responder las
mismas preguntas:
Con relacin a la caracterstica, son los grupos homogneos o
no lo son?
Hay alguna asociacin entre grupos y caractersticas?
El grupo y las caractersticas se estudian independientes?
A no ser que vaya a profundizar en los temas epidemiolgicos y bioes-
tadsticas, esto es todo lo que necesita saber en este nivel. Esperamos
que haya perdido el susto heredado que estos trminos todava les cau-
san a algunos.
Estos son entonces los pasos que se siguen durante el anlisis de va-
rianza:
Manera de proceder:
La prueba F
ANOVA se debe ver como una prueba estadstica global que analiza
toda la capacidad de variar que tiene la variable dependiente (de resulta-
do) en su conjunto. Lo que no dice es cul de los grupos es el diferente,
mayor o menor, y con respecto a cules de los restantes grupos.
Mire de nuevo la tabla anterior y notar que si observa solo las cifras to-
tales encontrar en la mitad derecha menos muertes y lesiones severas
entre quienes usan los cascos. Pero si mirara solo la mitad izquierda de
la tabla hay menos lesiones leves entre los que no lo usan porque pro-
porcionalmente se fueron a engrosar las filas de los ms severamente
afectados.
Aqu, amigo, hemos llegado juntos al final del camino de las inferen-
cias que, aunque azaroso, hemos atravesado juntos. Usted y nosotros
sentimos que nos merecemos una pausa y una cerveza. Esto, siempre y
cuando, sus creencias y su gusto se lo permitan.
287 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Es decir: depende.
Precisin
Si lo que deseamos es obtener un IC de cierta amplitud (o de cierta
estrechez), es necesario que especifiquemos de antemano los siguientes
valores:
IC : X 1.96 =Xd
n
1.962 2
n=
d2
- Es necesario especificar d (la mitad de la anchura del IC).
- Es necesario estimar 2.
Ejemplo
1.96 2. 2 1.96 2 10 2
n = = = 42 pacientes.
d2 32
.
1.96 = d
n
1.962 .
n=
d2
1.96 2 p.q 1.96 2 (0.20) (0.80)
n= = = 384 personas
d2 (0.04) 2
Este segundo estudio me saldra muy caro y muy difcil de planear por-
que se trata de una muestra mucho ms grande.
1.96 2 (0.5) (0.5)
N= = 600
(0.04) 2
(Z /2 + Z ) 2 2
n=
2
H0
12 = 0
H0 p1p2 = 0
H p1 p2 = .
-Z alfa/2 0 +Z alfa/2
Posibilidad de cometer Error Tipo I sombreado de amarillo
Posibilidad de cometer Error Tipo II sombreado de azul
Posibilidad de cometer Error Tipo 1- sombreado de rosado
-Z /2 0 +Z /2
Posibilidad de cometer Error Tipo 1- est sombreado en amarillo
Escogencia de :
Z puede ser de un lado o de los dos lados.
Por lo general, alfa = 0.05 y Z = 1 645
Z /2 = 1.96
Beta y poder (1-). Escogencia de Beta
0 -2 +2
Escogencia de
En el caso de que los tamaos sean iguales para dos grupos con
resultados dicotmicos, el tamao de muestra se calcula as:
*
(Z /2 2 p q + Z p1q1 + p2 q2) 2
n=
2
Conclusiones:
Ejemplos:
(1.96 + 0.84*) 2 (15 2 + 152)
n = = 2 205.
42
Donde: p1= 0.03, q1=1-p1= 0.97, p2 = 0.02, q2 = 0.98, 2= (p1-p2)2= 0.0001,
y p = 0.03+0.02/2 = 0.025; q = 0.97+0.98/2 = 0.975.
(Z /2 2p q + Z p1q1 + p2 q2) 2
n=
2
n= [1.96 ( 2*0.025*0.975) + 0.98 ( 0.03*0.97 + 0.02*0.98)]2 / 0.0001
n= [1.96 (0.22) + 0.98 (0.029+0.0196)]2/ 0.0001
n= [0.43 + 0.21]2/ 0.0001
Hoy es poco probable que usted o alguien tengan que recurrir a este
tipo de clculos para un tamao de muestra. Hay demasiados progra-
mas estadsticos y varios applets disponibles en Internet.
Anlisis de Correlacin.
Anlisis de Correlacin
x (peso)
x (peso)
y (presin
arterial) Correlacin Negativa:
cuando la x disminuye y la y disminuye
x (peso)
No hay Asociacin
r=0
r = +1 r=0 r = -1
r = entre r = entre
0 y +1 0 y -1
Supongamos que hemos examinado los datos y parece existir una co-
rrelacin lineal que toma la forma de lnea recta.
H0: = 0
Al igual que lo hemos hecho hasta ahora, es posible construir in-
tervalos de confianza IC alrededor de .
b0
X1 X2
b0 = intercepto
301 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
Cuando tenemos una relacin lineal podemos tomar dos datos cual-
quiera y ver cmo se comportan con relacin a la lnea recta que ex-
presa dicha relacin; es decir que si tenemos dos observaciones de dos
pacientes distintos digamos peso (X) en las abscisas y presin arterial
(Y) en las ordenadas se trata de encontrar la lnea recta entre esos dos
puntos que represente el mejor estimativo.
X1 X2 X
Error
Un ejemplo:
Y= 118 + 0.23 X
Anlisis longitudinal
Nada es tan simple como parece
Ventajas
Modelos multinivel
No olvide que los modelos multinivel son llamados igualmente mode-
los jerrquicos lineales
Niveles
Al estudiar a los nios de quinto de primaria de varias escuelas, no lo
podemos hacer como si fueran iguales, que es lo que haran los mode-
los lineales tradicionales. Por un lado, aun dentro de una mismo saln
de una escuela dada, hay individuos diferentes en cuanto a: composi-
cin tnica y cultural, edad, proceden de diversas reas de la ciudad).
Usualmente, lo que los hace tiles es ver cmo se ajustan los modelos
multinivel con el cambio de datos. Y cmo se interpretan los resulta-
dos.
305 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
ALUMNO
PERSONAS
MEDICIONES
m1 m2 m3 m1 m2 m1 m2 m3 m4
3 niveles
AREA A1 A2 A1
HOSPITAL H1 H2 H3 H4 H5 H6
Nivel Hospital H1 H2 H3 H3
Nivel de Area A1 A2 A1
Cada uno de estos modelos con distintos niveles tiene un manejo ma-
temtico diferente segn sean anidados o no anidados.
Metodologa multinivel
La metodologa multinivel es una metodologa alternativa para acer-
carse al contexto de un individuo en la bsqueda de explicaciones de
causalidad.
Races
Metodolgicas
- La varianza es constante.
Las alternativas son los modelos multinivel con los cuales se trabajan
simultneamente tres o ms niveles de anlisis. Los creadores del mo-
delo proponen una estructura de anlisis dentro de la cual se pueden
reconocer los distintos niveles en los cuales se articulan los datos, pues
cada subnivel se representa mediante su correspondiente modelo.
1 0 .0 0
8 .0 0
6 .0 0
56 62 68 71
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
75 82 85 109
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
113 137
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
0 .0 0 4 .0 0 8 .0 0 1 2 .0 0 0 .0 0 4 .0 0 8 .0 0 1 2 .0 0
edad_c5 edad_c5
y = b0 +b1X
Y2
y
y b1 (pendiente) =
Y1 x
x
b0
X1 X2
b0 = intercepto
Con ello, los modelos del primer nivel estn relacionados por un
modelo de segundo nivel en el cual los Coeficientes de Regresin
del nivel 1 se regresan a un segundo nivel de variables explicativas,
y as sucesivamente para los diferentes niveles.
1. Concepto de correlacin nter clase. Nos sirve para hacer una es-
timacin de lo que comparten los individuos que pertenecen a un
mismo saln de clase o servicio de un hospital.
Por una parte fija que es comn para todos los contextos.
Otra parte especfica para cada contexto que vara, y que se estima
mediante la varianza en los distintos niveles.
Determinantes Determinantes
conductuales ambientales
Hbitos Clima
Costumbres Aire
Creencias Agua
Actitudes Nivel de deforestacin
Comportamientos Contaminacin
Excretas
SALUD
Determinantes Determinantes
biolgicos sociales
Genes Relaciones familiares
Edad y sociales. Exclusin
Raza Situacin financiera
Sexo Trabajo y satisfaccin
Nutricin Libertad. Dignidad
Inmunidad
Anlisis de sobrevida
Mtodo actuarial.
Mtodo de Kaplan Meier.
80
% de supervivencia
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Periodos desde cuando se enrolan en la cohorte
80
% de supervivencia
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Periodos desde cuando se enrolan en la cohorte
riables estimativas. Con ello nos permite estimar el riesgo (el mo-
delo tambin se llama modelo de riesgos proporcionales) de
muerte o de otros eventos de inters de los individuos, dadas sus
diferentes variables pronsticos.
19. Eplogo
Apreciado lector:
Juntos hemos aguantado el punto del dolor tan conocido por los ma-
ratonistas antes de sobrepasar el mojn del km 21. Dicho punto separa
a quienes posiblemente van a terminar de quienes se quedarn en el
camino a la espera de una nueva oportunidad. Como premio por haber
superado la parte difcil del camino, algo que francamente no habamos
logrado antes, sabemos que llegaremos al objetivo impuesto al comien-
zo de la carrera. En el fondo vemos el estadio y adivinamos la meta y
los vtores. No importa que por ahora sean vanas ilusiones. Sabemos
que en el futuro vendrn desafos nuevos y ms difciles.