Epidemiologia para No Epidemiologos

1 EPIDEMIOLOGA PARA NO EPIDEMILOGOS
EPIDEMIOLOGA
PARA NO
EPIDEMILOGOS
Herramientas bsicas de epidemiologa
y bioestadstica para clnicos
y otros profesionales.
Jairo Osorno, Beatriz Eugenia Alvarado-Llano y Gabriel Osorno

Con la colaboracin de Carlos Eduardo Vasco, Luis Fajardo y Fernando Arteaga.
EPIDEMIOLOGA
PARA NO
EPIDEMILOGOS
Herramientas bsicas de epidemiologa
y bioestadstica para clnicos
y otros profesionales.
Jairo Osorno, Beatriz Eugenia Alvarado-Llano y Gabriel Osorno

Con la colaboracin de Carlos Eduardo Vasco, Luis Fajardo y Fernando Arteaga.
ISBN 958-95308-7-7
Impresin: Da Vinci Editores
Printed in Colombia
Este libro se lo dedicamos con todo cario a Alberto

Alzate Snchez, amigo y maestro de tantas cohortes de
epidemilogos.
Los autores.
Indice
1. Prefacio. Justificacion del libro.
2. Introduccin.
3. Lenguaje Estadistico Bsico.
4. Cuadro de cuatro casillas generalidades.
5. Campana de Gauss.
6. Uso del cuadro de cuatro casillas evaluacin de pruebas
Curvas ROC.
7. Uso del cuadro de cuatro casillas en clculo de riesgos.
8. Uso del cuadro de cuatro casillas en toma de decisiones.
9. Puntaje Z Curvas de crecimiento-Osorno-lfp.
10. Medidas usadas en epidemiologa.
11. Tipos de epidemias.
12. Estudios Epidemiolgicos BEA.
13. Azarconfusion y sesgos Enemigos de la validez de los
estudios.
14. El valor de p y los Intervalos de Confianza.
15. Probabilidades.
16. Inferencias.
17. Tamao de muestra. Poder.
18. Regresin lineal simple y anlisis lineal.

1. Prefacio. Justificacion del libro.
2. Introduccin.
3. Lenguaje Estadistico Bsico.
4. Cuadro de cuatro casillas generalidades.
5. Campana de Gauss.
6. Uso del cuadro de cuatro casillas evaluacin de pruebas
Curvas ROC.
7. Uso del cuadro de cuatro casillas en clculo de riesgos.
8. Uso del cuadro de cuatro casillas en toma de decisiones.
9. Puntaje Z Curvas de crecimiento-Osorno-lfp.
10. Medidas usadas en epidemiologa.
11. Tipos de epidemias.
12. Estudios Epidemiolgicos BEA.
13. Azarconfusion y sesgos Enemigos de la validez de los
estudios.
14. El valor de p y los Intervalos de Confianza.
15. Probabilidades.
16. Inferencias.
17. Tamao de muestra. Poder.
18. Regresin lineal simple y anlisis lineal.

Presentacin
A menudo la verdad es tan sencilla y elemental que parece increble

Giovanni Guareschi
Hemos odo en varias ocasiones a Jairo Osorno afirmar que una

cosa es ver la msica escrita y otra orla al ser interpretada. Nos
preguntamos entonces: Cmo sera conocerla escrita, orla y eje-
cutarla simultneamente? Aceptando antes que existen unidades
de texto e interpretacin que nos abriran un panorama y un hori-
zonte inconmensurables.
Si ello pasa con la msica, lo mismo sucedera con el conocimiento

cientfico a travs de su anlisis ordenado, congruente y serio, que
aborda con realismo y razonamiento las grandsimas contradic-
ciones, algunas carentes de cualquier lgica y que solemos hacer
quienes nos dedicamos a la aplicacin de la ciencia, respondiendo
con frecuencia tan slo al afn del pblico o a expectativas que se
satisfacen con respuestas o conclusiones ficticias.
As pues, el texto Epidemiologa para no epidemilogos nos intro-

duce a un mundo ilustrado de una dimensin inmensa, pues nos
permite comprender con la lectura temas que se haban circuns-
crito a un nmero exclusivo de expertos, quienes con su visin
estricta y frecuentemente fija, no haban posibilitado que el gran
conjunto de profesionales de la salud, y aun de otras reas del co-
nocimiento, tuviramos perspectivas nuevas y cientficas sobre la
vida, la tecnologa y su uso, la estadstica aplicada, el conocimiento
de la enfermedad y sus causas y, en sntesis, del hombre con su
entorno.
Adems, los autores de este libro resolvieron, no slo como profe-

sores sino como humanistas, indicarnos un camino que impide la
generosidad y el subjetivismo para llevarnos al estudio de lo parti-
cular, de los elementos iniciales, aplicando un anlisis adecuado y
serio que logra la percepcin de un nuevo cientfico, en ocasiones
trgico pero realista; prctico y aplicable, demostrable y en ocasio-
nes totalmente ajeno a lo que esperamos o aspiramos de nuestra
vida y nuestras costumbres.
La conclusin, al ser aplicados con rigurosidad los conceptos y

mtodos de la epidemiologa en la medicina, tambin nos mues-
tra cmo la ciencia, en general, es un observatorio de la eterna

oscilacin del pndulo entre la enfermedad y el enfermo; entre la
sociedad y los factores patognicos, entre el medio ambiente y el
hombre y, en fin, cundo las decisiones y cdigos se convierten en
reglas y estas son reformadas, a su vez, por otros hallazgos.
Un viaje hacia la comprensin de la epidemiologa es lo que esta

publicacin nos dar, al tiempo que generar un abanico de mo-
tivaciones y usos que nos facilitarn el dilogo cientfico, serio y
coherente. Sus lectores tendrn con su referencia un apasionante
periplo hacia la comprensin y razonamiento cientfico. Pero a
su vez, la delicadeza de su presentacin, la seriedad de su conte-
nido, los anlisis y ejemplos prcticos con que se nos ilustra, nos
demostrarn la idoneidad y la razn de quienes son sus autores, al
pensar para quin se escribe, para quin est dirigido, sin olvidar la
severidad de la materia tratada, que incluye un concepto artstico y
caricaturesco perfectamente maravilloso.
Les deseamos pues, un viaje extraordinario y un aprendizaje fun-

damental con esta publicacin, sin dudar que su lectura y consulta
siempre sern gua de compaa en la bsqueda de la verdad y no
de la quimera.
Jenaro Murgueitio Restrepo Tito Arcadio Perilla Cepeda

Agradecimientos
A la CIUDADELA DE LA SALUD S. A., en especial a Jena-

ro Murgueitio y Tito Perilla, como reconocimiento al esfuer-
zo titnico emprendido para ofrecerles medicina de la mejor
calidad a los colombianos.
AMAREY NOVA MEDICAL S. A., en particular a su presi-

dente, Octavio Amaya; a su gerente, Rafael Eduardo Arango,
y a su director mdico, Guillermo Ortiz, quienes con tanta
generosidad financiaron esta publicacin.
A los profesores y alumnos de pregrado y posgrado de la Fa-

cultad de Salud de la Universidad del Valle, cohortes de 1994
en adelante.
A los profesores y alumnos de la maestra de Salud Pbli-

ca del Instituto Karolinska de Estocolmo, en especial a Lars
Gunnar Hrte e Isabelle Ljungkvist, sin cuyas sugerencias,
algunos de los captulos no hubieran logrado tener la claridad
requerida.
A nuestras familias, sin cuya devocin y afecto, no hubira-

mos tenido las fuerzas necesarias para esta tarea.
1. Prefacio. Justificacin del Libro.

Contexto social, poltico y mdico
Cuando comenzamos a discutir la conveniencia de publicar un nuevo

texto de epidemiologa, nos hicimos varias preguntas:
Por qu publicar un libro ms de epidemiologa y por qu uno

para no epidemilogos?
Por qu habran de interesarse ahora en la epidemiologa otros

profesionales, cuando antes no lo han hecho?
Qu hay de til en la epidemiologa para el ejercicio concreto

de sus especialidades y no solamente como disciplina acadmi-
ca?
Por qu insistir en la bsqueda de un libro que, sin sacrificar

rigor, sea comunicante y no le produzca rechazo a quien lo lee,
en especial cuando muchos otros autores han fracasado en el
intento?
Qu nos autoriza a algunos de nosotros, legos en la materia, a

escribir sobre el tema?
La mayora de los profesionales de la salud se han visto obligados

a ponerse en contacto con la epidemiologa por razones curricula-
res, pero muchos la encuentran aburrida y descontextualizada. Por
otra parte, a quienes por dominar lo numrico y lo estadstico les
ha correspondido ensear bioestadstica y epidemiologa a los pro-
fesionales de la salud, no siempre parece interesarles la clnica ni la
enfermedad, ni la salud. Adems, la epidemiologa y la bioestadstica
se ensean en las escuelas de medicina y de ciencias de la salud en los
primeros aos, cuando no se les ve la aplicacin real; en los cursos de
materias clnicas no se usan, si acaso se vuelve a ellas es para lucirse
en congresos mdicos y actividades acadmicas. A los profesionales
de las ciencias sociales no suelen ensearles epidemiologa.
En resumen, parece existir un hiato en la comunicacin.
En las ltimas dcadas, la epidemiologa y la salud pblica parecen

haber adquirido nueva carta de ciudadana entre los profesionales de
la salud y de otras disciplinas, y como resultado muchos ingresan a los
posgrados de epidemiologa, salud pblica o simplemente cualquier
rama administrativa de la salud. Algunos lo hacen por verdadera voca-

cin, otros esencialmente por razones de poder o como reaccin ante
la falta de empleo en mercados saturados y con frecuencia diseados
para beneficio de los sistemas de salud promovidos por la globalizacin
y las fuerzas del mercado.
Incluso, para muchos de ellos, la epidemiologa sigue siendo vista como

libresca y lejana del mundo real.
La epidemiologa es difcil, aluden algunos, porque es matemtica. Tal

vez sin reflexionar que muchos de los conceptos y razonamientos epi-
demiolgicos, an desprovistos de frmulas matemticas, son especial-
mente complicados de abordar y muy exigentes en lo intelectual. Es
decir, la epidemiologa es difcil, obliga a pensar en orden, a filosofar.
Si se toma en serio, la epidemiologa los llegar a cuestionar sobre su
manera de ejercer la profesin.
Se han intentado muchas alternativas para hacer digerible la epidemio-

loga, todas ellas bien intencionadas. Sin embargo, algunas ignoran el
hecho de que con un acercamiento light no es posible transmitir lo que
es inherentemente exigente. Por ello, pueden terminar siendo irrelevan-
tes tantos libros introductorios, tantas epidemiologas sin esfuerzos,
epidemiologas para ser aprendidas mientras se duerme, o epide-
miologas para dummies, todas condenadas a tener menos impacto del
esperado y a dejar el sinsabor de un inicio sin futuro y mucha frustra-
cin; algo similar a lo que pasa con tantos cursos de idiomas, no im-
porta cuntos se comiencen, hay un punto ms all del cual no se logra
avanzar. En este aspecto consideramos necesario pedirle a usted, lector,
que no se deje desorientar por la aparente contradiccin entre lo que
acabamos de expresar y la caricatura de la portada: Este no es un libro
Light ni usted es un Dummy.
En qu consiste este esfuerzo

La escritura de este libro es producto de un proceso en el cual han
primado unas ganas enormes de comunicar estas materias fascinantes
relacionadas con todos los campos de la salud y la enfermedad, y el uso
de las herramientas ms bsicas sin las cuales no es posible compren-
derlas. Se trata de la bsqueda de un libro til y riguroso pero a la vez
placentero de leer, como tambin de un libro que refleje cunto entendemos los
autores que para la mayora de profesionales prcticos hay un lmite ms all del
cual la epidemiologa y la bioestadstica dejan de tener inters y utilidad prctica.
No estamos detrs del libro mgico. Este no existe. Como no existen

libros totalmente malos. En nuestra opinin, el aprendizaje resulta tam-
bin de consultar mltiples fuentes, aun los libros equivocados, para
descubrir a travs de muchas miradas la iluminacin deseada.
Qu pasa si quienes trabajan en el campo de la salud no

aprenden epidemiologa
Sin elementos bsicos de epidemiologa y bioestadstica es difcil
entender la literatura mdica y comprender lo que dicen discipli-
nas diferentes.
Sin epidemiologa no es posible hacer buena salud pblica ni ad-

ministrar de manera correcta los servicios de salud, ni priorizar
con justicia, como estaramos obligados a hacerlo.
Hace algunos aos haba una chiste conocido entre los profesionales
de la medicina: Cmo se llama un mdico que no sabe de neurologa
ni de vas y lemniscos, ncleos, neuronas y clulas gliales?: Un tegua.
De igual forma, un mdico sin epidemiologa sera un tcnico sin los

elementos necesarios para tomar decisiones complejas y as acompa-
ar mejor a sus pacientes. Se tratara ms bien de un mdico sin huma-
nismo, un brujo descontextualizado, un obrero de segunda.
Podra un cirujano operar sin saber epidemiologa? Por supuesto. Po-

dra ignorarla de la misma manera que un piloto de avin podra no
saber nada de los mecanismos ni de la fsica que hacen posible volar.
Pero en situaciones difciles en las cuales la decisin de operar o no
hacerlo significan todo para el paciente, o cundo volar el avin o no
hacerlo, o aterrizar en medio de una tormenta o aplazar el aterrizaje,
o evitar un huracn y devolverse a la base implica garantizar la vida de
muchas personas, se requieren criterios, razonamientos y considera-
ciones estadsticas complejas que van ms all de la intuicin y no se
pueden improvisar. Y por encima de ellas son necesarios sistemas de
comunicacin que mantengan a las partes informadas a travs de un
lenguaje claro para todos.
El libro exige
Hemos tratado de ser comunicantes y de que usted disfrute el libro.
Pero debemos advertir que algunos captulos exigirn toda su concen-
tracin y leerlos una y otra vez con todos los sentidos puestos. Por
momentos el esfuerzo doler. Hubiramos querido evitarlo y no pare-
cer pesados pero no siempre fue posible hacerlo sin correr el riesgo de
perderlo todo. El aprendizaje de la epidemiologa, como en todas las
ciencias y artes, exige trabajo consciente y persistente. Cualquier atajo es
prdida de tiempo.
Qu es nuevo en esta versin

Hace casi 10 aos, junto con Guillermo Llanos, publicamos un primer
libro. Este nuevo intento tambin podra haberse llamado como aquel
Epidemiologa para Clnicos, segunda versin. Pero a medida que
avanzbamos en su redaccin nos dimos cuenta de que se trataba de
una obra cada vez ms diferente. Sin duda, los tiempos y las motiva-
ciones han cambiado. Hoy tenemos conciencia de la gran complejidad
de la tarea en que nos habamos metido con algo ms de inocencia y

ligereza la primera vez. Y de las responsabilidades que esto implica,
algo de lo cual no fuimos tan concientes entonces. La tarea ha sido, al
igual que la primera vez, una mezcla de placer y de tortura. Solo que
en esta ocasin nos cost ms trabajo y tiempo. Como resultado, este
libro es menos fresco; si se quiere, menos espontneo; pero esperamos
tambin, ms riguroso y ms til.
Forma como se construy el libro. El proceso

Una epidemiloga de la nueva generacin, Beatriz Eugenia Al-
varadoLlano, es ahora una de las coautoras. Ella, junto con dos
mdicos que no son epidemilogos ni van a serlo, el escribano
(JO) y el artista (GO), los dos ms bien ignorantes en la materia,
pero apasionados ambos por el ideal de una medicina integrada y
humana, han escrito y pensado los primeros borradores y han so-
ado con una diagramacin y un arte de primera. Nuestra experta
(BEALL) se ha encargado de garantizar rigor en un dilogo muy
fluido. Estos son los autores principales.
Al igual que la primera vez, muchas personas han ledo los borra-
dores, los han criticado y han ayudado a modificar el texto sustan-
cialmente con la franqueza propia de los amigos de verdad. Den-
tro de ellos, los ms destacados son Carlos Eduardo Vasco, Luis
Fajardo y Fernando Arteaga. Por ello van como colaboradores.
Importancia de lo visual
Creemos que las grficas bien hechas y bien interpretadas, as como los
dibujos oportunamente usados, tienen un valor inmenso para comu-
nicar ideas y resultados. Ese lenguaje todava permanece inexplorado
porque a algunos no les parece suficientemente intelectual. Lo resienten
los acartonados, lo cual no debera preocuparnos. Estamos conscientes
de que hay que afinarlo, saberlo usar. Puede convertirse en una excusa
para la superficialidad. Todava nos da miedo.
Algunas premisas para leer el libro

El libro, de alguna manera, pide meterse un poco en la discusin ya
vieja de qu se considera ciencia y cmo se adquiere. Dejemos algunos
puntos claros:
Pensamos que la discusin entre lo cualitativo y lo cuantitativo es est-

ril. Al igual la disputa sobre si para hacer buena salud pblica y buena
promocin de la salud hay que saber de enfermedades y de biologa.
Algunos profesionales de las ciencias sociales quisieran que la epide-
miologa no fuera una rama mdica, otros quisieran que no fuera tan
matemtica. En realidad, todas las disciplinas, no solo las nuestras, estn
relacionadas y se complementan. Y en la epidemiologa se juntan como
en ninguna otra. Los profesionales de las ciencias sociales ms avanza-
dos saben que muchas de las herramientas usadas en la epidemiologa y
en la bioestadstica tuvieron y siguen teniendo su origen en las ciencias

sociales. Nos referimos a herramientas matemticas y estadsticas y no
a los mtodos cualitativos de investigacin. Sin bioestadstica no es po-
sible entender la epidemiologa, por eso ocupa un lugar tan prominen-
te. Sin contexto histrico no es posible entender ninguna ciencia.
No discutiremos en este libro los mtodos cualitativos. No lo hacemos

por estar conscientes de cunto ms conocen otros de estos temas, y
de cunto requieren los mtodos cualitativos de un espacio formal para
ser entendidos y enseados adecuadamente. Hemos visto cunto valor
tienen y cunto se complementan con los mtodos numricos y hu-
biramos querido incluirlos, pero esta no es una obra enciclopdica ni
pretende cubrir siquiera todos los puntos de un programa curricular.
Por razones similares no discutimos los principios de la Epidemiologa

Clnica ni de la Medicina Basada en la Evidencia, por supuesto ntima-
mente relacionadas, pero a su vez se trata de ramas con metodologas y
razonamientos propios a pesar de los espacios compartidos. Aspiramos
a que el libro tenga aplicacin prctica y no que sea solo un modo de
especulacin terica.
Usaremos la caricatura para evitar la burla, es decir, para tomarnos en

serio.
Hoy las separaciones
La falta de referencias en la mayora de captulos refleja hasta cierto funcionales -y hasta
punto la historia del libro y la forma como fue escrito: Mucha comu-
nicacin entre los autores y uso frecuente de la memoria para evocar cierto punto, artificia-
momentos compartidos en las aulas universitarias o simplemente en les- que dividieron las
conversaciones informales, a veces acaloradas, sobre un buen jugo de ciencias y crearon las
lulo o una tasa de caf, con pandebonos o sin ellos.
profesiones ya no se
sostienen. Los lmites
A quines est dirigido este libro y cul es su nivel? de hace unos aos son
cada vez ms borro-
Este no es un libro para expertos ni pretende convertirse en un
texto destinado a cubrir el currculo de cursos de introduccin a la sos.
epidemiologa. La realidad, el sentido prctico y nuestra ignorancia
nos han impuesto lmites.
Al escribirlo hemos pensado en todos los profesionales de la sa-

lud: Enfermeras profesionales, nutricionistas y mdicos a quienes,
como a algunos de nosotros, les ha costado trabajo entender y en-
contrarle el gusto a la epidemiologa y a las matemticas que llevan
implcitas.
Pero tambin hemos pensado en los profesionales de las ciencias

sociales y administrativas que tienen qu ver con los servicios de
salud o los departamentos universitarios encargados de estos te-
mas. Pensamos en antroplogos, socilogos, trabajadores sociales,
tan importantes en los servicios de salud actuales.
Hoy las separaciones funcionales y hasta cierto punto artificiales que

dividieron las ciencias y crearon las profesiones, ya no se sostienen. Los
lmites de hace unos aos son cada vez ms borrosos.
Antes los lmites eran claros, bien artificiales o bien arbitrarios, pero
claros. Esto se deba en parte a nuestra ignorancia, pero tambin suce-
da por apropiacin de territorios y acciones que daban y siguen dando
poder. Hoy no hay territorios vedados para nadie. Pero ello exige que
los profesionales entiendan que deben ganarse su rol de liderazgo, que
sus opiniones deben contar pero solo si se diferencian de las opiniones
que surgen como resultado de la vulgarizacin prevalente, que no igua-
la, pero s puede hacer mucho dao.
Aunque se presume que los lectores estn familiarizados con el len-

guaje de la bioestadstica y la epidemiologa bsicas, asumimos tambin
que ese conocimiento es superficial, incompleto y a veces francamente
desorientador. Se ha odo taer la campana en alguna parte, pero no se
sabe para qu, si para una misa solemne o para un entierro.
Este no es un libro erudito ni agota el tema cubrindolo, pero s es un

texto sobre el cual se ha reflexionado mucho. Adems, aspira a ser un
texto cambiante y a tenerlo a usted como crtico y colaborador. Por
ello, lo invitamos a que desde ya nos enve sus opiniones con la seguri-
dad de que sern tenidas en cuenta.
Jairo Osorno,
josorno@etb.net.co
...hay un lmite ms all del cual la epidemiologa y la bioestadstica dejan de tener inters y utilidad prctica.
2. Introduccin
Evolucin de la Epidemiologa: la epidemiologa fue en sus inicios

una disciplina mdica. Cuando comenz a ser aceptada como ciencia, la
concepcin de enfermedad era aun ms limitada que la actual. La epide-
miologa no es hoy nica ni esencialmente mdica, aunque no pueda olvidarse
de sus orgenes. Quizs ha sido as desde el comienzo. Gran parte de la
metodologa usada en la epidemiologa, sobre todo en lo relacionado
con muestreo y medicin, desarrollo de cuestionarios, diseo, mtodo
de comparacin entre grupos y las mismas matemticas, fue tomada
en prstamo de las ciencias sociales - dcadas de los aos treinta y
los cuarenta del siglo anterior -. Fenmenos como el suicidio fueron
del inters de los primeros socilogos, como Durkheim, quien no slo
describi e interpret de manera literal los fenmenos observados, sino
que us repetidamente grficas, tablas y calcul tasas. Esto contina:
Los modelos jerrquicos lineales, muy usados en la actualidad,

fueron descritos en 1986 por los matemticos ingleses Aitkin y
Longford antes de ser desarrollados en un principio por los sis-
temas educativos de todo el mundo y luego usados para estudiar
muchos aspectos de la salud en los cuales importan las condicio-
nes sociales de las personas, como los efectos del barrio y otras
comunidades sobre la salud de la poblacin, o para observar las
trayectorias de salud en el tiempo, en general.
La definicin de causa y los criterios de causalidad tienen como

base filosfica a pensadores como Hume, Russell y Popper, nin-
guno de los cuales podramos llamar epidemilogos.
Las tablas de sobrevida, que se ven tanto en los ensayos clnicos,

no son solo ni primordialmente dominio de los epidemilogos,
sino de los demgrafos y los aseguradores. Y comenzaron a evo-
lucionar como concepto desde el siglo XVII con las tablas de so-
brevida de John Graunt.
En el captulo del anlisis de los datos longitudinales hablaremos algo

ms de los modelos jerrquicos lineales (tambin llamados modelos
multinivel) y de las grficas de sobrevida.
Algunas caractersticas de la epidemiologa

La epidemiologa cuantifica esto ha sido y sigue siendo un as-
pecto central y nos sirve para definir y limitar objetivos; en esta
tarea est estrechamente ligada a la bioestadstica.
Tiene que ver con la obtencin y el ordenamiento de los datos,

con la identificacin de patrones y su anlisis, de manera que ayu-
den en la toma de decisiones (tendencias, perfiles).
Mediante los sistemas de vigilancia epidemiolgica, la epidemiologa

ayuda a detectar fenmenos de inters lo ms tempranamente po-
sible, de manera continua y sistemtica.
La epidemiologa postula mecanismos causales de los fenmenos de

salud, no tanto de individuos, sino de la poblacin.
La epidemiologa considera que la enfermedad no se distribuye

al azar y que algunos grupos de poblacin son ms afectados por
algunas condiciones que otros.
La epidemiologa cambia permanentemente. Al hacerlo busca maneras

eficientes de estudiar y analizar los fenmenos. Por ello incorpora
en su camino diversos diseos y programas estadsticos y de cm-
puto.
Pero tambin incorpora nuevos conceptos sociales y se transfor-

ma al desarrollar, por ejemplo, la Epidemiologa de la Desigualdad y de
la exclusin; o al analizar cmo mediante la utilizacin de las defi-
niciones convencionalmente aceptadas de razas y grupos sociales
se crea una especie de caja negra llena de secretos que solo se
podrn percibir en su verdadera dimensin cuando dicha caja se
abra.
La epidemiologa procura tener aplicacin prctica (prevencin) y no

ser slo un modo de especulacin terica.
La epidemiologa
Implica un arte y ciencia matemticos. Sin matemticas no hay epide-
miologa. Cuantificar es pasar impresiones cualitativas al lenguaje
numrico para objetivar nuestros hallazgos bajo la presuncin de
que los nmeros son un lenguaje comn que no depende tanto de
variaciones culturales, regionales o personales.
Aunque esencialmente con un matiz matemtico y de bioestads-

tica fuertes, y con componentes mdicos y biolgicos que no se
pueden evitar, la epidemiologa no es exclusivamente ni matem-
tica, ni mdica, ni biolgica. Es una ciencia interdisciplinaria, lo
cual no quiere decir inespecfica o eclctica.
Sobre todo, la epidemiologa es una manera de pensar con espritu crti-

co para sacar a la medicina y a la salud pblica de lo meramente
intuitivo, darles un lenguaje comn y las herramientas adecuadas

para evaluar los datos y los hechos. En el caso particular de los
profesionales de la salud y de las ciencias sociales, la epidemiologa
enfatiza la necesidad de mirar relaciones y poblaciones y no sola-
mente entidades o individuos.
Aunque nos negamos a participar en la estril discusin que vuelve

mutuamente excluyentes lo cualitativo y lo cuantitativo, en este libro
insistimos ms en los mtodos cuantitativos que en los cualitativos.
Creemos que la resistencia a entender an los razonamientos matem-
ticos ms elementales, les ha impedido a muchos beneficiarse de esta
maravillosa disciplina. Y pensamos que esto debe ser corregido.
Usos de la epidemiologa
Cuando usted le pregunta a alguien qu es un martillo, seguramente
le responda que es una herramienta que sirve, entre otras, para clavar
clavos y puntillas. De la misma manera, para definir la epidemiologa
es necesario saber cules son sus usos. De otra forma sera imposible
definirla. En 1955 Jerry Morris escribi un libro clave para entender el
uso de la epidemiologa1. A pesar del tiempo transcurrido, sus ideas
siguen siendo muy tiles hoy. Nancy Krieger, una epidemiloga, deca:
Los siete usos que propone Morris de la epidemiologa ofrecen una
forma muy lcida de pensamiento que se traduce en poderosas formas
de hacernos preguntas. Veamos cules son estos siete usos:
1) Estudio histrico de la salud de las poblaciones y de los cambios de

salud relacionados con los cambios del medio ambiente y las formas
de vida. La epidemiologa es una ciencia histrica y busca aprender de
la historia para cambiar el futuro. Esto no es slo una conclusin de la
epidemiologa, como usted ya lo sabr. Muchas de las repuestas que
podemos darle a un fenmeno se pueden encontrar en las diferencias
de la frecuencia de la enfermedad en el tiempo. La epidemiologa se
pregunta, por ejemplo, cules son los factores asociados con la dismi-
nucin de la enfermedad cardiovascular en los pases desarrollados.
2) Diagnstico de la salud de la comunidad. La epidemiologa identifica

la presencia, naturaleza y la distribucin de la salud de la poblacin, las
dimensiones de la enfermedad en trminos de incidencia, la prevalencia
y la mortalidad. La epidemiologa toma en cuenta que la salud cambia cuando
las sociedades cambian. Las preguntas que surgiran de su uso podran ser
las siguientes: Cul es la prevalencia de retardo de crecimiento (baja
talla) en Colombia? Es sta igual en todas las regiones del pas? Dicha
prevalencia se distribuye de manera similar en las madres escolarizadas
que en las no escolarizadas?
3) Estudio de los servicios de salud. Segn Morris, la epidemiologa es

indispensable para determinar las necesidades y recursos de los servi-
cios de salud y para identificar qu tan bien funcionan y responden a las
necesidades de las poblaciones. Con ello, la epidemiologa busca apren-
der de y comparar diferentes tipos de servicios, los cuales se traduci-
rn en cambios o en nuevas intervenciones. La epidemiologa actual

tambin estudia el efecto que tienen sobre la salud de las poblaciones
otras intervenciones no necesariamente relacionadas con los servicios
de salud. Se logran impactos significativos en la salud de la poblacin
con el acceso universal a los servicios de salud? Qu impacto tienen en
la mortalidad infantil la provisin de agua potable, la disminucin de la
desnutricin infantil y la disminucin del uso de lea para cocinar?2
4) Estimacin del riesgo de enfermar de los individuos. Uno de los

usos de la epidemiologa es precisamente identificar a los individuos
ms vulnerables. En general, los estudios epidemiolgicos slo pueden
calcular el riesgo promedio de enfermar a causa del fenmeno estudia-
do, y se calculan los riesgos de un conjunto de individuos con ciertas caractersticas y
no de individuos aislados. Despus de lo cual, estos riesgos se aplican a ni-
vel individual; esto es lo que se hace en clnica. El concepto de riesgo de
enfermedad coronaria que usted conoce (si no es as, lo invitamos a que
lo conozca) viene de la cohorte de Framingham. Esta es una muestra
de 5 209 individuos norteamericanos de raza blanca que viven en Fra-
mingham, una ciudad de clase media de los Estados Unidos. El riesgo
promedio que tiene un individuo de sufrir de enfermedad coronaria en
los siguientes 5 o 10 aos, y los tratamientos de eleccin, se determinan
de acuerdo con su edad, su nivel de colesterol, presin arterial sistlica,
niveles de HDL y si el individuo es fumador o no3.
5) Sirve para completar el cuadro clnico de una enfermedad. La epide-

miologa relaciona los casos clnicos con los subclnicos, observa cam-
bios en el espectro de la enfermedad. Por ello se dice que la epidemio-
loga aclara la historia natural de la enfermedad. Desde la descripcin
temprana de la pelagra hasta la historia natural del Virus de Inmunode-
ficiencia Humana (VIH) y el SARS.
6) Sirve para identificar sndromes. Este es otro de los usos clnicos

de la epidemiologa. Las enfermedades no son las mismas, las causas
no son las mismas y su comportamiento no es el mismo entre diferen-
tes poblaciones. Por qu los blancos estadounidenses sufren ms de
enfermedad coronaria, mientras que los afrodescendientes del mismo
pas sufren ms de enfermedad cerebrovascular? Se trata de dos me-
canismos biolgicos diferentes?, Son dos enfermedades diferentes?,
Son los factores de riesgo diferentes?
7) Bsqueda de causas. Ya comentbamos que la epidemiologa busca

mecanismos causales y busca identificar causas. Segn Morris, esto se
logra mediante la comparacin de grupos de alto y bajo riesgo, de las
diferencias en formas de vida y salud de las poblaciones, y de la eva-
luacin de las prcticas de salud en varias poblaciones. Para identifi-
car las causas de una enfermedad debemos identificar los factores ms
all del individuo: el contexto, las formas de vida y las condiciones de
vida. Por qu el colesterol no es un factor de riesgo para enfermedad
cardiovascular en los japoneses o en los chinos, pero s en el resto del
mundo? O Por qu en Rusia la esperanza de vida de los hombres
es 12 aos menor que en las mujeres, mientras que en Colombia esa
diferencia es de 5 aos? Le bastara para responder a estas preguntas
saber que la enfermedad cardiovascular est asociada con la presencia
de ateromas?
Ejercicio 1: trate de citar cinco ejemplos de circunstancias o preguntas

que usted podra resolver con la ayuda de la epidemiologa.
Respuesta: Mire la lista de posibles ejemplos. No tiene que coincidir

con la suya. Solamente se trata de darle unas ideas.
1. Ha disminuido la mortalidad materna en su pas en los ltimos

20 aos? A qu se le puede atribuir ese cambio? Se presenta ese
cambio igualmente en todas las regiones, en todas las mujeres, in-
dependiente de su raza, etnia o clase social?
2. Ocurren en Cali ms muertes por arma de fuego o por accidentes

de trnsito?
3. En dnde ocurren ms casos de desercin escolar, en Buenos

Aires, en Medelln o en Baltimore? Cul es la explicacin? Qu
factores estn asociados en cada lugar con las deserciones escola-
res?
4. Existen en Estocolmo casos de neumona adquirida en la comu-

nidad resistentes a las cefalosporinas de ltima generacin?
5. Amamantan por igual tiempo las madres fumadoras que las no

fumadoras?
6. Existe alguna diferencia por clase social entre las madres lactantes
exitosas y las que no lo son?
7. Cul es el programa ms efectivo para disminuir el nmero de

personas mayores con fractura de la cabeza del fmur? Cules
son los factores de riesgo de fracturas de cabeza de fmur en su
ciudad? Son iguales o diferentes a las del resto del pas? Cmo se
comparan con los de otros pases y grupos de poblacin?
8. Cules personas tienen ms riesgo de suicidarse en su ciudad?

En qu pocas del ao?
De los ejemplos salen los usos.
Historia de la epidemiologa
Sin marco histrico no es posible entender la epidemiologa. Pierde
contexto. Algunos nombres son clave en la historia de esta disciplina
y los conceptos con que contribuyeron an persisten como puntos de
referencia. Se trata de nombres sin los cuales es difcil hablar de epide-
miologa.
Ejercicio 2
En seguida le damos, a manera de ejemplo, una serie de referentes his-

tricos. Se trata de personas y de hechos. Le pedimos que los consulte
y los compare con la columna del frente. Usted mismo decida cul es
su importancia.
A. Ignaz Semmelweis 1. Las causas de la distribucin de la enfermedad no son las

mismas que las causas de la enfermedad en la poblacin.
B. Joseph Lister 2. Uso de la estreptomicina y primer ensayo clnico controlado.
C. John Graunt, 1662. 3. Proponente de los beneficios del acceso universal a la salud.
D. Edwin Chadwick 4. Causas y prevencin de la fiebre puerperal.
E. John Snow 5. Los efectos de la globalizacin sobre la salud.
F. Koch 6. Los postulados de causalidad de las enfermedades infecciosas.
G. Wade Hampton Frost 7. Aplicacin de la estadstica en la medicina y en la epide
miologa, tutor de Hill.
H. Major Greenwood 8. Tablas de vida.
I. Sir Richard Doll 9. Los criterios de causalidad.
J. Austin Bradford Hill 10. Primeras medidas antispticas en ciruga.
K. Los responsables de la cohorte de 11. Epidemiologa del carcinoma de cuello uterino y el rol del
Framingham. virus del papiloma humano.
L. Brian McMahon 12. Grandes crticos de la medicina y la epidemiologa.
M. Mervin Susser y su esposa Ida Stein. 13. Padre del movimiento sanitario y de la salud pblica como
estrategia para mejorar la salud de la poblacin.
N. Geoffrey Ross. 14. Carcinoma de estmago y de la epidemiologa de la lcera
gstrica y duodenal y su relacin con el H. Pylori.
O. Milton Terris 15. Historia natural de la influenza, la polio y la tuberculosis.
P. Ren Dubos, Thomas McKeown, 16. La epidemia del clera en Londres.
Ivan Illich.
Q. Vincent Navarro 17. La asociacin de tabaco y cncer de pulmn.
R. lvaro Muoz 18. Maestro de muchas generaciones de epidemilogos y salubris
tas colombianos, a quien con tanto aprecio le dedicamos este
libro.
S. Leif Svanstrm 19. Las causas sociales de la enfermedad y la salud de las poblacio
nes.
T. Pelayo Correa 20. Crtico de los crticos del papel de la medicina en la salud de las
poblaciones.
U. Nubia Muoz 21. El comportamiento del HIV segn los niveles de carga viral de
los componentes de su cohorte de Baltimore.
V. Alberto Alzate 22. Modelo de Comunidades Seguras.

Respuestas al ejercicio anterior (le pedimos que tenga la paciencia

de leerlas).
Primera parte del ejercicio: la mayora de las respuestas sobre las asocia-
ciones entre los primeros nombres de la columna de la izquierda y las
opciones de la derecha no han debido costarle trabajo.
Tales son los casos de Ignaz Semmelweis (A) y la fiebre puerperal (4),
Joseph Lister (B) y las medidas antispticas de la ciruga (10), Koch
(F) y sus postulados de causalidad de las enfermedades infecciosas (6),
John Graunt (C) y las tablas de vida (8), Edwin Chadwick (D) y su reco-
nocimiento como padre del movimiento sanitario y de la salud pblica
como estrategia para mejorar la salud de la poblacin (13), John Snow
(E) y la epidemia de clera de Londres (16).
Todos esos nombres y sus descubrimientos son parte de lo que al-

gunos llaman cultura general, de tanto recibo en programas de con-
curso televisivo y en crucigramas. Pertenecen, si se quiere, a una inter-
pretacin idealizada y restringida de la historia y de la ciencia que se

empea en encontrar ganadores (usualmente buenos) y perdedores
(por lo general malos), al igual que responsables nicos de ideas y
descubrimientos.
Parte intermedia: el siguiente grupo, los nombres de la mitad de la colum-

na de la izquierda pudieron haberle trado momentos de duda, tal vez
mltiples consultas de la literatura mdica, epidemiolgica y de salud
pblica, de pronto algo de irritacin. Esto se debe a que hay sobreposi-
cin en muchos de los hallazgos y conceptos atribuidos a unos y otros
y de los momentos histricos y las circunstancias compartidas. Wade
Hampton Frost (G) en el ejercicio se ha ligado con la opcin (15), la
historia natural de la influenza, del polio y de la tuberculosis, pero igual-
mente hubiramos podido asociarlo con la fundacin de la Escuela
de Salud Pblica de John Hopkins y con el estudio de las epidemias
de tifoidea de Baltimore a comienzos del siglo anterior, o lo hubira-
mos podido destacar por ser el primero en introducir el concepto de
personatiempo, esencial para entender el concepto gemelo de tasas de
incidencia. A Major Greenwood (H) lo hemos asociado con (7) la apli-
cacin de la estadstica en la epidemiologa y la medicina, pero tambin
con el hecho de haber sido tutor de Hill. No es el nico vnculo familiar
porque a su vez fue discpulo del padre de Hill, de quien fue monitor
de fisiologa en Londres. Greenwood fue adems el primer profesor
de epidemiologa y estadsticas vitales del London School of Hygiene and
Tropical Medicine hasta su retiro, en 1945.
Los casos de Sir Richard Doll y de Austin Bradford Hill siempre sern
un desafo mayor: es difcil evitar adjetivos y muy complicado asignarles
casillas, pues todas les quedan estrechas a sus aportes. Tocaron tantos
aspectos, que es posible atribuirle a otros contribuciones compartidas.
Si bien Richard Doll (I) es reconocido por todos como el Decano en-
tre Decanos de la epidemiologa moderna, sera imposible separarlo
de Austin Bradford Hill (J). A ambos se les asocia con los criterios de
causalidad (9) en este ejercicio atribuidos a Doll, pero como ver ms
adelante en este mismo libro, analizados por Rothman, por Susser y
por Hill. Doll y Hill son inseparables tambin en el estudio sobre el
uso de la estreptomicina para el tratamiento de la tuberculosis y el pri-
mer ensayo clnico controlado ocurrido en 1948 (2), o por haber sido
los primeros en demostrar la conexin entre el cigarrillo y el cncer
de pulmn (17), tema que por otra parte tambin ha sido ligado en el
ejercicio nuestro a Brian McMahon (L). Los responsables de la cohorte
de Framingham (K) en la columna de la izquierda se quedaron sin co-
lumna en la derecha, pero obviamente son los responsables de muchos
de nuestros conocimientos actuales sobre la influencia de los estilos
de vida, as como las variables antropomtricas y bioqumicas en las
enfermedades cardiovasculares. Mervin Susser, junto con su esposa Ida
Stein (M), han sido exponentes de los beneficios del acceso universal
a la salud (3), aunque no han sido los nicos, y Milton Terris (O), gran
promotor del cuidado preventivo, proponente del sistema de salud ni-
co para los Estados Unidos y de la idea de que los factores socioecon-
micos y otros no mdicos deben ser tenidos en cuenta en el estudio de
la salud pblica (3). Como vern, esto tambin es algo compartido por
Susser y Stein. Geoffrey Ross (N) es identificado por la mayora gracias
a su concepto de que las causas de la distribucin de la enfermedad no
son las mismas que las causas de la enfermedad en la poblacin (1).

Dubos, Illich y McEwon (P) fueron, desde luego, los grandes crticos
de la medicina pero tambin de la epidemiologa y especialmente en
el caso de Illich, de los sistemas escolares y todas las formas de poder
disfrazadas de servicio (12). Vincent Navarro (Q), por su lado, analiza
las limitaciones de los argumentos de unos y otros, aun de los crticos
reconocidos de la medicina y de la epidemiologa, y argumenta cmo
cualquier recorte social incrementa la pobreza y la enfermedad de la
poblacin. Navarro defiende la inversin social y propone como mayor
factor de salud la inclusin, sin la cual la cohesin social y la salud de
las poblaciones se deterioran. Podra Navarro haber estado ligado a
muchas de las casillas de la derecha, pero aqu lo hemos asociado con
la casilla (20).
Parte final de la columna de la izquierda: durante las pruebas de lectura del

libro, algunos de nuestros lectores profesionales de la salud cultos
se irritaron al no poder encontrar fcilmente cul era la asociacin entre
algunos nombres de la columna de la izquierda y los descubrimientos
de la columna de la derecha. Tales fueron especialmente los casos de
Pelayo Correa y su papel en el entendimiento de la epidemiologa del
Helicobacter Pylori, la enfermedad cidopptica y el cncer de la parte
alta del tubo digestivo; el de Nubia Muoz en la comprensin del rol
del virus del Papiloma y la epidemiologa del cncer de cuello uterino, o
la de lvaro Muoz en la epidemiologa del SIDA a travs de su cohor-
te de seropositivos de Baltimore. Lo anterior tiene una explicacin.
La contribucin de los tres profesionales colombianos, cuyo rol ter-

min siendo tan elusivo para quienes hicieron el ejercicio pero tan
determinante para nuestro entendimiento de estas enfermedades, fue
esencialmente epidemiolgica y la epidemiologa es una ciencia menos
publicitada que las ciencias bsicas y de laboratorio.
Barry Marshal y J. Robin Warren, dos australianos ganadores del Pre-

mio Nobel de Medicina en 2005, lograron aislar y cultivar el Helicobac-
ter Pylori, documentar la erradicacin de la bacteria con antibiticos,
acelerar la curacin de las lceras gstricas y disminuir la reaparicin
de las lesiones, pero fue Pelayo Correa quien describi el complejo no-
solgico constituido por la gastritis, atrofia, metaplasia, lcera gstrica,
displasia y cncer, y postul que la gastritis crnica era un eslabn de la
cadena etiolgica del cncer gstrico.
Por su parte, Luc Montaigner en el caso del HIV, y Harald zur Hausen
en el caso del Papiloma, fueron premiados con el Nobel en 2008. Basta,
sin embargo, leer los trabajos de Nubia Muoz sobre la distribucin
del virus del papiloma humano y su asociacin con el cncer de cuello
uterino para entender la importancia de su contribucin en el entendi-
miento del rol del virus en dicho cncer, o leer u or a lvaro Muoz
sobre su cohorte de Baltimore para saber cuntas luces dio a nuestra
comprensin del comportamiento del SIDA segn los niveles de carga
viral y la relacin entre CD4/CD8.
Todos los casos referidos son descubrimientos bastante recientes. Es-

pecialmente durante la segunda mitad del siglo nuestras interpretacio-
nes de ciencia - qu es y cmo se hace - han cambiado de manera
radical.
Ustedes, lectores, y nosotros crecimos con la idea de que ciencia para

serlo y no dogma, puede y debe ser cambiante, sus conceptos deben ser
desafiados (refutacionismo de Popper). Y hemos aprendido de Kuhn,
en su Historia de las Revoluciones Cientficas, que los grandes des-
cubrimientos y los cambios de paradigma suceden cuando los modelos
prevalentes ya no alcanzan para explicar los fenmenos que le ataen
a dicha ciencia. Dichos cambios no son milagrosos ni suceden de un
momento a otro, ni son el producido de una sola persona a quien sbi-
tamente se le ilumina un bombillo.
Finalmente, espero que todos hayan podido asociar a Alberto Alzate

(V) con la enseanza de la epidemiologa en Colombia y Latinoamrica
(18), y a Leif Svanstrm (S), del Instituto Karolinska de Estocolmo,
con el modelo de Comunidades Seguras (22).
Ejercicio 3
Trate de responder las siguientes preguntas o de construirle una histo-

ria a los temas planteados:
Las grandes escuelas de salud pblica y epidemiologa del mundo:

Cules son y los criterios para escogerlas
Epidemiologa de los accidentes y del movimiento de Comunida-

des Seguras en Suecia y luego en el mundo.
Rescate de la lactancia materna en el mundo.
Investigue el papel que jugaron o juegan David Morley, Csar Vic-

tora, Cicely Williams, Kathryn Dewey, o los esposos Jeliffe en Ca-
lifornia en el rescate de la lactancia materna.
Ejercicio 4
Construya su propia historia con sus propios matices, pero no olvide

que hay otros que merecen ser incluidos, adems de usted y los suyos.
Ver cmo todos terminan beneficindose del intercambio con otros
ms viejos o ms jvenes y de miradas diferentes.
Los anteriores ejercicios nos obligan a expresar los siguientes puntos:
A pesar de lo atractivo que hayan podido resultar estos ejercicios y

otros similares, lo real es que los descubrimientos no los hace una
sola persona ni en un solo momento de iluminacin.
Los milagros en epidemiologa y en ciencia solo le ocurren a

quienes tienen los elementos para identificar que el milagro est
ocurriendo porque lo han buscado con mucho esfuerzo durante
un largo tiempo.
La epidemiologa es una ciencia interdisciplinaria en la cual es

esencial trabajar con muchas personas con quienes es necesario
escucharse y respetarse mutuamente.
Aun as, todava hoy se le atribuyen los descubrimientos a una sola

persona.
Diversas ramas de la epidemiologa

Reuel Stallones4, en su publicacin de 1980 sobre Cmo avanza la
epidemiologa, expuso los territorios de investigacin que abarcaban
las diferentes ramas de las ciencias biomdicas. Deca que la biologa
molecular tiene como territorio un nivel compuesto por molculas y
partculas; la patologa, por las clulas, los rganos y los individuos; la
investigacin clnica por los rganos, los individuos y las familias; y la
epidemiologa por los individuos, las familias, las comunidades y las socie-
dades. Aunque se entrelaza con los territorios de otras ciencias biom-
dicas, la epidemiologa abarca un territorio ms amplio que aquellas.
Nuevas formas de epidemiologa

Hasta hace poco la gente hablaba simplemente de epidemiologa a se-
cas. Hoy se mencionan y se estudian diversos tipos de epidemiologa.
A medida que vinieron las tecnologas, cada vez fue ms difcil poder
decir que hay epidemilogos puros trabajando en los problemas de la
poblacin. La gentica y la biologa molecular permitieron especializar
a algunos epidemilogos en la bsqueda de la arquitectura gentica
de enfermedades complejas, y los genes involucrados en el riesgo de
enfermar, por ejemplo la enfermedad coronaria y el APOB, el cncer
de pulmn y el NAT2, el cncer de colon y el APC, o el cncer de
mama, el BRC1 y el BRC2.
Ms recientemente, se ha decidido llamar a la epidemiologa segn el

tipo de poblacin o las enfermedades estudiadas. As, se habla de epi-
demiologa del envejecimiento, epidemiologa prenatal, o de la epide-
miologa de las enfermedades crnicas, del cncer, o de las enferme-
dades infecciosas. Todas hacen parte de la llamada Epidemiologa del
transcurso de la vida (Life Course Epidemiology).
Otros epidemilogos tienden a especializarse en exposiciones: epide-

miologa ocupacional, epidemiologa del medio ambiente, epidemiolo-
ga nutricional, epidemiologa social o epidemiologa de la exclusin y
de la desigualdad, en contraste con la epidemiologa del exceso.
Independiente de las especializaciones, lo propio de la epidemiologa

es la mirada probabilstica y el anlisis del comportamiento de pobla-
ciones, as como la importancia y las limitaciones que tiene la estadsti-
ca como herramienta fundamental de la epidemiologa para analizar el
comportamiento de poblaciones en trminos de probabilidad, que vale
tanto para las molculas como para las sociedades.
En general, los autores de este libro se inclinan ms por pensar que la

epidemiologa se puede dividir en tres ramas o territorios: la epidemio-
loga del macronivel, del micronivel, y en medio de estos dos niveles
encontramos el mesonivel y la epidemiologa de factores de riesgo.
Qu es peculiar a cada una?

Cada una de ellas se focaliza en algunos usos de la epidemiologa ms
que en otros.
1. La epidemiologa del nivel molecular o micro-epidemiologa: su

territorio abarca del nivel molecular al individuo. All podramos
ubicar la epidemiologa gentica. Busca caracterizar las variaciones
genticas de las poblaciones, mide las interacciones entre genes y
medio ambiente y evala las pruebas genticas como formas de
tamizaje. Una de sus grandes contribuciones a la epidemiologa
analtica ha sido mejorar las inferencias causales en estudios ob-
servacionales5 (lo veremos mejor en otro captulo).
2. La macro-epidemiologa: comprende principalmente el estudio de

las poblaciones, los barrios, las comunidades o los pases. Identifica
patrones y busca asociaciones entre diferentes niveles de organiza-
cin de la sociedad, la forma como las poblaciones los incorporan
(mecanismos) y el estado de salud; stas nos ayudarn a ver que no
es tan sencillo describir ni interpretar los fenmenos y las causas,
nos harn ver que en algunas sociedades los pobres se mueren ms
de enfermedades cardiovasculares o sufren ms accidentes, que
el hecho de aguantar hambre de nio se traduce en que al llegar
a adulto las nios hambrientos de antao no se ejercitan como es
debido y comen de ms. Que al igual que la epidemiologa de la
miseria, existe la fisiopatologa, la sicopatologa y la epidemiologa
de la holgura.
3. En medio de ellas se encuentra la epidemiologa clnica, a veces

llamada epidemiologa de los factores de riesgo. Su territorio son los
individuos y busca aplicar los resultados de grupos de individuos a
individuos particulares. Poco interacciona con el nivel macro, pero
deja espacio para el nivel micro. Las asociaciones de cigarrillo, as-
bestos y cncer de pulmn; o de la dieta y los mayores factores de
riesgo para enfermedad cardiovascular son ejemplos de algunos
de sus grandes descubrimientos. Su paradigma son los estudios experi-
mentales, especialmente los ensayos clnicos, y por ello el estudio de la po-
breza, de los efectos del cambio climtico, o de la discriminacin
sobre la salud - los cuales no pueden ser sometidos a experimen-
tacin - son ignorados por esta rama de la epidemiologa6.
Pero la verdadera (o la nueva) epidemiologa debera abarcar varios te-

rritorios, como lo propona alguna vez Stallones y lo propone Mervin
Susser.
Observe los siguientes ejemplos:

En el ejemplo de su izquierda (Figura 1) puede ver una mirada de la

epidemiologa de arriba hacia abajo. Estudios que demuestran mayor
prevalencia de obesidad en lugares con mayor nmero de comidas r-
pidas (McDonalds, por ejemplo) han llevado a proponer estudios en
poblaciones para demostrar la asociacin entre el consumo de comi-
das rpidas (ricas en grasas poliinsaturadas), el incremento del ndice
de Masa Corporal y un alto riesgo de diabetes. Este hallazgo permite
asociar la epidemia de obesidad en el mundo con otros hbitos de vida
de la sociedad moderna, tambin muy asociados con la ingestin de
comidas rpidas: la pobreza, la falta de tiempo, la televisin, el se-
dentarismo.
En el caso de la derecha, tenemos un ejemplo de la mirada de abajo

hacia arriba. Desde hace ya varios aos, los investigadores de ciencias
bsicas han descubierto mutaciones de resistencia a las terapias antirre-
trovirales usadas primordialmente en el tratamiento del SIDA. Estas
mutaciones han servido para replantear el tratamiento de los pacientes
VIH seropositivos, y especialmente han llevado a muchos epidemilo-
gos y mdicos tratantes a interrogarse sobre la importancia de la adhe-
rencia a los medicamentos en la sobrevida de los pacientes.
Figura 1
Mayor nmero de comidas

rpidas por milla, Sobrevida
mayor prevalencia obesidad
Alto contenido de dieta rica en Adherencia

grasas poli insaturadas
Diabetes, obesidad Tratamiento de eleccin HIV
Epidemia de Obesidad Mutaciones de

asociada con resistencia
la modernidad
Tendencias
Se refiere este trmino a que, al hablar de ciertos fenmenos, en epide-
miologa se deben considerar como unidades de anlisis tiempos que
son diferentes a los periodos de tiempo que se consideran cuando se
describe un solo fenmeno aislado. De all que la epidemiologa sea una
ciencia histrica. Estos periodos de tiempo a veces son largos, pues es
la nica manera de poder interpretar los cambios dentro de un contex-
to social e histrico para ver si permanecen y con ello darles, quizs, un
significado diferente. A veces los periodos de anlisis necesarios para

establecer tendencias son no una semana sino un ao, o estacionales,
a veces quinquenios. En salud pblica, para ver algunos cambios se
requiere al menos de treinta aos. En algunos fenmenos es necesario
analizar periodos de cien aos. Los cambios ocurridos definiran las tendencias
seculares.
Cambios atribuibles a mejores diagnsticos

Segn Brian McMahon, uno de los grandes maestros de la epidemiolo-
ga, algunos cambios se deben ms a variaciones en la forma de hacer
los diagnsticos. La tecnologa progresa y se aumenta la capacidad de
detectar la enfermedad, sin que ello signifique que haya habido un ver-
dadero aumento en la incidencia y en la prevalencia de la misma.
Cambios atribuibles a cambios de los agentes causantes

Los virus o los grmenes cambian de comportamiento y se vuelven
ms o menos virulentos; nuevas circunstancias pueden favorecer su en-
trada (hacinamiento), o limitarla (higiene, mejor nutricin, vacunacin).
El papel de la epidemiologa es tratar de aclarar todo ello.
El estudio de las tendencias tambin puede ayudar a identificar los de-

terminantes de la salud de una poblacin, o a establecer los efectos
(positivos o negativos) de intervenciones en salud, o aun el efecto de
descubrimientos mdicos en la salud de la poblacin. Observe este
ejemplo: la mortalidad materna por aborto sptico era un problema
de la primera mitad del siglo pasado, ms en Nueva Zelandia y Austra-
lia, que en Inglaterra. Muchos factores parecen haber contribuido a la
reduccin de la mortalidad materna en esta poca (mejoras en la edu-
cacin materna, cuidado prenatal, capacitacin de parteras), pero para
algunos historiadores de la medicina, la introduccin de antibiticos
favoreci de manera importante esta disminucin. (Figura 2).
Figura 2. Mortalidad Materna por aborto sptico

por 10000 nacimientos
No le llama la
20 Disponibilidad de
Sulfonamidas Disponibilidad de
atencin que la
18 Penicilina mortalidad ya estaba
16
Mortalidad por cada 10.000
disminuyendo antes de
14 que estuviera dispo-
12 nible la penicilina,
10 Inglaterra y que despus de la
8 Australia introduccin de las
6
Nueva Zelanda sulfonamidas se pre-
sentaron algunos picos
4
de incremento de la
2
mortalidad?
0
35 936 38 939 43 45 946 48 949

41
37
40
42
44
47
50
19 1 19 1 19 19 1 19 1
19
19
19
19
19
19
19
Medidas de morbilidad y mortalidad usadas en la epidemiologa
Ya lo hemos dicho: la epidemiologa tiende a ser una disciplina cuanti-

tativa en la cual las medidas ms usadas adquieren mucho valor. Cules
son esas medidas?
Por favor, no menosprecie ninguna por simple que le parezca; de igual

manera le pediremos ms adelante que no menosprecie ningn tipo de
diseo, y que tampoco sobrevalore ninguno. Cada medida y cada dise-
o tienen su funcin, segn al que hagan referencia:
Conteo. Es la medida ms simple y ms frecuentemente usada por la

epidemiologa cuantitativa. Se refiere al nmero de casos de la enferme-
dad o el fenmeno estudiado.
Proporcin. Para que el conteo describa un grupo, dicho conteo debe

ser relativo al tamao del grupo. Cuando yo digo que 70 estudiantes de
un colegio tienen depresin con tendencias suicidas, es diferente si el
colegio tiene 700 o 7 000 estudiantes. En la mayora de las situaciones
es necesario tener una idea del tamao del denominador. Slo as los
conteos podrn describir con claridad y ser tiles.
Las proporciones se pueden expresar como porcentajes o como fracciones, o como

nmeros decimales.
Pero volvemos a insistir, y perdone que nos volvamos irritantes, el con-

teo en s, sin nada ms, puede ser importante en algunas circunstancias.
Un solo caso de bola es importante, como sera uno de SARS (Sndro-
me de Dificultad Respiratoria Aguda) o un caso de gripe aviar, o uno de
gripe porcina. Sin importar para nada los denominadores, prenderan
las alarmas y pondra a mover a todas las autoridades sanitarias y de
toda la sociedad de igual manera en Mxico, en Suecia, en Inglaterra o
en Colombia.
Razn. Al igual que la proporcin, la razn es una fraccin, y por lo

tanto, tiene un numerador y un denominador. La diferencia consiste
en que en la razn no hay necesariamente una relacin especfica entre
el numerador y el denominador, mientras en la proporcin el numerador
siempre es parte del denominador. La razn puede expresarse como:
X/Y
Por ejemplo, de 1 200 vctimas de violencia domstica, 800 son mu-

jeres y 400 son hombres. La razn entre sexos para casos de vctimas
de violencia domstica es de 800/400. Es decir, 2.0 mujeres por cada
hombre.
Tasa. La tasa difiere de la proporcin en que el denominador de la tasa

incluye una medida de tiempo. El concepto de tasa es muy importante para
entender ms adelante el concepto de tasa de incidencia y ver cmo vara
o cmo se relaciona con la incidencia pura. Ya lo veremos cuando sea el
momento, pero lo adelantamos para que se vaya familiarizando con la
idea, el concepto de tasa de incidencia lleva implcito el concepto de persona-tiempo,
una idea introducida a comienzos del siglo XX por Wade Hampton
Frost, fundador de la Escuela de Salud Pblica de la Universidad de

Johns Hopkins, segn sus alumnos y sus acadmicos, y tambin otros,
la mejor de los Estados Unidos y del mundo. (Con el tiempo aprender
cuntos se autoproclaman como los mejores en todos los campos del
conocimiento).
Hay Tasas y tasas. Fuera del contexto de un estudio epidemiolgico de

seguimiento, en el que se utiliza la tasa de incidencia expresada como
persona-tiempo, tambin hay tasas que se obtienen para agregados po-
blacionales (en especial geogrficos). Estas ltimas son aquellas con las
que usted estar ms familiarizado, ya que son las tasas ms comn-
mente usadas en salud pblica y demografa. El numerador consiste en
la frecuencia de la enfermedad durante un perodo especfico de tiem-
po mencionado, y el denominador es una unidad de tamao de la po-
blacin (por lo general el promedio de la poblacin a mitad de ao).
Ejemplo, la tasa cruda de mortalidad:
# muertos durante un ao determinado x 100.000

Tasa cruda de mortalidad =
Poblacin de referencia (a mitad de ao)
Observe que las tasas de cncer se expresan usualmente en 1: 100 000,

pero las tasas de mortalidad infantil se expresan en 1: 1 000, y las de
mortalidad materna en 1:10 000. La escogencia de la cifra usada al final
de la frmula depender de cun frecuente es la enfermedad, para que
al expresarla en casos de eventos no tan comunes, no haya necesidad
de expresar las tasas en decimales, sino que por el contrario se puedan
expresar en nmeros enteros que sean mayores de la unidad (uno). Con
tal que los informes tcnicos las expresen claramente (y las justifiquen),
las tasas se pueden multiplicar por 1 000, por 10 000 o por 100 000,
segn convenga.
Muchas publicaciones usan, de manera muy liberal, los trminos razn,

proporcin y tasas, sin adherirse estrictamente a las definiciones tcnicas.
Pero las tasas bien empleadas mejoran la capacidad de hacer compa-
raciones.
Perfil epidemiolgico
El perfil epidemiolgico es algo similar al perfil de las personas. En
stas el perfil bsico lo dan los genes, pero los perfiles son cambiantes
y hay que actualizarlos; a veces la gente cambia tanto que se vuelve irre-
conocible con el paso del tiempo. Una foto de una persona de 50 aos
no siempre deja ver cmo era de beb o de nio.
Un perfil epidemiolgico es una descripcin detallada de las caracters-

ticas demogrficas, sociales y de enfermedad de una poblacin. Dicho
perfil puede ser general o especfico. Y tambin es cambiante con el
tiempo. La distribucin por edad y sexo de las causas de morbilidad y
mortalidad ayudan a definir el perfil epidemiolgico de una poblacin,
y por supuesto a definir las intervenciones de salud que sern priori-

tarias en dicha poblacin. Y decimos que son cambiantes porque hace
50 aos las causas de mortalidad en el mundo no eran las mismas de
ahora, y ello porque ni los servicios, ni las expectativas, ni la sociedad
son iguales. O pregnteles a sus abuelos si en su poca las personas se
moran de cncer o si haba tantas personas obesas o tan altas como
hay ahora. Los estudios epidemiolgicos descriptivos ayudan a estable-
cer los perfiles requeridos. Los instrumentos usados para establecer los
perfiles epidemiolgicos son tablas, figuras y mapas. Estos sern vistos
en detalle cuando hablemos de las herramientas usadas con ms fre-
cuencia en epidemiologa. Ms recientemente est disponible un soft-
ware geogrfico de alta calidad, y muy divertido, diseado por Hans
Rsling del Instituto Karolinska de Estocolmo, que recomendamos
como la mejor herramienta disponible para comparar perfiles de salud
en distintos pases a lo largo de la historia.
Vigilancia
La vigilancia epidemiolgica es una herramienta poderosa de la epide-
miologa y de la salud pblica.
Qu es? Qu se vigila
Se vigilia lo que pasa y
Hasta hace algn tiempo se hablaba exclusivamente de La vigilancia epi- sobre todo lo que uno
demiolgica, para diferenciar este tipo de vigilancia de otras que se hacen
con otros propsitos (como la inteligencia militar). La vigilancia epi- no quiere que pase.
demiolgica se define como la recoleccin sistemtica y permanente
de datos sobre una enfermedad o fenmeno, de manera que se identi-
fiquen tempranamente y as se pueda actuar de forma tan oportuna y
eficiente como sea posible. En la actualidad, se habla ms de vigilancia en
salud pblica con el fin de incorporar actividades de la salud pblica que
van ms all de la investigacin epidemiolgica y que incorporan otros
tipos de vigilancia: de laboratorio, de comportamientos y de oferta de
servicios.
Niveles local y central

La definicin de vigilancia implica que los datos se recolectan e inter-
pretan en el nivel local para que las decisiones sean giles, pero tambin
implica comunicacin y coordinacin permanente con los niveles cen-
trales, para establecer patrones comunes en reas mayores y se puedan
distribuir los recursos equitativa y gilmente.
Qu se vigila
Se vigilia lo que pasa y sobre todo lo que uno no quiere que pase. Por ejem-
plo, uno no quiere que se le entren los ladrones a la casa y por ello
le paga a los vigilantes. Uno debe vigilar permanentemente el estado
nutricional de las personas y celebrar cmo crecen las poblaciones sa-
nas, pero debe estar preparado para tomar medidas en aquellos casos
infortunados en que el equilibrio social se rompe, de manera que se
detecten y puedan ser solucionados, tan tempranamente como sea posible, los
casos en los cuales hay signos de alarma.
Con qu instrumentos se vigila?

Aqu es donde la imaginacin se puede usar sin lmites. Se pueden usar
series de datos que se llenan en una matriz, bases de datos, etc. Lo que
importa es que los datos se miren, se discutan y se tomen acciones, y
no que se dejen sin interpretacin y sin accin oportuna. En ese caso,
la vigilancia sirve de poco.
Ejemplos de vigilancia en salud pblica:
El mapa de casos (spot map) de Snow durante la epidemia de cle-

ra. La tabulacin de casos de ataque de la enfermedad y la de los
casos fatales permitieron identificar el patrn que eventualmente
servira para controlar la epidemia.
El mapeo de los accidentes de trnsito en Cali o en Bogot, con

caracterizacin de las vctimas y los victimarios. De dnde son,
por qu estaban all. Para tomar medidas y no simplemente para
contar muertos. Esas medidas implican a veces tomar decisiones
incmodas, verse con los polticos, con la polica, con gente que
puede pensar diferente a uno, tener otra visin, otros intereses,
pero sin los cuales no hay sociedad. Los sistemas de vigilancia epide-
miolgica de accidentes de trnsito en diversas ciudades del mundo nos
han mostrado que hay cruces de vas y circunstancias peligrosas
en las cuales lo nico sensato sera aislar completamente a las vcti-
mas, por ejemplo mediante la construccin de puentes peatonales,
o la proteccin fsica de los sitios de recreacin en donde los nios
puedan jugar sin correr el riesgo de ser atropellados por carros,
ms que el uso de campaas educativas. Sabemos que la posibi-
lidad de que un carro le produzca lesiones y muerte a un peatn
depende de la masa de un carro multiplicada por la velocidad. Si
sabemos que a 20 km por hora se mueren tantos, y que a 30, a 50,
o a 70 km por hora el riesgo es mucho mayor, lo nico sensato pa-
recera ser obligar mediante multas muy altas a los conductores de
carros a mantener los lmites de velocidad indicados en las reas
altamente pobladas.
La vigilancia de segunda generacin de VIH/SIDA provee infor-

macin sobre los cambios en la epidemia en el tiempo, recolecta
datos sobre factores de riesgo (uso de condn, intercambio de je-
ringas en consumidores de drogas, nmero de compaeros sexua-
les), reporte de casos de VIH/SIDA y enfermedades de transmi-
sin sexual. El tipo de poblacin que se examina depende de la
frecuencia del VIH en la zona. Por ejemplo, la prevalencia en la
poblacin general es de ms de 1%, se vigila la poblacin general
y los grupos de riesgo (trabajadores sexuales), si la frecuencia de
la enfermedad es baja, aun en los grupos de alto riesgo, slo se
vigilan estos ltimos7.
Epidemia
Versin tradicional
El concepto de epidemia estuvo tradicionalmente asociado con las en-
fermedades infecciosas. Pero incluso dentro de ellas aquel ha cambiado.
En el caso de las enfermedades transmisibles, un solo caso de una en-
fermedad que no se ha visto en un largo periodo, o la primera invasin
de una enfermedad no identificada antes en un sitio, es una epidemia.
Dichos casos requieren ser reportados de inmediato. Cualquier caso
de parlisis flcida de cualquier etiologa, en cualquier lugar, disparara
mltiples alarmas en todo el planeta, pues podra tratarse de polio, una
enfermedad a punto de ser erradicada en el mundo. Igual pasara con
un nuevo caso de viruela, una patologa ya erradicada, o un caso de
SARS o de gripa aviar, cuyas amenazas recientes han puesto a temblar
los servicios de salud de todos los continentes.
Es decir que un nmero x de casos de tal enfermedad, asociados en

tiempo y lugar, son suficiente evidencia de transmisin para ser consi-
derados como una epidemia.
Versin nueva
En la actualidad, el concepto de epidemia no est confinado a las in-
fecciones sino que incluye muchas otras enfermedades, algunas de ellas
crnicas, como cncer, accidentes, suicidios, intoxicaciones, anorexia
nervosa, etc. Aqu la epidemia tambin se define por cualquier nmero
de casos ms all de lo esperado en una poblacin dada, segn el com-
portamiento histrico de dicho fenmeno.
Inmunidad de rebao: Qu es?

La inmunidad de rebao - tambin conocida como inmunidad comuni-
taria - es un tipo de inmunidad que se aplica en epidemias infecciosas
de transmisin rpida. Dicha inmunidad se presenta cuando, de una
poblacin, el nmero de sujetos inmunes contra una enfermedad es de
tal magnitud, que existen pocas probabilidades de nuevas infecciones
dentro de la poblacin no vacunada o no afectada previamente por una
epidemia, porque no hay manera de mantener la cadena de transmisin.
Esta situacin se presenta cuando los programas de vacunacin masiva
son exitosos o cuando una poblacin estuvo recientemente expuesta a
una epidemia que afect un gran nmero de individuos sin quitarles
la vida, con lo cual quedaron equipados con anticuerpos contra dicha
enfermedad y, por lo tanto, no pueden transmitrsela a otros.
Umbral de inmunidad
En los programas de salud pblica existe el concepto ntimamente re-

lacionado de umbral de inmunidad; este se refiere al nmero (porcentaje)
mnimo de personas que debe ser vacunado para lograr la inmunidad
de rebao en una poblacin y as evitar la cadena de transmisin de la
misma. En la erradicacin de ciertas enfermedades no fue necesario

vacunar a todo el mundo, bast con haber vacunado a un nmero sufi-
ciente de personas determinado por el umbral de inmunidad.
Ejemplo de inmunidad de rebao
Un buen ejemplo de inmunidad de rebao sera el sarampin antes de la

existencia de la vacuna y su uso masivo en salud pblica: imaginemos
el comportamiento del sarampin a lo largo del tiempo como un ro
con un lmite superior y uno inferior que daran los percentiles superior
e inferior del comportamiento estacional tradicional del sarampin y
le pondran un lmite a lo que sera considerado epidemia. Es decir, al
ponerle las lneas de base estacionales, incorporamos el concepto hist-
rico. Sabemos qu pasa (las epidemias de sarampin se solan presentar
cada cuatro aos porque ya haba suficiente cantidad de nuevos nios
no expuestos entre los nacidos en este periodo) y este es el concepto
que usamos para definir si lo que vemos sobrepasa las expectativas, lo
podemos catalogar entonces como un fenmeno ms all de lo espera-
do y llamarlo epidemia. Ya sea que la epidemia se presente durante un
periodo de baja presentacin poblacional de la enfermedad o durante
el nuevo pico estacional.
Inmunidad de Rebao
Comportamiento hipottico del sarampin
en una regin dada a lo largo de los aos.
Epidemia sobre
un pico estacional
Al acabar la
inmunidad de
rebao cada 4
aos hay picos
# Casos
estacionales
Epidemia
Pico por fuera
del estacional
1950 1951 1955 1959 1963
Causalidad
La epidemiologa tiene que ver con la distribucin y los determinantes de
salud y enfermedad, morbilidad, lesiones, discapacidad y muerte en las
poblaciones; ayuda a formular la pregunta correcta y a encontrarle las
explicaciones ms plausibles a los fenmenos de salud y enfermedad;
tambin nos ayuda a determinar cules son los factores causales y en
qu proporcin estos pueden ser responsables de una enfermedad o
fenmeno.
Por ello, los epidemilogos han gastado ya varios de sus aos pregun-
tndose: Qu es una causa? Cmo sabemos que estamos frente a
una?
Los epidemilogos no son los nicos que han encontrado dificultades

al definir una causa, muchos cientficos de diferentes ciencias tambin
las tienen. Los primeros han preferido usar trminos como: determi-
nantes, factores de riesgo, exposicin y factores etiolgicos para aproxi-
marse a una definicin de causa sin tener que hacer una definicin de
ella. Algunos, para facilitar esta tarea, han creado categoras de causas:
necesarias, suficientes, directas, indirectas, modificables, no modifica-
bles, nicas, mltiples. Observe la tabla 1 para ver algunas de sus defi-
niciones.
Mervin Susser ofrece una definicin muy amplia de causa8: Todo aque-
llo que produzca un cambio. Y con ello admite que el sexo, la edad, el
sitio donde nacimos, a pesar de que son caractersticas que no podemos
modificar o someterlas a un experimento, pueden ser catalogadas como
causas. Observe que le hablamos de poder exponer nuestros factores a
un experimento (definicin de causa contrafactual). Es aqu donde los
epidemilogos se dividen entre aquellos que afirman que una relacin
puede ser causal si es posible someter el factor causal a un experimento,
y entre aquellos que no se fundamentan en el paradigma experimental
para darle piso a sus argumentos causales.
Produccin Las causas son condiciones que juegan un pa-

pel esencial en la produccin de la ocurrencia
de una enfermedad.
Causas necesarias Es una condicin sin la cual el efecto no pue-

de ocurrir, por ejemplo la infeccin con VIH
es la causa necesaria del SIDA.
Causas componentes Una causa suficiente garantiza que el efecto

suficientes ocurra. Cuando la causa es presente, el efecto
debe ocurrir. Una causa suficiente est com-
puesta de varias causas insuficientes, ninguna
de las cuales por si sola podra producir la en-
fermedad. Esta slo se presenta cuando todas
estn presentes.
Causa probabilstica Es una causa que incrementa la probabilidad

de que el efecto ocurra. No necesita ser nece-
saria ni suficiente.
Causa contra factual Es una causa que hace diferencia en el efec-

to cuando est presente, comparada a cuando
est ausente, mientras todo lo dems se man-
tiene constante. No necesita ni ser necesaria
ni suficiente.
Tomado de Parascandola y Weed, 20019.

Pero ms importante que saber qu es una causa, es saber cmo reco-

nocerla.
En la mayor parte del proceso de conocimiento etiolgico, pasamos de

la inferencia estadstica (encontrar una asociacin) al de inferencia causal (decir
qu es una causa). Aunque a veces se superponen, representan principios
distintos.
Los test estadsticos formales, de los que hablaremos ms adelante,

estn diseados de forma tal que:
- den respuestas matemticas a preguntas estructuradas, de manera

que
- esas respuestas conduzcan a un juicio.
En el proceso de inferencia causal, los epidemilogos recurren a los

criterios causales, que son principios tiles para establecer un juicio
sobre si una asociacin es causal o no. En este proceso se ha pasado
del determinismo puro de los postulados de Koch, y de los mode-
los nicos de causalidad, a formas de causalidad ms compleja, tales
como las defini inicialmente Austin Bradford Hill (ver recuadro). Pero
cuidado! Estos criterios no se deben usar como una lista de chequeo;
diferentes autores le dan distinto valor a cada uno de ellos, ms peso
o menos, segn la pregunta de investigacin y segn los valores de los
investigadores.
Ejercicio 5
Recuerda cules son los postulados de Koch?
Podra explicar por qu ya no son suficientes dichos postulados

para explicar las causas de las enfermedades?
Consulte las formas de causalidad propuestas por Bradford Hill.
Adicionalmente, Mervin Susser ha sugerido otras cuatro estrategias

(adems de los criterios de causalidad) para garantizar que nuestros
factores o exposiciones se puedan juzgar como posibles causas: simpli-
ficar las condiciones del diseo y buscar mayor rigurosidad, buscar el
posible efecto de confusin, elaborar asociaciones analticas, as como
usar tests de significancia y anlisis de poder. Todo esto lo trata la epi-
demiologa y en este texto usted se topar con todos estos elementos.
Complementacin entre la epidemiologa y la vida real

en la clnica
En cualquier campo en donde usted ejerza como trabajador de la salud,

se ver abocado:
- A responder a preguntas no estructuradas,
- A pasar de un juicio a una decisin y a una implementacin poste-

rior de tal decisin en un tiempo corto.
Los procesos de inferencia epidemiolgicos toman mucho tiempo des-

de cuando se hace una pregunta hasta el momento en que se le encuen-
tra una respuesta a tal pregunta. En la vida de un clnico no es posible
darse ese lujo. Una cosa es planear un estudio y llevarlo a cabo, y otra
decidir (como lo hace un cirujano con un paciente que se deteriora muy
rpido en un servicio de urgencias o uno de cuidado intensivo). El de-
safo para todos se centra en cmo encontrar que la investigacin, que
toma tanto tiempo, eventualmente le pueda ayudar a pacientes y mdi-
cos bajo la presin de la vida diaria a que las decisiones que se toman,
en apariencia de manera intuitiva, no sean tanto el producto de la intui-
cin del profesional, sino el producto de muchas reflexiones y estudios
que se han sistematizado de manera tal que los conocimientos vengan a
la mente de manera casi automtica bajo circunstancias adversas.
Hill, emulando a Popper, dice que todo trabajo cientfico es susceptible

de modificacin en la medida en que surja nuevo conocimiento. Pero
nunca debemos esperar lo ideal que pueda traer el futuro al estar cons-
cientes de nuestra limitacin de hoy. Debemos trabajar con lo bueno
de hoy. De otra manera. Lo mejor hipottico del futuro es enemigo de
lo bueno real de hoy.
Segn Susser, Rothman, Hill
1. Fuerza de asociacin. Hill cita el ejemplo de la observacin hecha por

Percival Pott segn la cual los limpiadores de chimeneas del viejo
Londres tenan una mortalidad 200 veces mayor a causa del cncer
de escroto que otros trabajadores no expuestos al holln o a aceites
minerales. Este 200 veces mayor, y no 2 veces, mayor es el que
hace la diferencia entre una asociacin fuerte o menos fuerte.
2. Consistencia en la repeticin. Cuando 1 000 artculos cientficos mues-

tran que existe asociacin entre el consumo de alcohol y los ac-
cidentes de trnsito, o que entre el consumo del tabaco y el desa-
rrollo del cncer del pulmn se puede establecer con ms certeza
una relacin de causalidad, no basta slo replicar los estudios de
la misma manera en diferentes sitios, sino poner las hiptesis a
prueba en diferentes circunstancias y cada vez hacindolo mejor
para ver si estas hiptesis se mantienen. Es decir que la causa debe
sobrevivir a exmenes que son cada vez ms rigurosos y a diferen-
tes tipos de pruebas de asociacin.
3. Especificidad. Cuando la asociacin descrita se limita a trabajadores

especficos, de sitios especficos y ciertas formas de enfermedad,
y cuando adems no existe asociacin entre esta forma de trabajo
y otras formas de morir, uno puede hablar de causalidad, lo cual
implica que una enfermedad tiene una sola causa o que una causa
tiene un efecto nico.
4. Secuencia temporal claramente establecida. Ciertas formas de dieta tie-

nen que preceder a ciertas formas de cncer del estmago para
que uno pueda hablar de asociacin y de causalidad. Por ejemplo,
el uso de sales nitradas de la carne o la falta de fibra en el cncer
del colon, no que como consecuencia de dicho cncer, el paciente
se vuelva intolerante a la lactosa de la leche, deje de tomarla y se le

atribuya errneamente a la falta de leche la aparicin del cncer.
5. Gradiente biolgico. Debe haber evidencia de la existencia de una

curva dosisrespuesta. Por ejemplo, que el nmero de cncer de
pulmn aumente segn el nmero de cigarrillos fumados, o que el
infarto sea ms frecuente en personas con ndices de masa corpo-
ral mayores. Sin embargo, no se puede descartar que asociaciones
que tienen forma de U sean tambin causales. Por ejemplo, los
individuos ms desnutridos y los ms gorditos se mueren ms que
aquellos que tiene un peso normal.
6. Plausibilidad. Si la explicacin encaja en los modelos biolgicos ac-

tuales, es ms probable que exista una asociacin causal.
7. Coherencia de la explicacin. La asociacin no debe estar en conflicto,

es decir, no debe contradecir lo que se sabe de la historia natural y
la biologa de la enfermedad.
8. Experimento. En algunos casos puede existir un experimento natu-

ral que arroja luz sobre un tema. La presencia de bocio en pobla-
ciones que viven en lugares donde los niveles de yodo en el agua
son bajos, o de ms fluorosis o menos caries segn los niveles de
flor en el agua consumida por una comunidad.
9. Analoga. Hill cita el caso de la talidomida y de la rubola como

causa de anomalas congnitas, asociaciones que han sido demos-
tradas. Con seguridad, entenderamos mejor si otra enfermedad
viral u otros medicamentos produjeran casos similares, que si es-
tos casos no se hubieran presentado.
Prevencin y promocin
La prevencin primaria tiene como objetivo lograr la reduccin de la
incidencia de la enfermedad (bsicamente que aparezcan nuevos casos)
por medio de inmunizaciones, el saneamiento, la educacin y diversas
formas de eliminar la contaminacin del medio ambiente con agentes
patgenos. Este concepto de prevencin primaria no se puede separar
del de promocin de la salud, que tiene como objetivo preservar el
nivel de salud de una comunidad, informarla y capacitarla para que ella
misma ejerza un mayor grado de control sobre su salud, as como esti-
mularla a practicar estilos de vida saludables.
La prevencin secundaria tiene como objetivo la deteccin temprana y

el tratamiento precoz de las enfermedades o de los factores de riesgo.
La prevencin terciaria tiene como objetivo reducir las complicaciones

de las enfermedades y la mejora del nivel de funcionalidad del paciente
por medio de tratamientos paliativos y de la rehabilitacin.
Mire ahora estos conceptos:

Periodo de prepatognesis. Ocurre antes de que los precursores (los

causantes?) de la enfermedad (bacterias, virus) se hayan puesto en con-
tacto con el husped (la persona que sufre de la enfermedad).
Periodo de patognesis. Cuando los precursores han actuado con el

husped, un evento que se marca con la aparicin inicial de la enferme-
dad, (el estadio presintomtico), por ejemplo las masas que se detectan
durante un examen de abdomen, o las que aparecen en las mamografas
(patrones tempranos).
Periodo de incubacin. Al considerar las enfermedades infecciosas agu-

das hablamos de periodos de incubacin, es decir, de los intervalos que
transcurren entre la invasin del agente y el desarrollo de los sntomas
de la enfermedad.
Ejercicio 6
Cules de las siguientes intervenciones no se ajustan a los objetivos de

la prevencin primaria?
a. Vacunacin contra el virus del papiloma humano a todos los alum-

nos de 9 grado.
b. Fluorizacin del agua consumida por una comunidad donde los

niveles de agua del acueducto son bajos.
c. Toma de la citologa vaginal.
d. Fisioterapia domiciliaria para prevenir el desarrollo de lceras de

decbito y contracturas en un anciano que ha sufrido un accidente
cerebrovascular.
e. Campaa a travs de medios masivos (radio, TV, prensa, etc.) para

disminuir la incidencia de accidentes de trnsito.
Ejercicio 7
Suponga que usted vive en una regin donde la carne de cerdo hace
parte de la dieta tradicional. Si usted tuviera que escoger la medida de
prevencin primaria ms efectiva (solo una) para evitar la aparicin de
nuevos casos de neurocisticercosis, cul escogera?
La tica: un aspecto central de la epidemiologa actual

Hasta hace poco los problemas de salud pblica haban sido tradicio-
nalmente solucionados con mejor higiene. La mayora de las enferme-
dades hoy son crnicas y degenerativas; existen varios factores contri-
buyentes, algunos de los cuales tienen que ver con estilos de vida que
han causado dao por haberse practicado durante aos. Surge entonces
un desafo grande para la epidemiologa y para la salud pblica: Cmo
decir lo que debemos hacer o evitar sin que se convierta en prdica lai-
ca, en un moralismo mdico, cuando como mdicos fuimos llamados
a consolar ms que a juzgar; cuando la promocin de la salud se presta

para que muchos ofrezcan soluciones simplistas?
Cmo investigar factores de riesgo? Lo hacemos a travs de estudios

experimentales que son los ms prestigiosos entre los residentes de
epidemiologa, como si los dems no sirvieran, o a travs de estudios
intervencionales? En algunos casos no haremos intervenciones porque
no es prctico; en otros, y esto es esencial, porque no es tico.
Por ejemplo, sabiendo todo lo que sabemos de lactancia materna y sus

beneficios, no se justificara averiguar, a travs de llamadas telefnicas
diarias de la madre, por qu hoy el nio dej de mamar y dejarla sin
intervencin que le ayude a solucionar el problema. Nadie podra ser
expuesto hoy a ciertos niveles de plomo a ver qu pasa. Y esperemos
que una tragedia como la de Tuskegee no se vuelva a repetir.
Ejercicio 8:
Podra usted decir en qu consisti la historia de Tuskegee?
Podra algo similar ocurrir hoy?
La epidemiologa es cambiante
Note todas las infecciones que han aparecido desde cuando uno de
nosotros se gradu de mdico (JO), hace ms de 30 aos:
SARS, enfermedad de los legionarios, Marburg, bola y todos los filo-

virus, virus del Nilo, los virus lentos que desaparecieron para dar lugar
a los priones; la resistencia bacteriana, el SIDA, Machupo, VIH y sus
primos, los retrovirus HTLV1 y HLTV2, un tema en el que era experto
Abraham Blank, uno de los alumnos del curso de maestra de epide-
miologa de la Universidad del Valle, en 1995.
La malaria persiste y se vuelve difcil de tratar. La tuberculosis reapare-

ce con fuerza, hay resistencia extrema a los medicamentos en muchos
casos de tuberculosis en Sudfrica y en otras partes del mundo. Se vuel-
ve obligatorio investigar si esta enfermedad est asociada o no con el
SIDA. Los papilomas acuminados ya no son una enfermedad menor
que se cura con podofilina, el virus que los causa es el responsable del
cncer de cuello uterino de muchas mujeres, y del cncer de garganta
en otras.
Se caen todos los andamios que nos daban la falsa seguridad; el cono-
cimiento y la realidad se transforman y la epidemiologa tambin. Ah
est el desafo para quienes leen este libro y para las nuevas generacio-
nes.
Qu no es la epidemiologa
En muchos ambientes mdicos se ha querido desplazar la enseanza de
la epidemiologa tradicional y cambiarla por la epidemiologa clnica,
una rama complementaria de la epidemiologa que ha aportado muchos

elementos de anlisis pero que por momentos se ha convertido, en
manos de algunos, en una camisa de fuerza. La epidemiologa clnica
y la medicina basada en la evidencia no pueden ser ignoradas. Pero no
remplazan a la epidemiologa como tal.
La epidemiologa no es bioestadstica, pero sin ella no funciona.
La epidemiologa no es salud pblica, pero sera difcil entender a un

epidemilogo, aun al ms terico de ellos, que se atreva a decir que no
tiene que ver con la salud pblica.
La epidemiologa no sobrevivira seriamente sin antropologa, historia,

geografa, economa, ni las dems ciencias sociales.
Por fortuna, nos lleg la poca de la duda y el rescate del valor de las
ciencias sociales, que entre nosotros los mdicos haban sido miradas
con sospecha.
En resumen:
La epidemiologa:
Ordena.
Da contexto histrico, geogrfico y cultural.
Define.
Disea.
Usa las estadsticas permanentemente.
Usa los programas de cmputo e ingeniera de sistemas para vol-

verse gil en el aporte y anlisis de datos.
Se nutre de y nutre la salud pblica y la medicina, acoge la epide-

miologa clnica y la acepta, se complementa con ella y la pone en
duda.
Respuestas del Ejercicio 6
Las respuestas correctas son c y d.
- La citologa vaginal es un procedimiento que se lleva a cabo para

demostrar precozmente el cncer cervical, y es un examen de pre-
vencin secundaria, como lo sera tambin la toma de una mamo-
grafa.
- La fisioterapia, aunque sea hecha en casa y no en un hospital de

tercer nivel, es un tratamiento de prevencin terciaria, es decir,
uno tendiente a reducir las complicaciones de una enfermedad
que ya se manifest. Recuerde adems que la pregunta se refera a

prevencin primaria y no a atencin primaria.
Respuestas del Ejercicio 7
Si su respuesta fue matar a todos los cerdos, o prohibir el consumo

de carne de cerdo, o aun cocinar mejor la carne de cerdo lo cual
tambin se debe hacer, lo invitamos a revisar de nuevo el tema. La
cisticercosis cerebral usualmente se adquiere a travs del consumo de
aguas o verduras lavadas con agua contaminada con heces de cerdo,
en las que estn presentes los huevos de la tenia. As mismo, podran
adquirirla a travs de la ingestin de huevos Tenia Solium, presentes
en las mismas heces de personas parasitadas que no se lavan las manos.
Para evitar la cisticercosis se recomienda aislar las cocheras, los cerdos
y sus excrementos de las fuentes de agua de consumo humano, en es-
pecial las usadas en el riego de las verduras y los alimentos, y lavar bien
las manos, las verduras y los alimentos. No vaya a sacrificar innecesaria-
mente a los animalitos y, a no ser que sea vegetariano o su religin no
se lo permita, siga disfrutando de la carne de cerdo, cocnela bien, pero
sin necesidad de quemarla para matar los cisticercos.
Bibliografa
1. Smith, G.D. (2001). The uses of Uses of Epidemiology. Int. J.

Epidemiol, 30 (5): 1 1461 155.
2. Gakidou E., Oza S., Vidal Fuertes C., Li A.Y., Lee D.K., Sousa A.,
Hogan M.C., Vander Hoorn S., Ezzati M. (2007). Improving child
survival through environmental and nutritional interventions: the
importance of targeting interventions toward the poor. JAMA,
298 (16): 1 8761 887.
3. DAgostino R.B., Russell M.W., Huse D.M., Ellison R.C., Silbers-

hatz H., Wilson P.W., Hartz S.C. (2000). Primary and subsequent
coronary risk appraisal: new results from the Framingham study.
American Heart Journal, 139 (2 Pt 1): 272281.
4. Stallones R.A. (1980). To Advance Epidemiology. Annual Review of

Public Health, 1 (1): 6982.
5. Davey Smith G., Ebrahim S., Lewis S., Hansell A.L., Palmer L.J.,
Burton P.R. (2005). Genetic epidemiology and public health: hope,
hype, and future prospects. Lancet, 366 (9 495): 1 4841 498.
6. Pearce N. (2007). Commentary: The rise and rise of corporate

epidemiology and the narrowing of epidemiologys vision. Int. J.
Epidemiol, 36 (4): 713717.
7. Rehle T., Lazzari S., Dallabetta G., AsamoahOdei E. (2004).

Secondgeneration HIV surveillance: better data for decision
making. Bulletin of the World Health Organization., 82 (2): 121127.
8. Susser M. (1991). What is a cause and how do we know one? A

grammar for pragmatic epidemiology. American journal of epidemio-
logy, 133 (7): 635648.
9. Parascandola M., Weed D.L. (2001). Causation in epidemiology.

Journal of epidemiology and community health, 55 (12): 905912.
Lecturas recomendadas
1. Estudio de Framingham. Disponible en: http://www.nhlbi.nih.

gov/about/framingham/index.html
2. Presentaciones de Hans Rsling. Disponible en: http://www.gap-

minder.org
Lecturas adicionales sugeridas
1. Last J.M. (200). A dictionary of Epidemiology. London.
2. Organizacin Panamericana de la Salud. (1988). Desafo de la Epi-

demiologa: Problemas y lecturas seleccionadas. Washington: Au-
tor.
3. Teutsch, S.M., Churchill, R.E. (1994). Principles and practice of

public health surveillance. Oxford University Press.
4. Lpez A.D., Mathers C.D., Ezzati M., Jamison D.T., Murray C.J.
Global and regional burden of disease and risk factors, 2001: sys-
tematic analysis of population health data. (2006). Lancet, 367 (9
524):1 7471 757.
5. Kuhn Thomas S. (1962). The Structure of Scientific Revolutions,

The University of Chicago Press, Chicago, Illinois, USA.
6. Popper Karl. (1959). The Logic of Scientific Discovery (translation of

Logik der Forschung). Hutchinson, London.
7. Popper Karl. (1963). Conjectures and Refutations: The Growth of

Scientific Knowledge. Routledge, London.
8. Durkheim Emile. Le suicide. (1966). Etude de Sociologie. Nouvelle

dition. Presses Universitaires de France.
3. Lenguaje Estadstico Bsico
Qu es, para qu sirve y cmo se usa la bioestadstica

La bioestadstica es la rama de la estadstica que aplica los razonamien-
tos y los mtodos de la estadstica para ayudar en la toma de decisiones
sobre fenmenos naturales, dentro de los cuales estn los de salud y
enfermedad y, en general, todos los que le conciernen a la biologa y la
medicina, a la salud pblica y a la epidemiologa.
Principio de parsimonia
La estadstica busca encontrar la forma ms simple de presentar los
fenmenos y la interrelacin ms directa entre las variables estudiadas
para poder dar explicaciones sobre los hechos observados y generar
hiptesis sobre mecanismos causales. Todo eso lo hace con un cierto
orden.
Estadstica descriptiva y estadstica de inferencias:
Dos tipos de estadstica?
Se dice que existe una estadstica descriptiva y una estadstica inferen-
cial, de igual forma que al hablar de diseos se habla de estudios des-
criptivos y de estudios analticos.
La estadstica descriptiva tiene como funcin organizar y describir

las observaciones hechas para poder empezar a detectar patrones
de comportamiento de los datos; esto es lo que le corresponde a
los estudios descriptivos.
La estadstica de inferencias sirve para sacar conclusiones al valo-

rar la fuerza de la evidencia a favor o en contra de una hiptesis y
para la evaluacin de los datos.
La principal razn de ser de esta divisin entre lo descriptivo y lo anal-

tico es funcional. Se busca con ello entender mejor los diversos objeti-
vos de la estadstica en la solucin de las preguntas planteadas segn el
momento y el tipo de pregunta de que se trate.
Estadstica descriptiva y sus funciones

Mediante la estadstica descriptiva se hace una exploracin inicial de
los datos, se organizan y se resumen de manera que sea ms fcil ver
los fenmenos que se destacan. Ya sea que se trate de datos iniciales
desorganizados, o ya organizados en cuadros o grficas, la funcin es
la misma: obtener una impresin visual y descubrir patrones que nos per-
mitan generar hiptesis.
Mediante la exploracin inicial es posible ver qu tanto toman los datos

la forma de la curva normal, si se sesgan hacia un lado o hacia otro, si
hay datos muy alejados de los dems o datos raros, como si no perte-
necieran al resto (los outliers).
La inferencia estadstica
Si mediante la estadstica descriptiva se generan hiptesis, mediante el
proceso de inferencia estadstica estas hiptesis se ponen a prueba para confirmarlas
o rechazarlas.
Es decir, a travs de los mtodos de la inferencia estadstica:
Es posible llegar a conclusiones sobre toda una poblacin a partir

de una muestra obtenida de esa poblacin,
Es posible valorar la fortaleza de la evidencia a favor de una hip-

tesis entre dos o ms hiptesis que compiten entre s para ver cul
es la que mejor explica, y
Es posible hacer comparaciones y predicciones.
Mediante la inferencia estadstica se trata de hacer conjeturas sobre cul

es la ms probable entre las opciones consideradas.
Fjese bien que se trata de conjeturas lgicas que nos ayudan a tomar
decisiones estadsticas, pero nunca podremos estar seguros 100% de
las conclusiones.
Note tambin que las decisiones que se toman mediante la estadstica

son decisiones estadsticas y solamente estadsticas; solo tendrn valor
prctico en la medida en que hagan parte de un razonamiento ms
integral con la ciencia o el arte que sirven. Las estadsticas no pueden
remplazar el juicio crtico ni la lgica de cada ciencia y cada experiencia
humana.
Variabilidad
Mediante la estadstica cuantificamos la variabilidad existente entre los

datos y nuestra falta de certeza.
En el captulo correspondiente a los sesgos y factores de confusin

detallaremos cules son las principales fuentes de variabilidad de los
datos; por ahora las mencionaremos:
Variacin natural. Por ejemplo hay ms gordos y ms flacos en

todas las poblaciones, o ms altos y ms bajos.
Variacin de las mediciones (error).
Sesgos que resultan en una diferencia entre el valor esperado de

una medida y su verdadero valor.
La interrelacin existente entre variables se puede deber simplemente a

asociaciones o, por el contrario, a conexiones causales, tambin.
Tipos de variables segn la estadstica

Segn la escala de medicin usada, las variables son esencialmente de
dos tipos: cuantitativas y cualitativas.
Las variables cuantitativas se refieren a nmeros o cantidades.
Estas variables cuantitativas pueden ser:
- Discretas: cuando quedan espacios entre los valores de los con-

teos, es decir, cuando los decimales no tienen en s significado:
sera el caso del nmero de muertos, este es siempre entero. Sin
embargo, aunque medio muerto o medio pulso no signifiquen
nada, s se pueden sacar promedios del nmero de muertos, o de
los pulsos de un grupo o de una persona tomados en diferentes
ocasiones.
- Continuas: cuando no dejan dichos huecos, porque es posible

encontrar siempre otros nmeros entre dos valores enteros conse-
cutivos, decimales o fracciones que tienen sentido, como cuando
se mide la estatura, el peso, la presin arterial o la temperatura.
Variables cualitativas. Tambin llamadas categricas o de atribu-

tos.
Estas, a su vez, pueden usar escalas diferentes:
- Escala nominal. Raza, etnicidad, sexo.
- Escala ordinal. Aqu las variables tienen un rango, un orden, por

ejemplo: rangos militares, niveles de educacin, de ingreso, estrato
social, por ejemplo de 1 a 5. Aunque se les asignen nmeros a los
distintos niveles de estas escalas, hay que tener cuidado para no ir
a sacar promedios o clculos estadsticos de ellas, para no terminar
dndoles un significado numrico que no tienen.
Anlisis exploratorio de los datos

La impaciencia propia de los seres humanos, con frecuencia nos lleva
a querer hacerle a los datos pruebas estadsticas y anlisis complejos
(por ejemplo, obtener pes de significancia) antes de hacer un anlisis
inicial, como cuando usted va a explorar nuevos terrenos. Nosotros le

aconsejamos que primero observe los datos y se familiarice con ellos.
Cercirese de que no haya inconsistencias, datos faltantes, anomalas o
datos que no encajan.
Forma de organizar los datos

Una vez se hayan recogido los datos de la encuesta o del experi-
mento, es necesario hacer una exploracin inicial de los mismos
mediante el uso inteligente de medidas cuantitativas, de grficas y
tablas apropiadas.
Solo entonces:
Se anticipan patrones mediante el clculo de probabilidades, que

son distintos si las variables son continuas o son discretas.
Se formulan hiptesis.
Se hacen inferencias estadsticas mediante la estimacin y puesta a

prueba de las hiptesis.
Entonces, la epidemiologa descriptiva y la analtica se diferencian bsi-

camente en que la Estadstica Descriptiva se encarga de mostrar los datos,
y la Estadstica Analtica se refiere a las pruebas usadas para saber cmo
estn relacionados los datos entre s.
La primera parte de la estadstica descriptiva trata de las medidas y aqu

mencionaremos solo las de la distribucin normal, ya que las dems las
veremos en detalle en el captulo correspondiente.
Distribuciones y frecuencias
Observe los siguientes datos de las pulsaciones por minuto de los estu-
diantes de grado 9 A de un colegio de Bogot, despus de darle cinco
vueltas a la manzana del colegio y descansar durante cinco minutos.
79 68 74 91 68 65 90 80 80
69 76 78 92 86 62 70 70 63
64 75 81 84 75 75 79 66 71
66 62 71 100 88 90 64 72 74
84 65 66 82 83 62 77 74 66
Usted sabe que el pulso de su hijo es de 72 por minuto, pues se lo hace

medir cada vez que termina de hacer sus ejercicios diarios. Pero si desea
saber si dicho pulso est por encima o por debajo del promedio del
grupo, le costar algo de trabajo hacerlo rpidamente slo con mirar
los datos que se presentan arriba.
Observe ahora los mismos datos ordenados:
62 62 62 63 64 64 65 65 66
66 66 66 68 68 69 70 70 71
71 72 74 74 74 75 75 75 76
77 78 79 79 80 80 81 82 83
84 84 86 88 90 90 91 92 100
Le resulta ms fcil saber dnde est situado su hijo en comparacin

con los dems? Posiblemente s porque ahora con los datos ordenados,
se da cuenta cmo estn distribuidos, cules son los menores y los ma-
yores, y cules dentro de esa distribucin se repiten con ms frecuencia
y a qu distancia se encuentran del promedio.
Distribucin es entonces la forma ordenada de presentar los datos para

entenderlos mejor, saber cul es la frecuencia de cada dato y cmo se
comporta dentro de esa distribucin.
Medidas usadas en las distribuciones normales

Medidas de tendencia central
Son aquellas medidas alrededor de las cuales se agrupan los datos de

una distribucin e incluyen el promedio, la mediana y la moda.
El promedio es la suma de todos los valores dividida por el nmero de

valores a partir de los cuales se calcula la suma.
La mediana o punto central es el valor situado exactamente en medio

de la secuencia cuando los datos se organizan del menor al mayor o a
la inversa. En otras palabras: la mediana es el resultado por encima del
cual y por debajo del cual se encuentran la mitad de los valores de una
secuencia. La mediana tambin es conocida como el Percentil 50. En
el caso de que los valores sean un nmero par, la mediana se calcula
como el promedio de los dos valores centrales.
La moda es el resultado que ms se repite dentro de una secuencia.

Puden existir una o varias modas.
Medidas de dispersin
Las medidas de dispersin son aquellas que describen la variacin de
los datos de una distribucin. A travs de ellas se intenta describir qu
tanto se alejan los datos de las medidas centrales.
Dichas medidas incluyen: el rango, la desviacin estndar y la varian-

za.
El Rango es la diferencia existente entre el dato ms alto y ms bajo

de la distribucin.
La Desviacin Estndar (S) y su cuadrado, la Varianza (S2), son

medidas de dispersin alrededor del promedio. Como es obvio, la des-
viacin estndar es la raz cuadrada de la varianza.
(x1 - ) 2
S= (coloque una __ encima de la segunda X. para significar promedio)
n-1
El Error Estndar del Promedio (EE) es una medida comnmente usa-

da en estadstica para determinar los lmites de confianza de una mues-
tra. El EE es la desviacin estndar de la distribucin de los promedios
de las muestras de una poblacin, y corresponde a la frmula:

EE =
n
Una curva normal se puede describir adecuadamente con una medida

de tendencia central y una medida de dispersin.
Medidas de posicin
Al describir las medidas de tendencia central mencionamos la media-
na. Aunque la mediana en realidad describe una tendencia central, en
sentido estricto tambin es una medida de posicin y como tal debera
ser considerada.
Las medidas de posicin son comnmente conocidas como percentiles,

a los cuales se les asigna el nmero del lugar que ocupan al ordenar la
serie.
En una poblacin terica de 100 datos:
Percentil 1 significa que de los 100 datos, solamente 1 est por

debajo de ese punto.
Percentil 5 indica que de los 100 datos, solamente 5 estn por de-
bajo de ese punto. Por supuesto, 95 estn por arriba.
Percentil 50 indica que exactamente la mitad de los datos estn por

arriba de ese punto y la mitad por debajo. Es el punto situado en la
posicin de la mitad, o sea la mediana.
Percentil 95 significa que de los cien datos, 95 estn por debajo de

ese punto y solamente 5 por encima.
Hay otros percentiles comnmente usados llamados los cuartiles.
Cuartil 1 (Q1) por su denominacin en ingls Quartile, tambin

llamado Percentil 25.
Cuartil 2 (Q2), que corresponde a la mediana o percentil 50.
Cuartil 3 (Q3) tambin conocido como Percentil 75.
Como veremos ms adelante, dichos cuartiles se pueden representar

grficamente mediante las cajas de bigotes. Los cuartiles permiten cal-
cular otra medida de dispersin til: la distancia intercuartiles, que es
la diferencia entre el tercer cuartil y el primero. Los percentiles 10, 20,
30.. 90 tambin se llaman deciles. Ya es fcil adivinar cmo se lla-
man los percentiles 20, 40, 60,80.
Aclaracin importante:
Medidas de posicin (como los percentiles) no son lo mismo ni equiva-

len simtricamente a las medidas de dispersin (como las desviaciones
estndar). Es necesario entender su diferencia y su uso.
Ya aclararemos esto en ms detalle al hablar de puntajes Z. Por ahora

es importante que entienda que:
Los percentiles no son equivalentes a las desviaciones estndar.
Uno de los percentiles se llama el percentil 50, es igual a la mediana, y

como veremos coincide con el puntaje Z de cero. Pero a diferencia de
las desviaciones estndar, que son simtricas a la derecha o a la izquier-
da del punto medio, el hecho de que la mitad de individuos medidos se
encuentre en los percentiles por encima de la mediana y la mitad por
debajo de ella, no implica simetra.
Grficas
Para resumir los datos, apelamos a grficas y tablas.
Quienes leen los textos y los reportes ignoran cunto trabajo hay antes
de que les entreguen los datos organizados. No saben que detrs de la
recoleccin y organizacin de los datos est, en gran parte, el secreto
del aprendizaje. La organizacin de los datos para ver qu muestran en
la mirada inicial sirve para que uno se familiarice con ellos y se atreva
a exponer las primeras teoras. De ah tambin la importancia de lo
visual.
Qu le mira uno a los datos

El centro de la distribucin dado por la mediana.
Cmo y cunto se dispersan.
La forma de la grfica, su simetra, nmero de picos, desviacio
nes o asimetras (Skewness).
Uniformidad de los datos y la existencia de datos por fuera de
los dems, es decir, los raros (outliers).
Primera mirada de los datos en las grficas
Centro de la distribucin Dispersin de la distribucin Simetra: simtrica, unimodal

de la mediana en forma de campana
Asimetra: (Skewness)
Desviada a la izquierda
o desviada a la derecha Asimetra bimodal Simetra bimodal
Espacios entre los Datos lejanos de los dems outliers

datos
La forma ms conocida de distribucin de los datos es la de las curvas

normales, cuando son perfectamente normales toman la forma de
campana totalmente simtrica, la campana de Gauss a la cual le dedi-
caremos un captulo. Pero no siempre los datos se distribuyen de forma
normal, en especial si se trata de nmeros pequeos. Es lo primero
que uno debe observar: Toman los datos una distribucin normal o
cercana a la normal?
Antes de hacer las grficas puede uno ir haciendo conteos y ubicando

resultados con palotes, o simplemente los puede ir situando en ciertos
puntos de cada decimal entre ciertos valores e ir especificando. Este es
el mtodo sugerido por Tukey, llamado en ingls Stem and leaf plots, el
grfico de tronco y hojas.
Troncos y hojas del rbol

El mtodo de troncos y hojas de Tukey se usa para exhibir visualmente
datos cuantitativos cuando la cantidad de estos no sobrepasa los cin-
cuenta. El objetivo es poder discriminar en ms detalle los datos.
Ejemplo: Puntajes obtenidos por 34 alumnos de la escuela de Medi-

cina de la Universidad del Valle en las pruebas de conocimientos de
nutricin infantil.
Las calificaciones van de 0 a 50.
Cada nmero de las hojas, separados por comas, identifica pues el pun-
taje (unidades) que alcanz cada alumno dentro de la decena corres-
pondiente. As, en la parte del tronco con la decena 50 solo hay un
alumno que obtuvo 50, el puntaje mximo, del cual tomamos el cero
final y lo ponemos como una nica hoja de esa parte del tronco. Si otro
alumno hubiera obtenido 50, hubiramos colocado en esa fila 0,0.
Tronco Hojas
50 0
40 a 49 0, 0, 4, 4, 5, 5,6 , 7, 7,7,7, 8, 8, 8
30 a 39 1,1,1,2,4,5,5,5, 6, 6, 9,9,9
20 a 29 7,8, 8, 8, 9
10 a 19 9
0 a 9
Miremos ahora las hojas que se desprenden del tronco en la rama co-
rrespondiente a los estudiantes que consiguieron puntajes entre 40
y 49: hubo dos que obtuvieron 40, representados por 0,0; luego dos
alumnos con 44, representados por 4,4; en seguida dos que lograron
45, representados por 5,5; uno que obtuvo 46, representado por el 6;
cuatro con 47 representados por los cuatro 7, 7, 7, 7 y tres con 48, re-
presentados por 8, 8, 8. Podramos hacer el mismo ejercicio para cada
rama del tronco y sus hojas respectivas. Ya que nadie obtuvo puntajes
por debajo de 9, en la casilla correspondiente a esa rama no colocamos
ningn nmero.
Para quienes gustan de los colores, la siguiente es una versin ligera-

mente diferente de la misma grfica de tronco y hojas.
Tronco Hojas
5 0
4 00445567777888
3 11124555 66999
2 78899
1 9
0
Note que en esta ocasin en el tronco hemos omitido los ceros de las
decenas. Esta manera de presentar los datos nos da ms detalles que los
que obtendramos con un grfico de barras en el cual los datos estn
organizados por grupos, pero uno no sabe cmo discriminar los valo-
res dentro de esos grupos.
50
40 - 49
30 - 39
20 - 29
10 - 19
0-9
Histograma y grfico de barras

Se haba preguntado alguna vez cul es la diferencia entre un histogra-
ma y un grfico de barras?
Grfico de Barras: Histograma:
Cada columna presenta un grupo definido Cada columna presenta un grupo definido
por una variable categrica por una variable cuantitativa
Acc
por
Ao
Cali Quito Oslo Estocolmo 15-19 20-29 30-49 50-70

Grupos de edad de accidentes de moto
Medelln
En los grficos de barras las columnas representan grupos definidos

por variables categricas. En los histogramas, las columnas representan
grupos definidos por variables cuantitativas.
BoxWhiskers Plot
En espaol se conocen como cajas y bigotes.
Las cajas dividen los datos en cuartiles, una de las medidas de posicin.
Los cuartiles se construyen acomodando en cuatro grupos, de menor a
mayor. Dichos grupos no tienen por qu ser simtricos, pero s deben
tener igual cantidad de datos.
El cuerpo de la caja va entre los cuartiles 1 y 3, por convencin Q1 y

Q3 del ingls, y dentro de esos Q1 y Q3 se pone la mediana Q2.
Caja central y bigotes de gato: No necesariamente simtricos

Outlier ms grande.
Outlier (punto lejano) Punto lejano ms grande.
ms pequeo. Uno de los pelos de gato.
Q1 Q2 Q3
Mediana
Adicionalmente, las cajas y bigotes de gato incluyen dos medidas de

dispersin (variabilidad) de los datos:
Rango: la distancia entre el valor ms pequeo y el ms grande.
Rango Intercuartil: Q3Q1, es decir, los datos del medio, los que
estn dentro de la caja.
Los datos as expresados pueden exhibir estos patrones:
Patrones de la caja y bigotes de gato
Sesgado a la Simtrico Sesgado a la

derecha izquierda
Resumen
Medidas de dispersin
Rango
Rango intercuartil
Desviacin estndar
Varianza
Medidas de posicin
Percentiles.
Hay unos tipos especiales de percentiles llamados cuartiles Q1 o
percentil 25, Q2 llamado percentil 50 o tambin mediana, Q3
llamado percentil 75.
Puntaje Z.
Grfica de dispersin de los puntos (Scatter Plot): Una herramienta

grfica usada para exhibir la relacin entre dos variables cuantitativas.
Ya recurriremos a ella al hablar de regresin lineal. Por ahora, observe-
mos algunos patrones.
Diversos patrones de la grfica de dispersin de puntos (Scatter Plot)
Peso Relacin Lineal Pendiente positiva Relacin Lineal No hay pendiente
Un dato alejado: outlier Dos racimos con un espacio ente ellos. Peso
No hay pendiente clara
Los coeficientes de correlacin miden la fuerza de la asociacin entre

dos variables. El ms comn es el de Pearson, que mide la asociacin
lineal entre dos variables.
En los siguientes captulos seguiremos construyendo nuestro libro con

la descripcin de las herramientas que en nuestra opinin son las ms
valiosas visual y conceptualmente para entender la bioestadstica y la
epidemiologa bsicas.
Coeficiente de correlacin de Pearson (r)
r=1 r = -1 r=0
Correlacin positiva mxima Correlacin negativa mnima No hay correlacin
En los siguientes captulos seguiremos construyendo nuestro libro con

la descripcin de las herramientas que en nuestra opinin son las ms
valiosas visual y conceptualmente para entender la bioestadstica y la
epidemiologa bsicas.
4. Herramientas
1. Cuadro de Cuatro Casillas

Generalidades
Mire este cuadro:
Parece algo sencillo para alguien de su nivel educativo. No se engae.

De menospreciarlo, cometer un error. Detrs de tan pocas lneas se
esconde una de las ms verstiles herramientas estadsticas. Su uso, ya
sea aislado o en conjunto con la curva de distribucin normal, o con las
curvas ROC, puede explicar muchas frmulas y razonamientos de uso
diario. Por eso hemos comenzado con l.
Mrelo por todos los costados. Familiarcese con sus secretos. Hga-
lo parte suya. Evite presumir en algn momento, que por haber des-
cubierto algunos de sus secretos y haberle encontrado utilidad, podr
usarlo automticamente en situaciones concretas.
De qu consta el cuadro de cuatro casillas

Todo cuadro de cuatro casillas tiene dos filas y dos columnas.
Columnas
Enfermedad o evento a estudiar
COLUMNAS Enfermedad o evento a estudiar

+ -
1. En la columna de la izquierda, aqu arbitrariamente de color azul,

se pone a quienes tienen la enfermedad o sufren, o gozan, el even-
to estudiado.
2. En la columna de la derecha, aqu arbitrariamente sin color para

denotar as la ausencia de algo, se coloca a quienes no tienen la
enfermedad o evento estudiado.
Todo cuadro de cuatro casillas tambin tiene dos filas o hileras
FILAS +
- La fila superior, arbitrariamente de color rojo, es la fila de los posi-

tivos. En ella se coloca a quienes han dado positivo al hacerles una
prueba de laboratorio o a quienes se han expuesto a un factor de
riesgo, hayan desarrollado o no la enfermedad o evento estudia-
do.
- La fila inferior, sin color, representa a aquellos que dan negati-

vo en la prueba, tengan o no la enfermedad, o que no han sido
expuestos al factor de riesgo, desarrollen o no la enfermedad o
evento estudiado.
Al cruzar las columnas con las filas obtenemos las cuatro casillas. A
estas tambin las podemos llamar celdas.
Por convencin, a cada casilla se le ha asignado una letra minscula: a,

b, c, d.
Y se les llama de la siguiente manera:
a a= b b=
verdadero falso
positivo positivo
c= d=
falso verdadero
negativo negativo
c d
a = verdadero positivo. Tiene la enfermedad y el resultado de la prueba

es positivo. O si se trata del factor de riesgo, estuvo expuesto a l y
enferm.
b = falso positivo. No tiene la enfermedad, no obstante, la prueba es po-

sitiva. O si se trata del factor de riesgo, estuvo expuesto a este pero no
se enferm.
c = falso negativo. Tiene la enfermedad pero el examen para detectarla da

negativo. Si se trata de la exposicin, no estuvo expuesto y sin embargo
desarroll la enfermedad.
d = verdadero negativo. No tiene la enfermedad y el resultado de la prueba

es negativo, o no estuvo expuesto al factor examinado y tampoco tuvo
la enfermedad.
Totales marginales fijos

Los cuadros de cuatro casillas, que por razones didcticas seguiremos
pintando divididos por las lneas en forma de cruz de la mitad, tienen a
la derecha y en la parte inferior los espacios para los totales marginales,
que son los resultados de la suma de las celdas correspondientes. Estos
totales marginales, una vez se le poner unos datos, no son modificados.
Cosa que s se hace con las cifras colocadas dentro de cada una de las
celdas del cuadro cuando queremos analizar otras probabilidades, una
vez se conozcan los resultados.
Totales
de las
sumas
de las
hileras
Totales de las sumas de Totales

las columnas Globales
Tablas de contingencia
Cuando se le agregan al cuadro de cuatro casillas ms columnas o ms
hileras, hablaremos de un derivado del cuadro de cuatro casillas, que
entonces no tendr cuatro sino ms casillas y se llamar Tabla de con-
tingencia. En realidad, los cuadros de cuatro casillas tambin son tablas
de contingencia denominadas 2 x 2 solo que por ser las ms usadas, les
hemos puesto un nombre aparte.
En la tabla de contingencia (n x m) anterior tenemos dos filas y cinco

columnas. En el clculo de algunas frmulas que incluyen los grados
de libertad gl (en ingls se escribe df degrees of freedom) es necesario
tener en cuenta el nmero de filas y de columnas que tiene cada tabla
de contingencia.
Grados de libertad
La frmula para calcular los grados de libertad en las tablas de contin-
gencia es la siguiente:
Grados de libertad gl = (lneas - 1) (columnas - 1)

Como es obvio, en el cuadro de cuatro casillas el clculo de los grados
de libertad, gl = (2-1) x (2-1) siempre dar igual a 1.
Sin embargo, como veremos en su momento, los grados de libertad se

calculan de manera diferente en otras ocasiones, en las cuales los grados
de libertad sern uno menos que el tamao de la muestra. Si el tamao
de la muestra es n, los grados de libertad sern n - 1) gl = n - 1).
En los siguientes captulos le iremos mostrando diversos usos del cua-

dro de cuatro casillas y poco a poco le presentaremos otras herramien-
tas y otros conceptos.
5. Herramientas 2
Campana de Gauss
Esto sera para la mayora de las personas una campana:
Campana de ......................
Mire ahora esta curva:
A esta curva la han llamado campana de Gauss. Probablemente ya se la

han enseado muchas veces. Pero no nos critique si lo invitamos a que
la miremos de nuevo juntos. Quizs le descubra otros secretos si la mira
desde otro ngulo y con otra compaa.
Lo primero que queremos hacerle notar es que a veces la dibujan abier-

ta, como la de arriba, otras veces cerrada. Ya volveremos a ello.
Ahora, observe primero la lnea inferior, ahora pintada de rojo, que

correspondera al eje de las abscisas, y notar ante todo que existe un
punto central llamado , y la continuacin de la lnea a ambos lados,
hacia la derecha el ms infinito + , y el menos infinito - a la izquier-
da del punto central .
- +
infinito infinito
A continuacin mire la curva, que esta vez es roja. El infinito de la lnea

recta representa el comportamiento terico de la curva. No se cerrara
nunca. A esa curva que no se cierra nunca porque tiende hacia el infi-
nito sin llegar a tocar el eje inferior, se le llama asinttica. Pero eso es la
teora. En la prctica la campana, que en la teora no sera campana, se
cerrara y nos dara posibilidad de calcular los espacios (reas) incluidos
bajo la curva.
Asintnica hacia la Asintnica hacia la

izquierda derecha
Mu
Si la cerramos, como nos vemos obligados a hacerlo en la prctica,

obtendremos una campana de Gauss tambin llamada curva de distri-
bucin normal.
En realidad, la curva abierta tambin se llama curva de distribucin

normal. Se cierra arbitrariamente en 3 porque el rea a la izquierda
de -3 es tan pequea que se supone incluida entre -2 y -3 , cosa que
sucede igualmente con los valores a la derecha de +3 que se suponen
incluidos entre +2 y +3 .
Curva normal:
nos interesan los valores de
las reas representadas por
debajo de la curva
La curva normal perfecta

Una curva de distribucin normal perfecta tiene varios componentes,
todos importantes. Recuerde que estamos hablando de una distribu-
cin normal perfecta. Y que esa perfeccin, desde luego, es terica.
1) Tiene forma de campana.

2) Tiene valores comprendidos entre ms infinito y menos infinito

en el eje horizontal. 2) Es simtrica alrededor del promedio.
3) La desviacin estndar es (sigma minscula) -ya le haremos ver

la importancia de llamarla con nombre griego-, y el promedio
(mu), cuando hablamos de poblaciones (universo) y no de mues-
tras, en cuyo caso tanto la desviacin estndar (s o DS) como el
promedio se nombrarn con letras latinas.
4) La media (promedio) (mu), la mediana y la moda son iguales

entre s. Media = Mediana = Moda. De nuevo, solo cuando es
perfecta.
5) El rea bajo la curva es igual a 1 (uno). Otra manera de expresarlo

es el 100%.
32.1 32.1
Menos 1 desviacin Menos 1 desviacin

estndar estndar
Area bajo la curva entre ms 1 y menos 1 desviaciones estndar = 68.2
De ahora en adelante, cuando hablemos de poblaciones (universos),

a las desviaciones estndar las llamaremos (sigma), a la varianza 2;
ser el promedio del universo y el punto a partir del cual se empiezan
a medir hacia a la derecha o hacia la izquierda las desviaciones estndar
positivas o negativas. Y cuando hablemos de muestras de ese universo,
a las desviaciones estndar las llamaremos DS (o SD por las siglas en
ingls). Es posible que si alguien no especifica si se trata de una pobla-
cin, hable indiferentemente de o de DS. Lo importante es que usted
no se confunda y sepa qu estn describiendo los datos de la curva.
Una muestra tomada de un universo.

Aqu la desviacin estndar se llama Otra muestra tomada del
DS y el promedio, mismo universo.
pero con otras DS y otro
promedio.
-3 -2 - =0 + +2 +3
Poblacin o universo Una muestra Otra muestra

Ahora miremos los datos de las reas debajo de la curva, de cualquier

curva normal, ya sea que describa universos o poblaciones.
34.1% 34%
2.5% 2.5%
13.5% 13.5%
-3 -2 - =0 + +2 +3
Entre 0 y menos 1= 34.1% Entre 0 y ms 1 = 34%
Entre menos 1 y menos 2= 13.52% Entre ms 1 y ms 2 = 13.52%
Entre menos 2 y menos 3= 2.5% Entre ms 2 y ms 3 = 2.5%
Cambiemos ahora los colores, cuyo cdigo no es una decisin definiti-

va, y miremos que aproximadamente el rea comprendida entre las dos
mediciones centrales +1 y -1 ocupa el 68% del rea total bajo la curva.
Area de la curva comprendida entre las dos desviaciones

estndar del centro, es decir entre 1 y -1 = 68%
68%
-1 +1
rea entre , rea entre ,

y +1 y -1
rea entre
+1 y -1 34.1 + 34 68
95
rea entre
+1 y +2 , 13.5 + 13.5 27
sumada al rea
entre -1 y -2
rea entre
+2 y +3
sumada al rea 2.4 + 2.5 5 5
entre -2 y -3
50.0 50.0 100.0 10.0

Y si hacemos los clculos para los espacios comprendidos entre distin-

tas desviaciones estndar:
Clculo de diversas reas bajo la curva
13.5% 13.5%
2.5% 2.5%
-3 -2 -1 +1 +2 +3
Area entre -1 y -2 desviaciones estndar,
ms rea entre +1 y 2 desviaciones estndar = 27%
Area entre --2 y --3 desviaciones estndar,
ms rea entre +2 y +3 desviaciones estndar = 5%
La presentacin usual de la curva describe todos estos datos:

Sumas de reas bajo la curva
Entre ms 1 y menos 1 est el 68.2%
Entre ms 2 y menos 2 est el 95%
Entre ms 3 y menos 3 en total 6
desviaciones estndar est el 99.7%
0
68.2%
95%
99.7%
En trminos matemticos estrictos, por fuera de +3 y -3 queda so-

lamente el 3 por mil = 0.3%, valor que por razones prcticas al cerrar la
curva se asigna a una de las dos colas de la campana.
Tambin encontrar en la representacin de las curvas normales que

ciertos valores, como 1.96 y 1.645 en el eje de las abscisas de la parte
inferior, se repiten con frecuencia.
Ciertos valores comunes de Z
=1
0 1 2 Z
Z=1.645 Z=1,96
As como se tom = 0, ahora se toma (sigma) = 1
Distribucin Z
Los valores arriba citados se refieren a los que toman ciertas reas bajo
la curva en la Tabla de Z o Tabla de Distribucin Normal Estndar.
Una de las distribuciones normales ms usadas es la distribucin Z.
Por ahora esperamos que en adelante cada vez que mire una curva
normal recuerde que 0.025 es el rea de un lado de la curva (una de
las colas), y 0.025 del otro lado de la curva, de las verticales sobre Z =
-1.96 y Z = +1.96. Al juntarlas, estas dos reas suman 0.05, es decir 5%,
un valor recurrente en el anlisis epidemiolgico.
=1
0.025 rea a la 0.025 rea a la

izquierda de la derecha de la
vertical sobre vertical sobre
Z =1.96 Z =1.96
-1,96 +1,96 Z
Ms adelante le aclararemos el concepto de Puntaje Z, relacionado

ntimamente, pero distinto a la distribucin Z
Otros aspectos de la versatilidad de la campana de Gauss

Ahora lo invitamos a que mire otras aplicaciones de la campana de
Gauss:
rea de rechazo
+1,96 Z
Al rea en amarillo, a la derecha de Z = +1.96, tambin se le conoce

como rea de rechazo. Aqu solo muestra la cola (rea de rechazo) de
un lado, pero el rea de rechazo existe del otro lado de la distribucin
por debajo o hacia la izquierda de los valores negativos de Z = 1.96
A esta rea amarilla tambin se le conoce como el rea de la H0 o de la

hiptesis nula.
En la discusin del clculo estadstico de las diferencias entre pro-

porciones veremos cul es el origen de la palabra nulo. Por ahora,
digamos que es la hiptesis cero, es decir, aquella hiptesis que afirma
algo diferente a lo que queremos poner a prueba. Esto lo analizaremos tambin
en el captulo sobre el uso del cuadro de cuatro casillas en las pruebas
de las hiptesis. En resumen, lo que significa el rea de rechazo es que,
excepto por razones del azar que aceptamos arbitrariamente en un ni-
vel 5%, es poco probable que el valor encontrado se halle en el rea
bajo la curva correspondiente al punto en que Z = 1.96.
Ahora, observe la siguiente campana:
Cuando se fija alfa en

0.05 (=0.05) cada
rea representa 0.025 y
la suma de las dos 0.05
-1,96 Mu +1,96
No se olvide de + 1.96 y 1.96, los valores de Z medidos en unidades

de desviaciones estndar. Entre + 1.96 y -1.96 se encuentra el 95% de
los valores de la distribucin. El 5% restante es una cifra muy impor-
tante tanto para fijar alfa () como para calcular p y se encuentra por
fuera de los dos valores expresados de Z, 2.5% (0.025) por encima de
Z = + 1.96 y 2.5% (0.025) por debajo de Z = -1.96
Hay otros Z que deber recordar, Z = 1.645. Entre Z =+1.645 y Z =

1.645 estn incluidos 90% de los valores cuando se fija en 0.1, caso
en el cual 0.05 es el valor fijado para en cada lado de la cola.
Por otra parte, entre Z = +2.33 y Z = 2.33 estn incluidos el 99%

de los valores.
En la curva que mostramos abajo, a la cual recurriremos de nuevo en

el captulo de inferencias, al rea incluida entre los valores de Z (en
rosado) y no por fuera de ellos (en amarillo) se le llamar rea de NO
rechazo de la hiptesis nula.
Al rea rosada se le llama rea

de aceptacin de la Hipotesis
alternativa Ha, o mejor an si se le
llamara rea de NO rechazo de la H0
hiptesis nula
-1,96 0 +1,96
Ahora imagine dos campanas que compiten entre s y se toman los

espacios mutuamente:
Estas dos campanas de Gauss corresponden a dos distribuciones nor-

males pero diferentes. Mire ahora en la grfica de abajo cmo represen-
tamos alfa y cmo beta. Alfa es algo que fijamos de antemano, usual-
mente en 0.05, es la probabilidad que aceptamos de cometer el error
de rechazar la hiptesis nula cuando sta es verdad (Error tipo I). Beta,
por su parte, expresa la probabilidad de NO rechazar la hiptesis nula
(aceptar la hiptesis alternativa) cuando la hiptesis H0 es falsa (Error
tipo II).
Este razonamiento, que en primera instancia parece simple, puede re-

sultar siendo una trampa cuando usted lo incorpora en la prctica dia-
ria.

Al rea en azul
la llamamos beta 1-
Al rea en rosado
la llamamos 1
menos beta o
poder
Este concepto de dos campanas, y no de una sola, resulta muy til

cuando al poner a prueba una hiptesis se comparan dos poblaciones
o dos muestras entre s, para decidir cul es ms probable que se ajuste
y explique los datos de una distribucin normal dada.
La parte rosada de la curva de la derecha expresara el poder (1- beta).

Beta () es el rea representada en azul.
Por ahora dejaremos atrs la campana de Gauss. Solo queramos pre-

sentrsela aqu como una herramienta verstil y omnipresente. Ms
adelante la juntaremos con otras herramientas como el cuadro de cua-
tro casillas y las curvas ROC. Mientras llega el momento, sigamos en el
prximo captulo con el uso del cuadro de cuatro casillas en el clculo
de riesgos.
6. Herramientas 3
Uso del cuadro de cuatro casillas
en la evaluacin de pruebas
En este captulo revisaremos el uso del cuadro de cuatro casillas en:
El clculo de la Sensibilidad junto con su complemento, la Proporcin

de Falsos Negativos.
La Especificidad y su complemento, la Proporcin de Falsos Positivos,

as como
El Valor Predictivo Positivo y el Valor Predictivo Negativo de las prue-

bas.
Adems, miraremos cmo se calcula la Exactitud, aclararemos qu sig-

nifica exactitud del examen y precisin, y veremos cmo se juntan stas
con la Sensibilidad y la Especificidad.
Todos estos conceptos tienen gran importancia y aplicacin en la prc-

tica clnica.
Para entender mejor las frmulas, tenga en cuenta:
Los puntos significan el lugar de origen de la frmula, es decir,

la celda en donde se pone nfasis porque la bsqueda de su signi-
ficado justifica la frmula.
La direccin de las flechas indica el sentido en que nos movemos

en el cuadro de cuatro casillas al calcular las frmulas.
Notar que para calcular la Sensibilidad y la Especificidad, como

tambin para calcular la Proporcin de Falsos Positivos y la Pro-
porcin de Falsos Negativos, nos movemos en sentido vertical, es
decir, de arriba hacia abajo o de abajo hacia arriba.
Por el contrario, para calcular los valores de prediccin, es decir, el

Valor Predictivo Positivo y el Valor Predictivo Negativo, nos mo-
vemos en sentido horizontal, de derecha a izquierda y de izquierda
a derecha.
Note adems que para calcular la Exactitud del Examen nos mo-
vemos en sentido diagonal de la celda a, a la celda d.
Veamos ahora cmo se calculan las Proporciones que nos interesan:

1. Proporcin de verdaderos positivos, mejor conocida como
Sensibilidad.
2. Proporcin de verdaderos negativos, mejor conocida como
Especificidad.
3. Proporcin de falsos positivos.
4. Proporcin de falsos negativos.
5. Valor predictivo positivo.
6. Valor predictivo negativo.
7. Exactitud del examen.
Y qu significan.
1. Sensibilidad (Proporcin de verdaderos positivos)

Sensibilidad es la capacidad que tiene una prueba para detectar al mayor
nmero de enfermos, es decir, a los verdaderos positivos. Dicho de otra
manera, la sensibilidad es una medida de la probabilidad de que la prue-
ba resulte positiva si la enfermedad est presente. Un resultado positivo
(anormal) en todos los pacientes con una enfermedad tendra una
sensibilidad perfecta del 100%. Tal prueba no dara falsos negativos, es
decir que si el examen diera negativo, podramos afirmar que tal per-
sona no sufre de la enfermedad. A la proporcin de falsos negativos la
consideramos como el complemento de la sensibilidad.
Las pruebas de alta sensibilidad se usan cuando las consecuencias nega-

tivas de no detectar la enfermedad son grandes. Un ejemplo clsico es
el tamizaje de sfilis con la prueba del VDRL. Su utilidad se demuestra
en el siguiente ejemplo: el VDRL tiene una sensibilidad de 100% para
el diagnstico de sfilis secundaria y de 95 a 98% para sfilis latente
(The Internet Journal of Infectious Diseases, 2004). Si el tamizaje para
detectar sfilis se hace en una poblacin de alto riesgo (prevalencia de
12% en mujeres en las crceles) con la prueba de VDRL seguida por
una prueba confirmatoria (FTAABS), 1 de cada 10 personas tendr
sfilis y 2 de 100 personas sern falsos negativos. Fletcher y Fletcher
sugieren que las pruebas de alta sensibilidad debern preferirse en las
primeras etapas de diagnstico, en el estadio en que an se estn con-
siderando dentro de las posibles condiciones una gama amplia de cua-
dros, con el fin de reducir el nmero de posibilidades diagnsticas en
las cuales debemos concentrarnos.
Sensibilidad
Proporcin
de verdaderos
positivos
a verdaderos positivos
Sensibilidad =
a + c verdaderos positivos + falsos negativos
2. Especificidad (Proporcin de verdaderos negativos)
Especificidad es la capacidad de eliminar con plena certeza a quienes no

estn enfermos, es decir, a los verdaderos negativos. Dicho de otra ma-
nera: la especificidad es una medida de la probabilidad de que la prueba
resulte negativa si la enfermedad no est presente. Un resultado nega-
tivo (normal) en todos los pacientes que no tienen la enfermedad
tendra una especificidad perfecta, es decir una capacidad de 100% de
confirmar un sano porque la prueba no da falsos positivos. Por lo tanto, si el
resultado es positivo confirmar un diagnstico anormal. La proporcin
de falsos positivos es el complemento de la especificidad de una prueba.
Se busca una prueba bien especfica para no exponer a tratamientos in-

necesarios a quien no lo necesita. Si lo eliminamos por ser un verdadero
negativo, tenemos la certeza de que no est enfermo.
d Verdaderos negativos
Especificidad = ------------ = --------------------------------------------------
d + b Verdaderos negativos + falsos positivos
3. Proporcin de falsos positivos

La proporcin de falsos positivos es el complemento de la especifici-
dad de una prueba.
La proporcin de falsos positivos se calcula as:
Proporcin
de falsos
positivos
b falsos positivos
Proporcin de = ------------- = --------------------------------------------------
falsos positivos
b + d falsos positivos + verdaderos negativos
Un examen es falso positivo cuando una prueba es anormal (da po-

sitivo para detectar la enfermedad) aunque el paciente no sufra de la
enfermedad.
Los exmenes falsos positivos les pueden causar mucho sufrimiento

a aquellas personas que sin tener una enfermedad grave, se someten a
una prueba de filtro recomendada por algn organismo de salud para
descubrir precozmente una enfermedad. Sobre todo si el sistema de
salud no tiene cmo aclarar rpidamente las dudas cuando surgen.
Usemos los datos del estudio de seguimiento de un milln de muje-

res para hacer algunas suposiciones (The millon women study). Si los
radilogos de Colombia se comportaran igual que los radilogos de
dicho estudio, tendramos la siguiente situacin: un radilogo muy acu-
cioso, de 1 000 mamografas, informara 36 como compatibles con
el diagnstico de cncer de mama. De esos casos, solamente cinco son
carcinomas de verdad. Los otros son falsos positivos. Por otra parte, la
cita con el experto en mamografas y el equipo interdisciplinario de ci-
rujano, patlogo y radilogo se demora tres meses. Se justifica el sufri-
miento de esas 31 personas y sus familias durante el tiempo de espera?
Ser posible que los servicios de promocin de pruebas y diagnsticos
tempranos distingan que promover pruebas de diagnstico precoz es
solo una parte de la promocin de la salud? Adems Ser posible que
entiendan que prevencin primaria es diferente a diagnstico tempra-
no, y que lo que se denomina diagnstico temprano, no siempre es tal?
Y que lo que se hace en caso de un diagnstico temprano depender
tanto de la historia natural de la enfermedad como de la historia clnica
personal y familiar de la persona diagnosticada?
4. Proporcin de falsos negativos

La proporcin de falsos negativos es el complemento de la sensibili-
dad.
La proporcin de falsos negativos se calcula as.
Proporcin
de falsos
positivos
c falsos negativos
Proporcin de =
falsos
negativos
c + a falsos negativos + verdaderos positivos
Una prueba es falsa negativa cuando el resultado se informa como nor-

mal, es decir negativo, aunque el paciente tenga la enfermedad.
Las pruebas falsas negativas son muy preocupantes cuando la falla

en la deteccin de una enfermedad resultara personal y socialmente
costosa.
Suponga las consecuencias funestas que tendramos si la prueba de

ELISA de VIH no tuviera la sensibilidad que tiene, del 99.5%, sino una
sensibilidad del 80%, y un laboratorio reportara como negativa la prue-
ba de HIV de una persona portadora del virus, quien desde hace aos
se la pasa arguyendo en contra del uso de los preservativos, y para cele-
brar la buena noticia, tal persona se fuera de farra con cuantos amigos
encontrara dispuestos a compartir su dicha y sus habilidades erticas.
La prueba de ELISA practicada en la actualidad (2009) garantiza que
de cada mil personas sometidas al tamizaje, solo 5 son falsos negativos.
Imagnese si los falsos negativos fueran 20 de cada 100!
Prcticamente, ningn examen de los usados en medicina clnica tiene

sensibilidad ni especificidad perfectas. En consecuencia, la mayora de
las pruebas puede dar tanto resultados falsos positivos como resultados
falsos negativos.
5. Valor predictivo positivo

El valor predictivo positivo expresa la probabilidad de que el paciente
tenga la enfermedad si el resultado de la prueba da positivo. Se calcula
de la siguiente manera:
a b
Valor
predictivo
positivo c d
a verdaderos positivos
Valor predictivo = =
positivo a + b verdaderos positivos + falsos positivos
6. Valor predictivo negativo

El valor predictivo negativo expresa la probabilidad de que el pacien-
te est libre de la enfermedad, si el resultado de la prueba da negativo.
Se calcula de la siguiente manera:
a b
Valor
predictivo
negativo c d
d verdaderos negativos
Valor predictivo = =
negativo
d + c verdaderos negativos + falsos negativos
Esperamos que haya notado cmo para el clculo de los valores predic-
tivo positivo y negativo nos hemos movido en el sentido horizontal y
no en el vertical, como lo hicimos para las primeras cuatro frmulas.
Tanto el valor predictivo positivo como el negativo se pueden expresar

como porcentajes, en cuyo caso simplemente los resultados de las ecua-
ciones anteriores se multiplican por cien.
Los valores predictivos positivo y negativo son muy tiles en la clni-

ca. Con el resultado del test en sus manos usted necesita decidir si la
persona tiene o no tiene la enfermedad investigada. Veamos este con-
cepto usando un ejemplo publicado por Grimes et al, en Lancet. En
la institucin en donde usted trabaja, desde hace poco tiempo se tiene
disponible el sper test para el diagnstico de Clamydia Trachomatis,
una enfermedad de transmisin sexual altamente prevalente en su me-
dio. El nuevo test tiene una sensibilidad de 98% y una especificidad de
97%.
Entonces, aplica el test en 100 mujeres que asisten a la clnica de enfer-

medades de transmisin sexual ETS de su hospital pblico, situado en
un rea donde hay mucha prostitucin. En dicha consulta 30 de cada
100 mujeres padecen la infeccin. Al final de su estudio, el valor predic-
tivo positivo de su prueba ser de 93%. En las circunstancias descritas,
la prueba resultar muy til ya que dar verdaderamente positiva en la
mayora de sus pacientes. Con mucha confianza usted empezar el tra-
tamiento ms adecuado y sugerir que de ser posible vayan a consulta
con el compaero o los compaeros sexuales de cada persona.
Pero si usted se va a una clnica privada donde se atienden especial-

mente a seoras casadas y virtuosas, y muchas monjas de distintas co-
munidades que han mantenido, as sea con dificultades, sus votos de
castidad, el valor predictivo de la prueba no ser tan bueno como en
el caso anterior del hospital situado en la zona de tolerancia. En las
circunstancias del segundo grupo de mujeres, solo 3 de 100 tendrn la
infeccin. En este caso el VPP de su prueba es de 50%.
Uso del cuadro de cuatro casillas en la evaluacin de prue-

bas de tamizaje. Precisin y Exactitud
Todos los das, en la prctica clnica se utilizan pruebas para confirmar
diagnsticos o para eliminarlos. Independientemente de la prueba usa-
da, con todos los exmenes se presentan dos tipos de problemas:
Intrnsecos: relacionados con lo que el laboratorio hace en s.
Extrnsecos: relacionados con la interpretacin que el mdico hace

de la prueba.
Para poder superar dichos obstculos acudimos a dos conceptos que se

le aplican a las pruebas: el de confiabilidad y el de validez, y dos concep-
tos que se le aplican a las medidas: los de precisin y exactitud.
La confiabilidad expresa el grado en que uno puede depender de

un examen porque tiene certeza de sus bondades.
La validez expresa el punto hasta donde un examen mide aquello

para lo cual fue diseado.
La validez tiene dos componentes:

1. La Sensibilidad, y
2. La Especificidad, ya vistas.
Con relacin a los conceptos que se aplican a las medidas, hablaremos

de exactitud (accuracy, en ingls) y de precisin (precision):
La exactitud de un examen es la capacidad de una prueba para

producir los verdaderos valores de las muestras del estudio y sus
verdaderas clasificaciones. En otras palabras, es la capacidad de
acercarse a la magnitud real o de expresar el grado en que el valor
medido se aproxima al valor correcto.
La exactitud de un examen disminuye como consecuencia de un tipo

de error conocido como error experimental. Para lograr la exactitud de
un examen se requiere la calibracin del mtodo y los equipos con un
estndar de oro conocido.
La exactitud es diferente a la precisin.
La precisin de la prueba es la capacidad que ella tiene de reali-

zar medidas similares en diversas circunstancias. La precisin nos
confiere la certeza necesaria para afirmar que la variabilidad en-
contrada en los resultados de una prueba no se debe al azar. Se
podra deber a un sesgo, pero no al azar.
La precisin de un examen disminuye como resultado de lo que se

conoce como error de azar. La precisin se describe mediante la Desvia-
cin Estndar, el Error Estndar y los Intervalos de Confianza IC.
Observe los siguientes esquemas grficos de una diana con los patro-
nes posibles; luego preste atencin a los dibujos:
Patrn de la diana # 1: No es preciso, tampoco es exacto. Las flechas

dan en cualquier sitio, menos en el blanco; los patrones tampoco
se repiten con precisin en ningn sitio.
Ni es preciso,
ni es exacto
Patrn de la diana # 2: Preciso, pero no es exacto. Las flechas siempre

se juntan con gran precisin en un mismo sitio, pero este no es el
sitio deseado.
Preciso, muy
preciso, pero
no exacto
Patrn de la diana # 3: Exacto pero no es preciso. Las flechas no estn

en un racimo, pero su posicin promedio es el centro de la diana.
Rojo y rosado dan puntajes altos.
Patrn de la diana # 4. Preciso y exacto. Las flechas se renen

pegadas en un racimo muy compacto y su posicin promedio es el
centro de la diana.
Preciso
y exacto
Todos los laboratorios manejan un error sistemtico (experimental)

propio, pero lo suelen hacer con gran precision. Para que sean exactos,
peridicamente deben calibrar sus equipos con un estndar de oro co-
nocido y aceptado como tal.
Volvamos al cuadro de cuatro casillas:
7. Exactitud del examen

La exactitud se calcula de la siguiente manera:
a b
Exactitud
c d
a + d verdaderos positivos + verdaderos negativos

Exactitud = =
(a + b + c + d) todos los positivos + todos los negativos
Note que para calcular la exactitud de un examen tomamos del cuadro

los extremos a y d, es decir, las casillas donde se encuentran los valores
verdaderos y los ponemos en el numerador.
La Precisin y la Exactitud son necesarias en la prctica diaria para la

definicin de los rangos de referencia de cada examen practicado por
los laboratorios. Un examen dado solo se puede interpretar correcta-
mente comparndolo con los valores incluidos en esos rangos de refe-
rencia especficos. No hacerlo as, sera muy peligroso.
Por ejemplo, para ser clasificado como diabtico del tipo I, la OMS
requiere que los niveles de azcar en el plasma venoso sean mayores de
8mol/L. La Asociacin Norteamericana de Diabetes (ADA) requiere
que esos mismos niveles sean mayores de 140 mg/dl. Se trata, claro
est, de unidades de medicin diferentes y los 140 mg/dl equivalen a
7.8 mol/L. Pero si la medicin se hace en la sangre capilar venosa y
no en el plasma, la OMS requiere valores mayores de 7 mol/L, y la
ADA valores mayores de 120 mg/dl. La cifra de 120 mg/ dl equivale a
6.7mol/L. Se supone que en todos los casos las muestras se toman en
ayunas. Los rangos de referencia ms comnmente usados para deter-
minar si una glicemia es normal, en los laboratorios que miden en mg/
dl, son 80120 mg/dl.
Se imaginan ustedes lo que podra ocurrir si lo anterior no fuera teni-

do en cuenta por un acucioso mdico joven, preocupado por lo que l
considera que son valores muy elevados de glucosa en sangre venosa,
139 mg/dl, y comenzara a tratar de bajarle activamente esos niveles
a un paciente diabtico, acostumbrado a manejar sin descompensarse
valores an ms elevados? Con decisiones similares, seguramente en-
traran al servicio de urgencias muchas personas con cuadros agudos de
confusin, sudoracin, irritabilidad, etc., vctimas del celo profesional
de galenos que, como el anterior, no tuvieron en cuenta la relatividad
de los exmenes y los rangos de valores aceptados en diferentes situa-
ciones clnicas.
Manera de establecer los rangos

Por lo general, para establecer cules son los rangos de referencia de
una prueba:
Se miden los valores de la prueba en un nmero considerable de

voluntarios sanos.
Se grafican las distribuciones encontradas. En la mayora de las

pruebas cuantitativas, los resultados suelen esbozar una curva nor-
mal en forma de campana.
Se calculan el promedio y la desviacin estndar de esa distribu-

cin.
Ya vimos en el captulo anterior la curva normal.
2.5% No normal 2.5% No normal
-2 -1 Promedio +1 +2
Normal
Se define como rango normal aquel comprendido entre los dos puntos
que representan los valores de desviaciones estndar del promedio +2
y -2.
Dentro de ese rango de valores de dos desviaciones estndar del pro-

medio hacia la derecha y dos hacia la izquierda (en total cuatro desvia-
ciones estndar), se encuentra el 95% de la poblacin ideal de la cual
obtuvimos los exmenes. Por convencin, 5% de la poblacin ideal
y sana (poblacin de referencia) de la que tomamos la muestra para
comparar con ella a los enfermos, estar por fuera de esos rangos con-
siderados como normales, 2.5% a la derecha de +2 desviaciones es-
tndar, y 2.5% a la izquierda de -2 desviaciones estndar. Lo anterior
tiene importancia en la interpretacin de los valores situados en los
extremos de las distribuciones.
Note desde ya que la normalidad estadstica no es equivalente a nor-

malidad biolgica.
Por otra parte, la distribucin de los resultados de los exmenes de

individuos sanos frecuentemente se superpone con la de los enfermos,
como ocurre en la siguiente grfica en la que, al examinar las curvas
de distribucin de los valores del cido rico, se puede ver cmo los
niveles ms altos de este cido en pacientes sanos se traslapan con los
niveles ms bajos de los enfermos de gota.
Niveles de cido rico en sangre

Sanos
Enfermos
0 1 6 9
Cuando esto ocurre, es necesario asignar un Punto de Corte. La esco-

gencia de dicho punto de corte A, B, C, etctera, determina cul es la
sensibilidad y la especificidad de un examen.
Ejemplo:
Entre sus colegas se ha desatado una discusin sobre quin sufre de

gota y quin no, basndose nicamente en los resultados del cido ri-
co en sangre. Esperamos que esto no sea as. Pero como se trata de un
ejemplo, supongamos que usted y sus colegas, despus de una sesuda
discusin, deciden solicitarle mediciones de cido rico a un grupo de
personas gotosas clnicamente y a un grupo de personas sanas. El resul-
tado obtenido fue el de la grfica anterior. Al verla, alguien les sugiere
que decidan entre ustedes cul es el punto de corte ms adecuado para
separar, solamente con la prueba, a los gotosos de quienes no lo son.
Usted, muy interesado en el mtodo cientfico, decide asignar tres pun-
tos de corte diferentes a ver qu sucede con ellos:
Punto de corte A = cido rico de 6 mg/dl
Punto de corte B = cido rico de 7.6 mg/dl
Punto de corte C = cido rico de 10 mg/dl
Diferentes puntos de corte
10 10 10
6 mg/dl 7.6 mg/dl 10 mg/dl
Punto de corte A Punto de corte B Punto de corte C
Al escoger A como punto de corte, descubre usted que la prueba tiene

una sensibilidad cercana al 100%, del 97.5% para ser ms exactos. La
prueba captar entonces a casi todos los individuos con la enferme-
dad, pero tambin tendr una baja especificidad, pues se incluirn en
el grupo de no normales a muchos individuos sanos, simplemente por
tener el cido rico por encima de 6 mg/dl. Un punto de corte as solo
sera apropiado si la prueba se fuera a usar como filtro inicial (tamizaje;
screening, en ingls), despus del cual necesitaramos hacer una prueba
confirmatoria ms especfica.
Si se escoge C como punto de corte y consideramos como anormales

solo a aquellas personas con niveles de cido rico por encima de 10
mg/dl, el examen tendr una especificidad elevada -en este caso 100%
de quienes estn por encima de tal punto de corte son enfermos (en
azul)- , pero una sensibilidad baja. Segn los resultados que muestra la
grfica, podemos afirmar que todas las personas que estn por encima
de 9 mg/ dl y algunas de las que estn por encima de 6 mg/dl son go-
tosos, pero no sern considerados como tales porque el punto de corte
establecido fue muy exigente.
En la vida real escogeramos un punto de corte entre A y C, en este

caso sera B. Si as lo hiciramos se incluiran a unas pocas personas no
enfermas dentro del grupo de los gotosos por tener el cido rico alto
-no seran muchos- y dejaramos tambin de captar a aquellos gotosos
con valores bajos de cido rico, tampoco seran tantos.
Ese punto de corte intermedio B minimiza los errores.
Por consejo del profesor de Medicina Interna, de ahora en adelante us-

ted y sus compaeros sern mucho ms cuidadosos en la interpretacin
de los resultados, pero por encima de todo no los volvern a interpretar
aisladamente; ms bien, le pondrn mayor atencin a la evolucin cl-
nica de cada individuo y a los cambios sbitos de los niveles de cido
rico en sangre, que los pondrn alerta sobre la liberacin masiva de
cristales y la aparicin de un episodio agudo de gota.
Este captulo pretenda, esencialmente, hacerle ver uno de los usos del
cuadro de cuatro casillas. A medida que avancemos notar cmo su
interpretacin se complementa y se enriquece con otras herramientas,
por ejemplo con la curva de distribucin normal, una herramienta tan
verstil y omnipresente, ya discutida en detalle en otro captulo.
En el siguiente captulo trataremos las Curvas ROC, una hija legtima

del cuadro de cuatro casillas. Las curvas ROC son una herramienta
visual muy gil para discriminar la utilidad de los exmenes segn su
sensibilidad y su especificidad. Esperamos no se asuste con lo prolfico
de esta familia ni con su promiscuidad. Al final, el resultado ser que
todas estas herramientas terminarn siendo complementarias entre s.
Si las separamos, es solamente con propsitos educativos.
7. Herramientas 4
ROC
Curvas ROC. Una hija del cuadro de cuatro casillas
Cuando estbamos estudiando la parte correspondiente a la sensibi-

lidad y la especificidad de las pruebas en el cuadro de cuatro casillas,
descubrimos que tenan un hijo no siempre identificado como tal, pero
hijo de sus entraas. Se trata de las curvas ROC.
Hemos pintado primero un cuadro lleno del color rosa plido para re-
cordarle que en el caso de las curvas ROC, al igual que en la campana
de Gauss, el valor que se mide es el rea debajo de la curva. Luego le
hemos quitado dos lneas, la superior y la de la derecha al segundo, para
que tenga presente que en la representacin usual de las curvas ROC
se usan como referencias las lneas que constituyen las ordenadas Y y
las abscisas X.
La curva ROC se llama as por sus siglas en ingls Receiver Operating Cha-
racteristics (caractersticas operativas del receptor de radio).
Cmo se construye la representacin ms comn de la

curva ROC
En el eje de las ordenadas Y colocamos la Sensibilidad, cuyos valores

van entre cero y uno (1 es el 100%). En el eje de las abscisas X coloca-
mos 1- Especificidad, cuyos valores tambin van entre cero y 1.
Sensibilidad
0 1 - Especificidad 1
La idea con la curva ROC es medir qu tanto se acerca una curva al

punto ideal en donde la sensibilidad es el 100 y el rea bajo la curva
abarque la mayor cantidad de rea posible. En otras palabras, cuando
en las ordenadas se pone la sensibilidad y en las abscisas 1- Especifici-
dad, la curva ROC mide la Exactitud (Accuracy) con que un examen
puede discriminar. Es una curva con alto poder discriminatorio entre
los exmenes tiles para tomar decisiones y aquellos no lo son.
1-E
Como se trata de medir el poder discriminatorio de la curva, en el gr-

fico anterior la curva de la lnea roja sera excelente y la morada buena;
en cambio, la negra que representara 50% no servira para nada, pues
equivaldra a tirar una moneda al aire para decidir cara o sello.
Si hacemos un resumen de lo visto en el uso del cuadro de cuatro casi-

llas para la determinacin de especificidad y sensibilidad de una prueba,
entenderemos qu relacin hay entre el cuadro de cuatro casillas y las
curvas ROC, y entre estas y las campanas de Gauss de las curvas nor-
males.
Enfermedad / Efecto
Positivo Negativo
Prueba verdadero falso

diagnstica positivo positivo
positiva
a b
Prueba falso verdadero

diagnstica
negativo negativo
positiva c d
Sensibilidad a/a + c 1 - Especificidad

Miremos las campanas de Gauss de dos curvas normales.

V+ F+
punto de
corte F- V-
Comparacin de dos curvas normales segn el punto de corte elegido
Miremos las campanas de Gauss de dos curvas normales.

V-
V- V+
NO hay color rojo porque en este punto de corte no hay falsos elegidos
Podramos ver que no hay color rojo porque no hay falsos positivos.
De nuevo, una advertencia: los cdigos de colores propuestos en este

libro para el cuadro de cuatro casillas no son originales ni universal-
mente aceptados. Algunos encuentran til para el aprendizaje la memo-
rizacin de un cdigo de colores, que fallara en otros.
Pero con colores o sin ellos, para la mayora de personas las curvas
ROC dan una informacin visual ms fcil de entender.
La ventaja de las curvas ROC es que son ms visuales
En la representacin ms comnmente usada de las curvas ROC con

las abscisas X representando 1-especificidad, el punto de referencia a
donde tiende a acercarse la curva con mayor valor posible es el punto
donde S (sensibilidad) es el 100%, es decir 1.
1- Especificidad
La lnea en rojo que parte del rea el punto ms bajo de sensibilidad y a

la vez el ms alto de 1-especificidad, representa el rea ms baja posible
cuando se combinan estos dos valores. Y si se pintaran varias curvas:
1- Especificidad
Al valorar un examen, la capacidad de prediccin de ste aumenta en la

medida en que la curva se acerca al punto verde.
Otros usos de la curva ROC
aparte de la Exactitud de un Examen
Aunque la representacin vista hasta ahora es la forma ms comn-

mente usada de la curva ROC, no es la nica posibilidad.
En realidad, segn el valor que le asignemos al eje de las Y o de las X,

tendremos las diversas versiones de la curva ROC.
X Y
1. F+ = 1 - E V+ = S
2. V- = E V+ = S
3. V- = E F- = 1-S
4. F+ = 1 - E F- = 1-S
Origen histrico de las curvas ROC

Las curvas ROC tuvieron su origen en la Segunda Guerra Mundial. Al
igual que suceda con los viejos radios, y todava con los transistores de
uso corriente cuando uno trata de captar estaciones de onda corta, la
seal a veces llega confusa. Para los operadores de radio y de radares
era y es muy importante distinguir si la seal que captaban correspon-
da a la de un objetivo enemigo o, por el contrario, de un barco aliado.
Desde hace unos aos se le encontr valor en la medicina, como lo

veremos a continuacin.
Ejemplo prctico del uso de las curvas ROC

En una poblacin de Espaa se desarroll una prueba de tamizaje del
deterioro cognitivo, que puede darnos una idea sobre cules personas
mayores debern ser remitidas al neuropsiquiatra para confirmacin de

su diagnstico de demencia. Usualmente, estas pruebas de tamizaje se
componen de varios tems que miden diferentes capacidades y habili-
dades cognitivas. La respuesta correcta a cada uno de los tems recibe
un valor de 1 y por ello se cree que entre ms puntaje reciba la persona,
mejor ser su funcin cognitiva. Lo que no se saba hasta este estudio,
era si la prueba sera capaz de discriminar entre aquellos que tienen
demencia o no, y en qu punto de corte o valor esta discriminacin
sera mejor.
Tal prueba consiste en 10 preguntas, las personas reciben un punto si

responden correctamente y cero si no son capaces de responder cada
tem. Dicha prueba se les aplic a 960 personas a quienes adems se les
aplicaron las pruebas neuropsicolgicas consideradas como los estn-
dares de oro en el diagnstico de la demencia. Se diagnosticaron en to-
tal 110 casos de demencia. As luce el puntaje de la prueba de tamizaje
en las 960 personas:
Nmero de respuestas Con demencia Sin demencia

correctas
1 28 1
2 25 3
3 18 8
4 12 12
5 10 20
6 7 22
7 5 35
8 4 75
9 1 160
10 0 514
Total : 110 850
La curva ROC se construye a partir de mltiples tablas de 4 casillas en

las cuales se establece la positividad de la prueba en diferentes puntos
de corte, as:
Punto de corte 1/2

Demecia Demecia
presente ausente -
Prueba + 28 1
Prueba - 82 849
Punto de corte 2/3

Demecia Demecia
presente ausente -
Prueba + 93 44
Prueba - 17 806
Punto de corte 3/4 Demecia Demecia

presente ausente -
Prueba + 53 4
Prueba - 57 846

presente ausente -
Prueba + 71 12
Prueba - 39 838

presente ausente -
Prueba + 83 24
Prueba - 27 826

presente ausente -
Prueba + 110 236
Prueba - 0 614

presente ausente -
Prueba + 100 66
Prueba - 10 784

presente ausente -
Prueba + 105 101
Prueba - 5 749

presente ausente -
Prueba + 109 176
Prueba - 1 674
La tabla de sensibilidad y especificidad para cada punto de corte se

muestra as:
Punto de Corte Sensibilidad Especificidad
1/2 25% 100%

2/3 48% 100%
3/4 65% 99%
4/5 75% 97%
5/6 85% 95%
6/7 91% 92%
7/8 95% 88%
8/9 99% 79%
9/10 100% 72%
La curva ROC luce as:
1
0.9 8/9 9/10
6/7 7/8
0.8
0.7 4/5
0.6 3/4
0.5
2/3
0.4
0.3
0.2
0.1
0
0 0.05 0.1 0.15 0.2 0.25 0.3
En el eje de las X hemos dibujado 1-especificidad y en las Y la sensi-

bilidad.
Como se observa en la curva, el punto izquierdo ms extremo es el

punto de corte 5/6. Ese es el punto de corte que nos da ms balance
entre la sensibilidad y la especificidad. Usted podra escoger este pun-
to de corte para remitir a sus pacientes a diagnstico confirmatorio,
en cuyo caso habr 5% de falsos positivos y 15% de casos sin diag-
nstico; tambin podra aumentar su punto de corte a 6/7, con lo cual
usted aumenta sus falsos positivos en una proporcin no muy grande,
8%, pero disminuye la posibilidad de dejar pasar un diagnstico de
demencia en 9%. Estas decisiones, como lo veremos en otro captulo,
dependen de varios aspectos.
8. Herramientas 5
Cuadro de Cuatro Casillas y Clculo de Riesgos
Fjese de nuevo en el cuadro de cuatro casillas y observe que en esta

ocasin a las filas las llamamos factor de riesgo, en vez de llamarlas prue-
bas, como lo hicimos al usar el cuadro de cuatro casillas para la evalua-
cin de pruebas. En este caso, como en el anterior, a las columnas las
llamaremos columnas de enfermedad.
Enfermedad
+ -
Factor de riesgo +
Factor de riesgo -
Adems, observe aqu cmo nos movemos tambin en sentido hori-

zontal tanto arriba como abajo del cuadro, tal como lo hicimos al
hablar de la positividad o la negatividad de una prueba. Solo que esta
vez nos moveremos horizontalmente para calcular factores de riesgo.
Esta vez, al igual que en las otras oportunidades, usaremos color azul
para la columna de la enfermedad, pero en vez de rojo usaremos el
amarillo para la fila positiva del factor de riesgo. La combinacin de
los dos colores, el verde, significar que quienes estn incluidos en esa
casilla tienen simultneamente la enfermedad y el factor de riesgo.
Riesgo Absoluto entre los Expuestos
Clculo del Riesgo Absoluto

entre los expuestos al factor de riesgo
Enfermedad
+ -
+ a b
Factor de riesgo
- c d
Aqu, a los cuadros les daremos los siguientes nombres:

a= para quienes tienen a la vez la enfermedad y el factor de riesgo.
b= para quienes estn expuestos al factor de riesgo, pero no sufren
la enfermedad.
c= para quienes sin tener el factor de riesgo, tienen la enfermedad.
d= para quienes no estn expuestos al factor de riesgo y no se enfer-
man.
Llamamos incidencia al nmero de casos nuevos sobre el tiempo total

bajo riesgo de todos los individuos expuestos.
Nmero de nuevos casos
Incidencia =
Tiempo bajo riesgo de los individuos expuestos
El Riesgo Absoluto en el grupo de los expuestos se puede describir
como la Incidencia de una enfermedad o evento entre los expuestos al factor de
riesgo, y se calcula de la siguiente manera:
a
Riesgo Absoluto entre los Expuestos = Incidencia =
[ a + b]
# individuos positivos para la enfermedad

Riesgo Absoluto entre Expuestos =
# positivos + # negativos para la enfermedad
Riesgo Absoluto entre los NO expuestos

Enfermedad
+ -
+ a b
Factor de riesgo
- c d
Al Riesgo Absoluto en el grupo de los NO Expuestos se le llama tam-

bin Incidencia entre los No Expuestos y se calcula as:
c
Riesgo Absoluto entre los No Expuestos =
[c + d]
Riesgo Absoluto Nmero de individuos sin el factor de riesgo que tienen la enfermedad
para No expuestos =
# Individuos con la enfermedad pero + # individuos sin la enfermedad
sin el factor de riesgo y sin el factor de riesgo
Note cmo en la terminologa del clculo de riesgos absolutos positi-

vos y negativos aparece tambin el trmino Incidencia.
Riesgo Relativo
El Riesgo Relativo RR es simplemente la Razn de dos probabilidades
condicionales.
De manera similar a lo que suceder con el Odds Ratio descrito ms ade-

lante, un Riesgo Relativo igual a 1 implica que el evento es igualmente
probable en ambos grupos. Un Riesgo Relativo mayor de 1 implica que
el evento es ms probable en el primer grupo. Un Riesgo Relativo me-
nor de 1 implica que el riesgo es menos probable en el primer grupo.
El Riesgo Relativo se define como la Tasa de Incidencia en el grupo so-

metido al riesgo sobre la Tasa de Incidencia en el grupo NO expuesto al
riesgo. Se trata de una divisin.
a
[a + b]
Riesgo Relativo RR =
c

[c + d]
Riesgo Absoluto entre los expuestos

RR =
Riesgo Absoluto entre los NO expuestos
Tasa Incidencia entre los expuestos

RR =
Tasa Incidencia entre los NO expuestos
Riesgo Atribuible
El Riesgo Atribuible se define como la Tasa de Incidencia en el grupo
sometido al riesgo, menos la Tasa de Incidencia en el grupo NO expuesto
al riesgo. Se trata de una resta.
a c
Riesgo Atribuible = -
[a + b] [c + d]
Riesgo Atribuible = Riesgo Absoluto entre los expuestos Riesgo Absoluto entre los NO expuestos
Al Riesgo Atribuible tambin se le puede llamar Diferencia de Riesgos

o Diferencia de Tasas.
Note tambin el concepto de Tasa de Incidencia.
OR (Odds Ratio)
El OR es una manera de comprobar si la probabilidad de ocurrencia de
un evento determinado es la misma en dos grupos.
Odds Ratio es el cociente entre el ODD (la apuesta con ms probabi-

lidades de ganar) de que el evento ocurra en el grupo con el Factor
de Riesgo y el ODD de que ocurra en el grupo sin el factor de riesgo.
Indica cun ms probable es la ocurrencia de un evento, que su NO
ocurrencia.
El OR debe ser mayor o igual a cero. En la medida de que el Odds del

primer grupo se acerca a cero, el OR se acerca igualmente a cero. En
la medida en que el Odds del segundo grupo se acerca a cero, el OR se
aproxima al infinito positivo.
Un OR de 1 implica que el evento es igualmente probable en
ambos grupos.
Un OR mayor de 1 implica que el evento es ms probable en el
primer grupo, por ejemplo el grupo expuesto al factor de riesgo.
Un OR menor de 1 implica que el evento es menos probable en
el primer grupo.
Entonces, el Odds Ratio es una medida del efecto del tamao. Se define
como la Razn de que un evento ocurra en un grupo contra la razn de
que el evento ocurra en otro grupo. Dichos grupos pueden hacer parte
de un todo en el cual una clasificacin los divide dicotmicamente, por
ejemplo entre grupo experimental y grupo de control, o un grupo ex-
puesto a un factor de riesgo y otro no expuesto a dicho factor.
Aunque tambin se calculan OR en los estudios de cohortes y en otros

diseos que explicaremos ms adelante, OR (Odd Ratio) es el nombre
que se les da a los riesgos relativos en los estudios de Casos y Con-
troles.
Para calcular los OR necesitamos calcular las Tasas de Exposicin entre

los Casos, las Tasas de Exposicin entre los Controles, la proporcin
de expuestos entre los casos y la proporcin de expuestos entre los
controles:
a
Tasa de Exposicin entre los Casos =
a + c
b
Tasa de Exposicin entre los Controles =
b + d
La proporcin de expuestos entre los casos = a/c
La proporcin de expuestos entre los controles = b/d
a/b axd
OR = =
c/d bxc
ODDS RATIO OR= llamada tambin

Razn de Productos Cruzados
p
a b
c d
Observe como se cruzan en el numerador el producto de los verdaderos (positivo

y negativo) y en el denominador el producto de los falsos (positivo y negativo)
Usted ver el RR y el OR reportado en muchos estudios de epidemio-

loga.
En este libro hemos separado el uso del cuadro de cuatro casillas para
el clculo de riesgos del captulo correspondiente a las pruebas diag-
nsticas. Ni la separacin ni el uso de colores, como est aqu plantea-
do, son universales, se trata nicamente de una sugerencia didctica no
siempre til ni necesaria.
Aclaracin sobre el uso del trmino ODDS RATIO

Hemos mantenido el trmino ODDS Ratio en ingls a propsi-
to. La razn ms importante para ello es que todas las traduccio-
nes que se intentan del OR terminan por aclarar que se trata del
mismo. En el contexto epidemiolgico y de la bioestadstica, las
palabras ODDS y Ratio suelen ir juntas y no obedecen a lgicas
individuales.
ODD en ingls es raro, nico, non (opuesto a par), extrao. Para

los apostadores de caballos, ODDS equivale a las apuestas que se
le haran a un caballo como expresin de sus probabilidades, cal-
culadas sobre la base de sus rcords anteriores.
Quizs el siguiente cuadro, mitad en espaol, mitad en ingls, le ayude
a entender mejor el concepto:
PROBABILIDADES APUESTAS
Chances 1 out of 2 ODDS 1 to 1
2 out of 3 2 to 1
3 out of 4 3 to 1
Cuando hablemos de los estudios de Casos y Controles en el captulo
de diseos epidemiolgicos, volveremos a hablar del OR.
9. Herramientas 6
Cuadro de cuatro casillas
en la prueba de hiptesis
Al cuadro de cuatro casillas tambin se le podra llamar Cuadro de Puesta

a Prueba de una Afirmacin que queremos Rechazar (H0), porque dicha afir-
macin expresa todo lo contrario a lo que queremos probar. Pero eso
sera muy largo. Lo importante en el uso del cuadro de cuatro casillas
en la puesta a prueba de la hiptesis es saber que los componentes del
cuadro se construyen, no alrededor de la hiptesis que queremos pro-
bar (HA), sino alrededor de una hiptesis terica comnmente conoci-
da como Hiptesis Nula (H0), la cual, como dijimos, afirma lo opuesto
a lo que se quiere probar y que eventualmente vamos a rechazar. Por
ejemplo, si usted quiere probar, una vez ms, que el cigarrillo es una
causa que pesa mucho en el desarrollo del cncer del pulmn en una
poblacin, su hiptesis nula dira que no existe asociacin entre el h-
bito de fumar y el cncer del pulmn.
La Hiptesis Alternativa (HA), por ende, es aquella que expresa lo que

se quiere probar, por ejemplo, que s existe una asociacin entre el h-
bito de fumar y el cncer de pulmn.
Observe bien que la decisin se toma alrededor de la Hiptesis Nula

(H0) y que en ningn momento la HA hace parte del cuadro. Observe tambin
que segn la decisin que tomemos al rechazar o no rechazar la hipte-
sis nula, estaremos cometiendo ya sea un error denominado Error Tipo
I o, por el contrario, un Error Tipo II.
Hiptesis
H0 Verdadera H0 Falsa
Decisin Error
Aceptar H0 correcta Tipo II
Decisin
Rechazar H0 Error Decisin

Tipo I correcta
El Error Tipo I consiste en rechazar la H0 cuando es correcta.
El Error Tipo II consiste en aceptar la H0 cuando es falsa. Es un len-

guaje un poco enrevesado. Y por ello, con frecuencia, conduce a con-
fusiones.
Sigamos:
Aqu, el cuadro de cuatro casillas no lo usamos para deducir frmulas

matemticas, se utiliza simplemente para sacar una conclusin. Se trata
de un ejemplo ms de la versatilidad del cuadro de cuatro casillas en el
razonamiento epidemiolgico.
En esta oportunidad, la casilla asignada a cada concepto tampoco ocu-

pa un lugar fijo. De hecho, si lo construimos de otra manera, el cuadro
podra verse de la siguiente forma:
Conclusin basada en los datos
No rechaza la H0 Rechaza la H0
Verdad = H0 Conclusin correcta Error Tipo I

es correcta
Verdad = H0 Error Tipo II () Conclusin correcta

es falsa
Este concepto de la aceptacin o rechazo, tambin se entiende mejor

cuando se usa simultneamente con la curva de la distribucin normal.
Ahora, observe la siguiente campana de Gauss:
0.025 + 0.025 = 0.05

al juntar las dos colas
de la distribucin
alfa / 2, usualmente 0.025 alfa / 2
Mu 0
Y ahora mire esta otra, ms completa:

alfa / 2 = 0.025 alfa / 2 = 0.025
Rechazo la H0 Regin en la cual no logro Rechazo la H0

rechazar la Hiptesis Nula
Todo el razonamiento necesario para el uso de la hiptesis nula y la

fijacin de los valores de alfa, lo vamos a explicar en un captulo dedi-
cado a la puesta a prueba de la hiptesis. Entender entonces qu significan,
cmo usar la regin de rechazo y la de aceptacin y qu indica el 0 de
la primera curva.
10. Uso de las Herramientas.

Un ejemplo
Puntaje Z. Curvas de Crecimiento
Para entender los puntajes Z, que se basan tanto en la distribucin Z

como en las desviaciones estndar, y diferenciarlos de los percentiles que
se usan, entre otros, en las curvas de crecimiento individual, necesita-
mos volver a la distribucin normal y distinguirla de las distribuciones
no normales.
Habamos dicho que toda curva normal se puede definir por una medi-
da de dispersin y una medida de tendencia central; tambin habamos
dicho que entre las medidas de tendencia central estn: la mediana, la
moda y la media o promedio -esta ltima la ms usada y la mejor com-
prendida-. Las medidas de dispersin se representan bsicamente por
la desviacin estndar (o por su cuadrado, la varianza).
Ahora, le pedimos que enfoque simultneamente su atencin en las:
Medidas de dispersin (distribucin), y las de posicin, y se d

cuenta que no son lo mismo.
Medidas de dispersin (se aplican a distribuciones
normales)
Valores positivos y negativos. Una medida de dispersin dice qu
tan alejado est un punto cualquiera de una distribucin, de un punto
central , usualmente cero. Si el promedio es cero lo cual es cier-
to cuando la poblacin sigue una distribucin normal la medida
de dispersin se puede alejar hacia la derecha o hacia la izquierda,
segn se trate de valores mayores de cero (positivos) o menores de
cero (negativos).
Simetra. En la curva terica normal, el rea bajo la curva com-

prendida entre 0 y +1 DS es exactamente igual al rea comprendi-
da entre 0 y 1 DS.
Distribucin Normal:
1. Los valores positivos, a la
derecha, se dispersan de manera
simtrica con relacin a los
negativos, a la izquierda.
-3 -2 -1 0 +1 +2 +3
En esta ocasin usaremos el rojo para representar valores negativos, y

el azul para los positivos. Si dicha representacin grfica girara 90 ha-
cia la izquierda, los valores positivos (los de la derecha) quedaran hacia
arriba y los negativos (los de la izquierda) quedaran hacia abajo.
+3
+2
+1
-1
-3 -2 -1 0 +1 +2 +3 -2
Valores negativos Valores positivos
-3
Medidas de posicin (no es necesario que la distribucin

sea normal)
Una medida de posicin nos dice en qu orden de una ordenada est
ubicado un valor, pero NO en relacin con un punto intermedio sino
en relacin con toda la lista de individuos de la poblacin, ordenada de
abajo hacia arriba o de arriba hacia debajo.
La medida ms publicitada de posicin son los percentiles o centiles,

pero no son los nicos, tambin se usan los cuartiles, los quintiles y los
deciles. P95
P95 P90 P90

P50 P50
P10 P10
P5 P5
Versin Idealizada de los percentiles Versin ms cercana a la realidad

Se dibujan los percentiles como si fueran de los percentiles
desviaciones estndar simtricas alrededor No hay simetra alrededor del valor
del percentil 50. P5 se dibuja como si fuera del percentil 50.
equivalente a +2DS y P95 como si fuera
-2DS. El problema es que P95 no es ms
negativo con relacin a P50 que P5.
Los centiles
Ya est dicho, pero no sobra repetirlo. En una poblacin terica de 100
personas:
Percentil 1 significa que de las 100 personas solamente 1 est por
debajo de ese punto.
Percentil 5, que de las 100 personas solamente 5 estn por debajo
de ese percentil. Por supuesto, 95 estn por arriba.
Percentil 50 indica que exactamente la mitad de las personas
estn por encima de ese punto y la mitad por debajo. Es el punto
situado en la posicin de la mitad, es decir, la mediana. Es el nico

punto en donde los percentiles son necesariamente simtricos.
Percentil 95 significa que de las 100 personas contadas, 95 estn
por debajo de ese punto, y solamente 5 por encima.
Tradicionalmente se han pintado los valores ms altos arriba y los me-
nores abajo.
De igual forma, se han construido carriles para delimitar los percentiles

entre s o entre un grupo de ellos. Por ejemplo, un carril para delimitar
entre el percentil 95 por arriba y el percentil 90 por abajo.
Percentiles altos P95

P90 Aqu los canales que
delimitan los percentiles
se han representadoco-
mo si fueran simtricos.
Percentiles bajos Usualmente no lo son.
Aqu aparece un nuevo problema:
Los valores de los percentiles que definen una poblacin cualquie-

ra se toman de una poblacin de referencia.
Dichas poblaciones suelen ser cambiantes con el tiempo, pero

no es solo eso: los parmetros tambin van cambiando en el largo
plazo; por ejemplo, en el caso del crecimiento de los nios, se es-
pera que estos crezcan (aumenten de talla), y engorden (aumenten
de peso).
A diferencia de la grfica que refleja el crecimiento del permetro

ceflico de los individuos de una poblacin que estara normal-
mente distribuida, el crecimiento del peso NO sigue una distribucin nor-
mal. Por el contrario, los percentiles se ubican grficamente den-
tro de lneas curvas, ascendentes, que llevan una direccin similar,
pero no necesariamente distribuidas de manera normal.
Permetros ceflicos para la edad Peso para la edad
P50
P50
Permetro
en cm
Peso en kg
Edad en meses Edad en meses
Los carriles que delimitan los percentiles del aumento de peso

tampoco son simtricos. No se puede asumir que la distancia entre el
percentil 60 y el 65 es igual que la distancia entre el percentil 35 y
el 40.
Sin embargo, en el proceso de enseanza y aprendizaje del uso de las

curvas de crecimiento correspondientes al peso para la edad y la talla
para la edad, o el peso para la talla, es fcil caer en la confusin y ter-
minar creyendo que se trata de lneas paralelas, a las cuales tambin le
aplican las matemticas de las distribuciones normales y no las de las
distribuciones no normales.
Del mismo modo, sucede que muchos interpretan los percentiles como
si se tratara de desviaciones estndar. O a las medidas de posicin como
si fueran medidas de dispersin. No obstante, se equivocan.
El que las lneas de los percentiles lleven la misma direccin no

significa que sean paralelas todo el tiempo, como tampoco que las
distancias entre unos percentiles y otros sean simtricas.
El que P50 divida el grupo en dos mitades con respecto a la po-

sicin de los inferiores y los superiores no significa que los otros
valores hacia arriba, por ej. P75y hacia abajo P25, sean equidistan-
tes.
El hecho de que en una poblacin distribuida de manera abso-

lutamente normal coincidan el promedio, la moda y la mediana,
no significa que en poblaciones no normales deban coincidir. De
hecho, no lo hacen.
La mediana 90.5 de un grupo de 10 personas que pesan 10, 20, 30,

40, 90, 91, 92, 93, 94, 95 no es un valor simtrico entre 10 y 95. El
promedio 65.5 tampoco es igual a la mediana.
Los centiles -entre ellos la mediana- no fueron hechos slo para medir
poblaciones con distribuciones normales.
Ahora dmosle algunos nombres tiles a ciertos percentiles.
El Percentil 50 es la Mediana, y tambin es el Cuartil Q2 de la caja

con bigotes de gato. La recuerda?
Q1, el Cuartil 1, es el Percentil 25; Q3 el Percentil 75, y Q2, ya lo

dijimos, el Percentil 50 o la misma Mediana.
Caja con bigotes de gato

Caja central y bigotes de gato: No necesariamente simtricos
Outlier ms grande.
Outlier (punto lejano) Punto lejano ms grande.
ms pequeo. Uno de los pelos de gato.
Q1 Q2 Q3
Mediana
En este captulo veremos una aplicacin prctica de las medidas de disper-

sin y de las medidas de posicin en el campo especfico de la epidemiologa
nutricional y de la salud pblica nutricional.
En su compaa trataremos de ver la diferencia entre las grficas de

crecimiento que usan percentiles, y las grficas que usan los puntajes
Z, tambin intentaremos entender que a pesar de estar relacionadas, las
curvas de crecimiento usadas en la consulta individual del nio sano
de manera secuencial, pueden causar confusin cuando se aplican para
evaluar riesgos nutricionales en una ocasin nica, tanto de nios como
de poblaciones.
El no poder ver cunta profundidad conceptual tienen las grficas de

seguimiento y los puntajes Z ha llevado a muchas confusiones y dificul-
tades en su interpretacin y uso.
Para usar adecuadamente y con utilidad las grficas de crecimiento y los

puntajes Z, es necesario tener presente que:
Se puede hacer seguimiento de poblaciones o de individuos. Lo

mejor sera a travs de varias tomas, como se hara al juntar fotografas
en la cinematografa.
Se pueden medir poblaciones o individuos en un momento

dado nico, como sucede cuando se toma una foto. Con la foto o con
la medicin nica se puede hacer un diagnstico, calcular un riesgo y
tomar las acciones correspondientes. Pero no se puede condenar de
por vida a alguien con un diagnstico puntual.
Su uso en una u otra circunstancia depender de qu tanto se entiende

la teora sobre la cual se construyeron las curvas de crecimiento y los
puntajes Z.
Aunque estn ntimamente relacionadas, las grficas de crecimiento

que son curvas y usan percentiles, y las del puntaje Z que son rectas,
tienen su uso especfico.
Los puntajes Z fueron introducidos en el campo nutricional como

respuesta a las dificultades que se encontraron cuando nutrilogos
destacados, como el mexicano Gmez, intentaron usar las curvas de
crecimiento y el concepto de percentiles en las que se basaban per-
tenecientes a las matemticas de las curvas para hacer clasificaciones
de riesgo y no para hacer el seguimiento hacia el cual estaban disea-
das. Si la Clasificacin de Desnutricin de Gmez se hubiera basado
en la lnea recta y en puntajes Z, hubiera sido til. Pero no lo fue y por
eso se abandonaron. La confusin heredada desde la poca de Gmez
persiste en la mente de muchos y continuar mientras no se entienda
la racionalidad del uso de las grficas y los conceptos de percentiles
y puntaje Z. Un desafo grande para pediatras y otros profesionales,
quienes a pesar de su nivel educativo tampoco entienden toda la racio-
nalidad y han menospreciado la complejidad aparentemente simple de
las grficas de crecimiento.
Curvas de crecimiento
Examine el siguiente dibujo:
Con un poco de imaginacin, podra ser una carretera de una sola di-
reccin en una regin desarrollada. Mire cmo hay una lnea en el cen-
tro para orientar a los conductores. Y por fuera de las lneas por donde
circulan los carros hay dos bermas de seguridad pintadas de gris.
Hace ms de treinta aos, este tipo de carretera le sirvi a David Mor-

ley, MBE, Profesor Emrito del Instituto de Salud del Nio de la Uni-
versidad de Londres, para proponer su interpretacin de las grficas
de crecimiento infantil como un camino siempre ascendente hacia la
salud. De hecho, Morley las llam El camino de la salud e intent
simplificarlas al mximo.
Este es un esquema del modelo de Morley. Note que elimin las ber-
mas de los extremos.
Percentil 50
Percentil 95
Peso en
Grfica de crecimiento. kg
Peso sobre talla
Percentil 5
6 12
Edad en meses
Morley tambin evit pintarle muchos carriles a la grfica, como lo ha-

can tradicionalmente los pediatras, porque en su experiencia, cuando
por alguna circunstancia los nios cambiaban entre carriles muy estre-
chos, muy sensibles a los cambios desfavorables, eran estigmatizados
de inmediato como desnutridos, sin que se beneficiaran de tal adjetiva-
cin. Por sobre todo, Morley insista en el uso frecuente de la grfica
para la deteccin temprana de tendencias que podan ser corregidas si
se identificaban a tiempo, ms que para hacer diagnsticos de estado
nutricional basados en una sola medicin.
La grfica que sigue muestra que en un nio especfico, ms que su

localizacin en un momento dado en un percentil reflejado por los
puntos grandes, lo que importa es la tendencia a la direccin que lleve
su propia lnea curva de peso.
Grfica de crecimiento peso para la edad
En un nio especfico, ms que puntos

aislados en un momento nico (su ubicacin
en un carril estrecho limitado por percentiles)
importa la direccin que siguen en la grfica
Se trata, obviamente, de una grfica exagerada. Pero aun as:
Se atrevera usted a decir que el nio cuyas huellas pintadas en verde,

que va por la lnea del percentil 5, est en peligro? O que el nio cuyas
huellas estn pintadas de rojo en el momento en que cruza la lnea del
percentil 50, por estar en el percentil 50, est sano? Algunos insisten en
interpretarla de ese modo.
Si en la grfica anterior el punto rojo fuera interpretado aislada-

mente en el momento en que cruza el percentil 50, y el nio fuera
clasificado como sano, dicho nio se deteriorara demasiado tiem-
po sin que nadie hiciera nada.
Si el nio de los puntos verdes de la lnea ms inferior hubiera sido

clasificado como desnutrido, se habra cometido una gran injusti-
cia con su madre - vamos a suponer que fue un nio con peso bajo
desde el nacimiento - que lo ha cuidado tan bien y lo lleva sano por
su carril inferior.
Morley le dio especial nfasis al uso del peso para la edad ms que al
uso del peso para la talla o el de la talla para la edad, porque crey que
el peso para la edad solo daba informacin suficientemente buena, fcil
de usar y de interpretar, a menor costo. No menospreci la utilidad de
la medicin de la talla en cada evaluacin del nio, ni el uso de grficas
en las cuales se contrastaban el peso con la talla, pero saba cun difcil
es tallar bien y hacerlo consistentemente. De la experiencia haba apren-
dido cuntos errores se cometen en la medicin de la talla rutinaria de
los nios. Por otra parte, Morley y otros se haban dado cuenta de que
a veces la talla de los nios pareca esttica por ciertos periodos sin que
los nios dejaran de ganar peso o estuvieran mal clnicamente, tambin
cmo en otros momentos de la vida del nio la talla daba saltos ines-
perados entre mediciones -como si los nios se estiraran mgicamente
de un da para otro- . Al contrario de lo que ocurra con el peso, la talla
no se encoga, a no ser que estuviera mal medida, y para detectar cam-
bios, especialmente el dficit de talla, habra que esperar meses.
Sin querer entender el propsito de Morley y la practicidad que quiso

darle al instrumento de seguimiento de los nios al volverlo sencillo,
o de su intencin de masificar las grficas y darles el control a las ma-
ms, algunos criticaron su grfica de peso e insistieron en mantener el
uso de las grficas de peso para la talla con carriles entre percentiles
bastante estrechos, y numerosos carriles como la grfica ms sensible
para detectar enflaquecimientos indeseados tempranamente y actuar a
tiempo.
Esa sigue siendo la verdad ms aceptada en la actualidad.
Pero permanece an como un desafo lograr que las grficas de creci-

miento no slo proporcionen la mayor informacin y la ms exacta al
menor costo, sino que tambin en la prctica real sean bien usadas y bien inter-
pretadas por los equipos de salud y las madres dentro de los contextos
de la atencin primaria.
Hay otro punto importante: Morley, que saba de los errores cometidos
antes por Gmez, quiso evitar interpretar los carriles inferiores de la
grfica como si fueran carriles siempre peligrosos y, sobre todo, siem-
pre diagnsticos de desnutricin.
Qu hizo Gmez y cul fue el error para que su clasifica-

cin de desnutricin fuera abandonada?
Era obvio que en determinadas circunstancias se necesitaba clasi-
ficar el estado de nutricin de poblaciones tanto como la de indi-
viduos aislados, para emprender acciones de salud pblica basadas
en los riesgos identificados; por ejemplo, en casos de hambrunas,
o cuando se identificaran poblaciones en riesgo.
Tambin era obvio que en cada caso individual, todo nio debera
tener su propia grfica de crecimiento para vigilar si segua por su
carril o si se desviaba y, al comenzar a hacerlo, tomar las medidas
pertinentes. La luz de los semforos
solo se aplica para un
momento dado.
El problema es que para hacer su clasificacin de grados de desnu-
tricin, Gmez apel al uso de grficas de crecimiento individuales
construidas a partir de poblaciones de referencia. Quienes iban por
los carriles del centro estaban relativamente seguros y a medida que se
alejaban de l hacia abajo en esa poca no se insista con la fuerza de
hoy en los riesgos de la obesidad se clasificaban en Desnutridos I,
Desnutridos II o Desnutridos III.
Algunos creativos apelaron al semforo y pensaron que el smil educa-

tivo estaba exento de todo peligro.
Con el tiempo, la parte inferior de la carretera se convirti en una zona

de peligro permanente.
Una interpretacin P50

tercermundista de la
grfica de crecimiento
Peso
en kg
Edad en meses
La parte inferior del camino se

convierte en rea de peligro
En el modelo con los colores del semforo, todo lo que estuviera por
debajo de una franja verde ideal se calificaba como de riesgo: el ama-
rillo era para estar alerta y el rojo definitivamente condenaba, mientras
ms abajo, peor. Los nios prematuros estaran siempre condenados
y sus mams seran castigadas cada vez que vinieran a la consulta de
seguimiento de sus bebs.
El principal error de Gmez

Pero el principal error de Gmez fue olvidar que unas son las mate-
mticas de las curvas usadas para evaluar el crecimiento individual (dis-
tribuciones no normales) y otras las matemticas de las distribuciones
normales. Las grficas de seguimiento individual estaban construidas
sobre datos obtenidos de poblaciones de referencia, que no se distri-
buan normalmente. Si Gmez hubiera transformado los percentiles de
las curvas en puntajes Z, hubiera logrado una grfica como la siguiente,
y esa s hubiera sido til.
Desnutricin I
Desnutricin II
Desnutricin III
Es decir, Gmez fall al no identificar que haba que pasar del lenguaje
de los percentiles y las distribuciones que no eran enteramente nor-
males, al lenguaje de las distribuciones normales, los puntajes Z y las
desviaciones estndar.
Clasificacin de Gmez basada en el Peso para la Edad:
I Desnutricin leve: Deficiencia del 25% o menos del peso que un

nio debe tener con relacin a su edad (toma como peso ideal la me-
diana de una poblacin de referencia).
II Segundo grado de desnutricin. Desnutricin Moderada. Defi-

ciencia del 26 al 40% del peso con relacin a la edad (toma como peso
ideal la mediana de una poblacin de referencia).
III Tercer grado de desnutricin. Desnutricin severa. Deficiencia

mayor del 40% con relacin a la edad.
Como no funcionaba por usar percentiles y las matemticas de la curva

no eran las mismas, la clasificacin de Gmez fue remplazada por la
clasificacin del NIHS (National Institute for Health Statistics) basada, esta
s, en el Puntaje Z.
Clasificacin del NIHS basada en el Peso para la Edad
Desnutricin leve: cuando el peso del nio se encuentre entre de - 1

a -1.99 DS con relacin a su edad.
Desnutricin moderada: peso del nio entre - 2 y -2.99 DS con rela-

cin a su edad.
Grave: peso del nio igual o menor de 3 DS con relacin a la edad.
Tanto la clasificacin de Gmez como la del NIHS escogieron el peso

para la edad con el fin de identificar tipos de desnutricin.
La notacin empleada en las clasificaciones anteriores, con grados que

indican severidad, no es la ms apropiada para describir riesgos, que
es lo que ahora nos interesa. Para ello sera ms conveniente hablar de
riesgos bajo, medio o alto, que se interpretaran como probabilidades
baja, media o alta de estar efectivamente desnutrido. Pero nada de adje-
tivos que denoten gravedad o severidad.
Posterior a las clasificaciones de Gmez y el NIHS, vino la clasificacin

de Waterlow, quien volvi a usar los percentiles y las matemticas de las
curvas para hacer la clasificacin de estado nutricional y la desnutricin.
Sin embargo, Waterlow no us el peso para la edad, sino el peso para la
talla y la talla para la edad.
Clasificacin de Waterlow
Grados de Desnutricin
ndice usado: Normal Leve Moderado Grave
% con relacin al
percentil 50
Peso para la talla 90110 8089 7079 <70
Talla para la edad 95105 9094 8589 <85
Ms recientemente se ha usado una clasificacin de desnutricin basa-

da en el dficit identificado del peso o la talla para la edad, o del peso
para la talla.
Segn lo anterior, se dijo que:

Desnutricin aguda: Dficit del peso para la talla.
Desnutricin crnica: Dficit de la talla para la edad.
Desnutricin global: Dficit del peso para la edad.
Dicha clasificacin tambin ha sido criticada, en esencia porque no
tiene el poder discriminatorio que se le atribuy y no ayuda a tomar
decisiones.
Qu se recomienda hoy
Ms que clasificar a los nios en grados de desnutricin, hoy se reco-
mienda tener en cuenta dos indicadores que todos entienden muy bien
y deberan poner a funcionar todas las alarmas, as como todos los re-
cursos mdicos, nutricionales y sociales en individuos y poblaciones.
Hambre
Enflaquecimiento (wasting)
Tambin se habla de talla baja (stunting, en ingls), como resultado de no

haber crecido de manera apropiada en los momentos en que se define
la talla, especialmente en las primeras etapas de la vida (periodos intrau-
terinos y primeros meses posparto).
El enflaquecimiento, entendido como dficit del peso para la talla, es un

indicador muy sensible. Las grficas de seguimiento con el nmero ade-
cuado de carriles limitados por los respectivos percentiles, permitiran
detectar a un nio que no est recibiendo suficiente alimento (failure to
thrive), antes de que la falta de ingesta logre causar sus efectos nocivos
y permanentes en la salud del nio.
En situaciones de emergencia se usan clasificaciones como la siguiente,
tambin basada en el peso para la talla, pero que usa puntajes Z en vez de
percentiles:
Carril entre Z=0 (p50) y Z= +1
Carril entre Z=0 y Z= -1. Normales
-2 y -1 DE. Medianamente desnutridos
-3 y -2 DE. Moderadamente desnutridos

Por debajo de -3 DE. Severamente desnutridos. Se hospitalizan en el Centro
Teraputico de Recuperacin Nutricional.
Pero ya se trate de hacer diagnsticos individuales o poblacionales en

momentos nicos, o de hacer seguimientos a lo largo del tiempo, o de
usar percentiles para expresar dficit con relacin a un punto medio
P50, o puntajes Z, es necesario entender:
De dnde se obtienen los datos para construir las curvas (las
poblaciones de referencia).
Por qu se organizan en forma de percentiles.
Cmo se construye un puntaje Z a partir de los datos de la po-
blacin de referencia.
Cmo se logra una representacin grfica adecuada de los datos.
Qu es una Poblacin de Referencia

Antes de responder esta inquietud, primero trate de aclarar usted la
siguiente pregunta:
Suponga que debe usted construir una nueva grfica de referencia para
Bogot. Cmo escogera a los nios para construir esa nueva grfica y
decidir si estn creciendo bien o mal?
Se trata, desde luego, de una situacin hipottica. Suponga que le ofre-

cen un presupuesto ilimitado para construir dicha grfica de peso. Esta
ha sido propuesta por alguien que rechaza toda forma de imperialismo
cultural o cientfico y aduce que los nios colombianos crecen de ma-
nera diferente a los nios europeos o norteamericanos, en los cuales,
segn el acucioso funcionario, se basan las grficas usadas en la actua-
lidad.
Cmo construira usted la grfica?
Hay varias cosas que usted ya sabe, entre otras, que tendr que seguir a
los nios durante el tiempo necesario para construir la grfica. Es una
verdad de Perogrullo.
Tras muchas otras consideraciones, finalmente el grupo tiene que en-

frentarse a la pregunta ms importante.
De dnde se escogen los nios para hacer la grfica?
Casi invariablemente, al hacer esta pregunta los participantes de la se-

sin sacan a relucir su talante democrtico y, con ms vehemencia unos
que otros, todos deciden por muestras representativas tomadas al azar
(en eso insisten todos y las llaman con el anglicismo muestras rando-
mizadas), eso s de todos los barrios y clase sociales. Insisten en incluir
los barrios marginales.
El expositor re. Una vez ms los participantes del curso se han dejado
traicionar por su espritu de justicia y democracia.
La respuesta viene en el cuadro que sigue:

Las poblaciones de referencia no son un ejercicio

de democracia
Una poblacin de referencia es una poblacin tericamente ideal, de nios sanos,

bien alimentados y con todos los esquemas de vacunacin completos, que crecen en
medios higinicos adecuados, cuyas madres son educadas, no fumadoras en lo posible.
Aquellos nios y nias con quienes yo quisiera comparar a mis hijos si tuviera que
compararlos con alguien.
Ni yo ni usted, ni nadie, quisiera tener un hijo que crezca con limita-

ciones, con hambre, o estuviera expuesto a infecciones, o fuera vctima
de las inequidades que sufren los nios de las reas marginales. Si yo
quiero comparar a mi hijo con alguien, posiblemente lo haga con los de
los barrios de estrato alto, bien alimentados, limpios, etc.
Por ello, en las grficas de peso normales no se incluye a nios pre-

maturos ni nacidos como producto de embarazos mltiples, tampoco
nios con anomalas congnitas.
Las poblaciones de referencia se definen segn el conocimiento del

momento sobre lo que es un nio ideal.
Antes del auge del rescate de la lactancia como mtodo incomparable

de alimentacin infantil y de los estudios de K. Dewey, de la U. de Cali-
fornia, las referencias usadas en todo el mundo se basaban en nios de
los Estados Unidos. Sus medidas, tomadas en los aos veinte y treinta
del siglo XX, correspondan a las de nios alimentados con bibern, se
trataba de las curvas del NIHS (National Institute of Health Statistics)
de los Estados Unidos. Dichos nios terminaron siendo obesos y ms
tarde empezaron a pagar como adultos un alto precio en enfermeda-
des cardiovasculares y todo el espectro de enfermedades crnicas de la
holgura.
Por ello, se hicieron las nuevas grficas de referencia de la OMS, basa-

das en nios alimentados esencialmente segn las recomendaciones de
hoy: lactancia materna exclusiva sin ningn otro alimento durante los
primeros seis meses de vida y a partir de esa edad, lactancia continua
junto con adecuada introduccin de slidos y otros alimentos.
Las mediciones de las poblaciones de referencia dan como resultados

percentiles, que aunque estn colocados en los extremos, corresponden
a medidas de nios sanos.
Del Percentil 5 para abajo estaran los flacos. Pero no hay que olvidar
que por flacos que nos parezcan, si se toma un solo punto de corte, es-
tos individuos son los ms flacos de una poblacin tericamente ideal.
Del Percentil 95 para arriba estaran localizados los gorditos de una

poblacin normal ideal.
El Percentil 50 seguira siendo el punto exacto por encima del cual es-
tn 50% de los valores superiores y por debajo del cual estn 50% de
los valores inferiores de una poblacin.
Percentil 50 = Mediana = Z, cuando Z = 0
Pero de ninguna manera puede usted asumir que la distribucin (la

dispersin) de los valores obtenidos tiene la forma de una campana de
Gauss como la siguiente:
Percentiles si se tratara de una distribucin Gaussiana normal
3 5 10 25 50 75 90 95 98
Para que los valores de los percentiles se puedan usar de manera equi-
valente a los de una curva normal, es preciso transformarlos en algo
ms parecido a la campana anterior, es decir, hay que normalizarlos.
Puntaje Z
(X - P50)
Z = ----------------
DS
El Puntaje Z o Puntaje Estndar es un puntaje (una cifra) que indica qu

tan lejos y en qu direccin hacia arriba o hacia abajo (o hacia la izquier-
da y hacia la derecha) se desva un tem o individuo del promedio de la
distribucin (de Z = 0). Dicho puntaje est expresado en unidades
de su desviacin estndar de su poblacin de referencia. Las ma-
temticas de la transformacin Z son tales que si todos los temes indivi-
duos de una distribucin se convierten en su puntaje Z, los puntajes
as transformados necesariamente tendrn un promedio de cero y una
desviacin estndar de 1.
Tericamente, el puntaje Z usa la gama de valores de la distribucin Z

y podra ir desde -3 hasta +3. En la prctica, las franjas que van cerca
del Z = 0 o entre el 0 a +1 por arriba y el 0 a -1, son las franjas de los
valores ideales
Representacin grfica tpica del puntaje Z
Ahora, para hacer una representacin grfica coherente, tendremos

que hacer una transformacin visual.
En la lgica visual de casi todos nosotros, al girar la campana 90 (esta

vez la giraremos hacia la derecha), los valores negativos (rojo en nues-
tro cdigo de colores) deberan quedar hacia abajo. Pero eso no sucede,
sino que los valores positivos (azules) quedan por debajo de los nega-
tivos (rojo).
Valores negativos Valores positivos
Al rotar la campana 90o los valores negativos (en rojo) quedan arriba,
algo que no encaja en la logica visual de la mayora de nosotros.
Esto es algo que va en contra de la interpretacin universal de poner

arriba los valores positivos y abajo los negativos. Para transformarlos
en la expresin grfica de puntaje Z ms conocida, rotamos de la si-
guiente manera:
Z=0
Primero rotamos 180o sobre el eje vertical la y ahora si, rotamos la grfica 90o a la derecha,
parte azul, y 90o la parte roja, de manera que los con lo cual los valores positivos quedan por arri-
valores negativos queden transitoriamente a la ba y los negativos por debajo del punto en que
derecha. Z=0
Ahora s, mediante las maniobras de transformacin, los puntajes posi-

tivos, en azul, quedan arriba y los negativos, en rojo, abajo.
La forma ms comn de la representacin de los puntajes Z usa una

lnea horizontal en el centro, sta corresponde al punto Z = 0 (la misma
mediana o percentil 50). Hacia arriba se colocan los puntajes de Z =
+1; Z = +2; Z = +3 e intermedios, hacia abajo los valores negativos
correspondientes.
Valores
positivos
Z=0
Valores
negativos:
-1, -2, -3
Tambin se representa en forma de caja y sin colores.
O con colores, que sugieren que los puntajes dentro de los cuales se
debe encontrar la mayora de valores en una poblacin normal, deben
estar en el rango comprendido entre +1 y -1. Mientras ms se alejen los
valores de Z = 0, menos normales son.
Ms 3
Ms 2
Ms 1
Z=0
Menos 1
Menos 2
Menos 3
Revise de nuevo las grficas de peso.
Haba notado ya que los carriles donde estn situados los valores ne-
gativos con relacin al percentil cincuenta estn en la parte de abajo, es
decir a la derecha, donde deberan estar los valores positivos? Y que
una campana como la que va montada en las curvas de crecimiento no
podra ser una campana de Gauss?
Transformacin de una distribucin
Z en un puntaje Z. Ejemplo de la
grfica de crecimiento.
Percentil 50
Percentil 5
Note que los carriles con huellas en rojo que corresponderan a los
percentiles bajos, en la campana de Gauss, antes de transformarla,
corresponderan a los valores positivos en azul
Si quisiera representar los percentiles transformados en puntajes Z con

la Z = 0 (el percentil 50) como una lnea totalmente horizontal, obten-
dra lo siguiente:
Z=0
Puntajes negativos de Z
por debajo de la lnea
de Z = 0
Las nuevas grficas de crecimiento de la OMS

La siguiente grfica muestra cmo sern las nuevas grficas de la OMS
para el seguimiento individual de nias y nios. En tonos ms plidos y
en lneas continuas aparecen los antiguos patrones de crecimiento.
Ya dijimos que las grficas de crecimiento anteriores a estas, que an se

usan en la mayora de consultorios, se basan en lo que se consider des-
de 1928 como poblacin de referencia. Sabemos ahora que para crecer
de manera ideal, los nios no deben recibir bibern sino que deben ser
amamantados exclusivamente durante los primeros seis meses y seguir
siendo lactados por largo tiempo (dos aos o ms). Si se continuaran
usando las antiguas grficas de crecimiento, los nios amamantados
estaran en desventaja en comparacin con aquellos que reciben bibe-
rn, especialmente despus de los primeros seis meses, pues siempre se
veran flacos aunque estuvieran sanos, felices y recibieran alimentacin
complementaria adecuada a partir de los seis meses de edad. La repre-
sentacin grfica de lo descrito sera la siguiente:
Puntajes Z de los nios amamantados si la poblacin de

referencia continuar siendo la usada desde 1928
Z=0 representara
el crecimiento de
la poblacin ideal
aqu en azul
Z=0
1 2 3 4 5 6 7 8 9 10 11 12 meses
La lnea roja representara los puntajes z de los nios amamantados
Al cambiar la poblacin de referencia por la nueva, la lnea roja tomara

el lugar de la azul, pues sera la poblacin de referencia, y los nios que
reciben bibern, en especial despus de los seis meses, se empezaran a
ver obesos con relacin a la nueva poblacin de referencia.
Comportamiento de los nios alimentados con bibern

cuando se usa como poblacin de referencia nios
amamantados
Z=0
1 2 3 4 5 6 7 8 9 10 11 12 meses
El cambio de un paradigma por otro que significa el uso de una nueva

poblacin de referencia en el diseo de nuevas grficas de crecimiento
traer un desafo tcnico y educativo grande. El estudio multicntrico
de la OMS dur ms de quince aos y se invirtieron por encima de US$
10 millones. Muchos ms dlares sern necesarios para disear y distri-
buir las nuevas grficas de uso individual y lograr que los trabajadores
de la salud las usen correctamente. Mientras ello se logra, pasaremos
por un periodo difcil durante el cual estos profesionales seguirn reci-
biendo presiones de las casas productoras de frmula infantil y otros
grupos comerciales que condicionan a madres y pediatras para que su-
plementen innecesariamente a sus nios, con la excusa de que se estn
desnutriendo.
Otro ejemplo de la aplicacin prctica de los conceptos

expresados
La experiencia ha mostrado cun til puede ser la grfica del camino

de la salud y los percentiles en el seguimiento de pesajes repetidos de
un mismo nio. Por eso y por ser fcil de entender, estas grficas las
conservan las mams y no los servicios de salud.
Por el contrario, si se trata de medir el peso o la talla de un nio en

una situacin de emergencia, o cuando se quiere hacer un diagnstico
del estado nutricional de una comunidad completa, es decir, cuando se
cuantifican las distribuciones de los riesgos de ser anormales, es ms
gil y ms til la representacin del puntaje Z en la lnea horizontal con
los valores positivos arriba y los negativos abajo.
As pues, no se prestara a confusiones ni los profesionales de la salud

andaran repitindoles a las madres que sus nios, si van por los carriles
de abajo, estn desnutridos.
Ejemplo de Dadaab en el frica oriental
Dadaab es un campo de varios campos de refugiados situados en la

parte desrtica del oriente de Kenia.
Desde hace ms de 15 aos, a raz del conflicto interno de Somalia,

muchos somales musulmanes fueron desplazados de su pas y no han
sido admitidos en ningn otro.
Las condiciones de vida son miserables: estn en medio del desierto

en un terreno con poca agua. No pueden salir del territorio que les
han asignado, el cual est cercado y custodiado por militares armados
hasta los dientes, porque Kenia aduce que no los podra absorber pues
desestabilizaran la economa. No pueden regresar a Somalia, pues los
mataran. No pueden tener posesiones ni economa formal, pues es-
tn de paso. Llevan 15 aos de paso. Son ms de 130.000 personas en
medio del desierto que dependen para su supervivencia de la Oficina
para Refugiados de las Naciones Unidas y de otras ONG como CARE
y agencias alemanas, y de otros pases, que contribuyen con la adminis-
tracin de la ciudadela y la provisin de vivienda, comida, agua y salud
bsicas.
Cada persona tiene derecho a 15 litros de agua por da para aseo y co-
mida. La racin diaria por persona no es mayor de 1 500 kcal. Escasa-
mente para sobrevivir. El desierto no produce mucho.
A pesar de que las mams son estimuladas para que lacten, y muchas
lo hacen, otras caen en la tentacin de darles frmula infantil a sus
bebs. Y estos, por supuesto, se desnutren y mueren si las mams no
logran relactarlos. A los ms enfermos hay que remitirlos a los Centros
Teraputicos de Recuperacin Nutricional. Pero estos viven llenos. No
hay espacio para tantos. Y no se debe admitir a todos, pues se pueden
infectar ms fcilmente cuando estn admitidos.
Cul es el criterio de admisin a la unidad?

-Todos -dira usted- Y si estuviera alguna vocacin por discursos polti-

cos dira que esos centros no deberan existir, que debera existir justicia
social. Que habra que forzar el cambio De acuerdo! Pero si mientras
tanto usted cnicamente se queda sin hacer nada, sera lo mismo que si
yo no le hiciera nada a ningn enfermo y no corriera a salvar a ningn
herido si al fin y al cabo todos nos vamos a morir algn da.
Por eso se han dado recomendaciones tcnicas para las situaciones de

emergencias y desastres. Estas son algunas de ellas:
1. Vigilar a todas las madres gestantes y prepararlas para que lacten

exitosamente a sus hijos desde que nazcan.
2. Decidir qu poblaciones infantiles necesitan ayuda ms especia-

lizada para que sus madres los puedan lactar desde que nazcan,
entre ella se incluye a los nios prematuros y en cualquier instante
los nios visiblemente flacos o bajos de peso. Es una decisin
clnica que no necesita que usted espere por la balanza.
3. Los nios visiblemente flacos pueden estar: a) medianamente

desnutridos (mildly malnourished) si al medirles el peso para la
talla se encuentran entre -2 y -1 desviaciones estndar por debajo,
o si tal medida es 80% de la mediana; o b) moderadamente des-
nutridos, cuando estn entre -3 y -2 desviaciones estndar, o si tal
medida es entre 70 y 79% de la mediana.
4. Se hospitaliza en los Centros Teraputicos de Recuperacin Nutri-

cional a los nios Severamente Desnutridos, aquellos que estn
por debajo de 3 desviaciones estndar o tienen menos del 70% de
la mediana de peso para la talla. Todo esto es ms fcil de ver en
una grfica como la siguiente.
-2 y -1 DE. Medianamente desnutridos
-3 y -2 DE. Moderadamente desnutridos

Por debajo de -3 DE. Severamente desnutridos. Se hospitalizan en el Centro
Teraputico de Recuperacin Nutricional.
Resumen de algunos conceptos

1. Poblaciones e individuos se pueden medir una vez o varias veces
para hacerles seguimiento e identificar tendencias potencialmente
dainas a tiempo. Pero si solo se tiene disponible una medida, en
especial aislada del contexto clnico global y de la observacin de
otros aspectos fsicos distintos a las mediciones antropomtricas,

esta debe ser interpretada ms como un riesgo que como un diag-
nstico definitivo. Si la medida clasifica al nio dentro de los de
riesgo alto, a este nio se le debe seguir ms de cerca.
2. El lenguaje y los instrumentos que se usen expresarn mejor o

peor el mensaje que se quiere expresar. Pero todos los profesiona-
les deben entender de qu se tratan unos y otros.
3. En el seguimiento individual, especialmente en la consulta de cre-

cimiento y desarrollo, puede hacer mucho dao el uso de adjeti-
vos que clasifican no solo el estado nutricional del nio sino la
habilidad de crianza de la mam. Sobre todo si estos se repiten
de manera recurrente. Desnutrido, riesgo de desnutrido, flaco o
gordo suelen ser palabras que bloquean la intervencin y la des-
valorizan.
4. En poblaciones se hace obligatorio hablar de desnutricin pero

tambin se debe tener cuidado con el uso del trmino. El punto
de corte usado -1.0 DS o -1.5 DS implicar que un poltico ines-
crupuloso puede hacer propaganda a favor o en contra de una
inversin de salud pblica, o usar un diagnstico poblacional en la
condena de un enemigo.
5. Las clasificaciones son muy tiles en situaciones de emergencia, en

la valoracin de individuos, cuando es obvio que el nio est des-
nutrido. Con una buena clasificacin se har mejor administracin
de magros recursos de salud y alimentacin.
6. La flacura y el hambre reflejan cun desigual es una sociedad. Am-

bas, flacura y hambre, pueden ser identificadas a tiempo e inter-
venidas. Es ms fcil identificar a un nio que empieza a quedarse
flaco cuando los carriles que delimitan los percentiles son estre-
chos, y cualquier cambio de canal pone en alerta a los cuidadores.
7. Si el nio est clnicamente bien, si va por su carril y sigue la di-

reccin esperada, no hay que tratarlo como un nio de riesgo cada
vez que venga a la consulta simplemente porque est en los carri-
les correspondientes a los percentiles bajos. Pero sobre todo no
hay que suplementarlo, en especial no hay que suplementarlo con
frmula lctea infantil ni tratar de hacerlo subir de carril como
si esta accin fuera inocua. Dichas conductas las han usado las
industrias de alimentos y los pediatras para suplementar nios in-
necesariamente.
Cuando se usa por fuera del contexto en que podra ser realmente til,
por ejemplo en situaciones de emergencias y desastres, y en hambru-
nas, quienes usan dicho modelo:
Se suelen equivocar al tomar un punto nico para interpretar toda

una tendencia.
Se olvidan del lado de arriba del camino, que tambin tiene su

propio abismo: el de la obesidad, la hipertensin, la diabetes, la
enfermedad cardiovascular y todas las enfermedades que hoy son

una verdadera epidemia en el mundo.
Convierten la grfica en una herramienta nica de decisin, inclu-

so sabiendo que la desnutricin es algo ms global que involucra
la historia de cada embarazo, el peso al nacer, los antecedentes. Es
un diagnstico en el que cuentan, tanto como el peso o la talla,
otros parmetros y medidas corporales, la actividad, la manera en
que se relacionan los nios, su sonrisa, el estado de su piel, la pre-
sencia de infecciones concomitantes o de otras anomalas.
Propuesta
1. Peso para la edad: til especialmente en periodos cortos de tiempo
para vigilar la evolucin de un nio que parece ir bien, se ve bien,
es bonito, gil, canta, es alegre. Es una propuesta que sigue la filo-
sofa de Morley. Se empieza a quedar corta cuando el nio entra
en el mundo soficisticado de la pediatra de las sociedades comple-
jas, aquellas donde habiendo toda la comida, sera imperdonable
no detectar en el nio cualquier asomo de retraso, especialmente
entre quienes van por los carriles de abajo. Aqu, cuando el nio
se enflaquece, la mejor grfica de seguimiento, bien sensible a los
cambios, es la del peso para la talla.
2. Peso para la talla. El bajo peso para la talla refleja una prdida de
peso ya sea reciente, como correspondera a lo que han llamado
una desnutricin aguda, o de ms larga duracin, como sera el caso
de nios descuidados por largo tiempo; algo que se ve en familias
disfuncionales o en situaciones econmicas difciles en todas las
sociedades. Lo cierto es que el nio se est enflaqueciendo. Y hay
que detectarlo a tiempo para que no lo siga haciendo. Seran los
nios de madres con dietas raras; aquellas que esconden sus nios
bajo las ropas o que persisten en lactar sin aumentar la produccin
de leche, o aquellas que persisten con la lactancia exclusiva en eda-
des en que el nio ya debe recibir alimentacin complementaria;
aquellas que con razn o sin ella sienten odio por el establecimien-
to profesional y no consultan aun cuando estn llenas de dudas.
Para que sea til en el seguimiento y para que refleje cambios, la
talla debe ser impecablemente medida. Sobre todo en el nio que
se estir y no ech carnes. Para que sean usadas adecuadamente,
los pediatras y otros profesionales deben estar actualizados en las
nuevas grficas de crecimiento, como la recientemente desarrolla-
da para todo el mundo por la OMS, en la cual el patrn ideal es
tomado de nios lactados segn las recomendaciones.
3. Talla para la edad. El dficit de la talla para la edad refleja un dao

permanente sobre el cual ya no es posible actuar individualmente
una vez detectado, excepto en determinadas circunstancias e inter-
venciones endocrinas u ortopdicas especficas. Se sabe que dicho
dficit se determina en etapas muy tempranas del desarrollo, con
seguridad antes del primer ao de vida, quiz en la vida intraute-
rina y an ms tempranamente, en los factores genticos. Es en
esencia un marcador de cuidado global y no de alimentacin. En
realidad, no sabemos en concreto a qu parte del cuidado respon-

de.
Este captulo se incluy como un ejemplo de la importancia que tiene

la epidemiologa nutricional en la salud pblica de cualquier regin o
pas del mundo, y como reflejo de los trabajos epidemiolgicos y las
decisiones de salud pblica en pases de ingresos relativamente bajos.
Bibliografa
Waterlow, J. C. (1972). Classification and Definition of protein Calorie

Malnutrition. British Medical Journal, 3, 566569.
Gmez F. (1943). Desnutricin. Bol. Med. Hosp. Infant. (Mex.) 3:

543.
Bengoa J. M., Jelliffe D. B., Prez C. (1959). Some indicators for a broad
assessment of the magnitude of protein calorie malnutrition in young
children in population groups. Am. Jr. Clin. Nutr,7: 714.
Mora O., Rojas J. M., Pardo F., LunaJaspe H. (1970). Somatometra

en nios de clase socioeconmica baja. Arch. Lat. Am. Nutr. Vol. XX,
marzo: 7.
Morley, D., Woodland, M. & Martin, W. J. (~963). J. Hyg., Camb. 61,

115.
Morley David, Nutrition education in rural societies
Institute of Child Health, 30 Guilford Street, London WCI
http://journals.cambridge.org/
journals.cambridge.org/production/action/cjoGetFulltext?fulltextid=
653300
Gmez, F., Ramos Galvn, R., Frenk, S., Muoz, J. C., Chvez, R., and
Vzquez, J. (1956). Mortality in second and third degree malnutrition.
Journal of Tropical Pediatrics, 2, 7783.
Jelliffe, D. P. (1966). The Assessment of the Nutritional Status of the

Community. WHO Monograph Series No. 53.WHO, Geneva.
Morley, D. (1973). Paediatric Priorities in the Developing World, p. 137.

Butterworths, London.
Sykes P.A. Errors arising through using the Harvard tables and percen-
tage levels of median weightforage in assessing nutritional status.
(1977). Archives of Disease in Childhood, 52, 391394.
Dewey K.G., Heining M.J., Nommsen L.A. et al. (1992). Growth of

breastfed and formula fed infants from 0 to 18 months. The DAR-
LING Study, Pediatrics, 89: 1 035.
Dewey K.G., Heining M.J., Nommsen L.A. et al.(1993). Breastfed in-

fants are leaner than formula fed infants at one year of age: The DAR-
LING Study, Am J Clin Nutr, 57: 140.
Dewey K.G., Peerson J.M., Brown K.H. et al. (1959). Growth of breas-
tfed infants deviates from current reference data: A pooled analysis of
US, Canadian and European data sets. Pediatrics 96: 495.
Dewey K.G. Is breastfeeding protective against child obesity? (2003). J

Hum Lact, 19: 9.
Lecturas recomendadas
http//www.who.int/childgrowth/standards/en.
http//www.who.int/childgrowth/en.
Concepto persona - tempo

11. Medidas usadas en la Epidemiologa
Antes de leer este captulo, revise de nuevo las definiciones de Razn,

Proporcin y Tasas, presentadas en la Introduccin.
Las medidas usadas en epidemiologa se pueden clasificar en tres gran-

des grupos:
1. Medidas de Frecuencia, tambin llamadas medidas de ocu-
rrencia o de distribucin,
2. Medidas de Asociacin, tambin llamadas medidas de efecto, y
3. Medidas de impacto.
La escogencia de la medida apropiada depender del nivel de medicin
deseado y ste a su vez depender, por una parte, de la hiptesis y los
objetivos de la investigacin, y por otra, de las variables disponibles.
Las medidas de frecuencia responden a las preguntas sobre cun
tos, cada cunto, qu tan probable y qu tanto riesgo existe.
Las medidas de asociacin despejan el interrogante sobre cul es
la fuerza de asociacin.
Las medidas de impacto responden a la pregunta sobre la impor
tancia del fenmeno estudiado, ya sea en el grupo de riesgo o en
la poblacin general.
Fuentes
Podemos obtener las medidas de ocurrencia de enfermedad y mor-
talidad de los registros de estadsticas vitales, de los registros de los
servicios de salud, o como resultado de la vigilancia de fenmenos o
eventos, pero tambin como resultado de estudios epidemiolgicos o
clnicos.
Medidas de Frecuencia (Medidas de ocurrencia
de enfermedad y mortalidad)
Las medidas de frecuencia se dividen en dos grandes grupos:
Medidas de incidencia, entre las cuales estn la incidencia acumu-

lada o proporcin de incidencia, y la tasa de incidencia o densidad
de incidencia.
Medidas de prevalencia, entre las cuales estn la prevalencia pun-

tual, la prevalencia de periodo y los odds de prevalencia.
Prevalencia e Incidencia
Hablaremos ahora s de Prevalencia y de Incidencia y aclararemos qu

entendemos aqu por Riesgo*. A medida que avancemos notarn que
diferenciaremos entre la Proporcin de Incidencia y la Tasa de Inci-
dencia.
*Nota: algunos usan trminos que pueden llegar a confundir a los lec-
tores que comienzan. Riesgo, por ejemplo es llamado por algunos Pro-
porcin de incidencia. No esperamos que lo entienda totalmente ahora,
pero s que est alerta ante las variaciones del lenguaje.
Prevalencia e Incidencia: lo que usted ya saba
El concepto con que probablemente usted llega a ojear este libro es que
por un lado existe la Prevalencia y por otro la Incidencia, as a secas.
La prevalencia mide el nmero de casos de una enfermedad, un proble-

ma de salud o una caracterstica ya existente en una poblacin, en un
momento determinado. En general, cuando se habla de prevalencia nos
referimos a casos crnicos y a caractersticas permanentes; sin embargo
hay que diferenciar entre dos tipos de prevalencia:
- La prevalencia de punto, y
- La prevalencia de periodo.
Prevalencia de Punto es igual al nmero de personas enfermas sobre el

nmero total del grupo en un momento dado del tiempo.
Nmero de personas enfermas
Prevalencia de Punto =
Nmero total del grupo a riesgo en un momento dado
Ejemplo:
Usted ha sido contratado como experto para que establezca si existe
una emergencia sanitaria en un campo de refugiados de Dadaab, en el
oriente de Kenia. El da siguiente a su llegada hace una encuesta para
establecer cuntas personas tienen diarrea. Visita entonces cada una
de las tiendas donde se ubican las familias y le pregunta a cada uno de
sus habitantes si ha tenido ms de tres deposiciones en el da, pues esa
es la definicin que usted y otros expertos han aceptado para determi-
nar los casos. Usted encuentra que de las 1 000 personas entrevistadas
(que constituyen el total de personas en el campo, aunque tambin
podran haber sido escogidas al azar si se tratara de un campo de refu-
giados ms grande), 200 llenan sus criterios de episodio de diarrea. La
Prevalencia de Punto de diarrea en este lugar ser el nmero de perso-
nas que llenaron los criterios de diarrea, es decir 200, sobre el nmero
de personas que usted entrevist, o el total de personas en el campo
de refugiados, es decir 1 000; P = 20 por 100 personas = 20%.
La prevalencia de punto se puede obtener para un periodo muy corto,

por ejemplo un da, como en el caso anterior, y el punto no tiene por
qu referirse a un tiempo calendario, sino ms bien a un evento. As,
usted podra hablar de la prevalencia de diarrea de la primera erupcin
del Volcn Arenas.
Prevalencia de periodo se refiere al nmero de personas enfermas en

una poblacin promedio durante un periodo de tiempo
Nmero de personas enfermas Durante un periodo
Prevalencia de periodo =
Poblacin promedio de tiempo
Aqu s se especifica un perodo, por ejemplo una semana, un mes, un

ao. Combina los casos que ocurrieron al comienzo del periodo (preva-
lencia de punto), con los que se presentan durante el periodo de tiempo
escogido, al cual se le aaden.
- Debido a que el denominador puede cambiar segn el nmero de

personas que entran o salen durante el periodo de tiempo, uno se
refiere al promedio de la poblacin. Y esta referencia al promedio y no simple-
mente a un conteo, como sucede con la poblacin de la prevalencia de punto, es
lo que la diferencia de aquella.
- Los casos se cuentan como tales, aun si mueren, migran o recaen

(nuevos episodios en una misma persona), durante este periodo.
Volvamos al estudio de emergencia sanitaria en el campo de refugia-

dos. Usted lleva tres meses en la zona y quiere saber cul ha sido la
prevalencia de diarrea en el periodo total de su estada. Los datos que
tiene de una nueva encuesta realizada a los tres meses, se resumen en
la figura 1.
100
50
200
1000 50
refugiados
550
800
50
50
Cuando usted llega A los 3 meses
En los tres meses trascurridos desde su llegada, se han presentado 200

nuevos casos de diarrea entre quienes no haban presentado diarrea al
inicio, adems de 50 nuevos casos de diarrea entre quienes se detect
diarrea el primer da. Al sumarlas, usted tendr el numerador necesario
para calcular su prevalencia de periodo. La poblacin total del campo
tres meses despus de su permanencia en l es de 850 personas (150
personas, aqu en azul claro, salieron a otro campo de refugiados o emi-
graron). La prevalencia de periodo (tres meses) ser el total de casos al
inicio, 200, ms el nmero nuevo de casos, 250; y su denominador es-
tar compuesto por una poblacin promedio (de la poblacin al inicio
y la poblacin al final): 1 000+850/2 = 925; de donde la prevalencia de

periodo es de 450/925 = 48% en tres meses.
Proporciones y no tasas. Tcnicamente ambas medidas de prevalencia

son proporciones y no tasas. Como proporciones que son, no tienen
dimensin y no deben ser descritas como tasas.
Utilidad de las prevalencias

Las prevalencias son tiles para:
- Medir la carga de un problema de salud en una poblacin.
- Estimar cul es la frecuencia de una exposicin.
- Asignar recursos en la administracin de salud pblica y los pro
gramas de promocin de la salud, as como a prevenir la enfer
medad.
Pero las prevalencias no suelen ser tiles para estudiar la etiologa de
una enfermedad.
La incidencia, por su parte, describe el nmero de casos nuevos de una

enfermedad en una poblacin. La incidencia simple (no la tasa de inci-
dencia) tambin es una proporcin.
Nuevos casos
Incidencia =
Poblacin a riesgo en el tiempo seleccionado
La incidencia incluye tres elementos:

Los casos nuevos.
Una poblacin a riego (que generalmente excluye a quienes ya
tienen la enfermedad).
El paso del tiempo. El periodo de tiempo tambin puede variar
tanto en el clculo de la incidencia como en el de la prevalencia
de periodo.
Ahora, quiere saber cul ha sido la Incidencia de diarrea en el total del

periodo de su estada. Una manera de calcular la incidencia ser dividir
todos los nuevos casos, es decir 200, sobre la poblacin a riesgo (para
el clculo de la incidencia la poblacin a riesgo es aquella que no tena
la enfermedad al inicio, es decir 200/800 = 25 por 100 en tres meses =
25% en tres meses). Note que especificamos el tiempo porque si no lo
hacemos, usted no sabra si esta incidencia equivale a un riesgo de 25
de 100 en un mes o en 15 das, etc casos en los cuales la incidencia
hubiera sido mayor de la que acabamos de obtener.
Nota aclaratoria
Como la diarrea es un evento recurrente, usualmente usted podra in-
cluir los 50 casos nuevos de los casos prevalentes en su numerador, y
tomar como poblacin de riesgo las 1 000 personas. Para enfermedades
que solo se presentan una sola vez, como sera el caso de la diabetes,
su poblacin a riesgo estar siempre constituida por aquellos que no
han desarrollado la enfermedad. No siempre es fcil definir cul es la
poblacin a riesgo porque las poblaciones estn en movimiento (como
las 150 personas que se han marchado del campo de refugiados en
nuestros tres meses, y de quienes no sabemos si sufrieron o no de dia-
rrea). En muchos de estos casos (cuando es difcil definir la poblacin
a riesgo) vamos a preferir utilizar otra medida de incidencia, como lo
veremos ms adelante.
Relacin entre Prevalencia e Incidencia

Tal vez alguien le haya dicho ya que Prevalencia = Incidencia x Dura-
cin
(P = I x D)
Esta es una ecuacin que resume de manera bastante cercana a la ver-

dad lo esencial de los conceptos expresados en este captulo, pero que
no cuenta la historia completa.
Relacin entre Incidencia y Prevalencia
Incidencia
Inmigracin
Prevalecencia
Curacin
Muerte
Emigracin
Pensemos en trminos de poblacin. Observe la figura anterior.
La incidencia depende del nmero de casos nuevos, los casos que se

van adicionando a nuestra poblacin. Los factores relacionados con
esta entrada de casos se pueden deber a tres condiciones:
1. Una es el aumento real del riesgo de enfermar de la poblacin, que

puede ocurrir por aumento de factores de riesgo (factores etiol-
gicos), como el aumento de la obesidad que lleva a aumento de
incidencia de enfermedad cardiovascular; una nueva enfermedad
que predispone a otra, por ejemplo la incidencia elevada de TB
como consecuencia del aumento en casos de VIH; el cambio en la
virulencia de un organismo, como el incremento de casos clnicos
de sepsis por Clostridium Difficile por mal uso de antibiticos.
2. Segundo, porque se identifica con ms claridad la enfermedad, ya

sea por mayor registro de casos, por mayor disponibilidad de una
tcnica diagnstica ms precisa y ms exacta, mayor conciencia
entre los mdicos de la presencia de un problema, o cambios en la
definicin de un evento; o como resultado de lo que sucede cuan-
do empezamos a hacer tamizaje de un evento en una poblacin
(aumento del cncer de mama cuando hacemos una campaa de

tamizaje con mamografa).
3. Y tercero, puede ocurrir adems que entren a la poblacin nuevos

casos, como resultado de migraciones, tal como sucede con el au-
mento de nuevos casos de neurocisticercosis en los estados del sur
de Estados Unidos a causa de la entrada de mejicanos; o lo que
sucedera con la aparicin de casos de malaria en Canad (donde
la transmisin no existe) a causa de la inmigracin de personas
provenientes del frica.
Observe ahora de nuevo la figura y notar que la prevalencia no solo

depende de la entrada de nuevos casos (la incidencia) sino tambin de
factores relacionados con la dinmica de la enfermedad, estos son:
1. Si la enfermedad se cura o no, o si la enfermedad es fatal o no.

La prevalencia de diarrea en una poblacin ser igual a la inci-
dencia si todos los episodios de diarrea se curan; la prevalencia
de diabetes podra ser mayor que la incidencia, y en general usted
esperara que su prevalencia incrementara con la incidencia, por-
que es una enfermedad incurable (la letalidad por diabetes tendra
que ser muy alta para que ambas, la prevalencia y la incidencia, se
igualaran). Una vez la letalidad de estas enfermedades incurables
se vuelve estable, la prevalencia solo disminuir si usted disminuye
la entrada de casos.
2. Igual que en la incidencia, la prevalencia depende de la dinmica

de movimiento de poblaciones: refugiados, emigraciones a otros
pases que generan la salida de casos. Por ejemplo, los pacientes
de HIV que viajan a otros pases en busca de tratamientos ms
eficaces que los ofrecidos en su lugar de origen.
Ahora entiende usted que hablar de incidencia y prevalencia no son

la misma cosa. La incidencia tiene ms importancia desde el punto de
vista etiolgico y nos puede interesar para identificar acciones de pre-
vencin primaria para evitar los nuevos casos. La prevalencia es ms
til para la planeacin de los servicios de salud porque nos dice cuntos
recursos debemos disponer para enfrentar la presencia de casos.
En otro captulo veremos otro uso importante de la prevalencia en la

interpretacin de las pruebas diagnsticas. Por ahora le adelantamos
que muchas decisiones acerca de en qu tipo de poblaciones debemos
aplicar una prueba diagnstica, depender del nmero de casos exis-
tentes de la enfermedad, es decir, de la prevalencia. As, tendremos
ms probabilidad de que una prueba detecte a los enfermos, cuando es
positiva, en poblaciones donde la prevalencia de la enfermedad es alta.
Lo nuevo para usted

Permtanos compartir los conceptos de incidencia y prevalencia de una
manera ms precisa y ms til. Comencemos por introducir, por un
lado, el concepto de Proporcin de prevalencia, a la cual la llamaremos tam-
bin riesgo de padecer una enfermedad, y por el otro, dos conceptos en los
que se usa la palabra incidencia, que aunque emparentados, son dife-

rentes: la Proporcin de Incidencia o Incidencia Acumulada (Incidencia a secas, o
riesgo) y la Tasa de Incidencia, tambin llamada Densidad de Incidencia.
Independiente de la escogencia de lenguaje, lo importante es entender

que el trmino Tasa de Incidencia, como la llamaremos de aqu en ade-
lante, lleva implcito un concepto central que nos ayudar, como pocos
conceptos de epidemiologa, a entender muchos fenmenos elusivos
hasta ahora: el concepto de personatiempo.
Entonces,
Qu es Proporcin de Incidencia. Simplemente el nmero de casos

nuevos de una enfermedad, en una poblacin, en un momento dado; es
decir, la misma idea que usted traa de incidencia a secas (como arriba).
El concepto que ms pesa en esta definicin es el de casos nuevos.
Qu describe la Tasa de Incidencia. Describe los casos nuevos de una

enfermedad en una poblacin, durante un periodo de tiempo medido
solamente por el tiempo en que la persona permanece expuesta (o pro-
tegida, segn el caso) al factor de riesgo. Aqu el tiempo se incluye en
el denominador y se mide en unidades de personatiempo. Y el concepto que
ms pesa en la definicin es el de personatiempo.
La Tasa de Incidencia incluye pues, tres elementos:

1. Numerador = nmero de casos nuevos, en especial medimos
primeros eventos.
2. Denominador = una poblacin en riesgo, lo cual implica excluir
a los que ya tienen la enfermedad.
3. El periodo de tiempo durante el cual se acumulan los casos.
Nmero de casos nuevos durante un periodo de tiempo Qu es Proporcin de

Tasa de Incidencia = Incidencia. Simple-
Total de personastiempo de observacin
mente el nmero de
Ejemplo casos nuevos de una
enfermedad, en una
Volvamos a la grfica 1. Ahora estamos interesados en la tasa del pri- poblacin, en un mo-
mer episodio de diarrea. Hasta aqu nada diferente a lo que habamos mento dado.
visto, el numerador es el mismo que el de la incidencia, 200 personas. El
cambio est en el denominador. Para calcular el total de personastiem- Qu describe la Tasa
po tenemos que saber el tiempo que cada persona ha estado expuesta de Incidencia. Descri-
(tiempo de permanencia en el campo de refugiados). Este tiempo be los casos nuevos
ser para 3 meses (el tiempo transcurrido desde cuando lleg hasta
el momento en que hizo el ltimo seguimiento). Si usted no tiene en de una enfermedad en
cuenta que 150 personas se le fueron y que todos sus casos ocurrieron una poblacin, durante
al final de los tres meses, su tasa de incidencia ser: 200/800*3=0.08/ un periodo de tiempo
personasmes, o 8 * 100 personasmes-1.
Note que ponemos la expresin personasmes elevadas a la me-

nos 1.
Qu significa entonces el concepto de personatiempo

El concepto de personatiempo expresa numricamente no solo si
las personas sufrieron o no la enfermedad, es decir, no las cuenta como
unidades sujetos de eventos dicotmicos SI o NO, sino que expresa el
total de tiempo aportado en condicin de enfermos, o como sujetos
expuestos o protegidos a un factor de riesgo. De manera que en el caso
de dos enfermos de mesotelioma, que estuvieron expuestos a asbestos
durante quince aos, no cuenta de igual manera que otro trabajador de
asbestos que estuvo en la fbrica solamente durante un ao, sino quince

veces ms; o el que estuvo expuesto a vivir 3 meses en un campo de
refugiados no cuenta igual que el que acaba de llegar hace 1 mes. La
unidad de medida para estudiar un fenmeno poblacional no es pues
la persona, sino cunto tiempo de exposicin al factor de riesgo o al
factor de proteccin aportan.
Este concepto de personatiempo y su concepto siams de tasas de inci-

dencia fueron introducidos a comienzos del siglo XX por Wade Hamp-
ton Frost, el fundador de la muy prestigiosa escuela de salud pblica de
la Universidad de Johns Hopkins en Baltimore, Estados Unidos.
Las tasas de incidencia pueden ir de cero al infinito () y se expresan

con un exponente negativo, de la siguiente manera: Doscientos perso-
nas se mueren por cada mil personas - aos de exposicin a un factor
de riesgo dado = 200/1 000 aos-1. Dicha tasa de incidencia se puede
interpretar como el recproco del tiempo 1/tiempo = 1/0.20 = 5 aos
(tiempo promedio hasta el evento); el tiempo medido en aospersona,
mesespersona etc., de experiencia o de exposicin a un factor de ries-
go, o a uno de proteccin. En nuestro ejemplo de tasa de incidencia en
el campo de refugiados tiene, por supuesto, ms riesgo y por lo tanto
pesa ms en el clculo una persona que permanece durante ms tiempo
all.
Riesgos y tasas
Hasta hace poco los epidemilogos haban intercambiado los trminos
riesgos y tasas. Lo cual da origen a algo de confusin.
Riesgo (Proporcin de Incidencia o Incidencia Acumulada)
En general, todos entendemos el concepto de Riesgo como una manera

de expresar la probabilidad de que algo ocurra, por ejemplo de que un
individuo desarrolle o no una enfermedad en un periodo de tiempo,
siempre y cuando no se muera durante ese periodo por otra causa. Esa
es la manera en que la gente comn habla de riesgos.
Sin embargo, en epidemiologa no tiene mucho sentido medir el riesgo

individual, es decir, la probabilidad de que a alguien le d una enferme-
dad, ya que cuando hablamos de personas, en su condicin de indivi-
duos, simplemente decimos que alguien tiene o tuvo la enfermedad, o
que no la tiene, o no la tuvo. No obstante, en la vida real se habla de
riesgos individuales, con los cuales se calcula la probabilidad terica de
que a alguien le ocurra un evento.
Pero los dos conceptos estn entrelazados debido a que tomamos pro-
medios de las poblaciones para calcular el riesgo de los individuos y
con frecuencia usamos los dos trminos como si fueran sinnimos.
La ventaja de usar riesgos es que se trata de un concepto que intui-

tivamente lo entiende todo el mundo, aun los no epidemilogos. Sin
embargo, tal vulgarizacin puede ser peligrosa.
Al Riesgo Promedio del grupo se le llama Proporcin de Incidencia.
Hay algunas distinciones claves:
1. Riesgo es una medida de la probabilidad (chance) de que algo ocu-

rra, por ejemplo de que un individuo desarrolle una enfermedad
en un periodo de tiempo, siempre y cuando no muera en ese pe-
riodo por otra causa. Como tal, el valor del Riesgo est entre cero
y uno y no tiene dimensin.
2. Para hacer una aseveracin sobre riesgos se requiere que se diga de

qu periodo se trata. Por ejemplo, se habla del riesgo de desarro-
llar una enfermedad coronaria en un periodo de 5, 10 o 20 aos,
y de desarrollar una diarrea en meses, o una infeccin (cuntas
horas) despus de una fractura abierta.
3. El riesgo se puede calcular como la incidencia acumulada de una

enfermedad.
Incidencia Acumulada es la proporcin de una poblacin fija (vea el

recuadro) que se enferma durante el periodo de tiempo establecido.
Poblaciones cerradas (de membresa fija)
La mayora de las poblaciones que creamos en los estudios clnicos y

epidemiolgicos son poblaciones cerradas. La gente entra al estudio al
mismo tiempo o durante un tiempo definido, que es igual para todos,
y despus de este no se permiten ms entradas. Los individuos salen
del estudio por diferentes razones: se van, se mueren, no quieren seguir
participando (figura 1A). Un ejemplo de poblacin cerrada es la que
cre en su estudio de incidencia de diarrea en un campo de refugiados.
Otros ejemplos de poblaciones cerradas son las que creamos en los
ensayos clnicos en los que asignamos a las personas uno o varios tra-
tamientos. Todas empiezan a contar como poblacin de riesgo desde
que son asignadas al tratamiento, y esperamos seguirlas a todas por el
mismo tiempo hasta observar el efecto que esperamos. El Riesgo no
se afecta si la proporcin que sale del estudio es menor del 20%,
pero por encima de esta cifra el estudio se ver significativamente
afectado.
Debido a que la poblacin es fija, cuando se calcula la Incidencia Acu-

mulada no se permite que entren individuos al denominador durante el
periodo de observacin. Por su parte, el numerador solamente puede
incluir a individuos que hacan parte de esa poblacin fija. El clculo
de la Incidencia Acumulada tambin requiere que el estatus de enfer-
medad se conozca en todos aquellos que hacen parte del denomina-
dor. Lo cual quiere decir que una vez se decida incluir a alguien en el
denominador, hay que hacerle el seguimiento necesario a esa persona,
lo cual puede ser difcil de lograr pues las poblaciones se mueven de
una manera dinmica. Por otra parte, no siempre para los participantes
en un estudio, lo prioritario es la pertenencia a un grupo que se est
midiendo.
Cuando las poblaciones que definimos son fijas y sabemos que habr
varias personas que abandonarn el estudio, tenemos otras posibilida-
des para definir nuestro denominador: 1) la poblacin a riesgo son to-
dos lo que entraron en el estudio, 2) la poblacin a riesgo son solo los
que quedan cuando acabamos el estudio, 3) la poblacin a riesgo es una
poblacin promedio (igual que lo que calculamos para la prevalencia de
periodo) o 4) la poblacin de riesgo son los que acaban ms la mitad
de los que no acaban (aquellos que no acaban son contados como la
mitad).
Fig. 2a Fig. 2b
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
Tiempo Tiempo
Desarrollan el evento Emigran o se mueren
Hay muchos estudios en los cuales los Riesgos se miden directamente,

por lo general cuando el periodo de seguimiento es corto y cuando los
riesgos que compiten entre s son suficientemente pequeos en relacin
con la poblacin en estudio, de manera que hay muy poca distorsin en
la estimacin de las Proporciones de Incidencia (Riesgos). En este caso,
el denominador es simplemente la poblacin al inicio.
Sin embargo, es difcil hacer el clculo del Riesgo (Proporcin de In-

cidencia) debido a que en la vida real hay competencia de riesgos (es decir
que si yo sigo a una persona para averiguar si se muere por enfermedad
coronaria en un periodo de diez aos, esa persona se puede morir antes
en un accidente de trfico o de un cncer). Debido a esta competencia de
riesgos la poblacin no permanecer constante a lo largo del tiempo, lo
cual significa que algunos elementos sern retirados de la poblacin de
bajo riesgo antes de completar el periodo de seguimiento. En el caso
de poblaciones fijas, como dichas poblaciones son especialmente crea-
das con el propsito de hacer estudios de investigacin, adems de la
competencia de riesgos, las personas se van de la poblacin de riesgo
porque no quieren seguir participando, o se fueron del sitio donde se
realizaba el estudio. En este caso, la poblacin de riesgo se puede defi-
nir de las otras tres maneras que mencionamos anteriormente.
En las cohortes fijas, tambin se puede calcular la Tasa de Incidencia.

En el clculo de la Tasa de Incidencia de las cohortes cerradas lo ideal
es disponer de informacin precisa de la cantidad de tiempo que cada
persona ha permanecido en su condicin de poblacin de riesgo. Un
ejemplo sera una cohorte cerrada retrospectiva histrica, como la de
las vctimas de la bomba de Hiroshima, en la cual quienes ms per-
manecieron en el rea contaminada, cuentan de manera diferente que
aquellos que fueron sacados ms rpido.
Ejemplo de mal uso del concepto de riesgo
En un aviso aparecido hace un par de aos en los vagones y estaciones

del metro de NY se lea lo siguiente:
El riesgo de que una mujer norteamericana padezca de cncer de mama es de 1
en 8. Prevngalo.
Dicho eslogan ha sido copiado por quienes quieren promover el uso
de la mamografa diagnstica para la deteccin temprana del cncer
de mama.
Dios mo, que no vaya a ser yo una de esas! piensa cualquier
mujer en reaccin instintiva.
Pocos cnceres tienen un contenido emocional tan alto para las muje-
res y sus familias como el cncer de mama. La gente sabe que el cncer
de mama suele ser mortal y que es necesario hacer algo para prevenirlo.
Pero nadie le ha dicho que no es lo mismo prevencin primaria o se-
cundaria y menos que para que la prevencin primaria sea til, debe ser
de toda la vida, y tampoco le han dicho que algunos de los factores de
riesgo no seran controlables, tales como la historia familiar, es decir,
los genes. Lo que s le han dicho es que se hagan peridicamente una
mamografa o que se examinen los pechos todos los meses. Les han
vendido la idea de la necesidad de usar servicios que cuestan. Mamo-
grafas para todas a partir de los cuarenta o cuarenta y cinco todos los
aos y auto examen de mama todos los meses a partir de edades cada
vez ms tempranas. Nadie habla de la sensibilidad y de especificidad o
del valor predictivo positivo o negativo de las pruebas, algo de lo cual
hablamos en el captulo correspondiente.
Pero sobre todo, no le han dicho a las mujeres que, a parte de cualquier
consideracin, el riesgo (la proporcin de incidencia) es distinto segn
la edad. El riesgo de 1:8 sera el que le correspondera a mujeres por encima de los
65 aos cuando ya han ido eliminando otros riesgos y no han fallecido por in-
farto, por enfermedades cardiovasculares, diabetes, accidentes, suicidio,
no han sido asesinadas o no han muerto como consecuencia de enfer-
medades relacionadas con las gestaciones, sepsis, aborto o enfermedad
hipertensiva del embarazo.
Tampoco les han aclarado que por puro proceso de eliminacin, el cn-
cer de mama es una de las enfermedades por las que se pueden morir
las mujeres, especialmente despus de la menopausia, y que morirn
ms de dicho cncer si son obesas, si fuman, si no han tenido hijos, si
en su familia hay historia de cncer de mama, si han estado expuestas
sin descanso a la accin de los estrgenos durante largo tiempo, o han
tomado estrgenos despus de la menopausia. Menos les han dicho
que hay maneras naturales de descansar de esta influencia negativa de
los estrgenos adhirindose a sus receptores todos los meses, nmero
de hijos y tiempo de mamadas, y aos acumulados de experiencia de
lactancia (aqu viene el concepto de personatiempo).
Y jams les han dicho a todas esas mujeres que entraron en pnico y se
contaron como una de las ocho que iban en aquel vagn del tren a las
que les dara cncer, que a los cincuenta ese riesgo es de 1:150; a los 35
aos 1:1 500 pero de ninguna manera de 1 en 8.
Ahora entiende por qu la necesidad de precisar es tambin una ne-

cesidad tica? Y, a no ser que usted quiera vender mquinas y pruebas
diagnsticas, va a tener que pensar qu est haciendo con ellas y cmo
va a tener que incluir otros elementos de juicio y no solamente los que
le imponen. De nuevo, est comenzando a ser epidemilogo y a pensar
como tal.
Tasa (tasa de incidencia, densidad de incidencia)

Las tasas de incidencia son las medidas de frecuencia de eleccin en
poblaciones dinmicas (ver recuadro). La medicin de la poblacin a
riesgo es mucho ms compleja en las cohortes abiertas en las cuales se
aaden nuevas personas a la cohorte en el periodo de seguimiento. Para
obviar este problema de la cohorte abierta, se tienen en cuenta nicamente
los tiempos que cada persona permanece comportndose como poblacin de ries-
go. Mire dnde viene a salir con gran fuerza el concepto de persona
tiempo y se calcula ya no un riesgo (Proporcin de Incidencia), sino
una Tasa de Incidencia.
Poblaciones abiertas
Tambin llamadas poblaciones dinmicas, son aquellas en las cuales se in-

corporan nuevos miembros, en tiempos diferentes (ver figura 2B). Por
ejemplo, como sucede con el Registro de Cncer de Cali y otros regis-
tros similares, que recolectan informacin de todos los diagnsticos
de cncer de una poblacin hipottica compuesta, en el caso de Cali,
por todas las personas que viven en Cali. Los datos de dicho registro
miden tasas de incidencia de cncer que reflejan lo que sucede en una
poblacin que cambia permanentemente, est sometida a grandes mi-
graciones de gente que va y viene, al contrario de lo que sucede en las
cohortes cerradas en las cuales necesariamente la cohorte se va desgas-
tando poco a poco.
La tasa es una medida frecuencia de enfermedad que mide la velocidad

a la que se desarrolla una enfermedad. Observe ahora la figura 3. En
las dos poblaciones el nmero de casos nuevos es igual, pero en una
de ellas la velocidad en que las personas desarrollan la enfermedad es
diferente. La figura de la izquierda puede ser la velocidad a la que los
fumadores desarrollan cncer de pulmn, mientras que la figura de la
derecha podra ser la velocidad a la que los no fumadores la desarrollan.
Si no tuviramos en cuenta el tiempo en que hemos seguido a las per-
sonas, nuestra conclusin hubiera sido que el riesgo es igual entre los
fumadores y no fumadores (3 casos sobre 10 = 3%).
Figura 3. Tasa de Incidencia

1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
Tiempo Tiempo
Desarrollan el evento Emigran o se mueren
Figura 3
Como ya lo habamos anotado, el clculo del nmero de casos nuevos

en el numerador de la tasa de incidencia se hace de la misma manera
que en el clculo de la Incidencia Acumulada. Pero en el clculo del de-
nominador de la Tasa de Incidencia debemos tener en cuenta algunos
detalles:
1. Los casos contribuyen al denominador solamente hasta cuando se

vuelven casos, despus de lo cual no contribuyen ms al denomi-
nador.
2. Las personas que suman tiempo en el denominador pueden, en

algn momento, volverse casos. Una vez se vuelven casos NO po-
demos contar el tiempo aportado por ellos; por ejemplo, no con-
taramos el tiempo aportado por una mujer a quien se le hizo una
mastectoma radical dentro del tiempo medido para las expuestas
a cncer de mama.
3. Igualmente, quienes se pierden en el seguimiento aportan nica-

mente el tiempo transcurrido hasta el momento en que se pierden;
por el contrario, aquellos que podemos seguir hasta que termine el
estudio, contribuirn con su tiempo completo de seguimiento.
Para calcular el denominador de la tasa se pueden utilizar diferentes

formas:
1) Calculando una poblacin promedio, al igual que lo hicimos cuan-

do calculamos la prevalencia de periodo o la incidencia acumulada.
Esto solo se hace cuando la poblacin es muy estable.
2) A quienes no logran llegar hasta el final del periodo de seguimien-

to y a quienes tienen el evento los contamos como la mitad; pero
lo ideal es que tengamos el tiempo aportado por cada persona, y
3) El denominador ser la suma de esos tiempos.
Volvamos al estudio de emergencia sanitaria en el campo de refugiados.

En los tres meses hay 200 casos nuevos de diarrea. Hay 550 refugiados
que no han tenido jams diarrea y 50 en quienes no sabemos si tuvieron
diarrea o no porque se marcharon. Calculemos la tasa de incidencia
siguiendo las dos primeras formas:
a) Poblacin promedio: el nmero de personastiempo ser 800+750/2

= 775 de donde su tasa de incidencia ser 200/775 = 0.25 por persona
mes (3 meses) = 0.086 por personames-1.
b) Contando a quienes se enferman y pierden como la mitad: 800

1/2(200+50) = 675, su tasa de incidencia ser de 200/675=0.29 por
personames-1 (3 meses) = 0.09 por personames-1.
Anteriormente habamos contado el tiempo aportado por cada una de

las 800 personas como de tres meses, lo que nos daba un denomina-
dor de 2 400 personasmes. Esto es irreal porque los casos debieron
haber sucedido en cualquier momento en el periodo de tres meses, y

por lo tanto no pudieron contribuir con tantos meses como personas
en riesgo. Igual razonamiento puede hacerse con quienes abandonaron
el campo. Lo ideal entonces hubiera sido que usted hubiera tenido un
sistema de vigilancia de casos de diarrea y que pudiera tener la fecha
exacta de la presentacin de cada caso; adems, que hubiera llevado
registros de la gente que entra y sale del campo y las fechas respectivas.
Esto solo ocurre si usted, de antemano, ha planeado un estudio de co-
horte en esta poblacin.
Riesgo y Tasa: Cundo y para qu se usan

Retomemos los dos conceptos. Cuando hablamos de riesgo (la inciden-
cia acumulada) nos referimos a la probabilidad que tiene un individuo
de enfermar, morir, curarse o recuperarse (ntese el nfasis en indivi-
duo); mientras que la tasa es una medida instantnea de la velocidad de
desarrollo en una poblacin expresada en casos por tiempo (ntese el
nfasis en poblacin). Esto es lo bsico. Ahora, veamos ejemplos prc-
ticos de cundo y para qu se usan.
El que riesgo sea una medida que se puede extrapolar a un individuo

quiere decir que usted, si es un clnico, puede decirle a su paciente cul
podra ser el riesgo (promedio) de sufrir una enfermedad X, si por
ejemplo l es un fumador.
La tasa se usa mucho ms para estimar una relacin causal (como en el

caso en que queramos comparar la tasa a la que se desarrolla cncer de
pulmn en una poblacin de fumadores, con la de no fumadores para
evaluar la relacin causal del cigarrillo y el cncer de pulmn).
Morgenstern, Kleinbaum y Kupper1 lo explican as: Si usted sigue a

un grupo de personas por mucho tiempo, cada una de ellas presentar
en algn momento el evento de inters (por ejemplo todas morirn),
en ese momento todas estarn a riesgo o tendrn el mismo riesgo, los
fumadores y los no fumadores (como sucede en la figura 3). Esto no
sucede con la tasa, que puede variar en el tiempo; pero la velocidad a
la que desarrolla el evento no ser igual en fumadores y no fumadores,
solo por el hecho de que se sigan por varios periodos de tiempo.
Antes se afirmaba que para el estudio de las enfermedades crnicas,

como la enfermedad coronaria, lo que se debera estimar sera la tasa
de incidencia porque su latencia va ms all del periodo que hemos
definido como de observacin (empez antes y puede seguir despus).
Mientras que si tenemos una enfermedad aguda en la cual es corta la
latencia, es muy posible que cubramos el verdadero periodo de latencia
de esta enfermedad en nuestro seguimiento, y por lo tanto se debe o
se puede estimar el riesgo (si usted estima la tasa de incidencia, esta va-
riar dependiendo del curso de la epidemia). Sin embargo, esto ltimo
no es tan cierto si tenemos enfermedades agudas, como la diarrea, que
adems son recurrentes. Definir la poblacin a riesgo es difcil, en un
momento una persona no est en el denominador porque ya sufri la
enfermedad, pero despus s podra estar porque ya se cur del episo-
dio pasado. En este caso es ms apropiado que usted intente estimar la

tasa de incidencia.
La decisin de medir riesgo o tasa tambin puede depender de la capa-

cidad de detectar la enfermedad en un grupo de personas. Para poder
estimar el momento exacto en que la persona se vuelve positiva para el
virus de inmunodeficiencia humana, usted tendra que estarle tomando
serologas cada dos o tres meses; ante esta imposibilidad de no saber el
tiempo exacto en el cual desarrolla la enfermedad, usted podra estimar
el riesgo de enfermar, ms que tratar de estimar una tasa de inciden-
cia.
Para terminar, queremos decirle que el riesgo y la tasa se pueden rela-

cionar matemticamente. Aqu no le vamos a explicar cmo se llega esa
relacin, pero en algunas circunstancias (poblacin estable, enfermedad
rara, seguimientos cortos) el riesgo es igual a la densidad de incidencia.
Los estadsticos y epidemilogos han logrado mejorar el seguimiento
de las poblaciones y han desarrollado nuevos mtodos estadsticos para
calcular el riesgo en poblaciones dinmicas (en donde la tasa es la me-
dida aconsejable). El ejemplo clsico es el estudio de Framingham y el
clculo de riesgo de enfermedad cardiovascular. A partir del seguimien-
to de esta poblacin, por ms de 20 aos, hoy sabemos que si usted es
un hombre fumador, tiene 40 aos, un colesterol total de 220mg/dl,
un HDL de 40mg/dl y una presin sistlica de 130mmHG, su riesgo a
10 aos de tener una enfermedad coronaria es de 2%; si es mujer con
los mismos factores de riesgo, su probabilidad es de 1% (1 de cada 100
mujeres con estos niveles desarrollarn una enfermedad coronaria en
10 aos).
Medidas de frecuencia en salud pblica

Como ya lo habamos visto en nuestro captulo introductorio, una de
las funciones de la epidemiologia es describir el estado de salud de una
poblacin, que se puede definir geogrficamente (pas, regin etc.). Ya
sea porque queremos ver en el tiempo cmo cambia y si las nuevas
intervenciones o cambios han tenido un efecto, o cuando queremos
comparar una poblacin con otra para saber qu es lo que hace que
aquellos estn mejor o peor que nosotros. Existe un sinnmero de in-
dicadores del estado de salud que van desde indicadores de bienestar
completo (calidad de vida, esperanza de vida), de salud reproductiva
(fertilidad), que miden el estado mental o fsico (depresin, funcin
cognitiva, limitaciones de la movilidad, fragilidad), el estado funcional
(limitaciones, discapacidad) y la mortalidad.
Muchas de estas medidas se obtienen de estudios epidemiolgicos: en-

cuestas poblacionales, estudios de cohortes, estudios de prevalencia.
Pero tambin se pueden obtener de registros poblacionales: censos,
estadsticas de morbilidad y mortalidad obligatorias en cada pas y que
se obtienen de quienes consultan los servicios de salud.
Las medidas de frecuencia ms utilizadas en la salud pblica son la

Mortalidad y la Morbilidad.
La mortalidad es una de las medidas de frecuencia ms utilizada en

epidemiologia y salud pblica. La medicin de la mortalidad es espa-
cialmente til para estudiar enfermedades que provocan la muerte,
mxime cuando la letalidad (medida de la gravedad de la enfermedad)
es elevada.
La medicin de la morbilidad es til en especial cuando la letalidad es

baja, o cuando no es posible analizar la frecuencia de una enfermedad
al medirla nicamente con los casos que mueren.
Para el clculo del numerador de estas medidas se utilizan (al igual que
en las cohortes) el nmero de casos registrados en un periodo X (1 ao,
por lo general): nmero de nacidos vivos, nmero de consultas, nme-
ro de muertes por enfermedad X, nmero total de muertes. Y para el
denominador se usan: la poblacin censada o la poblacin estimada a la
mitad de periodo (la poblacin al 1 de julio). Con ello obtendramos la
tasa de nacimiento, la tasa de consultas, la tasa especfica de mortalidad
por una enfermedad X y la tasa total de mortalidad. Note que en el
caso de estas tasas se asume que la poblacin es estable (la poblacin es
la misma porque las entradas son iguales a las salidas) y que quitar del
numerador los casos nuevos hace muy poca diferencia en la tasa porque
la enfermedad es generalmente rara (el denominador es muy grande
toda la poblacin de Colombia). El gran desafo de estas medidas
es la definicin de caso y tener un denominador confiable. La interpre-
tacin de tasa de mortalidad es la misma que la de incidencia.
Algunas tasas que no son verdaderas tasas
No todo lo que se llama tasa es tasa, como pudo haber deducido al leer
el ltimo prrafo. Observe los siguientes ejemplos:
Tasa de ataque: forma alternativa de llamar a una tasa de incidencia que

se usa cuando una poblacin se observa por un periodo de tiempo
corto . Se define como el nmero de casos dividido por la poblacin a
riesgo; por ejemplo, en los estudios de brote se calcula la tasa de ataque
para cada alimento consumido y el nmero de casos entre los que con-
sumieron dicho alimento.
Tasa de mortalidad neonatal: nmero de muertes en los primeros 28 das

de nacimiento dividido por el nmero de nacidos vivos (parece ms
una incidencia acumulada).
Tasa de mortalidad materna: muertes en el embarazo o en los primeros

48 das dividido por el nmero de nacidos vivos (no todas las mujeres
que mueren pueden estar incluidas en la denominador, parece ms una
razn).
Para finalizar este captulo, le hablaremos de lo til que puede ser para
usted y para quienes toman las decisiones de polticas de salud de su
pas, el saber que la mortalidad tiene una relacin directa con la inci-
dencia y la fatalidad.
Mire este ejemplo tomado de Ghafoor et al2: La tasa de incidencia de

cncer de seno en las mujeres blancas en Estados Unidos es de 140.8
casos por 100 000 y de 121.7 en las mujeres afro descendientes en

el periodo de 1996 a 2000. Probablemente las mejores explicaciones
para una mayor incidencia en las mujeres blancas parecen ser un mayor
uso de hormonoterapia (23% en blancas, 8% en afro descendientes en
una cohorte de 19711992), menos nmero de hijos y aplazamiento
del primer embarazo (mayor edad al nacimiento del primer hijo). Sin
embargo, parece ser que por el hecho de que las mujeres blancas se
hacen ms la mamografa, su incidencia sera mayor. La sobrevida a
cinco aos de las mujeres blancas, no obstante, es ms alta que la de
las afro descendientes: 97.6% versus 89.7% para enfermedad localiza-
da, y de 80.3% versus 66% para estadio regional de la enfermedad
(regionalstage disease). La mortalidad es a su vez ms alta en las mujeres
afro descendientes a pesar de su incidencia ms baja: 35.9 por 100 000
mujeres versus 27.2 por 100 000 mujeres blancas. Los factores que pare-
cen explicar la diferencia en la mortalidad consisten en que las afro des-
cendientes son diagnosticadas en etapas ms avanzadas que las mujeres
blancas, y eso debido a las desigualdades en el uso de la mamografa
y en los tratamientos ofrecidos; las afro descendientes parecen recibir
menos radiacin despus de ciruga conservadora de seno.
Ejercicio
Reflexione sobre la siguiente figura en trminos de incidencia y preva-

lencia. Se trata de la mortalidad por enfermedades isqumicas y cere-
brovasculares en Colombia desde 19901999. Al contrario de lo que
acabamos de contarle para los pases desarrollados, la mortalidad en
Colombia por este tipo de enfermedades no ha disminuido, ha aumen-
tado. Qu piensa usted: Mayor incidencia o mayor letalidad? Cmo
explica que los hombres tengan mayor mortalidad que las mujeres?
(incidencia elevada o mayor letalidad?); por qu no ocurre los mis-
mo para las enfermedades cerebrovasculares? (igual incidencia y leta-
lidad?). Ser que hay error en el diagnstico de estas enfermedades?
Nota: estas estadsticas estn ajustadas por edad, es decir que el en-
vejecimiento de la poblacin colombiana no explica el aumento de la
mortalidad.
70
65
Mortalidad por 100.000 habitantes
Hombres
60
55 Enfermedades
50 isqumicas
45 Mujeres
40
35 Hombres
30 Enfermedades
25 cerebrovasculares
20 Mujeres
15
10
5
0
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Medidas de Efecto. Causalidad

Las medidas de efecto tambin se conocen como medidas de asocia-
cin.
Dichas medidas son indicadores que buscan evaluar la fuerza con que
un evento (enfermedad) se asocia con un determinado factor o causa,
es decir, son medidas que comparan el riesgo de que una enfermedad
se desarrolle en el grupo de personas expuestas al factor bajo sospecha,
con aquellos no expuestos.
Esta comparacin se hace de dos maneras:

Con medidas usadas para calcular la diferencia de riesgos.
Con medidas usadas para calcular el efecto relativo: el RR y el
OR.
Causalidad
El objetivo central de la epidemiologa es el estudio de las causas de la

enfermedad.
Pero el enfoque epidemiolgico de causalidad es distinto al enfoque

legal de causalidad de los casos individuales, en los cuales se le asigna
a una causa un efecto especfico, como cuando se afirma que tal carro
lesion a Juan y le caus una ruptura de bazo e hgado. La epidemio-
loga evala la proposicin, ms en sentido terico que especfico, de
que la exposicin es la causa de la enfermedad. En otras palabras, no
necesariamente una persona expuesta a un agente causante de una en-
fermedad debe la enfermedad a dicho agente, como sucedera en el
caso del cncer del pulmn y el cigarrillo.
Cmo medir los efectos y las causas en una situacin especfica en la

cual se disponga de todos los datos?
Un individuo, cualquier individuo, es diferente de otros en millones de

aspectos. Si comparamos riesgos (proporcin de incidencia) o tasas de
incidencia entre los expuestos y los no expuestos, no podemos asegurar
que tales diferencias de riesgos se puedan atribuir a la exposicin a un
factor causal potencial, ya que se podran atribuir tambin a otros fac-
tores en los cuales las poblaciones expuestas y las no expuestas varan
entre s.
La comparacin ideal sera con uno mismo, tal como se hace en los
estudios de entrecruzamiento o un modelo en el cual todo fuera igual
excepto el factor de exposicin. Esta situacin no es real en la mayora
de diseos y de estudios. Ni siquiera uno es igual a s mismo entre un
momento y otro del estudio.
Supongamos que en la bsqueda de una explicacin sobre un fenme-

no encontramos que hay diferencias entre los grupos expuestos y los
no expuestos. En los primeros, el fenmeno estudiado se presenta en
200 de cada mil expuestos; en los segundos, en 80 de cada mil. Cmo
podemos saber que tal diferencia se puede atribuir a la exposicin?
Quiz el factor de exposicin no tiene un efecto igual en uno de los

grupos, porque los no expuestos -o los expuestos, ya que esto vale en
ambas direcciones- tienen un riesgo diferente.
Para que las experiencias se vuelvan comparables, se usan diversos m-

todos de diseo:
1. Entrecruzamiento (Cross over). Este mtodo tiene problemas
ticos y solo es posible si se trata de un experimento corto y el
efecto es breve.
2. Aleatorizacin. De manera que ni los participantes ni el experi
mentador escojan a qu grupo deben ser asignados.
En ltimas tenemos que apuntarle a lograr (o a poder presumir)
que los grupos son comparables excepto en el factor de riesgo.
Ese es el uso de las medidas de efecto.
Dichas medidas se dividen en dos grupos:

1. Medidas de diferencia absoluta, entre las cuales estn
Diferencias de riesgos,
Excesos de riesgos,
Riesgos atribuibles, y
Nmero de personas necesarias a tratar.
2. Medidas de diferencia relativa, dentro de las cuales estn:
Razn de riesgos,
Razn de incidencia acumulada,
Razn de tasas,
Razn de tasas de incidencia,
OR, y
OR de prevalencia.
Manera general de calcular el efecto relativo

Aqu se trata de una divisin: se obtiene primero el numerador, el cual
es la diferencia de la Incidencia entre los expuestos y los no expues-
tos:
Ie -I0
Y luego dividimos este resultado por el riesgo entre los no expuestos:
Efecto relativo = Diferencia de Riesgos/Riesgo entre los no expues-

tos
RD = R1 - R0 /R0= RR - 1.
Es decir, el efecto relativo es la razn (Ratio) de riesgos menos 1, RR

menos 1.
Debido a que el efecto relativo es simplemente RR-1, los epidemilo-

gos con frecuencia se refieren al RR como medida del efecto relativo.
Cuando se usa de tal forma es necesario recordar que el valor de 1
corresponde a la ausencia de efecto.
Resumen:
Tenemos entonces las siguientes medidas:

Diferencia de Riesgos (en la cual los valores van entre -1 y +1)
Razn de Riegos (en la cual los valores van entre 0 e )
Diferencia de las Tasas de Incidencia (en la cual los valores van
entre + y -)
Razn de las Tasas de Incidencia (en la cual los valores van entre
0 e ).
Diferencias entre Razones de Riesgos y Razones de Tasas.

Los datos de los riesgos calculan efectos que son, ya sea:
a) Diferencias de Riesgos, o
b) Razn de Riesgos
Los riesgos no se pueden comparar con las tasas que tienen diferentes
unidades de medidas, por la misma razn que las diferencias de riesgos
cuyo resultado es una resta, no se pueden comparar con las diferencias
de tasas cuyo resultado es una divisin.
Sin embargo, bajo ciertas circunstancias especiales, la Razn de Riesgos

es equivalente a la Razn de las Tasas; por ejemplo, cuando las Tasas de
Incidencia permanecen constantes a lo largo del tiempo y la tasa entre
los no expuestos I1 es igual a I0
RR puede expresarse I1/I0
Esta relacin muestra que la tasa de riesgo es la misma que la razn de

riesgo, siempre y cuando el periodo de tiempo sobre el cual se aplica el
riesgo sea suficientemente corto para que la ecuacin
Riesgo = tasa de incidencia x tiempo,
se pueda aplicar.
Con periodos de tiempo mayores (cuya extensin depende del valor de

las tasas involucradas), los riesgos se pueden volver tan suficientemente
grandes que la Razn de los Riesgos comenzara a alejarse del valor de
la Razn de Tasas.
Recuerde que las Tasas de Incidencia se miden en personastiempo,

personasmes, personasao, con exponentes negativos x-1.
Si el periodo de tiempo sobre el cual se calcula el riesgo se aproxima a

cero (0), el riesgo en s tambin se acerca a cero (0). Cul es el riesgo de
que en los prximos cinco minutos le d un infarto a alguien con coles-
terol alto e hipertensin? As, el riesgo de que usted tenga un accidente
en los prximos 10 aos puede ser del 20%, pero en la prxima hora
ser muy pequeo, cercano a cero; eso si en los siguientes 30 minutos
usted no piensa subirse a un bus de transporte pblico en Bogot.
No obstante, la Razn de dos cantidades que se acerquen ambas a cero,

no necesariamente se acerca a cero. En el caso de la Razn de Riesgos
calculados para riesgos aplicados a intervalos de tiempo cada vez ms
pequeos, en la medida en que los riesgos se acercan a cero, la Razn
de Riesgos se acerca al valor de la Razn de la Tasa de Incidencia.
Es decir que la razn de la tasa de incidencia es el valor limitante para

la razn de riesgos en la medida en que el intervalo de tiempo sobre el
cual se toman esos riesgos se acerca a cero .
Mejor dicho, uno puede escribir la Razn de la tasa de Incidencia como

una razn de riesgos instantneos.
Pero el que se haya hecho equivalencia de estos dos tipos de razones

para periodos de tiempo muy cortos, ha generado mucha confusin y
con frecuencia se oye la frase Riesgo Relativo para referirse tanto a la
Razn de Tasas de Incidencia como para la Razn de Riesgos (Propor-
ciones de Incidencia).
Medidas de Impacto Potencial

Son medidas usadas para estimar la importancia de una exposicin so-
bre una poblacin y lo que sucedera si dicha exposicin fuera elimina-
da tanto en los individuos expuestos como en toda la poblacin. Por
tanto, se pueden dividir entre:
Medidas del impacto que tendra remover la exposicin entre los
expuestos:
- Riesgo Atribuible
- Exceso de Riesgo
Medidas que tendra la remocin de la exposicin en la
poblacin:
- Riesgo Atribuible Poblacional
Fraccin atribuible (fraccin etiolgica)
Ya vimos que si tomamos la diferencia de riesgos entre los expuestos y

los no expuestos R1-R0 y las dividimos por el riesgo en el grupo de no
expuestos, obtenemos la medida relativa del efecto.
Pero tambin podemos dividir la diferencia de riesgos, ya no por los

NO expuestos, sino por los expuestos. Al hacerlo obtenemos la Frac-
cin Atribuible o fraccin etiolgica.
RD/R1 = R1 - R0/R1
= 1 - 1/RR = RR-1/RR
Cuando la diferencia de riesgos refleja un efecto causal no distorsio-

nado por sesgos, la Fraccin Atribuible es una medida que cuantifica
la proporcin de la carga de enfermedad entre los expuestos, que se
puede atribuir al hecho de estar expuesto a una noxa.
Bibliografa
1. Morgenstern H., Kleinbaum D.G., Kupper LL (1980). Measu-

res of disease incidence used in epidemiologic research. Int J Epide-
miol, 9 (1): 97104.
2. Ghafoor A., Jemal A., Ward E., Cokkinides V., Smith R., Thun
M. (2003). Trends in Breast Cancer by Race and Ethnicity. CA Cancer
J Clin., 53 (6): 342355.
Lecturas recomendadas:
Clculo del riesgo de ataque al corazn en 10 aos
http://hp2010.nhlbihin.net/atpiii/calculator.asp
Datos de mortalidad por causa y grupos de edad
http://www.who.int/whosis/en/
12. Epidemias
En este captulo aclararemos:

Los diversos tipos de epidemias y brotes,
El significado de endemia y de pandemia.
Qu es una epidemia
En general, se habla de epidemia cuando se presentan nmeros eleva-
dos de nuevos casos que exceden los esperados en un momento
y en un lugar limitado. En las enfermedades infecciosas esto se aplica Una epidemia es en-
tanto en los casos que provienen de una fuente comn, como cuando tonces la ocurrencia
se trata de epidemias propagadas.
inusualmente alta de
Una epidemia es entonces la ocurrencia inusualmente alta de una en- una enfermedad.
fermedad. La decisin de llamarla inusualmente alta en el caso de las
infecciones depende de las circunstancias; por ejemplo, en el caso de
grmenes causantes de pandemias o de enfermedades reemergentes,
un solo caso podra ser tratado como el comienzo de una epidemia.
Qu es un brote
Epidemias y brotes son sinnimos, sin embargo, el trmino brote se
suele reservar para el aumento sbito, por encima de la lnea de base,
de casos de enfermedades infecciosas. Un brote puede ser, como ya lo
dijimos, un solo caso de una enfermedad comunicable, en especial si
esta es grave, no se ha visto por un largo periodo de tiempo en un lugar
dado y, por lo tanto, requerira de un reporte inmediato. Tal sera un
solo caso de polio o de una parlisis flcida de cualquier naturaleza, u
otro ms dramtico como sera la aparicin de un solo caso de viruela;
tambin podra tratarse de la aparicin de un solo caso de influenza de
cepas como la H5N1, o la H9N2 (la cepa responsable de las pandemias
ocurridas en Hong Kong durante 1997 y 1999), en las que todas las
alarmas de todos los sistemas de salud del mundo se prendieron ante la
posibilidad de una pandemia, tal como sucede en el momento en que
este libro va a impresin con la cepas AH1N1.
En el caso de patgenos emergentes o reemergentes, como los citados

anteriormente, un solo caso sera un brote.
En el caso de los patgenos comunes o prevalentes es necesario tener

disponibles los datos del comportamiento usual de dicho pat-
geno, para poder discernir si el aumento observado en el nmero
de casos de la enfermedad en cuestin obedece al patrn usual
histrico o si se trata de una elevacin inusual.
En circunstancias de lugar especficas, como sera el caso de asilos

para adultos mayores, unidades renales o donde quiera que exis-
tan muchas personas hacinadas, en especial si estn debilitadas,
un solo caso de enfermedad por grmenes comunes podra ser
catalogado como brote.
Endemia
Se habla de endemia cuando la enfermedad se presenta en forma cons-
tante e ilimitada en el tiempo, pero es limitada con respecto al lugar. Cuando la
prevalencia de una enfermedad es elevada, hay que pensar en enfermedades
endmicas.
Pandemia
Se trata de elevaciones inusuales de una enfermedad en un periodo de
tiempo limitado pero en un espacio geogrfico ilimitado. Se dice que cuando una
enfermedad sobrepasa un continente, estamos ante una pandemia.
Cepas pandmicas versus Cepas no pandmicas

o contemporneas
En el caso de algunos patgenos, como el de la influenza, se habla

de brotes cuando se detecta un solo caso de cepas con potencial
pandmico.
En el caso de cepas no pandmicas, un solo caso nosocomial cons-

tituye un brote institucional. Este concepto es de especial importan-
cia en asilos y en instituciones donde se podra diseminar con gran
rapidez una epidemia que, en otras circunstancias, no tendra tanto
problema, pero que ahora ante poblaciones con sistemas inmunes
debilitados adquiere especial gravedad.
Tipos de Epidemias
Epidemias de Origen Comn
Si una epidemia surge de una fuente nica, es decir de la exposicin a

un agente causal nico, se llama Epidemia de Origen Comn. Ejemplos:
- Epidemias de intoxicacin alimenticia por comida contaminada

durante un bazar organizado por los empleados de la Secretara
Municipal de Cali.
- Epidemia de casos de cncer de tiroides despus de la explosin

de la planta nuclear de Chernobyl.
La escala de tiempo entre las primeras y las segundas es dramticamen-

te diferente, pero ambos casos tienen en comn un componente causal
nico.
En las epidemias de origen comn, la curva muestra una subida sbita

inicial caracterstica, seguida de un descenso ms gradual. Dichas cur-
vas son conocidas como curvas Lognormal.
Epidemias de origen comn
# de
casos
B A
Tiempo
En las epidemias de origen comn se puede observar que:
Inicialmente, despus de que termina el periodo mnimo (A) de

incubacin requerido para que se manifieste la enfermedad en el
primer individuo, solo aparece un reducido nmero de casos.
El nmero mayor de casos aparece y hace su pico al final del pe-

riodo total A + B.
Periodo de incubacin es aquel que va desde el momento de la

exposicin hasta la lnea media de la curva.
La curva Lognormal
En la curva Lognormal la parte ascendente representa el nmero de
casos nuevos (la proporcin de incidencia), la parte descendiente mues-
tra la tasa de incidencia. La lentitud del descenso de la curva refleja

que a aquellos a quienes ya les dio la enfermedad infecciosa, ya no
sern susceptibles a dicha enfermedad, al menos durante un periodo de
tiempo. Es decir, si una gran parte de la poblacin result afectada por
un brote, el nmero de personas susceptibles declina a medida que la
epidemia avanza. La tasa de incidencia de la parte descendiente indica
que el nmero de casos nuevos va disminuyendo porque la incidencia
se divide ahora por la cantidad cada vez menor de personastiempo
susceptibles.
Epidemias Progresivas (las epidemias que se propagan de una per-

sona a otra)
Se llaman epidemias progresivas a aquellas en las cuales el agente causal

se transmite de un individuo a otro a travs de la poblacin. Ejemplo
de epidemias progresivas seran el virus de la influenza, una epidemia
de sarampin o la epidemia de HIV. La velocidad de progresin de-
pender del tipo de agente infeccioso y ser tan rpida que pareciera
comportarse como una epidemia de origen comn, como en el caso de
la gripa, o ms lenta, como en el caso del sida.
Epidemias propagadas / progresivas
# de Caso ndice
casos
Casos Secundarios
Tiempo
La curva de las epidemias progresivas tiende a mostrar un ascenso ms
gradual debido a que se propaga de persona a persona, tambin cuenta
con una forma ms simtrica que la de origen comn. El modo de
transmisin puede ser directo o indirecto, segn la transmisin se haga a
travs del contacto humano o sus fomitas (gotas de aerosol del tracto
respiratorio, orina, sudor, heces), a travs de vectores (artrpodos) o
del aire. En las epidemias progresivas adquiere especial importancia
identificar el caso ndice.
Ejemplos de epidemias de transmisin directa seran: una epidemia de sa-

rampin, brotes de hepatitis viral, brotes de influenza o enfermedades
de transmisin sexual.
Ejemplos de transmisin indirecta seran: la malaria, la fiebre amarilla, el

dengue, etc.
Caso ndice
Primer caso identificado a partir del cual se infectan los dems, como
sera el caso del asistente de vuelo de la compaa americana que infec-
t a tantas personas con el virus del HIV.
Dificultades para definir las epidemias segn el tiempo

No todas las epidemias se pueden definir segn el tiempo, como se-
ra el caso de una crisis de histeria que se propaga en una escuela de
una persona a otra en un periodo muy breve. Los cnceres despus de
Chernobyl se presentaron aos despus y se trata de una epidemia de
punto o de origen comn.
Tasas de ataque
La tasa de ataque es una forma de medir la incidencia en la que el pe-
riodo de riesgo es limitado. Dichas tasas se usan cuando se calculan las
tasas de incidencia durante una semana, un mes o por el tiempo que
dure la epidemia, siempre y cuando tal duracin sea menor a un ao.
# casos nuevos durante un periodo especfico
Tasa de ataque =
# personas expuestas a riesgo durante el mismo periodo
Tasa de ataque secundario
Es una medida de ocurrencia de enfermedad transmisible entre las

personas susceptibles, despus de que han sido expuestas a un caso
primario. Se calcula relacionando el nmero de personas expuestas al
contagio que enferman dentro del periodo de incubacin mximo. Se
excluyen de esta relacin tanto el caso primario como los casos terciarios,
que son aquellos que se presentan despus de terminado el periodo
de incubacin mximo terico del caso primario, y por lo tanto son el
resultado ya sea de contacto con los casos secundarios o son casos que
no se relacionan con el grupo original (un brote diferente).
# casos surgidos despus del caso primario
Tasa de ataque secundario =
Poblacin expuesta
La tasa de ataque secundario:
Refleja el grado de contagiosidad y la capacidad de producir infec-

cin del agente infeccioso.
Sirve para evaluar la eficacia de las acciones profilcticas.
Se usa para evaluar si una enfermedad de etiologa desconocida es

de naturaleza infecciosa, es decir, si es transmisible.
Es elevada en las enfermedades respiratorias, menor en las enfer-

medades diarreicas y menor an cuando es transmitida por con-
tacto corporal directo.
Cuando los conceptos se juntan
Tanto la proporcin de incidencia como la tasa de incidencia son

medidas que valoran la frecuencia de comienzo de una enfermedad. El
numerador en ambas es el nmero de casos nuevos que ocurren.
Por el contrario, en la proporcin de prevalencia, con frecuencia lla-

mada simplemente prevalencia, no se miden solo los casos nuevos, el
comienzo de la enfermedad, sino el estatus de la enfermedad, y se hace
mediante el conteo de los casos que ya son tales. La manera ms senci-
lla de expresar la prevalencia es decir que la enfermedad est presente
o ausente. La prevalencia, por ello, siempre es una proporcin y no una
tasa, la proporcin de la poblacin que tiene una enfermedad. Ejem-
plos: la prevalencia de diabetes de epilepsia, de reflujo o de depresin
en una poblacin.
Factores que afectan la prevalencia:
- Ocurrencia de la enfermedad, es decir, que mientras ms grande

sea la incidencia en la poblacin, ms gente tendr esta enferme-
dad al hacer el conteo.
- El otro factor que la afecta es la duracin de la enfermedad en

los individuos. Mientras ms dure la enfermedad, ms alta ser la
prevalencia.
Aunque suene a repeticin, de ello se deriva la frmula ms bsi-

ca de la epidemiologa:
P=IxD
Enfermedades de corta duracin pueden tener prevalencia baja, aun-

que la tasa de incidencia sea alta, tal sera el caso de la gripa o de la
infeccin respiratoria aguda, ya que despus de un periodo corto la
mayora de la gente se recupera o muere y ya no estn infectados. Cosa
que no pasa con la tuberculosis. Tambin mueren rpido en el caso de
una enfermedad grave como la meningitis.
Debido a que la prevalencia refleja tanto la incidencia como la duracin

de la enfermedad, no es til para estudiar las causas de una enfermedad,
pero s es ms til para estudiar la carga de una enfermedad.
En estado estable, es decir en aquellas circunstancias en las cuales las

tasas de incidencia y la duracin de la enfermedad permanecen estables
sin variar a lo largo del tiempo, la prevalencia tiene la siguiente relacin
con la Tasa de Incidencia:
P
= ID
I-P
D= Duracin promedio
I = Tasa de Incidencia
A la cantidad P
se le llama ODDS de Prevalencia.
I-P
En general, cuando tomamos una (proporcin de) prevalencia y la divi-

dimos por 1 - P (uno menos la Prevalencia), la Razn de tal Proporcin
se llama ODDS.
Los ODDS en una situacin particular representan el grado de proba-

bilidad de que algo suceder (o no suceder) o de que alguien ser o
no ser exitoso, especialmente cuando se habla de apuestas. Si uno le
apuesta una corona (o un peso) a un caballo cuyos ODDS son de 10:1
(diez a uno), usted recibe 10 coronas o pesos si su caballo gana. Los
ODDS pueden ser a favor o en contra.
Si un caballo es favorito 3 a 1 para ganar una carrera, quiere decir que
tiene una posibilidad calculada de ganar de 0.75
0.75
Los ODDS de que el caballo gane = = 3:1
(1- 0.75)
ODDS, como lo aclaramos al hablar de ODDS RATIO, es una palabra

difcil de traducir con toda la sutileza y posibilidades que tiene el tr-
mino en ingls. Algunos lo traducen como razones de momios y otros como
equivalentes, pero no creemos que se hagan entender mejor.
Cuando las prevalencias son pequeas, el valor de la proporcin de

prevalencia y los ODDS de prevalencia estarn cada vez ms cercanos
debido a que el denominador del ODDS se acerca a 1 (uno).
De manera que para prevalencias pequeas, menores de 0.1, la ecua-

cin de los ODDS se pueden escribir:

P = ID como la escribimos al comienzo. Ese es el origen de la frmula, ya
varias veces repetida.
Lo cual significa que cuando el estado es estable y la prevalencia es baja,

esta es aproximadamente igual al producto de la tasa de incidencia y de
la duracin promedio de la enfermedad.
Excepciones en el uso de la prevalencia

Las prevalencias se usan ms en las reas administrativas de la salud p-
blica que en la investigacin de factores causales. No obstante, existen
reas de investigacin en las cuales la proporcin de prevalencia se usa
ms que las medidas de incidencia. Una de esas reas es la de las ano-
malas congnitas. As, cuando se habla de comunicacin interventri-
cular o de espina bfida, se usa prevalencia y no incidencia porque para
poder medir la incidencia verdadera tendramos que haber valorado
todos los productos de gestacin cuando eran embriones, tanto a los
que continuaron el embarazo como a los abortos. Dichos defectos con-
gnitos as contados desde el comienzo del embarazo s seran la verda-
dera incidencia de los defectos en cuestin, pero muchos se pierden y
como no lo sabemos, hablamos de prevalencia de defectos congnitos
y no de incidencia.
13. Estudios Epidemiolgicos
Objetivo
Los estudios epidemiolgicos son ejercicios de medicin cuyo objetivo
es obtener estimativos de las medidas epidemiolgicas ya menciona-
das.
Maneras de separarlos
Antes de hablar de diseos, digamos que en general, toda investigacin

clnica cabe en dos categoras generales:
O se trata de investigaciones experimentales, cuando el investiga-

dor asigna la exposicin.
O de investigaciones observacionales, cuando el investigador no

asigna la exposicin.
La investigacin epidemiolgica tambin se puede dividir en estos dos gran-

des grupos, pero como su espectro de estudio es ms amplio en tr-
minos de poblacin de estudio, y su aplicacin es ms amplia que la
investigacin clnica, los diseos epidemiolgicos presentan muchas
variaciones. Una de ellas es el estudio de agregados de individuos o
estudios ecolgicos (comparacin de pases, regiones), otra el estudio
de las variaciones en el tiempo, y otros los diseos de niveles mltiples
(que incluyen, por ejemplo, el estudio de barrios, familias, individuos,
etc.).
En este captulo nos centraremos en aquellos diseos que le son comu-

nes a la epidemiologa y a la investigacin clnica.
Estudios observacionales
Los estudios observacionales pueden ser analticos o descriptivos.
Estudios analticos. Son aquellos en los cuales los resultados de un gru-

po se comparan con los de otro u otros grupos.
En los estudios analticos se incluyen ciertos diseos bsicos:

a) Cohortes: en los cuales se sigue a grupos de seres biolgicos a partir

de una exposicin hasta llegar a un resultado, y se compara el resultado
en los expuestos con el resultado de los no expuestos.
b) Casos y controles: en los cuales se va en reverso, y a partir de un

resultado se llega a una exposicin; en los estudios de esta clase se
compara la exposicin en los enfermos con la exposicin en los no en-
fermos (aunque no siempre el grupo de comparacin es gente sana).
c) Estudios transversales: en los cuales, como si se tratara de una foto

nica en la que todo se resume, se miden la exposicin y el resultado en
un mismo momento; se deben mirar como los estudios de cohorte, y
por ello se prefiere comparar la enfermedad entre los expuestos con los
no expuestos. Todos los dems diseos son variaciones de los citados.
Los estudios analticos comparan las medidas de ocurrencia de enfer-

medad de un grupo con las de otro(s) grupo(s), con el propsito de:
- Predecir tal ocurrencia.
- Aprender y profundizar sobre las causas de la enfermedad.
- Evaluar el impacto de una enfermedad en una comunidad.
Para ello utilizan medidas como el Riesgo Relativo (RR) en las cohortes, o el
OR en los estudios de casos y controles, y la Razn de Prevalencias en los estudios
transversales. Estas son las medidas preferidas cuando se trata de expre-
sar resultados dicotmicos, como cuando se est infectado o no se est
infectado. Los Intervalos de Confianza (IC) de estas medidas indican la
precisin de estos resultados. Las medidas de asociacin con Intervalos
de Confianza revelan la fuerza de asociacin, la direccin y el riesgo
plausible de un efecto as como la posibilidad de ocurrencia. Por el
contrario, la p solo revela la probabilidad de ocurrencia. (Ver captulo
15 sobre Intervalos de confianza y Funcin del valor de p).
Estudios descriptivos. Son aquellos en los que no se hace esa compara-

cin de resultados de manera sistemtica porque no buscan relaciones
etiolgicas en particular, sino describir un problema en trminos de
tiempo, lugar o persona. Los estudios descriptivos han demostrado ser
muy tiles para generar hiptesis de investigacin, para caracterizar una
nueva enfermedad y como punto de partida en la investigacin de bro-
tes (ver ejemplo del Clostridium Difficile en el recuadro 1). Ejemplos
de estos estudios son los resultados que se obtienen de la informacin
de rutina que generan los sistemas de vigilancia en salud pblica, los
reportes de morbilidad y mortalidad de los organismos de salud, o la
descripcin de un fenmeno o de una condicin especial en un rea
geogrfica, en una poblacin especial, o la comparacin de la presenta-
cin de un fenmeno o un evento en varias poblaciones. El reporte de
casos o los reportes de series de casos son estudios descriptivos muy
utilizados por los clnicos.
En este tipo de estudios se obtienen estimativos de riesgos simples

(Proporciones de Incidencia), Tasas de Incidencia, o simplemente de
las Prevalencias. Se diferencian de los estudios analticos por cuanto en
los estudios descriptivos no se establecen de antemano grupos de com-
paracin (expuestos contra no expuestos, enfermos y no enfermos),
y por ello los investigadores no se arriesgan a establecer asociaciones,

que se olvidan o se ignoran.
La historia del Clostridium Difficile (CD) en Qubec
Unos aos atrs los infectlogos del hospital de Sherbrook, en Qubec

(Canad), notaron un incremento en la mortalidad por CD entre los
pacientes hospitalizados. Esta bacteria siempre haba sido asociada con
episodios de diarrea en individuos hospitalizados, pero desde el 2002
los mdicos empezaron a notar aumento en el nmero de colecistec-
tomas de urgencia practicadas en pacientes hospitalizados. Despus
de hacer una buena definicin de caso (el diagnstico de CD mediante
identificacin de toxinas se haca de rutina en ese hospital), los inves-
tigadores procedieron a revisar los registros de todos los pacientes en
busca de ms casos. En la revisin de los registros desde 1993 a 2003
encontraron 1 721 casos. Dado que se trataba de un hospital regional
que tena a su cargo la atencin de una poblacin muy bien definida,
los investigadores pudieron estimar los cambios en la incidencia de la
enfermedad (la incidencia haba aumentado de 35 por 100 000 a 156
por 100 000 habitantes), de su severidad (de 7.1% a 18.2%), y de su
mortalidad (de 4.7% a 7.8%). El incremento de la severidad y de la
mortalidad estaba acompaado de cambios en lo antibiticos usados
en los pacientes. La presentacin de la enfermedad fue ms severa y
la evolucin ms desfavorable en las personas de mayor edad, y en
aquellas que reciban algunos antibiticos (como el metronidazol). La
descripcin de esta serie de casos ha resultado en el entendimiento de
la historia natural de la enfermedad del CD y en el estudio de interven-
ciones para mejorar la seleccin de los antibiticos usados en personas
mayores hospitalizadas.
Recuadro 1.
Casi todos los estudios tienen componentes descriptivos y analticos.

Separarlos de manera excluyente es un ejercicio ms artificial que real.
Tipos de estudios analticos

Aun ahora se les oye a algunas personas hablar de estudios prospecti-
vos y estudios retrospectivos como si fueran equivalentes, los prospec-
tivos a los estudios de cohortes, y los retrospectivos a los estudios de
casos y controles no son equivalentes, como lo veremos a medida que
avancemos en este libro, tampoco estn tan separados. Ms bien deben
ser vistos como maneras diferentes de acercarse a los problemas segn
lo que se pretenda y lo que convenga.
Cohortes
Piense en las cohortes como si se tratara de dos ejrcitos que salen para
una larga marcha que los llevar a la misma guerra, son iguales en todo
excepto en las caractersticas que usted quiere analizar. Los puede mirar
continuamente desde el comienzo, como si se tratara de una pelcula,
o les puede hacer un seguimiento peridico cada determinado tiempo,
como si se tratara de unas fotos (note que, de hecho, unos y otros son
parecidos, ya que las pelculas simplemente son muchas fotos puestas a
continuacin una tras de otra), o puede usted de antemano decidir en
qu momento deja de hacer mediciones y alcanza el punto final; tam-
bin podra, para plantearlo de otra manera, intervenirlos exponiendo
a unos a ciertas condiciones de batalla, es decir, estara usted haciendo
un experimento; o simplemente todo lo que hara sera mirar a ver qu
pasa segn lo que vaya sucediendo, sin intervencin, en cuyo caso se
tratara de cohortes observacionales.
Lo importante es entender que Cohorte es un grupo de individuos

que se observan y se miden a lo largo de un periodo determinado de
tiempo. Se puede fijar de antemano cundo cesan las observaciones
o el seguimiento, o simplemente usted puede dejar que la cohorte se
desgaste hasta que todos sus miembros desaparezcan o mueran. Un
estudio de cohortes implica medir la ocurrencia de una enfermedad, de
un fenmeno o un resultado en una o ms cohortes.
Por lo general, las personas de las cohortes tienen algunas caractersti-

cas comunes que los definen: viven en la misma rea geogrfica (Fra-
mingham, Leganes, Pelotas); nacieron el mismo ao, como ocurre con
The National Child Development Study (NCDS) el cual sigue a la po-
blacin nacida en los Estados Unidos en marzo de 1958; trabajan en
el mismo lugar (mineros, pilotos); estuvieron expuestos a un mismo
evento (veteranos de la guerra de Vietnam, poblacin de Hiroshima y
Nagasaki en la poca de las bombas atmicas); tienen un riesgo elevado
de alguna enfermedad (homosexuales en San Francisco, los jvenes
de la calle en Montreal). Todos ellos son grupos especiales de perso-
nas que pueden darnos buenos datos y son fciles de seguir (mdicos
britnicos de las cohortes de Doll y Hill, las enfermeras de los Estados
Unidos).
Expuestos Efecto
Poblacin Tiempo
a riesgo
No Expuestos Efecto
Tiempo
Para poder entender qu es una cohorte, debemos conocer los elemen-

tos esenciales que la definen, ellos son:
- La exposicin.
- La poblacin a riesgo.
- El seguimiento.
- El evento o el efecto que queremos estimar.
La exposicin
En general, las cohortes estn:

- Expuestas a uno o ms factores de riesgo, o factores protectores
que queremos estudiar.
- No estn expuestas a dicho(s) factor(es) de riesgo.
Al hablar de exposicin no hablamos solamente de una noxa, enten-
dida como un agente infeccioso, dicha exposicin tambin podra tra-
tarse de tener un gen o haber nacido con una caracterstica protectora
(las mujeres nacidas sin el gen del BRCA estn ms protegidas contra
el cncer de mama que aquellas que lo tienen), o de una exposicin a
lo largo de la vida que vuelve ms o menos vulnerables a quienes se
exponen o no se exponen (no saber leer ni escribir, tener o no el gen
del BRCA). Se trata de situaciones ante las cuales se plantean teoras, hi-
ptesis, etc.; por ejemplo: las mujeres sin el gen del BRCA comparadas
con las mujeres con dicho gen tienen tres veces menos riesgo de tener
cncer de mama a temprana edad; las personas que saben leer y escribir
tienen dos veces menos riesgo de sufrir de dficit cognitivo despus de
los 60 aos de edad, que aquellos que no han ido a la escuela1.
En los casos ms simples, en efecto dichas cohortes estn comparando

un grupo de personas expuestas con un grupo de personas no expues-
tas (bajo peso al nacerpeso normal al nacer). Pero en otros casos las
cohortes pueden ser separadas en subcohortes de acuerdo con catego-
ras de exposicin ms complejas: por nivel de importancia (general-
mente relacionadas con algn efecto causal que queramos buscar) con
escalas o instrumentos que creamos para tal propsito; por ejemplo,
en la cohorte de Framingham los miembros de la cohorte fueron cla-
sificados en subcohortes de acuerdo con los diferentes niveles sricos
de colesterol (<160mg/dl, 160200 mg/dl, etc.), de presin arterial
diastlica y sistlica (<120/80, 140/90, etc.), y segn si fumaban o no,
o eran diabticos o no2. Para determinar la exposicin y clasificar las
cohortes fue necesario tomar muestras de sangre, hacer mediciones de
presin arterial y llenar una encuesta.
En el caso de Framingham, y de muchas otras cohortes en que se es-

tudian las enfermedades crnicas, la exposicin se determina en el
momento del inicio de la cohorte. No sabemos, sin embargo, cunto
tiempo llevan las personas de las cohortes expuestas a estos factores
(las personas no saban que tenan el colesterol srico alto antes de
que se empezara el estudio). En algunos casos, se recomienda que la
exposicin sea definida de acuerdo con su duracin y de alguna manera
ver cmo se acumula a lo largo de la vida; por ejemplo, en la medicin
del hbito de fumar podemos definir como exposicin el nmero de
aos que una persona fuma ms de 100 cigarrillos por da, el nmero
de cigarrillos fumados por da, el nmero de aos que ha fumado un
paquete diario (paquetesaos). Todas estas opciones nos daran una
medida ms exacta de la exposicin que si definimos la exposicin sim-
plemente como si las personas fuman o no fuman.
En algunas ocasiones es fcil definir en qu momento empieza la expo-

sicin, como sucede con la sufrida en los accidentes nucleares a agentes
radiactivos, ya sea como producto de la bomba o por la explosin de la

planta nuclear, como en Hiroshima o en Chernobyl. En estas cohortes,
la exposicin se puede definir de acuerdo con la dosis recibida, que
se calcular segn el tiempo que hayan permanecido en el ambiente
contaminado; pero tambin se podra medir segn la distancia de las
vctimas con el punto mximo de exposicin, en el momento de la
explosin.
En las cohortes ocupacionales, la medicin de la exposicin puede

llegar a ser ms exacta, cuando existen registros y estos son buenos.
Tomemos como ejemplo el estudio de pilotos y de los ayudantes de
cabina en una aerolnea griega3. La hiptesis del estudio es que la radia-
cin csmica en vuelos de alta altitud se puede asociar con un mayor
riesgo de cncer. Primero, sabemos que la exposicin empieza en el
momento que se entra a trabajar; segundo, sabemos las horas de vuelo
de cada una de las personas y el tiempo que llevan trabajando. Entonces
podremos saber qu nmero de horas por ao de exposicin han acu-
mulado (note la diferencia con la persona con niveles de colesterol alto
que no saba que los tena elevados hasta el momento en que se hizo
la medicin al ingresar al estudio). Los grupos de comparacin en el
caso de las cohortes ocupacionales pueden ser internos (comparamos
diferentes horas acumuladas de vuelo) o pueden tener grupos de com-
paracin externos (comparamos la incidencia de cncer en pilotos con
la mortalidad de la poblacin de Grecia).
Poblacin a riesgo
Un hecho inherente a las cohortes es que todos sus miembros deben

estar expuestos al riesgo de desarrollar la enfermedad especficamente
estudiada o medida. Un requerimiento estndar de cualquier poblacin
de riesgo es que cada miembro de la cohorte est libre de la enferme-
dad o de la complicacin, o del buen resultado si esto es lo que se
mide, al comienzo del periodo de seguimiento. Es decir que excluimos
los casos prevalentes o ya existentes. Por supuesto, los miembros de una co-
horte deben estar vivos.
Por otro lado, existen enfermedades que uno tiene y luego no las puede
volver a tener porque ya las adquiri y desde ese momento las tendr
para siempre. No pueden, por ello, ser sujetos susceptibles de ellas los
pacientes que ya sufren de la enfermedad de Louis Goerig (esclerosis
lateral amiotrfica) o la diabetes tipo 1. En este tipo de enfermedades
usted podr determinar la primera aparicin de la misma, en cuyo caso
la poblacin a riesgo es aquella que todava no la ha desarrollado. Pero
hay otras afecciones en las cuales los eventos pueden ser recurrentes, y
en este caso la poblacin a riesgo depender del objetivo de su estudio
(esto ya lo habamos visto en el captulo de medidas de frecuencia, pero
se lo repetimos aqu); por ejemplo, si el estudio est diseado para esti-
mar los factores asociados con el riesgo del primer episodio de infarto
de miocardio, la poblacin a riesgo ser aquella que nunca ha tenido un
infarto; pero si en esa misma poblacin se buscan los factores asocia-
dos con la recurrencia de un infarto de miocardio, la poblacin a riesgo
estar constituida por aquellos con infarto previo.
La definicin de la poblacin a riesgo es un proceso dinmico mediante

el cual la gente entra y sale (de las poblaciones de riesgo) segn su esta-
do de salud y otros posteriores de eleccin propia. Este dinamismo de
la cohorte tiene dos implicaciones:
1) En la forma como vamos a construir el denominador para el clculo

de la tasa de incidencia (que ser en personastiempo) o para la Inci-
dencia (que ser la poblacin al inicio o la poblacin promedio) (ver
captulo #), y
2) En la forma como vamos a tratar las prdidas de seguimiento, que

como lo veremos en otro captulo, pueden afectar la validez de nuestro
estudio.
Seguimiento de los sujetos del estudio

Los individuos son seguidos por diferentes razones: porque queremos
mirar de qu se mueren, porque queremos ver si se enferman o no, si se
complican o no, si se curan o no; estos son los eventos que contamos y
que constituyen nuestro numerador (ver captulo de Incidencia).
Los individuos tambin salen de la cohorte sin que nosotros lo haya-

mos determinado: cuando se cambian de cuidad (cuando estbamos
haciendo una cohorte de personas que viven en Cali), o de trabajo (en
el caso de cohortes ocupacionales), o porque se fueron a vivir a una
residencia para personas mayores (si seguimos a personas mayores en
la comunidad), o se murieron (cuando esperbamos que vivieran). A
algunos los seguimos por el tiempo que fue planeado el estudio y no
desarrollaron el efecto que queramos. A todos estos casos (que se pier-
den en el seguimiento y no desarrollan el evento) se les llama casos
censurados. No hacen parte del numerador, pero siempre harn parte
del denominador. La forma como se tratan estos casos censurados en
los clculos de incidencia y tasas de incidencia fue discutida en un ca-
ptulo anterior.
La localizacin y el seguimiento de los individuos de las cohortes son

costosos y difciles. Usualmente hay prdidas, cuando estas superan el
40%, o aun en el caso de prdidas menores de 20% a 30%, a dichas
cohortes se les debe mirar con escepticismo y es necesario ser muy cui-
dadoso con la interpretacin. Esto lo detallaremos en otro captulo.
El efecto
En general, seguimos a las personas para buscar la aparicin de un

efecto, cualquiera que sea: inicio de la enfermedad, curacin, resultado
de un tratamiento, sobrevida. Pero tambin podemos seguirlos para
observar cmo crecen, cmo cambia su presin arterial en el tiempo,
en qu medida aumentan de peso, a qu edad empiezan a fumar o a
tener sus relaciones sexuales. Los estudios de cohorte tienen la ventaja
sobre otro tipo de estudios, de permitirnos establecer las relaciones de
una exposicin, no solo con medidas de efecto dicotmicas (enferme-
dad/no enfermedad), sino tambin con la dinmica del cambio o con
el tiempo de produccin de un evento. En este captulo, y en la mayor
parte de este libro, nos hemos centrado en eventos que adquieren un

carcter nominal, la persona se muere o no, se enferma o no.
Para poder contar estos eventos hay que definir con precisin qu sig-
nifica un nuevo caso, y a partir de qu momento se cuenta la enferme-
dad. Tomemos el caso de la bomba de Hiroshima. Por supuesto, ese
seguimiento uno no lo comienza a hacer en el periodo inmediato al
accidente. ste, por definicin, no fue algo planeado sino que sucedi
inesperadamente y uno todava se est reponiendo del susto. Pero si
se iniciara el seguimiento ah mismo, imposible logsticamente, y se
diagnosticara un carcinoma de tiroides en la primera semana despus
de la cada de la bomba, por lo que sabemos es poco probable que se
pueda atribuir (plausibilidad biolgica) a la explosin, asumimos que
ese cncer lo traa dicha persona desde antes de la explosin, si acaso la
baja masiva de defensas lo hizo consciente de ese problema. Lo mismo
sucedera en el caso de los pilotos y los ayudantes de cabina, en cuyas
circunstancias sera imposible atribuirle a la exposicin csmica cual-
quier cncer que aparezca en el primer ao de trabajo. En general, para
que se desarrolle la enfermedad de manera que pueda ser detectada
clnicamente, hay que dejar pasar un periodo conocido como periodo
de induccin y un periodo de latencia (ver recuadro).
Tomado de Rothman, 19814
El periodo de induccin (o periodo etiolgico) corresponde al tiempo

que toma para que el mecanismo causal termine de completarse (lo cual
a su vez es difcil) y la enfermedad inicie. Por ejemplo, una enfermedad
con causas genticas tiene un periodo de induccin que comienza en
la concepcin. La precisin con que podamos definir el periodo de
induccin depender de lo finos y avanzados que sean los mtodos de
diagnstico utilizados y del grado de certeza con que se puedan aplicar
dichos mtodos. Puesto de otra manera, la precisin del periodo de
induccin depender de qu tan afinados estn nuestros conocimientos
para saber cuntos milisegundos toma desorganizar todo a nivel mo-
lecular (algo que, por ejemplo, s podramos saber de manera ms di-
nmica y obvia despus de un accidente de trnsito) para que la accin
de las causas complementarias se junten y para que todo el mecanismo
transformador convierta clulas normales en clulas cancerosas y el
cncer se manifieste clnicamente 10 o 20 aos despus.
El periodo latente (o periodo patolgico). Una vez se presente la en-

fermedad, hay un intervalo adicional, el periodo latente tambin un
trmino relativo hasta que la enfermedad se diagnostique. Este pe-
riodo se puede reducir mejorando los mtodos de deteccin de la en-
fermedad antes de que se vuelva sintomtica. Es muy difcil diferenciar
el periodo de induccin del periodo latente y generalmente se estiman
los dos al mismo tiempo, lo que se conoce como periodo de induccin
emprico.
Lo usual es que un investigador nunca est seguro sobre cul es el

tiempo de induccin de una exposicin y una enfermedad, excepto en
el caso de los accidentes, en el de la biologa experimental de las heridas
o del choque hipovolmico. Por ello, en la mayora de los estudios de
enfermedades crnicas (y de las no crnicas con periodos de induccin
y de latencia largos) se hacen varias mediciones a lo largo del tiempo

para determinar, dentro de los lmites posibles de certeza, el momento
en el cual la enfermedad comienza. La infeccin por VIH es un claro
ejemplo de las limitaciones que tienen los investigadores para determi-
nar el momento de aparicin de la infeccin. Debido a que al menos
el 50% de las infecciones son asintomticas, para poder determinar el
inicio de la enfermedad se debe hacer un seguimiento de personas ne-
gativas (esto se hace en poblaciones de alto riesgo, como aquellos que
se inyectan drogas), a quienes se les hacen tomas frecuentes de sangre
para realizarles pruebas serolgicas, con el fin de definir el periodo de
latencia como la mitad del tiempo entre la muestra negativa y la posi-
tiva.
En el caso de Chernobyl o de Hiroshima, o en casos parecidos, quizs

sea necesario plantear hiptesis sobre varios tiempos posibles de induc-
cin y luego analizar de nuevo los datos de cada hiptesis por separado.
Aunque el tiempo de induccin comienza despus de la exposicin, si
planteamos la hiptesis de que durante seis aos no se presenta ningn
cncer de tiroides como resultado de la explosin nuclear, o que duran-
te el primer ao de trabajo los pilotos no desarrollan cncer, aunque en
el fondo sabemos que no es verdad, vamos a trabajar bajo la presun-
cin de que la exposicin no tiene ningn efecto y esos primeros aos
son usados matemticamente como si se tratara de un tiempo transcu-
rrido antes de la exposicin. Las opciones para el manejo de ese tiempo
son las siguientes: lo ignoramos (empezamos a contar despus de seis
aos) o lo combinamos con el tiempo de seguimiento de quienes nunca
sufrieron la exposicin (la cohorte de comparacin).
Estas son dificultades inherentes al diseo de los estudios epidemiol-

gicos. Lo importante es que cuando usted haga un estudio de cohorte
tenga en cuenta los periodos posibles de induccin y de latencia y que
fije un periodo de induccin emprico, que en el mejor de los casos
podr obtener de otros estudios.
Cohortes retrospectivas
En las cohortes prospectivas la informacin sobre la exposicin se re-

coge en el momento en que comienza a hacerse el seguimiento, y el pe-
riodo de riesgo se recoge a lo largo del estudio. Esto siempre es as en
el caso de los estudios experimentales y los no experimentales. En las
cohortes retrospectivas, tambin llamadas cohortes histricas, se trata de
identificar la informacin obtenida con anterioridad, en el tiempo du-
rante el cual estuvieron sometidos al riesgo de adquirir la enfermedad, a
sabiendas de que ese periodo sucedi antes de comenzar el estudio. Es
posible, pues, comenzar a seguirlos y contar los eventos a partir de aho-
ra. Como el estudio retrospectivo debe confiar en datos ya existentes
(recogidos hace tiempo), es posible que falte alguna informacin. Sin
embargo, cuando es posible recogerla de las fuentes confiables dispo-
nibles, esa informacin cuesta menos y puede producir resultados ms
rpido. Un ejemplo de estas cohortes son las ocupacionales.
Las cohortes ocupacionales5
La mayora de las cohortes ocupacionales son histricas. Algunas se

han formado para mirar las tendencias en el tiempo de la enfermedad
entre los trabajadores, pero en la mayora de los casos lo que se bus-
can son relaciones etiolgicas, y ms precisamente conocer la relacin
dosisrespuesta. Estas cohortes han producido en los ltimos 50 aos
la mayor parte de la informacin que se tiene sobre el cncer relacio-
nado con exposiciones ocupacionales: la silicosis entre los mineros y el
cncer de escroto entre los limpiadores de chimeneas son los ejemplos
clsicos. Los ms recientes son: estrs en el trabajo y enfermedad car-
diovascular, gases anestsicos y fertilidad, pesticidas y diabetes6.
Estudios de Casos y Controles
(tambin llamados de Casos y Testigos)
El gran inconveniente de las cohortes, adems de los costos, es la ne-
cesidad de tener grandes poblaciones para obtener la informacin re-
querida sobre la exposicin y las otras variables necesarias para medir
riesgos (Proporcin de Incidencia), as como las Tasas de Incidencia,
a sabiendas de que pocos suelen desarrollar la enfermedad o evento
estudiado.
Los estudios de casos y controles le apuestan a lo mismo que los estu-

dios de cohortes, pero lo hacen a travs del muestreo.
Los objetivos de los estudios de casos y controles son los mismos que
los de los estudios de cohortes, pero pretenden hacerlo con ms efi-
ciencia. Cuando se llevan a cabo de manera adecuada y cuando estn
indicados, los estudios de casos y controles proporcionan informacin
comparable con la que produciran los estudios de cohortes, por lo ge-
neral en menos tiempo y con menos costo. Infortunadamente, aunque
son ms fciles de llevar a cabo, tambin es ms fcil que terminen mal,
ya que los estudios de casos y controles tienden a ser ms susceptibles
que otros a los sesgos.
De ellos hablaremos en el prximo captulo.
Para poder entender un estudio de casos y controles es necesario reto-

mar el diseo de una cohorte.
Recuerde que en un estudio de cohortes:
1. Identificamos a una o varias cohortes expuestas y otras cohortes

no expuestas.
2. De estas poblaciones que constituyen las cohortes obtendramos

los denominadores correspondientes para las Tasas de Incidencia
(personatiempo) y para los Riesgos (poblacin a riesgo).
3. Identificaramos luego el nmero de casos que ocurren en cada

cohorte, las de los expuestos y los no expuestos, y calcularamos
los Riesgos y las Tasas de Incidencia.
En los estudios de Casos y Controles:
1. Se identifican los mismos casos y luego los clasificamos como per-

tenecientes a la cohorte de expuestos o a la de no expuestos.
2. Pero en lugar de obtener los denominadores para las tasas o los

riesgos, obtenemos el grupo control, que idealmente debe ser
muestreado de la poblacin total que da lugar a los casos.
3. Los individuos del grupo de control se clasifican luego en dos

categoras: a) los expuestos, y b) los no expuestos.
Poblacin
fuente
Expuestos Casos
No Expuestos Controles
Los Casos
Un caso puede ser una persona con cierta o ciertas enfermedades a
quien queremos comparar con otra que nunca la(s) ha tenido; una per-
sona que recibi una vacuna con otra que no la ha recibido; una per-
sona que fue sometida a una prueba de tamizaje de una enfermedad a
quien queremos comparar con otra que no fue tamizada. Lo que ha-
cemos en los estudios de Casos y Controles es comparar personas con
un evento, con otras con otro evento o sin el evento, y en general ese
evento es una enfermedad. Observe los siguientes ejemplos clsicos de
estudios de Casos y Controles.
Estudio Autores y publicacin Casos Controles
El hbito de fumar y el Richard Doll y Austin Bra- Cncer de pulmn de 743 enfermos con
carcinoma del pulmn. dford Hill. entre 1 732 pacientes patologas no malignas
British Medical Journal, 30 entrevistados de un total hospitalizados en las sa-
de septiembre de 1950. de 2 370 casos de cncer las de medicina y ciruga
de pulmn, estmago o general.
intestino grueso reporta-
dos entre 1948 y 1949 en
Inglaterra.
La interrelacin entre el Jrgen Rjel . Cncer del tero

cncer uterino y la sfilis. Un Copenhagen, NYT Nordisk
estudio patodemogrfico. Forlag, Arnold Busck, 1953.
The interrelation between
uterine cancer and syphi-
lis. A Patho-Demographic
study.
Adenocarcinoma de la vagi- Arthur I. Herbst, Howard Ocho pacientes naci- Cuatro testigos pareadas
na: relacin entre la terapia Ulfelder y David C. Pos- das entre 1946 y 1951 por cada paciente.
materna con Estilbestrol y kanzer en hospitales de Nueva Comentario: se encon-
la aparicin de tumores en The New England Jour- Inglaterra en quienes se tr que las madres de las
mujeres jvenes. nal of Medicine 248 (16): diagnostic adenocarcino- pacientes con carcinoma
878881, 1971. ma de vagina, una entidad vaginal haban sido tra-
muy rara. tadas a partir del primer
Comentario: la presen- trimestre del embarazo
tacin de solamente 8 con dietil etilbestrol.
casos de una enfermedad Este es el estudio ms
tan rara se trataba de una clsico de cmo con
verdadera epidemia. pocos datos y un buen
diseo es posible llegar a
conclusiones valiosas.
Edad al primer parto y ries- Brian MacMahon, P. Cole, Cncer de mama. 13 000 personas con-
go de cncer de mama. T.M. Lin, C.R. Lowe et al. 4 000 casos de cncer de trol.
Bulletin of the World mama en 7 pases.
Health Organization,
43:209221, 1970.
Un estudio controlado sobre 43 (93%) de los 46 258 conductores a

accidentes mortales de auto- conductores de autos no quienes sin anuncio
mvil en la ciudad de Nueva James R. McCarrol y Wi- comerciales muertos en previo se les detuvo
York. lliam Haddon Jr. Nueva York entre el 1 de unas semanas ms tarde
junio de 1959 y el 24 de en el mismo sitio del
Journal of Chronic Disea- octubre de 1960. accidente de los casos.
ses, 15:811826, 1962. Los controles fueron en-
trevistados y sometidos
a prueba de aliento. Solo
uno de los 259 iniciales
se neg alegando inmu-
nidad diplomtica.
Una encuesta de enfermeda- Alice Stewart, Josephine

des malignas de la infancia. Webb y David Hewitt.
British Medical Journal 1:
19451508, 1958.
Contrario a los estudios de cohortes donde el evento podra ser una

condicin cambiante, como la talla durante el crecimiento, o una con-
dicin medida de manera continua, como el peso corporal, presin
arterial, ndice de masa corporal, en los estudios de Casos y Controles
necesitamos definiciones del evento que son nominales u ordinales: tiene o no tiene
la enfermedad, o por ejemplo grado de severidad. De all que la defini-
cin de caso sea mucho ms estricta y ms difcil que la que se hace del
evento en las cohortes (la cual se puede modificar en el transcurso del
estudio o se puede estudiar de diferentes maneras).
Una buena definicin de Caso debe incluir un conocimiento sobre la

sensibilidad y especificidad de los criterios o de las pruebas para defi-
nirlo (en cncer se considera como estndar la histologa del tumor).
El fin ser tener una definicin que nos permita incluir todos los casos
posibles y que no entre ningn falso positivo. Por ello algunos autores
han sugerido que se deben preferir pruebas diagnsticas que tengan

alta especificidad a pruebas con alta sensibilidad, para poder as excluir
un gran nmero de personas que parecen ser casos, pero que no los
son7. Cuando incluimos falsos positivos podemos diluir el efecto que
queremos porque incluiremos como casos a personas que no los son y
que, de pronto, no tienen el nivel de exposicin que creemos es causal
(esto lo detallamos en otro captulo). Para otras definiciones de ca-
sos no existen pruebas diagnsticas objetivas. Algunas enfermedades,
como las reumticas y las psiquitricas, se basan en criterios subjetivos
o nmero de sntomas y ello limita la validez de la definicin (algunos
dicen que las mujeres tienden a reportar ms sntomas que los hombres
y por lo tanto en algunas de estas condiciones podran ser sobrediag-
nosticadas). La definicin de caso se vuelve menos precisa y la com-
paracin con otros estudios, ms difcil. Aqu tambin vale la idea de
escoger pruebas que tengan mayor especificidad.
Las fuentes de casos son muy diversas e incluyen: registros de hospital,

registros de cncer, certificados de defuncin y registros de vigilancia.
Este aspecto lo detallaremos ms adelante cuando hablemos de los di-
ferentes tipos de estudios de casos y controles.
Poblacin fuente
Los estudios de casos y controles se entienden mejor si se toma como
punto de partida a una poblacin fuente que representara hipottica-
mente (o de hecho) una poblacin en la cual se hubiera llevado a cabo
(o se realiz) un estudio de cohortes. De esta poblacin fuente se toman
los casos y los controles que se incluyen en el estudio. Al igual que para
los estudios de cohorte, las poblaciones fuente pueden ser trabajado-
res de una empresa, una poblacin geogrfica definida o un grupo de
personas expuestas a las mismas condiciones: una guerra, un accidente
nuclear, entre otras.
En el diseo de un estudio de Casos y Controles se presume que todas

las personas de la poblacin fuente que desarrollan la enfermedad es-
tudiada (o el evento que nos interesa), se incluyen como casos. Por lo
tanto, la definicin de la poblacin fuente corresponde a los criterios
de elegibilidad de los casos; sin embargo, no es necesario incluir todos
los casos que ocurren en una poblacin con ciertos lmites geogrficos,
pues ello sera impensable logsticamente. Observe el siguiente ejem-
plo:
Usted quiere estudiar la asociacin existente entre exposicin a activi-

dad fsica rigurosa y la enfermedad coronaria. Los casos de enfermedad
coronaria que tiene disponibles son aquellos que han sido hospitaliza-
dos en la Clnica Shaio, una clnica con gran experiencia en enferme-
dades del corazn en Colombia. La poblacin fuente en este estudio
ser definida de acuerdo con la poblacin a la cual la Clnica Shaio le
sirve. Si ms del 80% de los posibles casos de enfermedad coronaria en
Bogot son atendidos all, su poblacin fuente seran todos los bogota-
nos. Pero si la clnica slo atiende a la poblacin que se encuentra en un
radio de 10 km (debido a que hay ms clnicas especializadas en Bogot
y la gente va a la que le queda ms cerca), su poblacin fuente son los
bogotanos que se encuentran en el rea del barrio Niza, que incluir

por supuesto a los golfistas del Club Los Lagartos.
Es decir, para que los estudios de Casos y Controles sean eficientes, nos
obligamos a definir con gran precisin y sentido prctico la poblacin
fuente. En el ltimo ejemplo escogemos como poblacin fuente a la
poblacin que va a consulta a la Clnica Shaio, y elegimos como casos
dentro de ellos a los que sufren de enfermedad coronaria.
El grupo control
El propsito del grupo de control es determinar el tamao relativo
de los componentes de la exposicin y de la no exposicin de la poblacin
fuente.
Debido a que el grupo control se usa para estimar la distribucin de

la exposicin en la poblacin fuente, la condicin ms importante para la
seleccin de los controles es que sean muestreados independientemente de su estatus de
exposicin. Es decir que mientras con los casos ya identificados como enfermos,
sabemos o suponemos que estuvieron en contacto con un factor de
exposicin al cual, aunque en el fondo lo creemos culpable, todava lo
seguimos tratando como sospechoso (al fin y al cabo es lo que quere-
mos estudiar), lo que hacemos con los controles es ver cunta exposicin
podemos identificar, en la medida en que hipotticamente son una po-
blacin expuesta a los mismos factores a que estuvieron sometidos los
casos (recuerde que vienen de la misma poblacin fuente).
Las fuentes usadas con frecuencia para las series de controles son:
Fuentes de poblacin: se usan cuando existen registros poblacionales.

Los casos son representativos de esa poblacin de donde se pueden
muestrear los controles. Estas fuentes pueden ser los registros de cn-
cer o de mortalidad que en varios pases se recolectan de manera siste-
mtica y con muy buena representacin de la poblacin.
Fuentes de vecindario: cuando no se tienen datos poblacionales, y los
casos son seleccionados de registros de hospitales, los controles pue-
den ser vecinos (amigos) de los casos; sin embargo, es importante que
la poblacin fuente de los casos sea la misma que los vecinos, es decir
que si estos ltimos tuvieran la misma enfermedad, iran a la misma
institucin.
Fuentes de nmeros obtenidos al azar de la lista del directorio telef-

nico: se utilizan para buscar controles que sean representativos de la
poblacin cuando no hay registros confiables. En sitios donde la mayor
parte de la poblacin no tiene telfono, no se podran usar. Se debe
tener especial cuidado en la forma como se seleccionan los nmeros.
Fuentes obtenidas de controles hospitalarios: son tiles porque los

datos estn disponibles y porque los errores sern similares a si los
casos tambin se escogen de hospitales. Muchas veces se asume que
los controles hospitalarios son ideales porque provienen de la misma
poblacin fuente de los casos (sin embargo mire nuestro ejemplo de la
clnica Shaio). En muchas ocasiones se usan los controles de hospital y

de poblacin al mismo tiempo.
Fuentes obtenidas de los fallecidos: se recomiendan cuando los casos

son definidos como muerte por X causa. Se compararan a los con-
troles en que los datos de la exposicin se obtendran de personas cer-
canas; sin embargo, se ha encontrado que los controles muertos no son
representativos de los que no se han muerto todava. En efecto, pueden
tener una exposicin diferente a la de la poblacin general.
De all que el problema ms grande con cualquier muestreo de los con-

troles es la posibilidad de que estos no sean seleccionados indepen-
dientemente de su exposicin en la poblacin fuente. As, los pacientes
hospitalizados por razones diferentes a la enfermedad estudiada, quiz
no tienen la misma exposicin al factor causal bajo estudio que la po-
blacin total, ya que los expuestos a cualquier causa de las que por lo
general se estudian, tienden a ser hospitalizados con ms frecuencia por
cualquier razn.
Volvamos a nuestro ejemplo de enfermedad coronaria en Bogot. Su-

pongamos que nuestra poblacin fuente de casos son todos los bo-
gotanos: los controles debern ser una muestra representativa de los
que no han padecido de infarto en Bogot (los nocasos). Pensara
usted en seleccionar sus controles de personas que no llenan la de-
finicin de caso en la misma clnica? No sera recomendado que los
seleccionara de la Clnica Shaio porque esta ha sido por tradicin una
clnica especializada en enfermedad coronaria y en otras cardiovascula-
res, en este caso sus controles no sern representativos de la exposicin
(actividad fsica vigorosa) de la poblacin de Bogot. Las personas que
asisten a la clnica Shaio muy probablemente tendrn menos actividad
fsica que la mayora de los bogotanos (la falta de actividad fsica se aso-
cia con mayor frecuencia de otras enfermedades cardiovasculares, por
eso estn all, en esa clnica. No le parece?). En este caso usted deber
seleccionar los controles entre los pobladores de Bogot, por ejemplo
los vecinos de sus casos, las personas incluidas en una lista aleatoria,
tomada a su vez de las personas del directorio telefnico (ver recuadro
para otras opciones).
Casos y Controles basados en registros
(casebased casecontrol study)
Los casos y los controles son seleccionados entre los individuos que
viven en una poblacin dada en un momento dado. A este tipo de
estudio pertenecen las muestras de casos de registros mdicos, de hos-
pitales u otro tipo de registros poblacionales. La poblacin fuente no
es una cohorte identificada con claridad, sino ms bien una poblacin
tericamente identificada a partir de la definicin de caso que hayamos
hecho. Los controles son aquellos que no tienen la enfermedad (o el
evento) en dicha poblacin. Estos se pueden obtener de los mismos re-
gistros o de la poblacin fuente terica de donde vienen los casos y los
controles (ver recuadro sobre fuentes de controles). Observe el diseo
del estudio de Siemiatycki y colaboradores en Montreal, Canad8.
En 1979 se dise un estudio de Casos y Controles de base poblacional

para buscar la asociacin entre diferentes tipos de cncer y una centena
de exposiciones ocupacionales. Fueron seleccionados en total 19 cn-
ceres entre hombres de 35 a 70 aos que vivan en Montreal. Los casos
fueron escogidos de todos los nuevos casos confirmados de todas las
instituciones de salud de Montreal. Los controles fueron seleccionados
en el mismo ao de diagnstico de los casos de la lista electoral y otros
de una muestra aleatoria tomada del directorio telefnico.
En este tipo de estudios es posible medir el OR.
Casos y Controles dentro de Cohortes definidas

Son estudios de Casos y Controles hechos en la misma poblacin in-
cluida en un estudio de cohortes, de manera tal que se podra decir que
el estudio est anidado dentro de un estudio de cohortes. En estos estudios los
casos son todas aquellas personas que renen los criterios para ser un
caso (o una muestra de ellos) en un periodo de tiempo definido por el
investigador. Esta alternativa se usa cuando uno quiere estudiar una
exposicin especfica no medida aun por un gran estudio de cohortes y
resulta ms eficiente construir un estudio de casos y controles dentro de
esa gran cohorte, una vez se ha obtenido ya un nmero significativo de
casos. Comnmente, en los estudios de cohortes el riesgo de tener una
enfermedad riesgo (proporcin de incidencia) de ser caso en una
categora de exposicin, se contrasta con el riesgo de enfermedad en
otra categora. Si la nueva exposicin que nos interesa medir ahora
y no antes, no haba sido medida originalmente pero podra ser
medida en alguien momento despus de que se haya armado la
cohorte resulta eficiente medir ahora la exposicin solamente en
los casos y en un subgrupo de no casos. redaccin?
Cmo es posible medir la exposicin de manera retroactiva en un es-

tudio de cohortes?
Por ejemplo, cuando se han obtenido especmenes de sangre o de te-

jidos pero no se han analizado para la pregunta que nos interesa, pero
se han guardado para que cuando salga una nueva prueba puedan ser
analizados mediante ella, como el ejemplo de lvaro Muoz cuando
hizo su cohorte de Sida en Baltimore (referencia: Mellers J. W., Muoz
A., Giorgi J. V. et al. Plasma viral load and CD4+ lymphocytes as prog-
nostic makers of HIV1 infection. Annals of Internal Medicine, 126
(12), 946954).
Por ejemplo, cuando se hace una entrevista nueva sobre un detalle es-
pecfico, un tema para preguntarles a los miembros de la cohorte casos
sobre una exposicin especfica no considerada en las primeras entre-
vistas.
Por ejemplo, cuando se miran registros de exposicin de las historias

clnicas o de las de salud ocupacional sobre las cuales no se haban
pensado originalmente.
El anlisis en estos casos se hace como en cualquier otro estudio de

casos y controles, mediante el cmputo del OR haciendo los ajustes
respectivos y necesarios para eliminar factores de confusin.
Segn la forma como se haga el muestreo de los controles, se pueden

clasificar en: estudios anidados y casocohorte.
Casos y controles anidados - Estudios anidados

En los estudios anidados (a diferencia de otros estudios que veremos
ms adelante) la seleccin de los controles se basa en la Densidad de
Incidencia. Recuerde que autores como Hiss llaman Densidad de Incidencia a lo
que aqu llamamos Tasas de Incidencia.
En los estudios de Densidad (Tasa de Incidencia) de Casos y Contro-

les:
1) La serie de control representa la distribucin de personatiempo

de exposicin al factor precipitante o protector en la poblacin
fuente. Si la muestra se toma, al menos tericamente, indepen-
diente de la exposicin.
2) La representatividad se logra mediante la seleccin de los contro-

les de una manera tal que la probabilidad de que una persona de
la poblacin fuente sea seleccionada como control, sea directa-
mente proporcional a su contribucin, calculada en unidades de
personatiempo, a las tasas de incidencia de la poblacin fuente.
Por ejemplo, para estudiar cunta proteccin concede la lactancia
contra el carcinoma de mama, al sumar la experiencia acumulada
de la lactancia de todos sus hijos, una persona que en total dio de
mamar cinco aos debe tener cinco veces ms probabilidad de ser
seleccionada como control, que otra mujer que solo dio de mamar
en total durante un ao.
Ya mencionamos que es esencial tomar la muestra de casos y controles

independientemente de la exposicin. En un estudio de Casos y Con-
troles anidado es posible obtener un estimativo vlido de la Razn
de las Tasas de Incidencia cuando el muestreo se hace independiente-
mente de la exposicin; es decir, cada control muestreado representar
cierta cantidad de experiencia de personastiempo.
Observe el siguiente grfico. Suponga que usted ha seguido por tres

aos una cohorte de 28 263 mujeres posmenopusicas. Usted tiene
congelados los sueros de esas personas y quiere saber si la homociste-
na protege contra la enfermedad coronaria. Los institutos de salud no
le han dado dinero para que procese todas las muestras de sangre, as
que decide hacer un estudio anidado. En este caso usted identifica los
casos de enfermedad cardiovascular (las bolitas azules), y selecciona
como controles a personas que no desarrollaron la enfermedad (bo-
litas blancas) de manera aleatoria. Observe dos caractersticas de este
diseo, un caso futuro puede ser seleccionado como control para otro
caso (vea lnea A), pero adems un control puede servir de control para
varios casos (lnea B). La variable tiempo en nuestro ejemplo es la edad,
usted selecciona los controles entre aquellas mujeres que no desarrolla-

ron la enfermedad y que tienen la misma edad que su caso9.
Tiempo (edad)
A
B
Formacin de la cohorte
Estudios de CasosCohorte
Por el contrario, los estudios de CasosCohorte son estudios en los
cuales:
1) Todas las personas de la poblacin fuente tienen la misma proba-

bilidad de ser incluidas como controles, independientemente de la
cantidad de personatiempo con que cada una haya contribuido
en la cohorte. Esta es la manera de llevar a cabo un estudio cuando
a las personas de la cohorte se les sigue durante el mismo periodo
de tiempo.
2) En este muestreo cada control representa una fraccin del n-

mero total de personas de la poblacin, ms que representar una
fraccin del total de unidades personas tiempo.
Aunque se calcula igual que en los estudios de Casos y Controles tra-

dicionales, el OR de los estudios de CasosCohorte tiene una inter-
pretacin distinta, ya que el OR de un estudio de CasosCohorte es
un estimativo de la Razn de Riesgos (es decir, una Razn de las Pro-
porciones de Incidencia), ms que una Razn de Tasas. Desde luego,
cuando los riesgos son pequeos, el valor de la Razn de Riesgos se
aproxima al de la Razn de Tasas de Incidencia, de forma tal que en
muchos casos existe poca diferencia entre el resultado de un estudio de
CasosCohorte y uno de Casos y Controles.
En conclusin, la principal razn para hacer un estudio de CasosCo-

horte en vez de un estudio de densidad de Casos y Controles, es su
conveniencia.
Estudios de CasosEntrecruzados (CaseCrossover)

Un estudio entrecruzado (crossover), as a secas, es un estudio experi-
mental se usa mucho en farmacologa, en el cual se comparan dos o
ms intervenciones en cada sujeto de estudio. En dichos estudios, cada
sujeto, en tiempos diferentes, es objeto de las intervenciones estudia-
das, con lo cual se sirve a s mismo como su propio control. Para poder
separar las mediciones, cada intervencin es escogida en una secuencia
determinada por el azar. Dichos estudios tienen reglas estrictas, por

ejemplo, por cuestiones ticas, el efecto medido no debe ser grave y
debe tener corta duracin, de manera que no persista hasta la siguiente
medicin, con lo cual la modificara.
El Estudio de CasosEntrecruzados es una versin del estudio de en-

trecruzados mencionado en el prrafo anterior, solo que en esta oca-
sin todos los sujetos de estudio son Casos. En consecuencia, las series de
control en los estudios de CasosEntrecruzados no incluyen un con-
junto diferente de gente, sino ms bien se escogen las mismas personas
en las que se hace un muestreo del tiempo experimentado por ellos antes de que
hubieran desarrollado la enfermedad.
Las condiciones iniciales son las siguientes:
1. Se define la hiptesis con relacin a una exposicin especfica cau-

sante de una enfermedad dada dentro de un periodo de tiempo.
2. Cada caso se considera expuesto o no, segn una relacin de tiem-

po especificada en la hiptesis, por ejemplo, en el caso de un in-
farto se escogera de las consultas al servicio de urgencias de car-
diologa solo a quienes hubieran tenido sntomas dentro de las dos
horas siguientes al uso de pastillas de Viagra.
3. Los casos se clasifican como Expuestos, solamente si toman

Viagra en las dos horas anteriores a la consulta. De no ser as, se
clasifican como No expuestos.
Hasta aqu el proceso es igual de lo que se hubiera hecho en un estudio

de Casos y Controles. La diferencia surge de la forma como se consi-
guen las series de controles, pues en vez de obtener la informacin
de otras personas, se obtiene de los Casos mismos.
En el ejemplo de nuestros viejitos tomadores de Viagra que consultaron

en la Clnica Shaio, se debe obtener informacin sobre las veces que
tomaron Viagra en los seis meses anteriores, sin que como resultado de
ello hubieran tenido que consultar al servicio de urgencias de cardiolo-
ga. Bajo la hiptesis de estudio, cada vez que nuestros entusiasmados
longevos toman Viagra, se eleva el riesgo de que consulten al servicio
de cardiologa de urgencias dentro de las dos horas despus de hacerlo.
Esas dos horas se consideran como unidades de personatiempo expuestas.
Cualquier otro tiempo se considera como persona tiempo NO expuestas.
Si la persona toma Viagra una vez cada 15 das, todo el tiempo, excepto
las dos horas que siguen a cada toma de Viagra, se considera como
tiempo de No exposicin.
Tipos de problemas que se pueden resolver con este diseo

- Problemas en los cuales la exposicin debe variar de vez en cuan-
do en la misma persona. Uno no puede estudiar con este diseo el
efecto del color de los ojos de una persona sobre algo. A no ser que
dicha persona use esos horribles lentes de contacto que pretenden
darle ojos azules artificiales a personas a quienes la naturaleza les
dio unos bellos ojos negros. Pero s se podran estudiar los efectos
del consumo de alcohol o del alquiler de pelculas pornogrficas
sobre la salud de los mismos viejitos que consumen Viagra.
- La enfermedad debe tener un efecto sbito. Como ocurrira en un

caso de asma o de alergia. No se pueden estudiar con este diseo
casos de enfermedad de motoneurona superior, pero s el efecto
de una rubia con minifalda que atraviesa la calle sobre la conducta
de quien conduce un vehculo y sus riesgos de sufrir por un acci-
dente de trnsito.
- El efecto de la exposicin debe ser breve. Una llamada por el te-

lfono celular desorganiza todo el estado neurolgico y afectivo
del conductor de un vehculo, especialmente en los minutos que
siguen a la llamada.
Comparacin de los Estudios Transversales

(CrossSectional) con los Longitudinales
En los Estudios Longitudinales, la informacin se ha obtenido en ms
de un momento. Lo cual implica que la accin causal siempre precede
al efecto.
Como se quiere tener
En los Estudios Transversales, la informacin adquirida siempre se re- una FOTO de la po-
fiere al mismo periodo de tiempo. Es una foto nica comparada con
una pelcula. Tales estudios transversales pueden correlacionar la prevalencia blacin en un momen-
de una enfermedad con ciertas exposiciones, pero no pueden medir la to dado, queremos que
incidencia de la enfermedad, ya que tanto los clculos de Riesgos (Propor- esa foto sea lo ms
ciones de Incidencia) como los de las Tasas de Incidencia requieren cercana posible a la
informacin adquirida a lo largo del tiempo.
realidad.
As pues, el componente ms importante de los estudios de prevalencia
es el muestreo. Como se quiere tener una FOTO de la poblacin en
un momento dado, queremos que esa foto sea lo ms cercana posible
a la realidad. Y esto se hace con un muestreo de la poblacin, de modo
que esa muestra sea representativa del total de la poblacin. El tipo de
muestreo que se escoge en estos casos depende del tipo de estudio.
Como muchos de los estudios de prevalencia se hacen en poblaciones
grandes (ciudades o pases), los muestreos son complejos ya que deben
incluir provincias (municipios), barrios, casas y personas dentro de las
casas. Ejemplos de este tipo de diseo son las encuestas nacionales de
demografa y salud (Profamilia en Colombia), la encuesta SABE de en-
vejecimiento en Latinoamrica y el Caribe, o la encuesta de salud de la
Organizacin Mundial de la Salud (ver referencias al final del captulo),
y el estudio CARMELA.
Los estudios de prevalencia se utilizan para conocer la magnitud de un

problema, para generar hiptesis y son muy tiles para hacer compa-
raciones entre varios pases en donde la informacin se recolectar de
la misma manera. La desventaja radica en la medida de frecuencia, la
prevalencia que, solamente sobre algunos supuestos, nos dar idea de la
relacin causal entre la exposicin y la enfermedad.
Los experimentos
Los experimentos son estudios de cohortes. (No todas las cohortes son
experimentos).
Un experimento es un estudio de cohortes en el cual se comparan la

Tasa de Incidencia o la Proporcin de Incidencia entre dos o ms co-
hortes despus de asignarle a cada cohorte diferentes dosis, dependien-
do de si est expuesta o no. En los experimentos supuestamente natu-
rales el investigador no ha asignado la exposicin sino que la encontr
as, sin que lo hubiera planeado. En esos experimentos as llamados
naturales, se sistematiza lo que ya se encontr. Pero en general, en
un experimento real el investigador asigna una dosis de exposicin o
de proteccin contra una noxa, slo para satisfacer las necesidades del
estudio. Esto debe ser escrito de antemano en un protocolo de investi-
gacin (ver recuadro).
Los experimentos son:

- Experimentos Clnicos (Ensayos Clnicos).
- Estudios de campo.
- Ensayos en la comunidad.
Ensayos clnicos
La mayora de los experimentos se conducen en medios clnicos, usual-
mente para decidir cul tratamiento es mejor (ensayos teraputicos),
cual es la mejor forma de prevenir la enfermedad (ensayos preventivos)
o qu examen predice mejor y en qu punto de corte (ensayos diag-
nsticos), o cul es ms til para detectar una enfermedad (ensayos de
tamizaje). Dichos experimentos se conocen como experimentos clni-
cos o ensayos clnicos. A todos los sujetos se les ha diagnosticado una
enfermedad especfica, pero no es este el objetivo del estudio, sino esta-
blecer qu pasa, si hay muerte, mejora o complicacin, como resultado
de una intervencin o de una complicacin.
Para poder entender un ensayo clnico (y cualquier experimento) hay
que entender sus elementos fundamentales:
La intervencin o tratamiento.
La asignacin al azar.
El ciego y el doble ciego, mejor llamados enmascarados.
La adherencia al tratamiento.
Cuando se planea un experimento, se comparan siempre dos o ms
intervenciones y se quiere mirar el resultado. En esto se asemejan
mucho a los estudios de cohorte, en que se parte de la exposicin y se
mira el resultado. Qu se compara? Un nuevo tratamiento con ningn
tratamiento (cuando no existe terapia convencional, por ejemplo darle
vitamina A a los nios para disminuir la incidencia de diarrea versus un
placebo); una terapia nueva con una terapia convencional (Ej., con la
emergencia de nuevos medicamentos para el VIH, el grupo control es
el tratamiento estndar); una droga adicional o una dosis diferente de
la droga comparada con la terapia convencional. El tratamiento puede

ser una nueva dieta, una intervencin educativa, un medicamento, una
ciruga, cualquier exposicin que se pueda asignada al azar.
En la mayora de los ensayos los tratamientos se asignan al azar. Esto

quiere decir que la probabilidad de recibir un tratamiento es igual para
todas las personas: por ejemplo, si se quiere comparar el efecto de la
Vitamina A versus el placebo en la incidencia de diarrea en menores
de 5 aos en una poblacin infantil de 200 nios, cada nio tiene 50%
de probabilidad de recibir la vitamina o el placebo. Lo que se logra
con la asignacin al azar es que se minimizan las diferencias entre los
individuos tratados y los no tratados, y cualquier beneficio o dao que
haga el tratamiento no se debe a las caractersticas que diferencian a
los participantes que reciben o no el tratamiento. Esta es una de las
caractersticas que hace de los experimentos los mejores diseos para
evaluar hiptesis etiolgicas (cuando se pueden hacer, claro est).
En los experimentos clnicos, los pacientes no escogen qu tratamien-

to reciben. Hay un supuesto beneficio pero el paciente no sabe si el
tratamiento que recibe es el que est siendo investigado o el que tiene
la ventaja sobre el otro. Est ciego, y quien lo administra tambin est
ciego, es decir, hay dos ciegos.
El Doble Ciego es un trmino usado para describir que quienes reci-

ben el tratamiento y se lo administran no saben qu tratamiento de los
dos es ms probable que se le haya asignado al paciente. Doble ciego
no es un buen trmino, pero se ha impuesto. Mejor sera decir que quie-
nes intervienen estn, ambos, vendados transitoriamente. Tambin po-
dramos hablar de estudios triple ciego, cuando adems de los pacientes
y quienes asignan la intervencin, aquel que mide el resultado de la
intervencin o de la ausencia de la misma mediante un examen, no sabe
para qu mide lo que mide, simplemente se trata de un profesional que
est haciendo una evaluacin. Como sucede cuando un psiclogo mide
mediante una prueba el resultado de la intervencin, para que no se
sesgue a favor o en contra de un resultado, el psiclogo no debe saber
para qu mide lo que mide.
Adems, un elemento que se debe tener en cuenta cuando se planea y

se analiza un estudio experimental, y que se aplica mucho a los ensayos
clnicos, es la adherencia. Note que no habamos tenido en cuenta la
adherencia a la exposicin en los estudios de casos ni en los controles, ni
en las cohortes. No porque no sea importante, pues la exposicin pue-
de ser cambiante (usted puede empezar su estudio de cohorte con 100
fumadores, y acabarlo con 50 porque en el camino la mitad decidieron
no fumar). Estos son problemas que los epidemilogos ms avanzados
saben cmo tratar, pero no lo haremos en este momento. Sin embargo,
en los estudios experimentales el hecho de que un paciente sea asigna-
do a un tratamiento, pero que no se tome todos los medicamentos o
decida no tomrselos, o cambiarse a tomar al tratamiento asignado al
grupo control, es posible y requiere un anlisis especial: anlisis de la
intencin de tratar (intention to treat). Observe el siguiente ejemplo:
En 1979 decidieron hace un ensayo clnico para saber si el tratamiento

mdico era mejor que la ciruga en la mortalidad por angina inestable,
373 pacientes fueron asignados a tratamiento mdico y 394 a ciruga10.
Despus de dos aos de seguimiento, los investigadores encontraron
que 50 de los 373 pacientes asignados a tratamiento mdico haban sido
operados, que 26 de los asignados a ciruga no pudieron ser operados y
tuvieron que recibir tratamiento mdico. Los investigadores tienen tres
opciones: 1) analizar los datos de los participantes sobre cmo fueron
asignados sin tener en cuenta que despus se cambiaron de tratamiento
(esta es la intencin de tratar), 2) hacer el anlisis excluyendo a los que se
cambiaron de tratamiento, o 3) analizar a aquellos que se cambiaron de
tratamiento dentro de los grupos equivalentes a este cambio. Lo que es-
tos investigadores encontraron es que cuando estimaron la mortalidad
de los que reciban medicamentos menos la mortalidad ciruga bajos
los tres escenarios, sta fue: 1) 2.4%; 2) 5.4% y 3) 4.8%.
Note que si no se hace un anlisis de la intencin de tratar, los investigado-

res llegaran a la conclusin de que el exceso de muertes por no hacer
ciruga sera de hasta 5%, pero si se considera en el anlisis la intencin
de tratar, dicho exceso sera casi la mitad (lo cual adems result no ser
significativo a nivel estadstico). El anlisis de la intencin de tratar mantie-
ne la asignacin al azar y por eso se prefiere. El tipo de respuesta que
da la intencin de tratar es diferente de los otros dos tipos de anlisis.
La intencin de tratar es lo ms cercano a la realidad y por eso se dice
que examina la efectividad o la intencin aplicada del tratamiento.
En la vida real no esperamos que las personas adhieran 100% a los

tratamientos, como tampoco que no escojan una terapia alternativa a la
que le hemos ofrecido.
Ensayos de campo
En los ensayos de campo (field trials) el objetivo es estudiar la preven-
cin primaria de una enfermedad, por ejemplo mediante una vacuna,
es decir que este tipo de experimentos se hacen en personas sanas. Los
elementos que describimos para los ensayos clnicos se aplican de la
misma manera para este tipo de estudios.
Pruebas de intervencin comunitaria

Aqu la exposicin se le aplica a grandes grupos de gente ms que a
individuos, por ejemplo, la yodizacin de la sal o de la harina para la
prevencin del bocio, educacin de hbitos higinicos para la preven-
cin de la diarrea o campaas de educacin y mecanismos legales para
la prevencin de accidentes. Aqu no se decide por azar qu grupos se
intervienen o no.
Protocolos de investigacin
Para qu se hacen los protocolos de investigacin? Los protocolos
de investigacin se hacen con muchos propsitos: buscar financiacin,
ayudar al investigador a aclarar las ideas, someter a escrutinio la ca-
pacidad de investigar de un estudiante en formacin, y ms que todo
para garantizar que los aspectos ticos involucrados sean consi-
derados seriamente de antemano. Cada vez se hace ms nfasis en
la importancia de que los resultados que se publican concuerden con
los protocolos, y que usen menos los estudios con distintos objetivos
primarios para evaluar hiptesis que no se plantearon desde un prin-
cipio o hallazgos e interpretaciones que a uno se le ocurren cuando
ya tiene los datos a la mano y que no haba considerado antes. Sacados
del sombrero del mago y usualmente resultado de decisiones tomadas
con la excusa de: YA QUE contamos con estos datos, pues utili-
cmoslos. Suele ser receta de muchos desastres.
Cules son los elementos de un protocolo de investigacin:
1) La justificacin y los principales antecedentes del protocolo: Por

qu se hace el estudio, qu aade, por qu es importante?
2) Preguntas de investigacin o hiptesis: Cules son las preguntas

que este estudio quiere hacerse? Qu busca responder con ellas?
3) Diseo: Qu tipo de estudio epidemiolgico se har para respon-

der a la pregunta? El que est planeado es el ms apropiado?
4) Sujetos: Quines sern las personas estudiadas, cmo sern selec-

cionadas?
5) Mediciones: Qu medidas sern tomadas? Son estas fiables y

vlidas?
6) Anlisis: Qu mtodos estadsticos va a utilizar? El tamao de

muestra es apropiado para responder la pregunta?
Para resumir
La dinmica de transicin epidemiolgica nos ha llevado como inves-
tigadores a tratar de responder preguntas sobre las enfermedades que
causan una gran carga de la enfermedad en el mundo. Las enfermeda-
des cardiovasculares (Colombia es uno de los 23 pases que produce el
80% de la carga de enfermedad por estas condiciones) y los cnceres
estn entre las principales causas de muerte. Los estudios de cohorte
han aportado importantes hallazgos que han permitido conocer los
principales factores de riesgo de estas patologas. Los estudios de co-
horte se siguen haciendo, predominan ahora sobre los otros tipos de
diseos analticos, y se seguirn necesitando en muchos contextos para
responder nuevas hiptesis. Sin embargo, aunque los investigadores
ven los estudios de Casos y Controles con mucha reticencia (por sus
posibilidades de sesgos), estos estudios, cuando son bien diseados, le
ayudan al investigador a responder hiptesis etiolgicas a menor costo
y le quitan menos tiempo a la persona entrevistada. Con un estudio
de Casos y Controles es posible responder mucho ms rpido a pre-
guntas etiolgicas de estas enfermedades, mientras que con la cohorte
tardaramos mucho tiempo en hacerlo (aunque no sera impensable que
lo hiciramos). Lo invitamos a que no los desprecie y que, ms bien,
aprenda a hacerlo de manera correcta. Otro mensaje importante que
quisiramos dejarle es que un estudio de prevalencia bien diseado, y
en lo posible que le permita comparar diferentes poblaciones, es de una
riqueza investigativa nica.
Por lo dems, existen hoy muchas herramientas que le pueden ayudan

a disear muy bien los estudios epidemiolgicos, son guas que se usan
para evaluar publicaciones. Lo invitamos a leerlas al terminar nuestro
captulo.
Bibliografa
1. Rothman K.J. Induction and latent periods. (1981). Am. J. Epi-

demiol, 114 (2): 253259.
2. DAgostino R.B., Russell M.W., Huse D.M., Ellison R.C., Sil-

bershatz H., Wilson P.W., Hartz S.C. (2000). Primary and subsequent
coronary risk appraisal: new results from the Framingham study. Am
Heart J, 139 (2 Pt 1): 272281.
3. Paridou A., Velonakis E., Langner I., Zeeb H., Blettner M., Tzo-
nou A. Mortality among pilots and cabin crew in Greece, 19601997.
(2003). Int J Epidemiol, 32 (2): 244247.
4. Alvarado B.E., Zunzunegui M.V., Del Ser T., Beland F. Cogni-

tive decline is related to education and occupation in a Spanish elderly
cohort. (2002). Aging Clin Exp Res, 14 (2): 132142.
5. Checkoway H., Eisen E.A. (1998). Developments in Occupa-

tional Cohort Studies. Epidemiol Rev, 20 (1): 100111.
6. Montgomery M.P., Kamel F., Saldana T.M., Alavanja M.CR.,

Sandler D.P. (2008). Incident Diabetes and Pesticide Exposure among
Licensed Pesticide Applicators: Agricultural Health Study, 19932003.
Am. J. Epidemiol, 167 (10): 1 2351 246.
7. Brenner H., Savitz D.A. The effects of sensitivity and specifi-

city of case selection on validity, sample size, precision, and power in
hospitalbased casecontrol studies. (1990). Am. J. Epidemiol, 132 (1):
181192.
8. Siemiatycki J., Wacholder S., Richardson L., Dewar R., Gerin M.

Discovering carcinogens in the occupational environment. Methods of
data collection and analysis of a large case-referent monitoring system.
(1987). Scand J Work Environ Health, 13 (6): 486492.
9. Ridker P.M., Manson J.E., Buring J.E., Shih J., Matias M., Hen-
nekens C.H. Homocysteine and Risk of Cardiovascular Disease Among
Postmenopausal Women. (1999). JAMA, 281 (19): 1 8171 821.
10. Green S.B. Design of randomized trials. (2002). Epidemiol Rev,

24 (1): 411.
Lecturas recomendadas:
Clinical Trials
http://clinicaltrials.gov/ct2/info/index
Estudios de prevalencia
CARMELA
http://www.interamericanheart.org/?mod=carmela
SABE
http://www.icpsr.umich.edu/cocoon/ICPSR/STUDY/03546.xml
World Health Survey
http://www.who.int/healthinfo/survey/en/
Encuestas de demografa y salud
http://www.measuredhs.com/
Guas para reportar estudios
Ensayos clnicos:
http://www.consort-statement.org/
Estudios observacionales:
http://www.strobe-statement.org/
14. Factores de confusin y sesgos:

los grandes enemigos de la validez interna
de los estudios epidemiolgicos
En toda investigacin estar presente la duda de si los datos obtenidos

tienen o no validez.
Los dos grandes enemigos de la validez de las investigaciones son:

Los sesgos, y
Los factores de confusin.
Estos sern el objeto de anlisis en este captulo. En la epidemiologa la

mejor manera de ga-
Hay otro elemento que podra ser considerado aqu: rantizar la validez de
El azar. los estudios consiste
en que usted entienda
Los errores debidos al azar se controlan mediante procedimientos esta- de qu se trata el asun-
dsticos. De hecho, una de las dos principales funciones de la estadstica
en el anlisis de los datos epidemiolgicos es distinguir entre los resul- to estudiado y los m-
tados debidos al azar de aquellos que podran repetirse si se hicieran de todos pertinentes para
nuevo los estudios, es decir, de los sesgos; y en algunas circunstancias la que controle lo que es
mejor manera de evitar sesgos es mediante la asignacin al azar de los controlable.
grupos en los que sern incluidos los participantes de un estudio.
Usted ha sido advertido: dichos enemigos estn por todas partes y ade-
ms son astutos y escurridizos. Entonces, usted y todos los epidemi-
logos se preguntan cmo hacer para evitarlos. Esa es una tarea a la
cual los estadsticos y los epidemilogos le dedican gran parte de sus
esfuerzos, no siempre con xito.
Sabemos que hay tcnicas que pueden aumentar la validez de los estu-
dios, por ejemplo la aleatorizacin (asignacin al azar) mencionada con
anterioridad, pero no la garantizan.
En la epidemiologa la mejor manera de garantizar la validez de los es-

tudios consiste en que usted entienda de qu se trata el asunto estudia-
do y los mtodos pertinentes para que controle lo que es controlable.
Intentemos pues, conocer a los enemigos:

1. Las variaciones debidas al azar (aleatorias)

Toda medicin se puede deber al azar y no ser producto del diseo del
estudio. La mejor manera de controlar la indebida influencia del azar
es mediante la seleccin de un tamao de muestra adecuado que nos
garantice que aquellos efectos que podran ser causados por el azar, se
neutralicen y no se haga interpretacin incorrecta de los hallazgos.
Los novatos siempre sugieren aumentar el tamao de muestra como

solucin mgica. En el captulo sobre el tamao de la muestra veremos
que eso es simplista y no siempre lo ms conveniente.
2. Los sesgos
Los sesgos son variaciones que se repiten sistemticamente.
Los sesgos son errores repetidos que no son producto del azar
Se puede caer en sesgos en cualquier momento de un estudio, ya sea

durante la revisin de la literatura, el diseo, la ejecucin del mismo,
o durante el anlisis de los datos; puede haber sesgos de publicacin
porque a los directores de revistas les interesa slo publicar resultados
positivos o los estudios que vienen de centros prestigiosos, o porque
se sienten influenciados por sus pares; o puede haber sesgos de inter-
pretacin segn lo que el lector quiera concluir de un estudio. En otras
palabras, quien hace la revisin de la literatura, quien disea el estudio,
quien lo ejecuta o lo analiza, quien lo interpreta o quien lo publica, son
responsables de que ocurran los sesgos.
Los sesgos son pues, errores evitables.
El resultado final es que los datos producidos no son precisos ni exac-

tos, esto lo veremos ms adelante.
Las grandes categoras de sesgos, con los que usted estar ms familia-
rizado, son los:
Sesgos de seleccin, y
Sesgos de medicin.
Los sesgos de seleccin y de medicin se presentan principalmente en

el diseo del estudio y en la ejecucin del mismo. Profundicemos sobre
estos dos sesgos un poco ms y luego le hablaremos de otros enemigos
de la validez, que usted posiblemente no conoca.
Sesgos de seleccin
La forma como usted selecciona a los sujetos de un estudio determina

si la muestra obtenida es representativa o no lo es de la poblacin del
estudio. Lo ms grave sera si la relacin entre la exposicin y la en-
fermedad que usted obtiene en la gente seleccionada para su estudio
es diferente de la poblacin a la que usted quisiera que se le aplicaran
sus resultados; este es su sesgo de seleccin. Por ejemplo, para que le
respondan una encuesta, usted puede escoger a quienes estn desocu-
pados o quienes tienen un nmero telefnico asignado en el directorio

de un sitio donde solo se inscriben los miembros privilegiados de una
sociedad; o selecciona entre los transentes a los rubios o a las mujeres
bonitas, o a los que tienen cara de buena gente. O usted puede evitar
que le respondan las encuestas polticas de popularidad quienes se opo-
nen al gobernante de turno. En todos estos casos, las asociaciones que
usted intenta observar sern diferentes de las que usted obtendra si
seleccionara una muestra representativa de la poblacin.
Los sesgos de seleccin pueden tomar muchas caras, y tienen mayor

peso en algunos estudios que en otros.
En los estudios de casos y controles:
Enfermos que exageran la severidad de las enfermedades y mdi-

cos que interpretan incorrectamente sntomas y signos, las perso-
nas que se incluyen no corresponden al perfil de enfermedad de la
poblacin general.
En determinadas instituciones de salud suelen consultar tan solo

los enfermos ms graves de determinadas dolencias, lo cual da
como resultado una distribucin desigual de nmero y severidad
de los casos y los controles de nuestro estudio con un estudio rea-
lizado en otra institucin.
Grupos grandes de poblacin no llegan a ser estudiados.
En los estudios de cohorte:
Las personas que hacen parte de la cohorte pueden no representar

la distribucin de la exposicin o la no exposicin de la poblacin
de donde fueron seleccionados.
Las personas que son seguidas se pueden perder y por lo tanto

el resultado puede no reflejar la distribucin de la exposicin, de
la incidencia de la enfermedad de la cohorte inicial y, muy posible-
mente, tampoco de la poblacin a la que se quiere generalizar el
resultado del estudio.
La mejor manera de evitar los sesgos de seleccin es mediante la asig-

nacin al azar de los grupos, de manera que no sea usted ni los parti-
cipantes quienes decidan si participan o no, o en qu grupo caen. Es
decir, la mejor manera de evitar los sesgos de seleccin es mediante la aleatorizacin.
En los estudio de cohorte lo ms importante es poder lograr que aque-
llos que fueron incluidos en el estudio puedan ser seguidos hasta el final
o, en el mejor de los casos, que eventualmente se pueda tener informa-
cin de ellos a partir de registros mdicos, o hacindole contestar un
cuestionario a sus familiares.
Hay algunos sesgos de seleccin conocidos en la literatura con nombre

propio.
Sesgos de seleccin con nombre propio
Sesgo de Berkson: se presenta cuando se llega a conclusiones errneas

por utilizar muestras de hospitales u otras instituciones de salud. Tanto la enfer-
medad como los factores de exposicin suelen estar sobrerepresenta-
dos o subrepresentados en poblaciones hospitalarias. Las instituciones
de salud tienden a escoger tanto a sus pacientes como las enfermedades
que admiten, y los enfermos tienden - a veces inconscientemente - a
visitar ms ciertos hospitales que otros, debido a su xito con los casos
de mayor complejidad.
Ejemplo: deseosos de saber cunto protege la lactancia materna contra

el maltrato infantil, un grupo de investigadores decide emprender un
estudio de Casos y Controles en un grupo de nios menores de cinco
aos. Se escogen como casos a nios con trauma craneano severo por
golpiza, hospitalizados en el servicio de trauma del hospital universita-
rio. Los controles los toman de pacientes admitidos por otras formas
de trauma en el servicio de ciruga general y del servicio de recupera-
cin nutricional de un hospital diferente. Los resultados son muy si-
milares en todos los grupos estudiados. Un epidemilogo consultado
les aconseja tomar los controles no de los hospitales, sino del mismo
barrio de donde provienen los nios golpeados. All el grupo de nios
control muestra tasas ms altas de lactancia materna exclusiva y de lac-
tancias prolongadas.
Sesgo de Neyman: se presenta en los estudios de Casos y Controles cuan-

do se seleccionan casos prevalentes, tambin se llama sesgo de sobrevi-
da. Cuando se eligen los casos que existen en un momento dado en una
poblacin, estos pueden representar los casos que sobrevivieron hasta
el momento en que se incluyen y no necesariamente los casos en la po-
blacin general. Cuando seleccionamos casos prevalentes no sabremos
si la exposicin est relacionada con la sobrevida de la enfermedad,
ms que con su etiologa. Se corre el riesgo de que al calcular el OR,
como no se incluyen dentro del anlisis los ya fallecidos, el factor de
riesgo puede aparecer como si fuera un factor protector, o su relacin
es menor que la esperada.
Ejemplo: estudios de casos y controles haban demostrado que el ciga-

rrillo estaba asociado con menor riesgo de Enfermedad de Alzheimer.
La mayora de estos estudios haban tomado los casos de entre aque-
llos en quienes la enfermedad era prevalente. Ms adelante, estudios
de cohorte no probaron esta asociacin. Por tratarse de casos preva-
lentes, lo que quiz sucedi fue que aquellos que fumaban se moran
ms tempranamente de otras enfermedades, tal vez antes de desarrollar
demencia. Quienes sobrevivieron eran fumadores que desde el inicio
no tenan alto riesgo de demencia.
Sesgos de Medicin
Los sesgos de medicin dependern de qu tan bien calibrados estn
los instrumentos o de las expectativas de los participantes, ya que estos
le darn al investigador una u otra respuesta segn les convenga, de
igual forma que los evaluadores darn uno u otro puntaje segn lo que
quieran demostrar. Por ello, una manera de evitar los sesgos de medicin es
esencialmente mediante el enmascaramiento de los participantes (un ciego), de los
diseadores del estudio y de los participantes (dos ciegos) o de los anteriores ms los
evaluadores de pruebas (tres ciegos). Los sesgos de medicin se relacionan
tambin con la validez de los instrumentos de medicin de la exposi-
cin y de la enfermedad. Los sesgos de medicin se pueden evitar (o disminuir)
con instrumentos que sean confiables, es decir, que midan lo que quieren medir. El
uso de instrumentos poco sensibles o poco especficos puede alterar la
magnitud de nuestras asociaciones, como lo veremos ms adelante.
Tanto para los estudios de casos y controles, estudios de prevalencia

o estudios de cohortes, los sesgos de medicin pueden surgir de ma-
nera similar, por las mismas razones (ver siguiente recuadro), pero en
ciertos estudios predominan unos ms que otros; por ejemplo, en los
estudios de casos y controles ser ms frecuente que la medicin de la
exposicin se altere por la presencia de una enfermedad. Recuerde que
en los diseos tradicionales de casos y controles la persona conoce cul
es su estado de salud cuando hacemos la entrevista. En los estudios de
cohorte las dificultades de medicin se relacionan ms con la medicin
de la enfermedad o de la incidencia de un evento; recuerde que en los
estudios de cohorte partimos de la medicin de la exposicin y quere-
mos saber, en el tiempo, el estado de salud. La medicin vlida de la in-
formacin de la enfermedad deber ser independiente del estado de la
exposicin (ciega), pero adems apropiada en cuanto al tiempo en que Los sesgos de medi-
se mide (si incluye el periodo de relevancia etiolgico ver captulo de cin se pueden evitar
diseos) y su validez.
(o disminuir) con ins-
Recuadro No ? Fuentes de errores en la medida (vale tanto para trumentos que sean
la exposicin como para la enfermedad) confiables, es decir,
que midan lo que quie-
1. Errores en el diseo del instrumento: ocurre cuando el instrumen-
to que elegimos no cubre todas las fuentes de la exposicin posibles, ren medir.
como sucedera si quisiramos medir la ingesta de cafena y solo pre-
guntramos por el consumo de caf, sin tener en cuenta el consumo
de t o de bebidas gaseosas. Tambin puede ocurrir que la medicin
biolgica de nuestra exposicin o evento no sea una buena medida de
la exposicin, lo que sucede cuando usamos pruebas poco sensibles o
especficas. Igualmente podemos hacer un cuestionario para conocer
el efecto del consumo de alcohol y su relacin con la enfermedad coro-
naria, pero solo preguntamos si se consumi alcohol durante la ltima
semana, y no se nos ocurre averiguar sobre la frecuencia de consumo
alcohlico en el ltimo ao o por episodios de ingesta excesiva de alco-
hol (borracheras - binge behaviour -).
2. Errores en el protocolo: cuando usamos medidas biolgicas o prue-

bas fsicas para medir una exposicin o un evento, podemos encontrar-
nos con tcnicos de laboratorio, encuestadores o investigadores que
no siguen las instrucciones. Esto puede hacer que la informacin pro-
porcionada por varios laboratorios o varios encuestadores de nuestro
estudio no sea comparable entre s, algo que puede suceder cuando
hacemos estudios multicntricos.
3. Limitaciones debidas a las caractersticas de nuestros participantes:

puede ocurrir que las personas que entrevistamos tengan dificultades
de memoria (personas mayores), no entienden correctamente las pre-

guntas, o que por su grado de escolaridad no puedan realizar la prueba
(como sucede con las pruebas cognitivas).
4. Errores en la inclusin de los datos y su anlisis: los errores en la pro-

gramacin de los datos de nuestro estudio pueden ocurrir por la falta
de experiencia y seguimiento de la forma como se ingresan los datos
del estudio a los programas de cmputo.
Sesgos de medicin con nombre propio

Efecto Hawthorne. Este trmino fue acuado en 1955 para describir
un fenmeno observado en una fbricataller de Chicago en la po-
ca de la gran recesin econmica de los aos 19281932. El efecto
Hawthorne describe la mejora transitoria observada en los puntajes de
desempeo cuando se introducen cambios en la estructura fsica, por
ejemplo en la iluminacin del lugar de trabajo o el orden de las estante-
ras. Dichos cambios hacen que los trabajadores se sientan observados
y como consecuencia mejoren su rendimiento, la mejora es transitoria
y dura mientras los trabajadores se acostumbran al nuevo ambiente,
despus de lo cual vuelven a sus rutinas y a sus niveles usuales de rendi-
miento. En los estudios de investigacin, el efecto Hawthorne se refiere
a la tendencia de algunas personas a trabajar ms duro y tener mejor
desempeo cuando participan en un experimento. Para evitar que el
efecto Hawthorne distorsione los resultados de un estudio, hay que ga-
rantizar que tanto los participantes en los grupos de tratamiento como
los de control tengan igual conciencia de su participacin en el estudio.
A pesar de su uso extendido, se recomienda no usar este trmino debi-
do a su falta de especificidad.
Ejemplo: Yosimiro Muitomusho, un periodista palmireo descendien-

te de japoneses, nos pidi que incluyramos esta pequea contribucin
que, segn l, ayudara a entender mejor el texto:
Han visto ustedes alguna vez a las quinceaeras palmireas, de ta-

cones altos y minifaldas estrechas, atravesar un saln sobre el que caen
miradas desde todos los rincones? Las primeras veces trastabillarn y
perdern el paso pero a medida que ellas se acostumbran y los ojos
de los espectadores cambian de foco de inters, el paso se volver firme
y ellas caminarn con la gracia de las palmeras mecidas por las brisas
del ro Cauca.
Nota: entre los autores y colaboradores del libro hubo una discusin
acalorada sobre la conveniencia y la relevancia de incluir esta contribu-
cin ligera en un libro tan serio; tambin les preocupaba a dos de ellos
el tono machista y el uso de un lenguaje tan ajeno a la correccin pol-
tica del momento. Finalmente, se mantuvo la nota de Yosimiro como
reconocimiento al desarrollo propiciado por los inmigrantes japoneses
llegados a Palmira a comienzos del siglo XX (Palmira es una hermosa
ciudad del Valle del Cauca, en Colombia, al menos eso dicen los pal-
mireos).
Sesgo de recuerdo (recall bias): frecuente en los estudios retrospec-

tivos, este sesgo de respuesta se presenta cuando en una encuesta, o
durante la obtencin de la historia clnica, la respuesta puede ser modi-
ficada voluntaria o involuntariamente por la versin y el recuerdo que
tiene de los hechos quien responde.
Ejemplo: es frecuente que los pacientes con tumores intracraneanos

relaten golpes en la cabeza y los asocien con el comienzo de los snto-
mas de la hipertensin endocraneana. O que las mujeres con carcinoma
de mama asocien la deteccin de la masa con un golpe al cual le atri-
buyen el tumor.
Este sesgo est relacionado con el sesgo de enfermedad no aceptable.
Sesgo de enfermedad no aceptable: es difcil que una persona que haya

decidido hacerse un aborto voluntario, lo confiese espontneamente.
Igual cosa podra pasar con enfermedades mentales propias o de los
parientes, o con las enfermedades de transmisin sexual.
Sesgo del observador: se supone que por ser hombres de ciencia, los
investigadores (mdicos y otros) usan criterios objetivos en las valora-
ciones clnicas. Eso est lejos de ser verdad.
Ejemplo: dos radilogos que leen la misma placa de trax la interpre-

tarn de manera diferente en un alto porcentaje de veces (variacin en-
tre observadores). Un mismo radilogo interpretar la misma placa de
manera diferente en dos ocasiones distintas (variacin intraobserva-
dor). La variacin es grande cuando varios mdicos auscultan el mismo
trax. En el caso de los ensayos clnicos siempre existe la probabilidad
de que los criterios diagnsticos y de mejora sean diferentes entre ob-
servadores. La mejor manera de evitarlo es mediante aleatorizacin.
Sesgos causados por la regresin hacia el promedio: se conoce como

regresin hacia el promedio la tendencia que tienen los individuos con
puntajes extremos en la medicin de una variable, a obtener puntajes
ms cercanos al punto central de la distribucin cuando los resulta-
dos se miden por segunda vez. Por supuesto, este es un sesgo que se
presenta al medir solo aquellas variables susceptibles de modificacin
mediante una intervencin, como sera el caso de la presin arterial, el
peso, el nivel de colesterol srico o aun los puntajes de exmenes aca-
dmicos y no de aquellas variables relativamente estticas como la talla
corporal en la vida adulta. La regresin hacia el promedio puede intro-
ducir sesgos porque los investigadores le podran atribuir los cambios
a su intervencin y no a la tendencia de los extremos a regresar hacia
el promedio.
Ejemplo: patrocinados por una compaa farmacutica, un grupo de

cardilogos decide emprender un estudio para evaluar los efectos de
un nuevo medicamento antihipertensivo basado en una mezcla de blo-
queadores de los canales del calcio y antagonistas de los receptores de
Angiotensina II. Los participantes del estudio son divididos en tres
grupos.
Grupo 1. Lo conforman 200 pacientes deseosos de intentar el nuevo

tratamiento. Su TA en promedio es de 200/118 mm. Hg. Grupo 2.
Conformado por 200 pacientes que no estn dispuestos a tomar me-
dicamentos pero que aceptan que les midan la TA posteriormente, su
TA en promedio es de 200/120 mm. Hg. Grupo 3. Conformado por
200 voluntarios sanos, muy entusiasmados con la presencia de las muy
atractivas estudiantes de medicina encargadas de medir la presin arte-
rial. El promedio de TA de este grupo es de 115/75 mm. Hg.
Dos aos ms tarde los tres grupos son examinados de nuevo.
Del grupo 1 han perseverado 150 pacientes; el promedio de sus cifras

tensionales es de 139/99 mm. Hg. Del grupo 3, muchos se vieron en-
vueltos en romances con las estudiantes de medicina, algunos se casa-
ron y de ellos algunos ya se separaron. Casi todos se ven ms obesos.
El promedio de los 130 que acudieron a la medicin fue de 135/ 90.
Del grupo 2 se pudieron conseguir solamente 120 pacientes dispues-
tos a respetar el compromiso adquirido. Se ven ms flacos y algunos
han hecho dietas y comenzado a caminar regularmente, por miedo al
infarto y a los accidentes vasculares, sus cifras de TA son en promedio
de 140/100.
Los sesgos causados por quienes endiosan las pruebas: Los endiosa-
dores de pruebas suelen ir camuflados de mdicos jvenes de hos-
pitales universitarios, con ms frecuencia entre quienes han hecho re-
cientemente alguna rotacin en el extranjero. An andan intoxicados
de libros a medio digerir y carecen de experiencia en la vida real. Basta
entonces que aparezca un artculo que anuncie una nueva prueba para
que ellos la abracen entusiasmados. La utilidad de una nueva prueba
diagnstica depende de si cumple con los mismos criterios de las prue-
bas ampliamente usadas, es decir, la Sensibilidad (capacidad de demos-
trar los verdaderos positivos), la Especificidad (capacidad de descubrir
los verdaderos negativos), y del Valor Predictivo. El problema que tienen
las pruebas nuevas es que se suelen ensayar primero en pacientes entre
quienes hay una prevalencia elevada de la enfermedad que se desea de-
tectar. En esas condiciones el Valor Predictivo de un test es ms elevado
que en condiciones normales.
Por ello, la valoracin de las bondades de una nueva prueba diagnstica

es optimista. Ha sucedido con la resonancia nuclear y sucedi en su
momento con la tomografa axial computada, con el ultrasonido, con
las pruebas de PCR (reaccin de cadenas de polimerasa) y con el ant-
geno prosttico para la deteccin temprana del carcinoma de la prsta-
ta. Con el paso del tiempo y ms experiencia clnica en poblaciones no
tan seleccionadas, todas fueron mostrando sus limitaciones y tambin
se fueron precisando sus indicaciones y sus ventajas.
Ejemplo: sucedi hace bastantes aos. Un cientfico local, deseoso

de ganarse el Premio Nobel, haba desarrollado una prueba para la
demostracin temprana de la lepra. Escogi para realizar las prime-
ras pruebas a los habitantes de una poblacin de tierra caliente, algo
aislada, pero aun as famosa por proveerles refugio amable a msicos
retirados y a los leprosos de todo el pas que vivan all sin que nadie los
discriminara. Estos fueron los resultados de las pruebas:
Lepra
Presente + Ausente - Total
Prueba 62 4 66
+
Prueba
6 53 59
-
68 57 125
Sensibilidad de la prueba: 62/68 = 91%

Especificidad de la prueba: 53/57 = 93%
Valor Predictivo Positivo: 62/66 = 94%
- Maravilloso! - Exclam nuestro cientfico entusiasmado -. Y empez
a preparar maletas para Estocolmo.
Sin embargo, un ao despus de usar el test en pacientes sospechosos
de lepra, ya no del pueblo de leprosos sino de todo el departamento, los
resultados mostraron lo siguiente:
Lepra
Presente + Ausente - Total
Prueba 67 32 99
+
Prueba
6 425 431
-
73 457 530
Segn estos nuevos resultados, la Sensibilidad de la prueba sigue siendo

67/73 = 92%, la Especificidad 425/457 = 93% tambin sigue siendo
igual, pero el Valor Predictivo positivo disminuye,
Valor Predictivo Positivo = 67/99

En la prctica clnica, el Valor Predictivo Positivo tiene ms utilidad
que la Sensibilidad o la Especificidad, ya que estas dos ltimas reflejan
solamente la proporcin de resultados positivos y negativos en pobla-
ciones homogneas, es decir, entre quienes tienen la enfermedad o no
la tienen, mientras que el valor predictivo positivo tiene la capacidad de
detectar variaciones entre poblaciones diferentes.
Como notamos, en el primer estudio el investigador infl (endios) el

valor predictivo positivo de la prueba por haber escogido, para probar-
la, a una poblacin altamente seleccionada.
Tambin pueden equivocarse quienes, llenos de confianza en las bon-

dades de una prueba, calculan los puntos de corte y los rangos de nor-
malidad con mucha estrechez.
(Ver el captulo correspondiente).

Otros sesgos que usted, posiblemente, no conoca

Sesgos en el diseo que se generan de la no comparabilidad
Ocurre cuando los grupos que se escogen para la comparacin no pue-

den ser comparados.
Falacia ecolgica: la falacia ecolgica es un error de la interpretacin de

los datos estadsticos de un estudio ecolgico, mediante el cual las infe-
rencias de los individuos se basan solamente sobre los agregados esta-
dsticos de la poblacin a la cual pertenecen. En otras palabras, median-
te la falacia ecolgica se asume errneamente que todos los individuos de
un grupo toman todas las caractersticas de su grupo, como si fueran
estereotipos.
Sesgo resultante de la mejora en la exactitud diagnstica: este sesgo

se presenta cuando hay cambios sbitos en la incidencia de una enfer-
medad - por ejemplo aumento o disminucin del nmero de casos de
cncer en una poblacin dada, en un ao determinado - como conse-
cuencia de la disponibilidad de nuevos mtodos diagnsticos en la re-
gin. En otras palabras, el aumento o la disminucin percibidos en las
estadsticas no corresponderan a un cambio real en el nmero de ca-
sos - que hubieran permanecido iguales si se hubieran seguido usando
los mtodos y criterios antiguos de diagnstico -, sino a su incremento
o disminucin como resultado de las nuevas tcnicas. Este cambio en
la incidencia es transitorio.
Ejemplo: En el Congreso Andino de Medicina Interna de hace unos

30 aos, un grupo de mdicos internistas - proponentes entusiastas de
las terapias alternativas - present un estudio en el que demostraban
la eficacia de una dieta a base de yerbas locales en el tratamiento y
prevencin de la lcera pptica. En efecto, desde cuando se empez
a promover la dieta mencionada, la incidencia de lcera pptica - do-
lencia hasta entonces muy comn en la regin montaosa de donde
provenan nuestros internistas de marras - comenz a descender.
El entusiasmo de los galenos disminuy cuando un epidemilogo les

hizo ver la realidad.
La verdadera historia fue as: preocupado por el elevado nmero de

pacientes con sntomas gstricos, el Secretario de Salud local convoc
a los profesionales de la regin a proponer alternativas viables para
solucionar el problema. Una de las propuestas que suscit mayor entu-
siasmo fue la de los internistas de la dieta de yerbas en una regin muy
dada a los remedios caseros. Por la misma poca en que se planeaba
el estudio, lleg a la regin un endoscopista entrenado en el Japn,
un patlogo de la Universidad de Louisiana y un epidemilogo de la
Universidad del Valle, y con ellos llegaron los mejores endoscopios, los
mtodos histolgicos ms avanzados y una epidemiologa ms razona-
ble. Todo ello result en una mejora sustancial en la exactitud diagns-
tica. Casos anteriormente diagnosticados por los mdicos locales como
lcera, comenzaron a ser clasificados como gastritis hemorrgicas por
analgsicos, reflujos, gastritis alcohlicas, carcinomas de estmago y,
claro est, tambin algunas ulceras gstricas y duodenales, pero en me-
nor nmero que antes. Unos aos ms tarde se aclarara el rol del Heli-
cobacter Pylori tanto en la gnesis de algunas formas de gastritis como
en las lceras y carcinomas gstricos.
Efecto de cohorte. Este enemigo se camufla de manera especial en los

estudios transversales. El efecto de cohorte es la tendencia de atribuirle
a las personas nacidas en determinadas pocas, Riesgos Relativos ms
altos o ms bajos de padecer cierta enfermedad, cuya incidencia suele
ser atribuida de forma errnea a la edad y no a un factor comn al que
los miembros de esa cohorte han sido expuestos circunstancialmente
en alguna poca de sus vidas.
Ejemplo: las estadsticas de salud de una ciudad costera muestran que

existe una alta prevalencia de casos de carcinoma escamo celular de
piel en las personas mayores de cuarenta aos. Lo atribuyen a una ex-
posicin elevada a los rayos del Sol. Al organizarlos por grupos de
edad, una epidemiloga perspicaz nota que el carcinoma de piel no ha
aumentado entre los pescadores ms viejos de la poblacin, los cuales
continan saliendo diariamente a pescar, tal como lo hicieron toda su
vida, sin ninguna proteccin contra los rayos del Sol. Por el contrario,
la prevalencia s ha aumentado en la cohorte de quienes tienen entre
40 y 50 aos. En la bsqueda de un factor comn asociado se descubre
que dentro del grupo de edad afectado estuvo muy de moda una crema
rejuvenecedora a la cual se le han descubierto recientemente sustancias
carcinognicas.
El efecto del trabajador sano. Cuando se seleccionan poblaciones de

trabajadores y se quieren obtener datos que deban ser generalizados a la
poblacin general, los estudios muestran que los trabajadores tienen ta-
sas de mortalidad e incidencia bastante menores para ciertas condicio-
nes no relacionadas con riesgos propios de la ocupacin. Las personas
que trabajan, por el hecho de estar trabajando, representan poblaciones
ms sanas que son seleccionadas por su estado de salud para trabajar.
Lo que hace que una persona trabaje en construccin es muy diferente
de lo que hace que una persona trabaje como secretaria o lo que hace
que alguien est desempleado. Estas diferencias para seleccionar a las
personas en determinados trabajos hacen que estos grupos de pobla-
cin no sean comparables cuando se hacen estudios epidemiolgicos.
Sesgos de anlisis
La proteccin que se obtiene mediante la seleccin por el azar sirve

solo si se mantiene a lo largo del estudio y durante el anlisis, de manera
que se sigan cumpliendo las condiciones originales, o si las condiciones
cambian usted las tenga en cuenta y haya planeado de antemano qu
hara en caso de prdida o de abandono de los participantes del estu-
dio. Manera de evitarlos: maximizando el seguimiento o mediante un anlisis
llamado intencin de tratamiento (intention to treat) en el que se considera lo que
se decidi al comienzo del estudio.
Sobreemparejamiento, tambin llamado sobreapareamiento (over-

matching). Este es un sesgo caracterstico de los estudios de Casos y
Controles. Dichos estudios buscan, sobre todo, eficiencia. Y para lo-
grarlo se procura asegurar que los factores que deben estar apareados,
tales como edad y sexo, estn igualmente distribuidos entre los casos
y los controles. Por lo tanto, este apareamiento remueve el efecto de
confusin original de estos factores, pero puede introducir nuevos ses-
gos, en especial cuando se aparea tanto que al final los estudios no son
capaces de reconocer la presencia de una asociacin verdadera, usual-
mente la ms importante. En sentido estricto, el sobreapareamiento
no sesga los resultados pero hace que el anlisis sea ineficiente, con lo
cual desaparece la principal virtud del apareamiento.
Ejemplo: un ingeniero sanitario de la Secretara de Salud decide hacer

un estudio de casos y controles para determinar si la contaminacin
ambiental del aire es o no la causa del elevado nmero de asmticos en
la ciudad. Al disear su protocolo, el acucioso ingeniero considera to-
das las variables posibles. Asmticos y no asmticos son apareados por
sexo, edad, clase social, ingreso, nivel educativo, aficiones y aun por la
manzana de la vivienda. Al medir la concentracin de partculas conta-
minantes por volumen del aire ambiental, el funcionario no encuentra
ninguna diferencia entre el aire que respiran asmticos y no asmticos
en cada manzana examinada. El error consisti en que el ingeniero hizo
todos los cruces y apareamientos posibles pero pas por alto pregun-
tarse qu hubiera pasado si hubiera tomado los controles no de la mis-
ma manzana de los asmticos sino de una diferente, aun de otro barrio
en donde las condiciones ambientales fueran diferentes.
Algunas sugerencias generales para evitar los sesgos

(Tomado del libro de campo del General Desconcierto, experto en
contrainteligencia del Ejrcito):
1. Lo primero es reconocer que se trata de enemigos difciles a los

cuales debemos respetar. Ningn diseo, por perfecto que sea, ni
algn grado de experiencia garantizarn que un estudio se pueda
librar totalmente de ellos.
2. No intente entonces destruirlos por completo. Es mejor contro-

larlos. Para ello:
3. Hay que aprender a conocerlos. Ciertos sesgos se presentan ms

en algunos diseos, otros son todo terreno.
4. Hay que entender que no necesariamente la ausencia de sesgos le

da mayor validez a un estudio.
Al igual que existen batallones modelo, constituidos por soldados bien

presentados pero que se arrugan en el fragor de la batalla, hay algunos
estudios impecablemente concebidos y metodolgicamente perfectos
pero que poco aportan: aburridas hojas de papel con mucha claridad y
poca sustancia.
Por el contrario, conocemos ejrcitos llenos de hombres maosos, aun

viciosos, pero soldados valientes a la hora de la verdad, que para nada
daan la eficiencia del grupo. Y tambin conocemos estudios geniales
que no logra invalidar la presencia de algunos sesgos.
Moraleja: no se preocupe en encasillar totalmente los sesgos. Ellos no

son cuadrados. Por ahora, basta que entienda que toda investigacin es
un territorio minado y que usted debe estar alerta.
Descansen Ar!
Qu efectos tienen los sesgos en nuestras estimaciones?

Una medida no vlida de la exposicin puede afectar nuestras estima-
ciones, en este caso le explicaremos cmo puede afectar el OR y el RR
(riesgo relativo).
Lea el siguiente ejemplo:
La encuesta nacional de salud de los Estados Unidos, as como mu-

chas encuestas, estiman la frecuencia de diabetes por el autoreporte
de diabetes de sus encuestados, utilizando la siguientes pregunta: Al-
guna vez un mdico le ha dicho que usted tiene diabetes o azcar en la
sangre? Como usted se imaginar, es posible que el autoreporte sea
mucho ms bajo si sabemos que al menos el 40% de la poblacin de
ese pas no tiene seguro mdico; o la prevalencia resultante podra ser
sobreestimada si las personas desconocen el verdadero significado de
tener azcar en la sangre. Algunos investigadores lograron estimar la
sensibilidad y especificidad del autoreporte de diabetes, y encontraron
una sensibilidad de 73% y una especificidad de 99%. Ahora valdra la
pena preguntarse de qu manera la falta de una buena sensibilidad de la
prueba afectara las asociaciones entre diabetes y frecuencia de enfer-
medad cardiovascular, una asociacin ya muy conocida.
Con los datos de la encuesta encontramos la siguiente asociacin entre

el autoreporte de diabetes y la incidencia de enfermedad coronaria
en 10 aos. Incidencia en personas con diabetes: 72/206 = 34%, y en
las personas sin diabetes = 408/4 659 = 8%, lo cual indica un RR de
3.99. Este es el riesgo de enfermedad coronaria asociado con diabetes
cuando esta ltima es medida por autoreporte.
EC + EC - Total
Diabetes
72 134 206
+
Diabetes 408 4251 4659
-
408 4385
Cuando se verifica el reporte de diabetes y se tiene en cuenta que la sen-

sibilidad es solo del 73% y la especificidad de 99%, la tabla lucira as:
EC + EC - Total
Diabetes
93 125 206
+
Diabetes 387 4259 4659
-
408 4385
No se presentan los clculos, pero el lector ms interesado puede encontrar las fr-
mulas en libros de epidemiologa ms avanzados). Observe que el nmero de casos de
enfermedad coronaria no cambia, pero s el nmero de casos de diabetes que ahora
ha aumentado por el posible subreporte de diabetes cuando se hizo la encuesta. El
RR es ahora de 5.13
En el ejemplo anterior, la falta de validez de nuestra medida subestim

la asociacin entre la diabetes y la enfermedad coronaria. No siempre
sucede as. La regla general (ahora muy discutida) es que las asociacio-
nes tienden a subestimarse cuando se trata de errores nodiferenciales,
y que pueden subestimarse o sobreestimarse cuando los errores son
diferenciales.
De qu se tratan estos errores?
Los errores nodiferenciales se producen cuando los errores de la

medida son independientes de la exposicin o de la enfermedad. Por
ejemplo, la sensibilidad y especificidad del autoreporte de diabetes es
igual entre quienes desarrollaron enfermedad coronaria y aquellos que
no la desarrollaron (nodiferencial). Otro ejemplo sera el de un estu-
dio de casos y controles en el cual los casos son aquellos que sufrieron
de enfermedad coronaria, y los controles, aquellos que no; ahora, la
sensibilidad y especificidad de la prueba para diagnstico de diabetes
fue igual entre los casos y controles (es decir que usamos el mismo
laboratorio, el mismo protocolo, el mismo encuestador y que muy po-
siblemente el observador estaba ciego en cuanto a si se trataba de un
caso o un control).
Otro ejemplo de error nodiferencial. En un estudio hipottico de ca-

sos y controles de mortalidad general, en el cual se midi el consumo
de cafena por el consumo de caf, se encontr que el consumo de
cafena de >230mg/da est asociado a la mortalidad general con un
OR de 1.02. Se encontr que tanto en los casos como el los controles
el consumo de cafena se subestima en 63%. Cuando se incluye tanto
en los casos como en los controles la medicin de cafena que proviene
de chocolate, medicamentos, t y colas, la verdadera asociacin entre el
consumo de cafena y mortalidad es de 2.
Los errores diferenciales ocurren cuando la medicin de la exposicin

depende del estado de las otras variables, o cuando la medicin de la
enfermedad depende de la exposicin. En los estudios de casos y con-
troles esto se presenta porque los casos tienden a reportar de manera
diferente las exposiciones debido al conocimiento que tienen de la en-
fermedad; por ejemplo, las madres de nios con anomalas congnitas
reportan mejor la exposicin que las madres con nios normales; la
exposicin tiene mayor sensibilidad en los casos que en los controles.
Cuando el entrevistador, conociendo el estado de salud de la persona,
si esta es caso, o control expuesto o no expuesto, mide de manera di-
ferente en cada grupo, o utiliza una prueba de diferente sensibilidad y
especificidad en los casos o en los controles (este sera un ejemplo ex-
tremo). Los laboratorios o los encuestadores que miden la exposicin
y la enfermedad tienen diferentes protocolos para los grupos. Tambin
es posible que los sntomas de la enfermedad modifiquen la informa-
cin sobre la exposicin en los futuros casos, pero no en los controles
que no tienen sntomas. Si la prueba que mide la enfermedad se basa

en reporte de sntomas, la prueba ser ms sensible entre los expuestos
que entre los no expuestos.
Miremos un ejemplo:
Una investigacin adelantada en Noruega estudi la relacin entre la

exposicin al polvo y a gases en el trabajo con el riesgo de enfermedad
respiratoria. Los datos de la exposicin fueron reportados por los en-
trevistados, pero de igual manera los investigadores fueron a los lugares
de trabajo a medir la exposicin en los entrevistados. Lo que encontra-
ron los cientficos fue que la sensibilidad de la medida autoreportada
en las personas que tenan sntomas respiratorios era mayor, 62.9%,
entre quienes tenan asma que en las personas que no tenan asma,
21%. En este caso, la validez de la medida era mayor para los enfermos
que para los no enfermos. Los investigadores encontraron que cuando
se usaba el autoreporte de exposicin, el riesgo de asma asociado con
la exposicin era de 1.98, y cuando usaban los registros era de 1.45. En
este caso, el error diferencial hace que se sobrestime la asociacin.
Factores de Confusin
Qu es un factor de confusin? Es un factor asociado con el resultado
que nos interesa, pero que por estar distribuido desigualmente entre
los grupos de estudio, invalida los hallazgos o hace difcil su interpre-
tacin.
Requisitos de los factores de confusin
Para que sea un factor de confusin, se requiere que:

El factor de confusin est asociado con el efecto (enfermedad,
lesin) como causa de sta, pero no como efecto de la enferme
dad.
El factor de confusin est asociado con la exposicin.
Sin embargo, aunque cumplen con las dos caractersticas mencionadas
Hay factores que son a la vez el resultado de una exposicin y
pasos intermedios, pero NO son factores de confusin.
Puesto de otra manera: el factor de confusin est asociado con el efec-

to y con la exposicin, pero NO est en la lnea directa del camino de
causalidad que conecta las variables estudiadas.
En otras palabras, NO es factor de confusin si est en la lnea explica-

toria directa que une causa y efecto.
Variables de confusin: Hbito de fumar Cncer de pulmn
no estn en la lnea de
causalidad directa, pero
afecta tanto a la variable
independiente como a la Consumo de alcohol
dependiente (Factor de confusin)
El factor de confusin, en este caso el alcohol, puede causar sesgos en

ambas direcciones ya sea porque sobreestima el efecto, como sucedera
en el caso del consumo del alcohol y los casos de carcinoma de la larin-
ge, o porque los subestima.
No es factor de confusin si est en la lnea explicatoria directa.
Causa Intermedio Efecto
Factor de confusin
Supongamos que la obesidad y la elevacin del colesterol srico son

producto de una dieta inadecuada y de la falta de ejercicio. Y que el
efecto estudiado sea el infarto del miocardio. Las causas primarias del
infarto seran la falta de ejercicio y la dieta inadecuada. Pero la obesidad
no es un factor de confusin. La relacin entre obesidad, dieta, ejerci-
cio y colesterol e infarto de miocardio lucira as:
Actividad fsica Obesidad

Infarto del
miocardio
Dieta Colesterol
Varios puntos se desprenden de lo anterior:
El estudio de los factores de confusin est ntimamente ligado al de la

causalidad. Por ahora baste recordar que la causalidad se entiende hoy
como algo complejo y que rara vez hay una sola causa; adems, stas es-
tn interrelacionadas de forma tan compleja que debemos esclarecer.
De manera que mientras:

Sesgo implica error en la medicin de una variable,
Confusin es un error en la interpretacin de lo que puede ser un
resultado exacto.
Algunos ejemplos clsicos de factores de confusin
Confusin sucede al decir que un estudio muestra datos en los que se
asocia al alcohol con el cncer de pulmn o de laringe y uno dice que
el alcohol causa cncer de la laringe o de pulmn sin entender que
quienes consumen alcohol, al igual que los jugadores de billar, fuman
ms que otras personas. En ambos casos la asociacin fue espuria por
confundir algo que no est en la lnea de explicacin y por ello impide
ver que el factor era el cigarrillo.
Tambin, hace varios aos se dijo que el caf era causa del cncer de
pncreas porque los consumidores de caf tenan una incidencia mayor
de cncer de pncreas (los datos eran ciertos) pero se olvido considerar
que quienes tomaban mucho caf eran los fumadores.
Qu hacer con los factores de confusin

Los factores de confusin se evitan o se controlan.
Cmo evitar los factores de confusin?

Se restringe la poblacin de estudio de manera que los grupos de com-
paracin tengan la misma distribucin del factor de confusin; por
ejemplo, en un estudio en el cual el consumo de cigarrillo sea un fac-
tor de confusin, usted restringe su poblacin de estudio a los no fu-
madores. La otra forma es asignar al azar la exposicin, que como ya
sabamos, permite que los grupos sean comparables en otros factores
o exposiciones diferentes a las que hemos asignado al azar. En el dise-
o tambin podemos aparear las personas expuestas y no expuestas, o
los casos y los controles por variables de exposicin que podran ser
factores de confusin; por ejemplo, si la edad es un factor importante
de confusin, porque es ms probable que los casos de cncer sean de
mayor edad que los controles sanos, escogemos un caso y lo apareamos
con un control de la misma edad.
Cmo controlar los factores de confusin?

A. Es fcil si usted sabe cules son.
1. Se estratifican los resultados. Se analizan fumadores y no fuma
dores por separado ya que son dos estratos diferentes.
2. O se usan tcnicas estadsticas para ajustarse a la confusin.
B. Si los factores no son conocidos, es ms difcil.
En aquellos estudios en que usted intuye que tales factores estn aso-
ciados con un resultado, pero no quiere invalidar el estudio con sus pre-
juicios, la manera ms segura de evitarlos es mediante la aleatorizacin,
de manera que los posibles factores de confusin: los conocidos y los
no conocidos, se distribuyan por igual en los grupos estudiados.
Control de los factores de confusin mediante la estratifica-
cin de los datos
Historia de la estatua del profesor Estrato.
Una pequea aclaracin: esta nota fue escrita antes de que el sistema de transporte MIO estuviera
funcionando.
En el ao 2007 un gran nmero de acadmicos caleos decidi reti-

rarse a disfrutar de su pensin en La Cumbre, un pequeo pueblo de
la cordillera cercano a Cali, hasta hace poco amenazado por guerrilla,
paramilitares y bandas de narcotraficantes.
El pueblo es idlico, con mucha vegetacin, un maravilloso paisaje des-

de donde se ve el valle del ro Cauca a lo lejos y a donde llegan las brisas
del Pacfico. Hay gran quietud, lo cual para los viejos desesperados con
el ruido y el mugre de las obras del MIO, un sistema de transporte masi-
vo cuya construccin parece no acabar nunca, es un alivio. Arriendos y
propiedades son mucho ms baratos en La Cumbre que en Cali, donde
las mesadas ya no les alcanzan a los viejos para pagar el mantenimiento
y la administracin de sus apartamentos, adquiridos en mejores pocas.
Los hijos, en quienes haban puesto sus esperanzas para la vejez, se han
dirigido a los nuevos polos de desarrollo del mundo donde viven sus
soledades a su manera, y en vez de enviar ayudas ocasionales, peridi-
camente mandan notas escuetas en las que solicitan dinero para poder
terminar sus tesis de doctorado, o simplemente para costear sus magras
ilusiones de climas fros.
No obstante, viven bien los viejos.
Todo permanece tranquilo hasta cuando llega a buscar refugio all un

epidemilogo recin jubilado de una prestigiosa universidad norteame-
ricana, cuya conversacin gira tercamente alrededor del psimo estado
de salud de los habitantes de La Cumbre.
- Miren - les dice con vehemencia - la tasa de mortalidad de los viejos de la
Cumbre.
- Mucho ms alta que la de Bogot o Estocolmo, grandes metrpolis! Ms alta
aun que la de Cali.
Luego, con gran fanfarronera, les menciona un artculo que seala que
los acadmicos retirados en sitios distintos a los lugares donde traba-
jaban tienen ms riesgo de morir que los que se quedan en sus lugares
de trabajo.
Y esto realmente preocupa a los dems. Saben de la fama de exagerado,

alarmista y del afn de protagonismo del profesor americanizado, pero
igualmente los viejos entran en pnico al acordarse del nmero de cor-
tejos fnebres que han visto pasar durante los ltimos meses camino al
cementerio de La Cumbre.
Algunos ya han decidido regresar a Cali, a pesar de sus inconvenientes,

a un clima y un ambiente que no los mate. Hasta cuando un tmido pro-
fesor de la universidad local que ha subido a comer arepas y fritanga el
fin de semana, les hace ver que la tasa de mortalidad en La Cumbre es
ms alta simplemente porque all hay, en proporcin, ms viejos que en
los otros sitios debido a que no hay suficientes nmeros para comparar.
Al estandarizar las tasas de La Cumbre y las de Cali con las de una

poblacin estndar dada por la OMS, se dan cuenta, aliviados, que si
tuvieran los mismos habitantes de la poblacin del estndar, sus tasas
de mortalidad para los viejos de La Cumbre no son ms altas que las
de Cali. Despus de desempacar maletas, todos reunidos en asamblea,
deciden hacerle una estatua en el parque principal al profesor Estrato y
declarar persona no grata al epidemilogo retirado, que no saba cmo
controlar los factores de confusin.
El ejemplo del profesor Estrato nos muestra que el nivel acadmico

elevado no era el factor precipitante de las muertes de La Cumbre, aun-
que as lo hubieran credo los profesores retirados, influenciados por el
pensionado gringo.
Algo similar ocurri tras un estudio en el que se concluy que el orden

de nacimiento era un factor de riesgo de ciertas anomalas congnitas,
y los nios nacidos de primeros o de cuartos o de quintos tenan ms
riesgo de dichas anomalas que los nacidos de segundos, terceros o
cuartos. Haban confundido la edad de la madre con el orden de los
partos: las muy jvenes o las muy mayores suelen tener ms riesgo de
anomalas congnitas debido a la edad, pero el orden del nacimiento en
s no tiene por qu ser un factor de riesgo para anomalas congnitas.
Para evitar las variables de confusin, estratificamos.
Qu es la estratificacin?
Es la tabulacin cruzada de los datos de exposicin de un factor de
riesgo con un resultado por categoras, de una o ms variables, que po-
dran actuar como factores de confusin. Se hacen estimativos de los
efectos no influenciados por los factores de confusin y los IC de los
datos estratificados.
De dnde resulta la confusin

La confusin resulta de comparar a las personas expuestas con las no
expuestas. Lo cual sucede cuando comparamos al mismo tiempo gru-
pos de personas en quienes el factor de confusin se distribuye de ma-
nera diferente.
Manera como la estratificacin controla los factores de con-

fusin
La estratificacin crea subgrupos dentro de los cuales el factor de con-
fusin no vara o vara muy poco. Tericamente, mediante el uso de
variables de escala nominales, tales como sexo o lugar de origen, la
estratificacin resulta en estratos en los que dichas variables de sexo o
lugar de origen no varan, excepto debido a clasificaciones errneas.
Cuando la clasificacin se hace mediante variables numricas continuas,

por ejemplo edad, resulta en categoras muy distintas que varan dentro
de unos rangos restringidos. Con variables como edad, mientras ms
subgrupos (estratos) se construyan, menos variabilidad habr entre las
edades encontradas en los miembros de cada subgrupo (categoras).
Un anlisis estratificado puede ser tan simple como cuando se presen-

tan los datos correspondientes a cada estrato seleccionado; sin embar-
go, usualmente lo que se busca es hacer un resumen fcil de entender
que muestre la relacin existente entre el factor de exposicin y la en-
fermedad. Esto se hace mediante comparaciones que se llevan a cabo
solo dentro de cada estrato particular y luego s mediante la agregacin

de la informacin.
Es decir, primero se analizan los datos dentro de cada estrato por sepa-
rado y luego se juntan.
Miremos un ejemplo y para ello sigamos con la diabetes: el anlisis

crudo (sin estratificar) de la asociacin entre diabetes e incidencia de
accidente cerebro vascular (ACV) muestra que la diabetes est asociada
con 3.38 veces ms riesgo de un primer episodio de ACV que la ausen-
cia de diabetes en la poblacin de estudio.
ACV + ACV - Total

Diabetes
15 95 110
+
Diabetes 182 4341 4523
-
RR=3.38
Sin embargo, sabemos que las personas diabticas son muy diferentes
de las personas no diabticas de muchas maneras; por ejemplo, se sabe
que existen desigualdades sociales en la prevalencia de diabetes, es decir
que las personas con bajos niveles de educacin tienen mayores niveles
de prevalencia de diabetes que las personas con alto nivel educativo. La
educacin, adems, es un determinante importante de la incidencia de
ACV, en otras palabras, que independientemente de su relacin con la
diabetes, las personas de ms baja escolaridad tienen mayor riesgo de
ACV. Sus mecanismos son mltiples y podran incluir las pocas oportu-
nidades que tienen para hacer ejercicio, el mayor estrs social y la mala
calidad de la dieta. Nuestra figura conceptual sera la siguiente:
Dibetes ACV
Educacin
Lo cual significa que la educacin puede ser un factor de confusin en

la relacin entre diabetes y ACV. La pregunta que nos hacemos es si es
posible que la asociacin entre diabetes y ACV se deba a que las perso-
nas con diabetes tienen menor nivel educativo. Miremos qu pasa con
la asociacin entre diabetes y ACV en cada estrato de nivel educativo.
Menos de 12 aos de educacin
ACV + ACV - Total

Diabetes
11 51 62
+
Diabetes 107 1329 1436
-
RR=2.38
12 aos de educacin
ACV + ACV - Total

Diabetes
3 35 38
+
Diabetes 54 1972 2026
-
RR=2.96
Ms de 12 aos de educacin
ACV + ACV - Total

Diabetes
1 9 10
+
Diabetes 21 1040 1061
-
RR=5.05
Primero observe que hay ms diabticos en el estrato con menos de

12 aos de educacin, lo cual apoya lo que le acabamos de contar; se-
gundo, observe que el RR en cada estrato es menor que el RR de 3.38,
excepto en el estrato superior (>12 aos). Este ltimo dato es muy sos-
pechoso porque solo tenemos un caso de ACV entre los diabticos. Pa-
recera entonces que la asociacin de diabetes y ACV no es tan elevada
como se piensa y que podra ser aun menor considerando que en cada
estrato de nivel educativo bajo y medio, el RR es menor. Para poder
saber cul sera el efecto de la diabetes sobre el ACV que no se explica
por el nivel educativo, generamos una medida resumen que se llama el
RR de MantelHaenzel, que es la medida resumen de la asociacin
ajustada para el factor de confusin. El RR de MantelHaenzel nos da
2.87. El nivel de educacin es un factor de confusin en la asociacin
entre diabetes y ACV; cuando se ajusta para la educacin el efecto de la
diabetes en el ACV, el valor es menor pero an muy importante.
Estandarizacin de tasas
Qu es
Es la obtencin de una medida o un ndice que toma en cuenta las dife-

rencias en la distribucin de un fenmeno segn diferencias de grupos
de edad o de ocupacin, o de cualquier forma en que est dividido el
grupo.
El caso ms usado es la estandarizacin o ajuste por grupos de edad.
Hay dos maneras de hacer esta estandarizacin:
Mtodo directo de estandarizacin de tasas, y
Mtodo indirecto.
Mtodo directo
Da como resultado la Tasa de Mortalidad/Incidencia Estandarizada
por edad (TEM) o en ingls (SDR).
En este caso se requieren dos fuentes de informacin:
a) Las tasas de mortalidad/incidencia especfica para cada grupo de

edad de la poblacin bajo anlisis.
b) Una poblacin estndar definida con una estructura de edad

conocida en la cual se sabe cuntas personas pertenecen a cada
grupo.
Mediante este mtodo se relacionan y ajustan las tasas observadas

(mortalidad, morbilidad, etc.) en la poblacin de nuestro estudio con la
estructura de edad conocida en la poblacin modelo estndar.
Cmo lo hace
Ajustndolas, es decir, dndole un peso a las tasas de mortalidad de

cada grupo de edad del grupo, se estudia segn las tasas conocidas de
la poblacin estndar (ideal) (modelo).
En otras palabras, pone a funcionar la poblacin o las poblaciones de

las que tenemos las tasas como si tuvieran un nmero de habitantes de
una poblacin modelo.
Mire el siguiente ejemplo:
Se tienen la incidencia de enfermedad coronaria de tres grupos pobla-

cionales, unos que tienen baja educacin (menos de 12 aos de estu-
dio), otros que tienen educacin media (12 aos) y otros ms de alta
educacin (> de 12 aos). Estos tres grupos difieren en su distribucin
de edad, las personas mayores tiene en general menor escolaridad que
los ms jvenes. Para poder comparar la incidencia entre estos tres gru-
pos es necesario que la distribucin de edad sea similar.
Vamos a suponer que las tasas de mortalidad son las siguientes:
Incidencia en el grupo Incidencia en el grupo Incidencia en el grupo

de < 12 aos de 12 aos de > 12 aos
de escolaridad de escolaridad de escolaridad
2529 0.04603 0.01812 0.01606
3034 0.06985 0.04110 0.02286
3539 0.12579 0.06574 0.05316
4044 0.15517 0.12048 0.12587
4549 0.22581 0.15864 0.17241
5054 0.29234 0.20563 0.22000
5559 0.38173 0.30037 0.25926
6064 0.44499 0.32065 0.36585
Todas las edades 0.24 0.12 0.10
Miremos ahora la distribucin por edad de la poblacin estndar, en este caso la

distribucin por edad de la poblacin de Estados Unidos en el 2000.
2529 13 923 673

3034 11 838 807
3539 11 049 014
4044 11 822 170
4549 12 127 299
5054 11 368 170
5559 10 176 130
6064 8 838 352
Pasos a seguir:
Paso 1. Se calcula el nmero de muertes o de casos esperados si cada

grupo tuviera la misma estructura de poblacin que tiene la poblacin
estndar (veamos algunos de estos clculos).
Escolaridad Baja Escolaridad Media
Edad Casos esperados Edad Casos esperados
2529 0.04603 * 13 923 673 2529 0.01812* 13 923 673
3034 0.06985 * 11 838 807 3034 0.04110* 11 838 807
3539 0.12579 *11 049 014 3539 0.06574* 11 049 014
La tabla de nmero de casos esperados lucir as:

2529 640838.5 252323.6 223673.5
3034 826975.5 486526.3 270601.3
3539 1389813 726329.6 587323
4044 1834475 1424358 1488105
4549 2738422 1923877 2090914
5054 3323409 2337680 2500997
5559 3884565 3056567 2638256
6064 3932959 2834037 3233543
Todas las edades 18571457 13041698 13033413
Paso 2. Se divide el nmero de casos esperados en un ao por el nmero

total de personasao en riesgo en la poblacin estndar.
Tasa ajustada
Incidencia ajustada = 18571457 / = 13041698 / = 13033413 /
91143615 91143615 91143615
= 0.20 = 0.14 = 0.14
Mtodo indirecto de estandarizacin

Da como resultado una Razn de mortalidad ajustada.
Este mtodo - lo contrario del mtodo directo - se usa cuando en la

poblacin estudiada no hay informacin sobre las tasas de mortalidad
especficas para la edad. Dicho mtodo le aplica entonces a la estructura
de edad de la poblacin estudiada las tasas especficas de una poblacin
estndar. Lo cual nos permite calcular la llamada Razn de Mortalidad
Estandarizada (RME), en ingls (SMR); en otros trminos, la razn x
100 de las muertes observadas contra las que uno podra esperar en la
poblacin estudiada si estuviera conformada de manera igual a la po-
blacin de referencia.
Manera de calcularlas
Deseo comparar la mortalidad de una regin con la de todo el pas, o la
de un municipio con la de todo el departamento.
Las muertes esperadas se calculan mediante la aplicacin de las tasas

de mortalidad especficas para la edad de todo el pas, a la poblacin o
poblaciones locales divididas segn las bandas (categoras) de edad, y
luego sumndole a las muertes esperadas en cada banda grupo de edad,
se obtiene el total para la poblacin.
Deseo calcular la mortalidad de la poblacin general con la mortalidad

de un grupo de trabajadores de quienes sospecho podran tener un
riesgo mayor que la poblacin general.
Las muertes esperadas se calculan mediante la aplicacin de las tasas

de mortalidad especficas para la edad de la poblacin general, a la po-
blacin ocupacional segn las categoras de edad, y luego sumndole a
las muertes esperadas en cada banda grupo de edad se obtiene el total
de muertes esperadas para ese grupo ocupacional en relacin con la
poblacin general.
Un ejemplo que usan muchos epidemilogos en sus clases es el siguien-

te:
Se quiere saber si los mineros tienen un mayor riesgo de tuberculosis

que la poblacin general. Los datos que se tienen son el nmero de
casos de tuberculosis en el grupo de mineros, el nmero de mineros en
cada grupo de edad, y la tasa de mortalidad en la poblacin general.
Pasos que se deben seguir:

Paso 1. Se calcula el nmero de muertes esperadas si la poblacin de
mineros tuviera la misma mortalidad de la poblacin general:
Ver tabla en la siguiente pgina

Poblacin estimada Mortalidad Muertes Muertes

Edad de mineros por tuberculosis de la esperadas observadas
poblacin general/
1 00 000
2024 74 598 12.26 = 12.26 * 74.598 10
= 9.14
2529 85 077 16.12 = 16.12 * 85.077 20
= 13.71
3034 80 845 21.54 17.41 22
3544 148 870 33.96 50.55 98
4554 102 649 56.82 58.32 174
5559 42 494 75.23 31.96 112
Total 181.09 436
Paso 2. Se divide el nmero de muertes observadas por el nmero de

muertes esperadas:
SMR= (436/181.09) = 2.41
Lo cual quiere decir que los mineros mueren dos y media ms veces de
tuberculosis que la poblacin general.
Para finalizar este captulo, recuerde que la estandarizacin es otro m-

todo de ajuste para hacer grupos comparables, como la estratificacin.
Cuando las poblaciones son pequeas y las tasas de mortalidad no son
muy fiables, se prefiere el mtodo indirecto.
15. Poblaciones y Muestras.

Parmetros. Estimadores Y Estimativos
Estimativo puntual. Valor de p y los intervalos de confianza
(IC) alrededor de los estimativos puntuales y de los valores
de P. Curva de funciones de valores de p.
Introduccin al manejo de los errores no sistemticos

En un captulo anterior vimos que existen:
a) Errores que se repiten, o sea errores sistemticos resultantes de ses-

gos y factores de confusin, y
b) Errores no sistemticos, como se les llama a los errores producto del

azar.
Las dos principales funciones de la estadstica en el anlisis de los datos

epidemiolgicos son:
a) Examinar la variabilidad de los datos con el fin de distinguir los ha-

llazgos debidos al azar, de aquellos que se podran repetir si el
trabajo se hiciera de nuevo, es decir, los sesgos.
b) Hacer un estimativo (una estimacin) de cules son los efectos rema-

nentes despus de tomar las acciones necesarias para eliminar los
sesgos y los factores de confusin.
En otros captulos vemos cmo se hace para controlar los factores de

confusin a travs de la estratificacin. En ellos mencionamos aspectos
muy bsicos sobre cmo y cundo usar algunos modelos de regresin
en el anlisis epidemiolgico.
En este captulo nos concentraremos en el examen de la variabilidad

de los datos y en la comprensin de las p y los intervalos de confianza
(IC).
Antes de seguir, aclaremos que cuando hablamos de estimativos (esti-

maciones) nos referimos a datos, y cuando hablamos de estimadores
nos referimos a funciones; tambin aclaremos ahora (lo haremos mu-
chas veces) que cuando hablamos de estadsticos nos referimos a mues-
tras y cuando hablamos de parmetros, nos referimos a poblaciones.
Estimativo Puntual
Los estudios epidemiolgicos son ejercicios de medicin mediante los
cuales obtenemos estimativos (datos). En estadstica el clculo del estima-
tivo puntual conlleva el uso de los datos de una muestra para obtener
un valor nico - conocido como estadstico - que nos servir como la
mejor adivinanza posible de un parmetro de la poblacin.
Intervalos de Confianza (IC)

Los Intervalos de Confianza (IC) se usan, ya sea a posteriori, ya sea a
priori, cuando son ms tiles para indicar el nivel de precisin de un
estimativo.
Qu es un Intervalo de Confianza.
Un Intervalo de Confianza (IC) es un rango de valores que indica el
grado de precisin estadstica del estimativo. Los estadsticos usan di-
cho intervalo de confianza para describir numricamente la falta de
certeza asociada con el estimativo muestral que nos interesa.
Expresado de otra manera, se trata de un intervalo de valores compu-

tado que contiene el verdadero valor del parmetro de la poblacin. El
grado de confianza se expresa, por lo general, como un porcentaje, del
cual el ms usado es el 95%. Por eso uno escribe 95% CI (Confidence
Interval, en ingls) o IC del 95%.
Para calcular los IC es suficiente con que tengamos una frmula expl-
cita o una tabla para la distribucin del estimador.
Qu se requiere para calcularlo?

Para calcular un IC se requieren tres valores: un nivel de confianza, un
estadstico (no nos referimos aqu a un profesional) y un margen de
error.
Un nivel de confianza, tambin llamado grado de confianza, es

el 95% mencionado arriba. Aunque se podra escoger otro va-
lor segn lo que nos interese, siempre y cuando no sea cercano a
50% (equivaldra a echar una moneda a cara y sello). Un nivel de
confianza de 80% indicara que si un grupo de datos y su anlisis
se pudieran replicar muchas veces, 80% de ellos incluiran el valor
calculado.
Un estadstico, es decir un estimador (una funcin) que nos per-

mite calcular de una muestra, un estimativo del valor de un par-
metro.
Un margen de error, que expresa la diferencia mxima esperada

entre el verdadero parmetro de la poblacin y una muestra es-
timativa de dicho parmetro. Si consideramos que el margen de
error es usualmente 100 menos el nivel de confianza, muchos con-

sideran que este margen de error es superfluo.
Cmo se interpreta un IC?

Un IC amplio nos indica baja precisin; un IC estrecho, alta precisin.
Sin embargo, en el mejor de los casos los Intervalos de Confianza son

una gua general del error admisible de una serie de datos; es decir, es
el (alfa) que estamos dispuestos a fijarle de antemano a una serie de
datos.
Mire el siguiente ejemplo:
Tres personas diferentes lo invitan a almorzar:
- Un cachaco, uno de los bogotanos de antes, le dira: Ala chino,

djate ver la semana entrante para que almorcemos.
- Un paisa, como se les dice en Colombia a los antioqueos, le dira:

Venite (sic) pues a mi casa a almorzar el viernes de la prxima
semana.
- Un ingls le dira: Almorzamos en el pub The Gunners, en Have-

lock Street, el jueves prximo a las 13.00h. Te espero en la Esta-
cin Central de Glasgow en la Plataforma 12, donde llega el tren
que viene de Londres, Euston, a las 12.50h.
Entienda que esto es algo ilusorio ya que aunque los ingleses an valo-
ran la puntualidad, los trenes en el Reino Unido pueden ser tan incum-
plidos como los buses en Colombia.
Si viniera en un avin desde el frica, otro ingls le dira: Estar en

Heathrow entre las 12 y la 1 de la tarde. Dame alrededor de media hora
ms para reclamar las maletas y pasar por inmigracin y aduanas. Con
ello el ingls le est haciendo una concesin a la realidad. No puede
garantizar tanta puntualidad como quisiera. Para no quedar mal, ampla
un poco el intervalo de confianza.
En ciertas circunstancias se requiere ms confiabilidad que para otras y

por lo tanto se exigen intervalos de confianza ms estrechos. Cuando
hay grandes intereses econmicos de por medio y muchas personas
esperando un evento, nadie puede darse el lujo de usar intervalos de
confianza amplios.
En la transmisin del mundial de ftbol, en que tantos telespectadores

estn pendientes y se perderan millones de dlares en caso de tener
que aplazar una transmisin, todo est programado para que los parti-
dos empiecen a una hora exacta. Todos los relojes estn coordinados:
los del rbitro, los del productor de televisin, los de los satlites; los
himnos y las ceremonias se acortan para ajustarse a intervalos de con-
fianza muy estrechos.
Los Intervalos de Confianza (IC) se pueden calcular para

estimativos puntuales y valores de p
Aunque quisiramos, no siempre es posible garantizar un margen de
confiabilidad tan estrecho. Para calcular qu intervalos son aceptables
existen algunas reglas. Todava les oye uno decir a algunas personas que
si los intervalos de confianza pasan por un punto arbitrario llamado
1 para los RR, y 0 (cero) para el rango de valores entre - infinito y +
infinito, esos intervalos de confianza invalidan un estudio. Si los inter-
valos de confianza estuvieran entre 0.9 y 1.4 (IC 0.91.4) diran que los
resultados del estudio no son significativos. Tal vez le daran ms valor
a unos IC 2.384.5 o a unos IC -0.15 y -21.45. Hacen con los IC lo
mismo que haran con un valor arbitrario de p para decidir si un valor
es significativo o no lo es. Estn en lo cierto? Quin pone las reglas?
Cundo es posible violarlas sin que el contrato pierda validez?
Ms que de puntos de corte fijos, las p y tambin los IC son valores

que, segn la tendencia actual, es mejor expresar como tales, sin com-
pararlos con una cifra y menos decidir si pueden ser aceptados o no,
segn sean mayores o menores, en vez de juzgar todos los datos dentro
de un contexto global.
Necesitamos los IC para que quepa el mundo tal como es. En la esta-
dstica, al ser el estimativo un valor nico, necesitamos los IC porque
un valor nico tomado de manera aislada no logra expresar la varia-
cin estadstica o el error debido al azar subyacente en este estimativo.
Cuando los estudios son grandes, el proceso de estimacin es relativa-
mente preciso y habr poco error debido al azar. Si el estudio es peque-
o tiene menos precisin y el estimativo, por ende, est sujeto a ms
error debido al azar.
El IC indica cul es la cantidad de error en un estimativo, dado que

usted est dispuesto a dejarlo al azar. Los niveles de confianza, ya lo di-
jimos, suelen ser del 90% o 95%. Aunque usted puede decidir, como
ya lo expresamos, cul es el nivel de confianza entre 0 y 100 que debe
aceptar para su intervalo. Si el nivel de confianza que se escoge es del
80%, eso significa que si: a) la recoleccin de los datos y b) el anlisis de
los datos se pudieran replicar muchas veces, en el 80% de ellos incluira
el valor correcto.
Implicaciones
Eso quiere decir que lo nico que cambiaran estas repeticiones hipo-
tticas del estudio, seran los elementos estadsticos debidos al azar,
tambin implica que las variaciones posibles de los datos se pueden
describir de manera adecuada por el modelo estadstico, y que no hay
sesgos. Ese es un mundo ideal que no existe ni en el estudio ms cuida-
dosamente diseado y ejecutado. Esa definicin de los IC, en especial
en los estudios no experimentales, pertenece al mundo de la ficcin,
que en el mejor de los casos nos proporciona un estimativo burdo de la
variabilidad estadstica de un conjunto de datos.
Moraleja: el IC es una gua general sobre la cantidad de error de una

serie de datos.
Cmo se calculan los IC

Los IC se calculan con las mismas ecuaciones que los valores de p.
Significativo o no significativo?
(To p or not to p?) (Importa la p?)
En el aprendizaje de la epidemiologa nada ha causado tanta confusin

como la interpretacin de los valores de p y los IC. En ambos casos es-
tas herramientas que expresan valores matemticos se convirtieron en
herramientas cualitativas que obligan a tomar decisiones dicotmicas al
llamar a un resultado como significativo o no significativo. Con lo cual
bendicen o descalifican un resultado sin considerar todo el contexto.
En los siguientes prrafos intentaremos ayudarlo a encontrarle un lugar
ms coherente al uso de la p y los Intervalos de Confianza. Para ello
nos valdremos de un concepto grfico y dinmico, la curva llamada
Funcin del Valor de p.
Despus, con la ayuda de Carlos Vasco, nos adentraremos en un anlisis

integrado del significado de 1-alfa con su complemento alfa, y de 1-beta
con su complemento beta, todos ellos pertenecientes al momento del
diseo (el antes); luego, en los conceptos de 1-p con su complemento p,
y 1-q con su complemento q, todos estos pertenecientes al momento
de la interpretacin de los resultados (el despus).
Con seguridad usted ha visto en los congresos de medicina y en algu-

nas publicaciones de poco rigor, cmo los mdicos interpretamos las p
menores de 0.05 como un valor mgico que valida nuestros resultados;
es decir, habr visto usar la p para determinar si una prueba es estadsti-
camente significativa o no lo es, y con ello dar por vlida o no las hip-
tesis que se desea probar, o bendecir las asociaciones que dan sus datos.
Es el resultado de la tendencia humana a confinar las experiencias den-
tro de una dicotoma que hace ver todo en blanco y negro. El trmino
significativo, aplicado a un valor de p, solo quiere decir que el valor
calculado de p es menor que un valor arbitrariamente determinado. En
la epidemiologa, este valor arbitrario para bendecir o condenar suele
ser p < 0.05 o 5%, porcentaje de azar aceptable en ella, pero que sera
por completo inaceptable en farmacologa y mucho menos en fsica
de los cohetes. Ya imaginar qu resultara si se aceptara un valor de p
simplemente por ser menor de 0.05 en el lanzamiento de un cohete con
destino a Marte, o si lo quiere ms cerca, a la Luna.
Origen de las dificultades

Una cosa es el proceso de anlisis que se hace antes de obtener los re-
sultados, y otra son los clculos que hace el estadstico (el profesional)
despus de obtenerlos.
La prueba de la hiptesis se ha usado para describir el proceso por el

cual se decide si se rechaza o no una hiptesis, por lo general llamada
hiptesis nula; dicho proceso se desarrolla en el momento del diseo
del estudio.
La hiptesis nula expresa lo contrario de lo que uno quiere poner a

prueba. En un estudio sobre la asociacin entre el cigarrillo y el cncer
de pulmn, la hiptesis nula expresara que el consumo de cigarrillo no
tiene asociacin estadstica con el cncer del pulmn.
Origen de las dificultades
Aqu est el meollo del problema:
Por un lado, confundir las decisiones que se toman a posteriori sobre

los clculos hechos con el estadstico (las p), con los razonamientos
que se hacen durante la fase de diseo del estudio (antes de recoger los
datos); es decir, confundir p con .
Para algunos expertos, la aceptacin del uso rgido de un valor arbi-

trario de p para decidir si una prueba es significativa o no, sin incluir
otros elementos en el anlisis, significara estar tomando una decisin
cualitativa y no cuantitativa. Por ello, el concepto de p > 0.05 o de
cualquier valor arbitrario para decir categricamente si un hallazgo es

significativo o no lo es, causa tanto escozor, al punto de que algunos le
quitan todo valor a las p expresadas como menores de (p<) y sugieren,
a cambio, expresarlas como igualdades. Para los epidemilogos moder-
nos, decir que una p es significativa ofrece menos informacin que el
valor de p expresado como una cifra, p = 0.00045.
Por supuesto, siempre y cuando las p vayan acompaadas de sus res-

pectivos IC.
En tercer lugar, est el razonamiento alrededor de las hiptesis: que una

hiptesis no pueda ser rechazada es diferente a que sea verdadera, y que
no pueda ser aceptada es diferente a que sea falsa.
Tal vez la mejor manera de aclarar un poco ms lo anterior es trayendo

a colacin todos los elementos participantes. Esta fue una contribucin
recibida de Carlos Eduardo Vasco.
Poder y Confianza
Para explicar estos difciles temas de la estadstica de inferencias, he en-
contrado que es mejor distinguir dos momentos: el del diseo (a priori
o antes de la observacin), y el clculo del estadstico con los valores
encontrados en la muestra (a posteriori o despus de la observacin).
Tambin he encontrado que la gente entiende ms fcil lo positivo, lo

grande, y por eso empiezo por la confianza a priori y el poder a priori, que
son grandes y positivas, mientras ms grandes, mejor. Luego saco los
complementos, que para la confianza es la significancia, y para el poder
lo que yo llamo la finura , ambas a priori, mientras ms peque-
as, mejor. Estas ltimas, las pequeas, van en griego, y , alfa para
la significancia y beta para la finura, es necesario fijarlas desde antes y
establecer con ellas los intervalos de confianza o de poder.
Despus de la observacin y el clculo del estadstico con los valo-

res encontrados en la muestra, y la comparacin con los intervalos de
confianza o de poder, resultan la confianza a posteriori y el poder
a posteriori, que ojal sean grandes, y mientras ms grandes mejor.
Luego salen los complementos, que son la significacin a posteriori
y la finura a posteriori, que ojal resulten pequeos, y mientras ms
pequeos, mejor. Estos ltimos, los pequeos, van en espaol p y q.
Pero estos no se pueden fijar desde antes, a priori, sino que hay que
calcularlos despus de la observacin, a posteriori.
La confianza a priori es lo complementario de la significancia a prio-

ri, alfa: mientras ms significativo es el test, ms pequeo es el nivel de
significancia alfa y mayor la confianza a priori, que es 1-.
El alfa del 0.05 en fracciones entre cero y uno, y 100 veces ese valor
cuando se quiere expresar como porcentaje, la explico diciendo que se
piense en una serie larga de pruebas positivas sobre la misma poblacin
y con el mismo diseo, por ejemplo cien pruebas en las cuales las di-
ferencias fueron lo suficientemente grandes para que se concluya que
hay que rechazar la hiptesis nula: la posibilidad de equivocarse recha-

zndola, aunque sea verdad que no hay diferencias, es solo del 5%, o
sea que se equivoca uno en cinco de esas cien pruebas positivas, o en
una de veinte; dicho de otra manera, acierta en 95 de ellas, o sea que la
confianza a priori es del 95%. El alfa es la probabilidad a priori de
un falso positivo entre todos los exmenes del mismo diseo que dan
positivos.
La significancia a posteriori p, que se puede expresar ms con des-

igualdades que con igualdades, como p < 0.01, p <0.005, p <0.001,
indica que aunque se hubiera fijado a priori el alfa en 0.01, o en 0.05,
o aun en 0.001, tambin habra salido rechazada la hiptesis nula. La
confianza a posteriori 1-p es lo complementario a la significancia a
posteriori p. Pero mientras alfa y beta son probabilidades, p no es una
probabilidad de equivocarse ni 1-p es una probabilidad de acertar, pues
ya se hizo el clculo sobre una muestra dada y ya se tom una decisin;
la p ya es un resultado de la prueba, mientras que el alfa es una medida
de la bondad del diseo cuando la hiptesis alterna o hiptesis de tra-
bajo es que s hay diferencias, pero uno se cuida de no dejarse llevar por
el deseo de encontrarlas aunque no las haya.
El poder a priori es lo complementario de la finura a priori beta

(); mientras ms fino es el test, ms pequea es la beta y mayor el po-
der, que es 1-. De nuevo en fracciones entre cero y uno, y 100 veces
ese valor si se prefieren los porcentajes.
Explico la beta del 0.05 diciendo que en una serie larga de pruebas ne-
gativas sobre la misma poblacin y con el mismo diseo, por ejemplo
cien pruebas en las cuales las diferencias fueron tan pequeas que se
concluya que hay que seguir aceptando la hiptesis nula, la probabilidad
de equivocarse aceptndola aunque sea verdad que s hay diferencias es
slo del 5%, o sea que se equivoca uno en cinco de las cien pruebas
negativas, es decir en una de veinte; dicho de otra manera, acierta en
95 de ellas, o sea que el poder a priori es del 95%. La beta es la pro-
babilidad a priori de un falso negativo entre todos los exmenes del
mismo diseo que dan negativos.
El cuadro se debera completar con la finura a posteriori q, y el po-

der a posteriori 1-q, que son paralelos a la significancia a posteriori
p y la confianza a posteriori 1-p, que tampoco son probabilidades
sino resultados de un clculo con una muestra dada.
Una pregunta fina y difcil, que indica qu entiende la gente por la p, es

la siguiente:
En el printer o print out del computador, que redondea los resultados

a dos cifras decimales, le sali a usted lo siguiente:
p = 0.00
Explique qu pudo haber pasado. Ser que el diseo del test fue per-
fecto? Ser que hay cero duda, es decir que no hay duda con respecto a
que las diferencias son significativas? Ser que hay 100% de confianza
en rechazar la hiptesis nula?
(Piense un poco antes de mirar mi intento por discutir esta situacin).
Al recordar cmo redondean las cifras decimales los computadores y

las calculadoras, puedo pensar en el caso hipottico en que el clculo
a posteriori de p hubiera dado un valor de p = 0.0006; en ese caso, el
computador hubiera redondeado a la siguiente cifra decimal y hubiera
escrito p = 0.001, que se redondea a p = 0.00. Luego, puedo decir
que P < 0.005.
Dicho de otra forma, aunque yo hubiera exigido a priori una signifi-

cancia alfa del cinco por mil, de todas maneras la diferencia encontrada
fue tan grande, que tambin hubiera podido rechazar la hiptesis nula
con un intervalo de confianza tan exigente contra falsos positivos.
Pero todava me puedo equivocar en cinco de cada mil exmenes po-

sitivos, uno en 200, puede que yo sea muy de malas y ste sea ese uno,
pues p no es una probabilidad sino un resultado numrico de un clcu-
lo con estos valores especficos de esta muestra que ya tom.
No es que el diseo del test fuera perfecto, pues si hubiera puesto alfa
igual a cero para asegurarme contra falsos positivos, quedara prctica-
mente seguro de equivocarme por falsos negativos.
Todava queda duda de que este caso sea ese fatdico uno equivocado
contra los 199 en que, a la larga, yo acierte; nunca tengo el 100% de
confianza, aunque esta vez s puedo decir que tengo el 99.5% de con-
fianza.
Carlos E. Vasco U.
Tabla de resumen sobre el Poder y la Confianza
Antes (a priori). Despus (a posteriori).

Van en letras griegas. En letras latinas
Estos clculos se hacen Estos clculos los hace el estadstico
en el momento del diseo o el computador con los valores
encontrados en la muestra
Complemento de la confianza, Significancia a posteriori:
llamada Significancia: p. Mientras ms pequea mejor. *.
No se puede calcular desde antes
Confianza: 1-. Confianza a posteriori: 1-p.
Mientras ms grande, mejor Mientras ms grande, mejor
Poder: 1-. Poder a posteriori: 1-q.
Mientras ms grande, mejor Mientras ms grande, mejor
Complemento del poder, l Finura a posteriori: q.
lamada Finura:
La de significancia y la de finura * Esta p as interpretada se ha
se deben fijar de antemano. Con prestado a interpretaciones vulgares,
ellas se establecen los intervalos de por eso muchos no le ven ninguna
confianza y de poder funcin y sugieren eliminarla
Qu es una p o un valor de p
La p es solo un estadstico (valor numrico o estimador) usado para po-
ner a prueba una hiptesis. El valor de p indica la probabilidad de
que los hallazgos observados podran haber ocurrido solamente como
resultado del azar. Lo opuesto no es verdad: una diferencia no signifi-
cativa no puede ser atribuida nica y necesariamente al azar.
Funciones del Valor de p (tambin se pueden llamar Fun-

ciones del Intervalo de Confianza)
Para ilustrar de qu manera un estimativo cumple una mejor funcin
para expresar tanto la fortaleza de la relacin como de la precisin, se
usa una curva llamada con frecuencia Funcin del Valor de p, o tambin
Funcin del I de C.
La Funcin del Valor de p ampla el concepto del valor de p. Ya he-

mos dicho que p es un estadstico que se puede ver como una medida
de la compatibilidad existente entre los datos disponibles y la hiptesis
nula.
El valor de p ordinario (a diferencia de las Funciones del Valor de p)

es una medida de la consistencia de los datos y de la hiptesis de que
RR = 1.0; sin embargo, nada nos obliga a hacerle pruebas nicamente
a la hiptesis de que el RR= 1.0. Con cualquier conjunto de datos po-
demos calcular valores de p que midan la compatibilidad de esos datos
y cualquier valor de RR. No slo podramos poner a prueba un valor
particular de RR, sino que de hecho podramos calcular un nmero
infinito de valores de p para poner a prueba cada posible valor de RR.
Si lo hiciramos y graficramos los resultados, terminaramos constru-
yendo la Funcin del Valor de p.
Podemos avanzar un poco ms sobre la Funcin del Valor de p ima-

ginndonos que en vez de poner a prueba solo la hiptesis nula, cal-
cularemos el valor de p tambin para un rango de hiptesis diferentes.
Supongamos que consideramos la medicin de la Razn de Tasas de
Incidencia (RR o Rate Ratio, en ingls), que puede ir de cero a infinito (0
a ) si la hiptesis nula es correcta.
La Funcin del Valor de p es entonces una curva en la cual, en el eje de

las x van los RR, y en el eje de las y van los valores de p.
1
0.8
0.6
Valor de p
0.4
0.2 Valor de p = 0.07
0.1 1 10 100 1000 Valor de RR

Medida de RR en escala algortmica
-1 0 1 2 logaritmos
3 decimales de RR
El modelo de la curva anterior fue modificado de un ejemplo del li-

bro de Keneth J. Rothman. (2002). Epidemiology. An Introduction. Oxford
University Press.
Note bien los elementos que constituyen esta curva con forma de tipi,
como se llama la tienda de los indios norteamericanos:
- En las abscisas, en escala logartmica, pusimos los valores de RR.

Estos valores de RR van de 0 hasta el infinito, pero sus logaritmos
van de - menos infinito a + ms infinito. El cero de la es-
cala logartmica representa el RR = 0, que no ocurre, (su logaritmo
sera - menos infinito, es decir que no lo tiene).
- Mire ahora la lnea marrn que parte verticalmente desde el punto

1 de las abscisas. Esta lnea representa la hiptesis nula, que es
RR=1.0, el valor usual de p que pone a prueba la hiptesis nula.
- En las ordenadas, en escala de razn, pusimos los posibles valores

de p, que van desde 0 hasta un mximo posible de 1, que es el
100%
- Al mirar la curva notamos que aqu la p = 0.07. Este es un punto

clave como p > 0.05, si no hubiramos tenido disponible la fun-
cin del valor de p hubiramos fallado completamente, y no hu-
biera sido posible publicar mucha de la informacin. Redaccin?
- Si hablramos aisladamente de significancia y hubiramos fijado

= 0.05, habramos dicho que la p no era significativa por ser mayor
de > 0.05.
- Arriba, en el punto ms alto de la tienda, hemos colocado un pun-

to rojo para el estimativo de RR. La lnea roja es un artificio para
hacer ver qu valor tiene el estimativo de punto al trazarlo hasta
encontrar el punto en el que cruza las abscisas, en este caso 3.2.
- A medida que el RR se aleja en cualquier de ese punto mximo

llamado Estimativo Puntual, el valor de p declina, indicando con
ello que existe menos compatibilidad entre los datos obtenidos y
estas hiptesis de RR. Redaccin?
Esta curva:
a) Proporciona una visin cuantitativa del conjunto de la relacin

estadstica existente entre la exposicin y el resultado (una enfer-
medad).
b) Da una apreciacin visual del grado de precisin del estimativo,

que se indica por la estrechez o la amplitud de la tienda de campa-
a de los Sioux.
En la curva usada como ejemplo, vemos que el valor de p que result

de este conjunto de datos que se obtuvo para poner a prueba la hipte-
sis de que RR = 1.0, es 0.07.
Su interpretacin, seor lector, hasta ahora:
Basndose en lo que probablemente le han enseado hasta el momen-

to, usted dira que dicho valor de p no es significativo, y que por lo
tanto usted podra concluir que no hay relacin entre la exposicin y la
enfermedad.
Cmo interpretar la Curva de la Funcin de p

En general, una curva de la Funcin de p ms estrecha significa mayor
precisin:
Curva de Funcin de p estrecha Curva de Funcin de p ancha
Por el contrario, una curva de la Funcin de p ms amplia significa

menos precisin.
Ahora, mire superpuestas estas dos curvas que representan dos bases
de datos diferentes:
1
Valor de p 0.5
0.1 1 10 100
Riesgo Relativo
La estrechez de la curva azul clara refleja que el tamao del conjunto

de datos con el cual se construy es ms grande, tamao mayor que se
refleja en mejor precisin. La curva azul oscura, por su lado, sugiere
que los datos son imprecisos. Los datos son compatibles con un amplio
rango de efectos y los riesgos van desde casi cero (0) a ms de 10. Esto
sugerira que la exposicin al factor estudiado sera un gran riesgo. Por
el contrario, en el otro grupo los datos dan un estimativo preciso de un
efecto que es cercano al efecto nulo, estos datos sugieren que el efecto
causado por la exposicin no es fuerte.
Aunque superficialmente pareciera que se trata de una aplicacin so-

fisticada de los mtodos cuantitativos, las pruebas de significancia (p)
son solo proposiciones cualitativas que, al final, no dan ninguna idea
sobre la magnitud del efecto. En contraste, la Funcin del Valor de p, es

decir una curva, nos proporciona una explicacin visual de todos los
datos y nos da un mensaje con dos componentes importantes: a) uno
relacionado con la fuerza del efecto, y b) otro con la precisin, para lo
cual se vale no solo de los valores de p sino de los IC.
Al fin qu?
Cualitativo o cuantitativo. Importa tanto?
O parodiando a Hamlet: To p or not to p?
La discusin anterior es ms una cuestin de epistemologa. Desde la

poca de Popper, en la primera mitad del siglo XX, cuando se interpre-
t como ciencia todo lo que era falsable, es decir todo lo que eventual-
mente pudiera ser cuestionado y declarado como falso si apareca una
mejor explicacin, el modelo de ciencia aceptado por las ciencias natu-
rales y por herencia la medicina, es matemtico y positivista en esencia.
Cualitativo y cuantitativo se usan bsicamente como adjetivos, a veces
ms descalificativos que calificativos. Pero en el fondo, defensores de
unos y otros los usan para validar hiptesis. En el lenguaje de este libro,
la Ciencia es una competencia entre hiptesis, H1, H2, H3; es decir, va-
rias hiptesis compiten entre s. La bioestadstica proporciona el marco
para el mtodo cientfico necesario en este libro. Uso cuantitativo de
la informacin para describir o para sacar inferencias, juicios de valor
matemtico que nos sirven para tomar decisiones.
Curvas de Funcin de p e Intervalos de Confianza

1
Valor de p 0.5
0.2 80%
90%
IC 95%
0.1 1 10 100
Riesgo Relativo
Ya expresamos que la curva denominada Funcin del valor de p pro-

porciona una exhibicin ms visual que simplemente la mencin de un
valor de p.
El mensaje viene en dos partes:

a) una relacionada con la fuerza del efecto, y
b) otra con la precisin.
Como la p es solo un nmero, no puede llevar consigo dos mensajes

cuantitativos separados. Para transmitir el mensaje sobre la fuerza y la
precisin se requieren por lo menos dos nmeros que forman los lmi-
tes del intervalo de confianza.
La curva llamada Funcin del valor de p est estrechamente relaciona-

da con el conjunto de todos los intervalos de confianza de un estima-
tivo dado.
La figura anterior muestra los intervalos de confianza.
Estos IC se diferencian solamente en el nivel arbitrario de confianza que

determina la anchura del intervalo. El intervalo del 95% se puede leer
en la curva a lo largo del eje horizontal trazado, donde la p es igual a
0.05; el IC del 90%, donde la p es igual a 0.1, y el IC del 80%, donde la
p es igual a 0.2.
Los tres intervalos de confianza de la figura muestran el mismo grado

de precisin pero difieren en su anchura solamente en el nivel de con-
fianza arbitrario, en este caso se describen como IC Anidados.
Intervalos de Confianza y Lmites de Confianza

En la curva anterior quedaron en claro los tres valores expresados al
comienzo del captulo para calcular los IC, es decir: un nivel de confian-
za, un estadstico y un margen de error. Resumamos diciendo:
Que el Intervalo de Confianza es un rango de valores que indica el

grado de precisin estadstica que describe el estimativo.
El nivel de confianza es algo que se fija arbitrariamente, pero en cual-

quier nivel de confianza, la anchura del intervalo expresa cul es la
precisin de la medida; as, un intervalo ms amplio indica que hay
menor precisin, y uno ms angosto, como el que se ve en el 95%
de la figura de arriba, demuestra mayor precisin. A los extremos
superior e inferior del intervalo de confianza se les conoce como
lmites inferior o superior de dicho intervalo.
Es necesario usar siempre la curva de la funcin de p o de los IC para

presentar los datos?
Por supuesto que no. Rara vez se hace en los artculos cientficos, pero
su valor grfico es innegable para entender cules son los conceptos
que hay detrs de estos datos.
16. Probabilidades. Muestreo y distribucin

de muestreo. Teorema del lmite central
Probabilidades
Por convencin, en estadstica se llama Probabilidad a un valor com-
prendido en un rango que va de 0 a 1,dicho valor describe la probabili-
dad de que un evento ocurra.
Si la Probabilidad de que un evento A, P (A) es igual a 0, no hay
ninguna probabilidad de que el evento ocurra.
Si P (A) es cercano a 0, hay poca probabilidad de que ocurra.
Si P (A) es cercano a 1, hay bastante probabilidad de que el even
to ocurra.
Si P (A) es igual a 1, el evento ocurrir eventualmente.
Se llama Espacio Muestral a todos los posibles resultados de que un even-

to ocurra.
Punto Muestral es cualquier resultado particular del Espacio Muestral.
Distribuciones
El concepto de probabilidades es inseparable del concepto de distri-
buciones. Las distribuciones de las probabilidades describen, como lo
mencionamos, los valores que toman las probabilidades asociadas con
que un evento ocurra.
Los valores mencionados varan segn se trate de variables discretas o de

variables continuas.
Distribuciones continuas son aquellas en que las variables toman un va-

lor computable dentro de un rango de valores, como ocurrira cuando
se miden peso, talla o presin arterial; en estos casos el valor mismo o
el promedio pueden dar valores intermedios entre los valores enteros
de los resultados, adems tienen valor en s mismos.
Ejemplo de las distribuciones discretas sera el que resulta al soltar al

aire una moneda no cargada. Podra no salir cara o sello durante mu-
chos lanzamientos, pero siempre existir la probabilidad igual de uno o
de otro resultado cada vez que se suelte moneda. Otro ejemplo sera el
resultante de lanzar unos dados no cargados al buscar un par de 6, o de

3. Podran pasar muchos lanzamientos antes de obtener el par deseado,
pero si los dados no estn cargados, eventualmente el resultado desea-
do tendr que salir.
Por ahora, lo que interesa es que recuerde que al estudiar las aplicacio-
nes de las herramientas estadsticas, para hacer inferencias:
En el caso de las distribuciones continuas calculamos estadsticos,

por ejemplo promedios, y la herramienta visual ms usada para
entenderlos es la campana de Gauss, que ser muy til para com-
prender conceptos como los de alfa () y p de significancia.
En el caso de las distribuciones que usan variables discretas, al ha-

cer inferencias hacemos la prueba de la hiptesis y la herramienta
ms usada es el cuadro de cuatro casillas o cualquier tabla de con-
tingencia; sin embargo, para entender completamente el razona-
miento de la prueba de la hiptesis tambin usamos la campana
de Gauss, o dos campanas de Gauss que se entrecruzan. Dicha
representacin visual nos ha ayudado a muchos a entender el sig-
nificado y la manera de calcular y el concepto de poder (1-).
Al hablar de distribuciones, ya sean estas de variables continuas o dis-

cretas, en la mayora de los casos se tratar de la distribucin normal;
pero tanto en un caso como en el otro, hay muchas otras distribucio-
nes.
Distribuciones para las variables discretas

Por ahora basta con que comprenda que dentro de las distribuciones
de variables discretas estn aquellas conocidas como de soporte finito
y las de soporte infinito.
Con soporte finito seran:

La distribucin binomial, ya vista, que describe el nmero de xi-
tos o de fracasos en una serie de experimentos en los cuales la res-
puesta posible es solo s o no. Se trata entonces de la distribucin
en que los resultados son mutuamente excluyentes (dicotmicas
es otro trmino usado) como en el caso de cara y sello, o como
sera en caso de vivos o muertos, o enfermos o sanos.
Distribucin uniforme discreta es aquella en la cual todos los ele-

mentos de un conjunto finito de probabilidades son igualmente
posibles, como sera el caso de los dados o de las cartas de un
casino.
De soporte infinito seran:

La distribucin de las series logartmicas.
La distribucin de Poisson.
La distribucin de Poisson describe un nmero muy grande de eventos

individuales altamente improbables que suceden durante cierto inter-
valo de tiempo.
Aunque en este texto no estudiaremos la distribucin de Poisson, he-

mos credo conveniente que los mdicos y otros profesionales clnicos
y administrativos entiendan de qu se trata porque tiene muchsimas
aplicaciones tanto en vida real como en los eventos mdicos y clni-
cos.
Ejercicio 1
Podra usted dar ejemplos de distribucin de Poisson en la prctica

mdica o en la vida?
Respuestas:
Solo se dan a manera de ejemplo. Las suyas no tienen por qu ser estas
mismas.
Los siguientes eventos tomaran la distribucin de Poisson:
- El nmero y los intervalos de las llamadas telefnicas que entrarn

en su telfono en las prximas 24 horas.
- El nmero de nuevos cnceres de seno que se diagnosticarn en

Cali en cada uno de los meses del siguiente ao.
- Los tiempos transcurridos entre uno y otro caso de leucemia en

una ciudad o en un hospital en un periodo determinado.
- La frecuencia y las fechas en que ocurrirn los prximos temblo-

res de tierra en su regin.
- La distribucin por fechas de los accidentes de automvil en un

lugar dado. Independientemente de la frecuencia, es muy difcil
decidir con alguna certeza cundo se presentar el prximo acci-
dente.
Ejercicio 2
Dibjelos en una grfica sobre una lnea

Distribuciones ms comunes usadas para las variables
continuas
Se pueden basar en un intervalo limitado o en un intervalo semiinfi-
nito, como sera:
La distribucin Chi Cuadrado (2)
La distribucin F
La distribucin logstica
La distribucin Log normal
Pero no son las nicas. Al entrar en el mundo de las estadsticas usted

oir de muchas y no debe aprenderlas a no ser que quiera profundizar
en estos temas, algo que por el contrario s tienen que hacer los estads-
ticos y los epidemilogos.
De ellas, en este libro slo se tratar con algn detalle la distribucin

normal.
Distribucin Muestral
(en ingls se conoce como Sampling Distribution)
A esta distribucin muestral tambin la podramos llamar distribucin de

muestreo o distribucin de las muestras - en plural porque se trata de muchas
muestras - para diferenciarla de la distribucin de una muestra.
La Distribucin Muestral es una distribucin terica
Para entenderla es necesario diferenciarla de otras dos distribuciones

ms fciles de entender porque son concretas:
La distribucin de la poblacin,
La distribucin de una muestra particular tomada, por supuesto,

de una poblacin.
Qu es entonces la distribucin muestral
Suponga que tomamos todas las muestras posibles de tamao n de una

poblacin. Suponga ahora que computamos un estadstico por
ejemplo el promedio, una proporcin o la desviacin estndar de
cada muestra. A este estadstico de la probabilidad de distribucin se le cono-
ce como Distribucin del Muestreo o Distribucin de las Muestras, o mejor an,
Distribucin muestral.
Variabilidad
La variabilidad de la distribucin de las muestras se mide por su varian-
za o por su desviacin estndar.
(Recuerda que la desviacin estndar es la raz cuadrada de la varianza,

y que una y otra representan desviaciones de la tendencia central?)
Dicha variabilidad depende de tres factores:

N (mayscula), es decir, el nmero de observaciones de la pobla
cin,
n (minscula), que equivale al nmero de observaciones de la
muestra.
La forma como se escoge la muestra.
Cuando el tamao de la poblacin es mucho mayor que el tamao de
la muestra, la distribucin de muestreo tiene, grosso modo, el mismo
error muestral, ya sea que se hagan reemplazos a medida que se toman
las muestras o no. Hablamos de reemplazo cuando, por ejemplo, al

sacar los nmeros favorecidos de una rifa, los volvemos a meter dentro
de la bolsa, de manera que la probabilidad de salir ms de una vez es
real, y el tamao de la poblacin de la cual se saca la muestra no dismi-
nuye a medida que se sacan nmeros.
Teorema del Lmite Central

El teorema del lmite central afirma que la distribucin muestral de cual-
quier estadstico es normal o cercana a la normalidad si la muestra pobla-
cional es suficientemente grande.
Dicha condicin muy general del enunciado tiene por objetivo dis-
minuir la probabilidad de que un sumando contribuya excesivamente
al resultado total del estadstico calculado, imprimiendo as una mar-
cadamente influencia en el resultado final, tal como pasara cuando en
una muestra pequea hay un individuo anormalmente alto, o bajo,
o pesado o flaco
Not usted que destacamos en cursivas los trminos muestra pequea y

muestra suficientemente grande?
1. Qu es una muestra pequea?
2. Qu es una muestra suficientemente grande?
Se considera que una muestra es suficientemente grande si cualquiera de las

siguientes condiciones se cumple:
La distribucin de la poblacin es estadsticamente normal.
La distribucin de la muestra es simtrica, unimodal, sin elemen
tos muy alejados de la distribucin (outliers), y la muestra es de 15.
La distribucin de la muestra es ligeramente asimtrica (skewed),
unimodal, sin elementos muy alejados de la distribucin (outliers),
y el tamao de la muestra est entre 16 y 40.
El tamao de la muestra es mayor de 40 y no tiene elementos
muy alejados de la distribucin.
Que se cumplan o no las condiciones arriba mencionadas determinar
si uno usa Z o t en el anlisis. En general, la distribucin t se usa para
muestras pequeas y la Z para muestras de tamao grande.
Muestreo
El muestreo y la aleatorizacin son dos conceptos ntimamente ligados
con el Teorema del Lmite Central, ellos son los pilares sobre los cuales se
ha construido gran parte de la teora estadstica.
Qu es el muestreo
El muestreo es un procedimiento estadstico mediante el cual se

procura seleccionar eficientemente un nmero adecuado de ele-
mentos, llamados muestra, de manera tal que uno pueda aplicarle a la

poblacin de la cual se obtuvo esa muestra, las mismas conclusio-
nes que le aplicara a aquella. Esto se puede hacer porque se consi-
dera que, dentro de unos lmites de confianza previamente estable-
cidos, la muestra es suficientemente representativa de la poblacin.
Glosario de trminos utilizados en el muestreo:
Parmetros: los valores que servirn para describir el universo se

llaman parmetros y se denominan con letras del alfabeto griego,
como , , etc.
Estadsticos: los valores que sirven para describir la muestra se

llaman estadsticos y se denominan con letras del alfabeto lati-
no.
Unidad de Muestreo: es lo mismo que Punto Muestral, en otras

palabras, cada uno de los resultados del Marco Muestral.
Marco Muestral: Es lo mismo que Espacio Muestral, es decir, una

lista de las unidades de muestreo.
Muestra: una coleccin de unidades seleccionadas de un marco o

de varios marcos muestrales.
Las muestras se obtienen de varias maneras, mediante:

Muestreo aleatorio simple o irrestricto.
Muestreo sistemtico.
Muestreo estratificado.
Muestro por conglomerados.
Un ejemplo de muestreo repetido y de aplicacin del Teorema
del Lmite Central
Para entender mejor los conceptos arriba mencionados, imagine el si-

guiente juego con doce participantes y un par de dados no cargados.
Reglas del juego: antes de comenzar a lanzar los dados, cada participante
debe escribir en un papel cuntas veces en promedio cree (l o ella),
tendrn que echar los dados los jugadores antes de obtener un par de
seis.
Ganar quien ms se acerque al promedio matemtico del nmero de

lanzamientos requeridos, no quien ms rpido saque el par.
Desarrollo del juego: todos han escrito en el papel una cifra y los ms atre-
vidos han hecho jugosas apuestas.
Comienza el juego y el primer jugador obtiene el par deseado con el

primer lanzamiento; el segundo lo hace despus de 12 lanzamientos.
Nadie parece sorprendido. Sin embargo, cuando el tercer jugador echa
los dados 195 veces antes de obtener el par deseado, todos, sin ex-
cepcin, se muestran sorprendidos y ms de uno propone recoger las
apuestas y retirarse del juego. Un viejo profesor de estadstica pide

calma y les propone que cada uno lance los dados en cuatro series de
lanzamientos, hasta lograr obtener el par de seis. Cada cual calcular el
promedio de sus muestras.
Resultados: estos fueron los resultados obtenidos, expresados en nme-

ro de lanzamientos hechos antes de lograr los pares de seis deseados:
Series de Jugador
lanzamientos A B C D
Serie # 1 25 72 32 52
Serie # 2 40 52 6 72
Serie # 3 5 3 99 1
Serie # 4 8 7 47 81
Series de Jugador
lanzamientos E F G H
Serie #1 44 50 29 27
Serie #2 11 45 38 46
Serie #3 5 10 71 65
Serie # 4 17 71 7 2
Series de Jugador
lanzamientos I J K L
Serie #1 171 4 63 9
Serie #2 1 54 22 13
Serie #3 151 9 20 10
Serie # 4 3 49 13 16
Los promedios que obtuvo por cada jugador fueron:

Primera generacin de promedios
A = 19.5 B = 33.5 C = 45.5 D = 51.5
E = 19.4 F = 44.0 G = 36.2 H = 35.0
I = 81.5 J = 29.0 K = 29.5 L = 12.0
Dichos promedios son muy distintos entre s, aunque las diferencias

no sean tan exageradas como cuando cada quien lanz los dados las
primeras veces.
Entonces, el profesor les propone hacer dos series de clculos diferen-

tes:
a) Por una parte, les pide tomar las tres hileras de la primera gene-
racin de promedios y obtener en cada hilera el promedio de los
promedios, es decir, una segunda generacin de promedios.
b) Por otra parte, les pide calcular el promedio matemtico real de

todos los resultados de todas las series de lanzamientos originales,
y luego los invita a comparar esos resultados.
Segunda generacin de promedios

19.5+35.5+45.5+51.5 150
Hilera 1 = = = 37.5
4 4
19.4+44.0+36.2+35.0 134.6
Hilera 2 = = = 33.5
4 4
81.5+29.0+29.5+12 152
Hilera 3 = = = 38
4 4
Los resultados logrados se parecen mucho ms entre s, y se parecern

ms si hacemos una generacin ms de promedios, tomando los de la
segunda generacin.
Tercera generacin de promedios:

37.5+ 33.5 + 38
= 108/3 = 36
3
Admirado, usted comienza a sacar conclusiones. La ms llamativa de

ella es la siguiente:
No importa qu tan pequea sea la muestra ni qu tanto difieran entre

s los resultados; si la distribucin es normal, al hacer una segunda genera-
cin de promedios, el promedio de estos promedios se acerca al pro-
medio real. Es decir:
Al mezclar los promedios ya obtenidos como si fueran elementos de

una nueva muestra,
Nuevo muestreo Muestreo repetido

XA 1A
XB 1B
XC 1C
XD 1D
se obtiene un nuevo promedio de los promedios (segunda generacin
de promedios); ese nuevo promedio se parece al promedio de la pobla-
cin.
1A + 1B + 1C + 1D + 1 n dividido entre n = a aproximadamente

.
Corolario
Por dispares que parezcan los resultados y las muestras, con frecuencia
es posible hacerles correcciones y ajustes a los datos mediante proce-
dimientos estadsticos. La base de toda esta teora y sus aplicaciones
prcticas es el Teorema del Lmite Central, o de las distribuciones normales. La

riqueza matemtica, as como la ductilidad de la distribucin normal,
son inagotables y la convierten en el pilar sobre el cual se apoyan las
teoras de la probabilidad y las teoras estadsticas.
Aleatorizacin
Cualquiera que sea la manera de obtener una muestra y organizar los
datos, existe en todos nosotros una tendencia muy humana a caer en
sesgos. (Ver captulo sobre los enemigos de la validez interna de los
estudios epidemiolgicos).
Ya sea porque uno no ordena los datos, porque los ordena demasiado
o porque tiende a escoger a los primeros de la lista, a los ltimos o a
los ms altos, etc., si no se toman las precauciones necesarias, terminar
aplicndole a una poblacin unas conclusiones errneas.
Aleatorizacin es el procedimiento mediante el cual el investigador

procura que cada elemento de la poblacin tenga una probabilidad co-
nocida de ser escogido como elemento de la muestra, y esa posibilidad
es distinta a cero (0).
Hay muchas maneras de aleatorizar y la ms comn de hacerlo en estu-

dios epidemiolgicos formales es mediante el uso de una tabla de n-
meros aleatorios previamente diseada; tambin, en el uso de las tablas
se podra caer en sesgos innecesarios. Hoy en da todos los programas
estadsticos conocidos tienen una forma de aleatorizar. Para evitar los
sesgos antes de entrar en la tabla previamente hecha, es necesario es-
tablecer las reglas del juego y respetarlas todo el tiempo mientras se
escoge la muestra.
A propsito de la palabra aleatorizacin, su origen es latino:
Alea significa dado, suerte, azar.
Recuerde la frase clsica de Julio Cesar:
Alea jacta est (la suerte est echada).
Aleator: jugador, tahr.
Aleatorium: garito, casa de juego. No son muy santos los orgenes,

como puede ver.
Ejemplo de la influencia de datos sobre promedios
El siguiente ejemplo se tom de la vida real, se trata de las listas de

los estudiantes inscritos en 1996 al posgrado en epidemiologa de la
Universidad del Valle, de los estudiantes de Salud Pblica de la misma
universidad en el mismo ao, y de los estudiantes de las dos especiali-
dades juntos.
Primera lista: Estudiantes de Epidemiologa solamente
Nmero Sexo Edad Peso en kg Talla en cm Practica algn deporte:

(aos) S o No
1 Masculino 40 70 165 S
2 Femenino 28 60 155 S
4 Femenino 30 52 168 No
6 Masculino 34 120 186 No
Qu le llama la atencin de la tabla?
Uno de los estudiantes de la maestra, el nmero 6, ya muerto, era en

1996 un joven mdico con vocacin acadmica definida, quien a los 34
aos de edad haba abandonado casi por completo todo ejercicio prc-
tico de la Medicina Interna, su especialidad, para dedicarse a estudiar el
virus de la Para paresia Espstica del Pacfico, campo en el cual logr cierto
reconocimiento internacional y un buen nmero de publicaciones. De
ah su inters muy prctico por la epidemiologa (Zaninovic V., Galindo
J., Blank A. (1992). Enfermedades asociadas con el virus HTLV1,
XYZ Impresores, Cali (Colombia).
Como ven ustedes, el peso en kilogramos de este alumno era alto al

compararlo con el promedio de peso de los estudiantes de la maestra
de epidemiologa y con los pesos de algunos de ellos, en especial con el
peso que por entonces tena una de las coautoras de este libro.
Se trataba de una poblacin relativamente pequea, de solo nueve per-

sonas.
Asociacin til para el aprendizaje
En la poca en que se recogieron los datos de esta tabla, estbamos

en pleno desarrollo de los Juegos Olmpicos. A alguien que acababa
de ver en la televisin cmo asignaban los puntajes los jueces de las
competencias de clavados y los ejercicios de gimnasia de dichos jue-
gos, se le ocurri sugerir que para evitar los sesgos y describir con ms
justicia la poblacin del curso, se podra hacer lo mismo que en tales
competencias: eliminar los puntajes de los extremos y hacer el clculo
del promedio slo con los otros resultados. Supongamos, en el caso
de los clavadistas olmpicos, que si dichos puntajes se asignan entre un
cero y un diez, se eliminan de los puntajes que le dieron al clavadista
israel, el juez norteamericano 10 (demasiado!) y 1, el juez sirio (muy
poco!). Especular usted sobre razones polticas, pero la solucin es

salomnica: el puntaje de los ocho jueces restantes vari entre 7.8 y 8.5,
el promedio fue 8.0.
Ejercicio 3. Calcule ahora los siguientes promedios.

Promedio del peso,
Promedio de la talla, y
Promedio de la edad.
De los siguientes grupos:
a. De todos los estudiantes del posgrado de epidemiologa.
b. De todos los hombres del posgrado de epidemiologa.
c. De las mujeres del posgrado de epidemiologa.
d. De hombres y mujeres del posgrado, pero excluyendo, sin consi-

deraciones de sexo, a los de los extremos; es decir, en peso el ms
pesado y la menos pesada; en talla al ms alto y al ms bajo; en
edad al ms viejo y la ms joven.
Cules fueron esos resultados? Escrbalos.

Peso en kg:
Promedio de todo el grupo.
Promedio de los hombres.
Promedio de las mujeres.
Promedio del grupo, excluyendo los extremos.
Talla en cm:
Edad, calculada en aos:

Lista de los estudiantes de epidemiologa y salud pblica, juntos:

(aos) S o No
2 Masculino 40 70 165
4 Femenino 27 62 170
12 Femenino 28 55 150
14 Masculino 34 120 186
15 Femenino 23 55 165
16 Femenino 35 73 165
17 Femenino 27 60 162
19 Femenino 40 70 170
21 Femenino 38 56 160
23 Femenino 33 62 160
24 Femenino 34 51 160
25 Femenino 30 52 168
Ahora, haga con este grupo los mismos clculos que hizo con la lista
anterior.
Peso en kg:
Talla en cm:

Edad:
Promedio de todo el grupo,
Promedio de los hombres,
Promedio de las mujeres,
Podra sacar algunas conclusiones y resumirlas?
Respuestas:
El peso del estudiante nmero 6 del grupo de epidemiologa es mucho

mayor que el del resto de sus compaeros de curso. Al salirse de lo
normal, su peso altera muy significativamente el promedio de los pesos
y la forma de la curva de Gauss correspondiente; pero al eliminarlo
junto con el extremo opuesto el peso de la coautora de este libro
cuando era diez aos ms joven, el promedio de los pesos y la curva
resultante se parecen ms a la curva normal.
Cuando el grupo que se analiza crece, aunque el peso del residente

obeso ahora el nmero 14 de la lista conjunta de los residentes de
epidemiologa y salud pblica es tambin, en esta ocasin, mayor
que el de todos sus compaeros, el promedio de los pesos y la curva
no se ve tan influenciado por la presencia de dicho estudiante. En otras
palabras, a medida que aumenta el tamao del grupo, la influencia de
las cifras extremas se va diluyendo.
Otra manera de expresar lo anterior

Para que se pueda aplicar el teorema del lmite central, es necesario
cumplir algunos requisitos, dentro de los cuales el principal es que la n
sea suficientemente grande. En el caso de los estudiantes de epidemio-
loga, la n no era suficientemente grande.
Resumen: Pero en general, la respuesta depender en cada ocasin de la

distribucin que tenga la poblacin de donde tomamos los datos. Si los
datos de la poblacin se distribuyen simtricamente (lo cual har que
la curva sea una campana de Gauss perfecta) la n puede ser bastante
pequea. Si la poblacin es asimtrica, la n debe ser mayor.
Estos conceptos nos ayudarn a comprender mejor la llamada distri-

bucin Z y la necesidad de usar otras distribuciones alternativas, como
la distribucin t.
Antes de hablar de ellas, en el siguiente captulo, aqu tal vez pueda

responder la siguiente pregunta: Podra decir intuitivamente cundo se usa
una distribucin Z y cundo una distribucin t, es decir, cules son las condiciones
para usar una u otra?
Cuando la p es estadsticamente significativa, se debe a que la muestra

obtenida es representativa de la poblacin y los resultados reencontra-
dos en esta muestra pueden, dentro de ciertos lmites, ser generalizados
a la poblacin. Se pueden hacer inferencias.
Resumen
Lo que hemos dicho hasta aqu en este captulo, se puede resumir de la
siguiente manera:
1. El promedio de los promedios de todas las muestras es el pro-
medio real de toda la poblacin.
2. La varianza de los promedios de todas las muestras es la varianza
real dividida por el tamao de las muestras.
3. La distribucin de los promedios de todas las muestras es normal
(gaussiana), si el tamao de la muestra es suficientemente grande.
Estas tres propiedades matemticas de las muestras aleatorias simples

son esenciales, por ejemplo, son ellas las que nos permiten utilizar el
promedio de la muestra como un estimador confiable del promedio
poblacional. Veremos que tiene uso y bastante.
No olvide que el objetivo final de la estadstica es hacer inferencias

acerca de una poblacin con base en la informacin que contiene la
muestra, y que tomamos sta ya que representa a la poblacin por ra-
zones de economa, pues nos saldra muy costoso e innecesario, por lo
dems, calcular todo usando siempre a la poblacin total.
Aplicacin en la vida real
Como en las investigaciones se toma la muestra una sola vez, y no es

posible observar la distribucin que tendra x, si se tomaran muestras
repetidas, se usan todos los elementos tericos que nos permiten decir
cuales seran:
El promedio, y
La desviacin estndar de una distribucin normal hipottica (Error
Estndar), que resultaran si pudiramos tomar muestras
repetidas.
Tipos de muestreo
De acuerdo con el proceso de seleccin usado, existen dos grandes
clases de muestras: muestras probabilsticas y muestras no probabils-
ticas.
Muestreo probabilstico
Es aquel en el cual cada uno de los elementos de la poblacin tiene una
probabilidad conocida de ser seleccionado como parte de la muestra, y
esta probabilidad no es cero (0).
A este tipo de muestreo pertenecen:

El Muestreo Aleatorio Simple MAS,
El Muestreo Sistemtico MS,
El Muestreo Estratificado ME, y
El muestreo por conglomerados (clusters o racimos).
Muestreo no probabilstico
Es aquel en el cual no se conocen las probabilidades de ser selecciona-
do como elemento de la muestra. Habr, por lo tanto, grupos poblacio-
nales cuya probabilidad de seleccin es cero (0) y cuyas caractersticas,
por ende, no podrn ser conocidas.
Dentro de este tipo de muestreo se describen:

El muestreo por conveniencia.
El muestreo por cuotas, y
El muestreo voluntario.
Describiremos ahora los diversos tipos de muestreo:
Muestreo probabilstico
1. Muestreo Aleatorio Simple MAS. En este tipo de muestreo, cada
uno de los elementos de la poblacin tiene la misma probabilidad
de ser escogido. Para ello se requiere que el grupo sea homogneo
en trminos de varianza. Sera el tipo de muestreo usado en proce-
sos industriales, en donde se esperara que cualquier muestra esco-
gida al azar fuera representativa, pues todos los elementos seran,
tericamente, iguales. Para la muestra un botn. En estudios
adelantados con seres humanos, para lograr este tipo de muestreo
es necesario hacer primero un listado de los elementos, asignarles
un nmero y luego escoger la muestra mediante el uso de una
tabla de nmeros aleatorios. Dichas tablas se hicieron por com-
putador, con el objetivo de que los nmeros que la componen se
hayan escogido al azar y cada uno de los dgitos, de 0 a 9, tenga una
probabilidad 0.1 de ser escogidos. Antes de profundizar en la tabla
se necesita que el investigador haya decido de antemano la forma
en que la va a usar, es decir, a partir de qu nmero y siguiendo qu
orden completar el tamao de muestra previamente calculado.
2. Muestreo Sistemtico, MS. Es una variacin del muestreo aleatorio

simple. Aqu la seleccin se hace a travs de un ciclo que se repite
cada cierto nmero; por ejemplo, cada quinto caso, o cada dcimo
caso. Sera un mtodo conveniente para escoger la muestra de una
poblacin de pacientes con cirrosis hepticas de una lista, pero
inadecuado para escoger la muestra de un grupo de pacientes hos-
pitalizados por trauma.
3. Muestreo Estratificado, ME. Debido a que la mayora de pobla-

ciones son heterogneas (en trminos de varianza), una de las ma-
niobras estadsticas ms tiles consiste en subdividir la poblacin
en subconjuntos homogneos, llamados estratos; por ejemplo,

cuando uno quiere averiguar qu caractersticas tiene determinado
fenmeno en una poblacin dada, no es lo mismo hacerlo en las
clases ricas o en las clases pobres, sin tener en cuenta los elemen-
tos que la componen, o qu peso tiene cada clase en la poblacin
estudiada con respecto al fenmeno que se investiga. Esta estra-
tegia de muestreo se usa entonces, para garantizar que la muestra
sea representativa de todos los subgrupos que conforman la po-
blacin con respecto a raza, sexo, estado civil, ingreso, etc., a cada
no de los cuales se le dar un peso u otro ( se ponderarn) segn
sea su peso en la poblacin estudiada, en ese fenmeno particular
bajo estudio. Es fundamental, en cada caso, analizar por separado
los resultados de subgrupos que a causa de su poco tamao tuvie-
ron que ser submuestrados.
4. Muestreo por conglomerados (Clusters). Si despus de haber for-

mado los estratos persiste la heterogeneidad, se pueden utilizar
ciertos grupos de unidades como si fueran unidades de muestreo,
as se aumenta el tamao de la muestra sin necesidad de elevar
mucho los costos. A estos grupos de unidades se les conoce como
conglomerados, se trata de agrupaciones en las cuales se sabe que
se encontrarn los elementos que se hallaran en la poblacin. La
OMS escogi esta estrategia de muestro para evaluar la efectividad
de la campaa de erradicacin del polio en grandes reas geogrfi-
cas imposibles de cubrir totalmente, por las dificultades de acceso,
aislamiento, etc. Grupos de casas, aldeas y pueblos de determi-
nado tamao fueron escogidos como conglomerados, por estar
reunidos all todos los elementos de la poblacin, en la cual todos
los nios de la edad requerida se tomaban como muestra.
Tipos de muestreo no probabilstico

1. Muestreo por conveniencia. Este es el muestreo que se usa cuando
se escoge un grupo de la poblacin porque se sabe de antemano
que en ese grupo se encontrarn ms fcilmente los fenmenos
que se desean estudiar; por ejemplo, al hacer un estudio sobre
traumatismo craneoenceflico severo por accidentes de moto, los
investigadores no recogen los datos de los casos que se presentan
en todas las clnicas y hospitales de la ciudad, sino que los escogen
solamente en aquellos centros que por tener a su disposicin la
tecnologa adecuada, verbigracia, escanografa, quirfanos, ciruja-
nos de guardia, etc., exhiben la mayora de casos severos. Este es
un muestreo que deben decidir expertos en trauma y autoridades
en la dinmica de funcionamiento de las instituciones de salud de
la ciudad, si se trata de evaluar la severidad y el pronstico de estas
lesiones, as como para saber a dnde llegan los casos y si lo hacen
de manera oportuna segn la severidad del trauma.
2. Muestreo por cuotas. Se usa ampliamente en tcnicas de mercadeo.

De acuerdo con el inters del vendedor, se asignan determinadas
cuotas a aquellos grupos de poblacin que con ms probabilidad
van a adquirir el producto. Si lo que se quiere averiguar es cul es la
aceptacin de alguna marca de gaseosas o de helados, seguramen-
te se le asignar una cuota mayor al grupo de edad entre los 5 y los

12 aos que a grupos que no consumen estos productos, como
mujeres y hombres de altos ingresos en plan de cuidar la lnea.
3. Muestreo voluntario. Es el ms usado cuado los investigadores no

saben de muestreo. Encuestas de radio, que usualmente respon-
den voluntarios que llaman a la emisora porque estn interesados
en el tema, o por desocupados que simplemente quieren or su
voz al aire. Sera un error pretender aplicarle a la poblacin general
conclusiones que solo seran aplicables a los oyentes del programa
radial.
Reglas del muestreo

Para que los muestreos y las encuestas no caigan en sesgos que las in-
validen, y de esta manera se pueda hacer con confianza la asociacin
descrita de acuerdo con los resultados, es necesario respetar unos pasos
decididos de antemano.
Planeacin de una encuesta

Primer paso: Establecer los objetivos de la encuesta de manera clara y concisa,
y remitirse a esos objetivos a medida que se vaya progresando en el di-
seo y en la instrumentacin de la encuesta. Qu necesito saber? Para
qu quiero saberlo? Cmo voy a usar los resultados recolectados? Es
necesario mantener los objetivos suficientemente simples de manera
que los entiendan todos los encuestadores. Para garantizar el xito, el
coordinador de la encuesta debe ser capaz de responder de manera sa-
tisfactoria cualquier pregunta de los miembros del equipo.
Segundo paso: Definir cuidadosamente cul va a ser la poblacin mues-

treada. Si uno va a tomar una muestra de un grupo de adolescentes, es
necesario que de antemano se defina qu se entiende por adolescente,
por ejemplo, todos aquellos con acn, o mujeres y hombres entre los 12
aos y los 20 aos, la manera de contar los aos, de qu lugar, de qu
nivel educativo, etc.
Tercer paso: Seleccionar el marco o marcos muestrales de tal manera que con-
cuerden la lista de las unidades muestreadas y la poblacin objetivo.
Cuarto paso: Seleccionar el diseo de muestreo, incluyendo el nmero de ele-

mentos de la muestra, de manera tal que esta d informacin suficiente
que responda a los objetivos de la encuesta. Con frecuencia, muchas
personas ignorantes de todos estos pasos, e irrespetuosos con los pro-
fesionales de estas disciplinas, llegan preguntando simplemente por la
manera de saber, sin muchas arandelas, el tamao de la muestra, como
si esta saliera del sombrero de un mago.
Quinto paso: Definir los mtodos de medicin. Cada uno conlleva sus riesgos
y tiene sus tcnicas: las entrevistas personales libres o semiestructu-
radas, los formularios de autollenado, las entrevistas telefnicas, por
correo, la observacin directa, etc.
Sexto paso: Definir el instrumento. No es tan fcil disear un buen ins-

trumento. Esta es una trampa en la que caen los incautos y los princi-
piantes, quienes piensan que el diseo del instrumento es algo que se
puede elaborar en una jornada. Por el contrario, es un paso exigente,
engaoso y que cobra muy caro los errores cuando ya no hay forma de
echar marcha atrs.
Sptimo paso: Organizar el trabajo de campo.
Octavo paso: Organizar la recoleccin de los datos de manera adecuada.
Noveno paso: Decidir cundo, cmo, con qu nmero se va a hacer la

prueba del instrumento y cmo se van a hacer los ajustes, si los necesita.
Dcimo paso: Decidir lo concerniente al anlisis de los datos y a la pu-

blicacin posterior de los mismos.
Por no ceirse a estos pasos o a otros equivalentes, como se ceira uno

a una receta delicada, muchos investigadores principiantes y mal orien-
tados han echado a pique muchas investigaciones, de la misma manera
que un cocinero chambn echara a perder los mejores ingredientes.
Tamao de la muestra
Este tema se tratar ms en profundidad en otro captulo. Por ahora,
baste con decir lo siguiente:
No hay respuestas inmediatas ni simples. Ya lo dijimos al hablar del

Teorema del Lmite Central, que mientras ms se parezca la distribu-
cin a una campana de Gauss perfecta, es decir, mientras ms simtrica
sea la distribucin de los datos, la n necesaria ser ms pequea.
La mejor manera de calcular el tamao de la muestra es buscar a un

muestrista, es decir, un estadstico experto en determinar tamaos de
muestra. l va a hacer unas preguntas a las cuales usted deber respon-
der con claridad.
Estas son las cosas que el muestrista querr saber:
- La naturaleza de la informacin que busca. No es lo mismo deter-

minar una muestra si se trata de variables categricas (fuma o no
fuma), estos nios tienen enuresis (s
- o no); que si se trata de variables continuas, como cuando se quie-

re determinar peso, o cifras de tensin arterial de una poblacin.
- Cul es la prevalencia probable de la condicin. Para ello, la ni-

ca forma de saberla es informarse sobre los trabajos previamente
realizados sobre el tema, en esa misma poblacin o en otras.
- Qu tan exacto quiere uno que sea su estimativo, y qu margen de

error est dispuesto uno a tolerar, o puede admitir la condicin
estudiada.
- La distribucin que el fenmeno y la muestra tomen. Normal o no

normal.
- Del diseo de la investigacin. Va a seleccionar una muestra para

un estudio de casos y controles o para uno de cohortes? Insisto,
en todo ello pesa mucho el concepto de economa y de eficiencia,
de manera que uno obtenga un nmero ideal (el ms bajo posible),
que d una informacin que no se podra obtener aumentando
el tamao de la muestra. Muchos de los que sugieren doblar el
tamao de la muestra no saben que al hacerlo no se duplicar con
ello el retorno que se puede obtener de la informacin, pero s se
elevarn desproporcionadamente los costos y los esfuerzos.
17. Aplicaciones de las Herramientas

Estadsticas
Inferencias
Para quienes comienzan, este captulo suele ser territorio minado! Es
verdad: en el aprendizaje de las inferencias hay muchas minas quie-
brapatas, la ms daina de todas es la facilidad con que parece que se
comprenden los conceptos aqu expresados, que solo es proporcional a
la facilidad con que se olvidan. Por ello le pedimos que vaya con mucho
cuidado, paso a paso, muy despacio.
Un camino minado, vaya con mucho cuidado.

Antes de adentrarse en el captulo en s, le pedimos entonces que acep-

te lo siguiente:
Primero, que en esta materia es bueno entender de qu se trata,

ojal gozosamente. Mientras ms entienda, ms gil ser de aqu
en adelante su dilogo con estadsticos y epidemilogos en las di-
versas circunstancias en las cuales se encuentre con estos temas.
Tambin le pedimos que acepte sus lmites, ya sean intelectuales

o vocacionales, y que no se obligue ms all de lo sano a grabar
frmulas y definiciones.
Para ello debe entender que:
Ubicar el asunto ya es en s un avance.
Ubicar el asunto no significa captarlo en todas sus dimensiones.
Captar de qu se trata el asunto no es entenderlo a fondo.
Ver al profesor simplificarlo no significa que usted pueda hacer

lo mismo. Ese es un error que tambin cometen quienes asisten
al quirfano las primeras veces. Para llegar a ensear estas asigna-
turas, la mayora de profesores debieron detenerse muchas veces,
equivocarse y, luego s, paso a paso, encontrarle sentido; es decir,
sufrieron como usted.
No siempre quien ms rpido entiende un tema es el ms indicado

para ensearlo.
Saber usar algo de vez cuando tampoco significa que el concepto

ha quedado grabado para siempre; entenderlo tampoco significa
grabarlo, de manera que se vuelva de inmediato materia til cuan-
do sea pertinente, por ejemplo durante el estrs de los exmenes o
cuando en la vida cotidiana le hagan una pregunta inesperada.
Menos que se lo pueda explicar a otros y mucho menos que lo dis-

frute, pero si logra superar estas dificultades ver que es divertido
y til; le quedar la sensacin de haber llegado, y de ah en adelante
no se asustar ms porque habr conquistado un secreto ms de
la ciencia, tanto como se ha conquistado a s mismo, sus miedos y
sus malos recuerdos.
Marie Diener West, profesora de bioestadstica de John Hopkins Uni-

versity, en cuyas presentaciones est basado este captulo, emplea diez
sesiones en su curso de verano para explicar los conceptos introducto-
rios de las inferencias. http://www.uwtv.org/programs/series.aspx
Si ella lo hace as, es porque ha entendido que:
Hay que ir despacio.
No se pueden dar grandes bocados si uno no quiere atragantarse.

Hay que detenerse despus de cada bocado.
Es muy fcil confundirse y especialmente olvidar estos temas

cuando uno no los usa en la vida diaria. Para eso estn los exper-
tos.
No pretenda convertirse en uno de ellos, a no ser que ste vaya a ser su

oficio de todos los das. Seguramente no lo ser.
Antes de comenzar el camino recordemos lo siguiente:
Inferir es sacar conclusiones a partir de algo
En estadstica se pueden hacer inferencias de dos formas bsicas:
a) Mediante un estimativo del estadstico (no olvide que estadstico

es un valor de la muestra, el mismo que en la poblacin se llama
parmetro).
b) Mediante la prueba de la hiptesis.
Primera mina del camino. Lo del estadstico.
Estadstico, insistimos, no se trata aqu del profesional en estadstica.
Para entender qu es un estadstico, usted debe recordar que una cosa

son poblaciones y otras son las muestras de esas poblaciones.
Hablemos con un ejemplo para aclarar lo del estadstico:
Si queremos saber algo sobre un fenmeno que sucede en Bogot, lo

ideal sera que tomramos a toda la poblacin de la ciudad y viramos
cmo se distribuye en ella el fenmeno que nos interesa. Idealmente
tomaramos sus ocho millones de habitantes y les mediramos el fen-
meno de inters, pero eso no es prctico, ni siquiera posible. Si lo pu-
diramos hacer, al resultado que obtuviramos le podramos calcular,
por ejemplo, promedios (de edad, de colesterol, del peso) o proporcio-
nes (el porcentaje de bogotanos que no hace ejercicio, que fuma o que
no tiene amigos).
En Bogot (en toda la poblacin) esos promedios y esas proporciones

seran los parmetros de LA POBLACIN.
Como no podemos saber cules son los parmetros de toda la pobla-

cin, tomamos una MUESTRA que la represente. Cuando hablamos
de muestras no los llamamos parmetros sino ESTADSTICOS.
Los principiantes estaran tentados a creer que la toma de las muestras

consistira en hacer lo ms fcil, o lo ms democrtico e incluso lo
ms econmico; por ejemplo, salir a la calle y contar el fenmeno que
nos interesa en los primeros mil bogotanos que veamos pasar. Otros
escogeran a los habitantes de un barrio. No es su caso porque, a estas
alturas, usted ya sabr que el muestreo no es algo que podamos minus-
valorar y cuando se hace en serio, se debe realizar con la orientacin de

un profesional llamado muestrista.
Ya sabe usted que si fuera a tomar una muestra de un pastel, no sera lo

mismo si se tratara de uno homogneo que de uno con capas, en cuyo
caso tendra que tomar al menos un pedazo de cada una de las capas:
tambin sabe que no sera igual probar cada capa aisladamente que
mezclarlas en las debidas proporciones. Pero dejmonos de repostera.
A los VALORES de la muestra: promedios, medianas, proporciones de

la muestra, los llamamos ESTADSTICOS y a esos ESTADSTICOS
les calculamos ESTIMATIVOS.
Parmetro .
Estimador
Estimativo 17.5.
Ahora s, a esos estadsticos, que ya dijimos pueden ser:
Promedios
Proporciones
O tambin pueden ser:

Diferencias de promedios
Diferencias de proporciones
Para dos grupos
Para dos o ms grupos
A todos ellos (a ellos en s, o a la diferencia entre ellos) les podemos cal-
cular las pes y los Intervalos de Confianza (IC).
Inferencias. Primer paso

Generalidades sobre los estimativos
En este paso aclararemos lo de los estimativos; en pasos subsiguientes
nos dedicaremos a hablar de la prueba de la hiptesis.
Se pueden hacer estimativos:

1. Para un promedio.
2. Para una proporcin.
3. Para diferencias de promedios.
4. Para diferencias de proporciones.
Hay dos tipos de estimativos:
Estimativos puntuales, de los cuales el ms conocido es la p de

significancia.
Estimativos de los Intervalos de Confianza.

Tanto para los estimativos puntuales como para los intervalos de con-
fianza es indispensable entender de qu se trata la distribucin Z y la
distribucin t, es decir, las distribuciones normales. Veremos cundo se
debe usar la una o la otra, o cundo da lo mismo usar Z o usar t.
Pero tambin es indispensable entender qu es la distribucin muestral

(una distribucin terica) y distinguirla en todo momento de la distribucin
de la muestra y de la distribucin de la poblacin, estas ltimas distri-
buciones concretas.
Advertencia:
Aqu viene una GRAN MINA:
EL CONCEPTO DE DISTRIBUCIN MUESTRAL
Detngase. Vuelva a caminar, pero hgalo muy despacio. Trate

de grabar este concepto para siempre. Tal vez le ayude recordar
que aqu la palabra clave es TERICA. Terica o virtual no quie-
re decir intil.
Distribucin muestral
La Distribucin Muestral es una distribucin terica virtual que re-
sultara de todos los valores estadsticos (o estadsticos simplemente) de
la muestra, computados a partir de un nmero infinito de muestras del
mismo tamao tomadas al azar de la misma poblacin.
Distribuciones concretas
La distribucin de una poblacin determinada describe la forma,
la tendencia central y la dispersin de N (todos los valores de la
poblacin).
La distribucin de una muestra concreta describe la forma, la tenden-

cia central y la dispersin de los n valores muestreados.
Como por lo general no tenemos todos los valores de una poblacin,

recurrimos a la muestra.
La distribucin muestral describe la forma, la tendencia central y la

dispersin del resumen de los datos estadsticos de todas las muestras
posibles de un mismo tamao, tomadas de una poblacin
Distribucin de la poblacin Distribucin de la muestra Distribucin muestral
de la poblacin DS de la muestra del estadsticos

por ejemplo
del promedio
del estadstico estadstico

de los promedios
Las distribuciones muestrales se pueden usar en cuatro situaciones po-

sibles:
Promedio. Es la distribucin muestral ms frecuente en una po-

blacin de valores continuos.
Proporciones. Se usa cuando tenemos datos dicotmicos.
Diferencias entre promedios. Se usa para comparar promedios de

muestras obtenidas de dos poblaciones diferentes.
Diferencias entre proporciones
Estas no son, por supuesto, las nicas aplicaciones de las distribuciones

muestrales ni del captulo de inferencias, tambin estn los estimativos
y la comparacin de proporciones cuando se trata ya no de dos, sino de
tres o ms grupos.
Utilidad de la distribucin muestral del promedio

de las muestras
Supongamos que el estadstico que nos interesa analizar es el promedio
de una muestra dada; la distribucin muestral del promedio describe cul
es la probabilidad asociada con cada promedio posible si una muestra
de tamao igual se repitiera muchas veces. Sabemos que por puro azar,
algunos promedios tienen alta probabilidad y otros tienen baja. Como
hacer para saber si el promedio de nuestra muestra s representa la ver-
dad de la poblacin?
Hagamos un ejercicio concreto y analicemos paso a paso el peso de los

estudiantes de la maestra de epidemiologa de la Universidad del Valle,
en 1996.
Estudiantes de epidemiologa

(aos) S o No
Por un momento suponga que esta es la distribucin de todos los valo-

res de peso de todos los estudiantes de la maestra de epidemiologa de
la Universidad del Valle. Dicha distribucin sera la siguiente:
140
120
100
80
60
40
20
0
1 2 3 4 5 6 7 8 9
El promedio de los pesos de esta poblacin es de = 71.88 kg = (70 +

60 + 48 + 52 + 66 + 120 + 72 + 88+ 71) / 9.
Como se obtiene la desviacin estndar?

Ya le habamos hablado de las medidas de tendencia central, por ejem-
plo el promedio, la mediana y la moda. Existen otras medidas que son
importantes para saber qu tan alejados estn los datos alrededor de
una medida central. En nuestro caso, qu tan alejados estn los datos
del peso de los estudiantes de la maestra de epidemiologa, del prome-
dio de peso del universo (todos los estudiantes).
La desviacin estndar se calcula como la diferencia de cada valor con

relacin a su promedio.
Pero para calcularla se necesita un pequeo ajuste. Si a cada uno de los

datos de peso de los estudiantes le restramos el promedio y sumra-
mos esos resultados:
(70-71.88) + (60-71.88) + (48-71.88) la suma siempre nos dara

cero. Por ello, y para evitar usar los valores negativos que resultaran en
algunos clculos, hay que elevar al cuadrado la desviacin del promedio
de cada dato.
(70-71.88)2 + (60-71.88) 2+ (48-71.88)2 entre mayor sea esta suma,

mayor es la dispersin de los datos. Pero este valor no es la desviacin
estndar. Primero tenemos que pasar por la varianza.
Si queremos comparar la dispersin de los datos de una poblacin con

otra, es necesario adicionar el nmero de personas de la poblacin en
la ecuacin. Despus de haber sumado los cuadrados de la desviacin

de cada dato de su promedio, lo dividimos por N:
(70-71.88)2 + (60-71.88) 2+ (48-71.88)2

9
Esta es la varianza. Y la desviacin estndar es la raz cuadrada de la

varianza.
La desviacin estndar es = 21.58.
Ahora, construyamos la distribucin muestral de esta poblacin. To-

memos de esa poblacin de pesos una muestra de tamao n = 2. La
muestras se toman sin remplazo, es decir, que yo puedo elegir en las
dos oportunidades a la misma persona. La tabla de todas las posibles
muestras de tamao 2 de nuestra poblacin sera la siguiente:
Muestra 2
Estudiante 1 2 3 4 5 6 7 8 9
Estudiante 70 60 48 52 66 120 72 88 71
Muestra 1 1 70 70,70 70,60 70,48 70,52 70,66 70,120 70,72 70,88 70,71
2 60 60,70 60,60 60,48 60,52 60,66 60,120 60,72 60,88 60,71
3 48 48,70 48,60 48,48 48,52 48,66 48,120 48,72 48,88 48,71
4 52 52,70 52,60 52,48 52,52 52,66 52,120 52,72 52,88 52,71
5 66 66,70 66,60 66,48 66,52 66,66 66,120 66,72 66,88 66,71
6 120 120,70 120,60 120,48 120,52 120,66 120,120 120,72 120,88 120,71
7 72 72,70 72,60 72,48 72,52 72,66 72,120 72,72 72,88 72,71
8 88 88,70 88,60 88,48 88,52 88,66 88,120 88,72 88,88 88,71
9 71 71,70 71,60 71,48 71,52 71,66 71,120 71,72 71,88 71,71
Y la distribucin muestral de los promedios de los estudiantes:
Muestra 2
Estudiante 1 2 3 4 5 6 7 8 9
Estudiante 70 60 48 52 66 120 72 88 71
Muestra 1 1 70 70 65 59 61 68 95 71 79 71
2 60 65 60 54 56 61 90 66 74 66
3 48 59 54 48 50 57 84 60 68 60
4 52 61 56 50 52 59 86 62 70 62
5 66 68 63 57 59 66 93 69 77 69
6 120 95 90 84 86 93 120 96 104 96
7 72 71 66 60 62 69 96 72 80 72
8 88 79 74 68 70 77 104 80 88 80
9 71 71 66 60 62 69 96 72 80 71
El promedio ms bajo posible que usted encontrara en esta poblacin,

si muestreara a dos individuos, sera 48, y el ms alto sera 120.
Ahora, fjese cmo luce esta distribucin muestral en una tabla de fre-
cuencias:
Promedio Frecuencia
45-50 3
50-55 3
55-60 8
60-65 13
65-70 16
70-75 10
80-85 4
90-95 8
100-105 6
105-109 4
110-115 2
115 y ms 1
Y fjese cmo luce esta distribucin en una grfica:
18
16
14
12
10
El promedio ms tpico, es decir, el que ms probabilidades tendra de

salir, estara entre 65 y 70, pero si computamos exactamente la suma de
todos los promedios (70 + 65 + 59 + 61+ 65 + 60 + 59) nos
dara el promedio que calculamos para la poblacin = 71.8.
A que le recuerda la forma de esta distribucin? A la

distribucin normal.
Imagnese que usted tuviera que hacer este mismo ejercicio para una
muestra de 1 500 habitantes de la ciudad de Bogot. Desesperante!
Por ello se ha creado la estadstica de inferencias, para que de una sola
muestra podamos estimar los parmetros de la poblacin. Pero es po-
sible, como sucede con nuestros estudiantes, que esa muestra difiera
en los promedios, que encontremos en alguna oportunidad promedios
ms bajos o promedios ms altos.
Entonces qu hacer? Obtener la variabilidad de nuestras estimaciones,

que se produce por el hecho de haber escogido una muestra al azar.
Aqu es donde entra el concepto de desviacin estndar y error estn-
dar, que se pueden obtener para la poblacin (todos los bogotanos) o

para la muestra de nuestra poblacin.
Para entender la matemtica de la distribucin muestral de los prome-

dios es necesario introducir aqu el concepto del error estndar.
La frmula matemtica del error estndar, EE en espaol, SE en in-
gls es:
/ n
Dicha frmula se deriva de la desviacin estndar de la poblacin e
incluye el tamao de la muestra n. Tngala presente de ahora en ade-
lante y sobre todo est alerta para distinguir cundo se est hablando de
desviacin estndar y cundo de error estndar.
Qu pasa si la distribucin muestral no est distribuida normalmente?

En realidad no hay nada qu temer de acuerdo con el Teorema del
lmite central.
Teorema del Lmite Central

El Teorema del Lmite Central nos dice que dada una poblacin de cual-
quier distribucin continua no normal de promedio y de desviacin estn-
dar , la distribucin muestral de los promedios tomar una distribu-
cin aproximada normal con promedio y desviacin estndar /n
cuando el tamao de la muestra es suficientemente grande. Grande
como lo veremos repetidamente al consultar las tablas y al hacer los
clculos es 25.
El Teorema del lmite central tambin nos dice que en el caso de la dis-
tribucin de la poblacin, siempre y cuando esta sea normal:
- 68% de los datos caen entre 1 del verdadero promedio.
- 95 % de los datos caen entre 2 s.
- 99% de los datos caen entre 3 .
En cambio, en el caso de la distribucin muestral, aunque la poblacin no
sea normalmente distribuida:
- 68% de los datos caen entre /n.
- 95% de los datos caen entre 2 / n.
- 99% de los datos caen entre 3 / n.
En el ejemplo anterior, de los 9 alumnos de la maestra de la cohorte
del 96, en la Universidad del Valle, se puede decir lo siguiente:
- 68% de los pesos caen entre 71.88 21.58 = 50.3-93.46.
- 95% de los pesos caen entre 71.88 2 * 21.58 = 28.72-115.04.
- 99% de los pesos caen entre 71.88 3 * 21.58 = 7.14-136.62.
Dichos datos son tan vagos como decir que los pesos pueden ser cual-
quiera. Eso sucede porque la poblacin es tan pequea que no se le
pueden aplicar las estadsticas de la distribucin normal.
En cambio, en el caso de la distribucin muestral:

- 68% de los datos caen entre /n = 71.88 7.19 = 64.69-
79.07.
- 95 % de los datos caen entre 2 / n = 71.88 2* 7.19 =
57.5-86.26.
- 99% de los datos caen entre 3 / n =71.88 3*7.19 = 50.31-
93.45.
Por qu nos interesa el Teorema del lmite central?

Porque gracias a l podemos calcular la probabilidad asociada con el
promedio de una muestra, por ejemplo, si conocemos que la distribu-
cin de colesterol (mg/dl) de todos los bogotanos se distribuye con un
promedio = 185 y una desviacin estndar de 43 (como sucede en
la poblacin de adultos de Estados Unidos) podramos saber cul es la
probabilidad de que los bogotanos tengan un colesterol muy elevado,
por ejemplo de 280 mg/dl.
Y esta probabilidad la podemos encontrar utilizando la distribucin

normal llamada Z.
Z = X-Mu / =
Probabilidad (280-185/43).
Probabilidad (X > 280) = 2.20.
En la tabla de Z, esta probabilidad es de 1.4%.
Estimativos puntuales y estimativos de intervalo
Los estimativos puntuales son aquellos valores nicos que toma
el estadstico de la muestra. El estadstico es un estimador de un
parmetro de la poblacin. Un estimativo es el valor estadstico
particular.
El estimativo de intervalo se trata de un estimativo puntual rodea-

do por un intervalo que expresa la falta de certeza o la variabilidad
asociada con el estimativo. Este, como lo veremos repetidamente,
est influenciado por el tamao de muestra y por la variabilidad,
de manera que mientras mayor sea el tamao de la muestra en
general, menor es el intervalo (ms estrecho).
- Estimativo puntual o de punto es el mejor valor estimado del

verdadero parmetro de la poblacin, que se puede obtener segn
los datos disponibles.
- El estimativo de intervalo es lo mismo que el intervalo de con-

fianza.
Estimativo puntual para una muestra

El promedio de la muestra es el mejor estimador del promedio de
la poblacin.
La proporcin de la muestra es el mejor estimador de la propor-

cin de la poblacin.
Cmo se hace el estimativo puntual cuando se trata no de una muestra

sino de dos muestras independientes?
Para datos continuos, la diferencia entre dos promedios de muestras to-

madas de dos poblaciones independientes es el mejor estimador
de la verdadera diferencia de los promedios de dos poblaciones.
Cuando los resultados son binarios, la diferencia entre dos proporciones

de muestras tomadas de dos poblaciones independientes es el mejor
estimador de la verdadera diferencia de las 2 proporciones.
Cmo se construye el Intervalo de Confianza?

Por definicin, un intervalo de confianza del 95% (IC 95%) para un
valor verdadero, pero desconocido del parmetro de la poblacin, es:
IC 95% = Estadstico de la muestra Z /2 *Error Estndar.
Interpretacin:
- En muestras repetidas de una poblacin distribuida normalmente,

el 95% de los intervalos incluirn el verdadero parmetro de la pobla-
cin; es decir, estamos 95% seguros de que el intervalo de confian-
za expresado contiene el verdadero parmetro de la poblacin.
Clculo del IC para una muestra nica

Cuando tenemos una muestra nica podemos calcular el intervalo de
confianza, ya sea:
Para el promedio de esa poblacin, o
Para una proporcin.
Clculo del IC del 95% para el promedio de la poblacin

Un intervalo de confianza del 95% (IC 95%) del promedio verdadero
de la poblacin se basa en el promedio de la muestra, el error estndar
y un valor (alfa). Cuando el intervalo de confianza es de 95%, el
es 0.05; cuando el intervalo de confianza es de 90%, el es 0.10 y se
calcula como ya lo habamos mencionado:
IC 95% = Estadstico de la muestra Z /2 *Error Estndar.
IC 95% = 1.96. n
En la frmula anterior, al aumentar n (el tamao de la muestra), dismi-

nuye o se estrecha el intervalo de confianza.
Y de dnde sale el 1.96? de la tabla Z. Para encontrarlo, primero

debe dividir su entre 2 = 0.025, en el caso de que quiera el intervalo
del 95%, luego, a UNO restarle ese valor y buscarlo en la tabla. Lo
encontrar en la esquina de abajo. La suma de la primera columna y la
ltima columna que corresponden a este nmero suma 1.96
Z 0 0.03 0.04 0.05 0.06

0 0.5 0.512 0.516 0.5199 0.5239
0.1 0.5398 0.5517 0.5557 0.5596 0.5636
1.2 0.8849 0.8907 0.8925 0.8944 0.8962
1.3 0.9032 0.9082 0.9099 0.9115 0.9131
1.4 0.9192 0.9236 0.9251 0.9265 0.9279
1.5 0.9332 0.937 0.9382 0.9394 0.9406
1.6 0.9452 0.9484 0.9495 0.9505 0.9515
1.7 0.9554 0.9582 0.9591 0.9599 0.9608
1.8 0.9641 0.9664 0.9671 0.9678 0.9686
1.9 0.9713 0.9732 0.9738 0.9744 0.975
Nueva advertencia!
Otra mina que lo obliga a detener el paso:
Ya lo habamos dicho antes, pero lo repetimos: la distribucin
normal tambin se llama distribucin Z si = 0, y = 1.
Desde ya debe saber que existe una distribucin alternativa de
la distribucin Z: la distribucin t.
Es importante que entienda cundo usar Z o cundo la t.
Distribucin t:
La distribucin t es una distribucin alternativa de la distribucin Z que
se usa cuando no se conoce la desviacin estndar de la poblacin .
Al igual que en el caso de la distribucin Z (la distribucin normal), la

distribucin t es una distribucin terica en la cual el promedio, la mediana
y la moda son iguales, es decir, la distribucin t tambin es una distri-
bucin completamente simtrica alrededor del promedio, su rango de
valores se dispersa entre + y - ; pero la distribucin t pertenece a
una familia de distribuciones determinada por los grados de libertad (gl),
conocidos en ingls como degrees of freedom (df).
La t de esta distribucin se empieza a parecer y termina siendo bsica-

mente lo mismo que la distribucin Z a medida que la t aumenta. Se
sabe que el punto en que termina parecindose a Z sucede cuando n
= 25.
The Student (El estudiante) fue el seudnimo utilizado por William

Gosset para publicar sus trabajos sobre la distribucin t a comienzos
del siglo XX ante la prohibicin de los dueos de la cervecera Guiness
de que sus funcionarios publicaran artculos cientficos. Gosset tena
un almacn de elementos de costura en Dubln, pero tambin trabajaba
como estadstico en la cervecera.
Quienes han tenido el placer de saborear una buena pinta de Guiness

saben que a pesar de que los dueos de la industria eran de una familia
muy britnica, Guiness es uno de los productos que mejor identifican a
Irlanda. Se trata de un gusto aprendido para los extranjeros, pero para
los irlandeses se trata de una deliciosa cerveza negra, tibia, con una es-
puma muy espesa, casi cremosa, mejor cuando se extrae del barril que
cuando la embotellan para exportacin.
Qu tiene qu ver esto con el clculo del intervalo
de confianza
Cuando no sabemos cul es la verdadera desviacin estndar de la po-
blacin, la mejor manera de adivinarla es usando la desviacin estndar
de los datos de la muestra (s).
Tomemos de nuevo nuestra poblacin, los pesos en kg de los estudian-

tes de la maestra de epidemiologa de la universidad del Valle: 48, 52,
60, 66,70, 71, 72, 88, 120.
Si recordamos el promedio de la poblacin, es 71.88 y la desviacin

estndar es 21.58
Si de esa poblacin tomo un tamao de muestra n = 4 y supongo que

salieron al azar los valores de la mitad, excepto el ms mediano de ellos
60, 66, 71 y 72, el promedio calculado de esa muestra de sera 67.25 y
la desviacin estndar (S) 5.50
Pretendamos que no sabemos nada de la poblacin de la que tomamos

la muestra, el IC del 95% para el verdadero valor de la poblacin sera
=
IC 95% = t 0.05/2 ; n-1 gl S/ n.
En este ejemplo especfico, la t 0.05/2 y los tres grados de libertad 3 gl

se basan calculando un alfa de 0.05 para los dos lados, y los tres grados
de libertad salieron de n-1.
Al mirar la tabla de t, nos sale que t es igual a = consultar tabla.
Tabla de la distribucin t de Student (versin para este libro, a la cual

solo se le han puesto los valores que hacen posible la explicacin):
df 0.05 0.025 0.01

2 2.92 4.3027 6.2054
3 2.3534 3.1824 4.1765
4 2.1318 2.7765 3.4954
5 2.015 2.5706 3.1634
6 1.9432 2.4469 2.9687
7 1.8946 2.3646 2.8412
8 1.8595 2.306 2.7515
9 1.8331 2.2622 2.685
10 1.8125 2.2281 2.6338
.n
Por ahora, mientras consultamos la tabla completa de t, supongamos

que nos dio que t = 3.182
IC 95% = 67.25 3.182 x 5.5 /4= 67.25 3.182 x 2.75
IC 95% = 67.25 8.75
IC95% = 58.5- 76.0
Mi resultado quiere decir que estoy 95% seguro de que el verdadero
promedio de los pesos de los estudiantes de maestra de la Universidad
del Valle cae entre 58 kg el valor ms bajo del intervalo calculado y
76 kg, el valor ms alto.
Este se trata, por supuesto, de un ejercicio artificial para demostracin.

De todas manera, si miramos el verdadero promedio de la poblacin
(se supone que no lo sabamos) comprobamos que este promedio de
71.88 cae dentro del intervalo calculado. Es un intervalo amplio, pero
esto se debe a que el tamao de la muestra es pequeo. Ya dijimos, sin
embargo, que a medida que el tamao de la muestra n aumenta, se es-
trechar el rango de valores entre los cuales podremos asegurar con un
95% de certeza que cae nuestro verdadero promedio.
Si en otro ejemplo de una poblacin de 200 personas tomamos una

muestra n de 25 datos, los grados de libertad sern de 24, entonces t se
acercar a Z. Si ese fuera el caso y si an estuviramos en la poca no
muy lejana cuando no tenamos disponibles ni computadores persona-
les ni programas estadsticos ampliamente conocidos, como STATA,
SPS o Epiinfo, y no tuviramos a la mano un libro con la tabla de t, po-
dramos echarle mano a la tabla de Z y obtendramos valores similares
a los obtenidos aqu.
Clculo del IC del 95% para la proporcin
de una poblacin
El razonamiento es similar al que hicimos para el promedio de una
poblacin.
Solo que en el caso de una proporcin , el IC 95% se calcula de la

siguiente manera:
IC 95% = Estadstico de la muestra Z 0.05/2. EE
Si recordamos que el Error Estndar (EE) de la muestra y sabe-

mos que para completar la unidad (el 100%), esa proporcin tiene un
complemento
IC 95% = . /n
(Alerta: esta p que se refiere a una proporcin no es la misma p de

significancia, omnipresente en la estadstica).
Tomemos de nuevo el ejemplo anterior de los pesos y tomemos tam-

bin una muestra n de cuatro elementos, pero supongamos que de esa
muestra n en la cual los elementos eran 60, 66, 71 y 72 solo estamos
interesados en la proporcin de la muestra que es mayor de 60. En este
caso 3 pesos de 4, es decir o 0.75% son mayores de 60.
El intervalo de confianza para la verdadera proporcin de la poblacin

sera:
IC 95% = 0.75 1.96 (0.75) (0.25) / 4
IC 95% = 0.75 0.42
IC 95% = (0.33-1.17)
Punto importante sobre las notaciones usadas. Para evitar confusiones

y no interpretar como negativos nmeros que no lo son, los compo-
nentes de los intervalos de confianza se escriben entre parntesis y se-
parados por comas:
IC 95% = (0.33, 1.17)
La interpretacin de ese intervalo de confianza es que estoy 95% ra-

zonablemente seguro (confiado) de que este intervalo contiene la
verdadera proporcin de la poblacin.
Sin embargo, aqu nos encontramos con un problema: usualmente se dice que
los intervalos de confianza que pasan por 1 no tienen valor. Los dos
valores de los intervalos de confianza pueden ser negativos -2.8 y -3.5,
o ambos pueden ser positivos +3.5, +9.3, pero no pueden pasar por el
punto 1. Este 1 es un problema de la escala logartmica porque sta no
tiene cero (0). En las escalas no logartmicas, en vez de no darle valor a
1, no se le da valor a los IC que pasan por cero.
En este caso, el intervalo encontrado pas por 1, pero ello se debi a

que el tamao de la muestra fue muy pequeo.
En el caso de los IC, para decidir cul es el tamao de la muestra para un

promedio nico, seguimos estos pasos:
Supongamos que queremos estimar el verdadero promedio de edad de

una poblacin dentro de un rango que vaya entre 5 aos. Eso signi-
fica en total 10 aos para los dos lados de la distribucin.
- Especificamos el intervalo de confianza 5.
- Asumimos que la verdadera desviacin estndar de la pobla-

cin es 10 con un nmero que obtenemos ya sea de un estudio pre-
viamente publicado en la literatura o de uno obtenido de un pequeo
estudio piloto. Finalmente, resolvemos cul es el valor de n.
IC 95% = Z 0.05 /2 x / n
5= 1.96 / n
1.96 x 10 2
n = = 15.4
52
Un tamao de muestra n 15 nos permitira estimar el verdadero prome-

dio de edad 5 aos.
Para decidir cul es el tamao de la muestra para calcular los IC del 95% de
una proporcin nica, seguimos un procedimiento similar al del promedio.
Supongamos que queremos estimar la verdadera proporcin de pesos
mayores de 60 kg dentro de un IC de 3%.
Los pasos son los siguientes:
Especificamos el IC, en este caso 0.03.
Asumimos, basados en estudios previos, la proporcin de la

poblacin, o en el peor de los casos asignamos a cada proporcin el
50%, lo cual nos permitira obtener el ms conservador de los clcu-
los.
Resolvemos la ecuacin para hallar el valor de n.
Si IC 95 % = 1.96 . / n
0.03= 1.96. . / n, en caso de que usramos proporcin = 0.5
(Alerta: esta p, que se refiere a una proporcin, no es la misma p de

significancia, omnipresente en la estadstica).
El tamao de muestra n ser =

1.96 2 (0.5) (0.5)
= 1 067
0.03 2
Fjese que aqu, al decidir que queramos un intervalo de confianza
muy estrecho, el tamao de la muestra se nos agrand demasiado. En
la vida real no es necesario estrechar tanto los intervalos de confianza
y por ello, en el fondo, el clculo del tamao de muestra siempre con-
sistir en negociar el mejor resultado posible considerando los costos
econmicos y logsticos de aumentar el tamao de la muestra innece-
sariamente.
En los siguientes captulos usaremos la misma lgica empleada hasta

ahora para hacer los estimativos y calcular los IC de los promedios y
proporciones nicas, para calcular los mismos en casos de:
Las diferencias entre promedios de dos poblaciones distintas s.
Las diferencias de proporciones de dos poblaciones diferentes.
Y ms adelante, en este captulo veremos cmo comparar cuando se

enfrenta a ms de tres grupos con el anlisis de varianza y relaciona-
dos.
Inferencias. Segundo paso.
Tome un nuevo descanso antes de dar el segundo paso
Generalidades sobre puesta a prueba de la hiptesis

En el paso anterior nos dedicamos solamente a hablar de la parte de las
inferencias que tienen que ver con estimativos. En este paso veremos
cmo poner a prueba una hiptesis y durante su desarrollo usaremos

simultneamente dos herramientas visuales vistas al comienzo del libro,
la tabla de cuatro casillas y la curva normal.
Como casi todos somos profesores a la antigua, estamos convencidos

de que tambin a base de repeticin se aprende. A algunos de nosotros
nos cost trabajo lo del estadstico, por eso insistimos en ello y se lo
resumimos en el cuadro que sigue a continuacin.
Nomenclaturas distintas
Para seguir leyendo sin sobresaltos, recuerde una vez ms que usamos
una nomenclatura para hablar de las medidas que describen poblacio-
nes (universos) y otra nomenclatura para las muestras.
Parmetros. Cuando hablamos de poblaciones, nos referimos a
parmetros.
Estadsticos. Cuando hablamos de muestras, hablamos de esta
dsticos.
Muestras Poblaciones
(Estadsticos) (Parmetros)
X1= un elemento de la muestra

n= nmero de elementos de la muestra N= Nmero de elementos de la
poblacin (universo)
Promedio de la muestra Promedio de la poblacin
S2 Varianza de la muestra 2 Varianza de la poblacin
S = Desviacin Estndar (la raz cuadra- Desviacin Estndar de la poblacin
da de la Varianza), la S se toma de la no-
tacin inglesa SD (Standard Deviation), que
tiene un derivado importante.
EE= Error Estndar de los promedios
(SE, en ingls) =

En qu consiste la puesta a prueba de una hiptesis

La puesta a prueba de las hiptesis es un proceso deductivo mediante
el cual se pone a prueba una hiptesis por medio de los datos de una
muestra.
Poner a prueba el estadstico no se trata entonces de ver cunta pacien-

cia tiene dicho profesional, sino del proceso deductivo que le ayuda
al investigador a tomar una decisin estadstica sobre una poblacin,
al examinar una muestra tomada de la misma. Si la hiptesis sobre el
verdadero parmetro de la poblacin es realmente verdadera (recuerde
que lo suponemos verdadero pero an lo desconocemos), es necesario
preguntarse: Qu tan probable, poco o mucho, es que el valor del
estadstico de la muestra represente los verdaderos parmetros de la
poblacin?
El investigador, basado en los datos, aqu puede rechazar o no rechazar

la hiptesis.
Para hacerlo, se siguen ciertos pasos:
1- Se selecciona un modelo de probabilidad para los datos observa-

dos.
2- Se escoge una Hiptesis Nula (H0) y una Hiptesis Alternativa (HA),

segn los datos de que se trate se pueden hacer pruebas de los dos
lados (de las dos colas de la distribucin), o de un solo lado (una
cola).
3- Se selecciona una prueba estadstica, Z o t. Se usa:

t cuando no se conoce la verdadera desviacin estndar de la
poblacin () y n < 25.
De otra manera, se usa Z.
4- Se elige el nivel de significancia alfa (). Se escogen las reglas de
decisin y una regin critica, llamada tambin regin de rechazo,
que incluye aquellos valores estadsticos que tienen muy poca pro-
babilidad de ser escogidos, es decir, aquellos que estn situados
en las colas de la distribucin, en oposicin a aquellos con ms
probabilidades de salir por estar situados en el centro de la distri-
bucin. Se cambia aqu la lgica de los IC a la lgica de la zona de
rechazo.
5- Se computa el valor observado del estadstico de la prueba.
6- Se toma una decisin estadstica y se llega a una conclusin.
Hagamos un ejercicio:
La hiptesis nula H0
= 0
/2 /2
Supongamos que la Hiptesis Nula (H0) asevera que el verdadero pro-

medio de la poblacin es igual a algn promedio dado 0.
Dicho valor 0 lo obtuvimos de otro estudio, quizs de uno ms pe-

queo, un estudio piloto, por ejemplo. Hemos decidido que a falta de
mejores datos - para eso estamos haciendo nuestro nuevo estudio -
tenemos que usar lo que ya existe en la literatura. Siempre partimos de algo
ya hecho.
Si transformamos la distribucin de los promedios de las muestras en

una Z dividiendo ese 0 por los valores de la desviacin estndar me-
diante el uso de una tabla de Z, llegamos a establecer cul es la regin
crtica (regin de rechazo de la hiptesis nula).
Regin Crtica mediante el uso de la tabla de Z

Rechazo la No logro rechazar Rechazo la
Hiptesis la Hiptesis Nula Hiptesis
Nula H0 0,95 (rea correspondiente Nula H0
/2= 0.025 bajo la curva) /2= 0.025
Decisin estadstica
Ahora debemos tomar una decisin estadstica:
Rechazar la Hiptesis Nula H0 debido a que el valor del test esta-

dstico es muy poco probable cuando la hiptesis nula es verdade-
ra (aquellos valores que caen en las regiones crticas o regiones de
rechazo).
Aceptar la H0 (mejor entenderlo como Fallar en rechazar la H0)

debido a que el valor del test estadstico es probable cuando la H0
es verdadera (valores localizados en la regin de aceptacin).
Resultados de la puesta a prueba de la hiptesis

Aqu usaremos simultneamente dos curvas superpuestas para explicar
por qu hay una regin de aceptabilidad y una de rechazo.
Supongo que tenemos dos

distribuciones, una centrada
en el promedio H0 de la de
la izquierda y otra en el pro-
medio de la Ha.
Note que el razonamiento
lo hacemos sobre la distri-
bucin de la H0
0 A
Regin de aceptabilidad Regin de rechazo
de la H0 de la H0
0 A
Regin de aceptabilidad. Esta es Esta es una distribucin centrada
una distribucin centrada en en de A de la hiptesis alter-
de 0 de la hiptesis nula. nativa.
Estas son pues nuestras dos apuestas, que las hacemos, por supuesto a
priori, una que est centrada en los valores promedios de la hiptesis
nula 0, y otra que est centrada en los valores promedio de la hiptesis
alternativa A.
Como veremos ms adelante al discutir el origen del nombre de la H0

hiptesis nula, la HA debera ms bien llamarse H no 0 o hiptesis No
Nula.
Tipos de errores posibles
Al tomar la decisin existen dos posibilidades de cometer errores:

Se rechaza la Hiptesis Nula, cuando sta es verdadera.
Se fallara en rechazar la hiptesis alternativa debido a que la cola
de esa hiptesis cae en la regin de aceptacin pintada de azul.
Posibles resultados de la puesta a prueba de la hiptesis:
Otro uso ms del cuadro de cuatro casillas.
Conclusin basada en los datos de la muestra
Cuando NO Cuando se rechaza la H0

se rechaza la H0
Si la verdad es que La conclusin es correcta Error Tipo I
H0 es correcta
Si la verdad es que Se comete La conclusin es correcta
la H0 NO es correcta un Error Tipo II
Si volvemos de nuevo al grfico donde estn las dos curvas, podremos

darle nombres a los posibles errores que se pueden cometer al poner a
prueba una hiptesis.
Posibles errores al poner a prueba una hiptesis

y definicin de poder
es la probabilidad de Error del Tipo I.
Beta es la probabilidad de un Error del Tipo II, lo cual sucede
cuando fallamos por no rechazar la Hiptesis Nula (H0) cuando
sta no es correcta.
Poder = 1- es la probabilidad de rechazar correctamente la H0.
Poder aqu el razona-

miento lo hacemos
sobre la curva de la
derecha, centrada en
1- la HA.

El poder est representado por el rea en rosado a la derecha de la lnea que limita beta
Todas estas decisiones con , con y con el poder, se toman a priori.
Error Tipo I = apntele a mantener el Error Tipo I pequeo.
Error Tipo II = trate de mantener el Error Tipo II pequeo y el

Poder grande. O, puesto de otra manera, mantenga el error tipo II
pequeo para maximizar el poder.
Tenga en cuenta que si estuviramos en un mundo ideal, para mantener

tanto el error tipo I como el error tipo II al mnimo, tendramos que
agrandar demasiado el tamao de la muestra.
Prueba del valor de p

Dudamos mucho sobre si deberamos haber puesto lo correspondiente
a la prueba del valor de p en otro lugar, por ejemplo junto con los IC
cuando los tratamos en el captulo anterior, pero decidimos dejarlo aqu
para hacer nfasis en el hecho de que, a diferencia de los razonamientos
sobre y sobre , que se hacen antes de la prueba, la prueba del valor
de p es algo que se hace a posteriori, para tomar una decisin mediante
la cual se determina si los datos obtenidos pudieron haber sido produc-
to del azar, cuando la H0 es verdadera.
El valor de p se puede calcular para un lado (cola) o los dos lados de

la curva.
Interpretacin ms comn de la p en la epidemiologa

p < 0.05 se interpreta, por lo general, como que la p es arbitraria-
mente significativa.
P >0.05 se interpreta, por lo general, como que la p no es estads-

ticamente significativa.
Intervalos de Confianza IC o p de significancia?

La interpretacin de las p de significancia que acabamos de ofrecerle
se ha descontextualizado y muchos la toman como si se tratara de un
valor que, mientras ms pequeo, mejor. Es una p de 0.04 muy dife-
rente de una p de 0.06? Como vimos en ms detalle en el recuadro del
captulo dedicado especficamente a p e intervalos de confianza escrito
por Carlos Vasco, lo mejor es reportar el valor de p como una igualdad,
y presentarlo junto con sus respectivos Intervalos de Confianza, IC.
No obstante, la tendencia actual de algunas publicaciones de no aceptar

las p que acompaan los reportes estadsticos es una gua convencional
y controvertible, pero que sirve para tomar decisiones. Es necesario
entender que se trata solo de una gua y no de una cifra mgica, y que
posiblemente el IC sea ms informativo. A la larga, el problema se trata
de que haya que tomar decisiones alrededor de unos valores. Lo cual no
quiere decir que para tomar esas decisiones se pueda evadir el proceso
racional. Y que significancia estadstica, como lo expresan las p, sea ne-

cesariamente equivalente a significancia clnica o prctica, la estadstica
es una herramienta de ayuda y nunca debe remplazar el juicio clnico.
El estadstico de una prueba.

El estadstico de una prueba se calcula de la siguiente manera cuando se
sabe :
Estadstico de la muestra - valor hipottico

Estadstico de la prueba =
Error Estndar del estadstico de la muestra
Para calcularlo, necesitamos saber entonces:

El estadstico calculado de la muestra.
El valor hipottico del parmetro de la poblacin.
El Error Estndar (EE).
Dichos estadsticos los podemos aplicar para promedios, para diferen-
cias, etc.
Estadstico de la prueba para un promedio:

Si la H0 dice que =
Cuando se conoce , se usa la distribucin Z y las tablas corres
pondientes.
Entonces, se calcula de la siguiente manera:
(X - 0)
Z=
/n
Cuando no se conoce , se usa la distribucin t y las tablas corres-

pondientes.
Y se calcula:
(X - 0)
t=
S/n
Como no se sabe , se estima con S / n
Cuando n es grande, la t tiende a ser Z. Ya dijimos que se considera

grande de 25 para arriba.
El razonamiento que hicimos para el promedio lo podemos extender

para la proporcin.
Estadstico de la prueba para una proporcin de una poblacin.
En este caso, la hiptesis nula H0 afirma que la proporcin verdadera

de la poblacin es igual con la proporcin de otra poblacin descono-
cida, o sea p = p0 (le ruego que no confunda esta p de proporcin con
las p de significancia que acabamos de mencionar).
H0 afirma que p = p0
(p - p0)
Si se usa Z =
p -q
0 0
n
Ejemplo del clculo del estadstico de un promedio para apren-

der cmo se hace el razonamiento adecuado
Usemos otra vez mediciones de colesterol.
Supongamos que hemos tomado una muestra de 25 personas de 40

aos de edad cuyo promedio de colesterol srico es de 132 mg/dl y su-
pongamos que sabemos de antemano porque as lo dice la literatura
o porque hicimos un estudio piloto recientemente, que los adultos
de 40 aos sin riesgo cardiovascular tienen en promedio 117 mg/dl.
La pregunta que nos haramos sera la siguiente: Es posible concluir

que la muestra de 25 adultos se tom de una poblacin de adultos sin
riesgo cardiovascular?
Razonamiento:
Nuestra H0 nos dice que el promedio de una poblacin no lo

conocemos pero lo suponemos segn lo que dice la literatura es
de 117 mg/dl.
Es decir, H0 dice que = 117 mg/dl.
Sabemos que n = 25 y que X = 132.
Supongamos que la desviacin estndar de la poblacin es = 20

mg/dl. Esta suposicin se basa en lo que ya ha publicado la litera-
tura al respecto, o es un dato que obtuvimos de un estudio piloto
previo.
Como en este caso sabemos, o suponemos que sabemos cul es la des-

viacin estndar de la poblacin, utilizamos Z.
(X-) 132 -117
Z = = = 3.75
/ n 20/ 25
Z = 3.75 est situado en la regin de rechazo.
La representacin grfica en la campana de Gauss sera la siguiente:

Regin Crtica
Cuando uso la tabla de
Z, la Z calculada est
ubicada en la zona de
rechazo.
= 0.05
/2 = 0.025 /2 = 0.025
-1.96 0 +1.96
Rechazo la H0 0.095 Rechazo la H0
No logro rechazar la H0
Conclusin: Rechazamos la hiptesis nula de que esta muestra fue to-

mada de una poblacin de adultos sin riesgo cardiovascular cuyo pro-
medio es 117.
El valor de p = p (Z < -3.75) + p (Z > +3.75) es menor de 0.001.

Este valor de p < 0.001 significa que en menos de 1 de 1 000 opciones
habramos observado una muestra de adultos sin riesgo cardiovascular
con un promedio de 132 mg/dl, si el promedio verdadero de la pobla-
cin fuera 117 mg/dl
Cundo usar una o las dos colas de la distribucin?

Hagmonos esta pregunta: Si sabemos que la poblacin tiene un pro-
medio de 117 mg/dl, Por qu usar las dos colas de la distribucin? La
respuesta es que aunque lo suponemos, en realidad no sabemos que
117 sea el promedio; ese nmero lo tomamos de la literatura mdica
para ayudarnos en nuestros clculos. Usamos las dos colas habiendo
escogido un colesterol de 117 mg/dl como si fuera el peso de la pobla-
cin, porque esta era nuestra hiptesis, basada en realidades que supo-
nemos pero que no conocemos, es decir hiptesis, no certezas.
Una cola
Caso contrario sera si tomramos la muestra de una poblacin de adultos
diabticos.
En esta situacin podramos usar solo una cola de la distribucin con

ms seguridad porque podemos estar razonablemente seguros de que
estos adultos no pueden caer en la parte de la cola de la izquierda, la del
colesterol ms bajo, porque en general las personas con diabetes tienen
niveles de colesterol ms altos. En estas circunstancias, estaramos dis-
puestos a hacer nuestra apuesta con nicamente la parte mayor de la
distribucin, e incluir en el anlisis solo la cola de la derecha, porque de
ninguna manera el promedio de pesos de los diabticos va a estar en la
parte inferior de la poblacin adulta normal.
De nuevo, en el ejemplo que sigue, si no sabemos cul es el promedio

de la poblacin , menos podramos saber su desviacin estndar .
Cuando no conocemos el promedio o la desviacin estndar de la po-

blacin, podemos usar como la mejor alternativa la desviacin estndar
de la muestra.
H0 dice que = 117mg/dl
Supongamos que S = 22 mg/dl
Estadstico del test:
Recordemos que cuando n es grande, t tiende a parecerse a Z.
Calculemos t por disciplina, pues no conocemos la verdadera desvia-

cin estndar de la poblacin:
- 0 (132-117)
Entonces, t = = = 3.40
S/ n 22/ 25
Si n = 25, los grados de libertad gl sern 24.
En el ejemplo anterior, en la tabla de t, el valor correspondiente de p

para t de 3.40
es p < 0.005.
Interpretacin: Eso significa que solamente 5 de 1 000 veces en que lo

hagamos obtendramos una muestra cuyo promedio es de 132 mg/dl,
si el verdadero promedio de la poblacin es 117 g.
Conclusin: Basados en nuestros datos es poco probable que hubira-

mos tomado la muestra de una poblacin de adultos cuyo promedio de
colesterol hubiera sido de 117 mg/dl. Dicho de otra manera, basados
en nuestros datos parece que tomamos la muestra de una poblacin de
adultos que tiene colesterol ms alto que los adultos sin riesgo cardio-
vascular.
Inferencias. Tercer paso

Haga otra pausa y d el tercer paso.
Comparacin de promedios entre dos grupos
En el captulo anterior vimos la manera de calcular los estadsticos de

un promedio y de una proporcin.
En el presente captulo veremos cmo se hace la comparacin de los

promedios entre dos grupos, en dos circunstancias diferentes:
a) Cuando se trata de grupos independientes.
b) Cuando se trata de grupos relacionados o apareados
(crossmatched pairs).
Para entrar en el tema, retomemos el ejemplo de los datos de colesterol

de la muestra de 25 adultos.
Al calcularlo con cualquier programa estadstico obtenemos que con

los datos de EE = 4.4 (22/25) y promedio de 132 obtenemos un IC
95% (123, 140). Dicho IC no contiene el colesterol de 117 mg/dl que
le habamos asignado al promedio de la H0.
Al manipular el programa llegamos a la misma conclusin de rechazar

la hiptesis nula con las p, con los IC y con el estadstico de t. Haba-
mos dicho que la t = 3.40 caa en la regin de rechazo, que a dicha t le
corresponda una p < 0.005 que habamos interpretado como tener un
chance de 5 en 1 000 de observar este valor de 117, y habamos recha-
zado, por lo tanto, la H0 para la poblacin de adultos sin riesgo cardio-
vascular. Si todos estos datos no coinciden y nos llevan a conclusiones
similares, algo anda mal.
Llevemos esto a otro nivel.
Cuando tenemos dos grupos, se trata de:
Calcular el estadstico de la prueba de la hiptesis segn el

cual:
(H0: 1- 2 = 0), que se expresa verbalmente como: la Hiptesis

Nula dice que la verdadera diferencia entre los promedios de dos po-
blaciones es igual a cero.
Calcular el IC 95% para la verdadera diferencia entre dos prome-

dios poblacionales, por ejemplo del tratamiento A y del tratamien-
to B.
Origen del nombre de la Hiptesis Nula.
El verdadero origen del nombre de la Hiptesis Nula surgi del razo-

namiento hecho para calcular este estadstico de la diferencia entre
dos promedios, segn el cual la hiptesis que queremos poner a prueba
afirma que no existen diferencias entre los promedios de dos poblacio-
nes independientes. Esa diferencia es cero. En ingls, Null significa nulo,
invlido, cero, de la misma manera que en espaol.
Los pasos que se siguieron en los clculos de promedios y propor-

ciones del captulo anterior siguen el mismo esquema que se usar en
la comparacin de promedios, que tambin se repetir en el captulo
siguiente, en la comparacin de proporciones.
En la comparacin de promedios entre dos grupos:
Se calcula un estadstico.
Se plantea la Hiptesis Nula
(H0 1-2 = 0)
Esto significa que la H0 la hiptesis que queremos poner a prueba

plantea que la diferencia entre los promedios de dos poblaciones es
igual a cero. Expresado de otra manera, que los promedios de las dos
poblaciones son iguales.
Se calcula el IC de 95% para la verdadera diferencia entre dos pro-

medios poblacionales.
Se usa la prueba de Z cuando se conocen las varianzas de las poblacio-

nes (universos) de ambos grupos.
Se usa la prueba t cuando las varianzas de las poblaciones (universos)

se desconocen.
En la prctica, en la mayora de los casos se usa la prueba t de Student

porque, por lo general, no se conocen las varianzas verdaderas 2 ni las
desviaciones estndar de las poblaciones.
En general, se dice que:

Estadstico de la muestra - El valor hipottico planteado
El Estadstico t =
Error Estndar del Estadstico de la muestra
Por lo tanto, para calcular el estadstico t necesitamos saber:

El estadstico calculado de la muestra.
El valor hipottico propuesto para el parmetro de la poblacin.
El error estndar de la muestra.
Ejemplo de comparacin de promedios de dos grupos indepen-
dientes:
Gaede y col. (2003): Multifactor intervention and cardiovascular di-

sease in patients with type 2 Diabetes, NEJM (adaptado para nuestros
propsitos).
Los autores de este artculo llevaron a cabo un ensayo clnico con asig-
nacin al azar de los tratamientos, para evaluar el efecto de una in-
tervencin en pacientes con diabetes en la enfermedad cardiovascular.
La intervencin consista en: 1) reduccin del consumo de grasa , 2)
ejercicio moderado al menos 30 minutos 5 veces por semana, 3) charlas
para dejar de fumar 4) medicamento antihipertensivo, 5) suplemento de
vitaminas y 6) aspirina. Sesenta y tres pacientes recibieron esta inter-
vencin y fueron comparados con otros 63 individuos que recibieron
el tratamiento convencional. Los pacientes fueron seguidos por 7 aos,
luego de los cuales se compar la reduccin en niveles de colesterol,
peso, presin arterial, consumo de grasas, actividad fsica y el riesgo de
enfermedad cardiovascular. Al final de la intervencin, quienes recibie-
ron terapia intensiva tuvieron promedios ms bajos de presin sistlica,
presin diastlica y colesterol. Los datos de cambio en colesterol son
los siguientes:
El grupo de intervencin convencional, al final de sta, tuvo un prome-

dio de colesterol de 216 mg/dl, mientras que el grupo con terapia in-
tensiva tuvo un colesterol de 159 mg/dl. La pregunta que nos hacemos

es si estos promedios son iguales. A simple vista, la respuesta sera no.
Evaluemos la hiptesis nula de que s lo son.
Los investigadores tambin evaluaron el efecto en las lipoprotenas de

alta densidad. En el grupo convencional al final del tratamiento tuvie-
ron un promedio de 45, y las de terapia intensiva de 47. Evaluemos la
hiptesis nula de que son iguales.
Vamos a llamar XA al promedio en los de intervencin convencional, y

XB a los intervenidos con terapia intensiva:
XA es = 216 y XB es = 150
Los errores estndar obtenidos en el estudio fueron:
SA ~50 y SB ~ 34
Y expresamos:
La diferencia de los promedios de los puntajes entre la intervencin A y

la intervencin B fue de -47. Ahora nos hacemos la pregunta: Es esta
diferencia mayor de la que hubiramos podido encontrar nicamente
como resultado del azar?
Probamos el estadstico con la prueba t:

(XA- XB - 0)
T= ==-
SA2 SB2
+
nA nB
= 216-150-0/ (50)2/63 + (34) 2/63

= 66/ 39.7 + 18.3
= 66 /7.61
= 8.67
Ahora debemos tomar una decisin estadstica:
Podemos ver si este valor de t en la tabla cae en la regin de
rechazo de la hiptesis nula, o
Podemos calcular el valor de p, o
Podemos calcular los IC.
El estadstico de la prueba dio:
T = 8.67
Los grados de libertad:

gl = (nA-1) + (nB -1)
gl = (63-1) + (63-1) = 124
Comparamos con el estadstico t de la tabla t (la tabla de t llega en sus

mayora de casos hasta 120, aqu le ponemos el valor correspondiente a
120, lo ms cerca de 124, consulte la tabla completa en Internet).
df 0.05 0.025 0.01

2 2.92 4.3027 6.2054
3 2.3534 3.1824 4.1765
n
120 1.658 1.980 2.35
Con 124 grados de libertad:

0.05
= = 1.98 -1.98 < 8.67 Se rechaza la H0
2
Si empleramos la campana de Gauss con la representacin de las reas
de rechazo o no rechazo.
Al caer en -1.98 en
la regin de rechazo,
rechazamos la H0
0.025 0.025
-1.98 -1.96 0 +1.96
Los datos para lipoprotenas de alta densidad son los siguientes:
XA es = 45y XB es = 47
SA ~12 y SB ~ 16
Probamos el estadstico con la prueba t:

(XA- XB -0)
T= ==-
SA2 SB2
+
nA nB
= 45-47-0/ (12)2/63 + (16) 2/63

= 2/ 2.28 + 4.06
= 2 /2.51
= 0.79
Con 124 grados de libertad:
0.05
= = 1.98 -1.98> 0.79 No se rechaza la H0
2
Fallar en rechazar la H0 en este caso significa que no hay diferencia en-

tre uno y otro tratamiento, o entre el tratamiento y el placebo.
Y tambin podemos hacerlo con los IC.
Aqu diramos:
Con el IC del 95%

SA2 SB2
(XA-XB) Tabla t con 124 grados de libertad 2 colas de 0.05 +
nA nB
2 1.98 *2.46= 2 4.87= -2.87; 4.87
Los valores entre los dos lmites incluyen el valor de cero
Nota:
En los anteriores clculos el error estndar de la diferencia se calcula

con la siguiente frmula, cuando los tamaos de muestra son iguales en
los dos grupos que se comparan:
SA2 SB2
+
nA nB
Cuando los tamaos de muestra de los dos grupos difieren, el denomi-

nador de la prueba t toma la siguiente forma:
(nA -1)* SA2 + (nB -1)* SB2

----* (1/ nA + 1/ nB)
nA + nB -2
Primero se resuelve la multiplicacin (*) y luego, al valor, se le saca la

raz cuadrada.
Comparacin de promedios con grupos apareados

(Pairmatched data)
Aqu se trata no de dos muestras independientes, como en el caso ante-
rior, sino de dos muestras correlacionadas, es decir, son observaciones
relacionadas o apareadas, del tipo que se encuentran cuando el diseo
incluye antes y despus. Como cuando uno se sirve a s mismo como su
propio control en un experimento en el cual primero toma una droga
y despus otra, o un placebo, para ver los resultados. En este caso, se
pueden considerar como si se tratara de una simple muestra tomada al
azar de una poblacin distribuida normalmente de las diferencias entre
observaciones apareadas.
De nuevo los pasos son iguales, y el ejemplo parecido al de muestras no

pareadas (ejemplo adaptado del libro de Daniel).
Supongamos que en vez de comparar a los pacientes que reciben una

intervencin intensiva para disminuir el colesterol, con individuos que
reciben una terapia convencional (entonces se trataba de grupos in-
dependientes), en esta ocasin tomamos solo 12 sujetos, durante dos
meses no les damos nada y luego les aplicamos la terapia intensiva por
dos meses ms. Aqu no tenemos pacientes diferentes asignados a cada
tratamiento, sino 12 pacientes en total pero cada uno es comparado
consigo mismo; es decir, cada individuo se sirve a s mismo como con-
trol, lo cual es clsico en los estudios de entrecruzamiento.
Promedio de colesterol Promedio de colesterol Diferencia d

durante los dos meses durante los dos meses (antes y despus)
que no recibieron trata- que recibieron terapia
miento intensiva
1 201 1 200 -1
2 231 2 236 +5
3 221 3 216 -5
4 260 4 233 -27
5 228 5 224 -4
6 237 6 216 -21
7 326 7 296 -30
8 235 8 195 -40
9 240 9 207 -33
10 267 10 247 -20
11 284 11 210 -74
12 201 12 209 +8
En el diseo de entrecruzamiento los clculos se hacen de la siguiente

manera: (la d se refiere a diferencia)
( - d )
t=
Sd
n
t = Se incluyen aqu las cifras correspondientes. Si mira con atencin
ver que si d es 0, todo se reduce a un test para una muestra. Solo que
aqu se trata de una muestra de las diferencias en vez de tratarse de una
muestra de las observaciones.
Aqu, como en el caso anterior, se puede:

Tomar una decisin basndose en el estadstico.
Tomar una decisin basndose en el valor de p.
Tomar una decisin basndose en el IC.
En el ejemplo anterior,
es: -20.17= -1 +5 +(-5) +(-27)/12
Y la desviacin estndar es de 23.13; calculada igual que el recuadro de

la pgina XXX = (-1 - (-20.17))2 + (5-20.17)2+ (-5-(-20.17))2/
12-1; y luego la raz cuadadra de lo que le dio de donde:
n = 12, nmero de pares
En nuestro ejemplo,
t= -20.17/ (23.13/12)= -3.02
El rea de rechazo de nuestra Ho es -2.20, grados de libertad n-1 =

12-1 como -3.02 es menor que -2.20, rechazamos la hiptesis nula
de que los promedios de colesterol son iguales antes y despus de la
terapia intensiva, y que por lo tanto la terapia intensiva disminuye el
colesterol srico en el grupo de pacientes estudiados.
df 0.1 0.05 0.025 0.01

2 2.92 4.3027 6.2054 9.925
3 2.3534 3.1824 4.1765 5.8408
4 2.1318 2.7765 3.4954 4.6041
5 2.015 2.5706 3.1634 4.0321
6 1.9432 2.4469 2.9687 3.7074
7 1.8946 2.3646 2.8412 3.4995
8 1.8595 2.306 2.7515 3.3554
9 1.8331 2.2622 2.685 3.2498
10 1.8125 2.2281 2.6338 3.1693
11 1.7959 2.201 2.5931 3.1058
Aqu tambin se pueden hacer, como en la ocasin anterior, los dibujos

de la campana de Gauss para entender las reas de rechazo o no recha-
zo en donde caen nuestros valores.
Todava no nos hemos metido con estos nmeros tan pequeos de

estos ejemplos con el tema del tamao de la muestra.
En el siguiente captulo veremos cmo se hacen las comparaciones no

de los promedios sino de las proporciones entre dos grupos, y presenta-
remos la prueba del Chi2, que tanto atormenta a quienes comienzan a
navegar por primera vez en estas aguas.
Volveremos de nuevo al cuadro de cuatro casillas.
Y luego de dar un esbozo a la manera de tratar las comparaciones entre

ms de dos grupos, discutiremos ahora s algo sobre el tamao de
la muestra y el poder.
Pruebas no paramtricas
Ahora que hemos mencionado la prueba del Chi2 una prueba no
paramtrica haremos una pausa mayor antes de dar el cuarto paso.
Durante dicha pausa hablaremos someramente de las pruebas no pa-
ramtricas.
Con frecuencia, los fenmenos estudiados no toman la distribucin

normal y es evidente que se necesitan procedimientos estadsticos que
nos permitan procesar datos imperfectos, o de muestras pequeas, o
de aquellos con variables cuya distribucin desconocemos.
Las pruebas no paramtricas tienen, sobre las paramtricas, la venta-

ja de que se pueden usar cuando los datos experimentales solamente
pueden ser medidos a nivel ordinal, es decir, cuando slo se pueden
establecer rangos en orden de magnitud.
Contrario a los modelos paramtricos vistos a lo largo de este libro,

en los modelos no paramtricos no se especifica la estructura de ante-
mano, por el contrario, sta se determina por los datos; es decir, no se
hacen presunciones previas sobre las probabilidades de distribucin de
las variables valoradas.
A los mtodos NO paramtricos tambin podramos llamarlos mto-

dos libres de parmetros o de distribucin libre, son los que se usan
cuando los datos no son normales, en otras palabras, cuando no cum-
plen con los parmetros mencionados en el Teorema del lmite central.
Lo dicho no implica que estos modelos carecen por completo de pa-
rmetros sino que su nmero y naturaleza no se fijan de antemano y
son flexibles. Ello conlleva un precio: Comparativamente con los test
paramtricos, los no paramtricos tienen menos poder y, por ende, re-
quieren muestras de mayor tamao.
Mencionamos aqu algunos de los test no paramtricos ms conocidos,

solo con el propsito de que usted se d una idea de dnde ubicarlos.
A excepcin de la prueba del Chi cuadrado (2), ellos y las matemticas
subyacentes estn ms all del propsito de este libro, pero se los va a
encontrar con frecuencia en la literatura cientfica y en los programas
estadsticos ms comunes.
Test de Chi cuadrado (2). La prueba del Chi cuadrado es apro-

piada cuando los datos que se obtienen en un experimento son de
valor nominal, lo cual significa que en lugar de medir los puntajes
de cada individuo participante en el experimento, slo es posible
asignar los individuos a una o ms categoras. Como usualmente
no es posible asignar los sujetos de un estudio a ms de una ca-
tegora, la prueba del Chi2 slo se puede usar cuando se asignan
sujetos de estudio diferentes a cada grupo. Cuando se use el test
del 2 se debe recordar que en los otros diseos experimentales
el investigador decide cuntos sujetos debe tener cada grupo, por
lo cual el nmero de puntajes resultantes en cada grupo est pre-
determinado. En el caso del Chi2, por el contrario, se somete a
prueba una hiptesis experimental que predice cuntos sujetos de
cada grupo caern dentro de ciertas categoras, as que esto no se
puede decidir anticipadamente. Por ello es necesario incluir bas-
tantes sujetos en el estudio (al menos 20) para garantizar que un
nmero suficiente de ellos sea asignado a cada categora.
Test de KolmorogovSmirnov (KS) es una prueba de la bondad

del ajuste, que se usa para determinar si dos distribuciones de pro-
babilidades difieren.
Kappa de Cohen es una medida estadstica de concordancia de

los puntajes de dos evaluadores que clasifican N tems dentro de
C categoras mutuamente excluyentes. Los valores de Kappa me-
nores de 0 significan que no hay acuerdo, y los valores entre 0 y 1

indican acuerdo cada vez mayor a medida que se acercan a 1.
Test de MannWhitney, o test de suma de rangos de Wilcoxon, o

Test de Mann Whitney Wilcoxon es un test que se usa para saber
si dos muestras de observaciones provienen de la misma distribu-
cin.
Test de Kruskall Wallis, o de anlisis de varianza de una va o por

rangos, es una prueba usada para comprobar la igualdad de media-
nas entre grupos.
Coeficiente de correlacin de rango de Spearman Rho es una

prueba para valorar qu tan bien describe una funcin monotni-
ca la relacin existente entre dos variables, sin hacer presunciones
sobre la distribucin de frecuencia de stas.
Test de SiegelTukey es una prueba que se le aplica a dos grupos

de datos de los cuales, por lo menos uno, se mide en la escala or-
dinal. Se usa para determinar si uno de esos dos grupos tiende a
tener ms valores extremos que el otro, tanto en la cabeza como
en la cola de la distribucin.
John Tukey ( 19152000)

Fue un estadstico norteamericano del siglo pasado, muy conocido por
haber contribuido con los esquemas de las cajas y los bigotes, y otros
mtodos como los troncos y las hojas, ampliamente usados en estads-
tica descriptiva para el anlisis exploratorio de los datos.
Test de Wald Wolfowitz. Se usa para probar la hiptesis segn la

cual los elementes de una secuencia son mutuamente indepen-
dientes.
Inferencias. Cuarto paso

Comparacin de Proporciones de dos grupos.
Introduccin al uso del Chi2
En los pasos anteriores hemos visto cmo se calculan los estadsticos
de un promedio y de una proporcin; luego vimos cmo se comparan
los promedios de dos grupos cuando son independientes y cuando no
lo son.
En este captulo haremos comparacin de las proporciones entre dos

grupos. Explicaremos el origen del Chi2 y para hacerlo volveremos a
recurrir a la poderossima herramienta del cuadro de cuatro casillas, o
tabla de 2 x 2.
De qu trata el captulo:
De comparar dos grupos con resultados dicotmicos.

De cmo usar el cuadro de cuatro casillas (tabla de 2 x 2) para

hacer dicha comparacin.
De calcular el Chi2.
Pregunta inicial
Para comenzar, hagmonos una pregunta: Por qu al examinar dos
grupos, escogemos mirar las diferencias entre proporciones, en lugar
de examinar las diferencias entre sus promedios, si los promedios pro-
porcionan ms informacin?
Respuesta:
Es verdad que los promedios proporcionan ms informacin, pero no

siempre es posible calcularlos por carecer de toda la informacin ne-
cesaria para hacerlo; por ejemplo, al evaluar la efectividad de un trata-
miento quiz sea ms difcil obtener datos sobre el tiempo transcurrido
para saber si las personas respondieron o no a la terapia, que saber
simplemente si respondieron o no.
Al hacer comparacin entre las proporciones de dos grupos, nos inte-

resa saber si dos grupos son iguales o NO con relacin a alguna carac-
terstica o un resultado dicotmico.
Un resultado dicotmico es aquel que excluye otra probabilidad con la cual

se compara: Una persona est enferma o no lo est. En una prueba se
tiene xito o fracaso. Se es hombre o se es mujer.
Ejemplo:
A pesar de muchos esfuerzos y millonarias inversiones, la malaria sigue

siendo la enfermedad parasitaria ms importante y uno de los grandes
asesinos de la humanidad. El sufrimiento y las prdidas econmicas
que causa son enormes. Cada ao, ms de un milln de personas en
el mundo mueren como consecuencia de la malaria. Por otra parte, la
malaria es una enfermedad difcil de tratar, pues los parsitos mutan y
se vuelven resistentes a medicamentos a los que antes eran sensibles.
Muy preocupados con la resistencia a los medicamentos antimalricos,
durante los ltimos aos los laboratorios y gobiernos viven estudiando
alternativas. No siempre es fcil encontrarlas; por ejemplo, la mefloqui-
na es un medicamento muy poderoso para tratar malaria resistente. El
problema es que puede producir sntomas psiquitricos, como alucina-
ciones y ansiedad extrema, a quienes la consumen. Las alucinaciones
visuales producidas por la mefloquina han sido descritas por algunos
como delirios en tecnicolor. Por ello, un grupo de investigadores planea
un estudio para detectar la presencia de sntomas psiquitricos severos
en personas que toman mefloquina profilctica y ver si otro medica-
mento alternativo, la doxiciclina, produce o NO sntomas equivalentes.
Y como andamos en la bsqueda de drogas efectivas y no queremos
usarlas excesivamente, la comparamos con el antibitico, otra de las
propuestas del CDC. A este medicamento tambin lo evaluamos para
efectos colaterales similares a los evaluados con la mefloquina.
Obtenemos una tabla como la siguiente. Los nmeros son, todos, hi-
potticos.
Medicamento Sntomas psiquitricos severos Total Proporcin de

sintomticos
S No
Mefloquina 90 10 100 90/100 =
0.90
Doxiciclina 20 160 180 20/60 =
0.33
Total 110 170 280 110/280 =
0.39
Al mirar dicha tabla es obvio, con una sola mirada, que quienes to-
maron la mefloquina sufrieron sntomas psiquitricos colaterales con
mucha ms frecuencia que quienes tomaron el otro medicamento.
90 % de quienes tomaron mefloquina presentaron sntomas.
33.3 % de quienes tomaron doxiciclina presentaron sntomas.
La pregunta clave sobre esta tabla es: La diferencia que se encuentra

en las proporciones de quienes presentan sntomas psiquitricos seve-
ros con la mefloquina y quienes tomaron doxiciclina se debe al azar, o
no se debe al azar?
La diferencia absoluta entre unos y otros es de 90- 33 = 64.7 %
0.90 - 0.33
La diferencia relativa es = 1.72
0.33
1.72 x 100 = 172 nos dice que la mefloquina es 172% ms txica

en lo referente a sntomas psiquitricos que la doxiciclina.
Adems de la diferencia absoluta y la diferencia relativa, esta informa-
cin tambin se puede presentar como ODDS.
Los ODDS, en una situacin particular, representan el grado de pro-

babilidad de que algo suceder (o no suceder), por ejemplo, de que
alguien ser o no ser exitoso, especialmente cuando se habla de apues-
tas. Si uno le apuesta una corona a un caballo cuyos ODDS son de
10:1 (diez a uno) para ganar, usted recibe 10 diez coronas si su caballo
gana.
Los ODDS pueden ser a favor o en contra.
Si un caballo es favorito 3 a 1 para ganar una carrera, eso quiere decir

que tiene una posibilidad calculada de ganar de 0.75
3+1=4
4=1.0
3= 0.75
0.75
Los ODDS de que el caballo gane = --------------- = 3
(1- 0.75)
ODDS, como sucede al hablar de ODDS RATIO (OR) es una pala-
bra difcil de traducir con toda la sutileza y posibilidades que tiene el
trmino en ingls. Algunos traducen el OR, la medida que se usa para
hablar de riesgos en los estudios de CasosControles, como Razn de
Desigualdades. Estn en lo cierto al llamarla Razn o Relacin, pero no
creo que se hagan entender mejor. Como no lo harn quienes llamen al
OR Razn de Momios o cualquiera de los tantos nombres usados para
definirlo, pues siempre terminan aclarando que se trata de los OR.
En el ejemplo de los medicamentos antimalricos, la definicin de

ODDS para tener complicaciones psiquitricas con la mefloquina o
con la doxiciclina se expresan as:
Probabilidad de tener sntomas psiquitricos

ODSS=
Probabilidad de no tenerlos
90
-------------
100 0.9
ODDS mefloquina = = = 9
10 0.1
--------
100
Los ODDS de tener sntomas psiquitricos con doxiciclina:
20
-----------
180 0.1

ODDS doxiciclina = -------------------- = ------------ = 0.1
160 0.9
-----------
180

9
Los ODDS de complicaciones entre mefloquina y doxiciclina = ------- = 90
0.1
Los ODDS de que la mefloquina cause sntomas psiquitricos son 90

veces mayores que con doxiciclina.
Hagmonos de nuevo la pregunta, al comparar los dos medicamentos:
La diferencia en las proporciones de personas con sntomas psiquitri-

cos, entre quienes tomaron mefloquina y quienes tomaron doxiciclina,
es mayor de lo que podramos esperar solamente a causa del azar?
Uso del Chi cuadrado (2)

Para explicarle el uso del Estadstico Chi, permtanos llevarlo a travs
de algunos pasos. Le proponemos inicialmente mirar solo los totales
marginales fijos del cuadro anterior, es decir, al cuadro de cuatro casillas
le faltan los valores internos identificados:
Medicamento Sntomas psiquitricos severos Total

S No
Mefloquina 100
Doxiciclina 180
Total 110 170 280
Comparacin de los dos grupos si las respuestas a los me-

dicamentos fueran iguales:
Supongamos que el 39% de quienes reciben mefloquina y 39% de quie-
nes reciben doxiciclina presentan los sntomas estudiados. Esa fue la
proporcin de sintomticos que nos dio el total marginal fijo de la parte
inferior cuando lo calculamos y ella nos permite hacer la pregunta:
Qu frecuencias esperaramos si el nmero de pacientes con sntomas

psiquitricos fuera el mismo con un medicamento o con el otro?
Frecuencias de sntomas psiquitricos severos esperados si la respuesta

fuera la misma con ambos tratamientos:

S No
Mefloquina 0.39 (100)=39 100
Doxiciclina 0.39 (180)=70.2 180
Total 109.2 280
Las columnas de quienes no presentan sntomas severos se llenan con

las diferencias resultantes de quitarle a los totales de la derecha la cifra
que supusimos en la columna de la izquierda si la respuesta fuera la
misma.
As obtenemos la tabla con las cifras esperadas si nuestra suposicin

se cumple:

S No
Mefloquina 39 61 100
Doxiciclina 70.2 109.8 180
Total 109.2 170.8 280
Cmo se comparan estos resultados con los que habamos observa-

do? La respuesta a esta pregunta es la base para la construccin de la
frmula del Chi2.
Comparemos las tablas con los conteos de los observados y los espe-
rados:
Conteo de los OBSERVADOS Conteo de los ESPERADOS
Tratamiento S No Total Tratamiento S No Total
Mefloquina 90 10 100 Mefloquina 39 61 100
Doxiciclina 20 160 180 Doxiciclina 70.2 109.8 180
Total 110 170 280 Total 109.2 170.8 280
Estas tablas son diferentes. Entre los casos observados hay muchos
ms pacientes con sntomas entre los que toman mefloquina que entre
los que toman doxiclina.
Papel del estadstico Chi2 (2)

Lo que el estadstico Chi2 hace es comparar los conteos de lo observado
contra los de lo esperado. Este clculo se hace para cada una de las celdas k
del cuadro de cuatro casillas.
Para hacer estos clculos se emplean las frecuencias expresadas como

nmeros absolutos y no las proporciones:
(O-E1)2
2 = k [ ]
E
Si lo observado fuera igual a lo esperado, O-E sera igual a cero (0)

y el Chi2 sera igual a cero (0).
Si lo observado es mayor que lo esperado, el numerador aumenta

y el Chi2 aumenta.
El estadstico de la prueba de Chi2 es til como prueba de la in-

dependencia (la carencia de asociacin, la carencia de homogenei-
dad).
El estadstico pone a prueba la H0 que dice que las muestras se

extraen de poblaciones homogneas.
El estadstico de la prueba de Chi2 toma una distribucin de

Chi2.
Si usted mira la familia de las distribuciones, ver que la forma que

tome la distribucin de Chi2 depende de los grados de libertad.
Cmo se hace el clculo en s

Entonces, para el clculo del estadstico de Chi2
En la frmula, r significa lneas o hileras (por la letra r usada en la fr-

mula inglesa donde r significa row). Al igual que lo hicimos en el caso de
t o de Z, al hablar de grados de libertad, el estadstico de Chi2 tambin
consulta su propia tabla de Chi, de la que toma un valor u otro segn los
grados de libertad.
La frmula quiere decir que para hacer la sumatoria se tiene en cuenta

uno a uno lo observado menos lo esperado de cada una de las casillas,
en este caso cuatro, de ambos cuadros: el de lo observado y el de lo
esperado.

a b
Recuerde el cuadro
de cuatro casillas
para calcular el Chi2 c d
a= b=
90.50 10.50
c= d=
20.90 160.90
(90- 50)2 (10 50)2 (20- 90)2 (160-90)2

= +
2
+ +
50 50 90 90
1600 1600 1600 1600

2 = + + + = 172.8
50 50 90 90
2 = 172.8 con 1 grado de libertad.
(El grado de libertad se calcul del nmero de filas del cuadro r menos
1 multiplicado por el nmero de filas menos 1).
El resultado que se obtuvo de Chi2 no est cerca de cero.

Nos preguntamos ahora: Qu tan probable es que dicho resultado se

haya debido solamente al azar?
Por ahora no respondamos la pregunta, hasta no mirar las grficas de

las distribuciones de Chi2.
Variables de Chi2 con valores de k pro-
gresivamente mayores son cada vez ms
asimtricas
k=4
k=3
k=2
k=1
1
X2
En las tablas de contingencia para los clculos de Chi2, los grados de

libertad se calculan as:
Grados de libertad = (hileras -1) x (columnas -1)
Por tratarse de un cuadro de cuatro casillas, donde:
Grados de libertad = (2-1) x (2-1) = 1
Slo nos preocuparemos con 1 grado de libertad. Esta maniobra nos
permite tomar un atajo para calcular la frmula de Chi2.
k (ad-bc)2
=
2
(a+c) (b+d) (a+b) (c+d)
Al igual que en los casos de las distribuciones Z y t, anteriormente

vistas, hay tablas especiales de Chi2 para ver qu valor corresponde en
dicha tabla cuando p = 0.05
El punto clave de la estadstica de Chi2 es ver cunta discrepancia hay

entre lo observado y lo esperado. Cuando hay poca discrepancia, el
Chi2 toma valores cercanos a cero (0). Cuando hay discrepancia, el va-
lor de Chi aumenta.
Hoy todos los programas estadsticos disponibles (STATA, EPIINFO,

SPS, etc.) le hacen estos clculos sin que usted tenga que recurrir a las
tablas, pero el conocimiento de los razonamientos usados para lograrlas
le ayudar a saber cmo interpretar los resultados y cual test escoger.
Ya dijimos antes que el Chi2 no se usa solamente para el cuadro de cua-

tro casillas, tambin se podra usar cuando hay ms hileras y columnas,
como se ver en el captulo en que se analizan los pasos para comparar
tres o ms grupos pareados o no pareados.
En el caso de las cuatro casillas existen otros test, adems del Chi2,
algunos de ellos ya los vimos:
Test de Z de la diferencia de las proporciones entre dos grupos.
La prueba exacta de Fisher.
El IC para la verdadera diferencia de las proporciones entre dos
grupos.
El OR e IC.
El Estadstico de MantelHaenzel.
El Estadstico de MantelHaenzel se usa para la combinacin de resul-

tados de mltiples tablas de 2 x 2, por ejemplo, cuando se compara la
frecuencia de consumo de alcohol en adolescentes hombres y mujeres
de varias ciudades.
Todos ellos prueban las diferencias entre dos grupos para responder las
mismas preguntas:
Con relacin a la caracterstica, son los grupos homogneos o
no lo son?
Hay alguna asociacin entre grupos y caractersticas?
El grupo y las caractersticas se estudian independientes?
A no ser que vaya a profundizar en los temas epidemiolgicos y bioes-
tadsticas, esto es todo lo que necesita saber en este nivel. Esperamos
que haya perdido el susto heredado que estos trminos todava les cau-
san a algunos.
Inferencias. Quinto paso

Comparaciones de 3 o ms grupos. Anlisis de Varianza
(ANOVA)
En el captulo anterior hicimos el razonamiento sobre cmo se compa-
ran promedios y proporciones entre dos grupos.
En este captulo veremos cmo se comparan tres o ms grupos en dos

circunstancias:
Cuando se comparan promedios en datos continuos.
Cuando se comparan distribuciones.
Cuando se comparan promedios entre tres o ms grupos de datos con-

tinuos usamos ANOVA. Cuando se comparan distribuciones usamos
el estadstico de Chi2.
Comparacin de ms de tres grupos cuando se tienen
datos continuos:
En este caso usamos el anlisis de varianza, tambin llamado ANO-
VA.
Anlisis de varianza (ANOVA)

El anlisis de varianza ANOVA es un mtodo para poner a prueba la
Hiptesis Nula H0 de que todos los promedios de varias poblaciones
son iguales. La HA dice que s hay diferencias entre por lo menos dos
de los promedios de tres o ms grupos analizados.
Estos son entonces los pasos que se siguen durante el anlisis de va-
rianza:
Se pone a prueba la H0 de que todos los promedios de las pobla-

ciones estudiadas son iguales: 1 = 2 = 3 = k, donde k es el
nmero de poblaciones. En el razonamiento de ANOVA se asu-
me que la HA dira que por lo menos un promedio de ellos j es
diferente. Se trata de una tcnica de comparacin de mltiples
promedios mediante el posicionamiento de la variacin total en un
conjunto de datos en componentes definidos segn sus fuentes especficas.
Se asume que las observaciones son independientes y que las va-

rianzas dentro de cada grupo son iguales.
El anlisis de varianza es, realmente, una prueba global de si hay dife-

rencias entre los promedios de varios grupos:
Dicho anlisis se hace en dos grandes pasos:
Primero, se hace una prueba global mediante el test F.
Luego, solo de ser necesario, se hace el test de comparaciones pa-

readas entre los diversos grupos.
Manera de proceder:
Si el resultado de nuestro test global F nos dice que NO hay dife-

rencias estadsticamente significativas, entonces concluimos que
no podemos rechazar la H0 (parece ser verdadera) y todos los
promedios deben ser iguales.
Si el resultado de la prueba global mediante el test F es estadsti-

camente significativo, entonces se llevan a cabo comparaciones
individuales pareadas entre los grupos.
Las comparaciones pareadas de los grupos se llevan a cabo usando

mltiples procedimientos de comparacin.
Para hacer el test F:
Distinguimos que la variacin total tiene dos componentes: la va-

riacin entre los grupos + la variacin dentro de los grupos.
Estimativo de varianza basado en las diferencias entre los grupos
Estadstico F =
Estimativo de la varianza basado en las diferencias dentro de los grupos
Para ello se toman tanto el promedio al cuadrado de las diferencias

dentro de los grupos como el promedio al cuadrado de las diferencias
entre los grupos.
XE2
La Prueba F =
XD2
Segn el resultado que se obtenga de F, se toma una decisin estads-

tica:
- Un valor de F cercano a 1 indica que la variabilidad es similar tanto

entre los grupos como dentro de ellos. Por lo cual NO podemos
rechazar la H0. En ese caso nos detenemos porque no hay necesi-
dad de hacer nada ms.
- Un Estadstico F grande indica que hay ms variabilidad entre los

grupos que dentro de los grupos. En este caso se rechaza la H0 y
se concluye que por lo menos el promedio de uno de los grupos
es diferente. Si esa es la situacin, se lleva a cabo una prueba de
comparaciones mltiples, de las cuales existen varios modelos en
la estadstica.
La prueba F
En el procedimiento de comparaciones mltiples, el estadstico F de

FisherSvedecor pone presente la existencia de diferencias significa-
tivas entre los diversos subgrupos en los cuales se han separado los
sujetos de un estudio, sobre la base de las categoras establecidas por la
variable o factor protector.
ANOVA se debe ver como una prueba estadstica global que analiza
toda la capacidad de variar que tiene la variable dependiente (de resulta-
do) en su conjunto. Lo que no dice es cul de los grupos es el diferente,
mayor o menor, y con respecto a cules de los restantes grupos.
Para ello usamos las pruebas de comparaciones mltiples, como la de

Bonferroni.
Pruebas de comparaciones mltiples

- Mencionamos algunas de ellas, solamente con el propsito edu
cativo de que sepa ubicarlas.
Prueba de las Comparaciones planeadas de Bonferroni.
Prueba de Comparacin Post Hoc.
Prueba de las Diferencias menos significativas.
Prueba de las Diferencias ms significativas.
Prueba de Dunnet.
Prueba de Duncan.
Prueba de Barlett para varianzas iguales.
Las pruebas de comparaciones mltiples tienen una misma forma de
razonar ante los datos:
Se hacen muchas comparaciones entre pares.

Se calcula la probabilidad de error tipo I = 0.05 para cada
prueba por separado.
Necesariamente, al hacer pruebas mltiples, se eleva por
encima de 0.05.
Ello se debe a que al hacer muchas comparaciones, es posible
que se encuentren valores de significancia solamente como
resultado del azar.
El procedimiento de las comparaciones mltiples le apunta a
preservar un nivel de alfa global.
La ms usada de ellas en los paquetes estadsticos es la prueba de

Bonferroni.
Inferencias. Sexto paso
Comparacin de distribuciones o resultados categricos
entre tres o ms grupos.
La manera de proceder es diferente cuando se comparan ya no datos

continuos sino resultados categricos entre 3 o ms grupos.
Tanto cuando se hace comparacin de distribuciones de 3 o ms gru-

pos, como cuando se trata de:
a) Comparar resultados dicotmicos (SNo) entre varios grupos.
b) Comparar resultados ordinales (psimo, malo, regular, bueno, ex-

celente) entre varios grupos.
Recurrimos al el uso del Estadstico Chi2.
Pasos para la comparacin con los resultados categricos

Los pasos que se siguen con los resultados categricos son similares a
los que se siguieron cuando se hicieron comparaciones de promedios
de dos grupos, cuando se hicieron comparaciones de proporciones y
cuando se hicieron las mismas operaciones en ms de dos grupos.
Se pone a prueba la Hiptesis Nula; en este caso, que no hay aso-

ciacin entre los grupos comparados.
Se compara lo observado contra lo esperado en un cuadro de con-

tingencia que tendr, como es lgico, un nmero de filas y uno de
columnas que nos servirn para determinar los grados de liber-
tad.
Se hace el cmputo del Chi2.

Con la siguiente frmula:
- Donde E1 sera el nmero que esperaramos si NO hubiera asocia-

cin.
- k sera el nmero de celdas (casillas) en un cuadro de contingencia con

un nmero especfico r de lneas y c de columnas.
- Los grados de libertad seran (r-1) x (c-1).
Se rechaza la Hiptesis Nula (H0) si el estadstico 2 (Chi

cuadrado) es grande.
Miremos el siguiente cuadro de una variable dicotmica: ciclistas que

usan o no usan casco protector y el grado de severidad de las lesiones
craneanas sufridas en unos y en otros:
Severidad de la lesin craneana

Uso del Ninguno Leve Grave Muerte Total
casco (hospitalizacin Nmeros
protector y/o ciruga ) absolutos
S 89 200 30 10 329
NO 70 140 150 40 400
159 340 180 50 729
En las columnas se expresan los posibles resultados de un traumatismo

craneal como consecuencia de un accidente de bicicleta en usuarios y
no usuarios de cascos protectores. Pero de igual manera hubiramos
podido tener no varias posibilidades (aqu llamadas categoras) sino, en
su lugar, variables dicotmicas tales como lesionado o no lesionado;
vivomuerto; con edema cerebralsin edema; pacientes sometidos a
cirugapacientes sin ciruga).
Si se desea hacer comparaciones, los nmeros crudos de la tabla ante-

rior dan menos informacin si se usaran porcentajes de los resultados
segn hayan usado o no el casco protector.
Severidad de la lesin craneana
Uso del Ninguno Leve Grave Muerte Total
casco (hospitalizacin Nmeros
protector y/o ciruga ) absolutos
S 27% 60.7 % 9.1% 3.3% 100%
NO 17.5% 35% 37.5% 10% 100%
22.2 47.5 23.3 6.6 100%
Note que en la hilera inferior de los totales marginales fijos, al calcular

los porcentajes debo tomar el promedio de cada grado de severidad de
la lesin entre quienes usaron casco y quienes no lo hicieron.
El clculo del Chi2 de Pearson para 3 grados de libertad (Hileras: 2-1) x

(Columnas: 4-1) da un valor # (calcularlo).
Si tomo un valor de p = 0.025, el estadstico Chi2 de ese valor de p da

como resultado un nmero tal.
Conclusin: la conclusin ya la hubiramos podido sacar con la mira-

da de los nmeros crudos y, mejor an con los porcentajes. Con el Chi
comprobamos que quienes usan los cascos y quienes no los usan, no
sufren lesiones craneanas de la misma severidad. Los datos indican que
quienes usan los cascos tienen menos muertes y menos lesiones graves
que quienes no los usan.
El proceso de razonamiento estadstico para llegar a esa conclusin

debe ser ordenado y gradual. El valor de p sugiere que debemos re-
chazar la hiptesis nula que deca que no hay diferencia en las cifras de
muertos y lesiones severas entre quienes usan los cascos y quienes no
los usan.
Si miramos lo que vimos antes y lo de ahora:

El anlisis de varianza ANOVA proporciona una prueba de si los
promedios de mltiples grupos independientes son los mismos.
Prueba F.
Pruebas comparativas mltiples.
El estadstico de Chi2 proporciona una comparacin de resultados, ya
sean dicotmicos o categricos entre grupos.
Mire de nuevo la tabla anterior y notar que si observa solo las cifras to-
tales encontrar en la mitad derecha menos muertes y lesiones severas
entre quienes usan los cascos. Pero si mirara solo la mitad izquierda de
la tabla hay menos lesiones leves entre los que no lo usan porque pro-
porcionalmente se fueron a engrosar las filas de los ms severamente
afectados.
Para evitar tal perversin en la interpretacin de los nmeros, no deje

que estos decidan aisladamente por usted, cuando es usted quien debe
verbalizar la interpretacin de los hallazgos.
Aqu, amigo, hemos llegado juntos al final del camino de las inferen-
cias que, aunque azaroso, hemos atravesado juntos. Usted y nosotros
sentimos que nos merecemos una pausa y una cerveza. Esto, siempre y
cuando, sus creencias y su gusto se lo permitan.
18. Aplicaciones de las Herramientas

Estadsticas
Tamao de la muestra y poder

Entre los mltiples chistes de epidemilogos, quizs el ms clsico sea
el siguiente:
Cmo est su marido? le preguntan a una epidemiloga
Comparado con quin? responde esta.
Es decir: depende.
Qu tamao de muestra necesito para mi estudio? le pregunta

usted ingenuamente al epidemilogo detrs de cuya cara de bonachn
se esconde una serpiente venenosa.
Depende! le responde aquel. Usted se irrita de igual forma que

se frustra cuando al leer libros introductorios le dicen que ste no es el
nivel para hablar de tamao de muestra.
Trataremos de explicar en seguida por qu el chiste del depende del

epidemilogo no es solamente un chiste sino una postura epistemol-
gica y por qu al hablar del tamao de muestra tiene su mejor aplica-
cin. De igual forma, trataremos de hacerle ver algo de la complejidad
del razonamiento requerido para calcular tamaos de muestra adecua-
dos y con ello la razn por la cual los libros introductorios evitan el
tema al que aqu solo hemos podido llegar despus de plantearle, paso
a paso, los razonamientos previos necesarios para hablar del tamao de
la muestra.
Cuando usted va a comprar un carro, si el vendedor es honesto, le har

algunas preguntas bsicas:
Para qu lo quiere?
Qu grado de confiabilidad necesita?
Cunto est dispuesto a invertir? Lo cual depender de cunto
dinero tiene.
Hablando en serio: Para calcular el tamao de la muestra de un estudio,
usted y el epidemilogo se deben plantear, primero:
Para qu quiere el estudio, es decir, qu est esperando responder-

se con l.
Qu grado de confiabilidad necesita. Qu grado de finura y de pre-

cisin desea, qu poder estadstico y dentro de cules intervalos de
confianza. Todo lo cual ser distinto cuando se trate de investigar
aspectos de seguridad farmacolgica, que cuando se trata de hacer
asociaciones entre una noxa y una enfermedad.
Cunta plata tiene para su estudio y cunto tiempo, lo cual debe

quedar especificado en los protocolos de todo estudio, sin impor-
tar su diseo.
Con este prembulo, ahora s entremos en los clculos de los tamaos

de muestra.
Formas de calcular los tamaos de las muestras

Para comenzar, digamos que el tamao de la muestra se calcula antes
de recoger los datos y de hacerles los exmenes estadsticos. Es decir, el
tamao de la muestra es algo que se calcula a priori.
Y la manera de hacerlo variar si usted est calculando variables con-

tinuas o variables dicotmicas, y segn se trate de un grupo o de dos
grupos.
Existe una manera de calcular el tamao de muestra para un grupo

que vara cuando se trata de: a) poner a prueba una hiptesis, o b)
cuando lo que quiere es precisin, es decir, un intervalo de con-
fianza (IC) estrecho.
El clculo del tamao de muestra para dos grupos independientes depen-

der de si dicho clculo se hace para detectar diferencias entre
promedios o entre proporciones.
Clculo del tamao de la muestra para un grupo

Este clculo es distinto cuando se trata de:
a) Obtener precisin, o
b) Poner a prueba una hiptesis.
Precisin
Si lo que deseamos es obtener un IC de cierta amplitud (o de cierta
estrechez), es necesario que especifiquemos de antemano los siguientes
valores:
, es decir, el nivel de significancia que deseamos obtener, o en

otras palabras, la probabilidad de un Error Tipo I.
El ancho del intervalo deseado, es decir, la amplitud o estrechez

dentro de la cual queremos que caigan nuestros datos.
Un estimativo de la varianza o de la proporcin, ya sea una o la

otra.
Tamao de muestra de un grupo cuando queremos obte-

ner precisin y la variable es continua.
A la siguiente expresin: 1.96 / n la llamaremos d
Para una variable continua, el IC del 95% es:

IC : X 1.96 =Xd
n
1.962 2
n=
d2
- Es necesario especificar d (la mitad de la anchura del IC).
- Es necesario estimar 2.
Ejemplo
Veamos el siguiente ejemplo del clculo del tamao de la muestra de un

grupo para una variable continua:
A nuestro grupo de investigacin le interesa hacer un estimativo de la

edad promedio en que empieza a consumir alcohol una poblacin de
adolescentes de Bogot.
Digamos que queremos hacer un estimativo de la edad promedio den-

tro de un rango de 3 aos (IC 95% con una anchura de 6 aos) es
decir d= 3.
Supongamos que la desviacin estndar de la poblacin que nos inte-

resa es 10 aos.
Y antes de seguir, hagamos aqu un parntesis para explicar qu quere-

mos decir con el supongamos utilizado para la desviacin estndar.
Origen de la desviacin estndar propuesta arriba

De dnde pudimos obtener tal desviacin estndar que parece como
salida del sombrero de un mago? En realidad, uno nunca parte de la
nada. Y no hay tal sombrero de mago, pero en cambio s existe toda la
literatura disponible de estudios anteriores que se refieren al tema. A
esos estudios recurrimos para poder comenzar con el nuestro; es de-
cir, esta desviacin estndar la tomamos de un estudio previo o de un
estudio piloto. Si no disponemos ni de uno ni de otro, adivinamos. Se
trata de una adivinanza hecha por alguien que sabe del tema y supone
que sera as.
Entonces, necesitamos un tamao de muestra de:


1.96 2. 2 1.96 2 10 2
n = = = 42 pacientes.
d2 32
Clculo del Tamao de muestra cuando queremos

precisin de un grupo con resultados dicotmicos
Cuando tenemos resultados dicotmicos p y q, y el intervalo de con-
fianza es de 95%, el tamao de la muestra n se calcula de la siguiente
manera (recuerde que q es el complemento de p, o sea que (p + q) =
1).
.
1.96 = d
n

1.962 .
n=
d2
Necesitamos especificar d (la mitad del IC).

Necesitamos estimar p.
Ejemplo:
Digamos que estamos interesados en saber, dentro de un margen del

4%, cul es la proporcin de personas que usan casco para proteccin
de accidentes de bicicleta despus de tres aos de un programa que
promociona el uso de los mismos (IC del 95% anchura 8%). Recordar
ms adelante que d es cinco, un intervalo relativamente estrecho.
- Supongamos, en este caso, que el clculo (el estimativo) de p es 0.20

(lo suponemos basados en un reporte previo tomado de la literatura).

1.96 2 p.q 1.96 2 (0.20) (0.80)
n= = = 384 personas
d2 (0.04) 2
Si yo quisiera obtener una muestra dentro de un intervalo de confianza

mucho ms estrecho, digamos anchura de 2%, el tamao de la muestra
aumentara enormemente:

1.96 2 (0.20) (0.80)
n= = 1 536
(0.02) 2
Este segundo estudio me saldra muy caro y muy difcil de planear por-
que se trata de una muestra mucho ms grande.
De manera que cuando quiero una precisin mayor, al estrechar el IC

necesito aumentar el tamao de la muestra enormemente.
Lo opuesto tambin es verdad: Si no quiero una precisin tan grande y

aumento la anchura de mi intervalo de confianza, digamos a 8%.

1.96 2 (0.2) (0.8)
n= = 96
(0.08) 2
En este caso en que sacrifico la precisin, el tamao de muestra es mu-
cho menor que en los casos anteriores.
Pregunta: Cul es el tamao de muestra necesario para estimar la pro-

porcin de personas que no estarn usando todava el casco protector
si se desconoce el valor de p?
Por ejemplo, cuando no hay estudios previos publicados en la literatura

o no se ha hecho un estudio piloto que nos pudiera orientar, sera como
echar una moneda al aire.
En ese caso, en el numerador se le asignan valores iguales a p y a su

complemento q, es decir, 0.5 y 0.5.

1.96 2 (0.5) (0.5)
N= = 600
(0.04) 2
El clculo del tamao de la muestra siempre se trata de un negocio en

el cual hay que lograr un equilibrio de intereses entre la precisin que se
necesita, el nmero de pacientes esenciales para responder la pregunta,
y el costo requerido para reunir la informacin.
Clculo del tamao de la muestra para un grupo cuando se

trata de hacer prueba de una hiptesis
Para determinar el tamao de la muestra basado en la prueba de la hi-
ptesis, se requiere tener de antemano:
Un nivel de significancia, .
El poder estadstico (1) deseado.
Una diferencia clnica significativa entre la H0 y la HA.
Un estimativo de la varianza del grupo.
En este clculo la preocupacin se centra en el nivel de , es decir, la
probabilidad de un Error Tipo I. Tambin nos concierne saber cul es
el valor de , es decir la probabilidad del Error Tipo II; adems, querre-
mos saber cul es el Poder 1.
Recordemos aqu de nuevo unas definiciones fundamentales:
Error Tipo I = Rechazar la Hiptesis Nula, siendo esta verdadera.
() = La Probabilidad de un error Tipo I.

Error Tipo II = Aceptar (Fallar en rechazar) la Hiptesis Nula, sien-

do esta verdadera.
Beta () = La Probabilidad de un Error Tipo II.
Poder = 1 = La probabilidad de rechazar correctamente la H0
Una pregunta para que no se desconcentre: Record lo visto cuando

presentamos el uso del cuadro de cuatro casillas en la puesta a prueba
de la hiptesis, con respecto a que los razonamientos estadsticos se
hacen alrededor de la Hiptesis Nula (H0) solamente, es decir, en re-
chazarla o fallar en rechazarla, y no en la hiptesis alternativa?
Volvamos al clculo del tamao de muestra necesario para la puesta a

prueba de la hiptesis.
Est alerta porque aqu se introduce un nuevo trmino: Delta = ,y

tambin porque aqu el clculo se hace de manera diferente si se trata
de variables continuas o variables dicotmicas.
Cuando las variables son continuas, el razonamiento es de la siguiente

manera:
H0 dice que = 1
HA dice que = 2
Delta es la diferencia entre los valores propuestos = 1 2

(Z /2 + Z ) 2 2
n=
2
Cuando las variables son dicotmicas, en vez de sigma al cuadrado (la

varianza de la poblacin) usamos las alternativas p q.
El resumen de lo que hace con unas (continuas) u otras (dicotmicas)

est en el siguiente cuadro:
Resultado continuo:
H0 1 2 = 0
HA 1 2 =
Resultado dicotmico:
H0 p1- p2 =0
HA p1 - p2 =
Tamao de Muestra para dos grupos

El clculo del tamao de la muestra para dos grupos, uno centrado en
0 para la hiptesis nula, y otro centrado en , requiere escoger:
Un nivel de significancia .
Un poder estadstico 1.
Una diferencia clnicamente significativa entre los dos grupos,
delta , en la cual es necesario especificar qu se entiende por

diferencia clnicamente significativa.
Un estimativo de la varianza S2 de cada grupo.
De nuevo, en esta ocasin el tamao de la muestra se calcula de una
manera diferente cuando el resultado es continuo o cuando es dicot-
mico.
Cuando el resultado es continuo:
H0
12 = 0
HA 12 = (Diferencia clnicamente significativa)
Cuando el resultado es dicotmico:

H0 p1p2 = 0
H p1 p2 = .
Miremos su representacin grfica:
Recordemos la grfica inicial:

H0 HA
-Z alfa/2 0 +Z alfa/2
Posibilidad de cometer Error Tipo I sombreado de amarillo
Posibilidad de cometer Error Tipo II sombreado de azul
Posibilidad de cometer Error Tipo 1- sombreado de rosado
Ahora, hacemos notar delta .

H0 HA
-Z /2 0 +Z /2
Posibilidad de cometer Error Tipo 1- est sombreado en amarillo
Si realmente hubiera una diferencia, nos enfocamos en la parte del po-

der (1-) que expresa la probabilidad de no rechazar la H0 cuando no
es verdad.
El tamao de la muestra tendr que ver con lo que especifiquemos

como diferencia clnicamente significativa, delta.
Si delta fuera pequea, la probabilidad de error del tipo II aumentar.

Si cambiramos delta y lo corriramos a la derecha, aumenta el poder y
disminuye la probabilidad de cometer error tipo II.
Escogencia de :
Z puede ser de un lado o de los dos lados.
Por lo general, alfa = 0.05 y Z = 1 645
Z /2 = 1.96
Beta y poder (1-). Escogencia de Beta
H0:- 2 = 0 y poder H0:- 2 = 0
0 -2 +2
Escogencia de
Z es siempre de un solo lado.

Por lo general, = 0.20 y Z = 0.84
= 0.10 y Z = 1.28
Tamao de la muestra para dos grupos:

Manera de calcularlo
Cuando los tamaos de muestras son iguales para dos grupos, en
el caso de resultados continuos:

(Z /2 + Z ) 2 (1 2+ 2 2)
n=
2
En el caso de que los tamaos sean iguales para dos grupos con
resultados dicotmicos, el tamao de muestra se calcula as:

*
(Z /2 2 p q + Z p1q1 + p2 q2) 2
n=
2
es el promedio de nuestra adivinanza
Diferencias clnicamente significativas.

Conclusiones:
En general, todo lo que aumenta en el numerador, como la varian-

za 2, aumenta el tamao de la muestra.
Todo lo que aumenta en el denominador, disminuye el tamao de

la muestra. Si delta aumenta, el tamao de la muestra disminuye.
Consecuencias sobre el tamao de muestra:

El mejor estimativo del tamao de muestra NO se trata simple-
mente del clculo de un nmero.
Ms bien consiste en analizar una serie de probabilidades cuando

los supuestos cambian.
El estimativo del tamao de muestra debe permitir la presencia de

fluctuaciones en las prevenciones y nuestra relativa ignorancia del
tema.
Ejemplos:
Tamao de muestra para dos grupos en el caso de variables

continuas.
Supongamos que queremos saber qu tamao de muestra necesitamos

para detectar una diferencia promedio de por lo menos 4 kilos de peso
entre los individuos de un grupo sometidos a una dieta de recuperacin
nutricional, y otro de personas que no la recibieron.
- Asumo un de 0.05 y un poder (1-) de 0.80.
- Asumo, basado en los datos publicados en la literatura,
que 1= 2 = 15 kg.
- Asumo que ambos grupos tienen igual tamao de muestra.

(Z /2 + Z ) 2 (1 2+ 2 2)
n=
2

(1.96 + 0.84*) 2 (15 2 + 152)
n = = 2 205.
42
(El valor 0.84 sealado por el asterisco * es el valor correspondiente a

. Hasta aqu los mtodos ms sencillos).
El valor de 2 205 encontrado es el tamao de muestra que necesitara-

mos en cada grupo para detectar una diferencia como la solicitada.
Ejemplo: Tamao de muestra para dos grupos el caso de las va-

riables dicotmicas.
Supongamos que queremos saber cul sera el tamao de muestra ne-

cesario para detectar una disminucin del 1% del riesgo de accidente
cerebro vascular en dos grupos de individuos, unos que reciben aspiri-
na y otros que reciben placebo.
- Fijamos un de 0.05 y un poder (1-) de 0.80.
- Asumimos, basados en los datos publicados en la literatura, que

el riesgo de accidente cerebro vascular en quienes reciben aspirina
puede ser de 3% en veinte aos de seguimiento, y de 2% en quie-
nes reciben placebo despus de 20 aos.
- Asumo que ambos grupos tienen igual tamao de muestra.

Donde: p1= 0.03, q1=1-p1= 0.97, p2 = 0.02, q2 = 0.98, 2= (p1-p2)2= 0.0001,
y p = 0.03+0.02/2 = 0.025; q = 0.97+0.98/2 = 0.975.

(Z /2 2p q + Z p1q1 + p2 q2) 2
n=
2

n= [1.96 ( 2*0.025*0.975) + 0.98 ( 0.03*0.97 + 0.02*0.98)]2 / 0.0001

n= [1.96 (0.22) + 0.98 (0.029+0.0196)]2/ 0.0001

n= [0.43 + 0.21]2/ 0.0001
n= 8 007 personas por grupo = 16 000 personas en total a seguir por

20 aos.
Existen otros mtodos para calcular el tamao de muestra.
Hoy es poco probable que usted o alguien tengan que recurrir a este
tipo de clculos para un tamao de muestra. Hay demasiados progra-
mas estadsticos y varios applets disponibles en Internet.
El problema consiste en que si usted no introduce la informacin co-

rrecta y no sabe cmo hacerlo porque ignora el razonamiento y el signi-
ficado, nunca va a poder entender los resultados y tampoco va a poder
dialogar inteligentemente con los estadsticos y los profesionales exper-
tos en calcular muestras (los muestristas).
En este captulo le hemos mostrado la complejidad del razonamiento

necesario para calcular los tamaos de la muestra. Dichos razonamien-
tos son ms complejos a medida que se profundiza en otros mtodos
estadsticos. Esperamos que lo que hemos escrito le ayude a ver qu
tan necesario es saber algo del tema antes de pedirle ingenuamente
a un muestrista o a un epidemilogo que le calculen el tamao de la
muestra, como tambin qu tan importante son la aceptacin de los
lmites de nuestro conocimiento y de nuestras habilidades, as como
la necesidad del trabajo interdisciplinario para beneficio de aquellos a
quienes servimos.
19. Introduccin a las diferentes

correlaciones y los modelos lineales.
Regresin lineal y Anlisis Longitudinal
En este captulo hablaremos:
De la regresin lineal simple y el mtodo de los mnimos cuadra-

dos.
Del anlisis longitudinal, incluyendo los modelos multinivel (jerr-

quicos lineales), los mtodos actuarial y de Kaplan Meier.
Recordemos que una asociacin expresa la relacin existente entre dos

variables. La manera como se mide dicha asociacin depende de la na-
turaleza de las variables estudiadas; por ejemplo, si las variables son:
Continuas, como en el caso de la presin arterial, la talla, el peso,

o
Si son ordinales, o
Si son nominales.
Hasta ahora hemos visto medidas de asociacin tales como el estads-
tico Chi2, que mide la asociacin existente entre dos variables nomi-
nales.
En este captulo veremos un mtodo que tambin le apunta a medir la

asociacin entre solamente dos variables, con la diferencia que en este
caso se trata de la relacin entre dos variables continuas, como sera el
caso de la presin arterial y el peso corporal.
Coeficiente de correlacin de Pearson

El anlisis de correlacin describe la relacin lineal (de una lnea
recta) que expresa el grado de la fortaleza y la direccin de la rela-
cin existente entre dos variables continuas.
El anlisis de regresin predice o estima el valor de una variable

basado en el valor de otra variable y para ello utiliza la lnea recta
que se encuentra en el anlisis de correlacin. Su objetivo es cuan-
tificar la relacin.
Entre los mtodos bivariados hay otras maneras de mirar la relacin

existente entre dos variables, como cuando tenemos una variable conti-
nua y una no continua, en cuyo caso usaramos un test no paramtrico,
el Coeficiente de Correlacin de Rango de Spearman; o podramos
usar el Estadstico Kappa de Cohen si tratramos de averiguar el grado
de concordancia de los puntajes de dos evaluadores diferentes.
En el ltimo captulo intentaremos ubicar dentro de un contexto global

los mtodos no paramtricos. Nuestro objetivo ser all exclusivamente
docente, pues entendemos que el no saber ubicar cada uno de los con-
ceptos y los temas, es una de las razones por las cuales se dificulta la
enseanza de la bioestadstica.
Anlisis de Correlacin.
Es un anlisis esencialmente visual.
Al hablar de la descripcin de los datos habamos recomendado inspec-

cionar siempre los datos, familiarizarse con ellos y detectar qu patro-
nes toman antes de lanzarse a hacer clculos matemticos. El anlisis
de correlacin permite esto.
Diversos patrones de la grfica de dispersin de puntos (Scatter Plot)
Anlisis de Correlacin
y (presin No se ve correlacin de los datos

arterial)
x (peso)
y (presin Correlacin Positiva:

arterial) cuando la x aumenta y la y aumenta
x (peso)
y (presin
arterial) Correlacin Negativa:
cuando la x disminuye y la y disminuye
x (peso)
En la grfica anterior, cada punto corresponde a una persona a la que

se le han medido las dos variables de inters. Bastara la inspeccin de
los puntos para saber si hay o no una correlacin entre las variables
estudiadas, en este caso las presiones arteriales en funcin del peso de
cada una de las personas aportando estos datos. Pero tambin es posi-
ble cuantificar la fuerza de esa relacin. Ello lo obtenemos mediante el
clculo de r, el Coeficiente de Correlacin de Pearson.
Dicho coeficiente no se expresa en ninguna unidad especfica, simple-

mente r toma un valor entre -1 y + 1 independiente de las unidades
usadas para medir las variables de inters. Entonces:
r = + 1 significa que hay una asociacin positiva perfecta.

r = 0 significa que no hay asociacin.
r = -1 significa que hay una asociacin negativa perfecta.
Interpretacin del Coeficiente Correlacin de Pearson r
r = +1 Asociacin positiva perfecta
No hay Asociacin
r=0
Asociacin negativa perfecta

r = -1
Ya sean negativas o positivas, la manera de interpretar las cifras es como

sigue:
0 a 0.25 indica que hay poca o ninguna correlacin.
0.25 a 0.50, que hay alguna correlacin.
0.50 a 0.75, una correlacin entre moderada y buena,
0.75 a 1, la correlacin es muy buena o excelente.
Esa manera de interpretar tiene sentido pero es arbitraria.
Miremos ahora con un par de ejemplos por qu se recomienda analizar

visualmente los resultados de la correlacin en una grfica, y no solo el
resultado de un estadstico r.
Est claro que en los anteriores ejemplos, el valor de r refleja lo que se

observa en las grficas.
Eso no sucede en los siguientes ejemplos:

Ejemplos de porqu es importante hacer una interpretacin visual
de la correlacin y no nicamente da un valor a r
r = +1 r=0 r = -1
r = entre r = entre
0 y +1 0 y -1
En todos los casos anteriores no habra problemas de interpretacin,

pues el valor de r coincide con lo observado visualmente
Ejemplos en los que la r interpretada aisladamente de la

representacin visual podra ser desorientadora
Primer ejemplo r=0 Segundo ejemplo Tercer ejemplo r=0

r=entre 0 y 1
En todos ellos la r no refleja lo que sucede con los datos. En el primer

ejemplo hay una relacin lineal que toma la forma de una lnea curva,
y la r se ha hecho para reflejar lo que sucede con datos que toman la
forma de la lnea recta. En el segundo caso, aunque la mayora de los
datos daran un valor de r entre 0 y -1, el valor lejano de la esquina de la
derecha (un outlier) cambia el valor de r hacindolo difcil de interpre-
tar. En el tercer ejemplo, la totalidad de los datos da un valor de r que
tiende a -1, pero dentro de los datos se forman estratos separados, cada
uno de los cuales tienden a una r de +1.
Es obvio que si hubiramos aceptado solo la r como un valor que

interpreta los datos fielmente, no hubiramos podido ver la relacin
existente entre las variables y nos hubiramos equivocado.
Regresin Lineal Simple

Introduccin de un nuevo smbolo (ro) en el anlisis
de correlacin.
Supongamos que hemos examinado los datos y parece existir una co-
rrelacin lineal que toma la forma de lnea recta.
Ahora debemos poner a prueba la H0 de que , el verdadero coefi-

ciente de correlacin, es igual a cero ( = 0). Cuando es el verdadero
coeficiente de correlacin
H0: = 0
Al igual que lo hemos hecho hasta ahora, es posible construir in-
tervalos de confianza IC alrededor de .
La regresin lineal simple consiste en estimar los valores correspon-

dientes y construir la mejor lnea recta que pase por un grupo de pun-
tos X y Y.
Caractersticas y objetivo de la regresin lineal
Una regresin lineal describe una medida de respuesta Y (variable

dependiente), en funcin de una variable X (variable independien-
te).
El objetivo de la regresin lineal simple es predecir o estimar el

valor de Y basado en el valor de X.
y = b0 +b1X
Y2
y
y b1 (pendiente) =
Y1 x
x
b0
X1 X2
b0 = intercepto
Cuando tenemos una relacin lineal podemos tomar dos datos cual-
quiera y ver cmo se comportan con relacin a la lnea recta que ex-
presa dicha relacin; es decir que si tenemos dos observaciones de dos
pacientes distintos digamos peso (X) en las abscisas y presin arterial
(Y) en las ordenadas se trata de encontrar la lnea recta entre esos dos
puntos que represente el mejor estimativo.
Mtodo de los cuadrados mnimos
Si encontramos las distancias entre cada punto y la lnea de regresin

lineal, y elevamos esas distancias al cuadrado, el mtodo de cuadrados m-
nimos (mnimos cuadrados) consiste en encontrar la lnea que mejor se
ajuste para minimizar las distancias entre todos los puntos y esa lnea.
Mtodo de los Cuadrados Mnimos
Se trata de tomar la distancia

en azul entre cada punto
de la distribucin y la lnea
recta, elevarlas al cuadrado y
encontrar la lnea que mejor
se ajusta entre todos los
puntos y la lnea construida.
X1 X2 X
Error
Es el nombre de la distancia entre la lnea que mejor se ajusta a los

datos y la observacin.
Lnea de mejor ajuste (Best fitting line)
La lnea que mejor se ajusta a los datos se determina entonces hallando

los estimativos de 0 (intercepto) y 1 (pendiente) que minimizan la
suma de las diferencias entre un punto observado y un punto ajustado
sobre la lnea; en otras palabras, la lnea que minimiza la suma de los
trminos de error elevados al cuadrado.
La ecuacin de la lnea que ajusta los datos luce de esta manera:

Y= 0 + 1 X
En donde Y es la variable dependiente o la variable que queremos pre-

decir, la presin arterial, 0 es el valor de Y cuando X es 0, en este caso
cuando la presin arterial es 0, y 1 es la pendiente que corresponde al
cambio de Y por cada unidad de X, es decir, cunto ms aumenta o dis-
minuye la presin arterial por cada unidad de aumento de peso, por un
gramo o kilogramo de peso (de acuerdo con las unidades de inters).
Un ejemplo:
La ecuacin de datos de una regresin lineal de la presin sistlica y el

peso en una poblacin de adultos de Estados Unidos luce as:
Y= 118 + 0.23 X
Qu significa el 0.23? Que por cada kilogramo de peso se espera un

aumento de 0.23 mm/Hg de presin arterial sistlica o, lo que es igual,
por cada 10 kg se aumentara en 2 mm/Hg la presin sistlica. Usted
tambin podra predecir cul ser la presin arterial de una persona con
100 kg en esta poblacin:
Y= 118 + 0.23 * (100)= 118 + 23= 141 mm/Hg
Coeficiente de determinacin r2.

Uso de la lnea que mejorse ajusta para hacer predicciones.
El coeficiente de determinacin r2 es el mtodo estadstico usado para
mostrar qu tanto (qu proporcin) de la variabilidad de un factor se
puede explicar por su relacin con otro factor.
En una escala de 0 a 1, mientras ms alto sea el valor, mejor se consi-

dera el ajuste (fit).
Por otra parte, r2 tambin se puede usar para describir la fraccin de la

varianza no explicada.
En el caso de la presin arterial y el peso de la correlacin, nos da 0.19,

y el coeficiente de determinacin 0.035= 3.5%. Cmo se interpreta
este resultado? La correlacin luce baja de acuerdo con lo que anot-
bamos anteriormente, es adems positiva, es decir que a medida que
aumenta el peso esperamos que aumente la presin arterial. El coefi-
ciente de determinacin, al igual que la correlacin, es bajo, 3.5% de la
variacin de la presin arterial en esta poblacin se explica por el peso
de las personas. No nos debera parecer extrao. Bien sabemos que hay
mltiples factores que explican la presin arterial en una poblacin y
no slo el peso actual.
Anlisis longitudinal
Nada es tan simple como parece
Este captulo se refiere a los modelos estadsticos usados para el anlisis

longitudinal de datos, que incluyen:
Los modelos multinivel, tambin llamados modelos jerrquicos linea-

les, en los cuales nos interesan los cambios y las trayectorias.
Modelos de supervivencia en los cuales nos interesa el tiempo tras-

currido hasta la ocurrencia de un evento, incluyendo el modelo de Cox,
tambin conocido como modelo de riesgos proporcionales.
A qu se refieren los anlisis longitudinales?
Los trminos modelos longitudinales y anlisis longitudinal no

siempre son bien interpretados. Para algunos son sinnimos de estu-
dio de cohortes, pero no lo son. Los anlisis longitudinales a dife-

rencia de las cohortes no implican solamente seguimiento hasta la
ocurrencia de un evento (enfermedad o muerte), sino que involucra
mediciones repetidas, es decir, el individuo es observado en ms de una
ocasin. En otras palabras, al hablar de anlisis longitudinal de datos
nos referimos a modelos de cambio y ocurrencia de eventos.
La idea general de los estudios longitudinales no es nueva, aunque uno

de ellos, el modelo multinivel, se comenz a usar solo en la epidemio-
loga social en la segunda parte de la dcada de los ochenta.
Sin embargo, como lo mencionamos en la introduccin del libro, ya

Graunt en el siglo XVII analiz las estadsticas de mortalidad de Lon-
dres y concluy correctamente que nacen ms nias que nios y que las
mujeres viven ms que los hombres; basado en sus datos cre las tabla
de vida para calcular cuntos, de 100 recin nacidos, sobrevivan hasta
ciertas edades. Filibert Guenau de Monteillard (17201785) midi y
anot la estatura de su hijo cada seis meses hasta cuando cumpli 18
aos.
Esos fueron los primeros anlisis longitudinales.
Los anlisis longitudinales estudian fenmenos a lo largo del

tiempo
- Cambios sistemticos a lo largo del tiempo
Lucas y colaboradores siguieron, a lo largo de varios aos, a un gru-

po de lactantes prematuros para ver su desarrollo neurolgico. Unos
haban recibido leche materna y otros no. Inicialmente a ambos gru-
pos les hicieron las pruebas de neurodesarrollo apropiadas (escala de
Bailey, versin inglesa) en distintos momentos de su desarrollo hasta
cuando cumplieron 18 meses. Luego, al ver que existan diferencias en
los puntajes entre unos y otros, a los 8 aos los evaluaron mediante un
test de inteligencia. Posteriormente, estas cohortes se han evaluadas
nuevamente.
- Pregunta sobre si ocurre o no un evento
(Anlisis de supervivencia para tiempo discreto y continuo)
Por ejemplo, cuando segn caractersticas definidas al comienzo del pe-

rodo de observacin, se sigue a varios individuos para ver si se suicidan
o si desarrollan cncer, o si se mueren, como hizo A. Muoz con sus
cohortes de HIV positivos de Baltimore.
Tanto en un caso como en el otro, hay:

1. Anlisis descriptivo de lo que le pasa a cada persona.
2. Resumen estadstico de cada persona.
3. Comparacin entre personas para ver cmo cambian unas y
otras segn los riesgos asignados en diversos momentos del estu
dio.
Ventajas
Estos mtodos tienen las ventajas de ser ms flexibles en el diseo de la

investigacin, permiten hacer cortes e identifican patrones temporales
de datos como si ah terminara el estudio, se pueden incluir predictores
que varan con el tiempo y se pueden incluir interacciones.
En el caso de los modelos multinivel:
Dan una versin ms realista, ya que:

- Modelan cada nivel de jerarqua.
- No requieren que haya independencia entre los grupos.
Modelos multinivel
No olvide que los modelos multinivel son llamados igualmente mode-
los jerrquicos lineales
Aqu tenga en cuenta dos conceptos claves:

Niveles.
Anidados (de nido).
Niveles
Al estudiar a los nios de quinto de primaria de varias escuelas, no lo
podemos hacer como si fueran iguales, que es lo que haran los mode-
los lineales tradicionales. Por un lado, aun dentro de una mismo saln
de una escuela dada, hay individuos diferentes en cuanto a: composi-
cin tnica y cultural, edad, proceden de diversas reas de la ciudad).
Pero incluso si suponemos que los salones de 5 grado A, B, C, son

homogneos por estar en una misma escuela, esa escuela est dentro
de un vecindario que no es igual al de otras escuelas. Y los vecindarios
estn situados en ciudades que son diferentes. Y las ciudades dentro de
pases, cobijados estos por el mismo sistema educativo; es decir, hay
cosas compartidas y otras que no lo son.
En otras palabras: hay niveles y todos estos niveles tienen influencia

entre s.
Nivel 1: submodelo para los cambios individuales, en la grfica de abajo

el nivel de los alumnos
Nivel 2: Submodelo para diferencias interindividuales sistemticas, en la

siguiente grfica el nivel de las escuelas.
Estos son los niveles mnimos requeridos para llamar a un modelo

como multinivel.
Usualmente, lo que los hace tiles es ver cmo se ajustan los modelos
multinivel con el cambio de datos. Y cmo se interpretan los resulta-
dos.
Diagramas de modelos multinivel: El nivel ms sencillo
ESCUELA Escuela 1 Escuela 2 Escuela 3
ALUMNO
Mencionamos el sistema educativo porque fue el primer sistema en el

cual se usaron los modelos multinivel, pero estos no solamente sirven
para los sistemas educativos sino tambin para otras estructuras socia-
les, y en el campo de la salud, especialmente para la llamada epidemio-
loga social.
Otros ejemplos de su uso de los modelos jerrquicos lineales seran

entonces:
Pacientes que estn adscritos a un hospital o a un mdico deter
minado,
Personas en viviendas, o viviendas en barrios.
Otra forma de modelos multinivel son las mediciones repetidas de una
persona a lo largo del tiempo, por ejemplo, en las grficas de crecimien-
to, el nivel 1 corresponde a las mediciones repetidas de las personas y el
nivel 2 a la persona a quien le corresponden dichas medidas.
Mediciones repetidas de una persona a lo largo del tiempo:
por ejemplo en las grficas de crecimiento
Persona 1 Persona 2 Persona 3
PERSONAS
MEDICIONES
m1 m2 m3 m1 m2 m1 m2 m3 m4
El diagrama para tres niveles sera el siguiente:
3 niveles
AREA A1 A2 A1
HOSPITAL H1 H2 H3 H4 H5 H6
PACIENTE P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 P13 P14

Todos los niveles anteriores son anidados.
Qu son niveles anidados?

Los niveles anidados son aquellos en los cuales los niveles se comuni-
can entre s porque, segn una jerarqua, el nivel menor est contenido
dentro de un nivel superior, es decir, se anida dentro de otro ms gran-
de.
Pero tambin hay niveles NO anidados.
Como cuando la clasificacin de los pacientes est cruzada por hospital

y por rea.
Modelos MULTINIVEL NO ANIDADOS
Nivel Hospital H1 H2 H3 H3
Nivel Enfermo E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 E11 E12
Nivel de Area A1 A2 A1
los enfermos 1 y 2 van al mismo hospital pero vienen de distintas reas

los enfermos 6 y 10 vienen de la misma rea pero van a diferentes hospitales
En el caso anterior, el rea no est anidada dentro del hospital ni el

hospital dentro del rea.
Cada uno de estos modelos con distintos niveles tiene un manejo ma-
temtico diferente segn sean anidados o no anidados.
Metodologa multinivel
La metodologa multinivel es una metodologa alternativa para acer-
carse al contexto de un individuo en la bsqueda de explicaciones de
causalidad.
Por qu: Razones sociales
Las variables de contexto de cada persona frecuentemente juegan un

papel importante y no deben relegarse o analizarse como si todas per-
tenecieran al mismo nivel individual.
Todava hoy, las causas asociadas con la ocurrencia de un evento son

estudiadas de manera esttica, como si los individuos y sus circunstan-
cias no cambiaran, es decir, sin tener en cuenta cambios que le puedan

ocurrir y le van a ocurrir al ambiente cultural, social y clnico del indivi-
duo: en resumen, a la ecologa de la persona.
Cuando se analizan como si todas pertenecieran al mismo nivel indivi-

dual, llegaramos ya sea a la falacia ecolgica o la falacia individualista.
Se trata entonces de estudiar el individuo de una manera ecolgica, es

decir, de una forma dinmica y conjunta, sin separarlo del contexto en
donde acta, vive y trabaja, sino fusionndolo con su ambiente cultural,
laboral, social, algo que lo integre y no lo deje como individuo aislado
en el nivel ms bajo de una estructura.
Este razonamiento tiene sus races histricas.
Races
Metodolgicas
Con las metodologas tradicionales usadas para hacer relaciones: Regre-

sin lineal mltiple y regresin logstica, surgen problemas cuando se
ignoran el contexto y la jerarqua de los datos.
En dichos modelos se asume que:
- La varianza es constante.
- Las unidades de estudio son independientes unas de otras.
En 1986, los matemticos ingleses Aitkin y Longford hicieron ver que

los modelos de regresin lineal, una tcnica que como vimos se usaba
con frecuencia para estudiar cmo un conjunto de variables explicaban
otra variable producto, solo se podan emplear en el caso muy especial
en el cual las observaciones fueran independientes.
La realidad es que en los sistemas educativos analizados inicialmente,

y luego en otros:
Los estudiantes (individuos), que por supuesto tiene caractersti-

cas individuales independientes, estn organizados por aulas.
Pero las aulas estn dentro de los colegios.
Estos en los barrios y en ciudades.
En regiones y pases que tienen sistemas educativos que ejercen

su influencia en todo el pas y estos a su vez en regiones.
Los modelos multinivel reconocen y manejan los distintos niveles de

organizacin jerrquica de los sistemas educativos y de salud, y tambin
ofrecen resultados con menor incidencia de errores de la estimacin de
los resultados.
Antes de ellos, una de las decisiones sobre el manejo cuantitativo en la

cual las variables de los estudiantes se analizaban junto con las del aula
(por ejemplo si los estudiantes reciban clases especiales de ingls o no)
o de escuela, era la unidad de anlisis ante la cual haba dos alternativas
igualmente insatisfactorias:
La unidad era el individuo (el paciente o el estudiante) con lo

cual se recogan los datos de cada sujeto de manera independiente
(recuerde que ese era uno de los requisitos) y se caa en la Falacia
Atomista.
La unidad era el aula con la cual se caa en la Falacia Ecolgica,

aquella que, como lo vimos en el captulo se sesgos, se presenta
cuando se le atribuyen incorrectamente las caractersticas del con-
texto a los sujetos, como cuando al describir que una poblacin
es de diabticos, se supone que cada uno de los que llegue es dia-
btico o rubio, o negro o mentiroso. O como al pasar por ciertos
controles de migracin, una santa madre colombiana es tratada
como sospechosa de llevar dentro de la maleta de paales de su
hijo un alijo de cocana.
La realidad es que los estudiantes de un mismo curso comparten una

serie de experiencias diferentes de los de otras aulas, pero de igual ma-
nera, las aulas de una escuela tienen en general el mismo ambiente edu-
cativo y el mismo ambiente escolar que las otras.
Las alternativas son los modelos multinivel con los cuales se trabajan
simultneamente tres o ms niveles de anlisis. Los creadores del mo-
delo proponen una estructura de anlisis dentro de la cual se pueden
reconocer los distintos niveles en los cuales se articulan los datos, pues
cada subnivel se representa mediante su correspondiente modelo.
Cada submodelo expresa la relacin de las variables dentro de un nivel

determinado y especfico, tambin cmo las variables de ese nivel influ-
yen en las relaciones que se establecen con otros niveles.
Por qu identificar trayectorias
Una medida nica de talla o de peso permite identificar como est el

nio ahora, pero no sabemos si su talla o peso han disminuido con res-
pecto a un momento anterior. Adems, un nio puede estar de talla ms
baja que otro en un mismo momento, pero estar aumentando ms de
talla que otro nio que en un momento dado tenga una talla superior.
Igualmente, un anlisis transversal de los datos que tomamos en varias
ocasiones sobre el mismo nio no nos permite estimar el efecto sobre
el crecimiento de los eventos que cambian en el tiempo; por ejemplo,
estimar el efecto de la suspensin de la lactancia materna, o el efecto
de los cambios en el tipo de dieta o de la frecuencia de enfermedades a
diferentes puntos en el tiempo.
Por el contrario, con los diseos y anlisis jerrquicos lineales podemos

caracterizar los patrones de cambio en una persona (cambios intra
individuales) y establecer qu factores intraindividuales afectan las tra-
yectorias de cambio. Conociendo que algunos determinantes cambian
en el tiempo, los estudios longitudinales me ayudan a estimar tambin

el efecto de estas variables en el cambio de nuestra variable de inters,
es decir, la talla o el peso; adems, estimar las relaciones entre el creci-
miento y los determinantes respetando la temporalidad de las asocia-
ciones, tambin nos permiten comparar trayectorias de cambio entre
los individuos, y los factores relacionados con las trayectorias (cambio
entreindividuos).
Observe las siguientes trayectorias de peso. Estos son los datos de un

estudio longitudinal de crecimiento infantil en nios de Guap, Cauca.
Como usted nota, las trayectorias varan de un nio a otro. Hay algunos
que inician con mayor peso que otros a los 6 meses, pero que ganan
mucho ms peso en el primer ao, como es el caso del nio 5; hay otros
que inician con peso ms alto pero ganan menos, como el nio 33.
6 33 36 41
1 4 .0 0
Linear R egress ion
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
56 62 68 71
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
75 82 85 109
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
113 137
1 4 .0 0
1 2 .0 0
peso_k
1 0 .0 0
8 .0 0
6 .0 0
0 .0 0 4 .0 0 8 .0 0 1 2 .0 0 0 .0 0 4 .0 0 8 .0 0 1 2 .0 0
edad_c5 edad_c5
Los modelos multinivel nos permiten modelar conjuntamente cada una

de las trayectorias de estos nios e identificar las exposiciones que pre-
dicen mejor estas trayectorias. De este estudio sabemos que hay gran
variabilidad en el peso a los seis meses, y que adems hay gran variabi-
lidad en la ganancia de peso entre los nios. Mientras que la educacin
de la madre es un buen predictor del peso a los seis meses, la propor-
cin de tiempo que los nios han estado enfermos predicen mejor la
trayectoria de peso en el tiempo.
Fundamentos de los modelos multinivel

Los modelos multinivel son, en esencia, ampliaciones de los modelos
de regresin lineal clsicos:
y = b0 +b1X
Y2
y
y b1 (pendiente) =
Y1 x
x
b0
X1 X2
b0 = intercepto
Ampliaciones mediante las cuales se elaboran modelos de regresin

lineal para cada nivel de anlisis.
Con ello, los modelos del primer nivel estn relacionados por un
modelo de segundo nivel en el cual los Coeficientes de Regresin
del nivel 1 se regresan a un segundo nivel de variables explicativas,
y as sucesivamente para los diferentes niveles.
Tres conceptos clave: Concepto de correlacin nter clase, concep-

to de coeficiente fijo y coeficiente aleatorio y concepto de interaccin
entre los niveles.
1. Concepto de correlacin nter clase. Nos sirve para hacer una es-
timacin de lo que comparten los individuos que pertenecen a un
mismo saln de clase o servicio de un hospital.
Recordemos aqu que una correlacin baja o cercana a cero significa

que los sujetos de un grupo son tan diferentes entre s como los que
pertenecen a otros grupos. En ese caso, la agrupacin no tiene conse-
cuencias y las observaciones son independientes, como si se tratara de
modelos lineales tradicionales.
2. Concepto de coeficiente fijo y coeficiente aleatorio (estocstico).

En los modelos de regresin clsicos, los parmetros que se esti-
man son el intercepto (punto de corte) y la pendiente. Desde el
punto de vista clsico, estos coeficientes se asumen como fijos,
es decir comunes a todos los sujetos y se estiman partiendo de los
datos. Por el contrario, los coeficientes aleatorios son variables y
se distribuyen segn una funcin de probabilidad.
En las estructuras multinivel, los coeficientes del primer nivel (alum-

nos, pacientes) son tratados como aleatorios en el segundo nivel (aulas,
centros de salud, servicios de hospital). En los modelos multivariados
se permite que los grupos se desven de la solucin central tanto en el
intercepto como en la pendiente. En otras palabras, los modelos multi-
nivel estn compuestos:
Por una parte fija que es comn para todos los contextos.
Otra parte especfica para cada contexto que vara, y que se estima
mediante la varianza en los distintos niveles.
3. Concepto de interaccin entre los niveles. Es la interaccin de

las variables que se miden en diferentes niveles de una estructura
jerrquica de datos.
Los modelos multinivel:

1 Consideran la heterogeneidad
2 Reconocen la interaccin entre individuos y contextos
3 Reconocen la existencia de mltiples contextos
Modelos multinivel en salud
En el campo de la salud, los modelos jerrquicos lineales tienen uso
privilegiado en lo que se denomina epidemiologa social.
La epidemiologa social estudia la frecuencia y distribucin de los

estados de salud o de enfermedad en las poblaciones y su relacin con
determinantes sociales.
En un sentido ms amplio, se llama determinantes de la salud a

aquellos factores que influyen en la salud individual y que, interactuan-
do en diferentes niveles de organizacin, determinan el estado de salud
de la poblacin.
Determinantes Determinantes
conductuales ambientales
Hbitos Clima
Costumbres Aire
Creencias Agua
Actitudes Nivel de deforestacin
Comportamientos Contaminacin
Excretas
SALUD
Determinantes Determinantes
biolgicos sociales
Genes Relaciones familiares
Edad y sociales. Exclusin
Raza Situacin financiera
Sexo Trabajo y satisfaccin
Nutricin Libertad. Dignidad
Inmunidad
Estos determinantes de salud se podran clasificar en:

Niveles bsicos, tales como poblacin y medio ambiente.
Niveles estructurales, tales como nivel de riqueza o nivel educati
vo.
Niveles prximos, como condiciones de vida y de trabajo.
Como se puede ver, la complejidad de anlisis exigido por el modelo

es mayor, pero tambin ms realista.
Angustias metodolgicas (lmites)

- No solo de los modelos multinivel sino en general para los longi-
tudinales, existe preocupacin por el desgaste (atricin), es decir,
la existencia de datos perdidos de la muestra a medida que van
saliendo individuos porque se pierden para el seguimiento, ya sea
porque se trasladan de lugar, se cambian de escuela, etc.
Para solucionar este problema se han desarrollado tcnicas de impu-

tacin de los valores faltantes. Con frecuencia, dichas prdidas de
informacin son diferenciales, por ejemplo, se pierden ms mediciones
en los pacientes con peores niveles de salud. Entonces, se recomienda
que la imputacin de datos se haga teniendo en cuenta los datos ya
existentes del propio individuo a quien le hacen falta.
Anlisis de sobrevida
Mtodo actuarial.
Mtodo de Kaplan Meier.
El anlisis de sobrevida incluye las tcnicas estadsticas usadas en los

estudios longitudinales, en la cuales se hace uso de todos los datos dis-
ponibles, incluyendo los de los miembros de la cohorte de inters que
se pierden o se retiran del estudio.
En los clculos de las resultantes de los anlisis de sobrevida se tienen

en cuenta la duracin del tiempo de seguimiento de cada individuo de
la cohorte a partir del momento en que empiezan a ser parte de esta.
En las enfermedades raras, los individuos comienzan a ser parte de la
cohorte en distintos momentos, diversas edades y tras evoluciones cl-
nicas diferentes, entonces es necesario igualarlos considerndolos parte
de la misma cohorte, por ejemplo, slo cuando comienzan a recibir
tratamiento.
Este tipo de anlisis se utiliza tradicionalmente, pero no siempre, cuan-

do se sigue a la cohorte durante un tiempo relativamente largo (aos) y
el resultado final es dicotmico: El paciente sobrevive o muere. Sin
embargo, es necesario que individuos
(no siempre significa individuos humanos) y que cohortes, en casos de

microorganismos, pueden ser seguidas por periodos cortos.
El nombre de anlisis de sobrevida refleja sus orgenes comerciales,

pues estos anlisis fueron creados para calcular los riesgos de muerte o
supervivencia y de acuerdo con ellos asignarles las cuotas que habran
de pagar quienes compraban seguros de vida segn padecieran o no de
ciertas condiciones.
El anlisis de sobrevida se puede usar ya sea en:

Estudios descriptivos: Cuando hay un grupo nico expuesto.
Estudios analticos: Cuando hay dos o ms grupos (cohortes)
expuestos.
Tambin se pueden usar en:
Estudios observacionales: Como sucede cuando se sigue a una co-

horte de pacientes con SIDA que reciben tratamientos semejantes
para ver cmo evolucionan, o cuando se sigue con el mismo fin a
una cohorte de nios con tumores de Wilms.
Estudios de diseo experimental: Ensayos clnicos.
Utilidad de los anlisis de sobrevida

En la vida todo tiene lmites. Cuando se estudian fenmenos de cual-
quier naturaleza, en algn momento el investigador debe cerrar su es-
tudio: Qu hacer entonces para saber si los individuos de una cohorte
determinada hubieran desarrollado o no el resultado evaluado en el
estudio, si ste hubiera durado ms tiempo? Cmo comparar indivi-
duos que se han seguido durante tiempos diferentes por haber entrado
en momentos diferentes del estudio? Aunque se podran utilizar varios
mtodos de anlisis, por ejemplo, el promedio de duracin de la vida,
la mediana de la sobrevida, etc., todos ellos terminarn siendo inade-
cuados. En estos casos de debe recurrir a alguna de las dos tcnicas
principales de sobrevida:
El mtodo actuarial.
El mtodo de Kaplan Meier.
Las curvas de ambos mtodos describen la misma tendencia de la so-

brevida de la cohorte, pero en la curva de Kaplan Meier, en fechas
exactas, se ven escalones correspondientes a los cambios bruscos su-
fridos por la cohorte en determinados momentos, y estos cambios se
vuelven progresivamente ms grandes a medida que disminuye el n-
mero de quienes an sobreviven al final del seguimiento.
Grfica de Supervivencia: MTODO ACTUARIAL

La curva comienza en el punto donde 100 % de
100 la cohorte permanece completa
80
% de supervivencia
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Periodos desde cuando se enrolan en la cohorte
Grfica de Supervivencia: MTODO DE KAPLAN METER

Note las cadas bruscas caractersticas
100
80
% de supervivencia
60
40
20
0
1 2 3 4 5 6 7 8 9 10 11 12 13
Periodos desde cuando se enrolan en la cohorte
Modelos de COX Modelo de riesgos proporcionales

El modelo de COX, una subclase de los modelos de supervivencia, es
una tcnica estadstica que se emplea para explorar la relacin existente
entre la supervivencia de un paciente y diversas variables explicativas.
Si el Anlisis de Sobrevida estudia el tiempo transcurrido en-

tre el ingreso de una persona a un estudio y un evento posterior,
como enfermedad y muerte
El Modelo de Cox proporciona un estimativo del efecto de un

tratamiento sobre la sobrevida despus de ajustarlo por otras va-
riables estimativas. Con ello nos permite estimar el riesgo (el mo-
delo tambin se llama modelo de riesgos proporcionales) de
muerte o de otros eventos de inters de los individuos, dadas sus
diferentes variables pronsticos.
Aun si los grupos de tratamiento son similares con respecto a variables

que sabemos afectan la sobrevida, el modelo de COX puede producir
un estimativo ms preciso del efecto del tratamiento, por ejemplo ha-
ciendo ms estrecho el intervalo de confianza. Este modelo implica
el examen de los coeficientes para cada variable explicativa. Como en
otros modelos de correlacin positiva, para una variable explicativa se
interpreta como si el riesgo es mayor. Por el contrario, un coeficiente
de regresin negativo implica que el paciente tiene un pronstico mejor
con los valores ms altos de dicha variable.
19. Eplogo
Apreciado lector:
Hasta aqu llegamos en nuestro recorrido compartido.
Juntos hemos aguantado el punto del dolor tan conocido por los ma-
ratonistas antes de sobrepasar el mojn del km 21. Dicho punto separa
a quienes posiblemente van a terminar de quienes se quedarn en el
camino a la espera de una nueva oportunidad. Como premio por haber
superado la parte difcil del camino, algo que francamente no habamos
logrado antes, sabemos que llegaremos al objetivo impuesto al comien-
zo de la carrera. En el fondo vemos el estadio y adivinamos la meta y
los vtores. No importa que por ahora sean vanas ilusiones. Sabemos
que en el futuro vendrn desafos nuevos y ms difciles.
Por ahora, es tiempo de disfrutar del paisaje y de la brisa, y de tratar de

adivinar qu hay entre los atajos y las distracciones que en esta ocasin
hemos evitado. Quizs la vida nos junte una vez ms y tengamos enton-
ces el placer de compartir otra aventura.
Los autores y colaboradores.
Bogot, Kingston (Ontario) y Cali, mayo de 2009.


Epidemiologia para No Epidemiologos

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Epidemiologia para No Epidemiologos

Uploaded by

Copyright:

Available Formats

1 EPIDEMIOLOGA PARA NO EPIDEMILOGOS

Jairo Osorno, Beatriz Eugenia Alvarado-Llano y Gabriel Osorno

Jairo Osorno, Beatriz Eugenia Alvarado-Llano y Gabriel Osorno

Este libro se lo dedicamos con todo cario a Alberto

1. Prefacio. Justificacion del libro.

3. Lenguaje Estadistico Bsico.

4. Cuadro de cuatro casillas generalidades.

6. Uso del cuadro de cuatro casillas evaluacin de pruebas

7. Uso del cuadro de cuatro casillas en clculo de riesgos.

8. Uso del cuadro de cuatro casillas en toma de decisiones.

9. Puntaje Z Curvas de crecimiento-Osorno-lfp.

10. Medidas usadas en epidemiologa.

11. Tipos de epidemias.

12. Estudios Epidemiolgicos BEA.

13. Azarconfusion y sesgos Enemigos de la validez de los

14. El valor de p y los Intervalos de Confianza.

17. Tamao de muestra. Poder.

18. Regresin lineal simple y anlisis lineal.

1. Prefacio. Justificacion del libro.

3. Lenguaje Estadistico Bsico.

4. Cuadro de cuatro casillas generalidades.

6. Uso del cuadro de cuatro casillas evaluacin de pruebas

7. Uso del cuadro de cuatro casillas en clculo de riesgos.

8. Uso del cuadro de cuatro casillas en toma de decisiones.

9. Puntaje Z Curvas de crecimiento-Osorno-lfp.

10. Medidas usadas en epidemiologa.

11. Tipos de epidemias.

12. Estudios Epidemiolgicos BEA.

13. Azarconfusion y sesgos Enemigos de la validez de los

14. El valor de p y los Intervalos de Confianza.

17. Tamao de muestra. Poder.

18. Regresin lineal simple y anlisis lineal.

A menudo la verdad es tan sencilla y elemental que parece increble

Hemos odo en varias ocasiones a Jairo Osorno afirmar que una

Si ello pasa con la msica, lo mismo sucedera con el conocimiento

As pues, el texto Epidemiologa para no epidemilogos nos intro-

Adems, los autores de este libro resolvieron, no slo como profe-

La conclusin, al ser aplicados con rigurosidad los conceptos y

tra cmo la ciencia, en general, es un observatorio de la eterna

Un viaje hacia la comprensin de la epidemiologa es lo que esta

Les deseamos pues, un viaje extraordinario y un aprendizaje fun-

Jenaro Murgueitio Restrepo Tito Arcadio Perilla Cepeda

A la CIUDADELA DE LA SALUD S. A., en especial a Jena-

AMAREY NOVA MEDICAL S. A., en particular a su presi-

A los profesores y alumnos de pregrado y posgrado de la Fa-

A los profesores y alumnos de la maestra de Salud Pbli-

A nuestras familias, sin cuya devocin y afecto, no hubira-

1. Prefacio. Justificacin del Libro.

Cuando comenzamos a discutir la conveniencia de publicar un nuevo

Por qu publicar un libro ms de epidemiologa y por qu uno

Por qu habran de interesarse ahora en la epidemiologa otros

Qu hay de til en la epidemiologa para el ejercicio concreto

Por qu insistir en la bsqueda de un libro que, sin sacrificar

Qu nos autoriza a algunos de nosotros, legos en la materia, a

La mayora de los profesionales de la salud se han visto obligados

En resumen, parece existir un hiato en la comunicacin.

En las ltimas dcadas, la epidemiologa y la salud pblica parecen

rama administrativa de la salud. Algunos lo hacen por verdadera voca-

Incluso, para muchos de ellos, la epidemiologa sigue siendo vista como

La epidemiologa es difcil, aluden algunos, porque es matemtica. Tal

Se han intentado muchas alternativas para hacer digerible la epidemio-

En qu consiste este esfuerzo

No estamos detrs del libro mgico. Este no existe. Como no existen