Metodolog

Metodologa de la Investigacin
Page1
Metodologa de la Investigacin
Salvador Pita Fernndez

Mdico de Familia
Profesor de la Universidad de A Corua (Espaa)

"La medicina es una ciencia de probabilidades y el arte de
manejar la incertidumbre..."

Presentacin

La realizacin de estudios clnico epidemiolgicos precisa no
solo de tiempo y entusiasmo dirigido a responder una pregunta,
sino de conocimiento metodolgico.
La estadstica y la epidemiologa clnica proporcionan los
instrumentos metodolgicos adecuados para dicha carrera de
obstculos en la que habitualmente se convierte la realizacin y
publicacin de un trabajo.
Los trabajos aqu presentados pretenden proporcionar los
principios bsicos de diseo, anlisis e interpretacin de los
resultados que capaciten al lector para entender e incluso realizar
dichos estudios.
Pretendemos abordar conjuntamente aspectos metodolgicos,
estadsticos y epidemiolgicos ya que todos ellos se precisan
para interpretar y realizar un estudio.

Fuente:http://www.fisterra.com/mbe/investiga/index.asp
I nvest igacin: Element o bsicos en el diseo de un est udio 1/ 4

www. fist erra. com At encin Primar ia en la Red
Elementos bsicos en el diseo de un estudio
Pita Fernndez, S.
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario Juan Canalejo. A Corua
(Espaa)
Cad Aten Primaria 1996; 3: 83-85. Actualizacin 08/01/2001.
_________________________________
La investigacin se debe entender como el proceso dedicado a responder a una pregunta. Dicha respuesta
lo que pretender es aclarar la incertidumbre de nuestro conocimiento. No se trata de almacenar datos de
forma indiscriminada sino que se define como un proceso sistemtico, organizado y objetivo destinado a
responder a una pregunta. La palabra "sistemtico" significa que a partir de la formulacin de una
hiptesis u objetivo de trabajo se recogen unos datos segn un plan preestablecido que, una vez
analizados e interpretados, modificarn o aadirn nuevos conocimientos a los ya existentes (Tabla 1)
(1,2). El mtodo cientfico parte de la observacin de una realidad, se elabora una hiptesis explicativa, se
contrastan las hiptesis y dicha hiptesis se acepta se realizan proposiciones que forman la teora
cientfica.

TABLA 1. Esquema gener al del pl ant eami ent o de un est udi o.
Hipt esis de t r abaj o
Obj et ivos
Diseo de est udio
Seleccin de variables
Definicin de variables
Escala de medida
Prot ocolo de recogida de dat os
Seleccin de la muest ra
o Cunt os?
o Quines?
Recogida de dat os
Aut omat izacin de los dat os
Depuracin de los dat os
Anlisis
Result ados
Conclusiones

La epidemiologa y la estadstica son instrumentos indispensables para la realizacin de este proceso. En
general podemos decir lo que habitualmente sucede es que de una poblacin se extrae una muestra, sobre
la que se realiza un experimento o medicin y los resultados del mismo se extrapolan nuevamente a la
poblacin realizando una estimacin con una seguridad definida completando as la inferencia (Tabla 2)
(3,4).


Tabl a 2. El ement os de l a i nf er enci a est adst i ca
La definicin del objetivo es el eje en torno al cual se construye la estructura del estudio. Si este objetivo
no est claramente definido ser difcil tomar decisiones sobre el tipo de estudio ms apropiado, sobre la
seleccin de la muestra, sobre el tamao muestral, sobre las variables a medir y sobre el anlisis
estadstico a realizar.
El problema a investigar debe entenderse como la incertidumbre sobre algn hecho o fenmeno que el
investigador desea resolver realizando mediciones en los sujetos del estudio. En este proceso es
fundamental la realizacin de la revisin bibliogrfica que como se seala en la tabla 3 presenta
importantes utilidades y por consiguiente es imprescindible (5).
Tabl a 3. UTI LI DAD DE LA REVI SI N BI BLI OGRFI CA
Fuent e de ideas suscept ibles de invest igacin.
Valoracin de los conocimient os act uales sobre el t ema.
Valoracin sobre la per t inencia y viabilidad del proyect o.
Provisin del marco concept ual para la invest igacin.
Ayuda en la delimit acin del obj et ivo especfico.
I nformacin sobre aspect os concret os del diseo:
o Est rat egias
o Procedimient os
o Paut as de seguimient o
o Crit erios de seleccin
o Det er minacin del t amao de la muest ra
o Definicin de variables
o I nst r ument os de medicin
o Prevencin de problemas
o Anlisis est adst ico
Comparacin de los propios r esult ados con est udios similares.
Cont ribucin a la valoracin de la validez ext rema.
Fuent e: Argimn Pallas J. M. , Jimnez Villa J. ( 5)

La pregunta a investigar debe reunir en definitiva una serie de caractersticas que se sealan en la tabla 4
y que se resumiran diciendo que debe ser factible, interesante, novedosa, tica y relevante (2).


Tabl a 4. CRI TERI OS DE UNA BUENA PREGUNTA A I NVESTI GAR
FACTI BLE
o Nmero adecuado de individuos
o Experiencia t cnica adecuada
o Abordable en cuant o a t iempo y dinero
o Manej able en cuant o al alcance
I NTERESANTE PARA EL I NVESTI GADOR. NOVEDOSA
o Confirma o refut a hallazgos previos
o Amplia hallazgos previos
o Proporciona nuevos result ados
TI CA Y RELEVANTE
o Para el conocimient o cient fico
o Para la polt ica clnica sanit aria
o Para lneas de invest igacin fut uras
Fuent e: St ephen B. Hulley, St even R. Cummings ( 2)
La falta de claridad en nuestra pregunta no nos permitir entre otras cosas poder calcular el tamao
muestral de nuestro estudio, donde precisaremos conocer la seguridad de nuestra estimacin, la precisin
de nuestra inferencia, el poder estadstico o la capacidad para detectar diferencias si es que existen. Si
estos pasos han sido solucionados, debemos decidir a la vez que tipo de estudio epidemiolgico vamos a
realizar. Los estudios epidemiolgicos clsicamente se dividen en experimentales y no experimentales.
En los estudios experimentales (ensayos clnicos, ensayos de campo, ensayos comunitarios) se produce
una manipulacin de una exposicin determinada en un grupo de individuos que se compara con otro
grupo en el que no se intervino, o al que se expone a otra intervencin. Cuando el experimento no es
posible se disean estudios no experimentales que simulan de alguna forma el experimento que no se ha
podido realizar (estudios ecolgicos, estudios de prevalencia, estudios de casos y controles, estudios de
cohortes o de seguimiento) (6,7).
Tras decidir el tipo de estudio habr que tener en consideracin las amenazas o riesgos que dicho estudio
lleva implcitos; en particular debemos reflexionar sobre los sesgos del estudio. En el sesgo de seleccin
los grupos no son comparables debido a como fueron seleccionados los pacientes (eleccin inadecuada
del grupo control, eleccin inadecuada del espacio muestral, prdidas de seguimiento y supervivencia
selectiva), en el sesgo de informacin los grupos no son comparables debido a como se obtuvieron los
datos (instrumento de medida no adecuado, diagnstico incorrecto, omisiones, imprecisiones, vigilancia
desigual en expuestos y no expuestos, errores de clasificacin, errores en los cuestionarios o
procedimientos) y finalmente en el sesgo de confusin existe una mezcla de efectos debido a una
tercera o ms variables. Esta variable est asociada con la exposicin a estudio e independientemente de
la exposicin es un factor de riesgo para la enfermedad. La confusin puede ser controlada en el diseo
del estudio y en el anlisis del mismo con lo cual nuestro estudio podra ser vlido. La presencia de
sesgos de seleccin e informacin podran ser cuantificados en algunas ocasiones pero invalidaran el
estudio (8).
Podemos afirmar sin lugar a dudas que realizar un estudio es una carrera de obstculos que an no siendo
infranqueables, permanentemente estn presentes y dificultan a la vez que hacen atractivo la realizacin
de cualquier trabajo de investigacin.
M. Susser en sus reflexiones sobre causalidad (9) sealaba "cuando hay minas por todas partes no debe
uno aventurarse sin un detector de minas". El conocimiento de la metodologa y su aplicacin a la
prctica clnica debemos considerarla como un elemento til, necesario y atractivo pues nos va a permitir
aumentar nuestra capacidad para responder a preguntas a la vez que incrementar nuestra capacidad
crtica para discriminar lo seguro y correcto de lo que no lo es tanto.
Bi bl i ogr af a
1. Contandriopoulos AP. Champagne F. Potvin L, Denis JL, Boyle P. Preparar un proyecto de
investigacin. Barcelona: SG Editores; 1991.
2. Stephen B. Hulley, Steven R. Cummings. Diseo de la investigacin clnica. Un enfoque
epidemiolgico. Barcelona: Doyma; 1993.

3. Beth Dawson-sauders, Robert G. Trapp. Bioestadstica Mdica Mxico, D.F.: Editorial el
Manuel Moderno; 1993.
4. J.S. Milton, J.O. Tsokos. Estadistica para biologa y ciencias de la salud. Madrid:
Interamericana-McGraw Hill; 1989.
5. Argimn Pallas J.M. Jimenez Villa J. Mtodos de Investigacin aplicados a la atencin primaria
de salud. Barcelona: Ediciones Doyma; 1991.
6. Hennekens CH, Buring JE. Epidemioloy in Medicine. Boston: Little Brown and Company;
1987.
7. Kelsey JL, Thompson WD, Evans AS. Methods in Observational Epidemiology. New York:
Oxford University Press; 1986.
8. Kleinbaum DG, Kupper LL, Morgenstern H. Epidemiologic research. Principles and
Quantiative Methods. Belmont. California: Lifetime Learning Publications; 1982.
9. Susser M. Conceptos y estrategias en epidemiologa. El pensamiento causal en ciencias de la
salud. Mxico: Biblioteca de la Salud; 1991.

I nvest igacin: Dificult ades de los mdicos 1/ 4

Dificultades de los mdicos para la realizacin
de estudios clnico-epidemiolgicos

Pita Fernndez, S.
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario Juan Canalejo. A Corua.
Ponencia: Congreso Galego de Estadstica e Investigacin de Operacins.
Santiago de Compostela, A Corua (Espaa). 11-13 Novembre-1999.
Actualizacin 15/01/2001.
________________________________
La prctica mdica diaria requiere la toma de decisiones sobre actividades preventivas, diagnsticas,
teraputicas y pronsticas basadas en clculo de probabilidades que pretenden delimitar la incertidumbre
que envuelve la prctica de la medicina. Con frecuencia existen dificultades para trasladar los resultados
de una investigacin a la prctica clnica por la forma en que habitualmente se presentan los resultados en
trminos de: p<0.05, p<0.01, riesgo relativo, odds ratio, reduccin absoluta del riesgo, reduccin relativa
del riesgo, fraccin atribuible poblacional o fraccin etiolgica. A este lenguaje con el que muchos
profesionales sanitarios no estn familiarizados y tienen dificultades para su compresin (1,2) se suma el
hecho que adems los resultados de un estudio pueden ser estadsticamente significativos y no ser
clnicamente relevantes (3).
El mtodo cientfico parte de la observacin de una realidad, se elabora una hiptesis explicativa, se
contrastan las hiptesis y si dicha hiptesis es aceptada se realizan proposiciones que forman la teora
cientfica. Dicho procedimiento requiere un proceso sistemtico, organizado y objetivo destinado a
responder a una pregunta (Tabla 1) (4,5) que los profesionales sanitarios perciben como una carrera
infinita de obstculos. En este contesto de dificultad muchos profesionales sanitarios acuden a los
epidemilogos y estadsticos solicitando diferentes tipo de ayudas. As algunos acuden solamente para
que se les calcule una "p", otras acuden porque quieren cruzar variables, otros a que le "echen los
nmeros", otros a que se les calcule el tamao de la muestra y otros cada vez ms numeroso a que se les
ayude a disear el estudio desde el principio.
TABLA 1. Esquema gener al del pl ant eami ent o de un est udi o.
Hipt esis de t r abaj o
Obj et ivos
Diseo de est udio
Seleccin de variables
Definicin de variables
Escala de medida
Prot ocolo de recogida de dat os
Seleccin de la muest ra
o Cunt os?
o Quines?
Recogida de dat os
Aut omat izacin de los dat os
Depuracin de los dat os
Anlisis
Result ados
Conclusiones
Las dificultades que presentan los mdicos para entender el lenguaje y/o metodologa de los estadsticos y
epidemilogos radica fundamentalmente y entre otras razones en que ambos trabajan en escenarios
diferentes. Los clnicos y los epidemilogos/estadsticos deben de resolver problemas diferentes. El
clnico trabaja con un paciente que conoce por nombre y apellidos, sabe sus antecedentes y hasta conoce a
su familia, los estadsticos estudian a los pacientes de cien en cien o de mil en mil y siempre le dicen al
clnico que tiene pocos pacientes. El clnico desea realizar un diagnstico concreto a un paciente
determinado y el estadstico le habla de curvas ROC, valores predictivos, sensibilidad, especificidad.... El
clnico quiere concretar la causa de la enfermedad y el estadstico le calcula un OR (odds ratio) un RR
(riesgo relativo), 95% intervalos de confianza y gradientes biolgicos controlando eso s por confusin

con tcnicas de regresin mltiple. El clnico desea conocer la mejor teraputica y el estadstico le calcula
reducciones relativas de riesgo, reducciones absolutas y nmero necesario de pacientes a tratar para
prevenir un evento. El clnico desea conocer el pronstico de un paciente determinado y el estadstico le
habla de Kaplan-Meier, de asuncin de riesgos proporcionales y de regresiones de Cox. Ambos abordan
problemas en escenarios diferentes de los cuales ambos logran objetivos diferentes, el clnico se centra en
el paciente y los estadsticos y epidemilogos se centran en la enfermedad (6,7). A parte de los problemas
estrictamente metodolgicos los profesesionales sanitarios deben a su vez afrontar problemas en relacin
con la viabilidad y pertinencia de los diferentes estudios como se indican en la tabla 2. El disponer del
tiempo, independientemente del conocimiento metodolgico, es uno de los importantes problemas que
todos los profesionales sanitarios acusan como muy importante.
TABLA 2. Di f i cul t ades en r el aci n a l a v i abi l i dad y per t i nenci a de un
est udi o.
Vi abi l i dad
o Disponibilidad de t iempo
o Conocimient o met odolgico
o Disposicin de grupos de apoyo met odolgico, est adst ico,
informt ico
o Disponibilidad de nmero de pacient es suficient es
o Ut ilizacin de variables que puedan medirse y cuant ificarse
o Colaboracin con ot ros profesionales, equipos o cent ros
o Disponibilidad de recursos econmicos
o Consideraciones t ico- legales
o Experiencia del invest igador
Per t i nenci a
o La pregunt a plant eada no ha sido cont est ada, lo ha sido de
forma cont radict oria o se requier e adecuar la a la propia
prct ica
o I mport ancia del problema:
! Frecuencia
! Gravedad
! I nt er s social
! Beneficios que pueden der ivarse de los result ados
! I mport ancia de su valor t erico
o Los result ados esper eables compensan los r ecur sos
ut ilizados
Los problemas que presentas los clnicos para la ejecucin de diferentes tipos de estudios clnico
epidemiolgicos no son solo puramente estadsticos como lo muestra el resultado de la evaluacin de los
454 ensayos clnicos evaluados por el comit tico de ensayos clnicos de la Comunidad Autnoma de
Galicia que siguiendo los procedimientos normalizados de trabajo se presentan en la tabla 3 (8). La causa
ms frecuente de valoracin positiva condicional o negativa han sido los aspectos ticos entendiendo
como tales y por orden de frecuencia: la informacin al paciente/consentimiento informado, pliza de
seguros/indemnizacin, consideraciones ticas generales y contenidos del presupuesto econmico. Los
problemas de anlisis estadstico figuran en ltimo lugar. Es evidente que este hallazgo refleja la realidad
de que el aspecto cuantitativo del ensayo este diseado por grupos de expertos conocedores la
metodologa cuantitativa que la industria farmacutica posee.

TABLA 3. Di ct amen f i nal de t odos l os ensay os cl ni cos eval uados por el
Comi t Et i co de i nvest i gaci n Cl ni ca de Gal i ci a ( Oct ubr e/ 1996 a
Oct ubr e/ 1999) .
N %
Procedent es 337 74.2
Procedent e condicionado 61 13.4
No procedent e 43 9.5
Ret irado 12 2.6
Ot ros 1 0.2
TOTAL 454 100

Causas de val or aci n posi t i va condi ci onal o negat i va
Aspect os t icos 49.1 %
I nvest igador Principal ( falt a de firma del proyect o. . . ) 8.4 %
Seleccin de los pacient es 8.3 %
Just ificacin y obj et ivos 6.8 %
Consideraciones prct icas 5.6 %
Tipo de ensayo clnico y diseo del mismo 5.6 %
Descripcin del t rat amient o 3.6 %
Desarrollo del ensayo y evaluacin de la respuest a 3.4 %
Anlisis est adst ico 2.4 %
Ot ras causas 6.8 %
Los problemas estrictamente estadsticos de los ensayos clnicos han sido por otra parte sealados por
Pocock (9) y se resumen en la tabla 4.
Tabl a 4. Pr obl emas est adst i cos de l os ensay os cl ni cos
Mlt iples " end point s" .
Los result ados de obj et ivos secundar ios deben present arse como dat os
explorat or ios.
Si no hay suficient e poder est adst ico los anlisis de subgr upos deben
evit arse.
Los ensayos con medidas repet idas en el t iempo requier en un abordaj e
est adst ico de anlisis diferent e y los t est est adst icos repet idos en cada
punt o en el t iempo deben evit arse.
En ensayos con ms de dos t rat amient os el t rat amient o primario de
cont rast e debe clarament e indicar se y enfat izarse en el informe.
Limit ar el nmero de t est est adst icos realizados.
Poner el valor exact o de la p, indicar la magnit ud del efect o del
t rat amient o y sus int ervalos de confianza.
El t amao muest ral y su j ust ificacin deben indicarse en el diseo.
Los anlisis y frecuencia de anlisis int er medios a realizar deben est ar
clarament e definidos.
La decisin de parar el est udio debe basar se en crit er ios est adst icos
clarament e definidos e indicados en el diseo.
El resumen mencionar la magnit ud del efect o del t rat amient o ms que su
significancia est adst ica.
Una parte importante de la investigacin que se realiza en el mbito de la atencin primaria en nuestro
pas se presenta en los congresos nacionales de Medicina Familiar y Comunitaria. En el ao 1993
nosotros pusimos en marcha un sistema de evaluacin de las comunicaciones que se presentan en los
congresos nacionales de esta especialidad (10). Dicho sistema pretende identificar las causas de
denegacin de los trabajos que se rechazan considerando las normas de presentacin, la originalidad, el
inters y la metodologa. En dicho ao se aceptaron 358 comunicaciones (54.9%) de un total de 652,
siendo las causas de exclusin las que se resumen en la tabla 5. En dicho anlisis se objetiv que los
problemas ms frecuentemente detectados han sido la falta de originalidad, resmenes mal estructurados
que no aportaban elementos de valoracin, conclusiones que no se derivaban del estudio y estudios no
apropiados para alcanzar los objetivos del mismo. En las fases de una investigacin clinico-
epidemiolgica la colaboracin del bioestadstico con los profesionales sanitarios consideramos que es de
suma utilidad para activamente participar en apartados como: seleccin de la variable respuesta,
definicin de los criterios de seleccin de la poblacin de estudio, eleccin de la tcnica de seleccin de
los sujetos, clculo del nmero de sujetos necesarios, seleccin de las variables que deben ser medidas,
estimacin de la magnitud del efecto o respuesta observada, control de factores de confusin e
interpretacin de los resultados.
Sealbamos inicialmente que los problemas que presentan los profesionales sanitarios para la ejecucin
de estudios clnico-epidemiolgicos son mltiples y como hemos indicado no solo se limitan a problemas
estrictamente metodolgicos y estadsticos sino que se deben abordar adems problemas ticos y

problemas de originalidad entre otros. La estadstica y el mtodo epidemiolgico consideramos que
pretenden aportar ms ciencia al arte de la medicina y es por ello que la colaboracin de expertos en
metodologa, bioestadsticos y los clnicos deben conjuntamente colaborar para en un esfuerzo conjunto
reducir la variabilidad que rodea al ejercicio de la medicina que es una ciencia de probabilidades y un arte
de manejar la incertidumbre.
TABLA 5. Causas de denegaci n de comuni caci ones. XI I I Congr eso
Naci onal de Medi ci na Fami l i ar y Comuni t ar i a ( 9)
Pr esent aci n
n %
17 5.8
No cumple las normas de acept acin
I legible
Tachaduras o errat as graves
Abreviat uras no explicadas
Or i gi nal i dad
112 38.1 Tema reit eradament e expuest o
I nt er s par a l a at enci n pr i mar i a
14 4.8
El t ema de invest igacin no est , o lo est escasament e
relacionado con la At encin Primar ia
Met odol oga
36 12.2 Obj et ivos mal definidos
79 26.9
El t ipo de est udio no es apropiado para alcanzar los obj et ivos del
est udio
19 6.5 Seleccin de muest ra inadecuada
13 4.4 Tamao de muest ra inadecuada
49 16.7
Presencia de sesgos de seleccin infor macin o confusin que
invalidan el est udio
12 4.1 La infer encia es incorrect a
35 11.9 Result ados no cuant ificados
26 8.8 Anlisis incorrect o del est udio
31 10.5 Present acin inadecuada de r esult ados
14 4.8 No hay conclusiones
80 27.2
Las conclusiones no se der ivan del est udio realizado o de los
result ados obt enidos
83 28.2 Trabaj o invalor able pues no aport a element os
Bi bl i ogr af a
1. Greenwood M. The statistician and medical research. BMJ 1948; 2:467-8.
2. Berwick DM, Fineberg HV, Weinstein MC. When doctors meet numbers. Am J Med 1981;
71:991-998. [Medline]
3. Laupacis A, Sackett DI, Roberts RS. An assesment of clinically useful measures of the
consequences of treatment. N. Engl J Med 1988; 318: 1728-1733. [Medline]
4. Contandripoulos AP, Champagne F. Potvin L, Denis JL, Boyle P. Preparar un proyecto de
investigacin. Barcelona: SG Editores; 1991.
5. StephenB. Hulley, Steven R. Cummings. Diseo de la investigacin clnica. Un enfoque
epidemiolgico. Barcelon. Doyma; 1993.
6. Jenicek M. Clroux R. Epidemiologa. Principios-Tcnicas-Aplicaciones. Barcelona; Salvat;
1988.
7. Sackett DL, Haynes RB , Guyatt GH, Tugwell P. Epidemiologa clnica. Ciencias bsicas para
la medicina clnica, 2 ed. Madrid: Editorial Mdica Panamericana; 1994.
8. Memoria. Comit Etico de investigacin Clnica de Galicia 1996-1999. Divisin de Farmacia e
Productos Sanitarios. Santiago: Xunta de Galicia, Servicio Galego de Saude; 1999.
9. Pocock SJ. Hughes MD, Lee RJ. Statistical Problemas in the reporting of clinical trials. A
survey of Three Meical Journals. N Eng J Med 1987; 317: 426-32. [Medline]
10. Pita Fernndez S. Evaluacin de comunicaciones del XIII Congreso de Medicina Familiar y
Comunitaria (La Corua). Aten Primaria 1994; 13: 150-152. [Medline]
I nvest igacin: Medidas de frecuencia de enfermedad: incidencia y prevalencia 1/ 6

Medidas de frecuencia de enfermedad
Autores: Pita Fernndez S (1), Prtegas Daz S (1), Valds Caedo F. (2)
(1) Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario-Universitario Juan
Canalejo. A Corua (Espaa).
(2) Servicio de Nefrologa. Complexo Hospitalario-Universitario Juan Canalejo. A Corua (Espaa).
_________________________________
La epidemiologa tiene entre uno de sus objetivos primordiales el estudio de la distribucin y los
determinantes de las diferentes enfermedades. La cuantificacin y la medida de la enfermedad o de otras
variables de inters son elementos fundamentales para formular y testar hiptesis, as como para permitir
comparar las frecuencias de enfermedad entre diferentes poblaciones o entre personas con o sin una
exposicin o caracterstica dentro de una poblacin determinada.
La medida ms elemental de frecuencia de una enfermedad, o de cualquier otro evento en general, es el
nmero de personas que la padecen o lo presentan (por ejemplo, el nmero de pacientes con hipertensin
arterial, el nmero de fallecidos por accidentes de trfico o el nmero de pacientes con algn tipo de
cncer en los que se ha registrado una recidiva). Sin embargo, dicha medida por s sola carece de utilidad
para determinar la importancia de un problema de salud determinado, pues debe referirse siempre al
tamao de la poblacin de donde provienen los casos y al periodo de tiempo en el cual estos fueron
identificados. Para este propsito, en epidemiologa suele trabajarse con diferentes tipos de fracciones que
permiten cuantificar correctamente el impacto de una determinada enfermedad:
a. Proporcin: es un cociente en el que el numerador est incluido en el denominador. Por
ejemplo, si en una poblacin de 25.000 habitantes se diagnostican 1.500 pacientes con diabetes,
la proporcin de diabetes en esa poblacin es de 1.500/25.000 = 0.06 (6%). El valor de una
proporcin puede variar as de 0 a 1, y suele expresarse como un porcentaje.
b. Razn: En este cociente el numerador no forma parte del denominador. En el ejemplo anterior,
la razn entre la poblacin con diabetes y la poblacin no diabtica es de 1.500/23.500 = 3/47
=0,064. Cuando, como en el caso del ejemplo, la razn se calcula entre la probabilidad de que
ocurra un evento y la probabilidad de que ste no ocurra, la razn recibe tambin el nombre de
odds. En el ejemplo, la odds de diabetes es de 0,06, es decir, en el rea de estudio por cada
1/0,064 = 16,7 pacientes no diabticos hay 1 que s lo es.
El valor de una odds puede ir de 0 a infinito. El valor 0 corresponde al caso en que la enfermedad nunca
ocurre, mientras que el valor infinito correspondera tericamente a una enfermedad que est siempre
presente. En realidad, una proporcin y una odds miden el mismo evento pero en escalas diferentes, y
pueden relacionarse mediante las frmulas siguientes:
1 Odds
Odds
Proporcin
+
=

Proporcin - 1
Proporcin
Odds =

c. Tasa: El concepto de tasa es similar al de una proporcin, con la diferencia de que las tasas
llevan incorporado el concepto de tiempo. El numerador lo constituye la frecuencia absoluta de
casos del problema a estudiar. A su vez, el denominador est constituido por la suma de los
perodos individuales de riesgo a los que han estado expuestos los sujetos susceptibles de la
poblacin a estudio. De su clculo se desprende la velocidad con que se produce el cambio de
una situacin clnica a otra.
En epidemiologa, las medidas de frecuencia de enfermedad ms comnmente utilizadas se engloban en
dos categoras
1-6
: Prevalencia e Incidencia.
Prevalencia

La prevalencia
7
(P) cuantifica la proporcin de individuos de una poblacin que padecen una
enfermedad en un momento o periodo de tiempo determinado. Su clculo se estima mediante la
expresin:
momento ese en poblacin de Total
dado momento un en enfermedad la con casos de N
= P

Para ilustrar su clculo, consideremos el siguiente ejemplo: en una muestra de 270 habitantes
aleatoriamente seleccionada de una poblacin de 65 y ms aos se objetiv que 111 presentaban obesidad
(IMC30). En este caso, la prevalencia de obesidad en ese grupo de edad y en esa poblacin sera de:
% 1 , 41 411 , 0
270
111
P = =

Como todas las proporciones, la prevalencia no tiene dimensin y nunca toma valores menores de 0
mayores de 1, siendo frecuente expresarla en trminos de porcentaje, en tanto por ciento, tanto por mil,...
en funcin de la rareza de la enfermedad estudiada. La prevalencia de un problema de salud en una
comunidad determinada suele estimarse a partir de estudios transversales para determinar su importancia
en un momento concreto, y no con fines predictivos. Adems, es evidente que el clculo de la prevalencia
ser especialmente apropiado para la medicin de procesos de carcter prolongado, pero no tendr mucho
sentido para valorar la importancia de otros fenmenos de carcter ms momentneo (accidentes de
trfico, apendicitis, infarto de miocardio,...).
Otra medida de prevalencia utilizada en epidemiologa, aunque no con tanta frecuencia, es la llamada
prevalencia de periodo, calculada como la proporcin de personas que han presentado la enfermedad en
algn momento a lo largo de un periodo de tiempo determinado (por ejemplo, la prevalencia de cncer en
Espaa en los ltimos 5 aos). El principal problema que plantea el clculo de este ndice es que la
poblacin total a la que se refiere puede haber cambiado durante el periodo de estudio. Normalmente, la
poblacin que se toma como denominador corresponde al punto medio del periodo considerado. Un caso
especial de esta prevalencia de periodo, pero que presenta importantes dificultades para su clculo, es la
llamada prevalencia de vida, que trata de estimar la probabilidad de que un individuo desarrolle una
enfermedad en algn momento a lo largo de su existencia.
Incidencia
La incidencia
8
se define como el nmero de casos nuevos de una enfermedad que se desarrollan en una
poblacin durante un perodo de tiempo determinado. Hay dos tipos de medidas de incidencia: la
incidencia acumulada y la tasa de incidencia, tambin denominada densidad de incidencia.
La incidencia acumulada ( IA) es la proporcin de individuos sanos que desarrollan la enfermedad a lo
largo de un perodo de tiempo concreto. Se calcula segn:
o seguimient del inicio al riesgo en poblacin de Total
o seguimient el durante enfermedad una de nuevos casos de N
IA=

La incidencia acumulada proporciona una estimacin de la probabilidad o el riesgo de que un individuo
libre de una determinada enfermedad la desarrolle durante un perodo especificado de tiempo. Como
cualquier proporcin, suele venir dada en trminos de porcentaje. Adems, al no ser una tasa, es
imprescindible que se acompae del periodo de observacin para poder ser interpretada.
Por ejemplo: Durante un perodo de 6 aos se sigui a 431 varones entre 40 y 59 aos sanos, con
colesterol srico normal y tensin arterial normal, para detectar la presencia de cardiopata isqumica,
registrndose al final del perodo l0 casos de cardiopata isqumica. La incidencia acumulada en este caso
sera:

% 3 , 2 023 , 0
431
10
IA = =
en seis aos
La incidencia acumulada asume que la poblacin entera a riesgo al principio del estudio ha sido seguida
durante todo un perodo de tiempo determinado para observar si se desarrollaba la enfermedad objeto del
estudio. Sin embargo, en la realidad lo que sucede es que:
a. Las personas objeto de la investigacin entran en el estudio en diferentes momentos en el
tiempo.
b. El seguimiento de dichos sujetos objeto de la investigacin no es uniforme ya que de algunos no
se obtiene toda la informacin.
c. Por otra parte, algunos pacientes abandonan el estudio y slo proporcionan un seguimiento
limitado a un perodo corto de tiempo.
Para poder tener en consideracin estas variaciones de seguimiento existentes en el tiempo, una primera
aproximacin sera limitar el clculo de la incidencia acumulada al perodo de tiempo durante el cual la
poblacin entera proporcionase informacin. Esto de todos modos hara que perdisemos informacin
adicional del seguimiento disponible en alguna de las personas incluidas. La estimacin ms precisa es la
que utiliza toda la informacin disponible es la denominada tasa de incidencia o densidad de incidencia
(DI). Se calcula como el cociente entre el nmero de casos nuevos de una enfermedad ocurridos durante
el periodo de seguimiento y la suma de todos los tiempos individuales de observacin:
n observaci de es individual tiempos los de Suma
o seguimient de perodo el durante enfermedad una de nuevos casos de N
DI =

El total de personas-tiempo de observacin (suma de los tiempos individuales de observacin) es la suma
de los perodos de tiempo en riesgo de contraer la enfermedad correspondiente a cada uno de los
individuos de la poblacin. La suma de los perodos de tiempo del denominador se mide preferentemente
en aos y se conoce como tiempo en riesgo. El tiempo en riesgo para cada individuo objeto de estudio es
el tiempo durante el cual permanece en la poblacin de estudio y se encuentra libre de la enfermedad, y
por lo tanto en riesgo de contraerla.
La densidad de incidencia no es por lo tanto una proporcin, sino una tasa, ya que el denominador
incorpora la dimensin tiempo. Su valor no puede ser inferior a cero pero no tiene lmite superior.
Para ilustrar su clculo consideremos el siguiente ejemplo: En un estudio de seguimiento durante 20 aos
de tratamiento hormonal en 8 mujeres postmenopusicas se observ que se presentaron 3 casos de
enfermedad coronaria. Con estos datos, la incidencia acumulada sera de un 3/8 = 0,375 37,5%
durante los 20 aos de seguimiento. Sin embargo, tal y como se muestra en la Figura 1, el tiempo de
seguimiento no es el mismo para todas las pacientes. Mientras que, por ejemplo, la paciente A ha sido
observada durante todo el periodo, la paciente D ha comenzado el tratamiento ms tarde, una vez
comenzada la investigacin, y ha sido seguida slo durante 15 aos. En otros casos, como la paciente C,
han abandonado el tratamiento antes de finalizar el estudio sin presentar ninguna afeccin coronaria. En
total se obtienen 84 personas-ao de observacin. La tasa de incidencia result por tanto ser igual a:
036 , 0
28
1
84
3
DI = = =
personas por ao
Esto es, la densidad de incidencia de enfermedad coronaria en esa poblacin es de 3,6 nuevos casos por
cada 100 personas-ao de seguimiento.
La eleccin de una de las medidas de incidencia (incidencia acumulada o densidad de incidencia)
depender, adems del objetivo que se persiga, de las caractersticas de la enfermedad que se pretende
estudiar. As, la incidencia acumulada se utilizar generalmente cuando la enfermedad tenga un periodo
de latencia corto, recurrindose a la densidad de incidencia en el caso de enfermedades crnicas y con un
periodo de latencia mayor. En cualquier caso, debe tenerse en cuenta que la utilizacin de la densidad de
incidencia como medida de frecuencia de una enfermedad est sujeta a las siguientes condiciones:

a. El riesgo de contraer la enfermedad es constante durante todo el periodo de seguimiento. Si esto
no se cumple y, por ejemplo, se estudia una enfermedad con un periodo de incubacin muy
largo, el periodo de observacin debe dividirse en varios subperiodos.
b. La tasa de incidencia entre los casos que completan o no el seguimiento es similar. En caso
contrario se obtendra un resultado sesgado.
c. El denominador es adecuado a la historia de la enfermedad.
Adems, en el clculo de cualquier medida de incidencia han de tenerse en consideracin otros aspectos.
En primer lugar, no deben incluirse en el denominador casos prevalentes o sujetos que no estn en
condiciones de padecer la enfermedad a estudio. El denominador slo debe incluir a aquellas personas en
riesgo de contraer la enfermedad (por ejemplo, la incidencia de cncer de prstata deber calcularse en
relacin a la poblacin masculina en una comunidad y no sobre la poblacin total), aunque tambin es
cierto que en problemas poco frecuentes la inclusin de casos prevalentes no cambiar mucho el
resultado. En segundo lugar, adems, es importante aclarar, cuando la enfermedad pueda ser recurrente, si
el numerador se refiere a casos nuevos o a episodios de una misma patologa.
Relacin entre incidencia y prevalencia
Prevalencia e incidencia son conceptos a su vez muy relacionados. La prevalencia depende de la
incidencia y de la duracin de la enfermedad. Si la incidencia de una enfermedad es baja pero los
afectados tienen la enfermedad durante un largo perodo de tiempo, la proporcin de la poblacin que
tenga la enfermedad en un momento dado puede ser alta en relacin con su incidencia. Inversamente, si
la incidencia es alta y la duracin es corta, ya sea porque se recuperan pronto o fallecen, la prevalencia
puede ser baja en relacin a la incidencia de dicha patologa. Por lo tanto, los cambios de prevalencia de
un momento a otro pueden ser resultado de cambios en la incidencia, cambios en la duracin de la
enfermedad o ambos.
Esta relacin entre incidencia y prevalencia puede expresarse matemticamente de un modo bastante
sencillo
4,7,9
. Si se asume que las circunstancias de la poblacin son estables, entendiendo por estable que
la incidencia de la enfermedad haya permanecido constante a lo largo del tiempo, as como su duracin,
entonces la prevalencia tampoco variar. As, si el nmero de casos prevalentes no cambia, el nmero de
casos nuevos de la enfermedad ha de compensar a aquellos individuos que dejan de padecerla:
N de casos nuevos de la enfermedad = N de casos que se curan o fallecen (1)
Si se denota por N al total de la poblacin y E al nmero de enfermos en la misma, N-E ser el total de
sujetos sanos en esa poblacin. Durante un periodo de tiempo t, el nmero de gente que contrae la
enfermedad viene dado entonces por:
( ) E - N t DI

(2)
donde DI denota a la densidad de incidencia.
Por otro lado, el nmero de enfermos que se curan o fallecen en ese periodo puede calcularse como:
E t
D
1

(3)
donde D es la duracin media de la enfermedad objeto de estudio.
Combinando (2) y (3) en (1) se obtiene que:
D DI
E - N
E
E t
D
1
E) - (N t DI = =
(4)

El cociente E/N-E es el cociente entre los individuos enfermos y los no enfermos, o equivalentemente,
entre la prevalencia y su complementario, P/1-P (lo que habamos denominado odds), de modo que la
expresin (4) puede escribirse equivalentemente como:
D DI
P - 1
P
=

(5)
En el caso adems en el que la prevalencia de la enfermedad en la poblacin sea baja, la cantidad 1 - P es
aproximadamente igual a 1 y la expresin (5) quedara finalmente:
D DI P =

(6)
Es decir, si se asume que las circunstancias de la poblacin son estables y la enfermedad es poco
frecunente, la prevalencia es proporcional al producto de la densidad de incidencia (DI) y el promedio de
duracin de la enfermedad (D).
De las consideraciones anteriores se deduce que la prevalencia carece de utilidad para confirmar hiptesis
etiolgicas, por lo que resulta ms adecuado trabajar con casos incidentes. Los estudios de prevalencia
pueden obtener asociaciones que reflejen los determinantes de la supervivencia y no las causas de la
misma, conduciendo a conclusiones errneas. No obstante, su relacin con la incidencia permite que en
ocasiones pueda utilizarse como una buena aproximacin del riesgo para evaluar la asociacin entre las
causas y la enfermedad. Tambin es cierto que en otras aplicaciones distintas a la investigacin
etiolgica, como en la planificacin de recursos o las prestaciones sanitarias, la prevalencia puede ser una
mejor medida que la incidencia ya que nos permite conocer la magnitud global del problema.

Bibliografa
1. Kark SL. Epidemiology and community medicine. Nueva York: Appleton-Century-Crofts; 1975.
p.19-21.
2. Kleimbaum D, Kupper I, Morgenstern H. Epidemiologic Research. Belmont: Lifetime Learning
Publications; 1982.
3. Mausner J, Kramer S. Epidemiology: an introductory text. 2 ed. Filadelfia: WB Saunders Company;
1985.
4. Rothman KJ. Modern Epidemiology. Boston: Little, Brown & Co; 1986.
5. Colimn KM. Fundamentos de epidemiologa. 2 ed. Madrid: Daz de Santos; 1990.
6. Argimn Palls JM, Jimnez Villa J. Mtodos de Investigacin Clnica y Epidemiolgica. 2 ed.
Madrid: Harcourt; 2000.
7. Tapia Granados JA. Medidas de prevalencia y relacin incidencia-prevalencia. Med Clin (Barc)
1995; 105: 216-218. [Medline]
8. Tapia Granados JA. Incidencia: concepto, terminologa y anlisis dimensional. Med Clin (Barc)
1994; 103: 140-142. [Medline]
9. Freeman J, Hutchinson GB. Prevalence, incidente and duration. Am J Epidemiol 1980; 112: 707-723.
[Medline]


Fi gur a 1. Ej empl o de cl cul o de l a densi dad de i nci denci a: est udi o de segui mi ent o de una
cohor t e de muj er es post menopusi cas con t r at ami ent o hor monal .
A
D
B
E
C
F
G
H
FINAL DEL
ESTUDIO
Tiempo de seguimiento
Enfermedad coronaria
A
B
C
FINAL DEL
ESTUDIO
A
D
B
E
C
F
G
H
FINAL DEL
ESTUDIO
Enfermedad coronaria
A
B
C
FINAL DEL
ESTUDIO

Pacient e Seguimient o ( aos) Enfer medad coronaria
A 20 No
B 10 S
C 15 No
D 15 No
E 4 S
F 6 No
G 7 No
H 7 S

I nvest igacin: Clculo de probabilidades: nociones bsicas 1/ 6

Calculo de probabilidades: nociones bsicas.
Prtegas Daz S (1), Pita Fernndez S (1),
(1) Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario Juan Canalejo. A Corua
(Espaa)
_________________________________
La estadstica, junto con la epidemiologa, es un instrumento indispensable en el proceso de investigacin
en medicina. Formalmente, se puede clasificar la estadstica en descriptiva, cuando se utiliza
simplemente para la presentacin y sntesis de la informacin recogida en un estudio, e inferencial, que
tiene por objetivo generalizar la informacin obtenida en una muestra a resultados vlidos para la
poblacin de la que procede
1
. Supongamos, por ejemplo, que nos interesa comparar dos frmacos A y B y
determinar cul de ellos es ms eficaz para el tratamiento de una determinada enfermedad. Para ello, se
disea un estudio distribuyendo 100 enfermos en dos grupos, cada uno de los cuales recibe uno de los dos
tratamientos. Al cabo de 1 mes, la tasa de curacin en cada grupo es del 80% y del 70%, respectivamente.
Ante esta informacin, es correcto suponer que el tratamiento A es mejor que el tratamiento B para esta
enfermedad en concreto? La respuesta a esta pregunta, como a la mayor parte de problemas que pueden
plantearse en medicina, est sujeta a un cierto grado de incertidumbre que hacen muy complicado tomar
una decisin al respecto. En la respuesta de un paciente al tratamiento pueden influir diversos factores,
entre los que se incluye el azar, que pueden provocar una gran variabilidad en los resultados. La
aplicacin de los principios de la estadstica a la clnica permite reducir y cuantificar dicha variabilidad y
ayudar a la toma de decisiones. En particular, el clculo de probabilidades suministra las reglas
apropiadas para cuantificar esa incertidumbre y constituye la base para la estadstica inductiva o
inferencial.
El objetivo de este trabajo consiste en introducir algunos de los conceptos bsicos del clculo de
probabilidades, as como las reglas necesarias para el desarrollo de la inferencia estadstica en medicina.
Una exposicin ms detallada de estos y otros conceptos puede encontrarse en referencias ms
especializadas
2-8
.
El concepto de probabilidad resulta familiar a cualquier profesional del mbito sanitario, pero una
definicin ms precisa exige considerar la naturaleza matemtica de dicho concepto. La probabilidad de
ocurrencia de un determinado suceso podra definirse como la proporcin de veces que ocurrira dicho
suceso si se repitiese un experimento o una observacin en un nmero grande de ocasiones bajo
condiciones similares. Por definicin, entonces, la probabilidad se mide por un nmero entre cero y uno:
si un suceso no ocurre nunca, su probabilidad asociada es cero, mientras que si ocurriese siempre su
probabilidad sera igual a uno. As, las probabilidades suelen venir expresadas como decimales,
fracciones o porcentajes.
La definicin anterior de probabilidad corresponde a la conocida como definicin frecuentista. Existe otra
descripcin ms formal desde el punto terico que permite definir el concepto de probabilidad mediante
la verificacin de ciertos axiomas a partir de los que se deducen todas las dems propiedades del clculo
de probabilidades
2
. En otros contextos, se ha defendido una interpretacin ms amplia del concepto de
probabilidad que incluye las que podemos denominar probabilidades subjetivas o personales, mediante las
cuales se expresa el grado de confianza o experiencia en una proposicin. Esta definicin constituye la
base de los llamados mtodos bayesianos, que se presentan como alternativa a la estadstica tradicional
centrada en el contraste de hiptesis
9-11
. No obstante, y en relacin con el propsito de este trabajo,
bastar con considerar la definicin frecuentista anterior. As, a partir de una poblacin con N elementos,
de los cuales k presentan una caracterstica A, se estimar la probabilidad de la caracterstica A como
P(A) = k/N. As, por ejemplo, en una poblacin de 100 pacientes, 5 de los cuales son diabticos, la
probabilidad de padecer diabetes p(Diabetes) se estimar como el cocient:e 5/100= 0.5.
Es conveniente conocer algunas de las propiedades bsicas del clculo de probabilidades:
Para un suceso A, la probabilidad de que suceda su complementario (o equivalentemente, de que
no suceda A) es igual a uno menos la probabilidad de A:

( ) ( ) ( ) ( ) A P A P A P A P = = + 1 1

donde
A
denota al suceso contrario o suceso complementario de A.
Si un fenmeno determinado tiene dos posibles resultados A y B mutuamente excluyentes (es
decir, que no pueden darse de forma simultnea, como ocurre en el lanzamiento de una moneda
al aire), la probabilidad de que una de esas dos posibilidades ocurra se calcula como la suma de
las dos probabilidades individuales:
( ) ( ) ( ) B P A P P + = B A (1)
La extensin de la ley aditiva anterior al caso de ms de dos sucesos mutuamente excluyentes A, B, C...
indica que:
( ) ( ) ( ) ( ) ... ... C B A + + + = C P B P A P P

Consideremos, como ejemplo, un servicio de urologa en el que el 38,2% de los pacientes a los que se les
practica una biopsia prosttica presentan una hiperplasia benigna (HB), el 18,2% prostatitis (PR) y en un
43,6% el diagnstico es de cncer (C). La probabilidad de que en un paciente que se somete a una biopsia
de prstata no se confirme el diagnstico de cncer prosttico ser igual a:
( ) ( ) ( ) 564 , 0 182 , 0 382 , 0 PR HB = + = + = PR P HB P P

Es decir, en un 56,4% de los casos se logra descartar un diagnstico maligno. De modo equivalente, la
probabilidad anterior podra haberse calculado como la probabilidad del suceso contrario al del
diagnstico de cncer:
( ) ( ) ( ) 564 , 0 436 , 0 1 1 PR HB = = = = C P C P P

Ntese la importancia del hecho de que los sucesos anteriores sean mutuamente excluyentes. Sin esta
condicin, la ley de adicin no ser vlida. Por ejemplo, se sabe que en una determinada Unidad de
Cuidados Intensivos (UCI) el 6,9% de los pacientes que ingresan lo hacen con una infeccin adquirida en
el exterior, mientras que el 13,7% adquieren una infeccin durante su estancia en el hospital. Se conoce
adems que el 1,5% de los enfermos ingresados en dicha unidad presentan una infeccin de ambos tipos.
Cul ser entonces la probabilidad de que un determinado paciente presente una infeccin de cualquier
tipo en UCI? Para realizar el clculo, si se suman simplemente las probabilidades individuales
(0,069+0,137) la probabilidad de un suceso doble (infeccin comunitaria y nosocomial) se estar
evaluando dos veces, la primera como parte de la probabilidad de padecer una infeccin comunitaria y la
segunda como parte de la probabilidad de adquirir una infeccin en la UCI. Para obtener la respuesta
correcta se debe restar la probabilidad del doble suceso. As:
Si un fenmeno determinado tiene dos posibles resultados A y B, la probabilidad de que una de
esas dos posibilidades ocurra viene dada, en general, por la expresin:
( ) ( ) ( ) ( ) B y A B A P B P A P P + =

Por lo tanto, si dos o ms sucesos no son mutuamente excluyentes, la probabilidad de que ocurra uno de
ellos o ambos se calcula sumando las probabilidades individuales de que ocurra una de esas circunstancia,
pero restando la probabilidad de que ocurra la comn.
Resulta evidente que, para el caso de procesos mutuamente excluyentes,
( ) 0 B y A = P
y se obtiene (1).
En el ejemplo anterior, la probabilidad de infeccin en UCI vendr dada, por lo tanto, como:

( ) 191 , 0 015 , 0 137 , 0 069 , 0 B A = + = P

Es decir, 19 de cada 100 enfermos registrar alguna infeccin (ya sea de tipo comunitario o nosocomial)
durante su ingreso en la citada unidad.
A veces, la probabilidad de que un determinado suceso tenga lugar depende de que otro suceso se haya
producido o no con anterioridad. Esto es, en ocasiones el hecho de que se produzca un determinado
fenmeno puede hacer ms o menos probable la aparicin de otro. Este tipo de probabilidades se
denominan probabilidades condicionadas, y se denotar por
( ) B A P
a la probabilidad condicionada del
suceso A suponiendo que el suceso B haya ocurrido ya.
La ley multiplicativa de probabilidades indica que la probabilidad de que dos sucesos A y B
ocurran simultneamente es igual a:
( ) ( ) ( ) B P B A P P = B y A (3)
La ley multiplicativa anterior se utiliza tambin con el fin de determinar una probabilidad condicional
( ) B A P
a partir de los valores de
( ) B y A P
y
( ) B P
:
( )
( )
( ) B P
P
B A P
B y A
=

(4)
Supongamos, por ejemplo, que queremos estudiar la incidencia del hecho de ser fumador como factor de
riesgo en el desarrollo de una enfermedad en una determinada poblacin. Para ello se dise un estudio
prospectivo y, tras seleccionar una muestra de 180 sujetos, los resultados son los que se muestran en la
Tabla 1. Considerando toda la muestra, la probabilidad de desarrollar la enfermedad (E) en la poblacin
de estudio es:
( ) % 4 , 44 444 , 0
180
80
= = E P

Mientras que la probabilidad de padecer la enfermedad un fumador (F) es:
( ) % 7 , 85 857 , 0
70
60
= = F E P

Y un no fumador:
( ) % 2 , 18 182 , 0
110
20
= = F E P

Teniendo en cuenta que:
( ) % 9 , 38 389 , 0
180
70
= = F P

( ) ( ) % 1 , 61 611 , 0 389 , 0 1 1 = = = F P F P

( ) % 3 , 33 333 , 0
180
60
E y F = = P ( ) % 1 , 11 111 , 0
180
20
E y F = = P

Podra haberse aplicado la frmula (4) para obtener cualquiera de las dos probabilidades condicionadas
anteriores, resultando idnticos valores:

( )
( )
( )
% 7 , 85 857 , 0
389 , 0
333 , 0
F P
F y E
= = =
P
F E P ( )
( )
( )
% 2 , 18 182 , 0
611 , 0
111 , 0
F P
F y E
= = =
P
F E P
En el ejemplo, se constata por lo tanto que la incidencia de la enfermedad es diferente en la poblacin
fumadora que en la no fumadora (85,7% vs 18,2%). As pues, la probabilidad de desarrollar la
enfermedad depende de si se es o no fumador. En otras ocasiones, sin embargo, sucede que la ocurrencia
o no de un determinado fenmeno B no influye en la ocurrencia de otro suceso A. Se dice entonces que
los sucesos A y B son independientes y se verificar que:
( ) ( ) A P B A P =

(5)
Sustituyendo (5) en (3) se obtiene entonces que:
( ) ( ) ( ) B P A P P = B y A

Es decir, en caso de independencia, la probabilidad de que ocurran dos sucesos de forma simultnea es
igual al producto de las probabilidades individuales de ambos sucesos.As, dos sucesos son
independientes, si el resultado de uno no tiene efecto en el otro; o si el que ocurra el primero de ellos no
hace variar la probabilidad de que se de el segundo.
Obviamente, en la prctica, y debido a las variaciones en el muestreo, ser extremadamente difcil
encontrar una muestra que reproduzca de forma exacta las condiciones de independencia anteriores. El
determinar si las diferencias observadas son o no compatibles con la hiptesis de independencia
constituye uno de los principales problemas que aborda la estadstica inferencial.
Si se considera un fenmeno con k resultados posibles, mutuamente excluyentes, B
1
, B
2
,...,B
k
y
se conoce la probabilidad de cada uno de ellos, el llamado Teorema de las Probabilidades
Totales permite calcular la probabilidad de un suceso A a partir de las probabilidades
condicionadas:
( ) ( ) ( ) ( )
k 2 1
B y A ... B y A B y A P P P A P + + + =

Utilizando la expresin para el clculo de la probabilidad de la interseccin de dos sucesos se tiene que
( ) ( )
k
k
B P
B
A
P P
=
k
B y A
y, por lo tanto:
( ) ( ) ( ) ( ) ( ) ( ) ( )
k k
B P B A P B P B A P B P B A P A P + + + = ...
2 2 1 1

En el ejemplo anterior, podra aplicarse este resultado para el clculo de la incidencia de la enfermedad en
la poblacin de estudio:
( ) ( ) ( ) ( ) ( ) % 44 444 , 0 611 , 0 182 , 0 389 , 0 857 , 0 = + = + = F P F E P F P F E P E P

Las leyes aditiva y multiplicativa, junto con la nocin de probabilidades condicionadas y el teorema de las
probabilidades totales se han empleado para desarrollar el llamado Teorema de Bayes, de indudable
inters en la aplicacin de la estadstica al campo de la medicina. Si se parte de la definicin de
probabilidad condicionada (4):
( )
( )
( ) B P
P
B A P
B y A
=

( )
( )
( )
( ) ( ) ( ) A P A B P P
A P
P
A B P = = B y A
B y A

siempre que
( ) 0 A P
y
( ) 0 B P
. Aplicando adems el teorema de las probabilidades totales se llega a
que:

( )
( ) ( )
( ) ( ) ( ) ( ) A P A B P A P A B P
A P A B P
B A P
+

=

El diagnstico mdico constituye un problema tpico de aplicacin del Teorema de Bayes en el campo
mdico, puesto que permite el clculo de la probabilidad de que un paciente padezca una determinada
enfermedad una vez dados unos sntomas concretos. La capacidad predictiva de un test o de una prueba
diagnstica suele venir dada en trminos de su sensibilidad y especificidad
12
. Tanto la sensibilidad como
la especificidad son propiedades intrnsecas a la prueba diagnstica, y definen su validez
independientemente de cul sea la prevalencia de la enfermedad en la poblacin a la cual se aplica. Sin
embargo, carecen de utilidad en la prctica clnica, ya que slo proporcionan informacin acerca de la
probabilidad de obtener un resultado concreto (positivo o negativo) en funcin de si un paciente est
realmente enfermo o no. Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme
utilidad a la hora de tomar decisiones clnicas y transmitir informacin sobre el diagnstico, presenta la
limitacin de que dependen en gran medida de lo frecuente que sea la enfermedad a diagnosticar en la
poblacin objeto de estudio. El Teorema de Bayes permite obtener el valor predictivo asociado a un test
al aplicarlo en poblaciones con ndices de prevalencia muy diferentes.
Consideremos como ejemplo un caso clnico en el que una gestante se somete a la prueba de sobrecarga
oral con 50 gramos de glucosa para explorar la presencia de diabetes gestacional, obtenindose un
resultado positivo. Es sabido que dicho test presenta unos valores aproximados de sensibilidad y
especificidad en torno al 80% y al 87%, respectivamente. Si se conoce adems que la prevalencia de
diabetes gestacional en la poblacin de procedencia es aproximadamente de un 3%, por medio del
teorema de Bayes podemos conocer la probabilidad de que el diagnstico sea correcto o,
equivalentemente, el valor predictivo positivo:
( )
( ) ( )
( ) ( ) ( ) ( )
=
+

=
+ + +
+
= +
a) Prevalenci - (1 dad) Especifici 1 ( a Prevalenci ad Sensibilid
a Prevalenci ad Sensibilid
D P D P D P D P
D P D P
D P

( ) ( )
% 9 , 15 159 , 0
1261 , 0 024 , 0
024 , 0
03 , 0 1 87 , 0 1 03 , 0 80 , 0
03 , 0 80 , 0
=
+
=
+

=

Se puede concluir por lo tanto que, a pesar de obtener un resultado positivo en la prueba, existe slo una
probabilidad de un 15,9% de que la paciente padezca diabetes gestacional.
Supongamos que adems dicha paciente tiene ms de 40 aos de edad. Se sabe que en grupos de edad
ms avanzada la prevalencia de diabetes gestacional entre las gestantes llega a aumentar hasta
aproximadamente un 8%. En este caso, el valor predicativo positivo asociado vendr dado por:
( ) =
+

= +
a) Prevalenci - (1 dad) Especifici 1 ( a Prevalenci ad Sensibilid
a Prevalenci ad Sensibilid
D P

( ) ( )
% 86 , 34 3486 , 0
1196 , 0 064 , 0
064 , 0
08 , 0 1 87 , 0 1 08 , 0 80 , 0
08 , 0 80 , 0
=
+
=
+

=

En este caso las posibilidades de un diagnstico de diabetes gestacional aumentan hasta un 34,86%.
En un caso como este, en que se realiza una prueba para obtener informacin sobre un diagnstico, suele
hablarse de probabilidad a priori, que es la disponible antes de realizar la prueba (la prevalencia, en este
caso) y probabilidad a posteriori, que es la obtenida despus de realizarla (los valores predictivos). A su
vez, se suele denominar verosimilitudes a las probabilidades de un suceso bajo distintas hiptesis. El
teorema de Bayes permite as obtener los valores de las probabilidades a posteriori a partir de las
probabilidades a priori mediante una multiplicacin proporcional a las verosimilitudes.
Tal y como se indic al inicio del presente artculo, la teora de la probabilidad constituye la base
matemtica para la aplicacin de la estadstica inferencial en medicina. El clculo de probabilidades

constituye una herramienta que permitir hacer inferencia sobre distintos parmetros poblacionales a
partir de los resultados obtenidos en una muestra, y despus tomar decisiones con el mnimo riesgo de
equivocacin en situaciones de incertidumbre.
Bi bl i ogr af a
1. Argimn Palls JM, Jimnez Villa J. Mtodos de investigacin clnica y epidemiolgica. 2 ed.
Madrid: Harcourt; 2000.
2. Sents J, Pardell H, Cobo E, Canela J. Bioestadstica. 3 ed. Barcelona: Masson; 2003.
3. Colton T. Estadstica en medicina. Barcelona: Salvat; 1979.
4. Armitage P, Berry G. Estadstica para la investigacin biomdica. Barcelona: Doyma; 1992.
5. Departamento de Medicina y Psiquiatra. Universidad de Alicante. Tratado de Epidemiologa
Clnica. Madrid: DuPont Pharma; 1995.
6. Altman DG. Practical Statistics for Medical Research. London: Chapman & Hall; 2004.
7. Vlez R, Hernndez V. Clculo de Probabilidades I. Madrid: UNED; 1995.
8. Quesada V, Garca A. Lecciones de Clculo de Probabilidades. Madrid: Daz de Santos; 1988.
9. Silva LC, Benavides A. El enfoque bayesiano: otra manera de inferir. Gac Sanit 2001; 15(4):
341-346.
10. Silva LC, Surez P. Qu es la inferencia bayesiana? JANO 2000; 58: 65-66.
11. Silva LC, Muoz A. Debate sobre mtodos frecuentistas vs bayesianos. Gac Sanit 2000; 14: 482-
494.
12. Prtega Daz S, Pita Fernndez S. Pruebas diagnsticas. Cad Aten Primaria 2003; 10: 120-124.
[Texto completo]
Tabl a 1. Asociacin ent re el hbit o t abquico y el desarrollo de una
enfer medad. Dat os de un est udio de seguimient o en 180 individuos.
Enfer mos Sanos Tot al :
Fumador 60 10 70
No fumador 20 90 110
Tot al : 80 100 180

I nvest igacin: Det er minacin de fact or es de riesgo 1/ 6

Determinacin de factores de riesgo

Pita Fernndez S, Vila Alonso MT, Carpente Montero J.
_______________________________
En cada sociedad existen comunidades, grupos de individuos, familias o individuos que presentan ms
posibilidades que otros, de sufrir en un futuro enfermedades, accidentes, muertes prematuras, se dice
que son individuos o colectivos especialmente vulnerables. A medida que se incrementan los
conocimientos sobre los diferentes procesos, la evidencia cientfica demuestra en cada uno de ellos que:
en primer lugar las enfermedades no se presentan aleatoriamente y en segundo que muy a menudo esa
"vulnerabilidad" tiene sus razones.
La vulnerabilidad se debe a la presencia de cierto nmero de caractersticas de tipo gentico, ambiental,
biolgicas, psicosociales, que actuando individualmente o entre s desencadenan la presencia de un
proceso. Surge entonces el trmino de "riesgo" que implica la presencia de una caracterstica o factor (o
de varios) que aumenta la probabilidad de consecuencias adversas. En este sentido el riesgo constituye
una medida de probabilidad estadstica de que en un futuro se produzca un acontecimiento por lo general
no deseado. El termino de riesgo implica que la presencia de una caracterstica o factor aumenta la
probabilidad de consecuencias adversas. La medicin de esta probabilidad constituye el enfoque de riesgo
(1-4).
Un factor de riesgo es cualquier caracterstica o circunstancia detectable de una persona o grupo de
personas que se sabe asociada con un aumento en la probabilidad de padecer, desarrollar o estar
especialmente expuesto a un proceso mrbido. Estos factores de riesgo (biolgicos, ambientales, de
comportamiento, socio-culturales, econmicos..) pueden sumndose unos a otros, aumentar el efecto
aislado de cada uno de ellos produciendo un fenmeno de interaccin.
Ut i l i zaci n del r i esgo
El conocimiento y la informacin sobre los factores de riesgo tienen diversos objetivos (5):
a. Prediccin: La presencia de un factor de riesgo significa un riesgo aumentado de presentar en un
futuro una enfermedad, en comparacin con personas no expuestas. En este sentido sirven como
elemento para predecir la futura presencia de una enfermedad.
b. Causalidad: La presencia de un factor de riesgo no es necesariamente causal. El aumento de
incidencias de una enfermedad entre un grupo expuesto en relacin a un grupo no expuesto, se
asume como factor de riesgo, sin embargo esta asociacin puede ser debida a una tercera
variable. La presencia de esta o estas terceras variables se conocen como variables de confusin.
As por ejemplo el ejercicio fsico se conoce como factor de proteccin asociado al infarto de
miocardio. El efecto protector que pueda tener el ejercicio, se debe controlar por la edad de los
pacientes, ya que la edad est asociada con el infarto de miocardio en el sentido de que a ms
edad ms riesgo. Por otra parte la mayor dosis de ejercicio la realiza la gente ms joven; por lo
tanto parte del efecto protector detectado entre el ejercicio y el infarto de miocardio esta
condicionado por la edad. La edad en este caso acta como variable de confusin.
c. Diagnstico: La presencia de un factor de riesgo aumenta la probabilidad de que se presente una
enfermedad. Este conocimiento se utiliza en el proceso diagnstico ya que las pruebas
diagnsticas tienen un valor predictivo positivo ms elevado, en pacientes con mayor
prevalencia de enfermedad. El conocimiento de los factores de riesgo se utiliza tambin para
mejorar la eficiencia de los programas de cribaje, mediante la seleccin de subgrupos de
pacientes con riesgo aumentado.
d. Prevencin: Si un factor de riesgo se conoce asociado con la presencia de una enfermedad, su
eliminacin reducir la probabilidad de su presencia. Este es el objetivo de la prevencin
primaria. As por ejemplo se relacionan la obesidad y la hipertensin, la hipercolesterolemia y la
enfermedad coronaria, el tabaco y el cncer de pulmn.


Cuant i f i caci n del r i esgo
El trmino de riesgo implica que la presencia de una caracterstica o factor aumenta la probabilidad de
consecuencias adversas.
La cuantificacin del grado de riesgo constituye un elemento esencial y fundamental en la formulacin de
polticas y prioridades que no deben dejar hueco a la intuicin ni a la casualidad. Hay diferentes maneras
de cuantificar ese riesgo (1,6):
a. Riesgo Absoluto: Mide la incidencia del dao en la poblacin total.
b. Riesgo Relativo: Compara la frecuencia con que ocurre el dao entre los que tienen el factor de
riesgo y los que no lo tienen (Tabla 1).

TABLA 1.1. TABLA DE 2 x 2 PARA EL CALCULO DE LAS MEDI DAS DE
ASOCI ACI N EN UN ESTUDI O DE SEGUI MI ENTO
Enf er mos Sanos Tot al
Ex puest os a b a + b
No ex puest os c d c + d
Tot al a + c b + d a + b + c + d

TABLA 1. 2. TABLA DE 2 x 2 EN LOS ESTUDI OS DE CASOS Y CONTROLES
Casos Cont r ol es
Ex puest os a b
No ex puest os c d
Odds rat io ( razn de predominio, opor t unidad relat iva)

El riesgo relativo mide la fuerza de la asociacin entre la exposicin y la enfermedad. Indica la
probabilidad de que se desarrolle la enfermedad en los expuestos a un factor de riesgo en relacin al
grupo de los no expuestos. Su clculo se estima dividiendo la incidencia de la enfermedad en los
expuestos (Ie) entre la incidencia de la enfermedad en los no expuestos (Io).
En la Tabla 2, exponemos los resultados de un estudio de seguimiento (7) donde 853 mujeres estuvieron
pasivamente expuestas al humo del tabaco durante la gestacin y 1620 no lo estuvieron, y su asociacin
con el bajo peso al nacer.
TABLA 2. DI STRI BUCI ON DE GESTANTES SEGN EXPOSI CI N PASI VA AL
HUMO DE TABACO Y RECI EN NACI DOS SEGN BAJO PESO O PESO NORMAL
( 7)
Reci en Naci do de Baj o peso Tabaco
Ex posi ci n pasi va
S No
Tot al
S 20 833 853
No 14 1606 1620
Tot al 34 2439 2473

X
2
= 9.03; p = 0.00265
95% I C ( 1.38; 5.34)

El riesgo relativo igual a 2.71 de la tabla 2, significa que las expuestas al factor x (exposicin pasiva al
tabaco) tienen 2,71 veces ms probabilidades de tener nios de bajo peso que las no expuestas.
En los estudios de casos y controles, dado que la incidencia es desconocida, el mtodo de estimacin del
riesgo relativo es diferente y se estima calculando el Odds ratio, traducida al castellano con mltiples
nombres como (8,9,10,11): razn de productos cruzados, razn de disparidad, razn de predominio,
proporcin de desigualdades, razn de oposiciones, oposicin de probabilidades contrarias, cociente de
probabilidades relativas, oportunidad relativa.
Su clculo se indica en la tabla 1 y es:

c. Fraccin Atribuible y Riesgo Atribuible
La Fraccin atribuible: Estima la proporcin de la enfermedad entre los expuestos que puede ser
atribuible al hecho de estar expuestos. Esta medida la podemos calcular:
a. en el grupo de expuestos y
b. en la poblacin.
La fraccin atribuible en el grupo expuesto (fraccin etiolgica, o porcentaje de riesgo atribuible en los
expuestos), establece el grado de influencia que tiene la exposicin en la presencia de enfermedad entre
los expuestos. Su clculo se realiza:

Segn los datos de la Tabla 2 la FAe seria:

Lo que significa que el 63.14% del bajo peso en los expuestos se debe a la exposicin.
Si dividimos en numerador y el denomidador por la Io (Incidencia en los no expuestos), obtendremos una
nueva frmula que expresa la misma idea.

Dado que en nuestro ejemplo previo el riesgo relativo era 2.71 el clculo se podra expresar tambin
como:


El Riesgo Atribuible en los expuestos se calcula: RAe = Ie Io
Su clculo esta determinado por la diferencia entre la incidencia de expuestos y no expuestos. La
diferencia entre ambos valores da el valor del riesgo de enfermedad en la cohorte expuesta, que se debe
exclusivamente a la exposicin.
La Fraccin Atribuible en la Poblacin (FAP), muestra la proporcin en que el dao podra ser reducido
si los factores de riesgo causales desapareciesen de la poblacin total.

It = Incidencia en la poblacin total
Io = Incidencia en los no expuestos
Si la prevalencia de la exposicin en la poblacin es disponible l calculo tambin se puede realizar del
siguiente modo con esta frmula alternativa:

Pt = Prevalencia de la exposicin (o factor de riesgo) en la poblacin.
La fraccin atribuible en la poblacin total es una medida de asociacin influenciada por la prevalencia
del factor de riesgo en la poblacin total. Para el clculo de la misma utilizaremos el ejemplo de la tabla 3
(1).

Este valor, es el porcentaje de riesgo atribuible en la poblacin para el factor de riesgo "sin control
prenatal". El concepto que encierra es totalmente similar al de la FAe, con la salvedad de que es un
parmetro que se refiere a toda la colectividad y no solamente a los expuestos.
La frmula alternativa previamente indicada permite objetivar como cambia el impacto de una
intervencin con la prevalencia de un factor de riesgo. En los estudios de casos y controles, en los cuales
no se pueden obtener tasas reales de incidencia, uno puede usarla tomando la razn de productos
cruzados, la razn de predominio, la oportunidad relativa, el OR en definitiva, como una aproximacin
para el riesgo relativo.
Tabl a 3. MORTALI DAD PERI NATAL SEGN LA PRESENCI A O AUSENCI A DE
CONTROLES PRENATALES ( 1)
Mor t al i dad per i nat al Cont r ol es
Pr enat al es
S No
Tot al
0 2056 25891 27947
1 ms 776 22387 23163
Tot al 2832 48278 51110
El Riesgo Atribuible en Poblacin general se calcula: RAp = It Io.
Se podra definir como la cantidad de riesgo que sufre toda la poblacin como consecuencia de la
exposicin. Representa lo mismo que el RAe, pero referido a la comunidad.

I nt er v al os de conf i anza par a l a est i maci n del r i esgo.
Cuando calculamos el Riesgo Relativo debemos expresar s dicho riesgo es diferente de 1. Si al construir
el 95% intervalo de confianza el intervalo no incluye el valor 1 concluimos que el riesgo es
estadsticamente significativo p<0.05. Si el 99% intervalo de confianza no incluye el valor 1, el riesgo
relativo es significativo p<0.01.
Si el riesgo relativo fuese menor de 1 y su intervalo de confianza tambin, estaramos ante la presencia de
un factor de proteccin.
El clculo de dicho 95% IC para el riesgo relativo se realiza del siguiente modo (12,13,14):
(RR) exp [ 1.96 Error Estndar del Ln RR)
donde:
-RR es la estimacin puntual del riesgo relativo
-exp es la base del logaritmo natural elevada a la cantidad entre parntesis

- a,b,c y d representan los valores numricos de la tabla de 2 x 2
Si utilizamos el ejemplo de la tabla 2 tendramos:
1. Logaritmo natural de 2.71 = 0.996
2. Error estndar =
3. El 95% intervalo de confianza del logaritmo de RR= 0.99 1.96 * 0.34 =
(0.319; 1.674)
4. El antilogaritmo de estos lmites es: e
0.319
a e
1.67
= (1.38 a 5.34)
Por tanto en el ejemplo (tabla 2) el RR = 2.71 y el 95% Intervalo de confianza es: 1.38 a 5.34
El clculo del 95% IC para el OR en un estudio de casos y controles seria:

donde:
OR es la estimacin puntual del Odds ratio
exp es la base del logaritmo natural elevada a la cantidad entre parntesis.
a,b,c y d representan los valores numricos de la tabla de 2 x 2
El clculo del intervalo de confianza del riesgo relativo y del odds ratio es fundamental al realizar el
anlisis de cualquier estudio. Dicho clculo nos indica no solo la direccin del efecto, sino la significancia
estadstica, si el intervalo no engloba el valor 1 y la precisin del intervalo que est directamente
relacionada con el tamao muestral del estudio.
Estimado el riesgo de cada variable de forma independiente, se debe en un siguiente paso determinar el
riesgo de dicha variable teniendo en cuenta las dems variables utilizando tcnicas de regresin mltiples.

Bi bl i ogr af a
1. Serie PALTEX para ejecutores de programas de salud N 7. Manual sobre el enfoque de riesgo
en al atencin materno-infantil. Washington: Organizacin Panamericana de la salud; 1986.
2. MacMahon, Trichopoulos D. Epidemiology: Principles and Methods. Second edition. Boston:
Little Brown & Company; 1996.
3. Brownson R.C., Remington P.L., Davis J.R. Chronic disease epidemiology and control.
Baltimore: American Public Health Association; 1993.
4. Lilienfeld D.E., Stolley P.D. Foundation of Epidemiology. 3 td. ed. New York: Oxford
University Press; 1994.
5. Fletcher R.H., Fletcher S.W., Wagner E.H. Epidemiologa clnica. Barcelona: Ediciones
Consulta; 1989.
6. Pita Fernndez S. Epidemiologa. Conceptos bsicos. En: Tratado de epidemiologa clnica.
Madrid: DuPont Pharma; 1995.
7. Martn TR, Bracken MB. Association of low birth weight with passive smoke exposure in
pregnancy. Am J. Epidemiol 1986; 124: 633-642. [Medline]
8. Rigau Prez J.G. Traduccin del trmino "odds ratio". Gac Sanit 1990; 16: 35.
9. Becerra J.E. Traduccin del trmino "odds ratio". Gac Sanit 1990; 16:36.
10. Martn Moreno J.M. Oportunidad relativa; reflexiones en torno a la traduccin del termino
"odds ratio". Gac Sanit 1990; 16:37.
11. Porta Serra M. Traducir o no traducir. es esa la cuestin?. Gac Sanit 1990; 16: 38-39.
12. Garb J.L. Understanding medical research. A practitioners guide. Boston: Little Brown and
Company; 1996.
13. Gardner M. J., Altman D.G. Confidence intervals rather than P values: estimation rather than
hypothesis testing. Br Med J (Clin Res Ed) 1986; 292: 746-750. [Medline]
14. Simon R. Confidence intervals for reportin results of clinical trials. Ann Intern Med 1986; 105:
429-435. [Medline]

I nvest igacin: Det er minacin de fact or es pronst icos 1/ 6

Determinacin de factores pronsticos

Pita Fernndez S, Valds Caedo FA.
Cad Aten Primaria 1997; 4: 26-29.
_______________________________________
La actividad clnica diaria esta fundamentada en tres elementos: el juicio diagnstico, el pronstico y el
tratamiento. Estas tres actividades estn basadas en estudios probabilsticos. Tras el diagnstico de una
enfermedad se precisa conocer el pronstico de la misma. La determinacin de un pronstico es estimar
las probabilidades de los diversos modos de evolucin; es predecir la evolucin de una enfermedad en un
paciente determinado. El conocimiento del pronstico es una variable fundamental ya que en muchos
casos decidir el tratamiento (1). Por otra parte las actividades teraputicas y preventivas pueden
modificar l pronostico de una enfermedad.
La historia natural de una enfermedad es la evolucin sin intervencin mdica. El curso clnico describe
la evolucin de la enfermedad que se encuentra bajo atencin mdica(2).
El pronstico depende por tanto de la historia natural de la enfermedad y de su curso clnico. Dicho
pronstico no siempre cambia con la intervencin mdica.
La incertidumbre sobre el futuro de una enfermedad, puede estimarse sobre la experiencia clnica y la
informacin epidemiolgica. Es evidente que la experiencia clnica individual an siendo de gran valor,
por si sola es inadecuada ya que esta basada en un conjunto mas o menos limitado de pacientes que no
representan la totalidad de los mismos sobre los que se tiene adems un seguimiento desigual.
Di f er enci a ent r e r i esgo y pr onst i co
Por otra parte debemos a su vez tener en cuenta la diferencia entre factores de riesgo y factores
pronsticos. Los factores de riesgo son los que condicionan la probabilidad de presentar una enfermedad
determinada. Dichos factores pueden estar presentes en poblacin sana y aumentan el riesgo de tener la
enfermedad. La identificacin de los factores de riesgo son imprescindibles para la prevencin primaria.
Los factores pronsticos son aquellos que predicen el curso clnico de un padecimiento una vez que la
enfermedad esta presente. La identificacin de estos factores son de gran inters para la prevencin
secundaria y terciaria (2,3,4). Para la estimacin del riesgo el suceso final que se busca es la presencia de
una enfermedad especfica. Para la estimacin del pronstico la variable final como elemento de inters
para estudio puede ser: la muerte, la recurrencia del proceso, la invalidez, las complicaciones (5).
Existen a su vez marcadores de riesgo que son caractersticas de las personas que no son modificables
(edad, sexo, estado socio-econmico,) y que determinan la probabilidad de presentar una enfermedad.
Los marcadores de pronstico son a su vez caractersticas no modificables del sujeto que tienen una
probabilidad determinada de afectar el curso clnico de la enfermedad.
Hay factores de riesgo (edad, HTA,...) que cuando aparece la enfermedad (cardiopata isqumica) a su
vez son factores pronsticos para la presencia o no de muerte por dicha enfermedad (2), Tabla 1.
Tabl a 1. Di f er enci as ent r e Fact or es de Ri esgo y Pr onst i cos en el
I nf ar t o agudo de mi ocar di o ( 2)
Fact or es de Ri esgo Fact or es Pr onst i cos
Edad
Sexo masculino
LDL elevado
HDL descendido
Tabaquismo
HTA
Edad
Sexo masculino
I nfart o previo
Hipot ensin
I nsuficiencia cardaca
congest iva
Cardiomegalia

Sedent ar ismo Arrit mia vent ricular
En la prctica clnica diaria es preciso tener un conocimiento del pronostico de un problema determinado
para tomar decisiones respecto a exploraciones continuadas, ingresos hospitalarios, tratamientos
especficos, que no modificando el pronstico no podran objetivamente ser justificados. Por otra parte se
precisa conocer el curso clnico de la enfermedad para informar al paciente de su futuro.
Par met r os de i nt er s pr onst i co
Los parmetros de inters pronstico dependen de la enfermedad que se estudie pero los de uso ms
frecuente son (2,6,7):
a. Tasa de supervivencia a los cinco aos.
Porcentaje de pacientes que sobreviven cinco aos a partir de algn momento en el curso de la
enfermedad.
b. Tasa de letalidad.
Porcentaje de pacientes con una enfermedad que mueren a causa de ella.
c. Tasa de respuesta.
Porcentaje de pacientes que muestran alguna seal de mejora despus de una intervencin.
d. Tasa de remisiones.
Porcentaje de pacientes que entran en una fase en la que la enfermedad deja de ser detectable.
e. Tasa de recurrencia.
Porcentaje de pacientes que vuelven a tener la enfermedad despus de un perodo libre de ella.
Det er mi naci n de l os f act or es pr onst i cos.
En la actividad diaria conoceremos el pronstico de muchos de los pacientes por nuestra formacin y
experiencia previa. Las estrategias para conocer el pronstico podran resumirse en las siguientes
posibilidades (3,7,8):
1. Experiencia personal:
Consultar a otro compaero de trabajo.
Consultar a un "experto" o especialista en el tema.
2. Hacer una revisin de la literatura.
3. Realizacin de estudios:
Revisin de casos.
Estudios de casos y controles
Estudios de cohortes
Ensayos clnicos.
1. Experiencia personal. La experiencia personal, ya sea la de uno mismo o la de un experto, sin duda
es muy valorable en todo el proceso clnico asistencial, sin embargo tiene limitaciones en relacin con:
a. Sesgos de seleccin de pacientes: El sesgo de seleccin viene determinado por la dificultad de
haber tenido contacto con todos los tipos de pacientes de una determinada enfermedad. El lugar
de trabajo condiciona la patologa que s diagnstica y se trata.
b. Sesgos de informacin: El sesgo de informacin nos lleva a valorar los factores acompaantes
de pacientes que han presentado un excelente pronstico o un fatal pronstico.
c. Falta de precisin: La falta de precisin viene determinada por el tamao muestral de la
casustica que si es reducida puede estar afectada por el azar.
Por otra parte la identificacin de factores de riesgo para la presencia de una enfermedad tampoco puede
ser producto de la experiencia personal. Existen riesgos que pueden ser identificados fcilmente entre
exposicin y enfermedad (traumatismos por accidente de coche, intoxicacin por sobredosis de
frmacos) pero en la mayora de las enfermedades crnicas las relaciones entre exposicin y

enfermedad son menos aparentes. Las razones por las que la experiencia personal es insuficiente para
establecer una relacin entre una exposicin y una enfermedad se sealan en la tabla 2 (2).

Tabl a 2. Si t uaci ones en l as que l a ex per i enci a per sonal es i nsuf i ci ent e
par a est abl ecer una r el aci n ent r e una ex posi ci n una enf er medad ( 2)
Perodo de lat encia largo ent r e la exposicin y la enfer medad.
Exposicin frecuent e al fact or de riesgo.
I ncidencia baj a de la enfermedad.
Riesgo pequeo producido por la exposicin.
Enfer medad fr ecuent e.
Causas mlt iples de enfer medad.
2. Revisin de la literatura. La revisin de la literatura es siempre recomendable. Un artculo
aisladamente puede estar sesgado o limitado en sus conclusiones, es por ello aconsejable revisar la
literatura buscando: a) artculos de revisin b) estudios de metanlisis.
Los artculos de revisin discuten la informacin sobre el tema teniendo en cuenta aspectos
metodolgicos, concordancias y divergencias sobre diferentes trabajos que nos permitirn una
informacin actualizada sobre el tema (9).
El metanlisis ha sido definido por Jenicek como "una integracin estructurada, con una revisin
cualitativa y cuantitativa de los resultados de diversos estudios independientes acerca de un mismo
tpico". El metanlisis desplaz de la literatura mdica a la revisin por un experto.
El metanalisis como mtodo ha generado reacciones muy diferentes en el campo de la ciencia mdica.
Dichas reacciones van desde un rechazo y escepticismo total (10) hasta un ferviente apoyo y entusiasmo
(11). Los epidemiologos lo consideran una herramienta til pero que hay que saber utilizar (12). Los
objetivos del metanlisis son fundamentalmente dos (13): revisar con tcnicas cuantitativas la situacin
actual de un tema que ha sido investigado previamente en mltiples o diversos trabajos. Esta revisin
cuantitativa permitira resumir los resultados de todos los estudios previos. En segundo lugar el
metanlisis nos permite incrementar el poder estadstico para detectar diferencias entre variables.
Claramente si podemos reunir en una misma tabla de contingencia diferentes estudios, el tamao muestral
de dicha tabla se incrementar y por tanto tambin lo har nuestro poder estadstico para detectar
diferencias. En definitiva la precisin del estudio mejora y la posibilidad de cometer errores de tipo II o
beta (no detectar diferencias cuando realmente las hay) disminuye. Esta tcnica es por tanto muy til
cuando estimamos incidencias o mortalidad de eventos muy poco frecuentes o cuando en un estudio de
casos y controles la exposicin de inters es muy rara o muy frecuente.
3. Realizacin de estudios. Existen diferentes diseos de investigacin para conocer la historia natural y
el curso clnico de la enfermedad:
a. Revisin de casos: Permiten reconstruir retrospectivamente el curso clnico de una enfermedad.
En estos estudios los sesgos de seleccin son muy frecuentes y no es aconsejable utilizarlos para
hacer inferencias sobre el pronstico. Estos estudios aunque son muy tiles para formular
hiptesis, no sirven para evaluar o testar la presencia de una asociacin estadstica. La presencia
de una asociacin puede ser un hecho fortuito. La gran limitacin de este tipo de estudios es en
definitiva la ausencia de un grupo control.
b. Estudio de casos y controles: Todos los pacientes en el estudio, tienen la enfermedad de inters.
En este tipo de estudios los casos son pacientes que han fallecido en un perodo determinado de
tiempo o presentaron la complicacin de inters o la recurrencia. Los controles son pacientes que
no han fallecido o no han tenido el evento de inters. El objetivo del estudio se centra en
determinar que variables estn asociadas con el hecho de pertenecer a uno u otro grupo. La
estimacin del efecto se determina por medio del calculo del odds ratio (Tabla 3).
c. Estudio de cohortes: Estos estudios describen paso a paso la historia natural o el curso clnico de
la enfermedad y calculan el riesgo relativo debido a un determinado factor pronstico. Los

integrantes de la cohorte de pacientes son todos los individuos afectados por la enfermedad. Tras
el seguimiento de la cohorte durante un tiempo, se estudia la supervivencia, la presencia de
complicaciones, la recurrencia.., en relacin con diferentes variables de exposicin (Tabla 3).
Este tipo de estudio es el ideal para determinar factores pronsticos.

Tabl a 3. 1. Tabl a de 2 x 2 en l os Est udi os de Casos y Cont r ol es
Casos Cont r ol es
Ex puest os a b
No ex puest os c d

Tabl a 3.2. Tabl a de 2 x 2 par a el Cl cul o de l as medi das de asoci aci n
en un est udi o de segui mi ent o par a det er mi nar pr onst i co

Enf er mos
( fallecidos,
recurrent es. . . )
Enf er mos
( no fallecidos. . .)
Tot al

d. Ensayos clnicos: Este tipo de estudios permiten estudiar las modificaciones del curso clnico de
la enfermedad como respuesta a nuevas intervenciones teraputicas.
Los datos proporcionados por los estudios clnicos se expresan en mltiples ocasiones en trminos de
supervivencia. Este trmino no queda limitado a los trminos de vida o muerte, sino a situaciones en las
que se mide el tiempo que transcurre hasta que sucede el evento de inters, como puede ser tiempo de
recurrencia, tiempo que dura la eficacia de una intervencin, tiempo de un aprendizaje determinado etc.
Por tanto, la supervivencia es una medida de tiempo a una respuesta, fallo, muerte, recada o desarrollo de
una determinada enfermedad o evento.
El termino supervivencia se debe a que las primeras aplicaciones de este mtodo de anlisis utilizaba
como evento la muerte de un paciente (14).
La estimacin de la supervivencia de una cohorte de pacientes se determina por tcnicas paramtricas
(distribucin exponencial, Weibul, lognormal) o no parametricas (Kaplan-Meier, logrank, regresin de
Cox). El mtodo Kaplan-Meier calcula la supervivencia cada vez que un paciente muere (o se produce el
evento de inters) (Fig 1).



Fi gur a 1. Super vi venci a del I nj er t o r enal . Hospi t al Juan Canal ej o. 1981- 1999.

La caracterstica distintiva del anlisis con este mtodo es que la proporcin acumulada que sobrevive, se
calcula para el tiempo de supervivencia individual de cada paciente y no se agrupan los tiempos de
supervivencia en intervalos (14).
En los estudios de seguimiento no todos los pacientes presentan el evento tras un tiempo de seguimiento
(observaciones censuradas). La tcnica ideada por Cox (modelo de riesgo proporcional o regresin de
Cox) es la proporcionada para realizar el anlisis cuando hay observaciones censuradas que dependen del
tiempo. Este modelo utiliza como variable dependiente el tiempo de supervivencia del paciente y como
covariables variables independientes) que se modifican con el tiempo. Los coeficientes de regresin de
Cox pueden usarse para determinar el riesgo relativo entre cada variable independiente y la variable
respuesta, ajustado por el efecto de las dems variables en la ecuacin (15).
Er r or es f r ecuent es en el est udi o del cur so cl ni co
Los errores ms frecuentes en los estudios sobre el curso clnico de enfermedades, vienen determinados
por los sesgos (estimaciones equivocadas del riesgo): de seleccin, de prdidas de seguimiento, y de
errores en la medicin (3,5,7).
a) Sesgo de seleccin: Este tipo de sesgo puede presentarse en cualquiera de los diseos previamente
sealados y es muy frecuente. Los pacientes que acuden a centros hospitalarios, los candidatos a ciruga,
son diferentes de los que no ingresan o no se operan por razones diferentes. Por tanto las conclusiones que
se deriven del estudio de un grupo de ellos, no son representativas de todos los pacientes que tengan la
enfermedad.
Si no se dispone del seguimiento del paciente desde el inicio de la enfermedad o evento, el resultado
sobre su pronstico puede ser impredecible. Pueden fcilmente presentarse sesgos de supervivencia
selectiva ya que aquellos que fallecieron antes o siguen vivos ahora (en el momento que se incorporan al
estudio) son diferentes. Es por ello fundamental incorporar al estudio casos incidentes desde el inicio de
la enfermedad o evento de inters.
b) Sesgo por perdidas de seguimiento: Las prdidas de seguimiento son frecuentes e los estudios de
cohortes y ensayos clnicos. Si las perdidas son aleatorias y no se asocian con el evento de inters no se

produce un sesgo. Debe ser un objetivo prioritario reducir al mnimo las perdidas con un cuidadoso
seguimiento de todos los pacientes ya que de lo contrario pueden tener un efecto impredecible e invalidar
las conclusiones del estudio.
c) Sesgo por errores de medicin: Se produce una estimacin equivocada del riesgo por errores en la
medicin, siendo las fuentes ms frecuentes de sesgo: un instrumento no adecuado de medida, un
diagnstico incorrecto, omisiones, imprecisiones, vigilancia desigual en expuestos y no expuestos,
procedimientos de encuesta no validos, encuestadores no entrenados o conocedores de las hiptesis del
estudio. Este tipo de sesgos pueden reducirse si se tienen en cuenta los siguientes conceptos bsicos: a)
los observadores (encargados de la medicin o evaluacin) deben ser ciegos al tipo de tratamiento que
recibe el enfermo, b) las mediciones del proceso de inters han de desarrollarse en condiciones similares
en ambos grupos con el mismo instrumento de medida y en los mismos momentos de seguimiento, y c)
los criterios diagnsticos que sealen la presencia del evento de inters deben estar claramente definidos.
Bi bl i ogr af a
1. Sackett, D.L., Haynes, R.B., Guyatt, G.H., Tugwell, P. Epidemiologa clnica. Ciencia bsica
para la medicina clnica. 2 ed. Madrid: Editorial Mdica Panamericana; 1994.
2. Fletcher, R.H., Fletcher S.W., Wagner E.H. Epidemiologa clnica. Barcelona: Ediciones
Consulta; 1989.
3. Moreno A., Cano V., Garca M. Epidemiologa clnica. 2 ed. Mxico: Interamericana.
McGraw-Hill; 1994.
4. Brownson R.C., Remigton P.L., Davis J.R. Chronic disease epidemiology and control.
Baltimore: American Public Health Association; 1993.
5. Jenicek M., Cleroux R. Epidemiologa. Principios-Tcnicas-Aplicaciones. Barcelona: Salvat;
1987.
6. Barker D.J.P., Rose G. Epidemiologa en la prctica mdica 2 Edicin. Barcelona: Ediciones
Cientficas y Tcnicas; 1992.
7. Alvarez Caceres R. El mtodo cientfico en las ciencias de la salud. Las bases de la
investigacin biomdica. Madrid: Daz de Santos; 1996.
8. Villagrasa F., Baares J., Barona C., PLA E. El juicio pronstico. En: Tratado de epidemiologa
clnica. Madrid: DuPont Pharma Madrid; 1995. p. 255-269.
9. Guyatt GH, Sackett DL, Cook DJ. Evidence-Based Medicine Working Group. Users guides to
the medical literature.II. How to use an article about therapy or prevention. Are the result of the
study valid? JAMA 1993; 270: 2598-2601. [Medline]
10. Goldman L., Feinstein AR. Anticoagulants and myocardial infarction. The problems of pooling,
drowing and floating. Ann Intern Med 1979; 90: 92-94. [Medline]
11. Chalmers T.C., Matta R.J., Smith H Jr, Kunzler AM. Evidence of favoring the use of
anticoagulants in the hospital phase of acute miocardial infarction. N. Engl J Med 1977; 297:
1091-1096. [Medline]
12. Abramson J.H. Meta-analysis: a review of pros and cons. Public Health Rev 1991; 18: 1-47.
[Medline]
13. Delgado Rodrguez M., Sillero Arenas M., Glvez Vargas R. Metaanalisis en epidemiologa
(primera parte): Caractersticas generales. Gac Sanit 1991; 5: 265-272. [Medline]
14. Pita Fernndez S. Anlisis de supervivencia. En: Tratado de epidemiologa clnica. Madrid:
DuPnt pharma Madrid; 1995. p.597-610.
15. Dawson S.B. Trapp R.G. Basic & Clnical Biostatistics. 2nd ed. New Jersey: Appleton &
Lange; 1994.

I nvest igacin: Nmero necesario de pacient es a t rat ar par a reducir un event o 1/ 3

Nmero necesario de pacientes a tratar para reducir un evento

Pita Fernndez S, Lpez de Ullibarri Galparsoro I.
Cad Aten Primaria 1998; 96-98. Actualizacin 26/01/2001.
______________________________________
La prctica clnica requiere la toma de decisiones sobre actividades preventivas, teraputicas y
pronsticas. Con frecuencia existen dificultades para trasladar los resultados de una investigacin a la
practica clnica por la forma en que habitualmente se presentan los resultados en trminos de: p<0.05,
p<0.001, riesgo relativo, odds ratio, reduccin absoluta del riesgo, fraccin atribuible poblacional o
fraccin etiolgica. Por otra parte los resultados de un estudio pueden ser estadsticamente significativos
y no ser clnicamente relevantes por lo que los mdicos necesitamos instrumentos que nos permitan
decidir si una actitud determinada o un tratamiento especfico deben ser incorporados en la rutina diaria
(1).
La medicina basada en la evidencia incorpora la utilizacin de trminos, como el nmero necesario de
pacientes a tratar para reducir un evento (NNT) que cada vez se utiliza con ms frecuencia (2,3). Una de
las razones por la que se utiliza cada vez con ms frecuencia se deriva de las deficiencias de expresiones
alternativas y porque expresa de una manera muy evidente los beneficios de utilizar un tratamiento o
actividad preventiva sobre un control, indicando por as decir "el precio a pagar para obtener un
beneficio" (4,5).
La prctica de la medicina basada en la evidencia considera el ensayo clnico aleatorizado como el
estndar para valorar la eficacia de las tecnologas sanitarias y recomienda que las decisiones se tomen,
siempre que se pueda, con opciones diagnsticas o teraputicas de demostrada eficacia (6,7).
La forma recomendada de presentar los resultados de un ensayo clnico aleatorizado y otros tipos de
estudio debe incluir (1,2,6,8): La reduccin relativa del riesgo (RRR), la reduccin absoluta del riesgo
(RAR) y el nmero necesario de pacientes a tratar para reducir un evento (NNT).
Consideremos para su clculo este ejemplo: Mueren 15% de pacientes en el grupo de intervencin y
mueren un 20% en el grupo control. El riesgo relativo, que es el cociente entre los expuestos al nuevo
tratamiento o actividad preventiva y los no expuestos, es en este caso (0.15/0.20=0.75). El riesgo de
muerte de los pacientes que reciben el nuevo tratamiento relativo al de los pacientes del grupo control fue
de 0.75. La RRR es el complemento del RR, es decir, (1-0.75)* 100 = 25%. El nuevo tratamiento reduce
el riesgo de muerte en un 25% relativo al que ha ocurrido en el grupo control. La reduccin absoluta del
riesgo (RAR) sera: 0.20-0.15= 0.05 (5%). Podramos decir por tanto que de cada 100 personas tratadas
con el nuevo tratamiento podemos evitar 5 casos de muerte. La siguiente pregunta sera: si de cada 100
personas tratadas con el nuevo tratamiento podemos evitar 5 casos de muerte. Cuntos tendramos que
tratar para evitar un solo caso de muerte?. En otras palabras cul es el NNT?. Su clculo requiere una
simple regla de tres que se resuelve dividiendo 1/RAR. En este caso 1/0.05 = 20. Por tanto la respuesta
es que necesitamos tratar a 20 pacientes con el nuevo tratamiento para evitar un caso de muerte.
Este modo de presentar los resultados nos cuantifica el esfuerzo a realizar para conseguir la reduccin de
un evento desfavorable. El presentar los resultados slo como reduccin porcentual del riesgo relativo
(RRR), aunque es tcnicamente correcto, tiende a magnificar el efecto de la intervencin al describir del
mismo modo situaciones muy dispares. Dicho efecto lo podemos objetivar en la tabla 1, donde se
objetiva que la reduccin del riesgo es igual pero el NNT es completamente diferente. Cambios pequeos
en el riesgo basal absoluto de un hecho clnico infrecuente conducen a grandes cambios en el nmero de
pacientes que necesitamos tratar con la intencin de prevenir uno.
Tabl a 1. Cl cul o de Ri esgo r el at i v o ( RR) , Reducci n Rel at i va del
Ri esgo ( RRR) , Reducci n Absol ut a del Ri esgo ( RAR) y Nmer o
Necesar i o de Paci ent es a Tr at ar par a r educi r un event o ( NNT) en
si t uaci ones di f er ent es.
I nci denci a
en
Ex puest os
I nci denci a
en No
Ex puest os
RR RRR RAR NNT

( I e) ( I o) I e/ I o ( 1- RR) * 100 I o- I e 1/ RAR
8 % 10 % 0.8 20 % 0.10- 0.08 50
0.8% 1 % 0.8 20 % 0.01- 0.008 500
El clculo del NNT representa como ya hemos indicado el nmero de pacientes a tratar de manera
experimental a fin de evitar que uno de ellos desarrolle un resultado negativo. Es por tanto una forma
excelente de determinar la significancia clnica de un ensayo que adems sea estadsticamente
significativo. Cuanto ms reducido es NNT el efecto de la magnitud del tratamiento es mayor. Si no se
encontrase eficacia en el tratamiento la reduccin absoluta del riesgo sera cero y el NNT sera infinito.
Como sucede en las estimaciones de otros parmetros, se debe expresar el NNT con intervalos de
confianza para estimar la incertidumbre que dicho parmetro presenta (9,10).
En la tabla 2 se presentan algunos NNT para diferentes tratamientos (6).
Tabl a 2. NNT par a t r at ami ent os di f er ent es ( 6)
Enf er medad I nt er v enci n
Epi sodi os
que se
pr evi enen
Tasa en el
gr upo
cont r ol
Tasa en el
gr upo
ex per i ment al
Dur aci n
del
segui mi ent o
NNT para
evit ar un
episodio
adicional
Diabetes
(DMID)
(1)

Regmenes
int ensivos de
I nsulina
Neuropat a
Diabt ica
0.096 0.028 6.5 aos 15
Ret inopat as 0.38 0.13 6 aos 4
Diabetes
(DMNID)
(2)

Regmenes
int ensivos de
I nsulina
Nefropat a 0.30 0.10 6 aos 5
Muer t e a las
5 semanas
0.134 0.081 5 semanas 19
Infarto de
Miocardio
(3)

Est r ept oquinasa
y Aspir ina
Muer t e a los
2 aos
0.216 0.174 2 aos 24
Presin
Arterial
Diastlica 115-
129 mmHg
(4)

Frmacos
ant ihipert ensivos
Muer t e,
apoplej a o
infart o de
miocardio
0.0545 0.0467 5.5 aos 128
Personas
mayores
independientes
(5)

Est udio
gerit rico
exhaust ivo
Permanencia
en
residencias
por un largo
perodo de
t iempo
0.10 0.04 3 aos 17
Mujeres
embarazadas
con eclampsia
(6)

MgSO4 iv ( vs
Diacepan)
Convulsiones
recurrent es
0.279 0.132 Horas 7
Mujeres sanas
de edad 50-69
aos
(7)

Exploracin de
mamas adems
de mamografa
Muer t e por
cncer de
mama
0.00345 0.00252 9 aos 1075
Estenosis
grave
sintomtica de
la arteria
(8)

Endart erect oma
Aplplej a
t ot al o
muer t e
0.181 0.08 2 aos 10
Nios
prematuros
(9)

Cort icost eroides
prenat ales
Sndrome de
dist rs
respirat orio
0.23 0.13 Das 11
( 1)
Ann I nt ern Med 1995; 122: 561- 8; EBM 1995; 1: 9
( 2)
Diabet es Res Cln Pract 1995; 28: 103- 17
( 3)
Lancet 1988; 2: 349- 60
( 4)
JAMA 1967; 202: 116- 22
( 5)
BMJ 1985; 291: 97- 104
( 6)
N Engl J Med 1995; 333: 1184- 9; EBM 1996; 1: 44
( 7)
Lancet 1995; 345: 1455- 63; EBM 1996; 1: 44
( 8)
Lancet 1993; 341: 973- 8
( 9)
N Engl J Med 1991; 325: 445- 53
( 9)
Am J Obst et Gynecol 1995; 173: 322- 35; EBM 1996; 1: 92


La creciente demanda de este tipo de informacin se puede obtener en Internet en el Centro de Medicina
Basada en la Evidencia que existe en Oxford, Inglaterra en la direccin: http://cebm.jr2.ox.ac.uk.
El clculo de NNT con sus intervalos de confianza se puede realizar de manera automtica con programas
disponibles al efecto en la direccin: http://www.healthcare.ubc.ca/calc/clinsig.html
El clculo del NNT proporciona a los clnicos un excelente instrumento en relacin a las decisiones de
incorporar prcticas en la actividad clnica diaria. Proporciona una manera clara y til de medir el
esfuerzo para conseguir un beneficio y es una excelente herramienta que la medicina basada en la
evidencia nos proporciona y que debe ser utilizada en la toma de decisiones.
Tabla de NNTs de Bandolier en http://www.jr2.ox.ac.uk/bandolier/band50/b50-8.html
Bi bl i ogr af a
1. Laupacis A, Sackett DL, Roberts RS: An assesment of clinically useful measures of treatment. N Engl
J Med 1988; 318: 1728-1733. [Medline]
2. Guyatt GH, Sackett DL, Cook DJ. Users guides to the medical literature. II. How to use an article
about therapy or prevention. B. What were the results and will they help in caring for my patients?
Evidence Based Medicine Working Group. JAMA 1994; 271: 59-63. [Medline]
3. Cordell WH. Number Needed to treat (NNT). Ann Emerg Med 1999; 33: 433-436. [Medline]
4. Chatellier G, Zapletal E. Lemaitre D. Menard J. Degoulet P. The number needed to treal: A clinically
useful nomogram in its proper context. BMJ 1996; 312: 426-429. . [Medline] [Texto completo]
5. McQuay HJ, Moore A. Using numerical result from systematic reviews in clinical practice. Ann Intern
Med 1997; 126: 712-720. [Medline]
6. Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how to practice and
teach EBM. London: Churchill-livingstone; 1997.
7. Guyatt GH, Sackett DL, Cook DJ. Usersguides to the medical literature. II. How to use an articie
about therapy or prevention. A. Are the results of the study valid? Evidence-Based Medicine Working
Group. JAMA 1993; 270: 2598-2601. [Medline]
8. Cook RJ, Sackett DL. The number needed to treal: a clincally useful measure of treatment effect. BMJ
1995; 310: 452-454. [Medline] [Texto completo]
9. Altman DG. Confidence intervals for the nember needed to treat. BMJ 1998; 317: 1309-1312.
[Medline] [Texto completo]
10. Daly LE. Confidence limits made easy: interval estimation using a subsitution method. Am J
Epidemiol 1998; 147: 783-90. [Medline]

I nvest igacin: Tipos de est udios epidemiolgicos 1/ 9

Tipos de estudios clnico epidemiolgicos

Pita Fernndez S.
Pita Fernndez, S. Epidemiologa. Conceptos bsicos. En: Tratado de Epidemiologa Clnica. Madrid;
DuPont Pharma, S.A.; Unidad de epidemiologa Clnica, Departamento de Medicina y Psiquiatra.
Universidad de Alicante: 1995. p. 25-47. Actualizacin 28/02/2001.
_______________________________________
Los estudios epidemiolgicos clsicamente se dividen en Experimentales y No experimentales. En los
estudios experimentales se produce una manipulacin de una exposicin determinada en un grupo de
individuos que se compara con otro grupo en el que no se intervino, o al que se expone a otra
intervencin. Cuando el experimento no es posible se disean estudios no experimentales que simulan de
alguna forma el experimento que no se ha podido realizar (1-5). En la Tabla 1 se resumen los diferentes
tipos de estudios. Si ha existido manipulacin pero no aleatorizacin se habla de estudios Cuasi-
experimentales. Existen diferentes clasificaciones de los diferentes estudios y as tambin algunos autores
describen los estudios como se sealan en la Tabla 2.
(6)

Tabl a 1. Ti pos de Est udi os Epi demi ol gi cos I
Ex per i ment al es No Ex per i ment al es
Ensayo clnico
Ensayo de campo
Ensayo comunit ario de
int ervencin
Est udios ecolgicos
Est udios de pr evalencia
Est udios de casos y cont roles
Est udios de cohort es o de
seguimient o

Tabl a 2. Ti pos de Est udi os Epi demi ol gi cos I I
DESCRI PTI VOS
En Pobl aci ones
o Est udios ecolgicos
En I ndi v i duos
o A propsit o de un caso
o Series de casos
o Transver sales / Prevalencia
ANAL TI COS
Obser vaci onal es
o Est udios de casos y cont roles
o Est udios de cohort es ( ret rospect ivos y prospect ivos)
I nt er v enci n
o Ensayo clnico
o Ensayo de campo
o Ensayo comunit ario
Las diferentes estrategias de los diferentes estudios han hecho que en la literatura cientfica exista una
proliferacin de nombres y sinnimos cuando se hace referencia a los estudios epidemiolgicos.
Resumimos en la Tabla 3 alguno de estos sinnimos.


Tabl a 3. Si nni mos y nombr e en i ngl s de l os di f er ent es t i pos de est udi os.
Est udi o Ex per i ment al ( Exper iment al st udy)
Ensayo clnico ( Clinical Trial)
Ensayo de campo ( Field t r ial)
Ensayo comunit ario de int ervencin ( Communit y int ervent ion t r ial)
Est udi o de Obser vaci n ( Observat ional st udy)
Est udios de Cohort es ( Cohort st udy)
Sinnimos: Est udio prospect ivo - Prospect ive st udy
Est udio de Seguimient o - Follow- up st udy
Est udio concur rent e - Concur rent st udy
Est udio de incidencia - I ncidence st udy
Est udio Longit udinal - Longit udinal st udy
Est udio de Cohort es hist rico ( Hist or ical cohort st udy)
Sinnimos: Est udio prospect ivo no concur rent e - Nonconcurrent prospect ive st udy
Est udio de seguimient o ret rospect ivo - Prospect ive st udy in ret rospect
Est udios de Casos y Cont roles ( Case cont rol- st udy)
Sinnimos: Ret rospect ive st udy
Case compar ison st udy
Case hist ory st udy
Case compeer st udy
Case referent st udy
Trohoc st udy
Est udi o Tr ansver sal ( Cross- sect ional st udy)
Sinnimos: Est udio de prevalencia - Pr evalence st udy - Disease frequencie st udy
Est udio de mor bilidad - Morbidit y survey
Encuest a de salud - Healt h survey
Dado el objetivo introductorio de este apartado presentamos muy brevemente las caractersticas
fundamentales de los diferentes tipos de estudios.
Est udi os descr i pt i v os
Estos estudios describen la frecuencia y las caractersticas ms importantes de un problema de salud. Los
datos proporcionados por estos estudios son esenciales para los administradores sanitarios as como para
los epidemilogos y los clnicos. Los primeros podrn identificar los grupos de poblacin ms vulnerables
y distribuir los recursos segn dichas necesidades y para los segundos son el primer paso en la
investigacin de los determinantes de la enfermedad y la identificacin de los factores de riesgo (5,6).
Los principales tipos de estudios descriptivos son: los estudios ecolgicos, los estudios de series de casos
y los transversales o de prevalencia.
Estudios ecolgicos: Estos estudios no utilizan la informacin del individuo de una forma aislada sino
que utilizan datos agregados de toda la poblacin. Describen la enfermedad en la poblacin en relacin a
variables de inters como puede ser la edad, la utilizacin de servicios, el consumo de alimentos, de
bebidas alcohlicas, de tabaco, la renta per cpita Un ejemplo de este estudio sera correlacionar la
mortalidad por enfermedad coronaria con el consumo per cpita de cigarrillos. Estos estudios son el
primer paso en muchas ocasiones en la investigacin de una posible relacin entre una enfermedad y una
exposicin determinada. Su gran ventaja reside en que se realizan muy rpidamente, prcticamente sin
coste y con informacin que suele estar disponible. As por ejemplo los datos demogrficos y el consumo
de diferentes productos se pueden correlacionar con la utilizacin de servicios sanitarios, con registros de
mortalidad y registros de cncer.
La principal limitacin de estos estudios es que no pueden determinar si existe una asociacin entre una
exposicin y una enfermedad a nivel individual. La falacia ecolgica consiste precisamente en obtener
conclusiones inadecuadas a nivel individual basados en datos poblacionales. Otra gran limitacin de los
estudios ecolgicos es la incapacidad para controlar por variables potencialmente confusoras. La
asociacin o correlacin que encontremos entre dos variables puede ser debida a una tercera variable que
a su vez est asociada con la enfermedad y la exposicin objeto de estudio.

Series de casos: Estos estudios describen la experiencia de un paciente o un grupo de pacientes con un
diagnstico similar. En estos estudios frecuentemente se describe una caracterstica de una enfermedad o
de un paciente, que sirven para generar nuevas hiptesis. Muchas veces documentan la presencia de
nuevas enfermedades o efectos adversos y en este sentido sirven para mantener una vigilancia
epidemiolgica.
Estos estudios aunque son muy tiles para formular hiptesis, no sirven para evaluar o testar la presencia
de una asociacin estadstica. La presencia de una asociacin puede ser un hecho fortuito. La gran
limitacin de este tipo de estudios es en definitiva la ausencia de un grupo control.
Estudios transversales: Este tipo de estudios denominados tambin de prevalencia, estudian
simultneamente la exposicin y la enfermedad en una poblacin bien definida en un momento
determinado. Esta medicin simultnea no permite conocer la secuencia temporal de los acontecimientos
y no es por tanto posible determinar si la exposicin precedi a la enfermedad o viceversa.
La realizacin de este tipo de estudios requiere definir claramente:
a. La poblacin de referencia sobre la que se desea extrapolar los resultados.
b. La poblacin susceptible de ser incluida en nuestra muestra delimitando claramente los que
pueden ser incluidos en dicho estudio.
c. La seleccin y definicin de variables por las que se va a caracterizar el proceso.
d. Las escalas de medida a utilizar.
e. La definicin de "caso".
Los estudios transversales se utilizan fundamentalmente para conocer la prevalencia de una enfermedad o
de un factor de riesgo.
Esta informacin es de gran utilidad para valorar el estado de salud de una comunidad y determinar sus
necesidades. As mismo sirven como todos los estudios descriptivos para formular hiptesis etiolgicas.
Est udi os anal t i cos
Estudio de casos y controles: Este tipo de estudio identifica a personas con una enfermedad (u otra
variable de inters) que estudiemos y los compara con un grupo control apropiado que no tenga la
enfermedad. La relacin entre uno o varios factores relacionados con la enfermedad se examina
comparando la frecuencia de exposicin a ste u otros factores entre los casos y los controles (5,6).
A este tipo de estudio que es de los ms utilizados en la investigacin se le podra describir como un
procedimiento epidemiolgico analtico, no experimental con un sentido retrospectivo, ya que partiendo
del efecto, se estudian sus antecedentes, en el que se seleccionan dos grupos de sujetos llamados casos y
controles segn tengan o no la enfermedad.
En los estudios de casos y controles (Tabla 4) tenemos casos expuestos (a), casos no expuestos (c),
controles expuestos (b) y controles no expuestos (d). En este estudio la frecuencia de exposicin a la
causa entre los casos (a/c) se compara con la frecuencia de exposicin en una muestra que represente a los
individuos en los que el efecto no se ha producido y entre los que la frecuencia de exposicin es (b/d).
TABLA 4. Tabl a de 2 x 2 en l os est udi os de Casos y Cont r ol es
Casos Cont r ol es
Ex puest os a b
No ex puest os c d


Si la frecuencia de exposicin a la causa es mayor en el grupo de casos de la enfermedad que en los
controles, podemos decir que hay una asociacin entre la causa y el efecto. La medida de asociacin que
permite cuantificar esta asociacin se llama "odds ratio" (razn de productos cruzados, razn de
disparidad, razn de predominio, proporcin de desigualdades, razn de oposiciones, oposicin de
probabilidades contrarias, cociente de probabilidades relativas, oportunidad relativa) y su clculo se
estima:

Los grandes temas que se deben abordar al realizar un estudio de casos y controles son despus de la
definicin de caso, la seleccin de los controles y las fuentes de informacin sobre la exposicin y la
enfermedad. No es el objetivo de este apartado realizar una revisin exhaustiva del diseo de este tipo de
estudios por lo que resumiremos diciendo que la seleccin de los casos debe:
a. Establecer de forma clara y explcita la definicin de la enfermedad y los criterios de inclusin.
b. Los casos deben ser incidentes ya que los casos prevalentes:
1. Cambian sus hbitos en relacin con la exposicin.
2. Los casos prevalentes pueden ser los sobrevivientes de casos incidentes y la
supervivencia puede estar relacionada con la exposicin.
La seleccin del grupo control debe tener en cuenta:
a. La funcin del grupo control es estimar la proporcin de exposicin esperada en un grupo que no
tiene la enfermedad.
b. Los controles deben ser representativos de la poblacin de donde provienen los casos. Los casos
y los controles no deben entenderse como dos grupos representativos de dos poblaciones
distintas, sino como dos grupos que proceden de una misma poblacin.
Los controles deben ser comparables a los casos en el sentido de haber tenido la misma probabilidad de
haber estado expuestos.
Estudio de cohortes (o de seguimiento): En este tipo de estudio los individuos son identificados en
funcin de la presencia o ausencia de exposicin a un determinado factor. En este momento todos estn
libres de la enfermedad de inters y son seguidos durante un perodo de tiempo para observar la
frecuencia de aparicin del fenmeno que nos interesa. Si al finalizar el perodo de observacin la
incidencia de la enfermedad es mayor en el grupo de expuestos, podremos concluir que existe una
asociacin estadstica entre la exposicin a la variable y la incidencia de la enfermedad.
La cuantificacin de esta asociacin la podemos calcular construyendo una razn entre la incidencia del
fenmeno en los expuestos a la variable (le) y la incidencia del fenmeno en los no expuestos (lo). Esta
razn entre incidencias se conoce como riesgo relativo y su clculo se estima como (Tabla 5):

Tabl a 5. Tabl a de 2 x 2 en l os est udi os de Cohor t es
Enf er mos Sanos Tot al


En este tipo de estudio como quiera que los participantes estn libres de la enfermedad al inicio del
seguimiento, la secuencia temporal entre exposicin y enfermedad se puede establecer ms claramente. A
su vez este tipo de estudio permite el examen de mltiples efectos ante una exposicin determinada.
Las ventajas y limitaciones de este tipo de estudio y de los diferentes tipos de estudios se resumen en la
Tabla 6 (6).
Los estudios de cohortes pueden ser prospectivos y retrospectivos dependiendo de la relacin temporal
entre el inicio del estudio y la presencia de la enfermedad. En los retrospectivos tanto la exposicin como
la enfermedad ya han sucedido cuando el estudio se inici. En los prospectivos la exposicin pudo haber
ocurrido o no, pero desde luego lo que an no ha sucedido es la presencia de la enfermedad. Por tanto se
requiere un perodo de seguimiento en el futuro para determinar la frecuencia de la misma.
Tabl a 6. Vent aj as y l i mi t aci ones de l os di f er ent es est udi os
epi demi ol gi cos
Ensay os Cl ni cos
Vent aj as Li mi t aci ones
Mayor cont rol en el diseo.
Menos posibilidad de sesgos
debido a la seleccin aleat oria
de los gr upos.
Repet ibles y comparables con
ot ras experiencias.
Cost e elevado.
Limit aciones de t ipo t ico y
responsabilidad en la
manipulacin de la
exposicin.
Dificult ades en la
generalizacin debido a la
seleccin y o a la propia
rigidez de la int ervencin.
Est udi os de Cohor t es
Est iman incidencia.
Mej or posibilidad de sesgos
en la medicin de la
exposicin.
Cost e elevado.
Dificult ad en la ej ecucin.
No son t iles en
enfer medades raras.
Requieren generalment e un
t amao muest ral elevado.
El paso del t iempo puede
int roducir cambios en los
mt odos y cr it erios
diagnst icos.
Posibilidad de prdida en el
seguimient o.
Est udi os de Casos y Cont r ol es
Relat ivament e menos
cost osos que los est udios de
seguimient o.
Cort a duracin.
Aplicaciones para el est udio
de enfer medades raras.
Permit e el anlisis de var ios
fact ores de riesgo para una
det er minada enfermedad.
No est iman dir ect ament e la
incidencia.
Facilidad de int roducir sesgos
de seleccin y/ o informacin.
La secuencia t emporal ent re
exposicin y enfermedad no
siempr e es fcil de
est ablecer .
Est udi os Tr ansv er sal es
Fciles de ej ecut ar.
Relat ivament e poco cost osos.
Por s mismos no sirven para
la invest igacin causal.

Se pueden est udiar varias
enfer medades y/ o fact ores de
riesgo a la vez.
Caract erizan la dist ribucin
de la enfer medad respect o a
diferent es variables.
Precisan poco t iempo para su
ej ecucin.
t iles en la planificacin y
Administ racin Sanit aria
( I dent ifican el nivel de salud,
los grupos vulnerables y la
prevalencia) .
No son t iles en
enfer medades raras ni de
cort a duracin.
Posibilidad de sesgos de
informacin y seleccin.
Este tipo de estudios son de la suficiente complejidad para requerir, no slo un equipo multidisciplinario
que los aborde sino una cantidad de recursos suficientes para mantenerlos a lo largo del tiempo.
Est udi os ex per i ment al es
En los estudios experimentales el investigador manipula las condiciones de la investigacin. Este tipo de
estudios se utilizan para evaluar la eficacia de diferentes terapias, de actividades preventivas o para la
evaluacin de actividades de planificacin y programacin sanitarias. Como en los estudios de
seguimiento los individuos son identificados en base a su exposicin, pero a diferencia de estos, en los
estudios experimentales es el investigador el que decide la exposicin. El gran control que se tiene sobre
el diseo facilita la interpretacin de las asociaciones como causales . Para el mdico clnico es de gran
inters poder realizar inferencias causales en medio de la incertidumbre que rodea la practica clnica ya
sea en actividades de prevencin, de diagnstico o teraputicas (7,8).
Los estudios experimentales pueden ser considerados:
1. Teraputicos (o prevencin secundaria) se realizan con pacientes con una enfermedad
determinada y determinan la capacidad de un agente o un procedimiento para disminuir
sntomas, para prevenir la recurrencia o para reducir el riesgo de muerte por dicha enfermedad.
2. Los preventivos (o prevencin primaria) evalan si una agente o procedimiento reduce el riesgo
de desarrollar una enfermedad. Por ello los estudios experimentales preventivos se realizan entre
individuos sanos que estn a riesgo de desarrollar una enfermedad. Esta intervencin puede ser
sobre una base individual o comunitaria a toda una poblacin determinada.
Ensayo clnico: Es el estudio experimental ms frecuente. Los sujetos son pacientes y evala uno o ms
tratamientos para una enfermedad o proceso. La validez de este estudio radica fundamentalmente en que
el proceso aleatorio haga los grupos comparables en las variables ms relevantes en relacin al problema
a estudiar. El diseo del estudio debe contemplar bsicamente:
a. La tica y justificacin del ensayo.
b. La poblacin susceptible de ser estudiada.
c. La seleccin de los pacientes con su consentimiento a participar.
d. El proceso de aleatorizacin.
e. La descripcin minuciosa de la intervencin.
f. El seguimiento exhaustivo que contemple las prdidas y los no cumplidores.
g. La medicin de la variable final.
h. La comparacin de los resultados en los grupos de intervencin y control.
Ensayos de campo: Tratan con sujetos que an no han adquirido la enfermedad o con aqullos que estn
en riesgo de adquirirla y estudian factores preventivos de enfermedades como pueden ser la
administracin de vacunas o el seguimiento de dietas.

Ensayos comunitarios: Incluyen intervenciones sobre bases comunitarias amplias. Este tipo de diseos
suelen ser cuasiexperimentales (existe manipulacin pero no aleatorizacin), en los que una o varias
comunidades recibirn la intervencin, mientras que otras servirn como control.
Los estudios experimentales si tienen un diseo cuidadoso con un tamao muestral suficiente, un proceso
de aleatorizacin adecuado, una intervencin y un seguimiento perfectamente controlados pueden
proporcionar evidencias muy fuertes que nos permitan emitir juicios sobre la existencia de relaciones
causales entre variables.
Sesgos. La pr eci si n y val i dez de un est udi o
Independientemente del tema y los objetivos de un estudio, que pueden ser de mayor o menor inters para
el lector o para la comunidad cientfica, lo que siempre se debe perseguir es que el estudio sea preciso y
vlido.
Todo estudio debe ser entendido como un ejercicio de medida en cada uno de los apartados de
planificacin, ejecucin e interpretacin. Es por tanto necesario formular unos objetivos de forma clara y
cuantitativa para dejar muy bien sentado desde el principio que es lo que se quiere medir. Si este primer
paso es deficiente o poco claro la calidad de un estudio se tambalea. (9-11)
La meta fundamental que todo estudio epidemiolgico debe perseguir es la agudeza en la medicin. Por
ello, que todo lo que amenace esta correcta medicin debe ser identificado y corregido. Los elementos
que amenazan estas mediciones son: El Error Aleatorio y el Error Sistemtico.
La carencia de error aleatorio se conoce como precisin y se corresponde con la reduccin del error
debido al azar. Para reducir este error el elemento ms importante del que disponemos es incrementar el
tamao de la muestra y con ello aumentamos la precisin. Los intervalos de confianza y el error estndar
se reducen al aumentar el tamao muestral. Es por tanto necesario desde un principio preocuparse por el
tamao muestral del estudio que vamos a realizar definiendo la precisin y la seguridad del mismo. La
precisin tambin se puede mejorar modificando el diseo del estudio para aumentar la eficiencia de la
informacin que obtengo de los sujetos del estudio.
La carencia del error sistemtico se conoce como validez. Esta validez tiene dos componentes: La validez
interna, que es la validez de las inferencias a los sujetos reales del estudio y la validez externa o
generalizacin en tanto se aplica a individuos que estn fuera de la poblacin del estudio. La validez
interna es por tanto un prerrequisito para que pueda darse la extrema.
La validez interna que es la que implica validez de inferencia para los propios sujetos de estudio. Se ve
amenazada por varios tipos de sesgos.
Entendemos por sesgos los errores sistemticos en un estudio epidemiolgico que producen una
estimacin incorrecta de asociacin entre la exposicin y la enfermedad. En definitiva producen una
estimacin equivocada del efecto.
Cuando realizamos un estudio o interpretamos los resultados del mismo nos podemos preguntar: Podran
los resultados deberse a algo que los autores no han tenido en consideracin?, como por ejemplo:
1. Los grupos del estudio no son comparables debido a como fueron seleccionados los pacientes
(sesgos en la seleccin).
2. Los grupos de pacientes del estudio no son comparables debido a como se obtuvieron los datos
(sesgos en la informacin).
3. Los autores no han recogido informacin (o la han obtenido pero no la han utilizado) sobre un
factor que se relaciona a la vez con la exposicin y con el efecto estudiados (factor de
confusin).
Los principales sesgos que comentaremos son los sesgos de seleccin, observacin e informacin.

Sesgo de Sel ecci n
Este sesgo hace referencia a cualquier error que se deriva del proceso de identificacin de la poblacin a
estudiar. La distorsin resulta de la forma en que los sujetos han sido seleccionados. Estos sesgos se
pueden cometer:
a. Al seleccionar el grupo control.
b. Al seleccionar el espacio muestral donde se realizar el estudio.
c. Por prdidas en el seguimiento.
d. Por la presencia de una supervivencia selectiva.
Los sesgos de seleccin pueden presentarse tambin en los estudios de casos y controles, cuando el
procedimiento utilizado para identificar el status de enfermedad (sesgo diagnstico) vara o se modifica
con el status exposicin. Este sesgo se llama "sesgo de deteccin".
Los sesgos de seleccin son un problema fundamental en los estudios de casos y controles y en los
estudios de cohortes retrospectivos donde la exposicin y el resultado final ya han ocurrido en el
momento que los individuos son seleccionados para el estudio. Los sesgos de seleccin son poco
probables en los estudios de cohortes prospectivos porque la exposicin se determina antes de la
presencia de enfermedad de inters. En todos los casos, cuando el sesgo de seleccin ocurre, el resultado
produce una relacin entre exposicin y enfermedad que es diferente entre los individuos que entraron en
el estudio que entre los que pudiendo haber sido elegidos para participar, no fueron elegidos.
La evitacin de los sesgos de seleccin depende en gran medida de que el investigador conozca las
fuentes de sesgo potenciales. En los estudios de casos y controles para evitar sesgos de seleccin, se
recomienda al menos tericamente, ya que desde el punto de vista prctico es muy costoso, utilizar dos
grupos control. Uno de ellos una muestra poblacional, lo que posibilita el detectar el posible sesgo de
seleccin al hacer estimaciones del efecto por separado. Si obtenemos la misma estimacin del efecto en
los controles poblacionales que con los otros controles podremos asumir que no hay sesgos en la
seleccin de los mismos. A pesar de todo siempre existe la posibilidad remota de que las dos estimaciones
tuviesen el mismo grado de sesgo. Otra recomendacin es utilizar muchas patologas como grupo control
en lugar de pocas patologas y comprobar que las frecuencias de exposicin son similares entre los
diferentes grupos diagnosticados en los controles. En los estudios de seguimiento se debe asegurar un
seguimiento completo en ambos grupos.
Sesgo de i nf or maci n u obser vaci n
Este sesgo incluye cualquier error sistemtico en la medida de informacin sobre la exposicin a estudiar
o los resultados. Los sesgos de observacin o informacin se derivan de las diferencias sistemticas en las
que los datos sobre exposicin o resultado final, se obtienen de los diferentes grupos. El rehusar o no
responder en un estudio puede introducir sesgos si la tasa de respuesta est relacionada con el status de
exposicin. El sesgo de informacin es por tanto una distorsin en la estimacin del efecto por errores de
medicin en la exposicin o enfermedad o en la clasificacin errnea de los sujetos. Las fuentes de sesgo
de informacin ms frecuentes son:
a. Instrumento de medida no adecuado.
b. Criterios diagnsticos incorrectos.
c. Omisiones.
d. Imprecisiones en la informacin.
e. Errores en la clasificacin.
f. Errores introducidos por los cuestionarios o las encuestadoras.
Los errores de clasificacin son una consecuencia directa del sesgo de informacin. Esta clasificacin
puede ser "diferencial" si el error de clasificacin es independiente para ambos grupos o "no diferencial"
si el error de clasificacin es igual para ambos grupos de estudio, producindose una dilucin del efecto
con una subestimacin del mismo.

Los encuestadores pueden introducir errores de clasificacin "diferencial" si conocen las hiptesis del
estudio y la condicin del entrevistado. Este tipo de problema se puede controlar por medio de:
a. Desconocimiento del entrevistado.
b. Desconocimiento de las hiptesis de estudio.
c. Utilizacin de cuestionarios estructurados.
d. Tiempos de ejecucin de la entrevista definitiva.
e. Utilizacin de pocos entrevistadores.
La prevencin y control de sesgos potenciales debe prevenirse durante el diseo del estudio ya que en el
anlisis no va a ser posible solucionar los sesgos de seleccin e informacin. Por el contrario los factores
de confusin s pueden ser controlados en el anlisis. Dichos factores de confusin van a producir una
distorsin en la estimacin del efecto, en el sentido de que el efecto observado en a poblacin en estudio
es una mezcla de los efectos debidos a una tercera (o ms) variables.
Los sesgos, el azar y la presencia de variables confusoras deben finalmente siempre, tenerse en cuenta,
como explicacin posible de cualquier asociacin estadstica ya sea esta positiva, negativa o no existente;
Y es que como sealaba M. Susser en sus reflexiones sobre causalidad "cuando hay minas por todas
partes no debe uno aventurarse sin un detector de minas" (12).
Bi bl i ogr af a
1- MacMahon B., Trichopoulos D. Epidemiology: Principles and Methods. 2
nd
ed. Boston: Lippincott
Williams & Wilkins; 1996. [editor]
2- Jenicek M., Cleroux R. Epidemiologa: la lgica de la medicina moderna. Barcelona: Masson; 1996.
3- Armijo R.R. Epidemiologa bsica en Atencin primaria de salud. Madrid: Daz de Santos; 1993.
4- Rothman K.J. Epidemiologa Moderna. Madrid: Ediciones Das de Santos; 1987.
5- Kelsey JL., Thompson WD., Evans AS. Methods in Observational Epidemiology. New York: Oxford
University Press; 1986. [Amazon]
6- Hennekens CH., Buring JE. Epidemiology in Medicine Boston: Litte, Brown and Company; 1987.
7- Sackett DL., Haynes RB., Guyatt GH., Tugwell P. Epidemiologa clnica. Ciencia bsica para la
medicina clnica. 2 ed. Madrid: Editorial Mdica Panamericana; 1994.
8- Fletcher RH., Fletcher SW., Wagner EH. Epidemiologa clnica. 2 ed. Barcelona: Masson-Williams &
Wilkins; 1998.
9- Kleinbaum DG., Kupper LL., Morggenstern H. Epidemiologic Research. Principles and Quantitative
Methods. Belmont, California: John Wiley & Sons; 1982.
10- Miettinem OS. Theoretical Epidemiology. New York: Jhon Wiley & Sons; 1985.
11- Rothman KJ. (ed). Causal Inference. Chesnut Hill: Epidemiology Resources Inc; 1988.
12- Susser M. Conceptos y estrategias en epidemiologa. El pensamiento causal en ciencias de la salud.
Mxico: Biblioteca de la Salud; 1991.

I nvest igacin: Ensayos clnicos 1/ 7

Estudios experimentales en la prctica clnica. Investigacin teraputica.
Ensayos clnicos.

Pita Fernndez, S. Estudios experimentales en la prctica clnica. Investigacin teraputica. Ensayos
clnicas. En: Gmez de la Cmara, A. ed. Manual de Medicina Basada en la Evidencia. Elementos para su
desarrollo y aplicacin en Atencin Primaria. Madrid: Jarpyo Editores; 1998. p. 147-163.
(Espaa).
__________________________________
Qu es un ensay o cl ni co?
Un ensayo clnico es una evaluacin experimental de un producto, sustancia, medicamento, tcnica
diagnstica o teraputica que a travs de su aplicacin a seres humanos pretende valorar su eficacia y
seguridad (1-3)
Diferentes grupos han propuesto que en la prctica mdica diaria se empleen slo los medicamentos y
procedimientos que hayan demostrado mayor eficacia y eficiencia sobre la salud de la poblacin (4).
En la prctica mdica actual un ensayo clnico aleatorio controlado de una teraputica contra otra es la
norma aceptada por la cual se juzga la utilidad de un tratamiento.
El diseo del estudio debe contemplar bsicamente:
1. La tica y justificacin del ensayo.
2. La poblacin susceptible de ser estudiada.
3. La seleccin de los pacientes con su consentimiento a participar.
4. El proceso de aleatorizacin.
5. La descripcin minuciosa de la intervencin.
6. El seguimiento exhaustivo que contemple las prdidas y los no cumplidores.
7. La medicin de la variable final.
8. La comparacin de los resultados en los grupos de intervencin y control.

Consi der aci ones met odol gi cas Pr ot ocol o de un Ensay o Cl ni co
El protocolo del ensayo debe estar claramente desarrollado y escrito antes del proceso de seleccin de los
pacientes. Los elementos bsicos de dicho protocolo se indican en la tabla 1 (5).
Todos los detalles de cmo se realizarn cada una de las actividades del ensayo no es necesario que se
incluyan en el protocolo siempre y cuando exista un manual del investigador y unos procedimientos
normalizados de trabajo en que s se incluyan. A continuacin revisaremos alguno de los aspectos
metodolgicos ms relevantes en el diseo de un ensayo clnico (1,5-7)
Tabl a 1. Apar t ados del pr ot ocol o de un Ensay o Cl ni co
Resumen
ndice
I nformacin general:
o Tt ulo del ensayo
o I dent ificacin del promot or
o I nvest igador/ es principal/ es
o Cent ros en los que se prev r ealizar el ensayo
o Fase del ensayo
Just ificacin y obj et ivos
Tipo de ensayo y diseo del mismo
Seleccin de suj et os

Descr ipcin del t rat amient o
Desarrollo del ensayo y evaluacin de la r espuest a
Acont ecimient os adversos
Aspect os t ico- legales:
o Consent imient o informado
o Pliza de segur os
o I ndemnizacin
Consideraciones prct icas
Anlisis est adst ico
Document acin complement aria:
o Cont rat os relacionados con el ensayo clnico
o Presupuest o
o Dist r ibucin de gast os
Cuaderno de recogida de dat os
Manual del invest igador
Procedimient os normalizados de t rabaj o:
o I dent ificacin y calificacin del equipo invest igador
o Procedimient o de archivo de la document acin
o Procedimient os de monit or izacin
o Regulacin de los procedimient os de suminist ro
o Procedimient o de not ificacin de acont ecimient os adversos
graves e inesperados
o Procedimient o para proporcionar infor macin adecuada al
suj et o y consent imient o infor mado

Just i f i caci n y obj et i v os
En este apartado se debe indicar toda la informacin relevante y las evidencias cientficas que apoyen la
realizacin del estudio. Es evidente que el ensayo depende de la pregunta a investigar, que debe ser
cientfica y mdicamente relevante. El tamao muestral depender del objetivo principal, que debe estar
claramente definido. Si existiesen objetivos debe quedar claramente de manifiesto y se pretende valorar la
eficacia, la seguridad, la farmacocintica o la bsqueda de dosis de un frmaco.
Ti po de ensay o cl ni co
La integridad cientfica del ensayo y la credibilidad de los datos obtenidos en el mismo dependen
sustancialmente del diseo. En este apartado se debe incluir:
Descripcin del tipo de ensayo que se va a realizar (como, por ejemplo: doble ciego, controlado
con placebo, cruzado o paralelo).
Tipo de control (placebo u otros).
Descripcin detallada del proceso de aleatorizacin (procedimiento y consideraciones prcticas).
Sel ecci n de l os suj et os
Criterios de inclusin y exclusin.
Criterios diagnsticos para las patologas en estudio.
Nmero de sujetos previstos (totales y por centros s procede) y justificacin de dicho tamao
muestral.
Variables que se estudiarn en cada sujeto, con su escala de medida y calendario de recogida.
Criterios de retirada y anlisis previsto de las retiradas y los abandonos.
Tratamiento de las prdidas pre-randomizacin.
Duracin aproximada del periodo de reclutamiento en funcin del nmero de pacientes
disponibles.


Descr i pci n del t r at ami ent o
Descripcin de la dosis, intervalo, va y forma de administracin y duracin del tratamiento a
ensayo.
Criterios de modificacin de pautas a lo largo del ensayo.
Tratamientos concomitantes permitidos y prohibidos.
Especificacin de la "medicacin de rescate" en los casos en que proceda.
Normas especiales del manejo de frmacos en estudio.
En caso de tratamientos no permitidos, especificar el perodo de tiempo mnimo transcurrido
desde su suspensin hasta que el sujeto pueda ser incluido en el estudio.
Medidas para valorar el cumplimiento teraputico.
Desar r ol l o del ensay o y eval uaci n de l a r espuest a
Enfermedad o trastorno a estudio.
Variable principal de valoracin.
Nmero y tiempo de las visitas durante el mismo, especificando las pruebas o exploraciones que
se realizarn para la valoracin de la respuesta.
Descripcin de los mtodos (radiolgicos, de laboratorio) utilizados para la valoracin de la
respuesta y control de calidad de los mismos.
Acont eci mi ent os adver sos
Indicacin de la informacin mnima que se deber especificar para los acontecimientos
adversos (descripcin, gravedad, duracin, secuencia temporal, mtodo de deteccin, tratamiento
administrado en su caso; causas alternativas, factores predisponentes).
Indicar criterios de imputabilidad que se van a utilizar.
Indicar los procedimientos para la notificacin inmediata de los acontecimientos adversos graves
o inesperados.
Incluir un modelo de hoja de notificacin de acontecimientos adversos a las autoridades
sanitarias.
Aspect os t i cos
Consideraciones generales: aceptacin de las normas nacionales e internacionales al respecto
(Declaracin de Helsinki). Normas de buena prctica clnica [anexo I].
Informacin que ser proporcionada a los pacientes y tipo de consentimiento que ser solicitado
en el ensayo clnico.
Especificacin de quin tendr acceso a los datos, con el fin de garantizar su confidencialidad.
Contenidos del presupuesto del ensayo clnico (compensacin para los pacientes del ensayo,
investigadores) que deben ser comunicados al comit tico de investigacin clnica
correspondiente.
Garanta de la existencia de una pliza de seguro o indemnizacin suscrita y caracterstica de la
misma.
Consi der aci ones pr ct i cas
Especificar las responsabilidades de todos los participantes en el ensayo clnico.
Especificar las condiciones de archivo de datos, su manejo, procesamiento y correcciones.
Identificacin de las muestras de investigacin clnica y responsables de su suministro y
conservacin, as como del etiquetado de las mismas.
Condiciones de publicacin.


Val or aci n de un ensay o
La valoracin de un ensayo se debe contemplar teniendo en cuenta dos aspectos diferentes: por un lado,
lo que deben contemplar los comits de investigacin clnica para evaluar un ensayo y, por otro lado,
cmo evaluar un artculo sobre teraputica.
La valoracin que de un ensayo clnico deben contemplar los comits de investigacin clnica comprende
los siguientes criterios:
1. Evaluacin de la idoneidad del protocolo en relacin con los objetivos del estudio, su eficiencia
cientfica o la posibilidad de alcanzar conclusiones vlidas, con la menor exposicin posible de
sujetos y la justificacin de los riesgos y molestias previsibles, ponderadas en funcin de los
beneficios esperados para los sujetos y la sociedad.
2. Evaluacin de la idoneidad del/de los equipos investigadores para el ensayo clnico propuesto.
En este apartado hay que tener en cuenta la experiencia y capacidad investigadora para llevar a
cabo el estudio.
3. Evaluacin de la informacin escrita sobre las caractersticas del ensayo clnico que se dar a los
posibles sujetos de la investigacin, la forma en que dicha informacin ser proporcionada y el
tipo de consentimiento que va a obtenerse.
4. Comprobacin de la previsin de la compensacin y tratamiento que se ofrecer a los sujetos
participantes en caso de lesin o de muerte atribuible al ensayo clnico y del seguro o
indemnizacin para cubrir las responsabilidades especificadas por la legislacin.
5. Conocimiento y evaluacin del alcance de las compensaciones que se ofrecern a los
investigadores y a los sujetos de la investigacin por su participacin.
Para la evaluacin de un artculo sobre teraputica siguiendo las recomendaciones de "The Evidence-
Based Medicine Working Group" (8,9) debemos tener en cuenta las siguientes consideraciones:
Son vlidos los resultados del estudio.
Fue aleatoria la asignacin de los pacientes al tratamiento?
Se ha tenido en cuenta en las conclusiones a todos los pacientes correctamente
incluidos, en cuanto a su nmero y a sus caractersticas?
Se realiz un enmascaramiento de los pacientes, los mdicos y del personal del
estudio?
Aparte de la intervencin experimental del estudio fueron ambos grupos igualmente
tratados?
Cules fueron los resultados del estudio?
Cul fue la magnitud del efecto teraputico?
Cul ha sido la precisin en la estimacin del efecto?
Cul fue la magnitud del efecto teraputico?
Cul ha sido la precisin en la estimacin del efecto?
Los resultados del estudio son tiles para mis pacientes?
Puedo aplicar estos resultados a mis pacientes?
Se han considerado todos los resultados clnicamente importantes?
Los beneficios teraputicos compensan los riesgos potenciales y los costes?
Aunque los investigadores tienen la obligacin de revisar crticamente el estudio y sus hallazgos y
presentar suficiente informacin para que el lector pueda evaluar adecuadamente el ensayo, los lectores
deben tener la suficiente capacidad crtica para discriminar la calidad de la mejor evidencia.
Consideramos que el conocimiento metodolgico de los diferentes aspectos de un ensayo clnico ayudan
a valorar la calidad de la evidencia cientfica y, en definitiva, ayudan a mejorar el cuidado de los
pacientes, que es el objetivo fundamental de nuestro trabajo.
Un ej empl o
Un ejemplo de la estructura de un artculo sobre teraputica para que el lector realice su propio
anlisis crtico podra venir dado por la pregunta frecuente de considerar el tratamiento de un paciente
con cardiopata isqumica y concentraciones elevadas de colesterol en sangre. Se pretende buscar

informacin cientfica sobre la eficacia del tratamiento hipolipemiante. La bsqueda bibliogrfica aporta
el siguiente artculo y se realiza una valoracin crtica detenida ponderando el beneficio del tratamiento
sobre tanto la reduccin relativa como la absoluta del riesgo y verificando fcilmente el esfuerzo a
realizar segn el nmero de sujetos a tratar por cardiopata isqumica para evitar un caso de muerte o de
infarto de miocardio
Randomised trial of cholesterol lowering in 4444 patients with coronary heart disease: the
Scandivarian Simvastatin Survival Study (4S). Lancet 1994; 334: 1383-1389.
Objetivo: evaluar la eficacia de la disminucin de colesterol con simvastatina en la reduccin de la
mortalidad y morbilidad en pacientes con enfermedad coronaria (EC).
Diseo: ensayo clnico controlado, aleatorizado en dos ramas, a doble ciego con placebo y un
seguimiento medio de 5,4 aos.
mbito: pacientes procedentes de 95 centros mdicos de Escandinavia.
Sujetos de estudio: 4.444 pacientes de entre 35 y 70 aos, 81% hombres, 51% mayores de 60 aos, con
antecedentes de infarto de miocardio previo a angina de pecho, colesterol srico de 5,5 a 8,8 mmol/l,
concentraciones medias de HDL de 1,18 mmol/l, LDL 4,87 mmol/l, triglicridos 1,50 mmol/l y dieta
hipolipemiante concurrente.
Intervencin: a 2.223 sujetos se les administraron 20 mgr de simvastatina y a 2.221 el correspondiente
placebo.
Parmetros principales de eficacia: mortalidad total, mortalidad de causa coronaria, infarto de miocardio
no letal probable o definitivo verificado.
Resultados principales: durante los 5,4 aos en promedio de seguimiento la simvastatina produjo unos
cambios medios de colesterol total, LDL colesterol y HDL colesterol de 25%, -35% y +8%,
respectivamente. Doscientos cincuenta y seis (12%) sujetos en el grupo de placebo murieron en
comparacin con 182 (8%) en el grupo de simvastatina. Hubo 189 muertes de origen coronario en el
grupo de placebo y 111 en el de simvastatina y 49 y 46 muertes de origen no cardiovascular en dichos
grupos, respectivamente. Seiscientos veintids sujetos (28%) en el grupo con placebo y 431 (19%) en el
de simvastatina tuvieron uno o ms incidentes coronarios mayores (tabla II).
Conclusiones: la disminucin de la concentracin de colesterol con simvastatina reduce la mortalidad
total y la incidencia de incidentes cardiovasculares mayores.
Tabl a 2. Si mvast at i na v s Pl acebo. Resul t ados a l os 5.4 aos de segui mi ent o
Si mvast at i na Pl acebo
RRR
Reducccin
Relat iva del
Riesgo
RAR
Reduccin
Absolut a del
Riesgo
NNT
Nmero que
se necesit a
t rat ar

TEE
Tasa de Episodios
en el grupo
Experiment al %
TEC
Tasa de
Episodios en el
grupo Cont rol
%
TEC- TEE / TEC TEC- TEE 1 / RAR
Mor t al i dad
t ot al
8 % 12 %
12- 8 / 12 =
33%
12- 8 = 4%
1/ 4 = 25
pacient es
I nci dent es
cor onar i os
may or es
19 % 28 %
28- 19 / 28 =
32%
28- 19 = 9%
1/ 9 = 11
pacient es


Bi bl i ogr af a
1. Friedman LM, Furberg CD, DeMets DL. Fundamentals of clinical trials. 3 rd. ed. New York: Springer
Verlag; 1998. [editor]
2. Hennekens CH, Buring JE. Epidemiology in Medicine. Boston: Little Brown; 1987.
3. Hulley SB, Cummings Sr. Designing clinical research. 2 nd. ed. Baltimore: Lippincott Williams and
Wilkins; 2001.
4. Evidence-Based Medicine Working Group. Evidence Based medicine. A new approach to teaching the
practice of medicine. JAMA 1992; 268: 2420-5. [Medline]
5. Procedimientos normalizados de trabajo del Comit tico de investigacin clnica (CEIC) de la
Comunidad Autnoma de Galicia. Santiago de Compostela: Consellera de Sanidade, Servicio Galego de
Sade; 1996. [Texto complementario]
6. Sacket DL, Haynes RB, Cuyatt GH, Tugwell P. Epidemiologa clnica. Ciencia bsica para la
medicina clnica. 2 ed. Madrid: Mdica Panamericana; 1994.
7. Fletcher RH, Fletcher SW, Wagner EH. Clinical Epidemiology. The Essentials. 3 rd. ed. Baltimore:
Williams and Wilkins; 1996.
8. Evidence-Based Medicine Working Group. UserGuides to the Medical Literature. II How to Use an
Article About Therapy or Prevention. A. Are the results of the study valid? JAMA 1993; 270: 2598-2601.
[Medline]
9. Evidence-Based Medicine Working Group. User Guides to the Medical Literature. II How to Use an
Article About Therapy or Prevention. B. What were the results and will they help me in caring for my
patients? JAMA 1994; 271: 59-63. [Medline]
10. Real Decreto 561/1993 de 16 de abril por el que se establecen requisitos para la realizacin de
Ensayos clnicos con Medicamentos (Boletn Oficial del Estado, n114, del 13 de mayo de 1993).
11. Directiva 91/507/CEE de 19 de julio sobre Normas y Protocolos Analticos, Toxifarmacolgicos y
Clnicos en materia de medicamentos (DOCE ,n L 270, 26 de septiembre de 1991).
Anex o I
Pr i nci pi os de Buena pr ct i ca cl ni ca y gar ant a de cal i dad
De acuerdo con la legislacin del Estado (R.D. 561/1993)
10
y de la Directiva Comunitaria
(91/507/CEE)
11
, todos los ensayos clnicos en todas sus fases, incluyendo aquellos de biodisponibilidad y
bioequivalencia, se realizarn segn las normas de buena prctica clnica.
Las normas de buena prctica clnica (BPC) son una ayuda para asegurar que la investigacin clnica se
lleva a cabo segn los ms elevados estndares de calidad, siguiendo los criterios ticos (basados en la
Declaracin de Helsinki y desarrollos ulteriores) y con un equipo mdico de garanta. En este sentido, las
normas de BPC constituyen una norma para el diseo, direccin, realizacin, cumplimiento,
monitorizacin, auditora, registro, anlisis e informacin de ensayos clnicos que asegura que los datos y
resultados obtenidos son correctos y crebles y que se protegen los derechos, integridad y
confidencialidad de los sujetos del ensayo.
Los principios de la BPC (buena prctica clnica) son los siguientes:

1. Los ensayos clnicos deben ser realizados de acuerdo con los principios ticos que tienen su
origen en la Declaracin Helsinki, los cuales son consistentes con la BPC y los requisitos
reguladores pertinentes.
2. Antes de iniciar un ensayo, deben considerarse las inconveniencias y riesgos previsibles en
relacin con el beneficio previsto paras el sujeto individual del ensayo y para la sociedad. Un
ensayo debe ser iniciado y continuado slo si los beneficios previstos justifican los riesgos.
3. Los derechos, seguridad y bienestar de los sujetos del ensayo son las consideraciones ms
importantes y deben prevalecer sobre los intereses de la ciencia y la sociedad.
4. La informacin clnica y no clnica disponible sobre un producto en investigacin debe ser
adecuada para respaldar el ensayo clnico propuesto.
5. Los ensayos clnicos deben ser cientficamente razonables y estar descritos en un protocolo claro
y detallado.
6. Un ensayo debe ser realizado de acuerdo con el protocolo, que ha recibido una revisin previa y
una opinin favorable/aprobacin de un Consejo Institucional de Revisin (CIR) / Comit tico
Independiente (CEI).
7. El cuidado mdico que reciben los sujetos y las decisiones mdicas que afectan a los mismos
deben ser siempre responsabilidad de un mdico cualificado o, en su caso de un odontlogo
cualificado.
8. Cada individuo implicado en la realizacin de un ensayo debe ser cualificado, por educacin,
formacin y experiencia, para realizar su labor.
9. Se debe obtener un consentimiento informado, dado libremente, de cada sujeto, previamente a su
participacin en el ensayo clnico.
10. Toda la informacin del ensayo clnico debe ser registrada, manejada y almacenada de forma
que permita su comunicacin, verificacin e interpretacin exactas.
11. Debe protegerse la confidencialidad de los registros que pudieran identificar a los sujetos,
respetando la privacidad y las normas de confidencialidad de acuerdo con los requisitos
reguladores pertinentes.
12. Los productos en investigacin deben ser fabricados, manejos y almacenados de acuerdo con las
normas de buena prctica de fabricacin pertinentes y se deben utilizar de acuerdo con el
protocolo aprobado.
Se debern llevar a cabo los sistemas y procedimientos que aseguren la calidad de cada aspecto del
ensayo.
El Consent i mi ent o I nf or mado en l os ensay os cl ni cos con medi cament os
Aut or es:
Lamas Mei l n, Manuel Mar a* Pi t a Fer nndez, Sal v ador * *
* Doct or en Derecho
* * Unidad de Epidemiologa Clnica y Bioest adst ica. Complexo Hospit alario Universit ario de A Corua ( Espaa) .
Cad At en Pr i mar i a 2009; 16: 240- 246.

Act ualizada el 30/ 10/ 2009.
Tabl a de cont eni dos:

REAL DECRETO 223/ 2004, de 6 de febrero, por el que se regulan los
Ensayos Clnicos con Medicament os

Bibliografa
I mprimir document o [ Problemas con PDF?]

Tabl as
Tabla 1. Apart ados del Prot ocolo de un Ensayo Clnico
Tabla 2. Cr it erios de evaluacin de un Ensayo Clnico
Tabla 3. Valor acin del consent imient o informado en los ensayos clnicos
- - - - - - - - - - - - - - - - - - - - - - -
Real Decret o 223/ 2004, por el que se regulan los ensayos clnicos con medicament os

Un ensayo clnico es una evaluacin experiment al de un product o, sust ancia, medicament o, t cnica diagnst ica o t eraput ica que a t r avs de su aplicacin a seres humanos
pr et ende valorar su eficacia y seguridad ( 1- 3) . Diferent es grupos han pr opuest o que en la prct ica mdica diar ia se empleen slo los medicament os y procedimient os que hayan
demost rado mayor eficacia y eficiencia sobre la salud de la poblacin ( 4) . En la prct ica mdica act ual un ensayo clnico aleat orio cont rolado de una t eraput ica cont r a ot ra es la
norma acept ada por la cual se j uzga la ut ilidad de un t rat amient o. El diseo del est udio debe cont emplar bsicament e:
a. La t ica y j ust ificacin del ensayo.
b. La poblacin suscept ible de ser est udiada.
c. La seleccin de los pacient es con su consent imient o a part icipar.
d. El proceso de aleat or izacin.
e. La descripcin minuciosa de la int ervencin.
f. El seguimient o exhaust ivo que cont emple las pr didas y los no cumplidores.
g. La medicin de la variable final.
h. La comparacin de los r esult ados en los gr upos de int ervencin y cont rol.
El prot ocolo del ensayo debe est ar clarament e desarrollado y escrit o ant es del proceso de seleccin de los pacient es. Los element os bsicos de dicho prot ocolo se indican en la Tabla
1. La evaluacin y valor acin del prot ocolo del ensayo clnico se llevar a cabo por evaluadores de los comit s t icos cor respondient es segn los siguient es crit er ios que se muest ran
en la Tabla 2 ( 5, 6) .
El comit t ico de invest igacin clnica de Galicia ( CEI C) dispone de una serie de propuest as, a modo de ej emplo, de modelos de consent imient o informado ( 7) segn el t ipo de
est udio que se desee r ealizar y que est n disponibles en: ht t p: / / www. sergas. es/ Most rarCont idos_N3_T01. aspx?I dPaxina= 60049. Dichos modelos no son de obligado cumplimient o,
sino propuest as, a modo de ej emplos y que en cualquier caso, precisan ser adapt ados a las caract er st icas de cada proyect o en part icular. Los apar t ados a valorar en el
consent imient o infor mado de un ensayo clnico, que se ut ilizan en el CEI C de Galicia se muest ran en la Tabla 3 ( 6) .

Tabl a 1. Apar t ados del Pr ot ocol o de un Ensay o Cl ni co.
1. Resumen
2. ndi ce
3. I nf or maci n gener al :
1. Tt ulo del ensayo.
2. I dent ificacin del promot or.
3. I nvest igador / res principal/ es.
4. Cent r os en los que se prevee r ealizar el ensayo.
5. Fase del ensayo.
4. Just i f i caci n del ensay o
5. Obj et i vos
6. Ti pos de ensay o
7. Di seo del mi smo
1. mbit o de est udio.
2. Perodo de est udio.
3. Seleccin de los pacient es.
4. Crit erios de inclusin y exclusin.
5. Procedimient o de aleat orizacin.
6. Just ificacin del t amao muest ral.
7. Mediciones e int ervenciones.
8. Descripcin de la int ervencin.
9. Evaluacin de la r espuest a.
10. Anlisis est adst ico.
8. Segur i dad y ef ect os adver sos
9. Aspect os t i co- l egal es
1. Consent imient o informado.
2. Pliza de seguros.
3. Cumplimient o de normas de Buena prct ica clnica y Declaracin de Helsinki.
4. Manej o de muest r as y confidencialidad de la informacin.
10. Memor i a econmi ca
11. Compr omi so del i nv est i gador
12. Compr omi so de publ i caci n
13. Cuader no de r ecogi da de dat os
14. Manual del i nv est i gador y pr ocedi mi ent os nor mal i zados de t r abaj o
1. Procedimient o de archivo de la document acin.
2. Procedimient o de monit orizacin.
3. Regulacin de los procedimient os de suminist ro.
4. Procedimient o de not ificacin de acont ecimient os adversos.
5. Procedimient o para proporcionar informacin adecuada al pacient e.
Tabl a 2. Cr i t er i os de ev al uaci n de un ensay o cl ni co.
1. Ev al uaci n de aspect os met odol gi cos
Pert inencia y j ust ificacin.
Hipt esis y obj et ivos.
Poblacin de est udio.
Just ificacin del t amao muest ral.
Valoracin de la int er vencin.
Valoracin de la respuest a a la int ervencin.
Valoracin de anlisis est adst ico pr evist o.
Acont ecimient os adver sos.
2. Ev al uaci n de aspect os t i cos
Riesgos y beneficios del ensayo.
Valoracin y j ust ificacin del t r at amient o en el gr upo cont rol o placebo.
Previsin de int er rupcin del ensayo por falt a de eficacia o seguridad.
Acceso a la medicacin del ensayo.
Valoracin de conflict os de int ers.
Valoracin de polt icas de publicacin del ensayo.
I nclusin de poblaciones vulnerables. Just ificacin de su pot encial beneficio.
3. Ev al uaci n de aspect os l egal es
Page 1 of 4 El Consentimiento Informado en los ensayos clnicos.
11/11/2009 http://www.fisterra.com/mbe/investiga/8consentimiento/consentimiento_ensayos.asp

( REAL DECRETO 223/ 2004, de 6 de f ebr er o, por el que se r egul an l os Ensay os Cl ni cos con Medi cament os) .
La Ley 29/ 2006, de 26 de j ulio, de garant as y uso racional de los medicament os y pr oduct os sanit arios, es la norma bsica que regula los ensayos clnicos en Espaa ( 8) . En ella el
Tt ulo I I I De las garant as de la invest igacin de los medicament os en uso humano es especfico sobre ensayos clnicos con medicament os, en su art culo 60 t it ulado Gar ant as de
respet o a los post ulados t icos en su apar t ado 4, se nos dice. . .El suj et o del ensayo prest ar su consent imient o librement e, expresado por escrit o, t ras haber sido informado sobre
la nat uraleza, impor t ancia, implicaciones y riesgos del ensayo clnico. Si el suj et o del ensayo no est en condiciones de escr ibir, podr dar, en casos excepcionales, su
consent imient o ver bal en presencia de, al menos, un t est igo mayor de edad y con capacidad de obr ar. El suj et o par t icipant e en un ensayo clnico o su represent ant e podr revocar,
en t odo moment o, su consent imient o sin expresin de su causa.
En el caso de personas que no puedan emit ir libr ement e su consent imient o, st e deber ser ot orgado por su represent ant e legal pr evia inst ruccin y exposicin ant e el mismo del
alcance y riesgos de ensayo. Ser necesar io, adems, la conformidad del represent ado si sus condiciones le permit en comprender la nat uraleza, impor t ancia, alcance y riesgos del
ensayo.
La normat iva comunit aria se t raspone mediant e el Real Decret o 223/ 2004, de 6 de febrer o, por el que se regulan los ensayos clnicos con medicament os ( 9) , la ORDEN SCO/
256/ 2007, de 5 de febr ero, por la que se est ablecen los principios y las direct rices det alladas de buena prct ica clnica y los requisit os para aut or izar la fabricacin o import acin de
medicament os en invest igacin humana ( 10) y el document o publicado por el Minist erio de Sanidad, Agencia Espaola de Medicament os y Product os Sanit arios, Subdireccin
Gener al de Medicament os de Uso Humano, rea de Ensayos Clnicos, t it ulado Aclaraciones sobre la aplicacin de la normat iva de ensayos clnicos con medicament os de uso
humano a part ir del 1 de mayo de 2004 , siendo la finalidad de st e lt imo document o aclarar la forma de proceder mient ras no se publiquen por el Minist erio de Sanidad t odas las
Direct ivas y guas de desarrollo europeas en mat eria de ensayos clnicos ( 11)
A cont inuacin analizaremos el art culo 7 del Real Decret o 223/ 2004, en donde se regula el consent imient o informado en los ensayos clnicos con medicament os, el cual derog
el Real Decret o 561/ 1993, de 16 de abril, por el que se est ablecan los requisit os para la realizacin de ensayos clnicos con medicament os ( 12)
Ar t cul o 7. Del consent i mi ent o i nf or mado
1. La obt enci n del consent i mi ent o i nf or mado debe t ener en cuent a l os aspect os i ndi cados en l as r ecomendaci ones eur opeas al r espect o y que se r ecogen en
l as i nst r ucci ones par a l a r eal i zaci n de ensay os cl ni cos en Espaa o, en su caso, en l as di r ect r i ces de l a Uni n Eur opea.
2. El suj et o del ensay o deber ot or gar su consent i mi ent o despus de haber ent endi do, medi ant e una ent r ev i st a pr ev i a con el i nv est i gador o un mi embr o del
equi po de i nv est i gaci n l os obj et i v os del ensay o, as como l as condi ci ones en l as que se l l ev ar a cabo, y despus de haber si do i nf or mado de su der echo a
r et i r ar se del ensay o en cual qui er moment o si n que el l o l e ocasi one per j ui ci o al guno.
El consent i mi ent o se document ar medi ant e una hoj a de i nf or maci n par a el suj et o y el document o de consent i mi ent o. La hoj a de i nf or maci n cont endr
ni cament e i nf or maci n r el ev ant e, ex pr esada en t r mi nos cl ar os y compr ensi bl es par a l os suj et os y est ar r edact ada en l a l engua pr opi a del suj et o.
En la exposicin de mot ivos del Real Decret o 223/ 20004, se nos dice que st e viene a incorpor ar en su t ot alidad al ordenamient o j urdico int er no la Direct iva 2001/ 20/ CE del
Parlament o Europeo y del Consej o, de 4 de abril de 2001, r elat iva a la aproximacin de las disposiciones legales, r eglament arias y administ rat ivas de los Est ados miembros sobr e la
aplicacin de buenas prct icas clnicas en la realizacin de ensayos clnicos de medicament os de uso humano. Viniendo as dicha Direct iva a armonizar las legislaciones de los
Est ados miembros de la Unin Europea sobre ensayos clnicos con medicament os en seres humanos. Lo ant erior implic modificar la legislacin espaola vigent e en est a mat eria,
la cual era obj et o de r egulacin en el t t ulo I I I de la Ley 25/ 1990, de 20 de diciembre, del Medicament o, y su desarrollo reglament ario mediant e el Real Decret o 561/ 1993 de 16
de abr il.
En la present e nor ma se recoge el mandat o armonizador de la Direct iva 2001/ 20/ CE de for ma cont inuada, y as se recoge en su exposicin de mot ivos. . . que por lt imo
complement an st e Real Decret o las nor mas de buena prct ica clnica y las inst rucciones para la realizacin de ensayos clnicos en Espaa, o en su caso, las dir ect rices de la
Comisin Europea, que se publicarn por el Minist erio de Sanidad. En su Disposicin final segunda, que versa sobre facult ad de desarrollo, se seala que . . .Asimismo, se
facult a al Minist ro de Sanidad para la adopcin de normas de buena prct ica clnica y las inst rucciones par a la realizacin de ensayos clnicos en Espaa, de acuerdo con las
direct rices que adopt e la Comisin Eur opea.
Si lo ant erior lo llevamos al art culo 7. 1 del RD 223/ 2004, se nos est diciendo: a) Por un lado que el consent imient o se obt endr t eniendo en cuent a los aspect os indicados en
las recomendaciones europeas las cuales se recogern en las inst rucciones para la realizacin de ensayos clnicos en Espaa, publicadas por el Minist erios de Sanidad o en su
caso las direct rices de la Unin Europea. b) Por ot ro lado que en al medida que surj a una nueva recomendacin europea en est a mat eria, la misma deber ser r ecogida en una
nueva inst ruccin elaborada y publicada por el Minist erio, lo que const it uye un inst r ument o muy t il y dinmico para ir subsanando las carencias o deficiencias que puedan ir
aflorando derivadas de la obt encin del consent imient o infor mado en los ensayos clnicos con medicament os.
Responsables del ensayo ( pr omot or , invest igador) . Se acogen a la ley vigent e de ensayos clnicos ( RD 223/ 2004, ley 29/ 2006 y ley 15/ 1999
de prot eccin de dat os de carct er personal?
Cumplimient o de las Normas de buena prct ica clnica y declaracin de Helsinki ( Sel 2008) .
Pliza de seguros segn requisit os del RD 223/ 2004.
Manej o de muest r as y dat os de los pacient es segn la legislacin vigent e. Garant a de confidencialidad.
Not ificacin al Minist erio Fiscal en menores de edad.
Valoracin de consent imient o informado.
4. Ev al uaci n de l a i donei dad del / de l os equi pos i nv est i gador / es
Cualificacin de los invest igadores principales.
Valoracin de la car ga invest igadora act ual de los invest igadores.
Valoracin de inst alaciones y equipos requeridos par a la r ealizacin del ensayo.
Tabl a 3. Val or aci n del consent i mi ent o i nf or mado en l os ensay os cl ni cos ( 6) .
1. Aspect os gener al es
Se menciona en el prot ocolo quien y cuando se obt endr el consent imient o informado?
Es la redaccin apropiada ( lenguaj e claro, ausencia de t ecnicismos, ext ensin) ?
Figuran el nombre del ensayo, el nombre del promot or y el nombre del invest igador ?
Se comienza invit ando a part icipar en un est udio de invest igacin?
Se indica con quien cont act ar en caso de duda o urgencia?
Se explican adecuadament e los obj et ivos del est udio?
Se explican los det alles del ensayo ( aleat orizacin, enmascaramient o, placebo) con claridad y en lenguaj e claro?
2. Descr i pci n del est udi o
Se explica clarament e lo que implica part icipar en el est udio ( n de visit as, pruebas, duracin) ?
Se describen los medicament os que se van a ut ilizar ( comercializado o en invest igacin y el perfil de segur idad del frmaco) ?
En el apart ado de beneficios se excluyen los beneficios por r ealizar ms o difer ent es pruebas de las habit uales y mayor seguimient o?
Queda bien claro que el medicament o est en invest igacin y por t ant o se car ece de dat os de seguridad y eficacia suficient es?
Se infor ma de t odos los riesgos e inconvenient es de part icipar en el est udio ( pruebas) ?
3. Ri esgos y benef i ci os
Se mencionan los r iesgos especficos relacionados con la t erat ogenia y se ofert a asist encia en consonancia con la decisin del pacient e?
Se infor ma de la exist encia de un seguro ( compaa, n de pliza) ?
Se indica que en caso de dao causado por la par t icipacin el pr omot or garant iza la asist encia sanit aria del pacient e?
Se describen las alt er nat ivas a la par t icipacin?
4. Der echos del par t i ci pant e
Queda clara la volunt ariedad de part icipar y que la negat iva no t endr consecuencias asist enciales?
Se le informa que puede ret irarse cuando quiera sin t ener que dar explicaciones?
Se le informa que puede consult ar con ot ras per sonas ant es de t omar la decisin?
Se especifican las condiciones de exclusin y la finalizacin del est udio?
Se menciona que se reint egr aran los gast os de desplazamient o o diet as u ot r as compensaciones si procediesen?
Se det allan las condiciones de prot eccin de confidencialidad de los dat os acogindose explcit ament e a la ley 15/ 1999?
Se infor ma del dest ino de las muest ras en las condiciones requeridas en ley 14/ 2007 de invest igacin biomdica?
Se le ofr ece el acceso al r esult ado de las pruebas?
Se le ofr ece conocer los result ados de la invest igacin?
Se le informa que el invest igador o cent ro cobran por part icipar en el est udio?
Se indica que en caso de beneficios econmicos derivados de los result ados del est udio ( pat ent es) los pacient es no part iciparn de los
mismos?
Ot r a de las novedades que encont ramos es la ent r evist a previa que deber mant ener el suj et o del ensayo con el invest igador o miembro del equipo de invest igacin, ya que en
al ant erior regulacin en su art culo 3 se nos remit a al Anexo 6 del Real Decret o 561/ 93, en donde en su apart ado 1. 11 debera figurar el invest igador responsable del ensayo y
de infor mar al suj et o y cont est ar a sus dudas y pregunt as, y modo de cont act ar con l en caso de ur gencia. Con la act ual regulacin el deber de informacin pr evia al
consent imient o puede ser ej ercida por cualquier miembro del equipo de invest igacin y no slo sobre el invest igador principal o el invest igador coordinador, est ando definidas las
funciones de est os lt imos en el ar t culo 2. h) . i) de la act ual norma.
En la ant erior regulacin se nos hablaba de la informacin dada acer ca de los obj et ivos del est udio, beneficios incomodidades y riesgos pr evist os, alt ernat ivas posibles, t al y como
se recogan en el anexo 6. Frent e a lo ant erior en el nuevo art iculado t an solo se nos dice que el suj et o debe ent ender los obj et ivos del ensayo as como las condiciones en las que
se llevar a cabo y de que puede r et irarse el mismo en cualquier moment o sin que ello le cause perj uicio, para post er iorment e decir que el consent imient o se document ar
mediant e una hoj a de informacin para el suj et o y el document o de consent imient o, y que la hoj a de infor macin cont endr nicament e informacin relevant e, expresada en
t rminos claros y comprensibles para los suj et os y est ar r edact ada en la lengua pr opia del suj et o. La exposicin de mot ivos del act ual Real Decret o, nos dice que asimismo se
ha t enido en cuent a en su elaboracin lo dispuest o en al Ley 41/ 2002, de 14 de noviembre, bsica r eguladora de la aut onoma del pacient e y de derechos y obligaciones en mat eria
de infor macin y document acin clnica ( 13) . Si bien result a evident e que difiere de la misma en lo referent e al cont enido de la informacin que se debe t ransmit ir al pacient e
ant es de recabar su consent imient o, ya que la Ley 41/ 2002, en su art culo 10, nos habla de la siguient e informacin bsica a t ransmit ir: a) Las consecuencias relevant es o de
impor t ancia que la int ervencin or igina con seguridad b) Los riesgos relacionados con las circunst ancias personales o profesionales del pacient e c) Los r iesgos probables en
condiciones nor males, conforme a la exper iencia y al est ado de la ciencia o direct ament e relacionados con el t ipo de int er vencin d) las cont r aindicaciones. I ncluso nuest ra Ley
3/ 2001 ( 14) , r eguladora del consent imient o informado y de la hist or ia clnica, en la Comunidad Aut noma de Galicia, la cual fue modificada en part e por la Ley 3/ 2005 ( 15) con el
fin de adapt arse a la Ley est at al 41/ 2002, incorpor a ent re los cont enidos de la informacin a t ransmit ir las cont raindicaciones las cuales no figuraban en la redaccin inicial.
De ah que con independencia de que en el art culo 3 del Real Decret o, t it ulado post ulados t icos, comience diciendo en su apart ado 1. . . Slo se podr iniciar un ensayo clnico
cuando el Comit t ico de I nvest igacin Clnica que corresponda y la Agencia Espaola de Medicament o y Product os Sanit arios hayan considerado que los beneficios esper ados
para el suj et o del ensayo y para la sociedad j ust ifiquen los riesgos, y que se nos siga diciendo en su apart ado 3. . . Slo se podr realizar ensayos clnicos cuando se cumplan los
requisit os siguient es: a) Disponer de suficient es dat os cient ficos y, en ensayos farmacolgicos y t oxicolgicos en animales, que garant icen que los riesgos que implican en las
per sonas que se realicen son admisibles b) Que el est udio. . . suponga presumiblement e un avance en conocimient o cient fico sobre el ser humano. . . y su diseo minimice los riesgos
para los suj et os par t icipant es en l c) Que los riesgos e inconvenient es previsibles par a los suj et os del ensayo se hayan ponder ado con respect o a los beneficios previsibles para
cada suj et o del ensayo y fut uros pacient es.. . , y que t ambin se nos diga en su apar t ado 2 que se deber salvaguar dar la int egridad fsica y ment al del suj et o y que finalice en su
apar t ado 10 diciendo que los suj et os del ensayo dispondrn de un punt o donde puedan obt ener mayor informacin sobre el ensayo, que const ar en la hoj a de informacin para el
suj et o, no evit ar que formulemos las siguient es consideraciones: 1 ) El t it ular de la informacin referent e a los riesgos derivados de part icipar en el ensayo es el suj et o del
ensayo 2 ) No se debe olvidar que la par t icipacin en el ensayo se puede hacer en la doble condicin de suj et o del ensayo y como pacient e, der ivada st a lt ima de un beneficio
pot encial direct o para el suj et o en invest igacin 3 ) Regular que la hoj a de infor macin cont endr ni cament e i nf or maci n r el ev ant e, ex pr esada en t r mi nos cl ar os y
compr ensi bl es par a l os suj et os, const it uye un ret roceso en cuant o a los cont enidos de la informacin a t ransmit ir y en cuant o a los der echos de los suj et os de los ensayos,
ya que van a asumir unos r iesgos sin un conocimient o t an exhaust ivo como el exigible en ot ros act os equiparables en el mbit o de las sanidad. 4 ) Pudiera incluso pensar se en un
ciert o pat ernalismo ej ercido por el Comit t ico de I nvest igacin Clnica que corresponda y por la Agencia Espaola de Medicament o y Pr oduct os sanit arios, lo cual est ara
t ot alment e en desacuerdo con los principios que inspiran st e t ipo de act uaciones en el moment o act ual. 5 ) El art culo 2 de la ORDEN SCO 256/ 2007, est ablece que . . . los derechos,
la seguridad y el bienest ar de los suj et os del ensayo prevalecern por encima de los int ereses de la ciencia y de la sociedad.
En lo que a nuest r a Comunidad Aut noma se refiere, el Comit de Ensayos Clnicos con Medicament os sigue ut ilizando lo que se denominan l a hoj a de i nf or maci n par a el
posi bl e par t i ci pant e en l a i nv est i gaci n cl ni ca , idnt ica a la que ya se vena usando en la ant er ior r egulacin ( Real Decret o 561/ 93) , de ah que no se haya pr oducido en la
pr ct ica una disminucin en el cont enido de la informacin que se t ransmit e, con carct er previo, al part icipant e en la invest igacin clnica. Si bien y con independencia de que
est amos ant e un ensayo, no debemos olvidar que el mismo slo se podr realizar . . .cuando se dispongan de suficient es dat os cient ficos y, en part icular, ensayos farmacolgicos y
t oxicolgicos en animales, que gar ant icen que los riesgos que implica en la per sona en que se r ealiza son admisibles ( art . 3. 3. a) RD 223/ 04) , de ah que consideremos que la
informacin debera incluir los riesgos relacionados con las circunst ancias per sonales o pr ofesionales del part icipant e en el ensayo, al igual que sucede cuando uno prest a su
consent imient o al ampar o de lo previst o y r egulado en la Ley 41/ 2002, de 14 de noviembre, bsica regulador a de la aut onoma del pacient e y de derechos y obligaciones en
mat er ia de informacin y document acin clnica.
3. Cuando el suj et o del ensayo no sea una per sona capaz par a dar su consent i mi ent o o no est en condi ci ones de hacer l o, l a deci si n deber adopt ar se,
t eni endo en cuent a l o i ndi cado en est e ar t cul o.
a. Si el suj et o del ensay o es menor de edad:
1 Se obt endr el consent i mi ent o i nf or mado pr evi o de l os padr es o del r epr esent ant e l egal del menor ; el consent i mi ent o deber r ef l ej ar l a
pr esunt a vol unt ad del menor y podr r et i r ar se en cual qui er moment o si n per j ui ci o al guno par a l . Cuando el menor t enga 12 o ms aos,
deber pr est ar adems su consent i mi ent o par a par t i ci par en el ensay o.
2. El menor r eci bi r , del per sonal que cuent e con ex per i enci a en el t r at o con menor es, una i nf or maci n sobr e el ensay o, l os r i esgos y l os
benef i ci os adecuada a su capaci dad de ent endi mi ent o.
3 El i nv est i gador acept ar el deseo ex pl ci t o del menor de negar se a par t i ci par en el ensay o o de r et i r ar se en cual qui er momen t o, cuando st e
sea capaz de f or mar se una opi ni n en f unci n de l a i nf or maci n r eci bi da.
4 El pr omot or pondr en conoci mi ent o del Mi ni st er i o Fi scal l as aut or i zaci ones de l os ensay os cl ni cos cuy a pobl aci n i ncl uy a a l os men or es.
En la legislacin vigent e en lo relat ivo al cont enido de la informacin que deber t r ansmit ir se a los menor es, se realiza con mayor concrecin que en el ant erior
Decret o, ya que se nos dice . . . informacin sobr e el ensayo, los riesgos y los beneficios, cuando en el ant er ior t ext o se nos deca t an slo en su art culo
5 . . . infor macin pert inent e. Se exige , en la act ualidad, que la persona encargada de t ransmit ir la informacin al menor cuent e con experiencia en el t rat o de
menores, lo cual no er a cont emplado en el ant erior t ext o, ahora bien, ya que con independencia que para la obt encin del consent imient o se r emit a a lo especificado
en el art culo 7. 3, t ambin es ciert o que en el ar t culo 4 d) se nos dice . . . que el prot ocolo de ensayos clnicos con menores sea aprobado por un Comit t ico de
I nvest igacin Clnica que cuent e con exper t os en pediat ra o que haya recabado asesoramient o sobre las cuest iones clnicas, t icas y psicosociales en el mbit o de la
pediat ra, y en la recient e ORDEN SCO/ 256/ 2007 en su art iculo 2, t it ulado Pr incipios y direct rices de buena prct ica clnica en su apart ado b) seala que . . . Cada
persona que part icipe en la realizacin de un ensayo est ar capacit ada por su t it ulacin, formacin y experiencia par a ej ecut ar sus t ar eas, de ah que consideremos
que en la confeccin de dicho prot ocolo deber sealarse la persona o per sonas ms idneas para t ransmit ir la infor macin, ya que convendrn conmigo que t rat ar
de indagar para despus reflej ar cual es la pr esunt a volunt ad del menor, no result a una t area fcil par a la cual adems de una especial empat a y unos especficos
conocimient os se debera act uar sobre la base de unos pr ot ocolos debidament e acredit ados.
Ot r a de las novedades que int r oduce el vigent e Real Decr et o es la obligacin del pr omot or del ensayo de poner en conocimient o del Minist erio Fiscal las
aut or izaciones de los ensayos clnicos cuya poblacin incluya a menor es. Sorprende la redaccin dada al act ual t ext o, ya que en el ant erior obligaba a ponerlo en
conocimient o del Minist er io Fiscal previament e a la realizacin del ensayo , lo que supone una merma considerable en cuant o a las garant as exigibles en st e t ipo de
act os.
El Est at ut o Orgnico del Minist erio Fiscal, Ley 24/ 2007, de 9 de oct ubr e por la que se modifica la Ley 50/ 1981, de 30 de diciembre, en su art culo 3 apart ado 7 le
at ribuye al Fiscal la defensa y la represent acin de los menor es e incapaces ( 16) .
En est e supuest o, el Fiscal act uar como garant e de los derechos de los menores, suj et os de ensayo, ya que los mismos son obj et o de especial prot eccin, velando
para que la infor macin recibida por los dest inat arios sea lo ms det allada e inequvoca haciendo especial hincapi en que se minimicen los riesgos y que se obt enga
un beneficio direct o par a la salud del menor. Debiendo act uar con gran rigor profesional cuando el ensayo no represent e un beneficio direct o para la salud de los
menores suj et os del ensayo. En el vigent e Real Decr et o en su ar t culo 4 se nos dice . . . Adems, la invest igacin deber guardar relacin direct a con alguna
enfer medad que padezca el menor o bien ser de nat uraleza t al que slo pueda realizarse en menores. . . el bienest ar del suj et o prevalecer siempre sobre los int er eses
de la ciencia y de la sociedad y que exist an dat os que permit an prever que los beneficios esper ados superan los riesgos o que el riesgo que conlleva el ensayo es
mnimo.
En el ant erior RD, 561/ 93, se deca en su art culo 11. 3 que podran realizarse ensayos con menor es sin fines t eraput icos cuando se cumpla lo siguient e: . . . riesgos
mnimos, que se obt endrn conocimient os relevant es sobre la enfermedad o sit uacin obj et o de invest igacin de vit al import ancia par a ent enderla, paliarla o curarla,
que no se puedan obt ener st os conocimient o de ot ro modo. Lo ant er ior aparece t ambin recogido en el ar t culo 6 del vigent e RD, de ah que al igual que como
hicimos en st a misma revist a en el ao 1988, al coment ar el ant er ior Real Decret o, 561/ 93, sealar que cuando el ensayo no r epresent e un beneficio direct o
para la salud del menor, el Fiscal deber act uar con gran rigor profesional velando para que se cumplan t odos y cada uno de los requisit os previst os y r egulados
en el art culo 6 del vigent e RD.
Tras el ant erior supuest o haremos las siguient es consideraciones: a) Con la act ual legislacin el Fiscal no int erviene con carct er previo a la realizacin del ensayo,
ya que es el pr omot or del ensayo quien pone en su conocimient o, con post er ioridad, las aut orizaciones de los ensayos con menores b) En los supuest os en que
se realicen sin fines t eraput icos par a los menores, la act ual r edaccin exige los mismos r equisit os que en el ant er ior t ext o c) La int ervencin del Fiscal en est os
supuest os, como garant e de los derechos de los menor es, deviene un t ant o debilit ada derivada fundament alment e del moment o de su int ervencin d) En st e t ipo de
pr ocedimient os el legislador debera evit ar a la hora de regularlos, redacciones genricas e imprecisas ya que las misma implican una gran dificult ad en lo referent e a
su cont rol legal.
b. Si el suj et o es un adul t o si n capaci dad par a ot or gar su consent i mi ent o i nf or mado:
1 Deber obt ener se el consent i mi ent o i nf or mado de su r epr esent ant e l egal , t r as haber si do i nf or mado sobr e l os posi bl es r i esgos,
i ncomodi dades y benef i ci os del ensay o. El consent i mi ent o deber r ef l ej ar l a pr esunt a v ol unt ad del suj et o y podr ser r et i r ado en
cual qui er moment o si n per j ui ci o par a st e.
2 Cuando l as condi ci ones del suj et o l o per mi t an, est e deber pr est ar adems su consent i mi ent o par a par t i ci par en el ensay o, despus
de haber r eci bi do t oda l a i nf or maci n per t i nent e adapt ada a su ni v el de ent endi mi ent o. En est e caso, el i nv est i gador deber t ener en
cuent a l a v ol unt ad de l a per sona i ncapaz de r et i r ar se del ensay o.
1. Friedman LM, Fur berg CD, DeMet s DL. Fundament als of clinical t rials. 3 rd. ed. New York: Springer Verlag; 1998.
2. Hennekens CH, Buring JE. Epidemiology in Medicine. Bost on: Lit t le Br own; 1987.
3. Hulley SB, Cummings Sr. Designing clinical research. 2 nd. ed. Balt imor e: Lippincot t Williams and Wilkins; 2001.
4. Evidence- Based Medicine Working Gr oup. Evidence Based medicine. A new approach t o t eaching t he pr act ice of medicine. JAMA 1992; 268: 2420- 5. [ Medline]
5. Procedement os nor malizados de t raballo ( PNT) do comit t ico de invest igacin clnica ( CEI C) de Galicia [ I nt ernet ] . Sant iago de Compost ela: Consellera de
Sanidade; 2009. [ Acceso 7 de oct ubre de 2009] . Disponible en: ht t p: / / www. sergas. es/ Most r arCont idos_N3_T02. aspx?
I dPaxina= 60018&uri= ht t p: / / www. sergas. es/ gal/ ser vicios/ docs/ I nvest igacionClinica/ PNTCEI C_gal. pdf&hifr = 1250&seccion= 0
6. Crit erios de evaluacin do comit t ico de invest igacin clnica de Galicia. [ I nt ernet ] . Sant iago de Compost ela: Conseller a de Sanidade; 2009 [ Acceso 7 de oct ubre
de 2009] . Disponible en: ht t p: / / www. sergas. es/ Most rarCont idos_N3_T01. aspx?I dPaxina= 60083
7. Modelos de consent imient o informado. Comit t ico de invest igacin clnica de Galicia. [ I nt ernet ] . Sant iago de Compost ela: Conseller a de Sanidade; 2009 [ Acceso
7 de oct ubre de 2009] . Disponible en: ht t p: / / www. ser gas. es/ Most rarCont idos_N3_T01. aspx?I dPaxina= 60049
8. Ley 29/ 2006, de 26 de j ulio, de garant as y uso racional de los medicament os y pr oduct os sanit arios. ( BOE nm. 178, de 27 de j ulio 2006) .
9. Real decret o 223/ 2004, de 6 de febrero, por el que se regulan los ensayos clnicos con medicament os. ( BOE nm. 33, de 7 de febr ero 2004) .
10. Or den sco/ 2007, de 5 de febr ero, por la que se est ablecen los pr incipios y las direct rices det alladas de buena prct ica clnica y los requisit os par a aut or izar la
fabr icacin o import acin de medicament os en invest igacin de uso humano( BOE, nm. 38, de 13 de febrero 2007) .
11. Aclaraciones sobre la aplicacin de la normat iva de ensayos clnicos con medicament os de uso humano a part ir del 1 de mayo de 2004 ( versin n 6, mayo de
2008) . Minist erio de Sanidad y Consumo, Agencia Espaola de Medicament os y Product os Sanit arios, r ea de Ensayos Clnicos.
12. Real decret o 561/ 93, de 16 de abril, sobre ensayos clnicos con medicament os. ( BOE nm. 114, de 13 de mayo 1993) .
13. Ley 41/ 2002, de 14 de noviembre, bsica reguladora de la aut onoma del pacient e y de der echos y obligaciones en mat eria de informacin y document acin
clnica. ( BOE nm. 274, de 15 de noviembr e 2002) .
14. Ley 3/ 2001, de 28 de mayo, r eguladora del consent imient o informado y de la hist oria clnica de los pacient es. ( BOE nm. 156, de 3 de j ulio 2001) .
15. Lei 3/ 2005, do 7 de marzo, de modificacin da Lei 3/ 2001, do 28 de maio, reguladora do consent imient o informado e da hist oria clnica dos pacient es. ( DOG, nm.
55 de 21 de marzo 2005) .
16. Ley 24/ 2007, de 9 de oct ubre, por la que se modifica la Ley 50/ 1981, de 30 de diciembre, reguladora del Est at ut o Orgnico del Minist erio Fiscal. ( BOE, nm. 243,
de 10 de oct ubr e 2007)
Ot r a de las novedades int roducidas por el act ual Real Decret o, es la de eliminar la int ervencin del Minist erio Fiscal cuando los suj et os del ensayo sean incapaces a
diferencia de lo pr evist o y regulado en el ant erior RD 561/ 1993, en donde obligaba a ponerlo en conocimient o del Fiscal previament e a la realizacin del ensayo. Si
en el ant er ior apart ado decamos que la int ervencin del Fiscal en los ensayos con menores con la act ual legislacin result a un t ant o debilit ada, con r elacin a los
ensayos clnicos con incapaces debemos concluir que es inexist ent e. No ent endiendo como el legislador excluye al Minist erio Fiscal de poder act uar defendiendo y
represent ando los int ereses de los incapaces, cuando en el rest o del ordenamient o j urdico le at ribuye indist int ament e, t ant o la represent acin y defensa de los
int er eses de los menores como de los incapaces, por ser ambos obj et o de especial prot eccin.
4. Cuando el ensay o cl ni co t enga un i nt er s especf i co par a l a pobl aci n en l a que se r eal i za l a i nv est i gaci n y l o j ust i f i quen r azones de necesi dad en l a
admi ni st r aci n del medi cament o en i nv est i gaci n, podr somet er se a un suj et o a un ensay o cl ni co si n obt ener el consent i mi ent o pr ev i o en l os si gui ent es
casos:
a. Si ex i st e un r i esgo i nmedi at o gr av e par a l a i nt egr i dad f si ca o psqui ca del suj et o, se car ece de una al t er nat i va t er aput i ca apr opi ada en l a pr ct i ca
cl ni ca y no es posi bl e obt ener su consent i mi ent o o el de su r epr esent ant e l egal . En est e caso, si empr e que l as ci r cunst anci as l o per mi t an, se
consul t ar pr ev i ament e a l as per sonas v i ncul adas a l por r azones f ami l i ar es o de hecho.
b. Si el suj et o no es capaz par a t omar deci si ones debi do a su est ado f si co o psqui co y car ece de r epr esent ant e l egal . En est e caso, el consent i mi ent o l o
pr est ar n l as per sonas v i ncul adas a l por r azones f ami l i ar es o de hecho.
En ambos casos, est a event ualidad y la for ma en que se proceder debe hallarse previst a en la document acin del ensayo aprobado por el Comit t ico de I nvest igacin
Clnica, y el suj et o o su r epresent ant e legal ser informado en cuant o sea posible y deber ot orgar su consent imient o para cont inuar con el ensayo si procediera.
5. El suj et o par t i ci pant e en un ensay o cl ni co, o su r epr esent ant e l egal , podr r ev ocar su consent i mi ent o en cual qui er moment o si n ex pr esi n de causa y si n
que por el l o se der i v e par a el suj et o par t i ci pant e r esponsabi l i dad ni per j ui ci o al guno.
La r edaccin dada al ant erior apar t ado carece en muchos supuest os de la concr ecin que posea el ant iguo t ext o, as el RD 561/ 93 comenzaba su art culo 6. . . . En el caso
excepcional en que por la urgencia de la aplicacin del t r at amient o no fuera posible disponer del consent imient o, ya que si bien es ciert o que el apart ado a) , act ual, se exige la
exist encia de un r iesgo inmediat o y gr ave para la int egridad fsica o psquica del suj et o, lo ant erior no aparece recogido en el apar t ado b) por lo que ser de aplicacin en st e
lt imo apart ado lo reflej ado en el encabezamient o del vigent e art culo. . . int ers especfico para la poblacin en la que se realice la invest igacin y lo j ust ifiquen razones de
necesidad en la aplicacin del medicament o en invest igacin, result a obvio que cuando el legislador se refiere al int ers especfico par a la poblacin en la que se r ealice la
invest igacin no se est refiriendo al especfico int er s t eraput ico part icular para el pacient e que exiga el ant erior t ext o en su art culo 6. El ant erior t ext o exiga al Comit ant es de
aprobar el pr ot ocolo. . . acr edit ar que la urgencia en la aplicacin del t rat amient o en est e t ipo de supuest os no es t an solo una manifest acin del equipo invest igador, sino una
realidad obj et ivable y como nicament e proceder cuando t enga un especfico int ers t eraput ico part icular para el pacient e, st e int ers habr de poder cuant ificarlo ya sea para
compararlo con ot ra alt ernat iva t eraput ica al obj et o de poder demost rar est a not able mej or a que j ust ifique su aplicacin sin cont ar con el consent imient o del pacient e o bien
acr edit ar la ausencia de alt ernat iva y las razones que hagan prever que r eport ar un especfico int ers t eraput ico par t icular para el suj et o. ( RD 561/ 93, art culo 6 apart ado
segundo) . De la comparacin de ambos t ext o result a evident e la laxit ud del act ual, sin olvidar se que cuando el suj et o del ensayo, cont emplado en el art culo 4, fuese un menor
deber el promot or comunicar la aut orizacin del ensayo al Minist erio Fiscal de acuer do con el ar t culo 7. 3. 4 del RD 223/ 2004 y el apart ado 24 de la Aclaracin sobre la aplicacin
de la normat iva de ensayos clnicos con medicament os de uso humano a part ir del 1 de mayo de 2004 ( ver sin N 6, mayo de 2008)

Para finalizar recordar una vez ms lo siguient e:
En el art culo 43 de la Const it ucin Espaola se reconoce el derecho a la prot eccin a la salud. Todo lo ant erior es una lgica consecuencia del derecho a la vida y a la
int egridad fsica, el derecho en abst r act o a la vida se concret a en el derecho a la prot eccin a la salud. Por t ant o cuando al negar el derecho a la pr ot eccin de la salud se
pusier a en peligro la vida o la int egr idad f sica de las per sonas, nos encont rar amos en presencia de un at aque al der echo a la vida, derecho fundament al, en t odas sus
consecuencias. Con independencia que en el art culo 44. 2 de la CE, se nos diga que los poderes pblicos promovern la ciencia y la invest igacin cient fica en beneficio del
int er s general.
Los poderes pblicos gar ant izarn la defensa de los consumidores y usuarios, prot egiendo mediant e procedimient os eficaces, la seguridad, la salud y los legt imos int er eses
econmicos de los mismos, art culo 51. 1 de la Const it ucin Espaola.

Nuest ro ordenamient o j urdico sanit ario se basa en el principio de aut onoma del pacient e lo que supone un cambio cult ural en las relaciones mdico pacient e, regidas ayer y
en menor medida hoy por el pr incipio de beneficencia. La crist alizacin de ese gran cambio cult ural en las relaciones usuar io- facult at ivo, se manifiest a baj o la forma de
consent imient o informado , que no es ot ra cosa que la manifest acin de respet o debido a la dignidad humana, reconociendo su derecho a t omar sus propias decisiones y
garant izando su liber t ad en algo t an fundament al como es su propia salud.

La Or den SCO/ 256/ 2007, de 5 de febrer o, en la que se regula los principios y las direct rices de buena prct ica clnica en los ensayos clnicos con medicament os en
invest igacin de uso humano, y en la que debern t enerse en cuent a las direct rices comunit ar ias publicadas por la Comisin Europea en los dist int os volmenes sobre
medicament os de la Unin Europea, en su art culo 2. a) t it ulado Principios y direct rices de la buena pr ct ica clnica nos dice que los der echos, la seguridad y el bienest ar de
los suj et os de un ensayo prevalecern por encima de los int er eses de la ciencia y de la sociedad.

An part iendo de la base que en el ensayo clnico el fin que se persigue es fundament alment e invest igador, no ser a posible oponer el int ers de la ciencia como j ust ificacin
para llevar a cabo los experiment os colisionando fr ont alment e cont ra los derechos de las personas, como sera el hecho de no informarle de manera veraz y exhaust iva ya
que nadie decide librement e lo que desconoce, o poner en peligro su int egridad fsica o psquica, so pena de convert ir al ser humano en una cobaya.
Bi bl i ogr af a
I nvest igacin: Det er minacin del t amao muest ral 1/ 6

Determinacin del tamao muestral

Pita Fernndez S.
________________________________
Todo estudio epidemiolgico lleva implcito en la fase de diseo la determinacin del tamao muestral
necesario para la ejecucin del mismo
(1-4)
. El no realizar dicho proceso, puede llevarnos a dos situaciones
diferentes: primera que realicemos el estudio sin el nmero adecuado de pacientes, con lo cual no
podremos ser precisos al estimar los parmetros y adems no encontraremos diferencias significativas
cuando en la realidad s existen. La segunda situacin es que podramos estudiar un nmero innecesario
de pacientes, lo cual lleva implcito no solo la prdida de tiempo e incremento de recursos innecesarios
sino que adems la calidad del estudio, dado dicho incremento, puede verse afectada en sentido negativo.
Para determinar el tamao muestral de un estudio, debemos considerar diferentes situaciones
(5-7)
:
A. Estudios para determinar parmetros. Es decir pretendemos hacer inferencias a valores
poblacionales (proporciones, medias) a partir de una muestra (Tabla 1).
B. Estudios para contraste de hiptesis. Es decir pretendemos comparar si las medias o las
proporciones de las muestras son diferentes.
Tabl a 1. El ement os de l a I nf er enci a Est adst i ca

A. Est udi os par a det er mi nar par met r os
Con estos estudios pretendemos hacer inferencias a valores poblacionales (proporciones, medias) a partir
de una muestra.
A.1. Estimar una proporcin:
Si deseamos estimar una proporcin, debemos saber:
a) El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da lugar a un coeficiente (Z
).
Para una seguridad del 95% = 1.96, para una seguridad del 99% = 2.58.
b) La precisin que deseamos para nuestro estudio.
c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una proporcin). Esta
idea se puede obtener revisando la literatura, por estudio pilotos previos. En caso de no tener dicha
informacin utilizaremos el valor p = 0.5 (50%).

Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser prxima al 5%; si no
tuvisemos ninguna idea de dicha proporcin utilizaramos el valor p = 0,5 (50%) que maximiza el
tamao muestral:

donde:
Z

2
= 1.96
2
(ya que la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)

Si la poblacin es finita, es decir conocemos el total de la poblacin y desesemos saber cuntos del total
tendremos que estudiar la respuesta seria:

donde:
N = Total de la poblacin
Z
2
= 1.96
2
(si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para conocer la
prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser prxima al 5% ; si no
tuviese ninguna idea de dicha proporcin utilizaramos el valor p = 0.5 (50%) que maximiza el tamao
muestral.

Segn diferentes seguridades el coeficiente de Z
vara, as:
Si la seguridad Z
fuese del 90% el coeficiente sera 1.645

Si la seguridad Z

Si la seguridad Z
fuese del 97.5% el coeficiente sera 2.24

Si la seguridad Z


A.2. Estimar una media:
Si deseamos estimar una media: debemos saber:
a. El nivel de confianza o seguridad (1-). El nivel de confianza prefijado da lugar a un coeficiente
(Z
). Para una seguridad del 95% = 1.96; para una seguridad del 99% = 2.58.
b. La precisin con que se desea estimar el parmetro (2
*
d es la amplitud del intervalo de
confianza).
c. Una idea de la varianza S
2
de la distribucin de la variable cuantitativa que se supone existe en la
poblacin.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con una seguridad del 95
% y una precisin de 3 mg/dl y tenemos informacin por un estudio piloto o revisin bibliogrfica que
la varianza es de 250 mg/dl.

Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la poblacin y
desearamos saber cuntos del total tendramos que estudiar, la respuesta sera:

B. Est udi os par a cont r ast e de hi pt esi s:
Estos estudios pretenden comparar si las medias o las proporciones de las muestras son diferentes.
Habitualmente el investigador pretende comparar dos tratamientos. Para el clculo del tamao muestral
se precisa conocer:
a. Magnitud de la diferencia a detectar que tenga inters clnicamente relevante. Se pueden
comparar dos proporciones o dos medias.
b. Tener una idea aproximada de los parmetros de la variable que se estudia (bibliografa, estudios
previos).
c. Seguridad del estudio (riesgo de cometer un error )
d. Poder estadstico (1 - ) (riesgo de cometer un error )
e. Definir si la hiptesis va a ser unilateral o bilateral.
Bilateral: Cualquiera de los dos parmetros a comparar (medias o proporciones) puede
ser mayor o menor que el otro. No se establece direccin.
Unilateral: Cuando se considera que uno de los parmetros debe ser mayor que el otro,
indicando por tanto una direccin de las diferencias.
La hiptesis bilateral es una hiptesis ms conservadora y disminuye el riesgo de cometer un error de tipo
I (rechazar la H
0
cuando en realidad es verdadera).


B.1. Comparacin de dos proporciones:

Donde:
n = sujetos necesarios en cada una de las muestras
Z
= Valor Z correspondiente al riesgo deseado

Z

p
1
= Valor de la proporcin en el grupo de referencia, placebo, control o tratamiento habitual.
p
2
= Valor de la proporcin en el grupo del nuevo tratamiento, intervencin o tcnica.
p = Media de las dos proporciones p
1
y p
2

Los valores Z
segn la seguridad y Z
segn el poder se indican en la Tabla 2

(8)
.
B.2. Comparacin de dos medias:

Donde:
n = sujetos necesarios en cada una de las muestras
Z

Z

S
2
= Varianza de la variable cuantitativa que tiene el grupo control o de referencia.
d = Valor mnimo de la diferencia que se desea detectar (datos cuantitativos).
Los valores Z
segn la seguridad y Z
segn el poder se indican en la Tabla 2

(8)
.
Tabl a 2. Val or es de Z
y Z
ms f r ecuent ement e ut i l i zados

Z

Test uni l at er al Test bi l at er al
0.200
0.150
0.100
0.050
0.025
0.010
0.842
1.036
1.282
1.645
1.960
2.326
1.282
1.440
1.645
1.960
2.240
2.576
Pot enci a
( 1- ) Z

0.01
0.05
0.10
0.15
0.20
0.25
0.30
0.35
0.40
0.45
0.99
0.95
0.90
0.85
0.80
0.75
0.70
0.65
0.60
0.55
2.326
1.645
1.282
1.036
0.842
0.674
0.524
0.385
0.253
0.126

0.50 0.50 0.000
Ejemplo de comparacin de dos medias:
Deseamos utilizar un nuevo frmaco antidiabtico y consideramos que seria clnicamente eficaz si lograse
un descenso de 15 mg/dl respecto al tto. Habitual con el antidiabtico estndar. Por estudios previos
sabemos que la desviacin tpica de la glucemia en pacientes que reciben el tratamiento habitual es de 16
mg/dl. Aceptamos un riesgo de 0.05 y deseamos un poder estadstico de 90% para detectar diferencias si
es que existen.

precisaremos 20 pacientes en cada grupo.
Ejemplo de comparacin de dos proporciones:
Deseamos evaluar si el Tratamiento T
2
es mejor que el tratamiento T
1
para el alivio del dolor para lo que
diseamos un ensayo clnico. Sabemos por datos previos que la eficacia del frmaco habitual est
alrededor del 70% y consideramos clnicamente relevante si el nuevo frmaco alivia el dolor en un 90%.
Nuestro nivel de riesgo lo fijamos en 0.05 y deseamos un poder estadstico de un 80%.

n = 48 pacientes. En cada grupo precisamos 48 pacientes.
El tamao muestral ajustado a las prdidas:
En todos los estudios es preciso estimar las posibles perdidas de pacientes por razones diversas (prdida
de informacin, abandono, no respuesta.) por lo que se debe incrementar el tamao muestral respecto a
dichas prdidas.
El tamao muestral ajustado a las prdidas se puede calcular:
Muestra ajustada a las prdidas = n (1 / 1R)
n = nmero de sujetos sin prdidas
R = proporcin esperada de prdidas
As por ejemplo si en el estudio anterior esperamos tener un 15% de prdidas el tamao muestral
necesario seria: 48 (1 / 1-0.15) = 56 pacientes en cada grupo.


Bi bl i ogr af a
1 - Contandriopoulos AP, Champagne F, Potvin L, Denis JL, Boyle P. Preparar un proyecto de
investigacin. Barcelona: SG Editores ; 1991.
2 - Hulley SB, Cummings SR. Diseo de la investigacin clnica. Un enfoque epidemiolgico. Barcelona:
Doyma; 1993.
3 Cook TD., Campbell DT. Quasi-Experimentation. Design & Analysis Issues for Field Settings.
Boston: Houghton Mifflin Company; 1979.
4 - Kleinbaum DG., Kupper LL., Morgenstern H. Epidemiologic Research. Principles and Quantitative
Methods. Belmont, California: Lifetime Learning Publications. Wadsworth; 1982.
5 Dawson-Saunders B, Trapp RG. Bioestadstica Mdica . 2 ed. Mxico: Editorial el Manual Moderno;
1996.
6 Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid: Interamericana
M
c
Graw Hill; 2001.
7 - Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4 ed. Madrid:
NORMA; 1993.
8 Argimn Pallas J.M., Jimnez Villa J. Mtodos de investigacin aplicados a la atencin primaria de
salud. 2 ed. Barcelona: Mosby-Doyma; 1994.

I nvest igacin: Clculo del t amao muest ral para la det er minacin de fact ores pronst icos 1/ 5

Clculo del tamao muestral para la determinacin de factores pronsticos

Prtegas Daz S. Pita Fernndez S.
__________________________________
La identificacin de factores capaces de influir en el pronstico de una enfermedad es de suma
importancia para la actividad clnica diaria. Por un lado, porque facilita la toma de decisiones en cuanto a
procedimientos diagnsticos o tratamientos y, por otro, porque el conocer la posible evolucin de un
paciente concreto permitir informarlo sobre el curso clnico de su enfermedad
1
.
La realizacin de estudios clnico-epidemiolgicos es una de las principales vas de las que se dispone
para conocer el pronstico de una patologa determinada. Aunque pueden utilizarse diferentes diseos de
investigacin, los estudios de seguimiento, ya sean prospectivos o retrospectivos, son los ms adecuados
para tratar de determinar factores pronstico. En este tipo de trabajos, una vez identificada una cohorte de
pacientes con una patologa determinada, se realiza un seguimiento y se calcula el riesgo relativo
asociado a un determinado factor
1,2
. En mltiples ocasiones, adems, los datos proporcionados por los
estudios clnicos suelen venir expresados en trminos de tiempo de supervivencia. Una de las
caractersticas esenciales de los estudios de seguimiento donde se pretende objetivar la presencia de un
evento es la posible presencia de datos censurados. El paciente censurado es el que durante este
seguimiento no ha presentado el evento de inters. Esto puede suceder bien porque haya abandonado el
estudio antes de fallecer, o bien porque ste termine sin que se haya producido la muerte o el evento
estudiado. Esta circunstancia obliga a utilizar mtodos estadsticos especficos que permitan manejar este
tipo de observaciones. La regresin de Cox es el mtodo apropiado para realizar el anlisis cuando existen
datos censurados permitiendo, a partir de los coeficientes estimados, calcular el riesgo relativo asociado a
cada uno de los factores incluidos en el modelo
3
.
Todo estudio epidemiolgico lleva implcita en la fase de diseo la determinacin del tamao muestral
necesario para su ejecucin
4
. Existen frmulas sencillas que permiten calcular el tamao muestral
necesario para la estimacin de un RR cuando no se dispone del tiempo de seguimiento. Sin embargo, en
estudios de supervivencia, las frmulas para el clculo del tamao muestral suelen ser ms complicadas y
se utilizan con menor frecuencia. El presente trabajo tiene por objetivo describir algunas de las frmulas
existentes para calcular el tamao de la muestra a estudiar cuando se quiere investigar la importancia de
un nuevo factor sobre el pronstico de una enfermedad. En primer lugar, se describe cmo calcular el
tamao muestral mnimo necesario para detectar un determinado riesgo relativo cuando se dispone de
informacin acerca del estatus final del paciente pero no de su tiempo de seguimiento. A continuacin, se
presentan dos formas sencillas de calcular el tamao muestral en estudios de supervivencia cuando la
importancia pronstica del factor a estudio se investiga por medio de un modelo de regresin de Cox. Se
distingue el caso en el que se hace un anlisis univariante de aquel en el que en el que el efecto del nuevo
factor se estudia controlando por otras covariables.
Cl cul o del t amao de l a muest r a par a l a est i maci n de un r i esgo r el at i vo
El riesgo relativo mide la fuerza de la asociacin entre la exposicin a un factor y la presencia del evento
estudiado (muerte, complicaciones, recidiva, etc.). Se calcula dividiendo la probabilidad de presentar
dicho evento entre los expuestos (por ejemplo, la probabilidad de muerte entre esos pacientes) y esa
misma probabilidad entre los no expuestos
1,2
. Si deseamos calcular el tamao muestral mnimo necesario
para detectar un determinado riesgo relativo, deberemos conocer:
1. Dos de los siguientes tres parmetros:
Una idea del valor aproximado del riesgo relativo que se desea estimar (RR).
La proporcin de expuestos al factor de estudio que presentaron el evento de inters (P
1
).
La proporcin de no expuestos que presentaron ese mismo evento (P
2
).
2. El nivel de confianza o seguridad (1-). Generalmente se trabajar con una seguridad del 95%.

3. La precisin relativa que se quiere para el estudio
. Dicha precisin es la oscilacin mnima

con la que se quiere estimar el RR correspondiente, expresada como porcentaje del valor real
esperado para ese riesgo.
Con estos datos, el clculo del tamao muestral se puede realizar mediante la frmula
5
:
( ) ( )
( ) ( )
2
2 2 1 1 2
2
1
1 ln
/ 1 / 1
+
=

P P P P
z n
Ecuacin 1
Donde el valor
2
1

z
se obtiene de la distribucin normal estndar en funcin de la seguridad (1-)
elegida para el estudio
6
. En particular, para una seguridad de un 95%, se tiene que

96 . 1
2
1
=
z
.
Ilustraremos con un ejemplo el uso de la frmula anterior: supongamos que deseamos saber si existen
diferencias entre dos terapias diferentes A y B utilizadas habitualmente para tratar un determinado tipo de
cncer. Para ello se planea realizar un estudio prospectivo en el que se recoger el estatus de los pacientes
(vivos/muertos) al cabo de un ao de ser tratados Cuntos pacientes debern estudiarse con cada
tratamiento si se desea calcular el riesgo relativo con una precisin del 50% de su valor real y una
seguridad del 95%? De experiencias previas, se estima que el valor real del riesgo relativo es
aproximadamente igual a 3 y la probabilidad de fallecer entre los pacientes tratados con el tratamiento A
de un 20%.
En este caso se tiene que:
5 . 0
6 . 0 2 . 0 3
2 . 0
2 1
2
1
2
=
= = = =
=
P RR P
P
P
RR
P

Aplicando la Ecuacin 1:
( ) ( )
( ) ( )
31 . 37
5 . 0 1 ln
2 . 0 / 2 . 0 1 6 . 0 / 6 . 0 1
96 . 1
2
2
=
+
= n

Es decir, se necesitara en cada grupo una muestra de 38 pacientes.
Si el tamao del efecto a detectar fuese menor, el tamao muestral necesario para llevar a cabo el estudio
aumentar. Por ejemplo, si estimamos que el RR correspondiente al nuevo tratamiento es
aproximadamente igual a 2 (P
1
=0.4) el tamao necesario sera:
( ) ( )
( ) ( )
98 . 43
5 . 0 1 ln
2 . 0 / 2 . 0 1 4 . 0 / 4 . 0 1
96 . 1
2
2
=
+
= n

Es decir, un total de 44 pacientes tratados con cada una de las dos terapias.


Cl cul o del t amao de l a muest r a en est udi os de super v i v enci a
Supongamos ahora que, en el ejemplo anterior, se dispone de informacin no slo acerca del estatus final
de los pacientes en cada uno de los dos grupos, sino que adems estamos en condiciones de conocer el
tiempo de supervivencia de cada uno de ellos. En este caso, para conocer si el tratamiento A tiene un
efecto beneficioso sobre la evolucin de los enfermos, podremos utilizar un modelo de regresin de Cox
en el que se ajuste por la variable tratamiento, y a partir de cuyos coeficientes podremos estimar el RR
asociado a la terapia recibida.
Si, con este procedimiento, deseamos calcular el tamao muestral mnimo necesario para detectar un
determinado riesgo relativo, deberemos conocer:
a) Una idea del valor aproximado del riesgo relativo que se desea detectar (RR).
b) La proporcin de expuestos al factor de estudio (p), es decir, en nuestro caso, la proporcin de
enfermos habitualmente tratados con la terapia A.
c) El porcentaje de observaciones censuradas
que se espera en el total de la muestra.

d) El nivel de confianza o seguridad
1
con el que se desea trabajar.
e) El poder
1
que se quiere para el estudio.
Con estos datos, el clculo del tamao muestral puede abordarse mediante la frmula
7
:
( ) ( ) ( )( )p p RR
z z
n

+
=

1 1 log
2
2
1
2
1

Ecuacin 2
donde, de nuevo
z
denota el
-cuantil de la distribucin normal estndar

6
.
Siguiendo con el ejemplo anterior, supongamos que el primer tratamiento (A) suele aplicarse a un 70% de
los pacientes que padecen ese tipo de cncer, mientras que la otra terapia (B) es recibida slo por un 30%
de los enfermos. Si el efecto pronstico del tratamiento recibido va a analizarse de modo univariado, la
Ecuacin 2 puede aplicarse para calcular el nmero necesario de pacientes a estudiar. As, para detectar
un riesgo relativo de 3, y trabajando con una seguridad del 95% y un poder del 80% se tendra:
( ) ( ) ( )( )
( )
( ) ( ) ( )
97 . 30
7 . 0 7 . 0 1 3 log
842 . 0 96 . 1
1 1 log
2
2
2
2
1
2
1
=
+
=

+
=

p p RR
z z
n

Esto es, se necesitara recoger informacin de 31 pacientes en total para detectar un efecto de RR=3. Si el
efecto fuese menor (RR=2), se necesitaran un total de 78 pacientes y si este riesgo incluso descendiese a
RR=1.5, el tamao aumentara hasta 228 enfermos. Todo ello si se asume que no existir censura. Si, por
el contrario, se prev que un 20% de los datos correspondern a observaciones censuradas, el tamao
muestral obtenido deber multiplicarse por
25 . 1
) 2 . 0 1 (
1
=
,
resultando en un total de 47 pacientes para detectar un RR=3, 117 para detectar un RR=2 342 para un
RR=1.5.

La frmula anterior por tanto nos permite calcular el n para detectar un efecto ante la presencia de una
caracterstica o exposicin determinada. Si, como sucede habitualmente, deseamos controlar o tener en
cuenta ms variables, el tamao de la muestra se debe modificar teniendo en cuenta esas posibles
variables.
En una situacin como la del ejemplo anterior, el conocimiento apropiado del efecto pronstico del
tratamiento recibido casi siempre exige ajustar por diferentes covariables en un modelo de regresin de
Cox. Intuitivamente, el tratar de ajustar un modelo ms complejo (ie, con un mayor nmero de variables)
con el mismo nmero de pacientes llevar consigo una prdida de precisin en la estimacin de los
coeficientes y, con ello, del RR asociado a cada una de las variables incluidas en el modelo multivariante.
En esta situacin, es obvio, que se necesita realizar alguna correccin en la Ecuacin 2 que permita
adaptar el tamao muestral calculado a las variables que se incluirn a posteriori en el modelo.
En este supuesto, la frmula para el clculo del tamao muestral vendr dada por
8
:
( ) ( ) ( )( )

+
=

2 2
2
1
2
1
1
1
1 1 log

p p RR
z z
n
Ecuacin 3
La Ecuacin 3 es as idntica a la Ecuacin 2, salvo en el factor
2
1
1
,
normalmente llamado factor de inflacin de la varianza, donde
denota al coeficiente de correlacin

de Pearson entre el factor a estudio y aquella otra variable que incluiremos en el modelo. En el caso en el
que se ajuste por ms de otro factor en el modelo, lo ms sencillo es considerar
como el mayor
coeficiente de correlacin entre el factor a estudio y todas las variables incluidas. Este coeficiente de
correlacin, cuanto mayor sea, ms incrementar el valor del factor de inflaccin de la varianza y, por
tanto, se incrementar el tamao de la muestra a estudiar.
Siguiendo con el ejemplo anterior, posiblemente el tratamiento aplicado a cada enfermo depender, como
ya se apunt, de las caractersticas clnicas particulares del mismo, y recibir una u otra terapia en
funcin, por ejemplo, del estadiaje del tumor. En trminos estadsticos, podr entonces decirse que el
factor tratamiento se encuentra correlacionado con esta caracterstica. Supongamos, por ejemplo, que la
correlacin existente entre el nuevo tratamiento y el estadiaje del tumor es de 0.25. Este dato lo podremos
obtener a partir de un estudio piloto o de otros trabajos sobre el tema. En caso de desconocerse,
deberemos asumir una correlacin suficientemente alta para as asegurar un poder suficiente. Una
correlacin de 0.25 implica un factor de inflacin de la varianza de
( )
07 . 1
25 . 0 1
1
2
=
.
Aplicando la Ecuacin 3, se obtendra un tamao muestral mnimo necesario de
34 17 . 33 07 . 1 31 = = n
pacientes para detectar un efecto de RR=3, de
84 46 . 83 07 . 1 78 = = n
si se quiere detectar un efecto de RR=2 y
244 96 . 243 07 . 1 228 = = n
para detectar un RR=1.5. De nuevo, deberemos ajustar el tamao
muestral a posibles prdidas. Si se prev, como antes, un 20% de censuras, el tamao muestral ser de 43
pacientes para detectar un RR=3, de 105 para detectar un RR=2 y de 305 enfermos para detectar un
RR=1.5.
El clculo del tamao muestral, por tanto, permite al investigador precisar el nmero de pacientes a
estudiar para detectar como significativos efectos de una magnitud determinada. El no hacerlo, o el no

conocer cuantos pacientes necesitamos para detectar un efecto como significativo podra llevarnos a
cometer un error de tipo II, es decir, no encontrar diferencias cuando s las hay. Es por ello recomendable,
por tanto, no slo tener una idea aproximada del nmero de pacientes sino adems estimar los riesgos con
su 95% intervalo de confianza para conocer la precisin y la direccin del efecto investigado.
Bi bl i ogr af a
1. Pita Fernndez S, Valds Caedo FA. Determinacin de factores pronsticos. Cad Aten Primaria
1997; 4: 26-29. [Texto completo]
2. Pita Fernndez S, Vila Alonso MT, Carpente Montero J. Determinacin de factores de riesgo. Cad
Aten Primaria 1997; 4: 75-78. [Texto completo]
3. Lee ET. Statistical Methods for Survival Data Analysis. Belmont, California: Lifetime Learning
Publications; 1980.
4. Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-141. [Texto
completo]
5. Lwanga SK, Lemeshow S. Determinacin del tamao muestral en los estudios sanitarios. Manual
Prctico. Ginebra: O.M.S.; 1991.
6. Prtega Daz S, Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001; 8: 268-274. [Texto
completo]
7. Schoenfeld DA. Sample-size formula for the proportional-hazard regression model. Biometrics 1983;
39: 499-503. [Medline]
8. Schmoor C, Sauerbrei W, Schumacher M. Sample size considerations for the evaluation of prognostic
factors in survival analysis. Statistic Med 2000; 19: 441-452. [Medline]

I nvest igacin: Clculo del t amao muest ral en est udios de casos y cont roles 1/ 5

Clculo del tamao muestral en estudios de casos y controles

Prtegas Daz S., Pita Fernndez S.
_________________________________
Est i maci n del r i esgo en l os est udi os de casos y cont r ol es.
Los estudios de casos y controles son un tipo de diseo habitualmente empleado en investigaciones
clnicas que tienen por objeto la identificacin de factores de riesgo. Si bien los estudios de cohortes
renen las caractersticas idneas para llevar a cabo este tipo de anlisis, los estudios de casos y controles
cuentan con la ventaja de que suelen exigir menos tiempo y ser menos costosos que aquellos
1,2
.
Una de las caractersticas esenciales de los estudios de casos y controles, y su principal diferencia con los
estudios de cohortes, es la forma de seleccin de los sujetos de estudio. En un estudio de cohortes se
selecciona a los sujetos en base a su exposicin. Por el contrario, en un estudio de casos y controles, se
identifica a un grupo de personas con una enfermedad (casos) y se les compara con un grupo apropiado
que no tenga la enfermedad (controles). Ya que los individuos son seleccionados en funcin de la
presencia o ausencia del evento de estudio y no por su exposicin, no podr estimarse directamente el
riesgo de enfermar entre los sujetos expuestos y los no expuestos. La relacin entre uno o varios factores
y la presencia de la enfermedad deber estudiarse comparando la frecuencia de exposicin entre los casos
y los controles. Si la frecuencia de exposicin es mayor en el grupo de casos que en los controles,
podremos decir que hay una asociacin entre la causa y el efecto.
En estudios de este tipo, la distribucin de n sujetos estudiados segn presenten o no la enfermedad y
segn su exposicin a cada factor se puede mostrar en una tabla 2 x 2, similar a la Tabla 1: as, existirn
en la muestra casos expuestos (a), casos no expuestos (c), controles expuestos (b) y controles no
expuestos (d). Como medida de la frecuencia de exposicin entre los casos se puede utilizar el cociente:
1
1
1
1 p
p
=

donde p
1
es la probabilidad de exposicin entre los casos. A partir de una muestra como la de la Tabla1,
1
se puede estimar dividiendo los casos expuestos entre los casos no expuestos:
( )
( )
c
a
c a
c
c a
a
=
+
+
=
1

De modo similar, se valora la frecuencia de exposicin entre los controles mediante el cociente:
( )
( )
d
b
d b
d
d b
b
p
p
=
+
+
=
=
2
2
2
2
1

donde p
2
es la probabilidad de exposicin entre los controles.
La medida ms utilizada para cuantificar la asociacin entre la exposicin y la presencia de enfermedad
es el "odds ratio" (OR) y su clculo se estima mediante el cociente de las dos cantidades anteriores:
( )
( ) c b
d a
d
b
c
a
R O
p p
p p
OR
= =
1
1
1 2
2 1
2
1


La interpretacin del OR es la siguiente: si el OR es igual a 1, la exposicin no se asocia con la
enfermedad, mientras que si el OR es menor de 1 la exposicin tiene un efecto protector (es decir, la
exposicin disminuye la probabilidad de desarrollar la enfermedad). Por ltimo, si el valor del OR es
mayor de 1, la exposicin aumenta las posibilidades de desarrollar la enfermedad. De cualquier modo, las
estimaciones del OR se deben realizar con su 95% intervalo de confianza para poder confirmar o rechazar
la asociacin de la exposicin con la enfermedad.
Como se puede observar, el valor del OR puede obtenerse de la Tabla 1 multiplicando en cruz sus
cuatro valores. De ah que tambin reciba el nombre de razn de productos cruzados, o tambin razn
de ventajas. Bajo suposiciones adecuadas, el OR puede ser un estimador adecuado de la razn de tasas
de incidencia o del riesgo relativo, medidas habitualmente utilizadas para valorar la asociacin entre una
exposicin y un evento. Cuando la frecuencia de exposicin es reducida, el valor del OR y del riesgo
relativo son muy similares.
Cl cul o del t amao muest r al en est udi os de casos y cont r ol es.
Supongamos que se quiere llevar a cabo un estudio de casos y controles con el fin de determinar si existe
una relacin significativa entre la exposicin a un factor y la presencia de una determinada enfermedad. A
continuacin se explica cmo calcular el tamao de muestra necesario para contrastar la hiptesis de que
el OR sea igual a 1.
Si se conoce la probabilidad de exposicin entre los controles p
2
, y se prev que el OR asociado al factor
de estudio es w, el valor de p
1
, la frecuencia de exposicin entre los casos, puede obtenerse fcilmente:
( )
( )
( ) ( ) ( )
( )
2 2
2
1
2 2 2 1 2 1 1 2
1 2
2 1
1
1 1 1
1
1
wp p
wp
p
wp wp p p p p p wp
p p
p p
w OR
+
=
= + =
= =

As, el problema del clculo del tamao muestral podr abordarse mediante las frmulas habituales
empleadas en la comparacin de dos proporciones, asumiendo aqu que las proporciones esperadas son p
1

y p
2

3
.
Recurriendo a las frmulas habituales para determinar el tamao muestral mnimo necesario para la
comparacin de dos proporciones, se precisar conocer
3
:
a) La magnitud de la diferencia a detectar, que tenga inters clnicamente relevante. En este caso,
como ya vimos, bastara con conocer dos de los siguientes tres parmetros:
Una idea del valor aproximado del odds ratio que se desea estimar (w)
La frecuencia de la exposicin entre los casos (p
1
)
La frecuencia de la exposicin entre los controles (p
2
)
b) La seguridad con la que se desea trabajar (), o riesgo de cometer un error de tipo I.
Generalmente se trabaja con una seguridad del 95% ( = 0,05).
c) El poder estadstico (1-) que se quiere para el estudio, o riesgo de cometer un error de tipo II.
Es habitual tomar = 0,2, es decir, un poder del 80%.
Con estos datos, y para un planteamiento bilateral, para el clculo del tamao muestral se utilizar la
expresin
4,5
:

( ) ( ) ( )
( )
2
2 1
2
2 2 1 1 1
2
1
1 1 1 2
p p
p p p p z p p z
n
+ +
=

Ecuacin 1

donde
2
2 1
p p
p
+
=

y los valores
2
1

z
y
1
z
son valores que se obtienen de la distribucin normal estndar en funcin de
la seguridad y el poder elegidos para el estudio
6
. En particular, para una seguridad de un 95% y un poder
estadstico del 80% se tiene que
96 , 1
2
1
=
z
y
84 , 0
1
=
z
.
Hasta ahora se ha asumido un tamao muestral igual para casos y controles. En caso de que el nmero de
casos y controles no est balanceado, la expresin anterior deber ser ligeramente modificada. Denotando
ahora por n el nmero de casos y por m el nmero de controles la frmula a aplicar sera
4
:

( )
( )
2
1 2
2
2 2 1 1 1
2
1
) 1 ( ) 1 ( ) 1 ( 1
p p c
p p p cp z p p c z
n
+ + +
=

Ecuacin 2
donde c = m/n es el nmero de controles por cada caso. As, el nmero de controles vendra dado por m =
c x n.
Debe precisarse que en el presente trabajo se ha tratado de exponer de modo lo ms sencillo posible el
procedimiento a seguir en el clculo del tamao de la muestra en un estudio de casos y controles. No
obstante, en ocasiones se utilizan para este clculo expresiones ms complejas basadas en una correccin
de la frmula del clculo del tamao muestral para la comparacin de dos proporciones
4
. As mismo,
existen frmulas especficas para el clculo del tamao de la muestra en el caso de que el diseo
corresponda a un estudio de casos y controles pareados
7-8
.
Ej empl o del cl cul o del t amao muest r al en un est udi o de casos y
cont r ol es.
Como ejemplo, supongamos que se desea estudiar la existencia de una asociacin entre el consumo de
tabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociacin y cuantificar
su magnitud se disea un estudio de casos y controles en el que se investigar el consumo de tabaco de
una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos
(controles). Se cree que alrededor de un 40% de los controles son fumadores y se considera como
diferencia importante entre ambos grupos un odds ratio de 4. Con estos datos, podemos calcular el
tamao de muestra necesario en cada grupo para detectar un odds ratio de 4 como significativamente
diferente de 1 con una seguridad del 95% y un poder del 80%. De acuerdo con lo expuesto con
anterioridad, conocemos los siguientes parmetros:
a. Frecuencia de exposicin entre los controles: 40%
b. Odds ratio previsto: 4
c. Nivel de seguridad: 95%
d. Poder estadstico: 80%
De acuerdo con estos datos, se estima que la frecuencia de exposicin entre los casos vendr dada por:
( ) ( )
73 , 0
6 , 1 60 , 0
6 , 1
40 , 0 4 40 , 0 1
40 , 0 4
1
2 2
2
1
=
+
=
+

=
+
=
wp p
wp
p

Esto es, se estima que aproximadamente un 73% de los casos son fumadores. Aplicando la Ecuacin 1, se
obtiene:

( ) ( ) ( ) [ ]
( )
35
4 , 0 73 , 0
4 , 0 1 4 , 0 73 , 0 1 73 , 0 84 , 0 565 , 0 1 565 , 0 2 96 , 1
2
2
+ +
= n

Es decir, se necesitara estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35
controles) para detectar como significativo un valor del odds ratio de 4.
Si se reduce el tamao del efecto a detectar, asumiendo que el odds ratio es aproximadamente igual a 3, se
obtiene:
( ) ( )
67 , 0
40 , 0 3 40 , 0 1
40 , 0 3
1
2 2
2
1
=
+

=
+
=
wp p
wp
p

y, de acuerdo con la Ecuacin 1, seran necesarios n=54 pacientes por grupo para llevar a cabo el estudio.
En algunos estudios, el investigador reune un nmero mayor de controles que de casos con el objeto de
incrementar el poder estadstico. Supongamos que en el presente ejemplo se planea obtener dos controles
por caso, y se asume que el odds ratio a detectar es aproximadamente igual a 3. Aplicando la Ecuacin 2:
( ) ( ) ( ) ( ) [ ]
( )
40
4 , 0 73 , 0 2
4 , 0 1 4 , 0 73 , 0 1 73 , 0 2 84 , 0 565 , 0 1 565 , 0 1 2 96 , 1
2
2

+ + +
= n

Por tanto, se necesitara un grupo de n=40 casos (pacientes con infarto de miocardio) y m=2x40=80
controles para llevar a cabo la investigacin.
El clculo del tamao de la muestra en los estudios de casos y controles debe formar parte del diseo
metodolgico del mismo, ya que la ejecucin de este tipo de estudios es costosa. El iniciar un estudio sin
conocer el poder estadstico y la seguridad para detectar diferencias, si es que existen, podra ser motivo
de cometer un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.
TABLA 1. Di sposi ci n de l os suj et os i ncl ui dos en un
est udi o de casos y cont r ol es. Tabl a de 2 x 2.
Casos Cont r ol es
a + c b + d n
Bi bl i ogr af a
1. Kelsey JL, Thompson WD, Evans AS. Methods in Observational Epidemiology. New York: Oxford
University Press; 1986.
2. Hennekens CH, Buring JE. Epidemiology in Medicine Boston: Litte, Brown and Company; 1987.
3. Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-141. [Texto
completo]
4. Fleiss JL. Statistical methods for rates and proportions. 2
nd
edition. New York: John Wiley & Sons;
1981.
5. Lwanga SK, Lemeshow S. Determinacin del tamao de las muestras en los estudios sanitarios.
Manual prctico. Ginebra: O.M.S.; 1991

6. Prtega Daz S, Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001; 8: 268-274. [Texto
completo]
7. Fleiss JL, Levin B. Sample size determination in studies with matched pairs. J Clin Epidemiol 1988;
41(8): 727-730. [Medline]
8. Schlesselman JJ. Case-Control Studies. New York: Oxford University Press; 1982.

I nvest igacin: Det er minacin del t amao muest ral para calcular 1/ 5
la significacin del coeficient e de correlacin lineal

Determinacin del tamao muestral para calcular la significacin del
coeficiente de correlacin lineal

Autores: Prtegas Daz, S. spertega@canalejo.org, Pita Fernndez, S. spita@canalejo.org
Cad Aten Primaria 2001; 2002; 9: 209-211. Actualizacin 18/11/2002.
_____________________________
El coef i ci ent e de cor r el aci n l i neal de Pear son
En el anlisis de estudios clnico-epidemiolgicos con frecuencia interesa estudiar, a partir de los datos de
un grupo de individuos, la posible asociacin entre dos variables. En el caso de datos cuantitativos ello
implica conocer si los valores de una de las variables tienden a ser mayores (o menores) a medida que
aumentan los valores de la otra, o si no tienen nada que ver entre s. La correlacin es el mtodo de
anlisis adecuado cuando se precisa conocer la posible relacin entre dos variables de este tipo. As, el
grado de asociacin entre dos variables numricas puede cuantificarse mediante el clculo de un
coeficiente de correlacin
1-5
. Debe entenderse, no obstante, que el coeficiente de correlacin no
proporciona necesariamente una medida de la causalidad entre ambas variables sino tan slo del grado de
relacin entre las mismas
6
.
La medida ms habitualmente utilizada para el estudio de la correlacin es el coeficiente de correlacin
lineal de Pearson. El coeficiente de Pearson mide el grado de asociacin lineal entre dos variables
cualesquiera, y puede calcularse dividiendo la covarianza de ambas entre el producto de las desviaciones
tpicas de las dos variables
1
. Para un conjunto de datos, el valor r de este coeficiente puede tomar
cualquier valor entre 1 y +1. El valor de r ser positivo si existe una relacin directa entre ambas
variables, esto es, si las dos aumentan al mismo tiempo. Ser negativo si la relacin es inversa, es decir,
cuando una variable disminuye a medida que la otra aumenta. Un valor de +1 1 indicar una relacin
lineal perfecta entre ambas variables, mientras que un valor 0 indicar que no existe relacin lineal entre
ellas. Hay que tener en consideracin que un valor de cero no indica necesariamente que no exista
correlacin, ya que las variables pueden presentar una relacin no lineal.
Para un conjunto de datos cualquiera, y una vez calculado el coeficiente de correlacin entre un par de
variables X e Y, puede realizarse un sencillo test de hiptesis, basado en la distribucin t de Student, para
valorar la significacin del coeficiente de correlacin y confirmar si existe o no una asociacin
estadsticamente significativa entre ambas caractersticas. Estudiar la significacin estadstica del
coeficiente de correlacin es, en definitiva, determinar si r es estadsticamente diferente de cero. As
mismo, puede obtenerse un intervalo de confianza para el coeficiente de correlacin en la poblacin. Sin
embargo, mientras que el valor del coeficiente de correlacin de Pearson puede ser calculado para
cualquier conjunto de datos, la validez del test de hiptesis sobre la correlacin entre las variables
requiere que al menos una de ellas tenga una distribucin normal en la poblacin de la cual procede la
muestra. Para el clculo del intervalo de confianza, se requiere adems que ambas variables presenten una
distribucin normal. An bajo esta suposicin, la distribucin del coeficiente de correlacin no ser
normal, pero puede transformarse para conseguir un valor de z que siga una distribucin normal y calcular
a partir de l su correspondiente intervalo de confianza
2
.
Cl cul o del t amao muest r al par a cal cul ar l a si gni f i caci n del coef i ci ent e
de cor r el aci n l i neal de Pear son.
Supongamos que se quiere llevar a cabo un estudio con el fin de determinar si existe o no una relacin
significativa entre dos variables numricas X e Y. Para llevar a cabo la investigacin, se recoge una
muestra de individuos en donde de cada uno de ellos se determina el valor que toma cada una de las dos
variables. A continuacin se muestra cmo calcular el tamao de muestra necesario para contrastar la
hiptesis de que el correspondiente coeficiente de correlacin sea significativamente diferente de 0.

Como se dijo anteriormente, la distribucin muestral del coeficiente de Pearson no es normal, pero bajo la
suposicin de que las dos variables de estudio presentan una distribucin gaussiana, el coeficiente de
Pearson puede transformarse para conseguir un valor de z que sigue una distribucin normal. Se suele
considerar la transformacin de Fisher:
+
=
r
r
z
1
1
ln
2
1

Siendo el error estndar de z aproximadamente igual a
3
1
n
.
Utilizando esta aproximacin, se obtiene fcilmente una frmula para el clculo del nmero de sujetos
necesarios en esta situacin. Para su cmputo, se precisar conocer:
La magnitud de la correlacin que se desea detectar (r). Esto es, se precisa tener una idea, a
partir de publicaciones o estudios previos, del valor aproximado del coeficiente de correlacin
existente entre las dos variables a estudio.
La seguridad con la que se desea trabajar,
1
, o riesgo de cometer un error de tipo I.
Generalmente se trabaja con una seguridad del 95% (
05 , 0 =
).
El poder estadstico,
1
, que se quiere para el estudio, o riesgo de cometer un error de tipo II.
Es habitual tomar
2 , 0 =
o, equivalentemente, un poder estadstico del 80%.
Se debe precisar adems si el contraste de hiptesis se va a realizar con un planteamiento unilateral (el r
calculado es mayor o menor de cero) o bilateral (el r calculado es diferente de cero) .
Si se dispone de los datos anteriores, el clculo del tamao muestral con un planteamiento bilateral puede
realizarse mediante la expresin
7
:
3
1
1
ln
2
1
2
1
2
1
+
+
+
=

r
r
z z
n

donde los valores
2
1

z
y
1
z
se obtienen de la distribucin normal estndar en funcin de la seguridad
y el poder elegidos para el estudio. En particular, para una seguridad del 95% y un poder estadstico del
80% se tiene que
96 , 1
2
1
=
z
y
84 , 0
1
=
z
. En las Tablas 1 y 2 se muestran los valores de estos
parmetros utilizados con mayor frecuencia en el clculo del tamao muestral, en funcin de la seguridad
y el poder con los que se trabaje.
Para un planteamiento unilateral, el razonamiento es anlogo, llegando a la siguiente frmula para el
clculo del tamao muestral:
3
1
1
ln
2
1
2
1 1
+
+
+
=

r
r
z z
n


donde ahora el valor
1
z
se obtiene igualmente de la distribucin normal estndar, siendo para una
seguridad del 95% igual a
645 , 1
1
=
z
. La Tabla 1 muestra los valores ms frecuentemente utilizados en
funcin de la seguridad elegida cuando se trabaja con un planteamiento unilateral.
Como resulta habitual, las frmulas anteriores pueden modificarse con el fin de ajustar el tamao
muestral previsto para el estudio a posibles prdidas de informacin que se produzcan durante el
desarrollo del mismo. As, asumiendo un porcentaje de prdidas L, el tamao de la muestra a estudiar
vendr dado por:
L
n
n
=
1

donde n denota el valor del tamao muestral calculado por cualquiera de las dos frmulas anteriores
segn el caso.
Ej empl o del cl cul o del t amao muest r al par a el cl cul o del coef i ci ent e de
cor r el aci n ent r e dos var i abl es
Supongamos que se desea estudiar la asociacin entre la edad y el nivel de colesterol entre los pacientes
que acuden a consulta en un determinado centro de salud. Para ello se disea un estudio en el que se
determinar mediante una analtica los valores de colesterol en una muestra aleatoria de los pacientes
atendidos en ese centro durante un periodo de tiempo prefijado, de los que tambin se registrar su edad.
Se cree que el valor del coeficiente de correlacin lineal de Pearson entre los valores de la edad y el
colesterol puede oscilar alrededor de r=0,4. Aplicando las frmulas anteriores, con un planteamiento
bilateral, una seguridad del 95% y un poder estadstico del 80%, se obtiene:
47 3
4 , 0 1
4 , 0 1
ln
2
1
84 , 0 96 , 1
3
1
1
ln
2
1
2
2
1
2
1
+
+
+
= +
+
+
=

r
r
z z
n

Es decir, se necesitar estudiar a una muestra de 47 pacientes para detectar como significativo un valor
del coeficiente de correlacin de r=0,4.
Como resulta habitual, si el tamao del efecto a detectar es menor, asumiendo ahora que el valor del
coeficiente de correlacin es aproximadamente igual a r=0,3, se obtiene:
85 3
3 , 0 1
3 , 0 1
ln
2
1
84 , 0 96 , 1
3
1
1
ln
2
1
2
2
1
2
1
+
+
+
= +
+
+
=

r
r
z z
n

En este caso, se necesitara incluir a 85 pacientes para llevar a cabo el estudio. Si, adems, en este ltimo
caso se prev un 20% de posibles prdidas de informacin durante la ejecucin del estudio, el tamao
muestral debe recalcularse segn la siguiente expresin:
107 25 , 106
2 , 0 1
85
1
=
=
L
n
n


Es decir, se necesitara una muestra de 107 pacientes para llevar a cabo la investigacin.
No debe olvidarse que el precisar convenientemente el tamao de muestra necesario para la ejecucin de
un estudio permite al investigador conocer el nmero mnimo de pacientes a estudiar para detectar como
significativos efectos de una magnitud determinada. El no hacerlo podra llevar a realizar el estudio con
un nmero insuficiente de casos y a cometer un error de tipo II, es decir, a no detectar una correlacin
significativa entre las dos variables cuando realmente la hay.
TABLA 1. Val or es de
1
z
y
2
1

z
ut i l i zados con may or
f r ecuenci a en el cl cul o del t amao muest r al en f unci n de l a
segur i dad
1
el egi da par a el est udi o.
Segur i dad
Pr ueba bi l at er al
2
1

z

Pr ueba
uni l at er al
1
z

80 %
0,200 1,282 0,842
85 % 0,150 1,440 1,036
90 % 0,100 1,645 1,282
95 % 0,050 1,960 1,645
97, 5 % 0,025 2,240 1,960
99 % 0,010 2,576 2,326

TABLA 2. Val or es de z
1-
ut i l i zados con may or f r ecuenci a en el
cl cul o del t amao muest r al en f unci n de el poder est adst i co 1-
el egi do par a el est udi o.
Poder est adst i co
z
1-

99 % 0,01 2,326
95 % 0,05 1,645
90 % 0,1 1,282
85 % 0,15 1,036
80 % 0,2 0,842
75 % 0,25 0,674
70 % 0,3 0,524
65 % 0,35 0,385
60 % 0,4 0,253
55 % 0,45 0,126
80 % 0,5 0,000
Bi bl i ogr af a
1. Pita Fernndez S. Relacin entre variables cuantitativas. Cad Aten Primaria 1997; 4: 141-144.
[Texto completo]
2. Altman D.G. Practical Statistics for Medical Research. London: Chapman&Hall, 1991.
3. Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. 2 ed. Mxico: Editorial el Manual
Moderno; 1996.

4. Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid: Interamericana
McGraw Hill; 2001.
5. Armitage P, Berry G. Estadstica para la investigacin biomdica. Barcelona: Doyma; 1992.
6. Pita Fernndez S. Correlacin frente a causalidad. JANO 1996; (1774): 59-60.
7. Argimon Palls J.M., Jimnez Villa J. Mtodos de Investigacin Clnica y Epidemiolgica. 2 ed.
Madrid: Ediciones Harcourt, 2000.

Investigacin: Clculo del poder estadstico de un estudio 1/7

www.fisterra.com Atencin Primaria en la Red
Clculo del poder estadstico de un estudio

Prtegas Daz, S. spertega@canalejo.org , Pita Fernndez, S. spita@canalejo.org
Unidad de Epidemiologa Clnica y Bioestadstica. Complexo Hospitalario-Universitario Juan Canalejo.
A Corua (Espaa). Actualizacin 20/01/2003.
__________________________
Las pr uebas de cont r ast e de hi pt esi s y el concept o de poder est adst i co
El anlisis de estudios clnico-epidemiolgicos con frecuencia exige la comparacin entre varios
tratamientos o entre diferentes grupos de sujetos con respecto a una respuesta de inters. Por ejemplo,
puede interesarnos comparar la eficacia de un nuevo frmaco frente a la de otro estndar en el tratamiento
de una determinada patologa, o bien establecer la asociacin entre la exposicin a un factor de riesgo y el
desarrollo de cierta enfermedad. Problemas de este tipo pueden plantearse como un contraste de
hiptesis, de forma que la hiptesis que se contrasta es la de que no existen diferencias entre ambos
grupos o tratamientos (hiptesis nula), frente a la hiptesis alternativa de que estos sean realmente
diferentes.
Una prueba de contraste de hiptesis o de significacin estadstica calcula la probabilidad de que los
resultados obtenidos en una investigacin puedan ser debidos al azar en el supuesto de que la hiptesis
nula sea cierta, es decir, bajo el supuesto de que no existan diferencias entre ambos grupos. Esta
probabilidad es el grado de significacin estadstica o valor de p. Basndose en esta probabilidad, se
decidir rechazar o no la hiptesis nula. As, cuanto menor sea el valor de p, menor ser la probabilidad
de que los resultados obtenidos se deban al azar y mayor evidencia habr en contra de la hiptesis nula. Si
dicha probabilidad es menor que un valor de p fijado previamente (habitualmente se toma p<0,05), la
hiptesis nula se rechazar. As, cuando el valor de p est por debajo de 0,05, se dir que el resultado es
estadsticamente significativo y ser no significativo en cualquier otro caso.
As pues, a partir de los resultados de un estudio, puede llegarse a diferentes conclusiones (Tabla 1). En
primer lugar, puede concluirse que existen diferencias entre los grupos que se comparan cuando
realmente las hay. Asimismo, puede concluirse que no hay diferencias cuando stas no existen. En ambos
casos, no se comete ningn error. Sin embargo, tambin se puede concluir que existen diferencias cuando
de hecho no las hay. Es decir, puede rechazarse la hiptesis nula cuando en realidad es verdadera. Si esto
ocurre, se comete un error de tipo I o error . La probabilidad de cometer un error de este tipo es lo que
mide precisamente el grado de significacin p.
En algunas ocasiones, por el contrario, los resultados de un estudio no son significativos. Se habla
entonces de estudios negativos. No obstante, la ausencia de significacin estadstica no implica
necesariamente que no exista relacin entre el factor de estudio y la respuesta. Puede ocurrir, que an
existiendo tal asociacin o una diferencia clnicamente relevante, el estudio haya sido incapaz de
detectarla como estadsticamente significativa. En estudios de este tipo se concluir que no existen
diferencias cuando realmente s las hay. Este error se conoce como error de tipo II. La probabilidad de
cometer un error de este tipo suele denotarse por y su complementario, 1-, es lo que se conoce como
poder estadstico o potencia estadstica
1-3
.
En definitiva, el poder estadstico representa la probabilidad de rechazar la hiptesis nula cuando es
realmente falsa. Es decir, representa la capacidad de un test para detectar como estadsticamente
significativas diferencias o asociaciones de una magnitud determinada.
Fact or es que i nf l uy en en el poder est adst i co de un est udi o.
El poder estadstico de un estudio depende de diferentes factores, como
3
:
El tamao del efecto a detectar, es decir, la magnitud mnima de la diferencia o asociacin entre
los grupos que se considera clnicamente relevante. Cuanto mayor sea el tamao del efecto que
se desea detectar, mayor ser la probabilidad de obtener hallazgos significativos y, por lo tanto,
mayor ser el poder estadstico.

La variabilidad de la respuesta estudiada. As, cuanto mayor sea la variabilidad en la respuesta,
ms difcil ser detectar diferencias entre los grupos que se comparan y menor ser el poder
estadstico de la investigacin. De ah que sea recomendable estudiar grupos lo ms homogneos
posibles.
El tamao de la muestra a estudiar. Cuanto mayor sea el tamao muestral, mayor ser la
potencia estadstica de un estudio. Es por ello que en los estudios con muestras muy grandes se
detectan como significativas diferencias poco relevantes, y en los estudios con muestras menores
es ms fcil obtener resultados falsamente negativos.
El nivel de significacin estadstica. Si se disminuye el valor de
tambin se disminuye el
poder de la prueba. Es decir, si disminuimos la probabilidad de cometer un error de tipo I
aumentamos simultneamente la probabilidad de un error de tipo II, por lo que se trata de
encontrar un punto de equilibrio entre ambas. Habitualmente se trabaja con un nivel de
significacin del 95% (
05 . 0 =
), por lo que el equilibrio hay que en encontrarlo finalmente
entre el tamao de la muestra que es posible estudiar y el poder que se quiere para el estudio.
Los cuatro factores anteriores, junto con el poder estadstico, forman un sistema cerrado. De este modo,
una vez fijados tres de ellos, el cuarto queda completamente determinado.
Cl cul o del poder est adst i co de un est udi o.
A la hora de disear una investigacin, es importante determinar si dicho estudio alcanzar una precisin
suficiente. En anteriores trabajos se ha mostrado cmo calcular el tamao muestral necesario para
alcanzar un determinado poder estadstico en diferentes tipos de diseo
4-7
. Generalmente, se suele trabajar
con un poder en torno al 80% o al 90%. Con frecuencia, sin embargo, las condiciones en las que se lleva a
cabo una investigacin son diferentes de las que se haban previsto en un principio. En consecuencia, y a
la vista de hallazgos no significativos, es recomendable evaluar de nuevo a posteriori su potencia con el
fin de discernir si el estudio carece del poder necesario para detectar una diferencia relevante o bien si
realmente puede no existir tal diferencia.
En la Tabla 2 se muestran las frmulas necesarias para el clculo del poder estadstico en funcin de la
naturaleza de la investigacin. Estas frmulas permiten obtener un valor
1
z
a partir del cual se puede
determinar el poder asociado recurriendo a las tablas de la distribucin normal. En la Tabla 3 se muestra
la correspondencia entre algunos valores de
1
z
y el poder estadstico asociado. Sin embargo, y aunque
dichas frmulas nos permitiran analizar el poder estadstico en diferentes tipos de diseo, puede resultar
ms sencillo disponer de algn software especfico con el que poder realizar dichos clculos
8
.
Ejemplo 1.
Ilustremos el proceso del clculo de la potencia mediante un ejemplo. Supongamos que se quiere llevar a
cabo un ensayo clnico para comparar la efectividad de un nuevo frmaco con la de otro estndar en el
tratamiento de una determinada enfermedad. Al inicio del estudio, se sabe que la eficacia del tratamiento
habitual est en torno al 40%, y se espera que con el nuevo frmaco la eficacia aumente al menos en un
15%. El estudio se dise para que tuviese un poder del 80%, asumiendo una seguridad del 95%. Esto
implica que son necesarios 173 pacientes en cada uno de los grupos para llevar a cabo la investigacin.
Tras finalizar el estudio, slo fue posible tratar con cada uno de los frmacos a 130 pacientes en cada
grupo en lugar de los 173 pacientes estimados inicialmente. Al realizar el anlisis estadstico, se objetiv
que no hay diferencias significativas en la efectividad de ambos tratamientos. A partir de las frmulas de
la Tabla 2, podemos calcular cul ha sido finalmente el poder del estudio. Aplicando la frmula para el
clculo del poder estadstico de comparacin de dos proporciones ante un planteamiento unilateral se
obtiene:

( )
( ) ( )
( )
( ) ( )
467 . 0
55 . 0 1 55 . 0 4 . 0 1 4 . 0
475 . 0 1 475 . 0 2 645 . 1 130 55 . 0 4 . 0
1 1
1 2
645 . 1 05 . 0
130
475 . 0
55 . 0
4 . 0
2 2 1 1
1 2 1
1
1
2
1
=
+

=
=
+

=
= =
=
=
)
`
=
=
p p p p
p p z n p p
z
z
n
p
p
p

A partir de la Tabla 3, podemos determinar que un valor de
467 . 0
1
=
z
corresponde a un poder en
torno al 65%-70%. Utilizando las tablas de la distribucin normal, se sabe que el poder es del 68%, es
decir, el estudio tendra un 68% de posibilidades de detectar una mejora en la eficacia del tratamiento del
15%.
Utilizando la frmula anterior, podra obtenerse un grfico como en el que se muestra en la Figura 1, en la
que, para este ejemplo, se estima el poder estadstico del estudio en funcin del tamao de la muestra
estudiada y la magnitud del efecto a detectar. As, puede concluirse que de haber estudiado 130 pacientes
por grupo, se obtiene una potencia de slo el 36.6% para detectar una diferencia mnima del 10%, una
potencia del 68% para detectar una diferencia del 15% y de un 90.2% para una diferencia del 20%. Este
tipo de grficos resulta muy til tanto en la fase de diseo de un estudio como a la hora de valorar a
posteriori el poder de una investigacin.
Ejemplo 2.
De modo anlogo, supongamos que se quiere llevar a cabo un estudio de casos y controles para estudiar la
posible asociacin entre la presencia de cardiopata isqumica y el hbito de fumar. De acuerdo con
estudios previos, se cree que la incidencia de cardiopata puede ser hasta 2 veces ms alta entre los
fumadores, y se asume que la frecuencia de exposicin entre los controles ser de un 40%. Debido a
ciertas limitaciones, slo es posible para el investigador incluir en el estudio a 100 pacientes con
cardiopata isqumica (casos). Utilizando de nuevo las frmulas de la Tabla 2, con un planteamiento
bilateral y una seguridad del 95%:
( ) ( )
( )
( ) ( )
( )
( ) ( )
472 . 0
40 . 0 1 40 . 0 5714 . 0 1 5714 . 0
486 . 0 1 486 . 0 2 96 . 1 100 40 . 0 5714 . 0
1 1
1 ) 1 (
1
96 . 1 05 . 0
100
486 . 0
2
5714 . 0
40 . 0 2 40 . 0 1
40 . 0 2
1 40 . 0
2
2 2 1 1
1 2 1
1
2
1
2 1
2 2
2
1
2
=
+

=
+
+
=
=
= =
=
=
+
=
=
+

=
+

=
)
`
=
=
p p p cp
p p c z cn p p
z
c
z
n
p p
p
p OR p
p OR
p
p
OR

Recurriendo de nuevo a las tablas de la distribucin normal, se obtiene para un valor
472 . 0
1
=
z
un
poder del 68.17%.
Con el fin de mejorar el poder del estudio, los investigadores se plantean reclutar un mayor nmero de
controles que de casos. En la Figura 2 se muestra para el ejemplo anterior el poder de la investigacin en

funcin del nmero de casos y controles estudiados. Como se puede observar, la ganancia en el poder
disminuye rpidamente, y es prcticamente nula cuando la relacin entre el nmero de controles y casos
es 4:1. Esto se verifica en cualquier estudio de casos y controles
3
. En particular, para el ejemplo previo, si
se estudiasen 100 casos y 200 controles se alcanzara un poder del 80.28%. Si se incluyesen 100 casos y
300 controles, el poder sera de un 84.69%. Con 400 controles el poder aumentara slo a un 86.89% y
con 500 a un 88.19%. Con lo cual claramente es ineficiente el incluir ms de 4 controles por caso ya que
no lograramos un incremento relevante del poder estadstico.
El anlisis adecuado del poder estadstico de una investigacin, que es en definitiva la capacidad que tiene
el estudio para encontrar diferencias si es que realmente las hay, es un paso fundamental tanto en la fase
de diseo como en la interpretacin y discusin de sus resultados. A la hora del diseo, por tanto, debe
establecerse la magnitud mnima de la diferencia o asociacin que se considere de relevancia clnica, as
como el poder estadstico que se desea para el estudio y, de acuerdo con ello, calcular el tamao de la
muestra necesaria. Tras realizar el anlisis estadstico, cuando se dice que no existe evidencia de que A se
asocie con B o sea diferente de B, deberemos cuestionarnos antes de nada si la ausencia de significacin
estadstica indica realmente que no existe una diferencia o asociacin clnicamente relevante, o
simplemente que no se dispone de suficiente nmero de pacientes para obtener hallazgos significativos.
Tanto si los hallazgos son estadsticamente significativos como si no lo son, la estimacin de intervalos de
confianza pueden tambin facilitar la interpretacin de los resultados en trminos de magnitud y
relevancia clnica, proporcionndonos una idea de la precisin con la que se ha efectuado al estimacin,
de la magnitud y de la direccin del efecto
9-10
. De este modo, los intervalos de confianza nos permiten
tener una idea acerca del poder estadstico de un estudio y, por tanto, de la credibilidad de la ausencia de
hallazgos significativos.
Bi bl i ogr af a
1. Altman D.G. Practical Statistics for Medical Research. London: Chapman & Hall; 1991.
2. Kelsey J.L., Whittemore A.S., Evans A., Thompson W.D. Methods in Observational
Epidemiology. 2
nd
ed. New York: Oxford University Press; 1996.
3. Argimon Palls J.M., Jimnez Villa J. Mtodos de investigacin clnica y epidemiolgica. 2 ed.
Madrid: Ediciones Harcourt; 2000.
4. Pita Fernndez S. Determinacin del tamao muestral. Cad Aten Primaria 1996; 3: 138-141.
[Texto completo]
5. Prtega Daz S, Pita Fernndez S. Clculo del tamao muestral para la determinacin de factores
pronsticos. Cad Aten Primaria 2002; 9: 30-33. [Texto completo]
6. Prtega Daz S, Pita Fernndez S. Clculo del tamao muestral en estudios de casos y controles.
Cad Aten Primaria 2002; 9:148-150. [Texto completo]
7. Prtega Daz S, Pita Fernndez S. Determinacin del tamao muestral para calcular la
significacin del coeficiente de correlacin lineal. Cad Aten Primaria 2002; 9: 209-211. [Texto
completo]
8. Thomas L, Krebs CJ. A review of Statistical power analysis software. Bulletin of the Ecological
Society of America 1997; 78 (2): 126-139.
9. Braitman LE. Confidence intervals assess both clinical significance and statistical significance.
Ann Intern Med. 1991; 114 (6): 515-7. [Medline]
10. Argimon JM. El intervalo de confianza: algo ms que un valor de significacin estadstica. Med
Clin (Barc) 2002; 118(10): 382-384. [Medline]


Tabl a 1. Posi bl es concl usi ones t r as una pr ueba est adst i ca de cont r ast e
de hi pt esi s.
Resul t ado de l a pr ueba

Asoci aci n o
di f er enci a
si gni f i cat i v a
Asoci aci n o
di f er enci a no
si gni f i cat i v a
Ex i st e asoci aci n o
di f er enci a
No error
(1-
)
Error de tipo II

Real i dad
No ex i st e asoci aci n o
di f er enci a
Error de tipo I

No error
(1-
)
= probabilidad de cometer un error de tipo I.
= probabilidad de cometer un error de tipo II.

Tabl a 2. Fr mul as par a el cl cul o del poder est adst i co par a di f er ent es t i pos de di seo.
Test uni l at er al Test bi l at er al
Compar aci n
de dos
pr opor ci ones
( )
( ) ( )
2 2 1 1
1 2 1
1
1 1
1 2
p p p p
p p z n p p
z
+

=

( )
( ) ( )
2 2 1 1
2
1
2 1
1
1 1
1 2
p p p p
p p z n p p
z
+

=

Compar aci n
de dos
medi a

=
1 1
2
z
S
d n
z

2
1
1
2

= z
S
d n
z

Est i maci n
de un OR en
est udi os de
casos y
cont r ol es
( )
2 2
2
1
1 p OR p
p OR
p
+

=

( )
( ) ( )
2 2 1 1
1 2 1
1
1 1
1 ) 1 (
p p p p c
p p c z nc p p
z
+
+
=

n c m =

( )
2 2
2
1
1 p OR p
p OR
p
+

=

( )
( ) ( )
2 2 1 1
2
1
2 1
1
1 1
1 ) 1 (
p p p p c
p p c z nc p p
z
+
+
=

n c m =

Est i maci n
de un RR
2 1
p RR p =

( )
( ) ( )
2 2 1 1
1 2 1
1
1 1
1 2
p p p p
p p z n p p
z
+

=

2 1
p RR p =

( )
( ) ( )
2 2 1 1
2
1
2 1
1
1 1
1 2
p p p p
p p z n p p
z
+

=

Est i maci n
de un
coef i ci ent e
de
cor r el aci n
l i neal

|
.
|
\
|
+
=
1 1
1
1
ln
2
1
3 z
r
r
n z

2
1
1
1
1
ln
2
1
3

|
.
|
\
|
+
= z
r
r
n z

n = Tamao muestral. En un estudio de casos y controles, n es el nmero de casos.

1
p
= En un estudio transversal o de cohortes, proporcin de expuestos que desarrollan la
enfermedad. En un estudio de casos y controles, proporcin de casos expuestos.

2
p
= En un estudio transversal o de cohortes, proporcin de no expuestos que desarrollan
la enfermedad. En un estudio de casos y controles, proporcin de controles expuestos.

2
2 1
p p
p
+
=

d = Valor mnimo de la diferencia a detectar entre dos medias
S
2
= Varianza en el grupo control o de referencia

c = Nmero de controles por caso
m = En un estudio de casos y controles, nmero de controles
OR = Valor aproximado del odds ratio a detectar
RR = Valor aproximado del riesgo relativo a detectar
r = Magnitud del coeficiente de correlacin a detectar

Tabl a 3. Val or es de
1
z
,
2
1

z
y
1
z
ms f r ecuent ement e ut i l i zados.

Segur i dad
Test uni l at er al
1
z

Test bi l at er al
2
1

z

80 % 0,200 0,842 1,282
85 % 0,150 1,036 1,440
90 % 0,100 1,282 1,645
95 % 0,050 1,645 1,960
97,5 % 0,025 1,960 2,240
99 % 0,010 2,326 2,576
Poder est adst i co
1

1
z

99 % 0,99 0,01 2,326
95 % 0,95 0,05 1,645
90 % 0,90 0,10 1,282
85 % 0,85 0,15 1,036
80 % 0,80 0,20 0,842
75 % 0,75 0,25 0,674
70 % 0,70 0,30 0,524
65 % 0,65 0,35 0,385
60 % 0,60 0,40 0,253
55 % 0,55 0,45 0,126
50 % 0,50 0,50 0,000


Fi gur a 1.
Poder estadstico en funcin del tamao muestral y la magnitud del efecto
a detectar. Comparacin de dos proporciones p1 y p2.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 50 100 150 200 250 300 350 400 450 500
Nmero de casos por grupo
p1=40% p2=50% p1=40%; p2=55% p1=40%; p2=60%

Fi gur a 2.
Poder estadstico en funcin del tamao muestral y el nmero de
controles por caso en un estudio de casos y controles. p2=40%; OR=2
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
0 50 100 150 200 250 300 350 400 450 500
Nmero de casos
c=1 c=2 c=3 c=4 c=5

I nvest igacin: Significacin est adst ica y relevancia clnica 1/ 7

Significancia estadstica y relevancia clnica

Pita Fernndez S., Prtega Daz S.
__________________________________
La realizacin de cualquier estudio clnico-epidemiolgico pretende poner de manifiesto al final del
mismo si existe o no asociacin entre diferentes variables. Esta asociacin puede ser resultado de que
realmente exista la asociacin indicada, pero esta asociacin tambin puede ser producto del azar, de la
presencia de sesgos o de la presencia de variables de confusin.
Una de las aplicaciones de la estadstica es hacer inferencias a poblaciones, a partir de muestras
(1)
. En la
realizacin de este proceso inferencial, siempre existe el riesgo de error o imprecisin ya sea por el azar o
la variabilidad biolgica del fenmeno a estudiar. La carencia de error aleatorio debido al azar se conoce
como precisin. Cuanto ms grande es el tamao muestral, mayor es la precisin y la variabilidad
explicada por el azar disminuye. Esta posibilidad de error o falta de precisin, siempre que no existan
sesgos o variables de confusin, se corrige aumentando el tamao de la muestra. De cualquier manera el
papel del azar debe ser siempre contemplado, evaluado y medido, realizando test de hiptesis o
construyendo intervalos de confianza para conocer la precisin de nuestra estimacin dentro de una
seguridad previamente definida.
Desde el punto de vista clnico la significacin estadstica no resuelve todos los interrogantes que hay que
responder ya que la asociacin estadsticamente significativa puede no ser clnicamente relevante y
adems la asociacin estadsticamente significativa puede no ser causal. En definitiva podemos encontrar
asociaciones "estadsticamente posibles y conceptualmente estriles"
(2)
.
Si gni f i caci n est adst i ca
A pesar de las limitaciones de la estadstica, el trmino "estadsticamente significativo" invade la
literatura mdica y se percibe como una etiqueta que indicase "garanta de calidad". El considerar el
trmino significativo implica utilizar trminos comparativos de dos hiptesis. Los test de hiptesis son
test de significacin estadstica que cuantifican hasta que punto la variabilidad de la muestra puede ser
responsable de los resultados de un estudio en particular. La H
o
(hiptesis nula) representa la afirmacin
de que no hay asociacin entre las dos variables estudiadas y la H
a
(hiptesis alternativa) afirma que hay
algn grado de relacin o asociacin entre las dos variables. Nuevamente la estadstica nos muestra su
utilidad ya que nos ayuda a tomar la decisin de que hiptesis debemos elegir. Dicha decisin puede ser
afirmada con una seguridad que nosotros previamente decidimos. El nivel de significacin se estableci
siguiendo los comentarios del estadstico Fisher que seal "...es conveniente trazar una lnea de
demarcacin a partir de la cual podamos decir: o bien hay algo en el tratamiento..."
(3)
. El mecanismo de
los diferentes test se realiza aunque con matices siempre de la siguiente forma: En primer lugar se mira la
magnitud de la diferencia que hay entre los grupos a comparar (A y B). Si esta magnitud o valor absoluto
es mayor que un error estndar definido multiplicado por una seguridad definida, concluimos que la
diferencia es significativa entre A y B. Por tanto aceptamos la hiptesis alternativa y rechazamos la
hiptesis nula.
Ejemplo: Disponemos de 2 tratamientos ( A y B). El tratamiento A lo reciben 25 pacientes y el
tratamiento B otros 25 pacientes. 15 pacientes responden favorablemente al tratamiento A y 20 al
tratamiento B. Existe diferencia significativa entre ambos tratamientos?
H
o
(hiptesis nula) = No hay diferencia entre ambos tratamientos.
H
a
(hiptesis alternativa) = S existe diferencia.
Tr at ami ent o N Por cent aj e de r espuest a
A 25 15/ 25 = 0.60
B 25 20/ 25 = 0.80

Si

es mayor que el producto de 1.96 * el error estndar,
conclumos que la diferencia es significativa.

Error estndar = = 0.1296
Error estndar * 1.96 = 0.1296 * 1.96 = 0.25
Como quiera que la diferencia =

no supera el valor 0.25 concluimos que la diferencia entre 0.60 y 0.80 no es
estadsticamente significativa. A la vista de los resultados no podemos aceptar
la H
a
(hiptesis alternativa).
El proceso de aceptacin o rechazo de la hiptesis lleva implcito un riesgo que se cuantifica con el valor
de la "p", que es la probabilidad de aceptar la hiptesis alternativa como cierta, cuando la cierta podra ser
la hiptesis nula.
El valor de "p" que indica que la asociacin es estadsticamente significativa ha sido arbitrariamente
seleccionado y por consenso se considera en 0.05. Una seguridad del 95% lleva implcito una p < de 0.05
y una seguridad del 99% lleva implcita una p < 0.01. Cuando rechazamos la H
o
(hiptesis nula) y
aceptamos la H
a
(hiptesis alternativa) como probablemente cierta afirmando que hay una asociacin, o
que hay diferencia, estamos diciendo en otras palabras que es muy poco probable que el azar fuese
responsable de dicha asociacin. Del mismo modo si la p>0.05 decimos que el azar no puede ser
excluido como explicacin de dicho hallazgo y no rechazamos la H
o
(hiptesis nula) que afirma que
ambas variables no estn asociadas o correlacionadas
(4)
.
Conviene por otra parte considerar que la significacin estadstica entre dos variables depende de dos
componentes fundamentales. El primero es la magnitud de la diferencia a testar. Cuanto ms grande sea
la diferencia entre las dos variables, ms fcil es demostrar que la diferencia es significativa. Por el
contrario si la diferencia entre ambas variables es pequea, las posibilidades de detectar diferencias entre
las mismas se dificulta. El segundo componente fundamental a tener en cuanta al testar diferencias entre
dos variables es el tamao muestral. Cuanto ms grande sea dicho tamao muestral ms fcil es detectar
diferencias entre las mismas. Pequeas diferencias se pueden detectar con grandes tamaos muestrales y
grandes diferencias entre variables necesitan muchos menos pacientes o individuos a ser estudiados.
Cualquier diferencia puede ser estadsticamente significativa si se dispone del suficiente nmero de
pacientes.
Ejemplo: En el ejemplo anterior objetivamos que no hay diferencia entre 60% y 80%. Supongamos que
realizamos ahora el estudio con 900 pacientes en cada grupo:
Si

es mayor que el producto de 1.96 * el error estndar,
concluimos que la diferencia es significativa.


Error estndar = = 0.0216
Error estndar * 1.96 = 0.0216 * 1.96 = 0.042
Como quiera que la diferencia =

supera el valor 0.0423 concluimos que la diferencia entre 0.60 y 0.80 s es
estadsticamente significativa. A la vista de los resultados por tanto
rechazamos la H
o
(hiptesis nula) y aceptamos la H
a
(hiptesis alternativa)
como probablemente cierta. Como podemos objetivar en este segundo ejemplo
ahora, si podemos decir que la diferencia entre 60% y 80% es estadsticamente
significativa (p< 0.05).
El tamao muestral afecta a la probabilidad de la significacin estadstica a travs del error estndar que
se hace ms pequeo cuantos ms pacientes tenga el estudio. As pues el valor de la "p" es funcin de la
magnitud de la diferencia entre los dos grupos o dos variables y del tamao de la muestra. Por esta razn
una pequea diferencia puede ser estadsticamente significativa si disponemos de un tamao muestral lo
suficientemente grande y por el contrario un efecto o diferencia relativamente grande puede no alcanzar la
significacin estadstica si la variabilidad es grande debida a un pequeo tamao muestral. Por estas
razones los valores de la "p" deben ser considerados solo como una gua y no como base de conclusiones
definitivas e irrevocables.
Er r or de t i po I ( )
Al realizar el test estadstico, podramos correr el riesgo de equivocarnos al rechazar la hiptesis nula. La
probabilidad de rechazar la hiptesis nula cuando en realidad es verdadera (error de tipo I) se le denomina
nivel de significacin y es la "p". Esta probabilidad de rechazar la hiptesis nula cuando es verdadera se
le conoce tambin como error alfa. La "p" no es por tanto un indicador de fuerza de la asociacin ni de su
importancia.
La significacin estadstica es por tanto una condicin resultante del rechazo de una hiptesis nula
mediante la aplicacin de una prueba estadstica de significacin. El nivel de significacin es el riesgo o
la probabilidad que voluntariamente asume el investigador de equivocarse al rechazar la hiptesis nula,
cuando en realidad es cierta. Este riesgo se establece normalmente en 0.05 0.01.
El proceso de poner a prueba una hiptesis involucra una toma de decisiones para rechazar o no la
hiptesis nula. Aunque los valores de la "p" son los de una variable continua, se utiliza para forzar una
decisin cualitativa, tomando partido por una u otra hiptesis. Si p < 0.05 se considera significativo, en
cuyo caso se rechaza la hiptesis nula y no significativo si p> 0.05 en cuyo caso no se rechaza. Una "p"
pequea significa que la probabilidad de que los resultados obtenidos se deban al azar es pequea. Los
sinnimos de la expresin estadsticamente significativos se muestran en la Tabla 1
(5)
.


Er r or de t i po I I ( )
El riesgo alfa ("p") indica la probabilidad de cometer un error de tipo I (falso positivo). El error de tipo
I, es por lo tanto rechazar la H
o
cuando en realidad es verdadera. Se podra considerar que para evitar este
tipo de error deberamos de elegir un nivel de confianza ms elevado, sin embargo al aumentar el nivel de
confianza aumenta la probabilidad de cometer el error de tipo II. El error de tipo II consiste en aceptar la
hiptesis nula cuando es falsa y esto se conoce como el error de tipo II o Beta ( ) (falso negativo)
(6)

(Tabla 2).
En la ejecucin de un estudio determinado no es posible saber si estamos cometiendo el error de tipo I o
error de tipo II, sin embargo hay una serie de recomendaciones que podramos seguir para disminuir
dichos errores.
Recomendaci ones par a di smi nui r el er r or de t i po I :
Disponer de una teora que gue la investigacin, evitando el "salir de pesca" con el ordenador
buscando asociaciones entre variables.
Disminuir el nmero de test estadsticos llevados a cabo en el estudio.
Depurar la base de datos para evitar errores de valores extremos que puedan producir hallazgos
significativos.
Utilizar valores de alfa ms reducidos (0.01 0.001).
Reproducir el estudio. Si al reproducir el estudio se obtienen resultados similares, estaremos ms
seguros de no estar cometiendo el error de tipo I.
Recomendaci ones par a di smi nui r el er r or de t i po I I :
Incrementar el tamao de la muestra.
Estimar el poder estadstico del estudio.
Incrementar el tamao del efecto a detectar.
Incrementar el valor de alfa.
Utilizar test paramtricos (ms potentes) en lugar de test no paramtricos.
Rel evanci a cl ni ca
La relevancia clnica de un fenmeno va ms all de clculos aritmticos y est determinada por el juicio
clnico. La relevancia depende de la magnitud de la diferencia, la gravedad del problema a investigar, la
vulnerabilidad, la morbimortalidad generada por el mismo, su coste y por su frecuencia entre otros
elementos.
La reduccin relativa del riesgo relativo es una medida de utilidad en el clculo de la relevancia clnica.
Reducciones del riesgo relativo de 50% casi siempre y de 25% con frecuencia, son consideradas como
clnicamente relevantes
(7)
independientemente de la significacin estadstica.
La prctica de la medicina basada en la evidencia considera el ensayo clnico aleatorizado como el
estndar para valorar la eficacia de las tecnologas sanitarias y recomienda que las decisiones se tomen,
siempre que se pueda, con opciones diagnsticas o teraputicas de demostrada eficacia
(8,9)
.
La forma recomendada de presentar los resultados de un ensayo clnico aleatorizado y otros tipos de
estudio debe incluir
(8, 10,11,12)
: La reduccin relativa del riesgo (RRR), la reduccin absoluta del riesgo
(RAR) y el nmero necesario de pacientes a tratar para reducir un evento (NNT). Consideremos para su
clculo este ejemplo: Mueren 15% de pacientes en el grupo de intervencin y mueren un 20% en el grupo
control. El que la diferencia entre ambos sea significativa depender del tamao muestral. El riesgo
relativo, que es el cociente entre los expuestos al nuevo tratamiento o actividad preventiva y los no
expuestos, es en este caso (0.15/0.20=0.75). El riesgo de muerte de los pacientes que reciben el nuevo
tratamiento relativo al de los pacientes del grupo control fue de 0.75. La RRR es el complemento del RR,
es decir, (1-0.75)* 100 = 25%. El nuevo tratamiento reduce el riesgo de muerte en un 25% relativo al que
ha ocurrido en el grupo control. La reduccin absoluta del riesgo (RAR) sera: 0.20-0.15= 0.05 (5%).

Podramos decir por tanto que de cada 100 personas tratadas con el nuevo tratamiento podemos evitar 5
casos de muerte. La siguiente pregunta sera: si de cada 100 personas tratadas con el nuevo tratamiento
podemos evitar 5 casos de muerte. Cuntos tendramos que tratar para evitar un solo caso de muerte?.
En otras palabras cul es el NNT?. Su clculo requiere una simple regla de tres que se resuelve
dividiendo 1/RAR. En este caso 1/0.05 = 20. Por tanto la respuesta es que necesitamos tratar a 20
pacientes con el nuevo tratamiento para evitar un caso de muerte.
Este modo de presentar los resultados nos cuantifica el esfuerzo a realizar para conseguir la reduccin de
un evento desfavorable. El presentar los resultados slo como reduccin porcentual del riesgo relativo
(RRR), aunque es tcnicamente correcto, tiende a magnificar el efecto de la intervencin al describir del
mismo modo situaciones muy dispares. Dicho efecto lo podemos objetivar en la tabla 3, donde se
objetiva que la reduccin del riesgo es igual pero el NNT es completamente diferente. Cambios pequeos
en el riesgo basal absoluto de un hecho clnico infrecuente conducen a grandes cambios en el nmero de
pacientes que necesitamos tratar con la intencin de prevenir uno.
El clculo del NNT representa como ya hemos indicado el nmero de pacientes a tratar de manera
experimental a fin de evitar que uno de ellos desarrolle un resultado negativo. Es por tanto una forma
excelente de determinar la significacin clnica de un ensayo que adems sea estadsticamente
significativo. Cuanto ms reducido es NNT el efecto de la magnitud del tratamiento es mayor. Si no se
encontrase eficacia en el tratamiento la reduccin absoluta del riesgo sera cero y el NNT sera infinito.
Como sucede en las estimaciones de otros parmetros, se debe expresar el NNT con intervalos de
confianza para estimar la incertidumbre que dicho parmetro presenta
(13,14)
.
El test de significacin estadstica nos proporciona una "p" que nos permiten conocer la probabilidad de
equivocarse si rechazamos la H
o,
pero es evidente que la relevancia del fenmeno a estudiar es un
elemento clave en la toma de decisiones. Por otro lado an siendo estadsticamente significativo y
clnicamente relevante no debemos olvidar que antes

de poner en marcha una practica clnica debemos a
su vez valorar la validez externa o generalizacin de los resultados al universo de pacientes que se
pretende aplicar dicha prctica clnica.
Tabl a 1. Si nni mos de l a ex pr esi n " Est adst i cament e si gni f i cat i v o"
Rechazo de la hipt esis nula
Acept acin de la hipt esis alt ernat iva
Exist e la suficient e evidencia para dudar de la hipt esis nula
El result ado observado no es compat ible con la hipt esis nula
Es improbable obt ener un result ado como el observado si la hipt esis
nula es ciert a
Es improbable que el result ado observado sea debido al azar
Las variaciones inherent es al muest reo no bast an para explicar el
result ado observado
p < 0.05 ( si el nivel de significacin fij ado previament e es 0.05)
Las muest ras proceden de poblaciones difer ent es

Tabl a 3. Cl cul o de Ri esgo r el at i v o ( RR) , Reducci n Rel at i v a del
Ri esgo ( RRR) , Reducci n Absol ut a del Ri esgo ( RAR) y Nmer o
Necesar i o de Paci ent es a Tr at ar par a r educi r un event o ( NNT) en
si t uaci ones di f er ent es.
I nci denci a
en
Ex puest os
I nci denci a
en No
Ex puest os
RR RRR RAR NNT
( I e) ( I o) I e/ I o ( 1- RR) * 100 I o- I e 1/ RAR
8 % 10 % 0.8 20 % 0.10- 0.08 50
0.8% 1 % 0.8 20 % 0.01- 0.008 500


Tabl a 2. Er r or de t i po I y er r or de t i po I I
Real i dad
No exist e
diferencia
( Ho ciert a)
Exist e
diferencia
( Ho falsa)
Diferencia
significat iva
( Rechazo de Ho)
Error t ipo I
( )
No error
est adst i ca
Diferencia no
significat iva
( No rechazo de Ho)
No error
Error t ipo I I
( )

Bi bl i ogr af a
1. Wassertheil-Smoller S. Biostatistics and Epidemiology. A primer for health professionals. Second
edition. New York: Springer-Verlag; 1995.
2. Silva Ayaguer LC. Cultura estadstica e investigacin cientfica en el campo de la salud: una mirada
crtica. Madrid: Daz de Santos; 1997.
3. Fisher R. The design of experiments. Londres: Oliver and Boyd; 1935.
4. Jekel JF, Elmore JG, Katz DL. Epidemiology Biostatistics and Preventive Medicine.Philadelphia: W.B.
Saunders Company; 1996.
5. Daly L.E, Bourke G.J. Interpretation and Uses of Medical Statistics. Oxford: Blackwell Science Ltd;
2000.
6. Daly LE, Bourke GJ. Interpretation and uses of medical statistics. 5th ed.. Oxford: Blackwell science;
2000.
7. Sackett DL, Haynes RB , Guyatt GH, Tugwell P. Epidemiologa clnica. Ciencias bsicas para la
medicina clnica, 2 ed. Madrid: Editorial Mdica Panamericana; 1994.
8. Sackett DL, Richarson WS, Rosenberg W, Hynes RB. Evidence-based medicine: how to practice and
teach EBM. 2
nd
ed. London: Churchill-livingstone; 2000.

9. Guyatt GH, Sackett DL, Cook DJ. Usersguides to the medical literature. II. How to use an articie
about therapy or prevention. A. Are the results of the study valid? Evidence-Based Medicine Working
Group. JAMA 1993; 270: 2598-2601.
10. Laupacis A, Sackett DL, Roberts RS: An assesment of clinically useful measures of treatment. N Engl
J Med 1988; 318: 1728-1733.
11. Guyatt GH, Sackett DL, Cook DJ. Users guides to the medical literature. II. How to use an article
about therapy or prevention. B. What were the results and will they help in caring for my patients?
Evidence Based Medicine Working Group. JAMA 1994; 271: 59-63. [Medline]
12. Cook RJ, Sackett DL. The number needed to treal: a clincally useful measure of treatment effect. BMJ
1995; 310: 452-454. [Texto completo]
13. Altman DG. Confidence intervals for the nember needed to treat. BMJ 1998; 317: 1309-1312. [Texto
completo]
14. Daly LE. Confidence limits made easy: interval estimation using a subsitution method. Am J
Epidemiol 1998; 147: 783-90. [Medline]
I nvest igacin: Est adst ica descript iva de los dat os 1/ 5

Estadstica descriptiva de los datos

Pita Fernndez S, Prtega Daz, S.
Pita Fernndez, S. Uso de la estadstica y la epidemiologa en atencin primaria. En: Gil VF, Merino J,
Orozco D, Quirce F. Manual de metodologa de trabajo en atencin primaria. Universidad de Alicante.
Madrid, Jarpyo Editores, S.A. 1997; 115-161.
__________________________________
I nt r oducci n
Existen diferentes razones por las cuales los profesionales de la atencin primaria deben conocer los
fundamentos de la epidemiologa y la estadstica como instrumentos del trabajo cotidiano. Entre dichas
razones sealamos las siguientes: los trminos estadsticos y epidemiolgicos invaden la literatura
mdica, la medicina es cada vez ms cuantitativa, su conocimiento nos permitir leer la bibliografa
mdica con ms capacidad crtica para detectar errores potenciales y falacias. Nos ser tambin til para
llegar a conclusiones correctas acerca de procedimientos para el diagnstico y del resultado de las pruebas
1,2
. Su conocimiento nos permitir a su vez valorar protocolos de estudio e informes remitidos para su
publicacin y participar, en definitiva, en la investigacin mdica. Resulta imprescindible, por lo tanto,
conocer los conceptos bsicos de estadstica que nos faciliten la realizacin de estudios y conocer las
posibilidades a desarrollar con ayuda de profesionales estadsticos para mejorar dicho anlisis.
En este trabajo se pretende dar a conocer algunas nociones estadsticas que nos ayudarn a explorar y
describir, en un primer momento, nuestros datos.
Pobl aci ones y muest r as
Cuando se realiza un estudio de investigacin, se pretende generalmente inferir o generalizar resultados
de una muestra a una poblacin. Se estudia en particular a un reducido nmero de individuos a los que
tenemos acceso con la idea de poder generalizar los hallazgos a la poblacin de la cual esa muestra
procede. Este proceso de inferencia se efecta por medio de mtodos estadsticos basados en la
probabilidad.
La poblacin representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser
inaccesible. Es, en definitiva, un colectivo homogneo que rene unas caractersticas determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la poblacin accesible y limitado sobre el
que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la
poblacin ). El individuo es cada uno de los componentes de la poblacin y la muestra. La muestra debe
ser representativa de la poblacin y con ello queremos decir que cualquier individuo de la poblacin en
estudio debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos sealar
3
:
a. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
b. Como consecuencia del punto anterior ahorraremos costes.
c. Estudiar la totalidad de los pacientes o personas con una caracterstica determinada en muchas
ocasiones puede ser una tarea inaccesible o imposible de realizar.
d. Aumentar la calidad del estudio. Al disponer de ms tiempo y recursos, las observaciones y
mediciones realizadas a un reducido nmero de individuos pueden ser ms exactas y plurales
que si las tuvisemos que realizar a una poblacin.
e. La seleccin de muestras especficas nos permitir reducir la heterogeneidad de una poblacin al
indicar los criterios de inclusin y/o exclusin.


Ti pos de dat os
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensin
arterial sistlica, etctera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a
realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos adems
concretar la escala de medida que aplicaremos a cada variable.
La naturaleza de las observaciones ser de gran importancia a la hora de elegir el mtodo estadstico ms
apropiado para abordar su anlisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos
tipos
3-5
: variables cuantitativas o variables cualitativas.
a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse
numricamente. Las variables cuantitativas pueden ser de dos tipos:
o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango
numrico determinado (edad, peso, talla).
o Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (nmero de hijos, nmero de partos, nmero de
hermanos, etc).
b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a
cada caso en una de varias categoras. La situacin ms sencilla es aquella en la que se clasifica
cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos
dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificacin no es
suficiente y se requiere de un mayor nmero de categoras (color de los ojos, grupo sanguneo,
profesin, etctera).
En el proceso de medicin de estas variables, se pueden utilizar dos escalas:
o Escalas nominales: sta es una forma de observar o medir en la que los datos se ajustan
por categoras que no mantienen una relacin de orden entre s (color de los ojos, sexo,
profesin, presencia o ausencia de un factor de riesgo o enfermedad, etctera).
o Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarqua entre las
categoras (grados de disnea, estadiaje de un tumor, etctera).
Est adst i ca descr i pt i va
Una vez que se han recogido los valores que toman las variables de nuestro estudio (datos), procederemos
al anlisis descriptivo de los mismos. Para variables categricas, como el sexo o el estadiaje, se quiere
conocer el nmero de casos en cada una de las categoras, reflejando habitualmente el porcentaje que
representan del total, y expresndolo en una tabla de frecuencias.
Para variables numricas, en las que puede haber un gran nmero de valores observados distintos, se ha
de optar por un mtodo de anlisis distinto, respondiendo a las siguientes preguntas:
a. Alrededor de qu valor se agrupan los datos?
b. Supuesto que se agrupan alrededor de un nmero, cmo lo hacen? muy concentrados? muy
dispersos?
a. Medidas de tendencia central
Las medidas de centralizacin vienen a responder a la primera pregunta. La medida ms evidente que
podemos calcular para describir un conjunto de observaciones numricas es su valor medio. La media no
es ms que la suma de todos los valores de una variable dividida entre el nmero total de datos de los que
se dispone.

Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La
media de edad de estos sujetos ser de:

Ms formalmente, si denotamos por (X
1
, X
2
,...,X
n
) los n datos que tenemos recogidos de la variable en
cuestin, el valor medio vendr dado por:

Otra medida de tendencia central que se utiliza habitualmente es la mediana. Es la observacin
equidistante de los extremos.
La mediana del ejemplo anterior sera el valor que deja a la mitad de los datos por encima de dicho valor
y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el nmero de observaciones es par (10 individuos), los dos valores que
se encuentran en el medio son 60 y 60. Si realizamos el clculo de la media de estos dos valores nos dar
a su vez 60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribucin de la variable es simtrica. La media es muy sensible
a la variacin de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.
Por ltimo, otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo ste el
valor de la variable que presenta una mayor frecuencia.
En el ejemplo anterior el valor que ms se repite es 60, que es la moda.
b. Medidas de dispersin
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersin
de los mismos. Existen distintas formas de cuantificar esa variabilidad. De todas ellas, la varianza (S
2
) de
los datos es la ms utilizada. Es la media de los cuadrados de las diferencias entre cada valor de la
variable y la media aritmtica de la distribucin.

Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados y por tanto tiene
como unidades de medida el cuadrado de las unidades de medida en que se mide la variable estudiada.
En el ejemplo anterior la varianza sera:
S
x
2
=


La desviacin tpica (S) es la raz cuadrada de la varianza. Expresa la dispersin de la distribucin y se
expresa en las mismas unidades de medida de la variable. La desviacin tpica es la medida de dispersin
ms utilizada en estadstica.

Aunque esta frmula de la desviacin tpica muestral es correcta, en la prctica, la estadstica nos interesa
para realizar inferencias poblacionales, por lo que en el denominador se utiliza, en lugar de n, el valor n-1.
Por tanto, la medida que se utiliza es la cuasidesviacin tpica, dada por:

Aunque en muchos contextos se utiliza el trmino de desviacin tpica para referirse a ambas expresiones.
En los clculos del ejercicio previo, la desviacin tpica muestral, que tiene como denominador n, el valor
sera 20.678. A efectos de clculo lo haremos como n-1 y el resultado seria 21,79.
El haber cambiado el denominador de n por n-1 est en relacin al hecho de que esta segunda frmula es
una estimacin ms precisa de la desviacin estndar verdadera de la poblacin y posee las propiedades
que necesitamos para realizar inferencias a la poblacin.
Cuando se quieren sealar valores extremos en una distribucin de datos, se suele utilizar la amplitud
como medida de dispersin. La amplitud es la diferencia entre el valor mayor y el menor de la
distribucin.
Por ejemplo, utilizando los datos del ejemplo previo tendremos 80-15 =65.
Como medidas de variabilidad ms importantes, conviene destacar algunas caractersticas de la varianza y
desviacin tpica:
Son ndices que describen la variabilidad o dispersin y por tanto cuando los datos estn muy
alejados de la media, el numerador de sus frmulas ser grande y la varianza y la desviacin
tpica lo sern.
Al aumentar el tamao de la muestra, disminuye la varianza y la desviacin tpica. Para reducir a
la mitad la desviacin tpica, la muestra se tiene que multiplicar por 4.
Cuando todos los datos de la distribucin son iguales, la varianza y la desviacin tpica son
iguales a 0.
Para su clculo se utilizan todos los datos de la distribucin; por tanto, cualquier cambio de valor
ser detectado.
Otra medida que se suele utilizar es el coeficiente de variacin (CV). Es una medida de dispersin
relativa de los datos y se calcula dividiendo la desviacin tpica muestral por la media y multiplicando el
cociente por 100. Su utilidad estriba en que nos permite comparar la dispersin o variabilidad de dos o
ms grupos. As, por ejemplo, si tenemos el peso de 5 pacientes (70, 60, 56, 83 y 79 Kg) cuya media es de
69,6 kg. y su desviacin tpica (s) = 10,44 y la TAS de los mismos (150, 170, 135, 180 y 195 mmHg)
cuya media es de 166 mmHg y su desviacin tpica de 21,3. La pregunta sera: qu distribucin es ms
dispersa, el peso o la tensin arterial? Si comparamos las desviaciones tpicas observamos que la
desviacin tpica de la tensin arterial es mucho mayor; sin embargo, no podemos comparar dos variables
que tienen escalas de medidas diferentes, por lo que calculamos los coeficientes de variacin:

CV de la variable peso =

CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersin.
Cuando los datos se distribuyen de forma simtrica (y ya hemos dicho que esto ocurre cuando los valores
de su media y mediana estn prximos), se usan para describir esa variable su media y desviacin tpica.
En el caso de distribuciones asimtricas, la mediana y la amplitud son medidas ms adecuadas. En este
caso, se suelen utilizar adems los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posicin. El percentil es
el valor de la variable que indica el porcentaje de una distribucin que es igual o menor a esa cifra.
As, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de s al 80% del
total de las puntuaciones. Los cuartiles son los valores de la variable que dejan por debajo de s el 25%,
50% y el 75% del total de las puntuaciones y as tenemos por tanto el primer cuartil (Q1), el segundo (Q2)
y el tercer cuartil (Q3).
Bi bl i ogr af a
1. Sackett, D.L., Haynes, R.B., Guyatt, G.H., Tugwell, P. Epidemiologa clnica. Ciencia bsica para la
medicina clnica. 2 ed. Madrid: Mdica Panamericana; 1994.
2. Fletcher RH., Fletcher SW., Wagner E.H. Epidemiologa clnica. 2 ed. Barcelona: Masson, Williams
& Wilkins; 1998.
3. Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. 2 ed. Mxico: Editorial el Manual Moderno;
1996.
4. Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid: Interamericana M
c
Graw
Hill; 2001.
5. Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4 ed. Madrid:
NORMA; 1993.

I nvest igacin: La dist ribucin normal 1/ 12

La distribucin normal

Prtegas Daz S., Pita Fernndez S.
__________________________________
1. I nt r oducci n
Al iniciar el anlisis estadstico de una serie de datos, y despus de la etapa de deteccin y correccin de
errores, un primer paso consiste en describir la distribucin de las variables estudiadas y, en particular, de
los datos numricos. Adems de las medidas descriptivas correspondientes, el comportamiento de estas
variables puede explorarse grficamente de un modo muy simple. Consideremos, como ejemplo, los
datos de la Figura 1a, que muestra un histograma de la tensin arterial sistlica de una serie de pacientes
isqumicos ingresados en una unidad de cuidados intensivos. Para construir este tipo de grfico, se divide
el rango de valores de la variable en intervalos de igual longitud, representando sobre cada intervalo un
rectngulo con rea proporcional al nmero de datos en ese rango
1
. Uniendo los puntos medios del
extremo superior de las barras, se obtiene el llamado polgono de frecuencias. Si se observase una gran
cantidad de valores de la variable de inters, se podra construir un histograma en el que las bases de los
rectngulos fuesen cada vez ms pequeas, de modo que el polgono de frecuencias tendra una
apariencia cada vez ms suavizada, tal y como se muestra en la Figura 1b. Esta curva suave "asinttica"
representa de modo intuitivo la distribucin terica de la caracterstica observada. Es la llamada funcin
de densidad.
Una de las distribuciones tericas mejor estudiadas en los textos de bioestadstica y ms utilizada en la
prctica es la distribucin normal, tambin llamada distribucin gaussiana
2, 3, 4, 5
. Su importancia se
debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y
cotidianos siguen, aproximadamente, esta distribucin. Caracteres morfolgicos (como la talla o el peso),
o psicolgicos (como el cociente intelectual) son ejemplos de variables de las que frecuentemente se
asume que siguen una distribucin normal. No obstante, y aunque algunos autores
6, 7
han sealado que el
comportamiento de muchos parmetros en el campo de la salud puede ser descrito mediante una
distribucin normal, puede resultar incluso poco frecuente encontrar variables que se ajusten a este tipo
de comportamiento.
El uso extendido de la distribucin normal en las aplicaciones estadsticas puede explicarse, adems, por
otras razones. Muchos de los procedimientos estadsticos habitualmente utilizados asumen la normalidad
de los datos observados. Aunque muchas de estas tcnicas no son demasiado sensibles a desviaciones de
la normal y, en general, esta hiptesis puede obviarse cuando se dispone de un nmero suficiente de
datos, resulta recomendable contrastar siempre si se puede asumir o no una distribucin normal. La
simple exploracin visual de los datos puede sugerir la forma de su distribucin. No obstante, existen
otras medidas, grficos de normalidad y contrastes de hiptesis que pueden ayudarnos a decidir, de un
modo ms riguroso, si la muestra de la que se dispone procede o no de una distribucin normal. Cuando
los datos no sean normales, podremos o bien transformarlos
8
o emplear otros mtodos estadsticos que no
exijan este tipo de restricciones (los llamados mtodos no paramtricos).
A continuacin se describir la distribucin normal, su ecuacin matemtica y sus propiedades ms
relevantes, proporcionando algn ejemplo sobre sus aplicaciones a la inferencia estadstica. En la seccin
3 se describirn los mtodos habituales para contrastar la hiptesis de normalidad.
2. La Di st r i buci n Nor mal
La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754).
Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la
ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de
Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su
media y su desviacin estndar, denotadas generalmente por y . Con esta notacin, la densidad de
la normal viene dada por la ecuacin:

Ecuacin 1:

que determina la curva en forma de campana que tan bien conocemos (Figura 2). As, se dice que una
caracterstica sigue una distribucin normal de media y varianza , y se denota como
, si su funcin de densidad viene dada por la Ecuacin 1.
Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de
datos en el rango de valores correspondiente si, tal y como se muestra en la Figura 2, en el eje horizontal
se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la
probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la
curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente
hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un
dato cercano al valor medio que uno que se encuentre muy alejado de ste.
Propiedades de la distribucin normal:
La distribucin normal posee ciertas propiedades importantes que conviene destacar:
I. Tiene una nica moda, que coincide con su media y su mediana.
II. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es
tericamente posible. El rea total bajo la curva es, por tanto, igual a 1.
III. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una
probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato
menor.
IV. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una
desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad.
V. El rea bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones
estndar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un
valor comprendido en el intervalo .
VI. La forma de la campana de Gauss depende de los parmetros y (Figura 3). La media indica
la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo
largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento
de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la
curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad
de obtener datos cercanos al valor medio de la distribucin.
Como se deduce de este ltimo apartado, no existe una nica distribucin normal, sino una familia de
distribuciones con una forma comn, diferenciadas por los valores de su media y su varianza. De entre
todas ellas, la ms utilizada es la distribucin normal estndar, que corresponde a una distribucin de
media 0 y varianza 1. As, la expresin que define su densidad se puede obtener de la Ecuacin 1,
resultando:

Es importante conocer que, a partir de cualquier variable X que siga una distribucin , se puede
obtener otra caracterstica Z con una distribucin normal estndar, sin ms que efectuar la transformacin:
Ecuacin 2:


Esta propiedad resulta especialmente interesante en la prctica, ya que para una distribucin
existen tablas publicadas (Tabla 1) a partir de las que se puede obtener de modo sencillo la probabilidad
de observar un dato menor o igual a un cierto valor z, y que permitirn resolver preguntas de probabilidad
acerca del comportamiento de variables de las que se sabe o se asume que siguen una distribucin
aproximadamente normal.
Consideremos, por ejemplo, el siguiente problema: supongamos que se sabe que el peso de los sujetos de
una determinada poblacin sigue una distribucin aproximadamente normal, con una media de 80 Kg y
una desviacin estndar de 10 Kg. Podremos saber cul es la probabilidad de que una persona, elegida
al azar, tenga un peso superior a 100 Kg?
Denotando por X a la variable que representa el peso de los individuos en esa poblacin, sta sigue una
distribucin . Si su distribucin fuese la de una normal estndar podramos utilizar la Tabla 1
para calcular la probabilidad que nos interesa. Como ste no es el caso, resultar entonces til
transformar esta caracterstica segn la Ecuacin 2, y obtener la variable:

para poder utilizar dicha tabla. As, la probabilidad que se desea calcular ser:

Como el rea total bajo la curva es igual a 1, se puede deducir que:

Esta ltima probabilidad puede ser fcilmente obtenida a partir de la Tabla 1, resultando ser
. Por lo tanto, la probabilidad buscada de que una persona elegida aleatoriamente
de esa poblacin tenga un peso mayor de 100 Kg , es de 10.9772=0.0228, es decir, aproximadamente de
un 2.3%.
De modo anlogo, podemos obtener la probabilidad de que el peso de un sujeto est entre 60 y 100 Kg:

De la Figura 2, tomando a=-2 y b=2, podemos deducir que:

Por el ejemplo previo, se sabe que . Para la segunda probabilidad, sin embargo,
encontramos el problema de que las tablas estndar no proporcionan el valor de para valores
negativos de la variable. Sin embargo, haciendo uso de la simetra de la distribucin normal, se tiene que:


Finalmente, la probabilidad buscada de que una persona elegida al azar tenga un peso entre 60 y 100 Kg.,
es de 0.9772-0.0228=0.9544, es decir, aproximadamente de un 95%. Resulta interesante comprobar que
se obtendra la misma conclusin recurriendo a la propiedad (III) de la distribucin normal.
No obstante, es fcil observar que este tipo de situaciones no corresponde a lo que habitualmente nos
encontramos en la prctica. Generalmente no se dispone de informacin acerca de la distribucin terica
de la poblacin, sino que ms bien el problema se plantea a la inversa: a partir de una muestra extrada al
azar de la poblacin que se desea estudiar, se realizan una serie de mediciones y se desea extrapolar los
resultados obtenidos a la poblacin de origen. En un ejemplo similar al anterior, supongamos que se
dispone del peso de n=100 individuos de esa misma poblacin, obtenindose una media muestral de
Kg, y una desviacin estndar muestral Kg, querramos extraer alguna conclusin
acerca del valor medio real de ese peso en la poblacin original. La solucin a este tipo de cuestiones se
basa en un resultado elemental de la teora estadstica, el llamado teorema central del lmite. Dicho
axioma viene a decirnos que las medias de muestras aleatorias de cualquier variable siguen ellas mismas
una distribucin normal con igual media que la de la poblacin y desviacin estndar la de la poblacin
dividida por . En nuestro caso, podremos entonces considerar la media muestral
,
con lo cual, a partir de la propiedad (III) se conoce que aproximadamente un 95% de los posibles valores
de caeran dentro del intervalo
.
Puesto que los valores de y son desconocidos, podramos pensar en aproximarlos por sus anlogos
muestrales, resultando . Estaremos, por lo tanto, un
95% seguros de que el peso medio real en la poblacin de origen oscila entre 75.6 Kg y 80.3 Kg. Aunque
la teora estadstica subyacente es mucho ms compleja, en lneas generales ste es el modo de construir
un intervalo de confianza para la media de una poblacin.
3. Cont r ast es de Nor mal i dad
La verificacin de la hiptesis de normalidad resulta esencial para poder aplicar muchos de los
procedimientos estadsticos que habitualmente se manejan. Tal y como ya se apuntaba antes, la simple
exploracin visual de los datos observados mediante, por ejemplo, un histograma o un diagrama de cajas,
podr ayudarnos a decidir si es razonable o no el considerar que proceden de una caracterstica de
distribucin normal. Como ejemplo, consideremos los histogramas que se muestran en la Figura 4a,
correspondientes a una muestra de 100 mujeres de las que se determin su peso y edad. Para el caso del
peso, la distribucin se asemeja bastante a la de una normal. P ara la edad, sin embargo, es claramente
asimtrica y diferente de la gaussiana.
Resulta obvio que este tipo de estudio no puede llevarnos sino a obtener una opinin meramente subjetiva
acerca de la posible distribucin de nuestros datos, y que es necesario disponer de otros mtodos ms
rigurosos para contrastar este tipo de hiptesis. En primer lugar, deberemos plantearnos el saber si los
datos se distribuyen de una forma simtrica con respecto a su media o presentan algn grado de asimetra,
pues es sta una de las caractersticas fundamentales de la distribucin de Gauss. Aunque la simetra de
la distribucin pueda valorarse, de modo simple, atendiendo a algunas medidas descriptivas de la variable
en cuestin
8
(comparando, por ejemplo, los valores de media, mediana y moda), resultar til disponer de
algn ndice que nos permita cuantificar cualquier desviacin. Si se dispone de una muestra de tamao n,
de una caracterstica X, se define el coeficiente de asimetra de Fisher como:


a partir del cual podemos considerar que una distribucin es simtrica ( =0), asimtrica hacia la
izquierda ( <0) o hacia la derecha ( >0). En segundo lugar, podemos preguntarnos si la curva es ms o
menos "aplastada", en relacin con el grado de apuntamiento de una distribucin gaussiana. El
coeficiente de aplastamiento o curtosis de Fisher, dado por:

permite clasificar una distribucin de frecuencias en mesocrtica (tan aplanada como una normal,
), leptocrtica (ms apuntada que una normal, ) o platicrtica (ms aplanada que una
normal, ).
Siguiendo con los ejemplos anteriores, y tal y como caba esperar, el coeficiente de asimetra toma un
valor mayor para la distribucin de la edad ( ) que para el peso observado ( ).
En cuanto a los niveles de curtosis, no hay apenas diferencias, siendo de 0.320 para el peso y de 0.366
para la edad.
Los grficos de probabilidad normal constituyen otra importante herramienta grfica para comprobar si
un conjunto de datos puede considerarse o no procedente de una distribucin normal. La idea bsica
consiste en enfrentar, en un mismo grfico, los datos que han sido observados frente a los datos tericos
que se obtendran de una distribucin gaussiana. Si la distribucin de la variable coincide con la normal,
los puntos se concentrarn en torno a una lnea recta, aunque conviene tener en cuenta que siempre
tender a observarse mayor variabilidad en los extremos (Figura 4a, datos del peso). En los grficos P-P
se confrontan las proporciones acumuladas de una variable con las de una distribucin normal. Los
grficos Q-Q se obtienen de modo anlogo, esta vez representando los cuantiles respecto a los cuantiles
de la distribucin normal. Adems de permitir valorar la desviacin de la normalidad, los grficos de
probabilidad permiten conocer la causa de esa desviacin. Una curva en forma de "U" o con alguna
curvatura, como en el caso de la edad en la Figura 4b, significa que la distribucin es asimtrica con
respecto a la gaussiana, mientras que un grfico en forma de "S" significar que la distribucin tiene colas
mayores o menores que la normal, esto es, que existen pocas o demasiadas observaciones en las colas de
la distribucin.
Parece lgico que cada uno de estos mtodos se complemente con procedimientos de anlisis que
cuantifiquen de un modo ms exacto las desviaciones de la distribucin normal. Existen distintos tests
estadsticos que podemos utilizar para este propsito. El test de Kolmogorov-Smirnov es el ms
extendido en la prctica. Se basa en la idea de comparar la funcin de distribucin acumulada de los
datos observados con la de una distribucin normal, midiendo la mxima distancia entre ambas curvas.
Como en cualquier test de hiptesis, la hiptesis nula se rechaza cuando el valor del estadstico supera un
cierto valor crtico que se obtiene de una tabla de probabilidad. Dado que en la mayora de los paquetes
estadsticos, como el SPSS, aparece programado dicho procedimiento, y proporciona tanto el valor del
test como el p-valor correspondiente, no nos detendremos ms en explicar su clculo. Existen
modificaciones de este test, como el de Anderson-Darling que tambin pueden ser utilizados. Otro
procedimiento muy extendido es tambin el test chi-cuadrado de bondad de ajuste. No obstante, este tipo
de procedimientos deben ser utilizados con precaucin. Cuando se dispone de un nmero suficiente de
datos, cualquier test ser capaz de detectar diferencias pequeas an cuando estas no sean relevantes para

la mayor parte de los propsitos. El test de Kolmogorov-Smirnov, en este sentido, otorga un peso menor
a las observaciones extremas y por la tanto es menos sensible a las desviaciones que normalmente se
producen en estos tramos.
Para acabar, observemos el resultado de aplicar el test de Kolmogorov-Smirnov a los datos de la Figura
4. Para el caso del peso, el valor del estadstico proporcionado por dicho test fue de 0.705, con un p-valor
correspondiente de p=0.702 que, al no ser significativo, indica que podemos asumir una distribucin
normal. Por otra parte, para el caso de la edad, en el que la distribucin muestral era mucho ms
asimtrica, el mismo test proporcion un valor de 1.498, con p=0.022, lo que obligara a rechazar en este
caso la hiptesis de una distribucin gaussiana.
Recur sos r el aci onados en I nt er net
Normal Density Plotter (UCLA Department of Statistic)
Pgina que permite obtener la representacin grfica de la densidad de una distribucin normal
de media y desviacin estndar dados por el usuario.
SurfStat Statistical Tables - Standard Normal Distribution (University of Newcastle)
Pgina que permite calcular, a partir de una distribucin normal estndar, la probabilidad
acumulada hasta un cierto valor, o la probabilidad de tomar un valor en un intervalo. As mismo,
permite realizar los clculos inversos, es decir, obtener el p-cuantil de una distribucin normal
estndar.
Normal Density Calculator (UCLA Department of Statistic)
Permite obtener, bajo una distribucin normal, la probabilidad de observar un valor mayor o
igual que uno dado. La ventaja es que permite hacerlo no slo para la distribucin normal
estndar, sino para valores de la media y desviacin estndar dados por el usuario.
Matt's spiffy normal plot maker (UCLA Department of Statistic)
Se introducen los datos de la variable de interes y produce el grfico Q-Q de probabilidad
normal correspondiente, que puede ser fcilmente exportado a otros programas.
Calculation of 95% Confidence Interval on a Sample Mean (Arizona State University)
A partir del valor de la media y la desviacin estndar muestral, calcula el 95% intervalo de
confianza para la media poblacional.
Bi bl i ogr af a
1. Prtega Daz S, Pita Fernndez S. Representacin grfica en el anlisis de datos. Cad Aten
Primaria 2001; 8: 112-117.
2. Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman &
Hall; 1997.
3. Daniel WW. Bioestadstica. Base para el anlisis de las ciencias de la salud. Mexico: Limusa;
1995.
4. Elston RC, Johnson WD. Essentials of Biostatistics. Philadelphia: F.A. Davis Company; 1987.
5. Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ 1995; 310: 298-298.
[Texto completo]
6. Elveback LR, Guilliver CL, Keating FR Jr. Health, Normality and the Gosth of Gauss. JAMA
1970; 211: 69-75. [Medline]
7. Nelson JC, Haynes E, Willard R, Kuzma J. The Distribution of Eurhyroid Serum Protein-Bound
Iodine Levels. JAMA 1971; 216: 1639-1641. [Medline]
8. Altman DG, Bland JM. Statistics notes: Detecting skewness from summary information. BMJ
1996; 313: 1200-1200. [Texto completo]
9. Bland JM, Altman DG. Statistics Notes: Transforming data. BMJ 1996; 312: 770. [Texto
completo]


Fi gur a 1. Hi st ogr ama de l os val or es de t ensi n ar t er i al si st l i ca par a
dos muest r as de paci ent es i squmi cos i ngr esados en una uni dad de
cui dados i nt ensi v os.
Fi gur a 1a.- Val or es de t ensi n ar t er i al si st l i ca en una muest r a de
1000 paci ent es i squmi cos i ngr esados en UCI .

Fi gur a 1b.- Val or es de t ensi n ar t er i al si st l i ca de una muest r a de
5000 paci ent es i ngr esados en UCI .


Fi gur a 2. Gr f i ca de una di st r i buci n nor mal y si gni f i cado del r ea
baj o l a cur va.


Tabl a 1. r eas baj o l a cur va nor mal est ndar . Los v al or es de l a t abl a
que no se muest r an en negr i t a r epr esent an l a pr obabi l i dad de
obser var un val or menor o i gual a z. La ci f r a ent er a y el pr i mer
deci mal de z se buscan en l a pr i mer a col umna, y el segundo deci mal
en l a cabecer a de l a t abl a.

Segunda ci f r a deci mal del val or de z
z 0. 00 . 01 . 02 . 03 . 04 . 05 . 06 . 07 . 08 . 09
0. 0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0. 1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0. 2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0. 3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
0. 4 .6554 .6591 .6628 .6664 .6700 .6736 .6772 .6808 .6844 .6879
0. 5 .6915 .6950 .6985 .7019 .7054 .7088 .7123 .7157 .7190 .7224
0. 6 .7257 .7291 .7324 .7357 .7389 .7422 .7454 .7486 .7517 .7549
0. 7 .7580 .7611 .7642 .7673 .7704 .7734 .7764 .7794 .7823 .7852
0. 8 .7881 .7910 .7939 .7967 .7995 .8023 .8051 .8078 .8106 .8133
0. 9 .8159 .8186 .8212 .8238 .8264 .8289 .8315 .8340 .8365 .8389
1. 0 .8413 .8438 .8461 .8485 .8508 .8531 .8554 .8577 .8599 .8621
1. 1 .8643 .8665 .8686 .8708 .8729 .8749 .8770 .8790 .8810 .8830
1. 2 .8849 .8869 .8888 .8907 .8925 .8944 .8962 .8980 .8997 .9015
1. 3 .9032 .9049 .9066 .9082 .9099 .9115 .9131 .9147 .9162 .9177
1. 4 .9192 .9207 .9222 .9236 .9251 .9265 .9279 .9292 .9306 .9319
1. 5 .9332 .9345 .9357 .9370 .9382 .9394 .9406 .9418 .9429 .9441
1. 6 .9452 .9463 .9474 .9484 .9495 .9505 .9515 .9525 .9535 .9545
1. 7 .9554 .9564 .9573 .9582 .9591 .9599 .9608 .9616 .9625 .9633
1. 8 .9641 .9649 .9656 .9664 .9671 .9678 .9686 .9693 .9699 .9706
1. 9 .9713 .9719 .9726 .9732 .9738 .9744 .9750 .9756 .9761 .9767
2. 0 .9772 .9778 .9783 .9788 .9793 .9798 .9803 .9808 .9812 .9817
2. 1 .9821 .9826 .9830 .9834 .9838 .9842 .9846 .9850 .9854 .9857
2. 2 .9861 .9864 .9868 .9871 .9875 .4878 .9881 .9884 .9887 .9890
2. 3 .9893 .9896 .9898 .9901 .9904 .9906 .9909 .9911 .9913 .9916
2. 4 .9918 .9920 .9922 .9925 .9927 .9929 .9931 .9932 .9934 .9936
2. 5 .9938 .9940 .9941 .9943 .9945 .9946 .9948 .9949 .9951 .9952
2. 6 .9953 .9955 .9956 .9957 .9959 .9960 .9961 .9962 .9963 .9964
2. 7 .9965 .9966 .9967 .9968 .9969 .9970 .9971 .9972 .9973 .9974
2. 8 .9974 .9975 .9976 .9977 .9977 .9978 .9979 .9979 .9980 .9981
2. 9 .9981 .9982 .9982 .9983 .9984 .9984 .9985 .9985 .9986 .9986
3. 0 .9987 .9987 .9987 .9988 .9988 .9989 .9989 .9989 .9990 .9990
3. 1 .9990 .9991 .9991 .9991 .9992 .9992 .9992 .9992 .9993 .9993
3. 2 .9993 .9993 .9994 .9994 .9994 .9994 .9994 .9995 .9995 .9995
3. 3 .9995 .9995 .9995 .9996 .9996 .9996 .9996 .9996 .9996 .9997
3. 4 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9997 .9998


Fi gur a 3. Ej empl os de di st r i buci ones nor mal es con di f er ent es par met r os.



Fi gur a 4. Hi st ogr amas y gr f i cos de pr obabi l i dad nor mal de l os
v al or es de peso y edad en dos muest r as de paci ent es.
Fi gur a 4a. - Hi st ogr amas

Fi gur a 4b. - Gr f i cos Q- Q de pr obabi l i dad.


I nvest igacin: Repr esent acin grfica en el anlisis de dat os 1/ 11

Representacin grfica en el Anlisis de Datos

Prtega Daz S., Pita Fernndez S.
_______________________________
La realizacin de los estudios clnico-epidemiolgicos implica finalmente emitir unos resultados
cuantificables de dicho estudio o experimento. La claridad de dicha presentacin es de vital importancia
para la comprensin de los resultados y la interpretacin de los mismos. A la hora de representar los
resultados de un anlisis estadstico de un modo adecuado, son varias las publicaciones que podemos
consultar
1
. Aunque se aconseja que la presentacin de datos numricos se haga habitualmente por medio
de tablas, en ocasiones un diagrama o un grfico pueden ayudarnos a representar de un modo ms
eficiente nuestros datos.
En este artculo se abordar la representacin grfica de los resultados de un estudio, constatando su
utilidad en el proceso de anlisis estadstico y la presentacin de datos. Se describirn los distintos tipos
de grficos que podemos utilizar y su correspondencia con las distintas etapas del proceso de anlisis.
Anl i si s descr i pt i v o.
Cuando se dispone de datos de una poblacin, y antes de abordar anlisis estadsticos ms complejos, un
primer paso consiste en presentar esa informacin de forma que sta se pueda visualizar de una manera
ms sistemtica y resumida. Los datos que nos interesan dependen, en cada caso, del tipo de variables que
estemos manejando
2
.
Para variables categricas
3
, como el sexo, estadio TNM, profesin, etc., se quiere conocer la frecuencia
y el porcentaje del total de casos que "caen" en cada categora. Una forma muy sencilla de representar
grficamente estos resultados es mediante diagramas de barras o diagramas de sectores. En los grficos
de sectores, tambin conocidos como diagramas de "tartas", se divide un crculo en tantas porciones
como clases tenga la variable, de modo que a cada clase le corresponde un arco de crculo proporcional a
su frecuencia absoluta o relativa. Un ejemplo se muestra en la Figura 1. Como se puede observar, la
informacin que se debe mostrar en cada sector hace referencia al nmero de casos dentro de cada
categora y al porcentaje del total que estos representan. Si el nmero de categoras es excesivamente
grande, la imagen proporcionada por el grfico de sectores no es lo suficientemente clara y por lo tanto la
situacin ideal es cuando hay alrededor de tres categoras. En este caso se pueden apreciar con claridad
dichos subgrupos.
Los diagramas de barras son similares a los grficos de sectores. Se representan tantas barras como
categoras tiene la variable, de modo que la altura de cada una de ellas sea proporcional a la frecuencia o
porcentaje de casos en cada clase (Figura 2). Estos mismos grficos pueden utilizarse tambin para
describir variables numricas discretas que toman pocos valores (nmero de hijos, nmero de recidivas,
etc.).
Para variables numricas continuas, tales como la edad, la tensin arterial o el ndice de masa corporal,
el tipo de grfico ms utilizado es el histograma. Para construir un grfico de este tipo, se divide el rango
de valores de la variable en intervalos de igual amplitud, representando sobre cada intervalo un rectngulo
que tiene a este segmento como base. El criterio para calcular la altura de cada rectngulo es el de
mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada intervalo y
el rea de los rectngulos. Como ejemplo, la Tabla I muestra la distribucin de frecuencias de la edad de
100 pacientes, comprendida entre los 18 y 42 aos. Si se divide este rango en intervalos de dos aos, el
primer tramo est comprendido entre los 18 y 19 aos, entre los que se encuentra el 4/100=4% del total.
Por lo tanto, la primera barra tendr altura proporcional a 4. Procediendo as sucesivamente, se construye
el histograma que se muestra en la Figura 3. Uniendo los puntos medios del extremo superior de las
barras del histograma, se obtiene una imagen que se llama polgono de frecuencias. Dicha figura
pretende mostrar, de la forma ms simple, en qu rangos se encuentra la mayor parte de los datos. Un
ejemplo, utilizando los datos anteriores, se presenta en la Figura 4.

Otro modo habitual, y muy til, de resumir una variable de tipo numrico es utilizando el concepto de
percentiles, mediante diagramas de cajas
4,5
. La Figura 5 muestra un grfico de cajas correspondiente a
los datos de la Tabla I. La caja central indica el rango en el que se concentra el 50% central de los datos.
Sus extremos son, por lo tanto, el 1
er
y 3
er
cuartil de la distribucin. La lnea central en la caja es la
mediana. De este modo, si la variable es simtrica, dicha lnea se encontrar en el centro de la caja. Los
extremos de los "bigotes" que salen de la caja son los valores que delimitan el 95% central de los datos,
aunque en ocasiones coinciden con los valores extremos de la distribucin. Se suelen tambin representar
aquellas observaciones que caen fuera de este rango (outliers o valores extremos). Esto resulta
especialmente til para comprobar, grficamente, posibles errores en nuestros datos. En general, los
diagramas de cajas resultan ms apropiados para representar variables que presenten una gran
desviacin de la distribucin normal. Como se ver ms adelante, resultan adems de gran ayuda cuando
se dispone de datos en distintos grupos de sujetos.
Por ltimo, y en lo que respecta a la descripcin de los datos, suele ser necesario, para posteriores
anlisis, comprobar la normalidad de alguna de las variables numricas de las que se dispone. Un
diagrama de cajas o un histograma son grficos sencillos que permiten comprobar, de un modo puramente
visual, la simetra y el "apuntamiento" de la distribucin de una variable y, por lo tanto, valorar su
desviacin de la normalidad. Existen otros mtodos grficos especficos para este propsito, como son los
grficos P-P o Q-Q. En los primeros, se confrontan las proporciones acumuladas de una variable con las
de una distribucin normal. Si la variable seleccionada coincide con la distribucin de prueba, los puntos
se concentran en torno a una lnea recta. Los grficos Q-Q se obtienen de modo anlogo, esta vez
representando los cuantiles de distribucin de la variable respecto a los cuantiles de la distribucin
normal. En la Figura 6 se muestra el grfico P-P correspondientes a los datos de la Tabla I que sugiere, al
igual que el correspondiente histograma y el diagrama de cajas, que la distribucin de la variable se aleja
de la normalidad.
Compar aci n de dos o ms gr upos.
Cuando se quieren comparar las observaciones tomadas en dos o ms grupos de individuos una vez ms
el mtodo estadstico a utilizar, as como los grficos apropiados para visualizar esa relacin, dependen
del tipo de variables que estemos manejando.
Cuando se trabaja con dos variables cualitativas podemos seguir empleando grficos de barras o de
sectores. Podemos querer determinar, por ejemplo, si en una muestra dada, la frecuencia de sujetos que
padecen una enfermedad coronaria es ms frecuente en aquellos que tienen algn familiar con
antecedentes cardiacos. A partir de dicha muestra podemos representar, como se hace en la Figura 7, dos
grupos de barras: uno para los sujetos con antecedentes cardiacos familiares y otro para los que no tienen
este tipo de antecedentes. En cada grupo, se dibujan dos barras representando el porcentaje de pacientes
que tienen o no alguna enfermedad coronaria. No se debe olvidar que cuando los tamaos de las dos
poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso el grfico
podra resultar engaoso.
Por otro lado, la comparacin de variables continuas en dos o ms grupos se realiza habitualmente en
trminos de su valor medio, por medio del test t de Student, anlisis de la varianza o mtodos no
paramtricos equivalentes, y as se ha de reflejar en el tipo de grfico utilizado. En este caso resulta muy
til un diagrama de barras de error, como en la Figura 8. En l se compara el ndice de masa corporal
en una muestra de hombres y mujeres. Para cada grupo, se representa su valor medio, junto con su 95%
intervalo de confianza. Conviene recordar que el hecho de que dichos intervalos no se solapen, no implica
necesariamente que la diferencia entre ambos grupos pueda ser estadsticamente significativa, pero s nos
puede servir para valorar la magnitud de la misma. As mismo, para visualizar este tipo de asociaciones,
pueden utilizarse dos diagramas de cajas, uno para cada grupo. Estos diagramas son especialmente tiles
aqu: no slo permiten ver si existe o no diferencia entre los grupos, sino que adems nos permiten
comprobar la normalidad y la variabilidad de cada una de las distribuciones. No olvidemos que las
hiptesis de normalidad y homocedasticidad son condiciones necesarias para aplicar algunos de los
procedimientos de anlisis paramtricos.
Por ltimo, sealar que tambin en esta situacin pueden utilizarse los ya conocidos grficos de barras,
representando aqu como altura de cada barra el valor medio de la variable de inters. Los grficos de
lneas pueden resultar tambin especialmente interesantes, sobre todo cuando interesa estudiar tendencias

a lo largo del tiempo (Figura 9). No son ms que una serie de puntos conectados entre s mediante rectas,
donde cada punto puede representar distintas cosas segn lo que nos interese en cada momento (el valor
medio de una variable, porcentaje de casos en una categora, el valor mximo en cada grupo, etc).
Rel aci n ent r e dos var i abl es numr i cas.
Cuando lo que interesa es estudiar la relacin entre dos variables continuas, el mtodo de anlisis
adecuado es el estudio de la correlacin. Los coeficientes de correlacin (Pearson, Spearman, etc.)
valoran hasta qu punto el valor de una de las variables aumenta o disminuye cuando crece el valor de la
otra. Cuando se dispone de todos los datos, un modo sencillo de comprobar, grficamente, si existe una
correlacin alta, es mediante diagramas de dispersin, donde se confronta, en el eje horizontal, el valor
de una variable y en el eje vertical el valor de la otra. Un ejemplo sencillo de variables altamente
correlacionados es la relacin entre el peso y la talla de un sujeto. Partiendo de una muestra arbitraria,
podemos construir el diagrama de dispersin de la Figura 10. En l puede observarse claramente como
existe una relacin directa entre ambas variables, y valorar hasta qu punto dicha relacin puede
modelizarse por la ecuacin de una recta. Este tipo de grficos son, por lo tanto, especialmente tiles en la
etapa de seleccin de variables cuando se ajusta un modelo de regresin lineal.
Ot r os gr f i cos.
Los tipos de grficos mostrados hasta aqu son los ms sencillos que podemos manejar, pero ofrecen
grandes posibilidades para la representacin de datos y pueden ser utilizados en mltiples situaciones,
incluso para representar los resultados obtenidos por mtodos de anlisis ms complicados. Podemos
utilizar, por ejemplo, dos diagramas de lneas superpuestos para visualizar los resultados de un anlisis de
la varianza con dos factores (Figura 11). Un diagrama de dispersin es el mtodo adecuado para valorar
el resultado de un modelo de regresin logstica (Figura 12). Existen incluso algunos anlisis concretos
que estn basados completamente en la representacin grfica. En particular, la elaboracin de curvas
ROC (Figura 13) y el clculo del rea bajo la curva constituyen el mtodo ms apropiado para valorar la
exactitud de una prueba diagnstica.
Hemos visto, por lo tanto, como la importancia y utilidad que las representaciones grficas pueden
alcanzar en el proceso de anlisis de datos. La mayora de los textos estadsticos y epidemiolgicos
4

hacen hincapi en los distintos tipos de grficos que se pueden crear, como una herramienta
imprescindible en la presentacin de resultados y el proceso de anlisis estadstico. No obstante, es difcil
precisar cundo es ms apropiado utilizar un grfico que una tabla. Ms bien podremos considerarlos dos
modos distintos pero complementarios de visualizar los mismos datos. La creciente utilizacin de
distintos programas informticos hace especialmente sencillo la obtencin de las mismas. La mayora de
los paquetes estadsticos (SPSS, STATGRAPHICS, S-PLUS, EGRET,...) ofrecen grandes posibilidades
en este sentido. Adems de los grficos vistos, es posible elaborar otros grficos, incluso
tridimensionales, permitiendo grandes cambios en su apariencia y facilidad de exportacin a otros
programas para presentar finalmente los resultados del estudio.


Fi gur a 1. Ej empl o de gr f i co de sect or es. Di st r i buci n de una muest r a de
paci ent es segn el hbi t o de f umar .

Fi gur a 2. Ej empl o de gr f i co de bar r as. Est adi o TNM en el cncer gst r i co.


Tabl a I . Di st r i buci n de f r ecuenci as
de l a edad en 100 paci ent es.
Edad N de paci ent es
18 1
19 3
20 4
21 7
22 5
23 8
24 10
25 8
26 9
27 6
28 6
29 4
30 3
31 4
32 5
33 3
34 2
35 3
36 1
37 2
38 3
39 1
41 1
42 1

Fi gur a 3. Ej empl o de un hi st ogr ama cor r espondi ent e a l os dat os de l a Tabl a I .


Fi gur a 4. Pol gono de f r ecuenci as par a l os dat os de l a Tabl a I .

Fi gur a 5. Ej empl o de un di agr ama de caj a cor r espondi ent e a l o dat os en l a Tabl a I .


Fi gur a 6. Gr f i co P- P de nor mal i dad par a l os dat os de l a Tabl a I .

Fi gur a 7. Di agr ama de bar r as agr upadas. Rel aci n ent r e l a pr esenci a de al guna
enf er medad cor onar i a y l os ant ecedent es car di acos f ami l i ar es en una muest r a.


Fi gur a 8. Bar r as de er r or . Var i aci n en el ndi ce de masa cor por al segn el sex o.

Fi gur a 9. Gr f i co de l neas. Nmer o de paci ent es t r aspl ant ados r enal es en el
Compl ex o Hospi t al ar i o " Juan Canal ej o" dur ant e el per i odo 1981- 1997.


Fi gur a 10. Di agr ama de di sper si n ent r e l a t al l a y el peso de una muest r a de
i ndi v i duos.

Fi gur a 11. Dos di agr amas de l neas super puest os. Var i aci n en el peso medi o de
una muest r a de r eci n naci dos segn el cont r ol gi necol gi co del embar azo y el
hbi t o de f umar de l a madr e.



Fi gur a 12. Di agr ama de di sper si n ( r egr esi n l ogst i ca) . Pr obabi l i dad de padecer
ci r r osi s hept i ca, segn un model o de r egr esi n l ogst i ca aj ust ando por el % de
pr ot r ombi na y el pr esent ar o no hepat omegal i a.


Fi gur a 13. Cur va ROC par a el por cent aj e de pr ot r ombi na en l a pr edi cci n de
ci r r osi s.

Bi bl i ogr af a
1. Lang TA, Secic M. How to report statistics in medicine. Annotated Guidelines for authors, Editors, and
reviewers. Philadelphia: Port City Press; 1997.
2. Altman DG, Bland JM. Statistics Notes: Presentation of numerical data. BMJ 1996; 312: 572.
[Medline] [texto completo]
3. Singer PA, Feinstein AR. Graphical display of categorical data. J Clin Epidemiol 1993; 46(3): 231-6.
[Medline]
4. Simpson RJ, Johnson TA, Amara IA. The box-plot: an exploratory analysis for biomedical
publications. Am Heart J 1988; 116 (6 Part 1): 1663-5. [Medline]
5. Williamson DF, Parker RA, Kendrick JS. The box plot: a simple visual method to interpret data. Ann
Intern Med 1989; 110 (11): 916-21. [Medline]
6.Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman & Hall;
1997.

I nvest igacin: Mt odos paramt ricos para la comparacin de dos medias. t de St udent 1/ 9

Mtodos paramtricos para la comparacin de dos medias. t de Student

________________________________________
En muchos estudios, incluidos la mayora de los ensayos clnicos, es necesario comparar ciertas
caractersticas en dos o ms grupos de sujetos. Tal sera el caso, por ejemplo, si pensamos que un
tratamiento nuevo puede tener un porcentaje de mejora mayor que otro estndar, o cuando nos
planteamos si los nios de las distintas comunidades autnomas tienen o no la misma altura. En este
artculo se analizar nicamente el problema de la comparacin de dos grupos con respecto a una variable
continua. La eleccin de un mtodo de anlisis apropiado en este caso depender de la naturaleza de los
datos y la forma en la que estos hayan sido obtenidos. Fundamentalmente, cuando se comparan dos o ms
grupos de observaciones pueden darse dos tipos de diseo: aquel en el que las observaciones se refieren a
dos grupos independientes de individuos, o el caso en el que cada serie de datos se recoge en los mismos
sujetos bajo condiciones diferentes. El tipo de metodologa ser distinto segn el caso en el que nos
encontremos. Otro aspecto a tener en consideracin ser el tipo y distribucin de los datos. Para grupos
independientes, los mtodos paramtricos requieren que las observaciones en cada grupo provengan de
una distribucin aproximadamente normal con una variabilidad semejante, de modo que si los datos
disponibles no verifican tales condiciones, puede resultar til una transformacin
(1,2,3)
de los mismos
(aplicacin del logaritmo, raz cuadrada, etc.) o, en todo caso, se debera recurrir a la utilizacin de
procedimientos no paramtricos
(4)
.
Normalmente en este tipo de anlisis podremos establecer una hiptesis de partida (hiptesis nula), que
generalmente asume que el efecto de inters es nulo, por ejemplo que la tensin arterial es la misma en
hombres y mujeres o que dos tratamientos para la hipercolesterolemia son igualmente efectivos.
Posteriormente se puede evaluar la probabilidad de haber obtenido los datos observados si esa hiptesis es
correcta. El valor de esta probabilidad coincide con el valor-p que nos proporciona cada test estadstico,
de modo que cuanto menor sea ste ms improbable resulta que la hiptesis inicial se verifique.
En un primer apartado, se presentar el test t de Student para dos muestras independientes, introduciendo
las modificaciones necesarias en el caso de que la variabilidad de ambos grupos sea distinta. A
continuacin se introducir el test t de Student para el caso de dos muestras dependientes.
Dos muest r as i ndependi ent es.
Uno de los anlisis estadsticos ms comunes en la prctica es probablemente el utilizado para comparar
dos grupos independientes de observaciones con respecto a una variable numrica. Como ejemplo,
consideremos los datos que se muestran en la Tabla 1, correspondientes a 75 individuos con sobrepeso
sometidos a dos dietas alimenticias distintas, de modo que se desea comparar el peso de los individuos
que iniciaron cada una de las dietas.
Como ya se ha adelantado, la aplicacin de un contraste paramtrico requiere la normalidad de las
observaciones para cada uno de los grupos. La comprobacin de esta hiptesis puede realizarse tanto por
mtodos grficos (por medio de histogramas, diagramas de cajas o grficos de normalidad) como
mediante tests estadsticos
(5)
(test de Kolmogorov-Smirnov, test de Shapiro-Wilks). Un nmero suficiente
de observaciones (digamos mayor de 30) como ocurre en el ejemplo planteado justifica, no obstante, la
utilizacin del mismo test. As mismo, este tipo de metodologa exigir que la varianza en ambos grupos
de observaciones sea la misma. En primer lugar se desarrollar el test t de Student para el caso en el que
se verifiquen ambas condiciones, discutiendo posteriormente el modo de abordar formalmente el caso en
el que las varianzas no sean similares.
Bajo las hiptesis de normalidad e igual varianza la comparacin de ambos grupos puede realizarse en
trminos de un nico parmetro como el valor medio (Figura 1a), de modo que en el ejemplo planteado la
hiptesis de partida ser, por lo tanto:
H
0
: La media de peso inicial es igual en ambos grupos

Se denotar por {X
1
, X
2
,...,X
n
} e {Y
1
,Y
2
,...,Y
m
} al peso observado en cada uno de los sujetos sometidos a la
dieta A y a la dieta B respectivamente. En general no se exigir que coincida el nmero de observaciones
en cada uno de los grupos que se comparan, de modo que en el ejemplo n=40 y m=35.
El t test para dos muestras independientes se basa en el estadstico:
(1)
donde e denotan el peso medio en cada uno de los grupos:

y , las cuasivarianzas muestrales correspondientes:

Con lo cual, en este caso particular, el valor utilizado para el contraste ser:

Si la hiptesis de partida es cierta el estadstico (1) seguir una distribucin t de Student con n+m-2
grados de libertad. De ser as, el valor obtenido debera estar dentro del rango de mayor probabilidad
segn esta distribucin (Figura 2). Usualmente se toma como referencia el rango de datos en el que se
concentra el 95% de la probabilidad. El valor-p que usualmente reportan la mayora de paquetes
estadsticos no es ms que la probabilidad de obtener, segn esa distribucin, un dato ms extremo que el
que proporciona el test. Como ya se dijo, refleja tambin la probabilidad de obtener los datos observados
si fuese cierta la hiptesis inicial. Si el valor-p es muy pequeo (usualmente se considera p<0.05) es poco
probable que se cumpla la hiptesis de partida y se debera de rechazar. La regin de aceptacin
corresponde por lo tanto a los valores centrales de la distribucin para los que p>0.05. En el ejemplo
planteado el valor-p correspondiente es de 0.425, de modo que no existe evidencia estadstica de que el
peso medio en ambos grupos sea diferente. En la Tabla 2, se determina los grados de libertad (en la
primera columna) y el valor de (en la primera fila). El nmero que determina su interseccin es el valor
crtico correspondiente. De este modo, si el estadstico que se obtiene toma un valor mayor se dir que la
diferencia es significativa.
Otro modo de obtener esta misma informacin es mediante el clculo de intervalos de confianza para la
diferencia de la respuesta media en ambos grupos. A mayores, el intervalo de confianza constituye una
medida de la incertidumbre con la que se estima esa diferencia a partir de la muestra, permitiendo valorar

tanto la significacin estadstica como la magnitud clnica de esa diferencia
(6)
. En el caso que nos ocupa,
el intervalo de confianza vendr dado como:

donde denota el valor que segn la distribucin t de Student con n+m-2 grados de libertad deja a
su derecha el 2.5% de los datos. En el ejemplo, el intervalo de confianza con una seguridad del 95% para
la diferencia de peso viene dado por:

que expresa en definitiva un rango de valores entre los que se puede encontrar el valor real de la
diferencia entre los pesos de ambos grupos. Proporciona adems la misma informacin que obtenamos
del contraste estadstico. El hecho de que el valor cero pertenezca al intervalo indica que no se dispone de
evidencia para concluir que el peso sea distinto en ambos grupos.
A medida que el tamao muestral aumenta, la distribucin del estadstico (1) se hace ms prxima a la de
una variable Normal estndar. De este modo, en algunos textos se opta por utilizar esta distribucin para
realizar la comparacin de medias. Aunque esta aproximacin es correcta para muestras suficientemente
grandes, ambos mtodos proporcionan en este caso resultados prcticamente idnticos, por lo que resulta
ms simple utilizar, independientemente del tamao de la muestra, la misma metodologa a partir de la
distribucin t. El mismo planteamiento podra utilizarse en el caso de varianzas distintas o de muestras
apareadas.
Dos muest r as i ndependi ent es con v ar i anza di st i nt a.
El caso en el que se dispone de dos grupos de observaciones independientes con diferentes varianzas, la
distribucin de los datos en cada grupo no puede compararse nicamente en trminos de su valor medio
(Figura 1b). El contraste estadstico planteado en el apartado anterior requiere de alguna modificacin que
tenga en cuenta la variabilidad de los datos en cada poblacin. Obviamente, el primer problema a resolver
es el de encontrar un mtodo estadstico que nos permita decidir si la varianza en ambos grupos es o no la
misma. El F test o test de la razn de varianzas viene a resolver este problema. Bajo la suposicin de que
las dos poblaciones siguen una distribucin normal y tienen igual varianza se espera que la razn de
varianzas:

siga una distribucin F de Snedecor con parmetros (n-1) y (m-1).
Supongamos que en el ejemplo anterior se desee comparar la prdida de peso en los sujetos sometidos a
cada una de las dos dietas. La aplicacin del estadstico (1) no ser factible, ya que las varianzas en ambos
grupos son sustancialmente distintas. En este caso la razn de varianzas es de 3.97 / 0.80 = 4.96, valor
que se debe comparar con una distribucin F
39,34
. El valor-p asociado ser p<0.01, siendo muy poco
probable que las observaciones provengan de poblaciones con igual variabilidad.
En este tipo de situaciones, donde no se debe aplicar el contraste basado en (1), podemos utilizar una
modificacin del t test para el caso de varianzas desiguales, conocido como el test de Welch
(7)
basada en
el estadstico:


que, bajo la hiptesis nula seguir una distribucin t de Student con un nmero f de grados de libertad que
depender de las varianzas muestrales segn la expresin:

La tcnica para realizar el contraste es anloga a la vista anteriormente cuando las varianzas son
desconocidas e iguales. Por ejemplo, en el caso planteado, la prdida media de peso para los individuos
en cada una de las dietas fue de e con las variabilidades anteriormente expresadas.
Esto conduce a un valor del estadstico de t=5.58 a relacionar con una distribucin t de Student con
aproximadamente 56 grados de libertad. El valor-p resultante es, por lo tanto, p<0.001 con lo cual
podemos rechazar la hiptesis de partida y concluir que la reduccin de peso experimentada es distinta
segn la dieta que se siga.
Al igual que en el caso anterior, podr optarse por calcular el correspondiente 95% intervalo de confianza
para la diferencia de medias dado por:

Dos muest r as dependi ent es.
Ya se ha comentado que cuando se trata de comparar dos grupos de observaciones, es importante
distinguir el caso en el que son independientes de aquel en el que los datos estn apareados. Las series
dependientes surgen normalmente cuando se evala un mismo dato ms de una vez en cada sujeto de la
muestra. Tambin se puede encontrar este tipo de observaciones en estudios de casos y controles donde
cada caso se aparea individualmente con un control.
Supongamos que queremos comprobar, en los datos de la Tabla 1 si realmente se produce una prdida de
peso significativa en esos individuos, para lo que se recoge en cada sujeto su peso antes y despus de
someterse a la dieta. En este tipo de anlisis el inters no se centra en la variabilidad que puede haber
entre los individuos, sino en las diferencias que se observan en un mismo sujeto entre un momento y otro.
Por este motivo, resulta intuitivo trabajar con la diferencia de ambas observaciones (en el ejemplo ser la
prdida de peso), de modo que se quiere contrastar la hiptesis:
H
0
: La prdida de peso es nula
frente a la alternativa de que la prdida de peso sea importante (es decir, distinta de cero).
La veracidad de dicha hiptesis puede ser contrastada igualmente mediante el test t de Student. Como se
ha dicho, este tipo de mtodos tienen como hiptesis fundamental la normalidad de los datos. En este
caso, sin embargo, no ser necesario que las observaciones en ambos grupos provengan de poblaciones
normales, sino que nicamente se requiere verificar la normalidad de su diferencia. Denotando por la
prdida media de peso la hiptesis de la que se parte es que:


frente a la alternativa

A partir de las observaciones muestrales {Y
1
,Y
2
,...,Y
n
} e {Y
1
,Y
2
,...,Y
n
} en cada uno de los grupos se calcula
la diferencia de peso para cada sujeto {d
1
,d
2
,...,d
n
} con d
j
=X
j
-Y
j
j=1,2,...,n. Ntese que en este caso un
requisito fundamental es que se tenga un nmero igual de observaciones en ambos grupos. A partir de
estos datos, el contraste se basa en el estadstico:

o en el clculo del 95% intervalo de confianza:

donde denota la media de la prdida de peso estimada a partir de la muestra:

y denota la cuasivarianza muestral de la diferencia dada por:

En nuestro ejemplo el valor del estadstico vendra dado por:

a comparar del modo habitual con la distribucin t de Student con n-1=74 grados de libertad. El intervalo
de confianza para la prdida media de peso correspondiente a una seguridad del 95% es de (3.56;4.41), lo
cual se traduce en una prdida de peso significativamente distinta de cero, tal y como indica el valor-p
correspondiente de p<0.001.


Fi gur a 1. Compar aci n de dos pobl aci ones nor mal es
a) Pobl aci ones nor mal es con i gual var i anza y medi as di st i nt as

b) Pobl aci ones nor mal es con i gual y di f er ent es var i anzas.

Fi gur a 2. Regi ones de acept aci n y r echazo en el cont r ast e de hi pt esi s



Tabl a 1. Dat os de 75 paci ent es con sobr epeso somet i dos a dos di et as
al i ment i ci as.
Di et a Peso i ni ci al Peso f i nal Di et a Peso i ni ci al Peso f i nal
A 94,07 86,59 B 88,02 84,12
A 96,79 93,08 B 88,22 86,13
A 92,15 87,85 B 103,45 101,21
A 92,30 86,83 B 82,94 79,08
A 96,50 92,70 B 89,71 86,19
A 83,11 76,80 B 94,83 91,93
A 91,16 83,40 B 81,93 78,97
A 90,81 86,74 B 83,41 78,89
A 81,37 77,67 B 73,59 69,76
A 89,81 85,70 B 108,47 104,20
A 84,92 79,96 B 72,67 70,01
A 84,43 79,80 B 96,84 93,66
A 86,33 81,15 B 88,48 87,00
A 87,60 81,92 B 89,57 87,24
A 81,08 76,32 B 85,22 82,09
A 92,07 90,20 B 103,76 102,24
A 81,14 73,34 B 87,84 84,66
A 96,87 93,58 B 91,50 88,95
A 99,59 92,36 B 93,04 88,73
A 83,90 77,23 B 92,14 88,07
A 89,41 85,45 B 85,26 81,36
A 85,31 84,59 B 89,42 86,64
A 89,25 84,89 B 92,42 88,99
A 93,20 93,10 B 93,13 89,73
A 89,17 86,87 B 80,86 77,81
A 93,51 86,36 B 88,75 85,93
A 88,85 83,24 B 95,02 91,90
A 88,40 81,20 B 92,29 91,28
A 82,45 77,18 B 89,43 87,22
A 96,47 88,61 B 93,32 89,77
A 99,48 94,67 B 92,88 89,38
A 99,95 93,87 B 89,88 88,00
A 100,05 94,15 B 82,25 80,81
A 87,33 82,17 B 88,99 86,87
A 87,61 86,01 B 82,07 79,74
A 89,28 83,78
A 89,72 83,56
A 95,57 89,58
A 97,71 91,35
A 98,73 97,82


Tabl a 2. Di st r i buci n t de St udent


Bi bl i ogr af a
1. Bland JM, Altman DG. Statistics Notes: Transforming data. BMJ 1996; 312: 770. [Medline] [texto
completo]
2. Altman DG, Bland JM. Detecting skewness from summary information, BMJ 1996; 313:1200.
[Medline]
3. Bland JM, Altman DG. Statistics Notes: The use of transformations when comparing two means. BMJ
1996; 312:1153. [Medline] [texto completo]
4. Moreno V, Vallescar R, Martn M. Las pruebas no paramtricas en el anlisis estadstico de datos. Aten
Primaria 1991; 8 (1): 58-60. [Medline]
5. Altman D. G. Preparing to analyse data. En: Practical statistics for medical research. London: Chapman
and Hall; 1991. p.132-145.
6. Braitman LE. Confidence intervals asses both clinical significance and statistical significance
[editorial]. Ann Intern Med 1991; 114 (6): 515-517. [Medline]
7. Berry G., Armitage P. Statistical Methods in Medical Research. 3 rd. ed. Oxford: Blackwell Science;
1994.

I nvest igacin: Relacin ent r e variables cuant it at ivas 1/ 8

Relacin entre variables cuantitativas

Pita Fernndez S., Prtega Daz S.
____________________________________
En el anlisis de los estudios clnico-epidemiolgicos surge muy frecuentemente la necesidad de
determinar la relacin entre dos variables cuantitativas en un grupo de sujetos. Los objetivos de dicho
anlisis suelen ser:
a. Determinar si las dos variables estn correlacionadas, es decir si los valores de una variable
tienden a ser ms altos o ms bajos para valores ms altos o ms bajos de la otra variable.
b. Poder predecir el valor de una variable dado un valor determinado de la otra variable.
c. Valorar el nivel de concordancia entre los valores de las dos variables.
Cor r el aci n
En este artculo trataremos de valorar la asociacin entre dos variables cuantitativas estudiando el mtodo
conocido como correlacin. Dicho clculo es el primer paso para determinar la relacin entre las
variables. La prediccin de una variable. La prediccin de una variable dado un valor determinado de la
otra precisa de la regresin lineal que abordaremos en otro artculo.
La cuantificacin de la fuerza de la relacin lineal entre dos variables cuantitativas, se estudia por medio
del clculo del coeficiente de correlacin de Pearson (1-3). Dicho coeficiente oscila entre 1 y +1. Un
valor de 1 indica una relacin lineal o lnea recta positiva perfecta. Una correlacin prxima a cero
indica que no hay relacin lineal entre las dos variables.
El realizar la representacin grfica de los datos para demostrar la relacin entre el valor del coeficiente
de correlacin y la forma de la grfica es fundamental ya que existen relaciones no lineales.
El coeficiente de correlacin posee las siguientes caractersticas (4):
a. El valor del coeficiente de correlacin es independiente de cualquier unidad usada para medir las
variables.
b. El valor del coeficiente de correlacin se altera de forma importante ante la presencia de un valor
extremo, como sucede con la desviacin tpica. Ante estas situaciones conviene realizar una
transformacin de datos que cambia la escala de medicin y modera el efecto de valores
extremos (como la transformacin logartmica).
c. El coeficiente de correlacin mide solo la relacin con una lnea recta. Dos variables pueden
tener una relacin curvilnea fuerte, a pesar de que su correlacin sea pequea. Por tanto cuando
analicemos las relaciones entre dos variables debemos representarlas grficamente y
posteriormente calcular el coeficiente de correlacin.
d. El coeficiente de correlacin no se debe extrapolar ms all del rango de valores observado de
las variables a estudio ya que la relacin existente entre X e Y puede cambiar fuera de dicho
rango.
e. La correlacin no implica causalidad. La causalidad es un juicio de valor que requiere ms
informacin que un simple valor cuantitativo de un coeficiente de correlacin (5).
El coeficiente de correlacin de Pearson (r) puede calcularse en cualquier grupo de datos, sin embargo la
validez del test de hiptesis sobre la correlacin entre las variables requiere en sentido estricto (4): a) que
las dos variables procedan de una muestra aleatoria de individuos. b) que al menos una de las variables
tenga una distribucin normal en la poblacin de la cual la muestra procede. Para el clculo vlido de un
intervalo de confianza del coeficiente de correlacin de r ambas variables deben tener una distribucin
normal. Si los datos no tienen una distribucin normal, una o ambas variables se pueden transformar
(transformacin logartmica) o si no se calculara un coeficiente de correlacin no paramtrico
(coeficiente de correlacin de Spearman) que tiene el mismo significado que el coeficiente de correlacin
de Pearson y se calcula utilizando el rango de las observaciones.

El clculo del coeficiente de correlacin (r) entre peso y talla de 20 nios varones se muestra en la tabla 1.
La covarianza, que en este ejemplo es el producto de peso (kg) por talla (cm), para que no tenga
dimensin y sea un coeficiente, se divide por la desviacin tpica de X (talla) y por la desviacin tpica de
Y (peso) con lo que obtenemos el coeficiente de correlacin de Pearson que en este caso es de 0.885 e
indica una importante correlacin entre las dos variables. Es evidente que el hecho de que la correlacin
sea fuerte no implica causalidad. Si elevamos al cuadrado el coeficiente de correlacin obtendremos el
coeficiente de determinacin (r
2
=0.783) que nos indica que el 78.3% de la variabilidad en el peso se
explica por la talla del nio. Por lo tanto existen otras variables que modifican y explican la variabilidad
del peso de estos nios. La introduccin de ms variable con tcnicas de anlisis multivariado nos
permitir identificar la importancia de que otras variables pueden tener sobre el peso.
Tabl a 1. Cl cul o del Coef i ci ent e de cor r el aci n de Pear son ent r e l as
var i abl es t al l a y peso de 20 ni os var ones
Y
Peso ( Kg)
X
Talla ( cm)
9
10
6
8
10
5
8
7
4
11
7
7
6
8
5
11
5
9
6
10
72
76
59
68
60
58
70
65
54
83
64
66
61
66
57
81
59
71
62
75
5.65
9.65
- 7.35
1.65
- 6.35
- 8.35
3.65
- 1.35
- 12.35
16.65
- 2.35
- 0.35
- 5.35
- 0.35
- 9.35
14.65
- 7.35
4.65
- 4.35
8.65
1.4
2.4
- 1.6
0.4
2.4
- 2.6
0.4
- 0.6
- 3.6
3.4
- 0.6
- 0.6
- 1.6
0.4
- 2.6
3.4
- 2.6
1.4
- 1.6
2.4
7.91
23.16
11.76
0.66
- 15.24
21.71
1.46
0.81
44.46
56.61
1.41
0.21
8.56
- 0.14
24.31
49.81
19.11
6.51
6.96
20.76

S
x
= Desviacin t pica x = 8.087
S
y
= Desviacin t pica y = 2.137


Test de hi pt esi s de r
Tras realizar el clculo del coeficiente de correlacin de Pearson (r) debemos determinar si dicho
coeficiente es estadsticamente diferente de cero. Para dicho calculo se aplica un test basado en la
distribucin de la t de student.

Si el valor del r calculado (en el ejemplo previo r = 0.885) supera al valor del error estndar multiplicado
por la t de Student con n-2 grados de libertad, diremos que el coeficiente de correlacin es significativo.
El nivel de significacin viene dado por la decisin que adoptemos al buscar el valor en la tabla de la t de
Student.
En el ejemplo previo con 20 nios, los grados de libertad son 18 y el valor de la tabla de la t de student
para una seguridad del 95% es de 2.10 y para un 99% de seguridad el valor es 2.88. (Tabla 2)

Como quiera que r = 0.885 > a 2.10
*
0.109 = 2.30 podemos asegurar que el coeficiente de correlacin es
significativo (p<0.05). Si aplicamos el valor obtenido en la tabla de la t de Student para una seguridad del
99% (t = 2.88) observamos que como r = 0.885 sigue siendo > 2.88
*
0.109 = 0.313 podemos a su vez
asegurar que el coeficiente es significativo (p<0.001). Este proceso de razonamiento es vlido tanto para
muestras pequeas como para muestras grandes. En esta ltima situacin podemos comprobar en la tabla
de la t de student que para una seguridad del 95% el valor es 1.96 y para una seguridad del 99% el valor
es 2.58.
I nt er v al o de conf i anza del coef i ci ent e de cor r el aci n.
La distribucin del coeficiente de correlacin de Pearson no es normal pero no se puede transformar r
para conseguir un valor z que sigue una distribucin normal (transformacin de Fisher) y calcular a partir
del valor z el intervalo de confianza.
La transformacin es:

L
n
representa el logaritmo neperiano en la base e

donde n representa el tamao muestral. El 95% intervalo de confianza de z se calcula de la siguiente
forma:


Tras calcular los intervalos de confianza con el valor z debemos volver a realizar el proceso inverso para
calcular los intervalos del coeficiente r

Utilizando el ejemplo de la Tabla 1, obtenemos r = 0.885

95% intervalo de confianza de z

Tras calcular los intervalos de confianza de z debemos proceder a hacer el clculo inverso para obtener
los intervalos de confianza de coeficiente de correlacin r que era lo que buscbamos en un principio
antes de la transformacin logartmica.

0.726 a 0.953 son los intervalos de confianza (95%) de r.
Pr esent aci n de l a cor r el aci n
Se debe mostrar siempre que sea posible la grfica que correlaciona las dos variables de estudio (Fig 1).
El valor de r se debe mostrar con dos decimales junto con el valor de la p si el test de hiptesis se realiz
para demostrar que r es estadsticamente diferente de cero. El nmero de observaciones debe a su vez
estar indicado.


Fi gur a 1. Cor r el aci n ent r e Peso y Tal l a

I nt er pr et aci n de l a cor r el aci n
El coeficiente de correlacin como previamente se indic oscila entre 1 y +1 encontrndose en medio el
valor 0 que indica que no existe asociacin lineal entre las dos variables a estudio. Un coeficiente de valor
reducido no indica necesariamente que no exista correlacin ya que las variables pueden presentar una
relacin no lineal como puede ser el peso del recin nacido y el tiempo de gestacin. En este caso el r
infraestima la asociacin al medirse linealmente. Los mtodos no paramtrico estaran mejor utilizados en
este caso para mostrar si las variables tienden a elevarse conjuntamente o a moverse en direcciones
diferentes.
La significancia estadstica de un coeficiente debe tenerse en cuenta conjuntamente con la relevancia
clnica del fenmeno que estudiamos ya que coeficientes de 0.5 a 0.7 tienden ya a ser significativos como
muestras pequeas (6). Es por ello muy til calcular el intervalo de confianza del r ya que en muestras
pequeas tender a ser amplio.
La estimacin del coeficiente de determinacin (r
2
) nos muestra el porcentaje de la variabilidad de los
datos que se explica por la asociacin entre las dos variables.
Como previamente se indic la correlacin elevada y estadsticamente significativa no tiene que asociarse
a causalidad. Cuando objetivamos que dos variables estn correlacionadas diversas razones pueden ser la
causa de dicha correlacin: a) pude que X influencie o cause Y, b) puede que influencie o cause X, c) X e
Y pueden estar influenciadas por terceras variables que hace que se modifiquen ambas a la vez.
El coeficiente de correlacin no debe utilizarse para comparar dos mtodos que intentan medir el mismo
evento, como por ejemplo dos instrumentos que miden la tensin arterial. El coeficiente de correlacin
mide el grado de asociacin entre dos cantidades pero no mira el nivel de acuerdo o concordancia. Si los
instrumentos de medida miden sistemticamente cantidades diferentes uno del otro, la correlacin puede
ser 1 y su concordancia ser nula (7).


Coef i ci ent e de cor r el aci n de l os r angos de Spear man
Este coeficiente es una medida de asociacin lineal que utiliza los rangos, nmeros de orden, de cada
grupo de sujetos y compara dichos rangos. Existen dos mtodos para calcular el coeficiente de correlacin
de los rangos uno sealado por Spearman y otro por Kendall (8). El r de Spearman llamado tambin rho
de Spearman es ms fcil de calcular que el de Kendall. El coeficiente de correlacin de Spearman es
exactamente el mismo que el coeficiente de correlacin de Pearson calculado sobre el rango de
observaciones. En definitiva la correlacin estimada entre X e Y se halla calculado el coeficiente de
correlacin de Pearson para el conjunto de rangos apareados. El coeficiente de correlacin de Spearman
es recomendable utilizarlo cuando los datos presentan valores externos ya que dichos valores afectan
mucho el coeficiente de correlacin de Pearson, o ante distribuciones no normales.
El clculo del coeficiente viene dado por:

en donde d
i
= r
xi
r
yi
es la diferencia entre los rangos de X e Y.
Los valores de los rangos se colocan segn el orden numrico de los datos de la variable.
Ejemplo: Se realiza un estudio para determinar la asociacin entre la concentracin de nicotina en sangre
de un individuo y el contenido en nicotina de un cigarrillo (los valores de los rangos estn entre
parntesis) (2).
X Y
Concent r aci n de Ni cot i na en
sangr e
( nmol / l i t r o)
Cont eni do de Ni cot i na por
ci gar r i l l o
( mg)
185.7 ( 2) 1.51 ( 8)
197.3 ( 5) 0.96 ( 3)
204.2 ( 8) 1.21 ( 6)
199.9 ( 7) 1.66 ( 10)
199.1 ( 6) 1.11 ( 4)
192.8 ( 6) 0.84 ( 2)
207.4 ( 9) 1.14 ( 5)
183.0 ( 1) 1.28 ( 7)
234.1 ( 10) 1.53 ( 9)
196.5 ( 4) 0.76 ( 1)
Si existiesen valores coincidentes se pondra el promedio de los rangos que hubiesen sido asignado si no
hubiese coincidencias. Por ejemplo si en una de las variables X tenemos:
X ( edad) ( Los r angos ser an)
23 1.5
23 1.5
27 3.5
27 3.5
39 5
41 6
45 7
.. . .. .

Para el clculo del ejemplo anterior de nicotina (2) obtendramos el siguiente resultado:

Si utilizamos la frmula para calcular el coeficiente de correlacin de Pearson de los rangos obtendramos
el mismo resultado

La interpretacin del coeficiente r
s
de Spearman es similar a la Pearson. Valores prximos a 1 indican una
correlacin fuerte y positiva. Valores prximos a 1 indican una correlacin fuerte y negativa. Valores
prximos a cero indican que no hay correlacin lineal. As mismo el tiene el mismo significado que el
coeficiente de determinacin de r
2
.
La distribucin de r
s
es similar a la r por tanto el calculo de los intervalos de confianza de r
s
se pueden
realizar utilizando la misma metodologa previamente explicada para el coeficiente de correlacin de
Pearson.
Bi bl i ogr af a
1- Dawson-Saunders B, Trapp RG. Bioestadstica Mdica . 2 ed. Mxico: Editorial el Manual Moderno;
1996.
2- Milton JS, Tsokos JO. Estadstica para biologa y ciencias de la salud. Madrid: Interamericana M
c
Graw
Hill; 2001.
3- Martn Andrs A, Luna del Castillo JD. Bioestadstica para las ciencias de la salud. 4 ed. Madrid:
ORMA; 1993.
4- Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman & Hall;
1997.
5- Pita Fernndez S. Correlacin frente a causalidad JANO 1996; (1174): 59-60.
6- Feintein AR. Tempest in a P-pot?. (Editorial). Hypertension 1985; 7: 313-318. [Medline]
7- Bland JM, Altman DG. Statistical methods for assesing agreement between two methods of clinical
measurement. Lancet 1986; 1: 307-310. [Medline]
8- Conover WJ. Practical nonparametric statistics. 3
rd
. ed. New York: John Wiley & Sons; 1998.

Tabl a 2. Di st r i buci n t de St udent

Metodologa de la Investigacin 1/5

Asoci aci n de v ar i abl es cual i t at i v as: t est de Chi - cuadr ado

Aut or es:
Sal v ador Pi t a Fer nndez
(1)
, Soni a Pr t ega Daz
(2)

(1) Mdico de Familia. Centro de Salud de Cambre (A Corua).
(2) Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario Juan Canalejo (A Corua).
Actualizada el 03/11/2004.

En la investigacin biomdica nos encontramos con frecuencia con datos o variables de tipo cualitativo,
mediante las cuales un grupo de individuos se clasifican en dos o ms categoras mutuamente
excluyentes. Las proporciones son una forma habitual de expresar frecuencias cuando la variable objeto
de estudio tiene dos posibles respuestas, como presentar o no un evento de inters (enfermedad,
muerte, curacin, etc.). Cuando lo que se pretende es comparar dos o ms grupos de sujetos con
respecto a una variable categrica, los resultados se suelen presentar a modo de tablas de doble entrada
que reciben el nombre de tablas de contingencia. As, la situacin ms simple de comparacin entre dos
variables cualitativas es aquella en la que ambas tienen slo dos posibles opciones de respuesta (es
decir, variables dicotmicas). En esta situacin la tabla de contingencia se reduce a una tabla dos por
dos como la que se muestra en la Tabla 1
1,2
.
Supongamos que se quiere estudiar la posible asociacin entre el hecho de que una gestante fume
durante el embarazo y que el nio presente bajo peso al nacer. Por lo tanto, se trata de ver si la
probabilidad de tener bajo peso es diferente en gestantes que fumen o en gestantes que no fumen
durante la gestacin. Para responder a esta pregunta se realiza un estudio de seguimiento sobre una
cohorte de 2000 gestantes, a las que se interroga sobre su hbito tabquico durante la gestacin y se
determina adems el peso del recin nacido. Los resultados de este estudio se muestran en la Tabla 2.
En la Tabla 1, a, b, c y d son las frecuencias observadas del suceso en la realidad de nuestro ejemplo de
estudio (43, 207, 105 y 1647), siendo n (2000) el nmero total de casos estudiados, y a+b, c+d, a+c y
b+d los totales marginales. En el ejemplo, a+b=250 sera el nmero total de mujeres fumadoras
durante el embarazo, c+d=1750 el nmero total de mujeres no fumadoras, a+c=148 el nmero de
nios con bajo peso al nacer y b+d=1852 el nmero de nios con peso normal al nacimiento.
Ante una tabla de contingencia como la anterior pueden plantersenos distintas cuestiones. En primer
lugar, se querr determinar si existe una relacin estadsticamente significativa entre las variables
estudiadas. En segundo lugar, nos interesar cuantificar dicha relacin y estudiar su relevancia clnica.
Esta ltima cuestin podr resolverse mediante las denominadas medidas de asociacin o de efecto
(riesgo relativo (RR), odds ratio (OR), reduccin absoluta del riesgo (RAR)), que ya han sido abordadas
en otros trabajos
3,4
. Por otro lado, para responder a la primera pregunta, la metodologa de anlisis de
las tablas de contingencia depender de varios aspectos como son: el nmero de categoras de las
variables a comparar, del hecho de que las categoras estn ordenadas o no, del nmero de grupos
independientes de sujetos que se estn considerando o de la pregunta a la que se desea responder
5
.
Existen diferentes procedimientos estadsticos para el anlisis de las tablas de contingencia como la
prueba
2
, la prueba exacta de fisher, la prueba de McNemar o la prueba Q de Cochran, entre otras.

En este artculo se expondr el clculo e interpretacin de la prueba
2
como mtodo estndar de

anlisis en el caso de grupos independientes
1,2,5,6
.
La pr ueba
2
en el cont r ast e de i ndependenci a de var i abl es al eat or i as cual i t at i vas.

La prueba
2
permite determinar si dos variables cualitativas estn o no asociadas. Si al final del

estudio concluimos que las variables no estn relacionadas podremos decir con un determinado nivel de
confianza, previamente fijado, que ambas son independientes.
Para su cmputo es necesario calcular las frecuencias esperadas (aquellas que deberan haberse
observado si la hiptesis de independencia fuese cierta), y compararlas con las frecuencias observadas
en la realidad. De modo general, para una tabla r x k (r filas y k columnas), se calcula el valor del
estadstico
2
como sigue:

( )
= =
=
r
i
k
j ij
ij ij
E
E O
1 1
2
2

(1)
donde:

ij
O
denota a las frecuencias observadas. Es el nmero de casos observados
clasificados en la fila i de la columna j.

ij
E
denota a las frecuencias esperadas o tericas. Es el nmero de casos esperados
correspondientes a cada fila y columna. Se puede definir como aquella frecuencia que
se observara si ambas variables fuesen independientes.
As, el estadstico
2
mide la diferencia entre el valor que debiera resultar si las dos variables fuesen
independientes y el que se ha observado en la realidad. Cuanto mayor sea esa diferencia (y, por lo
tanto, el valor del estadstico), mayor ser la relacin entre ambas variables. El hecho de que las
diferencias entre los valores observados y esperados estn elevadas al cuadrado en (1) convierte
cualquier diferencia en positiva. El test
2
es as un test no dirigido (test de planteamiento bilateral),

que nos indica si existe o no relacin entre dos factores pero no en qu sentido se produce tal
asociacin.
Para obtener los valores esperados
ij
E
, estos se calculan a travs del producto de los totales
marginales dividido por el nmero total de casos (n). Para el caso ms sencillo de una tabla 2x2 como la
Tabla 1, se tiene que:
( ) ( )
n
c a b a
E
+ +
=
11

( ) ( )
n
c a d c
E
+ +
=
21

( ) ( )
n
d b b a
E
+ +
=
12

( ) ( )
n
d b d c
E
+ +
=
22

Para los datos del ejemplo en la Tabla 2 los valores esperados se calcularan como sigue:
5 , 18
2000
250 148
11
=
= E

5 , 129
2000
1750 148
21
=
= E

5 , 231
2000
250 1852
12
=
= E

5 , 1620
2000
1750 1852
22
=
= E

De modo que los valores observados y esperados para los datos del ejemplo planteado se muestran en
la Tabla 3.
El valor del estadstico
2
, para este ejemplo en concreto, vendra dado entonces como:

( ) ( ) ( ) ( )
04 , 40
5 , 1620
5 , 1620 1645
5 , 129
5 , 129 105
5 , 231
5 , 231 207
5 , 18
5 , 18 43
2 2 2 2
2
=
=

A la vista de este resultado, lo que tenemos que hacer ahora es plantear un contraste de hiptesis entre
la hiptesis nula:
H
0
: No hay asociacin entre las variables (en el ejemplo, el bajo peso del nio y el hecho de fumar
durante la gestacin son independientes, no estn asociados).

Y la hiptesis alternativa:
H
a
: S hay asociacin entre las variables, es decir, el bajo peso y el fumar durante la gestacin estn
asociados.
Bajo la hiptesis nula de independencia, se sabe que los valores del estadstico
2
se distribuyen segn
una distribucin conocida denominada ji-cuadrado, que depende de un parmetro llamado grados de
libertad (g.l.). Para el caso de una tabla de contingencia de r filas y k columnas, los g.l. son igual al
producto del nmero de filas menos 1 (r-1) por el nmero de columnas menos 1 (k-1). As, para el caso
en el que se estudie la relacin entre dos variables dicotmicas (Tabla 2x2) los g.l. son 1.
De ser cierta la hiptesis nula, el valor obtenido debera estar dentro del rango de mayor probabilidad
segn la distribucin ji-cuadrado correspondiente. El valor-p que usualmente reportan la mayora de
paquetes estadsticos no es ms que la probabilidad de obtener, segn esa distribucin, un dato ms
extremo que el que proporciona el test o, equivalentemente, la probabilidad de obtener los datos
observados si fuese cierta la hiptesis de independencia. Si el valor-p es muy pequeo (usualmente se
considera p<0.05) es poco probable que se cumpla la hiptesis nula y se debera de rechazar.
En la Tabla 4, se determinan los grados de libertad (en la primera columna) y el valor de (en la
primera fila). El nmero que determina su interseccin es el valor crtico correspondiente. De este modo,
si el estadstico
2
que se obtiene toma un valor mayor se dir que la diferencia es significativa. As,
para una seguridad del 95% ( =0.05) el valor terico de una distribucin ji-cuadrado con una grado de
libertad es 3,84. Para =0.01 es de 6,63 y para =0.005 es de 7,88. Como quiera que en el clculo
del
2
en el ejemplo obtuvimos un valor de 40,04, que supera al valor para =0.005, podremos
concluir que las dos variables no son independientes, sino que estn asociadas (p<0.005). Por lo tanto,
a la vista de los resultados, rechazamos la hiptesis nula (H
0
) y aceptamos la hiptesis alternativa (H
a
)
como probablemente cierta.
Para el caso de una Tabla 2x2, la expresin (1) del estadstico
2
puede simplificarse y obtenerse

como:
( )
( )( )( )( ) d b c a d c b a
bc ad n
+ + + +

=
2
2

Cuando el tamao muestral es reducido la utilizacin de la distribucin ji-cuadrado para aproximar las
frecuencias puede introducir algn sesgo en los clculos, de modo que el valor del estadstico
2
tiende
a ser mayor. En ocasiones se utiliza una correccin para eliminar este sesgo que, para el caso de tablas
2x2 se conoce como la correccin de Yates:
( )( )( )( ) d b c a d c b a
n
bc ad n
Y
+ + + +

=
2
2
2

En el ejemplo previo el clculo del estadstico
2
con la correccin de Yates nos dara un valor de

2
Y
=38,43 (p<0.0.1) en lugar de

2
=40,04. No existe consenso en la literatura sobre la utilizacin o

no de esta correccin conservadora de Yates, que con muestras reducidas dificulta rechazar la hiptesis
nula, si bien el efecto es prcticamente imperceptible cuando se trabaja con muestras de mayor tamao.
No obstante, conviene mencionar que la utilizacin de la correccin de Yates no exime de ciertos
requerimientos acerca del tamao muestral necesario para la utilizacin del estadstico
2
. Como
norma general, se exigir que el 80% de las celdas en una tabla de contingencia deban tener valores
esperados mayores de 5. As, en una tabla 2x2 ser necesario que todas las celdas verifiquen esta
condicin, si bien en la prctica suele permitirse que una de ellas muestre frecuencias esperadas
ligeramente por debajo de este valor. En aquellos casos en los que no se verifique este requisito existe
un test, propuesto por R.A. Fisher, que puede utilizarse como alternativa al test
2
y que se conoce

como test exacto de Fisher. El procedimiento consiste en evaluar la probabilidad asociada a todas las
tablas 2x2 que se pueden formar con los mismos totales marginales que los datos observados, bajo el
supuesto de independencia. Los clculos, aunque elementales, resultan algo engorrosos, por lo que no
se incluirn en este trabajo, siendo mltiples las referencias que se pueden consultar a este respecto
5,6
.
Para finalizar, recalcar que existen otros mtodos estadsticos que nos permiten analizar la relacin entre
variables cualitativas, y que vienen a complementar la informacin obtenida por el estadstico
2
. Por
una parte, el anlisis de los residuos estandarizados permitir constatar la direccin en que se da la
relacin entre las variables estudiadas. A su vez, existen tambin otras medidas de asociacin, muchas
de las cuales resultan especialmente tiles cuando alguna de las variables se mide en una escala
nominal u ordinal, que permiten cuantificar el grado de relacin que existe entre ambos factores
7
.

Bi bl i ogr af a

1. Fleiss J L. Statistical Methods for rates and proportions. 3 rd. ed. New York: John Wiley &
Sons; 2003.
2. Selvin S. Statistical Analysis of epidemiologic data. 3 rd. ed. New York: Oxfrod University Press;
2004.
3. Pita Fernndez S, Vila Alonso MT, Carpente Montero J. Determinacin de factores de riesgo. Cad
Aten Primaria 1997; 4: 75-78. [Texto completo]
4. Pita Fernndez S, Lpez de Ullibarri Galparsoro I. Nmero necesario de pacientes a tratar para
reducir un evento. Cad Aten Primaria 1998; 96-98. [Texto completo]
5. Altman DG. Practical statistics for medical research. London: Chapman & Hall; 1991.
6. Armitage P, Berry G. Estadstica para la investigacin biomdica. Barcelona: Harcourt Brace;
1999.
7. Juez Martel P. Herramientas estadsticas para la investigacin en Medicina y Economa de la
Salud. Madrid: Centro de Estudios Ramn Areces; 2001.
Tabl a 1. Tabl a de cont i ngenci a gener al par a l a
compar aci n de dos var i abl es di cot mi cas.
Car act er st i ca A
Car act er st i ca
B
Presente Ausente Total
Presenta a b a + b
Ausente c d c + d
Total a + c b + d n

Tabl a 2. Tabl a de cont i ngenci a par a est udi ar l a
asoci aci n ent r e f umar dur ant e l a gest aci n y el baj o
peso del ni o al nacer . Est udi o de segui mi ent o de 2000
gest ant es.
Reci n naci do de baj o peso
Gest ant e S No Total
Fumadora 43 (a) 207 (b) 250
No fumadora 105 (c) 1645 (d) 1750
Total 148 1852 2000

Tabl a 3. Tabl a de cont i ngenci a par a est udi ar l a
asoci aci n ent r e f umar dur ant e l a gest aci n y el baj o
peso del ni o al nacer . Val or es obser vados y val or es
esper ados ( ent r e par nt esi s) si l os f act or es f uesen
i ndependi ent es.
Reci n naci do de baj o peso
Gest ant e S No Total
Fumadora 43 (18.5) 207 (231.5) 250
No fumadora 105 (129.5) 1645 (1620.5) 1750

Total 148 1852 2000

Tabl a 4. Di st r i buci n de j i - cuadr ado

Pr obabi l i dad de un val or super i or
Gr ados de l i ber t ad 0, 1 0, 05 0, 025 0, 01 0, 005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
7 12,02 14,07 16,01 18,48 20,28
8 13,36 15,51 17,53 20,09 21,95
9 14,68 16,92 19,02 21,67 23,59
10 15,99 18,31 20,48 23,21 25,19
11 17,28 19,68 21,92 24,73 26,76
12 18,55 21,03 23,34 26,22 28,30
13 19,81 22,36 24,74 27,69 29,82
14 21,06 23,68 26,12 29,14 31,32
15 22,31 25,00 27,49 30,58 32,80
16 23,54 26,30 28,85 32,00 34,27
17 24,77 27,59 30,19 33,41 35,72
18 25,99 28,87 31,53 34,81 37,16
19 27,20 30,14 32,85 36,19 38,58
20 28,41 31,41 34,17 37,57 40,00
21 29,62 32,67 35,48 38,93 41,40
22 30,81 33,92 36,78 40,29 42,80
23 32,01 35,17 38,08 41,64 44,18
24 33,20 36,42 39,36 42,98 45,56
25 34,38 37,65 40,65 44,31 46,93
26 35,56 38,89 41,92 45,64 48,29
27 36,74 40,11 43,19 46,96 49,65
28 37,92 41,34 44,46 48,28 50,99
29 39,09 42,56 45,72 49,59 52,34
30 40,26 43,77 46,98 50,89 53,67
40 51,81 55,76 59,34 63,69 66,77
50 63,17 67,50 71,42 76,15 79,49
60 74,40 79,08 83,30 88,38 91,95
70 85,53 90,53 95,02 100,43 104,21
80 96,58 101,88 106,63 112,33 116,32
90 107,57 113,15 118,14 124,12 128,30
100 118,50 124,34 129,56 135,81 140,17


Asociacin de variables cualitativas:
El test exacto de Fisher y el test de Mcnemar

Autores:
Sonia Prtega Daza
(1)
, Salvador Pita Fernndez
(2)

(1) Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario Juan Canalejo (A Corua).
(2) Mdico de Familia. Centro de Salud de Cambre (A Corua).
Actualizada el 14/11/2004.
Desde que Pearson
1,2
introdujo el test de la
2
en 1900, sta se ha convertido en una herramienta de

uso general para conocer si existe o no relacin entre variables de tipo cualitativo. Sin embargo, su
aplicacin exige de ciertos requerimientos acerca del tamao muestral que no siempre son tenidos en
cuenta
3
. La prueba
2
es aplicable a los datos de una tabla de contingencia solamente si las

frecuencias esperadas son suficientemente grandes. Del mismo modo, cuando los datos exhiben algn
grado de dependencia, el test
2
no ser el mtodo apropiado para contrastar la hiptesis nula de

independencia. En este trabajo se introducirn la prueba exacta de Fisher y el test de McNemar como
alternativa estadstica al test
2
cuando no se verifiquen las condiciones necesarias para su utilizacin

4-
7
.

La prueba de probabilidad exacta de Fisher
El test exacto de Fisher permite analizar si dos variables dicotmicas estn asociadas cuando la muestra
a estudiar es demasiado pequea y no se cumplen las condiciones necesarias para que la aplicacin del
test
2
sea adecuada. Estas condiciones exigen que los valores esperados de al menos el 80% de las
celdas en una tabla de contingencia sean mayores de 5. As, en una tabla 2x2 ser necesario que todas
las celdas verifiquen esta condicin, si bien en la prctica suele permitirse que una de ellas muestre
frecuencias esperadas ligeramente por debajo de este valor.
En situaciones como esta, una forma de plantear los resultados es su disposicin en una tabla de
contingencia de dos vas. Si las dos variables que se estn considerando son dicotmicas, nos
encontraremos con el caso de una tabla 2 x 2 como la que se muestra en la Tabla 1. El test exacto de
Fisher se basa en evaluar la probabilidad asociada a cada una de las tablas 2 x 2 que se pueden formar
manteniendo los mismos totales de filas y columnas que los de la tabla observada. Cada una de estas
probabilidades se obtiene bajo la hiptesis nula de independencia de las dos variables que se estn
considerando.
Tabla 1. Tabla de contingencia general para la comparacin
de dos variables dicotmicas en el caso de grupos
independientes.
Caracterstica A
Caracterstica B Presente Ausente Total
Presente a b a + b
Ausente c d c + d
Total a + c b + d n
La probabilidad exacta de observar un conjunto concreto de frecuencias a, b, c y d en una tabla 2 x 2
cuando se asume independencia y los totales de filas y columnas se consideran fijos viene dada por la
distribucin hipergeomtrica:
( ) ( ) ( ) ( )
! ! ! ! !
! ! ! !
d c b a n
d b c a d c b a
p
+ + + +
=

(1)
Esta frmula se obtiene calculando todas las posibles formas en las que podemos disponer n sujetos en
una tabla 2 x 2 de modo que los totales de filas y columnas sean siempre los mismos, (a+b), (c+d),
(a+c) y (b+d).

La probabilidad anterior deber calcularse para todas las tablas de contingencia que puedan formarse
con los mismos totales marginales que la tabla observada. Posteriormente, estas probabilidades se usan
para calcular valor de la p asociado al test exacto de Fisher. Este valor de p indicar la probabilidad de
obtener una diferencia entre los grupos mayor o igual a la observada, bajo la hiptesis nula de
independencia. Si esta probabilidad es pequea (p<0.05) se deber rechazar la hiptesis de partida y
deberemos asumir que las dos variables no son independientes, sino que estn asociadas. En caso
contrario, se dir que no existe evidencia estadstica de asociacin entre ambas variables.
En la literatura estadstica, suelen proponerse dos mtodos para el cmputo del valor de la p asociado al
test exacto de Fisher. En primer lugar, podremos calcularlo sumando las probabilidades de aquellas
tablas con una probabilidad asociada menor o igual a la correspondiente a los datos observados. La otra
posibilidad consiste en sumar las probabilidades asociadas a resultados al menos tan favorables a la
hiptesis alternativa como los datos reales. Este clculo proporcionara el valor de p correspondiente al
test en el caso de un planteamiento unilateral. Duplicando este valor se obtendra el p-valor
correspondiente a un test bilateral.
Para ilustrar la explicacin anterior, supongamos que en una determinada poblacin se desea averiguar
si existen diferencias en la prevalencia de obesidad entre hombres y mujeres o si, por el contrario, el
porcentaje de obesos no vara entre sexos. Tras ser observada una muestra de 14 sujetos se obtuvieron
los resultados que se muestran en la Tabla 2.
Tabla 2. Tabla de contingencia para estudiar las diferencias
en la prevalencia de obesidad entre sexos. Estudio de
prevalencia sobre 14 sujetos.
Obesidad
Sexo S No Total
Mujeres 1 (a) 4 (b) 5 (a+b)
Hombres 7 (c) 2 (d) 9 (c+d)
Total 8 (a+c) 6 (b+d) 14 (n)
En esta tabla a=1, b=4, c=7 y d=2. Los totales marginales son as a+b=5, c+d= 9, a+c=8 y b+d=6. La
frecuencia esperada en tres de las cuatro celdas es menor de 5, por lo que no resulta adecuado aplicar
el test
2
, aunque s el test exacto de Fisher. Si las variables sexo y obesidad fuesen independientes,
la probabilidad asociada a los datos que han sido observados vendra dada por:
( ) ( ) ( ) ( )
0,0599
! 2 ! 7 ! 4 ! 1 ! 14
! 6 ! 8 ! 9 ! 5
! ! ! ! !
! ! ! !
= =
+ + + +
=
d c b a n
d b c a d c b a
p

Tabla 3. Posibles combinaciones de frecuencias con los mismos totales
marginales de filas y columnas que en la Tabla 2.
Obesidad Obesidad
Si No Si No
(i) Mujeres 0 5 5 (iv) Mujeres 3 2 5
Hombres 8 1 9 Hombres 5 4 9
8 6 14 8 6 14

(ii) Mujeres 1 4 5 (v) Mujeres 4 1 5
8 6 14 8 6 14

(iii) Mujeres 2 3 5 (vi) Mujeres 5 0 5
8 6 14 8 6 14


La Tabla 3 muestra todas las posibles combinaciones de frecuencias que se podran obtener con los
mismos totales marginales que en la Tabla 2. Para cada una de estas tablas, se ha calculado la
probabilidad exacta de ocurrencia bajo la hiptesis nula, segn la expresin (1). Los resultados
obtenidos se muestran en la Tabla 4. El valor de la p asociado al test exacto de Fisher puede entonces
calcularse sumando las probabilidades de las tablas que resultan ser menores o iguales a la probabilidad
de la tabla que ha sido observada:
0909 , 0 0280 , 0 0599 , 0 0030 , 0 = + + = p

Tabla 4. Probabilidad exacta asociada con cada una de las
disposiciones de frecuencias de la Tabla 3.
a b c d p
(i) 0 5 8 1 0,0030
(ii) 1 4 7 2 0,0599
(iii) 2 3 6 3 0,2797
(iv) 3 2 5 4 0,4196
(v) 4 1 4 5 0,2098
(vi) 5 0 3 6 0,0280

Otro modo de calcular el valor de p correspondiente consistira en sumar las probabilidades asociadas a
aquellas tablas que fuesen ms favorables a la hiptesis alternativa que los datos observados. Es decir,
aquellas situaciones en las que la diferencia en la prevalencia de obesidad entre hombres y mujeres
fuese mayor que la observada en la realidad. En el ejemplo, slo existe una tabla ms extrema que la
correspondiente a los datos observados (aquella en la que no se observa ninguna mujer obesa), de
forma que:
0629 , 0 0599 , 0 0030 , 0 = + = p

(2)
Este sera el valor de la p correspondiente a un planteamiento unilateral. En este caso la hiptesis a
contrastar sera que la prevalencia de obesidad es igual en hombres y mujeres, frente a la alternativa de
que fuese mayor en los varones. Cuando el planteamiento se hace con una perspectiva bilateral, la
hiptesis alternativa consiste en asumir que existen diferencias en la prevalencia de obesidad entre
sexos, pero sin especificar de antemano en qu sentido se producen dichas diferencias. Para obtener el
valor de la p correspondiente a la alternativa bilateral deberamos multiplicar el valor obtenido en (2) por
dos:
1258 , 0 0629 , 0 2 = = p

Como se puede observar, las dos formas de clculo propuestas no tienen por qu proporcionar
necesariamente los mismos resultados. El primer mtodo siempre resultar en un valor de p menor o
igual al del segundo mtodo. Si recurrimos a un programa estadstico como el SPSS para el cmputo del
test, ste utilizar la primera va para obtener el p-valor correspondiente a la alternativa bilateral y el
segundo mtodo de clculo para el valor de p asociado a un planteamiento unilateral. En cualquier caso,
y a la vista de los resultados, no existe evidencia estadstica de asociacin entre el sexo y el hecho de
ser obeso en la poblacin de estudio.

El test de McNemar
En otras ocasiones, una misma caracterstica se mide en ms de una ocasin para cada uno de los
individuos que se incluyen en una investigacin. En estos casos, el inters se centra en comparar si las
mediciones efectuadas en dos momentos diferentes (normalmente antes y despus de alguna
intervencin) son iguales o si, por el contrario, se produce algn cambio significativo. Por ejemplo,
puede interesarnos estudiar, a distintos tiempos, el porcentaje de sujetos que se mantienen con fiebre
tras la aplicacin de un antitrmico o comparar la proporcin de enfermos con un determinado sntoma
antes y despus de un tratamiento.
Para el caso de datos pareados, existen claramente cuatro tipos de pares de observaciones, segn cada
individuo presente o no la caracterstica de inters en los dos momentos en los que se efecta la
evaluacin (Tabla 5). As, los resultados obtenidos pueden mostrarse igualmente en una tabla 2 x 2

como en la Tabla 1, con la salvedad de que aqu los datos son dependientes y por lo tanto no resultar
adecuada la utilizacin del test
2
.
Tabla 5. Frecuencia de cada una de las posibles combinaciones en un
estudio de datos pareados.
Observacin 1 Observacin 2 Nmero de pares
Tipo Caracterstica Caracterstica
1 Presente Presente a
2 Presente Ausente b
3 Ausente Presente c
4 Ausente Ausente d
Total n
Con esta notacin, las proporciones de individuos con la caracterstica de inters en los dos momentos
en los que se efecta la medicin son
n
b a
p
+
=
1
y
n
c a
p
+
=
2
, respectivamente. Estamos
interesados por lo tanto en la diferencia entre estas dos proporciones:
n
c b
n
c a
n
b a
p p d

=
+
+
= =
2 1

La hiptesis nula que se quiere contrastar es que el valor esperado para esta diferencia es cero, frente a
la hiptesis alternativa de que las dos proporciones
1
p
y
2
p
sean efectivamente diferentes. Esto se
puede contrastar centrando nuestra atencin en las casillas b y c que son las que muestran discordancia
en los dos momentos en los que se efectu la medicin. La prueba de McNemar contrasta as si el
nmero de individuos que han dejado de presentar la caracterstica de inters (b) es el mismo que el
nmero de individuos que han realizado el cambio inverso (c).
El error estndar para la diferencia entre dos proporciones viene dado por:
( )
( )
n
c b
c b
n
p p SE
2
2 1
1
+ =

(3)
De modo que, bajo la hiptesis nula de que no existe diferencia entre ambas
( ) 0 = c b
, la ecuacin
(3) se reduce a:
( ) c b
n
p p SE + =
1
2 1

El estadstico de contraste se construye as de la forma siguiente:
( )
c b
c b
c b
n
n
c b
p p SE
p p
z
+
=
+
=
1
2 1
2 1
(4)
que sigue una distribucin normal N(0,1).
Alternativamente, se puede considerar el estadstico de contraste:
( )
c b
c b
+
=
2
2


que sigue una distribucin chi-cuadrado con un grado de libertad y proporciona el mismo valor de la p
asociado.
A su vez, se puede aplicar una correccin de continuidad para trabajar sobre muestras pequeas:
c b
c b
z
+

=
1

refiriendo el valor de dicho estadstico al de una distribucin normal N(0,1) , equivalentemente, a una
distribucin chi-cuadrado con un grado de libertad si se trabaja con su valor al cuadrado:
( )
c b
c b
+

=
2
2
1

De modo anlogo, es posible obtener un intervalo de confianza para la diferencia de proporciones como:
( )
2 1 2 1
96 . 1 p p SE p p

Para ilustrar los clculos anteriores, se dispone de informacin acerca de 20 pacientes a los que se les
administr un determinado tratamiento para tratar el dolor tras una intervencin quirrgica. En cada
individuo, se realiz una valoracin del dolor inmediatamente despus de la operacin y al cabo de 1
hora tras la administracin del analgsico. Los datos observados se muestran en la Tabla 6. En primer
lugar se construye la tabla 2 x 2 con las frecuencias observadas en el estudio (Tabla 7). Segn estos
datos, el porcentaje de pacientes que manifiestan dolor inicialmente es de
% 60
20
12
=
, frente al
% 15
20
3
=
de los enfermos que dicen tener dolor una vez administrado el analgsico. El estadstico
de contraste se construye segn la expresin (4) como:
49 . 2
13
9
2 11
2 11
= =
+
=
+
=
c b
c b
z

El valor obtenido del estadstico (z=2.49) se compara con los valores de una distribucin normal
estndar (Tabla 8). El valor crtico correspondiente para =0.01 es de z=2.576 y para =0.02 es de
2.326. Como quiera que en el clculo del test de McNemar en el ejemplo obtuvimos un valor de 2.49,
que supera al valor para =0.02, podremos concluir que las dos variables no son independientes, sino
que estn asociadas (p<0.02). Aplicando la correccin de continuidad proporciona un resultado de
21 , 2
13
8
2 11
1 2 11 1
= =
+

=
+

=
c b
c b
z
, que sigue siendo un resultado significativo (p<0.03).
Otro modo de obtener esta misma informacin es mediante el clculo de intervalos de confianza para la
diferencia de proporciones en los dos momentos de observacin. A mayores, el intervalo de confianza
constituye una medida de la incertidumbre con la que se estima esa diferencia a partir de la muestra,
permitiendo valorar tanto la significacin estadstica como la magnitud clnica de esa diferencia. En el
caso que nos ocupa, el intervalo de confianza vendr dado como:
( ) 18 . 0 96 . 1 45 . 0 2 11
20
1
96 . 1 15 . 0 6 . 0 96 . 1
20
3
20
12
2 1
+ p p SE

( ) 8028 . 0 ; 0972 . 0 3528 . 0 45 . 0

Es decir, podemos asegurar (con una seguridad del 95%) de que la diferencia real en el porcentaje de
pacientes que manifiestan dolor antes y despus de recibir el tratamiento analgsico se mueve entre un
9.72% y un 80.28%.

En definitiva, el uso generalizado de la metodologa estadstica ha contribuido a dotar de un mayor rigor
a la investigacin clnico-epidemiolgica en los ltimos aos. Sin embargo, tambin ha hecho que estas
tcnicas se apliquen en ocasiones de una manera un tanto superficial. Es extremadamente importante
tener en cuenta las asunciones subyacentes a los distintos mtodos estadsticos, como en el caso del
test
2
, para comprender cundo es adecuado o no su uso y disponer de las tcnicas estadsticas

alternativas que deben utilizarse en cada ocasin.

Bibliografa
1. Pearson K. On a criterion that a given system of deviations from the probable in the case of
correlated system of variables is Duch that it can be reasonably supposed to have arisen from
random sampling. Philosophical Magazine 1900, Series 5, No. 50: 157-175.
2. Pearson, K. On the
2
testo f goodness of fit. Biometrika 1922; 14: 186-191.

3. Pita Fernndez S, Prtega Daz S. Asociacin de variables cualitativas: Test de chi-cuadrado.
Cad Aten Primaria 2004 (en prensa). [Texto completo]
4. Altman DG. Practical statistics for medical research. London: Chapman & Hall; 1991.
5. Armitage P, Berry G. Estadstica para la investigacin biomdica. Madrid : Harcourt Brace;
1999.
6. Juez Martel P. Herramientas estadsticas para la investigacin en Medicina y Economa de la
Salud. Madrid: Ed. Centro de Estudios Ramn Areces; 2001.
7. Agresti A. Categoriacl Data Analisis. New York: John Wiley & Sons; 1990.
Tabla 6. Datos de 20 pacientes intervenidos quirrgicamente en los
que se valor el dolor tras la ciruga y al cabo de 1 hora tras la
administracin de un analgsico.
Individuo Dolor tras la intervencin Dolor 1 horas despus del Tto.
1 No No
2 S No
3 No No
4 No No
5 S No
6 S No
7 No No
8 S S
9 No S
10 No No
11 S No
12 S No
13 S No
14 S No
15 S No
16 No S
17 No S
18 S No
19 S No
20 S No

Tabla 7. Tabla de contingencia con los datos de 20 pacientes
intervenidos quirrgicamente en los que se valor el dolor tras la
ciruga y al cabo de 1 hora tras la administracin de un analgsico.

Dolor 1 hora despus del
tratamiento

Dolor tras la
intervencin
S No Total
S 1 (a) 11 (b) 12 (a+b)
No 2 (c) 6 (d) 8 (c+d)
Total 3 (a+c) 17 (b+d) 20 (n)


Tabla 8. Tabla de valores de la distribucin normal. La tabla muestra los valores de z para los que la
probabilidad de observar un valor mayor o igual (en valor absoluto) es igual a . La cifra entera y el
primer decimal de se buscan en la primera columna, y la segunda cifra decimal en la cabecera de
la tabla.

I nvest igacin: 1/ 7

Tcnicas de regresin: Regresin Lineal Simple

__________________________________
En mltiples ocasiones en la prctica clnica nos encontramos con situaciones en las que se requiere
analizar la relacin entre dos variables cuantitativas. Los dos objetivos fundamentales de este anlisis
sern, por un lado, determinar si dichas variables estn asociadas y en qu sentido se da dicha asociacin
(es decir, si los valores de una de las variables tienden a aumentar o disminuir- al aumentar los valores
de la otra); y por otro, estudiar si los valores de una variable pueden ser utilizados para predecir el valor
de la otra.
La forma correcta de abordar el primer problema es recurriendo a coeficientes de correlacin
(1)
. Sin
embargo, el estudio de la correlacin es insuficiente para obtener una respuesta a la segunda cuestin: se
limita a indicar la fuerza de la asociacin mediante un nico nmero, tratando las variables de modo
simtrico, mientras que nosotros estaramos interesados en modelizar dicha relacin y usar una de las
variables para explicar la otra. Para tal propsito se recurrir a la tcnica de regresin. Aqu analizaremos
el caso ms sencillo en el que se considera nicamente la relacin entre dos variables. As mismo, nos
limitaremos al caso en el que la relacin que se pretende modelizar es de tipo lineal
(2)
.
La r ect a de r egr esi n.
Consideremos una variable aleatoria respuesta (o dependiente) Y, que supondremos relacionada con otra
variable (no necesariamente aleatoria) que llamaremos explicativa, predictora o independiente y que se
denotar por X. A partir de una muestra de n individuos para los que se dispone de los valores de ambas
variables, {(X
i
,Y
i
),i = 1,...n}, se puede visualizar grficamente la relacin existente entre ambas mediante
un grfico de dispersin, en el que los valores de la variable X se disponen en el eje horizontal y los de Y
en el vertical. El problema que subyace a la metodologa de la regresin lineal simple es el de encontrar
una recta que ajuste a la nube de puntos del diagrama as dibujado, y que pueda ser utilizada para predecir
los valores de Y a partir de los de X. La ecuacin general de la recta de regresin ser entonces de la
forma: Y = a + bX .
El problema radica en encontrar aquella recta que mejor ajuste a los datos. Tradicionalmente se ha
recurrido para ello al mtodo de mnimos cuadrados, que elige como recta de regresin a aquella que
minimiza las distancias verticales de las observaciones a la recta. Ms concretamente, se pretende
encontrar a y b tales que:

Resolviendo este problema mediante un sencillo clculo de diferenciacin, se obtienen los estimadores
mnimo cuadrticos de los coeficientes de la recta de regresin:

;


Tabl a 1. Tensi n Ar t er i al Si st l i ca y Edad de 69 paci ent es
N Tensi n Si st l i ca Edad N Tensi n Si st l i ca Edad
1 114 17 36 156 47
2 134 18 37 159 47
3 124 19 38 130 48
4 128 19 39 157 48
5 116 20 40 142 50
6 120 21 41 144 50
7 138 21 42 160 51
8 130 22 43 174 51
9 139 23 44 156 52
10 125 25 45 158 53
11 132 26 46 174 55
12 130 29 47 150 56
13 140 33 48 154 56
14 144 33 49 165 56
15 110 34 50 164 57
16 148 35 51 168 57
17 124 36 52 140 59
18 136 36 53 170 59
19 150 38 54 185 60
20 120 39 55 154 61
21 144 39 56 169 61
22 153 40 57 172 62
23 134 41 58 144 63
24 152 41 59 162 64
25 158 41 60 158 65
26 124 42 61 162 65
27 128 42 62 176 65
28 138 42 63 176 66
29 142 44 64 158 67
30 160 44 65 170 67
31 135 45 66 172 68
32 138 45 67 184 68
33 142 46 68 175 69
34 145 47 69 180 70
35 149 47
La Tabla 1 muestra los datos de 69 pacientes de los que se conoce su edad y una medicin de su tensin
sistlica. Si estamos interesados en estudiar la variacin en la tensin sistlica en funcin de la edad del
individuo, deberemos considerar como variable respuesta la tensin y como variable predictora la edad.
En la Figura 1 se muestra, superpuesta al diagrama de dispersin, la recta de regresin de mnimos
cuadrados correspondientes, as como las distancias verticales de las observaciones muestrales a la recta.
Aplicando los clculos anteriores a este caso, resultara:


Como se puede suponer, la relacin Y = a + bX no va a cumplirse exactamente, sino que existir un
error que representa la variacin de Y en todos los datos con un mismo valor de la variable
independiente. Las distancias verticales entre el valor observado y el valor dado por la recta para cada
individuo (o valor ajustado) reciben el nombre de residuos, y se suelen denotar por . La expresin
terica del modelo matemtico ser, por tanto:

donde, adems, se supondr

Fi gur a 1. Rel aci n ent r e l a Edad y Pr esi n Si st l i ca. Rect a de Regr esi n y di f er enci as ent r e
l os val or es obser vados y aj ust ados

I nt er pr et aci n de l os coef i ci ent es de r egr esi n y l a t abl a ANOVA.
En la ecuacin general de la recta de regresin, claramente b es la pendiente de la recta y a el valor de la
variable dependiente Y para el que X = 0. En consecuencia, una vez estimados estos coeficientes, en la
mayora de las aplicaciones clnicas el valor de no tendr una interpretacin directa, mientras que el
valor servir como un indicador del sentido de asociacin entre ambas variables: as, nos
indicar una relacin directa entre ellas (a mayor valor de la variable explicativa, el valor de la variable
dependiente Y aumentar), delatar una relacin de tipo inverso, mientras que nos indica
que no existe una relacin lineal clara entre ambas variables. As mismo, y tal y como se deduce de la
ecuacin de la recta de regresin, el coeficiente b nos da una estimacin del cambio por trmino medio en
la variable Y por cada unidad en que se incrementa X. Al igual que ocurre con otros estimadores, existir
cierta incertidumbre en el clculo de las estimaciones, que se podr reflejar mediante intervalos de
confianza para ambos valores, construidos bajo la hiptesis de normalidad de los residuos, mediante las
expresiones:



donde denota al cuantil de orden de una distribucin t de Student con n-2 grados de libertad.
De igual forma, podemos limitar esta incertidumbre realizando un test para contrastar la hiptesis de
que b=0 mediante el cociente y comparando ste con la distribucin t de Student con n-2
grados de libertad. De modo anlogo se llevara a cabo un contraste para la hiptesis a=0. El hecho de
que el test no resulte significativo indicar la ausencia de una relacin clara de tipo lineal entre las
variables, aunque pueda existir una asociacin que no sea captada a travs de una recta. Para los datos del
ejemplo, el resultado de ajustar un modelo de regresin lineal se muestra en la Tabla 2.
Tabl a 2. Model o de Regr esi n Li neal Si mpl e de l a Pr esi n si st l i ca
aj ust ando por edad
Var i abl e Coef i ci ent e ( B) E. T. ( B) I C 95% ( B) t p
Const ant e 103.35 4.33 ( 94.72;
111.99)
23.89 < 0.001
Edad 0.98 0.09 ( 0.81; 1.16) 11.03 < 0.001
Fuent e de
Var i aci n
Suma de
Cuadr ados
g.l .
Medi a
cuadr t i ca
F p
Regresin en edad 14,965.31 1 14,965.31 121.59 < 0.001
Residual 8,246.46 67 123.08
Tot al 23,211.77 68
La recta as ajustada explica tan slo una parte de la variabilidad de la variable dependiente, expresada
sta comnmente por medio de la varianza de Y, mientras que la cantidad de variabilidad que resta por
explicar puede ser expresada a travs de los residuos. Generalmente un anlisis de regresin suele ser
expresado por una tabla de anlisis de la varianza en la que se refleja toda esta informacin. En la Tabla 2
se muestra adems la tabla correspondiente en el ejemplo de la tensin sistlica. La columna etiquetada
por "Suma de cuadrados" muestra una descomposicin de la variacin total de Y en las partes explicada y
no explicada (residual) por la regresin. La proporcin de variabilidad explicada por el modelo coincide
aqu con el cuadrado del coeficiente de correlacin lineal de Pearson, que recibe el nombre de coeficiente
de determinacin, y que se persigue sea prximo a 1. En nuestro ejemplo sera R
2
=0.645.
A partir de esta informacin puede elaborarse un contraste para verificar la utilidad del modelo. En el
caso de regresin lineal simple, el estadstico de contraste se reduce a:

que se comparar con el cuantil correspondiente a una distribucin F de Snedecor con parmetros 1 y n-1.
El test resultante ser equivalente al test t para contrastar H
0
:b=0.
Hi pt esi s del model o.
Una vez ajustado el modelo, y antes de usarlo para realizar nuevas predicciones, conviene asegurarse de
que no se violan las hiptesis sobre las que se soporta: independencia de las observaciones muestrales,
normalidad de los valores de la variable dependiente Y para cada valor de la variable explicativa,
homocedasticidad (i.e., la variabilidad de Y es la misma para todos los valores de X) y relacin lineal

entre las dos variables. La informacin ms relevante la aportan los residuos. As, bajo las suposiciones
anteriores, los residuos habrn de tener una distribucin normal de media cero y varianza constante. El
modo ms sencillo de comprobar si esto se verifica es obteniendo una impresin visual a partir de un
grfico de los residuos frente a la variable dependiente Y. La Figura 2 muestra las diferentes posibilidades
en un grfico de residuos, mientras que el grfico que se obtiene en el ejemplo manejado se refleja en la
Figura 3.
Fi gur a 2. Di f er ent es posi bi l i dades del Gr f i co de Resi duos

Fi gur a 3. Gr f i co de Resi duos de l a r egr esi n f r ent e a l a edad

Se puede complementar este anlisis mediante grficos de probabilidad normal y tests de normalidad para
los residuos, como el de Kolmogorov-Smirnov (Figura 4). As mismo, la independencia de las
observaciones puede estudiarse mediante grficos de autocorrelacin y contrastes de independencia como
el de Durbin-Watson.

Fi gur a 4. Gr f i co de Pr obabi l i dad nor mal de l os Resi duos par a l a
Tensi n Si st l i ca f r ent e a l a Edad.

Aunque obviaremos un anlisis detallado de la verificacin de las hiptesis del modelo, conviene hacer
referencia a las medidas a tomar en caso de no cumplirse. Para el caso de no normalidad, resulta obvio
que la medida ms inmediata es la transformacin de la variable dependiente
(3)
, aunque otra alternativa
son los cada vez ms utilizados modelos de regresin no paramtrica
(4)
, que evitan la suposicin de una
distribucin gaussiana. Tambin se debe modificar el modelo en el caso de datos dependientes o valores
repetidos
(5)
.
Pr edi cci n.
Cuando se verifican las hiptesis sobre las que se asienta el modelo, la recta de regresin puede ser
utilizada para predecir el valor medio de la variable Y para cada valor concreto de X. Calculando la
esperanza matemtica en ambos lados de la ecuacin (1) se obtendr:

de modo que la lnea de regresin proporciona un estimador del valor medio de Y para cada valor de X.
Como tal estimador, debemos considerar la incertidumbre asociada a esta recta, que puede ser reflejada
mediante regiones de confianza que contienen a la recta. En la Figura 5 se muestra, superpuesta al
diagrama de dispersin, la recta de regresin en el ejemplo de la tensin sistlica que estamos manejando,
as como una regin de confianza para la misma, que contendr a la verdadera relacin entre tensin
sistlica y edad con una seguridad del 95%.


Fi gur a 5. I nt er v al os de conf i anza al 95 % par a l a Rect a de Regr esi n
y par a l a Pr edi cci n de l a Pr esi n Si st l i ca en un i ndi v i duo.

Tambin se puede utilizar la recta de regresin como estimador del valor de Y en un individuo concreto.
En este caso se esperar una mayor incertidumbre en la estimacin que en el caso de predecir una
tendencia media. En la Figura 4 se muestra adems la banda de prediccin para el ejemplo que estamos
manejando, siendo sta mucho ms amplia que en el caso de intentar predecir el valor medio.
La regresin lineal simple es entonces una tcnica sencilla y accesible para valorar la relacin entre dos
variables cuantitativas en la prctica clnica
(6)
, proponiendo adems un modelo al que se ajusta dicha
relacin. No debemos olvidar que a lo largo de este artculo hemos abordado el caso ms sencillo en el
que se obvia el problema de un nmero ms elevado de variables entre las que valorar la relacin. En este
caso entraramos de lleno en la temtica de la regresin lineal mltiple
(7)
, lo cual nos obligara a abordar
problemas de ndole ms complicado como el de la colinealidad, interaccin entre variables, variables
confusoras o un anlisis ms detallado de los residuos del modelo. As mismo, no se debe pasar por alto el
hecho de que en la mayora de las aplicaciones prcticas la relacin que se observa entre pares de
variables no es tanto lineal como de tipo curvilneo (ya sea una relacin logartmica, exponencial,
polinmica, etc.). En estos casos, aunque se puede hablar de regresin curvilnea segn el tipo de
relacin, una conveniente transformacin de las variables reduce el problema al caso que acabamos de
abordar.
Bi bl i ogr af a
1.- Pita Fernndez S, Rey Sierra T, Vila Alonso MT. Relaciones entre variables cuantitativas (I).
Cadernos de Atencin Primaria 1997; 4: 141-145.
2.- Seber GAF. Linear Regression Analysis. New York: John Wiley & Sons, 1977.
3.- Bland JM, Altman DG. Statistics Notes: Transforming data. BMJ 1996; 312:770. [Medline] [texto
completo]
4.- Hrdle. Aplied Nonparametric Regression. Cambridge: University Press, 1990.
5.- Statistics notes: Correlation, regression and repeated data. BMJ 1994; 308: 896. [texto completo]
6.- Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman & Hall;
1997.
7.- Etxebarra Murgiondo, J. Regresin Mltiple. Madrid: La Muralla; 1999.
I nvest igacin: Tcnicas de r egresin: regresin lineal mlt iple 1/ 6

Tcnicas de regresin: Regresin Lineal Mltiple

______________________________________
La mayora de los estudios clnicos conllevan la obtencin de datos en un nmero ms o menos extenso
de variables. En algunos casos el anlisis de dicha informacin se lleva a cabo centrando la atencin en
pequeos subconjuntos de las variables recogidas utilizando para ello anlisis sencillos que involucran
nicamente tcnicas bivariadas. Un anlisis apropiado, sin embargo, debe tener en consideracin toda la
informacin recogida o de inters para el clnico y requiere de tcnicas estadsticas multivariantes ms
complejas. En particular, hemos visto como el modelo de regresin lineal simple es un mtodo sencillo
para analizar la relacin lineal entre dos variables cuantitativas. Sin embargo, en la mayora de los casos
lo que se pretende es predecir una respuesta en funcin de un conjunto ms amplio de variables, siendo
necesario considerar el modelo de regresin lineal mltiple como una extensin de la recta de regresin
que permite la inclusin de un nmero mayor de variables.
Est i maci n de par met r os y bondad de aj ust e.
Generalizando la notacin usada para el modelo de regresin lineal simple, disponemos en n individuos
de los datos de una variable respuesta Y y de p variables explicativas
X
1
,X
2
,...,X
p
. La situacin ms sencilla que extiende el caso de una nica variable regresora es aquella en
la que se dispone de informacin en dos variables adicionales. Como ejemplo, tomemos la medida de la
tensin arterial diastlica en setenta individuos de los que se conoce adems su edad, colesterol e ndice
de masa corporal (Tabla 1). Es bien conocido que el valor de la tensin arterial diastlica vara en funcin
del colesterol e ndice de masa corporal de cada sujeto. Al igual que ocurra en el caso bidimensional, se
puede visualizar la relacin entre las tres variables en un grfico de dispersin, de modo que la tcnica de
regresin lineal mltiple proporcionara el plano que mejor ajusta a la nube de puntos resultante (Fig. 1).
Fi gur a 1. Pl ano de r egr esi n par a l a Tensi n Ar t er i al Di ast l i ca aj unt ando por
Col est er ol e ndi ce de Masa Cor por al



Del grfico se deduce fcilmente que los pacientes con tensin arterial diastlica ms alta son aquellos
con valores mayores de colesterol e ndice de masa corporal. Si el nmero de variables explicativas
aumenta (p>2) la representacin grfica ya no es factible, pero el resultado de la regresin se generaliza al
caso del mejor hiperplano que ajusta a los datos en el espacio (p+1)-dimensional correspondiente.
Tabl a 1. Edad, Col est er ol , ndi ce de Masa Cor por al y Tensi n Ar t er i al
Di ast l i ca de 70 paci ent es.
EDAD COLESTEROL I MC TAD EDAD COLESTEROL I MC TAD
1 42 292 31,64 97 36 53 187 23,31 80
2 64 235 30,80 90 37 43 208 27,15 65
3 47 200 25,61 80 38 57 246 21,09 80
4 56 200 26,17 75 39 64 275 22,53 95
5 54 300 31,96 100 40 43 218 19,83 75
6 48 215 23,18 67 41 47 231 26,17 75
7 57 216 21,19 , 42 58 200 25,95 90
8 52 254 26,95 70 43 58 214 26,30 75
9 67 310 24,26 105 44 48 230 24,89 70
10 46 237 21,87 70 45 62 280 26,89 100
11 58 220 25,61 70 46 54 198 21,09 65
12 62 233 27,92 75 47 67 285 31,11 95
13 49 240 27,73 90 48 68 201 21,60 80
14 56 295 22,49 95 49 55 206 19,78 65
15 63 310 , 95 50 50 223 22,99 75
16 64 268 30,04 90 51 53 290 32,32 95
17 67 243 23,88 85 52 63 315 31,14 100
18 49 239 21,99 75 53 60 220 28,89 80
19 53 198 26,93 75 54 46 230 20,55 75
20 59 218 , 85 55 45 175 22,49 70
21 65 215 24,09 70 56 53 213 22,53 70
22 67 254 28,65 105 57 59 220 20,82 65
23 49 218 25,71 85 58 62 287 32,32 95
24 53 221 25,33 80 59 60 290 33,91 90
25 57 237 25,42 90 60 62 209 20,76 75
26 47 244 23,99 85 61 58 290 31,35 80
27 58 223 25,20 70 62 57 260 31,14 95
28 48 198 25,81 85 63 49 202 20,76 80
29 51 234 26,93 80 64 61 214 19,59 90
30 49 175 27,77 80 65 52 231 20,08 75
31 68 230 30,85 70 66 59 280 31,60 100
32 58 248 21,61 75 67 50 220 25,34 70
33 54 218 26,30 95 68 46 233 22,86 75
34 59 285 31,44 100 69 44 215 19,53 70
35 45 253 25,00 75 70 60 202 19,10 65
En el caso general, el modelo de regresin lineal mltiple con p variables responde a la ecuacin:
(1)
de modo que los coeficientes se estiman siguiendo el criterio de mnimos cuadrados:


La obtencin aqu de las expresiones de los estimadores mnimo cuadrticos de dichos coeficientes
exigen reescribir la expresin (1) utilizando notacin matricial. As, (1) quedara:

donde:

De donde los estimadores mnimo cuadrticos se obtienen a partir de la ecuacin:

y mantienen una interpretacin anloga al caso de la regresin lineal simple (i.e. representa el
incremento por trmino medio en la variable respuesta por cada unidad adicional en la variable ).
Como se puede observar, la obtencin de estimadores, intervalos de confianza y contrastes de hiptesis
para los coeficientes de regresin involucran expresiones matriciales y distribuciones multivariantes que
complican notablemente las operaciones, por lo que en la prctica dichos clculos se obtienen de un modo
inmediato mediante el manejo de diferentes paquetes estadsticos. Son muchos los textos en los que se
pueden encontrar desarrollos tericos de dichas expresiones
(1),(2)
. Sin detenerse en ello, basta decir que
manteniendo las hiptesis habituales de independencia, homocedasticidad, normalidad y linealidad se
calculan expresiones para el error estndar de cada coeficiente estimado e intervalos de confianza de
modo anlogo al caso de la regresin simple. La significacin estadstica de cada variable se obtiene
simplemente calculando el cociente entre el coeficiente estimado y su error tpico, y comparndolo con el
cuantil correspondiente de una distribucin t de Student con n-p-1 grados de libertad. La bondad de ajuste
del modelo se puede valorar mediante la varianza residual y el estadstico R
2
(coeficiente de
determinacin), definidos de la forma habitual. Tambin aqu puede utilizarse el contraste F global de la
regresin, calculado a partir de las sumas de cuadrados explicada y no explicada para valorar la utilidad
del modelo. Como ejemplo, tras ajustar un modelo de regresin mltiple a los datos que se muestran en la
Tabla 1 usando como variables predictoras de la tensin diastlica el colesterol e ndice de masa corporal
de un individuo, los coeficientes de regresin para ambas variables fueron 0.18 (E.T. 0.03) y 0.73 (E.T.
0.30) respectivamente, siendo ambos significativamente distintos de cero (Tabla 2). Esto indica que por
trmino medio la tensin arterial diastlica de un paciente se incrementa en 1.8 y 7.3 respectivamente por
cada 10 unidades a mayores en su colesterol o ndice de masa corporal. El valor del coeficiente de
determinacin R
2
=52% y la significacin del contraste F global de la regresin (p<0.001) sugieren que
gran parte de la variabilidad de la respuesta viene explicada por el modelo ajustado.


Tabl a 2. Model o de r egr esi n l i neal ml t i pl e par a l a t ensi n ar t er i al
di ast l i ca aj ust ando por col est er ol e ndi ce de masa cor por al .
Const ant e 19.42 7.54 ( 4.37; 34.48) 2.58 0.012
Colest erol 0.18 0.03 ( 0.11; 0.25) 5.26 < 0.001
I MC 0.73 0.30 ( 0.14; 1.33) 2.45 0.017
Suma de Cuadr ados g.l . Medi a cuadr t i ca F p
Regr esin 4,449.72 2 2,224.86 34.93 < 0.001
Residual 4,076.40 64 63.69
Tot al 8,526.12 66
El hecho de contar con un nmero ms extenso de variables exige que adems del contraste F global se
puedan realizar pruebas parciales para constatar si un grupo de variables aadidas a un modelo lo
mejoran. Supongamos que al modelo (1) se suma una nueva variable explicativa . La proporcin de
variabilidad residual que es explicada al introducir esta nueva variable viene dada por la diferencia en las
sumas de cuadrados de cada modelo:

Para valorar si la introduccin de la nueva variable queda compensada por una mejora significativa en la
prediccin de la respuesta se utiliza el estadstico:

que se compara con el cuantil correspondiente de una distribucin F de Snedecor con 1 y n-p-2 grados de
libertad. Dicho contraste se denomina contraste F parcial. Para comprobar el uso de dicho estadstico
consideremos en el ejemplo anterior el modelo de regresin simple que resulta de tomar como nica
variable regresora el colesterol de un individuo (Tabla 3). El valor del estadstico R
2
en este caso es del
69.1% frente al 72.2% del modelo que se consigue introduciendo el ndice de masa corporal como nueva
variable explicativa. El cambio en el estadstico R
2
es de 0.045 que coincide con el cuadrado del
coeficiente de correlacin parcial entre la tensin arterial y el ndice de masa corporal ajustando por el
colesterol. La significacin del contraste F parcial para la introduccin del ndice de masa corporal es de
0.017, indicando que el modelo con dos variables mejora al modelo ms simple.
Tabl a 3. Model o de r egr esi n l i neal si mpl e par a l a t ensi n ar t er i al
di ast l i ca aj ust ando por col est er ol .
Const ant e 26.91 7.15 ( 12.63; 41.19) 3.76 < 0.001
Colest erol 0.23 0.03 ( 0.17; 0.29) 7.70 < 0.001
Regr esin 4,067.11 1 4,067.11 59.29 < 0.001
Residual 4,459.01 65 68.60
Tot al 8,526.12 66
Es importante recalcar la necesidad de uso de mtodos estadsticos multivariantes para estudiar
correctamente la relacin entre ms de dos variables. La aplicacin de las tcnicas de regresin ha sido
tratada en diversos textos
(3),(4),(5),(6)
desde un punto de vista eminentemente prctico. Aunque el modelo de
regresin se ha planteado inicialmente para analizar la relacin entre variables cuantitativas, su
generalizacin al caso de variables regresoras cualitativas es inmediata. Este tipo de anlisis recibe el
nombre de anlisis de covarianza o anlisis de varianza segn contenga o no adems variables numricas.
La limitacin de este modelo por considerar que la relacin de cada variable con la respuesta es de tipo

lineal queda solventada mediante la transformacin (logartmica, cuadrtica,...) de cada variable
regresora.
Sel ecci n de v ar i abl es.
Una de las principales dificultades a la hora de ajustar un modelo de regresin mltiple surge cuando es
necesario identificar entre el conjunto de variables disponibles aquellas que estn relacionadas con la
respuesta y que la predicen de la mejor forma posible. Cuando el nmero de variables es reducido, como
en el ejemplo manejado, la seleccin no resulta complicada. Una primera alternativa es construir un
modelo por inclusin o hacia delante ("forward"), considerando en primer lugar la relacin de cada
variable con la respuesta e ignorando todas las dems variables, valorndola por medio del coeficiente de
correlacin lineal de Pearson (Figura 2). Aquella que muestra una correlacin ms alta con la variable
dependiente (en este caso el colesterol) se introduce en un modelo inicial (Tabla 3).
El segundo paso consiste en seleccionar entre las variables restantes aquella que al introducirla en el
modelo permite explicar una mayor parte de la variabilidad residual. La comparacin entre distintos
modelos debe hacerse en trminos del valor relativo de los coeficientes de determinacin y el contraste F
parcial. Ya vimos como la inclusin del ndice de masa corporal reportaba una mejora en el modelo de
regresin simple. La introduccin de la variable edad, en cambio, proporciona un cambio en el coeficiente
de determinacin de 0.028 que no resulta en una mejora significativa (p=0.059). Este esquema se repetira
hasta que ninguna otra variable entrase a formar parte del modelo. En el ejemplo el ltimo paso sera
comprobar si la introduccin de la variable edad produce una mejora del ajuste del modelo mostrado en la
Tabla 2. El modelo ajustando por las tres variables se muestra en la Tabla 4. El coeficiente
correspondiente a esta ltima variable no es significativo (ntese que esta significacin ha de coincidir
con la del contraste F parcial correspondiente).
Tabl a 4. Model o de r egr esi n l i neal ml t i pl e par a l a t ensi n ar t er i al
di ast l i ca aj ust ando por col est er ol , ndi ce de masa cor por al y edad.
Const ant e 10.55 9.13 ( - 7.70; 28.81) 1.15 0.252
Colest erol 0.17 0.03 ( 0.1; 0.24) 4.84 < 0.001
I MC 0.68 0.30 ( 0.09; 1.28) 2.31 0.024
Edad 0.24 0.14 ( - 0.05; 0.53) 1.67 0.100
Regr esin 4,622.52 3 1,540.84 24.87 < 0.001
Residual 3,903.60 63 61.96
Tot al 8,526.12 66
En la mayora de los casos se dispone de informacin en un conjunto mucho ms amplio de variables de
las que se desconoce cules estn relacionadas o pueden utilizarse para predecir la respuesta de inters. La
identificacin del conjunto de variables que proporcionan el mejor modelo de regresin depender en
gran medida del objetivo del estudio y de experiencias previas. As, aunque la prctica habitual es
eliminar del modelo aquellas variables que no resultan significativas, puede ser recomendable
mantenerlas en caso de que en experiencias previas se haya constatado una relacin con la variable
dependiente. La mayora de paquetes estadsticos proporcionan una variedad de tcnicas para identificar
el mejor conjunto de variables regresoras que introducen o eliminan sucesivamente variables atendiendo a
su significacin en el modelo (hacia delante, hacia atrs, pasos sucesivos). Existen otras alternativas
basadas en la comparacin de todos los modelos posibles que se pueden formar con un conjunto inicial de
variables. Todas estas tcnicas deben considerarse meramente orientativas. As, identificado el mejor
conjunto de variables y ajustado el modelo es conveniente realizar un anlisis de residuos exhaustivo para
valorar la posibilidad de elegir un modelo distinto a pesar de que tenga un valor menor de R
2
.
I nt er acci n, conf usi n y col i neal i dad.
Cuando se introduce ms de una variable en el modelo de regresin es necesario contrastar adems la
independencia de los efectos de todas ellas. Es decir, se supone que la asociacin de cada variable con la
respuesta no depende del valor que tomen el resto en la ecuacin de regresin. En otro caso se dir que

existe interaccin. Antes de aprobar el modelo definitivo, por lo tanto, se debe explorar la necesidad de
incluir trminos de interaccin calculados a partir del producto de pares de variables, comprobando si
mejora la prediccin, siendo aconsejable investigar solamente aquellas interacciones que puedan tener
una explicacin clnica.
En ocasiones el fenmeno de la interaccin se hace coincidir errneamente con los de confusin y
correlacin. Existe confusin cuando el efecto de una variable difiere significativamente segn se
considere o no en el modelo alguna otra. sta se asociar tanto con la variable inicial como con la
respuesta, de modo que en casos extremos puede invertir el primer efecto observado. En ese caso las
estimaciones adecuadas son aquellas que proporciona el modelo completo, y se dirn que estn
controladas o ajustadas por variables de confusin. Por otro lado, el fenmeno que se produce cuando dos
variables explicativas muestran una correlacin alta recibe el nombre de cuasi-colinealidad y puede
producir estimaciones inestables de los coeficientes que se traducen en valores desorbitados de sus errores
tpicos y resultados poco crebles. La mayora de paquetes estadsticos muestran en sus salidas
diagnsticos de colinealidad (tolerancia, factor de inflaccin de la varianza, ndice de condicin) que
pueden ayudarnos a solventar estos problemas. Por lo tanto, se ha de tener un cuidado especial en la etapa
de construccin del modelo: un cambio significativo en las estimaciones tras la inclusin de una nueva
variable puede evidenciar cualquiera de estos fenmenos. Nos corresponde a nosotros evaluar la
conveniencia de incluirla o no en el modelo.
Fi gur a 2. Cor r el aci n l i neal de l a edad, col est er ol e ndi ce de masa cor por al con l a
t ensi n ar t er i al di ast l i ca.

Bi bl i ogr af a
1. Snedecor G.W., Cochran W.G. Statistical Methods. 8th ed. Iowa State University Press; 1989.
2. Seber GAF. Linear Regression Analysis. New York: John Wiley & Sons; 1977.
3. Etxebarra Murgiondo, J. Regresin Mltiple. Madrid: La Muralla; 1999.
4. Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman &
Hall; 1997.
5. Carrasco J.L., Hernn M.A. Estadstica Multivariante en las Ciencias de la Salud. Madrid: Ed.
Ciencia 3; 1993.
6. Kleinbaum D.G., Kupper L.L. Applied Regression Analysis and other Multivariable Methods.
3
rd
. ed. Massachusetts: Duxbury Press; 1997.
I nvest igacin: Anlisis de supervivencia 1/ 14

Anlisis de supervivencia

Autor: Pita Fernndez, S. spita@canalejo.org
A Corua (Espaa)
Actualizacin 29/04/01
______________________________________
Introduccin
Los datos proporcionados por los estudios clnicos se expresan en mltiples ocasiones en trminos de
supervivencia. Esta medida no queda limitada a los trminos de vida o muerte, sino a situaciones en la
que se mide el tiempo que transcurre hasta que sucede un evento de inters, como puede ser tiempo de
recurrencia, tiempo que dura la eficacia de una intervencin, tiempo de un aprendizaje determinado, etc.
Por tanto, la supervivencia es una medida de tiempo a una respuesta, fallo, muerte, recada o desarrollo de
una determinada enfermedad o evento. El trmino supervivencia se debe a que en las primeras
aplicaciones de este mtodo de anlisis se utilizaba como evento la muerte de un paciente.
En las enfermedades crnicas, tales como el cncer, la supervivencia se mide como una probabilidad de
permanecer vivo durante una determinada cantidad de tiempo. La supervivencia al ao o a los 5 aos son
a menudo expresadas como indicadores de la severidad de una enfermedad y como pronstico.
Tpicamente, el pronstico del cncer se valora determinando el porcentaje de pacientes que sobrevive al
menos cinco aos despus del diagnstico.
Son muchos los textos que se pueden consultar acerca de la metodologa estadstica a emplear en estudios
de supervivencia
1-4
. Los objetivos de este trabajo son: familiarizarse con los conceptos y terminologa
bsica del anlisis de supervivencia, conocer cmo estimar la proporcin acumulada de supervivencia, as
como los tests estadsticos a emplear para comparar dos curvas de supervivencia.
Conceptos bsicos
La observacin de cada paciente se inicia al diagnstico (tiempo = 0) y continua hasta la muerte o hasta
que el tiempo de seguimiento se interrumpe. Cuando el tiempo de seguimiento termina antes de
producirse la muerte o antes de completar el perodo de observacin se habla de paciente censurado
(Figuras 1 y 2).
El periodo de seguimiento puede terminar por las siguientes razones:
a. El paciente decide no participar ms en el estudio y lo abandona.
b. El paciente se pierde y no tenemos informacin.
c. El estudio termina antes de aparecer el evento.
Cuando los tiempos de supervivencia no se conocen con exactitud, los datos se consideran censurados.
No se conoce el tiempo hasta el suceso de inters (muerte, recada) porque los individuos en el estudio
pueden haberse perdido o retirado, o el suceso puede no haber ocurrido durante el perodo de estudio.
El seguimiento viene definido por una fecha de inicio y una fecha de cierre que determinan el tiempo de
seguimiento. Las fechas de inicio y cierre son diferentes para cada individuo, pues los pacientes o
personas incluidas en el estudio se incorporan en momentos diferentes.
En las observaciones incompletas (censuradas) el evento de inters no se ha producido, ya sea porque el
estudio se finaliz antes de la aparicin del evento, el paciente decide abandonar y no participar en el
estudio, perdemos al paciente por cambio en el lugar de residencia, muerte no relacionada con la
investigacin, etc.

El tiempo de supervivencia se define como el tiempo transcurrido desde el acontecimiento o estado inicial
hasta el estado final.
El estado inicial debe ser definido de manera que la fecha en que se produjo el evento pueda ser conocida
exactamente (fecha de diagnstico, fecha de la intervencin quirrgica, fecha de inicio de la radioterapia
o quimioterapia, etc.). Como previamente se seal las fechas correspondientes al estado inicial son
diferentes para cada sujeto.
El acontecimiento o suceso estudiado tambin debe estar perfectamente definido para poder determinar
exactamente la fecha del mismo. Este evento est casi siempre asociado a la muerte del paciente pero no
tiene por que ser as, ya que puede hacer referencia tambin a la fecha de alta, la fecha de remisin de la
enfermedad, la fecha de recidiva, la fecha de recada o fallo, etc.
En caso de estudiar la supervivencia, el evento considerado no es que se produzca o no la muerte, sino la
muerte relacionada con la enfermedad. Si consideramos una muerte no relacionada con la enfermedad
introduciremos un sesgo de informacin. El paciente fallecido por una causa que no est vinculada al
evento de inters debe ser considerado como censurado y computar su tiempo de seguimiento como
incompleto o perdido.
En la ltima observacin se deben registrar dos variables fundamentales, la primera es el estado del sujeto
y la segunda es la fecha de la informacin de dicho estado. El perodo de tiempo transcurrido entre la
fecha de entrada y la fecha de la ltima observacin o contacto se conoce como tiempo de participacin
en el estudio. Si el paciente ha fallecido podremos con la fecha de defuncin calcular el tiempo de
supervivencia. Si el paciente est vivo a la fecha de la ltima observacin se podr calcular el tiempo
incompleto o censurado aportado por dicho paciente.
Los factores que modifican la supervivencia de un paciente pueden ser variables fijas en el tiempo como
el sexo, factores genticos... o variables que se modifican en el tiempo como la intensidad de exposicin a
una dieta, los cigarrillos/da, las intervenciones o tratamientos, la recurrencia, etc.
Los requisitos necesarios para disponer de datos adecuados para un anlisis de supervivencia son:
a. Definir apropiadamente el origen o inicio del seguimiento.
b. Definir apropiadamente la escala del tiempo.
c. Definir apropiadamente el evento.
Limitaciones e imprecisiones de los datos
Los datos de nuestro estudio pueden estar sesgados por las censuras o los truncamientos.
Gnesis de censuras: Prdidas de seguimiento o fin del estudio.
Gnesis de truncamientos: Entrada en el estudio despus del hecho que define el origen.
Censuras:
No se observan los eventos en todos los individuos (abandonos, prdidas).
No se espera lo suficiente... a que aparezca el evento.
Truncamientos: No se observa la ocurrencia de origen en todos los individuos. Se tendra que haber
empezado con anterioridad ya que la enfermedad habra empezado antes.
Tipos de observaciones:
La combinacin de las observaciones previamente indicadas nos llevara a poder tener en nuestros datos
observaciones de diferentes tipos:

a. No truncada, no censurada:
t I +

El proceso se inicia en I pero el evento ocurre en t.
b. No truncada, censurada:
.......... I

El proceso se inicia en I pero el evento no se presenta durante el seguimiento realizado.
c. Truncada, no censurada:
t + . ..........

Ya se tena el proceso antes de entrar en el estudio (el diagnstico o fecha de inicio est
atrasada) y el evento se produce en t.
d. Truncada, censurada:
. .......... .........

Ya se tena el proceso antes de entrar en el estudio, como en la situacin anterior pero el evento
no se presenta durante el seguimiento realizado.
En el anlisis de la supervivencia asumimos un supuesto bsico: los mecanismos del evento y censura son
estadsticamente independientes, o el sujeto censurado en C es representativo de los que sobreviven en C.
Es decir, los no censurados representan bien a los censurados.
Metodologa estadstica
El anlisis de datos para estudios de supervivencia requiere mtodos de anlisis especficos por dos
razones fundamentales:
a. Los investigadores muy frecuentemente analizan los datos antes de que todos los pacientes
hayan muerto, ya que si no habra que esperar muchos aos para realizar dichos estudios. Los
datos aportados por los pacientes vivos, como se seal previamente, son observaciones
censuradas y deben considerarse como tales a la hora de analizarlas.
b. La segunda razn por la que se necesitan mtodos especiales de anlisis es porque tpicamente
los pacientes no inician el tratamiento o entran al estudio al mismo tiempo.
En la metodologa estadstica bsica se sealaba la existencia de pruebas paramtricas y no paramtricas.
En el anlisis de supervivencia, el anlisis de los datos puede ser realizado utilizando tcnicas
paramtricas y no paramtricas.
Paramtricas: (las ms frecuentes)
o Distribucin Exponencial.
o Distribucin de Weibull.
o Distribucin Lognormal.
No paramtricas:
o Kaplan-Meier.
o Logrank.
o Regresin de Cox.

Los mtodos estadsticos ms utilizados son los no paramtricos. As, las curvas de supervivencia por lo
general se producen usando uno de dos mtodos: el anlisis actuarial o el mtodo del lmite de producto
de Kaplan-Meier
5
.
El mtodo Kaplan-Meier calcula la supervivencia cada vez que un paciente muere. El anlisis actuarial
divide el tiempo en intervalos y calcula la supervivencia en cada intervalo. El procedimiento Kaplan-
Meier da proporciones exactas de supervivencia debido a que utiliza tiempos de supervivencia precisos;
el anlisis actuarial da aproximaciones, debido a que agrupa los tiempos de supervivencia en intervalos.
Antes de que se extendiera el uso de ordenadores, el mtodo actuarial era ms fcil de usar para un
nmero muy grande de observaciones.
El mtodo actuarial implica dos premisas en los datos: la primera es que todos los abandonos durante un
intervalo dado ocurren aleatoriamente durante dicho intervalo. Esta premisa es de escasa importancia
cuando se analizan intervalos de tiempo cortos, sin embargo, puede haber un sesgo importante cuando los
intervalos son grandes, si hay numerosos abandonos o si los abandonos no ocurren a mitad del intervalo.
El mtodo Kaplan-Meier supera estos problemas. La segunda premisa es que aunque la supervivencia en
un tiempo dado depende de la supervivencia en todos los perodos previos, la probabilidad de la misma en
un perodo de tiempo es independiente de la probabilidad de supervivencia en los dems perodos.
El mtodo de Kaplan-Meier se utiliza cuando la muestra es menor de 30 y tambin para muestras mayores
de 30 y se conocen los tiempos individuales de los censurados y no censurados.
Mtodo de Kaplan-Meier
Conocido tambin como del limite del producto. La caracterstica distintiva del anlisis con este
mtodo es que la proporcin acumulada que sobrevive se calcula para el tiempo de supervivencia
individual de cada paciente y no se agrupan los tiempos de supervivencia en intervalos. Por esta razn es
especialmente til para estudios que utilizan un nmero pequeo de pacientes. El mtodo de Kaplan-
Meier incorpora la idea del tiempo al que ocurren los eventos
5
.
La validez de este mtodo descansa en dos suposiciones:
1. Las personas que se retiran del estudio tienen un destino parecido a las que
quedan.
2. El perodo de tiempo durante el cual una persona entra en el estudio no tiene
efecto independiente en la respuesta.
Ejemplo 1
El ejemplo se basa en datos publicados por Pratt, et al
6
. Se recogieron los intervalos libres de enfermedad
(tiempos de remisin) de 20 pacientes con osteosarcoma, a los que se trataba con 3 meses de
quimioterapia despus de amputacin.
11 pacientes recayeron a los 6, 8, 10, 11, 12, 13, 13, 22, 32, 34, 36 meses.
8 pacientes se retiraron vivos al final del estudio contribuyendo 3, 7, 7, 11, 14, 16, 20, 20 meses
de observacin, sin haber sufrido recadas.
Un paciente rehus continuar la terapia a los 11 meses y se retir del estudio libre de
enfermedad.
Con estos datos se construye la Tabla 1 para calcular la proporcin acumulativa que sobreviven hasta el
tiempo t, o tasa de supervivencia acumulativa, de la siguiente forma:
Columna 1: Se hace una lista con todos los tiempos de supervivencia, censurada o no censurada, en orden
de menor a mayor.

Se coloca un signo positivo al lado de cada observacin censurada. Para observaciones censuradas y no
censuradas que tienen el mismo tiempo de supervivencia, se debe colocar la observacin no censurada
primero.
Columna 2: Una vez ordenados de menor a mayor los datos, en esta columna se numeran las
observaciones.
Columna 3: Colocar el nmero de orden (rango) de las observaciones no censuradas (eventos, en este
ejemplo recadas).
Columna 4: Calcular la proporcin de pacientes que sobrevive a cada intervalo.
1 +
r n
r n

donde n es el tamao de la muestra y r el rango no censurado.
Esta columna calcula la probabilidad de supervivencia para cada tiempo.
Columna 5: Calcular el estimador de la proporcin acumulativa que sobrevive. Se realiza multiplicando
los valores de la columna anterior (0,95 0,94 = 0,89).
De este modo, la probabilidad de vivir un cierto perodo de tiempo (hasta el instante t) desde el principio
del estudio, es el producto de la probabilidad acumulada de sobrevivir hasta el perodo del tiempo anterior
a t, (t-1), multiplicado por la probabilidad de sobrevivir durante el intervalo (t-1; t).
La probabilidad de supervivencia puede representarse grficamente como se muestra en la Figura 3.
Ejemplo 2
Supongamos ahora que disponemos de los datos de supervivencia de 10 pacientes que han sido
aleatoriamente asignados a los tratamientos A y B (datos hipotticos).
Tratamiento:
A. 3, 5, 7, 9+, 18
B. 12, 19, 20, 20+, 33+
9+ indica dato censurado y, por tanto, no ha presentado el evento (en este caso morir de cncer), como
tampoco lo han presentado las observaciones 20+ y 33+. Con estos datos se construye la Tabla 2 para
calcular la proporcin acumulativa que sobreviven hasta el tiempo t, o tasa de supervivencia acumulativa,
de la misma forma que se indic en el ejemplo previo.
Una vez calculada la probabilidad de supervivencia, sta puede representarse grficamente (Figura 4). Si
la ltima observacin es censurada, el estimador no llega a cero, como se ve en la Figura 4 en el caso del
tratamiento B. Los peldaos de la escalera que desciende se deben a los tiempos no censurados.
Mtodo actuarial
Con el mtodo actuarial, los tiempos de supervivencia se agrupan en intervalos. La longitud del intervalo
depende de la frecuencia con que ocurre el suceso de inters.
Los intervalos no necesitan ser de la misma longitud. El mtodo de la tabla vital o anlisis actuarial se
conoce en la bibliografa mdica como el mtodo de Cutler-Ederer
7
.

Este mtodo asume:
1. Las retiradas y las prdidas se distribuyen homogneamente en el intervalo. Por tanto, el nmero
de personas a riesgo en un intervalo es igual al nmero de personas que entra menos la mitad del
nmero que se pierde o retira del intervalo.
2. Las personas que se retiran del estudio tienen un destino parecido a las que se quedan.
3. El perodo de tiempo durante el cual una persona entra en el estudio no tiene efecto
independiente en la respuesta.
Ejemplo 3
Se utilizan para este ejemplo los datos de la Tabla 3
7
. Para ello, los clculos se realizan como sigue:
Columna 1: Intervalos de tiempo desde el inicio del estudio. La amplitud de los intervalos puede ser
variable.
Columna 2: Nmero de individuos en cada intervalo. Es el nmero que entra en cada intervalo. El nmero
que entra en el primer intervalo es el nmero total que entra en el estudio. El nmero que entra en otros
intervalos es el nmero que estaba presente al principio del intervalo previo menos aqullos que se
perdieron, retiraron o murieron (recayeron) en el intervalo anterior.
Columna 3: Nmero de muertos o eventos en cada intervalo.
Columna 4: Nmero de pacientes perdidos en el seguimiento o abandonos vivos.
Columna 5: Proporcin condicional de recaer durante el intervalo.
Este estimador de la probabilidad condicional de recada durante cualquier intervalo dada la exposicin al
riesgo de recaer se calcula como:
[ ] ( ) 2 / / w n d q =

donde
d = muertes o eventos durante el intervalo.
n = vivos al inicio del intervalo.
w = abandono vivo o prdida de seguimiento.
Columna 6: Proporcin condicional que sobrevive libre de enfermedad: la proporcin condicional que
sobrevive durante el intervalo es igual a 1-proporcin condicional de recaer durante el intervalo (1-
columna 5).
Columna 7: Proporcin acumulativa que sobrevive libre de enfermedad. Esta proporcin es un estimador
de la tasa de supervivencia acumulativa. Es igual a la proporcin condicional que sobrevive libre de
enfermedad durante los intervalos previos. El valor del primer intervalo es siempre de 1.
Comparacin de dos curvas de supervivencia
Para comparar si las diferencias observadas en dos curvas de supervivencia pueden ser explicadas o no
por el azar, debemos realizar un test estadstico. Si no hubiese observaciones censuradas la prueba no
paramtrica de suma de rangos de Wilcoxon podra ser apropiada para comparar dos muestras
independientes. Como la mayora de las veces hay datos censurados debemos utilizar otras tcnicas.
La prueba de la t de Student para datos independientes comparando la supervivencia en uno y otro grupo
tampoco es apropiada, pues los tiempos de supervivencia no presentan una distribucin normal.

Hay diversas pruebas para comparar distribuciones de supervivencia. Aqu sealaremos la prueba de
logaritmo del rango (logrank). Para realizar esta prueba, existen a su vez diversos mtodos.
Esta prueba compara en esencia el nmero de eventos (muertes, fracasos) en cada grupo con el nmero de
fracasos que podra esperarse de las prdidas en los grupos combinados. Se emplea la prueba del chi-
cuadrado para analizar las prdidas observadas y esperadas.
Para el clculo se disponen los datos de tal forma que se objetive en cada grupo y en cada mes (aos, etc.)
los pacientes en riesgo y los eventos presentados.
Si utilizamos los datos del Ejemplo 2 para la estimacin de Kaplan-Meier previamente sealado,
podremos construir la Tabla 4.
El nmero esperado de prdidas para un grupo se calcula multiplicando el nmero total de prdidas en un
perodo dado por la proporcin de pacientes en ese grupo. As por ejemplo, en el mes 7 hay una prdida;
de modo que
9
4
1
es el nmero de prdidas que se espera ocurran en el grupo A y
9
5
1
es el nmero
de prdidas que se espera para el grupo B.
En la primera columna se ponen los meses en los que se objetivaron eventos (muertes). Se trata por lo
tanto de tiempos no censurados.
En la 2 y 3 columna debe colocarse el n de pacientes en cada grupo que estuvieron a riesgo hasta la
presencia del evento.
En la columna 4 se pone el nmero total de pacientes.
En las columnas 5 a 7 se ponen los pacientes que tuvieron el evento en ese tiempo y el total.
Se calculan los totales para prdidas observadas y esperadas y el test siguiente puede utilizarse para
probar la hiptesis nula de que las distribuciones de supervivencia son iguales en los dos grupos.
( ) ( )
2
2
2 2
1
2
1 1 2
E
E O
E
E O
+
=

donde:

1
O
es el nmero total prdidas observadas en el grupo 1.

1
E
es el nmero total de prdidas esperadas en el grupo 1.

2
O
es el nmero total de prdidas observadas en el grupo 2.

2
E
es el nmero total de prdidas observadas en el grupo 2.
El test
2
sigue una distribucin chi cuadrado con un grado de libertad.

( ) ( )
21 , 4 005 , 1 20 , 3
31 , 5
31 , 5 3
68 , 1
68 , 1 4
2 2
= + =

Consultando las tablas de una distribucin
2
con un grado de libertad se concluye que la diferencia es

significativa. Por lo tanto, se concluye que hay diferencia entre ambas curvas de supervivencia.
Los datos generados permiten a su vez realizar una estimacin del riesgo (OR).

21 , 4
31 , 5 / 3
68 , 1 / 4
2 / 2
1 / 1
= = =
E O
E O
OR

As, los pacientes con el tratamiento B sobreviven 4,21 veces ms que los del tratamiento A.
Bibliografa
1. Dawson-Saunders B, Trapp RG. Bioestadstica Mdica. Mexico: Editorial El Manual Moderno;
1993.
2. Breslow NE, Day NE. Statistical methods in cancer research. Vol. II. The design and analysis of
cohort studies. Lyon: IARC Scientific Publications; 1987.
3. Collet D. Modelling survival data in medical research. London: Chapman & Hall; 1994.
[Contenido]
4. Lee ET, Wang JW. Satistical Methods for suvirval data analysis. 3rd. ed. Belmont, CA: Lifetime
learning Publications; 2003. [Contenido]
5. Kaplan EL, Meier P. Nonparametric estimation from incomplete observations. J Am Stat Assoc
1958; 53: 457-481.
6. Pratt C, Shanks E, Hustu O, Rivera G, Smith J, Kumar AP. Adjuvant multiple drug
chemotherapy for osteosarcoma of the extremity. Cancer 1977;39(1):51-57. [Medline]
7. Cutler SJ, Ederer F. Maximum utilization of the life table method in analyzing survival. J
Chronic Dis 1958; 8: 699-712.


Figura 1. Esquema general de un estudio de supervivencia.
FECHA DE INICIO
DEL ESTUDIO
FECHA DE
ENTRADA
FECHA DE LTIMA
OBSERVACIN
FECHA DE
CIERRE
Tiempo de supervivencia
Tiempo incompleto (perdido)
Tiempo incompleto (retirado vivo)
Duracin del estudio


Figura 2. Seguimiento de pacientes con distinta fecha de entrada.
a = Paciente muerto
b = Paciente vivo y seguido hasta el final del estudio
c = Paciente perdido
b
b
a
a
c
c
c
a
FINAL DEL
ESTUDIO
Tiempo de estudio


Tabla 1. Mtodo para calcular la curva de supervivencia de
Kaplan-Meier.
Col umna 1 Col umna 2 Col umna 3 Col umna 4 Col umna 5
Ti empo de
super vi venci a
en meses
N de or den
Or den de l as
obser vaci ones
no censur adas
( r )
) 1 /( ) ( + r n r n

3+ 1 -- -- --
6 2 2 18/19 = 0,95 0,95
7+ 3 -- -- --
7+ 4 -- -- --
8 5 5 15/16 = 0,94 0,89
10 6 6 14/15 = 0,93 0,83
11 7 7 13/14 = 0,93 0,77
11+ 8 -- -- --
11+ 9 -- -- --
12 10 10 10/11 = 0,91 0,70
13 11 11 9/10 = 0,90 0,63
13 12 12 8/9 = 0,89 0,56*
14+ 13 -- -- --
16+ 14 -- -- --
20+ 15 -- -- --
20+ 16 -- -- --
22 17 17 3 / 4 = 0,75 0,42
32 18 18 2/3 = 0,67 0,28
34 19 19 1 / 2 = 0,50 0,14
36 20 20 0 0,0
*
Cuando hay un tiempo de supervivencia (13 meses) con valores de supervivencia
diferentes se utilizar como estimador el valor ms bajo (0,56).


Figura 3. Curvas de Kaplan-Meier. Ejemplo 1.
Tiempo en meses
40 30 20 10 0
P
r
o
b
a
b
i
l
i
d
a
d

d
e

s
u
p
e
r
v
i
v
e
n
c
i
a
1,0
,8
,6
,4
,2
0,0

Tabla 2. Mtodo para calcular la curva de supervivencia de
Kaplan-Meier. Ejemplo 2.
Col umna 1 Col umna 2 Col umna 3 Col umna 4 Col umna 5
Ti empo de
super vi venci a
en meses
N de or den
Or den de l as
obser vaci ones
no censur adas
( r )
) 1 /( ) ( + r n r n

Tr at ami ent o A
3 1 1 4/5=0,80 0,8
5 2 3 3/4=0,75 0,6
7 3 3 2/3=0,67 0,4
9+ 4 -- -- --
18 5 5 0 0,0
Tr at ami ent o B
12 1 1 4/5=0,80 0,80
19 2 2 3/4=0,75 0,60
20 3 3 2/3=0,67 0,40
20+ 4 -- -- --
30+ 5 -- -- --


Figura 4. Curvas de Kaplan-Meier. Ejemplo 2.
Tiempo en meses
35 30 25 20 15 10 5 0
P
r
o
b
a
b
i
l
i
d
a
d

d
e

s
u
p
e
r
v
i
v
e
n
c
i
a
1,0
,8
,6
,4
,2
0,0
Tratamiento A
Tratamiento B

Tabla 3. Mtodo actuarial para calcular la funcin de
supervivencia. Ejemplo 3.
Col umna 1 Col umna 2 Col umna 3 Col umna 4
I nt er val os de
t i empo
Vi v os al i ni ci o del
i nt er val o
Muer t es o event os
dur ant e el i nt er val o
( d)
Abandono vi v o o
pr di da de
segui mi ent o ( w )
0-5 949 731 18
5-10 200 52 16
10-15 132 14 75
15-20 43 10 33
Col umna 5 Col umna 6 Col umna 6
Pr obabi l i dad de
muer t e o del
event o
Pr obabi l i dad de
est ar l i br e del
event o
Pr obabi l i dad
acumul ada de
super vi venci a

q = d / (n-[w/2]) p
i
= 1 - q s = p
i
p
i-1

0-5
731 / (949-[18/2]) =
0,77
0,23 0,23
5-10
52 / (200-[16/2]) =
0,27
0,73 0,17 = 0,23 0,73
10-15
14 / (132-[75/2]) ) =
0,15
0,85 0,14 = 0,17 0,85
15-20
10 / (43-[33/2]) =
0,38
0,62 0,09 = 0,14 0,62


Tabla 4. Test de log-rank para comparar la probabilidad de
supervivencia entre grupos. Ejemplo 2.
Paci ent es en r i esgo Pr di das obser vadas Pr di das esper adas
Tratamiento Tratamiento Tratamiento
Mes del
event o
A B Total A B Total A B Total
3 5 5 10 1 0 1 0,50 0,50 1
5 4 5 9 1 0 1 0,44 0,56 1
7 3 5 8 1 0 1 0,38 0,62 1
12 1 5 6 0 1 1 0,16 0,83 1
18 1 4 5 1 0 1 0,20 0,8 1
19 0 4 4 0 1 1 0,0 1,0 1
20 0 3 3 0 1 1 0,0 1,0 1
4 3 7 1,68 5,31 7

I nvest igacin: Medidas de concordancia: el ndice de Kappa 1/ 5

Medidas de concordancia: el ndice de Kappa
Autores: Lpez de Ullibarri Galparsoro I, Pita Fernndez, S.
A Corua (Espaa)
_________________________________
En cualquier estudio de investigacin una cuestin clave es la fiabilidad de los procedimientos de medida
empleados. Como seala Fleiss
(1)
en el contexto de los estudios clnicos, ni el ms elegante de los diseos
sera capaz de paliar el dao causado por un sistema de medida poco fiable.
Tradicionalmente se ha reconocido una fuente importante de error de medida en la variabilidad entre
observadores
(1,2)
. Consecuentemente, un objetivo de los estudios de fiabilidad debe consistir en estimar el
grado de dicha variabilidad.
En este sentido, dos aspectos distintos entran a formar parte tpicamente del estudio de fiabilidad: de una
parte, el sesgo entre observadores dicho con menos rigor, la tendencia de un observador a dar
consistentemente valores mayores que otro y de otra, la concordancia entre observadores es decir,
hasta qu punto los observadores coinciden en su medicin.
Cindonos a este segundo aspecto, la manera concreta de abordar el problema depende estrechamente de
la naturaleza de los datos: si stos son de tipo continuo es habitual la utilizacin de estimadores del
coeficiente de correlacin intraclase, mientras que cuando se trata de datos de tipo categrico el
estadstico ms empleado es el ndice kappa, al que dedicamos el resto de este artculo.
El ndice kappa
Supongamos que dos observadores distintos clasifican independientemente una muestra de n tems en un
mismo conjunto de C categoras nominales. El resultado de esta clasificacin se puede resumir en una
tabla como la tabla 1, en la que cada valor x
ij
representa el nmero de tems que han sido clasificados por
el observador 1 en la categora i y por el observador 2 en la categora j.
Tabl a 1. For mat o de l os dat os en un est udi o de concor danci a
Obser vador 2
Obser vador 1 1 2 C Tot al
1 X
11
X
12
X
1C
X
1

2 X
21
X
22
X
2C
X
2

C X
C1
X
C2
X
CC
X
C

Tot al X
.1
X
.2
X
.C
n
Por ejemplo, podemos pensar en dos radilogos enfrentados a la tarea de categorizar una muestra de
radiografas mediante la escala: "anormal, "dudosa", "normal". La tabla 2 muestra un conjunto de datos
hipotticos para este ejemplo, dispuesto de acuerdo con el esquema de la tabla 1.


Tabl a 2. Dat os hi pot t i cos de cl asi f i caci n de una muest r a de 100
r adi ogr af as por dos r adi l ogos.
Radi l ogo 2
Radi l ogo 1 Anor mal Dudosa Nor mal Tot al
Anor mal 18 4 3 25
Dudosa 1 10 5 16
Nor mal 2 4 53 59
Tot al 21 18 61 100
Desde un punto de vista tpicamente estadstico es ms adecuado liberarnos de la muestra concreta (los n
tems que son clasificados por los dos observadores) y pensar en trminos de la poblacin de la que se
supone que ha sido extrada dicha muestra. La consecuencia prctica de este cambio de marco es que
debemos modificar el esquema de la tabla 1 para sustituir los valores x
ij
de cada celda por las
probabilidades conjuntas, que denotaremos por
ij
(tabla 3).
Tabl a 3. Modi f i caci n del esquema de l a Tabl a 1 cuando se consi der an
l as pr obabi l i dades de cada r esul t ado
Obser vador 2
Obser vador 1 1 2 C Mar gi nal
1
11

12

1

1

2
12

22

2C

2

C
C1

C2

CC
c
Mar gi nal .
1
.
2
.
C
1
Con el tipo de esquematizacin que hemos propuesto en las tablas 1 3 es evidente que las respuestas que
indican concordancia son las que se sitan sobre la diagonal principal. En efecto, si un dato se sita sobre
dicha diagonal, ello significa que ambos observadores han clasificado el tem en la misma categora del
sistema de clasificacin. De esta observacin surge naturalmente la ms simple de las medidas de
concordancia que consideraremos: la suma de las probabilidades a lo largo de la diagonal principal. En
smbolos, si denotamos dicha medida por
0
, ser

donde los ndices del sumatorio van desde i = 1 hasta i = C.
Como es obvio, se cumple que

correspondiendo el valor 0 a la mnima concordancia posible y el 1 a la mxima.
Aunque este sencillo ndice ha sido propuesto en alguna ocasin
(3)
como medida de concordancia de
eleccin, su interpretacin no est exenta de problemas. La tabla 4 ilustra el tipo de dificultades que
pueden surgir. En el caso A,
0
= 0.2, luego la concordancia es mucho menor que en el caso B, donde
0
= 0.8. Sin embargo, condicionando por las distribuciones marginales se observa que en el caso A la
concordancia es la mxima posible, mientras que en el B es la mnima.
Tabl a 4. Ej empl os de concor danci a.
A B
Obser vador 2 Obser vador 2
Obser vador 1 1 2 Mar gi nal Obser vador 1 1 2 Mar gi nal
1 0.1 0.8 0. 9 1 0.8 0.1 0. 9
2 0 0.1 0. 1 2 0.1 0 0. 1
Mar gi nal 0. 1 0. 9 1 Mar gi nal 0. 9 0. 1 1

Por lo tanto, parece claro que la bsqueda se debe orientar hacia nuevas medidas de concordancia que
tengan en cuenta las distribuciones marginales, con el fin de distinguir entre dos aspectos distintos de la
concordancia, a los que podramos aludir informalmente como concordancia absoluta o relativa
(4)
. El
ndice kappa representa una aportacin en esta direccin, bsicamente mediante la incorporacin en su
frmula de una correccin que excluye la concordancia debida exclusivamente al azar correccin que,
como veremos, est relacionada con las distribuciones marginales.
Con la notacin ya empleada en la tabla 3, el ndice kappa, , se define como

[1]
donde los ndices del sumatorio van desde i = 1 hasta i = C.
Es instructivo analizar la expresin anterior. Observemos en primer lugar que si suponemos la
independencia de las variables aleatorias que representan la clasificacin de un mismo tem por los dos
observadores, entonces la probabilidad de que un tem sea clasificado por los dos en la misma categora i
es
i. .i
. Por lo tanto, si extendemos el sumatorio a todas las categoras,
i. .i
es precisamente la
probabilidad de que los dos observadores concuerden por razones exclusivamente atribuibles al azar. En
consecuencia, el valor de simplemente es la razn entre el exceso de concordancia observado ms all
del atribuible al azar (
ii
-
i. .i
) y el mximo exceso posible (1 -
i. .i
)
(5)
.
La mxima concordancia posible corresponde a = 1. El valor = 0 se obtiene cuando la concordancia
observada es precisamente la que se espera a causa exclusivamente del azar. Si la concordancia es mayor
que la esperada simplemente a causa del azar, > 0, mientras que si es menor, < 0. El mnimo valor de
depende de las distribuciones marginales.
En el ejemplo de la tabla 4, vale 0.024 en el caso A y -0.0216 en el B, lo que sugiere una interpretacin
de la concordancia opuesta a la que sugiere el ndice
0
(vide supra). Para comprender resultados
paradjicos como stos
(6)
, conviene recordar los comentarios que hacamos ms arriba acerca de las
limitaciones del ndice
0
.
A la hora de interpretar el valor de es til disponer de una escala como la siguiente
(7)
, a pesar de su
arbitrariedad:
Val or aci n del ndi ce Kappa
Val or de k Fuer za de l a
concor danci a
< 0.20 Pobre
0.21 0.40 Dbil
0.41 0.60 Moderada
0.61 0.80 Buena
0.81 1.00 Muy buena
A partir de una muestra se puede obtener una estimacin, k, del ndice kappa simplemente reemplazando
en la expresin [1] las probabilidades por las proporciones muestrales correspondientes:
[2]
Con los datos de la tabla 2 se obtiene aplicando esta frmula un valor de k = 0.66, que segn nuestra
convencin anterior calificaramos como una buena concordancia.

Contrastes de hiptesis e intervalos de confianza.
La obtencin de una simple estimacin puntual del valor de no nos proporciona ninguna indicacin de
la precisin de dicha estimacin. Desde el punto de vista de la Estadstica Inferencial es esencial conocer
la variabilidad de los estimadores y emplear ese conocimiento en la formulacin de contrastes de
hiptesis y en la construccin de intervalos de confianza.
Fleiss, Cohen y Everitt
(8)
dan la expresin de la varianza asinttica es decir, para muestras infinitamente
grandes del estimador k, cuando el verdadero valor de es cero:
[3]
Reemplazando las probabilidades tericas, que desconocemos, por las proporciones muestrales,
obtenemos un estimador de
0
2
(k) que denotaremos por s
0
2
(k):
[4]
Podemos emplear este resultado para contrastar la hiptesis nula de que es cero frente a la alternativa de
que no lo es, utilizando como estadstico del contraste el cociente

[5]
(|k| denota el valor absoluto de k) y comparando su valor con los cuantiles de la distribucin normal
estndar. Con los datos de la tabla 2, k = 0.6600 y s
0
2
(k)= 0.0738, luego |k|/ s
0
(k)= 8.9441 y como z
0.975
=
1.96, concluimos que, al nivel de significacin = 0.05, el valor de k es significativo y nos lleva a
rechazar que sea cero.
Es discutible la utilidad del contraste de hiptesis anterior, ya que como en general es razonable esperar
cierto grado de concordancia ms all del azar, nos encontraremos trivialmente con un resultado
significativo. Para poder realizar contrastes de hiptesis ms interesantes es necesario conocer la
expresin de la varianza asinttica cuando no se supone que es cero. La expresin es sensiblemente ms
compleja que la [3]
(4)
:

[6]
donde:
T
1
=
ii
,
T
2
=
i. .i
,
T
3
=
ii
(
i.
+
.i
),
T
4
=
ij
(
j.
+
.i
)
2
.
Se puede demostrar que cuando es cero la expresin [6] se reduce a la [3]. Para contrastar la hiptesis
nula de que es igual a un valor dado
0
frente a una alternativa bilateral, procedemos como en el caso
= 0, slo que empleando como estadstico del contraste:



[7]
donde s(k) ahora es la raz cuadrada de s
2
(k), el estimador de
2
(k) obtenido sustituyendo en [6]
probabilidades por proporciones muestrales. Es obvio que el caso = 0 que explicbamos con
anterioridad no es ms que un caso particular de este contraste, con una mejor estimacin del error
estndar.
Volviendo al ejemplo de la tabla 2, para contrastar la hiptesis de que el verdadero valor de es
0
= 0.7,
como k = 0.6600 y s(k) = 0.0677, calculamos |k -
0
|/s(k) = 0.5908 < z
0.975
= 1.96. Por tanto, al nivel de
significacin = 0.05, no hay suficiente evidencia para rechazar la hiptesis nula.
Desde el punto de vista inferencial, un enfoque ms verstil que el del contraste de hiptesis consiste en
dar intervalos de confianza para el verdadero valor de . Tomados simultneamente, k y el intervalo de
confianza nos dan, adems de la mejor estimacin de , una medida del error que podemos cometer con
esa estimacin. Un intervalo de confianza aproximado del (1- )100%, construido por el mtodo
estndar, es de la forma:

donde z
1- /2
es el percentil de orden (1- /2)100 de la distribucin normal estndar. Con los datos de la
tabla 2, nuestro intervalo de confianza del 95% para sera [0.5273 , 0.7927]. Se observa como los
valores 0 y 0.7 que considerbamos en los contrastes anteriores, quedan respectivamente fuera y dentro
del intervalo, un hecho que ilustra la equivalencia entre los dos enfoques: contraste de hiptesis y
estimacin por intervalos.
Aunque el lector ms interesado en los aspectos prcticos, aqul que se limita exclusivamente a usar un
programa estadstico para analizar sus datos, quizs piense que todos estos detalles son algo prolijos,
consideramos que son importantes para interpretar y explotar ptimamente los resultados que le brinda el
programa. Por ejemplo, un programa ampliamente difundido como el SPSS, muestra solamente el valor
de k (expresin [2]), su error estndar calculado a partir del estimador de [6], y el valor del estadstico [5].
Las explicaciones de este epgrafe muestran cmo utilizar estos valores para obtener intervalos de
confianza y realizar otros contrastes de hiptesis.
Bibliografa
1. Fleiss JL. The design and analysis of clinical experiments. New York: Wiley; 1986.
2. Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics
1977; 33: 159-174. [Medline]
3. Holley WJ, Guilford JP. A note on the G index of agreement. Educ Psychol Meas 1964; 32: 281-
288.
4. Bishop YMM, Fienberg SE, Holland PW. Discrete multivariate analysis: theory and practice.
Cambridge, Massachussetts: MIT Press; 1977.
5. Fleiss JL. Statistical methods for rates and proportions, 2nd edition. New York: Wiley; 2000.
6. Feinstein AR, Cicchetti DV. High agreement but low kappa: I. The problems of two paradoxes. J
Clin Epidemiol 1990; 43: 543-549. [Medline]
7. Altman DG. Practical statistics for medical research. New York: Chapman and Hall; 1991.
8. Fleiss JL, Cohen J, Everitt BS. Large sample standard errors of kappa and weighted kappa.
Psychol Bull 1969; 72: 323-327.

I nvest igacin: Pruebas diagnst icas 1/ 6

Pruebas diagnsticas

Pita Fernndez, S. spita@canalejo.org, Prtegas Daz, S. spertega@canalejo.org
A Corua (Espaa)
__________________________________
La medicina es una ciencia de probabilidades y un arte de manejar la incertidumbre. Dicha incertidumbre
se extiende no slo a las actividades preventivas, teraputicas y pronsticas sino tambin a las
diagnsticas. En las fases del proceso diagnstico intervienen la historia clnica, la exploracin fsica y la
realizacin de pruebas complementarias
1-2
. Cuando existen varias hiptesis diagnsticas, se realizar el
diagnstico diferencial y las pruebas complementarias tratarn de aclarar las dudas existentes. Si
solamente hay una sospecha diagnstica, las pruebas complementarias tratarn de confirmarla. La
realizacin simultnea de varias pruebas complementarias se denomina pruebas complementarias en
paralelo y la realizacin de pruebas complementarias segn los resultados de otras previas, se denomina
pruebas complementarias en serie. Al realizar pruebas en paralelo aumenta la probabilidad de
diagnosticar a un enfermo, pero tambin aumenta la probabilidad de considerar como enfermo a un sano.
El riesgo de la realizacin de pruebas en serie es no diagnosticar a algunos enfermos. En cambio, pocos
sanos sern considerados como enfermos.
Es evidente que una buena prueba diagnstica es la que ofrece resultados positivos en enfermos y
negativos en sanos. Por lo tanto, las condiciones que deben ser exigidas a un test son
3
:
Validez: Es el grado en que un test mide lo que se supone que debe medir. Con que frecuencia
el resultado del test es confirmado por procedimientos diagnsticos ms complejos y rigurosos?
La sensibilidad y la especificidad de un test son medidas de su validez.
Reproductividad: es la capacidad del test para ofrecer los mismos resultados cuando se repite
su aplicacin en circunstancias similares. La variabilidad biolgica del hecho observado, la
introducida por el propio observador y la derivada del propio test, determinan su
reproductividad.
Seguridad: La seguridad viene determinada por el valor predictivo de un resultado positivo o
negativo. Con que seguridad un test predecir la presencia o ausencia de enfermedad? Ante un
resultado positivo de un test qu probabilidad existe de que este resultado indique presencia de
la enfermedad? Veremos posteriormente que esta probabilidad est muy influenciada por la
prevalencia de la patologa.
A su vez, es conveniente que el test sea sencillo de aplicar, aceptado por los pacientes o la poblacin
general, que tenga los mnimos efectos adversos y que econmicamente sea soportable.
En este trabajo se revisarn fundamentalmente los conceptos que determinan la validez de un test
(sensibilidad y especificidad) y su seguridad (valores predictivos positivos y negativos).
La v al i dez de una pr ueba di agnst i ca. Sensi bi l i dad y especi f i ci dad.
El caso ms sencillo que se nos puede plantear es el de una prueba dicotmica, que clasifica a cada
paciente como sano o enfermo en funcin de que el resultado de la prueba sea positivo o negativo. En
casos como ste, generalmente un resultado positivo se asocia con la presencia de enfermedad y un
resultado negativo con la ausencia de la misma. Cuando se estudia una muestra de pacientes, los datos
obtenidos permiten clasificar a los sujetos en cuatro grupos segn una tabla 2x2 como la que se muestra
en la Tabla 1. En ella, se enfrenta el resultado de la prueba diagnstica (en filas) con el estado real de los
pacientes (en columnas) o, en su defecto, el resultado de la prueba de referencia o gold standard que
vayamos a utilizar. El resultado de la prueba puede ser correcto (verdadero positivo y verdadero negativo)
o incorrecto (falso positivo y falso negativo). El anlisis de su validez puede obtenerse calculando los
valores de sensibilidad y especificidad
4
:


Sensi bi l i dad
Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la probabilidad de que
para un sujeto enfermo se obtenga en la prueba un resultado positivo. La sensibilidad es, por lo tanto, la
capacidad del test para detectar la enfermedad.
Cuando los datos obtenidos a partir de una muestra de pacientes se clasifican en una tabla como la que se
muestra en la Tabla 1, es fcil estimar a partir de ella la sensibilidad como la proporcin de pacientes
enfermos que obtuvieron un resultado positivo en la prueba diagnstica. Es decir:
FN VP
VP
ad Sensibilid
+
=

De ah que tambin la sensibilidad se conozca como fraccin de verdaderos positivos (FVP).
Especi f i ci dad
Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la probabilidad de que para
un sujeto sano se obtenga un resultado negativo. En otras palabras, se puede definir la especificidad como
la capacidad para detectar a los sanos. A partir de una tabla como la Tabla 1, la especificidad se estimara
como:
FP VN
VN
dad Especifici
+
=

De ah que tambin sea denominada fraccin de verdaderos negativos (FVN).
Ej empl o:
Como ejemplo de lo visto hasta ahora, consideremos los datos de un estudio en el que se incluy a 2.641
pacientes con sospecha de cncer prosttico que acudieron a una consulta de Urologa durante un periodo
de tiempo determinado. Durante su exploracin, se recogi el resultado del tacto rectal realizado a cada
uno de estos pacientes, segn fuese ste normal o anormal, y se contrast con el posterior diagnstico
obtenido de la biopsia prosttica. Los datos del estudio y los resultados obtenidos se muestran en la Tabla
2. Se encontraron en total 1.121 casos de cncer, lo cual representa un 42,45% del total de sujetos
estudiados. La sensibilidad del tacto rectal para detectar cncer fue de 56,56% (634/1121) y la
especificidad de 82,3% (1251/1520). As, el tacto fue anormal en un 56,56% de los casos de cncer
prosttico y normal en un 82,3% de los casos que presentaron finalmente otras patologas. Esto significa
que un 100-56,56=43,44% de los pacientes que efectivamente tenan cncer presentaban tactos normales.
Claramente ello indica la necesidad de utilizar otros marcadores ms sensibles, como el PSA o sus
derivados, para poder establecer el diagnstico de forma ms precisa.
Resulta obvio que lo ideal sera trabajar con pruebas diagnsticas de alta sensibilidad y especificidad,
pero esto no siempre es posible. En general, las pruebas de screening deben ser de alta sensibilidad para
poder captar a todos los enfermos. Una prueba muy sensible ser especialmente adecuada en aquellos
casos en los que el no diagnosticar la enfermedad puede resultar fatal para los enfermos, como ocurre con
enfermedades peligrosas pero tratables, como los linfomas o la tuberculosis, o en enfermedades en las que
un falso positivo no produzca serios trastornos psicolgicos o econmicos para el paciente (por ejemplo,
la realizacin de mamografa en el cncer de mama).
Por otra parte, la especificidad se refiere, como se seal previamente, a la probabilidad de que un sujeto
sano sea clasificado adecuadamente. En general, las pruebas confirmatorias del diagnstico deben ser de
alta especificidad, para evitar falsos positivos. Los tests de alta especificidad son necesarios en
enfermedades graves pero sin tratamiento disponible que las haga curables, cuando exista gran inters por
conocer la ausencia de enfermedad o cuando diagnosticar a un paciente de un mal que realmente no
padece pueda acarrear graves consecuencias, ya sean fsicas, psicolgicas o econmicas (por ejemplo, en
el caso del SIDA).

La segur i dad de una pr ueba di agnst i ca. Val or es pr edi ct i v os.
Los conceptos de sensibilidad y especificidad permiten, por lo tanto, valorar la validez de una prueba
diagnstica. Sin embargo, carecen de utilidad en la prctica clnica. Tanto la sensibilidad como la
especificidad proporcionan informacin acerca de la probabilidad de obtener un resultado concreto
(positivo o negativo) en funcin de la verdadera condicin del enfermo con respecto a la enfermedad. Sin
embargo, cuando a un paciente se le realiza alguna prueba, el mdico carece de informacin a priori
acerca de su verdadero diagnstico, y ms bien la pregunta se plantea en sentido contrario: ante un
resultado positivo (negativo) en la prueba, cul es la probabilidad de que el paciente est realmente
enfermo (sano)?. As pues, resulta obvio que hasta el momento slo hemos abordado el problema en una
direccin. Por medio de los valores predictivos completaremos esta informacin
5
:
Val or pr edi ct i v o posi t i v o:
Es la probabilidad de padecer la enfermedad si se obtiene un resultado positivo en el test. El valor
predictivo positivo puede estimarse, por tanto, a partir de la proporcin de pacientes con un resultado
positivo en la prueba que finalmente resultaron estar enfermos:
FP VP
VP
VPP
+
=

Val or pr edi ct i v o negat i v o:
Es la probabilidad de que un sujeto con un resultado negativo en la prueba est realmente sano. Se estima
dividiendo el nmero de verdaderos negativos entre el total de pacientes con un resultado negativo en la
prueba:
VN FN
VN
VPN
+
=

Retomando el ejemplo anterior sobre cncer prosttico, el valor predictivo positivo es en este caso del
70,21% (634/903) y el valor predictivo negativo del 71,98% (1251/1738). Ello significa que en un
70,21% de los pacientes con un tacto anormal finalmente se confirm la presencia de cncer, mientras
que de los que no se detectaron anomalas en el tacto un 71,98% estaban efectivamente sanos.
La i nf l uenci a de l a pr eval enci a.
Hemos visto cmo los valores de sensibilidad y especificidad, a pesar de definir completamente la validez
de la prueba diagnstica, presentan la desventaja de que no proporcionan informacin relevante a la hora
de tomar una decisin clnica ante un determinado resultado de la prueba. Sin embargo, tienen la ventaja
adicional de que son propiedades intrnsecas a la prueba diagnstica, y definen su validez
independientemente de cul sea la prevalencia de la enfermedad en la poblacin a la cual se aplica.
Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme utilidad a la hora de tomar
decisiones clnicas y transmitir a los pacientes informacin sobre su diagnstico, presenta la limitacin de
que dependen en gran medida de lo frecuente que sea la enfermedad a diagnosticar en la poblacin objeto
de estudio. Cuando la prevalencia de la enfermedad es baja, un resultado negativo permitir descartar la
enfermedad con mayor seguridad, siendo as el valor predictivo negativo mayor. Por el contrario, un
resultado positivo no permitir confirmar el diagnstico, resultando en un bajo valor predictivo positivo.
Ilustraremos lo anterior con un sencillo ejemplo. Para el diagnstico del VIH se emplean tests que han
confirmado tener una alta validez, con valores aproximados de sensibilidad y especificidad de un 99,5%.
Supongamos que se aplicase esta prueba a la totalidad de la poblacin gallega, que se cifra en 2.800.000
habitantes. Si asumimos que en Galicia existen 6.000 pacientes VIH positivos (lo cual implicara una
prevalencia de 6000/ 2.800.000 =0,21%), el test resultara positivo en un total de 19.940 sujetos,
obtenindose un valor predictivo positivo del 29,9% (Tabla 3). As pues, slo un 29,9% de los sujetos con
un resultado positivo en el test resultaran estar realmente afectados, mientras que un 70,1% de los

mismos no presentaran la enfermedad. Resulta obvio que en una comunidad como la gallega la
utilizacin de esta prueba no resultara til, debido a la alta proporcin de falsos positivos que conllevara.
Veamos ahora que ocurrira si se aplicase la misma prueba a una poblacin en la que el nmero de
enfermos VIH+ fuese de 800.000 (resultando en una prevalencia mucho mayor de un
800.000/2.800.000=28,6%). En este caso, la predictividad de una prueba positiva aumenta de un 29,9% a
un 98,7%, disminuyendo la proporcin de falsos positivos a tan slo un 1,3% (Tabla 4). Por lo tanto, si la
prevalencia es alta, un resultado positivo tiende a confirmar la presencia de la enfermedad, mientras que
si la prevalencia es baja, un resultado positivo no permitir afirmar su existencia.
Razones de pr obabi l i dad
Queda claro pues cmo la prevalencia es un factor determinante en los valores predictivos de un test. Por
lo tanto, stos , no pueden ser utilizados como ndices a la hora de comparar dos mtodos diagnsticos
diferentes, ni tampoco a la hora de extrapolar los resultados de otros estudios a datos propios. Por ello,
resulta necesario determinar otros ndices de valoracin que sean a la vez clnicamente tiles y no
dependan de la prevalencia de la enfermedad en la poblacin a estudiar. As, adems de los conceptos de
sensibilidad, especificidad y valores predicitivos, se suele hablar del concepto de razn de
verosimilitudes, razn de probabilidad, o cociente de probabilidades
6
. Estos miden cunto ms probable
es un resultado concreto (positivo o negativo) segn la presencia o ausencia de enfermedad:
Razn de verosimilitudes positiva o cociente de probabilidades positivo: se calcula
dividiendo la probabilidad de un resultado positivo en los pacientes enfermos entre la
probabilidad de un resultado positivo entre los sanos. Es, en definitiva, el cociente entre la
fraccin de verdaderos positivos (sensibilidad) y la fraccin de falsos positivos (1-especificidad):
dad Especifici - 1
ad Sensibilid
= + RV

Razn de verosimilitudes negativa o cociente de probabilidades negativo: se calcula
dividiendo la probabilidad de un resultado negativo en presencia de enfermedad entre la
probabilidad de un resultado negativo en ausencia de la misma. Se calcula por lo tanto, como el
cociente entre la fraccin de falsos negativos (1-sensibilidad) y la fraccin de verdaderos
negativos (especificidad):
dad Especifici
ad Sensibilid - 1
= RV

Volvamos de nuevo al ejemplo planteado en la Tabla 2 sobre el diagnstico de cncer prosttico a partir
del tacto rectal. En este caso, se obtiene un cociente de probabilidades positivo de 3,20. Ello viene a
indicarnos que un tacto anormal es, por lo tanto, 3 veces ms probable en un paciente con cncer
prosttico que en otro sujeto sin cncer.
La razn de probabilidades ofrece la ventaja de que relaciona la sensibilidad y la especificidad de una
prueba en un solo ndice. Adems, pueden obtenerse razones de probabilidad segn varios niveles de una
nueva medida y no es necesario expresar la informacin de forma dicotmica, como resultado de normal
o anormal o bien positivo y negativo. Por ltimo, al igual que sucede con la sensibilidad y la
especificidad, no vara con la prevalencia. Esto permite utilizarlo como ndice de comparacin entre
diferentes pruebas para un mismo diagnstico.
Hasta ahora hemos abordado el caso de una prueba con un resultado dicotmico (positivo o negativo),
pero en muchas situaciones la confirmacin de un diagnstico debe hacerse a partir de un parmetro
numrico, sobre todo cuando ste se realiza a partir de determinaciones analticas. La generalizacin a
estas situaciones se consigue mediante la eleccin de distintos valores de corte que permitan una
clasificacin dicotmica de los valores de la prueba segn sean superiores o inferiores al valor elegido. La
diferencia esencial con el caso ms simple es que ahora contaremos no con un nico par de valores de
sensibilidad y especificidad que definan la exactitud de la prueba, sino ms bien con un conjunto de pares
correspondientes cada uno a un distinto nivel de decisin. La estrategia de anlisis adecuada consistira en

representar grficamente los pares (1-especificidad, sensibilidad) obtenidos al considerar todos los
posibles valores de corte de la prueba, obtenindose as una curva llamada curva ROC. El rea bajo dicha
curva se convierte as en el mejor indicador de la capacidad predictiva del test, independiente de la
prevalencia de la enfermedad en la poblacin de referencia y en base al cual se podrn establecer
comparaciones entre diferentes pruebas diagnsticas
7-10
.
En definitiva, es sumamente importante el saber valorar la validez y seguridad de las diferentes pruebas
diagnsticas con el fin de seleccionar la ms adecuada en cada momento. La sensibilidad, la especificidad
y los valores predictivos son los criterios tradicionalmente utilizados para valorar la capacidad predictiva
de un test
11,12
. Los estudios de evaluacin de tests diagnsticos son el instrumento adecuado para obtener
esta informacin. No obstante, no debemos olvidar que existen determinados aspectos en el diseo de este
tipo de investigaciones que pueden afectar a la precisin y a la validez de las estimaciones realizadas. Una
vez ms, el clculo de intervalos de confianza puede ayudarnos a conocer la precisin de los ndices
calculados. La poblacin de estudio, la estrategia de muestreo, la seleccin del criterio de referencia y la
forma de aplicacin de las pruebas diagnsticas sern algunos de los elementos a cuidar para evitar la
presencia de sesgos
11,13,14
.
Bi bl i ogr af a
1. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Epidemiologa clnica. Ciencia bsica para la
medicina clnica. 2 ed. Madrid: Editorial mdica panamericana; 1994.
2. Sandler G. The importance of the history in the medical clinic and the cost of unnecessary test.
Am Heart J 1980; 100: 928. [Medline]
3. Morrison AS. Screnning in Chronic disease. Second edition. New York: Oxford University
Press; 1992.
4. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 1: sensitivity and specificity. BMJ
1994; 308: 1552. [Medline]
5. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 2: predictive values. BMJ 1994; 309:
102. [Medline]
6. Dujardin B, Van der Ende J, Van Gompel A, Unger JP, Van der Stuyft P. Likelihood ratios: a
real improvement for clinical decisin making? Eur J Epidemiol 1994; 10: 29-36. [Medline]
7. Burgueo MJ, Garca Bastos JL, Gonzlez Buitrago JM. Las curvas ROC en la evaluacin de las
pruebas diagnsticas. Med Clin (Barc) 1995; 104: 661-670. [Medline]
8. Zweig MH, Campbell G. Receiver-operating characteristics (ROC) plots: a fundamental
evaluation tool in clinical medicine. Clin Chem 1993; 39: 561-577. [Medline]
9. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 3: receiver operating characteristic
plots. BMJ 1994; 309: 188. [Medline]
10. Lopez de Ullibarri Galparsoro I, Pita Fernndez S. Curvas ROC. Cad Aten Primaria 1998; 5(4):
229-235.
11. Argimon Palls JM, Jimnez Villa J. Mtodos de investigacin clnica y epidemiolgica. 2 ed
Barcelona: Harcourt; 2000.
12. Fletcher RH, Fletcher SW, Wagner EH. Clinical epidemiology: the essentials. 3 ed. Baltimore:
Williams and Wilkins; 1996.
13. Cabello Lpez JB, Pozo Rodrguez F. Estudios de evaluacin de las pruebas diagnsticas en
cardiologa. Rev Esp Cardiol 1997; 50: 507-519. [Medline] [Texto completo]
14. Greenhalgh T. How to read a paper: papers that report diagnostic or screening tests. BMJ 1997;
315: 540-543. [Medline] [Texto completo]
Tabl a 1. Rel aci n ent r e el r esul t ado de una pr ueba di agnst i ca y l a
pr esenci a o ausenci a de una enf er medad.
Ver dader o di agnst i co
Enf er mo Sano
Posi t i vo
Verdaderos Posit ivos
( VP)
Falsos Posit ivos
( FP)
Negat i vo
Falsos Negat ivos
( FN)
Verdaderos Negat ivos
( VN)


Tabl a 2. Resul t ados de l a ex pl or aci n y bi opsi a pr ost t i ca de una muest r a
de paci ent es con sospecha de cncer de pr st at a.
Resul t ado de l a bi opsi a pr ost t i ca Resul t ado del
t act o r ect al
Cncer Pat ol oga beni gna Tot al
Anor mal 634 269 903
Nor mal 487 1251 1738
Tot al 1121 1520 2641

Tabl a 3. Resul t ados de l a apl i caci n del t est de VI H en una pobl aci n de
baj a pr eval enci a.
Resul t ado del t est
VI H+ VI H- Tot al
Posi t i vo 5.970 13.970 19.940
Negat i vo 30 2.780.030 2.780.060
Tot al 6.000 2.794.000 2.800.000

a
Tabl a 4. Resul t ados de l a apl i caci n del t est de VI H en una pobl aci n de
al t a pr eval enci a.
Resul t ado del t est
VI H+ VI H- Tot al
Posi t i vo 796.000 10.000 806.000
Negat i vo 4.000 1.990.000 1.994.000
Tot al 800.000 2.000.000 2.800.000

I nvest igacin: Curvas ROC 1/ 10

Curvas ROC
Autores: Lpez de Ullibarri Galparsoro I, Pta Fernndez, S.
(Espaa)
Cad Aten Primaria 1998; 5 (4): 229-235.
_________________________________
Evaluacin de pruebas diagnsticas
La toma de decisiones clnicas es un proceso extremadamente complejo en el que deber finalmente ser
valorada la utilidad para el manejo del paciente de cualquier prueba diagnstica. En este contexto, es
imprescindible conocer detalladamente la exactitud de las distintas pruebas diagnsticas, es decir, su
capacidad para clasificar correctamente a los pacientes en categoras o estados en relacin con la
enfermedad (tpicamente dos: estar o no estar enfermo, respuesta positiva o negativa a la terapia...).
Sensi bi l i dad y Especi f i ci dad
Generalmente, la exactitud diagnstica se expresa como sensibilidad y especificidad diagnsticas. Cuando
se utiliza una prueba dicotmica (una cuyos resultados se puedan interpretar directamente como positivos
o negativos), la sensibilidad es la probabilidad de clasificar correctamente a un individuo cuyo estado
real sea el definido como positivo respecto a la condicin que estudia la prueba, razn por la que tambin
es denominada fraccin de verdaderos positivos (FVP). La especificidad es la probabilidad de clasificar
correctamente a un individuo cuyo estado real sea el definido como negativo. Es igual al resultado de
restar a uno la fraccin de falsos positivos (FFP).
Cuando los datos de una muestra de pacientes se clasifican en una tabla de contingencia por el resultado
de la prueba y su estado respecto a la enfermedad, es fcil estimar a partir de ella la sensibilidad y la
especificidad de la prueba (tabla 1). Conviene insistir ya que esta distincin aparecer repetidamente en
lo sucesivo en que lo que realmente obtenemos son estimaciones de los verdaderos valores de
sensibilidad y especificidad para una poblacin terica de la que suponemos que nuestro grupo de
pacientes constituye una muestra aleatoria. Por tanto, un tratamiento estadstico correcto de cantidades
como las calculadas por el mtodo descrito por la tabla 1 exigira incluir medidas de su precisin como
estimadores, y, mejor an, utilizarlas para construir intervalos de confianza para los verdaderos valores de
sensibilidad y especificidad.
Tabl a 1. Resul t ado de una pr ueba y su est ado r espect o a l a
enf er medad.
Ver dader o Di agnst i co

Enf er mo Sano
Pr ueba
Posi t i va
Verdadero Posit ivo
( VP)
Falso Posit ivo ( FP)
Resul t ado de
l a Pr ueba
Pr ueba
Negat i va
Falso Negat ivo ( FN)
Verdadero Negat ivo
( VN)
VP + FN VN + FP

Sensi bi l i dad
= VP/ ( VP + FN) = FVP ( f r acci n de ver dader os
posi t i vos)
Especi f i ci dad
= VN/ ( VN + FP) = FVN ( f r acci n de ver dader os
negat i v os)
= 1 - FFP ( f r acci n de f al sos posi t i v os)


LA CURVA ROC
La limitacin principal del enfoque hasta ahora expuesto estribara en nuestra exigencia de que la
respuesta proporcionada por la prueba diagnstica sea de tipo dicotmico, por lo que en principio
quedara excluida la amplia gama de pruebas diagnsticas cuyos resultados se miden en una escala
(nominalmente) continua o, al menos, discreta ordinal. Pinsese, por ejemplo, respecto al primer tipo en
la determinacin de la glucosa srica por el laboratorio o, respecto al segundo, en una prueba realizada
por el Servicio de Radiologa en que los resultados se expresen empleando las categoras "seguramente
normal", "probablemente normal", "dudoso", "probablemente anormal" y "seguramente anormal".
La generalizacin a estas situaciones se consigue mediante la eleccin de distintos niveles de decisin o
valores de corte que permitan una clasificacin dicotmica de los valores de la prueba segn sean
superiores o inferiores al valor elegido. La diferencia esencial con el caso ms simple es que ahora
contaremos no con un nico par de valores de sensibilidad y especificidad que definan la exactitud de la
prueba, sino ms bien con un conjunto de pares correspondientes cada uno a un distinto nivel de decisin.
Este procedimiento constituye la esencia del anlisis ROC, una metodologa desarrollada en el seno de la
Teora de la Decisin en los aos 50 y cuya primera aplicacin fue motivada por problemas prcticos en
la deteccin de seales por radar (aunque el detalle pueda parecer anecdtico, la equivalencia entre el
operador que interpreta los picos en la pantalla del radar para decidir sobre la presencia de un misil y el
mdico que emplea el resultado de una prueba diagnstica para decidir sobre la condicin clnica del
paciente, es completa
1
). La aparicin del libro de Swets y Pickett
2
marc el comienzo de su difusin en
el rea de la Biomedicina, inicialmente en Radiologa, donde la interpretacin subjetiva de los resultados
se recoge en una escala de clasificacin, pero de modo creciente en relacin con cualquier mtodo
diagnstico que genere resultados numricos.
Para centrar ideas, supongamos que, tanto para la poblacin sana como para la enferma, la variable de
decisin que representa el resultado de la prueba diagnstica se distribuye normalmente, con media y
desviacin tpica conocidas. En la figura 1 se muestran las funciones de densidad de probabilidad para
ambas variables, que mostrarn un determinado nivel de solapamiento. Si consideramos un valor
arbitrario del resultado de la prueba, x al que, en adelante, aludiremos como valor de corte, la FVP
(sensibilidad) y la FFP (1-especificidad) se correspondern respectivamente con el rea a la derecha de
ese punto bajo la funcin de densidad de probabilidad de la poblacin enferma (reas clara y oscura) y de
la poblacin sana (rea oscura). La curva ROC se obtiene representando, para cada posible eleccin de
valor de corte, la FVP en ordenadas y la FFP en abscisas (figura 2).
Mediante esta representacin de los pares (1-especificidad, sensibilidad) obtenidos al considerar todos los
posibles valores de corte de la prueba, la curva ROC nos proporciona una representacin global de la
exactitud diagnstica. La curva ROC es necesariamente creciente, propiedad que refleja el compromiso
existente entre sensibilidad y especificidad: si se modifica el valor de corte para obtener mayor
sensibilidad, slo puede hacerse a expensas de disminuir al mismo tiempo la especificidad. Si la prueba
no permitiera discriminar entre grupos, la curva ROC sera la diagonal que une los vrtices inferior
izquierdo y superior derecho. La exactitud de la prueba aumenta a medida que la curva se desplaza desde
la diagonal hacia el vrtice superior izquierdo. Si la discriminacin fuera perfecta (100% de sensibilidad y
100% de especificidad) pasara por dicho punto.
El modelo anterior, aplicable en principio a datos continuos, puede generalizarse al caso en que los datos
se obtiene por algn sistema de clasificacin en una escala discreta ordinal. Para ello basta suponer la
existencia de unas variables latentes con distribucin normal y de unos lmites fijos que marcan los
extremos de cada categora. La figura 3 muestra esquemticamente este modelo para un ejemplo con
cinco categoras.
Obviamente, el escenario en que hemos presentado la curva ROC es completamente terico, por dos
razones relacionadas entre s:
en la prctica no disponemos de las poblaciones (abstractas) de enfermos y sanos, sino
simplemente de una muestra de ellas,

en general, no conocemos las distribuciones de los valores de la prueba diagnstica en dichas
poblaciones.
Estas limitaciones nos obligan a considerar el problema prctico de la construccin de curvas ROC, que a
continuacin tratamos, desde un punto de vista tpicamente estadstico.
MTODOS DE CLCULO DE LA CURVA ROC
Un primer grupo de mtodos para construir la curva ROC lo constituyen los llamados mtodos no
paramtricos. Se caracterizan por no hacer ninguna suposicin sobre la distribucin de los resultados de
la prueba diagnstica. El ms simple de estos mtodos es el que suele conocerse como emprico, que
consiste simplemente en representar todos los pares (FFP, FVP) es decir todos los pares
(1-especificidad, sensibilidad) para todos los posibles valores de corte que se puedan considerar con la
muestra particular de que dispongamos. Desde un punto de vista tcnico, este mtodo sustituye las
funciones de distribucin tericas por una estimacin no paramtrica de ellas, a saber, la funcin de
distribucin emprica construida a partir de los datos. Informalmente, es como si en la figura 1
sustituyramos las funciones de densidad por histogramas obtenidos a partir de la muestra de pacientes
sanos y enfermos y construyramos la curva ROC a partir de ellos.
En la figura 4 se representa la curva ROC obtenida por el mtodo emprico para un conjunto de datos
obtenidos en un grupo de pacientes investigados con el fin de establecer un diagnstico de anemia
ferropnica mediante la determinacin del volumen corpuscular medio (ver apartado a) del apndice). El
verdadero diagnstico se establece empleando como gold standard el examen de la mdula sea.
La representacin obtenida por este mtodo tiene forma aproximadamente en escalera. En efecto, para
cada variacin mnima del valor de corte que produzca cambios en sensibilidad o especificidad, al menos
un caso pasa a ser considerado bien como verdadero positivo, lo que se corresponde con un trazo vertical,
bien como falso positivo, lo que da lugar a un trazo horizontal. Existe an otra posibilidad, derivada de la
posibilidad de que se produzcan empates, es decir, dos o ms casos con el mismo valor de la prueba: si el
empate ocurre entre un caso del grupo enfermo y otro del grupo sano aparecer un trazo diagonal en la
representacin.
Es evidente que este mtodo es especialmente idneo para datos de tipo continuo, sobre todo si la
discretizacin (el redondeo) inducida por la precisin del mtodo analtico utilizado no es muy
importante, de modo que el nmero de empates sea proporcionalmente escaso. En este caso, la apariencia
dentada de la curva es menos notoria a medida que crece el tamao de la muestra e, idealmente, en el
lmite tendramos una curva suave, la propia curva ROC terica (figura 1). No obstante, tambin puede
aplicarse a datos de tipo categrico. Claro est que ahora ser inevitable la aparicin de empates (al
menos si el tamao de la muestra es mayor que el nmero de categoras), con la consecuencia de que el
grfico consistir, independientemente del tamao de la muestra, en un nmero fijo de lneas en general
diagonales que unen los puntos correspondientes a los pares (1-especificidad, sensibilidad) calculados
para cada categora. En la figura 5 se presenta un ejemplo de la aplicacin de este mtodo a un conjunto
de datos procedente de la clasificacin en cinco categoras de imgenes obtenidas por tomografa
computerizada (ver apartado b) del apndice).
Una prctica frecuente que desaconsejamos es realizar la agrupacin artificial de los resultados de una
prueba diagnstica con valores continuos en un nmero limitado de categoras, como paso previo a la
construccin de la curva ROC. Si no se dispone de medios de representacin automticos este recurso
permite simplificar los clculos necesarios para construir la curva ROC, pero entre otras deficiencias, es
evidente que as se obtiene una estimacin sesgada de la verdadera curva ROC, concretamente una
infravaloracin de la verdadera exactitud diagnstica
3,4
.
Existen otros mtodos no paramtricos
5
aplicables a datos continuos que permiten obtener curvas ROC
suavizadas, en contraposicin con la forma dentada de la curva obtenida por el mtodo emprico. La idea
es bsicamente obtener estimaciones no paramtricas suavizadas de las funciones de densidad de las dos
distribuciones de resultados de la prueba empleando generalmente estimadores de tipo ncleo. A partir de

dichas densidades en lugar de a partir de los histogramas, como en el mtodo anterior se obtiene
directamente la curva ROC que, como dijimos, ser suave.
Los mtodos paramtricos se basan en postular un determinado tipo de distribucin para la variable de
decisin en las dos poblaciones que se trata de distinguir
2
. El modelo ms frecuentemente utilizado es el
binormal, que supone la normalidad de las variables tanto en la poblacin sana como en la enferma, pero
existen muchos otros modelos posibles que surgen al considerar distintas distribuciones, similares a la
normal como la logstica (modelo bilogstico) o no, como la exponencial negativa. El problema ahora se
reduce a estimar los parmetros de cada distribucin por un mtodo estadsticamente adecuado, en
general el mtodo de mxima verosimilitud. Se obtiene as una curva ROC suave, pero puede ocurrir una
sustancial falta de ajuste si los supuestos distribucionales resultan ser errneos
3,4
. Por ello, si se va a
emplear este mtodo debe previamente someterse la hiptesis sobre la naturaleza de las distribuciones a
un contraste de significacin. Tambin es recomendable emplear una transformacin de la variable inicial
que logre que los datos sean ms compatibles con las distribuciones asumidas, aunque este juicio slo
pueda basarse en un examen en gran medida visual y por lo tanto est expuesto a interpretaciones
subjetivas. Estas limitaciones hacen que el mtodo no sea en general recomendable para datos continuos.
Su utilidad es mayor con datos discretos: varios investigadores han examinado el modelo binormal para
datos de clasificacin, sin encontrar situaciones en las que el modelo fallara seriamente
6,7
. De hecho, esta
ltima observacin constituye la base para un mtodo aplicable tanto a datos continuos como de
clasificacin, debido a Metz et al.
8
(el software que lo implementa est libremente disponible en Internet
en http://www-radiology.uchicago.edu/krl/toppage11.htm). Segn este mtodo, primero se agrupan los
datos en categoras ordenadas y despus se aplica un algoritmo paramtrico para crear una curva ROC
suave. Del mtodo se dice que es semiparamtrico
5,9
, porque aunque supone la existencia de una
transformacin que haga que las dos distribuciones sean aproximadamente normales, sta se deja sin
especificar. La dependencia mucho menor de la validez de las asunciones se debe principalmente a la
invariancia de la curva ROC frente a las transformaciones montonas de la escala de la variable de
decisin
8
. Investigaciones recientes parecen indicar que el mtodo se comporta empricamente bien en
una amplia variedad de situaciones
10
. Permanece, no obstante, el problema de que el ajuste no es
reproducible a menos que el esquema de categorizacin empleado sea objetivo y est estandarizado. Las
figuras 4 y 5 muestran las curvas ROC ajustadas por este mtodo y permiten compararlas a las obtenidas
por el mtodo emprico.
ANLISIS ESTADSTICO DE LAS CURVAS ROC
r ea baj o l a cur va
Como observamos ms arriba, la mayor exactitud diagnstica de una prueba se traduce en un
desplazamiento "hacia arriba y a la izquierda" de la curva ROC. Esto sugiere que el rea bajo la curva
ROC (ABC) se puede emplear como un ndice conveniente de la exactitud global de la prueba: la
exactitud mxima correspondera a un valor de ABC de 1 y la mnima a uno de 0.5 (si fuera menor de 0.5
debera invertirse el criterio de positividad de la prueba).
En trminos probabilsticos, si X
E
y X
S
son las dos variables aleatorias que representan los valores de la
prueba en las poblaciones enferma y sana, respectivamente, puede probarse que el ABC de la "verdadera"
curva ROC (intuitivamente, aquella que obtendramos si el tamao de la muestra fuera infinito y la escala
de medida continua) es precisamente , o, en palabras, la probabilidad de que, si se
eligen al azar un paciente enfermo y otro sano, sea mayor el valor de la prueba en aqul que en ste
11
.
Cuando la curva ROC se genera por el mtodo emprico, independientemente de que haya empates o no,
el rea puede calcularse mediante la regla trapezoidal, es decir, como la suma de las reas de todos los
rectngulos y trapecios (correspondientes a los empates) que se pueden formar bajo la curva.
Estadsticamente, la observacin importante, puesto que permite hacer contrastes de significacin y dar
intervalos de confianza para la verdadera rea bajo la curva, es que el rea calculada por el mtodo
geomtrico anterior coincide con el valor del estadstico de suma de rangos de Wilcoxon, W
12
. Esto no es
sorprendente, ya que, cuando X
A
y X
B
son dos variables aleatorias independientes cualesquiera, dicho
estadstico es conocido precisamente por su uso para contrastar la hiptesis , que
en nuestro contexto es la hiptesis nula de que ABC sea , es decir, de que la prueba no sea capaz de
discriminar entre los dos grupos. Hanley y McNeil
11
dan frmulas tanto para el estadstico W como para

su error estndar y discuten el problema de la estimacin de este ltimo. En general, se suelen dar
intervalos de confianza del ABC construidos de la manera estndar, v. g. al nivel de confianza del 95%
intervalos de extremos W 1.96*EE(W), siendo EE(W) una estimacin del error estndar de W. Con los
datos del volumen corpuscular medio, el ABC calculado por este mtodo es 0.699 y un intervalo de
confianza del 95% (IC 95%) es (0.585,0.813).
Cuando se ajusta un modelo como el binormal empleando tcnicas estadsticas se obtienen, adems de
estimaciones de los parmetros que definen la curva ROC, estimaciones del ABC y de su error estndar,
que pueden emplearse para construir intervalos de confianza y efectuar contrastes de significacin como
en el caso no paramtrico. Empleando el mtodo semiparamtrico de Metz, el ABC estimado con los
datos de volumen corpuscular medio es 0.703 y (0.591,0.799) un IC 95%.
Cuando el nmero de empates es elevado, como ocurre cuando se emplean datos de clasificacin, el
estadstico W el rea calculada por el mtodo emprico proporciona un estimador sesgado de la
verdadera rea, lo que hace recomendable emplear un mtodo distinto, por ejemplo uno basado en un
mtodo paramtrico. Con los datos de la tomografa computerizada el ABC estimado es 0.893 (IC 95%
(0.830,0.956)) 0.911 (IC 95% (0.838,0.956)) segn se emplee el estadstico de Wilcoxon o el mtodo de
Metz en su clculo, respectivamente, lo que sugiere que en este caso la magnitud del sesgo no es
importante.
r ea par ci al
Son imaginables situaciones en las que las propias caractersticas ventajosas del ABC se conviertan en un
inconveniente para su uso clnico. El ABC puede interpretarse como un promedio de la sensibilidad
(especificidad) sobre todos los valores posibles de especificidad (sensibilidad). Puede que clnicamente
slo nos interesen los puntos de la curva ROC que aseguren altos valores de sensibilidad o especificidad.
Un caso tpico es el de las mamografas en programas de deteccin precoz del cncer, donde debe
asegurarse una alta sensibilidad de la prueba
13
. Se han propuesto ndices de rea parcial que pueden ser
empleados para evaluar la exactitud restringida a los puntos de operacin de inters de la curva ROC
13,14
.
Compar aci n de dos pr uebas
Cuando se dispone de dos (o ms) pruebas para abordar el diagnstico de un mismo problema clnico, el
clculo del ABC brinda un mtodo conveniente para comparar globalmente su exactitud diagnstica
relativa. En principio, al comparar dos pruebas preferiremos la que tenga mayor ABC, por ser la de mayor
exactitud diagnstica de las dos. Desde un punto de vista estadstico el problema es valorar si la
diferencia observada entre las ABC calculadas para dos pruebas distintas es debida a la variabilidad
inherente al muestreo o es ms bien atribuible a una diferencia real en la exactitud de ambas pruebas.
Podemos enunciar este problema como un contraste de la hiptesis nula de igualdad de las dos ABC, que
denotaremos por ABC
A
y ABC
B
, frente a una alternativa bilateral. En general, se dispone de los valores
para las dos pruebas en una nica muestra de pacientes. El contraste debido a Hanley y McNeil
15
, que
podemos considerar representativo de los desarrollados en esta situacin, utiliza como estadstico del
contraste

siendo ABC

el rea observada, EE el error estndar del ABC y r la correlacin entre ABC
A
y ABC
B
. Al
nivel de significacin se rechaza la hiptesis nula cuando |z| > z
/2
, siendo z
/2
el cuantil de orden 1-
/2

de una distribucin normal estndar, v. g. si = 0.05 es z
/2
= 1.96.
No obstante, hagamos notar que la comparacin entre dos pruebas no debe reposar exclusivamente en
contrastes como el anterior. Pueden existir dos pruebas con sendas curvas ROC muy distintas de forma,
hecho que puede tener importantes implicaciones prcticas, y que, sin embargo, sean prcticamente
iguales respecto a su ABC (figura 6). El empleo del rea parcial puede permitir manejar correctamente
estas situaciones. En cualquier caso, es evidente que nunca debera prescindirse de un examen visual
detenido de un grfico que muestre simultneamente ambas curvas ROC.

El ecci n del val or de cor t e
El empleo en la prctica mdica de una prueba diagnstica exige la eleccin de un valor de corte. Para
ello es imprescindible un conocimiento detallado de los riesgos y beneficios de las decisiones mdicas
derivadas del resultado de la prueba. Un enfoque sencillo
3,16
, que utiliza la razn de costes de un
resultado falso positivo frente a un falso negativo, requiere calcular el coeficiente

donde P es la prevalencia de la enfermedad. El valor de corte ptimo se determina hallando el punto de la
curva ROC (que supondremos suave) con la siguiente propiedad: la tangente a la curva en ese punto tiene
pendiente m.
Incluso una formula sencilla como la anterior deja en evidencia que en la mayora de los casos nuestra
pretensin de calcular un valor de corte ptimo ser excesiva, salvo que uno se contente con estimaciones
imprecisas o puramente intuitivas. De hecho, es un problema que se aborde ms adecuadamente con otras
herramientas ms complejas disponibles en el seno del Anlisis de Decisiones Clnicas
17,18
.
Apndice
Apndi ce 1.a. Vol umen cor puscul ar medi o er i t r oci t ar i o en 100
paci ent es con posi bl e di agnst i co de anemi a f er r r opni ca. El
ver dader o di agnst i co se est abl ece por bi opsi a de l a mdul a sea.
Ex amen de l a mdul a sea Vol umen cor puscul ar medi o
Ausencia de hierro ( n
E
= 33)
52, 58, 62, 65, 67, 68, 70, 72, 72, 73, 73, 74,
75, 77, 77, 77, 78, 78, 80, 80, 81, 81, 81, 81,
84, 84, 85, 85, 87, 88, 88, 92, 92
Presencia de hierro ( n
S
= 67)
60, 66, 68, 69, 71, 71, 71, 73, 74, 74, 74, 76,
76, 77, 77, 77, 78, 79, 79, 79, 80, 80, 81, 81,
82, 82, 82, 83, 83, 83, 83, 83, 83, 83, 83, 84,
84, 84, 85, 85, 86, 86, 86, 86, 88, 88, 88, 89,
89, 89, 90, 90, 90, 91, 91, 93, 93, 93, 94, 94,
94, 94, 96, 97, 98, 100, 103
Modificado de Beck JR, Shult z EK. The use of relat ive oper at ing charact er ist ic
( ROC) curves in t est performance evaluat ion. Arch Pat hol Lab Med 1986; 110:
13- 20.

Apndi ce 1. b. Cl asi f i caci n de 109 i mgenes de t omogr af a
comput er i zada.
Ver dader a
condi ci n
Segurament e
normal
Probablement e
normal
Dudosa
Probablement e
anormal
Segurament e
anormal
Normal 33 6 6 11 2
Anormal 3 2 2 11 33
Tomado de Hanley JA, McNeil BJ. The meaning and use of t he area under a
receiver operat ing charact er ist ic ( ROC) curve. Radiology 1982; 143: 29- 36.


Fi gur a 1. Di st r i buci n de l os r esul t ados de una pr ueba en l as pobl aci ones de
paci ent es sanos y enf er mos. Las di st r i buci ones t er i cas se suponen nor mal es
de medi a y desv i aci n t pi ca di f er ent es. Las r eas a l a der echa del val or de
cor t e x cor r esponden a l a sensi bi l i dad ( r eas cl ar a y oscur a) y 1- especi f i ci dad
( r ea oscur a) .

Fi gur a 2. Cur va ROC cor r espondi ent e a l a di st r i buci n t er i ca de l os r esul t ados de
una pr ueba r epr esent ada en l a f i gur a 1. Se muest r a el punt o cor r espondi ent e al
val or de cor t e x .


Fi gur a 3. Repr esent aci n esquemt i ca de un model o par a dat os de
cl asi f i caci n con ci nco cat egor as.

Fi gur a 4. Cur vas ROC cal cul adas por l os mt odos empr i co y semi par amt r i co
par a l os dat os de vol umen cor puscul ar medi o.


Fi gur a 5. Cur vas ROC cal cul adas por l os mt odos empr i co y semi par amt r i co par a l os dat os de
t omogr af a comput er i zada.

Fi gur a 6. Cur vas ROC empr i cas de dos pr uebas di agnst i cas di st i nt as.


Bibliografa
1. Robertson EA, Zweig MH. Use of receiver operating characteristic curves to evaluate the clinical
performance of analytical systems. Clin Chem 1981; 27: 1569-1574. [Medline]
2. Swets JA, Pickett RM. Evaluation of diagnostic systems: methods from signal detection theory. Nueva
York: Academic Press; 1982.
3. Zweig MH, Campbell G. Receiver-operating characteristic (ROC) plots: a fundamental evaluation tool
in clinical medicine. Clin Chem 1993; 39: 561-577. [Medline]
4. Burgueo MJ, Garca-Bastos JL, Gonzlez-Buitrago JM. Las curvas ROC en la evaluacin de las
pruebas diagnsticas. Med Clin (Barc) 1995; 104: 661-670. [Medline]
5. Zou KH, Hall WJ, Shapiro DE. Smooth non-parametric receiver operating characteristic (ROC) curves
for continuous diagnostic tests. Statist Med 1997; 16: 2143-2156. [Medline]
6. Hanley JA. The robustness of the binormal model used to fit ROC curves. Med Decision Making
1988; 8: 197-203. [Medline]
7. Swets JA. Form of empirical ROCs in discrimination and diagnostic tasks: implications for theory and
measurement of performance. Psych Bull 1986; 99: 181-198. [Medline]
8. Metz CE, Herman BA, Shen, J. Maximum likelihood estimation of receiver operating characteristic
(ROC) curves from continuously distributed data. Statist Med 1998; 17: 1033-1053. [Medline]
9. Hsieh F, Turnbull BW. Nonparametric and semiparametric estimation of the receiver operating
characteristic curve. Ann Statist 1996; 24: 25-40.
10. Hanley JA. The use of the "binormal" model for parametric ROC analysis of quantitative diagnostics
tests. Statist Med 1996; 15: 1575-1585. [Medline]
11. Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic
(ROC) curve. Radiology 1982; 143: 29-36. [Medline]
12. Bamber D. The area above the ordinal dominance graph and the area below the receiver operating
graph. J Math Psych 1975; 12: 387-415.
13. Jiang Y, Metz CE, Nishikawa RM. A receiver operating characteristic partial area index for highly
sensitive diagnostics tests. Radiology 1996; 201: 745-750.
14. McClish DK. Analyzing a portion of the ROC curve. Med Decision Making 1989; 9: 190-195.
[Medline]
15. Hanley JA, McNeil BJ. A method of comparing the areas under receiver operating characteristic
curves derived from the same cases. Radiology 1983; 148: 839-843. [Medline]
16. McNeil BJ, Keeler E, Adelstein SJ. Primer on certain elements of medical decision making. N Engl J
Med 1975; 293: 211-215. [Medline]
17. Weinstein MC, Fineberg HV. Clinical Decision Analysis. Philadelphia: WB Saunders Co; 1980.
18. Beck JR, Shultz EK. The use of relative operating characteristic (ROC) curves in test performance
evaluation. Arch Pathol Lab Med 1986; 110: 13-20. [Medline]
I nvest igacin: I nvest igacin cuant it at iva y cualit at iva 1/ 4

Investigacin cuantitativa y cualitativa
Autores: Pita Fernndez, S., Prtegas Daz, S.,
A Corua (Espaa)
_________________________________
El objetivo de cualquier ciencia es adquirir conocimientos y la eleccin del mtodo adecuado que nos
permita conocer la realidad es por tanto fundamental
1
. El problema surge al aceptar como ciertos los
conocimientos errneos o viceversa. Los mtodos inductivos y deductivos tienen objetivos diferentes y
podran ser resumidos como desarrollo de la teora y anlisis de la teora respectivamente. Los mtodos
inductivos estn generalmente asociados con la investigacin cualitativa mientras que el mtodo
deductivo est asociado frecuentemente con la investigacin cuantitativa.
Los cientficos sociales en salud que utilizan abordajes cualitativos enfrentan en la actualidad problemas
epistemolgicos y metodolgicos que tienen que ver con el poder y la tica en la generacin de datos as
como con la validez externa de los mismos
2
.
La investigacin cuantitativa es aquella en la que se recogen y analizan datos cuantitativos sobre
variables. La investigacin cualitativa evita la cuantificacin. Los investigadores cualitativos hacen
registros narrativos de los fenmenos que son estudiados mediante tcnicas como la observacin
participante y las entrevistas no estructuradas
3
. La diferencia fundamental entre ambas metodologas es
que la cuantitativa estudia la asociacin o relacin entre variables cuantificadas y la cualitativa lo hace en
contextos estructurales y situacionales
4
. La investigacin cualitativa trata de identificar la naturaleza
profunda de las realidades, su sistema de relaciones, su estructura dinmica. La investigacin cuantitativa
trata de determinar la fuerza de asociacin o correlacin entre variables, la generalizacin y objetivacin
de los resultados a travs de una muestra para hacer inferencia a una poblacin de la cual toda muestra
procede. Tras el estudio de la asociacin o correlacin pretende, a su vez, hacer inferencia causal que
explique por qu las cosas suceden o no de una forma determinada.
Las diferencias ms ostensibles entre ambas metodologas se muestran en la tabla 1
5-6
. Los fundamentos
de la metodologa cuantitativa podemos encontrarlos en el positivismo que surge en el primer tercio del
siglo XIX como una reaccin ante el empirismo que se dedicaba a recoger datos sin introducir los
conocimientos ms all del campo de la observacin. Alguno de los cientficos de esta poca dedicados a
temas relacionados con las ciencias de la salud son Pasteur y Claude Bernard, siendo este ltimo el que
propuso la experimentacin en medicina
1
. A principios del siglo XX, surge el neopositivismo o
positivismo lgico siendo una de las aportaciones ms importantes la induccin probabilstica. La clave
del positivismo lgico consiste en contrastar hiptesis probabilsticamente y en caso de ser aceptadas y
demostradas en circunstancias distintas, a partir de ellas elaborar teoras generales. La estadstica dispone
de instrumentos cuantitativos para contrastar estas hiptesis y poder aceptarlas o rechazarlas con una
seguridad determinada
7
. Por tanto el mtodo cientfico, tras una observacin, genera una hiptesis que
contrasta y emite posteriormente unas conclusiones derivadas de dicho contraste de hiptesis. El
contrastar una hiptesis repetidamente verificada no da absoluta garanta de su generalizacin ya que,
como seala Karl Popper, no se dispone de ningn mtodo capaz de garantizar que la generalizacin de
una hiptesis sea vlida
8
. Con el ejemplo de los cisnes, K. Popper rebata las tesis neopositivistas sobre la
generalizacin de las hiptesis
9
... "todos los cisnes de Austria eran blancos... no se dispone de datos sobre
el color de los cisnes fuera de Austria..., todos los cisnes son blancos...". En el momento actual no hay
ningn mtodo que garantice que la generalizacin de una hiptesis sea vlida, pero s se puede rebatir
una hiptesis con una sola evidencia en contra de ella. Es por ello que la ciencia, como seala K. Popper
"busca explicaciones cada vez mejores"
10
.
Vent aj as e i nconv eni ent es de l os mt odos
Las ventajas e inconvenientes de los mtodos cuantitativos vs los cualitativos se muestran en la tabla 2
11-
13
. En general los mtodos cuantitativos son muy potentes en trminos de validez externa ya que con una
muestra representativa de la poblacin hacen inferencia a dicha poblacin a partir de una muestra (Figura
1) con una seguridad y precisin definida. Por tanto una limitacin de los mtodos cualitativos es su

dificultad para generalizar. La investigacin cuantitativa con los test de hiptesis no slo permite
eliminar el papel del azar para descartar o rechazar una hiptesis, sino que permite cuantificar la
relevancia clnica de un fenmeno midiendo la reduccin relativa del riesgo, la reduccin absoluta del
riesgo y el nmero necesario de pacientes a tratar para evitar un evento
14
. La pregunta que evidentemente
hacen los investigadores cualitativos a los cuantitativos es cuan particularizables son tus
generalidades...?
Hoy en da hay un predominio claro de la investigacin cuantitativa en relacin a la cualitativa y as
podemos objetivar que en una bsqueda en Medline a fecha 20/4/2002 utilizando las palabras clave
"quantitative research" vs "qualitative research" encontramos 11.236 y 1.249 artculos respectivamente lo
que genera un cociente de 11.236/1.249 =8.99. El seleccionar una u otra metodologa puede depender de
diferentes planteamientos: Se busca la magnitud o la naturaleza del fenmeno?, Se busca un promedio
o una estructura dinmica?, Se pretende descubrir leyes o comprender fenmenos humanos?. Cuando en
la bsqueda en Medline a las palabras clave previamente mencionadas aadimos "nursing" para centrar la
pregunta en trabajos de enfermera objetivamos que el cociente de los artculos cuantitativos vs los
cualitativos (610 vs 535) claramente disminuye a 1.14 mostrando por tanto un importante peso de lo
cualitativo en la investigacin en enfermera a pesar de existir un predominio de lo cuantitativo que sigue
incrementndose en los ltimos aos en este colectivo.
El empleo de ambos procedimientos cuantitativos y cualitativos en una investigacin probablemente
podra ayudar a corregir los sesgos propios de cada mtodo, pero el hecho de que la metodologa
cuantitativa se la ms empleada no es producto del azar sino de la evolucin de mtodo cientfico a lo
largo de los aos. Creemos en ese sentido que la cuantificacin incrementa y facilita la compresin del
universo que nos rodea y ya mucho antes de los positivistas lgicos o neopositivistas Galileo Galilei
afirmaba en este sentido "mide lo que sea medible y haz medible lo que no lo sea".

Tabl a 1. Di f er enci as ent r e i nvest i gaci n cual i t at i v a y cuant i t at i v a
5- 6
.
I nvest i gaci n cual i t at i va I nvest i gaci n cuant i t at i va
Cent rada en la fenomenologa y
comprensin
Basada en la induccin probabilst ica
del posit ivismo lgico
Observacin nat urist a sin cont rol Medicin penet rant e y cont rolada
Subj et iva Obj et iva
I nferencias de sus dat os I nferencias ms all de los dat os
Explorat or ia, induct iva y descript iva Confirmat oria, infer encial, deduct iva
Orient ada al proceso Orient ada al result ado
Dat os "ricos y profundos" Dat os "slidos y repet ibles"
No generalizable Generalizable
Holist a Part icularist a
Realidad dinmica Realidad est t ica



Tabl a 2. Vent aj as e i nconveni ent es de l os mt odos cual i t at i v os v s
cuant i t at i vos.
Mt odos cual i t at i vos Mt odos cuant i t at i v os
Propensin a " comunicarse con" los
suj et os del est udio
11

Propensin a " servir se de" los suj et os
del est udio
11

Se limit a a pr egunt ar
11
Se limit a a r esponder
11

Comunicacin ms horizont al.. . ent re
el invest igador y los invest igados. . .
mayor nat uralidad y habilidad de
est udiar los fact ores sociales en un
escenar io nat ural
12

Son fuert es en t rminos de validez
int erna, pero son dbiles en validez
ext er na, lo que encuent ran no es
generalizable a la poblacin
Son dbiles en t rminos de validez
int erna - casi nunca sabemos si miden
lo que quieren medir- , pero son
fuert es en validez ext erna, lo que
encuent ran es generalizable a la
poblacin
13

Pregunt an a los cuant it at ivos: Cuan
part icularizables son los hallazgos?
Pregunt an a los cualit at ivos: Son
generalizables t us hallazgos?

Fi gur a 1. El ement os de l a i nf er enci a est adst i ca


Bi bl i ogr af a
1. lvarez Cceres R. El mtodo cientfico en las ciencias de la salud. Las bases de la investigacin
biomdica. Madrid: Daz de Santos, 1996.
2. Calero JL. Investigacin cualitativa y cuantitativa. Problemas no resueltos en los debates actuales.
Rev. Cubana Endocrinol 2000; 11 (3): 192-8. [Texto completo - PDF]
3. Abdellah FG, Levine E. Preparing Nursing Research for the 21 st Century. Evolution. Methodologies,
Chalges. Springer: New York; 1994.
4. Strauss AL. Qualitative analysis for social scientifics. New York: Cambridge University oress, 1987.
5. Cabrero Garca L, Richart Martnez M. El debate investigacin cualitativa frente a investigacin
cuantitativa Enfermera clnica, 1996; 6: 212-217. [Texto completo - PDF]
6. Reichart ChS, Cook TD. Hacia una superacin del enfrentamiento entre los mtodos cualitativos y
cuantitativos. En: Cook TD, Reichart ChR (ed). Mtodos cualitativos y cuantitativos en investigacin
evaluativa. Madrid: Morata,1986.
7. Pita Fernndez S., Prtega Daz S. Significancia estadstica y relevancia clnica. Cad Aten Primaria,
2000; 8: 191-195. [Texto completo]
8. Popper Karl R. La lgica de la investigacin cientfica. Barcelona: Crculo de Lectores; 1995.
9. Popper Karl R. Realismo y el objetivo de la ciencia. Madrid: Editorial Tecnos, 1983.
10. Popper Karl R. La sociedad abierta y sus enemigos. Barcelona: Editorial Paidos, 1991.
11. Ibaes J. El regreso del sujeto. La investigacin social de segundo orden. Madrid: Siglo XXI; 1994.
p.77-84.
12. Deegan MJ, Hill M. Women and symbolic interaction. Boston: Allen and Unwin; 1987. p. 84-85.
13. Campbell D, Stanley J. Diseos experimentales y cuasi experimentales en la investigacin social.
Buenos Aires: Ammorrortu Editores; 1982. p. 76-8.
14. Pita Fernndez S., Lpez de Ullibarri Galparsoro I. Nmero necesario de pacientes a tratar para
reducir un evento. Cad Aten Primaria 1998; 96-98. [Texto completo]

Investigacin: Anlisis de concordancia para variable numricas 1/1

La fiabilidad de las mediciones clnicas:
el anlisis de concordancia para variables numricas
Pita Fernndez S, Prtegas Daz S,
A Corua (Espaa)
_________________________________
Introduccin
La medicin es un proceso inherente tanto a la prctica como a la investigacin clnica. Mientras que
algunas variables son relativamente sencillas de medir (como el peso o la tensin arterial) otras
comportan cierto grado de subjetividad que hace especialmente difcil su medicin, como la intensidad de
dolor o el concepto de calidad de vida. En cualquier caso, el proceso de medicin conlleva siempre algn
grado de error. Existen factores asociados a los individuos, al observador o al instrumento de medida que
pueden influir en la variacin de las mediciones
1,2
. En la medida de la temperatura corporal, por ejemplo,
pueden aparecer errores en el registro debidos tanto al estado del paciente, como a defectos en el
termmetro utilizado o a la objetividad del observador.
Cualquier estudio epidemiolgico debe garantizar la calidad de sus mediciones, no slo porque
condicionar en gran medida la validez de sus conclusiones, sino por la importancia de las decisiones
clnicas que se apoyen en esa investigacin
3
. La calidad de una medida depende tanto de su validez como
de su fiabilidad
1,4
. Mientras que la validez expresa el grado en el que realmente se mide el fenmeno de
inters, la fiabilidad indica hasta qu punto se obtienen los mismos valores al efectuar la medicin en ms
de una ocasin, bajo condiciones similares. El que una medida sea muy precisa no implica, sin embargo,
que sea necesariamente vlida. As, si se realizan dos mediciones consecutivas de la presin arterial de un
paciente con un esfigmomanmetro mal calibrado los valores obtenidos seguramente sern parecidos,
aunque totalmente inexactos.
En los estudios que tratan de evaluar la validez de una medida se comparan sus resultados con los
obtenidos mediante una prueba de referencia (gold standard) que se sabe vlida y fiable para la medicin
del fenmeno de inters
5
. Cuando el objetivo se centra en la fiabilidad de una medicin, se repite el
proceso de medida para evaluar la concordancia entre las distintas mediciones. En un estudio de la
fiabilidad pueden valorarse los siguientes aspectos
1
:
a. Repetibilidad: indica hasta qu punto un instrumento proporciona resultados similares cuando
se aplica a una misma persona en ms de una ocasin, pero en idnticas condiciones.
b. Concordancia intraobservador: tiene por objetivo evaluar el grado de consistencia al efectuar
la medicin de un observador consigo mismo.
c. Concordancia interobservador: se refiere a la consistencia entre dos observadores distintos
cuando evalan una misma medida en un mismo individuo.
d. Concordancia entre mtodos de medicin: cuando existen diferentes mtodos de medida para
un mismo fenmeno, es interesante estudiar hasta qu punto los resultados obtenidos con ambos
instrumentos son equivalentes.
La concordancia entre variables es de sumo inters en la prctica clnica habitual
6-9
. La concordancia
entre mediciones puede alterarse no slo por la variabilidad de los observadores, sino por la variabilidad
del instrumento de medida o por el propio proceso a medir si se realiza en momentos diferentes. Las
tcnicas de anlisis de la concordancia dependen del tipo de variable a estudiar. El ndice estadstico ms
utilizado, para el caso de variables cualitativas, es el coeficiente kappa
10
. Si las variables son
cuantitativas, se utiliza habitualmente el coeficiente de correlacin intraclase
2,6,11
. El concepto bsico
subyacente del coeficiente de correlacin intraclase fue introducido originalmente por Fisher como una
formulacin especial de la r de Pearson, basndose en un modelo de anlisis de la varianza
12
. Las
dificultades para interpretar desde el punto de vista clnico los valores de este coeficiente y otras
desventajas metodolgicas han hecho que algunos autores propongan mtodos alternativos para estudiar
la concordancia de este tipo de variables. As, Bland y Altman (1995)
13
proponen un mtodo grfico y
muy sencillo, basado en el anlisis de las diferencias individuales, que permite determinar los lmites de

concordancia y visualizar de forma grfica las discrepancias observadas. Recientemente, otros mtodos
de anlisis de concordancia han sido propuestos
14-16
. A continuacin, se proceder a una descripcin
detallada de algunas de estas tcnicas de anlisis.
El coeficiente de correlacin intraclase
Para el caso de variables cuantitativas, es frecuente que el anlisis de la concordancia se aborde mediante
tcnicas estadsticas inapropiadas. Con frecuencia ha sido utilizado el clculo del coeficiente de
correlacin de lineal (r) de Pearson como ndice de concordancia. Sin embargo, sta no resulta una
medida adecuada del grado de acuerdo entre dos mediciones, ya que si dos instrumentos miden
sistemticamente cantidades diferentes uno del otro, la correlacin puede ser perfecta (r=1), a pesar de
que la concordancia sea nula. Consideremos como ejemplo los datos de la Tabla 1, en la que se comparan
las mediciones de tensin arterial con dos instrumentos diferentes. El instrumento B mide
sistemticamente 1mm Hg ms que el instrumento A. Al representar grficamente la correlacin entre
ambas mediciones, se objetiva que la correlacin es la mxima posible (r=1), a pesar de que ninguna de
las mediciones ha concordado (Figura 1). No se debe olvidar que el coeficiente de correlacin de Pearson
no proporciona informacin sobre el acuerdo observado, y solamente mide la asociacin lineal entre dos
variables
17
. As mismo, al calcularse a partir de los pares ordenados de mediciones, si vara el orden
tambin cambia el valor del coeficiente
17
, mientras que un cambio en las escalas de medida no afecta a la
correlacin pero s afecta a la concordancia. A su vez, debemos mencionar que la idea de que si el
coeficiente de correlacin entre dos medidas es significativamente diferente de cero la fiabilidad es buena,
es incorrecto. El coeficiente de correlacin lineal puede ser muy pequeo y resultar significativo si el
tamao muestral es suficientemente grande. Por ltimo, tampoco la comparacin de medias mediante un
test t de Student con datos apareados es una tcnica adecuada para este tipo de anlisis
1
.
Desde el punto de vista matemtico, el ndice ms apropiado para cuantificar la concordancia entre
diferentes mediciones de una variable numrica es el llamado coeficiente de correlacin intraclase
(CCI)
2,6,11
. Dicho coeficiente estima el promedio de las correlaciones entre todas las posibles
ordenaciones de los pares de observaciones disponibles y, por lo tanto, evita el problema de la
dependencia del orden del coeficiente de correlacin. As mismo, extiende su uso al caso en el que se
disponga de ms de dos observaciones por sujeto.
Sin embargo, una de las principales limitaciones del CCI es la dificultad de su clculo, ya que debe ser
estimado de distintas formas dependiendo del diseo del estudio
18
. La forma de clculo ms habitual se
basa en un modelo de anlisis de la varianza (ANOVA) con medidas repetidas (Tabla 2). La idea es que
la variabilidad total de las mediciones se puede descomponer en dos componentes: la variabilidad debida
a las diferencias entre los distintos sujetos y la debida a las diferencias entre las medidas para cada sujeto.
Esta ltima, a su vez, depende de la variabilidad entre observaciones y una variabilidad residual o
aleatoria asociada al error que conlleva toda medicin. El CCI se define entonces como la proporcin de
la variabilidad total que se debe a la variabilidad de los sujetos.
En la actualidad el valor del CCI puede obtenerse de modo directo con algunos programas informticos
como el SPSS. Otra forma sencilla de obtener el valor del CCI es a partir de una tabla ANOVA para
medidas repetidas. Como ejemplo, en la Tabla 3 se representan los datos de un estudio hipottico en el
que se tom la tensin arterial sistlica en 30 pacientes utilizando dos mtodos diferentes. Si se
representan grficamente estos datos, indicando el coeficiente de correlacin r=0,997 una asociacin
prcticamente lineal (Figura 2). A partir de la tabla ANOVA correspondiente (Tabla 4), el CCI se puede
calcular como:
( )
TOTAL
TOTAL ENTRE
SS k
SS SC k
CCI

=
1

donde k es el nmero de observaciones que se toman en cada sujeto. En el ejemplo:
( )
991 , 0
183 , 73940
183 , 73940 683 , 73597 2
1
=

=

=
TOTAL
TOTAL ENTRE
SS k
SS SS k
CCI


Como toda proporcin, los valores del CCI pueden oscilar entre 0 y 1, de modo que la mxima
concordancia posible corresponde a un valor de CCI=1. En este caso, toda la variabilidad observada se
explicara por las diferencias entre sujetos y no por las diferencias entre los mtodos de medicin o los
diferentes observadores. Por otro lado, el valor CCI=0 se obtiene cuando la concordancia observada es
igual a la que se esperara que ocurriera slo por azar. A la hora de interpretar los valores del CCI, toda
clasificacin es subjetiva, si bien resulta til disponer de una clasificacin como la que proponen otros
autores
6
(Tabla 5).
Hasta ahora, se ha presentado la forma ms habitual de clculo del CCI. Para su clculo en otras
situaciones, as como para la obtencin de intervalos de confianza, puede recurrirse a referencias ms
especializadas
6,18,19
.
A pesar de ser la medida de concordancia ms adecuada par el caso de variables numricas, el CCI
presenta ciertas limitaciones. Junto a la dificultad inherente a su clculo, el hecho de que se trate de una
prueba paramtrica limita su uso al caso en el que se verifiquen las hiptesis necesarias. A saber:
variables distribuidas segn una normal, igualdad de varianzas e independencia entre los errores de cada
observador. As mismo, el valor del CCI depende en gran medida de la variabilidad de los valores
observados: cuanto ms homognea sea la muestra estudiada, ms bajo tender a ser el valor del CCI.
Pero quizs lo que ms ha limitado la difusin del uso del CCI en la literatura mdica es la carencia de
interpretacin clnica, que ha propiciado la aparicin de otros mtodos de anlisis, mucho ms intuitivo y
fcilmente interpretables, que se exponen a continuacin.
Anlisis de las diferencias individuales: mtodo de Bland y Altman
Un sencillo procedimiento grfico para evaluar la concordancia entre dos sistemas de medida es el
propuesto por Bland y Altman
13
. Dicho procedimiento consiste en representar grficamente las
diferencias entre dos mediciones frente a su media. Utilizaremos para ilustrar dicha metodologa las
mediciones de tensin arterial sistlica obtenidas por medio de un esfigmomanmetro de mercurio en el
brazo y la obtenida por medio de un monitor autoinflable electrnico en el dedo ndice. Dichas
mediciones fueron realizadas a 159 alumnos de las escuelas universitarias de enfermera de A Corua y
Ferrol.
La correlacin existente entre ambas mediciones (r=0,202; p<0.05) se presenta en la Figura 3, donde se
objetiva una correlacin positiva y estadsticamente diferente de cero. Si se representan en un diagrama
de dispersin en el eje de ordenadas las diferencias entre ambos procedimientos, y en el eje de abscisas el
promedio de ambas mediciones, se obtiene la Figura 4. En dicha figura objetivamos que muy pocas
mediciones han concordado (diferencia igual a cero). Por el contrario, la mayora de las veces el aparato
electrnico digital ha proporcionado valores superiores al esfigmomanmetro de mercurio, de hecho la
media de dichas diferencias (electrnico mercurio) es positiva (22,5). Adems, dicha grfica permite
objetivar que la discordancia se incrementa a medida que se obtienen valores ms elevados de TAS. Por
lo tanto, las diferencias no son homogneas a lo largo del eje horizontal. La distribucin de las
diferencias se puede a su vez valorar realizando un histograma de las mismas (Figura 5), donde se
objetiva claramente el predominio de diferencias positivas mostrando por lo tanto cmo el aparato
electrnico claramente proporciona valores ms elevados que el esfigmomanmetro de mercurio. Es
evidente por lo tanto que la falta de homogeneidad de las diferencias, as como la magnitud de la misma,
invalida la utilizacin del monitor digital del dedo ndice como mtodo en este estudio para tomar la
tensin arterial.
Un aspecto muy importante de la metodologa de Bland y Altman es que proporciona adems unos
lmites de concordancia a partir del clculo del intervalo de confianza para la diferencia de dos
mediciones. Como es bien sabido, el intervalo de dos desviaciones estndar alrededor de la media de las
diferencias incluye el 95% de las diferencias observadas. Estos valores deben compararse con los lmites
de concordancia que se hayan establecido previamente al inicio del estudio para concluir si las diferencias
observadas son o no clnicamente relevantes.


Otros mtodos de anlisis
Distintos autores han propuesto algunas tcnicas alternativas para el anlisis de la concordancia para
mediciones numricas, principalmente desde un punto de vista grfico, que vienen a complementar el
mtodo de Bland y Altman
14-16
. Una propuesta sencilla y muy reciente se basa en construir una grfica,
similar a las de Kaplan-Meier que se utilizan en el anlisis de supervivencia, donde en el eje horizontal se
representa la diferencia absoluta entre dos mediciones para cada sujeto y en el eje vertical la proporcin
de casos en los que las discrepancias igualan al menos cada una de las diferencias observadas
16
. La
grfica se construye as igual que en un anlisis de supervivencia, donde ningn caso es censurado, y el
papel de la variable tiempo lo juega aqu la diferencia absoluta entre las mediciones.
Si retomamos el ejemplo anterior (Tabla 3), en la Figura 6 se muestra el anlisis de las diferencias
individuales segn la metodologa de Bland y Altman. Del grfico se deduce claramente que el mtodo B
proporciona con frecuencia valores ms bajos de tensin arterial, con una diferencia media de -3,23. De
modo complementario, en la Tabla 6 se muestra la magnitud, en trminos absolutos, de las dos
mediciones de tensin arterial en cada paciente, as como el porcentaje acumulado de casos en los que se
supera cada una de estas diferencias. A partir de estos datos puede construirse fcilmente la Figura 7, en
la que se muestra el desacuerdo existente entre ambos mtodos. Dicho grfico permite evaluar si la
diferencia tiene o no alguna relevancia desde un punto de vista clnico. As, por ejemplo, si establecemos
como aceptable un margen de error entre las mediciones de 2 mmHg se obtiene un porcentaje de acuerdo
de un 20%, mientras que la concordancia alcanza el 90% si se admiten diferencias de hasta 8 mmHg, lo
cual resulta aceptable desde un punto de vista clnico.
Al igual que el mtodo propuesto por Bland y Altman, el principal atractivo de esta alternativa es que
permite expresar sus resultados grficamente, relacionndolos con unos lmites de concordancia
preestablecidos segn criterios clnicos antes del estudio, lo que los hace especialmente atractivos para los
profesionales sanitarios. As mismo, permite contrastar si el grado de acuerdo depende de alguna otra
covariable, construyendo grficos independientes, uno para cada nivel de la variable. Incluso es posible
utilizar el test del log-rank para testar la existencia de diferencias significativas entre esas curvas. No
obstante, al trabajar con las diferencias absolutas, este mtodo, al contrario que el de Bland y Altman, no
permite observar si existe una diferencia sistemtica a favor de alguna de las dos tcnicas u observadores,
y tampoco comprobar si la magnitud de dicha diferencia se modifica en relacin a la magnitud de la
medida.
En definitiva, el problema del anlisis de la concordancia en el caso de variables numricas puede
abordarse segn diferentes metodologas. Lejos de recomendar el uso estndar de alguna de estas
tcnicas, ms bien deben considerarse como mtodos de anlisis que ofrecen informacin
complementaria. En cualquier caso, es conveniente insistir una vez ms en la conveniencia de garantizar
la validez y fiabilidad de los instrumentos de medida utilizados habitualmente en la prctica e
investigacin clnica. No debemos olvidar que un estudio bien diseado, ejecutado y analizado fracasar
si la informacin que se obtiene es inexacta o poco fiable
1
.
Bibliografa
1. Argimon Palln JM, Jimnez Vill J. Mtodos de investigacin clnica y epidemiolgica. 2 ed.
Madrid: Harcorurt; 2000.
2. Hernndez Aguado I, Porta Serra M, Miralles M, Garca Benavides F, Bolmar F. La
cuantificacin de la variabilidad en las observaciones clnicas. Med Clin (Barc) 1990; 95: 424-
429. [Medline]
3. Sackett DL. A primer on the precision and accuracy of the clinical examination. JAMA 1992;
267: 2638-2644. [Medline]
4. Latour J, Abraira V, Cabello JB, Lpez Snchez J. Mtodos de investigacin en cardiologa
clnica (IV). Las mediciones en clnicas en cardiologa: validez y errores de medicin. Rev Esp
Cardiol 1997; 50(2): 117-128. [Medline] [Texto completo]
5. Pita Fernndez S, Prtega Daz S. Pruebas diagnsticas. Cad Aten Primaria 2003; 10: 120-124.
[Texto completo]
6. Fleiss JL. The design and analysis of clinical experiments. New York: Wiley; 1986-

7. Landis JR, Koch GG. The measurement of observer agreement for categorical data. Biometrics
1977; 33: 159-174. [Medline]
8. Ripolles Orti M, Martn Rioboo E, Daz Moreno A, Aranguren Baena B, Murcia Simn M,
Toledano Medina A, Fonseca Del Pozo FJ. Concordancia en la medicin de presin arterial entre
diferentes profesionales sanitarios. Son fiables los esfigmomanmetros de mercurio? Aten
Primaria 2001; 27(4): 234-43. [Medline] [Texto completo]
9. Divison JA, Carbayo J, Sanchis C, Artigao LM. Concordancia entre las automedidas
domiciliarias y la monitorizacin ambulatoria de la presin arterial. Med Clin (Barc). 2001;
116(19): 759. [Medline]
10. Lpez de Ullibarri Galparsoro I, Pita Fernndez S. Medidas de concordancia: el ndice Kappa.
11. Prieto L, Lamarca R, Casado A. La evaluacin de la fiabilidad en las observaciones clnicas: el
coeficiente de correlacin intraclase. Med Clin 1998: 110(4): 142-145. [Medline]
12. Bravo G, Potvin L. Estimating the reliability of continuous measures with Cronbach's alpha or
the intraclass correlation coefficient: toward the integration of two traditions. J Clin Epidemiol.
1991; 44(4-5): 381-90. [Medline]
13. Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of
clinical measurement. Lancet 1986; 1: 307-310. [Medline]
14. Monti KL. Folded empirical distribution function curves mountain plots. Am Stat 1995; 49:
342-345. [ISI]
15. Krouwer JS, Monti KL. A simple, graphical method to evaluate laboratory assays. Eur J Clin
Chem Clin Biochem 1995; 33: 525-527. [Medline]
16. Luiz RR, Costa JL, Kale PL, Werneck GL. Assessment of agreement of a quantitative variable: a
new graphical approach. J Clin Epidemiol 2003; 56(10): 963-967. [Medline]
17. Bland JM, Altman DG. Measurement error and correlation coefficients. BMJ 1996; 313: 41-42.
[Medline] [Texto completo]
18. Bartko JJ. The intraclass correlation coefficient as a measure of reliability. Psychol Rep 1966;
19: 3-11. [Medline]
19. McGraw KO, Wong SP. Forming inferences about some intraclass correlation coefficients.
Psychol Methods 1996; 1: 30-46.

Tabla 1. Ejemplo terico sobre mediciones de
Tensin Arterial Sistlica con dos
instrumentos diferentes.
Instrumento
A
Instrumento B
110 111
120 121
130 131
140 141
150 151
160 161
170 171
180 181
190 191
200 201


Tabla 2. Tabla ANOVA para medidas repetidas.
Fuente de
variacin
Grados de
libertad
Suma de cuadrados
Media
cuadrtica
Entre sujetos n-1 SC
ENTRE
= ( )
2
1
=

n
i
i
X X k

1 n
SC
ENTRE

Observador k-1 SS
OBS
= ( )
2
1
=

k
j
j
X X n

1 k
SC
OBS

Intra
sujetos
Residual (n-1)(k-1) SS
RES
=
( )
= =

+
n
i
k
j
j i ij
X X X X
1 1
2

( )( ) 1 1 k n
SC
RES

Total nk-1 SC
TOTAL
=
( )
= =

n
i
k
j
ij
X X
1 1
2

1 nk
SC
TOTAL

n: nmero de sujetos.
k: nmero de observaciones por sujeto.

Tabla 3. Resultados de la medicin de la
presin arterial sistlica (TAS) en 30
pacientes, utilizando dos mtodos diferentes.
TAS Mtodo A TAS Mtodo B Diferencia
80 83 -3
85 83 2
90 94 -4
95 93 2
100 100 0
105 103 2
110 112 -2
115 114 1
120 121 -1
125 127 -2
110 111 -1
120 123 -3
130 128 2
140 148 -8
110 113 -3
130 132 -2
135 139 -4
140 144 -4
145 152 -7
150 157 -7
155 156 -1
160 171 -11
165 164 1
170 179 -9
175 181 -6
180 184 -4
185 190 -5
190 196 -6
195 203 -8
200 206 -6


Tabla 4. Tabla ANOVA para las mediciones de tensin arterial.
Fuente de variacin Grados de libertad
Suma de
cuadrados
Media cuadrtica
Entre sujetos 29 73597,683 2537,851
Observador 1 156,817 156,817 Intra
sujetos
Residual 29 185,683 6,403
Total 59 73940,183

Tabla 5. Valoracin de la concordancia segn
los valores del Coeficiente de Correlacin
Intraclase (CCI).
Valor
del CCI
Fuerza de la concordancia
>0,90 Muy buena
0,71-
0,90
Buena
0,51-
0,70
Moderada
0,31-
0,50
Mediocre
<0,30 Mala o nula

Tabla 6. Distribucin de la diferencia absoluta
entre las mediciones de tensin arterial en 30
pacientes.
Diferencia
absoluta
Frecuencia
Porcentaje
acumulado
0 1 3,3%
1 5 20,0%
2 7 43,3%
3 3 53,3%
4 4 66,7%
5 1 70,0%
6 3 80,0%
7 2 86,7%
8 2 93,3%
9 1 96,7%
11 1 100,0%


Figura 1. Correlacin entre los instrumentos A y B para la
medicin de la Tensin Arterial Sistlica.
Coeficiente de correlacin de Pearson r=1
Instrumento A
220 200 180 160 140 120 100
I
n
s
t
r
u
m
e
n
t
o

B
220
200
180
160
140
120
100

Figura 2. Mediciones de tensin arterial sistlica en 30 pacientes segn dos mtodos de
medicin.
Coef iciente de correlacin lineal r= 0.997
Mtodo A
220 200 180 160 140 120 100 80 60
M
t
o
d
o

B
220
200
180
160
140
120
100
80


Figura 3. Correlacin entre los valores de Tensin Arterial Sistlica
medida con esfigmomanmetro de mercurio en brazo dominante y
monitor digital en dedo ndice.
Coeficiente de correlacin de Pearson r=0,202 (p<0.05)
TAS mmHg con esfigmomanmetro de mercurio
180 160 140 120 100 80
T
A
S

m
m
H
g

c
o
n

m
o
n
i
t
o
r

d
i
g
i
t
a
l

e
n

d
e
d
o

n
d
i
c
e
240
220
200
180
160
140
120
100
80

Figura 4. Diferencias en los valores de Tensin Arterial Sistlica medidos
con esfigmomanmetro de mercurio en brazo dominante y monitor digital
en dedo ndice. Mtodo de Bland y Altman.
Diferencia media=22,5 (D.T.=27,6); IC 95%=(18,1;26,8)
Promedio de TAS ((electrnico + esfigmomanmetro)/2)
180 160 140 120 100 80
D
i
f
e
r
e
n
c
i
a

(
E
l
e
c
t
r
n
i
c
o

-

E
s
f
i
g
m
o
m
a
n
m
e
t
r
o

d
e

H
g
)
100
80
60
40
20
0
-20
-40
-60



Figura 5. Histograma de las diferencias entre el monitor electrnico
y el esfigmomanmetro de mercurio para la medicin de Tensin
Arterial Sistlica.
Diferencias (electrnico - esfigmomanmetro Hg)
90 70 50 30 10 -10 -30 -50
Media=22,5 (D.T.=27,6)
40
30
20
10
0

Figura 6. Diferencias en los valores de tensin arterial sistlica (TAS)
segn dos mtodos de medida A y C en relacin con su promedio.
Diferencia media=-3,23; IC 95%=(-4,57;-1,90)
TAS media
220 200 180 160 140 120 100 80
D
i
f
e
r
e
n
c
i
a

B
-
A
4
2
0
-2
-4
-6
-8
-10
-12



Figura 7. Porcentaje de discordancia entre dos mtodos de medicin de la
tensin arterial sistlica (A y B)
Diferencia absoluta entre los mtodos A y B
12 10 8 6 4 2 0
P
o
r
c
e
n
t
a
j
e

d
e

d
i
s
c
o
r
d
a
n
c
i
a
1,0
,8
,6
,4
,2
0,0

Revi si ones si st emt i cas y Met aanl i si s
Revisiones sist emt icas y Met aanlisis

Aut or es:
Soni a Pr t ega Daz
( 1)
, Sal vador Pi t a Fer nndez
( 2)

( 1) Unidad de Epidemiologa Clnica y Bioest adst ica. Complej o Hospit alario Juan Canalej o ( A
Corua) .
( 2) Mdico de Familia. Cent ro de Salud de Cambre ( A Corua) .
CAD ATEN PRI MARI A 2005; 12( 2) : 109- 112.
_______________________________________

I nt r oducci n
El ext raordinario y progresivo increment o en el nmero de publicaciones
cient ficas ha plant eado desde hace ya algn t iempo la necesidad de
realizar revisiones de la lit erat ura mdica en un int ent o de sint et izar los
result ados alcanzados en relacin a un t ema det erminado. A est o se
aade el hecho de que los est udios individuales dependen de sus
caract erst icas part iculares, y pocas veces dan respuest as definit ivas a
cuest iones clnicas, obt enindose en ocasiones result ados
cont radict orios. Pese a t odo ello, los concept os de revisin sist emt ica y
met aanlisis son t odava relat ivament e recient es, y vienen a formalizar,
a mediados de los aos 70
1
, el concept o de revisin narrat iva, segn el
cual hast a ent onces para revisar la evidencia en t orno a un t ema de
int ers se seleccionaba un nmero det erminado de art culos, limit ndose
habit ualment e a cont ar el nmero de est udios con result ados posit ivos y
negat ivos ( por ej emplo, aquellos con result ados a favor o en cont ra de
la efect ividad de un det erminado t rat amient o) , y con una valoracin a lo
sumo subj et iva de las caract erst icas met odolgicas o la calidad
cient fica at ribuible a cada uno de los t rabaj os incluidos. En
cont raposicin a la revisin narrat iva clsica, la revisin sist emt ica
viene a dot ar de un mayor rigor t ant o al proceso de seleccin de los
t rabaj os como a la post erior int egracin y anlisis de los result ados
2
.
Puest o que no t odas las revisiones sist emt icas de la bibliografa han de
incluir necesariament e un met aanlisis, en la act ualidad se recomienda
ut ilizar ambos t rminos para acuar dist int as realidades. As, se suele
hablar de revisin sist emt ica para referirse al proceso de ident ificar
sist emt icament e y evaluar varios est udios del mismo t ipo y con un
obj et ivo comn, mient ras que por met aanlisis nos referiremos
habit ualment e al conj unt o de t cnicas est adst icas mediant e las cuales
se combinan los result ados de est os est udios para obt ener parmet ros
de medida globales.
En at encin primaria, al igual que en ot ras especialidades, las t cnicas

del met aanlisis pueden cont ribuir a buscar siempre la mej or evidencia
disponible y t omar decisiones sobre el cuidado de los pacient es. Como
ej emplo, podemos t omar una invest igacin recient e
3
, en la cual se
realiz una revisin sist emt ica de 15 ensayos clnicos sobre la
comparacin de la t erapia clsica ant ihipert ensiva ( diurt icos o Bet a-
bloqueant es) y los nuevos frmacos ( I ECAS, ARA I I , Calcioant agonist as
o alfa- bloqueant es) para la reduccin de la morbimort alidad
cardiovascular. La bsqueda bibliogrfica para la seleccin de los
t rabaj os se ext endi a publicaciones elect rnicas y consult as de
audiciones pblicas, cumpliendo las invest igaciones seleccionadas
crit erios de inclusin/ exclusin clarament e especificados por los aut ores
de la revisin ( aleat orizacin, seguimient o mnimo de 2 aos, t amao
muest ral> 100, et c) . El beneficio de un grupo t rat amient o frent e a ot ro
se analiz mediant e odds rat ios ( OR) , que fueron calculados para cada
uno de los est udios originales, y post eriorment e combinados mediant e
met aanlisis para producir un valor OR global, concluyndose una
similar prot eccin cardiovascular de ambas t erapias.
En lo que sigue, nos cent raremos fundament alment e en la exposicin de
las fases de las que const a el proceso de la revisin sist emt ica, as
como de sus posibles limit aciones para, en post eriores t rabaj os,
cent rarse en las t cnicas est adst icas habit ualment e ut ilizadas en la
int egracin de result ados durant e la et apa del met aanlisis.
Li mi t aci ones del Met aanl i si s y l as Rev i si ones Si st emt i cas.
Ant es de exponer las dist int as fases que ha de incluir t oda revisin
sist emt ica, es import ant e dest acar las limit aciones met odolgicas
inherent es a est e t ipo de est udios
4- 7
, a fin de valorar convenient ement e
la import ancia de cada una de las et apas que se sealarn a
cont inuacin. Uno de los principales sesgos que afect an a est e t ipo de
revisiones es el conocido como sesgo de publicacin
7
. Viene derivado del
hecho de que muchos t rabaj os cient ficos, en su mayora con result ados
negat ivos ( aquellos que no hallan diferencias significat ivas o con
result ados en cont ra de la hipt esis de est udio o de lo habit ualment e
est ablecido) nunca llegan a publicarse, t ardan ms en hacerlo o son
menos cit ados en ot ras publicaciones. Todo ello condiciona los
result ados de una bsqueda bibliogrfica y puede dar lugar a result ados
sesgados en un met aanlisis. Ot ros hechos que cont ribuyen a est e t ipo
de sesgos es la publicacin duplicada de est udios o el ignorar los
t rabaj os publicados en un idioma dist int o al ingls.
Junt o con el sesgo de publicacin, el sesgo de seleccin es una de las

principales crt icas del met aanlisis
7
. Es import ant e definir con claridad
los crit erios de inclusin y exclusin de los est udios en la revisin, y que
est os sean lo ms obj et ivos posible. El propio aut or del met aanlisis
puede sesgar los result ados, ya que su crit erio para incluir o excluir un
est udio del anlisis puede venir influenciado por los result ados del
mismo.
Ot ros aspect os que pueden compromet er la validez de los result ados de
un met aanlisis son la calidad de los est udios originales incluidos, la
variabilidad ent re est udios o los errores en la fase de anlisis. Las
conclusiones del met aanlisis dependern en gran medida de la calidad
de los est udios originales, de modo que al combinar result ados de
invest igaciones sesgadas o met odolgicament e deficient es t ambin se
incurrir en un sesgo a la hora de obt ener un est imador global del
efect o. A su vez, la het erogeneidad ent re los diferent es est udios que se
combinan puede afect ar de una manera muy import ant e los result ados
del met aanlisis. Suelen ser invest igaciones realizadas en dist int os
cont ext os, con pacient es de caract erst icas no necesariament e similares
o incluso con result ados muy diferent es, lo que implica que no siempre
ser aconsej able realizar un met aanlisis. Debern invest igarse las
posibles fuent es de het erogeneidad, su influencia en los result ados y la
posibilidad de realizar un anlisis por subgrupos.
Finalment e, los result ados pueden verse compromet idos por el empleo
de t cnicas de anlisis errneas o una definicin incorrect a de las
medidas que se desean combinar. Los valores de significacin, que no
informan del sent ido ni de la magnit ud de la asociacin, o los
est adst icos de cont rast e, que t ienen en cuent a el sent ido del efect o
pero no su magnit ud, no deberan considerarse como medidas de
ent rada al met aanlisis.
Et apas en una r ev i si n si st emt i ca.
La revisin sist emt ica se ha convert ido as en un diseo de
invest igacin en s misma en el que las unidades de est udio, en lugar de
pacient es o unidades administ rat ivas, son los t rabaj os originales que se
revisan
8
. Como en cualquier est udio de invest igacin, su realizacin
requiere seguir un prot ocolo que debe incluir los siguient es pasos
4, 5, 9- 13
:
1. Est abl eci mi ent o de l a pr egunt a que se desea
r esponder y r azones par a el l o: Como en cualquier
proceso de invest igacin, debe est ablecerse de forma lo
ms clara y concisa posible la pregunt a de invest igacin que

se int ent a responder.
2. Cuant i f i caci n de l os ef ect os: Los invest igadores
debern concret ar qu medidas se van a ut ilizar para medir
el efect o de int ers, en funcin del t ipo de respuest a a
est udiar y el diseo de los est udios revisados. As, por
ej emplo, si la respuest a es binaria ( enfermedad/ no
enfermedad, muert e/ supervivencia, ) las medidas de
efect o ut ilizadas suelen ser la diferencia de proporciones, el
riesgo relat ivo o la odds rat io. Por el cont rario, si la
respuest a es un parmet ro numrico ( por ej emplo, la
det erminacin de un parmet ro analt ico) el efect o suele
medirse mediant e la diferencia est andarizada de medias en
los grupos de int ers. Debe t enerse en cuent a que en los
est udios experiment ales, con grupos aleat orizados, el propio
diseo cont rola la confusin y los efect os pueden medirse
con result ados crudos como los descrit os. Por el cont rario,
en met aanlisis realizados a part ir de evidencia
observacional, el cont rol del sesgo en el anlisis deber
hacerse mediant e t cnicas de regresin mult ivariant e,
siendo los result ados de est os modelos los que deben
combinarse en la et apa del met aanlisis para obt ener una
medida global de int ers.
Finalment e, es t ambin aconsej able que en el moment o de
planificacin de la invest igacin se fij e la diferencia mnima
en la variable respuest a que ser considerada de relevancia
en gran
clnica.
3. Local i zaci n de l os est udi os de i nvest i gaci n: Se debe
realizar una bsqueda exhaust iva, obj et iva y reproducible
de los t rabaj os originales sobre el t ema, que adems de
bases de dat os elect rnicas incluya bsquedas det alladas en
las revist as relacionadas y bsquedas manuales de la
llamada lit erat ura gris ( referencias bibliogrficas, t esis
doct orales, comunicaciones a congresos, informes de
inst it uciones pblicas o privadas, t rabaj os no publicados o
publicados en revist as no indexadas, et c) . La exhaust ividad
y el rigor de la bsqueda bibliogrfica det erminar
medida la calidad y validez final del met aanlisis.
4. Cr i t er i os de i ncl usi n/ ex cl usi n de l os est udi os: Los
invest igadores deben est ablecer cules de los t rabaj os
recuperados sern incluidos finalment e en el met aanlisis,
elaborando una list a de crit erios de inclusin y exclusin
que deber ser lo ms obj et iva posible. Para evit ar el
denominado sesgo de seleccin, es import ant e aplicar
dichos crit erios rigurosament e a cada est udio, siendo

recomendable que est a evaluacin sea realizada de forma
ciega e independient e por varios evaluadores.
Ent re los crit erios de seleccin ut ilizados con mayor
frecuencia en el met aanlisis est n: el t ipo de diseo de los
t rabaj os, el t amao muest ral est udiado, la exhaust ividad de
la informacin que present an o la comparabilidad en la
definicin de los fact ores de exposicin, de las
int ervenciones y de las respuest as est udiadas. Aunque
algunos aut ores sugieren ut ilizar la calidad met odolgica de
los t rabaj os como un crit erio de inclusin, es ms
aconsej able considerarlo como una variable ms a t ener en
cuent a en la int erpret acin de los result ados del
de los result ados y consensuar
e a la hora de det erminar la validez del
ut ilizar las punt uaciones asignadas como pesos en el
met aanlisis mediant e un anlisis de sensibilidad.
5. Bsqueda de i nf or maci n y dat os r el ev ant es de cada
est udi o: En cada uno de los art culos originales que se
revisan, se debe buscar informacin de int ers referent e a
las caract erst icas de los est udios ( diseo, crit erios de
inclusin/ exclusin o de seleccin de casos y cont roles,
periodo de seleccin, periodo de seguimient o,
aleat orizacin, t ipo de int ervencin, et c. ) , a las
caract erst icas de la poblacin de est udio, a su calidad
met odolgica ( incluyendo los mt odos de anlisis
est adst ico ut ilizados) y a sus result ados, con especial
nfasis a la descripcin de las variables del efect o de
int ers. Como en cualquier ot ro proyect o de invest igacin,
es aconsej able elaborar un formulario con los dat os que
deben consignarse para cada t rabaj o y que la recogida de
dat os sea realizada por ms de un invest igador, a fin de
evaluar la consist encia
posibles discrepancias.
6. Eval uaci n de l a cal i dad de l os est udi os i ncl ui dos:
Junt o con la est rat egia de bsqueda de informacin, la
calidad met odolgica de los art culos revisados es ot ro
element o clav
met aanlisis.
Exist en publicadas diversas escalas de valoracin de la
calidad de los est udios, que si bien valoran generalment e
los mismos aspect os ( diseo del est udio, cont rol de sesgos,
t amao muest ral, seguimient o, aleat orizacin,
enmascaramient o, et c. ) , pueden llegar a result ados
discrepant es. En cualquier caso, una vez valorada la calidad
met odolgica de cada t rabaj o, algunos aut ores proponen
met aanlisis, mient ras que ot ros defienden la ut ilizacin en

su lugar de un anlisis de sensibilidad.
7. Anl i si s de l a het er ogenei dad de l os est udi os: La
evaluacin del grado de het erogeneidad de los est udios
puede llevarse a cabo mediant e dist int as pruebas
est adst icas, ent re las que dest aca la prueba Q propuest a
por Der Simonian y Laird
14
. No obst ant e, est os t est s
present an una pot encia muy baj a, dado que adems en la
mayora de los casos los met aanlisis incluyen un nmero
relat ivament e pequeo de est udios, aument ando as la
posibilidad de comet er un error de Tipo I I . Por t odo ello, el
anlisis de la het erogeneidad suele llevarse a cabo mediant e
mt odos grficos como el grfico de LAbb
15
o el grfico de
Galbrait h
16
que permit en inspeccionar visualment e la falt a
de homogeneidad ent re los est udios recopilados.
En caso de que exist a het erogeneidad ent re los est udios
incluidos en la revisin, los invest igadores pueden opt ar
simplement e por no realizar el met aanlisis, por obt ener
una medida agregada del efect o de int ers indicando una
medida de la variabilidad ent re est udios o bien por realizar
un anlisis por subgrupos homogneos de ser posible
ident ificar la causa de la het erogeneidad.
8. Combi naci n de r esul t ados: Como ya adelant bamos
ant es, el mt odo elegido para combinar los result ados de
los diferent es est udios en una medida global del efect o
vendr det erminado fundament alment e por el t ipo de
respuest a a est udiar ( binaria o cont inua) y, t ambin, por los
result ados derivados del anlisis de het erogeneidad.
En la mayora de los casos, el est imador del efect o
combinado se calcula como una media ponderada de los
est imadores de cada est udio, donde los pesos se asignan en
base a la precisin de cada t rabaj o, generalment e el inverso
de la varianza de la est imacin correspondient e. De est a
forma, los est udios con mayor variabilidad ( por ej emplo,
aquellos con un t amao muest ral ms reducido) , t ienen una
cont ribucin menor en el est imador global.
La het erogeneidad ent re est udios puede ser t enida en
cuent a en est os clculos ut ilizando el llamado modelo de
efect os aleat orios, o no ser incluida mediant e el uso del
modelo de efect os fij os
17
. La principal diferencia es que con
est e lt imo se considera que no exist e het erogeneidad ent re
est udios, mient ras que con el modelo de efect os aleat orios
se consideran dos posibles fuent es de variabilidad, la
variabilidad int ra- est udio y la variabilidad ent re- est udios,
que se incorporan al est imador combinado a t ravs de los

pesos correspondient es. No obst ant e, debe t enerse en
cuent a que cuando exist e una gran het erogeneidad ent re
est udios el met aanlisis, an baj o la suposicin de efect os
aleat orios, no es apropiado y lo que procede es ident ificar
las fuent es de variabilidad y realizar un anlisis por
subgrupos.
Finalment e, los result ados obt enidos suelen represent arse
t picament e en una grfica que muest ra las est imaciones del
efect o individuales de cada est udio, adems del valor global
obt enido al combinar t odos los result ados y su
correspondient e int ervalo de confianza.
9. I dent i f i caci n del sesgo de publ i caci n: Como en
cualquier ot ro est udio, en un met aanlisis deber valorarse
la exist encia de posibles sesgos ent re los que el sesgo de
publicacin es uno de los ms import ant es. Ent re los
mt odos disponibles para valorar el sesgo de publicacin el
grfico en embudo o funnel plot
18
es quiz el ms ut ilizado,
en el que se represent a el t amao muest ral de cada t rabaj o
frent e al t amao del efect o det ect ado. Est e t ipo de grficos,
puest o que pueden dar lugar a int erpret aciones poco
obj et ivas, suelen complement arse con t cnicas est adst icas
como la prueba de Begg
19
o de Egger
18
.
10. Anl i si s de sensi bi l i dad: El anlisis de sensibilidad
permit e est udiar la influencia individual de cada est udio al
result ado del met aanlisis y, por lo t ant o, det erminar si los
result ados pueden verse sesgados por est udios con escasa
calidad met odolgica, t rabaj os no publicados o que no
cumplan est rict ament e los crit erios de seleccin, et c.
Consist ira en replicar el met aanlisis quit ando en cada paso
uno de los est udios incluidos, para ver si se obt ienen o no
result ados similares de forma global.
El proceso de realizacin de una revisin sist emt ica no es pues un
proceso fcil pero, en est e sent ido, no difiere del proceso de elaboracin
de cualquier ot ro t ipo de invest igacin cient fica
6
. Una buena revisin
sist emt ica const it uye una herramient a excelent e para encont rar la
mej or evidencia disponible sobre un t ema de int ers, si bien una lect ura
crt ica y obj et iva de est os t rabaj os es indispensable para poder valorar
en su medida su calidad met odolgica y realizar una correct a
int erpret acin de sus conclusiones.

Bi bl i ogr af a

1. Glass GV. Primary, secondary, and met a- analysis of
research. Educat ional Researcher 1976; 5: 3- 8.
2. Teagarden JR. Met a- analysis: whit her narrat ive review?
Pharmacot herapy 1989; 9: 274- 284. [ Medline]
3. St aessen JA, Wang JG, Thies L. Cardiovascular prevent ion
and blood pressure reduct ion: a quant it at ive overview
updat ed unt il 1 March 2003. J Hypert ens 2003; 21: 1055-
1076. [ Medline]
4. Guallar E, Banegas JR, Mart n- Moreno JM, Del Ro A.
Met aanlisis: su import ancia en la t oma de decisiones
clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509- 517.
[ Medline]
5. Molinero Casares LM. Met aanlisis: claves para int erpret ar
una herramient a de invest igacin cont rovert ida.
Hipert ensin 2001; 18( 5) : 232- 240.
6. Ruano- Ravia A, Figueiras A, Barros- Dios JM. El
met aanlisis a debat e. Med Clin ( Barc) 2002; 119( 11) : 435-
439. [ Medline]
7. Egger M, Smit h GD. Met a- analysis bias in locat ion and
select ion of st udies. BMJ 1998; 316: 61- 66. [ Medline]
[ Text o complet o]
8. Guallar E, Banegas JR, Mart n- Moreno JM, Del Ro A.
Met aanlisis: su import ancia en la t oma de decisiones
clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509- 517.
[ Medline]
9. Alt man DG. St at ist ics in medical j ournals: some recent
t rends. St at Med 2000; 19. 3275- 89. [ Medline]
10. Pet it t i D. Met a- analysis, decision analysis, and cost -
effect iveness analysis. Met hods for quant it at ive synt hesis in
medicine. Nueva York: Oxford Universit y Press; 1994.
11. Greenland S. Quant it at ive met hods in t he review of
epidemiologic lit erat ure. Epidemiol Rev 1987; 9: 1- 30.
12. Friedenreich CM. Met hods for pooled analysis of
epidemiologic st udies. Epidemiology 1993; 4: 295- 302.
[ Medline]
13. Abraira V. Revisiones sist emt icas y met aanlisis.
Semergen 2003; 29( 4) : 183- 185.
14. DerSimonian R, Laird N. Met a- analysis in clinical t rials.
Cont rol Clin Trials 1986; 7: 177- 188. [ Medline]
15. LAbb K, Det sky A, ORourke K. Met a- analysis in clinical

research. Ann I nt ern Med 1987; 107: 224- 233. [ Medline]
16. Galbrait h R. A not e on graphical present at ion of est imat ed
odds rat ios from several clinical t rials. St at Med 1988; 7:
889- 894. [ Medline]
17. Egger M, Smit h GD, Phillips AN. Met a- analysis: Principles
and procedures. BMJ 1997; 315: 1533- 1537. [ Medline]
[ Text o complet o]
18. Egger M, Smit h GD, Schneider M, Minder C. Bias in met a-
analysis det ect by a simple, graphical t est . BMJ 1997; 315:
629- 634. [ Medline] [ Text o complet o]
19. Begg CB, Mazumsdar M. Operat ing charact erist ics of a rank
correlat ion t est for publicat ion bias. Biomet rics 1994; 50:
1088- 1101. [ Medline]
Revisiones sist emt icas y Met aanlisis ( I I )
Rev i si ones si st emt i cas y Met aanl i si s ( I I )

Aut or es:

Soni a Pr t ega Daz
( 1)
, Sal vador Pi t a Fer nndez
( 2)

( 1) Unidad de Epidemiologa Clnica y Bioest adst ica. Complej o Hospit alario Juan Canalej o ( A
Corua) .
( 2) Mdico de Familia. Cent ro de Salud de Cambre ( A Corua) .
CAD ATEN PRI MARI A 2005; 12( 3) : 166- 171.
__________________________

I nt r oducci n.
En un t rabaj o ant erior se han present ado los concept os de revisin
sist emt ica y met aanlisis en el proceso de snt esis de los result ados
alcanzados por diversos est udios en relacin a un t ema det erminado
1
.
Dicha publicacin se cent r fundament alment e en la exposicin de las
limit aciones y las et apas de una revisin sist emt ica, con una breve
descripcin de las t cnicas est adst icas habit ualment e ut ilizadas durant e
la et apa del met aanlisis. En el present e t rabaj o, se t rat ar de describir
con mayor ext ensin los mt odos est adst icos disponibles para la
combinacin de result ados en est e t ipo de est udios.
El anl i si s de l a het er ogenei dad.
Ant es de opt ar por alguno de los dist int os mt odos est adst icos que
permit en combinar los result ados individuales de cada est udio para
obt ener un est imador combinado del efect o, habr que det erminar:
a. El t i po de r espuest a a est udi ar : si la respuest a es binaria
o dicot mica la medida de efect o ut ilizada ser la diferencia
de proporciones, el riesgo relat ivo o el valor del odds rat io.
Si la respuest a es una variable numrica, el efect o se
medir mediant e la diferencia de medias en los grupos de
int ers. Puest o que est a diferencia ser probablement e
mayor cuando las medias sean mayores, en lugar de usar
las diferencias absolut as se suelen ut ilizar las diferencias
est andarizadas. En est udios no aleat orizados, en los que no
se t enga cont rol sobre los posibles fact ores de confusin,
ser aconsej able ut ilizar como medidas del efect o los
correspondient es coeficient es de regresin.
En est e punt o, no debe olvidarse adems que los valores de
significacin ( valores de la p) , que no informan del sent ido
ni de la magnit ud de la asociacin, o los est adst icos de
cont rast e, que t ienen en cuent a el sent ido del efect o pero
no su magnit ud, no son medidas apropiadas para ut ilizar en

la fase del met aanlisis.
b. La het er ogenei dad ent r e est udi os: Se t rat a de analizar
hast a qu punt o los result ados de los diferent es est udios
pueden combinarse en una nica medida. Diferencias en el
diseo del est udio, las caract erst icas de la poblacin, et c.
pueden llevar a result ados muy diferent es y compromet er
los result ados del met aanlisis.
La evaluacin del grado de het erogeneidad puede llevarse a cabo
mediant e pruebas est adst icas, siendo la ms ut ilizada la prueba Q de
Der Simonian y Laird
2
. Dicha prueba se basa en calcular una suma
ponderada de las diferencias ent re el efect o det erminado en cada uno
de los est udios ( odds rat io, riesgo relat ivo, diferencia de medias, et c. )
y el promedio global:

con

.
De est a forma, si los est udios son homogneos, el est adst ico sigue
aproximadament e una dist ribucin con grados de libert ad. El
valor obt enido para dicho est adst ico en cada caso concret o se confront a
con la dist ribucin t erica correspondient e, obt enindose as un valor de
significacin que permit e rechazar ( p< 0, 05) o acept ar ( p> 0, 05) la
hipt esis de homogeneidad. No obst ant e, se t rat a de una prueba con
escasa pot encia est adst ica, por lo que un result ado no significat ivo
suele ser insuficient e para concluir que no exist e het erogeneidad ent e
los est udios, y conviene explorar est a posibilidad con ot ros mt odos,
fundament alment e de t ipo grfico, como son el grfico de Galbrait h o el
grfico de LAbb
3, 4
.
Por un lado, en el grfico de Galbrait h
3
se represent a la precisin de
cada est udio ( el inverso del error est ndar de la est imacin del efect o)
frent e al efect o est andarizado ( i. e. , la est imacin del efect o dividida
ent re su error est ndar) . Se represent a t ambin la lnea de regresin
aj ust ada a est os punt os y una banda de confianza, de modo que t odos
los punt os deberan sit uarse dent ro de dicha banda. Los punt os fuera de
esos mrgenes de confianza son los que mayor variabilidad aport an al
anlisis. Adems, aquellos est udios con un mayor peso en el
met aanlisis sern los de mayor precisin y podrn ident ificarse, por lo
t ant o, a la derecha del grfico.
El grfico de LAbb
4
es ot ra herramient a t il en el caso de t rabaj ar con
una respuest a binaria ( por ej emplo, respuest a a un nuevo t rat amient o
frent e a ot ro est ndar) . En l se represent a la proporcin de event os en
el grupo cont rol frent e a la proporcin de event os en el grupo de
t rat amient o. Cada uno de los punt os en el grfico represent a as el
riesgo relat ivo correspondient e a los diferent es est udios, de modo que la
diagonal que divide el grfico en dos secciones dej ar a uno de los lados
los est udios favorables al grupo de t rat amient o y al ot ro los favorables
al grupo cont rol. La presencia de punt os dispersos, que no se sit en de
forma paralela a dicha diagonal, indicar posible het erogeneidad.
Para ilust rar lo ant erior, consideraremos un hipot t ico ej emplo en el que
se desea realizar un met aanlisis de 10 ensayos clnicos que t rat an de
evaluar la eficacia de un nuevo frmaco para el t rat amient o de una
det erminada enfermedad. En t odos los est udios los pacient es son
aleat orizados para recibir el frmaco experiment al ( Grupo de
t rat amient o) o bien el t rat amient o habit ual ( Grupo cont rol) ,
cont abilizndose en cada grupo el nmero de pacient es que se han
recuperado de la enfermedad. La variable respuest a es por lo t ant o la
curacin, y la medida de efect o el riesgo relat ivo ( ) . Los dat os
ut ilizados para est e ej emplo se muest ran en la Tabla 1.
La prueba de Der Simonian y Laird no revela, con un nivel de confianza
del 95%, evidencia est adst ica de het erogeneidad ( Q= 14, 401;
p= 0, 109) . Sin embargo, los grficos de Galbrait h y de LAbb sugieren
ciert o grado de het erogeneidad, con uno de los est udios fuera de las
bandas de confianza en el primero ( aquel que proporciona una menor
est imacin del efect o) y con punt os que no se alinean en t orno a una
lnea rect a en el grfico de LAbb ( Figuras 1 y 2) .
Mt odos est adst i cos par a l a combi naci n de r esul t ados.
A pesar de las diferencias ent re los dist int os mt odos disponibles para el
met aanlisis, t odos ellos siguen un esquema similar. En la mayora de
los casos, el est imador del efect o combinado se calcula como una media
ponderada de los est imadores de cada est udio, donde los pesos se
asignan en base a la precisin de cada t rabaj o. De est a forma, los
est udios con mayor variabilidad en la respuest a o con un t amao
muest ral ms reducido t endrn una cont ribucin menor en el est imador
global.
Fundament alment e, los mt odos est adst icos ms ut ilizados en la

prct ica pueden clasificarse en dos grupos, segn se t enga en cuent a o
no la het erogeneidad ent re est udios en el anlisis
5
: los model os de
ef ect os al eat or i os y los model os de ef ect os f i j os.
a) Model os de ef ect os f i j os.
En el modelo de efect os fij os se asume que no exist e het erogeneidad
ent re los est udios incluidos en la revisin, de modo que t odos ellos
est iman el mismo efect o y las diferencias observadas se deben
nicament e al azar.
Denot ando una vez ms por la medida de efect o ( odds rat io,
diferencia de medias, et c. ) obt enida a part ir de los dat os del i- simo
est udio, en el modelo de efect os fij os se asume que exist e un efect o
global fij o :

siendo el error comet ido al aproximar .
El efect o global puede est imarse como un promedio ponderado de los
efect os individuales de cada est udio:

donde los pesos vienen dados como el inverso de la varianza de la
est imacin correspondient e:

La medida global del efect o as obt enida t endr una varianza que viene
dada por:

de modo que si se asume que sigue una dist ribucin normal podr
calcularse el int ervalo de confianza correspondient e como
.
b) Model os de ef ect os al eat or i os.
Por el cont rario, con un modelo de efect os aleat orios se asume que los
est udios incluidos en la revisin const it uyen una muest ra aleat oria de
t odos los est udios exist ent es. Ahora el efect o de cada est udio se
considera que t iene t res component es:

donde es el efect o comn que int ersesa est imar, es el efect o a
est imar en el i- esimo est udio ( en funcin de las caract erst icas
part iculares del mismo) y el error comet ido en la est imacin.
Del mismo modo que en el modelo de efect os fij os, el efect o global se
est ima aqu como una media ponderada de los est imadores individuales,
donde los pesos se calculan ahora como el inverso de la suma de la
varianza del est udio individual ms la varianza ent re est udios:

La medida global del efect o as obt enida t endr una varianza que viene
dada por:
pudiendo calcularse el int ervalo de confianza correspondient e como

.
Es frecuent e encont rar t rabaj os en los que se present an conj unt ament e
los result ados del met aanlisis t ant o con el modelo de efect os fij os como
con el modelo de efect os aleat orios. Mient ras que algunos aut ores
defienden la ut ilizacin del modelo de efect os aleat orios en t odos los
casos, ot ros hacen hincapi en sus posibles deficiencias, como el hecho
de que es menos preciso, proporcionando int ervalos de confianza ms
amplios que el modelo de efect os fij os. En general, debe t enerse en
cuent a que el principal obj et ivo de un met aanlisis no ser siempre el
de obt ener un est imador combinado del efect o. Cuando los result ados
de los est udios revisados sean clarament e het erogneos el anlisis e
ident ificacin de las causas de dicha het erogeneidad debe convert irse en
nuest ro principal obj et ivo. Si las discrepancias no son muy grandes el
modelo de efect os aleat orios se conviert e en la alt ernat iva al modelo
ms sencillo con efect os fij os para combinar los result ados. En caso de
una mayor variabilidad en los result ados la mej or opcin ser no realizar
el met aanlisis, averiguar las causas de la het erogeneidad y realizar un
anlisis por subgrupos.
Pr esent aci n de l os r esul t ados.
Una vez realizados los clculos ant eriores, los result ados de un
met aanlisis suelen represent arse en una grfica ( forest plot ) en la
que se muest ra el efect o est imado en cada est udio j unt o con el valor
obt enido combinando los result ados de t odas las invest igaciones,
acompaados por sus respect ivos int ervalos de confianza. Adems,
suele represent arse en la grfica la lnea vert ical del valor
correspondient e a la ausencia de efect os ( RR= 1 o Diferencia de
medias= 0) . Podra result ar t il fij ar t ambin los lmit es de relevancia
clnica para det erminar si las diferencias, adems de alcanzar
significacin est adst ica, son de una magnit ud relevant e.
Recurriendo una vez ms al ej emplo ant erior, en la Tabla 2 y en la
Figura 3 se muest ran los result ados del met aanlisis ut ilizando t ant o el
modelo de efect os fij os como el modelo de efect os aleat orios. Todos
salvo uno de los est udios muest ran result ados homogneos, con un
efect o favorable del t rat amient o experiment al, y RR comprendidos ent re
1, 04 y 1, 57. En los casos en los que los int ervalos de confianza cruzan
la lnea de no efect o ( RR= 1) la diferencia en las t asas de respuest a no
ha result ado est adst icament e significat iva. Con cualquiera de los dos
mt odos de anlisis, los result ados permit en concluir que el nuevo
t rat amient o es significat ivament e mej or que el t rat amient o est ndar
para conseguir la curacin de los pacient es, obt enindose medidas
globales del efect o muy similares, de RR= 1, 21 con el modelo de efect os
fij os y de RR= 1, 29 con el modelo de efect os aleat orios.
Anl i si s de sensi bi l i dad y del sesgo de sel ecci n.
Despus de realizar un met aanlisis, es recomendable est udiar la
influencia de cada uno de los est udios en los result ados obt enidos. El
anlisis de sensibilidad consist e en replicar los result ados del
met aanlisis excluyendo en cada paso uno de los est udios incluidos en
la revisin. Si los result ados as obt enidos son similares, t ant o en
direccin como en magnit ud del efect o y significacin est adst ica indica
que el anlisis es robust o. Est e mismo proceso podra repet irse
eliminando a un mismo t iempo varios est udios ( por ej emplo, aquellos de
peor calidad met odolgica, los no publicados, et c. ) para det erminar su
posible influencia en los result ados.
Junt o con el anlisis de sensibilidad, una vez obt enidos los result ados
del met aanlisis se debe analizar la exist encia de un posible sesgo de
seleccin que pudiese poner en ent redicho los result ados alcanzados.
Ent re los mt odos ms ut ilizados para evaluar la exist encia de est e t ipo
de sesgos el ms popular es el grfico de embudo
6
( funnel plot ) , el
cual se basa en represent ar el t amao muest ral de cada t rabaj o frent e
al t amao del efect o det ect ado. Lo normal sera que t odos los est udios
det ect asen un efect o de magnit ud similar, en t orno a una lnea
horizont al, con mayor dispersin cuant o menor fuese el t amao
muest ral. De est a forma, los punt os t enderan a dist ribuirse en forma de
un embudo invert ido. Si, por el cont rario, exist iese un sesgo de
publicacin, de los est udios de menor t amao muest ral solo se
publicaran aquellos que encont rasen diferencias significat ivas ent re los
grupos, de forma que la nube de punt os aparecera deformada en uno
de sus ext remos. Exist en ot ras t cnicas est adst icas como la prueba de
Begg
6
o de Egger
7
, implement adas en la mayora de los programas para
la realizacin de met aanlisis, que permit en evaluar de una manera ms
obj et iva la exist encia de un posible sesgo de publicacin.
Para los dat os del ej emplo previo, los result ados del anlisis de
sensibilidad y el grfico funnel plot se muest ran en las Figuras 4 y 5,
respect ivament e. Tal y como se puede apreciar, ninguno de los t rabaj os
parece modificar sust ancialment e los result ados si es eliminado del
met aanlisis. As mismo, la Figura 5 no evidencia la exist encia de sesgo
de publicacin, lo cual es refrendado por los result ados de las pruebas
de Begg ( p= 0, 720) y Egger ( p= 0, 316) .
En definit iva, las t cnicas de met aanlisis const it uyen as una

herramient a sin excesiva complej idad est adst ica que permit en sint et izar
los result ados de diferent es est udios en relacin con un t ema
det erminado. Su aplicacin se ha vist o facilit ada en los lt imos aos
gracias a la proliferacin de programas informt icos que implement an
est e t ipo de met odologa, como es el caso del soft ware EPI DAT
8
. Sin
embargo, su accesibilidad no debe pot enciar su uso indiscriminado,
obviando el hecho de que en ocasiones los diseos de los est udios que
se incluyen en una revisin, su calidad met odolgica o los result ados
que est os alcanzan present an un alt o grado de het erogeneidad que
desaconsej a la realizacin del met aanlisis.
Tabl a 1. Met aanl i si s de di ez ensayos cl ni cos que anal i zan l a
ef i caci a de un nuevo f r maco en el t r at ami ent o de una nueva
enf er medad.

Gr upo de
t r at ami ent o
Gr upo de cont r ol

Est udi o Enf er mos Sanos Enf er mos Sanos RR 95% I C
1 80 20 82 18 1, 11
0, 63-
1, 97
2 40 40 60 30 1, 50
1, 04-
2, 16
3 67 40 80 25 1. 57
1, 03-
2, 39
4 20 34 22 32 1, 06
0, 79-
1, 44
5 387 107 350 100 0, 97
0, 77-
1, 24
6 765 222 830 150 1, 47
1, 22-
1, 77
7 75 30 80 25 1, 20
0, 76-
1, 89
8 703 345 765 240 1, 38
1, 20-
1, 59
9 255 120 290 77 1, 53
1, 19-
1, 95
10 111 45 109 42 1, 04
0, 73-
1, 48

Fi gur a 1. Gr f i co de Gal br ai t h par a l os dat os del ej empl o en l a Tabl a 1.

Fi gur a 2. Gr f i co de L Abbl par a l os dat os del ej empl o en l a Tabl a 1.

Tabl a 2. Resul t ados del met aanl i si s par a l os dat os de ej empl o de l a Tabl a 1.
Est udi o
Tamao
muest r al
RR I C 95% ( RR)
Pesos
Model o de
ef ect os
Model o de
ef ect os
f i j os al eat or i os
4 108 1, 0625 0, 7861 1, 4360 7, 2094 9, 5287
2 170 1, 5000 1, 0411 2, 1612 4, 9052 7, 2288
1 200 1, 1111 0, 6263 1, 9712 1, 9908 3, 4331
7 210 1, 2000 0, 7601 1, 8945 3, 1375 5, 0711
3 212 1, 5701 1, 0306 2, 3919 3, 6921 5, 7917
10 307 1, 0371 0, 7264 1, 4806 5, 1614 7, 5103
9 742 1, 5252 1, 1910 1, 9532 10, 6925 12, 2262
5 944 0, 9747 0, 7661 1, 2401 11, 2800 12, 6111
6 1967 1, 4695 1, 2184 1, 7723 18, 6395 16, 2978
8 2053 1, 3785 1, 1982 1, 5860 33, 2917 20, 3012
Efect os
fij os
6913 1, 3119 1, 2100 1, 4224
Efect os
aleat orios
6913 1, 2880 1, 1504 1, 4421

Fi gur a 3. Resul t ados del met aanl i si s par a l os dat os del ej empl o de l a Tabl a 1.

Fi gur a 4. Anl i si s de sensi bi l i dad par a el met aanl i si s de l os dat os del ej empl o
en l a Tabl a 1.

Fi gur a 5. Funnel pl ot par a l os r esul t ados del met aanl i si s con
l os dat os del ej empl o de l a Tabl a 1.

Bi bl i ogr af a
1. Prt ega Daz S, Pit a Fernndez S. Revisiones sist emt icas y

met aanlisis. Cad At en Primaria 2005; 12( 2) : 109- 112.
[ Text o complet o]
2. DerSimonian R, Laird N. Met a- analysis in clinical t rials.
Cont rol Clin Trials 1986; 7: 177- 188. [ Medline]
3. Galbrait h R. A not e on graphical present at ion of est imat ed
odds rat ios from several clinical t rials. St at Med 1988; 7:
889- 894. [ Medline]
4. LAbb, K, Det sky A, O0Rourke K. Met a- analysis in clinical
research. Ann I nt ern Med 1987; 107: 224- 233. [ Medline]
5. Molinero LM. Met a- anlisis. [ I nt ernet [ . Asociacin de la
Sociedad Espaola de Hipert ensin; 2003 [ acceso, 23 de
noviembre de 2005] . Disponible en: ht t p: / / www. seh-
lelha. org/ pdf/ met aanalisis. pdf.
6. Begg CB, Mazumbar M. Operat ing charact erist ics of a rank
correlat ion t est for publicat ion bias. Biomet rics 1994; 50:
1088- 1101. [ Medline]
7. Egger M, Smit h GD, Schneider M, Zinder Ch. Bias in met a-
analysis det ect ed by a simple, graphical t est . BMJ 1997;
315: 629- 634. [ Medline] [ Text o complet o]
8. Epidat 3. 0: Anlise epidemiolxico de dat os
t abulados. [ I nt ernet ] . Xunt a de Galicia, Consellera de
Sanidade [ acceso 23 Nov 2005] . Disponible en:
ht t p: / / dxsp. sergas. es/ default . asp.

A la hora de analizar los datos recogidos para una investigacin, la eleccin de un mtodo de anlisis adecuado es crucial para
evitar llegar a conclusiones errneas. La seleccin de la tcnica de anlisis ms apropiada ha de hacerse tomando en cuenta
distintos aspectos relativos al diseo del estudio y a la naturaleza de los datos que se quieren cuantificar. El nmero de grupos
de observaciones a comparar, la naturaleza de las mimas (segn se trate de muestras independientes u observaciones
repetidas sobre los mismos individuos), el tipo de datos (variables continuas / cualitativas) o su distribucin de probabilidad
son elementos determinantes a la hora de conocer las tcnicas estadsticas que se pueden utilizar
1
.

En el anlisis de datos cuantitativos, los mtodos estadsticos ms conocidos y utilizados en la prctica, como el test t de
Student o el anlisis de la varianza, se basan en asunciones que no siempre son verificadas por los datos de los que se
dispone. As, es frecuente tener que asumir que la variable objeto de inters sigue por ejemplo una distribucin gaussiana.
Cuando la ausencia de normalidad es obvia, o no puede ser totalmente asumida por un tamao muestral reducido, suele
recurrirse a una transformacin de la variable de inters (por ejemplo, la transformacin logartmica) para simetrizar su
distribucin o bien justificar el uso de las tcnicas habituales recurriendo a su robustez (esto es, su escasa sensibilidad a la
ausencia de normalidad). Existen a su vez otros mtodos, usualmente llamados no paramtricos, que no requieren de este tipo
de hiptesis sobre la distribucin de los datos, resultan fciles de implementar y pueden calcularse incluso con tamaos de
muestra reducidos. En el presente trabajo se describirn algunos de los mtodos no paramtricos ms utilizados en la
prctica
1-3
.

En muchas situaciones se desea contrastar si la distribucin de una variable X es igual en dos poblaciones, o bien si dicha
variable tiende a ser mayor (o menor) en alguno de los dos grupos, basndose en los datos muestrales. Por ejemplo, puede
resultar interesante comparar el descenso de peso en pacientes sometidos a dos dietas alimenticias distintas, o el nivel de
dolor en sujetos con artrosis que reciben un tratamiento frente a placebo. En la teora estadstica tradicional la prueba que se
aplicara para realizar este tipo de comparaciones sera el test t de Student para dos muestras independientes
4
, siendo la U de
Mann- Whi t ney o la pr ueba de l a suma de r angos de Wi l cox on pruebas de carcter no paramtrico equivalentes que
podran emplearse tambin en esta situacin.
De un modo ms formal, supongamos que se dispone de observaciones de una misma variable X (prdida de peso, puntuacin
de dolor, etc.) en dos poblaciones distintas sobre muestras de tamao n
1
y n
2
, respectivamente:
Un modo intuitivo de proceder consiste en ordenar las observaciones obtenidas, independientemente de su poblacin de
origen, de menor a mayor valor y asignar rangos a los datos as ordenados. De esta forma, a la observacin con un valor ms
pequeo se le asigna rango 1, a la siguiente rango 2, y as sucesivamente. En caso de empates (si dos o ms observaciones
coinciden en valor) se le asignar a cada una de estas observaciones el promedio de los rangos que les seran asignados si no
hubiese empate.
Si no existiesen diferencias en la distribucin entre ambas poblaciones, los rangos deberan mezclarse aleatoriamente entre las
dos muestras. En cambio, si la suma de los rangos asignados a las observaciones de una de las poblaciones resulta mucho
mayor que la suma de los rangos asignados a las observaciones de la otra poblacin, esto indicara una diferencia en la
distribucin de la variable X entre ambas.
Denotemos por el rango asignado a cada una de las observaciones disponibles. Consideraremos
como estadstico de contraste para la pr ueba de l a suma de r angos de Wi l cox on la suma de los rangos en una de las
poblaciones:
La distribucin de probabilidad de los estadsticos anteriores ha sido tabulada para tamaos de muestra pequeos y en el caso
de no existir empates (Tabla 1). As, la Tabla 1 sirve para conocer si el resultado es significativo a nivel bilateral si se trabaja
con una seguridad del 95% y tamaos muestrales 15.
Mt odos no par amt r i cos par a l a compar aci n de dos muest r as
Aut or es:
Pr t ega Daz S, Pi t a Fer nndez S
Unidad de Epidemiologa Clnica y Bioestadstica. Complejo Hospitalario Juan Canalejo (A Corua).
Centro de Salud de Cambre (A Corua).

I nt r oducci n.
Dos muest r as i ndependi ent es: l a pr ueba U de Mann- Whi t ney y l a pr ueba de l a suma de r angos de Wi l cox on.
Poblacin 1:
Poblacin 2:

Page 1 of 7 Mtodos no paramtricos para la comparacin de dos muestras
11/11/2009 http://www.fisterra.com/mbe/investiga/noParametricos/noParametricos.asp
Para tamaos muestrales mayores (>15), es adecuado utilizar la aproximacin normal, obteniendo a partir de T la variable:
donde y son la media y desviacin estndar de T si la hiptesis nula es cierta, y vienen dadas por las siguientes
frmulas:
El nmero de empates debe ser adems pequeo en relacin con el nmero total de observaciones. En el caso de empates, la
varianza del estadstico T debe modificarse, de modo que la expresin anterior quedara como sigue:

Una vez obtenido el valor de z ste se debe referir a las tablas de la distribucin normal para obtener el valor de significacin
asociado
5
.

Para ilustrar el uso de esta prueba, consideraremos los datos de la Tabla 2, correspondiente a los valores de medicin del dolor
(en una escala de 0 a 10) en dos grupos de 11 pacientes sometidos a dos tratamientos analgsicos diferentes. En este caso
n
1
=n
2
=11. La suma de los rangos asignados a las observaciones del primer grupo es T=171, y su media
Puesto que la suma de rangos obtenida supera a la esperada, consideraremos como estadstico final T=171-126,5=44,5, y lo
referiremos a los valores en la Tabla 1. Trabajando con un planteamiento bilateral y una seguridad del 95%, la regin de
rechazo corresponde a valores de T menores o iguales a 96, por lo cual se rechazara la hiptesis nula de igual nivel de dolor
en ambos grupos de tratamiento con un nivel de significacin p<0.05.
En el ejemplo propuesto podemos comprobar el resultado que se obtendra al utilizar la aproximacin normal. Tal y como
vimos:
Con lo cual se utilizara el estadstico:
que debe referirse a los valores de una distribucin normal estndar
5
. As, se obtiene p=0,002, concluyndose igualmente que
el nivel de dolor es diferente segn la terapia analgsica utilizada.
Por otra parte, es frecuente referirse a la pr ueba de l a suma de r angos de Wi l cox on con el nombre de pr ueba U de
Mann- Whi t ney . En realidad, son dos pruebas diferentes, aunque esencialmente equivalentes entre s. Para el clculo de la
pr ueba U de Mann- Whi t ney , en lugar de la suma de rangos se calcularn los valores:
U
12
: el nmero de pares para los cuales una observacin de la primera poblacin es inferior a una observacin de la segunda
poblacin, .

y

U
21
: el nmero de pares para los cuales una observacin de la primera poblacin es superior a una observacin de la segunda
poblacin, .
En caso de empate se contabilizarn 0,5 unidades a mayores en cada una de las cantidades anteriores. De forma anloga a
como ocurra con la prueba anterior, valores bajos de U
12
indicarn una diferencia hacia valores ms altos de la variable en la
primera poblacin, mientras que valores altos indicarn que estos tienden a ser ms altos en la segunda poblacin.
Los parmetros anteriores se relacionan con el estadstico T descrito anteriormente mediante la siguiente ecuacin:
De forma que a partir del estadstico U puede obtenerse inmediatamente el valor del estadstico de Wilcoxon y utilizar la
metodologa anterior para obtener el valor de significacin asociado. De hecho, la mayor parte de programas estadsticos,
como el SPSS, muestran en sus salidas los valores de ambos estadsticos, junto con un p-valor comn, bien calculado a partir
de la aproximacin asinttica mediante una distribucin normal o a partir de las tabulaciones correspondientes, corrigiendo la
posibilidad de empates. Otra prueba equivalente aunque menos conocida es la S de Kendall, calculada segn S= U
12
- U
21
.
Por ltimo, decir que al igual que el anlisis de la varianza en el abordaje estadstico tradicional extiende la prueba t de
Student al caso en el que se quieran comparar ms de dos grupos, el t est de Kr usk al l - Wal l i s es una extensin natural de la
pr ueba de Mann- Whi t ney a esta situacin. Para su clculo se ordenarn las N observaciones obtenidas, independientemente
de su poblacin de origen, de menor a mayor valor y se asignarn los rangos correspondientes. El estadstico de contraste para
la pr ueba de Kr usk al l - Wal l i s vendr dado por:
donde N denota al nmero total de observaciones en los k grupos que se comparan, es el promedio de los
rangos de las observaciones del i-simo grupo y el promedio de todos los rangos. As definido, el estadstico H sigue una
distribucin con k-1 grados de libertad.
Otra situacin muy frecuente es aquella en la que se desea comparar la distribucin de una variable X en dos muestras de
casos apareados, usualmente sobre los mismos individuos en dos momentos diferentes de tiempo. Por ejemplo, puede
quererse comparar el nivel de dolor en una articulacin antes y despus de un tratamiento con infiltraciones, o el peso antes y
despus de someterse a algn programa de adelgazamiento. En estas situaciones, es lgico trabajar con la diferencia de las
observaciones entre ambos momentos (prdida de peso, disminucin del nivel de dolor, etc.):
donde aqu denotan los valores observados de la variable X en n individuos en el primer instante y
los valores observados en un instante posterior.
Una forma sencilla de proceder consiste en contabilizar el nmero r de diferencias positivas y el nmero s de diferencias
negativas (sin contar los valores 0). Bajo la hiptesis nula de que no existen diferencias, ser igualmente probable obtener una
diferencia positiva o negativa, por lo que ambos valores se distribuirn segn una distribucin binomial de parmetros Bi
(r+s,1/2). Recurriendo a las tablas de la distribucin binomial, podemos obtener a partir de r (o, equivalentemente, de s) el
valor exacto de significacin asociado (Tabla 3).
Como ejemplo, utilizaremos los datos de la Tabla 4 en la que se muestra la prdida de peso alcanzada por 20 sujetos
sometidos a un programa de adelgazamiento. El nmero de observaciones positivas (pacientes que realmente perdieron peso)
es r=14, mientras que el nmero de observaciones negativas (pacientes que ganaron peso) es s=6. Refiriendo estos valores a
los de una distribucin binomial de parmetros Bi(20,1/2) se obtiene un valor de p=2x0,058=0,116, por lo que no puede
concluirse que exista una prdida de peso significativa en los pacientes estudiados.

Dos muest r as r el aci onadas: l a pr ueba del si gno y l a pr ueba de l a suma de r angos con si gno de Wi l cox on.

Para tamaos muestrales grandes (n20) puede utilizarse como estadstico de contraste:
que seguir aproximadamente una distribucin normal estndar N(0,1).
En el ejemplo anterior:
Si referimos el valor obtenido a la funcin de probabilidad de una distribucin N(0,1) se obtiene p=0.075, no resultando en un
valor significativo tal y como ocurra con la aproximacin por la binomial.
La pr ueba del si gno, tal y como se denomina a la prueba que se acaba de describir, presenta como mayor limitacin el hecho
de que no tiene en cuenta la magnitud (positiva o negativa) de las observaciones. As, puede ocurrir que existan muchas
diferencias positivas pero de escasa magnitud (pacientes que pierden peso pero en poco volumen) y pocas diferencias
negativas pero de mucha mayor importancia (pacientes que ganan mucho peso). Este tipo de situaciones deberan reducir la
posibilidad de encontrar diferencias significativas entre las observaciones.
La pr ueba de l a suma de r angos con si gno de Wi l cox on toma en consideracin la deficiencia anterior. Las observaciones
se ordenan de menor a mayor valor absoluto y se les asignan rangos (ignorando los valores nulos y actuando igual que en el
caso de la prueba de suma de rangos ante empates). Se utilizar como estadstico de contraste la suma T
+
de los rangos
asignados a valores positivos o bien la suma T
-
de los rangos asignados a valores negativos. Para valores pequeos de n, la
distribucin de T
+
y T
-
est completamente tabulada, y puede utilizarse para obtener los valores crticos del test (Tabla 5). En
el caso de muestras grandes (n20), la distribucin de T
+
y T
-
puede aproximarse por la de una variable normal. As,
realizando la transformacin:
la distribucin asociada es la de una normal estndar (donde n es el nmero de observaciones no nulas).
Al igual que ocurra en la prueba de la suma de rangos para muestras independientes, en caso de empate la varianza del
estadstico vara y debera efectuarse alguna correccin en la expresin anterior. As mismo, los valores crticos en la Tabla 5
para el caso de empates suelen resultar algo conservadores, es decir, con empates se tender a aceptar la hiptesis nula de no
diferencias cuando en realidad sta debera ser rechazada.
Volviendo al ejemplo anterior, y tras ordenar las observaciones en la Tabla 4 de menor a mayor valor absoluto, se obtiene las
sumas de rangos T
+
=178,5 y T
-
=31,5 correspondientes a las observaciones con prdida o ganancia de peso, respectivamente.
Refiriendo estos valores a los que se muestran en la Tabla 5 con n=20, se obtiene un valor de p<0.01.
Obviamente, el tipo de procedimientos aqu expuestos permiten cubrir slo una pequea parte de las situaciones que se nos
pueden plantear en la prctica. En la mayora de las ocasiones, se dispone de informacin en una gran cantidad de variables, lo
cual requiere recurrir a otros mtodos de anlisis que no slo permitan estudiar las relaciones entre un par de variables, sino
estudiar el efecto conjunto de todas ellas.

Tabl a 1. Per cent i l es 95 par a l a pr ueba de l a suma de r angos de 2 muest r as de Wi l cox on.
n1
n2 4 5 6 7 8 9 10 11 12 13 14 15
4 10
5 11 17
6 12 18 26
7 13 20 27 36
8 14 21 29 38 49
9 14 22 31 40 41 62
10 15 23 32 42 53 65 78
11 16 24 34 44 55 68 81 96
12 17 26 35 46 58 71 84 99 115
13 18 27 37 48 60 73 88 103 119 136
14 19 28 38 50 62 76 91 106 123 141 160
15 20 29 40 52 65 79 94 110 127 145 164 184
Se define n
1
como el tamao muestral menor, . Se calcula T como la suma de los rangos
asignados a las observaciones de la muestra 1. Si , se toma
. El resultado es significativo al nivel bilateral del 5% si T es menor o
igual al valor tabulado.

Tabl a 2. Val or es de medi ci n del dol or ( en una escal a de 0 a 10) en dos gr upos de paci ent es
somet i dos a dos t r at ami ent os anal gsi cos di f er ent es.
Tr at ami ent o A Rango asi gnado Tr at ami ent o B Rango asi gnado
1 100 22 85 18
2 85 18 62 8
3 72 15 57 6.5
4 64 9.5 32 1
5 70 12.5 70 12.5
6 56 5 54 4
7 87 20 45 2
8 71 14 50 3
9 95 21 64 9.5
10 80 16 66 11
11 85 18 57 6.5
Suma de r angos 171 82

Tabl a 3. Tabl a de l a di st r i buci n bi nomi al acumul ada Bi ( n, p) con p= 1/ 2.

k
n
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
5 0,031 0,188 0,500 0,812 0,969

6 0,016 0,109 0,344 0,656 0,891 0,984

7 0,008 0,062 0,227 0,500 0,773 0,938 0,992

8 0,004 0,035 0,145 0,363 0,637 0,855 0,965 0,996

9 0,002 0,020 0,090 0,254 0,500 0,746 0,910 0,980 0,998

10 0,001 0,011 0,055 0,172 0,377 0,623 0,828 0,945 0,989 0,999

11

0,006 0,033 0,113 0,274 0,500 0,726 0,887 0,967 0,994

12

0,003 0,019 0,073 0,194 0,387 0,613 0,806 0,927 0,981 0,997

13

0,002 0,011 0,046 0,133 0,291 0,500 0,709 0,867 0,954 0,989 0,998

14

0,001 0,006 0,029 0,090 0,212 0,395 0,605 0,788 0,910 0,971 0,994 0,999

15

0,004 0,018 0,059 0,151 0,304 0,500 0,696 0,849 0,941 0,982 0,996

16

0,002 0,011 0,038 0,105 0,227 0,402 0,598 0,773 0,895 0,962 0,989 0,998

17

0,001 0,006 0,025 0,072 0,166 0,315 0,500 0,685 0,834 0,928 0,975 0,994 0,999
18

0,001 0,004 0,015 0,048 0,119 0,240 0,407 0,593 0,760 0,881 0,952 0,985 0,996 0,999
19

0,002 0,010 0,032 0,084 0,180 0,324 0,500 0,676 0,820 0,916 0,968 0,990 0,998
20

0,001 0,006 0,021 0,058 0,132 0,252 0,412 0,588 0,748 0,868 0,942 0,979 0,994
21

0,001 0,004 0,013 0,039 0,095 0,192 0,332 0,500 0,668 0,808 0,905 0,963 0,987
22

0,002 0,008 0,026 0,067 0,143 0,262 0,416 0,584 0,738 0,967 0,933 0,974
23

0,001 0,005 0,017 0,047 0,105 0,202 0,339 0,500 0,661 0,798 0,895 0,953
24

0,001 0,003 0,011 0,032 0,076 0,154 0,271 0,419 0,581 0,729 0,946 0,924
25

0,002 0,007 0,022 0,054 0,115 0,212 0,345 0,500 0,655 0,788 0,885

Tabl a 4. Val or es del peso en una muest r a de 20 paci ent es ant es y despus de somet er se a un
pr ogr ama de adel gazami ent o.
Peso i ni ci al Peso f i nal Pr di da de peso Si gno Rango asi gnado
100 89 21 + 20
1. Altman DG. Practical Statistics for Medical Research. London: Chapman & Hall, 1991. [ndice]
2. Armitage P, Berry G. Estadstica para la investigacin biomdica. 3 ed. Barcelona: Doyma; 1997.
3. Milton JS., Tsokos JO. Estadstica para biologa y ciencias de la salud. 3 ed. Madrid: Interamericana McGraw Hill; 2007.
4. Prtega Daz S, Pita Fernndez S. Mtodos paramtricos para la comparacin de dos medias. T de Student. Cad Aten
Primaria 2001; 8. 37-41. [Texto completo]
5. Prtega Daz S, Pita Fernndez S. La distribucin normal. Cad Aten Primaria 2001; 8: 268-274. [Texto completo]
98.5 90.5 8 + 14
87 89 -2 - 6
95.5 98 -2.5 - 7
79 72.5 6.5 + 13
84.5 80 4.5 + 11.5
96 85 11 + 16.5
99 98 1 + 1.5
120 110 10 + 15
104 105.5 -1.5 - 4
76.5 75 1.5 + 4
83 80 3 + 9
83 84 -1 - 1.5
92 80 12 + 18
90 79 11 + 16.5
96.5 92 4.5 + 11.5
101 98 3 + 9
106 90 16 + 19
96 97.5 -1.5 - 4
87 90 -3 - 9
Nmero de valores positivos: r=14
Nmero de valores negativos: s=6
Suma de los rangos de los valores positivos: T
+
=178,5
Suma de los rangos de los valores negativos: T
-
=31,5

Tabl a 5. Val or es cr t i cos par a l a pr ueba de l a suma de r angos con si gno de Wi l cox on segn el
t amao de muest r a y el ni vel de si gni f i caci n asoci ado.
Tamao de l a muest r a
ex cl ui das l as di f er enci as nul as
Ni vel de si gni f i caci n bi l at er al
0,05 0,01
6 0 -
7 2 -
8 3 0
9 5 1
10 8 3
11 10 5
12 13 7
13 17 9
14 21 12
15 25 15
16 29 19
17 34 23
18 40 27
19 46 32
20 52 37
21 58 42
22 66 48
23 73 54
24 81 61
25 89 68
Se muestra el valor crtico para la menor de las sumas de rangos T
+
T
-
. Un valor es
significativo al nivel bilateral sealado si la suma de rangos es menor o igual al valor tabulado.

Bi bl i ogr af a


Metodolog

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Metodolog

Uploaded by

Copyright:

Available Formats

Metodologa de la Investigacin

Salvador Pita Fernndez

fuese del 90% el coeficiente sera 1.645

fuese del 95% el coeficiente sera 1.96

fuese del 97.5% el coeficiente sera 2.24

fuese del 99% el coeficiente sera 2.576

= Valor Z correspondiente al riesgo deseado

= Valor Z correspondiente al riesgo deseado

segn el poder se indican en la Tabla 2

= Valor Z correspondiente al riesgo deseado

= Valor Z correspondiente al riesgo deseado

segn el poder se indican en la Tabla 2

ms f r ecuent ement e ut i l i zados

. Dicha precisin es la oscilacin mnima

que se espera en el total de la muestra.

-cuantil de la distribucin normal estndar

denota al coeficiente de correlacin

, la prueba exacta de fisher, la prueba de McNemar o la prueba Q de Cochran, entre otras.

como mtodo estndar de

en el cont r ast e de i ndependenci a de var i abl es al eat or i as cual i t at i vas.

permite determinar si dos variables cualitativas estn o no asociadas. Si al final del

es as un test no dirigido (test de planteamiento bilateral),

, para este ejemplo en concreto, vendra dado entonces como:

puede simplificarse y obtenerse

con la correccin de Yates nos dara un valor de

=38,43 (p<0.0.1) en lugar de

=40,04. No existe consenso en la literatura sobre la utilizacin o

en 1900, sta se ha convertido en una herramienta de

es aplicable a los datos de una tabla de contingencia solamente si las

no ser el mtodo apropiado para contrastar la hiptesis nula de

cuando no se verifiquen las condiciones necesarias para su utilizacin

, para comprender cundo es adecuado o no su uso y disponer de las tcnicas estadsticas

testo f goodness of fit. Biometrika 1922; 14: 186-191.

sigue una distribucin chi cuadrado con un grado de libertad.

con un grado de libertad se concluye que la diferencia es

Revisiones sist emt icas y Met aanlisis

En at encin primaria, al igual que en ot ras especialidades, las t cnicas

Junt o con el sesgo de publicacin, el sesgo de seleccin es una de las

ms clara y concisa posible la pregunt a de invest igacin que

dichos crit erios rigurosament e a cada est udio, siendo

met aanlisis, mient ras que ot ros defienden la ut ilizacin en

que se incorporan al est imador combinado a t ravs de los

15. LAbb K, Det sky A, ORourke K. Met a- analysis in clinical

Revisiones sist emt icas y Met aanlisis ( I I )

Rev i si ones si st emt i cas y Met aanl i si s ( I I )

no su magnit ud, no son medidas apropiadas para ut ilizar en

Fundament alment e, los mt odos est adst icos ms ut ilizados en la

pudiendo calcularse el int ervalo de confianza correspondient e como

En definit iva, las t cnicas de met aanlisis const it uyen as una

1. Prt ega Daz S, Pit a Fernndez S. Revisiones sist emt icas y

You might also like