Como Estudiar Un Estudio y Probar Una Prueba - La Prueba de Una Prueba

CAPTULO 13
INTRODUCCIN
A LA PRUEBA DE {JNA PRUEBA
El diagnstico mdico puede contemplarse como un intento de tomar las dedsiones idneas manejando informadn insufidente. As, la incertidumbre intrnseca al diagnstico mdico procede de la necesidad de reaJizlr diagnsticos basadosen datos indertos. Los instrumentos diagnsticos empleados I~nmedidna se han considerado tradidonalmente como un medio de redudr la incertidumbre en el diagnstico. Sin embargo, para utilizar con xito las pruebas diagnsbcas, se debe saber valorar no solo la forma cmo las pruebas reducen la incertidumbre ~;inotambin cmo describen y cuantifican la incertidumbre restante. En pocas pasadas, los instrumentos diagnsticos estaban limitados en gran parte a la historia clnica y al examen fsico. Actualml?nte, estos todava son potentes instrumentos de diagnstico. Sin embargo, hoy da St~ dispone, adems de los mtodos convencionales, de una tecnologa auxiliar con la cral el clnico cuidadoso puede redlizar diagnsticos prt.'Lisos,si la emplea dpropiada y ;electiva mente. La esenciade la prctica de la medicina diagnstica est constituida por el aprendizaje de cundo, si es conveniente, debe aplicarsecada elemento de la historia, del examen fsico y de la tecnologa auxilidr. El nfasis actual en la calidad con consciencia del costo requiere que los mdicos entiendan los principios fundamentales de las pru~bas diagnsticas: cules son las preguntas que pueden responder ~'cujles no, cules s,)n las pruebas que aumentan la precisin didgnstica ~.cules simplemente increment.m el costo. r,1ra p.1rafr.1sear Will Rogers, los mdicos traliidonalmente han a penSddoque ndda es cierto, exceptl) la bil)psid y Id autopsia. Sin embJrgo, incluso estos criterios de referencia para el dia~nstico l...JOld sfalufards)pueden err.lr el objetivo o reaiizarse dem.1siadotarde p.1raser de .1~.ud.1 alguna. El conocimiento c e los principios de las prueb.1sdi.1gnsticascontribu~.ea definir el grado de incertidumbre diagnstica ~'a aumentar la certeza. Saber cmo vi\ircon la incertidumbre es una caracterstica central del juicio clnico. El mdico habilidoso ha .1prendido cando debe a~;umir riesgos para aumentar 1.1 certeza y cunlio debe, simplemente, tolerar la incertid!lmbre. El prin~ipio fundamental de l.1spruebas diagnosticas reside en la creen~i.1 que los individuos que tienen una enfermedad son distintos de los que no de la tienen y que las pruebas diagnsticas permiten distinguir a los dos grupos. Las pruebJSdi.1gnstic.1s, p.1r.1 perfect.1s,requeriran que 1) todos los iruiivduos sin la enser fermed.1den estudio tuvieran un valor uniforme en la prueba, 2) ql e todos los individuos con la enfermedad tuvieran un valor uniforme pero distinto en la prueba y 3) que todos los resultados de las prueb.1sfueran consistentes con los resultados del grupo de los enfermos y del de los sanos (figura 13-1). Si esta fuera la situacin en el mundo real, la p"Ueba perfecta podra distinguir la enfermedad de la salud, yel trabajo del mdico consistira nicamente en solicitar la prueba "adecu.1d.1".El mundo real, sea para bien o p:lra mal, no es t.1n simple. Habitu.1lmente, ninguna de estas condiciones est presente. Existen variaciones en cada uno de los siguientes factores bsicos: las pruebas, el gnlpO de enfermos y el de s.1nos(figura 13-2).
~ ~ -;: '2:. ~ -;: E ~ ~ .'5 -;: '2:. ~ 8 ~ ~ ~
95
. fi:t
FIGURA13-1. Condicionesnecesarias de una prueba diagnOsticaperfecta

,'i -
" I I
x = VaJor para el sueIO SIn la enfermedad y = Valor para el SUeIO con la enfermedad
FIGURA 13.2. Los tres tipos de variaciones Que afectan a las pruebas diagnOsticas
~ ~ ~ ~ :: ~ ~ :o :) ~ ;:) " :5 ;"'

% ::
~ ~ ';J") ;.. ::::, ~ '..I
l--
Inter';21O varaconde iOS ce su;etos la ertelr:'ecad SIn I I
I I I I
!rtervalc \-anac:n los de de sujetos la entelmedad con
\0}6
La valoracin de las pruebas diagnsticas consiste en gran m,~dida en describir la variabilidad de estos tres factores, y por esa razn se pueden cuantificar las conclusiones, a pesar o a causa de esa variabilidad. La variabilidad, la reproducibilidad y la exactitud de las pruebas se presentan en el capitulo 14. En el capitulo 15 se revisa y valora la variabilidad de la poblacin de las personas sanas empleando el concepto del intervalo de la normalida,j. En los capitulos 16 y 17 se cuantifica la variabilidad de la poblacin de personas enfermas y su relitcin con la de las sanits por medio de los conceptos de sensibilidad, espel:ificiditd y vitlor predictivo. En esos citpitulos se esbozitn estos conceptos y se mue~;tran ejemplos de los errores que se cometen al itplicarlos. Seguidamente, se incluyen varios ~jercicios pitrit d~tl'CtLtr errores, que ofrl'Cl'n lit oportuniditd de itplicitr esos princiF'ios a la evLtluitcin de las prueb,ls diitgnl)sticits.
Al igual que con el anlisis de un estudio, es til tener una visin panormica o marco general de la evalacin de una prueba. Este marco se ilustra en la figura 13-3, en la que se representa la variabilidad que existe en las pruebas, en la poblacin sana y en la enferma. Tambin se subraya que estas variaciones deben ser estudiadas e incorporadas en cualquier valoradn de la utilidad diagnslicade una prueba.
FIGURA 13-3. Marco uniforme de la prueba de una prueba
~ , ~
-
~ ~ "' , 2. ~ :; r:: 5 ~ ~ ~
Q7
ARIABILmAD
DE UNA
PItUEBA
Una prueba perfecta producira los mismos resultados cadl vez que 5e aplicara en las mismas condiciones. Adems, sus medidones reflejaran exa,:tamente el fenmeno que la prueba intenta medir. En otras palabras, una prueba perfl~ta sera completamente u tiliza n . reproducible y exacta. Definamos estos trminos y veamos cmo Se
La reproducibilidad la capacidad de una prueba para prcducir rees suJtados consistentes cuando se repite en las mismas condiciones y se inter:>reta sin conocer sus resultados previos. Sin embargo, en la reproducibilidad de un.l prueba pueden influir diversos factores. I. Las condiciones del paciente y del laboratorio bajo las que se realiza 11prueba pueden no ser las mismas. 2. La prueba puede estar influida por variaciones de interpretacin ent"e observadores. Este efecto se conoce como lYlriabilidadillleroll$er'lYldor. 3. La prueba puede verse afectada por variaciones en la interpretacin qLe realiza la misma persona en diferentes momentos. Este efecto se conoce como lu;-iabiliiad illlraoll$er'loador. Paravalorar el rendimiento de la prueba, los investigadon~sdeben estar seguros de que las condiciones tcnicas y biolgicas de su realizacin son idnticas cuando se repite. El no seguir esta precaucin produce el error que se muestra en el siguiente ejemplo. Con el tin de evaluar la reprodul.;bilidad de una prueba pa ra medir la concentracin srica de cortisol se extrajeron dos muestras de sangre de los mismos individuos. La primera muestra se extrajo a las 8 de la maana y la segunda, al medioda. Los mtodos fueron idnticos y la interpretacin se realiz sin conocimiento pre\ io de los resultados de la primera prueba. Este mtodo se aplic a 100individuos ;eleccionados al azar. Los autores observaron que los valores de la segunda prueba eran en promedio el doble de la primera prueba aplicada al mismo individuo. Concluyeron que esta i ~ran variacin indicaba que la prueba no era reproducible. "' Recuerdeque la reproducibilidad es la capacidad de la pru,!ba para producir casi los mismos resultados cuando se realiza en las mismas condici(lnes. En este ejemplo, los investigadores no repitieron la prueba en las mismas condicilmes. La concentracin de cortisol tiene un ciclo natural durante el da. Al extraer una :nuestra de sangre a las 8 de la maana y otra al medioda, estaban obteniendo muestras de dos momentos distintos del ciclo. Aunque la prueba fuera perfectamentereproduciblEcuando se realizase en condiciones de laboratorio idnticas, las distintas situaciones do!los pacientes a los que se practic hubieran producido resultados bastante diferente~;. A menos que una prueba se repita sin conocer el resulta jo de la primera, la segunda lectura puede estar influida por la primera. como ilustra el siguil.'nte I.'jemplo. ~ ~ 1 ,"
~ :r. ;: ~ z ::J ~ ~ :r. '::) ~ ;... '::) ;... (J) '-J z -'
;... (J) '-J '"' -' ~ '::) c..)
~ ~ 3 ::J
II
i f
Un investigador, al estudiar la reproducibilidad de un anlisis de orina, solicit a un tCI'licode laboratorio experimentado que leyer2 un sedimento urinanO y, sin cambiar de lugar el portaobjetos, lo volviera a leer a lo:; cinco minutos, El investigador observ que la lectura, realizada en las mismas condi,jones, produjo resultados perfectamente reproducibles. En este ejemplo, el tcnico conoca los result.ldos de la primera prueba y era probable que estuviese influido por la primera lectura cuando la repiti a los cinco minutos, Una medida de la reproducibilidad requiere que la segunda lectura se efecte sin conocimiento pre\'o de la primera, Por esta razn, ,~Itrnico no debi haber conocido los resultados de la lectura anterior, Aunque los observadores no sean conscientes de sus propias lecturas previas o de las de otros, existe la posibilidad de que la variacin individual induzca a error cuando se comparan los resultados de la prueba. SiEmpre que hay que fonnar un juicio en la interpretacin de una prueba, existe la posil:ilidad de variacin inter e intraobservador. Es frecuente que dos radilogos interpreterlla misma placa de rayos X de diferente manera, lo cual se conoce como variacin interJbservador, Un residente puede interpretar el mismo electrocardiograma de fonna diferente por la manaa que en medio de una guardia nocturna, Esto se conoce comc variacin intraobservador, Por s mismas, estas variaciones no arruinan la utilidac. de la prueba, Sin embargo, es necesario que el mdico est siempre alerta a la posibilidad constante de variaciones en la interpreta(.in de los resultados de la prueba, L1s ir consistenciasde la tcnica o de la interpretacin contribuyen en cierta medida a la varia oilidad de la mayor parte de las pruebas, Por lo tanto, es preciso aplicar criterios que pem,itan juzgar cunta variabilidad puede tolerarse. En general, es importante que la variabilidad dl~la prueba sea mucho menor que el intervalo de variabilidad debido a factores biolgi( os. Por esta razn, el grado de \'.lri.lcin de la prueba debe ser pequeo en comparacin con el intervalo de nonnalidad de la prueba (vase el captulo 15), Es importante distinguir la reproducibilidad l!e la exactitud, L1 e\"tlctitudde una prueba es la capacidad que tiene de producir resul:ados cercanos a la verdadera medida del fenmeno anatmico, fisiolgico o bioqumi(:o, L1 exactitud de und prueba rt.'qu!ereque esta sea reproducible y que el resultado ru) muestre una tendencia sistemtica a diferir del \'erdadero valor en una direccin detl~rminada, Cuando disparamos a un blanco, a veceserramos el tiro porque las balas se dspersan alrededor del centro. Tambin puede haber una tendencia a situar todos los tiros a un solo lado ligeramente apartado del centro. Para ser perf~"tamente exactos y dar cada vez en el centro del blanco, debe existir reproducibilidad, eliminando de esra fonna la dispersin, :-'odebe existir un sesgo0 una tendencia a disparar siempre h,1a un lado. Por lo tanto, una prueba exacta est exenta de los efectos del azar y de em>res sistemticos o sesgos,Una prueba puede ser muy reproducible ya la vez inexacta, si reproduce \-alores alejados del valor verdadero. El siguiente caso ejemplifica un.! prueba con alta reproducibilid,ld pero poca exactitud, o sea, la diferencia entre reproducibilidad y exactitud, Se realiz un estudio de 100pacientes que haban sido operados por fracturas naviculares. De cada paciente, se obtuvieron dos radi:>grafas que se interpretaron de forma independiente. Ambas fueron negativas para una fractura navirular I!n la Sl!m.maposterior a la lL'Sin. autores concluyeron que lo, radilogos haban Los sido negligentes al no diagnosticar esasfracturas. rbr lo genl!ral, las fracturasnavicularesno se diagnostican por medio de radiografas tomad,1sI!n el momento dl! la lesin. Desde el punto ce vista anatmico,
..;: :r. ~ ..;: ~ ~ ~

~ ..;: ~ ..;: ~
99
la fractura existe, pero no suele detectarse en la radiografa hasta que no apar~en signos de reparacin, Por consiguiente, no se trata de una negligencia de los ra(lilogos, sino de la inexactitud de la prueba utilizada. La repeticin de las radiografas ('onfinn6 );. la reproducibilidad de los resultados negativos obtenidos por los dos radilog)s: no es posible identificar fracturas naviculares recientes en las radiografas. Exactitud significa que la prueba producir resultados semejantes al verdadero valor anatmicc , fisiolgico o bioqumico. Dado que las radiografas no son siempre un reflejo exacto c e la anatorna, el defecto radicaba en la prueba, no en los radilogos, Una prueba puede ser bastante exacta cuando se emplea tn un estudio cientfico, pero puede perder su exactitud cuando se aplica en el medio cl'nico, Es til pensar en dos tipos de exactitud: I) exactitud experimental, es decir, la exa('titud de la prueba cuando se utiliza en las condiciones especialesde un estudio, y 2) e~ctitud clnica, es decir, la exactitud de la prueba cuando se emplea en las situaciones clnicas reales. La diferencia entre ambos conceptos se muestra en el siguiente ejemplo>, En un hospital universitario se realiz un estudio de 500 p3cientes que siguieron una dieta baja en grasas durante 3 das, Se mostr que el contEnido de grasas en las heces recogidas 72 horas despus de finalizar la dieta permita distinguir bien entre los pacientes con malabsorcin y los que no la padecan. Con un p "Otocolo de estudio idntico aplicado a 500 pacientes ambulatorios no se consigui de:nostrar con que los resultadosde malabsorcin. Los autores del estudio ambulatorio ccncluveron xito la presencia obtenidos con los pacientes hospitalizados eran incorrel:tos. . El rendimiento de una prueba se valora habitualmente ell condiciones experimentales ideales, pero las condiciones reales en las que se aplica l1uchas \'eces estn lejos de ser ideales. En pacientes ambulatorios puede ser bastante difdl recoger las heces J las 72 horas despus de una dieta de tres das de duracin baja en grasas. El hecho de que los resultados de los datos de pacientes ambulatorios '0 conl"Uerden con los de los pacientes hospitalizados puede reflejar simplemente la realidad de las condiciones en la prctica. La exactitud es una propiedad necesaria de un.1buena prueba. No obstJnte, la exactitud, por s sola, no gJrantiza que la prueba sea \'lida o til para el diagnostico. La LYlluiez implica que la prueba es una medida apropi3da del fenmeno estudi.ldo, Una medida muy reproduble y exacta del tamao dc loS pulmones puede proporcionar poca informacin vlida o til para un diagnl)stico. !>araestablecer la utilidad diagnstica de una prueba, necesitamosvalorar la idoneidad ( on que la prueba distingue entre las personas sanas y las enfermas. Antes de tratar de determinar la idoneidad de una prueba p,lra distinguir los que no tienen una enfermedad de los que la tienen, centraremos Iluestra atencin en analiz.lr cmo medimos la ausencia de ~nfermedad por medio del concepto del intervalo de lo normal.
~ ~ ~ ~ ':, ~ ;... ~ -
~ ~ '.
... -
(; '"' ~ ':J '..I
CAPTULO 15
L INTERVALO
DE LO NORMAL
Las poblaciones humanas sanas estn sujeta~ a variaciones biolgicas intrinsecas. Uno solo necesitapasear por la calle para apreciar las diferencias entre la gente. La altura, el peso y el color de los individuos cubren un e~pacio que refleja las variaciones grandes, pero no ilimitadas, que pueden existir entre individuos sanos. En un mundo con informacin completa sabJamoscul es el resultado que debe tener un indi\1duo en una prueba detenninada. Esto nos permitira comparar el resultado obtenido en la prueba con el resultado esper Ido en esa persona. En la realidad, como raramente sabemos cul debera ser el resultado en un sujeto, estamos obligados a comparar sus resultados con los de otros individuos considerados sanos. Para llevar a cabo esta comparacin utilizamos un intemllc de lo nomUlIo de la nonnalidad. El intervalo de lo nonnal es un mal necesario basado en la suposicin de que un individuo concreto debe ser similar a otros individuos. El concepto del intervalo de la nonnalidad rep -esenta un esfuerzo para medir y cuantificar el inter\.alo de valores que existen en indi.iduos considerados sanos. Se puede derivar un intervalo de lo nonnal de cualquier med icin en la que existan mltiples posibles valores numericos para los sujetos sanos. Estc>s comprenden exmenes de caractersticas fsicas tales como la tensin arterial, el tan lao del hgado y el pulso o valores de laboratorio como el hematcrito, la velocidad de sedimentacin o la creatinina. Aunque el intervalo de medidas nonnalt.'Ssuele ser .1m:>lio,el concepto no incluye a todas las personas que no estn eniennas. Este intervalo ~xcluye a propsito a .5'710 los individuos considerados sanos, con el fin de crear un intervalo de lo nonnal de suiil-jentemente amplio para describir la ma~.orp,lrte de las mediciones de las personas sanas, pero no tan amplio como para incluir todos los posibles valo .esnumricos. Si el intt.'rvalo de la normalid~d incluvera las mediciones de todos los irdi\;duos sin la enfennedad, sera extrem,ldament~ amplio, tan amplio que no sera lil para separar a los enfennos de los sanos. El intervalo de lo nonnal es descriptivo y no diagnstico; describe a los individuos sanos, no diagnostica la enfennedad. Los val()res que se encuentran fuera de ese intervalo p<.~rian ser el resultado de la variacir debida al azar, de cambios fisiolgicos no asociados con la eniennedad o de cambios patolgicos secundarios a la enfennedad.
CONSTRUCCIN OEL INTERVALO DE LO NORMi'\L de la
"' ~ ~ ~
~ -..: ~ '""' ~ ~ :.. ~ ;. r~ -.1
Los valores del intervalo forma que se detalla a continua\.;n:
de lo normal se pue,jen construir
I. El investigador localiza a un grupo de individuos que se con )idera que no estn enfermos. Estegrupo se conocecomo grupo derefrrencia.Estos indivi duos muchas veces son estudiantes de medicina, trabajadores de hospital u otros voluntarios fcilmente accesibles. En general, simplemente se supone que no estn enfermc s, aunque en algunas circunstancias pueden llevarse a cabo diversas pruebas y un seguimiento para garantizarlo.
:..
101
2.
El investigador
realiza la prueba de inters en todos los individuos
del gru :>ode ; ""' ~
referencia.
3. Seguidamente, representa grficamente la distribucin de los valores obte 1idos mediante la prueba aplicada a los individuos del grupo de referencia. 4. Luego calcula el intervalo de lo nonnal, que comprende 95% de los valore:; centrales de la poblacin de referencia. En sentido estricto, el intervalo de la normclidad inclu ye la media ms y menos las mediciones incluidas en dos desviaciones estnc.arde la media. Si no existe alguna razn para hacerlo de otra forma, el investigador gel\eralmente escoge la parte central del intervalo, de forma que 2,5% de los individuos ~;anos tengan mediciones mayores y 2,5% de los individuos sanos tengan mediciones n\eno. res de los valores del intervalo de la normalidad. Para ilustrar este mtodo, imagine que los investigadores mi( len la estatura de 100estudiantes varones de una facultad de medicina y encuentran v.lores semejantes a los que aparecen en la figura 15-1.Los investigadores escogeran a I:ontinuacin un intervalo de la normalidad que incluyera 95 de los 100estudiantes. Si no tu\;esen una razn para hacerlo de otro modo, utilizaran la parte central del intel\-alo, de forma que el intervalo de la normalidad de este grupo de referencia estaria com ~rendido entre 60 y i8 pulgadas [152 y 198cm]. Los individuos que quedaran fuera el intervalo no tendran necesariamente que tener ninguna enfermedad, simplemente po. dran ser individuos sanos excluidos del intervalo de la normalidad.
PRINOPIOS BSICOS
En primer lugar, "'eamos las implicadones de loS prindpios c el inter\,alo de lo normal y despus los errores que pueden resultar si no se comprenden estas implicaciones. ~
AGURA 15-1. Estaturas de 100 estudiantes de medicina varones, utilizadas para construir un intervalo de valores nom1ales
:::
~ z :. ~ ~ "" ~ ~ :~ o :.
::1
z :.
~ ;~
'oJ '-' ~ -o '...J
58
60
62
64
66
68
70
72
74
76
78
K)
102
95%centrai
--i
1. Por definicin, en cualquier prueba determinada aplicada a un grupo, 5% de los resultados se encontrarn fuera del intervalo de lo normal. Por esta razn, "anormal" y "enfermo" no son sinnimos. Cuantas ms pruebas se realicen, Irs individuos se encontrarn fuera del intervalo de la normalidad, por lo menos en uJ\a prueba. Uevando esta proposicin a su lmite, se puede concluir que una persona 'nonnal" es aquella que no ha sido investigada suficientemente. A pesar de lo absurdo :ie esta proposicin, destaca la importancia de comprender que la definicin del intervllo de la normalidad sita a propsito a 5% de los individuos que no estn enfermos fuer a de dicho intervalo. Por este motivo, el trmino ftlt'TaLte lmitesde lo non1ral debe ~ntendersecomo siloS no nnimo de enfermedad. 2. Los valores que se encuentran en el intervalo de la norma lidad no garantizan que los individuos no estn enfermos. La capacidad del intervalo :ie la normalidad de una prueba para discriminar entre los sanos y los enfermos vara de una prueba a otra. A menos que la prueba sea perfecta para descartar la enfermedad -y pocas pruebas lo son-, las mediciones de algunos individuos que tienen la enfermedad se encontrarn dentro de los lmites de la normalidad. . 3. Los cambiosinduidos en los lmites normales pueden ser P'"tolgicos. Dado que el intervalo de lo normal incluye un amplio intervalo de valores nun\ricos, las mediciones de un indi,,;duo pueden cambiar considerablemente y todava encontrarse dentro de los lmites de lit normalidad. Por ejemplo, el inter\'alo de la normalidad para la enzima heptica A5r vara de 8 a 20 U/"L,el del potasio srico puede ,'ariar entre 3,5 y 5,4 mEqI"L,y el del cido rico, desde 2,5 a 8,0 mg por 100ml. Es impoJ.tanteconsiderar no solo si los valores de un indi,,;duo se hallan dentro de los lmites nornales, sino tambin si han cambiado con el tiempo. 8 concepto del inter\'alo de lo nomliJ es ms til cuando no se dispone de datos anteriores para comparar pacientes individ~lales. Sin embargo, cuando se dispone de t.'Sos datos, se deben tener en cuenta. 4. El intervalo de lo normal se calcula empleando un grupo cc ncreto de pacientes o una poblacin de referencia considerados sanos. Por consiguiene, cuando se aplica un intervalo concreto a un individuo, se debe averiguar si ese inc i\;duo pr~senta alguna caracterstica que lo diferencia de la poblacin de referencia IJtilizada para construir ~I inter\.alo de la normalidad. fbr ejemplo, si para obtener el intt."r\'alo de la normalidad del hematcrito se utilizan hombres, este no puede aplicarse necesariamente a las mujeres, que en general tienen hematcritos ms bajos. 5. El intervalo de la nonn.1lidad no debe confundirse con el intervalo deseable. El inter\.alo de la normalidad es una mt.~ida emprica de cmo son la~. cosas en un grupo de individuos que se consideran sanos en ese momento. Es posibl que umplios sectores de la comunidad tengan resultados de las pruebas ms elevad,)s que los ideales y estn predispuestos it desarrollur una enfermedad en el futuro. 6. Los lmites superior e inferior del intervalo de lo normal F'ueden modificarse con fines diagnsticos. El intervalo incluye 95'70 los que no prest'ntan una enfermede dad o estado concreto. Sin embargo, no es necesario que haya el mismo nmero de individuos sanos con valores de una prueba por debajo y por enciml del intervalo de la nonn.1lidad. Existe cierto margen de criterio \.;entfico para determi,ar dnde deben situarse los lmites superior e inferior de dicho intervalo. La demarc3cin de los lmites depende del objetivo que persigan el investigador o el clnico al apiicar la prueba.1 Por
"' < ~
~ ::.. ~ ;~
El m,~1 del,nlerv..I" de I" n,1rrn..1 iij..d" d...iinir.i I.. e"pI.'Ciiio:id..d d..'I.. pru..-ba. E.'ite m\ el ,;e puede .ljust..r P" rorrnente p..r.. ..um..'nt.lr (" di"minuir) I" .."'pI.'Cifio:id..d. !\>r ..'Sta r..L.:'n. en la practica el intervalo d..,I" "..11 ..1 siempre ,;.: h.. ..IU"I..do o:u..ndo I.. ..',;po.'Ciiio:id..dno es de 95'70.
103
FIGURA15-2. Positivos falsos, A: individIlOs que no tienen la enfermedad, con valores por encima del intervalo de la normalidad. Negatj\'os falsos, B: individuos que tienen la enfermedad, con valores dentro del intervalo de la normalidad
-:: ~ ;.o ::J ~ ~

z ::J ~ -:: ~ Q ~ ::.. ).. o Q ::J 1'J'I ;.o
ejemplo, suponga que la mayora de los individuos con una enfennedad tient~nniveles cercanos al lmite superior del intervalo de lo nonnal en la prueba. Si el investi!;ador est dispuesto a reducir este limite, se puede pre\'er que un mayor nmero de il\dividuos que tienen la cnfennl-dad tendrn resultados por encima del intervalo de I nonnalidad. En este caso, el in\'estigador tambin paga el precio (o acepta el interclmbio) de colocar a una mayor proporcin de la pobl.1cil)nsana fuera del intervalo de I nonnalidad. A vecesmerece la pena pagar eseprecio, sobre todo cuando es important ~detectar el mavor nmero posible de individuos c()n1aenfennedad o cuando las pruci>asde seguimiento para clarificar la situacin son baratasy prcticas. La figura 15-2muestra este intercambio.
Al trasladar el intervalo de la normalidad hacia la izquierda, como en el intervalo de normalidad No.2, observe que el rea B se reduce respecto a la del intervalo No.1 y que el rea A aumenta. En otras palabras, una disminucin del nmero de negativos falsos conduce a un aumento de los positivos falsos y vice ersa. En esta situacin, la prueba identifica como fuera de lo normal a un mayor nmel o de personas con la enfermed.1d. Al mismo tiemp<.), clasifica fuera de los lmites n(lrmales a ms individuos sin la enfermedad; por lo tanto, en el intervalo de la normali(:ad No.2 estamos aceptando ms lecturas positivas falsas a cambio de menos negativas falsas. El nmero de positivos y negativos falsos que el mdico o el sistema sanitario est dispuesto a tolerar depende de consideraciones ticas, econmicas y poticas, as :omo del conocimiento mdico. Los siguientes ejemplos ilustran los errores que se puedt?n comeestos principios.
~
~ -:: Q ::J 1'J'I :.
o ~
ter al aplicar incorrectamente
104
I. En I (XX) exmenes de salud consecutivos de tipo preventivo se realizaron 12 pruebas de laboratorio (SMA-12) en cada paciente, aunque no se encontraron anormalidades en la historia mdica o en la exploracin fsica. El 5"10de las SMA-12 estaban
fuera del lmite de la nonnalidad; es decir, se obtuvo un total de 600 pruebas "anonnales". Los autores concluyeron que los resultados obtenidos jllstificaban la realizacin de las sMA-l2 en todoS los exmenes de salud rutinarios. Veamos el significado de estos resultadoS. Los alores del intervalo de la nonnalidad incluyen, por definicin, solo 95% de todos aql.ellos que se consideran exentos de la enfennedad. Si aplicamos esta prueba a 1 (XX)individuos sin la enfermedad, 5Co SO individuos tendrn un resultado fuera del inter ,alo de la normalidad. Si se aplicaran 12 pruebas a 1 (XX) individuos sin sntornas ni si~;nosde enfennedad, en promedio, los resultados de 5Co las 12 (XX)pruebas realiz.:das se encontrade ran fuera del intervalo de lo nonnal. E15Co 12 (XX) de pruebas es 600 I>ruebas.Por eso, aunque los 1 (XX) individuos no tuvieran ninguna enfennedad, se podJa prever que 600 pruebas daran resultados fuera del intervalo de la nonnalidad. Esto) reflejaran simplemente el mtodo de calcular el intervalo de la nonnalidad. Estos re)ultados no indican necesariamente la presencia de enfennedad y por s mismos no ju~,tifican el realizar mltiples pruebas de laboratorio en todos los exmenes de salud rutl\arios. Al considerar las implicaciones de loSresultados ( le las pruebas, es importante darse cuenta de que no todos los valores fuera del inter.. alo de lo nonnal tienen el mismo significado. Es mucho ms probable que los valores l>astantealejados del lmite sean causados por enfennedad que los valores cercanos a c icho lmite y asimismo, que los resultados cercanosa los lmites del intervalo se debar a la variabilidad de la prueba o a la variabilidad biolgica. Por ejemplo, si el lmite supt'rior del hematcrito en un hombre es 52, es ms probable que el valor 60 est asociado Con una enfermedad que el valor 53. 2. Se midi la concentracin de AST [aspartasa aminotransferasa) en lOO alcohlicos, para valorar su funcin heptica. En la mayora, loS resultado~;se encontraban dentro del intef\'alo de la nonnalidad. Los autores conclu~.eronque e hgado de estos alcohlicos funcionaba bien. Este ejemplo ilustra la diferencia entre el intervalo de la nonnalidad de las pruebas de laboratorio y el no t~ner la t.'nfennedad. El hec,o de que los resultados de las pruebas de laboratorio de es.ls personas estu..;eran der tro de los lmites d~ 1 nonnalid)d no I!Ssuficiente por s solo para establecer que su hig;do funciona perfectamente, dado que en cualquier prueba algunos resultados correspondientes a individuos enfennos se encontrarn dentro de los limites de 10nonnal. C uanto menor sea la c)pacidadde la prueba p)radiagnosticar la enfennedad, ms elevado ser el nmero de individuos enfennos cuyos resultados se encuentran dentro de loS jmites de lo normal. Puede que ciertas pruebas no pennitan distinguir ) las persona~ enfermas de I)s sanas. Es posible que en ambos grupos la mayor parte de los resulta,jos estn dentro del intervalo de la nonnalidad. Esto sucedi con los resulta.;osde la tI.5T. La incapacidad de 1) prueba para discernir entre enfennos y sanos indica que su ( apacidad de discriminacin diagnstica es baja y que no es til para el diagnstico. s1lbraya, as, la diferenciaentre encontrarsedentro del intef\'alo de la normalidad y no tenl r la enfennedad. Las figuras 15-3a 15-5muestran las tres posibles relaciones entre la poblacin sana y la poblacin enfenna, La figura 15-3ilustra una prueba que separa completamente a loS que tienen la enfennedad de los que no la tienerl. La discriminacin diagnstica de esta prueba es perfecta. La figura IS-l representa I~ situacin usual, de una prueba que separa parcialmente a los que tienen la enfenneda(1 de los que no la tienen. La figura 15-5 muestra el ejemplo de una prueba que no tien~ discriminacin diagnstica. En el caso de la AST, la situacin se parece mucho a la de la figura 15-5. A pesar de su utilidad en ~I diagnstico de muchas enfennedades heptcas, la medicin
~ ~ ~ .j :.J '"'
~ :.. ~ ~
105
;: ~
~ z ~ ~ " ~ ,... '-' ~ >o ~ 2 ;J1
, -
:
~ " -=:' 5 ;... \I) '"' ,...
~ u
106
de la concentractn de AST no es til para diagnosticar el efecto Cf1)nico alcohol en del el hgado. Por eso, a pesar de que se puede calcular el intervalo de la normalidad para cualquier prueba, este intervalo, por s solo, no indica si la prueba s ~rtil para el diagstico. Las medictones en los individuos con una enfermedad c )ncreta pueden ser idnticas a las de los que no la tienen y viceversa, lo cual indica qu,~la prueba no tiene utilidad diagnstica para esa enfermedad concreta. 3. Se calcul que el intervalo de la normalidad de la creatinin.1 srica en 1 (XX) estadounidenses asintomticos sin enfermedad renal conodda era de ),7 a 1,4mg/dl. Una mujer de 70 aos de edad ingres en el hospital con una concentracn de creatinina de 0,8 mg/dl y fue tratada con gentamictna. Cuando fue dada de alta, ese valor era de 1,3 mg/dl. Su mdico lleg a la conclusin de que, como la concentracn de creatinina se encontraba dentro de los lmites de la normalidad, tanto al ingreso CI >moal darla de alta, su paciente no tena una lesin renal secundaria al tratamiento con gentamicina. La presencia de un resultado dentro de los lrJutes de la normalidad no garantiza la ausencia de enfermedad. En cada individuo, la medida que indica que no est enfenno puede estar por encima o por debajo de la medida promedio de los dems individuos sin la enfermedad. En este ejemplo, la concentrlcin de creatinina de la paciente aument en 60'70 si bien todava se encontraba dentrc>.del , intervalo de la normalidad. Dicho cambio sugiere la presencia de un nuevo proceso patolgico. Es probable que la gentamicina le haya productdo una lesin renal. Cuanc Ose dispone de informacin pre\;a, es importante considerarla al evaluar el resultado je una prueba. Los cambios, aun dentro del intervalo de la normalidad, /"ledt'11 un si! ;no de enfermedad. ser 4. Se utiliz a un grupo de 100estudiantes de medicina para (alcular el intervalo de valores de la normalidad del recuento de granulocitos. Se esco!;i un intervalo de forma que incluyera 95 de los 100recuentos de !:,'Tanulocitos. lmites del intervalo de Los la normalidad calcul.1do fueron 2 000 y 5 OOJ. Cuando se pregunt a los autores sobre el recuento de 1 900 en un anciano de raza negra, llegaron a la coruiusin de que este se encontraba claramente fuera del intervalo de lo normal y que era Freciso realizar mjs estudios para identificar la causa de ese resultado. El intervalo dc la normalidad dcpt.'ndede la po:llal.in de referencia sin la enfermedad que se ha seleccionado;esta se define como el intervalo alrededor de un valor promedio que incluye 95% de los indi~;duos de una pobl3cin de referencia determinada. Sin embargo, la poblacin de referencia sin la enfermt'dad utilizada para G11cular inter\"lo de la nonnalidad puede tener medicionesdiferentes de las del grupo el de personas en las que queremos usar la prueba. Es improbable que haya muchos ancianos d~ I aza negra entre el grupo de estudiantes de medicina utilizados para construir el inter talo de la normalidad. De hecho, loS hombres de.raza negra tienen un intervalo de ylores del recuento de granulocitos distinto de los de raza blanca. Por este motivo, el int{ rvalo de lo normal calculado con los estudiantes de medicina puede no retlejar el inter talo de la normalidad aplicable a los ancianos de raza negra. El recuento de granulocilos de este hombre se encontraba probablemente dentro del intervalo de normalidad pra su raza, edad y sexo. Como se sabe que los ancianos de raza negra tienen su propio intervalo de la normalidad, este hecho se debe tener en cuenta cuando se interpreter los resultados de la prueba.
5. El intervalo de la nonnalidad de la concentracin de colestercl srico medida en 100 hombres estadounidenses de raza blanca de 30 a 60 aos de eda( oscil entre 200 y 300 m't!/dl. Ll concentraci{)n de colesterol de un estadounidense de raza blanca de -!5
~
?:
;:.. ~ ~
107
aoS de edad fue 280 mg/dl. Su mdico le dijo que no tena que preocuparsl! por el colestero1elevado, dado que su concenb"adn se hallaba dentro de loS lmite~ de lo normal. El intervalo de la normalidad se calcula utilizando los (latos recogidos en una poblacin de referencia que en ese momento se considera sana. Es posible que el grupo utilizado est formado por individuos cuyos resultados en la plueba sean ms elevados (o ms bajos) que los deseables.Un resultado dentro del lmitE' de la normalidad no garantiza que el individuo se mantendr sano. Es posible que los hombres estadounidenses, considerados en conjunto, tengan concentraciones de coll!sterol por encima de los niveles deseables. Si esto es cierto, el paciente con una concer tracin de colesterol de 280 mg/dl puede muy bien sufrir las consecuencias de la hipe.colesterolemia. Cuando existen datos basados en la investigacin que sugieren clan mente un intervalo deseablede valores para una prueba, es aceptable sustituir el intelvalo habitual por el intervalo de la normalidad deseable. Esto se est haciendo cada v~z ms con el colesterol srico. 6. En un estudio se demostr que 9O0/c los que tienen una tensin i ltraocular de mayor de 25 mmHg desarrollarn defectos visuales secundarios al glaucom,l en los 10 aos siguientes. E120%de los que tienen tensiones intraoculares de 20 mmH 9 desarrollarn cambios similares y 1% de los que tienen tensiones intraoculares de 15 mmHg desarrollarn trastornos. Los autores concluyeron que el rendimiento de la prueba se podra mejorar disminuyendo el limite superior de la normalidad de 25 a 15 mmHg, dado que as la prueba podra identificar prcticamente a todos los que se encontraran en riesgo de desarrollar defectos visuales (figura 15-6). Si el lmite superior de la normalidad es de 25 mmHg, c lsi todo el mundo que no desarrollarglaucomaestardentro de los lmites de la nonnalida d. aunque un nmero elevado de los que desarrollarn glaucoma tambin estar.in incluidos en los lmites de la nl")rrnalidad. Por otro lado, si el lmite de lo normal se sita en 15 mmHg, muy pocos individuos con glaucoma estarn dentro de los limites de la nor11alidad y un alto nmero de los que nunca tendrn glaucoma estarn fuera del intervalo de la normalidad.
La capacidad de una prueba para detectar la enfermedac se puede aumentar modificando los lmites del intervalo de la normalidad. Si los lmiles se amplan suficientemente, la prueba incluir prcticamente a todos los que padezcan la enfermedad. Lamentablemente, esta atractiva solucin tambin sita fuera del intef\.alo de la normalidad a un mayor nmero de individuos que no tienen ni tendrllla enfermedad. Al JUmentar los lmites superiores de lo normal. los investigadorcs-i,crementan la cap,lcidad de detectar enfermedades futuras, pero solo pagando el precio de seguir a muchos individuos que no tendrjn la enfermedad. Al determinar dnde situar los lmites superiores, se pueden considerar los factores que se emlmeran a continuacin.
=.: "( ~ :) ~
I. La prdida de visin por el glaucoma es irreversible en gran parte y I'uede desarrollarse antes de que el paciente se d cuenta. 2. El tratamiento suele ser seguro, pero solo parcialmente efectivo para prevenir la prdida progresiva de la visin. 3. El seguimiento es seguro y acarrca un ricsgo bajo, pero el seguimicl'to de un nmero elevado de individuos requiere mucho tiempo y cs costoso, ya que e:;igc realizar mltiples exmencs rcpetidos liurante largos pcrodos de tiempo. AdeITs, el seguimiento produce ansiedad cn los pacientes.
a
FIGURA15-6. Posible distribuciOn de la tensiOn intraocular de los sujetos Ion y sin glaucoma SIn enfermecad la
Presin intraocular (mmHg)
LoS factores que hay que SopeSarno son tod(IS mdicoS. Otras consideraciones sociales,psicolgicas,econmicaso polticas se puedE tomar en cuenta n para establecer la lnea de demarcacin. Es posible que no exista lna respuesta correcta. La nica salida para esta situacin insoluble es que se invente lna prueba mejor, en la cual se superponga menos a loSque desarrollarn la enfermedd ya loSque no10 harn. El concepto del intervalo de lo normal es un inte ,m para tratar con la variabilidad que existe entre las personas. La comprensin de la ltilidad y las limitaones de este concepto es de capital importana para comprende'las pruebas diagnsticas. El inten'alo de la nonTIalidaddefine los valores numricos erlCOntrados 95'70 en de los sujetos considerados sanos de un grupo concreto de referen:ia. Este inten.alo puede no retlejar el nivel deseable y no tiene en cuenta los cambio~ que se producen respecto de los resultados de pruebas anteriores. El intervalo de la normalidad perseno nos dice J\adasobre la utilidad diagnstica de la prueba. Cada prueba tiene un intenralo de la nonnalidad que puede o no .1~"Udar discernir t?ntre los indi\'iduos que tienen la enfermedad y los que no la .1 tienen. rara determinar la utilidad de una prueba en el diagnstico d,~una enfermedad es necesario t?x.1minar resultados de la prueba en un grupo de irdi\;duos con una los determinada enfermedad y comparar estos valores con el intervalo d.~la normalidad de un grupo sin la enfermed.1d, como har.e.mos.en .e1c.'\ptulo1Z -A..nte~ que podamos de hacerlo, es prL'cisoque examinemos cmo se puede definir a los indi viduos que tienen la enfermedad.
~ < ~ z :j :..I ~ o ..J ~ ~ :. ... ?; -J :..I
109
CAPTULO 16 4-'.
DEFINICIN
DE ENFERMEDAD:
LA PRUEBA DE ORO
Cuando se aplica cualquier prueba diagnstica, ya sea a p ~rsonas que padecen una enfermedad o a las que no la padecen, los resultados represe ~tan un recorrido de valores. En los enfermos, la variabilidad de los resultados puede reflejar diferencias en la gravedad de la enfermedad o una respuesta individual a la msma. A pesar de esta variabilidad, es esencial definir un grupo de pacientes que, sin lugar a dudas, padecen la enfermedad.
LA PRUEBA
DE ORO
't: :c '.J :J ~ 't:

z :J ~ 't: ~ ~ ~ >:) a :J ;... 'J1 '.J z :J ~ 't: a :J ... t/) '.J ,.., -'
~ u
La prueba o criterio utilizado para definir in~uvocame 1te una enfermedad se conoce como pruebllde orol (goldsta,tdard). La prueba de oro pl ede ser una biopsia, un angiograma, una necropsia posterior o cualquier otra prueba reconocida. El uso de un criterio de oro con el fin de identificar definitivamente a los qu~ tienen la enfermedad es un requisito para examinar la utilidad diagnstica de cualquier prueba nueva 0 no evaluada. En otras palabras, la utilidad de la nueva prueba se ba~a en su comparacin con la de oro. De este modo, una prueba nueva se compara con ~ prueba (o pruebas) antigua y ms aceptada para determinar si la nueva ofrece el mismo)rendimiento que la de referencia. Observe que se parte del supuesto de que, utilizando la mejor de las pruebas antiguas, es posible tener un 100%de posibilidades de reatizar un diagnstico correcto; la suposicin de partida es la imposibilidad de "inventar llna mejor h-ampapara ratones", dado que no se put.-de superar el 100'70 .Puede ex.istiruna trampa para ratones ms barata o ms pr(tica pero, por definicin, ninguna con la que se atrapen ms ratones. Puede parecer equvoco ilfirmilr que la nicil forma d~ e\'aluar la capacidad diagnstica de una prueba nueva es suponer que ya es posible realiz )r diagnsticos perfectos. Lamentablemente, esa es la posicin en que nos encontr;lmos al evaluar una prueba nueva. Solo podemos preguntamos si la prueba est a la a tura de la mejor de las pruebas antiguas, esto es. la prueba de oro. A pesar de la limitJcin intrinseca de nuestra cJpacidad p ira evaluar inicialmente una prueba nuevJ, el tiempo y las aplicaciones repetidas estn jellado de la mejor trampa para ratones. Una vez que se aplica a la prctica clnica, puede hacerse evidente que, en realidad, la prueba nueva predice mejor el curso cinio) subsiguiente que la de referencia. Incluso es posible que con el tiempo la prueba nleva sea aceptada como prueba de oro. No obstante, el problema que surge con frecu,~nciaes que, si bien se puede realizar el diagnstico definitivo, la prueba acarrea un rit'sgo excesivo o se realiza demasiado tarde para rendir sus mximos beneficios cinico~.Es decir, existe una prueba de oro adecuadaque no es prctica en el sentido clnico. I:n estos CJSOS. til comprobar que la prueba nueva est a la altura de la de oro. Debt! entenes derse, repetimos, que el objetivo de evaluar una prueba se limita a compararl3 con la mejor prueba disponible. Por esta razn, es preciso estar seguro de que se e~t utili-
iI
'!; c
110
." de) E $., traducir.\ como pru".'a de orl'. cnlerio de oro. y prueba o criterio de ret,,'r,,'n.:I.1. ""glin t!1.::>ntexto.
-f f
zandola mejor prueba de oro disponible. Examinemos, a modo de ejeJnplo,lo que puede suceder cuando la prueba de oro utilizada no es la ms adecuada. Se practic la autopsia a 100individuos que fueron ingresados en un hospital con "ondas Q diagnsticas" en su electrocardiograma (ECG) y que fallecieron en la hora siguiente al ingreso, con objeto de determinar si hab:an sufrido infarto de miocardio (IM). La necropsia, que se utiliz como criterio de oro d ~IIM, revel pruebas de IM en solo 10sujetos. Los autores concluyeron que el ECG no ~raun mtodo til para realizar el diagnstico de IM e insistieron en aceptar el diagns tico anatomopa tolgico como la prueba de oro. La utilidad de todas las pruebas diagnsticas se determina comparndolas con pruebas de referencia cuya aptitud para medir las Clractersticasestudiadas ya se ha establecido con la prctica. Los diagnsticos por ne:ropsia se utilizan frecuentemente como criterio de oro contra el cual se juzgan las otra:; pruebas. Sin embargo, la necropsiano siempre constituye una fom1aideal de medir la ,?nfennedad,como muestra este ejemplo, dado que a \'ecesdebe pasar bastante tiempo a ntes de que se manifiesten los signos patolgicos del IM. Es posible que las ondas Q ciagnsticas de un ECG reflejen mejor el IM que los cambios patolgicos observables en una necropsia. El investigador debe cerciorarse de que el criterio de oro utilizado ha si(io realmente establecido como la mejor referencia posible, antes de usarlo como base :Jecomparacin. Por desgracia,incluso las mejores pruebas de refl 'rencia disponibles muchas \-ecesno distinguen inl'qu\ucamente a los enfennos de los sa1OS. Puedeque los casosde enfennedadesle\~ o en sus fasesiniciales no satisfaganlos cr terios de la prueba de oro. A menudo, los in\~tigadores L'Stn tentados de incluir soiameltea aquellos indi..1duosque presentan pruebas daras de la enfennedad, tal como se m den con la prueba de referencia.A pesarde la certezaintelectualque parecepropon:ionar, esto puede redundar en una in\"e5tigadnque se limita a los irK:iivlduosque tienen una t?nfennedad grave o en fase muy avanzada. Este peligro se ilustra con el siguiente ejemplo. Un in\-estigadorcompar la capacidadde la citolo:9a dela orina p.lra diagnosticr el cncer de \.ejiga urinaria con [a del diagnstico inequvoco por biopsia de casosde cncer invasor de vejiga que cumplan los criterios diagn )ticos de la prueba de oro. ~lediante el examen citl1!l).gico identific a 950/.de las pe "Sonasque tenan se cncer. Sin embargo, cuando se aplic en la prctica clnica, la citol Jga de orina solo detect 10%de los casos. Al considerar solo los casosavanzados de cnce .invasor de vejiga urinaria, los in\.estigadores haban eliminado los casosdudosos o en ~tapasinidales de la enfennedad. Por [o tanto, no debe sorprender que, al aplicar la prueba en la prctica clnica, su rendimiento no fuera tan bueno como el obtenido cuand:J se compar con una prueba de oro definitiva. I\>r muy tentador l1ue sea estudiar tan solo a I.)s individuos con enfennedades claramente definidas, es engaoso sacar conclusione) sobre la utilidad de una prueba que se ha aplicado exclusivamente a individuos con una enfennedad avanzada o grave. Cuando se valora la discriminacin diagnstica <le una prueba, es importante preguntarse si se utiliz el mejor criterio de referencia para definir a las personas con la enfermedad. Tambin es importante preguntarse si COI los enfermos es1 tudiados se abarc todo e[ espectro de la enfermedad. Debemos reccnocer que a veces es imposible lograr ambos objetivos simultneamente. Aunque se L"Umplan estas condiciones, es preciso apreciar que el propsito de probar una prul'ba se limita a detenninar si [a prueba estu.:iiadaes tan buena como la prueba de referenci.l establecida. Los mtodos empleados no :ontemplan la posibilidad de Que la prueba nueva sea mejor que la de oro.
,.J ~
~ ~ --;
~ -
~ 3 ~ ~ ~ ~ ~ ~
111
~
, CAPiTlJLO , 17. ,~
-."
DISCRIMINAON
DIAGNSTICA
DE LAS PRlEBAS
Hoy da es posible medir la capacidad de una prueba para discriminar entre los enfennos y los sanos. Al hacer esa valoracin, es importante co lsiderar los tres puntos siguientes: 1. Variabilidad de la prueba: medicin de la reproducibilidad del resulta:io de la prueba. El intervalo de variabilidad debe ser relativamente menor que el intervalo de la nonnalidad. Variabilidad de la poblacin sana: detenninacin de los valores del inte :valo de la nonnalidad para la prueba. Definicin de la prueba de oro: identificacin de los grupos de incividuos que definitivamente tienen la enfennedad y de los que no la tienen segn la prueba de oro. y ESPEOFICillAD
2. 3.
SENSIBIlillAD
" ~ ~ ~ -<: ~ ~
" ~ '"' '-' ~ ~ >'"' '-' 5:
~ ;.r, ~
... ':J '::) ~ .,... .'-'
~ ~ ~ -'
Las medidas tradicionales del valor diagnstico de una pru ebason la sensibilidad la especificiLfad. y Estas miden la discriminacin diagnstica de la prueba comparada con la del criterio de referenL;a, que, por definicin, tiene una sensbilidad y una espedficidad de lOO'7c sensibilidad y la espedfiddad se han selecdonaco como .La medidas, porque son caractersticasintrnsecas de una prueba que deben ser id,~nticas, }"a sea que se aplique a un grupo de pacientes en los cuales la enfermedad es .ara 0 a un grupo de pacientes en loSque es frecuente.1 Por esta razn, proporcionan nledidas de la discriminadn diagnstica de una prueba, que deben ser las mismas seacu 11fuere la probabilidad de enfermedad antes de realizar la prueba. La estabilidad de la ~ensibilidad y la especificidad pcrmite a los in\-estigadores Los ngeles, Parso Tokio aplicar de la misma prueba diagnstica y esperar resultados similares a pesar de las diferencias importantes que existen entre las poblaciones. Estas medidas tambin permit('n a los in\'estigadores ya los clnicos comparar directamente el rendimiento de una prul~bacon el de otras. L1 sensibilidad mide la proporcin de los individuos con I, enfermedad que son identificados correctamente por la prueba. En otras palabras, mide lo sensible que es la prueba para detectar la enfennedad. Puede ser til recordar I, Sensibilidad como posititu l'1llos l'1lfrrm(JS (PEE). L1 especificidad mide la proporcin de los individuos sanos que son correctamente identificados como tales por la prueba L1 espedficidad se puede recordar como nt',\'atittlt'11 sanos(NES). /os Observe que la sensibilidad y la especificidad solamente incican la proporcin o porcentaje de los que han sido correctamente dasificados como sanos o como enfermos. Estas medidas no predicen el nmero real de individuos que sel n clasificados correctamente, cifra que depender de la frecuencia de la enfermeda,i en el grupo al que se aplique la prueba.
~ t
-:? .
E, p"sible que esto nI) ,;~a t!strictam~ntl'l"l~rto. 12
';lla proporcilin
de l'nfl'rmos
~n l'Stadi,1S iniciales de la, 'nfermt!y e,pt.'Cifi.: dad dis-
dad cambia juntu .:un la irecu~ncia de la l'nterml'dad. L;n.. pru~ba pUl'dt! tt!nt!r st!nsibiildad tintas para una taSO! int..;al de la ~n{t!rmedad y par,\ una avanzada.
La sensibilidad y la especificidad son medidas tiles, porque permiten a los lectores ya los investigadores obtener los mismos resultados cuando evalan una prueba en grupos de pacientesque difieren en la frecuenciI de la enfermedad. Sin embargo, los valores numricos pueden ser diferentes segn ( ue se obtengan de un grupo de pacientes en los estadios iniciales de la enfermedad o ce otros en estadios avanzados. Primero mostraremos la forma de calcular la sensibilidad y la especificidad y luego sus implicaciones y limitaciones. Para calcular a sensibilidad y la espedficidad de una prueba en comparacincon la de oro, se siguen I<IS siguientes pasos: 1. Los investigadores seleccionan una prueba de oro que se usar para identificar los individuos enfermos. 2. Seguidamente, escogen a un grupo de pacientes que segr, el criterio de referencia padecen la enfermedad ya otro gru po de individ uos que segn el mismo criterio estn sanos. Al aplicar este criterio, es importante saber si los investil;adores incluyeron a grupos representativos de individuos con y sin la enfermedad. En )tras palabras, representan los individuos seleccionadosel espectro completo de los <Iuetienen la enfermedad y de los que no la tienen o representan nicamente los dos e (tremos del espectro? Una prctica habitual en la seleccin de estos individuos es la de escoger tantos sujetos sanos como enfermos, definidos segn el criterio de refereJ\cia. Sin embargo, esta divisin a medias no es necesaria.2 3. Los investigadores deben usar la prueba investigada para clasificar a todos los individuos como positivos o negativos. PJra las pruebas cuyos resul :ados se presentan en valores numricos, es preciso disponer de un intervalo de la nonnalidad. Por ejemplo, si la mayora de los individuos con la enfermedad presentan valc res por encima del intervalo de la normalidad, loSinvestigadores usan el lmite superioJ'del intervalo de la nonnalidad como lmite de demarcacin. A continuacin, aplican la nue\'a prueba a todos los indi\iduos y los clasifican como positivos o negativos. 4. Los in\'e5tigadores}'a han clasificadoa cada paciente como SinO o enfermo, de acuerdocon la prueb..lde oro, y C()mopositim o negati\'O,segn el resltltadOde la prueba. Ahora, y-apueden calcular el nmero de indi\iduos en loSque la pruet~ estudiada y la de oro concuerdan y en loSque discrepan, y p~nt:ar los resultadosde la siguiente manera:
PRL:EBA EN E~iL:DIO
..I: ~ ~ 'I) :5 ~ ~
~
rRll::BA DE ORO E:\FER.\IOS
PRUEBA ORO DE SA;\.:a; b = Nmero de individuos sanos y posii\'Os
Positivos
'.I) .,...
d = Nmero de indi..;duos
Negtivos
~ z
;:; " ~ - -:c
sanos y negc tivos
a + c = Total de individuos enfermos
b + d = Total de individuos sanos
f
l.I di\.i,;in d ml.di.., pr"p"rcit'nd ,,1mo1~..'r p,ld"r ",;tdd,;tico po1ro1 to1mo1" un muestrai deterrnjnado. Sin emba~". Jifil'lm"nt" v"r"m,"; dplico1r pru"bo1'; ",;nificdl;n estadisticlparlval"rar pru ~s diagnsticls.ddd" de 'lue ello1md" d" Id mul'slr.. ;"n"rdlm"nte "S pequ"ri" y, p',r l',;a rdZ"n. el puder estad~tico suele ser bai"
113
5.
Finahnente,
los investigadores
aplican las definiciones
de sensibilidad
y :le es-
pecificidad,
y calculan directamente
sus valores.
Sensibilidad = ~
Proporcin de individuos con la enfermedad = segn la prueba de oro e identificados como positivos por la prueba en estudio.
Especificidad
Proporcin de individuos sanos segn la prueba d = de oro e identificados como negativos b + d por la prueba en estudio.
Para ilustrar este mtodo numricamente, imaginemos que se aplica una nueva prueba a 500 individuos que tienen la enfem1edad de acuerdo con el c;terio de referencia ya 500 individuos que estn sanos segn el mismo criterio. Pocemos construir la tabla de 2 x 2 como sigue:
PRUEBA EN ESfU DIO
PRUEBA DE ORO EI"JFER.\1OS
PRUEBA DE ORO SANOS
Positivos
~egativos
;?:
--'
't z :J ::.: 't ~ ~ ::.: ~
Vamos a suponer que con la nueva prueba 400 de los 500 individuos con la enfermedad son identificados como positivos y que 450 de los 500 individuos sanos son identificados como negativos. Ya estamos en condiciones de rellt nar la tabla de 2 x 2:
PRUEBA E)I; ESTUDIO
PRUEBA DE ORO ENFER.\IOS
PRUEBA DE ORO SANOS
Positivos
?; :3 :( ~ ~
Negativos
Ahora se pueden calcular la sensibilidad
y la especifidad.
~ '""'
Una sensibilidad de 80% y una especifidad dt ' ~% desaiben una prueba diagnstica que, aunque no esIdeal, tiene la misma calida(1que muchas pruebas que se usan en la medina cnica para diagnosticar enfermed, Ides. Observe que la prueba se ha aplicado a un grt po de padentes, de los cuales 500 tienen la enfermedad y 500 estn sanos, segn el criterio de referenda. Esta divisin a medias entre sanos y enfermos es la que se emplt'a habitualmente al realizar estudios de este tipo. Sin embargo, la sensibilidad y la espedfiddad habrian sido las mismas independientemente del nmero de paentes enf.!rmos y sanos escogidos. Una forma de convencersede la autenticidad de este importinte prinpio es observar cmo se calculan la sensibilidad y la espedfiddad, esto es,
Observe que a y c -que son necesarios para calcular la sensibilid d- se e;1cuentran en la columna de la izquierda de la tabla. De la misma manera, b y d -que son necesarios para calcular la espedficidad- se encuentran en la columnc de la derecha de la tabla. De esta fonI1a, el nmero total de indi\'duos en cada columI,a no es importante realmente, dado que la sensibilidad y la especificidad se relacionarl, respectivamente, solo con la divisin de loS pacientes que se encuentran en una simI'le columna. Una vez que se han calculado la sensibilidad y la especificidad, es posible volver atrs y completar la tabla cuando se trabaja con distirltos nmeros de individuos enfenI1os y de sanos definidos segn la prueba de oro. E;ta vez vamos a suponer que hay 900 individuos sanos y 100enfenI1os. En otras pala 'ras, nos encontramos en una $ituacin en la cua110<:'o los indi\iduos a los que se apica la prueba tienen de la enfenI1edad. Por 10tanto, el individuo promedio nene una protabilidad de 10(7c de padecer la enfenI1edad antes de que se realice la prueba.
PRUEBA E':.;~ILDIO
PRUEBA DE ORO tI\fER.\IOS
PRUEBA DE ORO SAlI;CtS
'.r.
Positivos
~
'.1) ~ -
Negativos
c
100
d 900
~ ~ '.r. .,... ~
Apliquemos ahora las medidas de la sensibilidad y la especificidad, tal y como hemos hecho previamente. La sensibilidad es igual a 80%; por lo tanto, 80"!0de los que tienen la enfennedad sern correctamente identificados como positivos (80% de 100 = 80), y 20% de los que tienen la enfennedad sern incorrectamente iden~icados como negativos (20% de 100 = 20). La especificidad es igual a 90%; por consiguieJ\te, 90% de los que no tienen la enfennedad sern correctamente identificados como negativos (90% de 900 = 810), y 10'10 los que no tienen la enfennedad sern incorrectamente identifide cados como positivos (10'10 900 = 90). de
~ "2; ~ ~ ~ "2; ~ ~ '..J 9
115
Ahora podemos construir
la siguiente tabla de 2 x 2
PREVALENCIA
DE 10% PRUEBA DE ORO SAX..;OS
PRUEBA EN ESruDIO
Positivos
PRUEBA DE ORO ENFERr.IOS
80
90 positivos
falsos
Negativos
20 negativos falsos
100
810
900
En esta situacin, 10%de los pacientes estudiados tienen a enfermedad, segn la prueba de oro; por lo tanto, podemos afinnar que, en este grupo de pacientes, la verdadera probabilidad de tener la enfermedad es de 10%. Comparemos esta tabla con la que construirnos al calcular por primera vez la sensibilidad y la especificidad. En realidad, utilizamos un grupo dE pacientes cuya probabilidad de tener la enfermedad era de 50%, dado que trabajbaJnoscon 500 individuos enfermos y 500 sanos.
PREVALENCIA DE 50% PRUEBA E.~ ESfUDIO PRUEBA DE ORO ENFER.\IOS PRUEBA DE ORO 5A;\:OS
Positivos
.JOO
50
positivos
falsos
\egativos
100 negativos
falsos
450
~ ~ ~ '::j ~ ~ ~ ...
500
500
2
::J z ~ ~ ~
: "' '-J ... < ~
Observe que con nuestra divisin inidal a medias (esto es, con una prevalencia de 50l!o)se identificaron errneamente 100individuos como negativos y 50 como positivos. Sin embargo, en el grupo de pacientes en los que la prevalen:ia de la enfermedad era de 10%, se identificaron incorrectamente 20 individuos como n.~ativos y 90, tambin errneamente, como positivos. El cambio en las cifras se deb.~nicamente a la diferencia de la frecuencia relativa de la enfermedad o prevalencia erllos dos grupos de pa~ientesestudiados (50'70 L\T..;/IS ). Observe que en el ejemplo e 1que se 10(70 utiliz una prevalencia de 10'70 haba realmente ms positivos que estaban sanos (90) que positivos enfermos (80). Esto puede sorprender, habida cuenta de que la sensibili:lad y la especificidad son relativamente altas. Sin embargo, ilustra un principio que Ilebe conocerse para aplicar los conceptos de sensibilidad y especificidad. A pesar d~ que la sensibilidad y la especificidad no estn influidas directamente por la frecuencia relativa o prevalencia de la enfermedad, el nmero real de individuos que se identific3n errneamente como positivos o como negativos depende de la frecuencia relativa de la enfermedad. Ahora analizaremos una situaciOOms extrema, en la cual solo 1% de los integrantes del grupo estudiado tienen la enfermedad. Esta situacin es la que
aparece tpicamente cuando se realiza el tamizaje de un grupo de .ndividuos que estn expuestos a factores de riesgo de unaenfennedad comn, pero Ilue no tienen signos clnicos. La tabla correspondiente podra parecerse a la siguiente:
PREVALENCIA DE 1'70 PRUEBA DE ORO 5A1'i05 I
99 positi\ 'OS falsos
PRUEBA EN ESruDIO
PRUEBA DE ORO ENFER.'-1OS
Positivos
Negativos
~I}
10
9<:0
En esta situacin hemos utilizado de nuevo la misma prueba que tiene una sensibilidad de 80% y una espedficidad de ~0/c .Esta vez encontramos 8 positivos verdaderos y 99 positivos falsos o, dicho de otra forma, 12 positivos falsos por cada positivo verdadero. Por esta razn, la sensibilidad y la especificidad por s solas no proporcionan indicacin suficiente de la utilidad de un resultado para el diagnstico de una enfermedad en un individuo concreto. Como clnicos y usu arios de una prueba diagnstica, necesitamossaberalgo msque la sensibilidad y la es:>el ificidad dela prueba. Hemos de ser capacesde formular preguntas clnicas tales como Clll es la probabilidad de que haya enfermedad si el resultado de la prueba es positivo?; :cul es la probabilidad de que no haya enfermedad si el resultado es negati\'0? Antes de que podamos responder a estas preguntas, hemos de preguntamos cul es la pr,)babilidad de que el paciente tenga la enfermedad antes de realizar la prueba ? Esta I"' Jbabilidad Illlterior a la pntt'm, junto con la sensibilidad ~.Ia \c'Specificidad,nos permite calcular la medida denorninada lulor prt'dictil~ deIIi lIrUt'/,I.
VALOR PREDICfIVO DE LAS PRUEBAS POSmvAS y NEGATIVAS

Como hemos comentado anteriormente, la Frincipal "'entaja que ofrecen la sensibilidad y la especificidad en la valoracin de una Frueba es que no dependen directamente de la prevalencia o de la probabilidad de la t'nfermedad anterior a la prueba. Esta ventaja es especialmente til para los artculos de la literahlra mdica. Sin embargo, tambin tienen limita\.-jonespara responder a dos prt'guntas importantes desde el punto de vista cnico: si la prueba es positiva, cul es la probabilidad de que el individuo tenga la enfermedad?; si la prueba es negativa, cul t'S la probabilidad de que no la padezca? Estas preguntas tienen una importancia prcti.:a para loSclnicos. Las medidas que responden a estos interrogantes se conocen como
ttl/or predictit~.
~ ~ ~ '.II ~ ...
~
'JI """ z r. ... ~ ;::
~ c i ~ ~ u '.1'. 3.
Proporcin de loS individuos con Valor predictivo de una prueba positiva = una prueba posi iva que tienen la enfermedad. Proporcin de 105individuos con Valor predictivo de una prueba negativa = una prueba negativa que no tienen la enfermedad.
117
Los trminos pr~lencia y mlor predictiooaparecen en lo~ artcuk)S j de in~stiga~n.en relad~n con grupos de indivi?~os. Por fortuna, en la ~rct ica~ se utilIZan tenrunos equivalentes, aunque el mdico trata a un solo paaent(' a la ~ Desde la perspectiva de la actividad clnica, la preculencia una enfermed.d ccresde ponde a la mejor estimadn de la probabilidad de enfermedad antes de realizar a Prueba. En trminos clnicos, la prevalenda se conoce como probabilidad anteriora la ~. El rulor predictioosignifica lo mismo que la probabilidad de que la enfermedad est ~ sente (o ausente) despus de obtener los resultados de la prueba. Por esta razn, los valores predictivos pueden considerarse clnica mente como la probabilidad )teriorQla po .tmleba. los trminos pr~lencia y rulor predictioole parecen confusas, puede sustituirSi loS por los de probabilidad la t'11frrmedad de antes y despus de realizar la prueb.l. Como orientadn prctica y sendlla para interpretar los, 'alaresde esas medidas, puede ser til usar las siguientes aproxirnadones de las prob2 bilidades anteriores a la prueba: 1% = La probabilidad anterior a la prueba de los que estn expuestos a factores de riesgo de una enfernledad COl:I\n, pero asintomticos. 10% = La probabilidad anterior a la prueba cuando la enfernledad es improb, ble, pero clnicamente posible y el clnico desea descartarla. 50% = La probabilidad anterior a la prueba cuando la incertidumbre es con~.iderable, pero la presentacin clnica es compatible con la enfernledad. 90% = La probabilidad anterior a la prueba cuando la enfermedad es muy probable clnicamente, pero el clnico desea confirmarla por medio de un 1 prueba diagnstica.
Mediante las tablas de 2 x 2 mostraremoS cmo se calcua el valor predictivo. Recuerde que lo hacemos para una determinada prevalencia 0 pro!)abilidad anterior a la prueba.
~ ::.: ~ ~ z ~ ::.: ~ ~ :J ::.: ~ >-c 2 'J\ "J :2: :J ~ "C Q :J ... "1 "J '"' '-' ~ .a u
PRUEBA E!\; ESTUDIO PRUEBA DE ORO
PRUEBA DE ORO SA:-.;OS
E;\;FER.\IOS
--,
a = Nmero
Positivos
de individuos y positivos
b = Nmero
de individuo.
enfermos
sanos y positivos
c = Nmero
de individuos y negati\'OS
d = Nmero
de individuO5
"egativos
enfennos
sanos y negativos
a + b = Total de positivos
c + d = Total de negativo~
de las pruebas negativas y positi,
,. ~
Para calcular el valor predictivo

vas se emplean las siguientes formulas.
Valor predictivo de una prueba positiva
a a+b
Proporcin de individuos con una prueba = positiva que realmente tienen la enfermed.ld ( med ida con la prueba de oro) .
I ~
Valor predictivo de d Proporcin de individuos con un resultad(. una prueba negativa = C+d = negativo que realmente no tienen la enfernledad (medida con la prueba de oro).
Ahora, calculemos estos valores empezand, ) con probabilidades anteriores a la prueba de 90%,50%,'10% y 1%. Recuerde que el n mero de positivos y de negativos ser diferente para cada prevalencia de la enfermedld.
PROBABIUDAD ANTERIOR DE 90% PRUEBA EN ESTUDIO PRUEBA DE ORO ENFERr-.10S PRUEBA DE ORO 5N lOS
Positivos
Negativos
Empleando el mismo mtodo, los otros valofl's predictivos son:

Probabilidad V
a
anterior a la prueba de 50%

b
..a
a poSItIva: b : -: :
I
or pre
d ..
ICtlVO
d
e una prue
4))
889 , %
a +
4JV
VI a
or prealctlvo
,..
d e una prue b a negatIva .d
.~
= c + d : =::J,O
450
88 I,
Probabilidad Valor predictivo
anterior a la prueba de 10% positiva = a = T~ = 47,1%
de una prueba
~ ~ :5 r:5 ~ !,/) "'"' ... z "" s ~ z "'"' ... o ~ z ~ ~ u !,/) '5
a + b
Valor predictivo de una prueba negativa
d = c + d
810
--= 830
976% ,
Parauna prueba con una sensibilidad de 80% y una especificidad de 90%, los da tos pueden resumirse de la siguiente forma:
119
Probabilidad anterior ala prueba Valor predictivo de una prueba positiva Valor predictivo de una prueba negativ-a
1% 7;5% 99,8%
10% 47;1% 97,6%
50% 88,9% 8!,8% 98,6.. 33,3~ ~,
-I: 5 ~ "' ~ ~ ~ -I: ~ :) ~ ::00 >::J Q 2 .I\ '""' ~

~ -I: ~ 2 'J1 'oJ ,.., '-' ~ "::I ',.;
120
Los clculos de los valores predictivos tienen importantes implicaciones clnicas. Indican que la probabilidad de que la enfem1edad est preser te o ausente despus de obtener los resultados de una prueba depende de la mejor esti madn posible de la probabilidad de la enfem1edad antes de realizar la prueba. Cuand< , la probabilidad de una enfem1edad es moderadamente alta antes de realizar la pruE ba, por ejemplo de 50%, incluso una prueba negativa, como en el ejemplo utilizado, co1duce a una probabilidad de que la enfem1edad est presente de 18,2% (100%-81,8% ). <:uando la probabilidad de la enfem1edad es relativamente baja antes de realizar la pruE ba, por ejemplo, 10%, incluso una prueba positiva conduce a una probabilidad de que II enfermedad no est presente de 52,9% (100%-47,1%). La situacin empeora cuando la prueba se emplea como instrumento de tamizaje. Por ejemplo, podramos aplicar la prueba a un grupo de indvidu05 expuestos a un factor de riesgo cuya probabilidad de tener la enfermedad acti\ a es de l'7c. Nuestro ejemplo de 1% de prevalencia o probabilidad anterior.a la prueba lOS ensea que cuando se aplica la prueba que tiene una sensibilidad de 80~ y una e>peaiicidad de 90'70 este grupo de indi\-iduos, los que dan resultados positivos tienen una a probabilidad de enfermedad de 7;5%. Esto es lo que significa un v-alorpredicti\"O tie ;:5% de una prueba positiva. Si no se entiende el efecto de la probabilidad anterior a la prueba sobre el valor predictivo, se puede cometer el error que describimos a continuat:in. Se evalu una prueba nueva y barata para diagnosticar el cncer de pulmn aplicndola a un grupo de 100individuos con cncer de pulmn ya 100sin la enfem1edad. El valor predictivo de la prueba positiva fue de 85q; es decir. q11e85% de los que tuvieron pruebas positivas padecan cncer de pulmn. Los autores ..onduyeron que la prueba era adecuada para ~l tamiza je de esecncer en la poblacin 9 ~nera1, dado que 85% de los que tuvieran resultados positivos padeceran cjncer de pulmcn. El valor predictivo de una prueba positiva es el porcentaje ,.ie personas con un resultado positivo que tienen la enfem1edad. Esc ...alor predict vo jepende de la prevalenCiade la enfem1edad en el grupo de indi..iduos a los que ~e ha~-a aplicado la prueba. A menudo una prueba se evala aplicndola a un grupo de indi~iduos de los que se sabe que la mitad tienen la enfem1edad. En este ejemplo, la :Jrueba se aplic a un grupo en el cual 50% de los individuos padedan la enfermedad (100 con cncer de pulmn y 100sin cncer). As, la prevalencia o probabilidad anterior d,~la enfem1edad en este grupo era de 50% .Cuanto menor sea la probabilidad anteric r de la prueba, menor ser el valor predictivo de una prueba positiva. En ia comunidad. la prevalencia de cncer de pulmn es ;nucho menor de SQ'7c, incluso entre los fumadores. fbr lo tanto, el ,,-alorpredicti\"Ode una ;n1eba positiva en un individuo promedio de la comunidad -aunque est expuesto a los factores de riesgo de cncer de pulmn- ser mucho menor de 8S'7c capacidad ,.ieuna .La prueba positiva para predecir la presencia de enfem1edad cambia sustanCialmerlte. segn se aplique a gru pos de indi vid uos con probabilidades diferentes de presenta -la enfermedad. Una prueba positiva puede tener un valor predicti\U muy ele\-ado en un gru~ de pacientes; no obstante, en otro grupo con una prevalencia o probabilidad a,terior distinta de la enfermedad, la misma prueba puede tener un valor predictivo muctlo ms bajo. La prueba puede ser til para el diagnstico en un grupo de paentes que ;e sospecha pueden padecer la enfermedad, pero ser intil para el tamizaje de la pot lacin general en la cual la sospecha de enfermedad es baja.
"" ~ 'I
. i
COMBINAON
DE PRUEBAS
En la prctica cl1icay en los artculos de investigacin sobre anlisis de decisin, que se publican cada vez con mayor frecuencia, los I\vestigadores examinan los efectos de la combinacin de pruebas. Hay dos formas b isicas de combinar dos pruebas: en serie o en paralelo. El uso de dos pruebas en serie puede conducir al diagnstico mediante la siguiente estrategia:3
Al usar las dos pruebas en serie, la prueba nmero 2 solo se realiza en los individuos que son positivos a la prueba I. Cuando los resultallos de ambas pruebas son positi\"Os, la probabilidad de tener la enfermedad se calculc considerando que el valor predictivo de una prueba positiva adicional es igual a la prc babilidad de la enfermedad antes de realizar la prueba 2. Las pruebas en serie, aunqul' suelen tomar ms tiempo, permiten a los mdicos descartar la enfermedad empleand) menos pruebas.~ El valor predicti\'o de una prueba positiva o negativa no est influid() por la prueba que se realiza en primer lugar.' Habitualmente, son razones de segurida'i y de costo las que determinan cul es la prueba que se efectuar primero. L1 estrategia de utilizar las pruebas en paralelc exige realizar ambas pruebas al mismo tiempo, y la probabilidad de enfermedad se .:alcula despus de r<:aIizadas,tal como se presenta en el siguiente grfico,"
~ ~ 0.1) ~
3. ~ '.., ~ ~ """ z ,. ~ '5 z ~ u i "i: -::;; u ~ '5
) Tomad" de Riegelman RK y Puvar GJ. "ds. Putti".\, ort't"ntion ,nto practice Boston. Little, Brown; 1988. .Tambil'n pued" ser d" ayuda realizar prul'bas en serie cuando ambas pruebas tienen ur a especificidad baJa. , Se pn.'Sume qu" las prul'ba,; StJn independientes. En ,)tras palabras, se parte del supuesto, le quc 1.1 ~','Unda pnIl-bd tendrj la mi,;rna ~n,;ibilid.)d .V~ase la nota 3. y espl'Cificid"d, sea cual fuere el rc,;ult.ldo dc la primera-
121
Esta estrategia en paralelo funciona bien cuando ning ma de las pruebas tiene una sensibilidad especialmente elevada, pero cada una es ca.)az de detectar un tipo o estadio distinto de la enfermedad. A veces una prueba pue(.e detectar un estadio temprano, mientras que la otra puede detectar uno ms avanzad(). En otros casos,una prueba puede detectaruna enfennedad d~ evolucinrpida o agresi\ a mien~ que la segunda detecta una de progresin gradual o lenta. Las estrategiasen seriey en paralelosuponen que la 5egUIm prueba proporciona una infom1acinadicional superior a la que proporciona la primeJa. En caso contrario, el rendimiento de ambas estrategias es menor que el esperado. Por ejemplo, imagine el siguiente uso de la estrategia en paralelo. Se estudiaron la exploracin mamaria y la termografa c Jmo pruebas en paralelo para detectar el cncer de mama. Se observ que la explorccin tena una sensibilidad de 40% y la termografa, de 50%.Utilizando las dos conjuntlmente, se comprob que con una u otra prueba solo se detectaban 50% de los cncefl!S. Los investigadores estaban sorprendidos, dado que haban previsto ser capacesde :ietectar la mayor parte de los cnceres de mama. La combinacin de la exploracin mamaria y la termografa aade poco al uso de cada prueba por separado, ya que ninguna de ellas detecta 1,.enfennedad en una fase temprLIna. Los resultados de las pruebas nos proporcion1n bsicamente la misma informacin y, por este motivo, con una tenemos suficiente. Las pruebas de este tipo son poco tiles cuando se aplican conjuntamente, sea e, paralelo o en serie. Por eso, al disear una estrategia de diagnstico para aplicar las pruebas, necesitamossaber algo ms que la sensibilidad y la especificidad; necesitamos saber si las pruebas miden fenmenos diferentes o independientes. Tambin es preciso saber los tipos de enfermedad que pasan por alto las pruebas, por ejemplo si son incapacesde detectar enfermedades en sus fases iniciales o las de evolucin lenta.
~ ~ ~ ~ :3 ~ ~ ~ ;.. ~ -' ~ '4J "Z; :3 ~ ~ a :3 '!JI '.J ~ ~ \.J
122
f :1
RESUMEN:
CA-PTULO 18
LA PRUEBA DE UNA PRUEBA
El marco utilizado para probar una prueba no~;exige evaluarla mediante los conceptos de reproducibilidad y exactitud, y determinar ,avariabilidad de los resultados en los que no tienen la enfermedad, mediante el concepto del intervalo de la normalidad, y de los que tienen la enfermedad, mediante su medicin con la prueba de oro Ode referencia. Seguidamente, esta informacin se combina para valorar la discriminacin diagnstica de la prueba, que se mide en funcin de su ~ensibilidad, especificidad y valor predictivo. La variabilidad de una prueba se mide medial\te su reproducibilidad, o sea, repitiendo la prueba en condiciones idnticas. Las repeticiones de la prueba se interpretan sin conocer los resultados originales. La reproducil>ilidad no garantiza por s sola la exactitud de la prueba. Una prueba reproducible puecie reproducir resultados inexactos cuando existe un sesgo en una direccin. Aunque se puede prever alguna variabilidad en los resultados, esta debe ser bastante menol que la variabilidad biolgica medida con el intervalo de la normalidad. La variabilidad entre individuos sin la enferrnedad se mide mediante el intervalo de la normalidad. Este intervalo muchas veceso)mprende solo 95% de los valores de los individuos considerados sanos. Adems, del>ende del grupo de referencia seleccionado. Recuerde que ese intervalo es meramente una descripcin de cmo son las cosasentre los individuos presuntamente sanos. No ( s diagnstico: estar fuera de los lmites de la normalidad no equivale a estar enfermo, ) estar dentro de los lmites de la normalidad no equivale a estar sano; un cambio dentr) del intervalo de la normalidad puede ser patolgico, y estar dentro de los lmites de la normalidad no es necesariamente igual a tener los \.alores ms con\'enientes. Se pueden ajustar los valores que demarcan los lmites de la normalidad, alterando de ese modo la especificidad, pero debe tenerse en cuenta el precio que se paga con el nmero (,e positivos y negativos falsos. Finalmente, al emplear el concepto del intervalo de la r ormalidad para definir a un grupo de individuos sanos, es preciso establecerlmites ir\equvocos, con objeto de determinar cules son los pacientes positivos y cules los nt gativos a la prueba . El grupo de sujetos con la enfermedad se define mediante la prueba de oro, que es el mejor mtodo disponible y generalmente aceptad:>para diagnosticar la enfermedad. Al definir a los enfermos, es conveniente incluir a individuos que tengan el mismo tipo de estado patolgico que encontraremos al apUcar la prueba en el medio clnico. Despus de haber comprobado que la prueba es reproducible, que se ha definido lo que es una prueba positiva y una negativa mediar te el intervalo de la normalidad y que, mediante el criterio de referencia, se ha identifi('ado a un grupo de individuos enfermos ya uno de sanos, ya se puede valorar la discriminacin diagnstica de una prueba. Cuando se aplica la prueba en estudio a los inciividuos identificados como enfermos o como sanos mediante el criterio de referenda, se calculan su sensibilidad y espedfiddad comparando los resultados de la prueba e!.tudiada con los de la prueba de refcrenda. Dado que se supone que la prueba de refen~nda tiene una dis-
~
~ ~
~ :s 3 ~ ~ ~
123
criminacin diagnstica perfecta, o de 100%, la prueba en estudio generalmeI\te no estar ala altura de la de referencia. Esto ser cierto aunque la prueba estudiacla sea intrnsecamente mejor que la de referencia, ya que cualquier discrepanCia se resolver a favor de la de oro.
;?: :::: ~
:J ~ ~ ~ Q. :.. ~ :5 :J f:i; :.J ~ ~ " ~ ~ t;; :.J ~ < Q u
La sensibilidad mide la proporcin de los individuos que tienen la enfermedad, diagnosticada segn el criterio de referencia, que son identificadc,s correctamente como enfermos por la prueba estudiada. La especificidad mide la prl>porcin de los que no tienen la enfermedad, segn el criterio de referencia, que son identificados correctamente como sanos por la prueba en estudio. La sensibilidad yla especificidad son importantes porque tericamente son independientes de la prevaleru:ia o probabilidad anterior a la prueba de que la enfermedad exista en el grupo de in.:tividuos estudiados. Esto permite comparar los resultados que obtienen en la prueba futintos grupos de pacientes. Las pruebas se pueden comparar directamente en funci)n de su sensibilidad y especificidad. Sin embargo, es importante reconocer que estas :T\edidas pueden ser distintas en los estadios tempranos de una enfermedad, compafildos con los avanzados. La sensibilidad y la especificidad no responden a la siguil'nte pregunta clnica: cul es la probabilidad de tener la enfennedad si la prueba es ru'gativa o si es positiva? El valor predictivo de una prueba positiva nos informa de la ccrreccin con que la prueba confinna la enfennedad en una detenninada situacin clni.a. El valor predictivo de una prueba negativa nos indica la correccin con que la prueba descarta la enfennedad en una determinada situacin clnica. Los valores predi:tivos, a diferencia de la sensibilidad y la especificidad, dependen de la prevalencia o probabilidad de la enfenned.1d anterior .1la prueba. Desde el punto de \;sta clnico, esto significa que se debe realizar la mejor estimacin posible de la probabilidad de la enfennedad antes de ejt'cutar la prueba. El valor predictivo infonna al cIinico sobre la probabilidad de que la enfennedad est presente despus de realizar la prueba. El clnico ha de tener cuidado de no extrapolar el \ralor predictivo de un contexto clnico a otro. Una prueba muy Iltil para diagnosticar la eniennedad en presenciade sntomas puede ser prcticamente intil para el tamizaje de indi\'iduos asintomticos. Las pruebas pueden combinarse en serie o en paralelo. Clando se utilizan dos pruebas en serie, la segunda prueba se realiza nicamente si la primera da un resultado positivo. Las pruebas en serie a veces penniten establecer un dia;nstico realizando un menor nmero de pruebas. Las pruebas en paralelo pueden en\plearse cuando ninguna de ellas tiene una sensibilidad suficientemente alta. Esta e~trategia funciona bien cuando las dos pruebas detectan diferentes estadios o tipos de a enfermedad, diferendando, por ejemplo, entre un estadio incipiente y uno avanzad) o entre una enfennedad fulminante y una de desarrollo lento. En esta situacin, el empleo de las pruebas en paralelo garantiza que se detectar un porcentaje ms alto de incividuos con la enfennedad. La obtencin del mximo beneficio de cualquiera de estas estrategias requiere que los resultados de las dos pruebas midan fenmenos distintos o detecten la enfennedad en etapas diferentes de su evolucin.
PREGUNTAS mES PARA PROBAR UNA PRUEBA ayudar a refor-
zar los principios 1.
La siguiente lista de preguntas de comprobacin necesarios para probar una prueba.
Propiedades intrnsecas de una prueba. a. Reproducibilidad: producen resultados
prcticamente
idnticos
las
repeticiones condiciones ? mltiples . b.
de una prueba
realiza a en las mismas
Exactitud: corresponden los resultados de la prue~a a los verdaderos valores del fenmeno anatmico, bioqumico o fisiolgico? Exactitud clnica: proporciona la prueba mediciolles similares a las experimentales cuando se realiza en las condicione:; reales de la prctica clnica ?
2.
Variacin biolgica: el concepto del intervalo de la normalidld y de la variabilidad en los individuos sanos. a. Seha establecido el intervalo de la normalidad de forma apropiada para que incluya a un porcentaje definido, a menudo 95%, de los individuos considerados sanos? b. Seha distinguido entre estar fuera del intervalo de la normalidad yestar enfermo? c. Seha distinguido entre estar dentro del intervalo de la normalidad y estar sano? d. Se puede aplicar de forma generalizada el grupo de referencia utilizado o existen grupos identificables con diferentEs intervalos de la normalidad? e. Reconocieron quienes aplicaron la prueba que el iJ1tervalo de la normalidad es una descripcin del grupo presuntameJ1tesano y que los cambios dentro del mismo para un indi\-iduo puede"\ ser patolgicos? f. Seha distinguido el intervalo de la normalidad del Ieseable? g. Han justificado los investigadores la modificacin del intervalo para cumplir con objetivos diagnsticos especficos? Variabilidad de los individuos enfermos. a. Han seleccionado los investigadores la mejor pruebi de oro disponible para definir a los pacientes que tienen la enfermedac en estudio? b. Han incluido los investigadores a individuos que r{'presenten todo el espectro de la cnfermcdad, para establt.'Ccr i.nrer:alo rcalista de loS un resultados posibles? Discriminacin diagnstica: distincin entre los enfermos y ios sanos. a. Cun correctamente identifica la prueba a los enferr1os? Cun alta es su sensibilidad? Con qu frecuencia es positiva en I)s enfermos? b. CuncorrL'Ctamente identifica a los que no tienen la el1fermedad?Cun alta es su especificidad? Con qu frecuencia es negcti\'a en los que estn sanos? c. Seha reconocido que, si bien en teoria la sensibilidad y la especificidad no son influidas por la probabilidad de la enfermejad posterior a la prueba, estas medidas pueden ser distintas en las fases tempranas y en las avanzadas de la enfermedad? d. Seha distinguido entre la sensibilidad y la especificijad de la prueba y su valor predictivo cuando es positiva y cuando es ru~gativa?
DE LABORATORIO
3.
4.
~ :c " ~ " ~ .'5 3 < ~ 'j ~
PRUEBAS
Examinemos algunas de las pruebas bsicas de laboratorio que se utilizan en la medidna clnica para valorar su exactitud, reprodudbilidad, intervalo de la normalidad y discriminadn diagnstica.
.'.:;:J
. ,'f;
Hematcrito
Exactitud y reproducibilidad
~
El hematcrito es una medida del porcentaje de la saIlgre total compuesta pOI glbulos rojos aglomerados. Los hematcritos de rutina se miden mediante la puncin en el dedo, con el fin de valorar la sangre en los capilares, o Inediante puncin venosa. Ambos mtodos permiten medir exactamente la cantidad rt'lativa de eritrocitos en la sangre, pero su reproducibilidad depende de que se preste a .encin a los detalles tcnicos. Se puede esperar que la sangre de los capilares tenga un hematcrito entre 1 y 3% ms bajo que la venosa. El hecho de apretar excesivament? el dedo puede extraer ms plasma y disminuir errneamente el hematcrito. En pre:;encia de anemia grave, la puncin del dedo ofrece valores menos exactos. Para valorar la exactitud con que el hematcrito mide el.'stado fisiolgico, cabe recordar que se est midiendo la masa relativa, no absoluta, de glbulos rojos. Los resultados pueden ser errneos si el volumen plasmtico se ha redllcido debido a deshidratacin o diuresis. Los individuos con un volumen de plasma .educido pueden tener hematcritos por encima del intervalo de la norrnalidad. Estas sm variaciones normales que pueden confundirse con la policitemia (hematcrito patolgicamente elevado). Inil'rvaIo de la nonnalidad
'-= ~ 'oJ :J ~ '-=

? :J ~ '-= ~ ~ ~ ~ >~ c -' :'"" 'oJ ? :J ~ '-= ~
~ .~ '.J ~ ~ ...)
26
El intervalo de la normalidad de las concentraciones del hematcrito es diferente en los hombres y en las mujeres. Esto es de conocimiento general en los laboratorios y en sus informes los intervalos normales para hombres y mlljeres se presentan por separado. ~1enosa menudo se reconoce que los inten-alos de li normalidad son distintos en las diferentes fasesdel embarazo, en diversas edades y en las personas que viven a distintas altitudes, El hematcrito suele descender durante t~1 embarazo, empezando en algn momento entre el tercer y el quinto mes. Entre el quinto y el octavo no es inusual que se observe una reduccin de ~O("'r resf't-'Ctoa los \'alares anteriores. Sin embargo, por lo general aumenta ligeramente cerca del trmino del embarazo y vuelve a sus valores normales seis semanas despus del parto. La edad tiene un efecto marcado sobre el hematcrito, ~specialmente en los nios. El intervalo de la nonnalidad del primer da de \'ida es 54 = lO (esto es, oscila entre -!4 y 6-!). All-to. da, ~I intervalo es 42 = 7, ya los seis meses, 3:),5 = 5. El hematcrito promedio aumenta gradualmente hasta la adolescencia, y alcanza un promedio de 39 entre los 11y los 15aos de edad. El intervalo de la normalidad de los hombres adultos ~s .t7 = 5 y el de las mujeres, .t2 = 5. La presinbaromtrica baja tambin tiene un efecto prorulnciado sobre el intervalo de la nonnalidad del hematcrito. Las personas que nacen y \'iven a grandes alturas tienen en general hematcritos ms altos. Por ejemplo, el inteJ'-alo ~ la nonnalidad a los 1 200 metros es .t9,2 = 4,5 en los hombres adultos ~.44,5 :. 4,5 en las mujeres adultas. El intervalo de valores de los hematcritos normales es I:astante amplio. Por esta razn, si un individuo tiene un valor cercano allnite superi;)r de la normalidad, puede llegar a perder hasta una quinta parte del \ulumen de eritrocitos antes dequese pueda demostrar la existencia de anemia mediante un hematcrito bajo. Las comparaciones con los hematcritos anteriores son importantes para \'alorlr el desarroIlo de la anemia. Individualmente, el hematcrito se mantiene dentro de lnites
fisiolgicos bastante estrechos, por eso, sus cambios constituyen wta medida diagnstica mejor que la de una sola observadn. Discriminaci6n diagn6stica
Al evaluar el hematcrito, tambin es necesario conocer la forma en que este responde a la prdida aguda de sangre. Durante una hl~morragiaaguda se pierde sangre entera y en un primer momento, la restante se aproxiInar al hematcrito original. Pueden pasar hasta 24 horas o ms antes de que la prdida se compense mediante un aumento del volumen plasmtico. Solamente despus de esta compensacin puede el hematcrito reflejar totalmente la magnitud de la prdida de sangre. Si no se reconoce este fenmeno, se pueden obtener resultados negativos ialsos en la identificacin de los sangrados agudos. El cuerpo suele ser capaz de compensar la desintegracin o prdida de sangre que ocurre lentamente. Por lo tanto, es posible que En los pacientes con sangrado lento o hemlisis no se detecte anemia, aunque el nm,~ro de reticulodtos est elevado. Si mediante la prueba del hematcrito se espera dia:;nosticar las enfermedades que predisponen a las prdidas de sangre o a las hemli;is, encontraremos un nmero relativamente alto de negativos falsos. Enfermedades como la beta-talasemia o los dficit de glucosa-6-fosfato deshidrogenasa (G-6FD) se:nlanifiestan muchas vecescomo anemias compensadasque cursan con un hematcrito r orrnal o en el lmite inferior de la normalidad. Los resultados positivos falsos se puederl producir entre los individuos que tienen el \'Olumen plasmtico aumentado como un, variante de la normalidad. Desde otro punto de vista, estos individuos reflejan el hect 10 que para cualde quier intervalo de la normalidad habr individuos sanos con valores fuera de los limites del intervalo de la normalidad.
Nitrgeno ureico en la sangre y creatinina srica

E\,actihld y reprodllcibilidad Para medir las concentraciones de nitrgeno llreico en la sangre (NUs) y la creatinina srica contamos con pruebas automatizadas t astante reproducibles. Dado que esasconcentracionesreflejan la acumulacin de nitr geno ureico y creatinina no excretados, constituyen una indicacin de la incapacidad del rin para eliminar esas sustancias. Cuando se utilizan como medidas de la ful1cin renal, sm.en para valorar la tasa de filtracin glomerular, pero reflejan ms exactamente esta tasa cuando hay un deterioro importante de la funcin renal. Como los ri ones suelen tener una capacidad de reserva funcional considerable, puede producirs.~ una prdida funcional importante, por ejemplo. de un rin, sin que aumente la aC11mulacin NUs de y creatinina. Estas sustancias reflejarn la tasa de filtracin glomeruar solo despus de una prdida de 50% o superior de la filtracin glomerular. Cuanto m.is desciende la tasa de filtracin, ms rpidamente aumentan el NUs y la creatinina. Cuando el NUs y la creatinina estn claramente elevados, su incremento porcentual refu.ja mejor el porcentaje de prdida de la tasa de filtracin glomerular que su cambio nu :nrico. Cuando la concentracin de creatinina se encu~ntra dentro de los lmites normales y se precisa disponer de una valoracin exacta de a tasa de filtracin glomerular, es posible medir la concentracin de creatinina en Orin,l de 24 horas ya la vez la srica, y calcular entonces el aclaramiento de creatinina. Aunq le esta prueba presenta problemas relacionados con su reproducibilidad y con el intervalo de la normali-
~ ~ ~
z :1 ".oJ ~ $ ~ :1 ~ ~ ~ -J z t,, ~ :1 ~ ~
I!!'
dad, es capazde detectarcambiosmucho menoresde la tasade filtracin glomerular " cuandola concentracin sricade creatininano estele\"ada" Intervalo de la nonnalidad
Los intervalos de la normalidad de uso estndar en laborat)rios varian aproximadamente entre 10y 20 mg/dl para el NUS y entre 0,6 y 1,4 mg/dl pIa la creatinina srica. Para utilizar esos intervalos, es necesario comprender los factore~ que los afectan en ausencia de enfermedad. El NUS refleja el estado proteico y de hidratacin de un paciente. Por eso, el NUS puede cambiar marcadamente sin indicar la presencia de una enfermedad especfica. La creatinina es un producto muscular y, como tal, varia ampliamente entre individuos sanos, de acuerdo con su masa muscula:. La concentracin de creatinina suele ser ms baja en las mujeres que en los hombre~ .En los ancianos, considerados como grupo, la masa muscular y la concentracin de lreatinina son relativamente menores. A pesar de estas importantes diferencias, los laboratorios habitualmente presentan la concentracin de creatinina en referencia a un solo intef\'alo de la normalidad. La concentracin de creatinina, al contrario que la del NUS, 'aria menos de da a da y de mes a mes en respuesta a factores no renales. Muchas \"Eces, las comparaciones de las concentraciones de creatinina medidas en distintos mome ntos pueden proporcionar informacin muy importante sobre el estado renal. Una con:entracin de creatinina srica de 1,3 mgdl en una mujer anciana puede reflejar una prdida considerable de la tasa de filtracin glomerular, especialmente si ha aumen':ado en comparacin con valores anteriores. La misma concentracin en un hombn' joven y musculoso puede ser estable y no indicar disminucin de la tasa de filtra,in glomerular.
Discrinlinacin diagnstica
Como hemos comentado anteriormente, a menudo se obtienel\ reo sultados negativos falsos para la enfermedad renal utilizando el :\TUSy la creatinina, dado que la concentradn de estos metabolitos no empieza a aumentar hasta que s.~ha produddo una prdida sustandal de la filtradn glomerular. Adems, tambin se !,roducen resultados positivos falsos tanto con la creatinina como con el NUS. 1..1 con('entradn de :\TUSpuede ser baja en enfermedades que producen rnalnutricin. Por e;.?mplo, los alcohlicoscon frecuencia tienen concentri1ciones bajas de i'.'U'S. B ~rus tlmlnn refleja la degradadn hemtica que se produce durante una prdida rpida de sar gre en el tubo digestivo. Estas elevadones del NUS no son resultldos positivos faIso~,en sentido estricto, pues indican la presenda de otras enfermedades distintas de las rEnales. Sin \!mbargo, son positivos falsos cuando se est tratando de valorar la filtra(in glomerular. En presenda de enfermedades musculares se puede detectar una ele..'acin falsa de la concentradn de creatinina. En este caso, los resultados tampoco son p JSitivos falsos, pero sugieren que la enfermedad no es renal. Es posible utilizar las pruebas del NUS y la creatinina en para elo para entender y localizar anormalidades. Normalmente, la razn entre la concentracin de NUS y la de creatinina es de 15:1. La elevadn despropordonada del NUS en relacin con la creatinina sugiere la presencia de una enfermedad pre o posrenal, ms que llna enfermedad propiamente renal. La deshidratadn puede presentarse como un pat"n prerrenal. con elevadn dcsproporcionada del NUS respecto a la creatinina. A ve( es, alguna enfermed.ld posrenal, como la obstrucdn prosttica, tambin produce llna
t
i ~
elevacin desproporcionada del NUS respecto a la creatinina. Por e~te motivo, el uso paralelo o simultneo de las pruebas del NUS y la creatinina ejempliJica una situacin en la cual el uso de dos pruebas ofrecer ms informacin diagnstlca que el de una sola, dado que miden fenmenos distintos.
Acido rico
Exactitud y reproducibilidad
La concentracin de cido rico en la sangre SEpuede medir de fonna reproducible mediante tcnicas automatizadas. Paraello existEn diversos mtodos, cada uno de los cuales proporciona valores ligeramente distintcts. Es importante comparar las concentraciones obtenidas con el mismo mtodo. Con as tcnicas automatizadas generalmente se obtienen valores algo ms altos. La concentracin de cido riCOpuede variar en breve plazo; por ejemplo, puede aumentar r),ida y significativamente debido a deshidratacin. La concentracin de cido riCO la sangre micle exactamente la en concentracin del cido rico en el suero. Sin embargo, no valora exac amente todoSloS parmetros fisiolgicos importantes del cido rico. No es un indicadc r exacto del cido rico Corporal total. Por ejemplo, el cido riCO cristalizado y deposita<lo no se refleja en la concentracin srica. En relacin con el desarrollo de gota, el cido .rico cristalizado y depositado es frecuentemente el criterio diagnstico decisivo. Aden\s, la concentracin srica de cido rico es SOlouno de loS factores que influyen en ;u excrecin. Algunos individuoS que no tienen una concentracin elevada de cido rico en el suero pueden excretarlo en grandes cantidades, lo cual loS predispone a I)nnar piedras de cido riCO. ItltFnulo de la tJOnltalftld y discri,llitUlCitl diagnstica
El intervalo de valores normales del cido rico e:; bastante amplio y en la ma-Yor parte de los laboratorios vara .1proximadamente entn' 2 y 8 mgdl, en funcin del mtodo empleado. Muchos individuos tienen valores lig"ramente por encima de este intervalo y muy pocos por debajo. Son muy pocas las pe~,onas con valores ligeramente elevadosque desarro1l.1n gota. Esto ha llevado a muchos rldicos a afirmar que no se debe tratar a los pacientes con concentraciones ligeramente 1~levadas cido de rico. En realidad, lo que estn alegando es que el lmite superior de la normalidad se debe aumentar para que la concentracin srica del cido rico permit, discriminar mejor entre los que estn predispuestos a padecer gota y los que no lo estn. Incluso cuando las concentraciones de cido nC( sn elevadas, la ) discrimin.1Lin diagnstica no es buen.1, porque frecuentemente aparecen resultados positivos falsos. Las personas con insuficiencia renal en muchas ocas ones tienen concentraciones elevadas de cido rico, pero raramente padecen gota. Es evidente que existen otros factores, adems del cido rico, que determinan el desarrollo de esta dolencia. Se ha demostrado que a vecesla gota se desarrolla en los indivi(luos predispuestos cuando la concentracinde cido rico cambia rpidamente. Tanto SIl reduccin como su aumento puede precipitar una crisis de gota. Mucha gente que pacece de gota tiene concentraciones sricas de cido rico normales durante los episodi(os de la enfermedad. Estoscasosse han documentado mediante la prueba de oro, la dEmostracin de la presencia de cristales birrefringentes en el lquido articular, y no por medio de la concentracin de icido rico en el suero. Las personas que se sospecha tit 'nen gota a pesar
."
~ ~
~ :J =~ ~ -.1
~ ~
~ ."': =2
129
de que sus concentraciones de cido rico estn dentro de los lmites de la ncmtalidad durante los ataques agudos, deben ser examinadas posteriormente. A meIIUdo, SUS concentraciones de cido rico habrn aumentado, lo cual demuestra que se c,btuvo un resultado negativo falso al inicio del episodio de gota. A causade la dbil asociacinentre la concentracindel :ido rico en el suero y su excrecin urinaria, se puede decir que la primera prueba tienE'una baja discriminacin diagnst:ica de las piedras de cido rico. El nmero de resultados positivos y negativos falsos sera muy alto si se empleara la concentracin de (:ido rico en el suero como criterio exclusivo de diagnstico. La demostracin de la presencia de piedras es el mtodo de diagnstico ms definitivo. Se ha observado que la ~xcrecin elevada de cido rico en orina de 24 horas indica predisposicin a la formaci()n de piedras de cido rico. En este caso la asociacin tampoco es exclusiva, porque hay otros factores que influyen en la formacin de piedras. El volumen bajo de orina ye! pH bajo, especialmente, son factores predisponentes que aumentan la frecuencia de fJrmacin de piedras de cido rico. El cido rico ilustra diversos principios importantes aF'licablesa las pruebas diagnsqcas. I. Incluso en presencia de una prueba exacta y reproducible que reflej ~ la anormalidad metablica relacionada con la enfermedad, el grado de asocial:in entre la concentracin srica y la presencia de enfermedad puede ser bajo. Es posible que la medicin de concentraciones sricas,tanto del cido rico como de otras sustancias, no constitu~'a una buena indicacin del contenid(, corporal total y, en particular, de su concentracin en las localizaciones patol;icas. Puede que la concentracin srica proporcione menos seguridad en e! diagnstico cuando ms se necesita, al inicio de los sntomas.
2.
3.
~ :c '"J ~
~
~ z ~ ~ ~ :x ::J :.: Q,. >.::J c ~ .. V\ ... z ~ :.: ~ =s ~ '(I ... o ~ o u
111
CAPTULO 19
EJERCICIOS
PARA DETECIAR ERRORES: LA PRUEBA DE lrNA PRUEBA
Los siguientes ejerddos se han diseado con 1'1 de evaluar la fin capaddad que usted ha adquirido para aplicar los dive~ prindpios lsados en l prueixl le urja prleOO. ejerddos incluyen varios errores que se han ilustJ-adocon ejemplos Los hipotticos. Lea cada ejercido y luego escriba una crtica sealando I,>stipos de errores cometidos por los invetigadores. Compare su crtica con la que se pJopordona al final de cada ejercido. EJEROOO No.1: VARIABILIDAD SANA y ENFERMA DE LAS POBLAOJNEs
Se realizaron dos investigaciones para evaluar a utilidad de una nueva prueba diagnstic} del (n(er de mama. Pre\1amente, se hakia observado que los resultados de la prueba variaban en menos de 1%cuando se repet 3n en condiones iguales y er}n ledos por el mismo intrprete. En el primer estudio, los investigadores escogieron a 100mujeres con cncer de mama metastsico ya 100mujeres sanas sin signos dE enfennedad rnamari}. En I}smujeres sanas, los resultados de la prueba oscilaron entre 30 y 100mg/dl, :. en I}s pacientes (on cncer, entre 150y 200 mgidl. D}do que la pnleba diferenciaba perfectamente.1 un grupo de otro. los investigadores concluyeron q11e poda considerarse una pruebd idedl para el diagnl)5tico del cncer de mama y qtle deba aplicarse inmedi;1t.1mentc;11 tamizaje de tud;1S mujcrl's. (;1S En un segundo estudio en el que se us la mism3 prueba, otro investig;1durI.:umpara 100mujeres rel.in di;1gnosticadasde cncer de rnama con 100 que padedan una enfermedad benigna de mama. Los resultados de las pccientes de cncer variaron entre 70 y 200 mg/dl y los de las pacientes con enfennedad l>enigna, entre 40 y 180mgidl. Los autores de este estudio se perc}taron de la notable suj>erposicin entre los dos grupos y concluyeron que la prueba era intil. Un lector de ambos cstudios, asombrado de que dos investigadores rl'spetados pudieran obtener resultados tan inconsistentes. conclt.y que se deban h;1bercometido errores ;11 notificarlos.
CRllCA: EJERCICIO No.1
~
~
~ :::
Para revisar estos estudios, es interesante orgar izar la discusin en tomo a los conceptos de variabilidad de la prueba, variabilidad de 1,1 poblacin sin la enfermedad y variabilidad de la poblacin con la enfermedad. Variabilidad de la prueba
9 ~ s :,l:; 0=! :, .'""' ~
La reproducibilidad es la medida de la variabilida j de una prueba. Segn se afinlla ~n el estudio, cuando la prueba fue realizada en las rlismas condiciones por el mismo intrprete, su variabilidad fu~ d~ l0/c. La medicin de la reproducibi-
131
lidad exige repetir la prueba para demostrar que los resultados de la segunda 1~ no estn influidos por los de la primera lectura. Como el mismo intrprete repiti las pruebas, es posible que la lectura de los resultados de la segunda prueba estuvie~, influida por los resultados iniciales. Si esto fuera cierto, la reproducibilidad podria s ~r menor que la notificada anteriormente. No obstante, en el resto de la discusin supcndremos que los autores tenan razn al creer que la prueba era reproducible. Variabilidad del grupo de individuos sin la enfennedad
En el primer estudio se incluyeron mujeres sanas y los n$ultados oscilaron entre 30 y 100 mg/dl. En cambio, en el segundo se estudiaron mujeres con enfermedades mamarias benignas y los resultados estuvieron comprendido~; entre 70 y 200 mg/dl. Tal vez estos estudios no sean contradictorios y representen dos segmentos diferentes del grupo de mujeres sin la enfermedad. Es posible que la enlermedad mamaria benigna eleve a valores intermedios la concentracin del metabolit,) medida por la prueba. La medida adecuada del grupo de personas sin la enfennedad es el intervalo de la normalidad, el cual habitualmente incluye a 95'70 los individuos del de grupo sin cncer de mama. Sin embargo, aqu los resultados se presentan en i 1tervalos que agrupan a l009c de loSindividuos; el intervalo total no nos dice nada sobn'la forma en que se agrupan los resultados. Estospodran estar muy concentrados entrE'70 y 100. Sin disponer de todos los datos, o al menos del intervalo de la normalidad, es difcil utilizar estos estudios para comparar pacientes con y sin cncer de mama. Variabilidad de los individuos con la enfermedad
~ ~ ~ == ~ ~ ~ ~ >~ :5 ::J ... !./1 ~ "2: ::J ~ ~ :5 ::J ... '~ '-J :) ,~
En el primer estudio se incluyeron pacientes con cncer metastsico de mama y se estableci un intervalo de resultados comprendido entre 150y 200 mg/dl. En el segundo, se estudiaron pacientes recin diagnosticadas y los limjtes del intervalo de los resultados obser\'ados fueron 70 y 200 mg;dl. Es posible quE esta discrepancia no refleje un error en la notificacin de los datos, sino las diferencia~ entre los grupos estudiados. Las pacientes recin diagnosticadas de cncer de mama )robablemente representan un amplio espectro de la enfermedad, incluidos los estadio; iniciales y los metastsicos, Las pacientes con metstasis de cncer de mama constituiran solo un extremo del espectro de la enfermedad. Por este motivo, ~I intervalo ms lmplio de \'alores encontrado entre las pacientesrecin diagnosticadaspodria reflejar el g:upo ms representativo de pacient~s con cncer de mama incluido en ~I segundo estu,jio. Discriminacin d.iagnstica
132
LoS datos presentados no nos permiten calcular la sensibilidad o la especificidad de la prueba. Puesto que no se menciona la distribucin de los resultados individuales. no se puede ~stablecerun intervalo de la normalidad o una separacin entre las pruebas positivas y negativas. Por lo tanto. no es aconsejableIle:;ar a conclusiones sobre la utilidad diagnstica de la prueba. En el primer estudio, los investigadores incluyeron tanu) a individuos que padecan una enfermedad bastante avanzada como a individuos cl ~ramente sanos. No es sorprendente que sus resultados parecieran diferenciar correctamente a los grupos. En el segundo estudio. los investigadores incluyeron a pacientes ( ue representaban un espectro ms amplio de la enfermedad y tambin a las que padecan enfermedades benignas. Por lo tanto, tamp'-)(Oes sorprendente que se produjer;1 una m.1-
yor superposicin de los valores numricos. Tan incorrecto es inferir q le el ~er estudio es una prueba perfecta como que el segundo es una prueba intil. I.a verdad, que probablemente se encuentra entre ambos extremos, exige valorar la sensibilidad y la espedficidad utilizando todos los datos de un amplio espectro de la p:>blacinenferma y de la sana. EJEROOO No.2: EL CONCEIYro DE LA NORMAUDAD
Un investigador intent establecerlos lnites de la nom\alidad para una nueva prueba diagnstica de la diabetes, como se describe a ccntinuacin. 1. 2. 3. Localiz a 1000 pacientes hospitalizados por enfermeda:les distintas de la diabetes. Aplic la prueba a esos 1 000 pacientes. Traz la distribucin de los valores de la nueva prueba, excl11y 2,5% de los valores del extremo superior y 2,5% del inferior e incluy el 95% restante en el intervalo de la normalidad.
A continuacin, aplic la nueva prueba en la c(lmunidad y realiz pruebas de tamizaje en voluntarios. A los que tuvieron resultados centro del intervalo de la normalidad les dijo que no tenan diabetes ya los que tuvier(ln resultados fuera de esos lmites, que padecan diabetes. Un ao ms tarde aplic la prueba de nuevo a varios individuos cuyos resultados haban correspondido a la zona il\feriordellnite de la normalidad yalobservar que en esta ocasin los resultados se enamtrabanen la zona superior de dicho limite, les asegur que no tenan diabetes. Un paciente obeso con resultados en la zona su :>eriordel intervalo de la normalidad y con una historia familiar de diabetes muy marcada le pidi consejo sobre la forma de evitar el desarroUo la enfermedad. El in..~stigad(r le respondi que, de como sus resultados se encontraban dentro del intervalo de la norm.t!idad, no deba tener motivos de preocupacin.
CRnc.;.\:
Desarrollo
EJERCICIO No.2
del intervalo de la normalidad
~ ~
2: :: -
Al establecerel intervalo de la normalidad, el in vestigador debe intentar incluir solamente a los individuos que no tengan la enfermed&ldestudiada. El investigador del estudio anterior lleg a la conclusin de que los indi';duos hospitalizados con diagnsticos distintos de 1.1 diabetes no padedan estaenferml~d. Sin embargo, la diabetes es muy fr~uente y los pacientes diabticos desarroUanuna serie de complicacionesque aumentan el riesgo de ser hospitalizados. Por lo tanto, es probable que una proporcin de los individuos internados con diagnsticos principa ies diferentes tambin tu \;era n diabetes y que el investigador no haya establecido un ntervalo de la normalidad de pacientes exentos de la enfermedad. El investigador utiliz como intervalo de la nonnalidad 95% de los resultados centrales de un grupo de personas que presuntamente no tenan la enfermedad. Aunque este es el procedimiento habitual, puede que no se preste a la mxima discriminacin diagnstica de la prueba. A veces, la modificacin d~ los lmites del intervalo de la normalidad puede mejorar la capacidad de la prueba par3 discriminar entre los que tienen y los que no tienen la enfermedad. No obstante, dE'berecordarse que cuando cambiamos los lmites del intervalo de la normalidad para obtener menos re-
~ '5 ~ ~ ..I\
o u u ~ ;o ::3'
133
sultados negativos falsos, pagamos el precio de obtener ms resultados positivos fa 505 o vice\-ersa. Si bien puede merecer la pena pagar ese precio, se necesitan ms dtos antes de poder saber si este es el caso. De cualquier modo, los datos disponibl~ no . proporcionan los medios adecuados para juzgar si la nueva prueba ayuda a discriminar a los diabticos de los no diabticos. Lo nico que conocemos es el intervalo de la Ilormalidad definido para la prueba.
Aplicacin del intervalo de la normalidad

En el caso descrito, no se ha mantenido la distincin entre el c)ncepto del intervalo de la normalidad y el de en~ermedad, El autor ha considerado si 1nimos el estar fuera del intervalo de la normalidad y tener diabetes, y el estar dentro del inter.'alo y no tener diabetes, No se han presentado pruebas de que la nueva prueba ;ea til para discriminar a los diabticos de los no diabticos y es posible que los prime ros se encuentren totalmente dentro del intervalo de la normalidad de esta prueba. Aunque se hubiera demostrado, desde el punto de vista del di 19nstico, que esta prueba es til para distinguir a los que tienen diabetes de 10$que no la tienen, es probable que algunos individuos con diabetes tuvieran valores dentro jel inter.'alo de la normalidad y algunos sin la enfermedad, fuera de dicho intervalo, 'Dr definidn, el intervalo de la normalidad excluye a 5% de los individuos que no tier en la enfermedad, Poreso, el in..'eStigador puede limitarse simplementea aplicar la prut'ba no ya identificar a los individuos como diabticos o no diabticos.
Cambios dentro del intervalo de la norn1alidad

El hecho de que los resultados de una prueba aplicada a un in:ii\'iduo cambien, aunque se mantengan dentro del intervalo de la normalidad, puede ';er una manifestacin de enfermedad. El concepto del intervalo de la normalidad se ha (lesarroUado principalmente para individuos sobre los que no disponemos de datos llasales anteriores. Cuando este es 'el caso, es prt!ciso comparar, por medio del intervllo de la normalidad, los resultados individuales con los de aquellos que presuntamerlte estn sanos. Si la misma prueba se ha aplicado al individuo con anterioridad, esta nformacin debe tenerse en cuenta. n cambio dentro del intervalo de la normalidad puede repreSt:ntar un gran aumento para un individuo determinado; esto se m.mifiesta especialmerte cuando los resultados anteriores de 1.:1 prueb.:1 encuentr.:1n se cerca del lmite inferior je la normalidad y los postt!riores se desplazan h.:1cia lmite superior. Para esos indr:isu duos, los c.:1mbios que se producen dentro de los limites normales pueden ser manifl '5taciones precoces de la enfermedad.
Grupo de referencia
El grupo de referencia empleado en este estudio para fijar el intt'rvalo de la normalidad estaba formado en su totalidad por pacientes hospitalizados. ~;u intervalo de la normalidad podra ser bastante diferente del de otras poblaciones de Fajentes jvenes, ambulatorios y sanos. Por este motivo, al establecer los lmites de la normalidad de un ~po y aplicarlo a otro con caractersticas diferentes se pudo haber Introducido un error.
Dentro
de loS lmites
de la nonnalidad
~s
lo desea ble
Es posible que todos o algunos de los individllos cuyos resultados se encontraban dentro de los lmites de la nonnalidad tuvieran v31oresms elevados que los deseables.Recuerdeque el intervalo de la nonnalidad reflej 3cmo son las cosas y no necesariamente cmo deben ser. Posiblemente, una prdida je peso que en consecuenda disminuya los valores detectados por la prueba prevengc futuros problemas. Esto supone que la prueba discrimina de hecho a los enfennos de 11)5 enfennos, que no perder peso influir en los valores numricos de los resultados d ~ la prueba y que la reducdn de estos ltimos mejorar el pronstico. Sin embargo, 1(1 interesa en geque neral es que los resultados que caen dentro del intervalo de la normalidad no son necesariamente los deseables.
E]ERCIOO No.3: DISCRIMINAON DE LAS PRUEBAS
DIAGNsnCA
Se va a evaluar la utilidad de una nueva prueb(1para el diagnstico de la trombotlebitis. La prueba de referencia tradicional ha sido la flebografa y con ella se comparar la nueva prueba. Paravalorar la reproducibilidad de 1(1 nueva prueba, esta se aplica a 100pacientes consecuti\"Os con tlebografias positivas. Los investigadores observan que 98'7c los pacientes diagnosticados de trombotlebitis clan resultados poside tivos a la prueba. Repiten la prueba en el mismo grupo de pacientEsy de nuevo observan que es positiva en 98% de los 100pacientes. A partir de estos c atos concluyen que la reproducibilidad de la nueva prueba es de 100'7c . Una vez demostrada la reproducibilidad de la prueba, proceden a estudiar su discrimin.1cin diagnstica, para lo cual deben evaluar ?Ixito de la prueba (!n comparacin con la tlebografa. la prueba de oro o de referenci tradicional. Seguidamente, estudian 1 000 pacientes consecutivos con dolor de piem,s unilateral, 500de los cuales tuvieron tlcbografas positivas y 500, negativas. Los inv~tigadores clasifican a los individuos como positivos o negativos y presentan los datos cel siguiente modo:
PRUEBA NUEVA
Positiva
~ '-:
Negativa
'-: ==
En este ejemplo los investigadores usaron la clefinicin aceptada de sensibilidad, es decir, la proporon de individuos con resultados pllSitivos en la prueba de referencia que tienen resultados positivos en la nueva prueba. Ce esta manera,
~ ~ i
Sensibilidad =
450
=
500
0,90
90% ~
Tambin uS.lron la definicin aceptada de espt'cificidad, es decir, la proporcin de individuos negativos a la prueba d~ referencia qul! tienen resultados
135
negativos en la nueva prueba. De este modo, Especificidad = 400 500
0,80
80%
Asimismo, calcularon el valor predictivo de una prueba po:iitiva para su grupo de estudio. La definicin aceptada del valor predictivo de un resutado positivo es la proporcin de individuos con resultados positivos en la nueva pruebil que realmente tienen la enfermedad medida con la prueba de oro. De esta manera,
Sobre la base de estos resultados, siguientes conclusiones:
los investigadores
llegaron
a las
I. 2. 3.
La nueva prueba es totalmente reproducible. La nueva prueba es menos sensible y menos especficaque la flebograa y por eso, es una prueba intrnsecamente inferior. Cuando se aplica a un nuevo grupo de pacientes, por ejemplo, a un grupc con dolor de piernas bilateral, se puede esperar que el valor predictivo de un n'sultado positivo con la nueva prueba sea igual a 81,8%. EJEROCIO No.3
CR1lCA:
"' ::Q ::
~ ~
~ "' ~
'-J :) ~ "' -' .)
~ :) "5 ::J ~ ..J ~ ::J ~ ~ "5 ::J -'I
Cuando una prueba se aplica varias vecesa los mismos indivi<luos y en las mismas condiciones, el mtodo para valorar su reproducibilidad exige qu.~los resultados de cada individuo sean prcticamente idnticos si la prueba tiene una reproducibilidad de lOO'7c. Los autores declararon que el total de nuevas pruebas posilivas fue idntico cuando se repitieron. Sin embargo, no indicaron si los mismos indi\'i(luos que fueron positivos cuando se repiti la prueba tambin fueron positivos la prir:1era vez. Si los mismos individuos no fueron positivos, la prueba no puede considerars~ reproducible. Los autores tampoco indicaron si los que realizaron e interpretaron 10; resultados de las pruebas repetidas conocan los resultados de la primera prueba. Una prueba de oro es la medida generalmente aceptadade un enfem1edad contra la cual se comparan las pruebas nuevas o todava no probadas, Fero, de hecho, no siempre es una medida ideal de la enfem1edad para ~'Uyodiagnstic) ha sido diseada. Una prueba usada como prueba de oro puede considerarse diagn:;tica 5010por tradicil)n o por aceptacin generalizada de su utilid.1d. No obstante, \!Spo';ible que una nu\!va prueba sea una medida mjs til de la ~nfermedad que la aceptada cl)mo referencia. Al comparar la sensibilidad y la especificidad de nuevas pruebas con la de oro debemos ser conscientes de que las discr~pancias entre las pruebas puEden ser resultado de la imperfeccin de la prueba de referencia y no de la deficienci,! de la nueva prueba.
Cuando los autores concluyeron que la nueva prueba era menos sensible y especfica que la flebografa, estaban suponiendo que esta tiene una sensibilidad y L'Sperifidd.ld de 10090. Basndose en esta suposidn, L'Simposible que la nleva prueba tenga una sensibilidad y especificidad ms altas que la antigua. Si no estalnos seguros de que la tleb<.>grafia siempre es correcta, es prematuro concluir que la nueva prueba es menos til para diagnosticar 1.1 trombotlebitis. Por lo tanto, los autores de:>ie-
J6
-.
ron haber limitado sus conclusiones sobre la sensibilidad y la espelificidad de la nueva prueba a una comparacin con la flebografa. Si la nueva prueba fuese ms segura, barata o prctica que la flebografa, podra llegar a reemplazar a la flebc)grafa en la prctica clnica. A la larga, la experiencia clnica podra demostrar que es lo )uficientemente fiable para ser utilizada como prueba de oro. Mientras tanto, lo mejor que se puede esperar de la prueba es que iguale a la prueba de referencia establecida 1ue, por definicin, tiene una sensibilidad y especificidad de 100% . Los autores midieron correctamente la sensibilidad, la especificidad y el valor predictivo de una prueba positiva en su grupo de t~studio. Como afirmaron, el valor predictivo de una prueba positiva es la proporcin de los positivos a la nueva prueba que realmente tienen la enfermedad medida segn ~I criterio de oro. En este grupo de estudio, la prevalencia de tromboflebitis fue de 50% 500 con tromboflebitis y 500 sin la enfermedad) y, por consiguiente, el valor predictivc de la prueba es 450 dividido por 550, lo que t.'quivalea 81,8%.Sin embargo, el valor predi:tivo de una prueba es diferente en distintos grupos de pacientes, dependiendo de la prevalencia o probabilidad de la enfermedad anterior a la prueba en el grupo estudiado. No se puede extrapolar directamente un \-alor predicti\'Oobtenido en un grupo de pa jentes a otro grupo en el cual la prevalencia de la enfermedad es distinta. Es de espercr que un grupo de pacientes con dolor de piernas unilateral tenga una prevalencia de tromboflebitis distinta de otro grupo con dolor bilateral. Los valores predictivos del dolor de piernas bil,teral no se pueden estimar basndose nicamente en la sensibilidad y la especificidati que la prueba ha demostrado en los pacientescon dolor unilateral. Sin embargo, si se I>uedeestimar tambin el porcentaje de individuos con dolor de piernas bilateral que F'adecentromboflebitis, entonces es posible estimar los valores predictivos de una prueba en estos pacientes. Supongamos que la prevalenciade tromboflebitis es mucho ms I::ajaen los pacientes con dolor de piernas bilateral. Entonces sera de esperar que una nu( va prueba positiva tuviera un valor predictivo positivo mucho ms bajo que en un gruFo de pacientescon dolor unilateral. Rccuerdc que, desde el punto de vista clnico, la prevalena es lo mismo que la prob.1bilidad de p.1decerla enfermedad antes de realiz:lr la prueba, y quP el valor predictivo de una prueba positi.. es la probabilidad de pacecerla despus de obtener un resultado positivo. Dado que la probabilidad de la troml: oflebitis en un paciente que presenta dolor bilateral es menos de 5O0/c probabilidad de la enfermedad ,la incluso despus de un resultado positivo sera mucho menos de 81,1% .
E :: ~ ~ ~
5 :: ~ ~ -J
,:,j o u u ~ '-1 ::i'
1,7

Como Estudiar Un Estudio y Probar Una Prueba - La Prueba de Una Prueba

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Como Estudiar Un Estudio y Probar Una Prueba - La Prueba de Una Prueba

Uploaded by

Copyright:

Available Formats

CAPTULO 13

A LA PRUEBA DE {JNA PRUEBA

~ ~ -;: '2:. ~ -;: E ~ ~ .'5 -;: '2:. ~ 8 ~ ~ ~

FIGURA13-1. Condicionesnecesarias de una prueba diagnOsticaperfecta

~ ~ ~ ~ :: ~ ~ :o :) ~ ;:) " :5 ;"'

Inter';21O varaconde iOS ce su;etos la ertelr:'ecad SIn I I

!rtervalc \-anac:n los de de sujetos la entelmedad con

FIGURA 13-3. Marco uniforme de la prueba de una prueba

;... (J) '-J '"' -' ~ '::) c..)

..;: :r. ~ ..;: ~ ~ ~

(; '"' ~ ':J '..I

Los valores del intervalo forma que se detalla a continua\.;n:

de lo normal se pue,jen construir

realiza la prueba de inters en todos los individuos

del gru :>ode ; ""' ~

'oJ '-' ~ -o '...J

-:: ~ ;.o ::J ~ ~

ter al aplicar incorrectamente

Presin intraocular (mmHg)

~ < ~ z :j :..I ~ o ..J ~ ~ :. ... ?; -J :..I

't: :c '.J :J ~ 't:

... ':J '::) ~ .,... .'-'

E, p"sible que esto nI) ,;~a t!strictam~ntl'l"l~rto. 12

~n l'Stadi,1S iniciales de la, 'nfermt!y e,pt.'Cifi.: dad dis-

rRll::BA DE ORO E:\FER.\IOS

PRUEBA ORO DE SA;\.:a; b = Nmero de individuos sanos y posii\'Os

sanos y negc tivos

a + c = Total de individuos enfermos

b + d = Total de individuos sanos

aplican las definiciones

PRUEBA EN ESfU DIO

PRUEBA DE ORO EI"JFER.\1OS

PRUEBA DE ORO SANOS

't z :J ::.: 't ~ ~ ::.: ~

PRUEBA E)I; ESTUDIO

PRUEBA DE ORO ENFER.\IOS

PRUEBA DE ORO SANOS

Ahora se pueden calcular la sensibilidad

PRUEBA DE ORO tI\fER.\IOS

PRUEBA DE ORO SAlI;CtS

~ "2; ~ ~ ~ "2; ~ ~ '..J 9

Ahora podemos construir

DE 10% PRUEBA DE ORO SAX..;OS

PRUEBA DE ORO ENFERr.IOS

PRUEBA DE ORO ENFER.'-1OS

VALOR PREDICfIVO DE LAS PRUEBAS POSmvAS y NEGATIVAS

PRUEBA DE ORO SA:-.;OS

Para calcular el valor predictivo

Valor predictivo de una prueba positiva

Empleando el mismo mtodo, los otros valofl's predictivos son:

anterior a la prueba de 50%

d e una prue b a negatIva .d

Probabilidad Valor predictivo

anterior a la prueba de 10% positiva = a = T~ = 47,1%

~ ~ :5 r:5 ~ !,/) "'"' ... z "" s ~ z "'"' ... o ~ z ~ ~ u !,/) '5

10% 47;1% 97,6%

50% 88,9% 8!,8% 98,6.. 33,3~ ~,

-I: 5 ~ "' ~ ~ ~ -I: ~ :) ~ ::00 >::J Q 2 .I\ '""' ~

~ ~ ~ ~ :3 ~ ~ ~ ;.. ~ -' ~ '4J "Z; :3 ~ ~ a :3 '!JI '.J ~ ~ \.J

LA PRUEBA DE UNA PRUEBA

zar los principios 1.

La siguiente lista de preguntas de comprobacin necesarios para probar una prueba.

Propiedades intrnsecas de una prueba. a. Reproducibilidad: producen resultados