Professional Documents
Culture Documents
INTRODUCCIÓN
AL ANÁLISIS DE DATOS
EN META-ANÁLISIS
INTRODUCCIÓN
AL ANÁLISIS
DE DATOS
EN META-ANÁLISIS
E-mail: ediciones@diazdesantos.es
Internet: http://www.diazdesantos.es
ISBN: 978-84-7978-489-8
Depósito legal: M. 27.004-2001
E.L.M.
A.P.M.
Primera Parte
PERSPECTIVA GENERAL
DEL META-ANÁLISIS
1. Manejo de la información
Introducción ................................................................................ 3
El Meta-Análisis y otras técnicas alternativas............................... 5
Cómo manejar la explosión de información ................................. 6
Selección de trabajos y criterios de calidad.................................. 8
Estimación del número de estudios no publicados....................... 9
2. Elementos básicos de Estadística
Medidas de efecto en tablas de dos por dos................................ 11
Diferencia de riesgos, riesgo relativo, odds ratio .......................... 12
Influencia del diseño ................................................................... 14
Intervalos de confianza y significación......................................... 16
Segunda Parte
PERSPECTIVA GENERAL
DEL META-ANÁLISIS
Introducción
Si ordenásemos por importancia creciente los tipos de estudios y pro-
cedimientos en relación a la cantidad de evidencia aportada para la
demostración de una hipótesis científica dentro de los campos de la bio-
medicina, probablemente obtendríamos una relación como la de la
siguiente Tabla 1.1:
Homogeneidad de trabajos
Una condición fundamental que deben cumplir diferentes trabajos
integrados en un Meta-Análisis es que sean comparables. Esto implica
que en la fase de recogida de información se impongan unas restricciones
sobre determinadas características de los trabajos. A continuación se
comentan las más relevantes.
Fuentes de información: identificar y restringir los trabajos solamente
referenciados en fuentes contrastadas. Generalmente se acude a bases de
datos como Medline, Excerpta Médica, etc. Estas fuentes de información
garantizan mínimamente la calidad de las publicaciones.
Países e idiomas: se asume, aunque no es mantenible en muchos casos,
que la calidad de los trabajos está relacionada con el país de origen o el
idioma publicado. Esta regla admite muchos falsos positivos y negativos.
Periodo de publicación: se supone que a mayor intervalo entre los
tiempos de publicación menos homogéneos son dos trabajos.
Entidad Clínica: definición exhaustiva de los marcos clínicos o pato-
lógicos en los que se está interesado. P. ej., DMNID (tipo II).
Población: marco en el que se está interesado y en donde se quieren
generalizar las conclusiones, haciendo especial énfasis en los factores
pronóstico y en los tratamientos. P. ej., la población podría ser de adultos
recién diagnosticados; los factores pronóstico, retinopatía y nefropatía; y
los tratamientos, biguanidas versus una dieta.
Variables de eficacia, end points y medida de efecto: en primer lugar,
hay que precisar la característica sobre la que nos estamos fijando, esa
sería la variable de eficacia (p. ej.: glucemia); a continuación definiría-
mos la escala de dicha variable y cuál es nuestra medida principal de efi-
cacia (p. ej.: mg/dl<110); y por último, cómo resumimos la importancia
de los tratamientos a partir de una medida de efecto (que podría ser, p.
ej.: el porcentaje de diabéticos controlados).
más publicados: los estudios significativos, los que dan grandes diferen-
cias de efecto, los estudios no randomizados, los no comparativos, los
definitivos y los no patrocinados.
Se puede estimar la cantidad de estudios no publicados si asumimos
la hipótesis de no diferencia entre los tratamientos.
Diferencia de riesgos, DR
Es el diferencial de las probabilidades de enfermedad. La expresión
para su cálculo y su aplicación a los datos anteriores es:
Riesgo relativo, RR
Es una medida relativa de efecto, puesto que cuantifica el riesgo (pro-
babilidad de enfermedad) de los expuestos en relación a los no expues-
tos. La expresión para su cálculo y su aplicación a los datos anteriores es:
Odds ratio, OR
La traducción al castellano no está unificada, aunque se suele utilizar
el término de razón de productos cruzados. Es una medida de efecto de
difícil conceptualización, ya que es una razón de «odds». Un «odds» pro-
viene de una proporción y se define como el cociente entre una propor-
ción y su complementario. La expresión para su cálculo y su aplicación a
los datos anteriores es:
Estudios prospectivos
Se plantea estudiar si el tamaño de las cohortes si y s2 influye en las
medidas de efecto. El investigador tiene control sobre el tamaño relativo
de los individuos expuestos en relación a los no expuestos. En este ejer-
cicio de simulación se mantienen las mismas probabilidades de enferme-
dad en las cohortes. Se realizan tres simulaciones y a continuación se
presentan los valores de las tres medidas de efecto. En ellas se observa
que las medidas de efecto son invariables (estables) con respecto a los
tamaños de las cohortes.
Estudios retrospectivos
Manteniendo los mismos datos numéricos que en el ejemplo ficticio
anterior, se presentan los resultados de un estudio retrospectivo, en la
Tabla 2.2, en donde a partir de los historiales de los individuos que han
desarrollado o no la enfermedad r1 y r2, se establece si han estado some-
tidos a la influencia del factor de riesgo, valores de a y c. Se plantea estu-
diar si el tamaño de los grupos de individuos enfermos y sanos r1 y r2
influye en las medidas de efecto. El investigador tiene control sobre el
tamaño relativo de estos grupos. En este ejercicio de simulación se man-
tienen unas mismas probabilidades de enfermedad para los individuos
expuestos y no expuestos, puesto que la influencia del factor debe perma-
necer invariable. Se realizan tres simulaciones y a continuación se pre-
sentan los valores de las tres medidas de efecto. En ellas se observa que
el odds ratio invariante es la única medida de efecto que permanece inva-
riante con los cambios relativos de tamaños de los grupos estudiados.
Paradoja de Simpson
Supongamos dos estudios con los siguientes resultados y su significa-
ción:
Método logit
En un conjunto de estudios, y asumiendo que todos ellos cumplen
unos estándares mínimos de calidad para incluirse en el Meta-Análisis,
se establece un peso o ponderación objetiva para cada uno de ellos. La
expresión del peso o ponderación objetiva para cada estudio es:
Representación gráfica
Si reconsideramos todo el proceso desarrollado hasta ahora, básica-
mente tenemos unas medidas de efecto de los estudios individuales, un
intervalo de confianza asociado, una medida de efecto global, sus inter-
valos de confianza y su significación. Esta información se puede repre-
sentar gráficamente según se observa en la Figura 3.1.
DESARROLLO TEÓRICO
DE LAS MEDIDAS DE EFECTO
Proporción
Una proporción p se puede interpretar como la media X de una varia-
ble aleatoria X que toma dos valores (dicotómica) 1 y 0; el valor 1 lo
toma con probabilidad n y el valor 0 con probabilidad 1 - π. Se suele
denotar como 1 el suceso de mayor interés y 0 al otro. Por ejemplo, es
una práctica habitual denotar por 1 a la categoría «Enfermo» (Enf.) y 0 a
la categoría «Sano» (Sano). En este contexto, a la probabilidad de estar
enfermo π = Prob (Enf.) se la conoce como «prevalencia de enfermedad».
Si representamos por E[ ] a la esperanza o valor medio de una varia-
ble aleatoria y a V[ ] a la varianza, se tiene que, para dicha variable dico-
tómica X:
Intervalo confidencial
La estimación puntual de un parámetro consiste en dar un único valor
como candidato a la estimación del parámetro poblacional. En la estima-
ción por intervalos de confianza se da un conjunto de valores posibles
(intervalo) para dicho parámetro poblacional. El proceso consiste en bus-
car un estadístico muestral que sea un estimador «centrado» o no sesga-
do, y cuya distribución siga una función teórica de probabilidad conoci-
da, siendo deseable que sea una Normal (0,1). A partir de la varianza del
estadístico descriptivo y de la función de probabilidad asociada se deter-
mina la anchura del intervalo confidencial. El proceso anterior aplicado a
una proporción poblacional se concreta a continuación.
Estadístico de Contraste
La estimación por intervalos de confianza permite generalizar las
conclusiones de las muestras a las poblaciones correspondientes. Sin
embargo, no ayudan a tomar decisiones. Las pruebas estadísticas o de
contraste de hipótesis permiten tomar decisiones entre una hipótesis
nula y una hipótesis alternativa. Las pruebas estadísticas utilizan los lla-
mados estadísticos de contraste, que se calculan a partir de la informa-
ción de la muestra y que nos ayudan a decidir entre una u otra hipótesis.
En el caso de una proporción se suele utilizar el estadístico de contraste
z de Fisher.
Estadístico z
Ejemplo 1
Resolución
Intervalo confidencial
El candidato natural para estimar el odds poblacional de una propor-
ción es el odds muestral; sin embargo, el odds muestral de una proporción
es asimétrico, con rango (0, +∞), con distribución, por tanto, no normal. Se
hace necesario una transformación del odds muestral de una proporción
que consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una
distribución normal. La transformación habitual es considerar logaritmos
neperianos, y definir el logit, que viene dado por:
Demostración:
Para demostrar el teorema anterior se desarrolla f(x) en serie de Tay-
lor alrededor de la media de la variable x, E[x], utilizando la primera y la
segunda derivada de f (f’ y f’’ respectivamente). Para una observación
cualquiera:
se verifica,
y se tiene que:
Estadístico de contraste
Al igual que en el caso de una proporción se suele utilizar el estadísti-
co de contraste z de Fisher.
Estadístico z
Ejemplo 2
Resolución
Diseños prospectivos
Diseños retrospectivos
Diferencia de proporciones
En estudios prospectivos, la diferencia de proporciones se puede
interpretar como diferencias de riesgos, y vendría dada por:
Propiedades
Intervalo confidencial
En estudios prospectivos el intervalo confidencial de la diferencia de
proporciones se calcula del siguiente modo:
Estadístico de contraste
Los estadísticos de contraste que se suelen utilizar en el caso de dos
proporciones son: el estadístico χ2P de Pearson y el estadístico z de Fisher.
Propiedades
Demostración (2):
Por tanto:
Estadístico z
contraste z es:
Propiedades
3) Tanto en estudios prospectivos como retrospectivos
Demostración (3):
En estudios prospectivos:
En estudios retrospectivos:
Ejemplo 3
Se pretende estudiar si un factor de exposición está relacionado con
una determinada enfermedad. Se supone que se toman 29 individuos
expuestos y 47 no expuestos. Al cabo de un cierto tiempo, se observa si
han desarrollado o no la enfermedad en estudio. Se supone que desarro-
llaron la enfermedad 21 de los 29 expuestos y 16 de los 47 no expuestos.
Se trata de determinar el estimado puntual de la diferencia de proporcio-
nes (diferencia de riesgos), su intervalo confidencial y contrastar si su
Resolución
Riesgo relativo
El riesgo relativo φ se define como el cociente entre la probabilidad
de enfermo en los expuestos Prob. (Enf. |Exp. +) y la probabilidad de
enfermo en los no expuestos Prob. (Enf. |Exp. -):
Intervalo confidencial
El riesgo relativo φ es asimétrico, con rango (0, +∞), por lo que su
distribución es no normal. Se hace necesaria una transformación de éste
que consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una
distribución normal. La transformación habitual es considerar logaritmos
neperianos. Para el cálculo del intervalo confidencial del Ln(RR) se nece-
sita calcular E[LnRR], V[LnRR] y EE[LnRR]. Estos cálculos se basan en
la aplicación del resultado de Taylor a la transformación neperiano de
una proporción, vista en el capítulo anterior:
Estadístico de contraste
Ejemplo 4
Se trata de calcular para los datos del Ejemplo 2 el estimado puntual
del riesgo relativo, su intervalo confidencial y contrastar si su valor es de
uno.
Resolución
Odds ratio
En el capítulo anterior se introdujo la definición de odds de una pro-
porción como el cociente de probabilidades complementarias y se veía
por ejemplo el odds de enfermedad como el cociente entre la probabili-
dad de estar enfermo y la probabilidad de estar sano. Dichas probabilida-
des no incorporaban información «extra» de ninguna otra variable, eran
probabilidades sin condicionar. Esta definición de odds de una probabili-
dad se puede extender a probabilidades condicionadas. Así, se puede
hablar del odds de enfermedad en los individuos expuestos (Exp. +),
denotado por ΩExp+ ,con:
y por tanto:
Propiedades
Con lo que si, por ejemplo, el odds ratio es mayor que uno, la proba-
bilidad de enfermo en los expuestos es mayor que la probabilidad de
enfermo en los no expuestos (factor de riesgo)
11) Si se define
Demostración (4):
Utilizando el Teorema de Bayes para probabilidades condicionadas,
se tiene que:
Por tanto:
Demostración (5):
Por tanto,
Demostración (6):
Utilizando que:
Demostración (7):
Demostración (8):
Demostración (9):
Demostración (10):
En enfermedades «raras»: Prob. (Enf. |Exp. +) y Prob. (Enf. |Exp. -)
serán pequeños y utilizando P5 se tiene el resultado .'.
Demostración (11):
Demostración (12):
Demostración (13):
Se toman s1 y s2 cualesquiera (la solución no será única, habrá varias
soluciones), el «a» que buscamos pertenece a una tabla de la forma:
(II)
En (II) despejamos
(I)
(II)
Intervalo confidencial
El odds ratio w es asimétrico, con rango (0, +∞), por lo que su distri-
bución es no normal. Se hace necesario una transformación de éste que
consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una dis-
tribución normal. La transformación habitual es considerar logaritmos
neperianos. Para el cálculo del intervalo confidencial del Ln(OR) se
necesita calcular la E[LnOR], V[LnOR], EE[LnOR]. Estos cálculos se
basan en la aplicación del resultado de Taylor a la transformación nepe-
riano de una proporción, visto en el capítulo anterior:
Estadístico de contraste
Para contrastar Ho: w = 1, dado que w = l<=>φ = l, se tiene que son
válidos los mismos estadísticos de contraste utilizados con el riesgo rela-
tivo, y por tanto, los mismos que los utilizados para diferencias de pro-
porciones: χ2p de Pearson y z de Fisher.
Ejemplo 5
Se trata de calcular para los datos del Ejemplo 2 el estimado puntual
del odds ratio, su intervalo confidencial y contrastar si su valor es de
uno.
Resolución
Diseños prospectivos
Diseños retrospectivos
siendo:
siendo:
Intervalo confidencial
En estudios prospectivos el intervalo confidencial de p1L - p2L se cal-
cula del siguiente modo:
Estadístico de contraste
Los estadísticos de contraste que se suelen utilizar en el caso de com-
binación de distintas diferencias de proporciones son: el estadístico χ 2MH de
Mantel-Haenszel, el χ 2C de Cochran, el z de Fisher y el QA logit de asociación.
Propiedades
Demostración (14):
Demostración (15):
Propiedades
Demostración (16):
Estadístico z
Propiedades
Demostración (17):
En lo referente al numerador:
Ejemplo 6
Se supone que existen tres estudios realizados en los que se consi-
deran individuos expuestos y no expuestos a un factor de riesgo y que
se les observa un cierto tiempo para ver si desarrollan cierta enferme-
dad. Los resultados experimentales se resumen en las siguientes tres
tablas:
Resolución
Propiedades
Demostración (18):
Intervalo confidencial
El estimador conjunto de Mantel-Haenszel para el riesgo relativo
RRMH es asimétrico, con rango (0, +∞), por lo que su distribución es no
«normal». Para solucionar este inconveniente se consideran neperianos.
Para el cálculo del intervalo confidencial del LnRRMH se necesita calcu-
lar E[LnRRMH], V[LnRRMH] y EE[LnRRMH], que vienen dados por:
Propiedades
Demostración (19):
Estadístico de contraste
El estadístico de contraste que se suele utilizar en el caso de combina-
ción de distintos riesgos relativos por el método de Mantel-Haenszel es
el estadístico de χ2MH de Mantel-Haenszel.
Ejemplo 7
Se trata de aplicar la metodología Mantel-Haenszel a los datos del
Ejemplo 6 para el cálculo del estimado puntual conjunto del riesgo
relativo, su intervalo confidencial y contrastar si su valor puede ser
uno.
Resolución
con:
Intervalo confidencial
El estimador conjunto Logit para el riesgo relativo RRL es asimétrico,
con rango (0, +∞), por lo que su distribución es no normal. Para solucio-
nar este inconveniente se consideran neperianos. Para el cálculo del
intervalo confidencial del LnRRL se necesita calcular E[LnRRL],
V[LnRRL] y EE[LnRRL], que vienen dados por:
Propiedades
Demostración (20):
Estadístico de contraste
El estadístico de contraste que se suele utilizar en el caso de combina-
ción de distintos riesgos relativos por el método logit es el estadístico QA
logit de asociación.
Ejemplo 8
Se trata de aplicar la metodología logit a los datos del Ejemplo 6 para
el cálculo del estimado puntual conjunto del riesgo relativo, su intervalo
confidencial y contrastar si su valor puede ser uno.
Resolución
Propiedades
Demostración (21):
Demostración (22):
Demostración (23):
Intervalo confidencial
El estimador conjunto de Mantel-Haenszel para el odds ratio ORMH es
asimétrico, con rango (0, +∞), por lo que su distribución es no normal.
Para solucionar este inconveniente se consideran neperianos. Para el cál-
culo del intervalo confidencial del LnORMH se necesita calcular
E[LnORMH], V[LnORMH] y EE[LnORMH], que vienen dados por:
Propiedades
Demostración (24):
Demostración (25):
Estadístico de contraste
El estadístico de contraste que se suele utilizar en el caso de combina-
ción de distintos odds ratio por el método de Mantel-Haenszel es el esta-
dístico χ2MH de Mantel-Haenszel.
Propiedades
Demostración (26):
Ejemplo 9
Se trata de aplicar la metodología Mantel-Haenszel a los datos del
Ejemplo 6 para el cálculo del estimado puntual conjunto del odds ratio,
su intervalo confidencial y contrastar si su valor puede ser uno.
Resolución
Intervalo confidencial
El estimador conjunto logit para el odds ratio ORL es asimétrico, con
rango (0, +∞), por lo que su distribución es no normal. Para solucionar
este inconveniente se consideran neperianos. Para el cálculo del intervalo
confidencial del LnORL se necesita calcular E[LnORL], V[LnORL],
EE[LnORL], que vienen dados por:
Propiedades
Demostración (27):
Estadístico de contraste
El estadístico de contraste que se suele utilizar en el caso de combina-
ción de distintos odds ratios por el método logit es el estadístico QA logit
de asociación.
Ejemplo 10
Se trata de aplicar la metodología logit a los datos del Ejemplo 6 para
el cálculo del estimado puntual conjunto del odds ratio, su intervalo con-
fidencial y contrastar si su valor puede ser uno.
Resolución
Intervalo confidencial
El estimador conjunto logit da una medida global del efecto y verifi-
Estadístico de contraste
El estadístico de contraste que se emplea en la metodología logit es el
estadístico QA logit de asociación.
Concepto de homogeneidad
A la hora de combinar información de distintos estudios se tiene que
verificar que esta información es relativamente homogénea o no hetero-
génea.
Estadístico de contraste
El estadístico de contraste que se emplea en la metodología logit
para contrastar la homogeneidad es el estadístico QH logit de homoge-
neidad.
Propiedades
Demostración (28):
Demostración (29):
Propiedades
Para que
y por tanto
Intervalo confidencial
El estimador conjunto logit en Modelos de Efectos Aleatorios verifi-
Estadístico de contraste
El estadístico de contraste que se emplea en la metodología logit para
ver la asociación es el estadístico QA logit de asociación y el estadístico
para contrastar la homogeneidad es el estadístico QH logit de homoge-
neidad.
Chalmers TC, Lau J. Changes in clinical trials mandated by the advent of Meta-
Analysis. Statistics in Medicine 1996; Vol. 15, 1263-1268.
Fleiss JL. Statistical methods for rates and proportions. New York, John Wiley
and Sons, 1981; Capítulo 10.
Lau J, Chalmers TC. The rational use of therapeutic drugs in the 21st century.
Int J Tech Ass Health Care 1995; 11(3): 509-522.
115
Administración, 5 ECCA, 4
Anchura, 34 Efectos,
Asimétrico, 55 aleatorios, 105
fijos, 105
Ensayo clínico, 4
Bayes, teorema de, 59 Error estándar, 35
Esperanza, 34
Estables, 14
Calidad científica, 8
Estadística descriptiva, 11
Cantidad de estudios no publicados, 10
Estadístico de contraste asociado, 34
Cantidad de información, 6
Estimación puntual, 11, 35
Centrado, 34
Estimador conjunto logit, 106
Chi-cuadrado, 28
Estudios
de asociación, 28
de homogeneidad, 28 no publicados, cantidad de, 10
Cochran, 74 prospectivos, 14
Cochrane, iniciativa, 7 retrospectivos, 14
Combinación, 7 Evidencia, 3
Confianza, 35 Evolución, 6
Consenso, 5
Contraste de hipótesis, 36 Factores de exposición, 11
Correlación, 4 FEM.30, 110
Crudos, 20 Fisher, 36
Frecuencias,
esperadas, 49
Datos pareados, 91 observadas, 49
Decisiones, 36 Fuentes de información, 9
Dicotómico, 34
Diferencia Generalizar, 36
de proporciones, 47 Grado de libertad, 75
de riesgos, 12, 54 Gráficas, 23
logit, 71
Diseños, 15 Heterogeneidad, 23
prospectivos, 45, 69 Hipótesis, 3
retrospectivos, 45, 70 Homogeneidad, 24
DR, 12 de trabajos, 8
117