Introducción Al Análisis de Datos en Meta-Análisis - Emilio Letón, Alejandro Pedromingo

Estadísticos e-Books & Papers
INTRODUCCIÓN
AL ANÁLISIS DE DATOS
EN META-ANÁLISIS

Emilio Letón Molina
Alejandro Pedromingo Marino
INTRODUCCIÓN
AL ANÁLISIS
DE DATOS
EN META-ANÁLISIS

© Emilio Letón Molina, Alejandro Pedromingo Marino, 2001
www.e-biometria.com
Reservados todos los derechos.
«No está permitida la reproducción total o parcial de este libro,

ni su tratamiento informático, ni la transmisión de ninguna
forma o por cualquier medio, ya sea electrónico, mecánico
por fotocopia, por registro u otros métodos, sin el permiso
previo y por escrito de los titulares del Copyright.»
Ediciones Díaz de Santos, S. A.

Juan Bravo, 3-A
28006 Madrid (España)
E-mail: ediciones@diazdesantos.es
Internet: http://www.diazdesantos.es
ISBN: 978-84-7978-489-8
Depósito legal: M. 27.004-2001
Diseño de cubierta: Ángel Calvete

Fotocomposición: Fer, S. A.
Impresión: Edigrafos, S. A.
Encuademación: Rústica-Hilo, S. L.

Acerca de los autores
Emilio Letón Molina

Licenciado en Ciencias Matemáticas en la Universidad Complutense de
Madrid (UCM). Ha realizado el Programa de Doctorado en Matemáticas en el
Dpto. de Estadística e Investigación Operativa (UCM). Colabora en proyectos
de investigación de la Sección de Bioestadística en Medicina (UCM) en el
Área de Análisis de Supervivencia; los resultados de estas investigaciones se
han publicado en «Communications in Statistics: Theory and Methods».
Es coautor de otros tres libros de estadística y cuatro programas infor-
máticos estadísticos. Participa con asiduidad como ponente en cursos,
seminarios y programas de doctorado en materias relacionadas con la Bio-
estadística y el Diseño de Estudios.
Ha trabajado en departamentos de Planificación y Estadística dentro del
Sector Banca y de la Industria Farmacéutica, adquiriendo una amplia expe-
riencia en la aplicación de métodos estadísticos. En la actualidad desarrolla
su labor profesional en el Departamento de Biometría de GlaxoSmithKline.
Alejandro Pedromingo Marino

Especialista en Estadística y Máster en Estadística Matemática por el Insti-
tuto de Estadística e LO. de la Univ. Complutense de Madrid. Ha desarro-
llado su actividad profesional durante más de 24 años en departamentos de
I+D en la industria farmacéutica. Es coautor de otros tres libros de estadís-
tica y cuatro programas informáticos estadísticos públicos. Tiene publicado
más de 185 artículos y comunicaciones científicas.
Ha colaborado con diferentes instituciones científicas e impartido más
de 200 cursos y seminarios sobre diversos temas de bioestadística aplicada
a la investigación de las ciencias biomédicas.
Actualmente responsable del Departamento de Biometría de Glaxo-
SmithKline en el Centro de Investigación en Tres Cantos (Madrid).

A mis padres Adela y Juan
E.L.M.
A mis padres Pilar y Alejandro
A.P.M.

Contenido
Acerca de los autores......................................................................... VIl

Agradecimientos ................................................................................ XIII
Presentación...................................................................................... XV
Primera Parte
PERSPECTIVA GENERAL
DEL META-ANÁLISIS
1. Manejo de la información
Introducción ................................................................................ 3
El Meta-Análisis y otras técnicas alternativas............................... 5
Cómo manejar la explosión de información ................................. 6
Selección de trabajos y criterios de calidad.................................. 8
Estimación del número de estudios no publicados....................... 9
2. Elementos básicos de Estadística
Medidas de efecto en tablas de dos por dos................................ 11
Diferencia de riesgos, riesgo relativo, odds ratio .......................... 12
Influencia del diseño ................................................................... 14
Intervalos de confianza y significación......................................... 16
3. Combinación de resultados de varios estudios

Trampas y aproximaciones erróneas........................................... 20
Método logit ................................................................................ 21
4. Más allá de la evidencia

Teoría general del Meta-Análisis.................................................. 27
Modelos de efectos fijos y aleatorios........................................... 30

XII CONTENIDO
Segunda Parte
DESARROLLO TEÓRICO DE LAS MEDIDAS

DE EFECTO
5. En un estudio con una variable dicotómica
Proporción................................................................................... 34
Odds de una proporción .............................................................. 38
6. En un estudio de dos variables dicotómicas

Diferencia de proporciones ......................................................... 47
Riesgo relativo............................................................................. 54
Odds ratio ................................................................................... 57
7. Meta-Análisis con dos variables dicotómicas
Diferencia de proporciones logit................................................... 71
Riesgo relativo Mantel-Haenszel ................................................. 81
Riesgo relativo logit..................................................................... 86
Odds ratio Mantel-Haenszel ........................................................ 90
Odds ratio logit............................................................................ 100
8. Teoría General logit del Meta-Análisis

Generalización de medidas de efecto.......................................... 105
Concepto de homogeneidad ....................................................... 108
Modelos de efectos fijos y aleatorios........................................... 110
Bibliografía ....................................................................................... 115
Índice por palabras .......................................................................... 117

Agradecimientos
Queremos agradecer a todos los asistentes a nuestros cursos y semina-

rios de Meta-Análisis por sus valiosos comentarios y críticas que nos han
ayudado a saber lo que no sabíamos y a plantearnos preguntas que nunca
imaginamos.
También querríamos agradecer a los Laboratorios GlaxoSmithKline, en
donde trabajamos, las facilidades recibidas para innovar y aprender en
cualquier dirección y que han hecho posible la realización de este libro.

Presentación
En la actualidad, la comunidad científica se encuentra desbordada por

la enorme cantidad de información que se publica. El Meta-Análisis inten-
ta poner algo de orden ante tanta información, en cuanto a que integra y
combina los resultados de distintos estudios que responden a una misma
pregunta.
Este libro pretende servir de introducción a los que se enfrenten al
Meta-Análisis por primera vez, así como un texto medio-avanzado donde
se encuentren las bases estadísticas para aquellos que tengan algo de expe-
riencia y quieran profundizar en su conocimiento. Por eso, este libro está
dividido en dos partes complementarias, que pueden ser leídas de forma
independiente. En la primera parte se ofrece una visión general y completa
del Meta-Análisis sin hacer demasiado hincapié en temas estadísticos. En
la segunda parte se da una visión más teórica de las técnicas estadísticas
del Meta-Análisis, con ejemplos desarrollados completamente.
Esperamos que este libro acerque esta disciplina del Meta-Análisis a
todos los que lo lean.

Primera Parte
PERSPECTIVA GENERAL
DEL META-ANÁLISIS

1
Manejo de la información
Se define el Meta-Análisis como un conjunto de técnicas que permi-

ten la revisión y combinación de resultados de distintos estudios previos
para contestar una misma pregunta científica. Tradicionalmente, estas
técnicas empezaron a utilizarse en ciencias sociales y en agricultura
durante los años treinta y cincuenta. Cochran, en 1937, combina resulta-
dos de experimentos en agricultura y en 1954 publica un artículo referen-
cia en variables cuantitativas. Posteriormente se introdujeron en la com-
binación de ensayos clínicos, fundamentalmente para evaluar la eficacia
de tratamientos. Más tarde su empleo se ha generalizado en su aplicación
en estudios observacionales siendo muchas veces el objetivo la mejora de
políticas y tecnologías sanitarias.
El fin último del Meta-Análisis es la combinación de diferentes estu-
dios, siendo una auténtica alquimia estadística. Está entroncado en la dis-
ciplina de la Medicina Basada en la Evidencia como parte de «la última
estadística».
Introducción
Si ordenásemos por importancia creciente los tipos de estudios y pro-
cedimientos en relación a la cantidad de evidencia aportada para la
demostración de una hipótesis científica dentro de los campos de la bio-
medicina, probablemente obtendríamos una relación como la de la
siguiente Tabla 1.1:

4 INTRODUCCIÓN AL ANÁLISIS DE DATOS EN META-ANÁLISIS
Tabla 1.1: Estudios ordenados por cantidad de evidencia aportada
Se considera que el ensayo clínico comparativo y aleatorizado contie-

ne la mayor cantidad de evidencia aportada a la hora de probar un efecto.
Sin embargo, los ECCA no parecen suficientes para probar definitiva-
mente una hipótesis. Una razón fundamental podría ser la falta de poten-
cia debida a un tamaño insuficiente de la muestra para probar la hipótesis
alternativa. También encontramos que sobre las mismas hipótesis y obje-
tivos científicos se realizan estudios clínicos muy similares. La conse-
cuencia de esto es el hecho de que se obtengan resultados diferentes,
cuando no contradictorios.
El panorama se presenta repleto de ECCA asimilares, aportando en la
mayoría de los casos información redundante. Las variaciones encontra-
das entre los resultados y conclusiones de los ECCA hacen difícil su iden-
tificación de estudios definitivos y conclusivos alrededor de una única
hipótesis científica. Si esto ocurre con estudios experimentales, en condi-
ciones normalmente muy controladas, la situación, cuando nos referimos a
estudios observacionales o a la mera recopilación de casuística, es mucho
más dispersa y menos probable establecer conclusiones definitivas.
Esto ha ocurrido siempre. T. C. Chalmers, un médico general en los
EE UU en los años cincuenta y sesenta, y actualmente director asociado de
la Harvard School of Public Health, tomó conciencia de la gran cantidad de
información contradictoria, y a menudo imprecisa, en relación a la eficacia y
seguridad de numerosos tratamientos. Se encontraron dos posibles explica-
ciones: en primer lugar, la falta de rigor de la mayoría de los ensayos clínicos
de aquel tiempo, y en segundo lugar, la dificultad de asimilar e incorporar de
manera coherente y sistemática la información que se generaba. Chalmers se
dedicó al estudio en profundidad de la estadística y casualmente, mediante
un colega, estableció contacto con una nueva disciplina llamada Meta-Análi-
sis, en aquel tiempo empleada en ciencias sociales. Mediante estas técnicas
estudió la eficacia clínica de la lidocaína, medicamento ampliamente emple-
ado en cardiología y en medicina general, puesto que se suponía que era efi-
caz en la prevención de ataques cardiacos en pacientes previamente someti-
dos a una operación de corazón. Chalmers demostró la ausencia de
correlación entre la administración de lidocaína y la proporción de muestras
atribuibles a problemas cardiacos mediante técnicas de Meta-Análisis.

MANEJO DE LA INFORMACIÓN 5
Otro caso más reciente lo encontramos en el trabajo de Richard Peto,

codirector del Clinical Trial Service Unit en la Universidad de Oxford. Peto
llevó a cabo un Meta-Análisis con trabajos clínicos en donde se empleaba
la aspirina, así como otros antiplaquetarios, encontrando que la evidencia
conjunta de los estudios mostraban el efecto beneficioso de la aspirina en la
prevención de posteriores infartos de miocardio en pacientes que previa-
mente habían padecido alguno. La Administración americana aprobó su
recomendación en 1985, sin embargo el Meta-Análisis acumulativo de los
ensayos disponibles ordenados cronológicamente, mostró que ya desde
1976 había pruebas suficientes que probaban, sin lugar a dudas, este efecto.
Se calcula que si se hubiese instituido este tratamiento en esa fecha se
hubieran salvado de 10.000 a 20.000 vidas sólo en Estados Unidos.
Deberíamos, por tanto, añadir a la tabla anterior las técnicas de Meta-
Análisis como un avance más a la hora de acumular y potenciar eviden-
cia a favor o en contra de una hipótesis.
El Meta-Análisis y otras técnicas alternativas

El Meta-Análisis no es la única opción a la hora de combinar infor-
mación de diferentes fuentes. Otros métodos y sus características se pre-
sentan en la Tabla 1.2:
Tabla 1.2: Métodos para combinar información
Las revisiones de un experto sobre un tema son el método más em-

pleado actualmente para la puesta al día en cualquier tema científico.
Más complejo, pero más aceptado, es el procedimiento para lograr esta-
blecer el consenso entre expertos o definir líneas generales de actuación
refrendadas por instituciones u organismos competentes. La mayoría de
estos procedimientos tienen un gran componente subjetivo y la metodo-
logía de revisión está basada en habilidades cualitativas. Se requiere de
una gran capacidad de estudio y síntesis para integrar todos los aspectos
incluidos en información que proviene de diferentes fuentes y presentada
en diferentes formatos. No obstante, estos procedimientos son cercanos a

la manera natural de procesar e integrar información, y sin lugar a dudas,

se han utilizado y utilizarán en el futuro.
La aproximación subjetiva, la influencia de la formación y experiencia
previa de los revisores y la naturaleza cualitativa de estos métodos es, de
alguna manera, eliminada por los métodos de integración de información
cuantitativos: el Meta-Análisis. Este término fue acuñado por Glass en
1976 y desde los años noventa se ha venido popularizando cada vez más.
La dificultad de las técnicas matemáticas del Meta-Análisis no es muy
elevada en relación a la cantidad de información adicional que aportan.
Una variante muy atractiva es el Meta-Análisis acumulativo. Ésta es una
aproximación del Meta-Análisis en donde se combinan las ventajas de la
recopilación de información retrospectivamente con la de los estudios pros-
pectivos. Así, es posible determinar en qué momento la cantidad de eviden-
cia acumulada que va apareciendo a partir de estudios es significativa.
Cómo manejar la explosión de información

La cantidad de información disponible convierte la tarea de recopila-
ción de resultados en algo abrumador. Si nos referimos a la información
publicada, el aumento de revistas científicas y de biomedicina, y el de
artículos publicados, sigue un crecimiento exponencial. Se sabe que, en
la actualidad, se publican en el mundo más de 1 millón de trabajos anua-
les en este campo (¡1,9 trabajos por minuto!) provenientes de más de
25.000 publicaciones. Este panorama hace de la tarea de recopilación de
la información el aspecto más crítico de las técnicas combinatorias.
En la Tabla 1.3 se presenta la evolución de la información publicada
disponible sólo en publicaciones periódicas:
Tabla 1.3: Evolución de la información
Estas cantidades aumentan si contabilizamos la información disponi-

ble a partir de congresos, tesis doctorales, monografías y otras fuentes de
información escrita. Es imposible conocer la cantidad de ensayos clíni-
cos y estudios no publicados. Esto puede comprometer la fiabilidad de
las conclusiones de estas técnicas basadas en la recopilación. Éste es uno
de los principales argumentos en contra del Meta-Análisis. Más adelante

veremos algunos métodos para estimar el número de trabajos no publica-

dos y el control de los sesgos que ello implica.
Por definición, un Meta-Análisis nunca es un ejercicio concluyente.
La aportación de nuevo material relacionado con las hipótesis estudiadas
puede modificar conclusiones previas. La iniciativa Cochrane establece
unos programas para la recogida sistemática de información en los cam-
pos más importantes de la medicina. Estos programas están permanente-
mente abiertos a nuevas aportaciones. Entre las técnicas cuantitativas que
se utilizan, ocupa un lugar preeminente el Meta-Análisis, dentro de la
denominada Medicina Basada en la Evidencia.
En la realización de un Meta-Análisis se pueden identificar dos fases
bien diferenciadas y distintas:
1. Recogida de información relevante: a partir de los miles de artícu-
los disponibles directa o indirectamente relacionados con el objeti-
vo del estudio, hay que identificar el grupo de trabajos relevantes y
fiables que aporten evidencia en relación a los objetivos del estu-
dio. Un número adecuado y manejable de trabajos podría estar
entre tres y treinta.
2. Combinación de la información disponible: se realizan análisis
estadísticos de la información seleccionada. Estos análisis permi-
ten la combinación de resultados y generalmente presentan una
medida de efecto global, su intervalo de confianza y la significa-
ción estadística. Estas técnicas ayudan a la toma de decisiones de
manera similar a las técnicas estadísticas inferenciales.
Figura 1.1. Meta-Análisis: plan de acción.

La fase de recopilación de información no es exclusiva del Meta-Análi-

sis, puesto que también hay que pasar por ella cuando se realizan revisio-
nes o puestas al día, y es el material de base empleado por los paneles de
expertos o en las conferencias de consenso. Es en esta fase de recopilación
en donde se concentra la mayor inversión de recursos en comparación con
la relativamente cómoda fase de análisis. Puede llegar a prolongarse hasta
un año, con una duración media de seis meses. El análisis numérico, si uti-
lizamos ordenador, es relativamente inmediato: con la entrada de datos
incluida, la duración aproximada es de un día y el consumo de recursos es
mínimo. La información añadida, en términos de nueva evidencia a favor
de los objetivos del estudio es, en la fase numérica, comparativamente
grande en relación a la extenuante labor de la recogida de información.
Selección de trabajos y criterios de calidad

Éste es un libro enfocado fundamentalmente a los aspectos estadísti-
cos y numéricos del Meta-Análisis, sin embargo, comentaremos algunos
aspectos a tener en cuenta en la recogida de la información, que es sin
duda una tarea crítica, por cuanto que la elección de los datos de partida
condiciona más que ningún otro aspecto la fiabilidad de los resultados y
conclusiones. El análisis numérico de la información es incapaz de
detectar la posible baja calidad de los datos de partida.
Los aspectos clave de esta fase de un Meta-Análisis son: la calidad
científica de los datos y la homogeneidad de trabajos. Ambos aspectos
son cruciales y se comentan a continuación.
Calidad científica de los datos

Para certificación de la calidad intrínseca de los datos, fundamentalmente
en los ensayos clínicos, se han propuesto diferentes listas de chequeo basa-
das en el cumplimiento de las buenas prácticas clínicas. Estas listas recogen
información de los principales aspectos del ensayo que hacen referencia a la
aleatorización, consentimiento informado de los pacientes, enmascaramien-
to, conducción del estudio, alimentación de las bases de datos y análisis esta-
dísticos, etc. A partir de estas listas de chequeo se genera una puntuación
final que sirve de referente de calidad científica del trabajo. Un problema
derivado de estas listas es que certifican si, por ejemplo, se ha llevado a cabo
o no la aleatorización, pero no es posible certificar si la aleatorización se ha
llevado a cabo adecuadamente. Esto es, las listas recogen, fundamentalmen-
te, si se especifica que se cumplen las exigencias, pero no pueden certificar el

buen cumplimiento de las mismas. El problema de la calidad científica

mediante estas listas queda, por tanto, parcialmente sin resolver.
Homogeneidad de trabajos
Una condición fundamental que deben cumplir diferentes trabajos
integrados en un Meta-Análisis es que sean comparables. Esto implica
que en la fase de recogida de información se impongan unas restricciones
sobre determinadas características de los trabajos. A continuación se
comentan las más relevantes.
Fuentes de información: identificar y restringir los trabajos solamente
referenciados en fuentes contrastadas. Generalmente se acude a bases de
datos como Medline, Excerpta Médica, etc. Estas fuentes de información
garantizan mínimamente la calidad de las publicaciones.
Países e idiomas: se asume, aunque no es mantenible en muchos casos,
que la calidad de los trabajos está relacionada con el país de origen o el
idioma publicado. Esta regla admite muchos falsos positivos y negativos.
Periodo de publicación: se supone que a mayor intervalo entre los
tiempos de publicación menos homogéneos son dos trabajos.
Entidad Clínica: definición exhaustiva de los marcos clínicos o pato-
lógicos en los que se está interesado. P. ej., DMNID (tipo II).
Población: marco en el que se está interesado y en donde se quieren
generalizar las conclusiones, haciendo especial énfasis en los factores
pronóstico y en los tratamientos. P. ej., la población podría ser de adultos
recién diagnosticados; los factores pronóstico, retinopatía y nefropatía; y
los tratamientos, biguanidas versus una dieta.
Variables de eficacia, end points y medida de efecto: en primer lugar,
hay que precisar la característica sobre la que nos estamos fijando, esa
sería la variable de eficacia (p. ej.: glucemia); a continuación definiría-
mos la escala de dicha variable y cuál es nuestra medida principal de efi-
cacia (p. ej.: mg/dl<110); y por último, cómo resumimos la importancia
de los tratamientos a partir de una medida de efecto (que podría ser, p.
ej.: el porcentaje de diabéticos controlados).
Estimación del número de estudios no publicados

Es conocido que no todo tiene la misma probabilidad de publicarse,
con lo que se establece el denominado sesgo de publicación. Así, suelen
ser menos publicados: los estudios no significativos, los que dan peque-
ñas diferencias de efecto, los estudios randomizados, los comparativos,
los estudios pilotos y los patrocinados por terceros. Por contra, suelen ser

más publicados: los estudios significativos, los que dan grandes diferen-
cias de efecto, los estudios no randomizados, los no comparativos, los
definitivos y los no patrocinados.
Se puede estimar la cantidad de estudios no publicados si asumimos
la hipótesis de no diferencia entre los tratamientos.
Figura 1.2. Estimación del número de estudios no publicados.
En la fórmula de la Figura 1.2 se tiene que:

k representa el número de trabajos o estudios inicialmente disponibles,
int indica la parte entera de la expresión entre paréntesis
p(k) es el valor de p más elevado de los estudios disponibles
N proporcina el estimado de estudios que deben existir.
La diferencia entre N y k proporciona un estimado del número de
estudios no publicados. También se presenta una tabla de N para valores
más frecuentes de p y k.
Según se aprecia a un menor p(k), mayor será el número de trabajos no
disponible. A modo de ejemplo, si el máximo valor de p es 0,50 en una
serie de 10 trabajos recogidos, se tiene que, bajo la hipótesis de no dife-
rencia entre tratamientos, el número estimado de trabajos sin publicar es
10. La fórmula permite el estimado de este número para valores de p cua-
lesquiera. Así, si el valor máximo de p es 0,75, en 10 trabajos, entonces:

2
Elementos básicos
de Estadística
Las técnicas matemáticas del Meta-Análisis utilizan básicamente los

mismos elementos que las técnicas clásicas estadísticas. De hecho, el
lenguaje del Meta-Análisis es el mismo lenguaje que el de un único aná-
lisis. Las medidas de efecto empleadas en trabajos individuales son utili-
zadas en el Meta-Análisis como componentes de las medidas de efecto
global. Asimismo, todo el proceso inferencial estadístico clásico que
sigue a la estadística descriptiva, se utiliza igualmente en el Meta-Análi-
sis: estimación puntual de las medidas de efecto globales, varianza de los
estimados o de sus transformados, intervalos de confianza, estadísticos
de contraste y su significación.
Por ello, en este apartado comenzaremos empleando una aproximación
estadística para un único estudio en un diseño clásico en el que los resulta-
dos experimentales se puedan resumir en términos de una tabla 2x2.
Medidas de efecto en tablas de dos por dos

Supongamos que se trabaja en un estudio en donde se comparan dos
tratamientos (o factores de exposición) en relación a si se curan o no (si
los sujetos al término del estudio están sanos o enfermos). Su diseño
esquemático es el siguiente:
Variable explicativa dicotómica: Trat A / Trat B; Exp. + /Exp. -

Variable respuesta dicotómica: Éxito / Fracaso; Sano / Enfermo
Modelo: dicotómica explica dicotómica
Estudio: prospectivo

La presentación de los resultados experimentales de este tipo de estu-

dios se suele hacer en formato de tabla de frecuencias de 2 por 2. Las fre-
cuencias que aparecen son incidencias acumuladas y se asume que las
dos cohortes se han seguido el mismo tiempo.
En esta disposición de los datos se definen las probabilidades de

enfermedad para los individuos expuestos y no expuestos al factor como:
A partir de estas probabilidades de enfermedad se pueden definir

varias medidas de efecto según el siguiente apartado.
Diferencia de riesgos, riesgo relativo,

odds ratio
En estudios cuya disposición de resultados teórica sea en forma de
tabla 2x2,
se pueden definir las siguientes medidas de efecto para el factor de expo-

sición: diferencia de riesgos, riesgo relativo y odds ratio.
Diferencia de riesgos, DR
Es el diferencial de las probabilidades de enfermedad. La expresión
para su cálculo y su aplicación a los datos anteriores es:

ELEMENTOS BÁSICOS DE ESTADÍSTICA 13
La diferencia de riesgos se expresa en porcentaje o en tanto por uno,

toma valores de 0 a 100 en términos absolutos y es de inmediata interpre-
tación. Esta medida es la más empleada para presentar los resultados en
ensayos clínicos.
Riesgo relativo, RR
Es una medida relativa de efecto, puesto que cuantifica el riesgo (pro-
babilidad de enfermedad) de los expuestos en relación a los no expues-
tos. La expresión para su cálculo y su aplicación a los datos anteriores es:
El riesgo relativo es adimensional y teóricamente toma valores entre 0

e infinito. Un valor de uno se interpreta como la ausencia de efecto del
factor estudiado. Valores inferiores a uno indican un efecto protector
del factor (siempre que se defina el riesgo como la probabilidad de enfer-
medad). Valores superiores a uno indican una mayor probabilidad de
enfermedad en los individuos expuestos, con lo que el factor es realmen-
te de riesgo.
Odds ratio, OR
La traducción al castellano no está unificada, aunque se suele utilizar
el término de razón de productos cruzados. Es una medida de efecto de
difícil conceptualización, ya que es una razón de «odds». Un «odds» pro-
viene de una proporción y se define como el cociente entre una propor-
ción y su complementario. La expresión para su cálculo y su aplicación a
los datos anteriores es:
La interpretación de esta medida de efecto es similar a la del riesgo

relativo, aunque los valores numéricos no coincidan para un mismo estu-
dio. Valores inferiores a uno indican un efecto protector del factor (siem-
pre que se defina el riesgo como la probabilidad de enfermedad). Valores
superiores a uno indican una mayor probabilidad de enfermedad en los
individuos expuestos, con lo que el factor es realmente de riesgo.

Influencia del diseño

A continuación se van a realizar varias simulaciones en estudios prospec-
tivos y en estudios retrospectivos para ver la posible influencia de los mar-
ginales (estabilidad) en las medidas de efecto definidas con anterioridad.
Estudios prospectivos
Se plantea estudiar si el tamaño de las cohortes si y s2 influye en las
medidas de efecto. El investigador tiene control sobre el tamaño relativo
de los individuos expuestos en relación a los no expuestos. En este ejer-
cicio de simulación se mantienen las mismas probabilidades de enferme-
dad en las cohortes. Se realizan tres simulaciones y a continuación se
presentan los valores de las tres medidas de efecto. En ellas se observa
que las medidas de efecto son invariables (estables) con respecto a los
tamaños de las cohortes.
Tabla 2.1: Estabilidad de las medidas de Efecto. Estudios prospectivos
Estudios retrospectivos
Manteniendo los mismos datos numéricos que en el ejemplo ficticio
anterior, se presentan los resultados de un estudio retrospectivo, en la

Tabla 2.2: Estabilidad de las medidas de Efecto. Estudios retrospectivos
Tabla 2.2, en donde a partir de los historiales de los individuos que han
desarrollado o no la enfermedad r1 y r2, se establece si han estado some-
tidos a la influencia del factor de riesgo, valores de a y c. Se plantea estu-
diar si el tamaño de los grupos de individuos enfermos y sanos r1 y r2
influye en las medidas de efecto. El investigador tiene control sobre el
tamaño relativo de estos grupos. En este ejercicio de simulación se man-
tienen unas mismas probabilidades de enfermedad para los individuos
expuestos y no expuestos, puesto que la influencia del factor debe perma-
necer invariable. Se realizan tres simulaciones y a continuación se pre-
sentan los valores de las tres medidas de efecto. En ellas se observa que
el odds ratio invariante es la única medida de efecto que permanece inva-
riante con los cambios relativos de tamaños de los grupos estudiados.
Medidas de efecto en tablas 2x2

Como resultado de las simulaciones anteriores se presenta la Tabla 2.3
que resume en qué situaciones (diseños) se puede utilizar (es estable)
cada medida de efecto:
Tabla 2.3: Estabilidad de las medidas de efecto

El odds ratio se puede utilizar como medida de efecto independiente

del diseño del estudio. Sus características de simetría (ver segunda parte
del libro), invariabilidad con respecto a los marginales, y su facilidad de
cálculo, justifican su utilización más que el resto de medidas. En los
estudios transversales el odds ratio que se obtiene es un «odds ratio
transversal» o «prevalente» que nada tiene que ver con el odds ratio habi-
tual.
Intervalos de confianza y significación

En las fórmulas anteriores se presentaban los estimados puntuales
de las medidas de efecto. En este apartado se presentan las fórmulas de
las varianzas muéstrales de las medidas de efecto transformadas y los
intervalos de confianza para los estimados de los efectos sin transfor-
mar.
Excepto para las «diferencias de riesgo», es más conveniente operar
con el logaritmo neperiano del «riesgo relativo» y «odds ratio». Me-
diante esta transformación se consigue «normalizar» la distribución
muestral de los estimadores puntales y, por tanto, se puede emplear el
Teorema Central del Límite para el cálculo de los intervalos de confian-
za. En el cálculo de estos últimos hay que deshacer la transformación
logarítmica, tomando exponenciales. Las expresiones se presentan en la
Tabla 2.4:
Tabla 2.4: Intervalos de confianza de las Medidas de Efecto

Para el ejemplo numérico anteriormente expuesto con a = 2 1 , b = 16,

c = 8 y d = 31, los resultados son los de la Tabla 2.5.
Tabla 2.5: Intervalos de confianza y significación de las Medidas de Efecto.

Caso práctico
Se observa que para el cálculo de la significación de las diferencias de

riesgo y de las otras medidas de efecto se utiliza el estadístico Chi-cua-
drado con un grado de libertad. Su expresión para su cálculo y su aplica-
ción a los datos anteriores es:
Con lo que el resultado para este estudio ficticio es significativo a

nivel p < 0,05, es decir, el efecto del factor de riesgo no puede ser atribui-
do al azar.

3
Combinación
de resultados
de varios estudios
La pregunta central del Meta-Análisis se dirige hacia la obtención

de una medida global que integre la información numérica procedente de
varios estudios. El efecto global o conjunto de dichos estudios se deriva-
rá de las medidas de efecto individuales, vistas en el capítulo anterior, de
forma que se refleje «la importancia» de cada estudio.
En la Tabla 3.1 se presenta un ejemplo con tres estudios, en los que
se ha obtenido, para cada uno de ellos, información de las probabilida-
Tabla 3.1: Datos experimentales con tres estudios

des de enfermedad, del OR, su intervalo de confianza y su significa-

ción.
Se observa que en el primer y en el tercer estudio el factor estudiado
es de riesgo y que en el segundo estudio el factor es protector. La pregun-
ta sería cómo obtener un estimado conjunto del OR.
Trampas y aproximaciones erróneas

Una primera aproximación sería considerar la media de los distintos
OR. Esto es absolutamente peligroso y no recomendable en modo algu-
no. Estudios con 20 sujetos tendrían el mismo peso que estudios con
2.000 sujetos. Es un método no recomendable, de la misma familia que
los métodos que calculan las medias de medias o las medias de propor-
ciones.
Se podría pensar en una aproximación más ajustada mediante el
colapso de celdas. Esto da lugar al método de los OR crudos. Mediante
este método se construye una única tabla en donde las celdas son la suma
de las celdas de los diferentes estudios en la misma posición. En nuestro
caso se obtendría la siguiente tabla colapsada:
que daría lugar al siguiente OR crudo, con su intervalo confidencial y su

significación estadística:
Este método, aparentemente correcto, esconde numerosas trampas

basadas en el hecho de que en el proceso de colapso se pierde la identi-
dad de la información proveniente de cada estudio. En esta trampa se
basa la paradoja de Simpson.

COMBINACIÓN DE RESULTADOS DE VARIOS ESTUDIOS 21
Paradoja de Simpson
Supongamos dos estudios con los siguientes resultados y su significa-
ción:
En ambos estudios el factor estudiado es de riesgo y muy significati-

vo. Cabría esperar que el OR conjunto tomase el valor de 3. Sin embargo,
cuando se colapsan estas dos tablas se obtiene:
y ahora parecería (erróneamente) que el factor es protector y además sig-

nificativo. Estos métodos basados en el colapso de datos presentarán, asi-
mismo, problemas como el visto debidos principalmente a la pérdida de
la singularidad de cada estudio. El Meta-Análisis resuelve estos proble-
mas, combinando adecuadamente la información teniendo en cuenta la
singularidad y la importancia de cada estudio.
Método logit
En un conjunto de estudios, y asumiendo que todos ellos cumplen
unos estándares mínimos de calidad para incluirse en el Meta-Análisis,
se establece un peso o ponderación objetiva para cada uno de ellos. La
expresión del peso o ponderación objetiva para cada estudio es:

La aplicación de la metodología logit para la combinación de varios

OR se refleja a continuación en la Tabla 3.2:
Tabla 3.2: Combinación de varios OR¡. Método logit: ORL
Este estimado puntual de la medida de efecto global presenta una

varianza muestral que permite el cálculo de sus intervalos de confianza:
Asimismo, es posible obtener el estadístico de contraste asociado

Chi-cuadrado de asociación y su significación:
Esta medida de efecto global logit basado en los OR no es única. Otra

opción no presentada aquí (ver Segunda Parte del libro) incluiría el cál-
culo de OR de Mantel-Haenszel.

Representación gráfica
Si reconsideramos todo el proceso desarrollado hasta ahora, básica-
mente tenemos unas medidas de efecto de los estudios individuales, un
intervalo de confianza asociado, una medida de efecto global, sus inter-
valos de confianza y su significación. Esta información se puede repre-
sentar gráficamente según se observa en la Figura 3.1.
Figura 3.1. Representación gráfica de un Meta-Análisis.
La figura incluye una línea vertical a la altura de un OR=1, que repre-

senta el valor de no efecto del factor estudiado, tanto para los estudios
individuales, como para el OR global. En aquellos trabajos en donde los
intervalos de confianza no corten la línea OR=1 el efecto es significativo.
A la derecha de la línea transversal OR=1 se encuentran los efectos de
riesgo y a la izquierda se encuentran los factores protectores. Las gráfi-
cas de Meta-Análisis, a diferencia de otras gráficas empleadas en estadís-
tica, resumen toda la información.
Introducción al concepto de heterogeneidad

Consideremos la colección de siete trabajos con sus resultados
en las celdas de frecuencias a, b, c y d (Tabla 3.3).

Tabla 3.3: Introducción al concepto de heterogeneidad
La representación gráfica de los resultados del Meta-Análisis sería

como se aprecia en la Figura 3.2.
Figura 3.2. Introducción al concepto de heterogenidad/homogeneidad.
Se observa que en el primero de los trabajos el factor es protector, al

contrario que en el resto. Asimismo, gráficamente se puede observar que
este trabajo está «desplazado» del resto. Éstos forman una nube más o
menos compacta, situándose el trabajo HDFP al margen y muy diferen-
ciado del resto.
Se introduce ahora el concepto de «heterogeneidad» en un conjunto
de trabajos. Heterogeneidad desde el punto de vista numérico, no referi-
do a la ausencia de homogeneidad de diseño que deberían cumplir todos
los trabajos inicialmente en un Meta-Análisis. Para un conjunto de traba-

jos se calcula el componente Q de Heterogeneidad, mediante la siguiente

expresión:
El componente Q está asociado al estadístico Chi-Cuadrado de Hete-

rogeneidad con k - 1 grados de libertad, siendo k el número de trabajos
incluidos. En nuestro ejemplo de tres trabajos de la Tabla 3.2 toma el
siguiente valor: Q = X2H, 3-1 = 1,92; p = 0,3838. Esto indica que los tres
trabajos son homogéneos (no heterogéneos) con lo cual se podría inter-
pretar sin problemas la medida de efecto global OR logit, sus intervalos
de confianza y su significación.
El problema surge cuando tenemos un valor de Q significativo. En
el ejemplo anterior de siete trabajos obtenemos que la significación de
Q es p < 0,001. Este valor es altamente significativo e indica que algún o
algunos de los trabajos no son homogéneos con respecto al resto. En este
caso es difícil la interpretación de un único OR logit, que se podría calcu-
lar numéricamente sin problemas pero que sería desaconsejado.
La solución al problema de la heterogeneidad significativa, consiste
en intentar identificar en los trabajos alguna característica común que
Figura 3.3. Pasos en la realización de un MA.

permita reagruparlos y realizar diferentes Meta-Análisis con los subgru-

pos. Es posible que se estén mezclando diferentes subpoblaciones donde
el efecto del factor en estudio sea significativamente diferente. Sin
embargo, estas técnicas de estratificación a posteriori, no están exentas
de problemas al no poder identificar efectos y subpoblaciones ficticias,
debido a que la heterogeneidad tiene su origen en el diseño o los resulta-
dos del estudio. Otras técnicas más avanzadas implican el empleo de téc-
nicas de regresión múltiple en el Meta-Análisis.
Normalmente se suelen tomar valores de p < 0,10 como significativos
en esta prueba, debido a la baja sensibilidad del test. Por tanto, en el dia-
grama para la realización de un MA, es aconsejable la obtención del
componente Q de heterogeneidad y su significación, antes del cálculo de
las medidas globales de efecto y sus intervalos de confianza. Este diagra-
ma está representado en la figura anterior.

4
Más allá de la evidencia
Hasta ahora se ha planteado el caso de un diseño de estudios en el que

una variable dicotómica explicativa (presencia o ausencia de un factor o
tratamiento) explica una variable respuesta también dicotómica (enfer-
mo/sano). Los resultados se recogían en una tabla de frecuencias de dos
por dos, la medida de efecto partía de los valores OR individuales para
calcular un OR logit global.
Los resultados vistos en el capítulo anterior se pueden generalizar
para cualquier medida de efecto, como:
- Riesgos relativos y diferencias de riesgos para resultados de fre-

cuencias en tablas de 2 por 2.
- Medias, coeficientes de correlación y coeficientes de regresión para
variables respuesta continuas.
Teoría general del Meta-Análisis

Como paso previo, en esta teoría general suele ser necesario hacer
ciertas transformaciones en las medidas de efecto para conseguir norma-
lizar las poblaciones muéstrales, como se muestra en la Figura 4.1.

Figura 4.1. Teoría general.
Una vez se ha conseguido la normalidad (transformando o no), se

puede calcular la varianza muestral V[yi] y a partir de ella los pesos de
cada estudio w¡, dados por: w¡ = 1 según se aprecia en la Figura 4.2.
V[yi]
Figura 4.2. Teoría general. Medidas de efectos individuales.
A partir de los valores individuales de las medidas de efecto de cada

trabajo y de sus pesos se pueden definir: la medida del efecto global, la
varianza global, los límites de confianza, el estadístico Chi-cuadrado de
asociación y su significación, y el estadístico Chi-cuadrado de homoge-
neidad y su significación. Estos valores aparecen en la Figura 4.3.

MÁS ALLÁ DE LA EVIDENCIA 29
Figura 4.3. Teoría general. Medida global y otros estadísticos.
La aplicación de la metodología logit para la combinación de cual-

quier medida de efecto de varios estudios se incluye en la Figura 4.4.
Figura 4.4. Resumen. MA con cualquier medida de efecto.

Modelos de efectos fijos y aleatorios

En la fase de diseño de un Meta-Análisis hay que tener en cuenta si se
han recogido todos los estudios disponibles o si se han recogido sólo una
muestra. En el primer caso nos encontramos ante un Modelo de Efectos
Fijos (Fixed Effects Model: FEM), en el segundo, ante un Modelo de
Efectos Aleatorios (Random Effects Model: REM).
Figura 4.5. Modelos estadísticos en Meta-Análisis.
Los resultados FEM son generalizabas sólo a la muestra de estudios y

tienen en cuenta la variabilidad «dentro» de los estudios. Los REM son
generalizables al universo de estudios y tienen en cuenta la variabilidad
«dentro» y «entre» estudios. La aproximación REM es más conservado-
ra, tiene un efecto menos significativo y un intervalo confidencial más
amplio. En cualquier caso, la decisión de utilizar un FEM o un REM tie-
ne que ser tomada a prior i, aunque las fórmulas del REM se basan en cál-
culos previos de las fórmulas del FEM, según se aprecia en la Figura 4.5.
(ver también segunda parte del libro).

Segunda Parte
DESARROLLO TEÓRICO
DE LAS MEDIDAS DE EFECTO

5
En un estudio con una
variable dicotómica
En este capítulo se realiza un breve repaso a los principales aspectos

teóricos estadísticos cuando se está estudiando una única variable que
puede tomar solamente dos posibles valores (variable dicotómica). El
ejemplo más típico sería aquel estudio donde se analiza la variable dico-
tómica «Enfermedad» que viene dada por dos posibles valores: «Enfer-
mo» (Enf.) y «Sano» (Sano). Al término de la fase experimental llevada a
cabo en n sujetos tendríamos que r están enfermos y que (n - r) están
sanos. La disposición de estos datos en forma tabulada se suele presentar
del siguiente modo:
Desde un punto de vista teórico existe una probabilidad n de que un

individuo esté enfermo y una probabilidad complementaria a uno de (1- n)
de que el individuo esté sano. Estas probabilidades son desconocidas y se
estiman a través de las proporciones muéstrales p y (1 — p) respectiva-
mente, siendo:
Las medidas de efecto que se utilizan en esta situación son la propor-

ción y el odds de proporción o cociente de probabilidades complementa-
rias. En términos generales, toda medida de efecto viene descrita, según

veremos más adelante, por una estimación puntual o descriptiva, una

estimación por intervalos de confianza y un estadístico de contraste aso-
ciado.
Proporción
Una proporción p se puede interpretar como la media X de una varia-
ble aleatoria X que toma dos valores (dicotómica) 1 y 0; el valor 1 lo
toma con probabilidad n y el valor 0 con probabilidad 1 - π. Se suele
denotar como 1 el suceso de mayor interés y 0 al otro. Por ejemplo, es
una práctica habitual denotar por 1 a la categoría «Enfermo» (Enf.) y 0 a
la categoría «Sano» (Sano). En este contexto, a la probabilidad de estar
enfermo π = Prob (Enf.) se la conoce como «prevalencia de enfermedad».
Si representamos por E[ ] a la esperanza o valor medio de una varia-
ble aleatoria y a V[ ] a la varianza, se tiene que, para dicha variable dico-
tómica X:
La primera igualdad nos dice que el valor medio o esperado de una

variable dicotómica «0 - 1» es la probabilidad de que la variable tome el
valor 1, es decir π. La segunda igualdad indica que la dispersión de dicha
variable sólo depende del parámetro π. Estas expresiones nos servirán de
ayuda a la hora de realizar inferencias y pruebas estadísticas sobre el
parámetro poblacional desconocido π.
Intervalo confidencial
La estimación puntual de un parámetro consiste en dar un único valor
como candidato a la estimación del parámetro poblacional. En la estima-
ción por intervalos de confianza se da un conjunto de valores posibles
(intervalo) para dicho parámetro poblacional. El proceso consiste en bus-
car un estadístico muestral que sea un estimador «centrado» o no sesga-
do, y cuya distribución siga una función teórica de probabilidad conoci-
da, siendo deseable que sea una Normal (0,1). A partir de la varianza del
estadístico descriptivo y de la función de probabilidad asociada se deter-
mina la anchura del intervalo confidencial. El proceso anterior aplicado a
una proporción poblacional se concreta a continuación.

EN UN ESTUDIO CON UNA VARIABLE DICOTÓMICA 35
Utilizando propiedades básicas de la esperanza y de la varianza de

una variable aleatoria y considerando que p = X, se tiene que:
La primera igualdad nos dice que la proporción muestral estima de

forma «centrada» o sin sesgos a la proporción poblacional. La segunda
igualdad nos va a ayudar a cuantificar lo que nos equivocamos cuando
hacemos esa estimación. Así, si se denota por EE [ ] al error estándar
dado por la raíz cuadrada de V [ ], se tiene que el error estándar de una
proporción es:
Con la ayuda del EE [ ] se pueden realizar intervalos confidenciales.

Así, el intervalo confidencial de una proporción viene dado por:
IC95(p)% = p + 1,96 • EE[p]. El valor 1,96 se obtiene a partir del
resultado que afirma que la proporción muestral sigue una distribución
normal y de las propiedades de ésta para una confianza del 95%. Téc-
nicamente no se puede decir que el intervalo confidencial IC95% tiene
una probabilidad del 95% de contener al parámetro desconocido, ya
que el parámetro o está o no está en dicho intervalo. La confianza hace
referencia al procedimiento de construcción, de forma que si se repi-
tiese el experimento 100 veces y se realizasen los 100 intervalos de
confianza según el método descrito, 95 de cada 100 incluirían al pará-
metro. Se podría decir que la estimación puntual es análoga a lanzar
una flecha, mientras que la estimación por intervalos de confianza
sería como lanzar un hacha cuyo filo es la anchura del intervalo. En
este símil la confianza vendría dada por la destreza del lanzador del
hacha.

Estadístico de Contraste
La estimación por intervalos de confianza permite generalizar las
conclusiones de las muestras a las poblaciones correspondientes. Sin
embargo, no ayudan a tomar decisiones. Las pruebas estadísticas o de
contraste de hipótesis permiten tomar decisiones entre una hipótesis
nula y una hipótesis alternativa. Las pruebas estadísticas utilizan los lla-
mados estadísticos de contraste, que se calculan a partir de la informa-
ción de la muestra y que nos ayudan a decidir entre una u otra hipótesis.
En el caso de una proporción se suele utilizar el estadístico de contraste
z de Fisher.
Estadístico z
Se trata de contrastar Ho: π = p0. Bajo esta hipótesis nula, la varianza
de la proporción muestral se estima por
El estadístico de contraste z se calcula mediante la expresión siguiente,

que sigue una N (0, 1):
Ejemplo 1
Imaginemos que se recoge información de 76 individuos y se observa

si están o no enfermos. El resultado del estudio es que de esos 76 indivi-
duos, 37 son enfermos y 39 son sanos. Se trata de dar una estimación
puntual de la proporción (prevalencia) de enfermos en la población, una
estimación por intervalos de confianza de esa proporción y contrastar si
esa proporción es de 0,5:

Resolución
La estimación puntual de la probabilidad de enfermedad (prevalen-
cia) viene dada por Para calcular el intervalo con-
fidencial necesitamos calcular como paso previo según se detalla a

continuación:
Para contrastar H®. n = 0,5, se construye el estadístico z de la forma

siguiente:
que le corresponde p = 0,8185, con lo que no se rechaza esta hipótesis al

nivel 0,05.

Odds de una proporción

El odds de una proporción (probabilidad) π se define como Ω, sien-
do Ω el cociente de probabilidades complementarias π (1 - π),
así: Ω = π . Para π = 0, el odds es también cero, para π próximo a

(1 − π )
uno, el odds toma valores muy grandes, con lo que el rango teórico de Ω
es desde cero a infinito.
El odds de enfermedad sería el cociente entre la probabilidad de estar
enfermo Prob. (Enf.) y la probabilidad de estar sano, Prob. (Sano), es decir:
Un odds de enfermedad se puede transformar en Prob. (Enf.), de la

forma siguiente:
Odds de enfermedad • [1 - Prob. (Enf.)] = Prob. (Enf.)=>
Un odds de enfermedad de uno indicaría que hay la misma probabili-

dad de estar enfermo que de estar sano. Un odds de enfermedad > 1 indi-
caría que la probabilidad de estar enfermo es mayor que la de estar sano.
Por ejemplo, un odds de enfermedad de 4, indicaría que la probabilidad
de estar enfermo es cuatro veces la probabilidad de estar sano, con lo que
4 4
la probabilidad de estar enfermo sería de = y la de estar sano
4 +1 5
4 1 4 1
1− = . Obsérvese que = 4.
5 5 5 5
Un odds de enfermedad < 1 indicaría que la probabilidad de estar
enfermo es menor que la probabilidad de estar sano. Por ejemplo, un
odds de enfermedad de 0,7 indicaría que la probabilidad de estar enfermo
es 0,7 veces la probabilidad de estar sano. En el caso de que se obtenga
un odds de enfermedad menor que uno, conviene razonar por recí-
1
procos. Así, = 1, 43 , y entonces la probabilidad de estar sano es 1,43
0, 7
veces la probabilidad de estar enfermo.
El candidato natural para estimar el odds poblacional de una propor-
ción es el odds muestral; sin embargo, el odds muestral de una proporción
es asimétrico, con rango (0, +∞), con distribución, por tanto, no normal. Se
hace necesario una transformación del odds muestral de una proporción
que consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una
distribución normal. La transformación habitual es considerar logaritmos
neperianos, y definir el logit, que viene dado por:
La expresión para el logit muestra cómo a partir de una probabilidad

se transforma ésta en logit. También se puede transformar un logit en
probabilidad sin más que tomar exponenciales, de la forma siguiente:
La transformación logit nos ha solucionado el problema de la norma-

lidad, pero ahora tenemos que calcular la varianza del logit para así
poder determinar la anchura del intervalo confidencial, en términos de su
error estándar. Para ese cálculo necesitamos el teorema de Taylor de
variables transformadas, que relaciona la media y la varianza de una
variable transformada con la media y la varianza de la variable sin trans-
formar.
Teorema de Taylor de variables transformadas
La media y la varianza de una variable aleatoria X y una transforma-

ción de ésta f(X), se relacionan del siguiente modo:
siendo f' la derivada de la función f. Si la transformación de los datos

consigue que/(X) sea una distribución normal, un IC95% se puede obte-
ner como:

Demostración:
Para demostrar el teorema anterior se desarrolla f(x) en serie de Tay-
lor alrededor de la media de la variable x, E[x], utilizando la primera y la
segunda derivada de f (f’ y f’’ respectivamente). Para una observación
cualquiera:
Teniendo en cuenta que y sumando para todos los

puntos, se verifica:
Es decir, la media de la variable transformada es aproximada (pero no

igual) por la transformada de la media (visualmente se intercambian la E
y la f).
Por otra parte:
Elevando al cuadrado, dividiendo por n y sumando para todos los

puntos, se obtiene la aproximación para la varianza:
La última parte del teorema relativa a la construcción del intervalo

confidencial, se sigue de las propiedades de la distribución normal.
Taylor aplicado a la transformación logit

Aplicando el resultado de Taylor para la transformación logia f(p)=
se verifica,
y se tiene que:

Taylor aplicado a la transformación neperiano
se verifica, y se tiene que:
Aplicando el resultado de Taylor para la transformación neperiano
Taylor aplicado a la transformación arcoseno-raíz
Aplicando el resultado de Taylor para la transformación arcoseno-raíz
f(p) = 2 • arcsen Vp, se verifica, y se tiene que:

Estadístico de contraste
Al igual que en el caso de una proporción se suele utilizar el estadísti-
co de contraste z de Fisher.
Estadístico z
Se trata de contrastar Ho: logit = logit0. Bajo esta hipótesis nula:
V[logit] se estima por

El estadístico de contraste z se calcula mediante la expresión siguiente,
que sigue una N (0, 1):
Ejemplo 2
Se trata de calcular para los datos del Ejemplo 1, el odds de enferme-

dad, dar una estimación por intervalos de confianza del logit de enferme-
dad y contrastar si el logit es cero.
Resolución
La estimación puntual del logit de enfermedad viene dada por:
Para calcular el intervalo confidencial necesitamos calcular como paso

previo E[logit], V[logit] y EE[logit], según se detalla a continuación:
Para contrastar Ho: logit = 0,5, se observa en primer lugar que un
logito = 0 está asociado con con lo que el

estadístico z es:
que le corresponde p = 0,8185, con lo que no se rechaza esta hipótesis al

nivel 0,05.
6
En un estudio con dos
variables dicotómicas
En este capítulo se supone que se están estudiando dos variables dico-

tómicas, de forma que una de ellas realiza el papel de variable explicativa
y la otra el papel de variable respuesta o resultado. En algunos textos se
prefiere utilizar el nombre de variable independiente para la primera y de
variable dependiente para la segunda. El ejemplo más típico sería aquel
estudio donde se analiza la variable explicativa dicotómica «Exposición»
que viene dada por dos posibles valores: «Expuesto» (Exp. +) y «No
Expuesto» (Exp. -); y la variable respuesta dicotómica «Enfermedad»
con los valores: «Enfermo» (Enf.) y «Sano» (Sano).
El objetivo de este tipo de estudios es determinar la posible
influencia que pudiera tener la variable «Exposición» en la variable
respuesta «Enfermedad». Existen básicamente dos tipos distintos de
diseños para contestar la pregunta anterior: los diseños prospectivos y
los diseños retrospectivos. Las medidas de efecto que se utilizan en los
diseños prospectivos son la diferencia de proporciones, el riesgo rela-
tivo y el odds ratio. Las medidas de efecto para los diseños retrospecti-
vos son la diferencia de proporciones y el odds ratio. Los dos tipos de
diseños anteriores no sólo se diferencian porque utilizan distintas
medidas de efecto, sino que también son distintas la interpretación de
la fuerza de la causalidad, siendo mayor dicha fuerza en los diseños
prospectivos.
Diseños prospectivos
En los diseños prospectivos se fijan el número de expuestos y el de no

expuestos, y se ve su evolución para saber si enferman o sanan. La dispo-

sición de los datos en los diseños prospectivos en forma tabulada se sue-

len presentar del siguiente modo:
donde se quiere indicar con la flecha el sentido de la observación (experi-

mentación) y con los cuadrados alrededor de S1 y s2, que estos marginales
están fijados por el investigador al inicio del estudio. Las probabilidades
teóricas asociadas a esta tabla se denotan por:
que se pueden estimar por:
Diseños retrospectivos
En los diseños retrospectivos se fijan el número de enfermos y el de

sanos, y retrospectivamente se observa si estuvieron o no expuestos. La
disposición de los datos en los diseños retrospectivos en forma tabulada
se suelen presentar del siguiente modo:

mentación) y con los cuadrados alrededor de r1 y r2, que estos marginales

EN UN ESTUDIO CON DOS VARIABLES DICOTÓMICAS 47
están fijados por el investigador al inicio del estudio. Las probabilidades

teóricas asociadas a esta tabla se denotan por:
Diferencia de proporciones
En estudios prospectivos, la diferencia de proporciones se puede
interpretar como diferencias de riesgos, y vendría dada por:
que se puede estimar por:
En estudios retrospectivos la diferencia de proporciones vendría dada por:
que se puede estimar por:
Propiedades
1) Si definimos DR = Prob. (Sano|Exp. +) - Prob. (Sano|Exp. -), se

verifica que DR = -DR (esta propiedad refleja cierta «simetría» en las
diferencias de proporciones).
Demostración (1):
Prob. (Sano|Exp. +) - Prob. (Sano|Exp. -) = 1 - Prob. (Enf. |Exp. +)
- 1 + Prob. (Enf. |Exp. -), y por tanto, DR = -DR ...

En estudios prospectivos el intervalo confidencial de la diferencia de
proporciones se calcula del siguiente modo:
En estudios retrospectivos el intervalo confidencial de la diferencia de

proporciones se calcula del siguiente modo:
Los estadísticos de contraste que se suelen utilizar en el caso de dos
proporciones son: el estadístico χ2P de Pearson y el estadístico z de Fisher.

Estadístico χ2P de Pearson
Se trata de contrastar la hipótesis nula de independencia entre las dos

variables. El estadístico de contraste se construye a partir de las frecuen-
cias observadas y esperadas bajo la hipótesis de independencia, su expre-
sión es la siguiente:
Este estadístico sigue una distribución χ2 con un grado de libertad.
Propiedades
2) Para una tabla
Demostración (2):
A partir de la tabla de frecuencias observadas se construye la tabla de

frecuencias esperadas de la forma siguiente:
Mediante las dos tablas anteriores se calcula la tabla de las diferencias

de las frecuencias observadas y esperadas. Si se denota a la primera celda
de dicha tabla por D, se tiene que la segunda celda es, -D, la tercera es -D
y la cuarta D. De forma gráfica, la tabla Obs.-Esp. viene dada por:
siendo , según se demuestra a continuación:

Por tanto:
y operando se obtiene que:
Estadístico z
En estudios prospectivos, se trata de contrastar Bajo

esta hipótesis nula, se estima por y la varianza de la
diferencia de las proporciones muéstrales:

Este estadístico sigue una distribución N(0, 1).

En estudios retrospectivos, se trata de contrastar Bajo
esta hipótesis nula, se estima por la varianza de las
diferencias de las proporciones muéstrales:
se estima por El estadístico de
contraste z es:
Este estadístico sigue una distribución N(0, 1).
Propiedades
3) Tanto en estudios prospectivos como retrospectivos
Demostración (3):
En estudios prospectivos:

En estudios retrospectivos:
Ejemplo 3
Se pretende estudiar si un factor de exposición está relacionado con
una determinada enfermedad. Se supone que se toman 29 individuos
expuestos y 47 no expuestos. Al cabo de un cierto tiempo, se observa si
han desarrollado o no la enfermedad en estudio. Se supone que desarro-
llaron la enfermedad 21 de los 29 expuestos y 16 de los 47 no expuestos.
Se trata de determinar el estimado puntual de la diferencia de proporcio-
nes (diferencia de riesgos), su intervalo confidencial y contrastar si su

valor puede ser cero. La disposición de los datos experimentales en una

tabla 2 x 2 sería:
Resolución
La estimación puntual de la diferencia de riesgos viene dada por

Para calcu-
lar el intervalo confidencial necesitamos calcular como paso previo

según se detalla a continuación:
Para contrastar Ho: π1 - π2 = 0, se utiliza indistintamente el estadístico

z o el estadístico χ2p, ya que son equivalentes, de la forma siguiente:

que le corresponde una p = 0,0011, con lo que se rechaza la hipótesis de

igualdad de proporciones al nivel 0,05.
Riesgo relativo
El riesgo relativo φ se define como el cociente entre la probabilidad
de enfermo en los expuestos Prob. (Enf. |Exp. +) y la probabilidad de
enfermo en los no expuestos Prob. (Enf. |Exp. -):
El riesgo relativo, por la propia definición, sólo se puede estudiar en

estudios prospectivos donde están fijos los marginales Exp. + (número de
expuestos) y Exp. - (número de no expuestos). El riesgo relativo φ se esti-
ma por RR, que viene dado por
Si se define no hay relación con RR. El
riesgo relativo, a diferencia del odds ratio y de la diferencia de riesgos no

tiene ninguna propiedad de simetría.
El riesgo relativo φ es asimétrico, con rango (0, +∞), por lo que su
distribución es no normal. Se hace necesaria una transformación de éste
que consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una
distribución normal. La transformación habitual es considerar logaritmos
neperianos. Para el cálculo del intervalo confidencial del Ln(RR) se nece-
sita calcular E[LnRR], V[LnRR] y EE[LnRR]. Estos cálculos se basan en
la aplicación del resultado de Taylor a la transformación neperiano de
una proporción, vista en el capítulo anterior:
A partir de V[LnRR], se calcula su raíz cuadrada para determinar el

error estándar y así poder construir el intervalo confidencial del LnRR:
Como paso último, sólo queda deshacer la transformación neperiano,

tomando exponenciales:

Para contrastar, se observa en primer lugar que esto equi-

vale a contrastar: o lo que es lo mismo a
tiene, por tanto, que se pueden usar los mismos estadísticos de contraste
que en el caso de dos proporciones: χ2p de Pearson y z de Fisher.
Ejemplo 4
Se trata de calcular para los datos del Ejemplo 2 el estimado puntual
del riesgo relativo, su intervalo confidencial y contrastar si su valor es de
uno.
Resolución
La estimación puntual del riesgo relativo viene dada por
Para calcular el intervalo confidencial se
necesita calcular como paso previo , según

se detalla a continuación:
Como paso último sólo queda deshacer el cambio de los neperianos


Para contrastar o lo que es lo mismo:
que equivale se utiliza indistintamente el estadístico

o el estadístico z, ya que son equivalentes. Así, por ejemplo:
que le corresponde una p = 0,0011, con lo que se rechaza la hipótesis

de que el riesgo relativo sea igual a uno.
Odds ratio
En el capítulo anterior se introdujo la definición de odds de una pro-
porción como el cociente de probabilidades complementarias y se veía
por ejemplo el odds de enfermedad como el cociente entre la probabili-
dad de estar enfermo y la probabilidad de estar sano. Dichas probabilida-
des no incorporaban información «extra» de ninguna otra variable, eran
probabilidades sin condicionar. Esta definición de odds de una probabili-
dad se puede extender a probabilidades condicionadas. Así, se puede
hablar del odds de enfermedad en los individuos expuestos (Exp. +),
denotado por ΩExp+ ,con:
y, de la misma manera, de odds de enfermedad en los individuos no

expuestos (Exp. -), denotado por:

El odds ratio (razón de odds) es una razón o cociente de dos odds. En

estudios prospectivos el odds ratio w se define por:
En estudios retrospectivos el odds ratio se define por el cociente entre

ΩEnf. y Ωsano es decir, el cociente del odds de exposición en los enfermos
y el odds de exposición en los sanos:
y por tanto:
Propiedades
4) El odds ratio poblacional es el mismo para los estudios prospec-

tivos y para los estudios retrospectivos. Es decir:
5) La estimación de w, tanto en estudios prospectivos como en re-

trospectivos, se realiza por: De ahí el nombre para
odds ratio de razón de productos cruzados.
6) La interpretación del odds ratio es la misma en la práctica, tanto

en estudios prospectivos como en retrospectivos, y es:

Con lo que si, por ejemplo, el odds ratio es mayor que uno, la proba-
bilidad de enfermo en los expuestos es mayor que la probabilidad de
enfermo en los no expuestos (factor de riesgo)
7) Un odds ratio poblacional de uno equivale a un riesgo poblacio-

nal de uno, es decir:
8) El odds ratio poblacional y el riesgo relativo poblacional se re-
lacionan de la siguiente forma:
9) El odds ratio muestral y el riesgo relativo muestral se relacio-

nan de la siguiente forma:
10) En enfermedades «raras» el odds ratio poblacional es un buen

estimador del riesgo relativo poblacional, es decir
11) Si se define
Se podría decir que lo «bueno» por fumar es el inverso de lo

«malo» por fumar, es decir, que lo «bueno» por no fumar es lo
mismo que lo «malo» por fumar. Esta propiedad de «simetría» no
la cumple el riesgo relativo.
12) Es posible determinar las celdas de la tabla 2x2: a, b, c, d si sólo

está disponible la información del OR, S1 y s2.
13) Es posible determinar las celdas de la tabla 2 x 2: a, b, c, d si sólo

está disponible la información del OR y χ2P.
Demostración (4):
Utilizando el Teorema de Bayes para probabilidades condicionadas,
se tiene que:

Por tanto:
Demostración (5):
En estudios prospectivos, se puede estimar

el odds ratio w se podría estimar por OR, con:
En estudios retrospectivos, se puede estimar
Por tanto,
el odds ratio w se podría estimar por OR,
Demostración (6):
Utilizando que:
Es análogo el caso de w>l y w<l
Demostración (7):

Demostración (8):
Demostración (9):
Demostración (10):
En enfermedades «raras»: Prob. (Enf. |Exp. +) y Prob. (Enf. |Exp. -)
serán pequeños y utilizando P5 se tiene el resultado .'.
Demostración (11):

Demostración (12):
Se toma un r1 cualquiera (la solución no será única, habrá varias solu-

ciones, tantas como valores enteros entre cero y n = s1 + s2), el «a» que
buscamos pertenece a una tabla de la forma:
Demostración (13):
Se toman s1 y s2 cualesquiera (la solución no será única, habrá varias
soluciones), el «a» que buscamos pertenece a una tabla de la forma:
Se va a determinar un sistema de dos ecuaciones con dos incógnitas a y r1:

(II)
En (II) despejamos
Para resolver el sistema de ecuaciones (I) y (II) se introduce la

siguiente notación:
El sistema a resolver queda con esta notación de la siguiente

manera:
(I)
(II)
Se sustituye (II) en (I) para tener una única ecuación:

Se divide por «a» y se multiplica por y2:
Y el r1 se obtiene de (II) .'.
El odds ratio w es asimétrico, con rango (0, +∞), por lo que su distri-
bución es no normal. Se hace necesario una transformación de éste que
consiga simetría, rango (-∞, +∞) y, lo más importante, que siga una dis-
tribución normal. La transformación habitual es considerar logaritmos
neperianos. Para el cálculo del intervalo confidencial del Ln(OR) se
necesita calcular la E[LnOR], V[LnOR], EE[LnOR]. Estos cálculos se
basan en la aplicación del resultado de Taylor a la transformación nepe-
riano de una proporción, visto en el capítulo anterior:

A partir de V[LnOR], se calcula su raíz cuadrada para determinar el

error estándar y así poder construir el intervalo confidencial del LnOR:

tomando exponenciales en los extremos del intervalo confidencial ante-
rior:
Para contrastar Ho: w = 1, dado que w = l<=>φ = l, se tiene que son
válidos los mismos estadísticos de contraste utilizados con el riesgo rela-
tivo, y por tanto, los mismos que los utilizados para diferencias de pro-
porciones: χ2p de Pearson y z de Fisher.
Ejemplo 5
Se trata de calcular para los datos del Ejemplo 2 el estimado puntual
del odds ratio, su intervalo confidencial y contrastar si su valor es de
uno.

Resolución
Como paso último, sólo queda deshacer el cambio de los neperianos

que le corresponde una p = 0,0011, con lo que se rechaza la hipótesis

de que el odds ratio sea igual a uno.

7
Meta-Análisis con dos
variables dicotómicas
El objetivo de este capítulo es desarrollar las técnicas del Meta-Análi-

sis en el caso más sencillo, que es aquél en el que se tienen varios estu-
dios en los que se está estudiando, en cada uno de ellos, dos variables
dicotómicas de forma que una de ellas es la variable explicativa y la otra
es la variable respuesta. En cada estudio se tendrá una medida de efecto
de las vistas en el capítulo anterior. Se trata ahora de dar una medida de
efecto global que aglutine las medidas de efecto de los distintos estudios.
En cada estudio se supone que el propósito es el mismo: determinar la
posible influencia que pudiera tener la variable explicativa en la variable res-
puesta. El objetivo del Meta-Análisis es aunar esfuerzos combinando la
información de distintos k estudios. Existen varias formas de combinar infor-
mación de distintas tablas: el método de Mantel-Haenszel y el método logit.
La exposición de los métodos anteriores se realizará para estudios pros-
pectivos y estudios retrospectivos y se empleará la siguiente notación:
Diseños prospectivos
La disposición de los datos en los diseños prospectivos en forma tabu-

lada se suele presentar del siguiente modo:


mentación) y con los cuadrados alrededor de s1j y s2j, que estos margina-
les están fijados por los investigadores al inicio de los estudios. Las pro-
babilidades teóricas asociadas a estas tablas se denotan por:
Diseños retrospectivos
La disposición de los datos en los diseños retrospectivos en forma

tabulada se suele presentar del siguiente modo:

mentación) y con los cuadrados alrededor de r1j y r2j, que estos margina-
les están fijados por los investigadores al inicio de los estudios. Las pro-
babilidades teóricas asociadas a estas tablas se denotan por:

META-ANÁLISIS CON DOS VARIABLES DICOTÓMICAS 71
Diferencia de proporciones logit

En estudios prospectivos la estimación conjunta logit para la diferen-
cia de proporciones P1j-p2j o diferencias de riesgos en k estudios es:
siendo:
la ponderación que recibe cada estudio en la estimación conjunta.

Obsérvese que en el caso de que k = 1, es decir, si sólo se tiene un estu-
dio, p1L - p2L = p1 - p2
En estudios retrospectivos, la estimación conjunta logit para la dife-
rencia de proporciones p’1j -p’2j en k estudios es:
siendo:


dio, p’1L - p'2L = p’1 - p'2
En estudios prospectivos el intervalo confidencial de p1L - p2L se cal-
cula del siguiente modo:
En estudios retrospectivos el intervalo confidencial de p'1L - p'2L se cal-

cula del siguiente modo:

Obsérvese que en el caso de que k = 1, es decir, si sólo se tiene un

estudio, en estudios prospectivos y en estu-
dios retrospectivos
Los estadísticos de contraste que se suelen utilizar en el caso de com-
binación de distintas diferencias de proporciones son: el estadístico χ 2MH de
Mantel-Haenszel, el χ 2C de Cochran, el z de Fisher y el QA logit de asociación.
Estadístico χ 2MH de Mantel-Haenszel
La construcción de este estadístico se basa en calcular la suma de las

diferencias entre los valores observados y esperados. Este estadístico se
eleva al cuadrado y se estandariza a partir de la varianza hipergeométrica.
El resultado es un estadístico que sigue una χ 2 con un grado de libertad:

Propiedades
14) Las diferencias entre los valores observados y esperados, se pue-

den escribir de distintas formas:
15) En el caso de un estudio, k = 1, la %2MH de Mantel-Haenszel y la

χ2p de Pearson se encuentran relacionadas de la siguiente manera:
Demostración (14):
Demostración (15):
Estadístico χ2C de Cochran
La construcción de este estadístico se basa, al igual que el estadístico

de contraste anterior, en calcular la suma de las diferencias entre los

valores observados y esperados. Este estadístico se eleva al cuadrado y se

estandariza a partir de la varianza «dos-binomial», que resulta de susti-
tuir n2j . (nj - 1) por n3j en la varianza hipergeométrica. El resultado es un
estadístico que sigue una χ2 con un grado de libertad:
Propiedades
Demostración (16):
Estadístico z
En estudios prospectivos el estadístico de contraste z viene dado por:
En estudios retrospectivos el estadístico de contraste z viene dado por:

Propiedades
Demostración (17):
En lo referente al numerador:
Estadístico QA logit de asociación
En estudios prospectivos el estadístico de contraste viene dado por:
que sigue una distribución x2 con un grado de libertad.

En estudios retrospectivos el estadístico de contraste viene dado

por:
que sigue una distribución χ2 con un grado de libertad.
Ejemplo 6
Se supone que existen tres estudios realizados en los que se consi-
deran individuos expuestos y no expuestos a un factor de riesgo y que
se les observa un cierto tiempo para ver si desarrollan cierta enferme-
dad. Los resultados experimentales se resumen en las siguientes tres
tablas:
Se trata de determinar el estimado puntual conjunto de la diferencia

de riesgos, su intervalo confidencial y contrastar si su valor puede ser
cero.
Resolución
Como paso previo se calculan las ponderaciones w¡ para cada estudio,

que vienen dadas por los recíprocos de los estimados de la medida de
efecto en cada estudio.

La estimación puntual conjunta logit para la diferencia de proporcio-

nes viene dada por:
Para calcular el intervalo confidencial se necesita calcular como paso

previo , según se detalla a conti-
nuación:

Para contrastar Ho: π1L -π2L = 0 se presentan en detalle los siguientes

estadísticos de contraste: χ2MH de Mantel-Haenszel, χ2C de Cochran, z de
Fisher y QA logit de asociación.
El valor de la χ2MH de Mantel-Haenszel se calcula mediante:
A este valor le corresponde una p = 0,1469, con lo que se rechaza

la hipótesis de que la diferencia de proporciones sea nula.

El valor de la χ2C de Cochran se calcula mediante:
A este valor le corresponde una p = 0,1435, con lo que se rechaza la

hipótesis de que la diferencia de proporciones sea nula.
El valor de la z de Fisher se calcula mediante:


El valor de la QA logit de asociación se calcula mediante:

Riesgo relativo Mantel-Haenszel

La estimación conjunta de Mantel-Haenszel para el riesgo relativo
estudios es:
con la ponderación que recibe cada estudio en la estimación

conjunta. Obsérvese que en el caso de que , es decir, si sólo se tiene
un estudio.
Propiedades
Demostración (18):

El estimador conjunto de Mantel-Haenszel para el riesgo relativo
RRMH es asimétrico, con rango (0, +∞), por lo que su distribución es no
«normal». Para solucionar este inconveniente se consideran neperianos.
Para el cálculo del intervalo confidencial del LnRRMH se necesita calcu-
lar E[LnRRMH], V[LnRRMH] y EE[LnRRMH], que vienen dados por:
A partir de V[LnRRMH], se calcula su raíz cuadrada para determinar

el error estándar y así poder construir el intervalo confidencial del
LnRRMH:

Propiedades
19) Si k = 1, es decir, si sólo se tiene un estudio, V[LnRRMH] = V[LnRR].

Demostración (19):
El estadístico de contraste que se suele utilizar en el caso de combina-
ción de distintos riesgos relativos por el método de Mantel-Haenszel es
el estadístico de χ2MH de Mantel-Haenszel.
Estadístico χ2MH de Mantel-Haenszel
El estadístico χ2MH de Mantel-Haenszel se calcula mediante la siguien-

te expresión:
con Este estadístico sigue una
distribución con un grado de libertad.
Ejemplo 7
Se trata de aplicar la metodología Mantel-Haenszel a los datos del
Ejemplo 6 para el cálculo del estimado puntual conjunto del riesgo
relativo, su intervalo confidencial y contrastar si su valor puede ser
uno.

Resolución
La estimación puntual Mantel-Haenszel del riesgo relativo viene dada por:

previo E[LnRRMH], V[LnRRMH] y EE[LnRRMH], según se detalla a conti-
nuación:

Como paso último, sólo queda deshacer el cambio de los neperianos

El valor de la χ2MH de Mantel-Haenszel se calcula mediante:

A este valor le corresponde una p = 0,1469, con lo que no se rechaza

la hipótesis de que el riesgo relativo conjunto sea igual a uno.
Riesgo relativo logit

La estimación conjunta logit para el riesgo relativo
estudios es:
con:

dio, RRL = RR. Por otra parte señalar que el RRL no tiene por qué coinci-
dir con RRMH
El estimador conjunto Logit para el riesgo relativo RRL es asimétrico,
con rango (0, +∞), por lo que su distribución es no normal. Para solucio-
nar este inconveniente se consideran neperianos. Para el cálculo del
intervalo confidencial del LnRRL se necesita calcular E[LnRRL],
V[LnRRL] y EE[LnRRL], que vienen dados por:

A partir de V[LnRRL], se calcula su raíz cuadrada para determinar el

error estándar y así poder construir el intervalo confidencial del LnRRL:

Propiedades
20) Si k = 1, es decir, si sólo se tiene un estudio, V[LnRRL] = V[LnRR]
Demostración (20):

ción de distintos riesgos relativos por el método logit es el estadístico QA
logit de asociación.
El estadístico QA logit de asociación se calcula mediante la siguiente

expresión:
Ejemplo 8
Se trata de aplicar la metodología logit a los datos del Ejemplo 6 para
el cálculo del estimado puntual conjunto del riesgo relativo, su intervalo
confidencial y contrastar si su valor puede ser uno.
Resolución
Como paso previo se calculan las ponderaciones wj para cada estudio,


La estimación puntual conjunta logit de distintos riesgos relativos vie-

ne dada por:


previo E[LnRRL], V[LnRRL] y EE[LnRRL], según se detalla a continua-
ción:

El valor de la QA logit de asociación se calcula mediante:

la hipótesis de que el riesgo relativo conjunto sea igual a uno.
Odds ratio Mantel-Haenszel

Propiedades
21) El Odds Ratio ORMH se puede expresar en función de proporcio-

nes muéstrales:
23) El OR para datos pareados se deduce a partir del ORMH
Demostración (21):

Demostración (22):
Demostración (23):
Un estudio pareado se representa mediante:
Esta tabla se puede desdoblar en varias (t + r + s + u) tablas de la

siguiente forma:

Como consecuencia de este resultado se define el OR de datos parea-

dos como:
El estimador conjunto de Mantel-Haenszel para el odds ratio ORMH es
asimétrico, con rango (0, +∞), por lo que su distribución es no normal.
Para solucionar este inconveniente se consideran neperianos. Para el cál-
culo del intervalo confidencial del LnORMH se necesita calcular
E[LnORMH], V[LnORMH] y EE[LnORMH], que vienen dados por:
A partir de V[LnORMH]. se calcula su raíz cuadrada para determinar el

error estándar y así poder construir el intervalo confidencial del LnORMH:


Propiedades
24) Si k = 1, es decir, si sólo se tiene un estudio, V[LnORMH ] =

V[LnOR].
25) La varianza del OR para datos pareados se deduce a partir de la

varianza de LnORMH
Demostración (24):

Demostración (25):
Se parte de la configuración de los cuatro subtipos de tablas vistas

anteriormente:
Como consecuencia de este resultado se define la varianza del OR de

datos pareados como:
ción de distintos odds ratio por el método de Mantel-Haenszel es el esta-
dístico χ2MH de Mantel-Haenszel.
Estadístico χ2MH de Mantel-Haenszel
El estadístico de Mantel-Haenszel se calcula mediante la siguiente

expresión:
con Este estadístico sigue una
distribución con un grado de libertad.

Propiedades
26) El estadístico χ2 para datos pareados (McNemar) se deduce a

partir de χ2MH.
Demostración (26):
Se parte de la configuración de los cuatro subtipos de tablas vistas

anteriormente:
Como consecuencia de este resultado se define el estadístico para
datos pareados (McNemar) como:
Ejemplo 9
Se trata de aplicar la metodología Mantel-Haenszel a los datos del
Ejemplo 6 para el cálculo del estimado puntual conjunto del odds ratio,
su intervalo confidencial y contrastar si su valor puede ser uno.
Resolución
La estimación puntual Mantel-Haenszel del odds ratio viene dada

por:


previo E[LnORMH], V[LnORMH] y EE[LnORMH], según se detalla a conti-
nuación:



El valor de la de Mantel-Haenszel se calcula mediante:

la hipótesis de que el odds ratio conjunto sea igual a uno.

Odds ratio logit

La estimación conjunta logit para el odds ratio
estudios es:
siendo: la ponderación que reci-
be cada estudio en la estimación conjunta. Obsérvese que en el caso de

que k = 1, es decir, si sólo se tiene un estudio, ORL = OR.
El estimador conjunto logit para el odds ratio ORL es asimétrico, con
rango (0, +∞), por lo que su distribución es no normal. Para solucionar
este inconveniente se consideran neperianos. Para el cálculo del intervalo
confidencial del LnORL se necesita calcular E[LnORL], V[LnORL],
EE[LnORL], que vienen dados por:

A partir de V[LnORL], se calcula su raíz cuadrada para determinar el

error estándar y así poder construir el intervalo confidencial de LnORL:

Propiedades
27) Si k = 1, es decir, si sólo se tiene un estudio, V[LnORL] = V[LnOR].
Demostración (27):
ción de distintos odds ratios por el método logit es el estadístico QA logit
de asociación.

expresión:

Ejemplo 10
Se trata de aplicar la metodología logit a los datos del Ejemplo 6 para
el cálculo del estimado puntual conjunto del odds ratio, su intervalo con-
fidencial y contrastar si su valor puede ser uno.
Resolución
Como paso previo se calculan las ponderaciones wj para cada estudio,


La estimación puntual conjunta logit de distintos odds ratios viene

dada por:

previo E[LnORL], V[LnORL], EE[LnORL], según se detalla a continua-
ción:

Como paso previo sólo queda deshacer el cambio de los neperianos

El valor de la QA Logit de Asociación se calcula mediante:

la hipótesis de que el odds ratio conjunto sea igual a uno.

8
Teoría general logit
del Meta-Análisis
En este capítulo se desarrollan de forma completa las técnicas del

Meta-Análisis aplicadas a cualquier estudio y a cualquier medida de
efecto. La metodología que se presenta es la metodología logit, de mayor
generalidad que la metodología Mantel-Haenszel.
El enfoque logit tiene varias ventajas frente al enfoque Mantel-Haens-
zel: la primera es que la medida de efecto combinado se define sólo con
la ayuda de las varianzas de cada estimación de cada estudio. En segundo
lugar, el estadístico de contraste de asociación se deduce de forma inme-
diata. Y, por último, permite incorporar modelos de efectos fijos y mode-
los de efectos aleatorios.
Generalización de medidas de efecto

Se parte de k estudios en donde se tiene definida una medida de efec-
to o asociación cualquiera p. En cada estudio se dispone de una estima-
ción yj de ese µ, verificando el modelo yj = µ + ej, con ej ≈ N(0, σ2ej.) con lo
que yj ≈ N(µ, σ2ej). Se supone que se encuentra disponible una estimación
de la varianza σ2ej dada por V[yj].
La medida global (conjunta) del efecto, aplicando mínimos cuadra-
dos, viene dada por: que da un peso o pon-

deración objetiva a la información de cada estudio. Los estudios con

mayor variabilidad tiene menor peso en el estimado conjunto, por contra,
los de poca variabilidad tienen un peso mayor.
El enfoque logit tiene la ventaja, frente a Mantel-Haenszel, de que
podemos combinar cualquier medida de asociación y, resultante de k
estudios, sin más que conocer la varianza V[yj]. Así, por ejemplo:
El estimador conjunto logit da una medida global del efecto y verifi-
ca que: (ya que la combina-
ción lineal de normales es también normal), según se demuestra a conti-

nuación:

TEORÍA GENERAL LOGIT DEL META-ANÁLISIS 107
A partir de V[y], se calcula su raíz cuadrada para determinar el error

estándar y así poder construir el intervalo confidencial de y:
El estadístico de contraste que se emplea en la metodología logit es el
estadístico QA logit de asociación.

expresión:
Este estadístico sigue una distribución χ2, con un grado de libertad

bajo Ho: µ = 0.

El estadístico z y el estadístico QA son equivalentes, es decir, z2 = QA,

ya que:
Concepto de homogeneidad
A la hora de combinar información de distintos estudios se tiene que
verificar que esta información es relativamente homogénea o no hetero-
génea.
El estadístico de contraste que se emplea en la metodología logit
para contrastar la homogeneidad es el estadístico QH logit de homoge-
neidad.
Estadístico QH logit de homogeneidad
El estadístico Q H logit de homogeneidad se calcula mediante la

siguiente expresión:

Este estadístico sigue una distribución χ2 con k - 1 grados de libertad.

A partir de QH y de QA se define el estadístico QT logit total, que tiene la
y que sigue una distribución χ2 con k grados de libertad.
Propiedades
Demostración (28):
Demostración (29):

110 INTRODUCCIÓN ALANÁLISIS DE DATOS EN META-ANÁLISIS
Modelos de efectos fijos y aleatorios

El enfoque descrito anteriormente con yj = µ + ej, con ej ≈ N(0, σ2ej)
corresponde al Modelo de Efectos Fijos (FEM: Fixed Effects Model). El
Modelo de Efectos Aleatorios (REM: Random Effects Model) está des-
crito por:
Se supone que se encuentra disponible una estimación de la varianza

σ2ej dada por V[yj].
La medida global (conjunta) del efecto, aplicando mínimos cuadra-
dos, viene dada por:
con siendo la estimación de la varianza dada
por con la estimación de por el método de los

momentos.
Propiedades
30) La estimación de por el método de los momentos viene dada

por que se calcula como el máximo de cero y de:

Para que
y por tanto
* Observaciones. Se toma el máximo en relación al cero para asegurar que s§ sea no

negativa.

112 INTRODUCCIÓN ALANÁLISIS DE DATOS EN META-ANÁLISIS
El estimador conjunto logit en Modelos de Efectos Aleatorios verifi-
ca que: (ya que la combina-
ción lineal de normales es también normal), según se demuestra a conti-

nuación:
A partir de se calcula su raíz cuadrada para determinar el error

estándar y así poder construir el intervalo confidencial de
El estadístico de contraste que se emplea en la metodología logit para
ver la asociación es el estadístico QA logit de asociación y el estadístico
para contrastar la homogeneidad es el estadístico QH logit de homoge-
neidad.


expresión:
que sigue una distribución χ2 con un grado de libertad bajo Ho:µ = 0.
Estadístico QH logit de homogeneidad
El estadístico Q H logit de homogeneidad se calcula mediante la

que sigue una distribución χ2 con k - 1 grados de libertad.
El estadístico sigue una dis-
tribución χ2 con k grados de libertad.

Bibliografía
Berlín JA. Benefits of heterogeneity in Meta-Analysis of data from epidemio-

logic studies. Am J Epidemiol 1995; Vol. 142, N.° 4, 383-387.
Berlín JA. The use of Meta-Analysis in pharmacoepidemiology. Pharmacoepi-
demiology 1994; 525-547.
Chalmers TC, Lau J. Changes in clinical trials mandated by the advent of Meta-
Analysis. Statistics in Medicine 1996; Vol. 15, 1263-1268.
Delgado M, Sillero M.a, Gálvez R. Meta-Análisis en epidemiología (Segunda

Parte): Métodos cuantitativos. Grac. Sanit 1992; 6(28): 30-39.
DerSimonian R, Laird, N. Meta-Analysis in clinical trials. Controlled Clinical

Trials 1986; 7: 177-188.
Fleiss JL. Statistical methods for rates and proportions. New York, John Wiley
and Sons, 1981; Capítulo 10.
Guerra RL. La medicina basada en la evidencia: un intento de acercar la ciencia

al arte de la práctica clínica. Medicina Clínica 1996; 107: 377-382.
Hedges LV y Olkin I. Statistical methods for Meta-Analysis. New York, Acade-

mic Press, 1985.
Irwig L, Macaskill P, Glasziou P, Fahey M. Meta-Analytic methods for diagnos-

tic test accuracy. /. Clin. Epidemiology 1995; Vol. 48, 119-130.
Laird NM, Mosteller F. Some statistical methods for combining experimental

results. Int J Tech Ass Health Care 1990; 6: 5-30.
Lau J, Chalmers TC. The rational use of therapeutic drugs in the 21st century.
Int J Tech Ass Health Care 1995; 11(3): 509-522.
115

116 BIBLIOGRAFÍA
López JM, Qizilbash N. La medicina basada en pruebas: revisiones sistemá-

ticas. La colaboración Cochrane. Med. Clínica 1996; 107:581-585.
Marubini E, Valsecchi M. Analysing survival data from clinical trials and
observational studies. Statistics in Practice (Vic Barnett) 1995; Capítulo 11.
Olkin I. Meta-Analysis: reconciling the results of independent studies. Statistics
in Medicine 1995; Vol. 14,457-472.

índice por palabras
Administración, 5 ECCA, 4
Anchura, 34 Efectos,
Asimétrico, 55 aleatorios, 105
fijos, 105
Ensayo clínico, 4
Bayes, teorema de, 59 Error estándar, 35
Esperanza, 34
Estables, 14
Calidad científica, 8
Estadística descriptiva, 11
Cantidad de estudios no publicados, 10
Estadístico de contraste asociado, 34
Cantidad de información, 6
Estimación puntual, 11, 35
Centrado, 34
Estimador conjunto logit, 106
Chi-cuadrado, 28
Estudios
de asociación, 28
de homogeneidad, 28 no publicados, cantidad de, 10
Cochran, 74 prospectivos, 14
Cochrane, iniciativa, 7 retrospectivos, 14
Combinación, 7 Evidencia, 3
Confianza, 35 Evolución, 6
Consenso, 5
Contraste de hipótesis, 36 Factores de exposición, 11
Correlación, 4 FEM.30, 110
Crudos, 20 Fisher, 36
Frecuencias,
esperadas, 49
Datos pareados, 91 observadas, 49
Decisiones, 36 Fuentes de información, 9
Dicotómico, 34
Diferencia Generalizar, 36
de proporciones, 47 Grado de libertad, 75
de riesgos, 12, 54 Gráficas, 23
logit, 71
Diseños, 15 Heterogeneidad, 23
prospectivos, 45, 69 Hipótesis, 3
retrospectivos, 45, 70 Homogeneidad, 24
DR, 12 de trabajos, 8
117

118 ÍNDICE POR PALABRAS
Importancia, 19 Paradoja de Simpson, 20, 21

Información, Peso, 21
cantidad de, 6 Población, 9
homogénea, 108 Ponderación, 21
no heterogénea, 108 Ponderaciones,
Iniciativa Cochrane, 7 wj,77
Intervalo confidencial, Prevalencia, 34
deP1L-P2L,72 Probabilidad, 35
de la diferencia de proporciones, 48 Proporción, 33
de una proporción, 35 Protector, 13
de y, 107, 112 Pruebas estadísticas, 36
del LnOR, 66
del LnORL, 101 Qa logit de asociación, 88, 107
del LnRR, 55 Qh logit de homogeneidad, 113
del LnORMH, 93 logit de homogeneidad, 108, 113
del LnRRL, 87 Razón de productos cruzados, 13
del LnRRMH, 82 Recogida, 7
Intervalos de confianza, 11, 35 REM, 30, 110
Representación gráfica, 23
Listas de chequeo, 8 Revisiones, 5
Logaritmos neperianos, 55 Riesgo, 13
Logit, 22, 39, 69 relativo, 12, 54
Mantel-Haenszel, 81
Mantel-Haenszel, 22, 69 Riesgo relativo logit, 86
Marginales, 16, 54 RR, 13
Medicina basada en la evidencia, 3 Sesgo de publicación, 9
Medida de efecto, 9, 15 Simetría, 16, 54
global, 11
Metodología logit, 21, 29 Taylor, 39
Mínimos cuadrados, 105 Teorema central del límite, 16
Modelo de efectos, Teoría general logit, 106
aleatorios, 30, 110 Transformación,
fijos, 30, 110 arcoseno-raíz, 41
logit, 40
Normalidad, 28 neperiano, 41
Normalizar, 16 Transformaciones, 27
Odds, 13,57 Variable(s),

de enfermedad, 38, 57 dependiente, 45
de proporción, 33 explicativa, 45
de una proporción, 38 independiente, 45
logit, 100 respuesta, 45
Mantel-Haenszel, 90 transformadas, 39
ratio, 12, 16, 54 Varianza, 34
transversal, 16
OR, X2p de Pearson, 48
crudo, 20
logit, 27 z de Fisher, 48


Introducción Al Análisis de Datos en Meta-Análisis - Emilio Letón, Alejandro Pedromingo

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Introducción Al Análisis de Datos en Meta-Análisis - Emilio Letón, Alejandro Pedromingo

Uploaded by

Copyright:

Available Formats

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Reservados todos los derechos.

«No está permitida la reproducción total o parcial de este libro,

Ediciones Díaz de Santos, S. A.

Diseño de cubierta: Ángel Calvete

Estadísticos e-Books & Papers

Emilio Letón Molina

Alejandro Pedromingo Marino

Estadísticos e-Books & Papers

A mis padres Pilar y Alejandro

Estadísticos e-Books & Papers

Acerca de los autores......................................................................... VIl

3. Combinación de resultados de varios estudios

4. Más allá de la evidencia

Estadísticos e-Books & Papers

DESARROLLO TEÓRICO DE LAS MEDIDAS

6. En un estudio de dos variables dicotómicas

8. Teoría General logit del Meta-Análisis

Bibliografía ....................................................................................... 115

Índice por palabras .......................................................................... 117

Estadísticos e-Books & Papers

Queremos agradecer a todos los asistentes a nuestros cursos y semina-

Estadísticos e-Books & Papers

En la actualidad, la comunidad científica se encuentra desbordada por

Estadísticos e-Books & Papers

Estadísticos e-Books & Papers

Se define el Meta-Análisis como un conjunto de técnicas que permi-

Estadísticos e-Books & Papers

Tabla 1.1: Estudios ordenados por cantidad de evidencia aportada

Se considera que el ensayo clínico comparativo y aleatorizado contie-

Estadísticos e-Books & Papers

Otro caso más reciente lo encontramos en el trabajo de Richard Peto,

El Meta-Análisis y otras técnicas alternativas

Las revisiones de un experto sobre un tema son el método más em-

Estadísticos e-Books & Papers

la manera natural de procesar e integrar información, y sin lugar a dudas,

Cómo manejar la explosión de información

Estas cantidades aumentan si contabilizamos la información disponi-

Estadísticos e-Books & Papers

veremos algunos métodos para estimar el número de trabajos no publica-

Figura 1.1. Meta-Análisis: plan de acción.

Estadísticos e-Books & Papers

La fase de recopilación de información no es exclusiva del Meta-Análi-

Selección de trabajos y criterios de calidad

Calidad científica de los datos

Estadísticos e-Books & Papers

buen cumplimiento de las mismas. El problema de la calidad científica

Estimación del número de estudios no publicados

Estadísticos e-Books & Papers

Figura 1.2. Estimación del número de estudios no publicados.

En la fórmula de la Figura 1.2 se tiene que:

Estadísticos e-Books & Papers

Las técnicas matemáticas del Meta-Análisis utilizan básicamente los

Medidas de efecto en tablas de dos por dos

Variable explicativa dicotómica: Trat A / Trat B; Exp. + /Exp. -

Estadísticos e-Books & Papers

La presentación de los resultados experimentales de este tipo de estu-

En esta disposición de los datos se definen las probabilidades de

A partir de estas probabilidades de enfermedad se pueden definir

Diferencia de riesgos, riesgo relativo,

se pueden definir las siguientes medidas de efecto para el factor de expo-

Estadísticos e-Books & Papers