You are on page 1of 11

Examen de Estadistica multivariante: interpretacin de resultados- 23 de junio 2012

No cuenta negativos
Hay una hora para completar el examen.

1. Puede plantear algn problema la introduccin de la presin arterial sistlica y la presin


diastlica como variables independientes en un modelo de regresin lineal mltiple?
1. No plantea ningn problema ya que la informacin que proporcionan es complementaria.
2. Puede existir un problema de colinealidad entre ambas variables.
3. Una alternativa inadecuada sera crear una nueva variable que sea la media de las dos
presiones.
4. Una alternativa inadecuada sera crear una nueva variable que sea la diferencia de las dos
presiones.
5. Debera usarse siempre regresin logstica en estos casos.

2. Qu valor del coeficiente de correlacin debemos hallar entre dos variables independientes
para necesariamente tener que excluir una de las dos del modelo de regresin lineal
multivariante?
1. r 0,8
2. Entre 0,8 y 0,9
3. r > 0,9
4. La correlacin entre dos variables no es un criterio til para decidir si se introduce una variable
en el modelo.
5. Debe valorar el coeficiente de determinacin, no la correlacin.

3 Cul de las siguientes respuestas es la ms adecuada para valorar si estamos siguiendo el


principio de parsimonia?
1. Comprobar el valor de R2
2. Comprobar el valor de R2 ajustado
3. Comprobar el factor de inflacin de la varianza.
4. No introducir ms de una variable independiente por cada 20 sujetos que haya en la base de
datos.
5. Valorar trminos de producto entre cad apreja de dos nuevas variables introducidas

4. Qu se puede interpretar a partir de la siguiente representacin grfica de los residuales?


5 x calories

1. Los residuales del modelo se apartan totalmente de la normalidad.


2. Existe una dispersin homognea que sugiere igualdad de varianzas.
3. Heteroscedasticidad
4. Esta grfica no es til si no se conoce el tamao de muestra.
5. Alta colinealidad

1
5. En relacin con el anlisis de regresin lineal mltiple, cul de las siguientes afirmaciones
es cierta?
1. Se debe hacer una transformacin de toda variable continua antes de introducirla en el
modelo.
2. Las variables independientes se introducirn en el modelo multivariable slo si el valor p de la
regresin univariante tiene un valor p < 0.10
3. Los valores perdidos se recodificarn en todas las covariables asignndoles un valor arbitrario
y distinto de un sujeto a otro para tener el mismo nmero de individuos en todos los anlisis.
4. Las variables con un valor p > 0,05 sern retiradas del modelo multivariable.
5. Se pueden introducir covariables que sean policotmicas, con k categoras, mediante k-1
variables dummy.

6. Dnde encontrar el ANCOVA en SPSS?


1. Modelo lineal general.
2. Comparacin de medias.
3. Regresin lineal.
4. Regresin curvilnea.
5. Regresin logstica.

Preguntas 7-11. El siguiente listado valora el riesgo de cadas en ancianos. La unidad


de tiempo son das.
Tabla de supervivencia
Proporcin acumulada que N de
sobrevive hasta el eventos N de casos que
momento acumulados permanecen

Tiempo Estado Estimacin Error tpico


18 Cada ,967 ,033 1 29
23 Cada ,933 ,046 2 28
34 Cada ,900 ,055 3 27
49 No cada . . 3 26
67 Cada ,865 ,063 4 25
77 Cada ,831 ,069 5 24
79 Cada A??? ,074 6 23
98 No cada . . 6 22
98 No cada . . 6 21
125 Cada ,758 ,080 7 B??
150 No cada . . 7 ??
150 No cada . . 7 ??
186 No cada . . 7 17
189 Cada ,714 ,087 8 16
220 Cada ,669 ,092 9 15
267 No cada . . 9 14
300 No cada . . 9 13
315 Cada ,618 ,098 10 12
340 Cada ,566 ,103 11 11
365 No cada . . 11 10
365 No cada . . 11 9
365 No cada . . 11 8
365 No cada . . 11 7
365 No cada . . 11 6
365 No cada . . 11 5

2
365 No cada . . 11 4
365 No cada . . 11 3
365 No cada . . 11 2
365 No cada . . 11 1
365 No cada . . 11 0

7. Este anlisis corresponde a


1. Kaplan-Meier
2. Kruskal-Wallis
3. Log-rank
4. Regresin de Cox
5. Nada de lo anterior

8. La hiptesis nula es
1. Igualdad de supervivencia
2. Mayor riesgo en ancianos que en ancianas
3. Igualdad de medianas (que no de medias) de supervivencia acumulada
4. No hay hiptesis nula alguna formulada en esta tabla (por eso no hay valores p)
5. Nada de lo anterior es completamente correcto

9. El supuesto bsico de este anlisis es


1. La mediana es igual en los dos grupos
2. Homoscedasticidad o igualdad de varianzas
3. Normalidad de la variable dependiente
4. Normalidad de los residuales
5. Censura no informativa

10. Cunto valen A y B?


1. A= 0.831 (24/23) y B = 20
2. A= 0.831 (24/23) y B = 19
3. A= 0.831 (24/23) y B = 21
4. A= 0.831 (23/24) y B = 20
5. A= 0.831 (23/24) y B = 19

11. Cunto vale la mediana del tiempo de supervivencia?


1. 19
2. 220 das
3. 365 das
4. (267+220)/2
5. Afortunadamente no es posible calcularlo

3
Preguntas 12-16. Se presenta una tabla del trabajo de Bes-Rastrollo et al. en Am J Clin Nutr 2009
sobre ingesta de frutos secos (nuts) y riesgo de desarrollar obesidad en mujeres
norteamericanas seguidas desde 1991-99.

_______________________________________________________________________________________________________________________________________________________
_____________________________
2 Multivariate model adjusted for age (continuous), baseline alcohol intake (0, 0.14.9, 5.09.9, 101 g/d), physical activity
(quintiles metabolic equivalent score), smoking (never, past, current, missing), postmenopausal hormone use (no,
current or past, missing), oral contraceptive use (no, current, missing), baseline BMI (continuous), glycemic load, and
intakes of total fiber, trans fat, fruit, vegetables, red meat, processed meat, refined grain, whole grain, snacks, sugar-
sweetened beverages, diet beverages, low-fat dairy products, and high-fat dairy products (continuous) at baseline.
3 Multivariate model adjusted for multivariate model 2 + changes in the adherence of prudent and Western dietary

patterns.

12. Corresponde a un modelo multivariante de


1. Regresin lineal mltiple
2. Regresin logstica
3. Regresin de Poisson
4. Regresin de Cox
5. Analsis de la varianza (1 va)

13. El nmero total de mujeres incluidas en este estudio es aproximadamente


1. <1.000
2. 1.000-5.000
3. 5.001-10000
4. >10.000
5. No es posible saberlo, ni siquiera aproximadamente

14. El nmero total de casos nuevos de obesidad observados en el estudio fue


1. <1.000
2. 1.000-5.000
3. 5.001-10000
4. >10.000
5. No es posible saberlo, ni siquiera aproximadamente

15. La hiptesis nula principal mantendr que


1. El riesgo de obesidad no vara con el consumo de frutos secos
2. Hay mayor riesgo de obesidad si se consumen ms frutos secos
3. Hay menor riesgo de obesidad si se consumen ms frutos secos
4. Quienes no consumen frutos secos no tienen riesgo de obesidad
5. No hay hiptesis nula en este anlisis

4
16. Con respecto al riesgo de obesidad se encontr que
1. No variaba significativamente segn niveles de consumo de frutos secos en ninguno de los
anlisis
2. Slo variaba significativamente segn niveles de consumo de frutos secos en anlisis que no
ajustaban por factores de confusin
3. En el anlisis comparativo de cada categora con la de referencia, slo se observ un riesgo de
obesidad significativamente inferior en la categora de consumo de 1 vez a la semana cuando
se hizo el ajuste por todos los factores de confusin considerados
4. El riesgo era significativamente superior en las que consuman dos o ms veces por semana
5. Slo variaba significativamente segn niveles de consumo de frutos secos en anlisis que
ajustaban por factores de confusin, pero no en el anlisis crudo (no ajustado)

Preguntas 17-20. Se ha comparado si la frecuencia con que se tiene insomnio actualmente


("insomn_act") difiere entre hombres y mujeres. Se han recodificado ambas variables para que
valgan 0 1, tal como se muestra entre parntesis en la siguiente salida de SPSS
Tabla de contingencia insomn_act sexo
Recuento
sexo Total
mujer (0) varn (1) mujer (0)
insomn_act no tiene insomnio ahora (0) 108 64 172
insomnio actualmente (1) 6 2 8
Total 114 66 180

17. Cunto valdra la constante u ordenada en el origen si se ajustaste un modelo de regresin


logstica binaria simple a estos datos considerando el insomnio como variable dependiente?
1) la odds de insomnio en la mujer
2) la odds de insomnio en el varn
3) ln(6/2)
4) ln(6/108)
5) nada de lo anterior

18. Cunto valdra la pendiente o coeficiente b en el mismo modelo de regresin logstica?


1) la odds de insomnio en la mujer
2) la odds de insomnio en el varn
3) ln(6/2)
4) ln(6/108)
5) nada de lo anterior

19. Cunto valdra la odds ratio?


1) (108/172) / (114/180)
2) (2/64) / (6/108)
3) ln[(6/2)/(108/64)]
4) ln[(6/108)/(2/64)]
5) nada de lo anterior

20. Cul de las siguientes es la mejor interpretacin de estos resultados?


1) En los varones el riesgo (odds) de insomnio se reduce al 30% de lo que sucede en las
mujeres
2) Las mujeres tienen un riesgo significativamente superior de tener insomnio
3) Si no hubiese diferencias significativas entre hombres y mujeres en el riesgo de insomnio en
la poblacin, habra una probabilidad relativamente alta de encontrar estos resultados
4) La odds de tener insomnio en hombres es menor que en mujeres (en hombres la odds es el
56,3% de la odds en mujeres)
5) nada de lo anterior

5
21. Qu es un factor de confusin?
1) Una tercera variable (z) que hace que el efecto de la x sobre la y sea distinto en funcin del
nivel de z
2) Una variable asociada a la vez a la dependiente y a la independiente y que distorsiona la
relacin entre ellas, sin ser un eslabn causal intermedio
3) Una tercera variable, que no aparece habitualmente en el planteamiento del problema, pero
que si no se tiene en cuenta podra hacer que los resultados no fuesen estadsticamente
significativos
4) Una variable que es consecuencia, resultado o efecto simultneamente tanto de la x como de
la y en modelos de regresin
5) Una variable que produce cambios significativos en la asociacin

22. Un factor de confusin


1) Equivale a un modificador del efecto, de modo que, para conocer el efecto de una variable, se debe
especificar el nivel del factor de confusin donde se mide el efecto
2) Es una variable que distorsiona los resultados de un estudio por actuar de eslabn intermedio
(entre otras caractersticas) entre la exposicin y el efecto
3) Es una variable que es causada tanto por la exposicin como por el efecto
4) Es una variable que se asocia con el efecto slo entre los expuestos al factor de riesgo
5) Nada de lo anterior es cierto

23. Sabemos que los fumadores tienden a tener HDL ms bajo y que HDL protege de
enfermedad coronaria Qu es lo ms probable que puede pasarle a la odds ratio de
enfermedad coronaria para el hecho de ser fumador, si en vez de presentarlo sin ajustar se
ajusta mediante un modelo de regresin logstica por HDL?
1. No cambiar
2. Slo cambiar su intervalo de confianza, que se har ms ancho
3. Slo cambiar la estimacin puntual, que se alejar del valor nulo
4. Cambiar su intervalo de confianza, que se har ms ancho y, ademas, la estimacin puntual se
alejar del valor nulo
5. Nada de lo anterior

24. Cul de las siguientes expresiones NO es correcta respecto al metanlisis?


1. Suele resultar ms vlido en estudios no experimentales que en los ensayos.
2. El intervalo de confianza suele ser ms amplio cuando se usa el modelo de efectos
aleatorios que cuando se usa el de efectos fijos.
3. Existe abundante software que facilita mucho las tareas cuantitativas
4. En el fondo, desde el punto de vista cuantitativo, viene a ser anlogo a estimar una media
ponderada
5. A veces es ms importante buscar las causa de una heterogeneidad que tratar de integrar
cuantitativamente los estudios disponibles

25. Qu es un intervalo de confianza?


1. Un rango de valores poblacionales donde puede encontrarse el estimador muestral
2. Un horquilla de probabilidad (muy alta) donde el estimador coincidira con el parmetro
3. La proporcin de estimadores que son consistentes con el parmetro
4. Un rango de valores crebles para un parmetro
5. La probabilidad de rechazar acertadamente la hiptesis nula

26. Qu es un valor p de significacin estadstica?


1. La probabilidad de que unos datos se adapten a la distribucin normal
2. La probabilidad de encontrar una muestra tan distante o ms que sta de la hiptesis nula
(H0), si H0 fuese cierta
3. La probabilidad de equivocarse al afirmar que las diferencias no son significativas
4. La probabilidad de que la hiptesis nula (H0) sea cierta en un contraste de hiptesis, cuando
H0 establece la ausencia de efecto
5. La capacidad de rechazar correctamente la hiptesis nula

6
27. Qu es la potencia estadstica?
1. La capacidad de demostrar que la hiptesis nula es cierta
2. La capacidad que tiene un estudio para obtener conclusiones vlidas y libres de sesgo
3. La probabilidad de equivocarse al afirmar que las diferencias no son significativas
4. La probabilidad de que la hiptesis nula (H0) sea cierta en un contraste de hiptesis, cuando
H0 establece la ausencia de efecto
5. La capacidad de rechazar correctamente la hiptesis nula

28. Qu es un factor de confusin?


1. Una variable que muestra interaccin con otra sobre el mismo efecto
2. Un factor que produce un error de medicin que impide valorar con precisin una exposicin
3. Un factor que hace de eslabn intermedio en la cadena causal entre la exposicin que se
estudia y el efecto que se le atribuye
4. Un factor que est estadsticamente asociado tanto a la exposicin que se estudia como al
efecto que se le atribuye
5. Una variable que comparte causas comunes tanto con la exposicin como con el efecto

29. Al riesgo instntaneo de presentar un evento, es decir, al cociente entre quienes presentan
el evento y quienes estaban a riesgo de presentarlo, se le denomina en ingls
1) hazard
2) odds
3) hazard ratio
4) odds ratio
5) nada de lo anterior

30. En un contraste de hiptesis es cierto que


1. La hiptesis nula suele mantener que el parmetro poblacional vale 0
2. Habitualmente, para calcular un valor z bastar dividir el estimador por su error estndar para
hallar el valor z.
3. El valor z calculado supone un contraste entre la realidad y la hiptesis nula (H0) y permite
calcular la probabilidad (valor p) de que se d la diferencia observada en la muestra o una
todava ms alejada de H0 si H0 fuese cierta
4. 2 y 3 son correctas
5. 1, 2 y 3 son correctas

31. El lmite inferior del intervalo de confianza (IC) al 95% vale 1,25 para una hazard ratio (HR) de
2,50, cunto valdr el lmite superior de confianza para esta HR?
1) 3,75
2) 4
3) 5
4) 7,5
5) No puede saberse

32. Seale cul de los siguientes binomios es correcto:


1. variable independiente cuantitativa regresin lineal mltiple
2. variable dependiente cualitativa dicotmica regresin de Cox
3. variable dependiente ordinal regresin de Cox
4. variable independiente cualitativa dicotmica regresin logstica
5. variable dependiente cualitativa con dos categoras regresin logstica

7
33. Los modelos multivariables permiten todo lo siguiente, EXCEPTO:
1. Controlar posibles factores de confusin
2. Valorar la interaccin
3. Hacer predicciones
4. Calcular intervalos de confianza a los estimadores obtenidos
5. Permiten todo lo anterior

Preg. 34-38. Para valorar la posible asociacin entre el consumo de alcohol (0-no consumo; 1-
consumo) y el riesgo de sufrir un accidente de trfico, se construy un modelo de regresin
logstica para valorarla. Se obtuvieron los siguientes resultados:
95,0% C.I.for
B S.E. Wald df Sig. Exp(B) EXP(B)
Lower Upper
Alc ,693 ,058 11,979 1 ,001 2,000 1,620 2,469
Constant -,693 ,500 1,922 1 ,166 ,500
a Variable(s) entered on step 1: Alc.

34. Seale la opcin correcta a la vista de estos resultados:


1. No se observ una asociacin estadsticamente significativa entre el consumo de alcohol y el riesgo
de presentar un accidente de trfico.
2. El consumo de alcohol es protector frente a un accidente de trfico (OR=0,693).
3. En este modelo no se ha valorado ninguna interaccin.
4. El modelo est ajustado por posibles factores de confusin.
5. Para poder construir este tipo de modelo ha tenido que existir un tiempo de seguimiento de los
pacientes.

35. A la vista de estos resultados Cuntos sujetos tena en total la muestra?


1. <100
2. 100-200
3. 201-500
4. >500
5. No puede saberse

36. A la vista de estos resultados Cuntos casos de accidentes de trfico se observaron?


1. <10
2. 10-20
3. 21-50
4. >50
5. No puede saberse

37. A la vista de estos resultados es cierto que


1. Se construyeron tres variables dummy
2. Se valor confusin, mediante un test de Wald que result significativo
3. La variable independiente es dicotmica
4. Existe poco riesgo de confusin residual
5. Nada de lo anterior es correcto

38. La constante (a) en un modelo de regresin logstica


1.Es una odds ratio
2.Es el logaritmo neperiano de la odds cuando todas las covariables valen 0
3.Es una Hazard ratio
4.Es el logaritmo neperiano de la odds ratio
5.Es el logaritmo neperiano de la odds en los no expuestos

8
39. En un modelo de regresin logstica, obtenemos el siguiente modelo predictivo:

ln (odds de HTA)= 10,5 + 0,9*edad

Cul sera la OR de HTA para un incremento de edad de 5 aos? Tenga en cuenta que la
variable de edad est recogida en aos.
1. =exp(0,9)
2. =5*0,9
3. =exp(10,5+0,9*5)
4. =exp(5*0,9)
5. =5*exp(0,9)

40. Los coeficientes b de un modelo de regresin de Cox se interpretan como


1. Diferencias de medias
2. Diferencias de proporciones
3. Logaritmos neperianos de la odds
4. Logaritmos neparianos del hazard (~riesgo instantneo)
5. Logaritmos neparianos de la hazard ratio (~riesgo relativo)

Preguntas 41-42.
Se han sutituido dos conceptos del siguiente texto por AAAA y BBBB.
La caracterstica que ms decisivamente influye en el clculo de los valores p es AAAA. Por
eso, cuando un resultado no es significativo, hay que fijarse mucho en AAAA antes de
interpretarlo. En cambio, si AAAA es muy grande, muchas de las diferencias, por pequeas que
sean, pueden resultar significativas y entonces en lo que hay que fijarse ms es en BBBB y no
hacer excesivo caso a los valores p. En general, interesa ms BBBB que lo nfimo que pueda
parecer un valor p. BBBB se refiere a la diferencia concreta que existe entre dos medias o entre
dos proporciones, o, en epidemiologa, al valor del riesgo relativo, odds ratio o razn de tasas.
41. A qu corresponde AAAA?
1) la potencia estadistica
2) el tamao muestral
3) la magnitud del efecto
4) el intervalo de confianza
5) la hiptesis alternativa

42. A qu corresponde BBBB?


1) la potencia estadistica
2) el tamao muestral
3) la magnitud del efecto
4) el intervalo de confianza
5) la hiptesis alternativa

43. En un test de hiptesis, el error consistente en aceptar de manera definitiva la hiptesis nula
e interpretar que un resultado no significativo es lo mismo que conseguir demostrar
fehacientemente la igualdad, equivaldra a:
1) Error tipo 1
2) Error tipo 2
3) Alfa
4) Beta
5) Confundir no significativo con demostracin de equivalencia

9
Preguntas 44-47. Se lee el siguiente resumen de un estudio.
En un estudio epidemiolgico en el que se sigui a 12.059 voluntarios, todos ellos graduados
universitarios e inicialmente libres de depresin, durante una mediana de 6,1 aos, se encontr
que la ingestin de grasa trans se asociaba a un incremento del riesgo de desarrollar depresin
sudrante el seguimiento, con riesgos relativos (intervalos de confianza del 95%) segn quintiles
sucesivos de ingestin de grasas trans: 1 (ref), 1,08 (0,82-1,43), 1,17 (0,88-1,53), 1,28 (0,97-1,68) y
1,42 (1,09-1,84). El valor p de tendencia lineal fue de 0,003. Los resultados se ajustaron por edad
y sexo y por diversos factores de riesgo tanto de estilo de vida como nutricionales y no
cambiaron sustancialmente. Todos los participantes estaban inicialmente libres de depresin,
pero se consideraron casos incidentes aquellos que durante el seguimiento referan que un
mdico les haba diagnosticado y/o tratado de una depresin clnica. (Snchez-Villegas A,
Verberne L, De Irala J, Ruz-Canela M, Toledo E, Serra-Majem L, Martnez-Gonzlez MA. Dietary
fat intake and the risk of depression: the SUN Project. PLoS One. 2011;6:e16268).

44. Qu diseo se ha utilizado?


1. Cohorte prospectiva
2. Casos y controles
3. Estudio de intervencin
4. Ensayo aleatorizado
5. Estudio de correlacin ecolgica

45. Cul de los siguientes modelos multivariantes se habr empleado ms probablemente?


1) ANCOVA
2) Regresin lineal mltiple
3) Regresin logstica
4) Regresin de Cox
5) Modelo lineal general (univariante, segn SPSS)

46. A partir de qu quintil de ingesta de grasa trans se puede decir que hay diferencias
estadsticamente significativas (p<0,05) en la incidencia de depresin comparado con la
categora de referencia?
1) 1.
2) 2.
3) 3.
4) 4.
5) 5.

47. A raz de la publicacin de este artculo, oye comentar en la televisin que la grasa trans
incrementa el riesgo de depresin en un 42%; si se refiere a la comparacin entre quintiles
extremos, a qu medida epidemiolgica se estn refiriendo?
1) Riesgo relativo
2) Incremento absoluto del riesgo
3) Riesgo atribuible en expuestos
4) Fraccin etiolgica en expuestos
5) Incremento relativo del riesgo

48. Si se observa que la odds ratio (OR) cruda de c-HDL bajo es de 2,5 para la cardiopata
isqumica, pero al ajustar este resultado por sexo, edad y el nmero de cigarrillos fumados al
da la OR es de 1,3. Es cierto que:
1) Existe interaccin entre c-HDL y tabaco
2) El c-HDL modifica la relacin entre consumo de tabaco y cardiopata isqumica
3) El c-HDL causa un sesgo de informacin
4) La verdadera OR es 2,5
5) La verdadera OR es 1,3

10
49. En un estudio sobre deterioro cognitivo, los resultados del anlisis multivariable muestran
que el deterioro cognitivo se acelera ms con la edad en los fumadores que en los no
fumadores. Las diferencias segn el tabaco no son homogneas sino que aumentan con la
edad, de manera que hay un mayor deterioro cognitivo asociado a la edad en fumadores y hay
mayores diferencias entre fumadores y no fumadores a medida que aumenta la edad. Con esta
informacin usted concluye que:
a. Hay interaccin entre el tabaco y el deterioro cognitivo
b. nicamente se ha ajustado por edad y no por tabaco
c. La edad y el tabaco son factores de confusin en este estudio
d. En el anlisis multivariable se ha introducido un trmino de producto edad*tabaco
e. Se ha cometido un sesgo de seleccin, ya que la distribucin de fumadores segn la edad no es
homognea

50. En un estudio de casos (n=100) y controles (n=200) la frecuencia de exposicin en casos es


del 80% y la frecuencia de exposicin en controles es del 50%. Si se ajustase un model de
regresin logstica crudo cunto valdra la odds ratio?
1. Es imposible responder a esta pregunta
2. 3,2
3. 4
4. 8
5. 80

11

You might also like