You are on page 1of 4

1er Examen Parcial Regresin Lineal y Series de Tiempo Primavera 2013 Los datos de su examen vienen del siguiente

artculo: Tunca, BT y Egeli U (1996). Cytogenetic findings on shoe workers exponed to long-term benzene. Environmental Health Perspectives, 104, 1313-1317. No necesitan consultar el artculo, a menos que as lo deseen (est disponible en J-Stor). Los datos contienen 78 renglones (individuos) y 5 columnas (variables). Los datos describen 58 trabajadores del calzado en Turqua con larga exposicin al benzeno y 20 individuos de control, que presumiblemente no estuvieron expuestos al benzeno. Las variables son age, edad en aos; exposure que mide la exposicin en aos (=0 para los controles); alcohol es el consumo de alcohol (1=s, 0=no); smoking mide el nmero de cigarros consumidos por da; y totalplus es el porcentaje de clulas en la muestra de sangre que presentan dao cromosomtico. Noten que necesitan construir la variable control, la cual ser 1 para los 20 controles que no estuvieron expuestos al benzeno, y 0 para los 58 trabajadores del calzado. Modelo #1 totalplus = 0 + 1age + 2exposure + 3smoking + con iid N(0,2) Modelo #2 totalplus = 0 + 1age + 2exposure + 3smoking + 4control + con iid N(0,2) donde control=1 si exposure=0 y control=0 si exposure>0. Necesitan construir esta variable control a partir de la variable exposure. El Modelo #1 tiene coeficientes , mientras que el modelo #2 tiene coeficientes , por lo que cada cosa tiene un nombre en particular. INSTRUCCIONES: Escriba su nombre en ambos lados de la hoja. Si una pregunta tiene distintas secciones, conteste todas y cada una de ellas. Escriba su nombre en campos lados de la hoja. Devuelva nicamente la hoja de respuestas debidamente impresa por ambos lados (una sola hoja). No entregue ninguna hoja adicional. No es necesario entregar ningn tipo de grfico. Las respuestas breves son ms que suficientes. Si en alguna pregunta se le pide que circule una opcin, en ese caso cuando circulen la respuesta correcta, su respuesta estar correcta, y si circulan la respuesta equivocada, su respuesta ser la incorrecta. Si tacha una respuesta, no importa si esta es correcta o no, la respuesta ser incorrecta. ESTO ES UN EXAMEN. No discuta este examen con NADIE. Si discuten el examen con alguien, estn haciendo trampa.

NOMBRE:___________________________________________________________________________________ 1er EXAMEN PARCIAL DE REGRESIN LINEAL Y SERIES DE TIEMPO. PRIMAVERA 2013. HOJA DE RESPUESTA No. 1 ESTO ES UN EXAMEN. NO LO DISCUTA CON NADIE. Pregunta 1 Circule la respuesta correcta 1.a. Los trabajadores expuestos al benzeno y VERDADERO FALSO* los no expuestos son muy similares en trminos de las variables age y smoking 1.b. Las variables age y exposure no estn VERDADERO FALSO* relacionadas. 1.c. La variable smoking no puede ser VERDADERO FALSO* utilizada como predictor (X) en una regresin, porque no est distribuida Normal. 1.d. Todos los controles tienen valores totalplus que estn por debajo del menor VERDADERO FALSO* cuartel de los valores de aquellos trabajadores que s han estado expuestos. 2. Al responder la pregunta 2, asuma de manera tentativa que el modelo #1 es verdadero. Otras preguntas ms adelante preguntaran sobre si el modelo ajusta bien, etc. Pregunta 2, basada en el Modelo #1 Responda o circule la respuesta correcta 2.a. Pruebe la hiptesis H0: 2=0 in el modelo Nombre ____Prueba T_________ Valor:___7.272___ #1. Cul es el nombre del estadstico de prueba? Cul es el valor numrico de dicho estadstico? Cul es el valor p de dos colas de p-value: 3.05e-10 este estadstico? Es la hiptesis nula PLAUSIBLE NO PLAUSIBLE* plausible? Nombre ___Prueba F__________ 2.b. Pruebe la hiptesis H0: 1=2=3=0 en el modleo #1. Cul es el nombre del estadstico Valor:______23.88________ de prueba? Cul es el valor numrico de p-value: 6.522e-11 dicho estadstico? Cul es el valor p de dos colas de este estadstico? Es la hiptesis nula PLAUSIBLE NO PLAUSIBLE* plausible? 2.c. LA correlacin entre los valores VERDADERO * FALSO observados y los ajustados de totalplus en el modelo #1 es 0.701 raiz de R2=.7012 VERDADERO * 56.9572 2.d. El estimador insesgado de s2 en el modelo #1 es aproximadamente 56.96 FALSO 2.e Basado nicamente en el resumen del modelo ajustado #1, parece ser que una mayor asociacin al benzano est asociada con mayores niveles de dao cromosmico, que una mayor edad est asociada con menores valores y que fumar podra no estar relacionado con el nivel de dao cromosmico en este estudio.

VERDADERO*

FALSO

NOMBRE:___________________________________________________________________________________ 1er EXAMEN PARCIAL DE REGRESIN LINEAL Y SERIES DE TIEMPO. PRIMAVERA 2013. HOJA DE RESPUESTA No. 3 ESTO ES UN EXAMEN. NO LO DISCUTA CON NADIE. 3. Calcule los residuales del modelo #1 y utilice los resultados para responder. Pregunta 3, basada en el modelo #1 Circule la respuesta correcta 3.a. El diagrama de caja de los residuales VERDADERO FALSO* provee de clara evidencia de las observaciones aberrantes 3.b. El grfico de quantiles normales de los Duda residuales sugiere que los residuales tienen VERDADERO* FALSO colas largas comparadas con la distribucin normal, i.e., los residuales no son propensos a observaciones extremas que la Normal. 3.c. La prueba de Shapiro prueba que los VERDADERO* FALSO residuales se distribuyen Normal, con un valor p de 0.062 aproximadamente, por lo que la distribucin Normal no puede ser rechazada al nivel de 0.05, pero est muy cerca de ser rechazada. 3.d. Grafique los residuales Vs los valores VERDADERO * duda ajustados. Grafique los residuales Vs la FALSO variable exposure. Incluya un suavizamiento menor. Estos grficos no muestran ningn patrn 4. Ajuste el modelo #2, y responda la siguiente pregunta. Pregunta 4, basada en el modelo #2 Responda o circule la respuesta Nombre _____________ 4.a. Pruebe la hiptesis h0: 1=2=0 en el Valor:______________ modelo #2. (Es decir, la hiptesis de que los coeficientes age y exposure son 0). Cul es el nombre del estadstico de prueba? Cul es el p-value______________________ valor numrico de dicho estadstico? Cul es NO PLAUSIBLE el valor p de dos colas de este estadstico? Es PLAUSIBLE la hiptesis nula plausible? 4.b. Grafique totalplus Vs age y calcule la correlacin. Haga lo mismo para los 20 RAZONABLE individuos de control nicamente. Ahora haga lo mismo para los 58 trabajadores expuestos. Es razonable en estos datos, enfatizar la NO RAZONABLE importancia de la edad como predictor del dao cromosmico? 4.c. Cul es la R2 del modelo #1 y cul la del Modelo #1 _0.4918_ modelo #2? Modelo#2 0.6402 4.d. Si la exposicin actual al benzeno ha YES NO producido un dao cromosmico visible en las muestras de sangre, pero la exposicin de mucho tiempo no fuera visible, eso explicara mucho de lo que se observa en los modelos #1 y #2?

You might also like