You are on page 1of 6

Taller 1 Regresion Lineal Simple Fecha de entrega: Mayo 22

Los ejercicios 1 a 4 deben ser realizados por todos los grupos. De los ejercicios restantes, a cada grupo ha sido asignado uno (ver Tabla 8) . Para la entrega de la solucion debe anexar las gracas pedidas y el programa R usado en un ap ndice o anexo. e 1. Considere el modelo de regresion lineal simple Y = 200 + 5X + E, E N (0, 16). a) Halle la distribucion de Y para X = 10, 20, 40. b) Explique el signicado de 0 y 1 en este caso, asuma que la cobertura del modelo incluye a X = 0. 2. Suponga un modelo de regresion lineal simple Y = 100 + 20X + E, con E N (0, 25). Si X es observado en un valor de 5 cual es la probabilidad de que Y tome un valor entre 195 y 205? 3. La funcion de regresion que relaciona el volumen de produccion (Y ) de un operario des pu s de haber tomado un programa de entrenamiento, con el volumen de produccion que e tena antes del programa de entrenamiento (X), es E[Y |X] = 20 + 0.95X, con X variando entre 40 y 100. Un analista arma que el programa de entrenamiento no conduce a incremento en el volumen de produccion promedio debido a que 1 < 1. Comente acerca de tal armacion. 4. La experiencia con cierto tipo de plastico indica que existe una relacion entre Y : dureza del item moldeado (medida en grados brinell) y X: tiempo transcurrido desde la terminacion del proceso de moldeo. Para estudiar esta relacion se seleccionan 4 tiem pos (tratamientos) desde la terminacion del proceso para obtener luego la medida de la dureza. Para el estudio se disponen de 16 lotes (unidades experimentales). Cada tratamiento sera asignado a 4 de las unidades, aleatoriamente. Use un generador de numero aleatorios para realizar la asignacion aleatoria apropiada. 5. El Director de admisiones de una universidad aplico un nuevo test de admision a 20 estudiantes de primer ano seleccionados aleatoriamente, con el n de determinar si el promedio de notas al nal del primer ano (GPA) puede ser predicho a partir del puntaje de la prueba de ingreso. Los resultados se presentan en la Tabla 1. a) Identique la variable respuesta y la variable predictora. Haga un graco de disper sion con la curva de regresion loess Puede ser el MRLS apropiado? 20 20 20 20 20 2 b) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Exprese y calcule 0 y 1 en t rmie i nos de estos valores e interprete los valores obtenidos. c) Obtenga la estimacion de la desviacion estandar de los parametros estimados. In dique claramente cuanto vale cada t rmino involucrado en los calculos. Construya e un I.C del 95 % para los parametros del modelo de regresion asumiendo que son validos los supuestos. Pruebe la signicancia del modelo de regresion e interprete a la luz del problema. 1
iid iid

d) Obtenga una estimacion puntual y un intervalo de conanza para la media de GPA para estudiantes con un puntaje en la prueba de ingreso de 5.0.

Tabla 1: Datos problema 5


ID. Sujeto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Nota nal 1er ano (GPA) 3.10 2.30 3.00 1.90 2.50 3.70 3.40 2.60 2.80 1.60 2.00 2.90 2.30 3.20 1.80 1.40 2.00 3.80 2.20 1.50 Puntaje de ingreso 5.50 4.80 4.70 3.90 4.50 6.20 6.00 5.20 4.70 4.30 4.90 5.40 5.00 6.30 4.60 4.30 5.00 5.90 4.10 4.70

6. Una empresa distribuye cierto computador de escritorio y proporciona servicio de reparacion y mantenimiento preventivo de tales equipos. Los datos en la Tabla 2 fueron tomados de 18 solicitudes recibidas de mantenimiento preventivo. Sea X: el numero de equipos servidos y Y : el tiempo en minutos dedicado por el t cnico que atiende el servicio. e
Tabla 2: Datos problema 6
ID. Servicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 Tiempo en minutos 97.00 86.00 78.00 10.00 75.00 62.00 101.00 39.00 53.00 33.00 118.00 65.00 25.00 71.00 105.00 17.00 49.00 68.00 No. Equipos 7 6 5 1 5 4 7 3 4 2 8 5 2 5 7 1 4 5

2 a) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Asumiendo que un MRLS es apropiai 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. do, calcule e

18

18

18

18

18

b) Haga un graco de dispersion junto con la recta estimada Hay buen ajuste? Calcule e interprete el R2 de la regresion. c) Obtenga una estimacion puntual del tiempo medio de servicio para atender 5 equipos

y un intervalo de prediccion del 95 % para el tiempo de servicio de 5 equipos. Inter prete a la luz de los datos. d) Asumiendo que son validos los supuestos del MRLS, realice la prueba F de la signi cancia del modelo de regresion e interprete a la luz del problema. 7. Una sustancia empleada en investigacion m dica y biologica es transportada por carga e a rea en cajas de carton conteniendo 1000 ampollas de la sustancia. En la Tabla 3 se e presentan los datos obtenidos para 10 embarques y corresponden al X: numero de veces que las cajas son transferidas de un avion a otro en la ruta de embarque y el Y : numero de ampollas que fueron halladas quebradas a la llegada.
2 a) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Asumiendo que un MRLS es apropiai do, calcule 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. e b) Obtenga una estimacion puntual del numero de ampollas quebradas cuando solo una transferencia es hecha durante el transporte. Tambi n obtenga un intervalo de e prediccion del 96 %. Interprete a la luz del problema. c) Obtenga el graco de dispersion junto con la recta estimada. Evalue la calidad del ajuste. Calcule e interprete el R2 de la regresion. d) Pruebe estadsticamente, la veracidad de la siguiente armacion: Por cada unidad en que se aumenta el numero de transferencias entre aviones realizadas durante el transporte del producto, el numero promedio de ampollas que llegan quebradas a su destino se incrementa en mas de 4 unidades. 10 10 10 10 10

Tabla 3: Datos problema 7


ID. Embarque 1 2 3 4 5 6 7 8 9 10 No. Ampollas quebradas 16 9 17 12 22 13 8 15 19 11 No. transferencias 1 0 2 0 3 1 0 1 2 0

8. Re rase al problema 4: 16 lotes del plastico en cuestion fueron obtenidos y de cada lote e un tem de prueba fue moldeado, Cada tem de prueba fue asignado aleatoriamente a uno de cuatro niveles de tiempo predeterminados y la dureza fue medida despu s del e tiempo asignado. Los resultados se muestran en la Tabla 4. a) Realice el graco de dispersion de los datos. Graque la curva de ajuste no param tri e co LOESS tipo gausssiana con un span de 0.9. Juzgue si una relacion lineal es apropiada. Tambi n evalue si puede asumirse constante la variabilidad de la dureza e en cada nivel de tratamiento observado. 16 16 16 16 16 2 b) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Asumiendo que un MRLS es apropiai do, calcule 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. e c) Puede armarse que el cambio medio en la dureza del tem cuando el tiempo trans currido despu s del moldeo se incrementa en 1 hora es menor a 3 grados brinell? e Asuma que son validos los supuestos del MRLS. d) Construya la tabla ANOVA y asumiendo validos los supuestos del MRLS realice e interprete el test asociado.

Tabla 4: Datos problema 8


ID. Item 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Dureza ( Brinell) 199.00 205.00 196.00 200.00 218.00 220.00 215.00 223.00 237.00 234.00 235.00 230.00 250.00 248.00 253.00 246.00 Tiempo transcurrido (Horas) 16 16 16 16 24 24 24 24 32 32 32 32 40 40 40 40

9. Se espera que la masa muscular de una persona disminuya con la edad. Para explorar esta relacion en las mujeres, un nutricionista selecciona aleatoriamente 4 mujeres de cada grupo de edad en rangos de 10 anos comenzando con 40 anos y terminando en 79 anos. Sea X: edad y Y : medida de la masa muscular. Los datos obtenidos se presentan en la Tabla 5.
2 a) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Asumiendo que un MRLS es apropiai do, calcule 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. e 16 16 16 16 16

b) Asumiendo que el MRLS es correcto, obtenga una estimacion puntual de la diferen cia en la media de la masa muscular para mujeres con una diferencia de edad de 10 anos, en el rango de edad estudiado. Interprete. c) Calcule el coeciente de determinacion muestral e interprete a la luz del problema. Construya tambi n la ANOVA y asumiendo que el MRLS es valido realice el test e asociado e interprete el resultado. d) Dibuje el graco de dispersion junto con la curva LOESS y la recta de regresion lineal ajustada Qu concluye acerca del ajuste del modelo lineal? e

Tabla 5: Datos problema 9


ID. Mujer 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Masa muscular 82.00 91.00 100.00 68.00 87.00 73.00 78.00 80.00 65.00 84.00 116.00 76.00 97.00 100.00 105.00 77.00 Edad 71.00 64.00 43.00 67.00 56.00 73.00 68.00 56.00 76.00 65.00 45.00 58.00 45.00 53.00 49.00 78.00

10. Un criminologo estudia la relacion entre la densidad poblacional y la tasa de robos para ciudades de tamano poblacional mediano. Para una muestra aleatoria simple de 16 ciu dades se recolectaron los siguientes datos, X: densidad poblacional (No. Habitantes/Ud. de area), Y : tasa de robos en el ultimo ano (No. de robos por cada 100000 habitantes). Los datos se muestran en la Tabla 6.
Tabla 6: Datos problema 10
ID. ciudad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Tasa de robos 209.00 180.00 195.00 192.00 215.00 197.00 208.00 189.00 213.00 201.00 214.00 212.00 205.00 186.00 200.00 204.00 Densidad Pob. 59.00 49.00 75.00 54.00 78.00 56.00 60.00 82.00 69.00 83.00 88.00 94.00 47.00 65.00 89.00 70.00

2 a) Halle 16 xi , 16 yi , 16 xi yi , 16 x2 , 16 yi . Asumiendo que un MRLS es apropiai=1 i=1 i=1 i=1 i i=1 do, calcule 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. e

b) Obtenga la estimacion de la desviacion estandar de los parametros estimados. In dique claramente cuanto vale cada t rmino involucrado en los calculos. Construya e un I.C del 95 % para los parametros del modelo de regresion asumiendo que son validos los supuestos. Pruebe la signicancia del modelo de regresion e interprete a la luz del problema. c) Bajo el supuesto de que el MRLS es correcto, obtenga el R2 y estime la desviacion estandar del modelo e interprete las cifra obtenidas y concluya a la luz del problema. d) Dibuje el graco de dispersion junto con la curva LOESS y la recta de regresion lineal ajustada Qu concluye acerca del ajuste del modelo lineal? Corrobora la e graca los resultados del literal b)? 11. Una empresa productora de piezas de repuesto para equipos de refrigeracion realiza un estudio para establecer el tamano optimo de los lotes que produce. Uno de sus objetivos es determinar la relacion entre el tamano de los lotes y las horas de trabajo requeri das para producir el lote, para ello tomo datos sobre tamano de lote y horas de trabajo para 25 ordenes de produccion recientes. Las condiciones de produccion fueron estables durante el perodo de seis meses en los cuales fueron hechas las 25 corridas de produc cion y se espera que tales condiciones continuen en los proximos tres anos. La Tabla 7 contiene la informacion recolectada.
2 a) Halle i=1 xi , i=1 yi , i=1 xi yi , i=1 x2 , i=1 yi . Asumiendo que un MRLS es apropiai do, calcule 0 y 1 en t rminos de estos valores e interprete las estimaciones obtenidas. e 25 25 25 25 25

b) Dibuje el graco de dispersion junto con la curva LOESS y la recta de regresion lineal ajustada Qu concluye acerca del ajuste del modelo lineal? e c) A partir de los datos puede decirse que por cada hora adicional de trabajo que se invierta, en promedio el tamano de lote que puede procesarse se incrementa mas de 4 unidades? Pruebe esta armacion asumiendo validos los supuestos del MRLS.

d) Examine el graco de dispersion qu concluye acerca del ajuste del MRLS? Calcule e el R2 y realice el analisis de varianza. Concluya a la luz del problema.
Tabla 7: Datos problema 11
ID. corrida 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Tamano lote 80 30 50 90 70 60 120 80 100 50 40 70 90 20 110 100 30 50 90 110 30 90 40 80 70 Horas de trabajo 399 121 221 376 361 224 546 352 353 157 160 252 389 113 435 420 212 268 377 421 273 468 244 342 323

Tabla 8: Grupos y asignacion problema


Grupo 1 Integrantes Deisy Yuliana Cano Quintero Julian Andres Giraldo Hoyos Marisol Tamayo Velez Wilinton Galeano Munoz Daniel Alberto Ocampo Marn Silvio Tangarife Restrepo Lina Maria Estrada Arredondo Ruth Bibiana Quiros Gomez Catalina Maria Serna Sanchez Lizeth Yurany Lopez Aristizabal Jorge Emilio Salazar Fl orez Anderson Garcia Cano Martha Cecilia Gutierrez Arango Johanna Trochez Gonzalez Diana Marcela Arango Correa Jose Luis Castaneda Rios Yohan Manuel Tobon Cuartas Luis Fernando Mendoza Carmona Lady Tatiana Ospina De Los Rios Hugo Roman Botero Tabares Jon Duque Prob. Particular 5

4 5

8 9

10

11

Ayuda R #GRAFICA DE DISPERSIN CON CURVA LOESS Y CURVA AJUSTADA POR MRLS O scatter.smooth(X,Y,span=0.9,family="gaussian",pch=19) abline(modelo,col=2) #Agrega recta ajustada en objeto modelo de tipo lm() #modelo=lm(YX) legend("topright",legend=c("LOESS","RLS"),col=c(1,2),lty=1)

You might also like