You are on page 1of 10

PRCTICA N 07 ANALISIS DE REGRESIN Y CORRELACIN

1. Se desea estudiar la repercusin que tiene los das de lluvia en el nmero de visitas a un zoo. Para ello, se observaron las siguientes variables, durante los ltimos 6 aos, siendo Y = N de visitas anuales, en miles, y X = N de das de lluvia al ao: Ao Y: X: 2004 107 18 2005 105,5 26 2006 104,4 33 2007 104 39 2008 103,1 46 2009 103 49

a) Calcule el coeficiente de correlacin lineal. Interprete el resultado. R=-0.986 Interpretacin: indica que existe una alta correlacin inversa o negativa ya que se aproxima a -1.
a) Obtenga la recta de regresin que explique el nmero de visitas

anuales en funcin del nmero de das de lluvia. Interpreta los parmetros estimados

Observando el grfico podemos decir que la edad y el peso tienen una correlacin Inversa o Negativa.
b) Hallar el error estndar de estimacin y el Coeficiente de

Determinacin e interpretar. Error estndar de estimacin

E=1.712 Coeficiente de determinacin R2=0.9713 Interpretacin: El 97.13% de las variaciones del n de visitas anuales son explicados por el n de das de lluvia.
a) Obtenga la recta de regresin X/Y y represntela junto a la

recta de regresin Y/X

2. Las siguientes sumatorias se obtienen a partir de 16 observaciones de las variables e : x y

y y
i

2 i

= 526

2 i

= 657

x y
i

= 492

= 96

= 64

a) Calcula

( x x )
i

( y y )
i

( y y ) ( x x )
i i

i.

( x x )
i

(xi-x)2= xi2-2xxi+nx2

=657-2696+1662 (xi-x)2=81 ii.

( y y )
i

(yi-y)2= yi2-2yyi+ny2 =526-2464+1642 (yi-y)2=270 iii.

( y

y ) ( xi x

)
(yi-y)(xi-x)= (xiyi-xyi-yxi+xy) =xiyi-xyi-yxi+nxy =492-664-496+166(4) (yi-y)(xi-x)=108

a) Encuentra las estimaciones MCO de la regresin

yi = 0 + 1 xi + ui
y=-4+1.33x+4.392

b) Calcula el coeficiente de correlacin interpreta


R=0.73

Interpretacin: Indica que existe una correlacin directa o positiva. 3. Se ha estudiado las calificaciones de 100 alumnos en dos asignaturas: Matemtica I y Estadstica Bsica, obtenindose los siguientes resultados: xi2 nx 2 = 4 2 S2 = SY = 2.25 xi = 1066 ; yi = 1230 ; X n ;

r = 0.9
a) Hallar la ecuacin de recta de regresin de Y sobre X ; y

sobre Y Y(x)=5.1045+0.675x X(y)=-4.11.2x

a) Predecir la nota en estadstica cuando el alumno saca 17 en matemtica I Y(x)=16.58 4. Para realizar un estudio sobre la utilizacin de una impresora en un determinado departamento se midi en un da los minutos transcurridos entre las sucesivas utilizaciones (X) y el nmero de pginas impresas (Y), obtenindose los siguientes resultados: X 9 Y 3 X 9 Y 1 2 9 8 9 2 0 4 3 1 0 8 6 8 9 2 0 8 3 1 5 8 9 8 1 0 8 7 8 1 2 2 0 6 8 1 2 8 9 3 1 0 8 9 8 1 0 1 2 9 1 2 1 2 8 8 1 2 1 0 2 0 8 8 1 0 2 0 9 8 1 2 3 8 8 1 2 3 9 1 2 1 0 2 0

a) Construya un diagrama de dispersin y calcule el coeficiente de correlacin

coeficiente de correlacin: R=0.1 a) Calcule la ecuacin de regresin e interprete sus coeficientes


y=0.3749x+6.4349

Interpretacin: b1=0.3749, es el incremento en 0.3749 cuando x aumenta en una unidad. Quiere decir que hay un aumento de 0.3749 de copias por cada minuto que transcurre.

a) Hallar el valor promedio Y para X= 13; X= 18


y(13)=11.3086 y(18)=13.1831

5. El coeficiente de correlacin entre dos variables X e Y es 0,6. Sabiendo adems VARIABLE X Y MEDIA 10 20 DESV. TIPICA 1,5 2

a) Halle las rectas de regresin Y/X y de X/Y.

b) Calcule el error tpico de estimacin (raz cuadrada de la varianza residual) para las dos Regresiones anteriores.
E(Y/X)= 4.1280 E(X/Y)= 5.1599

6. Al estudiar la relacin entre el costo y las utilidades en soles de ciertos productos a partir de una muestra se obtuvo la siguiente informacin:
S x = 5; S y = 4; x = 100; y = 50; Y = 26+ 0.76 X
a) Qu porcentaje de la varianza de las utilidades es explicada

por el modelo de regresin de utilidades sobre costo? X/Y b) Si cada valor del costo se aumenta en 3 soles y el valor correspondiente a la utilidad se aumenta en 6 soles en cuanto se estima la utilidad para un costo de 120 soles? 7. Las estaturas y pesos de los durante una semana fueron: E 50 51 53 50 51 48 50 P 3. 4. 4. 3 3. 2. 3. 2 1 5 6 9 8 50 51 50 51 52 53 52 52 3. 4. 3. 3. 3. 4. 4. 3. 1 3 3 9 7 1 2 5 51 52 51 50 51 49 51 48 4. 4 4. 3. 3. 3. 3. 2. 2 4 9 7 4 3 7 50 nios nacidos en una maternidad 49 3. 8 51 3. 8 50 3. 4 52 3. 6 50 3. 6 52 3. 6 52 3. 9 51 3. 4 53 4. 4 49 50 52 3 3. 4. 8 1 54 50 51 4. 3. 3. 6 5 6 52 50 52 4. 3. 4. 3 3 2 51 3. 5 51 3. 1 51 4. 2 52 4. 0 51 4 49 3. 1 52 3. 8 51 51 3. 3. 3 7

a) Calcular la covarianza y el coeficiente de correlacin lineal. Dibujar la nube de puntos. Comentar los resultados. Es la estatura independiente del peso? Covarianza:

Sxy=0.313728

significa que hay una dependencia directa (positiva) es decir a grandes valores de x grandes corresponden valores de y

Coeficiente de correlacin lineal R=0.7224 significa

que correlacin positiva o directa

existe

una

Diagrama de dispersin correlacin positiva o directa. La estatura es independiente del peso.

a) Ajustar los datos a una recta de regresin e interpretar sus coeficientes. 8. En un pas europeo se han obtenido estadsticas que relacionan el nmero de vehculos Matriculados y el nmero de accidentes habidos en un perodo determinado. Los datos recogidos son los siguientes: perio do 1 2 3 4 5 6 7 8 9 10 11 Se pide: n de n de acciden vehculos a) Un modelo de regresin que nos tes matricula explique el n de accidentes en funcin de los vehculos matriculados. dos b) Coeficiente de correlacin lineal. 166 352 c) Porcentaje de las causas ajenas a la 153 373 regresin que influyen en la variable 177 411 dependiente. 201 441 d) Deducir cul sera el n de 216 462 accidentes si se matriculan 800 208 490 vehculos. 227 529 e) Estimar el parque de vehculos 238 577 matriculados para reducir el nmero 268 641 de accidentes hasta 175. 268 692 274 743

a) Rpta:

b) c) d) e)

Rpta: 0.96757429

Rpta: R2 = 0.9362*100% = 93.62%. Y=0.312x+55.853 0.312(800)+55.853 = 305.453 Y=0.312x+55.853 175=0.312x+55.853

x=381.8814103 9. A partir de un conjunto de datos sobres las variables X e Y se ha calculado la regresin de Y sobre X, obtenindose los siguientes resultados: ; ; 2 Y = 10 + 0, 45 X r = 0, 9 X = 20 Calcule los parmetros de la regresin de X sobre Y. Parmetros: b0=2.2, b1=22.2 X=2.2y-22.2

10. La resistencia del papel utilizado en la fabricacin de cajas de cartulina (Y) est relacionado con la concentracin de madera dura en la pulpa original (X). Bajo condiciones controladas, una planta piloto fabrica 16 muestras con un lote diferente de pulpa y mide la resistencia a la tensin. Los datos obtenidos son los siguientes: X1 2.2 2.4 2. 5 Y 10 11 11 10 13 14 14 13 1 1.4 7.4 7.1 6.2 1.9 6.9 6.8 3.9 1 1 1.5 1.5 1.5 2 2 2. 2.8 2.8 3 3 3.2 3.3 5 1 12 14 13 14 14 14 2 5.1 5.1 4.3 4.5 3.7 6.9 3

a) Representar grficamente los datos y comentar los resultados. b) Hallar el coeficiente de correlacin y la Covarianza R=0.692098258 , COVARIANZA= 20460129.8
c) Ajustar un modelo de regresin lineal. Predecir la resistencia de

una caja fabricada con pulpa cuya concentracin es 2.3. Y=b0+b1X+e Y= 15.635+ 93.35 (2.3) Y=230.34 d) Hallar el error estndar de estimacin y el Coeficiente de Determinacin e interpretar. e) Calcule la ecuacin de regresin de X sobre Y Y=B0+B1X+e Y=0+55.78X+e X=0.0179Y-e 11. A la Gerente de Supermercados Wall Mart, Anna Shenan le gustara predecir las ventas de los libros con base en la cantidad de espacio de repisas (en metros) N de libros vendidos Espacio en repisas (metros) 21 29 27 19 17 15 96 6 8 8 4 5 3 6.5 6 6.5 7.5 8.5 9.5 10

a) Ajustar la curva de regresin a la exponencial

y = aX b
b) Estimar

cuando

x = 12 m

y=-41.722x+526.27 y(x=12)=25.606

12. La direccin de una empresa quiere estudiar la rentabilidad de su inversin en publicidad. Para ello ha recogido datos del volumen de ventas y del gasto en publicidad referidos a los aos 2000 - 2009 expresados en millones de soles. Ao 200 200 200 200 200 200 200 200 200 200 0 1 2 3 4 5 6 7 8 9 Ventas 50 100 150 200 200 300 400 500 650 700 Gasto 10 15 18 20 25 35 50 55 60 65 publicidad a) Construya el diagrama de dispersin y calcule el coeficiente de correlacin, la covarianza e interprete. Coeficiente de correlacin: r= 0.9816 Covarianza:
a) Especfica y estima el modelo lineal que explique las ventas de

la empresa en funcin de la inversin publicitaria. Interpreta los parmetros estimados. y = 0.088x + 6.6966 x=11.36y-76.097 b1=11.36. Es el incremento en 11.36 cuando y aumenta en una unidad. Quiere decir que hay un aumento de 11.36 de gasto de publicidad. b) En el ao 2010, la empresa va a invertir 85 millones de soles en publicidad. Calcula el volumen de ventas esperado. y = 0.088x + 6.6966 85=0.088x+6.6966 x=889.81 13. El efecto de la temperatura (X) en la absorcin (Y) del anhdrido carbnico en agua est dada en la siguiente tabla: Temperatura (C) Coeficiente de absorcin relativa 10 15 20 30 35 40 5 8 7.5 12 13 22

a) Ajustar la curva de regresin a la exponencial

Y = b0b1 X

b) Hallar los coeficientes Estimar

b0 , b1
Y=0.4679x-0.4464 b0=-0.4464 b1=0.4679
c) c) Estimar

cuando

x = 25

Y(x=25)=11.2511

You might also like