You are on page 1of 12

UNIVERSIDAD NACIONAL DE COLOMBIA

FACULTAD DE CIENCIAS
Departamento de Estadstica

Anlisis de Regresin

Alexander Avella
Andres Flrez
Johan Pieros

162990

162989

162986

Semestre 2014-II
Bogot D.C
1

Taller 1. Regresin Lineal Simple


1.

a)

Dados los datos de la tabla B.1 [1] donde encontramos los valores de distintas variables para 28 equipos de la
liga nacional de futbol en 1976, ajustaremos un modelo que relacione las yardas ganadas por los contrarios
con la cantidad de juegos ganados, utilizamos el paquete Rcmdr del programa R para tratar los datos y
generar el modelo, a continuacin se muestra la salida de R y su respectiva interpretacin estadstica

Es decir:

y = 0 + 1 x
y = (21,789) + (0,0070)x
Donde

Como

son las yardas ganadas por los contrarios.

es negativo, sabemos que tiene una relacin inversa, es decir cuando el nmero de yardas aumenta

los partidos ganados disminuye, as como se evidencia en el diagrama de dispersin.

b)

La tabla de anlisis de varianza para este modelo se calcul a partir de las salidas de R de la siguiente
manera;

Como

Residual Standard Error = 2,393

entonces podemos calcular:

CME = (2,393)2 = 5, 73
adems como:

CME =

SCE
n2

entonces

CME (n 2) = SCE
en este caso

SCE = (5, 73)(26) = 148,88


Ahora, sabemos adems que la estadstica

est dada por:

Fc =

CMR
= 31,1
CME

Luego para nuestro propsito

CMR = (31,1)CME = (31,1)(148,88) = 178,09


As, completamos los datos necesarios para construir la tabla de anlisis de varianza

F. de V.

G.L.

Suma de Cuadrados

Cuadrados Medios

Regresin

178.09

178.09

Error

26

148.88

5.726

Total

27

326.98

N/A

Fc
31.1

b-2) Prueba de Signicado del Modelo:


Como es importante mirar la prueba de hiptesis

H0 : 1 = 10 vs H1 : 1 6= 10 , para probar la sig10 = 0 y mirar si se rechaza o no la hiptesis

nicancia de la regresin nos toca mirar lo que pasa cuando


nula.

El procedimiento de prueba lo realizaremos con un estadstico

t0 =

el cual ser

1 10
1
=
S1
S1

y la hiptesis de la signicancia de la regresin se rechaza si

1 = 0,0070

|t0 | > t(n2, )


2

S1 = 0,0012 entonces nuestro estadstico ser t0 = 5,577


Ahora por la tabla de la distribucin tstudent y escogiendo = 0, 05 tenemos que t(26, 0,025) = 2,055,
por lo tanto rechazamos H0 : 1 = 0 y concluimos que hay una relacin lineal entre la cantidad de yardas
Como tenemos que

c)

ganadas por tierra y la cantidad de juegos ganados por un equipo.


El intervalo de conanza del

95 %

para la pendiente esta dado por:

1 t(n2, ) S1 1 1 + t(n2, ) S1
2

y en este caso es {0,0096

, 0, 00443}

d)

Para observar el porcentaje de variabilidad que explica el modelo, calculamos el coeciente de determinacin;

R2 =
Es decir, el modelo explica el

e)

El intervalo de conanza de
los contrarios es de

2000,

54,47 %

95 %

SCR
178,09
=
= 0,5447
SCT
326,98

de la variabilidad total

para la cantidad promedio de juegos ganados, si la distancia ganadas por

esta dado por:

Es decir

6,76 E(y|2000) 8,71


2. En el escenario anterior, usaremos el modelo para hacer pronosticos, en especial, queremos pronosticar los juegos
que ganar un equipo que pueda limitar los avances de los contrarios a
intervalo al

90 %

1800

yardas. As la estimacin y el

son:

Ms claro:

y0 = 9,14
4,93 y0 13,35

Los siguientes puntos, se desarrollaron siguiendo la metedologa del primer punto, a continuacin se presentan
los resultados puntuales para cada caso en particular

3. La tabla B.2 [1] contiene los datos reunidos durante un proyecto de energa solar en el

T ecnolgico de Georgia,

donde se quiere mirar la relacin que existe entre el ujo total de calor y (kilowatts) y la deexin radial de
los rayos desviados x (milirradianes).

a)

El modelo de regresin lineal para este caso es:

y = 607, 10 21, 40x

b)

b-2)

Como

es negativo, sabemos que tiene una relacin inversa, como se observa en el diagrama de dispersin.

La tabla de anlisis de varianza para este punto es:

t0 = 8,343

F. de V.

G.L.

Suma de Cuadrados

Cuadrados Medios

Regresin

10582.73

10582.73

Error

27

4104.78

152.02

Total

28

14687.51

N/A

y tomando

= 0, 05

tenemos que

t(27,

0,025)

= 2,0518,

Fc
69.61

por lo tanto rechazamos

H0 : 1 = 0

concluimos que hay una relacin lineal entre el ujo total de calor y la deexin radial de los rayos desviados.

c)

El intervalo de conanza de

99 %

para la pendiente es {28, 5099

, 14, 2949}

d)
e)

R2 = 0, 7205

, por lo tanto el modelo explica el

Un intervalo de

95 %

72, 05 %

de la variabilidad total.

de conanza para el ujo promedio de calor, cuando la deexin radial es

milirradianes es {249, 1468

16, 5

, 258, 7787}

4. En la tabla B.3 [1] se encuentran los rendimientos en millas por galn de gasolina de 32 diferentes automviles.
Para estos datos ajustaremos un modelo de regresin lineal simple que relacione el rendimiento de la gasolina
y (millas por galn) con el cilindrje del motor

a)

x1 

(pulgadas cbicas).

Se tiene que el modelo de regresin lineal queda de la forma:

y = (33,75) + (0,047)x1

Como vemos en el modelo de regresin, la relacin de las variables es inversa, es decir a mayor cilindrje
de motor, menor es el rendimiento de gasolina.

b)

La tabla de anlisis de varianza, para estos datos queda de la siguiente forma:

b-2) Como

F. de V.

G.L.

Suma de Cuadrados

Cuadrados Medios

Regresin

956.022

956.022

Error

30

281.46

9.38

Total

31

1237.48

N/A

t0 = 10,10,

t(30,0,025) = 2,0423,

por lo tanto se rechaza

H0 : 1 = 0

Fc
101.9

, y se concluye que existe una

relacin lineal entre el rendimiento de gasolina y el cilindrje del motor.

c)
d)

e)
f)

R2 = 0,7726

, por lo que el modelo de regresin explica el 77.26 % de la variabilidad total.

El intervalo de conanza de

95 %

para el rendimiento promedio de gasolina, si el desplazamineto del motor

es de 275 pulgadas cbicas es {19, 58274

, 21, 80217}

Un intervalo de conanza de 95 % pronosticado para el rendimiento de gasolina si se supone un carro con


un cilindraje de 275 pulgadas cbicas es {14,34027

, 27,04464},

y el valor puntual seria de

20,69246.

El intervalo pronosticado es mas amplio, pues la varianza es mayor, pues se le suma 1, que es la del
rendimiento promedio. Adems los dos intervalos estan centrados en

y solo dieren en la varianza como

se dijo anteriormente, debido a la mayor variabilidad del error de prediccin para una nica observacin en
comparacin con el error del clculo del promedio.
5. Tomando la misma tabla del punto anterior se realiza un modelo de regresion lineal entre el rendimiento de
gasolina y y el peso del automovil  x10 .

a)

El modelo queda de la forma:

y = 39, 96 0, 0055x10

b)

Como vemos en el modelo de regresin, la relacin de las variables es inversa, ya que

es negativo.

La tabla de anlisis de varianza, queda de la siguiente forma:

b-2) Como

F. de V.

G.L.

Suma de Cuadrados

Cuadrados Medios

Regresin

871.89

871.89

Error

30

366.03

12.2

Total

31

1237.92

N/A

t0 = 8,4528,

t(30,0,025) = 2,0423,

por lo tanto se rechaza

H0 : 1 = 0

Fc
71.46

, y se concluye que existe

una relacin lineal entre el rendimiento de gasolina y el peso del automovil.

c)

R2 = 0, 7049

, por lo tanto el modelo explica el

Dados los resultados, se evidencia que


como el

x1 

70, 49 %

de la variabilidad total.

es mejor variable regresora para y que

ajustados son mayores para el modelo realizado con

x10 

pues tanto el

R2

x1 

6. Se cree que la pureza del oxgeno producido con un proceso de fraccionamiento y est relacionada con el porcentaje de hidrocarburos en el condensador principal de la unidad de procesamiento x.

a)

El modelo de regresin lineal para este caso es:

y = 77, 863 11, 801x

Como

b)

es positivo, sabemos que tiene una relacin directa, como se observa en la graca de dispersin.

t0 = 3, 386

y tomando

= 0, 05

tenemos que

t(18,

0,025)

= 2,1009,

por lo tanto rechazamos

H0 : 1 = 0

concluimos que hay una relacin lineal entre la pureza del oxgeno producido con un proceso de fracciona-

c)
d)

e)

miento y el porcentaje de hidrocarburos en el condensador principal de la unidad de procesamiento.

R2 = 0, 3891

, por lo tanto el modelo explica el

El intervalo de conanza de

Un intervalo de
{ 87,5101

95 %

95 %

38, 91 %

de la variabilidad total.

para la pendiente es {4, 4790

, 19, 1229}

de conanza para la pureza media, cuando el porcentaje de hidrocarburos es 100 es

, 91.8194}

7. Para los datos del ltimo ao segn la tabla del ejercicio 2.12 en [1] ajustaremos un modelo de regresin lineal
para establecer la relacin entre la cantidad de libras de vapor usadas en una planta con la temperatura ambiente
promedio mensual

a)

El modelo de regresin lineal para este caso es:

y = 6,3320977 + 9,20847x

Como

es positivo, sabemos que tiene una relacin directa, como se observa en la graca de dispersin.

10

b)

t0 = 272,278

y tomando

= 0, 05

tenemos que

t(12

0,025)

= 2,1788,

por lo tanto rechazamos

H0 : 1 = 0

y concluimos que hay una relacin lineal entre la cantidad de libras de vapor usadas en una planta con la

c)

temperatura ambiente promedio mensual

R2 = 0, 9999

, por lo tanto el modelo explica el

99, 99 %

de la variabilidad total, es decir el modelo es muy

bueno y explica casi en su totalidad la variabilidad

d)

Estos datos no respaldan la idea, ya que como se puede ver primero en el modelo la pendiente es la que nos
representa el cambio de la cantidad de libras de vapor usadas en una planta por mes por una unidad de
cambio en la temperatura y como

1 = 9, 20847

podemos ver que el cambio que se realiza es menor al que

cree la planta. Tabin es importante tener en cuenta que aunque se tenga un aumento en la temperatura
el mes es un factor importante, ya que si observamos el mes de Mayo y el de Octubre tuvieron una misma
temperatura pero no se obtuvo la misma cantidad de vapor usada.

e)

Un intervalo de prediccin de 99 % para la cantidad de libras de vapor usada si la temperatura mensual


promedio es de

58

es {521,2237

, 534,2944},

y el valor puntual seria de

527,759.

8. Para demostrar los resultados, recordaremos que

0 = y 1 x
,
COV (0 , 1 ) =

2
V ar(1 ) =
,
Sxx

E(0 ) = 0 y E(1 ) = 1

x 2
Sxx

COV (0 , 1 ) = E[(0 E(0 ))(1 E(1 ))]


= E[(0 0 )(1 1 )]
Ahora como

0 = E(0 ) = E(
y 1 x
) = y 1 x

restamos

de lo cual:

0 0 = y 1 x
(
y 1 x
) = y 1 x
y + 1 x
= 1 x
+ 1 x
= (
x)(1 1 )
Luego

COV (0 , 1 ) = E[(
x)(1 1 )(1 1 )]
= (
x)E[(1 1 )(1 1 )]
= (
x)E[(1 1 )2 ]
= (
x)E[(1 E(1 )2 ]
= (
x)V ar(1 )
2
)
Sxx

x 2
=
Sxx

= (
x)(

11

COV (
y , 1 ) = 0
COV (
y , 1 ) = E[(
y E(
y ))(1 E(1 ))]
Ahora como:

y E(
y ) = 0 + 1 x
(E(0 + 1 x
)) = 0 + 1 x
(0 + 1 x
)

es decir:

COV (
y , 1 ) = E[(0 + 1 x
(0 + 1 x
))(1 E(1 ))]
= E[(0 + 1 x
0 1 x
)(1 E(1 ))]
= E[(0 + 1 x
0 1 x
)(1 1 )]
= E[(0 0 )(1 1 ) + x
(1 1 )2 ]
= E[(0 0 )(1 1 )] + E[
x(1 1 )2 ]
= COV (0 , 1 ) + x
E[(1 1 )2 ]
=

x 2
+x
V ar(1 )
Sxx

x
2
x
2
+
=0
Sxx
Sxx

Referencias
[1] Montgomery, D.C., Peck, E.A. y Vining G.G.,

Introduccin al Anlisis de Regresin Lineal, tercera edicin,

Cecsa, Mxico, DF, 2006.

12

You might also like