Professional Documents
Culture Documents
FACULTAD DE CIENCIAS
Departamento de Estadstica
Anlisis de Regresin
Alexander Avella
Andres Flrez
Johan Pieros
162990
162989
162986
Semestre 2014-II
Bogot D.C
1
a)
Dados los datos de la tabla B.1 [1] donde encontramos los valores de distintas variables para 28 equipos de la
liga nacional de futbol en 1976, ajustaremos un modelo que relacione las yardas ganadas por los contrarios
con la cantidad de juegos ganados, utilizamos el paquete Rcmdr del programa R para tratar los datos y
generar el modelo, a continuacin se muestra la salida de R y su respectiva interpretacin estadstica
Es decir:
y = 0 + 1 x
y = (21,789) + (0,0070)x
Donde
Como
es negativo, sabemos que tiene una relacin inversa, es decir cuando el nmero de yardas aumenta
b)
La tabla de anlisis de varianza para este modelo se calcul a partir de las salidas de R de la siguiente
manera;
Como
CME = (2,393)2 = 5, 73
adems como:
CME =
SCE
n2
entonces
CME (n 2) = SCE
en este caso
Fc =
CMR
= 31,1
CME
F. de V.
G.L.
Suma de Cuadrados
Cuadrados Medios
Regresin
178.09
178.09
Error
26
148.88
5.726
Total
27
326.98
N/A
Fc
31.1
t0 =
el cual ser
1 10
1
=
S1
S1
1 = 0,0070
c)
95 %
1 t(n2, ) S1 1 1 + t(n2, ) S1
2
, 0, 00443}
d)
Para observar el porcentaje de variabilidad que explica el modelo, calculamos el coeciente de determinacin;
R2 =
Es decir, el modelo explica el
e)
El intervalo de conanza de
los contrarios es de
2000,
54,47 %
95 %
SCR
178,09
=
= 0,5447
SCT
326,98
de la variabilidad total
Es decir
90 %
1800
yardas. As la estimacin y el
son:
Ms claro:
y0 = 9,14
4,93 y0 13,35
Los siguientes puntos, se desarrollaron siguiendo la metedologa del primer punto, a continuacin se presentan
los resultados puntuales para cada caso en particular
3. La tabla B.2 [1] contiene los datos reunidos durante un proyecto de energa solar en el
T ecnolgico de Georgia,
donde se quiere mirar la relacin que existe entre el ujo total de calor y (kilowatts) y la deexin radial de
los rayos desviados x (milirradianes).
a)
b)
b-2)
Como
es negativo, sabemos que tiene una relacin inversa, como se observa en el diagrama de dispersin.
t0 = 8,343
F. de V.
G.L.
Suma de Cuadrados
Cuadrados Medios
Regresin
10582.73
10582.73
Error
27
4104.78
152.02
Total
28
14687.51
N/A
y tomando
= 0, 05
tenemos que
t(27,
0,025)
= 2,0518,
Fc
69.61
H0 : 1 = 0
concluimos que hay una relacin lineal entre el ujo total de calor y la deexin radial de los rayos desviados.
c)
El intervalo de conanza de
99 %
, 14, 2949}
d)
e)
R2 = 0, 7205
Un intervalo de
95 %
72, 05 %
de la variabilidad total.
16, 5
, 258, 7787}
4. En la tabla B.3 [1] se encuentran los rendimientos en millas por galn de gasolina de 32 diferentes automviles.
Para estos datos ajustaremos un modelo de regresin lineal simple que relacione el rendimiento de la gasolina
y (millas por galn) con el cilindrje del motor
a)
x1
(pulgadas cbicas).
y = (33,75) + (0,047)x1
Como vemos en el modelo de regresin, la relacin de las variables es inversa, es decir a mayor cilindrje
de motor, menor es el rendimiento de gasolina.
b)
b-2) Como
F. de V.
G.L.
Suma de Cuadrados
Cuadrados Medios
Regresin
956.022
956.022
Error
30
281.46
9.38
Total
31
1237.48
N/A
t0 = 10,10,
t(30,0,025) = 2,0423,
H0 : 1 = 0
Fc
101.9
c)
d)
e)
f)
R2 = 0,7726
El intervalo de conanza de
95 %
, 21, 80217}
, 27,04464},
20,69246.
El intervalo pronosticado es mas amplio, pues la varianza es mayor, pues se le suma 1, que es la del
rendimiento promedio. Adems los dos intervalos estan centrados en
se dijo anteriormente, debido a la mayor variabilidad del error de prediccin para una nica observacin en
comparacin con el error del clculo del promedio.
5. Tomando la misma tabla del punto anterior se realiza un modelo de regresion lineal entre el rendimiento de
gasolina y y el peso del automovil x10 .
a)
y = 39, 96 0, 0055x10
b)
es negativo.
b-2) Como
F. de V.
G.L.
Suma de Cuadrados
Cuadrados Medios
Regresin
871.89
871.89
Error
30
366.03
12.2
Total
31
1237.92
N/A
t0 = 8,4528,
t(30,0,025) = 2,0423,
H0 : 1 = 0
Fc
71.46
c)
R2 = 0, 7049
x1
70, 49 %
de la variabilidad total.
x10
pues tanto el
R2
x1
6. Se cree que la pureza del oxgeno producido con un proceso de fraccionamiento y est relacionada con el porcentaje de hidrocarburos en el condensador principal de la unidad de procesamiento x.
a)
Como
b)
es positivo, sabemos que tiene una relacin directa, como se observa en la graca de dispersin.
t0 = 3, 386
y tomando
= 0, 05
tenemos que
t(18,
0,025)
= 2,1009,
H0 : 1 = 0
concluimos que hay una relacin lineal entre la pureza del oxgeno producido con un proceso de fracciona-
c)
d)
e)
R2 = 0, 3891
El intervalo de conanza de
Un intervalo de
{ 87,5101
95 %
95 %
38, 91 %
de la variabilidad total.
, 19, 1229}
, 91.8194}
7. Para los datos del ltimo ao segn la tabla del ejercicio 2.12 en [1] ajustaremos un modelo de regresin lineal
para establecer la relacin entre la cantidad de libras de vapor usadas en una planta con la temperatura ambiente
promedio mensual
a)
y = 6,3320977 + 9,20847x
Como
es positivo, sabemos que tiene una relacin directa, como se observa en la graca de dispersin.
10
b)
t0 = 272,278
y tomando
= 0, 05
tenemos que
t(12
0,025)
= 2,1788,
H0 : 1 = 0
y concluimos que hay una relacin lineal entre la cantidad de libras de vapor usadas en una planta con la
c)
R2 = 0, 9999
99, 99 %
d)
Estos datos no respaldan la idea, ya que como se puede ver primero en el modelo la pendiente es la que nos
representa el cambio de la cantidad de libras de vapor usadas en una planta por mes por una unidad de
cambio en la temperatura y como
1 = 9, 20847
cree la planta. Tabin es importante tener en cuenta que aunque se tenga un aumento en la temperatura
el mes es un factor importante, ya que si observamos el mes de Mayo y el de Octubre tuvieron una misma
temperatura pero no se obtuvo la misma cantidad de vapor usada.
e)
58
es {521,2237
, 534,2944},
527,759.
0 = y 1 x
,
COV (0 , 1 ) =
2
V ar(1 ) =
,
Sxx
E(0 ) = 0 y E(1 ) = 1
x 2
Sxx
0 = E(0 ) = E(
y 1 x
) = y 1 x
restamos
de lo cual:
0 0 = y 1 x
(
y 1 x
) = y 1 x
y + 1 x
= 1 x
+ 1 x
= (
x)(1 1 )
Luego
COV (0 , 1 ) = E[(
x)(1 1 )(1 1 )]
= (
x)E[(1 1 )(1 1 )]
= (
x)E[(1 1 )2 ]
= (
x)E[(1 E(1 )2 ]
= (
x)V ar(1 )
2
)
Sxx
x 2
=
Sxx
= (
x)(
11
COV (
y , 1 ) = 0
COV (
y , 1 ) = E[(
y E(
y ))(1 E(1 ))]
Ahora como:
y E(
y ) = 0 + 1 x
(E(0 + 1 x
)) = 0 + 1 x
(0 + 1 x
)
es decir:
COV (
y , 1 ) = E[(0 + 1 x
(0 + 1 x
))(1 E(1 ))]
= E[(0 + 1 x
0 1 x
)(1 E(1 ))]
= E[(0 + 1 x
0 1 x
)(1 1 )]
= E[(0 0 )(1 1 ) + x
(1 1 )2 ]
= E[(0 0 )(1 1 )] + E[
x(1 1 )2 ]
= COV (0 , 1 ) + x
E[(1 1 )2 ]
=
x 2
+x
V ar(1 )
Sxx
x
2
x
2
+
=0
Sxx
Sxx
Referencias
[1] Montgomery, D.C., Peck, E.A. y Vining G.G.,
12