Professional Documents
Culture Documents
INGENIERA INDUSTRIAL
INTRODUCCIN
La regresin y la correlacin son dos tcnicas estrechamente relacionadas y
comprenden una forma de estimacin.
En forma ms especifica el anlisis de correlacin y regresin comprende el anlisis de
los datos mustrales para saber qu es y cmo se relacionan entre s dos o ms
variables en una poblacin. El anlisis de correlacin produce un nmero que resume
el grado de la correlacin entre dos variables; y el anlisis de regresin da lugar a una
ecuacin matemtica que describe dicha relacin.
PROBLEMAS
1. Ricky est pensando vender su casa. Con el fin de decidir qu precio pedir por ella,
ha recogido datos de 12 ventas (miles de dlares), el nmero de pies cuadrados de
construccin (en cientos de pies), el nmero de pisos, el nmero de baos y la
antigedad de la casa (en aos).
Precio de 50.8 67.95 81.15 81.60 91.50 95.25 100.35 104.25 112.65 149.70 160.65 228.6
venta
Pies
8.7
9.5
12.6 12.9 19.0 17.6
20.0
20.6
20.5
25.1
22.7
38.7
cuadrados
Pisos
1
1
2
2
2
1
2
2
1
2
2
3
Baos
1.0
1.0
1.5
1.5
1.0
1.0
1.5
1.5
2.0
2.0
2.0
4.0
Antigedad
2
6
11
8
22
17
12
11
9
8
18
12
a) Determine la ecuacin de regresin de mejor ajuste para los datos, utilizando
cualquier paquete disponible.
b) Calcular e interpretar el valor de R (coeficiente de correlacin mltiple)
c) Si la casa de Ricky tiene 1800 pies cuadrados (= 18 cientos de pies2), un piso, 1.5 baos
y 6 aos de antigedad Qu precio de venta podra esperar Ricky? Para este precio,
determinar los lmites de control.
2. Una empresa administra a sus vendedores una prueba de adiestramiento de ventas
antes de permitirles salir a trabajar. La administracin de la empresa est interesada
en determinar la relacin entre las calificaciones de la prueba y las ventas hechas por
esos vendedores al final de un ao de trabajo. Los siguientes datos se recopilaron de
10 agentes de ventas que han estado en el campo durante un ao.
Nmero de vendedor
Calificacin de la prueba
1
2
3
4
5
6
7
8
9
10
2.6
3.7
2.4
4.5
2.6
5.0
2.8
3.0
4.5
4.4
Nmero de unidades
vendidas
95
140
85
180
100
195
115
136
174
146
a) Encuentre la lnea de regresin de mnimos cuadrados que podra usarse para predecir
ventas de las calificaciones de las personas en adiestramiento.
b) En cunto se incrementa el nmero esperado de unidades vendidas por cada
incremento de 1 punto en una calificacin de la prueba?
Demanda
56
60
50
55
60
70
65
65
75
75
80
100
90
95
85
Precio
12
22
9
8
7
6
6
8
5
5
5
3
4
3
4
Ingreso
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800
Sustituto
11
13
12
13
11
15
16
17
22
19
20
23
18
24
21
X
3,4
1,8
4,6
2,3
3,1
5,5
7
3
2,6
3,6
2,6
1,1
6,1
4,8
3,8
Y
26,2
17,8
31,3
23,1
27,5
36
14,1
22,3
19,6
29,7
24,5
17,3
43,2
36,4
26,1
XY
89,08
32,04
143,98
53,13
85,25
198
98,7
66,9
50,96
106,92
63,7
19,03
263,52
174,72
99,18
X2
11,56
3,24
21,16
5,29
9,61
30,25
49
9
6,76
12,96
6,76
1,21
37,21
23,04
14,44
Y2
686,44
316,84
979,69
533,61
756,25
1296
198,81
497,29
384,16
882,09
600,25
299,29
1866,24
1324,96
681,21
55,3
395,1
1545,11
234,73
11303,13
a)
b)
c)
d)
POBLACIN
32
47
75
99
SOLUCIN 1:
1a) Primero construimos el diagrama de dispersin tomando como variable
dependiente al precio de venta y como variables independiente al nmero de pies
cuadrados, el nmero de pisos, el nmero de baos y los aos de antigedad que
tiene la casa; para deducir mejor el tipo de funcin matemtica para la lnea de
regresin, en este caso es una regresin lineal mltiple.
Diagrama de dispersin
250
200
150
Pies cuadrados
Pisos
Baos
100
Antigedad
50
0
0
10
20
30
40
50
Y = A+B1X1+B2X2+B3X3+B4X4
Usando Excel obtenemos la ecuacin:
Y* = -1,2436 + 1,2436X1 + 29,3761X2 3,7389X3 + 3,200X4
Coeficientes
-1,243571302
1,045148558
29,37612677
-3,7398837
3,01995469
Intercepcin
Variable X 1
Variable X 2
Variable X 3
Variable X 4
X1(antigedad) X2(baos)
2
X3(pisos)
X4(pies
cuadrados)
Y(precio
de venta)
X1Y
X2Y
X3Y
X4Y
8,7
50,8
101,6
50,8
50,8
441,96
9,5
67,95
407,7
67,95
67,95
645,525
11
1,5
12,6
81,15
892,65
121,725
162,3
1022,49
1,5
12,9
81,6
652,8
122,4
163,2
1052,64
22
19
91,5
2013
91,5
183
1738,5
17
17,6
95,25
1619,25
95,25
95,25
1676,4
12
1,5
20
100,35
1204,2
150,525
200,7
2007
11
1,5
20,6
104,25
1146,75
156,375
208,5
2147,55
20,5
112,65
1013,85
225,3
112,65
2309,325
25,1
149,7
1197,6
299,4
299,4
3757,47
18
22,7
160,65
2891,7
321,3
321,3
3646,755
12
38,7
228,6
2743,2
914,4
685,8
8846,82
136
20
21
227,9
R=
0,975688189
0,951967442
INTERPRETACIN: Como el coeficiente de correlacin es mayor que cero entonces existe una
CORRELACIN POSITIVA, adems este indica que el 98% de la variacin en Y se debe a las
variables independientes X1, X2, X3 y X4. Adems el coeficiente de determinacin se acerca a 1
lo que indica que EL MODELO ES CONFIABLE para hacer pronsticos de Y a partir de las
variables usadas.
1c)
Y* = -1,2436 + 1,2436X1 + 29,3761X2 3,7389X3 + 3,200X4
Si X1= 6 , X2 =1,5 , X3 = 1 y X4 = 18
Entonces Y* = 104.143
Se puede esperar un precio de venta 104,143 (en miles de dlares) por la casa de
Ricky.
SXY =
Donde
Y*: valores estimados a partir de la ecuacin de regresin
k : nmero de variables independientes
Entonces el ERROR ESTNDAR DE ESTIMACIN es:
SXY =
SXY = 13,3081478
Para Y* = 104.143
LIC = Y* - 2 SXY
SOLUCIN 2:
2a) Si llevamos las variables a una grfica, podremos ver mucho mejor cual es la ecuacin
correspondiente. Entonces tomamos como variable dependiente a la CALIFICACIN DE LA
PRUEBA y como independiente al NMERO DE UNIDADES VENDIDAS.
X (Calificacin de
la prueba)
2,6
3,7
2,4
4,5
2,6
5
2,8
3
4,5
4.4
Y (Nmero de unidades
vendidas)
95
140
85
180
100
195
115
136
174
146
250
Diagrama de dispersin
200
150
100
50
0
0
Calificacin de la prueba
Observando la grfica, podemos utilizar el mtodo de los mnimos cuadrados para hallar la
lnea de regresin, en este caso ser una recta.
X
1
2
3
4
5
6
7
8
9
10
Y
2,6
3,7
2,4
4,5
2,6
5
2,8
3
4,5
4,4
35,5
95
140
85
180
100
195
115
136
174
146
1366
=3,55
XY
X^2
247
518
204
810
260
975
322
408
783
642,4
5169,4
Y^2
6,76
13,69
5,76
20,25
6,76
25
7,84
9
20,25
19,36
134,67
= 136,6
Lnea de regresin: Y = A + BX
Ecuaciones:
B=
A=
-B
= 37,0271833
= 5,15349913
Y*= 5,15349913 + 37,0271833X
LNEA DE REGRESIN
9025
19600
7225
32400
10000
38025
13225
18496
30276
21316
199588
2c)
Si X = 3.55
Y* = 137
Se venderan 137 unidades si una persona tiene 3.55 de calificacin en su prueba.
2d) Primero tenemos que hallar el ERROR ESTNDAR DE ESTIMACIN.
SYX =
SYX =
SYX = 10,6770718 ERROR ESTNDAR DE ESTIMACIN
Los lmites de control son:
LIC = Y* - 2 SYX
LSC = Y* + 2 SYX
Para Y* = 137
LIC =115,6. LMITE INFERIOR DE CONTROL
LSC = 158,4. LMITE SUPERIOR DE CONTROL
2e) Coeficiente de correlacin
R=
R=
R = 0,9551212 .. COEFICIENTE DE CORRELACIN
UTILIZANDO EXCEL
1
2
3
4
5
6
7
8
9
Y*
90,75485
131,48455
83,34945
161,10615
90,75485
179,61965
98,16025
105,56565
161,10615
LIC
69,40485
110,13455
61,99945
139,75615
69,40485
158,26965
76,81025
84,21565
139,75615
LSC
112,10485
152,83455
104,69945
182,45615
112,10485
200,96965
119,51025
126,91565
182,45615
10
250
136,05345
178,75345
Diagrama de dispersin
230
Nmero de unidades vendidas
157,40345
y = 37.027x + 5.1535
R = 0.9123
210
190
170
LNEA DE REGRESIN
150
130
LMITES MINIMOS
110
LMITES MXIMOS
90
70
50
2
Linear (LNEA DE
REGRESIN)
Calificacin de la prueba
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
0,955121198
0,912256503
SOLUCIN 3:
X1
(precio)
12
12
9
8
7
6
6
8
5
5
5
3
4
3
4
X2
X3
Y
(ingreso)
(sustituto) (demanda)
400
11
56
500
13
60
600
12
50
700
13
55
800
11
60
900
15
70
1000
16
65
1100
17
65
1200
22
75
1300
19
75
1400
20
80
1500
23
100
1600
18
90
1700
24
95
1800
21
85
110
Diagrama de dispersin
100
90
80
70
Precios
60
Ingresos
50
Sustitutos
40
30
20
0
500
1000
1500
2000
MLTIPLE
3b) COEFICIENTE DE CORRELACIN MLTIPLE usando Excel:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,926007188
Coeficiente de determinacin R^2
0,857489313
SXY =
SXY =
SXY = 6,54545881
3d)
Y* = 32,620 + 0,383 X1 + 0,017X2 + 1,383 X3
Si X1 = 6 , X2 = 1200 y X3 =17 entonces
Y* = 78,829
La demanda ser de 78,829.
SOLUCIN 4
Ecuaciones normales:
B=
A=
= 2,87
- 2,87 (
) = 15,76
Coeficiente de correlacin:
R=
R=
R=
R=
R= 0,53
Lmites de control:
Y* = A + Bx
Y* = 15,76 + 2,87x
- Para x= 2
Y* = 15,76 + 2,87(2)
Y* = 21,5
LC = Y*
2 Syx
- Para x=3,5
Y* = 15,76 + 2,87(3,5)
Y* = 25,80
LC = Y*
2 Syx
Grfico :
SOLUCIN 5
Ao
X2
Log Y
2008
32
1,505
0.000
0.000
2010
47
1,672
0.477
2012
25
75
1,875
2014
49
99
1,996
N=4
19
84
253
7,048
Log X
(Logy)2
X(LogY)
0.000
2,265
1,505
0,228
0,798
2,796
5,016
0.699
0,489
1,311
3,516
9,375
0.845
0,714
1,687
3,984
13,972
12,561
29,868
2,526
(Logx)2
1,431
Lg x Log Y
3,796
FUNCIN POTENCIAL
ECUACIONES NORMALES:
A=
LogB =
= 3,99
- 3,99 (
) = -0,76 B=0,17
COEFICIENTE DE CORRELACIN:
2
R=
R2=
R2=
R= 1,036
FUNCIN EXPONENCIAL
ECUACIONES NORMALES:
logB =
logA =
= 0,578
- 0,578 ( ) = -0,984
COEFICIENTE DE CORRELACIN:
R=
R2=
R2=
R2= 1,059
R = 1,029
= -6,28
+6,28( ) = 93,08
Base:2013 x
Ecuacin: Y = A + Bx
Ecuacin: Y = 93,08 - 6,28x
Pronstico :2015 x+2
Ecuacin: Y = 93,08 - 6,28 (x+2)
Ecuacin: Y =93,08 - 12,56 - 6,28x
Ecuacin: Y = 80,52 - 6,28x