You are on page 1of 16

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL

FACULTAD DE INGENIERA INDUSTRIAL Y DE SISTEMAS

INGENIERA INDUSTRIAL

Dr. Ing. Luis Manrique Surez

INTRODUCCIN
La regresin y la correlacin son dos tcnicas estrechamente relacionadas y
comprenden una forma de estimacin.
En forma ms especifica el anlisis de correlacin y regresin comprende el anlisis de
los datos mustrales para saber qu es y cmo se relacionan entre s dos o ms
variables en una poblacin. El anlisis de correlacin produce un nmero que resume
el grado de la correlacin entre dos variables; y el anlisis de regresin da lugar a una
ecuacin matemtica que describe dicha relacin.

El anlisis de correlacin generalmente resulta til para un trabajo de exploracin


cuando un investigador o analista trata de determinar que variables son potenciales
importantes, el inters radica bsicamente en la fuerza de la relacin. La correlacin
mide la fuerza de una entre variables; la regresin da lugar a una ecuacin que
describe dicha relacin en trminos matemticos.

Los datos necesarios para anlisis de regresin y correlacin provienen de


observaciones de variables relacionadas.

PROBLEMAS
1. Ricky est pensando vender su casa. Con el fin de decidir qu precio pedir por ella,
ha recogido datos de 12 ventas (miles de dlares), el nmero de pies cuadrados de
construccin (en cientos de pies), el nmero de pisos, el nmero de baos y la
antigedad de la casa (en aos).

Precio de 50.8 67.95 81.15 81.60 91.50 95.25 100.35 104.25 112.65 149.70 160.65 228.6
venta
Pies
8.7
9.5
12.6 12.9 19.0 17.6
20.0
20.6
20.5
25.1
22.7
38.7
cuadrados
Pisos
1
1
2
2
2
1
2
2
1
2
2
3
Baos
1.0
1.0
1.5
1.5
1.0
1.0
1.5
1.5
2.0
2.0
2.0
4.0
Antigedad
2
6
11
8
22
17
12
11
9
8
18
12
a) Determine la ecuacin de regresin de mejor ajuste para los datos, utilizando
cualquier paquete disponible.
b) Calcular e interpretar el valor de R (coeficiente de correlacin mltiple)
c) Si la casa de Ricky tiene 1800 pies cuadrados (= 18 cientos de pies2), un piso, 1.5 baos
y 6 aos de antigedad Qu precio de venta podra esperar Ricky? Para este precio,
determinar los lmites de control.
2. Una empresa administra a sus vendedores una prueba de adiestramiento de ventas
antes de permitirles salir a trabajar. La administracin de la empresa est interesada
en determinar la relacin entre las calificaciones de la prueba y las ventas hechas por
esos vendedores al final de un ao de trabajo. Los siguientes datos se recopilaron de
10 agentes de ventas que han estado en el campo durante un ao.
Nmero de vendedor

Calificacin de la prueba

1
2
3
4
5
6
7
8
9
10

2.6
3.7
2.4
4.5
2.6
5.0
2.8
3.0
4.5
4.4

Nmero de unidades
vendidas
95
140
85
180
100
195
115
136
174
146

a) Encuentre la lnea de regresin de mnimos cuadrados que podra usarse para predecir
ventas de las calificaciones de las personas en adiestramiento.
b) En cunto se incrementa el nmero esperado de unidades vendidas por cada
incremento de 1 punto en una calificacin de la prueba?

c) Utilice la lnea de regresin de mnimos cuadrados para predecir el nmero de


unidades que vendera una persona en adiestramiento que recibi una calificacin de
prueba promedio.
d) Determinar los lmites de control para c)
e) Calcular el coeficiente de correlacin
3. Estamos intentando predecir la demanda anual de un cierto producto (Demanda),
utilizando las siguientes variables independientes:
PRECIO = precio del producto (en S/.)
INGRESO = ingreso del consumidor (en S/.)
SUB = precio de un bien sustituto (en S/.)
(Nota: Un bien sustituto es aquel que puede suplir a otro bien. Por ejemplo, la margarina es
un bien sustituto de la mantequilla). Se han registrado datos correspondientes al periodo del
1 al 15.
Ao
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

Demanda
56
60
50
55
60
70
65
65
75
75
80
100
90
95
85

Precio
12
22
9
8
7
6
6
8
5
5
5
3
4
3
4

Ingreso
400
500
600
700
800
900
1000
1100
1200
1300
1400
1500
1600
1700
1800

Sustituto
11
13
12
13
11
15
16
17
22
19
20
23
18
24
21

a) Utilice el paquete de computo que tenga disponible para encontrar la ecuacin de


regresin de mejor ajuste para estos
b) Establezca e interprete el coeficiente de correlacin mltiple
c) Establezca e interprete el error estndar de la estimacin
d) Utilizando la ecuacin de regresin obtenida Qu valor de demanda predecira si el
precio de los productos fue de S/.6, el ingreso del consumidor de S/. 1200 y el precio
del bien sustituto fue de S/.17?
4. Suponga que una compaa de seguros contra incendio desea relacionar la cantidad
de daos por el fuego en incendios residenciales importantes (Y, miles de soles) con
la distancia entre la residencia y la estacin de bomberos ms cercana (X,
kilmetros). Se selecciona una muestra de 15 incendios recientes.

X
3,4
1,8
4,6
2,3
3,1
5,5
7
3
2,6
3,6
2,6
1,1
6,1
4,8
3,8

Y
26,2
17,8
31,3
23,1
27,5
36
14,1
22,3
19,6
29,7
24,5
17,3
43,2
36,4
26,1

XY
89,08
32,04
143,98
53,13
85,25
198
98,7
66,9
50,96
106,92
63,7
19,03
263,52
174,72
99,18

X2
11,56
3,24
21,16
5,29
9,61
30,25
49
9
6,76
12,96
6,76
1,21
37,21
23,04
14,44

Y2
686,44
316,84
979,69
533,61
756,25
1296
198,81
497,29
384,16
882,09
600,25
299,29
1866,24
1324,96
681,21

55,3

395,1

1545,11

234,73

11303,13

Calcular: Y*, SYX, r, lmites de control


Graficar los datos observados y los datos tericos.
5. Ajustar los siguientes datos a:
AO
2008
2010
2012
2014

a)
b)
c)
d)

POBLACIN
32
47
75
99

Una curva potencial, SYX y r


Una curva exponencial, SYX y r
Obtener la ecuacin con base en 2013, X dado en aos.
Hallar Y* (pronstico para el ao 2015)

Poblacin: millones de habitantes

SOLUCIN 1:
1a) Primero construimos el diagrama de dispersin tomando como variable
dependiente al precio de venta y como variables independiente al nmero de pies
cuadrados, el nmero de pisos, el nmero de baos y los aos de antigedad que
tiene la casa; para deducir mejor el tipo de funcin matemtica para la lnea de
regresin, en este caso es una regresin lineal mltiple.

Diagrama de dispersin

250

200

150

Pies cuadrados
Pisos
Baos

100

Antigedad
50

0
0

10

20

30

40

50

Y = A+B1X1+B2X2+B3X3+B4X4
Usando Excel obtenemos la ecuacin:
Y* = -1,2436 + 1,2436X1 + 29,3761X2 3,7389X3 + 3,200X4
Coeficientes
-1,243571302
1,045148558
29,37612677
-3,7398837
3,01995469

Intercepcin
Variable X 1
Variable X 2
Variable X 3
Variable X 4

1b) COEFICIENTE DE CORRELACIN MLTIPLE

X1(antigedad) X2(baos)
2

X3(pisos)

X4(pies
cuadrados)

Y(precio
de venta)

X1Y

X2Y

X3Y

X4Y

8,7

50,8

101,6

50,8

50,8

441,96

9,5

67,95

407,7

67,95

67,95

645,525

11

1,5

12,6

81,15

892,65

121,725

162,3

1022,49

1,5

12,9

81,6

652,8

122,4

163,2

1052,64

22

19

91,5

2013

91,5

183

1738,5

17

17,6

95,25

1619,25

95,25

95,25

1676,4

12

1,5

20

100,35

1204,2

150,525

200,7

2007

11

1,5

20,6

104,25

1146,75

156,375

208,5

2147,55

20,5

112,65

1013,85

225,3

112,65

2309,325

25,1

149,7

1197,6

299,4

299,4

3757,47

18

22,7

160,65

2891,7

321,3

321,3

3646,755

12

38,7

228,6

2743,2

914,4

685,8

8846,82

136

20

21

227,9

R=

1324,45 15884,3 2616,925 2550,85 29292,435

R= 0.9756. COEFICIENTE DE CORRELACIN MLTIPLE


Usando Excel:
Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2

0,975688189
0,951967442

INTERPRETACIN: Como el coeficiente de correlacin es mayor que cero entonces existe una
CORRELACIN POSITIVA, adems este indica que el 98% de la variacin en Y se debe a las
variables independientes X1, X2, X3 y X4. Adems el coeficiente de determinacin se acerca a 1
lo que indica que EL MODELO ES CONFIABLE para hacer pronsticos de Y a partir de las
variables usadas.

1c)
Y* = -1,2436 + 1,2436X1 + 29,3761X2 3,7389X3 + 3,200X4
Si X1= 6 , X2 =1,5 , X3 = 1 y X4 = 18

Entonces Y* = 104.143
Se puede esperar un precio de venta 104,143 (en miles de dlares) por la casa de
Ricky.

Para hallar los lmites de control primero hallaremos ERROR ESTNDAR DE


ESTIMACIN.

SXY =

Donde
Y*: valores estimados a partir de la ecuacin de regresin
k : nmero de variables independientes
Entonces el ERROR ESTNDAR DE ESTIMACIN es:
SXY =
SXY = 13,3081478
Para Y* = 104.143

LIC = Y* - 2 SXY

LIC = 104,143 26,616

LIC = 77,527 .. LMITE INFERIOR DE CONTROL


LSC = Y* + 2 SXY

LIC = 104,143 + 26,616

LSC = 130.149. LMITE SUPERIOR DE CONTROL

SOLUCIN 2:
2a) Si llevamos las variables a una grfica, podremos ver mucho mejor cual es la ecuacin
correspondiente. Entonces tomamos como variable dependiente a la CALIFICACIN DE LA
PRUEBA y como independiente al NMERO DE UNIDADES VENDIDAS.
X (Calificacin de
la prueba)
2,6
3,7
2,4
4,5
2,6
5
2,8
3
4,5
4.4

Y (Nmero de unidades
vendidas)
95
140
85
180
100
195
115
136
174
146

Nmero de unidades vendidas

250

Diagrama de dispersin

200
150
100
50
0
0

Calificacin de la prueba

Observando la grfica, podemos utilizar el mtodo de los mnimos cuadrados para hallar la
lnea de regresin, en este caso ser una recta.
X
1
2
3
4
5
6
7
8
9
10

Y
2,6
3,7
2,4
4,5
2,6
5
2,8
3
4,5
4,4
35,5

95
140
85
180
100
195
115
136
174
146
1366

=3,55

XY

X^2
247
518
204
810
260
975
322
408
783
642,4
5169,4

Y^2
6,76
13,69
5,76
20,25
6,76
25
7,84
9
20,25
19,36
134,67

= 136,6

Lnea de regresin: Y = A + BX
Ecuaciones:

B=

A=

-B

= 37,0271833

= 5,15349913
Y*= 5,15349913 + 37,0271833X

LNEA DE REGRESIN

9025
19600
7225
32400
10000
38025
13225
18496
30276
21316
199588

Y*= 5,15349913 + 37,0271833X

2c)

Si X = 3.55
Y* = 137
Se venderan 137 unidades si una persona tiene 3.55 de calificacin en su prueba.
2d) Primero tenemos que hallar el ERROR ESTNDAR DE ESTIMACIN.
SYX =

SYX =
SYX = 10,6770718 ERROR ESTNDAR DE ESTIMACIN
Los lmites de control son:
LIC = Y* - 2 SYX
LSC = Y* + 2 SYX
Para Y* = 137
LIC =115,6. LMITE INFERIOR DE CONTROL
LSC = 158,4. LMITE SUPERIOR DE CONTROL
2e) Coeficiente de correlacin

R=

R=
R = 0,9551212 .. COEFICIENTE DE CORRELACIN
UTILIZANDO EXCEL

1
2
3
4
5
6
7
8
9

Y*
90,75485
131,48455
83,34945
161,10615
90,75485
179,61965
98,16025
105,56565
161,10615

LIC
69,40485
110,13455
61,99945
139,75615
69,40485
158,26965
76,81025
84,21565
139,75615

LSC
112,10485
152,83455
104,69945
182,45615
112,10485
200,96965
119,51025
126,91565
182,45615

10

250

136,05345

178,75345

Diagrama de dispersin

230
Nmero de unidades vendidas

157,40345

y = 37.027x + 5.1535
R = 0.9123

210
190
170

LNEA DE REGRESIN

150
130

LMITES MINIMOS

110
LMITES MXIMOS

90
70
50
2

Linear (LNEA DE
REGRESIN)

Calificacin de la prueba

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2

0,955121198
0,912256503

SOLUCIN 3:
X1
(precio)
12
12
9
8
7
6
6
8
5
5
5
3
4
3
4

X2
X3
Y
(ingreso)
(sustituto) (demanda)
400
11
56
500
13
60
600
12
50
700
13
55
800
11
60
900
15
70
1000
16
65
1100
17
65
1200
22
75
1300
19
75
1400
20
80
1500
23
100
1600
18
90
1700
24
95
1800
21
85

110

Diagrama de dispersin

100
90
80
70

Precios

60

Ingresos

50

Sustitutos

40
30
20
0

500

1000

1500

2000

3a) ECUACIN DE REGRESIN usando Excel:


Y = A+B1X1+B2X2+B3X3
Coeficientes
Intercepcin 32,6204604
Variable X 1
0,38289268
Variable X 2 0,01673373
Variable X 3 1,38324384

Y* = 32,620 + 0,383 X1 + 0,017X2 + 1,383 X3 ECUACIN LINEAL DE REGRESIN

MLTIPLE
3b) COEFICIENTE DE CORRELACIN MLTIPLE usando Excel:
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,926007188
Coeficiente de determinacin R^2
0,857489313

El coeficiente de correlacin mltiple es positivo por lo tanto es una correlacin positiva.


Adems el coeficiente de determinacin indica que el 85% de la variacin de Y se debe a las
variables independientes X1, X2 y X3. Tambin indica que el modelo es confiable para futuros
pronsticos de la variable dependiente Y en base a las variables independientes utilizadas.

3c) ERROR ESTNDAR DE ESTIMACIN

SXY =

SXY =
SXY = 6,54545881
3d)
Y* = 32,620 + 0,383 X1 + 0,017X2 + 1,383 X3
Si X1 = 6 , X2 = 1200 y X3 =17 entonces
Y* = 78,829
La demanda ser de 78,829.
SOLUCIN 4
Ecuaciones normales:
B=
A=

= 2,87
- 2,87 (

) = 15,76

Error estndar de estimacin:


Syx =
Syx =
Syx =
Syx = 6,54

Coeficiente de correlacin:
R=

R=
R=
R=
R= 0,53

Lmites de control:
Y* = A + Bx
Y* = 15,76 + 2,87x
- Para x= 2
Y* = 15,76 + 2,87(2)
Y* = 21,5
LC = Y*

LSC= 21,5 + 2(6,54) = 34,58


LIC = 21,5 - 2(6,54) = 8,42

2 Syx

- Para x=3,5
Y* = 15,76 + 2,87(3,5)
Y* = 25,80
LC = Y*

LSC= 25,80 + 2(6,54) = 38,88


LIC = 25,80 - 2(6,54) = 12,72

2 Syx

Grfico :

SOLUCIN 5
Ao

X2

Log Y

2008

32

1,505

0.000

0.000

2010

47

1,672

0.477

2012

25

75

1,875

2014

49

99

1,996

N=4

19

84

253

7,048

Log X

(Logy)2

X(LogY)

0.000

2,265

1,505

0,228

0,798

2,796

5,016

0.699

0,489

1,311

3,516

9,375

0.845

0,714

1,687

3,984

13,972

12,561

29,868

2,526

(Logx)2

1,431

Lg x Log Y

3,796

FUNCIN POTENCIAL
ECUACIONES NORMALES:
A=
LogB =

= 3,99
- 3,99 (

) = -0,76 B=0,17

ERROR ESTANDAR DE ESTIMACION:


Syx =
Syx =
Syx =
Syx = 0,832

COEFICIENTE DE CORRELACIN:
2

R=

R2=
R2=
R= 1,036

FUNCIN EXPONENCIAL
ECUACIONES NORMALES:
logB =
logA =

= 0,578
- 0,578 ( ) = -0,984

ERROR ESTANDAR DE ESTIMACION:


S2yx =
S2yx =
Syx = 0,747

COEFICIENTE DE CORRELACIN:

R=

R2=
R2=
R2= 1,059
R = 1,029

ECUACIN BASE 2013(PRONOSTICO 2015):


B=
A=

= -6,28
+6,28( ) = 93,08

Base:2013 x
Ecuacin: Y = A + Bx
Ecuacin: Y = 93,08 - 6,28x
Pronstico :2015 x+2
Ecuacin: Y = 93,08 - 6,28 (x+2)
Ecuacin: Y =93,08 - 12,56 - 6,28x
Ecuacin: Y = 80,52 - 6,28x

You might also like