You are on page 1of 33

UNIDAD 1 REGRESIN Y CORRELACIN LINEAL

1.- Variable DEPENDIENTE "Y" Es la que se quiere predecir.


2.- Variable INDEPENDIENTE "X" Se usa para predecir la
variable dependiente.

RELACIN LINEAL

Se requiere predecir las ventas semanales de una muestra aleatoria de 20 almacenes de


una franquicia. A continuacin se presentan los datos.

Almacenes
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

Clientes
907
926
506
741
789
889
874
510
529
420
679
872
924
607
452
729
794
844
1010
621

Ofertas
11.2
11.05
6.84
9.21
9.42
10.08
9.45
6.73
7.24
6.12
7.63
9.43
9.46
7.64
6.92
8.95
9.33
10.23
11.77
7.41

ria de 20 almacenes de

VENTAS EN LOS ALMACENES


14
12
10
8
VENTAS

6
4
2
0
300

400

500

600

700
CLIENTES

A medida que aumenta el nmero


de clientes, se incrementa el
volumen de ventas.

800

900

1000

1100

00

1000

1100

Al gerente de comercializacin de una cadena grande de supermercados le gustara


determinar el efecto del espacio en estanques sobre la venta de comida para
mascotas. Se seleccionar 12 muestras aleatorias que se presentaran a
continuacin.

Tienda
1
2
3
4
5
6
7
8
9
10
11
12

Espacio en pies (X)


5
5
5
10
10
10
15
15
15
20
20
20

Ventas semanales (y)


1.6
2.2
1.4
1.9
2.4
2.6
2.3
2.7
2.8
2.6
2.9
3.1

ermercados le gustara
de comida para
sentaran a

tas semanales (y)


1.6
2.2
1.4
1.9
2.4
2.6
2.3
2.7
2.8
2.6
2.9
3.1

ESPACIO VS VENTAS
3.5
3
2.5
2
VENTAS

1.5
1
0.5
0
4

10

12

14

ESPACIO

Las ventas aumentan a medida de que


el espacio d los estantes es mayor.

16

18

S VENTAS

12

14

ESPACIO

16

18

20

22

EJERCICIO 2: Al director de una compaa que fabrica partes le gustara


desarrollar un modelo para estimar el nmero de horas - trabajador requeridas para
las corridas de produccin de lotes de tamao variable. Se seleccion una muestra
aleatoria de 14 corridas de produccin ( dos por cada tamao de lote (20, 30, 40,
50, 60, 70, 80) y los resultados son los siguientes.

Tam Lote
70
20
60
80
20
40
40
80
60
30
50
50
30
70

Hrs. Trabaj
148
50
128
170
55
87
95
162
135
73
108
112
67
160

Ta

Horas - trabajador

180
160
140
120
100
80
60
40
20
0
1

gustara
dor requeridas para
ccion una muestra
e lote (20, 30, 40,

Tamao de lote vs Hra - Trabajador

Horas - trabajador

180
160
140
120
100
80
60
40
20
0
10

20

30

40

50

Tamao del lote

60

70

80

90

80

90

RELACIN LINEAL POSITIVA:


" Y" aumenta al incrementarse "X"

RELACION CURVILINEA POSITIVA:


Los valores de "Y" aumnetan al incrementarse el valor de "X", pero
este incremento disminuye cuando se sobrepasan ciertos valores
de "X"
Ej. Edad y costo de mantenimiento de maquinaria.

RELACIN PARABLICA:
"X" aumenta al principio y disminuye, pero a medida que "x" sigue
incrementando entonces "Y" tamnien.
Ej. El nmero de errores por hora comentidos en una hora
cometidos en una tarea y el nmero de horas trabajados en ellos.
Primero mejorar con el tiempo pero aumentarn a causa de la
fatiga.

RELACIN LINEAL NEGATIVA


Aumenta "X" y los valores de "Y" disminuyen.
Ejemplo: Costo de un producto y ventas.

RELACION EXPONENCIAL NEGATIVA O CURVIILINEA NEGATIVA

r de "X", pero
rtos valores

"Y" disminuye rpidamente que "X" aumenta, pero luego su disminucin se hace ms
lenta.
La devaluacin de un auto con el tiempo.

e "x" sigue

ora
os en ellos.

usa de la

Ninguna relacin de "X" y "Y" Se da


cuando los valores difieren.

GATIVA

sminucin se hace ms

MODELO DE REGRESIN
A la ecuacin con la que se describe cmo se relaciona Y con X y en la que se da
un trmino para el error se llama MODELO DE REGRESIN: Y= B0 + B1X1 +E
DONDE
Y= Variable dependiente
X= Variable independiente
B0= Coeficiente o la interseccin Y para lapoblacin ( valor de Y cuando X= 0
B1= Pendiente de la poblacin o de regresin (coef de cambio.)
E= Es el error aleatorio en "Y" para la observacin.

CLIENTES VS OFERTAS
14
12
f(x) = 0.0087293382x + 2.4230443959

10
8
6
4
2
0
300

400

500

600

700

800

900

1000

1100

Con 2000 clientes


3.29

con X y en la que se da
N: Y= B0 + B1X1 +E

DETERMINACIN DE LA ECUACIN LINEAL SIMPLE


Retomando el ejemplo 1, en el que las ventas pa
de clientes.....

El problema que debe enfrentarse en el anlisis


determinacin del modelo particular de lnea rect

or de Y cuando X= 0

mbio.)
MTODO DE MNIMOS CUADRADOS

Con el propsito de predecir los valores "Y" esta e


determinacin de los coeficientes: B0 y B1

AlmaC

1000

1100

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
TOTALES

Clientes
Ofertas
907
926
506
741
789
889
874
510
529
420
679
872
924
607
452
729
794
844
1010
621
14623

X2
11.2
11.05
6.84
9.21
9.42
10.08
9.45
6.73
7.24
6.12
7.63
9.43
9.46
7.64
6.92
8.95
9.33
10.23
11.77
7.41
176.11

Y2
822649
857476
256036
549081
622521
790321
763876
260100
279841
176400
461041
760384
853776
368449
204304
531441
630436
712336
1020100
385641
11306209

125.44
122.1025
46.7856
84.8241
88.7364
101.6064
89.3025
45.2929
52.4176
37.4544
58.2169
88.9249
89.4916
58.3696
47.8864
80.1025
87.0489
104.6529
138.5329
54.9081
1602.0971

Promedio X
Promedio Y
X BARRA 2
B1
B1
B1
B0

731.15
8.8055
534580.32
5365.07
614602.55
0.0087

77.54

2.423

Por lo tanto la ecuacin de la recta es:


Y= 0.0087x + 2.42

Por cada aumento de un cliente, el modelo ajustado


predice una estimacin de aumento de las ventas
semanales de 0.0087 miles de dolares.
En consecuencia la pendiente puede considerarse como la
representacin de la porcin de ventas semanales que se
estiman variarn con respecto al nmero de clientes.

534580.323

B0: Es el valor d

B1: Coerficiente
aumento de los
factor de venta p

El B0 es el indi
determina si es
pequeo.

CIN LINEAL SIMPLE


que las ventas parecen aumentar con el nmero

arse en el anlisis de regresin implica la


ticular de lnea recta

ADOS

s valores "Y" esta ecuacin requiere la


tes: B0 y B1

XY
10158.4
10232.3
3461.04
6824.61
7432.38
8961.12
8259.3
3432.3
3829.96
2570.4
5180.77
8222.96
8741.04
4637.48
3127.84
6524.55
7408.02
8634.12
11887.7
4601.61
134127.9

VENTAS CON LA ECUACION


10.31
10.48
6.83
8.87
9.29
10.16
10.03
6.86
7.03
6.08
8.33
10.01
10.46
7.70
6.36
8.77
9.33
9.77
11.21
7.83

0.5014952145

0.50149521
0.50149521

B0: Es el valor de y cuando x vale 0.


B1: Coerficiente de cambio: es el
aumento de los clientes (multiplicar ese
factor de venta por los clientes.

El B0 es el indicador y
determina si es muy grande o
pequeo.

EJERCICIO 1
Utilice el mtodo de los mnimos cuadrados pra calcular los coeficientes de
regresin de B0 y B1Interprete el significado de la B1 en el problema.
Prediga las ventas semanales promedio de alimento para mascotas con 8ft d
espacio en estantes por alimento.

cular los coeficientes de

para mascotas con 8ft d

ERROR ESTNDAR DE ESTIMACIN


La escuacin de regresin no es un pronosticador perfecto, a menos que todos los
valores de los datos caigan sobre la lnea recta.
La medida de la variabilidad alrededor de la lnea de regresin se conoce como
error estndar de estimacin.

AlmaC
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
TOTALES

Clientes
Ofertas
X2
Y2
907
11.2
822649
125.44
926
11.05
857476
122.1025
506
6.84
256036
46.7856
741
9.21
549081
84.8241
789
9.42
622521
88.7364
889
10.08
790321
101.6064
874
9.45
763876
89.3025
510
6.73
260100
45.2929
529
7.24
279841
52.4176
420
6.12
176400
37.4544
679
7.63
461041
58.2169
872
9.43
760384
88.9249
924
9.46
853776
89.4916
607
7.64
368449
58.3696
452
6.92
204304
47.8864
729
8.95
531441
80.1025
794
9.33
630436
87.0489
844
10.23
712336
104.6529
1010
11.77
1020100
138.5329
621
7.41
385641
54.9081
14623
176.11
11306209 1602.0971

El error estndar de la estimacin es igual a 0.5015 o


Representa una medida de la variacin alrededor de la
regresin ajustada. Se mide en unidades de la variable
dependiente Y. La interpretacin del error es entonces
la interpretacin de la desviacin estndar

ACIN

ecto, a menos que todos los


nea recta.

regresin se conoce como


n.

XY
10158.4
10232.3
3461.04
6824.61
7432.38
8961.12
8259.3
3432.3
3829.96
2570.4
5180.77
8222.96
8741.04
4637.48
3127.84
6524.55
7408.02
8634.12
11887.7
4601.61
134127.9

PROM X2
PROM Y2
X BARRA 2
B1
B1
B1
B0

Sys

timacin es igual a 0.5015 o sea $501.5.


de la variacin alrededor de la lnea de
ide en unidades de la variable
etacin del error es entonces anlogo a
sviacin estndar

731.15
8.81
534580.32
5365.0735
614602.55
0.0087
2.423

SST
SSR
SSE

0.5014952145
EL ERROR ESTNDAR DE ESTIMACIN

Puede utilizarse para hacer inferencias acerca de un valor predi


para determinar si existe una relacin estadsticamente significa
las 2 variables.
A mayor error, mayor cantidad de dispersin.

51.36
46.83
4.53

CIN

s acerca de un valor predicho de Y, y


estadsticamente significativa entre las

ersin.

MEDICIONES DE VARIACIN EN REGRESIN Y CORRELACIN

Se debe examinar que tambien una variable independiente puede predecir a la d


Para esto se desarrollan "medidas de variacin"

La primera de ellas es "Suma total de cuadrados (SST). Esta es una medida de va


valores de Y alrededor de su media Y

SST SE DIVIDE EN 2

La variacin explicada o suma de cuadrados debiada a la regresin (S


relacin entre X y Y

Variacin noi explicada o suma de cuadrados de error (SSE) Que son


diferentes a la relacin entre X y Y.
SST = SSR + SSE

SST

GRESIN Y CORRELACIN

endiente puede predecir a la dependiente.


didas de variacin"

ST). Esta es una medida de variacin de los


de su media Y

DIVIDE EN 2

dos debiada a la regresin (SSR) Que es la


entre X y Y

rados de error (SSE) Que son los factores


elacin entre X y Y.

SR + SSE

Se puede concluir que hay mas relacin


entre X y Y Que factores que diferentes a
su relacin.

que hay mas relacin


tores que diferentes a

COEFICIENTE DE DETERMINACIN R2
Mide la porcin de variacin que es explicada por la variable independiente
de modelos de regresin.
r2 = SSR
SST

11.6
COEFICIENTE DE CORRELACIN
14.3
Medida descrptiva de la intensidad de la relacin
lineal entre dos variables X y Y. Los valores del
coeficiente de correlacin son valores que van de -1
a 1.
+1 Indica que las dos variables X y Y, estan
perfectamente relacionadas con una relacin lineal
positiva.

e independiente
0.91

Porcentaje de relacin entre las


variables X y Y
Por lo tanto el 91.18% de la
variacin de las ventas
semanales puede explicarse
mediante la variabilidad en el
nmero de clientes de una
tienda a otra

COEFICIENTE DE CORRELACION (r)


-1 Indica perfectamente relacionadas con una
relacin lineal negativa.
Los valores cercanos a 0 indican que X y Y no
estan relacionados linealmente.

entre las

de la
s
icarse
ad en el
una

You might also like