You are on page 1of 5

REGRESION Y CORRELACION LINEAL

1. Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan,


respectivamente, 14, 20, 32, 42 y 44 kilos.
a) Hallar la ecuacin de la recta de regresin de la
edad sobre el peso.
b) Cul sera el peso aproximado de un nio de seis
aos?
xi

yi

xi
yi

14

196

28

20

400

60

32

25

1 024

160

42

49

1 764

294

44

64

1 936

352

2
5

15
2

15
1

5 320

894

2
i

b) Si el centro comercial se sita a 2 km, cuntos


clientes puede esperar?
c) Si desea recibir a 500 clientes, a qu distancia del
ncleo de poblacin debe situarse?
xi

yi

xi
yi

xi2

yi2

15

12
0

64

225

19

13
3

49

361

25

15
0

36

625

23

92

16

529

34

68

1 156

40

40

1 600

2
8

15
6

60
3

17
0

4 496

2
i

2. Un centro comercial sabe en funcin de la distancia, en


kilmetros, a la que se site de un ncleo de poblacin,
acuden los clientes, en cientos, que fi guran en la tabla:
N de clientes (X)

Distancia (Y)

15

19

25

23

34

40

a) Calcular el coefi ciente de correlacin lineal.

Correlacin negativa muy fuerte .

3. Las notas de cinco alumnos en Matemticas y Qumica


son:
Matemticas

3. 5

Qumica

6. 5

4. 5

Determinar las rectas de regresin y calcular la nota


esperada en Qumica para un alumno que tiene 7.5 en
Matemticas.
xi

yi

xi yi

xi2

yi2

6. 5

36

42. 25

39

4. 5

16

20. 25

18

64

49

56

25

25

25

3. 5

12. 25

16

14

26. 5

27

153.
25

152. 5

15
2

medias de las distribuciones marginales

Un punto de la recta ha de ser (

x ,

y ), es decir, (1,

2).
2 - 1 + 2
2 . 1 + 2 = 4
La recta pedida es: 2x + y = 4.
5. Las estaturas y pesos de 10 jugadores de futbol de un
equipo son:
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y)

85

85

86

90

87

91

93 103 100 101

Calcular:
a) La recta de regresin de Y sobre X.
b) El coefi ciente de correlacin.
c) El peso estimado de un jugador que mide 208 cm.

4. Un conjunto de datos bidimensionales (X, Y)


tiene coefi ciente de correlacin r = -0.9, siendo las

x = 1,

Se sabe que una de las cuatro ecuaciones siguientes


corresponde a la recta de regresin de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y = x + 1
Seleccionar razonadamente esta recta.
Como el coefi ciente de correlacin lineal es negativo ,
la pendiente de la recta tambin ser negativa, por
tanto descartamos la 2 y 4.

xi

yi

xi2

yi2

xi yi

186

85

34 596

7 225

15 810

189

85

35 721

7 225

16 065

190

86

36 100

7 396

16 340

192

90

36 864

8 100

17 280

193

87

37 249

7 569

16 791

193

91

37 249

8 281

17563

198

93

39 204

8 649

18 414

201

10
3

40 401

10
609

20 703

203

10

41 209

10

20 300

= 2.

0
205

10
1

1
950

92
1

000
42 025

10
201

20 705

380 618

85
255

179
971

82

300

6 724

90 000

24 600

85

340

7 225

115 600

28 900

79

315

6 241

99 225

24 885

84

330

7 056

108 900

27 720

80

310

6 400

96 100

24 800

62

240

3 844

57 600

14 880

936

3
632

73 760

1 109
254

285 908

Correlacin positiva muy fuerte.


6. A partir de los siguientes datos referentes a horas trabajadas
en un taller (x), y a unidades producidas (y), determinar
la recta de regresin de Y sobre X, el coefi ciente de
correlacin lineal e interpretalo.
Horas (X)

80

79

83

84

78

60

82

85

79

84

80

62

Produccin (Y) 300 302 315 330 300 250 300 340 315 330 310 240

xi

yi

xi yi

xi2

yi2

80

300

6 400

90 000

24 000

79

302

6 241

91 204

23 858

83

315

6 889

99 225

26 145

84

330

7 056

108 900

27 720

78

300

6 084

90 000

23 400

60

250

3 600

62 500

15 000

Correlacin positiva muy fuerte


7. Se ha solicitado a un grupo de 50 individuos
informacin sobre el nmero de horas que dedican
diariamente a dormir y ver la televisin. La clasifi cacin
de las respuestas ha permitido elaborar la siente tabla:
N de horas dormidas (X)

N de horas de televisin (Y)

Frecuencias absolutas (fi)

16

10

20

10

Se pide:

a) Calcular el coefi ciente de correlacin.


b) Determinar la ecuacin de la recta de regresin de Y
sobre X.
c) Si una persona duerme ocho horas y media, cunto cabe
esperar que vea la televisin?
xi

yi

fi

xi fi

xi2 fi

yi
fi

yi2 fi

xi yi fi

18

108

12

48

72

16

112

784

48

144

336

20

160

1280

60

180

480

10

90

810

20

40

180

10

10

100

10

50

390

3082

14
1

413

1078

2
9
8
4
11
12
2
4
4
20
1
10
15
15
16
17
6
5
206

X promedio

Es una correlacin negativa y


fuerte.

Se sospecha que el tiempo requerido para hacer un mantenimiento


preventivo est relacionado con su nmero. Calcular el coeficiente de
correlacin y graficar. Los datos de tiempo tomados para n = 25 servicios
se muestran a continuacin:
8.

X Servicios
2
8
11
10
8
4
2

Y Tiempo
9.95
24.45
31.75
35.00
25.02
16.86
14.38

(Xi-X)*(Yi-Y)
119.076672
1.099872
7.499472
10.502272
0.963072
51.612672
91.433472

(Xi-X)^2
38.9376
0.0576
7.6176
3.0976
0.0576
17.9776
38.9376

(Yi-Y)^2
364.1533
21.0021
7.3832
35.6075
16.1026
148.1771
214.7045

9.60
24.35
27.50
17.08
37.00
41.95
11.66
21.65
17.89
69.00
10.30
34.93
46.59
44.88
54.12
56.63
22.13
21.15
725.82

121.260672
-3.558928
0.367872
50.679872
21.989472
48.568672
108.406272
31.303072
47.245472
470.014272
135.625472
10.379072
118.686672
107.127072
194.676672
241.751472
15.462272
25.540272
2,027.7132

38.9376
0.5776
0.0576
17.9776
7.6176
14.1376
38.9376
17.9776
17.9776
138.2976
52.4176
3.0976
45.6976
45.6976
60.2176
76.7376
5.0176
10.4976
698.5600

377.6337
21.9286
2.3495
142.8694
63.4763
166.8541
301.8142
54.5057
124.1620
1,597.3771
350.9178
34.7770
308.2553
251.1337
629.3676
761.6054
47.6486
62.1385
6,105.9447

Sxy

Sxx

Syy = SST

Sxy

Sxx

Syy

Y Promedio

Si todos los puntos estuvieran completamente sobre la recta la ecuacin


lineal sera y = a + bx. Como la correlacin no siempre es perfecta, se
calculan a y b de tal forma que se minimice la distancia total entre puntos y
la recta. Los clculos tomando las sumas de cuadrados siguientes se
muestran a continuacin:
Sxy = 2027.71
Sxx = 698.56
Syy = 6105.94
Las ecuaciones para el clculo manual son las siguientes:
( Xi X )(Yi Y ) S XY
b1 1
S XX
( Xi X ) 2
= 2.902704421

b0 0

1 X i
n

r2 1

Y X

= 5.114515575

Las sumas de cuadrados son:


SST (Yi Y ) 2
6,105.9447
2
SSE (Yi Yi ) (Yi (bo b1 * X i )) 2

SSR SST SSE

220.0926

5,885.8521
El coeficiente de determinacin r2 y el coeficiente de correlacin r se
calculan a continuacin:

SSE ( SST SSE ) SSR

SST
SST
SST

= 0.9639
El coeficiente de determinacin indica el porcentaje de la variacin total que
es explicada por la regresin.
r r2
= 0.9816
El coeficiente de correlacin proporciona el nivel de ajuste que tienen los
puntos a la lnea recta indicando el nivel de influencia de una variable en la
otra. El factor de correlacin r es un nmero entre 1 (correlacin negativa
evidente) y +1 (correlacin positiva evidente), y r = 0 indicara correlacin
nula.
El coeficiente de correlacin r = 0.98 por lo cual tenemos suficiente
evidencia estadstica para afirmar que el tiempo de atencin esta
relacionado con el nmero de servicios atendidos.

You might also like