Professional Documents
Culture Documents
GENERAL
Unidad IV: Regresin lineal y
Correlacin
Mg. Guillermo Antonio
Mas Azahuanche
Regresin a la media
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
Ejemplo
Altura
Padre
Altura
Hijo
1.65
1.73
1.60
1.68
1.70
1.73
1.63
1.65
1.73
1.75
1.57
1.68
1.78
1.73
1.68
1.65
1.73
1.80
1.70
1.70
1.75
1.73
1.80
1.78
ue
q
ce
e
r
Pa
s
e
p
el
nta
e
um
a
o
la
n
co
a
r
u
t
al
10 kg.
10 cm.
Incorrelacin
280
230
180
130
80
30
140
150
160
170
180
190
200
Para
o
o
o
Dado un valor de X no podemos decir gran
cosa sobre Y. Mala relacin. Independencia.
Conocido
Incorreladas: Sxy =0
1
S xy ( xi x )( yi y )
n i
B1
SC xy
B0 y B1 x
SC x
SC x x
2
( x )
n
SC xy xy
( x )( y )
n
Ejemplo
Los datos corresponde a la estatura del padre (X) y la estatura del su hijo mayor (Y) para
una muestra de padres e hijos son los siguientes:
Estud.
Calificacin en
matemtica Pre
Univ. (X)
Calificacin en matemtica
Universidad (Y)
53
76
35
57
76
99
29
74
48
90
58
93
65
83
22
53
44
79
10
40
66
S xy
SxS y
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son incorreladas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
-1
Variables
incorreladas
Relacin
directa
casi
perfecta
+1
Preguntas frecuentes
Regresin
= Variable dependiente
predicha
explicada
= Variable independiente
predictora
explicativa
Es
Y = f(X) + error
Regresin
= b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
= b0 + b 1 X
b1=0,5
b0=85 cm
b1=0,5
b0=85 cm
i ei2
SY
b1 r
SX
b0 y b1 x
Cometi un error
de -30 en su
ltima prediccin
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
Bondad de un ajuste
Resumiendo:
Cuanto
S
R 1
S
2
2
e
2
Y
2
e
2
Y
por qu?
por qu?
1 variable explicativa
Modelos de regresin
Simple
Lineal
2+ variables explicativas
Mltiple
No lineal
Lineal
No lineal