Professional Documents
Culture Documents
Regresin a la media
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Qu vamos a estudiar
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
ue
q
ce
e
r
Pa
s
e
p
el
nta
e
um
a
o
la
n
co
a
r
u
t
al
10 kg.
10 cm.
No correla
cionadas
280
230
180
130
80
30
140
150
160
170
180
190
200
o
o
o
Dado un valor de X no podemos decir gran
cosa sobre Y. Mala relacin. Independencia.
No correlacionada: Sxy =0
1
S xy ( xi x )( yi y )
n i
10
S xy
SxS y
11
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son no correlacionadas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
-1
Variables no
correlacionadas
Relacin
directa
casi
perfecta
+1
12
13
14
15
Preguntas frecuentes
16
(ro) de Spearman
(tau) de Kendall
17
Regresin
El anlisis de regresin sirve para predecir una
medida en funcin de otra medida (o varias).
Y
= Variable dependiente
predicha
explicada
= Variable independiente
predictora
explicativa
Es
Y = f(X) + error
18
Regresin
19
= b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
20
= b0 + b 1 X
b1=0,5
b0=85 cm
21
b1=0,5
b0=85 cm
22
i ei2
SY
b1 r
SX
b0 y b1 x
23
Cometi un error
de -30 en su
ltima prediccin
24
25
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
26
Interpretacin
del
residuo
Fijmonos ahora en los errores de prediccin
(lneas verticales). Los proyectamos sobre el eje Y.
27
Bondad de un ajuste
Resumiendo:
S
R 1
S
2
2
e
2
Y
2
e
S
28
2
Y
por qu?
por qu?
29
30
1 variable explicativa
Modelos de regresin
Simple
Lineal
2+ variables explicativas
Mltiple
No lineal
Lineal
No lineal
31
180
190
170
b0=89,985
b1=0,466
Aprecias regresin a la media?
160
150
150
160
170
180
190
Eso significa que el 57% de las predicciones del modelo son correctas?
Correlaciones
Correlacin de Pearson
R
,759a
R cuadrado
,577
R cuadrado
corregida
,569
Coeficientes no
estandarizados
Modelo
1
Coeficientesa
Altura del
Padre
,759
1,000
Error tp. de la
estimacin
3,480
(Constante)
Altura del Padre
B
89,985
,466
Error tp.
9,180
,053
32
200
Qu hemos visto?
Ordenada en el origen
Pendiente
Residuo, error
Bondad del ajuste, coef. determinacin
33