Professional Documents
Culture Documents
1. Introduccin
NDICE:
2. Rectas de regresin o Regresin lineal 3. La varianza residual o de la regresin lineal 4. Regresin y correlacin no lineal
a. Regresin parablica b. Correlacin parablica
Introduccin
Se trata de aprovechar la informacin de una variable (por ejemplo x) para mejorar la media de la otra ( y ).
y (x ) y / x
Variable y/x
Distribucin condicionada Regresin de y/x Varianza residual ( s r2 )
y
2 sy
informacin dada
por x
y (x )
2 sy / x
ry2/ x =
s s
2 y 2 sy
2 r
s = 1 s
2 r 2 y
ry2/ x = 0
ry2/ x = 1
2 s y = s r2
s r2 = 0
Introduccin
a. Regresin en sentido estricto Regresin emprica de y sobre x: es la media de la distribucin condicionada, es decir: m y / xi = y j f j / i = y (x ) depende de x
j =1
Regresin emprica
y / xi Ajuste: consiste en aproximar dichos puntos por una lnea matemtica de tipo conocido
0 ( xi ; a0 , b0 ,K)
x xi Regresin mnimo cuadrtica (m.c.): llamaremos regresin mnimo cuadrtica a la curva 0 de una familia de curvas , que verifica
Introduccin
b. Regresin en sentido amplio
min y j (xi ; a, b,K) f ij = y j 0 (xi ; a, b, K) f ij
2 2 i =1 j =1 i =1 j =1 n m
Nube de puntos
yj
0 ( xi ; a0 , b0 ,K)
xi
Introduccin
Ejemplo: Calcular la recta regresin en sentido amplio y en sentido estricto de la siguiente distribucin bidimensional
x y 1 2 3
ni x i ni
3 1 1
n j
y j n j
y 2 n j j
1 16 45 62
x n
i i
ij
y j xi nij
i
1 8 15 24
3 17 22 42
3 34 66 103
2 6 18
ij
4 16 64 11 44
xi2 ni
y n
j j
j
3 9
xi y j nij
Introduccin
a. Regresin en sentido estricto Primero tenemos que calcular las medias condicionadas:
y j x1 = 3 n j /1 y j n j /1
1 2 Total
1 1
n1 = 2
1 2
3
y / x1 = y j f j /1 =
j =1
3 = 1,5 2
y j x2 = 4
2 3 Total
nj/2
1 3
y j nj/2
2 9 11
y / x2 = y j f j / 2 =
j =1
11 = 2,75 4
n 2 = 4
y j x3 = 5
n j /3
y j nj/3
2 3 Total
2 2 n3 = 4
4 6 10
y / x3 = y j f j / 3 =
j =1
10 = 2,5 4
Introduccin
a. Regresin en sentido estricto Para ajustar una funcin lineal habr que encontrar los valores a y b que hacen mnima la expresin:
i =1
y/x
i =1
f i =a + b xi f i
i =1
y/x
i =1
xi f i =a xi f i + b xi2 f i
i =1 i =1
y / xi
xi
f i
y / xi f i
y / xi xi f i
xi f i
xi2 f i
3 4 5
y1 = 0,75 + 0,392 x
Introduccin
b. Regresin en sentido amplio Se trata de minimizar la siguiente expresin:
min (a, b ) = y j a bxi
i =1 j =1
n m (a, b ) = 2 y j a bxi f ij = 0 a i =1 j =1 n m (a, b ) = 2 y j a bxi xi f ij = 0 b i =1 j =1
f ij
Aplicando Cramer:
2,4 a= 4,2 b= 1 2,4
y = 0,75 + 0,392 x
f ij
y
n i =1 j =1 m i =1 j =1 i
f ij = a f ij + b xi f ij
j
x y
f ij = a xi f ij + b xi2 f ij
i =1 j =1 i =1 j =1
i =1 j =1 n m
i =1 j =1 n m
a11 = aa10 + ba 20
2 a10 a01 = aa10 + ba10
Coeficiente de regresin
2 10
b=
a = y bx
y= y
s xy s s xy
2 x
x+
s xy s
2 x
x=
= y+
2 x
(x x ) = (x x )
y y (x x ) =r sy sx
= y+r
sy sx
(y y) = 2 sy s = x + r x (y y) sy
s xy
(y y) xx =r sx sy
s sr2 = y j r y (xi x ) + y f ij = s i =1 j =1 x
n m
s ( y j y ) r y ( xi x ) f ij = sx i =1 j =1
n m
2 sy sy 2 ( y j y ) 2r ( y j y )( xi x ) + r 2 2 ( xi x )2 f ij = = sx sx i =1 j =1 n m
= s 2r
2 y
sy sx
s xy + r
s2 y s
2 x
2 sx =
donde
s xy = r s x s y
2 2 2 = s y 2r 2 s y + r 2 s y =
2 2 2 = sy r 2sy = sy 1 r 2
2 0 sr2 s y
sr2 r = 1 2 sy
2
r2 1
1 r 1
sr2 r = 1 2 sy
2
r 1
2
y 1 r 1
r = b b =
r >0
y
r<0
y
r = 1
x
2 2 b. Si r = 0 sr = s y hay incorrelacin
r =0
y
5. Interpretacin cuantitativa de r: r2 nos indica el porcentaje (100 r2 ), en que hemos mejorado nuestra prediccin de y con la introduccin de la recta de regresin, comparada con aquella situacin donde no se supona ninguna relacin lineal entre las variables, es decir, cuando utilizbamos la media en lugar de la recta de regresin.
s xy s2 y
2 sx = sx s y r
sx s y r r 2 21 2 2 = sx s y = sx s y 1 r 2 2 sy r 1
)]
f ij
(b0 , b1 ,K , b p ) bk
)]
k =0 k =1 k=p
b0 + b1a10 + b2 a20 + L + b p a p 0 = a01 b0 a10 + b1a20 + b2 a30 + L + b p a p +1, 0 = a11 ......................................................... b0 a p , 0 + b1a p +1, 0 + b2 a p + 2, 0 + L + bp a2 p , 0 = a p1
p+1 ecuaciones
)]
f ij =
i =1 j =1 n m
)][
)]
)]
2 0 s r2 s y
3. Para cualquier otro valor0 < rp2 < 1 mayor o menor grado de correlacin parablica
2 4. Interpretacin cuantitativa de rp : nos indica el porcentaje en que hemos mejorado nuestra prediccin de y con la introduccin de la regresin parablica. rp2 = 1
f ( x1 / x 2 , x3 ) x1 ( x 2 , x3 )
s12(2,3 ) = s r2
s12
2 1 ( 2 ,3 )
s13
l11
l12
r12 1 r32
r13 r23 1
L = s21
s31
R = r21
r31
r12 1 r32
L=R=
0
b. Si rango L= 1 ( rango R = 1) todos los puntos del diagrama de dispersin se hallan sobre una recta singular c. Si rango L= 3 L 0 R 0 plano ni en una recta. x1 la distribucin no se encuentra en un x1
x2 x3 x3
x2
Regresin lineal mnimo cuadrtica de x1 sobre x2 y x3: el plano de regresin m.c. de x1 sobre x2 y x3 ser aquel que cumpla
1 = min n
1 = min n
(b12 , b13 ) 1 = 2 [( x1i x1 ) b12 ( x2i x2 ) b13 ( x3i x3 )]( x3i x3 ) = 0 b13 n i
Haciendo operaciones: b12l22 + b13l23 = l21 b12l32 + b13l33 = l31 l11 l12 L = l21 l22 l31 l32 l13 l23 l33 l22 l21 l23 l l l L12 ; b13 = 32 b12 = 31 33 = l22 l22 l23 L11 l32 l32 l33 l11 l12 L = l21 l22 l31 l32 l13 l23 l33 l22 L11 = l32 l23 l33 l21 l 21 l31 l = 31 l23 l22 l33 l32 l13 l23 l33 L13 = l22 l32 l23 l33 = L13 L11
l21 l23 L12 = l31 l33 l11 l12 L = l21 l22 l31 l32
1 = n
= [( x1i x1 ) b12 ( x2i x2 ) b13 ( x3i x3 )][( x1i x1 ) b12 ( x2i x2 ) b13 ( x3i x3 )]
i
1 n
0 sr2 s12
2 1 (2 3 )
(R = R11 r12= r13= 0) 3. Si 0 < r12(2 3 ) < 1 cierto grado de correlacin 4. Interpretacin cuantitativa de r122 3) : nos indica el porcentaje en que ( hemos mejorado nuestra prediccin de x1 con la introduccin de las variables x2 y x3 .
x1
x3
Se calcula como media geomtrica de los coeficientes de regresin lineal mltiple de las correspondientes variables: De x1 sobre x2 y x3: De x2 sobre x1 y x3: x1 = b10 + b12 x2 + b13 x3 x2 = b20 + b21 x1 + b23 x3 b12 = b21 = L12 L11 L21 L22
L12 R12 L L = r122, 3 = b12 b21 = 12 21 = L L L11 L22 R11 R22 11 22 El signo es el mismo que el del coeficiente de regresin.