Professional Documents
Culture Documents
Ricardo Aravena C.
Ricardo Olea O.
Departamento de Estadstica
Pontificia Universidad Cat
olica de Chile
Probabilidad y Estadstica
2015 - I
1 / 30
Contenido I
1
El Modelo de Regresion M
ultiple
Especificacion del Modelo
Desarrollo del Modelo
Graficos Tridimensionales
Estimaci
on de Coeficientes
Metodos de Mnimos Cuadrados
Prediccion
Aravena - Olea (PUC)
Probabilidad y Estadstica
2015 - I
2 / 30
El Modelo de Regresi
on M
ultiple
Especificaci
on del Modelo
Probabilidad y Estadstica
2015 - I
3 / 30
El Modelo de Regresi
on M
ultiple
Especificaci
on del Modelo
Probabilidad y Estadstica
2015 - I
4 / 30
El Modelo de Regresi
on M
ultiple
El modelo de regresion m
ultiple define la relaci
on entre una variable
dependiente o endogena, Y , y un conjunto de variables independientes o
ex
ogenas, xj , donde j = 1, . . . , K. Se supone que las xj i son n
umeros
fijos; Y es una variable aleatoria definida para cada observacion, i, donde
i = 1, . . . , n, y n es el n
umero de observaciones.
El modelo se define de la forma siguiente:
yi = 0 + 1 xi 1 + 2 xi 2 + + K xi K + i
donde las j son coeficientes constantes y las son variables aleatorias de
media 0 y varianza 2 .
Probabilidad y Estadstica
2015 - I
5 / 30
El Modelo de Regresi
on M
ultiple
Gr
aficos Tridimensionales
Probabilidad y Estadstica
2015 - I
6 / 30
El Modelo de Regresi
on M
ultiple
Gr
aficos Tridimensionales
Ingresos
3.92
3.61
3.32
3.07
3.06
3.11
3.21
3.26
3.42
3.42
3.45
3.58
3.66
Beneficio
0.75
0.71
0.66
0.61
0.70
0.72
0.77
0.74
0.90
0.82
0.75
0.77
0.78
A
no
14
15
16
17
18
19
20
21
22
23
24
25
Ingresos
3.78
3.82
3.97
4.07
4.25
4.41
4.49
4.70
4.58
4.69
4.71
4.78
Probabilidad y Estadstica
Oficinas
6672
6890
7115
7327
7546
7931
8097
8468
8717
8991
9179
9318
Beneficio
0.84
0.79
0.70
0.68
0.72
0.55
0.63
0.56
0.41
0.51
0.47
0.32
2015 - I
7 / 30
Estimaci
on de Coeficientes
Estimacion de Coeficientes
El modelo de regresion poblacional m
ultiple es
yi = 0 + 1 xi 1 + 2 xi 2 + + K xi K + i
y suponemos que se dispone de n conjuntos de observaciones. Se postulan
los siguientes supuestos habituales para el modelo.
Las xi j son o bien n
umeros fijos, o bien realizaciones de variables
aleatorias, Xj , que son independientes de los terminos del error, . En
el segundo caso, la inferencia se realiza condicionada a los valores
observados de las xi j .
El valor esperado de la variable aleatoria Y es una funcion lineal de
las variables independientes Xs.
Probabilidad y Estadstica
2015 - I
8 / 30
Estimaci
on de Coeficientes
Estimacion de Coeficientes
Los terminos de error son variables aleatorias cuya media es cero y
que tienen la misma varianza, 2 . Este u
ltimo supuesto se denomina
homocedasticidad o varianza uniforme.
E(i ) = 0
E(2i ) = 2 ,
para i = 1, . . . , n.
Los terminos de error aleatorio, i , no estan correlacionados entre s,
por lo que
E(i j ) = 0 i =
6 j
No es posible hallar un conjunto de n
umeros que no sean iguales a
cero, c0 , c1 ,. . . , cK , tal que
c0 + c1 xi 1 + + cK xi K = 0
Esta es la propiedad de la ausencia de relaci
on lineal entre las Xj .
Aravena - Olea (PUC)
Probabilidad y Estadstica
2015 - I
9 / 30
Estimaci
on de Coeficientes
M
etodos de Mnimos Cuadrados
Estimacion de Coeficientes
Metodos de Mnimos Cuadrados
n
X
(yi b0 b1 xi 1 b2 xi 2 bK xi K )2
i=1
es la menor posible.
Aravena - Olea (PUC)
Probabilidad y Estadstica
2015 - I
10 / 30
Estimaci
on de Coeficientes
M
etodos de Mnimos Cuadrados
Estimacion de Coeficientes
Metodos de Mnimos Cuadrados
La ecuacion resultante
yi = b0 + b1 xi 1 + b2 xi 2 + + bK xi K
es la regresion m
ultiple de Y sobre X1 , X2 ,. . . ,XK .
Probabilidad y Estadstica
2015 - I
11 / 30
Estimaci
on de Coeficientes
M
etodos de Mnimos Cuadrados
Estimacion de Coeficientes
Metodos de Mnimos Cuadrados
b1 =
b0 = y b1 x 1 b2 x 2
Probabilidad y Estadstica
2015 - I
12 / 30
Descomposici
on Suma de Cuadrados
Comenzamos con el modelo de regresi
on m
ultiple ajustado mediante
mnimos cuadrados
yi = b0 + b1 xi 1 + b2 xi 2 + + bK xi K + ei = yi + ei
donde las bj son las estimaciones por mnimos cuadrados de los
coeficientes del modelo de regresi
on poblacional y las e son los residuos del
modelos de regresion estimado.
Probabilidad y Estadstica
2015 - I
13 / 30
Descomposici
on Suma de Cuadrados
La variabilidad del modelo puede dividirse en los componentes
SCT = SCR + SCE
las que se definen de la siguiente manera
STC =
n
X
(yi y)2
i=1
n
X
i=1
(
yi y) +
n
X
(yi yi )2
i=1
Probabilidad y Estadstica
2015 - I
14 / 30
Descomposici
on Suma de Cuadrados
Esta descomposicion puede interpretarse como
Variabilidad Muestral Total = Variabilidad Explicada + Variabilidad No Explicada
El coeficiente de determinaci
on, R2 , de la regresi
on ajustada es la
proporcion de la variabilidad muestral total explicada por la regresion
R2 =
SCE
SCR
=1
SCT
SCT
y se deduce que
0 R2 1
Probabilidad y Estadstica
2015 - I
15 / 30
donde K es el n
umero de variables independientes en el modelo de
regresion. La raz cuadrada de la varianza, se , tambien se llama error
tpico de la estimaci
on.
Aravena - Olea (PUC)
Probabilidad y Estadstica
2015 - I
16 / 30
Coeficiente de Determinaci
on Ajustado
2
El coeficiente de determinaci
on ajustado, R , se define de la forma
siguiente:
SCE/(n K 1)
2
R =1
SCT/(n 1)
Utilizamos esta medida para tener en cuenta el hecho de que las variables
independientes irrelevantes provocan una peque
na reduccion de la suma de
los cuadrados de los errores.
2
Probabilidad y Estadstica
2015 - I
17 / 30
Coeficiente de Correlaci
on Multiple
El coeficiente de correlacion m
ultiple es la correlaci
on entre el valor
predicho y el valor observado de la variable dependiente.
R = r(
y , y) = R2
y es igual a la raz cuadrada del coeficiente m
ultiple de determinacion.
Utilizamos R como otra medida de la fuerza de la relacion entre variable
dependiente y las variables independientes.
Por lo tanto, es comparable a la correlaci
on entre Y y X en la regresion
simple.
Probabilidad y Estadstica
2015 - I
18 / 30
Probabilidad y Estadstica
2015 - I
19 / 30
Salida Excel
Probabilidad y Estadstica
2015 - I
20 / 30
bj j
,
sbj
j = 1, 2, . . . , K
Probabilidad y Estadstica
2015 - I
21 / 30
Intervalos de Confianza
Probabilidad y Estadstica
2015 - I
22 / 30
Contraste de Hip
otesis
H0 : j j
bj j
> t1 (n k 1)
s bj
Probabilidad y Estadstica
2015 - I
23 / 30
Contraste de Hip
otesis
H0 : j j
bj j
< t (n k 1)
sbj
Probabilidad y Estadstica
2015 - I
24 / 30
Contraste de Hip
otesis
Probabilidad y Estadstica
2015 - I
25 / 30
Probabilidad y Estadstica
2015 - I
26 / 30
CMR
> F1 (K, n K 1)
s2e
Probabilidad y Estadstica
2015 - I
27 / 30
Probabilidad y Estadstica
j = 1, . . . , r
2015 - I
28 / 30
Probabilidad y Estadstica
2015 - I
29 / 30
Predicci
on
Prediccion
Dado que se cumple el modelo de regresi
on poblacional
yi = 0 + 1 xi 1 + 2 xi 2 + + K xi K + i ,
i = 1, . . . , n
Probabilidad y Estadstica
2015 - I
30 / 30