Professional Documents
Culture Documents
II - 2018
Y Y
X X
Y Y
X X
Tipos de relaciones entre dos
variables DROVA
Y Y
X X
Y Y
X X
Tipos de relaciones entre dos
variables DROVA
Sin relación
X
Introducción al análisis de
regresión
DROVA
• El análisis de regresión se usa para:
• Conocer el grado en que (al menos) una variable
(independiente) explica a otra (dependiente), a lo que llamamos
como un efecto de causalidad:
• Predecir el valor de una variable dependiente, basándonos en
los valores de por lo menos una variable independiente.
• Conocer el efecto de cambios en una variable independiente
sobre la variable dependiente.
140
500
120
400
100
300 80
60
200
40
100
20
0 0
1981M01
1982M01
1983M01
1984M01
1985M01
1986M01
1987M01
1988M01
1989M01
1990M01
1991M01
1992M01
1993M01
1994M01
1995M01
1996M01
1997M01
1998M01
1999M01
2000M01
2001M01
2002M01
2003M01
2004M01
2005M01
2006M01
2007M01
2008M01
Crude Oil price index, 1997=100, left axis Regular gasoline prices, regina, cents per litre, right axis
(Edad) x4
Efecto marginal
de X, pendiente Término
Intercepto Variable de error
(poblacional) (poblacional)
Variable independiente aleatorio
dependiente
Yi β0 β1Xi ε i
Componente lineal Error aleatorio
Modelo de regresión lineal simple
DROVA
Y Yi β0 β1Xi ε i
Valor observado Yi
de Y dado Xi
εi Pendiente = β1
Predicción de Y
dado Xi
𝑌 i Error aleatorio para
este valor de Xi
Intercepto = β0
Xi X
Ecuación de regresión lineal
simple (línea de predicción) DROVA
Esta ecuación provee un estimado de la línea
regresión poblacional.
Valor Estimado de la
estimado de Estimado del pendiente/efecto
Y para la intercepto marginal
observación i.
Valor de X
Ŷi b0 b1Xi
para la
observación i
El método de mínimos cuadrados
DROVA
Educación (X)
Interpretación del intercepto y la
pendiente (estimados) DROVA
Efecto marginal
de X, pendiente Término
Intercepto Variable de error
(poblacional) (poblacional)
Variable independiente aleatorio
dependiente
𝑝𝑟𝑖𝑐𝑒 = 𝛽0 + 𝛽1 𝑆𝑞𝑢𝑎𝑟𝑒𝑓𝑒𝑒𝑡 + 𝑒
donde,
• 𝑆𝑆𝑋𝑌 = σ𝑛𝑖=1(𝑋𝑖 − 𝑋)(𝑌
ത 𝑖 − 𝑌),
ത y
• 𝑆𝑆𝑋 = σ𝑛𝑖=1(𝑋𝑖 − 𝑋)
ത 2
Ejemplo: Estimación
DROVA
• Luego estimamos b0 :
• 𝛽0 = 𝑌ത − 𝛽1 𝑋ത
Ejemplo: predicción
DROVA
Prediciendo el precio de una
casa de 2,000 pies cuadrados:
Rango de valores
observados
Mejor no intentar
extrapolar fuera
del rango
Estimación
DROVA
−𝟏
𝜷 = 𝑿´𝑿 𝑿´𝒀
DROVA
X
r2 =1
Ejemplos
DROVA
Y
0 < r2 < 1
X
Ejemplos
DROVA
r2 = 0
Y
No hay relación lineal entre
X y Y.
El valor de Y no depende
X de X. (Nada de la variación
r2 = 0
en Y se explica por
variación en X.)
Coeficiente de determinación, r2
Estimación:
𝑆𝑆𝑅 𝑅𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠 DROVA
2
𝑅 = =
𝑆𝑆𝑇 𝑇𝑜𝑡𝑎𝑙 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠
Y
Yi Yˆ
SSE
Pendiente = β1
SST 𝑌 i
SSR
𝑌ത
Intercepto = β0
Xi X
Coeficiente de determinación, r2
Estimación:
𝑆𝑆𝑅 𝑅𝑒𝑔𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠
𝑅2 = =
𝑆𝑆𝑇 𝑇𝑜𝑡𝑎𝑙 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠 DROVA
𝑆𝑆𝐸 𝐸𝑟𝑟𝑜𝑟 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠
𝑅2 = 1 − =1−
𝑆𝑆𝑇 𝑇𝑜𝑡𝑎𝑙 𝑠𝑢𝑚 𝑜𝑓 𝑠𝑞𝑢𝑎𝑟𝑒𝑠
Donde, 𝑛
ത 2
𝑆𝑆𝑇 = (𝑌𝑖 − 𝑌)
𝑖=1
𝑛
𝑆𝑆𝑅 = (𝑌𝑖 − 𝑌)
ത 2
𝑖=1
𝑛
• Linealidad:
• La relación entre X y Y es lineal.
• Exogeneidad estricta:
• E(error | X) = 0
-> No se cumple si hay variables omitidas que
“interactúan” con X o X influye sobre Y pero Y
también influye sobre X.
Supuestos: análisis de residuos
DROVA
ei Yi Ŷi
x x
residuos
residuos
x x
No lineal
Lineal
Análisis de residuos:
homocedasticidad
DROVA
Y Y
x x
residuos
residuos
x x
Hay independencia
X
residuals
X
residuals
X
Análisis en Excel: linealidad
DROVA
Supuesto de homocedasticidad e
independencia apropiado
¿Qué hacer si no se cumplen los supuestos?
• Si la relación entre ambas variables no es lineal, se puede especificar un
modelo de regresión no lineal.
-> Si corremos una regresión lineal,
estaríamos estimando un efecto marginal de X
sobre Y incorrecto/de forma sesgada.
De Excel: H1: β1 ≠ 0
Standard
Coefficients Error t Stat P-value
Intercept (bo) 82.916 14.528 5.707 0.00000459
Square Feet (b1) 0.102 0.00807 12.645 0.00000000000742
b1 β1 0.102 0
t STAT 12.645
Sb1 0.0081
Ejemplo: inferencia sobre la
pendiente
H0: β1 = 0 DROVA
De Excel: H1: β1 ≠ 0
Standard
Coefficients Error t Stat P-value
Intercept 82.916 14.528 5.707 0.00000459
Square Feet 0.102 0.00807 12.645 0.00000000000742
𝑉𝑎𝑟(𝛽0 ) 𝐶𝑜𝑣(𝛽0 , 𝛽1 )
- 𝑉𝑎𝑟 𝛽መ = 𝜎𝑒2 (𝑋´𝑋)−1 =
𝐶𝑜𝑣(𝛽1 , 𝛽0 ) 𝑉𝑎𝑟(𝛽1 )
Ejemplo: inferencia sobre la
pendiente
DROVA
¿Cómo calcular el error estándar de los coeficientes? (Continuación)
𝑉𝑎𝑟(𝛽0 ) 𝐶𝑜𝑣(𝛽0 , 𝛽1 )
- 𝑉𝑎𝑟 𝛽መ = 𝜎𝑒2 (𝑋´𝑋)−1 =
𝐶𝑜𝑣(𝛽1 , 𝛽0 ) 𝑉𝑎𝑟(𝛽1 )
Entonces,
De Excel: H1: β1 ≠ 0
Standard
Coefficients Error t Stat P-value
Intercept (bo) 82.916 14.528 5.707 0.00000459
Square Feet (b1) 0.102 0.00807 12.645 0.00000000000742
b1 β1 0.102 0
t STAT 12.645
Sb1 0.0081
Ejemplo: inferencia sobre la
pendiente
DROVA
H0: β1 = 0
tSTAT = 12.645 H1: β1 ≠ 0
d.f. = 10- 2 = 8
a/2=.025 a/2=.025
Decisión: Rechazar H0.
Standard
Coefficients Error t Stat P-value
Intercept 82.916 14.528 5.707 0.00000459
Square Feet 0.102 0.00807 12.645 0.00000000000742
p-value
Decisión: Rechazar H0, ya que p-value < α.