Professional Documents
Culture Documents
para Profesionales
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Consideramos el modelo de regresin
lineal general
= 0 + 1 1 + 2 2 + + +
Error no se observa.
,0 = ,1
Notemos que si = , esta formula coincide con el
estimador MCO
Si los supuestos VI.1 y VI.2 se cumplen
El estimador de VI es consistente.
El estimador de VI es asintticamente normal.
u
2
2
i i 0 x
1 i
2 i 1
i 1
nk nk
Adems
2
1 =
2 ,
Ejemplo usando la data MROZ del libro
log = 0 + 1 +
Objeto: estimar el rendimiento de un ao de educacin
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .1086487 .0143998 7.55 0.000 .0803451 .1369523
_cons | -.1851968 .1852259 -1.00 0.318 -.5492673 .1788736
------------------------------------------------------------------------------
Usamos la educacin del padre como instrumento. Cumple
el supuesto VI.2?
------------------------------------------------------------------------------
educ | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
fatheduc | .2694416 .0285863 9.43 0.000 .2132538 .3256295
_cons | 10.23705 .2759363 37.10 0.000 9.694685 10.77942
------------------------------------------------------------------------------
. predict educ_hat
(option xb assumed; fitted values)
Ejemplo usando la data MROZ del libro
. ivreg lwage (educ=fathe)
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0591735 .0351418 1.68 0.093 -.0098994 .1282463
_cons | .4411034 .4461018 0.99 0.323 -.4357312 1.317938
------------------------------------------------------------------------------
Instrumented: educ
Instruments: fatheduc
------------------------------------------------------------------------------
Es consistente este hallazgo con nuestra teora
econmica?
Si, esperabamos que el estimador MCO tuviera un sesgo
positivo.
,1 = 0.108
,1 = 0.059
Si no se cumplen los supuestos VI.1 y VI.2 el
estimador VI no ser consistente.
log = 0 + 1 +
------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | -.0898131 .0169786 -5.29 0.000 -.1231197 -.0565065
_cons | 4.769404 .0053694 888.26 0.000 4.758871 4.779937
------------------------------------------------------------------------------
------------------------------------------------------------------------------
packs | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cigprice | .0002829 .000783 0.36 0.718 -.0012531 .0018188
_cons | .0674257 .1025384 0.66 0.511 -.1337215 .2685728
------------------------------------------------------------------------------
------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | 2.988676 8.698888 0.34 0.731 -14.07573 20.05309
_cons | 4.448136 .9081552 4.90 0.000 2.666629 6.229644
------------------------------------------------------------------------------
Instrumented: packs
Instruments: cigprice
------------------------------------------------------------------------------
28
El modelo podra ser log = 0 + 1 + 1 + ,
donde suponemos que = 1 y = 1 .
La variable educ est correlacionada con el trmino de
error, por la omisin de habilidad y otras variables que
determinan salario y educacin al mismo tiempo.
Volvamos a notar nuevamente que an cuando el
regresor endgeno sea educ, todos los estimadores
MCO sern inconsistentes.
Necesitamos un instrumento 2 , que debe estar
correlacionado con el regresor endgeno. Nuevamente
debemos evaluar este supuesto estimando el modelo
auxiliar (llamado primera etapa).
1 = 0 + 1 1 + 2 2 +
29
Tenemos que evaluar si 2 = 0, para comprobar
que an luego de controlar por 1 el instrumento
est correlacionado con 1 .
La variable 2 aporta informacin a la determinacin de 1 .
Este instrumento no puede ser una variable explicativa del
modelo.
El instrumento 2 debe cumplir con los supuestos.
VI.1. 2 no puede estar correlacionado con 1
(como 1 es variable explicativa, obvio que tampoco
puede estarlo)
VI.2. 2 debe estar correlacionado con el regresor
endgeno.
30
Podemos tener ms de un instrumento y ms de
una variable endgena en la ecuacin.
MC2E es una generalizacin del estimador de VI en
estos contextos.
Si tenemos un solo instrumento MC2E es el
estimador de variables instrumentales (coinciden
plenamente).
Si tenemos ms de un instrumento, el estimador
de MC2E es un estimador de variables
instrumentales donde el instrumento usado es
1 = 0 + 1 1 + 2 2 .
31
La mecnica de cmo obtener el estimador es sencilla.
1. Limpiamos a 1 de la influencia de todo lo relacionado con
el trmino de error Esto se hace, corriendo el modelo
1 = 0 + 1 1 + 2 2 + y obteniendo 1 = 0 + 1 1 +
2 2 . Esta parte de 1 no est correlacionada con el
trmino de error si 2 es exgena. Se llama primera etapa.
2. Luego estimamos por MCO el modelo = 0 + 1 1 +
2 1 + 1 , esto es reemplazamos la variable endgena por
su contraparte exgena 1 , que captura slo la variacin
de la variable original que es explicada por 1 y 2 .
Por esto se le llama al mtodo MC2E. Si hay un solo
instrumento, MC2E es el estimador de VI.
El comando ivregres 2sls hace esto esencialmente,
tambin les calcula los errores estndares (con varias
opciones).
32
Notemos que si tenemos ms de un instrumento o
ms de una variable endgena, el mtodo sirve
igual, los pasos se resumen a
1. Primera etapa: variables endgenas sobre todas
las variables exgenas del sistema (las incluidas
en la ecuacin y las excludas).
2. Segunda etapa: variables endgenas se
reemplazan con sus predicciones de la primer
etapa.
Importante: necesitamos al menos tantos
instrumentos como variables endgenas tenemos
en la ecuacin.
33
MC2E
Necesitamos al menos un instrumento por cada variable
endgena explicativa.
Deben cumplir ambos con los dos supuestos de VI.
34
MC2E
La condicin de que haya al menos una variable exgena
externa por cada variable endgena se denomina
condicin de orden.
Es necesaria y no suficiente.
La condicin suficiente para identificacin se plantea en
trminos de matrices, pero intuitivamente tiene que ver
con el hecho de que tiene que haber suficiente poder
explicativo por separado para cada instrumento (que los
instrumentos no sean redundantes)
35
Algunas observaciones
Presentacin de resultados es similar a la de MCO.
Stata ofrece este procedimiento sin necesidad de hacer
dos etapas.
Si hacemos esto a mano (primera etapa y segunda etapa)
los errores estndares que obtenemos no son los
correctos.
R2 no es relevante en VI o MC2E, nada garantiza que est
entre cero y uno.
Problemas de multicolinealidad pueden ser problemticos
Si las variables exgenas estn altamente correlacionadas, los
errores estndares de MC2E pueden ser muy altos.
36
. reg lwage educ exper
37
. ivregress 2sls lwage (educ=fatheduc motheduc) exper, robust
Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]
Instrumented: educ
Instruments: exper fatheduc motheduc
38
. reg educ exper motheduc fatheduc
39
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
Noten que
Si tenemos variables explicativas endgenas, el
estimador MCO es inconsistente, pero el
estimador de VI es consistente.
Si no hay variables explicativas endgenas, ambos
estimadores, MCO y VI, son consistentes, pero el
estimador de MCO es de mnima varianza.
Bajo la hiptesis nula (no hay variables exgenas) no
deberamos encontrar diferencias sistemticas entre los
estimadores MCO y de VI.
Parece natural disear un test en base a esta observacin
H0: Todas las variables explicativas son exgenas
H1: alguna variable X es endgena
Test de Hausman
Se basa en comparar si hay diferencias
sistemticas entre el estimador MCO y el
estimador de VI.
Si son muy distintos => problemas con
MCO.
Cmo se implementa...
Si el modelo estructural es = 0 + 1 1 + 2 1 +
1 , en la primer etapa uno estima
1 = 0 + 1 1 + 2 2 +1
Y si 1 y 2 son efectivamente exgenas, entonces
1 no puede estar correlacionada con 1 .
Esto significa que la endogeneidad de 1 proviene
de que 1 est correlacionada con 1 .
Escribimos entonces 1 = 1 1 + , y entonces 1
no estar correlacionada con 1 slo si 1 = 0.
Sustitumos en el modelo original
= 0 + 1 1 + 2 1 + 1
= 0 + 1 1 + 2 1 + 1 1 +
1 no es observable, pero podemos estimarla de la
primer etapa para 1 = 0 + 1 1 + 2 2 +1 .
Entonces, estimamos el modelo
= 0 + 1 1 + 2 1 + 1 1 +
Y evaluamos 0 : 1 = 0, 1 : 1 0.
Bajo 0 , 1 es exgena. Bajo 1 , 1 es endgena.
Si sospechamos de heteroscedasticidad, el contraste puede
hacerse robusto.
Modelo estructural log = 0 + 1 + 1 + .
Instrumento para educ, educacin de madre y padre
Primera etapa
. reg educ exper motheduc fatheduc
Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]
Instrumented: educ
Instruments: exper fatheduc motheduc
Bedard y Deschenes (JHR, 2005) utilizan del Censo de
1980 en USA para estimar el efecto del divorcio sobre
la situacin econmica de la mujer. La muestra est
compuesta por mujeres blancas, nacidas en USA, entre
21 y 40 aos de edad, casadas por lo menos una vez y
con al menos un hijo.
Modelo = 0 + 1 + +
Variable dependiente: , varios outcomes; ingreso del hogar,
ingreso de la mujer, pobreza, horas de trabajo, etc.
Variable de inters: , dicotmica igual a 1 si hubo divorcio,
cero en cualquier otro caso.
, otros controles, como edad, edad, al momento de casarse,
edad al momento de tener el primer hijo, nivel educativo,
estado de, residencia y estado de nacimiento.
48
Por qu D es potencialmente endgena?
El divorcio es ms comn en grupos menos educados y
con mayor desventaja social-econmica
Mujeres, que ante una relacin desfavorable, se separan
pueden diferir de las que no se separan en diversos no-
observables.
Qu instrumento se propone?
Sexo del primer nio nacido en el matrimonio. Divorcios
ms frecuentes luego que nacen nias que cuando nacen
nios
49
(1) (2) (3) (4) (5) (6) (7)
VARIABLES std_hhinc poor inc_non inc_woman WORKED Weeks worked Hours
YR last year worked
last week
50
(1) (2) (3) (4) (5) (6) (7)
VARIABLES Ingreso Pobre Ingreso Hogar Ingreso Trabaj el Semanas Horas
Familiar pc no aportado Mujer ao pasado trabajadas el trabajadas
por Mujer ao pasado la semana
pasada
51
Primera etapa
(1)
VARIABLES end_marr
isGirl 0.0075***
(0.001)
Observations 576,664
R-squared 0.054
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
52
Card y Krueger (1993) utilizan la proximidad
geogrfica a una universidad en USA para estimar
los retornos a la educacin.
El modelo
53
Primera etapa, probamos ambos instrumentos,
juntos y por separado.
(1) (2) (3)
years of schooling years of schooling years of schooling
VARIABLES 1976 1976 1976
54
Estimador de variables instrumentales
55
Charter schools en USA, son similares a nuestros
colegios municipales de administracin delegadas
Financiamiento pblico
Mayores grados de libertad
Datos de una escuela de Massachusetts (Angrist et
al., 2010).
Sobre-inscripcin: aleatorizacin
Quien asiste o no no es aleatorio, pero est altamente
correlacionado con la lotera o aleatorizacin.
56
Modelo:
= 0 + 1 + +
X: diversos controles
D: Asiste o no a charter schoo
First stage
= 0 + 1 + +
L: si gana la lotera o no
Forma Reducida:
= 0 + 1 + +
57
Modelo:
Columna (1):
Efectos heterogneos por etnia
Efectos similares por etnia
Columna (2):
Efectos heterogneos por score
en lnea base.
Programa beneficia a los nios
con desempeo ms bajo en la
LB.
58
Ingeniera Comercial