Capitulo VI Endogeneidad en El MLG PDF

Ingeniera Comercial
para Profesionales
Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI
Estimacin por Mnimos Cuadrados en Dos
Etapas (MC2E)
Contrastes de endogeneidad
variables omitidas y error en las variables.
Etapas (MC2E)
Consideramos el modelo de regresin
lineal general
= 0 + 1 1 + 2 2 + + +
Cundo un regresor es endgeno

Decimos que un regresor es endgeno si ste est
correlacionado con el trmino de error, tal que
Cov , 0.
Ser entonces exgeno si Cov 1 , = 0.

El supuesto que aseguraba la exogeneidad de las
variables explicativas es el S4
Establece que la media condicionada del error en las variables
explicativas tiene que ser cero
E |1 , 2 , , = 0
Vale notar que esto slo se verifica si TODOS los regresores son
exgeneos.
Si al menos uno de ellos no lo es, el supuesto no se

cumple
Y ya vimos que las consecuencias del no cumplimiento
de este supuesto son serias: el estimador MCO no ser
consistente.
Por ahora nos focalizamos en dos causas de
endogeneidad.
Caso I: variables relevantes omitidas
Modelo verdadero
= 0 + 1 1 + 2 2 +
Pero estimamos el modelo que omite 2
= 0 + 1 1 +
Ya vimos que al menos que Cov 1 , 2 = 0, Cov 1 ,
0.
El supuesto S4 no se cumple en el modelo reducido y
entonces los estimadores MCO sern sesgados e
inconsistentes
Uno puede analizar el signo del sesgo
Caso II: error de medida en las variables
explicativas.
No se observa 1 sino que se observa una variable
medida con error (proxy)
1 = 1 + 1
Podemos notar que por definicin la variable 1 est
correlacionada con 1 .
1 cuyo efecto querramos estimar, pero 1 es la variable
que efectivamente observamos.
Dado este set-up, uno puede mostrar que la variable
medida con error est correlacionada con el error del
modelo.
variables omitidas, errores de medida.
Etapas (MC2E)
Vamos a ver la intuicin que est detrs de proponer el
estimador de Variables Instrumentales (VI)
Comencemos con el modelo de regresin simple
= 0 + 1 +
Ya vimos que el estimador MCO no es consistente si la
variable est correlacionada con el trmino de error.
Vamos a buscar otra variable que est fuera del
modelo, que llamaremos instrumento ( ), tal que se
cumplan los supuestos:
VI.1. no puede estar correlacionada con el trmino de
error: Cov , = 0.
VI.2. debe estar altamente correlacionada con el regresor
que sospechamos es endgeno: Cov , 0.
En el contexto de variables omitidas,
podemos esquematizar nuestro problema
como:
X causa Y, pero W tambin
W (variable omitida) est correlacionada
con X.
Z (instrumento), slo est correlacionada
con X. => cualquier influencia que pudiera
tener sobre Y es a travs de X.
Dos supuestos, uno slo de ellos
verificable.
X tiene que estar correlacionada con Z => verificable
Uno puede evaluar qu tan correlacionada estn X y Z usando
un modelo de regresin.
Z no puede estar correlacionada con Y, salvo a travs de X
Supuesto de Cov , = 0 NO ES CONTRASTABLE
Error no se observa.
Uno justifica la validez del instrumento usando su teora

econmica.
Cmo nos va a ayudar un instrumento a estimar
consistentemente el efecto de X sobre Y?
En MCO usamos la variacin en X para estimar el efecto de
X sobre Y.
Pero parte de la variacin en X se debe a W (y es la parte
que hace que X est correlacionada con el trmino de
error).
Idea: no usar slo la variacin en X que es explicada por
Z (determinstica) para inferir el efecto de X sobre Y.
Escribamos = 0 + 1 + . Si estimamos este modelo
por MCO, obtenemos = 0 + 1 . Si una buena parte de
es explicada por Z, yo tengo varianza en que es
exgena al error de la ecuacin original (siempre y
cuando Cov , = 0
Modelo de salarios log = 0 + 1 +
Notamos que el trmino de error incluye habilidad:
individuos toman decisiones sobre cunta educacin
tomar segn su nivel de habilidad.
Un instrumento: IQ, o alguna medida de CI no es un
buen instrumento ya que es una variable que debe
estar en la ecuacin de salarios.
Educacin del padre o madre?
Si, podra serlo si es que podemos sostener que estas
variables no afectan los salarios actuales de los hijos, sino
que afectaron las decisiones de educacin de ellos.
No es un buen instrumento si uno cree que la habilidad de la
madre/padre es transmisible (genes)
Mes de nacimiento del nio
No correlacionado con la habilidad del nio
Pero podra estar correlacionado con terminar o no el nivel
medio si los individuos que nacen antes alcanzan la edad
obligatoria antes de completar el nivel y como y
abandonan
Pero la correlacin puede ser baja
No es trivial encontrar instrumentos vlidos.
Sea el modelo = 0 + 1 + , veamos cmo es la
mecnica de usar los instrumentos para estimar
consistentemente los parmetros 0 y 1 .
Recordemos que establecimos que Cov , = 0, entonces
Cov , 0 1 = 0
Desarrollando,
Cov , ) Cov( , 0 ) 1 Cov( , = 0
Notamos que Cov( , 0 )=0, y despejando
,
1 =
,
Para que este estimador sea factible, necesitamos que
, 0.
Cmo operacionalizamos este estimador?
Reemplazamos los momentos poblacionales por los
muestrales.
Numerador: covarianza entre Z e Y.
Denominador: covarianza entre Z y Z.

=1( )( )
,1 =
=1( )( )
e igualmente obtenemos la ordenada al origen como
,0 = ,1
Notemos que si = , esta formula coincide con el
estimador MCO
Si los supuestos VI.1 y VI.2 se cumplen
El estimador de VI es consistente.
El estimador de VI es asintticamente normal.
Pero el estimador de VI nunca es insesgado.

Necesito muestras grandes, ya que no
necesariamente las propiedades del estimador
de VI van a ser buenas en muestras pequeas.
Toda la inferencia se hace asinttica
Se puede estimar su varianza asinttica bajo
homoscedasticidad o robusta a la heteroscedasticidad.
Los errores estndares de los estimadores de VI
son siempre ms grandes que los errores
estndares del estimador MCO (cuando este es
consistente).
Pero esta comparacin slo tiene sentido si , = 0.
Notar que,
Mientras ms correlacionada est x y z, menores sern los
errores estndares.
Cuando , es baja, VI es muy ineficiente.
Necesitamos un error estndar para el
estimador VI
El estimador de la varianza de la regresin
se obtiene como
y
n n
u
2
2
i i 0 x
1 i

2 i 1
i 1
nk nk
Adems
2
1 =
2 ,
Ejemplo usando la data MROZ del libro
log = 0 + 1 +
Objeto: estimar el rendimiento de un ao de educacin
. reg lwage educ
Source | SS df MS Number of obs = 428

-------------+------------------------------ F( 1, 426) = 56.93
Model | 26.3264193 1 26.3264193 Prob > F = 0.0000
Residual | 197.001022 426 .462443713 R-squared = 0.1179
-------------+------------------------------ Adj R-squared = 0.1158
Total | 223.327441 427 .523015084 Root MSE = .68003
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .1086487 .0143998 7.55 0.000 .0803451 .1369523
_cons | -.1851968 .1852259 -1.00 0.318 -.5492673 .1788736
------------------------------------------------------------------------------
Usamos la educacin del padre como instrumento. Cumple
el supuesto VI.2?
. reg educ fath if lwage!=.

-------------+------------------------------ F( 1, 426) = 88.84
Model | 384.841983 1 384.841983 Prob > F = 0.0000
Residual | 1845.35428 426 4.33181756 R-squared = 0.1726
-------------+------------------------------ Adj R-squared = 0.1706
Total | 2230.19626 427 5.22294206 Root MSE = 2.0813
------------------------------------------------------------------------------
educ | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
fatheduc | .2694416 .0285863 9.43 0.000 .2132538 .3256295
_cons | 10.23705 .2759363 37.10 0.000 9.694685 10.77942
------------------------------------------------------------------------------
. predict educ_hat
(option xb assumed; fitted values)
Ejemplo usando la data MROZ del libro
. ivreg lwage (educ=fathe)
Instrumental variables (2SLS) regression

-------------+------------------------------ F( 1, 426) = 2.84
Model | 20.8673606 1 20.8673606 Prob > F = 0.0929
-------------+------------------------------ Adj R-squared = 0.0913
Total | 223.327441 427 .523015084 Root MSE = .68939
------------------------------------------------------------------------------
lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
educ | .0591735 .0351418 1.68 0.093 -.0098994 .1282463
_cons | .4411034 .4461018 0.99 0.323 -.4357312 1.317938
------------------------------------------------------------------------------
Instrumented: educ
Instruments: fatheduc
------------------------------------------------------------------------------
Es consistente este hallazgo con nuestra teora
econmica?
Si, esperabamos que el estimador MCO tuviera un sesgo
positivo.
,1 = 0.108
,1 = 0.059
Si no se cumplen los supuestos VI.1 y VI.2 el
estimador VI no ser consistente.
log = 0 + 1 +
. reg lbwght packs

-------------+------------------------------ F( 1, 1386) = 27.98
Model | .997781141 1 .997781141 Prob > F = 0.0000
-------------+------------------------------ Adj R-squared = 0.0191
Total | 50.4203336 1387 .036352079 Root MSE = .18883
------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | -.0898131 .0169786 -5.29 0.000 -.1231197 -.0565065
_cons | 4.769404 .0053694 888.26 0.000 4.758871 4.779937
------------------------------------------------------------------------------
Problema: hay un montn de no-observables que estn correlacionados con

el consumo de cigarrillos
Podra ser el precio de los cigarrillos un buen instrumento? Veamos
Primera etapa
. reg packs cigprice

-------------+------------------------------ F( 1, 1386) = 0.13
Model | .011648626 1 .011648626 Prob > F = 0.7179
-------------+------------------------------ Adj R-squared = -0.0006
Total | 123.696129 1387 .089182501 Root MSE = .29873
------------------------------------------------------------------------------
packs | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
cigprice | .0002829 .000783 0.36 0.718 -.0012531 .0018188
_cons | .0674257 .1025384 0.66 0.511 -.1337215 .2685728
------------------------------------------------------------------------------
No se encuentra una alta correlacin entre el consumo de cigarrillos y

su precio. El precio del cigarrillo parece ser un mal instrumento, qu
sucede si lo usamos de todas maneras?
El estimador VI con un instrumento dbil
. ivreg lbwght (packs= cigprice)
Instrumental variables (2SLS) regression

-------------+------------------------------ F( 1, 1386) = 0.12
Model | -1171.28207 1 -1171.28207 Prob > F = 0.7312
Residual | 1221.70241 1386 .881459168 R-squared = .
-------------+------------------------------ Adj R-squared = .
Total | 50.4203336 1387 .036352079 Root MSE = .93886
------------------------------------------------------------------------------
lbwght | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
packs | 2.988676 8.698888 0.34 0.731 -14.07573 20.05309
_cons | 4.448136 .9081552 4.90 0.000 2.666629 6.229644
------------------------------------------------------------------------------
Instrumented: packs
Instruments: cigprice
------------------------------------------------------------------------------
R-cuadrado es negativo por eso no se presenta; no hay

significancia de los coeficientes
Nota: de todas maneras el R-cuadrado en este contexto pierde la
interpretacin usual, ya que SCT puede ser menor que SCE
Etapas (MC2E)
Cuando estamos en el modelo de regresin mltiple,
podemos tener varias variables endgenas y varias
variables exgenas como explicativas.
Podemos escribir el modelo como
= 0 + 1 1 + 2 1 + 1
A esta ecuacin la denominamos forma estructural.
Noten que estoy usando una notacin para referirme a
las variables explicativas
Exgenas: 1
Endgenas: 1
28
El modelo podra ser log = 0 + 1 + 1 + ,
donde suponemos que = 1 y = 1 .
La variable educ est correlacionada con el trmino de
error, por la omisin de habilidad y otras variables que
determinan salario y educacin al mismo tiempo.
Volvamos a notar nuevamente que an cuando el
regresor endgeno sea educ, todos los estimadores
MCO sern inconsistentes.
Necesitamos un instrumento 2 , que debe estar
correlacionado con el regresor endgeno. Nuevamente
debemos evaluar este supuesto estimando el modelo
auxiliar (llamado primera etapa).
1 = 0 + 1 1 + 2 2 +
29
Tenemos que evaluar si 2 = 0, para comprobar
que an luego de controlar por 1 el instrumento
est correlacionado con 1 .
La variable 2 aporta informacin a la determinacin de 1 .
Este instrumento no puede ser una variable explicativa del
modelo.
El instrumento 2 debe cumplir con los supuestos.
VI.1. 2 no puede estar correlacionado con 1
(como 1 es variable explicativa, obvio que tampoco
puede estarlo)
VI.2. 2 debe estar correlacionado con el regresor
endgeno.
30
Podemos tener ms de un instrumento y ms de
una variable endgena en la ecuacin.
MC2E es una generalizacin del estimador de VI en
estos contextos.
Si tenemos un solo instrumento MC2E es el
estimador de variables instrumentales (coinciden
plenamente).
Si tenemos ms de un instrumento, el estimador
de MC2E es un estimador de variables
instrumentales donde el instrumento usado es
1 = 0 + 1 1 + 2 2 .
31
La mecnica de cmo obtener el estimador es sencilla.
1. Limpiamos a 1 de la influencia de todo lo relacionado con
el trmino de error Esto se hace, corriendo el modelo
1 = 0 + 1 1 + 2 2 + y obteniendo 1 = 0 + 1 1 +
2 2 . Esta parte de 1 no est correlacionada con el
trmino de error si 2 es exgena. Se llama primera etapa.
2. Luego estimamos por MCO el modelo = 0 + 1 1 +
2 1 + 1 , esto es reemplazamos la variable endgena por
su contraparte exgena 1 , que captura slo la variacin
de la variable original que es explicada por 1 y 2 .
Por esto se le llama al mtodo MC2E. Si hay un solo
instrumento, MC2E es el estimador de VI.
El comando ivregres 2sls hace esto esencialmente,
tambin les calcula los errores estndares (con varias
opciones).
32
Notemos que si tenemos ms de un instrumento o
ms de una variable endgena, el mtodo sirve
igual, los pasos se resumen a
1. Primera etapa: variables endgenas sobre todas
las variables exgenas del sistema (las incluidas
en la ecuacin y las excludas).
2. Segunda etapa: variables endgenas se
reemplazan con sus predicciones de la primer
etapa.
Importante: necesitamos al menos tantos
instrumentos como variables endgenas tenemos
en la ecuacin.
33
MC2E
Necesitamos al menos un instrumento por cada variable
endgena explicativa.
Deben cumplir ambos con los dos supuestos de VI.
Tendremos una primer etapa para cada variable endgena.

Esto es, si el modelo estructural es = 0 + 1 1 + 2 2 +
1 1 + 2 2 + 3 3 + 1 y los instrumentos son 4 y 5 , la
primer etapa para los regresores endgenos sern
1 = 10 + 11 1 + 12 2 + 13 3 + 14 4 + 15 5
2 = 20 + 21 1 + 22 2 + 23 3 + 4 24 + 25 5
Necesitamos que ambos instrumentos sean significativos en las

primeras etapas.
34
MC2E
La condicin de que haya al menos una variable exgena
externa por cada variable endgena se denomina
condicin de orden.
Es necesaria y no suficiente.
La condicin suficiente para identificacin se plantea en
trminos de matrices, pero intuitivamente tiene que ver
con el hecho de que tiene que haber suficiente poder
explicativo por separado para cada instrumento (que los
instrumentos no sean redundantes)
35
Algunas observaciones
Presentacin de resultados es similar a la de MCO.
Stata ofrece este procedimiento sin necesidad de hacer
dos etapas.
Si hacemos esto a mano (primera etapa y segunda etapa)
los errores estndares que obtenemos no son los
correctos.
R2 no es relevante en VI o MC2E, nada garantiza que est
entre cero y uno.
Problemas de multicolinealidad pueden ser problemticos
Si las variables exgenas estn altamente correlacionadas, los
errores estndares de MC2E pueden ser muy altos.
36
. reg lwage educ exper
Source SS df MS Number of obs = 428

F(2, 425) = 37.02
Model 33.1324581 2 16.566229 Prob > F = 0.0000
Residual 190.194983 425 .447517607 R-squared = 0.1484
Adj R-squared = 0.1444
Total 223.327441 427 .523015084 Root MSE = .66897
lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
educ .1094888 .0141672 7.73 0.000 .0816423 .1373353

exper .0156736 .0040191 3.90 0.000 .0077738 .0235733
_cons -.4001744 .1903682 -2.10 0.036 -.7743548 -.0259939
37
. ivregress 2sls lwage (educ=fatheduc motheduc) exper, robust
Instrumental variables (2SLS) regression Number of obs = 428

Wald chi2(2) = 17.51
Prob > chi2 = 0.0002
R-squared = 0.1298
Root MSE = .67384
Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]
educ .0663893 .0334647 1.98 0.047 .0007996 .1319789

exper .0154877 .0041215 3.76 0.000 .0074098 .0235656
_cons .1478413 .4277165 0.35 0.730 -.6904676 .9861502
Instrumented: educ
Instruments: exper fatheduc motheduc
38
. reg educ exper motheduc fatheduc

F(3, 749) = 86.55
Model 1006.54298 3 335.514328 Prob > F = 0.0000
Residual 2903.49686 749 3.87649781 R-squared = 0.2574
Total 3910.03984 752 5.19952106 Root MSE = 1.9689
educ Coef. Std. Err. t P>|t| [95% Conf. Interval]
exper .0316688 .0089348 3.54 0.000 .0141287 .049209

motheduc .1874615 .0260437 7.20 0.000 .1363343 .2385888
fatheduc .1867954 .0245437 7.61 0.000 .1386128 .234978
_cons 8.570545 .251428 34.09 0.000 8.076957 9.064132
39
Etapas (MC2E)
Noten que
Si tenemos variables explicativas endgenas, el
estimador MCO es inconsistente, pero el
estimador de VI es consistente.
Si no hay variables explicativas endgenas, ambos
estimadores, MCO y VI, son consistentes, pero el
estimador de MCO es de mnima varianza.
Bajo la hiptesis nula (no hay variables exgenas) no
deberamos encontrar diferencias sistemticas entre los
estimadores MCO y de VI.
Parece natural disear un test en base a esta observacin
H0: Todas las variables explicativas son exgenas
H1: alguna variable X es endgena
Test de Hausman
Se basa en comparar si hay diferencias
sistemticas entre el estimador MCO y el
estimador de VI.
Si son muy distintos => problemas con
MCO.
Cmo se implementa...
Si el modelo estructural es = 0 + 1 1 + 2 1 +
1 , en la primer etapa uno estima
1 = 0 + 1 1 + 2 2 +1
Y si 1 y 2 son efectivamente exgenas, entonces
1 no puede estar correlacionada con 1 .
Esto significa que la endogeneidad de 1 proviene
de que 1 est correlacionada con 1 .
Escribimos entonces 1 = 1 1 + , y entonces 1
no estar correlacionada con 1 slo si 1 = 0.
Sustitumos en el modelo original
= 0 + 1 1 + 2 1 + 1
= 0 + 1 1 + 2 1 + 1 1 +
1 no es observable, pero podemos estimarla de la
primer etapa para 1 = 0 + 1 1 + 2 2 +1 .
Entonces, estimamos el modelo
= 0 + 1 1 + 2 1 + 1 1 +
Y evaluamos 0 : 1 = 0, 1 : 1 0.
Bajo 0 , 1 es exgena. Bajo 1 , 1 es endgena.
Si sospechamos de heteroscedasticidad, el contraste puede
hacerse robusto.
Modelo estructural log = 0 + 1 + 1 + .
Instrumento para educ, educacin de madre y padre
Primera etapa
. reg educ exper motheduc fatheduc

F(3, 749) = 86.55
Model 1006.54298 3 335.514328 Prob > F = 0.0000
Residual 2903.49686 749 3.87649781 R-squared = 0.2574
Total 3910.03984 752 5.19952106 Root MSE = 1.9689
educ Coef. Std. Err. t P>|t| [95% Conf. Interval]
exper .0316688 .0089348 3.54 0.000 .0141287 .049209

motheduc .1874615 .0260437 7.20 0.000 .1363343 .2385888
fatheduc .1867954 .0245437 7.61 0.000 .1386128 .234978
_cons 8.570545 .251428 34.09 0.000 8.076957 9.064132
Predigo el residuo de esta regresin, con predict res, res
Para evaluar si divorcio es endgeno, corremos modelo
aumentado por esta variable
. predict res, res
. reg lwage educ exper res

F(3, 424) = 25.63
Model 34.2800885 3 11.4266962 Prob > F = 0.0000
Residual 189.047352 424 .445866397 R-squared = 0.1535
Total 223.327441 427 .523015084 Root MSE = .66773
lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]
educ .0689671 .0289466 2.38 0.018 .0120704 .1258638

exper .0164092 .0040378 4.06 0.000 .0084727 .0243457
res .0521989 .0325359 1.60 0.109 -.0117528 .1161507
_cons .0921001 .3609096 0.26 0.799 -.6172946 .8014948
No podemos rechazar que el coeficiente del resdiduo es
cero => no podemos rechazar exogeneidad.
Notamos que los estimadores obtenidos en esta
regresin auxiliar son los mismos estimadores de VI.
. ivregress 2sls lwage (educ=fatheduc motheduc) exper, robust
Instrumental variables (2SLS) regression Number of obs = 428

Wald chi2(2) = 17.51
Prob > chi2 = 0.0002
R-squared = 0.1298
Root MSE = .67384
Robust
lwage Coef. Std. Err. z P>|z| [95% Conf. Interval]
educ .0663893 .0334647 1.98 0.047 .0007996 .1319789

exper .0154877 .0041215 3.76 0.000 .0074098 .0235656
_cons .1478413 .4277165 0.35 0.730 -.6904676 .9861502
Instrumented: educ
Instruments: exper fatheduc motheduc
Bedard y Deschenes (JHR, 2005) utilizan del Censo de
1980 en USA para estimar el efecto del divorcio sobre
la situacin econmica de la mujer. La muestra est
compuesta por mujeres blancas, nacidas en USA, entre
21 y 40 aos de edad, casadas por lo menos una vez y
con al menos un hijo.
Modelo = 0 + 1 + +
Variable dependiente: , varios outcomes; ingreso del hogar,
ingreso de la mujer, pobreza, horas de trabajo, etc.
Variable de inters: , dicotmica igual a 1 si hubo divorcio,
cero en cualquier otro caso.
, otros controles, como edad, edad, al momento de casarse,
edad al momento de tener el primer hijo, nivel educativo,
estado de, residencia y estado de nacimiento.
48
Por qu D es potencialmente endgena?
El divorcio es ms comn en grupos menos educados y
con mayor desventaja social-econmica
Mujeres, que ante una relacin desfavorable, se separan
pueden diferir de las que no se separan en diversos no-
observables.
Qu instrumento se propone?
Sexo del primer nio nacido en el matrimonio. Divorcios
ms frecuentes luego que nacen nias que cuando nacen
nios
49
(1) (2) (3) (4) (5) (6) (7)
VARIABLES std_hhinc poor inc_non inc_woman WORKED Weeks worked Hours
YR last year worked
last week
end_marr -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***

(17.539) (0.001) (40.734) (21.417) (0.002) (0.073) (0.065)
Observations 576,664 576,664 576,664 576,664 576,664 576,664 576,664

R-squared 0.167 0.082 0.218 0.125 0.066 0.068 0.083
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
50
(1) (2) (3) (4) (5) (6) (7)
VARIABLES Ingreso Pobre Ingreso Hogar Ingreso Trabaj el Semanas Horas
Familiar pc no aportado Mujer ao pasado trabajadas el trabajadas
por Mujer ao pasado la semana
pasada
D-OLS -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***

(17.539) (0.001) (40.734) (21.417) (0.002) (0.073) (0.065)
R2 0.167 0.082 0.218 0.125 0.066 0.068 0.083
D-IV 2,059.4 0.156 -3,108.8 6,164.8*** 0.556*** 28.330*** 20.041***

(1,801.404) (0.093) (4,066.368) (1,938.311) (0.177) (8.020) (6.541)
Observaciones 576,664 576,664 576,664 576,664 576,664 576,664 576,664

*** p<0.01, ** p<0.05,
51
Primera etapa
(1)
VARIABLES end_marr
isGirl 0.0075***
(0.001)
Observations 576,664
R-squared 0.054
*** p<0.01, ** p<0.05, * p<0.1
52
Card y Krueger (1993) utilizan la proximidad
geogrfica a una universidad en USA para estimar
los retornos a la educacin.
El modelo
Instrumento: si el individuo cuando joven tena

universidades con carreras de 4 aos (nearc4) y/o
centros de estudios superiores con carreras de dos
aos (nearc2).
Veamos cmo luce la primera etapa
53
Primera etapa, probamos ambos instrumentos,
juntos y por separado.
(1) (2) (3)
years of schooling years of schooling years of schooling
VARIABLES 1976 1976 1976
=1 if near 4 yr college, 1966 0.320*** 0.321***

(0.085) (0.085)
=1 if near 2 yr college, 1966 0.122 0.123
(0.078) (0.078)
Observations 3,010 3,010 3,010

R-squared 0.477 0.475 0.478
*** p<0.01, ** p<0.05, * p<0.1
54
Estimador de variables instrumentales
(1) (2) (3) (4)

VARIABLES log(wage) log(wage) log(wage) log(wage)
OLS IV (Nearc4) IV (Nearc2) IV (Ambos)
years of schooling, 1976 0.075*** 0.132** 0.293 0.157***

(0.004) (0.054) (0.186) (0.052)
Observations 3,010 3,010 3,010 3,010

*** p<0.01, ** p<0.05, * p<0.1
55
Charter schools en USA, son similares a nuestros
colegios municipales de administracin delegadas
Financiamiento pblico
Mayores grados de libertad
Datos de una escuela de Massachusetts (Angrist et
al., 2010).
Sobre-inscripcin: aleatorizacin
Quien asiste o no no es aleatorio, pero est altamente
correlacionado con la lotera o aleatorizacin.
56
Modelo:
= 0 + 1 + +
X: diversos controles
D: Asiste o no a charter schoo
First stage
= 0 + 1 + +
L: si gana la lotera o no
Forma Reducida:
= 0 + 1 + +
57
Modelo:
Columna (1):
Efectos heterogneos por etnia
Efectos similares por etnia
Columna (2):
Efectos heterogneos por score
en lnea base.
Programa beneficia a los nios
con desempeo ms bajo en la
LB.
58
Ingeniera Comercial

Capitulo VI Endogeneidad en El MLG PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Capitulo VI Endogeneidad en El MLG PDF

Uploaded by

Copyright:

Available Formats

Ingeniera Comercial

Cundo un regresor es endgeno

Ser entonces exgeno si Cov 1 , = 0.

Si al menos uno de ellos no lo es, el supuesto no se

Uno justifica la validez del instrumento usando su teora

Pero el estimador de VI nunca es insesgado.

. reg lwage educ

Source | SS df MS Number of obs = 428

. reg educ fath if lwage!=.

Source | SS df MS Number of obs = 428

Instrumental variables (2SLS) regression

Source | SS df MS Number of obs = 428

. reg lbwght packs

Source | SS df MS Number of obs = 1388

Problema: hay un montn de no-observables que estn correlacionados con

Source | SS df MS Number of obs = 1388

No se encuentra una alta correlacin entre el consumo de cigarrillos y

Instrumental variables (2SLS) regression

Source | SS df MS Number of obs = 1388

R-cuadrado es negativo por eso no se presenta; no hay

Tendremos una primer etapa para cada variable endgena.

Necesitamos que ambos instrumentos sean significativos en las

Source SS df MS Number of obs = 428

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .1094888 .0141672 7.73 0.000 .0816423 .1373353

Instrumental variables (2SLS) regression Number of obs = 428

educ .0663893 .0334647 1.98 0.047 .0007996 .1319789

Source SS df MS Number of obs = 753

educ Coef. Std. Err. t P>|t| [95% Conf. Interval]

exper .0316688 .0089348 3.54 0.000 .0141287 .049209

Source SS df MS Number of obs = 753

educ Coef. Std. Err. t P>|t| [95% Conf. Interval]

exper .0316688 .0089348 3.54 0.000 .0141287 .049209

. reg lwage educ exper res

Source SS df MS Number of obs = 428

lwage Coef. Std. Err. t P>|t| [95% Conf. Interval]

educ .0689671 .0289466 2.38 0.018 .0120704 .1258638

Instrumental variables (2SLS) regression Number of obs = 428

educ .0663893 .0334647 1.98 0.047 .0007996 .1319789

end_marr -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***

Observations 576,664 576,664 576,664 576,664 576,664 576,664 576,664

D-OLS -1,717.6*** 0.143*** -10,338.5*** 3,946.2*** 0.152*** 8.883*** 7.712***

R2 0.167 0.082 0.218 0.125 0.066 0.068 0.083

D-IV 2,059.4 0.156 -3,108.8 6,164.8*** 0.556*** 28.330*** 20.041***

Observaciones 576,664 576,664 576,664 576,664 576,664 576,664 576,664

Robust standard errors in parentheses

Instrumento: si el individuo cuando joven tena

=1 if near 4 yr college, 1966 0.320*** 0.321***

Observations 3,010 3,010 3,010

(1) (2) (3) (4)

years of schooling, 1976 0.075*** 0.132** 0.293 0.157***

Observations 3,010 3,010 3,010 3,010

Robust standard errors in parentheses

You might also like

end_marr -1,717.6* 0.143* -10,338.5* 3,946.2* 0.152* 8.883* 7.712***

D-OLS -1,717.6* 0.143* -10,338.5* 3,946.2* 0.152* 8.883* 7.712***

D-IV 2,059.4 0.156 -3,108.8 6,164.8* 0.556* 28.330* 20.041*

=1 if near 4 yr college, 1966 0.320* 0.321*

years of schooling, 1976 0.075* 0.132 0.293 0.157***