You are on page 1of 59

Ingeniera Comercial

para Profesionales

Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI

Estimacin por Mnimos Cuadrados en Dos


Etapas (MC2E)

Contrastes de endogeneidad

Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas y error en las variables.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI

Estimacin por Mnimos Cuadrados en Dos


Etapas (MC2E)

Contrastes de endogeneidad

Consideramos el
lineal general

modelo de regresin

= 0 + 1 1 + 2 2 + + +

Cundo un regresor es endgeno

Decimos que un regresor es endgeno si ste est


correlacionado con el trmino de error, tal que
Cov , 0.
Ser entonces exgeno si Cov 1 , = 0.

El supuesto que aseguraba la exogeneidad de las


variables explicativas es el S4

Establece que la media condicionada del error en las variables


explicativas tiene que ser cero
E |1 , 2 , , = 0

Vale notar que esto slo se verifica si TODOS los regresores son
exgeneos.

Si al menos uno de ellos no lo es, el supuesto no se


cumple
Y ya vimos que las consecuencias del no cumplimiento
de este supuesto son serias: el estimador MCO no ser
consistente.
Por ahora nos
endogeneidad.

focalizamos

en

dos

causas

de

Caso I: variables relevantes omitidas

Modelo verdadero

= 0 + 1 1 + 2 2 +

Pero estimamos el modelo que omite 2

= 0 + 1 1 +

Ya vimos que al menos que Cov 1 , 2 = 0, Cov 1 ,


0.
El supuesto S4 no se cumple en el modelo reducido y
entonces los estimadores MCO sern sesgados e
inconsistentes

Uno puede analizar el signo del sesgo

Caso II: error de medida en las variables


explicativas.

No se observa 1 sino que se observa una variable


medida con error (proxy)

1 = 1 + 1

Podemos notar que por definicin la variable 1 est


correlacionada con 1 .
1 cuyo efecto querramos estimar, pero 1 es la variable
que efectivamente observamos.
Dado este set-up, uno puede mostrar que la variable
medida con error est correlacionada con el error del
modelo.

Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI

Estimacin por Mnimos Cuadrados en Dos


Etapas (MC2E)

Contrastes de endogeneidad

Vamos a ver la intuicin que est detrs de proponer el


estimador de Variables Instrumentales (VI)
Comencemos con el modelo de regresin simple
= 0 + 1 +

Ya vimos que el estimador MCO no es consistente si la


variable est correlacionada con el trmino de error.
Vamos a buscar otra variable que est fuera del
modelo, que llamaremos instrumento ( ), tal que se
cumplan los supuestos:
VI.1. no puede estar correlacionada con el trmino de
error: Cov , = 0.
VI.2. debe estar altamente correlacionada con el regresor
que sospechamos es endgeno: Cov , 0.

En el contexto de variables omitidas,


podemos esquematizar nuestro problema
como:

X causa Y, pero W tambin

W (variable omitida) est correlacionada


con X.

Z (instrumento), slo est correlacionada


con X. => cualquier influencia que pudiera
tener sobre Y es a travs de X.

Dos supuestos,
verificable.

slo

de

ellos

X tiene que estar correlacionada con Z => verificable

uno

Uno puede evaluar qu tan correlacionada estn X y Z usando


un modelo de regresin.

Z no puede estar correlacionada con Y, salvo a travs de X

Supuesto de Cov , = 0 NO ES CONTRASTABLE

Error no se observa.

Uno justifica la validez del instrumento usando su teora


econmica.

Cmo nos va a ayudar un instrumento a estimar


consistentemente el efecto de X sobre Y?

En MCO usamos la variacin en X para estimar el efecto de


X sobre Y.
Pero parte de la variacin en X se debe a W (y es la parte
que hace que X est correlacionada con el trmino de
error).
Idea: no usar slo la variacin en X que es explicada por
Z (determinstica) para inferir el efecto de X sobre Y.
Escribamos = 0 + 1 + . Si estimamos este modelo
por MCO, obtenemos = 0 + 1 . Si una buena parte de
es explicada por Z, yo tengo varianza en que es
exgena al error de la ecuacin original (siempre y
cuando Cov , = 0

Modelo de salarios log = 0 + 1 +


Notamos que el trmino de error incluye habilidad:
individuos toman decisiones sobre cunta educacin
tomar segn su nivel de habilidad.
Un instrumento: IQ, o alguna medida de CI no es un
buen instrumento ya que es una variable que debe
estar en la ecuacin de salarios.
Educacin del padre o madre?

Si, podra serlo si es que podemos sostener que estas


variables no afectan los salarios actuales de los hijos, sino
que afectaron las decisiones de educacin de ellos.
No es un buen instrumento si uno cree que la habilidad de la
madre/padre es transmisible (genes)

Mes de nacimiento del nio

No correlacionado con la habilidad del nio


Pero podra estar correlacionado con terminar o no el nivel
medio si los individuos que nacen antes alcanzan la edad
obligatoria antes de completar el nivel y como y
abandonan
Pero la correlacin puede ser baja

No es trivial encontrar instrumentos vlidos.

Sea el modelo = 0 + 1 + , veamos cmo es la


mecnica de usar los instrumentos
para estimar
consistentemente los parmetros 0 y 1 .
Recordemos que establecimos que Cov , = 0, entonces

Cov , 0 1 = 0
Desarrollando,
Cov , ) Cov( , 0 ) 1 Cov( , = 0

Notamos que Cov( , 0 )=0, y despejando


,
1 =
,

Para que este estimador sea factible, necesitamos que


, 0.

Cmo operacionalizamos este estimador?

Reemplazamos
muestrales.

los

momentos

poblacionales

Numerador: covarianza entre Z e Y.

Denominador: covarianza entre Z y Z.

,1 =

por

los

=1( )( )

=1( )( )

e igualmente obtenemos la ordenada al origen como

,0 = ,1
Notemos que si = , esta formula coincide con el
estimador MCO

Si los supuestos VI.1 y VI.2 se cumplen

El estimador de VI es consistente.

El estimador de VI es asintticamente normal.

Pero el estimador de VI nunca es insesgado.


Necesito muestras grandes, ya que no
necesariamente las propiedades del estimador
de VI van a ser buenas en muestras pequeas.

Toda la inferencia se hace asinttica


Se
puede
estimar
su
varianza
asinttica
homoscedasticidad o robusta a la heteroscedasticidad.

bajo

Los errores estndares de los estimadores de VI


son siempre ms grandes que los errores
estndares del estimador MCO (cuando este es
consistente).

Pero esta comparacin slo tiene sentido si , = 0.

Notar que,

Mientras ms correlacionada est x y z, menores sern los


errores estndares.

Cuando , es baja, VI es muy ineficiente.

Necesitamos un error estndar para el


estimador VI

El estimador de la varianza de la regresin


se obtiene como
n

Adems
1

u
i 1

y
n

2
i

nk

2
=
2 ,

i 1

x
0
1 i

nk

Ejemplo usando la data MROZ del libro


log = 0 + 1 +
Objeto: estimar el rendimiento de un ao de educacin
. reg

lwage educ

Source |
SS
df
MS
-------------+-----------------------------Model | 26.3264193
1 26.3264193
Residual | 197.001022
426 .462443713
-------------+-----------------------------Total | 223.327441
427 .523015084

Number of obs
F( 1,
426)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

428
56.93
0.0000
0.1179
0.1158
.68003

-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.1086487
.0143998
7.55
0.000
.0803451
.1369523
_cons | -.1851968
.1852259
-1.00
0.318
-.5492673
.1788736
------------------------------------------------------------------------------

Usamos la educacin del padre como instrumento. Cumple


el supuesto VI.2?

. reg educ fath if lwage!=.


Source |
SS
df
MS
-------------+-----------------------------Model | 384.841983
1 384.841983
Residual | 1845.35428
426 4.33181756
-------------+-----------------------------Total | 2230.19626
427 5.22294206

Number of obs
F( 1,
426)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

428
88.84
0.0000
0.1726
0.1706
2.0813

-----------------------------------------------------------------------------educ |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------fatheduc |
.2694416
.0285863
9.43
0.000
.2132538
.3256295
_cons |
10.23705
.2759363
37.10
0.000
9.694685
10.77942
-----------------------------------------------------------------------------. predict educ_hat
(option xb assumed; fitted values)

Ejemplo usando la data MROZ del libro

. ivreg lwage (educ=fathe)


Instrumental variables (2SLS) regression
Source |
SS
df
MS
-------------+-----------------------------Model | 20.8673606
1 20.8673606
Residual |
202.46008
426 .475258404
-------------+-----------------------------Total | 223.327441
427 .523015084

Number of obs
F( 1,
426)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

428
2.84
0.0929
0.0934
0.0913
.68939

-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0591735
.0351418
1.68
0.093
-.0098994
.1282463
_cons |
.4411034
.4461018
0.99
0.323
-.4357312
1.317938
-----------------------------------------------------------------------------Instrumented: educ
Instruments:
fatheduc
------------------------------------------------------------------------------

Es consistente este hallazgo con nuestra teora


econmica?

Si, esperabamos que el estimador MCO tuviera un sesgo


positivo.
,1 = 0.108

,1 = 0.059

Si no se cumplen los supuestos VI.1 y VI.2 el


estimador VI no ser consistente.

log = 0 + 1 +
. reg lbwght packs
Source |
SS
df
MS
-------------+-----------------------------Model | .997781141
1 .997781141
Residual | 49.4225525 1386 .035658407
-------------+-----------------------------Total | 50.4203336 1387 .036352079

Number of obs
F( 1, 1386)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

1388
27.98
0.0000
0.0198
0.0191
.18883

-----------------------------------------------------------------------------lbwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------packs | -.0898131
.0169786
-5.29
0.000
-.1231197
-.0565065
_cons |
4.769404
.0053694
888.26
0.000
4.758871
4.779937
------------------------------------------------------------------------------

Problema: hay un montn de no-observables que estn correlacionados con


el consumo de cigarrillos
Podra ser el precio de los cigarrillos un buen instrumento? Veamos

Primera etapa
. reg

packs cigprice

Source |
SS
df
MS
-------------+-----------------------------Model | .011648626
1 .011648626
Residual | 123.684481 1386 .089238442
-------------+-----------------------------Total | 123.696129 1387 .089182501

Number of obs
F( 1, 1386)
Prob > F
R-squared
Adj R-squared
Root MSE

=
1388
=
0.13
= 0.7179
= 0.0001
= -0.0006
= .29873

-----------------------------------------------------------------------------packs |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------cigprice |
.0002829
.000783
0.36
0.718
-.0012531
.0018188
_cons |
.0674257
.1025384
0.66
0.511
-.1337215
.2685728
------------------------------------------------------------------------------

No se encuentra una alta correlacin entre el consumo de cigarrillos y


su precio. El precio del cigarrillo parece ser un mal instrumento, qu
sucede si lo usamos de todas maneras?

El estimador VI con un instrumento dbil


. ivreg

lbwght (packs= cigprice)

Instrumental variables (2SLS) regression


Source |
SS
df
MS
-------------+-----------------------------Model | -1171.28207
1 -1171.28207
Residual | 1221.70241 1386 .881459168
-------------+-----------------------------Total | 50.4203336 1387 .036352079

Number of obs
F( 1, 1386)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

1388
0.12
0.7312
.
.
.93886

-----------------------------------------------------------------------------lbwght |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------packs |
2.988676
8.698888
0.34
0.731
-14.07573
20.05309
_cons |
4.448136
.9081552
4.90
0.000
2.666629
6.229644
-----------------------------------------------------------------------------Instrumented: packs
Instruments:
cigprice
------------------------------------------------------------------------------

R-cuadrado es negativo por eso no se presenta; no hay


significancia de los coeficientes
Nota: de todas maneras el R-cuadrado en este contexto pierde la
interpretacin usual, ya que SCT puede ser menor que SCE

Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI

Estimacin por Mnimos Cuadrados en Dos


Etapas (MC2E)

Contrastes de endogeneidad

Cuando estamos en el modelo de regresin mltiple,


podemos tener varias variables endgenas y varias
variables exgenas como explicativas.
Podemos escribir el modelo como
= 0 + 1 1 + 2 1 + 1

A esta ecuacin la denominamos forma estructural.


Noten que estoy usando una notacin para referirme a
las variables explicativas

Exgenas: 1

Endgenas: 1

28

El modelo podra ser log = 0 + 1 + 1 + ,


donde suponemos que = 1 y = 1 .
La variable educ est correlacionada con el trmino de
error, por la omisin de habilidad y otras variables que
determinan salario y educacin al mismo tiempo.
Volvamos a notar nuevamente que an cuando el
regresor endgeno sea educ, todos los estimadores
MCO sern inconsistentes.
Necesitamos un instrumento 2 , que debe estar
correlacionado con el regresor endgeno. Nuevamente
debemos evaluar este supuesto estimando el modelo
auxiliar (llamado primera etapa).
1 = 0 + 1 1 + 2 2 +

29

Tenemos que evaluar si 2 = 0, para comprobar


que an luego de controlar por 1 el instrumento
est correlacionado con 1 .

La variable 2 aporta informacin a la determinacin de 1 .


Este instrumento no puede ser una variable explicativa del
modelo.

El instrumento 2 debe cumplir con los supuestos.

VI.1. 2 no puede estar correlacionado con 1

(como 1 es variable explicativa, obvio que tampoco


puede estarlo)

VI.2. 2 debe estar correlacionado con el regresor


endgeno.

30

Podemos tener ms de un instrumento y ms de


una variable endgena en la ecuacin.

MC2E es una generalizacin del estimador de VI en


estos contextos.

Si tenemos un solo instrumento MC2E es el


estimador de variables instrumentales (coinciden
plenamente).

Si tenemos ms de un instrumento, el estimador


de MC2E es un estimador de variables
instrumentales donde el instrumento usado es
1 = 0 + 1 1 + 2 2 .

31

La mecnica de cmo obtener el estimador es sencilla.


1.

2.

Limpiamos a 1 de la influencia de todo lo relacionado con


el trmino de error Esto se hace, corriendo el modelo
1 = 0 + 1 1 + 2 2 + y obteniendo 1 = 0 + 1 1 +
2 2 . Esta parte de 1 no est correlacionada con el
trmino de error si 2 es exgena. Se llama primera etapa.
Luego estimamos por MCO el modelo = 0 + 1 1 +
2 1 + 1 , esto es reemplazamos la variable endgena por
su contraparte exgena 1 , que captura slo la variacin
de la variable original que es explicada por 1 y 2 .

Por esto se le llama al mtodo MC2E. Si hay un solo


instrumento, MC2E es el estimador de VI.

El comando ivregres 2sls hace esto esencialmente,


tambin les calcula los errores estndares (con varias
opciones).
32

1.

2.

Notemos que si tenemos ms de un instrumento o


ms de una variable endgena, el mtodo sirve
igual, los pasos se resumen a
Primera etapa: variables endgenas sobre todas
las variables exgenas del sistema (las incluidas
en la ecuacin y las excludas).
Segunda
etapa:
variables
endgenas
se
reemplazan con sus predicciones de la primer
etapa.

Importante:
necesitamos
al
menos
tantos
instrumentos como variables endgenas tenemos
en la ecuacin.
33

MC2E

Necesitamos al menos un instrumento por cada variable


endgena explicativa.

Deben cumplir ambos con los dos supuestos de VI.


Tendremos una primer etapa para cada variable endgena.
Esto es, si el modelo estructural es = 0 + 1 1 + 2 2 +
1 1 + 2 2 + 3 3 + 1 y los instrumentos son 4 y 5 , la
primer etapa para los regresores endgenos sern
1 = 10 + 11 1 + 12 2 + 13 3 + 14 4 + 15 5

2 = 20 + 21 1 + 22 2 + 23 3 + 4 24 + 25 5

Necesitamos que ambos instrumentos sean significativos en las


primeras etapas.
34

MC2E

La condicin de que haya al menos una variable exgena


externa por cada variable endgena se denomina
condicin de orden.

Es necesaria y no suficiente.

La condicin suficiente para identificacin se plantea en


trminos de matrices, pero intuitivamente tiene que ver
con el hecho de que tiene que haber suficiente poder
explicativo por separado para cada instrumento (que los
instrumentos no sean redundantes)

35

Algunas observaciones

Presentacin de resultados es similar a la de MCO.


Stata ofrece este procedimiento sin necesidad de hacer
dos etapas.
Si hacemos esto a mano (primera etapa y segunda etapa)
los errores estndares que obtenemos no son los
correctos.

R2 no es relevante en VI o MC2E, nada garantiza que est


entre cero y uno.
Problemas de multicolinealidad pueden ser problemticos

Si las variables exgenas estn altamente correlacionadas, los


errores estndares de MC2E pueden ser muy altos.
36

. reg lwage educ exper


Source

SS

df

MS

Model
Residual

33.1324581
190.194983

2
425

16.566229
.447517607

Total

223.327441

427

.523015084

lwage

Coef.

educ
exper
_cons

.1094888
.0156736
-.4001744

Std. Err.
.0141672
.0040191
.1903682

t
7.73
3.90
-2.10

Number of obs
F(2, 425)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.000
0.000
0.036

=
=
=
=
=
=

428
37.02
0.0000
0.1484
0.1444
.66897

[95% Conf. Interval]


.0816423
.0077738
-.7743548

.1373353
.0235733
-.0259939

37

. ivregress 2sls lwage

(educ=fatheduc motheduc) exper, robust

Instrumental variables (2SLS) regression

lwage

Coef.

educ
exper
_cons

.0663893
.0154877
.1478413

Instrumented:
Instruments:

Robust
Std. Err.
.0334647
.0041215
.4277165

Number of obs
Wald chi2(2)
Prob > chi2
R-squared
Root MSE

z
1.98
3.76
0.35

P>|z|
0.047
0.000
0.730

=
=
=
=
=

428
17.51
0.0002
0.1298
.67384

[95% Conf. Interval]


.0007996
.0074098
-.6904676

.1319789
.0235656
.9861502

educ
exper fatheduc motheduc

38

. reg educ exper motheduc fatheduc


Source

SS

df

MS

Model
Residual

1006.54298
2903.49686

3
749

335.514328
3.87649781

Total

3910.03984

752

5.19952106

educ

Coef.

exper
motheduc
fatheduc
_cons

.0316688
.1874615
.1867954
8.570545

Std. Err.
.0089348
.0260437
.0245437
.251428

t
3.54
7.20
7.61
34.09

Number of obs
F(3, 749)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

753
86.55
0.0000
0.2574
0.2545
1.9689

P>|t|

[95% Conf. Interval]

0.000
0.000
0.000
0.000

.0141287
.1363343
.1386128
8.076957

.049209
.2385888
.234978
9.064132

39

Causas y consecuencias de la
endogeneidad para el estimador de MCO:
variables omitidas, errores de medida.
Estimacin con variables instrumentales
(VI). Seleccin de instrumentos.
Propiedades del estimador VI

Estimacin por Mnimos Cuadrados en Dos


Etapas (MC2E)

Contrastes de endogeneidad

Noten que
Si tenemos variables explicativas endgenas, el
estimador MCO es inconsistente, pero el
estimador de VI es consistente.
Si no hay variables explicativas endgenas, ambos
estimadores, MCO y VI, son consistentes, pero el
estimador de MCO es de mnima varianza.
Bajo la hiptesis nula (no hay variables exgenas) no
deberamos encontrar diferencias sistemticas entre los
estimadores MCO y de VI.
Parece natural disear un test en base a esta observacin
H0: Todas las variables explicativas son exgenas
H1: alguna variable X es endgena

Test de Hausman
Se basa en comparar si hay diferencias
sistemticas entre el estimador MCO y el
estimador de VI.
Si son muy distintos => problemas con
MCO.

Cmo se implementa...
Si el modelo estructural es = 0 + 1 1 + 2 1 +
1 , en la primer etapa uno estima
1 = 0 + 1 1 + 2 2 +1

Y si 1 y 2 son efectivamente exgenas, entonces


1 no puede estar correlacionada con 1 .
Esto significa que la endogeneidad de 1 proviene
de que 1 est correlacionada con 1 .
Escribimos entonces 1 = 1 1 + , y entonces 1
no estar correlacionada con 1 slo si 1 = 0.

Sustitumos en el modelo original


= 0 + 1 1 + 2 1 + 1
= 0 + 1 1 + 2 1 + 1 1 +

1 no es observable, pero podemos estimarla de la


primer etapa para 1 = 0 + 1 1 + 2 2 +1 .
Entonces, estimamos el modelo

= 0 + 1 1 + 2 1 + 1 1 +

Y evaluamos 0 : 1 = 0, 1 : 1 0.

Bajo 0 , 1 es exgena. Bajo 1 , 1 es endgena.


Si sospechamos de heteroscedasticidad, el contraste puede
hacerse robusto.

Modelo estructural log = 0 + 1 + 1 + .

Instrumento para educ, educacin de madre y padre

Primera etapa
. reg educ exper motheduc fatheduc
Source

SS

df

MS

Model
Residual

1006.54298
2903.49686

3
749

335.514328
3.87649781

Total

3910.03984

752

5.19952106

educ

Coef.

exper
motheduc
fatheduc
_cons

.0316688
.1874615
.1867954
8.570545

Std. Err.
.0089348
.0260437
.0245437
.251428

t
3.54
7.20
7.61
34.09

Number of obs
F(3, 749)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

753
86.55
0.0000
0.2574
0.2545
1.9689

P>|t|

[95% Conf. Interval]

0.000
0.000
0.000
0.000

.0141287
.1363343
.1386128
8.076957

.049209
.2385888
.234978
9.064132

Predigo el residuo de esta regresin, con predict res, res


Para evaluar si divorcio es endgeno, corremos modelo
aumentado
por esta variable
. predict res, res
. reg lwage educ exper res
Source

SS

df

MS

Model
Residual

34.2800885
189.047352

3
424

11.4266962
.445866397

Total

223.327441

427

.523015084

lwage

Coef.

educ
exper
res
_cons

.0689671
.0164092
.0521989
.0921001

Std. Err.
.0289466
.0040378
.0325359
.3609096

t
2.38
4.06
1.60
0.26

Number of obs
F(3, 424)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.018
0.000
0.109
0.799

=
=
=
=
=
=

428
25.63
0.0000
0.1535
0.1475
.66773

[95% Conf. Interval]


.0120704
.0084727
-.0117528
-.6172946

.1258638
.0243457
.1161507
.8014948

No podemos rechazar que el coeficiente del resdiduo es


cero => no podemos rechazar exogeneidad.

Notamos que los estimadores obtenidos en esta


regresin auxiliar son los mismos estimadores de VI.
. ivregress 2sls lwage

(educ=fatheduc motheduc) exper, robust

Instrumental variables (2SLS) regression

lwage

Coef.

educ
exper
_cons

.0663893
.0154877
.1478413

Instrumented:
Instruments:

Robust
Std. Err.
.0334647
.0041215
.4277165

educ
exper fatheduc motheduc

Number of obs
Wald chi2(2)
Prob > chi2
R-squared
Root MSE

z
1.98
3.76
0.35

P>|z|
0.047
0.000
0.730

=
=
=
=
=

428
17.51
0.0002
0.1298
.67384

[95% Conf. Interval]


.0007996
.0074098
-.6904676

.1319789
.0235656
.9861502

Bedard y Deschenes (JHR, 2005) utilizan del Censo de


1980 en USA para estimar el efecto del divorcio sobre
la situacin econmica de la mujer. La muestra est
compuesta por mujeres blancas, nacidas en USA, entre
21 y 40 aos de edad, casadas por lo menos una vez y
con al menos un hijo.
Modelo = 0 + 1 + +

Variable dependiente: , varios outcomes; ingreso del hogar,


ingreso de la mujer, pobreza, horas de trabajo, etc.

Variable de inters: , dicotmica igual a 1 si hubo divorcio,


cero en cualquier otro caso.

, otros controles, como edad, edad, al momento de casarse,


edad al momento de tener el primer hijo, nivel educativo,
estado de, residencia y estado de nacimiento.
48

Por qu D es potencialmente endgena?

El divorcio es ms comn en grupos menos educados y


con mayor desventaja social-econmica

Mujeres, que ante una relacin desfavorable, se separan


pueden diferir de las que no se separan en diversos noobservables.

Qu instrumento se propone?

Sexo del primer nio nacido en el matrimonio. Divorcios


ms frecuentes luego que nacen nias que cuando nacen
nios

49

VARIABLES

end_marr

Observations
R-squared

(1)
std_hhinc

(2)
poor

(3)
inc_non

(4)
inc_woman

(5)
(6)
WORKED Weeks worked
YR
last year

(7)
Hours
worked
last week

-1,717.6***
(17.539)

0.143***
(0.001)

-10,338.5***
(40.734)

3,946.2***
(21.417)

0.152***
(0.002)

8.883***
(0.073)

7.712***
(0.065)

576,664
576,664
576,664
576,664
0.082
0.218
0.125
0.066
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

576,664
0.068

576,664
0.083

576,664
0.167

50

VARIABLES

D-OLS
R2
D-IV

Observaciones

(1)
Ingreso
Familiar pc

(2)
Pobre

(3)
Ingreso Hogar
no aportado
por Mujer

(4)
Ingreso
Mujer

(5)
Trabaj el
ao pasado

(6)
Semanas
trabajadas el
ao pasado

(7)
Horas
trabajadas
la semana
pasada

-1,717.6***
(17.539)

0.143***
(0.001)

-10,338.5***
(40.734)

3,946.2***
(21.417)

0.152***
(0.002)

8.883***
(0.073)

7.712***
(0.065)

0.167

0.082

0.218

0.125

0.066

0.068

0.083

2,059.4
(1,801.404)

0.156
(0.093)

-3,108.8
(4,066.368)

6,164.8***
(1,938.311)

0.556***
(0.177)

28.330***
(8.020)

20.041***
(6.541)

576,664

576,664

576,664

576,664

576,664

576,664

576,664

Robust standard errors in parentheses


*** p<0.01, ** p<0.05,

51

Primera etapa

VARIABLES
isGirl

(1)
end_marr
0.0075***
(0.001)

Observations
576,664
R-squared
0.054
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

52

Card y Krueger (1993) utilizan la proximidad


geogrfica a una universidad en USA para estimar
los retornos a la educacin.
El modelo

Instrumento: si el individuo cuando joven tena


universidades con carreras de 4 aos (nearc4) y/o
centros de estudios superiores con carreras de dos
aos (nearc2).
Veamos cmo luce la primera etapa
53

Primera etapa, probamos ambos instrumentos,


juntos y por separado.
(1)
years of schooling
1976

VARIABLES
=1 if near 4 yr college, 1966
=1 if near 2 yr college, 1966

Observations
R-squared

(2)
years of schooling
1976

(3)
years of schooling
1976

0.122
(0.078)

0.321***
(0.085)
0.123
(0.078)

0.320***
(0.085)

3,010
3,010
0.477
0.475
Robust standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1

3,010
0.478

54

Estimador de variables instrumentales

VARIABLES

years of schooling, 1976

Observations

(1)
log(wage)
OLS

(2)
log(wage)
IV (Nearc4)

(3)
log(wage)
IV (Nearc2)

(4)
log(wage)
IV (Ambos)

0.075***
(0.004)

0.132**
(0.054)

0.293
(0.186)

0.157***
(0.052)

3,010

3,010

3,010

3,010

Robust standard errors in parentheses


*** p<0.01, ** p<0.05, * p<0.1

55

Charter schools en USA, son similares a nuestros


colegios municipales de administracin delegadas

Financiamiento pblico

Mayores grados de libertad

Datos de una escuela de Massachusetts (Angrist et


al., 2010).

Sobre-inscripcin: aleatorizacin
Quien asiste o no no es aleatorio, pero est altamente
correlacionado con la lotera o aleatorizacin.

56

Modelo:
= 0 + 1 + +

X: diversos controles
D: Asiste o no a charter schoo
First stage
= 0 + 1 + +
L: si gana la lotera o no
Forma Reducida:

= 0 + 1 + +
57

Modelo:
Columna (1):
Efectos heterogneos por etnia
Efectos similares por etnia
Columna (2):
Efectos heterogneos por score
en lnea base.
Programa beneficia a los nios
con desempeo ms bajo en la
LB.

58

Ingeniera Comercial

You might also like