Professional Documents
Culture Documents
Parte prctica
1. El archivo Punto1.dta contiene informacin sobre 6000 trabajadores en
Canad, con respecto a los salarios (salario), la edad (edad), los aos de
educacin (educ), la experiencia (exper) y el puntaje de una prueba usado para
capturar la habilidad de un individuo (puntaje). Se desea conocer cul es la
mejor especificacin (forma funcional) para explicar el comportamiento de los
salarios de los trabajadores, para lo cual se plantean los modelos lin-lin, log-log y
log-lin. El modelo asume que la variable dependiente es el salario y las
explicativas son la edad, la educacin, la experiencia y el puntaje en la prueba.
a. Estime el modelo de regresin lineal (lin-lin), logartmico (log-log) y
semilogartmico (log-lin).
b. Interprete los resultados (signos e intuicin econmico, significancia parcial y
global, bondad de ajuste y magnitud de los coeficientes).
Interpretacin lin-lin
VARIABLES
edad
exper
educ
puntaje
Constant
(1)
salario
34.67
(80.16)
828.8***
(83.41)
1,309***
(74.90)
136.4***
(8.944)
-17,849***
(2,475)
Observations
6,000
R-squared
0.206
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
. reg
salario
Source
edad
df
MS
Model
Residual
2.1442e+11
8.2625e+11
4
5995
5.3604e+10
137823663
Total
1.0407e+12
5999
173473609
salario
Coef.
edad
educ
exper
puntaje
_cons
34.66997
1309.359
828.7596
136.4403
-17848.65
Std. Err.
80.15874
74.89576
83.40894
8.944495
2474.52
t
0.43
17.48
9.94
15.25
-7.21
Number of obs
F( 4, 5995)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
6000
388.93
0.0000
0.2060
0.2055
11740
P>|t|
0.665
0.000
0.000
0.000
0.000
-122.47
1162.536
665.2481
118.9059
-22699.6
191.8099
1456.182
992.2712
153.9748
-12997.7
Edad: Se espera que la el coeficiente que acompaa a la variable Edad sea positivo,
pues entre mayor sea la edad de la persona, se asume que tendr una mayor
habilidad en el desempeo de su respectivo trabajo dado que ni mierda-; en efecto,
en el modelo estimado, el coeficiente tiene un signo mayor a cero. Un aumento en
un ao de edad conlleva a un aumento de 34.67 pesos aproximadamente en el
salario. Sin embargo, el coeficiente no posee significancia parcial a ningn nivel.
Experiencia: Un aumento en un ao de experiencia aumenta el salario en 828.76
pesos aproximadamente. Se espera que el signo sea positivo, puesto que la
experiencia es valorada como un buen desarrollo del trabajo y el conocimiento es
ms amplio a medida que se adquiere experiencia; en el modelo, el signo del
coeficiente es positivo. Tiene una significancia parcial a cualquier nivel.
Educacin: Por un ao adicional de educacin, el salario aumenta en 1309.36 pesos
aprox. Se espera que el coeficiente sea positivo debido a que los aos de educacin
son valorados porque entre ms aos de educacin, mayor conocimiento en el rea a
trabajar. Esto se evidencia en la regresin. Es significativo a cualquier nivel.
Puntaje: El aumento en un punto en la prueba de habilidad conlleva a un aumento de
136.44 pesos en el salario aproximadamente. Se espera que el coeficiente sea
positivo porque entre ms habilidad tenga una persona, ms alta ser su
remuneracin; en efecto, lo es en el modelo anteriormente estimado. Es significativo
a cualquier nivel.
Intercepto: Cuando las variables explicativas toman un valor de cero, el salario
devenido por el individuo es de -17848.65 pesos aproximadamente. Intuicin,
despus. Es significativo a cualquier nivel.
Bondad de ajuste: Las variaciones en el salario estn explicadas en un 20.6% por las
variables independientes. Tomamos el Rcuad y no el Rcuad ajustado, ya que el
nmero de variables independientes es pequeo.
La significancia es global.
Interpretacin log-lin
(1)
lnsalario1
VARIABLES
edad
-0.0124**
(0.00519)
0.0627***
(0.00540)
0.0743***
(0.00485)
0.00773***
(0.000579)
7.751***
(0.160)
exper
educ
puntaje
Constant
Observations
6,000
R-squared
0.173
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
. reg lnsalario edad educ exper puntaje
Source
SS
df
MS
Model
Residual
723.46045
3466.0799
4
5995
180.865113
.578161785
Total
4189.54035
5999
.698373121
lnsalario1
Coef.
edad
educ
exper
puntaje
_cons
-.012363
.0742783
.0626702
.0077254
7.750984
Std. Err.
.0051917
.0048509
.0054023
.0005793
.1602706
t
-2.38
15.31
11.60
13.34
48.36
Number of obs
F( 4, 5995)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.017
0.000
0.000
0.000
0.000
=
=
=
=
=
=
6000
312.83
0.0000
0.1727
0.1721
.76037
-.0021853
.0837878
.0732606
.0088611
8.065172
Edad: Se espera que la el coeficiente que acompaa a la variable Edad sea positivo,
pues entre mayor sea la edad de la persona, se asume que tendr una mayor
habilidad en el desempeo de su respectivo trabajo dado que ni mierda-; no
3
(1)
lnsalario1
-0.00360
(0.163)
0.499***
(0.0475)
0.944***
(0.0611)
0.391***
(0.0308)
4.356***
4
(0.547)
Observations
5,992
R-squared
0.160
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
. reg
SS
df
MS
Model
Residual
667.057366
3501.63032
4
5987
166.764341
.584872276
Total
4168.68768
5991
.695825018
lnsalario1
Coef.
lnedad1
lneduc1
lnexper1
lnpuntaje1
_cons
-.0036049
.9443474
.4987682
.3913417
4.355963
Std. Err.
.1626609
.061109
.0474766
.0307587
.5473906
t
-0.02
15.45
10.51
12.72
7.96
Number of obs
F( 4, 5987)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.982
0.000
0.000
0.000
0.000
=
=
=
=
=
=
5992
285.13
0.0000
0.1600
0.1595
.76477
.315269
1.064143
.5918395
.4516397
5.429045
Edad: Se espera que la el coeficiente que acompaa a la variable Edad sea positivo,
pues entre mayor sea la edad de la persona, se asume que tendr una mayor
habilidad en el desempeo de su respectivo trabajo dado que ni mierda-; no
obstante, esto no sucede en la regresin. Un aumento en un 1% en la edad, genera
una disminucin de 0.0036% en el salario aproximadamente. No hay significancia
para ningn nivel.
Experiencia: Un aumento en un 1% de experiencia aumenta el salario en 0.5%
aproximadamente. Se espera que el signo sea positivo, puesto que la experiencia es
valorada como un buen desarrollo del trabajo y el conocimiento es ms amplio a
medida que se adquiere experiencia; en el modelo, el signo del coeficiente es
positivo. Tiene una significancia parcial a cualquier nivel.
Educacin: Por un aumento del 1% en la educacin, el salario aumenta 0.94%
aproximadamente. Se espera que el coeficiente sea positivo debido a que los aos de
educacin son valorados porque entre ms aos de educacin, mayor conocimiento
se tendr en el rea a trabajar. Esto se evidencia en la regresin. Es significativo a
cualquier nivel.
Puntaje: El aumento en un 1% en la prueba de habilidad conlleva a un aumento del
0.39% en el salario aproximadamente. Se espera que el coeficiente sea positivo
5
Log log
Ramsey RESET test using powers of the fitted values of lnsalario1
Ho: model has no omitted variables
F(3, 5984) =
19.25
Prob > F =
0.0000
Lin-lin
Ramsey RESET test using powers of the fitted values of salario
Ho: model has no omitted variables
F(3, 5992) =
20.52
Prob > F =
0.0000
La prueba Ramsey Reset determina que se rechaza la hiptesis nula, es decir, que
existe sesgo de especificacin. Mierdita agrega!!
d. Realice la prueba de Davidson y McKinnon para comparar el modelo log-lin y
log-log. Interprete los resultados
VARIABLES
(1)
lnsalario1
6
edad
exper
educ
puntaje
y_2
Constant
-0.0129**
(0.00537)
0.0702***
(0.00982)
0.0870***
(0.0115)
0.00901***
(0.00116)
-0.177
(0.143)
9.124***
(1.119)
Observations
5,992
R-squared
0.170
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
e. Realice la prueba del Multiplicador de Lagrange para comparar los modelos
log-lin y log-log. Interprete los resultados.
2. La base de datos Punto2.dta contiene informacin sobre 1.085 madres y sus
hijos. Usted como investigador est interesado en entender si las prcticas de
disciplina en el hogar afectan el desarrollo cognitivo de los hijos. Para lo cual se
plantea la siguiente regresin
log ( Saber )= 0+ 1 castigos + 2 educmadre + 3 raza+ 4 sexo + 5 edadmadre+
log ( Saber )
Donde
castigos
mes,
educmadre
raza
es
VARIABLES
Castigos
Educmadre
Raza
Sexo
Edadmadre
Constant
(1)
logSaber
0.00443***
(0.00133)
0.0289***
(0.00391)
-0.176***
(0.0180)
-0.0238*
(0.0131)
-0.00534***
(0.00152)
4.293***
(0.0510)
Observations
1,085
R-squared
0.145
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
SS
df
MS
Model
Residual
8.51403661
50.0159622
5
1079
1.70280732
.046353996
Total
58.5299988
1084
.053994464
logSaber
Coef.
castigos
educmadre
raza
sexo
edadmadre
_cons
.0044276
.0289328
-.1757008
-.0238486
-.0053396
4.293135
Std. Err.
.0013297
.0039122
.0180297
.0130977
.0015219
.051033
t
3.33
7.40
-9.75
-1.82
-3.51
84.12
Number of obs
F( 5, 1079)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.001
0.000
0.000
0.069
0.000
0.000
=
=
=
=
=
=
1085
36.73
0.0000
0.1455
0.1415
.2153
.0070368
.0366092
-.1403235
.0018512
-.0023534
4.39327
Edadmadre: El signo es negativo, por lo que es posible pensar que este resultado
favorece la parte intuitiva que sugera que a mayor edad, menos preparada est
la madre para tener sus hijos; sin embargo, desde nuestro punto de vista, debera
primar el hecho de que las madres jvenes no estn listas para criar a sus hijos
con facultades suficientes para un buen desarrollo de sus habilidades. Ante un
ao adicional en la edad de la madre, el nio obtiene una disminucin del
puntaje en un 0.53% aproximadamente. El coeficiente es relevante a cualquier
nivel de significancia.
Intercepto: Cuando las otras variables se vuelven cero, el puntaje que recibira
un individuo sera
d. Ahora, suponga que castigos es endgena. Explique la intuicin de la
anterior afirmacin.
Tiene sentido que la variable sea endgena debido a que el nmero de castigos
que una mam ejerce sobre sus hijos puede estar determinado por otras
variables, tales como su credo o su opinin respecto a la conveniencia de
castigar o no a sus hijos. Tambin entran en juego las polticas que realice el
Estado para la educacin en el hogar, en el sentido de que decida o no promover
los castigos como mtodo de crianza.
El problema de endogenidad no se debe relacionar con la variable instrumental
sino con otra que est en el trmino del error.
e. Explique por qu la condicin laboral de una madre (si trabaja o no) podra
estar correlacionada con la variable castigos . De lo anterior, se podra
considerar que el instrumento es vlido?
Dado que a priori es muy difcil explicar con palabras una posible relacin entre
el instrumento y el trmino del error del modelo estructural, vamos a asumir que
no estn relacionados y que por lo tanto, si hay relacin entre la variable
endgena y el instrumento, ser un buen instrumento. ---------- 2 visiones. Si la
madre trabaja, significa que tiene menos tiempo de dedicacin para su hijo y que
por lo tanto el tiempo de exposicin para posibles castigos es menor. Sin
embargo, tambin se podra pensar que si trabaja entonces castiga a su hijo
como primera opcin ante la ausencia de tiempo que tiene para criarlo con
detenimiento. Ahora bien, si no trabaja el tiempo de exposicin a los castigos
ser ms alto. Aunque, si no trabaja, tiene ms tiempo para criar a su hijo y as
evitar la necesidad de castigos.
f. La base de datos contiene informacin sobre: i) el nmero de centros del
ICBF en la regin (ICBF); ii) el nmero de Secretaras de Integracin Social
10
g. Utilizando las tres variables como instrumentos, estime el modelo inicial por
Mnimos cuadrados en dos Etapas (MC2E) de forma matricial y usando el
comando directo de STATA.
B_mc2e[6,1]
uno
castigos
educmadre
raza
sexo
edadmadre
VARIABLES
castigos
educmadre
raza
sexo
edadmadre
Constant
logSaber
4.1898948
-.03526416
.05591226
-.21448092
-.0297591
-.00554112
(1)
logSaber
-0.0353**
(0.0141)
0.0559***
(0.0109)
-0.214***
(0.0279)
-0.0298*
(0.0178)
-0.00554***
(0.00206)
4.190***
(0.0779)
Observations
1,085
Standard errors in parentheses
*** p<0.01, ** p<0.05, * p<0.1
h. Interprete los resultados (signos, significancia parcial y global, bondad de
ajuste y magnitud).
11
SS
Model
Residual
-32.7863597
91.3163585
Total
58.5299988
logSaber
Coef.
castigos
educmadre
raza
sexo
edadmadre
_cons
-.0352642
.0559123
-.2144809
-.0297591
-.0055411
4.189895
df
MS
Number of obs
F( 5, 1079)
Prob > F
R-squared
Adj R-squared
Root MSE
5 -6.55727195
1079 .084630545
1084
.053994464
Std. Err.
.014077
.0108631
.0279209
.0178193
.0020576
.0779341
t
-2.51
5.15
-7.68
-1.67
-2.69
53.76
P>|t|
0.012
0.000
0.000
0.095
0.007
0.000
=
=
=
=
=
=
1085
20.16
0.0000
.
.
.29091
-.0076428
.0772275
-.1596955
.0052053
-.0015037
4.342814
-.0352642
.0559123
-.2144809
-.0297591
-.0055411
.0044276
.0289328
-.1757008
-.0238486
-.0053396
(b-B)
Difference
-.0396918
.0269794
-.0387801
-.0059105
-.0002015
sqrt(diag(V_b-V_B))
S.E.
.0103329
.0070235
.0100956
.0015387
.0000525
Ho:
La prueba sugiere que se debe rechazar la hiptesis nula. Dado que en la Prueba
de Hausman la hiptesis nula sostiene que no existe endogendidad, se concluye
que el modelo presenta problemas de endogenidad.
j. Realice las pruebas estadsticas (Sargan) para comprobar la validez y la
significancia de los instrumentos usados.
Tests of overidentifying restrictions:
Sargan N*R-sq test
0.383 Chi-sq(2)
Basmann test
0.380 Chi-sq(2)
P-value = 0.8257
P-value = 0.8268
13