You are on page 1of 13

UNIVERSIDAD NACIONAL DEL ALTIPLANO

FACULTAD DE INGENIERA ECONMICA


Curso de Evaluacin del Impacto de los Programas Sociales
Edson Nimer Samillan Sanga

Yeny Lizbet Chipana Paredes

Emparejamiento por Puntaje de Propensin


Los datos provienen de la National Supported Work (NSW) restringido a la NSWPSID-1 sub muestra. Se usa esta base porque es ampliamente conocida en la aplicacin
de este mtodo a la economa laboral, y porque est pblicamente disponible el sitio Web
de Rajeev Dehejia (http://www.columbia.edu/rd247/nswdata.html.). La variable de
inters es RE78 (ganancias reales en 1978); el tratamiento TREAT es la participacin en
el grupo de tratamiento NSW. Las variables de control son edad (AGE), educacin
(EDUC), BLACK (1 si negro, 0 en otro caso), HISP (1 si hispano, 0 en otro caso), MARR
(1 si es casado, 0 en otro caso), NODEGREE (1 si tiene grado, 0 si no la tiene), RE75
(ganancias en 1975), y RE74 (ganancias en 1974). El grupo de tratamiento contiene 185
observaciones, el de control 2490 observaciones, de lo que en total son 2675
observaciones.
Descripcin de la muestra de datos de la National Supported Work
VARIABLE

DESCRIPCIN

RE78

Ganancias reales en 1978

TREAT

Participacin del grupo de tratamiento (1= si recibe la capacitacin, 0 si no la


recibe)

EDAD

La edad del participante

EDUC

Educacin del participante

BLACK

1 si negro, 0 en otro caso

HISP

1 si hispano, 0 en otro caso

MARR

1 si es casado, 0 en otro caso

NODEGREE 1 si tiene grado, 0 si no la tiene


RE75

ganancias en 1975

RE74

ganancias en 1974

Fuente: Elaboracin propia en base a datos de la NSW

El tratamiento de evaluacin es la estimacin del efecto medio de un programa o


tratamiento sobre el resultado de inters. Una comparacin de los resultados se hace entre
los grupos tratados y de control. El emparejamiento por puntaje de propensin se utiliza
cuando un grupo de sujetos reciben un tratamiento y nos gustara comparar sus resultados
con los resultados de un grupo de control. El ejemplo incluye la estimacin de los efectos
de un programa de capacitacin en el desempeo laboral o los efectos de un programa
gubernamental dirigido a ayudar a las escuelas particulares.
Histogramas

3.0e-05
2.0e-05

1.0e-05

Density

4.0e-05

5.0e-05

histogram RE78

50000

100000
RE78

150000

10

Density

20

30

histogram TREAT

.2

.4

.6

.8

TREAT

Definimos la variable de tratamiento, resultado o dependiente, y las variables


independientes haciendo uso de los siguientes comandos:
global treatment TREAT
global ylist RE78
global xlist AGE AGESQ EDUC EDUCSQ MARR BLACK HISP RE74
RE75SQ U74BLACK
global breps 5
Mtodo de diferencias (Datos de un periodo-RE78)
Para este mtodo se hace uso de los siguientes comandos:
describe $treatment $ylist $xlist

. describe $treatment $ylist $xlist

variable name
TREAT
RE78
AGE
AGESQ
EDUC
EDUCSQ
MARR
BLACK
HISP
RE74
RE75SQ
U74BLACK

storage
type
float
float
float
float
float
float
float
float
float
float
float
float

display
format

value
label

variable label

%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g

sum $treatment $ylist $xlist


Variable

Obs

Mean

Std. Dev.

Min

Max

TREAT
RE78
AGE
AGESQ
EDUC

2675
2675
2675
2675
2675

.0691589
20502.38
34.22579
1281.61
11.99439

.2537716
15632.52
10.49984
766.8415
3.053556

0
0
17
289
0

1
121174
55
3025
17

EDUCSQ
MARR
BLACK
HISP
RE74

2675
2675
2675
2675
2675

153.1862
.8194393
.2915888
.0343925
18230

70.62231
.3847257
.4545789
.1822693
13722.25

0
0
0
0
0

289
1
1
1
137149

RE75SQ
U74BLACK

2675
2675

5.11e+08
.0549533

8.91e+08
.2279316

0
0

2.45e+10
1

bysort $treatment: sum $ylist $xlist

-> TREAT = 0
Variable

Obs

Mean

Std. Dev.

Min

Max

RE78
AGE
AGESQ
EDUC
EDUCSQ

2490
2490
2490
2490
2490

21553.92
34.8506
1323.53
12.11687
156.3161

15555.35
10.44076
769.796
3.082435
71.43048

0
18
324
0
0

121174
55
3025
17
289

MARR
BLACK
HISP
RE74
RE75SQ

2490
2490
2490
2490
2490

.8662651
.2506024
.0325301
19428.75
5.48e+08

.3404357
.433447
.1774389
13406.88
9.12e+08

0
0
0
0
0

1
1
1
137149
2.45e+10

U74BLACK

2490

.0144578

.1193923

-> TREAT = 1

Variable

Obs

Mean

Std. Dev.

Min

Max

RE78
AGE
AGESQ
EDUC
EDUCSQ

185
185
185
185
185

6349.145
25.81622
717.3946
10.34595
111.0595

7867.405
7.155019
431.2517
2.01065
39.30388

0
17
289
4
16

60307.9
48
2304
16
256

MARR
BLACK
HISP
RE74
RE75SQ

185
185
185
185
185

.1891892
.8432432
.0594595
2095.574
1.27e+07

.3927217
.3645579
.2371244
4886.623
5.60e+07

0
0
0
0
0

1
1
1
35040.1
6.32e+08

U74BLACK

185

.6

.4912274

El resultado es la diferencia en los ingresos antes y despus del tratamiento

(rediff)
TRATAMIENTO
0
1

NMERO DE
OBSERVACIONES
2490
185

PORCENTAJE DE
FRECUENCIA
93%
7%

Tenemos que encontrar resultados para las 185 observaciones tratadas y


luego comparar los resultados
Note de la salida que no todas las observaciones de control se utilizaron
como pareamiento para las 185 observaciones tratados.

Modelo para el tratamiento (t-test)


Primero, el mtodo ms simple para calcular el efecto de tratamiento promedio
del programa de capacitacin laboral, el cual compara el resultado entre el grupo de
tratamiento y grupo de control en el desempeo laboral. El siguiente comando muestra el
efecto del programa de capacitacin laboral
reg $ylist $treatment
Source

SS

df

MS

Model
Residual

3.9811e+10
6.1365e+11

1
2673

3.9811e+10
229573201

Total

6.5346e+11

2674

244375675

RE78

Coef.

TREAT
_cons

-15204.78
21553.92

Std. Err.
1154.614
303.6414

t
-13.17
70.98

Number of obs
F( 1, 2673)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

2675
173.41
0.0000
0.0609
0.0606
15152

P>|t|

[95% Conf. Interval]

0.000
0.000

-17468.8
20958.53

-12940.75
22149.32

El resultado muestra (-15204.78), que es muy significativo.


La regresin anterior muestra el impacto total del programa de capacitacin sobre
las ganancias reales de 1978. Este resultado puede cambiar si incluimos otras variables
de inters en la regresin. Ahora, regresionamos las ganancias reales contra la dummy de
capacitacin, ms otros factores que pueden afectar en el ingreso:
reg $ylist $treatment $xlist

Source

SS

df

MS

Model
Residual

3.5496e+11
2.9851e+11

11
2663

3.2269e+10
112093617

Total

6.5346e+11

2674

244375675

RE78

Coef.

TREAT
AGE
AGESQ
EDUC
EDUCSQ
MARR
BLACK
HISP
RE74
RE75SQ
U74BLACK
_cons

-1742.745
233.7363
-4.531737
-375.4803
44.41395
1624.787
-1087.801
1101.271
.5633764
3.65e-06
1163.395
2880.478

Std. Err.
1151.41
165.0521
2.241993
363.5069
15.54644
622.1396
528.8095
1152.101
.0241606
3.41e-07
1241.172
3570.156

t
-1.51
1.42
-2.02
-1.03
2.86
2.61
-2.06
0.96
23.32
10.71
0.94
0.81

Number of obs
F( 11, 2663)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.130
0.157
0.043
0.302
0.004
0.009
0.040
0.339
0.000
0.000
0.349
0.420

=
=
=
=
=
=

2675
287.87
0.0000
0.5432
0.5413
10587

[95% Conf. Interval]


-4000.494
-89.90695
-8.92796
-1088.265
13.92964
404.8609
-2124.72
-1157.832
.5160009
2.98e-06
-1270.363
-4120.08

515.0039
557.3796
-.1355133
337.3041
74.89826
2844.712
-50.88201
3360.373
.6107519
4.31e-06
3597.153
9881.037

Como puede verse en la salida que sigue, la asignacin del programa en


capacitacin no muestra ningn efecto secundario (spillover) despus de controlar por
otras variables, veamos al utilizar nicamente como variable independientes a las
variables AGE, EDUC y MARR
Source

SS

df

MS

Model
Residual

1.3388e+11
5.1958e+11

4
2670

3.3470e+10
194600040

Total

6.5346e+11

2674

244375675

RE78

Coef.

TREAT
AGE
EDUC
MARR
_cons

-6901.379
176.6396
1900.046
4937.016
-11901.44

Std. Err.
1213.245
27.60029
91.77385
800.0326
1703.792

t
-5.69
6.40
20.70
6.17
-6.99

Number of obs
F( 4, 2670)
Prob > F
R-squared
Adj R-squared
Root MSE

P>|t|
0.000
0.000
0.000
0.000
0.000

=
=
=
=
=
=

2675
171.99
0.0000
0.2049
0.2037
13950

[95% Conf. Interval]


-9280.375
122.5195
1720.091
3368.269
-15242.33

-4522.384
230.7597
2080.001
6505.762
-8560.557

Puede verse que al aplicarse nicamente estas variables el programa resulta


significativo.

LA TCNICA DEL PROPENSITY SCORE MATCHING (EMPAREJAMIENTO


POR PUNTAJE DE PROPENSIN)
La idea bsica detrs del Propensity Score Matching (PSM) es emparejar a cada
participante en un determinado programa con uno idntico y medir el efecto la diferencia
promedio en la variable de resultado entre el participante y no participante..
El comando para estimar en Stata es "pscore", desarrollado por Becker y Ichino
(2002). El comando "pscore" estima el propensy score (puntuacin de la propensin), que
es la probabilidad de obtener un tratamiento para cada individuo, y probar la propiedad
de balanceo, es decir, las observaciones con el mismo PSM que tienen la misma
distribucin de caractersticas observables independientes de la condicin de tratamiento.
Despus hacer el balanceo, se pueden utilizar diferentes comandos para llevar a cabo
diferentes tipos de matching (emparejamiento) y luego obtener el efecto promedio del
tratamiento (ATE).
Modelo Emparejamiento por puntaje de propensin (Modelo probit)
La variable dependiente es si el individuo particip en el programa / tratamiento.
Para tal efecto se ejecuta el siguiente comando:
pscore $treatment $xlist, pscore(myscore) blockid(myblock) comsup
****************************************************
Algorithm to estimate the propensity score
****************************************************

The treatment is TREAT


TREAT

Freq.

Percent

Cum.

0
1

2,490
185

93.08
6.92

93.08
100.00

Total

2,675

100.00

Estimation of the propensity score


Iteration
Iteration
Iteration
Iteration
Iteration
Iteration

0:
1:
2:
3:
4:
5:

log
log
log
log
log
log

likelihood
likelihood
likelihood
likelihood
likelihood
likelihood

=
=
=
=
=
=

-672.64954
-445.24322
-417.65611
-414.43392
-414.37065
-414.37062

Probit regression

Number of obs
LR chi2(3)
Prob > chi2
Pseudo R2

Log likelihood = -414.37062

TREAT

Coef.

AGE
EDUC
MARR
_cons

-.0479858
-.1686459
-1.469566
2.729172

Std. Err.
.0060942
.0192597
.0995124
.3230556

z
-7.87
-8.76
-14.77
8.45

P>|z|
0.000
0.000
0.000
0.000

=
=
=
=

2675
516.56
0.0000
0.3840

[95% Conf. Interval]


-.0599302
-.2063942
-1.664607
2.095994

-.0360415
-.1308977
-1.274526
3.362349

Se puede resumir en el siguiente cuadro para efectos de interpretacin:

Edad
Educacin
Casado (married)

Coeficientes Probit
-0.05
-0.17
-1.47

Interpretacin:

Las personas que son mayores, ms educadas, o casadas tienen menos probabilidades
de recibir capacitacin.
Estamos salvando las puntuaciones de propensin (probabilidades predichas) desde
el modelo probit y el uso de ellos para encontrar resultados para las observaciones
tratadas.
La propiedad de equilibrio (caractersticas similares entre las observaciones tratados
y de control) es satisfecho.

Emparejamiento por Puntaje de Propensin utilizando Matching del Vecino Ms


Prximo
attnd $ylist $treatment $xlist, pscore(myscore) comsup boot reps($breps) dots
ATT estimation with Nearest Neighbor Matching method
(random draw version)
Bootstrapped standard errors

n. treat.

n. contr.

ATT

Std. Err.

185

431

-6715.251

1208.485

-5.557

Note: the numbers of treated and controls refer to actual


nearest neighbour matches

La estimacin attnd con o sin pesos no afecta a los resultados de la variable de


inters. En este ejercicio, attnd los resultados se muestran con los pesos.
Los siguientes resultados muestran que, la capacitacin en un periodo en el
desempeo laboral tiene un impacto negativo sobre el ingreso con el mtodo del vecino
ms cercano (t = -5.557). El tratamiento promedio de los tratados (ATT) sobre el ingreso
en el programa de capacitacin es -6715.251.
Emparejamiento por Puntaje de Propensin utilizando Radio Matching
El comando attr calcula el efecto de tratamiento promedio sobre los tratados
usando el mtodo del radio.
attr $ylist $treatment $xlist, pscore(myscore) comsup boot reps($breps) dots
radius(0.1)
ATT estimation with the Radius Matching method
Bootstrapped standard errors

n. treat.

n. contr.

ATT

Std. Err.

185

2147

-1.33e+04

1629.979

-8.130

Note: the numbers of treated and controls refer to actual


matches within radius

El resultado muestra un impacto decreciente (-13300), (t = -8.130) de la


capacitacin en el programa sobre ingreso.
Emparejamiento por Puntaje de Propensin utilizando Kernel Matching
El commando attk calcula el efecto de tratamiento promedio usando el
emparejamiento basado en la distribucin kernel. La opcion reps active el bootstrapping
5 veces.
attk $ylist $treatment $xlist, pscore(myscore) comsup boot reps($breps) dots

ATT estimation with the Kernel Matching method


Bootstrapped standard errors

n. treat.

n. contr.

ATT

Std. Err.

185

2147

-7009.315

441.523

-15.875

Los resultados son consistentes con los hallazgos anteriores. La capacitacin a los
trabajadores disminuye el ingreso en (-7009.315) con un (t=-15.875).
Emparejamiento por Puntaje de Propensin utilizando Matching Estratificado
El comando atts calcula el efecto tratamiento promedio usando el
emparejamiento de estratificacin. El efecto de tratamiento promedio estimado de la
capacitacin sobre los tratados en el programa sobre el ingreso, se usa el siguiente
comando:
atts $ylist $treatment $xlist, pscore(myscore) blockid(myblock) comsup boot
reps($breps) dots
ATT estimation with the Stratification method
Bootstrapped standard errors

n. treat.

n. contr.

ATT

Std. Err.

184

2148

-6497.605

400.987

-16.204

El resultado muestra una disminucin del ingreso de -6497.605 en el ingreso


debido a la capacitacin.
Mtodo de diferencias en diferencias (Datos de dos periodos-REDIFF)
Para este caso se trabajara de similar manera que el mtodo de diferencia, tomando
en cuenta que se trabajara con datos de dos periodos, es decir en vez de como variable
resultado a RE78 se tendr la variable REDIFF, a continuacin se muestra el cuadro
resumen.

Mtodo de estimacin

Diferencias usando datos


de un periodo (RE78)

T-test
Regresin con dummy
ATET vecino ms prximo
ATET radio matching
ATET kernel matching
ATET matching estratificado

-15,204
-6,901
-6,715
-13,252
-7,009
-6,497

Diferencia en diferencias
usando datos de dos
periodos (REDIFF)
2,327
2,276
2,989
2,215
2,803
2,776

Interpretacin:

Despus de comparar los individuos tratados y de control, los efectos del programa
de formacin redujeron las ganancias por alrededor de $ 6.000 a $ 13.000 en un
periodo. En otras palabras, las personas que recibieron capacitacin ganan menos que
los que no recibieron.

El uso datos de dos periodos (la variable de resultado es la diferencia del antes y
despus de los perodos), los resultados muestran que las personas que recibieron la
capacitacin aumenta sus ingresos por $ 2.000 a $ 3.000.

Referencias bibliogrficas
Baum C.F., Schaffer M.E. y Stillman, S. (2003): Instrumental Variables and
GMM: Estimation and Testing, Stata Journal.
Becker, S. y Andrea Ichino, (2002). "Estimation of average treatment effects
based on propensity scores", Stata Journal.

NDICE
Emparejamiento por Puntaje de Propensin ........................................................................... 1
Descripcin de la muestra de datos de la National Supported Work ................................. 1
Mtodo de diferencias (Datos de un periodo-RE78) ............................................................ 3
Modelo para el tratamiento (t-test)........................................................................................ 6
LA TCNICA DEL PROPENSITY SCORE MATCHING (EMPAREJAMIENTO POR
PUNTAJE DE PROPENSIN) .............................................................................................. 8
Modelo Emparejamiento por puntaje de propensin (Modelo probit) .......................... 8
Emparejamiento por Puntaje de Propensin utilizando Matching del Vecino Ms
Prximo ................................................................................................................................ 9
Emparejamiento por Puntaje de Propensin utilizando Radio Matching ............... 10
Emparejamiento por Puntaje de Propensin utilizando Kernel Matching ............. 10
Emparejamiento por Puntaje de Propensin utilizando Matching Estratificado ... 11
Mtodo de diferencias en diferencias (Datos de dos periodos-REDIFF).......................... 11
Referencias bibliogrficas......................................................................................................... 12

You might also like