Professional Documents
Culture Documents
ENDOGENITAS
I. Pendahuluan
Salah satu asumsi yang perlu dipertahankan agar kita dapat memperoleh
estimator tidak bias dari suatu persamaan regresi dengan OLS adalah tidak
adanya korelasi antara variabel bebas dengan residual, atau Cov(x,u)=0.
Namun demikian dalam praktek empiris asumsi ini sangat mungkin tidak
terpenuhi.
qt = α1 pt + ε t ; α1 > 0 ………………………1)
qt = β1 pt + β 2 yt + vt ; β1 < 0, β 2 > 0 ………………………2)
1
β2 vt − et
pt = yt + = π 11 yt + u1t ………………………3)
α1 − β1 α1 − β1
αβ α v − β1et
qt = 1 2 yt + 1 t = π 21 yt + u2t ………………………4)
α1 − β1 α1 − β1
Jika kita mengestimasi persamaan 1 dengan OLS tanpa memperhatikan
kenyataan bahwa nilainya ditentukan didalam suatu system (persamaan 3
dan 4), maka kita akan memperoleh hasil yang bias. Hal ini dapat dilihat
dari estimator α1 sbb
α1 =
∑ p q = ∑ p (α p + ε ) = ∑ α p
t t t 1 t t 1 t
2
+
∑ pε
t t
∑p 2
t ∑p ∑p 2
t
2
t ∑p 2
t
=α +
∑ pε t t
∑p
1 2 ………………………5)
t
2
dari sisi demand maupun supply maka tidak mungkin bagi kita untuk
memulihkan fungsi demand dan supply dari data ekuilibrium dimaksud.
Jika kita memiliki suatu variabel eksogen pada fungsi supply misalnya
tingkat upah, maka dengan menggunakan nilai berbagai tingkat upah (yang
lain konstan, ceteris paribus) kita dapat mendeteksi fungsi demand. Pada
grafik 1 dapat dilihat peningkatan upah akan menggeser kurva supply keatas
sehingga kita dapat memperoleh kurva demand.
Hal ini dapat digeneralisir untuk suatu system persamaan yang lebih
kompleks (terdiri dari 3 atau lebih variabel endogen). Syarat pertama yang
diperlukan tentunya system ini memenuhi kaidah matematis penyelesaian
system persamaan linear (lihat Chiang & Wright, 2005). Orde condition
selanjutnya dapat ditentukan dengan melihat apakah satu persamaan
3
memiliki jumlah variabel eksogen yang dikeluarkan (excluded) yang sama
dengan atau lebih besar dari pada variabel endogen yang ada disisi sebelah
kanan.
Sebagai contoh misalnya kita akan mengestimasi parameter suatu model IS-
LM, sbb
Y = C (Y ) + I (r ) + G + NX (e)
C = c0 + c1Y
I = αr
………………………5)
NX = β e
M = m1Y + m2 r
r = rf + θ ( e − e)
Y = c0 + c1Y + α r + G + β e ………………………6)
M = m1Y + m2 r ………………………7)
r = rf + θ ( e − e) ………………………8)
Ini adalah suatu system dengan 3 variabel endogen (Y,r dan e) serta 5
variabel eksogen(M, c0,G,rf,dane ). Persamaan 1 adalah teridentifikasi
karena jumlah variabel eksogen yang dikeluarkan yakni e dan rf adalah
sama dengan jumlah variabel endogen disebelah kanan (yakni r dan e).
Persamaan 2 adalah teridentifikasi karena jumlah variabel eksogen yang
dikeluarkan (5 buah) lebih besar dari variabel endogen sisi sebelah kanan (2
buah). Demikian juga persamaan 3, ia adalah identified. Jika order
condition terpenuhi dalam kondisi strict (lebih besar) maka persamaan
disebut dengan overidentified.
4
IV.a. Instrumental Variable (IV)
Misalnya kita akan mengestimasi hubungan antara upah yang diperoleh
(log(wage)) dengan pendidikan (duc) dan variabel kapasitas kerja (abil),
sbb:
Jika educ dan abil tidak berhubungan maka estimator OLS yang diperoleh
adalah tidak bias. Sebaliknya jika kedua variabel ini berhubungan, maka
memasukkan secara eksplisit variabel abil akan menyebabkan estimator
yang diperoleh bersifat bias.
Cov( z , u ) = 0 ……………………11)
Cov( z , x) ≠ 0 ……………………12)
5
σ2
var( β1 ) = ……………………13)
nσ x2 ρ x2, z
dimana sebagai penduga tak bias dari σ2, kita dapat menggunakan residual
kuadrat model semula, atau
1 n 2
σˆ =
2
∑ uˆi ;
n − 2 i =1
……………………14)
Contoh 1
Kita menggunakan data dari Mroz.raw. Disini kita mencoba mengestimasi
hubungan antara tingkat upah (log(wage)) terhadap pendidikan. Terdapat
banyak sekali variabel yang berpengaruh terhadap tingkat upah sehingga
model yang hanya memasukkan variabel pendidikan sebagai penjelas sangat
mungkin sekali mengalami omitted variabel (dan berarti endogenitas).
Untuk mengatasi hal ini kita akan menggunakan variabel pendidikan ayah
sebagai IV bagi educ. Untuk pembanding pertama kita akan melakukan
regresi tanpa IV (hanya OLS), dengan hasil sbb
6
R-squared 0.117883 Mean dependent var 1.190173
Adjusted R-squared 0.115812 S.D. dependent var 0.723198
S.E. of regression 0.680032 Akaike info criterion 2.071309
Sum squared resid 197.0010 Schwarz criterion 2.090276
Log likelihood -441.2600 F-statistic 56.92891
Durbin-Watson stat 1.984707 Prob(F-statistic) 0.000000
7
y1 = β 0 + β1 y2 + β 2 z1 + ... + β k −1 zk −1 + ui ……………………15)
y2 = π 0 + π 1 z1 + π 2 z2 + ... + π k zk + v2 ……………………16)
Sesuai namanya estimasi dengan teknik ini dilakukan dalam dua tahap.
Pertama, kita meregresikan variabel endogen terhadap seluruh variabel
eksogen yang telah ada dan minimal satu variabel eksogen lain. Kedua kita
meregresikan model awal (persamaan 15) dengan fitted value y2 (dari
persamaan 16) sebagai IV. Dengan cara ini maka estimator yang diperoleh
adalah tidak bias dan konsisten. Catatan: dalam praktek kita tidak
melakukan tahap-tahap ini secara manual, prosedur rutin biasanya telah
tersedia pada software statistik (termasuk) Eviews. Pelaksanaan secara
manual akan menghasilkan estimator yang salah.
8
Contoh 2.
Romer (1993) menyusun suatu model inflasi yang menunjukkan bahwa
semakin terbuka suatu negara maka inflasinya akan semakin rendah.
Namun demikian keputusan untuk membuka diri terhadap dunia
internasional juga tergantung seberapa baik kinerja kebijakan khususnya
inflasi. Dengan demikian kita memiliki suatu system persamaan simultan
sbb:
9
menggunakan rutin 2SLS yang ada pada Eviews maka hasil estimasi yang
diperoleh adalah
Salah satu teknik pengujian yang umum digunakan adalah yang diusulkan
oleh Hausman (1978). Pengujian ini dilakukan dengan langkah-langkah
sbb:
10
1. Misalnya kita memiliki model sbb:
y1 = β 0 + β1 y2 + β 2 z1 + ... + β k −1 zk −1 + ui ……………………19)
y2 = π 0 + π 1 z1 + π 2 z2 + ... + π k zk + v2 ……………………20)
Kondisi lain yang sering ditemui dalam penelitian empiris dengan kondisi
endogenitas adalah overidentification. Overidentification terjadi ketika
suatu persamaan memiliki variabel eksogen (yang tidak ada pada
persamaan atau IV) lebih banyak dari variabel endogen disisi sebelah
kanan. Bound, Jaeger dan Baker 9995) menunjukkan penggunaan 2SLS
dalam kondisi seperti ini memungkinkan terjadinya bias. Secara intuitif
penggunaan banyak IV untuk suatu variabel endogen akan meningkatkan
probabilitas variabel endogen tersebut untuk berkorelasi dengan error pada
persamaan strukturalnya.
11
Wooldrige (2005) megusulkan suatu kerangka kerja yang sederhana untuk
menguji hal ini, yakni
nR12 χ q2 ……………………22)
dimana q adalah jumlah variabel eksogen dari luar model (IV) dikurangi
jumlah variabel endogen.
4. Jika nilai statistik uji melebihi nilai kritis pada α=5%, maka kita akan
menolak H0 dan mengatakan bahwa paling tidak ada satu IV yang tidak
eksogen.
Contoh 3.
Dengan menggunakan data Mroz.raw kita akan menguji apakah variabel
educ adalah bersifat endogen. Disini kita akan menggunakan variabel exper,
exper2, motheduc dan fatheduc sebagai IV. Regresi IV akan memberikan
hasil sbb
12
Log likelihood -909.7168 F-statistic 28.36041
Durbin-Watson stat 1.939888 Prob(F-statistic) 0.000000
Kita simpan residual dari regresi ini sebagai variabel v2, dengan
mengetikkan series v2=resid pada command window. Persamaan struktural
yang ingin diestimasi adalah regresi atas log(wage) terhadap educ, exper
dan exper2. Hasil yang diperoleh dengan memasukkan variabel v2 pada
persamaan struktural adalah
Dapat dilihat dari tabel 6 bahwa t statistik adalah sebesar 1.67 dengan p
value 9,5%. Dengan menggunakan α=10%, kita dapat mengatakan bahwa
educ adalah bersifat endogen.
13
Sesuai prosedur yang telah diuraikan diatas, maka hal pertama yang
dilakukan adalah estimasi persamaan structural dengan seluruh IV. Hasil
regresi diberikan sbb:
Dependent Variable: U
Method: Least Squares
Date: 06/30/08 Time: 09:49
Sample: 1 753 IF WAGE<>NA
Included observations: 428
14
Log likelihood -436.7021 F-statistic 0.093496
Durbin-Watson stat 1.946859 Prob(F-statistic) 0.984495
Dapat dilihat pada tabel 8, nilai R12 adalah sebesar 0.0009 sehingga nilai
statistik uji adalah nR12= 428(0.0009)=0.3852. Nilai χ2 dengan df=1 (2 IV-1
variabel endogen) adalah 3.84 dengan demikian hipotesis null seluruh IV
adalah tidak berkorelasi dengan u1 dapat diterima. Penggunaan motheduc
dan fatheduc adalah valid.
15