Professional Documents
Culture Documents
Jazman Ihsanuddin
yappy.benedict@gmail.com penyusun.
Pendahuluan
Dokumen ini adalah bahan yang digunakan dalam pelatihan Modul B - Analisis
Regresi (OLS) . Modul ini mencakup deskripsi ringkas fungsi yang akan digunakan
dalam software, perintah yang digunakan, serta contoh hasil yang diperoleh (bilamana perlu). Dalam paragraf uraian, perintah/command Stata dapat dikenali
dengan format ini, dengan ringkasan perintah baru ditulis di sebelah kanan dan
bagian perintah yang diubah sesuai penggunaan dicetak miring. Contoh output
Stata dapat dikenali seperti startscreen Stata berikut:
Bagi pengguna, perintah help berguna untuk melihat bagaimana suatu command digunakan, dan opsi perintah apa saja yang tersedia, terutama bila fungsi
yang ingin digunakan sudah diketahui. Caranya adalah mengetik help command
(yep, it includes help help!). Informasi lebih lengkap terkait perintah yang
diperkenalkan dalam modul dapat diakses dengan perintah ini.
Modul ini mencakup seluruh silabus pelatihan yang hendak disampaikan. Dengan kata lain, pembaca dapat menguasai materi yang disampaikan dalam pelatihan dengan membaca dan mereplikasi langkah yang ada dalam modul ini. Pembaca
dipersilahkan mengakses materi di http://benconomy.wordpress.com/tutoring,
tanpa mengubah isinya.
help
Daftar Isi
Daftar Isi
1 Pendahuluan
2 Review
2.1 Metode OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Asumsi OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Pengujian Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
3
5
6
8
8
9
10
5 Instrumental Variables
11
6 Specication Test
12
7 Setelah estimasi
7.1 Perintah predict . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Perintah estimates . . . . . . . . . . . . . . . . . . . . . . . . . .
13
13
13
benconomy.wordpress.com
2 Review
2
2.1
Review
Metode OLS
Metode regresi OLS (Ordinary Least Squares) adalah salah satu pendekatan untuk
melakukan estimasi parameter yang menentukan nilai variabel independen. OLS
termasuk keluarga estimasi method of moments, di mana salah satu momen dari
sampel digunakan untuk mengestimasi parameter populasi. Metode regresi dimulai
dari mengspesikasikan fungsi regresi populasi;
yi = 0 + 1 xi + i
(1)
E() = E (y 0 1 x) = 0
(2)
dengan asumsi
dan asumsi yang mengikutinya;
Cov(x, ) = E(x) = E [x (y 0 1 x)] = 0
(3)
(yi 0 1 xi ) = 0
(4)
[xi (yi 0 1 xi )] = 0
(5)
i=1
dan
n1
i=1
n [
(
(
)
)]
xi yi y 1 x + 1 xi = 0
(7)
i=1
i=1
benconomy.wordpress.com
xi (y y) = 1
xi (xi x)
i=1
2 Review
Dengan menyusun ulang* ;
n
1 =
i=1
n
xi (yi y)
=
xi (xi x)
i=1
i=1
(xi x) (yi y)
n
=
(xi x)
Cov(x, y)
Var(x)
(8)
i=1
Dalam kasus multivariabel, maka lebih dari satu variabel independen masuk
dalam persamaan (1):
yi = 0 + 1 x1i + 2 x2i + + j xji + i
Persamaan di atas dapat ditulis dalam bentuk matriks:
y1
0 (1) 1 x11 2 x12 . . . j x1j
1
y2 0 (1) 1 x21 2 x22 . . . j x2j 2
+ .
.. = ..
..
..
.
.
..
..
. .
..
.
.
yn
0 (1) 1 xn1 2 xn2 . . . j xnj
n
(9)
y = X +
(10)
b = (X X) (X y)
(11)
benconomy.wordpress.com
2 Review
2.2
Asumsi OLS
Dalam regresi, parameter estimasi perlu memenuhi kriteria yang sering disingkat
BLUE, yaitu Best (parameter estimasi meminimumkan varians (kuadrat) error),
Linear (persamaan yang diestimasi bersifat linear), Unbiased (parameter estimasi
tidak bias) dan Estimator (parameter adalah estimator yang baik untuk parameter
populasi). Estimator yang tidak bias dan konsisten berarti parameter sesuai dengan
parameter populasi dan semakin dekat dengan parameter populasi ketika sampel
ditambah (plim = )
Berikut rangkuman denisi yang lebih formal dari asumsi OLS:
OLS 1 Parameter bersifat linear. yi = 0 + 1 x1 + + j xj
Dengan kata lain, parameter model populasi tidak dapat bersifat
bersifat non-linear, seperti x1 1 atau 1 x1 2 x2 .
OLS 2 Random Sampling
Data yang diambil adalah sampel yang diambil secara random dari
populasi yang hendak dipelajari.
OLS 3 Corr(x1 , x2 , . . . , xj ) = 1
Tidak adanya multikolinearitas sempurna antara variabel independen.
OLS 4 Variasi dalam sampel.
Nilai sampel tidak konstan (hanya satu nilai) untuk satu variabel.
Asumsi ini adalah implikasi asumsi sebelumnya.
OLS 5 E(|x) = 0 (zero conditional mean)
Nilai error yang diekspektasikan bernilai 0 untuk semua nilai x.
Implikasinya adalah (1) korelasi x dan adalah 0 dan (2) E(y|x) =
y. Asumsi ini adalah dasar pendekatan moment of method yang
digunakan dalam persamaan (2) dan (3).
OLS 6 Corr(i , j ) = 0
Tidak ada korelasi antar error dalam seluruh sampel.
OLS 7 Var(i ) = 2
Varians error tidak berubah/konstan untuk semua nilai xj .
benconomy.wordpress.com
2 Review
Data/model yang tidak memenuhi asumsi tersebut akan mengakibatkan parameter yang diestimasi tidak memenuhi kriteria BLUE. Karena itu, dibutuhkan
(1) teknik deteksi pelanggaran asumsi tersebut untuk mengetahui adanya estimasi
yang tidak konsisten dan (2) teknik estimasi yang mampu mengkoreksi pelanggaran yang terjadi untuk menghasilkan estimasi yang tetap konsisten dan esien.
Teknik-teknik lain yang menggunakan metode least square ada untuk mengatasi
adanya pelanggaran asumsi OLS tersebut.
2.3
Pengujian Hipotesis
Sebagai bagian dari teknik statistik, ekonometrika tidak lepas dari pengujian hipotesis. Pengujian statistik selalu menyajikan dua hipotesis yang bersifat eksklusif dan
lengkap:
H0 : a
H1 : a
Pada umumnya, peneliti ingin menolak H0 . Perhitungan yang dilakukan akan
menghasilkanw suatu ukuran tes (test statistic), seperti nilai z atau t. Statistik ini
digunakan untuk melihat apakah peneliti akan menolak H0 (menerima H1 ) atau
gagal menolak (menerima) H0 . Dalam pengujian statistik yang melibatkan proses
inference, selalu terdapat dua kemungkinan kesalahan:
Type 1 error Menolak H0 ketika H0 benar (disebut juga false positive).
Contohnya: (1) Mendiagnosa orang sehat mengalami infeksi; (2) Membuang
produk yang sebenarnya memenuhi standar kualitas.
Type 2 error Menerima H0 ketika H0 tidak benar (disebut juga false negative).
Contohnya: (1) Mendiagnosa orang sakit tidak mengalami infeksi; (2) Menerima/meluluskan produk yang sebenarnya tidak memenuhi standar kualitas.
Nilai berbagai statistik pengujian dapat digunakan untuk menghitung p-value,
yang dapat dikatakan mengukur kemungkinan terjadinya Type 1 error. Dalam
ekonometrika, pengujian yang sering dilakukan adalah melihat apakah suatu model/
variabel independen signikan menjelaskan variabel dependen. Jadi, dalam pengujian signikansi, p-value mengukur peluang menyatakan bahwa model/variabel
independen tersebut tidak signikan ketika model/variabel independen tersebut
signikan. p-value dapat langsung dibandingkan dengan condence interval (yang
seyogianya telah ditetapkan secara a-priori) untuk memutuskan apakah suatu
model/variabel independen signikan (H1 ) atau tidak signikan (H0 ).
benconomy.wordpress.com
Dapat dikatakan seperti Swiss Army Knife pemodelan, regresi OLS digunakan
secara paling luas dan menjadi alat paling mendasar dalam berbagai aplikasi pemodelan ekonomi. Sintaks perintah regresi OLS di Stata adalah sebagai berikut:
regress depvarname indepvarlist
Perhatikan bahwa variabel yang pertama disebut adalah (satu) variabel independen (y), sedangkan variabel-variabel yang disebut berikutnya adalah variabelvariabel independent (x1 , x2 , . . . , xj ) dalam model persamaan yang hendak diestimasi. Berikut adalah contoh perintah dan output regresi dalam Stata dan panduan
interpretasinya.
A Bagian ini adalah global test untuk signikansi model (apakah variasi dalam
model dapat menjelaskan variasi dalam variabel dependen - joint test). Dua
statistik yang dilaporkan adalah statistik F dan p-value-nya.
B Bagian ini melaporkan goodness of t dari model, yaitu berapa persen
variasi dalam variabel dependen dapat dijelaskan oleh model, yaitu R2 dan
2
2
Radj
. Radj
mengkoreksi bias positif pada R2 akibat penambahan variabel
independen.
C Konstanta (0 ). Stata dapat mencegah adanya konstanta, dengan cara menambahkan opsi noconstant (tidak dianjurkan karena akan membuat estimator
menjadi tidak konsisten).
D Koesien parameter estimasi j untuk masing-masing variabel independen
xj . Bagian ini dapat diinterpretasikan: Bertambahnya 1 unit weight menyebabkan kenaikan 5.774712 dalam price.
benconomy.wordpress.com
regress
4
4.1
Deteksi Terdapat dua metode statistik untuk mendeteksi heteroskedasitas setelah suatu model regresi diestimasi:
Breuch-Pagan Tes ini melakukan regresi OLS dengan 2 sebagai variabel dependen dan tted values model sebagai variabel independen. Untuk menggunakan seluruh variabel independen dari model utama sebagai variabel independen, tambahkan opsi rhs. Metode ini mampu mendeteksi heteroskedasitas yang bersifat linear. Perintah untuk melakukan BP-test adalah estat
hettest. Hasil yang dilaporkan adalah LM test-statistic yang mengikuti distribusi 2 dan p-valuenya.
White Tes ini melakukan regresi OLS dengan varepsilon2 sebagai variabel dependen dan seluruh variabel independen, kuadrat dan hasil perkaliannya dari
model utama sebagai variabel independen. Dengan demikian, metode ini
mampu mendeteksi heteroskedasitas dalam bentuk yang lebih kompleks. Perintah untuk melakukan White test adalah estat imtest, white. Hasil
yang dilaporkan termasuk LM test-statistic yang mengikuti distribusi 2 dan
p-valuenya.
Metode gras untuk mendeteksi heteroskedasitas adalah dengan melakukan plot
error (variabel y) dan salah satu variabel independen (variabel x), yang dapat
dilakukan dengan perintah rvpplot varname.
benconomy.wordpress.com
hettest
imtest
rvpplot
aweight
robust
4.2
Autokorelasi
Autokorelasi adalah adanya hubungan antara error satu observasi dengan error
observasi lainnya. Autokorelasi umumnya lebih umum terjadi pada data time series, di mana terjadi antara error suatu periode (t ) dengan error periode lainnya
(t1 , t2 , . . .). Autokorelasi dapat menyebabkan parameter estimasi menjadi bias,
sehingga harus ditangani.
Deteksi Untuk mendeteksi adanya autokorelasi secara gras, Stata menyediakan dua perintah:
corrgram varname
ac varname
Tambahkan opsi lags(#) untuk menampilkan autokorelasi sebanyak # lag.
Terdapat dua metode statistik untuk mendeteksi adanya autokorelasi.
corrgram
ac
dwatson
durbinalt
bgodfrey
4.3
prais
newey
Multikolinearitas
10
vif
Instrumental Variables
Instrumental Variables
11
ivregress
Specication Test
Specication Test
Pengujian spesikasi adalah salah satu topik paling penting dalam pemodelan, di
mana spesikasi persamaan regresi diuji untuk mendapatkan fungsi regresi populasi
yang sedekat mungkin dengan fungsi asli. Teori yang dipelajari melalui pemodelan sering memberi usul mengenai bentuk persamaan model secara a priori, yang
tidak selalu didukung dengan temuan parameter estimasi. Hal ini membuat pengujian spesikasi menjadi penting: Data dapat mengusulkan temuan yang berbeda
dengan teori, atau memperlihatkan bahwa teori tersebut benar atau tidak. Mendapat informasi yang tepat dari data adalah tujuan dari pengujian spesikasi:
Apakah suatu variabel signikan dalam model, bagaimana seharusnya suatu variabel dispesikasikan dalam model (linear, logaritma, dlsb.), dan apakah perlu ditambahkan variabel independen lainnya ke dalam model.
Dua hal perlu diperhatikan dalam pengujian spesikasi. Pertama, adanya variabel yang redundant atau tidak signikan tidak akan parameter estimasi menjadi
bias, namun akan mengurangi degrees of freedom dan esiensi model. Kedua,
adanya variabel yang signikan namun tidak dimasukkan dalam suatu model akan
membuat parameter menjadi bias. Bias memiliki pengaruh yang lebih merusak
dibandingkan inesiensi. Hal ini menunjukkan pentingnya pengujian spesikasi
ynag dilakukan secara benar.
Metode formal uji spesikasi cukup luas, termasuk pengujian manual seperti
dalam metode Mizon dan Richard (1986) atau Davidson MacKinnon J Test
(1981) untuk non-nested model dan metode Ramsey Regression Error Specication
Test (RESET) . Stata memiliki command untuk melakukan pengujian Ramsey
RESET, dengan perintah sebagai berikut:
estat ovtest
ovtest adalah singkatan untuk ommited variable test. Perintah ini dapat dilakukan setelah estimasi OLS. Bila kita ingin menggunakan polinomial dari variabel independen (bukan hanya tted values variabel dependen), tambahkan opsi
rhs.
Masukkan berbagai bentuk spesikasi fungsional dari variabel yang sama ke dalam model, dan
uji menggunakan Wald test apakah koesien untuk masing-masing kelompok spesikasi apakah
koesionnya sama dengan 0.
Untuk mempelajari bentuk fungsional spesikasi A dan B, lakukan estimasi untuk kedua
persamaan tersebut, dan diambil error masing-masing persamaan. Ambil persamaan dari satu
model (misal model A) dan masukkan ke model satunya (Model B) sebagai variabel independen.
Lakukan regresi model satunya tersebut dengan error. Bila koesion error model A dalam model
B tersebut tidak signikan, model A telah dispesikasikan dengan benar. Prosedur yang sama
dilakukan untuk model B.
Mengambil polinomial dari tted values dan memasukkannya ke dalam model utama. Bila
polinomial model utama signikan, maka model tersebut mengandung omitted variables.
benconomy.wordpress.com
12
ovtest
7
7.1
Setelah estimasi
Setelah estimasi
Perintah predict
Perintah predict berguna untuk membuat prediksi dari estimasi yang telah dilakukan, baik prediksi tted values, residual, dan lainnya. Berikut sintaks perintah
tersebut.
predict varname, options
Hasil perintah tersebut dimasukkan dalam variabel baru (varname) yang dispesikasikan. Nilai yang dapat diprediksi dispesikasikan dalam options:
predict
7.2
Perintah estimates
13
estimates
Setelah estimasi
benconomy.wordpress.com
14