You are on page 1of 14

Pelatihan Komputasi dengan Stata

Modul B - Analisis Regresi (OLS)


Benedict J. Yappy1

Jazman Ihsanuddin

Departemen Ilmu Ekonomi


Universitas Indonesia
1

yappy.benedict@gmail.com penyusun.

Pendahuluan

Dokumen ini adalah bahan yang digunakan dalam pelatihan Modul B - Analisis
Regresi (OLS) . Modul ini mencakup deskripsi ringkas fungsi yang akan digunakan
dalam software, perintah yang digunakan, serta contoh hasil yang diperoleh (bilamana perlu). Dalam paragraf uraian, perintah/command Stata dapat dikenali
dengan format ini, dengan ringkasan perintah baru ditulis di sebelah kanan dan
bagian perintah yang diubah sesuai penggunaan dicetak miring. Contoh output
Stata dapat dikenali seperti startscreen Stata berikut:

Bagi pengguna, perintah help berguna untuk melihat bagaimana suatu command digunakan, dan opsi perintah apa saja yang tersedia, terutama bila fungsi
yang ingin digunakan sudah diketahui. Caranya adalah mengetik help command
(yep, it includes help help!). Informasi lebih lengkap terkait perintah yang
diperkenalkan dalam modul dapat diakses dengan perintah ini.
Modul ini mencakup seluruh silabus pelatihan yang hendak disampaikan. Dengan kata lain, pembaca dapat menguasai materi yang disampaikan dalam pelatihan dengan membaca dan mereplikasi langkah yang ada dalam modul ini. Pembaca
dipersilahkan mengakses materi di http://benconomy.wordpress.com/tutoring,
tanpa mengubah isinya.

Powered by LATEX 2 with XLATEX using TEXstudio and Stata.

help

Daftar Isi

Daftar Isi
1 Pendahuluan

2 Review
2.1 Metode OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Asumsi OLS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Pengujian Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . .

3
3
5
6

3 Regresi OLS dengan Stata

4 Penanganan Pelanggaran Asumsi


4.1 Heteroskedasitas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Autokorelasi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Multikolinearitas . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8
8
9
10

5 Instrumental Variables

11

6 Specication Test

12

7 Setelah estimasi
7.1 Perintah predict . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Perintah estimates . . . . . . . . . . . . . . . . . . . . . . . . . .

13
13
13

benconomy.wordpress.com

2 Review

2
2.1

Review
Metode OLS

Metode regresi OLS (Ordinary Least Squares) adalah salah satu pendekatan untuk
melakukan estimasi parameter yang menentukan nilai variabel independen. OLS
termasuk keluarga estimasi method of moments, di mana salah satu momen dari
sampel digunakan untuk mengestimasi parameter populasi. Metode regresi dimulai
dari mengspesikasikan fungsi regresi populasi;
yi = 0 + 1 xi + i

(1)

E() = E (y 0 1 x) = 0

(2)

dengan asumsi
dan asumsi yang mengikutinya;
Cov(x, ) = E(x) = E [x (y 0 1 x)] = 0

(3)

Dalam pendekatan method of moments, kita menggunakan nilai (rata-rata)


sampel untuk mengestimasi nilai populasi, sehingga persamaan (2) dan (3) menjadi:
n1

(yi 0 1 xi ) = 0

(4)

[xi (yi 0 1 xi )] = 0

(5)

i=1

dan
n1

i=1

Dengan menggunakan sifat operator


dan memindahkan ruas, persamaan (4)
dapat ditulis ulang menjadi:
0 = y 1 x
(6)
Dengan memindahkan (6) ke persamaan (5) dan menghilangkan n1 yang tidak
mempengaruhi hasilnya, kita dapat memperoleh:
n

n [
(
(
)
)]

xi yi y 1 x + 1 xi = 0

(7)

i=1

Atur ulang persamaan tersebut, kita memperoleh:


n

i=1

benconomy.wordpress.com

xi (y y) = 1

xi (xi x)

i=1

2 Review
Dengan menyusun ulang* ;
n

1 =

i=1
n

xi (yi y)
=
xi (xi x)

i=1

i=1

(xi x) (yi y)
n

=
(xi x)

Cov(x, y)
Var(x)

(8)

i=1

Dalam kasus multivariabel, maka lebih dari satu variabel independen masuk
dalam persamaan (1):
yi = 0 + 1 x1i + 2 x2i + + j xji + i
Persamaan di atas dapat ditulis dalam bentuk matriks:


y1
0 (1) 1 x11 2 x12 . . . j x1j
1
y2 0 (1) 1 x21 2 x22 . . . j x2j 2


+ .
.. = ..
..
..
.
.
..
..
. .
..
.
.
yn
0 (1) 1 xn1 2 xn2 . . . j xnj
n
(9)

y = X +

Vektor parameter yang diestimasi adalah vektor yang akan meminimumkan


jumlah kuadrat error . Berikut vektor vektor parameter sampel b yang meminimumkan error kuadrat sampel e e:
Min e e = (y Xb) (y Xb)
= y y b X y y Xb + b X Xb
= y y 2y Xb + b X Xb

(10)

Keadaan yang meminimumkan error adalah:


e e
= 2X y + 2X Xb = 0
b
2X y = 2X Xb
1

b = (X X) (X y)

(11)

Penurunan yang diuraikan di sini mengikuti method of moments.


Penurunan yang diuraikan di sini mengikuti metode Least Squares, yang identik dengan
estimator method of moments (dan juga maximum likelihood)

benconomy.wordpress.com

2 Review

2.2

Asumsi OLS

Dalam regresi, parameter estimasi perlu memenuhi kriteria yang sering disingkat
BLUE, yaitu Best (parameter estimasi meminimumkan varians (kuadrat) error),
Linear (persamaan yang diestimasi bersifat linear), Unbiased (parameter estimasi
tidak bias) dan Estimator (parameter adalah estimator yang baik untuk parameter
populasi). Estimator yang tidak bias dan konsisten berarti parameter sesuai dengan
parameter populasi dan semakin dekat dengan parameter populasi ketika sampel
ditambah (plim = )
Berikut rangkuman denisi yang lebih formal dari asumsi OLS:
OLS 1 Parameter bersifat linear. yi = 0 + 1 x1 + + j xj
Dengan kata lain, parameter model populasi tidak dapat bersifat
bersifat non-linear, seperti x1 1 atau 1 x1 2 x2 .
OLS 2 Random Sampling
Data yang diambil adalah sampel yang diambil secara random dari
populasi yang hendak dipelajari.
OLS 3 Corr(x1 , x2 , . . . , xj ) = 1
Tidak adanya multikolinearitas sempurna antara variabel independen.
OLS 4 Variasi dalam sampel.
Nilai sampel tidak konstan (hanya satu nilai) untuk satu variabel.
Asumsi ini adalah implikasi asumsi sebelumnya.
OLS 5 E(|x) = 0 (zero conditional mean)
Nilai error yang diekspektasikan bernilai 0 untuk semua nilai x.
Implikasinya adalah (1) korelasi x dan adalah 0 dan (2) E(y|x) =
y. Asumsi ini adalah dasar pendekatan moment of method yang
digunakan dalam persamaan (2) dan (3).
OLS 6 Corr(i , j ) = 0
Tidak ada korelasi antar error dalam seluruh sampel.
OLS 7 Var(i ) = 2
Varians error tidak berubah/konstan untuk semua nilai xj .
benconomy.wordpress.com

2 Review
Data/model yang tidak memenuhi asumsi tersebut akan mengakibatkan parameter yang diestimasi tidak memenuhi kriteria BLUE. Karena itu, dibutuhkan
(1) teknik deteksi pelanggaran asumsi tersebut untuk mengetahui adanya estimasi
yang tidak konsisten dan (2) teknik estimasi yang mampu mengkoreksi pelanggaran yang terjadi untuk menghasilkan estimasi yang tetap konsisten dan esien.
Teknik-teknik lain yang menggunakan metode least square ada untuk mengatasi
adanya pelanggaran asumsi OLS tersebut.

2.3

Pengujian Hipotesis

Sebagai bagian dari teknik statistik, ekonometrika tidak lepas dari pengujian hipotesis. Pengujian statistik selalu menyajikan dua hipotesis yang bersifat eksklusif dan
lengkap:
H0 : a
H1 : a
Pada umumnya, peneliti ingin menolak H0 . Perhitungan yang dilakukan akan
menghasilkanw suatu ukuran tes (test statistic), seperti nilai z atau t. Statistik ini
digunakan untuk melihat apakah peneliti akan menolak H0 (menerima H1 ) atau
gagal menolak (menerima) H0 . Dalam pengujian statistik yang melibatkan proses
inference, selalu terdapat dua kemungkinan kesalahan:
Type 1 error Menolak H0 ketika H0 benar (disebut juga false positive).
Contohnya: (1) Mendiagnosa orang sehat mengalami infeksi; (2) Membuang
produk yang sebenarnya memenuhi standar kualitas.
Type 2 error Menerima H0 ketika H0 tidak benar (disebut juga false negative).
Contohnya: (1) Mendiagnosa orang sakit tidak mengalami infeksi; (2) Menerima/meluluskan produk yang sebenarnya tidak memenuhi standar kualitas.
Nilai berbagai statistik pengujian dapat digunakan untuk menghitung p-value,
yang dapat dikatakan mengukur kemungkinan terjadinya Type 1 error. Dalam
ekonometrika, pengujian yang sering dilakukan adalah melihat apakah suatu model/
variabel independen signikan menjelaskan variabel dependen. Jadi, dalam pengujian signikansi, p-value mengukur peluang menyatakan bahwa model/variabel
independen tersebut tidak signikan ketika model/variabel independen tersebut
signikan. p-value dapat langsung dibandingkan dengan condence interval (yang
seyogianya telah ditetapkan secara a-priori) untuk memutuskan apakah suatu
model/variabel independen signikan (H1 ) atau tidak signikan (H0 ).

benconomy.wordpress.com

Regresi OLS dengan Stata

Regresi OLS dengan Stata

Dapat dikatakan seperti Swiss Army Knife pemodelan, regresi OLS digunakan
secara paling luas dan menjadi alat paling mendasar dalam berbagai aplikasi pemodelan ekonomi. Sintaks perintah regresi OLS di Stata adalah sebagai berikut:
regress depvarname indepvarlist
Perhatikan bahwa variabel yang pertama disebut adalah (satu) variabel independen (y), sedangkan variabel-variabel yang disebut berikutnya adalah variabelvariabel independent (x1 , x2 , . . . , xj ) dalam model persamaan yang hendak diestimasi. Berikut adalah contoh perintah dan output regresi dalam Stata dan panduan
interpretasinya.

A Bagian ini adalah global test untuk signikansi model (apakah variasi dalam
model dapat menjelaskan variasi dalam variabel dependen - joint test). Dua
statistik yang dilaporkan adalah statistik F dan p-value-nya.
B Bagian ini melaporkan goodness of t dari model, yaitu berapa persen
variasi dalam variabel dependen dapat dijelaskan oleh model, yaitu R2 dan
2
2
Radj
. Radj
mengkoreksi bias positif pada R2 akibat penambahan variabel
independen.
C Konstanta (0 ). Stata dapat mencegah adanya konstanta, dengan cara menambahkan opsi noconstant (tidak dianjurkan karena akan membuat estimator
menjadi tidak konsisten).
D Koesien parameter estimasi j untuk masing-masing variabel independen
xj . Bagian ini dapat diinterpretasikan: Bertambahnya 1 unit weight menyebabkan kenaikan 5.774712 dalam price.
benconomy.wordpress.com

regress

Penanganan Pelanggaran Asumsi

E Standar error parameter estimasi sd(j ).


F Statistik t untuk masing-masing variabel independen. Statistik t dihitung
dari j /sd(j ).
G p-value untuk menguji signikansi masing-masing variabel.
H Range masing-masing parameter estimasi dalam rentang condence interval.
Level yang dilaporkan dapat diatur dengan menambahkan opsi level()

4
4.1

Penanganan Pelanggaran Asumsi


Heteroskedasitas

Heteroskedasitas adalah keadaan ketika varians error berubah seiring perubahan


nilai variabel independen xj . Heteroskedasitas umumnya tidak menyebabkan indikator menjadi bias, namun menyebabkan kesalahan dalam perhitungan standar
error, yang menurunkan esiensi model.

Deteksi Terdapat dua metode statistik untuk mendeteksi heteroskedasitas setelah suatu model regresi diestimasi:
Breuch-Pagan Tes ini melakukan regresi OLS dengan 2 sebagai variabel dependen dan tted values model sebagai variabel independen. Untuk menggunakan seluruh variabel independen dari model utama sebagai variabel independen, tambahkan opsi rhs. Metode ini mampu mendeteksi heteroskedasitas yang bersifat linear. Perintah untuk melakukan BP-test adalah estat
hettest. Hasil yang dilaporkan adalah LM test-statistic yang mengikuti distribusi 2 dan p-valuenya.
White Tes ini melakukan regresi OLS dengan varepsilon2 sebagai variabel dependen dan seluruh variabel independen, kuadrat dan hasil perkaliannya dari
model utama sebagai variabel independen. Dengan demikian, metode ini
mampu mendeteksi heteroskedasitas dalam bentuk yang lebih kompleks. Perintah untuk melakukan White test adalah estat imtest, white. Hasil
yang dilaporkan termasuk LM test-statistic yang mengikuti distribusi 2 dan
p-valuenya.
Metode gras untuk mendeteksi heteroskedasitas adalah dengan melakukan plot
error (variabel y) dan salah satu variabel independen (variabel x), yang dapat
dilakukan dengan perintah rvpplot varname.

benconomy.wordpress.com

hettest

imtest

rvpplot

Penanganan Pelanggaran Asumsi

Koreksi Terdapat dua metode statistik untuk menangani heteroskedasitas.


weight Penggunaan weights (timbangan) untuk menormalkan efek variabel yang
menyebabkan heteroskedasitas. Contohnya, varians error adalah linear dari
suatu variabel (Var() = 2 = x2 ), sehingga perlu timbangan 1/x22 menghilangkan korelasi antara x2 dengan . Untuk menggunakan koreksi ini, tambahkan [aweight=varlist] di akhir command, sebelum tanda koma. Perintah untuk contoh sebulumnya:
gen invdepvar2sq=1/depvar22
regress indepvar depvar1 depvar2 [aweight=invdepvar2sq]

aweight

robust Tambahkan opsi robust setelah perintah estimasi untuk menggunakan


standard error yang mampu menangani adanya heteroskedasitas (heteroskedascity robust). Contoh:
regress indepvar depvar1 depvar2, robust

robust

Kedua metode tersebut dapat dikombinasikan. Bila variabel yang menyebabkan


heteroskedasitas tersebut diketahui, variabel tersebut dapat ditransformasikan bila
dimungkinkan oleh teori yang mendasari spesikasi model.

4.2

Autokorelasi

Autokorelasi adalah adanya hubungan antara error satu observasi dengan error
observasi lainnya. Autokorelasi umumnya lebih umum terjadi pada data time series, di mana terjadi antara error suatu periode (t ) dengan error periode lainnya
(t1 , t2 , . . .). Autokorelasi dapat menyebabkan parameter estimasi menjadi bias,
sehingga harus ditangani.

Deteksi Untuk mendeteksi adanya autokorelasi secara gras, Stata menyediakan dua perintah:
corrgram varname
ac varname
Tambahkan opsi lags(#) untuk menampilkan autokorelasi sebanyak # lag.
Terdapat dua metode statistik untuk mendeteksi adanya autokorelasi.

corrgram
ac

Durbin-Watson Pengujian Durbin-Watson hanya dapat mendeteksi autokorelasi


dengan lag 1 error (t1 ). Statistik Durbin Watson berada di antara 0-4.
Nilai dekat 0 mengindikasikan autokorelasi positif, sedangkan nilai dekat
4 mengindikasikan autokorelasi negatif. Dengan demikian, nilai dekat 2
mengindikasikan tidak adanya autokorelasi. Perintah untuk menampilkan
statistik Durbin-Watson di Stata adalah estat dwatson. Pengembangan uji
Durbin menghasilkan estat durbinalt yang memungkinkan uji hipotesis.
benconomy.wordpress.com

dwatson
durbinalt

Penanganan Pelanggaran Asumsi

Tambahkan opsi lags(numlist) untuk menspesikasikan lag autokorelasi


yang diuji.
Breuch-Godfrey Tes Breuch-Godfrey dilakukan dengan melakukan regresi error
terhadap error lag periode yang dispesikasikan. Perintah untuk BG test di
Stata adalah sebagai berikut:
estat bgodfrey, lags(numlist)
di mana numlist adalah lag-lag yang ingin diuji (dapat lebih dari satu).
Pengujian sebanyak lebih dari 1 lag periode dilakukan secara terpisah.

bgodfrey

Koreksi Koreksi untuk masalah autokorelasi sebaiknya dilakukan mengubah


spesikasi model, atau menggunakan metode time series (bukan hanya OLS),
seperti penambahan lag variabel dependen ke dalam model (model AR). Walau
demikian, terdapat dua metode OLS yang mampu menangani autokorelasi. Pertama, menggunakan transformasi Cochrane-Orkutt dengan perintah sebagai berikut:
prais depvar indepvarlist, corc
Perintah ini memiliki berbagai opsi dan pendekatan lain untuk menangani autokorelasi yang dapat dieksplorasi lebih lanjut. Kedua, menggunakan standar error
Newey-West yang robust terhadap autokorelasi (dan heteroskedasitas) dengan perintah sebagai berikut:
newey depvar indepvarlist, lag(#)
Perintah ini memungkinkan penanganan lags dengan order yang lebih tinggi. Lags
maksimum yang digunakan dalam model dapat dispesikasikan menggunakan opsi
lags(#)

4.3

prais

newey

Multikolinearitas

Multikolinearitas adalah adanya kombinasi linear korelasi antara variabel-variabel


independen, yang menyebabkan adanya korelasi. Kolinearitas antara dua variabel
independen dapat dilihat secara gras dengan menggunakan perintah
graph matrix varlist.
Dalam Stata, statistik untuk mendeteksi multikolinearitas dapat ditampilkan
dengan perintah estat vif. Nilai Mean VIF yang lebih dari 10 dapat dikatakan
mengindikasikan adanya kolinearitas. Namun, tidak terdapat batasan yang denitif
mengenai statistik ini untuk menguji hipotesis secara statistik.
Secara matematis, tidak mungkin melakukan estimasi OLS bila terdapat satu
variabel independen yang adalah gabungan dari satu atau lebih variabel independen
lain. Dalam sebagian besar kasus, multikolinearitas umumnya tidak menyebabkan
masalah estimasi. Bahkan, sulit untuk menemukan variabel-variabel independen
yang tidak berkorelasi (terutama untuk data time series). Multikolinearitas mulai menjadi masalah bila terdapat variabel yang benar-benar bergerak bersama
benconomy.wordpress.com

10

vif

Instrumental Variables

(korelasi >90%). Hal ini dapat menyebabkan variabel-variabel yang mengalami


kolinearitas secara bersama-sama tidak signikan, sedangkan sebenarnya berpengaruh terhadap variabel dependen (signikan secara joint test). Kolinearitas akan
hilang dengan mengeluarkan variabel yang ber-kolinear dari model. Namun, hal
tersebut dapat menyebabkan omitted variabel bias yang serius. Tidak terdapat
metode yang denitif untuk menangani multikolinearitas, sehingga menjadi kebijakan peneliti untuk memutuskan variabel yang tetap dimasukkan dalam model
bilamana terjadi multikolinearitas.

Instrumental Variables

Penggunakan Instrumental Variables (berikutnya disebut IV) dalam regresi adalah


salah satu teknik untuk menangani pelanggaran asumsi adanya korelasi antara
satu atau lebih variabel independen dengan error term . Dimulai dari spesikasi
persamaan utama;
yi = 0 + 1 x1i + + j xji + k xki + + m xmi + i
di mana variabel-variabel k xki + + m xmi berkorelasi dengan error;
Corr ((xk , . . . , xm ) , i ) = 0
Pelanggaran ini akan menyebabkan estimator yang bias dan tidak konsisten. Pengujian dapat dilakukan dengan cara regresi dengan menggunakan error dari model
utama sebagai variabel dependen.
Untuk mengatasi masalah bias yang ditimbulkan, diperlukan adanya variabel
z1 , z2 , . . . , zv yang berkorelasi dengan variabel yang bermasalah dan tidak berkorelasi dengan error untuk dijadikan IV untuk variabel yang bermasalah tersebut.
Dengan demikian, variabel independen dalam model tidak lagi berkorelasi dengan
error, sehingga dapat dihasilkan parameter yang konsisten.
Perintah untuk menerapkan regresi dengan IV adalah:
ivregress method depvar indepvarlist (indepvarlist2 = ivvarlist)
method adalah cara melakukan estimasi dengan IV. 3 metode yang dapat dipilih
adalah 2SLS, liml dan gmm.
depvar adalah variabel independen yang diestimasi.
indepvarlist adalah variabel-variabel independen yang tidak mengalami masalah
korelasi dengan error.
indepvarlist2 adalah variabel-variabel independen yang mengalami masalah korelasi dengan error, sehingga dicarikan variabel instrumen.
ivvarlist adalah variabel-variabel yang dijadikan Instrumental Variable.
benconomy.wordpress.com

11

ivregress

Specication Test

Specication Test

Pengujian spesikasi adalah salah satu topik paling penting dalam pemodelan, di
mana spesikasi persamaan regresi diuji untuk mendapatkan fungsi regresi populasi
yang sedekat mungkin dengan fungsi asli. Teori yang dipelajari melalui pemodelan sering memberi usul mengenai bentuk persamaan model secara a priori, yang
tidak selalu didukung dengan temuan parameter estimasi. Hal ini membuat pengujian spesikasi menjadi penting: Data dapat mengusulkan temuan yang berbeda
dengan teori, atau memperlihatkan bahwa teori tersebut benar atau tidak. Mendapat informasi yang tepat dari data adalah tujuan dari pengujian spesikasi:
Apakah suatu variabel signikan dalam model, bagaimana seharusnya suatu variabel dispesikasikan dalam model (linear, logaritma, dlsb.), dan apakah perlu ditambahkan variabel independen lainnya ke dalam model.
Dua hal perlu diperhatikan dalam pengujian spesikasi. Pertama, adanya variabel yang redundant atau tidak signikan tidak akan parameter estimasi menjadi
bias, namun akan mengurangi degrees of freedom dan esiensi model. Kedua,
adanya variabel yang signikan namun tidak dimasukkan dalam suatu model akan
membuat parameter menjadi bias. Bias memiliki pengaruh yang lebih merusak
dibandingkan inesiensi. Hal ini menunjukkan pentingnya pengujian spesikasi
ynag dilakukan secara benar.
Metode formal uji spesikasi cukup luas, termasuk pengujian manual seperti
dalam metode Mizon dan Richard (1986) atau Davidson MacKinnon J Test
(1981) untuk non-nested model dan metode Ramsey Regression Error Specication
Test (RESET) . Stata memiliki command untuk melakukan pengujian Ramsey
RESET, dengan perintah sebagai berikut:
estat ovtest
ovtest adalah singkatan untuk ommited variable test. Perintah ini dapat dilakukan setelah estimasi OLS. Bila kita ingin menggunakan polinomial dari variabel independen (bukan hanya tted values variabel dependen), tambahkan opsi
rhs.

Masukkan berbagai bentuk spesikasi fungsional dari variabel yang sama ke dalam model, dan
uji menggunakan Wald test apakah koesien untuk masing-masing kelompok spesikasi apakah
koesionnya sama dengan 0.

Untuk mempelajari bentuk fungsional spesikasi A dan B, lakukan estimasi untuk kedua
persamaan tersebut, dan diambil error masing-masing persamaan. Ambil persamaan dari satu
model (misal model A) dan masukkan ke model satunya (Model B) sebagai variabel independen.
Lakukan regresi model satunya tersebut dengan error. Bila koesion error model A dalam model
B tersebut tidak signikan, model A telah dispesikasikan dengan benar. Prosedur yang sama
dilakukan untuk model B.

Mengambil polinomial dari tted values dan memasukkannya ke dalam model utama. Bila
polinomial model utama signikan, maka model tersebut mengandung omitted variables.

benconomy.wordpress.com

12

ovtest

7
7.1

Setelah estimasi

Setelah estimasi
Perintah predict

Perintah predict berguna untuk membuat prediksi dari estimasi yang telah dilakukan, baik prediksi tted values, residual, dan lainnya. Berikut sintaks perintah
tersebut.
predict varname, options
Hasil perintah tersebut dimasukkan dalam variabel baru (varname) yang dispesikasikan. Nilai yang dapat diprediksi dispesikasikan dalam options:

predict

xb Analogis dengan X, yaitu prediksi linear/tted values dari model.


residuals Error i hasil regresi.
rstd Nilai standardized dari error.
stdp Standar error nilai tted values.
stdf Standar error nilai forecast (nilai baru).
stdr Standar error nilai error.

7.2

Perintah estimates

Perintah estimates berguna untuk menyimpan, mengelola dan mengakses hasil


estimasi yang telah dilakukan sebelumnya. Dengan adanya tur ini, kita tidak perlu
menyimpan log-le Stata (.smcl) hanya untuk menyimpan hasil estimasi (lihat opsi
save). Di samping itu, perintah ini juga menyimpan lebih banyak detail yang tidak
ditampilkan dalam tabel laporan estimasi. Berikut adalah beberapa penggunaan
perintah tersebut.
estimates store modelname menyimpan hasil regresi ke dalam memori
(hilang bila Stata dimatikan) dengan nama modelname. Untuk mengakses/mengaktifkan kembali hasil estimasi yang telah di-store, gunakan perintah
estimates restore modelname.
estimates save filename menyimpan hasil regresi dengan nama lename
ke hard-disk. Untuk mengakses kembali hasil estimasi ynag telah di-save,
gunakan perintah estimates use filename.
estimates replay modelnamelist menampilkan kembali laporan/tabel estimasi untuk hasil model-model dalam memori. Untuk menampilkan kembali
perintah regresi yang dilakukan dalam suatu model yang disimpan, gunakan
perintah estimates describe modelname (hanya satu model).
benconomy.wordpress.com

13

estimates

Setelah estimasi

estimates table modelnamelist, options menampilkan satu atau lebih


hasil estimasi dalam suatu tabel secara vertikal, yang (terutama) berguna
untuk memilih model. Opsi yang dapat digunakan adalah:
Menampilkan beberapa statistik sekaligus untuk satu model, atau menggunakan bintang (*) untuk menandai variabel yang signikan. Bila
kita ingin menampilkan beberapa statistik sekaligus, tambahkan statistik yang diinginkan secara langsung: b (koesien estimasi), se (standard
error koesien estimasi), t (statistik t terkait) dan p (p-value). Bila kita
ingin menggunakan bintang tambahkan opsi star(#1 #2 #3), di mana
#1 adalah angka untuk mendapat 1 bintang, #2 adalah angka untuk
mendapat 2 bintang, dan seterusnya.
Menampilkan statistik goodness of t model. Statistik yang dapat ditampilkan dimasukkan dalam stat(list), di mana list dapat berupa r2
(R2 ), r2_a (adjusted R2 ) ll (likelihood ratio), N (jumlah sampel), df_r
(degress of freedom model), AIC dan BIC.
Untuk menunjukkan bagaimana menggunakan estimates digunakan, beberapa
baris perintah berikut ini dapat menampilkan contohnya.
sysuse auto, clear
regress pr mp re tr
estimates store model1
regress pr mp re
estimates store model2
estimates table model1 model2, b se p stats(r2 r2_a df_r)
estimates table model1 model2, star(0.05 0.01 0.001)
estimates describe model1
estimates describe model2
estimates replay model1 model2
Alternatif perintah estimates table yang memiliki kemampuan menampilkan
beberapa statistik sekaligus dan bintang secara bersamaan, kontrol hasil tampilan
lebih baik serta ekspor hasil ke program lain (seperti LATEX) adalah paket estout.
Gunakan perintah ssc install estout, replace untuk meng-install paket ini
ke dalam Stata (dibutuhkan koneksi internet untuk download paket).

benconomy.wordpress.com

14

You might also like