Copula

TOPIK DALAM STATISTIKA III
PREDIKSI RETURN SP100 DAN SP600

DENGAN CLAYTON COPULA
Isran K Hasan 20113051

Eka Okta Satriani 20113063
Cukri Rahminiani 20113070
Sukono 20114055
PROGRAM STUDI MAGISTER MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
INSTITUT TEKNOLOGI BANDUNG
2014
Bab 1
Pendahuluan
1.1
Latar Belakang
Indeks harga saham merupakan indikator utama yang menggambarkan pergerakan

harga saham dengan memiliki fungsi sebagai indikator tren pasar, indikator tingkat
keuntungan, tolak ukur kinerja fortofolio, serta penentuan strategi pasif dan produk
derivatif.
Peramalan (forecasting) adalah suatu usaha atau kegiatan yang akan terjadi
di masa mendatang mengenai objekobjek tertentu dengan menggunakan judgement,
pengalaman-pengalaman ataupun data historis. Subagyo (1986) menyatakan bahwa
pada dasarnya tidak ada suatu metode peramalan yang paling baik dan selalu cocok
digunakan untuk membuat peramalan dalam berbagai situasi. Untuk menghitung
peramalan ini ada beberapa metode yang digunakan diantaranya metode runtun
waktu (time series).
Peramalan dilakukan untuk mengestimasi suatu perilaku data berdasarkan
analisis dan pengolahan data historis. Data runtun waktu (time series) merupakan data yang diamati menurut urutan waktu untuk suatu peubah tertentu. Model
time series yang umum digunakan adalah Autoregressive (AR), Moving Average
(MA) dan kombinasi Autoregressive Moving Average (ARMA) yang mempunyai
asumsi Homoscedasticity (variansi yang homogen). Namun pada kasus data finansial, termasuk data indeks harga saham, memiliki kecenderungan berfluktuasi secara
cepat dari waktu ke waktu sehingga variansi dari error-nya akan selalu berubah
setiap waktu(Heterogen). Ketidakpastian yang dihadapi data indeks harga saham
biasanya mengakibatkan terjadinya pengelompokan volatilitas (volatility clustering)
yaitu berkumpulnya sejumlah error dengan besar yang relatif sama dalam beberapa
Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

waktu yang berdekatan.
Volatilitas digunakan untuk menggambarkan fluktuasi dari suatu data, sehingga memungkinkan datanya bersifat heteroskedastisitas. Dalam kasus ini, pemodelan
data time series dengan menggunakan metode AR, MA, ARMA menjadi kurang tepat untuk digunakan, maka diperlukan metode lain untuk mengatasi masalah keheterogenan variansi tersebut. Salah satu metode yang dapat digunakan untuk mengatasi masalah keheterogenan variansi adalah metode Autoregressive Conditional Heteroscedasticity (ARCH) yang diperkenalkan Engle pada tahun 1982. Perubahan
variansi pada model ARCH dipengaruhi oleh sejumlah T data acak sebelumnya.
Model tersebut digeneralisasikan oleh Bollerslev pada tahun 1986 untuk mengatasi
orde yang terlalu tinggi pada model ARCH, yang lebih dikenal dengan Generalized
Autoregressive Conditional Heteroscedasticity (GARCH).
Data historis mempunyai keterkaitan terhadap analisis karakteristik dan pola
data. Pola data menggambarkan suatu kecendrungan antar data yang nantinya
dapat digunakan sebagai acuan untuk melakukan suatu peramalan atau prediksi.
Data yang digunakan adalah data harga saham SP100 dan SP600 dari tahun 2000-2014 (Finance.yahoo.com,2014). Data saham dipilih adalah data periode
harian selama 15 tahun terakhir, masing-masing data saham SP100 dan SP600 mencakup 3552 data.
1.2
Tujuan
Tujuan-Tujuan dalam tugas besar ini adalah:

1. Mengestimasi parameter dengan menggunakan model time series AR(1) dan
GARCH(1,1).
2. Memodelkan data dengan Kopula Gaussian.
3. Menggabungkan data SP100 dan SP600 yang dimodelkan dengan Kopula Gaussian dengan menggunakan Kopula Clayton.
4. Memprediksi harga saham dengan Kopula Clayton.
Bab 2
Model Deret Waktu S&P100 dan
S&P600
2.1
Data Harga Saham S&P100 dan S&P600
Pemodelan untuk data deret waktu membutuhkan asumsi bahwa data hari ini bergantung dari data sebelumnya. ukuran kebergantungan dua variabel diartikan juga
sebagai korelasi. Ukuran korelasi dua variabel yang cukup populer digunakan adalah
koefisien korelasi Pearson. Misalkan Yt menyatakan harga saham saat t, dengan mean Y dan variansi Y2 . Koefisien korelasi () didefinisikan sebagai ukuran hubungan
linier antara Yt dan Yt+1 , dimana:
Yt ,Yt+1 =
Cov(Yt , Yt+1 )
Y2t
(a) Scatter Yt dengan Yt+1 S&P100
(b) Scatter Yt dengan Yt+1 S&P600
Gambar 2.1: Scatter plot antara harga saham Yt dengan Yt1 . Berdasarkan grafik,
terdapat hubungan yang erat antara harga saham hari ini dengan hari berikutnya.
Nilai antara 0 sampai 1, semakin mendekati 1 maka nilai korelasi atau hu3

bungan kebergantungannya semakin tinggi. Nilai koefisien korelasi dari harga saham
S&P100 saat t dan t + 1 adalah 0.998 sedangkan korelasi dari harga saham S&P600
saat t dan t + 1 adalah 0.998 . Selain itu, diagram scatterplot menunjukkan bahwa
data harga saham menggerombol mengikuti garis lurus dengan kemiringan positif.
Dapat disimpulkan bahwa terdapat korelasi positif yang tinggi harga saham hari ini
dengan harga saham hari berikutnya.
Data yang digunakan adalah data harga Saham S&P100 dan S&P600 pada
tanggal 28 Juli 2000 sampai dengan 11 September 2014. Berikut adalah statistika
deskriptif dari kedua data tersebut.
Tabel 2.1: Statistika Deskriptif untuk S&P100 dan S&P600
Mean
Median
Variansi
Skewness
Kurtosis
S&P100 S&P600
592.8091 89.1459
577.4950 82.0850
11334.084 722.091
0.503
0.255
3.144
2.898
Berdasarkan Tabel 2.1, dapat diketahui bahwa nilai mean dan median tidak
jauh berbeda. Hal ini berarti, data yang ada cukup simetris. Hal tersebut juga
terlihat pada skewnes dimana skewnes kedua data mendekati 0. Dari kurtosis, dapat
diketahui bahwa nilainya mendekati 3. Dengan demikian, data dapat dikatakan
mendekati distribusi normal. Variansi pada data memberikan informasi bahwa data
cukup jauh menyebar. Hal ini menjadi salah satu penyebab bahwa pengolahan data
menggunakan data harga saham tidak dianjurkan dalam pemodelan time series.
(a) Plot harga saham S&P100
(b) Plot harga saham S&P600
Gambar 2.2: Plot antara harga saham S&P100 dan S&P 600. Berdasarkan grafik, dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran mean dan
variansi.
Berdasarkan Gambar 2.2, dapat diketahui bahwa data deret waktu pada harga
saham S&P100 dan S&P600 tidak menunjukan gejala stasioner. Dengan demikian,
4

dapat dikatakan bahwa data tersebut tidak memenuhi syarat kestasioneran yang
diperlukan dalam model deret waktu. Indikator lain mengetahui suatu kestasioneran
suatu data adalah dengan mengetahui fungsi autokprelasi. Jika fungsi atukorelasi
menurun secara perlahan, maka dapat dikatakan data tersebut tidak stasioner. Jika
model tersebut cut off pada lag tertentu, dapat dikatakan bahwa data tersebut
stasioner.
Pola ACF pada Gambar 2.3 menunjukkan bahwa nilai ACF menurun secara
perlahan. Artinya, dapat diketahui bahwa data tersebut tidak stasioner. Pengolahan model deret waktu dengan model tersebut tentu akan memberikan taksiran model yang jauh dari kondisi sebenarnya. Terdapat beberapa metode untuk
menstasionerkan suatu data, diantaranya return, regresi linier, pendekatan fungsi,
differencing, dsb. Metode yang umum digunakan pada data saham adalah return.
(a) ACF harga saham S&P100
(b) ACF harga saham S&P600
Gambar 2.3: Plot ACF harga saham S&P100 dan S&P 600. Berdasarkan grafik,
dapat diketahui bahwa kedua data tidak menunjukkan kestasioneran.
Seiring berjalannya waktu, harga saham cenderung berubah. Perubahan harga saham diiringi dengan perubahan return harga. Hal tersebut mengakibatkan
kecenderungan berubahnya variansi dan volatilitas dari suatu return harga. Return
harga suatu aset dibedakan menjadi dua jenis yaitu return sederhana dan return
majemuk. Dalam hal ini, return yang digunakan adalah return Majemuk.
Return majemuk sering disebut log return. Misalkan Xt adalah return harga
aset.
Xt = log(1 + Rt ) = log
Pt
= log(Pt ) log(Pt1 )
Pt1
Misalkan Y1 = 500 dan Y2 = 1000. Dengan demikian, dapat diketahui bahwa

nilai dari r1 = 1. Jika Y1 = 1000 dan Y2 = 500 akan memberikan hasil r1 = 0.5.
Seperti diketahui, jarak antara Y1 dan Y2 adalah sama-sama 500, yang menunjukkan
perbedaan tanda saja. Namun, dengan penggunaan return majemuk, selain memberikan perbedaan tanda, namun memberikan hasil konstanta yang berbeda pula.
5

Berbeda halnya dengan return majemuk. Misalkan Y1 = 500 dan Y2 = 1000.
Dengan demikian, dapat diketahui bahwa nilai dari X1 = 0.693. Jika Y1 = 1000
dan Y2 = 500 akan memberikan hasil X1 = 0.693. Seperti diketahui, jarak antara
Y1 dan Y2 adalah sama-sama 500, dengan return sederhana, log hanya memberikan
perbedaan tanda saja. Hal tersebut sering dikatakan sifat simetris pada return.
Hal tersebut menjadi salah satu alasan pemilihan return majemuk daripada return
sederhana.
(a) Plot Return S&P100
(b) Plot Return S&P600
Gambar 2.4: Plot Return harga saham S&P100 dan S&P600.

Gambar 2.4 memberikan informasi bahwa nilai mean cenderung satsioner. Namun, variansinya dapat dikatakan tidak stasioner. Hal ini menjadi salah satu alasan
memodelkan data dengan konsep GARCH. Salah satu upaya mengetahui kestasioneran adalah dengan plot autocorrelation function. Berikut ini adalah ACF dari
return majemuk S&P100 dan S&P 600.
(a) ACF
S&P100
return
harga
saham
(b) ACF
S&P600
return
harga
saham
Gambar 2.5: Plot ACF return harga saham S&P100 dan S&P 600. Berdasarkan
grafik, dapat diketahui bahwa kedua data cukup menunjukkan kestasioneran.
2.2
Model AR(1)-GARCH(1,1)
Model AR(1)-GARCH(1,1) dapat dituliskan sebagai berikut:

Yt = + 1 Yt1 + Xt
(2.1)
2
2
t2 = 0 + 1 Xt1
+ 2 t1
(2.2)
dimana Xt = t t
dengan t N (0, 1). Untuk mengestimasi parameter dan 1 akan digunakan

metode OLS (ordinary least square). Misalkan nilai yang terobservasi dari t = 2
sampai t = T dan misalkan pula
f (1 , ) =
T
X
(Yt 1 Yt1 )2
(2.3)
t=2
1 ,)
= 0 dan
untuk meminimalkan f (1 , ), Perhatikan persamaan f (
sehingga
T
X
f (1 , )
= 2
(Yt 1 Yt1 ) = 0
t=2
dan
f (1 ,)
1
=0
(2.4)
X
f (1 , )
= 2
(Yt 1 Yt1 )(Yt1 ) = 0
t=2
(2.5)
dengan menyelesaikan persamaan (2) dan (3) diperoleh

(T 1) + 1
T
X
Yt1 =
t=2
dan
T
X
Yt1 + 1
T
X
t=2
T
X
Yt
t=2
2
Yt1
t=2
T
X
Yt Yt1
t=2
Atau dapat dituliskan sebagai berikut
T
P
T
P
Yt1
t=2 Yt T 1
t=2
=
T
T
T
P
P
P
2
Yt1
(Yt1 )
Yt Yt1
t=2
t=2
t=2
Selanjutnya akan diestimasi parameter 0 , 1 dan 2 dengan menggunakan maksimum likelihood (MLE). Perhatikan bahwa Xt memiliki distribusi (bersyarat) normal
dengan E(Xt |Ft1 ) = t E(|Ft1 ) = 0 dan V ar(Xt |Ft1 ) = t2 V ar(|Ft1 ) = t2 .

7

Dari sini diperoleh fungsi peluangnya adalah
(
1
exp
f (Xt |Xt1 ) = p
2
2t2
1
Xt
t
2 )
Selanjutnya akan diestimasi parameter menggunakan metode Maksimum Likelihood

dari fungsi peluang diatas diperoleh fungsi likelihood
L() =
n
Y
t=2
(
2 )

1
1
Xt
p
exp
2
2
)
2 2(0 + 1 Xt1 + 2 t1
(2(0 + 1 Xt1 + 2 t1
))
fungsi log-likehood adalah

n
1X
Xt2
2
`() =
log(2) + log(0 + 1 Xt1 + 2 t1 ) +
2
2 t=2
0 + 1 Xt1 + 2 t1
untuk memperoleh nilai estimasi (c
0 ), (c
1 ), dan (b1 ) diperoleh dengan memaksimumkan fungsi log likelihood dengan cara mencari turunan parsial terhadap parameternya, yaitu:
(`())
= 0,
0
(`())
= 0,
1
(`())
=0
2
Sehingga diperoleh
n
Xt2
2
2
0 + 1 Xt1 + 2 t1
0 + 1 Xt1 + 2 t1

n
2
Xt2
1 X 0 + 1 Xt1 + 2 t1
=
2
2 t=2
0 + 1 Xt1 + 2 t1
(`())
1X
=
0
2 t=2
2
2
rt1
Xt2 Xt1
2
2
0 + 1 Xt1 + 2 t1
0 + 1 Xt1 + (2 t1
)2

n
2
4
2
2
2
+ 1 Xt1
+ 2 t1
Xt1
Xt2 Xt1
1 X 0 Xt1
=
2
2 t=2
0 + 1 Xt1 + (2 t1
)2
(`())
1X
=
1
2 t=2
2
2
t1
Xt2 Xt1
2
2
0 + 1 Xt1 + 2 t1
0 + 1 Xt1 + (2 t1
)2

n
2
2
2
4
2
+ 1 Xt1
t1
+ 2 t1
Xt2 t1
1 X 0 t1
=
2
2 t=2
0 + 1 Xt1 + (2 t1
)2
(`())
1X
=
1
2 t=2

Untuk memaksimumkan fungsi log likelihoodnya akan digunakan perhitungan dengan menggunakan program MATLAB
2.3
Penerapan Model pada data S&P100 dan S&P600
Pada tugas ini, data yang akan digunakan adalah data saham S&P100 dan S&P600
dari tanggal 28 juli 2000 sampai 11 september 2014. Data saham tersebut diolah
dengan menggunakan software MATLAB. Selanjutnya dengan menerapkan model
ini pada data S&P100 dan S&P600 diperoleh estimasi parameter sebagai berikut:
1
0
1
2
S&P100
S&P600
0.000038680049795 1.174097488765628 104
-0.093657943546480
-0.021541387640377
2 10 6
1.630484378274826 105
0.886791561211049
0.843039248484122
0.097704530705975
0.156958751515878
Tabel 2.2: estimasi parameter data saham S&P100 dan S&P600

Selanjutnya, dari persamaan (1) diperoleh
t =
Yt
b
c1 Yt1
2
2
b
c0 + 1 Xt1 + b2 t1
(2.6)
Dari persamaan error diatas dapat dihitung dilihat masing-masing statistik deskriptif dari error untuk S&P100 dan S&P600 sebagai berikut:
Tabel 2.3: Tabel Statistik Deskriptif Error
ERROR S&P100
ERROR S&P600
Statistic
Value
Statistic
Value
SampleSize
3552
SampleSize
3552
Range
33.856
Range
81.464
Mean
-6.46E-05
Mean
-0.00245
Variance
4.4616
Variance
3.5223
Std.Deviation
2.1122
Std.Deviation
1.8768
Coef.ofVariation
-32697
Coef.ofVariation -766.92
Std.Error
0.03544
Std.Error
0.03149
Skewness
-0.63063
Skewness
-17.518
ExcessKurtosis
8.4834
ExcessKurtosis
686.36
Dari sini terlihat bahwa data tersebut berdistribusi student t. Selanjutnya akan
dilihat dengan menggunakan menggunakan ACF dapat dilihat apakah eror dari
data tersebut tidak berkorelasi. Perhatikan gambar berikut:
9
(a) S&P100
(b) S&P600
Gambar 2.6: Fitting histogram S&P100 dan S&P600 dengan distribusi normal dan
t.
(a) Normal PP Return S&P100
(b) Normal PP Return Return

S&P600
Gambar 2.7: Normal PP Return S&P100 dan S&P600.
(a) Fungsi Autokorelasi error dari

data S&P100
(b) Fungsi Autokorelasi error dari

data S&P600
Gambar 2.8: Fungsi Autokorelasi error dari data S&P100 dan S&P600.
Dari gambar diatas dapat dilihat bahwa eror dari kedua data tidak menempel
pada garis merah sehingga dapat disimpulkan bahwa eror dari kedua data tidak berdistribusi normal. terlihat juga dari plot bahwa eror dari kedua data tersebut tidak
berkorelasi karena autokorelasi dari semua lagnya berada dibawah batas signifikansi.
Selain menggunakan plot ACF, kebebasan dari error juga dapat diketahui dengan residual plot.
10
Model Distribusi Eror dengan Copula
(a) S&P 100
(b) S&P 600
Gambar 2.9: Plot Residual dari data S&P100 dan S&P600.

Berdasarkan Gambar 2.9, dapat diketahui bahwa error kedua data tidak berkorelasi. Hal tersebut dikarenakan tidak ada pola grafik.
Selanjutnya, akan dilihat apakah model AR(1)-GARCH (1,1) dapat merepresentasikan kedua data return dengan membandingkan data return dan data yang
diperoleh dari hasil estimasi sehingga diperoleh
(a) Plot Hasil Model untuk data

S&P100
(b) Plot Hasil Model untuk data

S&P600
Gambar 2.10: Plot Hasil Model untuk data S&P100 dan S&P600.
Dari gambar ini terlihat bahwa model AR(1)-GARCH(1,1) cukup merepresentasikan
kedua data return.
11
Bab 3
Model Distribusi Eror dengan
Copula
3.1
Distribusi Error S&P 100 dan S&P 600
Copula merupakan distribusi yang digunakan untuk mengkonstruksi beberapa distribusi yang saling bergantung. Informasi distribusi marginal dari distribusi tersebut
diperlukan dalam proses konstruksi. Copula sangat sensitif terhadap distribusi marginal tersebut. Oleh karena itu, penentuan distribusi marginal yang akurat sangat
diperlukan agar hasil konstruksi distribusi tepat.
Salah satu metode untuk menentukan parameter distribusi adalah dengan melihat histogram dari suatu sampel acak. Histogram tersebut diharapkan mampu
memberikan informasi mengenai distribui yang tepat digunakan untuk pendekatan
sampel. Berikut adalah histogram dan pendekatan distribusi yang dianggap sesuai.
Berdasarkan 3.1, dapat diketahui bahwa gambar cukup simetris. Oleh karena
itu, distribusi yang dianggap tepat adalah distribusi normal dan t. Informasi mengenai kelancipan pada gambar tersebut sudah cukup jelas mengarahkan pada distribusi
t. Berikut adalah estimasi parameter distribusi sampel acak dengan menggunakan
distribusi t.
Tabel 3.1: Estimasi parameter error S&P100 dan S&P600
Distribusi t
b
b
S&P100
7.25355 102
1.04946
1.89475
S&P600
5.43921 102
1.01296
3.70339
Parameter tersebut dapat diuji keakuratannya dengan metode kuadrat error.

12
(a) S&P 100
(b) S&P 600
Gambar 3.1: Pendekatan distribusi sampel error S&P 100 dan S&P 600.
Langkah pertama penggunaan metode kuadrat error adalah dengan menghitung
x
fungsi kumulatif F empirik dari sampel, Fem (x) = #data
. Selanjutnya, menghin
tung fungsi kumulatif F berdasarkan parameter yang ditentukan F,t (x). Dengan
mengetahui sampel tersebut, dapat diperoleh
n
X
KS(xt ) =
(F,t (xt ) Fem (xt ))2
t=1
Selanjutnya akan diperoleh Hdata =
KS(x)
.
n
Dengan cara serupa, dapat dibangkitkan data secara berulang-ulang (Simulasi

Monte Carlo) sesuai dengan distribusi dan parameter yang telah diestimasi sebelumnya sehingga diperoleh Fem (b
x), F,t (b
x), KS(b
x) dan Hsimulasi . Berikut adalah Hdata
untuk error S&P100 dan S&P600.
Tabel 3.2: Hdata S&P100 dan S&P600
Error
Hdata
S&P100
2.0581 104
13
S&P600
1.1340 104

Berdasarkan nilai Hsimulasi untuk error S&P 100 dan S&P 600, secara berurutan Hdata berada pada kuantil 0.713 dan 0.486. Dengan demikian, dapat disimpulkan
bahwa model sudah cukup akurat menggambarkan distribusi sampel dan dapat diproses lebih lanjut dengan konsep Copula.
Berikut adalah histogram dari Hsimulasi untuk S&P100 dan S&P600.
(a) S&P 100
(b) S&P 600
Gambar 3.2: Histogram untuk H pada error S&P 100 dan S&P 600.
3.2
Fungsi Marginal dengan Gaussian Copula
Distribusi marginal error pada subbab sebelumnya memberikan informasi penting

dalam penerapan Copula pada error return harga saham. Dalam pembahasan pada
bab ini error dari S&P 100 disimbolkan dengan dan error dari S&P 600 disimbolkan
dengan .
S&P 100 1 , 2 , ..., T
S&P 600 1 , 2 , ..., T
Pada subbab sebelumnya, telah diketahui bahwa distribusi dari dan adalah
distribusi t. Dengan informasi tersebut akan dicari distribusi dari F (t |t1 ) dan
F (t |t1 ).
F (t |t1 ) =
t1
C (u ,
u1 ... ut1 1
..., ut )
c (u1 , ..., ut1 )
dengan
14
(3.1)
t1
C (u1 , ..., ut ) =
u1 ... ut1
1 (ut )
c (1 (u1 ), ..., 1 (ut1 ), st )d st
(1 (u
1 ))
...
1
(1 (ut1 ))
(3.2)
dan
1 (u )...1 (u
1 I)(1 (u )...1 (u
0
1
t1 ))(
1
t1 ))
c (u1 , ..., ut1 ) = ||0.5 e0.5(
(3.3)
sedangkan uj = F (j ). Dengan mensubtitusikan persamaan 3.2 dan 3.3 ke persamaan 3.1 diperoleh
Z
1 (ut )
F (t |t1 ) =
f (1 (u1 ), ..., 1 (ut1 ), st )

d st
f (1 (u1 ), ..., 1 (ut1 ))
(3.4)
Dengan persamaan diatas dapat diperoleh

X = {u1 , ..., uT }
Y = {v1 , ..., vT }
dengan uT adalah F (t |t1 ).
3.2.1
Penerapan Gaussian Copula pada data error
Berikut adalah Algoritma sederhana untuk memperoleh F (t |t1 )

1. Memanggil data error dari S&P100 dan S&P600
2. Fitting distribusi dengan t, diperoleh
b,
b, b
3. Standarisasi error Kt =
t b
4. Mencari CDF dari dengan distribusi t, dengan derajat kebebasan b dan selanjutnya disimbolkan dengan W
5. Mencari Z, dimana Z = 1 (W )
15

6. Mencari parameter b
h dan matrix
(p, q) = h exp(
(p q)2
)
2h
dengan dekomposisi cholesky diperoleh = LL0

7. Mencari matrik loglikelihood
n
X
1
1
1
lnFi (xi ))
L() = V 0 V + Z 0 Z + ( ln(||) +
2
2
2
i=1
dengan V = L1 Z
8. Mencari u, dengan b
h yang memaksimumkan likelihood untuk S&P 100 dan
S&P600, berturut-turut yaitu 0.43 dan 0.48
F (t |t1 ) =
t1
C (u ,
u1 ... ut1 1
..., ut )
c (u1 , ..., ut1 )
Algoritma hasil diatas, memberikan hasil sebagai berikut:
(a) S&P 100
(b) S&P 600
Gambar 3.3: Z S&P 100 dan S&P 600.

Gambar 3.3 memberikan informasi bahwa grafik cepat turun ke nilai 0 (mean reversion) dengan demikian nilai b
h kurang dari 1. Dari kondisi tersebut, dapat ditentukan
bahwa nilai b
h berada pada selang 0 < b
h < 1. Dengan memaksimumkan fungsi log
b
likelihood, diperoleh h. Berikut adalah grafik hubungan antara b
h dengan nilai log
likelihoodnya.
Berdasarkan Gambar 3.4, dapat diketahui bahwa nilai dari b
h berturut-turut
untuk S&P 100 dan S&P 600 adalah 0.433 dan 0.484. Hal tersebut wajar karena
grafik error cepat menuju 0 atau mean reversion.
16
(a) S&P 100
(b) S&P 600
Gambar 3.4: b
h S&P 100 dan S&P 600.
Berikut adalah grafik dan histogram u dan v. Berdasarkan Grafik 3.5, dapat
diketahui bahwa u dan v berdistribusi uniform (0,1). Setelah memperoleh u dan v,
selanjutnya akan ditentukan Copula banding untuk menggabungkan kedua peubah
acak dari u dan v.
(a) S&P 100
(b) S&P 600
Gambar 3.5: Histogram u dan u S&P 100 dan S&P 600

Seharusnya, distribusi dari X dan Y adalah Uniform (0,1). Gambar 3.5 memberikan informasi bahwa distribusi yang sesuai untuk X dan Y adalah uniform(0,1),
meskipun terdapat sedikit anomali di nilai kecil yang mendekati nol dan nilai besar
yang mendekati 1. Salah satu uji keseragaman yang digunakan adalah QQ plot.
Selain menggunakan QQ-plot, dengan konsep KS yang telah dijelaskan sebelumnya, diperoleh nilai KS pada data berada di luar selang data bangkitan. Nilai H
yang diperoleh adalah Hd ata = 0.2265 sedangkan Hs imulasi = [1.30105 , 1.35103 ]
17
Konstruksi Copula Bivariat dengan Clayton Copula
(a) S&P 100
(b) S&P 600
Gambar 3.6: Quantile-Quantile Plot u dan v

Berdasarkan Gambar 3.6, dapat diketahui bahwa data sudah menunjukan keseragaman, namun terdapat sedikit anomali di ekor atas dan bawah. Namun, hal
tersebut dirasa tidak signifikan mempengaruhi sifat seragam data.
18
Bab 4
Konstruksi Copula Bivariat
dengan Clayton Copula
Salah satu metode untuk mengkonstruksi dua distribusi adalah Copula. Copula
memiliki keistimewaan untuk menggabungkan dua distribusi yang tidak identik.
Copula dapat menggabungkan dua distribusi berbeda yang tidak saling bebas meskipun tidak diketahui jenis hubungan diantara dua kerugian acak tersebut. Pada
dasarnya, Copula merupakan distribusi multivariat dengan marginal Uniform [0, 1]
yang berfungsi untuk menggabungkan dua fungsi distribusi dari dua kerugian acak.
4.1
Karakteristik Clayton Copula
Terdapat beberapa metode untuk mengkonstruksi Copula bivariat. Salah satu metode yang umum digunakan adalah pendekatan Archimedean. Copula yang dikonstruksi dengan metode ini disebut Archimedean Copula. Dengan (t) adalah fungsi
generator. Archimedean Copula didefinisikan sebagai (Nelsen 2006):
C(
u, v) = 1 [(
u) + (
v )] u, v [0, 1]
Pada kelas Archimedean, terdapat beberapa jenis Copula 1 parameter dengan spesifikasi masing-masing. Beberapa diantaranya adalah Clayton Copula. Clayton
Copula memiliki fungsi generator sebagai berikut:
(t) =
19
(4.1)

Salah satu hal penting dalam fungsi generator adalah invers dan turunan dari fungsi
generator tersebut. Invers dan turunan dari fungsi generator salah satunya berguna
untuk menentukan penaksir parameter. Fungsi invers dan turunan pertama terhadap t untuk persamaan 4.1 adalah sebagai berikut.
1
1 (t) = (t + 1)
(4.2)
0 (t) = t(+1)
(4.3)
Untuk mengetahui distribusi gabungan dari dua peubah acak, dapat diketahui dari fungsi distribusi Copula. Fungsi distribusi kumulatif fungsi distribusi peluang
Clayton Copula adalah sebagai berikut:
u) + (
v )]
C(
u, v) = 1 [(

= 1 u 1 + v 1
1
C(
u, v) = (
u + v 1)
(4.4)
Berikut adalah grafik untuk fungsi distribusi cumulatif Clayton Copula. Berdasarkan Gambar 4.1, dapat diketahui bahwa semakin besar nilai parameter , nilai cdf
semakin membesar, meskipun hal ini tidak begitu tampak secara signifikan.
(a) = 0
(b) = 0.5
(c) = 1
(d) = 5
(e) = 10
(f) = 20
Gambar 4.1: Distribusi Kumulatif Clayton Copula

Dari persamaan 4.4, didapat turunan pertama terhadap u dan v yang merupakan
20

densitas dari Copula tersebut.

1
1
1
1
c(
u, v) = 1 +
u a + v a 1)a2
(
uv)1 a (
a
(a) = 0
(b) = 0.5
(c) = 1
(d) = 5
(e) = 10
(f) = 20
Gambar 4.2: Fungsi Kepadatan Peluang Clayton Copula
(a) = 0
(b) = 0.5
(c) = 1
(d) = 5
(e) = 10
(f) = 20
Gambar 4.3: Scatterplot Clayton Copula

Gambar 4.2 dan 4.3 memberi informasi bahwa semakin besar nilai , titik
semakin tebal berada pada daerah sekitar u dan v. Selain itu, nilai juga menumpuk
pada daerah sekitar u = 0 dan v = 0. Dengan informasi ini, dapat dikatakan
21

bahwa Copula tipe clayton bagus digunakan untuk dua distribusi yang memeiliki
kebergantungan di ekor bawah.
4.2
Penaksir Parameter pada Clayton Copula
Penaksir parameter distribusi Copula dapat ditaksir dengan menggunkan konsep

Kendalls Tau. Kendalls Tau merupakan salah satu ukuran asosiasi yang populer digunakan untuk mengukur asosiasi bertipe linear ataupun non-linear. Konsep
Ukuran asosiasi Kendalls Tau erat kaitannya dengan konsep Concordance dan discordance.
Misal (X, Y ) menyatakan peubah acak kontinu dari marginal eror S&P 100
dan S&P 600, sedangkan (
ui , vi ) dan (
uj , vj ) adalah dua observasi yang berbeda
dari (X, Y ).
(
ui , vi ) dan (
uj , vj ) dikatakan concordant jika
(
ui uj ) (
vi vj ) > 0
Hal ini terjadi jika ui < uj dan vi < vj atau ui > uj dan vi > vj .
(
ui , vi ) dan (
uj , vj ) dikatakan discordant jika
(
ui uj ) (
vi vj ) < 0
Hal ini terjadi jika ui < uj dan vi > vj atau ui > uj dan vi < vj .
Gambar 4.4: Ilustrasi concordant dan discordant pada dua peubah acak.
Kendalls Tau pada sampel dapat didefinisikan sebagai peluang concordance
dikurangi peluang discordance:
b = X,Y = P [(Xi Xj )(Yi Yj ) > 0] P [(Xi Xj )(Yi Yj ) < 0]
22
(4.5)

Misal (
u1 , v1 ), (
u2 , v2 ), ... , (
un , vn ) adalah sampel acak dari (X, Y ) , maka terdapat
ui , vi ) dan (
uj , vj ) yang berbeda. Jika banyak pasangan yang
n C2 pasang observasi (
concordant dinyatakan dengan c dan pasangan yang discordant dinyatakan dengan
d, maka Kendalls Tau sampel adalah
b =
cd
, 1 1
n C2
(4.6)
Dalam bentuk Copula, ukuran asosiasi Kendalls Tau adalah sebagai berikut (Nelsen. 2006):
X,Y = P [(X1 X2 )(Y1 Y2 ) > 0] P [(X1 X2 )(Y1 Y2 ) < 0]
(4.7)
Untuk kelas Archimedean Copula, persamaan ukuran asosiasi Kendalls Tau dapat
dinyatakan sebagai berikut(Nelsen, 2006):
Z
C = 1 +
0
(t)
dt
0 (t)
(4.8)
Persamaan 4.8 jika dikombinasikan dengan persamaan 4.2 dan 4.3 dapat diperoleh
persamaan Kendalls tau pada Clayton Copula.
Z
(t)
C = 1 +
dt = 1 +
0
0 (t)

4
1
1
= 1+
+2 2
C =
+2
4.3
Z
0
t 1
(+1)
t
dt
(4.9)
Aplikasi Clayton Copula pada data marginal

Error S&P 100 dan S&P 600
Pada Bab 3, telah diketahui distribusi marginal bersyarat dari Error S&P 100 dan
S&P 600 menggunakan konsep Gaussian Copula. Dicurigai, distribusi marginal bersyarat dari Error S&P 100 dan S&P 600 saling memiliki kebergantungan. Oleh karena itu, untuk memprediksi nilai harga saham di masa mendatang, dapat diketahui
melalui konsep Copula bivariat, yang mampu mengakomodir nilai kebergantungan
diantara dua peubah acak tersebut.
Langkah awal untuk mengetahui Copula yang sesuai adalah dengan melihat
23

scatterplot dari kedua marginal error tersebut.
Gambar 4.5: Scatter fungsi marginal bersyarat error S&P 100 dan S&P 600
Berdasarkan Gambar 4.5 dan 4.3, dapat diketahui bahwa Copula tipe Clayton
sebenarnya tidak begitu sesuai digunakan untuk kedua peuabah acak tersebut. Hal
ini karena, untuk kondisi ekor atas, atau saat fungsi marginal kedua peuabah acak
mendekati satu, tidak bisa didekati oleh Copula Clayton. Meskipun demikian, akan
diketahui sejauh mana keakuratan penggunaan model Clayton Copula pada data.
Langkah lanjut untuk mengkonstruksi distribusi dengan menggunakan Clayton Copula adalah mengetahui nilai Kendalls Tau dan parameternya. Berdasarkan
persamaan 4.6 nilai Kendalls tau yang diperoleh adalah 0.6020. Berdasarkan per2
.
samaan 4.9 dan penerapan konsep pada aljabar, dapat diketahui bahwa = 1
20.6020
Dengan demikian,
b = 10.6020 , = 3.0255.
(a) n = 380
(b) n = 2000
Gambar 4.6: Plot u dan v simulasi dengan basis Clayton Copula

Pada dasarnya, distribusi u dan v simulasi berdistribusi uniform(0,1). Berikut
adalah histogram dan QQ plot dari u dan v simulasi. Dari QQplot diatas dapat
dilihat bahwa data u dan v dari hasil simulasi berdistribusi uniform (0,1).
24
Gambar 4.7: CDF u dan v simulasi dengan Clayton Copula
Gambar 4.8: Histogram dari u dan v simulasi
Gambar 4.9: Quantile-Quantile plot dari u dan v simulasi

Uji Keakuratan Model
Dalam sebuah model, salah satu hal penting adalah menguji keakuratan model
pada data riil. Terdapat beberapa metode yang digunakan dalam uji keakuratan
model, diantaranya metode grafik dan metode Uji Cumulative Distribution Function
(CDF test). Berikut uji keakuratan model dengan menggunakan metode grafik.
25
(a) Riil
(b) Simulasi
(c) Fitting
Gambar 4.10: Plot u dan v simulasi dengan u dan v

Berdasarkan Gambar 4.10 dapat diketahui bahwa model pendekatan dengan
Clayton Copula berparameter b
a = 3.0255 untuk eror S&P 100 dan S&P 600 belum
cukup akurat, meskipun terdapat beberapa sampel yang mendekati.
Selanjutnya, akan dibahas mengenai Uji Cumulative Distribution Function
(CDF test). Pada CDF test, data observasi berpasangan dapat ditulis (
ui , vi ), dimana P [X ui , Y vi ] dapat diketahui dari data observasi (empirical joint distribution). Sementara itu, C(ui , vi ) dapat diketahui dari fungsi copula yang dipilih,
yaitu Clayton Copula, dengan parameter yang telah ditaksir sebelumnya,
b. Uji
CDF dilakukan dengan membandingkan fungsi distribusi bersama empiris dengan
Copula yang dipilih.
SSD =
n
X
2
P [X ui , Y vi ] C @ (ui , vi )
(4.10)
i=1
Persamaan 4.10 sering disebut sebagai jumlah beda kuadrat (sum of square
difference / SSD). Semakin besar nilai SSD maka semakin besar pula error suatu
Copula dalam menaksir data sebenarnya. Begitupula sebaliknya. Nilai SSD terkecil
memberikan informasi bahwa Copula terebutlah yang paling sesuai memodelkan
data. Berdasarkan perhitungan, diperoleh nilai SSD adalah sebesar 53.1794.
26

Copula

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Copula

Uploaded by

Copyright:

Available Formats

TOPIK DALAM STATISTIKA III

PREDIKSI RETURN SP100 DAN SP600

Isran K Hasan 20113051

PROGRAM STUDI MAGISTER MATEMATIKA

Indeks harga saham merupakan indikator utama yang menggambarkan pergerakan

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

Tujuan-Tujuan dalam tugas besar ini adalah:

Data Harga Saham S&P100 dan S&P600

(a) Scatter Yt dengan Yt+1 S&P100

(b) Scatter Yt dengan Yt+1 S&P600

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

(a) Plot harga saham S&P100

(b) Plot harga saham S&P600

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

(a) ACF harga saham S&P100

(b) ACF harga saham S&P600

Misalkan Y1 = 500 dan Y2 = 1000. Dengan demikian, dapat diketahui bahwa

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

(a) Plot Return S&P100

(b) Plot Return S&P600

Gambar 2.4: Plot Return harga saham S&P100 dan S&P600.

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

Model AR(1)-GARCH(1,1) dapat dituliskan sebagai berikut:

dengan t N (0, 1). Untuk mengestimasi parameter dan 1 akan digunakan

dengan menyelesaikan persamaan (2) dan (3) diperoleh

Atau dapat dituliskan sebagai berikut

dengan E(Xt |Ft1 ) = t E(|Ft1 ) = 0 dan V ar(Xt |Ft1 ) = t2 V ar(|Ft1 ) = t2 .

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

Selanjutnya akan diestimasi parameter menggunakan metode Maksimum Likelihood

fungsi log-likehood adalah

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

Penerapan Model pada data S&P100 dan S&P600

Tabel 2.2: estimasi parameter data saham S&P100 dan S&P600

Prediksi Return S&P100 dan S&P600 dengan Clayton Copula

(a) Normal PP Return S&P100

(b) Normal PP Return Return

Gambar 2.7: Normal PP Return S&P100 dan S&P600.

(a) Fungsi Autokorelasi error dari

(b) Fungsi Autokorelasi error dari

Model Distribusi Eror dengan Copula

(a) S&P 100

(b) S&P 600

Gambar 2.9: Plot Residual dari data S&P100 dan S&P600.

(a) Plot Hasil Model untuk data

(b) Plot Hasil Model untuk data

Distribusi Error S&P 100 dan S&P 600

Parameter tersebut dapat diuji keakuratannya dengan metode kuadrat error.

Model Distribusi Eror dengan Copula

(a) S&P 100

(b) S&P 600

Selanjutnya akan diperoleh Hdata =

Dengan cara serupa, dapat dibangkitkan data secara berulang-ulang (Simulasi

Model Distribusi Eror dengan Copula

(a) S&P 100

(b) S&P 600

Fungsi Marginal dengan Gaussian Copula

Distribusi marginal error pada subbab sebelumnya memberikan informasi penting

c (u1 , ..., ut1 )

Model Distribusi Eror dengan Copula

c (1 (u1 ), ..., 1 (ut1 ), st )d st

c (u1 , ..., ut1 ) = ||0.5 e0.5(

f (1 (u1 ), ..., 1 (ut1 ), st )

Dengan persamaan diatas dapat diperoleh

dengan uT adalah F (t |t1 ).