Fuzzy

Pengelompokkan Zona Musim (ZOM) dengan Fuzzy K-Means Clustering
(Studi Kasus :Pengelompokkan ZOM di Kabupaten Ngawi)

1
Febrina Dinar Palupi Utami,
2
Sutikno
1
Mahasiswa Jurusan Statistika FMIPA-ITS (1306 100 037)
2
Dosen Jurusan Statistika FMIPA-ITS
1
fhe_n4@statistika.its.ac.id, 2sutikno@statistika.its.ac.id
Abstrak
Banyak penelitian klimatologi yang bertujuan membuat kelompok stasiun/ wilayah
perkiraan iklim. Badan Meteorologi Klimatologi dan Geofisika (BMKG) telah melakukan
pengelompokkan iklim (pola curah hujan) dengan membuat Zona Musim (ZOM) pada tahun 2009.
Metode yang sering digunakan dalam pembentukan ZOM adalah analisis kelompok (cluster
analysis). Penelitian ini bertujuan mengkaji prosedur pengelompokkan ZOM dan membangun ZOM
serta membandingkan kinerja ZOM di kabupaten Ngawi dengan metode Fuzzy K-Means
Clustering. Metode ini merupakan pengembangan dari metode partisi yang dikenal dengan K-
means. Kelebihan dari metode Fuzzy K-means adalah meminimalkan masalah kegagalan
konvergen yang terjadi pada metode K-means. Variabel yang digunakan adalah tinggi curah hujan
tiap stasiun di Kabupaten Ngawi. Hasil pengelompokkan terbaik dianalisis dengan menggunakan
MANOVA untuk mengetahui apakah ada perbedaan vektor rata-rata pada kelompok yang
terbentuk. Dari hasil analisis dapat disimpulkan bahwa jumlah kelompok ZOM yang terbentuk
dengan metode Fuzzy K-Means sebanyak lima ZOM dan ZOM yang tersebut lebih baik
dibandingkan dengan ZOM BMKG berdasarkan kriteria SW dan SB.
.
Kata kunci: Zona Musim (ZOM), Analisis Faktor, Fuzzy K-means Clustering, MANOVA
1. Pendahuluan Wichern, 2002). Analisis kelompok merupakan

Banyak penelitian klimatologi yang salah satu analisis data eksplanatori yang
bertujuan membuat kelompok stasiun atau bertujuan untuk menentukan kelompok dari
wilayah prakiraan iklim. Penggunaan data sekelompok objek.
kelompok stasiun lebih menguntungkan dari- Metode analisis kelompok yang
ada data masing-masing individu stasiun. Salah popular terdiri atas metode hierarkhi dan
satu keuntungan data kelompok stasiun adalah metode partisi. Analisis kelompok hierarkhi
data lebih homogen. Badan Meteorologi yang membentuk diagram dendogram dengan
Klimatologi dan Geofisika (BMKG) telah mendiskripsikan pengelompokkan berdasarkan
melakukan pengelompokkan iklim (pola curah jarak. Metode hierarkhi tidak dapat mengelom-
hujan) dengan membuat Zona Musim (ZOM) pokkan lebih dari dua objek secara langsung,
pada tahun 2009. Pembagian zona tidak sehingga objek dengan ukuran yang sama
dibatasi oleh wilayah administrasi kabupaten terhadap dua atau lebih objek lainnya dikelom-
atau kota, sehingga dalam satu zona tertentu pokkan secara acak (Johnson dan Wichern,
bisa mencakup beberapa kabupaten/ kota. 2002). Masalah lain pada metode hierarkhi
Untuk Propinsi Jawa Timur terbagi atas 37 adalah tidak mudah diterapkan pada kasus
ZOM dan khusus Kabupaten Ngawi terbagi dengan jumlah objek yang sangat besar.
atas 2 ZOM (www. staklimkarangploso.net). Jumlah objek yang sangat besar sangat sulit
Metode yang seringkali digunakan untuk digambarkan dalam bentuk diagram
dalam pembentukan ZOM adalah analisis dendogram. Di samping variabel yang
kelompok (cluster analysis). Analisis digunakan untuk pengelompokkan tidak boleh
kelompok adalah proses pengelompokan saling dependen.
objek-objek yang didasarkan pada ukuran Metode lain yang digunakan untuk
kesamaan atau ketidaksamaan (Johnson dan dapat mengatasi permasalahan pada metode
1
hierarkhi yaitu metode partisi atau biasa hubungan kovarian antara beberapa variabel
disebut juga dengan metode non-hierarkhi. yang mendasari tetapi tidak teramati, kuantitas
Salah satu metode partisi yang biasa digunakan random yang disebut faktor. Secara khusus
adalah metode K-means clustering. Metode K- analisis faktor dapat ditulis sebagai berikut :
means clustering dapat diterapkan pada kasus X 1 − µ1 = l11 F1 + l12 F2 + ... + l1m Fm + ε1
dengan jumlah objek yang sangat besar
X 2 − µ 2 = l 21 F1 + l 22 F2 + ... + l 2m Fm + ε 2
(Johnson dan Wichern, 2002). Kekurangan
dari metode K-means clustering adalah : : :
penentuan jumlah cluster yang paling tepat dan X p − µ p = l p1 F1 + l p 2 F2 + ... + l pm Fm + ε p
kemungkinan terjadinya kegagalan untuk Dengan :

konvergen, sehingga proses iterasi akan F j = Common factor ke-j
berlangsung secara terus-menerus (Agusta,
2007). l ij = Loading factor ke-j dan variabel ke-i
Pengelompokan dengan mempertim- ε i = Spesific factor ke-i
angkan tingkat keanggotaan yang mencakup dimana : i = 1, 2, ..., p dan j = 1, 2, ..., m
himpunan fuzzy sebagai dasar pembobotan
bagi pengelompokan disebut dengan fuzzy Dalam notasi matriks persamaan dapat
clustering (Jang et al, 1997). Metode fuzzy K- ditulis sebagai :
means clustering merupakan pengembangan X ( p×1) − µ( p×1) = L( p×m )F(m×1) + ε ( p×1)
dari metode K-means clustering untuk
meminimalkan masalah kegagalan konvergen Secara garis besar tahapan-tahapan
(Jang et al, 1997). Dengan menggunakan dalam melakukan analisis faktor adalah
metode fuzzy K-means clustering 1. Membentuk matrik korelasi dari ma-
diperkirakan akan mendapatkan ZOM triks X yang berukuran n × p
yang lebih homogen. 2. Menghitung nilai eigenvalue dan
Variabel yang digunakan dalam eigenvector dari matrik korelasi
pengelompokkan zona musim (ZOM) 3. Mengambil nilai eigenvalue yang lebih
adalah tinggi curah hujan bulanan dan besar dari 1
menggunakan pos-pos hujan di Kabupaten 4. Membentuk matriks yang berupa
Ngawi sebagai studi kasus. Untuk matriks loading factor , dengan
mendapatkan pengelompokkan terbaik rumus L = λ1 e1 ... λp e p , λ = eigen-
dianalisis dengan menggunakan
value dan e = eigen vector.
Multivariate Analysis of Varians
(MANOVA). MANOVA digunakan untuk 5. Setelah nilai loading factor diketahui
maka selanjutnya dapat dihitung nilai
mengetahui apakah ada perbedaan vektor
communality factor:
rata-rata pada kelompok yang terbentuk.
hi = li1 + l i 2 + ... + lim
2 2 2 2
Oleh karena itu, penelitian ini

bertujuan untuk mengkaji prosedur
pengelompokkan dan membangun ZOM di Himpunan Fuzzy
Kabupaten Ngawi dengan fuzzy K-means Konsep tentang himpunan fuzzy (fuzzy
clustering. Hasil pengelompokkan ZOM set = himpunan kabur) diperkenalkan pertama
akan dibandingkan dengan ZOM hasil kali pada bulan July 1964 oleh Prof. Lotfi A.
BMKG. Zadeh yang menyatakan bahwa ketidakpastian
dapat didekati dengan metode lain selain
pendekatan probabilitas, yaitu konsep
2. Tinjauan Pustaka himpunan fuzzy. Himpunan tegas atau
Analisis Faktor himpunan klasik merupakan himpunan dengan
Analisis faktor mengasumsikan suatu batas yang jelas.
struktur spesifik tertentu dalam sebuah model Jika X adalah kumpulan objek-objek
untuk variabel-varabel random. Johnson & yang dinyatakan secara umum oleh x, maka
~
Wichern (2002) mengatakan bahwa tujuan dari himpunan fuzzy A di X didefinisikan sebagai
analisis faktor adalah untuk menggambarkan
2
himpunan pasangan terurut sebagai n q
 q  n
A = {(x; µ A~ ( x )) | x ∈ X } G = ∑∑ µ .d − ∑ λ j  ∑ µ jl − 1
~ w
jl
2
jl
j =1 l =1 j =1  l =1 
dimana µ A~ ( x) : fungsi keanggotaan Untuk mendapatkan derajat
(membership function) untuk himpunan fuzzy keanggotaan tiap-tiap objek, turunan fungsi
~ Lagrange terhadap µ jl sama dengan nol dan
A (Jang et al, 1997).
diperoleh
Peranan himpunan fuzzy dalam
1
kelompok adalah dalam pembentukan fungsi µ jl = 1
dan tingkat keanggotaan dari setiap objek atau
 d 2jl  w−1
q
data dalam kelompok (Pravitasari, 2008).
Tingkat ke-fuzzy-an tidak berasal dari ∑ 
 d 2 
h =1  hl 

keacakan anggota himpunan, tetapi berasal dari
ketidakpastian dan ketidaktepatan pikiran serta dengan j = 1,..., n dan l = 1,2,..., q
konsep yang abstrak (Jang et al, 1997). Sedangkan pusat kelompok dapat
diperoleh dari turunan fungsi Lagrange
Fuzzy K-Means Clustering terhadap vl sama dengan nol. Jadi nilai vl
Fuzzy K-means clustering atau fuzzy diperoleh
n
isodata dikembangkan oleh Bezdek pada tahun
1981 untuk menyelesaikan masalah optimasi ∑µj =1
w
jl xj
(Agusta, 2007). vl = n
; ∀ l = 1,..., q
Metode K-means clustering memiliki
matriks keanggotaan biner yaitu 0 dan 1,
∑µ j =1
w
jl
sedangkan fuzzy K-means clustering memiliki

matriks keanggotaan kontinu antara 0 dan 1. Indeks XB (Xie dan Beni)
Pada fuzzy K-means clustering, fungsi
Untuk menentukan banyak kelompok
keanggotaan memiliki nilai antara 0 sampai 1
dapat dilakukan dengan menghitung Indeks
dengan fungsi pembatas berikut
q
XB (Xie dan Beni). Indeks ini ditemukan oleh
∑µ
l =1
jl = 1; ∀j = 1,..., n Xie dan Beni dan pertama kali dikemukakan
pada tahun 1991 (Pravitasari, 2008). Indeks
Derajat keanggotaan terbesar dari XB dituliskan sebagai berikut
n q
setiap objek menunjukkan kecenderungan
∑∑ (µ
2
objek tersebut menjadi anggota dari kelompok jl ) w x j − vl

j =1 l =1
tertentu. Prinsip utama dari fuzzy K-means XB =
n (min v h − v k )
2
clustering adalah meminimumkan fungsi h≠ k
objektif, yaitu jarak antara objek dengan setiap
pusat kelompok. dimana q = banyak kelompok, µ jl = derajat
n q n q
B = ∑∑ µ wjl .d 2jl = ∑∑ µ wjl x j − vl
2
keanggotaan, d 2jl = jarak pengamatan dengan
j =1 l =1 j =1 l =1
pusat kelompok vl = pusat kelompok dan n =
dengan :
banyak objek yang akan dikelompokkan, serta
vl = pusat kelompok ke-l
min vh − vk = jarak minimum antara pusat
2
µ jl = derajat keanggotaan pada objek ke-j
h≠k
dan kelompok ke-l
w = bobot (w > 1) kelompok v h dan vk .
xj = objek ke-j Kriteria banyak kelompok yang
B = fungsi objektif optimum ditunjukkan dengan nilai indeks XB
Tidak ada nilai w yang optimum, yang minimum pada lembah pertama.
tetapi nilai w yang sering digunakan adalah 2 Penggunaan indeks XB untuk menentukan
(Agusta, 2007). jumlah kelompok yang optimum pada metode
Fungsi objektif dapat diminimumkan fuzzy K-means clustering (CHEN Duo, LI Xue
dengan fungsi pembatas dengan menggunakan dan CUI Du-Wu 2007) menyatakan bahwa
pengganda lagrange indeks XB memiliki ketepatan dan keandalan
yang tinggi untuk memberikan jumlah
3
kelompok yang optimum pada metode fuzzy K- B+W = Jumlah Kuadrat Total Terkoreksi dan
means clustering. hasil kali silang.
Multivariate Analysis of Varian (MANOVA)

Pemeriksaan Asumsi Normal Multivariat
Multivariate Analysis of Variance dan Matrik Varian Kovarian
(MANOVA) merupakan teknik analisis yang
Pemeriksaan asumsi normal
digunakan untuk menguji tentang perbedaan
multivariat dilakukan untuk mengetahui
beberapa vektor rata-rata populasi (Johnson
distribusi data dari variabel independen. Untuk
dan Wichern, 2002). Model MANOVA
mempermudah pemeriksaan dilakukan
dinyatakan sebagai berikut
pemeriksaan distribusi normal multivariat
xij = µ + τ i + eij dengan menggunakan plot χ 2 dengan
dimana menghitung jarak d 2j = (x j − x )'S −1(x j − x ) ,

j = 1,2,..., n dengan xj = objek pengamatan
i = 1,2,..., g , j = 1,2,..., ni
ke-j dan n = banyak pengamatan S-1 = invers
eij merupakan residual Np (0,Σ). matriks varian kovarian berukuran p x p.
Apabila terdapat paling sedikit 50%
Tabel MANOVA untuk perbandingan vektor
rata-rata populasi disajikan pada Tabel 1 dari nilai d 2j ≤ χ (2p ;0 ,5) maka sebaran data
berikut dapat dikatakan mengikuti sebaran distribusi
Tabel 1 Matriks Jumlah Kuadrat MANOVA
normal multivariat atau dapat dilihat dari plot
χ2.
Sumber Matriks Jumlah Kuadrat dan hasil Derajat
variasi kali silang bebas Selanjutnya pemeriksaan dapat
dilanjutkan dengan melakukan pemeriksaan
g
matrik varian kovarian dari suatu data, variabel
Perla-
kuan
B = ∑ n i ( x i − x )( x i − x )' g-1 independen dalam hal ini tingkat curah hujan
i =1
tiap stasiun hujan setiap bulannya harus
g ni g memenuhi asumsi yaitu memiliki matriks
Residual
W = ∑∑ ( x ij − x i )( x ij − x i )' ∑n i −g varian kovarian yang sama. Untuk menguji
i =1 j =1 i =1
kehomogenan matriks varian kovarian antar
kelompok atau grup digunakan statistik uji
Total g ni g Box’s M (Karson, 1982).
B + W = ∑∑ ( xij − x )( xij − x )'
(Terko- i =1 j =1
∑n
i =1
i −1
H0 : Σ1 = Σ2 = ... = Σk
reksi)
H1 : minimal ada satu Σi yang berbeda
(Sumber : Johnson dan Wichern, 2002)
Misalkan Si adalah suatu estimasi tak bias dari
Statistik uji yang digunakan adalah Σi dengan derajat bebas ni pengamatan dari
Wilk’s Lambda dengan rumus sebagai berikut : populasi ke-i.
g ni k
1
W
∑∑ ( xij − xi )( xij − xi )' S= k ∑ (n i − 1) S i
Λ =
*
=
i =1 j =1
∑ (n i − 1) i =1
B +W g ni i =1
∑∑ ( x
i =1 j =1
ij − x )( xij − x )'
dengan S i = ( xi − x )( xi − x )
T
Tolak H0 jika Λ* > F g (α) merupakan estimasi dari matriks varian

p, ∑ ni − p −1 kovarian umum dan statistik ujinya adalah
i =1
k k
dimana W = Jumlah Kuadrat Dalam Perlakuan M = ∑ (ni − 1) ln S − ∑ (ni − 1) ln S i
dan hasil kali silang, B = Jumlah Kuadrat i =1 i =1
Antara Perlakuan dan hasil kali silang dan
4
  b. Uji kesamaan vektor rata-rata antar
2 p + 3p −1
2  k
1 1  kelompok yang terbentuk dengan
C −1 = 1 − ∑ − k  MANOVA
6 ( p + 1)( k − 1)  i =1 n i − 1
 ∑ ( n i − 1)  c. Mendapatkan ZOM baru de-ngan
i =1  mengidentifikasi anggota ZOM
dan tolak H0 jika MC > χ (1 / 2 ( k −1) p ( p +1)(α )
-1 2
dengan MANOVA.
3. Membandingkan kinerja ZOM antara
ZOM BMKG dan ZOM terbaik.
a. Membandingkan ZOM baru yang
3. Metodologi Penelitian didapat dengan ZOM milik
Data yang digunakan pada penelitian BMKG.
ini adalah data sekunder yang diperoleh dari b. Didapat ZOM terbaik dengan
Badan Meteorologi Klimatologi dan Geofisika kriteria nilai minimum Wilk’s
(BMKG). Data ini mencakup data zona curah Lambda.
hujan bulan Januari sampai Desember di
Kabupaten Ngawi.
4. Analisis dan Pembahasan
Letak pos hujan sesuai lintang dan
bujur dan pembagian zona musim (ZOM) di Deskripsi Umum Curah Hujan di Tiap
Kabupaten Ngawi digambarkan sebagai Stasiun
berikut Deskripsi curah hujan digunakan untuk
mengetahui gambaran tinggi curah hujan
bulanan di Kabupaten Ngawi. Tabel 2
menyajikan ringkasan dari curah hujan
meliputi ukuran pemusatan, nilai maksimum,
nilai minimum dan ukuran penyebaran tinggi
curah hujan di Kabupaten Ngawi.
Tabel 2 Deskripsi Tinggi Curah Hujan Bulanan di
Kabupaten Ngawi
Bulan Min Maks Rata- StDev
rata
Januari 219,62 387,89 289,91 45,20
Februari 243,23 417,37 303,92 47,04
Maret 220,16 368,95 288,94 49,05
Gambar 1 Zona Musim di Kabupaten Ngawi April 154,72 311,65 221,27 41,46
Dalam penelitian ini variabel yang Mei 54,08 124,95 87,24 21,61
digunakan adalah tinggi curah hujan tiap Juni 29,69 99,30 59,54 15,19
stasiun di Kabupaten Ngawi. Juli 18,00 46,05 30,23 7,73
Tiga tahapan analisis data, yaitu : Agustus 8,12 49,46 17,83 9,81
1. Pengelompokan ZOM di Kabupaten September 7,75 34,00 19,69 8,21
Ngawi. Oktober 81,85 155,05 121,88 16,90
a. Mendeskripsikan data curah hujan
November 160,93 296,38 227,37 38,75
yang merupakan hasil rataan dari
masing-masing stasiun di Desember 203,29 336,95 263,91 36,49
Kabupaten Ngawi.
Tabel 2 menunjukkan bahwa rata-rata
b. Mereduksi data curah hujan curah hujan pada Bulan Februari adalah
dengan Analisis Faktor. tertinggi di Kabupaten Ngawi, yaitu sebesar
c. Membentuk kelompok dengan 303,92 mm. Hal ini menunjukkan Februari
metode fuzzy K-means clustering. merupakan puncak dari musim penghujan.
2. Mendapatkan ZOM baru. Rata-rata curah hujan terendah terjadi Bulan
a. Uji asumsi multivariat normal dan Agustus, yaitu sebesar 17,83 mm. Ini berarti
uji kehomogenan matrik varian pada bulan ini merupakan puncak dari musim
kovarian. kemarau di Kabupaten Ngawi. Jika dilihat nilai
5
simpangan baku, pada Bulan Maret memiliki dapat dilihat pula bahwa pola sebaran data
simpangan baku tertinggi, artinya pada bulan tinggi curah hujan stasiun Mantingan tiap
tersebut terdapat variasi curah hujan diantara bulan tidak mengikuti pola sebaran distribusi
pos hujan di Kabupaten Ngawi. Menurut nilai normal.
range, yaitu selisih nilai minimum dan
maksimum yang besar, dapat diartikan tingkat
curah hujan setiap pos hujan di Kabupaten Analisis Faktor
Ngawi rendah. Pereduksian variabel dilakukan
Gambar 2 menjelaskan bahwa tipe dengan menggunakan input matriks faktor
curah hujan di Kabupaten Ngawi yaitu tipe korelasi dan matriks ekstrasi komponen utama
monsunal yang berarti bersifat monsun karena (principal component). Untuk memperjelas
dari gambar tersebut pola curah hujannya dalam menggambarkan karakteristik curah
membentuk huruf U. Selanjutnya dari Gambar hujan bulanan di Kabupaten Ngawi dilakukan
2 dapat diidentifikasi bahwa musim penghujan rotasi Varimax. Hasil loading faktor
di Kabupaten Ngawi mulai Bulan November – selengkapnya disajikan pada Tabel 3.
April, sedangkan musim kemarau terjadi pada Tabel 3 Nilai Loading faktor dengan Rotasi
Bulan Mei – Oktober. Varimax
Variabel/ F1 F2 F3 F4
Bulan
Januari 0,903 0,125 -0,141 0,174
Februari 0,890 0,102 0,169 -0,010
Maret 0,637 -0,025 0,534 -0,358
April 0,552 -0,130 0,679 0,223
Mei 0,331 0,791 0,461 -0,026
Juni 0,575 -0,016 -0,056 0,572
Juli 0,056 0,065 0,623 -0,111
Gambar 2 Rata-rata tinggi curah hujan menurut
bulan. Agustus 0,020 0,101 -0,140 -0,839
September 0,015 0,899 0,036 -0,084
Sebaran curah hujan di pos hujan
Oktober 0,071 0,599 -0,137 0,579
Mantingan sebagai contoh disajikan dalam
boxplot. Gambar 3 mengindikasikan bahwa November -0,122 0,290 0,786 0,314
terdapat data curah hujan yang outlier di Desember 0,708 0,516 0,296 -0,098
Stasiun Mantingan. Amatan outlier yang Keterangan: Yang diarsir dan bold mempunyai
terbanyak yaitu terjadi pada Bulan Juni - nilai loading tinggi masing-masing faktor.
September. Hal ini menunjukkan bahwa
meskipun pada bulan-bulan tersebut merupaka Tabel 3 menunjukkan bahwa faktor 1
periode musim kemarau, namun masih terjadi (F1) lebih menggambarkan musim penghujan,
hujan. yaitu meliputi curah hujan bulan Desember,
Januari, Februari, Maret. Faktor 2 dan faktor 3
400
lebih menggambarkan musim transisi, baik
300 transisi musim kemarau (April, Mei, dan Juli)
maupun musim penghujan (September,
Data
200
Oktober, dan November). Sementara faktor 4
100
lebih mengambarkan musim kemarau. Total
keragaman yang dapat dijelaskan dengan
0 empat komponen utama tersebut sebesar 78%.
i ri et il ei ni li s r er r r
ar ua ar
r
Ju Ju tu be be be
nu br Ap M
us ob
Ja M
Ag em kt ve
m
se
m
Fe pt O
Se No De
Gambar 3 Deskripsi tinggi curah hujan tiap bulan Fuzzy K-Means Clustering
di stasiun Mantingan Algorithma pengelompokkan dengan
Pada musim penghujan masih terdapat metode fuzzy K-means clustering sebagai
amatan yang outlier, namun jumlahnya tidak berikut :
sebanyak pada musim kemarau. Selain itu,
6
1. Menentukan jumlah kelompok dengan ZOM 5 : Karangjati, Jogorogo dan
menggunakan indeks XB. Kedung urung-urung.
2. Mengalokasikan data sesuai dengan Persebaran stasiun menurut kelompok
jumlah kelompok yang ditentukan sesuai ZOM hasil pengelom-pokkan dengan fuzzy K-
dengan kriteria indeks XB. means clustering disajikan Gambar 4.4 berikut.
3. Menghitung pusat dari masing-masing
kelompok.
4. Menghitung nilai fungsi keanggotaan
masing-masing data ke masing-masing
kelompok.
5. Bandingkan nilai keanggotaan matriks
partisi atau matriks fungsi keanggotaan
(U), apabila nilai U ( j +1) − U ( j ) < ε
maka telah konvergen dan proses iterasi
dihentikan. Apabila U (k +1) −U (k ) ≥ ε
Gambar 5 Persebaran stasiun menurut Zona
maka kembali ke langkah 3. Musim hasil fuzzy K-means clustering
Langkah awal proses pengelompokkan Gambar 5 diatas menjelaskan penge-
yaitu menentukan jumlah kelompok, yaitu lompokkan zona musim (ZOM) Kabupaten
dengan menggunakan bantuan indeks XB. Ngawi hasil metode fuzzy K-means clustering.
Dilakukan simulasi dengan jumlah kelompok ZOM dengan kode 1, 3 dan 4 telah membentuk
sebanyak 2 sampai dengan 6 kelompok. pola kelompok yang jelas, sedangkan ZOM
Berdasarkan nilai XB yang minimum kode 2 dan 5 lebih menyebar. ZOM 3
diperoleh jumlah kelompok sebanyak 5 diidentifikasi berada pada daerah pegunungan
kelompok, yaitu sebesar 1,0937. Plot antara dan ZOM 1 dan 4 diidentifikasi berada pada
nilai indeks XB dan banyaknya kelompok daerah dataran rendah (flat).
ditunjukkan pada Gambar 4.
Pada ZOM 2 dan 5 masing-masing
Scatterplot of Indeks XB vs Kelompok terdapat satu stasiun yang berada jauh dari
2,6
2,4
kelompoknya yaitu Mantingan pada ZOM 2
2,2
dan Karangjati pada ZOM 5. Beberapa
2,0 kemungkinan yang timbul sebagai akibat dari
Indeks XB
1,8 terpisahnya stasiun Mantingan dan stasiun

1,6
Karangjati dari zona musimnya yaitu adanya
1,4
amatan ekstrim tinggi curah hujan.
1,2
1,0
Berdasarkan identifikasi melalui sebaran curah
2 3 4
Kelompok
5 6
hujan (boxplot) Karangjati dan Kedung Urung-
urung pada bulan Juli dan Agustus memiliki
Gambar 4 Plot antara Nilai Indeks XB dan pola yang sama. Sementara pada Stasiun
Banyaknya Jumlah Kelompok. Mantingan dan Tretes terletak berdekatan yaitu
Anggota kelompok masing-masing zona berada di daerah pegunungan yang memiliki
musim (ZOM) adalah sebagai berikut: kemiripan secara geografis namun belum tentu
dengan tinggi curah hujannya.
ZOM 1 : Bekoh, Guyung, Sambiroto,
Padas dan Begal.
Multivariate Analysis of Varian (MANOVA)
ZOM 2 : Mardiasri, Paron, Ngawi dan
Mantingan. Pengujian perbedaan rata-rata
digunakan untuk melihat apakah
ZOM 3 : Ngrambe, Tretes dan
pengelompokkan yang dilakukan telah
Walikukun.
menghasilkan kelompok yang mempunyai
ZOM 4 : Kedunggalar, Ngadirejo/ perbedaan yang nyata. Analisis ini didasari
Sooko dan Ngale. oleh beberapa asumsi yaitu data yang dianalisis
7
harus berdistribusi normal multivariat dan Berdasarkan pengujian yang telah
matriks varian kovarian kelompok yang dilakukan, diperoleh nilai wilk’s lambda (Λ*)
homogen. sebesar 0,04. P-value yang diperoleh cukup
kecil yaitu sebesar 0,000 atau p-value < 0,05
Hasil pemeriksaan distribusi normal
untuk semua statistik uji diputuskan untuk
multivariat, diperoleh d 2j ≤ χ (24;0 , 05) dimana menolak H0, sehingga bisa dikatakan bahwa
χ (24;0, 05) = 9,488 adalah sebesar 66,7%. Hasil terdapat perbedaan rata-rata antar kelompok
zona musim (ZOM) yang terbentuk.
ini menunjukkan bahwa data mengikuti
distribusi normal multivariate. Untuk
pemeriksaan asumsi kehomogenan matrik Perbandingan ZOM BMKG dengan ZOM
varian kovarian ZOM yang terbentuk dengan Baru
metode fuzzy K-means clustering dengan uji
Pengelompokkan zona musim (ZOM)
Box’s M tidak dapat dilakukan, karena
dengan metode fuzzy K-means clustering
terdapat sedikitnya dua cell matrik kovarian
diperoleh 5 kelompok, sedangkan ZOM milik
nonsingular (ada indikasi matriks Σ tidak
Badan Meteorologi Klimatologi dan Geofisika
homogen). Hasil identifikasi secara parsial
(BMKG) mengelompokkan ZOM sebanyak 2
menunjukkan bahwa untuk variabel skor faktor
kelompok. Oleh karena itu ingin diketahui
4 tidak homogen antar ZOM.
perbandingan ZOM milik BMKG dengan
Seharusnya, jika tidak dapat dilakukan ZOM yang diperoleh dengan metode baru
uji Box’s M, maka dilakukan transformasi. yaitu dengan kriteria Wilk’s Lambda pada
Namun, pengelompokkan yang dilakukan yaitu MANOVA. Untuk MANOVA ini digunakan
dengan menggunakan score factor, sehingga score factor 1, 2 dan 3 sesuai dengan hasil uji
tidak dapat ditransformasi. Untuk memeriksa homogenitas. Penggunaan score factor ini juga
hal ini maka dilakukan uji kesamaan varian dilakukan pada MANOVA kelompok milik
dengan Bartlett. Tabel 4 dibawah ini BMKG.
menyajikan nilai statistik uji dan p-value hasil
Untuk menunjukkan uji homogenitas
uji Bartlett.
kelompok fuzzy dan kelompok BMKG dengan
Tabel 4 Uji kesamaan varian dengan Bartlett tiga score factor, maka hasil uji Box’s M
Score ditampilkan sebagai berikut
Factor 1 2 3 4 Tabel 5 Hasil Uji Homogenitas Kelompok Fuzzy
Nilai 4,85 3,71 2,62 10,39 dan BMKG
p-value 0,303 0,446 0,623 0,034 Kelompok Box's M F Sig
Score factor 1, 2 dan 3 menunjukkan Fuzzy 19,448 1,627 0,139
p-value yang lebih besar dari nilai α, maka BMKG 7,518 0,864 0,552
gagal tolak H0 berarti bahwa varian untuk
score factor 1, 2 dan 3 homogen. Namun untuk Tabel 5 mentunjukkan bahwa hasil uji
score factor 4 tidak signifikan karena p-value Box’s M dengan nilai signifikan untuk
< α = 0,05 berarti score factor 4 memiliki kelompok hasil fuzzy K-means clustering
varian yang berbeda dengan score factor yang sebesar 0,139 dan untuk kelompok BMKG
lain. Maka untuk analisis selanjutnya dengan sebesar 0,552. Kedua nilai signifikan tersebut
MANOVA hanya menggunakan score factor lebih besar dari nilai α = 0,05 yang berarti
yang memiliki varian sama yaitu score factor gagal tolak H0 maka dapat disimpulkan bahwa
1, 2 dan 3. matriks varian kovarian dari keempat
kelompok yang terbentuk adalah sama
Setelah asumsi normal multivariat dan (homogen).
kehomogenan matriks varian kovarian
terpenuhi, langkah selanjutnya yang dilakukan Semakin kecil nilai signifikan
adalah menguji perbedaan rata-rata dari kelima menunjukkan bahwa kelompok yang terbentuk
kelompok dengan MANOVA. Hipotesis yang semakin homogen yang berarti keragaman
digunakan adalah sebagai berikut dalam kelompok semakin kecil dan keragaman
antar kelompok semakin besar. Oleh karena
H0 : τ1 = τ2 = ...= τg = 0 itu, hasil pengelompokkan dengan fuzzy K-
H1 : minimal ada satu τi ≠ 0 means clustering lebih baik digunakan untuk
8
mengelompokkan ZOM Kabupaten Ngawi Anonim_b. (2009). Zona Musim Wilayah Jawa
dengan nilai signifikan terkecil. Timur. [http://
www.staklimkarangploso.net ] (On-
5. Kesimpulan line: Oktober, 12th 2009).
Berdasarkan hasil analisis dan Bunkers WJ, Miller JR, De Gaetano
pembahasan, maka diperoleh kesimpulan AT.(1996).Definition of Climate
sebagai berikut : Regions in the Northern Plains Using
1. Hal-hal yang perlu diperhatikan dalam an Objective Cluster Modification
algorithma Fuzzy K-Means Clustering Technique. J.Climate 9:130-146.
adalah penentuan jumlah kelompok. Oleh
Duo, C., Xue, L., Du-Wu, C., (2007). An
karena itu digunakan indeks XB untuk
Adaptive Cluster Validity Index for the
membantu menentukan jumlah kelompok
Fuzzy C-means, International Journal
yang optimum.
of Computer Science and Network
2. Pengelompokkan zona musim (ZOM) Security 7 No. 2, 146-156.
Kabupaten Ngawi menggunakan metode
fuzzy K-means clustering. Menentukan Jang, J. S, Sun, C. T., dan Mizutani, E. (1997).
jumlah kelompok yang akan digunakan Neuro-Fuzzy and Soft Computing,
pada prosedur fuzzy K-means Clustering Prentice Hall, New York.
dengan menggunakan kriteria indeks Xie Johnson, R. A, dan Wichern, D. W. (2002),
dan Beni (indeks XB) dan diperoleh Applied Multivariate Statistical
jumlah kelompok yang optimum sebanyak Analysis, Prentice Hall, New York.
5 kelompok. Penentuan anggota kelompok
Karson, M. J. (1982), Multivariate Statistical
menggunakan metode fuzzy K-means
Methods, First Edition, The Iowa State
clustering dan diperoleh kelompok ZOM
University Press, Ames-Iowa.
sebagai berikut
• ZOM 1 : Bekoh, Guyung, Sambiroto, Klawonn, F. dan Keller, A., (1997). Fuzzy
Padas dan Begal. Clustering and Fuzzy Rules. Science
Journal.
• ZOM 2 : Mardiasri, Paron, Ngawi dan
Mantingan. Noury, M., Khatami, H. R., Moeti, M. T., dan
Barani, G., (2008). “Rainfall-Runoff
• ZOM 3 : Ngrambe, Tretes dan Modeling Using Fuzzy
Walikukun. Methodology”,Journal of Applied
• ZOM 4 : Kedunggalar, Ngadirejo/ Sciences, Vol.8, No.16, hal. 2851-
Sooko dan Ngale. 2858.
• ZOM 5 : Karangjati, Jogorogo dan Ping, K. S and Salim, N. 2006. Optimized
Kedung urung-urung. Subtractive Clustering for Cluster-
3. Berdasarkan nilai Wilk’s Lambda Based Compound Selection. Putrajaya.
menunjukkan bahwa ZOM fuzzy K-means Malaysia.
clustering mempunyai kinerja yang lebih Regariana, Cut Meurah. (2005). Modul Cuaca
baik daripada ZOM BMKG. Hal ini dan Iklim Geografi kelas X (sepuluh).
ditunjukkan dengan nilai Wilk’s Lambda
ZOM hasil fuzzy K-means clustering lebih Sarjani. (2009). Cuaca dan Iklim Geografi
kecil daripada ZOM BMKG. kelas 1.
Zong-yi, X., Yong, Z., Li-min, J., dan Wei-li,
H. (2005), “Construct Interpretable
Daftar Pustaka Fuzzy Classification System based on
Agusta, Y. (2007), “K-means-Penerapan, Fuzzy Clustering Inilization”,
Permasalahan dan Metode Terkait”, Iinternational Journal of Information
Jurnal Sistem dan Informatika, Vol. 3, Technology, Vol.11, No. 6, hal. 91-
hal. 47-60. 107.
Anonim_a. (2009).Cuaca dan Iklim. [http://
www.petualangan.com ] (On-line:
July, 4th 2009).

Fuzzy

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Fuzzy

Uploaded by

Copyright:

Available Formats

Pengelompokkan Zona Musim (ZOM) dengan Fuzzy K-Means Clustering

(Studi Kasus :Pengelompokkan ZOM di Kabupaten Ngawi)

1. Pendahuluan Wichern, 2002). Analisis kelompok merupakan

kemungkinan terjadinya kegagalan untuk Dengan :

Oleh karena itu, penelitian ini

sedangkan fuzzy K-means clustering memiliki

objek tersebut menjadi anggota dari kelompok jl ) w x j − vl

Multivariate Analysis of Varian (MANOVA)

dimana menghitung jarak d 2j = (x j − x )'S −1(x j − x ) ,

Tolak H0 jika Λ* > F g (α) merupakan estimasi dari matriks varian

1,8 terpisahnya stasiun Mantingan dan stasiun

You might also like