Professional Documents
Culture Documents
BAB I
PENDAHULUAN
1
1.3 Tujuan
1. Mendeskripsikan algoritma Fuzzy C-Means
2. Mendeskripsikan contoh penerapan algoritma Fuzzy C-Means dalam kasus
penentuan jurusan SMA.
1.5 Manfaat
1. Manfaat teoritis : dapat menjadi referensi untuk penggunaan algoritma Fuzzy
Clustering Means untuk diterapkan pada kasus lain.
2. Manfaat praktis : dapat memberi pertimbangan untuk meningkatkan akurasi
dalam proses pengelompokan siswa dalam memilih jurusan berdasarkan prestasi
siswa.
2
BAB II
TINJAUAN PUSTAKA
A. Algoritma
B. Konsep Clustering
Clustering merupakan suatu metode untuk mencari dan mengelompokkan data yang
memiliki kemiripan karakteristik antara satu data dengan data yang lain. Tujuan utama
dari metode clustering adalah pengelompokan sejumlah data ke dalam cluster (group)
sehingga dalam setiap cluster akan berisi data yang semirip mungkin.
Fuzzy Cluster Means (FCM) adalah suatu tehnik pengelompokan yang mana
keberadaan tiap-tiap titik data dalam suatu kelompok (cluster) ditentukan oleh derajat
keanggotaan. Kelebihan FCM adalah dapat melakukan clustering lebih dari satu variable
secara sekaligus. Tehnik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.
Konsep dasar FCM, pertam ialah menentukan pusat cluster yang akan menandai
lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum
akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan
cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data secara
3
berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi yang
tepat. Perulangan ini didasarkan pada minimasi fungsi objektif yang menggambarkan
jarak dari titik data yang diberikan ke pusat cluster terbobot oleh derajat keanggotaan titik
data tersebut.
Metode Fuzzy Clustering mengijinkan objek untuk menjadi bagian dari beberapa
kelompok secara bersamaan dengan perbedaan level keanggotaan. Sebagai contoh dalam
hard clustering, missal himpunan data Z ^z1 , z 2 , z3 ,..., z10 ` jika dibagi menjadi 2
kelompok maka himpunan U yang merupakan matriks pasrtisi yang menunjukan level
keanggotaan elemen himpunan Z dalam kelompok A 1 atau A 2 akan menjadi sebagai
berikut :
ª1 1 1 1 1 1 0 0 0 0º
U « »
¬0 0 0 0 0 0 1 1 1 1¼
Baris atas matriks partisi U menunjukan level keanggotaan elemen himpunan Z dalam
A1 dan baris bawah menunjukan level keanggotaan elemen himpunan Z dalam A . 2
Tampak bahwa setiap elemen himpunan Z secara khusus atau penuh akan menjadi
anggota kelompok (A 1atau A ) 2dengan level keanggotaan 1. Dan tidak menjadi anggota
dalam suatu kelompok dengan level keanggotaan 0. x1 , x2 , x3 , x4 , x5 , x6 secara khusus
Sementara itu dalam fuzzy clustering level keanggotaan data dalam suatu kelompok
bukan hanya 0 dan 1 akan tetapi dapat memiliki nilai interval > ,0@1 . Baris ke i dalam
matriks partisi mengandung level keanggotaan i terhadap A . i Nilai level keanggotaan
dalam setiap kolom matriks partisi yang berarti nilai keanggotaan data dalam setiap
kolom akan selalu berjumlah 1.
Sebagai contoh : himpunan Z ^z1 , z 2 , z3 ,..., z10 `. Jika himpunan Z dibagi menjadi 2
kelompok Z1dan Z ,2 maka matriks partisi U dapat dituliskan seperti berikut :
4
ª1 1 1 ,0
7 ,04 2 0 0 0 1º
,0
U « »
¬0 0 0 ,0
3 ,0
6 ,0
8 1 1 1 0¼
c n
¦¦
2
Pik w u X ij Vkj
i 1 j 1
XB 2
n u min k , j Vk Vj
c = banyak kluster
n = banyak objek yang dikelompokkan
Pik = derajat keanggotaan fuzzy
w = pangkat pembobotan
nu min k , j Vk V j = jarak minimum antara pusat klaster Vk dan Vj
5
BAB III
PEMBAHASAN
Salah satu teknik fuzzy clustering adalah Fuzzy C-Means (FCM). Fuzzy C-Means
(FCM) adalah suatu teknik pengklasteran data yang keberadaan tiap-tiap data dalam
suatu cluster ditentukan oleh nilai/derajat keanggotaan tertentu. Dalam FCM setiap
data bisa menjadi anggota dari beberapa cluster. Konsep dasar Fuzzy C-Means,
pertama kali ialah menunjukkan pusat cluster yang akan menandai lokasi rata-rata
untuk tiap-tiap cluster. Pada kondidi awal, pusat cluster ini masih belum akurat. Tiap-
tiap data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara
memperbaiki pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maka
akan terlihat bahwa pusat cluster akan bergerak menuju lokasi yang tepat. Perulangan
ini didasarkan pada minimasi fungsi objektif. Algoritma Fuzzy C-Means (FCM)
diberikan sebagai berikut :
6
c. Maksimum iterasi = Maxlter;
d. Error terkecil =[ ;
Pik Pik
(2)
Qi
d) Hitung pusat cluster ke-k; V jk GLPDQD N ,,,..,F GDQ M ,,,«,P, GHQJDQ
persamaan sebagai berikut :
¦ P
n
w
ik X ij
V jk i 1
n (3)
¦ Pik w
i 1
ij
k 1 ¬j 1 ¼
'LPDQD L ,,«,Q GDQ N ,,«F
g) Langkah terakhir adalah dengan mengecek kondisi berhenti dengan ketentuan
sebagai berikut
a. Jika Pt Pt 1 [ atau (t> iterasi maksimal) maka berhenti
7
h) Jika tidak, maka t=t+1 kemudian ulangi langkah 4.
Bidang Minat
Kimia Ekonomi
Biologi Geografi
1. Data
Data siswa SMA akan dilakukan pengujian tingkat akurasi algoritma Fuzzy C-
Means dalam pemetaan kesamaan minat siswa SMA berdasarkan mata pelajaran
bidang peminatan dan menentukan kevalidan suatu cluster menggunakan Index XB
(Xie-Beni).
9
a. Contoh Data
Contoh data yang digunakan ialah nilai sebelum dan setelah penjurusan siswa
SMA. Sampel data yang di pakai ialah sebanyak 25 dari100 siswa. Adapun parameter
data yang digunakan ialah : jurusan MIA, jurusan IIS dan jurusan Bahasa.
10
23 76,8 78,6 73,5
24 75,3 71,2 77,6
25 76,1 72,4 73,4
11
Nilai Rata-Rata Setelah Peminatan
Siswa Jurusan yang Dipilih
Kelas X Kelas XI Kelas XII
1 Bahasa 75,5 76,7 81
2 IIS 66 69 78
3 MIA 76 85 85
4 Bahasa 89 90 92
7 IIS 69 65,5 74
11 Bahasa 78 76,5 82
12 IIS 65 71 69
14 IIS 67,5 65 74
15 Bahasa 69,5 70 74
16 MIA 68 71 71
17 IIS 70 70 74
18 Bahasa 76 80,5 79
20 MIA 74 71 74,5
12
21 MIA 69,5 73,5 74
25 MIA 65 72 72
b. Metode Pengukuran
Dalam penerapan algoritma Fuzzy C-Means ketika mencari akurasi dalam
penjurusan diuji dengan cara sebagai berikut :
1. Data sampel siswa dan nilai rata-rata mata pelajaran peminatan sebelum
peminatan dikelompokkan dengan algoritma Fuzzy C-Means untuk membagi
siswa kedalam bidang minat tertentu (MIA, IIS, dan Bahasa)
2. Hasil peminatan Fuzzy C-Means dibandingkan dengan hasil peminatan yang
telah didapat dari sekolah.
3. Jika minat yang dipilih siswa sama dengan peminatan FCM dan nilai rata-rata
mata pelajaran peminatan yang diperoleh setelah peminatan lebih dari atau
sama dengan KKM yang ideal t 75 , PDND )&0 GLQ\DWDNDQ ³DNXUDW´
4. Jika minat yang dipelih siswa sama dengan FCM dan nilai rata-rata mata
pelajaran peminatan yang diperoleh setelah peminatan kurang dari KKM yang
ideal t 75 , PDND )&0 GLQ\DWDNDQ ³WLGDN DNXUDW´
5. Jika minat yang dipilih oleh siswa tidak sama dengan FCM dan nilai rata-rata
mata pelajaran yang diperoleh setelah peminatan lebih dari atau sama dengan
KKM yang ideal t 75 , PDND )&0 GLQ\DWDNDQ ³WLGDN DNXUDW´
6. Jika minat yang dipilih siswa tidak sama dengan FCM dan nilai rata-rata mata
pelajaran peminatan yang diperoleh setelah peminatan kurang dari KKM yang
ideal t 75 , PDND )&0 GLQ\DWDNDQ ³DNXUDW´
13
1. Input data yang akan di-cluster X, berupa matriks berikut berukuran n u m (n =
jumlah sample data, yaitu 25, m = parameter yaitu 3), dimana X adalah
ij data
sample ke-i (i=1,2,3,..,n), atribut ke-j (j=1,2,3,..m).
2. Selanjutnya, tentukan nilai-nilai awal perhitungan seperti, jumlah cluster,
pangkat, iterasi maksimal, error terkecil yang diharapkan( [ ), fungsi objektif
awal dan iterasi awalnya.
Tentukan :
a. Jumlah cluster = 3
b. Pangkat (bobot) = 2
c. Maksimum iterasi = 20
d. Error terkecil = 0,001
e. Fungsi objektif awal = (P0) = 0
f. Iterasi awal = (t) = 1
14
ª ,02453 ,06038 1509 º
,0
« »
«,00299 ,02722 ,06979»
«,04228 ,0
1988 ,03784»
« »
«,01246 ,00154 ,0
86 »
« ,0995 ,07468 1537 »
,0
« »
«0.,613 ,04451 ,03936»
«,00616 ,0
9318 ,00066»
« »
« ,0135 ,0466 399 »
,0
«,02598 ,04186 ,03216»
« »
«,00089 ,0
8462 1449 »
,0
« »
«,01568 ,0
5252 ,0
318 »
«,01372 ,02026 ,06602»
« »
«,01859 ,06721 ,0
142 »
«,00722 ,08381 ,00897»
« »
«,06392 ,00196 ,03412»
«,00846 ,06813 ,02341»
« »
«,00934 ,03795 ,05271»
« »
«,00589 ,0
8318 ,0
1093 »
«,01587 ,05028 ,03386»
« »
«,00224 ,07095 ,02681»
«,02007 ,04289 ,03704»
« »
«,00933 ,0
3046 ,06021»
«,02637 ,0
1897 ,05466»
« »
«,03617 ,0
1934 ,04449»
« »
¬,00232 ,06822 ,02946¼
¦ P
n
w
ik X ij
V jk i 1
n
¦ P ik
w
i 1
15
Table 1.3 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Kluster 1
Derajat
Keanggotaan Data yang di
(Pi 1) 2 u Xi1 ( Pi 1) 2 u Xi 2
Siswa pada Kluster kluster ( Pi 1) 2 ( Pi 1) 2 u Xi 3
1
( Pi 1) Xi1 Xi2 Xi3
16
Jumlah 2,148 161,73 155,5 162,4
¦ P
n
w
ik X ij
V jk i 1
n 75,31 72,36 75,58
¦ Pik w
i 1
Table 1.4 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Kluster 2
Derajat
Keanggotaan Data yang di
( Pi 2) 2 ( Pi 2) 2 u Xi1 ( Pi 2) 2 u Xi 2
Siswa pada Kluster kluster ( Pi 2) 2 u Xi 3
2
( Pi 2) Xi1 Xi2 Xi3
17
20 0,7095 74,7 72,4 72,1 0,504 37,60 36,5 36,29
21 0,4289 74 71,3 71,9 0,19 13,62 13,2 13,22
22 0,3046 70,6 78,5 76,6 0,093 6,55 7,28 7,1
23 0,1897 76,8 78,6 73,5 0,036 2,76 2,83 2,65
24 0,1934 75,3 71,2 77,6 0,037 2,9 2,66 2,91
25 0,6822 76,1 72,4 73,4 0,465 35,42 33,69 34,16
Jumlah 7,5542 556,36 5559,791 561,88
¦ P
n
w
ik X ij
V jk i 1
n 73,65 74.1 73.38
¦ Pik w
i 1
Table 1.5 Hasil Perhitungan Pusat Klaster pada Iterasi Pertama Kluster 3
Derajat
Keanggotaan Data yang di
(Pi 3) 2 u Xi1 ( Pi 3) 2 u Xi 2 ( Pi 3) 2 u Xi 3
Siswa pada Kluster kluster ( Pi 3) 2
3
( Pi 3) Xi1 Xi2 Xi3
18
14 0,0897 73,1 73,9 72,5 0,0081 0,6 0,6 0,58
15 0,3412 71.9 73.2 74.9 0,116 8,37 8,522 8,72
16 0,2341 74,3 73,2 70,3 0,06 4,08 4,012 3,86
17 0,5271 78,3 79,2 79 0,3 21,75 22,00 21,95
18 0,1093 71,8 74,3 77,9 0,012 0,86 0,89 0,93
19 0,3385 74,1 75,3 80,3 0,12 8,49 8,7 9,2
20 0,2681 74,7 72,4 72,1 0,08 5,4 5,21 5,18
21 0,3704 74 71,3 71,9 0,2 10,16 9,78 9,86
22 0,6021 70,6 78,5 76,6 0,37 25,59 28,5 27,76
23 0,5466 76,8 78,6 73,5 0,3 22,95 23,48 21,96
24 0,4449 75,3 71,2 77,6 0,2 14,91 14,09 15,36
25 0,2946 76,1 72,4 73,4 0,09 6,61 6,29 6,37
Jumlah 4,150 305,39 315,52 307,18
¦ P
n
w
ik X ij
V jk i 1
n 73,57 76,01 74
¦ Pik w
i 1
19
§ªm 2º
·
TK 3 ¨«¦
¨j1
X i 3 V 3 j »Pi 3 w ¸
¸
©¬ ¼ ¹
( Pi 1) 2 ( Pi 2) 2 ( Pi 3) 2
20
17 0,008 0,144 0,3 0,589 11,41 15,98 27,98
ª § 2º
·
Vkj »P
n c m
Pt ¦¦ ¦¨
¨« X ij ik w
¸
¸ 371,826
i 1 k 1 ©¬j 1 ¼ ¹
( Pi 3)
( Pi 1) ( Pi 2)
Siswa TK1 TK2 TK3 KT=K1+K2+K3
TK1 KT TK2 KT TK3 KT
21
3 1,59 1,129 6,46 9,166 0,17269 0,123156 0,704155
22
24 0,71 1,08 7,73 9,53 0,074493 0,113594 0,811913
§ ,74
9 ,74
7 9·
,73
¨ ¸
V 15 ¨ ,74
1 74 ,74
4¸
¨ ,73 4¸
© 9 ,75
4 ,74
¹
24
ª0 1 0º
« »
«0 0 1»
«0 0 1»
« »
«0 0 1»
«0 1 0»
« »
«0 1 0»
«0 1 0»
« »
«0 1 0»
«0 1 0»
« »
«0 1 0»
« »
«0 1 0»
«0 0 1»
« »
«0 1 0»
«0 1 0»
« »
«1 0 0»
«0 1 0»
« »
«0 0 1»
« »
«0 1 0»
«0 1 0»
« »
«0 1 0»
«0 0 1»
« »
«0 0 1»
«1 0 0»
« »
«0 0 1»
« »
¬1 0 0¼
Jadi, dari hasil perhitungan matriks partisi U15. Maka nilai rata-rata sebelum
peminatan dibandingkan dengan derajat keanggotaan pada iterasi terakhir,
sehingga mengetahui siswa masuk pada kluster yang mana, apakah sesuai dengan
peminatan yang siswa pilih atau tidak.
25
Tabel 1.8 Derajat Keanggotaan Tiap Data Pada Setiap Klaster dengan
FCM (Pada Iterasi Terakhir)
X1 X2 X3 ( Pi 1) ( Pi 2) ( Pi 3) C1 C2 C3
11 74 69,8 80,3 0 1 0 *
17 78,3 79,2 79 0 0 1 *
26
18 71,8 74,3 77,9 0 1 0 *
21 74 71,3 71,9 0 0 1 *
§ ,74
9 ,74
7 9·
,73
¨ ¸
V 15 ¨ ,74
1 74 ,74
4¸
¨ ,73 4¸
© 9 ,75
4 ,74
¹
Dari data tersebut, diperoleh tiga kelompok berdasarkan nilai rata-rata mata pelajaran
peminatan, yaitu :
x Kelompok pertama, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran
peminatan Mia sekitar 74,9; nilai rata-rata mata pelajaran IPS sekitar 74,7; dan
nilai rata-rata mata pelajaran peminatan Bahasa sekitar 73,9.
x Kelompok kedua, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran
peminatan Mia sekitar 74,1; nilai rata-rata mata pelajaran IIS sekitar 74; dan nilai
rata-rata mata pelajaran peminatan Bahasa sekitar 74,4.
x Kelompok ketiga, terdiri atas siswa yang memiliki nilai rata-rata mata pelajaran
peminatan Mia sekitar 73,9; nilai rata-rata mata pelajaran IIS sekitar 75,4; dan
nilai rata-rata mata pelajaran peminatan Bahasa sekitar 74,3.
a. Pada klaster baris pertama, nilai yang paling tinggi berada pada kolom pertama
(peminatan MIA), maka klaster pertama merupakan kelompok peminatan MIA.
27
b. Pada klaster baris kedua, nilai yang paling tinggi berada pada kolom ketiga
(peminatan Bahasa), maka klaster kedua merupakan kelompok peminatan Bahasa.
c. Pada klaster baris ketiga, nilai yang paling tinggi berada pada kolom kedua
(peminatan IIS), maka klaster ketigaa merupakan kelompok peminatan IIS.
Tabel 1.9 Hasil Peminatan yang Dipilih dan Hasil Peminatan yang
Dihasilkan oleh FCM
Yang di
MIA IIS Bahasa FCM Kelas X Kelas XI Kelas XII
Pilih
28
13 73,7 73,9 71,4 IIS Bahasa 71,5 74 69,5
Yang di
MIA IIS Bahasa FCM Kelas X Kelas XI Kelas XII
Pilih
29
MIA IIS Tidak Tidak Tidak
3 77,5 70,6 74,6
Akurat Akurat Akurat
30
23 76,8 78,6 73,5 IIS MIA Akurat Akurat Akurat
¦¦
2
Pik w u X ij Vkj
i 1 j 1
XB 2
n u min k , j Vk Vj
c = banyak kluster
n = banyak objek yang dikelompokkan
Pik = derajat keanggotaan fuzzy
w = pangkat pembobotan
nu min k , j Vk V j = jarak minimum antara pusat klaster Vk dan Vj
C1 6367,03
C2 25468,1
C3 1018,72
31
Dari hasil perhitungan ini didapat suatu hasil dimana klaster 1 akan dinyatakan
³cukup akurat´, NOXVWHU DNDQ GLQ\DWDNDQ ³sangat akurat´, GDQ klaster 3 akan dinyatakan
³WLGDN akurat´.
Tabel 1.12 Tabel Akurasi Hasil Index Xie-Beni
1 0 1 0 C2 Sangat Akurat
2 0 0 1 C3 Cukup Akurat
3 0 0 1 C3 Cukup Akurat
4 0 0 1 C3 Cukup Akurat
5 0 1 0 C2 Sangat Akurat
6 0 1 0 C2 Sangat Akurat
7 0 1 0 C2 Sangat Akurat
8 0 1 0 C2 Sangat Akurat
9 0 1 0 C2 Sangat Akurat
10 0 1 0 C2 Sangat Akurat
11 0 1 0 C2 Sangat Akurat
12 0 0 1 C3 Cukup Akurat
13 0 1 0 C2 Sangat Akurat
14 0 1 0 C2 Sangat Akurat
15 1 0 0 C1 Akurat
32
16 0 1 0 C2 Sangat Akurat
17 0 0 1 C3 Cukup Akurat
18 0 1 0 C2 Sangat Akurat
19 0 1 0 C2 Sangat Akurat
20 0 1 0 C2 Sangat Akurat
21 0 0 1 C3 Cukup Akurat
22 0 0 1 C3 Cukup Akurat
23 1 0 0 C1 Akurat
24 0 0 1 C3 Cukup Akurat
25 1 0 0 C1 Sangat Akurat
33
BAB IV
PENUTUP
4.1 Kesimpulan
1. Fuzzy C-Means (FCM) adalah suatu teknik pengklasteran data yang
keberadaan tiap-tiap data dalam suatu cluster ditentukan oleh nilai/derajat
keanggotaan tertentu. Algoritma Fuzzy C-Means ialah sebagai berikut:
a) Input data yang akan di-cluster X, berupa matriks berikut berukuran
n u m (n = jumlah sample data, m = atribut setiap data), dimana X adalah
ij
34
4.2 Saran
a. Bagi yang menginginkan menggunakan algoritma fuzzy c-means dapat
menggunakannya pada kasus untuk menentukan besar uang kuliah tunggal
mahasiswa dan sebagiannya.
35