You are on page 1of 19

KELOMPOK 5

Fitrinadi J1F114021
Muhamad Ridho Iryananda J1F114083
Clustering atau analisis cluster adalah :
 Proses pembentukan kelompok data (cluster) dari himpunan data yang tidak
diketahui kelompok-kelompok atau kelas-kelasnya.
 Proses menentukan data-data termasuk ke dalam cluster yang mana.
Bisa dibilang, clustering merupakan proses untuk mengetahui kelas-kelas atau
taksonomi atau botryologi, atau analisis topologi dari data-data yang ada. Dilihat
dari kacamata data mining, clustering bukanlah proses klasifikasi. Karena dalam
proses klasifikasi, data dikelompokkan ke dalam kelas-kelas yang telah diketahui
sebelumnya.
Ada beberapa metode atau model untuk melakukan clustering, antara lain :
• Model connectivity.
• Model centroid.
• Model density.
• Model subspace.
• Model group.
• Model graph based.

Algoritma k-means merupakan model centroid. Model centroid adalah model yang
menggunakan centroid untuk membuat cluster. Centroid adalah “titik tengah” suatu
cluster. Centroid berupa nilai. Centroid digunakan untuk menghitung jarak suatu objek
data terhadap centroid. Suatu objek data termasuk dalam suatu cluster jika memiliki
jarak terpendek terhadap centroid cluster tersebut.
 K-means ditemukan oleh beberapa orang yaitu Lloyd (1957, 1982), Forgey (1965) ,
Friedman and Rubin (1967) , and McQueen (1967). Ide dari clustering pertama kali
ditemukan oleh Lloyd pada tahun 1957, namun hal tersebut baru dipublikasi pada
tahun 1982. Pada tahun 1965, Forgey juga mempublikasi teknik yang sama
sehingga terkadang dikenal sebagai Lloyd-Forgy pada beberapa sumber.
 K-Means adalah suatu metode penganalisaan data atau metode Data Mining yang
melakukan proses pemodelan tanpa supervisi (unsupervised) dan merupakan
salah satu metode yang melakukan pengelompokan data dengan sistem partisi.
Metode k-means berusaha mengelompokkan data yang ada ke dalam beberapa
kelompok, dimana data dalam satu kelompok mempunyai karakteristik yang sama
satu sama lainnya dan mempunyai karakteristik yang berbeda dengan data yang
ada di dalam kelompok yang lain. Dengan kata lain, metode ini berusaha untuk
meminimalkan variasi antar data yang ada di dalam suatu cluster dan
memaksimalkan variasi dengan data yang ada di cluster lainnya.
dimana :
dij = Jarak objek antara objek i dan j
P = Dimensi data
Xik = Koordinat dari obyek i pada dimensi k
Xjk = Koordinat dari obyek j pada dimensi k
1. Tentukan banyaknya cluster.
2. Tentukan centroid setiap cluster.
3. Hitung jarak data dengan centroid menggunakan rumus Euclidian.
4. Kelompokkan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak
terpendek.
5. Proses kembali lagi ke langkah no. 2. Sampai centroid tidak mengalami
perubahan (sama dengan centroid sebelumnya).
Data Tinggi dan Berat
1. Tentukan Banyaknya Cluster
Kluster = 2

2. Tentukan centroid setiap cluster.


3. Hitung jarak data dengan centroid menggunakan rumus Euclidian
4. Kelompokkan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak
terpendek.
Kemudian Hitung Centroid baru

Iterasi I
5. Proses kembali lagi ke langkah no. 2. Sampai centroid tidak mengalami
perubahan (sama dengan centroid sebelumnya).
Iterasi II
 https://yudiagusta.wordpress.com/k-means/
 http://sharewy.blogspot.co.id/2013/04/algoritma-k-means-clustering.html
 https://informatikalogi.com/algoritma-k-means-clustering/
 M. Ridho Handoko (+4)  Nazarudin Syah (+4)
 Siti Mulyana (+4)  Edri Adi Setiawan (+4)
 M. Latief Saputra (+4)  Humaera Nur A. (+4)
 Riza Susanto (+4)
 Khairi Ihsan (+4)
 Rahmah Hayati (+4)
 M. Naseruddin (+4)
 Try Isman H. (+4)
 Halimatus Sa’diah (+4)
 Qurratu Ainiati (+4)
 Rahmad Hidayat (+4)
 Patrick Josealdo R. (+4)
 Husna Rusdiani (+4)
 Ketut Mega Fortuna (+4)
 Reviyan Akbar A. (+4)
 M. Rosandy (+4)

You might also like