You are on page 1of 9

ANALISIS PENGELOMPOKAN DESA TERTINGGAL DI KABUPATEN KUTAI TIMUR DENGAN PENDEKATAN METODE K-MEANS DAN WARD (Squared Euclidean

Distance Measure)

Adi Wijaya NRP. 1310201720 Program Pascasarjana, Jurusan Statistika, Fakultas MIPA, Institut Teknologi Sepuluh Nopember, Surabaya

Abstract

Poverty is one of the complicated problems in Indonesia and many countries. In Indonesia especially in East Kutai (Kutai Timur), the government has published many policies to press the poverty rate. However, poverty is not only about people but also about related to surrounding areas like village. Therefore, this research uses culstering analysis method to find how many clusters will be produced by this method and how many villages that be included in each cluster. The different methods used in this research are non-hierarchical method with k-means clustering analysis and hierarchical method with Wards method using squared euclidean distance measure . The results show that the number of clusters of villages in East Kutai is two clusters with different member of each cluster of each method. Keywords: poverty, villages, k-means clustering, Wards method, squared euclidean distance 1. Pendahuluan Salah satu masalah utama saat ini baik di negara-negara miskin, berkembang maupun di negara-negara maju adalah kemiskinan. Kemiskinan merupakan awal dari timbulnya masalah-masalah sosial lainnya yang terkait erat dengan kualitas pendidikan, kriminalitas, kelaparan dsb yang secara tidak langsung akan mengganggu ketahanan atau stabilitas negara (Arisanti, 2008). Oleh karena itu pemerintah daerah di tiap negara berjuang keras untuk mengatasi masalah kemiskinan dengan beragam kebijakan-kebijakan, termasuk daerah-daerah di Indonesia. Kutai Timur sebagai salah satu kabupaten di Propinsi Kalimantan Timur juga berjuang untuk mengatasi kemiskinan di daerahnya dengan beragam kebijakan baik nasional maupun lokal antara lain bantuan langsung tunai (BLT), pelayanan kesehatan gratis (JAMKESMAS), pendidikan gratis dsb. Selain itu pembangunan sarana-sarana

penunjang kebijakan-kebijakan tersebut juga ditingkatkan baik dari segi jumlah maupun kualitas di berbagai lini dari desa, kecamatan hingga tingkat kabupaten (BPS, 2009). Salah satu langkah awal memerangi kemiskinan adalah dengan mengetahui kantong-kantong kemiskinan di Kabupaten Kutai Timur. Kantong-kantong

kemiskinan ini merupakan kelompok desa-desa yang memiliki kedekatan karakteristik sarana dan kemiripan dalam nilai-nilai sejumlah variabel sehingga didefinisikan sebagai desa tertinggal. Dengan mengetahui secara geografis desa-desa yang mengalami ketertinggalan, diharapkan akan lahir kebiijakan-kebijakan yang tepat sasaran dan efektif dalam memerangi kemiskinan di Kutai Timur. Badan Pusat Statistik telah melakukan perhitungan skor desa tertinggal sejak 1993 sebagai penentu identifikasi daerah kantong-kantong kemiskinan melalui data Potensi Desa. Akan tetapi untuk mengklasifikasian tertinggal tidaknya suatu desa, dilakukan oleh Kementerian Pembangunan Daerah Tertinggal berdasarkan pada nilai skor yang diperoleh setiap desa. Metode yang digunakan BPS dalam menentukan skor desa adalah dengan nilai indeks komposit ketertinggalan desa yang merupakan rata-rata dari jumlah skor kondisi desa berdasarkan faktor alam/lingkungan, faktor kelembagaan, keterbatasan sarana prasarana dan akses serta faktor sosial ekonomi penduduk. Kemudian Kementerian Pembangunan Daerah Tertinggal menetapkan desa-desa yang memiliki skor terkecil sebagai desa tertinggal dalam suatu kabupaten. Supaya penetapan desa tertinggal lebih valid, maka dilakukanlah proses klarifikasi ulang kepada pihak kabupaten yang bersangkutan. Metode scoring dengan tanpa memperhitungkan faktor jarak atau kedekatan karakteristik antar wilayah memiliki beberapa kelemahan yaitu tidak tertangkapnya perbedaan kondisi geografis dan sosilogis antar wilayah, sehingga menghasilkan pengklasifikasian yang tidak tepat (Widyasthika, 2005). Oleh karena itu perlu dilakukan sebuah penelitian yang menggunakan metode dengan memperhitungkan faktor jarak kedekatan antar desa. Sehingga diperoleh pengelompokan desa tertinggal yang tepat dan akurat. Salah satu metode yang cukup populer untuk menjawab permasalahan ini adalah clustering atau penggerombolan. Metode clustering merupakan suatu metode untuk mengelompokkan individu atau unit penelitian ke dalam beberapa kelompok dimana setiap unit penelitian dalam suatu kelompok akan mempunyai ciri yang relatif sama sedangkan antar kelompok unit pengamatan memiliki sifat yang berbeda. Pada penelitian ini, akan digunakan
2

pendekatan hierarchical method yaitu metode Ward dengan menggunakan ukuran jarak squared Euclidean. Selain itu, untuk mendapatkan keterbandingan dengan metode yang lain akan digunakan non-hierarchical method yaitu metode k-means cluster analysis. Diharapkan penggunaan metode cluster ini mampu mengklasifikasikan desadesa tertinggal dengan baik, sehingga diperoleh suatu kesimpulan dan keputusan yang dapat dijadikan salah satu rujukan dalam program pengentasan kemiskinan yang tepat sasaran melalui program di desa-desa tertinggal di Kabupaten Kutai Timur.

2. Tinjauan Pustaka 2.1. Metode Cluster . Analisis cluster merupakan analisis yang bertujuan untuk

mengelompokkan unit penelitian ke dalam beberapa kelompok dimana setiap unit penelitian dalam suatu kelompok akan mempunyai ciri yang relatif sama sedangkan antar kelompok unit pengamatan memiliki sifat yang berbeda (Rencher, 2002). Metode cluster yang akan digunakan dalam penelitian ini adalah sebagai berikut: 1) Hierarchical Method (Wards method) Tujuan utama penggunaan metode ini adalah apabila jumlah kelompok yang diinginkan tidak diketahui. Pengelompokan disajikan secara visual berbentuk dendogram yang menyajikan gambaran jumlah kelompok terbesar hingga terkecil. Metode ini memulai pengelompokkan pada unit penelitian yang mempunyai kesamaan karakteristik terdekat yang dianalogikan dengan jarak. Proses dilanjutkan dengan unit penelitian lainnya dengan pertimbangan sama sepert i proses sebelumnya yaitu unit penelit ian yang memiliki kesamaan karakteristik terdekat berikutnya, proses yang sama dilakukan hingga ada tingkatan c u k u p jelas antar unit penelitian dari yang paling mirip sampai yang paling tidak mirip, sehingga pada akhirnya akan membentuk hanya satu kelompok. Pada pengelompokan Hierarki terdapat beberapa jenis metode antara lain between-groups linkage, within-groups linkage, nearest neighbor, furthest neighbor, centroid clustering, median clustering dan Ward's method. Metode clustering yang digunakan dalam penelitian ini adalah metode Ward. Penentuan ukuran interval yang digunakan dalam penelitian ini adalah squared Euclidean distance yaitu penjumlahan kuadrat dari selisih antara nilainilai variabel dari dua unit penelitian yang berbeda. Squared Euclidean distance
3

antara dua unit penelitian misalkan X dan Y dapat dirumuskan sebagai berikut: , dimana p adalah jumlah variabel. Pembentukan kelompok berdasarkan pada informasi yang hilang sebagai akibat dari penggabungan-penggabungan individu-individu menjadi kelompok yang diukur dengan jumlah total kuadrat deviasi tiap observasi dan rata-rata tiap kelompok. Informasi yang hilang ini dinamakan dengan Error Sum Square (ESS). Unit penelitian yang mempunyai ESS yang terkecil tergabung menjadi sebuah kelompok. Begitu seterusnya sampai terbentuk satu kelompok yang

mencakup semua unit penelitian (Ward, 1963) . 2) Non Hierarchical Method (K-means clustering) Menurut MacQueen (1967), metode ini dimulai dengan menentukan jumlah cluster terlebih dahulu yang diinginkan misalkan c cluster. Langkah berikutnya adalah K-Means, dengan langkah-langkah sebagai berikut: a. Mempartisi objek menjadi sejumlah c initial cluster, kemudian dihitung nilai rata-rata (centroid) untuk masing-masing kelompok cluster yang ada b. Memasukkan unit-unit penelitian pada cluster yang memiliki centroid terdekat (dihitung dari jaraknya). Kemudian hitung kembali centroid untuk masing-masing cluster yang mengalami perubahan anggotanya (unit penelitian) c. Ulangi langkah ( b ) sampai diperoleh cluster yang tidak berubah-ubah lagi atau stabil

2.2 Konsep dan Definisi Desa tertinggal adalah desa-desa yang kondisinya relatif tertinggal dari desadesa lainnya. Kemajuan atau ketertinggalan suatu desa dicerminkan oleh indikator utama, yaitu tinggi rendahnya rata-rata pengeluaran perkapita penduduk desa (BPS, 2003). Menurut Sumaryadi dalam Widhyast ika (1997), desa tertinggal dicirikan sebagai desa dengan potensi sumber daya alam yang terbatas, prasarana dan sarana pelayanan dasar yang tidak lengkap, serta kelembagaan sosial ekonomi yang belum berkembang. Desa miskin tidak memberikan sumber penghidupan yang memadai kepada penduduk yang tinggal di dalamnya.

3. Metodologi 3.1 Sumber Data Data yang digunakan dalam penelitian ini adalah data Potensi Desa Kabupaten Kutai Timur, Propinsi Kalimantan Timur tahun 2008. Secara keseluruhan data yang digunakan merupakan data cross section dengan unit observasi sejumlah 135 desa tanpa dibedakan antara rural dan urban. Sedangkan variabel yang digunakan sebagai dasar clustering pada penelitian ini adalah karakteristik dari desa yaitu: kepadatan penduduk/km2, persentase keluarga yang memiliki listrik (PLN), persentase keluarga yang tinggal di bantaran sungai, persentase keluarga yang tinggal di pemukiman kumuh, persentase keluarga penerima askeskin, persentase keluarga yang

berlangganan telepon kabel, jumlah SD negeri, jumlah posyandu, jumlah bidan, jumlah industri makanan, jumlah pasar tanpa bangunan, jumlah restoran, jumlah toko, jumlah penginapan dan jumlah rumah permanen.

3.2 Metode Analisis Langkah-langkah analisis yang dilakukan pada penelitian ini adalah sebagai berikut. 1. Menentukan jumlah cluster yang ingin dibentuk yaitu dua cluster 2. Analisis cluster dengan menggunakan Hierarchical Method (Wards method) 3. Analisis cluster dengan menggunakan non-Hierarchical Method (K-menas) 4. Analisis perbandingan antara metode (1) dan (2) 5. Interpretasi dan kesimpulan

4. Hasil dan Pembahasan 4.1 Analisis cluster dengan menggunakan Hierarchical Method (Wards method) Dari hasil pengolahan data dengan menggunakan software SPSS, terlihat dari dendogram bahwa desa di Kabupaten Kutai Timur terbagi menjadi dua kelompok desa yaitu desa dengan kategori tertinggal dan tidak. Jumlah desa Desa tertinggal (cluster ke-1) Desa tidak tertinggal (cluster ke-2) 132 3 Keterangan Selain desa no 26, 63 dan 59 Desa no 26, 63 dan 59

Hal ini menunjukkan bahwa di Kabupaten Kutai Timur diperoleh klasifikasi desa

dengan dua kategori dengan mempertimbangkan variabel-variabel sebagai dasar pembeda atau jarak.

4.2. Analisis cluster dengan menggunakan non-Hierarchical Method (K-means) Dari hasil pengolahan data dengan menggunakan software SPSS, terlihat bahwa desa terbagi menjadi dua kelompok yaitu desa dengan kategori tertinggal dan tidak.

Jumlah desa Desa tertinggal Desa tidak tertinggal 134 1 Selain desa no 59 Desa no 59

Pada tabel ANOVA (terlampir), dapat diketahui variabel-variabel yang signifikan secara statistik sebagai faktor yang mempengaruhi pengelompokan desa tertinggal atau tidak adalah: kepadatan penduduk/km2, persentase keluarga yang memiliki listrik (PLN), persentase keluarga yang berlangganan telepon kabel, jumlah posyandu, jumlah bidan, jumlah restoran, jumlah toko dan jumlah penginapan Perbedaan hasil pengelompokan desa antar kedua metode ini adalah pada penentuan jumlah cluster. Pada metode hierarki, penentuan atau pemilihan jumlah cluster dilakukan proses clustering selesai dengan kata lain jumlah cluster tidak dapat diketahui sebelumnya, yang hasilnya diserahkan sepenuhnya pada peneliti dengan mengedepankan subyektifitas sesuai dengan tujuan penelitian. Hal ini mengakibatkan cluster yang terbentuk bisa saja sejumlah 4, 5, 3 atau 2 terkait subyektifitas peneliti. Sedangkan pada metode non-hierarki, penentuan atau pemilihan jumlah cluster sudah harus ditentukan di awal sebelum proses clustering berjalan, sehingga hasil akhirnyapun akan terbentuk jumlah cluster yang sama. Penentuan ini menuntut kehati-hatian, pengetahuan, informasi memadai dan intuisi yang cukup tinggi dari peneliti.

5. Kesimpulan Dari hasil pembahasan di atas dapat disimpulkan bahwa 1. Pengelompokan dengan menggunakan metode Ward dapat diketahui bahwa di Kabupaten Kutai Timur terdapat dua kelompok desa yaitu desa tertinggal dan
6

tidak tertinggal dengan mempertimbangkan beberapa informasi yang merupakan karakteristik dari masing-masing desa dengan komposisi desa tidak tertinggal sejumlah 1 desa dan desa tertinggal sejumlah 134 desa 2. Pengelompokan dengan menggunakan metode K-means clustering dapat diketahui bahwa di Kabupaten Kutai Timur terdapat dua kelompok desa yaitu desa tertinggal dan tidak tertinggal dengan komposisi desa tidak tertinggal sejumlah 3 desa dan desa tertinggal sejumlah 132 desa 3. Perbedaan antar metode hierarki dan non-hierarki terletak pada penentuan jumlah cluster yang terbentuk, metode hierarki setelah proses clustering sedangkan pada metode non-hierarki sebelum proses clustering 4. Variabel-variabel yang signifikan secara statistik sebagai faktor jarak yang mempengaruhi pengelompokan desa tertinggal atau tidak adalah: kepadatan penduduk/km2, persentase keluarga yang memiliki listrik (PLN), persentase keluarga yang berlangganan telepon kabel, jumlah posyandu, jumlah bidan, jumlah restoran, jumlah toko dan jumlah penginapan

Daftar Pustaka Arisanti, Restu. (2011), Model Regresi Spasial Untuk Deteksi Faktor-faktor Kemiskinan di Provinsi Jawa Timur. Tesis. Bogor: Institut Pertanian Bogor (IPB). [BPS] Badan Pusat Statistik. 2009. Kutai Timur Dalam Angka. Kutai Timur: Badan Pusat Statistik. MacQueen, J.B. 1967. Some Methods for Classification and Analysis of Multivariate Observations Hierarchical Grouping to Optimize an Objective Function. Berkeley: University of California Press A967 Rencher, Alvin C. 2000. Methods of Multivariate Analysis:2nd edition. England: Jhon Willey & Sons Ltd Widyasthika, Hayu Fadlun (2005), Evaluasi Pengklasifikasian Desa Tertinggal Kabupaten Purworejo Tahun 2005. Skripsi. Jakarta: Sekolah Tinggi Ilmu Statistik (STIS). Ward, J.H. 1963. Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical Association. Vol. 58, 236-244.

Lampiran
* * * * H I E R A R C H I C A L Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E Label Num 54 56 126 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ -+ -+ -+ -+ -+ -+-----+ -+ | -+ | -+ | -+ | -+ | -+ | C L U S T E R A N A L Y S I S * * * *

14 78 36 83 37 79 10 25 74

24 22 31 93 43 57 49 39 76 55 133 41 19 68 48 102 42 44 35 80 29 4 70 51 11 2 5 69 1 3 27 28 61 30 82 60 81 62 73 26 63 59 -+ | -+ | -+ | -+ | -+ | -+ | -+ | -+ +---------------+ -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | +-------------------------+ -+ | | | -+ | | | -+-----+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+ | | -+---------------------+ | -+ | -+ | -------------------------------------------------+

* * * * N O N - H I E R A R C H I C A L

C L U S T E R

A N A L Y S I S * * * *

ANOVA Cluster Mean Square kepadatan pddk/km2 persen klg dgn pln persen klg bantaran sungai persen klg pemukiman kumuh persen klg terima askeskin persen klg berlang telpon kabel jml sd negeri jml posyandu jml bidan jml industri makanan jml pasar tanpa bangunan jml restoran jml toko jml pengnpn jml rumah permanen .836 32.098 238.241 .488 .029 384.982 129099.076 20.368 191039.877 1 1 1 1 1 1 1 1 1 .301 1.059 1.154 75.444 .158 1.297 1208.984 1.289 57937.937 133 133 133 133 133 133 133 133 133 2.774 30.312 206.434 .006 .185 296.904 106.783 15.806 3.297 .098 .000 .000 .936 .668 .000 .000 .000 .072 24.980 77.622 1 1 312.591 17.841 133 133 .080 4.351 .778 .039 1.057E7 5682.462 159.298 9.727 df 1 1 1 1 Error Mean Square 4041.923 1216.987 316.872 111.282 df 133 133 133 133 F 2614.686 4.669 .503 .087 Sig. .000 .032 .480 .768

The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the differences among cases in different clusters. The observed significance levels are not corrected for this and thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.

adiw@bps.go.id

You might also like