You are on page 1of 29

TUGAS STATISTIKA LANJUTAN TEKNIK ANALISIS DATA MULTIVARIAT ANALISIS CLUSTER

OLEH: ADH A SEMESTER 5 Ayu Putri Sili Anggreni I.A. Tara Astherina S. Ni Wayan Aryati Ni Wayan Priyanka Diana I Gede Arimbawa 11102004 11102005 11102012 11102013 11102019

KEMENTERIAN PARIWISATA DAN EKONOMI KREATIF SEKOLAH TINGGI PARIWISATA NUSADUA BALI 2013

KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Tuhan Yang Maha Esa atas rahmat dan karunia-Nya, sehingga kami dapat menyelesaikan Tugas mata kuliah Statistika lanjutan mengenai Menu Engineering Dengan selesainya tugas ini tidak lepas dari bantuan banyak pihak yang telah memberikan masukan-masukan kepada kami. Untuk itu kami mengucapkan banyak terimakasih Kami menyadari bahwa tugas ini masih memiliki banyak kekurangan baik dari segi materi maupun dari segi penyajiannya. Oleh karena itu, kritik dan saran yang membangun sangat kami harapkan demi sempurnanya tugas ini.

Denpasar, November 2013

Tim Penulis

DAFTAR ISI

KATA PENGANTAR DAFTAR ISI BAB I PENDAHULUAN A. Latar Belakang B. Rumusan Masalah C. Tujuan BAB II TEKNIK ANALISIS MULTIVARIAT A. Definisi Analisis Multivariat B. Klasifikasi teknik Analisis Multivariat BAB III ANALISIS CLUSTER A. Definisi Analisis cluster B. Sejarah Singkat C. Analisis Cluster dalam Berbagai bidang Keilmuan D. Istilah Dalam Analisis Cluster E. Cara Kerja Analisis Cluster F. Proses Analisis Cluster G. Contoh Analisis cluster dengan SPSS BAB IV PENUTUP A. Kesimpulan DAFTAR PUSTAKA

ii

BAB I PENDAHULUAN

A. Latar Belakang Analisis multivariat atau yang sering disebut dengan teknik analisis peubah ganda adalah satu teknik analisis data pada statistika yang dikenakan pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Salah satu bagian dari teknik analisis data multivariat adalah analisis cluster (cluster analysis). Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan oleh peneliti itu sendiri. Fokus dari analisis cluster adlah membandingkan objek berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu set variabel yang merpresentasikan karakteristik yang dipakai objek-objek. Bedanya dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.

B. Rumusan masalah Berdasarkan latar belakang tersebut kami merumuskan beberapa rumusan masalah yang akan dibahas pada paper ini antara lain: 1. Apakah yang dimaksud dengan analisis cluster? 2. Bagaimana proses dalam penggunaan analisis cluster? 3. Bagaimana cara peenggunaan SPSS dalam melakukan analisis cluster?

C. Tujuan Adapun tujuan dibuatnya paper ini adalah : 1. Untuk mengetahui pengertian serta fungsi dar analisis cluster 2. Untuk mengetahui bagaimana proses dalam melakukan analisis cluster 3. Untukmengetahui cara penggunaan program SPSS dalam analisis cluster 4. Untuk pemenuhan tugas matakuliah statistika lanjutan

BAB II TEKNIK ANALISIS MULTIVARIAT

A. Definisi analisis Multivariat Teknik analissi multivariat merupakan salah satu teknik analisis dari statistika Analisis statistika multivariate adalah analisis statistika yang dikenakan pada data yang terdiri dari banyak variabel dan antar variabel saling berkorelasi. Analisis statistik multivariat merupakan metode statistik yang

memungkinkan kita melakukan penelitian terhadap lebih dari dua variable secara bersamaan. Dengan menggunakan teknik analisis ini maka kita dapat menganalisis pengaruh beberapa variable terhadap variabel (variable) lainnya dalam waktu yang bersamaan. Contoh kita dapat menganalisis pengaruh variable kualitas produk, harga dan saluran distribusi terhadap kepuasan pelanggan. Contoh yang lain, misalnya pengaruh kecepatan layanan, keramahan petugas dan kejelasan memberikan informasi terhadap kepuasan dan loyalitas pelanggan. Analisis multivariat digunakan karena pada kenyataannnya masalah yang terjadi tidak dapat diselesaikan dengan hanya menghubung-hubungkan dua variable atau melihat pengaruh satu variable terhadap variable lainnya. Sebagaimana contoh di atas, variable kepuasan pelanggan dipengaruhi tidak hanya oleh kualitas produk tetapi juga oleh harga dan saluran distribusi produk tersebut.

B. Klasifikasi teknik analisis multivariat Teknik analisis multivariat secara dasar diklasifikasi menjadi dua, yaitu sebagai berikut :

1. Analisis Dependensi Analisis dependensi berfungsi untuk menerangkan atau memprediksi variable (variable) tergantung dengan menggunakan dua atau lebih variable bebas. Yang termasuk dalam klasifikasi ini ialah a. analisis regresi linear berganda, b. analisis diskriminan, c. analisis varian multivariate (MANOVA), d. analisis korelasi kanonikal.

2. Analisis Interdependensi Analisis interdependensi berfungsi untuk memberikan makna terhadap seperangkat variable atau membuat kelompok-kelompok secara bersamasama. Yang termasuk dalam klasifikasi ini ialah a. analsis faktor, b. analisis cluster, c. multidimensional scaling.

BAB III ANALISIS CLUSTER

A. Definisi Analisis Cluster Analisis Cluster termasuk dalam teknik analisis multivariate metode interdependen. Teknik analisis ini bertujuan untuk mengatur informasi / meringkas data dengan cara mengelompokkan objek-objek berdasarkan kesamaan karakteristik tertentu. Dengan demikian, Cluster analisis atau clustering memiliki tujuan untuk mengelompokkan data dari serangkaian pengamatan ke subset (disebut cluster). Di Indonesia analisis ini juga sering desebut dengan analisis gerombol. Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon & Goldstein, 1984). Analisis cluster mengelompokkan objek data hanya berdasarkan pada informasi yang ditemukan pada data tersebut yang menunjukkan hubungan antara setiap objeknya. Tujuannya agar object dalam suatu kelompok serupa atau saling berkaitan dan berbeda dengan objek pada kelompok yang lainnya.

Pada Gambar 2.1 dapat diilustrasikan bahwa data yang ada dapat diklasifikasikan menjadi beberapa kelompok tertentu berdasarkan kemiripan atau kesamaan karakteristik yang dimiliki oleh setiap data. Pada klasifikasi dua cluster dapat dilihat bahwa analisis cluster memisahkan data berbentuk segitiga dengan data yang berbentuk persegi.

Gambar 3.1 Ilustrasi Pengelompokan Data dalam Analisis Cluster

Sumber: analisis cluster, 2012

B. Sejarah Singkat Analisis cluster panjang (pertama kali digunakan oleh Tryon, 1939) meliputi beberapa algoritma yang berbeda dan metode untuk mengelompokkan benda serupa ke dalam kategori masing-masing. Sebuah pertanyaan umum yang dihadapi peneliti di banyak bidang penelitian adalah bagaimana mengorganisasi data yang diamati ke dalam struktur yang bermakna, yaitu, untuk

mengembangkan taksonomi.Analisis cluster dapat digunakan untuk menemukan struktur data tanpa memberikan penjelasan / penafsiran. Dengan kata lain, analisis cluster hanya menemukan struktur data tanpa menjelaskan mengapa mereka ada. 6

C. Analisis Cluster dalam beberapa bidang keilmuan Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk: 1. mengetahui segmentasi dan menentukan target pasar yang dituju; 2. mengetahui positioning produk dan menentukan pengembangan produk baru; 3. Memilih pasar yang akan dipilih untuk produk baru perusahaan. Dalam pencitraan medis, seperti PET scan (Positron emission

tomography), analisis cluster dapat digunakan untuk membedakan antara berbagai jenis jaringan dan darah dalam gambar tiga dimensi. Dalam aplikasi ini, posisi sebenarnya tidak masalah, namun intensitas voxel dianggap sebagai vektor, dengan dimensi untuk setiap gambar yang diambil dari waktu ke waktu. Teknik ini memungkinkan, misalnya, pengukuran akurat dari tingkat pelacak radioaktif dikirim ke daerah yang menarik, tanpa pengambilan sampel terpisah dari darah arteri, teknik mengganggu yang paling umum saat ini. Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk memahami dan utilitas dari cluster dalam penelitian pendidikan. Cluster analisis dalam penelitian pendidikan dapat digunakan untuk data eksplorasi, cluster konfirmasi dan pengujian hipotesis. Data eksplorasi digunakan ketika ada sedikit informasi tentang sekolah atau siswa yang akan dikelompokkan bersama-sama. Ini. bertujuan untuk menemukan setiap cluster yang berarti unit berdasarkan langkah-langkah pada satu set variabel respon. Konfirmasi cluster digunakan untuk mengkonfirmasikan hasil cluster yang dilaporkan sebelumnya pengujian Hipotesis yang digunakan untuk mengatur struktur cluster.

D. Istilah dalam Analisis Cluster Adapun beberapa istilah yang sering digunakan dalam analisis cluster antara lain : 1. Aggomerration schedule : merupakan jadwal yang akan memberikan informasi tentang ibjek atau kasus yang akan dikelompokkan pada setiap tahap pada suatu proses analisis cluster yang hierarkis. 2. Cluster centroid : merupakan nilai rata-rata variabel dari semua objek/kasus atau observasi dalam cluster tertentu 3. Cluster centers, adalah titik awal dimulainya pengelompokan di dalam cluster nonhierarki. 4. Cluster membership merupakan keanggotaan yang menunjukkan cluster. 5. Dendogram merupakan visualisasi cluster. Garis vertical (Y) menunjukkan cluster yang digabung bersama. Posisi garis pada skala X menunjukkan jarak (distance) dimana cluster digabung. 6. Distance between cluster center adalah jarak yang menunjukkan bagaimana terpisahnya pasangan individu cluster. 7. Dua metode analisis Cluster adalah Hierarchical Cluster dan K-means Cluster. Hierarchical Cluster disarankan untuk data dengan sampel kecil, sedangan K-means cluster disarankan untuk sampel bersa (lebih dari 100)

E. Cara Kerja Analisis Cluster Secara garis besar ada tiga hal yang harus terjawab dalam proses kerja analisis cluster, yaitu : 1. Bagaimana mengukur kesamaan ?

Ada tiga ukuran untuk mengukur kesamaaan antar objek, yaitu ukuran korelasi, ukuran jarak, dan ukuran asosiasi. 2. Bagaimana membentuk cluster ? Prosedur yang diterapkan harus dapat mengelompokkan objek-objek yang memiliki kesamaan yang tinggi ke dalam sutau cluster yang sama. 3. Berapa banyak cluster/kelompok yang akan dibentuk ? Pada prinsipnya jika jumlah cluster berkurang maka homogenitas alam cluster secra otomatis akan menurun.

F. Proses Analisis Cluster Sebagaimana teknik multivariat lain proses analisis cluster dapat dijelaskan dalam enam tahap sebagai berikut :

1. Tahap Pertama : Tujuan Analisis Cluster Tujuan utama analisis cluster adalah mempartisi suatu set objek menjadi dua kelompok atau lebih berdasarkan kesamaan karakteristik khusus yang dimilikinya. Dalam pembentukan kelompok/cluster dapat dicapai tiga tujuan, yaitu : a. Deskripsi klasifikasi (taxonomy description) Penerapan anallisis cluster secara tradisisonal bertujuan mengeksplorasi dan membentuk suatu klasisfikasi/taksonomi secara empiris. Karena kemampuan partisinya analisis cluster dapat diterapkan secara luas. Meskipun secara empiris merupakan teknik eksplorasi analisis cluster dapat pula digunakan untuk tujuan konfirmasi.

1) Penyederhanaan Data Penyederhanaan data merupakan bagian dari suatu taksonomi. Dengan struktur yang terbatas observasi/objek dapat dikelompokkan untuk analisis selanjutnya. 2) Identifikasi Hubungan (Relationship Identification) Hubunganantar objek diidentifikasi secara empiris. Struktur analisis cluster yang sederhana dapat menggambarkan adanya hubungan atau kesamaan dan perbedaan yang tidak dinyatakan sebelumnya.

b. Pemilihan pada Pengelompokan Variabel Tujuan analisis cluster tidak dapat dipisahkan dengan pemilihan variabel yang digunakan untuk menggolongkan objek ke dalam clucter-cluster. Cluster yang terbentuk merefleksikan struktur yang melekat pada data seperti yang didefinisikan oleh variabel-variabel. Pemilihan variabel harus sesuai dengan teori dan konsep yang umum digunakan dan harus rasional. Rasionalitas ini didasarkan pada teori-teori eksplisit atau penelitian

sebelumnya. Variabel-variabel yang dipilih hanyalah variabel yang dapat mencirikan objek yang akan dikelompokkan dan secara spesifik harus sesuai dengan tujuan analisis cluster.

2. Tahap Kedua : Desain Penelitian dalam Analisis Cluster Tiga hal penting dalam tahap ini adalah pendeteksian outlier, mengukur kesamaan, dan standarisasi data. a. Pendeteksian Outlier

10

Outlier adalah suatu objek yang sangat berbeda dengan objek lainnya. Outlier dapat digambarkan sebagai observasi yang secara nyata kebiasaan, tidak mewakili populasi umum, dan adanya undersampling dapat pula memunculkan outlier. Outlier menyebabkan menyebabkan struktur yang tidak benar dan cluster yang terbentuk menjadi tidak representatif. b. Mengukur Kesamaan antar Objek Konsep kesamaan adalah hal yang fundamental dalam analisis cluster. Kesamaan antar objek merupakan ukuran korespondensi antar objek. Ada tiga metode yang dapat diterapkan, yaitu ukuran korelasi, ukuran jarak, dan ukuran asosiasi. 1) Ukuran Korelasi Ukuran ini dapat diterapkan pada data dengan skala metrik, namun jarang digunakan karena titik bertnya pada nilai suatu pola tertentu, padahal tisik berat analisis cluster adalah besarnya objek. Kesamaan antar objek dapat dilihat dari koefisien korelasi antar pasangan objek yang diukur dengan beberapa variabel. 2) Ukuran Jarak Merupakan ukuran yang paling sering digunakan. Diterapkan untuk data berskala metrik. Sebenarnya merupakan ukuran ketidakmiripan, dimana jarak yang besar menunjukkan sedikit kesamaan sebaliknya jarak yang pendek/kesil menunjukkan bahwa suatu objek makin mirip dengan objek lain. Bedanya dengan ukuran korelasi adalah bnahwa ukuran jarak fokusnya pada besarnya nilai. Cluster berdasarkan ukuran korelasi bisa saja tidak memiliki kesamaan nilai tapi memiliki

11

kesamaan pola, sedangkan cluster dberdasrkan ukuran jarak lebih memiliki kesamaan nilai meskipun polanya berbeda. Ada beberapa tipe ukuran jarak antara lain jarak Euklidian, jarak cityBox, dan jarak Mahalanobis. Ukuran yang paling sering digunakan adalah jarak Euklidian. Jarak Euklidian adalah besarnya jarak suatu garis lurus yang menghubungkan antar objek. 3) Ukuran Asosiasi Ukuran asosiasi dipakai untuk mengukur data berskala nonmetrik (nominal atau ordinal).

c. Standarisasi Data 1) Standarisasi Variabel Bentuk paling umum dalam standarisasi variabel adalah konversi setiap variabel terhadap skor atandar ( dikenal dengan Z score) dengan melakukan substraksi nilai tengan dan membaginyadengan standar deviasi tiap variabel. 2) Standarisasi Data Berbeda dengan standarisasi variabel, standarisasi ndata dilakukan terhadap observasi/objek yang akan dikelompokkan.

3. Tahap Ketiga : Asumsi-asumsi dalam Analisis Cluster Seperti hal teknik analisis lain,analisis cluster juga menetapkan adanya suatu asumsi. Ada dua asumsi dalam analisis cluster, yaitu : a. Kecukupan Sampel untuk merepresentasikan/mewakili Populasi

12

Biasanya suatu penelitian dilakukan terhadap populasi diwakili oleh sekelompok sampel. Sampel yang digunakan dalam analisis ckuster harus dapat mewakili populasi yang ingin dijelaskan, karena analisis ini baik jika sampel representatif. Jumlah sampel yang diambil tergantung penelitinya, seorang peneliti harus yakin bahwa sampil yang diambil representatif terhadap populasi. b. Pengaruh Multukolinieritas Ada atau tidaknya multikolinieritas antar variabel sangat diperhatikan dalam analisis cluster karena hal itu berpengaruh, sehingga variabelvariabel yang bersifat multikolinieritas secara eksplisit dieprtimbangkan dengan lebih seksama.

4. Tahap Keempat : Proses Mendapatkan Cluster dan Menilai kelayakan secara keseluruhan Ada dua proses penting yaitu algoritma cluster dalam pembentukan cluster dan menentukan jumlah cluster yang akan dibentuk. Keduanya mempunyai implikasi substansial tidak hanya pada hasil yang diperoleh tetapi juga pada interpretasi yang akan dilakukan terhadap hasil tersebut.

a. Algoritma Cluster Algoritma cluster harus dapat memaksimalkan perbedaan relatif cluster terhadap variasi dalam cluster. Dua metode paling umum dalam algoritma cluster adalah metode hirarkhi dan metode non hirarkhi. Penentuan metode mana yang akan dipakai tergantung kepada peneliti dan

13

konteks penelitian dengan tidak mengabaikan substansi, teori dan konsep yang berlaku. Keduanya memiliki kelebihan sendiri-sendiri. Keuntungan metode hirarkhi adalah cepat dalam proses pengolahan sehingga menghemat waktu, namun kelemahannya metode ini dapat menimbulkan kesalahan. Selain itu tidak baik diterapkan untuk menganalisis sampel dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan, dan termasuk variabel tak relevan atau variabel yang tidak tepat. Keuntungannya hanya dengan

menggunakan titik bakal nonrandom, penggunaan metode non hirarkhi untuk titik bakal random hirarkhi. Alternatif lain adalah dengan mengkombinasikan kedua metode ini. Pertama gunakan metode hirarkhi kemudian dilanjutkan dengan metode non hirarkhi. 1) Metode Hirarkhi Tipe dasar dalam metode ni adalah aglomerasi dan pemecahan. Dalam metode aglomerasi tiap observasi pada mulanya dianggap sebagai cluster tersendiri sehingga terdapat cluster sebyak jumlah observasi. Kemudian dua cluster yang terdekat kesamaannya digabung menjadi suatu cluster babru, sehingga jumlah cluster berkurang satu pada tiap tahap. Sebaliknya pada metode pemecahan dimulai dari satu cluster besar yang mengandung seluruh observasi, selanjutnya observasi-observasi yang paling tidak sama dipisah dan dibentuk secara nyata lebih buruk dari pada metode

14

cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap observasi menjadi cluster sendiri-sendiri. Hal penting dalam metode hirarkhi adalah bahwa hasil pada tahap sebelumnya selalu bersarang di dalam hasil pada tahap berikutnya, membentuk sebuah pohon. Ada lima metode aglomerasi dalam pembentukan cluster, yatiu : a) Pautan Tunggal (Single Linkage) Metode ini didasarkan pada jarak minimum. Dimulai dengan dua objek yang dipisahkan dengan jarak paling pendek maka

keduanya akan ditempatkan pada cluster pertama, dan seterusnya. Metode ini dikenal pula dengan nama pendekatan tetangga terdekat. b) Pautan Lengkap (Complete Linkage) Disebut juga pendekatan tetangga terjauh. Dasarnya adalah jarak maksimum. Dalam metode ini seluruh objek dalam suatu cluster dikaitkan satu sama lain pada suatu jarak maksimuma atau dengan kesamaan minimum. c) Pautan Rata-rata (Average Linkage) Dasarnya adalah jarak rata-rata antar observasi. pengelompokan dimulai dari tengan atau pasangan observasi dengan jarak paling mendekati jarak rata-rata. d) Metode Ward (Wards Method) Dalam metode ini jarak antara dua cluster adalah jumlah kuadrat antara dua cluster untuk seluruh variabel. Metode ini cenderung

15

digunakan untuk mengkombinasi cluster-cluster dengan jumlah kecil. e) Metode Centroid Jarak antara dua cluster adalah jarak antar centroid cluster tersebut. Centroid cluster adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain. 3) Metode Non Hirarkhi Masalah utama dalam metoda non hirarkhi adalah bagaimana memilih bakal cluster. Harus disadari pengaruh pemilihan bakal cluster terhadap hasil akhir analisis cluster. Bakal cluster pertama adalah observasi pertama dalam set data tanpa missing value. Bakal kedua adalah observasi lengkap berikutnya (tanpa missing data) yang dipisahkan dari bakal pertama oleh jarak minimum khusus. Ada tiga prosedur dalam metode non hirarkhi, yaitu : a) Sequential threshold Metode ini dimulai dengan memilih bakal cluster dan menyertakan seluruh objek dalam jarak tertentu. Jika seluruh objek dalam jarak tersebut disertakan, bakal cluster kedua terpilih, kemudian proses terus berlangsung seperti sebelumnya. b) Parallel Threshold

16

Metode ini memilih beberapa bakal cluster secara simultan pada permulaannya dan menandai objek-objek dengan jarak permulaan ke bakal terdekat. c) Optimalisasi Metode ketiga ini mirip dengan kedua metode sebelumnya kecuali pada penandaan ulang terhadap objek-objek.

b. Menentukan jumlah cluster yang akan dibentuk Hal penting lain dalam tahap keempat adalah menentukan jumlah cluster yang akan dibentuk.Sebenarnya tidak ada standar,prosedur pemilihan tujuan eksis. Karena tidak ada kriteria statistik internal digunakan untuk inferensia, seperti tes signifikansipada teknik multivariat lainnya, para peneliti telah mengembangkan beberapa kriteria dan petunjuk sebagai pendekatan terhadap permasalahan ini dengan memperhatikan substansi dan aspek konseptual.

5. Tahap Kelima : Interpretasi terhadap Cluster Tahap interpretasi meliputi pengujian tiap cluster dalam term untuk menamai dan menandai dengan suatu label yang secara akurat dapat menjelaskan kealamian cluster. Proes ini dimulai dengan suatu ukuran yang sering digunakan yaitu centroid cluster. Membuat profil dan interpretasi cluster tidak hanya tidak hanya untuk memoeroleh suatu gambaran saja melainkan pertama, menyediakan suatu rata-rata

17

untuk menilai korespondensi pada cluster yang terbentuk, kedua, profil cluster memberikan araha bagi penilainan terhadap signifikansi praktis.

6. Tahap Keenam: Proses Validasi dan Pembuatan Profil (PROFILING) Cluster a. Proses validasi solusi cluster Proses validasi bertujuan menjamin bahwa solusi yang dihasilkan dari analisis cluster dapat mewakili populasi dan dapat digeneralisasi untuk objek lain. Pendekatan ini membandingkan solusi cluster dan menilai korespondensi hasil. Terkadang tidak dapat dipraktekkan karena adanya kendala waktu dan biaya atau ketidaktersediaan ibjek untuk analisis cluster ganda. b. Pembuatan Profil ( PROFILING)Solusi Cluster Tahap ini menggambarkan karakteristik tiap cluster untuk menjelaskan cluster-cluster tersebut dapat dapat berbeda pada dimensi yang relevan. Titik beratnta pada karakteristik yang secara signifikan berbeda antar clustre dan memprediksi anggota dalam suatu cluster khusus.

Secara keseluruhan proses analisis cluster berakhir setelah keenam tahap ini dilalui. Hasil analisis cluster dapat digunakan untuk berbagai kepentingan sesuai dengan materi yang dianalisis.

G. Contoh Analisis Cluster dengan SPSS

18

Terdapat sebuah penelitian mengenai tingkat stress yang dialami pada anak anak. Gejala-gejala stres yang digunakan ada empat dimana nilai tersebut merupakan total skor dari skala sikap yang telah dibuat berdasarkan observasi terhadap 45 responden. Penelitian tersebut kemudian dianalisa menggunakan analisis cluster dengan bantuan SPSS. Berikut merupakan data yang telah diambil yang dipaparkan pada tabel 3.1 berikut ini. Tabel 3.1 Skor Tingkat Stres pada Anak-anak Berdasarkan Gejala di daerah Yogyakarta Tahun 2011 No. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. Intrusion 19 10 22 18 21 23 17 23 14 23 18 20 19 23 19 14 12 20 20 15 19 19 20 19 22 Hyperarousal 27 38 32 38 29 30 46 26 35 31 32 30 27 30 39 29 23 30 30 30 26 38 30 30 35 19 Avoidance 17 20 11 18 13 16 10 12 12 15 11 12 18 12 14 14 11 14 15 15 13 14 9 12 19 Perilaku lain 19 19 21 18 21 22 23 17 14 18 18 17 20 21 20 25 14 23 17 21 18 19 21 23 24

26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45.

22 23 26 20 15 13 21 23 19 19 26 29 18 19 22 19 20 23 21 20

26 35 34 27 27 23 28 28 35 27 37 45 29 27 31 37 29 34 31 31

11 18 15 11 20 14 13 18 16 9 17 19 14 15 14 16 16 12 18 11

17 20 18 19 23 18 19 20 12 18 20 20 17 15 20 17 18 23 29 17

Sumber: hasil observasi peneliti, 2011

Berdasarkan data tersebut peneliti akan melakukan pengelompokan (clustering) menjadi 2 kelompok yaitu kelompok yang memiliki tingkat stres yang tinggi dengan kelompok yang memiliki tingkat stres yang rendah. Analisis clustering tersebut akan dilaksanakan dengan menggunakan program SPSS. Adapun langkah langkah yang ditempuh adalah sebagai berikut: 1. Masukkan data. Cara pemasukan data dapat dilihat pada gambar 3.2 berikut ini. Gambar 3.2 Pemasukan Data penelitian pada Program SPSS

20

pada Variable view

Sumber: SPSS, 2013

Gambar 3.3 Pemasukan data penelitian pada Program SPSS Pada Data View

Sumber: SPSS, 2013

2. Untuk menghilangkan pengaruh karena perbedaan interval antar dimensi/variabel maka perlu dilakukan standardisasi.

21

Dari menu Analyze, pilih submenu Descriptive Statistic kemudian Descriptives dan muncul kotak dialog yang dapat dilihat pada gambar 3.4 berikut ini. Gambar 3.4 Tampilan layar menu Descriptives

Sumber: SPSS, 2013

Pengisisan: Variable(s): masukkan keempat gejala stres kemudian tandai save standardized values as variables lalu klik OK maka nilai standardisasi akan masuk ke data spss dgn awalan Z.... 3. Setelah diperoleh nilai standar dilanjutkan ke analisis cluster Dari menu Analyze, pilih submenu Classify kemudian K-Means Cluster.. Pengisian: Variables: masukkan nama yang sudah distandardisasi Number of cluster: masukkan jumlah kelompok yang akan dibentuk Method: tandai iterate and classify kemudian klik OK Untuk lebih jelanya langkah ini dapat dilihat pada gambar 3.5 berikut ini

22

Gambar 3.5 Tampilan menu Cluster analysis pada SPSS

Sumber: SPSS, 2013

Kemudian dari langkah tersebut akan didapatkan data berupa output yang ditunjukkan oleh tabel 3.2 berikut ini. Tabel 3.2 Final Cluster Center Cluster 1 2 -.21621 .35610 -.63754 1.05006 -.63754 1.05006 -.19301 .31790

Zscore(Hyperarousal) Zscore(Avoidance) Zscore(Perilaku_lain) Zscore(Intrusion)


Sumber: SPSS, 2013(data diolah)

Berdasarkan Tabel 3.2, dapat dilihat bahwa untuk kelompok 1 memiliki nilai yang negatif semua yang berarti di bawah rata-rata sedangkan kelompok 2 kondisinya sebaliknya yaitu nilainya positif semua yang berarti di atas ratarata. Sehingga kita bisa menamai kelompok 1 sebagai kelompok tingkat stres rendah dan kelompok 2 sebagai kelompok tingkat stres tinggi.

Tabel 3.3

23

Number of cases in each Cluster Cluster Valid Missing 1 2 Jumlah 28.000 17.000 45.000 .000

Sumber: SPSS, 2013(data diolah)

Pada Tabel 3.3 menunjukkan jumlah anggota pada setiap kelompok, dimana responden yang mengalami tingkat stres rendah sebanyak 28 dan yang mengalami tingkat stres tinggi sebanyak 17 orang dari jumlah total sebanyak 45 responden.

24

BAB IV PENUTUP A. Kesimpulan

25

DAFTAR PUSTAKA

26

You might also like