Professional Documents
Culture Documents
OLEH:
NIM : PO714241151018
POLITEKNIK KESEHATAN
Terdapat dua metode dasar dalam statistik deskriptif, yaitu numerik dan grafis.
2. Ukuran Pemusatan
Ukuran pemusatan adalah sembarang ukuran yang menunjukkan pusat segugus
data, yang telah diurutkan dari yang terkecil sampai yang terbesar atau sebaliknya dari
yang terbesar sampai yang terkecil. Salah satu kegunaan dari ukuran pemusatan data
adalah untuk membandingkan dua (populasi ) atau contoh, karena sangat sulit untuk
membandingkan masing-masing anggota dari masing-masing anggota populasi. Nilai
ukuran pemusatan ini dibuat sedemikian sehingga cukup mewakili seluruh nilai pada data
yang bersangkutan.Nilai Pemusatan data yang sering digunakan antara lain mean ,
median da modus.
3. Mean
Mean adalah nilai rata-rata dari beberapa buah data. Nilai mean dapat ditentukan
dengan membagi jumlah data dengan banyaknya data. Mean (rata-rata) merupakan suatu
ukuran pemusatan data. Mean suatu data juga merupakan statistik karena mampu
menggambarkan bahwa data tersebut berada pada kisaran mean data tersebut. Mean tidak
dapat digunakan sebagai ukuran pemusatan untuk jenis data nominal dan ordinal.
Mean adalah teknik penjelasan kelompok yang didasarkan atas nilai rata-rata dari
kelompok tersebut. Rata-Rata (mean) ini didapat dengan menjumlahkan data seluruh
individu dalam kelompok itu, kemudian dibagi dengan jumlah individu yang ada pada
kelompok tersebut.
Rumus Cara Menghitung Mean (Nilai Rata-rata)
Jika suatu data terdiri atas n datum, yaitu x1, x2, ... xn, mean dari data tersebut
dirumuskan sebagai berikut.
4. Median
Median adalah salah satu teknik penjelasan kelompok yang didasarkan atas nilai
tengah dari kelompok data yang telah disusun urutannya dari yang terkecil sampai yang
terbesar, atau sebaliknya dari yang terbesar sampai yang terkecil.
Median menentukan letak tengah data setelah data disusun menurut urutan
nilainya. Bisa juga nilai tengah dari data-data yang terurut. Simbol untuk median adalah
Me. Dengan median Me, maka 50% dari banyak data nilainya paling tinggi sama dengan
Me, dan 50% dari banyak data nilainya paling rendah sama dengan Me. Dalam mencari
median, dibedakan untuk banyak data ganjil dan banyak data genap. Untuk banyak
data ganjil, setelah data disusun menurut nilainya, maka median Me adalah data yang
terletak tepat di tengah. Median bisa dihitung menggunakan rumus sebagai berikut:
5. Modus
Modus merupakan nilai yang paling sering muncul. Apabila ada data data
frekuensi, jumlah dari suatu nilai dari kumpulan data, maka bisa memakai modus.
Mode atau modus adalah nilai variabel (atribut) yang memiliki frekuensi tertinggi.
Mode dapat dipakai terhadap data kuantitatif dan data kualitatif. Jika kita dengar atau
baca : kebanyakan kematian di Indonesia disebabkan oleh penyakit malaria, pada
umumnya kecelakaan lalu lintas karena kecerobohan pengemudi, maka ii tiada lain
masing-masing merupakan modus penyebab kematian dan kecelakaan lalu lintas.
Untuk bisa melihat hasil akhir dari modus maka kita harus menentukan kelas pada
tabel dengan memilih frekuensi yang paling banyak. Lihat detail rumusnya dibawah ini
Range yang biasa diberi lambang R adalah salah satu ukuran statistik yang
menunjukkan jarak penyebaran antara skor (nilai) yang terendah (Lowest Score) sampai
skor (nilai) yang tertinggi (Highest Score). Dengan singkat dapat dirumuskan dengan
R = H-L
Range kita gunakan sebagai ukuran apabila di dalam waktu yang sangat singkat
kita ingin memperoleh gambaran tentang penyebaran data yang sedang kita selidiki
dengan mengabaikan faktor ketelitian atau kecermatan.
Adapun Kelebihan dan Kelemahan Range :
a. Kelebihan range sebagai suatu ukuran penyeabran data ialah dengan
menggunakan range dalam waktu singkat kita dapat memperoleh gambaran
umum mengenai luas penyebaran data yang sedang kita hadapi.
b. kelemahannya adalah sebagai berikut:
1) Range akan sangat bergantung pada nilai-nilai ekstrimnya. Dengan kata
lain besar-kecilnya range akan sangat ditentukan oleh nilai tertinggi dan
terendah yang terdapat dalam data distribusinya, dengan demikian range
sifatnya sangat labil dan kurang teliti.
2) Range sebagai ukuran penyebaran data tidak memperhatikan distribusi
yang terdapat dalam range itu sendiri, sehingga apabila yang diketahui
hanya nilai tertinggi dan terendahnya saja, kita tidak akan tahu nilai-nilai
yang didapat oleh setiap orangnya dari masing-masing tes yang dilalui.
Keterangan:
σ2 = varians atau ragam untuk populasi
S2 = varians atau ragam untuk sampel
fi = Frekuensi
xi = Titik tengah
x¯ = Rata-rata (mean) sampel dan μ = rata-rata populasi
n = Jumlah data
Koefisien variasi merupakan suatu ukuran variansi yang dapat digunakan untuk
membandingkan suatu distribusi data yang mempunyai satuan yang berbeda. Kalau kita
membandingkan berbagai variansi atau dua variabel yang mempunyai satuan yang berbeda
maka tidak dapat dilakukan dengan menghitung ukuran penyebaran yang sifatnya absolut.
Koefisien variasi adalah suatu perbandingan antara simpangan baku dengan nilai rata-rata
dan dinyatakan dengan persentase.
Besarnya koefisien variasi akan berpengaruh terhadap kualitas sebaran data. Jadi jika
koefisien variasi semakin kecil maka datanya semakin homogen dan jika koefisien
korelasi semakin besar maka datanya semakin heterogen.
Keterangan
Ki = kuartil ke –
n = jumlah data
i = letak kuartil
Keterangan:
b = Tepi bawah interval kelas Ki ( b = batas bawah - 0,5)
p = Panjang kelas interval
i = Letak Ki
n = Banyak data
F = Frekuensi kumulatif sebelum kelas Ki
f = Frekuensi pada kelas Ki
Keterangan:
Di = desil ke –
n = jumlah data
i = urutan desil
Setelah tabel distribusi frekuensi terbentuk, maka dilanjutkan dengan mencari nilai desil
dengan rumus yang diungkapkan Andi (2007: 83), seperti berikut:
Keteragan:
b = Tepi bawah interval kelas Dsi ( b = batas bawah - 0,5)
p = Panjang kelas interval
i = letak Dsi
n = Banyak data
F = Frekuensi kumulatif sebelum kelas Dsi
f = Frekuensi pada kelas Dsi
Keterangan:
Pi = persentil ke –
n = jumlah data
i = urutan persentil
b. Persentil data berkelompok
Mencari persentil dalam bentuk data berkelompok terlebih dahulu dengan adanya tabel
distribusi frekuensi. Hal ini juga disampaikan oleh Riduwan (2009: 116), menyebutkan
bahwa mencari persentil data berkelompok haruslah dibuat susunan dristribusi frekuensi
terlebih dahulu, dalam hal ini semata-mata untuk mempermudah perhitungan.
Setelah tabel distribusi terbentuk, maka dilanjutkan dengan mencari nilai persetil dengan
rumus yang diungkapkan Andi (2007: 86), seperti berikut:
Keterangan
b = Tepi bawah interval kelas Psi ( b = batas bawah - 0,5)
p = Panjang kelas interval
i = letak Psi
n = Banyak data
F = Frekuensi kumulatif sebelum kelas Psi
f = Frekuensi pada kelas Psi
1. Banyaknya subyek penelitian, maksudnya jika populasi ada 1000, maka sampel yang
diambil jangan hanya 5, namun diusahakan lebih banyak, seperti 10 atau 50.
2. Keadaan penyebaran data. Dalam hal ini perlu diperhatikan bahwa pengambilan
sampel harus merata pada bagian populasi. Diharapkan dalam pengambilan sampel
dilakukan secara acak, sehingga kemerataan dapat dimaksimalkan dan apapun
kesimpulan yang didapat dapat mencerminkan keadaan populasi yang sebenarnya.
Statistika Inferensial dibagi menjadi dua, yaitu Statistika Parametrik dan Statistika
Non Parametrik.
Contoh dari statistika inferensial adalah pada pemilihan Ketua BEM Undiksha
tahun 2008. Dalam kegiatan ini, walaupun sistem pemilihannya dengan pemungutan
suara, tetapi tidak semua mahasiswa Undiksha yang diberikan untuk memilih, melainkan
hanya perwakilan dari masing-masing HMJ. Di sini telah dilakukan sampling, yaitu
pemilihan sampel (perwakilan HMJ), dari suatu populasi (seluruh mahasiswa Undiksha).
Statistika Inferensial atau induktif adalah statistik bertujuan menaksir secara
umum suatu populasi dengan menggunakan hasil sampel, termasuk didalamnya teori
penaksiran dan pengujian teori. Statistika Inferensial digunakan untuk melakukan :
a. Generalisasi dari sampel ke populasi.
b. Uji hipotesis (membandingkan atau uji perbedaan/kesamaan dan menghubungkan,
yaitu uji keterkaitan, kontribusi).
Kelemahan:
Jika uji t yang dilakukakan harus banyak .Semakin banyak uji-t yang dilakukan
,semakin kecil angka penyesuaiannya ,semakin besar kemunkinan anda menolak Ha .
18. Anova
Anova adalah sebuah analisis statistik yang menguji perbedaan rerata antar grup. Grup
disini bisa berarti kelompok atau jenis perlakuan. Syaratnya yaitu
Keterangan :
Sb = varian between
Sw = varian within
Sn2 = varian kelompok
X = rata-rata gabungan
Xn = rata-rata kelompok
Nn = banyaknya sampel pada kelompok
k = banyaknya kelompok
Kelebihan:
Dimana :
r = nilai korelasi
x = variabel x
y = variabel y
Langkah analisis :
1. Klik Analuze>Correlate>Bivariate
2. Pindahkan variabel sales dan penjualan ke kolom variable
3. Pilih pearson pada Correlation coeffecient
4. Pilih Two-Tailed pada Test of significance
5. Aktifkan Flag signiicant correlations
6. Kemudian OK
Hipotesis
H0= Tidak ada hubungan antara sales dan penjualan
H1= Ada hubungan antara sales dan penjualan
Kriteria : Tolak hipotesis nol (H0) jika nilai signifikansi p-value (<0.05)
Dari tabel di atas dapat diketahui bahwa nilai signifikansi p-value sebesar 0.000 (<0.05)
maka tolak hipotesis nol (H0). Kesimpulannya ada hubungan antara sales dan penjualan.
Besarnya korelasi adalah 0.827.
20. Regresi Linear Sederhana Dan Regresi Liner Berganda
Secara umum, analisis regresi pada dasarnya adalah studi mengenai
ketergantungan satu variabel dependen (terikat) dengan satu atau lebih variabel
independent (variabel penjelas/bebas), dengan tujuan untuk mengestimasi dan/atau
memprediksi rata-rata populasi atau niiai rata-rata variabel dependen berdasarkan nilai
variabel independen yang diketahui. Pusat perhatian adalah pada upaya menjelaskan dan
mengevalusi hubungan antara suatu variabel dengan satu atau lebih variabel independen.
a. Regresi linear sederhana
Dalam regresi linear sederhana juga ada yang disebut dengan koefisien
korelasi yang menunjukkan bahwa nilai suatu variabel bergantung pada
perubahan nilai variabel yang lain. Rumus untuk menghitung koefisien korelasi
adalah sebagai berikut :
Keterangan:
Y’ = Variabel dependen (nilai yang diprediksikan)
X1 dan X2 = Variabel independen
a = Konstanta (nilai Y’ apabila X1, X2…..Xn = 0)
b = Koefisien regresi (nilai peningkatan ataupun penurunan)
Perlu dibedakan uji ini dari uji yang lain tapi mirip namanya, yaitu uji Wilcoxon Rank
Sum Test. Uji Wilcoxon Rank Sum Test merupakan uji beda nonparametris 2 kelompok
data yang tidak berpasangan. atau disebut data bebas/independen
7. Diantara nilai U1 dan U2 yang lebih kecil digunakan sebagai U hitung untuk
dibandingkan degan U table
8. Jika nilai U hitung pada no. 7 lebih besar dari n1 n2/2 maka nilai tersebut adalah nilai
U’, dan nilai U dapat dihitung dengan rumus : U = n1 n2-U’
9. 9.Dengan kriteria Pengambilan keputusan : • H0 diterima bila U hitung ≥ U tabel ( α;
n1, n2) • H0 ditolak bila U hitung ≤ Utabel ( α; n1, n2)
Perlu kami tekankan lagi, bahwa syarat atau asumsi uji ini adalah:
a) Bila digunakan pada data yang dapat diuji menggunakan statistika parametrik
maka hasil pengujian menggunakan statistik nonparametrik menyebabkan
pemborosan informasi
b) Pekerjaan hitung-menghitung (aritmetik) karena memerlukan ketelitian terkadang
menjemukan
Tidak seperti ANOVA Dua Arah, uji Friedman tidak memerlukan asumsi di
bawah ini:
1. Normalitas distribusi populasi asal sampel
2. Homogenitas varians populasi
3. Tersedianya data yang diukur dalam skala minimal interval
Rumus Uji Friedman
Dimana :
Jika dilakukan secara manual, maka tata tertib melakukan uji korelasi Spearman adalah:
1. Jumlahkan skor item-item di tiap variabel untuk mendapatkan skor total variabel
(misalnya cari skor total variabel X dengan menotalkan item-item variabel X).
2. Lakukan rangkin skor total x (rx) dan rangking skor total y (ry).
Jika uji korelasi Spearman diadakan dengan SPSS maka langkah-langkahnya sebagai
berikut:
3. Buatlah Ranking bagi rx dan ry menggunakan menu Transform > Compute >
Masukkan Skor Total Variabel X dan Variabel Y ke Variables > Pilih saja Smallest
pada Assign Rank > Klik OK. Setelah itu muncul dua variabel baru yaitu rangking
untuk x dan y (lihat di tab Variable View).
4. Lakukan Uji Korelasi Spearman dengan SPSS dengan klik Analyze > Correlate >
Bivariate > Masukkan Rangking X dan Ranking Y ke Variables > Pada Correlation
Coefficient ceklis Spearman > Pada Test of Significance pilih 2-Tailed (jika 2 sisi)
atau 1-Tailed (jika 1 sisi) > Klik OK.
B : Jumlah baris
K : Jumlah kolom
Nilai chi square adalah nilai kuadrat karena itu nilai chi square selalu positif. Bentuk
distribusi chi square tergantung dari derajat bebas (Db)/degree of freedom. Pengertian
pada uji chi square sama dengan pengujian hipotesis yang lain, yaitu luas daerah
penolakan Ho atau taraf nyata pengujian.
Keterangan:
R =angkauan
Xmaks = data terbesar
Xmin = data terkecil
2) Jangkauan interkuartil
H = Q3 – Q1
Keterangan :
H = jangkauan interkuartil
Q3 = kuartil ketiga
Q1 = kuartil pertama
Sk = ½ Q3 – Q1
Keterangan :
Sk = simpangan kuartil
Q3 = kuartil ketiga
Q1 = kuartil pertama
b. Simpangan Rata- Rata
1) Data Tunggal
Keterangan :
SR = simpangan rata-rata
Xi = data ke-i
X = rataan hitung
n = banyak data
Keterangan :
SR = simpangan rata-rata
Xi = data ke-i
X = rataan hitung
fi = frekuensi data ke-i
c. Ragam
Ragam atau variasi adlah nilai yang menunjukkan besarnya penyebaran
data pada kelompok data. Ragam atau variasi dilambangkan dengan s2.
1) Variasi untuk data tunggal
Keterangan :
s2= variasi
xi = data ke –i
x = rataan hitung
n = banyak data
Keterangan :
s2= variasi
xi = data ke –i
x = rataan hitung
fi = frekuensi data ke-i
30. Ukuran letak Data
Ukuran letak data yang masih merupakan salah satu pengukuran data dalam
statiska. Jika pada ukuran pemusatan data terdapat median, mean dan modus. Pada
ukuran letak data terdapat kuartil, desil dan persentil. Untuk menentukan nilai ukuran
letak data, data harus kita urutkan terlebih dahulu dari data nilai yang paling kecil ke data
yang lebih besar. Sebelum kita membahas tentang ukuran letak data, sebaiknya kita
pelajari materi Untuk penjelasan lengkapnya kita uraikan dibawah ini. ukuran ini terdiri
dari kuartil, desil, persentil.