You are on page 1of 64

STATISTIK

TERAPAN
Projo Danoedoro
Jurusan Sains Informasi Geografis dan
Pengembangan Wilayah

POKOK-POKOK MATERI
Kuliah ini tidak membahas tentang dasardasar teori statistik, melainkan penerapan
beberapa prinsip statistik dalam analisis
geografis, khususnya dalam kaitannya
dengan penggunaan peta (SIG dan PJ)
Bersifat komplementer dengan Mata
Kuliah Statistik dan Metode Penelitian
SIGPW

Materi dari Projo:


Error matrix untuk analisis akurasi peta/hasil
interpretasi
Aspek statistik pemrosesan citra
Analisis Regresi untuk pemetaan kecenderungan
(trend)
Principal Component Analysis
Beberapa aspek dari Geostatistik dan Trend
Surface Analysis

50

121

Beberapa catatan
Prinsip yang sama dapat diterapkan untuk
mengevaluasi peta. Bukan hanya citra
Untuk citra dan analisis digital, satuan
perhitungan diberikan dalam piksel, sedangkan
dalam analisis akurasi peta dengan SIG berbasis
vektor, satuan ini bisa dalam satuan luas
Untuk hasil interpretasi visual (misalnya foto
udara) satuan yang biasa digunakan ialah jumlah
satuan pemetaan tetapi metode ini
sebenarnya mensyaratkan perlu-tidaknya
penggabungan klas

Vektor nilai piksel


Citra penginderaan jauh banyak yang
dihasilkan dalam bentuk multispektral,
sehingga setiap piksel setiap posisi baris i dan
kolom j pada suatu saluran k akan mempunyai
pasangan nilai lain pada saluran l dan
seterusnya
Suatu vektor nilai piksel disajikan dalam
bentuk: BVijk, yaitu nilai kecerahan pada baris
i, kolom j, saluran k.

Histogram citra
Suatu citra yang tersusun atas sejumlah kolom
dan baris piksel akan mempunyai distribusi
frekuensi (kemunculan) nilai piksel, yang dapat
disajikan dalam bentuk tabel maupun histogram
Evaluasi atas citra dan upaya perbaikan
kenampakannya --dalam hal tertentu-- dapat
dilakukan tanpa melihat citranya, melainkan
hanya dengan menganalisis histogramnya.

Rerata, kemencengan, kurtosis


Mean (rerata) :

Kemencengan:
(skewness)

Kurtosis:

Tendensi
sentral dan
kemencengan
(skewness)

Histogram yang terdistribusi normal:


Kurtosis = 0 sempurna
Kurtosis >0 dan besar semakin curam
Kurtosis <0 dan kecil semakin landai

Citra dengan kenampakan kontras antara dua


jenis obyek yang secara spektral berbeda
tajam tidak akan menyajikan histogram
berkurva normal.
Contoh: citra inframerah dekat, tengah
dan jauh untuk kenampakan darat dan
tubuh air

Ukuran dispersi : variansi dan kovariansi


Julat (range) : maxk mink
Variansi = (Sd)2 =

Kovariansi

Mean =44.698477, Sd=32.388668

Mean =61.196332, Sd=13.541991

Mengukur kekuatan hubungan


antar-variabel: korelasi
Tipe korelasi

Skala pengukuran Karakteristik data

Product moment (r)

Interval/rasio

Dapat digunakan untuk


kedua macam skala

Spearman rank (rs)

Ordinal

Kendalls tau ()

Ordinal

Kedua variabel harus


dinyatakan sebagai data
berperingkat untuk
kedua macam uji ini

Biserial (rb)

Nominal

Salah satu merupakan


variabel dikotomis,
sedangkan yang lain
punya > 2 macam nilai

Koefisien Phi ( atau r )

Nominal

Kedua variabel harus


dikotomis

Pustaka
Shaw dan Wheeler (Wheeler). 1989
(1995). Statistical Techniques in
Geographical Analysis. NY: John Wiley
and Sons
Watford, N. 1996. Geographical Data
Analysis. NY: John Wiley and Sons

Pearsons product moment


Perhitungan melibatkan kovariansi
Kovariansi dapat dihitung dari populasi atau dari
sampel
Kovariansi populasi:
Kovariansi sampel:

Kovariansi dapat juga diartikan sebagai


simpangan rerata dari satu himpunan observasi
dari sentroid mereka (sentroid rerata)

Rumus r (product moment) untuk N populasi:

Rumus r (product moment) untuk n sampel:

Rumus rs (spearman rank):


rs = 1 (6D2)/N(N2-1)

Net farm income

rs = 1 (6D2)/N(N2-1)
rs = 1- (6 x 5.5)/(50x(502-1)
= +0.9997

Koefisien Phi ()
Digunakan untuk data tabel silang
Hanya berlaku untuk dua variabel yang
masing-masing bersifat dikotomis,
disajikan dalam bentuk tabel kontingensi
Rumus:
=
AD BC

[(A+B)(B+C)(A+C)(B+D)]

Tabel kontingensi untuk koefisien korelasi


Atribut a
Ada/setuju/ya, dsb. Tidak ada/
menolak/tidak, dsb

Atribut
b

Ada/setuju/ya,
dsb.

Tidak ada/
menolak/tidak,
dsb

AD BC
[(A+B)(B+C)(A+C)(B+D)]

Erosi
Ada

Lereng

Tidak ada

Curam

11

13

Tidak
curam

25

12

38

24
26
50

AD BC
= (11x25) (13 x 1)
[(A+B)(B+C)(A+C)(B+D)] (24 x 14 x 12 x 38)

= + 0,4912

Peta batas administratif


kecamatan

Jenis analisis korelasi apa yang


dapat kita lakukan dengan
dua macam peta ini?
PETA PENGGUNAAN LAHAN KABUPATEN KARANGANYAR JAWA TENGAH
470000 mT

480000

490000

500000

510000

Skala 1:180.000

520000 mT

8 Km

N
W
9170000 mU

9170000 mU

KAB. SRAGEN
Kec. Gondangrejo

Kec. Kebakkramat

Legenda

Kec. Colom adu


Kec.M ojogedang

Kec. Jenawi

Kec. Kerjo

Kec. Jaten

Batas Kecamatan

Kec Tas ikm adu

Batas Kabupaten

Kec. Karanganyar

9160000

9160000

E
S

Kec. Ngargoyoso

Kec. Karangpandan

Batas Propinsi
Sungai
Waduk

KAB. SUKOHARJO

Kec. M ates ih
Kec. T aw angm angu

Laut Jawa
Kec. Jumapolo

Prop. Jawa Tengah


Kab. Karanganyar

Kec. Jatiyoso

Kec.Jatipuro

Prop. DIY

9140000 mU

9140000 mU

9150000

9150000

Kec. Jumantono

Samudera Hindia

470000 mT

480000

490000

500000

510000

520000 mT

Sumber : Data Pokok Kabupaten Karanganyar


Berupa Peta Digital Karakteristik Lahan

Analisis Regresi
Mengukur kekuatan hubungan dengan
analisis korelasi
Menerapan bentuk persamaan regresi
yang sesuai
Regresi linier berganda
Beberapa catatan

Menganalisis hubungan:
Beyond statistical consideration
Menilai kekuatan hubungan tidak hanya
bergantung pada observasi atas 2 variabel
(x dan y) saja Perlu memperhatikan
adanya pengaruh variabel lain
Dengan mencoba memecah data ke
dalam 2 kategori, pengamatan
mengenai ada-tidaknya hubungan bisa
dikaji lebih mendalam dan akurat

pendapatan keluarga

R =0,01

Pola permukiman tidak teratur


Pola permukiman teratur

R =0,75

pendapatan keluarga

pendapatan keluarga

ukuran rumah

R = -0,15

ukuran rumah
ukuran rumah

Menerapkan persamaan regresi


Regresi linier: Y = a + bX + e

Y = variabel terikat
X = variabel bebas
a = intercept pada sumbu Y, yaitu nilai Y ketika X = 0
b = koefisien gradien/slope
e = error

a=

(Y)(X2) (X)(XY)
N X2 - (X)2

b=

N XY - (X)(Y)
N X2 - (X)2

Contoh: persamaan regresi antara jumlah


penduduk dengan jumlah toko (N=15)
pdd

Jumlah
penduduk
(X)

Wilayah A

9.204

84.713.616

95

9.025

874.380

Wilayah B

5.629

31.685.640

94

8.836

529.126

Wilayah C

17.883
.
.

319.801.664
.
.

271
.
.

73.441
.
.

4.846.293
.
.

Wilayah O

14.830

219.928896

233

54.289

3.455.390

125.442

1.453.923.072

2.127

412.911

22.648.580

wil

Jumlah

X2

Jumlah
toko
(Y)

Y2

XY

Menerapkan persamaan regresi


Regresi linier: Y = a + bX + e
a=

b=

(2127)(1453923072) (125442)(22648580) = 41.4


(15 x 1453923072) - 15735695360
(15) (22648580) - (125442)(2127)
(15 x 1453923072) - 15735695360

Persamaan regresi menjadi

Y = 41,4 + 0,0120X

= 0,0120

Modifiable
Areal Unit
Problem
(MAUP):
Scale Effect

Modifiable
Areal Unit
Problem
(MAUP):
Zoning Effect

Regresi non linier?

Bentuk umum:
Logaritmik sederhana : Y = a + b.logX
Eksponensial sederhana : Y = a.ebX
Pangkat sederhana: Y = a.Xb

Tugas: Baca Shaw and Wheeler (1989)


atau lainnya, untuk memahami model
fungsi regresi non-linier

Regresi linier berganda


Digunakan untuk menggambarkan
hubungan matematis antara satu variabel
terikat (Y) dengan beberapa variabel
bebas (Xi)
Menggunakan asumsi bahwa masingmasing variabel bebas Xi bersifat saling
independen

Bentuk umum:
Y = a + b1X1 + b2X2 + b3X3 + + biXi + e
a = nilai intercept
b1 s/d bi = koefisien regresi parsial
e = error

Tidak dapat digambarkan secara grafis,


kecuali kalau hanya terdapat dua variabel
bebas X1 dan X2.
Pada kasus di mana hanya ada 2 variabel X1
dan X2, bentuk persamaan yang umum
adalah

Pada kasus di mana hanya ada 2 variabel X1 dan X2, bentuk


persamaan yang umum sebenarnya adalah

Y = a + b01.2 X1 + b02.1 X2 + e
di mana b01.2 adalah koefisien regresi yang mewakili garis
regresi Y vs X1, dengan asumsi X2 tetap (konstan). Begitu
sebaliknya untuk b02.1.
Bila persamaan di atas hanya digambarkan dengan b1 dan b2,
maka perhitungan b1 dan b2 adalah sbb:
b1 = (Y Y)(X1 X1)(X X1) (X2-X2)2

SELANJUTNYA: TUGAS UNTUK REGRESI


LINIER BERGANDA

ANALISIS FAKTOR
Analisis faktor diperlukan ketika dalam suatu
penelitian ada sejumlah besar variabel yang
terlibat; khususnya ketika dalam mengamati
variabel-variabel yang berpengaruh terhadap
suatu fenomena Y, terdapat sejumlah besar Xi
yang harus diperhitungkan kontribusinya
Dalam analisis faktor, diasumsikan bahwa
sejumlah besar variabel Xi tersebut belum tentu
saling independen

ANALISIS FAKTOR
Analisis faktor juga diperlukan karena:
Ada kebutuhan untuk mempelajari hubungan timbal-balik
antar sejumlah besar variabel
Untuk menilai masing-maisng faktor menurut keterkaitan
variabel yang ada di dalam kelompoknya
untuk digunakan sebagai dasar dalam menyisihkan
variabel yang tidak nyata

Analisis faktor bertumpu pada data rasio/interval,


yang besarannya dapat diplot pada suatu sistem
koordinat multi-dimensi. Perhatian utama analisis
faktor adalah pada upaya penentuan sumbu-sumbu
utama dari sejumlah variabel.

Beberapa jenis analisis faktor


Tahap

Tipe pilihan

Terminologi

Matriks korelasi

(a) antar-variabel

R-factoring

(b) Antar individu

Q-factoring

(a) Faktor yang


terdefinisi

Principle Component

(b) Faktor terinferensi

Factor analysis

(a) Uncorrelated (takberkorelasi)

Ortogonal

(b) Correlated
(berkorelasi)

Condong

Ekstraksi faktor inisial

Rotasi untuk mencapai


faktor final

Sumbu utama
pertama
Sumbu utama
kedua

Contoh analisis awal dengan melibatkan koefisien korelasi


antar 3 variabel: Estimasi variabel rerata baru (atau faktor)
Lereng

Elevasi

Drainase
permukaan

Lereng

1,0

0,6

0,7

Elevasi

0,6

1,0

0,8

Drainase permukaan

0,7

0,8

1,0

Jumlah korelasi=

2,3

2,4

2,5

Bobot faktor
(factor loadings)=

Jumlah setiap korelasi


(jumlah total korelasi)

Variabel

Bobot faktor
(factor loading)

Kuadrat bobot

Lereng

2,3/(2,3+2,4+2,5) =
0,85

0,72

Elevasi

2,4/(7,2) =
0,89

0,79

Drainase permukaan

2,5/ (7,2) =
0,93

0,86

Nilai eigen (eigen value) =


(kuadrat bobot faktor)

2,37

Besarnya variansi faktor, dalam persen, adalah: (1/n), =nilai eigen


Sehingga untuk faktor I = 2,37/3 = 79%
Perhitungan untuk nilai eigen dan persentase faktor II, III dst biasanya tidak
mungkin dilakukan secara manual, dan dilakukan secara iteratif (berulang)
dengan komputer.

Sumbu utama
pertama
Sumbu utama
kedua

Total variansi:
% faktor
Nilai eigen

GEOSTATISTIK
Concern utama: variabel acak yang terdistribusi
dalam ruang, yang disebut sebagai
teregionalisasi (regionalized)
Geostatistik dapat digunakan untuk melakukan
ekstraksi sifat-sifat spasial dari variabel-variabel
yang teregionalisasi
Manfaat
interpolasi
klasifikasi

Analisis geostatistik
Pioner: Krige (1951), di Afrika Selatan
tambang emas
Matheron dan Ghandin (1971) di Uni
Soviet karakteristik tanah
Konsep fundamental :
PRINSIP AUTOKORELASI SPASIAL

AUTOKORELASI DAN KRIGING


Autokorelasi: hubungan statistik antar titiktitik yang diukur, di mana korelasi
tergantung pada jarak dan arah yang
memisahkan lokasi titik-titik tersebut.
Prinsipnya: yang berdekatan lebih punya
kemiripan daripada yang berjauhan.
Semakin jauh, semakin tidak mirip

AUTOKORELASI: HUKUM GEOGRAFI YANG PERTAMA


MENURUT WALDO TOBLER

Autokorelasi dan Kriging


Kriging memanfaatkan prinsip autokorelasi
spasial, dan pada dasarnya merupakan
distance-weigthed interpolation
Kriging memberi bobot pada ruang di sekitar
nilai-nilai yang diukur, untuk memprediksi nilai
setiap titik pada lokasi baru
Bobot tidak hanya pada titik-titik yang dievaluasi,
melainkan juga titik yang akan diprediksi, dan
juga susunan keruangan (spatial arrangement)
yaitu autokorekorelasi titik-titik yang diukur

Kriging
Kriging menggunakan bobot berdasarkan
perhitungan statistik data, dan bukan
bersifat a-priori (seperti pada scoring)
menjadi pembeda kunci antara analisis
deterministik (tradisional) dan analisis
geostatistik
Proses Kriging:
Kuantifikasi struktur spasial dari titik-titik data
di sekitar titik yang akan diprediksi
Menghasilkan prediksi pada suatu lokasi baru

Variografi, semivariogram
Variografi proses di mana model spasial
terplotkan secara tepat pada data, dan struktur
spasialnya terkuantifikasi
Semivariogram digunakan untuk mengkaitkan
semivariansi dengan separasi spasial/
autokorelasi yang ada pada sampel
Semivariansi memberikan deskripsi tak bias
mengenai skala dan pola variabilitas spasial di
seluruh wilayah kajian

Contoh komputasi semivariansi


12 nilai kecerahan secara individual (BV) yang
terdapat pada suatu penampang/jalur
(BV) z dari piksel x diekstrak dengan interval
teratur z(x), di mana x = 1,2,3,n
Hubungan antara suatu pasangan piksel sejauh
h interval dapat diberikan oleh nilai variansi
rerata sepanjang penampang
Ada m kemungkinan pasangan yang dipisahkan
oleh lag distance h.

Semivariogram (h) merupakan fungsi yang


mengkaitkan setengah dari pangkat perbedaan antara
titik-titik sampel:

Semivariansi rerata merupakan ukuran yang bagus


untuk besarnya ketidakmiripan (dissimilarity) antar
piksel-piksel yang secara spasial terpisah

Karakteristik terpenting dalam semivariogram:

PENGAMBILAN SAMPEL

You might also like