You are on page 1of 55

Tugas Analisis Data Spasial dan SIG

(B.6 Variogram dan Kriging dan C.1 Model Ekonomi


Spasail)
Dosen Pengampu:
Prof. Dr. Ir. Henny Pramoedyo, MS

Oleh:
Adriani Bunga Nona Risky
156090500111003

PROGRAM STUDI MAGISTER STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA
MALANG
2016
1

DAFTAR PUSTAKA

B.6

Variogram dan Kriging1

B.6.1 Pengantar..1
B.6.2 Teori Geostatistik.1
B.6.3 Penduga Variogram.3
B.6.4 Pemodelan Variogram.7
B.6.5 Studi Kasus: Variogram.10
B.6.6 Prediksi Geostatistik: Kriging16
B.6.7 Studi Kasus: Kriging 23
C.1

Model Ekonomi Spasial.29

C.1.1 Pendahuluan 29
C.1.2 Penduga Model Lag Spasial 33
C.1.3 Penduga Parameter Dispersi dan Infersi37
C.1.4 Interpretasi Penduga Parameter.. 38
C.1.5 Penutup..46

B.6 Variogram dan Kriging


Margaret A. Oliver

B.6.1 Pengantar
Statistik spasial dan geostatistik telah dikembangkan untuk menggambarkan dan
menganalisis variasi di kedua fenomena alam dan buatan manusia, di atas atau di bawah
permukaan tanah. Statistik spasial termasuk salah satu teknik formal yang mempelajari
kesatuan yang memiliki indeks spasial (Cressie 1993). Istilah geostatistik pada dasarnya
berlaku untuk satu set tertentu dari model dan teknik yang dikembangkan sebagian besar
oleh Matheron (1963) pada tahun 1960 untuk mengevaluasi cadangan pemulihan untuk
industri pertambangan. Ide-ide ini telah muncul sebelumnya di bidang lain; mereka
memiliki sejarah panjang peregangan kembali ke Mercer dan Hall (1911), Youden dan
Mehlich (1937), Kolmogorov (1941), Gandin (1965), Matern (1960) dan Krige (1966).
Geostatistik sejak itu telah diterapkan di berbagai bidang, seperti pertanian, perikanan,
hidrologi, geologi, meteorologi, minyak bumi, penginderaan jauh, ilmu tanah dan
sebagainya. Sebagian besar bidang ini datanya adalah fragmentaris dan jarang, karena itu
ada kebutuhan untuk memprediksi dari mereka setepat mungkin di tempat-tempat di
mana mereka belum diukur.
B.6.2 Teori Geostatistik
Dasar geostatistik modern adalah untuk memprediksi variabel keuntungan sebagai
variabel acak. Ini berarti bahwa pada setiap titik
nilai untuk properti,

Z ( x ) , dan satu diamati,

dalam ruang ada serangkaian nilaiz ( x ) , yang diambil secara acak

menurut beberapa hukum, dari beberapa distribusi probabilitas. Pada


properti

Z (x)

variabel acak,

adalah variabel acak dengan rata-rata,


Z ( x1 ) , Z ( x2 ) , ,

x , sebuah

dan varians,

2 . Set

adalah proses acak, dan nilai sebenarnya dari Z yang


1

diamati adalah salah satu yang berpotensi sejumlah realisasi dari proses acak. Dalam
statistik klasik set nilai-nilai yang diamati, realisasinya, adalah penduduk.
Kovarians untuk variabel-variabel acak diberikan oleh

C ( x 1 , x 2 )=E { Z ( x 1 ) ( x 1 ) }{ Z ( x 2 ) ( x 2 ) }
di mana

( x1 )

dan

( x2 )

adalah rata-rata

di

x1

(B.6.1)
dan

x2

dan

menunjukkan nilai harapan.


Stasioneritas
Kami berasumsi bahwa rata-rata,
( x1 )

dan

=E [ Z ( x ) ] , adalah konstan untuk semua

( x2 ) dapat diganti dengan

sampel berulang. Ketika

x1

, yang dapat diduga dengan pengambilan

x2

dan

x , dan

bertepatan (sesuai), Persamaan (B.6.1)

mendefinisikan varians (atau varians priori dari proses),

2=E [ { Z ( x ) }

diasumsikan terbatas, seperti untuk rata-rata, sama dimana mana. Ketika

, yang

x 1 dan

x2

tidak sesuai, kovariansnya tergantung pada perpisahannya dan bukan pada posisi
mutlaknya, dan ini berlaku untuk setiap pasang titik

xi ,

xj

dipisahkan oleh lag

h=xi x j (vektor di kedua jarak dan arah), sehingga

C ( x i x j )=E {Z ( x i ) }{Z ( x j ) } =E [ { Z ( x ) }{ Z ( x +h ) }2 ]=C ( h )


yang juga konstan diberikan untuk

(B.6.2)

h . Persamaan (B.6.2) menunjukkan bahwa

kovarians adalah fungsi dari lag dan menggambarkan secara kuantitatif ketergantungan
antara nilai Z dengan mengubah pemisahan atau jarak lag. Autokovarian tergantung pada
skala Z diukur; oleh karena itu, sering dikonversi ke autokorelasi berdimensi oleh
( h )=C ( h ) /C ( 0 )
2
di mana C ( 0 ) = adalah kovarians pada lag nol.

Variasi intrinsik dan variogram


2

(B.6.3)

Kovarian tidak dapat didefinisikan karena tidak ada nilai

untuk dimasukkan ke

dalam Persamaan (B.6.2). Matherons (1965) solusi untuk ini adalah hipotesis lemah
intrinsik geostatistik. Meskipun rata-rata umum mungkin tidak konstan, itu akan menjadi
jarak lag kecil sehingga diharapkan perbedaan akan menjadi nol sebagai berikut:
E [ Z ( x ) Z ( x+ h ) ] =0

(B.6.4)

dan diharapkan kuadrat perbedaan bagi yang tertinggal menentukan variansnya


E [ { Z ( x )Z ( x +h ) } ] =var [ Z ( x )Z ( x +h ) ]=2 ( h )
2

Kuantitas

( h)

dikenal sebagai semivariance di lag

titik dianggap berpasangan. Sebagai fungsi

h ,

(B.6.5)

h , atau varians per titik ketika

( h)

adalah semivariogram atau

biasanya variogram.
Jika proses

Z (x)

adalah urutan kedua stasioner, semivariance dan kovarians

yang setara
( h )=C ( 0 )C ( h )= 2 { 1 ( h ) }

(B.6.6)

Namun, jika proses intrinsik hanya ada kesetaraan karena fungsi kovarians tidak ada.
Variogram ini berlaku, namun, karena itu dapat diterapkan lebih luas dari fungsi
kovarians.
B.6.3 Penduga Variogram
Bagian ini menjelaskan dua metode untuk menduga variogram dari data, metode momen
Matheron dan metode residual maximum likelihood (REML), bersama dengan fitur
utama yang cenderung memiliki variograms.
Penduga metode momen
Semivariances empiris dapat diduga dari data,

z ( x1 ) ,

z ( x 2 ) , , oleh

m (h)

2
1
^ ( h )=
z ( x i )z ( x i+ h ) }

{
2 m ( h ) i=1

(B.6.7)

di mana

z ( xi )

dan

z ( x i +h )

adalah nilai-nilai yang sebenarnya dari Z pada

( xi )

dan ( x i+ h ) , dan m ( h ) adalah jumlah perbandingan berpasangan pada lag h. Dengan


mengubah h, set memerintahkan semivariances diperoleh; ini merupakan percobaan
variogram atau sampel. Cara mengimplementasikan persamaan ini sebagai algoritma
tergantung pada konfigurasi data. Untuk transek biasa lag menjadi skalar,

h= h ,

dimana semivariances dapat dihitung hanya pada kelipatan interval sampling. Lag
maksimum harus ditetapkan tidak lebih dari sepertiga panjang transek. Untuk grid biasa,
semivariances dapat dihitung sepanjang baris dan kolom dari grid dan kenaikan lag
adalah interval jaringan. Untuk sampel data yang tidak teratur dalam satu atau lebih
dimensi, atau untuk menghitung variogram omnidirectional data pada grid biasa,
pemisahan antara pasangan titik ditempatkan ke tempat bin dengan batas yang
memisahkan jarak dan arah, Gambar B.6.1. Dalam gambar ini, 0L adalah interval lag
/2

nominal panjang h, w adalah lebar bin,

adalah sudut toleransi dan adalah salah

satu dari set arah. Untuk menghitung variogram atas semua arah, variogram
omnidirectional, /2

diatur untuk 180-an dan diatur ke nol.

Gambar. B.6.1. Diskritasi lag ke tempat bin untuk data tidak teratur yang tersebar

Pilihan bin yang sempit cenderung menimbulkan variograms tidak menentu, sedangkan
bin yang lebar cenderung halus dan mengakibatkan hilangnya detail.
Webster dan Oliver (1992) telah menunjukkan bahwa setidaknya 100 titik
sampling diperlukan untuk memperkirakan variogram MoM. Dalam situasi lain ukuran
sampel mungkin mengakibatkan jarak sampel lebih dekat daripada yang dibutuhkan
4

untuk menyelesaikan variasi memadai; ini terjadi di mana properti yang memiliki skala
besar variasi spasial relatif terhadap batas wilayah studi. Hal ini akan mengakibatkan
over-sampling dan pemborosan sumber daya. Pardo-Igzquiza (1997) menyarankan
pendekatan maximum likelihood (ML) sebagai alternatif untuk penduga Matheron. Dia
juga menyarankan bahwa di mana jumlah data yang relatif kecil (beberapa lusin), ML
variogram estimator menawarkan alternatif yang memberikan pendugaan parameter
variogram dan ketidakpastiannya (Pardo-Igzquiza 1998, hlm. 462-464).
Residual maximum likelihood (REML) variogram estimator
Setelah notasi Kerry dan Oliver (2007), diasumsikan bahwa data,

z ( x i ) , i=1, ,n ,

realisasi dari proses ini, mengikuti distribusi multivariat Gaussian dengan fungsi
kepadatan probabilitas gabungan (pdf) dari yang didefinisikan oleh pengukuran
1

V 2 exp

{12 ( zX ) V
T

( z X )

(B.6.8)

n
2

p ( z , )=( 2 )
di mana

adalah vektor yang berisi n data, berisi parameter dari matriks kovarians,

V adalah varians-kovarians matriks n oleh n, dan

merupakan tren. Matriks V

dapat difaktorkan sebagai


V = 2 A
di mana

(B.6.9)

adalah varians dan A adalah matriks autokorelasi. Pdf dapat ditulis

kembali sebagai
1
2

A exp

1
( z X )T A1 ( zX )
2
2
2

p ( z , , ) =( 2 )
di mana

n
2

(B.6.10)

adalah himpunan parameter kovarians termasuk varians. Parameter,

, 2 , , diduga meminimalkan fungsi loglikelihood negatif yang diberikan oleh


n
1
1
ln L ( , ^ 2 , z ) = ln ( 2 ) +n ln ( ) + ln |A|+ 2 ( zX )T A1 ( z X )
2
2
2
5

(B.6.11)

Kenaikan umum, g, dapat direpresentasikan sebagai


g= z

(B.6.12)

di mana matriks berasal dari matriks proyeksi


1

P=I X ( X T X ) X T

(B.6.13)

dengan menjatuhkan p baris dalam karena ada p penambahan umum yang linear
tergantung pada yang lain (Kitanidis 1983). Matriks P memiliki properti
PX =0

(B.6.14)

maka
Pz=PX + Pe=Pe

(B.6.15)

yang menyaring tren terlepas dari apa koefisien

. e adalah residual. Maka

E ( g )=0

(B.6.16)

dan
E ( g g T ) = V T

(B.6.17)

Kelipatannya, g, diasumsikan Gaussian dan kovarians parameter diduga oleh


minimalisasi fungsi negative log-likelihood (NLLF), yang diberikan oleh
ln LT ( ^ 2 , g )=

1
n p
n p n p
1
n p
ln ( 2 ) +

ln ( n p ) + ln | A T |+
ln [ gT ( A T ) g ]
2
2
2
2
2

(B.6.18)
Kovarians parameter, , dapat mencakup nugget varians (lihat di bawah untuk definisi),
panjang dan pendek komponen jarak untuk situasi isotropik dan anisotropik, bersamasama dengan rasio anisotropik yang terakhir. Pardo-Igzquiza (1997) program MLREML
ini menghitung parameter untuk tiga model kovarians, berbentuk bulat, eksponensial dan
Gaussian.

Fitur dari variogram

Kontinuitas.

Kebanyakan

mengharapkan

( h)

variabel

lingkungan

berkelanjutan,

karena

itu

kita

untuk melewati asal di h = 0 [Gambar B.6.2 (a)]. Namun dalam

prakteknya, variogram yang sering muncul mendekati ordinat di beberapa nilai positif
sebagai h mendekati nol, Gambar B.6.2 (b), menunjukkan bahwa proses ini terputusputus. Perbedaan ini dikenal sebagai varian nugget. Gambar B.6.2 (c) adalah variogram
nugget murni yang biasanya menunjukkan bahwa interval sampling terlalu besar untuk
menyelesaikan variasi.
Peningkatan monoton. Gambar B.6.2 (a) dan (b) menunjukkan bahwa kenaikan
semivariance dengan meningkatnya jarak lag. Hal ini menunjukkan bahwa pada jarak
pendek nilai-nilai dari

Z (x)

adalah sama, tetapi karena lag meningkat jarak mereka

menjadi semakin berbeda dari rata-rata. Meningkatnya kemiringan secara monotonik


menunjukkan bahwa proses ini tergantung pada spasial.
Ambang dan rentang. Gambar B.6.2 (b) menunjukkan variogram yang mencapai batas
atas setelah kemiringan awal; ini terikat dikenal sebagai varian ambang. Ini adalah
varians priori,

2 , dari proses. Sebuah variogram dibatasi menggambarkan proses

urutan kedua stasioner. Jarak di mana variogram mencapai ambang adalah rentang, yaitu
kisaran ketergantungan spasial.
Efek hole dan periodisitas. Variogram mungkin menurun dari maksimum ke minimum
lokal dan kemudian meningkat lagi. Maksimum ini setara dengan minimal dalam fungsi
kovarians yang muncul sebagai 'hole'. Ini menunjukkan pengulangan cukup teratur dalam
proses. Sebuah variogram yang berfluktuasi dengan cara periodik dengan meningkatnya
jarak lag menunjukkan keteraturan yang lebih besar dari pengulangan.

Gambar B.6.2. Tiga bentuk variogram ideal: (A) tidak terbatas; (b) dibatasi; dan (c) adalah
komponen spasial korelasi [ c 0

adalah varian nugget, a adalah kisaran spasial ketergantungan,

c +c 0 adalah varians sill, dan c nugget murni]


Variogram tidak terbatas. Jika variogram meningkat tanpa batas dengan meningkatnya
jarak lag seperti pada Gambar B.6.2 (a), proses ini intrinsik saja.
Anisotropi. Untuk mengeksplorasi data setiap anisotropi, yaitu arah variasi, variogram
harus dihitung paling sedikit tiga arah. Untuk grid biasa, biasanya untuk menghitung
variogram di sepanjang baris, kolom dan diagonal utama. Jika gradien awal atau
jangkauan perubahan variogram dengan arah dan transformasi sederhana dari koordinat
akan menghapusnya, maka ini dikenal sebagai anisotropi geometris. Contoh ini diberikan
pada Gambar B.6.5 kemudian dalam studi kasus; itu menunjukkan variogram dari pH
pada Brooms Barn Farm dihitung dalam empat arah dari data pada grid biasa. Jika
varians ambang berfluktuasi dengan perubahan arah, ini mungkin menunjukkan adanya
zona istimewa orientasi dengan rata-rata yang berbeda. Hal ini dikenal sebagai zonal
anisotropi.
Variasi Bersarang. Variasi dalam lingkungan sering terjadi di beberapa skala spasial
secara bersamaan, dan pola variasi dapat bersarang satu sama lain. Hal ini biasanya
terlihat ketika ada banyak data, misalnya dari penginderaan jauh dan lain-lain. Variogram
percobaan sering muncul lebih kompleks jika terdapat lebih dari satu skala spasial; hal ini
dapat dilihat pada Gambar B.6.6. Kombinasi dari dua atau lebih model sederhana yang
berwenang dapat digunakan untuk model variogram tersebut. Model gabungan yang
paling sederhana adalah satu dengan komponen nugget. Ketergantungan spasial dapat
terjadi pada dua skala yang berbeda dan ini dapat direpresentasikan dalam variogram
sebagai dua komponen spasial. Model menggambarkan lebih dari satu tata ruang yang
sering dikenal sebagai fungsi bersarang; model berbentuk bulat bersarang atau ganda
yang paling sering digunakan, Gambar B.6.6 (b).
B.6.4 Pemodelan Variogram
MoM variogram eksperimental terdiri dari satu set penduga diskrit pada interval lag
tertentu, merupakan subyek kesalahan yang muncul sebagian besar dari fluktuasi
sampling. Variogram mendasar, yang mewakili variasi regional, bersifat kontinu. Untuk
8

memperoleh perkiraan ini kita bisa sesuaikan dengan apa yang dikenal sebagai fungsi
resmi conditional negative semi-definite (CNSD) dengan nilai-nilai percobaan. Ada
beberapa fitur fungsi utama yang harus bisa mewakili:
(i) peningkatan monoton dengan meningkatnya jarak lag dari dekat ordinat,
(ii) maksimum konstan atau asymptote (ambang),
(iii) intersep positif pada ordinat (nugget),
(iv) anisotropi.
Rumus untuk fungsi yang dipilih akan diberikan dalam bentuk isotropik, yaitu untuk
h= h .
Model lingkaran. Persamaan untuk fungsi lingkaran adalah

}
2

2
2h
h
1 h
c 0+ c 1 cos
+
1 2 untuk h a

a a
a
( h )=
c0 + c untuk h> a
0 untuk h=0

di mana

( h)

autokorelasi,

c0

()

(B.6.19)

adalah semivariance di lag h, c adalah varians a priori dari proses


adalah varians nugget yang mewakili variasi spasial berkorelasi pada

jarak kurang dari interval sampling dan pengukuran kesalahan, dan a adalah parameter
jarak, kisaran ketergantungan spasial atau autokorelasi spasial. Gabungan

c 0 +c

adalah

model sill. Secara teoritis semivariance di lag nol itu sendiri nol, tetapi dalam prakteknya
biasanya ada sedikit perkiraan

( h)

dekat dengan ordinat sesuai model melalui titik

asal. Fungsi ini merupakan CNSD dalam dua dimensi. Kurva erat karena mendekati
rentang (lihat Gambar B.6.4 (i)).
Fungsi berbentuk bulat. Persamaannya adalah

( )}

3h 1 h 3
c 0+ c
+
untuk h a
2a 2 a
( h )=
c 0 +c untuk h> a
0 untuk h=0

(B.6.20)

Kurva model ini secara bertahap sebagai ambang tercapai dari lingkaran, lihat Gambar
6.4.4 (c). Fungsi ini adalah CNSD dalam tiga dimensi. Ini merupakan fitur transisi yang
memiliki batas umum yang muncul sebagai patch, beberapa dengan nilai besar dan
lainnya dengan nilai kecil. Diameter rata-rata patch diwakili oleh berbagai model.
Fungsi Pentaspherical. Model kurva ini lebih halus saat mendekati ambang dibandingkan
model sebelumnya, lihat Gambar B.6.3 (b). Hal ini CNSD dalam tiga dimensi. Fungsi
pentaspherical memiliki persamaan

( h )=

c 0+ c

( ) ( )}
3

15 h 5 h
3 h

+
untuk h a
8a 4 a
8 a
c 0 +c untuk h>a
0untuk h=0

(B.6.21)

Fungsi eksponensial. Fungsi eksponensial dan fungsi berbentuk bulat bersama-sama


memperhitungkan sebagian besar model yang dipasang dalam ilmu lingkungan.
Persamaannya adalah

( h )=c 0 +c 1exp

di mana

c0

( hr )}

(B.6.22)

dan c memiliki arti yang sama seperti di atas, tetapi parameter jarak

sekarang r. Model eksponensial mendekati ambang bahkan lebih halus daripada model
sebelumnya dan juga asimtotik sehingga tidak memiliki jangkauan yang terbatas. Dalam
prakteknya, jangkauan efektif ditugaskan pada jarak di mana fungsi telah mencapai 95
persen c. Kisaran efektif, a', adalah 3r. Hal ini CNSD dalam tiga dimensi. Fungsi
eksponensial juga merupakan struktur transisi, tetapi sekarang memiliki luasan acak.

10

Eksponensial stabil. Ini adalah pengganti yang berguna untuk fungsi Gaussian
variograms eksperimental yang muncul mendekati asal dengan kelengkungan terbalik;
dapat direpresentasikan oleh persamaan umum

{ ( )}

h
( h )=c 0 +c 1exp
r

dimana

1<< 2 . Untuk fungsi Gaussian

(B.6.23)

=2 , yang dikecualikan karena mewakili

variasi terdiferensiasi dalam proses, yang tidak acak. Websterand Oliver (2006)
menggunakan fungsi eksponensial yang stabil untuk menggambarkan variasi topografi.
Model tak terbatas. Model ini memiliki persamaan umum termasuk varian nugget dari
( h )=c 0 +wh

(B.6.24)

di mana w menggambarkan intensitas dari proses, dan eksponen,


kelengkungan. Jika

, menggambarkan

< 1 , kurva cembung ke atas; jika itu adalah salah satu garis lurus

dan w adalah gradien; dan jika

>1

kurva ke atas cekung. Eksponen harus terletak

dengan benar antara nol dan dua.


Model anisotropi. Jika variogram eksperimental anisotropik, maka variasi adalah fungsi
jarak, h, dan arah, . Anisotropi geometris dapat dibuat isotropik oleh transformasi linear
dari koordinat. Transformasi didefinisikan berdasarkan referensi elips
( )= A2 cos2 ( )+ B2 sin 2 ( )

(B.6.25)

di mana A dan B adalah diameter panjang dan pendek pada elips, masing-masing, dan
adalah orientasi, yaitu arah sumbu panjang. Untuk model dibatasi, menggantikan
parameter jarak dari variogram isotropik sebagai berikut untuk variogram eksponensial
(lihat Gambar B.6.5 (b))

11

h
()

1exp { ]
( h , )=c 0 +c

(B.6.26)

dan untuk fungsi kekuasaan menggantikan gradien


( h , )=c 0 + [ ( ) h ]

(B.6.27)

Model bersarang. Fungsi berbentuk bulat bersarang diberikan oleh

c 0+ c 1

( h )=

Dimana

c1

variasi, dan

dan
c2

dan

( ) } { ( ) }untuk 0<h a
c +c +c
{ 2a3 h 12 ( ah ) }untuk a < h a

3h 1 h

2 a1 2 a1

+c 2

3h 1 h

2 a2 2 a2

(B.6.28)

c 0+ c 1+ c2 untuk h=a2
a1

adalah ambang dan berbagai komponen jarak pendek dari


a2

adalah ambang dan berbagai komponen jarak jauh. Sebuah

komponen nugget juga dapat ditambahkan seperti di atas (lihat Gambar B.6.6 (b).).
B.6.5 Studi Kasus: Variogram
Kami menggambarkan beberapa prinsip geostatistik dengan hasil dari sebuah penelitian
terbaru di pertanian presisi untuk British Home-Grown Cereals Authority (Oliver dan
Carroll 2004). Bidang (UK National Grid reference SU 458174) meliputi 23ha pada
Yattendon Estate, Berkshire, Inggris. Dari serangkaian luas data survei yang diperoleh
selama tahun 2002 kami telah memilih humus (0-15 cm) yang terdapat kalium. Data hasil
gandum musim dingin yang tersedia untuk tahun 2001 menggambarkan variasi
bersarang. Tabel B.6.1 memberikan kesimpulan statistik dua variabel tersebut.
Sampling untuk survei tanah berada di node 30m 30m grid, dengan pengamatan
tambahan pada 15m interval sepanjang transek pendek dari node jaringan yang dipilih
secara acak. Ada 230 titik data, yang memungkinkan setiap anisotropi dalam variasi yang
12

akan ditentukan; ukuran sampel ini dekat dengan 250 data yang direkomendasikan oleh
Webster dan Oliver (1992).
Tabel B.6.1. Ringkasan statistik

Variograms percobaan dihitung oleh Persamaan (B.6.7) di empat arah untuk


mengungkapkan anisotropi variasi. Hasil untuk humus K ditunjukkan pada Gambar B.6.3
(a) untuk arah 0, 45, 90 dan 135.

Gambar B.6.3. (a) arah variogram dihitung dari data mentah (230 poin) dari Yattendon Estate,
dan (b) arah variogram dihitung dari residual dari rata-rata kelas. Simbol mewakili: *
menandakan 0 (E-W), menunjukkan 45, menunjukkan 90 (N-S), menandakan 135

Untuk menggambarkan pengaruh ukuran sampel pada variogram, kami subsampled set
lengkap data (230 titik sampel) untuk memberikan subset dari 94 dan 47 data. Variograms
omnidirectional percobaan dihitung dari total data dan dua subset untuk humus K. Untuk
mengeksplorasi efek dari lebar bin yang berbeda, variograms dihitung untuk interval lag
dari 15m (interval sampling untuk transek), 20m (pertengahan jalan antara transek dan
selang jaringan secara keseluruhan) dan 40m (untuk ilustrasi). Model yang dilengkapi
dengan nilai-nilai eksperimental menggunakan GENSTAT (Payne 2008).

13

Gambar B.6.4 menunjukkan nilai percobaan sebagai simbol dan model tepat
sebagai garis solid. Variograms percobaan menunjukkan bahwa interval 20m lag terdiri
antara hasil yang agak tidak menentu untuk interval 15m dan kehilangan detail dengan
interval 40m lag. Variograms percobaan juga menunjukkan efek penurunan jumlah data;
variograms menjadi lebih tidak menentu dan yang dihitung dari 47 data juga
menunjukkan kerugian yang serius dari varians.
Tabel B.6.2 memberikan model dan parameter yang dipasang ke variograms
percobaan. Ini menunjukkan seberapa sensitif parameter model terhadap perubahan
dalam interval lag dan jumlah data. Untuk 230 data, perbedaan utama dalam parameter
model untuk variograms dihitung dengan interval lag yang berbeda dalam varian nugget,
yang adalah nol untuk 15m lag. Hal ini menunjukkan bahwa data dari sampel transek
telah diselesaikan variasi lokal di tanah lapisan atas K. Ini merupakan pertimbangan
penting ketika merancang skema sampling. Untuk survei grid, akan lebih bermanfaat
memiliki beberapa titik sampling tambahan pada jarak lebih pendek dari interval jaringan
seperti dalam survei ini karena membantu untuk mengurangi varians nugget. Ada 40
sampel poin pada interval yang lebih pendek yang hanya 17 persen dari total data.

14

Gambar B.6.4. Experimental variograms (*) dihitung dengan metode momen (MoM) estimator
untuk jarak lag dari 20m, 15m dan 40m, dan untuk kumpulan data lengkap 230 situs [(a), (b) dan
(c) , masing-masing], bagian dari 94 data [(d), (e), (f)] dan subset dari 47 data [(g), (h), (i)] untuk
humus K pada Yattendon Estate. Garis utuh model dilengkapi dengan variogram MoM dan garis
putus-putus adalah variogram yang diperkirakan oleh residual maximum likelihood (REML)

Parameter model untuk kumpulan data terkecil yang jauh berbeda dari set data lengkap,
menunjukkan bahwa variograms dari set terkecil data tidak akurat dari struktur variasi.
Misalnya, varians sill yang nyata kurang dan rentang spasial ketergantungan

Tabel B.6.2 Model variogram parameter

15

Catatan: adalah varian spasial berkorelasi dari komponen spasial jarak jauh, + adalah berbagai
komponen spasial jarak jauh, * adalah parameter jarak dari fungsi eksponensial; untuk
mendapatkan jangkauan kerja a'= 3r

lebih pendek. Tabel B.6.2 menunjukkan bahwa semua model berbatasan dengan fungsi
menunjukkan bahwa variasi memiliki distribusi merata.
Selanjutnya variogram juga dihitung dengan REML untuk interval jaringan 20m,
dan ditampilkan sebagai garis putus-putus pada Gambar B.6.4 (a), (d) dan (g).
Variograms diduga oleh REML untuk dua set data yang lebih besar yang tidak sama
dengan yang dihitung menggunakan MoM sebagai salah satu harapan. Varians sill lebih
besar dari varians data. Kisaran model eksponensial untuk subset dari 94 data juga lebih
lama dari variogram MoM.
Variogram percobaan dihitung dari data hasil tanaman gandum musim dingin
(2001) menunjukkan struktur yang kompleks [lihat Gambar B.6.6 (a)]. Model tetap
terbaik adalah fungsi berbentuk bulat dengan dua komponen spasial; satu dengan jarak
44m dan lainnya 278m. Gambar B.6.6 (b) menunjukkan variogram percobaan dengan

16

model tetap; nugget, pendek dan jangka panjang komponen dari model juga ditampilkan
secara terpisah.
Anisotropi. Gambar B.6.3 (a) menunjukkan arah variogram untuk humus K. Jelas bahwa
varians ambang sesudah lag sekitar 130m. Anisotropi zonal tidak dapat ditangani oleh
transformasi sederhana dari koordinat. Jika daerah dapat dikelompokkan ke dalam zona,
maka ini adalah salah satu cara di mana anisotropi zonal dapat diselesaikan. Model
variogram menunjukkan bahwa variasi tidak merata, yang bisa timbul dari zona istimewa
berorientasi dengan cara yang berbeda.
Arah variogram kemudian dihitung dari residual rata-rata kelas, Gambar B.6.3 (b). Arah
variogram ditunjukkan oleh simbol untuk empat arah dan model isotropik dipasang pada
arah variograms oleh garis hitam tebal untuk kedua data mentah dan residual. Parameter
model juga telah berubah; model tetap terbaik saat ini adalah fungsi pentaspherical
dengan varians ambang kurang dari 1000 dan jarak 91m. Model ini sekarang memiliki
jarak lebih pendek dari ketergantungan spasial, Tabel B.6.2, dan variogram telah diplot
untuk

lag

maksimum

150m

untuk

memperhitungkan

perbedaan

ini.

Gambar B.6.5. Arah variogram dihitung pada data pH dari Broom ini Barn Farm (433 titik
sampling) : (a) dengan model tetap terbaik isotropik (garis tebal), dan (b) dengan fungsi
eksponensial isotropik (garis tebal menunjukkan sampul dari fungsi). Simbol mewakili: *
menandakan 0 (E-W), menunjukkan 45, menunjukkan 90 (N-S), menunjukkan 135, dan
garis tebal adalah model isotropik dipasang pada variograms omnidirectional

17

Untuk menggambarkan anisotropi geometris kami menggunakan data pH dari Brooms


Barn Farm. Ini adalah percobaan bit gula pertanian dekat Bury St Edmunds,
Cambridgeshire, Inggris (lihat Webster dan Oliver 2007, untuk lebih detail). Gambar
B.6.5 (a) menunjukkan arah variogram yang menggambarkan bagaimana semivariances
di arah yang berbeda mulai menyimpang setelah lag 80m. Garis solid adalah model
terbaik isotropik tepat, fungsi eksponensial (Tabel B.6.2). Gambar B.6.5 (b) menunjukkan
arah variogram dengan anisotropik tepat fungsi eksponensial. Dua baris menunjukkan
sampul dari fungsi ini dan Tabel B.6.2 memberikan parameter dari fungsi dipasang. Arah
variasi maksimum dan rentang lebih pendek sekitar 60 (di mana 0 adalah E-W) dan arah
variasi minimum tegak lurus terhadap ini.
Variasi Bersarang. Gambar B.6.6 (a) menunjukkan variogram percobaan untuk hasil
2001 di Yattendon Estate; tampaknya memiliki struktur yang kompleks. Beberapa model
yang dilengkapi dan satu dengan jumlah sisa terkecil dari grid adalah fungsi bersarang
berbentuk bulat, yang ditampilkan sebagai garis tebal dipasang pada nilai-nilai percobaan
pada Gambar B.6.6 (b). Parameter model untuk hasil 2001 diberikan dalam Tabel B.6.2.
Untuk menggambarkan masing-masing komponen model ini, kami telah menunjukkan
secara terpisah pada Gambar B.6.6 (b) sebagai garis dengan ornamen yang berbeda.
Struktur kompleks diidentifikasi dari percobaan variogram terbukti sebagai dua rentang
yang

sangat

berbeda

dari

variasi

18

spasial

44m

dan

278m.

Gambar B.6.6 variogram dari hasil 2001 untuk Yattendon Estate: (a) percobaan variogram
(simbol), dan (b) percobaan variogram dengan model tepat berbentuk bulat ganda (garis tebal);
garis dengan ornamen mewakili komponen model individu

B.6.6 Prediksi Geostatistik: Kriging


Kriging adalah metode prediksi yang optimal atau penduga dalam ruang geografis, sering
dikenal sebagai best linear unbiased predictor (BLUP). Ini adalah metode geostatistik
interpolasi untuk proses spasial acak. Matheron (1963) pertama kali menggunakan istilah
'kriging' untuk metode pengakuan atas kontribusi D. G. Kriges untuk meningkatkan
ketepatan menduga konsentrasi emas dan logam lainnya di tubuh bijih. Krige (1951)
telah mengamati bahwa ia bisa meningkatkan pendugaan nilai bijih di blok pertambangan
dengan memperhatikan nilai-nilai dalam blok sekitarnya. Matheron (1963) memperluas
ide-ide empiris Kriges dan menempatkan mereka ke dalam kerangka teoritis geostatistik.
Namun, perkembangan Matherons ini tidak terisolasi; matematika kriging sederhana
telah dikerjakan oleh A. N. Kolmogorov pada tahun 1930-an (Kolmogorov 1939, 1941),
oleh Wold (1938) untuk analisis time series dan kemudian oleh Wiener (1949). Cressie
(1993) memberikan sejarah singkat asal-usul kriging.
Kriging memberikan solusi untuk masalah mendasar yang dihadapi oleh para
ilmuwan lingkungan untuk menduga nilai data sampel jarang berdasarkan model
stokastik variasi spasial. Kebanyakan properti lingkungan (tanah, vegetasi, batuan, air,
lautan dan atmosfer) dapat diukur tak terbatas, tapi karena alasan ekonomi hanya sedikit
yang diukur. Beberapa metode matematika interpolasi yang tersedia, misalnya, poligon
Thiessen, triangulasi, tetangga interpolasi alami, fungsi inverse jarak, kuadrat-polinomial
(permukaan trend) dan splines. Sebagian besar dari metode ini hanya memperhitungkan
variasi sistematis atau deterministik dan mengabaikan kesalahan prediksi. Kriging, di sisi
lain, mengatasi kelemahan interpolators matematika. Kriging juga tidak hanya
menyediakan prediksi tapi juga varians kriging atau kesalahan.
Sejak formulasi aslinya, kriging telah menguraikan untuk mengatasi masalah yang
semakin kompleks dalam disiplin ilmu yang menggunakan prediksi spasial dan
pemetaan. Hal ini digunakan dalam pertambangan, perminyakan, meteorologi, ilmu
tanah, pertanian presisi, pengendalian pencemaran, kesehatan masyarakat, monitoring
stok ikan dan kepadatan hewan lainnya, penginderaan jauh, ekologi, geologi, hidrologi
19

dan disiplin ilmu lainnya. Akibatnya, kriging telah menjadi istilah generik untuk berbagai
metode BLUP leastsquares prediksi spasial dalam geostatistik. Perumusan asli kriging,
sekarang dikenal sebagai kriging biasa (Journel dan Huijbregts 1978), adalah metode
yang paling kuat dan yang paling sering digunakan.
Tipe kriging
Kriging biasa mengasumsikan bahwa rata-rata tidak diketahui dan bahwa proses ini
secara lokal stasioner. Kriging sederhana, mengasumsikan bahwa rata-rata diketahui,
digunakan sedikit karena rata-rata umumnya tidak diketahui. Kriging lognormal adalah
kriging biasa dari data positif miring diubah oleh logaritma untuk mendekati distribusi
lognormal. Kriging dengan tren memungkinkan data dengan komponen deterministik
(proses non-stasioner) yang kuat untuk dianalisis;
Matheron (1982) mengembangkan kriging faktorial atau analisis kriging untuk
variasi bersarang. Cokriging biasa (Matheron 1965) adalah perpanjangan kriging biasa
untuk dua atau lebih variabel yang secara spasial berkorelasi.
Kriging disjungtif (Matheron 1973) adalah metode parametrik non-linear dari
kriging. Indikator kriging (Journel 1982) adalah bentuk non-linear, non-parametrik
kriging di mana variabel kontinu dikonversi ke biner (indikator). Ini bisa menangani
distribusi dari hampir semua jenis dan juga dapat menampung informasi kualitatif
'lembut' untuk meningkatkan prediksi. Probabilitas kriging diusulkan oleh Sullivan
(1984) karena indikator kriging tidak memperhitungkan kedekatan nilai ambang, tetapi
hanya posisi geografisnya. Kriging Bayesian diperkenalkan oleh Omre (1987) untuk
situasi di mana ada beberapa pengetahuan sebelumnya tentang drift atau tren.
Kriging biasa
Dengan menganggap bahwa variabel acak, Z, telah diukur pada titik-titik sampling,

xi ,

i = 1, ... n, dan kami ingin menggunakan informasi ini untuk menduga nilai pada titik
x 0 (kriging tepat waktu) dengan dukungan yang sama seperti data dengan

20

Z^ ( x o )= i z ( x i )

(B.6.29)

i=1

di mana n biasanya merupakan titik data dalam lingkungan lokal, V, dan jauh lebih
sedikit dibandingkan jumlah total sampel, N, dan i adalah bobot. Untuk memastikan
bahwa pendugaan tersebut berisi bobot yang dibuat untuk jumlah untuk satu
n

i=1

(B.6.30)

i=1

E [ Z^ ( x 0 )Z ( x0 ) ]=0 . Prediksi varians adalah

dan kesalahan harapan adalah

2
var [ Z^ ( x 0 ) ]=E {Z^ ( x 0 )Z ( x0 ) } =2 i ( x i , x 0 ) i j ( x i , x j )

di mana

( xi , x j )

i =1

i=1 j=1

adalah semivariance dari Z antara titik

adalah semivariance antara i-th titik sampling dan target

xi

dan

xj ,

(B.6.31)
( x i , x0 )

x0 .

Prediksi Kriged sering diperlukan di daerah (blok kriging) yang lebih besar dari
dukungan sampel data. Perkiraan tersebut adalah rata-rata tertimbang dari data,
z ( x 2 ) , ,

z ( x1) ,

z ( x n ) , pada blok yang tidak diketahui,


n

Z^ ( B )= i z ( xi )

(B.6.32)

i=1

Penduga varians Z ( B ) adalah:

2
var [ ^Z ( B ) ] =E { Z^ ( B )Z ( B ) } =2 i ( x i , B ) i j ( x i , x j ) ( B , B )
i=1

i=1 j =1

21

(B.6.33)

( x i , B ) adalah semivariance rata-rata antara data titik

di mana
B, dan

y ( B , B )

x i dan blok sasaran

adalah semivariance rata-rata dalam B, dalam blok varians.

Persamaan (B.6.31) untuk titik mengarah ke satu set

n+1

persamaan

n+1

tidak diketahui
n

i ( x i , x j ) + ( x 0 )= ( x j , x0 ) untuk semua j
i=1

(B.6.34)

i=1

(B.6.35)

i=1

Perkalian jarak lag, , diperkenalkan untuk mencapai minimisasi. Persamaan kriging


dalam bentuk matriks untuk kriging tepat waktu adalah
A=b

(B.6.36)

di mana A adalah matriks semivariances antara titik data, ( x i , x j ) , b adalah vektor dari
semivariances antara titik data dan target,

( x j , x0)

dan adalah vektor bobot dan

perkalian jarag lag. Bobot kriging diperoleh sebagai berikut dengan cara membalik
matriks A,
1

=A b
Bobot,
pada

(B.6.37)

i , dimasukkan ke dalam Persamaan (B.6.29) untuk memberikan prediksi Z


x 0 . Kriging (prediksi atau penduga) varians sebagai berikut
n

2 ( x 0 )= i ( x i , x 0 ) + ( x 0 )
i=1

dan dalam bentuk matriks

22

(B.6.38)

2 ( x 0 )=b T

(B.6.39)

Kriging tepat waktu adalah interpolator tepat - nilai kriged di lokasi pengambilan sampel
adalah nilai yang diamati di sana dan varians penduga adalah nol. Sistem kriging yang
setara untuk blok adalah
n

i ( x i , x j ) + ( B )= ( x j , B ) untuk semua j
i= j

(B.6.40)

i=1

(B.6.41)

i=1

dan varians blok kriging diperoleh sebagai


n

( B )= i ( xi , B ) + ( B ) ( B , B )
2

i=1

(B.6.42)

dan dalam bentuk matriks


2 ( B )=bT ( B , B )

(B.6.43)

Bobot kriging
Bobot kriging tergantung pada variogram dan konfigurasi sampling. Webster dan Oliver
(2007) menggambarkan bagaimana bobot bervariasi sesuai dengan perubahan nugget:
rasio sill, jangkauan, jenis model, sampling konfigurasi dan efek anisotropi. Bobot sangat
sensitif terhadap varians nugget dan anisotropi. Bobot dekat dengan titik atau blok yang
akan diduga membawa lebih banyak beban daripada yang lebih jauh, yang menunjukkan
bahwa kriging adalah prediktor lokal. Sebagai nugget: rasio ambang meningkatkan bobot
dekat dengan penurunan target dan meningkat lebih jauh. Untuk variogram nugget murni,
bobot kriging semua sama dan perkiraan rata-rata dari nilai-nilai di lingkungan. Efek dari
kisaran lebih kompleks daripada nugget: rasio ambang karena juga dipengaruhi oleh jenis
model variogram. Untuk data yang didistribusikan tidak teratur, titik yang berkerumun
membawa berat kurang secara individual daripada yang terisolasi.

23

Fakta bahwa titik-titik terdekat dengan target umumnya membawa paling berat
memiliki implikasi praktis. Ini berarti bahwa lingkungan pencari perlu memuat tidak
lebih dari 16-20 titik data, yang pada gilirannya berarti bahwa matriks A dalam sistem
kriging tidak perlu besar.
Kriging faktorial
Jika variogram dari

Z (x)

bersarang, dapat diwakili sebagai kombinasi dari S

variogram individu
1
2
S
( h ) = ( h ) + ( h ) ++ ( h )

(B.6.44)

di mana superscripts merujuk komponen variograms. Jika kita berasumsi bahwa proses
diwakili oleh komponen tidak berkorelasi, maka Persamaan (B.6.44) dapat ditulis sebagai
S

( h ) = bk gk ( h )

(B.6.45)

k=1

di mana

gk ( h )

adalah kth fungsi variogram dasar dan

mengukur kontribusi relatif dari varians

bk

adalah koefisien yang

gk ( h ) penjumlahan tersebut.

Komponen di sisi kanan Persamaan (B.6.45) sesuai dengan S fungsi acak pada
sejumlah bentuk Z ( x ) , yang dapat direpresentasikan sebagai
S

Z ( x )= Z k ( x ) +

(B.6.46)

k=1

di mana

adalah rata-rata dari proses. Setiap

k
Z (x)

memiliki harapan nol, dan

perbedaan kuadrat adalah


k k
1
E [ { Z k ( x )Z k ( x +h ) }{ Z k ' ( x )Z k ' ( x+ h ) }] = b g ( h ) jika k=k '
2
0 selaninnya

24

(B.4.47)

Komponen terakhir,

Z S( x )

bisa menjadi intrinsik saja, sehingga

(B.6.45) terbatas dengan gradient

gS ( x )

Persamaan

b S . Persamaan ini menyatakan S fungsi acak saling

bebas, dan memungkinkan nilai-nilai dari proses yang berkontribusi diduga secara
terpisah oleh kriging faktorial. Setiap komponen spasial

Zk ( x )

diduga sebagai

kombinasi linear dari pengamatan,


n

k
k
Z^ ( x 0 )= i z ( x i )

(B.6.48)

i =1

ki

bobot ditetapkan untuk pengamatan, tapi sekarang harus berjumlah nol, bukan satu,

untuk memastikan bahwa penduga tak bias dan agar sesuai dengan Persamaan (B.6.46).
Sesuai dengan kondisi ini, mereka dipilih untuk meminimalkan varians kriging. Hal ini
menyebabkan sistem kriging
n

kj ( x i , x j ) k ( x0 ) =b k gk ( x i , x 0 ) untuk i=1, , n

(B.6.49)

j=1

kj =0

(B.6.50)

j=1

di mana

k ( x0 )

adalah perkalian jarak lag untuk komponen kth. Sistem persamaan ini

diselesaikan untuk setiap komponen spasial, k, untuk menemukan bobot,

kj

,yang

kemudian dimasukkan ke dalam Persamaan (B.6.48). Pendugaan dibuat untuk setiap


skala spasial, k, dengan memecahkan Persamaan (B.6.49).
Kriging biasanya dilakukan di lingkungan gerak yang kecil berpusat pada

x0 ,

seperti untuk kriging biasa. Dengan demikian, dari sudut pandang teoritis, hanya perlu
Z ( x ) lokal stasioner. Persamaan (B.6.46) kemudian dapat ditulis kembali sebagai

25

Z ( x )= Z k ( x ) + ( x )
k=1

di mana

(x )

(B.6.51)

adalah rata-rata lokal yang dapat dianggap sebagai komponen spasial

jarak jauh. Kita perlu Krige rata-rata lokal, kombinasi linear dari data:
n

^ ( x 0) = mean
z ( x j)
j

(B.6.52)

Bobot diperoleh dengan memecahkan sistem


n

mean
k k
( x i , x j ) ( x 0 ) =b g ( x i , x 0 ) untuk semua i=1, , n
mean
j
j=1

(B.6.53)

kj =1

(B.6.54)

j=1

Menduga komponen jarak jauh dapat dipengaruhi oleh ukuran lingkungan bergerak (Galli
et al. 1984). Untuk menduga komponen spasial dengan rentang tertentu, jarak di
lingkungan setidaknya harus sama dengan kisaran tersebut. Jika sampling intensif dan
kisaran besar, ada begitu banyak data di dalam lingkungan yang dipilih hanya sebagian
kecil dari mereka yang dipertahankan untuk kriging, dan semuanya dekat dengan target.
Meskipun komputer modern dapat menangani banyak data pada satu waktu, inversi
matriks besar dapat menjadi tidak stabil. Selanjutnya, hanya sedikit data yang dekat
dengan target kontribusi untuk penduga karena mereka menyaring data yang lebih jauh.
Akibatnya, lingkungan digunakan lebih kecil dari yang ditentukan, yang berarti bahwa
berbagai komponen diduga lebih kecil dari yang ditentukan variogram tersebut. Galli et
al. (1984) menyarankan cara untuk mengatasi kekurangan ini dengan memilih hanya
sebagian dari data dalam lingkungan tertentu. Pemilihan seperti itu sewenang-wenang,
dan Jaquet (1989) mengusulkan alternatif yang menyebabkan tambahan perkiraan ratarata lokal untuk menduga komponen jarak jauh. Berikut Oliver et al. (2000), adalah solusi
yang telah diterapkan pada studi kasus di bawah ini:.
B.6.7 Studi Kasus: Kriging
26

Studi kasus menggambarkan aplikasi dari kriging biasa dengan model variogram
isotropik dan dengan anisotropik di mana ada perbedaan terarah pada variasi. Faktorial
kriging diterapkan untuk mengeksplorasi variasi yang dijelaskan terbaik dengan fungsi
variogram bersarang.
Kriging Biasa
Set lengkap data dan dua subset data humus kalium dari Yattendon digunakan untuk
menggambarkan kriging biasa. Prediksi dibuat di tempat tanpa sampel pada node dari
grid 5m 5m oleh tepat waktu biasa dan blok kriging. Minimal tujuh dan maksimal 20
poin batas yang ditetapkan untuk jumlah data dalam lingkungan. Untuk blok kriging,
penduga dibuat lebih dari blok 10m 10m. Parameter dari model variogram dipasang
pada percobaan MoM variograms setiap set data untuk 20m lag (Tabel B.6.2) yang
digunakan dengan data masing-masing untuk kriging. Prediksi kriged dipetakan di
Gsharp. Gambar B.6.7 menunjukkan peta pendugaan blok kriged; tepat waktu kriging
tidak ditampilkan mirip seperti yang ditampilkan. Berdasarkan peta data 230, Gambar
B.6.7 (a), menunjukkan detail variasi humus K dari sampel intensif. Daerah dengan
konsentrasi kecil di mana tanah lebih berpasir dan konsentrasi terbesar berada di sebuah
lembah kering yang membentang dari NW ke SE di lapangan di mana tanah mengandung
lebih banyak tanah liat dan lumpur. Berdasarkan peta ukuran sampel 94, Gambar B.6.7
(b), yang dekat dengan Webster dan Oliver (1992) minimum ukuran yang
direkomendasikan untuk menghitung variogram akurat, menunjukkan fitur utama dari
variasi dalam lapisan tanah atas K, meskipun ada beberapa detail yang hilang. Dari
perspektif manajemen peta ini akan membentuk dasar yang kuat untuk mengelola
aplikasi dari K di bidang ini. Ukuran sampel yang lebih kecil ini merupakan penghematan
hampir 60 persen dalam upaya sampling. Gambar B.6.7 (c) adalah blok kriged peta
berdasarkan 47 data dan hilangnya detail sangat nyata. Jelas bahwa untuk mengurangi
ukuran sampel tingkat ini dianjurkan untuk mengelola aplikasi K di bidang ini.

27

Gambar B.6.7. Peta prediksi blok kriged humus kalium di Yattendon Estate untuk: (a) set
lengkap dari 230 data, (b) subset dari 94 data, dan (c) subset dari 46 data

28

Gambar B.6.8 Peta blok kriged kriging varians untuk humus kalium di Yattendon Estate untuk:
(a) total dari 230 data, (b) subset dari 94 data, dan (c) subset dari 46 Data

Gambar B.6.8 (a), (b) dan (c) menunjukkan peta varians blok kriging untuk tiga ukuran
sampel (230, 94 dan 47, masing-masing); mereka menunjukkan dengan jelas bagaimana
varians dari prediksi meningkat tajam dengan data yang lebih sedikit. Kriging besar
varians di bagian tengah lapangan pada Gambar B.6.8 (a) dan (b) menunjukkan suatu
daerah tanpa titik sampling di mana ada belukar. Gambar B.6.8 (a) menunjukkan
kesalahan terkecil sepanjang transek pendek di mana sampel paling intensif. Gambar
B.6.8 (b) dan (c) juga menunjukkan bahwa varians kriging yang terkecil dekat dengan
titik sampling. Varians besar di sekitar batas lapangan menunjukkan efek tepi di mana ada
data yang lebih sedikit dari prediksi. Peta ini menunjukkan bahwa penghematan sampling

29

untuk ukuran sampel dari 47 hasil pada hilangnya ketepatan dalam prediksi yang bisa
memiliki implikasi untuk manajemen selanjutnya.
Gambar B.6.9 menunjukkan peta kriging varians dari kriging tepat waktu untuk
set data lengkap. Meskipun peta penduga untuk tepat waktu dan blok kriging hampir
tidak bisa dibedakan, peta dari kriging varians sangat berbeda. Varians kriging tepat
waktu jauh lebih besar karena varians nugget menetapkan batasan yang lebih rendah
untuk varians kriging. Untuk blok kriging varians nugget menghilang dari varians blok
kriging [lihat Perssamaan (B.6.31) dan (B.6.37)]. Semakin besar proporsi nugget varians,
semakin besar perbedaan antara blok dan varians kriging tepat waktu.
Kriging dengan model anisotropik
pH data dari Brooms Barn Farm digunakan dengan model anisotropik eksponensial
untuk kriging tepat waktu biasa pada grid 10m 10m. Gambar B.6.10 menunjukkan peta
prediksi. Jelaslah bahwa ada lebih banyak variasi dalam pH dari SSE ke NNW pada sudut
kanan sebagai model pada Tabel B.6.2.

Gambar B.6.9. Peta kriging tepat waktu kriged varians untuk humus kalium di Yattendon Estate
untuk set lengkap 230 data

30

Gambar B.6.10. Peta prediksi tepat waktu kriged untuk pH humus pada Brooms Barn Farm

Variasi bersarang: kriging faktorial


Hasil gandum musim dingin 2001 dari Yattendon Estate digunakan untuk
menggambarkan kriging faktorial; variogram (lihat Gambar B.6.6 dan Tabel B.6.2)
menunjukkan bahwa ada lebih dari satu skala variasi. Prediksi dibuat pada node dari grid
5m 5m sebagai humus K di Yattendon. Parameter dari model berbentuk bulat ganda
digunakan untuk kriging biasa pertama; Gambar B.6.11 (a) adalah peta prediksi. Pola
variasi muncul kompleks karena komponen jangka panjang dan jangka pendek dari
variasi. Komponen-komponen ini kemudian diekstraksi secara terpisah dan diprediksi
oleh kriging faktorial. Gambar B.6.11 (b) adalah peta prediksi jangka panjang. Hal ini
mirip dengan kriging biasa tapi kurang bising karena variasi jarak pendek tidak ada.
Daerah lapangan dengan hasil besar dan kecil yang jelas di kedua peta. Banyak daerah
dengan penghasilan besar sesuai dengan besar daerah konsentrasi humus K [lihat Gambar
B.6.11 (a)]. Peta prediksi jarak pendek, Gambar.B.6.11 (c) sangat berbeda dari dua peta
lainnya. Hal ini menunjukkan skala yang lebih kecil dari variasi dengan pola teratur yang
kuat.

31

Gambar B.6.11. Peta hasil gandum tahun 2001 di Yattendon Estate (a) prediksi kriged biasa, (b)
prediksi komponen jangka panjang dari variasi, dan (c) prediksi komponen jarak pendek dari
variasi

Untuk data yang intensif seperti monitor hasil, model elevasi digital dan satelit, kriging
faktorial adalah teknik yang berharga untuk mengeksplorasi variasi pada skala spasial
yang berbeda.

32

C.1 Model Ekonomi Spasial


James P. Lesage dan R. Kelley Pace

C.1.1 Pendahuluan
Model regresi spasial memungkinkan kita untuk memperhitungkan ketergantungan antara
pengamatan, yang sering muncul ketika pengamatan yang dikumpulkan dari poin atau
wilayah terletak di ruang angkasa. Contoh pengamatan titik-tingkat akan rumah individu,
perusahaan, atau sekolah. Pengamatan daerah bisa mencerminkan rata-rata pendapatan
rumah tangga daerah, jumlah tenaga kerja atau tingkat penduduk, tarif pajak, dan
sebagainya. Skala spasial daerah sering sangat beragam (misalnya, daerah Uni Eropa,
negara, atau wilayah administratif seperti zona pos atau saluran sensus).
Untuk pengamatan tingkat daerah kita dapat mengandalkan koordinat lintangbujur dari titik yang terletak di wilayah ini, mungkin titik pusat. Hal ini umumnya
diamati bahwa sampel data yang dikumpulkan untuk daerah atau titik dalam ruang tidak
independen, melainkan positif spasial dependent, yang artinya bahwa pengamatan dari
satu lokasi cenderung menunjukkan nilai-nilai yang sama dengan lokasi terdekat.
Data generating process (DGP) menghasilkan sampel data menentukan jenis
ketergantungan spasial. Tentu saja, kita tidak pernah benar-benar tahu DGP, sehingga
dianjurkan menerapkan pendekatan alternatif untuk situasi pemodelan. Salah satu
pendekatannya adalah dengan mengandalkan model spesifikasi fleksibel yang dapat
memuat berbagai kemungkinan proses menghasilkan data yang berbeda. Misalnya,
Lesage dan Pace (2009) menggunakan spatial Durbin model (SDM), karena sejumlah
model bersarang lainnya sebagai kasus khusus.
Pendekatan kedua akan bergantung pada jenis ekonomi atau lainnya teori untuk
memotivasi DGP.
Pendekatan ketiga mungkin mengandalkan argumen murni ekonometrik yang
mendukung penggunaan model tertentu untuk melindungi heterogenitas, dihilangkan
33

variabel atau jenis lain dari masalah yang timbul saat diterapkan dalam prakteknya.
Misalnya, Lesage dan Pace (2008) menunjukkan bahwa dalam kasus model interaksi
spasial jenis dibahas dalam Bab C.3, variabel dihilangkan atau pengaruh teramati laten
akan mengarah pada model yang mencakup lag spasial variabel dependen.
Pendekatan keempat secara resmi menggabungkan ketidakpastian mengenai DGP
menjadi pendugaan dan cara menyimpulkan, yang digambarkan dalam Bab C.4.
Model regresi konvensional biasa digunakan untuk menganalisis penampang dan
panel data menganggap bahwa pengamatan independen satu sama lain. Prinsip mendasar
analisis regional adalah bahwa daerah yang terletak di dekatnya cenderung lebih mirip
daripada yang dipisahkan oleh jarak yang jauh. Ini berarti bahwa ketergantungan spasial
positif tampaknya lebih masuk akal daripada kemerdekaan spasial ketika menganalisis
sampel data regional.
Sebagai contoh, model regresi konvensional yang berhubungan komuter waktu
kerja untuk wilayah i untuk jumlah orang di daerah i diasumsikan bahwa komuter waktu
independen dari mereka untuk orang yang terletak di daerah sekitar j. Karena tidak
mungkin daerah i dan j tidak berbagi bagian dari jaringan jalan, kita mengharapkan
asumsi ini tidak realistis. Selain kurangnya realisme, mengabaikan pelanggaran
independensi antara pengamatan dapat menghasilkan penduga yang bias dan tidak
konsisten.
Dalam komuter waktu misalnya, mungkin tampak intuitif menarik untuk menyertakan
rata-rata variabel dependen pengamatan dari daerah lain di dekatnya sebagai variabel
penjelas sisi kanan dalam model regresi cross-sectional. Hal ini mengakibatkan
perpanjangan model regresi untuk pengamatan i mengambil berbentuk seperti
ditunjukkan pada Persamaan (C.1.1), di mana sampel mengandung n pengamatan
n

j=1

r =1

y i= W ij y j + X ir r + i

(C.1.1)

34

Dalam Persamaan (C.1.1), variabel dependen untuk pengamatan i adalah


variabel

X ir , r=1, , k

dengan koefisien terkait

yi , k

r , dan istilah gangguan

i .

Matriks W n oleh n mencerminkan hubungan kedekatan Queens antara n daerah dan


n

kami menggunakan

W ij

untuk menunjukkan unsur (i,j)th.

W ij y j
j=1

mewakili nilai

skalar sama dengan rata-rata nilai yang diambil oleh delapan daerah sekitar wilayah i.
Skalar dalam model yang diberikan oleh Persamaan (C.1.1) adalah parameter yang
akan diduga untuk menentukan kekuatan rata-rata (lebih dari semua pengamatan i=
1, ...,n) hubungan antara nilai-nilai variabel dependen untuk daerah/pengamatan dan ratarata nilai untuk daerah sekitarnya .
Dalam kasus yang melibatkan kisi yang tidak teratur atau pengamatan titik ini
menjadi pertimbangan dalam menentukan model regresi spasial. Misalnya, orang bisa
menggunakan beberapa nomor tetap tetangga terdekat untuk kasus kisi tidak teratur,
sejumlah tetangga yang dipilih menggunakan jarak cut-off atau beberapa definisi
persentuhan lain seperti kedekatan berbasis Rook sebagai pengganti kedekatan
'Queenbased'. Kebijaksanaan konvensional adalah bahwa spesifikasi dari matriks W
memberikannya banyak pengaruh pada penduga dan kesimpulan mengenai parameter
model ini.
Ini harus jelas bahwa jika parameter = 0, kita memiliki model regresi
k

konvensional:

y i= X ir r + i , sehingga tempat tujuan akan menjadi signifikansi


r=1

statistik dari penduga koefisien untuk .


Kita dapat menulis model dalam (C.1.1) menggunakan notasi matriks/vektor seperti yang
ditunjukkan pada Persamaan (C.1.2), di mana y adalah vektor n-oleh-1 yang mengandung
pengamatan variabel dependen, W matriks bobot spasial n oleh n yang mengidentifikasi
konektivitas atau struktur tetangga pengamatan sampel, X adalah matriks n oleh k

35

variabel penjelas yang termasuk istilah intersept. Vektor

n oleh 1 merupakan rata-

rata nol, varians konstan, nol kovarians, gangguan distribusi normal, misalnya,
N ( 0, 2 I n ) , di mana kita menggunakan i untuk menunjukkan matriks identitas n
oleh n. Parameter skalar dan vektor

k oleh 1 bersama dengan parameter variansi

2
skalar merupakan parameter model yang diduga. DGP terkait untuk model ini yang

kami beri label SAR ditunjukkan pada Persamaan (C.1.3), dan nilai yang diharapkan atau
prediksi dari model ini ditunjukkan pada Persamaan (C.1.4).
y=W y + X +

(C.1.2)
1

y=( I n W ) X + ( I nW )

(C.1.3)

E ( y )=( I nW )1 X

(C.1.4)

N ( 0, 2 I n )

(C.1.5)

Harapannya mengikuti asumsi bahwa unsur-unsur dari matriks W tetap/non-stokastik


seperti

pengamatan

dalam

matriks

X.

Hal

ini

menyebabkan

W
I n
E.
E [ 1 ] =( I nW )1 E [ ] =0
Tentu saja ada cara lain kita bisa membayangkan ketergantungan spasial yang
timbul sebagai bagian dari DGP dan ini mengarah ke ekstensi lain dari model regresi
konvensional. Sebagai contoh, mungkin kasus ketergantungan hanya muncul dalam
proses gangguan yang mengarah ke model dalam Persamaan (C.1.6) (yang kami beri
label SEM), terkait DGP di Persamaan (C.1.7), dan harapan dalam Persamaan (C.1.8).
y= X+u

(C.1.6a)

36

u= W u+

(C.1.6b)
1

y= X+ ( I nW )

(C.1.7)

E ( y )=X

(C.1.8)

N ( 0, 2 I n )

(C.1.9)

Elaborasi lain dari model dasar salah satunya yang kita beri label SDM ditampilkan
dalam Persamaan (C.1.10) dengan DGP terkait dalam Persamaan (C.1.11) dan harapan
dalam Persamaan (C.1.12). Dalam menetapkan model SDM kita perlu memisahkan
W =I n

intersep memotong dari variabel matriks penjelas X karena


intersept n oleh 1 yang dilambangkan dengan

dimana vektor

I n . Model ini mencakup lag spasial

variabel dependen dilambangkan dengan matriks Wy, dan lag spasial variabel penjelas
dilambangkan dengan produk matriks W X selain jelas variabel konvensional X. Matriks
produk W X menciptakan rata-rata nilai variabel penjelas dari daerah yang ditambahkan
ke set variabel penjelas sekitarnya.
y=W y + n + X+WX +

(C.1.10)

y=( I n W )1 ( n + X+WX+ )
E ( y )=( I nW )1 ( n + X +WX )

(C.1.12)

N ( 2 I n)

(C.1.13)

Ada juga model berdasarkan rata-rata proses error spasial,


proses error autoregressive spasial,

(C.1.11)

u=( I n W )1

Lesage dan Pace 2009).

37

u=( I n W )

daripada

yang telah dijelaskan di sini (lihat

Model SEM memiliki harapan yang sama dengan model regresi konvensional di
mana indepndent antara pengamatan variabel dependen adalah bagian dari hipotesis yang
dipertahankan. Dalam sampel besar, penduga titik untuk parameter

dari model SEM

dan regresi konvensional akan sama, tetapi dalam sampel kecil mungkin ada keuntungan
efisiensi dari pemodelan ketergantungan spasial dalam proses dislokasi. Sebaliknya,
model SAR dan SDM kadang-kadang disebut model lag spasial (karena mengandung
istilah

Wy

di sisi kanan) menghasilkan harapan yang berbeda dari model regresi

konvensional. Penggunaan metode regresi kuadrat terkecil untuk menduga parameter


model yang akan menghasilkan pendugai bias dan tidak konsisten untuk parameter

serta .
C.1.2 Penduga Model Lag Spasial
Dari DGP terkait dengan model SAR, jelas bahwa ada istilah Jacobian terlibat dalam

transformasi dari

ke y. Fungsi log-likelihood untuk model SAR berbentuk seperti

pada Persamaan (C.1.14) - (C.1.16) (lihat Ord 1975), di mana adalah vektor n oleh 1
yang mengandung nilai-nilai eigen dari matriks W. Lesage dan Pace (2009, Bab 4)
memberikan pembahasan yang melibatkan eigen kompleks yang timbul untuk jenis
tertentu dari bobot spasial matriks W.
ln L=

1 ( 2 )
eT e
ln +ln |I nW | 2
2
2

(C.1.14)

e= y W y X

(C.1.15)

[ min ( )1 , max ( )1 ]
Manipulasi

sederhana

yWy= X+

model

SAR

(C.1.16)
ditampilkan

dalam

Persamaan

(C.1.2):

menunjukkan bahwa log-likelihood dalam Persamaan (C.1.14) dapat

berkonsentrasi terhadap parameter

dan
38

. Hal ini dapat dicapai menggunakan:

=( X X ) X ( I nW ) y
likelihood.

Kami

untuk mengganti fungsi parameter dalam fungsi full


juga

mengganti
1

e e=( yWy X ) ( y Wy X ) n

parameter

di mana

dengan

seperti dijelaskan di atas.

Konsentrasi full likelihood dalam hasil mode dalam masalah optimasi univariat lebih dari
parameter . Mengingat penduga maximum likelohood untuk , yang diberi label *, kita
dapat menggunakan penduga ini untuk memulihkan penduga maximum likelihood untuk
parameter

=( X T X )

( I n W ) y .

Sebuah alternatif untuk mengatasi apa yang telah dianggap sebagai kesulitan
komputasi terkait dengan penduga maximum likelihood adalah mengandalkan metode
penduga not likelihood based. Contohnya pendekatan variabel instrumental Anselin
(1988, pp.81-90), variabel instrumen/generalized moments estimstor dari Kelejian dan
Prucha (1998, 1999), atau metode entropi maksimum Marsh dan Mittelhammer (2004).
Metode alternatif mengalami beberapa kelemahan. Salah satunya adalah bahwa mereka
dapat menghasilkan penduga parameter ketergantungan ( dalam diskusi kami) berada di
luar interval yang ditentukan oleh batas-batas nilai eigen yang timbul dari matriks W.
Selain itu, prosedur inferensial untuk metode ini sensitif terhadap isu-isu implementasi
seperti interaksi antara pilihan instrumen dan spesifikasi model, yang tidak selalu jelas
bagi praktisi.
Alternatif model spesifikasi seperti eksponensial matriks spasial diperkenalkan
oleh Lesage dan Pace (2007) yang berlabel MESS yang dapat diduga menggunakan
maximum likelihood atau metode Bayesian. Model regresi spesifikasi spasial ini dapat
digunakan dalam situasi di mana model DGP adalah SAR atau SDM untuk menghasilkan
penduga setara dan kesimpulan. Model MESS menghilangkan istilah determinan dari
fungsi likelihood, memungkinkan maximum likelihood dan penduga Bayesian model
untuk sampel spasial yang besar. Lesage dan Pace (2007) memberikan solusi bentuk
tertutup untuk penduga model ini. Hal ini juga memungkinkan untuk menghasilkan solusi
bentuk tertutup untuk penduga maximum likelihood dari SAR, SDM dan model SEM
39

dibahas di sini, sebuah inovasi terbaru yang diperkenalkan oleh Lesage dan Pace (2009).
Pendekatan ini sangat mengurangi motivasi ketergantungan pada metode non likelihoodbased yang secara tradisional menganjurkan kerja-sekitar untuk kesulitan komputasi yang
dirasakan dari penduga maximum likelihood. Kesulitan-kesulitan ini telah banyak
diselesaikan dengan kemajuan terbaru yang dijelaskan dalam Lesage dan Pace (2009).
The bias of least-squares
Sebagaimana dicatat, salah satu fokus kesimpulan adalah besarnya dan pentingnya
parameter , karena ini membedakan model SAR dari konvensional regresi dan
memberikan informasi mengenai kekuatan ketergantungan spasial antara pengamatan
variabel dependen.
Kontras penduga maximum likelihood * dari kuadrat yang berlabel

^ ,

perhatikan ekspresi matriks dalam Persamaan (C.1.17).


y=( W y X ) +

()

( ) [(

(C.1.17)

^ = y T W T ( wy X )
^
XT

] ( ) [(
1

y W
XT

yW W y
y=
XT W y

y W X
XT X

)] (

yT X T y
XT y

(C.1.18)
Jika kita berasumsi kovarians nol (atau orthogonality) antara W y dan X, matriks inverse
dalam Persamaan (C.1.18) menjadi diagonal memiliki inverse analisis sederhana, yang
T

^=( y W Wy ) y W y .

mengarah ke:

Kami dapat menunjukkan bahwa penduga kuadrat-terkecil untuk parameter


dalam kasus sederhana nol kovarians bias dan tidak konsisten. Ini melibatkan
pertimbangkan apakah definisi konsistensi:
T

plim ( ^ )= , berlaku
1

^=( y W Wy ) y W y=( y W Wy ) y W ( Wy+ X+ )

40

( y T W T Wy ) y T W T X+ ( y T W T Wy ) y T W T
1

( y T W T Wy ) y T W T

(C.1.19)

di mana persamaan terakhir mengikuti kovarians nol,

y T W T X =0 . Sekarang

plim ( y T W T Wy ) yT W T .

perhatikan batas probabilitas (Plim) dari


1

T
T
Istilah: Q= plim ( 1/n ) ( y W Wy )

memperoleh status matriks nonsingular

yang terbatas dengan pembatasan wajar/asumsi yang dibuat dalam aplikasi khusus.
Kami mengalihkan perhatian dengan istilah:
model DGP:

R= plim ( 1/n ) y T W T . Menggunakan

y=( I n pW )1 ( X + ) , kita menemukan


T

R= plim ( 1/n ) y W

(C.1.20)
T

R= plim ( 1/n ) [ ( I n pW )1 ( X + ) ] W T
R= plim ( 1/n ) T ( I n pW )1 W T

(C.1.21)
(C.1.22)

^= + R

(C.1.23)

Harus jelas bahwa Plim (operator batas probabilitas) dari bentuk kuadrat dalam gangguan
ditunjukkan pada Persamaan (C.1.22), tidak sama dengan nol kecuali dalam kasus sepele
di mana = 0, atau jika matriks W segitiga tepat. Sebagaimana dicatat, di bawah asumsi
penyederhanaan Wy dan X tidak berkorelasi, kebalikan matriks dalam Persamaan (C.1.18)
menjadi

diagonal

memiliki

inverse

analisis

sederhana,

yang

mengarah

ke:

^=( X T X )1 X T y . Ini harus jelas bahwa bukti serupa inkonsistensi dapat dibangun
untuk penduga kuadrat vektor parameter. Seperti telah disebutkan penduga maximum

41

( X X ) X ( I n W ) y , yang membutuhkan penduga tak

likelihood harus sama:


bias untuk .
Penduga Bayesian

Sebuah alternatif untuk penduga maximum likelihood adalah penduga Bayesian Markov
Chain Monte Carlo (MCMC) yang ditetapkan dalam Lesage (1997) untuk model SAR.
Kami menunjuk distribusi posterior menggunakan
merupakan parameter ,

( D )

p (D), di mana

dan D data sampel. Jika sampel

( D )

cukup

besar, kita bisa mendekati bentuk kepadatan posterior menggunakan estimator densitas
kernel atau histogram, menghilangkan kebutuhan untuk mengetahui bentuk analisis yang
tepat dari kepadatan rumit ini. Statistik sederhana juga bisa digunakan untuk membangun
sarana dan varians didasarkan pada nilai-nilai sampel yang diambil dari posterior.
Parameter

dan

dalam model SAR dapat diduga dengan menggambar

secara berurutan distribusi bersyarat dari dua set parameter, sebuah proses yang dikenal
sebagai Gibbs sampling, karena asal-usulnya dalam analisis citra (gambar), (Geman dan
Geman 1984). Distribusi bersyarat untuk parameter berbentuk distribusi normal
multivariat (untuk ) dan distribusi Gamma invers (untuk

). Gibbs Sampling juga

telah diberi label bolak pengambilan sampel kondisional, yang tampaknya deskripsi lebih
akurat dari prosedur.
Seperti yang sudah dibahas dalam diskusi kami memusatkan fungsi kemungkinan,
parameter vektor
merupakan

rata-rata
1

dapat dinyatakan sebagai:


dari

normal
1

T
T
2
T
N ( X X ) X ( I n W ) y , ( X X )

=( X T X ) X T ( I nW ) y , yang

distribusi

bersyarat

. Kita dapat menggunakan ekpresi rata-rata

dalam hubungan dengan matriks varians-kovarians terkait:

42

posterior

2 ( XT X )

, untuk

membangun hasil imbang normal multivariat untuk k oleh 1 parameter vektor . Kami
mencatat bahwa kemampuan untuk mengkondisikan parameter

(yang menganggap

itu dikenal) inilah yang menjadikan perhitungan ini dan multivariat yang normal imbang
sederhana. Demikian pula, distribusi posterior bersyarat untuk parameter

mengambil bentuk distribusi terbalik Gamma bahwa kita menunjukkan IG(a,b),dengan


T

a=n/ 2 , dan b=[ ( I nW ) y X ] [ ( I n W ) y ] /2 .


C.1.3 Penduga Parameter Dispersi dan Inferensi
Penduga MCMC Bayesian mengarah ke sampel besar dari gambaran untuk parameter
model yang dapat digunakan untuk membangun langkah-langkah dispersi yang
digunakan dalam inferensi Bayesian. Maximum likelihood inferensi biasanya
menggunakan tes rasio kemungkinan (LR), Lagrange multiplier (LM), atau Wald (W). Ini
setara asimtotik, tetapi dapat berbeda dalam sampel kecil.
Pace dan Barry (1997) mengusulkan tes rasio kecenderungan untuk hipotesis
seperti penghapusan variabel penjelas tunggal yang memanfaatkan kelebihan perhitungan
untuk bisa cepat mengevaluasi kemungkinan. Pace dan Lesage (2003) membahas
penggunaan signed root deviance statistic yang dapat digunakan untuk mengubah tes
rasio kemungkinan untuk variabel tunggal penghapusan ke bentuk yang mirip dengan ttests. Akar penyimpangan yang ditandatangani adalah akar kuadrat dari statistik
penyimpangan dengan tanda pencocokan penduga koefisien

(Chen dan Jennrich

1996). Statistik ini mirip dengan t-rasio untuk sampel besar, dan dapat digunakan tstatistik untuk pengujian hipotesis.
Wald inferensi menggunakan versi analitis atau numerik dari Hessian. Ini dapat
digunakan untuk membangun regresi konvensional t-statistik. Masalah implementasi
adalah bahwa membangun Hessian analitis (atau matriks informasi) melibatkan
1

perhitungan jejak padat n oleh n invers matriks ( I nW )

43

Dari perspektif kecepatan perhitungan ekspresi vektor dari Pace dan Barry (1997)
untuk cepat mengevaluasi fungsi log-likelihood membuat Hessian murni numerik layak
untuk model ini. Namun, ada beberapa kelemahan menerapkan pendekatan ini dalam
perangkat lunak untuk penggunaan umum, karena praktisi sering bekerja dengan data
sampel yang kurang baik dan data sampel multicollinear. Data tersebut dapat menurunkan
akurasi penduga numerik dari derivatif populating Hessian. Titik kedua adalah bahwa
optimasi univariat berlangsung menggunakan kemungkinan terkonsentrasi sehubungan

dengan parameter

dan

, sehingga pendekatan numerik Hessian penuh dari

prosedur penduga maximum likelihood. Lesage dan Pace (2009) menunjukkan


bagaimana istilah yang sulit komputasi tunggal dalam Hessian analitis dapat diganti
dengan pendekatan numerik. Hal ini memungkinkan istilah analitis yang tersisa untuk
digunakan, meningkatkan akurasi dan mengatasi masalah skala.
C.1.4 Interpretasi Penduga Parameter
Tanggapan simultan merupakan ciri dari model regresi spasial yang berasal dari
hubungan ketergantungan diwujudkan dalam lag spasial seperti Wy. Ini menyebabkan
efek umpan balik dari perubahan variabel penjelas di suatu daerah yang berdekatan i,
mengatakan wilayah j, yang akan berdampak pada variabel dependen untuk
observasi/wilayah i.
Untuk melihat bagaimana efek umpan balik ini bekerja, perhatikan proses
menghasilkan data yang terkait dengan model SAR, ditampilkan dalam Persamaan
(C.1.24), yang telah menerapkan serangkaian ekspansi terbatas terkenal di Persamaan
(C.1.25) untuk mengungkapkan kebalikannya.
y=( I n W )1 X + ( I nW )1
1
2
2
3
3
( I nW ) =I n + W + W + W +

(C.1.24)
(C.1.25)

y= X+ WX+ 2 W 2 X ++ + We+ 2 W 2 + 3 W 3 + (C.1.26)

44

Pernyataan model dalam persamaan (C.1.26) dapat diartikan sebagai nilai yang
diharapkan dari setiap pengamatan y akan bergantung pada nilai rata-rata ditambah
kombinasi linear dari nilai-nilai yang diambil oleh pengamatan skala oleh parameter
ketergantungan

, , ,

Perhatikan kekuatan dari baris-stokastik matriks bobot spasial

W ,W ,

yang

muncul dalam Persamaan (C.1.26), di mana kita asumsikan bahwa baris dari bobot
matriks W dibangun untuk mewakili orde pertama berdekatan. Matriks W akan
mencerminkan orde kedua berdekatan, yang adalah tetangga orde pertama. Karena
tetangga dari tetangga (orde kedua tetangga) untuk pengamatan i meliputi pengamatan i
sendiri,

memiliki unsur-unsur positif pada diagonal. Artinya, tingkat tinggi lag


W 2 X

spasial dapat menyebabkan hubungan konektivitas untuk observasi i sehingga


dan

W 3 X

akan mengekstrak pengamatan dari vektor

dan

yang

menunjuk kembali ke pengamatan i sendiri. Hal ini kontras dengan hubungan


konvensional independen dalam regresi kuadrat terkecil di mana asumsi Gauss-Markov
mengesampingkan ketergantungan

observasi lainnya j, dengan asumsi kovarians

nol antara pengamatan i dan j dalam proses menghasilkan data.


Steady-state equilibrium interpretasi
Orang mungkin mengira bahwa efek umpan balik akan memakan waktu, tetapi tidak ada
peran eksplisit untuk perjalanan waktu dalam model cross-sectional. Sebaliknya, kita
melihat sampel cross sectional dari daerah sebagai hasil dari suatu hasil keseimbangan
atau steady state dari proses daerah pemodelan kita. Untuk menjelaskan hal ini,
perhatikan hubungan di mana y merupakan pendapatan daerah pada waktu t, dinotasikan
dengan y, dan ini tergantung pada karakteristik periode daerah sendiri saat
tenaga kerja, manusia dan modal fisik dan parameter terkait

45

Xt

seperti

, ditambah pengamatan

tingkat pendapatan dari daerah sekitarnya dari periode terakhir,


dependence dapat diwakili oleh variabel space time lag

t1 . Jenis space time

Wy t1 , yang mengarah pada

model Persamaan (C.1.27). Tampaknya masuk akal untuk mengasumsikan bahwa


karakteristik daerah seperti tenaga kerja, manusia dan perubahan modal fisik perlahan
dari waktu ke waktu, sehingga kita membuat asumsi penyederhanaan bahwa ini tidak
Xt =X

berubah dari waktu ke waktu, ditetapkan

pada Persamaan (C.1.27).

y t =W y t 1+ X+ t
y t1

Perhatikan bahwa kita dapat mengganti

(C.1.27)
di sisi kanan Persamaan (C.1.27) dengan

y t1= Wy t2 + X + t 1 , dan melakukan jenis substitusi rekursif dan batas dengan t


besar dan q menghasilkan (Lesage dan Pace 2009):

lim E ( y t )=lim E ( I n + W + W ++
qt

q t

q1

q1

) X+ q W q y t q +u ] ( I nW )1 X
(C.1.28)

Kami menyimpulkan bahwa harapan jangka panjang model Persamaan (C.1.27), dapat
diartikan sebagai memiliki keseimbangan steady state yang berbentuk konsisten dengan
proses menghasilkan data untuk model SAR cross-sectional. Dengan kata lain, umpan
balik simultan adalah fitur dari keseimbangan steady-state untuk model regresi spasial
yang mencakup lag spasial variabel dependen. Dalam konteks model SAR statis crosssectional di mana kita memperlakukan sampel yang diamati sebagai cermin keadaan hasil
ekuilibrium stabil, efek umpan balik ini muncul sesaat, tetapi harus diinterpretasikan
menuju gerakan steady state berikutnya.
Interpretasi parameter

Lesage dan Pace (2009) menunjukkan bahwa interpretasi dari vektor parameter

dalam model SAR berbeda dari interpretasi kuadrat terkecil konvensional. Dalam

46

kuadrat-rth parameter,

, dari vektor

ditafsirkan mewakili turunan parsial dari y

terhadap perubahan variabel penjelas rth dari matriks X, yang kita tulis sebagai

Xr

Dalam regresi kuadrat-terkecil standar dimana variabel vektor tergantung berisi


independen, pengamatan perubahan dalam pengamatan i dari variabel rth dinotasikan
X ir

hanya pengaruh pengamatan

perubahan pengaruh

y i , sedangkan model SAR memungkinkan jenis

y i , serta pengamatan lainnya

y j , di mana j i .. Jenis

dampak timbul akibat saling ketergantungan atau konektivitas antara


pengamatan dalam model SAR.
Untuk melihat bagaimana ini bekerja, perthatikan model SAR

( I nW ) y= X+

(C.1.29)

y= S r ( W ) X r +V ( W )
r=1

S r ( W )=V ( W ) ( I n r )
V (W )=( I nW )1=I n+ W + 2 W 2+ 3 W 3 +
Untuk menggambarkan peran

(C.1.30)

(C.1.31)
(C.1.32)

S r ( W ) , perhatikan perluasan proses menghasilkan data

dalam Persamaan (C.1.30) seperti yang ditunjukkan pada Persamaan (C.1.33).

() (

)( )

S r (W )11 Sr ( W )21 Sr ( W )1n X 1 r


y1
k
y 2 = Sr ( W )21 Sr ( W )22
X 2 r +V ( W ) +V ( W )

r =1

yn
S r ( W )n 1 S r ( W )n 2 S r ( W )nm X nr

(C.1.33)

Untuk membuat peran S r ( W ) yang jelas, perhatikan penentuan tergantung pengamatan


variabel tunggal

y i ditunjukkan pada Persamaan (C.1.34).


47

y i= [ ( S r ) ( W )i 1 X 1 r +S r ( W )i 2 X 2 r ++ Sr ( W ) X nr ] +V ( W )i ln+V ( W )i

(C.1.34)

r=1

Mengikuti Persamaan (C.1.34) bahwa turunan dari

yi

terhadap

X jr

berbentuk
Sr

seperti yang ditunjukkan pada Persamaan (C.1.35), di mana kita menggunakan

W ij ) untuk mewakili unsur (i, j)th dari matriks S r ( W ) .


yi
=Sr ( W )ij
X jr

(C.1.35)

Berbeda dengan kasus kuadrat terkecil, turunan dari y terhadap X tidak sama untuk
dan turunan dari

y i untuk

X jr untuk

j i

tidak sama dengan nol.

Langkah-langkah ringkasan dampak skalar didasarkan pada gagasan bahwa turunan


sendiri untuk ith wilayah berbentuk seperti pada Persamaan (C.1.36), yang mewakili ith
unsur diagonal dari matriks S r ( W ) , yang dinotasikan S r ( W )ii .
yi
=S r ( W )ii
X ir

(C.1.36)

Lesage dan Pace (2009) mendefinisikan langkah-langkah meringkas skalar


dampak adalah sebagai berikut:
a.

Rata-rata dampak langsung. Dampak perubahan pengamatan ith

dinotasikan dengan

X ir on

yi

X r

dapat diringkas dengan mengukur unsur

diagonal utama S r ( W )ii , dari matriks S r ( W ) .


b.

Rata-rata dampak keseluruhan. Jumlah seluruh deretan ith

merupakan dampak keseluruhan pada pengamatan individu

48

yi

Sr ( W )

yang dihasilkan

dari mengubah variabel penjelas rth denga jumlah seluruh pengamatan n (misalnya,
X r + n di mana

adalah perubahan skalar). Di sisi lain, jumlah seluruh kolom

ith mencerminkan dampak total pada semua

yi

yang timbul dari mengubah

variabel penjelas rth dengan jumlah pengamatan jth (misalnya,

X jr + ). Rata-rata

jumlah baris atau jumlah kolom akan menghasilkan jumlah yang sama, yang
merupakan dampak keseluruhan.
c.
Rata-rata dampak tidak langsung. Ini adalah definisi perbedaan antara
dampak keseluruhan dan langsung. Dampak ukuran ringkasan ini mencerminkan apa
yang umumnya dianggap sebagai spillovers spasial, atau dampak yang jatuh di daerah
selain daerah sendiri.
Lesage dan Pace (2009) menunjuk ke sebuah perbedaan interpretasi antara keseluruhan
ukuran ringkasan dampak rata-rata yang timbul dari rata-rata jumlah baris dibandingkan
rata-rata jumlah kolom. Meskipun dua ringkasan skalar ini sama, rata-rata jumlah baris
bisa dilihat sebagai cerminan (rata-rata) jumlah dampak keseluruhan ke pengamatan,
sedangkan rata-rata jumlah kolom lebih tepat diartikan sebagai (rata-rata) jumlah dampak
keseluruhan dari sebuah pengamatan.
Untuk menguraikan perbedaan antara dua sudut pandang interpretatif ini,
perhatikan situasi modeling di mana pusat bunga mengenai bagaimana krisis keuangan di
satu negara/penyebarluasan pengamatan untuk menghasilkan penularan di pasar
keuangan negara-negara lain (Kelejian et al. 2006). Situasi ini dapat dilihat sebagai
perubahan dalam jth pengamatan/negara (misalnya,

X jr + ) berdampak pada semua

negara y, i = 1, ..., n, atau (rata-rata) jumlah dampak dari pengamatan.


Sebaliknya, bagaimana jika pusat bunga mengalami kenaikan tingkat modal
manusia di seluruh wilayah dengan beberapa jumlah (rata-rata) mempengaruhi tingkat
pertumbuhan satu wilayah, maka kami bekerja dengan (rata-rata) jumlah dampak untuk
pengamatan sudut pandang interpretatif (Dall'erba dan LeGallo 2007).

49

Sangat mudah melihat bahwa nilai-nilai numerik dari langkah-langkah ringkasan


untuk dua bentuk total dampak rata-rata yang ditetapkan di atas adalah sama, karena rata1 T
1 T
rata dari kolom jumlah baris Cr =Sr ( W ) n , sama dengan n n C r=n n S r ( W ) n . Di

sisi lain, rata-rata dari deretan jumlah kolom


sama dengan

r r =Tn Sr ( W ) , sama

n1 r r n

yang juga

1 T

n n Sr ( W ) n .

Ringkasan ukuran keseluruhanl dampak,

n1 Tn Sr ( W ) n , untuk model SAR

berbentuk sederhana dalam Persamaan (C.1.37) untuk model yang bergantung pada barisstokastik matriks W (dimana jumlah baris sama dengan satu).
n1 Tn Sr ( W ) n =n1 Tn ( I nW )1 r n=( 1 )1 r

(C.1.37)

Satu hal yang perlu diperhatikan adalah dampak langsung rata-rata untuk model ini tidak
sama dengan koefisien seperti pada kasus model regresi konvensional. Perbedaan
antara penduga koefisien r dan ukuran ringkasan skalar dari dampak langsung rata-rata
muncul dari umpan balik yang mencerminkan bagaimana perubahan awal dalam
menimbulkan dampak pada daerah sekitar

yj

yi

yang pada gilirannya melewati daerah

sekitar dan umpan balik ke daerah i.


Salah satu ilustrasi terapan ini menggunakan pendugaan dampak ringkasan skalar
dapat ditemukan di Bab E. 1. Aplikasi ini mempertimbangkan dampak langsung, tidak
langsung dan total perubahan modal manusia pada tingkat produktivitas tenaga kerja di
daerah Uni Eropa. Sejumlah aplikasi lainnya dapat ditemukan di Lesage dan Pace (2009)
dalam berbagai konteks diterapkan.
Kesimpulan mengenai dampak
Untuk penilaian mengenai pentingnya dampak ini, kita perlu menentukan distribusi
empiris atau teori distribusi. Karena dampak mencerminkan kombinasi non-linear dari
parameter dan dalam kasus model SAR, bekerja dengan distribusi teoritis tidak terlalu
50

nyaman. Mengingat perkiraan model sekaligus terkait matriks varians-kovarians bersama


dengan pengetahuan bahwa pernduga maximum likelihood adalah (asimtotik)
berdistribusi normal, kita dapat mensimulasikan parameter dan .
Untuk kasus penduga Bayesian MCMC sudah memiliki sampel parameter
gambaran untuk dan yang dapat digunakan dalam hubungannya dengan ekspresi
untuk langkah-langkah ringkasan skalar untuk menghasilkan distribusi posterior dari
keseluruhan, langkah-langkah dampak langsung dan tidak langsung. Gelfand et al. (1990)
menunjukkan bahwa ini adalah pendekatan yang valid untuk mendapatkan distribusi
posterior untuk kombinasi non-linear dari parameter modele.
Untuk kasus model SAR, ini relatif mudah kita hanya perlu mengevaluasi

( 1 )1 r

untuk menemukan dampak keseluruhan. Menghitung dampak langsung


1

mengharuskan kita bekerja dengan diagonal utama matriks ( I nW )

dimana Lesage

dan Pace (2009) memberikan metode komputasi yang efisien. Ingat bahwa kita perlu
untuk melakukan perhitungan ini ribuan kali menggunakan simulasi nilai parameter atau
MCMC gambaran untuk menentukan langkah-langkah empiris dispersi. Langkah-langkah
ini digunakan untuk menentukan signifikansi statistik dari dampak langsung, tidak
langsung dan jumlah yang terkait dengan berbagai variabel penjelas dalam model, dengan
cara yang sama untuk menggunakan t-statistics dalam model regresi konvensional. Pada
model yang lebih rumit seperti SDM, langkah-langkah ringkasan skalar dampak
berbentuk lebih rumit, tapi Lesage dan Pace (2009) memberikan pendekatan komputasi
yang efisien untuk mengevaluasi ekspresi ini.
Sebuah ilustrasi diterapkan pendekatan simulasi untuk menentukan langkahlangkah dispersi untuk diduga dampak ringkasan skalar dapat ditemukan di Bab E.1.
Ilustrasi lain diberikan dalam Lesage dan Fischer (2008) dalam konteks metode rata-rata
model yang dibahas dalam Bab C.4.
Heterogenitas spasial, ketergantungan spasial, dan dampak

51

Banyak penulis menggambarkan perbedaan antara model ketergantungan spasial dan


heterogenitas spasial. Biasanya, model ketergantungan spasial menduga parameter untuk
setiap variabel sementara model heterogenitas spasial efektif memperkirakan parameter
matriks n oleh n.
Namun, perbedaan antara model ketergantungan spasial dan heterogenitas spasial tidak
jelas. Untuk memotivasi diskusi ini, perhatikan model linear biasa (C.1.38) dengan
parameter yang ditulis dalam bentuk matriks di Persamaan (C.1.39) ke (C.1.41).
E ( y )=X 1 1+ X 2 2 ++ X k k

(C.1.38)

(1 )
( 2)
(k )
E ( y )= X 1 + X 2 + X k

(r )

ii = r r=1, , k , i=1, ,n

(r )= (r )

(C.1.39)
(C.1.40)
(C.1.40)

Jelas, dalam model linear biasa dampak perubahan variabel penjelas adalah sama di
seluruh pengamatan dan perubahan variabel penjelas untuk satu pengamatan tidak
mempengaruhi yang lain.
Bagaimana jika kita memberi bobot menurun geometris untuk nilai-nilai
parameter di sekitarnya, termasuk parameter pada tetangga dari tetangga, dan sebagainya
seperti yang ditunjukkan pada Persamaan (C.1.42). Mengingat rumus untuk ekspansi seri
tak terbatas, ini mengarah ke Persamaan (C.1.43). Menariknya, matriks parameter tersirat
oleh proses ini sama dengan dampak matriks

( Sr ( W ) ) yang dibahas sebelumnya.

Seperti sebelumnya, kita dapat melihat nilai yang diharapkan dari variabel dependen
sebagai jumlah dampak dari semua variabel penjelas seperti pada Persamaan (C.1.44).
(r )=I n B( r) + W B (r )+ 2 W 2 B(r ) +
(r )=( I nW )1 B( R)=S r ( W )

52

(C.1.42)
(C.1.43)

E ( y )=S1 ( W ) X 1+ S 2 ( W ) X 2+ +S k (W ) X k

(C.1.44)

Sebagai rangkuman, ketergantungan spasial melibatkan lag spasial variabel dependen


mengisyaratkan suatu bentuk heterogenitas spasial di mana dampak mengukur
heterogenitas pada pengamatan.
C.1.5 Penutup
Proses autoregressive spasial merupakan cara untuk model ketergantungan spasial
antara pengamatan yang sering muncul dalam penelitian ekonomi regional. Kami telah
menunjukkan bagaimana model regresi dasar dapat ditambah dengan proses
autoregressive spasial untuk menghasilkan model yang menggabungkan umpan balik
simultan antara daerah yang terletak di ruang. Hal ini juga menunjukkan bahwa perkiraan
model regresi konvensional yang mengabaikan umpan balik ini bias dan tidak konsisten.
Interpretasi estimasi dan kesimpulan mengenai hubungan konektivitas spasial
dimodelkan membutuhkan interpretasi berdasarkan pandangan keseimbangan mapan.
Model ini menghasilkan situasi di mana perubahan variabel penjelas menyebabkan
serangkaian masukan simultan yang pada akhirnya menghasilkan keseimbangan mapan
baru. Karena kita bekerja dengan data sampel cross-sectional, penyesuaian model ini
muncul seolah-olah secara simultan, tapi kami berpendapat bahwa model ini dapat dilihat
mengandung dimensi waktu implisit.
Ketersediaan perangkat lunak domain publik untuk menerapkan estimasi dan
inferensi untuk model dijelaskan di sini harus membuat metode ini dapat diakses secara
luas (Anselin 2006; Bivand 2002; Lesage 1999; Pace 2003).

53

You might also like