Professional Documents
Culture Documents
Oleh:
Adriani Bunga Nona Risky
156090500111003
DAFTAR PUSTAKA
B.6
B.6.1 Pengantar..1
B.6.2 Teori Geostatistik.1
B.6.3 Penduga Variogram.3
B.6.4 Pemodelan Variogram.7
B.6.5 Studi Kasus: Variogram.10
B.6.6 Prediksi Geostatistik: Kriging16
B.6.7 Studi Kasus: Kriging 23
C.1
C.1.1 Pendahuluan 29
C.1.2 Penduga Model Lag Spasial 33
C.1.3 Penduga Parameter Dispersi dan Infersi37
C.1.4 Interpretasi Penduga Parameter.. 38
C.1.5 Penutup..46
B.6.1 Pengantar
Statistik spasial dan geostatistik telah dikembangkan untuk menggambarkan dan
menganalisis variasi di kedua fenomena alam dan buatan manusia, di atas atau di bawah
permukaan tanah. Statistik spasial termasuk salah satu teknik formal yang mempelajari
kesatuan yang memiliki indeks spasial (Cressie 1993). Istilah geostatistik pada dasarnya
berlaku untuk satu set tertentu dari model dan teknik yang dikembangkan sebagian besar
oleh Matheron (1963) pada tahun 1960 untuk mengevaluasi cadangan pemulihan untuk
industri pertambangan. Ide-ide ini telah muncul sebelumnya di bidang lain; mereka
memiliki sejarah panjang peregangan kembali ke Mercer dan Hall (1911), Youden dan
Mehlich (1937), Kolmogorov (1941), Gandin (1965), Matern (1960) dan Krige (1966).
Geostatistik sejak itu telah diterapkan di berbagai bidang, seperti pertanian, perikanan,
hidrologi, geologi, meteorologi, minyak bumi, penginderaan jauh, ilmu tanah dan
sebagainya. Sebagian besar bidang ini datanya adalah fragmentaris dan jarang, karena itu
ada kebutuhan untuk memprediksi dari mereka setepat mungkin di tempat-tempat di
mana mereka belum diukur.
B.6.2 Teori Geostatistik
Dasar geostatistik modern adalah untuk memprediksi variabel keuntungan sebagai
variabel acak. Ini berarti bahwa pada setiap titik
nilai untuk properti,
Z (x)
variabel acak,
x , sebuah
dan varians,
2 . Set
diamati adalah salah satu yang berpotensi sejumlah realisasi dari proses acak. Dalam
statistik klasik set nilai-nilai yang diamati, realisasinya, adalah penduduk.
Kovarians untuk variabel-variabel acak diberikan oleh
C ( x 1 , x 2 )=E { Z ( x 1 ) ( x 1 ) }{ Z ( x 2 ) ( x 2 ) }
di mana
( x1 )
dan
( x2 )
adalah rata-rata
di
x1
(B.6.1)
dan
x2
dan
dan
x1
x2
dan
x , dan
2=E [ { Z ( x ) }
, yang
x 1 dan
x2
tidak sesuai, kovariansnya tergantung pada perpisahannya dan bukan pada posisi
mutlaknya, dan ini berlaku untuk setiap pasang titik
xi ,
xj
(B.6.2)
kovarians adalah fungsi dari lag dan menggambarkan secara kuantitatif ketergantungan
antara nilai Z dengan mengubah pemisahan atau jarak lag. Autokovarian tergantung pada
skala Z diukur; oleh karena itu, sering dikonversi ke autokorelasi berdimensi oleh
( h )=C ( h ) /C ( 0 )
2
di mana C ( 0 ) = adalah kovarians pada lag nol.
(B.6.3)
untuk dimasukkan ke
dalam Persamaan (B.6.2). Matherons (1965) solusi untuk ini adalah hipotesis lemah
intrinsik geostatistik. Meskipun rata-rata umum mungkin tidak konstan, itu akan menjadi
jarak lag kecil sehingga diharapkan perbedaan akan menjadi nol sebagai berikut:
E [ Z ( x ) Z ( x+ h ) ] =0
(B.6.4)
Kuantitas
( h)
h ,
(B.6.5)
( h)
biasanya variogram.
Jika proses
Z (x)
yang setara
( h )=C ( 0 )C ( h )= 2 { 1 ( h ) }
(B.6.6)
Namun, jika proses intrinsik hanya ada kesetaraan karena fungsi kovarians tidak ada.
Variogram ini berlaku, namun, karena itu dapat diterapkan lebih luas dari fungsi
kovarians.
B.6.3 Penduga Variogram
Bagian ini menjelaskan dua metode untuk menduga variogram dari data, metode momen
Matheron dan metode residual maximum likelihood (REML), bersama dengan fitur
utama yang cenderung memiliki variograms.
Penduga metode momen
Semivariances empiris dapat diduga dari data,
z ( x1 ) ,
z ( x 2 ) , , oleh
m (h)
2
1
^ ( h )=
z ( x i )z ( x i+ h ) }
{
2 m ( h ) i=1
(B.6.7)
di mana
z ( xi )
dan
z ( x i +h )
( xi )
h= h ,
dimana semivariances dapat dihitung hanya pada kelipatan interval sampling. Lag
maksimum harus ditetapkan tidak lebih dari sepertiga panjang transek. Untuk grid biasa,
semivariances dapat dihitung sepanjang baris dan kolom dari grid dan kenaikan lag
adalah interval jaringan. Untuk sampel data yang tidak teratur dalam satu atau lebih
dimensi, atau untuk menghitung variogram omnidirectional data pada grid biasa,
pemisahan antara pasangan titik ditempatkan ke tempat bin dengan batas yang
memisahkan jarak dan arah, Gambar B.6.1. Dalam gambar ini, 0L adalah interval lag
/2
satu dari set arah. Untuk menghitung variogram atas semua arah, variogram
omnidirectional, /2
Gambar. B.6.1. Diskritasi lag ke tempat bin untuk data tidak teratur yang tersebar
Pilihan bin yang sempit cenderung menimbulkan variograms tidak menentu, sedangkan
bin yang lebar cenderung halus dan mengakibatkan hilangnya detail.
Webster dan Oliver (1992) telah menunjukkan bahwa setidaknya 100 titik
sampling diperlukan untuk memperkirakan variogram MoM. Dalam situasi lain ukuran
sampel mungkin mengakibatkan jarak sampel lebih dekat daripada yang dibutuhkan
4
untuk menyelesaikan variasi memadai; ini terjadi di mana properti yang memiliki skala
besar variasi spasial relatif terhadap batas wilayah studi. Hal ini akan mengakibatkan
over-sampling dan pemborosan sumber daya. Pardo-Igzquiza (1997) menyarankan
pendekatan maximum likelihood (ML) sebagai alternatif untuk penduga Matheron. Dia
juga menyarankan bahwa di mana jumlah data yang relatif kecil (beberapa lusin), ML
variogram estimator menawarkan alternatif yang memberikan pendugaan parameter
variogram dan ketidakpastiannya (Pardo-Igzquiza 1998, hlm. 462-464).
Residual maximum likelihood (REML) variogram estimator
Setelah notasi Kerry dan Oliver (2007), diasumsikan bahwa data,
z ( x i ) , i=1, ,n ,
realisasi dari proses ini, mengikuti distribusi multivariat Gaussian dengan fungsi
kepadatan probabilitas gabungan (pdf) dari yang didefinisikan oleh pengukuran
1
V 2 exp
{12 ( zX ) V
T
( z X )
(B.6.8)
n
2
p ( z , )=( 2 )
di mana
adalah vektor yang berisi n data, berisi parameter dari matriks kovarians,
(B.6.9)
kembali sebagai
1
2
A exp
1
( z X )T A1 ( zX )
2
2
2
p ( z , , ) =( 2 )
di mana
n
2
(B.6.10)
(B.6.11)
(B.6.12)
P=I X ( X T X ) X T
(B.6.13)
dengan menjatuhkan p baris dalam karena ada p penambahan umum yang linear
tergantung pada yang lain (Kitanidis 1983). Matriks P memiliki properti
PX =0
(B.6.14)
maka
Pz=PX + Pe=Pe
(B.6.15)
E ( g )=0
(B.6.16)
dan
E ( g g T ) = V T
(B.6.17)
1
n p
n p n p
1
n p
ln ( 2 ) +
ln ( n p ) + ln | A T |+
ln [ gT ( A T ) g ]
2
2
2
2
2
(B.6.18)
Kovarians parameter, , dapat mencakup nugget varians (lihat di bawah untuk definisi),
panjang dan pendek komponen jarak untuk situasi isotropik dan anisotropik, bersamasama dengan rasio anisotropik yang terakhir. Pardo-Igzquiza (1997) program MLREML
ini menghitung parameter untuk tiga model kovarians, berbentuk bulat, eksponensial dan
Gaussian.
Kontinuitas.
Kebanyakan
mengharapkan
( h)
variabel
lingkungan
berkelanjutan,
karena
itu
kita
prakteknya, variogram yang sering muncul mendekati ordinat di beberapa nilai positif
sebagai h mendekati nol, Gambar B.6.2 (b), menunjukkan bahwa proses ini terputusputus. Perbedaan ini dikenal sebagai varian nugget. Gambar B.6.2 (c) adalah variogram
nugget murni yang biasanya menunjukkan bahwa interval sampling terlalu besar untuk
menyelesaikan variasi.
Peningkatan monoton. Gambar B.6.2 (a) dan (b) menunjukkan bahwa kenaikan
semivariance dengan meningkatnya jarak lag. Hal ini menunjukkan bahwa pada jarak
pendek nilai-nilai dari
Z (x)
urutan kedua stasioner. Jarak di mana variogram mencapai ambang adalah rentang, yaitu
kisaran ketergantungan spasial.
Efek hole dan periodisitas. Variogram mungkin menurun dari maksimum ke minimum
lokal dan kemudian meningkat lagi. Maksimum ini setara dengan minimal dalam fungsi
kovarians yang muncul sebagai 'hole'. Ini menunjukkan pengulangan cukup teratur dalam
proses. Sebuah variogram yang berfluktuasi dengan cara periodik dengan meningkatnya
jarak lag menunjukkan keteraturan yang lebih besar dari pengulangan.
Gambar B.6.2. Tiga bentuk variogram ideal: (A) tidak terbatas; (b) dibatasi; dan (c) adalah
komponen spasial korelasi [ c 0
memperoleh perkiraan ini kita bisa sesuaikan dengan apa yang dikenal sebagai fungsi
resmi conditional negative semi-definite (CNSD) dengan nilai-nilai percobaan. Ada
beberapa fitur fungsi utama yang harus bisa mewakili:
(i) peningkatan monoton dengan meningkatnya jarak lag dari dekat ordinat,
(ii) maksimum konstan atau asymptote (ambang),
(iii) intersep positif pada ordinat (nugget),
(iv) anisotropi.
Rumus untuk fungsi yang dipilih akan diberikan dalam bentuk isotropik, yaitu untuk
h= h .
Model lingkaran. Persamaan untuk fungsi lingkaran adalah
}
2
2
2h
h
1 h
c 0+ c 1 cos
+
1 2 untuk h a
a a
a
( h )=
c0 + c untuk h> a
0 untuk h=0
di mana
( h)
autokorelasi,
c0
()
(B.6.19)
jarak kurang dari interval sampling dan pengukuran kesalahan, dan a adalah parameter
jarak, kisaran ketergantungan spasial atau autokorelasi spasial. Gabungan
c 0 +c
adalah
model sill. Secara teoritis semivariance di lag nol itu sendiri nol, tetapi dalam prakteknya
biasanya ada sedikit perkiraan
( h)
asal. Fungsi ini merupakan CNSD dalam dua dimensi. Kurva erat karena mendekati
rentang (lihat Gambar B.6.4 (i)).
Fungsi berbentuk bulat. Persamaannya adalah
( )}
3h 1 h 3
c 0+ c
+
untuk h a
2a 2 a
( h )=
c 0 +c untuk h> a
0 untuk h=0
(B.6.20)
Kurva model ini secara bertahap sebagai ambang tercapai dari lingkaran, lihat Gambar
6.4.4 (c). Fungsi ini adalah CNSD dalam tiga dimensi. Ini merupakan fitur transisi yang
memiliki batas umum yang muncul sebagai patch, beberapa dengan nilai besar dan
lainnya dengan nilai kecil. Diameter rata-rata patch diwakili oleh berbagai model.
Fungsi Pentaspherical. Model kurva ini lebih halus saat mendekati ambang dibandingkan
model sebelumnya, lihat Gambar B.6.3 (b). Hal ini CNSD dalam tiga dimensi. Fungsi
pentaspherical memiliki persamaan
( h )=
c 0+ c
( ) ( )}
3
15 h 5 h
3 h
+
untuk h a
8a 4 a
8 a
c 0 +c untuk h>a
0untuk h=0
(B.6.21)
( h )=c 0 +c 1exp
di mana
c0
( hr )}
(B.6.22)
dan c memiliki arti yang sama seperti di atas, tetapi parameter jarak
sekarang r. Model eksponensial mendekati ambang bahkan lebih halus daripada model
sebelumnya dan juga asimtotik sehingga tidak memiliki jangkauan yang terbatas. Dalam
prakteknya, jangkauan efektif ditugaskan pada jarak di mana fungsi telah mencapai 95
persen c. Kisaran efektif, a', adalah 3r. Hal ini CNSD dalam tiga dimensi. Fungsi
eksponensial juga merupakan struktur transisi, tetapi sekarang memiliki luasan acak.
10
Eksponensial stabil. Ini adalah pengganti yang berguna untuk fungsi Gaussian
variograms eksperimental yang muncul mendekati asal dengan kelengkungan terbalik;
dapat direpresentasikan oleh persamaan umum
{ ( )}
h
( h )=c 0 +c 1exp
r
dimana
(B.6.23)
variasi terdiferensiasi dalam proses, yang tidak acak. Websterand Oliver (2006)
menggunakan fungsi eksponensial yang stabil untuk menggambarkan variasi topografi.
Model tak terbatas. Model ini memiliki persamaan umum termasuk varian nugget dari
( h )=c 0 +wh
(B.6.24)
, menggambarkan
< 1 , kurva cembung ke atas; jika itu adalah salah satu garis lurus
>1
(B.6.25)
di mana A dan B adalah diameter panjang dan pendek pada elips, masing-masing, dan
adalah orientasi, yaitu arah sumbu panjang. Untuk model dibatasi, menggantikan
parameter jarak dari variogram isotropik sebagai berikut untuk variogram eksponensial
(lihat Gambar B.6.5 (b))
11
h
()
1exp { ]
( h , )=c 0 +c
(B.6.26)
(B.6.27)
c 0+ c 1
( h )=
Dimana
c1
variasi, dan
dan
c2
dan
( ) } { ( ) }untuk 0<h a
c +c +c
{ 2a3 h 12 ( ah ) }untuk a < h a
3h 1 h
2 a1 2 a1
+c 2
3h 1 h
2 a2 2 a2
(B.6.28)
c 0+ c 1+ c2 untuk h=a2
a1
komponen nugget juga dapat ditambahkan seperti di atas (lihat Gambar B.6.6 (b).).
B.6.5 Studi Kasus: Variogram
Kami menggambarkan beberapa prinsip geostatistik dengan hasil dari sebuah penelitian
terbaru di pertanian presisi untuk British Home-Grown Cereals Authority (Oliver dan
Carroll 2004). Bidang (UK National Grid reference SU 458174) meliputi 23ha pada
Yattendon Estate, Berkshire, Inggris. Dari serangkaian luas data survei yang diperoleh
selama tahun 2002 kami telah memilih humus (0-15 cm) yang terdapat kalium. Data hasil
gandum musim dingin yang tersedia untuk tahun 2001 menggambarkan variasi
bersarang. Tabel B.6.1 memberikan kesimpulan statistik dua variabel tersebut.
Sampling untuk survei tanah berada di node 30m 30m grid, dengan pengamatan
tambahan pada 15m interval sepanjang transek pendek dari node jaringan yang dipilih
secara acak. Ada 230 titik data, yang memungkinkan setiap anisotropi dalam variasi yang
12
akan ditentukan; ukuran sampel ini dekat dengan 250 data yang direkomendasikan oleh
Webster dan Oliver (1992).
Tabel B.6.1. Ringkasan statistik
Gambar B.6.3. (a) arah variogram dihitung dari data mentah (230 poin) dari Yattendon Estate,
dan (b) arah variogram dihitung dari residual dari rata-rata kelas. Simbol mewakili: *
menandakan 0 (E-W), menunjukkan 45, menunjukkan 90 (N-S), menandakan 135
Untuk menggambarkan pengaruh ukuran sampel pada variogram, kami subsampled set
lengkap data (230 titik sampel) untuk memberikan subset dari 94 dan 47 data. Variograms
omnidirectional percobaan dihitung dari total data dan dua subset untuk humus K. Untuk
mengeksplorasi efek dari lebar bin yang berbeda, variograms dihitung untuk interval lag
dari 15m (interval sampling untuk transek), 20m (pertengahan jalan antara transek dan
selang jaringan secara keseluruhan) dan 40m (untuk ilustrasi). Model yang dilengkapi
dengan nilai-nilai eksperimental menggunakan GENSTAT (Payne 2008).
13
Gambar B.6.4 menunjukkan nilai percobaan sebagai simbol dan model tepat
sebagai garis solid. Variograms percobaan menunjukkan bahwa interval 20m lag terdiri
antara hasil yang agak tidak menentu untuk interval 15m dan kehilangan detail dengan
interval 40m lag. Variograms percobaan juga menunjukkan efek penurunan jumlah data;
variograms menjadi lebih tidak menentu dan yang dihitung dari 47 data juga
menunjukkan kerugian yang serius dari varians.
Tabel B.6.2 memberikan model dan parameter yang dipasang ke variograms
percobaan. Ini menunjukkan seberapa sensitif parameter model terhadap perubahan
dalam interval lag dan jumlah data. Untuk 230 data, perbedaan utama dalam parameter
model untuk variograms dihitung dengan interval lag yang berbeda dalam varian nugget,
yang adalah nol untuk 15m lag. Hal ini menunjukkan bahwa data dari sampel transek
telah diselesaikan variasi lokal di tanah lapisan atas K. Ini merupakan pertimbangan
penting ketika merancang skema sampling. Untuk survei grid, akan lebih bermanfaat
memiliki beberapa titik sampling tambahan pada jarak lebih pendek dari interval jaringan
seperti dalam survei ini karena membantu untuk mengurangi varians nugget. Ada 40
sampel poin pada interval yang lebih pendek yang hanya 17 persen dari total data.
14
Gambar B.6.4. Experimental variograms (*) dihitung dengan metode momen (MoM) estimator
untuk jarak lag dari 20m, 15m dan 40m, dan untuk kumpulan data lengkap 230 situs [(a), (b) dan
(c) , masing-masing], bagian dari 94 data [(d), (e), (f)] dan subset dari 47 data [(g), (h), (i)] untuk
humus K pada Yattendon Estate. Garis utuh model dilengkapi dengan variogram MoM dan garis
putus-putus adalah variogram yang diperkirakan oleh residual maximum likelihood (REML)
Parameter model untuk kumpulan data terkecil yang jauh berbeda dari set data lengkap,
menunjukkan bahwa variograms dari set terkecil data tidak akurat dari struktur variasi.
Misalnya, varians sill yang nyata kurang dan rentang spasial ketergantungan
15
Catatan: adalah varian spasial berkorelasi dari komponen spasial jarak jauh, + adalah berbagai
komponen spasial jarak jauh, * adalah parameter jarak dari fungsi eksponensial; untuk
mendapatkan jangkauan kerja a'= 3r
lebih pendek. Tabel B.6.2 menunjukkan bahwa semua model berbatasan dengan fungsi
menunjukkan bahwa variasi memiliki distribusi merata.
Selanjutnya variogram juga dihitung dengan REML untuk interval jaringan 20m,
dan ditampilkan sebagai garis putus-putus pada Gambar B.6.4 (a), (d) dan (g).
Variograms diduga oleh REML untuk dua set data yang lebih besar yang tidak sama
dengan yang dihitung menggunakan MoM sebagai salah satu harapan. Varians sill lebih
besar dari varians data. Kisaran model eksponensial untuk subset dari 94 data juga lebih
lama dari variogram MoM.
Variogram percobaan dihitung dari data hasil tanaman gandum musim dingin
(2001) menunjukkan struktur yang kompleks [lihat Gambar B.6.6 (a)]. Model tetap
terbaik adalah fungsi berbentuk bulat dengan dua komponen spasial; satu dengan jarak
44m dan lainnya 278m. Gambar B.6.6 (b) menunjukkan variogram percobaan dengan
16
model tetap; nugget, pendek dan jangka panjang komponen dari model juga ditampilkan
secara terpisah.
Anisotropi. Gambar B.6.3 (a) menunjukkan arah variogram untuk humus K. Jelas bahwa
varians ambang sesudah lag sekitar 130m. Anisotropi zonal tidak dapat ditangani oleh
transformasi sederhana dari koordinat. Jika daerah dapat dikelompokkan ke dalam zona,
maka ini adalah salah satu cara di mana anisotropi zonal dapat diselesaikan. Model
variogram menunjukkan bahwa variasi tidak merata, yang bisa timbul dari zona istimewa
berorientasi dengan cara yang berbeda.
Arah variogram kemudian dihitung dari residual rata-rata kelas, Gambar B.6.3 (b). Arah
variogram ditunjukkan oleh simbol untuk empat arah dan model isotropik dipasang pada
arah variograms oleh garis hitam tebal untuk kedua data mentah dan residual. Parameter
model juga telah berubah; model tetap terbaik saat ini adalah fungsi pentaspherical
dengan varians ambang kurang dari 1000 dan jarak 91m. Model ini sekarang memiliki
jarak lebih pendek dari ketergantungan spasial, Tabel B.6.2, dan variogram telah diplot
untuk
lag
maksimum
150m
untuk
memperhitungkan
perbedaan
ini.
Gambar B.6.5. Arah variogram dihitung pada data pH dari Broom ini Barn Farm (433 titik
sampling) : (a) dengan model tetap terbaik isotropik (garis tebal), dan (b) dengan fungsi
eksponensial isotropik (garis tebal menunjukkan sampul dari fungsi). Simbol mewakili: *
menandakan 0 (E-W), menunjukkan 45, menunjukkan 90 (N-S), menunjukkan 135, dan
garis tebal adalah model isotropik dipasang pada variograms omnidirectional
17
sangat
berbeda
dari
variasi
18
spasial
44m
dan
278m.
Gambar B.6.6 variogram dari hasil 2001 untuk Yattendon Estate: (a) percobaan variogram
(simbol), dan (b) percobaan variogram dengan model tepat berbentuk bulat ganda (garis tebal);
garis dengan ornamen mewakili komponen model individu
dan disiplin ilmu lainnya. Akibatnya, kriging telah menjadi istilah generik untuk berbagai
metode BLUP leastsquares prediksi spasial dalam geostatistik. Perumusan asli kriging,
sekarang dikenal sebagai kriging biasa (Journel dan Huijbregts 1978), adalah metode
yang paling kuat dan yang paling sering digunakan.
Tipe kriging
Kriging biasa mengasumsikan bahwa rata-rata tidak diketahui dan bahwa proses ini
secara lokal stasioner. Kriging sederhana, mengasumsikan bahwa rata-rata diketahui,
digunakan sedikit karena rata-rata umumnya tidak diketahui. Kriging lognormal adalah
kriging biasa dari data positif miring diubah oleh logaritma untuk mendekati distribusi
lognormal. Kriging dengan tren memungkinkan data dengan komponen deterministik
(proses non-stasioner) yang kuat untuk dianalisis;
Matheron (1982) mengembangkan kriging faktorial atau analisis kriging untuk
variasi bersarang. Cokriging biasa (Matheron 1965) adalah perpanjangan kriging biasa
untuk dua atau lebih variabel yang secara spasial berkorelasi.
Kriging disjungtif (Matheron 1973) adalah metode parametrik non-linear dari
kriging. Indikator kriging (Journel 1982) adalah bentuk non-linear, non-parametrik
kriging di mana variabel kontinu dikonversi ke biner (indikator). Ini bisa menangani
distribusi dari hampir semua jenis dan juga dapat menampung informasi kualitatif
'lembut' untuk meningkatkan prediksi. Probabilitas kriging diusulkan oleh Sullivan
(1984) karena indikator kriging tidak memperhitungkan kedekatan nilai ambang, tetapi
hanya posisi geografisnya. Kriging Bayesian diperkenalkan oleh Omre (1987) untuk
situasi di mana ada beberapa pengetahuan sebelumnya tentang drift atau tren.
Kriging biasa
Dengan menganggap bahwa variabel acak, Z, telah diukur pada titik-titik sampling,
xi ,
i = 1, ... n, dan kami ingin menggunakan informasi ini untuk menduga nilai pada titik
x 0 (kriging tepat waktu) dengan dukungan yang sama seperti data dengan
20
Z^ ( x o )= i z ( x i )
(B.6.29)
i=1
di mana n biasanya merupakan titik data dalam lingkungan lokal, V, dan jauh lebih
sedikit dibandingkan jumlah total sampel, N, dan i adalah bobot. Untuk memastikan
bahwa pendugaan tersebut berisi bobot yang dibuat untuk jumlah untuk satu
n
i=1
(B.6.30)
i=1
2
var [ Z^ ( x 0 ) ]=E {Z^ ( x 0 )Z ( x0 ) } =2 i ( x i , x 0 ) i j ( x i , x j )
di mana
( xi , x j )
i =1
i=1 j=1
xi
dan
xj ,
(B.6.31)
( x i , x0 )
x0 .
Prediksi Kriged sering diperlukan di daerah (blok kriging) yang lebih besar dari
dukungan sampel data. Perkiraan tersebut adalah rata-rata tertimbang dari data,
z ( x 2 ) , ,
z ( x1) ,
Z^ ( B )= i z ( xi )
(B.6.32)
i=1
2
var [ ^Z ( B ) ] =E { Z^ ( B )Z ( B ) } =2 i ( x i , B ) i j ( x i , x j ) ( B , B )
i=1
i=1 j =1
21
(B.6.33)
di mana
B, dan
y ( B , B )
n+1
persamaan
n+1
tidak diketahui
n
i ( x i , x j ) + ( x 0 )= ( x j , x0 ) untuk semua j
i=1
(B.6.34)
i=1
(B.6.35)
i=1
(B.6.36)
di mana A adalah matriks semivariances antara titik data, ( x i , x j ) , b adalah vektor dari
semivariances antara titik data dan target,
( x j , x0)
perkalian jarag lag. Bobot kriging diperoleh sebagai berikut dengan cara membalik
matriks A,
1
=A b
Bobot,
pada
(B.6.37)
2 ( x 0 )= i ( x i , x 0 ) + ( x 0 )
i=1
22
(B.6.38)
2 ( x 0 )=b T
(B.6.39)
Kriging tepat waktu adalah interpolator tepat - nilai kriged di lokasi pengambilan sampel
adalah nilai yang diamati di sana dan varians penduga adalah nol. Sistem kriging yang
setara untuk blok adalah
n
i ( x i , x j ) + ( B )= ( x j , B ) untuk semua j
i= j
(B.6.40)
i=1
(B.6.41)
i=1
( B )= i ( xi , B ) + ( B ) ( B , B )
2
i=1
(B.6.42)
(B.6.43)
Bobot kriging
Bobot kriging tergantung pada variogram dan konfigurasi sampling. Webster dan Oliver
(2007) menggambarkan bagaimana bobot bervariasi sesuai dengan perubahan nugget:
rasio sill, jangkauan, jenis model, sampling konfigurasi dan efek anisotropi. Bobot sangat
sensitif terhadap varians nugget dan anisotropi. Bobot dekat dengan titik atau blok yang
akan diduga membawa lebih banyak beban daripada yang lebih jauh, yang menunjukkan
bahwa kriging adalah prediktor lokal. Sebagai nugget: rasio ambang meningkatkan bobot
dekat dengan penurunan target dan meningkat lebih jauh. Untuk variogram nugget murni,
bobot kriging semua sama dan perkiraan rata-rata dari nilai-nilai di lingkungan. Efek dari
kisaran lebih kompleks daripada nugget: rasio ambang karena juga dipengaruhi oleh jenis
model variogram. Untuk data yang didistribusikan tidak teratur, titik yang berkerumun
membawa berat kurang secara individual daripada yang terisolasi.
23
Fakta bahwa titik-titik terdekat dengan target umumnya membawa paling berat
memiliki implikasi praktis. Ini berarti bahwa lingkungan pencari perlu memuat tidak
lebih dari 16-20 titik data, yang pada gilirannya berarti bahwa matriks A dalam sistem
kriging tidak perlu besar.
Kriging faktorial
Jika variogram dari
Z (x)
variogram individu
1
2
S
( h ) = ( h ) + ( h ) ++ ( h )
(B.6.44)
di mana superscripts merujuk komponen variograms. Jika kita berasumsi bahwa proses
diwakili oleh komponen tidak berkorelasi, maka Persamaan (B.6.44) dapat ditulis sebagai
S
( h ) = bk gk ( h )
(B.6.45)
k=1
di mana
gk ( h )
bk
gk ( h ) penjumlahan tersebut.
Komponen di sisi kanan Persamaan (B.6.45) sesuai dengan S fungsi acak pada
sejumlah bentuk Z ( x ) , yang dapat direpresentasikan sebagai
S
Z ( x )= Z k ( x ) +
(B.6.46)
k=1
di mana
k
Z (x)
24
(B.4.47)
Komponen terakhir,
Z S( x )
gS ( x )
Persamaan
bebas, dan memungkinkan nilai-nilai dari proses yang berkontribusi diduga secara
terpisah oleh kriging faktorial. Setiap komponen spasial
Zk ( x )
diduga sebagai
k
k
Z^ ( x 0 )= i z ( x i )
(B.6.48)
i =1
ki
bobot ditetapkan untuk pengamatan, tapi sekarang harus berjumlah nol, bukan satu,
untuk memastikan bahwa penduga tak bias dan agar sesuai dengan Persamaan (B.6.46).
Sesuai dengan kondisi ini, mereka dipilih untuk meminimalkan varians kriging. Hal ini
menyebabkan sistem kriging
n
kj ( x i , x j ) k ( x0 ) =b k gk ( x i , x 0 ) untuk i=1, , n
(B.6.49)
j=1
kj =0
(B.6.50)
j=1
di mana
k ( x0 )
adalah perkalian jarak lag untuk komponen kth. Sistem persamaan ini
kj
,yang
x0 ,
seperti untuk kriging biasa. Dengan demikian, dari sudut pandang teoritis, hanya perlu
Z ( x ) lokal stasioner. Persamaan (B.6.46) kemudian dapat ditulis kembali sebagai
25
Z ( x )= Z k ( x ) + ( x )
k=1
di mana
(x )
(B.6.51)
jarak jauh. Kita perlu Krige rata-rata lokal, kombinasi linear dari data:
n
^ ( x 0) = mean
z ( x j)
j
(B.6.52)
mean
k k
( x i , x j ) ( x 0 ) =b g ( x i , x 0 ) untuk semua i=1, , n
mean
j
j=1
(B.6.53)
kj =1
(B.6.54)
j=1
Menduga komponen jarak jauh dapat dipengaruhi oleh ukuran lingkungan bergerak (Galli
et al. 1984). Untuk menduga komponen spasial dengan rentang tertentu, jarak di
lingkungan setidaknya harus sama dengan kisaran tersebut. Jika sampling intensif dan
kisaran besar, ada begitu banyak data di dalam lingkungan yang dipilih hanya sebagian
kecil dari mereka yang dipertahankan untuk kriging, dan semuanya dekat dengan target.
Meskipun komputer modern dapat menangani banyak data pada satu waktu, inversi
matriks besar dapat menjadi tidak stabil. Selanjutnya, hanya sedikit data yang dekat
dengan target kontribusi untuk penduga karena mereka menyaring data yang lebih jauh.
Akibatnya, lingkungan digunakan lebih kecil dari yang ditentukan, yang berarti bahwa
berbagai komponen diduga lebih kecil dari yang ditentukan variogram tersebut. Galli et
al. (1984) menyarankan cara untuk mengatasi kekurangan ini dengan memilih hanya
sebagian dari data dalam lingkungan tertentu. Pemilihan seperti itu sewenang-wenang,
dan Jaquet (1989) mengusulkan alternatif yang menyebabkan tambahan perkiraan ratarata lokal untuk menduga komponen jarak jauh. Berikut Oliver et al. (2000), adalah solusi
yang telah diterapkan pada studi kasus di bawah ini:.
B.6.7 Studi Kasus: Kriging
26
Studi kasus menggambarkan aplikasi dari kriging biasa dengan model variogram
isotropik dan dengan anisotropik di mana ada perbedaan terarah pada variasi. Faktorial
kriging diterapkan untuk mengeksplorasi variasi yang dijelaskan terbaik dengan fungsi
variogram bersarang.
Kriging Biasa
Set lengkap data dan dua subset data humus kalium dari Yattendon digunakan untuk
menggambarkan kriging biasa. Prediksi dibuat di tempat tanpa sampel pada node dari
grid 5m 5m oleh tepat waktu biasa dan blok kriging. Minimal tujuh dan maksimal 20
poin batas yang ditetapkan untuk jumlah data dalam lingkungan. Untuk blok kriging,
penduga dibuat lebih dari blok 10m 10m. Parameter dari model variogram dipasang
pada percobaan MoM variograms setiap set data untuk 20m lag (Tabel B.6.2) yang
digunakan dengan data masing-masing untuk kriging. Prediksi kriged dipetakan di
Gsharp. Gambar B.6.7 menunjukkan peta pendugaan blok kriged; tepat waktu kriging
tidak ditampilkan mirip seperti yang ditampilkan. Berdasarkan peta data 230, Gambar
B.6.7 (a), menunjukkan detail variasi humus K dari sampel intensif. Daerah dengan
konsentrasi kecil di mana tanah lebih berpasir dan konsentrasi terbesar berada di sebuah
lembah kering yang membentang dari NW ke SE di lapangan di mana tanah mengandung
lebih banyak tanah liat dan lumpur. Berdasarkan peta ukuran sampel 94, Gambar B.6.7
(b), yang dekat dengan Webster dan Oliver (1992) minimum ukuran yang
direkomendasikan untuk menghitung variogram akurat, menunjukkan fitur utama dari
variasi dalam lapisan tanah atas K, meskipun ada beberapa detail yang hilang. Dari
perspektif manajemen peta ini akan membentuk dasar yang kuat untuk mengelola
aplikasi dari K di bidang ini. Ukuran sampel yang lebih kecil ini merupakan penghematan
hampir 60 persen dalam upaya sampling. Gambar B.6.7 (c) adalah blok kriged peta
berdasarkan 47 data dan hilangnya detail sangat nyata. Jelas bahwa untuk mengurangi
ukuran sampel tingkat ini dianjurkan untuk mengelola aplikasi K di bidang ini.
27
Gambar B.6.7. Peta prediksi blok kriged humus kalium di Yattendon Estate untuk: (a) set
lengkap dari 230 data, (b) subset dari 94 data, dan (c) subset dari 46 data
28
Gambar B.6.8 Peta blok kriged kriging varians untuk humus kalium di Yattendon Estate untuk:
(a) total dari 230 data, (b) subset dari 94 data, dan (c) subset dari 46 Data
Gambar B.6.8 (a), (b) dan (c) menunjukkan peta varians blok kriging untuk tiga ukuran
sampel (230, 94 dan 47, masing-masing); mereka menunjukkan dengan jelas bagaimana
varians dari prediksi meningkat tajam dengan data yang lebih sedikit. Kriging besar
varians di bagian tengah lapangan pada Gambar B.6.8 (a) dan (b) menunjukkan suatu
daerah tanpa titik sampling di mana ada belukar. Gambar B.6.8 (a) menunjukkan
kesalahan terkecil sepanjang transek pendek di mana sampel paling intensif. Gambar
B.6.8 (b) dan (c) juga menunjukkan bahwa varians kriging yang terkecil dekat dengan
titik sampling. Varians besar di sekitar batas lapangan menunjukkan efek tepi di mana ada
data yang lebih sedikit dari prediksi. Peta ini menunjukkan bahwa penghematan sampling
29
untuk ukuran sampel dari 47 hasil pada hilangnya ketepatan dalam prediksi yang bisa
memiliki implikasi untuk manajemen selanjutnya.
Gambar B.6.9 menunjukkan peta kriging varians dari kriging tepat waktu untuk
set data lengkap. Meskipun peta penduga untuk tepat waktu dan blok kriging hampir
tidak bisa dibedakan, peta dari kriging varians sangat berbeda. Varians kriging tepat
waktu jauh lebih besar karena varians nugget menetapkan batasan yang lebih rendah
untuk varians kriging. Untuk blok kriging varians nugget menghilang dari varians blok
kriging [lihat Perssamaan (B.6.31) dan (B.6.37)]. Semakin besar proporsi nugget varians,
semakin besar perbedaan antara blok dan varians kriging tepat waktu.
Kriging dengan model anisotropik
pH data dari Brooms Barn Farm digunakan dengan model anisotropik eksponensial
untuk kriging tepat waktu biasa pada grid 10m 10m. Gambar B.6.10 menunjukkan peta
prediksi. Jelaslah bahwa ada lebih banyak variasi dalam pH dari SSE ke NNW pada sudut
kanan sebagai model pada Tabel B.6.2.
Gambar B.6.9. Peta kriging tepat waktu kriged varians untuk humus kalium di Yattendon Estate
untuk set lengkap 230 data
30
Gambar B.6.10. Peta prediksi tepat waktu kriged untuk pH humus pada Brooms Barn Farm
31
Gambar B.6.11. Peta hasil gandum tahun 2001 di Yattendon Estate (a) prediksi kriged biasa, (b)
prediksi komponen jangka panjang dari variasi, dan (c) prediksi komponen jarak pendek dari
variasi
Untuk data yang intensif seperti monitor hasil, model elevasi digital dan satelit, kriging
faktorial adalah teknik yang berharga untuk mengeksplorasi variasi pada skala spasial
yang berbeda.
32
C.1.1 Pendahuluan
Model regresi spasial memungkinkan kita untuk memperhitungkan ketergantungan antara
pengamatan, yang sering muncul ketika pengamatan yang dikumpulkan dari poin atau
wilayah terletak di ruang angkasa. Contoh pengamatan titik-tingkat akan rumah individu,
perusahaan, atau sekolah. Pengamatan daerah bisa mencerminkan rata-rata pendapatan
rumah tangga daerah, jumlah tenaga kerja atau tingkat penduduk, tarif pajak, dan
sebagainya. Skala spasial daerah sering sangat beragam (misalnya, daerah Uni Eropa,
negara, atau wilayah administratif seperti zona pos atau saluran sensus).
Untuk pengamatan tingkat daerah kita dapat mengandalkan koordinat lintangbujur dari titik yang terletak di wilayah ini, mungkin titik pusat. Hal ini umumnya
diamati bahwa sampel data yang dikumpulkan untuk daerah atau titik dalam ruang tidak
independen, melainkan positif spasial dependent, yang artinya bahwa pengamatan dari
satu lokasi cenderung menunjukkan nilai-nilai yang sama dengan lokasi terdekat.
Data generating process (DGP) menghasilkan sampel data menentukan jenis
ketergantungan spasial. Tentu saja, kita tidak pernah benar-benar tahu DGP, sehingga
dianjurkan menerapkan pendekatan alternatif untuk situasi pemodelan. Salah satu
pendekatannya adalah dengan mengandalkan model spesifikasi fleksibel yang dapat
memuat berbagai kemungkinan proses menghasilkan data yang berbeda. Misalnya,
Lesage dan Pace (2009) menggunakan spatial Durbin model (SDM), karena sejumlah
model bersarang lainnya sebagai kasus khusus.
Pendekatan kedua akan bergantung pada jenis ekonomi atau lainnya teori untuk
memotivasi DGP.
Pendekatan ketiga mungkin mengandalkan argumen murni ekonometrik yang
mendukung penggunaan model tertentu untuk melindungi heterogenitas, dihilangkan
33
variabel atau jenis lain dari masalah yang timbul saat diterapkan dalam prakteknya.
Misalnya, Lesage dan Pace (2008) menunjukkan bahwa dalam kasus model interaksi
spasial jenis dibahas dalam Bab C.3, variabel dihilangkan atau pengaruh teramati laten
akan mengarah pada model yang mencakup lag spasial variabel dependen.
Pendekatan keempat secara resmi menggabungkan ketidakpastian mengenai DGP
menjadi pendugaan dan cara menyimpulkan, yang digambarkan dalam Bab C.4.
Model regresi konvensional biasa digunakan untuk menganalisis penampang dan
panel data menganggap bahwa pengamatan independen satu sama lain. Prinsip mendasar
analisis regional adalah bahwa daerah yang terletak di dekatnya cenderung lebih mirip
daripada yang dipisahkan oleh jarak yang jauh. Ini berarti bahwa ketergantungan spasial
positif tampaknya lebih masuk akal daripada kemerdekaan spasial ketika menganalisis
sampel data regional.
Sebagai contoh, model regresi konvensional yang berhubungan komuter waktu
kerja untuk wilayah i untuk jumlah orang di daerah i diasumsikan bahwa komuter waktu
independen dari mereka untuk orang yang terletak di daerah sekitar j. Karena tidak
mungkin daerah i dan j tidak berbagi bagian dari jaringan jalan, kita mengharapkan
asumsi ini tidak realistis. Selain kurangnya realisme, mengabaikan pelanggaran
independensi antara pengamatan dapat menghasilkan penduga yang bias dan tidak
konsisten.
Dalam komuter waktu misalnya, mungkin tampak intuitif menarik untuk menyertakan
rata-rata variabel dependen pengamatan dari daerah lain di dekatnya sebagai variabel
penjelas sisi kanan dalam model regresi cross-sectional. Hal ini mengakibatkan
perpanjangan model regresi untuk pengamatan i mengambil berbentuk seperti
ditunjukkan pada Persamaan (C.1.1), di mana sampel mengandung n pengamatan
n
j=1
r =1
y i= W ij y j + X ir r + i
(C.1.1)
34
X ir , r=1, , k
yi , k
i .
kami menggunakan
W ij
W ij y j
j=1
mewakili nilai
skalar sama dengan rata-rata nilai yang diambil oleh delapan daerah sekitar wilayah i.
Skalar dalam model yang diberikan oleh Persamaan (C.1.1) adalah parameter yang
akan diduga untuk menentukan kekuatan rata-rata (lebih dari semua pengamatan i=
1, ...,n) hubungan antara nilai-nilai variabel dependen untuk daerah/pengamatan dan ratarata nilai untuk daerah sekitarnya .
Dalam kasus yang melibatkan kisi yang tidak teratur atau pengamatan titik ini
menjadi pertimbangan dalam menentukan model regresi spasial. Misalnya, orang bisa
menggunakan beberapa nomor tetap tetangga terdekat untuk kasus kisi tidak teratur,
sejumlah tetangga yang dipilih menggunakan jarak cut-off atau beberapa definisi
persentuhan lain seperti kedekatan berbasis Rook sebagai pengganti kedekatan
'Queenbased'. Kebijaksanaan konvensional adalah bahwa spesifikasi dari matriks W
memberikannya banyak pengaruh pada penduga dan kesimpulan mengenai parameter
model ini.
Ini harus jelas bahwa jika parameter = 0, kita memiliki model regresi
k
konvensional:
35
rata nol, varians konstan, nol kovarians, gangguan distribusi normal, misalnya,
N ( 0, 2 I n ) , di mana kita menggunakan i untuk menunjukkan matriks identitas n
oleh n. Parameter skalar dan vektor
2
skalar merupakan parameter model yang diduga. DGP terkait untuk model ini yang
kami beri label SAR ditunjukkan pada Persamaan (C.1.3), dan nilai yang diharapkan atau
prediksi dari model ini ditunjukkan pada Persamaan (C.1.4).
y=W y + X +
(C.1.2)
1
y=( I n W ) X + ( I nW )
(C.1.3)
E ( y )=( I nW )1 X
(C.1.4)
N ( 0, 2 I n )
(C.1.5)
pengamatan
dalam
matriks
X.
Hal
ini
menyebabkan
W
I n
E.
E [ 1 ] =( I nW )1 E [ ] =0
Tentu saja ada cara lain kita bisa membayangkan ketergantungan spasial yang
timbul sebagai bagian dari DGP dan ini mengarah ke ekstensi lain dari model regresi
konvensional. Sebagai contoh, mungkin kasus ketergantungan hanya muncul dalam
proses gangguan yang mengarah ke model dalam Persamaan (C.1.6) (yang kami beri
label SEM), terkait DGP di Persamaan (C.1.7), dan harapan dalam Persamaan (C.1.8).
y= X+u
(C.1.6a)
36
u= W u+
(C.1.6b)
1
y= X+ ( I nW )
(C.1.7)
E ( y )=X
(C.1.8)
N ( 0, 2 I n )
(C.1.9)
Elaborasi lain dari model dasar salah satunya yang kita beri label SDM ditampilkan
dalam Persamaan (C.1.10) dengan DGP terkait dalam Persamaan (C.1.11) dan harapan
dalam Persamaan (C.1.12). Dalam menetapkan model SDM kita perlu memisahkan
W =I n
dimana vektor
variabel dependen dilambangkan dengan matriks Wy, dan lag spasial variabel penjelas
dilambangkan dengan produk matriks W X selain jelas variabel konvensional X. Matriks
produk W X menciptakan rata-rata nilai variabel penjelas dari daerah yang ditambahkan
ke set variabel penjelas sekitarnya.
y=W y + n + X+WX +
(C.1.10)
y=( I n W )1 ( n + X+WX+ )
E ( y )=( I nW )1 ( n + X +WX )
(C.1.12)
N ( 2 I n)
(C.1.13)
(C.1.11)
u=( I n W )1
37
u=( I n W )
daripada
Model SEM memiliki harapan yang sama dengan model regresi konvensional di
mana indepndent antara pengamatan variabel dependen adalah bagian dari hipotesis yang
dipertahankan. Dalam sampel besar, penduga titik untuk parameter
dan regresi konvensional akan sama, tetapi dalam sampel kecil mungkin ada keuntungan
efisiensi dari pemodelan ketergantungan spasial dalam proses dislokasi. Sebaliknya,
model SAR dan SDM kadang-kadang disebut model lag spasial (karena mengandung
istilah
Wy
serta .
C.1.2 Penduga Model Lag Spasial
Dari DGP terkait dengan model SAR, jelas bahwa ada istilah Jacobian terlibat dalam
transformasi dari
pada Persamaan (C.1.14) - (C.1.16) (lihat Ord 1975), di mana adalah vektor n oleh 1
yang mengandung nilai-nilai eigen dari matriks W. Lesage dan Pace (2009, Bab 4)
memberikan pembahasan yang melibatkan eigen kompleks yang timbul untuk jenis
tertentu dari bobot spasial matriks W.
ln L=
1 ( 2 )
eT e
ln +ln |I nW | 2
2
2
(C.1.14)
e= y W y X
(C.1.15)
[ min ( )1 , max ( )1 ]
Manipulasi
sederhana
yWy= X+
model
SAR
(C.1.16)
ditampilkan
dalam
Persamaan
(C.1.2):
dan
38
=( X X ) X ( I nW ) y
likelihood.
Kami
mengganti
1
e e=( yWy X ) ( y Wy X ) n
parameter
di mana
dengan
Konsentrasi full likelihood dalam hasil mode dalam masalah optimasi univariat lebih dari
parameter . Mengingat penduga maximum likelohood untuk , yang diberi label *, kita
dapat menggunakan penduga ini untuk memulihkan penduga maximum likelihood untuk
parameter
=( X T X )
( I n W ) y .
Sebuah alternatif untuk mengatasi apa yang telah dianggap sebagai kesulitan
komputasi terkait dengan penduga maximum likelihood adalah mengandalkan metode
penduga not likelihood based. Contohnya pendekatan variabel instrumental Anselin
(1988, pp.81-90), variabel instrumen/generalized moments estimstor dari Kelejian dan
Prucha (1998, 1999), atau metode entropi maksimum Marsh dan Mittelhammer (2004).
Metode alternatif mengalami beberapa kelemahan. Salah satunya adalah bahwa mereka
dapat menghasilkan penduga parameter ketergantungan ( dalam diskusi kami) berada di
luar interval yang ditentukan oleh batas-batas nilai eigen yang timbul dari matriks W.
Selain itu, prosedur inferensial untuk metode ini sensitif terhadap isu-isu implementasi
seperti interaksi antara pilihan instrumen dan spesifikasi model, yang tidak selalu jelas
bagi praktisi.
Alternatif model spesifikasi seperti eksponensial matriks spasial diperkenalkan
oleh Lesage dan Pace (2007) yang berlabel MESS yang dapat diduga menggunakan
maximum likelihood atau metode Bayesian. Model regresi spesifikasi spasial ini dapat
digunakan dalam situasi di mana model DGP adalah SAR atau SDM untuk menghasilkan
penduga setara dan kesimpulan. Model MESS menghilangkan istilah determinan dari
fungsi likelihood, memungkinkan maximum likelihood dan penduga Bayesian model
untuk sampel spasial yang besar. Lesage dan Pace (2007) memberikan solusi bentuk
tertutup untuk penduga model ini. Hal ini juga memungkinkan untuk menghasilkan solusi
bentuk tertutup untuk penduga maximum likelihood dari SAR, SDM dan model SEM
39
dibahas di sini, sebuah inovasi terbaru yang diperkenalkan oleh Lesage dan Pace (2009).
Pendekatan ini sangat mengurangi motivasi ketergantungan pada metode non likelihoodbased yang secara tradisional menganjurkan kerja-sekitar untuk kesulitan komputasi yang
dirasakan dari penduga maximum likelihood. Kesulitan-kesulitan ini telah banyak
diselesaikan dengan kemajuan terbaru yang dijelaskan dalam Lesage dan Pace (2009).
The bias of least-squares
Sebagaimana dicatat, salah satu fokus kesimpulan adalah besarnya dan pentingnya
parameter , karena ini membedakan model SAR dari konvensional regresi dan
memberikan informasi mengenai kekuatan ketergantungan spasial antara pengamatan
variabel dependen.
Kontras penduga maximum likelihood * dari kuadrat yang berlabel
^ ,
()
( ) [(
(C.1.17)
^ = y T W T ( wy X )
^
XT
] ( ) [(
1
y W
XT
yW W y
y=
XT W y
y W X
XT X
)] (
yT X T y
XT y
(C.1.18)
Jika kita berasumsi kovarians nol (atau orthogonality) antara W y dan X, matriks inverse
dalam Persamaan (C.1.18) menjadi diagonal memiliki inverse analisis sederhana, yang
T
^=( y W Wy ) y W y .
mengarah ke:
plim ( ^ )= , berlaku
1
40
( y T W T Wy ) y T W T X+ ( y T W T Wy ) y T W T
1
( y T W T Wy ) y T W T
(C.1.19)
y T W T X =0 . Sekarang
plim ( y T W T Wy ) yT W T .
T
T
Istilah: Q= plim ( 1/n ) ( y W Wy )
yang terbatas dengan pembatasan wajar/asumsi yang dibuat dalam aplikasi khusus.
Kami mengalihkan perhatian dengan istilah:
model DGP:
R= plim ( 1/n ) y W
(C.1.20)
T
R= plim ( 1/n ) [ ( I n pW )1 ( X + ) ] W T
R= plim ( 1/n ) T ( I n pW )1 W T
(C.1.21)
(C.1.22)
^= + R
(C.1.23)
Harus jelas bahwa Plim (operator batas probabilitas) dari bentuk kuadrat dalam gangguan
ditunjukkan pada Persamaan (C.1.22), tidak sama dengan nol kecuali dalam kasus sepele
di mana = 0, atau jika matriks W segitiga tepat. Sebagaimana dicatat, di bawah asumsi
penyederhanaan Wy dan X tidak berkorelasi, kebalikan matriks dalam Persamaan (C.1.18)
menjadi
diagonal
memiliki
inverse
analisis
sederhana,
yang
mengarah
ke:
^=( X T X )1 X T y . Ini harus jelas bahwa bukti serupa inkonsistensi dapat dibangun
untuk penduga kuadrat vektor parameter. Seperti telah disebutkan penduga maximum
41
Sebuah alternatif untuk penduga maximum likelihood adalah penduga Bayesian Markov
Chain Monte Carlo (MCMC) yang ditetapkan dalam Lesage (1997) untuk model SAR.
Kami menunjuk distribusi posterior menggunakan
merupakan parameter ,
( D )
p (D), di mana
( D )
cukup
besar, kita bisa mendekati bentuk kepadatan posterior menggunakan estimator densitas
kernel atau histogram, menghilangkan kebutuhan untuk mengetahui bentuk analisis yang
tepat dari kepadatan rumit ini. Statistik sederhana juga bisa digunakan untuk membangun
sarana dan varians didasarkan pada nilai-nilai sampel yang diambil dari posterior.
Parameter
dan
secara berurutan distribusi bersyarat dari dua set parameter, sebuah proses yang dikenal
sebagai Gibbs sampling, karena asal-usulnya dalam analisis citra (gambar), (Geman dan
Geman 1984). Distribusi bersyarat untuk parameter berbentuk distribusi normal
multivariat (untuk ) dan distribusi Gamma invers (untuk
telah diberi label bolak pengambilan sampel kondisional, yang tampaknya deskripsi lebih
akurat dari prosedur.
Seperti yang sudah dibahas dalam diskusi kami memusatkan fungsi kemungkinan,
parameter vektor
merupakan
rata-rata
1
normal
1
T
T
2
T
N ( X X ) X ( I n W ) y , ( X X )
=( X T X ) X T ( I nW ) y , yang
distribusi
bersyarat
42
posterior
2 ( XT X )
, untuk
membangun hasil imbang normal multivariat untuk k oleh 1 parameter vektor . Kami
mencatat bahwa kemampuan untuk mengkondisikan parameter
(yang menganggap
itu dikenal) inilah yang menjadikan perhitungan ini dan multivariat yang normal imbang
sederhana. Demikian pula, distribusi posterior bersyarat untuk parameter
1996). Statistik ini mirip dengan t-rasio untuk sampel besar, dan dapat digunakan tstatistik untuk pengujian hipotesis.
Wald inferensi menggunakan versi analitis atau numerik dari Hessian. Ini dapat
digunakan untuk membangun regresi konvensional t-statistik. Masalah implementasi
adalah bahwa membangun Hessian analitis (atau matriks informasi) melibatkan
1
43
Dari perspektif kecepatan perhitungan ekspresi vektor dari Pace dan Barry (1997)
untuk cepat mengevaluasi fungsi log-likelihood membuat Hessian murni numerik layak
untuk model ini. Namun, ada beberapa kelemahan menerapkan pendekatan ini dalam
perangkat lunak untuk penggunaan umum, karena praktisi sering bekerja dengan data
sampel yang kurang baik dan data sampel multicollinear. Data tersebut dapat menurunkan
akurasi penduga numerik dari derivatif populating Hessian. Titik kedua adalah bahwa
optimasi univariat berlangsung menggunakan kemungkinan terkonsentrasi sehubungan
dengan parameter
dan
(C.1.24)
(C.1.25)
44
Pernyataan model dalam persamaan (C.1.26) dapat diartikan sebagai nilai yang
diharapkan dari setiap pengamatan y akan bergantung pada nilai rata-rata ditambah
kombinasi linear dari nilai-nilai yang diambil oleh pengamatan skala oleh parameter
ketergantungan
, , ,
W ,W ,
yang
muncul dalam Persamaan (C.1.26), di mana kita asumsikan bahwa baris dari bobot
matriks W dibangun untuk mewakili orde pertama berdekatan. Matriks W akan
mencerminkan orde kedua berdekatan, yang adalah tetangga orde pertama. Karena
tetangga dari tetangga (orde kedua tetangga) untuk pengamatan i meliputi pengamatan i
sendiri,
W 3 X
dan
yang
45
Xt
seperti
, ditambah pengamatan
y t =W y t 1+ X+ t
y t1
(C.1.27)
di sisi kanan Persamaan (C.1.27) dengan
lim E ( y t )=lim E ( I n + W + W ++
qt
q t
q1
q1
) X+ q W q y t q +u ] ( I nW )1 X
(C.1.28)
Kami menyimpulkan bahwa harapan jangka panjang model Persamaan (C.1.27), dapat
diartikan sebagai memiliki keseimbangan steady state yang berbentuk konsisten dengan
proses menghasilkan data untuk model SAR cross-sectional. Dengan kata lain, umpan
balik simultan adalah fitur dari keseimbangan steady-state untuk model regresi spasial
yang mencakup lag spasial variabel dependen. Dalam konteks model SAR statis crosssectional di mana kita memperlakukan sampel yang diamati sebagai cermin keadaan hasil
ekuilibrium stabil, efek umpan balik ini muncul sesaat, tetapi harus diinterpretasikan
menuju gerakan steady state berikutnya.
Interpretasi parameter
Lesage dan Pace (2009) menunjukkan bahwa interpretasi dari vektor parameter
dalam model SAR berbeda dari interpretasi kuadrat terkecil konvensional. Dalam
46
kuadrat-rth parameter,
, dari vektor
terhadap perubahan variabel penjelas rth dari matriks X, yang kita tulis sebagai
Xr
perubahan pengaruh
y j , di mana j i .. Jenis
( I nW ) y= X+
(C.1.29)
y= S r ( W ) X r +V ( W )
r=1
S r ( W )=V ( W ) ( I n r )
V (W )=( I nW )1=I n+ W + 2 W 2+ 3 W 3 +
Untuk menggambarkan peran
(C.1.30)
(C.1.31)
(C.1.32)
() (
)( )
r =1
yn
S r ( W )n 1 S r ( W )n 2 S r ( W )nm X nr
(C.1.33)
y i= [ ( S r ) ( W )i 1 X 1 r +S r ( W )i 2 X 2 r ++ Sr ( W ) X nr ] +V ( W )i ln+V ( W )i
(C.1.34)
r=1
yi
terhadap
X jr
berbentuk
Sr
(C.1.35)
Berbeda dengan kasus kuadrat terkecil, turunan dari y terhadap X tidak sama untuk
dan turunan dari
y i untuk
X jr untuk
j i
(C.1.36)
dinotasikan dengan
X ir on
yi
X r
48
yi
Sr ( W )
yang dihasilkan
dari mengubah variabel penjelas rth denga jumlah seluruh pengamatan n (misalnya,
X r + n di mana
yi
X jr + ). Rata-rata
jumlah baris atau jumlah kolom akan menghasilkan jumlah yang sama, yang
merupakan dampak keseluruhan.
c.
Rata-rata dampak tidak langsung. Ini adalah definisi perbedaan antara
dampak keseluruhan dan langsung. Dampak ukuran ringkasan ini mencerminkan apa
yang umumnya dianggap sebagai spillovers spasial, atau dampak yang jatuh di daerah
selain daerah sendiri.
Lesage dan Pace (2009) menunjuk ke sebuah perbedaan interpretasi antara keseluruhan
ukuran ringkasan dampak rata-rata yang timbul dari rata-rata jumlah baris dibandingkan
rata-rata jumlah kolom. Meskipun dua ringkasan skalar ini sama, rata-rata jumlah baris
bisa dilihat sebagai cerminan (rata-rata) jumlah dampak keseluruhan ke pengamatan,
sedangkan rata-rata jumlah kolom lebih tepat diartikan sebagai (rata-rata) jumlah dampak
keseluruhan dari sebuah pengamatan.
Untuk menguraikan perbedaan antara dua sudut pandang interpretatif ini,
perhatikan situasi modeling di mana pusat bunga mengenai bagaimana krisis keuangan di
satu negara/penyebarluasan pengamatan untuk menghasilkan penularan di pasar
keuangan negara-negara lain (Kelejian et al. 2006). Situasi ini dapat dilihat sebagai
perubahan dalam jth pengamatan/negara (misalnya,
49
r r =Tn Sr ( W ) , sama
n1 r r n
yang juga
1 T
n n Sr ( W ) n .
berbentuk sederhana dalam Persamaan (C.1.37) untuk model yang bergantung pada barisstokastik matriks W (dimana jumlah baris sama dengan satu).
n1 Tn Sr ( W ) n =n1 Tn ( I nW )1 r n=( 1 )1 r
(C.1.37)
Satu hal yang perlu diperhatikan adalah dampak langsung rata-rata untuk model ini tidak
sama dengan koefisien seperti pada kasus model regresi konvensional. Perbedaan
antara penduga koefisien r dan ukuran ringkasan skalar dari dampak langsung rata-rata
muncul dari umpan balik yang mencerminkan bagaimana perubahan awal dalam
menimbulkan dampak pada daerah sekitar
yj
yi
( 1 )1 r
dimana Lesage
dan Pace (2009) memberikan metode komputasi yang efisien. Ingat bahwa kita perlu
untuk melakukan perhitungan ini ribuan kali menggunakan simulasi nilai parameter atau
MCMC gambaran untuk menentukan langkah-langkah empiris dispersi. Langkah-langkah
ini digunakan untuk menentukan signifikansi statistik dari dampak langsung, tidak
langsung dan jumlah yang terkait dengan berbagai variabel penjelas dalam model, dengan
cara yang sama untuk menggunakan t-statistics dalam model regresi konvensional. Pada
model yang lebih rumit seperti SDM, langkah-langkah ringkasan skalar dampak
berbentuk lebih rumit, tapi Lesage dan Pace (2009) memberikan pendekatan komputasi
yang efisien untuk mengevaluasi ekspresi ini.
Sebuah ilustrasi diterapkan pendekatan simulasi untuk menentukan langkahlangkah dispersi untuk diduga dampak ringkasan skalar dapat ditemukan di Bab E.1.
Ilustrasi lain diberikan dalam Lesage dan Fischer (2008) dalam konteks metode rata-rata
model yang dibahas dalam Bab C.4.
Heterogenitas spasial, ketergantungan spasial, dan dampak
51
(C.1.38)
(1 )
( 2)
(k )
E ( y )= X 1 + X 2 + X k
(r )
ii = r r=1, , k , i=1, ,n
(r )= (r )
(C.1.39)
(C.1.40)
(C.1.40)
Jelas, dalam model linear biasa dampak perubahan variabel penjelas adalah sama di
seluruh pengamatan dan perubahan variabel penjelas untuk satu pengamatan tidak
mempengaruhi yang lain.
Bagaimana jika kita memberi bobot menurun geometris untuk nilai-nilai
parameter di sekitarnya, termasuk parameter pada tetangga dari tetangga, dan sebagainya
seperti yang ditunjukkan pada Persamaan (C.1.42). Mengingat rumus untuk ekspansi seri
tak terbatas, ini mengarah ke Persamaan (C.1.43). Menariknya, matriks parameter tersirat
oleh proses ini sama dengan dampak matriks
Seperti sebelumnya, kita dapat melihat nilai yang diharapkan dari variabel dependen
sebagai jumlah dampak dari semua variabel penjelas seperti pada Persamaan (C.1.44).
(r )=I n B( r) + W B (r )+ 2 W 2 B(r ) +
(r )=( I nW )1 B( R)=S r ( W )
52
(C.1.42)
(C.1.43)
E ( y )=S1 ( W ) X 1+ S 2 ( W ) X 2+ +S k (W ) X k
(C.1.44)
53