Professional Documents
Culture Documents
Introduo, 9
Breve histrico da Geoestatstica, 9 Objetivos, 12 Organizao do livro, 12
1 Conceitos Bsicos, 19
1.1 Fenmeno espacial, 19 1.2 Amostra e mtodos de amostragem, 20 1.3 Inferncia espacial, 21 1.4 Variveis aleatria e regionalizada, 24 1.5 Desagrupamento, 26
3 Estimativas Geoestatsticas, 55
3.1 Transformao de dados, 56 3.2 Estimativas geoestatsticas, 62 3.3 Krigagem no linear, 83 3.4 Interpolao de variveis categricas, 106 3.5 Consideraes nais, 117
do corpo de minrio; avaliao e mapeamento de incertezas; parametrizao das reservas minerais em curvas teor/tonelagem, bem como varincia global do depsito mineral. Como fontes introdutrias so recomendados os livros de Clark (1979), Rendu (1981), Armstrong (1998), Brooker (1991), Clark e Harper (2000), Andriotti (2003), Landim (2003), Druck et al. (2004) e Olea (2009). Devem ser citados tambm diversos textos que tratam de aplicaes da Geoestatstica, como Journel e Huijbregts (1978), Valente (1982), Guerra (1988), Isaaks e Srivastava (1989), Deutsch e Journel (1992), Cressie (1993), Samper-Calvete e Carrera-Ramrez (1996), Goovaerts (1997), Hohn (1999), Olea (1999), Yamamoto (2001a), Soares (2006), Webster e Oliver (2007) e Oliver (2010). Um extenso estudo bibliomtrico sobre textos, tanto em livros como em artigos, relativos Geoestatstica apresentado por Hengl, Minasny e Gould (2009). Nesse trabalho, como referncia origem geogrca dos autores, a Amrica do Sul, so destaques as regies de So Paulo/Brasil e Santiago/Chile (Hengl; Minasny; Gould, 2009, p. 508).
O BJETIVOS
O principal objetivo deste livro, baseado na experincia dos dois autores, mostrar de maneira clara, simples e objetiva a metodologia geoestatstica em suas diversas aplicaes. Dedica-se principalmente anlise de dados geolgicos controlados pela sua distribuio espacial, mas pode perfeitamente ser utilizada em outras reas que disponham tambm de dados georreferenciados. A teoria geoestatstica foi baseada na literatura corrente, que foi referenciada com a maior preciso possvel, indicando autor, ano e pgina.
O RGANIZAO
DO LIVRO
Geoestatstica: conceitos e aplicaes est organizado em cinco captulos. Evidentemente, o texto no tem a pretenso de cobrir todas as tcnicas e campos de aplicao da Geoestatstica, mas introduzir conceitos e tcnicas fundamentais atualmente em uso. O Cap. 1 aborda conceitos bsicos envolvendo amostra e populao (fenmeno espacial), mtodos de amostragem, o problema da inferncia espacial (Fig. 2) e a natureza das variveis aleatrias contnuas e discretas. importante ressaltar que o estudo geoestatstico tem incio com a coleta de uma amostra, que ser usada para inferir as caractersticas da populao ou do fenmeno espacial de interesse da pesquisa. A amostragem deve ser feita em disposio regular ou o mais prximo disso, mas podem ocorrer amostragens preferenciais em zonas de maior interesse que acabam produzindo agrupamentos de pontos. Esses agrupamentos devem ter seus efeitos atenuados para no distorcer as estatsticas globais, tais como o histograma e o variograma. Assim, so apresentadas duas tcnicas de desagrupamento de amostras (polgonos e clulas). Atualmente, os conceitos da Geoestatstica podem ser aplicados tanto a variveis contnuas como a discretas. Nesse sentido, abre-se uma gama de aplicaes envolvendo
12
40
?
20
20
40
Amostragem
40
40
40
20
20
20
0 0
3,13712
0 20
16,09888
0 0 20
14,39134
40
40
0
25,82543 4,14811
20
15,40782
40
26,66753
29,06064 2,95726
Estimativa espacial
40
40
40
20
20
20
20
16,09888
40
0 0 20
14,94972
0 40
20
15,40782
40
26,66753
3,13712
29,06064 2,95726
26,94217 4,14811
Inferncia espacial
Fig. 2 Esquema mostrando o processo de inferncia do fenmeno espacial com base na amostragem (seo 1.3) variveis discretas, pois elas so frequentemente observadas nos pontos de amostragem em que so feitas medidas de variveis contnuas. O Cap. 2 voltado ao clculo e modelagem de variogramas experimentais, e introduz os conceitos de estacionaridade, hiptese intrnseca, clculo de variogramas expe-
Introduo
13
rimentais, modelos tericos de variogramas, anisotropias e graus de continuidade na origem. Uma sntese do procedimento de clculo e modelagem de variogramas experimentais pode ser vista na Fig. 3. O variograma depende fundamentalmente da direo e da distncia, as quais permitem calcular o variograma experimental e vericar a hiptese intrnseca (Fig. 3C,D). O Cap. 3 apresenta tcnicas geoestatsticas de estimativa e interpolao para variveis aleatrias contnuas e discretas (Fig. 4). Os mtodos geoestatsticos de estimativa foram divididos em krigagem linear e no linear. As tcnicas da krigagem simples, da mdia e ordinria foram includas como tcnicas lineares, pois fazem uso da varivel contnua na escala original de medida. Mtodos que fazem uso da transformao no linear de dados foram classicados como krigagem no linear: krigagem multigaussiana, krigagem lognormal e krigagem indicadora. Alm disso, este captulo apresenta uma seo especial
A
Y 50
B
40 Gama(h) 10 8 6 Direo e distncia 20 4
30
E
2
0 0 5 10 15 20 25 h
Z(x)
Z(x)
H
8,07 Variograma 6,46 4,84 3,23 1,61 0,00 0 5 10 15 20 25 Distncia
Fig. 3 Sntese do procedimento de clculo e modelagem de variogramas experimentais: A) mapa de pontos; B) variogramas experimentais
calculados para as direes de 45 (vermelho) e 135 (azul); C) vetores usados no clculo do variograma experimental para a direo de 45; D) vetores usados no clculo do variograma experimental para a direo de 135; E) destaque para o comportamento prximo origem, com alta continuidade; F) interpretao geomtrica de Journel (1989) para a direo de 135; G) interpretao geomtrica de Journel (1989) para a direo de 45; H) modelos tericos ajustados aos variogramas experimentais (seo 2.6)
14
Variveis regionalizadas
Contnuas
Discretas
% 20
15 10 5 0
%
80 60 40 20 0
% 30
25 20 15 10 5
0,08
6,25
12,42
18,58
24,75
30,92 45,20
47,36
49,52
51,68
53,84
56,00
0,03
7,98
15,93
23,88
31,83
39,79
Tipos
Zgauss
Znegativo
Zlog
Dados originais
Codificao binria
Gaussiana
Logartmica
Indicadora
Krigagem ordinria
Krigagem multigaussiana
Krigagem lognormal
Krigagem indicadora
Equaes multiqudricas
(seo 3.1)
sobre interpolao de variveis categricas baseada em equaes multiqudricas, pois o clculo de variogramas experimentais depende fortemente dos tipos e sua distribuio no espao amostral. O Cap. 4 trata das coestimativas geoestatsticas, como a cokrigagem ordinria, cokrigagem colocalizada e krigagem com deriva externa. Essas tcnicas utilizam diferentes conguraes de pontos de amostragem, que devem ser consideradas para fazer o melhor uso da informao disponvel. A krigagem com deriva externa deveria ser abordada no Cap. 3, porm tratada no Cap. 4 por compartilhar das mesmas amostras para o seu teste. Quando trataram da krigagem com deriva externa, no Cap. 4, os autores se depararam com diculdades na obteno do variograma residual. Desse modo, com base no clculo do variograma da mdia com os dados de deriva externa, uma nova aproximao foi proposta para o clculo do variograma residual. A sntese dos procedimentos de coestimativas geoestatsticas encontra-se na Fig. 5. O Cap. 5 aborda a simulao estocstica, notadamente os mtodos sequenciais, entre os quais so consideradas a simulao gaussiana sequencial, com opo tanto pela krigagem simples como pela ordinria, e a simulao indicadora sequencial, para variveis contnuas
Introduo
15
A
Y: Norte Y: Norte
50
B
Y: Norte
0 10 20 30 40 50 X: Leste 50 50
40
40
40
30
30
30
20
20
20
10
10
10
10
20
30
40 50 X: Leste
10
20
30
40 50 X: Leste
VP
Cokrigagem ordinria
D
Cokrigagem colocalizada Krigagem com deriva externa
VS1
Variograma residual
E
Variograma
25 20 15 10 5 0 0 5 10 15 20 25 Distncia
F
25 20 15 10 5 0 0 5 10 15 20 25 Distncia
G
Variograma residual
0,5 0,4 0,3 0,2 0,1 0,0 0 5 10 15 20 25 Distncia
Covariograma
30
30
H
Y: Norte Y: Norte
50 50
I
Y: Norte
0 10 20 30 40 50 X: Leste 50
40
40
40
30
30
30
20
20
20
10
10
10
10
20
30
40 50 X: Leste
10
20
30
40 50 X: Leste
Fig. 5 Sntese dos mtodos de coestimativas geoestatsticas: A) mapa de localizao de pontos com heterotopia parcial; B) mapa de localizao
de pontos com isotopia; C) mapa de localizao de pontos da varivel secundria sobre os ns de uma malha regular; D) correlao entre a varivel primria e a varivel secundria; E) modelos de variogramas diretos (vermelho = varivel primria; verde = varivel secundria) e cruzado (vermelho); F) covariograma da varivel primria (vermelho) e covariograma cruzado calculado por modelo de Markov 1 (azul); G) variograma residual; H) resultado da cokrigagem ordinria; I) resultado da cokrigagem colocalizada; J) resultado da krigagem com deriva externa (seo 4.3)
e discretas (Fig. 6). A opo pela krigagem ordinria para a simulao gaussiana sequencial foi includa, pois a interpretao dos pesos da krigagem ordinria como probabilidades condicionais permite a determinao da funo de distribuio acumulada condicional,
16
Y: Norte
Y: Norte
Y: Norte
40 30 20 10 0 0
12 20 9 16 1
10
2 5 11 4 10
20
13 15 18 6 24
30
17 14 21 8 7
22 23 19 25 3
40 30 20 10 0
7 12 23 20 9
0 10
17 10 21 1 15
20
18 6 13 16 5
30
4 2 25 22 3
24 19 14 8 11
40 30 20 10 0
24 14 11 4 23
0 10
3 18 13 5 16
20
21 12 17 15 8
30
20 22 25 6 10
1 2 7 9 19
Y: Norte
50
50
50
50 40 30 20 10 0
10 6 19 14 12
0 10
15 5 1 11 21
20
25 23 8 13 18
30
4 22 24 17 2
20 3 9 16 7
40 50 X: Leste
40 50 X: Leste
40 50 X: Leste
40 50 X: Leste
Krigagem simples
Krigagem ordinria
Varivel contnua
Varivel categrica
A
Variograma Variograma
1,29 1,03 0,77 0,52 0,26 0,00 0 5 10 15 20 25 Distncia 1,29 1,03 0,77 0,52 0,26 0,00
B
Variograma
0,30 0,25 0,20 0,15 0,10 0,05 0,00
C
Multiqudrica
0 5 10 15 20 25 Distncia 10 8 6 4 2 0
10
15
20 25 Distncia
20
40
60
E
FDAC FDAC
1,0 0,8 0,6 0,4 0,2 0,0 -2,5 -1,8 -1,1 -0,3 0,4 1,1 Escores normais 1,0 0,8 0,6 0,4 0,2
F
FDAC
1,0 0,8 0,6 0,4 0,2
80 100 Distncia
H
FDAC
-1,4 -0,8 -0,1 0,5 Y(x) 1,0 0,8 0,6 0,4 0,2 0,0 I II III IV V Tipos var. categrica
0,0 -2,0
I
Y: Norte Y: Norte
50 40 30 20 10 0 50 40 30 20 10 0
J
Y: Norte
50 40 30 20 10 0
L
50 40 30 20 10 0
10
20
30
40 50 X: Leste
10
20
30
40 50 X: Leste
10
20
30
40 50 X: Leste
Y: Norte
20
40
60
80 100 X: Leste
Fig. 6 Sntese dos mtodos sequenciais de simulao estocstica. Denio dos caminhos aleatrios para as realizaes (topo); variograma
da varivel transformada para escores normais (A e B); variograma indicadora da mediana (C); ncleo multiqudrico com constante nula (D); funes de distribuio acumulada condicional (E, F, G e H); resultado da simulao gaussiana sequencial opo por krigagem simples (I); opo por krigagem ordinria (J); resultado da simulao indicadora sequencial varivel contnua (K) e varivel categrica (L) (seo 5.4)
que pode ser amostrada por Monte Carlo. No caso de variveis discretas, as realizaes da simulao indicadora sequencial podem ser ps-processadas para determinao da imagem mais provvel, assim como da zona de incerteza mapeada por meio da varincia da proporo mais provvel.
Introduo
17
Conceitos Bsicos
O estudo geoestatstico tem como ponto de partida um conjunto de observaes que constituem uma amostra. As observaes, de natureza quantitativa ou qualitativa, so usadas para inferir as propriedades do fenmeno espacial em estudo. Na realidade, o fenmeno espacial desconhecido representa a populao da qual uma amostra foi extrada. Nesse sentido, este captulo tem a nalidade de introduzir os conceitos bsicos empregados no estudo geoestatstico.
1.1 F ENMENO
ESPACIAL
A Geoestatstica tem por objetivo a caracterizao espacial de uma varivel de interesse por meio do estudo de sua distribuio e variabilidade espaciais, com determinao das incertezas associadas. O fenmeno espacial o conjunto de todos os valores possveis da varivel de interesse, que dene a distribuio e variabilidade espaciais dessa varivel dentro de um dado domnio em 2D ou 3D. Representa, portanto, em termos estatsticos, a populao que o conjunto de todos os valores do qual uma amostra pode ser extrada. Para ns de ilustrao de um fenmeno espacial, considerar uma varivel de interesse que apresente a distribuio e variabilidade espaciais conforme apresentado na Fig. 1.1. Dentro do domnio de 50 por 50 conhece-se o valor da varivel em qualquer ponto. preciso lembrar, po0
0,07663 15,50000
50
30,92337
40
30
20
10
rm, que, na prtica, nada ou pouco se sabe sobre o fenmeno espacial a ser estudado. Assim, a Fig. 1.1 tem a nalidade didtica de mostrar como se apresenta um fenmeno espacial em toda a sua extenso, conhecido como domnio de denio.
10
20
30
40
50
interesse caracterizando um fenmeno espacial em 2D (Arquivo completo 1, disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/ download/Bell.txt>)
Quando se decide estudar um fenmeno espacial do qual se tem pouco conhecimento sobre a varivel de interesse, necessria uma amostragem, pois impossvel analisar todo o conjunto de valores.
1.2 A MOSTRA
E MTODOS DE AMOSTRAGEM
A amostra um subconjunto de valores do fenmeno espacial que, se representativa, deve reproduzir a distribuio e variabilidade espaciais tanto em tamanho, isto , nmero de pontos de dados, como em termos de distribuio dos pontos no domnio a ser estudado. Qualquer estimativa baseada em pontos amostrais est, porm, sujeita a uma incerteza, e, nesse sentido, a metodologia geoestatstica se destaca ao oferecer a incerteza associada estimativa. A amostragem feita com base em um planejamento, que deve denir a coleta das unidades de amostragem de forma aleatria simples, aleatria estraticada ou sistemtica.
40
30
de dimenses xas nas direes leste-oeste e norte-sul. Dentro de cada clula, as coordenadas geogrcas de um ponto so escolhidas aleatoriamente e o ponto se-
20
10
lecionado. Assim, ao nal desse processo, o nmero de unidades selecionadas ser igual ao nmero de clulas.
0 0 10 20 30 40 50
3,13712
Para o exemplo da Fig. 1.1, a regio de estudo foi subdividida em cem clulas de dimenses 5 5 e, dentro de cada clula, foi escolhido um ponto, resultando no mapa de localizao da Fig. 1.3.
20
pela escolha do ponto de origem, mas isso no o que ocorre na prtica, pois a malha regular denida inicialmente pelo responsvel pela amostragem para otimizar a coleta das unidades dentro da regio de estudo. A amostragem sistemtica em uma malha regular de 10 10 para o fenmeno espacial mostrado na Fig. 1.1 resulta no mapa de localizao de pontos mostrado na Fig. 1.4.
50
25,82543
50
26,66753
40
40
30
14,39134
30
15,40782
20
20
10
10
0 0 10 20 30 40 50
2,95726
0 0 10 20 30 40 50
4,14811
1.3 I NFERNCIA
ESPACIAL
O processo de reproduo das caractersticas do fenmeno espacial baseado em pontos amostrais denominado interpolao ou estimativa. A interpolao ou estimativa de um ponto no amostrado feita por meio do ajuste de funes matemticas locais (pontos mais prximos ao ponto no amostrado) ou globais (todos os pontos amostrais).
Conceitos Bsicos
21
Como denir e prever o comportamento espacial de uma varivel regionalizada {Z ( ), = 1, n} coletada em n pontos distribudos em uma determinada regio? Pretende-se responder a essa questo neste e no prximo captulo por meio da metodologia geoestatstica, com exemplos ilustrando aplicaes. Para entender a variao espacial do processo aleatrio subjacente, deve-se levar em considerao a possibilidade de que o valor de cada ponto no espao est relacionado, de algum modo, com valores obtidos de pontos situados a certa distncia, sendo razovel supor que a inuncia tanto maior quanto menor for a distncia entre os pontos, conforme interpretao de Soares (2006, p. 18). Isso signica que a inferncia da continuidade espacial de uma varivel regionalizada pode ser feita com valores amostrais tendo como base a estatstica de dois pontos. Aplicando-se as denies da funo covarincia e funo variograma, verica-se que elas dependem apenas de dois pontos 1 e 2 , situados a uma distncia h = 1 2 , ento cada par de pontos considerado uma realizao diferente, o que torna possvel a inferncia estatstica dessas funes (Journel; Huijbregts, 1978, p. 32). Para determinao do modelo de correlao espacial da varivel regionalizada, calcula-se experimentalmente essa correlao usando os pontos amostrais e, em seguida, ajusta-se um modelo terico. Esse modelo terico permite determinar o valor da correlao espacial para qualquer distncia dentro do espao amostrado. Neste captulo ser apresentado como se calcula o modelo de correlao espacial, que a ferramenta bsica da Geoestatstica para estimativas e simulaes estocsticas.
2.1 E STATSTICAS
ESPACIAIS
Segundo Soares (2006, p. 18), o conjunto de variveis aleatrias {Z ( ) , = 1,n} correlacionadas entre si constitui uma funo aleatria cuja amostragem fornece uma realizao z ( ). Por isso, de acordo com ele, com uma nica realizao torna-se impossvel determinar as estatsticas no ponto dessa funo, tais como mdia e varincia. Para ele, a soluo consiste em assumir diversos graus de estacionaridade da funo aleatria, como, por exemplo, admitindo que as variveis aleatrias tenham a mesma mdia: E [Z ( 1 )] = E [Z ( 2 )] = = E [Z ( n )] = E [Z ( )] = m
Desse modo, a mdia m passa a ser independente da localizao e obtida como mdia aritmtica das realizaes das variveis aleatrias (Soares, 2006, p. 18): m = E [Z ( )] = 1 n
n
Z ( )
=1
Julgar, porm, que essa hiptese esteja correta signica supor que a mdia das amostras seja representativa da rea estudada, isto , que os valores so homogneos (Soares, 2006, p. 18). A homogeneidade espacial raramente ocorre, sendo necessria a vericao da distribuio e variabilidade espaciais da funo aleatria, como ser visto neste captulo. A varincia associada mdia calculada como:
A
N225 N-S N45
Vr [Z ( )] = E [Z ( ) m]2 A hiptese de estacionaridade de 2 ordem, alm de denir que a esperana matemtica, E [Z ( )], existe e no depende do suporte , dene tambm que a correlao entre duas variveis aleatrias depende somente da distncia espacial,
E-W
h, que as separa e independente da sua localizao (Journel; Huijbregts, 1978, p. 32). Em Estatstica, a covarincia uma medida da relao mtua entre duas variveis aleatrias distintas, por exemplo, X e Y . Em Geoestatstica, a covarincia mede a relao entre valores da mesma varivel, obtidos em pontos separados por uma distncia h, conforme uma determinada direo. Isso signica que, ao alterar a direo, a covarincia tambm pode
N30
N120
se alterar e, nesse caso, h indicao de presena de fenmeno espacial anisotrpico (Fig. 2.1B). Existem casos em que a covarincia a mesma em qualquer direo e, por isso, o fenmeno espacial isotrpico (Fig. 2.1A). Assim, para detectar se o fenmeno espacial apresenta anisotropia ou no, a covarincia calculada para vrias direes. Geralmente, quando o fenmeno em estudo est distribudo em 2D, calculam-se as covarincias em quatro direes horizontais: 0, 45, 90 e 135.
Para fenmenos espaciais 3D, alm das direes horizontais, calculam-se as covarincias para a direo vertical ou
pico e B) anisotrpico
inclinada, conforme a estrutura geolgica do corpo em profundidade. A covarincia de uma varivel regionalizada para pontos separados por uma distncia h pode ser calculada como: C (h) = E {[Z ( + h) m] [Z ( ) m]} em que h representa um vetor entre dois pontos 1 e 2 no espao tridimensional. fcil vericar que a covarincia para distncia nula (h = 0) igual varincia da varivel regionalizada Z ( ).
34
Estimativas Geoestatsticas
Todo o processo de inferncia espacial tem incio com a coleta de uma amostra composta por n pontos de dados. esperado que essa amostra seja representativa do fenmeno em estudo, em termos da distribuio e variabilidade espaciais. Krigagem um processo geoestatstico de estimativa de valores de variveis distribudas no espao e/ou tempo, com base em valores adjacentes quando considerados interdependentes pela anlise variogrca. Pode ser comparado com os mtodos tradicionais de estimativa por mdias ponderadas ou por mdias mveis, mas a diferena fundamental que somente a krigagem apresenta estimativas no tendenciosas e a mnima varincia associada ao valor estimado. O termo traduo do francs krigeage e do ingls kriging foi cunhado pela Escola Francesa de Geoestatstica em homenagem a Daniel G. Krige, engenheiro de minas sul-africano e pioneiro na aplicao de tcnicas estatsticas em avaliao mineira. Abrange uma famlia de algoritmos conhecidos, entre outros, como krigagem simples, krigagem da mdia, krigagem ordinria e krigagem universal. O estimador mais usual a krigagem ordinria, cuja traduo, do francs krigeage ordinaire, deveria ser krigagem normal (Soares, 2006, p. 69). A traduo para krigagem ordinria, porm, est consagrada no Brasil e, assim, ser a usada nesta obra. Estimativas geoestatsticas so, em geral, superiores aos demais mtodos de interpolao numrica, pois fazem uso da funo variograma, que no simplesmente uma funo da distncia entre pontos, mas depende da existncia ou no do efeito pepita, da amplitude e da presena de anisotropia. Na impossibilidade de obteno de um modelo de correlao espacial, mtodos de interpolao no estoNo Variograma? Sim Krigagem Anlise variogrfica Amostra
csticos, que no necessitam do variograma, podem ser considerados (Fig. 3.1). A estimativa geoestatstica tem por objetivo a modelagem do fenmeno espacial em estudo, ou seja, determinar a distribuio e variabilidade espaciais da varivel de interesse.
Interpolao
variograma
Os valores obtidos nos pontos amostrais so usados na interpolao ou estimativa geoestatstica para fornecer uma grade regular 2D ou 3D, dependendo da dimensionalidade do fenmeno espacial. A modelagem da distribuio e variabilidade espaciais
50 102,99165
da varivel de interesse feita geralmente em malhas regulares, que permitem analisar a inferncia espacial com maior preciso. Em Geoestatstica, trabalha-se com funes locais, pois ela , por excelncia, um mtodo local de estimativa.
40
30 83,00352 20
Nesse sentido, pontos distantes situados alm do alcance do variograma no deveriam ser considerados, mas a krigagem tem um mecanismo interno de atenuao da inuncia desses pontos e, portanto, podem ser deixados como pertencentes vizinhana. As Figs. 3.2 e 3.3 ilustram exemplos em 2D e 3D, respectivamente, para a estimativa geoestatstica de um ponto no amostrado, com base nos pontos vizinhos prximos.
N
10
10
20
30
40
50
63,01539
E 10,40000
5,32000
483,
3 0 8, 02 270, 8 6 , 231
38
0,24000
Fig. 3.3 Localizao de pontos vizinhos prximos para interpolao do ponto no amostrado (dados 3D)
3.1 T RANSFORMAO
DE DADOS
As variveis regionalizadas podem ser contnuas ou discretas (Fig. 3.4). As variveis contnuas podem apresentar comportamentos distintos revelados pela forma do histograma. Se a distribuio tiver assimetria positiva, h necessidade de transformao dos dados para evitar a inuncia dos poucos valores altos na estimativa de pontos da vizinhana, caracterizada por baixos valores. Transformaes de dados so, em diversas circunstncias, necessrias para a estimativa geoestatstica e, aqui, sero analisadas as principais, como a gaussiana, a logartmica e a indicadora, conhecida tambm como indicativa e indicatriz.
56
Variveis regionalizadas
Contnuas
Discretas
% 20
15 10 5 0
%
80 60 40 20 0
% 30
25 20 15 10 5
0,08
6,25
12,42
18,58
24,75
30,92 45,20
47,36
49,52
51,68
53,84
56,00
0,03
7,98
15,93
23,88
31,83
39,79
Tipos
Zgauss
Znegativo
Zlog
Dados originais
Codificao binria
Gaussiana
Logartmica
Indicadora
Krigagem ordinria
Krigagem multigaussiana
Krigagem lognormal
Krigagem indicadora
Equaes multiqudricas
Fig. 3.4 Esquema ilustrando o processo de estimativa geoestatstica ou interpolao de variveis regionalizadas
As estimativas geoestatsticas para os dados transformados so obtidas por meio das krigagens multigaussiana, lognormal e indicadora. Para dados com distribuio normal ou que apresentem assimetria negativa, no h necessidade de transformao dos dados, e a krigagem ordinria aplicada diretamente sobre os dados originais. Para as variveis regionalizadas discretas, h necessidade de se fazer a codicao binria, e cada tipo que compe a varivel discreta interpolado usando as equaes multiqudricas, conforme proposta de Yamamoto et al. (2012). No usada a krigagem indicadora, por causa da necessidade de um variograma para cada tipo da varivel discreta. Mesmo que seja possvel, quando houver grande quantidade de informao os variogramas no sero iguais entre si, em termos de efeito pepita, patamar e amplitude. Por isso, cada tipo sendo estimado por um variograma diferente resultar em valores cuja soma no ser, necessariamente, igual a 1, condio essencial quando se estima probabilidades. Dessa forma, a soluo a obteno de um variograma nico, tal como se faz no processo da krigagem da varivel indicadora da mediana. Mas isso impossvel no caso de variveis discretas, pois elas esto decompostas em k tipos.
Estimativas Geoestatsticas
57
Coestimativas Geoestatsticas
No estudo de um fenmeno espacial, diversas variveis podem ser amostradas simultaneamente nas mesmas localizaes ou por mtodos distintos de pesquisa em diferentes pontos. Algumas dessas variveis podem estar subamostradas e outras, superamostradas. Contudo, se essas variveis subamostradas e superamostradas apresentarem alguma correlao, ento as variveis superamostradas podem ser utilizadas para fazer uma melhor estimativa das variveis subamostradas (Isaacks; Srivastava, 1989, p. 400). Denomina-se corregionalizao a existncia de duas ou mais variveis regionalizadas medidas sobre um mesmo campo aleatrio (Olea, 1999, p. 209). Geralmente, o padro de amostragem da varivel mais bem amostrada mais regular que o da varivel subamostrada (Olea, 1999, p. 401). Para essas situaes, a Geoestatstica proporciona um conjunto de ferramentas para coestimativas. Neste captulo, sero vistos os mtodos conhecidos genericamente como cokrigagem, a cokrigagem ordinria e a cokrigagem colocalizada, bem como um tipo especial de krigagem denominado krigagem com deriva externa. So denominadas variveis primrias aquelas de interesse na pesquisa, mas subamostradas, e variveis secundrias aquelas que podem ser usadas para melhorar a estimativa das variveis primrias. Segundo Wackernagel (1995, p. 144), as variveis primria e secundria podem ser medidas nos mesmos pontos ou em pontos diferentes, congurando trs situaes (Fig. 4.1): isotopia: as variveis primria e secundria foram medidas nos mesmos pontos de amostragem; heterotopia total: as variveis primria e secundria foram medidas em diferentes localizaes; heterotopia parcial: as variveis primria e secundria compartilham alguns pontos comuns. Para ns de ilustrao das tcnicas geoestatsticas de coestimativas, deve-se ter conjuntos de dados contendo variveis primria e secundria que sejam correlacionadas entre si. O ponto de partida, nesse caso, foi o Arquivo completo 1 (disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/download/Bell.txt>; Fig. 1.1), cuja informao foi considerada como varivel primria. Com base nesse arquivo, foi obtida uma amostra com 289 pontos, a qual foi usada para deteriorar a informao original de forma controlada e, assim, gerar a varivel secundria apresentando correlao com a primria. Nesse processo, duas variveis secundrias com alta e mdia correlao foram geradas.
A 50 50 Y Y
B 50 Y 10 20 30 40 50 X
40
40
40
30
30
30
20
20
20
10
10
10
10
20
30
40
50 X
10
20
30
40
50 X
Fig. 4.1 Amostragens possveis para as variveis primria e secundria: A) isotopia; B) heterotopia parcial; C) heterotopia total. Crculo =
40
40 30 20 10
30
30 20 10
20
10
10
20
30
40
50
10
20
30
40
50
10
20
30
40
50
Fig. 4.2 Base de dados completa: A) varivel primria (VP); B) varivel secundria com alta correlao (VS1 ); C) varivel secundria com
A Fig. 4.3 mostra as correlaes entre a varivel primria e as variveis secundrias com alta ( = 0,916) e mdia correlao ( = 0,724). A varivel secundria com alta correlao foi denominada VS1 e a com mdia correlao, VS2 .
122
24,75
24,75
18,58
18,58
12,42
12,42
6,25
6,25
0,08 1,45
7,98
14,51
21,04
27,57
34,10 VS1
0,08 3,41
8,44
13,47
18,50
23,53
28,56 VS2
Fig. 4.3 Diagramas de disperso mostrando a correlao entre as variveis primria e secundria: A) alta correlao
4.1 C OKRIGAGEM
A cokrigagem um procedimento geoestatstico pelo qual se pode estimar diversas variveis regionalizadas em conjunto com base na correlao espacial entre si. , portanto, uma extenso multivariada do mtodo da krigagem quando, para cada local amostrado, obtm-se um vetor de valores em lugar de um nico valor. A cokrigagem um procedimento verdadeiramente multivariado de estimativa porque o modelo trata com dois ou mais atributos dentro do mesmo campo aleatrio (Olea, 1999, p. 209). Uma de suas mais frequentes aplicaes ocorre quando a amostragem de uma varivel primria insuciente e o objetivo melhorar a sua estimativa, o que feito utilizando-se a correlao da varivel primria com variveis secundrias mais densamente amostradas. Ela tambm utilizada quando a varivel primria exibe uma baixa autocorrelao espacial e as variveis secundrias apresentam uma alta continuidade. Normalmente, o estudo feito considerando uma varivel primria e apenas uma secundria. Para n variveis primrias e secundrias, sero necessrios n(n + 1)/ 2 variogramas e covariogramas cruzados. No caso de mais de duas variveis secundrias, o sistema de cokrigagem torna-se extremamente instvel em termos numricos. Fundamental na utilizao da cokrigagem a vericao prvia da correlao existente entre a varivel primria e as variveis secundrias, a qual deve ser alta para que as estimativas sejam consistentes (Watanabe et al., 2009). Quando os pontos de amostragem so totalmente coincidentes (isotopia), no se obtm uma melhoria substancial na aplicao da cokrigagem em relao krigagem ordinria. Por
Coestimativas Geoestatsticas
123
Simulao Estocstica
A krigagem proporciona a estimativa Z ( o ) em um ponto no amostrado o com base na informao dos n pontos vizinhos. Essa estimativa feita minimizando-se a varincia do erro de estimativa, como visto no Cap. 3. Na realidade, porm, a minimizao da varincia do erro envolve a suavizao das disperses reais (Journel; Huijbregts, 1978, p. 493). Essa suavizao ocorre mesmo que as estimativas sejam condicionais aos pontos amostrais, ou seja:
( o ) = Z ( o ) ZKO
Entretanto, esse condicionamento no garante que as estimativas resultantes (por exemplo, calculadas sobre os ns de uma malha regular) no estejam suavizadas. Na verdade, todos os algoritmos de interpolao tendem a suavizar a variabilidade espacial do atributo (Goovaerts, 1997, p. 370). A suavizao se caracteriza pela subestimativa de valores altos e superestimativa de valores baixos (Goovaerts, 1997, p. 370). Alm disso, segundo esse autor, a suavizao no uniforme, pois zero nos pontos amostrais e vai aumentando medida que se distancia dos pontos de dados. A suavizao pode ser facilmente vericada comparando-se o histograma amostral com o histograma das estimativas por krigagem ordinria. Por exemplo: para a amostra com os dados da distribuio lognormal (Arquivo 12, Anexo B) (Fig. 5.1), verica-se uma discreta
A 50 % 40 30 30 20 20 10 10 0 0,10 0 0,17 40 % 1,83 3,57 5,31 7,04 8,78 Zlog B
1,60
3,03
4,46
5,88
7,31
Fig. 5.1 A) Histograma amostral da distribuio lognormal e B) histograma das estimativas por krigagem ordinria
suavizao, a qual mostra que os valores baixos e altos no foram reproduzidos, ou seja, a perda das caudas inferior e superior da distribuio. Alm disso, pode-se representar as curvas acumulativas em escala de logprobabilidade aritmtica, as quais devem mostrar quo diferentes so essas distribuies (Fig. 5.2). Nessa gura, verica-se que a distribuio das estimativas est suavizada, ou seja, com menor varincia, por causa da inclinao da curva. O diagrama P-P (probabilidade-probabilidade) no canto superior esquerdo da gura conrma que essas duas distribuies so diferentes. O efeito de suavizao das estimativas, alm disso, pode ser vericado comparando-se o variograma experimental com o variograma das estimativas (Fig. 5.3). Como pode ser observado nessa gura, o variograma das estimativas apresenta uma continuidade muito maior que o variograma amostral e um pa0,10 1,0 10 (Zlog)+(Teor mdio do bloco)
95,00 90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 5,00
tamar bem menor, reetindo a perda da varincia. A consequncia que o efeito de suavizao da krigagem no reproduz adequadamente as caractersticas da amostra usada para fazer as estimativas em pontos no amostrados. Assim, o processo de
(cruz vermelha) com a distribuio das estimativas por krigagem ordinria (crculo verde)
inferncia do fenmeno espacial em estudo no pode ser realizado com exatido, porque no permite concluir corretamente sobre a distribuio e variabilidade espaciais da varivel de interesse. De acordo com Olea (1999, p. 141), a simulao estocstica foi a soluo adotada pela Geoestatstica para resolver o problema da suavizao da krigagem. Entretanto, segundo ele, a simulao no a soluo perfeita: ganha-se em
Variograma 4,59
preciso global em detrimento da preciso local. Na realidade, as realizaes no esto isentas de erros na reproduo da realidade e, em mdia, os erros da simulao estocstica so maiores que os da krigagem (Olea, 1999, p. 141). A simulao estocstica tambm foi a soluo adotada pelos geoestatsticos para modelar a incerteza associada estimativa (Deutsch, 2011, p. 5-1), uma vez que a varincia de krigagem foi reconhecida apenas
0 5 10 15 20 25 Distncia
3,67
2,75
1,84
0,92
0,00
como um ndice de congurao espacial dos pontos vizinhos prximos (Journel; Rossi, 1989, p. 783). Na verdade, o conjunto de realizaes {Z ( ), = 1,L} proporciona uma medida visual e quantitativa da incerteza espacial (Goovaerts, 1997, p. 372).
mativas (crculos). O modelo de correlao espacial est representado por linha contnua (Arquivo 12, Anexo B)
146
Anexo
F UNDAMENTOS M ATEMTICOS
E STATSTICOS
A utilizao de tcnicas geoestatsticas requer o conhecimento de alguns fundamentos matemticos e estatsticos que so imprescindveis para o melhor entendimento dos conceitos empregados nessa metodologia. A seguir sero expostos, de maneira resumida, alguns desses conceitos. Para mais detalhes, podem ser consultados Waltham (2000), Davis (2002; Caps. 2 e 3) e Borradaire (2003), entre outros.
A.1 M TODOS
Como visto no Cap. 1, as variveis podem ser consideradas como categricas/discretas e contnuas, ambas apresentando distribuies de valores e usadas para uma anlise exploratria dos dados. A anlise estatstica tem por objetivo resumir a informao disponvel. Nesse sentido, os grcos mais usuais para a apresentao de dados so o histograma, a curva de distribuio acumulada e a distribuio espacial de pontos. Para ilustrar os conceitos estatsticos, o arquivo fornecido por Goovaerts (1997, p. 4-6) ser considerado. Na realidade, os dois arquivos, denominados prediction e validation, foram aglutinados em um nico arquivo, doravante chamado juradata.txt. O histograma um grco de barras, que so proporcionais s frequncias de classes. O intervalo de valores entre o mnimo e o mximo dividido em um nmero de classes, as quais acumulam as contagens dos valores encontrados no arquivo de dados. Para o exemplo dos dados do arquivo juradata.txt contendo diversas variveis contnuas e discretas, foi feita a representao da varivel cobalto em histograma (Fig. A.1).
0 1,55 5,36 9,17 12,98 16,79 20,60 Co 10 20 15 30 % 25 5
Anexo
B
35.50 36.50 36.50 36.50 36.50 37.50 37.50 37.50 38.50 38.50 39.50 40.50 40.50 40.50 41.50 42.50 42.50 43.50 43.50 44.50 44.50 44.50 45.50 46.50 46.50 46.50 47.50 47.50 48.50 49.50 49.50 49.50 49.50 49.50 18.633 10.203 20.833 17.994 16.965 9.572 9.060 20.438 9.944 19.060 18.798 15.452 9.343 18.134 12.556 17.751 12.291 14.738 18.282 12.184 17.043 23.920 20.300 17.220 14.630 24.501 12.367 13.942 20.191 21.283 27.551 28.740 28.244 23.388
A RQUIVOS
Arquivo 1
DE
D ADOS
0.50 0.50 0.50 1.50 2.50 2.50 3.50 3.50 3.50 4.50 4.50 4.50 5.50 6.50 7.50 7.50 7.50 9.50 9.50 10.50 10.50 10.50 11.50 11.50 12.50 12.50 13.50 13.50 13.50 13.50 13.50
8.738 11.160 19.399 9.697 11.953 18.864 8.973 6.499 13.656 3.137 6.561 14.841 21.668 14.743 17.048 13.165 15.479 15.341 23.290 29.061 11.066 22.317 26.852 12.303 16.677 15.031 12.741 18.058 17.102 16.089 12.641