You are on page 1of 45

Introduccin a la Geoestadstica

Ing. Marco A. Hernndez Garca.


GEOMATICA - CESAVEG
Contenido

Qu es la geoestadstica?

Por utilizar geoestadstica?

Aplicacin de la geoestadstica

Un poco de historia ...

Pasos de un estudio geoestadstico


Qu es la geoestadstica ?

Tradicionalmente:
GEO = geologa (minera)
Ahora:
GEO = geogrfico (SIG)

Definicin:
Estudio estadstico de fenmenos naturales que se
distribuyen de forma continua en el espacio y/o el tiempo

Definiciones alternativas:

Estadstica aplicada a datos geogrficos

Estadstica espacial

Gestin, tratamiento e interpretacin de datos espaciales

Descripcin cuantitativa de variables naturales que se distribuyen


en el espacio o en el espacio y el tiempo
(Chils y Delfiner, 1999)
Por utilizar geoestadstica ?
Un agricultor quiere que se le
determine la distribucin de la
fertilidad del suelo de su rancho. No
quiere el valor promedios de cada
parcela, sino informacin ms
detallada, de modo que pueda
fertilizar solamente donde el suelo
resulta deficiente.

Contenido NPK en todos los


puntos de muestreo

El agricultor quiere informacin continua,


en todos los puntos de sus rancho.
Cmo obtener informacin en puntos no
muestreados?

Cmo se relacionan los pequeos volmenes


de suelo de las muestras con la superficie total
que maneja el agricultor.

Cuntas muestras de suelo hay que tomar,


y dnde, para que esta informacin sea

?
confiable.

Costo para obtener esta informacin


(muestreo de suelo + anlisis)

Argumentos agronmicos y ambientales

Beneficio econmico de la aplicacin


localizada de NPK (Agricultura de Precisin)

Usar datos dispersos para estimar, o predecir,


el contenido medio en NPK en bloques de
suelo muestreado.
Un agricultor (tecnolgicamente avanzado)
puede actualmente:

Posicionar su maquinaria en el
campo con una precisin de < 2 m

Puede medir y registrar la


produccin de los cultivos
continuamente durante la cosecha

Puede regular la cantidad de


fertilizante suministrada segn la
cantidad requerida

Pero cmo puede obtener la


informacin sobre el estado
nutricional del suelo, distribucin de
plagas y enfermedades a un precio
razonable?
Campos de aplicacin

La geoestadstica ha sido ampliamente aplicada en diversas ramas de


las ciencias y en las ingenieras, entre otras tenemos:

petrleo, minera, pesca,


agricultura, ciencias del mar,
hidrogeologa, medio ambiente,
estudios forestales, salud pblica,
ingeniera civil, procesamiento de
imgenes, cartografa, finanzas,
meteorologa, edafologa, etc.
PROPSITO DE LA GEOESTADSTICA

A partir de escasa
informacin conocida
estimar o predecir el
valor de una variable
en localidades donde no
se conoce

Geoestadstica:
Estimar, o predecir espacialmente,
sin sesgo y con un error mnimo.
La Geoestadstica es la aplicacin de la teora de las variables regionalizadas
De manera general, diremos que un fenmeno es regionalizado cuando se
desplaza en el espacio, manifestando una cierta estructura.

Un aspecto aleatorio
(alta irregularidad, y variaciones de un punto a otro)

Un aspecto estructurado
(la V.R. debe reflejar a su manera las caractersticas estructurales de un
fenmeno regionalizado)

La teora de las V.R. se propone entonces dos objetivos principales:

en el plano terico, expresar estas caractersticas estructurales


en una forma matemtica adecuada

en el plano prctico, resolver el problema de la estimacin de una


V.R. a partir de un muestreo fragmentario.
Un poco de historia

En los aos 60, Matheron acu el trmino de Geoestadstica.

Matheron formaliz y generaliz matemticamente un


conjunto de tcnicas desarrolladas por D. G. Krige (1941) que
explotaban la correlacin espacial para hacer predicciones en la
evaluacin de reservas de las minas de oro en Sudfrica.

Matheron defini a la Geoestadstica como

"la aplicacin del formalismo de las funciones aleatorias al


reconocimiento y estimacin de fenmenos naturales"

(Matheron, 1962).
Programas informticos
Geo-EAS, GSLIB, GSTAT, VARIOWIN, VESPER, R+, SADA, WINGSLIB,
GS+, S+, MATLAB, IDRISI, SURFER, ARCGIS GEOSTATISTICAL
ANALIST
Pasos de un estudio geoestadstico.

1. Anlisis exploratorio de los datos

2. Anlisis estructural contraccin del variograma

3. Interpolacin o estimacin espacial kriging

4. Validacin del modelo geoestadstico


Qu es el Anlisis Exploratorio de Datos (AED)?

Es un conjunto de tcnicas estadsticas y grficas que


permiten establecer un buen entendimiento bsico del
comportamiento de los datos y de las relaciones
existentes entre las variables que se estudian.

El AED es un paso previo e indispensable para la


aplicacin exitosa
de cualquier mtodo estadstico.

En particular permite la deteccin de fallos en el


diseo y toma de datos, el tratamiento y/o la
evaluacin de datos ausentes, la identificacin de
valores atpicos y la comprobacin de los supuestos
requeridos por parte de las tcnicas geoestadsticas.
Etapas de un AED

Realizar un examen grfico de la naturaleza de las variables individuales y un


anlisis descriptivo numrico que permita cuantificar algunos aspectos grficos de
los datos.

Realizar un examen grfico de las relaciones entre las variables y un anlisis


descriptivo numrico que cuantifique el grado de interrelacin existente entre ellas.

Evaluar algunos supuestos bsicos subyacentes a muchas tcnicas estadsticas, por


ejemplo, normalidad, linealidad y homocedasticidad.

Identificar los posibles valores atpicos (outliers) y evaluar el impacto potencial


que puedan ejercer en anlisis estadsticos posteriores.

Evaluar, el impacto potencial que pueden tener los datos ausentes (missing) sobre
la representatividad de los datos analizados.

Herramientas del AED


Estadstica univariada
Estadstica multivariada
Regresin lineal y mnimos cuadrados
Anlisis exploratorio

Primer paso de cualquier anlisis (geoestadstico o no).

Go beyond the data o familiarizacin con el conjunto de datos.

Representar los datos en figuras y diagramas en vez de analizar


directamente listados en formato tabular

Identificar observaciones sospechosas

Calcular los estadsticos descriptivos: resumir los datos

Datos geogrficos: controlar la posicin

Identificar las poblaciones

Caracterizar la funcin de distribucin y proponer alguna


transformacin de los datos si no es normal.
Variable Aleatoria (V.A.):

Es una variable Z que puede tomar


una serie de valores o realizaciones (zi) cada
una de las cuales tienen asociadas una
probabilidad de ocurrencia (pi).

Ejemplo: Al lanzar un dado puede resultar {1,


2,3, 4, 5 o 6} con una probabilidad de
ocurrencia igual a 1/6.

Variable Aleatoria Discreta: cuando el nmero de ocurrencias es finito o contable, se


conoce como variable aleatoria discreta. Ejemplo: tipos de facies en un yacimiento.

Variable Aleatoria Continua: si el nmero de ocurrencias posibles es infinito.


Ejemplo: el valor de la porosidad de un medio se encuentra en el intervalo
[0,100%].
Para qu sirve el histograma?

Estimacin de la funcin de densidad


Tipo de distribucin (Normal, log-normal, ...)
Distribucin uni-modal, multi-modal
Aparicin de valores extremos y outliers
Variabilidad del fenmeno
Funcin de Distribucin de Probabilidad Funcin de Densidad de Probabilidad
(FDP) (fdp).
caracteriza completamente a la VA.

Su grfica es el histograma acumulativo Su grfica es el histograma.

Tratar datos con una distribucin sesgada:


transformacin logartmica
Percentiles o cuantiles de una distribucin

El percentil de una distribucin F(z) es


el valor zp de la V.A. que corresponde a
un valor p de probabilidad acumulada,
es decir:

Algunos cuantiles de inters:


Mediana, p=0.5
Cuartiles
(primer cuartil o inferior) p=0.25
(tercer cuartil o superior) p=0.75
Rango o intervalo intercuartil (IR)
Varianza de una VA
caracteriza la dispersin de la distribucin alrededor de la media.

Distribucin Normal o Gaussiana.

Esta distribucin est completamente


caracterizada por sus dos parmetros:
media y varianza

Distribucin LogNormal

Una VA positiva Y se dice que tiene una


distribucin lognormal si su logaritmo
ln(Y) esta normalmente distribuido.
Desviacin Estndar
Coeficiente de variacin (dispersin relativa)
Coeficiente de simetra (medida de la simetra)
Coeficiente de curtosis (medida del achatamiento)

Simetra y Curtosis de una distribucin


Medidas de dispersin

La varianza: cuantifica la dispersin entorno a la


media
en unidades de medicin al cuadrado
aditivo
muy sensible para valores extremos
raz cuadrada: la desviacin tpica, s

Hay que corregir la frmula anterior porque no podemos muestrear la poblacin


entera, solamente disponemos de una muestra que consiste de un limitado numero
de observaciones
Medidas de dispersin ...

Expresa la dispersin en trminos relativos

P.ej.: cuando una propiedad ha sido medida en dos zonas


diferentes con valores similares de s, pero diferentes de m.

Medida de la asimetra de distribuciones positivamente sesgadas

Indicador preliminar de posibles problemas para la estimacin local

<100 % sin problemas


100-200 % dificultades con valores extremos
>200 % grandes dificultades con valores extremos
El coeficiente de sesgo (CS):

Mide la asimetra de la distribucin


CS = 0 distribucin simtrica
CS > 0 sesgo positivo
(la funcin de densidad
muestra una cola larga por la derecha)
CS < 0 sesgo negativo
(la funcin de densidad
muestra una cola larga por la
izquierda)
Anlisis estructural o variografa

Cuantificacin de la correlacin espacial y su estructura


Clculo del semivariograma muestral o experimental
Analizarlo e interpretarlo
Ajustar un modelo terico

Hiptesis de Estacionariedad:

Suponer estacionariedad para poder tratar los datos en diferentes puntos


como si fueran diferentes realizaciones de la propiedad.

Estacionariedad significa que la funcin de distribucin del proceso aleatorio


tiene caractersticos que son iguales en todos los puntos (primer y segundo
momento).
Cmo calcular el variograma?

(semi)variograma experimental =
(semi)variograma muestral

se calcula mediante un algoritmo que


depende de la configuracin
espacial de los datos (1D, regular e
irregular o 2D, regular e irregular).

N(h): nmero de pares de


observaciones separadas por el vector h

h: vector de separacin, determina la


distancia entre dos observaciones en
una cierta direccin
Cmo calcular el variograma?

Muestreo regular en una dimensin:


Muestreo irregular en una dimensin:

Elegir h con cuidado:


demasiado grande
(variograma demasiado suavizado)
demasiado pequeo
(variograma errtico porque no hay bastante
pares de puntos en cada clase de h)

Variabilidad anisotrpica:

1. Isotropa: La variacin espacial de


la variable bajo estudio es igual en
todas la direcciones

2. Anisotropa: la semivarianza no
depende solamente de h, pero
tambin de la direccin
Algunas reglas generales:

N >100 en el caso de isotropa y N > 250 en el caso de anisotropa

Cuanto ms puntos mejor (el nmero de observaciones es en muchas


ocasiones restrictivo para la aplicacin de geoestadstica)

El nmero total de pares de observaciones = N(N-1)/2

El nmero de pares en el que se basa el clculo de cada punto del


variograma debera ser por lo menos 30 50.

El paso h mximo del variograma experimental deberia ser inferior a


la mitad de la dimensin mxima de la zona de estudio: hmax L/2

efecto pepita = variabilidad inexplicada. Se debera de incorporar en


cada diseo de muestreo algunas observaciones a pequeas distancias
de otros para obtener informacin sobre el comportamiento del
variograma en la cercana el origen.

Esto permitir una descripcin completa de la variabilidad espacial e


incrementar la precisin de la interpolacin espacial.
Modelar el variograma
El ajuste a una funcin permite extraer
una serie de parmetros que son los que
van a ser usados para la interpolacin
geostadstica (kriging) y que definen el
grado y escala de variacin espacial.

El rango, El nugget y El sill

El rango: es la distancia a la que la semivarianza deja de aumentar, indica la


distancia a partir de la cual las muestras son espacialmente independientes unas de
otras y representa el tamao de grano o mancha que representa la variable

El nugget: es la varianza no explicada por el modelo, y se calcula como la


intercepcin con el eje Y. Se conoce tambin como varianza error

El sill: es la mxima semivarianza encontrada entre pares de puntos y debe


coincidir con la varianza de la poblacin y nos representa el grado de variacin
espacial, y por tanto el grado de incertidumbre a la hora de interpolar puntos en el
espacio.
Modelar el variograma

Ajustar un variograma terico al


variograma experimental que se ha
calculado a partir de los datos

Variograma terico = funcin que


representa el variograma real del
fenmeno.
Cmo ajustar un modelo al variograma experimental?
Uno de los temas ms controvertidos de la geoestadstica

Por qu?

1. La mayora de los modelos son no-lineales en uno o ms parmetros.


2. La fiabilidad de los valores de semivarianza no es igual para todos los h
3. La dispersin en el variograma experimental puede hacer el ajuste
automatizado numricamente inestable

ajuste a ojo ajuste por mnimos cuadrados

programa VARIOWIN : combinacin de ambos

Ponderar los valores experimentales del variograma segn el nmero de


pares de observaciones que se han empleado para su clculo
Interpolacin o estimacin espacial

1. Polgonos de Thiessen (Voronoi, Dirichlet)

2. Triangulacin
cada prediccin se basa en solamente tres observaciones

3. Inverso de la distancia IDW


4. Regresin polinmica
5. Krigeado Ordinario
El Kriging es un trmino que ha sido acuado para designar al mejor
estimador lineal insesgado.

Este nombre apareci alrededor de 1960 para nombrar una tcnica creada
en Francia por Matheron a partir de los trabajos de D. G. Krige quin fue
probablemente el primero que hizo uso de la correlacin espacial.

El estimador Kriging se considera ptimo ya que es

1. Insesgado, es decir, el valor esperado del error es cero


2. minimiza la varianza de la estimacin, reduce al mnimo la varianza del error.

Tipos de Kriging lineales ms usados

Kriging Simple

Kriging Ordinario

Kriging Universal

Kriging Residual
Kriging

Estimacin en puntos donde no se dispone de observaciones


(nodos de una retcula regular)

Tener en cuenta la correlacin espacial


(el semivariograma)

Estimacin puntual o en bloques (2, 3 D)

Krigeado simple, krigeado ordinario, krigeado universal, ...

Incorporar toda la informacin disponible: variables


secundarias, imgenes de satlite, MDEs

Estimacin basada en el conocimiento


de las covarianzas (semivariograma), direccion y distancia entre
los VA en los puntos de observacin.
Aspectos prcticos del Kriging

1.- Definir una malla de estimacin:


Si bien no hay restricciones para la malla de estimacin usualmente se eligen mallas
regulares debido a que su geometra facilita la representacin grfica de los
resultados en forma de mapas de contornos, relieves, etc.

Una recomendacin prctica respecto al tamao de la celda de la malla es que debe


ser de un orden aproximadamente igual a la distancia mnima de separacin de los
datos, puesto que sta es la resolucin de la informacin que se dispone.
2.- Definir una vecindad de vecindad de bsqueda:
La vecindad de bsqueda se define con respecto al punto a estimar y determina
cuales puntos vecinos potencialmente sern tomados en la estimacin.
Caso isotrpico: tomar una circunferencia con centro en el punto a estimar y radio
igual o menor al alcance del variograma.
Caso anisotrpico: tomar una elipse con centro en el punto a estimar y semiejes
iguales o menores a los alcances del variograma anisotrpico.
3.- Definir cantidad de punto de la estimacin:
Una vez definida la vecindad de bsqueda hay que especificar cuantos puntos
intervendrn en la estimacin. Esto determina el tamao de la matriz del
Kriging.

Para toda la vecindad se pueden tomar como valores prcticos:

Mnimo de puntos: entre 4 y 6 puntos.


Mximo de puntos: entre 10 y 25 puntos.
Tambin se pueden establecer cantidades min. y mx. por cuadrante, octante,
etc.
Validacin del modelo geoestadstico

Validacin cruzada y Jack-knifing


Validar el modelo terico del semivariograma
Validar los parmetros del algoritmo de interpolacin
Comparar y evaluar diferentes procedimientos de interpolacin

Existen varios parmetros en el Krigeado que se pueden optimizar antes de


interpolar y elaborar el mapa

1. Los parmetros del semivariograma terico: efecto pepita, alcance y


meseta.

2. Importancia de considerar anisotropa o no


3. El mnimo nmero de puntos vecinos que van a participaren el krigeado
4. El mximo nmero de puntos vecinos que van a participaren el krigeado
5. El radio del rea de bsqueda alrededor del punto u
6. El grado del polinomio en KD (K)
Existen dos maneras:

1. Retirar cada dato a su vez del conjunto y estimar su valor con los datos que
quedan comparar los valores estimados con los observados

Evala el modelo solamente en los puntos donde disponemos de datos

No disponemos de informacin sobre la exactitud de la interpolacin en otros


puntos

2. Eliminar 25 % de los datos y calcular el semivariograma y interpolar con el


75 % restante compara los valores estimados con los observados

Despilfarro de informacin

Solamente apto para trabajos de investigacin


CUADRADO MEDIO DEL
ERROR DE KRIGING

CUADRADO MEDIO DEL


ERROR DE IDW

CUADRADO MEDIO DEL


ERROR DE SPLINE

You might also like