You are on page 1of 9

Mdulo de Geoestadstica; Diplomado SIG 2013

Profesor Luis Carvacho Bart / Instituto de Geografa U.C.

Gua de trabajo nmero 2: Exploracin de datos

En este ejercicio se vern los mtodos de exploracin de datos que


ofrece el Geostatistical Analyst y cmo se aplican e interpretan. As, ser
posible obtener superficies de tendencia (interpoladas) sobre la base de
decisiones objetivas tomadas por el usuario de acuerdo a lo que pueda
inferir de los datos con que cuenta. As, se realizar un anlisis
exploratorio en tres etapas:
Examinar la distribucin de los datos;
Identificar tendencias, si las hay, y
Comprender la autocorrelacin espacial y tendencias direccionales.
Para proceder con este ejercicio, cargue el que resolvi anteriormente
con parmetros asumidos.

Anlisis exploratorio

Dado que los mtodos geoestadsticos asumen que los datos con los que
operarn tienen una distribucin normal, es importante comprobar este
he cho con el fin de tomar las decisiones correctas ms adelante. Para
ello, determinaremos su distribucin mediante un grfico de frecuencias
o histograma.

1. Asegrese de dejar la disposicin de las capas de que dispone tal


como se presenta en la figura (es importante
que Ca_ozone_pts est en primer lugar). Con
esto debera poder ver tanto los puntos y el 1
contorno del Estado como la superficie
calculada anteriormente a la vez.
2. En la barra Geostatistical Analyst, pulse sobre
Explore Data y luego en Histogram.

1
3. Procure tener un despliegue como el de la siguiente figura:

Ca_ozone_ Ozon
pts o!

Puede observarse en el histograma, que la distribucin de


frecuencias de las mediciones de ozono parece normal, es decir, la
distribucin es unimodal con la mayor cantidad de observaciones
en torno al centro del grfico y con una forma relativamente
simtrica en el sentido de las abscisas.
4. El histograma es muy til para verificar la localizacin de los
puntos que conforman cada barra del mismo, en particular, es
muy clarificador examinar los extremos de la distribucin. Haga
click sobre la barra del extremo derecho del grfico y observe en el
mapa la localizacin de los puntos a los que se refiere. Vea qu
puede deducir. Cierre la ventana del grfico.

2
5. Tambin es posible determinar la
normalidad de la distribucin de 5
los datos de muestra mediante un
grfico Q-Q, tambin disponible
entre las herramientas de
exploracin de datos. Haga click en
esta entrada.

6. El grfico Q-Q compara la distribucin de las observaciones del


usuario con una distribucin normal; as, si ambas distribuciones
son iguales, por tanto, normales, esto debera reflejarse en una
disposicin lineal de puntos en el grfico. Esto se aprecia
relativamente as en nuestro caso. Al igual que con el caso del
histograma, en este grfico se pueden seleccionar algunos puntos
(arrastrando el mouse, vea la figura), lo que tendr un eco en el
mapa. Compruebe esta circunstancia y obtenga conclusiones.
7. Una de las circunstancias que conspira contra una interpolacin de
buena calidad es la presencia de tendencias o sesgos que poseen
las observaciones. Estos sesgos son naturales y esperables, ya
que, finalmente, representan el elemento determinstico de la
distribucin, es decir, todo aquello no aleatorio. El ideal,
entonces, es que el mtodo de interpolacin conozca cmo es esta
tendencia, hacia dnde el fenmeno desarrolla su mayor presencia
o fuerza. Estos sesgos pueden estar dados por factores intrnsecos
del fenmeno o por factores exgenos; en cualquier caso, la idea
es que ello se considere a la hora de interpolar. Como estas
tendencias pueden tener distinta fuerza para cada tipo de caso a
estudiar, es necesario descubrirla cada vez, con el fin de adaptar
el modelo de interpolacin al sesgo existente, para lo cual se
requiere definirlo matemticamente a travs de un anlisis de
tendencia.

3
8. Haga click en Trend Analysis y cercirese de establecer
ca_ozone_pts como capa de estudio en el cuadro siguiente y
Ozone como variable.

9. Procure dejar el grfico de


tendencias en la disposicin que
se aprecia en la figura siguiente:

Note la tendencia en este


plano

Con este control puede girar el


grfico en torno al eje cenital

Este grfico dispone los puntos de muestra segn su posicin en el


terreno, pero los proyecta verticalmente de acuerdo al valor del
fenmeno que representan. Esta proyeccin se representa desde
el nivel cero (x, y) con una barra de color negro vertical. La
elevacin de cada punto (z) se representa con un punto verde.
Sobre los paneles verticales se proyectan en cada plano los puntos
anteriores, como si hubiera sendos focos iluminando desde los
4
lados opuestos a esos paneles (si desmarca Sticks e Input Data
Points en las Graph Options, puede que lo vea ms claro). Sobre
los puntos proyectados es posible trazar un modelo de ajuste; si
dicha traza se asemeja a una lnea horizontal, la tendencia de los
datos es baja en esa orientacin, si no se asemeja, entonces se
est en presencia de una tendencia. En este caso, se aprecia una
tendencia en forma de U invertida en el plano este-oeste. Al ser
en forma de U, se puede ajustar a un modelo polinomial de
segundo grado. La tendencia (la lnea verde) claramente sigue una
direccin noreste-sudoeste (interprete los ejes X,Y). Trate de
buscar alguna razn que explique este comportamiento del
fenmeno. Cierre este cuadro.

10. Dentro del anlisis de las tendencias de los datos, uno de los
ms importantes es el de autocorrelacin espacial, que busca
determinar el grado de similitud entre puntos cercanos. En
trminos simples, se espera que los puntos muy cercanos entre s
tengan valores similares, y si se piensa en el concepto de
tendencia que vimos antes, est claro que si no existe sesgo la
relacin de los valores entre cada punto y los restantes debera
seguir un patrn circular, es decir, simtrico en todas direcciones.
El anlisis siguiente busca determinar esta cuestin.
11. En las herramientas de anlisis exploratorio, escoja
Semivariogram/Covariance tool y asegrese que en el cuadro
siguiente se haga referencia a ca_ozone_pts y a la variable
Ozone, respectivamente.

1
1

12. En estos grficos


resulta esencial
comprender a qu se
refieren los puntos
mostrados. En el
semivariograma (grfico
superior) se representan
las diferencias al cuadrado
entre los valores de ozono
de cada par de puntos
posible en el rea de estudio (eje Y) con respecto a la distancia
entre ambos puntos (eje X). Por ejemplo, el punto sealado por
5
una flecha verde (arriba), significa que existen dos muestras de
ozono con una gran diferencia en sus medidas, pero que estn a
corta distancia. Eso ya indica una situacin no esperable. En
teora, a medida que la distancia entre los puntos aumenta (eje X),
tambin debera aumentar la diferencia entre las magnitudes de
los valores de esos puntos (eje Y). Llega un momento, sin
embargo, en que la distancia entre los puntos deja de reflejarse en
un aumento de las diferencias de sus magnitudes, situacin en la
que se dice que los puntos dejan de estar autocorrelacionados
entre s; en este caso, ese punto aproximado se muestra en el
grfico con una flecha azul (abajo). Si observa algunos de los
puntos en el semivariograma, ver que algunos de ellos prximos
entre s tienen valores relativamente altos de diferencia (o gama,
), lo que podra significar que son datos anmalos, por lo que es
prudente investigar esta situacin.
13. Arrastre el puntero de seleccin sobre los puntos
sospechosos y vea en el mapa a qu pares de puntos
corresponden, puntos que deberan ser muy cercanos entre s,
pero con gran diferencia en los valores que miden. Esto se grafica
en la figura siguiente:

Arrastre el
puntero de
seleccin sobre
estos puntos y
seleccinelos

1
3
Como se puede apreciar, los
puntos seleccionados en el
semivariograma se reflejan de
inmediato en el mapa,
mostrndose los pares enlazados.
Efectivamente, se trata de puntos
cercanos, pero que tienen una
diferencia fuerte en los valores de
ozono que miden. Se puede
apreciar que el patrn es general
en esa zona, lo que indica una
fuente alta de ozono (es el rea urbana de Los ngeles, de hecho) y que
decrece rpidamente hacia el oeste, lo que parece indicar alguna
situacin local que favorece la menor emisin en esa direccin. Todas
estas son situaciones que deben hacer suponer al investigador no slo
que hay sesgos, sino que adems, parecen ser direccionales, cuestin
que deber considerar al momento de decidir la forma de calcular una
superficie de interpolacin. En el punto siguiente se ver cmo se
pueden buscar tendencias direccionales en el comportamiento de las
magnitudes de ozono medidas.

14. Marque Show Search Direction (A) y mueva el puntero direccional


(B) en el ngulo que desee. Luego arrastre el puntero de seleccin
sobre los puntos que en el semivariograma parezcan con mayor
diferencia en sus mediciones (C). Pruebe con una disposicin similar
a la de la figura.

1
4

7
C

A
B

Como se puede apreciar de acuerdo a las selecciones realizadas,


ac se est mostrando la variabilidad en el sentido norte-sur. La
interpretacin de lo que se aprecia debe realizarse atendiendo a
los tres elementos principales simultneamente, semivariograma,
superficie de semivariograma y mapa; cada elemento por s
mismo es insuficiente para lograr la interpretacin. En este caso,
se advierte que en el sentido norte-sur hay altas variaciones en las
muestras de ozono a distancias intermedias. Qu se obtendra al
restringir la direccin de anlisis en sentido oeste-este respecto a
la relacin distancia/variabilidad? Contine experimentando con la
herramienta direccional y procure extraer conclusiones sobre su
utilidad.

Cierre el cuadro de dilogo y deseleccione cualquier punto que


pudiera estar seleccionado.
15. En esta gua de trabajo se pudo determinar que:
el fenmeno en estudio tiene una distribucin normal;
lo anterior queda reafirmado por el grfico Q-Q;
existe una tendencia en las magnitudes de los datos en la
direccin SE-NE que se puede ajustar con una funcin
polinomial de segundo grado;
existen grandes concentraciones de ozono en un rea
especfica del rea de estudio, con fuertes variabilidades
hacia todas las direcciones, y
no parece haber datos anmalos, de modo que se puede
proceder al clculo de una superficie interpolada de acuerdo

8
a lo que ha llegado a determinarse con este anlisis
exploratorio.
16. Con todo lo que se ha podido conocer de las tendencias de
los datos, gracias al anlisis exploratorio anterior, ser posible
construir una superficie interpolada mejor ajustada que la creada
en el trabajo previo, cuestin que se acometer en el ejercicio
siguiente.

You might also like