Professional Documents
Culture Documents
Introduccin:
Figura 1. Reparticin espacial del ndice de servicios de electricidad y telefona. Fuente no conocida.
Tambin hay mucha evidencia emprica que esta es una situacin parece repetirse en diversas
escalas espaciales, por lo que hay que ser extremadamente cuidadoso al dar conclusiones a partir
de un anlisis de caso que no tenga en cuenta el tema de la escala del estudio.
En geografa interesan tanto las regularidades como las excepciones, pero claramente la idea de
existencia de un orden espacial es un concepto clave pues en cierta medida da relevancia a
nuestra disciplina. As, por ejemplo, si la reparticin espacial de la mayora de las variables de
1
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
inters para la geografa fuera completamente al azar, la geografa tendra que estudiar cada
unidad territorial como un caso particular, lo que se conoce como el enfoque "ideogrfico" y fue
una corriente filosfica fuerte en la disciplina hace ya muchas dcadas. Por otra parte, una
reparticin espacial ajustada a una funcin de probabilidad definida, por ejemplo, la normal, dara
mucho crdito a la prediccin estocstica que podra hacerse desde la disciplina de la Estadstica o
desde la Geografa, pero usando bsicamente tcnicas propias de la estadstica. Contrariamente,
cuando los fenmenos son organizados o semi-organizados, existe la posibilidad de adoptar
modelos estocsticos para describir la componente errtica1 de la variacin, pero tambin
modelos determinsticos para describir los patrones de distribucin ms regulares. Considerando
adems que las distribuciones semi-estructuradas (semi-organizadas en el espacio) son
multiescalares, es posible hallar tambin patrones repetitivos y buscar principios generales que
expliquen estas configuraciones, lo que se conoce como el enfoque "nomottico" por oposicin al
mencionado "excepcionalismo".
1
La componente errtica sera aquella que difiere de la tendencia general, que es variable localmente y cuya
distribucin es ms difcil de modelar con una simple ecuacin matemtica determinstica.
2
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
territorio amplio y con relieve contrastado, suelen aparecer ncleos de alta precipitacin (en
barlovento por lo general) y de baja precipitacin (en sotavento).
Frecuencia es un concepto comn aunque quizs se le utilice en forma vaga por parte de la
mayora de las personas. En las ciencias fsicas, la frecuencia se refiere al nmero de repeticiones
por unidad de tiempo de cualquier fenmeno o suceso peridico (Figura 3). En el Sistema
Internacional de Unidades (SI), la frecuencia se mide en Hercios (Hz). Un Hercio corresponde a un
evento por segundo.
Figura 3. Oscilacin de temperatura del aire (color azul) y de la presin atmosfrica (color negro). Frecuencia
aproximada de 1/24 horas y 2/24 horas respectivamente.
En geografa nos interesa este concepto de frecuencia y muchas propiedades de la luz, como
veremos en el curso Teledeteccin y otros, pero de momento, en el curso Anlisis Espacial,
estamos ms interesados en el concepto de frecuencia espacial de los eventos. Por analoga con la
definicin fsica de frecuencia (temporal), los gegrafos podemos utilizar el concepto de
frecuencia espacial, el cual hace referencia al nmero de repeticiones por unidad de distancia o
por unidad de rea, siendo este segundo concepto ms apropiado en opinin del autor.
En geografa, a diferencia de lo que ocurre en las ciencias fsicas, las frecuencias de los eventos
suelen no ser estables, de modo que por frecuencia espacial entendemos a menudo, una situacin
promedio; por ejemplo: la frecuencia de parcelas de caa por kilmetro cuadrado en la regin
caera de Grecia. Se trata de una aproximacin ms flexible al concepto de frecuencia de los
fsicos, pero no por eso, menos importante, como se mostrar a continuacin.
3
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Un ltimo ejemplo de frecuencia y continuidad espacial que mencionaremos ac, podra ser el
caso de la reparticin de la cobertura del terreno, medida a travs de la reflectancia de la
vegetacin (Figura 6). La reflectancia es el porcentaje de energa radiante que los diversos
materiales devuelven al espacio, con relacin a la que reciben. Note en particular las oscilaciones y
la frecuencia espacial que se ilustra en los perfiles horizontal y vertical.
En el perfil vertical hay una oscilacin poco marcada en el sector del embalse pero quizs con la
ms alta frecuencia (mayor cantidad de "ondas" o ciclos por unidad de distancia); luego viene una
"onda" de muy alto valor reflectivo que corresponde al reflejo de energa desde el camino (franja
blanca brillante), le sigue una baja de reflectancia que corresponde a una franja de un herbazal
arbustivo; posteriormente viene otra "onda" de alta reflectancia que corresponde al suelo
desnudo y, finalmente, se entra en una larga fase de oscilacin peridica muy bien definida que
corresponde a las variaciones en la cantidad de luz reflejada, segn nos posicionemos en la copa,
4
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
las "vertientes" o el "valle" entre arbustos, sobre una misma hilera de la plantacin. La parte
elevada de cada "onda" es este ltimo tramo coincide aproximadamente con la parte superior de
la copa de cada arbusto y su frecuencia espacial coincide por tanto con la distancia a que se
siembra el cultivo.
5
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
6
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Temperatura Ti vs Ti+0.25h
25
24 y = 0.979x + 0.4399
23
R = 0.9682
Temperatura Ti+0.25h
22
21
20
19
18
17
16
15
15 17 19 21 23 25
Temperatura Ti
7
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
12
podra establecerse con relacin al vecino ms 10
cercano. 8
4
La figura 11 muestra que la comparacin con el
2
segundo vecino en direccin NE hace decrecer el 0
0 5 10 15 20 25
coeficiente de correlacin lineal de un valor de 1.00, a
Altitud
un valor r= 0.967 y R2 = 0.9345.
Figura 11. Diagrama de dispersin y ecuacin de
Este caso representa variaciones de altitud en un regresin para un desplazamiento espacial de dos
territorio reducido, por lo que es razonable esperar pxeles al noreste.
que el fenmeno presente elevada continuidad espacial cuando se comparan celdas que estn a
distancias cortas y moderadas. De igual manera, es conocido que la variable altitud del relieve
tiene una elevada parsimonia, cambiando por lo general de forma muy gradual sobre el plano
(E,N).
La autocorrelacin espacial puede ser calculada para la totalidad de los datos (autocorrelacin
global) o para los datos del "vecindario" o entorno inmediato (autocorrelacin local). En el primer
caso se tiene un nico ndice de autocorrelacin para toda el rea de estudio, mientras en el
segundo caso se tiene un ndice de autocorrelacin espacial para cada punto, lnea o polgono del
mapa.
8
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Para medir la autocorrelacin espacial se suelen utilizar ndices de correlacin diferentes a la "r"
de Pearson. Estos ndices tienen la particularidad de incorporar en el algoritmo de clculo, lo que
se conoce como la matriz de interaccin espacial. Dicha matriz tiene por objeto definir el peso
particular que tendr cada punto-dato (cada dato localizado) en el clculo final del ndice de
autocorrelacin espacial. Los pesos por lo general son asignados atendiendo la mencionada
"primera ley de la geografa de Waldo Tobler" y se basan ya sea en contigidad (colindancias que
definen vecindad) o en distancia (Euclideana o Manhattan); de este modo, los vecinos de primer
orden tendrn ms peso que los vecinos de segundo orden en el clculo de la autocorrelacin
espacial, o bien, los vecinos ms distantes tendras una influencia menor que los ms cercanos, en
el clculo de la autocorrelacin espacial.
En general el ndice de autocorrelacin positivo se interpreta como una seal de que la reparticin
espacial de los valores observados cumple con el supuesto de Tobler, observndose una tendencia
al agrupamiento de valores similares en el espacio; es decir, hay un agrupamiento ms all de lo
que podra ser esperado razonablemente para una reparticin al azar. Por otra lado, un ndice de
autocorrelacin negativo indica tendencia a la excesiva dispersin espacial de los valores similares,
lo que lleva a un patrn dispersado ms all de lo que razonablemente puede producir el azar.
Los ndices de autocorrelacin espacial son en general estadsticos inferenciales, lo que significa
que para interpretar correctamente el valor del ndice es importante someterlo a una prueba de
hiptesis. En la prueba de hiptesis, se pueden hacer presunciones como:
Hiptesis nula (H0): "el proceso espacial que causa el patrn de valores observado es producido
por azar".
Hiptesis alternativa (H1): " el proceso espacial que causa el patrn de valores observado NO es
producido por azar".
9
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
valores estandarizados (z) para niveles de significancia de 1, 5 y 10% para pruebas de dos colas2
son z = 1.654, z = 1.96 y z = 2.58, como se puede comprobar en las tablas de probabilidad
asociadas a la funcin de distribucin de probabilidad normal, y como se ilustra en la figura 12.
En dicha figura, la regin en color amarillo, definida entre los valores estandarizados -1.645 z
1.645 corresponde a la regin de aceptacin de la hiptesis nula, es decir, no hay suficiente
certeza (al 90% de confianza) como para pensar que el resultado no es producto del azar. En las
colas de la distribucin, ms all de -1.645 y +1.645 (regiones coloreadas en tonos de azul y de rojo
respectivamente), se rechaza la hiptesis nula y se acepta por tanto que el resultado no es
producido por azar, con niveles de confianza de entre 90 y 95% para las regiones del azul claro y
rojo claro; de entre 95 y 99% para las regiones del azul intermedio y rojo intermedio, y ms del
99% para las regiones en rojo y azul oscuro.
I de Moran global:
Este ndice de autocorrelacin espacial fue definido por Patrick Alfred Pierce Moran (Figura 13),
estadstico australiano (1917-1988), quien trabaj en la Universidad Nacional de Australia (1952-
1983).
Como otros ndices de correlacin, la I de Moran bsicamente expresa la razn entre en valor de la
covarianza (dividendo) y el producto de las varianzas (divisor). En este caso, por tratarse de una
sola variable, la covarianza se establece entre cada elemento (i) del mapa menos su valor
promedio, y cada elemento vecino (j)menos su valor promedio. De igual manera, el producto de
las varianzas se reduce al cuadrado de la varianza de la nica variable considerada. Tanto la
cavarianza (en el dividendo), como la varianza cuadrada (en el divisor) estn multiplicadas por el
peso de cada uno de los elementos considerados en el proceso de clculo. El peso puede asignarse
por contigidad (1: para elementos contiguos, 0: para elementos no contiguos) o con base en el
2
Prueba convencional donde se asume que los eventos extremos altos y bajos tienen igual oportunidad de
ocurrir.
10
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
recproco de la distancia (1/dij 1/dij2 por lo general) entre los elementos (puntos o polgonos) del
mapa.
La figura 14 ilustra los resultados del clculo del ndice glogal I de Moran, para la variable "servicio
de electricidad y telefona", en la
ciudad de San Ramn y sus
alrededores (Figura 1). El valor I de
Moran global (0.36) sugiere
tendencia al agrupamiento, lo cual
concuerda con el supuesto de
autocorrelacin espacial de Tobler
y concuerda tambin con lo que
muestra la figura 1. El valor
estandarizado z = 18.39, en la cola
derecha de la distribucin, indica
un patrn agrupado muy difcil de
obtener por azar, con una
probabilidad (p-value) menor de 1
en un milln).
La interpretacin del resultado sera: Dado el valor z de 18.39, hay menos de 1% de probabilidad
de que este patrn agrupado pueda ser el resultado del azar.
Arthur Getis, gegrafo estadounidense, profesor emrito, San Diego State University y J Keith Ord,
profesor retirado de Business Statistics, Georgetown University, son
coautores del mtodo de clculo de la autocorrelacin espacial que lleva su
nombre (G de Getis y Ord).
11
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Donde: xi y xj son atributos de los objetos (i,j) y wij es el peso espacial entre el objeto i y el objeto j;
n es el nmero de objetos en el mapa y la expresin j i indica que los caracteres (i,j) no pueden
ser el mismo objeto. La nica diferencia entre el numerador y el denominador es el peso (wij). Para
la implementacin en ArcGIS, la herramienta Clustering alto/bajo slo funciona con valores
positivos.
c de Geary global:
12
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
pequeos de c indican autocorrelacin espacial positiva, mientras que valores grandes de c indican
autocorrelacin espacial negativa. Por lo tanto, este estadstico se comporta de forma inversa a los
anteriores.
Para cada uno de los ndices de autocorrelacin espacial globales que hemos descrito, existe su
equivalente local, que es igual o ms interesante para los gegrafos, ya que devuelve como
resultado un mapa con valores de autocorrelacin para cada objeto del mapa y permite hacer una
clasificacin temtica basada en agrupaciones basadas en el nivel de significancia y la orientacin
(positiva o negativa) del ndice.
I de Moran local:
Figura 17. Ph.D. Luc Anselin De acuerdo con Anselin (10), un LISA debe cumplir con dos requisitos:
2. La suma de los LISAs para todas las observaciones es proporcional a un indicador global de
asociacin espacial. Este es un requerimiento importante si el propsito es determinar el grado en
el cual un estadstico global es representativo del patrn medio de asociacin local.
diferentes a cero solo a los vecinos ms cercanos (en efecto, la suma incluye solo el vecindario).
Los pesos espaciales wij pueden ser estandarizados (los pesos suman 1) para facilitar la
comparacin de diferentes grupos de resultados.
13
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
La I de Moran es entonces:
Donde:
S0 =
La figura 18 ilustra el resultado para el clculo de la I de Moran local utilizando contigidad como
criterio para definir el "vecindario" de cada uno de los elementos del mapa.
Note que el algoritmo detecta los grupos homogneos y los utiliza para crear el mapa temtico. En
este caso solo estn presentes los grupos HH y LL, que corresponden a valores estadsticamente
significativos a un nivel de significancia de 5% y superior, que en el caso HH corresponden a una
agrupacin de valores altos fuertemente autocorrelacionados, y en el caso LL corresponden a una
agrupacin de valores bajos altamente correlacionados. Otros grupos que detecta el algoritmo son
los HL (extremos altos rodeados de valores inferiores) y LH (extremos mnimos rodeados de
valores superiores).
El tamao del vecindario y la forma en que se asignan los pesos de la matriz de interaccin
espacial tiene influencia en el resultado de la I de Moran local.
14
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Figura 18. Grupos de autocorrelacin local usando I de Moran. Resultados obtenidos con ArcGIS para la variable
Indide de Electriciad y Telefona (SERVET).
15
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Figura 20. Grupos de autocorrelacin espacial estadsticamente significativos usando I de Moran local.
La figura 21 muestra los niveles de significancia que produce el anlisis de autocorrelacin espacial
utilizando I de Moran local. En este caso se obtuvieron significancias del 1% y 5%, pero no del
1/1000, y 1/10,000, conforme a la leyenda pre-establecida para este tipo de mapa, usando GeoDA.
Vale la pena destacar que en este caso los grupos locales son ms compactos y el total de
elementos que no muestran autocorrelacin significativa al 5% de significancia o inferior se redujo
notablemente.
Tanto GeoDA como ArcGIS permiten guardar los valores locales de I de Moran, valor
estandarizado de la I de Moran, y valor de probabilidad (p-value). En la figura 22 se muestra la
tabla con los resultados obtenidos en ArcGIS.
16
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Figura 22. Tabla de valores del ndice I de Moran, as como el ndice mantiene para esos objetos
estandarizados de la I, y el p-value estimado. con valor inferior al 0.05 (5%
de significancia).
Interpretacin:
Un valor positivo de I indica que un objeto tiene objetos vecinos con valores atributivos
semejantes (altos/bajos); el objeto es parte de un cluster. Un valor negativo de I indica que un
objeto tiene objetos vecinos con valores dismiles; este objeto es un pico (outlier). En ambos
casos el valor p para el objeto debe ser suficientemente pequeo para que el cluster o outlier sea
considerado estadsticamente significativo
El ndice de autocorrelacin local (Gi de Getis y Ord) es conocido tambin como "anlisis de puntos
calientes" en referencia a que el ndice permite hallar puntos calientes y fros estadsticamente
significativos.
Donde xj es el valor del atributo (SERVET) para el objeto (j); wi,j es el peso espacial entre el objeto i
y el objeto (j); n es el nmero total de objetos, y:
17
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
El estadstico Gi* es un valor estandarizado en s mismo (un valor Z), as que no se requiere ningn
clculo adicional.
El valor Gi* para la variable SERVET para el sector de San Ramn, con una matriz de interaccin
espacial basada en la funcin inversa de la distancia, se muestra en la Figura 23. En este caso solo
16/173 elementos son estadsticamente significativos a un nivel de confianza superior al 90%.
Figura 23. Gi* local de Getis y Ord para la variable SERVET, usando pesos basados en el recproco de la distancia (1/d ij),
sector San Ramn de Alajuela.
Claramente se nota que la variable SERVET, analizada con el algoritmo Gi*, usando una matriz de
interaccin espacial basada en contigidad, presenta dos puntos calientes en San Ramn Centro, y
puntos fros al Este, Sur y Oeste en el rea periurbana.
18
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Figura 24. Gi* local de Getis y Ord para la variable SERVET, usando pesos basados en contigidad espacial, sector San
Ramn de Alajuela.
Cuando se procesa la muestra de 173 segmentos censales (versin del ao 2000 del mapa),
usando el algoritmo Gi*, en el software GeoDa, resulta un mapa de agrupamientos (clusters), que
se ilustra en la figura 25; as como un mapa de significancia medida a travs de los valores de
probabilidad (p-values).
A diferencia de la figura 24, las figuras 25 y 26, obtenidas en GeoDa, muestran un agrupamiento
compacto de valores similares altos en todo el centro urbano de San Ramn, y evidencian
tendencia al agrupamiento de valores similares bajos principalmente en el sector este de San
Ramn.
Figura 25. Agrupamientos espaciales usando Gi* local de Getis y Ord para la variable SERVET, sector San Ramn de
Alajuela, usando el software GeoDa.
19
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
El ncleo de alta autocorrelacin de valores bajos del sector oeste (Figura 24), prcticamente
desaparece en las figuras 25 y 26, lo que podra deberse a diferencias en la compilacin de la
matriz de interaccin espacial, o bien a diferencias ms sustantivas en la forma en que se
implement el algoritmo en GeoDa y ArcGIS.
Figura 26. Niveles de significancia para los agrupamientos espaciales usando Gi* local de Getis y Ord para la variable
SERVET, sector San Ramn de Alajuela, usando el software GeoDa.
K de Ripley:
Esta funcin lleva debe su nombre en honor a su creador Bryan David Ripley (1952), estadstico
ingls, formado en Cambridge University, profesor retirado de Oxford en el ao 2014. El autor ha
hecho grandes contribuciones en los campos de la estadstica espacial y el reconocimiento de
patrones y colabor en la creacin de los lenguajes de programacin S y R, de uso extendido en
estadstica y estadstica espacial.
Diversas variantes de la funcin original K de Ripley han sido sugeridas. En ArcGIS se implement
una transformacin de K conocida como L(d):
20
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Donde: d es la distancia, n es igual al nmero total de objetos, A representa el rea total de los
objetos y ki,j es un peso. Si no hay correccin de borde, el peso ser igual a uno cuando la distancia
entre i y j es menos que d, y ser cero en caso contrario. Usar un mtodo especifico de correccin
de borde modificar ki,j ligeramente.
La K de Ripley determina si los objetos, o los valores asociados con los objetos, exhiben
agrupamiento o dispersin estadsticamente significativos dentro de un rango de distancias.
La funcin K de Ripley para la variable SERVET muestra tendencia al agrupamiento para rangos de
distancia que van de 200 a 2500 metros (Figura 28).
21
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Figura 28. Funcin K de Ripley para la variable SERVET, sobre rangos de distancia de 200 a
2500 metros.
D0 es la distancia media observada entre cada uno de los objetos y su vecinos ms cercanos:
22
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
23
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.
Este anlisis implementado en las ltimas versiones de ArcGIS resulta bastante prctico. En alguna
medida guarda relacin con el anlisis de semivarianza que se practica en la Geoestadstica, como
veremos ms adelante en el curso, pero es ms limitado en el sentido de que no crea una funcin
matemtica de la dependencia entre la autocorrelacin y la distancia.
El algoritmo mide la
autocorrelacin espacial para
una serie de distancias y
opcionalmente crea un grfico
de lnea de dichas distancias y
sus correspondientes valores
estandarizados (z-value),
figura 31. Dichos valores
reflejan la intensidad del
agrupamiento espacial, y picos
significantes de los valores z
indican distancias donde el proceso
Figura 31. Resultados del anlisis con el algoritmo para clculo de la
autocorrelacin espacial incremental. espacial que promueve
agrupamientos es ms intenso. Estas
distancias pico generalmente son valores apropiados para ser usadas cuando se solicitan
parmetros como Bandas de Distancia o Radios de Distancia.
La figura 32 ilustra el
resultado grfico del anlisis
incremental para la variable
SERVET en el sector San
Ramn de Alajuela.
24