You are on page 1of 24

Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Curso GF-0102 Anlisis Espacial

Tema 5. Primera ley de la geografa e


ndices de autocorrelacin espacial.
Rafael Arce Mesn
Escuela de Geografa, Universidad de Costa Rica
Febrero, 2015.

FRECUENCIA Y CONTINUIDAD ESPACIAL

Introduccin:

Uno de los temas de mayor relevancia en la ciencia de la geografa es la cuestin de la


organizacin espacial de los fenmenos. La evidencia emprica muestra que por lo general los
fenmenos geogrficos son semi-estructurados o semi-organizados en el espacio, mostrando
existencia de controles determinsticos basados en relaciones causa-efecto, pero tambin
mostrando que hay mucha variabilidad local difcil de modelar con ecuaciones determinsticas,
donde una aproximacin probabilstica encaja mejor (Figura 1).

Figura 1. Reparticin espacial del ndice de servicios de electricidad y telefona. Fuente no conocida.

Tambin hay mucha evidencia emprica que esta es una situacin parece repetirse en diversas
escalas espaciales, por lo que hay que ser extremadamente cuidadoso al dar conclusiones a partir
de un anlisis de caso que no tenga en cuenta el tema de la escala del estudio.

En geografa interesan tanto las regularidades como las excepciones, pero claramente la idea de
existencia de un orden espacial es un concepto clave pues en cierta medida da relevancia a
nuestra disciplina. As, por ejemplo, si la reparticin espacial de la mayora de las variables de

1
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

inters para la geografa fuera completamente al azar, la geografa tendra que estudiar cada
unidad territorial como un caso particular, lo que se conoce como el enfoque "ideogrfico" y fue
una corriente filosfica fuerte en la disciplina hace ya muchas dcadas. Por otra parte, una
reparticin espacial ajustada a una funcin de probabilidad definida, por ejemplo, la normal, dara
mucho crdito a la prediccin estocstica que podra hacerse desde la disciplina de la Estadstica o
desde la Geografa, pero usando bsicamente tcnicas propias de la estadstica. Contrariamente,
cuando los fenmenos son organizados o semi-organizados, existe la posibilidad de adoptar
modelos estocsticos para describir la componente errtica1 de la variacin, pero tambin
modelos determinsticos para describir los patrones de distribucin ms regulares. Considerando
adems que las distribuciones semi-estructuradas (semi-organizadas en el espacio) son
multiescalares, es posible hallar tambin patrones repetitivos y buscar principios generales que
expliquen estas configuraciones, lo que se conoce como el enfoque "nomottico" por oposicin al
mencionado "excepcionalismo".

En favor del enfoque nomottico Waldo Tobler (gegrafo y cartgrafo suizo-estadounidense,


Figura 2) enunci lo que se conoce como Primera Ley de la Geografa, la cual dice: "... todo est
relacionado con todo lo dems, pero las cosas que estn ms cerca estn ms relacionadas que
las cosas que estn ms distantes" (Tobler, 1970, p.236). Aunque se trata de una "ley estadstica",
este principio muestra una fortaleza remarcable y se aplica tanto en las ciencia fsicas, como en las
ciencias sociales. En trminos puramente geogrficos,
este principio explica la observacin comn que la
reparticin espacial de muchos fenmenos es
espacialmente organizada y susceptible de ser
descrita, explicada y proyectada, usando el mtodo
cientfico.

Aplicado a la figura 1, este principio supone que la


cantidad de contactos rojo-rojo, azul-azul, rojo-
naranja y viceversa, amarillo-azul claro y amarillo-
naranja, por citar algunos, tienen una frecuencia de
ocurrencia mucho mayor que los contactos rojo-
amarillo, azul-amarillo, rojo-azul y viceversa,
justamente porque estos ltimos ponen en contacto
situaciones muy asimtricas. Esto explica, por
ejemplo, que la condicin de pobreza se concentre en
Figura 2. Waldo Tobler, Chicago, 2007. Fuente: ciertas regiones, mientras la riqueza ocupa otras
https://en.wikipedia.org/wiki/Waldo_R._Tobler regiones, al tiempo que se desarrollan bandas de
transicin que marcan distintos tintes entre las dos situaciones extremas. Esto es vlido para
procesos fsicos tambin, por ejemplo, si se analiza la variacin de la precipitacin sobre un

1
La componente errtica sera aquella que difiere de la tendencia general, que es variable localmente y cuya
distribucin es ms difcil de modelar con una simple ecuacin matemtica determinstica.

2
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

territorio amplio y con relieve contrastado, suelen aparecer ncleos de alta precipitacin (en
barlovento por lo general) y de baja precipitacin (en sotavento).

Conceptos de frecuencia y continuidad espacial:

Frecuencia es un concepto comn aunque quizs se le utilice en forma vaga por parte de la
mayora de las personas. En las ciencias fsicas, la frecuencia se refiere al nmero de repeticiones
por unidad de tiempo de cualquier fenmeno o suceso peridico (Figura 3). En el Sistema
Internacional de Unidades (SI), la frecuencia se mide en Hercios (Hz). Un Hercio corresponde a un
evento por segundo.

Figura 3. Oscilacin de temperatura del aire (color azul) y de la presin atmosfrica (color negro). Frecuencia
aproximada de 1/24 horas y 2/24 horas respectivamente.

En geografa nos interesa este concepto de frecuencia y muchas propiedades de la luz, como
veremos en el curso Teledeteccin y otros, pero de momento, en el curso Anlisis Espacial,
estamos ms interesados en el concepto de frecuencia espacial de los eventos. Por analoga con la
definicin fsica de frecuencia (temporal), los gegrafos podemos utilizar el concepto de
frecuencia espacial, el cual hace referencia al nmero de repeticiones por unidad de distancia o
por unidad de rea, siendo este segundo concepto ms apropiado en opinin del autor.

En geografa, a diferencia de lo que ocurre en las ciencias fsicas, las frecuencias de los eventos
suelen no ser estables, de modo que por frecuencia espacial entendemos a menudo, una situacin
promedio; por ejemplo: la frecuencia de parcelas de caa por kilmetro cuadrado en la regin
caera de Grecia. Se trata de una aproximacin ms flexible al concepto de frecuencia de los
fsicos, pero no por eso, menos importante, como se mostrar a continuacin.

3
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

La frecuencia espacial de los fenmenos se relaciona en forma inversa con la continuidad


espacial de tal fenmeno. Consideremos, por ejemplo, el mapa topogrfico de la Figura 4. La
frecuencia con que se repiten las curvas de nivel (nmero de curvas por unidad de rea) es menor
en el sector oeste con relacin al sector este,
por lo que el relieve tiene mayor continuidad, o

Figura 4. Mapa Topogrfico. cambia ms pausadamente en el sector oeste

que en el sector este.

De igual manera, la figura 5, muestra una situacin


de elevada discontinuidad espacial si se
considera un relieve profundamente
disectado (curvas de nivel en rojo), versus
una situacin donde el relieve ha sido
generalizado y presenta mayor continuidad (curvas
en verde).

Cuando se compara entre variables de inters para la geografa, como la


Figura 5. Indentacin de las curvas de nivel y
presin atmosfrica, la lluvia, el valor del suelo, la concentracin de
continuidad espacial. Elaboracin propia.
un contaminante, las tasas de mortalidad, etc., se aprecian notables
contrastes en trminos de continuidad espacial a escalas equivalentes; por ejemplo, la
continuidad espacial puede extenderse justo a unos pocos metros para ciertas propiedades
qumicas del suelo, pero puede extenderse a miles de kilmetros para la temperatura del aire. Este
hecho, ms el valor de conocer la estructura espacial de cada variable en s misma, justifican
ampliamente el esfuerzo que conlleva el anlisis estructural del espacio geogrfico.

Un ltimo ejemplo de frecuencia y continuidad espacial que mencionaremos ac, podra ser el
caso de la reparticin de la cobertura del terreno, medida a travs de la reflectancia de la
vegetacin (Figura 6). La reflectancia es el porcentaje de energa radiante que los diversos
materiales devuelven al espacio, con relacin a la que reciben. Note en particular las oscilaciones y
la frecuencia espacial que se ilustra en los perfiles horizontal y vertical.

En el perfil vertical hay una oscilacin poco marcada en el sector del embalse pero quizs con la
ms alta frecuencia (mayor cantidad de "ondas" o ciclos por unidad de distancia); luego viene una
"onda" de muy alto valor reflectivo que corresponde al reflejo de energa desde el camino (franja
blanca brillante), le sigue una baja de reflectancia que corresponde a una franja de un herbazal
arbustivo; posteriormente viene otra "onda" de alta reflectancia que corresponde al suelo
desnudo y, finalmente, se entra en una larga fase de oscilacin peridica muy bien definida que
corresponde a las variaciones en la cantidad de luz reflejada, segn nos posicionemos en la copa,

4
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

las "vertientes" o el "valle" entre arbustos, sobre una misma hilera de la plantacin. La parte
elevada de cada "onda" es este ltimo tramo coincide aproximadamente con la parte superior de
la copa de cada arbusto y su frecuencia espacial coincide por tanto con la distancia a que se
siembra el cultivo.

En el perfil horizontal la oscilacin es mucho mejor definida y ms constante que en el perfil


vertical, pues los cambios mejor definidos coinciden con la interposicin de hileras de cultivo
(reflectancia de la vegetacin verde) y el espacio entre hileras (reflectancia del suelo desnudo).

Figura 6. Perfiles de reflectancia como medida de la frecuencia y continuidad espacial

Concepto de autocorrelacin espacial:

Para medir la continuidad espacial o parsimonia de una variable distribuida en el espacio se


utilizan diversos coeficientes de autocorrelacin. Al igual que la conocida "r" de Pearson, estos
coeficientes miden la razn entre la covarianza de las variables involucradas y el producto de sus
varianzas:

5
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

No obstante, los coeficientes de autocorrelacin lo que miden es la correlacin de una variable


consigo misma, pero con un desfase temporal, espacial o espacio-temporal. En este curso, nos
interesaremos particularmente por el segundo caso, conocido como autocorrelacin espacial,
pero se hace una breve nota sobre autocorrelacin temporal.

Temperatura Temperatura Temperatura Conceptualmente, la autocorrelacin temporal,


Ti Ti+0.25h Ti+0.50h consiste en correlacionar una variable consigo misma,
17.6 tomando en cuenta un desfase temporal que resulte
17.6 17.6
17.6 17.6 17.8 de inters. La figura 7 muestra una tabla diseada
17.6 17.8 17.9 para realizar el clculo de autocorrelacin temporal y
17.8 17.9 17.6
la Figura 8 muestra el diagrama de dispersin
17.9 17.6 17.4
17.6 17.4 17.1 resultante.
17.4 17.1 17.2
17.1 17.2 17.2 En este caso, se va a correlacionar temperatura de
17.2 17.2 17.2
una estacin con temperatura en la misma estacin,
17.2 17.2 16.8
17.2 16.8 17.1 pero con un desfase temporal de 0.25 y 0.50 horas (15
16.8 17.1 17 y 30 min respectivamente). Los datos representan
17.1 17 17.1
17 17.1 17.2
valores medios de temperatura para perodos de
17.1 17.2 16.9 observacin de 15 minutos. De este modo, el desfase
17.2 16.9 17.1 de 15 min corresponde a un desplazamiento de los
16.9 17.1 16.9
datos de solo una celda en la hora de clculo
(columna intermedia. Al comparar la temperatura actual (Ti), con la temperatura 15 min ms tarde
(Ti+0.25) el diagrama (Figura 8), muestra una significativa dispersin de los valores relacionados, lo
cual se expresa en un coeficiente de correlacin "r" de 0.984 y un coeficiente de determinacin R2
de 0.968.

6
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Temperatura Ti vs Ti+0.25h
25
24 y = 0.979x + 0.4399
23
R = 0.9682
Temperatura Ti+0.25h

22
21
20
19
18
17
16
15
15 17 19 21 23 25
Temperatura Ti

Claramente, si aumentamos el desfase temporal a 30 min, 1 hora y ms, se espera que la


autocorrelacin decrezca de forma ms o menos rpida hasta hallar un valor que revele el lmite
de persistencia o parsimonia temporal de la variable considerada, cuando la autocorrelacin caiga
a valores cercanos a cero.

En el caso de fenmenos distribuidos en el tiempo, la persistencia de un fenmeno est


relacionada con los mecanismos causales. La temperatura diaria, desde luego, est relacionada
principalmente con el balance de calor (estado inicial + ingresos - egresos). Este balance de calor
es positivo durante casi todo el perodo diurno, pero alcanza su valor mximo hacia las 2 p.m.,
cuando la temperatura suele ser la ms alta. Por otra parte, el balance es negativo desde el
anochecer, pero alcanza su valor mnimo justo antes de la salida del sol, momento en que ocurre
el mnimo de temperatura. Por lo tanto, un ciclo de calentamiento diurno mostrar una cierta
persistencia y continuidad temporal como mximo por algunas horas.

7
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

De manera anloga, la continuidad o persistencia espacial de una propiedad repartida en el


espacio puede ser hallada calculando la correlacin de una variable consigo misma, pero con un
desfase posicional (Figuras 9 y 10).
12 11 10 9 8
14 13 12 11 10 13 12 11 10 9
16 15 14 13 12 11 16 15 14 13 12 11 10
17 16 15 14 13 12 17 16 15 14 13 12 11
18 17 16 15 14 13 18 17 16 15 14 13 12
19 18 17 16 15 14 19 18 17 16 15
20 19 18 17 16 20 19 18 17 16
Figura 9. Matriz espacial con desfase de una Figura 10. Matriz espacial con desfase de dos celdas
celda al noreste. al noreste.

En la figura 9 cada valor se compara con su primer Altitud = f(altitud + ds=2)


vecino al NE, mientras en la figura 10 cada valor se 18

compara con su segundo vecino al NE. En el caso de 16 y = 1.113x - 6


2
14 R = 0.9345
polgonos irregulares o valores puntuales la relacin
Altitud + ds=2

12
podra establecerse con relacin al vecino ms 10

cercano. 8

4
La figura 11 muestra que la comparacin con el
2
segundo vecino en direccin NE hace decrecer el 0
0 5 10 15 20 25
coeficiente de correlacin lineal de un valor de 1.00, a
Altitud
un valor r= 0.967 y R2 = 0.9345.
Figura 11. Diagrama de dispersin y ecuacin de
Este caso representa variaciones de altitud en un regresin para un desplazamiento espacial de dos
territorio reducido, por lo que es razonable esperar pxeles al noreste.
que el fenmeno presente elevada continuidad espacial cuando se comparan celdas que estn a
distancias cortas y moderadas. De igual manera, es conocido que la variable altitud del relieve
tiene una elevada parsimonia, cambiando por lo general de forma muy gradual sobre el plano
(E,N).

Autocorrelacin global versus autocorrelacin local:

La autocorrelacin espacial puede ser calculada para la totalidad de los datos (autocorrelacin
global) o para los datos del "vecindario" o entorno inmediato (autocorrelacin local). En el primer
caso se tiene un nico ndice de autocorrelacin para toda el rea de estudio, mientras en el
segundo caso se tiene un ndice de autocorrelacin espacial para cada punto, lnea o polgono del
mapa.

8
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Indices de autocorrelacin espacial:

Para medir la autocorrelacin espacial se suelen utilizar ndices de correlacin diferentes a la "r"
de Pearson. Estos ndices tienen la particularidad de incorporar en el algoritmo de clculo, lo que
se conoce como la matriz de interaccin espacial. Dicha matriz tiene por objeto definir el peso
particular que tendr cada punto-dato (cada dato localizado) en el clculo final del ndice de
autocorrelacin espacial. Los pesos por lo general son asignados atendiendo la mencionada
"primera ley de la geografa de Waldo Tobler" y se basan ya sea en contigidad (colindancias que
definen vecindad) o en distancia (Euclideana o Manhattan); de este modo, los vecinos de primer
orden tendrn ms peso que los vecinos de segundo orden en el clculo de la autocorrelacin
espacial, o bien, los vecinos ms distantes tendras una influencia menor que los ms cercanos, en
el clculo de la autocorrelacin espacial.

En general el ndice de autocorrelacin positivo se interpreta como una seal de que la reparticin
espacial de los valores observados cumple con el supuesto de Tobler, observndose una tendencia
al agrupamiento de valores similares en el espacio; es decir, hay un agrupamiento ms all de lo
que podra ser esperado razonablemente para una reparticin al azar. Por otra lado, un ndice de
autocorrelacin negativo indica tendencia a la excesiva dispersin espacial de los valores similares,
lo que lleva a un patrn dispersado ms all de lo que razonablemente puede producir el azar.

Los ndices de autocorrelacin espacial son en general estadsticos inferenciales, lo que significa
que para interpretar correctamente el valor del ndice es importante someterlo a una prueba de
hiptesis. En la prueba de hiptesis, se pueden hacer presunciones como:

Hiptesis nula (H0): "el proceso espacial que causa el patrn de valores observado es producido
por azar".

Hiptesis alternativa (H1): " el proceso espacial que causa el patrn de valores observado NO es
producido por azar".

Para rechazar la hiptesis nula (H0) es


comn que en estadstica se exija un
nivel de significancia mximo de entre 1
y 10%, lo que equivale a una
probabilidad de error o equivocacin en
la decisin (aceptar o rechazar la
hiptesis nula), que va de 1 en cada 100
casos (1%), a 1 en cada 10 casos (10%).
Igualmente se pueden utilizar
cualesquiera otros niveles de
significancia.
Figura 12. Funcin de distribucin de probabilidad normal con
regiones de significancia de 10, 5 y 1% La prueba de hiptesis se plantea por lo
general con relacin a la funcin de distribucin de probabilidad normal estndar, donde los

9
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

valores estandarizados (z) para niveles de significancia de 1, 5 y 10% para pruebas de dos colas2
son z = 1.654, z = 1.96 y z = 2.58, como se puede comprobar en las tablas de probabilidad
asociadas a la funcin de distribucin de probabilidad normal, y como se ilustra en la figura 12.

En dicha figura, la regin en color amarillo, definida entre los valores estandarizados -1.645 z
1.645 corresponde a la regin de aceptacin de la hiptesis nula, es decir, no hay suficiente
certeza (al 90% de confianza) como para pensar que el resultado no es producto del azar. En las
colas de la distribucin, ms all de -1.645 y +1.645 (regiones coloreadas en tonos de azul y de rojo
respectivamente), se rechaza la hiptesis nula y se acepta por tanto que el resultado no es
producido por azar, con niveles de confianza de entre 90 y 95% para las regiones del azul claro y
rojo claro; de entre 95 y 99% para las regiones del azul intermedio y rojo intermedio, y ms del
99% para las regiones en rojo y azul oscuro.

I de Moran global:

Este ndice de autocorrelacin espacial fue definido por Patrick Alfred Pierce Moran (Figura 13),
estadstico australiano (1917-1988), quien trabaj en la Universidad Nacional de Australia (1952-
1983).

Figura 13. Mr. P. A. Pierce Moran.

Donde: wij es un elemento de la matriz de proximidad espacial; los


valores del atributo yi tienen media y ; el nmero de zonas es n; los subndices (i,j) se refieren a
cada elemento del mapa (polgono o punto) y a sus vecinos, respectivamente; el atributo yi es la
propiedad repartida en el espacio; cuando I de Moran es positivo indica agrupamiento de valores
similares, mientras que cuando I es negativo indica dispersin de valores similares; el valor de cero
indica cero autocorrelacin espacial.

Como otros ndices de correlacin, la I de Moran bsicamente expresa la razn entre en valor de la
covarianza (dividendo) y el producto de las varianzas (divisor). En este caso, por tratarse de una
sola variable, la covarianza se establece entre cada elemento (i) del mapa menos su valor
promedio, y cada elemento vecino (j)menos su valor promedio. De igual manera, el producto de
las varianzas se reduce al cuadrado de la varianza de la nica variable considerada. Tanto la
cavarianza (en el dividendo), como la varianza cuadrada (en el divisor) estn multiplicadas por el
peso de cada uno de los elementos considerados en el proceso de clculo. El peso puede asignarse
por contigidad (1: para elementos contiguos, 0: para elementos no contiguos) o con base en el

2
Prueba convencional donde se asume que los eventos extremos altos y bajos tienen igual oportunidad de
ocurrir.

10
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

recproco de la distancia (1/dij 1/dij2 por lo general) entre los elementos (puntos o polgonos) del
mapa.

La figura 14 ilustra los resultados del clculo del ndice glogal I de Moran, para la variable "servicio
de electricidad y telefona", en la
ciudad de San Ramn y sus
alrededores (Figura 1). El valor I de
Moran global (0.36) sugiere
tendencia al agrupamiento, lo cual
concuerda con el supuesto de
autocorrelacin espacial de Tobler
y concuerda tambin con lo que
muestra la figura 1. El valor
estandarizado z = 18.39, en la cola
derecha de la distribucin, indica
un patrn agrupado muy difcil de
obtener por azar, con una
probabilidad (p-value) menor de 1
en un milln).

Figura 14. Prueba de hiptesis para el Indice de Moran global.

La interpretacin del resultado sera: Dado el valor z de 18.39, hay menos de 1% de probabilidad
de que este patrn agrupado pueda ser el resultado del azar.

G global de Getis y Ord:

Arthur Getis, gegrafo estadounidense, profesor emrito, San Diego State University y J Keith Ord,
profesor retirado de Business Statistics, Georgetown University, son
coautores del mtodo de clculo de la autocorrelacin espacial que lleva su
nombre (G de Getis y Ord).

La G general (global) de Getis y Ord mide el grado de agrupamiento de


valores altos o bajos para un rea de estudio determinada.

Figura 15. Ph.D. Arthur Getis

La ecuacin de la G general es:

11
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Donde: xi y xj son atributos de los objetos (i,j) y wij es el peso espacial entre el objeto i y el objeto j;
n es el nmero de objetos en el mapa y la expresin j i indica que los caracteres (i,j) no pueden
ser el mismo objeto. La nica diferencia entre el numerador y el denominador es el peso (wij). Para
la implementacin en ArcGIS, la herramienta Clustering alto/bajo slo funciona con valores
positivos.

Interpretacin. La herramienta G general de Getis-Ord es una estadstica deductiva (inferencial),


lo que significa que los resultados del anlisis se interpretan dentro del contexto de la hiptesis
nula. La hiptesis nula establece que no existe un agrupamiento (clustering) espacial de los
valores de las entidades. Cuando el valor P que devuelve la herramienta es pequeo y
estadsticamente significativo, la hiptesis nula se puede rechazar. Si se rechaza la hiptesis nula,
el signo del valor z se torna importante. Si el valor z es positivo, el ndice de G general observado
es mayor que el ndice de G general esperado, lo que indica que se agrupan valores altos para el
atributo en el rea de estudio. Si el valor z es negativo, el ndice de G general observada es
menor que el ndice de G general esperada, lo que indica que se agrupan valores bajos en el rea
de estudio.

La herramienta G general de Getis-Ord es ms adecuada cuando se tiene una distribucin de


valores similares y se buscan picos espaciales no esperados de valores altos.
Desafortunadamente, cuando se agrupan valores altos y bajos, estos tienden a cancelarse entre
s. Si desea medir un clustering espacial cuando se agrupan valores altos y bajos, mejor utilice la
herramienta Autocorrelacin espacial.

c de Geary global:

Robert C. Geary fue un influyente estadstico irlands (1896-


1983), director del Instituto de Investigacin econmica en
Dublin, Irlanda.

El estadstico conocido como razn de contigidad "c" de Geary,

es un ndice de autocorrelacin espacial donde los valores


Figura 16. Ph.D. Robert C. Geary

12
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

pequeos de c indican autocorrelacin espacial positiva, mientras que valores grandes de c indican
autocorrelacin espacial negativa. Por lo tanto, este estadstico se comporta de forma inversa a los
anteriores.

Para cada uno de los ndices de autocorrelacin espacial globales que hemos descrito, existe su
equivalente local, que es igual o ms interesante para los gegrafos, ya que devuelve como
resultado un mapa con valores de autocorrelacin para cada objeto del mapa y permite hacer una
clasificacin temtica basada en agrupaciones basadas en el nivel de significancia y la orientacin
(positiva o negativa) del ndice.

I de Moran local:

Luc Anselin, economista de origen belga, especialista en econometra


espacial y Ciencia Regional, director de la Escuela de Ciencias Geogrficas y
Planificacin Urbana de Arizona State University, public un libro clsico
Spatial Econometrics en 1979, cre el GeoDa Center for Geospatial Analysis
and Computation y desarroll una serie de indicadores de asociacin
espacial local (LISA, por sus siglas en ingls), entre ellos la I de Moran local.

Figura 17. Ph.D. Luc Anselin De acuerdo con Anselin (10), un LISA debe cumplir con dos requisitos:

1. El LISA para cada observacin indica la extensin de un


agrupamiento espacial alrededor de dicha observacin.

2. La suma de los LISAs para todas las observaciones es proporcional a un indicador global de
asociacin espacial. Este es un requerimiento importante si el propsito es determinar el grado en
el cual un estadstico global es representativo del patrn medio de asociacin local.

La I de Moran local para un elemento (i) viene dada por:

Las observaciones zi son desviaciones respecto a la media (y y ). Usualmente, se asigna pesos


i

diferentes a cero solo a los vecinos ms cercanos (en efecto, la suma incluye solo el vecindario).
Los pesos espaciales wij pueden ser estandarizados (los pesos suman 1) para facilitar la
comparacin de diferentes grupos de resultados.

13
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

La suma de los I de Moran locales (Ii) es:

La I de Moran es entonces:

Donde:

S0 =

La figura 18 ilustra el resultado para el clculo de la I de Moran local utilizando contigidad como
criterio para definir el "vecindario" de cada uno de los elementos del mapa.

Note que el algoritmo detecta los grupos homogneos y los utiliza para crear el mapa temtico. En
este caso solo estn presentes los grupos HH y LL, que corresponden a valores estadsticamente
significativos a un nivel de significancia de 5% y superior, que en el caso HH corresponden a una
agrupacin de valores altos fuertemente autocorrelacionados, y en el caso LL corresponden a una
agrupacin de valores bajos altamente correlacionados. Otros grupos que detecta el algoritmo son
los HL (extremos altos rodeados de valores inferiores) y LH (extremos mnimos rodeados de
valores superiores).

El tamao del vecindario y la forma en que se asignan los pesos de la matriz de interaccin
espacial tiene influencia en el resultado de la I de Moran local.

14
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Figura 18. Grupos de autocorrelacin local usando I de Moran. Resultados obtenidos con ArcGIS para la variable
Indide de Electriciad y Telefona (SERVET).

En el caso del programa GeoDa, se


tienen los resultados que se muestran
en las figuras 19, 20 y 21.

La figura 19 muestra el diagrama de


dispersin y lnea de tendencia para la
relacin entre los valores yi , de la
variable (Servicio de Electricidad y
Telefona, SERVET) y los valores yj ,
para los vecinos espacialmente
relacionados. Igualmente muestra el
valor global de la I de Moran (0.36),
resultado que es prcticamente igual
al reportado por ArcGIS (figura 14).

La figura 20 muestra los mismos tipos


Figura 19. Diagrama de dispersin mostrando la asociacin entre el de grupos espacialmente autocorrela-
valor de la variable SERVET medido en un elemento (i) del mapa y un
cionados a un nivel de significancia de
elemento (j) del vecindario local.
5%, pero adems de los grupos HH y
LL, aparecen tambin pequeos grupos o elementos individuales de los tipos LH y HL, que no se
identificaron en ArcGIS.

15
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Figura 20. Grupos de autocorrelacin espacial estadsticamente significativos usando I de Moran local.

La figura 21 muestra los niveles de significancia que produce el anlisis de autocorrelacin espacial
utilizando I de Moran local. En este caso se obtuvieron significancias del 1% y 5%, pero no del
1/1000, y 1/10,000, conforme a la leyenda pre-establecida para este tipo de mapa, usando GeoDA.

Figura 21. Nivel de significancia para la I de Moran local.

Vale la pena destacar que en este caso los grupos locales son ms compactos y el total de
elementos que no muestran autocorrelacin significativa al 5% de significancia o inferior se redujo
notablemente.

Tanto GeoDA como ArcGIS permiten guardar los valores locales de I de Moran, valor
estandarizado de la I de Moran, y valor de probabilidad (p-value). En la figura 22 se muestra la
tabla con los resultados obtenidos en ArcGIS.

16
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Como ejemplo, note que


tanto los polgonos
etiquetados LL como los
etiquetados HH, tienen un
alto valor del LMIndex (Local
Moran Index) pero tambin
del LMiZScore, que es el valor
estandarizado de la I de
Moran. Por su parte, el
campo LMiPValue se

Figura 22. Tabla de valores del ndice I de Moran, as como el ndice mantiene para esos objetos
estandarizados de la I, y el p-value estimado. con valor inferior al 0.05 (5%
de significancia).

Interpretacin:

Un valor positivo de I indica que un objeto tiene objetos vecinos con valores atributivos
semejantes (altos/bajos); el objeto es parte de un cluster. Un valor negativo de I indica que un
objeto tiene objetos vecinos con valores dismiles; este objeto es un pico (outlier). En ambos
casos el valor p para el objeto debe ser suficientemente pequeo para que el cluster o outlier sea
considerado estadsticamente significativo

G de Getis y Ord Local:

El ndice de autocorrelacin local (Gi de Getis y Ord) es conocido tambin como "anlisis de puntos
calientes" en referencia a que el ndice permite hallar puntos calientes y fros estadsticamente
significativos.

La G de Getis y Ord local (Gi*) est dada por:

Donde xj es el valor del atributo (SERVET) para el objeto (j); wi,j es el peso espacial entre el objeto i
y el objeto (j); n es el nmero total de objetos, y:

17
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

El estadstico Gi* es un valor estandarizado en s mismo (un valor Z), as que no se requiere ningn
clculo adicional.

El valor Gi* para la variable SERVET para el sector de San Ramn, con una matriz de interaccin
espacial basada en la funcin inversa de la distancia, se muestra en la Figura 23. En este caso solo
16/173 elementos son estadsticamente significativos a un nivel de confianza superior al 90%.

Figura 23. Gi* local de Getis y Ord para la variable SERVET, usando pesos basados en el recproco de la distancia (1/d ij),
sector San Ramn de Alajuela.

Se consigue un resultado aparentemente ms congruente con la realidad (Compare la Figura 24


con la Figura 1), si se repite el procesamiento, pero utilizando "contigidad de lados y esquinas"
(contiguite edge, corners).

Claramente se nota que la variable SERVET, analizada con el algoritmo Gi*, usando una matriz de
interaccin espacial basada en contigidad, presenta dos puntos calientes en San Ramn Centro, y
puntos fros al Este, Sur y Oeste en el rea periurbana.

18
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Figura 24. Gi* local de Getis y Ord para la variable SERVET, usando pesos basados en contigidad espacial, sector San
Ramn de Alajuela.

Cuando se procesa la muestra de 173 segmentos censales (versin del ao 2000 del mapa),
usando el algoritmo Gi*, en el software GeoDa, resulta un mapa de agrupamientos (clusters), que
se ilustra en la figura 25; as como un mapa de significancia medida a travs de los valores de
probabilidad (p-values).

A diferencia de la figura 24, las figuras 25 y 26, obtenidas en GeoDa, muestran un agrupamiento
compacto de valores similares altos en todo el centro urbano de San Ramn, y evidencian
tendencia al agrupamiento de valores similares bajos principalmente en el sector este de San
Ramn.

Figura 25. Agrupamientos espaciales usando Gi* local de Getis y Ord para la variable SERVET, sector San Ramn de
Alajuela, usando el software GeoDa.

19
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

El ncleo de alta autocorrelacin de valores bajos del sector oeste (Figura 24), prcticamente
desaparece en las figuras 25 y 26, lo que podra deberse a diferencias en la compilacin de la
matriz de interaccin espacial, o bien a diferencias ms sustantivas en la forma en que se
implement el algoritmo en GeoDa y ArcGIS.

Figura 26. Niveles de significancia para los agrupamientos espaciales usando Gi* local de Getis y Ord para la variable
SERVET, sector San Ramn de Alajuela, usando el software GeoDa.

Otros indicadores de autocorrelacin espacial global

K de Ripley:

Esta funcin lleva debe su nombre en honor a su creador Bryan David Ripley (1952), estadstico
ingls, formado en Cambridge University, profesor retirado de Oxford en el ao 2014. El autor ha
hecho grandes contribuciones en los campos de la estadstica espacial y el reconocimiento de
patrones y colabor en la creacin de los lenguajes de programacin S y R, de uso extendido en
estadstica y estadstica espacial.

Diversas variantes de la funcin original K de Ripley han sido sugeridas. En ArcGIS se implement
una transformacin de K conocida como L(d):

20
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Donde: d es la distancia, n es igual al nmero total de objetos, A representa el rea total de los
objetos y ki,j es un peso. Si no hay correccin de borde, el peso ser igual a uno cuando la distancia
entre i y j es menos que d, y ser cero en caso contrario. Usar un mtodo especifico de correccin
de borde modificar ki,j ligeramente.

La K de Ripley determina si los objetos, o los valores asociados con los objetos, exhiben
agrupamiento o dispersin estadsticamente significativos dentro de un rango de distancias.

Una caracterstica distintiva de este mtodo es que resume la dependencia espacial


(agrupamiento o dispersin de objetos) para un rango de distancias. En muchos estudios de
anlisis de patrones, la seleccin de una escala apropiada de anlisis es requerida. Por ejemplo,
suele requerirse una banda o un umbral de distancia. Cuando se exploran patrones espaciales a
distancias y escalas mltiples, los patrones cambian, reflejando la dominancia de procesos
espaciales particulares en operacin. La funcin K de Ripley ilustra cmo cambia la tendencia a la
agrupacin o dispersin espacial de los centroides de los objetos cuando el tamao del vecindario
se modifica.

La figura 27 presenta una ilustracin


esquemtica del resultado grfico del
anlisis K de Ripley. El eje de las
ordenadas es la funcin L(d) que es
una medida del agrupamiento o
dispersin de los valores de la
variable tratada. El eje de abcisas
contiene distancias crecientes entre
pares de puntos. La lnea azul
representa el patrn espacial
esperado para un proceso al azar;
parte el espacio en dos: un patrn
Figura 27. Ilustracin de los componentes grficos en el anlisis de la agrupado, por encima de la lnea, y
K de Ripley. un patrn dispersado, por debajo de
la lnea. Hipotticamente la lnea en
rojo, valores observados L(d) de la funcin de Ripley, puede ondular alrededor de la lnea azul
conforme la distancia entre puntos incrementa. Cuando la lnea de valores observados L(d) est
por encima de la lnea azul, la organizacin espacial de la variable considerada es agrupada,
mientras que si los valores observados L(d) se hallan por debajo de la lnea azul, la organizacin
espacial se considera dispersada. La figura tambin presenta las lneas envolventes del intervalo
de confianza superior al 90% para la seleccin entre patrn aleatorio, patrn agrupado y patrn
dispersado.

La funcin K de Ripley para la variable SERVET muestra tendencia al agrupamiento para rangos de
distancia que van de 200 a 2500 metros (Figura 28).

21
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Figura 28. Funcin K de Ripley para la variable SERVET, sobre rangos de distancia de 200 a
2500 metros.

Anlisis del vecino ms cercano:

Este estadstico calcula el ndice de


vecindad con base en la distancia
promedio entre cada objeto y su vecino
ms cercano; opera sobre el aspecto
espacial y no sobre el valor atributivo
asignado a la unidad muestral.

En su forma ms simple, el vecino ms


cercano es aquel objeto (punto, o
centroide de lnea o polgono) que se
encuentra ms cerca de un objeto de
referencia. Por ejemplo, los puntos
16472 y 16476 son mutuamente vecinos
ms cercanos, pero a su vez, 41676 es el
Figura 29. Ilustracin del concepto del vecino ms cercano
(Nearest Neighbord, NN) vecino ms cercano de 16475(Figura 29).

La razn de distancia al vecino ms cercano (ANN) se define como:

D0 es la distancia media observada entre cada uno de los objetos y su vecinos ms cercanos:

22
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

DE es la distancia esperada entre objetos dado un patrn aleatorio:

Donde: di es la distancia al vecino ms cercano, n es el nmero de objetos, A es el rea de estudio


total. Este parmetro A debe ser valorado con mucho cuidado, pues es determinante en los
clculos y a menudo se asume de forma simplista como el rectngulo mnimo que envuelve los
objetos bajo anlisis, sin tener en cuenta el impacto que tiene cuando hay puntos aislados por
inconsistencias espaciales en la serie de datos.

El valor estandarizado de ANN se obtiene calculando la diferencia entre la distancia media al


vecino ms cercano y el valor esperado de la distancia entre vecinos, dividido por la desviacin
estndar de las distancias (SE):

El valor SE depende del rea y del nmero de


elementos presentes:

La implementacin de ndice del vecino ms cercano en


ArcGIS calcula cinco valores: la distancia media
observada, la distancia media esperada, el ndice del
vecino ms cercano, el puntaje z (valor calculado de z) y
el valor p (la probabilidad asociada al valor z calculado).

El anlisis de vecino ms cercano para la variable


SERVET en San Ramn y alrededores se presenta en la
figura 30. La distancia media observada mayor que la
esperada para un proceso aleatorio, de modo que el
valor estandarizado ZANN resulta positivo indicando
tendencia a la dispersin. El anlisis de significancia
muestra que el resultado es significativo a ms del 99% Figura 30. Anlisis de vecino ms cercano ANN para la
reparticin espacial de los segmentos censales en el sector
de confianza, con un z-value de 5.58.
San Ramn de Alajuela, Costa Rica.

23
Ph.D. Rafael Arce M. Escuela de Geografa, UCR. Actualizado el 25/04/2016.

Autocorrelacin espacial incremental:

Este anlisis implementado en las ltimas versiones de ArcGIS resulta bastante prctico. En alguna
medida guarda relacin con el anlisis de semivarianza que se practica en la Geoestadstica, como
veremos ms adelante en el curso, pero es ms limitado en el sentido de que no crea una funcin
matemtica de la dependencia entre la autocorrelacin y la distancia.

El algoritmo mide la
autocorrelacin espacial para
una serie de distancias y
opcionalmente crea un grfico
de lnea de dichas distancias y
sus correspondientes valores
estandarizados (z-value),
figura 31. Dichos valores
reflejan la intensidad del
agrupamiento espacial, y picos
significantes de los valores z
indican distancias donde el proceso
Figura 31. Resultados del anlisis con el algoritmo para clculo de la
autocorrelacin espacial incremental. espacial que promueve
agrupamientos es ms intenso. Estas
distancias pico generalmente son valores apropiados para ser usadas cuando se solicitan
parmetros como Bandas de Distancia o Radios de Distancia.

La figura 32 ilustra el
resultado grfico del anlisis
incremental para la variable
SERVET en el sector San
Ramn de Alajuela.

La variable presenta auto-


correlacin espacial esta-
dsticamente significativa
dentro de rangos de
distancia de 250 a 2500
metros. Siendo la ms
significativa a 1250 metros,
situacin que no es obvia
bajo simple inspeccin
visual. Los valores z van de
Figura 32. Anlisis de autocorrelacin incremental de la variable SERVET,
utilizando la I de Moran global para grupos de distancias entre 250 y 2500 m. 4.7 a 26.3 por lo que lo que la
tendencia al agrupamiento
domina a todas las escalas consideradas y es significativa a un nivel de confianza superior al 99.9%.

24

You might also like