You are on page 1of 24

ESTADISTICA ESPAOLA

Vol. 34, Nm. 130, 1992, pgs. 285 a 307

Contrastes de autocorrelacin espacial .


Un estudio de Monte Carlo ( *)

por
JESUS MUR LACAMBRA
Departamento de Anlisis Econmico
Facultad de Ciencias Econbmicas y Ernpresariales
Universidad de Zaragoza

RESUMEN

En este artculo se trata de comparar varios procedimientos pro-


puestos para contrastar la autocorrelacin espacial. Despus de una
breve referencia a sus causas y consecuencias se presenta un
anlisis de algunos contrastes desarrollados en la literatura, de los
cuales se eligen dos y, mediante un experimento de Monte Carlo, se
comparan sus propiedades para diferentes tamaos muestrales y
bajo diferentes configuraciones espaciales.

Palabras clave.^ Autocorrelacin espacial, estadstico de Moran,


multiplicador de Lagrange, experimento de Mante Carlo.

Clasificacin AMS: 62P20, 9oA19.

(*) Este trabajo ha sido realizado dentro del proyecto C^NAI HS-20/90. EI autor desea
agradecer las tiles sugerencias formuladas por los profesores J. H. P. Paelinck, J. M. Otero, A.
Novales, M. T. Aparicio y J. Trivez, que juzgaron la Tesis doctoral de la que este artculo extrae
parte del material, as como el gran apoyo encontrado en el profesor A. Aznar, director de la
misma.
'?if^ [.ti f r^[)I^T I( .^ I^;f'A!V( ^ l A

1. INTRODUCCION

En este trabajo se presentan los resultados de un estudio de Monte Carlo,


cuyo objetivo es examinar el comportamiento de dos contrastes de autocorrelacin
espacial en un contexto de muestras finitas.

En la seccin 2 se introduce el concepto, causas y consecuencias de la


existencia de un proceso de autocorrelacin espacial en las perturbaciones
aleatorias de un modelo economtrico regional. En la seccin 3 se examinan los
distintos contrastes de autocorrelacin espacial propuestos en la literatura para,
despus de comentar sus propiedades y caractersticas, seleccionar los dos
estadsticos que parecen ofrecer mayores garantas. Como las propiedades de
estos dos estadisticos slo han sido obtenidas en un contexto asint^itico, parece
interesante comprobar qu ocurre en un contexto de muestras finitas. Con este
fin, en ia seccin 4 se disea un estudio de Monte Carlo que cubre un conjunto
arnplio de supuestos, y en la 5 se da cuenta de los resultados alcanzados. EI
trabajo finaliza con una serie de conclusiones que se pueden extraer del ejer-
cicia.

2. ^A AUTOCORRELACION ESPACIAL

La caracterstica fundamental de un modelo economtrico espacial es que


trata de explicar cierta variable, observada en una serie de puntos del espacio,
a travs de un conjunto de variables observadas en los mismos puntos. Es
decir, el modelo economtrico viene definido por su dimensin espacial, por lo
que deber tenerse en cuenta que estos datos son fuertemente interdependientes.
A esta circunstancia se refiere Tobler (1970) como la primera ley de la geogra-
fa: cualquier cosa est relacionada con cualquier otra, pero las cosas cercanas
est^n ms relacionadas que las distantes, e insisten Cliff y Ord (1981) cuando
dicen que la propiedad bsica de los datos localizados espacialmente es que
el conjunto de valores {x^}, estn seguramente relacionados sobre el espacio.
No obstante, la validez de esta proposicin est condicionada por el nivel de
agregacin espacial definido y los criterios de regionalizacin empleados [va-
se Griffith {1988), Arbia (1989) o Mur (1990)J.

Con carcter general, un modelo economtrico regional autocorrelado


espacialmente puede escribirse como:

y=x^i+u [2.1]
u= p Wu+^ [2 . 2]
^^N(O,cs2I) [2.3]
('ONTRAti[f^;ti I)f^. AIICO('OKItFI.A{'ION f^:til'A('IAI,. l1N f^tiTlJl)I( ^ f)f. ti1^ ^ ti[f ^-11t1^ ^ _'^7

siendo y el vector de T observaciones de la variable endgena sobre las T


regiones en las que se ha dividido el espacio relevante, X la matriz de orden T^k
de observaciones en esas mismas regiones, de las k variables exgenas del
modelo y u el vector de T perturbaciones aleatorias, autocorrelado espacialmente
tal como se indica en [2.2]. En esta ltima expresin, ^ es un vector de ruidos
b{ancos, p es un par^metro de autocorrelacin que traduce la intensidad de las
dependencias, y W es la denominada matriz de contactos, cuya funcin es
indicar, para cada regin, el conjunto de regiones con las que sta es
interdependiente.

EI modelo reflejado en las ecuaciones [2.1 ] a[2.3] no difiere sustancialmente


del modelo economtrico tpico con datos de series temporales y perturbacin
autorregresiva. La peculiaridad del mismo procede de su dimensin espacial, ya
que, con respecto al tiempo, las relaciones son unidireccionales (del pasado
sobre el presente), mientras que en el espacio son multidireccionales (poten-
cialmente de una regin con el resto de regiones). Con respecto a la matriz W
hay que dilucidar dos cuestiones: qu valores se asigna a fos elementos {w^^} de
la misma y en base a qu criterios. En relacin al primer punto, la solucin ms
empleada es la propuesta par ^1^Aoran (1950}, consistente en asignar un uno al
elemento (i, j) de la matriz W cuando la regin i recibe influencias de la j y cero
en otro caso [pueden encontrarse otras alternativas en Cliff et al. (1975), Arora
y Brown (1977) o Hordijk (1978)). Pero, para distribuir este conjunto de unos y
ceros sobre la rnatriz, es necesario conocer el entramado de dependencias
subyacente entre las regiones. Cuando esto no es posible, es preferible utilizar
el criterio de contigi^idad por el cual wi^ ser igual a 1 si entre las regiones i y j
existe contacto fsico y cero en otro caso. En consecuencia, la matriz W debera
ser simtrica y de tipo binario.

Por ltimo, las consecuencias sobre los estimadores MCO de la existencia


de un proceso de autocorrelacin espacial son ms perniciosas que en un
contexto temporal, ya que estos estimadores na son consistentes (Anselin,
1988}.

3. CONTRASTES DE AUTC)CORRELACION ESPACIAL

En trminos generales se pueden distinguir dos grupos diferentes de con-


trastes de autocorrelacin: el primero de ellos, que denominamos contrastes ad-
hoc, incluye una serie de contrastes basados en estadsticos previamente desa-
rrollados en un contexto temporal, y que han sido adaptados al mbito espacial;
ios del segundo grupo son ei resultado de aplicar el principio mximo-verosmil
al modelo economtrica formulado en [2.1 ] a[2.3].
^K^{ f,ti rA[)Iti"11('A F^iPA[^tl)(..A

Los estadsticos en los que se basan los contrastes ad-hoc, pueden obtenerse
todos ellos como caso particular del denominado estadstico general de produc-
tos cruzados:
T
r ^r1 k^is+I [3.1]

intraducido por Knox ( 1964), en el que k^1 es una medida de interaccin entre los
puntos (o regianes) i y j, y s;^ una medida de similitud entre esos dos puntos en
relacin a un determinado atributo.

Se puede identificar el conjunto {k;^} con el conjunto {w^} de elementos de la


matriz de contactos. Por otra parte, la medida de similitud puede tener naturale-
za cualitativa, formulada en trminos de presencia-ausencia de un determinado
atributo en un punto del espacio, o bien cuantitativa. En el primer caso, el
objetiva del anlisis ser comprobar si la existencia de un determinado atributo
en una regin favorece (autocorrelacin positiva) o perjudica ( autocorrelacin
negativa) !a posibiiidad de que ese misma atributo se manifieste en regiones
circundantes a aqulla. Este estudio puede Ilevarse a cabo utilizando los esta-
dsticos NN, BB y BN, cuyas propiedades y caractersticas se detallan en Cliff y
Ord (1981).

Cuando !a medida de interaccin es de naturaleza cuantitativa, el concepto


de autocorrelacin se perfila con ms claridad: el estadistico r medir hasta qu
punto tienden a producirse concentraciones de regiones en las cuales se obser-
van valores altos del atribu#o, frente a otras regiones caracterizadas por una
escasa dotacin dei mismo. EI caso inverso, autocorrelacin espacial negativa,
se produce cuando una concentracin elevada del atributo en una regin genera
efectos negativas externos para sus vecinas.

En la lteratura pueden encantrarse al menos tres contrastes de autocorrelacin


aplicables a datos cuantitat'rvos, corno san los basados en el estadistico de
Moran (1950}, en el de Geary (1954) y en el de Dacey (1965) y denominados
estadsticos , I, c y d, respectivamente. La obtencin de los momentos de estos
estadsticos, asf como sus distribuciones probabilsticas, es compleja dada la
multidireccionalidad de las conexiones; pero no es posible para la d de Dacey.
Por lo cual, los nicos utlzables son la I de Moran y la c de Geary, cuyas
expresiones son :

T ^,^T w;,(X;-X) (x -X)


I= `^ T f 2
[3.2)
`S L.1i=^ \X;-X)
('ON`TKAS'1'F,:S l)f^ AlJ`I'O('ORRt^,LA('I(1N t^.Sl'A('IAI.. l^N t^tiflil)f(t I)f ti1(tNlf ( ^1Kltt ^K^)

T-1 ^Tw (X t-X J)^


C i ^l ^1
[3.3]
ZSa ^T ^ {X^-X)2

siendo x la observacin de la variable x en la regin j-sima, x la rnedia


muestral de la misma y So=^;^w;^ (con ^;^ nos referimos al doble sumatorio de
forma abreviada).

Con respecto a estos dos ltimos estadisticos, todos los indicios tienden a
sealar que es preferible la I de Moran. As, Cliff y l7rd (1981) demuestran que
la I es asintticamente rns potente que la c de Geary, conclusin que se ve
corroborada mediante varias simulaciones que Ilevan a cabo ambos autores.
Adicionalmente, King (1981) demuestra que el de Moran es el test localrnente
ms potente para contrastar la hiptesis nula Ho: p=0 frente a alternativas del
tipo HA: p>0. En consecuencia y utilizando estos resultados, puede decirse que
el contraste de autocorrelacin espacial basado en la I de Moran es el que
ofrece rns garantas de todo el grupo de contrastes ad-hoc.

Los momentos de primer y segundo orden del estadstico I para los residuos
MCO de un modelo de regresin, obtenidos en un contexto asinttico y bajo el
supuesto de una perturbacin incorrelada, son los siguientes [en Cliff y Ord
(1981 } y Anselin (1988) pueden encontrarse los detalles]:

__ ^^w^
I A , A
[3.4]
U ^

tr(X X)-'X^WX
E [I]=- T-k 3 . 5]

[tr(X X)-'X'WX]^+tr(MWMW}+tr(MWMW')
E [I2]= [3 . 6]
( T-k) ( T-k-2 )

V [I]=E [I2l-(E [I])2 [3.7]

siendo M la matriz [l-X(X'X)-'X'], =y-X^3, y ^i el vector de estimadores MCO de


[2.1]. Por ltimo, Sen ( 1976) obtiene las condiciones de suficiencia que garanti-
zan la distribucin asintticamente normal del estadstico, las cuales tienden a
garantizar que la estructura espacial del sistema regional, captada en la matriz
W, est mnimamente articulada.
^ yC! E^.STA[:)ItiTlt'A FSPAPJ()LA

EI segundo grupo de contrastes se obtienen de la aplicacin del principio


rnximo-verosimil al modelo economtrico de [2.1 ] a[2.3], el cual incluye el
contraste de Wald, el contraste del ratio de verosimilitud y el del multiplicador de
Lagrange. Estos tres contrastes gozan de propiedades ptimas en un contexto
asintdtico y han sido usados con profusin.

Una cuestin previa de importancia se refiere a la definicin de la funcin de


verosimilitud del modelo. Tomando como punto de referencia la expresin del
modelo de ^2.1 ] a[2.3], esta funcin es:

^(Y^Q^ aa^ P)=(2n6z)-ri2 exp{- 1 (y-X(3)'A'A(y-X[i)} ^ A ^ [3.8]


2c^2

siendo A=(I-pW} que se obtiene de hacer ^={/-pVt^u en [2.2], y ^ A ^ el determi-


nante jacobiano de la transformacin lineal ^=Au. EI determinante de la matriz A
se obtiene como ei producto de sus T races caractersticas, las cuales se
obtienen a partir de las ra ces de la matriz W como: ^=1-p^ , siendo ^ y^,^ la j-
sima raz caracterstica de A y W, respectivamente. Es decir, se cumple que:
T T
IA I =^ ^ ^ (1-p^) [3 . 9]
l=^ 1=^
Este determinante debe ser estrictamente mayor que cero, lo cual implica
que: p^ ^ 1^ ^+'(b'j). Esta expresin sintetiza la importancia del operador espacial
W en la especificacin del modelo economtrico regional. Debe ser capaz de
captar el mecanisrno de interaccin subyacente en el sistema regional, limitan-
do el rango de valores que puede tomar el coeficiente de autocorrelacin
espacial. Un estudio ms detallado de las propiedades de esta matriz servir
para acotar el problema.

Por hiptesis, los elementos de la diagonal principal de W son todos cero,


siendo su traza igual a cero, lo cual implica que sus races caractersticas
debern ser tanto positivas como negativas de forma que su suma se compen-
se. Por otro lado, corno W es una matriz no negativa e indescomponible,
utilizando el Teorema de Perron-Frobenius, existir una raz caracterstica posi-
tiva y simple cuyo mdulo excede al del resto de races. Sea esta raz ^,+, y sea
^,_ la raz negativa de mayor valor absoluto (sta puede ser mltiple), que
cumplen:
^1,+> I ^ j I ^ %l,+ ) < I ^ j I -1 ( ^C7^j )

^,+>^^, ^^^,+,^^^ ^-,

Teniendo en cuenta estos resultados, se puede representar grficamente el


valor de ^ A ^ en funcin del valor de p, como [Mur ( 1990}]:
t'ONTFtAti"T^E.S Df^: AUTO('URRE:LAt'ION t^tii'A('IAL. l1N E tiiUf)IU [)t: !^1( ^ NTt c',Akl.^ ^ ^^a ^

Figura 3.1

EI determinante de A se anula para todos aquellos valores de p en los que


este coeficiente se hace igual a 1/^,^ (j=1, 2, ..., T}, teniendo una forrna sinusoidal
y con tendencia a ser explasiva. Lo que interesa remarcar es que la funcin ^ A ^
es regular de forma cncava para valores del coeficiente comprendidos entre
^,=^<p<^,^, entre los cuales est acotada como: 0< ^ A^<1. EI resto de posibles
valores del coeficiente deben desecharse a la vista de la figura 3.1. Esta
solucin puede mejorarse utilizando el Teorema de Fisher, por el cual el valor
de ^,+ est acotado entre:
< < [ 3 .10 ]
rmin + ^ nax

siendo r la suma de los elementos de la j-sirna fila (o columna), y m^n y rrn^X los
valores mnimo y mximo, respectivamente, de esas sumas. Si cada elemento
de la matriz W se divide por la suma de los elementos de su fila (o columna)
respectiva, m^^ ser igual a maX y ambos igual a 1, y el mximo valor que puede
tomar p es tambin igual a 1. Haciendo esta transformacin, la acotacin
anteriar se convierte en:
^,l^<p<1 [3.10]

Tras estas precisiones, se puede pasar a comentar las caractersticas de los


tres test de autocorrelacin espacial que incluimos en este segundo grupo de
contrastes. En el modelo economtrico de [2.1 ] a[2.3] se puede definir el vector
,y, t^:ti^1 A()ItiTIt.^A E^:SPAti()l.A

de parmetros 8'-[p, a2, pJ', siendo L(yl8) el logaritmo de la funcin de verosimi-


litud del modelo. Supngase que se desea contrastar s restricciones lineales
sobre el vec#or de par^metras, H^: RB=ro, frente a la hiptesis alternativa HA: R9^ro,
donde R es una matriz de constantes de orden s(k+2} y ro un vector de orden
s 1, igualmente de constantes. En este caso, se obtiene el test de Wald como:
^ ^
W=[R8-ro)' [R^(8)-, ^q']-, [R9 _ro]^S x2( S) [3.11 ]

siendo ^(8)^' la inversa de la matriz de informacin. Tambin puede obtenerse


el contraste del ratio de verosimilitudes:
,^ _
LR=-2[L(Y/8R)-L( y/^)]^S x2(S) [3.12]
^
siendo 8R el correspondiente estimador mximo-verosmil restringido, y el con-
traste de los multiplicadores de Lagrange:
^ ^
LM=^,R,[R^(e) [3.13]
^^q']^,R^Sx2(S)
^
donde ^.R es la estimacin mximo-verosimil del vector de s multiplicadores,
obtenida del correspondiente problema de maximizacin restringida [vase Rao
(1965), Engle (1984) y Gadfrey (1988)]. Est demostrado en ia literatura que los
tres contrastes gozan de todas las propiedades asintticas deseables siendo
asintticamente equivalentes, aun cuando pueden producirse discrepancias en-
tre ellos para rnuestras de tamaa finito.

Para contrastar la hiptesis nula Ho: p=0 frente a la alternativa HA: p^0, estos
tres contrastes se obtienen a partir del lagaritmo de la funcin de verosimilitud
del modeio:
T T 2
L[y/8]=- /og2n- loga -- [y--X^]'A'A[y-X^]
2 +^T log(1-p^^) [3.14]
2 2 2a ^_ ^

EI conjunto de (k+2) condiciones necesarias de mximo en [3.14] se obtie-


nen como:

^ ^^ ^ ^^
aL(y, 8) -^ [y'A'AX-R'X'A'AXJ _0
^R a2

^ ^^^ ^
c^L(Y^ 8) __0^ _ T + (Y-x^)'A'^(Y-XR) =0
^2 262 2a4

aL(y, 6) - (y-X[3)'A' W(y-Xa) T -^ -


^ -0^ ^.2 + ^ ^ -0 [3.15]
^P 6 /_^ 1--p^
t'ON"I^RAtiTF^:ti 1)t. All^^^O('t)RREt_^C'IC)N F:SF't^C^l:^ ^ L l1N Fti"Tl1Ul( ^ UF- !^1(aN^II^ C^:^Ki t^ ?^)^

....
Obsrvese que se utiliza la expresin A para indicar la estimacin rnximo-
verosmil de la matriz. De la primera y segunda ecuacin se obtiene, respectiva-
mente:
^ ^^ ^^
(3= [X'A'AX ] -' [X'A 'A y] [3.16]

^^ ^
^! u'A'Au
T [3.17]

^ ^ ^
donde u=y-X[i. La estimacin de p puede obtenerse Ilevando [3.16] y[3.17] a
[3.14]:
^ ^ ^ ^ T ^
L(ylj3, a2, p)oc- T log 62+
2 ^! ^
log{1-p^, ) ^ , [ 3.18 ]
cuya maximizacin implica la minimizacin de:
r
log[2 ^ (1-p^,^ y2^^] [3.19]
^_^

expresin en la cual se puede implementar un proceso de optimizacin iterativa


no lineal [mtodos alternativos de resolucin, en cualquier caso complejos,
pueden encontrarse en ^rd (1975), Anselin (1988) y Griffith (1988)]. Por otro
lado, como la restriccin impuesta en 9 es que p=o, introducindola en el
proceso de optimizacin, los estimadores mximo-verosmiles restringidos se
convierten en:
^ ..... ' ^^ ,,,.,
RR=[X'x]-,x,y
6R= ,r PR-^

Finalmente, la inversa de la matriz de informacin obtenida bajo la hiptesis


nula y alternativa, respectivamente, es la siguiente {Anselin, 1988):

a2{x'x)--^ o a -
,
-E ^ a2L(.Y^e)] ^1 0 264 0 [3.20]
^eae' ^ Ho T
0 0 (tr[(W+W')W])-' I
F:ti'T AI)I^TI('A F:^PAOL.A

az(X'A'A^ ' 0 0
2a2td^+d2) -2a2d3
0
_,E ^ ^ZL{Y^)] ^ T{d,+d2}--2d^2 T(d,+d2)--2d32 [3.21]
ae^e' J
-2a2da 2d3 _^
0 [ d , +d2- -^ ^
T{d,+d2}--2d^z

T
siendo d,=tr[WA-']'[WA-'], d^=^ ^,j2(1-p^)2 y d^=tr[WA-']
j=1

Utilizando todos estos resultados, y sustituyendo en fas expresiones del test


de Wald y en la de los multiplicadores de Lagrange la inversa de la matriz de
informacn por la estimacin consistente respectiva, se obtienen las expresio-
nes finales de los tres contrastes, que resultan ser:

r
LR= T[Iog6R log2]+2 ^ log(1 p^.}sx2^,^ [3.22]
j=1

W-p [ T(d, +d2}-2d3]a^2t, ^ [3.23]

T ' W 2
LM= 2 [3.24]
tr[(W'+W)W] ' asx c^^

Observando las expresiones [3.22], [3.23] y[3.24] resulta evidente la nota-


ble simplicidad del estadstico LM frente al LR o a W, ya que, para su aplicacin,
basta con obtener los estimadores MCO de los parmetros de posicin del
modelo, mientras que para utilizar el W o e LR es necesario resolver un
proceso de optimizacin iterativa no lineal complejo. Esta razn aconseja selec-
cionar el estadstico LM frente a los otros dos.

4. D1SEN0 DEL ESTUDIO DE MONTE CARLO

En esta seccin se plantea un estudio de Monte Carlo en el que se examina


el comportamiento de los estadsticos seleccionados en la seccin anterior
sobre muestras finitas, y utilizando varias especificaciones del operador espa-
cial.
('ONTRASTE:S DE AI^TOC'OftREI.,A("I<)N E^:^PAC:'IAL. l1N EtiT'll[)IO UE^ MONTEi. (^ARI (a 295

EI proceso generador de datos (PGD): Se corresponde con el modelo


economtrico de [2.1 ] a[2.3], que reescribimos a continuacin:

Y^=X',R+u, [4.1 ]

r
u.-P ^ wrjuj+ ^r
[4.2]
j= ^

^,--N(0; ^s2) r=1, 2, . . . , T [4.3]

EI objetivo del experimento es investigar dos tcnicas economtricas: el


contraste de autocorrelacin espacial basado en la I de Moran de las expresio-
nes [3.4] a[3.7], y el del multiplicador de Lagrange de [3.24]. Los eiementos del
PGD que parecen esenciales son los siguientes:

La matriz de contactos entre regiones W.

EI parmetro de autocorrelacin espacial p.

EI rnodelo economtrico simulado y la generacin de la parte sistemtica


y aleatoria del mismo.

EI tarnao de la muestra y nmero d'e replicacones del experimento.

A continuacin comentamos brevemente las decisiones tomadas al res-


pecto.

E/ parmetro de autocorre/acin espacial: EI rango de valores que puede


tomar este parmetro depende de la especificacin de la matriz W. No obstante,
si la matriz se define de tipo binario ponderada, la acotacin relevante de
valores del parmetro es la de [3.10], cualquiera que sea la matriz de contactos.
Esta parece la solucin ms satisfactoria. En consecuencia, con respecto al
parmetro p, slo se van a simular valores no negativos comprendidos entre
cero y la unidad. De esta forma, los resultados de la simulacin con respecto a
un mismo valor del parmetro p sern directamente comparables, cualquiera
que sea la rnatriz de contactos empleada y el tamao de la muestra.

La matriz de contactos entre regiones: Esta matriz desernpea un papel


crucial en cualquier contraste de correlacin espacial. Por ello, parece conve-
niente introducir en la simulacin varios tipos de matrices para comprobar la
robustez de los resultados. Se han utilizado dos tipos de matrices, que denorni-
naremos como matrices espaciales y matrices aespaciales. Las prirneras se
corresponden directamente con el sisterna regional espaol (es decir, se han
construido en base a un sistema de regiones que existe en la realidad), mientras
que las segundas se construyen de forma artificial sin que exista un mapa
^^)(^ E^^1 A[^ISTIc^A F.tif'Ac aL.A

regional que las respalde. De estas ltimas se han especificado dos tipos que
denominaremos de tipo 1 y de tipo II. En las primeras se ha supuesto que cada
regin tiene contacto con otras cuatro regiones, mientras que en las segundas
se supone que el 50% de las regiones tienen contacto con otras dos regiones, y
el 50% restante lo #ienen con otras seis. De esta forma, las matrices aespaciales
de tipo I se asocian a sisternas regionales equilibrados, mientras que las de tipo
li se asocian a sistemas peor articulados que las anteriores. Igualmente se han
utilizada dos matrices de tipo espacial, como son las obtenidas del sistema de
comunidades autnomas y de provincias espaol ( en ambos casos se han
excluido las Islas Canarias).

Modelo simulado y generacin de la parte sistemtica y aleatoria: EI modelo


economtrico que sirve de base para la simulacin es el siguiente:

y^=-0.2235+0.2379x^r+0.0843x2^+0.2621 x3r+u^ [4.4]

el cual se corresponde con el de la expresin [4.1 ], y est tomado de Aznar et


a/. (1989). ^a perturbacin u, se obtiene de acuerdo a la expresin [4.2], y el
ruido blanco ^r se genera aleatoriamente de acuerdo a[4.3] con 6=0.052, valor
estimado en el citado modelo economtrico. Finalmente, la obtencin de los
datos relativos a las variables exgenas ha seguido un doble camino, depen-
diendo de si la matriz de contactos es espacial o aespacial:

En el primer caso, los datos se toman directamente de las comunidades y


provincias espaolas en el ao 1985, ao para el que se estim el modelo de
[4.4]. Cuando se usa una matriz aespacial, se ha diseado un mtodo especifi-
co de generacin artificial de datos, que asegura la congruencia de stos con
los observados en la realidad espaola. Es#o ltimo ha sido necesario puesto
que, como se comentar ms adelante, se desea utilizar muestras de tamao
100 para las que no se dispon a de suficientes datos observados, caso de no
recurrir a otras soluciones menos satisfactorias (duplicacin de datos, utiliza-
cin de datos panel, etc.). Este mtodo se basa en la tcnica de componentes
principales, siendo capaz de generar una muestra del tamao deseado, mante-
niendo la estructura de correlaciones observada en la muestra original, lo cual
garantiza que los resultados de la sirnulacin no se vern afectados por el
mayor o menor grado de colinealidad existente en muestras diferentes [los
detalles pueden verse en Mur (1990)].

Tamao muestra/ y nmero de replicaciones: En el ejercicio se utilizaran


cinco tamaos rnuestrales: 16 y 48 con matrices espaciales y 20, 50 y 100 con
las matrices aespaciales, y el nmero de replicaciones efectuado en cada
experimento ha sido 1.000.
l'ONf'KAti`i'E.ti O[- AUTOt'{)KKE-L.A('ION f-tif`At'IAI._ l1N [tiTl![)I{)[)f ti1^ ^ ^1i[ ( 1Ft[t ^ ^^)7

5. RESULTADOS DEL EXPERIMENTO DE MONTE CAR^O

En la seccin anterior se han definido las caractersticas de este ejercicio de


simulacin, en el que se pretende examinar el comportamiento de los contrastes
I de Moran y LM. ^a cobertura del estudio es lirnitada, dado el gran nmero de
factores que intervienen en el mismo. No obstante, las conclusiones que se
obtengan estarn cimentadas en un nmero de replicaciones que ofrece garan-
tas. Estas conclusiones se presentan agrupadas en torno a dos situaciones de
inters: simulacin bajo la hiptesis nula (p=0) y ba ^ o la hiptesis alternativa
(P^0).

Resultados de la sirnulacin bajo la hiptesis nula (p=0)

Los resultados del ejercicio ba ^ o este supuesto se detallan en las dos tablas
siguientes. La primera examina el grado de ajuste de la distribucin muestral de
ambos estadsticos a las distribuciones tericas supuestas. En la siguiente se
presenta el nivel de significacin estimado en cada uno de los contrastes.

En la tabla 5.1 aparecen los resultados del contraste de Kolmogorov-Srnirnov


y del estadstico A/C aplicado al misrno conjunto de datos. EI primero es un
contraste bien conocido en la literatura, y su ob ^etivo es contrastar la hiptesis
nufa de que la funcin de distribucin que ha generado una serie de observacio-
nes (en este caso las 1.000 replicaciones de los estadsticos) se corresponde
con una determinada funcin identificada por el investigador. Es decir, Ho:
F(x)=Fo(x), donde Fa(x) es la funcin de distribucin sornetida a contraste, que
se corresponde con la N(0,1) para la I de Moran (previamente el valor del
estadstico se ha estandarizado) y con la x2^1^ para el LM.

Por otro lado, la utilizacin del estadstico AIC ha sido muy habitual para
resolver problemas de seleccin de modelos economtricos [Akaike (1973),
Sakamoto et al. (1986), Aznar (1989)]. EI problema que aqu nos ocu pa puede
entenderse igualmente como uno de seleccin de modelos y resolverse utili-
zando el estadstico A/C. La filosofa que subyace a este estadstico es la
de seleccionar aquel modelo economtrico que aporta un contenido inforrna--
tivo mayor. En nuestro caso, tenemos para los estadsticos I y LM una funcin
de distribucin emprica y una funcin de distribucin terica, caracterizada
cada una de ellas por una determinada distribucin de la masa de probabilidad
total sobre el espacio probabilstico. Tomando como referencia la funcin de
distribucin terica, este espacio probabilstico se puede dividir en una colec-
^^)X f^^+TAI)IS"Tlt'A E;Sf'Al)L..A

Tabla 5.1

Matriz de tipo 1 T= 20 T= 50 T=100

Estadistico I de Moran
Kolmogorov-Smirnov .................................................. 1,2017 0,7906 0,9171
Criterio A!C ................................................................... -8,5102 -13,5410 -12,9573

Estadistico L.M
Kolrnogorov-Smirnov ................................................... 1,0752 1,2965 0,6325
Criterio AIC .................................................................. --4, 5494 -2,5812 -8,3331

Matriz de tipo 11 T=20 T=50 T=100

Estadistico t de Moran
KImogorov-Smrnov .................................................. 2,4982(*) 0,4743 0,7589
Criterio A!C ................................................................... -7,2276 -15,7521 -14,2091

Estadstico LM
Kolmogorov-Smirnov .................................................. 1,6128(*) 0,7273 0,6641
Criterio AIC .................................................................. - 38
, 669 - 90
, 233 - 66
, 049

Matrices especiates T=16 T=48

Estadstico I de Moran
Kolmogorov-Smirnov ................................................... 1,3282 1,0436
Criterio AfC ................................................................... -11,0554 -12,2892

Estadstico LM
Kolmogorov-Smirnov .................................................. 1,3914(^*) 1,7076(**)
Criterio AIC ................................................................... -5,5636 -7,6024

(*) Se rechaza a ambos niveles.


(*') Se acepta al 1% y rechaza al 5% de nivel de significacin.

cin de intervalos equiprobabilsticos, y medir la verosimilitud del modelo teri-


co como:

n!
Pr[n^, n2, ..., nklp^, p2, ..., pk]= p2n2 ... pk^k L5- ^^
n ^^ . n2.^ . . . nk.^ p^n'

siendo p^ =p (dj } la probabilidad asignada a cada uno de los k intervalos, n^ el


nmero de observaciones censadas en el intervalo j y n=E k ^ n^ _^1.000. Como el
nmero de parmetros libres del modelo terico es cero, fa expresin [5.1] mide
ya directamente el contenido informativo de este rnodelo. Con respecto al
('C)NTRASTE:S [)f.^ Al1TO('ORFtf:LA('ION ESf'A('IAL_. [1N f^,STI ^ [)IO U!- MON"1 .AFtI () ?^t)

modelo emprico se debe utilizar la misrna expresin [5.1 ], pero la probabilidad


que esta distribucin asigna a cada uno de los k intervalos antes definidos viene
dada por p^=(n,n), y los grados de libertad del modelo son (k-1). En consecuen-
cia, el contenido informativo del modelo terico [AIC(1)] y el del modeto ernpri-
co [AIC(2)] se puede medir como:

n!
Al C( 1 )=-21og I^2 n2 ... pk ^^ [5.2]
n, . n2.1 . . . nk ! p n ^
I

n! n^ ^, n2 ^2
AIC(2)=-21og nk n k +2(k-1) [5.3]
n^!nZ! ... nk! n n n

EI criterio AIC aconseja seleccionar el modelo con un valor del estadstico


menor, por lo que una regla de comparacin til puede estar basada en la
diferencia:
T
AIC(1)-AIC(2)=^ n. log(n^)-n log(pn)-(k-1)
j=1

si es negativa seleccionaremos ia distribucin terica; en caso contrario el


resultado de la simulacin indica que sta no es una buena aproximacin.
Teniendo en cuenta ios resultados del contraste de Kolmogorov-Smirnov,
parece claro que la adherencia de las distribuciones muestrales de ambos
estadsticos a la distribucin terica respectiva es bastante pobre cuando el
tamao muestral es reducido pero mejora al aumentar ste. No obstante, para la
I de Moran el salto de 20 a 50 observaciones parece suficiente para alcanzar un
ajuste aceptable, mientras que para el LM parecen ser necesarias un rnayor
nmero de observaciones. Por otro lado, tambin parece claro que ambos
estadsticos se ajustan mejor a la distribucin terica cuando la matriz de
contactos tiende a ser regular, aunque con un tamao muestral grande el efecto
se diluye.
Por lo que respecta a la utilizacin del estadstico AIC podra pensarse que
los resultados son decepcionantes, dado su escaso poder discriminatorio: en
todos los casos, la distribucin terica es preferida a la emprica. No obstante,
estos resultados podan ser previsibles por cuanto al enfrentar el contenido
informativo de un modelo terico al de un modelo emprco ( pero sn teora),
nicamente se est sealando para aqul un rnnimo de informacin adicional a
la puramente muestral, la cual, en este caso, parece que los dos modelos
aportan.

En la tabla 5.2 aparecen !os niveles de significacin estimados para cada


t^ti t AUttiTI('A ^SPANI)t_A

Tabla 5.2

Matriz de tipo I T=20 T=50 T=100

Nivel de significacin LM I LM t LM !

0,01 ............................................ 2 10 6 13 2 7
0,05 ............................................ 25 45 37 43 39 44
0,10 ............................................ 71 89 74 83 93 83

Matriz de tipo 11 T=20 T=50 T=100

Nivel de significacin LM t LM t LM 1

0,01 ............................................ 1 13 9 9 14 13
0,05 ............................................ 21 50 43 49 46 56
0,10 ............................................ 67 90 110 113 97 98

Matrices espaciales T=16 T=48

Nivel de sig^nificacin LM t LM I

0,01 ............................................ 0 15 5 14
0,05 ............................................ 23 47 46 49
0,10 ............................................ 52 92 108 97

uno de los supuestos que se analizan. Esta tabla se ha construido de la


siguiente forma: para las 1.000 replicaciones del experimento en las que se ha
utilzado un valor de p igual a cero, se resuelven ambos contrastes de la
hiptesis nula Ho: p=0 frente a la alternativa HA: p^0. Los valores que aparecen
en esta tabla indican e! nmero de contrastes sobre el total de 1.000, en los
cuales se rechaza la hiptesis nula al nivel de significacin del 1%, del 5% o del
10%, respectivamente. En este sentido, es importante que el nivel de significa-
cin estimado se aproxime 1o ms posible al terico, lo cual significa que, al
menos en las colas, las distribuciones tericas y empiricas de ambos estadsti-
cos tienden a solaparse.

Las conclusiones que se extraen de esta tabla abundan en la misma direc-


cin que las obtenidas de la tabla anterior. As, a medida que aumenta el
tamao de la muestra el nivel de significacin estimado se aproxima al terico.
Pero la mejora que se observaba en la tabla anterior al pasar de la matriz tipo
II a la de tipo I(rns regular) aparece ms diluida, e incluso para un tamao
muestral de 100 puede entenderse que el efecto es de empeoramiento. No
obstante, lo que si es evidente es que el estadstico LM tiende a subestimar de
forma muy acusada el nivel de significacin terico del contraste, en compara-
cin a la 1 de Moran.
('ONTRASTF^ti [)f Al1Tf)(^UR^Rf-:LAC'ION t:SPAC'I^AL. t^N f^STI^UIO C)f^ M( ^ N I^t^ (^:1k1 ^^ 3U 1

Resultados de la simulacin bajo la hiptesis alternativa (p^Oj

En este caso se ha simutada el modelo de [4.1 ] a[4.3] utilizando valores de1


parmetro p distintos de cero progresivamente mayores, y el objetivo es com-
probar a potencia de los contrastes. La funcin de potencia de ambos estads-
ticos se puede estimar medante el nmero de veces en las que se rechaza la
hiptesis nula Ho: p=0.

Los valores del parmetro p empleados en 1a simuiacin son 0.05, 0.10,


0.15, 0.30, 0.45, 0.60, 0.75, 0.90 y o.95. Los resultados de la simulacin se
presentan en las figuras 5.1, 5.2 y 5.3. Cada uno de !os grficos reproduce, para
cada tipa de matriz de contactos, el nmero de rechazos de la hiptesis nula
sobre el total de 1.000 {en ordenadas) obtenido al usar e1 correspondente valor
de p(en abscisas). Las lneas de trazo continua se asocian a la funcin de
potencia estimada para 1a I de Moran, y la de traza discontinua a la del estads-
tico LM, mientras que el grosor de la lnea difiere con el tamao de la muestra
[los datas concretos pueden encontrarse en Mur (1990)].

Figura 5.1
MATRIZ DE TIPO I

^ooo
900
800
700
600
500
400
300
200 \\\\^^^.\\\\\-r:
\\\\ .,,..,,.,J ,
100 _ \^\\\\.^^
^^\\\^\\\\\\\\\ _^..^- -
^

0 ^ ^ ^

0,05 0,10 0,15 0,30 0,45 0,60 0,75 0,90 0,95

--- I (T=20) -- LM (T=20) ^^' I (T^50)

-- LM (T=50) ^^\ I { T:100 ) - LM (T=100)


;0^ E^STA[.)IS"Ti('A ESF'AI^LA

Figura 5.2
MATRIZ DE TIPO II

I (T-20) - LM (T=20) -.. i (T.^SO)


-'-' LM (T^50) ^^^ I (T_100) -- LM (T=100)

F'igura 5.3
MATRICES ESPACIALES

,.. I (T=16) --- LM {T-16) .... ^ (T_4$) ^- LM (T=4$)


('ONTRASTF.S f)f^ Al1TO('ORRELA('ION E;SPA('IAI, l.lN E?STl_iDlt) [)f^ MONTf. ( ARl_t1 ^l ^ ^

La lectura de estas figuras Ileva a conclusiones contundentes: en todos los


casos analizados, la potencia estimada del estadstico ! de Moran es superior a
la del estadstico LM. Esta superioridad es ms acusada cuanto menor es el
tamao de la rnuestra y cuando el parmetro de autocorrelacin espacial toma
un valor intermedio o bajo, Si el tamao de !a m^uestra aumenta a 50, los datos
siguen favoreciendo a!a I de Nlaran, aunque la diferencia ha disminuido sensi-
blemente, casi para desaparecer cuando el tarnao muestral es de 100.

Por otro lado, es significativa la escasa potencia de ambos estadsticos para


detectar procesos autocorrelados cuando e! coeficiente toma un valor mediano
o bajo, aunque el aurnento de la rnuestra tiende a corregir de forma notable este
defecto. Con respecto a! tipo de matriz de contactos empleada, no parecen
observarse diferencias significativas al menos con un tamao muestral de 100,
aunque con muestras de tamao 20 y 50, la potencia estimada de ambos
estadsticos es superior cuando se mide sobre !a matriz de tipo ! que sobre la de
tipo II, y la de sta es a su vez superior a la estimada sobre las matrices
espaciales.

6. CONCLUSIONES

En este trabajo se ha examinado el supuesto de autocorrelacin espacial en


las perturbaciones de un modelo economtrico regional, camentando sus cau-
sas y consecuencias. Posteriormente se han identificado das grandes grupos
de contrastes de autocorrelacin espacial, los ad-hoc y los basadas en el
principio mximo-verosmil, para cada uno de los cuales se ha seleccionado el
que parece mejar: el de la I de Moran y el del multiplicador de La ^ range o LM,
respectivamente. Ambos presentan propiedades ptimas en un contexto asinttico;
por elio a continuacin se plantea la realizacin de un estudio de Monte Carlo,
que permita examinar el comportamiento de ambos estadsticas en un contexto
de muestras finitas, as como estirnar !a funcin de potencia de cada uno de
ellos bajo el conjunto de supuestos planteados.

Los resultados de este estudio son bastante ilustrativos. Cuando 1a sirnula-


cin se ha Ilevado a cabo bajo la hiptesis de no autocorrelacin, todas las
medidas utilizadas tienden a indicar que e! ajuste de la distribucin emprica de
ambos estadsticos a la distribucin terica respectiva mejora al aumentar el
tamao de la muestra, como caba esperar. No obstante, aunque el grado de
ajuste exhibido por ambos estadisticos es pobre con un tamao muestral redu-
cido (de 16 20 observaciones}, en la I de Moran se observa una rnejora
significativa al utilizar un tamao muestra! mediano (de 48 50 observaciones),
^l)-l F-:tiFAI)Iti7l( ,^ F tiF',^t)1.,^

mientras que en el caso del LM esta mejora slo se observa con un tarnao
muestral grande (de 100 observaciones). otra circunstancia que apunta en
favor de la l de Moran es que ste tiende a estirnar con mayor exactitud el nivel
de significacin del contraste, mientras que el Lllrf tiende a subestimarlo, y de
forma muy acusada con un tamao muestral pequeo.

Con respecto al tipo de matriz de contactos empleada, los resultados del


estudio sugieren que la distribucin empirica de ambos estadsticos se ajusta
ligeramente mejor a la terica, cuando la matriz es ms regular, aun cuando no
se aprecian grandes diferencias. En cuaiquier caso, parece que tiene ms
incidencia sobre ambos estadsticos el hecho de variar el tamao de la muestra
que cambiar la especificacin del operador espacial. Este hecho creemos que
debe ser atribuido a un cierto efecto de homogeneizacin logrado al definir la
matriz de tipo binario ponderada, lo cual parece diluir las diferencias estructura-
les introducidas en las distintas matrices.

La segunda parte del experimento ha estado dedicada a la obtencin de la


funcin de potencia estirnada de los dos estadsticos. De este estudio surge con
fuerza una primera conclusin: en todos los casos analizados, la potencia
estimada def estadstico I es superior a la estimada para el LM, hacindose rnuy
significativa !a dferenca cuando el tamao de la muestra es reducido, y cuando
ei coeficiente torna un valor intermedio o bajo. Es necesario matizar esta ltima
conclusin porque, con muestras pequeas y valores poco elevados de p, la
potencia estimada de ambos estadsticos es muy pobre. Con respecto al tipo de
matriz empleada, se mantienen los comentarios anteriores. Es decir, si bien se
observa una potencia estimada ligeramente superior al operar con las matrices
de tipo i, asociadas a sistemas regionales ms equilibrados, esta dferenca no
parece significativa salvo cuando el tamao de la muestra es reducido.

En definitiva, a partir de este ejercicio de simulacin, creemos que pueden


subrayarse las siguientes conclusiones finales (hay que recordar, en cualquier
caso, que la validez de las mismas est supeditada al conjunto de supuestos
que aqui se han barajado):

Parece aconsejable utilizar en el contraste de autocorrelacin espacial


una especificacin de la matrz de contactos de tipo binario ponderado,
porque parece que este tipo de matrices tiende a diluir las diferencias en
la estructura del sistema regiona! que captan.

La distribucin emprica del estadstico de Moran se ajusta bastante


mejor a la distribucin N(o,1) que la del estadstico LM a la x2^,^ y, salvo
que el tamao de !a muestra sea reducido, la adherencia observada en
ambos estadisticos puede considerarse satisfactoria.
('ON^T^FtAti^T'F^ti Uf .^liT( ^ t^( ^ kf^E^:l.Al'Il1N i^tif'AC'1,^11 l^N I^til^^l!I)I ^ ) Ut ti1l ^ N^11^ ^.^kl ^ ^ ^Ilti

La potencia estimada del estadstico de Moran es sistemticarnente su-


perior a la del multiplicador de Lagrange, aun cuando sigue siendo redu-
cida para tamaos pequeos de la muestra y/o valores del parmetro de
autocorrelacin espacial intermedios o ba ^ os.

BIBLIOGRAFIA

AKAiKE, H. (1973): Information Theory and an Extension of the Maximum


Likelihood Principle, en Second /nternational Symposium on Inforrnation
Theory, edicin de B. N. Petro y F. Csaki, Akademiai Kiodo, Budapest, 267-
281

ANSELIN, L. (1988): Spatial Econometrics: Methods and Models, Londres:


Kluwer.

ARBIA, G. (1989): Spatial Data Configuration in Statistical Analysis of Regional


Economic and Related Problems, Londres: Kluwer.

ARORA, S., y BROwN, M. (197?): Alternative Approaches to Spatial Autocorrelation:


an Improvement over current Practice, International Regional Science Review,
2, 67-78.

AZNAR, A. (1989): Econometric Model Selection: A New Approach, Londres:


Kluwer.

AZNAR, A.; APARICIO, M. T.; TRIVEZ, J., y MuR, J. (1989): Determinacin del
escenario macroeconmico bsico de la economa aragonesa para el pero-
do 1988-91 , Zaragoza: Diputacin General de Aragn.

CLIFF, A.; HAGGETT, P.; ORD, J.; BASSETT, K., y DAVIES, R .


(1975): Elements of
Spatial Structure. A Quantitative Approach, Cambridge: Cambridge University
Press.

CLIFF, A., y ORD, J. {1981): Spatial Process. Models and Applications, Lon-
dres: Pion.

DACEY, M. (1965): A Review of Measures of Contiguity for Two and k-color


Maps, en Spatial Analyses: A Reader in Statistical Geography, edicin de
B. J. Berry y D. Marble, Englewood Cliffs: Prentice-Hall.

ENGLE, R. (1984): Wald, Likelihood Ratio and Lagrange Multiplier Test in


Econometrics, en Handbook of Econometrics, edicin de Z. Griliches y M.
D. Intrilligator, Amsterdam: North-Holland.
30fi E^STAUISTI('A E^SPAN()I^A

GEARY, R. (1954): The Contiguity Ratio and Statistical Mapping, The Incorporated
Statistician, 5, 115-145.

GODFREY, L. (1988): Misspecification Test in Econometrics, Cambridge:


Cambridge University Press.

GR^FFITH, D. (1988): Advanced Spatial Statistics, Londres: Kluwer.

HORDIJK, L. (1978): Problems in Estimating Econometrics Relations in Space,


Eigteenth European Congress of the Regiona/ Science Association, Fribourg,
Switzerland, August 28, September 1.

K^NG, M. (1981): A Small Sample ^Property of the Cliff-Ord Test for Spatial
Gorrelation, Journal of the Roya/ Statistical Society B, 43, 263-264.

KNOx, E. (1964): The Detection of Space-Time Interactions, Applied Statistics,


13, 25-29.

MoRAn,, P. (1950): A Test for Serial Independence of Residuals, Bometrica,


37, 17-23.

MuR, J. {1990): Correlacin espacial: Un estudio de Monte Carlo, Tesis docto-


ral, Departamento de Anlisis Econmico, Universidad de Zaragoza.

ORD, K. (1975): Estimation Methods for Models of Spatial Interaction, Journal


of the American Statistical Associativn, 70, 120-126.

RAO, R. (1965}: Linear Statistical Inference and its Application, Nueva York:
John Willey and Sons.

SAKAMOTO, Y., e ISHIGURO, H. (1986): Akaike Information Criterion Statistics,


Dordrecht: Reidel.

SEN, A. (1976): Large Sample-Size Distribution of Statistical Used in Testing


for Spatial Correlation, Geographical Analysis, 8, 175-184.

ToB^ER, W. (1970): A Computer Movie Simulating Urban Growth in the Detroit


Region, Economic Geography, 46, 234-240.
('(>N'ERAti"T"F^ E)E^ Al1TO{'ORRFLAI'll)N f:tiF'A(IAL... IIN F"ti"Tl;Ull) F)F M( ^ yTF (;^kl"^>

TESTING FOR SPATIAL AUTOCORRELATION. A MONTE CARLO


STU DY

SUMMARY

This paper is concerned with the comparison of some procedures


to test spatial autocorrelation. After a brief reference to its causes
and consequences we present a survey of some types of test
developed in the literature, form this we choose two of them and by
means of a Monte Carlo experiment we compare their properties for
different finite sample sizes and under different spatial configurations.

Keywords: Spatial autocorrelation, Moran statistic, Lagrange multiplier,


Monte Carlo experiment.

AMS Classification: 62P20, 90A19.

You might also like