You are on page 1of 58

2015

BITCORA TALLERES
ESTADSTICA ESPACIAL
UNIVERSIDAD DISTRITAL FRANCISCO JOS DE CALDAS
FACULTAD DE INGENIERA
ESPECIALIZACIN EN SIG
ESTADSTICA ESPACIAL
BOGOT D.C. COLOMBIA 2015

JUAN MANUEL CARILLO GARCIA - 20142094023


CRISTIAN ENRIQUE MORA CORTEZ - 20151094012
DIEGO ARMANDO RODRGUEZ LVAREZ - 20151094015

P g i n a 1 | 58

TABLA DE CONTENIDO

TALLER 1 AUTOCORRELACIN ESPACIAL ..................................................... 5


ACTIVIDAD INICIAL ............................................................................................ 5
MATRIZ DE PESOS ............................................................................................ 5
ANLISIS DE AUTOCORRELACIN ESPACIAL ............................................... 9
TALLER 2 REGRESIN ESPACIAL .................................................................. 15
ACTIVIDAD INICIAL .......................................................................................... 15
REGRESIN ESPACIAL ................................................................................... 19
TALLER 3. ESCOGER UN CRITERIO DE VECINDAD ........................................ 23
REGRESION SIMPLE DE LA TASA DE ANALFABETISMO (ILLITERACY): .... 23
REGRESION SIMPLE DE URBAN_POP CHINADATA (N=29: ......................... 27
REGRESION MULTIPLE CON URBAN_POP Y RMC_PC_UR_ ...................... 29
REGRESION DE ERROR SIMPLE Y RETARDO ESPACIAL ........................... 31
REGRESION DE LOGARITMO DE ANALFABETISMO: ................................... 32
TALLER 4 PATRONES PUNTUALES ESPACIALES ........................................ 34
OBJETIVOS DEL CAPTULO ............................................................................ 34
TIPOS DE PATRONES PUNTUALES ESPACIALES ........................................ 34
CARGUE Y PREPARACIN DE DATOS .......................................................... 35
PRUEBA DE CONTEO POR CUADRANTES ................................................... 36
NDICE DE VECINO MS CERCANO .............................................................. 38
ESTIMACIN KERNEL ..................................................................................... 38
ESTIMACIN DE LA FUNCIN G .................................................................... 42
ESTIMACIN DE LA FUNCIN F ..................................................................... 44
ESTIMACIN DE LA FUNCIN L ..................................................................... 46
GENERACIN DE PATRONES PUNTUALES.................................................. 48
TALLER 5 PATRONES PUNTUALES ................................................................ 54
FUNCIN K AGREGACIN ESPACIO-TIEMPO .............................................. 54
AJUSTE POBLACIN CASO - CONTROL ....................................................... 55

P g i n a 2 | 58

LISTA DE FIGURAS
Figura 1-1. Proyecciones de la capa sids ................................................................ 5
Figura 2-1. Mapas de vecindad Queen y Rook. ...................................................... 6
Figura 2-2. Mapas de vecindad k vecinos. .............................................................. 6
Figura 2-3. Mapas de vecindad datos puntuales. .................................................... 7
Figura 2-4. Mapas de vecindad bandas de distancias. ........................................... 8
Figura 2-5. Matriz de pesos estandarizada (izquierda) y binaria (derecha). ............ 8
Figura 2-6. Matriz de pesos por inverso de distancia. ............................................. 9
Figura 3-1. ndice I de moran para matriz estandarizada y binaria........................ 10
Figura 3-2. ndice I de moran Monte-Carlo. ........................................................ 11
Figura 3-3. Histograma residuales I de moran Monte-Carlo. .............................. 11
Figura 3-4. ndice C de Geary. .............................................................................. 12
Figura 3-5. Diagrama de dispersin I de Moran Local. .......................................... 13
Figura 3-6. Mapa de Cluster I de Moran Local. ..................................................... 14
Figura 1-1. Proyecciones de la capa Boston. ........................................................ 15
Figura 1-2. Mapas de vecindad K vecinos............................................................. 16
Figura 1-3. Comparacin Mapas de vecindad K vecinos. ..................................... 16
Figura 1-4. Mapas de vecindad bandas de distancia. ........................................... 17
Figura 1-5. ndices I de moran para matriz de pesos por k vecinos (arriba) y bandas
de distancias (abajo). ............................................................................................ 18
Figura 1-5. Diagramas de dispersin I de moran para matriz de pesos por k vecinos
(izquierda) y bandas de distancias (derecha). ....................................................... 18
Figura 2-1. Resumen modelo de regresin. .......................................................... 19
Figura 2-2. Test de moran. .................................................................................... 19
Figura 2-3. Parmetros Test de moran. ................................................................ 20
Figura 2-4. Resultados Test de Breusch-Pagan.................................................... 20
Figura 2-5. Resumen modelo de retardo espacial................................................. 21
Figura 2-6. Resumen modelo de error. ................................................................. 22
Figura 4-2 Creacin Matriz de pesos (China 35) ................................................... 23
Figura 4-5 Reporte de variacin y prediccin de regresin (China 35) ................. 25
Figura 4-6 Reporte de regresin (China 35) .......................................................... 25
Figura 4-7 Diagnostico de dependencia espacial (China 35) ................................ 26
Figura 4-8 Morans I para Residuales (China 35) .................................................. 26
Figura 4-9 Ploteo China 29 en GeoDa .................................................................. 27
Figura 4-10 Despliegue tabla China 29 ................................................................. 27
Figura 4-13 Diagnostico dependencia espacial (China 29) ................................... 28
Figura 4-15 Reporte de regresin (Urban_Pop y RMC_PC_UR_) ........................ 29
Figura 26 Eventos de pasto Cogon ....................................................................... 36
P g i n a 3 | 58

Figura 27 Conteo por cuadrantes de eventos del pasto Cogon ............................ 37


Figura 28 Determinacin del A.B ptimo por error medio cuadrtico .................... 39
Figura 29 Estimacin por kernel con variacin del parmetro k ............................ 41
Figura 30 Estimacin de la funcin kernel en spatstat .......................................... 42
Figura 31 Estimacin de la funcin G para eventos del pasto Cogon ................... 44
Figura 32 Estimacin de la funcin F para eventos del pasto Cogon.................... 46
Figura 33 Estimacin de la funcin L para eventos del pasto Cogon .................... 48
Figura 34 Eventos de un patrn puntual aleatorio CSR ........................................ 49
Figura 35 Estimacin de la funcin G para un patrn puntual aleatorio ................ 50
Figura 36 Eventos de un patrn puntual regular ................................................... 51
Figura 37 Estimacin de la funcin G para un patrn puntual regular................... 51
Figura 38 Eventos de un patrn puntual agregado ............................................... 52
Figura 39 Estimacin de la funcin G para un patrn puntual agregado............... 53
Figura 6-1. Resultados Funcin K agregacin espacio temporal .......................... 55
Figura 6-2. Ploteo funciones cruzadas K y L ......................................................... 57
Figura 6-3. Ploteo funcin cruzada K en intervalos. .............................................. 58

LISTA DE TABLAS
Tabla 2-1. Resumen de distancias entre elementos. .............................................. 8
Tabla 1-1. Resumen de distancias entre elementos. ............................................ 17

P g i n a 4 | 58

TALLER 1 AUTOCORRELACIN ESPACIAL

ACTIVIDAD INICIAL

El proceso inicial consiste en familiarizarse con las funciones de lectura, proyeccin


y transformacin del sistema de coordenadas para archivos shapefile; en el caso de
estudio se tiene una capa de datos de tipo lattice del estado de carolina del norte en
los Estados Unidos de Norteamrica.
Una vez ledo el archivo, se procede a proyectarlo en coordenadas geogrficas
mediante la siguiente funcin:
proj4string(sids)=CRS("+proj=longlat +ellps=WGS84")
Con el objeto de ejemplificar las funciones de transformacin, se adoptan los
siguientes cdigos presentes en la organizacin de referencia espacial1:

EPSG:3358: NAD83(HARN) / North Carolina


ESRI:102719: NAD 1983 StatePlane North Carolina FIPS 3200 Feet

Las funciones para realizar las transformaciones, as como los resultados obtenidos
se presentan a continuacin.
sids_NAD=spTransform(sids, CRS("+init=epsg:3358"))
sids_SP=spTransform(sids, CRS("+init=ESRI:102719"))
Figura 0-1. Proyecciones de la capa sids

MATRIZ DE PESOS
Una vez definidos los datos a analizar, se procede a determinar las matrices de
pesos por cada uno de los criterios que aplican para datos de tipo lattice:

Organizacin de referencias espaciales http://www.spatialreference.org/ref/


P g i n a 5 | 58

Matriz de Contigidad: en el caso de datos de rea se define la contigidad entre


polgonos a partir de la definicin de la vecindad, la cual puede ser mediante tres
casos, en los cuales un elemento es vecino de otro si comparte por lo menos un
lmite o un punto (caso queen), si comparte como nicamente un lmite (caso rook)
o si comparte nicamente un punto (caso bishop). Para el caso de anlisis se
definen los casos queen y rook, as como se presenta la vecindad mediante los
mapas y los enlaces entre los centroides de cada polgono.
sids_nbq=poly2nb(sids)
sids_nbr=poly2nb(sids, queen=FALSE)
Figura 0-1. Mapas de vecindad Queen y Rook.

Como se puede observar, existen variaciones menores, pues existen pocos


elementos que comparten un punto entre s en el caso de polgonos irregulares
como son los polgonos del caso de estudio.
Matriz por k vecinos: te mtodo para la definicin de vecindad a partir del nmero
de vecinos ms cercanos, evala para cada polgono los enlaces entre los
centroides de cada uno. A continuacin se presentan las funciones empleadas as
como los mapas de vecindad para uno, dos y tres vecinos ms cercanos.
sids_kn1=knn2nb(knearneigh(coords,k=1),row.names=IDs)
sids_kn2=knn2nb(knearneigh(coords,k=2),row.names=IDs)
sids_kn3=knn2nb(knearneigh(coords,k=3),row.names=IDs)
Figura 0-2. Mapas de vecindad k vecinos.

P g i n a 6 | 58

Como era de esperarse el nmero de relaciones de vecindad aumenta


consecuentemente con el nuero de vecinos definido, lo cual no solo se evidencia en
la matriz definida sino en los mapas de vecindad presentados.
Este tipo de vecindad aplica no solamente a los datos de reas sino a datos
puntuales, para el caso de estudio se evala una capa de puntos mediante la lectura
de un archivo csv (comma-separated values), en el cual cada observacin tiene
como atributos su localizacin. La funcin de vecindad para dos vecinos, as como
el mapa de vecindad se presenta a continuacin.
bost_k2=knn2nb(knearneigh(coord_b,k=2,longlat=T)
Figura 0-3. Mapas de vecindad datos puntuales.

Matriz por bandas de distancia: el concepto de vecindad por bandas de distancia


consiste en que para cada elemento se crea un buffer de la distancia especificada
y se toman como vecinos los elementos que caen dentro de dicho buffer, vale la
pena aclarar que para el caso de datos de rea se toman los centroides de los
polgonos.
A continuacin se presentan las funciones implementadas as como los mapas de
vecindad resultantes para 0,75, una vez y 1,5 veces la distancia mxima entre
centroides, para lo cual se requiere la determinacin de las distancias entre todos
los elementos.
dist=unlist(nbdists(sids_kn1, coords))
max_k1<-max(dist)
sids_kd1<-dnearneigh(coords, d1=0, d2=0.75*max_k1, row.names=IDs)
sids_kd2<-dnearneigh(coords, d1=0, d2=1*max_k1, row.names=IDs)
sids_kd3<-dnearneigh(coords, d1=0, d2=1.5*max_k1, row.names=IDs)
P g i n a 7 | 58

Min.
40100

1st Qu.
89770

Median
97640

Mean
96290

3rd Qu.
107200

Max.
134600

Tabla 0-1. Resumen de distancias entre elementos.

Figura 0-4. Mapas de vecindad bandas de distancias.

En virtud a que las bandas se realizaron con base en la distancia mxima, para el
caso de 0,75 veces la distancia mxima existen un alto nmero de elementos sin
vecindad.
Generalmente una matriz de pesos es expresada en forma binaria en donde para
cada elemento en filas se indica con 1 si existe vecindad y con cero 0 si no existe
vecindad; sin embargo, es til realizar una estandarizacin a partir del
fraccionamiento de los valores indicados con tal que cada fila sume la unidad. Para
el caso de estudio la matriz estandarizada para los primeros elementos as como la
matriz binaria del caso de matriz por contigidad en el caso queen y las funciones
empleadas se presentan a continuacin.
Figura 0-5. Matriz de pesos estandarizada (izquierda) y binaria (derecha).

P g i n a 8 | 58

sids_nbq_w<-nb2listw(sids_nbq)
sids_nbq_w$weights
sids_nbq_wb<-nb2listw(sids_nbq, style="B")
sids_nbq_wb$weights
Adicionalmente la matriz de pesos se puede definir a partir del inverso de las
distancias entre en este caso los centroides de los polgonos; se definen las
distancias, la funcin inversa y la matriz de pesos por contigidad en el caso queen
cuyas funciones y resultado se presenta a continuacin.
dist=nbdists(sids_nbq, coordinates(sids_SP))
idw=lapply(dist, function(x) 1/(x/1000))
sids_nbq_idwb=nb2listw(sids_nbq, glist=idw, style="B")
sids_nbq_idwb$weights
Figura 0-6. Matriz de pesos por inverso de distancia.

ANLISIS DE AUTOCORRELACIN ESPACIAL


El anlisis de autocorrelacin espacial se determina a partir de la estimacin del
ndice I de Moran, la cual es la mejor medida clsica que depende de la matriz de
pesos definida y la variable de estudio.
Para el caso de estudio se comparan los valores del ndice obtenido para la variable
SIDR79 y las dos matrices definidas, estandarizada por filas y binaria. A
continuacin se presentan las funciones y los resultados obtenidos.
P g i n a 9 | 58

moran.test(sids_NAD$SIDR79, listw=sids_nbq_w, alternative="two.sided")


moran.test(sids_NAD$SIDR79, listw=sids_nbq_wb)
Figura 0-1. ndice I de moran para matriz estandarizada y binaria.

Como se puede observar el valor del ndice para la variable en particular, son
similares y cercanos a cero, sin embargo el pvalue para un nivel de confianza del
95% de la matriz estandarizada es menor por lo que su significancia indica que se
rechaza la hiptesis alternativa de aleatoriedad espacial indicando que existe una
autocorrelacion dbil.
As mismo, el i de moran supone normalidad y aleatoriedad en los datos, razn por
la cual para el primer supuesto se acostumbra a realizar simulaciones de Montecarlo
en las cuales a partir de un nmero significativo de simulaciones se obtiene
conjuntamente la normalidad. En el caso de estudio se realizaron 999 simulaciones
cuyas funciones aplicadas y resultados se presentan a continuacin:
bperm=moran.mc(sids_NAD$SIDR79, listw=sids_nbq_w, nsim=999)

P g i n a 10 | 58

Figura 0-2. ndice I de moran Monte-Carlo.

Como se puede observar el ndice presenta un valor similar pero el pvalue se reduce
an ms indicando posible autocorrelacin espacial.
Figura 0-3. Histograma residuales I de moran Monte-Carlo.

El histograma de los residuales del i de moran simulados presentan una media de


cero indicando normalidad.
Adicionalmente el ndice C de Geary permite validar los resultados obtenidos, en la
cual valores menores a 1 indican posible autocorrelacin y valores mayores indican
autocorrelacin negativa. El valor del ndice as como las funciones empleadas se
presentan a continuacin igualmente para las dos matrices de pesos consideradas
anteriormente.
geary.test(sids_NAD$SIDR79, listw=sids_nbq_w)
geary.test(sids_NAD$SIDR79, listw=sids_nbq_wb)

P g i n a 11 | 58

Figura 0-4. ndice C de Geary.

Como se puede observar, valores menores a 1 indican una posible autocorrelacin


espacial.
Finalmente el anlisis del ndice I de moran, aplicado de manera local, permite
identificar la localizacin de los conglomerados espaciales, cuyas presencias fueron
definidas por el I de Moran global, para poder construir los mapas de
conglomerados. Los cinco tipos de conglomerados espaciales definidos son:
i)
ii)
iii)
iv)
v)

alto-alto.
bajo-bajo.
bajo-alto.
alto-bajo.
relacin no significativa.

A continuacin se presentan las funciones aplicadas para graficar los valores del i
de moran resaltando los estadsticos significantes agrupados as como los
resultados obtenidos.
nci=moran.plot(sids_NAD$SIDR79,sids_nbq_w,labels=as.character(sids_NAD$NA
ME), xlim=c(-1,6.5), ylim=c(-1,4.5), xlab="SIDS Rate", ylab="SL SIDS Rate")

P g i n a 12 | 58

Figura 0-5. Diagrama de dispersin I de Moran Local.

El grafico de dispersin muestra el ndice global (0,14), el cual se encuentra entre


el rango de 0 y 1, indicando que existe una posible autocorrelacin espacial,
validado por la pendiente de la regresin. Los puntos en el cuadrante inferior
izquierdo muestran los conglomerados bajo-bajo y los puntos del cuadrante superior
derecho indica los conglomerados alto-alto. As mismo, a continuacin se presenta
las funciones implementadas y el mapa de cluster, indicando la localizacin de los
diferentes tipos de conglomerados espaciales.
infl=apply(nci$is.inf, 1, any)
x=sids_NAD$SIDR79
lhx=cut(x,
breaks=c(min(x),
mean(x),
max(x)),labels=c("L",
"H"),
include.lowest=TRUE)
wx=lag(sids_nbq_w, sids_NAD$SIDR79)
lhwx=cut(wx,
breaks=c(min(wx),
mean(wx),
max(wx)),labels=c("L",
"H"),
include.lowest=TRUE)
lhlh=interaction(lhx, lhwx, infl, drop=TRUE)
cols=rep(1, length(lhlh))
cols[lhlh == "H.L.TRUE"]=2
cols[lhlh == "L.H.TRUE"]=3
cols[lhlh == "H.H.TRUE"]=4
plot(sids_NAD, col=grey.colors(4, 0.95, 0.55, 2.2)[cols])
legend("bottomright", legend=c("None", "HL", "LH", "HH"), fill=grey.colors(4, 0.95,
0.55, 2.2), bty="n", cex=0.8, y.intersp=0.8)
P g i n a 13 | 58

Figura 0-6. Mapa de Cluster I de Moran Local.

P g i n a 14 | 58

TALLER 2 REGRESIN ESPACIAL

ACTIVIDAD INICIAL
El objetivo del anlisis de regresin espacial consiste en tratar la autocorrelacin
espacial que existe entre una variable dependiente con relacin a una o varias
variables independientes y la correlacin de los errores entre las observaciones y
las estimaciones; en el caso de estudio se tiene una capa de datos de tipo puntual
de la ciudad de Boston del estado de Massachusettes en los Estados Unidos de
Norteamrica.
El anlisis de regresin espacial requiere de la definicin de la autocorrelacin entre
las variables y los residuales del modelo de regresin, razn por la cual el presente
taller requiere de las herramientas y conceptos definidos en el taller anterior.
En primer lugar luego de cargados los datos, se requieren realizar las proyecciones
y transformaciones. Segn el estado de anlisis se adoptan los siguientes cdigos
presentes en la organizacin de referencia espacial:

EPSG:2805: NAD83(HARN) / Massachusetts Mainland


ESRI:102686: NAD 1983 StatePlane Massachusetts Mainland FIPS 2001
Feet

Los esquemas de los datos en las diferentes proyecciones se presentan a


continuacin.
Figura 0-1. Proyecciones de la capa Boston.

Posteriormente, al igual que para el anlisis anterior, se requiere la estimacin de


las matrices de vecindad, las cuales para el tipo de datos disponibles se realiza
mediante los criterios de k vecinos y bandas de distancias. Las funciones aplicadas
P g i n a 15 | 58

son las mismas que se presentaron anteriormente razn por la cual a continuacin
se presentan los mapas de vecindad indicados.
Figura 0-2. Mapas de vecindad K vecinos.

En virtud a que en el taller anterior se realiz el anlisis de vecindad para datos


puntuales por k vecinos, a continuacin se presenta la comparacin entre los mapas
de vecindad, en donde la nica diferencia radica en el sistema de proyeccin
aplicado.
Figura 0-3. Comparacin Mapas de vecindad K vecinos.

Al igual que en los anlisis anteriores, se evidencia que a mayor nmero de vecinos
indicados mayores relaciones se observan en los mapas de vecindad.
Para el caso de la matriz de pesos por el mtodo de bandas de distancias se
calculan nuevamente las distancias entre cada uno de los elementos con el objeto
P g i n a 16 | 58

de poder identificar la distancia critica la cual es adoptada como la distancia mxima.


Los resultados los mapas de vecindad se presentan a continuacin.
Min.
166.6

1st Qu.
1088.0

Median
1790.0

Mean
2472.0

3rd Qu.
3128.0

Max.
13030.0

Tabla 0-1. Resumen de distancias entre elementos.


Figura 0-4. Mapas de vecindad bandas de distancia.

As mismo se observa que al incrementar el ancho de banda analizado las


relaciones entre los elementos dentro del mapa de vecindad igualmente aumentan
y densifican el esquema.
Para el caso de la matriz de pesos, se empleara la matriz estandarizada por filas, a
partir de las vecindades definidas; vale la pena aclarar que en el caso de bandas de
distancias con un ancho de 0,75 la distancia mxima se obtienen elementos sin
vecindades, razn por la cual a continuacin se indicaran los resultados del ndice I
de Moran para ambos casos de matriz de pesos y la variable LOGMEDV.
Las funciones implementadas en el caso de elementos sin vecindades requieren de
la inclusin del parmetro zero.policy=TRUE, por consiguiente las funciones
aplicadas son:
boston_kn1_w<-nb2listw(boston_kn1)
boston_kd1_w<-nb2listw(boston_kd1, zero.policy=T)
moran.test(boston$LOGMEDV, listw=boston_kn1_w)
moran.test(boston$LOGMEDV, listw=boston_kd1_w,zero.policy=T)

P g i n a 17 | 58

Figura 0-5. ndices I de moran para matriz de pesos por k vecinos (arriba) y bandas de
distancias (abajo).

Como se puede observar los pvalue son iguales indicando significancia, el valor del
ndice es mayor en el caso de la matriz por k vecinos (0.76) respecto del ndice para
el caso de bandas de distancias (0.39), indicando as una mayor autocorrelacin
espacial para el primer mtodo, igualmente se presentan los diagramas de
dispersin para ambos casos.
Figura 0-6. Diagramas de dispersin I de moran para matriz de pesos por k vecinos
(izquierda) y bandas de distancias (derecha).

Igualmente se valida la suposicin realizada a partir de la pendiente de la recta de


regresin entre la variable y el rezago espacial de la variable.

P g i n a 18 | 58

REGRESIN ESPACIAL
Se realiza la regresin espacial de la variable de estudio en funcin de 6 variables
independientes RM, LSTAT, CRIM, ZN, CHAS y DIS. Y se procede a guardar los
datos de los residuales para cada una de las observaciones. El resumen del modelo
de regresin el cual busca definir la significancia de las variables independientes se
presenta a continuacin.
Figura 0-1. Resumen modelo de regresin.

Como se puede observar, todas las variables incluidas son significativas, adicional
al valor del R2, la cual si bien no es una medida confiable del ajuste del modelo para
la regresin espacial es indicativa.
Una vez definida la matriz de pesos, como aquella obtenida mediante el mtodo de
k vecinos, se procede a realizar el test de moran mediante la siguiente funcin con
el objeto de verificar los residuales para autocorrelacin espacial, cuyos resultados
se presentan a continuacin
lm.morantest(bostlm,boston_kn1_w)
Figura 0-2. Test de moran.

P g i n a 19 | 58

En virtud a que se tiene un pvalue significativo y al valor alto del ndice de moran de
los residuales se puede establecer que existe autocorrelacin espacial para los
residuales indicando as que el modelo requiere de la inclusin de una variable
espacial.
Para determinar el tipo de dependencia espacial del modelo de regresin se
obtienen todos los parmetros del test de moran mediante la siguiente funcin con
los siguientes resultados.
lm.LMtests(bostlm, boston_kn1_w, test="all")
Figura 0-3. Parmetros Test de moran.

Estos resultados indican como significativos LMerr y LMlag, razn por la cual se
aplican test robustos para determinar el tipo de dependencia espacial.
Adicionalmente se aplica el test de Breusch-Pagan, el cual busca establecer la
existencia de heterocedasticidad (varianza no constante) en los errores. Las
funciones aplicadas as como los resultados del test se indican a continuacin:
library(lmtest)
bptest(bostlm)
Figura 0-4. Resultados Test de Breusch-Pagan.

P g i n a 20 | 58

El resultado del test y el valor de pvalue significativo indican que los errores son
heteroscedsticos, lo cual es consistente puesto que se tiene dependencia espacial
Finalmente se corren los modelos de retardo espacial y de error, los cuales buscan
definir la variable espacial a agregar al modelo de regresin. Las funciones
aplicadas y los resultados obtenidos se presentan a continuacin:
bostlag=lagsarlm(LOGMEDV~RM + LSTAT + CRIM + ZN + CHAS + DIS,
data=boston, boston_kn1_w)
summary(bostlag)
bptest.sarlm(bostlag)
Figura 0-5. Resumen modelo de retardo espacial.

Para el modelo de retardo espacial el pvalue del test LM indica que an existe una
mnima autocorrelacin espacial de los para el nivel de confianza definido y el test
BP indica que permanece la heterocedasticidad en los residuales.

P g i n a 21 | 58

bosterr=errorsarlm(LOGMEDV~RM + LSTAT + CRIM + ZN + CHAS + DIS,


data=boston, listw=boston_kn1_w)
summary(bosterr)
bptest.sarlm(bosterr)
Figura 0-6. Resumen modelo de error.

Para el modelo de error el pvalue del test LR indica el peso de la variable espacial
lambda equivalente al 41%.

P g i n a 22 | 58

TALLER 3. ESCOGER UN CRITERIO DE VECINDAD

REGRESION SIMPLE DE LA TASA DE ANALFABETISMO (ILLITERACY):


Visualizacion ShapeFile de China 35.
Figura 4-1 Ploteo China 35 en GeoDa

Despus creamos los pesos por el mtodo basado contigidad, utilizando el caso
Queen de orden grado uno, esto se realiza necesario para probar la auto
correlacin espacial. Con este paso se genera un archivo (.gal)
Figura 7-2 Creacin Matriz de pesos (China 35)

Realizamos la regresin simple, tomando como variable dependiente a illiteracy, y


como variable independiente Urban_pop_, en este proceso nos genera un reporte,

P g i n a 23 | 58

donde se encuentran que los coeficientes de la constante y de la variable


Urban_Pop_ son de 11.3146 y -6.5784 respectivamente.
Figura 4-3 Reporte de regresin (China 35)

En esta imagen observamos los coeficientes utilizados, para realizar la regresin


ordinaria. Ahora se procede a capturar estos resultados en la tabla, para ello captura
las variables de la prediccin y los valores de los residuales, generando el campo
de los atributos respectivamente.
Figura 4-4 Almacenamiento y despliegue de prediccin y residuales (China 35)

P g i n a 24 | 58

Procedemos a realizar la visualizacin de esta informacin en forma grfica, all


visualizar valores extremos, dando como resultado que la media de los residuos es
siempre cero.
Figura 8-5 Reporte de variacin y prediccin de regresin (China 35)

Variacin Total
Illiteracy v. Urban Pop%

Prediccin
regresin
OLS_Predict
Pop%

por
v.

la Variacin del residual


OLS_Resid v. Urban
Urban Pop%

En el anlisis del resultado de la regresin simple se obtiene las estadsticas de la


variable dependiente que estn resaltadas color rojo. Igualmente se puede hacer
una interpretacin de los resultados donde la regresin explica el 4.6% de la
varianza en este caso en Y, por ello podemos decir que NO es estadsticamente
significante por la probabilidad (F-staticstic) que tiene un valor de 0.215.
Figura 4-69 Reporte de regresin (China 35)

P g i n a 25 | 58

En este mismo sentido se puede comparar los valores de la Variacin de la


estimacin que la cual se calcula Sum squared residual / Degres os Fredom,
1368.89/33=41.4816 y la del error estndar e la estimacin que se encuentra raz
de la variacin calculada 41.4816=6.44062.
Figura 10 Diagnostico de dependencia espacial (China 35)

Nota: Para este proceso se realiz el diagnostico de los estadsticos espaciales


dependientes a travs de peso basados por contigidad, caso Queen de primer
grado.
Dada la anterior aclaracin, se puede determinar de esta manera que como el
Morans I (error) es igual a 0.0933, este es efectivamente no existe autocorrelacin
debido a que este tiende a cero (0).
En la siguiente grafica se puede ver reflejado el valor de Morans donde esta variable
espacial tiende a los valores agregados bajos bajos, y con alta variabilidad debido
a la presencia de datos atipocos.
Figura 4-811 Morans I para Residuales (China 35)

P g i n a 26 | 58

REGRESION SIMPLE DE URBAN_POP CHINADATA (N=29:

Este mismo procesamiento se realiza para los datos de China con 29 provincias.
Figura 4-9 12Ploteo China 29 en GeoDa

En esta regresin se encuentran que los coeficientes de la constante y de la variable


Urban_Pop_ son de 16.0475 y -16.1450 respectivamente
Figura 4-1013 Despliegue tabla China 29

Procedemos a realizar la visualizacin de esta informacin en forma grafica


Figura 4-11 Reporte de variacin y prediccin de regresin (China 29)

Variacion Total
Illiteracy v. Urban Pop%

Prediccin por la regresin


OLS_Predict v. Urban Pop%

Variacion del residual


OLS_Resid v. Urban Pop%

P g i n a 27 | 58

En el anlisis del resultado de la regresin simple se obtiene las estadsticas de la


variable dependiente que estn resaltadas color rojo. Igualmente se puede hacer
una interpretacin de los resultados donde la regresin explica el 33.4 % de la
varianza en este caso en Y con respecto a la de 23 providencias que solo explicaba
un 4.6%. Por ello podemos decir que es estadsticamente significante por la
probabilidad (F-staticstic) que tiene un valor de 0.001.
Figura 4-12 Reporte de regresin (China 29)

En este mismo sentido se puede comparar los valores de la Variacin de la


estimacin que la cual se calcula Sum squared residual / Degres os Fredom,
314/27=11.64 y la del error estndar e la estimacin que se encuentra raz de la
variacin calculada 11.6461=3.29
Figura 4-1314 Diagnostico dependencia espacial (China 29)

P g i n a 28 | 58

Nota: Para este proceso se realiz el diagnostico de los estadsticos espaciales


dependientes a travs de peso basados por contigidad, tipo Queen de primer
orden.
Dada la anterior aclaracin, se puede determinar de esta manera que como el
Morans I (error) es igual a 0.563, este es efectivamente tiene autocorrelacin
espacial positiva.
En este caso, ya con los datos reducidos a 29, se observa una distribucin mejor de
los datos en los cuadrantes, son no tienen tendencia, ni agregacin.
Figura 4-14 Morans I para Residuales (China 29)

REGRESION MULTIPLE CON URBAN_POP Y RMC_PC_UR_


Con los mismos datos de la China de 29 provincias, se calcula ahora la regresin
mltiple para, Illiteracy con % Pop Urban con UrbanIncome.
Dado que ya se calcularon los pesos por medio de la vecindad contigua se
procede a generar la regresin mltiple.
Figura 4-15 15Reporte de regresin (Urban_Pop y RMC_PC_UR_)

P g i n a 29 | 58

As mismo se obtienen las estadsticas generales de los datos, aunque al


observar la probabilidad de los datos se obtiene que la variable URBAN_POP,
es significativa dado que tienes un valor de 0.004 pero, el RMB_PC_URB no lo
es debido a que si probabilidad es de 0.1585. Adems al observar el diagnostico
de dependencia espacial el Morans I (error) lo encontramos como No
significativo.
Figura 4-16 Reporte de regresin (Urban_Pop y RMC_PC_UR_)

Para una visualizacin de los datos se presentan las siguientes graficas:


Figura 4-17 Cluster (Urban_Pop y RMC_PC_UR_)

En estos trminos se ratifica la expresin anterior, donde se dice que No es


estadsticamente significativo y que no existe auto correlacin espacial debido a
que el Morans I es de 0.0225, con un p-valor de 0.448.
Figura 4-18 Morans I y Montecarlo (Urban_Pop y RMC_PC_UR_)

Grfica Morans I

Permutaciones de Monte Carlo


P g i n a 30 | 58

REGRESION DE ERROR SIMPLE Y RETARDO ESPACIAL

De esta misma forma, se realiza la regresin mltiple de los anteriores datos,


pero esta genera los resultados del modelo de errores espaciales.
Figura 4-19 Reporte de regresin (Modelo error espacial)

Dado que LAMBDA es la variable espacial, esta dice cumplir con el 60% del
todo el modelo y esta dependen del p-valor y el nivel de confianza, y como
el valor es de 0.871 podemos afirmar que este No es significativo.
Figura 4-20 Regresin mltiple los resultados del modelo de retardos espaciales.

P g i n a 31 | 58

Para continuar con este anlisis, se obtiene la regresin mltiple para la


obtencin de los resultados del modelo de retardos espaciales.
Igualmente cuando se visualiza el resultado del peso de la variable se obtiene
que este retardo espacial no sea significativo.
REGRESION DE LOGARITMO DE ANALFABETISMO:
Para obtener un mejor entendimiento de lo anterior descrito se presenta los modelos
grficamente, dado que la relacin que de la grafia xx, no es lineal se debe realizar
un calcul logartmico (Log base 10), de la variable Illiteracy.
Figura 4-21 Scatter Plot (URBAN_POP Y LOG_ILLT)

P g i n a 32 | 58

Figura 4-22 Reporte de regresin (Log de Illiteracy)

P g i n a 33 | 58

TALLER 4 PATRONES PUNTUALES ESPACIALES

OBJETIVOS DEL CAPTULO

1. Determinar si existe tendencia de los eventos a encontrarse en un patrn


sistemtico sobre el rea de estudio como contradiccin a estar
aleatoriamente distribuidos.
2. Identificar si un patrn muestra una agregacin, regularidad o aleatoriedad.

TIPOS DE PATRONES PUNTUALES ESPACIALES

Aleatorio: Cualquier
punto es igualmente
probable de ocurrir en
cualquier ubicacin y la
posicin de cualquier
punto no es afectada por
la posicin de otro punto.

Uniforme: Todos los


puntos estn alejados a
una distancia
aproximadamente igual
de sus vecinos ms
prximos.

Agregado:
Muchos
puntos se agrupan cerca
los unos a los otros y en
extensas reas se ubican
unos pocos.

P g i n a 34 | 58

CARGUE Y PREPARACIN DE DATOS


Los datos corresponden a un grupo de 191 localizaciones donde se observ la
presencia de la especie de pasto Cogon (especie invasiva en Florida).
En primera medida se cargan las libreras que se utilizarn para el anlisis de los
datos.
library(maptools)
library(rgdal)
library(shapefiles)
library(spatstat)
library(splancs)
Luego se define el directorio de trabajo.
workingDir="D:/Clase
5"
Posteriormente se define la ventana de anlisis con el fin de delimitar la zona donde
efectivamente se harn todos los procedimientos y se cargan los puntos de
coordenadas que representan la ocurrencia de los eventos.

border<-readShapePoly(paste(workingDir,
"/FLBndy.shp",
sep=""))
flbord<-border@polygons[[1]]@Polygons[[1]]@coords
str(border)
flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp")
flinvxy<-coordinates(flinv)
flinv<-readShapePoints("D:/Clase 5/FL_Invasive.shp")
flpt<-as(flinv,"ppp")
border<-readShapePoly(paste(workingDir,
"/FLBndy.shp",
sep=""))
flbdry<-as(border,"owin")
flppp<-ppp(flpt$x,flpt$y,window=flbdry)
Adicionalmente se grafica la ventana de anlisis y los eventos al interior de ella.
P g i n a 35 | 58

plot(flppp,axes=T)
Figura 16 Eventos de pasto Cogon

En la grfica se ve claramente la forma y borde del rea de inters as como la


posicin de cada uno de los eventos en su interior.

PRUEBA DE CONTEO POR CUADRANTES

El mtodo de conteo por cuadrantes divide el rea de estudio en subregiones de


igual tamao. Generalmente cuadrados, pero no necesariamente deben serlo (se
debe tener en cuenta que una subdivisin o grilla diferente en tamao o forma arroja
resultados diferentes). Luego cuenta la frecuencia de los eventos y calcula la
intensidad de estos en cada subregin.
En R se ejecuta un test para comprobar la hiptesis de completa aleatoriedad
espacial. Incicialmente se indica al test que divida la ventana de anlisis en una
cuadrcula compuesta por 10 filas y 10 columnas.
qt=quadrat.test(flppp,
ny=10)
qt

nx=10,

P g i n a 36 | 58

Resultado de la prueba
Chi-squared test of CSR using quadrat
counts
Pearson X2 statistic
data: flppp
X2 = 292.51, df = 89, p-value < 2.2e-16
alternative hypothesis: two.sided
Quadrats: 90 tiles (irregular windows)

El p-valor de esta prueba efectuada sobre una distribucin a dos colas, indica
claramente que se rechaza la hiptesis nula. Por lo anterior es posible afirmar que
los datos conforman un patrn puntual agregado.
Ahora se grafica el resultado del conteo por cada tile de la cuadrcula versus el
conteo esperado.

Figura 17 Conteo por cuadrantes de eventos del pasto Cogon

P g i n a 37 | 58

En la grfica se evidencian algunos cuadrantes con un nmero elevado de eventos,


muy superior al nmero esperado. La grfica confirma el resultado del test.

NDICE DE VECINO MS CERCANO

Con el mtodo del vecino ms cercano es posible conocer cul es la proporcin


entre la distancia mnima entre parejas de puntos vecinos y la distancia media
esperada. Para un patrn agregado esta proporcin ser cercana a cero, para un
patrn aleatorio ser de uno y para un patrn uniforme ser mayor a uno.
A diferencia del mtodo de los cuadrantes, este no se ve afectado por el tamao de
una cuadrcula, slo considera la distancia entre puntos, por lo que el analista no
debe asignar valores a parmetros.

ESTIMACIN KERNEL

La estimacin kernel permite conocer la densidad de eventos dentro de un radio de


bsqueda especfico alrededor de cada punto. En este mtodo se define un kernel
mediante una funcin matemtica que pondera la influencia de cada vecino dentro
del rea de influencia determinada por el ancho de banda o los parmetros
utilizados para definir la forma del kernel.
Es fundamental la determinacin del tipo de kernel a utilizar as como el ancho de
banda respectivo. Mediante el uso del error medio cuadrtico es posible el A.B
ptimo.
mse<-mse2d(flinvxy,flbord,100,600)
plot(mse$h, mse$mse,xlab="Bandwidth", ylab="MSE", type="l", xlim=c(100,600),
ylim=c(-30,50))
i<-which.min(mse$mse)
mse$h[i]
mse$mse[i]
points(mse$h[i], mse$mse[i])

P g i n a 38 | 58

Figura 18 Determinacin del A.B ptimo por error medio cuadrtico

Luego de identificar el ancho de banda apropiado, se procede a generar el objeto


tipo grilla donde sern almacenados los valores arrojados por este mtodo.
Adicionalmente se crea un objeto del tipo grid topology, indicando la resolucin
espacial deseada.
sG<-Sobj_SpatialGrid(border,
maxDim=400)$SG
grd<-slot(sG, "grid")
summary(grd)

poly<-slot(border, "polygons")[[1]]
poly1 <-slot(poly, "Polygons")[[1]]
coords<-slot(poly1, "coords")
min(coords[,1])
min(coords[,2])
grd<-GridTopology(cellcentre.offset=c(616593,531501),
cells.dim=c(400,400))
summary(grd)

cellsize=c(150,150),

P g i n a 39 | 58

Se procede luego al clculo de la estimacin por kernel mediante la variacin del


parmetro con el fin de tener un resultado ms suavizado o ms granular. Esto se
desarrolla con el paquete splancs o spatstat.
Usando splancs
k0 <-spkernel2d(flinvxy, flbord, h0=400, grd)
k1 <-spkernel2d(flinvxy, flbord, h0=600, grd)
k2 <-spkernel2d(flinvxy, flbord, h0=800, grd)
k3 <-spkernel2d(flinvxy, flbord, h0=1000, grd)
df<-data.frame(k0=k0, k1=k1, k2=k2, k3=k3)
kernels<-SpatialGridDataFrame(grd, data=df)
summary(kernels)
gp<-grey.colors(5, 0.9, 0.45, 2.2)
print(spplot(kernels,
at=seq(0,.00001,length.out=20),col.regions=colorRampPalette(gp)))

P g i n a 40 | 58

Figura 19 Estimacin por kernel con variacin del parmetro k

Usando spatstat
plot(density(flppp, sigma =
600))

P g i n a 41 | 58

Figura 20 Estimacin de la funcin kernel en spatstat

ESTIMACIN DE LA FUNCIN G

Es una medicin simple en la que se estudia la distribucin acumulada del nmero


de parejas de vecinos en la medida en que se va incrementando el umbral de
distancia entre ellos hasta llegar al par de vecinos ms cercanos que se hallan a
mayor distancia. Se presentan finalmente como la proporcin de nmero de parejas
a cierta distancia respecto el total de puntos considerados.
Se hace adicionalmente una simulacin de intervalo de confianza de completa
aleatoriedad espacial CSR para identificar visualmente si la grfica de eventos se
aleja significativamente de un comportamiento tpico de un patrn aleatorio.

r=seq(0,350,by=50)
G <-envelope(flppp, Gest, r=r, nsim= 59,
rank= 2)

P g i n a 42 | 58

plot(G)

P g i n a 43 | 58

Figura 21 Estimacin de la funcin G para eventos del pasto Cogon

En la grfica de la funcin G es evidente que la lnea de los valores observados se


aleja significativamente de la envolvente generada para un patrn con completa
aleatoriedad espacial CSR. El rpido incremento de la funcin G indica que
efectivamente el conjunto de puntos es un patrn agregado.

ESTIMACIN DE LA FUNCIN F

La funcin F tambin es relativamente simple, pero en esta se genera un nmero


aleatorio de ubicaciones al interior del rea de inters. Luego se observa la mnima
distancia entre cada uno de estos puntos y el evento ms cercano. Considerando
que en este mtodo los pares se forman entre puntos aleatorios y eventos, es
comprensible que la funcin tenga un comportamiento opuesto al de la funcin G
P g i n a 44 | 58

ya que en un patrn agregado la distancia de estos puntos aleatorios a un evento


ser mayor que la esperada.
De la misma forma se genera una simulacin para identificar visualmente cundo la
grfica presenta un comportamiento significativo.
r=seq(0,350,by=50)
F <-envelope(flppp, Fest, r=r, nsim= 59,
rank= 2)
plot(F)

P g i n a 45 | 58

Figura 22 Estimacin de la funcin F para eventos del pasto Cogon

En la grfica se observa que efectivamente la funcin F se ubica por debajo de la


zona de simulacin de completa aleatoriedad espacial, esto confirma que el patrn
observado es agregado.

ESTIMACIN DE LA FUNCIN L

La funcin L a diferencia de las otras estudiadas previamente, tiene en cuanta los


efectos de agregacin a varias escalas. Estudia el patrn mediante el conteo de
eventos al interior de un crculo con radio definido, haciendo lo mismo para todos
los puntos en el rea de estudio. Se controla el resultado mediante la modificacin
del parmetro h o rezago espacial.
Adicionalmente se puede aplicar una correccin por efectos de borde con la cual se
minimizan los efectos causados por la ausencia de puntos en aquellas zonas de
P g i n a 46 | 58

borde. Mediante la asignacin de una ponderacin alta si la totalidad del crculo se


halla al interior del rea de estudio, y baja si hay una porcin del crculo que est
por fuera del rea de inters.
L <-envelope(flppp, Lest, nsim= 59, rank = 2,
global=TRUE)
Tambin para la grfica se crean envolventes que permiten identificar visualmente
la significancia del comportamiento evidenciado con la funcin L.

P g i n a 47 | 58

Figura 23 Estimacin de la funcin L para eventos del pasto Cogon

Tal como se ve en la grfica, la funcin k observada de los eventos se aleja de las


bandas sombreadas que corresponderan a la funcin si el patrn presentara
completa aleatoriedad espacial. Segn lo anterior, se concluye que el patrn es
agregado. Tambin se observa en este caso que los patrones espaciales se
generan a distancias inferiores a 2000.

GENERACIN DE PATRONES PUNTUALES

Patrn aleatorio

En primera medida se genera un patrn con completa aleatoriedad espacial CSR,


esto se hace mediante la simulacin de 500 puntos provenientes de una distribucin
homognea de Poisson.
pa=rpoispp(500)
P g i n a 48 | 58

plot(pa)
Figura 24 Eventos de un patrn puntual aleatorio CSR

Adicionalmente se crea una envolvente con 99 simulaciones con base en el


comportamiento de un patrn bajo completa aleatoriedad espacial para compararlo
con la funcin G de los eventos observados.
r=seq(0,0.04,by=0.0004)
#G=envelope(pc, Gest, r=r, nsim= 59,
rank= 2)
paG=envelope(pa, Gest, r=r)
paG
plot(paG)

P g i n a 49 | 58

Figura 25 Estimacin de la funcin G para un patrn puntual aleatorio

En la grfica se observa claramente que la funcin G de los eventos analizados se


comporta de forma muy similar a la envolvente generada bajo la hiptesis de
completa aleatoriedad espacial CSR.

Patrn regular

Ahora se procede a la generacin de un conjunto de puntos que presenten un


comportamiento de patrn puntual regular.
pr=rSSI(0.05, 500)
plot(pr)
r=seq(0.05,0.1,by=0.0004)
prG=envelope(pr,
Gest,
r=r)
prG
plot(prG)

P g i n a 50 | 58

Figura 26 Eventos de un patrn puntual regular

Adicionalmente se crea una envolvente de simulaciones con base en el


comportamiento de un patrn bajo completa aleatoriedad espacial para compararlo
con la funcin G de los eventos observados.
Figura 27 Estimacin de la funcin G para un patrn puntual regular

P g i n a 51 | 58

En esta grfica es evidente que el patrn regular no presenta parejas de vecinos


cercanos a menos de una determinada distancia. Es a partir de 0.05 que la funcin
G de eventos observados empieza a tener un comportamiento creciente.

Patrn agregado

Finalmente se genera un patrn con comportamiento agregado. Esto se logra


mediante el uso de la funcin rMatClust, en esta se definen ciertos parmetros con
los que se determina el comportamiento especfico del patrn puntual agregado que
se desea generar.
pc=rMatClust(50,
0.05, 4)
plot(pc)
Figura 28 Eventos de un patrn puntual agregado

Adicionalmente se crea una envolvente de simulaciones con base en el


comportamiento de un patrn bajo completa aleatoriedad espacial para compararlo
con la funcin G de los eventos observados.
r=seq(0,0.05,by=0.0004)
pcG=envelope(pc, Gest,
rank= 2)
pcG
plot(pcG)

r=r,

P g i n a 52 | 58

Figura 29 Estimacin de la funcin G para un patrn puntual agregado

En la grfica de la funcin G para los eventos observados es evidente que sale de


la envolvente de un patrn puntual con completa aleatoriedad espacial. La funcin
G incrementa rpidamente para luego estabilizarse cerca del final, este
comportamiento es propio de un patrn agregado.

P g i n a 53 | 58

TALLER 5 PATRONES PUNTUALES

FUNCIN K AGREGACIN ESPACIO-TIEMPO

Adicional a la identificacin y determinacin de la existencia de algn tipo de patrn


puntual espacial, se requiere evaluar si ante un patrn agregado, el mismo es
generado por una variacin de la poblacin, o de la heterogeneidad en el rea de
estudio, si el mismo es debido a un factor externo como por ejemplo un foco de
contaminacin o incluso si existe una agregacin temporal.
Para evaluar dichas condiciones se parte igualmente de la formulacin de la
hiptesis nula en la cual se plantea completa aleatoriedad espacio temporal y es
entonces como los diferentes mtodos aplicados buscan evaluar la significancia de
diferentes pruebas con el objeto de aceptar o rechazar dicha hiptesis.
Las pruebas aplicadas son de tipo global entre las que se incluyen la prueba de
Knox, Mantel, la funcin K y de tipo local algunas medidas exploratorias.
En el presente taller se evala el mtodo de la funcin K aplicada mediante la
herramienta R; una vez se cargan los datos de anlisis se requiere la definicin de
los vectores de fechas. Se procede a evaluar la funcin K (stkhat), a recuperar los
residuales de la funcin y a aplicar la simulaciones de Montecarlo y evaluar la
significancia. Las funciones aplicadas as como el grfico resumen se presentan a
continuacin.
#PUNTOS
fluxy<-readOGR(dsn="C:/TrabajoR/E ESPACIAL/Clase 6",layer="Birdflu")
#VECTOR FECHAS
date<-as.Date(fluxy$OutbreakSt)
date
date2<-as.numeric(date)
date2
#FRONTERA
border<-readOGR(dsn="C:/TrabajoR/E ESPACIAL/Clase 6",layer="Birdflu_bndy")
flubord <- border@polygons[[1]]@Polygons[[1]]@coords
fluxy<-coordinates(fluxy)
P g i n a 54 | 58

#FUNCION K
flu1<-stkhat(fluxy, date2, flubord, c(12400, 13580), seq(1,10,.5), seq(30,1200,20))
flu1se<-stsecal(fluxy,
date2,
flubord,
c(12400,
13580),
seq(1,10,.5),
seq(30,1200,20))
flu1mc <- stmctest(fluxy, date2, flubord, c(12400, 13580), seq(0,10,.5), seq(30,
1200, 20), nsim=49,quiet=TRUE)
stdiagn(fluxy, flu1, flu1se, flu1mc, Dzero=TRUE)
Figura 6-1. Resultados Funcin K agregacin espacio temporal

AJUSTE POBLACIN CASO - CONTROL


Adicionalmente, en virtud a que en algunos tipos de eventos como lo es en el caso
de la epidemiologia la agregacin que se presenta se debe a la distribucin espacial
de la poblacin, razn por la cual se debe realizar un ajuste empleando como
medida global la aplicacin de la funcin K cruzada implementada en la herramienta
R. Una vez se cargan los datos, los cuales dentro de sus atributos especifican si
obedecen a casos o controles, se convierten en un tipo ppp que es la clase definida
para representar patrones puntuales en dos dimensiones. Las funciones aplicadas
as como los datos analizados se presentan a continuacin.
P g i n a 55 | 58

#MARCAS
spasthma<-readShapePoints("C:/TrabajoR/E ESPACIAL/Clase 6/spasthma.shp")
border<- readShapePoly("C:/TrabajoR/E ESPACIAL/Clase 6/spbdry.shp")
ppp<-as(spasthma,"ppp") # make points into ppp file
bdry<-as(border,"owin") # make boundary into owin file
m<-spasthma$Asthma # create marks file
asthppp<-ppp(ppp$x,ppp$y,marks=m,window=bdry)
Figura 6-2. Mapeo casos y controles

Seguidamente se corren las funciones cruzadas k y L, las lneas ejecutadas as


como los resultados obtenidos se presentan a continuacin.
#FUNCION K CRUZADA
asthkcross<-Kcross(asthppp, "case", "control",r=NULL)
asthlcross<-Lcross(asthppp, "case", "control",r=NULL)
par(mfrow=c(1,2))
plot(asthkcross)
plot(asthlcross)

P g i n a 56 | 58

Figura 6-1. Ploteo funciones cruzadas K y L

Posteriormente se procede a correr la funcin K cruzada en intervalos permitiendo


definir las bandas de confianza y determinar el tipo de patrn espacial que presentan
los datos. Las funciones ejecutadas as como los resultados obtenidos se presentan
a continuacin.
#FUNCION K CRUZADA INTERVALOS
r=seq(0,.4,by=.01)
akmult
<envelope(asthppp,
Kcross,
simulate=expression(rlabel(asthppp)))
lmult = sqrt(akmult / pi) - r
par(mfrow=c(1,2))

i="case",

j="control",

r=r,

P g i n a 57 | 58

plot(akmult, main="Cross-K Function")


ylim = c(min(lmult$obs, lmult$hi, lmult$lo, na.rm=TRUE), max(lmult$obs, lmult$hi,
lmult$lo, na.rm=TRUE))
plot(r, lmult$obs, type="l", xlab="Distance (m)", main="Ripley's K12 (Asthma
Cases/Controls)", ylab="Estimated L", xlim=c(0,.4), ylim=ylim)
lines(r, lmult$hi, lty=2)
lines (r, lmult$lo, lty=2)
Figura 6-2. Ploteo funcin cruzada K en intervalos.

Como se puede observar para la funcin K en intervalos los datos observados se


encuentran dentro de la banda de confianza indicando as que existe un patrn
espacial aleatorio.

P g i n a 58 | 58

You might also like