Professional Documents
Culture Documents
1
2
ndice general
Sntesis
1. La Introduccin
1.1. Los objetivos . . . . . . . . . . . . . . . . . . . . . .
1.2. El rea de estudio y sus caractersticas oceanogrficas
1.3. Y los datos? . . . . . . . . . . . . . . . . . . . . . . .
1.4. Las variables y el planteamiento del problema . . . . .
1.5. La metodologa y su por qu . . . . . . . . . . . . . .
1.5.1. Principios tericos iniciales . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
7
7
7
8
10
11
12
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
19
23
26
28
33
36
39
42
46
49
52
55
57
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
61
61
62
62
65
67
68
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4. Conclusiones y Recomendaciones
78
Bibliografa
80
Apndice A
81
2
ndice de cuadros
1.1. Base de datos a estudiar . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
2.7.
2.8.
2.9.
2.10.
2.11.
2.12.
2.13.
.
.
.
.
.
.
.
.
.
.
.
.
.
19
20
24
26
29
33
37
40
43
46
49
52
55
75
Prueba de hiptesis. . . . . . . . . . . . . . . .
Resultados de la prueba de Moran, variable Gbull. .
Resultados de la prueba de Moran, variable Gsipho.
Resultados de la prueba de Moran, variable Gruber.
Resultados de la prueba de Moran, variable Gsac. .
Resultados de la prueba de Moran, variable Ouniv.
Resultados de la prueba de Moran, variable Gglut. .
Resultados de la prueba de Moran, variable Ginfl. .
Resultados de la prueba de Moran, variable Gcultr.
Resultados de la prueba de Moran, variable Gtumi.
Resultados de la prueba de Moran, variable Nduter.
Resultados de la prueba de Moran, variable Npach.
Resultados de la prueba de Moran, variable Pobliq.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
ndice de figuras
1.1. Localizacin del rea de estudio. . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Lmites de la Cuenca de Panam . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Muestra obtenida de la perforacin del fondo marino. La muestra luego es llevada
8
9
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
18
21
22
23
24
25
26
27
28
29
30
30
31
31
32
32
33
34
35
35
36
37
38
39
39
40
41
42
42
43
44
45
NDICE DE FIGURAS
2.33. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gcultr
2.34. Grficos para Gtumi . . . . . . . . . . . . . . . . . . . . . . . .
2.35. Tamaos proporcionales al rango de la variable Gtumi . . . . . . . .
2.36. Grfico en 3D de la variable Gtumi . . . . . . . . . . . . . . . . .
2.37. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gtumi
2.38. Grficos para Nduter . . . . . . . . . . . . . . . . . . . . . . . .
2.39. Tamaos proporcionales al rango de la variable Nduter . . . . . . .
2.40. Grfico en 3D de la variable Nduter . . . . . . . . . . . . . . . . .
2.41. Box plot de la raz cuadrada de las diferencia vs. cada lag para Nduter
2.42. Grficos para Nduter . . . . . . . . . . . . . . . . . . . . . . . .
2.43. Tamaos proporcionales al rango de la variable Npach . . . . . . .
2.44. Grfico en 3D de la variable Npach . . . . . . . . . . . . . . . . .
2.45. Box plot de la raz cuadrada de las diferencia vs. cada lag para Npach
2.46. Grficos para Pobliq . . . . . . . . . . . . . . . . . . . . . . . .
2.47. Tamaos proporcionales al rango de la variable Pobliq . . . . . . .
2.48. Grfico en 3D de la variable Pobliq . . . . . . . . . . . . . . . . .
2.49. Box plot de la raz cuadrada de las diferencia vs. cada lag para Pobliq
2.50. Matriz de dispersin . . . . . . . . . . . . . . . . . . . . . . . .
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
45
47
47
48
48
50
50
51
51
53
53
54
54
56
56
57
58
60
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
64
66
69
70
71
73
73
74
76
77
Sntesis
Palabras claves: Geoestadstica, Autocorrelacin Espacial, Semivariograma, Sill, Rango, Varianza Nugget, Estacionaridad, Kriging, Foraminfero Planctnico.
El objetivo principal de este trabajo fue el de aplicar la geoestadstica, como herramienta
terica, para analizar la manera como se distribuyen espacialmente doce especies de foraminferos planctnicos encontrados en 31 perforaciones en la Cuenca de Panam, Pacfico
Colombiano. De forma ms precisa, se analiz si la presencia de una cantidad determinada
de individuos de cada una de las especies, encontrada en una perforacin dada, tendra alguna relacin espacial, autocorrelacin espacial, con la cantidad de individuos encontrada
en otras perforaciones.
Para ello se realiz, de manera preliminar, una anlisis exploratorio de cada una de las
variables en toda el rea de estudio, mediante el uso de paquetes dirigidos al anlisis exploratorio de variables georrefernciadas, incorporados al software R.
El anlisis exploratorio y la prueba I de Moran, permitieron determinar aquellas especies
que podran tener autocorrelacin y estacionaridad en media. Conceptos de gran importancia en la aplicacin de la geoestadstica.
La determinacin de tales especies llev a la seleccin de aquella que cumpliera, de
mejor modo, con los dos principios en mencin.
Para la especie elegida, Neogloboquadrina dutertrei, se realiz una serie de anlisis posteriores con el objeto de definir de manera ms clara su distribucin espacial en la Cuenca.
Se calcul su semivariograma, basado en la semivarianza, el cual fue sometido a modelos
de ajuste para encontrar parmetros como el Sill, el Rango y la Varianza Nugget.
Los parmetros inferidos del modelo que mejor se ajustaba al semivariograma, permitieron realizar una interpolacin espacial de los datos mediante el mtodo Kriging.
Captulo 1
La Introduccin
1.1. Los objetivos
El presente trabajo tiene trazado dos tipos objetivos que motivaron su realizacin; uno
general y varios particulares los cuales se presentan a continuacin.
Los generales
Aplicar la geoestadstica,a escala regional, al anlisis de variables que se encuentran
referenciadas geogrficamente.
Los particulares
Estudiar el comportamiento espacial en el mbito regional de las variables involucradas en el rea de estudio.
Aprender una herramienta estadstica de gran aplicacin en las ciencias naturales.
Aplicar esta herramienta a las Ciencias de la Tierra.
Integrar los conocimientos adquiridos durante la especializacin al campo de la geostadstica.
Definir, si existen, relaciones entre las variables de estudio.
CAPTULO 1. LA INTRODUCCIN
CAPTULO 1. LA INTRODUCCIN
El nombre de cada una de las especies analizadas aparece en cada columna de la Tabla
1.1 de manera abreviada. De esta manera tenemos que Gbull es referida a Globigerina
bulloides, Gsipho a Globigerina siphonifera, Gruber a Globigerinoides ruber, Gsac a Globigerinoides sacculifer, Ouniv a Orbulina universa, Gglut a Globigerinita glutinata, Gcultr
CAPTULO 1. LA INTRODUCCIN
10
Figura 1.3: Muestra obtenida de la perforacin del fondo marino. La muestra luego es llevada al
laboratorio donde se procesa y se monta en placas para el conteo de microfsiles.
a Globorotalia cultrata, Ginfl a Globorotalia inflata, Gtumi a Globorotalia tumida, Nduter
a Neogloboquadrina dutertrei, Npach a Neogloboquadrina pachyderma y Pobliq a Pulleniatina obliquiloculata (Martnez y Bedoya, 2001).
CAPTULO 1. LA INTRODUCCIN
11
CAPTULO 1. LA INTRODUCCIN
12
1.5.1.
CAPTULO 1. LA INTRODUCCIN
13
CAPTULO 1. LA INTRODUCCIN
14
De los tipos de datos espaciales anteriormente mencionados los propios de este trabajo
corresponden a datos geoestadsticos ya que D permite a s variar continuamente a travs de
una regin de espacio Euclidiano bidimensional (Cressie, 1991).
En resumen, consideraremos a (Z(s):s D R2 ) como un proceso estocstico y a
(z(s):s D R2 ) una realizacin de este proceso. Como D est contenido en el espacio
Euclidiano, llamaremos a este proceso estocstico un campo aleatorio.
El concepto de autocorrelacin es fundamental al momento de trabajar con campos
aleatorios. Este concepto difiere del concepto de correlacin entre dos variables aleatorias.
Si se tienen dos variables aleatorias X y Y que definen dos atributos diferentes, la correlacin entre X y Y se define como:
Cov[X, Y]
Corr[X, Y] = p
Var[X]Var[Y]
(1.1)
(1.2)
(1.3)
(1.4)
(1.5)
Donde t es el tiempo y h una magnitud de tiempo definida. Esta ecuacin muestra que la
correlacin entre un dato tomado para una variable en un tiempo t y otro tomado para un
tiempo de t + h depende slo de la distancia temporal que las separa. Ac la relacin se
establece entre la variable y ella misma pero en momentos diferentes, de ah su nombre de
autocorrelacin (Schabenberger, 2000).
De manera anloga, la autocorrelacin espacial se define como:
Corr[Z(s), Z(s+h)] = p
Cov[Z(s), Z(s+h)]
Var[Z(s)Var[Z(s+h)]
(1.6)
Es decir, la correlacin del valor de una variable con otro tomado en un sitio distinto, depende directamente de la distancia, h, que los separa. Cabe ac hacer mencin de la primera
ley de Tobler para condiciones en geografa:
CAPTULO 1. LA INTRODUCCIN
15
"Todo est relacionado con todo, pero las cosas cercanas estn ms relacionadas que las cosas distantes."
Si los datos no presentan autocorrelacin espacial, significa que ellos son independientes
el uno del otro y la aplicacin de la estadstica clsica sera inmediata. Para este caso el
valor de Corr[Z(s), Z(s+h)] = 0 y significara, por ejemplo, que los valores altos de la variable, estaran rodeados de valores altos o intermedios o viceversa. En otras palabras, el
conocimiento de un Zsi no aportara absolutamente en nada al conocimiento de alguno
de sus vecinos. Un resultado alto en Corr[Z(s), Z(s+h)] indica que valores altos, medios o
bajos tienden a estar rodeados de valores altos, medios o bajos respectivamente. Schabenberger (1999) indica que mientras en la correlacin producto-momento entre X y Y puede
existir una correlacin positiva o negativa, la autocorrelacin es usualmente positiva.
Parte del fundamento de la estadstica espacial reposa sobre el concepto de autocorrelacin. El poderlo definir, el determinar la distancia mxima a la que existe autocorrelacin, en caso de existir, llevan a dar un paso importante en la medida que de ello dependen los posteriores pasos, principalmente en el de prediccin o Kriging.
CAPTULO 1. LA INTRODUCCIN
16
17
11
30
12
145
36
276
20
14
47
148
27
291
10
11
11
17
75
111
35
290
26
18
18
100
106
23
311
50
166
53
296
15
70
13
14
107
116
23
371
28
15
105
125
12
303
88
30
24
102
73
14
374
12
235
43
305
10
15
238
22
303
32
43
60
217
24
444
32
18
24
40
194
28
468
14
20
228
21
312
21
18
207
27
302
11
23
205
24
296
17
10
13
39
160
30
302
10
32
290
50
408
11
177
25
232
21
24
15
139
221
26
23
23
15
142
10
259
19
236
14
279
1.8
17
16
22
13
21
176
285
14
219
24
288
63
162
49
295
49
21
17
71
93
25
298
10
48
162
55
299
226
63
300
21
282
37
376
12
10
40
200
46
363
15
12
53
120
97
321
42
38
111
524
77
532
284
56
85
5340
979
Total
110 9579
Tabla 1.1: Base de datos a estudiar. Core: cdigo de la perforacin, Prof: profundidad desde la superficie marina al piso ocenico, Long: longitud, Latit: latitud, Gbull...Pobliq: nmero de individuos
de foraminferos planctnicos, de cada especie, encontrados en la respectiva perforacin.
Captulo 2
I = Pn
Pn Pn
i=1
i=1 wij
Pnj=1
wij ui uj
2
i=1 ui
(2.1)
0, si i=j,
(2.2)
n u Wu
1 W1 u u
17
(2.3)
18
PA
Latitud
94
92
90
88
86
84
82
Longitud
|I E[I]|
I
(2.4)
La dificultad surge cuando se quiere calcular E[I] y 2 . Para ello existen dos aproximaciones
comunmente usadas (Schabenberger y Pierce, 2002):
Asumir que los Zsi son Gausianos.
Asumir que los Zsi son aleatorizados.
Bajo ambas perspectivas E[I] = 1/(n 1). La diferencia reside en la varianza (Schabenberger 1999) como se muestra en la siguiente tabla.
Modelo
Gausiano
Aleatorizado
Var(I)
n2 S1 nS2 +3S02
1
(n2)
2
S02 (n2 1
n[(n2 3n+3)S1 nS2 +3S02 ]b[(n2 n)S1 2nS2 +6S02 ]
(n3)(n2)(n1)S02
19
Schabenberger (2000) recomienda que ante la duda que podra resultar del carcter gaussiano de los datos, como nuestro caso parece ser, lo mejor es recurrir a la segunda aproximacin, es decir a la aleatorizacin de los mismos.
En la aproximacin por medio de la aleatorizacin los Z(si ) son considerados fijos inicialmente y permutados entre los n sitios, 31, donde se realiz perforacin. Existiran 31! de
permutaciones igualmente probables y I2 sera la varianza de los 31! valores I de Moran. Si
se adopta la aleatorizacin de los datos, se puede calcular un valor p emprico para probar
la no autocorrelacin espacial, clasificando el valor observado de I entre las (n! 1) posibles permutaciones restantes (Schabenberger y Pierce, 2002).
Para cada una de las variables se realiz la prueba de Moran. Para ello se utiliz el paquete spdep del software R cuyo cdigo se puede revisar en el Apndice A.
A manera de ejemplo se presenta una salida de esta prueba para un k (nmero de vecinos ms prximos) determinado.
Variable Gbull, K=5
Morans I test under randomisation
data: Gbull using rank correction
weights: vecinos.listaw
Moran I statistic standard deviate = 2.7854, p-value = 0.002673
alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
0.232615669 -0.033333333 0.009116604
Resulta de all el valor de Moran I statistic que corresponde la valor observado del I de
Moran. Expectation corresponde al valor esperado, E[I], y Variance a la varianza de I.
El p-value o valor p, ser comparado, en cada variable, con un = 0,05 para realizar la
siguiente prueba de hiptesis, Tabla 2.1:
Ho: E[I] =
Ha: E[I] >
1
N 1
1
N 1
Proceso aleatorio
Autocorrelacin espacial positiva
I Moran Obs.
0.31962472
0.232615669
0.204825608
0.143789387
0.109886854
0.044929023
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
20
Valor p
0.002479
0.002673
0.001495
0.003231
0.006362
0.04501
Coord Y
21
2
4
Y Coord
94
92
90
88
86
84
82
20
40
60
80
100
120
data
15
0
20
10
Frequency
60
40
data
80
100
20
120
X Coord
94
92
90
88
86
Coord X
84
82
20
40
60
80
100
120
data
Figura 2.2: Grficos para Gbull. Los colores rojo, amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.
colores azules, verdes a verdes y se exceptan los amarillos y los rojos que son escasos.
Eso significa que determinados valores estn rodeados de valores similares, corroborando
el resultado encontrado con la prueba de Moran.
Las grficas superior derecha e inferior izquierda presentan el comportamiento de la
variable en dos direcciones. En sentido Norte-Sur y en sentido Este-Oeste respectivamente.
En sentido Norte-Sur se observa bastante homogeneidad en los valores de la variable. Sin
embargo resalta la presencia de un valor bastante alto que corresponde a la perforacin
TR163-35 (Tabla 1.1). En sentido Este-Oeste, grfica inferior izquierda los datos igualmente se oscilan entre valores de 0 a 20 con excepcin de un punto bastante anmalo en su
valor.
La grfica inferior derecha corrobora la predominancia del valor de la variable en el
intervalo de 0 a 20. Igualmente se manifiesta el valor anmalo en la cola derecha del histograma.
La Figura 2.3 representa de manera un poco ms clara la variacin espacial de la magnitud de la variable. Se aprecia que en la parte Sur-Oriental de la zona se presentan los
mayores valores. En la parte central del rea parecen insinuarsen valores intermedios, con
un leve aumento al Occidente del rea.
El grfico en 3D es til cuando el tamao de la muestra es pequeo, ya que se logra
distinguir las diferencias que pueda presentar espacialmente una variable. La Figura 2.4
corresponde a uno de ellos.
En este grfico se puede apreciar de manera clara el valor anmalo y lo descrito anteriormente. Se logra observar cada valor y sus vecinos ms cercanos, con una aparente tendencia
22
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.3: Tamaos proporcionales al rango de la variable Gbull. A mayor tamao de la circunferencia, mayor es la magnitud del conteo.
23
60
Gbull
8
6
40
Latitud
80
100
120
Diagrama de dispersin en 3D
Rotado 120
20
2
0
2
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.4: Grfico en 3D de la variable Gbull. Los colores rojos indican aquellas perforaciones
ms cercanas espacialmente y los negros, las ms lejanas.
involucrados. En otras palabras parece ser que la variable Gbull, presenta un comportamiento similar, en cuanto al nmero de especmenes encontrados en cada perforacin, a partir de
esta lag, en todas las direcciones.
De lo anterior surgen dos conceptos fundamentales en geoestadstica; los procesos en
donde le comportamiento de la variable es igual en todas las direcciones, es decir, es independiente de la direccin en que se analice y los procesos donde el comportamiento de la
variable s depende de la direccin en que se observe. A los primeros se les llama procesos
isotrpicos y a los segundos procesos anisotrpicos.
Para concluir, se puede decir que los valores de la variable Gbull, 524, no corresponden
a un proceso natural aleatorio sino que obedecen a un posible proceso con presencia de autocorrelacin espacial relativamente dbil y con presencia de un posible proceso anisotrpico.
8
6
4
2
10
10
45 22.5, NESO
0 22.5, EO
24
90 22.5, NS
8
6
4
0
8
6
4
2
10
lag
lag
10
lag
4
lag
Figura 2.5: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones diferentes para Gbull. Note que la en la direccin NO-SE la variabilidad no es grande.
k
3
5
7
10
12
16
I Moran Obs.
0.17301442
0.167885436
0.167733090
0.132754418
0.144068657
0.084752057
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.05023
0.01754
0.006097
0.005329
0.001014
0.005265
Coord Y
25
2
4
Y Coord
94
92
90
88
86
84
82
10
data
10
0
data
Frequency
15
10
X Coord
94
92
90
88
86
84
82
Coord X
10
data
Figura 2.6: Grficos para Gsipho. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.
26
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.7: Tamaos proporcionales al rango de la variable Gsipho. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
k
3
5
7
10
12
16
I Moran Obs.
0.27109478
0.134464959
0.116554030
0.033129367
0.007876118
0.007729779
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.007688
0.03942
0.03085
0.1534
0.2367
0.1869
27
6
6
4
Gsipho
Latitud
10
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.8: Grfico en 3D de la variable Gsipho. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
45 22.5, NESO
3.0
2.0
0.0
90 22.5, NS
2.0
1.0
3
lag
0.0
lag
4
lag
3.0
1.0
2.0
1.0
0.0
3.0
0 22.5, EO
28
4
lag
Figura 2.9: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones diferentes para Gsipho.
Obsrvese cmo para la direccin E-O la variable presenta grandes cambios en la variabilidad de la raiz cuadrada de la diferencia a medida que aumentamos los lags. Las direcciones NE-SO y N-S muestran un comportamiento similar para cada lag. La direccin
NO-SE difiere de las anteriores. Para los dos primeros lags, se da una variabilidad bastante
baja, la cual aumenta a partir del tercer lag. Nuevamente estamos ante un proceso anisotrpico con comportamientos similares en dos direcciones.
Para finalizar el anlisis de esta variable, resumiremos que ella parece presentar autocorrelacin espacial hasta k=7, con presencia de un proceso anisotrpico a nivel global e
isotropa en las direcciones NE-SO y N-S.
8
6
4
2
Coord Y
2
4
94
92
90
88
86
84
82
20
40
60
80
data
10
0
20
40
Frequency
15
60
20
80
X Coord
data
29
2
4
Y Coord
94
92
90
88
86
84
82
Coord X
20
40
60
80
100
data
Figura 2.10: Grficos para Gruber. Los colores amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.
k
3
5
7
10
12
16
I Moran Obs.
0.27398776
0.139848327
0.123186620
0.015891485
-0.038273554
0.030238983
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.007214
0.03486
0.02552
0.2246
0.5342
0.08425
30
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.11: Tamaos proporcionales al rango de la variable Gruber. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
60
6
4
Gruber
8
40
Latitud
80
100
Diagrama de dispersin en 3D
Rotado 120
20
2
0
2
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.12: Grfico en 3D de la variable Gruber. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas. Note los valores altos hacia el NO-SE
45 22.5, NESO
2.0
1.0
0.0
90 22.5, NS
1.0
0.0
2.0
1.0
2.0
lag
0.0
1
lag
3.0
3.0
0.0
1.0
2.0
3.0
0 22.5, EO
31
lag
lag
Figura 2.13: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
8
6
4
2
Coord Y
2
4
Y Coord
94
92
90
88
86
84
82
10
15
20
25
30
data
8
0
Frequency
15
10
data
20
10
25
12
30
X Coord
94
92
90
88
86
Coord X
84
82
10
15
20
25
30
data
Figura 2.14: Grficos para Gsac. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.
32
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.15: Tamaos proporcionales al rango de la variable Gsac. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
15
Gsac
8
6
10
Latitud
20
25
30
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.16: Grfico en 3D de la variable Gsac. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
De lo anterior, se concluye que esta variable presenta un posible autocorrelacin espacial dbil con presencia de un proceso anisotrpico y oscilaciones en la variablidad de la
raz cuadrada de las diferencias especialmente en las direcciones E-O y NO-SE.
lag
90 22.5, NS
0 1 2 3 4 5
lag
0 1 2 3 4 5
1
0 1 2 3 4 5
45 22.5, NESO
0 1 2 3 4 5
0 22.5, EO
33
lag
lag
Figura 2.17: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gsac.
I Moran Obs.
0.06164828
0.090460740
0.129623621
0.084993511
0.070909042
0.012319517
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.2248
0.0974
0.02111
0.03443
0.03489
0.1614
Coord Y
34
2
4
Y Coord
94
92
90
88
86
84
82
10
data
15
10
0
data
Frequency
20
10
X Coord
94
92
90
88
86
84
82
Coord X
10
data
Figura 2.18: Grficos para Ouniv. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.
valores ms altos, amarillos, se encuentran separados a distancias relativamente intermedias. Esto puede dar una respuesta inicial al anlisis de las pruebas de Moran anteriormente
realizado.
Las grficas superior derecha e inferior izquierda muestran cmo los datos en las direcciones N-S y E-O se encuentran en su mayor parte entre 0 y 2 unidades, lo que es corroborado con el histograma de frecuencias del grfico inferior derecho.
La Figura 2.19 representa aquellas perforaciones donde el conteo fu mayor y aquellas
donde los valores fueron cero, los crculos ms pequeos. Sin embargo definir alguna tendencia all se dificulta por el escaso nmero de datos.
La grfica en 3D, Figura 2.20, podra mostrar de manera ms clara alguna relacin espacial. Vese en ella la zona Sureste donde se presentan los valores ms altos, rodeados de
valores intermedios y luego bajos. Esto es positivo al momento de definir autocorrelaciones
espaciales, ya que podran indicar cierta dependencia de la distancia en la medida que las
cantidades de individuos disminuyen al aumentar aquella. Hacia el Noreste se presenta una
perforacin con valores relativamente altos rodeados de valores pequeos lo que podra
determinar la presencia de procesos aleatorios en ese sector. Es importante observar, y de
manera especulativa, la direccin N-S cercana a la lnea de costa, donde se parte de valores
bajos que luego aumentan y disminuyen posteriormente hacia el Norte. Los puntos que se
encuentran sobre el plano XY, corresponden a perforaciones sin individuos.
El anlisis de la varianza de la raz cuadrada de las diferencias se hace a partir de la
Figura 2.21. Para la direccin E-O se observa que el comportamiento de la varianza de la
35
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.19: Tamaos proporcionales al rango de la variable Ouniv. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
Ouniv
8
6
4
Latitud
10
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.20: Grfico en 3D de la variable Ouniv. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
raiz cuadrada presenta un comportamiento bastante irregular a medida que se aumentan los
36
lags. Para la direccin N-S resltese la manera como esta raz disminuye lo mismo que su
variabilidad, registrndose un aumento considerable en la variabilidad para los lags 5 y 6.
Las direcciones NE-SO presenta un valor de la raz que igualmente disminuye pero presentando cierta constancia en la variabilidad de los datos y en la direccin NO-SE se da la
presencia de un proceso aparentemente fluctuante.
3.0
2.0
1.0
90 22.5, NS
lag
2.0
1.0
0.0
3.0
2.0
1.0
3.0
lag
lag
0.0
1
0.0
3.0
2.0
1.0
1
45 22.5, NESO
0.0
0 22.5, EO
lag
Figura 2.21: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Ouniv.
La variable Ouniv, presenta, en resumen, la ausencia de autocorrelacin espacial a distacias relativamente cortas y excesivamente largas debido posiblemente a la presencia de valores bajos o nulos situados unos cerca de los otros. Sin embargo se presume autocorrelacin
espacial dbil para distancias relativamente intermedias. El anslisis de la variabilidad de la
riz cuadrada de las diferncias muestra, en la supuesta presencia de autocorrelacin espacial, la presencia de un posible fenmeno anisotrpico.
I Moran Obs.
-0.22638640
-0.086392806
-0.071568890
-0.044307417
0.045069920
-0.030284138
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
37
Valor p
0.9378
0.7108
0.6832
0.567
0.5809
0.4737
8
6
4
2
Coord Y
2
4
Y Coord
La Figura 2.22 presenta claramente, grfico superior izquierdo, lo planteado anteriormente. Obsrvese como los valores encontrados para las distintas perforaciones difieren
considerablemente de sus repectivos vecinos; colores rojos rodeados de verde, amarillos
de azules, apoyando la presencia de un proceso netamente aleatorio. Ahora, este resultado
termina siendo incierto desde el punto de vista de la interpretacin ecolgica. Es posible
que la presencia de una especie en una cuenca como la de Panam sea un fenmeno netamente aleatorio? las cantidades de individuos encontrados en las perforaciones no pesan
lo suficiente para determinar las interrelaciones ecolgicas? qe implicaciones ecolgicas
conlleva un proceso aleatorio?
94
92
90
88
86
84
82
10
15
20
25
30
data
6
0
Frequency
15
10
data
20
25
30
X Coord
94
92
90
88
86
Coord X
84
82
10
15
20
25
30
data
Figura 2.22: Grficos para Gglut. Los colores rojo,amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.
Las grficas superior derecha e inferior izquierda muestran la amplia variabilidad en los
valores de los datos tanto en la direccin N-S como en E-O. El histograma reafirma este
resultado, donde los datos entre 0 y 10 presentan una frecuencia alta, seguida de cerca por
el rango entre 10 y 15 datos.
La Figura 2.23 presenta la magnitud de la cantidad de individuos encontrados en cada
38
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.23: Tamaos proporcionales al rango de la variable Gglut. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
El grfico en 3D, Figura 2.24, presenta lo concludo de manera diferente. All se aprecia
la alternancia, digamos aleatoria, en el valor de la variable.
Por ltimo, se har un anlisis de la manera cmo vara la raz cuadrada de la diferencia
a medida que se aumentan los lag. La Figura 2.25 presenta esta informacin.
En esta figura se observa, cmo para la direccin N-S el valor de la raz cuadrada y
su variabilidad permanecen practicamente constante hasta el lag 4 apartir del cual aumentan para empezar a disminuir. De manera diferente es el comportamiento para ese mismo
intervalo de lags en las otras direcciones. En la direccin NE-SO y E-O se presentan fluctuaciones en el valor de la raz, sin embargo la variabilidad parece ser similar.
En conclusin, la variable Gglut se presenta como un fenmeno con ausencia de autocorrelacin espacial, es decir un fenmeno puramente aleatorio. Llama la atencin el ser
la nica variable hasta ahora analizada en la que ni la presencia dbil de autocorrelacin
aparece. Ello tiene implicaciones en el sentido de la aplicacin de la teora geoestadstica
donde la autocorrelain desempea un papel crucial.
39
15
Gglut
8
6
10
Latitud
20
25
30
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.24: Grfico en 3D de la variable Gglut. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
90 22.5, NS
0 1 2 3 4 5
lag
lag
0 1 2 3 4 5
1
0 1 2 3 4 5
5
4
3
2
1
1
45 22.5, NESO
0 22.5, EO
lag
lag
Figura 2.25: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gglut.
40
es aleatorio.
k
3
5
7
10
12
16
I Moran Obs.
0.20527304
0.064992620
0.023599318
0.013630753
0.012179659
-0.006077670
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.02876
0.1516
0.2389
0.2351
0.2143
0.2775
8
6
4
2
Coord Y
2
4
Y Coord
Los grficos superior derecho e inferior izquierdo hacen un recorrido en sentido N-S y
E-O para el valor tomado en cada perforacin. Vase la gran cantidad de perforaciones sin
valor en estas direcciones y los altos valores para las latitudes al sur y longitudes al oriente,
cerca a Ecuador. El histograma resume esto indicando que la frecuencia mayor se da para
datos entre 0 y 10.
94
92
90
88
86
84
82
10
20
40
50
60
30
25
50
15
0
10
Frequency
20
40
30
10
20
data
30
data
60
X Coord
94
92
90
88
86
Coord X
84
82
10
20
30
40
50
60
data
Figura 2.26: Grficos para Ginfl. Los colores verde y azul indican la magnitud decreciente en el
nmero de individuos encontrados en las perforaciones.
La Figura 2.27 muestra estas relaciones espaciales segn la magnitud en cada perforacin, relativa al rango total. En este grfico se observan, aunque no de manera clara, la
41
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.27: Tamaos proporcionales al rango de la variable Ginfl. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
42
30
Ginfl
8
6
20
Latitud
40
50
60
Diagrama de dispersin en 3D
Rotado 120
10
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.28: Grfico en 3D de la variable Ginfl. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
6
4
0
lag
lag
90 22.5, NS
6
4
2
0
6
4
2
0
45 22.5, NESO
0 22.5, EO
4
lag
4
lag
Figura 2.29: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Ginfl.
43
En esta se concluye, a un = 0,05 y para cada uno de los k, que no existen pruebas suficientes para aceptar Ho. En otras palabras, se sospecha de la presencia de autocorrelacin
parcial. Es decir, la cantidad de individuos encontrada en un una perforacion cualesquiera
depende de las cantidades encontradas en otras perforaciones y posiblemente dependa de la
distancia que los separa.
k
3
5
7
10
12
16
I Moran Obs.
0.66665377
0.565077995
0.548643668
0.418951834
0.368470998
0.250830183
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
1.258e-08
1.836e-10
2.010e-13
1.773e-12
1.378e-12
3.745e-10
8
6
4
2
Coord Y
2
4
Y Coord
La Figura 2.30, margen superior izquierda, muestra claramente la agregacin de valores similares; cruces rojas rodeadas de rojas, verdes de verdes y azules de azules. Esto es
la manifestacn de una alta autocorrelacin espacial y permite realizar de manera adecuada
una prediccin espacial tratada en el prximo captulo.
94
92
90
88
86
84
82
20
40
80
100
12
8
0
20
Frequency
10
80
60
40
data
60
data
100
X Coord
94
92
90
88
86
Coord X
84
82
20
40
60
80
100
120
data
Figura 2.30: Grficos para Gcultr. Los colores rojo, amarillo, verde y azul indican la magnitud
decreciente en el nmero de individuos encontrados en las perforaciones.
44
2
4
Coordenada Y
la direccin N-S. Obsrvese la presencia de dos grupos de datos. El primero entre las latitudes -4o y 2o aproximadamente cuyos valores estn entre 0 y 40 individuos y el segundo grupo ms al Norte con valores entre 40 y 100 aproximadamente. El grfico inferior
izquierdo muestra un grupo entre las longitudes -82o y 84o aproximadamente cuyos valores
estn, igualmente, entre 0 y 40 individuos y otro grupo entre las longitudes -86o y -92o
aproximadamente con valores entre 40 y 100. De manera general para ambas direcciones
se observa la presencia de tendencias en los datos. Cuando nos desplazamos hacia el Norte,
los datos tienden a aumentar, mientras que si nos acercamos a la costa en sentido E-O, los
datos tienden a disminuir. El histograma de frecuencias muestra cmo una gran cantidas de
perforaciones, 12, reportan individuos que estn entre 0 y 20 seguidos por aquellos entre 40
y 60.
94
92
90
88
86
84
82
Coordenada X
Figura 2.31: Tamaos proporcionales al rango de la variable Gcultr. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
La Figura 2.31 presenta el tamao del crculo de acuerdo al valor relativo al rango
encontrado en cada perforacin. Obsrvese la manera en que las perforaciones con mayor
conteo de individuos se encuentra localizada al Noroeste del rea de estudio y los valores
menores al Sureste. Importante recalcar que las dos perforaciones ms al sur del rea presentan valores de cero, es decir no reportaron esta especie all.
La Figura 2.32 muestra de manera mucho ms clara la manera como se agregan valores
intermedios y bajos al Sureste del rea y los valores ms altos en la zona Noroccidental del
rea de estudio. Se aprecia tambin la manera como en la parte central de la cuenca los
valores son bajos, mucho ms que los presentados al Norte del rea.
Un anlisis de la raz cuadrada de las diferencias, [Z(si + h) - Z(si )]1/2 , y un nmero
de lags, se presenta en la Figura 2.33. Se observa de manera general y para todas las direcciones, la manera en que el valor de esta raz aumenta a medida que aumenta el nmero de
45
60
Gcultr
8
6
40
Latitud
80
100
120
Diagrama de dispersin en 3D
Rotado 120
20
2
0
2
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.32: Grfico en 3D de la variable Gcultr. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
lags, es decir, a medida que aumenta la distancia que separa una perforacion determinado de
los otros. De manera especial obsvese la manera como cambia este valor para la direccin
NE-SO es igualmente cierta constancia en la variabiliadad de estas diferencias para cada
lag. Este comportamiento en el valor de la raz cuadrada es propio de datos con autocorrelacin espacial.
45 22.5, NESO
8
6
4
0
lag
lag
90 22.5, NS
8
6
4
2
10
10
8
6
4
2
0
10
10
0 22.5, EO
4
lag
4
lag
Figura 2.33: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gcultr.
46
k
3
5
7
10
12
16
I Moran Obs.
-0.004991728
-0.047458497
-0.037731351
-0.079946089
-0.083811113
-0.056419006
E[I]
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.015780690
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.4108
0.5588
0.5219
0.7632
0.81
0.6915
Coord Y
47
2
4
Y Coord
94
92
90
88
86
84
82
10
15
20
data
20
15
Frequency
10
10
data
15
25
20
X Coord
94
92
90
88
86
84
82
10
Coord X
15
20
25
data
2
4
Coordenada Y
Figura 2.34: Grficos para Gtumi. Los colores amarillo verde y azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.
94
92
90
88
86
84
82
Coordenada X
Figura 2.35: Tamaos proporcionales al rango de la variable Gtumi. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
48
15
6
4
Gtumi
10
Latitud
20
25
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.36: Grfico en 3D de la variable Gtumi. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
4
3
2
1
90 22.5, NS
lag
3
2
1
0
4
3
2
1
lag
lag
0
1
4
3
2
1
1
45 22.5, NESO
0 22.5, EO
lag
Figura 2.37: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gtumi.
2.10.
49
Nduter es la variable que posee el mayor nmero de individuos encontrados en el conteo, de cada especie estudiada, en cada perforacin. Ella est representada por un total de
5340 individuos distribudos entre todas las perforaciones (Tabla 1.1).
La Tabla 2.11 presenta los resultados de la prueba de Moran para autocorrelacin espacial.
k
3
5
7
10
12
16
I Moran Obs.
0.43811496
0.370791845
0.421641398
0.298969278
0.251079526
0.273525037
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
8.739e-05
1.155e-05
7.071e-09
1.616e-07
3.758e-07
1.496e-11
8
6
4
2
Coord Y
2
4
94
92
90
88
86
84
82
50
100
150
200
250
data
4
0
50
100
150
Frequency
200
250
X Coord
data
50
2
4
Y Coord
94
92
90
88
86
84
82
50
100
Coord X
150
200
250
300
data
2
4
Coordenada Y
Figura 2.38: Grficos para Nduter. Los colores rojo, amarillo, verde y azul indican la magnitud
decreciente en el nmero de individuos encontrados en las perforaciones.
94
92
90
88
86
84
82
Coordenada X
Figura 2.39: Tamaos proporcionales al rango de la variable Nduter. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
aparecen dos perforaciones con valores altos, y una disminucin de estos valores hacia el
Noroeste.
La manera como se comporta la raz cuadrada de las diferencias a medida que se aumentan los lag se presenta en la Figura 2.41. En terminos generales parece existir un comportamiento, del valor de la raz y de su variablidad, muy similar en las cuatro direcciones
lo que podra indicar la presencia de un proceso isotrpico. Sin embargo la direccin N-S
51
150
Nduter
8
6
100
Latitud
200
250
300
Diagrama de dispersin en 3D
Rotado 120
50
2
0
2
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.40: Grfico en 3D de la variable Nduter. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
12
90 22.5, NS
lag
10
6
2
15
10
5
14
lag
lag
0
1
2 4 6 8
14
10
6
1
45 22.5, NESO
0 22.5, EO
lag
Figura 2.41: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Nduter.
Para concluir de manera preliminar, se podra decir que la variable Nduter presenta una
buena autocorrelacin espacial, y se sospecha de la presencia de un fenmeno anisotrpico.
Sin embargo llama la atencin el comportamiento de esta variable en la direccin N-S, que
52
k
3
5
7
10
12
16
I Moran Obs.
0.12580113
0.058895187
0.020439033
-0.012753644
-0.033759689
-0.038350843
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.1026
0.1670
0.2513
0.3758
0.503
0.5433
Coord Y
53
2
4
94
92
90
88
86
84
82
20
40
60
80
100
data
20
40
data
Frequency
60
80
15
100
X Coord
10
Y Coord
94
92
90
88
86
84
82
20
40
Coord X
60
80
100
data
Figura 2.42: Grficos para Npach. Los colores rojo, amarillo, verde y azul indican la magnitud
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.43: Tamaos proporcionales al rango de la variable Npach. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
54
60
6
4
Npach
8
40
Latitud
80
100
Diagrama de dispersin en 3D
Rotado 120
20
2
0
2
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.44: Grfico en 3D de la variable Npach. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
8 10
6
4
2
90 22.5, NS
lag
6
4
2
8
6
4
2
lag
lag
0
1
8
6
4
2
1
45 22.5, NESO
0 22.5, EO
lag
Figura 2.45: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Npach.
55
k
3
5
7
10
12
16
I Moran Obs.
0.06817516
0.050900703
0.106781948
0.038202988
0.040742165
0.053039873
E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213
Valor p
0.2095
0.1888
0.04035
0.1357
0.09877
0.03067
Coord Y
56
2
4
Y Coord
94
92
90
88
86
84
82
10
12
14
data
8
6
0
data
Frequency
10
10
12
12
14
14
X Coord
94
92
90
88
86
84
82
Coord X
10
12
14
data
Figura 2.46: Grficos para Pobliq. Los colores rojo, amarillo, verde y azul indican la magnitud
2
4
Coordenada Y
94
92
90
88
86
84
82
Coordenada X
Figura 2.47: Tamaos proporcionales al rango de la variable Pobliq. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.
rodeados de valores demasiado pequeos o nulos. Al Noroccidente se observa la presencia de valores fluctuando entre valores intermedios y algunos bajos. La manifestacin de
la ausencia de autocorrelacin espacial para k pequeos es debido posiblemente a las relaciones de sus vecinos ms prximos, como se concluye de la analizado inmediatamente
anterior. Sin embargo, los valores intermedios que estn a distancias intermedias y grandes
si pueden tener cierta autocorrelacin como se observa de esta grfica y como lo sugiere la
prueba del I de Morn.
57
8
6
8
6
4
Latitud
Pobliq
10
12
14
Diagrama de dispersin en 3D
Rotado 120
2
0
2
0
4
94
92
90
88
86
84
82
80
Longitud
Figura 2.48: Grfico en 3D de la variable Pobliq. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.
La Figura 2.49 muestra la manera como la raz cuadrada de las diferencias cambia para
cada una de las cuatro direcciones en la medida que se vara el lag. De manera general para
las cuatro direcciones, se observa la no constancia del cambio en el valor de la raz cuadrada de las diferencias a medida que se cambia de lag. De igual manera es la expresin de
la variabilidad de las mismas. Esta parece aumentar o disminur de forma aparentemente
aleatoria. Es posible que ante la presencia de una posible autocorrelacin espacial, como se
dedujo de la prueba del I de Morn, exista un proceso de carcter anisotrpico.
Y para concluir con el anlisis exploratorio de esta variable, se podra resumir como una
variable con presencia de autocorrelacin espacial dbil para k=7 y 16 y ausencia la misma
para las k restantes. Para los primeros se podra presentar procesos anisotrpicos dado el
comportamiento del valor y la variabilidad de la raz cuadrada de las diferencias.
3
2
1
90 22.5, NS
lag
2
1
0
3
2
1
lag
lag
0
1
3
2
1
1
45 22.5, NESO
0 22.5, EO
58
lag
Figura 2.49: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Pobliq.
Las variables Gcultr, Globorotalia cultrata y Nduter, Neogloboquadrina dutertrei, presentaron una fuerte autocorrelacin espacial para cada uno de los k. La primera con
un considerable nmero menor de individuos present una ms fuerte autocorrelacin
como lo indican los mayores valores observados para I sobre Nduter. Gcultr muestra
un aumento en el valor de los conteos desde el Sureste hacia el Noroccidente, mientras que Nduter presenta exactamente lo contrario. Tienen que ver acaso las diferentes
condiciones ambientales de la Cuenca de Panam en esta distribuccin?. La presencia
de una especie inhibe a la otra? cul ha sido el verdadero papel de la lnea de disolucin
para estas especies? son preguntas que se plantean ante estos resultados.
Martnez y Bedoya (2001) menconan la existencia de dos sistemas de surgencia, es decir desplazamientos ascendentes de las aguas marinas con alta productividad biolgica,
asociado cada uno a cadenas trficas diferentes. Las cadenas trficas diferentes implican que cada sitio de surgencia posee unas caractersticas ecolgicas particulares donde
las condiciones ambientales favorecen a unos seres mientras que a otros no. Ello podra
constiturse en la explicacin del comportamiento de cada una de estas especies.
II
III
59
Las variables Gbull, Globigerina bulloides, Ouniv, Orbulina universa, Gsipho, Globigerina siphonifera, Gruber, Globigerinoides ruber, Gsac, Globigerinoides sacculifer
y Pobliq Pulleniatina obliquiloculata presentan una dbil autocorrelacin espacial dado sus bajos valores en el I observado de Moran. Las dos primeras especies tienen sus
mayores valores hacia el Sureste mientras el resto los presentan hacia el Noroccidente.
Se agrega que algunas de estas especies no presenta autocorrelacin para todos los k.
Es el caso de Gsipho, Gsac, Ouniv y Pobliq.
Las variables Gglut, Globigerinita glutinata, Ginfl, Globorotalia inflata, Gtumi, Globorotalia tumida y Npach, Neogloboquadrina pachyderma son especies que no reportaron
autocorrelacin espacial, es decir, el hecho de encontrar un valor u otro en una perforacin dada no est determinado por el valor encontrado en otro; el proceso en este
caso sera completamente aleatorio. Ahora, cul es el significado ambiental de una variable aleatoria? son especies que se adaptan a distintas condiciones ecolgicas? o estn
tan restrigidas que el valor total del conteo se concentra en unas pocas perforaciones?
20
20
40
50
250
8
80
60
Gbull
60
Gsipho
20
Gruber
Gsac
20
Ouniv
0 60
Gglut
40
Gcultr
15
Ginfl
250
Gtumi
100
50
Nduter
20
Npach
Pobliq
80
60
0 60
15
20
100
Figura 2.50: Matriz de dispersin para el nmero de individuos contados de cada especie en las
distintas perforaciones.
A manera de conclusin, groso modo, de la Figura 2.50 se observa que Gcultr y Gglut
presentan en su mayora correlaciones directas. Ginfl, Gtumi y Pobliq no presentan correlaciones con ninguna de las otras especies y Nduter y Npach frecuentemente presentan
relaciones inversas.
Captulo 3
(3.1)
y significa que la distribucin espacial no vara, es invariante, bajo el cambio de coordenadas mediante un vector h. Es decir, la distribucin no cambia cuando paso de un lugar a
otro dentro del campo aleatorio en la direccin y magnitud de un vector distancia h. Si las
coordenadas se rotan o se reproyectan la distribucin espacial permanece igual (Schabenberger y Pierce, 2002).
Los dos restantes tipos de estacionaridad son definidos a partir de los momentos de Z(s).
La estacionaridad de segundo orden se da si el campo aleatorio cumple con la condicin
de que E[Z(s)] = y Cov[Z(s), Z(s+h) = C (h). Ella significa que el valor esperado de
Z(s) no depende del punto dentro del campo aleatorio donde se encuentre la variable aleatoria y la covarianza entre dos observaciones cualesquiera slo depende de la distancia, h, que
las separa (Schabenberger y Pierce, 2002)
61
62
1
Var[Z(s) Z(s+h)] = (h)
2
(3.2)
Suponer que
Var(Z(s1 ) Z(s2 )) = 2(s1 s2 ),
(3.3)
para todo s1 , s2 D.
La cantidad 2(), la cual es funcin solamente del incremento s1 s2 ha sido llamada
variograma y la cantidad 2() llamada semivariograma. Si esta funcin existe debe ser
tratada como un parmetro del proceso aleatorio Z() (Cressie, 1991).
El-Sheimy(1999), modificado para compatibilizar la nomenclatura, define la semivarinza para puntos que se encuentran igualmente, o regularmente, espaciados como:
N(h)
1 X
(h) =
(Zs Zs+h )2
2N(h)
i=1
(3.4)
63
Donde:
zs es la medicin de la variable obtenida en la localizacin s
zs+h es otra medicin de la variable pero obtenida a una distancia h de s
N (h) es el nmero de puntos encontrados a un lag o distancia h.
Si el muestreo no ha sido regular, como es nuestro caso, es decir sin un espaciamiento
sistemtico en el mismo, es posible que el variograma cambie para cada direccin . De esta
manera surgen los variogramas direccionales que define la variacin entre puntos separados
por un espacio lag h. Estos difieren de los semivariogramas omnidireccioneles en que ya h
no es un escalar sino un vector (El-Sheimy, 1999).
Adicional a lo anterior para datos espaciados irregularmente, se tiene un nmero de
pares en cada lag que pueda ser pequeo, en donde en el caso ms extremo cada lag tiene
slo un par de puntos. Para resolver este problema se combinan lags en clases de lag. Una
clase de lag, contiene, como se mencion en el captulo anterior todos los puntos a una
distancia ||h|| ||h|| de s o lo que es lo mismo i, y si la anisotropa es analizada, se debe
tener en cuenta el ngulo de clase (Schabenberger, 2000).
La semivarianza en palabras equivale a decir que es el promedio de las diferencias
cuadradas entre todos los pares de puntos que se encuentren separados a una distanacia
h y en una direccin particular dado el caso de anisotropa. Sin embargo, El-Sheimy (1999),
redefine sta en otros trminos un poco diferentes a los vistos.
Modificada ligeramente la nomenclatura por el autor de esta monografa para evitar
confusiones, El-Sheimy redefine la semivarianza como:
(h) =
N(h)
1
2N(h)
(Zs Zs+h )
i=1
(Zs Zs+h
N(h)
(3.5)
Si Z(s) es estacionaria de segundo orden, la media sera invariante con la posicin y por tal
el segundo trmino del lado izquierdo de la ecuacin 3.5 tendra la siguiente propiedad:
Zs
Zsh
=0
N(h) N(h)
(3.6)
Este mismo autor sugiere que si la media cambia con la distancia, es decir, que el proceso
no es estacionario, la ecuacin 3.6 no sera igual a cero y por lo tanto la ecuacin 3.5 debera
ser modificada.
La Figura 3.1 muestra las partes en las que est compuesto un semivariograma clsico
idealizado.
Cuando se aplica la ecuacin 3.4 a los datos se obtiene el denominado semivariograma
experimental que es el resultado de unir cada punto mediante una lnea curva. Cada punto
representa realmente el nmero de pares de puntos que se encuentran a una distancia h. El
lag, o distancia de separacin entre localizaciones muestrales, h, se da sobre el eje x. La
semivarianza, (h), en cada lag se localiza en el eje y. La Figura 3.1, muestra como en
64
4
bc
3
2
Rango
(h)
bc
Dependencia
Espacial
bc
Sill
1o bc
Varianza Nugget
0
0
Lag(h)
Figura 3.1: Partes del Semivariograma: En el eje y est la Semivarianza, en el eje x los diferentes
lags incrementados una distancia h, el Sill o meseta, el Rango, la Varianza Nugget o efecto pepita, y
la regin donde se da la dependencia espacial. Los crculos seala el valor de la semivarianza para
un nmero determinado de pares de nmeros separados una distancia h.
cierto sector de ella la semivarianza se incrementa mientras cada lag aumenta hasta llegado
un punto en el cual se estabiliza.
El sector en el cual se da una dependencia espacial, es tambin llamado la parte estructural del semivariograma. Cuando se logra estabilidad en la semivarianza se llega al punto
mximo de la misma. Esta cantidad es llamada el Sill o Meseta y el Rango se define como
la distancia a la cual se alcanza el Sill, es decir, la distancia despus de la cual el nmero de
pares de puntos en cada lag no presentan dependencia espacial.
Las observaciones que estn separadas a una distancia mayor que el Rango no estn correlacionadas. La autocorrelacin espacial existe solamente para pares de puntos separados
una distancia menor que el Rango (Schabenberger y Pierce, 2002). De ah la importancia de
este valor, ya que como veremos adelante la interpolacin Kriging se basa en esta distancia
para ponderar cada observacin y predecir en un sitio no muestreado.
De la Figura 3.1 se observa que el intercepto en el eje y del semivariograma a una distancia ||h|| = 0 no es (h) = 0, es decir, (h) o 6= 0 cuando ||h|| 0 (Schabenberger
y Pierce, 2002). Estos autores se plantean la pregunta del cmo se puede tener una varianza
positiva de las diferencias de las observaciones localizadas en el mismo lugar?. La respuesta a esta pregunta se responde de dos maneras. La primera, que ello es debido a que una
medida en un mismo punto no puede ser realizada sin error e2 y la segunda, la ms fuerte,
que existe un proceso espacial (s) operando a distancias ms cortas que el lag ms pequeo
observado y que este proceso que se da a una escala ms pequea que la estudiada tiene un
Sill 2 . Es decir, si las mediciones en el error y el proceso a microescala son independientes,
entonces:
o = e2 + 2
65
Modelo Nugget: Este modelo corresponde al semivariograma de un proceso ruido blanco, donde los Z(si ) tienen la misma media y varianza y sin correlacin entre ellos. Su
expresin matemtica es (Schabenberger y Pierce, 2002):
(h; s ) =
II
0, si h = 0
s , si h 6= 0
(3.7)
Peridico
66
Clsico
Aleatorio
(h)
Multifrecuencia
Lag(h)
IV
Modelo Esfrico: Este modelo es uno de los ms usados en estadstica espacial para
campos aleatorios estacionarios de segundo orden. Tiene dos caractersticas importante;
la primera es el comportamiento lineal cerca al origen y que a una distancia encuentra
el Sill y permanece paralelo a l. Su expresin matemtica es (Schabenberger y Pierce,
2002):
0,
si ||h|| = 0
3
||h||
||h||
(h; ) = o + s 23 12
, si 0 < ||h||
+ ,
si ||h|| >
o
s
(3.9)
si h = 0
0,
3||h||
(h; ) =
(3.10)
o + s 1 e
, si h 6= 0
Modelo Gaussiano: Este modelo presenta un comportamiento cuadrtico cerca al origen y muestra correlaciones en Rangos pequeos. Su funcin matemtica es la siguiente
(Schabenberger y Pierce, 2002):
(h; ) =
VI
0,
o + s
67
si h = 0
(
1e
||h|| 2
3
, si h 6= 0
(3.11)
(h; ) =
0,
n
o si h = 0
||h||
o + s 1 sin /||h||
si h 6= 0
(3.12)
Dentro de una amplia gama de modelos para ajustar variogramas, los anteriores son los
ms usuales. En general lo que se busca es ajustar al semivariograma emprico el mejor
modelo de entre los posibles a aplicar. Ellos buscan estimar el Rango y Sill para determinar de manera inicial, cul es la distancia a la cual los datos presentan correlacin
espacial y dar el paso siguiente; la prediccin.
Z(so ) =
m
X
wi Z(si ) +
i=1
m
X
wi
i=1
68
(3.13)
Donde:
Z(so ) corresponde a la observacin a ser estimada, localizada en so .
Z(si ) es el valor, conocido, de una observacin en si .
wi indica el peso asignado a cada observacin.
es la media poblacional comnmente desconocida.
La varianza de la estimacin realizada por este estimador es:
2 = 2
m
X
wi (Z(si ), Z(so ))
m
m X
X
(3.14)
i=1 i=1
i=1
(3.15)
j=1
69
10
0
distance
Semivariogramas Gruber
Semivariogramas Gsac
150
100
semivariance
400
0
0
45
90
135
200
0
45
90
135
800
distance
50
1200
semivariance
0
45
90
135
semivariance
600
1000
0
45
90
135
0 200
semivariance
15
Semivariogramas Gbull
distance
distance
Figura 3.3: Semivariogramas direccionales Gbull, Gsipho, Gruber y Gsac. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.
En esta figura se muestra como se pueden representar diferentes semivariogramas de acuerdo a la direccin que se requiera analizar. El anlisis en las cuatro direciones se hizo sobre
la base del anlisis exploratorio que se hizo en el captulo anterior, en donde la gran mayora
de las variables mostraba un comportamiento diferente en la diferencia de la raz cuadrada
para los diferentes lags y las distintas direcciones.
Las especies Gbull, Gsipho, Gruber y Gsac muestran de manera general cambios fuertes en
los valores de la semivarianza para cada una de las direcciones. Gbull presenta una semivarianza bastante alta para distancias pequeas en las direcciones de 135o y 90o y altas para
direcciones de 45o y 0o . Lo esperado, lo ideal, es el aumento constante de la semivarianza
a medida que aumenta la distancia, sin embargo, ac tenemos un caso particular donde la
semivarianza flucta entre altos y bajos para cada direccin a medida que aumenta la distancia. La direccin 0o , N-S, tiene un comportamiento un poco diferente; semivariaza alta para
distancias cortas y disminucin considerable de la misma despus de distancias mayores de
5o . En esta direccin es donde se presenta menor variabilidad. Esto podra indicar que la
presencia de esta especie en la Cuenca de Panam, est determinada por posibles cambios
zonales en las condiciones ambientales de la misma que se repiten. El Sill no logra estabilizarse lo que tambin puede ser debido al posible bajo nmero de pares que se encuentran
a cada lag.
La variable Gsipho muestra una direccin, 0o , donde la semivarianza en trminos generales
aumenta a medida que aumenta la distancia. Ser esto un indicador de que las condiciones
ambientales de la cuenca cambian de tal manera que determinan la existencia de la especie
de manera ms continua que en las otras direcciones, para las cuales las fluctuaciones son
70
80
60
40
semivariance
distance
Semivariogramas Gcultr
Semivariogramas Ginfl
500
distance
300
0
45
90
135
500
1500
semivariance
0
45
90
135
100
2500
semivariance
0
45
90
135
20
10
15
20
25
0
45
90
135
semivariance
Semivariogramas Gglut
120
Semivariogramas Ouniv
4
distance
distance
Figura 3.4: Semivariogramas direccionales Ouniv, Gglut, Gcultr y Ginfl. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.
71
Semivariogramas Nduter
6000
2000
semivariance
distance
distance
Semivariogramas Npach
Semivariogramas Pobliq
25
2500
15
10
semivariance
20
0
45
90
135
500
1500
0
45
90
135
semivariance
0
45
90
135
50
100
0
45
90
135
semivariance
150
Semivariogramas Gtumi
4
distance
distance
Figura 3.5: Semivariogramas direccionales Gtumi, Nduter, Npach y Pobliq. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.
Nos enfrentamos nuevamente ac a dos tipos de semivariogramas. Aquellos correspondientes a especies cuyo nmero de individuos no conllev a alguna autocorrelacin espacial.
Ellas son Npach y Gtumi, las cuales a su vez muestran similitud en sus variogramas. Pobliq
tiene un comportamiento un poco menos catico que estas dos especies. Prueba adicional
de ello es la dbil autocorrelacin espacial que presenta esta variable. Se reconfirma la
presencia de procesos anisotrpicos al haber tan poca compatibilidad en sus diferentes variogramas.
Nduter, como Gcultr, es un caso especial donde las caractersticas del semivariograma dan
la posibilidad inmediata de aplicar la teora geoestadstica. Obsrvese como, analizando
72
Variocloud Nduter
20000
15000
classical variogram
5000
10000
3000
2000
1000
classical variogram
4000
25000
5000
30000
Variocloud Gcultr
73
11
distance
11
distance
Figura 3.6: Variocloud Gcultr y Nduter. Obsrvese el rpido ascenso de la mediana para Gcultr.
5000
6000
22
4000
41
55
3000
46
42
40
2000
Semivarianza
26
39
40
28 pares
1000
24
10
Distancia
Figura 3.7: Variograma omnidireccional Nduter. Los nmeros indican el nmero de pares de puntos
que se encontr a la distancia indicada.
Este varigrama se ajust a los modelos Gaussiano, Esfrico, Exponencial y Lineal mencionados anteriormente. La Figura 3.8 muestra el semivariograma experimental ajustado a
los modelos descritos. En el Apndice A, se presenta el cdigo en R utilizado para obtenerlos. Diferentes valores iniciales se experimentaron hasta lograr encontrar el modelo que se
ajustara mejor. A diferncia del modelo Gaussiano, los otros modelos no lograron alcanzar
un Sill y un Rango razonable.
74
4000
3000
2000
Semivarianza
5000
6000
1000
M. Gaussiano
M. Esfrico
M. Exponencial
M. Lineal
10
Distancia
Figura 3.8: Modelos de ajuste al semivariograma emprico. Obsrvese que el modelo que mejor se
ajusta es el Gaussiano.
La Tabla 3.1 presenta los resultados de los parmetros encontrados con cada modelo.
Esta muestra como, a diferencia del modelo Gaussiano, los otros modelos presentan un
Sill, un Rango y una Varianza Nugget muy por encima de las condiciones reales. Por tal,
los parmetros estimados tienen los siguientes valores: V arianzaN ugget = 1525,8048,
Sill = 2778,5519 y Rango = 4,8271. Ac el Sill se encuentra por debajo de la varianza
muestral que es 3503.131.
El Rango se interpreta como el distancia a partir de la cual ya no existe autocorrelacin
espacial. De acuerdo a ello nuestro Rango, de aproximadamente 5o , implica que las cantidades de especies encontradas que estn a una distancia mayor de ella, en kilmetros, 550
aproximadamente, no presentan relacin espacial alguna.
Perfilndonos para el final, y despus de todo este recorrido, se llega a la prediccin mediante Kriging. El Apndice A presenta el programa en R utilizado para este fin.
De los diferentes tipos de Kriging, se plic el Kriging Ordinario el cual no requiere del
conocimiento de la media y es aplicable para datos geoestadsticos. Matricialmente se puede
expresar de la siguiente manera (Clark y Harper, 2000 modificado):
(Z(s1 ), Z(s1 ))
(Z(s2 ), Z(s1 ))
A=
. . . . . . . . . . .
(Z(sm ), Z(s1 ))
1
(Z(s1 ), Z(s2 ))
(Z(s2 ), Z(s2 ))
. . . . . . . . . . . . . .
(Z(sm ), Z(s3 ))
1
1
B = w1 w2 w m
(Z(s1 ), Z(sm ))
(Z(s2 ), Z(sm ))
. . . . . . . . . . .
(Z(sm ), Z(sm ))
1
(3.17)
(3.18)
75
(Z(s1 ), Z(so ))
(Z(s2 ), Z(so ))
C=
(Z(sm ), Z(so ))
1
(3.19)
76
10
Latitud
95
90
85
80
Longitud
Figura 3.9: Imagen de interpolacin Kriging Ordinario de Nduter. Tonos de grises oscuros y claros
indican un nmero alto o bajo, respectivamente, del nmero de individuos que se espera encontrar
en caso de una perforacin.
De todo este trabajo permanecen inquietudes de tipo estadstico y ecolgico, pero sobre ello
el intento de aplicar una metodologa de trabajo a este tipo de informacin. El recorrido es
largo y se espera corregir las inmensas imperfecciones, en esas dos perspectivas, de este
77
10
Latitud
500 10001500200025003000
95
90
85
80
Longitud
trabajo. La integracin entre los dos puntos de vista, para nuestro caso la ecologa y la estadstica, pero en otros, la geografa y la estadstica u otra combinacin, no puede caer en la
carreta. Es necesario hacer un esfuerzo para poderlo lograr, porque s que pocas personas lo
saben. Es mi deseo lograr descubrir realidades ocultas con herramientas como la estadstica
y la observacin, pero s, reafirmando lo anterior, que puede resultar desalentador y a veces
infructuoso.
Captulo 4
Conclusiones y Recomendaciones
1. Las especies Gcultr y Nduter, fueron las nicas que mostraron una alta autocorrelacin espacial. Es decir, que la cantidad de individuos encontrados en una perforacin, para una especie dada, est en estrecha relacin con la cantidad encontrada
en otras perforaciones.
2. Las especies Gbull, Gshipo, Gruber, Gsac, Ouniv, Ginfl y Pobliq, presentaron autocorrelacin espacial dbil. Poniendo en duda la relacin que pueda existir entre las
cantidades de individuos encontrados en cada perforacin
3. Las especies Gglut, Gtumi y Npach, no mostraron autocorrelacin espacial. En otras
palabras, el hecho de encontrar una determinada cantidad de individuos de una especie en una perforacin es puramente aleatorio, puro efecto pepita.
4. A excepcin de la especie Nduter, todas las otras mostraron procesos anisotrpicos.
Procesos en los cuales la cantidad de individuos de una especie en la zona de estudio,
es diferente segn la direccin de anlisis.
5. Los datos exploratorios indicaron concentraciones de individuos de algunas especies
en la parte Noroccidental o Sureste, con un predominio de la primera. Ejemplo de
ello las variables Gcultr y Nduter que presentaron concentraciones inversas. Es decir, mientras que la primera presentaba grandes cantidades de individuos en la zona
Noroccidental, la segunda los tena en la zona Sureste.
6. Los semivarigramas direccionales son una importante herramienta de anlisis espacial
por cuanto ellos son una radiografa clara de la variabilidad espacial de los datos.
7. El modelo que mejor se ajust al semivariograma de la variable Nduter fu el Gaussiano. El cual estim el Rango en aproximadamente 5o , 550 kilmetros. Ello implica
que esa es la distancia mxima a la cual los datos dependen entre s.
8. Desde la perspectiva de la autocorrelacin es mucho ms importante la manera como
los datos estn distribudos en el espacio que la misma cantidad de datos disponibles.
9. El grado de presencia de una especie en un rea determinada est intimamente relacionada con las condiciones ambientales de la Cuenca de Panam. Por ello, la exploracin de variables ambientales como la temperatura superficial de las aguas marinas,
las direcciones de las corrientes,la salinidad, etc. sera un gran complemento a este
78
79
Bibliografa
Brasier, M.D. Microfossils. Londres: George Allen, 1980. pp.193.
Camacho, H. Invertebrados fsiles. Buenos Aires: Eudeba, 1966. pp.706.
Clark, I. y Harper W. Practical Geostatistics 2000. Columbus: Ecosse, 2000. pp.342.
Cressie, N. Spatial for Data. New York: John Wiley and Sons, 1991, pp.900.
De Castro, R. El Universo LATEX. Segunda Edicin. Bogot: Universidad Nacional de Colombia, 2003. pp. 470.
El-Sheimy, N. Digital Terrein Model. http://www.geomatics.ucalgary.ca/nel-shei/.
Fatela, F. and Taborda, R. Confidence limits of species proportions in microfossil assemblages. Marine Micropalentology 45 (2002), 169-174.
Martnez J. I. y Bedoya G. Recent planktonic foraminifera from deep-sea sediments from
the eastern equatorial Pacific: Proxies of the Ecuatorial Front in the Late Quaternary. Boletn de Investigaciones Marinas. 2001. Vol. 30. pp.151-176.
Palaseanu-Lovejoy M. e-mail: monica.palaseanu-lovejoy@stud.man.ac.uk (Comunicacin
escrita).
Schabenberger O. and Pierce F. Contemporary Statistical Model: for the Plant and Soil Sciences. Boca Raton: CRC Press, 2002, pp.738.
Schabenberger O. Stat 5544 Spatial Statistics. Course of Summer 2000. pp.198
http://stress.swan.ac.uk/ mbarnsle/teaching/envmod/pdf/em-chapter18.pdf. Spatial Dependencia and the semi-vaiogram.
80
Apndice A
Cdigo generado en R usado en la monografa
Para la elaboracin de esta monografa se hizo uso del software R, el cual es de distribucin
gratuita y de un alto rendimiento.
Las libreras, adicionales a las bsicos, cuyas aplicaciones son exclusivas para estadstica
espacial, y que se utilizaron en este trabajo fueron:
spdep: se aplic para hacer pruebas de autocorrelacin espacial a partir del Indice de
Moran.
sgeostat: se aplic en la creacin de objetos puntos y en la posterior construccin de
grficos de lags y de caja.
scatterplot3d: se utiliz para la construccin de grficos en 3D.
geoR: con ella se generaron la mayora de las grficas, se produjeron los semivariogramas, los ajustes y la interpolacin Kriging.
El cdigo desarrollado es el siguiente:
Este cdigo es un resumen del cdigo total utilizado en este trabajo.
Mucha parte de el se repite en la medida que cada especie de
foraminfero ha sido tratada de la misma forma.
Se recomienda, si se va a hacer uso de este cdigo, revisar las
ayudas del R.
Debido a lo extenso de algunos argumentos, el lector debe tener
cuidado donde empieza y donde termina el mismo.
base<-read.table(panamainforme.txt,sep="\t",header=T)
attach(base)
plot(jitter(base$Longitud),jitter(base$Latitud),
xlab=Longitud,ylab=Latitud,
main=Localizacin de las perforaciones,
font.lab=2,col.lab=4,col.main=4,
cex.lab=0.8,cex.main=1.1,col.axis=1,fg=2)
library(spdep)%Prueba de autocorrelacin espacial del I de Moran%
x<-cbind(Longitud,Latitude)
k.vecinos<-knearneigh(x,5)
vecinos.nb<-knn2nb(k.vecinos, row.names = NULL, sym = FALSE)
81
82
plot(vecinos.nb,x, add=TRUE)
vecinos.listaw<-nb2listw(vecinos.nb, glist=NULL,
style="B", zero.policy=FALSE)
library(sgeostat)%para crear objetos puntos y construir Lags Plot%
library(geoR)
base2<-read.table(panamainforme2.txt,sep="\t",header=T)
geobase2<-as.geodata(base2,coords.col=1:2,
data.col=c(3,4,5,6,7,8,9,10,11,12,13,14))
Anlisis exploratorio variable Gbull
(Las otras especies se trataron de igual manera)
pruebas.mora<-moran.test(Gbull, vecinos.listaw, randomisation=TRUE,
zero.policy=TRUE,
alternative="greater", rank = TRUE)
plot(geobase2,coords=geobase2$coords,data=geobase2$data[,1])
s3d <- scatterplot3d(Longitud,Latitud,Gbull, type="h",
highlight.3d=TRUE, scale.y=0.7, pch=16,
main="Diagrama de dispersin en 3D\nRotado 120o ",
cex.main=1,font.axis=2,angle=120)
points.geodata(geobase2,geobase2$coords,geobase2$data[,1],
xlab = "Coordenada X", ylab = "Coordenada Y",font.lab=2,
pt.divide="rank.prop",pch=1)
%Grficos de caja %(Paquete sgeostat)
base2.point<-point(base2,x=Longitud,y=Latitude)
base2a.pair<-pair(base2.point,num.lags=6,
type=anisotropic, theta=0, dtheta=22.5, maxdist=8)
par(mfrow=c(2,2))
spacebox(base2.point,base2a.pair,Gbull,type=r)
%Matriz de dispersin
base3<-base2[,c(3,4,5,6,7,8,9,10,11,12,13,14)]
pairs(base3, font.labels=7,col=1,cex.labels=1)
%SEMIVARIOGRAMAS DIRECCIONALES Y KRIGING
base2<-read.table(panamainforme2.txt,sep="\t",header=T)
gbull<-base2[,c(1,2,3)]
nduter<-base2[,c(1,2,12)]
gbull.geo<-as.geodata(gbull)
duter.geo<-as.geodata(nduter)
bin10 <- variog4(nduter.geo, max.dist=9,bin.cloud=T)
cloud11 <- variog4(npach.geo, option = "cloud", max.dist=9)
bin11 <- variog4(npach.geo, max.dist=9,bin.cloud=T)
cloud12 <- variog4(pobliq.geo, option = "cloud", max.dist=9)
bin12 <- variog4(pobliq.geo, max.dist=9,bin.cloud=T)
par(mfrow=c(2,2))
plot(bin9, main = "classical estimator")
title(main=Semivariogramas Gtumi,cex.main=0.9)
plot(bin10, main = "classical estimator")
title(main=Semivariogramas Nduter, cex.main=0.9)
plot(bin11, main = "classical estimator")
83
84
n2<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "spherical",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n2,col=3)
n3<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "exponential",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n3,col=4)
n4<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "linear",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n4,col=1)
legend(7,1500, c("M. Gaussiano",
"M. Esfrico","M. Exponencial","M. Lineal"),
col=c("red","green","blue","gray"),cex=0.9,lty=c(1,1,1,1))
%KRIGING
coordenadas<-nduter.geo$coords
coordbase1<-coordenadas[,1]
coordbase2<-coordenadas[,2]
coordbase12<-matrix(c(coordbase1,coordbase2),31,2)
coordbase12<-matrix(c(coordbase1,coordbase2),31,2)
pred.grid <- expand.grid(Longitud=seq(-95,-80,1), seq(-5,10,1))
plot(pred.grid)
nduter<-base2[,c(1,2,12)]
nduter.geo<-as.geodata(nduter)
bin10c<- variog(nduter.geo, max.dist=10,bin.cloud=T)
n1<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "gaussian",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
kcOK <- krige.conv(nduter.geo, locations = pred.grid,
krige =krige.control(cov.pars = n1$cov.pars))
image(kcOK, loc = pred.grid, coords = coordbase12,
col=gray(seq(1,0.2,l=30)),xlab=Longitud,ylab=Latitud)
legend.krige(y.leg=c(-5,-4), x.leg=c(-95,-90),
val=kcOK$predict,col=gray(seq(1,0.2,l=30)),cex.leg=0.7)
title(main=Prediccin espacial Nduter,cex.main=0.9)
image(kcOK, loc = pred.grid, coords = coordbase12,
values = kcOK$krige.var,xlab=Longitud,ylab=Latitud)
legend.krige(y.leg=c(-5,-4), x.leg=c(-95,-90),
val=kcOK$krige.var,cex.leg=0.7)
title(main=Varianza de la prediccin, Nduter,cex.main=0.9)