You are on page 1of 85

Aplicacin de la Estadstica Espacial al Anlisis de Datos

Georreferenciados: Distribucin de los foraminferos


planctnicos recientes en la Cuenca de Panam, Pacfico
Colombiano.

Monografa realizada para obtener el ttulo de especialista en


estadstica
Autor: Carlos H. Cuartas Oquendo1
Director: Juan Carlos Correa M., PhD. 2

Universidad Nacional de Colombia, sede Medelln


Posgrado en estadstica
Enero de 2004

1
2

Gelogo Universidad Nacional de Colombia, Medelln. e-mail: chcuartas11@epm.net.co


Profesor Universidad Nacional de Colombia, Medelln. e-mail: jccorrea@unalmed.edu.co

Agradezco mucho a todos mis amigos, ellos saben quienes son,


en especial a Marion Weber. Tambin agradezco a Juan Carlos
Correa, a Jos Ignacio Martnez, a Kenneth Cabrera y a mi familia. Bueno, y no tengo una esposa para decirle que a ella por su
inagotable paciencia y abnegacin.

ndice general
Sntesis

1. La Introduccin
1.1. Los objetivos . . . . . . . . . . . . . . . . . . . . . .
1.2. El rea de estudio y sus caractersticas oceanogrficas
1.3. Y los datos? . . . . . . . . . . . . . . . . . . . . . . .
1.4. Las variables y el planteamiento del problema . . . . .
1.5. La metodologa y su por qu . . . . . . . . . . . . . .
1.5.1. Principios tericos iniciales . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

7
7
7
8
10
11
12

2. Exploracin Grfica de los Datos y el I de Moran


2.1. Variable Globigerina bulloides, Gbull. . . . . . .
2.2. Variable Globigerinella Gsiphonifera, Gsipho. . .
2.3. Variable Globigerinoides ruber, Gruber. . . . . .
2.4. Variable Globigerinoides sacculifer, Gsac. . . . .
2.5. Variable Orbulina universa, Ouniv. . . . . . . . .
2.6. Variable Globigerinita glutinata, Gglut. . . . . . .
2.7. Variable Globorotalia inflata, Ginfl. . . . . . . . .
2.8. Variable Globorotalia cultrata, Gcultr. . . . . . .
2.9. Variable Globorotalia tumida, Gtumi. . . . . . .
2.10. Variable Neogloboquadrina dutertrei, Nduter. . .
2.11. Variable Neogloboquadrina pachyderma, Npach.
2.12. Variable Pulleniatina obliquiloculata, Pobliq. . .
2.13. Conclusiones y dudas preliminares. . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

17
19
23
26
28
33
36
39
42
46
49
52
55
57

3. La Prediccin: El Semivariograma y el Kriging


3.1. La estacionaridad y la isotropa . . . . . . . . . . . . . . . .
3.2. El semivariograma: sus partes y modelos para su estimacin
3.2.1. Generalidades del semivariograma . . . . . . . . . .
3.2.2. Modelos de ajuste . . . . . . . . . . . . . . . . . .
3.3. El Kriging: la prediccin . . . . . . . . . . . . . . . . . . .
3.4. A la prctica: semivariogramas, ajustes e interpolaciones . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

61
61
62
62
65
67
68

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

4. Conclusiones y Recomendaciones

78

Bibliografa

80

Apndice A

81
2

ndice de cuadros
1.1. Base de datos a estudiar . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
2.7.
2.8.
2.9.
2.10.
2.11.
2.12.
2.13.

.
.
.
.
.
.
.
.
.
.
.
.
.

19
20
24
26
29
33
37
40
43
46
49
52
55

3.1. Resultados de los parmetos por ajuste de modelos. . . . . . . . . . . . . . . .

75

Prueba de hiptesis. . . . . . . . . . . . . . . .
Resultados de la prueba de Moran, variable Gbull. .
Resultados de la prueba de Moran, variable Gsipho.
Resultados de la prueba de Moran, variable Gruber.
Resultados de la prueba de Moran, variable Gsac. .
Resultados de la prueba de Moran, variable Ouniv.
Resultados de la prueba de Moran, variable Gglut. .
Resultados de la prueba de Moran, variable Ginfl. .
Resultados de la prueba de Moran, variable Gcultr.
Resultados de la prueba de Moran, variable Gtumi.
Resultados de la prueba de Moran, variable Nduter.
Resultados de la prueba de Moran, variable Npach.
Resultados de la prueba de Moran, variable Pobliq.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.

ndice de figuras
1.1. Localizacin del rea de estudio. . . . . . . . . . . . . . . . . . . . . . . . .
1.2. Lmites de la Cuenca de Panam . . . . . . . . . . . . . . . . . . . . . . . .
1.3. Muestra obtenida de la perforacin del fondo marino. La muestra luego es llevada

8
9

al laboratorio donde se procesa y se monta en placas para el conteo de microfsiles. 10


1.4. Flujograma metodolgico. . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.1. Localizacin muestral. . . . . . . . . . . . . . . . . . . . . . . . .


2.2. Grficos para Gbull . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3. Tamaos proporcionales al rango de la variable Gbull . . . . . . . . .
2.4. Grfico en 3D de la variable Gbull . . . . . . . . . . . . . . . . . .
2.5. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gbull .
2.6. Grficos para Gsipho . . . . . . . . . . . . . . . . . . . . . . . . .
2.7. Tamaos proporcionales al rango de la variable Gsipho . . . . . . . .
2.8. Grfico en 3D de la variable Gsipho . . . . . . . . . . . . . . . . . .
2.9. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gsipho
2.10. Grficos para Gruber . . . . . . . . . . . . . . . . . . . . . . . . .
2.11. Tamaos proporcionales al rango de la variable Gruber . . . . . . . .
2.12. Grfico en 3D de la variable Gruber . . . . . . . . . . . . . . . . .
2.13. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gruber
2.14. Grficos para Gsac . . . . . . . . . . . . . . . . . . . . . . . . . .
2.15. Tamaos proporcionales al rango de la variable Gsac . . . . . . . . .
2.16. Grfico en 3D de la variable Gsac . . . . . . . . . . . . . . . . . . .
2.17. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gsac .
2.18. Grficos para Ouniv . . . . . . . . . . . . . . . . . . . . . . . . .
2.19. Tamaos proporcionales al rango de la variable Ouniv . . . . . . . . .
2.20. Grfico en 3D de la variable Ouniv . . . . . . . . . . . . . . . . . .
2.21. Box plot de la raz cuadrada de las diferencia vs. cada lag para Ouniv .
2.22. Grficos para Gglut . . . . . . . . . . . . . . . . . . . . . . . . . .
2.23. Tamaos proporcionales al rango de la variable Gglut . . . . . . . . .
2.24. Grfico en 3D de la variable Gglut . . . . . . . . . . . . . . . . . .
2.25. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gglut .
2.26. Grficos para Ginfl . . . . . . . . . . . . . . . . . . . . . . . . . .
2.27. Tamaos proporcionales al rango de la variable Ginfl . . . . . . . . .
2.28. Grfico en 3D de la variable Ginfl . . . . . . . . . . . . . . . . . . .
2.29. Box plot de la raz cuadrada de las diferencia vs. cada lag para Ginfl .
2.30. Grficos para Gcultr . . . . . . . . . . . . . . . . . . . . . . . . .
2.31. Tamaos proporcionales al rango de la variable Gcultr . . . . . . . .
2.32. Grfico en 3D de la variable Gcultr . . . . . . . . . . . . . . . . . .
4

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

18
21
22
23
24
25
26
27
28
29
30
30
31
31
32
32
33
34
35
35
36
37
38
39
39
40
41
42
42
43
44
45

NDICE DE FIGURAS

2.33. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gcultr
2.34. Grficos para Gtumi . . . . . . . . . . . . . . . . . . . . . . . .
2.35. Tamaos proporcionales al rango de la variable Gtumi . . . . . . . .
2.36. Grfico en 3D de la variable Gtumi . . . . . . . . . . . . . . . . .
2.37. Box plot de la raz cuadrada de las diferencia vs. cada lag para Gtumi
2.38. Grficos para Nduter . . . . . . . . . . . . . . . . . . . . . . . .
2.39. Tamaos proporcionales al rango de la variable Nduter . . . . . . .
2.40. Grfico en 3D de la variable Nduter . . . . . . . . . . . . . . . . .
2.41. Box plot de la raz cuadrada de las diferencia vs. cada lag para Nduter
2.42. Grficos para Nduter . . . . . . . . . . . . . . . . . . . . . . . .
2.43. Tamaos proporcionales al rango de la variable Npach . . . . . . .
2.44. Grfico en 3D de la variable Npach . . . . . . . . . . . . . . . . .
2.45. Box plot de la raz cuadrada de las diferencia vs. cada lag para Npach
2.46. Grficos para Pobliq . . . . . . . . . . . . . . . . . . . . . . . .
2.47. Tamaos proporcionales al rango de la variable Pobliq . . . . . . .
2.48. Grfico en 3D de la variable Pobliq . . . . . . . . . . . . . . . . .
2.49. Box plot de la raz cuadrada de las diferencia vs. cada lag para Pobliq
2.50. Matriz de dispersin . . . . . . . . . . . . . . . . . . . . . . . .
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.

Partes del Semivariograma . . . . . . . . . . . . . . . . .


Tipos de semivariogramas . . . . . . . . . . . . . . . . . .
Semivariogramas direccionales Gbull, Gsipho, Gruber y Gsac
Semivariogramas direccionales Ouniv, Gglut, Gcultr y Ginfl .
Semivariogramas direccionales Gtumi, Nduter, Npach y Pobliq
Variocloud Gcultr y Nduter . . . . . . . . . . . . . . . . .
Variograma omnidireccional Nduter . . . . . . . . . . . . .
Modelos de ajuste al semivariograma emprico . . . . . . .
Imagen de interpolacin Kriging . . . . . . . . . . . . . .
Imagen de la varianza de la prediccin . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

45
47
47
48
48
50
50
51
51
53
53
54
54
56
56
57
58
60

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

64
66
69
70
71
73
73
74
76
77

Sntesis
Palabras claves: Geoestadstica, Autocorrelacin Espacial, Semivariograma, Sill, Rango, Varianza Nugget, Estacionaridad, Kriging, Foraminfero Planctnico.
El objetivo principal de este trabajo fue el de aplicar la geoestadstica, como herramienta
terica, para analizar la manera como se distribuyen espacialmente doce especies de foraminferos planctnicos encontrados en 31 perforaciones en la Cuenca de Panam, Pacfico
Colombiano. De forma ms precisa, se analiz si la presencia de una cantidad determinada
de individuos de cada una de las especies, encontrada en una perforacin dada, tendra alguna relacin espacial, autocorrelacin espacial, con la cantidad de individuos encontrada
en otras perforaciones.
Para ello se realiz, de manera preliminar, una anlisis exploratorio de cada una de las
variables en toda el rea de estudio, mediante el uso de paquetes dirigidos al anlisis exploratorio de variables georrefernciadas, incorporados al software R.
El anlisis exploratorio y la prueba I de Moran, permitieron determinar aquellas especies
que podran tener autocorrelacin y estacionaridad en media. Conceptos de gran importancia en la aplicacin de la geoestadstica.
La determinacin de tales especies llev a la seleccin de aquella que cumpliera, de
mejor modo, con los dos principios en mencin.
Para la especie elegida, Neogloboquadrina dutertrei, se realiz una serie de anlisis posteriores con el objeto de definir de manera ms clara su distribucin espacial en la Cuenca.
Se calcul su semivariograma, basado en la semivarianza, el cual fue sometido a modelos
de ajuste para encontrar parmetros como el Sill, el Rango y la Varianza Nugget.
Los parmetros inferidos del modelo que mejor se ajustaba al semivariograma, permitieron realizar una interpolacin espacial de los datos mediante el mtodo Kriging.

Captulo 1

La Introduccin
1.1. Los objetivos
El presente trabajo tiene trazado dos tipos objetivos que motivaron su realizacin; uno
general y varios particulares los cuales se presentan a continuacin.

Los generales
Aplicar la geoestadstica,a escala regional, al anlisis de variables que se encuentran
referenciadas geogrficamente.

Los particulares
Estudiar el comportamiento espacial en el mbito regional de las variables involucradas en el rea de estudio.
Aprender una herramienta estadstica de gran aplicacin en las ciencias naturales.
Aplicar esta herramienta a las Ciencias de la Tierra.
Integrar los conocimientos adquiridos durante la especializacin al campo de la geostadstica.
Definir, si existen, relaciones entre las variables de estudio.

1.2. El rea de estudio y sus caractersticas oceanogrficas


El rea de estudio, comprende aproximadamente 2700000Km2 , localizada en el Ocano
Pacfico Oriental, especficamente en la Cuenca de Panam. Se encuentra limitada de Oriente a Occidente por las longitudes -80o Oeste y -92o Oeste, respectivamente y de Sur a Norte
por las latitudes -5o Sur y 9o Norte respectivamente, como se muestra en la Figura 1.1.
La Cuenca de Panam est limitada geomorfolgicamente al Occidente por la Dorsal
de Cocos, al Oriente por la Costa Pacfica Suramericana, al Norte por el Istmo de Panam,
y al Sur por la Dorsal de Carnegie como se observa en la Figura 1.2. Estas caractersticas geomorfolgicas definen ecosistemas particulares dado que las dorsales se levantan
como inmensas cordilleras desde el piso ocenico actando como barreras naturales a la
7

CAPTULO 1. LA INTRODUCCIN

Figura 1.1: Localizacin del rea de estudio.


circulacin de las corrientes marinas superficiales pero principalmente a las profundas portadoras de nutrientes.

1.3. Y los datos?


En el rea anteriormente descrita se realizaron una serie de perforaciones, Figura 1.1,
del fondo marino en diferentes puntos y a diferentes profundidades durante algunos programas internacionales de perforacin del ocano: uno de ellos es el proyecto Trident de la
Unversidad de Rhode Island y el otro el Ocean Drilling Program (ODP). La profundidad
desde la superficie del mar hasta el piso ocenico oscil entre 900 y 3450 metros aproximadamente, como se muestra en la Tabla 1.1, donde aparecen las perforaciones con sus
repectivos cdigos y la profundidad a la que se realiz la perforacin. Estas variaciones
batimtricas reflejan la variabilidad en la topografa del piso ocenico, de manera particular
lo irregular de la Cuenca de Panam.
La Figura 1.3 presenta, como ejemplo, una muestra extrada mediante sistemas de
perforacin en cruceros. Tales muestras son marcadas y luego llevadas al laboratorio para
procesarlas y posteriormente analizar centmetro a centmetro distintas variables como carbonatos, densidad y porosidad del material, elementos trazas, diatomeas, foraminferos entre otras.
La base de datos analizada, Tabla 1.1, contiene un total de 31 perforaciones y fu re-

CAPTULO 1. LA INTRODUCCIN

Figura 1.2: Lmites de la Cuenca de Panam


copilada por el Doctor Jos Ignacio Martnez, profesor del Departamento de Geologa de
la Universidad EAFIT. Esta contiene, adems, el conteo del nmero de individuos de cada
especie de forminiferos planctnicos encontrados en el primer centmetro cbico de la perforacin. Para ello, y con la ayuda de un microcuarteador, se toma una muestra aleatoria de
300 especmenes, la cual se considera representativa de la poblacin y luego se hace el conteo del nmero de individuos de cada especie en cada perforacin (Fatela y Taborda, 2001).
Adicional al nmero de individuos por especie se encuentra el cdigo de la perforacin,la
profundidad desde el crucero al piso ocenico, la latitud y longitud de la misma y el total de
individuos encontrados. En cada perforacin se hace el inventario de las mismas especies
de tal manera que se pueda comparar determinada perforacin con otra dentro del rea de
estudio.

El nombre de cada una de las especies analizadas aparece en cada columna de la Tabla
1.1 de manera abreviada. De esta manera tenemos que Gbull es referida a Globigerina
bulloides, Gsipho a Globigerina siphonifera, Gruber a Globigerinoides ruber, Gsac a Globigerinoides sacculifer, Ouniv a Orbulina universa, Gglut a Globigerinita glutinata, Gcultr

CAPTULO 1. LA INTRODUCCIN

10

Figura 1.3: Muestra obtenida de la perforacin del fondo marino. La muestra luego es llevada al
laboratorio donde se procesa y se monta en placas para el conteo de microfsiles.
a Globorotalia cultrata, Ginfl a Globorotalia inflata, Gtumi a Globorotalia tumida, Nduter
a Neogloboquadrina dutertrei, Npach a Neogloboquadrina pachyderma y Pobliq a Pulleniatina obliquiloculata (Martnez y Bedoya, 2001).

1.4. Las caractersticas de las variables a estudiar y el planteamiento del problema


De los cinco reinos propuestos por Whittaker (1969); Monera, Protista, Vegetal, Animal y Fungi (Whitatker 1969, en Brasier 1980), los foraminferos son organismos que
corresponden al Reino Protista, es decir son organismos unicelulares con movilidad, y que
viven tanto en el piso ocenico, forminiferos bentnicos, como entre el plancton marino,
foraminferos planctnicos (Brasier, 1980).
Los foraminferos planctnicos, variable a estudiar, son organismos en su mayora
microscpicos, flotadores, o con escasa capacidad de nadar, y son transportados por las
corrientes de agua marina. Se encuentran principalmente en la regin nertica, es decir en
los primeros 200 metros de la columna de agua del mar y hacen parte del denominado
zooplancton. Su distribucin depende fuertemente de la abundancia de alimento, la temperatura, la salinidad y la cantidad de los sedimentos en suspensin y la presencia de una u otra
especie o de un conjunto de especies, est determinada por la combinacin de estos factores

CAPTULO 1. LA INTRODUCCIN

11

(Camacho,1966). Los estudios ms recientes en foraminferos realzan su importancia en la


posibilidad que tienen como indicadores paleombientales y el que los foraminferos planctnicos proveen la base de importantes esquemas de correlacin intercontinental litolgica
del Mesozico y Cenozico (Brasier, 1980).
Previo a el planteamiento del problema es importante resaltar dos supuestos de partida
para desarrollar este proyecto. El primero parte del hecho de que una especie al momento
de morir se deposita en un rea muy cercana al sitio donde vivi. Respecto a esto Camacho(1966), anota: Al morir los foraminferos planctnicos, sus cnchulas caen al fondo, donde se acumulan. Por las observaciones realizadas durante su cada, estas cnchulas
sufrirn cierto desplazamiento horizontal slo en los primeros cientos de metros, pero luego
el descenso sera vertical . El segundo tiene que ver con la denominada lisoclina, es decir
el nivel de mximo cambio en la tasa de solucin del carbonato. Est se asumir que no
influye significativamente en el nmero de especies encontrado en cada perforacin, es decir la concha que cae al fondo ocenico presentar niveles de disolucin tal que alcanza a
conservase en un alto porcentaje.
Para este trabajo, como se mencion anteriormente, cada variable es representada por
una especie de foraminfero planctnico. La presencia de una especie podra depender de
la presencia o ausencia de otra. Se espera poder encontrar la manera, como se plante en
los objetivos, en que se distribuyen espacialmente aquellos organismos que presenten una
mayor autocorrelacin en el nmero de especies encontradas.
Cmo cambia de un sector a otro, en el rea de estudio, la cantidad de individuos de
una especie determinada?, existe autocorrelacin espacial entre una especie?, existe autocorrelacin espacial entre dos o ms especies simultaneamente?, acaso el nmero de individuos de una especie en un punto dado obedece a un fenmeno puramente aleatorio?. stas
y otras preguntas surgen al momento de hacer un trabajo en estadstica espacial, donde las
variables en principio existen por una correlacin que depende de la distancia, un espacio,
que las separa.
El tamao muestral, 31 perforaciones en total, es bastante pequeo para un rea de estudio como la definida ac, sin embargo, este trabajo sera un intento por hayar resultados con
una metodologa poco explorada en nuestro medio y en donde la cantidad de datos pocas
veces pueden ser la teoricamente deseada.

1.5. La metodologa y su por qu


El tratamiento estadstico clsico parte de unos principios que conllevaran a conclusiones imprecisas al momento de investigar variables que tengan como atributo adicional su
localizacin geogrfica; variables con coordenadas localizadas sobre mapas. La presuncin
de la independencia del valor de la variable es muy conveniente para poder tratar ciertos
modelos estadsco-matemticos, pero en la realidad muchos de ellos involucran frecuentemente dependencia estadstica (Cressie, 1991).
Para este trabajo se utilizarn, en consecuencia, modelos espaciales, cuyas aplicaciones

CAPTULO 1. LA INTRODUCCIN

12

han sido recientes en campos como la geologa, la epidemiologa, la geografa, la ecologa,


la ssmica y el procesamiento de imgenes entre muchos otros. Estos modelos se han desarrollado en lo que actualmente se ha denominado estadstica espacial y que en sus albores
en la dcada de los 60s se denomin geoestadstica.
De acuerdo a Haining (1990, p.24 en Schabenberger 1999) existen cuatro importantes
tipos de procesos que estn estructurados espacialmente:
Procesos de difusin
Procesos de dispersin
Procesos de transferencia y de canje
Procesos de interaccin
Como ejemplo del primero se tiene en ciencias sociales el fenmeno del rumor que se
difunde atravs de una comunidad donde el fenmeno pasa de un individuo a otro. El proceso de dispersin tiene como claro ejemplo la dispersin de un contaminante, una emisin
atmosfrica. Ac toda la poblacin en s misma se dispersa. El fenmeno de transferencia y
canje es comn en estudios urbanos y econmicos; ingresos obtenidos en un lugar pueden
ser gastados en otro. Por ltimo, en los procesos interactivos los eventos en una localidad
afectan y son afectados por eventos en otras localidades, ejemplo de ello es el crecimiento
competitivo por la luz de los rboles. El crecimiento de un rbol en una ubicacin s, afecta
la probabilidad de supervivencia de rboles cercanos (Schabenberger, 2000).
Cmo estn estructuradas espacialmente nuestras variables?. De acuerdo no slo a lo
inmediatamente anterior se puede inferir que el proceso espacial definido para los foraminferos planctnicos corresponde a un proceso de interaccin ya que la presencia de una
o varias especies pueden estar marcada por la presencia o ausencia de otras. Sin embargo
procesos de dispersin pueden estar involucrados all debido a las caractersticas biolgicas
de los mismos.
La metodologa que se utilizar para abordar este problema, y que ser ampliada en
su desarrollo, se esboza de manera breve en la Figura 1.4. Para su desarrollo, se har uso
del software R versin 1.7.1 el cual es de distribucin gratuita. El cdigo utilizado para la
obtencin de los productos ser anexado al final de la monografa.

1.5.1.

Principios tericos iniciales

A continuacin se plantearn ciertos conceptos iniciales de la estadstica espacial con el


objeto de introducirnos en su aplicacin hacindose un desarrollo ms amplio y completo
de los mismos en captulos posteriores.
Muchos de los modelos estadsticos clsicos requieren para su aplicacin de determinadas condiciones para sus datos. Se asume, por ejemplo, que las observaciones hechas
sobre una variable sean tomadas bajo condiciones idnticas y que cada observacin sea
tomada independientemente una de la otra. De esta forma se tendra una muestra aleatoria

CAPTULO 1. LA INTRODUCCIN

13

Figura 1.4: Flujograma metodolgico.


cuyos datos son independientes e identicamente distribudos(i.i.d).
Como se mencion previamente, el supuesto de independencia es conveniente para hacer posible muchas de las teoras estadstico-matemticas existentes. Sin embargo los modelos que involucran la dependencia en los datos son modelos ms realistas (Cressie, 1991).
Consideremos, inicialmente, un atributo Z que vara aleatoriamente y cuya medicin
est asociada a una localizacin particular. Esta es almacenada en un vector s cuya dimensin depende del espacio de trabajo; si el estudio se hace sobre un transecto o sobre una
superficie, por ejemplo, las dimensiones seran 1 y 2 respectivamente. Z(s) hace nfasis en
la asociacin de Z y con una localizacin y denota un dato aleatorio con localizacin en s.
De manera precisa, s pertenece al espacio D, vara dentro de D, el cual est contenido por
la dimensin de estudio. En otros trminos, s D Rd , con d=(1,2,3...).
D puede representar un espacio fijo, continuo o discreto, o puede ser un espacio aleatorio segn s vare en l. Dependiendo de ello se obtienen diferentes tipos de datos espaciales;
datos geoestadsticos, es decir datos espaciales con variacin continua, datos en malla o
lattice que son datos espaciales con variacin discreta y datos con caractersticas puntuales
(Schabenberger, 2000).

CAPTULO 1. LA INTRODUCCIN

14

De los tipos de datos espaciales anteriormente mencionados los propios de este trabajo
corresponden a datos geoestadsticos ya que D permite a s variar continuamente a travs de
una regin de espacio Euclidiano bidimensional (Cressie, 1991).
En resumen, consideraremos a (Z(s):s D R2 ) como un proceso estocstico y a
(z(s):s D R2 ) una realizacin de este proceso. Como D est contenido en el espacio
Euclidiano, llamaremos a este proceso estocstico un campo aleatorio.
El concepto de autocorrelacin es fundamental al momento de trabajar con campos
aleatorios. Este concepto difiere del concepto de correlacin entre dos variables aleatorias.
Si se tienen dos variables aleatorias X y Y que definen dos atributos diferentes, la correlacin entre X y Y se define como:

Cov[X, Y]
Corr[X, Y] = p
Var[X]Var[Y]

(1.1)

y se denomina correlacin producto-momento, el cual mide el grado en el que Y puede ser


predicho de X en un modelo de regresin de Y en funcin de X (Schabenberger, 2000).
All
Cov[X, Y] = E[(X x )(Y y )]

(1.2)

Var[X] = E[X2 ] (E[X])2

(1.3)

Var[Y] = E[Y2 ] (E[Y])2

(1.4)

La autocorrelacin, desde la perspectiva de las series de tiempo, se define como:


Corr[Z(t), Z(t + h)] = p

Cov[Z(t), Z(t + h)]


Var[Z(t)Var[Z(t + h)]

(1.5)

Donde t es el tiempo y h una magnitud de tiempo definida. Esta ecuacin muestra que la
correlacin entre un dato tomado para una variable en un tiempo t y otro tomado para un
tiempo de t + h depende slo de la distancia temporal que las separa. Ac la relacin se
establece entre la variable y ella misma pero en momentos diferentes, de ah su nombre de
autocorrelacin (Schabenberger, 2000).
De manera anloga, la autocorrelacin espacial se define como:

Corr[Z(s), Z(s+h)] = p

Cov[Z(s), Z(s+h)]
Var[Z(s)Var[Z(s+h)]

(1.6)

Es decir, la correlacin del valor de una variable con otro tomado en un sitio distinto, depende directamente de la distancia, h, que los separa. Cabe ac hacer mencin de la primera
ley de Tobler para condiciones en geografa:

CAPTULO 1. LA INTRODUCCIN

15

"Todo est relacionado con todo, pero las cosas cercanas estn ms relacionadas que las cosas distantes."
Si los datos no presentan autocorrelacin espacial, significa que ellos son independientes
el uno del otro y la aplicacin de la estadstica clsica sera inmediata. Para este caso el
valor de Corr[Z(s), Z(s+h)] = 0 y significara, por ejemplo, que los valores altos de la variable, estaran rodeados de valores altos o intermedios o viceversa. En otras palabras, el
conocimiento de un Zsi no aportara absolutamente en nada al conocimiento de alguno
de sus vecinos. Un resultado alto en Corr[Z(s), Z(s+h)] indica que valores altos, medios o
bajos tienden a estar rodeados de valores altos, medios o bajos respectivamente. Schabenberger (1999) indica que mientras en la correlacin producto-momento entre X y Y puede
existir una correlacin positiva o negativa, la autocorrelacin es usualmente positiva.
Parte del fundamento de la estadstica espacial reposa sobre el concepto de autocorrelacin. El poderlo definir, el determinar la distancia mxima a la que existe autocorrelacin, en caso de existir, llevan a dar un paso importante en la medida que de ello dependen los posteriores pasos, principalmente en el de prediccin o Kriging.

CAPTULO 1. LA INTRODUCCIN

16

Cores Prof. Long. Latit. GbullGsiphoGruberGsacOunivGglutGcultrGinfl Gtumi NduterNpachPobliqTotal


ODP677B 3461 -83.74 1.202 14

17

11

30

12

145

36

276

ODP84 3096 -82.89 5.748 26

20

14

47

148

27

291

TR163-11 1950 -85.82 6.45

10

11

11

17

75

111

35

290

TR163-13 2450 -87.36 6.028 10

26

18

18

100

106

23

311

TR163-14 2365 -87.24 5.902

50

166

53

296

TR163-15 1770 -87.89 4.27

15

70

13

14

107

116

23

371

TR163-16 1840 -88.17 3.913

28

15

105

125

12

303

TR163-17 1680 -89.37 3.066 27

88

30

24

102

73

14

374

TR163-26 3000 -87.78-1.897

12

235

43

305

TR163-33 2230 -82.57-1.913 14

10

15

238

22

303

TR163-34 1360 -81.97-1.313 45

32

43

60

217

24

444

TR163-35 1415 -81.93 -1.35 120

32

18

24

40

194

28

468

TR163-36 1780 -81.78-1.358 22

14

20

228

21

312

TR163-37 2005 -81.68 -1.35

21

18

207

27

302

TR163-38 2200 -81.58-1.337 18

11

23

205

24

296

VM19-27 1373 -82.07-0.467 27

17

10

13

39

160

30

302

ODP506B 2711 -86.09 0.61

10

32

290

50

408

ODP846B 3307 -90.49 -3.05

11

177

25

232

RC23-12 3433 -83.72 1.23

21

24

15

139

221

RC23-20 3186 -83.62

26

23

23

15

142

10

259

VM17-44 3358 -85.1 -3.6

19

236

14

279

RC13-138 2655 -94

1.8

17

16

22

13

21

176

285

RC9-69 2959 -82.8 -2.6

14

219

24

288

14MC2 2045 -86.45 5.846

63

162

49

295

15MC6 904 -86.7 4.221

49

21

17

71

93

25

298

20MC2 2675 -86.49 3.212

10

48

162

55

299

21MC7 2942 -86.5 0.021

226

63

300

25MC3 2203 -82.79 1.853 14

21

282

37

376

29MC2 1343 -82 -1.513 26

12

10

40

200

46

363

38MC1 1003 -84.11 7.32

15

12

53

120

97

321

41MC7 1370 -83.61 7.86

42

38

111

524

77

532

284

56

85

5340

979

Total

308 1169 115

110 9579

Tabla 1.1: Base de datos a estudiar. Core: cdigo de la perforacin, Prof: profundidad desde la superficie marina al piso ocenico, Long: longitud, Latit: latitud, Gbull...Pobliq: nmero de individuos
de foraminferos planctnicos, de cada especie, encontrados en la respectiva perforacin.

Captulo 2

Exploracin Grfica de los Datos y el


I de Moran
La Figura 2.1 presenta la localizacin de las perforaciones. De ella se observa que la
distribucin de las perforaciones tienen una direccin predominante Norte-Sur, que concuerda con la direccin de la cuenca. Resalta el punto PA, que representa una perforacin
bastante aislada del resto y un agregado de perforaciones en la parte sureste de la zona de
estudio.
Debido a la importancia que tiene determinar si una variable posee o no autocorrelacin
espacial para definir la aplicacin o no de la estadstica espacial, se har para cada una de
las muestras, especies de foraminferos, una prueba denominada Prueba para la Autocorrelacin Global con el ndice I de Moran.
Moran introdujo en 1950 la primera medida de autocorrelacin espacial con el objeto de estudiar fenmenos estocsticos distribudos en el espacio en 2 o ms dimensiones
(www.uottawa.ca).
El I de Moran es definido como (Schabenberger y Pierce, 2002):

I = Pn

Pn Pn
i=1

i=1 wij

Pnj=1

wij ui uj

2
i=1 ui

(2.1)

Donde ui = Z(si ) Z y wi,j es un peso asociado con el par de localizaciones si y sj . En el


caso ms simple, los wi j son pesos binarios donde:

1, si si y sj estn conectados (i 6= j),


wij = 0, si si y sj no estn conectados,

0, si i=j,

(2.2)

Una expresin ms compacta se obtiene escribiendo la ecuacin 2.1 como :


I=

n u Wu
1 W1 u u
17

(2.3)

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

18

PA

Latitud

Localizacin de las perforaciones

94

92

90

88

86

84

82

Longitud

Figura 2.1: Localizacin muestral.


Donde u = [u1 , . . . , un ] , W = [wi,j ] y 1 = [1, . . . , 1] .
En ausencia de autocorrelacin espacial I tendra el valor de E[I] = 1/(n 1), con
autocorrelacin positiva I > E[I] y con autocorrelacin negativa I < E[I], lo cual se
asemeja a la prueba estadstica de Durbin-Watson usada en anlisis de regresin lineal para
dependencia entre los residuales. La autocorrelacin positiva implica que los valores tienden a estar rodeados por valores similares mientras que la autocorrelacin negativa implica
que los valores tienden a estar rodeados por valores dismiles unos de otros (Schabenberger
y Pierce, 2002).
Para determinar si la diferencia de I a su valor esperado, E[I], es estadsticamente significativa, se lleva a cabo una prueba de hiptesis donde el estadstico de prueba es:
|Zobs | =

|I E[I]|
I

(2.4)

La dificultad surge cuando se quiere calcular E[I] y 2 . Para ello existen dos aproximaciones
comunmente usadas (Schabenberger y Pierce, 2002):
Asumir que los Zsi son Gausianos.
Asumir que los Zsi son aleatorizados.
Bajo ambas perspectivas E[I] = 1/(n 1). La diferencia reside en la varianza (Schabenberger 1999) como se muestra en la siguiente tabla.
Modelo
Gausiano
Aleatorizado

Var(I)
n2 S1 nS2 +3S02
1
(n2)
2
S02 (n2 1
n[(n2 3n+3)S1 nS2 +3S02 ]b[(n2 n)S1 2nS2 +6S02 ]
(n3)(n2)(n1)S02

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

19

Schabenberger (2000) recomienda que ante la duda que podra resultar del carcter gaussiano de los datos, como nuestro caso parece ser, lo mejor es recurrir a la segunda aproximacin, es decir a la aleatorizacin de los mismos.
En la aproximacin por medio de la aleatorizacin los Z(si ) son considerados fijos inicialmente y permutados entre los n sitios, 31, donde se realiz perforacin. Existiran 31! de
permutaciones igualmente probables y I2 sera la varianza de los 31! valores I de Moran. Si
se adopta la aleatorizacin de los datos, se puede calcular un valor p emprico para probar
la no autocorrelacin espacial, clasificando el valor observado de I entre las (n! 1) posibles permutaciones restantes (Schabenberger y Pierce, 2002).
Para cada una de las variables se realiz la prueba de Moran. Para ello se utiliz el paquete spdep del software R cuyo cdigo se puede revisar en el Apndice A.
A manera de ejemplo se presenta una salida de esta prueba para un k (nmero de vecinos ms prximos) determinado.
Variable Gbull, K=5
Morans I test under randomisation
data: Gbull using rank correction
weights: vecinos.listaw
Moran I statistic standard deviate = 2.7854, p-value = 0.002673
alternative hypothesis: greater
sample estimates:
Moran I statistic Expectation Variance
0.232615669 -0.033333333 0.009116604
Resulta de all el valor de Moran I statistic que corresponde la valor observado del I de
Moran. Expectation corresponde al valor esperado, E[I], y Variance a la varianza de I.
El p-value o valor p, ser comparado, en cada variable, con un = 0,05 para realizar la
siguiente prueba de hiptesis, Tabla 2.1:
Ho: E[I] =
Ha: E[I] >

1
N 1
1
N 1

Proceso aleatorio
Autocorrelacin espacial positiva

Tabla 2.1: Prueba de hiptesis.

2.1. Variable Globigerina bulloides, Gbull.


Esta variable est representada por un total de 524 especmenes o individuos encontrada en 29 del las 31 perforaciones del rea de estudio como se puede observar de la Tabla 1.1.
Los resultados para la prueba de la existencia de autocorrelacin espacial, ndice I de
Moran para k=3, 5, 7, 10, 12 y 16, se presentan en la Tabla 2.2.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN


k
3
5
7
10
12
16

I Moran Obs.
0.31962472
0.232615669
0.204825608
0.143789387
0.109886854
0.044929023

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

20

Valor p
0.002479
0.002673
0.001495
0.003231
0.006362
0.04501

Tabla 2.2: Resultados de la prueba de Moran, variable Gbull.


De la Tabla 2.2 y a un = 0,05 se rechaza la hiptesis nula para k=3, 5, 7, 10, 12
y 16. Es decir, no existe evidencia suficiente para considerar, a esos nmeros de k, que el
nmero de individuos de Gbull encontrados en el rea de estudio corresponden a un proceso
netamente aleatorio. Se sospecha, pus, de la presencia de autocorrelacin espacial relativa
al nmero de individuos encontrados en la perforacin.
Surge un nuevo interrogante al decidir para cul de los k se presenta la mejor autocorrelacin. El I de Moran podra ser una gua al momento de decidir la distancia mxima
adecuada a la cual existe autocorrelacin espacial. Esto es de carcter fundamental ya que
de esta decisin se har la prediccin espacial adecuada.
Ntese del Tabla 2.2 que a medida que el valor de k aumenta, el valor observado del I de
Moran disminuye. Es decir que a medida que el nmero de vecinos ms cercanos aumenta
la autocrrelacin espacial positiva disminuye y en consecuencia su autocorrelacin espacial.
No obstante el I Moran no involucrar distancias en su ecuacin, se infiere que a medida que el nmero de vecinos ms cercanos aumenta, aumenta tambin la distancia que los
relaciona.
El I observado de Moran es relativamente bajo en el intervalo [-1,1]. Se considera que
un I presenta una autocorrelacin positiva relativamente buena cuando est cercana a 0.5 o
ms (Palaseanu Lovejoy, comunicacin escrita).
Pero y qu decidir?. Tomar un k de 3 sera un poco conservador, ntese tambin de la
Tabla 2.2 que a partir de k=7 se produce un cambi drstico en el I. Se podra en principio
tomar este valor como indicador de una distancia de autocorrelacin que en prximos captulos se analizar.
A continuacin se har un anlisis grfico de la variable para compararlo con la hiptesis planteada de la posible existencia de autocorrelacin espacial.
La Figura 2.2 presenta cuatro grficos: el superior izquierdo muestra cmo estn distribuidos espacialmente las cantidades absolutas, conteos, del nmero de especmenes de
la variable Gbull. Se observa una agregacin leve de los valores de la variable; cada color representa un intervalo de magnitudes de las cantidades de individuos encontrados. En
orden decreciente de magnitud se encuentran los colores rojo, amarillo, verde, azul. Con
un mnimo de convencimiento podemos observar que los colores azules estn cercanos a

Coord Y

21

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

20

40

60

80

100

120

data

15
0

20

10

Frequency

60
40

data

80

100

20

120

X Coord

94

92

90

88

86

Coord X

84

82

20

40

60

80

100

120

data

Figura 2.2: Grficos para Gbull. Los colores rojo, amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.

colores azules, verdes a verdes y se exceptan los amarillos y los rojos que son escasos.
Eso significa que determinados valores estn rodeados de valores similares, corroborando
el resultado encontrado con la prueba de Moran.
Las grficas superior derecha e inferior izquierda presentan el comportamiento de la
variable en dos direcciones. En sentido Norte-Sur y en sentido Este-Oeste respectivamente.
En sentido Norte-Sur se observa bastante homogeneidad en los valores de la variable. Sin
embargo resalta la presencia de un valor bastante alto que corresponde a la perforacin
TR163-35 (Tabla 1.1). En sentido Este-Oeste, grfica inferior izquierda los datos igualmente se oscilan entre valores de 0 a 20 con excepcin de un punto bastante anmalo en su
valor.
La grfica inferior derecha corrobora la predominancia del valor de la variable en el
intervalo de 0 a 20. Igualmente se manifiesta el valor anmalo en la cola derecha del histograma.
La Figura 2.3 representa de manera un poco ms clara la variacin espacial de la magnitud de la variable. Se aprecia que en la parte Sur-Oriental de la zona se presentan los
mayores valores. En la parte central del rea parecen insinuarsen valores intermedios, con
un leve aumento al Occidente del rea.
El grfico en 3D es til cuando el tamao de la muestra es pequeo, ya que se logra
distinguir las diferencias que pueda presentar espacialmente una variable. La Figura 2.4
corresponde a uno de ellos.
En este grfico se puede apreciar de manera clara el valor anmalo y lo descrito anteriormente. Se logra observar cada valor y sus vecinos ms cercanos, con una aparente tendencia

22

2
4

Coordenada Y

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coordenada X

Figura 2.3: Tamaos proporcionales al rango de la variable Gbull. A mayor tamao de la circunferencia, mayor es la magnitud del conteo.

a disminur hacia el norte del rea.


Por ltimo, se presenta un grfico de la raz cuadrada de la diferencia entre Z(si + h)
y Z(si ), [Z(si + h) - Z(si )]1/2 , y un nmero de lags determinados en cuatro direcciones;
Norte-Sur, N-S, Este-Oeste, E-O, Noreste-Sueroeste, NE-SO, y Noroeste-Sureste, NO-SE.
Schabenberger (2000) menciona que para garantizar estimaciones estables, la raz cuadrada de las diferencias, se combinan lags en clases de lags. El define una clase de lag como
aquella que contiene todos los puntos a una distancia khk khk de s.
La Figura 2.5 muestra un anlisis a diferentes lags, es decir para khk = 1, 2, 3, 4, 5, y 6,
a ngulos de 0o , 45o , 90o y 135o y un ngulo de tolerancia de 22.5o , representando de esta
manera las cuatro direcciones anteriormente mencionadas.
De ella se observa cmo para las direcciones N-S y E-O, en el primer lag, se tiene
una gran dispersin y sesgo para el nmero de pares de puntos a los cuales se les calcul
[Z(si + h) - Z(si )]1/2 . A diferencia de ello se tiene para este mismo lag las direcciones
NE-SO y NO-SE con menor variabilidad y sesgo para esta raiz cuadrada . Es decir en las
direcciones N-S y E-O la cantidad encontrada de individuos de Gbull presenta mayor variabiliad que en las otras direcciones. Representa esto acaso una mayor variabilidad en las
condiciones ambientales a escalas pequeas para el rea de trabajo en las primeras direcciones que para las segundas?. A pequea escala ya que como se aprecia de la grfica, al
comportamiento para los otros lags en las cuatro direcciones es bastante similar con alguna
variacin en la direccin E-O.
Desde una perspectiva global, principalmente a partir del lag 2, se tiene un comportamiento similar para la raz cuadrada de las diferencias entre los respectivos pares de puntos

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

23

60

Gbull

8
6

40

Latitud

80

100

120

Diagrama de dispersin en 3D
Rotado 120

20

2
0

2
4
94

92

90

88

86

84

82

80

Longitud

Figura 2.4: Grfico en 3D de la variable Gbull. Los colores rojos indican aquellas perforaciones
ms cercanas espacialmente y los negros, las ms lejanas.

involucrados. En otras palabras parece ser que la variable Gbull, presenta un comportamiento similar, en cuanto al nmero de especmenes encontrados en cada perforacin, a partir de
esta lag, en todas las direcciones.
De lo anterior surgen dos conceptos fundamentales en geoestadstica; los procesos en
donde le comportamiento de la variable es igual en todas las direcciones, es decir, es independiente de la direccin en que se analice y los procesos donde el comportamiento de la
variable s depende de la direccin en que se observe. A los primeros se les llama procesos
isotrpicos y a los segundos procesos anisotrpicos.
Para concluir, se puede decir que los valores de la variable Gbull, 524, no corresponden
a un proceso natural aleatorio sino que obedecen a un posible proceso con presencia de autocorrelacin espacial relativamente dbil y con presencia de un posible proceso anisotrpico.

2.2. Variable Globigerinella Gsiphonifera, Gsipho.


Para esta variable y las siguientes se har un anlisis igual al realizado a la variable
Gbull. Ello conlleva a una mayor brevedad en la descripcin de los resultados.
La variable Gsipho est representada por un total de 77 individuos encontrados en 21
de las 31 perforaciones como se puede observar de la Tabla 1.1.
Los resultados para la prueba de autocorrelacin espacial, el ndice I de Moran para
k=3, 5, 7, 10, 12 y 16, se presenta en el Tabla 2.3.
De la Tabla 2.3 y a un = 0,05 se rechaza , y de manera crtica,la hiptesis nula para
k=3. Es decir, se acepta Ha para k=5, 7, 10, 12,y 16, concluyndose que para estos k, no ex-

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

8
6
4
2

square root differnece

10

10

45 22.5, NESO

square root differnece

0 22.5, EO

24

90 22.5, NS

135 22.5, NOSE

8
6
4
0

square root differnece

8
6
4
2

10

lag

square root differnece

lag

10

lag

4
lag

Figura 2.5: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones diferentes para Gbull. Note que la en la direccin NO-SE la variabilidad no es grande.

k
3
5
7
10
12
16

I Moran Obs.
0.17301442
0.167885436
0.167733090
0.132754418
0.144068657
0.084752057

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.05023
0.01754
0.006097
0.005329
0.001014
0.005265

Tabla 2.3: Resultados de la prueba de Moran, variable Gsipho.


isten pruebas estadsticas significativas para pensar que el proceso es aleatorio. Para k=3 se
rechaza, aunque de manera dbil, Ho y se concluye que para este k el proceso es aleatorio.
Es probable que la autocorrelacin no s de a relativas pequeas distancias sino a distancias
intermedias o grandes entre las perforaciones.
La Figura 2.6, margen superior izquierda, muestra la presencia de valores con magnitudes bajas incluso cero, color azul, hacia el Sur y hacia el Occidente del rea. Es hacia
el Noroccidnete del rea hacia donde se presenta una mayor presencia de estos individuos como lo muestran los colores amarillos y verdes, los cuales sean los responsables de la
presencia de una leve autocorrelacin espacial. Estar esta especie limitada a un ambiente
de vida particular, localizado actualmente hacia el Noroccidente del rea? por qu en la
zona Occidental de Ecuador algunas de las perforaciones que no presentan individuos estn
cercanas a perforaciones que s lo tienen? Es la lisoclina, la responsable de esto? .
Los cuadros de la margen superior derecha e inferior izquierda de esta figura muestran
la gran variabilidad en la direccin N-S y E-O e indican el nmero de perforaciones, 10, en
las cuales el nmero de individuos reportados fu cero. El histograma muestra, igualmente,

Coord Y

25

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

10

data

10
0

data

Frequency

15

10

X Coord

94

92

90

88

86

84

82

Coord X

10

data

Figura 2.6: Grficos para Gsipho. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.

cmo la mayor frecuencia en la cantidad de individuos en las perforaciones est entre 0 y 2


con frecuencias cada vez ms bajas a medida que aumenta el nmero de datos. Es decir un
buen porcentaje de las perforaciones presentan un nmero de individuos de entre 0 y 2.
La Figura 2.7 muestra la variacin espacial de la magnitud de la variable proporcional
al rango de los valores. Interesa ver cmo los valores mayores se concentran en la zona
Noroccidental y cmo hacia el Sur del rea los valores son muy pequeos o nulos.
La Figura 2.8 presenta de manera mucho ms clara la distribucin espacial. All se
aprecia, sobre el piso de la grfica, aquellas perforaciones en las que no se encontraron
individuos y se observa claramente como hacia el Noroccidente del rea el nmero de individuos por perforacin aumenta.
Por ltimo la Figura 2.9 presenta los boxplot o diagramas de caja, para la variable
Gsipho. Obsrvese como los grficos de caja para las direcciones E-O y NO-SE, presentan
variabilidades en la raz cuadrada de las diferencias entre cada lag. De manera diferente es
el comportamiento en las direcciones NE-SO y N-S donde el comportamiento de cada lag
para cada una de ellas, es similar hasta el lag 3, a partir del cual la variablididad, en ambas direcciones, cambia a medida que aumentamos el lag, lo que indica un posible proceso
isotrpico en estas dos direcciones pero globalmente un proceso anisotrpico.
En resumen, la variable Gsipho presenta una autocorrelacin espacial pero relativamente dbil ya que el valor de I observado es cercano a cero. Existe adems la presencia
de un proceso anisotrpico ya que el comportamiento de esta variable en las principales
direcciones no es el mismo, exceptuando el de las direcciones NE-SO y N-S donde s es
similar hasta el lag 3.

26

2
4

Coordenada Y

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coordenada X

Figura 2.7: Tamaos proporcionales al rango de la variable Gsipho. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

2.3. Variable Globigerinoides ruber, Gruber.


Esta variable presenta un total de 532 individuos distribudos en la mayor parte del rea
de estudio ya que, exceptuando tres perforaciones, el resto de ellas reporta al menos la presencia de un individuo (Tabla 1.1).
La Tabla 2.4 presenta los resultados de la pruebas de Moran para diferentes k. De ella
se concluye que a un = 0,05 se rechaza Ho para k=3,5,7. En suma, a este y para esos
k, no existen evidencias suficientes para considerar a las cantidades encontradas de Gruber
como un fenmeno aleatorio. Es decir, se sospecha fuertemente de la presencia autocorrelacin espacial aunque dbil ya que los valores observados de I son cercanos a cero. Para
los k restantes se acepta Ho; resultado de esperar, ya que como se mencion anteriormente,
a mayor nmero de vecinos ms cercanos, la distancia entre ellos aumentara directamente
y en consecuencia disminuira la autocorrelacin espacial como lo dice la primera ley de
Tobler ya enunciada.

k
3
5
7
10
12
16

I Moran Obs.
0.27109478
0.134464959
0.116554030
0.033129367
0.007876118
0.007729779

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.007688
0.03942
0.03085
0.1534
0.2367
0.1869

Tabla 2.4: Resultados de la prueba de Moran, variable Gruber.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

27

6
6
4

Gsipho

Latitud

10

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.8: Grfico en 3D de la variable Gsipho. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

En el grfico de la margen superior izquierda de la Figura 2.10 se observa cmo algunos


valores altos, color rojo, se encuentran rodeados de valores similares. Igual cosa ocurre con
valores aquellos valores bajos cuya predominancia se halla al Sur y al Occidente del rea de
estudio. Esto indica cierto nivel de agregacin de valores similares, lo que apoya las pruebas
anteriormente hechas.
Las grficas superior derecha e inferior izquierda muestran, cmo en la direccin N-S,
la mayora de las perforaciones reportan valores que oscilan entre 0 y 20, mientras que un
anlisis en la direccin E-O muestra cmo esos valores oscilan entre este mismo rango pero
concentrados entre las longitudes -88 y -82 aproximademente. El histograma de frecuencias
corrobora estas observaciones.
La Figura 2.11 correspondiente a la grfica con los tamaos proporcionales al rango
del nmero total de especies encontrados muestra cmo hacia el Noroccidente del rea de
estudio se presentan los valores ms altos. Hacia la parte Suroriental estos valores son intermedios disminuyendo hacia el Norte y hacia el Occidente del rea de estudio. Pareciera
indicar un aumento gradual de la variable desde el Sureste hacia el Noroccidente.
El grfico en 3D, Figura 2.12, presenta de manera mucho ms clara esta situacin. Se
observa adicionalmente la manera en que en la regin Noroccidental valores altos estn
rodeados de valores intermedios y bajos de manera gradual. Vese, adems, la ausencia de
valores altos e intermedios al Occidente del rea de estudio. Nuevamente, tiene todo este
comportamiento estadstico su correspondiente significado ecolgico?, por qu de la abundancia o carencia de especmenes en ciertos sectores del rea de estudio?
Para analizar la variabilidad de los datos en distintas direcciones, se presentar la Figura 2.13 correspondiente a una grfica de caja o boxplot.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

45 22.5, NESO

3.0
2.0
0.0

90 22.5, NS

135 22.5, NOSE

square root differnece

2.0
1.0

3
lag

0.0

lag

4
lag

0.0 0.5 1.0 1.5 2.0 2.5

3.0

square root differnece

1.0

square root differnece

2.0
1.0
0.0

square root differnece

3.0

0 22.5, EO

28

4
lag

Figura 2.9: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones diferentes para Gsipho.

Obsrvese cmo para la direccin E-O la variable presenta grandes cambios en la variabilidad de la raiz cuadrada de la diferencia a medida que aumentamos los lags. Las direcciones NE-SO y N-S muestran un comportamiento similar para cada lag. La direccin
NO-SE difiere de las anteriores. Para los dos primeros lags, se da una variabilidad bastante
baja, la cual aumenta a partir del tercer lag. Nuevamente estamos ante un proceso anisotrpico con comportamientos similares en dos direcciones.
Para finalizar el anlisis de esta variable, resumiremos que ella parece presentar autocorrelacin espacial hasta k=7, con presencia de un proceso anisotrpico a nivel global e
isotropa en las direcciones NE-SO y N-S.

2.4. Variable Globigerinoides sacculifer, Gsac.


Esta variable, con un total de 284 individuos, se encuentra presente en 28 de las 31 perforaciones del rea de estudio.
La Tabla 2.5, presenta la informacin para realizar la prueba I de Morn de autocorrelacin espacial. De ella se observa, y de igual manera que para Gsipho, que para k=3, 5
y 7 se acepta Ha con las consecuencias antes mencionada. Para k=10, 12 y 16 se acepta
Ho y se supone ya para esos k procesos puramente aleatorios. Sin embargo persiste, como
para las variables anteriores una autocorrelacin espacial bastante dbil por los valores tan
cercanos a cero del I observado.
La Figura 2.14 presenta en su grfico superior izquierdo cmo valores altos en la variable estn relativamente agregados en la parte Noroccidental del rea de estudio, a diferencia

8
6
4
2

Coord Y

2
4

94

92

90

88

86

84

82

20

40

60

80

data

10
0

20

40

Frequency

15

60

20

80

X Coord

data

29

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coord X

20

40

60

80

100

data

Figura 2.10: Grficos para Gruber. Los colores amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.

k
3
5
7
10
12
16

I Moran Obs.
0.27398776
0.139848327
0.123186620
0.015891485
-0.038273554
0.030238983

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.007214
0.03486
0.02552
0.2246
0.5342
0.08425

Tabla 2.5: Resultados de la prueba de Moran, variable Gsac.


de aquellos valores bajos, color azul, los cuales se distribuyen por toda el rea de estudio.
Los valores intermedios, color verde, se presentan al Sur del rea, con ausencia de esas
magnitudes.
Los grficos de la margen superior derecha e inferior izquierda muestran cmo para
en el primero los datos entre las latitudes bajas, -4o , 2o , presentan magnitudes entre 2 y
10 aproximadamente mientras que para las latitudes ms al Norte , 2o y 8o estas magnitudes presentan mayor variabilidad. Para el segundo, margen inferior izquierda muchos de
los datos que se concentran entre las longitudes -82o y -88o los datos presentan una gran
variablidad. El histograma de frecuencia, margen inferior derecha, se presenta con una cola
hacia la derecha que disminuye de manera ms gradual que para las variables anteriormente
analizadas y donde la mayor frecuencia se encuentra entre los 0 y 5 individuos.
La Figura 2.15, muestra los tamaos de los conteos para cada perforacin relativos al
valor 284 que corresponde al valor total. Visto de manera distinta lo arriba descrito para esta
variable, vese la presencia de los valores mayores hacia el Noroccidente del rea. Comportamiento este similar para otras variables descritas. En la zona Suroriental se observa la

30

Coordenada Y

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coordenada X

Figura 2.11: Tamaos proporcionales al rango de la variable Gruber. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

60
6
4

Gruber

8
40

Latitud

80

100

Diagrama de dispersin en 3D
Rotado 120

20

2
0

2
4
94

92

90

88

86

84

82

80

Longitud

Figura 2.12: Grfico en 3D de la variable Gruber. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas. Note los valores altos hacia el NO-SE

presencia de valores pequeos e intermedios.


La Figura 2.16 corresponde a la grfica en 3D de los datos. Claramente se ve en ella
una agregacin de valores intermedios a pequeos en la zona Suroriental del rea de estudio. Hacia el Noroccidente de la misma estos valores aumentan sustancialmente. Se resalta
la presencia de valores altos cerca de la zona central del rea de estudio, as como el alto
valor encontrado en la perforacin ms Occidental.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

45 22.5, NESO

2.0
1.0
0.0

90 22.5, NS

135 22.5, NOSE

1.0
0.0

2.0
1.0

2.0

square root differnece

lag

0.0
1

lag

3.0

square root differnece

3.0

square root differnece

0.0

1.0

2.0

square root differnece

3.0

0 22.5, EO

31

lag

lag

Figura 2.13: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones

8
6
4
2

Coord Y

2
4

Y Coord

diferentes para Gruber.

94

92

90

88

86

84

82

10

15

20

25

30

data

8
0

Frequency

15
10

data

20

10

25

12

30

X Coord

94

92

90

88

86

Coord X

84

82

10

15

20

25

30

data

Figura 2.14: Grficos para Gsac. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.

En la Figura 2.17 se muestra la varianza de la raz cuadrada de las diferencias de los


valores de la variable a distintos lags. Obsrvese la manera que esta flucta, sube y baja,
de manera oscilante para las direcciones E-O y NO-SE. De manera similar, aunque no tan
marcada en la direccin N-S dnde el lag 4 corresponde a un punto de cambio. La direccin
NE-SO muestra cierta estabilidad en la varianza a medida que los lag, aumentan.

32

Coordenada Y

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coordenada X

Figura 2.15: Tamaos proporcionales al rango de la variable Gsac. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

15

Gsac

8
6

10

Latitud

20

25

30

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.16: Grfico en 3D de la variable Gsac. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

De lo anterior, se concluye que esta variable presenta un posible autocorrelacin espacial dbil con presencia de un proceso anisotrpico y oscilaciones en la variablidad de la
raz cuadrada de las diferencias especialmente en las direcciones E-O y NO-SE.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

lag

90 22.5, NS

135 22.5, NOSE

0 1 2 3 4 5

lag

0 1 2 3 4 5
1

0 1 2 3 4 5

square root differnece


2

square root differnece

square root differnece

45 22.5, NESO

0 1 2 3 4 5

square root differnece

0 22.5, EO

33

lag

lag

Figura 2.17: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gsac.

2.5. Variable Orbulina universa, Ouniv.


Esta especie de foraminfero es la que tiene menor cantidad de individuos contados, 56
en total. Con presencia en slo 18 perforacions de los 31, el resto de los cuales el conteo
result cero (Tabla 1.1).
k
3
5
7
10
12
16

I Moran Obs.
0.06164828
0.090460740
0.129623621
0.084993511
0.070909042
0.012319517

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.2248
0.0974
0.02111
0.03443
0.03489
0.1614

Tabla 2.6: Resultados de la prueba de Moran, variable Ouniv.


La Tabla 2.6 muestra como para esta variable la hiptesis nula se acepta a un = 0,05
para k=3, 5 y 16 y se concluye que para estas condiciones el proceso es netamente aleatorio.
Es decir la presencia de autocorrelacin espacial no est presente. Sin embargo, y de manera
extraa, la autocorrelacin espacial aparece, aunque muy dbil, para k=7, 10 y 12. Son estos
resultados vlidos?, acaso el nmero de individuos encontrados es demasido bajo para esta
prueba?. Los prximos anlisis grficos intentarn encontrar alguna luz de la distribucn
espacial, si ella existe, de esta especie.
La Figura 2.18, margen superior izquierda, muestra las existencia de un gran nmero de
perforaciones relativamente cercanas unas de otras, color azul, cuyos valores son demasado bajos e incluso muchos de ellos con valores cero. Se observa igualmente como aquellos

Coord Y

34

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

10

data

15
10
0

data

Frequency

20

10

X Coord

94

92

90

88

86

84

82

Coord X

10

data

Figura 2.18: Grficos para Ouniv. Los colores amarillo, verde, azul indican la magnitud decreciente
en el nmero de individuos encontrados en las perforaciones.

valores ms altos, amarillos, se encuentran separados a distancias relativamente intermedias. Esto puede dar una respuesta inicial al anlisis de las pruebas de Moran anteriormente
realizado.
Las grficas superior derecha e inferior izquierda muestran cmo los datos en las direcciones N-S y E-O se encuentran en su mayor parte entre 0 y 2 unidades, lo que es corroborado con el histograma de frecuencias del grfico inferior derecho.
La Figura 2.19 representa aquellas perforaciones donde el conteo fu mayor y aquellas
donde los valores fueron cero, los crculos ms pequeos. Sin embargo definir alguna tendencia all se dificulta por el escaso nmero de datos.
La grfica en 3D, Figura 2.20, podra mostrar de manera ms clara alguna relacin espacial. Vese en ella la zona Sureste donde se presentan los valores ms altos, rodeados de
valores intermedios y luego bajos. Esto es positivo al momento de definir autocorrelaciones
espaciales, ya que podran indicar cierta dependencia de la distancia en la medida que las
cantidades de individuos disminuyen al aumentar aquella. Hacia el Noreste se presenta una
perforacin con valores relativamente altos rodeados de valores pequeos lo que podra
determinar la presencia de procesos aleatorios en ese sector. Es importante observar, y de
manera especulativa, la direccin N-S cercana a la lnea de costa, donde se parte de valores
bajos que luego aumentan y disminuyen posteriormente hacia el Norte. Los puntos que se
encuentran sobre el plano XY, corresponden a perforaciones sin individuos.
El anlisis de la varianza de la raz cuadrada de las diferencias se hace a partir de la
Figura 2.21. Para la direccin E-O se observa que el comportamiento de la varianza de la

35

Coordenada Y

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

Coordenada X

Figura 2.19: Tamaos proporcionales al rango de la variable Ouniv. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

Ouniv

8
6
4

Latitud

10

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.20: Grfico en 3D de la variable Ouniv. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

raiz cuadrada presenta un comportamiento bastante irregular a medida que se aumentan los

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

36

lags. Para la direccin N-S resltese la manera como esta raz disminuye lo mismo que su
variabilidad, registrndose un aumento considerable en la variabilidad para los lags 5 y 6.
Las direcciones NE-SO presenta un valor de la raz que igualmente disminuye pero presentando cierta constancia en la variabilidad de los datos y en la direccin NO-SE se da la
presencia de un proceso aparentemente fluctuante.

3.0
2.0
1.0

90 22.5, NS

135 22.5, NOSE

lag

2.0
1.0
0.0

3.0
2.0
1.0

3.0

lag

square root differnece

lag

0.0
1

0.0

square root differnece

3.0
2.0
1.0
1

square root differnece

45 22.5, NESO

0.0

square root differnece

0 22.5, EO

lag

Figura 2.21: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Ouniv.

La variable Ouniv, presenta, en resumen, la ausencia de autocorrelacin espacial a distacias relativamente cortas y excesivamente largas debido posiblemente a la presencia de valores bajos o nulos situados unos cerca de los otros. Sin embargo se presume autocorrelacin
espacial dbil para distancias relativamente intermedias. El anslisis de la variabilidad de la
riz cuadrada de las diferncias muestra, en la supuesta presencia de autocorrelacin espacial, la presencia de un posible fenmeno anisotrpico.

2.6. Variable Globigerinita glutinata, Gglut.


Gglut es una especie representada por un total de 308 individuos presentes en 28 de las
31 perforaciones (Tabla 1.1).
La Tabla 2.7 muestra los resultados de la prueba I de Morn. De ella se concluye, a un
= 0,05, la aceptacin de Ho, para todos k . Esto qu significa?. Inicialmente al aceptar
Ho, se concluye a ese que la variable de las cantidades de individuos encontrados en cada
perforacin, no tienen ninguna autocorrelacin espacial, es decir, es problable que valores
altos, medios o bajos de la variable estn rodeados de valores bastante dismiles a ellos. La
exploracin grfica dar respuestas a esta situacin.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN


k
3
5
7
10
12
16

I Moran Obs.
-0.22638640
-0.086392806
-0.071568890
-0.044307417
0.045069920
-0.030284138

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

37

Valor p
0.9378
0.7108
0.6832
0.567
0.5809
0.4737

Tabla 2.7: Resultados de la prueba de Moran, variable Gglut.

8
6
4
2

Coord Y

2
4

Y Coord

La Figura 2.22 presenta claramente, grfico superior izquierdo, lo planteado anteriormente. Obsrvese como los valores encontrados para las distintas perforaciones difieren
considerablemente de sus repectivos vecinos; colores rojos rodeados de verde, amarillos
de azules, apoyando la presencia de un proceso netamente aleatorio. Ahora, este resultado
termina siendo incierto desde el punto de vista de la interpretacin ecolgica. Es posible
que la presencia de una especie en una cuenca como la de Panam sea un fenmeno netamente aleatorio? las cantidades de individuos encontrados en las perforaciones no pesan
lo suficiente para determinar las interrelaciones ecolgicas? qe implicaciones ecolgicas
conlleva un proceso aleatorio?

94

92

90

88

86

84

82

10

15

20

25

30

data

6
0

Frequency

15
10

data

20

25

30

X Coord

94

92

90

88

86

Coord X

84

82

10

15

20

25

30

data

Figura 2.22: Grficos para Gglut. Los colores rojo,amarillo, verde, azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.

Las grficas superior derecha e inferior izquierda muestran la amplia variabilidad en los
valores de los datos tanto en la direccin N-S como en E-O. El histograma reafirma este
resultado, donde los datos entre 0 y 10 presentan una frecuencia alta, seguida de cerca por
el rango entre 10 y 15 datos.
La Figura 2.23 presenta la magnitud de la cantidad de individuos encontrados en cada

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

38

2
4

Coordenada Y

perforacin relativos al rango de la muestra. En l se observa como no existen agregaciones


entre tamaos de crculos similares. Cerca a un crculo de tamao grande se encuentra uno
pequeo y viceversa.

94

92

90

88

86

84

82

Coordenada X

Figura 2.23: Tamaos proporcionales al rango de la variable Gglut. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

El grfico en 3D, Figura 2.24, presenta lo concludo de manera diferente. All se aprecia
la alternancia, digamos aleatoria, en el valor de la variable.
Por ltimo, se har un anlisis de la manera cmo vara la raz cuadrada de la diferencia
a medida que se aumentan los lag. La Figura 2.25 presenta esta informacin.
En esta figura se observa, cmo para la direccin N-S el valor de la raz cuadrada y
su variabilidad permanecen practicamente constante hasta el lag 4 apartir del cual aumentan para empezar a disminuir. De manera diferente es el comportamiento para ese mismo
intervalo de lags en las otras direcciones. En la direccin NE-SO y E-O se presentan fluctuaciones en el valor de la raz, sin embargo la variabilidad parece ser similar.
En conclusin, la variable Gglut se presenta como un fenmeno con ausencia de autocorrelacin espacial, es decir un fenmeno puramente aleatorio. Llama la atencin el ser
la nica variable hasta ahora analizada en la que ni la presencia dbil de autocorrelacin
aparece. Ello tiene implicaciones en el sentido de la aplicacin de la teora geoestadstica
donde la autocorrelain desempea un papel crucial.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

39

15

Gglut

8
6

10

Latitud

20

25

30

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.24: Grfico en 3D de la variable Gglut. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

90 22.5, NS

135 22.5, NOSE

0 1 2 3 4 5

lag

square root differnece

lag

0 1 2 3 4 5
1

0 1 2 3 4 5

square root differnece

5
4
3
2
1
1

square root differnece

45 22.5, NESO

square root differnece

0 22.5, EO

lag

lag

Figura 2.25: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gglut.

2.7. Variable Globorotalia inflata, Ginfl.


Ginfl, presenta un total de 115 individuos encontrados en 9 de las 31 perforaciones estudiadas como se puede deducir de la Tabla 1.1.
La Tabla 2.8 muestra cmo a partir del valor p y a un = 0,05, slo se rechaza Ho
para k=3. Es decir, no existen evidencias estadsticas significativas para este k para pensar
que el proceso sea aleatorio. Para k mayor de 3 se acepta Ho y se concluye que el proceso

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

40

es aleatorio.

k
3
5
7
10
12
16

I Moran Obs.
0.20527304
0.064992620
0.023599318
0.013630753
0.012179659
-0.006077670

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.02876
0.1516
0.2389
0.2351
0.2143
0.2775

Tabla 2.8: Resultados de la prueba de Moran, variable Ginfl.


La Figura 2.26, grfico superior izquierdo, muestra la manera en que se encuentran
distribudos los conteos para Ginfl. Ntese la gran cantidad de crculos azules. Ello indica
que la mayora de las perforaciones presentan valores en el conteo bastante bajos o nulos
como es el caso. Los tringulos verdes corresponden a conteos de magnitud intermedia y se
encuntran distribudos en forma circular.

8
6
4
2

Coord Y

2
4

Y Coord

Los grficos superior derecho e inferior izquierdo hacen un recorrido en sentido N-S y
E-O para el valor tomado en cada perforacin. Vase la gran cantidad de perforaciones sin
valor en estas direcciones y los altos valores para las latitudes al sur y longitudes al oriente,
cerca a Ecuador. El histograma resume esto indicando que la frecuencia mayor se da para
datos entre 0 y 10.

94

92

90

88

86

84

82

10

20

40

50

60

30
25

50

15
0

10

Frequency

20

40
30
10

20

data

30
data

60

X Coord

94

92

90

88

86

Coord X

84

82

10

20

30

40

50

60

data

Figura 2.26: Grficos para Ginfl. Los colores verde y azul indican la magnitud decreciente en el
nmero de individuos encontrados en las perforaciones.

La Figura 2.27 muestra estas relaciones espaciales segn la magnitud en cada perforacin, relativa al rango total. En este grfico se observan, aunque no de manera clara, la

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

41

2
4

Coordenada Y

presencia de valores altos y muy bajos en el rea de estudio.

94

92

90

88

86

84

82

Coordenada X

Figura 2.27: Tamaos proporcionales al rango de la variable Ginfl. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

La Figura 2.28 corresponde a la grfica en 3D de Ginfl. En esta grfica se aprecia de


manera muy clara dos valores aparentemente anmalos en cercanas al Ecuador. Surge el
interrogante del por qu de ellos?, tienen algn significado ecolgico?, por qu cambios tan
fuertes con respecto a sus vecinos? representan abundancia? por qu su ausencia en la parte
central y norte del rea?
La Figura 2.29 presenta los diagramas de caja para las cuatro direcciones principales.
Obsrvese cmo para las direcciones N-S y E-O, se presenta un valor alto para la raz
cuadrada de las diferencias e igualmente una gran variabilidad para el primer lag. A parir
del segundo lag, el valor de esta raz presenta una fuerte disminucin en su valor y a la vez
en su variabilidad, pero con un fuerte sesgo. Para las direcciones restantes se observa el peso
de la ausencia de valores y cierta fluctuacin en el valor de la raz y en la variabiliadad. Se
resalta igualmente la presencia de valores extremos en todas las direcciones analizadas.
En resumen, no obstante Ginfl presentar un nmero no muy bajo de individuos, stos se encuentran fuertemente asociados a dos perforaciones. Las restantes presentan en su
mayora ausencia de datos, lo que conlleva a la existencia de una muy pobre o mejor dbil
autocorrelacin espacial. En consecuencia se resalta la presencia de dos valores extemos en
los que se concentra gran parte del total muestral. Surge entonces la pregunta sobre si estos
tienen una interpretacin ecolgica razonable o cal ha sido el papel de la lisoclina para esta
especie?

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

42

30

Ginfl

8
6

20

Latitud

40

50

60

Diagrama de dispersin en 3D
Rotado 120

10

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.28: Grfico en 3D de la variable Ginfl. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

6
4
0

lag

lag

90 22.5, NS

135 22.5, NOSE

6
4
2
0

square root differnece

square root differnece

square root differnece

6
4
2
0

square root differnece

45 22.5, NESO

0 22.5, EO

4
lag

4
lag

Figura 2.29: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Ginfl.

2.8. Variable Globorotalia cultrata, Gcultr.


La variable Gcultr es la segunda variable que presenta mayor nmero de individuos con
un total de 1169 distibudos en 29 de las 31 perforaciones analizadas (Tabla 1.1).
La Tabla 2.9 presenta los resultados para la prueba de autocorrelacin espacial a partir
del ndice de Moran.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

43

En esta se concluye, a un = 0,05 y para cada uno de los k, que no existen pruebas suficientes para aceptar Ho. En otras palabras, se sospecha de la presencia de autocorrelacin
parcial. Es decir, la cantidad de individuos encontrada en un una perforacion cualesquiera
depende de las cantidades encontradas en otras perforaciones y posiblemente dependa de la
distancia que los separa.

k
3
5
7
10
12
16

I Moran Obs.
0.66665377
0.565077995
0.548643668
0.418951834
0.368470998
0.250830183

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
1.258e-08
1.836e-10
2.010e-13
1.773e-12
1.378e-12
3.745e-10

Tabla 2.9: Resultados de la prueba de Moran, variable Gcultr.


La presencia de autocorrelacin espacial que se da para esta variable parece ser fuerte,
al menos hasta k=10, dado los valores observados para el I de Moran. Sin embargo para
k=16 la autocorrelacin espacial, aunque dbil, existe.

8
6
4
2

Coord Y

2
4

Y Coord

La Figura 2.30, margen superior izquierda, muestra claramente la agregacin de valores similares; cruces rojas rodeadas de rojas, verdes de verdes y azules de azules. Esto es
la manifestacn de una alta autocorrelacin espacial y permite realizar de manera adecuada
una prediccin espacial tratada en el prximo captulo.

94

92

90

88

86

84

82

20

40

80

100

12
8
0

20

Frequency

10

80
60
40

data

60
data

100

X Coord

94

92

90

88

86

Coord X

84

82

20

40

60

80

100

120

data

Figura 2.30: Grficos para Gcultr. Los colores rojo, amarillo, verde y azul indican la magnitud
decreciente en el nmero de individuos encontrados en las perforaciones.

El grfico superior derecho de esta figura, muestra el comportamiento de los datos en

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

44

2
4

Coordenada Y

la direccin N-S. Obsrvese la presencia de dos grupos de datos. El primero entre las latitudes -4o y 2o aproximadamente cuyos valores estn entre 0 y 40 individuos y el segundo grupo ms al Norte con valores entre 40 y 100 aproximadamente. El grfico inferior
izquierdo muestra un grupo entre las longitudes -82o y 84o aproximadamente cuyos valores
estn, igualmente, entre 0 y 40 individuos y otro grupo entre las longitudes -86o y -92o
aproximadamente con valores entre 40 y 100. De manera general para ambas direcciones
se observa la presencia de tendencias en los datos. Cuando nos desplazamos hacia el Norte,
los datos tienden a aumentar, mientras que si nos acercamos a la costa en sentido E-O, los
datos tienden a disminuir. El histograma de frecuencias muestra cmo una gran cantidas de
perforaciones, 12, reportan individuos que estn entre 0 y 20 seguidos por aquellos entre 40
y 60.

94

92

90

88

86

84

82

Coordenada X

Figura 2.31: Tamaos proporcionales al rango de la variable Gcultr. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

La Figura 2.31 presenta el tamao del crculo de acuerdo al valor relativo al rango
encontrado en cada perforacin. Obsrvese la manera en que las perforaciones con mayor
conteo de individuos se encuentra localizada al Noroeste del rea de estudio y los valores
menores al Sureste. Importante recalcar que las dos perforaciones ms al sur del rea presentan valores de cero, es decir no reportaron esta especie all.
La Figura 2.32 muestra de manera mucho ms clara la manera como se agregan valores
intermedios y bajos al Sureste del rea y los valores ms altos en la zona Noroccidental del
rea de estudio. Se aprecia tambin la manera como en la parte central de la cuenca los
valores son bajos, mucho ms que los presentados al Norte del rea.
Un anlisis de la raz cuadrada de las diferencias, [Z(si + h) - Z(si )]1/2 , y un nmero
de lags, se presenta en la Figura 2.33. Se observa de manera general y para todas las direcciones, la manera en que el valor de esta raz aumenta a medida que aumenta el nmero de

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

45

60

Gcultr

8
6

40

Latitud

80

100

120

Diagrama de dispersin en 3D
Rotado 120

20

2
0

2
4
94

92

90

88

86

84

82

80

Longitud

Figura 2.32: Grfico en 3D de la variable Gcultr. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

lags, es decir, a medida que aumenta la distancia que separa una perforacion determinado de
los otros. De manera especial obsvese la manera como cambia este valor para la direccin
NE-SO es igualmente cierta constancia en la variabiliadad de estas diferencias para cada
lag. Este comportamiento en el valor de la raz cuadrada es propio de datos con autocorrelacin espacial.

45 22.5, NESO

8
6
4
0

lag

lag

90 22.5, NS

135 22.5, NOSE

8
6
4
2

square root differnece

10

10

square root differnece

square root differnece

8
6
4
2
0

square root differnece

10

10

0 22.5, EO

4
lag

4
lag

Figura 2.33: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gcultr.

En resumen, esta variable muestra una fuerte autocorrelacin espacial en el nmero

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

46

de individuos encontrados en cada perforacin como se indic en la prueba de Moran.


Los anlisis grficos reafirman esta situacin con la adicional presencia de un proceso
anisotrpico como lo indica la Figura 2.33. Queda por definir la distancia, o rango, a la
que la autocorrelacin es ptima, para obtener una adecuada estimacin espacial de los lugares no muestreados. Situacin que ser planteada en el prximo captulo.

2.9. Variable Globorotalia tumida, Gtumi.


Esta variable est representada por un total de 85 especmenes los cuales fueron encontrados en 20 de las perforaciones, el resto de las cuales reportaban ausencia de esta especie.
La Tabla 2.10 presenta los resultados para la prueba de Moran.

k
3
5
7
10
12
16

I Moran Obs.
-0.004991728
-0.047458497
-0.037731351
-0.079946089
-0.083811113
-0.056419006

E[I]
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.015780690
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.4108
0.5588
0.5219
0.7632
0.81
0.6915

Tabla 2.10: Resultados de la prueba de Moran, variable Gtumi.


De acuerdo a ella, se concluye que a un = 0,05 se acepta la hiptesis nula de ausencia
de autocorrelacin espacial entre la informacin encontrada en las perforaciones para cada
uno de los k analizados. Es decir, se estara, as como para la variable Gglut, en un proceso
completamente aleatorio. El anlisis grfico podra dar ms claridad a esta situacin.
La Figura 2.34 en su grfico superior izquierdo, muestra la predominancia de crculos
azules en la rea de estudio. Ello implica un alto nmero de perforaciones con valores bajos
o cero. Las perforaciones con valores intermedios a ms altos, colores verdes y amarillos
respectivamente, no muestran agregaciones particulares, encontrndose en el rea de manera dispersa y escasa.
El grfico superior derecho e inferior izquierdo muestran claramente la gran cantidad
de perforaciones con valores nulos o muy bajos. El histograma reafirma esta situacin al indicar el gran nmero de perforaciones, mayores de 25, con valores de individuos entre 0 y 5.
Importante resaltar en esta figura es el hecho que la perforacin ms alejada, extremo
Occidental, es la que presenta el mayor nmero de individuos. Sigue en su orden una perforacin en la regin central de la cuenca y otra hacia el Sureste de la misma.
La Figura 2.36, 3D, muestra de manera mucho ms clara la distribucin de los valores de esta especie en cada perforacin. En ella se observa de manera grfica, la verdadera
dimensin del valor de la variable en la perforacin ms al occidente del rea de estudio.

Coord Y

47

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

10

15

20

data

20
15

Frequency

10

10

data

15

25

20

X Coord

94

92

90

88

86

84

82

10

Coord X

15

20

25

data

2
4

Coordenada Y

Figura 2.34: Grficos para Gtumi. Los colores amarillo verde y azul indican la magnitud decreciente en el nmero de individuos encontrados en las perforaciones.

94

92

90

88

86

84

82

Coordenada X

Figura 2.35: Tamaos proporcionales al rango de la variable Gtumi. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

Igualmente las otras perforaciones con escasa o nula presencia de la variable.


La Figura 2.37 muestra como el valor de la raz cuadrada de las diferencia cambia, para
cada lag, de manera aparentemente aleatoria, subiendo y bajando la mediana con dispersiones igualmente cambiantes.
En conclusin, Gtumi, no parece tener en los valores de las perforaciones una auto-

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

48

15
6
4

Gtumi

10

Latitud

20

25

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.36: Grfico en 3D de la variable Gtumi. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

4
3
2
1

90 22.5, NS

135 22.5, NOSE

lag

3
2
1
0

4
3
2
1

lag

square root differnece

lag

0
1

square root differnece

4
3
2
1
1

square root differnece

45 22.5, NESO

square root differnece

0 22.5, EO

lag

Figura 2.37: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Gtumi.

correlacin espacial. Parece, ms bien, corresponder a un proceso netamente aletorio como


el presentado por Gglut, llevando esto a pensar que si bien es importante para la autocorrelacin espacial tener un alto nmero total de individuos, ms importante es la manera
como ellos estn distribudos en el espacio.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

2.10.

49

Variable Neogloboquadrina dutertrei, Nduter.

Nduter es la variable que posee el mayor nmero de individuos encontrados en el conteo, de cada especie estudiada, en cada perforacin. Ella est representada por un total de
5340 individuos distribudos entre todas las perforaciones (Tabla 1.1).
La Tabla 2.11 presenta los resultados de la prueba de Moran para autocorrelacin espacial.

k
3
5
7
10
12
16

I Moran Obs.
0.43811496
0.370791845
0.421641398
0.298969278
0.251079526
0.273525037

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
8.739e-05
1.155e-05
7.071e-09
1.616e-07
3.758e-07
1.496e-11

Tabla 2.11: Resultados de la prueba de Moran, variable Nduter.


De ella se concluye que a un = 0,05 y para cada unos de los k, que no existen evidencias suficientes para aceptar el hecho de que el nmero de individuos encontrado en
cada perforacin sea aleatorio. Esto lleva a intuir una posible autocorrelacin espacial en
los datos.de Nduter. Importante de resaltar es la comparacin entre Nduter (Tabla 2.11) y
Gcultr (Tabla 2.9); aquella rebasa a esta por 4171 individuos, sin embargo la autocorrelain
espacial de Gcultr parece ser ms fuerte. Se piensa, nuevamente, en que podra llegar a ser
en determinado momento ms importante la manera como se localizan espacialmente los
datos que su cantidad.
La Figura 2.38 presenta en su parte superior izquierda la manera como se agregan estos
datos. Hacia el Noroccidente resalta la agregacin de valores con magnitudes bajas, mientras que al Sureste y Sur se observa una agregacin de valores altos.
El grfico superior derecho muestra la manera en que disminuyen las magnitudes de
los conteos a medida que nos desplazamos hacia el Norte. En otras palabras, a medida que
nos dirigimos hacia el Sur, las magnitudes aumentan, mientras que en la direccin E-O no
se presenta una tendencia sino ms bien una gran dispersin en los mismos. El histograma refleja una simetra bastante alta con respecto al de las dems variables. Se presenta
gran contidad de perforaciones con conteos entre 100 y 250 individuos, mientras que se dan
pocas perforaciones con valores muy altos, mayores de 250 o muy bajos, menores de 100.
La Figura 2.39 muestra la anterior situacin de manera ms clara. Resalta de all la agregacin de valores bajos en el conteo hacia el Noroccidente, mientras que hacia el Sureste y
Sur las valores son mucho mayores.
La Figura 2.40 presenta esta informacin vista desde otra perspectiva. En ella se observa como estn agregados los valores de las perforaciones hacia el Sureste. All los valores
toman magnitudes entre 200 y 250. En la parte aproximadamente central del rea de estudio

8
6
4
2

Coord Y

2
4

94

92

90

88

86

84

82

50

100

150

200

250

data

4
0

50

100

150

Frequency

200

250

X Coord

data

50

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

50

100

Coord X

150

200

250

300

data

2
4

Coordenada Y

Figura 2.38: Grficos para Nduter. Los colores rojo, amarillo, verde y azul indican la magnitud
decreciente en el nmero de individuos encontrados en las perforaciones.

94

92

90

88

86

84

82

Coordenada X

Figura 2.39: Tamaos proporcionales al rango de la variable Nduter. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

aparecen dos perforaciones con valores altos, y una disminucin de estos valores hacia el
Noroeste.
La manera como se comporta la raz cuadrada de las diferencias a medida que se aumentan los lag se presenta en la Figura 2.41. En terminos generales parece existir un comportamiento, del valor de la raz y de su variablidad, muy similar en las cuatro direcciones
lo que podra indicar la presencia de un proceso isotrpico. Sin embargo la direccin N-S

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

51

150

Nduter

8
6

100

Latitud

200

250

300

Diagrama de dispersin en 3D
Rotado 120

50

2
0

2
4
94

92

90

88

86

84

82

80

Longitud

Figura 2.40: Grfico en 3D de la variable Nduter. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

presenta un comportamiento que es bastante apropiado para predecir espacialmente ya que,


en esta direccin, es relativamente constante el aumento del valor de la raz as mismo como
su variabilidad.

12

90 22.5, NS

135 22.5, NOSE

lag

10
6
2

15
10
5

14

lag

square root differnece

lag

0
1

2 4 6 8

square root differnece

14
10
6
1

square root differnece

45 22.5, NESO

square root differnece

0 22.5, EO

lag

Figura 2.41: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Nduter.

Para concluir de manera preliminar, se podra decir que la variable Nduter presenta una
buena autocorrelacin espacial, y se sospecha de la presencia de un fenmeno anisotrpico.
Sin embargo llama la atencin el comportamiento de esta variable en la direccin N-S, que

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

52

difiere un poco de las otras.

2.11. Variable Neogloboquadrina pachyderma, Npach.


Esta variable est representada por un total de 979 individuos los cuales fueron encontrados en todas las perforaciones estudiadas.
La Tabla 2.12 presenta los resultados para la prueba de Moran para autocorrelacin espacial.

k
3
5
7
10
12
16

I Moran Obs.
0.12580113
0.058895187
0.020439033
-0.012753644
-0.033759689
-0.038350843

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.1026
0.1670
0.2513
0.3758
0.503
0.5433

Tabla 2.12: Resultados de la prueba de Moran, variable Npach.


De sta se concluye que, a un = 0,05 y para todas las k, se acepta Ho y se rechaza
Ha. Es decir, no existe autocorrelacin espacial en el valor de los conteos encontrados en
cada perforacin. Esta cantidad sera por lo tanto aleatoria.
Ac nos encontramos con un caso aleatorio cuando el valor de la variable es relativamente alto en comparacin a variables cuyo conteo result ser bastante bajo o similar como
el de Gcultr. Surge la pregunta de qu es lo que estara determinando este proceso aleatorio?
La Figura 2.42, margen superior izquierda, presenta la manera como estn agregados
los datos. Tanto al Noroccidente como al Sureste del rea de estudio valores altos se encuentran rodeados de bajos lo que da respuesta a lo analizado anteriormente. En la parte central
del rea parace haber cierta agregacin de valores altos, que no alcanzan a ser suficientes
para garantizar autocorrelacin espacial.
Los grficos superior derecho e inferior izquierdo muestran la ausencia de alguna tendencia de los datos en la direccin Norte-Sur y Este-Oeste. Existe ms bien cierta dispersin del valor de los datos. El histograma de frecuencias se presenta con un sesgo hacia la
derecha, con un mayor nmero de perforaciones con conteos de individuos entre 20 y 40.
La Figura 2.43 presenta la manera como las magnitudes de los conteos estn distribudos en el espacio. Esta confirma lo analizado anteriormente, donde los valores mayores,
intermedios o bajos estn distribudos de manera aleatoria, a excepcin de algunos sectores
como el Sureste y la central, sin embargo, no se presenta de manera considerable, una clara
agregacin de valores similares .

Coord Y

53

2
4

94

92

90

88

86

84

82

20

40

60

80

100

data

20

40

data

Frequency

60

80

15

100

X Coord

10

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

20

40

Coord X

60

80

100

data

Figura 2.42: Grficos para Npach. Los colores rojo, amarillo, verde y azul indican la magnitud

2
4

Coordenada Y

decreciente en el nmero de individuos encontrados en las perforaciones.

94

92

90

88

86

84

82

Coordenada X

Figura 2.43: Tamaos proporcionales al rango de la variable Npach. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

La Figura 2.44 presenta la manera como se distribuyen espacialmente los datos de


Npach. En la regin Sureste se presenta una pequea agregacin, no muy clara en los otros
grficos, pero que no basta para garantizar autocorrelacin espacial. Bien al Norte se encuentra una perforacin con valores elevados. Al Noroccidente los valores intermedios se
encuentran rodeados de valores ms bajos y en la parte central del rea se presentan dos
perforaciones con valores relativamente altos.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

54

60
6
4

Npach

8
40

Latitud

80

100

Diagrama de dispersin en 3D
Rotado 120

20

2
0

2
4
94

92

90

88

86

84

82

80

Longitud

Figura 2.44: Grfico en 3D de la variable Npach. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

8 10
6
4
2

90 22.5, NS

135 22.5, NOSE

lag

6
4
2

8
6
4
2

lag

square root differnece

lag

0
1

square root differnece

8
6
4
2
1

square root differnece

45 22.5, NESO

square root differnece

0 22.5, EO

lag

Figura 2.45: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Npach.

En la Figura 2.45 el valor de la raz cuadrada de las diferencias y su variabilidad no


muestran cambios constantes a medida que aumentan los lags. Una situacin un poco excepcional se presenta en la direccin NE-SO donde a medida que aumentan los lags, se
percibe una relativa constancia en tal valor. Sin embargo no es satisfactorio ste comportamiento mientras se busque autocorrelacin espacial.
Para Npach se concluye una ausencia de autocorrelacin espacial, es decir, parece ser

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

55

que la cantidad de individuos encontrados en cada perforacin corresponde a un proceso


netamente aleatorio o lo que ser llamado posteriormente efecto pepita.

2.12. Variable Pulleniatina obliquiloculata, Pobliq.


Pobliq es una variable representada en el rea de estudio por un total de 110 individuos
encontrados en 26 de las 31 perforaciones.
La Tabla 2.13 presenta los resultados de la prueba de Moran para autocorrelacin espacial.

k
3
5
7
10
12
16

I Moran Obs.
0.06817516
0.050900703
0.106781948
0.038202988
0.040742165
0.053039873

E[I]
-0.03333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333
-0.033333333

Varianza
0.01578069
0.009116604
0.006435068
0.004229924
0.003304631
0.002131213

Valor p
0.2095
0.1888
0.04035
0.1357
0.09877
0.03067

Tabla 2.13: Resultados de la prueba de Moran, variable Pobliq.


De ella se concluye que se acepta Ho a un = 0,05 y para k=3, 5, 10 y 12. En otras
palabras, a estos k y a este nivel de significancia, el proceso es netamente aleatorio. Sin embargo para k=7 y 16 no existen evidencias estadsticas para pensar en lo mismo. Se creera
en lo contrario; en un proceso de autocorrelacin espacial a dos diferentes distancias. No
obstante esto, los valores del I observado son tan cercanos a cero que la autocorrelacin
espacial sera bastante dbil.
La Figura 2.46 muestra en el grfico superior izquierdo la alternancia de colores, lo que
representa una manifestacin de autocorrelacin espacial.
El grfico superior derecho muestra la ausencia de tendencia de los datos cuando son
analizados en la direccin N-S. El valor de los datos oscila, en su gran mayora, entre 0
y 8 especmenes. El grfico inferior izquierdo presenta un comportamiento similar a la direccin N-S. El histograma de frecuencias indica cmo aproximadamente la mitad de las
perforaciones tienen valores de entre 0 y 2 individuos, seguido por las perforaciones con
especmenes entre 4 y 6.
De la Figura 2.47 obsrvese la manera en que los crculos ms grandes estn cercanos
a crculos ms pequeos. Al Sur y extremo Este de la zona se encuentran perforaciones con
valores o muy bajos o cero, sin embargo esta grfica no muestra claramente estos comportamientos.
La Figura 2.48 presenta de manera mucho ms clara la relacin espacial de los datos
para esta variable. Obsvese cmo al Sureste valores de magnitudes intermedias estn

Coord Y

56

2
4

Y Coord

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

94

92

90

88

86

84

82

10

12

14

data

8
6
0

data

Frequency

10

10

12

12

14

14

X Coord

94

92

90

88

86

84

82

Coord X

10

12

14

data

Figura 2.46: Grficos para Pobliq. Los colores rojo, amarillo, verde y azul indican la magnitud

2
4

Coordenada Y

decreciente en el nmero de individuos encontrados en las perforaciones.

94

92

90

88

86

84

82

Coordenada X

Figura 2.47: Tamaos proporcionales al rango de la variable Pobliq. A mayor tamao de la circunferencia, mayor es la magnitud del conteo. Ntese que las circunferencias con menor tamao
corresponden a perforaciones sin datos.

rodeados de valores demasiado pequeos o nulos. Al Noroccidente se observa la presencia de valores fluctuando entre valores intermedios y algunos bajos. La manifestacin de
la ausencia de autocorrelacin espacial para k pequeos es debido posiblemente a las relaciones de sus vecinos ms prximos, como se concluye de la analizado inmediatamente
anterior. Sin embargo, los valores intermedios que estn a distancias intermedias y grandes
si pueden tener cierta autocorrelacin como se observa de esta grfica y como lo sugiere la
prueba del I de Morn.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

57

8
6
8
6
4

Latitud

Pobliq

10

12

14

Diagrama de dispersin en 3D
Rotado 120

2
0
2
0

4
94

92

90

88

86

84

82

80

Longitud

Figura 2.48: Grfico en 3D de la variable Pobliq. Los colores rojos indican aquellas perforaciones
ms cercanas y los negros, las ms lejanas.

La Figura 2.49 muestra la manera como la raz cuadrada de las diferencias cambia para
cada una de las cuatro direcciones en la medida que se vara el lag. De manera general para
las cuatro direcciones, se observa la no constancia del cambio en el valor de la raz cuadrada de las diferencias a medida que se cambia de lag. De igual manera es la expresin de
la variabilidad de las mismas. Esta parece aumentar o disminur de forma aparentemente
aleatoria. Es posible que ante la presencia de una posible autocorrelacin espacial, como se
dedujo de la prueba del I de Morn, exista un proceso de carcter anisotrpico.
Y para concluir con el anlisis exploratorio de esta variable, se podra resumir como una
variable con presencia de autocorrelacin espacial dbil para k=7 y 16 y ausencia la misma
para las k restantes. Para los primeros se podra presentar procesos anisotrpicos dado el
comportamiento del valor y la variabilidad de la raz cuadrada de las diferencias.

2.13. Conclusiones y dudas preliminares.


Todo el anlisis exploratorio anterior de cada una de la variables no tena si no un slo
objetivo y era la bsqueda de la presencia de la autocorrelacin espacial en el valor del conteo de cada especie en el total de las perforaciones. Pero y por qu esto es importante? La
prediccin espacial, como se tratar en el prximo captulo conlleva a predecir el atributo
Z() en lugares no muestreados Z(so ), que para nuestro propsito significara encontrar el
nmero de individuos que se esperaran encontrar bajo una supuesta perforacin en un sitio
donde no se ha hecho. Pero para lograr esto adecuadamente es necesario conocer bien la
forma como los datos se autocorrelacionan espacialmente ya que de ello depende el error
de prediccin. De ah que si los datos estn correlacionados y se ignoran estas correlaciones

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

3
2
1

90 22.5, NS

135 22.5, NOSE

lag

2
1
0

3
2
1

lag

square root differnece

lag

0
1

square root differnece

3
2
1
1

square root differnece

45 22.5, NESO

square root differnece

0 22.5, EO

58

lag

Figura 2.49: Box plot de la raz cuadrada de las diferencia vs. cada lag en cuatro direcciones
diferentes para Pobliq.

cuando se hacen predicciones, el predictor sera menos eficiente (Schabenberger, 2000).


Es importante, por tal, agrupar en grados de autocorrelacin espacial las variables analizadas en la precedentes secciones. Ello podra llegar a dar una muy buena idea hasta de
la forma en que se relacionan entre s las 12 variables analizadas y planteara en principio
dudas, y en el mejor de los casos, de ser posible, hiptesis ambientales del por qu de esas
relaciones.
De las secciones precedentes se agrupan las variables analizadas segn su grado de autocorrelacin espacial individual de la siguiente manera:
I

Las variables Gcultr, Globorotalia cultrata y Nduter, Neogloboquadrina dutertrei, presentaron una fuerte autocorrelacin espacial para cada uno de los k. La primera con
un considerable nmero menor de individuos present una ms fuerte autocorrelacin
como lo indican los mayores valores observados para I sobre Nduter. Gcultr muestra
un aumento en el valor de los conteos desde el Sureste hacia el Noroccidente, mientras que Nduter presenta exactamente lo contrario. Tienen que ver acaso las diferentes
condiciones ambientales de la Cuenca de Panam en esta distribuccin?. La presencia
de una especie inhibe a la otra? cul ha sido el verdadero papel de la lnea de disolucin
para estas especies? son preguntas que se plantean ante estos resultados.
Martnez y Bedoya (2001) menconan la existencia de dos sistemas de surgencia, es decir desplazamientos ascendentes de las aguas marinas con alta productividad biolgica,
asociado cada uno a cadenas trficas diferentes. Las cadenas trficas diferentes implican que cada sitio de surgencia posee unas caractersticas ecolgicas particulares donde
las condiciones ambientales favorecen a unos seres mientras que a otros no. Ello podra
constiturse en la explicacin del comportamiento de cada una de estas especies.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

II

III

59

Las variables Gbull, Globigerina bulloides, Ouniv, Orbulina universa, Gsipho, Globigerina siphonifera, Gruber, Globigerinoides ruber, Gsac, Globigerinoides sacculifer
y Pobliq Pulleniatina obliquiloculata presentan una dbil autocorrelacin espacial dado sus bajos valores en el I observado de Moran. Las dos primeras especies tienen sus
mayores valores hacia el Sureste mientras el resto los presentan hacia el Noroccidente.
Se agrega que algunas de estas especies no presenta autocorrelacin para todos los k.
Es el caso de Gsipho, Gsac, Ouniv y Pobliq.
Las variables Gglut, Globigerinita glutinata, Ginfl, Globorotalia inflata, Gtumi, Globorotalia tumida y Npach, Neogloboquadrina pachyderma son especies que no reportaron
autocorrelacin espacial, es decir, el hecho de encontrar un valor u otro en una perforacin dada no est determinado por el valor encontrado en otro; el proceso en este
caso sera completamente aleatorio. Ahora, cul es el significado ambiental de una variable aleatoria? son especies que se adaptan a distintas condiciones ecolgicas? o estn
tan restrigidas que el valor total del conteo se concentra en unas pocas perforaciones?

La Figura 2.50 corresponde a la matriz de dispersin para el nmero de individuos


contados de cada especie en las distintas perforaciones. Con esta se pretende ver de manera
grfica el grado de correlacin en la cantidad de especmenes encontrados entre las diferentes especies. Ella no aporta informacin espacial en la medida que aunque cualifica el
grado de correlacin no da informacin acerca de la manera como estn distribudos los
datos.
Del grfico se observa que Gbull no presenta una correlacin marcada con ninguna de
las otras especies. Sin embargo con Ouniv se percibe una leve correlacin positiva. Es decir,
a medida que se aumenta la cantidad de individuos de Ouniv encontrados en las perforaciones se aumenta ligeramente los valores de Gbull.
Gsipho muestra una correlacin directa con Gruber, Gglut, Gcultr y Pobliq e inversa
con Nduter. La relacin inversa se interpreta como que mientras se percibe un aumento o
disminucin en la cantidad de individuos de una especie, en la otra se da una disminucin o
aumento respectivamente de dichas cantidades. Ahora, esto tendra una interpretacin ambiental que agregado a la variabilidad espacial dara una visin mucho ms completa del
problema.
Gruber presenta correlaciones directas con Gsac, Gglut, Gcultr e inversa con Nduter y
Npach. Gsac muestra correlaciones directas con Gglut, Gcultr y Pobliq, mientras que inversa con Nduter y Npach.
Ouniv muestra una correlacin directa pero no muy fuerte con variables como Gglut,
Gcultr. Gglut muestra una correlacin directa con Gcultr e inversa con Nduter. Gcultr una
relacin inversa con Nduter. Ginfl, Gtumi y Pobliq no presentan relaciones claras con las
otras variables.

CAPTULO 2. EXPLORACIN GRFICA DE LOS DATOS Y EL I DE MORAN

20

20

40

50

250

8
80

60

Gbull

60

Gsipho

20

Gruber

Gsac

20

Ouniv

0 60

Gglut

40

Gcultr

15

Ginfl

250

Gtumi

100

50

Nduter

20

Npach

Pobliq

80

60

0 60

15

20

100

Figura 2.50: Matriz de dispersin para el nmero de individuos contados de cada especie en las
distintas perforaciones.

A manera de conclusin, groso modo, de la Figura 2.50 se observa que Gcultr y Gglut
presentan en su mayora correlaciones directas. Ginfl, Gtumi y Pobliq no presentan correlaciones con ninguna de las otras especies y Nduter y Npach frecuentemente presentan
relaciones inversas.

Captulo 3

Qu seramos sin la Prediccin? El


Semivariograma y el Kriging
El captulo anterior se centr en el anlisis exploratorio de los datos con el objeto de
encontrar indicios de autocorrelacin espacial en la cantidad de individuos encontrados en
las 31 perforaciones para cada una de las distintas especies de foraminferos. A esto subyacen otros objetivos, como el de lograr saber cul ser el valor de la cantidad de especies
que se podra encontrar en diferentes sitios que no se hayan perforado. A continuacin se
desarrollar una teora bsica que permite llevar a cabo los objetivos propuestos.

3.1. La estacionaridad y la isotropa


La estacionaridad es una propiedad de auto replicacin de un proceso estocstico e
implica la poca importancia que tiene sobre ella las coordenadas de un rea de estudio cualesquiera. Ella implica que el campo aleatorio sea similar en diferentes partes de el dominio
D. Existen tres importantes clases de estacionaridad; la estricta, la de segundo orden y la
intrnseca (Schabenberger y Pierce, 2002).
La estacionaridad estricta implica que:
Pr(Z(s1 ) < z1 , ..., Z(sk ) < zk ) = Pr(Z(s1 + h) < z1 , ..., Z(sk + h) < zk )

(3.1)

y significa que la distribucin espacial no vara, es invariante, bajo el cambio de coordenadas mediante un vector h. Es decir, la distribucin no cambia cuando paso de un lugar a
otro dentro del campo aleatorio en la direccin y magnitud de un vector distancia h. Si las
coordenadas se rotan o se reproyectan la distribucin espacial permanece igual (Schabenberger y Pierce, 2002).
Los dos restantes tipos de estacionaridad son definidos a partir de los momentos de Z(s).
La estacionaridad de segundo orden se da si el campo aleatorio cumple con la condicin
de que E[Z(s)] = y Cov[Z(s), Z(s+h) = C (h). Ella significa que el valor esperado de
Z(s) no depende del punto dentro del campo aleatorio donde se encuentre la variable aleatoria y la covarianza entre dos observaciones cualesquiera slo depende de la distancia, h, que
las separa (Schabenberger y Pierce, 2002)
61

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

62

El concepto de estacionaridad de segundo orden lleva implcito el concepto de isotropa


mencionado en captulos anteriores. La isotropa es la propiedad que tiene un campo aleatorio de permanecer invariante en sus propiedades cuando se analiza en diferentes ngulos y a
diferentes direcciones. En contraste con este concepto se da el de anisotropa en el cual el
valor esperado es constante en todas las direcciones, pero cambia de magnitud para alguna
de ellas y la funcin de covarianza depende no slo de la distancia euclidiana, h, sino que
vara segn la direccin que sea analizada.
La estacionaridad intrnsica se presenta cuando un campo estacionario tiene las siguientes caractersticas: E[Z(s)] = y

1
Var[Z(s) Z(s+h)] = (h)
2

(3.2)

(h), analizada en la prxima seccin, es llamada el semivariograma de Z(s) y es una


funcin, fundamental al momento de analizar las caractersticas espaciales de una variable.
Ella, como se concluye de la ecuacin 3.2, depende slo de la distancia euclidiana, h, que
separa dos observaciones y si su comportamineto es igual en todas las direcciones analizadas, el proceso sera nuevamente isotrpico.
El por qu de los elementos tericos generales expuestos anteriormente radica en el
hecho de que nos encaminamos hacia la prediccin. Para ello es necesario conocer la estructura espacial de los datos, es decir, conocer la manera como varan en la distancia y en
la direccin, determinar posibles autocorrelaciones entre otros aspectos.

3.2. El semivariograma: sus partes y modelos para su estimacin


3.2.1.

Generalidades del semivariograma

Suponer que
Var(Z(s1 ) Z(s2 )) = 2(s1 s2 ),

(3.3)

para todo s1 , s2 D.
La cantidad 2(), la cual es funcin solamente del incremento s1 s2 ha sido llamada
variograma y la cantidad 2() llamada semivariograma. Si esta funcin existe debe ser
tratada como un parmetro del proceso aleatorio Z() (Cressie, 1991).
El-Sheimy(1999), modificado para compatibilizar la nomenclatura, define la semivarinza para puntos que se encuentran igualmente, o regularmente, espaciados como:

N(h)
1 X
(h) =
(Zs Zs+h )2
2N(h)
i=1

(3.4)

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

63

Donde:
zs es la medicin de la variable obtenida en la localizacin s
zs+h es otra medicin de la variable pero obtenida a una distancia h de s
N (h) es el nmero de puntos encontrados a un lag o distancia h.
Si el muestreo no ha sido regular, como es nuestro caso, es decir sin un espaciamiento
sistemtico en el mismo, es posible que el variograma cambie para cada direccin . De esta
manera surgen los variogramas direccionales que define la variacin entre puntos separados
por un espacio lag h. Estos difieren de los semivariogramas omnidireccioneles en que ya h
no es un escalar sino un vector (El-Sheimy, 1999).
Adicional a lo anterior para datos espaciados irregularmente, se tiene un nmero de
pares en cada lag que pueda ser pequeo, en donde en el caso ms extremo cada lag tiene
slo un par de puntos. Para resolver este problema se combinan lags en clases de lag. Una
clase de lag, contiene, como se mencion en el captulo anterior todos los puntos a una
distancia ||h|| ||h|| de s o lo que es lo mismo i, y si la anisotropa es analizada, se debe
tener en cuenta el ngulo de clase (Schabenberger, 2000).
La semivarianza en palabras equivale a decir que es el promedio de las diferencias
cuadradas entre todos los pares de puntos que se encuentren separados a una distanacia
h y en una direccin particular dado el caso de anisotropa. Sin embargo, El-Sheimy (1999),
redefine sta en otros trminos un poco diferentes a los vistos.
Modificada ligeramente la nomenclatura por el autor de esta monografa para evitar
confusiones, El-Sheimy redefine la semivarianza como:

(h) =

N(h)

1
2N(h)

(Zs Zs+h )

i=1

(Zs Zs+h
N(h)

(3.5)

Si Z(s) es estacionaria de segundo orden, la media sera invariante con la posicin y por tal
el segundo trmino del lado izquierdo de la ecuacin 3.5 tendra la siguiente propiedad:
Zs
Zsh

=0
N(h) N(h)

(3.6)

Este mismo autor sugiere que si la media cambia con la distancia, es decir, que el proceso
no es estacionario, la ecuacin 3.6 no sera igual a cero y por lo tanto la ecuacin 3.5 debera
ser modificada.
La Figura 3.1 muestra las partes en las que est compuesto un semivariograma clsico
idealizado.
Cuando se aplica la ecuacin 3.4 a los datos se obtiene el denominado semivariograma
experimental que es el resultado de unir cada punto mediante una lnea curva. Cada punto
representa realmente el nmero de pares de puntos que se encuentran a una distancia h. El
lag, o distancia de separacin entre localizaciones muestrales, h, se da sobre el eje x. La
semivarianza, (h), en cada lag se localiza en el eje y. La Figura 3.1, muestra como en

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

64

4
bc

3
2

Rango

(h)

bc
Dependencia
Espacial

bc

Sill

1o bc
Varianza Nugget

0
0

Lag(h)
Figura 3.1: Partes del Semivariograma: En el eje y est la Semivarianza, en el eje x los diferentes
lags incrementados una distancia h, el Sill o meseta, el Rango, la Varianza Nugget o efecto pepita, y
la regin donde se da la dependencia espacial. Los crculos seala el valor de la semivarianza para
un nmero determinado de pares de nmeros separados una distancia h.

cierto sector de ella la semivarianza se incrementa mientras cada lag aumenta hasta llegado
un punto en el cual se estabiliza.
El sector en el cual se da una dependencia espacial, es tambin llamado la parte estructural del semivariograma. Cuando se logra estabilidad en la semivarianza se llega al punto
mximo de la misma. Esta cantidad es llamada el Sill o Meseta y el Rango se define como
la distancia a la cual se alcanza el Sill, es decir, la distancia despus de la cual el nmero de
pares de puntos en cada lag no presentan dependencia espacial.
Las observaciones que estn separadas a una distancia mayor que el Rango no estn correlacionadas. La autocorrelacin espacial existe solamente para pares de puntos separados
una distancia menor que el Rango (Schabenberger y Pierce, 2002). De ah la importancia de
este valor, ya que como veremos adelante la interpolacin Kriging se basa en esta distancia
para ponderar cada observacin y predecir en un sitio no muestreado.
De la Figura 3.1 se observa que el intercepto en el eje y del semivariograma a una distancia ||h|| = 0 no es (h) = 0, es decir, (h) o 6= 0 cuando ||h|| 0 (Schabenberger
y Pierce, 2002). Estos autores se plantean la pregunta del cmo se puede tener una varianza
positiva de las diferencias de las observaciones localizadas en el mismo lugar?. La respuesta a esta pregunta se responde de dos maneras. La primera, que ello es debido a que una
medida en un mismo punto no puede ser realizada sin error e2 y la segunda, la ms fuerte,
que existe un proceso espacial (s) operando a distancias ms cortas que el lag ms pequeo
observado y que este proceso que se da a una escala ms pequea que la estudiada tiene un
Sill 2 . Es decir, si las mediciones en el error y el proceso a microescala son independientes,
entonces:

o = e2 + 2

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

65

Ahora, si ninguno de los trminos de la ecuacin anterior es cero se tiene lo que se


conoce en Efecto Nugget o Pepita o Varianza Nugget.
No todos los semivariogramas presentan las mismas propiedades que el descrito anteriormente. Existen otras formas de semivariogramas que se pueden encontrar en la prctica,
algunos de ellos se presentan el la Figura 3.2 (www.stress.swan.ac.uk/-modificada).
En ella se incluyen adems los siguientes semivarogramas (www.stress.swan.ac.uk/):
Semivariogramas peridicos. Es tpico de propiedades que muestran una caracterstica espacial que se repite de manera peridica.
Semivariogramas no espaciales. Estos indican que no hay una estructura espacial en
la variable o propiedad de inters.
Semivariogramas de multifrecuencia. Indicativo de un proceso o procesos que ests
operando en diferentes escales espaciales.

3.2.2. Modelos de ajuste


Schabenberger y Pierce (2002), sealan que la estimacin del semivariograma por mtodos estadsticos paramtricos requieren de la seleccin de un modelo (h; ) que est ajustado a los datos. es un vector de parmetros que debe ser estimado de alguna manera.
Existen dos mtodos corrientes de estimacin de estos parmetros; el mtodo por mnimos
cuadrados y el mtodo por mxima verosimilitud. La estimacin de por el mtodo de
mnimos cuadrados ordinarios se encuentra minimizando las desviaciones cuadradas entre el semivariograma emprico o experimental y el semivariograma terico. La estimacin
por el mtodo de mxima verosimilitud se halla minimizando l(, ; z(s)) e implica el
conocimiento de la distribucin de los datos, cosa que no es necesaria mediante mnimos
cuadrados.
Los modelos de ajuste descritos a continuacin son los ms comunues para espacios
bidimensionales. De ellos se indicar su expresin matemtica, pero un anlisis detallado
de los mismos est por fuera de los objetivos de este trabajo.

Modelo Nugget: Este modelo corresponde al semivariograma de un proceso ruido blanco, donde los Z(si ) tienen la misma media y varianza y sin correlacin entre ellos. Su
expresin matemtica es (Schabenberger y Pierce, 2002):

(h; s ) =
II

0, si h = 0
s , si h 6= 0

(3.7)

Modelo Lineal: Modelo que es intrnsicamente estacionario con parmetros o y los


cuales deben ser positivos. Es un modelo que puede ser til para modelar semivariogramas a distancias cercanas al origen ya que los cambios lineales en la semivarianza es

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

Peridico

66

Clsico
Aleatorio

(h)

Multifrecuencia

Lag(h)

Figura 3.2: Tipos de semivariogramas: Aunque la gama de semivariogramas es amplia, los ms


comunes son el Clsico, el Peridico, el Multifrecuencia y el correspondiente a un proceso de ruido
blanco.

bastante razonable. Su expresin matemtica es (Schabenberger y Pierce, 2002):


(
0,
si h = 0
(h; ) =
(3.8)
o + ||h||, si h 6= 0
III

IV

Modelo Esfrico: Este modelo es uno de los ms usados en estadstica espacial para
campos aleatorios estacionarios de segundo orden. Tiene dos caractersticas importante;
la primera es el comportamiento lineal cerca al origen y que a una distancia encuentra
el Sill y permanece paralelo a l. Su expresin matemtica es (Schabenberger y Pierce,
2002):

0,
si ||h|| = 0

3
||h||
||h||
(h; ) = o + s 23 12
, si 0 < ||h||

+ ,
si ||h|| >
o
s

(3.9)

Modelo Exponencial: Este se aproxima asintticamente al Sill, s cuando ||h|| .


Schabenberger y Pierce hacen nfasis en que para un mismo Sill y un mismo Rango,
el modelo exponencial asciende ms rpidamente desde el origen y reconoce autocorrelaciones espaciales en distancias ms cortas que el modelo esfrico. Una expresin
matemtica de este modelo es la siguiente (Schabenberger y Pierce, 2002):

si h = 0
0,

3||h||
(h; ) =
(3.10)
o + s 1 e
, si h 6= 0
Modelo Gaussiano: Este modelo presenta un comportamiento cuadrtico cerca al origen y muestra correlaciones en Rangos pequeos. Su funcin matemtica es la siguiente
(Schabenberger y Pierce, 2002):

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

(h; ) =

VI

0,

o + s

67

si h = 0
(

1e

||h|| 2
3

, si h 6= 0

(3.11)

Modelo de Onda (Wave Model): Este modelo permite solamente autocorrelaciones


positivas. Esto significa que dentro del Rango un valor Z(s) grande o pequeo, est
probablemente pareado con un valor grande o pequeo respectivamente en Z(s+h)(Schabenberger
y Pierce, 2002). Este modelo se utiliza para ajustar variogramas con comportamientos
peridicos, es decir, variogramas donde las autocorrelaciones se estn repitiendo cada
determinado lag. Una funcin matemtica para este modelo se enuncia a continuacin:

(h; ) =

0,

n

o si h = 0
||h||
o + s 1 sin /||h||
si h 6= 0

(3.12)

Dentro de una amplia gama de modelos para ajustar variogramas, los anteriores son los
ms usuales. En general lo que se busca es ajustar al semivariograma emprico el mejor
modelo de entre los posibles a aplicar. Ellos buscan estimar el Rango y Sill para determinar de manera inicial, cul es la distancia a la cual los datos presentan correlacin
espacial y dar el paso siguiente; la prediccin.

3.3. El Kriging: la prediccin


Kriging es un mtodo de prediccin espacial que normalmente depende de las caractersticas de estacionaridad de segundo orden de Z(s). Su nombre fu dado por Matheron
en honor al ingeniero D.G. Krige, el cual desarrollo en la dcada de los 50 mtodos empricos para determinar distribuciones exactas del oro a partir de distribuciones muestrales
(Cressie, 1991). Kriging, recalca Cressie, es sinnimo de prediccin ptima cuyo objetivo
es realizar inferencias sobre valores que no han sido observados a partir de datos muestrales.
Partiendo de la presuncin de estacionariedad de la variable a estudiar y de un modelamiento adecuado del semivariograma, las estimaciones realizadas mediante Kriging, resultan ser las mejores estimaciones linales insesgadas. Adicionalmente, los procediemientos
realizados mediante Kriging, involucran medidas de error e incertidumbre cuando se hacen
tales estimaciones. Basndose en el semivariograma que se haya usado, el mtodo de Kriging permite hallar los pesos ptimos para los valores conocidos, a partir de los cuales se
hallan los desconocidos (El-Sheimy, 1999).
Una expresin general para el estimador ptimo es dada por Clark y Harper (2000). A
esta expresion se le realiz pequeos cambios en la nomenclatura con el objeto de evitar
incompatibilidades con la usada en el presente texto.
La expresin del estimador insesgado es la siguiente (Clark y Harper, 2000):

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

Z(so ) =

m
X

wi Z(si ) +

i=1

m
X

wi

i=1

68

(3.13)

Donde:
Z(so ) corresponde a la observacin a ser estimada, localizada en so .
Z(si ) es el valor, conocido, de una observacin en si .
wi indica el peso asignado a cada observacin.
es la media poblacional comnmente desconocida.
La varianza de la estimacin realizada por este estimador es:

2 = 2

m
X

wi (Z(si ), Z(so ))

m
m X
X

wi wj (Z(si )Z(sj )) (Z(so )Z(so ))

(3.14)

i=1 i=1

i=1

Los pesos, w, se encuentran resolviendo las ecuaciones:


m
X

wj (Z(si ), Z(sj )) = (Z(si ), Z(so ))

(3.15)

j=1

para i = 1, 2, 3, , m. Para hallar estos pesos es necesario resolver m ecuaciones para m


pesos. Una de esa ecuaciones sera de la forma:

w1 (Z(si , Z(s1 )) + w2 (Z(si , Z(s2 )) + + wm (Z(si , Z(sm )) = (Z(si ), Z(so ))


(3.16)
Existe una gran variedad de Kriging que depende de si se conoce o no la media, del nmero
de atributos, de la distribucin de Z(s), de si la media es constante en el campo aleatorio o
no y de si el predictor es lineal o no. Esta variedad implica cambios en las ecuaciones que
se ajusten a las caractersticas de los datos y de la geometra del campo aleatorio.
Segn lo anterior se tiene entonces una serie de nominaciones como: Kriging Simple, Kriging Ordinario, Kriging Universal, Kriging Indicador, Kriging Bayesiano, Cokriging, etc.

3.4. A la prctica: semivariogramas, ajustes e interpolaciones


En esta seccin se har un anlisis de los distintos semivariogramas direccionales de aquellas especies de forminiferos de la Tabla 1.1. De ellas se har un anlisis detallado para
aquella que muestre isotropa y cuya estacionaridad de segundo orden sea sospechada. El
semivariograma emprico de la misma ser sometido a un ajuste por diferentes modelos con
el objeto de hallar el mejor a partir del cual se estimarn los parmetros necesarios para lograr el objetivo final; la interpolacin lineal de la variable mediante kriging. De ser posible

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

69

se har una interpretacin ecolgica de la misma con los resultados obtenidos.


La Figura 3.3 muestra el semivariograma para las cuatro primeras varibles de la Tabla 1.1.
Semivariogramas Gshipo

10
0

distance

Semivariogramas Gruber

Semivariogramas Gsac

150
100

semivariance

400
0

0
45
90
135

200

0
45
90
135

800

distance

50

1200

semivariance

0
45
90
135

semivariance

600

1000

0
45
90
135

0 200

semivariance

15

Semivariogramas Gbull

distance

distance

Figura 3.3: Semivariogramas direccionales Gbull, Gsipho, Gruber y Gsac. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.

En esta figura se muestra como se pueden representar diferentes semivariogramas de acuerdo a la direccin que se requiera analizar. El anlisis en las cuatro direciones se hizo sobre
la base del anlisis exploratorio que se hizo en el captulo anterior, en donde la gran mayora
de las variables mostraba un comportamiento diferente en la diferencia de la raz cuadrada
para los diferentes lags y las distintas direcciones.
Las especies Gbull, Gsipho, Gruber y Gsac muestran de manera general cambios fuertes en
los valores de la semivarianza para cada una de las direcciones. Gbull presenta una semivarianza bastante alta para distancias pequeas en las direcciones de 135o y 90o y altas para
direcciones de 45o y 0o . Lo esperado, lo ideal, es el aumento constante de la semivarianza
a medida que aumenta la distancia, sin embargo, ac tenemos un caso particular donde la
semivarianza flucta entre altos y bajos para cada direccin a medida que aumenta la distancia. La direccin 0o , N-S, tiene un comportamiento un poco diferente; semivariaza alta para
distancias cortas y disminucin considerable de la misma despus de distancias mayores de
5o . En esta direccin es donde se presenta menor variabilidad. Esto podra indicar que la
presencia de esta especie en la Cuenca de Panam, est determinada por posibles cambios
zonales en las condiciones ambientales de la misma que se repiten. El Sill no logra estabilizarse lo que tambin puede ser debido al posible bajo nmero de pares que se encuentran
a cada lag.
La variable Gsipho muestra una direccin, 0o , donde la semivarianza en trminos generales
aumenta a medida que aumenta la distancia. Ser esto un indicador de que las condiciones
ambientales de la cuenca cambian de tal manera que determinan la existencia de la especie
de manera ms continua que en las otras direcciones, para las cuales las fluctuaciones son

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

70

igualmente como de de Gbull?


Gruber y Gsac muestran igualmente variaciones fluctuantes en la semivarianza con la diferencia que ambas presentan para distancias pequeas semivarianzas bajas. El comportamiento de Gruber es ms homogneo en la medida que las cuatro direcciones intentan superponerse mientras que para Gsac el comportamiento es totalmente diferente en cada direccin.
Si suponemos unas condiciones ambientales fijas, por un intervalo de tiempo dado, se podra acaso decir que las especies donde la semivarianza flucta, son especies restringidas a
reas pequeas donde las condiciones son bastante homogneas pero que se repiten en otros
sectores de la cuenca, mientras que para aquellas especies donde la semivarianza aumenta
de manera constante, su adaptabilidad depende de condiciones ambientales que mucho ms
generales o en su defecto condiciones permanentes en reas grandes?, sin embargo, no se
puede perder de vista covariables como la estacional donde los efectos de los aos Nia y
Nio desempean un papel importante en la presencia o ausencia de una o varias especies.
Es importante no olvidar los resultados del captulo anterior donde estas cuatro especies
presentaron una autocorrelacin dbil y procesos de anisotropa.
La Figura 3.4, presenta los semivariogramas para las especies Ouniv, Gglut, Gcultr y Ginfl.

80
60
40

semivariance

distance

Semivariogramas Gcultr

Semivariogramas Ginfl

500

distance

300

0
45
90
135

500

1500

semivariance

0
45
90
135

100

2500

semivariance

0
45
90
135

20

10

15

20

25

0
45
90
135

semivariance

Semivariogramas Gglut

120

Semivariogramas Ouniv

4
distance

distance

Figura 3.4: Semivariogramas direccionales Ouniv, Gglut, Gcultr y Ginfl. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.

Las especies Ouniv, Gglut y Ginfl, presentan mayor irregularidad en el comportamiento


de la semivarianza de la cantidad de individuos encontrados en las distintas perforaciones.
Si bien presentan altos y bajos a medida que aumenta la distancia, la semivarianza no se
muestra fluctuante. Ms bien un comportamiento aleatorio. Recordemos los resultados para
estas variables en el captulo anterior. Ouniv mostr una autocorrelacin espacial slo para
distancias grandes, mayores de 7o , pero de manera bastante dbil y Ginfl aotocorrelacin
slo para distancias cotas, pero igualmente muy dbil. Mientras que Gglut no result ten-

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

71

er autocorrelacin espacial. Es decir, la presencia de determinada cantidad de individuos


encontrados en una perforacin cualesquiera, no tena en absoluto, ninguna relacin con
la cantidad encontrada en otras. Pero y esto acaso tiene alguna interpretacin ambiental?
Pareciera que a estos individuos les diera lo mismo estar en un sitio u otro de la cuenca.
Importante resaltar, de la Figura 3.4, la especie Gcultr. Por fin se encuentra algo no tan
excepcional que el resto analizado. Para todas las direcciones, interpretando de manera
global, la semivarianza aumenta a medida que aumenta la distancia. Esta variable result
tener la autocorrelacin ms fuerte segn la prueba de Moran para las diferentes distancias
analizadas. Sin embargo se concluy en la presencia de procesos anisotrpicos, lo que se
evidencia en la no coincidencia de los distintos variogramas direccionales. Dmonos cuenta
del comportamiento de esta variable en las direcciones, 0o y 45o , N-S y NE-SO repectivamente; en ellas los semivariogramas presentan un comportamiento similar.
Los semivariogramas para las cuatro especies restantes; Gtumi, Nduter, Npach y Pobliq se
muestran en la Figura 3.5.

Semivariogramas Nduter

6000
2000

semivariance

distance

distance

Semivariogramas Npach

Semivariogramas Pobliq

25

2500

15
10

semivariance

20

0
45
90
135

500

1500

0
45
90
135

semivariance

0
45
90
135

50

100

0
45
90
135

semivariance

150

Semivariogramas Gtumi

4
distance

distance

Figura 3.5: Semivariogramas direccionales Gtumi, Nduter, Npach y Pobliq. Las direcciones se midieron azimutalmente; 0o corresponde a N-S, 45o a NE-SE, 90o a E-O y 135o a NO-SE.

Nos enfrentamos nuevamente ac a dos tipos de semivariogramas. Aquellos correspondientes a especies cuyo nmero de individuos no conllev a alguna autocorrelacin espacial.
Ellas son Npach y Gtumi, las cuales a su vez muestran similitud en sus variogramas. Pobliq
tiene un comportamiento un poco menos catico que estas dos especies. Prueba adicional
de ello es la dbil autocorrelacin espacial que presenta esta variable. Se reconfirma la
presencia de procesos anisotrpicos al haber tan poca compatibilidad en sus diferentes variogramas.
Nduter, como Gcultr, es un caso especial donde las caractersticas del semivariograma dan
la posibilidad inmediata de aplicar la teora geoestadstica. Obsrvese como, analizando

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

72

globalmente, cada semivariograma direccional aumenta mientras aumenta la distancia, con


un comportamiento particular en la direccin N-S. Ac las preguntas formuladas anteriormente son vlidas igualmente. Esta especie no mostr procesos anisotrpicos como todas
las anteriores, sin embargo en los variograms direccionales, no se muestra con claridad sta
caracterstica.
El paso siguiente es elegir de entre las especies analizadas aquella que posea las mejores
caractersticas para la aplicacin de modelos espaciales que concluyan en la obtencin de
parmetros fundamentales para la interpolacin; el Sill, el Rango y la varianza Nugget. A
continuacin se har una breve discusin sobre la eleccin de esta especie.
De las observaciones hechas anteriomente se concluye que slo dos especies tienen, de
manera clara, la caracterstica fundamental para la aplicacin de la teora geoestadstica y
es la concerniente a la presencia de autocorrelacin espacial. Ellas son Globorotalia Cultrata, Gcultr, y Neogloboquadrina dutertrei, Nduter. La segunda caracterstica importante
despus de la autocorrelacin tiene que ver con el hecho de que la variable a estudiar debe
cumplir con el principio de estacionaridad, al menos de segundo orden, la cual implica la
constancia de la media en todo el campo aleatorio. Una tercera caracterstica es la isotropa
de la variable.
La no estacionaridad en la media y la anisotropa son dos males que pueden ser tratados
mediante transformaciones. El primero se resuelve mediante un anlisis de regresin con
miras a eliminar la variacin en los datos. Es decir, se hace un trabajo estadstico con los
residuales. La anisotropa se resuelve mediante una matriz de transformacin de las coordenadas con el objeto de hacer iguales los ejes de variacin espacial.
De las dos caractersticas mencionadas, anisotropia y no estacionaridad, Nduter, en comparacin con Gcultr, es la que ms se aleja de tenerlo. Ello se sustenta en el anlisis realizado para ambas variables en el captulo anterior, en donde se concluy en la presencia de
isotropa para la variable Nduter. La sospecha de estacionaridad de segundo orden se da a
partir de todo el anlisis exploratorio realizado en el captulo anterior. La Figura 3.6 nos
da un mayor criterio sobre este asunto.
En esta figura se observa para Gduter un ascenso rpido en el valor de la semivarianza
cuando aumenta la distancia. Diferente la mediana de la variable Nduter donde se percibe
un gradual aumento de la misma pero alrededor de un cierto valor. Igualmente las diferentes
grficos de caja para Nduter, muestra una distribucin ms uniforme de los mismos cuando
aumenta la distancia que para Gcultr. Ello indica que el nmero de pares de puntos a cada
distancia es similar, hasta en su variabiliad, que los grficos de caja para Gcultr.
El semivariograma, omnidireccional, es decir, el semivariograma que asume isotropa en el
comportamiento de esta variable, se presenta en la Figura 3.7.
Los nmeros en rojo corresponden, como lo indica la grfica, a la cantidad de pares de puntos que se encuentran a la distancia correspondiente. Si el mtodo de ajuste a utilizar es el de
mnimos cuadrados, se deben remover aquellos puntos que no cumplan con la regla de dedo
que dice que cada punto debe tener por lo menos 30 pares (Schabenberger y Pierce, 2002).
Sin embargo dado la escases de perforaciones en el rea para hacer este tipo de trabajo, se

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

Variocloud Nduter

20000
15000

classical variogram

5000

10000

3000
2000
1000

classical variogram

4000

25000

5000

30000

Variocloud Gcultr

73

11

distance

11

distance

Figura 3.6: Variocloud Gcultr y Nduter. Obsrvese el rpido ascenso de la mediana para Gcultr.

opt por dejarlos todos.

Distancia mxima= 10=1100 km

5000

6000

22

4000

41

55

3000

46

42
40

2000

Semivarianza

26
39

40

28 pares

1000

24

10

Distancia

Figura 3.7: Variograma omnidireccional Nduter. Los nmeros indican el nmero de pares de puntos
que se encontr a la distancia indicada.

Este varigrama se ajust a los modelos Gaussiano, Esfrico, Exponencial y Lineal mencionados anteriormente. La Figura 3.8 muestra el semivariograma experimental ajustado a
los modelos descritos. En el Apndice A, se presenta el cdigo en R utilizado para obtenerlos. Diferentes valores iniciales se experimentaron hasta lograr encontrar el modelo que se
ajustara mejor. A diferncia del modelo Gaussiano, los otros modelos no lograron alcanzar
un Sill y un Rango razonable.

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

74

4000
3000
2000

Semivarianza

5000

6000

Nduter, Distancia mxima= 10=1100 km

1000

M. Gaussiano
M. Esfrico
M. Exponencial
M. Lineal

10

Distancia

Figura 3.8: Modelos de ajuste al semivariograma emprico. Obsrvese que el modelo que mejor se
ajusta es el Gaussiano.

La Tabla 3.1 presenta los resultados de los parmetros encontrados con cada modelo.
Esta muestra como, a diferencia del modelo Gaussiano, los otros modelos presentan un
Sill, un Rango y una Varianza Nugget muy por encima de las condiciones reales. Por tal,
los parmetros estimados tienen los siguientes valores: V arianzaN ugget = 1525,8048,
Sill = 2778,5519 y Rango = 4,8271. Ac el Sill se encuentra por debajo de la varianza
muestral que es 3503.131.
El Rango se interpreta como el distancia a partir de la cual ya no existe autocorrelacin
espacial. De acuerdo a ello nuestro Rango, de aproximadamente 5o , implica que las cantidades de especies encontradas que estn a una distancia mayor de ella, en kilmetros, 550
aproximadamente, no presentan relacin espacial alguna.
Perfilndonos para el final, y despus de todo este recorrido, se llega a la prediccin mediante Kriging. El Apndice A presenta el programa en R utilizado para este fin.
De los diferentes tipos de Kriging, se plic el Kriging Ordinario el cual no requiere del
conocimiento de la media y es aplicable para datos geoestadsticos. Matricialmente se puede
expresar de la siguiente manera (Clark y Harper, 2000 modificado):

(Z(s1 ), Z(s1 ))
(Z(s2 ), Z(s1 ))

A=
. . . . . . . . . . .
(Z(sm ), Z(s1 ))
1

(Z(s1 ), Z(s2 ))
(Z(s2 ), Z(s2 ))
. . . . . . . . . . . . . .
(Z(sm ), Z(s3 ))
1
1

B = w1 w2 w m

(Z(s1 ), Z(sm ))
(Z(s2 ), Z(sm ))

. . . . . . . . . . .

(Z(sm ), Z(sm ))
1

(3.17)

(3.18)

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

75

models parameters estimated by WLS


covariance model is: gaussian
parameter estimates:
tausq sigmasq phi
1525.8048 2778.5519 4.8271

minimised weighted sum of squares = 73936351


covariance model is: spherical
parameter estimates:
tausq sigmasq phi
1073.6871 4055.4392 13.0445

minimised weighted sum of squares = 73483343


covariance model is: exponential
parameter estimates:
tausq sigmasq phi
846.2360 6346.3435 10.1841

minimised weighted sum of squares = 73156024


covariance model is: linear
parameter estimates:
tausq sigmasq phi
1241.581 402.194 1.000

minimised weighted sum of squares = 74054881


Tabla 3.1: Resultados de los parmetos por ajustes de modelos. Donde tausq: Varianza Nugget,
sigmasq: Sill y phi: Rango. Modelos ajustados: Gaussiano, Esfrico, Exponencial, Lineal

(Z(s1 ), Z(so ))
(Z(s2 ), Z(so ))

C=

(Z(sm ), Z(so ))
1

(3.19)

Las ecuaciones de Kriging Ordinario se expresaran como:


AB = C
B = A1 C
y por tanto el estimador se puede expresar como:
Z(so ) = BZ(si )
La varianza del la estimacin puede ser expresada como:
k o2 = BC (Z(so ), Z(so ))
La Figura 3.9 corresponde a la interpolacin Kriging. Ella es el resultado de todos estos
anlisis. El objetivo es lograr predecir el valor del nmero de especies posibles en aquellos
puntos donde no se realiz un muestreo. Ya que D representa un campo continuo, la superficie de prediccin tambin lo es. A partir de esta figura se logra tener una idea de la manera

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

76

como estuvo distribuda la especie Nduter antes de morir.


De esta figura se logran definir reas con tonalidades bastante oscuras en la parte Centro, Sur
y Oriente del rea de estudio. Se aprecia como hacia el Noroccidente se encuentran zonas
muchos ms claras, indicando la posibiliad de encontrar valores bajos en esta especie. Representan acaso estas concentraciones ambientes propicios para la vida de esta especie?, qe
sucede o sucedi hacia el Norte ms extremo y hacia el Noroccidente para que esta especie
se encuentre en pocas cantidades?.
Martnez y Bedoya (2001) indican que hacia el Noroccidente de la Cuenca de Panam la
competencia ecolgica de Gcultr excluye a Nduter, explicando el comportamiento estadstico de los datos para estas dos especies.
La Figura 3.10, presenta la varianza de la prediccin de la informacin de la Figura 3.10.
Colores rojos intensos significan una varianza de prediccin baja con repecto a otros sitios.
Es decir, al comparar punto a punto o rea a rea entre estas dos figuras se puede tener una
idea de la precisin con la que se predijo. Los valores anaranjados corresponden a niveles de
precisin intermedias y los amarillos a niveles bastante bajos. En la direccin N-S el nivel
de precisin permanece relativamente alto y constante. Situacin contraria en la direccin
E-O, donde la cantidad de perforaciones fu menor.

10

Prediccin espacial Nduter

Latitud

100 150 200 250

95

90

85

80

Longitud

Figura 3.9: Imagen de interpolacin Kriging Ordinario de Nduter. Tonos de grises oscuros y claros
indican un nmero alto o bajo, respectivamente, del nmero de individuos que se espera encontrar
en caso de una perforacin.

De todo este trabajo permanecen inquietudes de tipo estadstico y ecolgico, pero sobre ello
el intento de aplicar una metodologa de trabajo a este tipo de informacin. El recorrido es
largo y se espera corregir las inmensas imperfecciones, en esas dos perspectivas, de este

CAPTULO 3. LA PREDICCIN: EL SEMIVARIOGRAMA Y EL KRIGING

77

10

Varianza de la prediccin, Nduter

Latitud

500 10001500200025003000

95

90

85

80

Longitud

Figura 3.10: Imagen de la varianza de la prediccin de la variable Nduter. Rojos ms intensos


indican valores ms bajos en la varianza de la prediccin. Colores amarillos varianzas altas en la
prediccin

trabajo. La integracin entre los dos puntos de vista, para nuestro caso la ecologa y la estadstica, pero en otros, la geografa y la estadstica u otra combinacin, no puede caer en la
carreta. Es necesario hacer un esfuerzo para poderlo lograr, porque s que pocas personas lo
saben. Es mi deseo lograr descubrir realidades ocultas con herramientas como la estadstica
y la observacin, pero s, reafirmando lo anterior, que puede resultar desalentador y a veces
infructuoso.

Captulo 4

Conclusiones y Recomendaciones
1. Las especies Gcultr y Nduter, fueron las nicas que mostraron una alta autocorrelacin espacial. Es decir, que la cantidad de individuos encontrados en una perforacin, para una especie dada, est en estrecha relacin con la cantidad encontrada
en otras perforaciones.
2. Las especies Gbull, Gshipo, Gruber, Gsac, Ouniv, Ginfl y Pobliq, presentaron autocorrelacin espacial dbil. Poniendo en duda la relacin que pueda existir entre las
cantidades de individuos encontrados en cada perforacin
3. Las especies Gglut, Gtumi y Npach, no mostraron autocorrelacin espacial. En otras
palabras, el hecho de encontrar una determinada cantidad de individuos de una especie en una perforacin es puramente aleatorio, puro efecto pepita.
4. A excepcin de la especie Nduter, todas las otras mostraron procesos anisotrpicos.
Procesos en los cuales la cantidad de individuos de una especie en la zona de estudio,
es diferente segn la direccin de anlisis.
5. Los datos exploratorios indicaron concentraciones de individuos de algunas especies
en la parte Noroccidental o Sureste, con un predominio de la primera. Ejemplo de
ello las variables Gcultr y Nduter que presentaron concentraciones inversas. Es decir, mientras que la primera presentaba grandes cantidades de individuos en la zona
Noroccidental, la segunda los tena en la zona Sureste.
6. Los semivarigramas direccionales son una importante herramienta de anlisis espacial
por cuanto ellos son una radiografa clara de la variabilidad espacial de los datos.
7. El modelo que mejor se ajust al semivariograma de la variable Nduter fu el Gaussiano. El cual estim el Rango en aproximadamente 5o , 550 kilmetros. Ello implica
que esa es la distancia mxima a la cual los datos dependen entre s.
8. Desde la perspectiva de la autocorrelacin es mucho ms importante la manera como
los datos estn distribudos en el espacio que la misma cantidad de datos disponibles.
9. El grado de presencia de una especie en un rea determinada est intimamente relacionada con las condiciones ambientales de la Cuenca de Panam. Por ello, la exploracin de variables ambientales como la temperatura superficial de las aguas marinas,
las direcciones de las corrientes,la salinidad, etc. sera un gran complemento a este
78

CAPTULO 4. CONCLUSIONES Y RECOMENDACIONES

79

trabajo por cuando llevara a un mayor entendimiento de la distribucin de las especies.


10. La geoestadstica result ser una herramienta que reflej de manera apropiada las
caractersticas espaciales de las especies analizadas.
11. Se requiere de un anlisis ms profundo de muchas de las variables ac estudiadas.
Se debe analizar la anisotropa y la no estacionaridad de las mismas y buscar modelos
adecuados para su comprensin.
12. Para el estudio multivariado se recomienda la aplicacin de cokriging para tener un
panorama ms amplio de la interrelacin entre las variables estudiadas.
13. El software R y sus paquetes de estadstica espacial son una herramienta de gran
utilidad para generar informacin espacial.
14. Es de gran importancia la investigacin y el fomento de la estadstica espacial en la
universidad dado sus mltiples aplicaciones en distintos campos del conocimiento.

Bibliografa
Brasier, M.D. Microfossils. Londres: George Allen, 1980. pp.193.
Camacho, H. Invertebrados fsiles. Buenos Aires: Eudeba, 1966. pp.706.
Clark, I. y Harper W. Practical Geostatistics 2000. Columbus: Ecosse, 2000. pp.342.
Cressie, N. Spatial for Data. New York: John Wiley and Sons, 1991, pp.900.
De Castro, R. El Universo LATEX. Segunda Edicin. Bogot: Universidad Nacional de Colombia, 2003. pp. 470.
El-Sheimy, N. Digital Terrein Model. http://www.geomatics.ucalgary.ca/nel-shei/.
Fatela, F. and Taborda, R. Confidence limits of species proportions in microfossil assemblages. Marine Micropalentology 45 (2002), 169-174.
Martnez J. I. y Bedoya G. Recent planktonic foraminifera from deep-sea sediments from
the eastern equatorial Pacific: Proxies of the Ecuatorial Front in the Late Quaternary. Boletn de Investigaciones Marinas. 2001. Vol. 30. pp.151-176.
Palaseanu-Lovejoy M. e-mail: monica.palaseanu-lovejoy@stud.man.ac.uk (Comunicacin
escrita).
Schabenberger O. and Pierce F. Contemporary Statistical Model: for the Plant and Soil Sciences. Boca Raton: CRC Press, 2002, pp.738.
Schabenberger O. Stat 5544 Spatial Statistics. Course of Summer 2000. pp.198
http://stress.swan.ac.uk/ mbarnsle/teaching/envmod/pdf/em-chapter18.pdf. Spatial Dependencia and the semi-vaiogram.

80

Apndice A
Cdigo generado en R usado en la monografa
Para la elaboracin de esta monografa se hizo uso del software R, el cual es de distribucin
gratuita y de un alto rendimiento.
Las libreras, adicionales a las bsicos, cuyas aplicaciones son exclusivas para estadstica
espacial, y que se utilizaron en este trabajo fueron:
spdep: se aplic para hacer pruebas de autocorrelacin espacial a partir del Indice de
Moran.
sgeostat: se aplic en la creacin de objetos puntos y en la posterior construccin de
grficos de lags y de caja.
scatterplot3d: se utiliz para la construccin de grficos en 3D.
geoR: con ella se generaron la mayora de las grficas, se produjeron los semivariogramas, los ajustes y la interpolacin Kriging.
El cdigo desarrollado es el siguiente:
Este cdigo es un resumen del cdigo total utilizado en este trabajo.
Mucha parte de el se repite en la medida que cada especie de
foraminfero ha sido tratada de la misma forma.
Se recomienda, si se va a hacer uso de este cdigo, revisar las
ayudas del R.
Debido a lo extenso de algunos argumentos, el lector debe tener
cuidado donde empieza y donde termina el mismo.
base<-read.table(panamainforme.txt,sep="\t",header=T)
attach(base)
plot(jitter(base$Longitud),jitter(base$Latitud),
xlab=Longitud,ylab=Latitud,
main=Localizacin de las perforaciones,
font.lab=2,col.lab=4,col.main=4,
cex.lab=0.8,cex.main=1.1,col.axis=1,fg=2)
library(spdep)%Prueba de autocorrelacin espacial del I de Moran%
x<-cbind(Longitud,Latitude)
k.vecinos<-knearneigh(x,5)
vecinos.nb<-knn2nb(k.vecinos, row.names = NULL, sym = FALSE)
81

CAPTULO 4. CONCLUSIONES Y RECOMENDACIONES

82

plot(vecinos.nb,x, add=TRUE)
vecinos.listaw<-nb2listw(vecinos.nb, glist=NULL,
style="B", zero.policy=FALSE)
library(sgeostat)%para crear objetos puntos y construir Lags Plot%
library(geoR)
base2<-read.table(panamainforme2.txt,sep="\t",header=T)
geobase2<-as.geodata(base2,coords.col=1:2,
data.col=c(3,4,5,6,7,8,9,10,11,12,13,14))
Anlisis exploratorio variable Gbull
(Las otras especies se trataron de igual manera)
pruebas.mora<-moran.test(Gbull, vecinos.listaw, randomisation=TRUE,
zero.policy=TRUE,
alternative="greater", rank = TRUE)
plot(geobase2,coords=geobase2$coords,data=geobase2$data[,1])
s3d <- scatterplot3d(Longitud,Latitud,Gbull, type="h",
highlight.3d=TRUE, scale.y=0.7, pch=16,
main="Diagrama de dispersin en 3D\nRotado 120o ",
cex.main=1,font.axis=2,angle=120)
points.geodata(geobase2,geobase2$coords,geobase2$data[,1],
xlab = "Coordenada X", ylab = "Coordenada Y",font.lab=2,
pt.divide="rank.prop",pch=1)
%Grficos de caja %(Paquete sgeostat)
base2.point<-point(base2,x=Longitud,y=Latitude)
base2a.pair<-pair(base2.point,num.lags=6,
type=anisotropic, theta=0, dtheta=22.5, maxdist=8)
par(mfrow=c(2,2))
spacebox(base2.point,base2a.pair,Gbull,type=r)
%Matriz de dispersin
base3<-base2[,c(3,4,5,6,7,8,9,10,11,12,13,14)]
pairs(base3, font.labels=7,col=1,cex.labels=1)
%SEMIVARIOGRAMAS DIRECCIONALES Y KRIGING
base2<-read.table(panamainforme2.txt,sep="\t",header=T)
gbull<-base2[,c(1,2,3)]
nduter<-base2[,c(1,2,12)]
gbull.geo<-as.geodata(gbull)
duter.geo<-as.geodata(nduter)
bin10 <- variog4(nduter.geo, max.dist=9,bin.cloud=T)
cloud11 <- variog4(npach.geo, option = "cloud", max.dist=9)
bin11 <- variog4(npach.geo, max.dist=9,bin.cloud=T)
cloud12 <- variog4(pobliq.geo, option = "cloud", max.dist=9)
bin12 <- variog4(pobliq.geo, max.dist=9,bin.cloud=T)
par(mfrow=c(2,2))
plot(bin9, main = "classical estimator")
title(main=Semivariogramas Gtumi,cex.main=0.9)
plot(bin10, main = "classical estimator")
title(main=Semivariogramas Nduter, cex.main=0.9)
plot(bin11, main = "classical estimator")

CAPTULO 4. CONCLUSIONES Y RECOMENDACIONES

83

title(main=Semivariogramas Npach, cex.main=0.9)


plot(bin12, main = "classical estimator")
title(main=Semivariogramas Pobliq, cex.main=0.9)
VARIOGRAMAS OMNIDIRECCIONES PARA NDUTER
cloud10a <- variog(nduter.geo, option = "cloud", max.dist=4)
bin10a <- variog(nduter.geo, max.dist=4,bin.cloud=T)
cloud10b <- variog(nduter.geo, option = "cloud", max.dist=6)
bin10b <- variog(nduter.geo, max.dist=6,bin.cloud=T)
cloud10c <- variog(nduter.geo, option = "cloud", max.dist=10)
bin10c <- variog(nduter.geo, max.dist=10,bin.cloud=T)
par(mfrow=c(2,2))
plot(bin10a, main = "Distancia mxima=4o =444 Km ",
xlab=Distancia,ylab=Semivarianza,cex.main=0.9)
lines(bin10a)
plot(bin10b, main = "Distancia mxima=6o =666 Km",
xlab=Distancia,ylab=Semivarianza,cex.main=0.9)
lines(bin10b,col="green")
plot(bin10c, main = "Distancia mxima= 10o =1100 km",
xlab=Distancia,ylab=Semivarianza,cex.main=0.9)
lines(bin10c,col="blue")
AJUSTES AL VARIOGRAMA EMPIRICO DE NDUTER
bin7c <- variog(gcultr.geo, max.dist=10,bin.cloud=T)
bin10c<- variog(nduter.geo, max.dist=10,bin.cloud=T)
par(mfrow=c(1,2))
plot(bin7c, bin.cloud = T, main = "Variocloud para Gcultr")
title(main=Variocloud Gcultr)
plot(bin10c, bin.cloud = T, main = "Variocloud para Nduter")
title(main=Variocloud Nduter)
par(mfrow=c(2,2))
plot(tapply(Gcultr,Longitud,median),xlab="Este-Oeste",
ylab="Gcultr",pch=4,col=4,cex=0.5,col.axis=4)
plot(tapply(Nduter,Longitud,median),xlab="Este-Oeste",
ylab="Nduter",pch=4,col=3,cex=0.5,col.axis=3)
plot(tapply(Gcultr,Latitud,median),xlab="Norte-Sur",
ylab="Gcultr",pch=2,col=4,cex=0.5,col.axis=4)
plot(tapply(Nduter,Latitud,median),xlab="Norte-Sur",
ylab="Nduter",pch=2,col=3,cex=0.5,col.axis=3)
Variograma Nduter omnidireccional
plot(bin10c, main = "Nduter, Distancia mxima= 10o =1100 km",
xlab=Distancia,
ylab=Semivarianza,cex.main=0.9)
AJUSTES
n1<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "gaussian",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n1,col=2)

CAPTULO 4. CONCLUSIONES Y RECOMENDACIONES

84

n2<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "spherical",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n2,col=3)
n3<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "exponential",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n3,col=4)
n4<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "linear",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
lines(n4,col=1)
legend(7,1500, c("M. Gaussiano",
"M. Esfrico","M. Exponencial","M. Lineal"),
col=c("red","green","blue","gray"),cex=0.9,lty=c(1,1,1,1))
%KRIGING
coordenadas<-nduter.geo$coords
coordbase1<-coordenadas[,1]
coordbase2<-coordenadas[,2]
coordbase12<-matrix(c(coordbase1,coordbase2),31,2)
coordbase12<-matrix(c(coordbase1,coordbase2),31,2)
pred.grid <- expand.grid(Longitud=seq(-95,-80,1), seq(-5,10,1))
plot(pred.grid)
nduter<-base2[,c(1,2,12)]
nduter.geo<-as.geodata(nduter)
bin10c<- variog(nduter.geo, max.dist=10,bin.cloud=T)
n1<-variofit(bin10c, ini.cov.pars=c(3000,3),
cov.model = "gaussian",fix.nugget = FALSE,
nugget = 0,fix.kappa = TRUE,weights = "npairs",
simul.number = NULL, max.dist = 8, messages.screen = TRUE)
kcOK <- krige.conv(nduter.geo, locations = pred.grid,
krige =krige.control(cov.pars = n1$cov.pars))
image(kcOK, loc = pred.grid, coords = coordbase12,
col=gray(seq(1,0.2,l=30)),xlab=Longitud,ylab=Latitud)
legend.krige(y.leg=c(-5,-4), x.leg=c(-95,-90),
val=kcOK$predict,col=gray(seq(1,0.2,l=30)),cex.leg=0.7)
title(main=Prediccin espacial Nduter,cex.main=0.9)
image(kcOK, loc = pred.grid, coords = coordbase12,
values = kcOK$krige.var,xlab=Longitud,ylab=Latitud)
legend.krige(y.leg=c(-5,-4), x.leg=c(-95,-90),
val=kcOK$krige.var,cex.leg=0.7)
title(main=Varianza de la prediccin, Nduter,cex.main=0.9)

You might also like