You are on page 1of 65

PROCESAMIENTO DE

INFORMACIÓN
“DETERMINACIÓN DE VALORES DE
FONDO Y UMBRALES”
ESTADISTICA BASICA
(Principales Estadígrafos)
MEDIA ARITMÉTICA
Es el estadígrafo de posición más importante, denominado simplemente
MEDIA
____
 x x x
1 2 3
   xn
X N

MEDIA GEOMÉTRICA
Es la raíz enésima del producto de los valores de una serie

x1.x 2.x3x n
1
Mg = n
Ejemplo:
Se tienen los siguientes valores:
4.3, 4.5, 4.8, 4.7, 4.2, 4.5, 7.0, 7.2
Media aritmética = 5.15
Media geométrica = 5.01

“La Media geométrica es un estadígrafo que no se


deja influenciar mucho por los altos o bajos
erráticos, por lo tanto es mucho más
representativo de la población examinada”
MEDIANA
Es el valor de la variable que divide el total de las “n” observaciones
debidamente ordenadas en dos parte de igual tamaño. Esto significa que a
uno o al otro lado de este valor mediano se encuentra no más del 50% del
total de las observaciones.
2 CASOS:
• IMPARES.- La mediana es igual al valor del término central.
4, 1, 4, 8, 5, 6, 9 n=7
1, 4, 4, 5, 6, 8, 9 n + 1 /2 = 4
• PARES.- La mediana es igual al promedio de los dos valores del centro
323, 425, 428, 432, 440, 445, 500, 510
n + 1 /2 = 4.5
432 + 440 /2 = 436.
MODA
Es simplemente el valor más frecuente de una variable.
• 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 13 -------- 9
• 3, 5, 8, 10, 12, 16, 18 ----- no hay
• 2, 3, 4, 4 , 4, 5, 5, 7, 7, 7, 9 ------- 4 y 7
Datos agrupados:
# personas por familia # de familias
Y1 = 2 N1 = 16
Y2 = 3 N2 = 24
Y3 = 4 N3 = 52
Y4 = 5 N4 = 76
Y5 = 6 N5 = 40
Y6 = 7 N6 = 12
LA VARIANZA
(es una alternativa para medir la dispersión)
Con la perspectiva de construir un indicador que dimensione la
desviación o distancia promedio de los Xi respecto a su media, se
propuso elevar al cuadrado su desviación, a fin de que no sea siempre
negativa.
 x  x 
2

Varianza
n 1
Si los valores están muy concentrados las desviaciones respecto a la
media serán muy pequeños y en consecuencia también sus cuadrados,
se evita que las desviaciones positivas se compensen con las negativas
“PERO DESDE ESTE PUNTO DE VISTA, LA VARIANZA TIENDE A
EXAGERAR LOS VERDADEROS VALORES RESPECTO A LA
MEDIA”
“BAJO ESTA ALTERNATIVA PARA MEDIR LA DISPERSIÓN Y
QUE AMORTIGUE DICHO EFECTO ES LA DESVIACIÓN
ESTÁNDAR”
DESVIACIÓN ESTÁNDAR
La desviación estándar o típica se define como la raíz cuadrada de la
varianza.
Desviación
Estándar
NOTA:
¿Porqué usar “n-1” y no “ n”?
Bien la respuesta es algo complicada, pero en general si su grupo de
datos es una muestra del universo, entonces Ud. Están tomando un
sub grupo del mundo real, entonces debe utilizar “n-1”
EJEMPLO DE DISPERSIÓN
Grupo 1:
X X–X (X – X)2
0 -10 100
8 -2 4
12 2 4
20 10 100
208 / n – 1 = (69.33)1/2 = 8.3 (DESV. ESTÁNDAR)

Grupo 2:
X X–X (X – X)2
8 -2 4
9 -1 1
11 1 1
12 2 4
10/ n – 1 = (3.33)1/2 = 1.8257 (DESV. ESTÁNDAR)
COEFICIENTE DE VARIACIÓN

C.V. = DESV. ESTÁNDAR/ MEDIA ARITMÉTICA

Se expresa en términos porcentuales.


“Es más homogénea o presenta menos discrepancia aquella
distribución que tiene el menor coeficiente de variación”
“Una distribución puede considerarse como Gaussiana si el coeficiente
de variación es menos a 0.5, en caso contrario indicaría un carácter log
– normal.”
CUARTILES.-
Los cuartiles son estadígrafos de posición que dividen al total de las
observaciones, debidamente ordenadas en cuatro partes de igual tamaño.
Valor mínimo.
• Q1 = n/4 ----- el 25% de las observaciones tienen valores inferiores o
iguales a Q1 y el 75% es > a Q1.
• Q2 = n/2 = mediana
• Q3 = 3n/4 = es un valor que supera a más del 75% y que es superado
por no más del 25%.
Valor máximo.
PERCENTILES.-
Los percentiles son estadígrafos de posición que dividen al totalidad
de las observaciones en 100 partes iguales, es un estádígrafo que dá
una idea porcentual de las distribución de los datos. Es uno de los
estadígrafos más utilizados

RANGO INTERCUARTÍLICO.-
(Q3 – Q1) ----- 50%
De la misma forma, que como alternativa a la media, la mediana es
una mediad de la tendencia central basada en percentiles.
El RI puede considerarse como una alternativa de la desviación típica
para calcular la dispersión de los elementos.
CORRELACIÓN.-

Trata de encontrar variables que estén relacionadas o asociadas entre


sí, existen muchas variables, es especial cuantitativas que dependen en
algún grado de otras; entonces es posible que una variable pueda
estar correlacionada matemáticamente en función de la otra.
• Correlación Positiva.- Cuando el incremento en una variable ,
significa el incremento en la otra.
• Correlación Negativa.- Cuando el incremento en una variable,
significa la disminución en la otra.
Hay dos formas de representar la correlación:
• Numérica .- (Coeficiente de Pearson)

• Gráfica .- (Nube de puntos)


CORRELACIÓN NUMÉRICA

Correlation Matrix

LNAG LNAS LNCO LNCU LNMO LNNI LNPB LNSB LNW LNZN LNCR LNFE LNMN
Correlation LNAG 1.000 .456 .326 .597 .376 .236 .565 .460 .086 .664 -.042 .222 .454
LNAS .456 1.000 .153 .372 .392 .203 .460 .319 .236 .528 .073 .161 .250
LNCO .326 .153 1.000 .684 .093 .301 .381 .140 -.048 .557 .071 .801 .635
LNCU .597 .372 .684 1.000 .364 .364 .511 .281 .057 .613 .066 .533 .387
LNMO .376 .392 .093 .364 1.000 .457 .369 .331 -.095 .232 -.028 .077 .108
LNNI .236 .203 .301 .364 .457 1.000 .271 .161 .050 .278 .625 .241 .147
LNPB .565 .460 .381 .511 .369 .271 1.000 .296 .145 .701 -.021 .248 .528
LNSB .460 .319 .140 .281 .331 .161 .296 1.000 -.046 .306 -.105 .089 .154
LNW .086 .236 -.048 .057 -.095 .050 .145 -.046 1.000 .198 .361 .067 -.028
LNZN .664 .528 .557 .613 .232 .278 .701 .306 .198 1.000 .100 .484 .712
LNCR -.042 .073 .071 .066 -.028 .625 -.021 -.105 .361 .100 1.000 .184 -.028
LNFE .222 .161 .801 .533 .077 .241 .248 .089 .067 .484 .184 1.000 .570
LNMN .454 .250 .635 .387 .108 .147 .528 .154 -.028 .712 -.028 .570 1.000
CORRELACIÓN
NUMÉRICA Y
GRÁFICA
(GEOSOFT –
MODULO
CHIMERA )
COEFICIENTES DE LA FORMA DE LA
DISTRIBUCIÓN
CURTOSIS.-
Es una medida de la concentración de la distribución entorno a la
media, si la variable es normal el valor del coeficiente es cero.
Valores mayores que cero indicarán que la distribución tiende a
concentrarse entorno a la media más que una distribución normal,
mientras que valores menores que cero indicarán que tienden a
desplazarse.

SESGO.-
Es una medida de la simetría de la distribución de los valores
respecto a la media. Valores mayores que cero indicarán que las
desviaciones respecto a la media son mayores para los valores
superiores (sesgo positivo), mientras que valores menores que
cero indicarán que las desviaciones respecto a la media son
mayores para los valores inferiores. (sesgo negativo)
Histograma con
sesgo Positivo
debido a valores
altos.

Histograma con
sesgo negativo
debido a valore
bajos
GRÁFICOS DE AYUDA

HISTOGRAMAS.-
Tratan de dividir el
conjunto de datos
en una serie de Curva
intervalos y Gaussiana
representarlos bajo
la forma de un
histograma de
frecuencias, la
similitud con una
curva Gaussiana,
puede inducir que
esta tiene un
comportamiento
normal.
BOX – PLOT (Caja de Bigotes)

Proporciona una distribución de la variable.


• Los límites superior e inferior de la caja
corresponden a los cuartiles tercero y primero
(percentil 75 y 25)respectivamente, en
consecuencia la altura de la caja coincide con
el rango intercuartílico (RI). Valores
extremos
• La línea horizontal dentro de la caja
corresponde al segundo cuartil Q2 (mediana).
Valores
• Los bigotes inferior y superior al mínimo y observados
máximo valor , tal que susu distancias a los
límites superior e inferior respectivamente de
la caja es inferior a una vez el RI.
• En el caso de que un valor diste de los
límites inferior y superior de la caja más de
1.5 veces el RI, el valor se le denomina fuera
de rango y se le representa por el símbolo “O”
y por “X” si los valores son superiores a tres
veces la longitud de la caja o RI, llamados
valores extremos.
GRÁFICO DE TALLOS Y HOJAS
(Stem & Leaf)

En este gráfico cada


línea de dígitos
corresponde a la
descomposición de los
valores de la variable en
dos partes: el tallo y la
hoja, donde primero se
indica la frecuencia,
coincidiendo con el
número de hojas en la
línea.
En la parte inferior se
indica que cada hoja
corresponde a un caso
RECTA DE HENRY

Si los puntos
obtenidos están
alineados
podemos decir
que la distribución
estudiada se
aproxima a una
distribución
normal
Además de indicarnos
la normalidad del
comportamiento de
las muestras nos Valor
indican al igual que
extremo
los gráficos anteriores
los valores extremos
que podrían ser
observados en el
tratamiento
estadístico
CRITERIOS GEOLÓGICOS
EN EL PROCESAMIENTO DE LA
INFORMACIÓN
NECESIDAD DE UNA SEPARACIÓN LITOLÓGICA
EN LA INTERPRETACIÓN DE VALORES
GEOQUÍMICOS

“En un área donde se halla realizado un determinado estudio


regional y existan DIFERENTES unidades litológicas , será
necesario realizar durante la fase interpretativa un estudio
independiente de cada uno de ellos, ya que una adecuada
consideración de los datos requiere de una buena
homogeneidad de los mismos.”

“No obstante muchas veces la ausencia previa de datos geológicos obliga a


realizar globalmente el estudio interpretativo o lo que es lo mismo nos obliga a
reconocer como una sola unidad toda el área estudiada, desde luego, lo dicho no
significa, que el desconocimiento de la geología sea un obstáculo que impida la
realización de campañas regionales, sino que reafirma la necesidad de reconocer
y comprobar cuales son las litologías dominantes.”
NEUTRALIZACIÓN DE VALORES ALTOS

Es muy conocida la influencia que los valores altos o muy elevados pueden
tener en los valores de fondo. Estos valores altos o robustos son ubicados en los
datos de la exploración geoquímica y muy a menudo los más extremos están
cerca de la mineralización.
Esta alta concentración puede falsear la información, de modo que los valores
de los parámetros estadísticos resultan erróneos o con un muy bajo nivel de
confianza.
Por lo tanto no se puede dar con anomalías que se encuentren ocultas
estadísticamente, es por tal razón que para obtener una mejor estimación de
los valores de fondo, se deben de separar del tratamiento estadístico o de
alguna forma asignarle poco peso estadístico para que influya poco en los
cálculos y de ésta manera salgan a relucir las anomalías estadísticas ocultas.
NEUTRALIZACIÓN DE VALORES BAJOS

La estadística es una ciencia que trabaja con límites de confiabilidad, entonces


¿Qué pasa cuando se trabaja con una población en la que tenemos un buen
número de muestras por debajo del límite de detección, siendo este un límite por
debajo del cual no hay confiabilidad en el valor de los datos? la respuesta es
clara y concisa se pierde confiabilidad en los parámetros estadísticos trabajados
de ésta manera, además de que cuando se observan los gráficos estadísticos las
muestras por debajo del límite de detección se comportan como una población
muy aparte, cuando en realidad sólo debe haber una, en caso contrario se pierde
la normalidad del elemento tratado.

“Una de las razones más


graves por la cual no se
trabajó con las muestras
por debajo del límite de
detección, es que producen
una desviación estándar
muy grande.”
CANTIDAD ÓPTIMA DE MUESTRAS

Cuando un elemento tiene un comportamiento log-normal, el threshold estaría ubicado


dentro de la campana de Gauss y representa el 2.5% superior del total de muestras tratadas,
dejando siempre de lado los altos erráticos, siendo muy claro que para que esto suceda el
threshold debe de ser menor que el valor máximo.

Estadísticamente, es sabido
también que el 2.5% está en
función de la cantidad de
muestras. Threshold
Entonces : ¿Cuál es el número de
muestras que debo trabajar para
que arroje estadísticamente una
anomalía y se cumpla el concepto
de la normalidad?

Threshold = Mg +2DS
Threshold > Valor Máximo = No hay anomalías
Threshold > Valor Máximo = No hay anomalías
VENTAJAS DEL ANÁLISIS ESTADÍSTICO

Las principales ventajas del análisis estadístico son:


• La posibilidad de establecer leyes de distribución adaptables a las
diversas poblaciones de datos.
• La reducción de inmensas poblaciones a sus parámetros básicos
esenciales que los caracteriza completamente.
• La comparación y representación de muchos grupos de datos de
manera gráfica y sintética.
• La creación de una base objetiva para la determinación de
anomalías.
• la estandarización para la representación de datos.
TRATAMIENTO EN EXCEL
“Toda población que tenga un comportamiento
normal o gaussiano, tiene que tener anomalías”
Threshold < Valor Máximo = se cumple
POBLACIÓN INTRUSIVA
(Cuadrángulo de Chiquián 21 - i)

Muestras por debajo Población 1 Población 2


del Límite de
detección
RESUMEN ESTADÍSTICO EN EL SPSS

Tratamiento no paramétrico
CORRELACIÓN USANDO BOX - PLOT

Correlación Negativa
muy fuerte

Correlación Positiva
Moderada
Correlación usando Box – Plot
( en muestras de agua)
BIBLIOGRAFIA
Módulo Chimera
CUADRÁNGULO DE
CHIQUIÁN (21 – i)

Laguna de
Conococha

IMAGEN
SATELITAL
BANDA 4
(con superposición
de óxidos y arcillas)
IMAGEN SATELITAL CON
LINEAMIENTOS
ESTRUCTURALES
“Un punto de muestreo de sedimentos de quebrada
representa toda un área, que puede abarcar varios
Km.”
EL PROCESO DE INTERPOLACIÓN

¿Què es la interpolación?
La interpolación es un procedimiento matemático utilizado para predecir el valor
de un atributo en una localización precisa a partir de puntos vecinos ubicados
en el interior de la misma región.

Método de Mínima Curvatura.- (SPLINE)


Con este método se trata de generar una superficie de interpolación, tal que
pasando por los puntos de la curvatura es mínima, es considerado como un
método de susvizado o una técnica de Relajación.
La interpolación más simple es la lineal.
El polinomio de grado “n” tiene “n+1” coeficientes, lo cual permite ir ajustando
al máximo la curva.
Los polinomios de tercer grado al tener 4 coeficientes y por lo tanto 4 grados de
libertad permiten fijar en los dos extremos de cada intervalo los puntos de paso
y las tangentes
Mínima Curvatura
(forma de suavizado)
VENTAJAS

• Acepta un número ilimitado de puntos de muestreo.


• Tensión interna de ajuste.
• Aplica un enmallado logarítmico o lineal.
• Aplica proyecciones.
• Deja en blanco áreas sin muestrear.
• La salida de los GRIDS puede ser de cualquier tamaño.
COMPRACIÓN DE MÉTODOS DE INTERPOLACIÓN
Los Diferentes Grados de la Interpolación
La Interpolación
y los Límites de
Detección
Formas más comunes de presentar los datos geoquímicos
Mapa de
Ubicación de
Muestras
(Stream
Sediment)
Mapa de Dispersión
de los Elementos
Mapa de Distribución
de Elementos

Mapa de anomalías
Geoquímicas
IMAGEN DE ALTERACIONES HIDROTERMALES
MUCHAS GRACIAS
POR SU ATENCIÓN

You might also like