You are on page 1of 30

03 - El Modelo

Probabilstico en
Geoestadstica

Interpretacin probabilstica
Variables aleatorias
Funciones de distribucin y de densidad de
probabilidad
Momentos
Ejemplos de distribuciones
Distribuciones bivariables y multivariables
Nocin de funcin aleatoria

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Interpretacin

Los fenmenos en Ciencias de la Tierra involucran


procesos complejos, luego, parecen aleatorios. Sin
embargo, los datos verdaderos no son resultado de un
proceso aleatorio: se trata solamente de una
interpretacin por nuestro desconocimiento de la
realidad.

El valor de la variable regionalizada en un punto z( u) se


interpreta como la realizacin ( outcome) de una variable
aleatoria Z(u).

Algunos problemas:

Cmo hacer inferencia acerca de la variable aleatoria si


slo disponemos de una realizacin?
Inferencia y Modelamiento

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Variable aleatoria

Variable aleatoria: Una funcin Z desde un espacio muestreal


S en los nmeros reales. Una forma de representar un valor z no
muestreado (desconocido). Se denota con letra mayscula

La variable aleatoria Z puede tomar cualquier valor dado por su


distribucin de probabilidad. sta modela la incertidumbre
respecto a su realizacin z. La variable puede ser continua o
discreta:

Variable continua: puede tomar valores en forma continua entre


dos valores dados: ley, densidad, concentracin, precio,...

Variable discreta o categrica : pertenece a una clase.


Ejemplo: cdigos de litologa

Cmo caracterizar una variable aleatoria?

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Funcin de distribucin
acumulada
Funcin de Distribucin Acumulada (fda) de una
variable aleatoria Z:

F ( z ) Prob{Z z} [0,1]

Est definida para todos los valores de z


Puede ser una funcin discontinua

lim FZ ( z ) 0

lim FZ ( z ) 1

FZ (z ) es una funcin no-decreciente

Probabilidad acumulada

Esta frmula entrega el rea bajo la funcin de densidad de


probabilidad de la variable aleatoria Z, y equivale a la probabilidad
de que la variable aleatoria Z sea menor o igual a un valor de corte
z.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Funcin de distribucin
acumulada

La probabilidad de superar cualquier valor de corte z se


escribe:

Prob{Z z} 1 F ( z )

La probabilidad de que Z pertenezca a un intervalo [a,b]


(donde b>a) es la diferencia entre los valores de la funcin
de distribucin acumulada evaluada en los puntos b y a:

Prob{Z [a, b]} F (b) F (a)

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Funcin de distribucin
acumulada

Teorema: (importante para entender porqu la


simulacin de Monte-Carlo funciona):
Sea Z una variable aleatoria con funcin de distribucin
FZ (z )
acumulada continua
y definamos la variable
Y FYZ (Z
)
aleatoria
como
. Entonces Y est distribuida
uniformemente entre 0 y 1, es decir,

ProbY y y, 0 y 1

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Funcin de densidad de
probabilidad

La funcin de densidad de probabilidad (fdp) es la


derivada de la fda, si es derivable:
F ( z dz ) F ( z )
dz 0
dz

f ( z ) F ' ( z ) lim

La fda se obtiene integrando la fdp:


z

F ( z)

f ( z )dz

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Funcin de densidad de
probabilidad

Propiedades de la funcin de densidad de probabilidad:


f(z) 0

f ( z )dz 1

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Grfico de probabilidad
acumulativo

Permite ver todos los datos en


un grfico, reconocer y separar
poblaciones estadsticas
Permite tambin detectar
valores extremos
Puede usarse para verificar
modelos de distribucin:

Lnea recta en escala aritmtica


distribucin normal
Lnea recta en escala
logartmica distribucin
lognormal
Pequeas divergencias pueden
ser importantes (especialmente
en los extremos)

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Valores extremos
Afectan considerablemente las estadsticas bsicas
Qu hacer con ellos?:

Declarar los valores extremos como errneos y eliminarlos


Clasificarlos en poblaciones estadsticas separadas
Usar estadsticas robustas, que son menos sensibles a los valores
extremos: mediana, coeficiente de correlacin de posicin
Transformar los datos para reducir su influencia
Bajarlos a un mximo razonable

Outliers: Observaciones que parecen no pertenecer a la


misma poblacin constituida por el resto de los datos.
Generan considerables problemas al aplicar regresin, debido
a que tienen un efecto desproporcionado sobre los valores
estimados
Se puede eliminar los datos considerados extremos
(outliers) slo si se ha comprobado que estn errados.
En caso de ser datos verdaderos, proveen informacin que
puede ser crtica para la respuesta del modelo.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Suavizamiento de
distribuciones
Pocos datos: estadsticas y grficos errticos
experimentales
Suavizamiento de la distribucin experimental permite reducir

las fluctuaciones, aumentar la resolucin de clases y extender la


distribucin mas all de los valores mnimo y mximo de la
muestra
Tcnicas de suavizamiento ms flexibles (programacin
cuadrtica) se han aplicado para suavizar histogramas y grficos
de dispersin: mantienen las estadsticas de la muestra.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Momentos

Esperanza: (primer momento) es un promedio ponderado


por las
probabilidades, si existe. Da una idea del centro de la
distribucin

Caso discreto n

E{Z } m wi zi

donde:
E{Z} = valor esperado o media de

i 1

wi = probabilidad de ocurrencia
del i-simo valor
n = nmero de datos

E{Z } m zdF ( z ) zf ( z ) dz
Caso continuo

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Momentos

Propiedades de la esperanza:
E a a
E bZ b E Z

E a bZ a b E Z
E g ( Z )

g ( z ) f ( z ) dz

La varianza (segundo momento centrado). Nos da una


idea de la dispersin de la distribucin de la variable
aleatoria Z. Se define como la esperanza de la
desviacin de Z respecto de su media al cuadrado:
Var {Z } 2 E{[ Z m]2 } E{Z 2 } m 2 0
MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Momentos

Caso discreto
n

Var {Z } wi ( zi m) 2
2

i1

Caso continuo

Var {Z } ( z m) dF ( z ) ( z m) 2 f ( z )dz
2

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Momentos

La varianza es una medida de la dispersin de los datos


en torno a la media.
Propiedades de la varianza
Var a 0

Var aZ a 2 Var Z
Var b Z Var Z

, 2
La desviacin estndar
, que es la raz
cuadrada de la varianza, tambin es una medida de la
variabilidad de los datos respecto a la media. Se escribe
en las mismas unidades de la variable.
El coeficiente de variacin (CV), que es adimensional,
es la razn entre la desviacin estndar y la media ( /m).

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin Uniforme

fdp

1
z [a,b]
f ( z) b a
0 ,
en otro caso

fda F ( z ) f ( z )dz

Momentos

0, z a
za
z [a,b]
ba
1, z b

E{Z }

ab
m mediana
2
b

1
1 2
2
E{Z }
z
dz

(a ab b 2 )

ba a
3
2

(b a ) 2
Var {Z } E{Z } m
12
2

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin Dirac

z = a (constante, sin incertidumbre)


fda
1, si z a

F ( z)

0, si no

fdp

0, z a
f ( z)
indefinida en z a

Momentos:
E{Z} = m = a
2 = 0

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin Normal
(Gaussiana)

La distribucin Gaussiana queda completamente caracterizada


por dos parmetros, la media m y la varianza 2:
1 zm
1
g (z)
exp

2
z
g o ( z)
exp
2
2

La fdp normal estndar tiene una media de cero y una


desviacin estndar de uno:

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin Normal
(Gaussiana)

La fda de la distribucin gaussiana G(z) no tiene una


expresin analtica simplificada, pero la fda normal
estndar Go(z) est tabulada en la literatura:
zm

Go ( z )

G ( z ) g ( z ) dz G o

g o ( z )dz

Si

Z ~ N (, 2 )

y definimos:

, entonces: Y ~ N (0,1)
g(z)
0.40

0.35

La distribucin gaussiana es simtrica:


0.30

La media y mediana son iguales


La fdp g(m+z) = g(m-z)

0.25

95 %

0.20
0.15
0.10
0.05
0.00
0

2.5%

2.5%
2

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

10

12

14

16

Distribucin Lognormal

Si Z es una variable aleatoria cuyo logaritmo est distribuido


como una normal, entonces Z tiene distribucin lognormal.

Z ~ log N (m, 2 ), si Y ln Z ~ N (, 2 )
g(z)

G(z)

0.35

1.0

0.9

0.30

0.8
0.25

0.7
0.6

0.20

0.5
0.15

0.4
0.3

0.10

0.2
0.05
0.00

0.1
0

10

0.0

10

Muy interesante en Ciencias de la Tierra


Distribucin sesgada hacia la derecha (cola larga de valores
altos): asimtricas

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin Lognormal
Las distribuciones lognormales tambin se caracterizan por
dos parmetros: media y varianza. Sin embargo, pueden
caracterizarse ya sea por los parmetros aritmticos (m y 2) o
por los parmetros logartmicos ( y 2).
La fda y fdp lognormal se expresan mas fcilmente en funcin
de sus parmetros logartmicos:

ln z
para todo z 0

FZ ( z ) Prob{Z z )} Go

f Z ( z)

dFZ ( z ) 1 ln z
g o

dz
z

Las relaciones entre los parmetros aritmticos y logartmicos


son:
m e / 2
2 m 2 [e 1]
2

ln m / 2
2

ln

2
1 2
m

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Combinacin de
distribuciones
De la combinacin de distribuciones resulta una nueva
distribucin.
F(z) =kkF'k(z) es un modelo de distribucin si las F' k(z) son
funciones de distribucin y si los k son positivos y suman 1.

Codificacin disyuntiva de un histograma experimental de datos


z1, z2 zn:
1 n

F ( z ) zi ( z )
n i1
Una suma de n
distribuciones Dirac
de parmetros zi e
igual amplitud 1/n

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Teorema del Lmite Central

La suma o la media de un gran nmero de variables


aleatorias estandarizadas independientes igualmente
distribuidas (no necesariamente Gaussianas) tiende a
distribuirse en forma normal. Es decir, si n variables
aleatorias Zi tienen la misma fda y medias m, su media
tiende hacia una fda normal, cuando n tiende a infinito.
1 n
m Z i
n i1

E{m } E{Z} m
Normal
1
2

Var {m} n Var {Z } n

Corolario: el producto de un gran nmero de variables


aleatorias positivas, independientes e idnticamente
distribuidas tiende a distribuirse en forma lognormal
1 n
log Z i
n i1

E{ } E{ log Z}
Normal
1
2

Var {} n Var {log Z } n

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin bivariable

f ( z1 , z 2:)
Funcin de densidad de probabilidad conjunta
de R2 en R es la funcin de densidad de probabilidad
conjunta del vector aleatorio bivariable (ZA1
,ZR2)2 si para
cada
:

Prob(( Z1 , Z 2 ) A) f ( z1 , z 2 ) dz1 dz2


A

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin bivariable

Funciones de distribucin acumulada y densidad


conjunta:
z1 z 2
2
FZ1Z 2 ( z1 , z 2 ) Prob{Z1 z1 , Z 2 z 2 }

Z1Z 2

( s,t ) ds dt

FZ1Z 2 ( z1 , z 2 )

Distribuciones marginales
(univariables):

f Z1 ( z1 )

f Z1Z 2 ( z1 , z 2 )

Z1Z 2

( z1 ,t ) dt

f Z 2 ( z2 )

Z1Z 2

( s, z2 ) ds

Distribuciones condicionales
(Ley de
f Z1Z 2 ( z1 , z 2 )
f Z1ZBayes):
( z1 , z 2 )
2
f Z 2 ( z 2 | z1 )

E{g ( Z 2 ) | Z1}

f Z1 ( z1 | z 2 )

f Z1 ( z1 )

f Z 2 ( z2 )

g ( z) f

Z2

( z | z1 ) dz

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

z1 z 2

Distribucin bivariable
5a. Fila

Ejemplo de distribuciones en filas horizontales


La media corresponde a la de la lnea MN de regresin
Z1/Z22 = Z12(1-r2) = 2,835

7
4

Variable z1
8

V a ria b le z 2

15

12

K1

1
1

7
6

Lnea de
regresin
5
de z 2 en z 1
4
3

Lnea de regresin
de z 1 en z 2

M
0

1
7

10

Variable z1

4
9

9
15

11

12 0

15
20 20

Distribucin Marginal (Global) de z1


Media = 6
Z12 = 3,78
Z1 = 1,945

Coeficiente de
Correlacin
r = 0,5

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

31 31
D is trib u c i n M a rg in a l (G lo b a l) d e
z2
M e 2d ia = 5
Z 2 = 1 ,3 3 4
Z 2 = 1 ,1 5 5

11

15

10

3 4

4 a . C o lu m n a

4 6 3
1

8 a . C o lu m n a

E je m p lo s d e d is trib u c io n e s
e n c o lu m n a s v e rtic a le s
L a m e d ia c o rre s p o n d e a la
d e la 2ln e a K 2L d e 2 re g re s i n
Z 2 /Z 1 = Z 2 (1 -r ) = 1 ,0 0

V a ria b le z 2

1
9

Distribucin bivariable

El momento de segundo orden de una distribucin


bivariable es la covarianza, definida como:
Cov{Z1 , Z 2 } E{[ Z1 m1 ][ Z 2 m2 ]} E{Z1Z 2 } m1m2

( z m )( z
1

m2 ) f Z1Z 2 ( z1 , z2 )dz1dz 2

La covarianza entre la variable y ella misma es su


varianza:
Cov{Z1,Z2} = Var{Z1}; Cov{Z2,Z2} = Var{Z2}

El coeficiente de correlacin entre dos variables se


define como la covarianza estandarizada por las
Cov{Z1 , Z 2 }
desviaciones estndar:
Z1 Z 2
[1,1]
Var {Z1}Var {Z 2 }

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Distribucin multivariable

Funcin de distribucin acumulada:

F ( z1 , z 2 ,...z n ) Prob{Z1 z1 , Z 2 z 2 ,...Z n z n }

Caracteriza cmo se distribuyen conjuntamente las


distintas variables aleatorias

Se utiliza para describir la distribucin de los valores de


la variable regionalizada en el espacio, al considerar el
Z (u),ude
D
conjunto de las variables aleatorias en el dominio
inters:

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Nocin de funcin
aleatoria

Funcin Aleatoria: el conjunto de las variables


Z (u),u D
aleatorias en un dominio:

La variable regionalizada es una realizacin


de una funcin aleatoria

Es importante caracterizar cmo se


correlacionan estas variables aleatorias, de
modo de modelar la continuidad espacial de
los valores de la variable regionalizada
anlisis variogrfico
MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

Nocin de funcin
aleatoria

Ejemplo: mismos conjuntos de valores, pero distribuidos de


forma diferente en el espacio. Las variables aleatorias se
modelarn con altas correlaciones en el primer caso, y con
bajas correlaciones en el segundo caso.

MI54A EVALUACIN DE YACIMIENTOS UNIVERSIDAD DE CHILE

You might also like