Geoestadistica - 2017 I

CAPITULO I
CONCEPTOS BASICOS
1. Introduccin.
La estadstica es la ciencia dedicada a la recoleccin, presentacin y
caracterizacin de la informacin con el objeto de analizar y tomar decisiones. La
estadstica se utiliza en diferentes especialidades de la ciencia como Minera,
Geologa, Agronoma, Economa, Ambiental, etc.
1.1. Individuo.- Cualquier elemento que porte informacin sobre el fenmeno que
se estudia. Por ejemplo, si estudiamos la estatura de los alumnos de una
clase, cada alumno es un individuo; si estudiamos el precio de la vivienda,
cada vivienda es un individuo. El individuo constituye una unidad elemental.
1.2. Poblacin.- Conjunto de todos los individuos (personas, objetos, animales,
etc.) que porten informacin sobre el fenmeno que se estudia.
Ejemplos:
1. El conjunto de todos los alumnos de la UNASAM.
2. El conjunto de todas las personas que viven en el distrito de Huaraz.
3. El conjunto de la estatura de todos los alumnos de la FIMGM.
1.3. Muestra.- Es un subconjunto que seleccionamos de la poblacin. As, si se
estudia el precio de la vivienda de una ciudad, lo normal ser no recoger
informacin sobre todas las viviendas de la ciudad (porque sera una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que sea
lo suficientemente representativo.
Al proceso de obtencin de una muestra se llama muestreo. Para que una
muestra sea representativa debe cumplir con las siguientes condiciones:
a. Debe haber sido obtenido al azar o en forma aleatoria.
b. Su tamao y sus elementos deben haber sido seleccionados aplicando un
mtodo de muestreo.
1.4. Variable.
Son las caractersticas que se desean evaluar en las unidades elementales.
Ejemplos:
1. X = Talla de los alumnos de una Universidad.
2. Y = Numero de cocinas vendidas al mes.
3. Z = Nivel de ingreso mensual de los trabajadores de la UNASAM.
4. W = Sexo de los alumnos.
Se representa generalmente por las ltimas letras maysculas del alfabeto,
por ejemplo: X, Y, Z, W, P, T o tambin X1, X2, X3,.. etc.
1.5. Tipos de Variables.
1.5.1. Variables Cuantitativas.
Son aquellas cuyas observaciones pueden expresarse en forma
numrica y con las cuales se puede realizar operaciones matemticas.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Numero de inasistencias en el mes.
Adems las variables cuantitativas se pueden clasificar en:
1. Variable cuantitativa contina.
Son aquellas que pueden asumir cualquier valor numrico dentro
de un intervalo continuo dado. Generalmente son representados
por el conjunto de nmeros reales. Las observaciones cuantitativas
continuas se obtienen utilizando instrumentos de medicin como:
test, escalas, balanzas, cronmetros, winchas, termmetros, etc.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Velocidad de los vehculos en Km/hora.
2. Variable cuantitativa discreta.
Son aquellos observaciones que cumplen la condicin de que entre
un valor cualquiera y su consecutivo no es posible que existan
valores intermedios. Generalmente son representados por el
conjunto de nmeros enteros. Las observaciones cuantitativas
discretas se registran por conteo.
Ejemplo:
1. X = Nmero de clientes atendidos cada 5 minutos en una
ventanilla.
2. Y = Numero de inasistencias en el mes en das.
1.5.2. Variables Cualitativas.

Son aquellas observaciones que permiten que una unidad elemental
(individuo) puede ser clasificada como poseedora o no de cierta
cualidad, propiedad o atributo. No tiene sentido de realizar
operaciones matemticas.
Ejemplo:
1. X = Vivienda propia o alquilada.
2. Y = Calificacin de un examen con niveles A, B, C y D.
Adems las variables cualitativas se pueden clasificar en:
1. Variable cualitativa nominal.
Son aquellos cuyos valores (cualidades, propiedades o atributos)
no son factibles de ser clasificados a travs de un criterio de orden
o jerarqua.
Ejemplo:
1. X = Sexo de los estudiantes.
2. Y = Condicin de ciertas viviendas (propia o rentada)
2. Variable cualitativa jerrquica.
Son aquellos donde s se puede establecer un criterio de orden y
jerarqua entre sus atributos.
1. X = Niveles socio econmicos de los habitantes de una ciudad.
2. Y = Calificacin de un examen con niveles A, B, C y D.
1.6. Observacin.
Es el valor especfico que toma una variable. A las observaciones se les suele
representar con las letras minsculas sub indicadas, como por ejemplo Xi, Yi,
Zi, Vi, etc.
Ejemplo:
1. X4 = 170. Quiere decir que el alumno 4 mide 170 cms.
2. Y11 = 21. Quiere decir que en el mes nmero 11 se vendieron 21 cocinas.
3. T200 = Primaria. Quiere decir que la persona nmero 200 de Huaraz tiene
instruccin primaria.
1.7. Parmetro.
Es una medida usada para describir el comportamiento de una variable en la
poblacin. El parmetro es una constante, por ello, las decisiones basadas
en esta informacin carecen de incertidumbre.
Los parmetros ms conocidos son: la Media (), la mediana (Me), la moda
(Mo), la varianza (2), proporcin (), etc.
Ejemplo:
1. = 15.4. Supone que el promedio de cocinas vendidas en todos los
meses.
2. En todo Huaraz se tienen las siguientes proporciones de instruccin.
Instruccin Proporcin ()
Primaria 0.455
Secundaria 0.445
Superior 0.100
TOTAL 1.000
1.8. Estadstico o Estadgrafo.

Es una medida usada para describir el comportamiento de una variable en la
muestra.
Debido a que sus valores varan de muestra a muestra, las decisiones
basadas en este tipo de informacin contienen cierto grado de incertidumbre.
Los estadsticos sirven para estimar a los parmetros.
Estimar consiste en considerar el valor del estadstico como si fuera el valor
del parmetro. Los estadsticos ms conocidos son: la Media (), la mediana
(me), la moda (mo), la varianza (S2), proporcin (p).
Notacin de los principales parmetros y estadsticos.
En una poblacin En una muestra
(Parmetro) (Estadstico)
Media
Mediana Me me
Moda Mo mo
Proporcin p
Varianza 2 S2
Desviacin Estndar S
1.9. Clasificacin de la Estadstica.

La estadstica se divide en dos grandes ramas de estudio que son:
1. La estadstica descriptiva, la que se encarga de la recoleccin,
clasificacin y descripcin de datos mustrales o poblacionales, para su
interpretacin y anlisis.
2. La estadstica matemtica o inferencial, que desarrolla modelos
tericos que se ajusten a una determinada realidad con cierto grado de
confianza.
Estas dos ramas no son independientes; por el contrario, son

complementarias y entre ambas dan la suficiente ilustracin sobre una
posible realidad futura, con el fin de que quien tenga poder de decisin, tome
las medidas necesarias para transformar ese futuro o para mantener las
condiciones existentes.
CAPITULO II
ORGANIZACIN DE DATOS.
2. Introduccin.
Despus de recoger toda la informacin correspondiente a la investigacin,
mediante una encuesta, es decir, una vez terminado el trabajo de campo, nos
encontramos con un conjunto de datos y cifras desordenadas los cuales, al ser
tomados como observaciones individuales, dicen muy poco sobre la poblacin
estudiada; es entonces, la tarea del investigador hacer hablar las cifras,
comenzando por la clasificacin y ordenacin, consignando la informacin en
tablas inteligibles a la que denominamos tabla o distribuciones de frecuencias.
2.1. Tablas de Frecuencias.
Son cuadros estadsticos que contienen los valores observados x1, x2, x3,
x4,.xk de la variable X (distribucin) con sus respectivas frecuencias
(distribucin de frecuencias). Dependiendo de la naturaleza de la variable en
estudio las tablas reciben el nombre de distribucin numrica o cuantitativa y
distribucin categrica o cualitativa. Son tiles porque permiten organizar la
informacin (datos no procesados) de forma tal, que se puede reconocer el
comportamiento de los datos. En el caso de la variable cuantitativa continua
presentan el inconveniente de una perdida de informacin, la cual es muy
pequea en relacin a las ventajas que proporciona.
Ejemplo:
El Gerente-propietario recoge la informacin respecto a la variable salario
diario de sus 50 operarios y la relaciona en la tabla No 1.
Tabla N 01
SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES
N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia
1 52 11 54 21 55 31 56 41 52
2 54 12 51 22 55 32 53 42 57
3 55 13 54 23 52 33 57 43 56
4 54 14 55 24 55 34 54 44 51
5 53 15 54 25 53 35 53 45 58
6 56 16 56 26 57 36 50 46 55
7 54 17 52 27 54 37 55 47 53
8 58 18 54 28 55 38 52 48 54
9 51 19 53 29 53 39 53 49 53
10 54 20 55 30 55 40 54 50 56
Tabla N 02

$/Dia $/Dia $/Dia $/Dia $/Dia
52 54 55 56 52
54 51 55 53 57
55 54 52 57 56
54 55 55 54 51
53 54 53 53 58
56 56 57 50 55
54 52 54 55 53
58 54 55 52 54
51 53 53 53 53
54 55 55 54 56
Tabla N 03
DATOS CLASIFICADOS Y ORDENADOS

$/Dia $/Dia $/Dia $/Dia $/Dia
50 53 54 55 56
51 53 54 55 56
51 53 54 55 56
51 53 54 55 56
52 53 54 55 56
52 53 54 55 57
52 53 54 55 57
52 53 54 55 57
52 54 54 55 58
53 54 54 55 58
Tabla N 04
DISTRIBUCION DE FRECUENCIAS DEL
SALARIO DE 50 OPERARIOS
$/Dia CONTEO FRECUENCIA
50 l 1
51 lll 3
52 lllll 5
53 lllll llll 9
54 lllll lllll ll 12
55 lllll lllll 10
56 lllll 5
57 lll 3
58 ll 2
SUMA 50
Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y
el ordenamiento y agrupamiento de la tabla No. 4.
Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbologa:
N: El tamao de la muestra, es el nmero de observaciones.
Xi : La variable; es cada uno de los diferentes valores que se han observado.
La variable xi, toma los x1, x2... xn valores.
fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se
repite la variable Xi; as f1, es el nmero de veces que se repite la observacin x1, f2 el
nmero de veces que se repite la observacin x2, etc.
fa: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
fr: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por
el tamao de la muestra.
fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre
el tamao de la muestra.
Tabla N 05
Tabla de Distribucin de Frecuencias.
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa Acum.
Xi fi fa fr fra
x1 f1 f1 f1/n f1/n
x2 f2 f1+f2 f2/n (f1+f2)/n
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
xi fi f1+f2+..fi fi/n (f1+f2+ +fi)/n
. . . . .
. . . . .
xn fn fi+f2+..fn fn/n (f1+f2+ +fn)/n
n 1
Tabla N 06
Tabla de Distribucin de Frecuencia del Salario Diario de 50 Operarios
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa
Xi fi fa fr Acum.
50 1 1 0.02 0.02
51 3 4 0.06 0.08
52 5 9 0.10 0.18
53 9 18 0.18 0.36
54 12 30 0.24 0.60
55 10 40 0.20 0.80
56 5 45 0.10 0.90
57 3 48 0.06 0.96
58 2 50 0.04 1.00
50 1.00
Anlisis:
Analizando las columnas porcentuales fr y fra se obtienen, entre otras las
siguientes conclusiones:
Slo el 4% de las obreras gana el mximo salario/da de la fbrica, el
cual corresponde a $58.000.00.
El salario diario mnimo ($50.000.00) lo gana nicamente una obrera,
lo que constituye el 2% del personal asalariado.
El 62% de las operarias tiene un salario diario entre $53.000.00 y
$55.000.00.
El 60% de las obreras tiene un salario/da de $54.000.00 o menos.
El 64% tiene un ingreso/da de $54.000.00 o ms.
2.2.
CAPITULO III
MEDIDAS DE POSICION
ESPACIO MUESTRAL (S)
Es el conjunto de todos los posibles resultados de un experimento. Aun cuando en

un experimento, no es posible determinar con seguridad su resultado, se puede s,
definir con precisin un listado de los resultados posibles de ocurrir. Esta lista
constituye el espacio muestral, y se designa como S.
Ejemplos:
1. Si el experimento consiste en lanzar una moneda, los resultados posibles son

sello o cara, luego:
S = {sello, cara}
Ns = 2
Ns: nmero posible de resultados del espacio muestral.
2. Si el experimento consiste en lanzar un dado, el espacio muestral ser:
S = {1, 2, 3, 4, 5, 6}
Ns = 6
3. Si el experimento consiste en lanzar 2 dados, el espacio muestral, de la suma
de los resultado ser:
S = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Ns = 11
EVENTOS
Son los resultados posibles que se puedan presentar en la realizacin de un
experimento.
Es un subconjunto del espacio muestral.
Ejemplos:
1. En el experimento de lanzar una moneda: El evento A, que salga cara es:

A = {cara}
NA = 1
NA: nmero posible de resultados del experimento.
2. En el experimento lanzar un dado: El evento B; que salga un nmero mayor
o igual que 3, es:
B = {3, 4, 5, 6}
NB = 4
3. En el experimento, lanzar dos dados: El evento C, que salga la suma 7, es:
C = {(1,6), (6,1), (2,5), (5,2), (4,3), (3,4)}
Nc = 6
1.3 DEFINICIN CLSICA DE PROBABILIDAD
La probabilidad P(A), de un evento A, en un experimento aleatorio que tiene Ns

resultados iguales posibles, y de los cuales NA, son resultado favorable, est dada
por:

() = .. (1)

Ejemplos:
1. El arrojar una moneda, la probabilidad de que salga sello, es:

1
P=2
2. Al arrojar un dado, hay seis casos igualmente posibles, la probabilidad de
que salga un nmero igual o mayor que 3 es:
4 2
P=6=3
3. Al arrojar dos dados, hay 36 casos igualmente posibles, la probabilidad de
que la suma de los resultado sea 7, es:
6 1
P = 36 = 6
4. En una serie de dos bolas rojas y ocho bolas negras, hallar la probabilidad
que al extraer una bola, esta sea de color rojo.
De los 10 casos igualmente probables, en 2 casos suceder el evento que
se considera, por lo que se tendr:
2 1
P = 10 = 5
En el concepto clsico de probabilidad solo se puede aplicar en experimentos
en los que hay un nmero finito de casos igualmente posibles. Pero en la
naturaleza, los principales problemas prcticos no son de este tipo.
1.4 DEFINICION AXIOMATICA DE PROBAILIDAD
Sea S un espacio muestral asociado a un experimento, y A cualquier suceso de S

(A subconjunto de S). Se dice que P es una funcin de probabilidad en el espacio
muestral S, si se satisfacen los siguientes tres axiomas:
1. 0 P(A) 1, para todo A S

2. P(S) = 1
3. Si 1 , 2 , , es una serie de sucesos, mutuamente excluyentes,
entonces:
P (1 U 2 U 3 U.U ) = P (1 ) + P (2 ) + + P ( )
De estos axiomas se deducen los siguientes teoremas:
1. P() = 0
2. P ( ) = 1 P(A), donde es el complemento de A.
PROBABILIDAD DE LA UNION DE SUCESOS
Si A y B son eventos cualesquiera en un espacio muestral S, entonces:
( ) = () + () ( ) (2)
PROBABILIDAD CONDICIONAL
Si A y B son dos eventos en los cuales () 0, entonces, la probabilidad

condicional de que ocurra el suceso B, dado que sucedi A, se define por:
( )
(/) = . (3)
()
1.5 VARIABLES ALEATORIOS
Es una funcin X, definida sobre un espacio muestral S, que asigna un valor a esta
variable, correspondiente a cada punto (resultado) del espacio muestral de un
experimento
A una variable aleatoria, se le conoce tambin como variable estocstica, sus

valores son nmeros reales, que no pueden predecirse con certeza antes de ocurrir
el fenmeno, es decir, ocurren al azar
1.5.1 CLASES DE VARIABLES ALEATORIAS
1. Variable aleatoria discreta
Se dice que una variable aleatoria X es discreta. Cuando sus valores se restringen
a un conjunto enumerable finito o infinito.
Ejemplo: Nmero de das de lluvias ocurridas en los meses de un ao cualquiera.
Representacin Grafica
Nmero de das
E F M A D Meses
2. Variable aleatoria contina
Se dice que una variable aleatoria X es continua cuando sus valores se encuentran
en un rango continuo y puede ser representado por cualquier nmero entero o
decimal.
Ejemplo: El caudal diario registrado en una estacin de aforo

Caudal Q
1 2 3 4 5 6 . 31 das
La mayora de secuencias de variables geolgicas son series continuas, de

variables continuas. Sin embargo, para propsitos prcticos, una variable discreta
puede tratarse arbitrariamente como continua, ajustndose a una funcin continua,
o bien, una continua como discreta, dividiendo stas en intervalos y agrupndolas
en nmeros discretos.
CAPITULO III
MEDIDAS DE LAS DISTRIBUCIONES.
3. MEDIDAS DESCRIPTIVAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.

Para describir ciertas caractersticas de un conjunto de datos, se pueden usar
nmeros simples, llamados estadsticos. De ellos se puede obtener un
conocimiento ms preciso de los datos que el que se obtiene a partir de las tablas
y los grficos.
Las caractersticas ms importantes de este conjunto de datos son:
3.1 Medida de tendencia central o medidas de localizacin.
Indican cual ser el punto medio o localizacin central. En la fig.1 la curva A
queda a la izquierda de los puntos medios de las curvas B y C, las cuales
tienen la misma localizacin central.
Curva B
Curva A
Curva C
Figura 1.Comparacion de la localizacin central de tres curvas
3.2 Medidas de dispersin.

Se refiere a la forma como se encuentran esparcidas las observaciones. En
la fig. 2, se observa que la curva B tiene una mayor separacin o dispersin
que la curva A.
Curva B
Curva A
Figura 2.Comparacin de la dispersin de dos curvas

3.3 Medidas de simetra y asimetra.
Las curvas que representan los datos puntuales de un conjunto pueden ser
simtricas o asimtricas. Las curvas simtricas, como la que se muestra en
la fig. 3, son las que al trazar una lnea vertical desde el pico de la curva al
eje horizontal dividen su rea en dos partes iguales, cada una idntica a la
otra.
Figura 3.Curva simtrica
Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4

son aquellas en las cuales la distribucin de frecuencia se concentra en el
extremo inferior o superior de la escala de medida sobre el eje horizontal.
Los valores no se distribuye igualmente, por lo que pueden ser sesgadas a
la derecha (curva A) y sesgadas a la izquierda (curva B).
Curva A
Curva B
Figura 4.Curvas segadas, A: sesgo a la derecha o positivo

B: sesgo a la izquierda o negativo
3.4 Medidas de achatamiento o curtosis.
Indican el grado de llanura de la curva. Por ejemplo en la fig. 5, las curvas A
y B tienen la misma localizacin central, y la misma dispersin, pero difieren
por el hecho que una es ms puntiaguda que la otra, por lo que tienen
diferente grado de curtosis.
Curva A
Curva B
Figura 5. Curvas con diferente curtosis

De acuerdo al grado de achatamiento, las curvas pueden ser segn fig. 6
Mesocrtica (curva A), Leptocrtica (curva B) y Platicrtica (curva C)
Curva A (Mesocrtica)
Curva B (Leptocrtica)
Curva C (Platicrtica)
Figura 6. Grados de achatamiento
2.2 MEDIDASD DE TENDENCIA CENTRAL.
Se define una medida de tendencia central como un ndice de localizacin central

empleado en la descripcin de las distribuciones de frecuencias.
En trminos generales se tienen tres medidas: la media, la mediana y la moda.
2.2.1 Media aritmtica
Dada la muestra compuesta de n datos, X1, X2, X3,Xn; la media, se

define como la suma algebraica de ellas, dividida entre el nmero de datos. Cuando
se calcula la media para una poblacin, esta se denota por y cuando se trata de
una muestra, por .
Media aritmtica de datos no agrupados
Matemticamente la media de los datos no agrupados se representa por:

=1
= (1)

= =1 (2)

Donde:
: media poblacional
: Media muestral
Xi: valor i-simo de la muestra
n: nmero de datos de la muestra o poblacin
Media aritmtica de datos agrupados
Para el caso de datos agrupados, la frmula es:

= =1 (3)
Donde:
fi: frecuencia absoluta (nmero de observaciones) en el intervalo i
Xi: marca de clase del intervalo i
k: nmero de intervalos de clase
n: nmero de observaciones de la muestra
2.2.2 Media ponderada
El promedio ponderado permite calcular un promedio que toma en cuenta la

ponderacin de los datos con respecto a un factor, es casi, un caso particular de la
frmula del clculo de la media para los datos agrupados, su frmula es:

= =1

..(4)
=1
Donde:
: Media ponderada
xi: valor i-simo de la muestra
fi: valor del factor de ponderacin del i-simo valor de la muestra
n: nmero de observaciones de la muestra

La media ponderada, se utiliza por ejemplo para el clculo de las notas promedio
de un alumno, donde para cada valor de notas, el factor de ponderacin es el
crdito o peso del curso, as:

.
= =1

=1
Dnde:
: Notas promedio
Pi: valor de las notas promedio del alumno i
Ai: Numero de crditos del alumno i
n: nmero de notas
2.2.3 Media geomtrica
Dada la muestra compuesta de n datos, X1, X2, X3,Xn, la media

geomtrica se define como la raz n-sima, de la productoria de los datos, es
decir:
= (=1 )1/ (5)
Donde:
: Media geomtrica
=1 : X1*X2* .* Xn (productoria de los datos)
Xi: i-simo valor de la muestra
n: nmero de elementos de la muestra
2.2.4 Mediana
Es un valor nico de un conjunto de datos que mide al elemento central en los datos.
Este nico elemento de los datos ordenados es el ms cercano a la mitad o el ms

central en el conjunto de nmeros. La mitad de los elementos quedan por encima
de ese punto y otra mitad por debajo de l.
Mediana para datos no agrupados
Sean X1, X2, X3,Xn, datos ordenados por magnitud creciente o

decreciente y nmero impar de datos, la mediana (Med) es el dato situado en el
centro, es decir:
+1
= , n impar (6)
2
Si n es par, la mediana es el promedio de los nmeros centrales, es decir:

+
+1
= 2 2
, n par (7)
2
Mediana de datos agrupados
Siendo la mediana el valor de la observacin central de un arreglo y como no se

conocen los valores de cada observacin en datos agrupados, la mediana se
suele aproximar, despus de localizar el intercalo de clase de la mediana, por la
siguiente ecuacin
+1
(+1)
= [ 2
] + (8)

Donde:
Med: mediana muestral
n: nmero total de elementos de la muestra
F: suma de todas las frecuencias hasta la clase de la mediana pero sin

incluirla
fm: frecuencia nicamente de la clase de la media
w: amplitud del intervalo de clase
Lm: lmite inferior
En general la clase donde se encuentra la mediana es aquella que tiene al

elemento situado en la porcin (n+1)/2
2.2.5 Moda
Es aquel valor que se repite ms frecuentemente en un conjunto de datos, se denota

por Mo.
Para datos agrupados en intervalos de clase, la moda, una vez determinada la clase
modal se calcula con la siguiente ecuacin:
1
= + 1+2 (9)
Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)
d2: diferencia entre la frecuencia de la clase modal y la postmodal (clase

siguiente)
w: amplitud del intervalo de clase
Lm: limite inferior de la clase modal
En general la clase modal es aquella que tiene la mxima frecuencia
2.2.6 comparacin entre la media, la mediana y la moda
La media, la mediana y la moda de una distribucin de frecuencias son

consideradas cono tres promedios ms importantes. Sin embargo, no son
igualmente aplicables y representativos a todas las situaciones. Como se muestra
en la fig. 7 las posiciones relativas de estas tres medidas dependen de la simetra
de la distribucin.
Si la distribucin es simtrica (fig. a), las tres medidas de tendencia central tienen
valores idnticos.
Si la distribucin es asimtrica (fig. b y c), los tres valores divergen, aunque siempre
para una distribucin unimodal, la moda est localizada en su punto ms alto y la
mediana esta ente la media y la moda.
Media
median
moda
a moda median
a Media
(a) (c)
median
a moda
Media
(c)
Figura 7. Localizacin de la media, mediana y moda

2.3 MEDIDAS DE DISPERSION.
Las medidas de dispersin o variabilidad permiten observar cmo se reparten o

dispersan los datos a uno y otro lado del centro. Si la dispersin es poca, indica gran
uniformidad de los datos en la distribucin. Por el contrario, gran dispersin indica
poca uniformidad.
2.3.1 Rango
Es una medida de distancia y representa la diferencia entre el mayor y el menor de

los valores observados, es decir:
R = Max Min (10)
Donde:
R: rango
Max: valor mximo de los datos
Min: valor mnimo de los datos

El rango o la amplitud es una manera conveniente de describir la dispersin, sin
embargo, no da medida alguna de la dispersin ente los datos con respecto al valor
central.
2.3.2 Varianza
Datos no agrupados:
La varianza poblacional (2), se define como la suma de cuadrados de las

desviaciones, de los datos con respecto a la media, dividida entre el nmero total
de datos, es decir:

=1()
2
2 = (11)

La varianza muestral (S2), se obtiene dividiendo la suma de cuadrados de las

observaciones de los datos con respecto a la media, entre el nmero total de
datos menos uno, es decir:

=1( )
2
2 = (12)
1
Para el clculo computacional es til expresar la sumatoria de la siguiente forma:
( )2 = ( 2 2 . + 2 )
2 2 () + 2 (13)
Pero:

= = (14)

Luego, sustituyendo (14) en (13), resulta:
( )2 = 2 2 () + 2
( )2 = 2 2 (15)
Sustituyendo (15) en (11), se tiene:

1
2 = (=1 2 2 )(16)
Y en (12) resulta:
1
2 = 1 (=1 2 2 ) (17)
Donde:
S2: varianza muestral
2= varianza poblacional
xi: valor i-simo de la muestra
=: media muestral o poblacional
n: nmero total de datos
Datos agrupados
Para el caso de datos agrupados en intervalos de clase, la varianza poblacional,

se define como la suma de los cuadrados de las desviaciones de las marcas de
clase con respecto a la media, por la frecuencia absoluta, dividido entre el nmero
total de datos, es decir:
2
=1() .
2 = (18)

Y la varianza muestral por:
2
=1( ) .
2 = (19)
1
Donde:
xi: valor de la i-sima marca de clase
=: media
fi: valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el intervalo

i
Para el clculo computacional, las ecuaciones (18) y (19), se pueden expresar:

1
2 = (=1 2 . 2 ) (20)
1
2 = 1 (=1 2 . 2 ) (21)
2.2.3 Desviacin Estndar

La desviacin estndar, se define como la raz cuadrada positiva de la varianza,
es decir:
= 2 (Poblacional)
= 2 (Muestral)
As se tiene, para datos no agrupados:
1
= (=1 2 2 ) (22)
1
= 1 (=1 2 2 ) (23)
Siendo:
1
= = =1 (24)
Para datos agrupados
1
= (=1 2 . 2 ) (25)
1
= 1 (=1 2 . 2 ) (26)
Siendo:
1
= = =1 . (27)
xi: valor de la i-sima marca de clase
= : Media
fi: valor de la i-sima frecuencia absoluta, es decir nmero de datos en el intervalo

i
2.3.4 COEFICIENTE DE VARIACION
Es una medida relativa de dispersin, que relaciona la desviacin estndar y la

media, es decir:

= (28)
Generalmente en geo estadstica se suele trabajar con datos mustrales.
2.4 MEDIDAS DE SIMETRIA Y ASIMETRIA
2.4.1 sesgo
El sesgo es el estadstico que mide la simetra y asimetra
Datos no agrupados:
El sesgo () para datos no poblacionales, se obtiene con la siguiente ecuacin:

= 33 (29)
Donde:

=1()
3
3 = (30)

1
= (( )2 )

=1

1
=

=1
El sesgo para datos mustrales, se obtiene con:

2
3
= (1)(2) 3 (31)
Donde:

=1( )
3
3 = (32)

1
= ( )2
1
=1

1
=

=1
Datos agrupados:
El sesgo ( ) para datos poblacionales, se obtiene con la siguiente ecuacin:

3
= 3
Donde:
3
=1()
3 = . (33)

1
= ( )2

=1
1
= =1
= marca de clase de intervalo i
= valor de la i-ensima frecuencia
K= nmero de intervalos de clase
n= nmero total de datos
El sesgo para datos mustrales, se obtiene con :

2
3
Cs = (1)(2) 3 (34)
Donde:
3
=1( )
M3 = (35)

1
= ( )2
1
=1
1
= =1

2.5 MEDIDAS DE ACHATAMIENTO.
El grado de achatamiento se mide con el estadstico denominado coeficiente de

curtosis.
2.5.1 Curtosis
Datos no agrupados:

K = .. (36)
4
=1()
3 = . (37)

1
= ( )2
1
=1
1
= =1
El coeficiente de curtosis para datos mustrales se define como:

3 4
Ck = ( 1)(2)(3)4 . (38)

=1( )
4
M4 = (39)

1
= ( )2
1
=1
1
= =1
Datos agrupados
El coeficiente de curtosis (k) para datos poblacionales se define mediante la

siguiente ecuacin

K = 44
Donde
4
=1()
4= ........ (40)

1
= ( )2

=1
1
= =1
El coeficiente de curtosis para datos mustrales, se define como:

3 4
Ck = ( 1)(2)(3)4 . (41)
Donde
4
=1( )
M4 = (42)

1
= ( )2
1
=1
1
= =1
Los clculos de los estadsticos de una serie de datos es por si laboriosa. Para la
simplificacin de los clculos, donde se requieren la determinacin de la media,
varianza, desviacin estndar, el coeficiente de variacin, coeficiente de variacin,
coeficiente de sesgo y coeficiente de curtosis.
2.6 EJEMPLO DE CLCULO
Dado los datos de precipitacin anual, en mm de la estacin, Mesapata, para el

periodo 1974-1986. Calcular su media, varianza, desviacin estndar, coeficiente
de variacin, coeficiente de sesgo y el coeficiente de curtosis.
AO PRECIPITACION AO PRECIPITACION
(mm) (mm)
1974 1418.60 1981 1441.50
1975 1527.30 1982 1133.20
1976 1108.60 1983 891.00
1977 1084.20 1984 1429.80
1978 1509.10 1985 1141.50
1979 1394.90 1986 1312.60
1980 1334.40
Solucin:
Los resultados que se obtienen, son los que se muestran:
SERIE
1418.60 1527.30 1108.60 1084.20 1509.10 1394.90 1334.40 1441.50

1133.20 891.00 1429.80 1141.50 1312.60
Numero de datos = 13
RESULTADOS
DATOS DATOS MUESTRALES

PROBLACIONALES
Media 1286,67 1286.67
Varianza 35214.73 38149.29
Desviacin estndar 187.66 195.32
Coeficiente variacin 0.15 0.15
Coeficiente sesgo -0.55 0.63
Coeficiente curtosis 2.20 3.12
2.7 PROBLEMAS PROPUESTOS
1. dadas las descargas medias del mes de mayo de un rio, en m3/seg.
AO Q m3/seg AO Q m3/seg
1971 3.99 1981 5.52
1972 2.96 1982 3.09
1973 1.79 1983 5.00
1974 1.55 1984 6.03
1975 2.48 1985 2.73
1976 2.61 1986 3.13
1977 2.27 1987 4.18
1978 1.86 1988 3.26
1979 2.07 1989 4.03
1980 2.70
Calcular la media, varianza, coeficiente de variacin, coeficiente de asimetra o
sesgo y coeficiente de curtosis.
Usar el proceso a pie y el proceso computacional.
2. si los datos del problema 1, se agrupan en los intervalos de clase que se

muestran calcular la media, varianza, coeficiente de variacin, coeficiente de
asimetra o sesgo y coeficiente de curtosis.
INTERVALOS DE MARCA DE
CLASE CLASE
1- 2 1.5
2 -3 2.5
3 -4 3.5
4 -5 4.5
56 5.5
6 -7 6.5
Usar el proceso a pie y el proceso computacional.
3. Se tiene una cuenca en la que se han instalado 8 pluvimetros. Las

precipitaciones promedio anuales registradas, en mm, para el periodo de 1970
1991 y las reas de influencia, en km2, de esas estaciones, se muestran en la
siguiente tabla.
ESTACION 1 2 3 4 5 6 7 8
AREA Km2 150 300 187 600 550 145 278 110
PRECIPITACION 2915 2563 3241 4017 5321 4621 5002 4932
Determinar la precipitacin promedio.

III. DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA
3.1 REPRESENTACION TABULAR Y GRAFICA DE LAS MUESTRAS
3.1.1 DEFINICIONES
En Geologa se trabaja con informacin de datos de muestreo, estas informaciones

pueden consistir en datos de leyes de cabeza de mineral, potencia de veta, precio
de los metales, etc.
Por lo general, se encuentra solo con una muestra de los datos de esa poblacin,
es decir nunca podemos disponer de la totalidad de los datos. Pero cuando estos
datos se organizan en forma compacta y fcil de utilizar, los gelogos pueden
disponer de una herramienta de gran utilidad, para tomar decisiones.
Existen muchas formas de clasificar los datos, una manera til es dividirlo en
categoras similares o clases y luego contar el nmero de observaciones que caen
en cada categora, lo que constituye una tabla de frecuencias o una distribucin de
frecuencias.
Para una muestra dada, se escoge un rango R, que contenga a todos los valores
de la misma. Se subdivide R en subintervalos que se llaman intervalos de clase; los
puntos medios de estos intervalos se denominan marcas de clase. Se dice que los
valores de la muestra en cada uno de los intervalos forma una clase. Al nmero de
valores en una clase se llama frecuencia de clase; su divisin en el tamao N de la
muestra es la frecuencia relativa de clase. Esta frecuencia considera como funcin
de las marcas de clase; se denomina funcin de frecuencias de la muestra, y se
denota con f(x). La funcin de frecuencias acumuladas de la muestra, se denota
como F(x), y se define como:
F(x) = () . (1)
3.1.2 PROCEDIMIENTO DE CLCULO
A continuacin se indica un procedimiento prctico, para el clculo de las

frecuencias y frecuencias acumuladas, la misma que se usara ms adelante para el
clculo de la distribucin de probabilidades empricas de datos agrupados en
intervalos de clase:
Procedimiento
1. Ordenar los datos de la muestra en forma creciente o decreciente puede

hacerse mediante el programa en Excel.
Por ejemplo, ordenando en forma creciente, se tiene:
Xmin, X2, X3,... ,Xmax
Donde:
Xmin = X1 es el valor mnimo de los datos
Xmax = XN es el valor mximo de los datos
2. Calcular el rango R de la muestra.

R = Xmax Xmin ( 2)
3. Seleccionar el nmero de intervalos de clase NC, este depende del tamao

de la muestra N. En aplicaciones de geologa, hidrologa el nmero de
intervalos de clase puede estar entre 6 y 25.
Yevjevich sugiere para seleccionar NC, las siguientes relaciones empricas:
(i) NC = 1.33 Ln(N) +1 (3)
(ii) Si N < 30 NC < 5
Si 30 < N < 75 8 NC 10
Si N > 75 10 < NC 30
Donde:
N : tamao de la muestra
Ln (N) logaritmo natural o neperiano del tamao muestral.

4. Calcular la amplitud de cada intervalo de clase x, segn la ecuacin:
max
x = = 1 . ( 4)
1
Al dividir el rango entre NC 1, lo que en realidad se hace es incrementar el

rango en x, incluyendo un intervalo ms, el mismo que resulta, de agregar
medio intervalo en cada extremo de la serie ordenada, a fin de que Xmin y
Xmax sern respectivamente, las marcas de clase de la primera y ltima clase.
Esto se aprecia en la figura 8.
Fig. 8: Representacin del total de la muestra en intervalos de clase

igualmente espaciados.
5. Calcular los lmites de clase de cada uno de los intervalos. Como se

manifest en 4, con el artificio de dividir entre NC-1 se logra que Xmin y Xmax
queden centrados y representan las marcas de clase de la primera y ltima
clase, entonces los lmites de clase inferior y superior del primer intervalo son
:
LCI1 = Xmin x/2 .. (5)
LCS1 = Xmin + x/2 = LCI1+x .. (6)
Los otros lmites de clase, se obtienen sumando la amplitud x, al lmite de

clase antecedente
6. Calcular las marcas de clase de cada uno de los intervalos. Las marcas de
clase se obtienen del promedio de los lmites de clase. As la marca de clase
del primer intervalo es :
1+1
1 = (7)
2
Con el artificio realizado anteriormente la marca de clase es igual al valor
mnimo, de igual forma la marca de clase del ltimo intervalo al valor mximo
es decir:
MCI = Xmin
MCn = Xmax
Las otras marcas de clase, se obtienen sumando la amplitud x, a las marcas
de clase antecedente.
7. Calcular la frecuencia absoluta, esta es igual al nmero de observaciones,

que caen dentro de cada intervalo definido por sus lmites de clases
respectivos, la misma que se obtiene por conteo, as se obtiene.
fabi = ni .. (8)
Donde:
fabi : frecuencia absoluta del intervalo i
ni : nmero de observaciones en el intervalo i
8. Calcular la frecuencia relativa fri de cada intervalo, esta es igual a la
frecuencia absoluta del mismo, dividido entre el nmero total de
observaciones, es decir:
fabi
fri = = . ( 9 )

9. Calcular la frecuencia relativa acumulada Fri, usando la frmula:
1
Fri = =1 = =1 = =1 . ( 10 )
Donde:
Fri: frecuencia relativa acumulada hasta el intervalo i.
J: 1, 2,..,i acumulacin de los intervalos hasta i
10. Calcular la funcin densidad emprica fi para cada intervalo. Esta funcin
segn Yevjevich, se calcula usando la frmula:

lim = = .. (11)
0
11. Calcular la funcin de distribucin acumulada o emprica usando la frmula:
= =1 (12)
3.1.3 EJEMPLO DE CLCULO
Dada la serie histrica de caudales medios anuales m 3/s (Tabla 3.1) de la

estacin Salinar del rio Chicama (Per) para el periodo 1911-1980, calcule
las frecuencias absolutas, relativas, acumulativas, funcin densidad, funcin
acumulada.
Tabla 3.1 Serie histrica de caudales medios anuales en m3/s del rio
Chicama. Estacin Salinar (1911-1980).
AO CAUDAL AO CAUDAL AO CAUDAL
M3/S M3/S M3/S
1911 7.91 1935 24.58 1959 22.88
1912 8.01 1936 28.49 1960 17.57
1913 13.27 1937 10.05 1961 14.60
1914 16.39 1938 28.01 1962 31.14
1915 80.83 1939 34.92 1963 18.20
1916 60.08 1940 31.36 1964 24.69
1917 21.55 1941 42.74 1965 22.99
1918 27.71 1942 12.94 1966 11.78
1919 28.63 1943 41.16 1967 32.26
1920 30.27 1944 35.90 1968 4.76
1921 33.43 1945 33.76 1969 12.70
1922 35.16 1946 29.28 19970 16.19
1923 27.21 1947 19.17 1971 30.14
1924 15.58 1948 29.37 1972 30.57
1925 64.81 1949 30.06 1973 45.38
1926 51.26 1950 9.67 1974 18.91
1927 33.48 1951 10.42 1975 34.99
1928 25.79 1952 23.99 1976 21.49
1929 25.80 1953 42.17 1977 29.26
1930 18.93 1954 16.00 1978 4.58
1931 16.15 1955 22.78 1979 12.46
1932 38.30 1956 32.69 1980 3.14
1933 54.54 1957 34.28
1934 59.40 1958 20.24
IV. ESTIMACION DE PARAMETROS:
Una funcin densidad emprica o una funcin de distribucin acumulada, pueden

escribirse como una funcin de variable aleatoria y en general como una funcin de
sus parmetros, as por ejemplo, la funcin densidad de la distribucin normal, de
variable aleatoria X, es:
1 2
() = 12[()]
2
Donde:
= parmetro de localizacin
2 = parmetro de escala
Para que la funcin f(x), quede definida, debe calcularse los parmetros y 2 .
Como normalmente, no se conocen todos los valores de la variable aleatoria, la
estimacin de los parmetros, se realiza a partir de una muestra.
Sea las variables de una muestra:
X1, X2, X3,.., Xn
Y si estos se ajustan a una distribucin normal los parmetros y 2 se estiman

a partir de:
=1
= =

2
=1( )2
2
= =

Donde:
: Es el estimador de la
: Es el estimador de 2.
Cualquier estimado desde la muestra es dominado un estimado o estimador de los

parmetros poblacionales.
4.1 DEFINICION DE ESTIMADORES.
Dada una funcin de distribucin con parmetros , , ,, se llaman

estimadores a los valores a, b, c,, a partir de los estadsticos de la muestra que
se supone que pertenece a la poblacin que se pretende caracterizar.
La bondad de estos estimadores est dado por diferencias (-a), (-b), (-c), etc.
pero como es fcil intuir hay infinitas posibilidades para a, b, c por lo tanto se
consideran como mejores estimadores aquellos que se aproximan ms a los
valores poblacionales y se llaman , , ,
Los estimadores se clasifican como:
Sesgado si:
E(a)=
Insesgado si:
E(a)= + v ()
Dnde: v () = E(a) es el sesgo.
Eficiente si:
El estimador es insesgado y adems:
VAR(a) =E (a-)2
Consistente si:
El tamao muestral N es largo
En geologa, se requiere principalmente que los estimadores sean insesgados y

eficientes, cuando se requiere extraer la mxima informacin desde los datos
mustrales.
3.5 METODOS DE ESTIMACION DE PARAMETROS.

Para determinar los valores numricos de los parmetros en distribucin
terica, a partir de los datos mustrales, se utilizan varios mtodos de
estimacin, siendo en orden ascendente de menor a mayor eficiencia:
Grafico
Mnimo cuadrado
Momentos
Mxima verosimilitud
3.5.1 METODO GRAFICO

Consiste en plotear los valores de la distribucin emprica sobre un
papel especial, donde la distribucin terica asignada apriori, se puede
representar con una lnea recta y de all estimar los parmetros
buscados.
As:
El papel de probabilidades normal, representa la distribucin normal como

una lnea recta.
El papel de probabilidades log-normal, representa la distribucin log-normal
es como una lnea recta.
El papel de probabilidades extremas, representa la distribucin gumbel

como una lnea recta
Por ejemplo para determinar los estimadores de y por medio de una muestra
dada correspondiente a una poblacin normal, hacer lo siguiente:
1. Plotear los valores de la distribucin emprica de la muestra.
2. Dibujar una muestra k se aproxime a los puntos, tanto como sea posible.
3. Calcular el valor correspondiente para una posibilidad de 50% este valor es ,

el cual es un estimador .
4. Calcular el
valor para una posibilidad del 84.13% el mismo k corresponde a +S, es decir.
+ = 2 = 2
es un estimador de .
4.2.2 METODO DE MINIMOS CUADRADOS
Este, mtodo ms aplicable para la estimacin de los parmetros de una ecuacin

de regresin.
Por ejemplo, dada la recta de regresin lineal:
Y = a + bX
Donde a y b son parmetros
El error entre el valor observado i y el terico es:

=
Y la suma de los cuadrados de los errores de los valores observados es:

= 2 = ( )2
=1 =1
Esta suma puede minimizarse para a y b, esto se consigue derivando

parcialmente S en funcin de cada estimando a y b, e igualando a cero, es decir:
= 2 =1( ) = 0 (1)
= 2 =1 ( ) = 0 (2)
Las ecuaciones (1) y (2) se denominan ecuaciones normales, las cuales resueltas
dan para a y b.

( )( )

= 2 =
( ) ( )2
2

= =

4.2.3 MOMENTOS DE LOS MOMENTOS
El principio bsico de la estimacin por el mtodo de los momentos es establecer

para cada funcin de distribucin la relacin entre los parmetros y momentos
centrales, de tal manera que:
= 1 ( , +1 , )
= 2 ( , +1 , ) (3)
= 3 ( , +1 , )
Donde:
, , : Son parmetros de la funcin de distribucin
, , : Son momentos con respecto a la media, o momentos centrales de la

poblacin.
Como los momentos son estimados a partir de los momentos de la muestra como
estimadores sesgados o insesgados, el resultado que se obtiene ser a, b, c, o
, , , como estimadores sesgados o insesgados de los parmetros.
Cuando la distribucin de probabilidad, a la que se estiman los parmetros por

este mtodo es simtrica y particularmente si es normal, se puede demostrar que
este mtodo es un mtodo muy eficiente, pero cuando la distribuciones son
asimtricas y por lo tanto sesgadas, como sucede muy a menudo con la mayora
de las variables geolgicas e hidrolgicas, el utilizar este mtodo representa una
prdida de eficiencia en la estimacin:
Ejemplos:
1.- dada la funcin densidad de la distribucin normal:

1 2
() = 12[(1 )2 ] Para - < x <
22
Estimar los parmetros 1 , 2 , por el mtodo de momentos.
Solucin:
Sabemos que:
1) la media poblacional es igual al 1er momento respecto al origen, es decir:

= () = 1 = () (4)
2) la varianza 2 es igual al 2do momento con respecto a la media, es decir:

() = 2 = 2 = ( )2 () (5)
Sustituyendo f(x) en (4) resulta:

1 2
= 12[(1 )2 ]
2 2
1 2
= 12[(1 )2 ]
22
(6)
Haciendo:
1
= = 1 + 2 = 2 + (7)
2
Lmites: si x - y -
x + y +
Sustituyendo (7) en (6), se tiene:
1 2 2
=
22
(1 + 2 ) 2

1 2 2 2 (2 )2 2 2
= +
22 22
1 2 2 2 2 2
=
2
+
22
(8)
Calculo de:
2 2 2 2 2 2
= = + 0 (9)
2
Siendo () = 12()
2 2
() = 12() = 12 = f(y)
Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0
() = 0 ()
Luego (9), se escribe:

2 2
= 0 12 + 0 12
2
= 2 0 12 (10)
Haciendo
2 = = 12

2 = = = 2 12
2
Limites:
Para y = 0 t =0
y t
Luego (10) se convierte en:

= 2 0 12 2 12

= 0 12 12 dt
Aplicando la transformacin de Laplace:

1 1
( 2 + 1) (2)
= 1 =
(1/2)2+1 (1/2)1/2
1
Pero (2) = (propiedad de la funcin gamma)

= 1
2
= 2 . (11)
Calculo de B
2
= 12
0 2 2
= 12 + 0 12 . (12)
1 2
Donde () = 2
1 1 2
()2
() = () 2 = () 2 = ()
Luego: (12) se escribe

12 2 2
= + 12
0 0
B=0 (13)
Sustituyendo (11) y (13) en (8), resulta

1 2
= 2 + (0)
2 2
= 1 ( lo que indica que el primer parmetro 1 es igual a la media )

1
1 = =

Sustituyendo f(x) en (5) se tiene:

1 2
2
= 2 = ( ) 12[(1 )2 ]
22
Como = 2

1 2
2 = 2 = ( 1 )2 12[(1 )2 ]
22
Haciendo:
1
= = 1 + 2 = 2
2
Lmites: si x - y -
x + y
Luego:

1 2
2 = 2 2 2 1/2 2
22
2
2 2
2
= 2 1/2
22
2
Siendo f(Y)= 2 1/2 y f(-y)=f(y) (funcin par), por lo cual

() = 2 ()
Luego:
2
2 2
2
= 2 1/2
2 0
Haciendo:

2 = = 1/2 = 2 1/2
Limites.
Para y = 0 t =0
y t
Se tiene:
22 2

2
= 12
2 0 2 12
2 2
2
= 1/2 12
2 0
Aplicando transformacin de Laplace:

1
2
2 2 (2 + 1)
= .
2 (1/2)3/2
1
2
2 2 1/2(2)
= .
2 (1/2)3/2
Pero: r(1/2) = luego:
2
2 2
= .
2 (1/2)1/2
2 2
2 = . 2
2
2 = 2 2 ( el parmetro 2 es igual )
1
2 = 2 2 = ( )2
1
1
2 = ( )2
1
2. Dada la funcin densidad de la distribucin Poisson:

Para x= 0, 1, 2,
!
f(x)=
0 En otro caso
Calcular usando el mtodo de momentos:
El parmetro
La varianza
Solucin:
1. como X es una variable discreta:
= () = ()

=

=0

=
( 1)
=0
0
= +
=1 (1)
(1)
Pero (-1) = r(0) =
Pero:
0
= r(0) = =0
(1)
Luego:

=
( 1)
=1

1 2 3
= .( + + + )
0 1 2
2 3
= . (1 + + + )
1 2
Pero:
2 3
(1 + + + ) = (Por desarrollo de serie de Taylor)
1 2
Entonces:
Falta 88 y 89
4.2.4. METODO DE MAXIMA VEROSIMILITUD
Dada una funcin densidad de probabilidad.
(, , , , . )
Donde:
, , , . Son los parmetros que deben ser estimados.
Se define la funcin verosimilitud de la muestra, como la productoria:
L = f( , , , , )
=1
L = f( , , , , . ) (2 , , , , . ) . . ( , , , , . )
Siendo N el tamao de la muestra:
El mtodo de mxima verosimilitud, consiste en estimar , , g, a partir de la

muestra de tal manera que L sea mxima. Esto se obtiene por la diferenciacin
parcial de L con respecto a cada parmetro e igualando a cero.
Puesto que f(x) es no negativo, un valor mximo de L ser, en general positivo.

Como el logaritmo natural ln(L) es una funcin monotmicamente creciente de L,
esta tiene un mximo precisamente en los puntos en que L tiene un mximo. Por
lo tanto, se puede usar lnL en lugar de L, es decir:
N
L = f( , , , , ) = ln f( , , , , )
=1 =1
Este artificio, permite transformar una productoria a una sumatoria, donde:
a, b, c son estimadores de , , g,
Entonces el conjunto de ecuaciones de mxima verosimilitud es:

= 0; =0; = 0 ;

El mismo que tiene tantas ecuaciones como incgnitas.
Las propiedades de los estimadores calculados por el mtodo de mxima

verosimilitud, son:
Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el
mtodo puede producirlos.
La solucin de la ecuacin de verosimilitud proporciona un estimador que
converge al valor poblacional cuando el tamao muestral tiende a infinito,
por lo que el estimador es consistente.
Ejemplos:
1. Dada la funcin densidad de la distribucin exponencial:

() = { > 0, > 0
0
Estimar el parmetro l, usando el mtodo de mxima verosimilitud.
Solucin:
Sea la funcin de verosimilitud:
L = f( , )
=1
Siendo: f( , ) =
Luego:
L =
=1
= ln( )
=1
= ln( + )
=1
= ln( )
=1
Derivando con respecto a l, se tiene:

= = [ ln( )] = 0

=1

1
( ) = 0

=1

1
= 0

=1 =1

1
=

=1

1 1
=

=1
1 1
= 1 =

=1
X
2. Dada la funcin densidad de la distribucin normal
1 1 [ / ]2
() = 2 1 2 < <
2 2
Estimar los parmetros 1 /2 , por el mtodo de mxima verosimilitud.

Solucin:
1. La funcin de verosimilitud es:
N
1 1 [ / ]2
L= 2 1 2
=1
2 2
2. Tomando ln:

1 1 [ / ]2
= ln( ) 2 1 2
=1
2 2

1 1 2
= ln (2 2 ) ( )
2 2
=1

1
= [ln(2 1 2 ) ()2 ]
2
=1
Derivando con respecto a 1 , 2 , resulta:
1 1 1
a) = =1 [ 2 2( )( )] = 0
2 2

1
=0
2
=1

1
( 1 ) = 0
2 2 =1

1 = 0
=1 =1

= 1
=1 =1

= 1
=1

1
1 = = X

=1
1 1
b) = =1 [ 2 ( 1 )2 (22 3)] = 0
2

1 ( 1 )2
[ + ]=0
=1
2 2 3

1 ( 1 )2
[1 + ]=0
2
=1
2 3

( 1 )2
(1) + =0
=1 =1
2 3

1
( 1 )2 =
2 2 =1

1 ( 1 )2
= 2 2

=1

1
2 2 = ( 1 )2 = 2

=1
4.3 PROBLEMAS PROPUESTOS
1. dada la funcin densidad de la distribucin uniforme:
1
() =

Estimar sus parmetros , utilizando el mtodo de momentos.

2. dada la funcin densidad de la distribucin exponencial:
() = > 0, >0
Estimar su parmetro , utilizando el mtodo de momentos.
3. Dada la funcin densidad de la distribucin de Poisson:

() = { ! = 0, 1, 2,
0
Calcular el parmetro , usando el mtodo de mxima verosimilitud.

4. dada la funcin densidad de la distribucin exponencial de dos parmetros:
() = () > , >0
Estimar sus parmetros , , utilizando el mtodo de momentos.

5. dada la funcin densidad de la distribucin exponencial de dos parmetros:
() = () > , >0
Estimar sus parmetros , , utilizando el mtodo de mxima verosimilitud.
V. PRUEBAS DE BONDAD DE AJUSTE
Las pruebas de bondad de ajuste consisten en comprobar grfica y

estadsticamente, si la frecuencia emprica de la serie analizada se ajusta a una
determinada funcin de probabilidades terica seleccionada a priori, con los
parmetros estimados en base a los valores mustrales.
Las pruebas estadsticas, tienen por objeto medir la certidumbre que se obtiene al
hacer una hiptesis estadstica sobre una poblacin, es decir calificar el hecho de
suponer que una variable aleatoria se distribuya segn una cierta funcin de
probabilidades.
Las pruebas de bondad de ajuste ms utilizadas son:
Ajuste grafico
chi cuadrado
Ajuste estadistico {
Smirnov Kolmogorov
5.1 AJUSTE GRAFICO

El ajuste grafico se puede realizar de las siguientes formas:
Comparar grficamente el histograma o funcin densidad emprica de la
serie de datos con la funcin densidad terica y decidir visualmente si hay
o no ajuste de acuerdo a la similitud o diferencia de ambos,
respectivamente.
Comparar grficamente la funcin acumulada de la serie de datos, con la
funcin acumulada terica seleccionada, dibujada en papel milimtrico, y
decidir visualmente si hay o no ajuste.
Se puede comparar tambin grficamente la funcin acumulada de la serie

de datos, con la funcin acumulada terica, ploteada en un papel
probabilstico adecuado, donde la distribucin terica seleccionada, se
puede representar como una lnea recta. As se tienen disponibles los
papeles probabilsticos normal, log-normal, gumbel, etc.
El procedimiento consiste en plotear los valores de la variable (leyes,
precipitacin, temperatura, etc.), versus la probabilidad emprica en el papel
de probabilidad correspondiente. Si los puntos ploteados se agrupan
alrededor de una lnea recta, que es la representacin de la distribucin
terica, se puede afirmar con cierta certeza que estos datos se ajustan a la
distribucin deseada.
5.2 PRUEBA CHI CUADRADO
La prueba chi-cuadrado es la ms comnmente usada para verificar la
bondad de ajuste de la distribucin emprica a una distribucin terica
conocida.
La expresin general de chi-cuadrado est dado por:
2 = =1( )2 / . ..(1)
Donde:

= =
= =
2
=Valor calculado de chi-cuadrado, a partir de los datos.
=Nmero de valores observados en el intervalo de clase i.
=Nmero de valores esperados en el intervalo de clase i.
=Nmero de intervalos de clase.
Asignado probabilidades a la ecuacin (1) es decir, asignando igual
probabilidad de ocurrencia a cada intervalo de clase, se tiene:

2 ( )2
= (2)

=1
Donde:
= Nmero de observaciones que caen dentro de los lmites de clases
ajustadas del intervalo i.
= Tamao muestral
= Probabilidad igual para todos los intervalos de clases.
i
Pi = k o ei = NPi . (3)
Simplificando la ecuacin (3), se obtiene la forma computacional desarrollada

por Markovic (1965).

2
= 2 (4)

=1
El valor 2 obtenido por la ecuacin (4) se compara con el 2 obtenido de

las tablas, cuyo valor se determina con:
Nivel de significacin: =0.05 o =0.01
Grados de libertad: g.l.= k-1-h
Dnde:
K= Nmero de intervalos de clase.
h = Es el nmero de parmetros a estimarse, as:
h = 2, para la distribucin normal
h = 3, para la distribucin log-normal de 3 parmetros
El criterio de decisin se fundamenta en la comparacin del valor calculado
de chi-cuadrado con el valor tabular encontrado, esto es:
Si el chi-cuadrado calculado es menor o igual que el valor de la tabla,
es decir:
2 2,
Entonces se acepta la hiptesis de que el ajuste es bueno al nivel de
significacin seleccionado.
Si el chi-cuadrado calculado es mayor que el valor tabular, es decir:
2 > 2,
Entonces el ajuste es malo y se rechaza la hiptesis, siendo necesaria
probar con otra distribucin terica.
VENTAJAS Y LIMITACIONES
1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha sido
desarrollado en base a datos normales e independientes.
2. Es realizado en la funcin densidad de datos agrupados en intervalos de
clases.
3. Requiere un conocimiento a priori de la funcin de distribucin terica
utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajust, pero estrictamente es
vlido solo para la normal.
5. Es de fcil aplicacin
6. Al utilizar esta prueba, se debe tener cuidado que en cada intervalo de clase,
se tenga por lo menos 5 observaciones.
5.3 PRUEBA DE BONDAD DE AJUSTE SMIRNOV-KOLMOGOROV
La prueba de ajuste de Smirnov-Kolmogorov, consiste en comparar las

diferencias existentes entre la probabilidad emprica de los datos de la
muestra y la probabilidad terica, tomando el valor mximo del valor absoluto,
de la diferencia entre el valor observado y el valor de la recta terica del
modelo, es decir:
= |() ()|. (5)
Donde:
= Estadstico de Smirnov-Kolmogorov, cuyo valor es igual a la diferencia

mxima existente entre la probabilidad ajustada y la probabilidad
emperica.
F(x) = Probabilidad de la distribucin de ajuste o terica
P(x) = Probabilidad experimental o emperica de los datos, de denominada

tambin frecuencia acumulada.
El estadstico tiene su funcin de distribucin de probabilidades.
Si o es un valor crtico para un nivel de significacin , se tiene que:

P { max | F(x) P(x) | o } = o
P( o) = (6)
Tambin:
P( < o) = 1 (7)
5.4 PROCEDIMIENTO.
El procedimiento para efectuar el ajuste con Smirnov-Kolmogorov, es:
1. Calcular la probabilidad empica o experimental P(x) de los datos, para

esto usar la frmula de Weibull:

P(x) = +1.(8)
Dnde:
M = Nmero de orden.
N = Nmero de datos
Existen varias frmulas para calcular la probabilidad experimental, la misma

que se muestra en la tabla 1, siendo la ms utilizada la frmula de Weibull.
2. Calcular la probabilidad terica F(x).
2.1. Para el caso de utilizar el procedimiento de los modelos tericos, Usar

la ecuacin de la Funcin acumulada F(x), o tablas elaboradas por tal
fin.
2.2. Si se quiere aplicar el procedimiento grfico, se utiliza un papel

probabilstico especial donde F(x), puede representarse como una lnea
recta, por lo cual, se puede trazar con solo 2 puntos, pero si se quiere
chequear que es una recta, se puede plotear 3 puntos, por ejemplo para
el caso de una distribucin normal, los puntos:
Tabla 1. Frmulas para determinar la probabilidad experimental.
Mtodo Probabilidad
experimental
P
m
California n
m-1/2
Hazen n
m
Weibull n+1
m - 0.3
Chegadayev n + 0.4
m-3/8
Bom n+
3m 1
Tukey 3n + 4
ma
Gringorten n + 1 2a
Dnde:
P = Probabilidad experimental o frecuencia relativa emprica.
m = Numero de orden
n = Numero de datos
a = Valor comprendido en el intervalo 0 < a < 1, y depende de n, de
acuerdo a la siguiente tabla:
n 10 20 30 40 50
a 0.448 0.443 0.442 0.441 0.440
n 60 70 80 90 100
a 0.440 0.440 0.440 0.439 0.439
Probabilidad
Valor %

50
+ S
84.13
- S
15.87
Representados en un papel de probabilidad normal, forman una recta.
3. Calcular las diferencias P(x) F (x), para todos los valores de x.

4. Seleccionar la mxima diferencia
5. Calcular el valor crtico del estadstico de , es decir o para un =
0.05 y N igual al Nmero de datos. Los valores de o, se muestran en
la tabla 2.
Tabla 2 valores crticos de o del estadstico Smirnov- kolmogorov , Para varios

valores de N y niveles de significacin
TAMAO NIVELES SIGNIFICACION

MUESTRAL
N 0.20 0.10 0.05 0.01
5 0.45 0-51 0.56 0.67
10 0.32 0.37 0.41 0.49
15 0.27 0.30 0.34 0.40
20 0.23 0.26 0.29 0.36
25 0.21 0.24 0.27 0.32
30 0.19 0.22 0.24 0.29
35 0.18 0.20 0.23 0.27
40 0.17 0.19 O.21 0.25
45 0.16 0-18 0.20 0.24
50 0.15 0.17 0.19 0.23
N >50 1.07 1.22 1.36 1.63

6. Comparar el valor del estadstico , con el valor critico o de la tabla

2, con los siguientes criterios de decisiones deducidos de la ecuacin
(6).
Si < o el ajuste es bueno, a nivel de significacin
seleccionado.
Si 0 el ajuste no es bueno, al nivel de significacin
seleccionado.
VENTAJAS Y LIMITACIONES
a. No requiere un conocimiento a priori de la funcin de la distribucin

terica.
b. Es aplicable a distribuciones de datos no agrupados, es decir no se
requiere hacer intervalos de clase.
c. Es aplicable a cualquier distribucin terica.
d. Se aplica en la funcin de distribucin acumulada y no en la funcin de
densidad.
e. Comparndola con la prueba chi- cuadrado, no hay condicin de que
cada clase de frecuencia deba contener un mnimo de 5 valores
observados.
f. No es una prueba exacta, sino una prueba aproximada.
VI DISTRIBUCIONES TEORICAS
El hidrlogo generalmente tendr disponible un registro de datos hidrometerologico

(precipitacin, descarga, evapotranspiracin, etc.), a travs de su conocimiento del
problema fsico, escoger un modelo probabilstico a usar, que represente en forma
satisfactoria el comportamiento de la variable.
Para utilizar estos modelos probabilsticos, se debe calcular sus parmetros y

realizar la prueba de bondad de ajuste, un esquema de este proceso se muestra en
la figura 15.
Encontrada la ley de distribucin que rige a las variables aleatorias se podr

predecir con determinada probabilidad, la ocurrencia o no ocurrencia, de una
determinada magnitud de un fenmeno Hidrometeorolgico.
Las distribuciones tericas comnmente utilizadas en Hidrologa, son entre otras:
Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel
Las cuales se ven en este capitulo
6.1. DISTRIBUCION NORMAL O GAUSSIANA
1. FUNCION DENSIDAD
La funcin densidad de la distribucin normal es:

2
1
1
[ ]
() = 2 ..(1)
2
2
1
1 [ ]
() = 2 (2)
2
Para - < x < .
Fig. 15. Proceso de seleccin de una distribucin terica.
Seleccion de una
distribucin
REGISTRO DE DATOS
ELEGIR UNA
DISTRIBUCION
TEORICA
ESTIMACION DE
PARAMETROS
PRUEBA DE
BONDAD DE
AJUSTE
F V
AJUSTE
BUENO
UTILIZAR DISTRIBUCION TEORICA

ELEGIDA
FIN
Donde:
f(x) = funcin densidad normal de la variable x.
x = variable independiente.
= parmetro de localizacin igual a la media aritmtica de x.
S = parmetro de escala, igual a la desviacin estndar de x.
Exp = funcin exponencial con base e, de los logaritmos neperianos.
Decimos que la variable aleatoria X, se distribuye normalmente con media =

y una varianza ( 2 = 2 ) y se representa:
X----- N(, 2 )
El grafico de la funcin densidad es:
F(x) es la funcin de distribucin de la distribucin para la variable original x,

segn la ecuacin (6), o tambin para la variable estandarizada Z, segn la ec.
(8), es decir F(x) = F(Z).
Esta funcin de distribucin tiene las siguientes funciones:

F() = 0
F() = 0.5
F(+) = 1
3. CALCULO DE LA FUNCION DE DISTRIBUCION ACUMULA
Existen tablas, por ejemplo las tablas 1 y 2 del apndice que permite calcular F(Z).
Para realizar clculos computacionales de F(Z), se utiliza funciones de

aproximacin, dentro de las cuales se pueden mencionar:
a) Abramowitz stegun (1965) han dado varias aproximaciones para la F.D.A.

de la Variable normal estandarizada Z . Una aproximacin polinomial con un error
menor que 10-5 es:
F(Z) 1- f(Z)(0.043618V 0.1217V2 + 0.9373V3) ..(10)
Donde:
F(Z) = es la funcin de distribucin acumulada
f(Z) = es la funcin densidad de la variable estandarizada
V = es definido para Z 0, como:

V = +.|| ..(11)
b) Masting (1955), ha dado una aproximacin polinomial que ha sido utilizado

por la IBM (1968). Esta aproximacin con un error menor que 7.5 x 10 -8 , es:
F(Z) 1- f(Z)( b1w + b2w + b3w + b4w + b5w)

..(12)
Donde:
W es definido para Z 0, como:
1
W = 1+0.2316419|| (13)
Siendo las constantes:
b1 = 0.319381530 b4 = -0.356563782
b2 = 1.781477937 b5 = - 1.821255978
b3 = 1.330274429
En ambas aproximaciones la F.D.A. es 1- F(Z), si Z<0
4. ESTIMACION DE PARAMETROS
Para estimar los parmetros de distribucin terica se puede usar el mtodo de

momentos o el mtodo de mxima verosimilitud.
Cabe mencionar que la distribucin normal, es la nica funcin de distribucin, que

produce los mismos resultados de los parmetros, estimados por el mtodo de los
momentos y mxima verosimilitud, los parmetros obtenidos son los siguientes:
1
= =
=1 X i
1
S = =[1 2 1/2
=1( - ) ] ..(14)
Donde:
= es el estimado de la media, llamado tambin parmetro de posicin.
S= es el estimado insesgado de la desviacin estndar parmetro de

escala.
5. APLICACIONES EN HIDROLOGIA
L a distribucin normal tiene gran utilidad en hidrologa, siendo alguna de sus

principales aplicaciones:
En el ajuste de distribuciones empricas de variables hidrolgicas de intervalos

de tiempos grandes, tales como variables medias anuales, estacionales, etc.,
que puede ser descargadas, precipitaciones, entre otros.
Anlisis de los errores aleatorios en las observaciones o mediciones
hidrolgicas.
Como referencia para comparar varias distribuciones tericas de ajuste en una
distribucin emprica.
Para hacer procesos de inferencia estadstica.
Para generacin de datos por el mtodo de Monte Carlos. El inconveniente en
la generacin de datos es que se obtienen valores negativos, lo cual
fsicamente no es justificado.
6. AJUSTE
El ajuste puede realizarse grficamente utilizando papel probabilstico normal o

analticamente, mediante los estadsticos chi-cuadrado o Smirnov Kolmogorov.
6.2. DISTRIBUCIONES LOGARITMICAS

Las distribuciones logartmicas ms conocidas son la Log-normal, Log-Pearson
tipo 3 y Log-Gumbel. Por ejemplo, si la variable aleatoria X, tiene una
distribucin log-normal, esto significa = , tiene una distribucin normal.
Anlogamente, si X es una variable aleatoria log-Pearson tipo 3, = , es
una variable aleatoria Pearson tipo 3.
Tambin, si la variable aleatoria X, tiene una distribucin log-Gumbel, = ,
es una variable aleatoria Gumbel. Es posible una generalizacin, en el caso que
se introduzca un lmite inferior 0, en cuyo caso , anteriores, es sustituido
por ln( 0 ).
6.2.1 DISTRUBUCIONES LOG-NORMAL
Hay una distribucin Log-normal de 2 parmetros y otra de 3 parmetros. En la de

3 parmetros, el tercer parmetro es el lmite inferior 0, denominado parmetro de
posicin.
6.2.1.1 DISTRIBUCION LOG-NORMAL DE 2 PARAMETROS
La variable aleatoria X, es positiva y el lmite inferior 0 no aparece.
La variable aleatoria: = , es normalmente distribuida con media y varianza

2 .
Se usan estos parmetros para especificar que la distribucin es logartmica, puesto
que tambin puede usarse la media y varianza de X.
1. FUNCION DENSIDAD
La funcin de distribucin de Y, es:
1 2
1 ( )
() = 2
.... (15)
2
( , 2 )
para < y <
Refiriendo la funcin de distribucin de Y como f(x), se tiene:

() = ()

Donde:
1
= ln =

Por esta razn, la funcin de distribucin de probabilidad de X es:

2
1
1 ( )
() = 2
(16)
2
( , 2 )
2. FUNCION DE LA DISTRIBUCION ACUMULADA

2
1

1 ( )
() = 2
dy . (17)
2

Si =
2
1
() = 2 dZ ... (18)
2
(0,1)
3. ESTIMACION DE PARAMETROS POR EL METODO DE MOMENTOS

Utilizando el mtodo de momentos, las relaciones entre la media y la varianza de la
variable X y los parmetros y 2 , que se obtienen son:
2
Media: = () = ( + )
2
Varianza: 2 = ( ())2 = (2 + 2 )(( 2 ) 1)
2 1
Desv. Est : = ( + )(EXP( 2 ) 1) 2
2
1
Coeficiente de variacin: = = (EXP( 2 ) 1) 2
De donde:
2 = ln(1 + 2 ) . (19)
1
= 2 + ln
2
1 2
= 2 ln( 2 ) . (20)
+1
Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (21)
2 2
Para valores prcticos de 2 : 0.1 < 2 < 0.6, la relacin es casi lineal y puede
ser aproximado por:
= = 0.52 + 4.85 2 . (22)
Que es correcto dentro del 2%, en el rango mencionado.
En la figura 16, se presenta la funcin densidad de la distribucin log-normal de 2

parmetros, para varios valores de y 2 .
Fig. 16. Distribucin log-normal de 2 parmetros, con varios valores de y .
6.2.1.2 DISTRIBUCION LOG-NORMAL DE 3 PARMETROS
Esta difiere de la distribucin log-normal de 2 parmetros por la introduccin de un

lmite inferior 0, tal que:
= ln( 0 ) ( , 2 )
La funcin de distribucin de probabilidad de x es:

1 ln(0 ) 2
1 ( )
() = ( 2
. (23)
0 ) 2
0 <
0 : Parmetro de posicin en el dominio x
: Parmetro de escala en el dominio x
2 : Parmetro de forma en el dominio x
1. ESTIMACION DE PARMETROS, MTODOS DE MONENTOS

Utilizando el mtodo de los momentos, las relaciones entre la media, la varianza y
el coeficiente de sesgo, de la variable X y los parmetros de 0 , y 2 , que se
obtiene, son:
2
Media: = () = 0 + + 2 . (24)
2 2
Varianza: 2 = ( ())2 = 2 + ( 1) . (25)
Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (26)
2 2
= = 0.52 + 4.85 2 . (27)
Para datos muestrales el coeficiente de sesgo es:

2
3
= = (1)(2) 3 . (28)
Donde:
( )3
3 = . (29)

( )2
S= . (30)
1

= . (31)

Luego:
0.52
De (27): = . (32)
4.85
1 2
De (25): = 2 (ln ( 2
) 2 ) . (33)
1
2
De (24): 0 = + 2 . (34)
6.2.2 EJEMPLO
3
Dada la serie histrica de caudales medio anuales, en . que corresponde a
un registro de 50 aos para el rio Santa (Per):
95.05 98.13 100.18 101.66 101.76

105.21 105.81 106.40 107.43 107.62
108.75 110.77 114.31 116.40 119.52
123.00 123.22 124.31 127.82 128.15
132.49 134.10 136.22 144.22 145.79
246.08 153.64 153.97 154.80 156.80
158.48 162.29 164.35 169.18 169.64
177.00 182.53 183.11 183.49 184.98
193.78 193.88 197.58 207.78 208.18
212.48 217.52 239.07 256.62 266.54
1. Averiguar si se ajustan a una distribucin log-normal de dos parmetros

2. El caudal a para un periodo de retorno de 75 aos.
SOLUCION:
1) Ajuste a la distribucin log-normal de dos parmetros:

Utilizando los programas del listado 6(para crear el archivo de datos) y el listado
7(para realizar la prueba de bondad de ajuste), se encuentra que los datos, se
ajustan a la distribucin log-normal de dos parmetros, con un nivel de
significancia del 5%, o a una probabilidad de 95%.
Un resumen de los resultados obtenidos con el programa es:
= 0.0747
0 = 0.1923, para un nivel de significancia del 5%
Como: = 0.0747 < 0 = 0.1923, se concluye que los datos se ajustan a al

distribucin log-normal de 2 parmetros, con un nivel de significancia del 5%.
2) Calculo de un caudal para un periodo de retorno de 75 aos:
1
( = ) = ( ) = 1

1
( = ) = 1
75
( = ) = 0.9866666 = ()
De la tabla 2 del apndice, para () = 0.9866666, se obtiene por interpolacin:

Z= 2.215
Pero para una distribucin log-normal de 2 parmetros, la variable estandarizada
es:
ln
= . (1)

El programa del listado 7, permite calcular tambin los parmetros y , siendo
los valores obtenidos:
= 4.9861
= 0.2808
Sustituyendo valores en la ec. (1), se tiene:

ln 4.9861
= 2.215
0.2808
De donde:
= 2.2150.2808+4.9861
3
= 272.618
6.3. DISTRIBUCIN GAMMA
Otra distribucin que juega un papel importante en Hidrologa es la distribucin

Gamma. Su aplicacin es tan comn, como el uso de la distribucin log-norma.
6.3.1. DISTRIBUCIN GAMMA DE DOS PARMETROS
1. FUNCIN DENSIDAD
Se dice que una variable aleatoria X, tiene una distribucin gamma de 2

parmetros si su funcin densidad de probabilidad es:
1 /
() =
()
para:
siendo:
= parmetro de forma (+)
= (+)
() = , :

() = 0 1 / que converge si > 0
La funcin gamma tiene las siguientes propiedades:
() = ( 1)! para = 1, 2, 3,
( + 1) = x() para > 0
(1) = (2) = 1
(1/2) =
(0) =
Si > 0 pero no entero, puede () ser calculado por expansin de series e

integracin numrica por:
2 1 1 1 1
() = [1 + + +]
12 288 2 51840 3 2488320 4
Para ms detalles sobre las propiedades de la funcin gamma completa, su forma

de clculo y la transformada de Laplace, ver anexo.
2. FUNCIN ACUMULADA
La funcin de distribucin acumulada, de la funcin gamma incompleta de 2

parmetros es:
1 /
() = 0 (44)
()
La integral de la ec. (44) puede evaluarse para valores dados de y , usando la

tabla 7 del apndice, en la cual se ha tabulado la funcin gamma incompleta. En
esta tabla se dan los valores de la probabilidad de excedencia 1 (), y se entra
con:
2
2 = y = 2 (45)

si es entero, la funcin de distribucin gamma acumulada, segn Mood et al

(1974), puede calcularse por:
1
/

() = 1 ( ) /!

La variable aleatoria reducida est dada por:

= (46)
la cual reduce la funcin de densidad de probabilidad a:
1
() = (47)
()
y la funcin de distribucin acumulada:

1
() = 0 (48)
()
las funciones reducidas contienen el parmetro , por lo cual cada valor positivo
de determina una funcin diferente. Un extracto de las tablas de Wik,
Gnanadesikan Huyett (1962), para las variables aleatorias reducidas Gamma, se
muestra en la tabla 1.
Tabla 1. Funcin de variables aleatorias reducidas Gamma, G(Y), en funcin de Y

y .
() = = = = =
0.10 0.105 0.532 2.433 6.221 14.53
0.20 0.223 0.824 3.090 7.289 16.17
0.30 0.357 1.097 3.634 8.133 17.44
0.40 0.511 1.376 4.148 8.904 18.57
0.50 0.693 1.678 4.671 9.669 19.67
0.60 0.916 2.022 5.237 10.476 20.81
0.70 1.204 2.439 5.890 11.387 22.08
0.80 1.609 2.994 6.721 12.519 23.63
0.90 2.303 3.890 7.994 14.206 25.90
0.95 2.996 4.744 9.154 15.705 27.88
0.99 4.605 6.638 11.605 18.783 31.85
En el listado 8, se presenta un programa, que tiene una subrutina que permite

calcular la funcin gamma acumulada ().
La representacin grfica de la funcin densidad y la funcin de distribucin
acumulada, para una variable aleatoria X, que sigue una distribucin gamma, con
= 5 y = 5.63, se muestra en la figura 17.
3. ESTIMACIN DE PARMETROS, MTODO DE MOMENTOS
Utilizando el mtodo de los momentos, las relaciones entre la media, la varianza y

el coeficiente de sesgo, de la variable X y los parmetros y de la distribucin
gamma, que se obtiene son:
Fig. 17. funcin densidad y funcin acumulada de la distribucin gamma de

dos parmetros.
media: = () = (49)
varianza: 2 = 2 (50)
2
coeficiente de sesgo: = = 1/2 (51)
2
De las ecs. (49) y (50), se tiene: = (52)
2
2
De las ecs. (49) y (52), resulta: = 2 (53)
4. ESTIMACIN DE PARMETROS, MTODO DE MXIMA

VEROSIMILITUD
Thom (1958), estableci que para < 10, el mtodo de momentos produce una
estimacin inaceptable de los parmetros y . Para cerca de 1 el mtodo de
momentos usa solamente el 50% de la informacin de la muestra para estimar y
solamente el 40% para estimar .
Greenwood y Durand (1960), presentan las siguientes relaciones aproximadas de

estimacin de parmetros por el mtodo de mxima verosimilitud:
para: 0 0.5772
= (0.5000876 + 0.1648852 0.0544274 2 ) (54)
y para:
8.898919+9.05995+0.97753732
= (55)
(17.79728+11.968477+ 2 )
donde:

= (56)
siendo:

= (57)

Greenwood y Durand (1960), establecieron que el mximo error de la ecuacin

(54) es de 0.0088% y en la ecuacin (55) es 0.0054%.
6.3.2. DISTRIBUCIN GAMMA INCOMPLETA DE 3 PARMETROS O

PEARSON III
1. FUNCIN DENSIDAD
Se dice que una variable aleatoria X, tiene una distribucin gamma de 3

parmetros o distribucin Pearson III, si su funcin de densidad de probabilidad
es:
( )1 ( )/
() = (58)
()
para:
<
<
0<
0<
2. FUNCIN ACUMULADA
La funcin de distribucin acumulada de la distribucin gamma de 3 parmetros

es:
( )1 ( )/
() = (59)
()
en la cual:
: variable aleatoria gamma de 3 parmetros o Pearson tipo III
: origen de la variable x, parmetro de posicin
: parmetro de escala
: parmetro de forma
(): funcin gamma completa
La representacin grfica de la funcin densidad y de la funcin de distribucin

acumulada, para = 10, = 5 y = 3, se muestra en la figura 18.
Fig. 18. Funcin densidad y funcin acumulada de la distribucin gamma de

3 parmetros.
La variable reducida Y Pearson tipo III, es:

= (60)

La funcin acumulada Pearson III reducida es:

1
() = (61)
()
la cual tiene como parmetro , y cuya variable aleatoria tienen origen en = 0
= .
3. ESTIMACIN DE PARMETROS, MTODO DE MOMENTOS
Aplicando el mtodo de momentos, se obtuvieron las siguientes relaciones:
media: = + (62)
varianza: 2 = 2 (63)
2
sesgo: = = (64)

de donde:
4
= 2 (65)

= /2 (66)
= 2/ (67)
4. APLICACIN EN HIDROLOGA
Su uso en hidrologa est casi tan difundido como el uso de la distribucin log-
normal de 3 parmetros, con la desventaja de la mayor complicacin al estimar
sus parmetros y calcular los valores de la funcin de distribucin acumulada.
La prctica ha demostrado que los resultados entre la distribucin log-normal y la

distribucin Pearson III, para el ajuste de series de precipitaciones anuales,
mdulos anuales, precipitaciones mensuales, etc. no difieren.
Las razones que convalidan la utilizacin de esta distribucin de probabilidad son

las mismas que lo hacen en la distribucin log-normal.
6.3.3. EJEMPLO
Para proteger de inundaciones a la poblacin de la ribera del rio Turrialba, se

desea construir muros de encauzamiento. Para esto, se cuenta con un registro de
25 aos de caudales mximos en m3/s de una estacin aguas arriba de la
poblacin, los mismos que se muestran en la tabla 2.
Tabla 2. Registro de caudales del ro Turrialba
53.50 64.00 169.90 162.70 102.10

165.60 155.80 199.00 22.80 76.00
250.50 120.50 250.50 231.70 207.00
234.00 189.00 196.00 96.90 91.60
65.40 123.00 119.00 200.00 380.00
Determinar el caudal de diseo para un periodo de retorno de 50 aos. Usar la

distribucin gamma de 2 parmetros.
SOLUCIN:
1. Ajuste de los datos de la serie a la distribucin gamma de dos

parmetros.
1.1. Para crear el archivo con la serie de datos, se usa el programa

del listado 6.
1.2. Para realizar la prueba de bonda de ajuste, se utiliza el

programa del listado 8. Este programa calcula adems los
parmetros de la serie y los parmetros de la distribucin, algunos
clculos parciales que se obtienen, es como se muestra:
- Clculo de los parmetros de la serie de caudales:
= 157.05
ln = 4.90
2 = 6450.21
= 80.31
- Clculo de los parmetros de la distribucin gamma:
Utilizando la ec. (56), se tiene:
=
ln = ln 157.05 4.9 = 0.15656
como: = 0.15656 < 0.5772, se utiliza la ec. (54), para el clculo de , es decir:
= (0.500087 + 0.1648852 0.0544274 2 )/
De la ec. (57), se tiene:

=
157.05
= = 45.8133
3.4280
6.4DISTRIBUCION GUNBEL
La distribucin Gumbel, una de la distribuciones de valor extremo, es llamada

tambin valor extremo Tipo I, Fisher Tippett tipo I o distribucin doble exponencial.
1. FUNCION ACUMULADA
La funcin de distribucin acumulada de la distribucin Gunbel, tienes la forma.
F(x) = EXP (-EXP (-(x-u)/)) . (68)
()
F(x) =
................................................................... (69)
Para: -< x <
Dnde:
0 < < , es el parmetro de escala.
-< < , es el parmetro de posicin, llamado tambin valor central o

moda.
2. FUNCION DENCIDAD
Derivando la funcin de distribucin acumulada, ec. (68) con respecto a x, se

obtiene la funcin densidad de probabilidad, es decir:
dF(x)
f(x)= dx
f(x) = EXP(-(x-)/) EXP(-(x-)/)

(70)
1 ()/
f(x) = ()/ .. (71)
Para:
-< x <
La variable aleatoria reducida de Gunbel, se define como:

Y=
...................................... (7)
Con lo cual, la funcin densidad reducida Gunbel es:

Y
g(x) = EXP (- Y- EXP (-Y)) = eYe ................................................................
(73)
y la funcin acumulada reducida Gunbel, es:

Y
G (Y) = EXP (-EXP(-Y)) = ee ..
(74)
Los valores correspondientes x e Y, estn relacionados por:
F(x) = G (Y)
Y la relacin es:
x
Y= x = + Y ..

(75)
3. ESTIMACION DE PARMETROS, MTODO DE MOMENTOS
Utilizando el mtodo de momentos, se obtiene las siguientes relaciones:
-Moda xmoda =
-Media E(x) = = +C
Donde C, es la constante de Euler, cuyo valor es:
lim 1 1 1
C = n [1 + + + + ln n]
2 3
C = 0.5772156649
Por lo tanto:
= +0.57721 . (76)
2 2
Varianza: E[(x E(x))2] = S2 = (77)
6
De donde se obtiene:
6
= S = 0.78 S .. (78)

= - 0.57721 = - 0.45 S. . (79)
4. APLICACIN EN HIDROLOGIA
La ley de Gunbel o ley de valores extremos, sed utiliza generalmente para ajustar,
a una expresin matemtica, las distribuciones empricas de frecuencia de
caudales mximos anuales, precipitaciones mximas, etc.
Es importante verificar antes de aplicar esta distribucin de probabilidad que los

coeficientes de asimetra y curtosis de la distribucin emprica sean del mismo
orden que los valores poblacionales.
Uno de los inconvenientes del uso de esta distribucin , es que en una

distribucin doble exponencial , la variable puede tomar cualquier valor, por lo
que se puede asignar probabilidades a valores negativos de la aleatorio,
cuestin que resta significacin fsica a la aplicacin, debido a que las variables
hidrolgicas toman solamente valores positivos o cero.
5. EJEMPLO
Se tiene el registro de caudales mximos de 29 aos, para la estacin 9- 3
Angostura, como se muestra en la tabla.
En este rio se desea construir una presa de almacenamiento, calcular el caudal

de diseo para el vertedor de demasas, con un periodo de retorno de 50 aos.
Usar la distribucin Gunbel.
1660 917 3800 1410 2280
618 683 934 779 921
876 740 1120 610 1150
563 520 360 367 658
824 824 1230 522 581
557 818 1030 418
SOLUCION:
1. Ajuste de los datos de la serie a la distribucin Gunbel.
1.1Para crear el archivo con la serie de datos, se usa el programa del listado 6.
1.2Para realizar la prueba de bondad de ajuste, se utiliza el programa del listado

9. Este programa calcula adems los parmetros de la serie y los parmetros de
la distribucin, algunos clculos parciales que se obtienen, es como se muestra:
-Clculo de los parmetros de la serie de caudales:
Media: = 957.59
Desviacin estndar: S = 682.72
-Clculo de los parmetros de la distribucin de Gunbel:
El programa calcula estos parmetros utilizando las ec. (778) y (79) obteniendo:
Parmetro de escala: = 523.3182

Parmetro de posicin =650.3237
-Prueba de bondad de ajuste
Los resultados que se obtienen del programa son:
= 0.1454
0 = 0.2552, para un nivel de significacin del 5%.
Decisin
Siendo: = 0.454 < 0 =0.2552
Se concluye que los datos se ajustan a una distribucin Gunbel, con un nivel de
significacin del 5%.
2. Clculo del caudal de diseo, para un periodo de retorno de 50 aos.

1
F(Q =q) = P(Q q) = 1- T
1
F(Q = q) = 1 - 50
F(Q = q) = 0.98 =F(y)

y
F(y) = ee = 0.98
-ey = ln0.98
ey = 0.020202707
-y = ln(0.020202707)
Y= 3.9019
Pero de la ec. (72)

Q
y= = 3.9019

Q = + 3.9019 x
Q = 650.3237 + (3.9019) (523.3182)
Q =2,727.38 m3/s.

Geoestadistica - 2017 I

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Geoestadistica - 2017 I

Uploaded by

Copyright:

Available Formats

CAPITULO I

1.5.2. Variables Cualitativas.

1.8. Estadstico o Estadgrafo.

1.9. Clasificacin de la Estadstica.

Estas dos ramas no son independientes; por el contrario, son

SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES

DATOS CLASIFICADOS Y ORDENADOS

ESPACIO MUESTRAL (S)

Es el conjunto de todos los posibles resultados de un experimento. Aun cuando en

1. Si el experimento consiste en lanzar una moneda, los resultados posibles son

Es un subconjunto del espacio muestral.

1. En el experimento de lanzar una moneda: El evento A, que salga cara es:

1.3 DEFINICIN CLSICA DE PROBABILIDAD

La probabilidad P(A), de un evento A, en un experimento aleatorio que tiene Ns

1. El arrojar una moneda, la probabilidad de que salga sello, es:

1.4 DEFINICION AXIOMATICA DE PROBAILIDAD

Sea S un espacio muestral asociado a un experimento, y A cualquier suceso de S

1. 0 P(A) 1, para todo A S

De estos axiomas se deducen los siguientes teoremas:

PROBABILIDAD DE LA UNION DE SUCESOS

Si A y B son eventos cualesquiera en un espacio muestral S, entonces:

Si A y B son dos eventos en los cuales () 0, entonces, la probabilidad

1.5 VARIABLES ALEATORIOS

A una variable aleatoria, se le conoce tambin como variable estocstica, sus

1. Variable aleatoria discreta

Ejemplo: Nmero de das de lluvias ocurridas en los meses de un ao cualquiera.

2. Variable aleatoria contina

Ejemplo: El caudal diario registrado en una estacin de aforo

La mayora de secuencias de variables geolgicas son series continuas, de

MEDIDAS DE LAS DISTRIBUCIONES.

3. MEDIDAS DESCRIPTIVAS DE LAS DISTRIBUCIONES DE FRECUENCIAS.

Figura 1.Comparacion de la localizacin central de tres curvas

3.2 Medidas de dispersin.

Figura 2.Comparacin de la dispersin de dos curvas

Figura 3.Curva simtrica

Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4

Figura 4.Curvas segadas, A: sesgo a la derecha o positivo

Figura 5. Curvas con diferente curtosis

Figura 6. Grados de achatamiento

2.2 MEDIDASD DE TENDENCIA CENTRAL.

Se define una medida de tendencia central como un ndice de localizacin central

En trminos generales se tienen tres medidas: la media, la mediana y la moda.

2.2.1 Media aritmtica

Dada la muestra compuesta de n datos, X1, X2, X3,Xn; la media, se

Media aritmtica de datos no agrupados

Matemticamente la media de los datos no agrupados se representa por:

Xi: valor i-simo de la muestra

n: nmero de datos de la muestra o poblacin

Media aritmtica de datos agrupados

Para el caso de datos agrupados, la frmula es:

fi: frecuencia absoluta (nmero de observaciones) en el intervalo i

Xi: marca de clase del intervalo i

k: nmero de intervalos de clase

n: nmero de observaciones de la muestra

2.2.2 Media ponderada

El promedio ponderado permite calcular un promedio que toma en cuenta la

xi: valor i-simo de la muestra

fi: valor del factor de ponderacin del i-simo valor de la muestra

n: nmero de observaciones de la muestra

Pi: valor de las notas promedio del alumno i

Ai: Numero de crditos del alumno i

2.2.3 Media geomtrica

Dada la muestra compuesta de n datos, X1, X2, X3,Xn, la media

=1 : X1X2 .* Xn (productoria de los datos)