Estadistica en Hidrología

ESTADISTICA EN HIDROLOGIA
Curso de Hidrologa
Ingeniera Civil
Profesor(a): Alejandra Gonzlez J.
2016
CONTENIDO
1. CONCEPTOS BSICOS .......................................................................................................................................4

2. PARMETROS ESTADSTICOS............................................................................................................................5
2.1 Parmetros de Posicin .................................................................................................................6
2.1.1 Media (): .......................................................................................................................................6
2.1.2 Mediana (Me) .................................................................................................................................7
2.1.3 Moda (Mo) ......................................................................................................................................7
2.1.4 Medidas de posicin no central ......................................................................................................7
2.2 Parmetros de Dispersin..............................................................................................................9
2.2.1 Recorrido o rango ...........................................................................................................................9
2.2.2 Intervalo Intercuartlico ..................................................................................................................9
2.2.3 Varianza (S2) ....................................................................................................................................9
2.2.4 Desviacin Estndar (S o ) ......................................................................................................... 10
2.2.5 Coeficiente de Variacin de Pearson ........................................................................................... 10
2.3 Parmetros de Forma ..................................................................................................................10
2.3.1 Coeficiente de Asimetra (Cs)....................................................................................................... 11
2.3.2 Coeficiente de Curtosis ................................................................................................................ 11
3. DISTRIBUCIONES DE PROBABILIDAD ............................................................................................................. 12
3.1 Distribucin Normal ....................................................................................................................13
3.2 Distribucin LogNormal ...............................................................................................................14
3.3 Distribucin Gamma ....................................................................................................................14
3.4 Distribucin Exponencial ............................................................................................................. 15
3.5 Distribucin Chi-Cuadrado ........................................................................................................... 15
3.6 Distribucin Weibull ....................................................................................................................15
3.7 Distribucin Pearson Tipo III ........................................................................................................ 15
3.8 Distribuciones de Valor Extremo .................................................................................................. 16
4. ANLISIS DE FRECUENCIA .............................................................................................................................. 16
4.1 Periodo de Retorno .....................................................................................................................16
4.2 Factor de Frecuencia....................................................................................................................17
4.2.1 Normal y Log Normal ................................................................................................................... 18
4.2.2 Pearson y LogPearson Tipo III ...................................................................................................... 18
Apuntes de Hidrologa Pgina 2

Alejandra Gonzlez J.
4.2.3 Valor Extremo .............................................................................................................................. 18
5. AJUSTE A UNA DISTRIBUCIN DE PROBABILIDAD......................................................................................... 19
5.1 Mtodo de los momentos............................................................................................................ 19
5.2 Mtodo de mxima verosimilitud ................................................................................................ 19
5.3 Prueba de Bondad de Ajuste ........................................................................................................ 20

ESTADISTICA EN HIDROLOGA
1. CONCEPTOS BSICOS
Proceso Estocstico = Procesos que evolucionan en el tiempo y espacio en una forma parcialmente predecible,
o determinstica y aleatoria.
Cuando no existe correlacin entre observaciones adyacentes, la salida de un sistema hidrolgico es tratada
como estocstica, independiente del espacio y tiempo. Este tratamiento sirve para eventos hidrolgicos
extremos, crecientes o sequias, y para informacin hidrolgica promediada a lo largo de intervalos de tiempos
grandes (precipitacin anual, por ejemplo).
La probabilidad de un evento P(A), es la posibilidad que de que ste ocurra cuando se hace una observacin de
la variable aleatoria.

() = lim

Donde nA son los valores en el rango de evento A (Ej; dados de 1 al 6) y n es la cantidad de observaciones.
Si las observaciones de una muestra estn idnticamente distribuidas, se pueden ordenar y dividir en intervalos
discretos, luego se cuenta el nmero de observaciones que cae en cada uno de los intervalos.
La funcin densidad de probabilidad f(x) es la probabilidad de un evento cuando la cantidad de observaciones
tiende a infinito y el intervalo de longitud tiende a cero (X)
()
() lim

0

La funcin de distribucin de probabilidad

lim ()
() =
0
Una de las funciones de densidad ms conocidas es la distribucin normal

1 ( )2
() =
2 2 2
Donde y son parmetros, la que puede simplificarse definiendo la variable estndar z como:

=

La distribucin normal estndar quedara con la funcin densidad de probabilidad siguiente
2

1
() = 2 +
2

Donde z es una variable de integracin auxiliar, no tiene forma analtica. Sus valores estn tabulados en tabla y
se aproximan mediante la siguiente expresin
1
= [1 + 0,196854 || + 0.115194||2 + 0.000344||3 + 0.019527||4 ]4
2
Donde || es el valor absoluto de z y la distribucin normal standard tiene:
() = para < 0
() = 1 0
2. PARMETROS ESTADSTICOS
Los parmetros estadsticos permiten caracterizar una poblacin y extraer la informacin esencial de un conjunto
de datos, reduciendo un conjunto de grandes nmeros a un conjunto de pequeos nmeros. Los parmetros son
medidas objetivas, es decir, su valor para un mismo conjunto de datos, siempre es el mismo, aunque lo estimen
distintas personas.
Los parmetros se pueden dividir en:
- Parmetros de Posicin
- Parmetros de Dispersin
En cada grupo se encuentran los siguientes parmetros:
Parmetros de Posicin Parmetros de Dispersin
Media Varianza
Mediana Desviacin Tpica
Moda Rango Intercuartlico
Cuartiles Coeficiente de Variacin

2.1 Parmetros de Posicin
Permiten identificar el valor en torno al cual se agrupan mayoritariamente los datos, es decir, cuyo valor es
representativo de todos ellos. Pueden ser de dos tipos:
Tendencia Tendencia
Central Media No central Cuartiles
Mediana Deciles
Moda Perceptiles
Medidas de tendencia central: media, mediana y moda.

Medidas de posicin no central: cuartiles, deciles y perceptiles.

2.1.1 Media ( ):
Es una medida del punto medio o tendencia central de la distribucin, y corresponde a la suma de todos los datos
dividido por el nmero total de valores, se define por:

1
=

=1
La media cumple una serie de propiedades bsicas:

(a) Si a cada uno de los valores de una variable se le suma una constante K, la media se ver incrementada
en esa misma constante:
N
x i +K
x+K = i =1
N
(b) Si a cada uno de los valores de una variable se le multiplica por una constante, K, la media queda
multiplicada por esa constante:
N
x K i
x K = i =1
N
(c) Si una variable Y es una transformada lineal de otra variable X, es decir, Y=a+bX, la media de Y es tambin
la transformada lineal de la media de X, es decir, y =a+b x .
(d) La suma de las desviaciones de todos los valores de la variable respecto a su media es cero:
N
(x
i =1
i x) = 0

(e) Si una variable Z es la suma de dos variables X e Y, la media de Z es tambin la suma de las medias de las
variables X e Y, es decir, si Z=X+Y entonces z = x + y .
En general, la media no ser un buen parmetro de posicin cuando la distribucin de los datos sea asimtrica,
al ser muy sensible a los valores extremos de la variable. Tambin la media en distribuciones estadsticas es
denominada en su letra griega .
2.1.2 Mediana (Me)
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que estos estn
ordenados de menor a mayor. La mediana se denota por Me y se calcula de manera sencilla. Ordenados los
datos de menor a mayor, Me es:
N +1
Si N es un nmero impar, entonces Me es el valor que ocupa la posicin de la lista de datos ordenados.
2
Dmonos cuenta que, en este caso, quedarn el mismo nmero de datos a un lado y al otro de la mediana.
Si N es un nmero par, no tenemos un dato central. En ese caso, tomamos la media de los dos datos centrales y
que s dejan el mismo nmero de valores a un lado y al otro, es decir, la mediana ser la media de los datos que
N N
ocupan las posiciones y + 1 de la lista de datos ordenados.
2 2
La mediana es menos sensible que la media a oscilaciones de los valores de la variable y no se ve afectada por la
dispersin. De hecho, es ms representativa que la media aritmtica cuando los datos son es bastante
heterogneos o asimtricos.
Por ejemplo: Sea la variable aleatoria nmeros de televisores por hogar. Se realiza una encuesta en 13 hogares,
obtenindose los siguientes resultados:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1
Hallar la mediana de los mismos.
El primer paso es ordenar los datos de menor a mayor: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4
Como n es 13, impar, Me ser igual a 2, de manera que queden 6 datos por debajo y 6 por encima de dicha
posicin. Mientras que la media sera 1,85 (24/13).
2.1.3 Moda (Mo)
La moda, representada por Mo, es otro parmetro de posicin que se calcula simplemente como el valor que
ms se repite en la muestra, es decir, el valor con una mayor frecuencia. En consecuencia, no siempre se sita
hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia.
Por otro lado, la moda puede no existir cuando en un conjunto de datos, todos stos son diferentes entre s y no
hay ningn dato que se repita ms de una vez.
2.1.4 Medidas de posicin no central
Se trata de valores de la variable estadstica que dejan por debajo de s determinada cantidad de los datos.
Mientras que la mediana deja por debajo de s al 50% de la distribucin, los cuantiles pueden hacerlo con

cualquier otro porcentaje. Los ms frecuentemente utilizados son cuartiles, si se divide la cantidad de datos en
cuatro partes. A estos cuartiles se les denomina y representa de la siguiente manera:
Primer cuartil, C1. Valor que deja por debajo el 25% de los datos y por encima el 75% de los datos.
Segundo cuartil, C2. Coincide con la mediana. Deja el 50% de los valores por debajo y por encima.
Tercer cuartil, C3. Valor que deja por debajo el 75% de los datos y por encima el 25% de los datos.
Para calcular C1 y C3, ordenados los datos de menor a mayor, se procede de la siguiente forma:
Si N es un nmero par, entonces C1 es la mediana de los N/2 primeros datos y C3 la mediana de los N/2
ltimos datos.
Si N es un nmero impar, entonces tenemos dos posibilidades:
N 1 N 1 N 1
es impar. C1 es la mediana de los primeros datos. C3 es la mediana de los ltimos
2 2 2
datos.
N 1 N 1 N 1
es par. C1 es la mediana de los primeros +C2 datos y C3 la mediana de los ltimos
2 2 2
+C2 datos
Por ejemplo: Los siguientes datos muestran el nmero de despedidos que se han producido en 15 empresas del
sector del automvil durante el ao 2010:
33 56 91 64 55 60 2 42 32 26 63 40 25 34 84
Hallar los cuartiles.

Lo primero que debemos hacer es ordenar los datos de menor a mayor:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
2 25 26 32 33 34 40 42 55 56 60 63 64 84 91
Se trata de un nmero impar de datos, luego la mediana es el valor central que ocupa la posicin (N+1)/2 o en
nuestro caso (15+1)/2=8, es decir, el dato 42.
Para el primer y el tercer cuartil, tenemos que N es impar (15) y que (N-1)/2=7 es impar. Por tanto, el primer
cuartil C1 es la media de los primeros (N-1)/2 datos, como son 7 datos, ser entonces el dato central de los
primeros (N-1)/2 datos, o el dato 4. Luego C1=32
Para C3 es la mediana de los (N-1) /2, con lo que C3=63.

2.2 Parmetros de Dispersin
Las medidas de posicin resumen la distribucin de datos, pero resultan insuficientes y simplifican
excesivamente la informacin. Estas medidas adquieren verdadero significado cuando van acompaadas de
otras que informen sobre la heterogeneidad de los datos. Estas medidas se conocen como parmetros de
dispersin y miden en qu medida los datos se agrupan entorno a un valor central.
Hay medidas de dispersin absolutas, entre las cuales se encuentran la varianza, la desviacin tpica o el recorrido
y medidas de dispersin relativas, como el coeficiente de variacin. Las medidas absolutas tienen que ir
acompaadas de un parmetro de posicin, normalmente la media, y no permiten comparaciones entre distintas
muestras. Las medidas relativas suelen ser adimensionales por lo que permiten la comparacin entre distintas
muestras. Los estadsticos de dispersin ms relevantes son:
2.2.1 Recorrido o rango
Es la medida de dispersin ms sencilla de calcular. Es la diferencia entre el mayor y el menor valor que toma la
variable. Es una medida poco precisa ya que slo toma en consideracin un par de observaciones y puede verse
afectada por valores extremos.
Por ejemplo: Hallar el rango de los datos 2, 9, 8, 9, 15, 21, 5, 20. (ordenados quedan 2,5,8,9,9,15,20,21)
El Rango quedara 21-2=19.
2.2.2 Intervalo Intercuartlico
Se define como la diferencia entre el tercer y primer cuartil. En ese rango estn, por la propia definicin de los
cuartiles, el 50% de las observaciones. Este tipo de medidas tambin se usa para determinar valores atpicos.
Por ejemplo: Hallar el Intervalo Intercuartlico de los datos 2, 9, 8, 15, 21, 5, 20.
Para el clculo de los cuartiles debemos ordenar los datos de menor a mayor: 2, 5, 8, 9, 15, 20, 21. El C1 ser
igual a 5 y el C3 igual a 20, con lo que el Intervalo Intercuartlico tendr un valor de 15.
2.2.3 Varianza (S2)
La varianza se define como:
N
(x i x )
2
i =1
S2 =
N 1
Donde x es el valor de la media aritmtica y xi el valor de cada dato.
La varianza cumple tres propiedades bsicas:
(a) La varianza y la desviacin tpica no varan si a cada valor de la variable se le suma una constante. Es decir,
si Y=a+X entonces, SY2 = S X2
(b) Si una variable Z es la suma de dos variables X e Y, la varianza de Z es la suma de las varianzas de X e Y, es
decir, si Z=X+Y entonces, S Z2 = S X2 + SY2
(c) Siguiendo lo anterior, si una variable Y es una transformada lineal de otra variable X, es decir, Y= a+bX, la
varianza de Y es tambin la transformada lineal de la varianza de X, esto es SY2 = b 2 S X2 .

2.2.4 Desviacin Estndar (S o )
Para evitar el inconveniente de calcular S2 que est expresado en las mismas unidades que la media, pero
elevadas al cuadrado, suele utilizarse la desviacin tpica (S) o tb identificada con , que no es ms que la raz
cuadrada de la varianza:
N
(x x)
2
i
S= i =1
=
N 1
Por ejemplo: La varianza y desviacin tpica de los datos 2, 9, 8, 15, 21, 5, 20, seran respectivamente 49,18 y
6,82.
2.2.5 Coeficiente de Variacin de Pearson
Se define como cociente entre la desviacin tpica y la media:
S
CV = ; o tambin =
x
Se interpreta como el nmero de veces que la media est contenida en la desviacin tpica. Suele darse su valor
en tanto por ciento, multiplicando el resultado anterior por 100. De este modo se obtiene un porcentaje de la
variabilidad.
2.3 Parmetros de Forma

Las variables aleatorias continuas presentan frecuentemente una pauta de variabilidad que se caracteriza por el
hecho de que los datos tienden a acumularse en torno a un valor central, que coincide con la media, decreciendo
su frecuencia de forma aproximadamente simtrica a medida que se alejan por ambos lados de dicho valor. Los
histogramas de estas variables continuas tienen forma de campana de Gauss, que es el modelo matemtico de
la distribucin normal, siendo la distribucin que con ms frecuencia aparece en multitud fenmenos reales.
Figura 1: Funcin densidad de una distribucin normal
Los parmetros de forma son indicativos de la forma tpica que presenta la grfica o histograma de los datos, es
decir de cmo se distribuyen. Entre ellas destacan el coeficiente de asimetra y curtosis.

2.3.1 Coeficiente de Asimetra (Cs)
Las medidas de asimetra permiten conocer si los datos estn dispuestos de forma simtrica en torno a un valor
central de posicin, que generalmente es la media aritmtica.
Para saber qu grado de asimetra presentan los datos se aplica el Coeficiente de Asimetra (C.A), que se define
como:
=1( )3
=
( 1)( 2) 3
Si unos datos son simtricos, lo son respecto a su media y la suma de los cubos de las desviaciones de los datos
respecto a su media ser nula.
Por el contrario, tendremos una asimetra positiva (C.A > 0), cuando la media est a la derecha de la mediana y
grficamente se obtiene un histograma en forma de L con una cola hacia la derecha, como se muestra en la
siguiente. As mismo, existe asimetra negativa (C.A <0) la media sea inferior a la mediana y el histograma
resultante tiene una forma caracterstica de J, con cola hacia la izquierda.
Figura 2: Tipos de Asimetra
2.3.2 Coeficiente de Curtosis

Con este parmetro se pretende medir cmo se reparten las frecuencias relativas de los datos entre el centro y
los extremos, tomando como comparacin la campana de Gauss. Miden si los valores se concentran ms o menos
frecuentemente en torno a la media respecto de lo que cabra esperar en una distribucin normal
N
(x i x )
4
i =1
Se define como: CC =
( N 1)S 4
Existen 3 grandes categoras de Curtosis:

(a) Distribucin leptocrtica (apuntamiento positivo) (CC>3): se produce cuando datos alejados de la media
aparecen con una frecuencia menor a lo que sera esperable. Presentan un histograma simtrico, pero
ms apuntado que una campana de gauss, como se muestra en la figura 3.
(b) Distribucin mesocrtica (apuntamiento normal): coincide con la distribucin normal.
(c) Distribucin platicrtica (apuntamiento negativo) (CC<3): indica que en las colas o extremos hay ms
casos acumulados que en las colas de una distribucin normal, es decir, datos alejados de la media que

aparecen con una frecuencia excesiva, respecto de una distribucin normal. Presentan un histograma
simtrico, pero ms aplanada que una campana de gauss, como se muestra en la figura 3.
Figura 3: Tipos de Curtosis
Por ejemplo: el coeficiente de asimetra y de Curtosis de los datos 2, 9, 8, 15, 21, 5, 20, seran respectivamente
0,22 y -1,64, es decir prcticamente normal respecto del punto de vista de la asimetra y ligeramente platicrtico.
3. DISTRIBUCIONES DE PROBABILIDAD
La distribucin probabilstica es una funcin que representa la probabilidad de ocurrencia de una variable
aleatoria, existen numerosas distribuciones, las que comnmente son utilizadas para variables hidrolgicas son:
- Distribucin Normal
- Distribucin Log Normal
- Distribucin Exponencial
- Distribucin Gamma
- Distribucin Pearson III
- Distribucin Log Pearson III
- Valor extremo tipo I
La siguiente tabla describe la funcin densidad de probabilidad y el rango de la variable de cada una de estas
distribuciones, junto con las ecuaciones para estimar los parmetros de la distribucin a partir de los
momentos 1de la muestra.
Tabla 1:Distribuciones de probabilidad para el ajuste de informacin hidrolgica
DISTRIBUCIN FUNCIN DENSIDAD RANGO ECUACIONES DE LOS PARMETROS
1 ( )2
Normal () = = , =
2 2 2
1 ( )2 Y = log x
LogNormal () = = , =
2 22 x>0
1 2 1
Gamma () = 0 = ; = =
() 2 2 2
1
Exponencial =
() = 0
= 1/ 2 = 1/2
1
Momentos corresponden a valores de parmetros de una funcin de densidad que permiten caracterizar la muestra.

DISTRIBUCIN FUNCIN DENSIDAD RANGO ECUACIONES DE LOS PARMETROS
21 /2 2
Chi-Cuadrado () = 0 = 2 =
22 (/2) 2
2 1
Weibull () = 1

0 = = , =
2 2 2
Pearson tipo ( )1 () 2 2
() = = ; = ; =
III ()
Log Pearson ( )1 () = 2 2
() = = ; = ; =
tipo III () ()
1 ( ) ( ) 6
Valor Extremo () = exp =

= 0,5772
3.1 Distribucin Normal

La distribucin norma surge del teorema del lmite central, el cual establece que si una secuencia de variables
aleatorias Xi son independientes y estn idnticamente distribuidas con media y varianza 2 , entonces la
distribucin de la suma de n de estas variables tiende hacia la distribucin normal con media n y varianza 2
a medida que n aumenta. Ahora esto es cierto sin importar cul es la distribucin de probabilidad que se quiera
aplicar.
Su aplicacin es conveniente para variables hidrolgicas tales como la precipitacin anual, ya que son eventos
completamente independientes entre un ao y otro. Las principales limitaciones son su variacin a lo largo de
un rango continuo , mientras que las variables hidrolgicas son en la mayor parte no negativas (P > 0
mm) y que es simtrica alrededor de la media, mientras que la informacin hidrolgica tiende a ser asimtrica,
razn por la cual se cre la distribucin LogNormal.
Su representacin grfica es la siguiente:
Media (u) = 0
N (0,1) Media (u) = 2
Distinto Cv
Figura 4: Distribucin Normal

3.2 Distribucin LogNormal
Corresponde a la misma normal con la transformacin de los datos de valor x a = log(). Su aplicacin es
conveniente para variables independientes e idnticamente distribuidas. Tiene la ventaja que est limitada para
X>0 (si no indefine el Log) y que al transformar los datos a Log se reduce la simetra positiva (permite asimetras),
ya que se reducen en una proporcin mayor los nmeros grandes que los pequeos. Sus limitaciones son que
cuenta slo con dos parmetros y requiere que los logaritmos sean simtricos alrededor de su media.
Su representacin grfica es la misma que la normal.
Su valor se estima a travs de tablas y en excell con la funcin NORM.DIST(x,media, desviacin estndar) y cuando
se necesita determinar el z se aplica su inverso NORM.INV (funcin, media, desviacin estndar), tambin hay
otras funciones que consideran algunos supuestos y entregan el valor de la normal con u =0 (normal standard)
3.3 Distribucin Gamma

Est basada en el principio de que la ocurrencia de un nmero de eventos ( eventos) es aleatorio e
independiente descrito por una distribucin gamma, la cual es la distribucin de una suma de variables
aleatorias distribuidas exponencialmente. Describe de buena manera variables hidrolgicas asimtricas sin el
uso de la trasformacin log. Tiene dos parmetros , tiene de lmite inferior cero, no se puede aplicar a
variables hidrolgicas en que todos sus datos sean inferiores a cero.
Algunas propiedades de la funcin gamma son:
() = ( 1)! ( + 1) = ( 1)!
(1) = 1 (0,5) =
Su representacin grfica es la siguiente:
=1, =1
=2, =1
=4, =1

3.4 Distribucin Exponencial
Est diseada para representar aquellos eventos hidrolgicos que ocurren instantneamente e
independientemente en un horizonte de tiempo, por lo que pueden considerarse como procesos de Poisson, el
cual esta descrito por una distribucin exponencial. Tiene la ventaja en que es fcil de estimar y que se adapta
muy bien a estudios tericos, tales como modelos de probabilidad para el embalse lineal = 1, donde k es
la contante de almacenamiento del embalse lineal. Su desventaja es que cada evento debe ser independiente
completamente, lo que a veces puede resultar imposible de asegurar (un frente de lluvias puede traer muchos
procesos y/u otros eventos de lluvias asociados). Su representacin grfica es igual a la Gamma con = 1
3.5 Distribucin Chi-Cuadrado

Es una distribucin gamma con = /2 y =0,5, donde es un entero positivo. La distribucin tiene un solo
parmetro, (1 grado de libertad). Esta distribucin es empleada para realizar pruebas de hiptesis, de
estimacin estadstica, estudios de confiabilidad, anlisis de la varianza y estadstica no paramtrica. Su
representacin grfica es igual a la Gamma con un slo parmetro ( = 2), ya que siempre es igual a 0,5.
3.6 Distribucin Weibull

Es una distribucin gamma, fue introducida por el fsico Waloddi Weibull en 1939. Es aplicada a resolver
problemas de confiabilidad, tiempos de Falla, periodos de retorno (tiempo en que la variable se ver superada).

Su distribucin acumulada (integral de la funcin densidad) est dada por la frmula F = 1 .
A travs de esta distribucin se determina el periodo de retorno de una variable hidrolgica y que representa el
tiempo en que un evento de una magnitud determinada se ver superado. Se representa por la letra T. En el caso
de aplicarla a una precipitacin mxima anual, T representa la cantidad de aos en que se volver a repetir y
superar la precipitacin asociada.
Por ejemplo: estimar el perodo de retorno que tiene una precipitacin de 10 mm, considerando que los datos
corresponden a precipitaciones mximas anuales y que siguen una distribucin Weibull y sus parmetros
calculados son = 2 y =0,1.
2
Probabilidad (P 10 ) = (10; = 2; = 0,1) = 1 (0,110) = 1 1 = 0,632 (63% del tiempo ser
menor a 10 mm).
Probabilidad (P 10 ) = 1 0,632 = 0,368
1
Periodo de retorno: = = 2,71 aos; Lo cual significa que 10 mm se vern superados cada 32
(10)
meses aprox, o al menos 1 vez cada dos aos.
3.7 Distribucin Pearson Tipo III

La distribucin Pearson Tipo III, tambin llamada como distribucin Gamma de tres parmetros, ya que introduce
un tercer parmetro, el lmite inferior , por lo que queda , , relacionados con la media, desviacin estndar
y el coeficiente de asimetra, por lo que resulta una distribucin muy flexible que se adapta muy bien a los datos.
Fue aplicada por primera vez para describir la distribucin de datos de caudales mximos anuales. Cuando la
informacin resulta ser muy asimtrica se le aplica los Log para hacerla ms simtrica (funcin LogPearson). Sin
embargo, su ajuste debe validarse utilizando la prueba o test Chi cuadrado.

3.8 Distribuciones de Valor Extremo
La distribucin valor extremo es aplicada para valores mximos o mnimos tomados de una serie de datos, por
ejemplo, el caudal mximo anual. Su funcin de probabilidad (integral de la funcin densidad) est dada por:
1/
() = exp 1 , con > 0

De acuerdo a su valor k se clasifican en tres categoras:

- Tipo I, k=0, su funcin densidad est dada por la tabla 1

- Tipo II. K < 0, para lo cual x est acotado entre +

- Tipo III, k > 0, para lo cual x est acotado entre +

Si una variable x esta descrita por una distribucin valor extremo tipo III, se dice que -x tiene una distribucin
Weibull.
4. ANLISIS DE FRECUENCIA
Los sistemas hidrolgicos son afectados por eventos extremos, precipitaciones altas que provocan inundaciones
severas, caudales mximos que exceden la capacidad del cauce que los contiene o periodos de sequa donde no
hay ocurrencia de lluvias por un largo tiempo, sin poder predecir cundo llover otra vez. La hidrologa
estadstica se encarga de estudiar estos fenmenos basada en que la magnitud de un evento extremo est
inversamente relacionada con su frecuencia de ocurrencia, es decir, eventos muy severos ocurren con menor
frecuencia que eventos ms moderados.
El objetivo de realizar un anlisis de frecuencia a los datos hidrolgicos es relacionar la magnitud de los eventos
extremos con su frecuencia mediante el uso de distribuciones de probabilidad, ya que se supone que la
informacin hidrolgica es independiente y est idnticamente distribuida y su proceso de creacin es
estocstico (procesos predecibles en el tiempo).
Los resultados del anlisis de frecuencia pueden ser utilizados para muchos propsitos en ingeniera, tales como
el diseo de presas, puentes, colectores de aguas lluvias, obras de drenaje y saneamiento de caminos,
mejoramientos y proteccin de cauces naturales, entre otros.
El primer concepto a definir es el periodo de retorno (T), parmetro que ser esencial para definir un evento
extremo.
4.1 Periodo de Retorno

El periodo de retorno se define como aquel intervalo de tiempo en que un evento extremo excede una
determinada magnitud. Para su determinacin, los datos deben ajustarse a una distribucin estadstica. Su valor
esta dado a travs de la siguiente relacin:
1
=
( )
Es decir, la probabilidad de que ocurra un evento es el inverso de un perodo de retorno. As como la probabilidad
de que un evento con periodo de retorno de T aos ocurra una vez en N aos es igual
1
( () 1 ) = 1 (1 () = 1 1


4.2 Factor de Frecuencia
Para predecir el comportamiento futuro de una variable hidrolgica o Hidrometeorolgica en un sitio de inters,
a partir de la informacin histrica de dicha variable, se puede emplear el mtodo de factor de frecuencia. El
objetivo es calcular la magnitud de la variable (precipitaciones, caudales) asociada a un perodo de retorno. Su
confiabilidad depende de la longitud y calidad de la serie histrica, adems de la incertidumbre propia de la
distribucin de probabilidades seleccionada.
El mtodo de factor de frecuencia, determina la magnitud de eventos extremos conociendo la variacin de la
variable respecto a la media. Chow en 1951 propuso determinar esta variacin a partir de un factor de frecuencia
KT que puede ser expresado:
= + , la cual puede aproximarse por = +

Donde:
XT = Magnitud de la Variable (P, Q)
( ) = Media
KT = Factor de frecuencia (asociado a la distribucin de probabilidad elegida)
S = Desviacin Estndar
En el evento que la variable sea y= log X, entonces se aplica el mismo mtodo a las estadsticas para los logaritmos
de los datos utilizando la relacin:
= +
As, el valor de requerido de XT se encuentra tomando el antilogaritmo de YT.
De esta forma, para una distribucin de probabilidad dada, se determina una relacin entre KT y un perodo de
retorno, la cual puede expresarse por trminos matemticos o por uso de tablas.
La siguiente tabla muestra los factores KT para las diferentes funciones de probabilidad que se emplean para el
mtodo de factor de frecuencia.
Tabla 2: Factores de Frecuencia
DISTRIBUCIN Factor de Frecuencia KT

Normal y Log =
Normal
Tabla Normalizada, o mediante la aproximacin de la variable w.
Pearson y Log
1 1
= + ( 2 1) + ( 3 6) 2 ( 2 1) 3 + 4 + 5
Pearson tipo 3 3
III
Valor Extremo 6
Tipo I = 0.5772 + ln ln
1

4.2.1 Normal y Log Normal
Para obtener la variable KT se asume que corresponde a la variable z calculada a travs de la aproximacin dada
por:
2.515517 + 0.802853 + 0.010328 2
= =
1 + 1.432788 + 0.189269 2 + 0.001308 3
Donde:
1 1/2 1
= ln
2
para 0 < p < 0,5 y =

1 1/2
= ln (1)2 para p > 0,5
Para la distribucin LogNormal, se aplica el mismo procedimiento excepto que se aplica a los logaritmos de las
variables y con su media y desviacin estndar se obtiene el YT que luego se le aplica el antilogaritmo y se obtiene
el XT
Ejercicio: calcule el factor de frecuencia para la distribucin normal de un evento asociado a un periodo de
retorno de 50 aos. (Resultado = 2.054)
4.2.2 Pearson y LogPearson Tipo III
Para obtener KT se hace a travs de los logaritmos de la informacin hidrolgica y = Log x. (en base 10). Se calcula
la media y la desviacin estndar y coeficiente de asimetra C para los logaritmos de los datos, de esta forma el
factor de frecuencia KT se aproxima por Kite (1977) como:
1 1
= + ( 2 1) + ( 3 6) 2 ( 2 1) 3 + 4 + 5
3 3
Donde:
k = Cs/6
z = se obtiene para T de acuerdo a la distribucin standard (w, KT distribucin normal)
Ejercicio: calcule los caudales mximos anuales con periodos de retorno de 5 aos, utilizando la distribucin Log
Pearson y los siguientes datos estadsticos: = 4,2743, Sy = 0,4027 y Cs = -0,0696. (Resultado = 41,17 m3/s).
4.2.3 Valor Extremo
El valor de KT se determina a travs de la expresin:
6
= 0.5772 + ln ln
1
Para expresar T en trminos de KT, la ecuacin anterior puede escribirse como:

1
=

1 +
6
Cuando XT es igual a la media, KT = 0 y T = 2,33 aos.
Ejercicio: determine la precipitacin para un periodo de retorno de 5 aos, considerando una media de 1,6
mm y desviacin estndar de 0,45. (resultado = 1,9 mm)

5. AJUSTE A UNA DISTRIBUCIN DE PROBABILIDAD
Como se seal, la distribucin probabilstica es una funcin que representa la probabilidad de ocurrencia de
una variable aleatoria. Mediante el ajuste a una distribucin de un conjunto de datos hidrolgicos, una gran
cantidad de informacin probabilstica en la muestra puede resumirse en forma compacta en la funcin y en sus
parmetros asociados. El ajuste se puede realizar por:
5.1 Mtodo de los momentos

El mtodo de los momentos fue desarrollado por Karl Pearson en 1902. l consider que unos buenos estimativos
de los parmetros de una funcin de probabilidad son aquellos para los cuales los momentos de la funcin
densidad de probabilidad alrededor del origen son iguales a los momentos correspondientes de la informacin
de la muestra. El mtodo selecciona valores para los parmetros de la funcin densidad de probabilidad de tal
manera que sus momentos son iguales a aquellos de la informacin de la muestra.
Se define por tres momentos:

Primer momento: = ()
Segundo momento: 2 = [( )2 ]
Tercer momento: = [( )3 ] 3
5.2 Mtodo de mxima verosimilitud

El mtodo de la mxima verosimilitud fue desarrollado por R.A Fisher (1922). l razon que el mejor valor de un
parmetro de una distribucin de probabilidad debera ser el valor que maximizar la verosimilitud o
probabilidad conjunta de ocurrencia de la muestra observada. Debido a que las observaciones son
independientes, su probabilidad de ocurrencia conjunta est dada como el producto f(xi)dx f(x2)dx..f(xn) dx =
=1 () puesto que el tamao dx es fijo, el maximizar la probabilidad conjunta de la muestra observada
es equivalente a maximizar la funcin de verosimilitud.

= ()
=1
Debido a que muchas funciones de densidad de probabilidad son exponenciales, algunas veces es conveniente
trabajar con la funcin algoritmo de la verosimilitud.

ln = ln[()]
=1
El mtodo de mxima verosimilitud tericamente es el ms correcto para ajustar distribuciones de probabilidad

(estimadores ms eficientes), pero para algunas distribuciones, no existe una solucin analtica para todos los
parmetros en trminos estadsticos de la muestra y la funcin logaritmo de verosimilitud debe maximizarse
numricamente, lo cual puede ser bastante difcil. En general, el mtodo de los momentos es ms fcil de aplicar
que el de mx. verosimilitud y es el ms apropiado para anlisis prcticos en hidrologa.

5.3 Prueba de Bondad de Ajuste
La prueba de bondad consiste en comparar los valores tericos con los obtenidos de las funciones de frecuencia
aplicadas. De las pruebas de bondad de ajuste ms usadas en el test chi-cuadrado (2), dada por la ecuacin:

2
[ () ()]2
=
()
=1
Donde:
m= N de intervalos
nfs(xi) = N de ocurrencias observadas = fo
np(xi) = N esperado de ocurrencias = fc
Por lo que se simplifica de la siguiente manera:
( )2
2 = =1 en donde

Si el estadstico =0 significa que las distribuciones terica y emprica se ajustan exactamente, mientras que si
el estadstico >0, ellas difieren.
La distribucin del estadstico se puede asimilar a una distribucin Chi-cuadrado con (k-1) grados de libertad,
donde k es el nmero de intervalos y n es el nmero de los parmetros de la distribucin terica.
La funcin de distribucin c2 est tabulada por Hann, 1977 considerando:
2 ( = 1)
Donde m es el nmero de intervalos, p el nmero de parmetros. El nivel de confianza se expresa como 1-,
donde se conoce como el nivel de significancia, siendo su valor ms tpico el del 95%. El tamao del intervalo
de confianza, dentro del cual es razonable esperar que caiga el valor correcto. Los valores extremos superior e
inferior del intervalo de confianza se conocen como los lmites de confianza.
El nivel de confianza, b, se encuentra relacionada con el nivel de significancia a, dada por


Estadistica en Hidrología

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Estadistica en Hidrología

Uploaded by

Copyright:

Available Formats

ESTADISTICA EN HIDROLOGIA

Profesor(a): Alejandra Gonzlez J.

1. CONCEPTOS BSICOS .......................................................................................................................................4

Apuntes de Hidrologa Pgina 2

Apuntes de Hidrologa Pgina 3

La funcin de distribucin de probabilidad

Una de las funciones de densidad ms conocidas es la distribucin normal

Apuntes de Hidrologa Pgina 4

Parmetros de Posicin Parmetros de Dispersin

Mediana Desviacin Tpica

Moda Rango Intercuartlico

Cuartiles Coeficiente de Variacin

Apuntes de Hidrologa Pgina 5

Medidas de tendencia central: media, mediana y moda.

La media cumple una serie de propiedades bsicas:

Apuntes de Hidrologa Pgina 6

Apuntes de Hidrologa Pgina 7

Hallar los cuartiles.

Apuntes de Hidrologa Pgina 8

Apuntes de Hidrologa Pgina 9

2.3 Parmetros de Forma

Figura 1: Funcin densidad de una distribucin normal

Apuntes de Hidrologa Pgina 10

Figura 2: Tipos de Asimetra

2.3.2 Coeficiente de Curtosis

Existen 3 grandes categoras de Curtosis:

Apuntes de Hidrologa Pgina 11

Figura 3: Tipos de Curtosis

DISTRIBUCIN FUNCIN DENSIDAD RANGO ECUACIONES DE LOS PARMETROS

Apuntes de Hidrologa Pgina 12

3.1 Distribucin Normal

Figura 4: Distribucin Normal

Apuntes de Hidrologa Pgina 13

3.3 Distribucin Gamma

Apuntes de Hidrologa Pgina 14

3.5 Distribucin Chi-Cuadrado

3.6 Distribucin Weibull

3.7 Distribucin Pearson Tipo III

Apuntes de Hidrologa Pgina 15

De acuerdo a su valor k se clasifican en tres categoras:

4.1 Periodo de Retorno

Apuntes de Hidrologa Pgina 16

= + , la cual puede aproximarse por = +

As, el valor de requerido de XT se encuentra tomando el antilogaritmo de YT.

DISTRIBUCIN Factor de Frecuencia KT

Apuntes de Hidrologa Pgina 17

Para expresar T en trminos de KT, la ecuacin anterior puede escribirse como:

Apuntes de Hidrologa Pgina 18

5.1 Mtodo de los momentos

5.2 Mtodo de mxima verosimilitud

El mtodo de mxima verosimilitud tericamente es el ms correcto para ajustar distribuciones de probabilidad

Apuntes de Hidrologa Pgina 19

Por lo que se simplifica de la siguiente manera:

El nivel de confianza, b, se encuentra relacionada con el nivel de significancia a, dada por

Apuntes de Hidrologa Pgina 20

You might also like