Professional Documents
Culture Documents
Curso de Hidrologa
Ingeniera Civil
2016
CONTENIDO
1. CONCEPTOS BSICOS
Proceso Estocstico = Procesos que evolucionan en el tiempo y espacio en una forma parcialmente predecible,
o determinstica y aleatoria.
Cuando no existe correlacin entre observaciones adyacentes, la salida de un sistema hidrolgico es tratada
como estocstica, independiente del espacio y tiempo. Este tratamiento sirve para eventos hidrolgicos
extremos, crecientes o sequias, y para informacin hidrolgica promediada a lo largo de intervalos de tiempos
grandes (precipitacin anual, por ejemplo).
La probabilidad de un evento P(A), es la posibilidad que de que ste ocurra cuando se hace una observacin de
la variable aleatoria.
() = lim
Donde nA son los valores en el rango de evento A (Ej; dados de 1 al 6) y n es la cantidad de observaciones.
Si las observaciones de una muestra estn idnticamente distribuidas, se pueden ordenar y dividir en intervalos
discretos, luego se cuenta el nmero de observaciones que cae en cada uno de los intervalos.
La funcin densidad de probabilidad f(x) es la probabilidad de un evento cuando la cantidad de observaciones
tiende a infinito y el intervalo de longitud tiende a cero (X)
()
() lim
0
2
1
() = 2 +
2
2. PARMETROS ESTADSTICOS
Los parmetros estadsticos permiten caracterizar una poblacin y extraer la informacin esencial de un conjunto
de datos, reduciendo un conjunto de grandes nmeros a un conjunto de pequeos nmeros. Los parmetros son
medidas objetivas, es decir, su valor para un mismo conjunto de datos, siempre es el mismo, aunque lo estimen
distintas personas.
Los parmetros se pueden dividir en:
- Parmetros de Posicin
- Parmetros de Dispersin
En cada grupo se encuentran los siguientes parmetros:
Media Varianza
Tendencia Tendencia
Central Media No central Cuartiles
Mediana Deciles
Moda Perceptiles
2.1.1 Media ( ):
Es una medida del punto medio o tendencia central de la distribucin, y corresponde a la suma de todos los datos
dividido por el nmero total de valores, se define por:
1
=
=1
x i +K
x+K = i =1
N
(b) Si a cada uno de los valores de una variable se le multiplica por una constante, K, la media queda
multiplicada por esa constante:
N
x K i
x K = i =1
N
(c) Si una variable Y es una transformada lineal de otra variable X, es decir, Y=a+bX, la media de Y es tambin
la transformada lineal de la media de X, es decir, y =a+b x .
(d) La suma de las desviaciones de todos los valores de la variable respecto a su media es cero:
N
(x
i =1
i x) = 0
En general, la media no ser un buen parmetro de posicin cuando la distribucin de los datos sea asimtrica,
al ser muy sensible a los valores extremos de la variable. Tambin la media en distribuciones estadsticas es
denominada en su letra griega .
2.1.2 Mediana (Me)
La mediana es un valor de la variable que deja por debajo de s a la mitad de los datos, una vez que estos estn
ordenados de menor a mayor. La mediana se denota por Me y se calcula de manera sencilla. Ordenados los
datos de menor a mayor, Me es:
N +1
Si N es un nmero impar, entonces Me es el valor que ocupa la posicin de la lista de datos ordenados.
2
Dmonos cuenta que, en este caso, quedarn el mismo nmero de datos a un lado y al otro de la mediana.
Si N es un nmero par, no tenemos un dato central. En ese caso, tomamos la media de los dos datos centrales y
que s dejan el mismo nmero de valores a un lado y al otro, es decir, la mediana ser la media de los datos que
N N
ocupan las posiciones y + 1 de la lista de datos ordenados.
2 2
La mediana es menos sensible que la media a oscilaciones de los valores de la variable y no se ve afectada por la
dispersin. De hecho, es ms representativa que la media aritmtica cuando los datos son es bastante
heterogneos o asimtricos.
Por ejemplo: Sea la variable aleatoria nmeros de televisores por hogar. Se realiza una encuesta en 13 hogares,
obtenindose los siguientes resultados:
3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1
Hallar la mediana de los mismos.
El primer paso es ordenar los datos de menor a mayor: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4
Como n es 13, impar, Me ser igual a 2, de manera que queden 6 datos por debajo y 6 por encima de dicha
posicin. Mientras que la media sera 1,85 (24/13).
2.1.3 Moda (Mo)
La moda, representada por Mo, es otro parmetro de posicin que se calcula simplemente como el valor que
ms se repite en la muestra, es decir, el valor con una mayor frecuencia. En consecuencia, no siempre se sita
hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la variable presenten la misma frecuencia.
Por otro lado, la moda puede no existir cuando en un conjunto de datos, todos stos son diferentes entre s y no
hay ningn dato que se repita ms de una vez.
2.1.4 Medidas de posicin no central
Se trata de valores de la variable estadstica que dejan por debajo de s determinada cantidad de los datos.
Mientras que la mediana deja por debajo de s al 50% de la distribucin, los cuantiles pueden hacerlo con
Segundo cuartil, C2. Coincide con la mediana. Deja el 50% de los valores por debajo y por encima.
Tercer cuartil, C3. Valor que deja por debajo el 75% de los datos y por encima el 25% de los datos.
Para calcular C1 y C3, ordenados los datos de menor a mayor, se procede de la siguiente forma:
Si N es un nmero par, entonces C1 es la mediana de los N/2 primeros datos y C3 la mediana de los N/2
ltimos datos.
Si N es un nmero impar, entonces tenemos dos posibilidades:
N 1 N 1 N 1
es impar. C1 es la mediana de los primeros datos. C3 es la mediana de los ltimos
2 2 2
datos.
N 1 N 1 N 1
es par. C1 es la mediana de los primeros +C2 datos y C3 la mediana de los ltimos
2 2 2
+C2 datos
Por ejemplo: Los siguientes datos muestran el nmero de despedidos que se han producido en 15 empresas del
sector del automvil durante el ao 2010:
33 56 91 64 55 60 2 42 32 26 63 40 25 34 84
Se trata de un nmero impar de datos, luego la mediana es el valor central que ocupa la posicin (N+1)/2 o en
nuestro caso (15+1)/2=8, es decir, el dato 42.
Para el primer y el tercer cuartil, tenemos que N es impar (15) y que (N-1)/2=7 es impar. Por tanto, el primer
cuartil C1 es la media de los primeros (N-1)/2 datos, como son 7 datos, ser entonces el dato central de los
primeros (N-1)/2 datos, o el dato 4. Luego C1=32
Para C3 es la mediana de los (N-1) /2, con lo que C3=63.
(b) Si una variable Z es la suma de dos variables X e Y, la varianza de Z es la suma de las varianzas de X e Y, es
decir, si Z=X+Y entonces, S Z2 = S X2 + SY2
(c) Siguiendo lo anterior, si una variable Y es una transformada lineal de otra variable X, es decir, Y= a+bX, la
varianza de Y es tambin la transformada lineal de la varianza de X, esto es SY2 = b 2 S X2 .
(x x)
2
i
S= i =1
=
N 1
Por ejemplo: La varianza y desviacin tpica de los datos 2, 9, 8, 15, 21, 5, 20, seran respectivamente 49,18 y
6,82.
2.2.5 Coeficiente de Variacin de Pearson
Se define como cociente entre la desviacin tpica y la media:
S
CV = ; o tambin =
x
Se interpreta como el nmero de veces que la media est contenida en la desviacin tpica. Suele darse su valor
en tanto por ciento, multiplicando el resultado anterior por 100. De este modo se obtiene un porcentaje de la
variabilidad.
Los parmetros de forma son indicativos de la forma tpica que presenta la grfica o histograma de los datos, es
decir de cmo se distribuyen. Entre ellas destacan el coeficiente de asimetra y curtosis.
Por ejemplo: el coeficiente de asimetra y de Curtosis de los datos 2, 9, 8, 15, 21, 5, 20, seran respectivamente
0,22 y -1,64, es decir prcticamente normal respecto del punto de vista de la asimetra y ligeramente platicrtico.
3. DISTRIBUCIONES DE PROBABILIDAD
La distribucin probabilstica es una funcin que representa la probabilidad de ocurrencia de una variable
aleatoria, existen numerosas distribuciones, las que comnmente son utilizadas para variables hidrolgicas son:
- Distribucin Normal
- Distribucin Log Normal
- Distribucin Exponencial
- Distribucin Gamma
- Distribucin Pearson III
- Distribucin Log Pearson III
- Valor extremo tipo I
La siguiente tabla describe la funcin densidad de probabilidad y el rango de la variable de cada una de estas
distribuciones, junto con las ecuaciones para estimar los parmetros de la distribucin a partir de los
momentos 1de la muestra.
Tabla 1:Distribuciones de probabilidad para el ajuste de informacin hidrolgica
1 ( )2
Normal () = = , =
2 2 2
1 ( )2 Y = log x
LogNormal () = = , =
2 22 x>0
1 2 1
Gamma () = 0 = ; = =
() 2 2 2
1
Exponencial =
() = 0
= 1/ 2 = 1/2
1
Momentos corresponden a valores de parmetros de una funcin de densidad que permiten caracterizar la muestra.
21 /2 2
Chi-Cuadrado () = 0 = 2 =
22 (/2) 2
2 1
Weibull () = 1
0 = = , =
2 2 2
Pearson tipo ( )1 () 2 2
() = = ; = ; =
III ()
Log Pearson ( )1 () = 2 2
() = = ; = ; =
tipo III () ()
1 ( ) ( ) 6
Valor Extremo () = exp =
= 0,5772
Media (u) = 0
N (0,1) Media (u) = 2
Distinto Cv
=1, =1
=2, =1
=4, =1
Si una variable x esta descrita por una distribucin valor extremo tipo III, se dice que -x tiene una distribucin
Weibull.
4. ANLISIS DE FRECUENCIA
Los sistemas hidrolgicos son afectados por eventos extremos, precipitaciones altas que provocan inundaciones
severas, caudales mximos que exceden la capacidad del cauce que los contiene o periodos de sequa donde no
hay ocurrencia de lluvias por un largo tiempo, sin poder predecir cundo llover otra vez. La hidrologa
estadstica se encarga de estudiar estos fenmenos basada en que la magnitud de un evento extremo est
inversamente relacionada con su frecuencia de ocurrencia, es decir, eventos muy severos ocurren con menor
frecuencia que eventos ms moderados.
El objetivo de realizar un anlisis de frecuencia a los datos hidrolgicos es relacionar la magnitud de los eventos
extremos con su frecuencia mediante el uso de distribuciones de probabilidad, ya que se supone que la
informacin hidrolgica es independiente y est idnticamente distribuida y su proceso de creacin es
estocstico (procesos predecibles en el tiempo).
Los resultados del anlisis de frecuencia pueden ser utilizados para muchos propsitos en ingeniera, tales como
el diseo de presas, puentes, colectores de aguas lluvias, obras de drenaje y saneamiento de caminos,
mejoramientos y proteccin de cauces naturales, entre otros.
El primer concepto a definir es el periodo de retorno (T), parmetro que ser esencial para definir un evento
extremo.
1
( () 1 ) = 1 (1 () = 1 1
En el evento que la variable sea y= log X, entonces se aplica el mismo mtodo a las estadsticas para los logaritmos
de los datos utilizando la relacin:
= +
De esta forma, para una distribucin de probabilidad dada, se determina una relacin entre KT y un perodo de
retorno, la cual puede expresarse por trminos matemticos o por uso de tablas.
La siguiente tabla muestra los factores KT para las diferentes funciones de probabilidad que se emplean para el
mtodo de factor de frecuencia.
Tabla 2: Factores de Frecuencia
Normal y Log =
Normal
Tabla Normalizada, o mediante la aproximacin de la variable w.
Pearson y Log
1 1
= + ( 2 1) + ( 3 6) 2 ( 2 1) 3 + 4 + 5
Pearson tipo 3 3
III
Valor Extremo 6
Tipo I = 0.5772 + ln ln
1
1 1/2
= ln (1)2 para p > 0,5
Para la distribucin LogNormal, se aplica el mismo procedimiento excepto que se aplica a los logaritmos de las
variables y con su media y desviacin estndar se obtiene el YT que luego se le aplica el antilogaritmo y se obtiene
el XT
Ejercicio: calcule el factor de frecuencia para la distribucin normal de un evento asociado a un periodo de
retorno de 50 aos. (Resultado = 2.054)
4.2.2 Pearson y LogPearson Tipo III
Para obtener KT se hace a travs de los logaritmos de la informacin hidrolgica y = Log x. (en base 10). Se calcula
la media y la desviacin estndar y coeficiente de asimetra C para los logaritmos de los datos, de esta forma el
factor de frecuencia KT se aproxima por Kite (1977) como:
1 1
= + ( 2 1) + ( 3 6) 2 ( 2 1) 3 + 4 + 5
3 3
Donde:
k = Cs/6
z = se obtiene para T de acuerdo a la distribucin standard (w, KT distribucin normal)
Ejercicio: calcule los caudales mximos anuales con periodos de retorno de 5 aos, utilizando la distribucin Log
Pearson y los siguientes datos estadsticos: = 4,2743, Sy = 0,4027 y Cs = -0,0696. (Resultado = 41,17 m3/s).
4.2.3 Valor Extremo
El valor de KT se determina a travs de la expresin:
6
= 0.5772 + ln ln
1
Segundo momento: 2 = [( )2 ]
Tercer momento: = [( )3 ] 3
= ()
=1
Debido a que muchas funciones de densidad de probabilidad son exponenciales, algunas veces es conveniente
trabajar con la funcin algoritmo de la verosimilitud.
ln = ln[()]
=1
Donde:
m= N de intervalos
nfs(xi) = N de ocurrencias observadas = fo
np(xi) = N esperado de ocurrencias = fc
( )2
2 = =1 en donde
Si el estadstico =0 significa que las distribuciones terica y emprica se ajustan exactamente, mientras que si
el estadstico >0, ellas difieren.
La distribucin del estadstico se puede asimilar a una distribucin Chi-cuadrado con (k-1) grados de libertad,
donde k es el nmero de intervalos y n es el nmero de los parmetros de la distribucin terica.
La funcin de distribucin c2 est tabulada por Hann, 1977 considerando:
2 ( = 1)
Donde m es el nmero de intervalos, p el nmero de parmetros. El nivel de confianza se expresa como 1-,
donde se conoce como el nivel de significancia, siendo su valor ms tpico el del 95%. El tamao del intervalo
de confianza, dentro del cual es razonable esperar que caiga el valor correcto. Los valores extremos superior e
inferior del intervalo de confianza se conocen como los lmites de confianza.