You are on page 1of 27

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

PRACTICA N 02
HIDROLOGIA ESTADSTICA
Los estudios hidrolgicos requieren del anlisis de cuantiosa informacin hidrometeolgica; esta
informacin puede consistir de datos de precipitacin, caudales, temperatura, evaporacin, etc.
Los datos recopilados, solo representan una informacin en bruto, pero si stos se organizan y analizan
en forma adecuada, proporcionan al hidrlogo una herramienta de gran utilidad, que
le permite tomar decisiones en el diseo de estructuras hidrulicas.
Para el anlisis de la informacin, la hidrologa utiliza los conceptos de probabilidades y estadstica,
siendo este campo, una de las primeras reas de la ciencia e ingeniera, en usar los
conceptos estadsticos, en un esfuerzo para analizar los fenmenos naturales.
Objetivos: El objetivo del estudio de la Hidrologa Estadstica, est orientada a ayudar a comprender
los principios fundamentales de la probabilidad y la estadstica, aplicada a la hidrologa, as como,
mostrar algunas herramientas estadsticas, que han sido aplicados con xito, en la solucin de
problemas hidrolgicos.
Para la simplificacin del anlisis de la abundante informacin, se requiere del uso de la computadora
digital, y el uso de software, que tiene la finalidad de procesar fcilmente esta informacin. Ella se
utiliza en la solucin de los ejemplos resueltos.

1. Frecuencias de una muestra

1.1 Representacin tabular y grfica de las muestras


En hidrologa se trabaja con informaciones hidrometeoro lgicas; estas informaciones pueden consistir
de datos de precipitacin, caudales, temperatura, evaporacin, etc.
Por lo general, se cuenta solo con una muestra de los datos de esa poblacin, es decir, nunca se puede
disponer de la totalidad de los datos. Pero cuando stos datos se organizan en forma compacta y fcil
de utilizar, los hidrlogos pueden disponer de una herramienta |de gran utilidad, para las decisiones a
tomar.
Existen muchas formas de clasificar los datos, una manera til, es dividirlo en categoras similares o
clases, y luego contar el nmero de observaciones que caen en cada categora, lo que constituye una
tabla de frecuencias o una distribucin de frecuencias.
Para una muestra dada, se escoge un rango R, que contenga a todos los valores de la misma. Se
subdivide R en subintervalos que se llaman intervalos de clase; los puntos medios de estos intervalos
se denominan marcas de clase. Se dice que los valores de la muestra
en cada uno de los intervalos forma una clase.. Al nmero de valores en una clase se llama frecuencia
de la clase; su divisin entre el tamao N de la muestra es la frecuencia relativa de clase. Esta
frecuencia considerada como funcin de las marcas de clase, se denomina funcin de frecuencias de la
muestra, y se denota comof(x). La funcin de frecuencias acumuladas de la muestra, se denota como
F(x), y se define como:
F x f (t )
tx

1.2 Procedimiento de clculo


-A continuacin se indica un procedimiento prctico, para el clculo de las frecuencias y frecuencias
acumuladas, la misma que se usar ms adelante para el clculo de la distribucin de probabilidades
empricas de datos agrupados en intervalos de clase:
Procedimiento:
1. Ordenar la muestra en forma creciente o decreciente:
Para agilizar los clculos resulta conveniente contar con una aplicacin que permita el ordenamiento de

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

los datos.
Por ejemplo, si se ordenan los datos en forma creciente, se tiene:
Xmin, X2, X3, ....Xmx

(1.1)

donde:
Xmin = X1 es el valor mnimo de los datos
Xmax = XN es el valor mximo de los datos
2. Calcular el rango R de la muestra:
R = Xmax - Xmin

(1.2)

3. Seleccionar el nmero de intervalos de clase NC:


NC depende del tamao de la muestra N. En aplicaciones de hidrologa el nmero de intervalos de
clase puede estar entre 6 y 25.
Yevjevich sugiere para seleccionar NC, las siguientes relaciones empricas:
(a)
NC = l.33lnN+1
(1.3)
(b)
si N < 30
=> NC < 5
si 30 < N < 75 => 8 < NC < 10
si N > 75
=> 10 > NC < 30
donde:
N = tamao de la muestra
lnN = logaritmo natural o neperiano del tamao muestral.
4. Calcular la amplitud de cada intervalo de clase x, segn la ecuacin:

x max x min
NC 1

R
NC 1
(1.4)
Al dividir el rango entre NC - 1, lo que en realidad se hace es incrementar el rango en x, incluyendo
un intervalo ms, el mismo que resulta, de agregar medio intervalo (x /2), en cada extremo de la serie
ordenada, a fin de que xmax y xmin respectivamente, las marcas de clase de la primera y ltima clase.

5. Calcular los lmites de clase de cada uno de los intervalos:


Como se manifest en el punto 4, con el artificio de dividir entre NC-1, se logra que x^fn y x^x
queden centrados y representan las marcas de clase de la primera y ltima clase, entonces los lmites de
clase inferior y superior del primer intervalo de clase, son:
x
LCI1 = x mn
(1.5)
2
x
LCS1 = x mn
= LCI1 + x
(1.6)
2
Los otros lmites de clase, se obtienen sumando la amplitud x, al lmite de clase anterior.
6. Calcular las marcas de clase de cada uno de los intervalos:
Las marcas de clase se obtienen del promedio de los lmites de clase.
As 1: marca de clase del primer intervalo es:
LCI 1 LCS1
MC1
2

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

Con el artificio realizado anteriormente la marca de clase del primer intervalo es igual al valor mnimo,
de igual forma la marca de clase del ltimo intervalo es igual al valor mximo es decir:
MCl=Xmin
MCn = Xmx
Las otras marcas de clase, se obtienen sumando la amplitud x, a las marcas de clase anteriores.
7. Calcular la frecuencia absoluta:
Esta es igual al nmero de observaciones, que caen dentro de cada intervalo definido por sus lmites de
clases respectivos, la misma que se obtiene por conteo, as se obtiene:
fabi = ni
... (1.8)
donde:
fabi = frecuencia absoluta del intervalo i
ni = nmero de observaciones en el intervalo i
8. Calcular la frecuencia relativa fri, de cada intervalo:
Esta es igual a la frecuencia absoluta del mismo, dividido entre el nmero total de observaciones, es
decir:

fri

fabi ni

N
N

...(1.9)

N
donde:
fri = frecuencia relativa del intervalo i
ni = nmero de observaciones en el intervalo i
N = nmero total de observaciones
N

9. Calcular la frecuencia relativa acumulada Fri, usando la frmula:


i
i n
1 i
j
Fri fr j
nj
(1.10)
N j 1
j 1
j 1 N
donde:
Fri = frecuencia relativa acumulada hasta el intervalo i
j = 1, 2,..., i acumulacin de los intervalos hasta i
ni =- nmero de observaciones en el intervalo i
N = nmero total de observaciones
10. Calcular la funcin densidad emprica fp para cada intervalo:
Esta funcin segn Yevjevich, se calcula usando la frmula:

fi lim
x 0

fri
fr
n
i i
x x x

...(2.11)

donde:
fi = funcin densidad emprica para el intervalo i
ni = nmero de observaciones en el intervalo i
N = nmero total de observaciones
x = amplitud del intervalo de clases
11. Calcular la funcin de distribucin acumulada emprica usando la frmula:
i

Fi xf j
j 1

7=1

...(1.12)

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

donde:
F = funcin de distribucin acumulada
fi = funcin densidad emprica para el intervalo j
Ax = amplitud del intervalo de clase
Los valores de Fri y Fi obtenidos con las ecuaciones (1.10) y (1.12) resultan similares.

Ejemplo
Dada la serie histrica de caudales medios anuales en m3/s (tabla 1.1), de la estacin Salinar del Ro
Chicama (Per), para el perodo 1911-1980, calcule las frecuencias absolutas, relativa, acumulada,
funcin densidad, funcin acumulada.
Solucin:
1. Ordenando los datos de la tabla 1.1, se obtiene la tabla 1.2.
Tabla 1.1. Serie histrica de caudales medios anuales en m3/s del ro Chicama, estacin Salinar (1911 1980)
Ao
1911
1912
1913
1914
1915
1916
1917
1918
1919
1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934

Caudal
m3/s
7.91
8.01
13.27
16.39
80.83
60.08
21.55
27.71
28.63
30.27
33.43
35.16
27.21
15.58
64.81
51.26
33.48
25.79
25.80
18.93
16.15
38.30
54.54
59.40

Ao
1935
1936
1937
1938
1939
1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958

Caudal
m3/s
24.58
28.49
10.05
28.01
34.92
31.36
42.74
12.94
41.16
35.90
33.76
29.28
19.17
29.37
30.06
9.67
10.42
23.99
42.17
16.00
22.78
32.69
34.28
20.24

Ao
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980

Caudal
m3/s
22.88
17.57
14.60
31.14
18.20
24.69
22.99
11.78
32.26
4.76
12.70
16.19
30.14
30.57
45.38
18.91
34.99
21.49
29.26
4.58
12.46
3.14

2. Clculo de R:
De (1.2), se tiene:
R = 80.83 - 3.14
R = 77.69
Tabla 1.2 Serie de caudales en m3/s, del ro Chicama, ordenado ascendentemente

Gua de Practicas de Hidrologa

3.14
10.42
15.58
18.91
22.88
27.21
29.37
32.26
34.99
45.38

4.58
11.78
16.00
18.93
22.99
27.71
30.06
32.69
35.16
51.26

4.76
12.46
16.15
19.77
23.99
28.01
30.14
33.43
35.90
54.54

7.91
12.70
16.19
20.24
24.58
28.49
30.27
33.48
38.30
59.40

Efran Chuchn Prado


Facultad de Ciencias Agrarias

8.01
12.92
16.39
21.49
24.69
28.63
30.57
33.76
41.16
60.08

9.67
13.27
17.57
21.55
25.79
29.26
31.14
34.28
42.17
64.81

10.05
14.60
18.20
22.78
25.80
29.28
31.36
34.92
42.74
80.83

3. Clculo de NC:
De (1.3), resulta:
NC = 1.33 1n70 + l
NC = 6.65
Redondeando:
NC=7
4. Clculo de x:
De (1.4) se obtiene:
77.69
x
12.95
7 1
Si se quisiera redondear a fin de que los lmites y las marcas de clase resulten nmeros ms simples,
podra ser: x=13 s =12.
Si se escoge x = 13 los lmites de clase superior e inferior, resultan un poco mayor y menor
respectivamente que si se escoge x = 12.
Para el ejemplo se escoge x = 12, a fin de obtener valores parecidos, al que se obtiene con el proceso
computacional.
5. Clculo de los lmites de clase:
De (1.5), el lmite de clase inferior del primer intervalo sera:
LCI1=3.14- 12/2 == -2.86
pero fsicamente los caudales no pueden ser negativos, el menor valor sera 0.
LCI1 =0
De (1.6), se tiene:
LCSI = 0+12=12
Los otros lmites, se calculan sumando x al lmite de clase que le antecede; los resultados se muestran
en la columna 1 de la tabla 1.3.
Nota. Cuando el lmite de clase es negativo, su valor, por condiciones fsicas ser cero.
6. Clculo de las marcas de clase
De (1.7), la marca de clase del primer intervalo es:
0 12
MC1
6
2
Las marcas de clase de los otros intervalos se obtienen sumando x a la precedente; los resultados se

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

muestran en la columna 2 de la tabla 1.3.


Nota. Observar que cuando el lmite de clase es inferior a cero, la marca de clase del primer intervalo,
no es igual al valor mnimo.
7. Clculo de la frecuencia absoluta
A partir de los datos ordenados de la tabla 1.2, es fcil determinar el nmero de valores comprendidos
en cada intervalo, as en el primer intervalo entre 0-12, hay 9 valores y as sucesivamente, los
resultados se muestran en la columna 3 de la tabla 1.3.
8. Clculo de la frecuencia relativa
Usando (1.9), se obtienen los valores que se muestran en la columna 4 de la tabla 1.3.
9. Clculo de la funcin densidad emprica y la funcin de distribucin acumulada.usando (1.11) y
(1.12), se obtienen los valores que se muestran en las columnas 5 y 6 de la tabla 1.3.
Tabla 1.3. Clculo de la frecuencia relativa, absoluta, funcin densidad y acumulada del ro Chicama,
proceso manual.
Marca de

Frecuencia

Frecuencia

Funcin

Funcin

Intervalo de clase

Clase

aabsoluta

relativa

densidad

acumulada

(1)

(2)
0

(3)

(4)

(5)

(6)

12

0.1286

0.0107

0.1286

12

24

18

22

0.3143

0.0262

0.4429

24

36

30

28

0.4000

0.0333

0.8429

36

48

42

0.0714

0.0060

0.9143

48

60

54

0.0429

0.0036

0.9571

60

72

66

0.0286

0.0024

0.9857

72

84

78

0.0143

0.0012

1.0000

Total

70

1.3 Representacin grfica


Existen varias formas de representar las muestras en forma grfica, dentro de las cuales se pueden
mencionar:
Histograma
Un histograma es la representacin grfica de las frecuencias, en forma de rectngulos, siendo la base
de cada rectngulo el intervalo de clase y la altura la frecuencia absoluta, fab i la frecuencia relativa
fri.
En la figura 1.3, se muestra el histograma del ejemplo anterior, que se obtiene grafcando las columnas
(1) y (4) de la tabla 1.3.

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

fr

Histograma
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-6

18

30

42

54

66

78

Marca de clase
Figura 1.3. Histograma o distribucin de frecuencias relativas de los caudales del ro Chicama
Polgono de frecuencia
Un polgono de frecuencia es la representacin grfica de las frecuencias, se obtiene uniendo con lneas
rectas, los puntos formados por las marcas de clase vs. la frecuencia absoluta o
relativa. Para que el polgono alcance al eje horizontal, a ambos lados de la distribucin, se le agrega
un intervalo de clase con frecuencia igual a cero.
En forma prctica, un polgono de frecuencia se obtiene, uniendo con lneas rectas los puntos medios
de todas las barras de un histograma.
En la figura 1.4 se muestra el polgono de frecuencia del ejemplo anterior, que se obtiene graneando las
columnas (2) vs. (4) de la tabla 1.3; se observa que se han agregado en las marcas de clase los
valores -6 y 90.

Polgono de Frecuencia
0.5
0.4

fr

0.3
0.2
0.1
0
-6

18

30

42

54

66

78

Marca de Clase
Figura 1.4. Polgono de frecuencia de los caudales del no Chicama
Funcin densidad emprica
El histograma o el polgono de frecuencia, son dependientes del tamao del intervalo de clase y la

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

posicin del lmite de clase. Para evitar esta dependencia el histograma o el polgono de frecuencia
puede transformarse en una funcin densidad emprica, usando la ecuacin (1.11) propuesta por
Yevjevich. En esta ecuacin el intervalo de clase tiende a cero, con lo que el nmero de intervalos
tiende a infinito.
El grfico es parecido al polgono de frecuencia, pero con la variante en la escala vertical, que se hace
pequea y la unin de los puntos se hace mediante lneas curvas.
En la figura 1.5, se muestra la funcin densidad del ejemplo anterior, que se obtiene graficando las
columnas (2) vs. (5), de la tabla 1.3.

Funcin de densidad emprica


0.04

func. densidad

0.035
0.03
0.025
0.02
0.015
0.01
0.005
0
-20

20

40

60

Marca de clase

80

100

Figura 1.5. Funcin densidad emprica de los caudales del ro Chicama


Este grfico de la funcin densidad, es muy til para comparar los resultados empricos, con la funcin
densidad de probabilidad de distribuciones conocidas, como la normal, log-normal y otras.
Funcin de distribucin acumulada o emprica
Permite ver el porcentaje de las observaciones que quedan por encima o por debajo de ciertos valores,
con respecto al total. El grfico se obtiene uniendo los puntos obtenidos por las marcas de
clase vs. la funcin acumulada.
En la Figura 2.6, se muestra la funcin acumulada del ejemplo anterior, que se obtiene gra neando las
columnas (2) vs. (6) de la tabla 2.3.

Fr

Funcin de distribucin acumulada


1.2
1
0.8
0.6
0.4
0.2
0
0

10

Marca de clase
Figura 1.6. Funcin de distribucin acumulada de los caudales del no Chicama

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

En la tabla 1.4 se muestran los resultados, para los mismos datos, usando el proceso computacional. En
esta tabla 1.4, la frecuencia relativa y la funcin de densidad acumulada se expresan en %.
Tabla 1.4. Funcin densidad emprica y funcin acumulada, proceso computacional
Intervalo de clase
LCI
0.00
12.00
23.99
35.99
47.98
59.98
71.97

MCL
6.00
17.99
29.99
41.99
53.98
65.98
77.97

LCS
12.00
23.99
35.99
47.98
59.98
71.97
83.97

Frecuencia Frecuencia Funcin Funcin


absoluta relativa
densidad acumulad
(%)
(%)
(%)
9.00
22.00
28.00
5.00
3.00
2.00
1.00

12.857
31.429
40.000
7.143
4.286
2.857
1.429

1.072
2.620
3.335
0.595
0.357
0.238
0.119

12.857
44.286
84.286
91.429
95.714
98.571
100.000

1.4 Problemas propuestos


1. Dada la serie histrica de caudales medios anuales en m^/s del ro Santa que se muestran en la tabla
1.5.
Tabla 1.5 Serie histrica de caudales medios anuales del ro Santa
239.07
197.58
144.22
169.64
212.48
184.98
98.13
182.53
266.54

101.76
153.64
134.10
158.48
123.22
146.08
106.40
183.49
256.62

100.18
169.18
156.80
164.35
177.00
128.15
145.79
95.05

107.43
124.31
119.52
163.88
193.78
101.66
207.78
132.49

183.11
107.62
105.21
105.81
162.29
123.00
217.52
114.31

154.80
108.75
116.69
110.77
133.97
127.82
208.18
136.22

Realizar el grfico de:


Histograma de distribucin de frecuencias relativas
Polgono de frecuencias
Funcin densidad emprica
Funcin acumulada
2. Dada la serie histrica de caudales medios anuales en m3/s de la estacin 76-20-01 del ro Corobic ,
que se muestra en la tabla 2,6, realizar el grfico de:
Histograma de distribucin de frecuencias relativas
Polgono de frecuencias
Funcin densidad emprica
Funcin acumulada

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

Tabla 2.6 Caudales medios anuales del ro Corobic


Ao
hidrolgico
54-55
55-56
56-57
57-58
58-59
59-60
60-61
61-62
62-63
63-64
64-65
65-66
66-67
67-68
68-69
69-70

Caudal
(m3/s)
13.35
21.90
11.13
5.22
4.40
6.70
8.55
8.12
7.86
5.35
7.51
5.82
10.05
9.66
7.61
10.54

Ao
hidrolgico
70-71
71-72
72-73
73-74
74-75
75-76
76-77
77-78
78-79
79-80
80-81
81-82
82-83
83-84
84-85
85-86

Caudal
(m3/s)
15.06
10.20
4.85
11.77
8.41
8.57
6.10
5.33
6.68
45.92
56.92
52.64
42.56
44.19
41.94
44.73

Gua de Practicas de Hidrologa

2.

Efran Chuchn Prado


Facultad de Ciencias Agrarias

Parmetros estadsticos

El hidrlogo generalmente tendr disponible un registro de datos hidrometeorolgico


(precipitacin, caudales, evapotranspiracin, temperaturas, etc.), a travs de su conocimiento
del problema fsico, escoger un modelo probabilstico a usar, que represente en forma
satisfactoria el comportamiento de la variable.
Para utilizar estos modelos probabilsticos, se deben calcular sus parmetros estadsticos y
realizar la prueba de bondad de ajuste. Dentro de estos parmetros estadsticos calculados por
los momentos ordinarios, se tiene:
media
rango
desviacin estndar
varianza
coeficiente de variacin
coeficiente de sesgo
coeficiente de curtosis
tambin estos parmetros estadsticos se pueden calcular utilizando los momentos lineales (Lmoments)

2.1 Media
Media muestral o poblacional datos no agrupados:
1 n
X xi
n i 1
donde:
X = media muestral o poblacional
xi = valor i-simo de la muestra
n = nmero total de datos
Media muestral o poblacional datos agrupados:
1 k
X xi f i
n ni 1
donde:
X = media
xi = valor de la i-sima marca de clase
fi = valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el intervalo i
k = nmero de intervalos de clase
n = nmero total de datos

2.2 Rango
Es una medida de distancia y representa la diferencia entre el mayor y el menor de los valores
observados, es decir:
R = Xmx - Xmn
donde:
R = rango
Xmx = valor mximo de los datos
Xmn = valor mnimo de los datos

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

El rango o la amplitud es una manera conveniente de describir la dispersin, sin embargo, no


da medida alguna de la dispersin entre los datos con respecto al valor central.

2.3 Desviacin estndar


Desviacin estndar poblacional datos no agrupados:

1 n 2

xi n 2
n i 1

Desviacin estndar muestral datos no agrupados:


1 n 2
2
S
xi n x
n 1 i 1

donde:
S = desviacin estndar muestral
= desviacin estndar poblacional
xi = valor i-simo de la muestra
x = = media muestral o poblacional
n = nmero total de datos
1 n
X xi
n i 1
Desviacin estndar poblacional datos agrupados:
1 k

xi2 f i n 2
n i 1

Desviacin estndar muestral datos agrupados:


1 k 2
2
S
xi f i n x
n 1 i 1

donde:
S = desviacin estndar muestral
= desviacin estndar poblacional
xi = valor de la i-sima marca de clase
x = = media
fi = valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el intervalo i
k = nmero de intervalos de clase
n = nmero total de datos
1 k
X xi f i
n i 1

2.4 Varianza
Varianza poblacional datos no agrupados:

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

n
1 n
xi 2 1 xi2 n 2

n i 1
n i 1

Varianza muestral datos no agrupados:

S2

1 n
xi X 2 1

n 1 i 1
n 1

xi2 n X

i 1

donde:
S = varianza muestral
= varianza poblacional
xi = valor i-simo de la muestra
x = = media muestral o poblacional
n = nmero total de datos
1 n
X xi
n i 1
Varianza poblacional datos agrupados:
1 k
1 k

2
2 xi f i xi2 f i n 2
n i 1
n i 1

Varianza muestral datos agrupados:

1 k
S
xi X 2 f i 1

n 1 i 1
n 1
2

x
i 1

2
i

fi nX

donde:
S = varianza muestral
= varianza poblacional
xi = valor de la i-sima marca de clase
x = = media
fi = valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el intervalo i
k = nmero de intervalos de clase
n = nmero total de datos
1 k
X xi f i
n i 1

2.5 Coeficiente de variacin


Es una medida relativa de dispersin, que relaciona la desviacin estndar y la media, es decir:
CV

S
x

Es una medida adimensional de la variabilidad alrededor de la media, generalmente en


Hidrologa se suele trabajar con datos muestrales.

2.6 Coeficiente de sesgo


El sesgo es el estadstico que mide la simetra y asimetra.
Sesgo poblacional datos no agrupados:
3
3

donde:

Gua de Practicas de Hidrologa

i 1

Efran Chuchn Prado


Facultad de Ciencias Agrarias

n
n

1
( xi ) 2
n i 1

1 n
xi
n i 1
Sesgo muestral datos no agrupados:
n2M 3
Cs
n 1 n 2 S 3
donde:

M3
S

x
i 1

n
1 n
( xi x ) 2

n 1 i 1

1 n
x xi
n i 1
Sesgo poblacional datos agrupados:
3
3

1 n

( xi ) 2 f i
n i 1
Sesgo muestral datos agrupados:
n2M 3
Cs
n 1 n 2 S 3

n 1

x
i 1

f nx

2
i i

1 k
xi f i
n i 1

2.7 Coeficiente de curtosis


El grado de achatamiento se mide con el estadstico denominado coeficiente de curtosis.
Curtosis poblacional datos no agrupados:
4
k 4

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

donde:
n

x
i 1

n
n

1
( xi ) 2

n i 1

1 n
xi
n i 1
Curtosis muestral datos no agrupados:
n3M 4
Cs
n 1 n 3 S 4
donde:

M4
S

x
i 1

n
1 n
( xi x ) 2

n 1 i 1

1 n
xi
n i 1
Curtosis poblacional datos agrupados:
4
k 4

donde:
x

x
i 1

fi
4

n
1 n
( xi ) 2 f i

n i 1

Curtosis muestral datos agrupados:


n3M 4
Cs
n 1 n 3 S 4
donde:
k

4
S

x
i 1

fi
4

n 1

x
i 1

f nx

2
i i

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

1 k
xi f i
n i 1

Momentos lineales (L-Moments)


Los momentos lineales (Lmoments), constituyen una metodologa moderna que permite
estimar los parmetros estadsticos de una poblacin o de una muestra. Son otra manera de
expresar las propiedades estadsticas de datos hidrolgicos, son similares a los momentos
ordinarios pues proporcionan las medidas de localizacin, dispersin, asimetra, curtosis, pero
se calculan de las combinaciones lineales de los datos (de aqu el nombre de momento lineal).
Los parmetros estadsticos estimados con esta metodologa, son menos sensibles a los valores
extremos, por lo que permite determinar la distribucin terica de probabilidad que mejor
ajusta a los datos analizados.
Por el mtodo de momentos lineales la dispersin no se calcula con respecto a un valor
central, sino que se calculan las diferencias de todos los datos entre s, considerando todas las
posibles combinaciones. Adems, las diferencias nunca se elevan a ninguna potencia, se
mantienen lineales, por lo cual los parmetros estimados por este mtodo son menos sensibles
a los valores extremos.
Las ecuaciones simplificadas de los momentos lineales, son:
1 n
1 n X i
C1 i 1

1 1
2 C 2n

1 1
3 C 3n

i 1
1

i 1
n

i 1

i 1
2

C1n i X i

2C1i 1C1n i C 2n i X i

1 1 n
C 3i 1 3C1i 1C1n i 3C1i 1C 2n i C 3n i X i
n
4 C 4 i 1
donde:
Xi (para i = 1,2 , 3, ..., n) = son los valores de la muestra ordenados ascendentemente
C kn = combinaciones de n elementos en grupos de k en k

para k<n
Si k = n C 1
n
Si k > n C k 0
El primer momento lineal 1 representa la media aritmtica de la muestra, es una medida de
localizacin y su valor es el mismo que el calculado por el mtodo tradicional. El segundo
momento lineal 2 es equivalente a la desviacin estndar pero calculada mediante las
diferencias de todos los datos entre s, no con respecto a un valor central; es un parmetro de
escala o dispersin de la variable aleatoria X.
Dividiendo el segundo momento lineal entre el primer momento lineal (desviacin estndar
entre la media), se obtiene el coeficiente lineal de variacin (CLV), es decir:
n
n

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

2
1
Dividiendo el momento lineal de orden r, entre la medida de dispersin, se obtiene la relacin
de momentos, es decir:

tr r
2
El t3 es una medida de asimetra y t4 es una medida de curtosis, stas son respectivamente el
coeficiente lineal de asimetra o sesgo (CLS) y el coeficiente lineal de curtosis (CLK), es decir:

t 3 CLS 3
2

t 4 CLS 4
2
Los clculos de los momentos lineales 1, 2, 3, 4, con el uso de calculadoras e incluso con la
computadora, resulta bastante complejo. Con el fin de simplificar stos clculos, se presenta el
cdigo fuente en Basic, de la subrutina que calcula estos momentos, tambin se incluyen los
clculos de los parmetros estadsticos lineales. En el cdigo: L1= 1, L2=2, L3=3, L4=4 y
xxord(j) es la serie ordenada en forma ascendente.
' Clculo de los parmetros lineales
' xxord(j) es la serie ordenada en forma ascendente que se tiene disponible
L1 = 0
L2 = 0
L3 = 0
L4 = 0
For j = 1 To n
CL1 = j - 1
CL2 = CL1 * (j - 1 - 1) / 2
CL3 = CL2 * (j - 1 - 2) / 3
CR1 = n - j
CR2 = CR1 * (n - j - 1) / 2
CR3 = CR2 * (n - j - 2) / 3
L1 = L1 + xxord(j)
L2 = L2 + (CL1 - CR1) * xxord(j)
L3 = L3 + (CL2 - 2 * CL1 * CR1 + CR2) * xxord(j)
L4 = L4 + (CL3 - 3 * CL2 * CR1 + 3 * CL1 * CR2 - CR3) * xxord(j)
Next j
C1 = n
C2 = C1 * (n - 1) / 2
c3 = C2 * (n - 2) / 3
C4 = c3 * (n - 3) / 4
L1 = L1 / C1
L2 = L2 / C2 / 2
L3 = L3 / c3 / 3
L4 = L4 / C4 / 4
'Clculo de los parmetros con momentos lineales
CIMedia = L1
CLV

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

CIDesEstandar = L2
CIVarianza = L2 ^ 2
CIVariacion = L2 / L1
CISesgo = L3 / L2
CIKurtosis = L4 / L2
Los clculos de los estadsticos de una serie de datos son por s laboriosos. Para la simplificacin de los
clculos, donde se requieren la determinacin de la media, varianza, desviacin estndar, el
coeficiente de variacin, coeficiente de sesgo y coeficiente de curtosis, tanto para datos poblacionales o
mustrales y para datos agrupados o no agrupados, es mejor contar con una aplicacin que realice estos
clculos.
En la prctica se va realizat utilizando computacionalmente el Microsft Excel y el HIDROESTA para
stos clculos.

Ejemplo 2:
Dado los datos de precipitacin anual, en mm de la estacin El Coyol, para el perodo 1974-1986, los
mismos que se muestran en la tabla 2.1. Calcular su media, varianza, desviacin estndar, coeficiente
de variacin, coeficiente de sesgo y el coeficiente de curtosis.
Tabla 2.1 Precipitacin anual de la estacin El Coyol
Ao

Precipitacin
(mm)
1418.60
1527.30
1108.60
1084.20
1509.10
1394.90
1334.40

1974
1975
1976
1977
1978
1979
1980

Ao
1981
1982
1983
1984
1985
1986

Precipitacin
(mm)
1441.50
1133.20
891.00
1429.80
1141.50
1312.60

Solucin:
Utilizando la aplicacin de Microsoft Excel y haciendo uso de la opcin de datos no agrupados, los
resultados que se obtienen, son los que se muestran:
Media
Varianza
Desviacin Estndar
Coeficiente Variacin
Coeficiente Sesgo
Coeficiente Curtosis

Poblacionales
1286.67
35214.73
187.66
0.15
-0.55
2.20

Mustrales
1286.67
38149.29
195.32
0.15
-0.63
3.12

Nota. Para calcular estos parmetros estadsticos solo hay que hacer uso de las frmulas indicadas.
Como prctica se sugiere que se realicen estos clculos, tiene de antemano los resultados que debe
encontrar.

2.2

Problemas propuestos

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

1. Dado los caudales medios del mes de Mayo, de un ro, en m3/s:


Ao
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980

Q m3/s
3.99
2.96
1.79
1.55
2.48
2.61
2.27
1.86
2.07
2.70

Ao
1981
1982
1983
1984
1985
1986
1987
1988
1989

Q m3/s
4.52
3.09
5.00
6.03
2.73
3.13
4.18
3.26
4.03

Calcular la media, varianza, coeficiente de variacin, coeficiente de asimetra o sesgo y coeficiente de


curtosis.
2. Si los datos del problema 1, se agrupan en los siguientes intervalos de clase:
Intervalos de clase
1 -2
2-3
3-4
4-5
5-6
6-7

Marca de clase
1.5
2.5
3.5
4.5
5.5
6.5

Calcular la media, varianza, coeficiente de variacin, coeficiente de asimetra o sesgo y coeficiente de


curtosis.
3. Se tiene una cuenca en la que se han instalado 8 pluvimetros. Las precipitaciones promedios
anuales registradas, en mm, para el perodo 1970 - 1991, y las reas de influencia, en Km2, de esas
estaciones, se muestran en la siguiente tabla:
Estacin
1
2
3
4
5
6
7
8

rea (Km2)
150
300
187
600
550
145
278
110

Precipitacin (mm)
2915
2563
3241
4017
5321
4621
5002
4932

Determinar la precipitacin promedio.


4. En la tabla 2.2, se muestran los caudales picos, en m3/s, medidos en cada ao, del periodo 19752000, de una estacin.
Calcular:
La media de los caudales picos
La desviacin estndar
El coeficiente de variacin
Tabla 2.2 Caudales picos para el periodo 1975-2000
Ao
1975
1976
1977
1978
1979
1980

Q (m3/s)
880
1360
885
1180
1100
1390

Ao
1988
1989
1990
1991
1992
1993

Q (m3/s)
1070
1060
718
965
370
549

Gua de Practicas de Hidrologa

1981
1982
1983
1984
1985
1986
1987

2230
1480
400
866
6130
1910
1310

Efran Chuchn Prado


Facultad de Ciencias Agrarias
1994
1995
1996
1997
1998
1999
2000

2240
319
772
882
1010
1130
1260

3.- Correlacin y regresin


3.1 Ecuaciones de regresin
El anlisis de regresin, es una tcnica determinstica, que permite determinar la naturaleza de
la relacin funcional entre dos o ms variables, permite predecir los valores de y = f(x),
ecuaciones de regresin, con un cierto grado de aproximacin. Algunas ecuaciones de
regresin ms utilizadas en hidrologa, son:
Ecuacin de regresin lineal simple
Ecuacin de regresin no lineal simple
Ecuacin de regresin lineal mltiple
Ecuacin de regresin no lineal mltiple
Ecuacin de regresin polinomial

3.2 Regresin lineal simple


En hidrologa el modelo ms simple y comn, est basado en la suposicin de que dos
variables se relacionan en forma lineal.
Como ejemplo se puede mencionar:
Caudales y precipitacin de una misma cuenca
Precipitacin de una estacin, con precipitacin de otra estacin
Caudal de una estacin con caudal de otra estacin
Precipitacin con la altitud de una cuenca
Este hecho, permite correlacionar estas variables para completar datos o extender un registro.

Ecuacin de regresin
En hidrologa el modelo ms simple y comn, est basado en la suposicin de que dos variables se
relacionan en forma lineal.
Como ejemplo se puede mencionar:
Caudales y precipitacin de una misma cuenca
Precipitacin de una estacin, con precipitacin de otra estacin
Caudal de una estacin con caudal de otra estacin
Precipitacin con la altitud de una cuenca
Este hecho, permite correlacionar estas variables para completar datos o extender un registro.

La ecuacin general de la ecuacin de regresin lineal es:


y = a + bx
donde:
x = variable independiente, variable conocida
y = variable dependiente, variable que se trata de predecir
a = intercepto, punto donde la lnea de regresin cruza el eje y, es decir valor de y cuando x =
0
b = pendiente de la lnea o coeficiente de regresin, es decir, es la cantidad de cambio de y
asociada a un cambio unitario de x.

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

Los valores de los parmetros a y b, se calculan utilizando el mtodo de mnimos cuadrados.

y x x y x
a
n x x
n x y x y
b
n x x
2
i

2
i

2
i

Pasos para el anlisis de regresin


1. Seleccin de una funcin de relacin correlativa, simple o mltiple, lineal o no lineal.
Y = f(x)
y = a + bx
y = abx
y = axb
etc
2. Estimacin de los parmetros que miden el grado de asociacin correlativa
r
r2
3. Prueba de significacin de los estadsticos que miden la asociacin correlativa, para lo cual se
aplica la prueba t.
Proceso:
3.1. Se plantea la hiptesis
Ho : = 0 ( es el coeficiente de correlacin poblacional y su valor vara entre -1 y 1)
Ha : p 0
3.2. Clculo deU calculado (te)
Se utiliza la ecuacin
r n2
tC
1 r 2
donde:
r = coeficiente de correlacin
n = nmero de pares de valores
3.3. Clculo del t tabular (tt)
El tt se obtiene de las tablas preparadas para este efecto, con un nivel de significacin o una
probabilidad (1- ), y con grado de libertad ( = n - 2), donde n es el nmero de pares de valores.
Por ejemplo las tablas de t, permite calcular tt, si se elige una probabilidad del 95%, el valor que se
debe tomar de la tabla corresponde

As:
para n = 15

->

=15-2 =13

= 0.025

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

para 95% de probabilidad >

= 0.025, entonces, de la tabla > tt = 2.160

3.4 Criterios de decisin:


Si | tc | < tt, se acepta la hiptesis nula, por lo que = 0, y por lo tanto no hay correlacin
significativa.
Si | tc | > tt , se rechaza la hiptesis nula, por lo que 0, indicndose que es significativo y por lo
tanto existe correlacin entre las variables.
4. Estimacin de los parmetros de la ecuacin o funcin de regresin
Por ejemplo para la ecuacin de regresin lineal:
y = a + bx
Los parmetros a y b, utilizando mnimos cuadrados son:

y x x y x
a
n x x
n x y x y
b
n x x
2
i

2
i

2
i

5. Determinar la significacin de los parmetros de la ecuacin deregresin, encontrando los lmites de


confianza de su variacin (se usa el anlisis de varianza).

Ejemplo 3:
En una cuenca, como se muestra en la figura 7.1 se tienen dos estaciones de aforo A y B, en las que se
midieron los caudales medios mensuales, en m}/s para el ao 1995, los que se muestran en
la tabla 3.1. Considerando que los caudales de la estacin A, son las variables independientes (x) y que
los caudales de la estacin B, son las variables dependientes (y):
1. Probar si los datos de ambas estaciones se correlacionan linealmente.
2. Calcular el caudal en la estacin 5, para un caudal de 800 m3/s en la estacin A.
Tabla 3.1 Caudales promedios mensuales de las
estaciones A y B
Mes

Estacin A (m3/s)

E
F
M
A
M
J
J
A
S
0
N
D

321
222
155
274
431
446
456
1270
2089
1618
431
509

Estacin B
m3/s)
175
75
45
77
131
136
171
475
897
710
268
224

Fig. 3.1. Estaciones de aforo A y B de una cuenca

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

Solucin:
1. Sea la ecuacin que correlaciona a las variables
y=a+bx
...(3.1)
donde:
x = caudales de la estacin A
y = caudales de la estacin B
2. De acuerdo a los datos se tiene n = 12 (nmero de pares de datos); los clculos de sus sumatorias, se
muestran en la tabla 3.2.
Tabla 3.2. Productos, cuadrados y sumatorias de las variables x, y
x
321
222
155
274
431
446
456
1270
2089
1618
431
509
8222

y
175
75
45
77
131
136
171
475
897
710
268
224
3384

xy
56175
16650
6975
21098
56461
60656
77976
603250
1873833
1148780
115508
114016
4151378

x2
103041
49284
24025
75076
185761
198916
207936
1612900
4363921
2617924
185761
259081
9883626

y2
30625
5625
2025
5929
17161
18496
29241
225625
804609
504100
71824
50176
1765436

3. Clculo de r:
De la ecuacin, se tiene:

n x

n xy x y

x n y 2 y
2

Sustituyendo valores, resulta:


12 x 4151378 8222 x3384
r
12 x9883626 8222 2 12 x1765436 3384 2
r

21'993,288.00
22'281,026.59

r = 0.9871
r2 = 0.9743
4. Prueba de significacin
4.1 Hiptesis:
Ho: r = 0
Ha: r 0
4.2 Calculo de tc:
r n2
tC
1 r 2
tC

0.987 12 2
1 0.9743

tc = 19.4713

4.3 Clculo del tt:

Gua de Practicas de Hidrologa

De la tabla, para:
= n-2 = 12-2 =10
y una probabilidad del 95%

Efran Chuchn Prado


Facultad de Ciencias Agrarias

0.05
= 0.025
2

se tiene: tt = 2.228
4.4 Criterio de decisin:
Como: | tc | = 19.4713 > tt = 2.228 se rechaza la hiptesis nula, siendo r 0
existe correlacin entre las variables x e y.
5. Clculo de los parmetros a y b:
De la ecuacin, Sustituyendo valores, resulta:

3384 x9883626 4151378 x8222


12 x98833626 8222 2

a = -13.4590

12 x 41511378 8222 x3384


12 x9883626 8222 2

b = 0.4312

6. Ecuacin de regresin:
Sustituyendo valores en la ecuacin , se tiene:
Y= -13.4590+0.4312 x
7. Clculo del caudal en la estacin A, para un caudal de 800 m3/s en la estacin B.
Sustituyendo valores en la ecuacin, resulta:
y=-13.4590+ 0.4312x800
y= 331.5010 rn3/s

Regresin no lineal simple


Existen varias relaciones no lineales, que con un artificio adecuado pueden reducirse a
relaciones lineales, dentro de las cuales se pueden mencionar:
1
a bx
1
y ab
x
y

(inversa)

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

y ab x
y ax bx 2

(exponencial)
(potencial)
Para el uso de estas ecuaciones, en todos los casos, el proceso es como sigue:
1. Realizar la transformacin de variables a fin de obtener una regresin lineal.
2. En la ecuacin lineal obtenida, aplicar el mtodo de mnimos cuadrados para estimar
los nuevos parmetros a1 y b1.
3. Restituir los cambios de variables, a fin de obtener los parmetros iniciales a y b.
4. Utilizar la ecuacin siempre y cuando exista correlacin adecuada entre las variables

3.3 Ecuacin de regresin lineal mltiple


Esta tcnica de anlisis, se utiliza cuando la variable dependiente y, es funcin de dos o ms
variables independientes x1, x2, x3, . . ., xm, siendo el modelo lineal:
y = ao + a1 x1 + a2 x2 + a3 x3 + . . . + amx m
donde:
n = nmero de variables independientes
ao, a1, a2, . . . , am = parmetros a estimar
p = m + 1 = nmero de parmetros

Ecuaciones normales

y a n a x a x a x ....... a x
x y a x a x a x x a x x ....... a x x
x y a x a x x a x a x x ....... a x x
0

.
.

2
1
1

2
2

y a 0 x m a1 x1 x m a 2 x 2 x m a3 x3 x m ....... a m x m2

La solucin del sistema proporcionan los valores ao, a1, a2, . . . , am

Error estndar del estimado para regresin mltiple (Se)


Es la medida de dispersin que se calcula con la siguiente ecuacin:
Se

a 0 y a1 x1 y a 2 x 2 y .... a m x m y
n p

donde:
Se= error estndar del estimado
y = valores muestrales (experimentales) de la variable dependiente
n = nmero de grupos de la muestra
p = m+1 = nmero de parmetros a estimar a partir de la muestra
n - p = grados de libertad

Coeficiente de determinacin mltiple


Representa la proporcin de la variacin total de y que es explicada por las variables
involucradas en la ecuacin de regresin mltiple, se puede calcular a partir de la ecuacin:
R2

a 0 y a1 x1 y a 2 x 2 y a 3 x3 y ..... a m x m y n y

ny

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

donde:
R2 = coeficiente de determinacin
y = valores muestrales (experimentales) de la variable dependiente
n = nmero de grupos de la muestra
y

1
y = media de la variable dependiente
n

Coeficiente de correlacin mltiple


y a1 x1 y a 2 x 2 y a3 x3 y ..... a m x m y n y

ny

3.4 Ecuacin de regresin no lineal mltiple


La forma general de una ecuacin de regresin no lineal mltiple es:
y a 0 x1a1 x 2a2 x3a3 ...
la misma que es posible transformar con un adecuado artificio, en una ecuacin de regresin
lineal mltiple, de la siguiente forma:
1. Tomando ln a ambos miembros de la ecuacin, se tiene:
ln y ln a 0 a1 ln x1 a 2 ln x 2 a3 ln x3 +...
2. Haciendo:
ln y = z
ln a 0 a 0'

lnx1 = w1
lnx2= w2
lnx3 = w3
.
.

z a 0' a1 w1 a 2 w2 a3 w3 ....

La ecuacin obtenida es una ecuacin de regresin lineal mltiple.

3.5 Ecuacin de regresin polinomial


La ecuacin polinomial de grado m es:
y a 0 a1 x a 2 x 2 a 3 x 3 ..... a m x m

Para el ajuste de los pares de valores, se puede utilizar la metodologa descrita para el caso de
una ecuacin de regresin lineal mltiple, siendo las ecuaciones normales:

y a n a x a x a x .... a x
xy a x a x a x a x .... a x
x y a x a x a x a x .... a
2

.
.

m 1

x m2

y a 0 x m a1 x m 1 a 2 x m 2 a 3 x m 3 .... a m x 2 m

Gua de Practicas de Hidrologa

Efran Chuchn Prado


Facultad de Ciencias Agrarias

You might also like