You are on page 1of 18

1

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA



CAPTULO X
ESTADSTICA APLICADA A LA HIDROLOGIA

10.1 INTRODUCCIN.
Los estudios hidrolgicos requieren del anlisis de informacin hidrometeorolgica, esta
informacin puede ser de datos de precipitacin, caudales, temperatura, evaporacin,
infiltracin, etc.
Se cuenta con datos recopilados de un periodo disponible, si esta informacin es organizada y
se analiza adecuadamente proporciona una herramienta muy til, para tomar decisiones sobre
el diseo de estructuras hidrulicas y responder a innumerables dudas y parmetros de diseo,
como se muestra en la Figura 10.1


FIGURA No 10.1
APLICACIONES DE LA ESTADISTICA EN LA HIDROLOGIA.

En el anlisis hidrolgico se utilizan los conceptos de probabilidades y estadstica, porque
generalmente se cuenta con escasa informacin, y casi todos los fenmenos hidrolgicos
tienen una alta aleatoriedad, por esta razn se ve la necesidad de introducir este captulo para
aclarar los conceptos y los mtodos ms utilizados en la hidrologa.

10.2 CONCEPTOS FUNDAMENTALES
PROBABILIDAD:
Sea S un espacio muestral asociado a un experimento, y A cualquier suceso de S, tal que A es
un subconjunto de S, se dice que la probabilidad de P(A) de un evento A, es un experimento
aleatorio que tiene Ns resultados igualmente posibles y Na resultados favorables, est dado
por:
Ns
Na
A P = ) (
(Ec. 10.1)
Este tiene que satisfacer los siguientes axiomas.
1. 0 P(A) 1, para todo AS (para todo evento A su probabilidad es positiva y cero si el
evento es imposible).
2. P(S)=1
3. P(A
1
UA
2
UA
3
UUA
N
)=P(A
1
+A
2
+A
3
+.+A
N
)=P(A
1
)+P(A
2
)+P(A
3
)+.P(A
N
). Si
A
1
+A
2
+A
3
++A
N
, es una serie de sucesos mutuamente excluyentes.
2

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA


FUNCIONES DE PROBABILIDAD:
Una de las formas de representar las probabilidades de las variables hidrolgicas son las
funciones de probabilidad (funciones de densidad), y las funciones de probabilidad
acumuladas que a continuacin se mencionan.

a. Funciones de probabilidad discreta:
Cuando el nmero n de valores que puede tomar una variable aleatoria X es finito, se
dice que la variable aleatoria X es discreta.
A la funcin y grfica que asocia una probabilidad a dicha variable aleatoria X se
denomina funcin de probabilidad discreta f(x
i
)
Esta funcin representa la probabilidad que tomar la variable aleatoria X, generalmente
se representa por un grfico de barras para cada valor de la variable aleatoria X, ver
Figura 10.2.

FIGURA No 10.2
FUNCION DE PROBABILIDAD DISCRETA

b. Funciones de probabilidad continas.
Cuando el nmero de valores n que puede tomar una variable aleatoria X es infinito, se
dice que la variable aleatoria X es continua. Este tipo de variables es ms frecuente en
hidrologa.
La funcin que asocia una probabilidad a dicha variable se denomina funcin de
probabilidad continua o funcin de densidad f(x
i
). Esta funcin representa la probabilidad
que toma una variable aleatoria X, la representacin grfica se muestra en la Figura 10.3


FIGURA No 10.3
3

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

FUNCION DE PROBABILIDAD CONTINUA

c. Funcin de distribucin acumulada.
Si X es una variable aleatoria discreta o continua, se define la funcin de distribucin
acumulada F(x), como la probabilidad de que la variable aleatoria X tome cualquier valor
menor o igual a x y se designa por:

F(x)=P(Xx) (Ec. 10.2)

Que es conocida como probabilidad de no excedencia, o

1- F(x)= 1 - P(Xx) = P(Xx) (Ec. 10.3)

Que es conocido como probabilidad de excedencia, ver Figura 10.4


FIGURA No 10.4
PROBABILIDAD EXCEDENCIA Y NO EXCEDENCIA

Tal que:
P(X x) + P(X x) = 1 (Ec. 10.4)

En hidrologa la variable ms frecuente es una variable continua, se analizara la funcin de
distribucin acumulada de esta variable, que est representada por:

}
= s =
x
dx x f x X P x F ) ( ) ( ) (
(Ec. 10.5)

En caso que la funcin empiece en -
De esto se deduce que:

}
= = s s
b
a
dx x f a F b F b x a P ) ( ) ( ) ( ) (
(Ec. 10.6)

Lo que significa que la probabilidad de un evento axb, es igual al rea que hay bajo la
curva de la funcin de densidad f(x
i
) entre x=a y x=b, ver Figura No 10.5

4

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA


FIGURA No 10.5
PROBABILIDAD DE UN EVENTO axb

Se concluye que la probabilidad puntual es cero, porque el rea bajo la curva es cero.,
como se observa en la Figura 10.6


FIGURA No 10.6
PROBABILIDAD PUNTUAL

Por otro lado se tiene que el rango de F(x) es:
0F(x)1 (Ec. 10.7)

Es decir que la funcin de distribucin acumulada est en el rango de cero y la unidad o
100%, dependiendo si se trabaja en porcentajes o decimales.
La funcin de distribucin acumulada se representa de la siguiente manera.

FIGURA No 10.7
FUNCION DE DISTRIBUCION ACUMULADA

La Figura No 10.7 nos permite ver el porcentaje de las observaciones que estn por
encima (Fx
i
) o debajo (1-Fx
i
) del valor x
i
con respecto al total.

5

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

d. Funcin de distribucin acumulada.
El Periodo de Retorno T, se define como el tiempo o lapso promedio entre la ocurrencia de
un evento igual o mayor a una magnitud dada, dicho de otra forma, es el intervalo de
recurrencia promedio para un cierto evento.
Estadsticamente el Periodo de Retorno es la inversa de la probabilidad de excedencia, es
decir:
) (
1
x X P
T
>
=
(Ec. 10.8)

O tambin puede ser representada por la probabilidad de no excedencia como se muestra
a continuacin.

) ( 1
1
x X P
T
>
=
(Ec. 10.9)

Otra forma de definir Periodo de Retorno T es como sigue:
Considerar por ejemplo la variable caudal mximo del ao, Q max para n aos.
La grfica correspondiente para una serie de 41 aos ser:

FIGURA No 10.8
CAUDALES DIARIOS MAXIMOS
La media histrica de esta serie de 41 aos resulta 14.9 m3/s.
Ahora considerar por ejemplo el valor 20 m3/s. Trazar una recta a 20 m3/s en el grfico.
Realizar el conteo de aos transcurridos entre eventos mayores a 20 m3/s:
Una vez que se present el evento Q>20 m3/s en el segundo ao, transcurrieron 2 aos
antes de que se volviera a presentar dicho evento. Luego transcurrieron 5 aos, luego 2
aos, etc.
Considerando varias centenas de aos, el periodo de retorno T ser el valor esperado de
esos lapsos de tiempo. Entonces en el ejemplo descrito T puede ser estimado como sigue:
aos T 80 . 3
10
5 8 1 2 2 6 5 2 5 2
=
+ + + + + + + + +
=

Lo que significa:
Considerando varias centenas de aos, el valor de 20 m3/s es excedido en promedio una
vez cada 3.8 aos, es decir, el periodo de retorno del valor de 20 m3/s es de 3.8 aos.
6

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

Con otras palabras, en el transcurso de un ao cualquiera se tiene una probabilidad de
uno en 3.8 (o sea 26%) de que Q max sea igual o mayor a 20 m3/s.
El periodo de retorno a adoptar para el diseo de una estructura hidrulica debera ser el
resultado del anlisis costo-beneficio. A mayor periodo de retorno mayor la obra y en
consecuencia ms cara y el beneficio tambin podra ser ms grande. Sin embargo la
evaluacin de los beneficios es frecuentemente muy difcil de utilizar, por lo que en la
prctica se adoptaran periodos de retorno en base a la prctica usual.
En la Tabla 10.1, se muestra periodos de retorno recomendados para el clculo de
caudales de diseo de estructuras menores.

TABLA No 10.1
PERIODO DE RETORNO PARA ESTRUCTURAS MENORES

FUENTE: MAXIMO VILLON BEJAR. HIDROLOGIA 2002.

Tambin se puede entender el periodo de retorno como un coeficiente de seguridad que
se asigna a las distintas estructuras, a raz de la falta de informacin y conocimiento del
comportamiento de las variables hidrolgicas (Precipitacin, Caudales), siendo una
medida de seguridad ante cualquier eventualidad.


TABLA No 10.2
PERIODO DE RETORNO PARA ESTRUCTURAS CIVILES EN GENERAL

FUENTE: CAMPOS ARANDA. HIDROLOGIA 1987
.
Se dan a conocer otras tablas presentando periodos de retornos recomendados para
diferentes tipos de estructuras civiles: La Tabla No 10.2 es de carcter general e incluye
diversas obras, la Tabla 10.3 es exclusivo para obras hidrulicas en carreteras, la Tabla
10.4 est en funcin al tipo de rea a proteger y la Tabla 10.5 en para el diseo de
vertederos de embalses.
7

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA


TABLA No 10.3
PERIODO DE RETORNO PARA OBRAS HIDRAULICAS EN CARRETERAS

FUENTE: CAMPOS ARANDA. HIDROLOGIA 1987

TABLA No 10.4
PERIODO DE RETORNO SEGN AREAS A PROTEGER
/
FUENTE: CAMPOS ARANDA. HIDROLOGIA 1987

TABLA No 10.5
PERIODO DE RETORNO PARA VERTEDEROS DE EMBALSE

FUENTE: CAMPOS ARANDA. HIDROLOGIA 1987.

e. Funcin de distribucin acumulada.
Por lo comn el ingeniero disea una obra para resistir una avenida de cierta magnitud.
Se define el riesgo de fallo R de un diseo como la probabilidad de que la avenida para la
cual se disea la obra sea excedida en el transcurso de N aos, esto es considerado como
una situacin de riesgo, pues la obra se disea para soportar cierta avenida mxima, y
crecientes mayores podran hacerle dao o incluso destruirla, poniendo en riesgo vidas
humanas e infraestructuras que estn aguas abajo.
De forma ms sencilla se entiende por riesgo de fallo a la probabilidad de que un
evento con un periodo de retorno de T aos ocurra al menos una vez en N aos.
El riesgo de fallo se puede escribir como:

N
x X P aos N en vez una menos al x X P R )) ( 1 ( 1 ) . . . . . . . ( > = > = (Ec. 10.10)
N
T
aos N en vez una menos al x X P R )
1
1 ( 1 ) . . . . . . . ( = > =
(Ec. 10.11)
Dnde:
T = Periodo de Retorno;
8

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

N = Aos
P( X x) = Probabilidad de excedencia
R = Riesgo de fallo o probabilidad de que un evento con periodo de retorno T aos ocurra
al menos una vez en N aos.
De la misma manera se puede definir la confiabilidad que viene a ser el complemento del
riesgo de fallo, que se define como la probabilidad de que un evento con periodo de
retorno de T aos no ocurra en N aos, la confiabilidad se puede expresar de la siguiente
manera:

N
x X P aos N durante ao cada x X P ) ( 1 ) . . . . . ( > = (
(Ec. 10.12)
N N
x F
T
N durante ao cada x X P R ) ( )
1
1 ( ) . . . . ( = = ( =
(Ec.10.13)

Tambin es posible calcular el periodo de retorno a partir del riesgo de fallo y del nmero
de aos, como sigue a continuacin:
(

=
N
R
T
1 . ln
exp 1
1
(Ec. 10.14)

10.3 POSICION DE PLOTEO Y PAPEL DE PROBABILIDAD.
a. Posicin de Ploteo.
Tambin denominada posicin de graficacin, o probabilidad emprica o experimental, o
probabilidad asignada (probabilidad acumulada experimental) La posicin de ploteo es la
ubicacin de graficacin en el papel de probabilidades de los datos de una muestra.
Existen varias frmulas empricas propuestas por diferentes autores para poder calcular
dicha posicin de ploteo, stas se muestran en la Tabla 10.6
TABLA No 10.6
PROBABILIDADES EMPIRICAS

FUENTE: MAXIMO VILLON BEJAR. HIDROLOGIA 2002
9

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

Dnde:
m : Numero de orden.
N : Nmero total de datos.
a : Valor entre 0a1, que depende de N de acuerdo a la Tabla No 10.7

TABLA No 10.7
VALORES DEL PARAMETRO a PARA LA FORMULA DE GRINGORTEM

FUENTE: MAXIMO VILLON BEJAR. HIDROLOGIA 2002

La frmula ms utilizada para el clculo de la posicin de ploteo es la de Weibull.
El procedimiento a seguir es el siguiente:
Una vez seleccionada la frmula emprica a utilizar, se procede a ordenar los datos de la
muestra de menor a mayor, despus se les asigna la probabilidad emprica, que es la
probabilidad de no excedencia. Si se ordena de mayor a menor, la probabilidad asignada
ser la probabilidad de excedencia.
Con estos datos se plotea en los respectivos papeles de probabilidad.

b. Posicin de Ploteo.
Es la representacin grfica de la probabilidad acumulada de una distribucin terica, este
papel de probabilidades tiene las escalas de las ordenada (X) y las abscisas (Probabilidad)
diseadas de tal manera que los datos que van a ser ajustados aparezcan cercanos a una
lnea recta.
El propsito del papel de probabilidad es el de linealizar la relacin de probabilidad de tal
manera que los datos graficados se acomoden a una recta, generalmente con fines de
comparacin. Es una forma de determinar si una serie de datos est siendo representada
de mejor manera por una distribucin de probabilidades en comparacin con otras
distribuciones de probabilidades tericas.
Para este propsito se hace uso de la posicin de ploteo.
Este procedimiento es conocido como la prueba de bondad de ajuste grfico, que nos sirve
para poder determinar si los datos se ajustan a la distribucin representada por el papel de
probabilidades. Ms adelante se presentarn las pruebas de bondad de ajuste estadstico

10.4 ANLISIS DE FRECUENCIA DE VALORES MEDIOS
En estadstica existen muchas funciones de distribucin de probabilidad tericas, las
funciones de distribucin de probabilidad tericas ms usadas en hidrologa son las siguientes.
- Distribucin Normal
- Distribucin Log. Normal
- Distribucin Gama de 2 y 3 parmetros
- Distribucin Log. Pearson Tipo III
- Distribucin Gumbel
10

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

- Distribucin Log. Gumbel.

a. Distribucin Normal.
Tambin denominada distribucin gausiana. Se dice que una variable aleatoria X tiene una
distribucin normal, cuando su funcin de densidad de probabilidad es:

(
(

|
|
.
|

\
|

=

2
2
1
2
1
) (
S
X x
e
S
x f
t
(Ec. 10.15)

Dnde:
f(x) : Funcin de densidad normal de la variable x
x : Variable independiente
X : Parmetro de localizacin, igual a la media aritmtica de x.
S : Parmetro de escala igual a la desviacin estndar de x.
e : Base del logaritmo neperiano
Cuando la variable aleatoria se distribuye normalmente con media
__
X y varianza S
2
, se
denota de la siguiente forma:

FIGURA No 10.9
FUNCION DE DENSIDAD DE LA DISTRIBUCION NORMAL

Para su aplicacin lo ms fcil es la utilizacin de una tabla que relacione Z versus f(Z)
para lo cual se ha definido la variable estandarizada como:

S
X x
Z

=
(Ec. 10.16)
Donde la funcin de densidad de Z, es denominada funcin de densidad de la distribucin
normal estndar o estandarizada, que tiene la siguiente expresin:


(

=
2
2 2
1
) (
Z
e
S
Z f
t
(Ec. 10.17)

Una caracterstica importante de la distribucin normal estndar es que tiene la media cero
y la varianza igual a uno.
La funcin de distribucin acumulada de la distribucin normal es:

11

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

dx e
S
x f x F
x
S
X x
x
} }
(
(
(

|
|
|
.
|

\
|

= =
2
2
1
2
1
) ( ) (
t
(Ec. 10.18)

O su equivalente:

dZ e Z F x F
Z
Z
}
(
(

= =
2
2
2
1
) ( ) (
t
(Ec. 10.19)

Para el clculo de la funcin de distribucin acumulada se recurre a la tabla de la ley
normal que est en funcin de la variable estandarizada Z.
La distribucin normal es de gran utilidad en hidrologa, siendo algunas de sus principales
aplicaciones:
- El ajuste de distribucin emprica de variables hidrolgicas medias anuales, mensuales,
estacionales, etc., o tambin variables acumuladas anuales, mensuales, etc., que
pueden ser caudales precipitacin, temperatura, entre otros.
- Como referencia para comparar varias distribuciones tericas de ajuste con una
distribucin emprica.
- Anlisis de errores aleatorios en las observaciones o mediciones hidrolgicas.
- Para aplicar inferencia estadstica.

Para realizar el ajuste se utiliza el papel de probabilidades de la ley normal junto a su
recta trazada analticamente.

b. Distribucin Log Normal.
Las variables de inters en hidrologa son generalmente positivas, por lo que es usual que
presenten distribuciones de frecuencia asimtricas, por lo que se propone aplicar una
transformacin logartmica a la variable de inters y luego utilizar el modelo de distribucin
normal para la variable trasformada, la distribucin as obtenida se denomina log-normal,
por ejemplo si la variable aleatoria X, tiene una distribucin log-normal, esto significa que Y
= lnX, tiene una distribucin normal.
Se dice que una variable aleatoria X tiene una distribucin log-normal, cuando su funcin
de densidad de probabilidad se define como:

Para 0<x<
(
(

|
|
.
|

\
|
=
2
. ln
2
1
2
1
) (
y
y
y
x
e
x
x f
o

o t
(Ec. 10.20)

Para -<y<
(
(

|
|
.
|

\
|
=
2
2
1
2
1
) (
y
y
y
y
e y f
o

o t
(Ec. 10.21)
12

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA


Dnde:
f(x) : Funcin de densidad log-normal de la variable x
x : Variable independiente y

y
: Media aritmtica de los logaritmos naturales de x

y
: Desviacin estndar de los logaritmos naturales de x
y : ln x
e : Base del logaritmo neperiano
La funcin de distribucin acumulada de la distribucin log-normal se muestra a
continuacin.
dx
x
e
x
x f x F
y
y x
y
x
(
(

|
|
.
|

\
|
= =
} }
2
0 0
. ln
2
1
2
1
) ( ) (
o

o t
(Ec. 10.22)
O su equivalente:
dy
y
e x f y F
y
y y
y
y
(
(

|
|
.
|

\
|
= =
} }
2
2
1
2
1
) ( ) (
o

o t
(Ec. 10.23)
Si:
y
y
y
y
x y
Z
o

o

=

=
. ln

Se obtiene la distribucin normal estndar.
dZ e Z F
Z
Z (
(

}
2
2
2
1
) (
t
(Ec. 10.24)


FIGURA No 10.10
FUNCION DE DENSIDAD DE LA DISTRIBUCION LOG NORMAL

Una vez realizada la transformacin con la variable estandarizada Z, utilizar las tablas de
la ley normal para el clculo de la probabilidad o la funcin acumulada.
La distribucin log-normal es de gran utilidad en hidrologa, siendo algunas de sus
principales aplicaciones:
- Como referencia para comparar varias distribuciones tericas de ajuste con una
distribucin emprica.
- Anlisis de errores aleatorios en las observaciones o mediciones hidrolgicas.
- Para aplicar inferencia estadstica.

13

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

c. Distribucin Gama de 3 parmetros o Pearson Tipo III.
Este es una de las distribuciones ms utilizadas en hidrologa, se dice que una variable
aleatoria X, tiene una distribucin Gama o Pearson tipo III, si su funcin de densidad de
probabilidad es:

|

|
) (
1
0
0
) (
) (
) (
x x
e
x x
x f

=
(Ec. 10.25)

Para: x
0
y; -y; 0y; 0
La funcin de distribucin acumulada de la distribucin Pearson tipo III es:

|

|
) (
1
0
0
0
) (
) (
) (
x x
x
x
e
x x
x F

}
I

=
(Ec. 10.26)
Dnde:
f(x) : Funcin de densidad de la variable x.
F(x) : Funcin de distribucin acumulada.
x : Variable aleatoria.
x
0
: Origen de la variable x, parmetro de posicin.
: Parmetro de escala.
: Parmetro de forma.
() : Funcin gama completa.


FIGURA No 10.11
FUNCION DE DENSIDAD DE LA DISTRIBUCION PEARSON TIPO III

Para la aplicacin de esta distribucin, es recomendable utilizar el factor de frecuencia,
donde se muestra que la mayora de las funciones de frecuencias pueden ser generadas
por:
x
K X X o *
_
+ =
(Ec. 10.27)
Dnde:
X : Variable analizada, con una probabilidad dada.
_
X : Media de la serie de datos.

x
: Desviacin estndar de la serie de datos.
K : Factor de frecuencia definido para cada distribucin.
14

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

Para la distribucin Pearson tipo III, se deber calcular la media, la desviacin estndar y
el coeficiente de asimetra.

Media :
N
x
X
i

=
_
(Ec. 10.28)

Desviacin Estndar :
1
) (
2

=


N
X x
i
x
o
(Ec. 10.29)

Coeficiente de Asimetra :
3
3
) 2 )( 1 (
) (
x
i
s
N N
X x N
g C
o

= =


(Ec. 10.30)
Para determinar el factor de frecuencia, es necesaria la utilizacin de tablas, para lo cual
es necesario calcular el coeficiente de asimetra y la probabilidad o perodo de retorno
respectivo para la variable analizada.
En el caso de la distribucin log-Pearson tipo III, el procedimiento es el mismo, lo nico
que cambia es que se deber trabajar con los logaritmos de las variables, y se utilizar la
misma tabla para determinar el factor de frecuencia.

La distribucin Pearson tipo III es de gran utilidad en hidrologa, siendo algunas de sus
principales aplicaciones:
- Como referencia para comparar varias distribuciones tericas de ajuste con una
distribucin emprica.
- Anlisis de errores aleatorios en las observaciones o mediciones hidrolgicas.
- Para aplicar inferencia estadstica.
- Para realizar ajustes de distribucin emprica de variables hidrolgicas de precipitacin,
caudales, temperatura, etc., tales como valores anuales, mensuales o valores
acumulados anuales, mensuales.

d. Distribucin Gumbel o de valores extremos Tipo I.
La distribucin Gumbel es tambin llamada distribucin de Valores Extremos Tipo I o
distribucin doble exponencial. Se dice que una variable aleatoria X tiene una distribucin
Gumbel, cuando su funcin de densidad de probabilidad se define como:

o

=
x
e
x
e x f
1
) (
(Ec. 10.31)

Dnde:
f(x) : Funcin de densidad de Gumbel de la variable x.
x : Variable independiente.
: Parmetro de escala.
: Parmetro de posicin, llamado moda.
15

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

e : Base de logaritmo neperiano.


FIGURA No 10.12
FUNCION DE DENSIDAD DE LA DISTRIBUCION GUMBEL

La funcin de distribucin acumulada de la distribucin Gumbel es:
o

=
x
e
e x F ) (
(Ec. 10.32)
Donde F(x) es la funcin de distribucin acumulada de la ley Gumbel. Una forma de
calcular y es con las ecuaciones 10.33 y 10.34 respectivamente, y estn en funcin
de los parmetros de la media

) ( X
y la desviacin estndar (S) de la muestra.

S S 78 . 0
6
~ =
t
o
(Ec. 10.33)

o 57721 . 0 =

X
(Ec. 10.34)

0.5772 es la constante de Euler.
La distribucin Gumbel o ley de valores extremos tipo I, se utiliza generalmente para:
- Realizar ajustes de distribucin empricas de variables hidrolgicas tales como valores
de caudales mximos anuales, mensuales o precipitaciones mximas anuales, entre
otros.
- Como referencia para comparar varias distribuciones tericas de ajuste con una
distribucin emprica.
- Para efectuar inferencias estadsticas.

10.5 PRUEBAS DE BONDAD DE AJUSTE.
Las pruebas de bondad de ajuste, consisten en comprobar grfica y estadsticamente, si la
frecuencia emprica de la serie analizada, se ajusta a una determinada funcin de probabilidad
terica seleccionada a priori, con los parmetros estimados con base en los valores
muestrales.
Las pruebas estadsticas, tienen por objeto calificar el hecho de suponer que una variable
aleatoria, se distribuya segn una cierta funcin de probabilidades.
16

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

Las pruebas de bondad de ajuste grafico ms utilizado en hidrologa se mencion en el acpite
10.3 con la ayuda del papel de probabilidades.
A continuacin se detallarn las pruebas de bondad de ajuste estadstico ms utilizadas en
hidrologa que son:
- Chi Cuadrado
- Smirnov Kolmogorov

a. Prueba Chi Cuadrado X
2

La prueba Chi-cuadrado se basa en el clculo de frecuencias, tanto de valores
observados, como valores esperados, para un nmero determinado de intervalos.
Esta prueba es comnmente usada para verificar la bondad de ajuste de la distribucin
emprica a una distribucin terica conocida, fue propuesta por Karl Pearson en 1900.
La expresin general de la prueba Chi-cuadrado est dada por:

=
k
i
i
i i
c
e
e
x
1
2
u
(Ec. 10.35)

= =
= =
k
i
i
k
i
i
N e
1 1
u

Dnde:

i
: Numero de valores observados en el intervalo de clase i.
e
i
: Numero de valores esperados en el intervalo de clase i.
2
c
x : Valor calculado de Chi Cuadrado, a partir de los datos.
k : Numero de intervalos de clase.
Asignando probabilidades a la ecuacin anterior, es decir asignando igual probabilidad de
ocurrencia a cada intervalo de clase, se tiene:

=
k
i
i
i i
c
NP
NP N
x
1
2
(Ec. 10.36)

Donde:
Ni : Nmero de observaciones que caen dentro de los lmites de clases ajustadas
del intervalo i
N : Tamao muestral i
P
i
: Probabilidad igual para todos los intervalos de clases
P
i
=1/k o e
i
=P
i
N

Simplificando la ltima ecuacin se obtiene la frmula computacional desarrollada por
Markovic.

=
=
k
i
c
N N
N
K
x
i
1
2 2
(Ec. 10.37)

17

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA

El valor de
2
c
x obtenido por la ecuacin se compara con el
2
t
x de la Tabla C-3 del Anexo
C, cuyo valor se determina con:
Nivel de significacin : =0.05 o =0.01
Grados de libertad : g.l.=k-1-h

Donde h, es el nmero de parmetros a estimarse, en el caso de la ley normal es 2.
El criterio de decisin se fundamenta en la comparacin del valor calculado de Chi-
Cuadrado con el valor tabular encontrado, esto es:
- Si el Chi-cuadrado calculado es menor o igual que el valor tabular, es decir:
2
c
x
2
t
x ,
entonces se acepta la hiptesis que el ajuste es bueno al nivel de significacin
seleccionado.
- Si el Chi-cuadrado calculado es mayor que el valor tabular , es decir:
2
c
x >
2
t
x ,
entonces el ajuste es malo y se rechaza la hiptesis, siendo necesario probar con otra
distribucin terica.
Esta prueba es de fcil aplicacin, es vlida slo para ajustes a la distribucin normal, en
la prctica se usa para cualquier modelo de ajuste.

b. Prueba de Smirnov-Kolmogorov.
La prueba de ajuste de Sminov-Kolmogorov, consiste en comparar las diferencias
existentes entre la probabilidad emprica de los datos de la muestra y la probabilidad
terica, tomando el valor mximo del valor absoluto, de la diferencia entre el valor
observado y el valor de la recta terica del modelo , es decir:

) ( ) ( max x P x F D =
(Ec. 10.38)

Donde:
D : Estadstico de Smirnov-Kolmogorov, cuyo valor es igual a la diferencia mxima
existente entre la probabilidad ajustada y la probabilidad emprica
F(x) : Probabilidad de la distribucin terica
P(x) : Probabilidad experimental o emprica de los datos

Si D
0
es un valor crtico para un nivel de significacin , se tiene que:

| | o = > 0 ) ( ) ( max x P x F P
o
o = >
0
. D D P

Tambien:

o = ( 1 .
0
D D P
(Ec. 10.39)
18

DOCENTE: Msc. Ing. ABEL A. MUIZ PAUCARMAYTA


El procedimiento para efectuar el ajuste, por el estadstico de Smirnov-Kolmogorov, es el
siguiente:
1. Calcular la probabilidad emprica o experimental Px de los datos, para esto se puede
utilizar las formulas de la Tabla 10.6, de estos el mas recomendado es la frmula de
Weibull, que se indica a continuacin:
1 +
=
N
m
Px
(Ec. 10.40)
Dnde:
P x : Probabilidad emprica o experimental.
m : Numero de orden.
N : Numero de datos.
2. Calcular la probabilidad terica F(x), utilizando la ecuacin de la funcin acumulada
F(x) de los modelos tericos o tablas elaboradas para tal fin.
3. Calcular las diferencias F(x)-P(x)
4. Seleccionar la mxima diferencia: D mx. F(x)-P(x)
5. Calcular el valor crtico del estadstico D, es decir D
0
, para un nivel de significancia
=0.05 y N igual al nmero de datos, los valores de D
0
se muestran a continuacin en
la siguiente tabla:
6. Comparar el valor del estadstico D, con el valor crtico D
0
de la Tabla C-4 del Anexo C,
con los siguientes criterios de decisin:
Si:
D<D
0
El ajuste es bueno, al nivel de significacin seleccionado
DD
0
El ajuste no es bueno, al nivel de significacin seleccionado, siendo necesario
probar con otra distribucin.
Esta prueba de ajuste no requiere del conocimiento a priori de la funcin de distribucin
terica, es aplicable a distribuciones de datos no agrupados y de cualquier distribucin
terica.
Comparndola con la prueba Chi-cuadrado, no requiere que la frecuencia absoluta de
cada clase sea igual o mayor que 5, esta no es una prueba exacta, sino una prueba
aproximada.

You might also like