You are on page 1of 84

I.

CONCEPTOS BASICOS
1.1 ESPACIO MUESTRAL
Es el conjunto de todos los posibles resultados de un experimento. Aun cuando
en un experimento, no es posible determinar con seguridad su resultado, se
puede s, definir con precisin un listado de los resultados posibles de ocurrir.
Esta lista constituye el espacio muestral, y se designa como S.
Ejemplos:
1. Si el experimento consiste en lanzar una moneda, los resultados posibles
son sello o cara, luego:
S = {sello, cara}
Ns = 2
Ns: nmero posible de resultados del espacio muestral.
2. Si el experimento consiste en lanzar un dado, el espacio muestral ser:
S = {1, 2, 3, 4, 5, 6}
Ns = 6
3. Si el experimento consiste en lanzar 2 dados, el espacio muestral, de la
suma de los resultado ser:
S = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Ns = 11
1.2. EVENTOS
Son los resultados posibles que se puedan presentar en la realizacin de un
experimento.
Es un subconjunto del espacio muestral.
Ejemplos:
1. En el experimento de lanzar una moneda el evento A, que salga cara es:
A = {cara}
NA = 1
NA: nmero posible de resultados del experimento.

2. En el experimento lanzar una dado, el evento B que salga un


nmero mayor o igual que 3, es:
B = {3, 4, 5, 6}
NB = 4
3. En el experimento, lanzar dos dados, el evento C, que salga un 7,
es:
C = {(1.6), (6,1), (2,5), (5,2), (4,3), (3,4)}
Nc = 6
1.3 DEFINICIN CLSICA DE PROBABILIDAD

La probabilidad P(A), de un evento A, en un experimento aleatorio que tiene Ns


resultados iguales posibles, y de los cuales N A, son resultado favorable, est

dada por:
P ( A )=

NA
NS

.. (1)

Ejemplos:
1. El arrojar una moneda, la probabilidad de que salga sello, es:
1
P= 2
2. Al arrojar un dado, hay seis casos igualmente posibles, la
probabilidad de que salga un nmero igual o mayor que 3 es:
4
2
P= 6 = 3
3. Al arrojar dos dados, hay 36 casos igualmente posibles, la
probabilidad de que la suma de los resultado sea 7, es:
6
1
P = 36 = 6
4. En una serie de dos bolas rojas y ocho bolas negras, hallar la
probabilidad que al extraer una bola, esta sea de color rojo.
De los 10 casos igualmente probables, en 2 casos suceder el
evento que se considera, por lo que se tendr:
2
1
P = 10 = 5
En el concepto clsico
experimentos en los
igualmente posibles.
problemas prcticos no

de probabilidad solo se puede aplicar en


que hay un nmero finito de casos
Pero en la naturaleza, los principales
son de este tipo.

1.4 DEFINICIONES AXIOMATICA DE PROBAILIDAD


Sea S un espacio muestral asociado a un experimento, y A cualquier
suceso de S (A subconjunto de S). Se dice que P es una funcin de
probabilidad en el espacio muestral S, si se satisfacen los siguientes tres
axiomas:
1. 0

P(A)

2. P(S) = 1

1 , para todo A

A1

3. Si

A2

, ,

AN

es una serie de sucesos, mutuamente

excluyentes, entonces:
A
A2
A3
AN
A
A
P( 1 U
U
U.U
) = P ( 1 ) + P ( 2 ) + + P (
AN

De estos axiomas se deducen los siguientes teoremas:


1. P( ) = 0
2. P ( A

) = 1 P(A), donde

AC

es el complemento de A.

PROBABILIDAD DE LA UNION DE SUCESOS


Si A y B son eventos cualesquiera en un espacio muestral S, entonces:

P ( A B )=P ( A ) + P ( B )P ( A B )( 2)
PROBABILIDAD CONDICIONAL
Si A y B son dos eventos en los cuales

P ( A ) 0 , entonces, la probabilidad

condicional de que ocurra el suceso B, dado que sucedi A, se define por:

P ( B/ A )=

P( A B)
.(3)
P( A)

1.5 VARIABLES ALEATORIOS


Es una funcin X, definida sobre un espacio muestral S, que asigna un valor a
esta variable, correspondiente a cada punto (resultado) del espacio muestral
de un experimento
A una variable aleatoria, se le conoce tambin como variable estocstica, sus
valores son nmeros reales, que no pueden predecirse con certeza antes de
ocurrir el fenmeno, es decir, ocurren al azar
Ejemplo:
Sea el experimento: lanzamientos independientes de una moneda de 10 y una
de 20 centavos.
En este caso el espacio muestral S, consta de los cuatro puntos (resultados):

( e , e ) ,( e , c ) , ( c , e) , ( c , c)
Dnde:
e = escudo, c = corona, la primera letra, se refiere al de 10 y la segunda al
de 20 colones.
Si se define como la variable aleatoria:
X = nmero total de escudos que se obtiene al efectuar el experimento
entonces, la variable aleatoria X, puede ser:
X = 0, 1, 2
Donde:
X = 0, si el resultado son 0 escudos
X = 1, si el resultado es 1 escudo
X = 2, si el resultado son 2 escudos
Luego, considerando que las monedas no son falsas, si:
X = 0, le corresponde una probabilidad de:

P ( X=0 )=1/4=0.25
X = 1, le corresponde una probabilidad de:

P ( X=1 )=2/4=1/2=0.5
X = 2, le corresponde una probabilidad de:

P ( X=2 ) =1/ 4=0.25


En forma general, X puede tomar un valor cualquiera del siguiente modo:

X =a P( X=a)

a< X <b P ( a< X <b )


X cP( Xc)

X > d P (X >d )
1.5.1 CLASES DE VARIABLES ALEATORIAS
1. Variable aleatoria discreta
Se dice que una variable aleatoria X es discreta. Cuando sus valores se
restringen a un conjunto enumerable finito o infinito.
Ejemplo: Nmero de das de lluvias ocurridas en los meses de un ao
cualquiera.
Representacin Grafica

Nmero
de das

Meses

2. Variable aleatoria contina


Se dice que una variable aleatoria X es continua cuando sus valores se
encuentran en un rango continuo y puede ser representado por cualquier
nmero entero o decimal.
Ejemplo: El caudal diario registrado en una estacin de aforo

Caudal Q

31

La mayora de secuencias de variables hidrolgicas son series continuas, de


variables continuas. Sin embargo, para propsitos prcticos, una variable
discreta puede tratarse arbitrariamente como continua, ajustndose a una

funcin continua, o bien, una continua como discreta, dividiendo stas en


intervalos y agrupndolas en nmeros discretos.
1.6

DISTRIBUCIONES

El comportamiento de una variable aleatoria se describe mediante su ley de


probabilidades, que a su vez se puede caracterizar de varias maneras. La ms
comn es mediante la distribucin de probabilidades de la variable aleatoria.
Notacin:
X

variable aleatoria de la funcin

valor particular que toma la variable aleatoria

f(x)
funcion de densidad (funcion de probabilidad, distribucion de
probabilidad de x)
F(x)

funcion acumulada (funcion de distribucion acumulada)

1.6.1 FUNCION DE PROBABILIDAD (FUNCION DENSIDAD) DE UNA


VARIABLE ALEATORIA
DISCRETA
Es

una

funcion

matematica

que

permite

determinar

la

probabilidad

f ( x )=P ( X=x ) , de que una variable aleatoria discreta X tome los diferentes
valores x, dentro del rango en el que esta definido y cumple con las siguientes
condiciones:

0 f ( x ) =P ( X =x ) 1 x

f ( x )=1
=1

P ( a x b )= f ( x )
=a

Ejemplo:
Sea X la variable aleatoria que representa la suma de los puntos que se
obtiene al lanzar dos dados.
La funcin de probabilidad f(x) correspondiente, tiene los siguientes valores:
X
f(x

2
1/36

3
2/36

4
3/36

5
4/36

6
5/36

7
6/36

8
5/36

9
4/36

10
3/36

11
2/36

12
1/36

)
la misma tiene la siguiente representacin grfica:

F(x) x

2
3 4
5
6 7
8
9
1.6.2. FUNCIN DE DENSIDAD DE UNA VARIABLE ALEATORIO
CONTINUO
Es una funcin matemtica que permite determinar la probabilidad, de
que una variable aleatoria continua X tome los diferentes valores

Xi ,

dentro del rango en el que est definido y cumple con las siguientes
condiciones:

xi )

f(

f ( x ) dx

=1

P (a x b) =

f ( x ) dx
b

Ejemplo:
Sea X una variable aleatoria continua que tiene la funcin densidad:

f (x) =

Se pide:

2
0.75 ( 1x ) , para1 x 1
,
0 , para cualquier otro valor de x

1. Elaborar la grfica de la funcin densidad.

2. Calcular P(-0.5

0.5)

Solucin:
1. Para elaborar el grafico, se evala f(x), para valores de x, que estn en el
intervalo definido por [-1.1] as se tiene:
x
F(x)

-1
0

-0.8
0.27

-0.4
0.5625

0
0.72

0.2
0.75

0.5
0.72

0.8
0.5625

Siendo su representacin grfica:


0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
-1.5

-1

-0.5

0.5

0.5

2. P (-0.5

0.5

= 0.75

dx
0.5

0.75 ( 1x 2 ) dx

0.5) =

0.5

0.5

( x 2) dx
0.5

0.5
= 0.75 (x | 0.5 -

0.5

x
3

| 0.5
3

= 0.75 [0.5 (-0.5) ( 0.5

/3 ( 0.5 /3

= 0.75 [1 (0.125/3 + 0.125/3)]


= 0.75 [1 0.25/3]

1.5

1
0

= 0.75/3 [3 0.25]
= 0.25x2.75
P (-0.5

0.5)

1.6.3 FUNCIONES DE DISTRIBUCION ACUMULADA


Si X es una variable aleatoria (discreta o continua), se define la funcin
de distribucin o funcin de distribucin acumulada F(x), como la
probabilidad de que X tome cualquier valor menor o igual que x, es
decir:
F(x) = P (X

x) (5)

Se puede demostrar que:


P (a x b) = F (b) F

(a).. (6)

1.6.4 FUNCIN DE DISTRIBUCIN ACUMULADA CORRESPONDIENTE A


UNA DISTRIBUCIN DISCRETA
Para el caso de una variable discreta F(x), se puede expresar como la
sumatoria de los f (

x i ), para los cuales

x i es menor o igual que x, es

decir:

F(x) = P (X

x)=

f ( x i )
. (7)
x i x

Ejemplo
Sea X una variable aleatoria discreta con funcin de probabilidades:

1
3
3
1
f ( 0 ) = , f ( 1 )= , f ( 2 ) = , f ( 3 ) =
8
8
8
8
1. Calcular

P( X 2)

2. Dibujar la funcin de distribucin acumulada


Solucin:

P ( X 2 )=F ( 2 )= f ( x ) =f ( 0 ) + f ( 1 )+ f (2)

1.

x=0

1 3 3
P( X 2)= + +
8 8 8

P ( X 2 )=

2
7

2. Siguiendo el mismo proceso de (1) se puede determinar


F(x) para los diferentes intervalos de x, asi se tiene:
x

x< 0

0 x <1

0 x <2

0 x <3

x3

F(x)

1/8

4/8

7/8

Graficando resulta:
F(x)
1
7/8

1/8

1/8

1.6.5 FUNCION DE DISTRIBUION ACUMULADA CORRESPONDIENTE A


UNA DISTRIBUCION CONTINUA
Para el caso de una variable continua, F(x) se representa por:
x

F ( x )=P ( X x )= f ( x ) dx (8)

La relacin entre la funcin de distribucin y la funcin densidad es:

d F(x)
=f ( x ) ( 9 )
dx
De(6), se tiene:
x

P ( a< x b ) =F ( b ) F(a)= f ( x ) dx (10)

Esta significa que la probabilidad del evento

a< x b

es igual al rea que hay

bajo la curva de la funcin de densidad f(x) entre x = a y x =b


GRAFICA

P (a
x

b)

F (x)

Tambin se cumple que:


la probabilidad

F ( x=a )=0

en efecto:

P ( x=a )=F ( a )=0


es decir, que el rea bajo la curva f(x) en un punto, es cero:

F (x)

De esto como F(x) es continua, se observa que las probabilidades


correspondientes a los intervalos:
a xb,

a x b,

ax b,

axb

(Con a y b fijos, pero arbitrarios y con b>a), son todos iguales, es decir:
P (a xb)=P (a x b)=P (ax b)=P (axb).
Esta situacin es diferente para el caso de una distribucin discreta.
Ejemplo:
Sea x una variable aleatoria continua, que tiene la funcin densidad:

2
para 0 x 1
f ( x )= 3 x
para
cualquier
otro valor de x
0

Calcular:
1. La funcin acumulada
2. P(X 0.8)
3. P(0.2 X 0.6)
4. P(X>0.7)
5. dibujar la funcin de distribucin acumulada.
Solucin:
1. por definicin:
x

F ( x )= f ( x )

0
0

F ( x )= f ( x )+ f ( x )dx
0

F ( x )= f ( x)dx
0

x3 x 3
F ( x )= 3 x dx=3 0 =x 0
3
0
2

F ( x )=x

2.

P(x <0.8)=P(0< x<0.8)=F (0.8) F (0)


P ( x <0.8 )=0.830
P ( x <0.8 )=0.512

3.

P ( 0.2< x <0.6 )=F ( 0.6 ) F ( 0.2 )


P ( 0.2< x <0.6 )=0.6 30.23=0.2160.008
P ( 0.2<x <0.6 )=2.06

4.

P ( x >0.7 )=1P ( x 0.8 ) =1[F (0.7) F (0)]


P ( x >0.7 )=1[0.630]=10.343
P ( x >0.7 )=0.6570

3
5. para elaborar el grafico de F ( x )=x , se da valores a x en el

intervalo [0,1], as se tiene:


x
F(
x)

0
0

0.2
0.0
08

0.4
0.0
64

0.6
0.2
16

Graficando resultado:

0.8
0.5
12

1
1

1.2
1
0.8

F(x ) 0.6
0.4
0.2
0
0

0.2

0.4

0.6

0.8

1.2

1.7 VALOR ESPERADO


Si X es una variable aleatoria (discreta o continua), con densidad f(x), y
si g(x) es una funcin de X, entonces el valor esperado de g(X) se define
de la siguiente forma:

E ( g ( X ) )= g ( x ) f ( x ) , para X discreta 11)

E ( g ( X ) )= g ( x ) f ( x ) dx para X continua (12)

Se requiere que g(x) este definida para todo x real, para el cual f(x) sea
diferente de cero.
1.7.1 PROPIEDADES DEL VALOR ESPERADO
1. Si g(x) = C cte.
E(C)=C

(13)

En efecto, por definicin:


variable continua

variable discreta

E ( C )= Cf ( x )dx

E ( C )= C(f xi )

E ( C ) =C f ( x)dx

E ( C )=C (f xi )

Pero:

f ( x ) dx=1

( f xi ) =1 ( definicion de funcioon dencidad )


E ( C )=C E ( C ) =C
Luego: E(1)=1
2. E(a*g(x))=a*E(g(x))

a=cte.

3. E(a*g(x)+b*h(x))=a*E(g(x))+b*E(h(x))

.(14)
.(15)

1.8 MOMENTOS DE UNA DISTRIBUCION


1.8.1 MOMENTO RESPECTO AL ORIGEN
K
Si g(X)= X , donde K=1,2,3,, se define el momento k-simo, k,

respecto al origen como:


K

k = E( x = x f (x)

para X discreta

.(16)

k = E( K )= E( x ) f (x)
K

para X continua

.(17)

Si K=1, se tiene el momento de primer orden respecto al origen


variable discreta variable continua

1= x . f (x) o

1= x . f ( x) dx

1=E ( x )=

el primer momento respecto al origen es la media

Si K=2, se tiene el momento de segundo orden respecto al origen

2= x 2 . f ( x ) o 2= x 2 . f (x)dx

Si k=3, se tiene el momento de tercer orden respecto al origen

3= x 3 . f ( x ) o 3= x3 . f (x ) dx

1.8.2 MOMENTO CENTRAL O CON RESPECTO A LA MEDIA


K
Si g(X)= (X ) , donde K=1, 2,3,., se define el momento central k-

simo, k, respecto a la media , como:


( x)
K
k= E( K )= ( X ) . f ( x )

para X discreta

.(18)

( X)

k= E( K )= ( X ) . f ( x)

para X continua .(19)

Si K=1, se tiene el primer momento central:


variable discreta

variable continua

1= ( x). f ( x )o 1= (x). f ( x )dx

Si

existe debe ser igual a 0


Si K=2, se tiene el segundo momento central:
x

2 . f (x )dx

(x) . f ( x ) o 2=
2

2=
el segundo momento central es la varianza, es decir:

( 2 )=
2
2
=V ( X )=E

SI K=3, se tiene el tercer momento central:


x

3 . f ( x)dx

(x) . f ( x ) o 3=

3=
1.8.3 MEDIA DE UNA DISTRIBUCION
El valor medio o media de una distribucin , es el esperado de la
variable X o momento de primer orden, proporciona una idea del lugar
donde estn concentrados los valores que toma la variable X, es decir:
= E( X = Xf (x)

para X discreta

= E( X)= Xf ( x )dx

para X continua

1.8.4 MEDIANA
Si x es una variable aleatoria y F(x) su funcin de distribucin
acumulada, la solucin x de la ecuacin:
F( x )=0.5

Recibe el nombre de mediana de la variable aleatoria X(o de la


distribucin)
Se puede representar:

F(X)=0.

F(x)

0.5

0.5

x
media
X

F ( X ) = f ( x ) dx=0.5 para X continua

F ( X ) = f ( x )=0.5 para X discreta

1.8.5 MODA
La moda es el valor de ocurrencia ms frecuente. As la moda de la
poblacin es el valor de X que maximiza f(x) y que satisface la ecuacin:
2

df (x)
d f ( x)
=0 y
< 0 para x continua
dx
d x2
O el valor de x asociado con:
n
Max f (x i) para x discreta
i=1

1.8.6 VARIANZA DE UNA DISTRIBUCION


La varianza de una distribucin

2 , es el segundo momento central,

mide la variabilidad alrededor de la media, es decir, expresa


cualitativamente la dispersin que hay alrededor de la media, se
representa:

(x )
(x) . f ( x )=E ( 2) para X discreta
2=V ( X )=
2

2 . f ( x )dx

(x)

=V ( X )=
2

A la raz cuadrada positiva de la varianza, se le llama desviacin


estndar y se designa por es decir

CV =

1.8.7. COEFICIENTE DE VARIACION


El coeficiente de variacin es una medida de dispersin y se define como
el cociente entre la desviacin estndar y la media.
CV =

1.8.8 SESGO DE UNA DISTRIBUCION


El sesgo de una distribucin , es una medida de asimetra de las
distribuciones y se representa por la siguiente relacin:
x

( 3)

E
3
3 =

Si =0 la distribucin es simtrica.
Si >0 la distribucin tiene cola en el lado derecho, o es sesgada a la
derecha.
Si <0 la distribucin tiene cola en el lado izquierdo, o es sesgada a la
izquierdo.

1.8.9 CURTOSIS
El coeficiente de curtosis, es una medida de achatamiento, indica el
grado de llanura de la curva de la funcin densidad f(x), se representa
por la siguiente relacin:
x

( 4)

E
4
k = 4 =

1.9 TRANSFORMACIN LINEAL DE VARIABLES ALEATORIAS


Con mucha frecuencia, a fin de realizar simplificaciones con la funcin densidad, se
requiere la transformacin de la variable aleatoria X a una nueva variable aleatoria.
X* =

a1

Con

a1 0

X+

a2

. (1)

Se dice entonces que X* se ha obtenido a partir de X, mediante la transformacin lineal (1).


Se desea calcular la mediana

, y la varianza

y la varianza 2 de X

Se sabe que:
=E(x)

Luego:
= E(X*) = E( a1 X + a2 )

= a E X) + 2 )
1
E

, de la variable X*, usando la media


= a E X) + a2 E(1) , pero E (1) = 1
1

Entonces:

= a E X) + a2
1

(2)

= a1 + a2

De otro lado, de (1)-(2), se tiene:


a

a1
a2
a

X*=(
X+
+ 2

X*- = a1 X -
De donde, los k-esimos momentos centrales se relacionan como sigue:
k

X
E(

k
) = E ( a1 X )

Xk
a1k E ( X k ).. (3)
E(
)
=

En el caso particular, de (3), cuando k=2, se tiene:


2

2
= E ( X

=a1
Si

(4)

0 y 2=1

De (4):
a12=

) = a1

De (2):
1
+a 2

0=

a2=

Si Z = X*, de (1), se tiene:


Z=

Z=

De lo anterior se puede manifestar, si una variable X tiene media


entonces la variable:
Z=

Tiene media 0 y varianza 1, es decir:

2
= 0, z = 1

A Z se le llama la variable estandarizada correspondiente a X


Ejemplo:
La funcin densidad de la distribucin normal o gaussiana es:

f(x) =

Con media

x/

1 /2
1

e
2

y varianza 2

Si z= (x- )/ , se tendr:

y varianza 2 ,

f(z) =

Con media

1
1/ 2 z
e
2

2
= 0 y varianza z = 1

II. MEDIDAS DE LAS DISTRIBUCIONES.


2.1 MEDIDAS DESCRIPTIVAS DE LAS DISTRIBUCIONES DE
FRECUENCIAS.
Para describir ciertas caractersticas de un conjunto de datos, se pueden usar
nmeros simples, llamados estadsticos. De ellos se puede obtener un
conocimiento ms preciso de los datos que el que se obtiene a partir de las
tablas y los grficos.
Las caractersticas ms importantes de este conjunto de datos son:
1. Medida de tendencia central o medidas de localizacin
Indican cual ser el punto medio o localizacin central. En la fig. 1 la curva A
queda a la izquierda de los puntos medios de las curvas B y C, las cuales tienen
la misma localizacin central

Curva B

Curva A

Curva C

Figura 1.Comparacion de la localizacin central de tres curvas

2. Medidas de dispersin
Se refiere a la forma como se encuentran esparcidas las observaciones. En la
fig. 2, se observa que la curva B tiene una mayor separacin o dispersin que
la curva A.

Curva B
Curva A

Figura 2.Comparacin de la dispersin de dos curvas

3. Medidas de simetra y asimetra


Las curvas que representan los datos puntuales de un conjunto pueden ser
simtricas o asimtricas. Las curvas simtricas, como la que se muestra en la
fig. 3, son las que al trazar una lnea vertical desde el pico de la curva al eje
horizontal dividen su rea en dos partes iguales, cada una idntica a la otra.

Figura 3.Curva simtrica

Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4 son
aquellas en las cuales la distribucin de frecuencia se concentra en el extremo
inferior o superior de la escala de medida sobre el eje horizontal. Los valores
no se distribuye igualmente, por lo que pueden ser sesgadas a la derecha
(curva A) i sesgadas a la izquierda (curva B).

Curva A
Curva B

Figura 4.Curvas segadas, A: sesgo a la derecha o positivo


B: sesgo a la izquierda o negativo

4. Medidas de achatamiento o curtosis


Indican el grado de llanura de la curva. Por ejemplo en la fig. 5, las curvas A y B
tienen la misma localizacin central, y la misma dispersin, pero difieren por el

hecho que una es ms puntiaguda que la otra,, por lo que tienen diferente
grado de curtosis.

Curva A
Curva B

Figura 5. Curvas con diferente curtosis

De acuerdo al grado de achatamiento, las curvas pueden ser Mesocrtica


(curva A, fig. 6), Leptocrtica (curva B) y Platicrtica (curva C)

Curva B (Leptocrtica)

Curva A (Mesocrtica)
Curva C (Platicrtica)

Figura 6. Grados de achatamiento

2.2 MEDIDASD DE TENDENCIA CENTRAL.


Se define una medida de tendencia central como un ndice de localizacin
central empleado en la descripcin de las distribuciones de frecuencias.
En trminos generales se tienen tres medidas: la media, la mediana y la moda.
2.2.1 Media aritmtica

Dada la muestra compuesta de n datos, X 1, X2, X3,Xn; la media, se


define como la suma algebraica de ellas, dividida ente el nmero de datos.
Cuando se calcula la media para una poblacin, esta se denota por m, y

X .

cuando se trata de una muestra, por

Media aritmtica de datos no agrupados


Matemticamente la media de los datos no agrupados se representa por:
n

xi

= i=1
n

(1)

xi

X = i=1
n

(2)

Donde:
: media poblacional

X : media muestral
Xi: valor i-simo de la muestra
n: nmero de datos de la muestra o poblacin
Media aritmtica de datos agrupados
Para el caso de datos agrupados, la frmula es:
k

fi . xi

X = i=1

(3)

Donde:
fi: frecuencia absoluta (nmero de observaciones) en el intercalo i
xi: marca de clase del intercalo i
k: nmero de intervalos de clase
n: nmero de observaciones de la muestra

2.2.2 Media ponderada


El promedio ponderado permite calcular un promedio que toma en cuenta la
ponderacin de los datos con respecto a un factor, es casi, un caso particular
de la frmula del clculo de la media para los datos agrupados, su frmula es:
n

fi . xi

X p = i=1n

fi

..(4)

i=1

Donde:

x p : media ponderada
xi: valor i-simo de la muestra
fi: valor del factor de ponderacin del i-simo valor de la muestra
n: nmero de observaciones de la muestra
La media ponderada, se utiliza por ejemplo para el clculo de la precipitacin
promedio de una cuenca, donde para cada valor de precipitacin de una
estacin, el factor de ponderacin es el rea, as:
n

Pi . Ai
P= i=1 n
Ai
i=1

Donde:

P
: precipitacin promedio
Pi: valor de la precipitacin en la estacin i
Ai: rea de influencia de la estacin i
n: nmero de estaciones
2.2.3 Media geomtrica
Dada la muestra compuesta de n datos, X 1, X2, X3,Xn, la media
geomtrica se define como la raz n-sima, de la productoria de los datos, es
decir:

1/ n

x G=( xi)

(5)

i=1

Donde:

x G : media geomtrica
n

xi
i=1

: x1 x2 . Xn (productoria de los datos)

xi: i-simo valor de la muestra


n: nmero de elementos de la muestra
2.2.4 Mediana
Es un valor nico de un conjunto de datos que mide al elemento central en los
datos.
Este nico elemento de los datos ordenados es el ms cercano a la mitad o el
ms central en el conjunto de nmeros. La mitad de los elementos quedan por
encima de ese punto y otra mitad por debajo de l.
Mediana de los datos no agrupados
Sean X1, X2, X3,Xn, datos ordenados por magnitud creciente o
decreciente y en el nmero impar de datos, la mediana (Med) es el dato
situado en el centro, es decir:
Med=X(n+1)/2

, n impar

(6)

Si n es par, la mediana es el promedio de los nmeros centrales, es decir:

Mcd=

X n / 2+ X n/ 2+1
, n par
2

(7)

Mediana de datos agrupados


Siendo la mediana el valor de la observacin central de un arreglo y como no
se conocen los valores de cada observacin en datos agrupados, la mediana se
suele aproximar, despus de localizar el intercalo de clase de la mediana, por
la siguiente ecuacin

n+1
(F +1)
2
Mcd=
W + Lm
fm

(8)

Donde:
Med: mediana muestral
n: nmero tital de elementos de la muestra
F: suma de todas las frecuencias hasta la clase de la mediana pero sin
incluirla
fm: frecuencia nicamente de la clase de la media
w: amplitud del intervalo de clase
Lm: lmite inferior
En general la clase donde se encuentra la mediana es aquella que tiene al
elemento situado en la porcin (n+1)/2
2.2.5 Moda
Es aquel valor que se repite ms frecuentemente en un conjunto de datos, se
denota por Mo.
Para datos agrupados en intervalos de clase, la moda, una vez determinada la
clase modal se calcula con la siguiente ecuacin:

Mo=Lm+

d1
w
d 1+ d 2

(9)

Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)
d2: diferencia entre la frecuencia de la clase modal y la postmodal (clase
siguiente)
w: amplitud del intervalo de clase
Lm: limite inferior de la clase modal
En general la clase modal es aquella que tiene la mxima frecuencia
2.2.6 comparacin entre la media, la mediana y la moda

La media, la mediana y la moda de una distribucin de frecuencias son


consideradas cono tres promedios ms importantes. Sin embargo, no son
igualmente aplicables y representativos a todas las situaciones. Como se
muestra en la fig. 7 las posiciones relativas de estas tres medidas dependen de
la simetra de la distribucin.
Si la distribucin es simtrica (fig. a), las tres medidas de tendencia central
tienen valores idnticos.
Si la distribucin es asimtrica (fig. b y c), los tres valores divergen, aunque
siempre para una distribucin unimodal, la moda esta localizada en su punto
mas alto y la mediana esta ente la media y la moda.

Media mediana moda

(a)

moda
mediana
Media

(c)

mediana
moda
Media

(c)
Figura 7. Localizacion de la media, mediana y moda

2.3 MEDIDAS DE DISPERSION.


Las medidas de dispersin o variabilidad permiten observar cmo se reparten o
dispersan los datos a uno y otro lado del centro. Si la dispersin es poca, indica
gran uniformidad de los datos en la distribucin. Por el contrario, gran
dispersin indica poca uniformidad.
2.3.1 Rango

Es una medida de distancia y representa la diferencia entre el mayor y el


menor de los valores observados, es decir:
R = Xmax Xmin

(10)

Donde:
R: rango
Xmax: valor mximo de los datos
Xmin: valor mnimo de los datos
El rango o la amplitud es una manera conveniente de describir la dispersin,
sin embargo, no da medida alguna de la dispersin ente los datos con respecto
al valor central.
2.3.2 Varianza
Datos no agrupados:
La varianza poblacional (2), se define como la suma de cuadrados de las
desviaciones, de los datos con respecto a la media, dividida entre el nmero
total de datos, es decir:
n

( xi)2

2= i=1

(11)

La varianza muestral (S2), se obtiene dividiendo la suma de cuadrados de las


observaciones de los datos con respecto a la media, entre el nmero toral de
datos menos uno, es decir:
n

( xix )2

S 2= i=1

n1

(12)

Para el clculo computacional es til expresar la sumatoria de la siguiente


forma:

( xi x )2= ( xi22 x . xi+ x2 )


xi22 x ( xi ) +n x 2
Pero:

(13)

xi=n

xi =n x

(14)

Luego, sustituyendo (14) en (13), resulta:

( xi x )2= xi2 2 x ( xi )+ n x 2
( xi x )2= xi2 n x2

(15)

Sustituyendo (15) en (11), se tiene:


n

1
2= ( xi 2n x 2 ) (16)
n i=1
Y en (12) resulta:
2

S=

1
2
2
( xi n x )
n1 i=1

(17)

Donde:
S2: varianza muestral
2= varianza poblacional
xi: valor i-simo de la muestra

x =: media muestral o poblacional


N: nmero total de datos
Datos agrupados
Para el caso de datos agrupados en intervalos de clase, la varianza poblacional,
se define como la suma de los cuadrados de las desviaciones de las marcas de
clase con respecto a la media, por la frecuencia absoluta, dividido entre el
nmero total de datos, es decir:
k

(xi)2 . fi

2= i=1

Y la varianza muestral por:

(18)

( xix )2 . fi

S 2= i=1

(19)

n1

Donde:
xi: valor de la i-sima marca de clase

x =: media
fi: valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
Para el clculo computacional, las ecuaciones (18) y (19), se pueden expresar:
2

xi . fin

(20)

i=1

1
=
n
2

xi 2 . fin x 2
k

i=1

1
S=

n1

(21)

2.2.3 desviacin estndar


La desviacin estndar, se define como la raz cuadrada positiva de la varianza,
es decir:

= 2 (poblacional)
S= S2

(muestral)

As se tiene, para datos no agrupados:

xi n
k

i=1

n
=

(22)

xi 2n x 2
k

i=1

n1
S=

(23)

Siendo:
n

1
x == xi
n i=1

(24)

Para datos agrupados


2

xi . fin

i=1

n
=
2

xi . fin x

(25)

i=1

n1
S=
Siendo:

(26)

x ==

1
xi . fi
n i=1

(27)

xi: valor de la i-sima marca de clase

x= :media
fi: valor de la i-sima frecuencia absoluta, es decir nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
2.3.4 coeficiente de variacin
Es una medida relativa de dispersin, que relaciona la desviacin estndar y la
media, es decir:

CV =

S
x2

(28)

Generalmente en Hidrologa se suele trabajar con datos muestrales


2.4 medidas de simetra y asimetra
2.4.1 sesgo
El sesgo es el estadstico que mide la simetra y asimetra
Datos no agrupados:
El sesgo () para datos no poblacionales, se obtiene con la siguiente ecuacin:

(29)

Donde:
n

( xi)3

3= i=1

(30)

(xi)
k

i=1

n
=
n

1
xi
n i=1

El sesgo para datos muestrales, se obtiene con:

Cs=

n2 M 3
( n1 )( n2 ) S 3

(31)

Donde:
k

( xi x )2

M 3= i=1

S=

(32)

1
(xi x )2
n1 i=1
k

1
x = xi
n i=1
Datos agrupados:
El sesgo ( ) para datos poblacionales, se obtiene con la siguiente ecuacin:
=

3
3

Donde:

( xi)3 fi

3 i=1

. (33)

1
2
= ( xi) fi
n i=1
k

1
fi xi
n i=1

xi

= marca de clase de intervalo i

fi = valor de la i-ensima frecuencia


K=numero de intervalos de clase
n= nmero total de datos
el sesgo para datos mustrales, se obtiene con :

n2 M 3
( n1 ) ( n2 ) s3

Cs =

(34)

(xix )3 fi

M3 =

S=

i=1

(35)

1
(xi x )2 fi
n1 i=1
k

1
fi xi
n i=1

xi

= marca de clase de intervalo i

fi = valor de la i-ensima frecuencia


K=numero de intervalos de clase

n= nmero total de datos

2.5 MEDIDAS DE ACHATAMIENTO.


El grado de achatamiento se mide con el estadstico denominado
coeficiente de curtosis.
2.5.1 Curtosis
Datos no agrupados:
4

K=

.. (36)

(xi)4 fi

3 =

i=1

. (37)

1
=
( xix )2 fi

n1 i=1
k

1
xi
n i=1

El coeficiente de curtosis para datos mustrales se define como:


n3 M 4
( n1 ) ( n2 )( n3)S 4

Ck =

. (38)

(xix )4

M3 =

S=

i=1

1
(xi x )2 fi
n1 i=1
k

(39)

1
fi xi
n i=1

Datos agrupados
El coeficiente de curtosis (k) para datos poblacionales se define
mediante la siguiente ecuacin
4
4

K=

Donde
k

(xi)3 fi

3 i=1

........ (40)

1
= ( xi)2 fi
n i=1
k

1
fi xi
n i=1

xi

= marca de clase de intervalo i

fi = valor de la i-ensima frecuencia


K=numero de intervalos de clase
n= nmero total de datos

el coeficiente de curtosis para datos muestrales, se define como:


3

Ck =

n M4
( n1 ) ( n2 )( n3)S 4

. (41)

Donde
k

M4 =

(xix )3 fi
i=1

(42)

S=

1
(xi x )2 fi
n1 i=1
k

1
fi xi
n i=1

Los clculos de los estadsticos de una serie de datos es por si laboriosa.


Para la simplificacin de los clculos, donde se requieren la
determinacin de la media, varianza, desviacin estndar, el coeficiente
de variacin, coeficiente de variacin, coeficiente de sesgo y coeficiente
de curtosis.
2.6 EJEMPLO DE CLCULO
Dado los datos de precipitacin anual, en mm de la estacin, el Coyol,
para el periodo 1974-1986. Calcular su media, varianza, desviacin
estndar, coeficiente de variacin, coeficiente de sesgo y el coeficiente
de curtosis.
AO
1974
1975
1976
1977
1978
1979
1980

PRECIPITACIO
N (mm)
1418.60
1527.30
1108.60
1084.20
1509.10
1394.90
1334.40

AO
1981
1982
1983
1984
1985
1986

PRECIPITACIO
N (mm)
1441.50
1133.20
891.00
1429.80
1141.50
1312.60

Solucin:
Utilizando el programa del listado 1, haciendo uso de la opcin de datos
no agrupados, los resultados que se obtienen, son los que se muestran:
SERIE
1418.60 1527.30 1108.60 1084.20 1509.10 1394.90 1334.40
1441.50 1133.20 891.00 1429.80 1141.50 1312.60
Numero de datos = 13
RESULTADOS

Media
Varianza
Desviacin estndar
Coeficiente variacin
Coeficiente sesgo
Coeficiente curtosis

DATOS
PROBLACIONALES
1286,67
35214.73
187.66
0.15
-0.55
2.20

DATOS
MUESTRALES
1286.67
38149.29
195.32
0.15
0.63
3.12

2.7 PROBLEMAS PROPUESTOS


1. dadas las descargas medias del mes de mayo de un rio, en m3/seg.
AO
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980

Q m3/seg
3.99
2.96
1.79
1.55
2.48
2.61
2.27
1.86
2.07
2.70

AO
1981
1982
1983
1984
1985
1986
1987
1988
1989

Q m3/seg
5.52
3.09
5.00
6.03
2.73
3.13
4.18
3.26
4.03

Calcular la media, varianza, coeficiente de variacin, coeficiente de


asimetra o sesgo y coeficiente de curtosis.
Usar el proceso a pie y el proceso computacional.
2. si los datos del problema 1, se agrupan en los intervalos de clase que
se muestran calcular la media, varianza, coeficiente de variacin,
coeficiente de asimetra o sesgo y coeficiente de curtosis.
INTERVALOS DE
CLASE
1- 2
2 -3
3 -4
4 -5
56
6 -7

MARCA DE
CLASE
1.5
2.5
3.5
4.5
5.5
6.5

Usar el proceso a pie y el proceso computacional.


3. se tiene una cuenta en la que se han instalado 8 pluvimetros. Las
precipitaciones promedio anuales registradas, en mm, para el periodo de
1970 1991 y las reas de influencia, en km2, de esas estaciones, se
muestran en la siguiente tabla.
ESTACION
AREA Km2
PRECIPITAC
ION

1
150
2915

2
300
2563

3
187
3241

4
600
4017

5
550
5321

6
145
4621

7
278
5002

8
110
4932

Determinar la precipitacin promedio.

III. DISTRIBUCION DE FRECUENCIAS DE UNA MUESTRA


3.1 REPRESENTACION TABULAR Y GRAFICA DE LAS MUESTRAS
3.1.1 DEFINICIONES
En hidrologa se trabaja con informacin hidrometeorologicas, estas
informaciones pueden consistir de datos de precipitacin, descarga,
temperatura, evaporacin.etc.
Por lo general, se encuentra solo con una muestra de los datos de esa
poblacin, es decir nunca podemos disponer de la totalidad de los datos.
Pero cuando estos datos se organizan en forma compacta y fcil de
utilizar, los hidrlogos pueden disponer de una herramienta de gran
utilidad, para las decisiones a tomar.
Existen muchas formas de clasificar los datos, una manera til es
dividirlo en categoras similares o clases y luego contar el numero de

observaciones que caen en cada categora, lo que constituye una tabla


de frecuencias o una distribucin de frecuencias.
Para una muestra dad, se escoge un rango R, que contenga a todos los
valores de la misma. Se subdivide R en subintervalos que se llaman
intervalos de clase; los puntos medios de estos intervalos se denominan
marcas de clase. Se dice que los valores de la muestra en cada uno de
los intervalos forma una clase. Al nmero de valores en una clase se
llama frecuencia de clase; su divisin en el tamao N de la muestra es la
frecuencia relativa de clase. Esta frecuencia considera como funcin de
las marcas de clase; se denomina funcin de frecuencias de la muestra,
y se denota con f(x). La funcin de frecuencias acumuladas de la
muestra, se denota como F(x). La funcin de frecuencia acumulada de la
muestra, se denota como F(x), y se define como:
F(x) =

f (t)
tx

. ( 1)

3.1.2 PROCEDIMIENTO DE CLCULO


A continuacin se indica un procedimiento prctico, para el clculo de
las frecuencias acumuladas, la misma que se usara ms adelante para el
clculo de la distribucin de probabilidades empricas de datos
agrupados en intervalos de clase:
Procedimiento
1. Ordenar la muestra en forma creciente o decreciente puede
hacerse uso del programa en QuickBASIC.
Por ejemplo, ordenando en forma creciente, se tiene:
Xmin, X2,X3.. Xmax
Donde
Xmin = X1 es el valor minimo de los datos
Xmax = XN es el valor mximo de los datos
2. Calcular el rango R de la muestra.
R = Xmax Xmin ( 2)
3. Seleccionar el nmero de intervalos de clase NC, este depende del
tamao de la muestra N en aplicaciones de hidrologa el numero
de intervalos de clase puede estar entre 6 y 25.
Yevjevich sugiere para seleccionar NC, las siguientes relaciones
empricas:

(i)

NC : 1.33 ln N +1 (3)

(ii)

Si N < 30 .. NC < 5
Si 30 < N < 75 8 NC 10
Si N > 75 . 10 < NC 30
Donde
N : tamao de la muestra
Ln N logaritmo natural o neperiano del tamao muestral.

4. Calcular la amplitud de cada intervalo de clase x, segn la


ecuacin.
x =

X maxXmin
NC 1

R
NC 1

. ( 4)

Al dividir el rango entre NC 1, lo que en realidad se hace es


incrementar el rango en x, incluyendo un intervalo mas, el mismo
que resulta, de agregar medio intervalo en cada extremo de la
serie ordenada, a fin de que Xmin y Xmax sern respectivamente,
las marcas de clase de la primera y ltima clase. Esto se aprecia
en la figura 8.

Fig 8: representacin del total de la muestra en intervalos de clase


igualmente espaciados.
5. Calcular los lmites de clase de cada uno de los intervalos. Como
se manifest en 4, con el artificio de dividir entre NC-1 se logra

que Xmin y Xmax queden centrados y representan la marca de


clase de la primera y ltima clase, entonces los limites de clase
inferior y superior del primer intervalo son :
LCII = Xmin x/2 .. ( 5)
LCSI = Xmin + x/2 . ( 6)
Los otros limites de clase, se obtienen sumando la amplitud x, al
limite de clase antecedente
6. Calcular las marcas de clase de cada uno de los intervalos. Las
marcas de clase se obtienen del promedio de los limites de clase.
Asi la marca de clase del primer intervalo es :
LCII + LCSI
MCI =
2

(7)

Con el artificio realizado anteriormente la marca de clase es igual


al valor minimo, de igual forma la marca de clase del ltimo
intervalo al valor mximo es decir:
MCI = X min
MICn = X max
Las otras marcas de clase, se obtienen sumando la amplitud x, a
las marcas de clase antecedente.
7. Calcular la frecuencia absoluta, esta es igual al numero de
observaciones, que caen dentro de cada intervalo definido por sus
limites de clases respectivos, la misma que se obtiene por conteo,
asi se obtiene.
Fabi = ni .. (8 )
Donde:
Fabi : frecuencia absoluta del intervalo i
ni : numero de observaciones en el intervalo i
8. Calcular la frecuencia relativa fri de cada intervalo, esta es igual a
la frecuencia absoluta del mismo, dividido entre el numero total d
observaciones, es decir:

fri =

Fab i
N

. ( 9 )

9. Calcular la frecuencia relativa acumulada Fri, usando la formula:


Fri =

j=1

j=1

frj=

nj
N

1
nj
N j=1

. ( 10 )

Donde
Fri: frecuencia relativa acumulada hasta el intervalo i

J: 1,2,.. i acumulacin de los intervalos hasta i


10.
Calcular la funcin de distribucin acumulada o empirica Fi
para cada intervalo. Esta funcin segn Yevjevich, se calcula
usando la formula:

Fi =

lim

x 0

fri
x

fri
x

N x

.. (11)

11.
Calcular la funcin de distribucin acumulada o emprica
usando la formula:
i

Fi =

x fj
j=1

(12)

Los valores de Fi y Fri obtenidos con las ecuaciones (10) y (12)


resultan similares.
En el listado 3 se muestra un programa en QuickBASIC, que
efectua el proceso anterior, pero con ligeras variantes. Este
programa permitre determinar los datos para el histograma en
forma de frecuencia absoluta y relativa densidad empirica y la
funcin de distribuciones acumulada.
3.1.3 EJEMPLO DE CLCULO
Dada la serie histrica de caudales medios anuales m3/s (tabla 3.1)
de la estacin Salinar del rio chicama (peru) para el periodo 19111980, calcule las frecuencias absolutas, relativas, acumulativas,
funcin densidad, funcin acumulada.
Tabla 3.1 serie histrica de caudales medios anuales en m 3/s del
rio Chicama. Estacin Salinar (1911-1980).

AO
1911
1912
1913
1914
1915

CAUDAL
M3/S
7.91
8.01
13.27
16.39
80.83

AO
1935
1936
1937
1938
1939

CAUDAL
M3/S
24.58
28.49
10.05
28.01
34.92

AO
1959
1960
1961
1962
1963

CAUDAL
M3/S
22.88
17.57
14.60
31.14
18.20

1916
1917
1918
1919
1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934

60.08
21.55
27.71
28.63
30.27
33.43
35.16
27.21
15.58
64.81
51.26
33.48
25.79
25.80
18.93
16.15
38.30
54.54
59.40

1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958

31.36
42.74
12.94
41.16
35.90
33.76
29.28
19.17
29.37
30.06
9.67
10.42
23.99
42.17
16.00
22.78
32.69
34.28
20.24

1964
1965
1966
1967
1968
1969
19970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980

24.69
22.99
11.78
32.26
4.76
12.70
16.19
30.14
30.57
45.38
18.91
34.99
21.49
29.26
4.58
12.46
3.14

IV. ESTIMACION DE PARAMETROS:


Una funcin densidad o una funcin de distribucin acumulada, pueden
escribirse como una funcin de variable aleatoria y en general como una
funcin de sus parmetros, as por ejemplo, la funcin densidad de la
distribucin normal, de variable aleatoria X, es:

f ( x )=

1
1 /2[( x)/ ]
e
2

Donde:
= parmetro de localizacin

= parmetro de escala

Para la funcin f(x), quede definida, debe calcularse para los parmetros
y

como normalmente, no se conocen todos los valores de la

variable aleatoria, la estimacin de los parmetros, se realiza a partir de


una muestra.
Por ejemplo se tiene una muestra:
X1, x2, x3,.., xn
Y si estos se ajustan a una distribucin y

se estiman a partir de:

xi

^= x^ = i=1
n

(x ix )2

^ =S 2= i=1

Donde:
^

Es el estimador de la

Es el estimador de

Cualquier estimado desde la muestra es dominado un estimado o


estimador de los parmetros poblacionales.

4.1 DEFINICION DE ESTIMADORES.


Dada una funcin de distribucin con parmetros , , ,, se llaman
estimadores a los valores a, b, c,, a partir de los estadsticos de la
muestra que se supone que pertenece a la poblacin que se pretende
caracterizar.

La bondad de estos estos estimadores esta dado por diferencias (-a),


(-b), (-c), etc; pero como es fcil intuir hay infinitas posibilidades para
a, b, c, por lo tanto se consideran como mejores estimadores aquellos
que se aproximan mas a los valores poblacionales y se llaman , , ,
Los estimadores se clasifican como:

Sesgado si

E(a)=

Insesgado

E(a)= + v ()
Dnde: v () = E(a)

Eficiente si:

El estimador es integrado y dems:


VAR(a) =E (-a)2

Consistente

Si el tamao muestral N es largo

En hidrologa, se requiere principalmente que los estimadores sean


insesgados y eficiente, cuando se requiere extraer la mxima
informacin de los datos muestrales.
4.2 METODOS DE ESTIMACION DE PARAMETROS
Para determinar los valores numricos de los parmetros en distribucin
terica, apartir de los datos muestrales, se utilizan varios mtodos de
estimacin, siendo en orden ascendente de menor a mayor eficiencia.

Grafico

Mnimo cuadrado

Momentos

Mxima verosimilitud

4.2.1 METODO GRAFICO


Consiste en plotear los valores de la distribucin emprica sobre un
papel especial, donde la distribucin terica asignada apriori, se puede
representar con una lnea recta y de all estimar los parmetros
buscados.
Asi:

El papel de probabilidades normal, representa la distribucin


normal como una lnea recta.

El papel de probabilidades log-normal, representa la distribucin


log-normal es como una lnea recta.

El papel de probabilidades extremas, representa la distribucin


gumbel como una lnea recta

Por ejemplo para determina los estimadores de y por medio de una


muestra dada correspondiente a una poblacin normal, hacer.
1. plotear los valores de la distribucin emprica de la muestra.
2. dibujar una muestra k se aproxime a los puntos, tanto como sea
posible.
3. calcular el valor correspondiente para una posibilidad de 50% este
valor es x , el cual es un estimador .

4 calcular el valor para una posibilidad del 84.13% el mismo k


corresponde a x +S, es decir.
x + s=K 2
s=K 2 x
S

es un estimador de

4.2.2 METODO DE MINIMOS CUADRADOS


Este, mtodo ms aplicable para la estimacin de los parmetros de una
ecuacin de regresin.
Por ejemplo, dada la recta de regresin lineal:
Y = a + bX
Donde a y b son parmetros
El error entre el valor observado i y el terico es:
i= y iab x i
e
Y la suma de los cuadrados de los errores de los valores observados es :

S= ei = ( y iab x i )
2

i =1

i=1

Esta suma puede minimizarse para a y b, esto se consigue derivando


parcialmente S en funcin de cada estimando a y b, e igualando a cero,
es decir:
n

S
=2 ( y iab x i )=0
b
i=1

(1)

S
=2 x i ( y iab x i ) =0
b
i=1

(2)

Las ecuaciones (1) y (2) se denominan ecuaciones normales, las cuales


resueltas dan para a y b.
xi

x ix

x
2i
xy
x i y i in i

b=

a= y b x =

y i xi b
n

4.2.3 MOMENTOS DE LOS MOMENTOS


El principio bsico de la estimacin por mtodo de los momentos es
establecer para cada funcin de distribucin la relacin entre los
parmetros y momentos centrales, de tal manera que:

=f 1( i , i +1, )
=f 2 ( j , j +1, )

(3)

=f 3 ( k , k +1, )

Donde , , son parmetros de la funcin de distribucin


i , j , k

Son momentos con respecto a la media, o momentos

centrales de la poblacin.
Como los momentos son estimados a partir de los momentos de la
muestra como estimadores sesgados o insesgados, el resultado k se
a^ , b^ , c^ , como estimadores sesgados o
obtiene ser a, b, c, o
insesgados de los parmetros.
Cuando la distribucin de probabilidad, a la que se estiman los
parmetros por este mtodo es simtrica y particularmente si es normal,
se puede demostrar que este mtodo es un mtodo muy eficiente, pero
cuando la distribuciones son asimtricas y por lo tanto sesgadas, como
sucede muy a menudo con la mayora de las variables hidrolgicas, el
utilizar este mtodo representa una perdida de eficiencia en la
estimacin:
Ejemplos:
1 dada la funcin densidad de la distribucin normal:
(x 1)/2

2
2
1/
1
f ( x )=
e
2 2

Para - < x <

Estimar los parmetros

1 , 2 ,

por el mtodo de momentos.

Solucin:
Sabemos que:
1) la media poblacional es igual al 1er momento respecto al origen, es
decir:

=E ( x )=1 = xf ( x ) dx

2) la varianza

(4)

es igual al 2do momento con respecto a la media, es

decir:
x

(5)

V (x)= = 2=
2

Sustituyendo f(x) en (4) resulta:


(x1 )/2

2
1/
1
x
e
2 2

( x1) / 2

2
1/
x e

1
=

2 2

(6)

Haciendo:
x1
=y
2

x=1 +2 y

Lmites: si

dx= 2+ d y

x -

y -

x +

y +

Sustituyendo (7) en (6), se tiene:

1
(1 +2 y)e y /2 2 dy

2 2
2

1 2 y /2
( 2)2 y / 2
=
e dy+ 2 e dy
2 2
2
2

Calculo de:

y /2

dy +

e y / 2 dy

2 2

A= e y / 2 dy = e y / 2 dy + ey /2 dy

(9)

1/2
f ( y )=e

Siendo

1/2
f ( y )=e

e1/ 2 y

= f(y)

Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0

f ( y ) dy

f ( y ) dy
0

Luego (9), se escribe:

A= e

1 /2 y

dy+ e1 /2 y dy
0

A=2 e1/ 2 y dy

(10)

Haciendo
2

y =t

2 ydy=dt

Limites:

y=t

1/ 2

dy=

dt
dt
= 1/2
2 y 2t

Para y = 0

t =0

Luego (10) se convierte en:

A=2 e1/ 2
0

dt
2t 1 /2

A= t 1 /2 e1 /2 t dt
0

Aplicando la transformacin de Laplace:


r(
A=

(1/2)

Pero

1
r( )
2
=
1
+1
(1/2)1 /2
2

1
+1)
2

( 12 )=

(propiedad de la funcin gamma)

A=
1
2
A= 2

. (11)

Calculo de B

B= ye1 /2 y dy

B= ye1 /2 y dy+ ye 1 /2 y dy

. (12)

Donde

f ( y )= y e

f ( y ) =( y ) e

1 2
y
2

1
2
( y )
2

=(y ) e

1 2
y
2

=f ( y )

Luego: (12) se escribe

B= ye

1 /2 y

B=0

dy + ye1 /2 y dy
0

(13)

Sustituyendo (11) y (13) en (8), resulta


=

=1

2 +

(0)

( lo que indica que el primer parmetro

)
1=

1
X = X
N i

Sustituyendo f(x) en (5) se tiene:

es igual a la media

(x1) / 2

2
1/
1
(x)
e
2 2

= 2=

Como =

( x1 )/ 2

2
1/
2
x1 e

1
2
=2=

2 2

Haciendo:
x1
=y
2

Limites:

x=1 +2 y

dx= 2 d y

Lmites: si

y -

luego

1
=
22 y 2 e1/ 2 y 2 dy

2 2
2

22 2 1 /2 y
=
y e dy
2 2
2

2 1 /2 y
Siendo f(Y) y e

f(-y)=f(y) (funcin par), por lo cual

f ( y ) dy=2 f ( y ) dy

Luego:
22 2 1/ 2 y
=
y e dy
2 0
2

Haciendo:
2

y =t

y=t

dy=

1/ 2

Limites.
Para y = 0
y

t =0
t

dt
2 t 1 /2

Se tiene:
2 22 1/ 2 dt
=
t e 2t 1/ 2
2 0
2

22 1 /2 1 /2
=
t e dt
2 0
2

Aplicando transformacin de Laplace:


1
r ( +1)
2

2
2= 2 .
2 (1/2)3 /2
1
1/2 r ( )
2

2
2= 2 .
3/ 2
2 (1 /2)

Pero: r(1/2) =

2=

2 2

. 1/ 2
2 (1/2)

2=

2 2
. 2
2

2= 22

2= 22=

luego:

( el parmetro

1
)2
(X X
N 1 i

es igual

2=

1
(X i X )2
N1

2. Dada la funcin densidad de la distribucin poisson:


x e
xfactorial

Para x= 0, 1, 2,

f(x)
0

En otro caso

Calcular usando el mtodo de momentos:


El parmetro
La varianza
Solucin:
1. como X es una variable discreta:
=E ( X ) = xf (x)

= x
x=0

x e
x

x e
x=0 ( x 1)

0 e
x e
+
(1) x=1 (x1)

Pero (-1) = r(0) =

Pero:

e
e
e
=
=
=0
(1) r (0)

Luego:

e
(x1)

x=1

=e .


+ + +
0 1 2

= e . 1+


+ +
1 2

Pero:

1+

2 3
+ + =e
1 2

Entonces:

(Por desarrollo de serie de Taylor)

=e e

Falta 88 y 89

El mtodo de mxima verosimilitud, consiste en estimar , , g, a partir de la muestra


de tal manera que L sea mxima. Esto se obtiene por la diferenciacin parcial de L con
respecto a cada parmetro e igualando a cero.
Puesto que f(x) es no negativo, un valor mximo de L ser, en general positivo. Como el
logaritmo natural lnL es una funcin monotmicamente creciente de L, esta tiene un
mximo precisamente en los puntos en que L tiene un mximo. Por lo tanto, se puede
usar lnL en lugar de L, es decir:
N

i =1

i=1

L= f ( x i , a ,b ,c , ) lnL= ln f ( x i , a , b , c , )

este artificio, permite transformar una productoria a una sumatoria, donde:


a, b, c son estimadores de , , g,
entonces el conjunto de ecuaciones de mxima verosimilitud es:

lnL
lnL
lnL
=0 ;
=0;
=0 ;
a
b
c
El mismo que tiene tantas ecuaciones como incgnitas.
Las propiedades de los estimadores calculados por el mtodo de mxima verosimilitud,
son:

Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el mtodo

puede producirlos.
La solucin de la ecuacin de verosimilitud proporciona un estimador que
converge al valor poblacional cuando el tamao muestral tiende a infinito, por lo
que el estimador es consistente.

Ejemplos:
1. Dada la funcin densidad de la distribucin exponencial:

f ( x )= e para x >0, > 0


0 en otros casos

Estimar el parmetro l, usando el mtodo de mxima verosimilitud.


Solucin:
Sea la funcin de verosimilitud:
n

L= f ( x i , )
i =1

f ( x i , )=

Siendo:

Luego:
N

L= ex
i =1

lnL= ln ( e

i=1

lnL= ln ( ln+ ln ex )
i=1

lnL= ln ( ln x i )
i=1

Derivando con respecto a l, se tiene:

lnL

=lnL=

( 1 x i)=0
i=1

[
n

i=1

ln ( ln x i ) =0

1
x i=0

i=1
n

i=1

n1
= x i

i=1
n

1 1
= x
n i=1 i

1
n

1
x
n i=1 i

2. Dada la funcin densidad de la distribucin normal

f ( x )=

1
[ x1 /2 ]
2

para< a<

Estimar los parmetros

1 /2 , por el mtodo de mxima verosimilitud.

Solucin:
1. La funcin de verosimilitud es:
N

L=
i =1

1
[ x1/ 2]
2

2. Tomando ln:
n

lnL= ln (
i=1

ln (

)e

1
[ x1 /2 ]
2

1 x
2 2) ( i 1 )
2 2
n

lnL=
i=1

1 2
lnL= ln ( 2 1ln 2 ) ( )
2
i=1
Derivando con respecto a

1 , 2 , resulta:

n
x 1
lnL
1
=
2( i 1 )(
) =0
i=1 2
2
2

a)
n

i=1

x i1
=0
2
n

1
( x i1 )=0
22 i=1
n

i=1

i=1

i=1

i=1

x i 1=0

x i= 1
n

x i=n 1
i=1

xi =
n

1=

b)

n i=1
x i 1

1 1
=0
2 2

n
lnL
=
i=1

x i1

2
1
+ =0
2

i=1

x i1

2
1+=0

n
1

2 i=1
x i 1

(1)+
i=1

i=1

x i 1

n
1

22 i=1
xi 1

n
1

n i=1

x i 1

n
1
2
2 =
n i=1
4.3 PROBLEMAS PROPUESTOS
1. dada la funcin densidad de la distribucin uniforme:
f ( x )=

1
para x

Estimar sus parmetros

y , utilizando el mtodo de momentos.

2. dada la funcin densidad de la distribucin exponencial:

f ( x )= ex para x> 0, >0

Estimar su parmetro

, utilizando el mtodo de momentos.

3. Dada la funcin densidad de la distribucin de Poisson:

e
f ( x )= x !

para x =0,1, 2,
0 en otros casos

Calcular el parmetro

, usando el mtodo de mxima verosimilitud.

4. dada la funcin densidad de la distribucin exponencial de dos parmetros:

f ( x )= e(x) para x> , >0


Estimar sus parmetros

, , utilizando el mtodo de momentos.

5. dada la funcin densidad de la distribucin exponencial de dos parmetros:


(x)

f ( x )= e

para x> , >0

Estimar sus parmetros

, , utilizando el mtodo de mxima verosimilitud.

V. PRUEBAS DE BONDAD DE AJUSTE


Las pruebas de bondad de ajuste consiste en comprobar grfica y estadsticamente, si la
frecuencia emprica de la distribucin emprica de la serie analizada se ajusta a una
determinada funcin de probabilidades terica seleccionada a priori, con los parmetros
estimados en base a los valores muestrales.
Las pruebas estadsticas, tienen por objeto medir la certidumbre que se obtiene al hacer
una hiptesis estadstica sobre poblacin, es decir calificar el hecho de suponer que una
variable aleatoria se distribuya segn una cierta funcin de probabilidades.
Las pruebas de bondad de ajuste ms utilizadas son:

ajuste grafico

ajuste estadistico

chicuadrado
{SmirnovKolmogorov

5.1 AJUSTE GRAFICO


El ajuste grafico se puede realizar de las siguientes formas:
Comparar grficamente el histograma o funcin densidad emprica de la
serie de datos con la funcin densidad terica y decidir visualmente si hay
o no ajuste de acuerdo a la similitud o diferencia de ambos,
respectivamente.

Comparar grficamente la funcin acumulada de la serie de datos, con la


funcin acumulada terica seleccionada, dibujada en papel milimtrico, y
decidir visualmente si hay o no ajuste.

Se puede comparar tambin grficamente la funcin acumulada de la serie


de datos, con la funcin acumulada terica, ploteada en un papel
probabilstico adecuado, donde la distribucin terica seleccionada, se
puede representar como una lnea recta. As se tienen disponibles los
papeles probabilsticos normal, log-normal, gumbel, etc.
El procedimiento consiste en plotear los valores de la variable hidrolgica
(caudal, precipitacin, temperatura, etc.), versus la probabilidad emprica
en el papel de probabilidad correspondiente. Si los puntos ploteados se
agrupan alrededor de una lnea recta, que es la representacin de la
distribucin terica, se puede afirmar con cierta certeza que estos datos se
ajustan a la distribucin deseada.

5.2 PRUEBA CHI CUADRADO


La prueba chi-cuadrado es la as comnmente usada para verificar la bondad de
ajuste de la distribucin emprica a una distribucin terica conocida.
La expresin general de chi-cuadrado est dado por:

i ei

2/i

(1)

X c =
i=1

Donde:
k

i=1

i=1

i = e i=N
X c 2 = valor calculado de chi-cuadrado, a partir de los datos.
i = nmero de valores observados en el intervalo de clase i.
e i = nmero de valores esperados en el intervalo de clase i.
k = nmero de intervalos de clase.
Asignado probabilidades a la ecuacin (1) es decir, asignando igual probabilidad
de ocurrencia a cada intervalo de clase, se tiene:

N iN Pi

X c 2=
i=1

Donde:

N i = nmero de observaciones que caen dentro de los lmites de clases

ajustadas del intervalo i.

N = tamao muestral

Pi = probabilidad igual para todos los intervalos de clases.


i
Pi= o ei =N Pi
k

. (3)

Simplificando la ecuacin (3), se obtiene la forma computacional desarrollada por


Markovic (1965).
k

k
2
X c = N i N . ( 4)
N i=1
2

E valor

Xc

obtenido por la ecuacin (4) se compara con el

Xt

de las

tablas, cuyo valor se determina con:


Nivel de significacin: =0.05 o 00.01
Grados de libertad: g.l.= k-l-h
Donde:
h = es el nmero de parmetros a estimarse, as:
h = 2, para la distribucin normal
h = 3, para la distribucin log-normal de 3 parmetros
El criterio de decisin se fundamenta en la comparacin dl valor calculado de chicuadrado con el valor tabular encontrado, esto es:
Si el chi-cuadrado calculado es menor o igual que el valor de la tabla, es
decir:

X c 2 X t2 ,
Entonces se acepta la hiptesis de que el ajuste es bueno al nivel de

significacin seleccionado.
Si el chi-cuadrado calculado es mayor que el valor tabular, es decir:

Xc > Xt

Entonces el ajuste es malo y se rechaza la hiptesis, siendo necesaria


probar con otra distribucin terica.
VENTAJAS Y LIMITACIONES
1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha sido
desarrollado en base a datos normales e independientes.
2. Es realizado en la funcin densidad de datos agrupados en intervalos de clases.
3. Requiere un conocimiento a priori de la funcin de distribucin terica utilizada en
el ajuste.
4. En la prctica se usa para cualquier modelo de ajust, pero estrictamente es
vlido solo para la normal.
5. Es de fcil aplicacin
6. Al utilizar esta prueba, se debe tener cuidado que en cada intervalo de clase, se
tenga por lo menos 5 observaciones.
5.3 PRUEBA DE BONDAD DE AJUSTE SMIRNOV-KOLMOGOROV
La prueba de ajuste de Smirnov-Kolmogorov, consiste en comparar las diferencias
existentes entre la probabilidad emprica de los datos de la muestra y la probabilidad
terica, tomando el valor mximo del valor absoluto, de la diferencia entre el valor
observado y el valor de la recta terica del modelo, es decir:

=max|F ( x )P( x)| . (5)


Donde:

= estadstico de Smirnov-Kolmogorov, cuyo valor es igual a la diferencia mxima


existente entre la probabilidad ajustada y la probabilidad emperica.
F(x) = probabilidad de la distribucin de ajuste o terica
P(x) = probabilidad experimental o emperica de los datos, de denominada tambin frecuencia
acumulada.
El estadstico tiene su funcin de distribucin de probabilidades.
Si o es un valor critico para un nivel de significacin , se tiene que:
P { max | F(x) P(x) | o } =
O

P( o) =

..(6)

Tambin:
P( < o) = 1

(7)

El procedimiento para efectuar el ajuste, mediante el estadstico de Smirnov-Kolmogorov, es:


1 Calcular la probabilidad empica o experimental P(x) de los datos, para esto usar la formula de
Weibull:

P(x)=

M
N +1

(8)

Donde:
M= nmero de orden.
N= nmero de datos.
Existen varias frmulas para calcular la probabilidad experimental, la misma que se muestra en la
tabla 1, siendo la ms utilizada la frmula de Weibull.
2 Calcular la probabilidad terica F(x)
2.1. Para el caso de utilizar el procedimiento de los modelos tericos, Usar la ecuacin de la
Funcin acumulada F(x), o tablas elaboradas por tal fin.
2.2. Si se quiere aplicar el procedimiento grfico, se utiliza un papel probabilstico especial
donde F(x), puede representarse como una lnea recta, por lo cual, se puede trazar con
solo 2 puntos, pero si se quiere chequear que es una recta, se puede plotear 3 puntos, por
ejemplo para el caso de una distribucin normal, los puntos:

Tabla 1. Formulas para determinar la probabilidad experimental.

Metodo

California

Probabilidad
experimental
P
m
n

Hazen

m-1/2
n

Weibull

Chegada
yev

n+1
m - 0.3
n + 0.4

Bom

m-3/8
n + 1/4

Tukey

3m - 1
3n + 4

Gringorte
n

m-a
n + 1 2a

Donde :
p = probabilidad experimental o frecuencia relativa empirica.
m= numero de orden
n= numero de datos
n= valor comprendido en el intervalo 0 < a < 1, y depende de n, de acuerdo a la siguiente tabla:
n
a
n
a

10
0.448
60
0.440

20
0.443
70
0.440

30
0.442
80
0.440

Valor

40
0.441
90
0.439

50
0.440
100
0.439

Probabilidad
%

50

X + S
X
-S

84.13
15.87

Representados en un papel de probabilidad normal, forman una recta.

3 Calcular las diferencias P(x) F (x), para todos los valores de x.


4 Seleccionar la mxima diferencia
5 Calcular el valor critico del estadstico de , es decir o para un = 0.05 y N igual al

Numero de datos. Los valores de o, se muestran en la tabla 2.


Tabla 2 valores criyicos de o del estadstico Smirnov- kolmogorov ,
Para varios valores de N y niveles de significacin

TAMAO
MUESTRA
L
N
5
10
15
20
25
30
35
40
45

0.20
0.45
0.32
0.27
0.23
0.21
0.19
0.18
0.17
0.16

0.10
0-51
0.37
0.30
0.26
0.24
0.22
0.20
0.19
0-18

0.05
0.56
0.41
0.34
0.29
0.27
0.24
0.23
O.21
0.20

0.01
0.67
0.49
0.40
0.36
0.32
0.29
0.27
0.25
0.24

50
N >50

0.15
1.07

0.17
1.22

0.19
1.36

0.23
1.63

NIVESLES SIGNIFICACION

6 Comparar el valor del estadstico , con el valor critico o de la tabla 2, con los siguientes
criterios de decisiones deducidos de la ecuacin (6)
Si < o el ajuste es bueno, a nivel de significacin seleccionado
0 el ajuste no es bueno, al nivel de significacin seleccionado.
VENTAJAS Y LIMITACIONES
a. No requiere un conocimiento a priori de la funcin de la distribucin terica.
b. Es aplicable a distribuciones de datos no agrupados, es decir no se requiere hacer
intervalos de clase.
c. Es aplicable a cualquier distribucin terica.
d. Se aplica en la funcin de distribucin acumulada y no en la funcin de densidad.
e. Comparndola con la prueba chi- cuadrado, no hay condicin de que cada clase de
f.

frecuencia deba contener un mnimo de 5 valores observados.


No es una prueba exacta, si no una prueba aproximada.

VI

DISTRIBUCIONES TEORICAS

El hidrlogo generalmente tendr disponible un registro de datos hidrometerologico (precipitacin,


descarga, evapotranspiracin, etc.), a travs de su conocimiento del problema fsico, escoger un
modelo probabilstico a usar, que represente en forma satisfactoria el comportamiento de la
variable.
Para utilizar estos modelos probabilsticos, debe calcular sus parmetros y realizar la prueba de
bondad de ajuste, en un esquema de este proceso se muestra en la figura 15.
Encontrada la ley de distribucin que rige alas variables aleatorias se podr predecir con
determinada probabilidad, la ocurrencia o no ocurrencia, de una determinada magnitud de un
fenmeno Hidrometeoro lgico.
Las distribuciones tericas comnmente utilizadas en Hidrologa, son entre otras:

Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel

Las cuales se ven en este capitulo


6.1 DISTRIBUCION NORMAL O GAUSSIANA
1.

FUNCION DENSIDAD
La funcin densidad de la distribucin normal es:

1
f(x) = 2 s

1 x X 2
EXP [- 2 ( s ) ..(1)

seleccion
de una
distribucin

REGISTRO DE
DATOS

ELEGIR UNA
DISTRIBUCIO
N TEORICA
ESTIMACION
DE
PARAMETROS
PRUEBA DE
BONDAD DE
AJUSTE
AJUSTE
BUENO
UTILIZAR
DISTRIBUCIO
N TEORICA
ELEGIDA
FIN

Fig. 15. Proceso de seleccin de una distribucin terica.


Donde F(x) es la funcin de distribucin de la distribucin para la variable original x, segn la
ecuacin (6), o tambin para la variable estandarizada Z, segn la ec. (8), es decir F(x) = F(Z).
Esta funcin de distribucin tiene las siguientes funciones:

F( ) = 0

F(

F( + ) = 1

X )

= 0.5

3. CALCULO DE LA FUNCION DE DISTRIBUCION ACUMULA


Existen tablas, por ejemplo las tablas 1 y 2 del apndice que permite calcular F(Z).
Para realizar clculos computacionales de F(Z), se utiliza funciones de aproximacin, dentro de las
cuales se pueden mencionar:
a)

Abramowitz stegun (1965) han dado varias aproximaciones para la F.D.A. de la


Variable normal estandarizada Z . Una aproximacin polinomial con un error menor que
10-5 es:
F(Z)

1- f(Z)(0.043618V 0.1217V2 + 0.9373V3)

..(10)

Donde:
F(Z) = es la funcin de distribucin acumulada
f(Z) = es la funcin densidad de la variable estandarizada
V

= es definido para Z 0, como:

1+0 .33267Z
1
V=

(11)
b)

Masting (1955), ha dado una aproximacin polinomial que ha sido utilizado por la IBM (1968).

Esta aproximacin con un error menor que 7.5 x 10 -8 , es:

1- f(Z)( b1w + b2w + b3w + b4w + b5w)

F(Z)

..(12)

Donde:
W es definido para Z 0, como:

1+0.2316419Z
1
W=

(13)

Siendo las constantes:


b1 = 0.319381530

b4 = -0.356563782

b2 = 1.781477937

b5 = - 1.821255978

b3 = 1.330274429
En ambas aproximaciones la F.D.A. es 1- F(Z), si Z<0
4. ESTIMACION DE PARAMETROS
Para estimar los parmetros de distribucin terica se puede usar el mtodo de momentos o el
mtodo de mxima vesimilitud.
Cabe mencionar que la distribucin normal, es la nica funcin de distribucin, que produce los
mismos resultados de los parmetros, estimados por el mtodo de los momentos y mxima
verosimilitud, los parmetros obtenidos son los siguientes:
N

S=

= [

1
X
N i=1 i

Xi

N
1

N 1 i=1

)2]1/2

..(14)

Donde:

X
S=

= es el estimado de la media, llamado tambin parmetro de posicin.


es el estimado insesgado de la desviacin estandaro parmetro de escala.

5. APLICACIONES EN HIDROLOGIA
L a distribucin normal tiene gran utilidad en hidrologa, siendo alguna de sus principales
aplicaciones:

En el ajuste de distribuciones empricas de variables hidrolgicas de intervalos de tiempos


grandes, tales como variables medias anuales, estacionales, etc., que puede ser descargadas,

precipitacio, entre otros.


Anlisis de los errores aleatorios en las observaciones o mediciones hidrolgicas.
Como referencia para comparar varias distribuciones tericas de ajuste en una distribucin

emprica.
Para hacer procesos de inferencia estadstica.
Para generacin de datos por el mtodo de Monte Carlos. El inconveniente en la generacin
de datos es que se obtienen valores negativos, lo cual fsicamente no es justificado.

6. AJUSTE
El ajuste puede realizarse grficamente utilizando papel probabilstico normal o analticamente,
mediante los estadsticos chi-cuadrado o Smirnov Kolmogorov.

You might also like