Professional Documents
Culture Documents
CONCEPTOS BASICOS
1.1 ESPACIO MUESTRAL
Es el conjunto de todos los posibles resultados de un experimento. Aun cuando
en un experimento, no es posible determinar con seguridad su resultado, se
puede s, definir con precisin un listado de los resultados posibles de ocurrir.
Esta lista constituye el espacio muestral, y se designa como S.
Ejemplos:
1. Si el experimento consiste en lanzar una moneda, los resultados posibles
son sello o cara, luego:
S = {sello, cara}
Ns = 2
Ns: nmero posible de resultados del espacio muestral.
2. Si el experimento consiste en lanzar un dado, el espacio muestral ser:
S = {1, 2, 3, 4, 5, 6}
Ns = 6
3. Si el experimento consiste en lanzar 2 dados, el espacio muestral, de la
suma de los resultado ser:
S = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Ns = 11
1.2. EVENTOS
Son los resultados posibles que se puedan presentar en la realizacin de un
experimento.
Es un subconjunto del espacio muestral.
Ejemplos:
1. En el experimento de lanzar una moneda el evento A, que salga cara es:
A = {cara}
NA = 1
NA: nmero posible de resultados del experimento.
dada por:
P ( A )=
NA
NS
.. (1)
Ejemplos:
1. El arrojar una moneda, la probabilidad de que salga sello, es:
1
P= 2
2. Al arrojar un dado, hay seis casos igualmente posibles, la
probabilidad de que salga un nmero igual o mayor que 3 es:
4
2
P= 6 = 3
3. Al arrojar dos dados, hay 36 casos igualmente posibles, la
probabilidad de que la suma de los resultado sea 7, es:
6
1
P = 36 = 6
4. En una serie de dos bolas rojas y ocho bolas negras, hallar la
probabilidad que al extraer una bola, esta sea de color rojo.
De los 10 casos igualmente probables, en 2 casos suceder el
evento que se considera, por lo que se tendr:
2
1
P = 10 = 5
En el concepto clsico
experimentos en los
igualmente posibles.
problemas prcticos no
P(A)
2. P(S) = 1
1 , para todo A
A1
3. Si
A2
, ,
AN
excluyentes, entonces:
A
A2
A3
AN
A
A
P( 1 U
U
U.U
) = P ( 1 ) + P ( 2 ) + + P (
AN
) = 1 P(A), donde
AC
es el complemento de A.
P ( A B )=P ( A ) + P ( B )P ( A B )( 2)
PROBABILIDAD CONDICIONAL
Si A y B son dos eventos en los cuales
P ( A ) 0 , entonces, la probabilidad
P ( B/ A )=
P( A B)
.(3)
P( A)
( e , e ) ,( e , c ) , ( c , e) , ( c , c)
Dnde:
e = escudo, c = corona, la primera letra, se refiere al de 10 y la segunda al
de 20 colones.
Si se define como la variable aleatoria:
X = nmero total de escudos que se obtiene al efectuar el experimento
entonces, la variable aleatoria X, puede ser:
X = 0, 1, 2
Donde:
X = 0, si el resultado son 0 escudos
X = 1, si el resultado es 1 escudo
X = 2, si el resultado son 2 escudos
Luego, considerando que las monedas no son falsas, si:
X = 0, le corresponde una probabilidad de:
P ( X=0 )=1/4=0.25
X = 1, le corresponde una probabilidad de:
P ( X=1 )=2/4=1/2=0.5
X = 2, le corresponde una probabilidad de:
X =a P( X=a)
X > d P (X >d )
1.5.1 CLASES DE VARIABLES ALEATORIAS
1. Variable aleatoria discreta
Se dice que una variable aleatoria X es discreta. Cuando sus valores se
restringen a un conjunto enumerable finito o infinito.
Ejemplo: Nmero de das de lluvias ocurridas en los meses de un ao
cualquiera.
Representacin Grafica
Nmero
de das
Meses
Caudal Q
31
DISTRIBUCIONES
f(x)
funcion de densidad (funcion de probabilidad, distribucion de
probabilidad de x)
F(x)
una
funcion
matematica
que
permite
determinar
la
probabilidad
f ( x )=P ( X=x ) , de que una variable aleatoria discreta X tome los diferentes
valores x, dentro del rango en el que esta definido y cumple con las siguientes
condiciones:
0 f ( x ) =P ( X =x ) 1 x
f ( x )=1
=1
P ( a x b )= f ( x )
=a
Ejemplo:
Sea X la variable aleatoria que representa la suma de los puntos que se
obtiene al lanzar dos dados.
La funcin de probabilidad f(x) correspondiente, tiene los siguientes valores:
X
f(x
2
1/36
3
2/36
4
3/36
5
4/36
6
5/36
7
6/36
8
5/36
9
4/36
10
3/36
11
2/36
12
1/36
)
la misma tiene la siguiente representacin grfica:
F(x) x
2
3 4
5
6 7
8
9
1.6.2. FUNCIN DE DENSIDAD DE UNA VARIABLE ALEATORIO
CONTINUO
Es una funcin matemtica que permite determinar la probabilidad, de
que una variable aleatoria continua X tome los diferentes valores
Xi ,
dentro del rango en el que est definido y cumple con las siguientes
condiciones:
xi )
f(
f ( x ) dx
=1
P (a x b) =
f ( x ) dx
b
Ejemplo:
Sea X una variable aleatoria continua que tiene la funcin densidad:
f (x) =
Se pide:
2
0.75 ( 1x ) , para1 x 1
,
0 , para cualquier otro valor de x
2. Calcular P(-0.5
0.5)
Solucin:
1. Para elaborar el grafico, se evala f(x), para valores de x, que estn en el
intervalo definido por [-1.1] as se tiene:
x
F(x)
-1
0
-0.8
0.27
-0.4
0.5625
0
0.72
0.2
0.75
0.5
0.72
0.8
0.5625
-1
-0.5
0.5
0.5
2. P (-0.5
0.5
= 0.75
dx
0.5
0.75 ( 1x 2 ) dx
0.5) =
0.5
0.5
( x 2) dx
0.5
0.5
= 0.75 (x | 0.5 -
0.5
x
3
| 0.5
3
/3 ( 0.5 /3
1.5
1
0
= 0.75/3 [3 0.25]
= 0.25x2.75
P (-0.5
0.5)
x) (5)
(a).. (6)
decir:
F(x) = P (X
x)=
f ( x i )
. (7)
x i x
Ejemplo
Sea X una variable aleatoria discreta con funcin de probabilidades:
1
3
3
1
f ( 0 ) = , f ( 1 )= , f ( 2 ) = , f ( 3 ) =
8
8
8
8
1. Calcular
P( X 2)
P ( X 2 )=F ( 2 )= f ( x ) =f ( 0 ) + f ( 1 )+ f (2)
1.
x=0
1 3 3
P( X 2)= + +
8 8 8
P ( X 2 )=
2
7
x< 0
0 x <1
0 x <2
0 x <3
x3
F(x)
1/8
4/8
7/8
Graficando resulta:
F(x)
1
7/8
1/8
1/8
F ( x )=P ( X x )= f ( x ) dx (8)
d F(x)
=f ( x ) ( 9 )
dx
De(6), se tiene:
x
a< x b
P (a
x
b)
F (x)
F ( x=a )=0
en efecto:
F (x)
a x b,
ax b,
axb
(Con a y b fijos, pero arbitrarios y con b>a), son todos iguales, es decir:
P (a xb)=P (a x b)=P (ax b)=P (axb).
Esta situacin es diferente para el caso de una distribucin discreta.
Ejemplo:
Sea x una variable aleatoria continua, que tiene la funcin densidad:
2
para 0 x 1
f ( x )= 3 x
para
cualquier
otro valor de x
0
Calcular:
1. La funcin acumulada
2. P(X 0.8)
3. P(0.2 X 0.6)
4. P(X>0.7)
5. dibujar la funcin de distribucin acumulada.
Solucin:
1. por definicin:
x
F ( x )= f ( x )
0
0
F ( x )= f ( x )+ f ( x )dx
0
F ( x )= f ( x)dx
0
x3 x 3
F ( x )= 3 x dx=3 0 =x 0
3
0
2
F ( x )=x
2.
3.
4.
3
5. para elaborar el grafico de F ( x )=x , se da valores a x en el
0
0
0.2
0.0
08
0.4
0.0
64
0.6
0.2
16
Graficando resultado:
0.8
0.5
12
1
1
1.2
1
0.8
F(x ) 0.6
0.4
0.2
0
0
0.2
0.4
0.6
0.8
1.2
Se requiere que g(x) este definida para todo x real, para el cual f(x) sea
diferente de cero.
1.7.1 PROPIEDADES DEL VALOR ESPERADO
1. Si g(x) = C cte.
E(C)=C
(13)
variable discreta
E ( C )= Cf ( x )dx
E ( C )= C(f xi )
E ( C ) =C f ( x)dx
E ( C )=C (f xi )
Pero:
f ( x ) dx=1
E ( C )=C E ( C ) =C
Luego: E(1)=1
2. E(a*g(x))=a*E(g(x))
a=cte.
3. E(a*g(x)+b*h(x))=a*E(g(x))+b*E(h(x))
.(14)
.(15)
k = E( x = x f (x)
para X discreta
.(16)
k = E( K )= E( x ) f (x)
K
para X continua
.(17)
1= x . f (x) o
1= x . f ( x) dx
1=E ( x )=
2= x 2 . f ( x ) o 2= x 2 . f (x)dx
3= x 3 . f ( x ) o 3= x3 . f (x ) dx
para X discreta
.(18)
( X)
k= E( K )= ( X ) . f ( x)
variable continua
Si
2 . f (x )dx
(x) . f ( x ) o 2=
2
2=
el segundo momento central es la varianza, es decir:
( 2 )=
2
2
=V ( X )=E
3 . f ( x)dx
(x) . f ( x ) o 3=
3=
1.8.3 MEDIA DE UNA DISTRIBUCION
El valor medio o media de una distribucin , es el esperado de la
variable X o momento de primer orden, proporciona una idea del lugar
donde estn concentrados los valores que toma la variable X, es decir:
= E( X = Xf (x)
para X discreta
= E( X)= Xf ( x )dx
para X continua
1.8.4 MEDIANA
Si x es una variable aleatoria y F(x) su funcin de distribucin
acumulada, la solucin x de la ecuacin:
F( x )=0.5
F(X)=0.
F(x)
0.5
0.5
x
media
X
1.8.5 MODA
La moda es el valor de ocurrencia ms frecuente. As la moda de la
poblacin es el valor de X que maximiza f(x) y que satisface la ecuacin:
2
df (x)
d f ( x)
=0 y
< 0 para x continua
dx
d x2
O el valor de x asociado con:
n
Max f (x i) para x discreta
i=1
(x )
(x) . f ( x )=E ( 2) para X discreta
2=V ( X )=
2
2 . f ( x )dx
(x)
=V ( X )=
2
CV =
( 3)
E
3
3 =
Si =0 la distribucin es simtrica.
Si >0 la distribucin tiene cola en el lado derecho, o es sesgada a la
derecha.
Si <0 la distribucin tiene cola en el lado izquierdo, o es sesgada a la
izquierdo.
1.8.9 CURTOSIS
El coeficiente de curtosis, es una medida de achatamiento, indica el
grado de llanura de la curva de la funcin densidad f(x), se representa
por la siguiente relacin:
x
( 4)
E
4
k = 4 =
a1
Con
a1 0
X+
a2
. (1)
, y la varianza
y la varianza 2 de X
Se sabe que:
=E(x)
Luego:
= E(X*) = E( a1 X + a2 )
= a E X) + 2 )
1
E
= a E X) + a2 E(1) , pero E (1) = 1
1
Entonces:
= a E X) + a2
1
(2)
= a1 + a2
a1
a2
a
X*=(
X+
+ 2
X*- = a1 X -
De donde, los k-esimos momentos centrales se relacionan como sigue:
k
X
E(
k
) = E ( a1 X )
Xk
a1k E ( X k ).. (3)
E(
)
=
2
= E ( X
=a1
Si
(4)
0 y 2=1
De (4):
a12=
) = a1
De (2):
1
+a 2
0=
a2=
Z=
2
= 0, z = 1
f(x) =
Con media
x/
1 /2
1
e
2
y varianza 2
Si z= (x- )/ , se tendr:
y varianza 2 ,
f(z) =
Con media
1
1/ 2 z
e
2
2
= 0 y varianza z = 1
Curva B
Curva A
Curva C
2. Medidas de dispersin
Se refiere a la forma como se encuentran esparcidas las observaciones. En la
fig. 2, se observa que la curva B tiene una mayor separacin o dispersin que
la curva A.
Curva B
Curva A
Las curvas asimtricas o sesgadas, como las que se muestran en la fig. 4 son
aquellas en las cuales la distribucin de frecuencia se concentra en el extremo
inferior o superior de la escala de medida sobre el eje horizontal. Los valores
no se distribuye igualmente, por lo que pueden ser sesgadas a la derecha
(curva A) i sesgadas a la izquierda (curva B).
Curva A
Curva B
hecho que una es ms puntiaguda que la otra,, por lo que tienen diferente
grado de curtosis.
Curva A
Curva B
Curva B (Leptocrtica)
Curva A (Mesocrtica)
Curva C (Platicrtica)
X .
xi
= i=1
n
(1)
xi
X = i=1
n
(2)
Donde:
: media poblacional
X : media muestral
Xi: valor i-simo de la muestra
n: nmero de datos de la muestra o poblacin
Media aritmtica de datos agrupados
Para el caso de datos agrupados, la frmula es:
k
fi . xi
X = i=1
(3)
Donde:
fi: frecuencia absoluta (nmero de observaciones) en el intercalo i
xi: marca de clase del intercalo i
k: nmero de intervalos de clase
n: nmero de observaciones de la muestra
fi . xi
X p = i=1n
fi
..(4)
i=1
Donde:
x p : media ponderada
xi: valor i-simo de la muestra
fi: valor del factor de ponderacin del i-simo valor de la muestra
n: nmero de observaciones de la muestra
La media ponderada, se utiliza por ejemplo para el clculo de la precipitacin
promedio de una cuenca, donde para cada valor de precipitacin de una
estacin, el factor de ponderacin es el rea, as:
n
Pi . Ai
P= i=1 n
Ai
i=1
Donde:
P
: precipitacin promedio
Pi: valor de la precipitacin en la estacin i
Ai: rea de influencia de la estacin i
n: nmero de estaciones
2.2.3 Media geomtrica
Dada la muestra compuesta de n datos, X 1, X2, X3,Xn, la media
geomtrica se define como la raz n-sima, de la productoria de los datos, es
decir:
1/ n
x G=( xi)
(5)
i=1
Donde:
x G : media geomtrica
n
xi
i=1
, n impar
(6)
Mcd=
X n / 2+ X n/ 2+1
, n par
2
(7)
n+1
(F +1)
2
Mcd=
W + Lm
fm
(8)
Donde:
Med: mediana muestral
n: nmero tital de elementos de la muestra
F: suma de todas las frecuencias hasta la clase de la mediana pero sin
incluirla
fm: frecuencia nicamente de la clase de la media
w: amplitud del intervalo de clase
Lm: lmite inferior
En general la clase donde se encuentra la mediana es aquella que tiene al
elemento situado en la porcin (n+1)/2
2.2.5 Moda
Es aquel valor que se repite ms frecuentemente en un conjunto de datos, se
denota por Mo.
Para datos agrupados en intervalos de clase, la moda, una vez determinada la
clase modal se calcula con la siguiente ecuacin:
Mo=Lm+
d1
w
d 1+ d 2
(9)
Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)
d2: diferencia entre la frecuencia de la clase modal y la postmodal (clase
siguiente)
w: amplitud del intervalo de clase
Lm: limite inferior de la clase modal
En general la clase modal es aquella que tiene la mxima frecuencia
2.2.6 comparacin entre la media, la mediana y la moda
(a)
moda
mediana
Media
(c)
mediana
moda
Media
(c)
Figura 7. Localizacion de la media, mediana y moda
(10)
Donde:
R: rango
Xmax: valor mximo de los datos
Xmin: valor mnimo de los datos
El rango o la amplitud es una manera conveniente de describir la dispersin,
sin embargo, no da medida alguna de la dispersin ente los datos con respecto
al valor central.
2.3.2 Varianza
Datos no agrupados:
La varianza poblacional (2), se define como la suma de cuadrados de las
desviaciones, de los datos con respecto a la media, dividida entre el nmero
total de datos, es decir:
n
( xi)2
2= i=1
(11)
( xix )2
S 2= i=1
n1
(12)
(13)
xi=n
xi =n x
(14)
( xi x )2= xi2 2 x ( xi )+ n x 2
( xi x )2= xi2 n x2
(15)
1
2= ( xi 2n x 2 ) (16)
n i=1
Y en (12) resulta:
2
S=
1
2
2
( xi n x )
n1 i=1
(17)
Donde:
S2: varianza muestral
2= varianza poblacional
xi: valor i-simo de la muestra
(xi)2 . fi
2= i=1
(18)
( xix )2 . fi
S 2= i=1
(19)
n1
Donde:
xi: valor de la i-sima marca de clase
x =: media
fi: valor de la i-sima frecuencia absoluta, es decir, nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
Para el clculo computacional, las ecuaciones (18) y (19), se pueden expresar:
2
xi . fin
(20)
i=1
1
=
n
2
xi 2 . fin x 2
k
i=1
1
S=
n1
(21)
= 2 (poblacional)
S= S2
(muestral)
xi n
k
i=1
n
=
(22)
xi 2n x 2
k
i=1
n1
S=
(23)
Siendo:
n
1
x == xi
n i=1
(24)
xi . fin
i=1
n
=
2
xi . fin x
(25)
i=1
n1
S=
Siendo:
(26)
x ==
1
xi . fi
n i=1
(27)
x= :media
fi: valor de la i-sima frecuencia absoluta, es decir nmero de datos en el
intervalo i
k: nmero de intervalos de clase
n: nmero total de datos
2.3.4 coeficiente de variacin
Es una medida relativa de dispersin, que relaciona la desviacin estndar y la
media, es decir:
CV =
S
x2
(28)
(29)
Donde:
n
( xi)3
3= i=1
(30)
(xi)
k
i=1
n
=
n
1
xi
n i=1
Cs=
n2 M 3
( n1 )( n2 ) S 3
(31)
Donde:
k
( xi x )2
M 3= i=1
S=
(32)
1
(xi x )2
n1 i=1
k
1
x = xi
n i=1
Datos agrupados:
El sesgo ( ) para datos poblacionales, se obtiene con la siguiente ecuacin:
=
3
3
Donde:
( xi)3 fi
3 i=1
. (33)
1
2
= ( xi) fi
n i=1
k
1
fi xi
n i=1
xi
n2 M 3
( n1 ) ( n2 ) s3
Cs =
(34)
(xix )3 fi
M3 =
S=
i=1
(35)
1
(xi x )2 fi
n1 i=1
k
1
fi xi
n i=1
xi
K=
.. (36)
(xi)4 fi
3 =
i=1
. (37)
1
=
( xix )2 fi
n1 i=1
k
1
xi
n i=1
Ck =
. (38)
(xix )4
M3 =
S=
i=1
1
(xi x )2 fi
n1 i=1
k
(39)
1
fi xi
n i=1
Datos agrupados
El coeficiente de curtosis (k) para datos poblacionales se define
mediante la siguiente ecuacin
4
4
K=
Donde
k
(xi)3 fi
3 i=1
........ (40)
1
= ( xi)2 fi
n i=1
k
1
fi xi
n i=1
xi
Ck =
n M4
( n1 ) ( n2 )( n3)S 4
. (41)
Donde
k
M4 =
(xix )3 fi
i=1
(42)
S=
1
(xi x )2 fi
n1 i=1
k
1
fi xi
n i=1
PRECIPITACIO
N (mm)
1418.60
1527.30
1108.60
1084.20
1509.10
1394.90
1334.40
AO
1981
1982
1983
1984
1985
1986
PRECIPITACIO
N (mm)
1441.50
1133.20
891.00
1429.80
1141.50
1312.60
Solucin:
Utilizando el programa del listado 1, haciendo uso de la opcin de datos
no agrupados, los resultados que se obtienen, son los que se muestran:
SERIE
1418.60 1527.30 1108.60 1084.20 1509.10 1394.90 1334.40
1441.50 1133.20 891.00 1429.80 1141.50 1312.60
Numero de datos = 13
RESULTADOS
Media
Varianza
Desviacin estndar
Coeficiente variacin
Coeficiente sesgo
Coeficiente curtosis
DATOS
PROBLACIONALES
1286,67
35214.73
187.66
0.15
-0.55
2.20
DATOS
MUESTRALES
1286.67
38149.29
195.32
0.15
0.63
3.12
Q m3/seg
3.99
2.96
1.79
1.55
2.48
2.61
2.27
1.86
2.07
2.70
AO
1981
1982
1983
1984
1985
1986
1987
1988
1989
Q m3/seg
5.52
3.09
5.00
6.03
2.73
3.13
4.18
3.26
4.03
MARCA DE
CLASE
1.5
2.5
3.5
4.5
5.5
6.5
1
150
2915
2
300
2563
3
187
3241
4
600
4017
5
550
5321
6
145
4621
7
278
5002
8
110
4932
f (t)
tx
. ( 1)
(i)
NC : 1.33 ln N +1 (3)
(ii)
Si N < 30 .. NC < 5
Si 30 < N < 75 8 NC 10
Si N > 75 . 10 < NC 30
Donde
N : tamao de la muestra
Ln N logaritmo natural o neperiano del tamao muestral.
X maxXmin
NC 1
R
NC 1
. ( 4)
(7)
fri =
Fab i
N
. ( 9 )
j=1
j=1
frj=
nj
N
1
nj
N j=1
. ( 10 )
Donde
Fri: frecuencia relativa acumulada hasta el intervalo i
Fi =
lim
x 0
fri
x
fri
x
N x
.. (11)
11.
Calcular la funcin de distribucin acumulada o emprica
usando la formula:
i
Fi =
x fj
j=1
(12)
AO
1911
1912
1913
1914
1915
CAUDAL
M3/S
7.91
8.01
13.27
16.39
80.83
AO
1935
1936
1937
1938
1939
CAUDAL
M3/S
24.58
28.49
10.05
28.01
34.92
AO
1959
1960
1961
1962
1963
CAUDAL
M3/S
22.88
17.57
14.60
31.14
18.20
1916
1917
1918
1919
1920
1921
1922
1923
1924
1925
1926
1927
1928
1929
1930
1931
1932
1933
1934
60.08
21.55
27.71
28.63
30.27
33.43
35.16
27.21
15.58
64.81
51.26
33.48
25.79
25.80
18.93
16.15
38.30
54.54
59.40
1940
1941
1942
1943
1944
1945
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
31.36
42.74
12.94
41.16
35.90
33.76
29.28
19.17
29.37
30.06
9.67
10.42
23.99
42.17
16.00
22.78
32.69
34.28
20.24
1964
1965
1966
1967
1968
1969
19970
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
24.69
22.99
11.78
32.26
4.76
12.70
16.19
30.14
30.57
45.38
18.91
34.99
21.49
29.26
4.58
12.46
3.14
f ( x )=
1
1 /2[( x)/ ]
e
2
Donde:
= parmetro de localizacin
= parmetro de escala
Para la funcin f(x), quede definida, debe calcularse para los parmetros
y
xi
^= x^ = i=1
n
(x ix )2
^ =S 2= i=1
Donde:
^
Es el estimador de la
Es el estimador de
Sesgado si
E(a)=
Insesgado
E(a)= + v ()
Dnde: v () = E(a)
Eficiente si:
Consistente
Grafico
Mnimo cuadrado
Momentos
Mxima verosimilitud
es un estimador de
S= ei = ( y iab x i )
2
i =1
i=1
S
=2 ( y iab x i )=0
b
i=1
(1)
S
=2 x i ( y iab x i ) =0
b
i=1
(2)
x ix
x
2i
xy
x i y i in i
b=
a= y b x =
y i xi b
n
=f 1( i , i +1, )
=f 2 ( j , j +1, )
(3)
=f 3 ( k , k +1, )
centrales de la poblacin.
Como los momentos son estimados a partir de los momentos de la
muestra como estimadores sesgados o insesgados, el resultado k se
a^ , b^ , c^ , como estimadores sesgados o
obtiene ser a, b, c, o
insesgados de los parmetros.
Cuando la distribucin de probabilidad, a la que se estiman los
parmetros por este mtodo es simtrica y particularmente si es normal,
se puede demostrar que este mtodo es un mtodo muy eficiente, pero
cuando la distribuciones son asimtricas y por lo tanto sesgadas, como
sucede muy a menudo con la mayora de las variables hidrolgicas, el
utilizar este mtodo representa una perdida de eficiencia en la
estimacin:
Ejemplos:
1 dada la funcin densidad de la distribucin normal:
(x 1)/2
2
2
1/
1
f ( x )=
e
2 2
1 , 2 ,
Solucin:
Sabemos que:
1) la media poblacional es igual al 1er momento respecto al origen, es
decir:
=E ( x )=1 = xf ( x ) dx
2) la varianza
(4)
decir:
x
(5)
V (x)= = 2=
2
2
1/
1
x
e
2 2
( x1) / 2
2
1/
x e
1
=
2 2
(6)
Haciendo:
x1
=y
2
x=1 +2 y
Lmites: si
dx= 2+ d y
x -
y -
x +
y +
1
(1 +2 y)e y /2 2 dy
2 2
2
1 2 y /2
( 2)2 y / 2
=
e dy+ 2 e dy
2 2
2
2
Calculo de:
y /2
dy +
e y / 2 dy
2 2
A= e y / 2 dy = e y / 2 dy + ey /2 dy
(9)
1/2
f ( y )=e
Siendo
1/2
f ( y )=e
e1/ 2 y
= f(y)
Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0
f ( y ) dy
f ( y ) dy
0
A= e
1 /2 y
dy+ e1 /2 y dy
0
A=2 e1/ 2 y dy
(10)
Haciendo
2
y =t
2 ydy=dt
Limites:
y=t
1/ 2
dy=
dt
dt
= 1/2
2 y 2t
Para y = 0
t =0
A=2 e1/ 2
0
dt
2t 1 /2
A= t 1 /2 e1 /2 t dt
0
(1/2)
Pero
1
r( )
2
=
1
+1
(1/2)1 /2
2
1
+1)
2
( 12 )=
A=
1
2
A= 2
. (11)
Calculo de B
B= ye1 /2 y dy
B= ye1 /2 y dy+ ye 1 /2 y dy
. (12)
Donde
f ( y )= y e
f ( y ) =( y ) e
1 2
y
2
1
2
( y )
2
=(y ) e
1 2
y
2
=f ( y )
B= ye
1 /2 y
B=0
dy + ye1 /2 y dy
0
(13)
=1
2 +
(0)
)
1=
1
X = X
N i
es igual a la media
(x1) / 2
2
1/
1
(x)
e
2 2
= 2=
Como =
( x1 )/ 2
2
1/
2
x1 e
1
2
=2=
2 2
Haciendo:
x1
=y
2
Limites:
x=1 +2 y
dx= 2 d y
Lmites: si
y -
luego
1
=
22 y 2 e1/ 2 y 2 dy
2 2
2
22 2 1 /2 y
=
y e dy
2 2
2
2 1 /2 y
Siendo f(Y) y e
f ( y ) dy=2 f ( y ) dy
Luego:
22 2 1/ 2 y
=
y e dy
2 0
2
Haciendo:
2
y =t
y=t
dy=
1/ 2
Limites.
Para y = 0
y
t =0
t
dt
2 t 1 /2
Se tiene:
2 22 1/ 2 dt
=
t e 2t 1/ 2
2 0
2
22 1 /2 1 /2
=
t e dt
2 0
2
2
2= 2 .
2 (1/2)3 /2
1
1/2 r ( )
2
2
2= 2 .
3/ 2
2 (1 /2)
Pero: r(1/2) =
2=
2 2
. 1/ 2
2 (1/2)
2=
2 2
. 2
2
2= 22
2= 22=
luego:
( el parmetro
1
)2
(X X
N 1 i
es igual
2=
1
(X i X )2
N1
Para x= 0, 1, 2,
f(x)
0
En otro caso
= x
x=0
x e
x
x e
x=0 ( x 1)
0 e
x e
+
(1) x=1 (x1)
Pero:
e
e
e
=
=
=0
(1) r (0)
Luego:
e
(x1)
x=1
=e .
+ + +
0 1 2
= e . 1+
+ +
1 2
Pero:
1+
2 3
+ + =e
1 2
Entonces:
=e e
Falta 88 y 89
i =1
i=1
L= f ( x i , a ,b ,c , ) lnL= ln f ( x i , a , b , c , )
lnL
lnL
lnL
=0 ;
=0;
=0 ;
a
b
c
El mismo que tiene tantas ecuaciones como incgnitas.
Las propiedades de los estimadores calculados por el mtodo de mxima verosimilitud,
son:
Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el mtodo
puede producirlos.
La solucin de la ecuacin de verosimilitud proporciona un estimador que
converge al valor poblacional cuando el tamao muestral tiende a infinito, por lo
que el estimador es consistente.
Ejemplos:
1. Dada la funcin densidad de la distribucin exponencial:
L= f ( x i , )
i =1
f ( x i , )=
Siendo:
Luego:
N
L= ex
i =1
lnL= ln ( e
i=1
lnL= ln ( ln+ ln ex )
i=1
lnL= ln ( ln x i )
i=1
lnL
=lnL=
( 1 x i)=0
i=1
[
n
i=1
ln ( ln x i ) =0
1
x i=0
i=1
n
i=1
n1
= x i
i=1
n
1 1
= x
n i=1 i
1
n
1
x
n i=1 i
f ( x )=
1
[ x1 /2 ]
2
para< a<
Solucin:
1. La funcin de verosimilitud es:
N
L=
i =1
1
[ x1/ 2]
2
2. Tomando ln:
n
lnL= ln (
i=1
ln (
)e
1
[ x1 /2 ]
2
1 x
2 2) ( i 1 )
2 2
n
lnL=
i=1
1 2
lnL= ln ( 2 1ln 2 ) ( )
2
i=1
Derivando con respecto a
1 , 2 , resulta:
n
x 1
lnL
1
=
2( i 1 )(
) =0
i=1 2
2
2
a)
n
i=1
x i1
=0
2
n
1
( x i1 )=0
22 i=1
n
i=1
i=1
i=1
i=1
x i 1=0
x i= 1
n
x i=n 1
i=1
xi =
n
1=
b)
n i=1
x i 1
1 1
=0
2 2
n
lnL
=
i=1
x i1
2
1
+ =0
2
i=1
x i1
2
1+=0
n
1
2 i=1
x i 1
(1)+
i=1
i=1
x i 1
n
1
22 i=1
xi 1
n
1
n i=1
x i 1
n
1
2
2 =
n i=1
4.3 PROBLEMAS PROPUESTOS
1. dada la funcin densidad de la distribucin uniforme:
f ( x )=
1
para x
Estimar su parmetro
e
f ( x )= x !
para x =0,1, 2,
0 en otros casos
Calcular el parmetro
f ( x )= e
ajuste grafico
ajuste estadistico
chicuadrado
{SmirnovKolmogorov
i ei
2/i
(1)
X c =
i=1
Donde:
k
i=1
i=1
i = e i=N
X c 2 = valor calculado de chi-cuadrado, a partir de los datos.
i = nmero de valores observados en el intervalo de clase i.
e i = nmero de valores esperados en el intervalo de clase i.
k = nmero de intervalos de clase.
Asignado probabilidades a la ecuacin (1) es decir, asignando igual probabilidad
de ocurrencia a cada intervalo de clase, se tiene:
N iN Pi
X c 2=
i=1
Donde:
N = tamao muestral
. (3)
k
2
X c = N i N . ( 4)
N i=1
2
E valor
Xc
Xt
de las
X c 2 X t2 ,
Entonces se acepta la hiptesis de que el ajuste es bueno al nivel de
significacin seleccionado.
Si el chi-cuadrado calculado es mayor que el valor tabular, es decir:
Xc > Xt
P( o) =
..(6)
Tambin:
P( < o) = 1
(7)
P(x)=
M
N +1
(8)
Donde:
M= nmero de orden.
N= nmero de datos.
Existen varias frmulas para calcular la probabilidad experimental, la misma que se muestra en la
tabla 1, siendo la ms utilizada la frmula de Weibull.
2 Calcular la probabilidad terica F(x)
2.1. Para el caso de utilizar el procedimiento de los modelos tericos, Usar la ecuacin de la
Funcin acumulada F(x), o tablas elaboradas por tal fin.
2.2. Si se quiere aplicar el procedimiento grfico, se utiliza un papel probabilstico especial
donde F(x), puede representarse como una lnea recta, por lo cual, se puede trazar con
solo 2 puntos, pero si se quiere chequear que es una recta, se puede plotear 3 puntos, por
ejemplo para el caso de una distribucin normal, los puntos:
Metodo
California
Probabilidad
experimental
P
m
n
Hazen
m-1/2
n
Weibull
Chegada
yev
n+1
m - 0.3
n + 0.4
Bom
m-3/8
n + 1/4
Tukey
3m - 1
3n + 4
Gringorte
n
m-a
n + 1 2a
Donde :
p = probabilidad experimental o frecuencia relativa empirica.
m= numero de orden
n= numero de datos
n= valor comprendido en el intervalo 0 < a < 1, y depende de n, de acuerdo a la siguiente tabla:
n
a
n
a
10
0.448
60
0.440
20
0.443
70
0.440
30
0.442
80
0.440
Valor
40
0.441
90
0.439
50
0.440
100
0.439
Probabilidad
%
50
X + S
X
-S
84.13
15.87
TAMAO
MUESTRA
L
N
5
10
15
20
25
30
35
40
45
0.20
0.45
0.32
0.27
0.23
0.21
0.19
0.18
0.17
0.16
0.10
0-51
0.37
0.30
0.26
0.24
0.22
0.20
0.19
0-18
0.05
0.56
0.41
0.34
0.29
0.27
0.24
0.23
O.21
0.20
0.01
0.67
0.49
0.40
0.36
0.32
0.29
0.27
0.25
0.24
50
N >50
0.15
1.07
0.17
1.22
0.19
1.36
0.23
1.63
NIVESLES SIGNIFICACION
6 Comparar el valor del estadstico , con el valor critico o de la tabla 2, con los siguientes
criterios de decisiones deducidos de la ecuacin (6)
Si < o el ajuste es bueno, a nivel de significacin seleccionado
0 el ajuste no es bueno, al nivel de significacin seleccionado.
VENTAJAS Y LIMITACIONES
a. No requiere un conocimiento a priori de la funcin de la distribucin terica.
b. Es aplicable a distribuciones de datos no agrupados, es decir no se requiere hacer
intervalos de clase.
c. Es aplicable a cualquier distribucin terica.
d. Se aplica en la funcin de distribucin acumulada y no en la funcin de densidad.
e. Comparndola con la prueba chi- cuadrado, no hay condicin de que cada clase de
f.
VI
DISTRIBUCIONES TEORICAS
Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel
FUNCION DENSIDAD
La funcin densidad de la distribucin normal es:
1
f(x) = 2 s
1 x X 2
EXP [- 2 ( s ) ..(1)
seleccion
de una
distribucin
REGISTRO DE
DATOS
ELEGIR UNA
DISTRIBUCIO
N TEORICA
ESTIMACION
DE
PARAMETROS
PRUEBA DE
BONDAD DE
AJUSTE
AJUSTE
BUENO
UTILIZAR
DISTRIBUCIO
N TEORICA
ELEGIDA
FIN
F( ) = 0
F(
F( + ) = 1
X )
= 0.5
..(10)
Donde:
F(Z) = es la funcin de distribucin acumulada
f(Z) = es la funcin densidad de la variable estandarizada
V
1+0 .33267Z
1
V=
(11)
b)
Masting (1955), ha dado una aproximacin polinomial que ha sido utilizado por la IBM (1968).
F(Z)
..(12)
Donde:
W es definido para Z 0, como:
1+0.2316419Z
1
W=
(13)
b4 = -0.356563782
b2 = 1.781477937
b5 = - 1.821255978
b3 = 1.330274429
En ambas aproximaciones la F.D.A. es 1- F(Z), si Z<0
4. ESTIMACION DE PARAMETROS
Para estimar los parmetros de distribucin terica se puede usar el mtodo de momentos o el
mtodo de mxima vesimilitud.
Cabe mencionar que la distribucin normal, es la nica funcin de distribucin, que produce los
mismos resultados de los parmetros, estimados por el mtodo de los momentos y mxima
verosimilitud, los parmetros obtenidos son los siguientes:
N
S=
= [
1
X
N i=1 i
Xi
N
1
N 1 i=1
)2]1/2
..(14)
Donde:
X
S=
5. APLICACIONES EN HIDROLOGIA
L a distribucin normal tiene gran utilidad en hidrologa, siendo alguna de sus principales
aplicaciones:
emprica.
Para hacer procesos de inferencia estadstica.
Para generacin de datos por el mtodo de Monte Carlos. El inconveniente en la generacin
de datos es que se obtienen valores negativos, lo cual fsicamente no es justificado.
6. AJUSTE
El ajuste puede realizarse grficamente utilizando papel probabilstico normal o analticamente,
mediante los estadsticos chi-cuadrado o Smirnov Kolmogorov.