Professional Documents
Culture Documents
CONCEPTOS BASICOS
1. Introduccin.
La estadstica es la ciencia dedicada a la recoleccin, presentacin y
caracterizacin de la informacin con el objeto de analizar y tomar decisiones. La
estadstica se utiliza en diferentes especialidades de la ciencia como Minera,
Geologa, Agronoma, Economa, Ambiental, etc.
1.1. Individuo.- Cualquier elemento que porte informacin sobre el fenmeno que
se estudia. Por ejemplo, si estudiamos la estatura de los alumnos de una
clase, cada alumno es un individuo; si estudiamos el precio de la vivienda,
cada vivienda es un individuo. El individuo constituye una unidad elemental.
1.2. Poblacin.- Conjunto de todos los individuos (personas, objetos, animales,
etc.) que porten informacin sobre el fenmeno que se estudia.
Ejemplos:
1. El conjunto de todos los alumnos de la UNASAM.
2. El conjunto de todas las personas que viven en el distrito de Huaraz.
3. El conjunto de la estatura de todos los alumnos de la FIMGM.
1.3. Muestra.- Es un subconjunto que seleccionamos de la poblacin. As, si se
estudia el precio de la vivienda de una ciudad, lo normal ser no recoger
informacin sobre todas las viviendas de la ciudad (porque sera una labor
muy compleja), sino que se suele seleccionar un subgrupo (muestra) que sea
lo suficientemente representativo.
Al proceso de obtencin de una muestra se llama muestreo. Para que una
muestra sea representativa debe cumplir con las siguientes condiciones:
a. Debe haber sido obtenido al azar o en forma aleatoria.
b. Su tamao y sus elementos deben haber sido seleccionados aplicando un
mtodo de muestreo.
1.4. Variable.
Son las caractersticas que se desean evaluar en las unidades elementales.
Ejemplos:
1. X = Talla de los alumnos de una Universidad.
2. Y = Numero de cocinas vendidas al mes.
3. Z = Nivel de ingreso mensual de los trabajadores de la UNASAM.
4. W = Sexo de los alumnos.
Se representa generalmente por las ltimas letras maysculas del alfabeto,
por ejemplo: X, Y, Z, W, P, T o tambin X1, X2, X3,.. etc.
1.5. Tipos de Variables.
1.5.1. Variables Cuantitativas.
Son aquellas cuyas observaciones pueden expresarse en forma
numrica y con las cuales se puede realizar operaciones matemticas.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Numero de inasistencias en el mes.
Adems las variables cuantitativas se pueden clasificar en:
1. Variable cuantitativa contina.
Son aquellas que pueden asumir cualquier valor numrico dentro
de un intervalo continuo dado. Generalmente son representados
por el conjunto de nmeros reales. Las observaciones cuantitativas
continuas se obtienen utilizando instrumentos de medicin como:
test, escalas, balanzas, cronmetros, winchas, termmetros, etc.
Ejemplo:
1. X = Estatura de los alumnos en cm.
2. Y = Velocidad de los vehculos en Km/hora.
2. Variable cuantitativa discreta.
Son aquellos observaciones que cumplen la condicin de que entre
un valor cualquiera y su consecutivo no es posible que existan
valores intermedios. Generalmente son representados por el
conjunto de nmeros enteros. Las observaciones cuantitativas
discretas se registran por conteo.
Ejemplo:
1. X = Nmero de clientes atendidos cada 5 minutos en una
ventanilla.
2. Y = Numero de inasistencias en el mes en das.
CAPITULO II
ORGANIZACIN DE DATOS.
2. Introduccin.
Despus de recoger toda la informacin correspondiente a la investigacin,
mediante una encuesta, es decir, una vez terminado el trabajo de campo, nos
encontramos con un conjunto de datos y cifras desordenadas los cuales, al ser
tomados como observaciones individuales, dicen muy poco sobre la poblacin
estudiada; es entonces, la tarea del investigador hacer hablar las cifras,
comenzando por la clasificacin y ordenacin, consignando la informacin en
tablas inteligibles a la que denominamos tabla o distribuciones de frecuencias.
2.1. Tablas de Frecuencias.
Son cuadros estadsticos que contienen los valores observados x1, x2, x3,
x4,.xk de la variable X (distribucin) con sus respectivas frecuencias
(distribucin de frecuencias). Dependiendo de la naturaleza de la variable en
estudio las tablas reciben el nombre de distribucin numrica o cuantitativa y
distribucin categrica o cualitativa. Son tiles porque permiten organizar la
informacin (datos no procesados) de forma tal, que se puede reconocer el
comportamiento de los datos. En el caso de la variable cuantitativa continua
presentan el inconveniente de una perdida de informacin, la cual es muy
pequea en relacin a las ventajas que proporciona.
Ejemplo:
El Gerente-propietario recoge la informacin respecto a la variable salario
diario de sus 50 operarios y la relaciona en la tabla No 1.
Tabla N 01
SALARIO DIARIO DE 50 OPERARIOS EN UNA FABRICA DE CONFECCIONES
N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia N Operario $/Dia
1 52 11 54 21 55 31 56 41 52
2 54 12 51 22 55 32 53 42 57
3 55 13 54 23 52 33 57 43 56
4 54 14 55 24 55 34 54 44 51
5 53 15 54 25 53 35 53 45 58
6 56 16 56 26 57 36 50 46 55
7 54 17 52 27 54 37 55 47 53
8 58 18 54 28 55 38 52 48 54
9 51 19 53 29 53 39 53 49 53
10 54 20 55 30 55 40 54 50 56
Tabla N 02
Tabla N 04
DISTRIBUCION DE FRECUENCIAS DEL
SALARIO DE 50 OPERARIOS
$/Dia CONTEO FRECUENCIA
50 l 1
51 lll 3
52 lllll 5
53 lllll llll 9
54 lllll lllll ll 12
55 lllll lllll 10
56 lllll 5
57 lll 3
58 ll 2
SUMA 50
Como se puede observar, hay una gran diferencia entre los datos brutos de la tabla No.1 y
el ordenamiento y agrupamiento de la tabla No. 4.
Con el fin de obtener una mejor tabla interpretativa, introduciremos la siguiente simbologa:
N: El tamao de la muestra, es el nmero de observaciones.
Xi : La variable; es cada uno de los diferentes valores que se han observado.
La variable xi, toma los x1, x2... xn valores.
fi: La frecuencia absoluta o simplemente frecuencia, es el nmero de veces que se
repite la variable Xi; as f1, es el nmero de veces que se repite la observacin x1, f2 el
nmero de veces que se repite la observacin x2, etc.
fa: La frecuencia acumulada, se obtiene acumulando la frecuencia absoluta.
fr: Frecuencia relativa; es el resultado de dividir c/u de las frecuencias absolutas por
el tamao de la muestra.
fra: Frecuencia relativa acumulada; se obtiene dividiendo la frecuencia acumulada entre
el tamao de la muestra.
Tabla N 05
Tabla de Distribucin de Frecuencias.
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa Acum.
Xi fi fa fr fra
x1 f1 f1 f1/n f1/n
x2 f2 f1+f2 f2/n (f1+f2)/n
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
xi fi f1+f2+..fi fi/n (f1+f2+ +fi)/n
. . . . .
. . . . .
xn fn fi+f2+..fn fn/n (f1+f2+ +fn)/n
n 1
Tabla N 06
Tabla de Distribucin de Frecuencia del Salario Diario de 50 Operarios
Frecuencia Frecuencia Frecuencia
Variable Frecuencia Acumulada Relativa Relativa
Xi fi fa fr Acum.
50 1 1 0.02 0.02
51 3 4 0.06 0.08
52 5 9 0.10 0.18
53 9 18 0.18 0.36
54 12 30 0.24 0.60
55 10 40 0.20 0.80
56 5 45 0.10 0.90
57 3 48 0.06 0.96
58 2 50 0.04 1.00
50 1.00
Anlisis:
Analizando las columnas porcentuales fr y fra se obtienen, entre otras las
siguientes conclusiones:
Slo el 4% de las obreras gana el mximo salario/da de la fbrica, el
cual corresponde a $58.000.00.
El salario diario mnimo ($50.000.00) lo gana nicamente una obrera,
lo que constituye el 2% del personal asalariado.
El 62% de las operarias tiene un salario diario entre $53.000.00 y
$55.000.00.
El 60% de las obreras tiene un salario/da de $54.000.00 o menos.
El 64% tiene un ingreso/da de $54.000.00 o ms.
2.2.
CAPITULO III
MEDIDAS DE POSICION
Ejemplos:
EVENTOS
Son los resultados posibles que se puedan presentar en la realizacin de un
experimento.
Ejemplos:
Ejemplos:
1. P() = 0
2. P ( ) = 1 P(A), donde es el complemento de A.
( ) = () + () ( ) (2)
PROBABILIDAD CONDICIONAL
( )
(/) = . (3)
()
Es una funcin X, definida sobre un espacio muestral S, que asigna un valor a esta
variable, correspondiente a cada punto (resultado) del espacio muestral de un
experimento
Se dice que una variable aleatoria X es discreta. Cuando sus valores se restringen
a un conjunto enumerable finito o infinito.
Representacin Grafica
Nmero de das
E F M A D Meses
Se dice que una variable aleatoria X es continua cuando sus valores se encuentran
en un rango continuo y puede ser representado por cualquier nmero entero o
decimal.
1 2 3 4 5 6 . 31 das
Curva B
Curva A
Curva C
Curva B
Curva A
Curva A
Curva B
Curva B
Curva A (Mesocrtica)
Curva B (Leptocrtica)
Curva C (Platicrtica)
Donde:
: media poblacional
: Media muestral
= =1 (3)
Donde:
Donde:
: Media ponderada
Dnde:
: Notas promedio
n: nmero de notas
Donde:
: Media geomtrica
2.2.4 Mediana
Es un valor nico de un conjunto de datos que mide al elemento central en los datos.
Donde:
2.2.5 Moda
Para datos agrupados en intervalos de clase, la moda, una vez determinada la clase
modal se calcula con la siguiente ecuacin:
1
= + 1+2 (9)
Donde:
di: diferencia entre la frecuencia de la clase modal y la premodal (clase
anterior)
Si la distribucin es simtrica (fig. a), las tres medidas de tendencia central tienen
valores idnticos.
Si la distribucin es asimtrica (fig. b y c), los tres valores divergen, aunque siempre
para una distribucin unimodal, la moda est localizada en su punto ms alto y la
mediana esta ente la media y la moda.
Media
median
moda
a moda median
a Media
(a) (c)
median
a moda
Media
(c)
2.3.1 Rango
Donde:
R: rango
2.3.2 Varianza
Datos no agrupados:
( )2 = ( 2 2 . + 2 )
2 2 () + 2 (13)
Pero:
= = (14)
( )2 = 2 2 () + 2
( )2 = 2 2 (15)
Y en (12) resulta:
1
2 = 1 (=1 2 2 ) (17)
Donde:
2= varianza poblacional
Datos agrupados
2
=1() .
2 = (18)
2
=1( ) .
2 = (19)
1
Donde:
=: media
1
2 = 1 (=1 2 . 2 ) (21)
= 2 (Poblacional)
= 2 (Muestral)
1
= (=1 2 2 ) (22)
1
= 1 (=1 2 2 ) (23)
Siendo:
1
= = =1 (24)
1
= (=1 2 . 2 ) (25)
1
= 1 (=1 2 . 2 ) (26)
Siendo:
1
= = =1 . (27)
= : Media
2.4.1 sesgo
Datos no agrupados:
Donde:
=1()
3
3 = (30)
1
= (( )2 )
=1
1
=
=1
Donde:
=1( )
3
3 = (32)
1
= ( )2
1
=1
1
=
=1
Datos agrupados:
Donde:
3
=1()
3 = . (33)
1
= ( )2
=1
1
= =1
Donde:
3
=1( )
M3 = (35)
1
= ( )2
1
=1
1
= =1
2.5.1 Curtosis
Datos no agrupados:
K = .. (36)
4
=1()
3 = . (37)
1
= ( )2
1
=1
1
= =1
=1( )
4
M4 = (39)
1
= ( )2
1
=1
1
= =1
Datos agrupados
Donde
4
=1()
4= ........ (40)
1
= ( )2
=1
1
= =1
Donde
4
=1( )
M4 = (42)
1
= ( )2
1
=1
1
= =1
Los clculos de los estadsticos de una serie de datos es por si laboriosa. Para la
simplificacin de los clculos, donde se requieren la determinacin de la media,
varianza, desviacin estndar, el coeficiente de variacin, coeficiente de variacin,
coeficiente de sesgo y coeficiente de curtosis.
AO PRECIPITACION AO PRECIPITACION
(mm) (mm)
1974 1418.60 1981 1441.50
1975 1527.30 1982 1133.20
1976 1108.60 1983 891.00
1977 1084.20 1984 1429.80
1978 1509.10 1985 1141.50
1979 1394.90 1986 1312.60
1980 1334.40
Solucin:
SERIE
Numero de datos = 13
RESULTADOS
AO Q m3/seg AO Q m3/seg
1971 3.99 1981 5.52
1972 2.96 1982 3.09
1973 1.79 1983 5.00
1974 1.55 1984 6.03
1975 2.48 1985 2.73
1976 2.61 1986 3.13
1977 2.27 1987 4.18
1978 1.86 1988 3.26
1979 2.07 1989 4.03
1980 2.70
Calcular la media, varianza, coeficiente de variacin, coeficiente de asimetra o
sesgo y coeficiente de curtosis.
INTERVALOS DE MARCA DE
CLASE CLASE
1- 2 1.5
2 -3 2.5
3 -4 3.5
4 -5 4.5
56 5.5
6 -7 6.5
ESTACION 1 2 3 4 5 6 7 8
AREA Km2 150 300 187 600 550 145 278 110
PRECIPITACION 2915 2563 3241 4017 5321 4621 5002 4932
3.1.1 DEFINICIONES
Por lo general, se encuentra solo con una muestra de los datos de esa poblacin,
es decir nunca podemos disponer de la totalidad de los datos. Pero cuando estos
datos se organizan en forma compacta y fcil de utilizar, los gelogos pueden
disponer de una herramienta de gran utilidad, para tomar decisiones.
Existen muchas formas de clasificar los datos, una manera til es dividirlo en
categoras similares o clases y luego contar el nmero de observaciones que caen
en cada categora, lo que constituye una tabla de frecuencias o una distribucin de
frecuencias.
Para una muestra dada, se escoge un rango R, que contenga a todos los valores
de la misma. Se subdivide R en subintervalos que se llaman intervalos de clase; los
puntos medios de estos intervalos se denominan marcas de clase. Se dice que los
valores de la muestra en cada uno de los intervalos forma una clase. Al nmero de
valores en una clase se llama frecuencia de clase; su divisin en el tamao N de la
muestra es la frecuencia relativa de clase. Esta frecuencia considera como funcin
de las marcas de clase; se denomina funcin de frecuencias de la muestra, y se
denota con f(x). La funcin de frecuencias acumuladas de la muestra, se denota
como F(x), y se define como:
F(x) = () . (1)
Procedimiento
Si 30 < N < 75 8 NC 10
Si N > 75 10 < NC 30
Donde:
N : tamao de la muestra
max
x = = 1 . ( 4)
1
1
Fri = =1 = =1 = =1 . ( 10 )
Donde:
Fri: frecuencia relativa acumulada hasta el intervalo i.
J: 1, 2,..,i acumulacin de los intervalos hasta i
10. Calcular la funcin densidad emprica fi para cada intervalo. Esta funcin
segn Yevjevich, se calcula usando la frmula:
lim = = .. (11)
0
= =1 (12)
Tabla 3.1 Serie histrica de caudales medios anuales en m3/s del rio
Chicama. Estacin Salinar (1911-1980).
AO CAUDAL AO CAUDAL AO CAUDAL
M3/S M3/S M3/S
1911 7.91 1935 24.58 1959 22.88
1912 8.01 1936 28.49 1960 17.57
1913 13.27 1937 10.05 1961 14.60
1914 16.39 1938 28.01 1962 31.14
1915 80.83 1939 34.92 1963 18.20
1916 60.08 1940 31.36 1964 24.69
1917 21.55 1941 42.74 1965 22.99
1918 27.71 1942 12.94 1966 11.78
1919 28.63 1943 41.16 1967 32.26
1920 30.27 1944 35.90 1968 4.76
1921 33.43 1945 33.76 1969 12.70
1922 35.16 1946 29.28 19970 16.19
1923 27.21 1947 19.17 1971 30.14
1924 15.58 1948 29.37 1972 30.57
1925 64.81 1949 30.06 1973 45.38
1926 51.26 1950 9.67 1974 18.91
1927 33.48 1951 10.42 1975 34.99
1928 25.79 1952 23.99 1976 21.49
1929 25.80 1953 42.17 1977 29.26
1930 18.93 1954 16.00 1978 4.58
1931 16.15 1955 22.78 1979 12.46
1932 38.30 1956 32.69 1980 3.14
1933 54.54 1957 34.28
1934 59.40 1958 20.24
1 2
() = 12[()]
2
Donde:
= parmetro de localizacin
2 = parmetro de escala
Para que la funcin f(x), quede definida, debe calcularse los parmetros y 2 .
Como normalmente, no se conocen todos los valores de la variable aleatoria, la
estimacin de los parmetros, se realiza a partir de una muestra.
=1
= =
2
=1( )2
2
= =
Donde:
: Es el estimador de la
: Es el estimador de 2.
La bondad de estos estimadores est dado por diferencias (-a), (-b), (-c), etc.
pero como es fcil intuir hay infinitas posibilidades para a, b, c por lo tanto se
consideran como mejores estimadores aquellos que se aproximan ms a los
valores poblacionales y se llaman , , ,
Sesgado si:
E(a)=
Insesgado si:
E(a)= + v ()
Eficiente si:
VAR(a) =E (a-)2
Consistente si:
Grafico
Mnimo cuadrado
Momentos
Mxima verosimilitud
As:
Por ejemplo para determinar los estimadores de y por medio de una muestra
dada correspondiente a una poblacin normal, hacer lo siguiente:
2. Dibujar una muestra k se aproxime a los puntos, tanto como sea posible.
4. Calcular el
valor para una posibilidad del 84.13% el mismo k corresponde a +S, es decir.
+ = 2 = 2
es un estimador de .
Y = a + bX
= 2 = ( )2
=1 =1
= 2 =1( ) = 0 (1)
= 2 =1 ( ) = 0 (2)
Las ecuaciones (1) y (2) se denominan ecuaciones normales, las cuales resueltas
dan para a y b.
( )( )
= 2 =
( ) ( )2
2
= =
4.2.3 MOMENTOS DE LOS MOMENTOS
= 1 ( , +1 , )
= 2 ( , +1 , ) (3)
= 3 ( , +1 , )
Donde:
Ejemplos:
Solucin:
Sabemos que:
1 2
= 12[(1 )2 ]
22
(6)
Haciendo:
1
= = 1 + 2 = 2 + (7)
2
Lmites: si x - y -
x + y +
Sustituyendo (7) en (6), se tiene:
1 2 2
=
22
(1 + 2 ) 2
1 2 2 2 (2 )2 2 2
= +
22 22
1 2 2 2 2 2
=
2
+
22
(8)
Calculo de:
2 2 2 2 2 2
= = + 0 (9)
2
Siendo () = 12()
2 2
() = 12() = 12 = f(y)
Dado que f(-y) =f(y), f(y) es una funcin par, por lo cual se tiene:
0
() = 0 ()
Haciendo
2 = = 12
2 = = = 2 12
2
Limites:
Para y = 0 t =0
y t
1
Pero (2) = (propiedad de la funcin gamma)
= 1
2
= 2 . (11)
Calculo de B
2
= 12
0 2 2
= 12 + 0 12 . (12)
1 2
Donde () = 2
1 1 2
()2
() = () 2 = () 2 = ()
B=0 (13)
Como = 2
1 2
2 = 2 = ( 1 )2 12[(1 )2 ]
22
Haciendo:
1
= = 1 + 2 = 2
2
Lmites: si x - y -
x + y
Luego:
1 2
2 = 2 2 2 1/2 2
22
2
2 2
2
= 2 1/2
22
2
Siendo f(Y)= 2 1/2 y f(-y)=f(y) (funcin par), por lo cual
() = 2 ()
Luego:
2
2 2
2
= 2 1/2
2 0
Haciendo:
2 = = 1/2 = 2 1/2
Limites.
Para y = 0 t =0
y t
Se tiene:
22 2
2
= 12
2 0 2 12
2 2
2
= 1/2 12
2 0
2
2 2
= .
2 (1/2)1/2
2 2
2 = . 2
2
2 = 2 2 ( el parmetro 2 es igual )
1
2 = 2 2 = ( )2
1
1
2 = ( )2
1
2. Dada la funcin densidad de la distribucin Poisson:
Para x= 0, 1, 2,
!
f(x)=
0 En otro caso
El parmetro
La varianza
Solucin:
= () = ()
=
=0
=
( 1)
=0
0
= +
=1 (1)
(1)
Pero:
0
= r(0) = =0
(1)
Luego:
=
( 1)
=1
1 2 3
= .( + + + )
0 1 2
2 3
= . (1 + + + )
1 2
Pero:
2 3
(1 + + + ) = (Por desarrollo de serie de Taylor)
1 2
Entonces:
Falta 88 y 89
4.2.4. METODO DE MAXIMA VEROSIMILITUD
Dada una funcin densidad de probabilidad.
(, , , , . )
Donde:
, , , . Son los parmetros que deben ser estimados.
Se define la funcin verosimilitud de la muestra, como la productoria:
L = f( , , , , )
=1
L = f( , , , , . ) (2 , , , , . ) . . ( , , , , . )
L = f( , , , , ) = ln f( , , , , )
=1 =1
a, b, c son estimadores de , , g,
= 0; =0; = 0 ;
Usualmente insesgado.
Si la eficiencia de estimadores existe para los parmetros , , g,, el
mtodo puede producirlos.
La solucin de la ecuacin de verosimilitud proporciona un estimador que
converge al valor poblacional cuando el tamao muestral tiende a infinito,
por lo que el estimador es consistente.
Ejemplos:
Solucin:
L = f( , )
=1
Siendo: f( , ) =
Luego:
L =
=1
= ln( )
=1
= ln( + )
=1
= ln( )
=1
= = [ ln( )] = 0
=1
1
( ) = 0
=1
1
= 0
=1 =1
1
=
=1
1 1
=
=1
1 1
= 1 =
=1
X
2. Dada la funcin densidad de la distribucin normal
1 1 [ / ]2
() = 2 1 2 < <
2 2
N
1 1 [ / ]2
L= 2 1 2
=1
2 2
2. Tomando ln:
1 1 [ / ]2
= ln( ) 2 1 2
=1
2 2
1 1 2
= ln (2 2 ) ( )
2 2
=1
1
= [ln(2 1 2 ) ()2 ]
2
=1
1 1 1
a) = =1 [ 2 2( )( )] = 0
2 2
1
=0
2
=1
1
( 1 ) = 0
2 2 =1
1 = 0
=1 =1
= 1
=1 =1
= 1
=1
1
1 = = X
=1
1 1
b) = =1 [ 2 ( 1 )2 (22 3)] = 0
2
1 ( 1 )2
[ + ]=0
=1
2 2 3
1 ( 1 )2
[1 + ]=0
2
=1
2 3
( 1 )2
(1) + =0
=1 =1
2 3
1
( 1 )2 =
2 2 =1
1 ( 1 )2
= 2 2
=1
1
2 2 = ( 1 )2 = 2
=1
1
() =
() = > 0, >0
() = { ! = 0, 1, 2,
0
() = () > , >0
() = () > , >0
Las pruebas estadsticas, tienen por objeto medir la certidumbre que se obtiene al
hacer una hiptesis estadstica sobre una poblacin, es decir calificar el hecho de
suponer que una variable aleatoria se distribuya segn una cierta funcin de
probabilidades.
Ajuste grafico
chi cuadrado
Ajuste estadistico {
Smirnov Kolmogorov
= =
= =
2
=Valor calculado de chi-cuadrado, a partir de los datos.
=Nmero de valores observados en el intervalo de clase i.
=Nmero de valores esperados en el intervalo de clase i.
=Nmero de intervalos de clase.
Asignado probabilidades a la ecuacin (1) es decir, asignando igual
probabilidad de ocurrencia a cada intervalo de clase, se tiene:
2 ( )2
= (2)
=1
Donde:
= Nmero de observaciones que caen dentro de los lmites de clases
ajustadas del intervalo i.
= Tamao muestral
= Probabilidad igual para todos los intervalos de clases.
i
Pi = k o ei = NPi . (3)
VENTAJAS Y LIMITACIONES
1. Es aplicable solo para ajustes a la distribucin normal, puesto que ha sido
desarrollado en base a datos normales e independientes.
2. Es realizado en la funcin densidad de datos agrupados en intervalos de
clases.
3. Requiere un conocimiento a priori de la funcin de distribucin terica
utilizada en el ajuste.
4. En la prctica se usa para cualquier modelo de ajust, pero estrictamente es
vlido solo para la normal.
5. Es de fcil aplicacin
6. Al utilizar esta prueba, se debe tener cuidado que en cada intervalo de clase,
se tenga por lo menos 5 observaciones.
Donde:
P( o) = (6)
Tambin:
P( < o) = 1 (7)
5.4 PROCEDIMIENTO.
Dnde:
M = Nmero de orden.
N = Nmero de datos
Mtodo Probabilidad
experimental
P
m
California n
m-1/2
Hazen n
m
Weibull n+1
m - 0.3
Chegadayev n + 0.4
m-3/8
Bom n+
3m 1
Tukey 3n + 4
ma
Gringorten n + 1 2a
Dnde:
P = Probabilidad experimental o frecuencia relativa emprica.
m = Numero de orden
n = Numero de datos
a = Valor comprendido en el intervalo 0 < a < 1, y depende de n, de
acuerdo a la siguiente tabla:
n 10 20 30 40 50
a 0.448 0.443 0.442 0.441 0.440
n 60 70 80 90 100
a 0.440 0.440 0.440 0.439 0.439
Probabilidad
Valor %
50
+ S
84.13
- S
15.87
Representados en un papel de probabilidad normal, forman una recta.
Distribucin normal
Distribucin log-normal de 2 o 3 parmetros
Distribucin de gamma de 2 o 3 parmetros
Distribucin Gumbel
1. FUNCION DENSIDAD
2
1
1 [ ]
() = 2 (2)
2
Seleccion de una
distribucin
REGISTRO DE DATOS
ELEGIR UNA
DISTRIBUCION
TEORICA
ESTIMACION DE
PARAMETROS
PRUEBA DE
BONDAD DE
AJUSTE
F V
AJUSTE
BUENO
FIN
Donde:
x = variable independiente.
X----- N(, 2 )
Existen tablas, por ejemplo las tablas 1 y 2 del apndice que permite calcular F(Z).
Donde:
V = +.|| ..(11)
Donde:
1
W = 1+0.2316419|| (13)
Siendo las constantes:
b1 = 0.319381530 b4 = -0.356563782
b2 = 1.781477937 b5 = - 1.821255978
b3 = 1.330274429
4. ESTIMACION DE PARAMETROS
1
= =
=1 X i
1
S = =[1 2 1/2
=1( - ) ] ..(14)
Donde:
5. APLICACIONES EN HIDROLOGIA
6. AJUSTE
1. FUNCION DENSIDAD
La funcin de distribucin de Y, es:
1 2
1 ( )
() = 2
.... (15)
2
( , 2 )
() = ()
Donde:
1
= ln =
( , 2 )
Si =
2
1
() = 2 dZ ... (18)
2
(0,1)
2
Media: = () = ( + )
2
2 1
Desv. Est : = ( + )(EXP( 2 ) 1) 2
2
1
Coeficiente de variacin: = = (EXP( 2 ) 1) 2
De donde:
2 = ln(1 + 2 ) . (19)
1
= 2 + ln
2
1 2
= 2 ln( 2 ) . (20)
+1
Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (21)
2 2
Para valores prcticos de 2 : 0.1 < 2 < 0.6, la relacin es casi lineal y puede
ser aproximado por:
= ln( 0 ) ( , 2 )
0 <
Coeficiente de sesgo:
3 2 1 2
Cs= g = 3 = ( 1) 2 ( + 2) . (26)
2 2
Donde:
( )3
3 = . (29)
( )2
S= . (30)
1
= . (31)
Luego:
0.52
De (27): = . (32)
4.85
1 2
De (25): = 2 (ln ( 2
) 2 ) . (33)
1
2
De (24): 0 = + 2 . (34)
6.2.2 EJEMPLO
3
Dada la serie histrica de caudales medio anuales, en . que corresponde a
un registro de 50 aos para el rio Santa (Per):
SOLUCION:
1
( = ) = ( ) = 1
1
( = ) = 1
75
( = ) = 0.9866666 = ()
De donde:
= 2.2150.2808+4.9861
3
= 272.618
1. FUNCIN DENSIDAD
1 /
() =
()
para:
siendo:
= (+)
() = , :
() = 0 1 / que converge si > 0
La funcin gamma tiene las siguientes propiedades:
() = ( 1)! para = 1, 2, 3,
(1) = (2) = 1
(1/2) =
(0) =
2 1 1 1 1
() = [1 + + +]
12 288 2 51840 3 2488320 4
2. FUNCIN ACUMULADA
1 /
() = 0 (44)
()
1
() = (47)
()
las funciones reducidas contienen el parmetro , por lo cual cada valor positivo
de determina una funcin diferente. Un extracto de las tablas de Wik,
Gnanadesikan Huyett (1962), para las variables aleatorias reducidas Gamma, se
muestra en la tabla 1.
() = = = = =
media: = () = (49)
varianza: 2 = 2 (50)
2
coeficiente de sesgo: = = 1/2 (51)
2
De las ecs. (49) y (50), se tiene: = (52)
2
2
De las ecs. (49) y (52), resulta: = 2 (53)
Thom (1958), estableci que para < 10, el mtodo de momentos produce una
estimacin inaceptable de los parmetros y . Para cerca de 1 el mtodo de
momentos usa solamente el 50% de la informacin de la muestra para estimar y
solamente el 40% para estimar .
para: 0 0.5772
y para:
8.898919+9.05995+0.97753732
= (55)
(17.79728+11.968477+ 2 )
donde:
= (56)
siendo:
= (57)
1. FUNCIN DENSIDAD
( )1 ( )/
() = (58)
()
para:
<
<
0<
0<
2. FUNCIN ACUMULADA
( )1 ( )/
() = (59)
()
en la cual:
: parmetro de escala
: parmetro de forma
media: = + (62)
varianza: 2 = 2 (63)
2
sesgo: = = (64)
de donde:
4
= 2 (65)
= /2 (66)
= 2/ (67)
4. APLICACIN EN HIDROLOGA
Su uso en hidrologa est casi tan difundido como el uso de la distribucin log-
normal de 3 parmetros, con la desventaja de la mayor complicacin al estimar
sus parmetros y calcular los valores de la funcin de distribucin acumulada.
6.3.3. EJEMPLO
SOLUCIN:
= 157.05
ln = 4.90
2 = 6450.21
= 80.31
=
ln = ln 157.05 4.9 = 0.15656
como: = 0.15656 < 0.5772, se utiliza la ec. (54), para el clculo de , es decir:
6.4DISTRIBUCION GUNBEL
1. FUNCION ACUMULADA
()
F(x) =
................................................................... (69)
Dnde:
2. FUNCION DENCIDAD
1 ()/
f(x) = ()/ .. (71)
Para:
-< x <
F(x) = G (Y)
Y la relacin es:
x
Y= x = + Y ..
(75)
-Moda xmoda =
-Media E(x) = = +C
lim 1 1 1
C = n [1 + + + + ln n]
2 3
C = 0.5772156649
Por lo tanto:
= +0.57721 . (76)
2 2
Varianza: E[(x E(x))2] = S2 = (77)
6
De donde se obtiene:
6
= S = 0.78 S .. (78)
4. APLICACIN EN HIDROLOGIA
La ley de Gunbel o ley de valores extremos, sed utiliza generalmente para ajustar,
a una expresin matemtica, las distribuciones empricas de frecuencia de
caudales mximos anuales, precipitaciones mximas, etc.
5. EJEMPLO
Se tiene el registro de caudales mximos de 29 aos, para la estacin 9- 3
Angostura, como se muestra en la tabla.
SOLUCION:
1.1Para crear el archivo con la serie de datos, se usa el programa del listado 6.
Media: = 957.59
El programa calcula estos parmetros utilizando las ec. (778) y (79) obteniendo:
= 0.1454
Decisin
Se concluye que los datos se ajustan a una distribucin Gunbel, con un nivel de
significacin del 5%.
1
F(Q = q) = 1 - 50
-ey = ln0.98
ey = 0.020202707
-y = ln(0.020202707)
Y= 3.9019
Q = + 3.9019 x
Q =2,727.38 m3/s.