You are on page 1of 11

Universidad Nacional Agraria La Molina

Facultad de Ingeniera Agrcola


DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
1 15/09/10

CLASE IV

ANLISIS DE CONSISTENCIA DE DATOS METEOROLGICOS E HIDROMTRICOS

1. Anlisis de Consistencia tpica

Una serie de datos es llamada consistente o homognea si es una muestra de una nica
poblacin. Si la serie no es homognea, se le debe hacer ajustes o correcciones para volverla
homognea, de manera que las estimaciones estadsticas muestrales sean vlidas
estimaciones de los parmetros poblacionales.

Tipo de pruebas estadsticas de homogeneidad

El test o prueba estadstica de homogeneidad, presenta una hiptesis nula y una regla para
aceptarla o rechazarla en base a su probabilidad de ocurrencia. Si dicha probabilidad es
pequea ser concluir que la serie no es homognea, si es grande la decisin es que es
homognea.

1.1. Prueba estadstica de la T de Student

Cuando la causa de la prdida de homogeneidad de la serie es probable que sea un abrupto
cambio en la media, la prueba paramtrica de la T de Student es especialmente til. La prueba
es poderosa para detectar la inconsistencia en la media, adems de ser un test riguroso,
excepto cuando la longitud de los dos perodos seleccionados para comparacin de sus
medias no son iguales, pues entonces la distribucin de los datos puede no ser sesgada.

Es recomendable aplicar la prueba t de Student , cuando los valores de n1 y n2 de cada media
que se compara 2 , 1 x x , sean similares.

El estadstico de la t de Student est definido por la siguiente ecuacin:

2 / 1
2 1 2 1
2
2 2
2
1 1
2 1
1 1
2
(

|
|
.
|

\
|
+
+
+

=
n n n n
S n S n
x x
td



siendo S
1
2
y S
2
2
las varianzas de x
i
en los dos periodos de registro respectivamente. Entonces
n1S1
2
puede ser calculada con la ecuacin:


2
1
1
1
1
1
2 2
1 1
1
|
.
|

\
|
=

n
i
n
i
x
n
x S n


y de manera similar n
2
S
2
2
.

El valor absoluto de td se compara generalmente con el valor de la distribucin T de Student de
dos colas y con v = n
1
+n
2
-2 grados de libertad y con 5% de nivel de significancia. Los valores
de t se tienen en la siguiente tabla.

Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
2 15/09/10


Si y slo si, el valor absoluto de td es mayor que el t de tabla se concluye que la diferencia
entre las medias, es evidencia de inconsistencia o falta de homogeneidad.

1.2. Prueba de Cramer

Algunas veces es ms conveniente comparar la media de toda la serie y la media de una cierta
parte del registro, para verificar la consistencia o homogeneidad, para tal propsito la prueba
de H. Cramer (1946) es bastante til, adems de ser complementaria de la prueba de la T de
Student, ya que sta ltima no es recomendable cuando n1 y n2 no son similares.

En la prueba de Cramer, X y S son respectivamente la media y la desviacin estndar del
registro total de n valores.

Por otra parte xk es la media del subperiodo de n valores, es decir:

'
1
n
xi
xk
n k
k

+
+
=


Grados de
libertad Una cola Dos colas
1 6,314 12,706
2 2,920 4,303
3 2,353 3,182
4 2,132 2,776
5 2,015 2,571
6 1,943 2,447
7 1,895 2,365
8 1,860 2,306
9 1,833 2,262
10 1,812 2,228
11 1,796 2,201
12 1,782 2,179
13 1,771 2,160
14 1,761 2,145
15 1,753 2,131
16 1,746 2,120
17 1,740 2,110
18 1,734 2,101
19 1,729 2,093
20 1,725 2,086
21 1,721 2,080
22 1,717 2,074
23 1,714 2,069
24 1,711 2,064
25 1,708 2,060
26 1,706 2,056
27 1,703 2,052
28 1,701 2,048
29 1,699 2,045
30 1,697 2,042
40 1,684 2,021
60 1,671 2,000
120 1,658 1,980
inf. 1,645 1,960
5% de nivel de significancia
Distribucin t de Student
Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
3 15/09/10
Definindose :
( )
S
x xk
k

= t


Y finalmente

( )
( ) | |
k
k n n
n n
tk t
t
2 / 1
2
1 '
2 '

+

=


El estadstico tk tiene distribucin T de Student de dos colas con v=n-2 grados de libertad y es
utilizado de la misma forma que el estadstico td.

5.3 Prueba F de Fisher

La prueba F de Fisher se utiliza para probar la consistencia o homogeneidad en la variancia de
una muestra con respecto a otra.

La prueba consiste en determinar en primer lugar los valores de S
1
2
y S
2
2


Los estadsticos sern: Fcal= S
1
2
/S
2
2
, si S
1
2
> S
2
2

Fcal= S
2
2
/S
1
2
, si S
2
2
> S
1
2



El valor de F tabla se obtiene con o=0.05
Grados de libertad del numerador = n
1
-1
Grados de libertad del denominador = n
2
-1

Los criterios de decisin sern:
Si Fcal <= Ftabla S
1
~ S
2
(Existe consistencia en la variancia)
Fcal > Ftabla S
1
<> S
2
(No existe consistencia en la variancia)


























Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
4 15/09/10
Correccin mediante el anlisis de saltos de la serie de caudales
medios mensuales
Estacin Puente Magdalena
0.0
2.0
4.0
6.0
8.0
10.0
12.0
14.0
16.0
18.0
1945 1950 1955 1960 1965 1970 1975 1980 1985
Aos
C
a
u
d
a
l

(
m
3
/
s
)
Serie Corregida Serie Original
1.3. Anlisis de saltos

Segn la literatura, los saltos son formas determinsticas transitorias que permiten a una
serie peridica o no peridica pasar desde un estado a otro, como respuesta a cambios
hechos por el hombre o a cambios naturales continuos en la cuenca.

El anlisis de consistencia del tipo estadstico descrito anteriormente permite identificar los
saltos en la media y desviacin estndar de series temporales y en base a dicha
identificacin se puede proseguir con la correccin de la i nformacin mediante las
siguientes ecuaciones:

+
(
(
(


=
2 2
1
1 '
X S
S
X X
X
t
t
(Para corregir al primer periodo)

+
(
(
(


=
1 1
2
2 '
X S
S
X X
X
t
t
(Para corregir al segundo periodo)

La siguiente figura muestra un ejemplo de correccin del primer periodo mediante el
anlisis de saltos para una serie de caudales medios mensuales provenientes de la
Estacin Puente Magdalena, Cuenca del ro Chilln.

Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
5 15/09/10

1.4. Anlisis de tendencias

No existen tcnicas "automticas" probadas para identificar componentes de tendencias en
series de tiempo, sin embargo, se puede indicar que la tendencia se caracteriza por ser
montona, es decir, la serie incrementa o disminuye sus valores en el tiempo.

Es frecuente que los datos de la serie de tiempo contengan variaciones aleatorias, entonces el
primer paso en el proceso de identificacin de la tendencia es la suavizacin de la misma.

Segn Box & Jenkins, 1976; Velleman & Hoaglin, 1981, el proceso de suavizar contiene
siempre algunas formas de promedio local de los datos tal que el componente no sistemtico
de las observaciones individuales se cancelen unas a otras. La tcnica ms comn es la
tcnica de los promedios mviles el cual reemplaza cada elemento de la serie por un simple o
ponderado promedio de "n" elementos de alrededor, donde "n" es el rango de suavizamiento.

La mayora de series de tiempo montonas se aproximan de manera adecuada a una funcin
lineal, sin embargo cuando existe un alto componente no lineal, los datos deben ser
transformados para quitar la no linealidad.

Las siguientes figuras muestran ejemplos de aplicacin de la tcnica de los promedios mviles
para la suavizacin de las series con el propsito de identificar tendencias.











Anlisis de Tendencias de la precipitacin total anual -
Estacin Sheque
0
200
400
600
800
1000
1985 1990 1995 2000 2005 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada
Anlisis de Tendencia para la precipitacin total anual -
Estacin Lachaqui
100
200
300
400
500
600
700
800
900
1000
1960 1970 1980 1990 2000 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Mina Colqui
0
200
400
600
800
1000
1200
1970 1975 1980 1985 1990 1995 2000 2005
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Pariacancha
200
300
400
500
600
700
800
900
1000
1100
1200
1970 1975 1980 1985 1990 1995 2000 2005 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Yantac
400
500
600
700
800
900
1000
1100
1200
1300
1400
1965 1975 1985 1995 2005
Aos
P
p
(
m
m
)
Serie original Serie suavizada
Tendencia
Anlisis de Tendencias de la precipitacin total anual -
Estacin Sheque
0
200
400
600
800
1000
1985 1990 1995 2000 2005 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada
Anlisis de Tendencia para la precipitacin total anual -
Estacin Lachaqui
100
200
300
400
500
600
700
800
900
1000
1960 1970 1980 1990 2000 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Mina Colqui
0
200
400
600
800
1000
1200
1970 1975 1980 1985 1990 1995 2000 2005
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Pariacancha
200
300
400
500
600
700
800
900
1000
1100
1200
1970 1975 1980 1985 1990 1995 2000 2005 2010
Aos
P
p
(
m
m
)
Serie original Serie suavizada Tendencia
Anlisis de Tendencia de la precipitacin total anual -
Estacin Yantac
400
500
600
700
800
900
1000
1100
1200
1300
1400
1965 1975 1985 1995 2005
Aos
P
p
(
m
m
)
Serie original Serie suavizada
Tendencia
Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
6 15/09/10

Ejemplo: Anlisis de Consistencia del registro de caudales medios mensuales del ro Caete -
Estacin Socsi para el periodo Enero-1960 a Diciembre-1998.

El anlisis de consistencia practicado a la serie de caudales medios mensuales registrados en
la estacin Socsi, comprenden las pruebas T de Student y F de Fisher, para probar la
existencia de consistencia en la media y variancia respectivamente.

Este anlisis tiene la finalidad de captar la presencia de tendencias o saltos que determinen la
falta de consistencia en la serie, lo que determinara que los anlisis posteriores de la serie no
sean los ms precisos.

La serie total fue dividida en dos periodos similares. El primer periodo estuvo comprendido
entre enero-60 a junio-79 y el segundo periodo de julio-79 a diciembre-98. (Cuadro N01).


Cuadro N01


DEPART. LIMA LATITUD 1302S
DIST.RIEGO MALA - OMAS- CAETE LONGITUD 7612W
EST. AFORO IMPERIAL O SOCSI ALTITUD (msnm) 430
RIO CAETE
AO ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
1960 134.41 122.71 43.88 24.83 19.42 11.22 8.30 6.81 6.46 8.76 10.27 11.26
1961 58.31 22.87 303.93 166.10 38.92 21.62 11.36 9.38 7.96 7.56 27.95 103.15
1962 106.41 128.85 207.30 55.29 19.63 14.50 13.40 11.38 10.36 8.75 9.36 17.37
1963 130.80 122.44 124.28 91.99 29.20 26.52 14.61 11.70 11.13 11.25 26.74 98.48
1964 54.57 107.86 121.91 100.60 48.19 24.23 12.98 9.82 9.26 8.59 11.01 13.97
1965 56.79 204.42 184.16 64.09 33.69 21.50 11.32 8.34 7.81 7.89 9.49 14.74
1966 53.74 71.18 113.28 33.94 19.37 13.31 10.87 9.20 8.17 26.90 30.09 74.54
1967 88.93 289.04 232.30 69.53 35.84 27.03 20.05 16.55 14.03 22.00 16.12 19.50
1968 51.25 56.73 100.40 38.94 20.21 14.58 12.26 9.68 9.90 12.35 26.18 34.25
1969 31.21 49.60 94.65 52.45 22.44 14.09 12.15 10.30 21.67 13.46 12.95 138.40
1970 278.48 131.39 85.71 27.04 16.91 6.51 14.51 10.46 10.77 12.40 13.03 36.52
1971 120.31 159.27 97.14 43.35 19.79 18.01 15.33 15.25 12.73 10.41 8.66 46.37
1972 169.10 251.15 689.14 212.02 40.19 20.42 11.16 11.86 10.34 13.73 23.37 66.62
1973 170.80 220.28 268.21 211.01 34.41 16.89 10.54 12.45 12.04 12.26 17.35 49.03
1974 108.34 202.02 250.22 59.03 32.24 22.87 18.33 14.85 13.67 10.34 17.75 23.68
1975 55.55 87.35 230.06 120.83 91.48 69.50 56.18 27.98 8.42 8.25 50.39 36.76
1976 108.93 185.89 161.96 86.00 43.10 31.06 21.85 14.09 12.80 13.79 13.50 20.10
1977 40.61 124.49 124.59 44.13 39.62 16.24 14.32 11.54 11.47 11.20 38.92 31.08
1978 56.87 109.39 61.52 48.91 24.47 16.37 8.88 11.13 9.83 10.79 21.79 39.20
1979 37.64 100.49 133.50 55.09 26.15 18.98 14.78 11.38 11.11 11.57 12.38 13.65
1980 43.97 47.16 61.65 58.80 25.60 14.50 11.98 10.39 9.10 23.41 26.56 42.02
1981 55.01 187.36 101.21 33.86 11.30 9.49 7.86 16.48 15.60 16.22 23.82 40.78
1982 50.24 131.47 83.72 58.25 18.19 12.58 17.04 15.11 7.71 7.61 46.36 66.50
1983 70.80 61.78 95.72 94.00 25.95 9.75 7.65 7.38 8.66 10.37 11.94 34.72
1984 87.09 303.32 408.18 254.81 61.01 57.26 50.44 47.57 15.51 16.09 23.64 68.69
1985 55.30 101.69 118.18 108.89 25.77 13.49 11.81 11.44 12.21 12.57 13.48 24.17
1986 135.08 204.00 232.48 172.80 70.73 29.78 21.19 16.73 14.00 12.37 13.88 42.58
1987 160.32 130.66 59.50 22.47 11.53 9.70 10.13 9.46 9.05 8.42 10.13 17.13
1988 73.68 82.91 45.97 43.97 17.97 15.50 12.71 11.73 11.69 11.27 10.41 15.72
1989 82.92 135.63 145.45 79.07 17.60 15.91 12.63 11.16 10.46 11.58 18.59 10.98
1990 34.63 26.70 78.23 28.02 18.56 14.97 11.10 8.78 7.63 12.58 36.25 42.61
1991 59.47 97.69 216.02 73.25 49.66 32.10 19.96 11.29 7.81 8.97 20.15 14.98
1992 22.32 15.98 74.76 35.92 21.21 12.15 8.23 6.23 5.63 7.33 8.54 10.00
1993 31.61 190.59 236.97 112.65
1994 151.0 334.8 211.1 74.7 64.7 30.2 19.8 17.1 12.4 10.9 19.3 17.2
1995 230.2 106.3 195.6 52.1 23.5 16.2 11.7 9.0 8.9 10.3 24.7 25.2
1996 133.0 176.3 184.3 122.3 48.2 17.3 13.6 9.3 9.3 9.5 11.3 19.7
1997 87.0 150.7 80.1 20.4 16.5 13.1 10.5 9.0 7.8 8.7 25.1 73.9
1998 184.1 189.1 217.2 135.7 29.5 17.3 16.1 13.7 11.7 11.9 14.7 30.0
DESCARGAS MEDIAS MENSUALES (m3/s)

Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
7 15/09/10
El siguiente cuadro N02, muestra que el valor del estadstico T es menor que el valor crtico de
T para una y dos colas respectivamente, probando que la media de los dos periodos
muestrales pertenecen a la misma poblacin.



Cuadro N02

El cuadro N03 muestra que el valor de F es ligeramente mayor que el valor crtico para F, lo
que indicara diferencias entre las variancias de los 2 periodos.

Sin embargo como la diferencia en las variancias es pequea y la media es consistente, se
acepta la hiptesis que la serie es consistente.

Cuadro N03













Prueba T Ene-60 a Jun-79 Jul-79 a Dic 98
Media 56.43 51.73
Varianza 5681.92 4333.63
Observaciones 234.00 226.00
Varianza agrupada 5019.55
Diferencia hipottica de las medias 0.00
Grados de libertad 458.00
Estadstico t 0.71
P(T<=t) una cola 0.24
Valor crtico de t (una cola) 1.65
P(T<=t) dos colas 0.48
Valor crtico de t (dos colas) 1.97

Prueba F Ene-60 a Jun-79 Jul-79 a Dic 98
Media 56.43 51.73
Varianza 5681.92 4333.63
Observaciones 234.00 226.00
Grados de libertad 233.00 225.00
F 1.31
P(F<=f) una cola 0.02
Valor crtico para F (una cola) 1.24

Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
8 15/09/10
Ejemplo Anlisis Doble Masa



CURVAS DOBLE MASA SERIES ESTACION PASTO GRANDE
PERIODO : Ene - 1956 a Ago - 1989
y = 0.266x - 54.342
R
2
= 0.998
0
1,000
2,000
3,000
4,000
5,000
6,000
0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,000 18,000 20,000
Pp.Total Mensual Acum.(mm)
C
a
u
d
a
l

M
e
d
i
o

M
e
n
s
u
a
l


A
c
u
m

(
m
m
)
Q.Est.PG - PEAE
Q.Est.PG - PEPG
Lineal (Q.Est.PG - PEAE)
Enero-74
Descriptor Serie Estudio Serie PEPG
Promedio 1 2.611 2.626
Variancia 1 8.803 8.939
n1 217 217
Promedio 2 2.398 3.393
Variancia 2 6.904 15.597
n2 187 187
t calculado 0.759 -2.212
t tabla 1.980 1.980
Grados libertad 402 402
Periodo Enero 1956 a Diciembre 1973
Periodo Enero 1974 a Agosto 1989
Prueba T de Student
CURVAS DOBLE MASA SERIES ESTACION PASTO GRANDE
PERIODO : Ene - 1956 a Ago - 1989
y = 0.266x - 54.342
R
2
= 0.998
0
1,000
2,000
3,000
4,000
5,000
6,000
0 2,000 4,000 6,000 8,000 10,000 12,000 14,000 16,000 18,000 20,000
Pp.Total Mensual Acum.(mm)
C
a
u
d
a
l

M
e
d
i
o

M
e
n
s
u
a
l


A
c
u
m

(
m
m
)
Q.Est.PG - PEAE
Q.Est.PG - PEPG
Lineal (Q.Est.PG - PEAE)
Enero-74
Descriptor Serie Estudio Serie PEPG
Promedio 1 2.611 2.626
Variancia 1 8.803 8.939
n1 217 217
Promedio 2 2.398 3.393
Variancia 2 6.904 15.597
n2 187 187
t calculado 0.759 -2.212
t tabla 1.980 1.980
Grados libertad 402 402
Periodo Enero 1956 a Diciembre 1973
Periodo Enero 1974 a Agosto 1989
Prueba T de Student
Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
9 15/09/10
2. Mtodo del vector regional de ndices pluviomtricos

2.1. Descripcin del mtodo del Vector Regional
1


El Vector Regional es, ante todo, un mtodo de crtica de datos [EC1](y accesoriamente de
reconstitucin de datos faltantes), elaborado en el ORSTOM-IRD en los aos setenta, con el
objeto de homogenizar los datos pluviomtricos. Sin embargo, nada se opone a utilizar este
mtodo para otros datos que no sean lluvias, con tal que stos sean relativamente
independientes entre s de un ao a otro, y que sean seudo-proporcionales. Esta ltima
condicin significa que los datos de las diferentes estaciones deben variar en el mismo sentido
y en proporciones casi idnticas, con variaciones ligeras debidas al ruido de fondo. Es
generalmente el caso para estaciones de una zona que no sea demasiado extendida, sometida
al mismo comportamiento climtico.

Imaginemos un juego de datos anuales como lluvias, reuniendo cierto nmero de estaciones de
una misma regin climtica sobre una duracin de a lo menos 5 aos. El mtodo clsico de
crtica de un juego de datos semejante consista en efectuar anlisis de dobles masas entre los
valores de las estaciones tomadas dos a dos, para detectar eventuales heterogeneidades,
luego en completar eventualmente datos faltantes por correlacin entre los datos de una
estacin y de sus vecinas. Cuando el nmero de estaciones es elevado, y el juego de
estaciones presenta aos faltantes, esta operacin puede ser muy fastidiosa, sobre todo que
se ignora desde el comienzo cules son las estaciones que presentan problemas.

El mtodo del Vector Regional consiste en elaborar, a partir del conjunto de la informacin
disponible, una especie de estacin ficticia que sea representativa de toda la zona de estudio.
Para cada estacin se calcula un promedio extendido sobre todo el perodo de estudio, y para
cada ao, se calcula un ndice que ser superior a 1 cuando el ao es excedentario, e inferior a
1 cuando el ao es deficitario. A esta serie de ndices anuales se le llama Vector Regional, ya
que toma en cuenta la informacin de una regin que se supone es climticamente
homognea. Este mtodo tambin puede aplicarse a datos mensuales, tratando
separadamente cada uno de los meses del ao como si se tratara de un valor anual. Pero en
este caso, especialmente respecto a los meses poco abundantes, el carcter seudo-
proporcional de los datos ser menos evidente.

Una vez elaborado el Vector Regional, la crtica de los datos es enormemente facilitada, ya que
se puede:
- Evaluar la calidad de los datos de una estacin por curvas de dobles acumuladas con los
ndices del Vector Regional, lo que ayuda a poner de relieve problemas de calidad
eventuales sobre una estacin.
- Comparar grficamente y correlacionar los datos de una estacin con los ndices del
Vector Regional.
- En cierta medida y con precaucin, evaluar los datos faltantes de una estacin
multiplicando el ndice de un ao del Vector Regional por el promedio extendido de la
estacin sobre el perodo de estudio.
Es evidente que la calidad del Vector Regional depende de la calidad de los datos de entrada.
Aunque los algoritmos utilizados por los dos mtodos intentan minimizar la influencia de los
datos errneos, el Vector calculado al comienzo sigue contaminado por los errores que existen
en los datos de las estaciones. Slo de manera iterativa, eliminando los datos visiblemente
imaginarios y corrigiendo poco a poco los errores ms evidentes sobre los datos de entrada, se
llegar a un Vector Regional de buena calidad.

Cuando el Vector Regional es de buena calidad, puede ser utilizado, si se desea, para
reconstituir datos faltantes. Una opcin del programa HYDRACCESS permite incluso agregar a
los datos reconstituidos una diferencia aleatoria tomada al azar en una ley de Gauss, para
evitar disminuir la variancia de las series reconstituidas. Sin embargo, no hay que perder de
vista que para una reconstitucin fina de datos faltantes sobre una estacin, es preferible
proceder por correlacin con las estaciones ms cercanas.

1
Vauchel Philippe Programa HYDRACCESS.
Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
10 15/09/10

El Vector Regional presenta por fin la ventaja de presentar las variaciones climticas de una
regin en forma sinttica, y no basndose en una sola estacin a la vez.

Mtodos utilizados

Dos mtodos concurrentes fueron elaborados en el ORSTOM - IRD por G. Hiez y Y. Brunet
Moret. El mtodo de G. Hiez se basa en el clculo de la moda (valor ms frecuente), mientras
que el de Y. Brunet Moret se basa en el promedio, eliminando los valores demasiado alejados
del promedio para evitar contaminar demasiado las estimaciones con datos evidentemente
errneos. Cada mtodo estima una media extendida para cada estacin sobre el perodo de
trabajo, y calcula los ndices anuales de cada estacin, obtenidos al dividir el valor observado
en una estacin para un ao por sta media extendida.

El mtodo de Y. Brunet Moret calcula el promedio extendido y los ndices del Vector Regional
por un mtodo de mnimos cuadrados, tratando de minimizar las desviaciones entre los ndices
de las estaciones y el Vector. Considera que el ndice regional de un ao es el promedio de los
ndices de todas las estaciones. Sin embargo, durante el proceso toma la precaucin de filtrar
los ndices de las estaciones que se alejan demasiado del promedio, puesto que el promedio
es influenciado por los valores extremos. La filtracin de los valores se hace en forma iterativa.
Cuando tales valores se detectan durante una iteracin, son remplazados por su estimacin
por medio del Vector que acaba de calcularse, y el clculo recomienza con estos nuevos
valores, hasta obtener un Vector Regional con ningn valor demasiado alejado. Por lo tanto se
puede notar que a pesar de filtrar los valores demasiado alejados del promedio, estos valores
guardan una cierta influencia sobre el Vector Regional calculado. En efecto, el Vector calculado
durante una iteracin y utilizado para re-estimar estos valores est contaminado por estos
valores, sobre todo si las estaciones son poco numerosas.

El mtodo de G. Hiez Calcula el promedio extendido y los ndices del Vector Regional de
manera a obtener un mximo de estaciones y de aos en concordancia con el Vector Regional,
mismo si eso significa que algunos valores se van a alejar mucho. Considera que el ndice
regional de una ao es el ndice ms frecuentemente observado sobre las diferentes
estaciones. Por lo tanto, no es necesario filtrar los datos que se alejan demasiado del
promedio, puesto que los datos extremos tienen poco efecto sobre el clculo de la moda.

De por su concepcin, el mtodo de G. Hiez parece ms potente para detectar datos errneos
y construir rpidamente un Vector Regional poco contaminado por estos datos errneos, pero
se basa en un clculo de la moda que siempre es delicado evaluar, y podra presentar cierto
riesgo de una distorsin de los datos. A contrario, el mtodo de Y. Brunet Moret parece
matemticamente ms slido, pero supone que el utilizador haya eliminado todos los datos
errneos para obtener un Vector Regional confiable. La deteccin, correccin o eliminacin de
los datos errneos es de todo modo una buena poltica, cualquier sea el mtodo utilizado, y es
a menudo la meta principal de un anlisis con el mtodo del Vector Regional.

En ausencia de un estudio comparativo para determinar cual mtodo es el mejor, los dos
mtodos son propuestos en el mdulo Vector Regional, y el utilizador deber consultar la
bibliografa para utilizar el que le parezca mejor adaptado a su juego de datos y a sus
necesidades.











Universidad Nacional Agraria La Molina
Facultad de Ingeniera Agrcola
DRAT
IA-4026 Hidrologa Aplicada
Ing. Eduardo A. Chvarri Velarde
11 15/09/10
Ejemplo
2


La utilizacin del mtodo del vector regional, permiti entender el comportamiento de la cuenca
amaznica (Estacin Tamishiyacu), apoyado en informacin de 375 estaciones del SENAMHI.






2
Proyecto HYBAM (Convenio UNALM IRD).

You might also like