Professional Documents
Culture Documents
ABSTRACT
This study evaluates the applicability of different methods of completion of missing data of
rainfall in six meteorological stations for the period of 1992-2007 in Jequetepeque River Basin,
Peru. First, the exploratory data analysis (AED) was performed to determine the existence of
outliers of the information obtained from the database of the ANA (National Water Authority).
These methods correspond to linear regression distances reasons, neighborhood average, average
rates and correlations with neighboring stations, proposed by UNESCO-ROSTLAC, in 1982,
under the water balance for South America. The method further completion by multiple
regression and the method of regional vector was added. The methods are analyzed using the
coefficient of determination (R2), standard error of estimate (EEE), test matching Bland and
Alamant (ACBA) and analysis of variance (ANOVA), with which it is determined that method
has better fit Jequetepeque for the river basin. According to ACBA, the best method of
completion of data for the stations of San Juan, Asuncin and Contumaza is the regional vector,
in Levis and Magdalena stations the best method is linear regression, multiple regression is
43
presented as best result the Llapa station in the values obtained from R2 and EEE best regional
vector method is in all seasons.
INTRODUCCIN
MATERIALES Y MTODOS
rea de estudio
La cuenca del ro Jequetepeque est ubicada en la costa norte del Per, entre las coordenadas
6,81 - 7,44S y 78,35-79,59O. Tiene una superficie de 3 956 km2. El ro Jequetepeque recorre
de este a oeste, desde la cordillera de los Andes hacia el ocano Pacfico. Con del modelo digital
de elevacin (DEM) proporcionado por la Administracin Nacional de Aeronutica y del
Espacio (NASA) a travs de la Misin de Radar Topogrfico del Transbordador Espacial
45
(SRTM) se puede observar su accidentada topografa que va desde el nivel del mar hasta su
punto ms alto de los 4189 msnm (Figura 1).
La precipitacin
Los datos de precipitacin mensual de la cuenca del ro Jequetepeque, fueron obtenidos de la pgina
web de la Autoridad Nacional del Agua (ANA, http://www.ana.gob.pe), existiendo 14 estaciones
pluviomtricas (1989-2009), de las cuales se seleccion 6 estaciones en estado operativo y con registro
completo de 1992-2007 (Tabla 1).
Las precipitaciones se concentran en los meses de verano austral (Enero-Febrero-Marzo) (Figura 2),
donde precipita entre un 50% y 69% del total anual. La estacin de estiaje se produce en los meses de
Junio-Julio-Agosto.
46
Figura 2. Precipitacin media mensual para el periodo 1992-2007 (mm/mes) de las seis estaciones pluviomtricas
analizadas
= + (1)
A travs del coeficiente de correlacin (R) se determina la mejor estacin vecina ms cercana
como patrn. En trminos hidrolgicos, se considera aceptable un valor de -0.8R0.8
(UNESCO-ROSTLAC, 1982; Pizarro et al, 1993; 2009).
Fig. 3. Disposicin espacial para la completacin por razones de distancia. (Fuente: Pizarro et al, 1993).
()
= + (+)
(2)
Fig. 4. Disposicin espacial para la completacin de datos por promedios vecinales (Pizarro et al, 1993)
= =1 (3)
= [ + + + ] (4)
,
Donde; ,
y
son el promedio de las precipitaciones anuales registradas en un
perodo comn para las N estaciones y PA, PB,PN es la precipitacin en las N estaciones
durante el perodo que falta en X.
+++
= (5)
+++
48
Donde; PX es el valor estimado de precipitacin, PXi son los valores estimados de precipitacin
en X, a partir de las regresiones con cada una de las i estaciones y rXi son los coeficientes de
correlacin entre los registros de la estacin X y cada una de las i estaciones.
= + 1 + 2+ + 1 (6)
=1 =1 ( ) (7)
Completacin de datos
Los datos de precipitacin mensual corresponden a 6 estaciones para un periodo de 15 aos
(1992-2007), se obtuvo un total de 180 datos mensuales por estacin. Se hizo una seleccin
aleatoria del 20% de los datos por estacin, los que fueron considerados como faltantes, con el
fin de generar vacos de informacin, para posteriormente establecer las comparaciones entre
las precipitaciones reales y las estimadas. Se debe sealar que para poder utilizar de forma
comparativa los mtodos, se estableci que los meses en los cuales se elimin la informacin,
deban ser los mismos en cada estacin.
Para la aplicacin del mtodo de RL, se determin el R con las tres estaciones ms cercanas a
la estacin planteada como incompleta. Para el mtodo de RD se consideraron las menores
distancias con relacin a la estacin de datos faltantes. El mtodo de PV considera una
disposicin espacial de tipo triangular, la nica estacin que cumpli con esta condicin fue
la estacin Magdalena, y a su vez se le aplico el mtodo de RP. Las correlaciones con estaciones
vecinas se realizaron en dos escenarios; el primero, con dos estaciones y, el segundo, con tres
estaciones, con el fin de establecer si el nmero de estaciones incluidas en la estimacin, tiene
relacin con la calidad de sta (Pizarro et al., 1993; 2009). En el mtodo de RM se utiliz la
misma combinacin del CEV y bajo el mismo escenario, lo que busca es establecer si la
cantidad y calidad de las estimaciones hechas con el mtodo de RL, se ve afectada por la
cantidad de estaciones incluidas.
49
Anlisis comparativo
Realizadas las estimaciones de los datos faltantes, se hizo una comparacin entre los valores
reales y los valores estimados a travs de los diversos mtodos de completacin, comparndolos
entre s para detectar diferencias estadsticamente significativas entre ellos y se aplicaron las
siguientes medidas de bondad de ajuste: Coeficiente de Determinacin (R), Error Estndar de
Estimacin (EEE), Anlisis de Varianza (ANOVA) y el Test de concordancia de Bland y
Altman (ACBA). Este ltimo modelo se basa en las diferencias promedio existentes entre el
valor real y el estimado, permite apreciar la homogeneidad del error. El nivel de concordancia
lo asignan las diferencias promedio (dp) entre el valor real y el estimado y la desviacin estndar
(SD) de dichas diferencias. Adems, establece un lmite de concordancia (LC) con un 95% del
nivel de significacin (Bland y Altman, 1999; Dunn y Roberts, 1999), definido por la siguiente
expresin (8):
LC = dp 1.96* SD (8)
RESULTADOS
Anlisis comparativo de los mtodos
En el tabla 2 se presentan los valores del R y el EEE para cada estacin, segn el mtodo
aplicado. Los Errores Estndar obtenidos en las estaciones, no presentaron grandes diferencias
entre los distintos mtodos de completacin utilizados para la misma estacin, a excepcin de
la estacin Magdalena, donde se presenta una marcada diferencia entre los mtodos
relacionados con la distancia (RD) y disposicin espacial (PV). Por otro lado, el VR presenta
un EEE menor en todas las estaciones, por consiguiente, bajo este contexto estadstico los datos
simulados son los ms cercanos a los observados.
y Asuncin (2229 msnm). Adems estas mismas estaciones cuentan con valores de EEE bajos
de forma general en todos los mtodos, debido a que se encuentran relativamente cerca y
adicionalmente el factor de altura no es muy diferente entre ellas.
Para determinar la existencia de diferencias entre los distintos mtodos utilizados para cada
estacin, se realiz un anlisis de varianza (ANOVA), que mide el comportamiento de los
efectos entre las medias de cada mtodo (Tabla 3). La estacin Magdalena es la nica que
manifest diferencias significativas entre los distintos mtodos utilizados, con un valor p muy
bajo (inferior a 0,05).
Valor
Estacin VF SC Gl CM FC Valor P
Critico F
Dentro del grupo 15631.72 9 1736.86
Lives Entre grupos 2869523.08 310 9256.53 0.1876 0.9953 1.9101
TOTAL 2885154.80 319
Dentro del grupo 56424.30 9 6269.37
Llapa Entre grupos 2576377.12 310 8310.89 0.7544 0.6588 1.9101
TOTAL 2632801.42 319
Dentro del grupo 3896.91 9 432.99
Contumaza Entre grupos 3338073.64 310 10767.98 0.0402 0.9999 1.9101
TOTAL 3341970.56 319
Dentro del grupo 178004.26 11 16182.21
Magdalena Entre grupos 2891901.79 372 7773.93 2.0816 0.0209* 1.8144
TOTAL 3069906.05 383
Dentro del grupo 35179.46 9 3908.83
Asuncin Entre grupos 5013056.69 310 16171.15 0.2417 0.9880 1.9101
TOTAL 5048236.15 319
Dentro del grupo 23518.54 9 2613.17
San Juan Entre grupos 4176641.96 310 13473.04 0.1940 0.9947 1.9101
TOTAL 4200160.50 319
Con el test de concordancia de Bland y Altman (ACBA), se determin los datos que se ajustan
mejor a los valores reales, a travs de las diferencias promedio. En la Figura 5 se muestran las
diferencias promedios (dp) de cada estacin entre los valores simulados y los observados.
El vector regional se muestra en las estaciones Contumaza (CON), San Juan (SAJ) y Asuncin
(ASC) (Figura 5a, 5e, 5f) como el mejor mtodo que se ajusta a los valores observados.
Teniendo un dp de 1.64 mm, 1.39 mm y 1.87 mm, respectivamente.
La regresin lineal de forma general se ubica como mejor mtodo en las estaciones Levis (LEV)
y Magdalena (MAG), dp de 3.63 mm y 0.45 mm, respectivamente.
En la estacin Llapa (LLA) se presenta como mejor mtodo segn el ACBA el de regresin
mltiple con dos estaciones con un dp de 2.90 mm.
51
CONCLUSIONES
En el anlisis realizado a los diferentes mtodos de completacin de datos en la cuenca del ro
Jequetepeque, se concluye con los resultados obtenidos por el test ACBA, que el vector
regional es el mejor mtodo en las estaciones SAJ, CON y ASC, la regresin lineal se presenta
como mejor mtodo en MAG y LEV, en tanto la regresin mltiple con 2 estaciones se muestra
como mejor mtodo en la estacin LLA.
El resultado del vector regional obtenido con el EEE coinciden con las estaciones del ACBA,
las cuales se encuentran cerca entre ellas y a una altitud similar, presentando precipitaciones
con buena correlacin en cuanto a la distribucun espacial.
La estacin MAG se encuentra cerca de SAJ, CON y ASC, pero con una diferencia de altitud
de alrerdor de 900 m. LEV y LLA se encuentran mas alejadas de este grupo de estaciones,
debido a la distribucin espacial de la lluvia en estas estaciones se presenta como mejor mtodo
la regresin, lineal y multiple, respectivamente.
La ventaja de utilizar el VR, es la extensin de datos, pero para ello se debe tener un grupo de
estaciones que guarde una buena correlacin y adems la DED debe ser menor a 0.2; y bajo
estos lineamientos el VR realizar una correcta completacin de datos, tal como lo revela el
ACBA. Por otro lado, las estaciones que se encuantren espacialmente muy alejadas y donde
exista una variabilidad de la precipitacin, lo ms idoneo ser utilizar los mtodos de regresin.
BIBLIOGRAFIA
Bland, J, Altman, D. 1999. Statistical methods in medical research. Measuring agreement in
methods comparative studies. Vol. 8 (2) pp. 35-160.
Brunet-Moret, Y. 1979. Homognisation des prcipitations. Cahiers ORSTOM, Srie
Hydrologie, 16:3-4.
Centro del Agua para Zonas ridas de Amrica Latina y el Caribe (CAZALAC). 2005 Gua
metodolgica para la elaboracin del mapa de zonas ridas, semiridas y subhmedas secas de
Amrica Latina y El Caribe. Chile. 66p.
Collier, C.G., 2007. Flash flood forecasting: what are the limits of predictability? Q. J. R.
Meteorol. Soc. 133 (622), 323.
52
Dunn, G., Roberts, C. 1999. Statistical methods in medical research. Biostatistics group. The
medical school. Modelling method comparison data. Vol. 8 (2) pp. 161-179.
Espinoza, J. 2005. Utilizacin del vector regional con HYDRACCES. SENAMHI- PER.
Hiez, G. 1977. Lhomognit des donnes pluviomtriques. Cahiers ORSTOM, srie
Hydrologie,14:129-172.
Hou, A.Y., kakar, R., Neeck, S., Azabarzin, A., Kummerow, C., Kojima, M., Oki, R.,
Nakamura, K., Iguchi, T., 2013. The Global Precipitation Measurement (GPM) Mission. Bull.
Am. Meteorol. Soc. http://dx.doi.org/10.1175/BAMS-D-13-00164. 1 (e-View).
Kidd, C., Levizzani, V., 2009. Status of satellite precipitation retrievals. Hydrol. Earth Syst.
Sci. 15, 11091116.
Waldo Sven Lavado Casimiro , Josyane Ronchail , David Labat , Jhan Carlo Espinoza & Jean
Loup Guyot. 2012. Basin-scale analysis of rainfall and runoff in Peru (19692004): Pacific,
Titicaca and Amazonas drainages, Hydrological Sciences Journal, 57:4, 625-642, DOI:
10.1080/02626667.2012.672985.
Montgomery, D., Runger, G. 1994. Applied statistics and Probability for engineers. New York:
Editorial Mc Graw-Hill.
Pizarro, R., Gonzlez, P., Wittersshein, M., Saavedra, J., Soto, C. 1993. Elementos tcnicos de
hidrologa III. Proyecto regional mayor sobre uso y conservacin de recursos hdricos en reas
rurales de Amrica latina y el caribe. Talca: Universidad de Talca. pp 135.
Pizarro, R., Ausensi, P., Aravena, D., Sangesa, C., Len, L., Balocchi, F. 2009. Evaluacin
de mtodos Hidrolgicos para la completacin de datos faltantes de precipitacin en estaciones
de la regin de Maule, Chile. Chile. Revista Aqua-LAC. Vol. 1 - N 2 - Sep. 2009. pp. 172-
185.
Ramesh S. V. Teegavarapu. 2014. Missing precipitation data estimation using optimal
proximity metricbased imputation, nearest-neighbour classification and cluster-based
interpolation methods, Hydrological Sciences Journal, 59:11, 2009-2026, DOI:
10.1080/02626667.2013.862334.
Scheel, M.L.M., Rohrer, M., Huggel, C., Santos Villar, D., Silvestre, E., Huffman, G.J., 2011.
Evaluation of TRMM Multi-Satellite Precipitation Analysis (TMPA) performance in the
Central Andes region and its dependency on spatial and temporal resolution. Hydrol. Earth
Syst. Sci. 15, 26492663.
Schuurmans, J.M., Bierkens, M.F.P., 2007. Effect of spatial distribution of daily rainfall on
interior catchment response of a distributed hydrological model. Hydrol. Earth Syst. Sci. 11,
677693.
Scofield, R.A., Kuligowski, R.J., 2003. Status and outlook of operational satellite precipitation
algorithms for extreme-precipitation events. Weather Forecast. 18, 10371051.
Tapiador, F., Kidd, C., Levizzani, V., Marzano, F. 2003. A neural networksbased fusion
technique to estimate half-hourly rainfall estimates at 0.1 resolution from satellite passive
microwave and infrared data. Journal of Applied Meteorology, Vol. 43 (4) pp. 576594.
Tapiador, F., Turk, F.J., Petersen, W., Hou, A., Garca-Ortega, E., Machado, L., Angelia, C.,
Salio, P., Kidd, C., Huffman, G., de Castro,M., 2012. Global precipitationmeasurement:
Methods, datasets and applications. Atmos. Res. 104105, 7097.
UNESCO ROSTLAC. 1982. Gua metodolgica para la elaboracin del balance hdrico de
Amrica de sur. Oficina Regional de Ciencias y Tecnologa de la UNESCO para Amrica latina
y el Caribe. Montevideo. Uruguay. 129 p - Espaa. 745p.
Vauchel, P., 2005. Hydraccess: Logiciel de gestion et traitement de donnes hydro
mtorologiques, version 2.1.4. Downloadable at http://www.mpl.ird.fr/hybam.01/01/2011.