Professional Documents
Culture Documents
Resumen. En la ltima dcada, Uruguay ha comenzado a migrar su matriz energtica hacia energas
renovables de origen elico y solar. Debido a que es difcil prever el comportamiento de los fenme-
nos atmosfricos asociados a dichas fuentes de generacion de energa, desde la Facultad de Ingeniera
se estn desarrollando herramientas que permitan predecir la generacin de la energa asociada en una
ventana de corto plazo. Sin embargo, estas herramientas presentan tiempos de ejecucin elevados, espe-
cficamente en lo que respecta al clculo del mdelo regional de tiempo y clima WRF. En este trabajo
se propone una arquitectura asincrnica del modelo WRF, buscando disminuir los tiempos de clculo de
la radiacin solar. Esta novel propuesta alcanza una aceleracin de 1.2 veces cuando se compara con la
mejor configuracin del WRF original, utilizando los mismos recursos de hardware para ambos casos.
1. INTRODUCCIN
Uruguay se encuentra en un proceso vertiginoso de modificacin de su matriz de genera-
cin de energa elctrica. En particular, en la ltima dcada se ha dado un importante impulso
a la generacin de energa elica y de origen solar. Alineado con esta poltica, investigadores
del Instituto de Mecnica de los Fluidos e Ingeniera Ambiental (IMFIA) de la Facultad de In-
geniera (FING) de la Universidad de la Repblica (UDELAR) desarrollaron una herramienta
para la prediccin de la generacin de energa elctrica de origen elico en el territorio Uru-
guayo. La herramienta se basa en la ejecucin de un modelo numrico de circulacin regional
de la atmsfera y su post-procesamiento estadstico, as como en la asimilacin en tiempo real
de la potencia generada por los parques elicos en la ltima hora y produce, como salida, un
estimativo de la potencia generada por los mismos. Para modelo de pronstico del tiempo, la
etapa ms costosa en recursos de cmputo, se usa el Weather Research and Forecasting (WRF)
(Skamarock et al., 2001), uno de los modelos numricos ms populares a nivel mundial para
dicho fin. Desde el ao 2014, los planes de desarrollo se han focalizado en la generacin de
energa de origen solar fotovoltaica. En concordancia con el esfuerzo anterior, se ha comenzado
a desarrollar una herramienta de prediccin de la generacin de energa solar fotovoltaica sobre
el territorio del pas. El proyecto rene investigadores del IMFIA, del Insituto de Computacin
(INCO) y del Instituto de Ingeniera Electrica (IIE) de la FING. Esta herramienta tambin se
basa en el WRF, pero buscando potenciar los clculos referidos a la radiacin solar para mejo-
rar la precisin de dicha estimacin. En resumen, ambas herramientas demandan importantes
volmenes de clculos, lo que motiva estudiar la aceleracin del WRF para disminuir su tiempo
de ejecucin (y/o mejorar la precisin numrica de los resultados).
Por otro lado, en los ltimos aos el rea de computacin de alto desempeo (HPC, del ingls
High Performance Computing), ha cambiado radicalmente. Adems de las grandes plataformas
de hardware reservadas para centros de cmputo con acceso a grandes fuentes de financiamien-
to, ha cobrado impulso el uso de plataformas de hardware de bajo costo. En especial, aquellas
que incluyen procesadores multi-core y aceleradores de hardware (como las GPUs y los pro-
cesadores Intel Xeon-Phi). Este tipo de hardware ofrece capacidades de cmputo importantes
con costos econmicos y niveles de consumo energticos razonables (Padoin et al., 2013). Pe-
ro, como contrapartida, estas plataformas que son especialmente aptas para el paralelismo de
datos, exigen enfoques donde se puedan abatir, o al menos acotar de manera importante, las
dependencias entre datos. Si bien el WRF incluye el uso de tcnicas de paralelismo mediante
la aplicacin de la API OpenMP, evaluaciones preliminares realizada sobre los casos de estudio
de inters mostraron que la herramienta ofrece una escalabilidad pobre en este tipo de escena-
rios. Esta situacin limita fuertemente el aprovechamiento de equipos con nmeros elevados de
cores y/o arquitecturas masivamente paralelas.
Considerando lo expuesto en los prrafos anteriores, nuestra propuesta se centra en el desa-
rrollo de una variante del WRF capaz de ejecutar mdulos de forma concurrente. Logrando as,
sacar partido del paralelismo de datos y de tareas al mismo tiempo. En particular, se desarroll
un prototipo que permite desacoplar los clculos de radiacin del modelo siguiendo un paradig-
ma de pipeline, dnde en un paso de tiempo se estn calculando los cmputos del modelo en
general y al mismo tiempo el mdulo de radiacin, cuya salida ser entrada en pasos futuros del
modelo general. Los resultados preliminares alcanzados muestran reducciones en los tiempos
de ejecucin de alrededor de un 20 % utilizando los mismos recursos de hardware.
El resto del documento se estructura de la siguiente forma. En la Seccin 2 se describe
someramente la herramienta para predecir la generacin de energa solar fotovoltaica, prestando
especial atencin en el modelo WRF. Luego, en la Seccin 3 se presenta la propuesta, seguida
de la evaluacin experimental de la misma en la Seccin 4. Finalmente, en la Seccin 5, se
ofrece un resumen de las principales conclusiones arribadas durante el trabajo y posibles lneas
de trabajo futuro.
Figura 1: Mdulos de la herramienta de prediccin de la generacin de energa de origen solar fotovoltaico pro-
puesta.
Si se analiza esta herramienta desde el punto de vista del costo computacional, la mayor parte
del tiempo de ejecucin necesario para realizar la estimacin de la planta es consumido por el
modelo numrico de pronstico del tiempo, el WRF. En particular, como se est estudiando
el fenmeno de radiacin, se utilizan mdulos que permitan calcular esta propiedad de forma
precisa. Cuando se analiza el funcionamiento del WRF en lo que respecta al clculo de la
radiacin (y como se ver en profundidad ms adelante), el modelo computa la radiacin y
utiliza estos valores por un lapso de tiempo posterior, configurable segn una variable inicial.
Si bien esta caracterstica busca espaciar el clculo de la radiacin y as disminuir el tiempo
de clculo asociado, al momento de actualizar estos datos, el modelo debe detenerse y realizar
los clculos del pronstico de la radiacin nuevamente para el siguiente lapso temporal. La
necesidad de una buena frecuencia de clculo para este caso y el uso de un mdulo de alta
precisin para el clculo de la radiacin, inciden en que el WRF sea la etapa ms costosa de la
herramienta.
Considerando lo expresado anteriormente, nuestro esfuerzo se centra en modificar el paradig-
ma de cmputo del WRF, por esta razn en el siguiente apartado se profundiza en la descripcin
del modelo.
2.1. El WRF
El programa WRF Michalakes et al. (2001) fue creado a principios de la dcada de los 90 por
distintos centros de estudio relacionados a la investigacin de los fenmenos de la atmsfera,
principalmente ubicados en Amrica del Norte. El WRF es un modelo numrico mesoescala, no
hidrosttico, euleriano y compresible, que permite predecir el clima orientado tanto al mbito
de la investigacin atmosfrica como al pronstico del tiempo diario. Esta herramienta, permite
pronosticar diversas propiedades fsicas y qumicas de la atmsfera, como el movimiento de
masas de aire, humedad, formacin de nubes y radiacin emitida hacia y desde la superficie
terrestre, entre otras.
Desde el punto de vista computacional, el WRF es un programa estructurado en capas y
mdulos, donde cada mdulo presenta un solver de alguna propiedad qumica o fsica de la at-
msfera. Para cada una de estas propiedades existen distintos mdulos, donde vara la precisin
del clculo y en consecuencia el tiempo de ejecucin del mismo. Para lograr la correcta simula-
cin de la atmsfera, estos mdulos son llamados por capas superiores del programa, siguiendo
un orden en particular, debido a que la informacin de ciertas propiedades atmosfricas son
utilizadas para los clculos de otras. En particular, la radiacin es una propiedad importante en
el modelo y es utilizada por diversos mdulos.
Figura 2: Funcionamiento de la arquitectura sincrnica del modelo WRF, cuando se lo divide segn la porcin de
cdigo que ejecuta la radiacin y el resto de los mdulos.
3. PROPUESTA
Debido al alto costo computacional que el WRF presenta en las configuraciones necesarias
para obtener un buen pronstico de la radiacin solar, resulta de inters analizar la herramienta
e intentar introducir alguna tcnica que permita disminuir los costos asociados. En particular,
debido al pronunciado crecimiento de las arquitecturas multi-core y many-core en los ltimos
aos, es til introducir al modelo alguna tcnica de computacin de alto desempeo que permita
aprovechar el poder de cmputo que estas arquitecturas ofrecen.
Como se vio en la Seccin 2, el WRF presenta un sincronismo entre el clculo de la ra-
diacin y el resto de los clculos asociados al modelo general. Adems, tiene implementado
un paralelismo de datos utilizando OpenMP, que para los casos utilizados para Uruguay, no
ofrece buenos niveles de escalabilidad. Por esta razn, parece interesante abordar en este con-
texto una propuesta basada en cambiar la arquitectura de cmputo del modelo WRF por un
paradigma asincrnico, que no slo permita realizar el clculo en paralelo, sino que adems no
incurra en los problemas que surgen del paralelismo de datos ya presente en la herramienta.
Especficamente, como se muestra en la Figura 3, resulta interesante implementar una tcnica
de paralelismo funcional que permita desacoplar los clculos de la radiacin solar y el resto del
modelo, para poder ejecutar estos cmputos en forma solapada.
Este cambio en el modelo WRF permitir hacer un uso eficiente de plataformas de hardware
multi-core y many-core, an con dominios de dimensiones modestas (como las discretizaciones
usadas para representar nuestro pas en los modelos numricos implicados). En especial, el nue-
vo paradigma propuesto en este trabajo permite que el gestor de radiacin se compute al mismo
tiempo que otros mdulos, disminuyendo e incluso evitando las esperas por la actualizacin de
Figura 3: Funcionamiento de la arquitectura asincrnica del WRF.
0.8
6000
0.6
4000
0.4
2000
0.2
0 0
0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
Figura 4: A la izquierda, progresin de los tiempos de ejecucin (en segundos). A la derecha progresin de la
eficiencia del modelo WRF en su versin original al cambiar la cantidad de hilos.
Si se considera la mejor configuracin para cada versin, o sea la que minimiza el tiempo de
ejecucin del modelo, que en este caso son la de 32 hilos para el caso original (670s) y para la
variante propuesta 30 hilos para el ncleo del WRF y 30 hilos para el clculo de la radiacin
(564s), los resultados muestran una mejora del orden de 1.2. Estos resultados, conseguidos
utilizando la misma plataforma de hardware, permiten afirmar que el clculo asincrnico de la
radiacin logra aprovechar de mejor manera los recursos de clculo de la plataforma.
Finalmente, es importante mencionar que para todas las ejecuciones de la nueva arquitectura,
los resultados numricos obtenidos se asemejan a los que arroja el modelo original. En particu-
lar, los resultados obtenidos en esta propuesta no presentan variaciones significativas a su par
en el modelo original cuando se realizan la misma cantidad de pasos de radiacin.
AGRADECIMIENTOS
R. Bay agradece el financiamiento parcial del centro ICT4V (Information and Commu-
nication Technologies for Verticals) mediante la beca POS_ICT4V_2016_1 02. Adems, los
autores quieren agradecer al PEDECIBA (Programa de Desarrollo de las Ciencias Bsicas) y a
la ANII (Agencia Nacional de Investigacin e Innovacin), por la financiacin recibida a travs
del proyecto FSE_2013_10975.
REFERENCIAS
Foster I. Designing and building parallel programs. 1995.
Gabriel E., Fagg G.E., Bosilca G., Angskun T., Dongarra J.J., Squyres J.M., Sahay V., Kam-
badur P., Barrett B., Lumsdaine A., et al. Open mpi: Goals, concept, and design of a next
generation mpi implementation. En European Parallel Virtual Machine/Message Passing
Interface Users Group Meeting, pginas 97104. Springer, 2004.
Michalakes J., Chen S., Dudhia J., Hart L., Klemp J., Middlecoff J., y Skamarock W. Develop-
ment of a next generation regional weather research and forecast model. En Developments in
Teracomputing: Proceedings of the Ninth ECMWF Workshop on the use of high performance
computing in meteorology, volumen 1, pginas 269276. World Scientific, 2001.
Michalakes J. y Vachharajani M. Gpu acceleration of numerical weather prediction. Parallel
Processing Letters, 18(04):531548, 2008.
Padoin E.L., Pilla L.L., Boito F.Z., Kassick R.V., Velho P., y Navaux P.O. Evaluating application
performance and energy consumption on hybrid cpu+ gpu architecture. Cluster Computing,
16(3):511525, 2013.
Quinn M.J. Parallel Programming, volumen 526. TMH CSE, 2003.
Silva J.P., Hagopian J., Burdiat M., Dufrechou E., Pedemonte M., Gutirrez A., Cazes G., y
Ezzatti P. Another step to the full gpu implementation of the weather research and forecasting
model. The Journal of Supercomputing, 70(2):746755, 2014.
Skamarock W.C., Klemp J.B., y Dudhia J. Prototypes for the wrf (weather research and fore-
casting) model. En Preprints, Ninth Conf. Mesoscale Processes, J11J15, Amer. Meteorol.
Soc., Fort Lauderdale, FL. 2001.
Skamarock W.C., Klemp J.B., Dudhia J., Gill D.O., Barker D.M., Wang W., y Powers J.G. A
description of the advanced research wrf version 2. Informe Tcnico, DTIC Document, 2005.
Snir M. MPIthe Complete Reference: The MPI core, volumen 1. MIT press, 1998.