P2 Suarez Perilla

PREDICCIN DE LA
PRODUCCIN DE
CAF EN COLOMBIA
CON SISTEMA DIFUSO
Y APRENDIZAJE
SUPERVISADO
Jos Domingo Suarez Giraldo Cdigo: 20101005073
Victor Hugo Perilla Martinez Cdigo: 201010050100
CONTENIDO
1. Descripcin del problema.
2. Mtodo de solucin.
3. Resultados.
4. Mejor Resultado
5. Anlisis de resultados
6. Conclusiones.
7. Referencias bibliogrficas.
1. DESCRIPCIN DEL PROBLEMA
La produccin del caf ha sido y es uno de los productos mas
importantes para la economa colombiana. La produccin tiene una
gran variacin, se ha visto afectada anualmente por factores
internos y externos, como los son las polticas de produccin,
plagas, deforestacin y tambin por el precio del caf en el exterior,
costos de insumo, rentabilidad entre otros. Para lograr predecir el
valor de la produccin se busca mtodos eficientes. Para este caso
se us un mtodo que reduce la raz cuadrada del error cuadrtico
medio, este es el aprendizaje supervisado Backpropagation que
genera un sistema difuso cuyas reglas permiten realizar la
prediccin.

GRAFICA DE PRODUCCIN
Se tienen 204 datos de produccin de caf, de los ltimos
aos, se divide en 70% (142 datos) para entrenamiento
del sistema y 30% (62 datos) para validacin

2. MTODO DE SOLUCIN.
El mtodo que se usa para la reduccin del
error, es Backpropagation. Este mtodo se
emplea como el aprendizaje supervisado
donde el sistema aprende una funcin o un
algoritmo y esta siendo supervisado con el fin
de corregir los datos para lograr el mnimo
error posible.

Es un mtodo bastante eficiente por que toma
unos datos y hace varias pruebas y por cada
prueba se hace una correccin, esto hace que
se aprenda al mximo un algoritmo y pueda
producir resultados con buena confiabilidad si
se ha parametrizado correctamente. Son
procesos que toman bastante tiempo en
ejecutarse pero logran generar buenos
resultados.

Backpropagation
Cargar datos
entrenamiento y validacin
Definir parmetros: nmero de
reglas, nmero de entradas, tasa de
aprendizaje, media y desviacin
Calcula en la
funcin EBDF
Determina el error
Reajusta los parmetros:
desviacin y promedio (md y ad)
Criterio de parada:
pocas y error
Entrena al sistema difuso para
que coincida con los pares de
entrada-salida deseados.
No
Muestra
resultados
Si Fin
Incrementa epoca
3. RESULTADOS
En el proyecto No. 1 se us 5 reglas, esto se uso como base para probar el
algoritmo y obtener una tasa de aprendizaje que fuera correcta. El
algoritmo necesita de los siguientes parmetros: Nmero de entradas,
Tasa de aprendizaje (alfa), Nmero de reglas, Valores de inicializacin
(in, xin, yin ), los ltimos fueron determinsticos.

Se tuvo que variar la cantidad de datos de
entrada debido a que el aprendizaje no tena
un buen resultado por ello se estableci un
numero de 12 entradas al sistema. A altos
ndices el error era alto y a muy bajos
ndices el aprendizaje se hacia muy lento.

Al variar la tasa de aprendizaje se obtuvo que para una
disminucin rpida del error y un establecimiento rpido esta
deba ser de 0.01.Se definen como criterios de parada:
RMSE > 0.001 pocas<1000 Cambio del error>0.0000001

HISTOGRAMAS DE ERROR RMSE DE VALIDACIN PARA
DIFERENTES REGLAS
Se realizan aprendizajes para 3,5,8,16 y 32 reglas donde se elije unas
variables de los conjuntos difusos aleatoriamente y se realizan 2000
repeticiones. Se agruparon errores por cada 1% de diferencia.

El mejor resultado se obtiene con 8 reglas, la cual fue la nica que di
un dato menor a 9%, como se observa cuando las reglas eran 3 y 5 los
errores tenan do puntos de tendencia, al aumenta se logro una
distribucin ms uniforme con lo errores menos concentrados lo cual
trajo errores ms altos presentes cuando se uso 16 reglas y 32 reglas.
Se debe tener en cuenta que a mayor numero de reglas se debi
tambin aumentar el numero de repeticiones puesto que el espacio es
mas grande, esto no se hizo debido a que por la combinacin las 12
entradas y las 16 y 32 reglas se tuvieron tiempos de ejecucin de 16 y
20 horas para obtener ese nmero de repeticiones, lo cual lleg a
provocar colapsos en las ejecuciones.

4. MEJOR RESULTADO OBTENIDO
El mejor resultado obtenido fue con 8 reglas. Para la cuales se obtuvo el
menor RMSE de validacin en las pruebas realizadas.
Produccin real (azul) y Produccin pronosticada (rojo)
RMSE ENTRENAMIENTO= 0.095184257225327 = 9.51%
RMSE VALIDACIN = 0.089715258189293 = 8.97%

APRENDIZAJE DEL SISTEMA PARA EL
MENOR ERROR ENCONTRADO:
Como se observa el aprendizaje se detuvo por el
criterio del cambio de error, y se ve un
comportamiento poco comn, esto es causado por
lo abrupto de los datos.
CONJUNTOS DIFUSO OBTENIDOS PARA EL
SISTEMA
Se obtuvieron 96 conjuntos difuso 12 entradas 8
reglas, se grafican por cada regla 12 conjuntos.
5.ANLISIS DE RESULTADOS
la eleccin de la tasa es muy importante por ello, se eligi por su rapidez en
disminuir el error y lo estable sin que hubiera un sobre-aprendizaje
considerable que se hacia con el tiempo para as disminuir los tiempos de
ejecucin y lograr un resultado satisfactorio.
El comportamiento de la grafica de aprendizaje muestra lo difcil que fue
obtener un aprendizaje que pudiera dar un resultado satisfactorio para
estos datos.
Se obtiene un gran numero de conjuntos difusos, esto debido a la gran
cantidad de variables de entrada y reglas usadas.
El error de validacin es menor al de aprendizaje esto debido a que el
sistema de aprendizaje busca es garantizar el mnimo error en los datos de
validacin pero no asegura ningn criterio para el error de aprendizaje, en
las grafica de los datos de validacin, se observa como los datos predecidos
buscan realizar los cambios abruptos realizados por los reales lo cual
muestra que el comportamiento del sistema si busca realmente modelar el
comportamiento de la produccin mensual de caf.

6. CONCLUSIONES
Cuando los datos son muy abruptos en su cambio, se hace difcil la eleccin de una
tasa de aprendizaje debido a que el error no se puede estabilizar fcilmente
conforme aumentan las pocas, en nuestro caso se debi tomar el que ms rpido
disminuyo y tenia una oscilacin baja para estabilizarse, esto muestra la
dependencia de este parmetro respecto los datos.
El mtodo de Backpropagation en un sistema de prediccin puede llegar a ser
bastante eficiente generando errores bajos y produciendo as ms fiabilidad en sus
resultados, se obtuvo un RMSE de 8.97% para nuestras pruebas y se observa con
claridad que el sistema difuso llego a un modelo que sigue el comportamiento de
la produccin de caf en Colombia.
Backpropagation es un algoritmo con muchos parmetros por lo cual las pocas de
aprendizaje y la tasa de aprendizaje de eleccin subjetiva que se empleen, son
factores muy importantes; pues el sistema puede llegar al sobre-aprendizaje o un
aprendizaje malo y esto conlleva a errores en la respuesta de salida de dicho
sistema.
La variacin en el numero de reglas tiene un comportamiento directo en la
distribucin del error, a menores reglas se hace ms concentrada la distribucin
de error y a mayores reglas se expande la distribucin de error.
Las series de tiempo abruptas producen dificultad en el aprendizaje.

7. REFERENCIAS
L.X. Wang and J. Mendel, BACKPROPAGATION FUZZY
SYSTEM AS NONLINEAR DYNAMIC SYSTEM
IDENTIFIERS, IEEE International Conference on Fuzzy
Systems, 1992
Relaciones dinmicas entre variables cafeteras
fundamentales. Sergio Clavijo, Jose Leibovich y Adriana
Ferrufino.
Manual de Econometra parte 1, edicin 2010. Facultad de
ciencias econmicas; Universidad Nacional de Rio Cuarto.

P2 Suarez Perilla

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

P2 Suarez Perilla

Uploaded by

Copyright:

Available Formats

PREDICCIN DE LA

You might also like