You are on page 1of 10

Red de Revistas Cientficas de Amrica Latina, el Caribe, Espaa y Portugal

Sistema de Informacin Cientfica

Juan Carlos Prez Mesa, Jaime de Pablo Valenciano, Jean-Pierre Levy Manguin
Empleo de redes neuronales de base radial a un modelo economtrico de exportacin de tomate
Ciencia Ergo Sum, vol. 14, nm. 1, marzo-junio, 2007, pp. 6-14,
Universidad Autnoma del Estado de Mxico
Mxico

Disponible en: http://www.redalyc.org/articulo.oa?id=10414102

Ciencia Ergo Sum,


ISSN (Versin impresa): 1405-0269
ciencia.ergosum@yahoo.com.mx
Universidad Autnoma del Estado de Mxico
Mxico

Cmo citar? Fascculo completo Ms informacin del artculo Pgina de la revista

www.redalyc.org
Proyecto acadmico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
Empleo de redes neuronales
de base radial a un modelo economtrico de
exportacin de tomate
Juan Carlos Prez Mesa*, Jaime de Pablo Valenciano** y Jean-Pierre Levy Manguin***

Recepcin: 11 de noviembre de 2005


Aceptacin: 7 de junio de 2006

*Universidad de Almera.
Resumen. En este artculo se realiza una Use of Neural Networks of Radial Base to a
Departamento de Direccin y Gestin de Empresas. comparacin entre redes neuronales de base Econometric Model of Tomato Exports
Caada de San Urbano s/n 04120 Almera, Espaa.
radial y la metodologa economtrica Abstract. In this paper a comparison between
Correo electrnico: juancarlos@ual.es
**Universidad de Almera. tradicional. Ambos sistemas se aplican a una Radial-Basis Networks and the traditional
Departamento de Economa Aplicada. funcin que explica y predice las exportaciones econometric methodology is realized. Both
Caada de San Urbano s/n 04120 Almera,
de tomate de empresas de economa social de la systems are applied to a function that explains
Espaa. Correo electrnico: jdepablo@ual.es
***Universit du Qubec en Outaouais, Qubec, provincia de Almera (Espaa). Los resultados and predicts the tomato exports of one social
Canada. Correo electrnico: que se obtienen son similares, aunque la economy company from the province of
Jean-Pierre.Levy-Mangin@uqo.ca
fiabilidad del modelo de redes al predecir Almera Spain. The out come is similar, though
queda cuestionada. Sin embargo, las redes se the reliability of network model to predict is
configuran como una herramienta fcil de questioned. Nevertheless, networks are a tool
utilizar ya que no estn condicionadas por una easy to use because they are not determined by
especificacin funcional anterior y una a previous functional specification and a
distribucin del error. distribution of the residuals.
Palabras clave: funcin de exportacin, Key words: export function, econometric
modelo economtrico, prediccin. model, forecast.

Introduccin La utilizacin de esta metodologa a una funcin de expor-


tacin de tomate, viene motivada por avanzar en el conoci-
Este artculo supone una aproximacin a las inmensas posi- miento del proceso de liberalizacin que est afectando a las
bilidades que nos ofrecen los nuevos avances en anlisis exportaciones de frutas y hortalizas. En concreto, nos he-
numrico. La investigacin de otras ramas de la ciencia, en mos centrado en la exportacin de tomate espaol debido a
este caso, la informtica, mediante el desarrollo de una apli- que es uno de los productos ms sensibles en cuanto a la
cacin computacional de Redes Neuronales de Base Radial competencia de terceros pases. En estos momentos a pesar
para el reconocimiento de patrones, nos proporciona una de que Espaa tiene la primaca en las exportaciones en el
oportunidad de utilizacin prctica en economa. contexto comunitario; en pases concretos, por ejemplo en
Francia, Marruecos ha doblegado al potencial exportador
espaol. En este artculo analizamos las exportaciones de las
1. Segn datos estadsticos facilitados por la Federacin Espaola de Asociaciones de
empresas de economa social de Almera (mximas represen-
Productores Exportadores de Frutas, Hortalizas y Plantas Vivas (FEPEX) y para el ao
tantes de la venta en destino, es decir, de la negociacin di-
2000, Almera supone el 29% del total exportado en toneladas por Espaa (Murcia recta con clientes fuera de nuestro pas), principal provincia
es la siguiente provincia en importancia con el 21%). exportadora de tomate en Espaa.1

6 C I E N C I A e r g o s u m , V o l . 14- 1, marzo- junio 2 0 0 7. U n i v e r s i d a d A u t n o m a d e l E s t a d o d e M x i c o , T o l u c a , M x i c o . P p . 6-14.


CIENCIAS S OCIALES

1. Redes de base radial: metodologa y por tanto su aplicacin podra llegar a generalizarse en los
prximos aos.
Los primeros trabajos sobre redes neuronales se remontan a El diseo de una red neuronal es un problema de ajuste
los aos cincuenta. Estos estudios pretendan mimetizar la de una curva o funcin (aproximacin). Desde este punto
estructura del sistema nervioso humano a fin de poder solu- de vista, el aprendizaje es equivalente a encontrar una su-
cionar ciertos problemas que son de difcil resolucin me- perficie en un espacio multidimensional que d como resul-
diante una programacin algortmica. Normalmente la refe- tado el mejor ajuste para los datos de entrenamiento, sien-
rencia histrica ms usual es la de Rosemblatt (1958) que do medido de una forma estadstica. Correspondientemente,
analiz el dispositivo perceptrn. Una referencia bsica que la generalizacin es equivalente a usar esta superficie
se recomienda al comenzar el estudio de redes neuronales es multidimensional para interpolar los datos del test.
McClelland y Rumelhart (1986) o Freeman y Skapura En el contexto de red neuronal, las unidades ocultas su-
(1991).2 ministran un conjunto de funciones que actan como fun-
Una red neuronal est compuesta por varios operadores ciones base para los vectores de entrada cuando son expan-
simples elementos de proceso o nodos con una pequea didos al espacio de unidades ocultas. Estas funciones se
cantidad de memoria. Las unidades se comunican median- llaman funciones de base radial.
te redes (axones) que transportan datos. Grosso modo en- Las funciones de base radial fueron primeramente intro-
contramos seis componentes: 1) unidades de procesamien- ducidas en la solucin de problemas de interpolacin
to (neuronas) que se disponen en capas; 2) un estado de multivariante. Los primeros trabajos se atribuyen a Powell
activacin que representa, en un instante de tiempo, el nivel (1987) y ahora es uno de los principales campos en la in-
de activacin de las neuronas; 3) unas salidas de las unida- vestigacin del anlisis numrico.
des de activacin, que determinan la seal que cada neuro- Bromhead y Lowe (1988) fueron los primeros que explo-
na enva sus vecinas; 4) un patrn de conexin (estructura taron el uso de las funciones de base radial en el diseo de
de la red en capas y la intensidad y sentido de las relacio- redes neuronales.
nes); 5) una regla de propagacin (funcin de activacin); y Otras contribuciones importantes a la teora, diseo y apli-
6) una regla de aprendizaje. cacin de las redes de funcin de base radial son los artcu-
Nuestro objetivo es ver la capacidad de este tipo de he- los de Moody y Darken (1989), Renals (1989) y Poggio y
rramientas en contraposicin a la potencia de los modelos Girosi (1990). El artculo de Poggio y Girosi enfatizaba el
economtricos tradicionales. En este sentido, Caridad y Ceular uso de la teora de la regularizacin aplicada a esta clase de
(2001) utilizan redes neuronales artificiales para comparar red neuronal como un mtodo para mejorar la generaliza-
los resultados con un modelo lineal de determinacin del cin de nuevos datos.4 La construccin de las redes de fun-
precio de la vivienda. Otero y Trujillo (1992) establecen
comparaciones entre un modelo economtrico tradicional, 2. Otra bibliografa, en referencia, al estudio de redes neuronales es: Haykin (1994);
una modelizacin ARIMA, y un modelo de redes neuronales,
Leonar, Kramer y Ungar (1992); Musavi y Liu (1991); Horak (1991); Jetter y Stockler
para predecir la tasa de actividad femenina en Andaluca.
(1991); Thau (1991); Light y Cheney (1991); Pantalen et al. (1993); Werntges (993) y
Richards, Patterson y Van Ispelen (1998) comparan un
Corchado et al. (2000).
modelo de redes con otro economtrico de determinacin
del margen (precio de venta al pblico-precio en granja) 3. Es una modificacin respecto del algoritmo de aprendizaje Back Propagation (BP).

para el tomate fresco en Estados Unidos. El modelo de Ambos algoritmos suponen un aprendizaje supervisado, es decir, se intenta mapear

Perceptrn Multicapa y como algoritmo el back propagation un conjunto de vectores de entrada y relacionarlos con unos de salida. En general,

ha sido tradicionalmente el tipo de red neuronal ms utili- existe un modelo BP capaz de reproducirse con un algoritmo de base radial, y viceversa.
zada, por su sencillez, en economa. En nuestro caso utili- La principal diferencia es que el modelo BP intenta encontrar una nica funcin no
zaremos otro tipo de red neuronal supervisada, las Redes lineal (normalmente logstica) capaz de representar el problema, sin embargo, las
de Funcin de Base Radial (Radial-Basis Function Networks),
redes de base radial estn formadas por un nivel de neuronas con una funcin radial
tambin conocidas con las siglas RBF.3 Se utiliza este tipo de
(en nuestro caso gaussiana) y un nivel integrador (de suma) de la salida del nivel
red por ser prcticamente desconocida en economa y por-
anterior. El entrenamiento de este sistema es un proceso basado en la teora de la
que dan un giro en el trabajo de investigacin sobre la
interpolacin tradicional estricta en un espacio regularizacin para la aproximacin de funciones.

multidimensional por lo que en la actualidad son uno de los 4. Un artculo que profundiza en la dificultad del diseo de redes de base radial es Valls

principales campos en la investigacin del anlisis numrico et al. (2000).

C I E N C I A e r g o s u m , V o l . 1 4- 1, marzo - junio 2 0 0 7 7
CIENCIAS SOCIALES

cin de base radial (RBF), en su forma bsica, incluye tres da p-dimensional hasta el espacio de salida unidimensional,
capas totalmente diferentes. el cual denotamos como:
Capa de entrada: est formada por los nodos fuente
(unidades sensoriales). s : p 1
Capa intermedia: es una capa oculta de gran dimensin
y en la que las unidades (neuronas) que la forman son las Podramos pensar en s como el hiperplano (grafo) p +1 ,
funciones base para los datos de entrada. donde el plano es un dibujo multidimensional de la salida
Capa de salida: que tiene la responsabilidad en la red de la como funcin de la entrada. En un caso prctico, el plano
activacin de patrones aplicados en la capa de entrada. es desconocido y los datos de entrenamiento son usualmente
La transformacin desde la capa de entrada hasta el es- contaminados con ruido. Consecuentemente, la fase de en-
pacio de las unidades ocultas se realiza de una forma no trenamiento y la de generalizacin del proceso de aprendiza-
lineal, mientras que la transformacin desde el espacio de je podran ser vistas como sigue:
unidades ocultas (capa intermedia) al espacio de salida se La fase de entrenamiento constituye la optimizacin
realiza de forma lineal. del proceso de ajuste para el plano , basado en puntos de
La justificacin matemtica para este fundamento pode- datos conocidos presentados en la red en la forma de
mos encontrarla en el artculo de Cover (1965). En particu- ejemplos de patrones de entrada-salida.
lar, cabe destacar de este artculo que el problema de la La fase de generalizacin es sinnima a la interpolacin
clasificacin de patrones en un espacio alto-dimensional no entre los puntos de datos, realizando la interpolacin junto
lineal es ms deseable que sea linealmente separable que en con el plano construido, generado por el proceso de ajuste
un espacio bajo-dimensional. Por lo tanto, es sta la razn como la aproximacin ptima al plano .
de hacer alta la dimensin del espacio de unidades ocultas De esta manera nos hemos dirigido a la teora de la
en una red RBF. interpolacin multivariable en un espacio alto-dimensional, la
A travs de un diseo cuidadoso, sin embargo, es posible cual tiene una larga historia. El problema de la interpolacin,
reducir la dimensin del espacio de unidades ocultas, espe- en sentido estricto, puede empezar como sigue:
cialmente si los centros de stas han sido adaptados. Cogiendo un conjunto de N puntos diferentes {xi p
i = 1,2,..., N } y un correspondiente conjunto de N nmeros
1.1.El problema de la interpolacin reales , encontrar la funcin que satis-
Un punto importante que surge del teorema de Cover en faga la condicin de interpolacin:
la separabilidad de patrones es que en la resolucin del
problema de la clasificacin de patrones no separables F ( xi ) = di ... (1)
linealmente hay, en general, una ventaja clara que se ob-
tiene acotando el espacio de entrada en un nuevo espacio Obsrvese que para una interpolacin estricta como la
de mayor dimensin. especificada aqu, el plano de interpolacin (la funcin F)
Bsicamente la acotacin no lineal se usa para transfor- es construido para pasarlo por todos los puntos de datos
mar un problema de clasificacin no linealmente separa- de entrenamiento.
ble en otro linealmente separable. De manera similar, po- La tcnica de las funciones de base radial (RBF) consiste
demos usar una acotacin no lineal para transformar un en coger una funcin F que tenga la siguiente forma
problema difcil de filtrado no lineal en otro ms fcil que (Powell, 1987):
incluya un filtrado lineal.
Consideremos entonces una red de retropropagacin con (2)
una capa de entrada, una capa oculta simple y una capa de
salida que consiste en una unidad simple. Se ha escogido Donde { ( x xi ) | i = 1, 2,..., N } es un conjunto de N funcio-
una unidad de salida simple para simplificar la exposicin nes (generalmente no lineales), conocidas como funciones
sin prdida de generalidad. La red es diseada para ejecutar de base radial, y denota la distancia eucldea. Los puntos
una acotacin no lineal desde el espacio de entrada hasta el de datos conocidos son escogidos como
espacio oculto, seguido por una acotacin lineal desde el los centros de las funciones de base radial.
espacio oculto hasta el espacio de salida. Denotamos con p Insertando las condiciones de interpolacin anteriores,
la dimensin del espacio de entrada. Entonces, de manera obtenemos el siguiente conjunto de ecuaciones lineales para
global, la red representa un plano desde el espacio de entra- los coeficientes desconocidos (pesos) {wi } .

8 P REZ M ESA , J. C. ET AL . E MPLEO DE REDES NEURONALES DE BASE RADIAL ...


CIENCIAS S OCIALES

(3) distintos, la matriz de interpolacin (7) es positiva y as, de


este modo, podemos resolver la ecuacin (3) para
despejar el vector de pesos w, obteniendo:

donde Donde -1 es la inversa de la matriz de interpolacin .


Aunque en la teora se asegura una solucin al problema de
, j , i = 1, 2,..., N (4) interpolacin estricta, en la prctica no lo podemos resolver
cuando la matriz est arbitrariamente cerca de ser singu-
y definiendo d y w como: lar. En este punto, la teora de la regularizacin puede ayudar,
y lo hace cambiando la matriz de interpolacin por + .
(5)
2. Un modelo para explicar las exportaciones de tomate de
las empresas de economa social de la provincia de Almera
w = [ w1 , w2 ,..., wN ] (6)
T

Los vectores d y w de longitud N representan el vector de 2.1. Metodologa


salida deseado y, el vector de pesos lineal, respectivamente. En este apartado intentaremos sealar cules son los factores
Denotando con a la matriz (N x N) con elementos que determinantes de la demanda exterior de tomate de las empre-
llamaremos matriz de interpolacin: sas de economa social, que se caracterizan por un sistema de
comercializacin en destino, diferente al existente en alhndiga.5
(7) Chebil y Briz op. cit. (2000) estiman una funcin de exportacin
hortcola espaola, utilizando como regresores: a) variables de
Hay una clase de funciones de base radial que cumplen la competitividad del precio de exportacin espaol en comparacin

==
dwjijiw
p
(
==[{= 1
)
d1d,jid|d N]
, i =di1,
j x
x2 j,...,
T
N}
2,...,siguiente propiedad (Light, 1992): con el de la Unin Europea (UE); b) variables de renta en el lugar
Si x1 , x2 ,..., xN son puntos distintos en
. Entonces la ma- de destino y c) una variable de demanda interna (produccin +
triz de interpolacin de (N x N) elementos () cuyos ele- exportaciones importaciones). Tambi (1998) utiliza la variable pro-
mentos son es positiva. duccin total en su funcin de exportacin de cacao y caf, usan-
Este teorema es ms poderoso que el resultado previo do, adems, una variable de precios en origen y de exportacin,
atribuido a Micchelli (1986) donde conclua que la matriz debiendo componer una variable adicional de relacin entre am-
de interpolacin es no-singular, es decir, que la matriz de bas cotizaciones para evitar la multicolinealidad; otros prefieren
interpolacin tiene inversa. utilizar la variacin de produccin como variable exgena del
El teorema de Light (1992) se aplica, entre otros, a los modelo (Mura y Araiztegui, 1994), conjuntamente con los pre-
siguientes casos: cios a nivel nacional e internacional del producto del cual se inten-
Multicuadrados inversos tan explicar sus exportaciones (en su caso almendra).
Las variables utilizadas en el modelo son:
1
(r ) = para cualquier c > 0, y r 0 XALt= Exportacin semanal de empresas de economa so-
(r + c2 )
1
2 2
cial de la provincia de Almera para la campaa 1998/99.
Los datos corresponden a la base de datos de COEXPHAL-FAECA.
Funciones Gausianas XMAt= Exportaciones semanales de Marruecos para la cam-
paa 1998/99.
r2
(r ) = exp 2
para cualquier > 0, y r 0 XFEt= Exportaciones del resto de asociaciones pertenecien-
2 tes a FEPEX (Murcia, Alicante, Las Palmas y Tenerife) para
No obstante, algunas investigaciones tericas y resulta- la campaa 1998/99.
dos prcticos, parecen mostrar que el tipo de funcin no PXt= Precios en origen del tomate: corresponde a la cotiza-
lineal no es crucial para el rendimiento de la red de funcin de cin media en Alhndiga para la campaa 1998/99.
base radial.
Si retornamos a la implicacin del teorema de Light, pode- 5. Una explicacin de esta frmula de comercio de frutas y hortalizas mediante subasta

mos decir que preservando que los puntos de datos sean puede verse en De Pablo y Prez Mesa (2002).

C I E N C I A e r g o s u m , V o l . 1 4- 1, marzo- junio 2 0 0 7 9
CIENCIAS SOCIALES

PALt= Produccin semanal de las empresas almeriense. Datos Tabla 2. Relacin 1 a largo plazo. Variable dependiente

COEXPHAL-FAECA. Campaa 1998/99. Coeficiente t-student Probabilidad


El estudio abarca, segn observaciones,6 desde la semana
C 5.256 2.687 0.012
41 de 1998 hasta la semana 20 de 1999. Trabajamos con PXt -0.276 -2.260 0.014
datos trasformados en logaritmos, de esta manera los coefi- PALt 0.894 13.411 0.000
XFEt -0.257 -1.650 0.110
cientes que acompaan a las variables sern elasticidades.
XMAt 0.054 1.102 0.285
El modelo propuesto7 es el siguiente:
R2Aj. 0.968
DW 2.009
XALt =a1+b1 XMAt+b2 XFEt+b3 PXt+b4 PALt+ et (8) F 230.980
Prob 0.000
ADF (1) -3.420
El anlisis de todas las variables que conforman ambos ADF (2) -3.365
modelos (tabla 1) muestra que no son estacionarias; sin ADF (3) -3.498
embargo, los residuos de los dos modelos s lo son (tabla 2 (1) Con trmino independiente y tendencia. Valor Mackinnon al 5% de la prueba ADF
para rechazar la hiptesis de raz unitaria = 3.561
y 3), esto nos indica de la presencia de cointegracin. Las (2) Con trmino independiente. Valor Mackinnon al 5% de la prueba ADF para rechazar
la hiptesis de raz unitaria = 2.959.
exportaciones de Marruecos no resultan significativas (al (3) Sin trmino independiente ni tendencia. Valor Mackinnon al 5% de la prueba ADF
para rechazar la hiptesis de raz unitaria = 1.951.
5%) para explicar las exportaciones almerienses, al igual
que las exportaciones del resto de provincias espaolas. Se
cin de las exportaciones almerienses son inferiores a la
construye por este motivo un modelo que explica las ex-
unidad. Los ajustes, medidos por el R2, son en los dos casos
portaciones almerienses en funcin de su produccin y los
superiores al 95%.
precios en origen8 (tabla 3): la elasticidad precio y produc-
2.2. Aplicacin de redes neuronales de base radial
Tabla 1. Prueba de Dickey-Full aumentada (ADF) con un rezago. Con el modelo economtrico (8), aplicamos la metodologa
Variables (1) (2) (3) (1) (2) (3) de redes neuronales de base radial.9 Vamos a probar la inclu-
XALt -0.600 -1.315 -1.197 -4.210 -3.893 -3.679 sin de las variables, que mediante anlisis economtrico tra-
XMAt -0.750 -4.788 -4.444
-2.967 -1.904 -4.745
dicional no resultaban significativas. El modelo de redes
PALt -1.472 -1.654 -1.577 -4.651 -3.276 -3.207
XFEt -0.426 -1.718 -0.087 -4.424 3.638 -3.341 neuronales, puede encontrar relaciones que la metodologa
PXt -1.754 -0.150 -0.321 -5.252 4.490 -4.812 tradicional estadstica soslaya. De esta forma probaremos
(1) Con trmino independiente y tendencia. Valor Mackinnon al 5% del test ADF para dos alternativas: a) una modelizacin con las variables que
rechazar la hiptesis de raz unitaria = 3.561.
(2) Con trmino independiente. Valor Mackinnon al 5% del test ADF para rechazar nos aconseja la metodologa economtrica tradicional (tabla
la hiptesis de raz unitaria = 2.959.
(3) Sin trmino independiente ni tendencia. Valor Mackinnon al 5% del test ADF 3), b) otra alternativa que incluye todas ellas (tabla 2).
para rechazar la hiptesis de raz unitaria = 1.951.
La construccin de la red neuronal asociada al trabajo es
una red de funciones de base radial que se construye de forma
6. La serie de Marruecos provena del Ministerio de Agricultura Marroqu. Sin embargo dinmica, por lo que depender del tamao de la muestra de
sta dej de ser facilitada en cuanto las autoridades de Marruecos descubrieron que entrenamiento y de las condiciones (aleatorias) iniciales.
se utilizaba para el control del contingente de exportacin a la UE, por parte de las Se han ensayado 50 modelos en total con la misma arqui-
asociaciones de empresas exportadoras espaolas.
tectura, el primer grupo (25 modelos) utiliza 20 datos como
7. Si se considera que alguna de las variables independientes est medida con error, es
Tabla 3. Modelo 2 a largo plazo. Variable dependiente XALt (OLS).
aplicable la estimacin con variables instrumentales.
Coeficiente t-student Probabilidad
8. Sobre esta especificacin se construye un modelo con MCE (ver anexo). El MCE es

significativo y muy prximo a uno, con signo negativo, lo que nos indica que cada C 2.621 2.097 0.045
PXt -0.266 -2.559 0.016
semana se corrige 99% de las desviaciones producidas en el periodo anterior. El
PALt 0.845 15.466 0.000
modelo propuesto sirve adems como test de verificacin de la relacin de
R2 Aj. 0.966
cointegracin examinando la significacin del coeficiente que acompaa a la correccin DW 1.772
F 443.124
del error (Kremers et al., 1992).
Prob 0.000
9. Para la utilizacin de redes neuronales de base radial se ha empleado una aplicacin ADF (1) -3.177
ADF (2) -3.128
desarrollada para MATLAB, por el Departamento de Lenguajes y Sistemas de la
ADF (3) -3.196
Universidad de Almera.

10 P REZ M ESA , J. C. ET AL . E MPLEO DE REDES NEURONALES DE BASE RADIAL ...


CIENCIAS S OCIALES

patrones de entrada escogidos de forma aleatoria. Poste- Tabla 5. Modelizacin con variables estadsticamente significativas y no

riormente se realiza una estimacin con la muestra completa significativas.

de 32 puntos. Con la red entrenada se realizan las prediccio- Entrenamiento R2

nes sobre la serie completa utilizada en el entrenamiento. Grupo de datos 1:20 0.6706

Hemos incluido cuatro neuronas en la capa intermedia Grupo de datos 2:32 0.9954
en el modelo con inclusin de todas las variables y tres
neuronas con el modelo de variables significativas (figura MCO 0.9704

1). El procedimiento que seguimos para escoger el nmero Prueba sobre residuos del modelo final de redes
Prueba ADF Ljung-Box Probabilidad
de neuronas fue el de prueba y error.10 Se ha utilizado un
(1) 5.241 Q(1) 0.128
entrenamiento supervisado.11 La funcin de activacin de
(2) 5.150 Q(4) 0.112
la capa oculta ha sido gausiana. La razn de aprendizaje se (3) 5.334 Q(10) 0.505
ha fijado en 0.01. En redes R2= medio de 25 modelos por grupo de datos.

Los 12 puntos restantes del primer grupo (para ambos


modelos tablas 4 y 5) se utilizan como muestra interme- (32 casos): en general se observa, en las tablas 4 y 5, cmo los
dia de validacin, obteniendo en su prediccin un R2 medio resultados, al comparar redes y modelo tradicional, son simila-
res. Tambin se puede ver (tabla 5)
Figura 1. Arquitectura de las redes utilizadas.
cmo la inclusin de todas las varia-
bles (significativas y no significativas)
mejora el ajuste mediante redes.13 El
PX t
anlisis de la estacionariedad y la
PX t
PAL t autocorrelacin de los residuos, en
XAL t XAL el modelo de redes, nos puede ser-
t
XFE t
PAL t vir para contrastar la mejorabilidad
del modelo ya que se puede deber a
XMA t
la existencia de comportamientos no
modelizados. En este sentido, las dos
versiones muestran autocorrelacin
del 25% y 65% respectivamente, lo que nos muestra un
proceso de generalizacin correcto para el caso de la inclu- 10. Normalmente el nmero de neuronas de la capa oculta se determina de forma artesanal

sin de variables significativas y no significativas, es decir, dependiendo de la experiencia del propio investigador (con carencia de esta

no existe sobreaprendizaje;12 para el primer caso parece experiencia el mtodo de prueba y error es el ms utilizado); otro algoritmo tpico es
existir un proceso de generalizacin incorrecto. Se observa, el desarrollado por Platt (1991) que consiste en ir aadiendo neuronas a la capa
adems, cmo los resultados del modelo de redes mejoran
oculta siempre que disminuya el error.
con la dimensin de la muestra de aprendizaje (al pasar de
11. En este tipo de entrenamiento, tanto los centros como los pesos, las desviaciones, son
20 a 32 datos). La comparacin con el modelo economtrico
calculados en la propia fase de entrenamiento. El entrenamiento de este tipo de aprendizaje
se realiza con la red entrenada con la totalidad de patrones
se realiza mediante clculos iterativos basados en el mtodo del gradiente descendente.

12. Uno de los problemas fundamentales que puede aparecer cuando se entrena una red
Tabla 4. Modelizacin con variables estadsticamente significativas.
neuronal es que se produzca un sobreaprendizaje, es decir, la red es capaz de aprender
Entrenamiento R2
de forma precisa los patrones con los que se entren, pero cuando se le presentan
Grupo de datos 1:20 0.4237
otros que no tuvieron que ver en el entrenamiento (patrones de validacin) devuelve
Grupo de datos 2:32 0.9394
valores alejados de la realidad. Normalmente el error de validacin debe ser similar al de

MCO 0.9688 entrenamiento, de esta forma se puede ver que la red est llevando a cabo un proceso

Prueba sobre residuos del modelo final de redes de generalizacin correcto. El problema del sobreaprendizaje suele venir provocado

Prueba ADF Ljung-Box Probabilidad porque los patrones de aprendizaje son muy diferentes a los utilizados para validar.

(1) 2.870 Q(1) 0.327 13. La inclusin de variables no relevantes en un modelo economtrico provoca que los
(2) 3.037 Q(4) 0.292
(3) 2.961 Q(10) 0.382 estimadores tengan mayores errores estndar: lo que podra provocar errores de

En redes R2= medio de 25 modelos por grupo de datos. especificacin (rechazar variables relevantes) que afecten a los resultados de la prediccin.

C I E N C I A e r g o s u m , V o l . 1 4- 1, marzo- junio 2 0 0 7 11
CIENCIAS SOCIALES

en los residuos, aunque sta parece mejorar con la inclusin Muchas veces, a la hora de predecir, suele ser ms impor-
de las variables estadsticamente no significativas. El an- tante la capacidad del modelo para captar los cambios de di-
lisis de los residuos nos sirve como punto adicional de reccin, que los resultados numricos (Henriksson y Merton,
valoracin de las redes neuronales. 1981): si ste fuera nuestro inters vemos (grfico 1) cmo los
Al analizar los resultados de la prediccin (tabla 6), vemos dos mejores modelos en prediccin (variables significativas
cmo con la inclusin de las variables estadsticamente signifi- con MCO e inclusin de todas las variables con redes) mues-
cativas, el modelo de red proporciona resultados en la predic- tran resultados algo distintos: los MCO consiguen predecir los
cin muy similares a los obtenidos al introducir tambin las tres cambios de direccin en la serie, mientras que el mejor15
variables no significativas, estando por debajo del nivel que los modelo de redes falla al predecir la subida de la semana sexta
MCO: el mejor modelo de redes alcanza un R2 de 73% frente de la serie de prediccin. Ambos tipos de modelizacin predi-
al 85% de los MCO. Para completar la informacin que nos cen un aumento de las exportaciones en la semana dcima,
proporcionan los coeficientes de determinacin se utiliza la U de cuando en realidad se produce un descenso.
Theil como medida del error de prediccin (Theil, 1961), su
clculo muestra resultados mejores para los modelos neuronales, Conclusiones
sin embargo, para ambos tipos de modelizacin la U est muy
cercana a cero por lo que las diferencias son mnimas. Se analizan en este apartado las conclusiones ms relevan-
tes en cuanto a la interpretacin general de modelo de ex-
Tabla 6. Resultados de la prediccin con diez puntos adicionales (Semana 41 a
portaciones de tomate para las empresas de economa so-
50 de la Campaa 1999/2000).
cial. Los precios en origen tienen influencia en las exporta-
Resultados de prediccin R2 Theils U14
ciones; sin embargo, la elasticidad es menor que uno, lo que
MCO (todas la variables) 0.805 0.019
nos dice que los cambios de los precios producirn una
MCO (variables significativas) 0.858 0.020 variacin menos que proporcional en las exportaciones pro-
Redes (todas las variables) 0.731 0.017 vinciales de las empresas de comercializacin en destino.
Redes (variables significativas) 0.702 0.017
Las exportaciones de tomate marroqu no parecen influir en
la exportacin de tomate de la provincia. Esto puede deberse a
Grfica 1. Predicciones sobre los 10 puntos adicionales de la serie de que el lmite de exportacin a la UE, situado en la campaa
exportaciones). 1998/1999 en 168,757 toneladas (el contingente de tomate
entre los meses de octubre a marzo se situaba para la campaa
1998/99 en 150,676 tm), era un volumen asimilable por el
mercado en destino;16 lo que no quiere decir que con futuros
contingentes la situacin no pueda variar.
Las exportaciones del resto de asociaciones FEPEX no re-
sultan significativas, esto es explicable si tenemos en cuenta
que en Espaa existe un cierto reparto de los mercados y por
tanto no existe una competencia sustitutiva (De Pablo, Prez
y Garca, 2004).17 Los cambios en la produccin almeriense
producen alteraciones en las exportaciones, en nuestro caso,
menos que proporcionales: se aprecia preferencia al merca-
Fuente: Elaboracin propia do interior frente al exterior que se puede deber a la dificul-
tad de colocar gnero en los mercados de exportacin en
14. Donde U= ( ( y y) / y )
2 2 1/ 2
, si U=0 los pronsticos sern perfectos. los momentos de produccin no esperada.
15. Al hablar de mejor modelo nos referimos a la existencia de un R2 ms elevado al realizar
Un inconveniente general de la red es que no se posee, en
sentido estricto, un modelo sobre el que realizar interpreta-
el entrenamiento con 32 patrones.
ciones econmicas de los coeficientes, por lo que en princi-
16. Para la campaa 2005/2006 el contingente base se sita en 185 000 toneladas, cantidad
pio, las redes neuronales se pueden destinar, ms fcilmente,
a la que debemos sumar 38 000 toneladas de contingente adicional.
a procesos de prediccin que de interpretacin; por este
17. Esta situacin parece estar cambiando en campaas ms recientes: Almera est motivo, en este apartado, evaluamos las redes neuronales en
incrementando sus exportaciones hacia el mercado alemn entrando en competencia comparacin con la modelizacin tradicional en su vertiente
directa con el resto de provincias espaolas. de prediccin.

12 P REZ M ESA , J. C. ET AL . E MPLEO DE REDES NEURONALES DE BASE RADIAL ...


CIENCIAS S OCIALES

Los resultados de los modelos desarrollados en este artculo predicciones con datos fuera de la serie original, stos son
muestran que no parecen existir problemas en las redes al incluir inferiores que los obtenidos mediante modelizacin
variables estadsticamente no significativas (los resultados son economtrica. Al realizar un anlisis de los residuos de los
prcticamente idnticos): la inclusin de stas en modelos de modelos de redes vemos que existe autocorrelacin, lo
MCO incrementa el coeficiente de correlacin y adems puede que sirve de aviso de una potencialidad no explotada en
producir problemas en la especificacin del modelo y, por ende, el modelo.
afectar la prediccin. Este problema no existira con la A modo de coda, aunque a primera vista ambas frmulas
modelizacin de redes neuronales pues no estn condicionadas de modelizacin son similares, los modelos de redes mues-
por una especificacin funcional anterior y una distribucin del tran condicionantes que cuestionan su fiabilidad, como son:
error, y son estimadores muy robustos bajo condiciones extre- la existencia de sobreentrenamiento (generalizacin incorrecta:
mas de no-normalidad (Richards, Patterson y Van Ispelen, 1998). inferiores resultados en la prediccin) e incluso patrones no
Los resultados de los modelos de redes son similares a aleatorios en los residuos. Por tanto, en el ejemplo desarrolla-
los de MCO (utilizando 32 patrones de entrenamiento, y do, no existiran evidencias concluyentes para seleccionar las
como medida de bondad el R2); sin embargo, al realizar redes neuronales frente a la metodologa tradicional.

Bibliografa

Bromead, D. S. y D. Lowe (1988). Multivariable hortofrutcola espaola: una aplicacin a la produccin Power of Cointegration Test. Oxford Bulletin
Function Interpolation and Adaptive Net- intensiva. Thomson-Civitas, Madrid. of Economics and Statistic. Vol. 54.
works, Complex System. 21. Freeman, J. A. y D. Skapura (1991). Neural Net- Leonard, J.A.; M. A. Kramer y L. H. Ungar (1992).
Caridad, J. M. y N. Ceular (2001). Un anlisis del works. Algorithms, Applications, and Programming Using Radial Basis Functions to Approxi-
mercado de vivienda a travs de redes Technique. Addison-Wesley Publishing Com- mate a Function and its Error Bounds. Dept.
neuronales artificiales, Estudios de Economa pany, Inc. Massachusetts. of Chem. Eng., MIT, Cambridge, MA, USA. IEEE
Aplicada. Nm. 18. Haykin, S. (1994). Neural Networks. IEEE press. Transactions on Neural Networks. Vol.3,
Chebil, A.y J. Briz (1999). Escenario competitivo Henriksson, R.D. y R. C. Merton (1981). On Nm. 4; July, pp 624-627.
del sector hortcola espaol, Rev. Distribucin Market Timing and Investment Performance, Light, W. A. (1992). Some Aspects of Radial
y Consumo. Nm. 52. II . Statistical Procedures for Evaluating Basis Function Approximation, en S.P. Singh
Corchado J. M.; Daz, F.; Borrajo L.: Fernndez, Forescasting Skills. Journal of Bussines. 54. (edit.). Approximation Theory, Spline Functions
F. (2000). Redes neuronales artificiales. Un enfoque Horak, D. T. (1991). Recursive Radial Basis Func- and Applications. NATO. ASI Series. Vol. 256,
prctico, Servicio de publicaciones de la tions for Multivariable Function Approxi- Kluwer Acad., Boston.
Universidad de Vigo. mation. Allied-Signal Aerosp. Co., Colum- Light W.A. y E. W. Cheney (1991). Interpolation
Cover, T.M. (1965). Geometrical and statisti- bia, MD, USA. Proceedings of the 1991 Ameri- by piecewise-linear radial basis functions.
cal properties of system of linear inequali- can Control Conference ( IEEE Cat. No. II, Journal of Approximation Theory. Vol.64, nm.
ties with applications in pattern recogni- 91CH2939-7). American Autom. Control Council, 1. Dept. of Math., Lancaster Univ., UK.
tion. IEEE Transactions on Electronic Comput- Evanston, IL, USA. Vol.1, pp.25-27. McClelland, J. y Rumelhart (1986). Parallel Dis-
ers. 14. Jetter, K. y J. Stockler (1991). Algorithms for tributed Processing. Vol. I y 2. MIT Press. Cam-
De Pablo, J. y Prez Mesa, J.C. (2002). Las Cardinal Interpolation Using Box Splines and bridge, MA.
Alhndigas, pasado, presente y futuro. Rev. Radial Basis Functions. Numerische- Micchelli, C.A. (1986). Interpolation of scattered
Distribucin y Consumo. Nm. 66. Mathematik. Vol.60, Nm.1. FB Math., data: distance matrices and conditionally posi-
De Pablo, J.; J. C. Prez-Mesa y R. Garca Duisburg Univ., Germany. tive define functions. Constructive Approxi-
(2004). Caracterizacin de la comercializacin Kremers, J., Ericsson N. y Dolado, J. (1992). The mation, 2.

C I E N C I A e r g o s u m , V o l . 1 4- 1, marzo- junio 2 0 0 7 13
CIENCIAS SOCIALES

Moody, J. y C. Darken (1989). Fast Learning in Cantabria, Santander, Spain.. Nanterre, France. Contables. <http://www.5campus. org/
Networks of Locally Tuned Processing Platt, J. (1991). A Resourceallocating Networks leccion/redes> (26/02/2002).
Units. Neural Computation. Vol. 1. for Funcion Implementation. Neural Com- Tambi, E. (1999). Co-integration and Error
Mura J. y A. Araiztegui (1994). Exportaciones de putation, 3. Correction Modelling of Agricultural Ex-
almendra: anlisis de calendarios y demanda. Poggio, T.; Girosi, F. (1990). Networks for Ap- port Supply in Cameroon. Journal of Agricul-
Rev. Espaola de Economa Agraria. Nm. 170. proximation and Learning. Proc. IEEE, 78. tural Economics, 20.
Musavi, M.T. y W. J. Liu (1991). Best Match Algorithm Powel, M. J. D. (1987). Radial basic functions Thau R.S. (1991). Application of Generalized
with Radial Basis Functions. Dept. of Comput. for multivariable interpolation, a review. Ma- Radial Basis Functions to the problem of
Eng., Maine Univ., Orono, ME, USA. IJCNN- son and Cox (eds.), Algorithms for Approxima- object recognition, Proceedings of the SPIE-The
91-Seattle: International Joint Conference on Neural tion. Oxford. Clarendon Press. International Society for Optical Engineering. Vol.1
Networks (Cat. No.91CH3049-4). IEEE. Vol. 2. Renals, D. (1989). Radial basics function net- MIT, Artificial Intelligence Lab., Cambridge,
New York, NY, USA. work for speech pattern classification. Elec- MA, USA.

Otero, J. M. y F. Trujillo (1992). Prediccin tronic Letters, 25, pp. 437-439. Theil, H. (1961). Economic Forescasts and Policy.
multivariante y multiperiodo mediante una Richards, T.; Patterson, P.; Van Ispelen, P. (1998). Amsterdam, North-Holland.
red neuronal: estudio de un caso. Estudios de Modeling Fresh Tomato Marketing Margins: Valls, J. M.; Molina, J.M.; Galvn, I. M. (2000).
Economa Aplicada. VI Reunin anual de ASEPELT- Econometrics and Neural Networks .Agri- Sistema Multiagente para el diseo de Redes
ESPAA. cultural and Resource Economics. December. de Neuronas de Base Radial ptimas. Revista
Pantalen, C.J.; Daz de Mara, F.; Figueiras Vidal Rosenblatt, F. (1958). The Perceptron: A Proba- Iberoamericana de Inteligencia Artificial. Nm. 10.
A. R. (1993). On training RBF networks. Sixth bilistic Model for Information Storage and Werntges, H.W. (1993). Partitions of unity im-
International Conference Neural Networks and their Organization in the Brain. Psycological Review. prove neural function approximators, IEEE
Industrial and Cognitive Applications. NEURO-NIMES Nm. 65. International Conference on Neural Networks (Cat.
93 Conference Proceedings and Exhibition Catalog. Serrano C. (2000). Las redes neuronales No.93CH3274-8). Dept. of Biophys.,
EC2 Dept. of Electron., ETSI Telecom-Univ. artificiales, 5campus.org, Sistemas Informativos Dusseldorf Univ., Germany. York, NY, USA.

14 P REZ M ESA , J. C. ET AL . E MPLEO DE REDES NEURONALES DE BASE RADIAL ...

You might also like