Professional Documents
Culture Documents
Santiago de Chile
Diciembre 2004
INDICE
Parte I
I.1 Introduccin.5
I.2 Marco Terico.6
I.2.1 Redes Neuronales Artificiales (RNA)...9
I.2.1.a RNA: Sistemas paralelos, distribuidos y adaptativos......10
I.2.1.b LA Neurona.....11
I.2.1.c Funciones de activacin14
I.2.1.d Arquitectura de RNA..16
I.2.1.e Proceso de aprendizaje........18
I.2.1.f Generalizacin v/s memorizacin........19
I.2.1.g Sntesis sobre redes neuronales.....20
Parte II
II.1 Metodologa..22
II.1.1 Mtodo Rolling..22
II.1.2 RNA Utilizada23
II.1.3 Modelo para la rentabilidad........24
II.1.4 Conformacin de portfolios........24
II.1.4.a Segn los betas........24
II.1.4.b Segn RNA26
II.1.5 Resultados comparables........28
II.1.6 Validacin y capacidad predictiva de los modelos.29
II.1.7 Datos..31
Parte III
III.1 Resultados..33
III.1.1 Capacidad predictiva..33
III.1.2 Portfolios...34
Parte IV
IV.1 Conclusiones..37
Anexo 1: Evolucin del Dow Jones diciembre 2000 a diciembre 2004....39
Referencias...41
Parte I
I.1 INTRODUCCIN
Hoy en da las redes neuronales son aplicadas en muchas reas como la
geologa, fsica o matemticas. Incluso son utilizadas por las isapres para detectar
licencias falsas. En el rea de las finanzas se han aplicado para predecir precios
de commodities como el oro, para estimar la probabilidad de quiebra y para
evaluar la calidad crediticia, entre muchas otras aplicaciones.
Esta tesis pretende evaluar como se habra desempeado un administrador
de carteras de inversin o un inversionista que hubiese seguido las
recomendaciones de compra y venta dadas por las predicciones de una red
neuronal artificial, reconformando su portfolio de forma semanal, durante 190
semanas consecutivas. Como benchmark utilizaremos las estrategias de buy and
hold y portfolios conformados utilizando el beta como medida de riesgo.
Para la conformacin de las carteras de cada semana se usar un proceso
Rolling en el que los datos ms nuevos irn siendo agregados y los ms antiguos
se irn eliminando de las series usadas en el estudio.
debera, segn ellos, a que habra un componente de largo plazo del mercado que
sera posible modelar y proyectar.
De hecho, antes de juntarse con Campbell; Lo y MacKinlay ya haban
escrito en 1988 su paper llamado Los precios accionarios no siguen un random
walk: evidencia sacada de una prueba simple de especificacin. En el que, como
lo dice su nombre, encontraron evidencia de que los precios accionarios no siguen
necesariamente un random walk y de que seran predecibles en cierto grado,
basados en que identificaron una correlacin sistemtica positiva entre los
retornos semanales de los principales mercados mundiales.
Muchos otros estudios han encontrado evidencia sobre la predictibilidad de
los retornos tanto a corto como largo plazo. Tambin Ferson y Harvey en 1991
descubrieron que muchas variables que sirven para explicar la rentabilidad de los
activos son predecibles. Lo que hara que los retornos de las acciones sean
predecibles, por lo menos de forma indirecta. Adems, Leung, Daouk y Cheng en
el ao 2000 concluyen que la prediccin de los retornos accionarios es un hecho
real, haciendo que la pregunta ya no sea si se puede o no predecir los retornos, si
no que como se debe usar la informacin de forma ptima para poder predecirlos.
En este mismo estudio se demostr que se podan obtener mejores resultados y
por ende mayores utilidades al intentar predecir el signo de los cambios de los
precios de los activos en vez de tratar de predecir el nivel exacto que alcanzarn.
As, en todos estos ltimos estudios y muchos otros podemos fundamentar
la idea de querer predecir lo que ocurrir en el futuro con los retornos de las
acciones y segn eso conformar nuestros portfolios de forma semanal (en este
caso), ya sea a partir de anlisis tcnico o el anlisis fundamental. Esto, claro,
reconociendo que las redes neuronales o cualquier otro mtodo matemtico que
usemos para predecir lo que ocurrir con los retornos no podrn conocer lo que
ocurre en el exterior o sea no podrn considerar datos como la ocurrencia de un
desastre natural o que se lleve a cabo un atentado terrorista, por lo que siempre el
Extracto del captulo 1 del libro Redes neuronales y sistemas borrosos de Martn del Bro y Alfredo Sanz
Molina
10
11
diagrama
funcionales
se
bsicas.
aprecian
La
sus
partes
neurona
recibe
por
un
proceso
denominado
por
el
axn
hasta
los
botones
viajan
la
donde
se
generan
12
hasta su destino a travs de miles de neuronas, cada una con una funcin
especfica.
En la Figura 3 se puede ver un diagrama bsico de una neurona o
Procesador Elemental (PE) de una RNA. Ahora es fcil apreciar la similitud entre
las neuronas biolgicas y los PE de las RNA. Tenemos que la neurona recibe
informacin desde distintas fuentes, esta vez, la informacin consistir de datos
provenientes de otras neuronas. A cada dato le asignar un peso (Wij) que podr
tomar valores entre 1 y -1, este depender de la intensidad de interaccin entre la
neurona que genera el dato y la que lo recibe, el valor del peso depender de:
ij
xj
13
y i (t ) = f i wij x j
j
14
F ( x) = e
La
funcin
Complemento
x2
de
F ( x) = 1 e
x2
Al usar estas dos funciones en dos slabs2 distintos dentro de la capa oculta,
se logra que la capa de salida tenga dos perspectivas de los datos. Al combinar
los dos puntos de vista de las caractersticas de los datos, se puede lograr una
mejor prediccin.
2
Un Slab es un conjunto de neuronas que pertenecen a la misma capa y usan la misma funcin
de activacin. Puede existir ms de un slab dentro de cada capa. De hecho en esta tesis la capa
oculta poseer dos slabs, como se ver ms adelante.
15
Hay que decir que las neuronas de la capa de entrada tambin tienen
funciones de activacin, pero stas por lo general son transformaciones lineales.
Lo que buscan estas funciones es transformar los datos de entrada a un formato
ms amigable, dejando todos los datos de entrada en la misma escala para que
la red neuronal trabaje con ellos, llevndolos todos a la misma escala, hacindolos
comparables. En otras palabras traduce los datos a un lenguaje ms fcil de
entender para la red neuronal. Despus, cuando los datos finales salen de la capa
de salida, son des - traducidos aplicndoles la funcin inversa de la funcin de
activacin de la capa de entrada.
I.2.1.d ARQUITECTURA DE RNA3
La arquitectura de una RNA constituye la forma en
que estn distribuidas las neuronas, grupos de neuronas
(slabs), capas y como estn conectadas e interactan
entre s. Tambin definirn como fluye la informacin a
Fig. 6: Red de 3 capas
con arquitectura estndar
travs de la red.
16
que aparece en la figura 7, del esquema se puede ver que se les llama
conexiones jump debido a que hay conexiones entre capas que no son sucesivas
en la red. Un tercer tipo de redes ms comnmente
usadas son las de Jordan Elman ilustrada en la figura
8 una particularidad de estas redes es que los grupos de
neuronas se pueden realimentar con su propia
informacin o con la informacin de una capa paralela.
Se puede ver que este tipo de redes la capa de entrada
Fig. 9: Red
polinomial GMDH
tiene 2 slabs de neuronas, o sea que hay un slab extra. Esto le permite a la red ver
el conocimiento anterior que tena sobre las entradas anteriores. El cuarto tipo de
arquitectura que deseo mencionar es la red polinomial GMDH (Group Method of
Data Handling) o la red polinomial de Mtodo de Manejo Grupal de Datos que se
puede ver en la figura 9.
17
18
valores
para
ese
sean
necesarias
hasta
19
Segn D.E. Rumelhart y J.L. McClelland del Parallel Distributed Processing Research Group de la
Universidad de California en San Diego.
20
21
Parte II
II.1 METODOLOGA
Lo que persigue esta tesis es evaluar como le habra ido a un inversionista
si hubiese conformado su portfolio de acuerdo a las recomendaciones de una red
neuronal durante 190 semanas (3 aos y 8 meses aproximadamente). Para
evaluarlo se tomaron datos pasados con los que se fueron conformando carteras
semanalmente, segn lo recomendado por la RNA y se calcul la rentabilidad que
habra obtenido cada cartera segn lo que ocurri en la realidad. Estos resultado
se compararon tanto con portfolios conformados segn los Betas (coeficientes de
correlacin con el mercado) de cada accin y con una estrategia ingenua o de
Buy & Hold. Adems, para efectos de la compra y venta de acciones se
consider un costo US$ 10 por transaccin, para hacer ms realista el ejercicio.
Para el desarrollo de esta investigacin se us el software Microsoft Office
Excel, en el que se program la red neuronal mediante el uso del software,
tambin de Microsoft, Visual Basic. Adems se us el complemento de Excel
llamado Super Solver que es una versin ms poderosa y moderna del tpico
Solver que viene junto con Excel.
II.1.1 MTODO ROLLING
Para ir sacando las predicciones de la red neuronal se us el mtodo de
Rolling que consiste en que cada vez que la red neuronal debe hacer una
prediccin para la siguiente semana, esta se vuelve a entrenar. Pero esta vez se
quita del conjunto de entrenamiento la semana ms alejada en el tiempo y se
agrega una semana ms nueva que todas las ya existentes en el conjunto. As, la
red recalcula los pesos sinpticos para cada semana que va a predecir.
Este mtodo se us basado en las recomendaciones que se hacen en el
paper Parisi, Parisi y Guerrero (2003). Los que concluyeron que los pesos
22
sinpticos, (wij) por los que se pondera cada trozo de informacin que entra a
cada neurona, no eran estables a travs del tiempo.
II.1.2 RNA UTILIZADA
Para este estudio se us una red Ward, siguiendo nuevamente las
recomendaciones de Parisi, Parisi y Guerrero (2003), ya que en ese paper
encontraron que esta era la mejor arquitectura para este tipo de prediccin.
Como
anteriormente,
ya
se
dijo
la
red
Ward
slab.
da
activacin
As,
para
en
esta
investigacin se us la funcin
Gaussiana en un slab de la
capa oculta y una
funcin
Complemento de Gaussiana en
la otra. Nuevamente, como ya
se mencion con anterioridad,
esto permite que la red tenga
23
Var ( x ) = Var (VarDow 1 , VarDow 2 , VarDow 3 , VarDow 5 , VarX 1 , VarX 2 , VarX 3 , VarX 4 )
Donde X corresponde a la accin cuya variacin se busca predecir y los
subndices indican cuantas semanas antes de la prediccin fue tomado el dato.
II.1.4 CONFORMACIN DE PORTFOLIOS
Como ya se dijo antes, compararemos los portfolios conformados por redes
neuronales con los conformados a partir de los betas de cada accin. Por lo que a
continuacin se explican ambos mtodos de conformacin de carteras.
II.1.4.a SEGN LOS BETAS
El riesgo de un portfolio de acciones depender del riesgo de los activos
que lo compongan y en que proporcin lo hacen. De la misma forma el retorno
esperado de la cartera depender del retorno esperado de sus componentes.
As, el beta de una cartera es el promedio ponderado de los betas de las
acciones por la proporcin de la cartera invertida en cada una. Por ende, una vez
que se tiene el Beta histrico para cada accin, el Beta del portfolio sera:
24
portfolio = i * i
i =1
Tal
que : i = 1
i =1
E ( R portfolio ) = E ( Ri )i
i =1
n
Tal que : i = 1
i =1
La cantidad de semanas hacia atrs que se use depender del criterio del analista
25
R portfolio = R i i
i =1
Tal que : i = 1
i =1
26
Riesgo = 1 PPS
Donde PPS corresponde al Porcentaje de Prediccin de Signo, que es
una medida de en que porcentaje de las proyecciones hechas por la red esta
acert al signo del cambio del precio de la accin. Por lo que 1-PPS
corresponder al porcentaje en que se equivoc.
Nuevamente el riesgo ser la suma ponderada de los riesgos de cada
accin por el porcentaje de la cartera invertida en ellas. Si al riesgo del portfolio lo
llamamos portfolio queda:
n
portfolio = (1 PPS i )i
i =1
Tal que : i = 1
i =1
27
)
Mx R portfolio
Sujeto a : portfolio = *
28
DA =
( SR SRI )
Var ( SR ) Var ( SRI )
DA sigue una distribucin normal, por lo que para probar la hiptesis nula
de que las observaciones y las proyecciones estn independientemente
distribuidas el resultado de esta ecuacin se compara con un t crtico, que
depender del nivel de confianza que se le quiera exigir a la prueba.
Adems el resto de las variables se define como:
n
SR = PPS =
Cantidad
de signos
acertados
N de Pr edicciones
I ( y * y > 0)
i =1
29
SRI = P P + (1 P ) (1 P )
Donde:
n
P=
I (Y > 0)
i =1
m
n
P =
I (Y > 0)
i =1
[
m(2 P 1) P (1 P ) + m(2 P 1) P (1 P ) + 4 PP (1 P )(1 P ) ]
Var ( SRI ) =
2
m2
SRI (1 SRI )
Var ( SR ) =
m
30
los
(observaciones)
estn
independientemente
distribuidos
de
los
31
Conjunto de produccin se denomina el conjunto de datos que recibe la red neuronal para la
prediccin del retorno de la semana de inters.
7
520 datos totales 300 datos para entrenamiento 30 datos para producir = 190 semanas
predecibles.
32
Parte III
III.1 RESULTADOS
III.1.1 CAPACIDAD PREDICTIVA
En la tabla 1 se puede ver el resumen de las estadsticas para la capacidad
predictiva del modelo para cada accin.
Accin
1 - AA
2 - AIG
3 - AXP
4 - BA
5-C
6 - CAT
7 - DD
8 - DIS
9 - GE
10 - GM
11 - HD
12 - HPQ
13 - IBM
14 - INTC
15 - JNJ
16 - JPM
17 - KO
18 - MCD
19 - MMM
20 - MO
21 - MRK
22 - MSFT
23 - PFE
24 - PG
25 - SBC
26 - UTX
27 - VZ
28 - WNT
29 - XOM
Promedio
PPS
Extram.
71,233%
60,731%
59,361%
64,384%
70,320%
70,776%
68,493%
61,644%
66,210%
62,100%
66,667%
68,037%
69,406%
69,863%
64,384%
63,927%
73,059%
70,320%
69,863%
73,973%
68,037%
74,886%
73,516%
75,799%
69,406%
70,320%
75,799%
72,603%
67,580%
68,714%
Test DA*
6,4060
3,2162
2,7723
4,2238
5,9937
6,2052
5,4578
3,4801
4,9090
3,4739
5,0547
5,5635
5,8573
5,9474
4,3804
4,2538
6,6762
6,0233
5,7186
6,9082
5,3358
7,2679
7,0589
7,4723
5,7244
5,7914
7,6300
6,8110
5,1334
5,5430
* t-crtico=1,96
33
Mtodo
Betas
RNA
Betas
RNA
Buy & Hold
Concentracin
Mx.
10,00%
10,00%
15,00%
15,00%
3,45%
Promedio
Desvest.
80,656%
81,484%
91,015%
92,684%
-9,537%
3,425%
4,476%
3,984%
5,720%
8,282%
Mximo
Mnimo
95,872% 68,512%
94,720% 44,255%
109,082% 79,386%
147,050% 72,734%
6,264% -29,215%
Semanas
Ganadoras
68
124
68
124
0
34
Mtodo
Betas
RNA
Betas
RNA
Buy & Hold
Concentracin
Mx
10,00%
10,00%
15,00%
15,00%
3,45%
Promedio
Desvest
Mximo
-3,013%
-6,781%
-1,544%
-3,609%
-9,537%
3,516%
9,664%
3,339%
8,414%
8,282%
7,474%
8,302%
9,817%
9,957%
6,264%
Mnimo
-27,366%
-44,225%
-23,902%
-44,464%
-29,215%
Semanas
Ganadoras
109
83
98
94
48
Ver anexo 1: Evolucin del Dow Jones diciembre 2000 a diciembre 2004.
35
Al prohibir la venta corta los resultados son totalmente distintos, aqu todos
los portfolios obtuvieron rentabilidades negativas en promedio. Adems, los
portfolios por Betas obtienen mayor rentabilidad acumulada promedio para ambas
concentraciones que los portfolios por RNA. Por lo menos ambas metodologas
siguen obteniendo mejores resultados promedio que el portfolio ingenuo (que
como ya dijimos es virtualmente el de mercado), ya que ninguno de ellos pierde
tanto dinero como el mercado en el perodo en cuestin.
Ahora se aprecia que los portfolios de Betas superaron en rentabilidad
acumulada a los de RNA en mayor cantidad de ocasiones para ambas
concentraciones, pero el mrgen es mucho menor que el logrado por los portfolios
de RNA cuando se permita la venta corta. Adems se puede ver que esta vez si
existieron semanas en que el portfolio ingenuo super a los otros 2 mtodos, de
hecho lo logr en un no despreciable 25% de las semanas estudiadas.
Las desviaciones estndar siguen siendo mayores para los portfolios de
RNA que para los de Betas, pero ahora existe un caso en que la desviacin
estndar de los portfolios por RNA super a la del portfolio de Buy & Hold, cosa
que no sucedi cuando se permita hacer venta corta.
Se puede apreciar que la diferencia entre la situacin con y sin venta corta
es abismante en trminos de la rentabilidad acumulada lograda por ambos
mtodos, era de esperarse que este indicador fuese mayor en el caso de estar
permitida la venta corta. Lo que no es tan intuitivo es el hecho de que con venta
corta el portfolio por RNA logre mejor rendimiento que el de Betas y que sin venta
corta la situacin sea a la inversa.
36
Parte IV
IV.1 CONCLUSIONES
La red Ward de 3 capas usada en este estudio posee una considerable
capacidad predictiva para el signo que seguir la variacin del precio de un activo,
esto la convierte en una herramienta muy potente para la generacin de retornos
proyectados ms crebles y por ende para conformar carteras de inversin. As,
las redes neuronales se pueden convertir en una opcin a las metodologas
tradicionales de conformacin de carteras, manteniendo la misma idea bsica de
maximizar el retorno sujeto a un riesgo dado, pero usando medidas alternativas a
las conocidas, tanto para el riesgo como para el retorno esperado (o proyectado
en el caso de RNA).
La red neuronal usada en este estudio es especialmente efectiva cuando se
permite la realizacin de ventas cortas, logrando una rentabilidad considerable al
cabo de 4 aos (aproximadamente). Sin embargo, cuando no se permite hacer
venta corta, la metodologa de conformacin de carteras por betas logra un mejor
desempeo en promedio. Esto no es intuitivo, pero se podra deber a las
concentraciones mximas con las que se oblig a trabajar a las metodologas,
quizs si no estuviesen tan limitadas las concentraciones, se lograran
rentabilidades positivas con ambos mtodos. Adems la estrategia con RNA
siempre gener mayores costos totales de transaccin, sobre todo para los
portfolios sin venta corta, lo que llev a que la estrategia por RNA tuviera menor
rentabilidad acumulada promedio. Pero en el caso de los portfolios con venta corta
la Red neuronal logr superar a los Betas en casi el doble de ocasiones, siendo
que en los portfolios sin venta corta ambas metodologas se superaron la una a la
otra en casi igual cantidad de veces. An cuando la de betas venci a la de RNA
en mayor nmero de semanas, la supremaca en este caso no es tan pronunciada
como en el anterior. Sin embargo ambas metodologas logran ganarle al
mercado al obtener mayores rentabilidades que este, an cuando no logran evitar
obtener rentabilidades negativas sin el uso de ventas cortas ni bajo las
37
38
Anexo 1:
39
40
REFERENCIAS
Markowitz, H.M. Portfolio selection. Journal of finance Vol. 7. 1952.
Markowitz, H.M. Portfolio selection: efficient diversification of investments. John
Wiley and Sons Inc. 1959.
Fama, Eugene F. Efficient capital markets: a review of theory and empirical
work. Journal of finance. Mayo 1970.
Fama, Eugene F. Efficient capital markets: II. Journal of finance. December
1991.
Campbell, J.; Lo, A.; MacKinlay, A. The econometrics of financial markets.
Princeton University Press. 1997.
Gavridis, M. Modelling with high frecuency data: a growing interest for financial
economists and fund managers. Nonlinear Modelling of High Frecuency Financial
Time Series. Dunis, C. Zhou, B. Editores. 1998.
Lo, A. y MacKinlay, A. C. Stock market prices do not follow random walk:
Evidence from simple specification test. Review of financial studies. 1988.
Ferson, W y Harvey, C. The variation of economic risk premiums. Journal of
Political Economy 99. 1991
Leung, M. T.; Daouk, H y Cheng, A. Forecasting stock indices: a comparison of
classification and level estimation models. International Journal of Forecasting 16.
2000.
41
42