24 APTmariano Gonzalez

Estimación y contrastación de la
Arbitrage Princing Theory: A Multifactor

State-Space Model
Dr. D. Mariano González Sánchez
Universidad San Pablo-CEU

Madrid (Spain)
1er. Simposio de Docentes de Finanzas de Colombia

29 y 30 de julio de 2004 (Bogotá)
Resumen: El objetivo de este trabajo es testar las diferentes

hipótesis que han surgido, a la sombra de la Arbitrage Pricing
Theory, sobre la aplicación y estimación de los modelos
multifactoriales de valoración de activos.
Para ello se emplea la técnica de State-Space, realizándose
diferentes test de constratación conjunta e individual, a fin de
identificar el modelo y el número de factores óptimo para una
determinada cartera.
Asimismo, utilizando los resultados iterativos del filtro de
Kalman, y tras identificar oportunidades de arbitraje, se estima
la cartera réplica de arbitraje en términos dinámicos.
Finalmente, se aplican el modelo teórico sobre una muestra de
acciones del mercado español y se introduce el concepto de
arbitraje estadístico.
Key words: Arbitrage Pricing Theory, State-Space Model, filter

Kalman, statistical arbitrage.
JEL: C10, C15, C22, G12, G14.

1. Introducción
El objetivo de este trabajo es testar las diferentes hipótesis que han surgido, a la
sombra de la Arbitrage Pricing Theory, sobre la aplicación y estimación de los
modelos multifactoriales de valoración de activos.
Dentro de la literatura financiera, y en lo relativo a los modelos multifactoriales,

son numerosos los trabajos realizados, una revisión de los principales puede
verse en Ferson (2003). A efectos de nuestro estudio son varias las cuestiones
que hemos de destacar y sobre las que intentaremos arrojar alguna luz:
− La primera cuestión es determinar si para un mercado concreto resulta más

correcta la versión estricta que la aproximada del modelo multifactorial, es
decir, si las correlaciones entre los llamados factores de riesgo no sistemático
son nulas (estricta) o no (aproximada), o lo que es igual, si la matriz de
covarianzas es diagonal o no.
− Una segunda cuestión que se plantea es la elección de los factores de riesgo

explicativos del comportamiento del rendimiento de los activos. En este
sentido podemos destacar varias líneas de actuación, en primer lugar, el uso
de análisis de componentes principales [Roll y Ross (1980); Connor y
Korajczyk (1986)]; en segundo lugar destaca el empleo de variables
económicas o carteras [Roll y Ross(1986); Ferson y Harvey (1991); Campbell
(1993); Cochrane (1996)]; y finalmente, la elección de ciertas características
particulares del activo [Keim (1983); Fama y French (1993, 1996)]. Como
consecuencia de estos estudios, surgen varias cuestiones que pretendemos
clarificar en nuestro trabajo: ¿cuál es el número de factores óptimo a
considerar?, ya que si la respuesta fuese uno estaríamos ante un modelo de
valoración como el del Capital Asset Pricing Model [Sharpe (1964); Lintner
(1965)], ¿son realmente observables dichos factores?, ¿cómo se comportan?,
¿qué representan? y ¿cuál es el activo libre de riesgo del mercado?
− Una última cuestión es la relativa a la construcción de carteras réplica de un

activo, que permitan aprovechar las oportunidades de arbitraje. En este
apartado, nuestra propuesta pasa por considerar los pesos de los activos que
intervengan en dicha cartera como factores no observables, lo que nos
permitirá incluso realizar predicciones de su comportamiento futuro.
1
Con el fin de analizar los tres aspectos anteriores y su diferente casuísticas,
hemos estructurado el trabajo en tres apartados. En el primero, se expone de
forma teórica nuestra propuesta de análisis y estimación del modelo
multifactorial como un State-Space Model, calibrado por máxima-verosimilitud
y la aplicación del filtro de Kalman; trabajos similares son los de y Bhar y
Chiarella (1997), Bolland y Connor (1999) y Staikouras (2001). En el segundo, se
implementa empíricamente sobre una muestra de valores negociados en el
mercado continuo español. Por último, en el tercero, se presentan las
principales conclusiones.
2. Multifactor State-Space Model para la valoración de activos
Este apartado está dividido en tres partes, la primera plantea de forma teórica el
modelo multifactorial considerado en las otras dos y recoge la definición de
arbitraje sobre la que se trabaja. En la segunda se plantea formalmente el
Multifactor State-Space Model (MSSM), y en la tercera se expone como se
realiza su estimación.
2.1. Concepto de arbitraje bajo un modelo multifactorial
Sea M el conjunto de activos que define un mercado, entendiendo por tal no
sólo un mercado físico u organizado, sino cualquier cartera de activos de un

agente o inversor institucional. Identificamos por S(i,t) el precio de uno
cualquiera (i) de dichos activos en el instante de tiempo t. De este modo para

una frecuencia o intervalo temporal cualquiera ∆t=T-t, tendremos que la
rentabilidad de dicho activo sería:
R ( i, ∆t ) = ln S ( i, T ) − ln S ( i, t ) (2.1)
Definición 1: Una estrategia de arbitraje de equilibrio o estándar es aquella que,
para un determinado modelo de equilibrio de mercado o de valoración de
activos cumple:
a) El coste inicial es nulo.
b) La cartera es autofinanciada.
c) El valor actual esperado de la cartera es positivo.
Matemáticamente podemos formularlo como:
2
V (τ ) = ∑ ω (i, τ ) S (i, τ )
i⊂M
1) V (0) = 0
(2.2)
2) lim Ε Pr V (t ) > 0
t →∞
3) lim Pr V (t ) < 0 = 0

t →∞
Donde ω es la ponderación en cada instante temporal para cada activo del

mercado en la cartera, Pr es la distribución de probabilidad riesgo neutral y V
representa el valor acumulado de la cartera autofinanciada.
Definición 2: La ecuación fundamental de valoración de un activo de forma

riesgo neutral sería:
S (i, t ) = Ε tPr  mt+1S (i, t + 1) (2.3)
Donde m representa una función de descuento estocástica estrictamente

positiva. La ecuación (2.3) también puede expresarse como a partir de la
relación entre precio y rentabilidad de la ecuación (2.1):
Ε Pr  mt+1R (i, t + 1) − 1 Ωt  = 0 (2.4)

 
Siendo Ω el conjunto de la información de mercado, si bien en la práctica suele

emplearse el conjunto de información disponible.
Definición 3: Un modelo multifactorial riesgo neutral en términos de la APT

consiste en expresar la función de descuento estocástica en base a una serie de
factores de riesgo, esto es:
Ε tPr  R (i, t + 1) Ωt  = λ (0, t ) + ∑ β (i, j, t )λ ( j, t ) (2.5)

  j
Donde λ(0,t) representa al factor libre de riesgo, λ(j,t) las primas de riesgo del
resto de factores y, β(i,j,t) sería la beta del activo i respecto del factor j en el
instante t.
Ahora bien, el rendimiento de un activo también puede expresarse en un

modelo multifactorial como:
R (i, t + 1) = α (i, t ) + ∑ β (i, j, t ) f ( j, t ) + u (i, t + 1) (2.6)
j
3
Donde α representaría el rendimiento esperado incondicional del activo, f el
valor del shock del factor de riesgo respecto a su valor esperado y u el factor no
sistemático del activo. De este modo, no existirán oportunidades de arbitraje
respecto del activo i siempre que:
α (i, t ) ≡ Ε tPr  R (i, t + 1) Ωt  = λ (0, t ) + ∑ β (i, j, t )λ ( j, t ) (2.7)

  j
Entonces realizando algo de cálculo en la expresión (2.6) tendríamos:

R (i, t + 1) = λ (0, t ) + ∑ β (i, j, t )λ ( j, t ) + ∑ β (i, j, t ) f ( j, t ) + u (i, t + 1) (2.8)
j j
Por definición sabemos que:

f (i, t ) = F (i, t ) − Ε tPr  F (i, t + 1)
λ (i, t ) = Ε tPr  F (i, t + 1) − λ (0, t ) (2.9)
Ε tPr  F (i, t + 1) > λ (0, t ) ≥ 0
Donde F es el valor de cada factor de riesgo. Con lo que a partir de (2.9) y

operando sobre la expresión (2.8) podemos llegar a la siguiente ecuación:
 
R (i, t + 1) = λ (0, t ) 1 − ∑ β (i, j, t ) + ∑ β (i, j, t ) F ( j, t ) + u (i, t + 1) (2.10)
 
 j  j
La expresión (2.10) sería la ecuación multifactorial libre de riesgo, ahora bien, si

un activo no presenta dichas oportunidades de arbitraje entonces modificando
esta ecuación como sigue:
 
R (i, t + 1) = κ (i ) + λ (0, t ) 1 − ∑ β (i, j, t ) + ∑ β (i, j, t ) F ( j, t ) + u (i, t + 1) (2.11)
 
 j  j
debería cumplirse que:

Pr κ (i ) = 0 = 1 (2.12)
Sujeto claro está al comportamiento del factor no sistemático, esto es:

u (i, t ) ∈ U ∼ N (0, Σ) (2.13)
De manera que si Σ es diagonal se trataría del modelo estricto, mientras que si

no lo es, sería el aproximado.
2.2. Formulación del MSSM
Dentro de la literatura financiera existen multitud de trabajos sobre el método

de estimación de los parámetros de la expresión (2.11), como son Método
Generalizado de los Momentos, Mínimos Cuadrados Ordinarios o
4
Generalizados, Máxima Verosimilitud, etc. Ahora bien, en cualquiera de los
casos se realizan una serie de hipótesis de partida como son el número de
factores, que se considera son observables, se asume que Σ es o no diagonal de
partida, y también se trabaja con un activo libre de riesgo observable. Todo ello
conlleva implícitamente realizar alguna hipótesis sobre el comportamiento
temporal de los parámetros. Pues bien, nuestra aportación es formalizar el
modelo (2.11) de manera que no se realice ninguna de las hipótesis de partida
anteriores, sino que sean los propios datos los que a través de criterios de
máxima-verosimilitud nos indique cual es el comportamiento concreto del
mercado, y si existen oportunidades de arbitraje para dicho modelo.
Con este objetivo, expresamos la ecuación (2.11) como un MSSM del siguiente
modo en forma matricial:
R t = κ + Zt ( ψt )iψt + U t U t ∼ N (0, Q)
ψt+1 = γ + Tiψt + ηt+1 ηt+1 ∼ N (0, H) (2.14)
Q 0 
Ω =  
 0 H
Donde la primera ecuación será la de medida, mientras que la segunda será la

de transición.
De este modo supongamos, para simplificar, que el mercado se compone de dos

únicos activos y que solo existe un factor de riesgo, entonces la ecuación de
medida de la expresión (2.14) quedaría como:
 λ (0, t ) 
 
 R (1, t )   κ (1)  1 − β (1,1, t ) β (1,1, t ) 0 0  F (1, t )   u (1, t ) 
         
 R (2, t ) = κ (2) + 1 − β (2,1, t ) β (2,1, t ) 0 0 i  β (1,1, t )  + u (2, t )
         
 β (2,1, t )
 
(2.15)
(
∀i u (i, t ) ∼ N 0, σu2(i) )
 σu2(1) σu(1)σu(2)ru(1),u(2) 
 
Q = 
σu(1)σu(2)ru(1),u(2) σu2(2) 
Fijémonos que r representa la correlación entre los factores de riesgo no

sistemáticos de los activos, de modo que si su valor no es cero estaremos ante la
expresión APT aproximada, en cambio si lo es, se trataría de la versión estricta.
En nuestra estimación su valor será determinado y comprobaremos
5
estadísticamente tantos su significación individual, como la significación
conjunta de ambos modelos.
En cuanto a la ecuación de transición podemos proponer varias formulaciones o

comportamientos, que posteriormente, en la estimación, nos permitirá realizar
una discriminación entre ellos según el valor alcanzado por la función de
verosimilitud en el máximo. Así pues, los modelos de comportamiento
propuesto, y siguiendo con el caso clarificador de un solo factor de riesgo y dos
activos, aunque la generalización sería directa, serían los siguientes incluyendo
también la ecuación de medida en los casos en que tiene lugar variaciones, al
introducir mayor número de factores, respecto de la expresión (2.15):
Primero. El factor libre de riesgo, los factores de riesgo y las betas siguen un
proceso autorregresivo de orden 1, cuya expresión matemáticas sería:
 λ ( 0, t + 1)   δ ( 0 )   ρ ( 0 ) 0 0 0   λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1) = δ (1) + 0 ρ (1) 0 0 i  F (1, t )  +  η (1, t + 1) 
 β (1,1, t + 1)   µ (1,1)   0 0 ρ (1,1) 0   β (1,1, t )   ϕ (1,1, t + 1) 
        
 β ( 2,1, t + 1)   µ ( 2,1)   0 0 0 ρ ( 2,1)   β ( 2,1, t )  ϕ ( 2,1, t + 1) 
s.t. (2.16)
∀m = 0,1, (1,1) , ( 2,1)  − 1 ≤ ρ ( m ) ≤ 1
δ ( 0 ) ≥ 0 δ (1) > δ ( 0 )
η ( 0, t + 1) ∼ N ( 0, s02 ) η (1, t + 1) ∼ N ( 0, s12 ) ∀i = 1, 2 ϕ ( i,1, t + 1) ∼ N ( 0, ωi2,1 )
 s02 0 0 0 
 2 
0 s 0 0 
H= 1
0 0 ω1,1
2
0 
 2 
 0 0 0 ω 2,1 
Segundo. En este caso todos los factores y las betas presenta un

comportamiento igual al de una variable aleatoria:
 λ ( 0, t + 1)   δ ( 0 )  η ( 0, t + 1) 
     
 F (1, t + 1)  =  δ (1)  + η ( 0, t + 1) 
 β (1,1, t + 1)   µ (1,1)  ϕ ( 0, t + 1) 
     
 β ( 2,1, t + 1)   µ ( 2,1)  ϕ ( 0, t + 1)  (2.17)
s.t.
δ ( 0 ) ≥ 0 δ (1) > δ ( 0 )
 s02 0 0 0 
 
0 s12 0 0 
H=
0 0 ω1,1
2
0 
 2 
 0 0 0 ω2,1 
6
Tercero. En este caso al existir un mayor número de factores no observables la
ecuación de medida varía; además, tanto los factores como las betas
siguen un modelo estructural, es decir, los movimientos vienen
explicados no sólo por el valor anterior de la variable, sino también
por cambios en la pendiente:
 λ ( 0, t ) 
 
 F (1, t ) 
 β (1,1, t ) 
 
 R (1, t )   κ (1)   1 − β (1,1, t ) β (1,1, t ) 0 0 0 0 0 0  β ( 2,1, t )   u (1, t ) 
 = +  i + 
 R ( 2, t )  κ ( 2 )  1 − β ( 2,1, t ) β ( 2,1, t ) 0 0 0 0 0 0  γ ( 0, t )   u ( 2, t ) 
 
 γ (1, t ) 
 µ (1,1, t ) 
 
 µ ( 2,1, t ) 
 λ ( 0, t + 1)  1 0 0 0 1 0 0 0  λ ( 0, t )   η ( 0, t ) 
      
 F (1, t + 1)  0 1 0 0 0 1 0 0  F (1, t )   η (1, t ) 

 β (1,1, t + 1)  0 0 1 0 0 0 1 0  β (1,1, t )   ϕ (1,1, t ) 
      
 β ( 2,1, t + 1)  = 0 0 0 1 0 0 0 1   β ( 2,1, t )  ϕ ( 2,1, t ) 
i +
 γ ( 0, t + 1)  0 0 0 0 1 0 0 0  γ ( 0, t )   ε ( 0, t ) 
      
 γ (1, t + 1)  0 0 0 0 0 1 0 0  γ (1, t )   ε (1, t ) 
 µ (1,1, t + 1)  0 0 0 0 0 0 1 0  µ (1,1, t )   ξ (1,1, t ) 
      
 µ ( 2,1, t + 1)  0 0 0 0 0 0 0 1   µ ( 2,1, t )  ξ ( 2,1, t ) 
s.t.
η ( 0, t + 1) ∼ N ( 0, s02 ) ε ( 0, t + 1) ∼ N ( 0,ν 02 ) η (1, t + 1) ∼ N ( 0, s12 ) ε (1, t + 1) ∼ N ( 0,ν 12 ) (2.18)
∀i = 1, 2 ϕ ( i,1, t + 1) ∼ N ( 0, ωi2,1 ) ξ ( i,1, t + 1) ∼ N ( 0, φi2,1 )
 s02 0 0 0 0 0 0 0 
 
0 s12 0 0 0 0 0 0 
0 0 ω1,1
2
0 0 0 0 0 
 
0 0 0 ω1,2
2
0 0 0 0
H=
0 0 0 0 ν 02 0 0 0
 
0 0 0 0 0 ν 12 0 0
0 0 0 0 0 0 φ1,12 0
 
 0 0 0 0 0 0 0 φ2,1
2

Cuarto. En este supuesto los factores siguen un proceso AR(1), mientras que
las betas se consideran variables aleatorias:
 λ ( 0, t + 1)   δ ( 0 )   ρ ( 0 ) 0 0 0  λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1) = δ (1) + 0 ρ (1) 0 0  F (1, t )   η (1, t + 1) 
i +
 β (1,1, t + 1)   µ (1,1)   0 0 0 0  β (1,1, t )   ϕ (1,1, t + 1) 
        
 β ( 2,1, t + 1)   µ ( 2,1)   0 0 0 0  β ( 2,1, t )  ϕ ( 2,1, t + 1)  (2.19)
s.t.
∀m = [ 0,1] − 1 ≤ ρ ( m ) ≤ 1
δ ( 0 ) ≥ 0 δ (1) > δ ( 0)
 s02 0 0 0 
 2 
0 s 0 0 
H= 1
0 0 ω1,1
2
0 
 2 
 0 0 0 ω 2,1 
7
Quinto. Nuevamente consideramos los factores como un proceso AR(1), pero
las betas siguen un modelo estructural:
 λ ( 0, t ) 
 
 F (1, t ) 
 R (1, t )   κ (1)   1 − β (1,1, t ) β (1,1, t ) 0 0 0 0  β (1,1, t )   u (1, t ) 
 = + i  + 
 R ( 2, t )  κ ( 2 )  1 − β ( 2,1, t ) β ( 2,1, t ) 0 0 0 0  β ( 2,1, t )   u ( 2, t ) 
 µ (1,1, t ) 
 
 µ ( 2,1, t ) 
 λ ( 0, t + 1)  δ ( 0 )   ρ ( 0 ) 0 0 0 0 0  λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1)   δ (1)   0 ρ (1) 0 0 0 0  F (1, t )   η (1, t + 1) 
 β (1,1, t + 1)   0   0 0 1 0 1 0  β (1,1, t )   ϕ (1,1, t + 1) 
 = + i  + 
 β ( 2,1, t + 1)   0   0 0 0 1 0 1   β ( 2,1, t )  ϕ ( 2,1, t + 1) 
 µ (1,1, t + 1)   0   0 0 0 0 1 0 µ (1,1, t )
   ξ (1,1, t + 1) 
        
 µ ( 2,1, t + 1)   0   0 0 0 0 0 1   µ ( 2,1, t )  ξ ( 2,1, t + 1) 
s.t.
∀m = [ 0,1] − 1 ≤ ρ ( m ) ≤ 1
δ ( 0 ) ≥ 0 δ (1) > δ ( 0 )
η ( 0, t + 1) ∼ N ( 0, s02 ) η (1, t + 1) ∼ N ( 0, s12 ) ∀i = 1, 2 ϕ ( i,1, t + 1) ∼ N ( 0, ωi2,1 ) ξ ( i,1, t + 1) ∼ N ( 0, φi2,1 )
 s02 0 0 0 0 0
 
0 s12 0 0 0 0
0 0 ω1,1
2
0 0 0
H=
ω 2,1
2  (2.20)
0 0 0 0 0
0 0 0 0 φ2
1,1 0
 2 
 0 0 0 0 0 φ2,1 
Sexto. Los factores son considerados como variables aleatorias, en cambio

las betas son proceso autorregresivos de orden 1:
 λ ( 0, t + 1)   δ ( 0 )  0 0 0 0   λ ( 0, t )   η ( 0, t + 1) 
     0   F (1, t )   η (1, t + 1) 
 F (1, t + 1)  =  δ (1)  + 0 0 0
i +
 β (1,1, t + 1)   µ (1,1)  0 0 ρ (1,1) 0   β (1,1, t )   ϕ (1,1, t + 1) 
        
 β ( 2,1, t + 1)   µ ( 2,1)  0 0 0 ρ ( 2,1)   β ( 2,1, t )  ϕ ( 2,1, t + 1) 
s.t.
∀m = (1,1) , ( 2,1)  − 1 ≤ ρ ( m ) ≤ 1 (2.21)
δ ( 0 ) ≥ 0 δ (1) > δ ( 0 )
 s02 0 0 0 
 2 
0 s 0 0 
H= 1
0 0 ω1,1
2
0 
 2 
 0 0 0 ω 2,1 
Séptimo. Mientras que los factores se expresan como variables aleatorias, las
betas vienen explicadas mediante un modelo estructural:
8
 λ ( 0, t ) 
 
 F (1, t ) 
 R (1, t )   κ (1)   1 − β (1,1, t ) β (1,1, t ) 0 0 0 0  β (1,1, t )   u (1, t ) 
 = + i +
 R ( 2, t )  κ ( 2 )  1 − β ( 2,1, t ) β ( 2,1, t ) 0 0 0 0  β ( 2,1, t )   u ( 2, t ) 
 µ (1,1, t ) 
 
 µ ( 2,1, t ) 
 λ ( 0, t + 1)  δ ( 0 )  0 0 0 0 0 0  λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1)   δ (1)  0 0 0 0 0 0  F (1, t )   η (1, t + 1) 

 β (1,1, t + 1)   0  0 0 1 0 1 0  β (1,1, t )   ϕ (1,1, t + 1) 
 = + i  + 
 β ( 2,1, t + 1)   0  0 0 0 1 0 1   β ( 2,1, t )  ϕ ( 2,1, t + 1) 
 µ (1,1, t + 1)   0  0 0 0 0 1 0  µ (1,1, t )   ξ (1,1, t + 1) 
        
 µ ( 2,1, t + 1)   0  0 0 0 0 0 1   µ ( 2,1, t )  ξ ( 2,1, t + 1) 
s.t.
δ ( 0 ) ≥ 0 δ (1) > δ ( 0 )
η ( 0, t + 1) ∼ N ( 0, s02 ) η (1, t + 1) ∼ N ( 0, s12 ) ∀i = 1, 2 ϕ ( i,1, t + 1) ∼ N ( 0, ωi2,1 ) ξ ( i,1, t + 1) ∼ N ( 0, φi2,1 )
 s02 0 0 0 0 0  (2.22)
 2 
0 s1 0 0 0 0 
0 0 ω1,1
2
0 0 0 
H= 
0 0 0 ω 2,1
2
0 0 
0 0 0 0 φ1,12 0
 2 
 0 0 0 0 0 φ2,1 
Octavo. Los factores siguen un modelo estructural y las betas un AR(1):
 λ ( 0, t ) 
 
 F (1, t ) 
 R (1, t )   κ (1)   1 − β (1,1, t ) β (1,1, t ) 0 0 0 0  β (1,1, t )   u (1, t ) 
 = + i  + 
 R ( 2, t )  κ ( 2 )  1 − β ( 2,1, t ) β ( 2,1, t ) 0 0 0 0  β ( 2,1, t )   u ( 2, t ) 
 γ ( 0, t ) 
 
 γ (1, t ) 
 λ ( 0, t + 1)   0  1 0 0 0 1 0  λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1)   0   0 1 0 0 0 1   F (1, t )   η (1, t + 1) 

 β (1,1, t + 1)   µ (1,1)   0 0 ρ (1,1) 0 0 0  β (1,1, t )   ϕ (1,1, t + 1) 
 = + i  + 
 β ( 2,1, t + 1)   µ ( 2,1)   0 0 0 ρ ( 2,1) 0 0  β ( 2,1, t )  ϕ ( 2,1, t + 1) 
 γ ( 0, t + 1)   0   0 0 0 0 1 0  γ ( 0, t )   ε ( 0, t + 1) 
        
 γ (1, t + 1)   0   0 0 0 0 0 1   γ (1, t )   ε (1, t + 1) 
s.t.
∀m =  (1,1) , (1, 2 )  − 1 ≤ ρ ( m ) ≤ 1
η ( 0, t + 1) ∼ N ( 0, s02 ) ε ( 0, t + 1) ∼ N ( 0,ν 02 ) η (1, t + 1) ∼ N ( 0, s12 ) ε (1, t + 1) ∼ N ( 0,ν 12 )
∀i = 1, 2 ϕ ( i,1, t + 1) ∼ N ( 0, ωi2,1 )
 s02 0 0 0 0 0
 
0 s12 0 0 0 0
0 0 ω1,1
2
0 0 0
H=
ω 2,1
2  (2.23)
0 0 0 0 0
0 0 0 0 ν 2
0 0
 
 0 0 0 0 0 ν 12 
Noveno. Finalmente, los factores se identifican con un modelo estructural,

mientras que las betas se considera que se comportan como una
variable aleatoria:
9
 λ ( 0, t ) 
 
 F (1, t ) 
 R (1, t )   κ (1)   1 − β (1,1, t ) β (1,1, t ) 0 0 0 0  β (1,1, t )   u (1, t ) 
 = + i  + 
 R ( 2, t )  κ ( 2 )  1 − β ( 2,1, t ) β ( 2,1, t ) 0 0 0 0  β ( 2,1, t )   u ( 2, t ) 
 γ ( 0, t ) 
 
 γ (1, t ) 
 λ ( 0, t + 1)   0  1 0 0 0 1 0  λ ( 0, t )   η ( 0, t + 1) 
        
 F (1, t + 1)   0   0 1 0 0 0 1  F (1, t )   η (1, t + 1) 

 β (1,1, t + 1)   µ (1,1)   0 0 0 0 0 0  β (1,1, t )   ϕ (1,1, t + 1) 
 = + i  + 
 β ( 2,1, t + 1)   µ ( 2,1)   0 0 0 0 0 0  β ( 2,1, t )  ϕ ( 2,1, t + 1) 
 γ ( 0, t + 1)   0   0 0 0 0 1 0  γ ( 0, t )   ε ( 0, t + 1) 
        
 γ (1, t + 1)   0   0 0 0 0 0 1  γ (1, t )   ε (1, t + 1) 
s.t.
η ( 0, t + 1) ∼ N ( 0, s02 ) ε ( 0, t + 1) ∼ N ( 0,ν 02 ) η (1, t + 1) ∼ N ( 0, s12 ) ε (1, t + 1) ∼ N ( 0,ν 12 )
∀i = 1, 2 ϕ ( i ,1, t + 1) ∼ N ( 0, ωi2,1 )
 s02 0 0 0 0 0
  (2.24)
0 s12 0 0 0 0
0 0 ω1,1
2
0 0 0
H= 
0 0 0 ω 2,1
2
0 0
0 0 0 0 ν 02 0
 
 0 0 0 0 0 ν 12 
Finalmente, y con relación a la construcción de la cartera réplica en el supuesto

de que existan oportunidades de arbitraje, la modelización propuesta sería la
siguiente. Supongamos, siguiendo con el caso teórico simple de un único factor
de riesgo, que 1 es el activo sobre el que se arbitrará, de tal manera que la
formalización del problema sería:
 β * (1,1, t )  β * (2,1, t )
   
 S (1,1, t )  =  S (2,1, t )  iψ (2, t )
   
ψ (2, t + 1) = θ1,2 ψ (2, t ) + e (2, t )
s.t. (2.25)
e (2, t ) ∼ N 0, σe2(2)( )
Pr κ (1) = 0 ≠ 1 Pr κ (2) = 0 ≠ 1
Donde β* representa el valor estimado del parámetro beta que acompaña al

factor de riesgo correspondiente, aplicando el modelo seleccionado de entre los
9 anteriores. Fijémonos que la expresión (2.25) nuevamente se trata de un
problema que puede plantearse como un modelo de State-Space, de tal manera
que generalizando a M factores de riesgo y N activos quedaría como:
10
 ψ (1, t ) 
 β ( h,1, t )   β (1,1, t ) β ( h − 1,1, t ) β ( h + 1,1, t ) β ( N ,1, t )   

   
i ψ ( h − 1, t ) 

 =
 β ( h, M , t )   β (1, M , t ) β ( h − 1, M , t ) β ( h + 1, M , t ) β ( N , M , t )  ψ ( h + 1, t ) 
   
 S ( h, t )   S (1, t ) S ( h − 1, t ) S ( h + 1, t ) S ( N , t )  



 ψ ( N , t ) 
0 0
Q= 
 
0 0
 ψ (1, t + 1)  θ h ,1 0 0 0   ψ (1, t )   e (1, t ) 
   0    
      
ψ ( h − 1, t + 1)   0 θ h ,1 0  ψ ( h − 1, t )   e ( h − 1, t ) 
 = i  + 
ψ ( h + 1, t + 1)   0 0 θ h ,1 0  ψ ( h + 1, t )   e ( h + 1, t ) 
   0    
      
 ψ ( N , t + 1)   0 0 0 θ h ,1   ψ ( N , t )   e ( N , t ) 
σ e2(1) 0 0 0 
  (2.26)
 0 
 0 σ e2( h −1) 0 
H= 
 0 0 σ e2( h +1) 0 
 
 0 

 0 0 0 σ e2( M ) 
A partir de la expresión (2.26) podemos deducir que se trata de una estrategia

de cobertura o réplica dinámica, siendo θ los parámetros de corrección de dicha
cartera a medida que transcurra el tiempo, donde además la frecuencia de
revisión dependerá de la frecuencia para la que se estimó la rentabilidad de los
activos y del riesgo que quiera asumir el agente, cuyo nivel de confianza vendrá
dado a partir de la matriz H.
2.3. Estimación del MSSM
La estimación de los modelos mediante State-Space suele realizarse mediante el

filtro de Kalman, lo cual exige que el modelo se plantee en términos lineales.
Fijémonos entonces en nuestra expresión general (2.14), en la que la ecuación
de medida no lo es, ya que las betas varían con el tiempo. Para estos supuestos,
se recurre a la linealización de las ecuaciones mediante las aproximaciones de
primera derivada [Durbin y Koopman (2001), 195-202]. Aplicándolo a nuestro
caso, hemos de definir una nueva ecuación de medida lineal, ya que la de
transición si lo era inicialmente, para ello denotamos R* como la nueva variable
dependiente tal que en forma matricial sería:
11
∂Z t ( a t )
R *t = iψt + ε t
∂a t
(2.27)
∂Z ( a )
R *t = R t - Z t ( a t ) + t t ia t = κ + ( fi - l 0 )
∂a t
Donde a representa un valor inicial de los estados, fi para los factores de riesgo y
l0 para el factor libre de riesgo. A modo de ejemplo, si la cartera constara de 2
activos y 2 factores (uno de ellos libre de riesgo), la linealización sería como
sigue:
 λ ( 0, t ) 
 
 R* (1, t )  κ (1)   −1 1 0 0  F (1, t )   u (1, t ) 
 * = + i +  (2.28)
 R ( 2, t )  κ (1)   −1 1 0 0  β (1,1, t )   u ( 2, t ) 
 
 β ( 2,1, t ) 
Como puede observarse nuestro problema es un modelo multiplicativo, ya

considerado, con otro objetivo, por Shephard (1994).
Con lo que generalizando, la linealización de la ecuación de medida en un

MSSM para cualquier activo puede expresarse como:
∀i = 1,... N
M
R * ( i, t ) = κ ( i ) + ∑ ( f j − l0 )i (2.29)
j =1
M
{
= R ( i, t ) + ∑  b ( i, j ) − 2  l0 + 1 − b ( i , j )  f j }
j =1
Donde b, f y l0 representan los valores iniciales elegidos.
Si ahora generalizamos las expresiones (2.28) y (2.29) para N individuos y M

factores de riesgos, obtendríamos la siguiente pauta de linealización del modelo
MSSM:
1. Estimar los valores de la nueva variable dependiente como:
 M 
 R (1, t )   R (1, t )   j =1
* ∑ b (1, j ) − ( M + 1) 1 − b (1,1) 1 − b (1, M )   l0 
       f  (2.30)
 = + i  1 
 R ( N , t )   R ( N , t ) 
* M  
   b ( N , j ) − ( M + 1) 1 − b ( N ,1)
∑ 1 − b ( N , M )   f M 
 j =1 
2. Plantear la nueva ecuación de medida tal y como sigue:
12
ψt
 λ ( 0, t ) 
 
F (1, t ) 
Z
Ut
 −1 1 1 0 0 
 R* (1, t )   κ (1)      u (1, t ) 
  −1 1 1 0 0 
   i F ( M , t )  +   (2.31)
 = +    
 R ( N , t )  κ ( N )  
*
  β ( )
1,1, t   u ( ) 
N , t
 
 −1 1 1 0 0   
 
 β ( N , M , t )
 
3. Optimizar la función de verosimilitud que genera la ecuación de medida

(2.31) junto con cada una de las ecuaciones de transición descritas
anteriormente, desde la expresión (2.16) hasta la (2.24), ambas inclusive.
Esta última fase exige la aplicación del filtro de Kalman, el cual permite
actualizar un sistema cada vez que se obtiene un nueva información, ya que
parte de que los estados siguen una distribución normal. De este modo si
tomamos un modelo de espacio de los estados genérico:
R (t ) = ψ (t ) + u (t )
ψ ( t + 1) = ψ ( t ) + η ( t ) (2.32)
ψ ( t ) ∼ N [ yt , st ]
Asumiendo que tanto yt como st son conocidos, el objetivo es estimar R(t+1)1.

En este sentido es fácil comprobar, dado que:
η ( t ) ∼ N ( 0, ω 2 ) (2.33)
que:
yt +1 = Ε ψ ( t + 1) K ( t )  = Ε ψ ( t ) + η ( t ) K ( t ) 
= Ε ψ ( t ) K ( t ) 
(2.34)
st +1 = var ψ ( t + 1) K ( t )  = var ψ ( t ) + η ( t ) K ( t ) 
= var ψ ( t ) K ( t )  + ω 2
Donde K(t) representa el conjunto de información conocida en el instante t. Si

ahora definimos:
1Con la intención de facilitar la comprensión de la nomenclatura empleada, tanto los valores

medios como las varianzas, presentan un subíndice para el tiempo, mientras que las variables
dependientes o los factores no observables lo presentan entre paréntesis.
13
et = R ( t ) − yt
(2.35)
ht = var ( et )
tal que:
Ε  et K ( t − 1)  = Ε ψ ( t ) + η ( t ) − yt K ( t − 1)  = 0
Ε [ et ] = Ε  Ε  et K ( t − 1)   = 0 (2.36)
cov [ et , yτ ] = 0
Entonces, al ser independientes las innovaciones (e) respecto de los valores

esperados de los estados (y), el problema puede tratarse como una regresión
normal multivariante (de ahí la necesidad de que el modelo fuera lineal), es
decir:
Ε ψ ( t ) K ( t )  = Ε ψ ( t ) K ( t − 1) , et 
(2.37)
= Ε ψ ( t ) K ( t − 1)  + cov ψ ( t ) , et  ⋅ var −1 ( et ) ⋅ et
Donde:
Ε ψ ( t ) K ( t − 1)  = yt
cov ψ ( t ) , et  = Ε ψ ( t ) ⋅  R ( t ) − yt   = Ε ψ ( t ) ⋅ ψ ( t ) + u ( t ) − yt  
= Ε ψ ( t ) ⋅ ψ ( t ) − yt   = Ε  var ψ ( t ) K ( t − 1)  

  (2.38)
= st
var ( et ) = var ψ ( t ) + u ( t ) − yt  = var ψ ( t ) K ( t − 1)  + σ u2
= st + σ u2
Con lo que finalmente:
st
Ε ψ ( t ) K ( t )  = yt + et
st + σ u2
st2 (2.39)
var ψ ( t ) K ( t )  = var ψ ( t ) K ( t − 1)  − cov 2 ψ ( t ) , et  ⋅ var −1 [ et ] = st −
st + σ u2
stσ u2
=
st + σ u2
Resumiendo, el filtro de Kalman da lugar a un proceso iterativo-recursivo como:
1. Estimar la innovación:
et = R ( t ) − yt (2.40)
14
2. Determinar el valor esperado para los estados no observables en el instante
temporal siguiente:
st
yt +1 = yt + et (2.41)
st + σ u2
3. Calcular la varianza de t+1 de los estados:
stσ u2
st +1 = +ω2 (2.42)
st + σ u 2
Con lo cual, el filtro de Kalman facilita enormemente la construcción de la

función de verosimilitud, puesto que ahora:
T
(·) = Pr ( R ) = ∏ Pr  R ( t ) K ( t − 1)
t =1 (2.43)
∀τ = 1, ,T Pr  R ( t ) K ( t − 1)  ∼ N  yt , ( st + σ 2
u )
De modo que la transformación logarítmica de dicha función (2.43) sobre la que
optimizaremos, puede reconstruirse fácilmente aplicando el filtro de Kalman,
tal y como sigue:
T 1 T  et2 
log ( ·) = log Pr ( R ) = − log 2π − ∑ log ( st + σ u ) +
2
(2.44)
2 2 t =1  st + σ u2 
Por tanto, el algoritmo solo requiere un punto de partida, es decir, fijar los
valores (y1, s1), y a partir de ahí se retro-alimenta. Es recomendable, cuando se
desconoce estos valores inicialmente, fijarlos como:
y1 = 0
(2.45)
s1 → ∞
Por lo que respecta al método de optimización empleado, y como suele ser

habitual, hemos elegido uno perteneciente a la familia de los optimizadores
Newton o quasi-Newton, que buscan el valor de los parámetros para los que el
gradiente es numéricamente cero. Para ello, determinan el gradiente numérico,
o primera derivada de la log-versosimilitud respecto de los parámetros, con el
fin de determinar la dirección en la que modificar el valor de los mismos, y
además, emplean el hessiano numérico, o segunda derivada, para estimar el
tamaño del cambio. De los métodos existen dentro de esta familia, hemos
15
empleado el conocido como BFGS o Broyden-Fletcher-Goldfarb-Shannon
[Fletcher (1987)].
Finalmente, y dado que alguno de los parámetros a estimar tiene acotado los
posibles valores que puede tomar, se hizo preciso llevar a cabo una redefinición
de los mismos, así pues:
− En lugar de optimizar directamente sobre un parámetro x que representara

las varianzas de los ruidos, y dado que una varianza no puede ser negativa, la
redefinición aplicada en la práctica habitual, y empleada aquí fue optimizar
sobre dicho parámetro x, pero su significado fue:
∀x σ 2 = exp ( x ) ≥ 0 (2.46)
− En los casos en que existe autocorrelación de los factores no observables o

correlación entre variables, y dado que el correspondiente parámetro está
acotado entre -1 y 1, la redefinición empleada fue optimizar sobre un
parámetro x, cuya relación con el de autocorrelación o correlación vendría
dado por:
x
∀x − 1 ≤ ρ = ≤1 (2.47)
1+ x
− En los modelos en los que los factores de riesgo presentan un término

constante (intercept) así como el factor libre de riesgo, también se ha
realizado una redefinición de los mismos, ya que por definición de la propia
APT, el rendimiento esperado de un factor libre de riesgo no puede ser
negativo, y el de los factores con riesgo deberá ser mayor que el anterior,
como consecuencia de la prima de riesgo, por tanto todo ello supuso que se
optimizará sobre x0 para el factor libre de riesgo y xj para los j factores con
riesgo, tal y como sigue:
δ 0 = exp ( x0 ) ≥ 0
(2.48)
∀j = 1, ,M δ j = δ 0 + exp ( x j ) ≥ δ 0 ≥ 0
2.4. Contrastación del MSSM
La contrastación del MSSM se realiza a dos niveles:
16
− Constratación conjunta: este primer nivel tiene por objetivo determinar el
modelo que mejor se adapta al comportamiento de la cartera, de los 9
posibles y propuestos anteriormente, así como fijar el número óptimo de
factores de riesgo necesarios para explicar dicho modelo. Su implementación
se hace en dos fases consecutivas:
a. Selección del número de factores óptimo para cada tipo de modelo: para
ello, y tanto para la versión estricta como para la aproximada, se estimará
un test de razones de verosimilitud en el óptimo de cada modelo y para
diferente número de factores de riesgo. Así, si M y H son el número de
parámetros para un mismo modelo, tal que M>H, lo cual solo se deberá a
que el primero presenta un mayor número de factores de riesgo que el
segundo, entonces el test se construirá como sigue, aceptando un modelo
con menor número de factores frente a otro con un factor más, si el p-
valor del test es menor o igual que el 5%:
vr = −2 ⋅ log ( PM ) − log ( PH )  ∼ χ M2 −H (2.49)
b. Selección del modelo que mejor se adapta al comportamiento de la

cartera: tras la fase anterior, se habrá seleccionado un número de factores
único para cada uno de los tipos de modelos propuestos (18, 9 versión
estricta y 9 versión aproximada), en esta etapa, se elegirá el mejor de
ellos, aplicando para ello criterios de información (AIC y BIC). Así pues, si
r es cada uno de los 18 modelos seleccionados, N es el número de activo, T
las observaciones temporales de los mismos y M el número de
parámetros, entonces:
∀r = 1, ,18
max [ AICr , BICr ]
r
(2.50)
AICr = −2 ⋅ log (P ) ⋅(N ⋅T ) + 2 ⋅ M
Mr r
BICr = −2 ⋅ log (P ) ⋅(N ⋅T ) + 2 ⋅ M

Mr r ⋅ log ( N ⋅ T )
− Contrastación individual: una vez elegido el modelo y el número de factores

de riesgo, procederemos a estimar el valor de los correspondientes
parámetros, y a continuación se realizará un contraste de significación
individual del tipo t-test. Para determinar el error estándar de cada
parámetro se trabajará con una aproximación habitual, consistente en la raíz
17
cuadrada de la diagonal principal de la matriz de covarianzas de los
parámetros estimados, aproximando esta última mediante la inversa de
menos el hessiano numérico en el óptimo. Dentro de esta evaluación destaca
la contrastación del intercepto de los rendimientos de los activos, ya que
según la APT, dicho parámetro no debería ser significativamente distinto de
cero, como se expuso en la expresión (2.12).
2.5. Construcción de la cartera réplica de arbitraje
Si en la contrastación individual de los interceptos del rendimiento de los

activos hubiera alguno estadísticamente distinto de cero, entonces existiría una
oportunidad de arbitraje sobre dicho activo, construyendo la cartera réplica
mediante una combinación lineal del resto de activos para los que dicho
parámetro no fue significativamente distinto de cero. De este modo podemos
definirlo como:
∀i = 1, ,N
i ∈ Arb ⇔ Pr κ ( i ) = 0 = 0 (2.51)
i ∈ Port ⇔ Pr κ ( i ) = 0 = 1
Donde Arb es el conjunto de activos que presentan oportunidades de arbitraje y

Port los que no, es decir, aquellos que se emplearán para construir la cartera
réplica.
Para nuestro caso, tomaremos como activo sobre el que arbitrar aquel que tenga
en valor absoluto el mayor intercepto, de manera que si el signo de éste fuera
positivo, se compraría dicho activo y se vendería la cartera réplica, mientras que
si fuera negativa, se operaría al revés.
La cartera réplica se construirá mediante un modelo de espacio de estados, de

manera que se tratará de una combinación lineal dinámica, lo cual supone que
no tengamos el mismo problema que con la modelización de los rendimientos,
ya que no habrá que linealizar. Su expresión es la ya expuesta en (2.25) y (2.26).
Ahora bien, antes de aplicar dichas expresiones, será preciso determinar en cada
instante temporal el valor de los factores no observables, betas respecto de los
factores de riesgo, tanto para el activo sobre el que arbitrar, como para los
activos que inicialmente compondrá la cartera réplica. Para ello, se empleará la
estimación iterativa-recursiva a que da lugar el filtro de Kalman en la
18
estimación del modelo óptimo, y que concreto queda recogido en la expresión
(2.47).
3. Aplicación práctica del modelo
Con el fin de implementar en la práctica el modelo teórico MSSM, se han

seleccionado 5 activos del mercado continuo español que forman parte de su
índice (IBEX-35). Se trata de Acesa (ACE), dedica a la construcción y
explotación de autopistas y aparcamientos; Repsol (REP), cuya actividad es la
extracción, refino y distribución de productos relacionados con el petróleo y el
gas; Telefónica (TEF), del ámbito de las telecomunicaciones; Unión Fenosa
(UNF), generadora y distribuidora de energía eléctrica; y Vallermoso (VAL),
constructora e inmobiliaria. La muestra ocupa, en datos diarios, desde el 2-01-
1992 hasta el 30-04-2001, ambos inclusive, obtenidos a través de REUTERS.
Comenzamos ofreciendo en la Tabla-1 un resumen estadístico de los

rendimientos o primera diferencia en logaritmos de los precios:
Estadísticos ACE REP TEF UNF VAL
Media 0.000259 0.00065259 0.00091769 0.00082792 0.00027467
Desviación estándar 0.017436 0.016238 0.019918 0.017716 0.021154
Asimetría 0.13696 0.076159 0.057833 0.24565 0.31497
Exceso de curtosis 1.7253 4.2952 2.0433 5.2507 2.7311
Mínimo -0.070594 -0.12859 -0.098857 -0.10911 -0.093152
Máximo 0.088594 0.11802 0.089178 0.13131 0.13983
Test normalidad (Bera-Jarque) 181.84 [0.0000] 751.24 [0.0000] 244.20 [0.0000] 954.67 [0.0000] 343.05 [0.0000]
Test autocorrelación (Portmanteau) -0.021084 0.056867 0.10781 0.12284 0.065033
Test heterocedasticidad (White) 15.020 [0.0001] 22.001 [0.0000] 144.25 [0.0000] 66.854 [0.0000] 48.348 [0.0000]
Test estacionariedad (ADF-t = -3.44) -48.6 -45.07 -42.7 -42.1 -44.67
Tabla 1. Resumen estadístico del rendimiento diario de los activos
En la estimación del modelo2, comenzamos por determinar en el óptimo el valor

de la log-verosimilitud, con el fin de realizar los oportunos test de razones de
verosimilitud. Ahora bien, dado que el número de parámetros no sirve para
determinar los grados de libertad de la distribución del estadístico, en la Tabla-2
aparecen recogidos para cada modelo y versión:
Modelo 1 Factor 2 Factores 3 Factores 4 Factores 5 Factores
31 49 67 85 103
1
41 59 77 95 113
24 36 48 60 72
2
34 46 58 70 82
3 31 49 67 85 103
2La implementación de los algoritmos se ha realizado en el lenguaje Ox [Doornik (1998)] y

empleando el paquete SsfPack 2.2 [Koopman et al. (1998)].
19
41 59 77 95 113
26 39 52 65 78
4
36 49 62 75 88
26 39 52 65 78
5
36 49 62 75 88
28 45 62 79 96
6
38 55 72 89 106
24 36 48 60 72
7
34 46 58 70 82
29 46 63 80 97
8
39 56 73 90 107
24 36 48 60 72
9
34 46 58 70 82
Tabla 2. Número de parámetros para cada modelo y versión
Por su parte el valor en el máximo de la log-verosimilitud aparece en la Tabla-3:

Modelo 1 Factor 2 Factores 3 Factores 4 Factores 5 Factores
19.8682 32.7473 51.1670 36.1700 38.4339
1
24.3685 20.3690 44.4102 5.5237 36.6466
10.4139 23.5971 10.3174 43.2217 15.9749
2
45.6476 33.0846 21.5266 38.7515 2.6575
6.8169 32.5534 17.6715 28.1970 2.4348
3
17.5932 1.1399 48.6870 15.3645 11.3384
5.7156 19.4050 20.9467 45.9046 10.0169
4
40.0204 20.0104 2.2826 51.4122 20.6688
3.1659 9.3655 19.7021 47.6130 24.6100
5
9.3691 28.6843 49.1548 30.2818 21.1154
48.0337 5.7646 12.5918 29.7158 31.2098
6
2.4963 9.8748 9.8618 37.1985 29.9724
11.5913 33.7564 32.4105 11.4375 40.8915
7
20.8540 23.2306 7.0409 30.8507 53.0479
52.5873 22.8749 9.9389 43.6921 50.5405
8
37.4245 51.5739 44.6317 34.1364 21.0131
22.4895 32.4309 32.0590 11.0698 6.9693
9
29.7709 3.5140 28.3199 20.3853 12.2365
Tabla 4. Valor en el óptimo de la log-verosimilitud para cada modelo y versión
A continuación y tras realizar los test de verosimilitud, se seleccionaron para

cada modelo y versión un número de factores óptimo, que se recogen en la
Tabla-5, junto con el valor de los correspondientes criterios de información:
Modelo Significado Versión Nº factores Log-verosim. AIC BIC
Estricta 2 32.7473 -337156.1 -347355.8
1 AR(1)-AR(1)
Aproximada 2 20.3690 -205698.8 -215812.7
Estricta 1 10.4139 -99975.35 -110389.5
2 VA-VA
Aproximada 1 45.6476 -474157.3 -484485.7
Estricta 1 6.8169 -61774.96 -72129.06
3 Estruct.-Estruct.
Aproximada 1 17.5932 -176220 -186488.3
Estricta 1 5.7156 -50079.85 -60476.84
4 AR(1)-VA
Aproximada 1 40.0204 -414397 -424708.2
Estricta 3 19.7021 -198616.5 -208790.5
5 AR(1)-Estruct.
Aproximada 1 9.3691 -88880.18 -99191.4
20
Estricta 3 12.5918 -123105.3 -133193.5
6 VA-AR(1)
Aproximada 3 9.8618 -94112.66 -104115.1
Estricta 1 11.5913 -112479.1 -122893.2
7 VA-Estruct.
Aproximada 2 23.2306 -236088.5 -246313.9
Estricta 1 52.5873 -547857.5 -558228.8
8 Estruct.-AR(1)
Aproximada 1 37.4245 -386828.7 -397114.2
Estricta 3 32.0590 -329846.2 -340054.5
9 Estruct.-VA
Aproximada 1 29.7709 -305546.8 -315875.2
Tabla 5. Modelos seleccionados y criterios de información
Como puede observarse en la Tabla-5, el modelo elegido es de factores

autorregresivos y betas variables aleatorias, con un factor de riesgo y en versión
estricta.
Seguidamente se estimaron los parámetros del modelo elegido, siendo los

valores los que figuran en la Tabla-6:
Parámetro Significado Valor Std. Error t-value
κ(1) intercepto activo (1) 0.00584227 0.00765579 0.7631182
δ(0) intercepto factor sin riesgo 0.00326265 0.00162899 2.00287423
δ(1) intercepto factor con riesgo 0.00763843 0.00343704 2.22238767
ρ(0) autocorrelación factor sin riesgo 0.79829161 0.23326884 3.42219573
ρ(1) autocorrelación factor con riesgo 0.87456089 0.24382685 3.58681123
σ2u(1) varianza error activo (1) 0.00211345 0.00092477 2.28537703
s 20 varianza error factor sin riesgo 0.00177148 0.00063964 2.76948746
s 21 varianza error factor con riesgo 0.00287666 0.00147788 1.94647546
ω21,1 varianza error beta activo (1) 0.00457527 0.00210104 2.17762116
Tabla 6. Parámetros estimados para el modelo óptimo seleccionado
A la luz de los resultados de la Tabla-6, podemos concluir que:
− El activo-3 (TEF) presenta una oportunidad de arbitraje en el conjunto de la

cartera, en concreto, consistiría en adquirir dicho activo, ya que su intercepto
es significativamente distinto de cero (positivo), y vender la cartera réplica.
21
− Como se indicó ya, el intercepto del activo libre de riesgo es menor que el del
factor con riesgo, como consecuencia de la prima de riesgo, siendo también
menor el parámetro de autocorrelación.
− Respecto a la volatilidad diaria de los activos, podemos comprobar que se

mueve entre 0.2% (ACE) y 0.6% (UNF). En cambio para los factores, el libre
de riesgo presenta una volatilidad diaria de 0.18%, mientras que para el
activo con riesgo es de 0.29%.
− Finalmente, las volatilidades de las betas se mueven entre 0.23% (TEF) y

0.8% (VAL).
Una vez analizados los parámetros, seleccionado el activo sobre el que arbitrar
(TEF) y elegidos los activos de la cartera réplica (ACE, REP, UNF y VAL),
determinaremos los parámetros de comportamiento de la estrategia de arbitraje
dinámico. Ello exige que previamente, como se indicó, y a partir del proceso
recursivo del filtro de Kalman, se estimen las betas del activo sobre el que
arbitrar y de los activos que compondrán inicialmente la cartera réplica. Esto
junto con los precios correspondientes y para los mismos instantes temporales,
alimentará el proceso de estimación, cuyos resultados aparecen en la Tabla-7:
Parámetro Significado Valor Std. Error t-value
θ(ACE, TEF) autocorrelación ponderación ACE 0.69904025 0.05041022 13.8670342
θ(REP, TEF) autocorrelación ponderación REP 0.87774059 0.08241247 10.6505804
θ(UNF, TEF) autocorrelación ponderación UNF 0.90168581 0.09396133 9.5963498
θ(VAL, TEF) autocorrelación ponderación VAL 0.76770511 0.05378448 14.2737296
σ2e(ACE) varianza error ponderación ACE 0.01432416 0.00528699 2.70932176
σ2e(REP) varianza error ponderación REP 0.00986769 0.00156411 6.30880091
σ2e(UNF) varianza error ponderación UNF 0.02670303 0.00380329 7.02104192
σ2e(VAL) varianza error ponderación VAL 0.04163846 0.00841913 4.94569484
Tabla 7. Parámetros de la estrategia de arbitraje dinámica
Según los resultados de la Tabla-7, las ponderaciones para construir la cartera

réplica de arbitraje presentan una volatilidad diaria entre 0.98% (REP) y 4.16%
(VAL).
4. Consideraciones finales
En este trabajo hemos presentado un modelo en espacio de los estados que

permite resolver el problema sobre el comportamiento y el número de factores a
considerar en un modelo multi-beta APT. Se han dado las pautas a seguir para
la estimación del mismo a través del filtro de Kalman y previa linealización del
22
modelo. También se ha incluido un apartado destinado a la contrastación y
selección del modelo y su correspondiente número de factores óptimos para la
cartera.
Asimismo, mediante test individuales, se han identificado las oportunidades de

arbitraje y finalmente, mediante un modelo dinámico de construcción de la
cartera réplica a través de espacio de los estados, se ha identificado la estrategia
a seguir.
Para terminar hemos de reseñar que este trabajo se engloba dentro de los
últimos avances en la gestión activa de carteras. En concreto, constituye un
estudio paralelo a la denomina estrategia de arbitraje estadístico (Anexo-1), la
cual consiste en buscar una combinación de activos que confeccionen una
cartera cuyo comportamiento sea definido como estacionario, ya que de este
modo, su valor esperado y su varianza serán buenos indicadores del
comportamiento futuro de la misma. Así pues, la estrategia consistiría en tomar
aquella combinación de activos que genere una cartera cuyo comportamiento
sea estacionario con mayor media y menor varianza.
Para llevar a cabo esta estrategia podemos recurrir al trabajo de Peña (1990), en
el que se demuestra que mediante un análisis de componentes principales
pueden extraerse las relaciones de cointegración entre activos, de tal modo, que
los componentes cuyo peso (eigenvalue) sea prácticamente nulo, constituyen
dichas relaciones o carteras estacionarias, y su construcción vendrá dada por la
combinación de los activos, siendo los pesos de cada uno los que se obtengan en
el correspondiente eigenvector.
Así y a modo de ejemplo, para nuestra cartera de 5 títulos, la matriz de

correlaciones del logaritmo del precio vendría dada en la Tabla-8:
ACE REP TEF UNF VAL
ACE 1
REP 0.73 1
TEF 0.75 0.98 1
UNF 0.75 0.95 0.98 1
VAL 0.89 0.84 0.81 0.81 1
Tabla 8. Matriz de correlaciones entre el logaritmo de los precios
Finalmente, realizamos un análisis de componentes principales de la matriz de

correlaciones con los resultados que figuran en la Tabla-9:
PC1 PC2 PC3 PC4 PC5
23
ACE -0.42 -0.671 -0.564 0.23073 0.0704
REP -0.46 0.3308 0.2655 0.65094 0.4308
TEF -0.46 0.3634 -0.159 0.07847 -0.79
UNF -0.46 0.3368 -0.279 -0.6543 0.4131
VAL -0.44 -0.441 0.7133 -0.2979 -0.12
Eigenvalues 4.399 0.4394 0.1173 0.03475 0.0099
% variación 87.97% 8.79% 2.35% 0.70% 0.20%
% acumulado 87.97% 96.76% 99.11% 99.81% 100.01%
Tabla 9. Análisis de componentes principales de la matriz de correlaciones
A la luz de los resultados de la Tabla-9, podemos comprobar que los dos últimos
componentes principales (Pc4 y Pc5) tienen eigenvalues prácticamente nulos,
por lo que sus correspondientes eigenvectors informan de los pesos a dar a cada
activo, con el fin de construir una cartera de arbitraje estadístico.
Por último reseñar, que los tres primeros componentes, que explican el 99.11%
de la matriz de correlaciones, mostrarían:
− El primero de ellos un índice del mercado, ya que su eigenvectors es una

equiponderación de los activos.
− El segundo para mostrar una contraposición de los sectores tecnológicos y

energéticos frente a la construcción.
− Y el tercero básicamente representa un indicador del efecto de la

construcción no recogido en los anteriores.
5. Referencias bibliográficas
− Bhar, R. y Chiarella, C. (1997). Transformation of the Heath-Jarrow-Morton

Models to Markovian System. European Journal of Finance, 3: 1-26.
− Bolland, P. J. y Connor, J. T. (1999). A robust non-linear multivariate

Kalman Filter for arbitrage identification in high frecuency data. Technical
Report, London Business School.
− Campbell, J. Y. (1993). Intertemporal Asset Pricing without consumption

data. American Economic Review, 83: 487-512.
− Cochrane, J. H. (996). A cross-sectional test of a production based asset

pricing model. Working paper, Journal of Political Economy.
24
− Connor, G. y Korajczyk, R. A. (1986). Performance Measurement with the
Arbitrage Pricing Theory: A New Framework for Análisis. Journal of
Financial Economics, 15: 373-394.
− Doornik, J. A. (1998). Object-oriented matrix programming using Ox 2.0.

Timberlake Consultants Press. Londres.
− Durbin, J. y Koopman, S. J. (2001). Time series análisis by State-Space

methods. Oxford Statistical Science Series #24. Oxford University Press.
Oxford.
− Fama, E. y French, K. (1993). Common risk factors in the returns of stocks

and bonds. Journal of Financial Economics, 33: 3-56.
− Fama, E. y French, K. (1996). Multifactor explanations of asset pricing

anomalies. Journal of Finance, 51: 55-87.
− Ferson, W. E. (2003). Tests of multifactor pricing models, volatility bounds

and portfolio performance. Working paper 9441, National Bureau of
Economic Research. Cambridge.
− Ferson, W. E. y Harvey, C. R. (1991). The Variation of Economic Risk

Premiums. Journal of Political Economy, 99: 385-415.
− Fletcher, R. (1987). Practical methods of optimisation. 2nd edition. John

Wiley. New York.
− Keim, D. B. (1983). Size-related anomalies and stock return seasonality:

Further empirical evidence. Journal of Financial Economics, 12: 13-32.
− Kim, C. J. y Nelson, C. R. (1999). State-Space models with regime switching.

Classical and Gibbs-Sampling approaches with applications. MIT Press.
Cambridge.
− Koopman, S. J.; Shephard, N. y Doornik, J. A. (1998). Statistical algorithms

for models in state space using SsfPack 2.2. Econometrics Journal, 1: 1-55.
− Lintner, J. (1965). The valuation of risk assets and the selection of risky
investments in stock portfolios and Capital budgets. Review of Economics
and Statistics, 47: 13-37.
25
− Peña, D. (1990). Cointegración y reducción de dimensionalidad en series
temporales multivariantes. Cuadernos Económicos de I.C.E., 44-I: 109-126.
− Roll, R. y Ross, S. A. (1980). An empirical investigation of the Arbitrage

Pricing Theory. Journal of Finance, 35: 1073-1103.
− Sharpe, W. F. (1964). Capital Asset Prices: A Theory of Market Equilibrium

under Conditions of Risk. Journal of Finance, 19: 425-442.
− Shephard, N. (1994). Partial non-Gaussian state space. Biometrika, 81: 115-

131.
− Staikouras, S. K. (2001). Equity returns of financial institutions and the

pricing of interest rate risk. Technical Report, Faculty of Finance, Cass
Business School of London.
6. ANEXO-I. CONCEPTO DE ARBITRAJE ESTADÍSTICO
Definición 1: Una estrategia de arbitraje de equilibrio o estándar es aquella que,

para un determinado modelo de equilibrio de mercado o de valoración de
activos cumple:
d) El coste inicial es nulo.
e) La cartera es autofinanciada.
f) El valor actual esperado de la cartera es positivo.
Matemáticamente podemos formularlo como:
1) V (0) = 0
2) lim Ε P V (t ) > 0 (6.1)
t →∞
3) lim P V (t ) < 0 = 0

t →∞
Donde P la probabilidad y V representa el valor acumulado y actualizado de la

cartera autofinanciada, es decir, si S es el valor de la cartera en cada instante y B
del bono libre de riesgo, o la correspondiente inversión en el mercado
monetario, entonces:
1
V (t ) =  S (t ) − S (0) (6.2)
B (t )
26
Definición 2: Por su parte, la estrategia de arbitraje estadístico, con
independencia del de mercado o de valoración de activos cumple:
a) El coste inicial es nulo.
b) La cartera es autofinanciada.
c) El valor actual esperado de la cartera es positivo.
d) La varianza muestral tiende a cero si la probabilidad de pérdidas no es nula

para un momento finito de tiempo.
Su correspondiente expresión matemática sería:
1) V (0) = 0
2) lim Ε P V (t ) > 0
t →∞
3) lim P V (t ) < 0 = 0 (6.3)

t →∞
σ P2 V (t )
4) lim = 0 if P V (t ) < 0 > 0 ∀t < ∞
t →∞ t
Así pues, el arbitraje de equilibrio no es más que una modalidad del arbitraje
estadístico sometido a un modelo de valoración o equilibrio, y excluyendo la
cuarta condición. Esta última, indica que cuando la probabilidad de pérdidas
esperadas no sea nula, entonces existe una oportunidad de arbitraje estándar.
Económicamente, esta condición supone que existen eventuales oportunidades
de incremento de beneficios sin riesgo.
Para testar si existen oportunidades de arbitraje estadístico no puede recurrirse

al t-test tradicional aplicado para medir la eficiencia del mercado usando
procesos alpha ajustados al riesgo. Esto se debe a:
 Los procesos alpha exigen que a priori se elija un modelo de equilibrio sobre
el que se testará una hipótesis de comportamiento conjunto, en cambio el
arbitraje estadístico no precisa de tal exigencia.
 En los procesos alpha se aplican sobre los excesos de rendimiento de las

carteras sobre la tasa libre de riesgo, mientras que en el arbitraje estadístico
se realiza sobre los valores acumulados.
 En los procesos alpha se asumen modelos de factores de riesgo lineal, por el

contrario, en el arbitraje estadístico pueden incluirse derivados no lineales.
27
 En los procesos alpha el test consiste en comprobar el t-ratio de la media
incondicional de la cartera, mientras que esto es inviable para detectar una
oportunidad de arbitraje estadístico como consecuencia de la cuarta
condición de su definición.
La cuarta condición en (6.3) exige que los activos que compongan la cartera
deben ser no correlacionados, puesto que, como resulta evidente, si la
correlación entre ellos es positiva, entonces en caso de rendimiento positivo el
valor esperado actual será mayor, ahora bien, en caso de rendimiento negativo,
la varianza será mayor como consecuencia de las covarianzas. Si por el
contrario, la correlación entre activos es negativa, con el fin de reducir la
varianza muestral, el rendimiento positivo esperado también lo será, ya que
cuando el valor de un activo suba, el de otros bajará. Por todo ello, en la
aplicación de una estrategia de arbitraje estadístico habrá que seleccionar
aquellos activos que representen en mayor medida la matriz de correlaciones
del total de activos, evitando así el fenómeno descrito anteriormente.
28

24 APTmariano Gonzalez

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

24 APTmariano Gonzalez

Uploaded by

Copyright:

Available Formats

Estimación y contrastación de la

Arbitrage Princing Theory: A Multifactor

Dr. D. Mariano González Sánchez

Universidad San Pablo-CEU

1er. Simposio de Docentes de Finanzas de Colombia

Resumen: El objetivo de este trabajo es testar las diferentes

Key words: Arbitrage Pricing Theory, State-Space Model, filter

JEL: C10, C15, C22, G12, G14.

Dentro de la literatura financiera, y en lo relativo a los modelos multifactoriales,

− La primera cuestión es determinar si para un mercado concreto resulta más

− Una segunda cuestión que se plantea es la elección de los factores de riesgo

− Una última cuestión es la relativa a la construcción de carteras réplica de un

2. Multifactor State-Space Model para la valoración de activos

2.1. Concepto de arbitraje bajo un modelo multifactorial

Sea M el conjunto de activos que define un mercado, entendiendo por tal no

sólo un mercado físico u organizado, sino cualquier cartera de activos de un

cualquiera (i) de dichos activos en el instante de tiempo t. De este modo para

a) El coste inicial es nulo.

c) El valor actual esperado de la cartera es positivo.

Matemáticamente podemos formularlo como:

3) lim Pr V (t ) < 0 = 0

Donde ω es la ponderación en cada instante temporal para cada activo del

Definición 2: La ecuación fundamental de valoración de un activo de forma

S (i, t ) = Ε tPr  mt+1S (i, t + 1) (2.3)

Donde m representa una función de descuento estocástica estrictamente

Ε Pr  mt+1R (i, t + 1) − 1 Ωt  = 0 (2.4)

Siendo Ω el conjunto de la información de mercado, si bien en la práctica suele

Definición 3: Un modelo multifactorial riesgo neutral en términos de la APT

Ε tPr  R (i, t + 1) Ωt  = λ (0, t ) + ∑ β (i, j, t )λ ( j, t ) (2.5)

Ahora bien, el rendimiento de un activo también puede expresarse en un

α (i, t ) ≡ Ε tPr  R (i, t + 1) Ωt  = λ (0, t ) + ∑ β (i, j, t )λ ( j, t ) (2.7)

Entonces realizando algo de cálculo en la expresión (2.6) tendríamos:

Por definición sabemos que:

Donde F es el valor de cada factor de riesgo. Con lo que a partir de (2.9) y

La expresión (2.10) sería la ecuación multifactorial libre de riesgo, ahora bien, si

debería cumplirse que:

Sujeto claro está al comportamiento del factor no sistemático, esto es:

De manera que si Σ es diagonal se trataría del modelo estricto, mientras que si

2.2. Formulación del MSSM

Dentro de la literatura financiera existen multitud de trabajos sobre el método

Donde la primera ecuación será la de medida, mientras que la segunda será la

De este modo supongamos, para simplificar, que el mercado se compone de dos

Fijémonos que r representa la correlación entre los factores de riesgo no

En cuanto a la ecuación de transición podemos proponer varias formulaciones o

Segundo. En este caso todos los factores y las betas presenta un

Sexto. Los factores son considerados como variables aleatorias, en cambio

Octavo. Los factores siguen un modelo estructural y las betas un AR(1):

Noveno. Finalmente, los factores se identifican con un modelo estructural,

Finalmente, y con relación a la construcción de la cartera réplica en el supuesto

Donde β* representa el valor estimado del parámetro beta que acompaña al

A partir de la expresión (2.26) podemos deducir que se trata de una estrategia

2.3. Estimación del MSSM

La estimación de los modelos mediante State-Space suele realizarse mediante el

Como puede observarse nuestro problema es un modelo multiplicativo, ya

Con lo que generalizando, la linealización de la ecuación de medida en un

Donde b, f y l0 representan los valores iniciales elegidos.

Si ahora generalizamos las expresiones (2.28) y (2.29) para N individuos y M

1. Estimar los valores de la nueva variable dependiente como:

2. Plantear la nueva ecuación de medida tal y como sigue:

3. Optimizar la función de verosimilitud que genera la ecuación de medida

Asumiendo que tanto yt como st son conocidos, el objetivo es estimar R(t+1)1.

Donde K(t) representa el conjunto de información conocida en el instante t. Si

1Con la intención de facilitar la comprensión de la nomenclatura empleada, tanto los valores