Professional Documents
Culture Documents
podemos escribir
(p)
S=WS
[3]
siendo
1
1
p
p
W=
'
I | |
|
|
i
\ .
la matriz 1 p (p ) anterior y denotando por
i
al vector columna
de la dimensin correspondiente con valores iguales a la unidad.
3. EL MODELO BAYESIANO JERRQUICO. ESTIMADORES PTIMOS DE
BAYES
Para la tendencia ( )
1 +
=
N r
T T,...,T ' , consideraremos una distribucin a priori,
condicionada por la precisin, t,
( ) ( )
2
2
(N r)/
T
(T| ,D) exp T'MT T T ' T T
+
t
(
t t t + P
`
)
[4]
donde M es la matriz de la forma cuadrtica cuyo objetivo ser favorecer tenden-
cias regulares. Para ello, la matriz se construye a partir de las matrices de primeras
o segundas diferencias. As, puede elegirse
1 1
M D' D = , siendo
1 ij
D (d ) = la matriz
1 (N r ) (N r) + + de rango 1 N r + que produce primeras diferencias, esto es,
0
ij
d = excepto
1
1 1
ii i,i
d , d
+
= = para 1 1 i , ,N r = + , o bien, si se desean favorecer
las tendencias lineales,
2 2
M D' D = , siendo
2 ij
D (d ) = la matriz 2 (N r ) (N r) + + de
rango 2 N r + que produce las segundas diferencias, esto es, 0
ij
d = excepto
1 2
1 2 1
ii i,i i,i
d , d ,d
+ +
= = = para 1 2 i , ,N r = + ,. La matriz
T
P es una matriz cuadra-
da, no singular, de orden N r + . En definitiva, esta distribucin a priori sigue un
esquema gaussiano que hace ms probables tendencias regulares, esto es, con
primeras o segundas diferencias pequeas.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
133
Para t suponemos una distribucin marginal a priori gamma(5)
1
0
b a
( D) e ,
t
t t t t> [5]
lo que garantiza que trabajaremos en un marco determinado por familias conjuga-
das de distribuciones.
A la componente estacional
1 p
S=(S,,S )' la asignamos una distribucin a priori
( ) ( )
2
2
p/
S
(S| ,D) exp S S ' S S
t
(
t t t P
`
)
[6]
restringida por [2], y siendo
S
P una matriz p p no singular.
Introduciendo la restriccin [3] en el modelo dispondremos de una priori sin res-
tricciones; as, denotando por
S S
W W' W = P y por
1
(p)
S S S
W W' S
= P , se tiene
que el exponente de [6] es,
( ) ( ) ( ) ( )
1 1
(p) (p)
S (p) S S (p) S S S S S
S S ' S S S ' W S S' WW W' S
(
P = + P P P
con lo que, incorporando la restriccin al modelo, y admitiendo independencia a
priori entre T y
(p)
S condicionados por t resulta la priori conjunta en el modelo
restringido,
( ) ( )
1
2 2
2 2
2
N r p
b
a
(p) T
(S ,T, D) e exp T'D' D T T T ' T T
+
+ +
t
t
t t t + P +
( )
( )
( )
( )
( )
( )
}
1 1
p p
S S S S S S S p p
S 'W S SP P WW W' P S
(
(
+ + (
[7]
El modelo de verosimilitud es el modelo [1] de descomposicin de la serie, con
ciertas especificaciones aleatorias.
(5) Existen varias versiones de la distribucin gamma de acuerdo con los parmetros que se
utilicen. Nosotros utilizaremos la versin segn la cual si X (a,b) , su funcin de densidad viene
dada por
1
b
a b ax
f(x) x e
(b)
=
I
, para
x 0 >
. Con esta parametrizacin, su esperanza es b/ a y su varianza
2
b/a .
ESTADSTICA ESPAOLA
134
Denotemos por
S
E la matriz que expande la estacionalidad al conjunto de los
N r + meses, es decir,
M p
S
r r,p r
E
i I | |
|
=
|
I O
\ .
, donde el bloque inferior es la matriz r p que
selecciona las estacionalidades de los r primeros meses del ao, esto es, la matriz
r,p r
O es una matriz nula de dimensin r (p r) .
Recordando la expresin [3] podemos escribir el modelo de verosimilitud como
S S (p)
y T E S T E WS = + + c = + + c , esto es
W (p)
y T E S = + + c [8]
siendo ( )
1 N r
y y , ,y '
+
= , y
1
M
W S
r r,p r
W
E E W
i | |
| = =
|
I O
\ .
,donde el bloque inferior es la
matriz r p que selecciona las estacionalidades de los r primeros meses del ao
entre los 1 p primeros, esto es, la matriz
1 r,p r
O es una matriz nula de dimensin
1 r (p r ) .
Admitimos una distribucin normal para el ruido, de manera que
( ) ( )
1 1
N r
,D N ,
+ c
c t O t P , es decir
( )
2 2
N r
'
,D e
c
+ t
c P c
t c t t , donde
c
P es una
matriz cuadrada de orden N r + no singular. En definitiva, la verosimilitud del
modelo resulta
( ) ( ) ( )
2
2
N r
W (p) W (p)
,D exp y T E S ' y T E S
+
c
t
t c t t P
`
)
[9]
Multiplicando la priori conjunta [7] por la funcin de verosimilitud [9] obtendre-
mos la conjunta a posteriori, detallada en el Anexo. Tras sencillas, aunque tediosas
operaciones que en el mismo se detallan, resulta que la marginal a posteriori de T
es una Student multivariante(6) de dimensin N r + con 2 1 b N r + + +
(6) Diremos que una variable Zde dimensin d tiene una distribucin t de Student
multivariante si su funcin de densidad conjunta es de la forma
( ) ( ) ( )
2 1
1
d
z z
f z z ' A z
+ v | |
|
\ . (
+
(
v
. Sus grados de libertad son v , su matriz de posicin
Z
y
su matriz de escala A . Se demuestra que su matriz de varianzas y covarianzas resulta
-1
(v/(v- 2))A para 2 v > . Vase, por ejemplo, Zellner, (1971), pg. 383, donde se justifica la
eleccin de esta versin de la distribucin de Student multivariante en lugar de otras clsicas.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
135
grados de libertad, matriz de posicin(7)
T
y matriz de varianzas-covarianzas
1
2
2 1
T
a
b N r
c
P
+ +
.
Se obtiene tambin en dicho Anexo que la marginal a posteriori de
(p)
S , es una
multivariante de Student con 2 1 b N r + + grados de libertad, matriz de posicin
(p)
S
P
+ +
.
En definitiva, la obtencin de las distribuciones marginales a posteriori de T y
(p)
S proporciona el estimador de Bayes ptimo que, como es conocido, es la espe-
ranza de la distribucin marginal a posteriori si suponemos una funcin de prdida
cuadrtica. Pueden observarse en el Anexo dichas esperanzas as como sus
matrices de varianzas y covarianzas a posteriori.
4. DISTRIBUCIONES MARGINALES A PRIORI
El conocimiento de las distribuciones marginales a priori y, en especial, la rela-
cin de ciertas caractersticas de dichas marginales con los parmetros del modelo,
permite asignar valores a dichos parmetros cuando se disponga de informacin a
priori sobre la serie. Obtengamos, en consecuencia, dichas marginales. La marginal
a priori de t , [5], ya fue descrita anteriormente. Se trata de una gamma (a,b) con
lo que se conocen sus momentos,
( ) E b/a
t
t =
y
( )
2
Var b/a
t
t =
. Igualmente, clculos
directos (vase Broemeling (1985) o Zellner (1971)) proporcionan los momentos de
1
t que sern utilizados ms adelante
( )
1
1
a
E
b
t
t =
, 1 b> y
( )
2
1
2
1 2
a
Var
(b ) (b )
t
t =
si
2 b> . Sealemos que desde el punto de vista de la asignacin de valores a los
parmetros, es preferible el enfoque que utiliza los momentos de
1
t a la utilizacin
de los momentos de t , ya que es ms intuitivo trabajar en trminos de varianza
que de la precisin.
Teniendo en cuenta la distribucin a priori de t de [5], la distribucin conjunta a
priori de ( , ) c t es
( )
| | 1 2
2 2
N r
b a '
, D e
c
+ t
+ +c P c
t c t t . Integrando en ( ) 0, t e obtene-
mos la marginal a priori de c
(7) En el Anexo se detallan las expresiones no definidas hasta el momento, tanto para
esta distribucin como para las restantes.
ESTADSTICA ESPAOLA
136
( ) | |
2
2
N r
b
D a '
+ | |
+
|
\ .
c
t c + c P c [10]
Se trata de una Student multivariante con 2b grados de libertad (obsrvese que
N r + es la dimensin de c ), matriz de posicin igual a la matriz nula de dimensin
( ) 1 N r + y matriz de varianzas-covarianzas
( )
1
1
a
V
b
c
c = P
[11]
Para obtener la distribucin a priori de T , partimos de la priori conjunta de
( ) T,t ,
( ) ( )
1 2
2 2
2
2
b (N r)/
T
(T, D) exp a T'D' DT T T ' T T
+ +
t
(
t t t + + P
`
)
[12]
Integrando en t dicha distribucin resulta entonces
( ) ( )
2
2
N r
b
T T T T
(T D) a T ' T
+ | |
+
|
\ .
t t t
(
t + P
[13]
donde denotamos por
2 2 T T
D' D
t
P = + P , por
1
T T T
T
t t
= P P y por
( )
1 1
2 2
T T T T T
a a T' T
t
= + P P P P .
La marginal a priori de T [13] es, por tanto, una distribucin de Student multiva-
riante con 2b grados de libertad, matriz de posicin
Tt
y matriz de varianzas-
covarianzas
1
1
T
T
a
b
t
P
.
Obtengamos ahora la marginal a priori de
(p)
S , de forma anloga al trabajo rea-
lizado para obtener la marginal a priori de T . La distribucin a priori conjunta
(p)
S y
de t es
( ) ( ) ( )
1 2 1 1
2
2
(p) (p)
b p/
(p) S S S S (p) S S (p) S
(S , D) exp a S' WW W' S S 'W S
+
t
(
t t t + P P P +
`
(
)
[14]
e integrando en t resulta
( ) ( )
2
2
(p) (p)
p
b
(p) S (p) S S (p) S
(S D) a S 'W S
(
t +
(
[15]
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
137
donde hemos llamado
( )
1 1
2 2
S S S S S
a a S' WW W' S
= + P P P . En consecuencia, la
distribucin a priori marginal de
(p)
S es una Student multivariante con 2 1 b+ grados
de libertad, matriz de posicin
(p)
S
y matriz de varianzas-covarianzas
1
2
2 1
S
S
a
W
b
.
Decamos anteriormente que estas distribuciones marginales a priori pueden
utilizarse para asignar valores a los parmetros del modelo. Dichos parmetros son
las matrices
S
P ,
T
P y
c
P , y los escalares a y b que determinan la distribucin a
priori de t .
La asignacin de valores a los parmetros de las distribuciones a priori em-
pleando informacin extramuestral es una tcnica empleada por los autores en
otras situaciones (vase, por ejemplo, Rojo y Sanz, 2002 y 2005). La idea que
subyace a la utilidad de dicha asignacin es que en muchos modelos econmicos,
la informacin muestral es escasa, por lo que la distribucin a priori llega a dominar
a la verosimilitud. En consecuencia, qu parmetros hayamos asignado a la distri-
bucin a priori resulta de extrema importancia.
Si disponemos de una serie vicaria, para la que se pueda suponer el mismo
modelo de descomposicin (puede ser una serie ms larga correspondiente a otro
mbito geogrfico una vez corregida de escala para que su orden de magnitud sea
el de la serie a estudiar) pueden asignarse valores a los parmetros siguiendo las
siguientes pautas:
1. Se obtiene una tendencia y una estacionalidad provisionales de la serie vicaria
por procedimientos descriptivos, y en consecuencia, una asignacin de valores a la
serie de ruido.
2. Haciendo paquetes (batchs) a dicho ruido podemos obtener varios valores de
1
t (vase, por ejemplo, Dhrymes (1984), pgs. 14 y 102, dependiendo del tipo de
modelo empleado) con los que obtener una estimacin a priori de,
1
E
t
(
t
y de
1
Var
t
(
t
(la media y cuasivarianza muestral de los valores de
1
t obtenidos) y,
por tanto, de a y b.
3. Tomando ahora la serie a descomponer, podemos obtener un valor de T y de S
por procedimientos descriptivos, y por tanto, una estimacin del ruido de nuestra
serie. A partir de esta estimacin, y suponiendo un modelo para el ruido, estimamos
a priori la matriz de varianzas y covarianzas del ruido utilizando la expresin [11] y
los valores de a y b obtenidos en el paso anterior.
4. No existe informacin suficiente para asignar valores razonables a
S
P y
T
P por
su alta dimensin. Parece prudente entonces asignarles matrices iguales a la
ESTADSTICA ESPAOLA
138
identidad del orden correspondiente. Ello no prejuzga que las matrices de varianzas
y covarianzas a posteriori de T y de S sean distintas a la identidad.
Puede tambin optarse por emplear distribuciones a priori neutrales en el senti-
do de J effreys (ver Zellner, (1971), pp. 41). En concreto:
1. Obtenemos valores de T y de S por procedimientos descriptivos (vase, por
ejemplo, Martn-Guzmn, 1989, pp. 250 a 256).
2. Tomamos matrices identidad del orden correspondiente para
S
P ,
T
P y
c
P .
3. Tomamos valores de a y b muy pequeos (en concreto, los hemos tomado
iguales a 0.001) de forma que la distribucin a priori de t sea aproximadamente
neutral. Ello permite que la distribucin a priori de t siga siendo una gamma,
garantizando que nos mantenemos dentro de las familias conjugadas de distribu-
ciones (esta prctica es frecuente en los modelos bayesianos jerrquicos, vase,
por ejemplo Spiegelhalter y otros, (1999))
5. APLICACIONES Y VALIDACIONES DEL PROCEDIMIENTO OBTENIDO
En este apartado ejemplificamos el funcionamiento del procedimiento diseado
en los epgrafes anteriores, a la vez que comparamos sus resultados con los que
proporciona el mtodo de alisado exponencial con estacionalidad (Holt-Winters
aditivo), y con otros dos procedimientos clsicos(8) mencionados anteriormente:
Tramo-Seats(9) y X12-Regarima(10), que denotaremos abreviadamente como TS y
X12. Las versiones utilizadas para los tres son las que tiene implementadas
Eviews(11). Se presenta una ilustracin del procedimiento y una evaluacin ms
sistemtica mediante procedimientos de simulacin.
El ejemplo propuesto como ilustracin utiliza la serie mensual de Matriculacio-
nes de turismos (Direccin General de Trfico, www.dgt.es) para Espaa. En este
caso se dispone de una serie larga (en el momento de cerrar la informacin, se
dispona de datos bsicamente homogneos desde enero de 1985 hasta septiem-
bre de 2009). La longitud de la serie permite comparar los cuatro mtodos (nuestro
mtodo bayesiano con el alisado exponencial, con X12 y con TS), as como evaluar
el grado de deterioro de las estimaciones cuando la serie pierde longitud. As, se
(8) Recomendados por Eurostat a las Oficinas estadsticas de los pases miembros.
(9) Vase Gmez y Maravall, 1997 y 1998.
(10) Vase US Census Bureau, 2002.
(11) Desarrollado por Quantitative Micro Software. Utilizamos la versin 4.1 del programa.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
139
descomponen las series para muestras que se inician en enero de 1985, de 1990,
de 1995, de 2000 y de 2005 (el valor final es siempre septiembre de 2009).
Finalmente presentaremos una evaluacin ms detenida del mtodo propuesto
realizada con elementos de simulacin. Se han realizado 500 simulaciones para
una serie corta (trimestral de 3 aos, esto es, 12 datos en total) con una tendencia
constante y una estacionalidad fija, con composicin aditiva. A estas dos compo-
nentes se les ha aadido un ruido blanco gaussiano. Las simulaciones se realizan
en 3x10=30 situaciones diferentes, correspondiendo a tres dispersiones del ruido
(poco disperso, medio disperso, muy disperso) y 10 situaciones en lo referente a la
estacionalidad, desde una estacionalidad leve hasta una estacionalidad amplia.
A continuacin describimos brevemente las herramientas de comparacin em-
pleadas. Utilizaremos medidas numricas, de carcter absoluto o relativo. Son
medidas clsicas para comparar dos series, donde habitualmente una de ellas es la
verdadera serie y la otra es la estimada. Nosotros las utilizamos para comparar la
serie estimada (tendencia ms estacionalidad) con la serie original, o (en la ilustra-
cin simulada) para comparar la tendencia lineal con las tendencias estimadas por
nuestro mtodo o por X12.
Utilizaremos tres medidas absolutas de discrepancias, que son clsicas en la
evaluacin de series cronolgicas. Si llamamos
t
y a la serie a comparar e
t
y
a la
serie estimada, utilizaremos dos medidas absolutas de error, MAD (Mean Absolute
Deviation, desviacin absoluta media), es decir,
1
1
m
t t
t
MAD(y,y) y y
m
=
=
. y RMSE
(Root of Mean Squared Error, raz del error cuadrtico medio), esto es,
( )
2
1
1
m
t t
t
RMSE(y,y) y y
m
=
=
.
Como medidas relativas, adems del coeficiente de correlacin lineal de Pear-
son, usaremos MAPE, (Mean Absolute Percentage Error, error absoluto medio
porcentual),
1
1
100
m
t t
t
t
y y
MAPE(y,y)
m y
=
2
1
1
100
m
t t
t
y y
RMSPE(y,y)
m y
=
| |
= |
|
\ .
ESTADSTICA ESPAOLA
140
Una de las caractersticas que queremos evaluar es la regularidad de la tenden-
cia estimada. Dagum (1979) utiliza la norma
2
L de las primeras diferencias (para
una serie
1 T
A , ,A , la define como ( )
2
1 1
2
T
t t
t
B A A
=
=
. Una modificacin
de 1 B en trminos relativos, que permite comparar la regularidad de series de
diferentes tamaos es
1
2
1 1
1
1
T
t t
t
RB (y) y y
T y
=
=
, donde y es la media aritmti-
ca de la serie, permite comparar la regularidad de series de diferentes escalas.
Otras dos medidas (una absoluta y otra relativa) permiten evaluar la linealidad
de la serie (para una tendencia lineal, las segundas diferencias se anulan). Estas
medidas son 2 B (y) y 2 RB (y) ,
1 2
3
1
2 2
2
T
t t t
t
B (y) y y y
T
=
= +
y
1 2
3
1 1
2 2
2
T
t t t
t
RB (y) y y y
T y
=
= +
.
Asimismo, mediremos el tamao de la estacionalidad estimada mediante la des-
viacin tpica de las componentes estacionales.
En cuanto a la descomposicin de la serie de Matriculaciones de Turismos, la
ventaja de esta ilustracin se encuentra en la utilizacin de una serie larga para la
que puede realizarse una estimacin por TS. Adicionalmente su longitud nos va a
permitir evaluar la evolucin de la calidad del procedimiento cuando la serie se
acorta. Sealemos tambin que, como ocurre con frecuencia para series econmi-
cas, el aspecto de la serie parece abonar ms una modelizacin que incluya una
composicin multiplicativa. Por ello, se ha realizado una transformacin logartmica
previa en la serie antes de proceder a la estimacin de las componentes.
Las cinco primeras columnas de la Tabla 1 evalan la semejanza entre la serie
original (el neperiano de las matriculaciones) y su estimacin como suma de ten-
dencia y estacionalidad. Puede observarse que la peor calidad se presenta para
TS. El resultado para este mtodo viene condicionado por el hecho de que se ha
hecho trabajar al programa con las opciones por defecto, y no ha encontrado
significativos los parmetros estacionales, por lo que no los ha incluido en la esti-
macin. Puede tambin notarse que, en general, la estimacin bayesiana presenta
mejores (menores) valores de los estadsticos, especialmente para series cortas,
indicando una mayor proximidad de la serie estimada con la original.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
141
Tabla 1
MEDIDAS DE DISCREPANCIA EN LA DESCOMPOSICIN DE LA SERIE
DE MATRICULACIONES
MAPE RMSPE RMSE MAD Pearson
S
o
RB1
desde 1985 Bayesiano 0,385 0,545 0,060 0,043 0,987 0,182 0,002
desde 1985 X12 0,380 0,601 0,066 0,043 0,984 0,188 0,001
desde 1985 TS 1,328 1,656 0,187 0,151 0,860 0,002
desde 1985 Alisado 0,657 0,924 0,102 0,074 0,961 0,184 0,003
desde 1990 Bayesiano 0,359 0,478 0,054 0,041 0,987 0,184 0,002
desde 1990 X12 0,348 0,519 0,058 0,040 0,984 0,170 0,001
desde 1990 TS 1,336 1,636 0,187 0,153 0,821 0,002
desde 1990 Alisado 0,601 0,828 0,093 0,069 0,959 0,188 0,003
desde 1995 Bayesiano 0,316 0,404 0,046 0,036 0,988 0,188 0,002
desde 1995 X12 0,308 0,448 0,051 0,036 0,986 0,217 0,001
desde 1995 TS 1,329 1,637 0,188 0,153 0,788 0,001
desde 1995 Alisado 0,534 0,698 0,080 0,062 0,965 0,193 0,003
desde 2000 Bayesiano 0,295 0,372 0,043 0,034 0,987 0,179 0,002
desde 2000 X12 0,296 0,401 0,046 0,034 0,984 0,191 0,001
desde 2000 TS 1,251 1,528 0,178 0,146 0,734 0,001
desde 2000 Alisado 0,517 0,640 0,074 0,060 0,960 0,185 0,003
desde 2005 Bayesiano 0,331 0,417 0,048 0,038 0,988 0,168 0,002
desde 2005 X12 0,346 0,435 0,050 0,040 0,987 0,173 0,002
desde 2005 TS 1,217 1,468 0,170 0,142 0,836 0,002
desde 2005 Alisado 0,532 0,702 0,081 0,062 0,966 0,177 0,004
En cuanto al comportamiento cuando la serie se acorta, ntese que TS mejora
muy ligeramente, mientras que X12 tambin lo hace segn se acorta la serie, salvo
cuando la serie es muy corta (desde 2005 hasta septiembre de 2009, una serie de
cuatro aos y nueve meses), en cuyo caso empeora. El procedimiento bayesiano
mejora segn la serie se acorta, lo que muestra que su mayor eficiencia del diseo
se presenta en la descomposicin de series cortas.
Las dos ltimas columnas evalan la regularidad de la estimacin de la tenden-
cia, mediante la medida RB1. Ntese que, aunque las diferencias son escasas, la
estimacin por el procedimiento X12 proporciona tendencias ms regulares. Por
otro lado, proporciona en general mayores componentes estacionales, como mues-
ESTADSTICA ESPAOLA
142
tra la columna de desviaciones tpicas de los coeficientes estacionales (columna
S
o ).
El balance general es que el procedimiento bayesiano y X12 funcionan de ma-
nera muy parecida en este caso, incluso para series cortas; el ligero deterioro de
ciertos estadsticos para el periodo 2005-2009 puede deberse al mayor peso del
periodo ms reciente, que hace que el cambio brusco en la serie de matriculaciones
en el verano de 2008 debido a la crisis tenga mayor peso en el conjunto de la serie
(13 meses en un total de 57) lo que aconsejara, probablemente, un tratamiento
diferenciado de ambos periodos.
Presenta peores resultados para todas las selecciones temporales el Alisado
exponencial (Holt-Winters estacional aditivo), si bien supera en todos los casos a
TS. Sealemos que hemos dejado que el programa estimase los parmetros de
alisado por mnimos cuadrados.
Finalmente, describamos el procedimiento de simulacin empleado en la valida-
cin de nuestro mtodo. Como sealamos en la introduccin de este apartado, la
simulacin se ha realizado para series trimestrales de tres aos consecutivos. Se
ha tomado una tendencia constante, 10 1 12
j
T , j , , = = . Para la estacionalidad se
han propuesto 10 escenarios, siempre con estacionalidad fija y composicin (con la
tendencia) aditiva. Ms explcitamente, se generan los cuatro valores estacionales
1 4
2
j j
k
S u , j , , = = , donde 1 10 k , , = recorren los escenarios y
j
u son realizacio-
nes de una distribucin uniforme 01 U( , ) . Se consigue as que la estacionalidad
vare en el intervalo 0
2
k
,
| |
|
\ .
. Esta estacionalidad se corrige para que el efecto esta-
cional medio sea nulo, es decir, se obtienen
4
1
1
1 4
4
'
j j i
i
S S S , j , ,
=
= =
. Con ello se
consiguen escenarios ms estacionales (valores altos de k ) o menos estacionales
(valores pequeos de k ). En las tablas, se describen estos 10 escenarios mediante
max
S
R , recorrido mximo de la estacionalidad, que vara desde hasta 5.
Otro de los parmetros de la simulacin es el nivel de ruido. En concreto, el rui-
do se simula como un ruido blanco, con 0
i
Niid( , ) c o , donde 1 12 i , , = , y o igual
a 1, .
La comparacin entre la tendencia original y las estimadas se presenta en la
Tabla 2, y el valor presentado es un ratio entre el valor que se obtendra con el
procedimiento que proponemos y la obtenida mediante X12. En cada situacin se
ha calculado el promedio de la medida para las 500 simulaciones realizadas en
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
143
cada caso. El cociente de ambos es el valor que se recoge en la tabla, de modo
que los valores menores que la unidad indican que el resultado obtenido con el
procedimiento bayesiano propuesto es mejor (menor valor del ndice correspon-
diente) que el obtenido mediante X12. Por ejemplo, para 25
max
S
R , = y o =, MAPE
vale 0,81, lo que indica que el valor de MAPE en el procedimiento bayesiano es un
81% del obtenido para X12. En el margen derecho e inferior de cada subtabla se
presentan los ratios de los valores medios de las medidas para los distintos escena-
rios de simulacin.
Puede verse que nuestro procedimiento replica mejor la tendencia de la serie,
valorado con cualquiera de las medidas. Adems, ntese que el procedimiento no
es muy sensible al tamao de la estacionalidad. As, los resultados no son muy
diferentes para los distintos valores de
max
S
R . Por el contrario, la comparacin es
muy sensible al tamao del ruido, mostrando una mayor similaridad de ambos
procedimientos segn disminuye el tamao de la estacionalidad. Los resultados
completos (que no se presentan) muestran adicionalmente que los indicadores
mejoran para ambos procedimientos segn disminuye la varianza del ruido.
ESTADSTICA ESPAOLA
144
Tabla 2
MEDIDAS DE DISCREPANCIA ENTRE TENDENCIA ORIGINAL Y ESTIMADA
MAPE =1 =1/2 =1/4 Media MAD =1 =1/2 =1/4 Media
05
max
S
R , =
0,82 0,81 0,89 0,83 05
max
S
R , = 0,80 0,79 0,89 0,81
1
max
S
R =
0,80 0,81 0,91 0,82 1
max
S
R =
0,79 0,81 0,93 0,81
15
max
S
R , =
0,80 0,82 0,89 0,82 15
max
S
R , = 0,78 0,81 0,92 0,81
2
max
S
R =
0,81 0,82 0,88 0,82 2
max
S
R =
0,81 0,84 0,88 0,83
25
max
S
R , =
0,79 0,81 0,88 0,81 25
max
S
R , = 0,79 0,83 0,87 0,81
3
max
S
R = 0,80 0,82 0,88 0,82 3
max
S
R = 0,78 0,82 0,87 0,81
35
max
S
R , =
0,80 0,80 0,89 0,81 35
max
S
R , = 0,79 0,81 0,88 0,81
4
max
S
R =
0,80 0,81 0,90 0,82 4
max
S
R =
0,80 0,80 0,88 0,81
45
max
S
R , =
0,80 0,82 0,89 0,82 45
max
S
R , = 0,79 0,82 0,89 0,82
5
max
S
R =
0,81 0,82 0,90 0,82 5
max
S
R =
0,80 0,81 0,90 0,82
media 0,80 0,81 0,89 media 0,79 0,81 0,89
RMSPE =1 =1/2 =1/4 Media RMSE =1 =1/2 =1/4 Media
05
max
S
R , =
0,80 0,79 0,90 0,81 05
max
S
R , = 0,73 0,51 0,41 0,58
1
max
S
R =
0,77 0,80 0,95 0,80 1
max
S
R =
0,72 0,52 0,43 0,59
15
max
S
R , =
0,78 0,83 0,94 0,81 15
max
S
R , = 0,71 0,53 0,41 0,59
2
max
S
R =
0,80 0,83 0,88 0,82 2
max
S
R =
0,73 0,53 0,40 0,59
25
max
S
R , =
0,78 0,81 0,90 0,80 25
max
S
R , = 0,71 0,53 0,41 0,58
3
max
S
R = 0,77 0,83 0,89 0,81 3
max
S
R = 0,70 0,53 0,40 0,58
35
max
S
R , =
0,77 0,79 0,92 0,80 35
max
S
R , = 0,69 0,52 0,41 0,57
4
max
S
R =
0,78 0,80 0,90 0,80 4
max
S
R =
0,71 0,51 0,40 0,58
45
max
S
R , =
0,77 0,81 0,91 0,80 45
max
S
R , = 0,70 0,52 0,42 0,58
5
max
S
R =
0,78 0,79 0,92 0,81 5
max
S
R =
0,71 0,51 0,42 0,58
media 0,78 0,81 0,91 media 0,71 0,52 0,41
Otros estadsticos revisados son los correspondientes a las primeras o segun-
das diferencias de la tendencia. El primero, B1, mide la regularidad de la tendencia,
mientras que B2 mide el grado de linealidad. Al principio de este apartado se
definieron estos indicadores en trminos absolutos y relativos, si bien en la simula-
cin actual pueden utilizarse los absolutos por ser las series del mismo orden de
magnitud. Puede observarse en la Tabla 3 que nuestro procedimiento proporciona
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
145
tendencias ms regulares y ms lineales que X12 (este ltimo hecho es especial-
mente importante ya que la tendencia verdadera es lineal). Su evolucin en los
distintos escenarios es similar a la descrita para el resto de las medidas. As, con
los datos originales (que no se presentan) la regularidad y linealidad de la tenden-
cia estimada es poco sensible al tamao de la estacionalidad para ambos procedi-
mientos, mientras que s lo es a la dispersin del ruido, mejorando ambos mtodos
cuando el ruido pierde parte de su varianza. S muestra esta Tabla que nuestro
procedimiento mejora su habilidad frente a X12 para escenarios de mayor varianza
del ruido.
Tabla 3
PRIMERAS Y SEGUNDAS DIFERENCIAS
B1 =1 =1/2 =1/4 Media B2 =1 =1/2 =1/4 Media
05
max
S
R , =
0,86 0,92 0,93 0,90 05
max
S
R , =
0,96 0,93 0,98 0,95
1
max
S
R =
0,83 0,91 0,92 0,89 1
max
S
R =
0,92 0,93 0,97 0,93
15
max
S
R , =
0,84 0,92 0,93 0,89 15
max
S
R , =
0,94 0,93 0,98 0,95
2
max
S
R =
0,84 0,92 0,92 0,89 2
max
S
R =
0,92 0,94 0,98 0,94
25
max
S
R , =
0,84 0,91 0,93 0,89 25
max
S
R , =
0,94 0,90 0,98 0,94
3
max
S
R = 0,84 0,91 0,92 0,89 3
max
S
R = 0,92 0,95 0,98 0,94
35
max
S
R , =
0,85 0,91 0,93 0,89 35
max
S
R , =
0,94 0,92 0,97 0,94
4
max
S
R =
0,84 0,91 0,93 0,89 4
max
S
R =
0,93 0,92 1,002 0,94
45
max
S
R , =
0,85 0,92 0,93 0,89 45
max
S
R , =
0,94 0,93 0,93 0,94
5
max
S
R =
0,84 0,92 0,93 0,89 5
max
S
R =
0,93 0,94 0,99 0,94
media 0,84 0,91 0,93 media 0,93 0,93 0,98
ESTADSTICA ESPAOLA
146
CONCLUSIONES
Hemos desarrollado en este trabajo un procedimiento bayesiano jerrquico para
descomponer una serie cronolgica corta (con pocas observaciones) en una ten-
dencia o ciclo-tendencia regular y una estacionalidad fija, para un esquema aditivo.
En los apartados 2 y 3 se desarrollan los aspectos distribucionales del problema
As, las distribuciones empleadas en la cadena jerrquica son gausianas, salvo
para el parmetro de precisin, al que se asigna una distribucin gamma. Ello
garantiza que nos movemos en un marco de distribuciones conjugadas. La verosi-
militud se construye a partir de un ruido gausiano para la componente irregular de
la serie. Puede utilizarse un ruido blanco a priori, aunque es posible introducir otros
esquemas, modificando de forma conveniente la matriz de varianzas y covarianzas.
El procedimiento proporciona explcitamente las soluciones de Bayes que cons-
tituyen las estimaciones de la tendencia de la serie y de su componente estacional.
Se obtienen tambin medidas de precisin de las estimaciones. El hecho de que
las soluciones sean explcitas facilita su uso en procedimientos automticos de
extraccin de seal a grupos numerosos de series.
En el apartado 4 se obtienen las distribuciones marginales a priori para los par-
metros implicados. Estas distribuciones son el vehculo adecuado para introducir
informacin extramuestral a priori en el procedimiento de estimacin, especialmente
cuando se disponga de una serie vicaria (proxy) de la que se trata de descomponer.
El apartado 5 presenta ilustraciones y validaciones del procedimiento. En primer
lugar, hemos descompuesto la serie de Matriculaciones de turismos en el mbito
nacional. Si bien por limitaciones de espacio no se presentan las series resultantes
de la descomposicin, se muestra la calidad del procedimiento comparada con el
X12-Arima, con Tramo-Seats y con el Alisado exponencial (Holt-Winters). El balan-
ce general es que el procedimiento bayesiano y X12 funcionan de manera muy
parecida para esta serie, incluso para series cortas; proporciona mejores resultados
que el alisado exponencial, siendo TS el que peores resultados produce, si bien no
se han modificado las opciones por defecto en este ltimo. La ventaja que propor-
ciona la longitud de la serie es que permite observar el comportamiento estable de
nuestro procedimiento cuando la longitud se acorta.
La segunda ilustracin es una evaluacin del procedimiento realizada mediante
simulaciones de una serie corta (trimestral con 12 observaciones) compuesta de
una tendencia constante y con distintas amplitudes para la estacionalidad y para la
dispersin del ruido. Los resultados permiten avalar la calidad de nuestro procedi-
miento, en cuanto a que es capaz de estimar tendencias regulares y a reconocer
las estacionalidades de la serie.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
147
Uno de los propsitos de los autores fue la combinacin de la descomposicin
con la prediccin coyuntural de series cortas, en especial para pequeas reas. En
estos casos, la serie no contiene suficiente informacin relevante, y los mtodos
habituales de prediccin prolongan hacia el futuro pautas errticas. La escasa
informacin de las series cortas dificulta integrar en un nico procedimiento des-
composicin y prediccin, por lo que nuestra propuesta en ese terreno es, por el
momento, secuencial. En primer lugar se procedera a la descomposicin ptima de
la serie mediante el trabajo aqu descrito, para posteriormente realizar la prediccin
coyuntural de la tendencia mediante un mtodo elaborado por Mendoza y de Alba
(vase Mendoza y Alba, 2006) mejorado por los autores (Rojo y Sanz, 2008) para
incorporar informacin extramuestral a priori.
Los resultados permiten, en definitiva, abordar la extraccin de la seal y la pre-
diccin de series cortas, series que se presentan frecuentemente en el mbito de
las estadsticas econmicas y sociales, en particular cuando se producen cambios
metodolgicos. Al tratarse de un procedimiento bayesiano, resulta especialmente
de inters en mbitos correspondientes a pequeas reas, como son las desagre-
gaciones espaciales a nivel de NUTS3 o en ramas y subramas de actividad. Las
frecuentes apariciones de volatilidades en las series pueden ser combatidas me-
diante la imposicin de condiciones de regularidad en los resultados.
Los autores se proponen en un futuro prximo mejorar el modelo propuesto ana-
lizando modelos ms complejos de comportamiento para los errores en el modelo
de descomposicin. Uno de ellos sera el denominado de lneas areas(12), fre-
cuente en la modelizacin de los errores en series temporales. Sealemos, no
obstante, que la escasa longitud de las series cortas hace a veces poco realista la
asignacin de modelos complejos, en los que intervienen un nmero importante de
periodos. Es por ello por lo que debemos ser cautelosos en el planteamiento y
motivacin de estos trabajos.
(12) Un modelo
12
011 011 ARIMA( , , ) ( , , )
ESTADSTICA ESPAOLA
148
ANEXO. OBTENCIN DE LAS DISTRIBUCIONES MARGINALES A POSTERIORI
En este Anexo se construyen de forma detallada las distribuciones a posteriori
de la tendencia y la estacionalidad.
Multiplicando la expresin de la priori conjunta, [7], una vez incorporada la res-
triccin [2], es decir, en el modelo restringido, por la expresin de la funcin de
verosimilitud, [9], se obtiene la distribucin conjunta a posteriori,
( )
( )
( ) ( )
1
2
2 2
2
p
b N r
a '
T p
S ,T, D e exp T'D D T T T 'P T T
+ + +
t
t
t t t + +
( )
( )
( )
( )
( )
( )
( )
1 1
p p
S S S S S S S p p
S ' W S S'P P WW W' P S
+ + + [A-1]
( )
( )
( )
( )
} W W p p
y T E S ' y T E S
c
(
+ P
(
Integrando en
( ) p
S se obtiene la distribucin conjunta a posteriori de T y t
( ) ( )
1
1
2 2
2 2
2
p p
b N r
a
T, D e exp T'D' D T T T
+ + +
t
t
t t t t + +
( )
( ) ( )
( ) ( )
1 1
p p
S S S S S S S
S'P P W W W P S ' W y T 'P y T
c
+ + + + [A-2]
( )
( ) }
1
(p) (p)
'
S S W W W S S
' W y T ' P E P E P (y T) W
c c c
(
+ +
donde
W S W W
W E' E
c c
P = + P .
Integrando en T la distribucin a posteriori conjunta [A-2], obtenemos la margi-
nal a posteriori de t ,
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
149
( ) ( )
1
1
1 1
2 2 2
2
2
N r p p
b N r
S S S S
D exp a S'P P W W W' P S
+
+ + +
t
t t t + +
( ) ( ) ( ) ( )
1
P P p p
'
S S S S S W S S T T T T
' W ' W P W P T'P T
c c
+ + + [A-3]
}
1
2
(p) W
W S S W
y'P P P y ' W P E' P y
c
c c c c c
(
+
donde denotamos por
1 1
W W W W
E E'
c c c c
P = P P , por
2 2 T T W
D' D
c c c c c
P = + P +P P P , y por
1 1
W (p)
T T T W W S S
T y E W
c
c c c c c c
(
= P P + P P P P P
. Finalmente, llamando
W
y E' y
c
= P , la
marginal a posteriori de t , que figura en la expresin [A-3], queda reducida a
( )
( )
1
2
2 2 2
N r
b a
D e
t
t t t
+
+ - -
[A-4]
donde hemos denotado por
( ) ( )
1
2 2
T S T T T S W S
a a T' T S' S y' y ' y W' S ' y W' S
c c c
= + P + P + P P + P P + P
[A-5]
Se trata de una
1
2 2
N r
a, b
+ | |
+ +
|
\ .
c c c
t + + P +
(
P P P + + +
( (
+ +
[A-6]
Llamando
1
1 1 1
2 2 2
(p)
(p) (p) (p) (p)
T T T T W S S W W
S S S S S S S S S W S S
a a ' T' T y' y ' W E' y
S' WW W' S ' W ' W W
c c c c c c c
c
= P + P + P P P P P +
(
+ P P P + P
[A-7]
ESTADSTICA ESPAOLA
150
podemos escribir la marginal a posteriori de T , [A-6], como
( )
( ) ( )
{ }
1 2
2
(b N r / )
T T T
T D a T 'P T
+ + +
c
t + [A-8]
Se trata de una Student multivariante(13) de dimensin N r + con 2 1 b N r + + +
grados de libertad, matriz de posicin
T
y matriz de varianzas-covarianzas
1
2
2 1
T
a
b N r
c
P
+ +
.
Finalmente, obtengamos la marginal a posteriori de
(p)
S a partir de [A-1]. Inte-
grando primero en T y despus en t y escribiendo
2 2
'
TD T
P D D P P ,
c
= + +
( )
1
(p)
S S W TD W
P W E' P P P P E
c c c
= + ,
( )
1 1 1
(p) (p)
S S S W TD T W TD S
P W E' P P P T E' P P P P y
c c c c
(
= +
y [A-9]
( ) ( ) ( )
( ) ( )
1
2 2
p p p
'
S S S S T T TD T
a a P S'P S T'P T y'P y P T P y 'P P T P y
-
c c c
= + + + + +
obtenemos la marginal a posteriori de
(p)
S ,
( )
( ) ( ) { }
2 2
2
(p) (p) (p)
N r p
b
(p) (p) S (p) S S
S D a S ' S
+ | |
+ +
|
-
\ .
t + P
[A-10]
que es una multivariante de Student con 2 1 b N r + + grados de libertad, matriz de
posicin
(p)
S
P
+ +
.
La obtencin de las distribuciones marginales de T y
(p)
S , [A-8] y [A-10] pro-
porciona el estimador de Bayes ptimo que, como es conocido, es la esperanza
(13) Vase la Nota 6 para la definicin empleada para esta distribucin.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
151
(parmetro de posicin) de la distribucin marginal a posteriori correspondiente si
suponemos una funcin de prdida cuadrtica.
REFERENCIAS
AKAIKE, H. (1980). Seasonal adjustment by a Bayesian modelling. Journal of Time
Series Analysis, Vol. 1, No. 1, pp. 1-13.
BROEMELING, L.D. (1985). Bayesian Analysis of Linear Models. Marcel Dekker,
Inc. New York.
CHOLETTE, P.A. (1979). Spectral Diagnosis and Marginal Improvements of the X-11
Seasonal Adjustment Method for Short Series. Technical Report of the Sea-
sonal Adjustment and Time Series Staff, Ottawa, Canada: Statistics Canada.
DAGUM, E. B. (1979). On the Seasonal Adjustment of economic Time Series Ag-
gregates: A Case Study of the Unemployment Rate, in Counting the Labor
Force, National Common Employment and Unemployment Statistics, Appendix,
2, 317-344, Washington.
DHRYMES, PH.J . (1984). Econometra. Ed. AC, Madrid.
FINDLEY, D.F. Y MARTIN, D.E.K. (2003). Frequency Domain Analyses of SEATS and
X-11/12-ARIMA Seasonal Adjustment Filters for Short and Moderate-Length
Time Series. Research Report Series, Statistics, 2003-02, Washington D.C.:
U.S. Bureau of the Census, pp. 1-32.
GMEZ, V. Y MARAVALL, A. (1997). Programs Tramo and Seats. Instructions for the
User, gua incluida en el programa, Madrid.
GMEZ, V. Y MARAVALL, A. (1998). Guide for Using the Programs Tramo and
Seats. Documento de trabajo 9805, Servicio de Estudios del Banco de Espa-
a, Madrid.
HOOD, C.C., ASHLEY, J .D. Y FINDLEY, D.F. (2000). An empirical Evaluation of
Tramo/Seats on Simulated Series. Proceedings of the Business and Economic
Statistics Section, American Statistical Association.
LADIRAY, D. Y MAZZI, G.L. (2003). Seasonal Adjustement of European Aggregates:
Direct versus Indirect Approach in M. Manna y R. Peronaci (eds.) Seasonal
Adjustment, Frankfurt am Maim, germany: European Central Bank, pp. 37-65.
MARTN-GUZMN, M. P. Y MARTN PLIEGO, F. J . (1989). Curso bsico de estadstica
econmica. AC: Madrid.
ESTADSTICA ESPAOLA
152
MATAS MIR, A. Y RONDONOTTI, V. (2003). The Performance of X-12 in the Seasonal
Adjustment of Short Time Series in M. Manna y R. Peronaci (eds.) Seasonal Ad-
justment, Frankfurt am Maim, Germany: European Central Bank, pp. 149-159.
MAZZI, G.L. Y SAVIO, G. (2005). The Seasonal Adjustment of Short Time Series en
Working Papers and Studies, European Commision.
MENDOZA, M. Y DE ALBA, E. (2006). Forecasting an accumulated series based on
partial accumulation II: A new Bayesian method for short series with stable sea-
sonal patterns. International Journal of Forecasting, vol. 22, pp. 781-798.
ROJ O, J .L. Y SANZ, J .A. (2002). Estimaciones para pequeas reas: un enfoque
bayesiano a un problema de distribucin. Estudios de Economa Aplicada. 20-
I, pp. 217-240.
ROJ O, J .L. Y SANZ, J .A. (2005). A Bayesian benchmarking method with applications
to the Quarterly National Accounts. Working Papers and Studies. ISSN: 1725-
4825, ISBN: 92-79-01310-6, Office for Official Publications of the European
Communities, 2005. Luxembourg.
ROJ O, J .L. Y SANZ, J .A. (2008). Prediccin de series cortas con estacionalidad esta-
ble usando distribuciones a priori informativas. Anales de Economa Aplicada,
N XXII (Tricls y Moslares, editores), ISBN: 978-84-92453-25-2, pp. 265-276.
SPIEGELHALTER, D., THOMAS, A. Y BEST, N. (1999): WinBUGS, V. 1.2: User Manual
MRC Biostatistics Unit, Cambridge, U.K.
U.S. CENSUS BUREAU (2002). X-12-ARIMA Reference Manual, Final Version 0.2
Washington DC, USA: US Census Bureau.
WINTERS, P.R. (1960). Forecasting sales by exponentially weighted moving aver-
ages. Management Science, 6, 324-342
YOUNG, M.R. (1996). Robust Seasonal Adjustment by Bayesian Modelling. Jour-
nal of Forecasting, 15, pp. 355-367.
ZELLNER, A. (1971). An Introduction to Bayesian Inference in Econometrics. J .
Wiley & Sons, Inc. New York.
DESCOMPOSICIN DE SERIES DE TIEMPO CORTAS: UN ENFOQUE BAYESIANO
153
DECOMPOSITION FOR SHORT TIME SERIES: A BAYESIAN AP-
PROACH
ABSTRACT
The decomposition of Time Series is an essential task for the spe-
cialists in Conjunctural Analysis. The most commonly used devices
are Tramo-Seats and X12-RegArima. Both devices have been rec-
ommended by Eurostat. Nowadays the Statistics literature has stated
the deterioration of the quality of the decomposition for short time se-
ries.
The authors have carried out a Hierarchical Bayes model for the
trend-cycle extraction and for the seasonal component estimation in
time series. Its usefulness is greatest for short ones, not showing any
sign of deterioration, much unlike the classic methods.
The paper ends with two examples. Firstly, we present an illustra-
tion and, finally, we show a validation of the approach by using simula-
tion for several scenarios. The conclusions confirm the interest of the
procedure in decomposing a short time series
Key Words: Bayesian models, Short Time Series, Times Series Analy-
sis, Seasonal Adjustment
AMS Classificacin: 62C10 (Bayesian problems), 62F15 (Bayesian in-
ference), 37M10 (Times Series Analysis)