Professional Documents
Culture Documents
M. Q. I . M. Q. I .
UMA BREVE DESCRIO DE ALGUMAS TCNICAS PARA ANLISE DE SRIES
TEMPORAIS: SRIES DE FOURIER, WAVELETS, ARIMA, MODELOS
ESTRUTURAIS PARA SRIES DE TEMPO E REDES NEURAIS.
Mauri Aparecido de Oliveira
1
Luiz Paulo Lopes Favero
2
1
Mestrando em administrao de empresas pela Faculdade de Economia, Administrao e Contabilidade da
Universidade de So Paulo FEA/USP. rea: Mtodos Quantitativos e Informtica. Engenheiro Mecnico (nfase em
Mecatrnica) pela Escola de Engenharia de So Carlos EESC/USP. E-mail: mauriao@usp.br.
2
Mestrando em administrao de empresas pela Faculdade de Economia, Administrao e Contabilidade da
Universidade de So Paulo FEA/USP. rea: Poltica de Negcios e Economia de Empresas. E-mail:
lpfavero@usp.br
UMA BREVE DESCRIO DE ALGUMAS TCNICAS PARA ANLISE DE SRIES
TEMPORAIS: SRIES DE FOURIER, WAVELETS, ARIMA, MODELOS
ESTRUTURAIS PARA SRIES DE TEMPO E REDES NEURAIS
3
.
Resumo
Neste trabalho estamos interessados em fazer uma descrio das tcnicas mais empregadas para
anlise de sries temporais. Sero mostradas diferentes abordagens e suas particularidades no
tratamento das sries temporais. A idia no colocar as tcnicas como competidoras entre si
mas sim que podem ser muitas vezes usadas conjuntamente ou alternativamente para as anlises
de sries temporais. As descries no sero apresentadas com todo o rigor que normalmente
exigido em textos mais tcnicos, ou seja vrias consideraes probabilsticas, matemticas e
estatsticas podem ser consideradas faltantes para um leitor mais especializado no assunto. Nossa
pretenso apresentar de forma breve e sucinta as tcnicas que so utilizados para modelamento
e anlise das sries temporais e a importncia que desempenham na criao de estruturas
matemticas para representar o passado e prever o comportamento do futuro.
1. Introduo
Uma srie temporal pode ser definida como um conjunto de observaes de uma varivel
dispostas seqencialmente no tempo. A srie temporal pode ser classificada como determinstica
ou estocstica, quando os valores da srie podem ser escritos atravs de uma funo matemtica
y = f(tempo) diz-se que a srie estacionria, quando a srie envolve alm de uma funo
matemtica do tempo tambm um termo aleatrio y = f(tempo,
) chamamos a srie de
estocstica. Normalmente as sries temporais so analisadas a partir de seus principais
movimentos descritos como: tendncia, ciclo, sazonalidade e variaes aleatrias. Neste trabalho
vamos usar os termos sries temporais e sries de tempo como tendo o mesmo significado.
2. Anlise de Fourier Clssica
A anlise de Fourier uma das formas mais tradicionais para tratamento de sinais e sries
temporais. Esta tcnica foi criada por Jean Baptiste Joseph Fourier e publicada em 1822 no seu
trabalho intitulado Thorie Analitique de la Chaleur. Fourier dedicou-se na resoluo das
equaes diferenciais que regem a transferncia de calor utilizando uma tcnica de sries de
senos e cossenos (Srie de Fourier) para resolver seus problemas. Vamos restringir aqui nossas
explicaes para funes determinsticas peridicas. Uma funo, ou srie, dita peridica
quando f(t + p) = f(t), sendo p o perodo. A Figura-2.1 mostra sries que podem ser obtidas a
partir da combinao de senos e cossenos.
-7.0 -3.5 0.0 3.5 7.0
X
-4
-2
0
2
4
Y
f(t) = sen(2t) cos(3t)
-10 -5 0 5 10
X
-10
-5
0
5
10
Y f(t) = 2 + sin(2t) + 4cos(3t) + sin(t) - 2cos(2t)
Figura-2.1 Sries formadas por funes de senos e cossenos
3
Agradecemos a colaborao do Prof. Dr. Jos O. Siqueira por todas as contribuies durante nossos estudos e em
particular no desenvolvimento deste trabalho.
Podemos adotar este procedimento para escrever uma srie f(t) genrica em termos de senos e
cossenos da seguinte forma:
1 2 3 1 2 3
( ) cos1 cos 2 cos3 ... sen1 sen 2 sen3 ... f t A a t a t a t b t b t b t + + + + + + + + +
(2.1)
ou ainda como:
1
( ) cos sen
k k
k
f t A a kt b kt
+ +
,
1
( ) cos
k
a f t ktdt
e
1
( ) sen
k
b f t ktdt
.
Para que a srie no domnio do tempo seja convertida para o domnio da freqncia
utilizada a transformada de Fourier (TF) dada por ( ) ( )
*
* 2
X
i f t
f f t e dt
, f
representa
a freqncia e
1 i
. Mudar para o domnio da freqncia importante porque na maioria
das vezes, a informao que no pode ser lida no domnio do tempo pode ser obtida no
domnio da freqncia.
Por exemplo, seja a srie x(t)=cos(2
10t)+ cos(2
25t) +cos(2
50t)+ cos(2
100t)
representada na Figura-2.2a
4
a sua transformada de Fourier (TF) mostrando as freqncias
que a compem so representadas na Figura-2.2b. A Figura-2.2b tambm pode ser chamada
de espectro de freqncia da srie x(t).
(a) (b)
Figura-2.2 Srie temporal mostrada em (a) e a sua transformada de Fourier em (b)
Para podermos prosseguir at o nosso prximo tpico chamado de transformadas de ondaletas ou
waveletes (TW) e entendermos melhor a sua necessidade vamos olhar mais atentamente para a
transformada de Fourier. A TF (bem como TW) uma transformada reversvel, ou seja, ela
permite ir para trs e para frente num processamento inicial (transformaes) dos sinais. Porm,
4
As Figuras 2.2a
e 2.2b foram construdas utilizando-se o software Matlab v6.5, as linhas de comando so:
t = 0:0.001:0.6;
x = cos(2*pi*10*t)+cos(2*pi*25*t)+cos(2*pi*50*t)+cos(2*pi*100*t);
plot(x)
ylabel(' Funo x(t)')
xlabel('Tempo')
Y = fft(x,512);
Pyy = Y.* conj(Y) / 512;
f = 1000*(0:256)/512;
plot(f,Pyy(1:257))
apenas uma dessas alternativas disponvel para qualquer srie. Ou seja, no h informao de
freqncia disponvel no domnio do tempo da srie ou sinal, com isso no h informao de
tempo disponvel na transformada de Fourier do sinal. A questo natural que surge: o que
necessrio para ter ambos, a informao de tempo e de freqncia ao mesmo tempo? A resposta
para esta questo, depende em particular da aplicao e da natureza do sinal ou srie que temos.
Lembremos que a TF da a informao da freqncia do sinal, a qual significa que temos o quanto
de cada freqncia existe no sinal Figura-2.2b, mas isso no nos diz quando no tempo estas
componentes freqnciais existem. Esta informao no necessria quando o sinal
estacionrio. O conceito de estacionariedade importante, vamos analisado mais detidamente.
Sinais cujo contedo de freqncia no mudam no tempo so chamados de estacionrios.
Um processo X(t) estacionrio se ele se desenvolve no tempo, de modo que a escolha de uma
origem dos tempos no seja importante, as caractersticas probabilsticas de X(t +
), para todo
T , so as mesmas de X(t) [Morettin/1999]. Em outras palavras, o contedo de freqncias
dos sinais estacionrios no mudam no tempo. Neste caso, ns no precisamos saber em quais
tempos os componentes freqnciais existem, desde que nesse caso o que acontece que todos os
componentes freqnciais existem o tempo todo.
No caso de sries no-estacionrias a concluso que a transformada de Fourier pode ser usada
em sinais no estacionrios, apenas se estivermos interessados em qual o espectro de
componentes existe no sinal, mas no interessa quando estes ocorrem. Porm, se esta informao
necessria, isto , se ns queremos saber, qual o componente espectral que ocorre em qual
tempo (intervalo), ento a transformada de Fourier no a transformada correta para ser
utilizada.
3. Anlise de Ondaletas (Wavelets)
A transformada de ondaleta ou wavelet (TW) capaz de fornecer a informao de tempo e de
freqncia simultaneamente, conseqentemente dando a representao de freqncia-tempo da
srie. Nesse ponto vale lembrar o princpio da incerteza de Heisenberg. Ns no podemos
exatamente saber qual freqncia existe em um dado instante de tempo, mas apenas podemos
saber quais bandas de freqncia existem em determinados intervalos de tempo.
A freqncia e a informao do tempo de uma srie em certo ponto no plano freqncia-tempo
no podem ser conhecidos. Em outras palavras: ns no podemos saber qual o componente
espectral existe em qualquer dado instante de tempo. Este um problema para se resolver, e esta
a principal razo pela qual pesquisadores tem mudado das transformadas de Fourier para a TW.
A anlise de ondaletas tem sido utilizada em vrios ramos da cincia, em economia sua principal
aplicao encontra-se na econometria no tratamento de sries temporais utilizadas para realizar
previso [Torrence/1998] [Morettin/1999].
A transforma de wavelet contnua TWC uma ferramenta excelente para mapear as mudanas de
propriedades em sries no estacionrias. Sua expresso dada por:
( ) ( )
1
,
f
t
TWC s f t dt
s
s
, , 0 s s
(3.1)
Onde ( ) f t
a srie que estamos utilizando, os parmetros
e s so chamados de translao e
escala, respectivamente. Psi(t) uma funo chamada de ondaleta me, sendo
( )
1/ 2
, s
t
t s
s
,
, , 0 s s
(3.2)
usualmente so tomados valores especiais para
e s: 2
j
s
, 2
j
k
,
, j k
.
A ondaleta-me funciona como uma janela de abertura finita percorrendo a funo f(t) - suporte
compacto. A translao
at
p
at
q
considerada um
processo rudo branco se para cada perodo de tempo t tivermos: (i) [ ] [ ]
1
0
t t
E E
L
,
mdia zero; (ii)
2 2 2
1 t t
E E
1 1
] ]
L
, varincia constante; (iii) [ ]
.
t t s
E
. 0
t j t j s
E
1
]
L
, covarincia nula para todo valor de s.
A equao (4.1) representa um modelo denominado como autoregressivo integrado de mdia
mvel, ou simplesmente ARIMA. Podemos escrever a equao (1) tambm com o seguinte
formato:
0
1 0
p q
t i t i i t i
i i
y y
+ +
, sendo
0
1
. Chamamos de modelo autoregressivo
quando podemos escrever uma srie temporal na forma
0
1
p
t i t i t
i
y y
+ +
, ou seja a srie
t
y
escrita a partir dos seus valores passados. Escrevendo a srie em termos dos seus choques
aleatrios temos o modelo de mdia mvel, ou seja
0
q
t i t i
i
y
, onde
0
1
.
Agora considere a srie,
0 1 1 t t t
y y
+ +
quando
0
0
e
1
1
esse modelo conhecido
como passeio aleatrio ou random walk, uma das caractersticas desse modelo violar a
condio de estacionariedade.
Um modelo estacionrio se para todo t e t-s tivermos: (i) [ ] [ ]
t t s
E y E y
, mdia constante;
(ii) ( ) ( )
2 2
2
t t s y
E y E y
1 1
] ]
, varincia constante; (iii) ( ) ( )
t t s
E y y
1
]
( ) ( )
t s t j s s
E y y
1
]
, covarincia constante.
Muitas vezes para tornar uma srie estacionria precisamos utilizar um recurso chamado
diferenciao usando o operador , sendo que
( )
1
d
d j
j
L e
j
t t j
L y y
. Quando
t
y
uma
srie temporal I(d) e depois de diferenciar d vezes ela pode ser modelada usando um modelo
AR(p), este modelo para
t
y
pode ser escrito como [Franses/1998]:
1 1 1 1 1
d d d
t t p t p t
y y y
K
, t=p+d, p+d+1, ..., n (4.2)
O modelo representado por (4.2) normalmente abreviado por ARI(p,d), ou seja autoregressivo
de ordem p e integrado de ordem d. Quando uma srie temporal apresenta uma tendncia
provavelmente ela poder ser representada por um modelo integrado ARI, ARIMA ou IMA.
importante destacar que os modelos ARIMA no apresentam especificidade grfica, somente
plotando a srie temporal no possvel identificar qual o modelo que a representa.
Para que possamos determinar qual o modelo da famlia ARIMA que melhor representa a srie e
que poder ser utilizado para fazer as previses, podemos seguir as seguintes etapas [Yim/2001]:
Identificao do
Modelo
Estimao
Verificao ou
diagnstico
Previso
Na etapa de identificao queremos saber:
t
y
AR
MA
ARMA
ARIMA
M
Qual a ordem do modelo, ou seja quais
os valores de
p
q
p,q
p,d,q
Na identificao dos modelos so utilizados dois recursos : as funes de auto-correlao (FAC)
e as funes de auto-correlao parciais (FACP). A funo de auto-correlao (FAC) de uma
srie
t
y
definida por [ ] [ ]
0
ov , / /
k t t k t k
C y y Var y
, onde
k
a auto-covarincia de k-
sima ordem de
t
y
, ou seja
( ) ( )
k t t k
E y y
1
]
, k = ..., -2,-1,0,1,2,... (4.3)
Dada a equao (4.3) podemos verificar que
0
1
,
k k
e que
1 1
k
< <
. A FAC til
para caracterizar modelos ARMA, um exemplo simples a srie rudo branco
t
para a qual
[ ]
0
t
E
e
0
k
para todo 0 k . Para o modelo AR(1) dado por ( )
1 1 t t t
y y
+
,
t=2,3,...,n podemos escrever que [ ] [ ] [ ] ( ) [ ]
1 1 1 1 1
1
t t t t
E y E y E E y
+ + +
. Para
que o processo AR(1) seja convergente necessitamos
1
1 <
, sendo assim a esperana de
t
y
pode ser escrita como [ ] ( ) ( )
1
1 1
1 1
t
E y L
1
1
]
]
o que resulta em
( )
1 1 1
k
k k
. Como
1
1 <
a FAC exponencialmente declinante.
Para calcular a FACP podemos utilizar o sistema de equaes de Yule-Walker:
Para a FACP de primeira ordem temos que
11 1
e para a FACP de segunda
( )
( )
2
2 1
22
2
1
1
1 1 2 1 1
2 1 1 2 2
1 1 2 2 3 3
k k
k k
k k k k k
+ + +
+ + +
+ + +
K
K
M
K
A partir da terceira ordem podemos utilizar a recurso:
1
1 1
1, 1,
1 1
. 1
k k
kk k k j k j k j k
j j
_ _
, ,
, sendo k=3,4,5,...
Para um modelo AR(1) determinamos
11
s
do modelo MA e a varincia do erro
2
: :
e a
funo que ser otimizada ( ) ( )
1
1
2 2
1
; ; ; 2 . .exp `
2
T
L w w w
_
,
. Depois da etapa de
estimao necessrio realizar a verificao ou diagnstico que compreende: a verificao dos
parmetros estimados, anlise dos resduos e anlise dos critrios de informao. Os critrios de
informao mais utilizados so o Akaike information criterion (AIC) e o Schwartz Bayesian
0
0
0 <
k
kk
0 <
3
6
9
1
0
3
0 >
k
6 9
0
kk
0 >
1
criterion (SBC), calculados como: AIC = ( )
2
2
ln p q
T
+ + e SBC = ( )
2
ln
ln
T
p q
T
+ + , onde
T o nmero de observaes usadas. O SBC tambm conhecido como Bayesian information
criterion (BIC). Idealmente, o AIC e o SBC devero ser os menores possveis podendo assumir
valores negativos, sendo que ambos medem o quanto o modelo estimado se ajusta aos dados.
Na etapa final, a de previso, dada uma srie { }
1 2
, ,...,
t
y y y
queremos prever os valores
1 t
y
+
,
2 t
y
+
at
t s
y
+
. O interesse agora est concentrado em encontrar o previsor timo
t s
y
+
, ou seja aquele
que minimiza o erro quadrtico mdio da previso: ( ) ( )
2
2
min
T s T T
E y y s E e s
+
1 1
] ]
.
Quando fazemos previso temos o problema da perda de informaes a medida que avanamos
em tentar prever os valores mais adiante no tempo. Isto pode ser visto claramente usando-se, por
exemplo um modelo ARMA(2,3) dado por
1 1 2 2 1 1 2 2 3 3 T T T T T T T
w w w
+ +
.
Atualizando um perodo ficamos com
1 1 2 1 1 1 2 1 3 2 T T T T T T T
w w w
+ +
+ +
para
obtermos o previsor de
T
w
um passo a frente, denotado por
1
T
w precisamos tomar a esperana
condicionada at o instante T da srie atualizada, o que resulta em
1
1 2 1 1 2 1 3 2
0
T T T T T T
w w w
+ + sendo que o valor zero nessa expresso representa
uma perda de informao, devido ao conjunto de informaes estar condicionado at o instante T
(ou seja: [ ]
1
0
T T
E
+
).
Continuando desta maneira, na determinao do valor da srie para dois passos frente teremos a
seguinte expresso
2 1 1 2 2 1 1 2 3 1 T T T T T T T
w w w
+ + + +
+ +
, o previsor condicionado
s informaes at o instante T obtido aplicando o operador esperana condicionada em ambos
os lados desta equao: [ ] [ ]
2 1 1 2 2 1 1 2 3 1 T T T T T T T T T
E w E w w
+ + + +
+ +
que resulta
em
2 1
1 2 2 3 1
T T T T T
w w w
+ , nota-se que a medida que avanamos em tentar prever o
futuro, ou seja determinar o valor da srie s passos frente, perdemos informaes referentes aos
choques aleatrios e a nossa previso passa a ser uma funo de outra previso, isso quer dizer
que o poder prditivo vai ficando mais pobre.
5. Modelos Estruturais para Sries de Tempo
Uma outra tcnica alternativa metodologia de Box e Jenkins para anlise de sries temporais foi
desenvolvida por Andrew Harvey. Nesse caso a srie
t
y
considerada como sendo composta por:
tendncia ( )
t
, ciclo ( )
t
, sazonalidade ( )
t
e erro ( )
t
.
t t t t t
y + + +
(5.1)
Harvey faz aplicao do filtro de Kalman para estimar os componentes
, ,
e
.
O filtro de Kalman um algoritmo computacional iterativo desenvolvido para realizar previses e
prever varincias de modelos de sries de tempo. Pode ser aplicado para qualquer modelo de
srie de tempo que possa ser escrita na forma de espao de estado. Quase todos os modelos
convencionais de sries de tempo podem ser escritos nesta forma [Harvey/1989].
A forma de espao de estado definida a partir das equaes (5.2), (5.3), (5.4) e (5.5) e das
hipteses (5.a) e (5.b):
.
t t t t
y z +
( ) 1
t
m
e ( ) 1
t
z m
(5.2)
Na Equao-5.2,
t
+
(5.4)
t
T
uma matriz ( ) m m
.
[ ]
0;
t
E
[ ]
t t
Var Q
(5.5)
Hiptese (5.a): o vetor de estado inicial
0
tem mdia
0
a
e matriz de covarincia
0
P
.
Hiptese (5.b): Os termos aleatrios
t
e
t
1
w
M
1 t
y
2 t
y
t p
y
M
1 t
2 t
t q
1
z
1
z
t t t
y y
M
m
w
11
w
1 m
w
1p
w
mp
w
12
w
2 m
w
t
y
*
11
w
*
1 m
w
*
12
w
*
2 m
w
*
1q
w
*
mq
w
1
1 +
AR(p)
MA(q)
t
y
dada pela equao-6.1
( ) ( )
*
1, , , 1, ,
1 1 1
.
p q m
t t t p t t q i ij t j ij t j t j i
i j j
y h y y W f w y w y y
+ + +
' ;
K K
(6.1)
sendo que f representa uma funo no-linear suave,
i
W
so os pesos entre os neurnios da
camada intermediria (ou escondida) e de sada,
ij
w
so os pesos entre as entradas externas e a
camada escondida,
*
ij
w
so os pesos entre a primeira camada de neurnios com entradas de retro-
alimentao (recorrentes) e a camada de neurnios escondidos,
i