010MQI - Algumas Tecnicas para Anal de Series Temporais

V I S E ME V I S E ME AD AD E n s a i o E n s a i o
M. Q. I . M. Q. I .
UMA BREVE DESCRIO DE ALGUMAS TCNICAS PARA ANLISE DE SRIES
TEMPORAIS: SRIES DE FOURIER, WAVELETS, ARIMA, MODELOS
ESTRUTURAIS PARA SRIES DE TEMPO E REDES NEURAIS.
Mauri Aparecido de Oliveira
1
Luiz Paulo Lopes Favero
2
1
Mestrando em administrao de empresas pela Faculdade de Economia, Administrao e Contabilidade da
Universidade de So Paulo FEA/USP. rea: Mtodos Quantitativos e Informtica. Engenheiro Mecnico (nfase em
Mecatrnica) pela Escola de Engenharia de So Carlos EESC/USP. E-mail: mauriao@usp.br.
2
Mestrando em administrao de empresas pela Faculdade de Economia, Administrao e Contabilidade da
Universidade de So Paulo FEA/USP. rea: Poltica de Negcios e Economia de Empresas. E-mail:
lpfavero@usp.br
UMA BREVE DESCRIO DE ALGUMAS TCNICAS PARA ANLISE DE SRIES
TEMPORAIS: SRIES DE FOURIER, WAVELETS, ARIMA, MODELOS
ESTRUTURAIS PARA SRIES DE TEMPO E REDES NEURAIS
3
.
Resumo
Neste trabalho estamos interessados em fazer uma descrio das tcnicas mais empregadas para
anlise de sries temporais. Sero mostradas diferentes abordagens e suas particularidades no
tratamento das sries temporais. A idia no colocar as tcnicas como competidoras entre si
mas sim que podem ser muitas vezes usadas conjuntamente ou alternativamente para as anlises
de sries temporais. As descries no sero apresentadas com todo o rigor que normalmente
exigido em textos mais tcnicos, ou seja vrias consideraes probabilsticas, matemticas e
estatsticas podem ser consideradas faltantes para um leitor mais especializado no assunto. Nossa
pretenso apresentar de forma breve e sucinta as tcnicas que so utilizados para modelamento
e anlise das sries temporais e a importncia que desempenham na criao de estruturas
matemticas para representar o passado e prever o comportamento do futuro.
1. Introduo
Uma srie temporal pode ser definida como um conjunto de observaes de uma varivel
dispostas seqencialmente no tempo. A srie temporal pode ser classificada como determinstica
ou estocstica, quando os valores da srie podem ser escritos atravs de uma funo matemtica
y = f(tempo) diz-se que a srie estacionria, quando a srie envolve alm de uma funo
matemtica do tempo tambm um termo aleatrio y = f(tempo,
) chamamos a srie de
estocstica. Normalmente as sries temporais so analisadas a partir de seus principais
movimentos descritos como: tendncia, ciclo, sazonalidade e variaes aleatrias. Neste trabalho
vamos usar os termos sries temporais e sries de tempo como tendo o mesmo significado.
2. Anlise de Fourier Clssica
A anlise de Fourier uma das formas mais tradicionais para tratamento de sinais e sries
temporais. Esta tcnica foi criada por Jean Baptiste Joseph Fourier e publicada em 1822 no seu
trabalho intitulado Thorie Analitique de la Chaleur. Fourier dedicou-se na resoluo das
equaes diferenciais que regem a transferncia de calor utilizando uma tcnica de sries de
senos e cossenos (Srie de Fourier) para resolver seus problemas. Vamos restringir aqui nossas
explicaes para funes determinsticas peridicas. Uma funo, ou srie, dita peridica
quando f(t + p) = f(t), sendo p o perodo. A Figura-2.1 mostra sries que podem ser obtidas a
partir da combinao de senos e cossenos.
-7.0 -3.5 0.0 3.5 7.0
X
-4
-2
0
2
4
Y
f(t) = sen(2t) cos(3t)
-10 -5 0 5 10
X
-10
-5
0
5
10
Y f(t) = 2 + sin(2t) + 4cos(3t) + sin(t) - 2cos(2t)
Figura-2.1 Sries formadas por funes de senos e cossenos
3
Agradecemos a colaborao do Prof. Dr. Jos O. Siqueira por todas as contribuies durante nossos estudos e em
particular no desenvolvimento deste trabalho.
Podemos adotar este procedimento para escrever uma srie f(t) genrica em termos de senos e
cossenos da seguinte forma:
1 2 3 1 2 3
( ) cos1 cos 2 cos3 ... sen1 sen 2 sen3 ... f t A a t a t a t b t b t b t + + + + + + + + +
(2.1)
ou ainda como:
1
( ) cos sen
k k
k
f t A a kt b kt
+ +
. Portanto, surge a pergunta: Dada uma srie

f(t), definida em um certo intervalo, quais so os valores dos coeficientes A,
k
a
e
k
b
de
modo que a soma de senos e cossenos a represente? Estes valores, no intervalo [ ]
,
, so
expressos como sendo
1
( )
2
A f t dt
,
1
( ) cos
k
a f t ktdt
e
1
( ) sen
k
b f t ktdt
.
Para que a srie no domnio do tempo seja convertida para o domnio da freqncia
utilizada a transformada de Fourier (TF) dada por ( ) ( )
*
* 2
X
i f t
f f t e dt
, f

representa
a freqncia e
1 i
. Mudar para o domnio da freqncia importante porque na maioria
das vezes, a informao que no pode ser lida no domnio do tempo pode ser obtida no
domnio da freqncia.
Por exemplo, seja a srie x(t)=cos(2
10t)+ cos(2
25t) +cos(2
50t)+ cos(2
100t)
representada na Figura-2.2a
4
a sua transformada de Fourier (TF) mostrando as freqncias
que a compem so representadas na Figura-2.2b. A Figura-2.2b tambm pode ser chamada
de espectro de freqncia da srie x(t).
(a) (b)
Figura-2.2 Srie temporal mostrada em (a) e a sua transformada de Fourier em (b)
Para podermos prosseguir at o nosso prximo tpico chamado de transformadas de ondaletas ou
waveletes (TW) e entendermos melhor a sua necessidade vamos olhar mais atentamente para a
transformada de Fourier. A TF (bem como TW) uma transformada reversvel, ou seja, ela
permite ir para trs e para frente num processamento inicial (transformaes) dos sinais. Porm,
4
As Figuras 2.2a

e 2.2b foram construdas utilizando-se o software Matlab v6.5, as linhas de comando so:
t = 0:0.001:0.6;
x = cos(2*pi*10*t)+cos(2*pi*25*t)+cos(2*pi*50*t)+cos(2*pi*100*t);
plot(x)
ylabel(' Funo x(t)')
xlabel('Tempo')
Y = fft(x,512);
Pyy = Y.* conj(Y) / 512;
f = 1000*(0:256)/512;
plot(f,Pyy(1:257))

apenas uma dessas alternativas disponvel para qualquer srie. Ou seja, no h informao de
freqncia disponvel no domnio do tempo da srie ou sinal, com isso no h informao de
tempo disponvel na transformada de Fourier do sinal. A questo natural que surge: o que
necessrio para ter ambos, a informao de tempo e de freqncia ao mesmo tempo? A resposta
para esta questo, depende em particular da aplicao e da natureza do sinal ou srie que temos.
Lembremos que a TF da a informao da freqncia do sinal, a qual significa que temos o quanto
de cada freqncia existe no sinal Figura-2.2b, mas isso no nos diz quando no tempo estas
componentes freqnciais existem. Esta informao no necessria quando o sinal
estacionrio. O conceito de estacionariedade importante, vamos analisado mais detidamente.
Sinais cujo contedo de freqncia no mudam no tempo so chamados de estacionrios.
Um processo X(t) estacionrio se ele se desenvolve no tempo, de modo que a escolha de uma
origem dos tempos no seja importante, as caractersticas probabilsticas de X(t +
), para todo
T , so as mesmas de X(t) [Morettin/1999]. Em outras palavras, o contedo de freqncias
dos sinais estacionrios no mudam no tempo. Neste caso, ns no precisamos saber em quais
tempos os componentes freqnciais existem, desde que nesse caso o que acontece que todos os
componentes freqnciais existem o tempo todo.
No caso de sries no-estacionrias a concluso que a transformada de Fourier pode ser usada
em sinais no estacionrios, apenas se estivermos interessados em qual o espectro de
componentes existe no sinal, mas no interessa quando estes ocorrem. Porm, se esta informao
necessria, isto , se ns queremos saber, qual o componente espectral que ocorre em qual
tempo (intervalo), ento a transformada de Fourier no a transformada correta para ser
utilizada.
3. Anlise de Ondaletas (Wavelets)
A transformada de ondaleta ou wavelet (TW) capaz de fornecer a informao de tempo e de
freqncia simultaneamente, conseqentemente dando a representao de freqncia-tempo da
srie. Nesse ponto vale lembrar o princpio da incerteza de Heisenberg. Ns no podemos
exatamente saber qual freqncia existe em um dado instante de tempo, mas apenas podemos
saber quais bandas de freqncia existem em determinados intervalos de tempo.
A freqncia e a informao do tempo de uma srie em certo ponto no plano freqncia-tempo
no podem ser conhecidos. Em outras palavras: ns no podemos saber qual o componente
espectral existe em qualquer dado instante de tempo. Este um problema para se resolver, e esta
a principal razo pela qual pesquisadores tem mudado das transformadas de Fourier para a TW.
A anlise de ondaletas tem sido utilizada em vrios ramos da cincia, em economia sua principal
aplicao encontra-se na econometria no tratamento de sries temporais utilizadas para realizar
previso [Torrence/1998] [Morettin/1999].
A transforma de wavelet contnua TWC uma ferramenta excelente para mapear as mudanas de
propriedades em sries no estacionrias. Sua expresso dada por:
( ) ( )
1
,
f
t
TWC s f t dt
s
s

, , 0 s s
(3.1)
Onde ( ) f t
a srie que estamos utilizando, os parmetros
e s so chamados de translao e
escala, respectivamente. Psi(t) uma funo chamada de ondaleta me, sendo
( )
1/ 2
, s
t
t s
s

,

, , 0 s s
(3.2)
usualmente so tomados valores especiais para
e s: 2
j
s

, 2
j
k

,
, j k
.
A ondaleta-me funciona como uma janela de abertura finita percorrendo a funo f(t) - suporte
compacto. A translao
est relacionada a posio da janela, ou seja a posio que a janela

assume atravs do sinal. A escala s refere-se ao comprimento da abertura da janela.
Srie no estacionria gerada com cem valores
Time Signal Time Signal Time Signal Time Signal
1 0 0 26 0,25 5,3847E-08 51 0,5 5,3847E-08 76 0,75 -0,7071068
2 0,01 -0,5877852 27 0,26 -0,9510565 52 0,51 -0,809017 77 0,76 -0,9510565
3 0,02 0,95105651 28 0,27 0,58778521 53 0,52 -0,9510565 78 0,77 -0,9876883
4 0,03 -0,9510565 29 0,28 0,5877853 54 0,53 -0,309017 79 0,78 -0,809017
5 0,04 0,58778527 30 0,29 -0,9510565 55 0,54 0,58778521 80 0,79 -0,4539905
6 0,05 -2,154E-08 31 0,3 -6,462E-08 56 0,55 1 81 0,8 -4,308E-08
7 0,06 -0,5877852 32 0,31 0,95105654 57 0,56 0,5877853 82 0,81 0,45399046
8 0,07 0,95105651 33 0,32 -0,5877852 58 0,57 -0,3090169 83 0,82 0,80901697
9 0,08 -0,9510565 34 0,33 -0,5877853 59 0,58 -0,9510565 84 0,83 0,98768833
10 0,09 0,58778528 35 0,34 0,95105649 60 0,59 -0,809017 85 0,84 0,95105653
11 0,1 -4,308E-08 36 0,35 7,5386E-08 61 0,6 -6,462E-08 86 0,85 0,70710681
12 0,11 -0,5877852 37 0,36 -0,9510565 62 0,61 0,80901696 87 0,86 0,30901704
13 0,12 0,9510565 38 0,37 0,58778519 63 0,62 0,95105654 88 0,87 -0,1564344
14 0,13 -0,9510565 39 0,38 0,58778532 64 0,63 0,30901706 89 0,88 -0,5877852
15 0,14 0,5877853 40 0,39 -0,9510565 65 0,64 -0,5877852 90 0,89 -0,8910065
16 0,15 -6,462E-08 41 0,4 -8,616E-08 66 0,65 -1 91 0,9 -1
17 0,16 -0,5877852 42 0,41 0,95105654 67 0,66 -0,5877853 92 0,91 -0,8910065
18 0,17 0,95105649 43 0,42 -0,5877852 68 0,67 0,30901693 93 0,92 -0,5877853
19 0,18 -0,9510565 44 0,43 -0,5877853 69 0,68 0,95105649 94 0,93 -0,1564345
20 0,19 0,58778532 45 0,44 0,95105649 70 0,69 0,80901704 95 0,94 0,30901695
21 0,2 -8,616E-08 46 0,45 9,6924E-08 71 0,7 7,5386E-08 96 0,95 0,70710675
22 0,21 -0,5877852 47 0,46 -0,9510565 72 0,71 -0,8090169 97 0,96 0,9510565
23 0,22 0,95105649 48 0,47 0,58778517 73 0,72 -0,9510565 98 0,97 0,98768835
24 0,23 -0,5877853 49 0,48 0,58778534 74 0,73 -0,3090171 99 0,98 0,80901703
25 0,24 0,9510565 50 0,49 -0,9510565 75 0,74 0,58778519 100 0,99 0,45399055
Tabela-3.1 Valores de uma srie no estacionria
A Figura-3.3 a representao grfica de uma srie no estacionria obtida a partir dos dados da
Tabela-3.1.
Generated Signal
0 0.2 0.4 0.6 0.8 1
Time
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
S
i
g
n
a
l
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
S
i
g
n
a
l
Figura-3.3 Plotagem dos dados da srie no estacionria da Tabela-3.1
Na Figura-3.4
5
temos a aplicao da TW sobre a srie no estacionria da Tabela-3.1.
As ondaletas so localizadas no tempo (ou espao), contrariamente do que ocorre com as funes
trigonomtricas. Esse comportamento torna-as ideais para analisar sinais no estacionrios,
contendo transitoriedades e estruturas tipo fractais. Bases de Fourier so localizadas em
freqncia, mas no no tempo: pequenas mudanas em algumas das observaes podem provocar
mudanas em todas as componentes de uma expanso de Fourier, o que no acontece com uma
expanso em srie de ondaletas [Morettin/1999].
1
0
.
9
0
.
8
0
.
7
0
.
6
0
.
5
0
.
4
0
.
3
0
.
2
0
.
1
0
5
1
0
1
5
2
0
2
5
3
0
3
5
4
0
4
5
T
im
e
F
r
e
q
u
e
n
c
y
0
0
0.025
0.025 0.05
0.05 0.075
0.075 0.1
0.1
0.125
0.125
I
n
t
=
P
S
D

T
I
S
A
I
n
t
=
P
S
D

T
I
S
A
Generated Signal
Continuous Wavelet Time-Frequency Spectrum
Figura-3.4 Transformada wavelet da srie no estacionria mostrada na Figura-3.3
4. Modelos ARIMA e Abordagem de Box e Jenkins
Durante a dcada de 1960 os professores George E. P. Box e Gwilym M. Jenkins escreveram
diversos trabalhos sobre a teoria de controle e anlise de sries temporais. Em 1970 publicaram o
livro Time Series Analysis, forecasting and control apresentando uma metodologia para a anlise
de sries temporais e em 1976 foi lanada a verso revisada desse livro e que normalmente a
mais mencionada, o grande mrito desse trabalho foi reunir as tcnicas existentes numa
metodologia para construir modelos que descrevessem com preciso e de forma parcimoniosa o
processo gerador da srie temporal, proporcionando dessa forma previses acuradas de valores
futuros.
A metodologia de Box-Jenkins estima modelos de sries temporais da forma:
0 1 1 1 1 t t p t p t t q t q
y y y

+ + + + + + + L L
(4.1)
Nesta equao temos que o termo
0
representa uma constante no modelo estimado,

1
at
p
so parmetros que ajustam os valores passados de

t
y
do instante imediatamente anterior at o
mais distante representado por p. Os valores de
representam uma seqncia de choques

aleatrios e independentes uns com os outros,
t
uma poro no-controlvel do modelo

chamado normalmente de rudo branco. Os parmetros
1
at
q
possibilitam escrever a srie

5
A Figura-3.4 foi construda utilizando-se o software Autosignal v1.6 da Systat.
em funo dos choques passados. Em geral cada
t
considerado como tendo distribuio

normal, mdia zero, varincia constante e no-correlacionados. Em linguagem estatstica,
considerando que [ ]
E x
denota a mdia terica do valor de x, a seqncia
t
considerada um
processo rudo branco se para cada perodo de tempo t tivermos: (i) [ ] [ ]
1
0
t t
E E

L
,
mdia zero; (ii)
2 2 2
1 t t
E E
1 1
] ]
L
, varincia constante; (iii) [ ]
.
t t s
E

. 0
t j t j s
E

1
]
L
, covarincia nula para todo valor de s.
A equao (4.1) representa um modelo denominado como autoregressivo integrado de mdia
mvel, ou simplesmente ARIMA. Podemos escrever a equao (1) tambm com o seguinte
formato:
0
1 0
p q
t i t i i t i
i i
y y

+ +

, sendo
0
1
. Chamamos de modelo autoregressivo
quando podemos escrever uma srie temporal na forma
0
1
p
t i t i t
i
y y
+ +
, ou seja a srie
t
y

escrita a partir dos seus valores passados. Escrevendo a srie em termos dos seus choques
aleatrios temos o modelo de mdia mvel, ou seja
0
q
t i t i
i
y

, onde
0
1
.
Agora considere a srie,
0 1 1 t t t
y y
+ +
quando
0
0
e
1
1
esse modelo conhecido
como passeio aleatrio ou random walk, uma das caractersticas desse modelo violar a
condio de estacionariedade.
Um modelo estacionrio se para todo t e t-s tivermos: (i) [ ] [ ]
t t s
E y E y

, mdia constante;
(ii) ( ) ( )
2 2
2
t t s y
E y E y
1 1

] ]
, varincia constante; (iii) ( ) ( )
t t s
E y y
1
]
( ) ( )
t s t j s s
E y y

1

]
, covarincia constante.
Muitas vezes para tornar uma srie estacionria precisamos utilizar um recurso chamado
diferenciao usando o operador , sendo que
( )
1
d
d j
j
L e
j
t t j
L y y

. Quando
t
y
uma
srie temporal I(d) e depois de diferenciar d vezes ela pode ser modelada usando um modelo
AR(p), este modelo para
t
y
pode ser escrito como [Franses/1998]:
1 1 1 1 1
d d d
t t p t p t
y y y

K
, t=p+d, p+d+1, ..., n (4.2)
O modelo representado por (4.2) normalmente abreviado por ARI(p,d), ou seja autoregressivo
de ordem p e integrado de ordem d. Quando uma srie temporal apresenta uma tendncia
provavelmente ela poder ser representada por um modelo integrado ARI, ARIMA ou IMA.
importante destacar que os modelos ARIMA no apresentam especificidade grfica, somente
plotando a srie temporal no possvel identificar qual o modelo que a representa.
Para que possamos determinar qual o modelo da famlia ARIMA que melhor representa a srie e
que poder ser utilizado para fazer as previses, podemos seguir as seguintes etapas [Yim/2001]:
Identificao do
Modelo
Estimao
Verificao ou
diagnstico
Previso
Na etapa de identificao queremos saber:

t
y
AR
MA
ARMA
ARIMA
M
Qual a ordem do modelo, ou seja quais
os valores de
p
q
p,q
p,d,q
Na identificao dos modelos so utilizados dois recursos : as funes de auto-correlao (FAC)
e as funes de auto-correlao parciais (FACP). A funo de auto-correlao (FAC) de uma
srie
t
y
definida por [ ] [ ]
0
ov , / /
k t t k t k
C y y Var y

, onde
k
a auto-covarincia de k-
sima ordem de
t
y
, ou seja
( ) ( )
k t t k
E y y
1
]
, k = ..., -2,-1,0,1,2,... (4.3)
Dada a equao (4.3) podemos verificar que
0
1
,
k k

e que
1 1
k
< <
. A FAC til
para caracterizar modelos ARMA, um exemplo simples a srie rudo branco
t
para a qual
[ ]
0
t
E
e
0
k

para todo 0 k . Para o modelo AR(1) dado por ( )
1 1 t t t
y y
+
,
t=2,3,...,n podemos escrever que [ ] [ ] [ ] ( ) [ ]
1 1 1 1 1
1
t t t t
E y E y E E y

+ + +
. Para
que o processo AR(1) seja convergente necessitamos
1
1 <
, sendo assim a esperana de
t
y

pode ser escrita como [ ] ( ) ( )
1
1 1
1 1
t
E y L
. Para calcular a FAC do processo AR(1)

vamos iniciar calculando a varincia [ ] ( ) [ ] ( )
0 t t t t
E y E y y E y
1

]
, que pode ser escrita
alternativamente como ( ) ( )
( )
2
2 2
0 1 1 1 2
...
t t t t
E y E

1
1
+ + +
1
]
]
. Sabemos que
[ ]
2
t
E
dessa forma a expresso da varincia pode ser simplificada para
( ) ( ) ( )
1
2 4 2
2 2
0 1 1 1
1 ... 1

1 1
+ + +
] ]
. A auto-covarincia para uma srie temporal
AR(1) dada por ( )
2 2
1 1 1
/ 1
, com isso temos que o primeiro valor da FAC
1 1 0 1
/
. Para calcular todos os valores
k
precisamos considerar a seguinte expresso

para o modelo AR(1) ( ) ( ) ( ) ( )
2
2
1 1
/ 1
k
t t k
E y y
1
1
]
]
o que resulta em
( )
1 1 1
k
k k

. Como
1
1 <
a FAC exponencialmente declinante.
Para calcular a FACP podemos utilizar o sistema de equaes de Yule-Walker:
Para a FACP de primeira ordem temos que
11 1

e para a FACP de segunda
( )
( )
2
2 1
22
2
1
1

1 1 2 1 1
2 1 1 2 2
1 1 2 2 3 3
k k
k k
k k k k k

+ + +
+ + +
+ + +
K
K
M
K
A partir da terceira ordem podemos utilizar a recurso:
1
1 1
1, 1,
1 1
. 1
k k
kk k k j k j k j k
j j

_ _

, ,

, sendo k=3,4,5,...
Para um modelo AR(1) determinamos
11
a partir da primeira auto-regresso e achamos

11 11

na segunda auto-regresso teremos que
22 22
0
e assim por diante tendo que para todos os
outros valores
0
kk

. Portanto, no modelo AR(1) temos apenas
11
0
, para k > 1
0
kk

.
Generalizando para um modelo AR(p) teremos
0
kk

para k p e
0
kk

nos casos k > p, ou
seja a FACP truncada na ordem p. Resumidamente a Tabela-1 apresenta o comportamento das
funes de auto-correlao para os modelos ARMA [Yim/2001].
Modelo FAC FACP
AR declinante truncada em p
MA truncada em q declinante
ARMA declinante declinante
Tabela-4.1 Comportamento da FAC e da FACP para os modelos ARMA
Na Figura-4.1 vemos os possveis padres de comportamento da FAC e da FACP para o modelo
AR(1).
Figura-4.1 Funes de autocorrelao FAC e FACP de um modelo AR(1)
Na etapa de estimao precisamos estimar os parmetros
s do modelo AR, os parmetros
s
do modelo MA e a varincia do erro
2
. A estimao pode ser feita utilizando-se o mtodo dos

mnimos quadrados ou mxima verosimilhana. A srie temporal
t
y
pode ser escrita como um
modelo ARIMA(p,d,q) se esta srie for no-estacionria podemos aplicar o operador diferena
nessa srie para torna-la estacionria na mdia, escrevendo uma nova srie
d
t t
w y , por
exemplo ( )
2
1 1 1 1
2
t t t t t
y y y y y
+ + +
+
. O modelo a partir de
t
w
permite que possa
escrever a srie diferenciada com a amostra de dados como sendo
1 1 0 1 0 1 1 1 0 2 1 1 p p q q
w w w w
+ +
+ + + + K K
. De forma abreviada
( ) ( )
t t
B w B
, onde B o operador backward, isolando o termo erro ficamos com
( ) ( )
1
t t
B B w
. Para realizar a estimao pelo mtodo dos mnimos quadrados devemos

minimizar
2
. No caso da estimao por mxima verosimilhana necessitamos da hiptese de

normalidade sobre a distribuio de
d
t t
w y , ou seja ( ) ( )
2
0, 0,
t t
N w N
: :
e a
funo que ser otimizada ( ) ( )
1
1
2 2
1
; ; ; 2 . .exp `
2
T
L w w w

_

,
. Depois da etapa de
estimao necessrio realizar a verificao ou diagnstico que compreende: a verificao dos
parmetros estimados, anlise dos resduos e anlise dos critrios de informao. Os critrios de
informao mais utilizados so o Akaike information criterion (AIC) e o Schwartz Bayesian
0
0
0 <
k
kk
0 <
3
6
9
1
0
3
0 >
k
6 9
0
kk
0 >
1
criterion (SBC), calculados como: AIC = ( )
2
2
ln p q
T
+ + e SBC = ( )
2
ln
ln
T
p q
T
+ + , onde
T o nmero de observaes usadas. O SBC tambm conhecido como Bayesian information
criterion (BIC). Idealmente, o AIC e o SBC devero ser os menores possveis podendo assumir
valores negativos, sendo que ambos medem o quanto o modelo estimado se ajusta aos dados.
Na etapa final, a de previso, dada uma srie { }
1 2
, ,...,
t
y y y
queremos prever os valores
1 t
y
+
,
2 t
y
+

at
t s
y
+
. O interesse agora est concentrado em encontrar o previsor timo
t s
y
+
, ou seja aquele
que minimiza o erro quadrtico mdio da previso: ( ) ( )
2
2
min
T s T T
E y y s E e s
+
1 1
] ]
.
Quando fazemos previso temos o problema da perda de informaes a medida que avanamos
em tentar prever os valores mais adiante no tempo. Isto pode ser visto claramente usando-se, por
exemplo um modelo ARMA(2,3) dado por
1 1 2 2 1 1 2 2 3 3 T T T T T T T
w w w

+ +
.
Atualizando um perodo ficamos com
1 1 2 1 1 1 2 1 3 2 T T T T T T T
w w w
+ +
+ +
para
obtermos o previsor de
T
w
um passo a frente, denotado por
1
T
w precisamos tomar a esperana
condicionada at o instante T da srie atualizada, o que resulta em
1
1 2 1 1 2 1 3 2
0
T T T T T T
w w w

+ + sendo que o valor zero nessa expresso representa
uma perda de informao, devido ao conjunto de informaes estar condicionado at o instante T
(ou seja: [ ]
1
0
T T
E
+

).
Continuando desta maneira, na determinao do valor da srie para dois passos frente teremos a
seguinte expresso
2 1 1 2 2 1 1 2 3 1 T T T T T T T
w w w
+ + + +
+ +
, o previsor condicionado
s informaes at o instante T obtido aplicando o operador esperana condicionada em ambos
os lados desta equao: [ ] [ ]
2 1 1 2 2 1 1 2 3 1 T T T T T T T T T
E w E w w
+ + + +
+ +
que resulta
em
2 1
1 2 2 3 1

T T T T T
w w w

+ , nota-se que a medida que avanamos em tentar prever o
futuro, ou seja determinar o valor da srie s passos frente, perdemos informaes referentes aos
choques aleatrios e a nossa previso passa a ser uma funo de outra previso, isso quer dizer
que o poder prditivo vai ficando mais pobre.

5. Modelos Estruturais para Sries de Tempo
Uma outra tcnica alternativa metodologia de Box e Jenkins para anlise de sries temporais foi
desenvolvida por Andrew Harvey. Nesse caso a srie
t
y
considerada como sendo composta por:
tendncia ( )
t
, ciclo ( )
t
, sazonalidade ( )
t
e erro ( )
t
.
t t t t t
y + + +
(5.1)
Harvey faz aplicao do filtro de Kalman para estimar os componentes
, ,
e
.
O filtro de Kalman um algoritmo computacional iterativo desenvolvido para realizar previses e
prever varincias de modelos de sries de tempo. Pode ser aplicado para qualquer modelo de
srie de tempo que possa ser escrita na forma de espao de estado. Quase todos os modelos
convencionais de sries de tempo podem ser escritos nesta forma [Harvey/1989].
A forma de espao de estado definida a partir das equaes (5.2), (5.3), (5.4) e (5.5) e das
hipteses (5.a) e (5.b):
.
t t t t
y z +
( ) 1
t
m
e ( ) 1
t
z m
(5.2)
Na Equao-5.2,
t
representa o vetor de estado que pode ser observvel ou no. E

t
z
relaciona y
ao vetor de estado.
[ ]
0;
t
E
[ ]
t t
Var h
(5.3)
A Equao-5.4 chamada de equao de transio fornece a evoluo do vetor de estado ao
longo do tempo.
1
.
t t t t
T
+
(5.4)
t
T
uma matriz ( ) m m
.
[ ]
0;
t
E
[ ]
t t
Var Q
(5.5)
Hiptese (5.a): o vetor de estado inicial
0
tem mdia
0
a
e matriz de covarincia
0
P
.
Hiptese (5.b): Os termos aleatrios
t
e
t
so no-correlacionados entre si e no-

correlacionados com o vetor de estado inicial.
O software Structural Time Series Analyser, Modeller and Predictor (Stamp) foi desenvolvido
especificamente para trabalhar com o modelamento estrutural de sries temporais.
A tcnica de anlise estrutural uma alternativa para resolver alguns problemas da abordagem
dos modelos ARIMA: a necessidade de estacionariedade, nem todas as sries podem ser
diferenciadas e quando diferenciamos uma srie perdemos algumas caractersticas interessantes
da srie; com relao ao processo de identificao pela FAC e FACP, caso a srie tenha uma
amostra pequena de dados e estes apresentem sazonalidade os modelos identificados podem ser
precrios com relao ao seu poder de previso.
6. Processamento Temporal utilizando Redes Neurais Artificiais
Uma rede neural um processador maciamente paralelamente distribudo de unidades de
processamento simples, que tem a propenso natural para armazenar conhecimento experimental
e torn-lo disponvel para o uso. Ela se assemelha ao crebro em dois aspectos: (1) o
conhecimento adquirido pela rede a partir de seu ambiente atravs de um processo de
aprendizagem; (2) foras de conexes entre neurnios, conhecidos como pesos sinpticos, so
utilizados para armazenar o conhecimento adquirido [Haykin/1999].
Uma das principais aplicaes das redes neurais artificiais (RN) tem sido no reconhecimento de
padres temporais e previso, para isso utilizada uma arquitetura de rede denominada como
rede neural recorrente. A caracterstica da RN recorrente possuir um ou mais laos de
realimentao. A Figura-1 representa uma RN recorrente para aproximao de um modelo
ARMA no-estacionrio conhecido como NARMA(p,q) [Drossu/1996].
1
z
1
w
M
1 t
y

2 t
y

t p
y

M
1 t

2 t

t q

1
z
1
z
t t t
y y

M
m
w
11
w
1 m
w
1p
w
mp
w
12
w
2 m
w
t
y
*
11
w
*
1 m
w
*
12
w
*
2 m
w
*
1q
w
*
mq
w
1
1 +
AR(p)
MA(q)
Figura-6.1 Rede neural recorrente para predio de um processo no-estacionrio NARMA(p,q)

Para o modelo representado na Figura-6.1 temos que a sada
t
y
dada pela equao-6.1
( ) ( )
*
1, , , 1, ,
1 1 1
.
p q m
t t t p t t q i ij t j ij t j t j i
i j j
y h y y W f w y w y y

+ + +
' ;

K K
(6.1)
sendo que f representa uma funo no-linear suave,
i
W
so os pesos entre os neurnios da
camada intermediria (ou escondida) e de sada,
ij
w
so os pesos entre as entradas externas e a
camada escondida,
*
ij
w
so os pesos entre a primeira camada de neurnios com entradas de retro-
alimentao (recorrentes) e a camada de neurnios escondidos,
i
so os termos que modificam

as sadas dos neurnios da camada escondida (tambm chamados de bias ou vis) e o bias
do neurnio de sada.
A grande vantagem de se usar RN est na sua capacidade de trabalhar com no-linearidade. De
forma bem simplificada, as sries temporais econmicas podem ser chamadas de no-lineares
quando grandes choques tem um impacto maior do que pequenos choques no sentido de que o
impacto de um choque no proporcional a sua extenso [Franses/1998]. Tem-se provado que as
redes neurais apresentam caractersticas de aproximadores universais, isso quer dizer uma rede
neural pode capturar qualquer tipo de comportamento, no importando o quo complexo ele seja.
No entanto, a maior fraqueza do modelamento neural a falta de procedimentos estabelecidos
para realizar testes para modelos no especificados e testes de significncia estatstica para os
vrios parmetros que foram estimados [Refenes/1997].
7. Bibliografia
BOX, G. E. P. & JENKINS, G. M.. Time Series Analysis: forecasting and control. San Francisco,
Holden-Day, 1976.
DROSSU, R. and OBRADOVIC, Z.. Rapid design of neural networks for time series prediction,
IEEE vol.3, no.2, p78-89, 1996.
ENDERS, W. Applied econometric time series. Wiley, 1995.
FISCHER, S. Sries univariantes de tempo metodologia de Box & Jenkins. Porto Alegre FEE,
1982.
FRANSES, P. H. Time Series models for business and economic forecasting, Cambridge, 1998.
HARVEY, A. C. Forecasting, structural time series models and the Kalman filter, 1989.
HAYKIN, S. Neural networks: a comprehensive foundation. Prentice Hall, 1999.
MORETTIN, P. A. Ondas e ondaletas: da anlise de Fourier anlise de ondaletas. EDUSP,
1999.
REFENES, A. N., BURGESS, A.N. and BENTZ, Y. Neural networks in financial engineering: a
study in metodology, IEEE vol.8, no. 6, November, 1997.
TORRENCE, C. and COMPO, G. A practical guide to wavelet analysis, Bulletin of the
American Meteorological Society, v.79, no.1, p.61-78, January, 1998.
YIM, J. Previso de Sries de Tempo: Modelos ARIMA, Modelos Estruturais e Redes Neurais
Artificiais. Dissertao (Economia) - Universidade de So Paulo, 2001.

010MQI - Algumas Tecnicas para Anal de Series Temporais

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

010MQI - Algumas Tecnicas para Anal de Series Temporais

Uploaded by

Copyright:

Available Formats

V I S E ME V I S E ME AD AD E n s a i o E n s a i o

. Portanto, surge a pergunta: Dada uma srie

est relacionada a posio da janela, ou seja a posio que a janela

representa uma constante no modelo estimado,

so parmetros que ajustam os valores passados de

representam uma seqncia de choques

uma poro no-controlvel do modelo

possibilitam escrever a srie

considerado como tendo distribuio

. Para calcular a FAC do processo AR(1)

precisamos considerar a seguinte expresso

a partir da primeira auto-regresso e achamos

s do modelo AR, os parmetros

. A estimao pode ser feita utilizando-se o mtodo dos

. Para realizar a estimao pelo mtodo dos mnimos quadrados devemos

. No caso da estimao por mxima verosimilhana necessitamos da hiptese de

representa o vetor de estado que pode ser observvel ou no. E

so no-correlacionados entre si e no-

Figura-6.1 Rede neural recorrente para predio de um processo no-estacionrio NARMA(p,q)

so os termos que modificam

You might also like