You are on page 1of 44

TPICOS EM ECONOMETRIA

SRIES TEMPORAIS & MODELOS ARIMA

VICTOR HASELMANN ARAKAWA

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------1

MODELOS ARIMA(p,d,q)

Lags das diferenciaes da srie na equao de previso so chamados termos autoregressivos; Lags dos erros de previso so chamados termos de mdias mveis; Sries temporais que precisam ser diferenciadas para serem consideradas estacionrias so chamadas verses integradas da srie estacionria; Sries de passeio aleatrio e de Tendncia aleatria, modelos autoregressivos e modelos de suavizao exponencial (mdias mveis exponenciais) so considerados casos especiais de modelos ARIMA;

Um modelo no-sazonal ARIMA classificado como ARIMA(p,d,q), em que:


p o nmero de termos auto-regressivos; d o nmero de diferenas NO SAZONAIS; q o nmero de erros passados na equao do modelo;

Para identificar o modelo ARIMA apropriado para uma srie temporal, deve-se identificar a ordem de diferenciao necessria para torn-la estacionria e remover traos de sazonalidade, talvez em conjunto com uma transofrmao para estabilizar a varincia da srie, como o uso de log ou deflacionamento. Se a primeira diferena uma constante, a srie um mero passeio aleatrio ou um modelo de tendncia aleatria. Passeio aleatrio Passeio aleatrio SAZONAL Tendncia aleatria SAZONAL 1 diferena constante Diferena SAZONAL constante 1 diferena da diferena sazonal constante (aprox. zero)

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------2

ARIMA (0,1,0) (Passeio Aleatrio)


Existem duas estratgias para eliminar a autocorrelao em erros de previso. A primeira delas a adio de defasagens da srie estacionria. Tomando uma srie de passeio aleatrio com crescimento, sua equao de previso pode ser escrita como: Y tY t1= Em que o termo constante a diferena mdia em Y. Este pode ser considerado um modelo de regresso em que a diferena de Y a varivel dependente e no existe varivel independente a no ser o termo constante. Como ele inclui (somente) uma diferena no sazonal e um termo constante, classificado como uma ARIMA(0,1,0) com constante. Um passeio aleatrio SEM crescimento seria somente um ARIMA(0,1,0) SEM constante.

ARIMA(1,1,0) (Modelo diferenciado auto-regressivo de primeira ordem)


Se os erros do modelo de passeio aleatrio so correlacionados, talvez o problema possa ser resolvido adicionando uma defasagem da varivel dependente ao modelo. Da equao passada: Y tY t1=Y t1Y t2 que pode ser rearrumada como: Y t=Y t1Y t1Y t2 Esta a auto regresso de primeira ordem, AR(1), modelo com uma ordemde fiderena no sazonal e um termo constante. Aqui a constante denotada por mu e o coeficiente auto-regressivo chamado de phi.

ARIMA(0,1,1) sem constante (Suavizao exponencial simples)


Outra estratgia para correo de erros auto-correlacionados em um passeio aleatrio o modelo de suavizao exponencial simples. Para alguma srie temporal no estacionria, o passeio aleatrio no reage bem como uma mdia mvel dos valores passados. Em outras palavras, melhor NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------3 que utilizar as observaes mais recentes como previso para a prxima observao, melhor utilizar uma mdia das ltimas observaes com o intuito de filtrar o rudo e estimar com mais preciso a mdia local. A suavizao exponencial usa uma mdia mvel ponderada exponencialmente de valores passados. O modelo de previso para a suavizao exponencial pode ser escrita de vrias formas, como a equao abaixo: Y t=Y t1e t1 Em que e(t-1) denota o erro no perodo (t-1). Esta equao muito semelhante ao modelo ARIMA(1,1,0), exceto pelo fato de que ao invs de um mltiplo da diferena defasada, este modelo inclui um mltiplo da defasagem do erro de previso. O coeficiente da defasagem do erro denotado pela letra grega theta e convencionalmente escrita com um sinal negativo. O theta da equao refere-se ao (1-) das tcnicas de suavizao exponencial.

ARIMA(0,1,1) com constante (Suavizao exponencial cm crescimento)


Implementando a suavizao eponencial como um modelo ARIMA, ganha-se flexibilidade na anlise. O coeficiente de MA(1) pode adquirir valores negativos, o que corresponde a um fator de suavizao maior que 1 em um modelo puramente de suavizao. Outra vantagem a opo de incluir um termo constante no modelo ARIMA, com o intuito de estimar uma tendncia mdia diferente de zero. O modelo ARIMA(0,1,1) com constante pode ser ecrito como: Y t =Y t1 e t1 A trajetria de previso de termos mais distante possuem uma linha de curvatura (mu), ao invs de uma linha horizontal.

ARIMA(0,2,1) ou (0,2,2) sem constante (Suavizao exponencial linear)


Modelos de suavizao exponencial linear so modelos ARIMA que usam duas diferenciaes no sazonais em conjunto com termos de mdias mveis. A segunda diferena de uma srie a diferena da primeira diferena da srie (mdedida da acelerao ou curvatura da funo em um dado ponto do tempo): [Y tY t1][Y t1Y t2]=Y t2Yt1Y t2

O ARIMA(0,2,2) sem constante prev que a segunda diferena da srie igual a uma funo linear dos dois ltimos erros de previso: NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------4

Y t2Y t1Y t2= 1 e t1 2 et2 Que pode ser rearranjada como: Y t=2Y t1Y t2 1 e t1 2 et2

IDENTIFICANDO A ORDEM DE DIFERENCIAO


O primeiro passo para adequao do modelo ARIMA determinar a ordem de diferenciao necessria para tornar a srie temporal estacionria. Normalmente, o nmero de diferenciaes a menor ordem de diferenciao que prov uma srie de tempo que flutua ao longo de um valor mdio bem definido e cuja funo de autocorrelao (ACF) decai rapidamente a zero, tanto faz, se de cima ou de baixo. Se a srie apresenta uma tendncia de longo prazo, ou mesmo no tende a flutuao ao redor do valor mdia, ou se sua autocorrelao positiva para um grande nmero de defasagens, ento preciso uma ordem de difernciao MAIOR.

egra n 1: Se a srie possui autocorrelaes positivas para uma grande nmero de defasagens, ento provavelmente ela precisa de uma ordem de diferenciao maior.

Diferenciar a srie tende a introduzir correlaes negativas: se a srie inicialmente mostra alta autocorrelao positiva, ento uma diferena no sazonal reduzir a autocorrelao e talvez transforme a autocorrelao com a primeira defasagem (lag-1) em um valor negativo. Se uma segunda diferena no sazonal for introduzida, a autocorrelao de lag-1 ser ainda mais negativa. Se a autocorrelao de lag-1 zero ou negativa, ento a srie no precisa de mais diferenciao. Um dos erros mais comuns em modelagem ARIMA a sobrediferenciao da srie, que obriga a adicionar mais ermos AR e MA para corrigir o erro. Se a autocorrelao de lag-1 mais negativa que -0,5 ( e toricamente a autocorrelao de lag-1 nunca deve ser maior que 0,5 em magnitude), ento ppode ser que a srie esteja diferenciada mais do que o necessrio. A plotagem de uma srie sobrediferenciada pode parecer aleatria, mas prestando mais ateno, possvel notar mudanas de sinais de uma observao para outra.

egra n 2: Se a autocorrelao de lag-1 zero ou negativa, ou so todas pequenas e sem padro definido, ento a srie no precisa de uma ordem maior de diferenciao. Se a autocorrelao de lag-1 for mais negativo que -0,5, a srie est sobrediferenciada.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------5

Outro sintoma de uma possvel sobrediferenciao o aumento do desvio padro, ao invs de sua reduo, quando a ordem de diferenciao aumentada.

R R

egra n 3: A ordem de diferenciao tima comumente aquela em que o desvio padro menor.

As duas primeiras regras nem sempre determinam a ordem de diferenciao correta. Caso haja leve subdiferenciao, pode-se compensar adicionando termos AR ao modelo, enquanto casos de leve sobrediferenciao podem ser compensados adicionando termos MA. egra n 4: Um modelo sem ordem de diferenciao assume que a srie original estacionria. Um modelo com uma ordem de diferenciao assume que a srie tem uma tendncia mdia constante. Um modelo com duas ordens de diferenciao assume que que a srie original possui uma tendncia que varia ao longo do tempo.

Outra considerao a fazer na determinao da ordem de diferenciao o papel do termo constante no modelo, se um for includo. A constante representa a mdia da srie se nenhuma diferenciao for feita, representa a tendncia mdia da srie se for usada uma ordem de diferenciao e representa a tendncia mdia da tendncia (curvatura) se forem usadas duas ordens de diferenciao. Geralmente, no se costuma assumir tendncia da tendncia, ento o termo constante usualmente retirado de modelos com duas ordens de diferenciao. Em modelos com apenas uma ordem de diferenciao, deve-se analisar o que se quer para a tendncia mdia:

egra n 5: Um modelo sem ordem de diferenciao normalmente inclui um termo constante (o que representa a mdia da sria). Um modelo com duas ordens de diferenciao normalmente no inclui o termo constante. Num modelo com uma ordem de diferenciao, um termo constante deve ser includo se a srie possui uma tendncia mdia diferente de zero.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------6

EXEMPLO

O grfico acima mostra uma srie temporal especificado num modelo ARIMA(0,0,0) com constante. Ou seja, simplesmente a srie original com o termo de mdia da srie (linha vermelha). A funo de autocorrelao (ACF) demonstra uma cada linear bem devagar, o que tpico de sries no estacionrias:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------7

Forecast model selected: ARIMA(0,0,0) with constant ARIMA Model Summary Parameter Mean Constant Backforecasting: yes Estimated white noise variance = 308.329 with 149 degrees of freedom Estimated white noise standard deviation = 17.5593 Number of iterations: 3 Estimate 222.738 222.738 Stnd. Error 1.60294 t 138.956 P-value 0.000000 ----------------------------------------------------------------------------

----------------------------------------------------------------------------

Certamente necessrio diferenciar a srie para torn-la estacionria. Tomando-se uma diferena no sazonal, ARIMA (0,1,0) c/ constante, o resduo tem a seguinte aparncia:

A srie aproximadamente estacionria sem nenhuma tendncia de longo prazo: ela exibe uma clara flutuao em torno da mdia, ainda que lenta. A ACF confirma uma pequena poro de autocorrelao:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------8

O desvio padro caiu dramaticamente, de 17,55 para 1,54, como pode ser visto abaixo:
Forecast model selected: ARIMA(0,1,0) with constant ARIMA Model Summary Parameter Mean Constant Backforecasting: yes Estimated white noise variance = 2.38304 with 148 degrees of freedom Estimated white noise standard deviation = 1.54371 Number of iterations: 2 Estimate 0.50095 0.50095 Stnd. Error 0.141512 t 3.53999 P-value 0.000535 ----------------------------------------------------------------------------

----------------------------------------------------------------------------

Esta srie estacionria ou preciso outra diferenciao? Como a tendncia foi eliminada por completo e a poro de autocorrelao que resta pequena, parece que a srie satisfatoriamente estacionria. Se uma segunda diferenciao for feita, ARIMA (0,2,0), obtm-se a srie abaixo:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA------------------------------------------------------------------------9

Em uma anlise mais aprofundada, notam-se os sinais de sobrediferenciao, como a mudana de sinais de uma observao para outra. Isso confirmado pela ACF, que agora tem picos negativos na primeira defasagem, que bem prxima de 0,5 em magnitude:

Outro sinal de sobrediferenciao o aumento do desvio padro de 15,54 para 1,81:


Forecast model selected: ARIMA(0,2,0) with constant ARIMA Model Summary Parameter Mean Constant Backforecasting: yes Estimated white noise variance = 3.28573 with 147 degrees of freedom Estimated white noise standard deviation = 1.81266 Number of iterations: 1 Estimate 0.000782562 0.000782562 Stnd. Error 0.166869 t 0.00468969 P-value 0.996265 ----------------------------------------------------------------------------

----------------------------------------------------------------------------

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------10 Conclui-se que uma diferena no-sazonal suficiente. Entretanto, esta no a concluso final: pode-se estimar que ao adicionar termos AR ou MA em modelos com mais ordens de diferenciao so mais refinados. Ainda mais, pode-se concluir intuitivamente (pela teoria econmica) que previses de longo prazo so mais razoveis com outra ordem de diferenciao.

IDENTIFICANDO A QUANTIDADE DE AR E MA
Depois que a srie foi diferenciada e atingiu a estacionariedade, o prximo passo na modelagem ARIMA determinar que termos AR ou MA so necessrios para corrigir qualquer autocorrelao restante na diferena da srie. A forma mais indicada observar a plotagem da funo de autocorrelao (ACF) e funo de autocorrelao parcial (PACF). A ACF a plotagem dos coeficientes de autocorrelao entre a srie temporal e suas prprias defasagens. A PACF a plotagem dos coeficientes de correlao parcial entre a srie e suas defasagens. A correlao parcial entre duas variveis a parcela de correlao entre elas que no pode ser explicada pelas sua correlao mtua com um conjunto especificado de outras variveis. Por exemplo, se estivermos regredindo a varivel Y com outras variveis X1, X2 e X3, a correlao parcial entre Y e X3 a poro de correlao entre Y e X3 que no explicada pela sua correlao comum com X1 e X2. A correlo parcial pode ser calculada como a raiz quadrada da reduo na varincia que alcanada pela adio de X3 regresso de Y com X1 e X2. A autocorrelao parcial a parcela de correlao entre a varivel e sua defasagem que no explicada por correlaes de defasagens de ordem mais baixa. A autocorrelao de uma srie temporal Y na primeira defasagem o coeficiente de correlao entre Y9t) e Y)t-1), que presumivelmente tambm a correlao entre Y(t-1) e Y(t-2). Mas se Y(t) correlacionado com Y(t-1), e Y(t-1) e correlacionado com Y(t-2), ento espera-se encontrar uma correlao entre Y(t) e Y(t-2) (a correlao da segunda defasagem precisamente o quadrado da correlao da primeira defasagem). Assim, a correlao do lag-1 porpaga para o lag-2 e para defasagens de ordem mais alta. A autocorrelao parcial de lag-2 , entretanto, a diferena entre a correlao atual de lag-2 e a correlao esperada devido a propagao da correlao do lag-1.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------11

As autocorrelaes so significantes para um grande nmero de defasagens, mas talvez as autocorrelaes do lag-2 em diante so meras propagaes da autocorrelao do lag-1. Essa afirmao confirmada pelo grfico de PACF:

O grfico mostra um pico no lag-1, dizendo que todas as autocorrelaes de maior ordem (mais defasadas) so explicadas pela corr da primeira defasagem. A autocorr parcial na defasagem K igual a estimar o coeficiente de AR(K) em um modelo autoregressivo com K termos, como um modelo de regresso mltipla em que Y explicada por LAG(Y,1), LAG(Y,2), etc., at LAG(Y,K). Assim, atravs da observao do PACF, possvel determinar quantos termos AR so necessrios para explicar o padro da autocorr da srie: se a autocorr parcial significante no lag-K e no significante em defasagens posteriores, sugere-se desenhar um modelo auto-regressivo de ordem K. O grfico da PACF da srie original acima diz que, na ausncia de diferenciao da srie, deve-se usar um AR(1). Entretanto, o termo AR(1) neste modelo ser equivalente primeira diferena, porque o coeficiente estimado do AR(1) (a altura do lag-1 na grfico de PACF) ser quase igual a 1. A equao de previso para um modelo AR(1) da srie Y sem ordem de diferenciaa dada por: Y t=Y t1 Se o coeficiente phi do termo AR(1) for igual a 1, equivalente a prever que a primeira diferena de Y constante, o que, por sua vez, igual equao de passeio aleatrio com crescimento: Y tY t1=

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------12 O grfico PACF aponta que, se a srie no for diferenciada, um modelo AR(1) deve ser utilizado, o que igual a tirar a primeira diferena. Em outras palavras, o PACF est apontando que a srie precisa de uma diferena para tornar-se estacionria.

TRAOS DE AR E MA
Se a PACF cai bruscamente enquanto a ACF decai vagarosamente, diz-se que a srie estacionria contm traos de AR, significando que o padro de autocorr pode ser explicada mais facilmente adicionando termos AR do que adicionando termos MA. Traos de AR so comumente associados com autocorr positivas no lag-1. Isto , tendem a surgir em sries SUB-diferenciadas. A razo para isto que um termo AR age como uma diferena parcial na equao. Por exemplo, num modelo AR(1), o termo AR age como a primeira diferena se o coeficiente autoregressivo for igual a 1, no tem ao se o coeficiente autoregressivo for zero, e age como uma diferena parcial se o coeficiente estiver entre zero e um. Ento, se a srie levemente SUBdiferenciada, ou seja, se o padro no estacionrio da autocorr positiva no foi completamente eliminado, a srie demandar uma diferena parcial.

egra n 6: Se a PACF da srie diferenciada mostra uma quedra abrupta e/ou a autocorr do lag-1 positiva, ou seja, a srie aparenta estar levemente SUB-diferenciada, ento considere adiconar termos AR ao modelo. A defasagem em que a PACF cai o nmero indicado de termos AR.

Em princpio, qualquer padro de autocorrelao pode ser removido de uma srie estacionria adicionando termos AR suficientes equao estimada, e o PACF diz quantos so necessrios. No entanto, esta no sempre a maneira mais simples de explicar um padro de autocorr: s vezes mais eficiente inserir termos MA (defasagens dos erros de previso). A funo de autocorrelao (ACF) funciona para o MA assim como a PACF funciona para o AR. Assim, a ACF nos diz quantos termos MA so necessrios para remover a autocorr remanescente na srie estacionria. Se a autocorr significante no lag-K, mas no em outros Las de ordem mais alta, ou seja, a ACF pra bruscamente no lag-K, isso indica que K termos de MA so necessrios na equao. Em outras palavras, diz-se que a srie estacionria possui traos de MA, o que significa dizer que o padro de autocorr pode ser explicada mais facilamente adicionando termos de MA ao invs de AR. Traos de MA so comumente associados com autocorr negativa no lag-1, ou seja, tende a aparecer em sries levemente SOBRE-diferenciadas. Se o coeficiente de MA(1) for maior que zero, como se estivsemos cancelando parcialmente uma ordem de diferenciao. Y t=Y t1 e t1 NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------13

egra n 7: Se a ACF da srie diferenciada mostrar uma queda abrupta e/ou a autocorr de lag-1 negativa (srie SOBREdiferenciada), ento considere adicionar termos MA ao modelo. A defasagem em que a ACF cai o nmero indicado de termos MA.

PRIMEIRO OPO: ARIMA (2,1,0)


A srie original precisava de uma diferena para tornar-se estacionria. Depois de tomar uma diferena no saazonal, ARIMA (0,1,0) c/ constante, a ACF e PACF mostram que:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------14 Nota-se que (a) a corr no lag-1 sgnificativa e positiva, e (b) a PACF mostra uma queda abrupta, enquanto a ACF no. Em particular, a PACF possui dois picos significativos, enquanto a ACF tem quatro. De acordo com a regra n 6, a srie diferenciada possui traos de AR(2). Se estimarmos o modelo ARIMA(2,1,0), teremos o seguinte grfico:

A autocorr nos lags 1 e 2 foram eliminadas, e no h nenhum outro padro observvel no resto da srie. A plotagem dos resduos da srie temporal mostra uma pequena tendncia de se desviar da mdia: NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------15

Entretanto, a sada da regresso mostra que o modelo se encaixa muito bem no perodo estudado. Ambos os coeficientes de AR so significativamente diferentes de zero e o desvio padro dos resduos diminuiu de 1,54 para 1,42 (quase 10%) por causa da adios dos termos AR. Ainda mais, no h indcios de raiz unitria porque a SOMA DOS COEFICIENTES AR (0,2522 + 0,1955) no est perto de 1. Resumindo, este um bom modelo.
Analysis Summary Data variable: units Number of observations = 150 Start index = 1/80 Sampling interval = 1.0 month(s) Length of seasonality = 12 Forecast Summary ---------------Nonseasonal differencing of order: 1 Forecast model selected: ARIMA(2,1,0) with constant Number of forecasts generated: 24 Number of periods withheld for validation: 30 Estimation Validation Statistic Period Period -------------------------------------------MSE 2.10757 0.757818 MAE 1.11389 0.726546 MAPE 0.500834 0.280088 ME 0.0197748 -0.200813 MPE 0.0046833 -0.0778831 ARIMA Model Summary Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------AR(1) 0.252254 0.0915209 2.75624 0.006593 AR(2) 0.195572 0.0916343 2.13426 0.034492 Mean 0.467566 0.240178 1.94675 0.053485 Constant 0.258178 ---------------------------------------------------------------------------Backforecasting: yes Estimated white noise variance = 2.10875 with 146 degrees of freedom Estimated white noise standard deviation = 1.45215 Number of iterations: 1

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------16 As previses do modelo mostram uma tendncia de crescimento linear projetada no futuro:

A tendncia de longo prazo devida ao fato que o modelo inclui uma diferena no sazonl e um termo constante: este modelo basicamente um passeio aleatrio com crescimento, ajustado pela adio de dois termos autoregressivos. A inclinao da previso (crescimento mdio de um perodo para outro) igual a mdia no modelo (veja sada da regresso: 0,467). A equao de previso escrita: Y t =Y t1 1 Y t1Y t2 2 Y t 2Y t3 Em que mu a constante do modelo (0,258), phi-1 o coeficiente do AR(1) (0,252) e phi-2 o oeficiente de AR(2) (0,1955).

MDIA x CONSTANTE
Em geral, a mdia em um modelo ARIMA se refere mdia da srie diferenciada (tendncia mdia se a ordem de diferenciao igual a 1), enquanto a constante o termo constante que aparece na parte direita da equao de previso. A mdia e a constante esto relacionadas da seguinte forma: Constante=Mdia1Soma dos coeficientes de AR

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------17

MODELO ALTERNATIVO: ARIMA(0,2,1)


Um ordem de diferenciao resultou no menor desvio padro da srie original (e uma autocorr positiva), enquanto duas ordens de diferenciao resultou numa srie mais estacionria (mas com autocorr negativa). O grfico da segunda diferena mostra que:

O sinal negativo do pico e lag-1 um indcio de MA(1). Ento, se forem usadas duas ordens de diferenciao no sazonais, devemos incluir um termo MA(1), resultando num modelo ARIMA(0,2,1). De acordo com a regra n 5, podemos suprimir o termo constante da equao. Segue abaixo a estimao do modelo ARIMA (0,2,1) sem constante: NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------18

Analysis Summary
Data variable: units Number of observations = 150 Start index = 1/80 Sampling interval = 1.0 month(s) Forecast Summary ---------------Nonseasonal differencing of order: 2 Forecast model selected: ARIMA(0,2,1) Number of forecasts generated: 24 Number of periods withheld for validation: 30 Estimation Validation Statistic Period Period -------------------------------------------MSE 2.13793 0.856734 MAE 1.15376 0.771561 MAPE 0.518221 0.297298 ME 0.0267768 -0.038966 MPE 0.017097 -0.0148876 ARIMA Model Summary Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------MA(1) 0.75856 0.0607947 12.4774 0.000000 ---------------------------------------------------------------------------Backforecasting: yes Estimated white noise variance = 2.1404 with 147 degrees of freedom Estimated white noise standard deviation = 1.46301 Number of iterations: 4

Note que o desvio padro somente um pouco maior que o do modelo anterior (1,463 contra 1,452). A equao de previso do modelo : Y t=2Y t1Y t21 e t1 Onde theta-1 o coeficiente de MA(1). Tembre-se de que isso similar ao modelo de suavizao exponencial linear, com o coeficiente de MA(1) correspondendo poro 2*(1-) no modelo.
Model Comparison ---------------Data variable: units Number of observations = 150 Start index = 1/80 Sampling interval = 1.0 month(s) Number of periods withheld for validation: 30 Models -----(A) ARIMA(2,1,0) with constant (B) ARIMA(0,2,1)

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------19


(C) Brown's linear exp. smoothing with alpha = 0.6067 Estimation Period Model MSE MAE MAPE ME MPE -----------------------------------------------------------------------(A) 2.10757 1.11389 0.500834 0.0197748 0.0046833 (B) 2.13793 1.15376 0.518221 0.0267768 0.017097 (C) 2.18056 1.14308 0.514482 0.000765696 0.0041274 Model RMSE RUNS RUNM AUTO MEAN VAR ----------------------------------------------(A) 1.45175 OK OK OK OK OK (B) 1.46217 OK OK OK OK OK (C) 1.47667 OK OK OK OK OK Validation Period Model MSE MAE MAPE ME MPE -----------------------------------------------------------------------(A) 0.757818 0.726546 0.280088 -0.200813 -0.0778831 (B) 0.856734 0.771561 0.297298 -0.038966 -0.0148876 (C) 0.882234 0.796109 0.306593 -0.014557 -0.00527448

Os tr modelos, ARIMA(2,1,0), ARIMA(0,2,1) e Linear Exponencial Smoothing (LES), apresentam resultados quase idnticos, mas o modelo ARIMA(2,1,0) com constante aparenta ser um pouco melhor que os outros. Baseado somente nestes trs resultados estatsticos, seria difcil escolher um entre os trs modelos apresentados. Entretano, se plotarmos a previso de longo prazo do modelo ARIMA(0,2,1) sem constante (que igual ao modelo LES), veremos uma significante diferena em comparao com o modelo anterior:

A previso possui uma tendncia com inclinao menor do que o modelo anterior, porque a tendncia local, situada perto do fim da srie, menor do que a tendncia mdia da srie inteira, mas os intervalos de confiana aumentam muito mais rpido. O modelo com duas ordens de diferena assume que a tendncia na srie varia com o tempo, por isso ele considera o futuro distante muito mais incerto do que o modelo com apenas uma ordem de diferenciao.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------20

Que modelo escolher?


Essa pergunta depende das premissas que estamos fazendo em relao ao comportamento da tendncia dos dados. O modelo com apena uma ordem de diferenciao assume uma tendncia mdia constante, essencialmente um ajuste fino do modelo de passeio aleatrio com crescimento, o que gera projees de tendncia relativamente conservadoras. Tambm muito otimista em relao a preciso das previses dos perodos posteriores. O modelo com duas ordens de difernciao assume uma tendncia local que varia com o tempo, essencialmente um modelo de suavizao exponencial linear, e suas projees de tendncia so mais volteis. Como regra geral deste tipo de situao, recomendvel escolher o modelo com menor ordem de diferenciao, tudo o mais permanencendo constante. Na prtica, passeios aleatrios ou modelos de suavizao exponencial simples frequentemente funcionam melhor do que modelos de suavizao exponencial linear (LES).

Modelos Combinados
Na maioria dos casos, o melhor modelo aquele que usa ou somente termos AR ou somente termos MA, apesar de que em alguns casos um modelo combinado com AR e MA possa resultar uma melhor adequao aos dados. No entanto, preciso cautela para misturar estes termos. possvel que um termo AR e uma termo MA venham a se cancelar, ainda que ambos paream estatisticamente significantes (julgados pela estatstica-t do modelo). Suponha que o modelo correto para uma srie temporal seja um ARIMA(0,1,1), mas ao invs disso, construiu-se um ARIMA(1,1,2), ou sjea, voc incluiu um termo AR e outro MA. Os termos adicionais aparecero como significativos no modelo, mas internamente eles podem estar meramente brigando entre si. O parmetro estimado pode parecer ambguo e o processo de estimao do parmetro pode levar vrias iteraes para convergir. Ento:

egra n 8: possvel que um termo AR e um termo MA cancele o efeito um do outro, ento se um modelo ARMA parece responder bem aos dados, tente tambm um modelo com um termo AR e um MA a menos, particularmente se a estimao dos parmetros do modelo original necessitar de mais de 10 iteraes para convergir.

Por essa razo, modelos ARMA no podem ser identificados por backward stepwise com ambos AR e MA. Em outras palavras, no possvel comear incluindo vrios termos de cada um, e ento eliminar aqueles termos cujos coeficientes no so significantes. Ao contrrio, normalmente segue-se o forward stepwise, adicionando termos de um ou de outro conforme indicado pelos grficos de ACF e PACF.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------21

RAZES UNITRIAS
Se uma srie est DEMASIADAMENTE sub- ou sobre-diferenciada, ou seja, se uma ordem de diferenciao inteira tem que ser adiconada ou retirada, isso frequentemente sinalizado por uma raiz unitria nos coeficientes estimados de AR ou MA do modelo. Um modelo AR(1) considerado como tendo uma raiz unitria se o coeficiente de AR(1) quase exatamente 1 (por quase extamente entenda-se por no significativamente diferente de, em termos do desvio padro do prprio coeficiente). Quando isso acontece, quer dizer que o termo AR(1) est precisamente imitando a primeira diferena, o que no caso significa que teremos que retirar o termo AR(1) e incluir uma ordem de diferena. Em modelos AR de maior ordem, a raiz unitria existe na parte AR se a soma dos coeficientes de AR for exatamente 1. Neste caso, deve-se reduzir a ordem de termos AR em 1 e adicionar outra ordem de diferena. Uma srie temporal com uma raiz unitria no estacionria.

egra n 9: Se houver raiz unitria na parte AR do modelo (soma dos coeficientes igual a 1), deve-se reduzir o nmero de termos AR em 1 e aumentar a ordem de diferenciao em 1.

Similarmente, um modelo MA(1) possui raiz unitria se o coeficiente estimado de MA(1) for exatamente 1. Quando isto acontecer, quer dizer que o termo MA(1) est exatamente cancelando primeira diferena, o que ento nos leva a remover o termo MA(1) e tambm remover uma ordem de diferenciao. Em um modelo MA de ordem mais elevada, a raiz unitria existe se a soma dos termos MA for exatamente igual a 1.

egra n 10: Se houver raiz unitria na parte MA do modelo, (soma dos coeficientes igual a 1), deve-se reduzir o nmero de termos MA em 1 e reduzir a ordem de diferenciao em 1.

Um modelo de previso com uma raiz unitria nos coeficientes estimados de MA so chamados no-inversveis, pelo fato de que os resduos do modelo no podem ser considerados como estimados do verdaderio rudo branco que gerou a srie temporal. Outro sintoma de uma raiz unitria que a previso do modelo explode ou se comporta de forma totalmente inesperada. Se a plotagem da previso de longo prazo do modelo parecer estranha, deve-se checar os coeficientes estimados para a presena de raiz unitria.

egra n 11: Se a previso parecer errtica ou instvel no longo prazo, pode haver raiz unitria nos coeficiente de AR ou MA.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------22

Mnimos Quadrados Lineares versus No-Lineares


Modelos ARIMA formados apenas termos AR so casos especiais de modelos de regresso linear, ento eles podem ser feitos por Mnimos Quadrados Ordinrios.

Previses AR so uma funo linear dos coeficientes assim como uma funo linear da informao passada; Em princpio, estimaes de mnimos quadrados dos coeficientes AR podem ser calculados exatamente por autocorr em uma nica iterao; Na prtica, possvel escrever um modelo AR num processo de regresso mltipla, basta regredir a diferena de Y contra suas defasagens. (Mas voc ir obter resultados um pouco diferentes dos do modelo ARIMA, veja abaixo);

Modelos ARIMA que incluem termos MA so similares modelos de regresso, mas no podem ser feitos por mnimos quadrados ordinrios:

As previses so uma funo linear dos valores passados, mas eles so funes no-lineares dos coeficientes, por exmeplo, um modelo ARIMA(0,1,1) sem constante uma mdia mvel ponderada exponencial: Y t=1[Y t1Y t22 Y t3...] ...em que as previses so funes no-lineares do parmetro MA(1) (theta).

Outro ponto de vista: no possvel escrever modelos MA usando regresses mltiplas ordinrias porque no existe maneira de especificar os erros como uma varivel independente, os erros no so conhecidos at o modelo ser feito. Eles precisam ser calculados sequencialmente, erodo por perodo, dado o atual parmetro estimado; Modelos MA, entretanto, necessitam de uma estimao de algoritmo no-linear, similar ao SOLVER do MS EXCEL; O algortimo usa um processo de busca que tipicamente necessita de 5 a 10 iteraes e pode no convergir; possvel ajustar o nvel de tolerncia para determinao de passos necessrios e critrio de parada da busca;

MDIA versus CONSTANTE


A mdia e a constante nos modelos ARIMA so nmeros diferentes sempre que o modelo incluir termos AR. Suponha um modelo ARIMA para Y em que p o nmero de termos autoregressivos. (Assuma que no h termos MA por convenincia) Se y denota a verso diferenciada (estacionria) de Y, ento a equao depreviso de y : y t = 1 y t12 y t2... p y t p

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------23 Este um modelo de regresso mltipla comum em que mu a constante, phi-1 o coeficiente da primeira defasagem de y, e assim por diante. Porm, internamente, os softwares economtricos convertem a forma inclinao-intercepto da regresso para a forma equivalente em termos de desvios em relao mdia. Seja m a mdia da srie estacionria y. Ento a equao autoregressiva de ordem p escrita em termos de desvios em relao mdia : y t m= 1 y t1m 2 y t2m... p y t pm Isolando os termos m da equao, vemos que ela igual constante, se: =m11 2... p O software estima m na verdade (junto com os outros parmetros) e o identifica com MDIA nos resultados do modelo, junto que seu desvio padroe estatstica-t, etc. A CONSTANTE (mu) ento calculada de acordo com a frmula acima. Se o modelo no contm nenhum termo AR, a mdia e a constante so idnticas. Num modelo que uma diferena no sazonal, a mdia o fator de tendncia (Mudana mdia de um perodo a outro). Num modelo com uma ordem de diferena SAZONAL, a mdia o fator de tendncia anual (Mudana mdia de um ano para outro).

Diferenciao Sazonal
A diferena sazonal de uma srie temporal uma diferenas de um perodo sazonal a outro. Para dados mensais, em que h 12 perodos em uma temporada, a diferena sazonal de Y no perodo t Y(t)-Y(t-12). Se a diferena sazonal de Y puro rudo (varincia constante, sem autocorrelao, etc.), ento Y descrita como um modelo de passeio aleatrio sazonal: cada valor um passo aleatrio alm do valor que ocorreu a exatamente um perodo sazonal atrs. Diferenas sazonais so uma forma grosseira de ajuste sazonal adicional: o ndice que subtrado de cada valor da srie temporal simplesmente o valor observado no memo perodo do ano anterior (p/ sries mensais). Diferenas sazonais, portanto, geralmente removem caractersticas mais grosserias de sazonalidade de uma srie, assim como a maioria da tendncia. Segue abaixo a plotagem dos dados da diferena sazonal da venda de carros deflacionada. Note que resta um pouco da tendncia da srie original, apesar de agora parecer um pouco mais como um passeio aleatrio do que apenas rudo.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------24

Primeira Diferena da Diferena Sazonal


No grfico abaixo, vemos que a primeira diferena da srie bem mais aleatria (ainda bastante sazonalizada), e a diferena sazonal est longe de ser estacionria (lembra mais um passeio aleatrio). Neste caso, parece que ambos os tipos de diferenciao so necessrios para render estacionariedade srie e capturar o padro de sazonalidade. A primeira diferena da diferena sazonal de uma srie mensal Y no perodo t igual a (Y(t)-Y(t-12)-Y(t-1)-Y(t-13)). Equivalente a (Y(t)-Y(t-1)-(Y(t-12)-Y(t-13)). Esta a poro pela qual a mudana do perodo anterior ao perodo atual diferente da mudana observada exatamente um ano atrs. Ento, por exmplo, a primeira diferena da diferena sazonal em setembro de 1995 igual a mudana de agosto a setembro em 1995 menos a mudana ocorrida em agosto a setembro de 1994. Se a primeira diferena da diferena sazonal de Y puro rudo, ento Y descrita por um modelo de tendncia sazonal aleatria.

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------25

Modelos de Passeio Aleatrio Sazonal


Se a diferena sazonal de uma srie temporal aparenta ser estacionria, isso sugere que o modelo de previso da mdia (constante) deve ser aplicada diferena sazonal. Para dados mensais, cujo perodo sazonal 12, a diferena sazonal no perodo t Y(t)-Y(t-12). Aplicando o modelo da mdia para esta srie, obtemos a equao: Y tY t12= ...em que alpha a mdia da diferena sazonal, isto , a tendncia mdia anual dos dados. Rearranjando os termos e isolando Y(t) esquerda, temos que: Y t=Y t12 Este modelo de previso chamado de modelo de passeio aleatrio sazonal, porque ele assume que cada valor sazonal forma um passeio aleatrio independente. Assim, o modelo assume que o valor de setembro deste ano um passo aleatrio frente do valor de setembro do ano NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------26 passado, o valor de outrubro deste ano um passo aleatrio frente do valor de outubro do ano passado, etc., e o valor mdio de cada passo igual a uma mesma constante (denotado por alpha): Y Set 96=Y Set 95 Y Out 96=Y Out 95 ...e assim por diante. Note que a previso para Set96 ignora todos os dados depois de Set 95, isto , baseada inteiramente no que aconteceu h exatamente um ano atrs. Um modelo de passeio aleatrio sazonal um caso especial de modelo ARIMA em que h uma ordem de diferenciao sazonal, um termo constante, e nenhum outro parmetro, i.e., um modelo ARIMA(0,0,0)x(0,1,0) com constante. A diferena sazonal dos dados de venda de automveis deflacionada no parece nem um pouco com um rudo estacionrio: ao contrrio, ela bem correlacionada. Se escrevermos um modelo de passeio aleatrio sazonal mesmo assim, obtemos a seguinte previso:

A caracterstica distinta da previso deste modelo que futuros ciclos sazonais so previstos como tendo exatamente a mesma forma do ciclo sazonal mais recente, e o ciclo na previso igual tendncia mdia calculada sobre todos os valores da srie. Olhando com mais ateno, notamos que este modelo no responde muito rpido mudanas cclicas nos dados: ele est sempre olhando para exatamente um ano atrs e assumindo que a tendncia corrente igual tendncia mdia, ento quando a tendncia entra num ciclo positivo ou negativo, a previso pode errar muito apontando em uma mesma direo por muito tempo. Logo, os erros da previso de um passo frente tipicamente mostram autocorrelao positiva. No entanto, as previses de longo prazo longe do fim da amostra aparentam ser razoveis na medida que eles assumem que a tendncia mdia do passado ir eventualmente prevalecer novamente no futuro. Outra caracterstica peculiar do modelo de passeio aleatrio sazonal que ele relativamente estvel na presena de alteraes nos valores. De fato, ele no nota as mudanas por 12 meses. Por exemplo, o grfico anterior mostra previses de longo prazo feitas com origem em NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------27 novembro de 1991, no final de um ciclo negativo. A alguns meses depois, os valores comeam a ter uma tendncia de alta, mas a previso de longo prazo gerada pelo modelo de passeio aleatrio sazonal bastante parecido com o anterior (o perodo de previso foi jogado para frente):

A autocorrelao positiva dos erros do modelo podem ser reduzidos adicionando um termo AR(1) equao de previso. Gerando um ARIMA(1,0,0)x(0,1,0) com constante. Sua performance com a srie de automveis esta:

H uma melhora na resposta conta pontos de inflexo dos ciclos. O desvio padro dos erros de previso so apenas 2,05, contra 2,98 para o modelo de passeio aleatrio sazonal sem o termo AR(1).

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------28

Modelo de Tendncia Aleatria Sazonal


Muitas vezes, uma srie temporal que tem um padro sazonal muito marcante no satisfatriamente estacionria depois de uma diferena sazonal. Por exemplo, a diferena sazonal doa srie de venda de automveis parece mais um passeio aleatrio do que rido estacionrio. No entanto, se olharmos para a primeira diferena da diferena sazonal da srie, vemos um padro que parece mais ou menos com rudo estacionrio com mdia igual a zero:

(mesmo se a mdia da srie duplamente diferenciada no extamaente zero, normalmente assume-se que igual a zero por motivos de previso: pois do contrrio, assumiramos uma tendncia na tendncia, o que pode ser um pouco arriscado de extrapolar. Para dados mensais, cujo perodo sazonal giaul a 12, a primeira diferena da diferena saznal no perodo t (Y(t)-Y(t-12))-(Y(t-1)-Y(t-13)). Aplicando o modelo de previso com mdia igual a zero esta srie, temos: Y t Y t12Y t1Y t13=0 Rearranjando os termos e isolando Y(t), temos: Y t=Y t1Y t12Y t13 Este tipo de modelo de previso chamado de Modelo de Tendncia Aleatria Sazonal, porque assume que a tendncia sazonal (diferena) observada este ms um passo frente da tendncia observada no ms passado, onde os passos assumem ter mdia igual a zero. Em outras palavras, a diferena sazonal esperada neste ms a mesma que a diferena sazonal observada no ms passado. Comparando este comportamento com o do modelo de passeio aleatrio sazonal: este modelo assume que os valores esperados de todas as futura difernas sazonais so iguais diferena sazonal mdia, calculada sobre toda a srie de dados. Em contraste, NO REPRODUZIR NO REPRODUZIR NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------29 o modelo de tendncia aleatria sazonal assume que os valores esperados de todas as diferenas sazonais futuras so iguais diferena sazonal observada mais recente. Ainda mais, o modelo de tendncia aleatria sazonal assume que as diferenas sazonais observadas apresentam um passeio aleatrio sem crescimento, ao invs de flutuar ao redor de uma constante mdia, ento seus valores sero muito incertos no futuro distante. Ambos os modelos de passeio aleatrio sazonal e o de tendncia aleatria sazonal prevem que o ciclo sazonal do prximo ano ter exatamente a mesma forma (a mesma variao mensal relativa) do ano presente. A diferena entre eles a prjeo da tendncia: o modelo de passeio aleatrio sazonal assume que a tendncia futura igual tendncia mdia anual observada anteriormente, enquanto que o modelo de tendncia aleatria sazonal assume que a tendncia futura igual tendncia anual mais recente. O modelo de tendncia aleatria sazonal um caso especial de modelo ARIMA, em que usado uma ordem de diferenciao no sazonal, uma ordem de diferenciao sazonal, e nenhuma constante ou outros parmetros, isto , um ARIMA (0,1,0)x(0,1,0). Se aplicarmos o modelo de tendncia aleatria sazonal srie de automveis, obtemos:

Note que as previses um passo frente respondem bem rpido mudanas cclicas, diferente dos resultados obtidos com o modelo de passeio aleatrio sazonal. As previses para ciclos sazonais futuros tm o mesmo formato do ltimo ciclo sazonal observado. Entretano, as previes de longo prazo caminham com uma tendncia de queda observada no perodo de nvembro de 90 a novembro de 91. Os limites de confiana para as previses de longo prazo tambm divergem muito rapdo por causa da premissa que a tendncia futura apresentar variao aleatria. Se recalcularmos as previses usando dados a partir de janeiro de 1992, vemos uma figura diferente na tendncia de longo prazo:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------30

A tendncia positiva entre janeiro de 1991 e janeiro de 1992 agora faz com que a previso de longo prazo aponte para cima. Assim, vemos que o modelo de tendncia sazonal muito mais sensvel a mudanas repentinas nos dados do que o modelo de passeio aleatrio sazonal. Essa afirmao no causa grandes complicaes nas previses de curto prazo, mas gera grande incerteza nas previses de longo prazo. Talvez seja melhor suavizar o padro sazonal e/ou a tendncia de longo prazo nas projees. possvel suavizar a tendncia esimada adicionando um termo MA(1), e tambm suavizar o padro sazonal adicionando um termo SMA(1). Adicionando ambos os termos juntos resultar num modelo ARIMA (0,1,1)x(0,1,1), que provavelmente o modelo ARIMA para sries sazonais mais usado. (O termo MA(1) adiciona um mltiplo do erro de previso do ms anterior no lado direito da equai, enquanto que o SMA(1) adiciona um mltiplo do erro de previso de 12 meses atrs, e escrevendo ambos juntos adiciona um mltiplo do erro de 13 meses atrs.O modelo resultante um tipo de suavizao exponencial linear sazonal). As previses geradas por este modelo com origem em novembro de 1991 mostram um padro sazonal mais suave, uma tendncia estimada mais conservadora, e intervalos de confiana mais estreitos:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------31 As observaes anteriores so confirmadas no relatrio de comparao entre os modelos de previso de (a) passeio aleatrio sazonal, (b) tendncia aleatria sazonal, e (c) um modelo ARIMA mais elaborado. O modelo de tendncia aleatria sazonal saiu-se melhor que o modelo de passeio aleatrio nos preodos de estimao e validao (isto , para todas as projees um passo a diante), e o modelo ARIMA mais elaborado mostrou-se mais adequado que os anteriores.
Model Comparison ---------------Data variable: AUTOSALE/CPI Number of observations = 263 Start index = 1/70 Sampling interval = 1.0 month(s) Length of seasonality = 12 Number of periods withheld for validation: 24 Models -----(A) ARIMA(0,0,0)x(0,1,0)12 with constant (B) ARIMA(1,0,0)x(0,1,0)12 with constant (C) ARIMA(0,1,0)x(0,1,0)12 (D) ARIMA(0,1,1)x(0,1,1)12

<--Seasonal random walk <-- ...with AR=1 <--Seasonal random trend <-- ...with MA=1 and SMA=1

Estimation Period Model MSE MAE MAPE ME MPE -----------------------------------------------------------------------(A) 8.85824 2.28831 9.41851 0.0188148 -0.706667 (B) 4.20197 1.45045 5.70019 0.00586504 -0.265589 (C) 4.84114 1.5869 6.19928 -0.00721427 -0.1331 (D) 2.81782 1.25272 4.92789 0.0120522 -0.21509 Model RMSE RUNS RUNM AUTO MEAN VAR ----------------------------------------------(A) 2.97628 *** *** *** OK OK (B) 2.04987 OK * *** OK *** (C) 2.20026 OK * *** OK *** (D) 1.67864 OK OK OK OK *** Validation Period Model MSE MAE MAPE ME MPE -----------------------------------------------------------------------(A) 11.2222 3.01909 10.2064 -2.93276 -9.9272 (B) 4.09013 1.67456 5.70802 -0.800644 -2.77393 (C) 4.47723 1.60335 5.48813 -0.0117734 -0.127019 (D) 1.85595 1.01423 3.47177 -0.354179 -1.36136 Key: RMSE = Root Mean Squared Error RUNS = Test for excessive runs up and down RUNM = Test for excessive runs above and below median AUTO = Box-Pierce test for excessive autocorrelation MEAN = Test for difference in mean 1st half to 2nd half VAR = Test for difference in variance 1st half to 2nd half OK = not significant (p >= 0.10) * = marginally significant (0.05 < p <= 0.10) ** = significant (0.01 < p <= 0.05) *** = highly significant (p <= 0.01)

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------32

Modelos ARIMA sazonais


Caractersticas dos modelos ARIMA sazonais:

A parte sazonal do modelo ARIMA possui a mesma estrutura que a parte no sazonal: ele pode conter um fator AR, um fator MA, e/ou uma ordem de diferenciao. Na parte sazonal do modelo, todos esses fatores operam sobre mltiplas defasagens de s (n de perodos em uma estao); Um modelo ARIMA sazonal classificado como ARIMA(p,d,q)x(P,D,Q), onde P = n de termos autoregressivos sazonais (SAR), D = n de diferenciaes sazonais, Q = n de mdias mveis sazonais (SMA); Ao identificar um modelo sazonal, o primeiro passo determinar se preciso ou no tirar a diferena sazonal da srie, junto com ou ao invs de uma diferenciao no sazonal. Deve-se observar o grfico de ACF e PACF para todas as possveis combinaes de 0 ou 1 diferena no sazonal e 0 ou 1 diferena sazonal. ATENO: nunca utilize mais do que uma diferena sazonal , nem mais do que duas diferenas no total (sazonal e no sazonal combinadas). Se o padro sazonal marcante E estvel atravs do tempo, ento provavelmente uma diferena sazonal recomendada indiferentemente de voc estar utilzando uma diferena no sazonal, j que isso previne que o padro sazonal desaparece de suas projees futuras;

egra n 12: Se a srie possui um padro sazonal muito forte e consistente, deve-se utilizar uma ordem de diferenciao sazonal, mas nunca utilizar mais que uma ordem de diferenciao sazonal, ou mais do que duas ordens de diferenciao quaisquer (sazonal + no sazonal).

O indcio de um comportamento de puro SAR ou SMA similar ao trao de puro AR ou puro MA, exceto que o padro aparece depois de algumas defasagens s na ACF e na PACF; Por exemplo, um processo de SAR(1) puro apresenta picos na ACF nas defasagens s, 2s, 3s, etc., enquanto que a PACF interrompe-se depois de s; Analogamente, um processo de SMA(1) puro apresenta picos na PACF nas defasagens s, 2s, 3s, etc., enquanto que a ACF interrompe-se depois da defasagem s; Um trao de SAR geralmente ocorre quando a autocorrelao no perodo sazonal positiva, enquanto que o trao de SMA geralmente ocorre quando a autocorrelao sazonal negativa, assim:

egra n 13: Se a autocorrelao no perodo sazonal positiva, considere adicionar um termo SAR ao modelo. Se a autocorrelao no perodo sazonal for negativa, considere adicionar um termo SMA ao modelo. No misture termos SAR e SMA no mesmo modelo, e evite usar mais de um de cada;

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------33

Geralmente, um termo SAR(1) ou SMA(1) suficiente. Raramente uma srie necessitar de um processo SAR(2) ou SMA(2), e ainda mais que tais diferenciaes necessitariam de dados suficientes para serem estimados; Ainda que um modelo ARIMA sazonal parece ter apenas alguns parmetros, lembre-se que previses para trs requerem que a estimao de uma ou duas estaes passadas para incializar o processo. Assim, necessrio ter umas 4 ou 5 estaes de dados para estimar um modelo ARIMA sazonal; Provavelmente, o modelo ARIMA sazonal mais comum o modelo (0,1,1)x(0,1,1), que essencialmente um modelo de suavizao exponencial sazonal; Quando modelos ARIMA sazonais so feitos em cima de valores em LOG, eles so capazes de identificar um padro sazonal multiplicativo;

EXEMPLO: Srie de Automveis revisto Lembre-se que a projeo feita anteriormente para esta srie de venda de veculos, utilizouse uma combinao de deflacionamento, ajuste sazonal e suavizao exponencial. Vamos tentar desenvolver um modelo ARIMA sazonal para ela. Segue abaixo o grfico da srie e o ACF/PACF, cujos resultados foram obetidos pelo modelo ARIMA(0,0,0) com constante:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------34

O padro estilo ponte pnsil na ACF tpico de uma srie que no estacionria e fortemente sazonal. Obviamente, precisamos de ao menos uma ordem de difernciao. Se tirarmos a primeira diferena no sazonal, obtemos como resultado:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------35

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------36

A srie diferenciada (os resduos de um modelo de passeio aleatrio) parece mais ou menos estacionria, mas ainda h uma forte autocorrelao sazonal (lag-12). Dado que o padro sazonal forte e estvel, sabemos (regra 12) que devemos usar uma ordem de diferenciao sazonal no modelo. Abaixo temos o resultado de uma diferenciao sazonal (somente):

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------37

A srie com diferena sazonal apresenta um padro bastante evidente de autocorrelao positiva, como podemos lembrar da tentativa de modelar um passeio aleatrio sazonal. Isso pode ser um indcio para o uso de um termo AR, ou ainda sinalizar a necessidade de uma egunda diferenciao. Se tirarmos a diferena sazonal e no sazonal ao mesmo tempo, obtemos:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------38

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------39

Estes so os resduos do modelo de tendncia aleatria sazonal que fizmos antes. Vemos agora os sinais da sobre-diferenciao: os picos positivos na ACF e na PACF tornaram-se negativos. Qual a ordem correta de diferenciao? Mais um pouco de informao que pode ser til o clculo da varincia da srie a cada nvel de diferenciao. Este somente o resultado de MSE resultante dos vrios modelos ARIM s com diferenciao:

Model Comparison ---------------Data variable: AUTOSALE/CPI Number of observations = 281 Start index = 1/70 Sampling interval = 1.0 month(s) Length of seasonality = 12 Number of periods withheld for validation: 48 Models -----(A) ARIMA(0,0,0) with constant (B) ARIMA(0,1,0) with constant (C) ARIMA(0,0,0)x(0,1,0)12 with constant (D) ARIMA(0,1,0)x(0,1,0)12 with constant Estimation Period Model MSE MAE MAPE ME MPE -----------------------------------------------------------------------(A) 26.2264 4.16826 17.1422 -0.00725956 -4.18066 (B) 5.67387 1.79003 7.13332 0.007303 -0.413321 (C) 9.02848 2.30545 9.54065 0.0144368 -0.752748 (D) 4.9044 1.59 6.25023 -0.00265268 -0.120404

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------40

Observamos que o menor MSE obtido atravs do modelo (D) que usa uma diferena de cada tipo. Assim, junto com a aparncia dos grficos acima, sugere que devemos usar ambas as diferenciaes sazonal e no sazonal. Note que, exceto pelo termo constante, o modelo (D) um modelo de tendncia aleatria sazonal, enquanto o modelo (B) um modelo de passeio aleatrio sazonal. Como apresentado anteriormente, o modelo de tendncia mostrou-se mais eficaz do que o de passeio aleatrio. Na anlise que se segue, tentaremos melhorar estes modelos atravs da adiode termos sazonais ARIMA. O Modelo ARIMA(0,1,1)x(0,1,1): Tendncia Aleatria Sazonal com termos MA(1) e SMA(1) Retornando ao conjunto de grficos acima, observe que com uma ordem de diferenciao de cada tipo existe um pico negativo no lag-1 e no lag-12 da ACF, enquanto que a PACF apresenta uma diminuio gradual nessas duas defasagens. Aplicando as regras para identificao de modelos ARIMA (regras 7 e 13), conclumos que o modelo de tendncia aleatria sazonal seria aprimorado pela adio de um termo MA(1) e um termo SMA(1). Pela regra n 5, exclumos a constante j que duas ordens de diferenciao esto sendo usadas. Se fizrmos isso, obteremos o modelo muito comumente usado na prtica, o ARIMA(0,1,1)x(0,1,1), cujos resduos esto abaixo:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------41

Apesar de restar uma pequena poro de autocorrelao na 12 defasagem, a plotagem como um todo est boa. Os resultados do modelo mostram que os coeficientes de MA(1) e SMA(1) estimados so significantes:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------42


Forecast Summary ---------------Nonseasonal differencing of order: 1 Seasonal differencing of order: 1 Forecast model selected: ARIMA(0,1,1)x(0,1,1)12 Number of forecasts generated: 24 Number of periods withheld for validation: 48 Estimation Validation Statistic Period Period -------------------------------------------MSE 2.77303 1.83711 MAE 1.23574 1.05651 MAPE 4.89559 3.47061 ME 0.00985809 -0.135525 MPE -0.246026 -0.614371 ARIMA Model Summary Parameter Estimate Stnd. Error t P-value ---------------------------------------------------------------------------MA(1) 0.479676 0.0591557 8.1087 0.000000 SMA(1) 0.906532 0.0267735 33.8593 0.000000 ---------------------------------------------------------------------------Backforecasting: yes Estimated white noise variance = 2.85055 with 266 degrees of freedom Estimated white noise standard deviation = 1.68836 Number of iterations: 7

O modelo ARIMA(0,1,1)x(0,1,1) basicamente um modelo de tendncia aleatria sazonal com um ajuste fino atravs da adio de termos MA(1) e SMA(1) para corrigir uma pequena sobrediferenciao obrtida aps duas ordens de diferenciao, estes termos consideram o padro sazonal e a tendncia local do fim da srie, mas eles so um pouco mais suaves, uma vez que ambos o padro sazonal e a tendncia esto sendo calculados como mdias (numa suavizao exponencial) das ltimas temporadas:

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR

VICTOR HASELMANN ARAKAWA-----------------------------------------------------------------------43

De fato, o valor do coeficiente de SMA(1) prximo de 1,0 sugere que muitas temporadas esto incorporadas na mdia para estimar o padro sazonal (Lembre-se que o coeficiente de MA(1) corresponde 1-alpha num modelo de suavizao exponencial, e que um coeficiente de MA(1) muito alto significa um alpha pequeno, ou seja, uma mdia com muitos dados de tempo est sendo considerada. O coeficiente de SMA(1) corresponde a 1- um coeficiente de suavizao sazonal, e um coeficiente de SMA(1) alto sugere uma mdia grande em unidades de estaes do dos dados). Um valor pequeno de MA(1) sugere que a suavizao usada para estimar o nvel e tendncia loca relativamente pequena, isto , s os ltimos meses esto sendo usados para este propsito. O modelo de previso pode ser escrito assim: Y t=Y t12Y t1Y t13 et1e t 12 e t 13

NO REPRODUZIR

NO REPRODUZIR

NO REPRODUZIR