You are on page 1of 115

ANALISE DE SERIES TEMPORAIS

RICARDO S. EHLERS

Primeira publicaao 2003 c Segunda ediao publicada em 2004 c Terceira ediao publicada em 2005 c Quarta ediao publicada em 2007 c RICARDO SANDES EHLERS 2003-2007

Sumrio a
1 Introduo ca 2 Tcnicas Descritivas e 2.1 Decomposiao Clssica . c a 2.2 Sries com Tendncia . . e e 2.3 Sries Sazonais . . . . . e 2.4 Autocorrelaao . . . . . c 2.4.1 O Correlograma 1 6 6 6 11 11 13 18 18 19 20 20 20 21 22 24 29 30 33 34 35 39 40 41 43 43 44 52 52 52

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

. . . . .

3 Modelos Probabil sticos 3.1 Introduao . . . . . . . . . . . . . c 3.2 Processos Estacionrios . . . . . . a 3.3 A Funao de Autocorrelaao . . . . c c 3.4 Alguns Processos Estocsticos . . . a 3.4.1 Sequncia Aleatria . . . . e o 3.4.2 Passeio Aleatrio . . . . . . o 3.4.3 Processos de Mdia Mveis e o 3.4.4 Processos Autoregressivos . 3.4.5 Modelos Mistos ARMA . . 3.4.6 Modelos ARMA Integrados

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

. . . . . . . . . .

4 Estimao ca 4.1 Autocovarincia e autocorrelaao . . a c 4.2 Ajustando Processos Autoregressivos 4.3 Ajustando Processos Mdias Mveis e o 4.4 Ajustando Processos ARMA . . . . . 4.5 Modelos Sazonais . . . . . . . . . . . 4.6 Adequaao do Modelo . . . . . . . . c 4.6.1 Anlise dos Res a duos . . . . . 4.6.2 Testes sobre os res duos . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

. . . . . . . .

5 Previso a 5.1 Mtodos Univariados de Previso . . . . . . . . . . . . . . . . . . . . . e a 5.1.1 Alisamento Exponencial Simples . . . . . . . . . . . . . . . . . i

ii 5.1.2 Mtodo de Holt-Winters . . . e Previso em Modelos ARMA . . . . a Performance Preditiva . . . . . . . . Critrios de Informaao . . . . . . . e c Previses Usando Todos os Modelos o Previso Bayesiana . . . . . . . . . . a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

SUMARIO . . . . . . . . . . . . . . . . . . . . . . . . 56 58 62 64 67 68 73 73 74 80 81 82 83 86 86 88 89 91 94 95 95 96 96 97 98 99 105 105 105 106 106 106 106 107 107 107 108 108 108 108

5.2 5.3 5.4 5.5 5.6

6 Modelando a Varincia a 6.1 Introduao . . . . . . . c 6.2 Modelos ARCH . . . . . 6.3 Modelos GARCH . . . . 6.3.1 Estimaao . . . . c 6.3.2 Adequaao . . . c 6.4 Volatilidade Estocstica a

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

. . . . . .

7 Modelos Lineares Dinmicos a 7.1 Introduao . . . . . . . . . . . . . . . . . . . . . c 7.2 Modelos Polinomiais . . . . . . . . . . . . . . . . 7.2.1 Anlise Sequencial e Previses . . . . . . a o 7.2.2 Varincias de Evoluao e das Observaoes a c c 7.3 Modelo de Crescimento Linear . . . . . . . . . . 7.4 Modelos Sazonais . . . . . . . . . . . . . . . . . . 7.4.1 Modelos sem Crescimento . . . . . . . . . 7.4.2 Modelos com Crescimento . . . . . . . . . 7.5 Representaao de Fourier . . . . . . . . . . . . . c 7.6 Ilustraao . . . . . . . . . . . . . . . . . . . . . . c 7.7 Modelos de Regresso . . . . . . . . . . . . . . . a 7.8 Monitoramento . . . . . . . . . . . . . . . . . . . A Lista de Distribuioes c A.1 Distribuiao Normal . . . . . . c A.2 Distribuiao Gama . . . . . . . c A.3 Distribuiao Wishart . . . . . . c A.4 Distribuiao Gama Inversa . . . c A.5 Distribuiao Wishart Invertida c A.6 Distribuiao Beta . . . . . . . . c A.7 Distribuiao de Dirichlet . . . . c A.8 Distribuiao t de Student . . . c A.9 Distribuiao F de Fisher . . . . c A.10 Distribuiao Binomial . . . . . c A.11 Distribuiao Multinomial . . . c A.12 Distribuiao de Poisson . . . . c A.13 Distribuiao Binomial Negativa c

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

. . . . . . . . . . . . .

SUMARIO References

iii 110

Cap tulo 1

Introduo ca
Uma srie temporal uma coleao de observaoes feitas sequencialmente ao longo do e e c c tempo. A caracter stica mais importante deste tipo de dados que as observaoes vizie c nhas so dependentes e estamos interessados em analisar e modelar esta dependncia. a e Enquanto em modelos de regresso por exemplo a ordem das observaoes irrelevante a c e para a anlise, em sries temporais a ordem dos dados crucial. Vale notar tambm a e e e que o tempo pode ser substituido por outra varivel como espao, profundidade, etc. a c Como a maior parte dos procedimentos estat sticos foi desenvolvida para analisar observaoes independentes o estudo de sries temporais requer o uso de tcnicas espec e e c cas. Dados de sries temporais surgem em vrios campos do conhecimento como e a Economia (preos dirios de aoes, taxa mensal de desemprego, produao industrial), c a c c Medicina (eletrocardiograma, eletroencefalograma), Epidemiologia (nmero mensal u de novos casos de meningite), Meteorologia (precipitaao pluviomtrica, temperatura c e diria, velocidade do vento), etc. a Algumas caracter sticas so particulares a este tipo de dados, por exemplo, a Observaoes correlacionadas so mais dif c a ceis de analisar e requerem tcnicas e espec cas. Precisamos levar em conta a ordem temporal das observaoes. c Fatores complicadores como presena de tendncias e variaao sazonal ou c c e c clica podem ser dif ceis de estimar ou remover. A seleao de modelos pode ser bastante complicada, e as ferramentas podem ser c de dif interpretaao. cil c E mais dif de lidar com observaoes perdidas e dados discrepantes devido ` cil c a natureza sequencial.

Terminologia
Uma srie temporal dita ser cont e e nua quando as observaoes so feitas continuamente c a no tempo. Denindo o conjunto T = {t : t1 < t < t2 } a srie temporal ser denotada e a 1

CAP ITULO 1. INTRODUCAO

por {X(t) : t T }. Uma srie temporal dita ser discreta quando as observaoes e e c so feitas em tempos espec a cos, geralmente equiespaados. Denindo o conjunto c T = {t1 , . . . , tn } a srie temporal ser denotada por {Xt : t T }. Por simplicidade e a podemos fazer T = {1, 2, . . . , n}. Note que estes termos no se referem ` varivel observada X, esta pode assumir a a a valores discretos ou cont nuos. Em muitas situaoes X pode ser discreta por deniao c c (e.g. o nmero de casos noticados de AIDS) porm para efeito de anlise estat u e a stica pode ser tratada como continua se os seus valores observados no forem muito a pequenos.

Por outro lado, sries temporais discretas podem surgir de vrias formas. Sries e a e cont nuas podem ser discretizadas, i.e. seus valores so registrados a certos intervalos a de tempo. Sries de valores agregados ou acumulados em intervalos de tempo, por e exemplo exportaoes medidas mensalmente ou quantidade de chuva medida diariac mente. Finalmente, algumas sries so inerentemente discretas, por exemplo dividene a dos pagos por uma empresa aos seus acionistas em anos sucessivos. Uma srie temporal tambm pode ser multivariada. Se k variveis so observadas e e a a a cada tempo (por exemplo discreto) denota-se por {X1t , . . . , Xkt , t T }. Neste caso vrias sries correlacionadas devem ser analisadas conjuntamente, ou seja em cada a e tempo tem-se um vetor de observaoes. c

Objetivos
Em algumas situaoes o objetivo pode ser fazer previses de valores futuros enquanto c o em outras a estrutura da srie ou sua relaao com outras sries pode ser o interesse e c e principal. De um modo geral, os principais objetivos em se estudar sries temporais e podem ser os seguintes, Descriao. Descrever propriedades da srie, e.g. o padro de tendncia, existnc e a e e cia de variaao sazonal ou c c clica, observaoes discrepantes (outliers), alteraoes c c estruturais (e.g. mudanas no padro da tendncia ou da sazonalidade), etc. c a e Explicaao. Usar a variaao em uma srie para explicar a variaao em outra c c e c srie. e Prediao: predizer valores futuros com base em valores passados. Aqui assumec se que o futuro envolve incerteza, ou seja as previses no so perfeitas. Porm o a a e devemos tentar reduzir os erros de previso. a Controle. Os valores da srie temporal medem a qualidade de um processo e de manufatura e o objetivo o controle do processo. Um exemplo o controle e e estat stico de qualidade aonde as observaoes so representadas em cartas de c a controle. Este tpico no ser abordado nestas notas de aula. o a a

Abordagens
Tcnicas Descritivas. Tcnicas grcos, identicao de padres, etc. e e a ca o Modelos Probabil sticos. Seleao, comparaao e adequaao de modelos, estimac c c cao, prediao. Ferramenta bsica a funao de autocorrelaao. c a e c c Anlise espectral. a Mtodos no paramtricos (alisamento ou suavizaao). e a e c Outras Abordagens. Modelos de espao de estados, modelos no lineares, sries c a e multivariadas, estudos longitudinais, processos de longa dependncia, modelos e para volatilidade, etc.

Sazonalidade
Muitas sries temporais exibem um comportamento que tende a se repetir a cada s e per odos de tempo. Por exemplo, natural esperar que as vendas mensais de brinquee dos tero um pico no ms de dezembro e talvez um pico secundrio em outubro. Este a e a padro possivelmente se repetir ao longo de vrios anos. Vejamos alguns poss a a a veis modelos sazonais, 1. Sazonalidade deterministica. Variveis dummies (binrias). O coeciente de a a cada varivel dummy representa o fator sazonal do respectivo ms, trimestre, a e etc. 2. Funoes trigonomtricas. c e 3. Sazonalidade estocstica: a (a) Varivel endgena com defasagem sazonal no modelo (modelos ARMA a o peridicos), o (b) modelo ARMA sazonal.

Tipos de Sazonalidade
Aditiva. A srie apresenta utuaoes sazonais mais ou menos constantes no e c a importando o n global da srie. vel e Multiplicativa. O tamanho das utuaoes sazonais varia dependendo do n c vel global da srie. e No exemplo dos brinquedos, suponha que o aumento esperado nas vendas nos meses de dezembro de 1 milho de reais em relaao ` mdia anual. Ento as e a c a e a previses para os meses de dezembro dos prximos anos deve somar a quantia de 1 o o milho de reais ` uma mdia anual para levar em conta esta utuaao sazonal. Isto a a e c o que se chama de sazonalidade aditiva. e

CAP ITULO 1. INTRODUCAO

Suponha agora que o aumento esperado nos meses de dezembro seja de 30%. Ento o aumento esperado (em valor absoluto) de vendas em dezembro ser pequeno a a ou grande dependendo da mdia anual de vendas ser baixa ou alta. Nas previses e o para os prximos meses de dezembro deve-se multiplicar a mdia anual pelo fator 1,3. o e Isto o que se chama de sazonalidade multiplicativa. e

Tendncia e
Globalmente, uma srie pode exibir tendncia de crescimento (ou decrescimento) com e e vrios poss a veis padres. o Crescimento linear. Por exemplo, a cada ano o aumento esperado nas vendas de um certo brinquedo de 1 milho de reais. e a Crescimento exponencial. Por exemplo, a cada ano as vendas de um certo brinquedo aumentam de um fator 1,3. Crescimento amortecido. Por exemplo, as vendas de um certo brinquedo tem uma aumento esperado de 70% sobre o ano anterior. Se o aumento esperado for de 1 milho de reais no primeiro ano, no segundo ano ser de 700 mil reais, no a a terceiro ano ser de 490 mil reais e assim por diante. a

Exemplos de Sries Temporais e


Como primeira ilustraao so apresentadas na Figura 1.1 quatro sries temporais c a e dispon veis no pacote R. Nos eixos horizontais aparecem os anos de observaao e nos c eixos verticais os nomes das sries (mesmos nomes do R). A Figura 1.1a mostra totais e mensais de passageiros em linhas areas internacionais nos EUA entre 1949 e 1960. e Existe uma clara tendncia de crescimento bem como um padro sazonal ao longo e a dos anos. A Figura 1.1b mostra a srie com o nmero anual de linces capturados em e u armadilhas entre 1821 e 1934 no Canad. Existe um padro c a a clico em torno de 10 ou 11 anos. A Figura 1.1c mostra a srie com as medioes anuais de vazes do Rio Nilo e c o em Ashwan entre 1871 e 1970. Parece haver alguma alteraao estrutural em torno do c ano de 1900. Finalmente a Figura 1.1d mostra a srie trimestral do consumo de gs no e a Reino Unido entre o primeiro trimestre de 1960 e o quarto trimestre de 1986. H uma a tendncia de crescimento porm a amplitude do padro sazonal aumenta bastante a e e a partir de 1971.

Exerc cios
1. Classique as seguintes sries temporais quanto ao tempo e quanto a varivel e a observada. (a) Registros de mar durante 1 dia. e (b) Medidas de temperatura em uma estaao meteorolgica. c o

AirPassengers

500

300

lynx 1950 1954 1958 0 1820 2000

100

5000

1860

1900

1400

1000

UKgas 1880 1920 1960

Nile

600

200 1960

600

1000

1970

1980

Figura 1.1: (a) Totais mensais de passageiros em linhas areas internacionais nos EUA e entre 1949 e 1960, (b) nmero anual de linces capturados em armadilhas entre 1821 u e 1934 no Canad, (c) medioes anuais de vazes do Rio Nilo em Ashwan entre 1871 a c o e 1970, (d) consumo de gs no Reino Unido entre o primeiro trimestre de 1960 e o a quarto trimestre de 1986. (c) O ndice dirio da bolsa de valores de So Paulo. a a (d) A inaao mensal medida pelo c ndice de preos ao consumidor. c (e) Variaao diria de um determinado c a ndice nanceiro, 1 para variaao poc sitiva, -1 para variaao negativa ou zero se no ocorreu variaao. c a c (f) Nmero mensal de novos casos de Dengue em uma determinada regio. u a 2. D exemplos de sries temporais continuas que poderiam ser discretizadas (e de e e que forma).

Cap tulo 2

Tcnicas Descritivas e
Ao se analisar uma ou mais sries temporais a representao grca dos dados see ca a quencialmente ao longo do tempo fundamental e pode revelar padres de comportae o mento importantes. Tendncias de crescimento (ou decrescimento), padres c e o clicos, alteraoes estruturais, observaoes aberrantes, etc. so muitas vezes facilmente idenc c a ticados. Sendo assim, o grco temporal deve ser sempre o primeiro passo e antecede a qualquer anlise. Outras ferramentas sero descritas ao longo deste cap a a tulo.

2.1

Decomposio Clssica ca a

Muitas das propriedades observadas em uma srie temporal Xt podem ser captadas e assumindo-se a seguinte forma de decomposiao c Xt = Tt + Ct + Rt onde Tt uma componente de tendncia, Ct uma componente c e e e clica ou sazonal e Rt uma componente aleatria ou ru (a parte no explicada, que espera-se ser e o do a puramente aleatria). A componente c o clica se repete a cada intervalo xo s, i.e. = Ct2s = Cts = Ct = Ct+s = Ct+2s = . . . . Assim, variaoes peridicas podem ser captadas por esta componente. c o

2.2

Sries com Tendncia e e

No existe uma deniao precisa de tendncia e diferentes autores usam este termo de a c e diferentes formas. Podemos pensar em tendncia como uma mudana de longo prazo e c no n mdio da srie. A diculdade aqui denir longo prazo. vel e e e A forma mais simples de tendncia e e Xt = + t + t (2.1)

onde e so constantes a serem estimadas e t denota um erro aleatrio com mdia a o e zero. O n mdio da srie no tempo t dado por mt = + t que algumas vezes vel e e e e 6

2.2. SERIES COM TENDENCIA

chamado de termo de tendncia. Porm alguns autores preferem chamar a inclinaao e e c de tendncia, ou seja a mudana no n e c vel da srie por unidade de tempo j que e a = mt mt1 . Note que a tendncia na equaao (2.1) uma funao determin e c e c stica do tempo e algumas vezes chamada de tendncia global (i.e. vale para toda a srie), e e e em oposiao a tendncia local. c e De um modo geral, uma forma de se lidar com dados no sazonais que contenham a uma tendncia consiste em ajustar uma funao polinomial, e c Xt = 0 + 1 t + + p tp + t . Uma funao linear ou quadrtica seria apropriada no caso de uma tendncia monoc a e tonicamente crescente ou decrescente. Caso contrrio polinmios de ordem mais alta a o devem ser ajustados. Outras poss veis formas de tendncia so os crescimentos descritos por uma curva e a Gompertz, log xt = a + brt onde a, b e r so parmetros com 0 < r < 1, ou uma curva Log a a stica, xt = a/(1 + bect ) onde a, b e c so parmetros. Estas duas ultimas so chamadas curvas S e se aproa a a ximam de uma ass ntota quando t . Neste caso o ajuste pode levar a equaoes c no lineares. a Seja qual for a curva utilizada, a funao ajustada fornece uma medida da tendncia c e da srie, enquanto os res e duos (valores observados valores ajustados) fornecem uma estimativa de utuaoes locais. c Exemplo 2.1 : A Figura 2.1 mostra as medioes anuais de vazes do Rio Nilo em c o Ashwan entre 1871 e 1970 juntamente com polinmios de graus 3 e 6 superimpostos. o Os polinmios foram ajustados por m o nimos quadrados usando os comandos do R a seguir. A srie original com as tendncias estimadas aparecem na Figura (2.1). e e > + + + + + + + + > > mypolytrend = function(y, degree = 1) { n = length(y) x = 1:n X = matrix(NA, n, degree) for (i in 1:degree) X[, i] = x^i a = as.numeric(lm(y ~ X)$coeff) out = cbind(rep(1, n), X) %*% a return(ts(out, start = start(y), freq = frequency(y))) } z3 = mypolytrend(Nile, 3) z6 = mypolytrend(Nile, 6)

CAP ITULO 2. TECNICAS DESCRITIVAS

1400

Vazoes

600

800

1000

1200

observado tendencia grau 3 tendencia grau 6

1880

1900

1920

1940

1960

Figura 2.1: Medioes anuais de vazes do Rio Nilo em Ashwan entre 1871 e 1970 (pontos), c o
com polinmios de graus 3 e 6 ajustados por minimos quadrados. o

Regresso Local a
A idia aqui estimar para cada t uma equaao de regresso polinomial diferente, e e c a por exemplo xt = (t) + (t)t. Note que as estimativas de e dependem do tempo o que da o carter local das a retas de regresso. a O procedimento conhecido como loess um procedimento iterativo que a cada e passo aplica a regresso local anterior, calcula os res a duos xt xt e aplica novamente a regresso local dando peso menor `s observaoes com res a a c suos maiores. Este procedimento se repete at atingir convergncia. e e Exemplo 2.2 : A Figura 2.2 apresenta os mesmos dados da Figura 2.1 sendo que as curvas superimpostas foram obtidas usando regresso local com os comandos do R a a seguir.

2.2. SERIES COM TENDENCIA

1400

Vazoes

600

800

1000

1200

observado tendencia f=1 tendencia f=0.25

1880

1900

1920

1940

1960

Figura 2.2: Medioes anuais de vazes do Rio Nilo em Ashwan entre 1871 e 1970 (pontos), c o
tendncia estimada via funao lowess. e c

Filtragem
Outro procedimento para analisar sries com tendncia atravs de ltros lineares. e e e e Um ltro linear converte uma srie {xt } em outra {yt } atravs da seguinte operaao e e c linear
s

yt =
j=q

aj xt+j

onde {aj } um conjunto de pesos. Alm disso, como queremos estimar a mdia local e e e s os pesos devem ser tais que j=q aj = 1, garantindo assim que min{xt } < yt < max{xt }. Neste caso a operaao chamada mdia mvel. c e e o Mdias mveis so em geral simtricas com s = q e ar = ar . Por exemplo, se e o a e s = q = 2 temos que yt = a2 xt2 + a1 xt1 + a0 xt + a1 xt+1 + a2 xt+2 . O caso mais simples quando todos os pesos aj tem o mesmo valor e devido ` restriao e a c de soma 1 segue que aj = 1/(2q +1), para j = q, . . . , q. Neste caso, o valor suavizado

10 de xt dado por e yt =

CAP ITULO 2. TECNICAS DESCRITIVAS

1 2q + 1

xt+j .
j=q

Qualquer que seja o ltro utilizado, yt uma estimativa da tendncia no tempo t e e e xt yt uma srie livre de tendncia. e e e Exemplo 2.3 : A Figura 2.3 apresenta a srie com os totais mensais de passageiros e de linhas areas internacionais nos EUA, entre 1949 e 1960 (Box, Jenkins and Reinsel, e 1976) juntamente com a tendncia estimada superimposta. Foram aplicados ltros e lineares com mdias mveis aproximadamente trimestrais (q = 2) e mdias mveis e o e o aproximadamente anuais (q = 5). Os seguintes comandos do R foram usados.

Numero de passageiros (em milhares)

500

600

100

200

300

400

dados Media Movel q=2 Media Movel q=5

1950

1952

1954 Anos

1956

1958

1960

Figura 2.3: Totais mensais de passageiros de linhas areas internacionais nos EUA, com e
a tendncia superimposta aplicando mdias mveis aproximadamente trimestrais (q = 2) e e e o mdias mveis aproximadamente anuais (q = 5). e o

Note que, para a aplicaao de qualquer ltro simtrico os valores suavizados s c e o podem ser calculados para t = q + 1, . . . , n q e assim a srie suavizada ter n 2q e a valores. Em algumas situaoes no entanto importante obter valores suavizados at c e e o per odo t = n e uma alternativa utilizar um ltro assimtrico que usa apenas os e e valores atual e passados de xt . Por exemplo na tcnica conhecida como alisamento e

2.3. SERIES SAZONAIS exponencial os valores suavizados so dados por a

11

yt =
j=0

(1 )j xtj

onde 0 < < 1. Note como, embora todas as observaoes passadas sejam usadas no c j decaem geometricamente com j. Quanto mais prximo de 1 ltro, os pesos (1 ) o estiver mais peso ser dado `s observaoes mais recentes e quanto mais prximo de a a c o zero mais os pesos estaro distribuidos ao longo da srie. Por exemplo se = 0, 90 a a e srie ltrada ca yt = 0, 9xt + 0, 09xt1 + 0, 009xt2 + . . . enquanto que para = 0, 1 e temos que yt = 0, 1xt + 0, 09xt1 + 0, 081xt2 + . . . . Este tipo de ltro pode ser utilizado para fazer previses. Especicamente a o previso da srie original em t + 1 ser o valor ltrado yt (mais detalhes no Cap a e a tulo 5).

Diferenciao ca
Um tipo especial de ltro, muito util para remover uma componente de tendncia e polinomial, consiste em diferenciar a srie at que ela se torne estacionria (este cone e a ceito ser formalizado no Cap a tulo 3). Para dados no sazonais, a primeira diferena a c e em geral suciente para induzir estacionariedade aproximada. A nova srie y2 , . . . , yn e formada a partir da srie original x1 , . . . , xn como e e yt = xt xt1 = xt . Note que isto nada mais do que um ltro (assimtrico) com coecientes 1 e -1. e e Diferenciaao de primeira ordem a mais utilizada sendo que ocasionalmente uma c e diferenciaao de segunda ordem pode ser requerida, i.e. c yt = 2 xt = (xt xt1 ) = xt 2xt1 + xt2 . Alm disso, independente do seu uso para induzir estacionariedade, a diferenciae cao pode ser muito util como ferramenta exploratria. Observaoes discrepantes por o c exemplo podem ter um efeito dramtico na srie diferenciada e uma representaao a e c grca em geral suciente para identicar tais pontos. a e

2.3

Sries Sazonais e

Uma forma bastante simples de eliminar o efeito sazonal simplesmente tomar mdias e e sazonais. Por exemplo, em dados mensais com sazonalidade anual, as mdias anuais e estaro livres do efeito sazonal. Embora este procedimento esteja correto muitos dados a sero perdidos e ao invs disto pode-se recorrer mais uma vez `s mdias mveis. a e a e o

2.4

Autocorrelao ca

Uma importante ferramenta para se identicar as propriedades de uma srie teme poral consiste de uma srie de quantidades chamadas coecientes de autocorrelaao e c

12

CAP ITULO 2. TECNICAS DESCRITIVAS

amostral. A idia similar ao coeciente de correlaao usual, i.e. para n pares de e e c observaoes das variveis x e y o coeciente de correlaao amostral dado por c a c e
n i=1 n i=1

r=

(xi x)(yi y)
n

(2.2)

(xi x)2

i=1

(yi y)2

Aqui no entanto queremos medir a correlaao entre as observaoes de c c uma mesma varivel em diferentes horizontes de tempo, i.e. correlaoes ena c tre observaoes defasadas 1, 2, . . . per c odos de tempo. Assim, dadas n observaoes x1 , . . . , xn de uma srie temporal discreta podemos formar os pares c e (x1 , x2 ), . . . , (xn1 , xn ). Considerando x1 , . . . , xn1 e x2 , . . . , xn como duas variveis a o coeciente de correlaao entre xt e xt+1 dado por c e
n1 t=1 n1 t=1

r1 =

(xt x1 )(xt+1 x2 )
n1 t=1

(2.3)

(xt x1 )2

(xt+1 x2 )2
n

onde as mdias amostrais so e a


n1

x1 =
t=1

xt /(n 1)

e x2 =
t=2

xt /(n 1).

Como o coeciente r1 mede as correlaoes entre observaoes sucessivas ele chamado c c e de coeciente de autocorrelaao ou coeciente de correlaao serial. c c E usual simplicar a equaao (2.3) utilizando-se a mdia de todas as observaoes, c e c
n

i.e. x =
t=1

xt /n j que x1 x2 , e assumindo varincia constante. Assim, a verso a a a


n1 t=1

simplicada de (2.3) ca (xt x)(xt+1 x)


n

r1 =

(2.4)

(n 1)

t=1

(xt x) /n

sendo que alguns autores ainda retiram o termo n/(n 1) que prximo de 1 para e o n no muito pequeno. Esta ultima forma simplicada, sem o termo n/(n 1) ser a a utilizada neste texto. A equaao (2.4) pode ser generalizada para calcular a correlaao entre observaoes c c c defasadas de k per odos de tempo, i.e.
nk t=1

rk =

(xt x)(xt+k x)
n t=1

(2.5)

(xt x)

2.4. AUTOCORRELACAO

13

fornece o coeciente de correlaao de ordem k. Assim como o coeciente de correlaao c c usual, as autocorrelaoes so adimensionais e 1 < rk < 1. c a Na prtica mais usual calcular primeiro os coecientes de autocovarincia {ck }, a e a denidos por analogia com a frmula usual de covarincia, i.e. o a
nk

ck =
t=1

(xt x)(xt+k x)/n.

Os coecientes de autocorrelaao so ento obtidos como rk = ck /c0 . c a a

2.4.1

O Correlograma

Um grco com os k primeiros coecientes de autocorrelaao como funao de k a c c e chamado de correlograma e pode ser uma ferramenta poderosa para identicar caracter sticas da srie temporal. Porm isto requer uma interpretaao adequada do e e c correlograma, i.e. devemos associar certos padres do correlograma como determinao das caracter sticas de uma srie temporal. Esta nem sempre uma tarefa simples e a e e seguir so dadas algumas indicaoes. a c

Sries aleatrias e o
A primeira questo que podemos tentar responder atravs do correlograma se uma a e e srie temporal aleatria ou no. Para uma srie completamente aleatria os valores e e o a e o defasados so no correlacionados e portanto espera-se que rk 0, k = 1, 2, . . . . a a Suponha que x1 , . . . , xn sejam variveis aleatrias independentes e identicamente a o distribuidas com mdia arbitrrias. Ento, pode-se mostrar que o coeciente de aue a a tocorrelaao amostral rk assintoticamente normalmente distribuido, com mdia e c e e varincia dados por a E(rk ) 1/n e V ar(rk ) 1/n.

(ver Kendall, Stuart, & Ord 1983, Cap tulo 48). Portanto, limites de conana aproc a ximados de 95% so dados por 1/n 1, 96/ n, que so frequentemente ainda mais a aproximados para 1, 96/ n. Isto ilustra uma das diculdades de interpretar o correlograma j que, mesmo para a uma srie completamente aleatria, espera-se que 1 em cada 20 coecientes rk esteja e o fora destes limites. Por outro lado, um valor muito grande de rk tem menos chance de ter ocorrido ao acaso do que um valor que est apenas ligeiramente fora dos limites. a A Figura 2.4 mostra uma srie temporal com 100 observaoes independentes e e c identicamente distribuidas geradas no computador juntamente com o seu correlo grama. Neste caso os limites de conana de 95% so aproximadamente 2/ 100 = c a 0,2 e podemos notar que 2 dentre as 20 primeiras autocorrelaoes esto ligeiramente c a fora destes limites. No entanto isto ocorre em defasagens aparentemente arbitrrias a (12 e 18) e podemos concluir que no h evidncia para rejeitar a hiptese de que as a a e o observaoes so independentes. c a

14

CAP ITULO 2. TECNICAS DESCRITIVAS

observaes

3 0

20

40 tempo

60

80

100

autocorrelaoes

0.2 0

0.4

1.0

10 defasagem

15

20

Figura 2.4: (a) 100 observaoes simuladas independentes e identicamente distribuidas. (b) c
20 primeiras autocorrelaoes amostrais. c

Correlao de curto-prazo ca
Uma srie temporal na qual uma observaao acima da mdia tende a ser seguida e c e por uma ou mais observaoes acima da mdia, similarmente para observaoes abaixo c e c da mdia, dita ter correlaao de curto-prazo. Um correlograma desta srie dever e e c e a exibir um valor relativamente grande de r1 seguido por valores que tendem a car sucessivamente menores. A partir de uma certa defasagem k os valores de rk tendem a ser aproximadamente zero. Na Figura 2.5 temos 50 observaoes geradas de acordo c com o processo xt = 0, 7xt1 + t juntamente com o seu correlograma.

Correlao negativa ca
Se os valores de uma srie temporal tendem a se alternar acima e abaixo de um valor e mdio, o correlograma desta srie tambm tende a se alternar. O valor de r1 ser e e e a negativo enquanto o valor de r2 ser positivo j que as observaoes defasadas de 2 a a c per odos tendem a estar do mesmo lado da mdia. Esta caracter e stica est ilustrada a na Figura 2.6 aonde temos 50 observaoes simuladas com autocorrelaoes negativas c c juntamente com as 14 primeiras autocorrelaoes amostrais. c

2.4. AUTOCORRELACAO

15

observacoes

3 0

10

20 tempo

30

40

50

autocorrelacoes

0.4 0

0.2

0.8

5 defasagem

10

15

Figura 2.5: (a) 50 observaoes simuladas com autocorrelaoes de curto-prazo. (b) 16 primeic c ras autocorrelaoes amostrais. c

Sries no estacionrias e a a
Para uma srie temporal com tendncia os valores de rk no decairo para zero a e e a a no ser em defasagens grandes. Intuitivamente, isto ocorre porque uma observaao a c de um lado da mdia tende a ser seguida por um grande nmero de observaoes do e u c mesmo lado (devido ` tendncia). Neste caso, pouca ou nenhuma informaao pode a e c ser extraida do correlograma j que a tendncia dominar outras caracter a e a sticas. Na verdade, como veremos em outros cap tulos a funao de autocorrelaao s tem um c c o signicado para sries estacionrias, sendo assim qualquer tendncia deve ser removida e a e antes do clculo de {rk }. a A Figura 2.7 mostra uma srie temporal com 50 observaoes geradas segundo o e c modelo xt = xt1 + t , juntamente com o seu correlograma. Note que a no estacionaa riedade da srie ca evidenciada no correlograma j que as autocorrelaoes amostrais e a c decaem muito lentamente.

Variao sazonal ca
Um padro sazonal em geral facilmente identicado no correlograma. De fato, se a e uma srie temporal contem utuaoes sazonais o correlograma ir exibir oscilaoes na e c a c

16

CAP ITULO 2. TECNICAS DESCRITIVAS

observacoes

3 0

10

20 tempo

30

40

50

autocorrelacoes

0.5 0

0.5

5 defasagem

10

15

Figura 2.6: (a) 50 observaoes simuladas com autocorrelaoes negativas. (b) 15 primeiras c c
autocorrelaoes amostrais. c

mesma frequncia. Por exemplo, com observaoes mensais r6 ser grande e negativo e c a enquanto r12 ser grande e positivo. a Na verdade, se o padro sazonal j for evidente no grco da srie original o a a a e correlograma trar pouca ou nenhuma informaao adicional. a c

Observaes discrepantes co
Se uma srie temporal contem uma ou mais observaoes discrepantes (outliers) o e c correlograma pode ser seriamente afetado. No caso de uma unica observaao discre c pante o grco de xt contra xt+k ter pontos extremos o que pode viesar os coecientes a a de correlaao para zero. Com dois valores discrepantes o efeito pode ser ainda mais c devastador, alm de gerar uma correlaao espria quando k igual ` distncia entre e c u e a a os valores.

Exerc cios
1. Use o R para gerar uma srie temporal Yt = b0 + b1 t + t , t = 1, . . . , 100, com e 2 b0 , b1 = 0 e t normais e independentes com mdia e varincia 1 se t 70 e a 2 = 2 se t > 70. Usando diferentes valores de aplique o mas varincia 2 a 1

2.4. AUTOCORRELACAO

17

observacoes

0.0 0

0.4

0.8

10

20 tempo

30

40

50

autocorrelacoes

0.2 0

0.4

1.0

10 defasagem

15

20

Figura 2.7: (a) 50 observaoes simuladas segundo um passeio aleatrio. (b) 20 primeiras c o
autocorrelaoes amostrais. c

alisamento exponencial e faa um grco da srie com os valores suavizados. c a e Comente os resultados. 2. Para cada um dos processos abaixo gere 200 observaoes. Faa um grco da c c a srie e do correlograma. e (a) Serie aleatria, observaoes iid da distribuiao N(0,1). o c c (b) Serie com tendncia estocstica, xt = xt1 + t , t N (0, (0, 1)2 ) e a (c) Outra serie com tendencia estocastica, xt = xt1 + t , t N (1, 52 ) (e) Serie com correlaoes negativas, xt = 0, 8xt1 + t , t N (0, 1) c (f) Medias moveis, xt = t + 0, 6t1 , t N (0, 1) (g) passeio aleatorio com desvio Xt = 1 + Xt1 + t , t N (0, 1).

(d) Serie com correlaao de curto-prazo, xt = 0, 7xt1 + t , t N (0, 1) c

Cap tulo 3

Modelos Probabil sticos


3.1 Introduo ca

Neste cap tulo sero descritos vrios modelos adequados para dados de sries tempoa a e rais. Tais modelos so chamados de processos estocsticos. a a Matematicamente um processo estocstico pode ser denido como uma coleao de a c variveis aleatrias ordenadas no tempo e denidas em um conjunto de pontos T , que a o pode ser cont nuo ou discreto. Iremos denotar a varivel aleatria no tempo t por X(t) a o no caso cont nuo (usualmente < t < ), e por Xt no caso discreto (usualmente t = 0, 1, 2, . . . ). O conjunto de poss veis valores do processo chamado de espao e c de estados que pode ser discreto (e.g. o nmero de chamadas que chegam a uma u central telefnica a cada 2 horas) ou cont o nuo (e.g. a temperatura do ar em uma localidade observada em intervalos de 1 hora). Em anlise de sries temporais a situaao bem diferente da maioria dos problemas a e c e estat sticos. Embora seja poss variar o tamanho da srie observada, usualmente vel e ser imposs a vel fazer mais do que uma observaao em cada tempo. Assim, tem-se c apenas uma realizaao do processo estocstico e uma unica observaao da varivel c a c a aleatria no tempo t denotada por x(t) no caso cont o nuo e xt , para t = 1, . . . , N no caso discreto. Uma maneira de descrever um processo estocstico atravs da distribuiao a e e c de probabilidade conjunta de X(t1 ), . . . , X(tk ) para qualquer conjunto de tempos t1 , . . . , tk e qualquer valor de k. Esta uma tarefa extremamente complicada e na e prtica costuma-se descrever um processo estocstico atravs das funoes mdia, vaa a e c e rincia e autocovarincia. Estas funoes so denidas a seguir para o caso cont a a c a nuo sendo que denioes similares se aplicam ao caso discreto. c mdia (t) = E[X(t)] e varincia 2 (t) = V ar[X(t)] a autocovarincia (t1 , t2 ) = E[X(t1 ) (t1 )][X(t2 ) (t2 )] a Note que a funao de varincia um caso especial da funao de autocovarincia c a e c a quando t1 = t2 . Momentos de ordem mais alta do processo tambm ser denidos e 18

3.2. PROCESSOS ESTACIONARIOS

19

mas so raramente utilizados na prtica e as funoes (t) e (t1 , t2 ) so em geral a a c a sucientes.

3.2

Processos Estacionrios a

Uma importante classe de processos estocsticos so os chamados processos estacia a onrios. A idia intuitiva de estacionariedade foi introduzida no cap a e tulo anterior e aqui ser apresentada a deniao formal. a c Uma srie temporal dita estritamente estacionria se a distribuiao de probae e a c bilidade conjunta de X(t1 ), . . . , X(tk ) a mesma de X(t1 + ), . . . , X(tk + ). Ou e seja, o deslocamento da origem dos tempos por uma quantidade no tem efeito na a distribuiao conjunta que portanto depende apenas dos intervalos entre t1 , . . . , tk . c Em particular, para k = 1 a estacionariedade estrita implica que a distribuiao c de X(t) a mesma para todo t de modo que, se os dois primeiros momentos forem e nitos, temos que (t) = e 2 (t) = 2 so constantes que no dependem de t. a a Para k = 2 a distribuiao conjunta de X(t1 ) e X(t2 ) depende apenas da distncia c a t2 t1 , chamada defasagem. A funao de autocovarincia (t1 , t2 ) tambm depende c a e apenas de t2 t1 e pode ser escrita como ( ) onde ( ) = E[X(t) ][X(t + ) ] = Cov[X(t), X(t + )] chamado de coeciente de autocovarincia na defasagem . e a Note que o tamanho de ( ) depende da escala em que X(t) medida. Portanto, e para efeito de interpretaao, mais util padronizar a funao de autocovarincia dando c e c a origem a uma funao de autocorrelaao c c ( ) = ( )/(0) que mede a correlaao entre X(t) e X(t + ). No cap c tulo anterior foi apresentado o seu equivalente emp rico para sries discretas rk . Note tambm que o argumento e e ser discreto se a srie temporal for discreta e cont a e nuo se a srie temporal for e cont nua. Na prtica muito dif usar a deniao de estacionariedade estrita e costuma-se a e cil c denir estacionariedade de uma forma menos restrita. Denio 3.1. Um processo estocstico {X(t), t T } dito ser estacionrio de ca a e a segunda ordem ou fracamente estacionrio se a sua funao mdia constante e sua a c e e funao de autocovarincia depende apenas da defasagem, i.e. c a E[X(t)] = e Cov[X(t), X(t + )] = ( ).

Nenhuma outra suposiao feita a respeito dos momentos de ordem mais alta. Alm c e e disso, fazendo = 0 segue que V ar[X(t)] = (0), ou seja a varincia do processo a

20

CAP ITULO 3. MODELOS PROBABIL ISTICOS

assim como a mdia tambm constante. Note tambm que tanto a mdia quanto a e e e e e varincia precisam ser nitos. a Esta deniao mais fraca de estacionariedade ser utilizada daqui em diante j c a a que muitas propriedades dos processos estacionrios dependem apenas da estrutura a especicada pelo primeiro e segundo momentos. Uma classe importante de processos aonde isto se verica a classe de processos normais ou Gaussianos aonde a distribuie cao conjunta de X(t1 ), . . . , X(tk ) normal multivariada para todo conjunto t1 , . . . , tk . e A distribuiao normal multivariada ca completamente caracterizada pelo primeiro e c segundo momentos, i.e. por (t) e (t1 , t2 ), assim estacionariedade fraca implica em estacionariedade estrita para processos normais. Por outro lado, e ( ) podem no a descrever adequadamente processos que sejam muito no-normais. a

3.3

A Funo de Autocorrelao ca ca

Foi visto na Seao 2.4 que os coecientes de autocorrelaao amostral de uma srie c c e temporal observada so uma ferramenta importante para descrever a srie. Analogaa e mente, a funao de autocorrelaao terica (fac) de um processo estocstico estacioc c o a nrio uma ferramenta importante para assessar suas propriedades. A seguir sero a e a apresentadas propriedades gerais da funao de autocorrelaao. c c Se um processo estocstico estacionrio X(t) tem mdia e varincia 2 ento a a e a a ( ) = ( )/(0) = ( )/ 2 e portanto (0) = 1. As seguintes propriedades so facilmente vericveis. a a 1. A correlaao entre X(t) e X(t + ) a mesma que entre X(t) e X(t ), ou c e seja ( ) = ( ). 2. 1 < ( ) < 1. 3. Embora um processo estocstico tenha uma estrutura de autocovarincia unica a a o contrrio no verdadeiro em geral. E poss encontrar vrios processos com a a e vel a a mesma funao de autocorrelaao, o que diculta ainda mais a interpretaao c c c do correlograma.

3.4

Alguns Processos Estocsticos a

Nesta seao sero apresentados alguns processos estocsticos que so utilizados com c a a a frequncia na especicaao de modelos para sries temporais. e c e

3.4.1

Sequncia Aleatria e o

Um processo em tempo discreto chamado puramente aleatrio se consiste de uma e o sequncia de variveis aleatrias {t } independentes e identicamente distribuidas. Isto e a o implica nas seguintes propriedades

3.4. ALGUNS PROCESSOS ESTOCASTICOS 1. E(t ) = E(t |t1 , t2 , . . . ) =


2 2. V ar(t ) = V ar(t |t1 , t2 , . . . ) =

21

3. (k) = Cov(t , t+k ) = 0,

k = 1, 2, . . . .

Como a mdia e a funao de autocovarincia no dependem do tempo o processo e c a a e estacionrio em segunda ordem. A funao de autocorrelaao simplesmente a c c e (k) = 1, k = 0 0, k = 1, 2, . . . .

Um processo puramente aleatrio as vezes chamado de ru branco e pode ser o e do util por exemplo na construao de processos mais complicados. As propriedades c acima podem ser entendidas como ausncia de correlaao serial e homocedasticidade e c condicional (varincia condicional constante). a

3.4.2

Passeio Aleatrio o

2 Seja {t } um processo discreto puramente aleatrio com mdia e varincia . Um o e a processo {Xt } chamada de passeio aleatrio se e o

Xt = Xt1 + t . Fazendo-se substituioes sucessivas obtm-se que c e Xt = Xt2 + t1 + t = Xt3 + t2 + t1 + t . . .


t

= X0 +
j=1

e iniciando o processo em X0 = 0 no dif vericar que a e cil


t

E(Xt ) =
j=1 t

E(j ) = t
2 V ar(j ) = t . j=1

V ar(Xt ) =

Alm disso, a funao de autocovarincia dada por e c a e


2 Cov(Xt , Xtk ) = Cov(1 + + tk + + t , 1 + + tk ) = (t k)

e portanto a funao de autocorrelaao ca c c t (k) = tk . t

22

CAP ITULO 3. MODELOS PROBABIL ISTICOS

Como a mdia, a varincia e as autocovarincias dependem de t este processo no e a a e a estacionrio. No entanto, interessante notar que a primeira diferena de um passeio a e c aleatrio estacionria j que o e a a Xt = Xt Xt1 = t . Os exemplos mais conhecidos de sries temporais que se comportam como um e passeio aleatrio so os preos de aoes em dias sucessivos (ver por exemplo Morettin o a c c e Toloi, 2004).

3.4.3

Processos de Mdia Mveis e o

2 Seja {t } um processo discreto puramente aleatrio com mdia zero e varincia . o e a Um processo {Xt } chamada de processo de mdias mveis de ordem q, ou MA(q), e e o se Xt = t + 1 t1 + + q tq , (3.1)

sendo i R, i = 1, . . . , q. No dif vericar como cam a mdia e a varincia a e cil e a deste processo,
q

E(Xt ) = E(t ) +
j=1

j E(tj ) = 0
q 2 2 2 2 j V ar(tj ) = (1 + 1 + + q ) .

V ar(Xt ) = V ar(t ) +
j=1

2 c Alm disso, como Cov(t , s ) = para t = s e Cov(t , s ) = 0 para t = s, a funao e de autocovarincia dada por a e

(k) = Cov(Xt , Xt+k ) = Cov(t + 1 t1 + + q tq , t+k + 1 t+k1 + + q t+kq ) 0 k>q qk 2 j j+k k = 0, . . . , q = (3.2) j=0 (k) k<0

com 0 = 1. Como a mdia e a varincia so constantes e (k) no depende de t e a a a o processo (fracamente) estacionrio para todos os poss e a veis valores de 1 , . . . , q . Alm disso, se os t s forem normalmente distribuidos os Xt s tambm sero e portanto e e a o processo ser estritamente estacionrio. a a A funao de autocorrelaao pode ser facilmente obtida de (3.2) como c c k=0 1 qk q 2 j j+k j k = 1, . . . , q (k) = j=0 j=0 0 k>q (k) k < 0.

3.4. ALGUNS PROCESSOS ESTOCASTICOS

23

Note que a funao tem um ponto de corte na defasagem q, i.e. (k) = 0 para k > c q. Esta uma caracter e stica espec ca de processos mdias mveis e ser util na e o a especicaao do valor de q na prtica (Box & Jenkins 1970, p. 170). c a > MAacf <- function(q, beta, lag.max) { + sig2x = 1 + sum(beta^2) + rho = rep(0, lag.max) + for (k in 1:q) { + rho[k] = beta[k] + if (q - k > 0) { + for (j in 1:(q - k)) rho[k] = rho[k] + beta[j] * + beta[j + k] + } + rho[k] = rho[k]/sig2x + } + return(rho) + } > round(MAacf(q = 2, beta = c(0.5, 0.3), lag.max = 6), 4) [1] 0.4851 0.2239 0.0000 0.0000 0.0000 0.0000 Vamos analisar agora com mais detalhes o caso particular do processo MA(1). A funao de autocorrelaao ca c c 1 k=0 2 ) k = 1 (k) = (3.3) /(1 + 1 1 0 k > 1. O processo estacionrio para qualquer valor de 1 mas em geral desejvel impor e a e a restrioes para que ele satisfaa uma condiao chamada inversibilidade. Considere os c c c seguintes processos MA(1) Xt = t + t1 1 Xt = t + t1 . Substituindo em (3.3) no dif vericar que estes dois processos diferentes tm a e cil e exatamente a mesma funao de autocorrelaao. Assim, no poss identicar um c c a e vel processo MA(1) unico a partir da funao de autocorrelaao. Por outro lado, podemos c c fazer substituioes sucessivas e reescrever estes dois processos colocando t em funao c c de Xt , Xt1 , . . . , i.e. t = Xt Xt1 + 2 Xt2 3 Xt3 + . . . 1 1 1 t = Xt Xt1 + 2 Xt2 3 Xt3 + . . . Se || < 1 a primeira srie converge e o modelo dito ser invers mas a segunda no e e vel a converge e o modelo no invers e a vel. Ou seja, a condiao de inversibilidade (neste c

24

CAP ITULO 3. MODELOS PROBABIL ISTICOS

caso || < 1) garante que existe um unico processo MA(1) para uma dada funao c de autocorrelaao. Outra consequncia da inversibilidade que o processo MA(1) c e e pode ser reescrito como uma regresso de ordem innita nos seus prprios valores a o defasados. Para um processo MA(q) esta condiao pode ser melhor expressa usando-se o c operador de retardo, denotado por B e denido como B j Xt = Xtj , para todo j.

A equaao (3.1) pode ento ser reescrita como c a Xt = (1 + 1 B + 2 B 2 + + q B q )t = (B)t onde (B) um polinmio de ordem q em B. Um processo MA(q) invers se as e o e vel ra zes da equaao c (B) = 1 + 1 B + 2 B 2 + + q B q = 0 estiverem fora do c rculo unitrio. Ou seja, se 1 , . . . , q so q soluoes de (B) = 0 a a c ento o processo invers se |i | > 1, i = 1, . . . , q. Teremos ento 2q modelos com a e vel a a mesma funao de autocorrelaao mas somente um deles ser invers c c a vel. Finalmente, vale notar que uma constante qualquer pode ser adicionada ao lado direito de (3.1) dando origem a um processo com mdia . O processo continuar e a sendo estacionrio com E(Xt ) = e em particular a funao de autocorrelaao no a c c a ser afetada. a

3.4.4

Processos Autoregressivos

Suponha que {t } seja um processo puramente aleatrio com mdia zero e varincia o e a 2 . Um processo {Xt } chamada de processo autoregressivo de ordem p, ou AR(p), e se Xt = 1 Xt1 + + p Xtp + t . (3.4)

Note a similaridade com um modelo de regresso mltipla, onde os valores passados a u de Xt fazem o papel das regressoras. Assim, processos AR podem ser usados como modelos se for razovel assumir que o valor atual de uma srie temporal depende do a e seu passado imediato mais um erro aleatrio. o Por simplicidade vamos comear estudando em detalhes processos de primeira c ordem, AR(1), i.e. Xt = Xt1 + t . (3.5)

Note que existe uma estrutura Markoviana no processo AR(1) no sentido de que, dado Xt1 , Xt no depende de Xt2 , Xt3 , . . . . Fazendo subtituioes sucessivas em (3.5) a c

3.4. ALGUNS PROCESSOS ESTOCASTICOS obtemos que Xt = (Xt2 + t1 ) + t = 2 Xt2 + t1 + t = 2 (Xt3 + t2 ) + t1 + t = 3 Xt3 + 2 t2 + t1 + t . . .
r

25

= r+1 Xtr1 +
j=0

j tj .

2 Se Xt for estacionrio com varincia nita X podemos escrever que a a r

E[Xt

2 2 j tj ]2 = 2r+2 E(Xtr1 ) = 2r+2 X j=0

e se || < 1 temos que 2r+2 0 quando r . Portanto, esta condiao nos c permite escrever Xt como o seguinte processo MA innito, Xt = t + t1 + 2 t2 + . . . e assim || < 1 uma condiao suciente para que Xt seja estacionrio. Neste caso, e c a reescrevendo o processo k per odos ` frente, i.e. a Xt+k = t+k + t+k1 + + k t + . . . (3.6)

note como o efeito de t sobre Xt+k diminui a medida que k aumenta e por isso e chamado efeito transitrio. o Podemos tambm usar o operador de retardo reescrevendo a equaao (3.5) como e c (1 B)Xt = t ou equivalentemente Xt = 1 t = (1 + B + 2 B 2 + . . . )t = t + t1 + 2 t2 + . . . (1 B)

Escrevendo o processo AR(1) neste formato de MA innito ca fcil ver que a sua a mdia e varincia so dados por e a a
2 E(Xt ) = 0 e V ar(Xt ) = (1 + 2 + 4 + . . . ) = 2 . 1 2

A funao de autocovarincia pode ser obtida usando os resultados acima. Reesc a crevendo a equaao (3.6) como c Xt+k = t+k + + k1 t+1 + k t + k+1 t1 + k+2 t2 + . . . pode-se vericar que, para qualquer k = 1, 2, . . . , Cov(t + t1 + 2 t2 + . . . , t+k + + k1 t+1 ) = 0.

26 Portanto,

CAP ITULO 3. MODELOS PROBABIL ISTICOS

E(Xt Xt+k ) = Cov(t + t1 + 2 t2 + . . . , k t + k+1 t1 + k+2 t2 + . . . ) = k E(2 ) + k+2 E(2 ) + k+4 E(2 ) + . . . t t1 t2
2 = k (1 + 2 + 4 + . . . ) = k 2 2 = k X = (k). 1 2

Assim, a funao de autocorrelaao (k) = k para k = 0, 1, 2, . . . . Assim, como a c c e mdia e a varincia so constantes e (k) no depende de t o processo AR(1) com e a a a || < 1 estacionrio. e a Na Figura 3.1 so mostradas gracamente as autocorrelaes tericas de um proa co o cesso AR(1) at a defasagem k = 20 para igual a 0,8, -0,8, 0,2 e -0,2. Note como e a funao de autocorrelaao decai rapidamente para zero quando = 0, 2 e se alterna c c entre valores positivos e negativos quando = 0, 8. Ou seja sempre h um decaia mento exponencial para zero mas este decaimento depende do sinal e magnitude de .

0.8

0.6

0.4

0.2

10

15

20

0.8

0.0

0.2

0.2

0.6

10

15

20

0.20

0.10

10

15

20

0.20

0.00

0.10

0.00

10

15

20

Figura 3.1: As 20 primeiras autocorrelaoes tericas de um processo AR(1) com (a) = 0, 8, c o


(b) = 0, 8, (c) = 0, 2 e (d) = 0, 2.

Generalizando os resultados acima para um processo AR(p) escrevemos novamente Xt como um processo MA innito com coecientes 0 , 1 , . . . , i.e. Xt = 0 t + 1 t1 + 2 t2 + = (0 + 1 B + 2 B 2 + . . . )t = (B)t .

3.4. ALGUNS PROCESSOS ESTOCASTICOS e em analogia com o caso AR(1) segue que o processo ser estacionrio se a a Usando agora o operador de retardo a equaao (3.4) ca c (1 1 B 2 B 2 p B p )Xt = t e portanto o processo AR(p) pode ser escrito como Xt = (B)1 t = (B)t . Assim, os coecientes j podem ser obtidos a partir dos coecientes j fazendo-se (1 1 B 2 B 2 p B p )(0 + 1 B + 2 B 2 + . . . ) = 1 Desenvolvendo-se esta expresso segue que a 0 + 1 B + 2 B 2 + 1 0 B 1 1 B 2 1 2 B 3 . . . ou (B)Xt = t
j

27
2 j < .

2 0 B 2 2 1 B 3 2 2 B 4 . . . . . .

p 0 B p p 1 B p+1 = 1 + 0B + 0B 2 + . . . e agora agrupando em termos de B, B 2 , . . . 0 + (1 1 0 )B + (2 1 1 2 0 )B 2 + = 1 + 0B + 0B 2 + . . . donde obtm-se os coecientes MA recursivamente como e 0 = 1 1 = 0 1 2 = 1 1 + 0 2 3 = 2 1 + 1 2 + 0 3 . . .


i

i =
j=1

ij j .

O efeito de t sobre Xt+k dado por k , k = 1, 2, . . . . e Pode-se mostrar que (ver por exemplo Box, Jenkins, & Reinsel 1994) a condiao c de estacionariedade do processo Xt que todas as ra e zes de (B) = 0 estejam fora do c rculo unitrio. Em particular, para p = 1 temos que (B) = 1 B = 0 implica a que B = 1/ e a condiao de estacionariedade ca || < 1 conforme j haviamos c a vericado. Para reescrever um processo AR(p) em forma vetorial, dena Z t = (Xt1 , . . . , Xtp ) e portanto Z t = Z t1 + ut

28

CAP ITULO 3. MODELOS PROBABIL ISTICOS

sendo a matriz denida como 1 2 1 0 =0 1 . . . . . . 0 0

... ... ... . . . ...

e ut = (t , 0, . . . , 0) . Para obter a funao de autocorrelaao de um processo AR(p) algebricamente c c e mais simples assumir a priori que o processo estacionrio com E(Xt ) = 0, V ar(Xt ) = e a 2 X e Cov(Xt , Xtk ) = (k). Neste caso, multiplicando a equaao (3.4) por Xtk , i.e c Xt Xtk = 1 Xt1 Xtk + + p Xtp Xtk + t Xtk . e tomando o valor esperado obtemos que E(Xt Xtk ) = (k) = 1 E(Xt1 Xtk ) + + p E(Xtp Xtk ) = 1 (k 1) + + p (k p), k > 0.

p1 p 0 0 0 0 . . . . . . 1 0

2 Dividindo-se ambos os lados pela varincia constante X obtem-se que a

(k) = 1 (k 1) + + p (k p),

k>0

chamadas equaoes de Yule-Walker. c Por exemplo, para um processo AR(1) com coeciente segue que (1) = , (2) = (1) = 2 , . . . , (k) = k como j haviamos vericado. Para um processo a AR(2) com coecientes 1 e 2 segue que (1) = 1 (0) + 2 (1) (1) = 1 /(1 2 ) e as outras autocorrelaos so obtidas iterativamente como c a (k) = 1 (k 1) + 2 (k 2), k2

Autocorrelaes Parciais co
Para um processo AR(p), o ultimo coeciente p mede o excesso de correlaao na c defasagem p que no levado em conta por um modelo AR(p 1). Este chamado a e e de p-simo coeciente de autocorrelaao parcial. Assim, variando k = 1, 2, . . . temos e c a chamada funao de autocorrelaao parcial (FACP). c c Por outro lado, em um processo AR(p) no existe correlaao direta entre Xt e a c Xtp1 , Xtp2 , . . . e substituindo k = p + 1, p + 2, . . . nas equaoes de Yule-Walker c obtem-se que todos os coecientes de correlaao parcial sero nulos para k > p. Por c a exemplo, substituindo-se k = p + 1 segue que (p + 1) = 1 (p) + + p (1) + p+1 . O fato de que a facp igual a zero para k > p sugerido em Box and Jenkins (1970, e e p. 170) como uma ferramenta para determinar a ordem p do processo autoregressivo para sries temporais observadas. e

3.4. ALGUNS PROCESSOS ESTOCASTICOS

29

3.4.5

Modelos Mistos ARMA

Combinando-se modelos AR e MA pode-se obter uma representao adequada com ca um nmero menor de parmetros. Processos autoregressivos mdias mveis (ARMA) u a e o formam um classe de modelos muito uteis e parcimoniosos para descrever dados de sries temporais. O modelo ARMA(p, q) dado por e e Xt = 1 Xt1 + + p Xtp + t + 1 t1 + + q tq
2 onde {t } um processo puramente aleatrio com mdia zero e varincia . Note e o e a que, modelos AR ou MA podem ser obtidos como casos especiais quando p = 0 ou q = 0. Usando o operador de retardo o modelo pode ser reescrito como

(1 1 B 2 B 2 p B p )Xt = (1 + 1 B + 2 B 2 + + q B q )t ou (B)Xt = (B)t . Os valores de 1 , . . . , p que tornam o processo estacionrio so tais que as ra a a zes de (B) = 0 esto fora do c a rculo unitrio. Analogamente, os valores de 1 , . . . , q a que tornam o processo invers vel so tais que as ra a zes de (B) = 0 esto fora do a c rculo unitrio. a Vale notar que as funoes de autocorrelaao e autocorrelaao parcial cam conc c c sideravelmente mais complicadas em processos ARMA. De um modo geral, para um processo ARMA(p, q) estacionrio a funao de autocorrelaao tem um decaimento a c c exponencial ou oscilatrio aps a defasagem q enquanto que a facp tem o mesmo o o comportamento aps a defasagem p (Box & Jenkins 1970, p. 79). Em princ o pio este resultado pode ser utilizado para auxiliar na determinaao da ordem (p, q) do processo c mas na prtica pode ser bastante dif distinguir entre decaimentos exponenciais e a cil oscilatrios atravs das estimativas destas funoes. o e c A Tabela 3.1 mostra as propriedades tericas das funoes de autocorrelaao e auo c c tocorrelaao parcial para alguns processos estacionrios como auxiliar na identicaao c a c do modelo. Tabela 3.1: Propriedades tericas da fac e facp. o Processo srie aleatria e o AR(1), > 0 AR(1), < 0 AR(p) MA(1) ARMA(p, q) FAC 0 decaimento decaimento decaimento 0, k > 1 decaimento FACP 0 0, k 2 idem 0, k > p decaimento oscilatrio o decaimento a partir de p

exponencial oscilatrio o para zero a partir de q

30

CAP ITULO 3. MODELOS PROBABIL ISTICOS

3.4.6

Modelos ARMA Integrados

Os modelos discutidos at agora so apropriados para sries temporais estacionrias. e a e a Assim, para ajustar estes modelos a uma srie temporal observada necessrio remoe e a ver as fontes de variaao no estacionrias. Por exemplo, se a srie observada for no c a a e a estacionria na mdia pode-se tentar remover a tendncia tomando-se uma ou mais a e e diferenas (esta abordagem muito utilizada em Econometria). c e Um modelo ARMA no qual Xt substituido pela sua d-sima diferena d Xt e e c capaz de descrever alguns tipos de sries no estacionrias. Denotando a srie e e a a e diferenciada por Wt = d Xt = (1 B)d Xt o processo autoregressivo integrado mdias mveis denotado ARIMA(p, d, q) dado e o e por Wt = 1 Wt1 + + p Wtp + t + 1 t1 + + q tq ou, equivalentemente (B)(1 B)d Xt = (B)t . (3.7) Da equaao (3.7) acima pode-se notar que o modelo para Xt claramente no c e a estacionrio j que o polinmio autoregressivo (B)(1 B)d tem exatamente d ra a a o zes sobre o c rculo unitrio, ou d ra a zes unitrias. Um processo que se torna estacionrio a a aps d diferenas dito ser no estacionrio homogneo, ou integrado de ordem d, o c e a a e I(d). Na prtica valores pequenos so em geral especicados para d, sendo d = 1 o valor a a mais frequentemente utilizado e excepcionalmente d = 2. Note tambm que o passeio e aleatrio pode ser considerado um processo ARIMA(0,1,0). o Vale notar que para dados reais um modelo ARIMA (e de fato qualquer modelo) no mximo uma aproximaao para o verdadeiro processo gerador dos dados. Na e a c prtica pode ser bem dif distinguir entre um processo estacionrio com memria a cil a o longa (e.g. AR(1) com 1) e um processo no estacionrio homogneo. Existe a a e uma vasta literatura economtrica sobre testes de ra unitria (ver por exemplo e z a Hamilton 1994 e Bauwens, Lubrano, & Richard 1999). Mais recentemente, modelos da classe ARFIMA (ou ARIMA fracionrios) tem sido utilizados para analisar sries a e com memria longa. Estes tpicos no sero abordados aqui e o leitor interessado o o a a pode consultar por exemplo Brockwell & Davis (1991) alm das referncias acima. e e

Exerc cios
Nos exerc cios a seguir {t } um processo discreto puramente aleatrio com mdia e o e 2 zero e varincia . a 1. Encontre a fac do processo Xt = t + 0, 7t1 0, 2t2 . 2. Encontre a fac do processo Xt = 0, 7(Xt1 ) + t .
2 3. Encontre a fac do processo Xt = 1 Xt1 + 9 Xt2 + t . 3

3.4. ALGUNS PROCESSOS ESTOCASTICOS 4. Se Xt = + t + t1 mostre que a fac do processo no depende de . a

31

5. Reescreva cada um dos modelos abaixo em termos de operador de retardo B e verique se o modelo estacionrio e/ou invers e a vel: (a) Xt = 0, 3Xt1 + t . (b) Xt = t 1, 3 t1 + 0, 4 t2 . (c) Xt = 0, 5Xt1 + t 1, 3 t1 + 0, 4 t2 . (d) Xt = 0, 3 Xt1 + t 0, 6 t1 (e) Xt = Xt1 + t 1, 5t1 6. Mostre que o processo Xt = Xt1 + cXt2 + t estacionrio se 1 < c < 0 e e a obtenha a fac para c = 3/16. 7. Mostre que o processo Xt = Xt1 + cXt2 cXt3 + t no estacionrio para e a a qualquer valor de c. 8. Descreva como deve se comportar a funao de autocorrelaao terica para os c c o seguintes processos, (a) AR(1) estacionrio, para = 0, 1, = 0, 75 e = 0, 99. a (b) Mdias mveis de ordem q. e o (c) Como deveriam car as funoes de autocorrelaao e autocorrelaao parcial c c c amostrais que identicam os processos acima? 9. Descreva como deveriam se comportar as funoes de autocorrelaao e autocorc c relaao parcial amostrais para processos AR, MA e ARMA no sazonais. c a 10. Para o modelo (1 B)(1 0, 2B)Xt = (1 0, 5B)t , identique os valores de p, q, e d e verique se o processo estacionrio e invers e a vel. 11. Mostre que a funao de autocovarincia de um processo AR(1) estacionrio com c a a 2 dada por k 2 (Sugesto: use a expresso (3.2) com q ) varincia X e a a a X 12. Verique se Xt =
t j=1 t

estacionrio. e a

13. Mostre que a fac do processo Xt = aXt1 + t + bt1 dada por e (1 + ab)(a + b) 1 + b2 + 2ab (k) = a(k 1), k = 2, 3, . . . (1) = 14. Obtenha a funao de autocovarncia do processo c a 1 1 1 Xt = t + t1 + 2 t2 + + m tm a a a sendo que 0 < a < 1.

32

CAP ITULO 3. MODELOS PROBABIL ISTICOS

15. Se {Xt } um processo estacionrio obtenha a funao de autocovarincia de e a c a Yt = Xt Xt1 . 16. Mostre que o processo Xt = ( + 1)Xt1 Xt2 + t tem exatamente uma raiz unitria e reescreva-o como um processo ARIMA(1,1,0). a 17. Obtenha a funao de autocorrelaao do passeio aleatrio Xt = Xt1 + t com c c o 2 E(t ) = , V ar(t ) = e Cov(t , s ) = 0, t = s. 18. Verique se o processo {Yt } tal que P (Yt = 1) = P (Yt = 1) = 1/2 estacioe nrio. Obtenha sua mdia, varincia e covarincia. a e a a 19. Sejam os processos Yt = t + t1 , || > 1 e {Xt } tal que Xt = 1 se Yt 0 e Xt = 1 se Yt < 0. Verique se {Xt } e {Yt } so estacionrios. Calcule a funao a a c de autocorrelaao de {Xt }. c 20. Verique que o processo Yt = (1)t t estacionrio e que Xt = Yt + t no e a a e estacionrio. a 21. Se {Xt } e {Yt } so independentes e estacionrios verique se Zt = Xt + Yt , a a , R tambm estacionrio. e e a 22. Obtenha a representaao MA() de um processo AR(2) estacionrio. c a 23. Obtenha a representaao AR() de um processo MA(1) invers c vel.

Cap tulo 4

Estimao ca
No cap tulo anterior foram estudados modelos probabil sticos que podem ser utilizados para descrever dados de sries temporais. Neste cap e tulo ser discutido o problema a de ajustar um modelo aos dados observados. A inferncia ser baseada na funao de e a c autocorrelaao. c Para um processo estacionrio {Xt } (t = 1, . . . , n), a funao de densidade de a c probabilidade conjunta de X1 , . . . , Xn pode ser sempre fatorada como p(x1 , . . . , xn ) = p(x1 )p(xn , . . . , x2 |x1 )

= p(x1 )p(x2 |x1 )p(xn , . . . , x3 |x2 , x1 ) . . .


n t=2

= p(x1 )

p(xt |xt1 , . . . , x1 ).

Em particular para um modelo ARMA(p, q), denotando o vetor de parmetros por a 2 =(1 , . . . , p , 1 , . . . , q , ) e destacando-se a densidade conjunta das p primeiras realizaoes segue que c
n

p(x1 , . . . , xn |) = p(x1 , . . . , xp |) = p(x1 , . . . , xp |)

t=p+1 n t=p+1

p(xt |xt1 , . . . , x1 , ) p(xt |xt1 , . . . , xp , ). (4.1)

A ultima igualdade vem da estrutura Markoviana da componente autoregressiva. O segundo termo em (4.1) a densidade condicional conjunta de xp+1 , . . . , xn dados os e valores iniciais x1 , . . . , xp e dene ento uma funao de verossimilhana condicional a c c enquanto p(x1 , . . . , xn |) dene a funao de verossimilhana exata. c c Se for atribuida uma distribuiao de probabilidades conjunta tambm para ento c e a pelo Teorema de Bayes poss obter sua distribuiao atualizada aps os dados serem e vel c o observados (distribuiao a posteriori), c p(|x) = p(x|)p() p(x|)p(). p(x) 33

34

CAP ITULO 4. ESTIMACAO

4.1

Autocovarincia e autocorrelao a ca

O coeciente de autocovarincia amostral de ordem k foi denido na Seao 2.4 como a c


nk

ck =
t=1

(xt x)(xt+k x)/n

que o estimador usual do coeciente de autocovarincia terico (k). As proprie a o edades deste estimador no sero detalhadas aqui mas podem ser encontradas por a a exemplo em Priestley (1981). Aps obter as estimativas de (k) os coecientes de o autocorrelaao so ento estimados como rk = ck /c0 , k = 1, 2, . . . . c a a Aqui sero consideradas apenas as propriedades de rk quando a amostra vem de a um processo puramente aleatrio (propriedades gerais podem ser obtidas em Kendall o et al. 1983, Cap tulo 48). Vimos na Seao 2.4.1 que o coeciente de autocorrelaao c c amostral rk assintoticamente normalmente distribuido, com mdia e varincia dados e e a por E(rk ) 1/n e V ar(rk ) 1/n. e os limites de conana aproximados de 95% frequentemente utilizados so dados c a por 1, 96/ n. No caso geral, limites de 100(1-)% podem ser construidos como q/2 / n sendo q/2 o percentil /2 da distribuiao normal padro. c a

Interpretando o correlograma
No Cap tulo 2 foram vistos alguns exemplos de correlogramas associados a caracter sticas de sries temporais observadas. O correlograma util tambm na identicaao e e e c do tipo de modelo ARIMA que fornece a melhor representaao de uma srie observada. c e Um correlograma como o da Figura 2.7 por exemplo, aonde os valores de rk decaem para zero de forma relativamente lenta, indica no estacionariedade e a srie precisa a e ser diferenciada. Para sries estacionrias o correlograma comparado com as autoe a e correlaoes tericas de vrios processos ARMA para auxiliar na identicaao daquele c o a c mais apropriado. Por exemplo, se r1 signicativamente diferente de zero e todos os e valores subsequentes r2 , r3 , . . . so prximos de zero ento um modelo MA(1) india o a e cado j que sua funao de autocorrelao terica se comporta assim. Por outro lado, se a c c o r1 , r2 , r3 , . . . parecem estar decaindo exponencialmente ento um modelo AR(1) pode a ser apropriado. Vale notar entretando que a interpretaao de correlogramas um dos aspectos c e mais dif ceis da anlise de sries temporais. A funao de autocorrelaao parcial um a e c c e importante coadjuvante nesta etapa de identicaao se houver termos autoregressivos c no modelo j que seus valores estimados tendem a car prximos de zero aps a a o o defasagem p. Vimos no Cap tulo 3 que para um processo ARMA(p, q) estacionrio a funao a c de autocorrelaao terica ter um decaimento exponencial ou oscilatrio aps a dec o a o o fasagem q enquanto que a funao de autocorrelaao parcial terica ter o mesmo c c o a comportamento aps a defasagem p. Mas na prtica esta distinao entre decaimentos o a c

4.2. AJUSTANDO PROCESSOS AUTOREGRESSIVOS

35

exponenciais e oscilatrios atravs das estimativas destas funoes pode ser bastante o e c dif cil.

4.2

Ajustando Processos Autoregressivos

Para um processo AR de ordem p com mdia dado por e Xt = 1 (Xt1 ) + + p (Xtp ) + t , e dadas n observaoes x1 , . . . , xn , os parmetros , 1 , , . . . , p podem ser estimados c a pelo mtodo de m e nimos quadrados, i.e. minimizando-se a soma de quadrados
n

S=

t=p+1

[(xt ) 1 (xt1 ) p (xtp )]2

com respeito a , 1 , , . . . , p . Note que o somatrio de t = p + 1 em diante, mas o e esta pequena perda de informaao no ser importante se a srie no for muito curta. c a a e a Alm disso, se o processo t tiver distribuiao normal ento as estimativas de m e c a nimos quadrado coincidem com as estimativas de mxima verossimilhana condicionada nas a c p primeiras observaoes. c Alternativamente, dois mtodos aproximados podem ser utilizados tomando-se e = x. O primeiro ajusta os dados ao modelo Xt x = 1 (Xt1 x) + + p (Xtp x) + t , como se fosse um modelo de regresso linear mltipla. a u No segundo mtodo os coecientes de autocorrelaao (k) so substituidos pelas e c a suas estimativas rk nas p primeiras equaoes de Yule-Walker. Ou seja, estamos usando c o mtodos dos momentos e por isto os estimadores resultantes so assintoticamente e a equivalentes aos estimadores de mxima verossimilhana. Assim, temos um sistema a c com p equaoes e p incgnitas 1 , . . . , p , i.e. c o r1 = 1 + 2 r1 + + p rp1

r2 = 1 r1 + 2 + + p rp2 . . .

rp = 1 rp1 + 2 rp2 + + p ou equivalentemente, r1 r2 .= . . rp 1 r1 . . . r1 1 . . . ... ... rp1 1 rp2 2 . . . . . . 1 p

rp1 rp2 . . .

Exemplo 4.1 : Usando os comandos do R abaixo vamos simular um processo AR(3) e usar as equaoes de Yule-Walker para estimar os coecientes. c

36 > > > > > > >

CAP ITULO 4. ESTIMACAO x = arima.sim(n = 200, model = list(ar = c(0.6, -0.7, 0.2))) r = acf(x, plot = FALSE)$acf[2:4] R = diag(3) R[1, 2] = R[2, 1] = r[1] R[1, 3] = R[3, 1] = r[2] R[2, 3] = R[3, 2] = r[1] round(solve(R, r), 4) 0.6659 -0.7513 0.2678

[1]

podemos reescrever o modelo na forma matricial como y = X + ,

Para estimaao por minimos quadrados basta escrever o AR(p) como um modelo c linear usual e resolver um sistema de equaoes lineares. Denindo-se c xp+1 xp . . . x1 p+1 1 x2 xp+2 xp1 . . . p+2 2 y= . X= . . = . = . . . . . . . . . . . xn xn1 . . . xnp n p (4.2)

2 sendo E() = 0, V ar() = I np e I np a matriz identidade de ordem n p. A soluao de m c nimos quadrados para os coecientes obtida minimizando-se e e e 1 X y. Usando o valor estimado de na equaao do modelo dada por = (X X) c calcula-se os res duos como y = X , i.e. p

et = xt

j xtj , t = p + 1, . . . , n
j=1

2 e e a estimativa de m nimos quadrados de dada por

2 =

1 np

e2 . t
t=p+1

Note que os res duos tambm foram calculados a partir de t = p + 1. e Mantendo a representaao (4.2) e adicionando a hiptese de normalidade dos erros, c o 2I i.e. N (0, np ) obtm-se uma funao de verossimilhana aproximada dada por, e c c
2 2 2 L(, ) ( )(np)/2 exp{ (y X) (y X)/2}. 2 nimos quadrados, Neste caso, os EMV de e coincidem com os estimadores de m 2 log(L(, )) 2 (y X) (y X) 2 2 (2 X y + X X) = 2 2 (2X y + 2X X). = 2

4.2. AJUSTANDO PROCESSOS AUTOREGRESSIVOS


2 log(L(, )) = 0 = (X X)1 X y. = 2 Lembrando que (y X ) (y X ) = n t=p+1 et segue que n 2 )) 1 log(L(, 2 2 = e2 (n p) log( ) + t 2 2 2 t=p+1 n 1 2 4 = (n p) e2 t 2 t=p+1

37

2 log(L(, )) 2

2 2 =

2 = 0 =

1 np

e2 . t
t=p+1

Exemplo 4.2 : Para um modelo AR(1) com erros normais a matriz X tem somente uma coluna e no dif vericar que a e cil
n n

XX=
t=2

x2 t1

e Xy=
t=2

xt xt1 .

Portanto, o EMV condicional dado por e =


n t=2 xt xt1 n 2 t=2 xt1

2 e =

1 n1

n t=2

(xt xt1 )2 .

Exemplo 4.3 : Novamente para o modelo AR(1) com erros normais o EMV incondicional obtido maximizando-se da funao de verossimilhana exata. A expresso e c c a (4.1) com p = 1 ca
n 2 p(x1 , . . . , xn |, )

2 p(x1 |, )

t=2

2 p(xt |xt1 , , ).

2 Lembrando que E(Xt ) = 0 e V ar(Xt ) = /(1 2 ) e razovel assumir que X1 a 2 /(1 2 )). Segue ento que N (0, a 2 L(, ) 2 1 2 1/2

exp

1 2 2 x 2 2 1
n t=2

2 ( )(n1)/2 exp

1 2 2

(xt xt1 )2
n

(1 )

2 1/2

2 ( )n/2 exp

1 2 2

(1

)x2 1

+
t=2

(xt xt1 )2

Maximizar esta expresso (ou seu logaritmo) em relaao a requer algum algoritmo a c de otimizaao numrica (por exemplo mtodos de Newton-Raphson). No R podemos c e e usar a funao optim como no Exemplo 4.4. c

38

CAP ITULO 4. ESTIMACAO

Exemplo 4.4 : Foram gerados 200 valores de um processo AR(1) com parmetros a 2 = 1. Os comandos abaixo podem ser usados para obter as estimativas de = 0, 8 e mxima verossimilhana (incondicional). Note que estamos maximizando o logaritmo a c da verossimilhana e vericando a condiao de estacionariedade. c c > fun = function(theta, x) { + s2 = theta[1] + alpha = theta[2] + if (abs(alpha) >= 1) + return(-Inf) + n = length(x) + e = x[2:n] - alpha * x[1:(n - 1)] + Q = (1 - alpha^2) * x[1]^2 + sum(e^2) + return(-0.5 * (n * log(s2) - log(1 - alpha^2) + Q/s2)) + } > > > + > x = arima.sim(n = 200, model = list(ar = 0.8)) init = c(1, 0.5) out = optim(init, fn = fun, method = "BFGS", control = list(fnscale = -1), hessian = T, x = x) out$par

[1] 1.0196881 0.8274672 Como o custo computacional de estimar modelos AR no to grande uma a e a abordagem alternativa para determinaao de p consiste em estimar modelos de ordem c progressivamente mais alta e calcular a soma de quadrados residual para cada valor de p. Pode ser poss encontrar o valor de p para o qual a incluso de termos extras vel a no melhora sensivelmente o ajuste. Como vimos na Seao 3.4.4 este procedimento a c d origem ` funao de autocorrelaao parcial. a a c c Suponha agora que vamos atribuir uma distribuiao de probabilidades para o c 2 ). Pelo Teorema de Bayes e usando a verossivetor de parmetros = (1 , . . . , p , a milhana condicional segue que c
2 2 p(|x) p() ( )(np)/2 exp{ (y X) (y X)/2}.

Para representar a informaao a priori sobre pode-se fazer por exemplo, p() = c 2 )p( 2 ) com | 2 N (0, 2 I ) ou p() = p()p( 2 ) com N (0, I ). Nos p(| p p 2 2 dois casos comumente assume-se que tem distribuiao Gama Inversa, i.e. c 2 GI(a, b) (ver Apndice A), ou equivalentemente Gama(a, b). e Exemplo 4.5 : No modelo AR(1) com erros normais vamos atribuir as seguintes 2 distribuioes a priori, N (0, 1) e GI(1, 1). Portanto, c p() exp(2 /2)
2 2 2 e p( ) ( )2 exp(1/ )

4.3. AJUSTANDO PROCESSOS MEDIAS MOVEIS

39

e os comandos abaixo podem ser usados para obter a moda da distribuiao a posteriori c 2 e . conjunta de > + + + + > > + > prior = function(theta) { s2 = theta[1] alpha = theta[2] return(-alpha^2/2 - 1/s2 - 2 * log(s2)) } post = function(theta, x) fun(theta, x) + prior(theta) out = optim(init, fn = post, method = "BFGS", control = list(fnscale = -1), hessian = T, x = x) out$par

[1] 1.0095348 0.8262561 Note que as estimativas pontuais nos Exemplos 4.4 e 4.5 so bastante similares. a Nenhuma restriao de estacionariedade foi imposta na distribuiao a priori, mas c c e poss fazer uma otimizaao restrita ou mesmo impor esta restriao a priori. No caso vel c c do AR(1) poderiamos atribuir uma distribuiao normal truncada ou uma distribuiao c c uniforme em (-1,1) para o parmetro . a

4.3

Ajustando Processos Mdias Mveis e o

O problema de estimaao dos parmetros em modelos MA bem mais complicado do c a e que em modelos AR. Os erros t so agora funoes no lineares complicadas dos para c a a metros 1 , . . . , q e expresses anal o ticas para os estimadores no podem ser obtidas. a Assim, mtodos computacionais iterativos precisam ser utilizados para minimizar a e soma de quadrados residual. Dado um modelo MA(q) Xt = + t + 1 t1 + + q tq e uma srie observada x1 , . . . , xn o procedimento iterativo consiste basicamente em e xar os valores de , 1 , . . . , q e calcular os res duos et = xt 1 t1 q tq sequencialmente para t = 1, . . . , n assumindo que 0 = 1 = = q+1 = 0 e substituindo t1 , . . . , tq pelos residuos calculados. Assim, e1 = x1

e2 = x2 1 e1 = x2 1 x1 + 1 e3 = x3 1 e2 2 e1 . . .

40

CAP ITULO 4. ESTIMACAO

Dados estes res duos pode-se calcular a soma de quadrados residual S(, ) = n 2 . Repetindo este procedimento para , , . . . , variando em uma grade 1 q t=1 et de pontos pode-se escolher os valores que minimizam a soma de quadrados. Este procedimento requer o uso de algoritmos ecientes de otimizaao numrica e nada c e garante a sua convergncia para um m e nimo global. Alm das estimativas pontuais, se o processo {t } tem distribuiao normal ento e c a Box & Jenkins (1970), p. 228 descrevem regies de conana para os parmetros do o c a 2 modelo. Neste caso, se t N (0, ) a funao de verossimilhana ca, c c
n 2 L(, , )

=
t=1

2 (2 )1/2 exp

1 2 e 2 2 t
n

2 ( )n/2 exp

1 2 2

e2 t
t=1

2 e e os valores de et so calculados como anteriormente. Portanto L(, , ) uma a funao no linear dos parmetros. c a a Em termos prticos, se o procedimento de otimizaao utilizado levar muitas itea c raoes para convergir ou mesmo no convergir deve-se desconar das estimativas. c a Neste caso as estimativas podem ser instveis no sentido de que adicionando-se ou a removendo-se uma ou duas observaoes pode-se obter valores muito diferentes. Nesta c situaao pode ser computacionalmente mais vantajoso ajustar um modelo AR aos c dados mesmo que o modelo resultante tenha mais parmetros do que o modelo MA a sugerido pela funao de autocorrelaao. c c

4.4

Ajustando Processos ARMA

Os problemas de estimaao para modelos ARMA so similares aqueles para modelos c a MA no sentido de que um procedimento iterativo precisa ser utilizado. Isto ocorre porque os erros {t } so funoes no lineares complicadas de todos os coecientes a c a 1 , . . . , p , 1 , . . . , q . Portanto os mesmos comentrios da seao anterior so vlidos a c a a para procedimentos que levam muitas iteraoes para convergir, i.e deve-se desconar c das estimativas. Os residuos so calculados de forma anloga ao modelo MA (ver a a Exerc 13). cio Outra diculdade, espec ca de modelos ARMA, o problema de cancelamento e de ra zes. Por exemplo considere o modelo ARMA(2,1) Xt = 2Xt1 2 Xt2 t1 + t que pode ser reescrito em termos do operador de retardo como (1 B)2 Xt = (1 B)t . Note como = implica em um modelo AR(1) Xt = Xt1 + t , ou seja ambos os modelos implicam exatamento no mesmo comportamento para a srie temporal Xt . e

4.5. MODELOS SAZONAIS

41

Este um problema de identicaao que ca ainda mais complicado em modelos de e c ordem mais alta. Em termos prticos dif identicar o problema de cancelamento de ra a no a e cil zes a ser, como j foi dito, que o procedimento iterativo dever ter convergncia lenta. No a a e caso particular de um modelo ARMA(1,1) deve-se desconar quando as estimativas de e so muito similares. Para outros valores de p e q a unica sugesto para tentar a a minimizar o problema no incluir muitos parmetros no modelo. e a a Exemplo 4.6 : Vamos simular um processo ARMA(1,1) com ra zes similares e vericar o problema de cancelamento de ra zes. > x = arima.sim(n = 100, list(ar = 0.7, ma = -0.75)) > arima(x, order = c(1, 0, 1), include.mean = F) Call: arima(x = x, order = c(1, 0, 1), include.mean = F) Coefficients: ar1 ma1 0.5992 -0.6835 s.e. 0.2946 0.2613 sigma^2 estimated as 1.020: log likelihood = -142.88, aic = 291.75

Note como as estimativas dos coecientes esto muito diferentes dos valores verdadeia ros e os erros padres esto enormes! o a

4.5

Modelos Sazonais

Muitas sries temporais contm uma componente peridica sazonal que se repete a e e o cada s observaoes (s > 1). Por exemplo, com dados mensais e s = 12 tipicamente c espera-se que Xt dependa de Xt12 e talvez de Xt24 alm de Xt1 , Xt2 , . . . . e Neste caso, tomar a primeira diferena xt xt1 no suciente para tornar a c a e srie (aproximadamente) estacionria. A forma apropriada de diferenciar dados com e a padro sazonal acentuado tomar diferenas no per a e c odo sazonal. Por exemplo, para dados mensais a primeira diferena sazonal c e 12 xt = (1 B 12 )xt = xt xt12 e ter variabilidade menor do que a primeira diferena no sazonal xt = xt xt1 , a c a sendo portanto mais fcil de identicar e estimar. a Em geral, uma diferena sazonal denotada por s onde s o per c e e odo sazonal. D . Combinando-se os dois tipos A D-sima diferena sazonal ento denotada por s e c e a c de diferenciaao obtem-se o operador d D . Por exemplo, tomando-se 1 diferena c s simples e 1 sazonal em uma srie mensal tem-se que e 12 xt = xt xt1 xt12 + xt13

42

CAP ITULO 4. ESTIMACAO

Box & Jenkins (1970) generalizaram o modelo ARIMA para lidar com sazonalidade e deniram um modelo ARIMA sazonal multiplicativo, denominado SARIMA, dado por (B)(B s )Wt = (B)(B s )t (4.3) onde (B) = (1 1 B p B p ) Wt = d D Xt s

(B s ) = (1 s B s P B P s ) (B) = (1 + 1 B + + q B q )

(B s ) = (1 + s B s + + Q B Qs ). Este modelo chamado SARIMA multiplicativo de ordem (p, d, q)(P, D, Q)s e e parece extremamente complicado ` primeira vista mas na prtica os valores de d e a a D em geral no sero maiores do que 1 e um nmero pequeno de coecientes ser a a u a suciente. Por exemplo, com P = 1 temos que (B s ) = (1 s B s ) o que signica simplesmente que Wt depende de Wts . A srie Wt formada a partir e e da srie original tomando-se diferenas simples para remover a tendncia e diferenas e c e c sazonais para remover a sazonalidade. Para xar idias considere o modelo SARIMA(1,0,0) (0, 1, 1)12 para dados mene sais. Ou seja temos um termo autoregressivo e um termo mdia mvel sazonal modee o lando a primeira diferena sazonal. O modelo pode ser escrito como c (1 B)(1 B 12 )Xt = (1 B 12 )t e desenvolvendo os produtos obtemos que Xt = Xt12 + (Xt1 Xt13 ) + t + t12 . Assim, Xt depende de Xt1 , Xt12 e Xt13 alm do erro no tempo t 12. e Para nalizar, ao ajustar um modelo sazonal aos dados a primeira tarefa ese pecicar os valores de d e D que tornam a srie (aproximadamente) estacionria e e a remove a maior parte da sazonalidade. Como j foi dito, estes valores raramente sero a a maiores do que 1. Posteriormente os valores de p, P , q e Q devem ser especicados com base nas funoes de autocorrelaao e autocorrelaao parcial da srie diferenciada. c c c e Os valores de P e Q so especicados basicamente a partir de rk , k = s, 2s, . . . . Por a exemplo, para dados mensais se r12 grande mas r24 pequeno isto sugere que um e e termo mdia mvel sazonal pode ser adequado. e o Aps ter identicado, por tentativa, o que parece ser um modelo SARIMA razovel o a os parmetros sero estimados por algum procedimento iterativo similar `queles proa a a postos para modelos ARMA. Detalhes sobre as rotinas de estimaao destes modelos c no sero abordados aqui e podem ser obtidos em Box & Jenkins (1970). a a

4.6. ADEQUACAO DO MODELO

43

4.6

Adequao do Modelo ca
Todos os modelos so errados mas alguns so uteis (George Box) a a

Aps identicar a ordem e estimar ecientemente os parmetros de um modelo o a e necessrio vericar sua adequaao antes de utiliz-lo por exemplo para fazer previses. a c a o Pode-se fazer testes de sobreajustamento, que consistem em incluir parmetros extras a no modelo e vericar sua signicncia estat a stica. No caso de modelos ARMA deve-se incluir um parmetro de cada vez para evitar o problema de cancelamento de ra a zes mencionado na Seao 4.4. c

4.6.1

Anlise dos Res a duos

Aps um modelo ter sido ajustado a uma srie temporal deve-se vericar se ele fornece o e uma descriao adequada dos dados. Assim como em outros modelos estat c sticos a idia e vericar o comportamento dos res e duos onde residuo = observaao - valor ajustado. c Para os modelos vistos aqui o valor ajustado a previso 1 passo a frente de modo e a que o res duo ca denido como o erro de previso 1 passo a frente. Por exemplo, a em um modelo AR(1) se a estimativa do coeciente autoregressivo ento o valor e a ajustado no tempo t xt1 e o res e duo correspondente et = xt xt1 . e Se o modelo tiver um bom ajuste espera-se que os res duos se distribuam aleatoriamente em torno de zero com varincia aproximadamente constante e sejam no a a correlacionados. Se a varincia dos res a duos for crescente uma transformaao logar c tmica nos dados pode ser apropriada. O fenmeno de no constncia na varincia o a a a denominado de volatilidade na literatura de sries temporais e pode ser tratado e e atravs de transformaoes nos dados (e.g. transformaoes de Box-Cox)1 . e c c Alm disso, em modelos de sries temporais os res e e duos esto ordenados no tempo a e portanto natural trat-los tambm como uma srie temporal. E particularmente e a e e importante que os res duos de um modelo estimado sejam serialmente (i.e. ao longo do tempo) no correlacionados. Evidncia de correlaao serial nos res a e c duos uma e indicaao de que uma ou mais caracter c sticas da srie no foi adequadamente descrita e a pelo modelo. Consequentemente, duas maneiras bvias de vericar a adequaao do modelo cono c sistem em representar gracamente os res duos e o seu correlograma. O grco tema poral poder revelar a presena de dados discrepantes, efeitos de autocorrelaao ou a c c padres c o clicos enquanto que o correlograma permite uma anlise mais detalhada da a estrutura de autocorrelaao indicando poss c veis termos faltantes no modelo. Ou seja, assim como em outros modelos estat sticos, a idia que os res e e duos podero identicar caracter a sticas que no foram adequadamente modeladas. Por a exemplo, autocorrelaoes residuais signicativas nas defasagens 1 ou 2, ou em defac sagens sazonais (e.g. 12 para dados mensais) so uma indicaao de que mais termos a c
Uma tendncia mais recente no entanto consiste em tentar modelar simultaneamente a mdia e e e a varincia ao invs de usar transformaes. a e co
1

44

CAP ITULO 4. ESTIMACAO

mdias mveis devem ser incluidos no modelo. Por outro lado, um valor de rk lie o geiramente fora dos limites de conana em defasagens sem signicado bvio (e.g. c o k=5) no indicaao suciente para se rejeitar o modelo. O mesmo comentrio vale a e c a para as autocorrelaoes parciais dos res c duos no que diz respeito ` incluso de termos a a autoregressivos (sazonais e no sazonais). a

4.6.2

Testes sobre os res duos

Ao invs de olhar para as autocorrelaoes residuais individualmente pode-se testar e c se um grupo de autocorrelaoes signicativamente diferente de zero atravs das c e e chamadas estat sticas Q. Para modelos ARMA Box & Jenkins (1970) sugeriram o uso do teste de Box-Pierce para as hipteses o H0 : (1) = = (m) = 0

H1 : (k) = 0, para algum k {1, . . . , m}. sendo a estat stica de teste dada por
m

Q=n
k=1

2 rk .

Na prtica o nmero m de autocorrelaoes amostrais tipicamente escolhido entre a u c e 15 e 30. Se o modelo ajustado for apropriado ento Q ter distribuiao aproximadaa a c mente qui-quadrado com m p q graus de liberdade. Assim, valores grandes de Q fornecem indicaao contra a hiptese de que as autocorrelaoes so todas nulas, em c o c a favor da hiptese de que ao menos uma delas diferente de zero. o e O teste de Box-Pierce no tem bom desempenho em amostras pequenas ou moa deradas no sentido de que a distribuiao se afasta da qui-quadrado. Vrios testes c a alternativos foram sugeridos na literatura e o mais conhecido o teste de Ljung-Box, e aonde a estat stica de teste dada por e
m

Q = n(n + 2)
k=1

2 rk . nk

Sua distribuiao amostral tambm aproximadamente c e e m p q graus de liberdade.

qui-quadrado

com

Exemplo 4.7 : Considere novamente a srie com os totais mensais de passageiros e em linhas areas internacionais nos EUA entre 1949 e 1960 que aparece na Figura ??. e Existe uma clara tendncia de crescimento bem como um padro sazonal ao longo e a dos anos. Foi feita uma transformaao logaritmica nos dados (esta transformaao c c sugerida na literatura). Faa os grcos da FAC amostral da srie original, 1a e c a e diferena e 1a diferena sazonal. Os comandos abaixo podem ser utilizados e obtmc c e se os grcos da Figura 4.1. a > y = log(AirPassengers) > z = cbind(y, diff(y), diff(y, lag = 12)) > yl = c("No de passageiros", "Variacao mensal", "Variacao anual")

4.6. ADEQUACAO DO MODELO

45

Os grcos anteriores indicam que precisamos tomar 1 diferena simples mais 1 a c diferena sazonal para tentar induzir estacionariedade aproximada. c > z = diff(diff(y), lag = 12) > m = acf(z, lag.max = 36, plot = F) > m$lag = m$lag * 12 Note que h valores grandes nas defasagens 1, 3, 12 e 23 do ultimo grco. Isto a a pode ser uma indicaao de que termos MA sazonais e no sazonais devem ser incluidos c a no modelo. Um modelo candidato para o logaritmo da srie SARIMA(0,1,1)x(0,1,1) e e e foi estimado usando os comandos abaixo. > m = arima(y, order = c(0, 1, 1), seasonal = list(order = c(0, + 1, 1))) > m Call: arima(x = y, order = c(0, 1, 1), seasonal = list(order = c(0, 1, 1))) Coefficients: ma1 -0.4018 s.e. 0.0896

sma1 -0.5569 0.0731 log likelihood = 244.7, aic = -483.4

sigma^2 estimated as 0.001348:

Como primeiro vericaao da adequaao do modelo vamos usar a funao tsdiag() c c c que retorna os grcos dos residuos padronizados, o correlograma e os p-valores do a teste de Ljung-Box para autocorrelaoes de ordem 1, 2, . . . . O resultado est na Figura c a 4.3. Compare estes p-valores com o resultado da funao Box.test() que calcula as c estatisticas de Box-Pierce e Ljung-Box para a hiptese nula de independncia. o e > for (i in 1:10) { + b = Box.test(m$residuals, i, type = "Ljung-Box")$p.value + print(b) + } [1] [1] [1] [1] [1] [1] [1] [1] [1] [1] 0.8610215 0.945251 0.4829255 0.3663102 0.4320234 0.488321 0.539204 0.6328112 0.5096084 0.5502512

46

CAP ITULO 4. ESTIMACAO

Testando a Normalidade dos Res duos


Para uma varivel aleatria X tal que E(X) = e V ar(X) = 2 dene-se os coecia o entes de assimetria e curtose como, A(X) = E (X )3 3 e K(X) = E (X )4 4

respectivamente. A distribuiao normal tem assimetria 0 e curtose igual a 3. Substic tuindo os momentos tericos de X pelos seus equivalente amostrais o mj = 1 n
n t=1

(Xt X)j

os estimadores da assimetria e curtose so dados por a m3 A= m3 2 e m4 K= m2 2

respectivamente. Sob a hiptese de normalidade as variveis aleatrias n/6A e o a o 3) so independentes e tm distribuiao assinttica N (0, 1) e assim a n/24(K a e c o estat stica nA2 n(K 3)2 + 6 24 2 com 2 graus de liberdade e pode ser usada para testar tem distribuiao assinttica c o a normalidade de X. As outras vericaoes usuais sobre os residuos tambm devem ser feitas. Por c e exemplo, um histograma com curva normal superposta, o grco de probabilidades a normais e um teste de normalidade. Os comandos abaixo podem ser utilizados no R. > z = m$residuals > d = seq(range(z)[1] - 3 * sd(z), range(z)[2] + 3 * sd(z), 0.001) > a = shapiro.test(z)

Exerc cios
1. Calcule as autocorrelaoes tericas de um processo MA(Q) puramente sazonal. c o 2. Faa um esboo do correlograma para uma srie com estrutura MA(Q) purac c e mente sazonal, i.e. no existe dependncia dentro de um per a e odo sazonal. 3. Para uma srie temporal observada foi identicado o modelo ARIMA(1,1,1). e (a) Escreva o modelo em termos do operador de retardo. (b) Descreva como deve ter sido o comportamento das funoes de autocorrelac cao e autocorrelaao parcial da srie original e da srie diferenciada. c e e 4. Escreva o modelo SARIMA(0, 0, 1) (1, 1, 0)12 em termos de operador de retardo.

4.6. ADEQUACAO DO MODELO

47

5. Para uma srie mensal observada foi identicado e estimado o modelo e SARIMA(1,1,0)(0,1,0). (a) Escreva o modelo em termos de operador de retardo. (b) Descreva como deve ter sido o comportamento das funoes de autocorrelac cao e autocorrelaao parcial da srie original e da srie diferenciada. c e e (c) Como deve ser o comportamento esperado dos res duos em termos de suas autocorrelaoes para que o modelo seja adequado? c (d) O que se deve fazer no caso de autocorrelaoes residuais signicativas nas c defasagens 1, 8 e 12 ? 6. Para uma srie observada trimestralmente foi identicado e estimado o modelo e SARIMA(1,1,0)(2,1,1). (a) Escreva o modelo em termos de operador de retardo. (b) Descreva como deve ter sido o comportamento das funoes de autocorrelac cao e autocorrelaao parcial da srie original e da srie diferenciada. c e e (c) O que se deve fazer se a autocorrelaao residual na defasagem 4 for signic cativa ? 7. Explique como voc estimaria os coecientes em um modelo ARMA(1,1) utilie zando as duas primeiras autocorrelaoes amostrais? c 8. Obtenha os estimadores de m nimos quadrados para os coecientes em um modelo AR(2). 9. Escreva as equaoes de m c nimos quadrados para o modelo AR(p). Como voc e estima a varincia dos erros? a 10. Em que condioes as estimativas de m c nimos quadrados de um modelo AR(p) coincidiro com as de mxima verossimilhana? a a c 11. Seja o modelo AR(1) com erros normais. (a) Obtenha os EMV usando a verossimilhana condicional. c (b) Obtenha os EMV usando a verossimilhana exata com c
2 X1 N (0, /(1 2 )).

12. Usando as notas de aula e qualquer outra referncia bibliogrca faa um resumo e a c da anlise de res a duos em sries temporais. e 13. Explique como podem ser calculados os res duos em um modelo ARMA(p,q).

48

CAP ITULO 4. ESTIMACAO

> par(mfrow = c(3, 2)) > for (i in 1:3) { + plot(z[, i], main = "", xlab = "Anos", ylab = yl[i]) + m = acf(z[, i], lag.max = 36, plot = F, na.action = na.pass) + m$lag = m$lag * 12 + plot(m, main = "", xlab = "defasagem", ylab = "FAC") + }

No de passageiros

5.0

FAC 1950 1954 Anos 1958

0.2 0

0.4 0.8

6.0

10

15

20

25

30

35

defasagem

Variacao mensal

0.2

FAC 1950 1954 Anos 1958

0.0

0.2

0.2 0

0.4

1.0

10

15

20

25

30

35

defasagem

Variacao anual

0.2

FAC 1950 1954 Anos 1958

0.0

0.2 0

0.4

1.0

10

15

20

25

30

35

defasagem

Figura 4.1:

4.6. ADEQUACAO DO MODELO

49

> par(mfrow = c(2, 1)) > plot(z, main = "serie com 1 diferenca simples e 1 sazonal", xlab = "Anos", + ylab = "") > plot(m, main = "")

serie com 1 diferenca simples e 1 sazonal


0.15 0.15 1950 0.00

1952

1954

1956 Anos

1958

1960

ACF

0.4 0

0.2

0.8

10

15 Lag

20

25

30

35

Figura 4.2:

50

CAP ITULO 4. ESTIMACAO

> tsdiag(m)
Standardized Residuals
3 3 1 1

1950

1952

1954 Time

1956

1958

1960

ACF of Residuals
0.4 0.8 0.2 0.0

ACF

0.5 Lag

1.0

1.5

p values for LjungBox statistic


0.8 0.0 0.4

p value

4 lag

10

Figura 4.3:

4.6. ADEQUACAO DO MODELO

51

> > > > > > >

par(mfrow = c(2, 1)) hist(z, freq = F) lines(d, dnorm(d, 0, sd(z))) qqnorm(z) qqline(z) text(-1.5, 0.05, "Teste de Shapiro-Wilk") text(-2, 0.01, paste("p-valor=", round(a$p.value, 4)))

Histogram of z
12 Density 0 4 8

0.10

0.05

0.00 z

0.05

0.10

Normal QQ Plot
Sample Quantiles 0.05 0.10

Teste de ShapiroWilk pvalor= 0.1674

Theoretical Quantiles

Figura 4.4:

Cap tulo 5

Previso a
Uma das formas de utilizaao de um modelo ajustado para fazer previses de valores c e o futuros. Assim, se t o per e odo corrente estamos interessados em prever os valores de Xt+1 , Xt+2 , . . . . A previso de Xt+k , para k = 1, 2, . . . ser denotada por xt (k) e a a e denida como a esperana condicional de Xt+k dados todos os valores passados, i.e. c xt (k) = E(Xt+k |xt , xt1 , . . . ). (5.1)

A equaao acima chamada de funao de previso e o inteiro k chamado de horizonte c e c a e de previso. Pode-se mostrar que esta previso tem o menor erro quadrtico mdio a a a e 2 . Na prtica temos um n mero nito de observaoes e (EQM), E(Xt+k xt (k)) a u c obtemos ento que xt (k) = E(Xt+k |xt , . . . , x1 ) que no tem o EQM m a a nimo mas pode ser visto como uma aproximaao de (5.1). c Note que se temos uma srie temporal observada x1 , . . . , xn as previses podem e o ser feitas dentro do per odo amostral e comparadas com os valores observados. Esta uma prtica bastante comum para checar a performance preditiva do modelo. A e a diferena entre os valores previsto e observado, xt (k) xt+k , chamada de erro de c e previso k passos a frente e ser denotado por et+k . a ` a

5.1

Mtodos Univariados de Previso e a

Os mtodos descritos nesta seao tm um forte apelo intuitivo, decompondo uma srie e c e e temporal em componentes de fcil interpretaao. Dados os recursos computacionais a c dispon veis atualmente eles tambm tm a vantagem de serem extremamente simples e e de programar e sua utilizaao ter um custo computacional muito pequeno. Vamos c comear com o caso mais simples, adequado para sries localmente constantes. c e

5.1.1

Alisamento Exponencial Simples

Dada uma srie temporal x1 , . . . , xn , no sazonal e sem tendncia sistemtica, razoe a e a e a vel tomar a estimativa de xn+1 como uma soma ponderada das observaoes passadas, c i.e. xn (1) = a0 xn + a1 xn1 + . . . 52

5.1. METODOS UNIVARIADOS DE PREVISAO

53

onde {aj } so os pesos. Parece razovel tambm dar um peso maior `s observaoes a a e a c mais recentes do que `s observaoes mais distantes no passado, i.e. a0 > a1 > . . . . a c Neste procedimento so adotados pesos que decaem geometricamente a uma taxa a constante dados por aj = (1 )j , j = 0, 1, . . . onde 0 < < 1 chamada de constante de alisamento. Assim, a previso 1 passo ` e a a frente em t = n ca xn (1) = xn + (1 )xn1 + (1 )2 xn2 + . . . . (5.2)

Naturalmente que na prtica haver um nmero nito de observaoes passadas e a a a u c soma acima ser tambm nita. A idia de que o contedo informativo de uma obsera e e u vaao decai com a sua idade bastante intuitivo e o parmetro est controlando c e a a o grau de envelhecimento deste contedo. u A equaao (5.2) costuma ser reescrita em forma de equaao recursiva. Colocandoc c se (1 ) em evidncia obtm-se que e e xn (1) = xn + (1 )[xn1 + (1 )xn2 + (1 )2 xn3 + . . . ] = xn + (1 )n1 (1) x (5.3)

i.e. uma mdia ponderada entre a observaao mais recente e a previso anterior. e c a A equaao (5.2) pode ainda ser reescrita na forma de correao de erro. Denindo c c en = xn xn1 (1) o erro de previso 1 passo ` frente no tempo n ento a a a xn (1) = xn1 (1) + en . Ou seja, a previso para t = n + 1 igual ` previso para t = n que foi feita em a e a a t = n 1 mais uma proporao do erro cometido. A previso k-passos a frente a c a e mesma, i.e xn (k) = xn (1), k = 2, 3, . . . .

Previses Dentro da Amostra o


Usando x0 (1) = x1 como previso inicial em t = 0 e denindo et = xt xt1 (1) os a erros de previso 1 passo ` frente, a equaao (5.3) pode ser usada recursivamente para a a c obter as previses, i.e. o xt (1) = xt + (1 )t1 (1), x Na forma de correao de erro as recurses cam c o xt (1) = xt1 (1) + et , t = 1, 2, . . . t = 1, 2, . . .

Especicao de ca
Vale notar que o valor de no depende da escala em que as observaoes foram media c das, mas sim das propriedades da srie temporal. O valor de deve ser especicado de e modo a reetir a inuncia das observaoes passadas nas previses. Valores pequenos e c o

54

CAP ITULO 5. PREVISAO

produzem previses que dependem de muitas observaoes passadas. Por outro lado, o c valores prximos de 1 levam a previses que dependem das observaoes mais recentes o o c e no caso extremo = 1 a previso simplesmente a ultima observaao. O valor de a e c tambm pode ser estimado a partir dos dados e o critrio utilizado a minimizaao e e e c da soma de quadrados dos erros de previso. Ou seja, dado um valor xo de e a usando a equaao (5.3), calcule c x0 (1) = x1 , x1 (1) = x1 + (1 )0 (1), x x2 (1) = x2 + (1 )1 (1), x . . . e2 = x2 x1 (1) e3 = x3 x2 (1) en = xn xn1 (1)

xn1 (1) = xn1 + (1 )n2 (1), x

n 2 e calcule t=2 et . Repita o procedimento para valores de variando entre 0 e 1 (digamos com incrementos de 0,1) e selecione o valor que minimiza esta soma de quadrados. Na prtica, o valor m a nimo pode ocorrer muito prximo de um dos extremos o do intervalo de variaao de . Isto pode ocorrer quando a soma de quadrados varia c muito pouco na regio em torno do m a nimo. Neste caso faz mais sentido utilizar valores no to extremos. a a

Exemplo 5.1 : No banco de dados do R, a srie lh contm as quantidades de um e e tipo de hormnio em amostras de sangue coletadas a cada 10 minutos de uma pessoa o do sexo feminino (Diggle 1990). Vamos aplicar o mtodo de alisamento exponencial e simples ` esta srie fazendo primeiro a seleao do valor de que minimiza a soma a e c dos quadrados dos erros de previso 1 passo a frente. Na Figura 5.1 temos o grco a a desta soma de quadrados como funao de e o grco das previses 1 passo ` frente c a o a juntamente com a srie observada. e O valor timo obtido foi = 0, 945 com a soma de erros quadrados igual a 11,86 o e os seguintes comandos do R podem ser utilizados para a seleao de . c

> AES = function(x, interval) { + e = NULL + for (alfa in interval) { + e2 = 0 + prev = x[1] + for (i in 2:length(x)) { + prev = c(prev, alfa * x[i - 1] + (1 - alfa) * prev[i + 1]) + e2 = e2 + (x[i] - prev[i])^2 + } + e = c(e, e2) + } + plot(interval, e, type = "l", xlab = expression(alpha), ylab = "Soma de quadra + e.min = min(e)

5.1. METODOS UNIVARIADOS DE PREVISAO + + + + + + } alfa = interval[e == e.min] prev = x[1] for (i in 2:length(x)) prev = c(prev, alfa * x[i - 1] + (1 alfa) * prev[i - 1]) return(list(alfa = alfa, sq2 = e.min, prev = prev))

55

> > > >

par(mfrow = c(2, 1)) m = AES(lh, seq(0.1, 0.99, 0.001)) plot(1:48, m$prev, ylab = "Hormonio", xlab = "Amostras", type = "l") points(lh)

Soma de quadrados dos erros

12.0

13.5

0.2

0.4

0.6

0.8

1.0

Hormonio

1.5 0

2.5

3.5

10

20 Amostras

30

40

Figura 5.1: Soma dos quadrados dos erros de previso 1 passo a frente em funao de . a c
Valores observados (pontos) e previses 1 passo a frente (linhas) usando o valor timo de . o o

Exemplo 5.2 : O procedimento do Exemplo 5.1 foi repetido para a srie de medidas e anuais de vazes do Rio Nilo entre 1871 e 1970, tambm do banco de dados do R. Os o e resultados esto na Figura 5.2. a

56 > > > >

CAP ITULO 5. PREVISAO par(mfrow = c(2, 1)) m = AES(Nile, seq(0.1, 0.99, 0.001)) plot(1:length(Nile), m$prev, ylab = "", xlab = "", type = "l") points(1:length(Nile), Nile)

Soma de quadrados dos erros

2100000

2700000

0.2

0.4

0.6

0.8

1.0

800 0

1000

20

40

60

80

100

Figura 5.2: Soma dos quadrados dos erros de previso 1 passo a frente em funao de . a c
Valores observados (pontos) e previses 1 passo a frente (linhas) usando o valor timo de o o

5.1.2

Mtodo de Holt-Winters e

O procedimento de alisamento exponencial pode ser generalizado para sries que cone tenham tendncia e variaao sazonal. Suponha por exemplo que as observaoes so e c c a mensais e sejam Lt , Tt e It o n vel, a tendncia e o e ndice sazonal no tempo t. Assim, Tt o aumento ou reduao esperada por ms no n atual da srie. e c e vel e Suponha que no tempo t os termos (L1 , T1 , I1 ), . . . , (Lt1 , Tt1 , It1 ) sejam conhecidos. Ento, aps observar xt os termos Lt , Tt e It so atualizados via alisamento a o a exponencial. Se a variaao sazonal for multiplicativa, i.e. com amplitudes que tendem c a crescer ao longo do tempo, as equaoes de atualizaao na forma de recorrncia so c c e a

5.1. METODOS UNIVARIADOS DE PREVISAO dadas por Lt = (xt /It12 ) + (1 )(Lt1 + Tt1 ) Tt = (Lt Lt1 ) + (1 )Tt1 It = (xt /Lt ) + (1 )It12

57

e as previses k per o odos ` frente so dadas por a a xt (k) = (Lt + kTt )It12+k , k = 1, 2, . . . .

No caso de sazonalidade aditiva as equaoes de atualizaao para o n c c vel e o ndice sazonal so modicadas para a Lt = (xt It12 ) + (1 )(Lt1 + Tt1 ) It = (xt Lt ) + (1 )It12 e as previses k per o odos ` frente cam a xt (k) = Lt + kTt + It12+k , k = 1, 2, . . . .

Aqui temos parmetros de alisamento, , e , para cada componente da srie a e que so em geral escolhidos no intervalo (0,1) e podem ser estimados minimizando-se a a soma de quadrados dos erros de previso como na seao anterior. Aqui vale tama c bm o comentrio sobre valores prximos aos extremos devido ` soma de quadrados e a o a variar pouco nesta regio. Alm disso, estes parmetros no dependem da escala das a e a a observaoes mas sim das propriedades temporais do n c vel, tendncia e sazonalidade e da srie. Valem os mesmos comentrios sobre estes valores reetindo a inuncia das e a e observaoes passadas nas previses de cada componente. c o Para o caso particular de sries sem variaao sazonal basta utilizar as equaoes e c c para Lt e Tt acima (sem o ndice It12 ). Ou seja, Lt = xt + (1 )(Lt1 + Tt1 ) Tt = (Lt Lt1 ) + (1 )Tt1 e a previso k passos ` frente no tempo t simplesmente Lt + kTt . Se a srie tambm a a e e e no tem uma tendncia sistemtica retorna-se ` equaao (5.3), ou seja a e a a c Lt = xt + (1 )Lt1 e Lt a previso 1 passo ` frente (t (1)). e a a x Exemplo 5.3 : A varivel UKLungDeaths contm os nmeros mensais de mortes por a e u doenas do pulmo (bronquite, esema e asma) no Reino Unido entre janeiro de 1974 c a e dezembro de 1979. A varivel composta por 3 sries: ambos os sexos (ldeaths), a e e sexo feminino (fdeaths) e sexo masculino (mdeaths). Aqui ser utilizada a funao a c HoltWinters do R que faz o alisamento exponencial de Holt-Winters com a srie ldee aths. As constantes de alisamento ( , e ) so determinadas minimizando a soma a

58

CAP ITULO 5. PREVISAO

dos quadrados dos erro de previso 1 passo ` frente. Considere um modelo sazonal a a aditivo. O resultado so as constantes de alisamento calculadas e as Estimativas a nais (em t = n) do nivel, tendncia e componentes sazonais. Pode-se tambm obter e e as previses e intervalos de previso (supondo normalidade) para modelos ajustados o a pelo mtodo de Holt-Winters. No grco da Figura 5.3 temos a srie original com a e a e srie suavizada mais as previses para os anos de 1980, 1981 e 1982 da srie ldeaths. e o e > data(UKLungDeaths) > m = HoltWinters(ldeaths, seasonal = "addit") > p = predict(m, n.ahead = 12, prediction.interval = T) > plot(m, p)

HoltWinters filtering
4000 Observed / Fitted 500 1975 1000 1500 2000 2500 3000 3500

1976

1977

1978 Time

1979

1980

1981

Figura 5.3: Srie original, srie suavizada e previses para o ano de 1980 da srie ldeaths via e e o e mtodo de Holt-Winters. e

5.2

Previso em Modelos ARMA a

Em modelos ARMA as previses podem ser obtidas usando-se diretamente a equaao o c do modelo. Assumindo que a equaao do modelo seja conhecida a previso xn (k) c a obtida substituido valores futuros dos erros por zero, valores futuros da srie e e

5.2. PREVISAO EM MODELOS ARMA

59

Xn+1 , Xn+2 , . . . pela sua esperana condicional, e valores passados de X e de pelos c seus valores observados. Tomemos como exemplo o modelo SARIMA(1, 0, 0) (0, 1, 1)12 . A equaao do c modelo dada por e (1 B)(1 B 12 )Xt = (1 + B 12 )t ou equivalentemente Xt = Xt12 + (Xt1 Xt13 ) + t + t12 . Neste caso, as previses 1 e 2 passos ` frente cam o a xn (1) = xn11 + (xn xn12 ) + n11

xn (2) = xn10 + (n (1) xn11 ) + n10 . x Note como o valor futuro Xn+1 foi substitu na segunda equaao pela sua esperana do c c condicional xn (1), i.e. a previso feita em t = n para t = n + 1. Previses para a o horizontes maiores podem ser obtidas recursivamente. No caso de modelos autoregressivos AR(p) no dif vericar como ca a funao a e cil c de previso. a xt (1) = 1 xt + + p xtp+1

xt (2) = 1 xt (1) + + p xtp+2 . . .

xt (p + 1) = 1 xt (p) + + p xt (1) de modo que as previses para horizontes maiores do que p usam apenas as previses o o anteriores. Para p = 1 por exemplo segue que xt (k) = t (k 1) = 2 xt (k 2) = = k xt x Para modelos mdias mveis MA(q) tambm no dif vericar que a equaao e o e a e cil c de previso ca a xt (1) = 1 t + + q tq+1

xt (2) = 2 t + + q tq+2 . . . xt (q) = q t xt (q + j) = 0, ou seja, xt (k) =


q i=k

j = 1, 2, . . .

0,

i t+ki , k = 1, . . . , q k>q

60

CAP ITULO 5. PREVISAO

Atualizao das Previses ca o


E interessante notar tambm como as previses podem ser atualizadas conforme novas e o observaoes da srie forem obtidas. Suponha por exemplo que o valor xn+1 foi obserc e vado. Neste caso a previso para t = n + 2 car condicionada em x1 , . . . , xn , xn+1 a a e pode ser facilmente atualizada para a nova origem n + 1. Para o modelo SARIMA visto acima a previso ca a xn+1 (1) = E(Xn+2 |xn+1 , . . . , x1 )

= xn10 + (xn+1 xn11 ) + n10 .

(5.4)

Somando e subtraindo n (1) no lado direito de (5.4) obtemos que x xn+1 (1) = xn10 + (n (1) xn11 ) + (xn+1 xn (1)) + n10 x = xn (2) + (xn+1 xn (1)) ou seja, a previso atualizada a previso anterior mais uma proporao do erro de a e a c previso 1 passo ` frente em t = n + 1. a a

Previses usando a forma MA o


As previses tambm podem ser obtidas reescrevendo-se o modelo como um processo o e mdias mveis de ordem innita. Neste caso temos que e o Xn+k = n+k + 1 n+k1 + + k n + k+1 n1 + . . . e ca claro que a previso k passos ` frente dada por a a e xn (k) = k n + k+1 n1 + . . . . (5.5)

Note que apenas os valores n , n1 , . . . foram utilizados j que a esperana dos valores a c futuros igual a zero. Esta forma particularmente util para o clculo da varincia e e a a do erro de previso. Da equaao (5.5) obtemos que o erro de previso k passos ` a c a a frente dado por e xn+k xn (k) = n+k + 1 n+k1 + + k1 n+1 e portanto a varincia do erro de previso dada por a a e
2 2 2 V ar(et+k ) = (1 + 1 + + k1 ) . 2 a a O ponto importante a se notar aqui que, para xo, a varincia do erro de previso e aumenta com o horizonte de previso. Na prtica, isto signica ter mais conana a a c em previses de curto prazo do que em previses de longo prazo. o o At agora no haviamos assumido nenhuma distribuiao de probabilidade para os e a c erros. Assumindo tambm que a sequncia {t } seja normalmente distribuida pode-se e e

5.2. PREVISAO EM MODELOS ARMA

61

construir intervalos de conana para Xt+k simtricos em torno das previses. Estes c e o so chamados intervalos de previso e so dados por a a a
k1 j=1

xt (k) z/2

E claro que neste caso a hiptese de normalidade precisa ser checada. o Finalmente, vale notar que na prtica os parmetros do modelo no so conhecidos a a a a de forma exata e precisam ser estimados. Os valores passados dos erros t tambm e precisam ser estimados como erros de previso um passo ` frente. Assim, por exemplo a a para o modelo SARIMA(1, 0, 0) (0, 1, 1)12 visto acima teremos que xn (1) = xn11 + (xn xn12 ) + n11 onde o erro de previso 1 passo ` frente em n 11 dado por a a e n11 = xn11 xn12 (1). Alm disso, os intervalos de previso obtidos sero intervalos aproximados devido a e a a esta substituiao. c Exemplo 5.4 : A Figura 5.4 mostra uma srie temporal com os totais mensais de e mortes por acidente nos Estados Unidos entre janeiro de 1973 e dezembro de 1978. Suponha que foi identicado o modelo SARIMA(0,1,1)x(0,1,1). Aps a estimaao, o c anlise de res a duos e vericaao da adequaao do modelo foram feitas previses para c c o o ano de 1979, i.e. previses 1, 2, . . . , 12 passos ` frente. Em julho de 1979 os valores o a para os primeiros 6 meses daquele ano foram disponibilizados e aparecem na Figura 5.5 juntamente com as previses. Note como os valores observados caram dentro o dos intervalos de previso fornecendo assim indicaao de que o modelo teve uma boa a c performance preditiva. Sendo assim, uma estratgia inicial para o segundo semestre e de 1979 consiste em simplesmente atualizar as previses. Os comandos do R para este o exemplo so dados a seguir. a

1 +

2 2 j .

Transformaes co
Em muitas aplicaoes a srie modelada na verdade uma transformaao dos dados c e e c originais, sendo a transformaao logaritmica a mais usual. Assim, tanto as previses c o pontuais quanto os intervalos de previso so obtidos para a srie transformada e estes a a e valores precisam ser transformados novamente para a escala original. A abordagem mais simples (e geralmente adotada) consiste simplesmente em tomar a transformaao c inversa, por exemplo se um modelo foi ajustado para a srie Xt = log Yt ento yn (k) = e a exp(n (k)) a previso k passos a frente da srie original. No entanto deve-se ter em x e a e mente que estas previses via transformaao inversa so em geral viesadas. Felismente o c a os intervalos de previso tem boas propriedades e por exemplo quanto se toma o antia logaritmo dos limites xn (k) z/2 var(en+k )

62

CAP ITULO 5. PREVISAO

> data(USAccDeaths) > plot(USAccDeaths, xlab = "Anos", ylab = "Numero de mortes por acidente")

Numero de mortes por acidente

7000 1973

8000

9000

10000

11000

1974

1975

1976 Anos

1977

1978

1979

Figura 5.4: Totais mensais de mortes por acidente nos Estados Unidos entre janeiro de 1973
e dezembro de 1978.

obtm-se um intervalo (geralmente assimtrico) de 100(1 )% para a previso pone e a tual yn (k). Exemplo 5.5 : Considere novamente a srie AirPassengers e faa transformaao e c c logaritmica nos dados (conforme sugerido na literatura). Estime um modelo SARIMA(0,1,1)x(0,1,1) usando os dados at dezembro de 1960 e faa previses de 1 at e c o e 12 meses ` frente para o ano de 1961 nas 2 escalas. As previses e intervalos de previa o so na escala transformada so dados na Tabela 5.1, enquanto as previses, intervalos a a o de previso e suas semi-amplitudes na escala original so dadas na Tabela 5.2. a a

5.3

Performance Preditiva

A idia de vericar a adequaao de um modelo em termos dos erros de previso um e c a passo ` frente foi apresentada na Seao 4.6. Na prtica preciso vericar se os res a c a e duos se comportam de maneira aleatria (ou imprevis o vel) em torno de zero e com varincia a

5.3. PERFORMANCE PREDITIVA previso a 6.11 6.05 6.17 6.20 6.23 6.37 6.51 6.50 6.32 6.21 6.06 6.17 li 6.04 5.97 6.08 6.09 6.12 6.25 6.38 6.37 6.18 6.06 5.91 6.00 ls 6.18 6.14 6.27 6.31 6.35 6.49 6.64 6.64 6.47 6.36 6.22 6.33

63

1961 Jan 1961 Feb 1961 Mar 1961 Apr 1961 May 1961 Jun 1961 Jul 1961 Aug 1961 Sep 1961 Oct 1961 Nov 1961 Dec

Tabela 5.1: Previses e limites inferior (li) e superior (ls) dos intervalos de previso. o a

aproximadamente constante, alm de serem no correlacionados ao longo do tempo. e a Alm disso, dois ou mais modelos podem ser comparados segundo a sua perfore mance preditiva, ou seja construindo-se medidas baseadas nos erros de previso. A a maioria dos mtodos de previso baseia-se na idia de minimizar somas de quadrados e a e ou de valores absolutos dos erros de previso e esta tambm uma medida usada a e e para comparar a adequaao de modelos alternativos. A idia ento comparar o erro c e a e quadrtico mdio e2 /(nm) ou erro absoluto mdio |et |/(nm) para diferentes a e e t modelos, onde m o nmero de parmetros a serem estimados. e u a Uma estratgia simples de se fazer previses consiste em tomar a observaao mais e o c recente como a melhor previso de um valor futuro da srie, i.e. xt (1) = xt . Note a e que esta a previso 1 passo ` frente de um passeio aleatrio. Assim, uma forma e a a o de medir a capacidade preditiva de um modelo consiste em comparar seus erros de previso com aqueles do passeio aleatrio. Isto pode ser feito atravs da chamada a o e estat stica U de Theil denida como U=
n1 2 t=1 (xt+1 xt (1)) . n1 2 t=1 (xt+1 xt )

Note que valores maiores do que 1 so uma indicaao de que globalmente os erros a c de previso tendem a ser grandes em relaao aos erros de um passeio aleatrio. Esta a c o no uma boa caracter a e stica e gostariamos que o valor de U fosse sempre menor do que 1. Vale notar tambm que neste caso os erros de previso esto sendo avaliados e a a independente da escala dos dados. Finalmente, vale notar que todas as medidas de capacidade preditiva citadas podem ser estendidas para erros de previso k passos a frente. a Outra prtica comum em sries temporais consiste em estimar o modelo excluindo a e algumas observaoes nais e usar o modelo estimado para fazer previses. Neste caso c o as previses podem ser comparadas com os valores observados. Por exemplo, para uma o

64 prev 450.42 425.72 479.01 492.40 509.05 583.34 670.01 667.08 558.19 497.21 429.87 477.24 li 418.53 390.81 435.08 443.00 453.98 516.02 588.18 581.40 483.18 427.59 367.37 405.40 ls 484.74 463.75 527.37 547.32 570.81 659.45 763.23 765.38 644.85 578.17 503.01 561.81

CAP ITULO 5. PREVISAO prev.li 31.89 34.91 43.93 49.41 55.07 67.33 81.83 85.68 75.01 69.62 62.50 71.84 ls.prev 34.32 38.03 48.36 54.92 61.75 76.11 93.22 98.30 86.66 80.96 73.14 84.57

1961 Jan 1961 Feb 1961 Mar 1961 Apr 1961 May 1961 Jun 1961 Jul 1961 Aug 1961 Sep 1961 Oct 1961 Nov 1961 Dec

Tabela 5.2: Previses e limites inferior (li) e superior (ls) e semi-amplitudes dos o intervalos de previso. a

srie mensal observada ao longo de 5 anos poderia-se estimar o modelo identicado e usando os primeiros 4 anos e meio (54 observaoes) e fazer previses para os ultimos c o 6 meses.

5.4

Critrios de Informao e ca

Em muitas aplicaoes vrios modelos podem ser julgados adequados em termos do c a comportamento dos res duos. Uma forma de discriminar entre estes modelos competidores utilizar os chamados critrios de informaao que levam em conta no e e c a apenas a qualidade do ajuste mas tambm penalizam a incluso de parmetros exe a a tras. Assim, um modelo com mais parmetros pode ter um ajuste melhor mas no a a necessariamente ser prefer em termos de critrio de informaao. A regra bsica a vel e c a consiste em selecionar o modelo cujo critrio de informaao calculado seja m e c nimo. A regra mais utilizada em sries temporais o chamado critrio de informaao de e e e c Akaike, denotado por AIC. A deniao mais comumente utilizada c e AIC = 2 log verossimilhana maximizada + 2m1 c onde m o nmero de parmetros (em modelos ARMA(p, q) m = p + q + 1). Para e u a dados normalmente distribuidos e usando-se estimativas de mxima verossimilhana a c para os parmetros pode-se mostrar que a AIC = n log( ) + 2m 2 onde = (1/n) 2
1

2 . t

O fator 2 somente uma conveno e no ir alterar a seleo do modelo. e ca a a ca

5.4. CRITERIOS DE INFORMACAO

65

Existem outros critrios de informaao que so basicamente modicaoes do AIC e c a c na forma de penalizar a incluso de parmetros extras. O mais famoso deles o a a e critrio de informaao Bayesiano, denotado por BIC e dado por e c BIC = 2 log verossimilhana maximizada + m log n. c Note como este critrio penaliza bem mais a incluso de parmetros do que o AIC e e a a portanto tende a selecionar modelos mais parcimoniosos. E sempre bom lembrar que estas medidas no tm nenhum signicado quando a e olhadas individualmente, i.e. considerando-se um unico modelo. Assim, tanto o AIC quanto o BIC podem assumir valores quaisquer, inclusive valores negativos, j que a eles dependem da forma da funao de verossimilhana. c c Vale lembrar tambm que ao usar tais critrios para comparar modelos a estie e maao precisa ser feita no mesmo per c odo amostral de modo que os modelos sejam comparveis. Note tambm que aumentando-se o nmero de termos autoregressivos a e u e/ou mdias mveis, o valor de m aumenta. Assim se a incluso de termos adicionais e o a no modelo no melhorar sensivelmente o ajuste, ento o AIC e o BIC (e qualquer a a outro critrio de informaao) sero maiores. e c a Para uma reviso geral destes e outros critrios de informaao no contexto de a e c sries temporais ver por exemplo Priestley (1981), Cap e tulo 5.

Identicao Revisitada ca
Vimos que as duas ferramentas bsicas para identicaao de modelos da classe ARIMA a c so as autocorrelaoes e autocorrelaoes parciais amostrais. Esta etapa envolve ala c c gum grau de arbitrariedade por parte do pesquisador ao interpretar estas funoes, c i.e. comparar subjetivamente seus valores amostrais com os correspondentes valores tericos. o Uma abordagem alternativa consiste em usar os critrios de informaao de um e c forma mais abrangente. Neste caso, um conjunto de poss veis modelos competidores denido a priori e aquele que minimiza o AIC ou BIC selecionado. Por exemplo, e e modelos ARMA(p, q) podem ser estimados sequencialmente variando os valores de p e q entre 0 e 3 digamos. Note que neste caso teremos 16 poss veis modelos sendo comparados e os critrios de informaao so agora funoes de p e q. Analogamente, e c a c para modelos AR(p) podemos variar o valor de p, digamos entre 1 e 10. Na prtica este procedimento pode ser aplicado de forma semi-automtica j que a a a muitos pacotes estat sticos fornecem estes valores. Porm aps um modelo ser selecie o onado a anlise residual ainda deve ser feita antes de se passar ` etapa das previses. a a o Outro problema de ordem prtica que pode haver dois ou mais modelos com AIC a e e/ou BIC muito similares de modo que no seja trivial discriminar entre eles. Nestas a situaoes Burnham & Anderson (1998), Seao 4.2, sugerem o uso de pesos que so c c a obtidos subtraindo-se o valor associado com o melhor modelo. Os pesos relativos ao AIC so dados por a wk exp(AIC(k)/2)

66

CAP ITULO 5. PREVISAO

sendo AIC(k) = AIC(k) min(AIC) e k a ordem do modelo. Estes pesos so e a ento normalizados para somarem 1 de modo que 0 < wk < 1 e a comparaao entre a c os modelos ca mais fcil. Se M o nmero total de modelos a comparaao ento a e u c e a baseada em wi wi = M , i = 1, . . . , M. j=1 wj Por exemplo, para modelos AR(p) os pesos relativos ao AIC so dados por a wp exp(AIC(p)/2), p = 1, . . . , pmax

sendo AIC(p) = AIC(p) min(AIC) e pmax deve ser especicado. Exemplo 5.6 : Na Figura 5.6 apresentada a srie com os totais anuais de linces e e canadenses capturados em armadilhas entre 1821 e 1934. Estes dados tm sido moe delados na literatura aps uma transformaao que consiste em tomar o logaritmo na o c base 10 e subtrair a mdia dos dados transformados. Vamos ajustar modelos AR(p) e com p variando de 1 at 5 e calcular os critrios de informaao e os respectivos pesos e e c para cada modelo. Os resultados esto na Tabela 5.3. Note que h falta de concora a dncia entre os critrios de informaao quanto ao melhor modelo. Isto pode ser uma a e c indicaao de que na verdade h 2 modelos descrevendo bem os dados. Outro proc a blema que o AIC seleciona um modelo com o valor mximo de p e isto pode indicar e a a necessidade de considerar mais termos autoregressivos. Repetindo o exercicio com p variando de 1 a 15 obteve-se a Tabela 5.4. p 1 2 3 4 5 AIC 242.3913 333.0988 332.7283 335.6596 335.8881 pesos AIC 0.0000 0.1057 0.0878 0.3802 0.4263 BIC 234.9189 321.8902 317.7835 316.9786 313.4709 pesos BIC 0.0000 0.8137 0.1044 0.0698 0.0121

1 2 3 4 5

Tabela 5.3: Critrios de informaao AIC e BIC e respectivos pesos para modelos e c AR(p) ajustados a srie Lynx. e

Os comandos do R utilizados no Exemplo 5.6 seguem abaixo. > > > > > > > > + y = log10(lynx) x = y - mean(y) p = 1:15 n = length(x) crit = matrix(0, nrow = length(p), ncol = 5) colnames(crit) = c("p", "AIC", "pesos AIC", "BIC", "pesos BIC") crit[, 1] = p for (k in p) { ar = arima(x, order = c(k, 0, 0), include.mean = F)

5.5. PREVISOES USANDO TODOS OS MODELOS + + + > > > > crit[k, 2] = n * log(ar$sigma2) + 2 * (k + 1) crit[k, 4] = n * log(ar$sigma2) + (k + 1) + (k + 1) * log(n) } aicp = bicp = crit[, crit[, exp(-(crit[, 2] - min(crit[, 2]))/2) exp(-(crit[, 4] - min(crit[, 4]))/2) 3] = aicp/sum(aicp) 5] = bicp/sum(bicp) p 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 AIC 242.3913 333.0988 332.7283 335.6596 335.8881 334.4484 338.8427 338.8505 338.3849 341.8678 354.5690 354.7117 353.0609 351.0895 349.2335 pesos AIC 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0001 0.0001 0.0001 0.0006 0.3581 0.3846 0.1685 0.0629 0.0249 BIC 234.9189 321.8902 317.7835 316.9786 313.4709 308.2950 308.9531 305.2247 301.0229 300.7696 309.7346 306.1411 300.7541 295.0465 289.4543 pesos BIC 0.0000 0.8100 0.1039 0.0695 0.0120 0.0009 0.0013 0.0002 0.0000 0.0000 0.0019 0.0003 0.0000 0.0000 0.0000

67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Tabela 5.4: Critrios de informaao AIC e BIC e respectivos pesos para modelos e c AR(p) ajustados a srie Lynx. e

Finalmente vale notar que se o nmero de modelos candidatos for muito grande u e a srie analisada muito longa o custo computacional deste mtodo pode ser muito e e alto. Por exemplo, em modelos SARIMA com pmax = qmax = 5, Pmax = Qmax = 2 e dmax = Dmax = 2 teremos mais de 500 modelos candidatos, sem contar poss veis transformaoes nos dados, diferentes distribuioes dos erros, presena de dados disc c c crepantes, alteraoes estruturais, etc. c

5.5

Previses Usando Todos os Modelos o

Suponha que existem k modelos candidatos denotados por M1 , M2 , . . . , Mk e desejase fazer a previso de Xn+h . Tratando tanto Xn+h quanto Mi como variveis aleata a o rias ento pelas regras de esperana condicional segue que a c
k

xn (h) = E(Xn+h |x) =

i=1

E(Xn+h |x, Mi )P (Mi |x).

68

CAP ITULO 5. PREVISAO

Ou seja, podemos escrever a previso pontual como uma mistura discreta de previses a o pontuais sob cada modelo considerado. A mesma lgica se aplica a qualquer funao de Xn+h , em particular o c
k 2 E(Xn+h |x)

=
i=1

2 E(Xn+h |x, Mi )P (Mi |x).

que pode ser usado para quanticar a incerteza sobre Xn+h , i.e.
2 V ar(Xn+h |x) = E(Xn+h |x) [E(Xn+h |x)]2 k

=
i=1 k

2 E(Xn+h |x, Mi )P (Mi |x) [E(Xn+h |x)]2

=
i=1

[V ar(Xn+h |x, Mi ) + E 2 (Xn+h |x, Mi )]P (Mi |x) [n (h)]2 x

Um procedimento para fazer previses usando todos os modelos estimados consiste o em substituir as probabilidades P (Mi |x) pelos pesos wi padronizados. Por exemplo, para modelos autoregressivos se pmax o nmero mximo de defasagens ento e u a a
pmax

E(Xn+h |x) =

i=1

E(Xn+h |x, AR(i))wi .

5.6

Previso Bayesiana a

Na prtica, os mtodos de previso em modelos ARIMA so aplicados substituindoa e a a se os parmetros do modelo pelas suas estimativas pontuais. Porm o fato de no a e a conhecermos os valores dos parmetros mais uma fonte de incerteza em relaao as a e c previses e que em muitas situaoes pode ser muito grande para ser ignorada. o c No contexto Bayesiano esta incerteza pode ser levada em conta j que a previso a a de valores futuros feita a partir da distribuiao preditiva de Xn+h , que dada por e c e p(xn+h |x) = p(xn+h |x, )p(|x)d.

Neste caso, todos os poss veis valores de esto sendo levados em conta e no apenas a a a sua estimativa pontual.

Exerc cios
1. No alisamento exponencial simples descreva a papel do parmetro . a 2. No mtodo de Holt-Winters descreva o papel dos parmetros , e . e a 3. Explique em que situaoes seriam usados os mtodos de Holt-Winters aditivo c e ou multiplicativo.

5.6. PREVISAO BAYESIANA 4. Seja o modelo MA(1), Xt = t + t1 .

69

(a) Obtenha a previso 1 passo ` frente em t = n e mostre que as previses k a a o passos ` frente para k = 2, 3, . . . so iguais a zero. a a
2 (b) Mostre que a varincia do erro de previso k passos ` frente dada por a a a e 2 para k = 1 e (1 + 2 ) para k = 2, 3, . . . .

5. Seja o modelo Xt = 90 + t + 0, 8t1 + 0, 5t1 . (a) Obtenha as previses k passos ` frente em t = n. o a (b) Obtenha a varincia do erro de previso k passos ` frente. a a a 6. Seja o modelo AR(1), Xt = Xt1 + t . (a) Mostre que a previso k passos ` frente feita em t = n dada por k xn . a a e (b) Mostre que a varincia do erro de previso k passos ` frente dada por a a a e 2 (1 2k )/(1 2 ). 7. Para o modelo SARIMA(0, 0, 1)(1, 1, 0)12 obtenha as previses no tempo t = n o para at 12 per e odos ` frente em termos das observaoes e residuos at o tempo a c e t = n. 8. Seja o modelo (1 B)(1 0, 2B)Xt = (1 0, 5B)t . (a) Obtenha as previses 1 e 2 passos ` frente. o a (b) Mostre que as previses 3 ou mais passos ` frente so dadas pela equaao o a a c recursiva xn (k) = 1, 2n (k 1) 0, 2n (k 2). x x (c) Obtenha a varincia dos erros de previso 1, 2 e 3 passos ` frente. a a a (d) Obtenha a previso xn (2) e o erro padro do erro de previso sabendo que a a a 2 = 2. n = 1, xn = 4, xn1 = 3 e 9. Seja o modelo ARIMA(1,0,1) para uma srie Xt com mdia zero. e e (a) Reescreva o modelo na forma de choques aleatrios, i.e. o Xt = t + 1 t1 + 2 t2 + . . . obtendo uma expresso geral para os coecientes j . a (b) Escreva a expresso da varincia do erro de previso et (k) = xt+k xt (k). a a a (c) Obtenha as previses xt (k) para horizontes k = 1 e k > 1. o 10. Sabe-se que se Y N (, 2 ) ento X = exp(Y ) tem distribuiao log-normal a c 2 /2) e V ar(X) = e2+ 2 (e 2 1). Se foram obtidas as com E(X) = exp( + previses k passos ` frente de Yt = log(Xt ) e assumindo que Yt normal mostre o a e que as previses na escala original so dadas por o a Xt (k) = exp(Yt (k) + Vy (k)/2) com varincia a exp(2Yt (k) + Vy (k)) [exp(Vy (k)) 1].

70

CAP ITULO 5. PREVISAO

11. Deseja-se ajustar um modelo ARMA a uma srie temporal estacionria mas e a os grcos das funoes de autocorrelaao e autocorrelaao parcial so pouco a c c c a informativos. Descreva um procedimento de identicaao alternativo (voc tem c e um pacote estat stico para fazer as contas). 12. Descreva um procedimento para obter previses h passos ` frente em modelos o a autoregressivos com nmero mximo de defasagens igual a kmax utilizando todos u a os modelos estimados. Ilustre situaoes em que as previses pontuais mdias c o e devem muito similares (ou muito diferentes) das previses usando somente o o melhor modelo.

5.6. PREVISAO BAYESIANA

71

> + + > > > > >

plot(ts(c(USAccDeaths, pacc$pred), frequency = 12, start = c(1973, 1)), xlab = "Anos", ylab = "Numero de mortes por acidente", ylim = c(6000, 12000)) abline(v = 1979 - 1/12, lty = 2) lines(pacc$pred + 1.96 * pacc$se, lty = 2) lines(pacc$pred - 1.96 * pacc$se, lty = 2) obs79 = c(7798, 7406, 8363, 8460, 9217, 9316) points(1979 + (0:5)/12, obs79, pch = "*")

Numero de mortes por acidente

10000

11000

12000

9000

** ** * *

6000 1973

7000

8000

1974

1975

1976

1977

1978

1979

1980

Anos

Figura 5.5: Previses para 1979 com observaoes do primeiro semestre incluidas. o c

72

CAP ITULO 5. PREVISAO

lynx

0 1820

1000

2000

3000

4000

5000

6000

7000

1840

1860

1880 Time

1900

1920

Figura 5.6: Totais anuais de linces canadenses capturados em armadilhas entre 1821 e 1934.

Cap tulo 6

Modelando a Varincia a
6.1 Introduo ca

Nos modelos vistos at aqui a varincia dos erros foi assumida constante ao longo e a 2 ) = 2 . Muitas sries temporais no entanto exibem do tempo, i.e. V ar(t ) = E(t e per odos de grande volatilidade seguidos de per odos de relativa tranquilidade. Nestes casos, a suposiao de varincia constante (homocedasticidade) pode no ser apropric a a ada. Na verdade, embora a varincia incondicional dos erros ainda possa ser assumida a constante, sua varincia condicional pode estar mudando ao longo do tempo. a Alm disso, em muitas situaoes prticas tem-se interesse em prever a varincia e c a a condicional da srie alm da srie propriamente dita. Por exemplo, no mercado de e e e aoes o interesse no apenas prever a taxa de retorno mas tambm a sua varincia c e a e a ao longo de um certo per odo. Esta varincia condicional tambm chamada de a e e volatilidade. Algumas referncias para este cap e tulo so Taylor (1986), Franses (1998), a e Tsay (2002). Exemplo 6.1 : Na Figura 6.1 os grcos da esquerda apresentam as taxas de cma a bio dirias da Libra Esterlina, Dolar Canadense, Marco Alemo e Iene Japones, em a a relaao ao Dolar Americano, enquanto nos grcos da direita esto os logaritmos das c a a taxas de variaao (retornos dirios). O per c a odo amostral vai de janeiro de 1991 a dezembro de 1998. Uma caracter stica comum nestes retornos que embora as mdias e e paream ser aproximadamente constantes as varincias mudam ao longo do tempo. c a Na Figura 6.2 esto os histogramas com uma curva normal superimposta para os a mesmos dados (retornos). Pode-se notar que muitos valores aparecem nas caudas das distribuioes. Finalmente, na Figura 6.3 temos as autocorrelaoes amostrais dos c c retornos e dos retornos ao quadrado. Note como existe bastante aucorrelaao entre os c retornos ao quadrado. Todas estas caracter sticas so em geral vericadas em sries a e reais de retornos e devem ser levadas em conta pelo modelo. A idia aqui tentar modelar simultaneamente a mdia e a varincia de uma srie e e e a e temporal. Para xar idias, suponha que um modelo AR(1), Xt = Xt1 + t foi e 73

74

CAP ITULO 6. MODELANDO A VARIANCIA

y.Dolar Canadense y.Libra Esterlina y.Iene Japonesy.Marco Alemao

0.70

z.Dolar Canadense z.Libra Esterlina z.Iene Japonesz.Marco Alemao


0 500 1000 1500 2000

0.60

1.4

1.2

1.4

140

100

120

80

0.04 0

0.00

0.03

0.00

1.6

0.02 0.015

1.8

0.000

0.015 0.03

0.50

0.00

0.02

500

1000

1500

2000

Figura 6.1: Taxas de cmbio e retornos dirios em relaao ao Dolar Americano da a a c Libra Esterlina, Dolar Canadense, Marco Alemo e Iene Japones, entre janeiro de a 1991 a dezembro de 1998. estimado e deseja-se fazer previses 1 passo ` frente, o a xt (1) = E(Xt+1 |xt ) = xt . A varincia condicional de Xt+1 dada por a e V ar(Xt+1 |xt ) = V ar(t+1 |xt ) = E(2 |xt ). t+1
2 At agora assumimos que E(2 |xt ) = , mas suponha que a varincia condicional e a t+1 2 |x ) = 2 . Uma poss vel causa disto que os dados e no seja constante, i.e. E(t+1 t a t+1 se distribuem com caudas muito longas. Para facilitar a notaao vamos denotar por c 2 = V ar( |I It = {xt , xt1 , . . . , t , t1 , . . . }, ou seja t t t1 ).

6.2

Modelos ARCH

Existem vrias formas de especicar como a varincia condicional (volatilidade) varia a a 2 com o tempo. Uma estratgia utilizada para modelar t , proposta em Engle (1982), e

6.2. MODELOS ARCH

75

Libra Esterlina
80

Dolar Canadense

60

40

20

0.03

0.01

0.01

0.03

0 0.015

50

100

150

0.000

0.010

Marco Alemao
60

Iene Japones

60

40

20

0.03

0.01

0.01

0.03

0 0.06

20

40

0.02

0.02

Figura 6.2: Histogramas dos retornos dirios do Exemplo 6.1. a consiste em assumir que ela depende dos quadrados dos erros passados, t1 , t2 , . . . atravs de uma autoregresso. No caso mais simples, faz-se e a t = vt c + 2 t1 (6.1)

onde {vt } uma srie puramente aleatria com mdia zero e varincia igual a 1 e vt e e o e a e t so independentes. Segue que a esperana e a varincia condicionais so dadas a c a a por, E(t |It1 ) = E(vt ) c + 2 = 0 t1 (6.2)

2 E(2 |It1 ) = t = c + 2 t t1

Neste caso dizemos que a varincia segue um processo autoregressivo condicionalmente a heterocedstico de ordem 1, ARCH(1). Note que necessrio impor as restrioes c > 0 a e a c 2 e 0 para que t seja sempre positiva. Quando = 0 a varincia condicional a e constante e t um processo condicionalmente homocedstico. e a Alm disso queremos garantir a estacionariedade da autoregresso de modo que a e a restriao imposta 0 < < 1. Note tambm que (6.2) no inclui um termo de erro c e e a e portanto no um processo estocstico. a e a

76
Libra Esterlina

CAP ITULO 6. MODELANDO A VARIANCIA


Libra Esterlina^2
0.02 0 5 15 25 0.04 0 5

Dolar Canadense

0.04

0.04

0 5

15

25

0.05

0.10

15

25

Dolar Canadense^2

Marco Alemao

Marco Alemao^2

0.10

0.05

0.06

0.00

0 5

15

25

0 5

15

25

0.05 0 5

0.10

15

25

Iene Japones
0.10 0.25 0 5 15 25 0.05 0.10

Iene Japones^2

0.00

0 5

15

25

Figura 6.3: Correlogramas dos retornos e retornos ao quadrado no Exemplo 6.1 A esperana e varincia incondicionais podem ser obtidas como, c a E(t ) = E[E(t |It1 )] = 0

V ar(t ) = E(2 ) = E[E(2 |It1 )] = c + E(2 ). t t t1 Se o processo estacionrio ento E(2 ) = E(2 ) = V ar(t ) e portanto e a a t t1 V ar(t ) = Alm disso, e Cov(t , t+k ) = E(t t+k ) = E[E(t t+k )|t+k1 , . . . , t1 ] = E[t E(vt+k c + t+k1 )] = 0, para k > 0. c . 1

Ou seja, ao postular o modelo ARCH(1) estamos assumindo que os {t } so no a a correlacionados. Exemplo 6.2 : Para ilustraao a Figura 6.4 apresenta dois processos ARCH de ordem c 1 simulados a partir de uma sequncia {vt } de 200 nmeros aleatrios i.i.d. gerados e u o de uma distribuiao N (0, 1). A sequncia {t } foi construida usando a equaao (6.1) c e c

6.2. MODELOS ARCH

77

com c = 1 e = 0, 8. Note como a sequncia {t } continua tendo mdia zero mas e e parece ter tido um aumento de volatilidade em alguns per odos. Em um modelo AR(1), a forma como esta estrutura nos erros afeta a srie original depende do valor e do parmetro autoregressivo e duas poss a veis situaoes so mostradas nos grcos c a a inferiores da gura. Na Figura 6.5 temos o histograma dos valores {t } gerados, com uma curva normal superimposta, alm do grco de probabilidades normais (QQe a plot normal). Note como h um excesso de valores nas caudas ocorrendo com uma a frequncia maior do que seria esperado na distribuiao normal. e c
processo aleatrio
10 10 0 50 100 150 200 5 0 0 5

(t) = v(t) 1 + 0.8(t 1)2

50

100

150

200

x(t) = 0.5x(t 1) + (t)


10 10

x(t) = 0.9x(t 1) + (t)

50

100

150

200

5 0

50

100

150

200

Figura 6.4: Processos autoregressivos com erros ARCH(1) simulados. Basicamente a equaao (6.2) nos diz que erros grandes (ou pequenos) em valor c absoluto tendem a ser seguidos por erros grandes (ou pequenos) em valor absoluto. Portanto o modelo adequado para descrever sries aonde a volatilidade ocorre em e e 2 grupos. Alm disso, na equaao (6.2) somando 2 e subtraindo t de ambos os lados e c t obtemos que 2 = c + 2 + t t t1
2 2 2 com t = 2 t = t (vt 1). Ou seja, o modelo ARCH(1) pode ser reescrito como t 2 um AR(1) estacionrio para 2 com erros no normais (vt 2 se vt N (0, 1)) que a a t 1 tm mdia zero e varincia no constante. Portanto, a funao de autocorrelaao do e e a a c c processo {2 } dada por (k) = k e o correlograma amostral deve apresentar um e t

78

CAP ITULO 6. MODELANDO A VARIANCIA

0.00 0.15 0.30

densidades

QQ plot Normal
quantis amostrais 4 4 3 0

0 quantis teoricos

Figura 6.5: Caracteristicas de um processo ARCH(1) simulado. decaimento exponencial para zero. Se o processo ARCH(1) for estacionrio no dif calcular o seu coeciente de a a e cil curtose que dado por e E(4 ) t . = [V ar(t )]2
4 Denotando por E(vt ) = o quarto momento do erro segue que o quarto momento condicional dado por e 4 4 4 E(4 |It1 ) = E(vt t |It1 ) = E(t |It1 ) = (c + 2 )2 . t t1

Se o processo estacionrio de quarta ordem ento podemos escrever E(4 ) = e a a t E(4 ) = 4 e portanto, t1 4 = (c2 + 2 4 + 2c e nalmente, 4 = c ) = c2 1 1+ 1 + 2 4

(se assumirmos que vt N (0, 1) ento = 3). Portanto, o quarto momento incondia cional ca, E(4 ) = E[E(4 |It1 )] = E(c2 + 2 4 + 2c2 ). t t t1 t1

c2 (1 + ) . (1 )(1 2 )

6.2. MODELOS ARCH O coeciente de curtose ento ca, a = (1 )2 c2 (1 + ) (1 2 ) = , 2 < 1/ (1 )(1 2 ) c2 1 2

79

que sempre maior do que . Ou seja, qualquer que seja a distribuiao de vt o coee c ciente de curtose ser maior do que a curtose de vt (desde que > 0 e > 1). Em a particular, processos ARCH(1) tm caudas mais pesadas do que a distribuiao nore c mal e so portanto adequados para modelar sries temporais com esta caracter a e stica. Sries de retornos, como as do Exemplo 6.1, frequentemente apresentam caudas mais e pesados do que a normal devido ao excesso de curtose.

Previses da Volatilidade o
Suponha que uma srie temporal Xt segue um processo ARCH(1), i.e. Xt = vt ht , e vt N (0, 1). As previses da volatilidade, k passos ` frente, no tempo t = n so o a a obtidas como, 2 hn (k) = E(hn+k |In ) = c + E(Xn+k1 |In ).
2 2 E(Xn+k1 |In ) = E(hn+k1 vn+k1 |In )

2 2 Para k = 1 segue que E(Xn+k1 |In ) = Xn+k1 e para k > 1 temos que 2 = E(hn+k1 |In )E(vn+k1 |In ) = E(hn+k1 |In ) = hn (k 1)

pois hn+k1 e vn+k1 so independentes. As previses ento cam, a o a hn (k) =


2 c + Xn , k = 1 c + hn (k 1), k = 2, 3, . . .

O Modelo ARCH(p)
Estas idias podem ser generalizadas para processos mais gerais ARCH(p) em que a e varincia condicional depende dos quadrados de p erros passados, i.e. a t = vt c + 1 2 + + p 2 tp t1 (6.3)

e ento a varincia condicional modelada como, a a e


2 t = E(2 |It1 ) = c + 1 2 + + p 2 . t t1 tp 2 Neste caso, para garantir que t seja sempre positiva necessrio impor a seguintes e a restrioes c > 0 e 1 0, . . . , p 0 e para garantir estacionariedade necessrio c e a p = 0 estejam fora do c tambm que as ra e zes de 1 1 B p B rculo unitrio. a p Juntando estas restrioes equivale a impor a restriao c > 0 e i=1 i < 1. c c Analogamente podemos reescrever o modelo ARCH(p) como um modelo AR(p) para 2 denindo os erros t como anteriormente, i.e. t

2 = c + 1 2 + + p 2 + t . t t1 tp
2 2 com t = t (vt 1).

80

CAP ITULO 6. MODELANDO A VARIANCIA

Identicao ca
A caracter stica chave dos modelos ARCH que a varincia condicional dos erros t se e a comporta como um processo autoregressivo. Portanto deve-se esperar que os res duos de um modelo ARMA ajustado a uma srie temporal observada tambm sigam este e e padro caracter a stico. Em particular, se o modelo ajustado for adequado ento a FAC a e a FACP dos res duos devem indicar um processo puramente aleatrio, no entanto o se a FAC dos quadrados dos res duos, 2 , tiver um decaimento caracter t stico de uma autoregresso isto uma indicaao de que um modelo ARCH pode ser apropriado. A a e c ordem p do modelo pode ser identicada atravs da FACP dos quadrados dos res e duos.

Previses da Volatilidade o
Suponha que uma srie temporal Xt segue um processo ARCH (p). As previses da e o volatilidade, k passos ` frente, no tempo t = n so obtidas como, a a
p

hn (k) = E(hn+k |In ) = c +

i=j

2 j E(Xn+kj |In ).

2 2 Para k j segue que E(Xn+kj |In ) = Xn+kj e para k > j temos que 2 2 E(Xn+kj |In ) = E(hn+kj vn+kj |In )

2 = E(hn+kj |In )E(vn+kj |In ) = E(hn+kj |In ) = hn (k j)

j que hn+k1 e vn+k1 so independentes. a a

6.3

Modelos GARCH

Uma generalizaao natural dos modelos ARCH consiste em assumir que a varincia c a condicional se comporta como um processo ARMA, i.e. depende tambm de seus e valores passados. Fazendo t = vt ht onde
p q

ht = c +
i=1

i 2 ti

+
j=1

j htj

segue que a esperana condicional de t zero e a varincia condicional c e a e 2 e t = ht . Este modelo chamado ARCH generalizado, ou GARCH, de ordem (p, q). Aqui as restrioes impostas sobre os parmetros so dadas por c > 0 e c a a p q i=1 i + j=1 j < 1. Embora a primeira vista parea um modelo mais complexo, sua vantagem sobre c os modelos ARCH basicamente a parcimnia. Assim como um modelo ARMA pode e o ser mais parcimonioso no sentido de apresentar menos parmetros a serem estimados a do que modelos AR ou MA, um modelo GARCH pode ser usado para descrever a volatilidade com menos parmetros do que modelos ARCH. a

6.3. MODELOS GARCH

81

Em termos de identicaao dos valores de p e q as ferramentas bsicas so mais c a a uma vez a FAC e a FACP dos quadrados dos res duos. Assim, se o modelo ajustado for adequado a FAC e a FACP dos res duos devem indicar um processo puramente aleatrio, no entanto quando estas funoes so aplicadas aos quadrados dos res o c a duos elas devem indicar um processo ARMA(p, q). A identicaao pode no ser muito fcil c a a em algumas aplicaoes embora na maioria dos casos um modelo GARCH(1,1) seja c suciente. Na prtica recomenda-se tambm tentar outros modelos de ordem baixa a e como GARCH(1,2) e GARCH(2,1). As previses da volatilidade em modelos GARCH so obtidas de forma similar o a a de um modelo ARMA. Por exemplo, aps estimar os parmetros de um modelo o a GARCH(1,1) e assumindo-se que 0 = h0 = 0 pode-se construir as sequncias 1 , . . . , t e e h1 , . . . , ht e a previso 1 passo ` frente da volatilidade ca a a t (1) = c + 2 + ht . 2 t

6.3.1

Estimao ca

Para uma srie x1 , . . . , xn observada e um modelo GARCH(p, q), denotando-se o vetor e de parmetros por =(c, 1 , . . . , p , 1 , . . . , q ) e destacando-se a densidade conjunta a das p primeiras realizaoes segue que c
n

p(x1 , . . . , xn |) = p(x1 , . . . , xp |) Assumindo normalidade segue que

t=p+1

p(xt |xt1 , . . . , xtp , ).

Xt |xt1 , . . . , xtp N (0, ht ) e portanto


n

p(x1 , . . . , xn |) = p(x1 , . . . , xp |)

(2ht )1/2 exp((1/2)x2 /ht ). t


t=p+1

Em geral o nmero de observaoes ser grande o suciente para que o termo u c a p(x1 , . . . , xp |) possa ser desprezado. Por exemplo, para um modelo ARCH(1) a funao log-verossimilhana ca c c
n

0.5

log(2) + log(c + x2 ) + x2 /(c + x2 ) . t1 t t1


t=2

Note que algum algoritmo de otimizaao no linear dever ser utilizado e nada garante c a a sua convergncia para um timo global. No R pode-se usar a funao garch do pacote e o c tseries para fazer a estimaao por mxima verossimilhana. c a c

82

CAP ITULO 6. MODELANDO A VARIANCIA

6.3.2

Adequao ca

Se um modelo ARCH ou GARCH foi ajustado a uma srie Xt no correlacionada e a ento os res a duos padronizados so dados por a Xt Xt = ht e formam uma sequncia i.i.d. com distribuiao normal padro. Assim, a adequae c a cao do modelo pode ser vericada aplicando os testes usuais de normalidade a estes residuos padronizados e os testes de aleatoriedade (Box-Pierce e Ljung-Box) aos quadrados dos res duos. Exemplo 6.3 : Na parte superior da Figura 6.6 esto os preos dirios no fechamento a c a de um indice de mercado da Alemanha (DAX), entre 1991 e 1998. O interesse em e analisar os chamados retornos dados por log(xt /xt1 ) e estes esto no grco inferior a a da Figura 6.6. Existe evidncia na literatura que modelos GARCH(1,1) conseguem e captar bem os movimentos caracter sticos dos retornos.

DAX

2000

5000

1992

1993

1994

1995

1996

1997

1998

retornos

0.10

0.00

1992

1993

1994

1995

1996

1997

1998

Figura 6.6: Preos dirios no fechamento de um indice de mercado da Alemanha (DAX), c a


entre 1991 e 1998 e respectivos retornos.

6.4. VOLATILIDADE ESTOCASTICA Usando a funao garch no pacote tseries do R o modelo ajustado obtido foi c Yt = vt ht , vt N (0, 1)

83

2 ht = 0.000005 + 0.068Yt1 + 0.889ht1

sendo todos os coecientes signicativos. O teste de Ljung-Box aplicado nos quadrados dos residuos indicou aleatoriedade (p-valor = 0,71), no entanto o teste de normalidade de Jarque-Bera aplicado aos residuos rejeitou a hiptese nula (p-valor<0,001). o Assim a hiptese de normalidade condicional parece estar sendo violada. o Na Figura 6.7 esto os histogramas, grcos de probabilidades normais dos retora a nos e res duos do modelo GARCH(1,1) estimado, alm dos correlogramas dos quae drados dos retornos e res duos. Use os comandos abaixo para estimar o modelo. > > > > > > > library(tseries) data(EuStockMarkets) x = EuStockMarkets dax = diff(log(x))[, "DAX"] dax.garch = garch(dax, trace = F) r = dax.garch$residuals round(dax.garch$coef, 6)

a0 a1 b1 0.000005 0.068329 0.889067 Um fato estilizado presente em sries temporais nanceiras que o mercado tem e e baixa volatilidade quando est em alta e alta volatilidade quando est em baixa. a a Tal assimetria no levada em conta pelos modelos GARCH e para contornar esta a e limitaao outros modelos foram propostos na literatura. Por exemplo, no modelo c EGARCH (ou GARCH exponencial) modela-se o logaritmo da volatilidade como,
2 log(t ) = c +

t1 t1 2 + + t1 . t1 t1

Em termos de estimaao uma vantagem deste modelo que os parmetros c, e so c e a a irrestritos j que estamos modelando o logaritmo da volatilidade. A unica restriao a c e < 0 pois assim a volatilidade aumenta quando t1 < 0.

6.4

Volatilidade Estocstica a

2 As frmulas para modelar t vistas at agora foram todas determin o e sticas, i.e. sem uma componente de erro aleatrio. No entanto, pode ser mais razovel assumir que a o a varincia condicional varia estocasticamente ao longo do tempo ao invs de determia e nisticamente, especialmente se existem mudanas abruptas na volatilidade (e.g. como c resultado de greves, guerras, etc.).

84

CAP ITULO 6. MODELANDO A VARIANCIA

DAX
30

Residuos

0 10

0.10

0.05

0.00

0.05

0.0

0.2

10

DAX
0.10 5

Residuos

0.00

0.10

DAX^2
0.8 0.8

Residuos^2

0.4

0.0

10

15

20

25

30

0.0 0

0.4

10

15

20

25

30

Figura 6.7: Histogramas e probabilidades normais dos retornos do indice de mercado da


Alemanha (DAX) e res duos do modelos GARCH(1,1) e correlogramas dos seus quadrados.

2 t

Assim, uma alternativa aos modelos ARCH ou GARCH consiste em assumir que 2 segue um processo estocstico. Geralmente modela-se o logaritmo de t . Em sua a forma mais simples um modelo de volatilidade estocstica (VE) dado por a e Xt = vt exp(ht /2), vt N (0, 1)

2 ht = c + ht1 + t , t N (0, )

2 com || < 1 e ht = log(t ). Note que no h necessidade de restrioes de positividade a a c nos parmetros pois estamos modelando o logaritmo da volatilidade. O modelo pode a ser estendido para uma estrutura AR(p) em ht , ou seja

Xt = vt exp(ht /2), vt N (0, 1)


p

ht = c +
i=1

2 i hti + t , t N (0, )

Propriedades
1. E(Xt ) = E(vt eht /2 ) = E(eht /2 )E(vt ) = 0, j que ht e vt so independentes. a a

6.4. VOLATILIDADE ESTOCASTICA

85

2 2 2 2. V ar(Xt ) = E(Xt ) = E(eht vt ) = E(eht )E(vt ) = E(eht ). Mas, como estamos assumindo que ht estacionria segue que, e a 2 E(ht ) = e V ar(ht ) = h = 2 /(1 2 ) 2 e a distribuiao incondicional do log-volatilidade ht N (, h ). Portanto, eht c e log-normal e segue que e

V ar(Xt ) = E(eht ) = e+h /2 .


4 4 e 3. E(Xt ) = E(vt e2ht ) = 3 e2+2h e a curtose dada por
2

K=

3 e2+2h e
2 2+h

= 3eh > 3.

Exerc cios
1. Um modelo ARIMA foi identicado e estimado para uma srie temporal obsere vada mas h indicaao de que a varincia condicional deve ser modelada por a c a um processo GARCH(1,1). Explique como se chegou a esta concluso. a 2. Refaa o exemplo da Figura 6.4 e estime um modelo AR(1) para a srie Xt . Veric e que se existe estrutura autoregressiva nos quadrados dos res duos e identique um modelo ARCH para os erros. 3. Obtenha as previses 1, 2 e 3 passos a frente para um modelo GARCH(1,2). o 4. Descreva duas vantagens de modelos EGARCH sobre modelos GARCH.

Cap tulo 7

Modelos Lineares Dinmicos a


A classe de modelos lineares dinmicos (MLD), tambm conhecidos como modelos a e de espao de estados tem sido utilizada com sucesso em anlise e previso de sries c a a e temporais. Neste cap tulo sero apresentadas as formas mais comumente utilizadas a de MLD, maiores detalhes podem ser obtidos em West & Harrison (1997) e Pole, West, & Harrison (1994).

7.1

Introduo ca
yt = F t + t t t = Gt t1 + t (7.1)

Um modelo linear dinmico pode ser caracterizado pelo seguinte par de equaoes a c

chamadas equaoes de observaao e evoluao respectivamente, onde t denota o vetor c c c de estados no tempo t, F um vetor de constantes conhecidadas ou regressores, G e uma matrix de evoluao conhecida. Os erros t e t so geralmente assumidos no e c a a correlacionados em todos os per odos de tempo e serialmente no correlacionados com a 2 mdia zero. Em muitas aplicaoes prticas pode-se assumir tambm que t N (0, ) e c a e e t tem distribuiao normal multivariada com mdia zero e matriz de varinciac e a covarincia W t . a A idia aqui que a idade da informaao que se tem sobre seja levada em e e c conta no sentido de que nossa incerteza a respeito de deve aumentar com o passar do tempo. Neste sentido, a forma do modelo apropriada apenas localmente no e tempo e necessrio caracterizar algum tipo de evoluao temporal de . O que se e a c tem ento uma sequncia de modelos ou um modelo dinmico parametrizado por t a e e a (o estado do processo no tempo t). Considere um modelo em que uma varivel y est relacionada a uma outra varivel a a a X de acordo com a seguinte forma paramtrica e y = X + . Alm disso, a incerteza do pesquisador em relaao ao parmetro descrita em e c a e termos de uma distribuiao de probabilidades p(). c 86

7.1. INTRODUCAO

87

Em um per odo t qualquer, Dt representa o conjunto de informaoes dispon c veis sobre . Por simplicidade vamos assumir que Dt = {y1 , . . . , yt }. Neste sentido, D0 representa toda a informaao inicial (antes de observar os dados) relevante sobre c incluindo a prpria deniao do modelo. o c No tempo t 1, aps observar y1 , . . . , yt1 , toda a informaao sobre o estado do o c processo est resumida probabilisticamente na distribuiao a posteriori p(t1 |Dt1 ). a c No tempo t, antes de observar yt , toda a informaao histrica Dt1 est resumida c o a probabilisticamente na distribuiao a priori de t obtida como c p(t |Dt1 ) = p(t |t1 )p(t1 |Dt1 )dt1

que atualizada aps observar yt para a posteriori t , combinando-se com o modelo e o amostral p(yt |t ) via teorema de Bayes p(t |Dt ) = sendo p(yt |Dt1 ) = p(yt |t )p(t |Dt1 )dt p(yt |t )p(t |Dt1 ) p(yt |Dt1 )

a distribuiao preditiva de yt . Esquematicamente, e c t1 |Dt1 Posteriori t |Dt1 Priori Yt |Dt1 Previso a t |Dt Posteriori

Estas equaoes fornecem um sistema de aprendizado sequencial sobre os parmec a tros do processo (no observveis) e tambm uma sequncia de distribuioes preditivas a a e e c (1 passo a frente) para as quantidades observveis. Porm a sua implementaao pra e c a tica envolve a resoluao de integrais que pode ser um problema de dif soluao c cil c em casos mais gerais. Um caso particular, onde as equaoes podem ser escritas em c forma fechada, o de modelos lineares dinmicos (MLD) normais onde a distribuiao e a c amostral denida pela e equaao das observaoes yt = Xt t + t , c c t N (0, Vt )

e os parmetros se relacionam em per a odos sucessivos atravs da e equaao do sistema t = Gt1 + t , c t N (0, Wt )

onde as sequncias t e t so independentes, mutuamente independentes e ambas e a so independentes da informaao inicial 0 |D0 N (m0 , C0 ). A matriz G descreve a a c evoluao (determin c stica) dos parmetros. Modelos nesta classe sero analisados nas a a prximas seoes. o c

88

CAP ITULO 7. MODELOS LINEARES DINAMICOS

7.2

Modelos Polinomiais

No MLD mais simples as observaoes so representadas por c a yt = t + t , t N (0, Vt )

onde t o n e vel da srie no tempo t. A evoluao do n e c vel modelada como um e passeio aleatrio simples, i.e. o t = t1 + t , Estas equaoes podem ser reescritas como c yt |t N (t , Vt ) t N (0, Wt ).

t |t1 N (t1 , Wt ) e a informaao inicial 0 |D0 N (m0 , C0 ). Vamos assumir por enquanto que as varic e a ncias Vt e Wt so conhecidas. Este modelo pode ser pensado como uma aproximaao a c a ordem para uma funao suave do tempo (t) de modo que de Taylor de 1 c (t + t) = (t) + termos de ordem mais alta e o modelo descreve os termos de ordem mais alta simplesmente como ru dos de mdia e zero. Como saber ento se este modelo adequado a uma particular aplicaao? a e c No tempo t, o valor esperado da srie k per e odos a frente condicional ao n vel atual e
k

E(Yt+k |t ) = E(t+k |t ) = E(t +

i=1

t+i |t ) = t

e denotando a mdia da distribuiao a posteriori de t por mt ento a funao de e c a c previso constante a e ft (k) = E(Yt+k |Dt ) = E[E(Yt+k |t , Dt )] = E(t |Dt ) = mt , k > 0.

Assim, este modelo util para previses de curto prazo, particularmente quando a e o variaao das observaoes (medida por Vt ) muito maior do que a variaao do n c c e c vel (medida por Wt ). Exemplo 7.1 : Foram gerados 100 valores de um modelo polinomial de primeira ordem com varincias constantes (Vt = V e Wt = W ). Na Figura 7.1 esto os valores a a gerados com as relaoes V /W iguais a 20, 2 e 0,2. Seguem os comandos do R para c produao dos grcos. c a > mld.sim = function(n, V, W, mu0) { + mu = mu0 + cumsum(rnorm(n, sd = sqrt(W))) + obs = mu + rnorm(n, sd = sqrt(V)) + ts(cbind(obs, mu)) + }

7.2. MODELOS POLINOMIAIS

89

7.2.1

Anlise Sequencial e Previses a o

A mdia inicial m0 uma estimativa pontual do n e e vel da srie e a varincia inicial e a C0 mede a incerteza associada. Assumindo que t1 |Dt1 N (mt1 , Ct1 ), ento a condicionalmente a Dt1 , t a soma de 2 quantidades normais e independentes t1 e e t e portanto tambm normal com mdia e varincia dadas por e e e a E(t |Dt1 ) = E(t1 |Dt1 ) + E(t |Dt1 ) = mt1

V ar(t |Dt1 ) = V ar(t1 |Dt1 ) + V ar(t |Dt1 ) = Ct1 + Wt = Rt Yt |Dt1 tambm a soma de quantidades normais independentes e portanto tem e e distribuiao normal com c E(Yt |Dt1 ) = E(t |Dt1 ) + E(t |Dt1 ) = mt1

V ar(Yt |Dt1 ) = V ar(t |Dt1 ) + V ar(t |Dt1 ) = Rt + Vt = Qt Aps observar yt , a distribuiao atualizada do n obtida via teorema de Bayes o c vel e combinando-se a verossimilhana c p(yt |t , Dt1 ) = (2Vt )1/2 exp{(yt t )2 /2Vt } com a priori p(t |Dt1 ) = (2Rt )1/2 exp{(t mt1 )2 /2Rt } de modo que p(t |Dt ) exp 1 (yt t )2 (t mt1 )2 + 2 Vt Rt 1 1 1 exp 2 (Vt1 + Rt ) 2t (Vt1 yt + Rt mt1 ) 2 t exp onde
1 mt = Ct (Vt1 yt + Rt mt1 ) 1 1 Ct = Vt1 + Rt 1 Ct (2 2t mt ) t 2

exp

1 Ct (t mt )2 2

e todos os termos que no dependem de t foram colocados na constante de propora cionalidade. Portanto, t |Dt N (mt , Ct ). A mdia a posteriori pode ser reescrita de 2 formas alternativas denindo-se o e coeciente adaptativo At = Ct Vt1 = Rt /Qt (0, 1) e o erro de previso 1 passo a a frente et = yt mt1 . Assim mt = (1 At )mt1 + At yt = mt1 + At et . Note a similaridade com a equaao de previso do mtodo de alisamento exponencial c a e simples visto no Cap tulo 5. Aqui At faz o papel da constante de alisamento porm e

90

CAP ITULO 7. MODELOS LINEARES DINAMICOS

agora variando no tempo. A varincia a posteriori tambm pode ser reescrita como a e funao do coeciente adaptativo como c Ct = Rt A2 Qt < Rt . t Podemos utilizar as equaoes das observaoes e de evoluao para obter a distric c c buiao preditiva k passos a frente. Fazendo substituioes sucessivas obtemos que c c
k

t+k = t +
j=1 k

t+j

Yt+k = t +
j=1

t+j + t+k

e como todos os termos so normais e independentes segue que Yt+k tambm normal a e e com E(Yt+k |Dt ) = E(t |Dt ) = mt
k

V ar(Yt+k |Dt ) = Ct +

Wt+j + Vt+k
j=1

A funao abaixo estima um modelo com tendencia polinomial de 1a ordem fac zendo a analise sequencial usando as equaoes dadas no texto com varincias xas e c a conhecidas. > mld = function(Y, V, W, m0, C0) { + n = length(Y) + m = C = R = Q = f = A = e = ts(rep(NA, length = n), start = start(Y)) + Y = ts(c(NA, Y), end = end(Y)) + C[1] = C0 + m[1] = m0 + for (t in 2:n) { + R[t] = C[t - 1] + W[t] + f[t] = m[t - 1] + Q[t] = R[t] + V[t] + A[t] = R[t]/Q[t] + e[t] = Y[t] - f[t] + m[t] = m[t - 1] + A[t] * e[t] + C[t] = A[t] * V[t] + } + return(list(m = m, C = C, R = R, f = f, Q = Q)) + } Exemplo 7.2 : A funao mld pode ser usada para estimar sequencialmente o nivel c da serie de vazes do rio Nilo. Primeiro vamos permitir que o nivel varie bastante ao o

7.2. MODELOS POLINOMIAIS

91

longo do tempo especicando um valor grande para W e depois reestimar com pouca variaao temporal (W bem pequeno). Usaremos a variancia amostral da serie como c estimativa de V . Como informaao inicial usaremos uma estimativa do nivel igual c a 1000 mas com uma grande incerteza associada. O grco da srie com os n a e veis superimpostos aparece na Figura 7.2.

7.2.2

Varincias de Evoluo e das Observaes a ca co

Tipicamente, Wt desconhecida. Sua estimaao entretanto leva a uma intratabilidade e c anal tica que pode ser evitada atravs de sua especicaao subjetiva. e c O fator de desconto o parmetro bsico que controla o grau de envelhecimento e a a da informaao de uma observaao. Por exemplo, podemos quanticar o envelhecic c mento da informaao sobre o parmetro t como um aumento de 5% em sua varincia c a a a priori (no tempo t), i.e. V ar(t |Dt1 ) = (1 + )V ar(t1 |Dt1 ) ou Rt = (1 + ) Ct1

com = 0.05. Por outro lado, informaao em geral medida em termos de preciso c e a (o inverso da varincia) e podemos escrever a Preciso(t |Dt1 ) = (1 + )1 Preciso(t1 |Dt1 ) a a
1 1 ou Rt = (1 + )1 Ct1 .

Nesta escala, o fator de desconto = (1 + )1 varia entre 0 e 1 e = 5% implica em 0.95. Vale notar que o fator de desconto no depende da escala na qual as a observaoes so medidas. c a Se = 1 ento no existe mudana ao longo do tempo no n da srie e quanto a a c vel e menor o valor de maiores so as alteraoes esperadas e maior a perda de infore a c e maao contida em observaoes mais antigas. c c Assim, para um valor xo do fator de desconto temos que Rt = Ct1 / = Ct1 + Wt ou equivalentemente Wt = Ct1 1 = Ct1 .

Como Rt = Ct1 + Wt podemos interpretar esta especicaao intuitivamente como c um aumento de incerteza, ao evoluir de t1 para t, quanticado como uma proporao c de Ct1 . A sequncia de varincias Vt tambm , em geral, desconhecida embora o pesquie a e e sador possa ter alguma informaao a priori sobre caracter c sticas desta sequncia. Por e exemplo, Vt = V (varincia constante e desconhecida), Vt = V kt onde os pesos kt so a a conhecidos, Vt = V k(t ) onde k() uma funao de varincia do n da srie ou em e c a vel e p particular Vt = V t . Impondo-se uma particular estrutura para a sequncia Wt e para a informaao e c inicial obtem-se um procedimento de atualizaao sequencial para V alm de t . Para c e

92

CAP ITULO 7. MODELOS LINEARES DINAMICOS

isto redene-se o modelo, agora condicionalmente em V , como yt = t + t , t N (0, V ),

t = t1 + t ,

0 |V, D0 N (m0 , V C0 ) n0 n0 S0 , V 1 |D0 Gama 2 2

t N (0, V Wt ), ou n0 S0 V 1 2 0 n

sendo que m0 , C0 , n0 e S0 sero especicados. Surgiu assim mais um item na infora maao inicial com c 1 n0 /2 = E(V 1 |D0 ) = n0 S0 /2 S0

e S0 a estimativa pontual a priori da varincia V . Com esta deniao pode-se e a c mostrar que a distribuiao inicial marginal de 0 c e 0 |D0 tn0 (m0 , C0 )
com C0 = S0 C0 . Se a distribuiao a posteriori (incondicional) do n em t 1 c vel e

t1 |Dt1 tnt1 (mt1 , Ct1 ) ento pode-se mostrar que as distribuioes a priori, preditiva e a posteriori no tempo a c t so dadas por a t |Dt1 tnt1 (mt1 , Rt ) t |Dt tnt (mt , Ct )

Yt |Dt1 tnt1 (mt1 , Qt )

onde os parmetros atualizados so a a Qt = Rt + St1 mt = mt1 + At et Ct = (St /St1 )(Rt A2 Qt ) t nt = nt1 + 1 nt St = nt1 St1 + St1 e2 /Qt . t A funao mld1 abaixo faz a anlise sequencial com a varincia das observaoes c a a c xa e desconhecida. A especicaao de Wt feita via fator de desconto. Note que c e agora tanto o nivel quanto a varincia e os graus de liberdade so atualizados sequena a cialmente. > mld1 = function(Y, delta, m0, C0, n0, S0) { + N = length(Y) + m = n = C = R = Q = S = f = A = e = rep(NA, length = N) + Y = c(NA, Y)

7.2. MODELOS POLINOMIAIS + + + + + + + + + + + + + + + + + + } C[1] = C0 m[1] = m0 S[1] = S0 n[1] = n0 for (i in 2:N) { n[i] = n[i - 1] + 1 R[i] = C[i - 1]/delta f[i] = m[i - 1] Q[i] = R[i] + S[i - 1] A[i] = R[i]/Q[i] e[i] = Y[i] - f[i] S[i] = S[i - 1] + (S[i - 1]/n[i]) * (e[i]^2/Q[i] - 1) m[i] = m[i - 1] + A[i] * e[i] C[i] = A[i] * S[i] } return(list(m = m, C = C, R = R, f = f, Q = Q, n = n, S = S, e = e))

93

Exemplo 7.3 : Novamente vamos examinar a srie de vazes do rio Nilo, agora e o usando diferentes fatores de desconto na funao mld1. c > res1 = mld1(y, delta = 0.98, m0 = 1000, C0 = 100, n0 = 1, S0 = 0.01) > res2 = mld1(y, delta = 0.7, m0 = 1000, C0 = 100, n0 = 1, S0 = 0.01) Os grcos na Figura 7.3 mostram a srie original, as estimativas do nivel obtidas a e com descontos 0,70 e 0,98 e estas mesmas estimativas com um intervalo de 1, 5 Ct . Os grcos foram feitos com os seguintes comandos do R, a Os modelos podem ser comparados calculando-se o erro quadrtico mdio e o a e desvio absoluto mdio. Usando os comandos abaixo percebe-se que o modelo com e fator de desconto 0,70 melhor segundo estes critrios. e e > > + + + + + > eqm = dam = rep(0, 2) for (i in 2:length(y)) { eqm[1] = eqm[1] + (y[i] - res1$m[i - 1])^2 dam[1] = dam[1] + abs(y[i] - res1$m[i - 1]) eqm[2] = eqm[2] + (y[i] - res2$m[i - 1])^2 dam[2] = dam[2] + abs(y[i] - res2$m[i - 1]) } eqm

[1] 2681716 2375484 > dam [1] 13258.47 11904.16

94

CAP ITULO 7. MODELOS LINEARES DINAMICOS

7.3

Modelo de Crescimento Linear

Considere agora que a descriao local mais apropriada uma tendncia polinomial c e e de 2a ordem. Um modelo um pouco mais elaborado ento obtido criando-se um e a parmetro extra para descrever o crescimento do n a vel do processo observado. A equaao das observaoes ca inalterada, i.e. c c yt = t + t , t N (0, Vt )

e a evoluao do n e do crescimento modelada como c vel e t = t1 + t1 + 1t t = t1 + 2t . Usando a representaao matricial temos que o vetor de regresso e a matriz de c a evoluao so dados por c a Xt = ( 1 0 ) e Gt = 1 1 0 1 .

Nesta notaao, denindo t = (t , t ) obtemos os momentos das distribuioes a priori c c e preditiva como E(t |Dt1 ) = at = GE(t1 |Dt1 ) = Gmt1 = (mt1 + bt1 , bt1 )

V ar(t |Dt1 ) = Rt = GCt1 G + Wt

V ar(Yt |Dt1 ) = Qt = Xt Rt Xt + St1 .

E(Yt |Dt1 ) = ft = Xt at = mt1 + bt1

Os momentos da distribuiao a posteriori de t so uma generalizaao matricial c a c daqueles obtidos para o modelo anterior, E(t |Dt ) = mt = at + At et

V ar(t |Dt ) = Ct = (St /St1 )(Rt At A Qt ) t No dif vericar que a funao de previso dada por a e cil c a e ft (k) = Xt Gk mt = mt + kbt sendo que mt e bt so as estimativas pontuais do n t e do crescimento t . Portanto, a vel assim como no caso anterior, este modelo tambm apropriado para previses de curto e e o prazo. As varincias Wt so mais uma vez especicadas indiretamente atravs de um a a e fator de desconto . Neste caso, Rt = GCt1 G / implica que Wt = GCt1 G (1 1).

7.4. MODELOS SAZONAIS

95

7.4

Modelos Sazonais

Um comportamento peridico ou c o clico pode ser encontrado em vrias sries tema e importante que se consiga descrever o padro sazonal da srie atravs de porais. E a e e quantidades que possam ser estimadas incluindo-se assim este padro na funao prea c viso. Nos modelos aqui analisados dene-se um componente sazonal descrevendo a desvios sazonais em torno de um n dessazonalizado ou tendncia. vel e

7.4.1

Modelos sem Crescimento

A idia aqui fazer a superposiao de um modelo polinomial de 1a ordem (para o n e e c vel dessazonalizado) com um modelo de efeitos sazonais. As equaoes das observaoes e c c de evoluao so dadas por c a yt = t + t0 + t , t = t1 + t tr = t1,r+1 + t,r , t,p1 = t1,0 + t,p1 t N (0, Vt ) r = 0, , p 2

e odo sazonal da srie. Por exemplo, e com a restriao p1 tr = 0, t e onde p o per c r=0 p = 12 para uma srie com observaoes mensais e p = 4 para observaoes trimestrais. e c c Para xar idias, considere uma srie trimestral e suponha que t 1 o segundo e e e trimestre de um determinado ano. Ento o vetor de parmetros consiste de 4 efeitos a a sazonais, um para cada trimestre, t0 t1 t2 t3 trim. trim. trim. trim. 2 3 4 1

t1

A funao de previso assume a forma ft (k) = mt + htj onde mt o valor esperado c a e do n dessazonalizado no tempo t + k e htj o desvio sazonal esperado em torno vel e deste n vel. O desvio utilizado na funao de previso tal que j o resto da diviso c a e e a k/p. Por exemplo, se p = 12, e t0 refere-se ao ms de janeiro ento a previso e a a 1 passo a frente (k = 1) feita em dezembro mt + E(t0 |Dt ), com j = 1. Se o e horizonte de previso for k = 2 ento j = 2 e o desvio sazonal refere-se a fevereiro, a a i.e. ft (2) = mt + E(t1 |Dt ).

e ao passar de t 1 para t ocorre simplesmente uma rotaao nos elementos deste c vetor, trim. 3 t0 trim. 4 t1 t = . = t2 trim. 1 trim. 2 t3

96

CAP ITULO 7. MODELOS LINEARES DINAMICOS

7.4.2

Modelos com Crescimento

Novamente a idia fazer a superposiao de um modelo para os efeitos sazonais e e c mas agora com um modelo polinomial de 2a ordem onde se tem um parmetro que a representa o crescimento do n dessazonalizado. vel O modelo pode ser escrito como yt = t + t0 + t ,
t = t1 + t

t = t1 + t1 + t tr = t1,r+1 + t,r , t,p1 = t1,0 + t,p1 com a restriao c forma


p1 r=0 tr

t N (0, Vt )

r = 0, , p 2

= 0, t. A funao de previso agora assume a seguinte c a


p1

ft (k) = mt + kbt + htj , onde htj tem a mesma interpretaao anterior. c

com
j=0

htj = 0

7.5

Representao de Fourier ca

Uma forma alternativa de se representar padres c o clicos atravs de combinaoes e e c lineares de funoes peridicas. Em particular a utilizaao de funoes trigonomtricas c o c c e leva a representaoes de Fourier da sazonalidade. c O modelo (com crescimento) representado pelas seguintes equaoes e c
p/2

yt = t +
j=1

j,t + t ,

t N (0, Vt )

t = t1 + t1 + t , j,t
j,t t = t1 + t ,

e j,t = j,t1 + j,t para j = p/2. A funao de previso dada por c a e


p/2 p/2

cos 2j/p sin 2j/p sin 2j/p cos 2j/p

j,t1 j,t1

wj,t wj,t

, j = 1, . . . , p/2 1

ft (k) =
j=1

Sjk =
j=1

[at,j cos(2jk/p) + a sen(2jk/p) t,j

onde at,j e a so as estimativas pontuais de coecientes de Fourier t,j e t,j . t,j a Como no cap tulo anterior, as varincias dos erros de evoluao so especicadas a c a indiretamente atravs de um fator de desconto. A estratgia recomendada em (Pole, e e West, & Harrison 1994) e West & Harrison (1997) consiste em especicar um fator de

7.6. ILUSTRACAO

97

desconto para cada componente do modelo. No modelo com uma tendncia polinomial e mais um componente sazonal teremos ento 2 fatores de desconto. a Em geral, o fator de desconto do componente sazonal maior do que o da tendne e cia. Neste sentido estamos assumindo que o padro sazonal da srie, embora possa a e estar sujeito a alteraoes, mais estvel do que a sua tendncia. c e a e

7.6

Ilustrao ca

A Figura ?? apresenta o total de vendas trimestrais (em milhares) de perus na Irlanda entre o primeiro trimestre de 1974 e o terceiro trimestre de 1982. A srie exibe e um crescimento sistemtico ao longo de todo o per a odo juntamente com um padro a sazonal acentuado. Outra caracter stica interessante que a forma do padro sazonal e a se alterou a partir de 1978. Vamos fazer a estimaao sequencial de um modelo para c os efeitos sazonais superpostos a uma tendncia de crescimento linear e vericar o e comportamento das previses 1 passo a frente. o Suponha que a informaao a priori foi acessada examinando-se as vendas dos anos c anteriores a 1974. Esta informaao est resumida na Tabela 7.1. Note a restriao de c a c soma zero na especicaao a priori dos efeitos sazonais e tambm que a especicaao c e c equivalente em termos de fatores sazonais seria 11, 19, 19 e 11 para os fatores e (11+19+19+11)/4 = 15 para o n vel. Tabela 7.1: Informaao a priori. c

Componente N vel Crescimento Efeito sazonal 1 Efeito sazonal 2 Efeito sazonal 3 Efeito sazonal 4 D.P. das observaoes c

Mdia (Desvio padro) e a 15 (0.75) 0 (0.3) -4 (0.5) 4 (0.5) 4 (0.5) -4 (0.5) 1 com 1 g.l.

A performance preditiva do modelo foi investigada para fatores de desconto variando nos intervalos (0.9,1.0) para a tendncia e (0.6,1.0) para os fatores sazonais. e Estes intervalos esto coerentes com a idia de que espera-se um padro sazonal mais a e a estvel do que a tendncia. Entretanto os valores encontrados aps esta busca foa e o ram 0.90 para a tendncia e 0.80 para os fatores sazonais. Uma idia intuitiva a e e e alteraao no padro sazonal ocorrida em 1978 deve ter contribuido para este resultado c a at pico. Os 2 grcos a seguir apresentam as previses pontuais (1 passo a frente) juntaa o mente com intervalos de 90% de probabilidade e os valores observados da srie. O e primeiro grco refere-se ao modelo esttico (ambos os fatores de desconto iguais a 1). a a

98

CAP ITULO 7. MODELOS LINEARES DINAMICOS

Note que a mudana no padro sazonal ocorre muito lentamente no modelo esttico e c a a no nal da srie o padro estimado apenas ligeiramente diferente do padro inicial. e a e a J no modelo dinmico o padro sazonal evolui para uma forma completamente dia a a Tabela 7.2: Descontos 0.90 e 0.80 1.00 e 1.00 EQM 3.11 4.23 DAM 1.34 1.64 LLIK -71.1 -77.6

ferente melhorando a performance preditiva. Este fato pode ser notado por inspeao c visual e conrmado pelos indicadores na Tabela 7.2. e A explicaao intuitiva para este fato, lembrando da deniao de fator de desconto, c c que no modelo dinmico um peso maior dado para as observaoes mais recentes e a e c ao fazer previses. Com isto a alteraao no padro sazonal incorporada mais rapio c a e damente do que no modelo esttico. As previses de vendas para o quarto trimestre a o de 1982 e para 1983 tambm levaro em conta os diferentes padres sazonais do nal e a o da srie. e

7.7

Modelos de Regresso a

Para completar o nosso modelo dinmico podemos pensar em incluir na equaao a c das observaoes efeitos de variveis regressoras. Considere por exemplo a regresso c a a linear da varvel yt em uma coleao de p variveis independentes X1t , . . . , Xpt . Se a c a um termo constante for incluido no modelo ento X1t = 1, t. Denotando o vetor de a regresso e o vetor de coecientes de regresso no tempo t por Xt = (X1t , . . . , Xpt ) e a a t = (1t , . . . , pt ) respectivamente ento as equaoes do modelo so dadas por a c a yt = Xt t + t , t = t1 + t , t N (0, Vt )

t N (0, Wt ).

Assim, os coecientes da regresso evoluem segundo um passeio aleatrio, como a o a ordem, i.e., a matriz de evoluao G = I . O vetor de no modelo polinomial de 1 c p regresso formado pelas prprias variveis regressoras e note que a equaao das a e o a c observaoes pode ser reescrita como c
p

yt =
i=1

it Xit + t

de modo que o modelo pode ser visto como uma superposiao de p regresses simples c o pela origem. Todas as distribuioes envolvidas so anlogas aos casos anteriores e as equaoes c a a c dadas na Seao 2.3 podem ser utilizadas para obter os momentos das distribuioes a c c

7.8. MONITORAMENTO priori, preditiva e a posteriori fazendo-se G = Ip . Assim, at = mt1 Rt = Ct1 + Wt ft = Xt mt1

99

e as outras equaoes permanecem inalteradas. c interessante notar como ca a funao de previso ft (k) neste caso. Primeiro E c a reescreva a equaao de evoluao para t+k fazendo k substituioes sucessivas obtendo c c c
k

t+k = t +
j=1

t+j

de modo que at+k = mt


k

Rt+k = Ct +
j=1

Wt+j .

Ento, usando a equaao das observaoes obtemos que a c c ft (k) = Xt+k mt


Qt+k = Xt+k Rt+k Xt+k + St .

Assim, a previso pontual k passos a frente a prpria funao de regresso avaliada a e o c a na estimativa dos coecientes no tempo t e nos valores futuros dos regressores (que nem sempre esto dispon a veis). A sequncia de varincias Wt mais uma vez estruturada usando um fator de e a e desconto.

7.8

Monitoramento

Ao comparar sequencialmente as previses com os valores observados pode-se julgar o a adequaao relativa de modelos alternativos com base em sua performance preditiva. c Observaoes ocorrendo nas caudas da distribuiao preditiva so sempre poss c c a veis por deniao porm improvveis. Quanto mais afastada em uma das caudas mais c e a improvvel a observaao. E preciso ento estabelecer um critrio para julgar que a e c a e tipo de inconsistncia entre observaao e previso deve ser sinalizada pelo sistema. e c a No entanto, sinalizar uma observaao como improvvel apenas indica uma poss c a vel decincia geral do modelo. E preciso saber em que sentido o modelo deciente, e e i.e. vericar que modelos alternativos, com diferentes distribuioes preditivas, teriam c uma performance melhor. O fator de Bayes, denido a seguir, a ferramenta utilizada e para fazer esta comparaao de modelos. c

100

CAP ITULO 7. MODELOS LINEARES DINAMICOS

Se pA (yt |Dt1 ) a densidade preditiva 1 passo a frente de um modelo alternativo e ento o fator de Bayes denido como a e Ht = p(yt |Dt1 ) , pA (yt |Dt1 )

i.e. a razo das densidades preditivas avaliadas no valor observado yt . a Outra forma de comparar a performance preditiva de dois modelos considerer um e grupo de observaoes ao invs de uma unica e se basear no fator de Bayes acumulado c e Ht (k) = p(yt |Dt1 )p(yt1 , . . . , ytk+1 |Dtk ) p(yt , . . . , ytk+1 |Dtk ) = pA (yt , . . . , ytk+1 |Dtk ) pA (yt |Dt1 )pA (yt1 , . . . , ytk+1 |Dtk )
k1 j=0

= Ht Ht1 (k 1) =

Htj .

Pode-se assim sinalizar evidncias de alteraao lenta na estrutura da srie. A idia e c e e que, individualmente, estas evidncias no so sucientes para se questionar as e e a a previses do modelo em uso mas quando consideradas conjuntamente a evidncia o e acumulada pode ser grande e deve ser sinalizada. A questo agora como construir a e um sistema de monitoramento automtico da srie a partir destas idias intuitivas. a e e Quando as observaoes esto cada vez mais afastadas das previses ento um fator c a o a de Bayes individual Ht pode no ser sucientemente pequeno e precisa ser acumua lado para indicar alguma evidncia contra o modelo padro. Neste caso, o monitor e a identica o grupo mais discrepante de observaoes consecutivas calculando Vt and lt c da seguinte forma, Vt = min Ht (k) = Ht (lt )
1kt

sendo calculado sequencialmente com as seguintes recurses, o Vt = Ht min{1, Lt1 } e lt = lt1 + 1, se Lt1 < 1 1, se Lt1 1

conforme mostrado em West (1986). O modelo padro aceito como sendo satisfatrio at a ocorrncia de um valor a e o e e Lt menor do que um valor pr-especicado < 1 (o limite inferior para aceitaao e c de Lt ) quando a ocorrncia de uma descontinuidade na srie sinalizada. Se lt = 1 e e e ento uma unica observaao discrepante identicada como a causa mais provvel de a c e a falha, embora o in de uma mudana tambm seja uma possibilidade. Por outro cio c e lado, lt > 1 indica que uma mudana comeou a ocorrer lt periods atrs em t lt + 1. c c a Alm disso, se uma mudana estrutural lenta est ocorrendo na srie as observaoes e c a e c mais recentes indicaro evidncia contra o modelo padro que no ser suciente para a e a a a fazer Lt < . Assim, para aumentar a sensibilidade do monitor a estas mudanas uma c descontinuidade deve ser sinalizada se lt > 3 ou 4. Para especicar o modelo alternativo assume-se que as densidades preditivas so a normais com mdia comum ft e varincias Qt e Qt / onde 0 < < 1, de modo que o e a fator de Bayes ca Ht = (yt ft )2 1 exp (1 ) 2Qt = 1 1 exp (1 )e2 t 2

7.8. MONITORAMENTO onde et o erro de previso um passo a frente padronizado. e a A escolha de pode ser facilitada reescrevendo-se o fator de Bayes como Ht = exp(0.5 log + (1 )e2 ). t

101

Claramente Ht = 1 ou equivalentemente e2 = (log )/(1 ) indica nenhuma evit dncia para discriminar entre os modelos. O valor de , pode ser escolhido de modo e a fornecer o valor mximo de |et | que no indica evidence contra o modelo padro. a a a Por exemplo, (0.1, 0.3) implica que a evidncia contra o modelo padro deve ser e a acumulada para 1.3 < |et | < 1.6 que so aproximadamente os percentil 0.90 e 0.95 a distribuiao normal padro. c a E claro que para xo, a evidncia contra o modelo padro aumenta com |et |. e a West & Harrison (1997) ilustraram como a escolha de tem pouca inuncia quando e o erro se torna muito grande em relaao ao modelo alternativo. Este pode ser visto c como um modelo geral no sentido de levar em conta vrios tipos de mudanas alm a c e de observaoes discrepantes. Essencialmente, este procedimento pode ser visto como c um mtodo exploratrio gerando informaao sobre o tipo e o per e o c odo mais provvel a de mudana estrutural. c

102

CAP ITULO 7. MODELOS LINEARES DINAMICOS

> > > > + + +

w = c(0.05, 0.5, 5) g = list(col = 1:2, xlab = "tempo", ylab = "y") par(mfrow = c(2, 2)) for (i in w) { ts.plot(mld.sim(100, 1, i, 25), gpars = g, main = paste("V/W=", 1/i)) }
V/W= 20
27 30

V/W= 2

25

y 23 21 0 20 40 60 80 100 18 0 22

26

20

40

60

80

100

tempo

tempo

V/W= 0.2
40 y 10 0 20 30

20

40

60

80

100

tempo

Figura 7.1: 100 valores simulados do modelo polinomial de 1a ordem com (a) V /W = 20,
(b) V /W = 2, (c) V /W = 0, 2.

7.8. MONITORAMENTO

103

> > > > > > > > + > > +

y = Nile n = length(y) res = mld(y, V = rep(var(y), n), W = rep(50, n), m0 = 1000, C0 = 1000) plot(y, xlab = "Anos", ylab = "Medioes", type = "p") c~ lines(res$m, col = 2) lines(res$m - 2 * sqrt(res$C), col = 2, lty = 1) lines(res$m + 2 * sqrt(res$C), col = 2, lty = 1) res = mld(y, V = rep(var(y), n), W = rep(0.05, n), m0 = 1000, C0 = 1000) lines(res$m, col = 4) legend(1940, 1350, c("obs", "W=50", "W=.05"), col = c(1, 2, 4), bty = "n")

1400

Medies

600

800

1000

1200

obs W=50 W=.05

1880

1900

1920 Anos

1940

1960

Figura 7.2:

104

CAP ITULO 7. MODELOS LINEARES DINAMICOS

Serie original
1400

Desconto 0.98 0.70


1400 obs desconto=.98 desconto=.70

1000

1400

600

1200

1000

1880

1920

1960

600 1880

1000

1920

1960

600

800

1880

1900

1920 Time

1940

1960

Figura 7.3:

Apndice A e

Lista de Distribuies co
Neste apndice so listadas as distribuioes de probabilidade utilizadas no texto para e a c facilidade de referncia. So apresentadas suas funoes de (densidade) de probabilie a c dade alm da mdia e varincia. Uma reviso exaustiva de distribuioes de probabilie e a a c dades pode ser encontrada em Johnson et al. (1994), Johnson et al. (1995) e Johnson et al. (1992).

A.1

Distribuio Normal ca

X tem distribuiao normal com parmetros e 2 , denotando-se X N (, 2 ), se c a sua funao de densidade dada por c e p(x|, 2 ) = (2 2 )1/2 exp[(x )2 /2 2 ], < x < ,

para < < e 2 > 0. Quando = 0 e 2 = 1 a distribuiao chamada c e normal padro. A distribuiao log-normal denida como a distribuiao de eX . a c e c No caso vetorial, X = (X1 , . . . , Xp ) tem distribuiao normal multivariada com c vetor de mdias e matriz de varincia-covarincia , denotando-se X N (, ) e a a se sua funao de densidade dada por c e p(x|, ) = (2)p/2 ||1/2 exp[(x ) 1 (x )/2] para Rp e positiva-denida.

A.2

Distribuio Gama ca

X tem distribuiao Gama com parmetros e , denotando-se X Ga(, ), se sua c a funao de densidade dada por c e p(x|, ) = para , > 0. E(X) = / e V (X) = / 2 . 105 1 x x e , () x > 0,

106

APENDICE A. LISTA DE DISTRIBUICOES

Casos particulares da distribuiao Gama so a distribuiao de Erlang, Ga(, 1), a c a c distribuiao exponencial, Ga(1, ), e a distribuiao qui-quadrado com graus de c c liberdade, Ga(/2, 1/2).

A.3

Distribuio Wishart ca

Diz-se que uma matriz aleatria (n n) segue uma distribuiao Wishart com o c parmetro e graus de liberdade, denotando-se W (, ), se sua funao de a c densidade dada por, e p(|, ) ||(n1)/2 exp((1/2)tr()) sendo n, positiva-denida e tr(A) indica o trao de uma matriz A. Uma c W (AA , ). propriedade util que AA e

A.4

Distribuio Gama Inversa ca


denotando-se

X tem distribuiao Gama Inversa com parmetros e , c a X GI(, ), se sua funao de densidade dada por c e p(x|, ) = para , > 0. E(X) = 1 e V (X) = (+1) /x x e , () x > 0,

No dif vericar que esta a distribuiao de 1/X quando X Ga(, ). a e cil e c

2 . ( 1)2 ( 2)

A.5

Distribuio Wishart Invertida ca

Diz-se que uma matriz aleatria (n n) segue uma distribuiao Wishart-Invertida o c com parmetro e graus de liberdade, denotando-se W I(, ) se sua funao a c de densidade dada por, e p(|, ) ||(+n+1)/2 exp((1/2)tr()) sendo n, positiva-denida e tr(A) indica o trao de uma matriz A. No dif c a e cil 1 W (, ). Outra propriedade que AA W I(AA , ). vericar que e

A.6

Distribuio Beta ca

X tem distribuiao Beta com parmetros e , denotando-se X Be(, ), se sua c a funao de densidade dada por c e p(x|, ) = ( + ) 1 x (1 x)1 , ()() 0 < x < 1,

A.7. DISTRIBUICAO DE DIRICHLET para , > 0. E(X) = + e V (X) = . ( + )2 ( + + 1)

107

A.7

Distribuio de Dirichlet ca

O vetor aleatrio X = (X1 , . . . , Xk ) tem distribuiao de Dirichlet com parmetros o c a 1 , . . . , k , denotada por Dk (1 , . . . , k ) se sua funao de densidade conjunta dada c e por k (0 ) p(x|1 , . . . , k ) = xi = 1, x1 1 . . . xk k 1 , (1 ), . . . , (k ) 1
i=1

para 1 , . . . , k > 0 e 0 = E(Xi ) = i , 0

k i=1 i .

V (Xi ) =

(0 i )i , 2 0 (0 + 1)

e Cov(Xi , Xj ) =

i j 2 ( + 0 0

1)

Note que a distribuiao Beta obtida como caso particular para k = 2. c e

A.8

Distribuio t de Student ca

X tem distribuiao t de Student (ou simplesmente t) com mdia , parmetro de escala c e a 2 ), se sua funao de densidade e graus de liberdade, denotando-se X t (, c e dada por (x )2 (( + 1)/2) /2 + p(x|, , ) = 2 (/2)
2 (+1)/2

x R,

para > 0, R e 2 > 0. E(X) = , para > 1 e V (X) =

, 2

para > 2.

Um caso particular da distribuiao t a distribuiao de Cauchy, denotada por c e c 2 ), que corresponde a = 1. C(,

A.9

Distribuio F de Fisher ca

X tem distribuiao F com 1 e 2 graus de liberdade, denotando-se X F (1 , 2 ), c se sua funao de densidade dada por c e p(x|1 , 2 ) = ((1 + 2 )/2) 1 /2 2 /2 1 /21 2 x (2 + 1 x)(1 +2 )/2 (1 /2)(2 /2) 1

x > 0, e para 1 , 2 > 0. E(X) = 2 , 2 2 para 2 > 2 e V (X) =


2 22 (1 + 2 2) , 1 (2 4)(2 2)2

para 2 > 4.

108

APENDICE A. LISTA DE DISTRIBUICOES

A.10

Distribuio Binomial ca

X tem distribuiao binomial com parmetros n e p, denotando-se X bin(n, p), se c a sua funao de probabilidade dada por c e p(x|n, p) = para n 1 e 0 < p < 1. E(X) = np e V (X) = np(1 p) n x p (1 p)nx , x x = 0, . . . , n

e um caso particular a distribuiao de Bernoulli com n = 1. e c

A.11

Distribuio Multinomial ca

O vetor aleatrio X = (X1 , . . . , Xk ) tem distribuiao multinomial com parmetros n o c a e probabilidades 1 , . . . , k , denotada por Mk (n, 1 , . . . , k ) se sua funao de probabic lidade conjunta dada por e p(x|1 , . . . , k ) = n! x x1 , . . . , k k , x1 !, . . . , xk ! 1
k

xi = 0, . . . , n,
i=1

xi = n,

para 0 < i < 1 e k i = 1. Note que a distribuiao binomial um caso especial c e i=1 da multinomial quando k = 2. Alm disso, a distribuiao marginal de cada Xi e c e binomial com parmetros n e i e a E(Xi ) = ni , V (Xi ) = ni (1 i ), e Cov(Xi , Xj ) = ni j .

A.12

Distribuio de Poisson ca

X tem distribuiao de Poisson com parmetro , denotando-se X P oisson(), se c a sua funao de probabilidade dada por c e p(x|) = para > 0. E(X) = V (X) = . x e , x! x = 0, 1, . . .

A.13

Distribuio Binomial Negativa ca

X tem distribuiao de binomial negativa com parmetros r e p, denotando-se X c a BN (r, p), se sua funao de probabilidade dada por c e p(x|r, p) = r+x1 r p (1 p)x , x x = 0, 1, . . .

A.13. DISTRIBUICAO BINOMIAL NEGATIVA para r 1 e 0 < p < 1. E(X) = r(1 p)/p e V (X) = r(1 p)/p2 .

109

Um caso particular quando r = 1 e neste caso diz-se que X tem distribuiao geoe c mtrica com parmetro p. e a

Referncias e
Bauwens, L., Lubrano, M. & Richard, J. (1999). Bayesian Inference in Dynamic Econometric Models. Oxford University Press. Box, G. E. P. & Jenkins, G. M. (1970). Time Series Analysis, Forecasting and Control. Holden-Day, San Francisco, California. Box, G. E. P., Jenkins, G. M. & Reinsel, G. C. (1994). Time Series Analysis: Forecasting and Control (Third ed.). Englewood Clis NJ: Prentice-Hall. Brockwell, P. & Davis, R. (1991). Time Series: Theory and Methods (2nd ed.). New York: Springer-Verlag. Burnham, K. P. & Anderson, D. R. (1998). Model Selection and Inference: A Practical Information-Theoretic Approach. Springer: New York. Diggle, P. (1990). Time Series: A Biostatistical Introduction. Oxford University Press: New York. Engle, R. F. (1982). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom ination. Econometrica 50, 9871007. Franses, P. H. (1998). Time Series Models for Business and Economic Forecasting. Cambridge University Press. Hamilton, J. D. (1994). Time Series Analysis. Princeton University Press. Johnson, N. L., Kotz, S. & Balakrishnan, N. (1994). Continuous Univariate Distributions (2nd ed.), Volume 1. John Wiley, New York. Johnson, N. L., Kotz, S. & Balakrishnan, N. (1995). Continuous Univariate Distributions (2nd ed.), Volume 2. John Wiley, New York. Johnson, N. L., Kotz, S. & Kemp, A. W. (1992). Univariate Discrete Distributions (2nd ed.). John Wiley, New York. Kendall, M. G., Stuart, A. & Ord, J. K. (1983). Advanced theory of statistics (4th ed.), Volume 3. Grin: London. Pole, A., West, M. & Harrison, J. (1994). Applied Bayesian Forecasting and Time Series Analysis. Texts in Statistical Sciences. Chapman & Hall. Priestley, M. B. (1981). Spectral Analysis and Time Series. London: Academic Press. Taylor, S. (1986). Modelling Financial Time Series. Wiley. 110

References. Tsay, R. S. (2002). Analysis of Financial Time Series. Wiley.

111

West, M. & Harrison, P. J. (1997). Bayesian Forecasting and Dynamic Models. Springer Verlag, New York.

You might also like