Professional Documents
Culture Documents
Bernard Rapacchi
Centre Interuniversitaire de Calcul de Grenoble
18 ao^
ut 1993
Dans cette note, nous nous interessons aux series chronologiques sous le point de vue de
l'Analyse des modeles Box-Jenkins (ARMA, ARIMA, SARIMA, : : : ), ou d'Analyse Spectrale.
Nous supposons que vous avez deja lu une petite note [8] introduisant les series chronologiques
et leurs aspects sous le point de vue Analyse Exploratoire et Methodes Robustes. On aurait pu
s'arr^eter la, mais pourquoi faire simple quand on peut faire complique : : :
i
Table des matieres
1 INTRODUCTION AUX MODELES BOX-JENKINS 1
1.1 Introduction : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1
1.2 Serie Stationnaire : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1
1.2.1 Denition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 1
1.3 Comment rendre une serie stationnaire : : : : : : : : : : : : : : : : : : : : : : : : 2
1.3.1 Pourquoi des series sont non stationnaires : : : : : : : : : : : : : : : : : : 2
1.3.2 Le lissage de la serie : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 2
1.3.3 Les operateurs de Box-Jenkins : : : : : : : : : : : : : : : : : : : : : : : : 2
1.4 Fonction d'autocorrelation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 3
2 LE MODELE LINEAIRE DE BOX-JENKINS 5
2.1 Hypothese : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5
2.2 Filtre : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 5
3 PROCESSUS A MOYENNE MOBILE 7
3.1 MA d'ordre 1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 7
3.2 MA d'ordre q : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 8
3.3 En resume : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 9
4 PROCESSUS AUTOREGRESSIF 10
4.1 AR d'ordre 1 : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 10
4.2 AR d'ordre p : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 11
4.3 La Fonction d'Autocorrelation Partielle : : : : : : : : : : : : : : : : : : : : : : : 12
4.3.1 ACF et PACF d'un AR(1) : : : : : : : : : : : : : : : : : : : : : : : : : : 12
4.3.2 PACF d'un AR(p) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14
4.4 Dualite : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 14
5 PROCESSUS ARMA, ARIMA ET SARIMA 15
5.1 Les processus ARMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15
5.1.1 Denition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15
5.1.2 Processus ARMA(1,1) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 15
5.2 Les processus ARIMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16
5.3 Les processus SARIMA : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 16
6 UN EXEMPLE 17
6.1 Donnees de Pollution Atmospherique : : : : : : : : : : : : : : : : : : : : : : : : : 17
6.2 Les logiciels : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17
6.3 Processus de modelisation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 17
ii
6.4 Modelisation : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 18
7 ETUDE MULTIVARIEE DES SERIES CHRONOLOGIQUES 25
7.1 Fonction de correlation croisee : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25
7.1.1 Denition : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 25
7.1.2 L'exemple de la pollution : : : : : : : : : : : : : : : : : : : : : : : : : : : 25
7.2 Modele de Fonction de Transfert : : : : : : : : : : : : : : : : : : : : : : : : : : : 26
7.3 L'in
uence de l'inversion de temperature sur la pollution : : : : : : : : : : : : : : 27
7.4 Les in
uences de l'inversion et de la temperature : : : : : : : : : : : : : : : : : : 34
7.5 Previsions : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : 36
iii
Chapitre 1
INTRODUCTION AUX
MODELES BOX-JENKINS
1.1 Introduction
Nous supposons donc que vous savez ce qu'est une serie chronologique (sinon voir [8]) et
quels sont les pieges pouvant survenir face a l'etude de celles-ci. Dans la suite, nous aurons une
serie notee:
Xt avec t = 1; : : :; n
C'est-a-dire que nous avons une serie de n observations sequentielles ordonnees suivant leurs
indices.
1
1.3 Comment rendre une serie stationnaire
1.3.1 Pourquoi des series sont non stationnaires
1. La premiere serie non stationnaire a laquelle on pense est celle qui est croissante dans le
temps. Par exemple la serie \Airline Data" (cf [8]) est croissante, qu'elle soit prise telle
quelle, ou transformee par Logarithme.
2. Une serie saisonniere est egalement non stationnaire puisque la valeur esperee depend
du temps dans la periode de la saison. Par exemple la serie \Airline Data" n'est pas
stationnaire egalement par le fait de saisonnalite.
3. Une serie dont la dispersion varie dans le temps n'est pas stationnaire. Par exemple, la
serie des valeurs brutes \Airline Data" n'est pas stationnaire du fait que sa dispersion
grandit dans le temps. La transformation par le Logarithme permet d'eviter ce probleme.
En fait, en prenant une serie brutalement, on a fort peu de chances pour qu'elle soit station-
naire.
1.3.2 Le lissage de la serie
On peut d'abord lisser les donnees (cf [8]). On regardera alors le rugueux et celui-ci est
stationnaire. Nous ne nous attarderons pas sur cet aspect de l'analyse.
1.3.3 Les operateurs de Box-Jenkins
L'operateur de recul B
L'operateur de recul B est deni comme agissant sur la serie. A un instant t on fait corres-
pondre la valeur de la serie a l'instant t ; 1. On denit ainsi une nouvelle serie B X comme:
B Xt = Xt;1
On peut appliquer plusieurs fois cet operateur, on denit ainsi des nouvelles series:
B2 Xt = B (B Xt) = B Xt;1 = Xt;2
et
Bm Xt = Xt;m
L'operateur de dierenciation r
L'operateur r (prononcer \nabla") est deni par:
rXt = Xt ; Xt;1 (1.1)
Nous entrons maintenant dans des considerations de notations. En eet, par ecriture pure-
ment formelle on peut ecrire:
rXt = Xt ; B Xt = (1 ; B) Xt (1.2)
On peut ecrire r sous la forme d'un polyn^ome en B avec:
2
r = 1;B
Ce mode d'ecriture sous forme de polyn^ome en B est en fait tres pratique mais totalement
formel. Il ne faut pas oublier que, quand on ecrit (1 ; B ) X , on denit a partir d'une serie X,
une nouvelle serie qui a t, fait correspondre la dierence entre la valeur de la serie observee a
l'instant t et celle observee a l'instant t ; 1.
L'operateur de desaisonnalisation rs
L'operateur rs est deni par:
rs Xt = Xt ; Xt;s
En d'autres termes:
rs = (1 ; Bs )
Les eets des operateurs de Box-Jenkins
L'operateur r
1. permet d'eliminer la tendance de la serie.
2. peut ^etre repete plusieurs fois si la tendance n'est pas lineaire. Par exemple:
r2 Xt = (1 ; B)2 Xt = (1 ; 2B + B2) Xt
permet d'eliminer une tendance quadratique. Le nombre de fois ou on applique r est
appele ordre de dierenciation.
L'operateur rs
1. permet d'eliminer la saisonnalite de periode s.
2. On peut egalement l'appliquer plusieurs fois.
rs2 Xt = rs (Xt ; Xt;s)
Le nombre de fois ou on applique rs est appele ordre de desaisonnalisation.
4
Chapitre 2
LE MODELE LINEAIRE DE
BOX-JENKINS
2.1 Hypothese
On suppose que notre serie Xt est generee a partir d'une autre serie at qui suit une loi de
Gauss de moyenne 0 et d'ecart-type a , sous le forme:
Xt = + at + tat;1 + t;1 at;2 + : : :
at verie donc:
8
> a ; N (0; 2)
< E (at) = 0 8 t a
>
( 2
>
> si k=0
:
(k) = Cov (at; at+k ) = 0 a si k 6= 0
La serie at est un \bruit blanc". C'est l'exemple parfait d'une serie stationnaire puisque son
esperance est toujours nulle, que sa dispersion est stable et qu'il y a independance entre les
observations.
La valeur est la moyenne de la serie Xt . Nous supposerons dorenavant, que la serie
Xt est centree et donc que = 0.
L'Analyse des series sous l'aspect Box-Jenkins consiste a chercher la serie at et les coecients
i qui permettent de passer de la serie at a Xt .
2.2 Filtre
De l'equation precedente, on peut ecrire:
Xt = at + 1B at + 2B2 at + : : :
Xt = (1 + 1B + 2B2 + : : :)at
Xt = (B)at (2.1)
(B ) est un polyn^ome en B dont les coecients sont les i . Si on revient a la notion de
ltre [8], la serie at est en entree d'un ltre dont la serie Xt est en sortie et le polyn^ome (B )
est la \fonction de transfert" du ltre.
5
On peut remarquer que formellement le polyn^ome (B ) a une innite de termes mais dans
la pratique on ne dispose que de n observations et on ne peut remonter que jusqu'a la valeur
t = 1.
6
Chapitre 3
PROCESSUS A MOYENNE
MOBILE
En anglais, moyenne mobile se dit \Moving Average" c'est pourquoi nous dirons que ces
series sont des MA.
3.1 MA d'ordre 1
On dit que la serie Xt suit un processus de moyenne mobile d'ordre 1 (MA(1)) si elle est
generee par un bruit blanc at sous la forme:
Xt = at ; at;1
Xt = (1 ; B)at
La fonction de transfert du ltre se reduit a un seul terme.
Variance de X Par calculs simples, on peut montrer que
V ar(X ) = (1 + 2)a2
V ar(X ) > a2
C'est-a-dire qu'en modelisant, on diminue la variance du phenomene ce qui est, par nature,
le propre de toute modelisation!
Autocorrelation de X De m^eme, on peut montrer que
( ;
(k) = 01+2 Si k=1
Si k 2
On peut dessiner la fonction d'autocorrelation (ACF). Ce dessin est d'ailleurs appele au-
7
tocorrelogramme.
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
3.2 MA d'ordre q
On suppose que la serie X est generee par un bruit blanc a sous la forme:
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
8
3.3 En resume
Pour reconna^tre qu'une serie X est un processus moyenne mobile d'ordre q, on va dessiner
l'autocorrelogramme de cette serie. Pour chacune des valeurs d'autocorrelation, on aura un
intervalle de conance sur cette valeur. Si on peut decider que jusqu'a un decalage q, ces valeurs
sont dierentes de 0, et qu'ensuite elles ne sont pas statistiquement dierentes de 0, alors on
pourra dire que la serie suit un processus MA(q).
On peut remarquer aussi qu'une telle serie est stationnaire.
9
Chapitre 4
PROCESSUS AUTOREGRESSIF
De tels processus seront notes AR.
4.1 AR d'ordre 1
On dit que la serie Xt suit un processus autoregressif d'ordre 1 (AR(1)) si on peut ecrire:
Xt = Xt;1 + at
Xt ; Xt;1 = at
(1 ; B )Xt = at
ou la serie at est un bruit blanc.
On peut remarquer qu'on fait une regression de la serie decalee de 1 sur la serie elle-m^eme
et les residus forment un bruit blanc.
Fonction de transfert On peut ecrire:
Xt = at + Xt;1
Xt = at + at;1 + 2 Xt;2
Xt = at + at;1 + 2 at;2 + : : : + k at;k + : : :
X1
Xt = iat;i
i=0
1
X
Xt = iBi at = (B)at
i=0
La fonction de transfert a donc une innite de termes. Si on revient a notre ecriture formelle
sous forme de polyn^ome, on remarque qu'on a calcule l'inverse du polyn^ome (1 ; B ) et
que
1
X
(1 ; B );1 = i B i
i=0
10
Variance de X Par calculs simples, on peut montrer que
2
V ar(X ) = 1 ;a2
Ici aussi, on diminue la variance en modelisant a condition que soit en valeur absolue
inferieur a 1.
Autocorrelation de X De m^eme, on peut montrer que
(k) = k pour k 1
On peut obtenir deux sortes de correlogramme suivant si est positif ou negatif.
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
jj < 1
4.2 AR d'ordre p
Une serie X suit un processus autoregressif d'ordre p (AR(p)) si on peut ecrire:
11
Ici encore, on fait une regression des p series decalees sur la serie elle-m^eme.
Autocorrelation Pour un processus AR(p), on ne peut rien dire de sa fonction ACF, si ce
n'est que:
et
PACF (k) = Corr(U; V )
Il faut comprendre que l'autocorrelation partielle est la correlation entre Xt et Xt+k , une
fois qu'on a explique ceux-ci par les valeurs entre eux deux, Xt+1 ; Xt+2; : : :; Xt+k;1.
4.3.1 ACF et PACF d'un AR(1)
Prenons une serie Xt suivant un processus autoregressif d'ordre 1. Par exemple:
Xt = 0:9Xt;1 + at
ACF(1) La correlation entre Xt et Xt+1 peut se calculer facilement
ACF (1) = Corr(Xt+1; Xt)
= Corr(0:9Xt + at+1 ; Xt)
= 0:9Corr(Xt; Xt) + Corr(at+1; Xt)
= 0:9 + 0 = 0:9
Ceci est vrai car Xt et at+1 sont independants.
12
ACF(2) En ecrivant la relation entre une valeur a un instant et la valeur precedente a l'ordre
t ; 1, on a:
Xt;1 = 0:9Xt;2 + at;1
d'ou
Xt = 0:9(0:9Xt;2 + at;1) + at
Xt = 0:81Xt;2 + 0:9at;1 + at
Comme Xt;2 est independant a la fois de at;1 et at, on en deduit facilement que:
13
PACF(2) Il faut, pour calculer PACF(2), faire la regression de Xt+1 sur Xt+2 et sur Xt. On
sait deja que:
Xt+2 = 0:9Xt+1 + at+2
Du rappel precedent, on en deduit que, si on fait la regression de Xt+1 sur Xt on obtient:
Xt = 0:9Xt+1 + Vt
Pour le calcul de PACF(2), on calcule la correlation entre les 2 residus de ces regressions:
PACF (2) = Corr(Xt+2 ; 0:9Xt+1; Xt ; 0:9Xt+1)
= Corr(at+2; Xt ; 0:9Xt+1)
= Corr(at+2; Xt) ; 0:9Corr(at+2; Xt+1)
PACF (2) = 0
PACF(k) Par de calculs similaires on peut montrer que:
PACF (k) = 0 Pour tout k > 1
4.3.2 PACF d'un AR(p)
Nous ne nous attarderons pas sur cette fonction d'autocorrelation partielle mais on peut
montrer que:
PACF (k) = 0 Pour tout k > p
4.4 Dualite
Pour introduire un tableau de dualite entre les processus MA et AR:
AR(p) MA(q)
ACF = 0 Pour tout k > q
PACF = 0 Pour tout k > p
On reconna^t qu'une serie suit un processus MA(q) si sa fonction d'autocorrelation ACF s'an-
nule a partir d'un decalage q, ou qu'elle suit un processus AR(p) si sa fonction d'autocorrelation
partielle PACF s'annule a partir d'un decalage p.
14
Chapitre 5
15
5.2 Les processus ARIMA
Une serie Xt suit un processus ARIMA (AutoRegressive Integrated Moving Average) d'ordre
(p,d,q) si elle suit un processus ARMA d'ordre (p+d,q):
(B )Xt = (B )at
ou la valeur B=1 est racine d'ordre d du polyn^ome (B ). On modelise alors la serie sous la
forme:
(B )(1 ; B )d Xt = (B )at
(B )rd Xt = (B )at
ou le polyn^ome (B ) est de degre p et le polyn^ome (B ) est de degre q. On ecrit que la serie
Xt suit un processus ARIMA(p,d,q).
On peut remarquer que la serie Xt suivant un processus ARIMA n'est pas stationnaire
puisqu'il faut lui appliquer l'operateur de dierenciation pour avoir un bruit blanc la generant.
16
Chapitre 6
UN EXEMPLE
6.1 Donnees de Pollution Atmospherique
Les donnees dont nous disposons nous ete fournies par l'ASCOPARG (Association pour le
Contr^ole de la Pollution Atmospherique dans la Region Grenobloise) par Mme Marie-Blanche
Personnaz.
Cette Association mesure, en divers points de la cuvette grenobloise, chaque quart d'heure
plusieurs polluants et plusieurs param^etres meteorologiques. Son but est non seulement de
contr^oler la pollution atmospherique mais egalement de prevenir les personnes competentes en
cas de pollution ague.
Nous nous interesserons ici seulement a quelques param^etres: le dioxide de soufre (SO2)
mesure a la Villeneuve de Grenoble, la temperature au Peuil-de-Claix (situe environ a 800m
d'altitude) l'inversion de temperature, c'est-a-dire a la dierence de temperature entre le Peuil-
de-Claix et le Pont-de-Claix (situe dans la vallee). La situation encaissee de la vallee grenobloise
permet eectivement de mesurer facilement cette inversion de temperature, mais elle apporte
beaucoup de probleme de pollution. Des etudes anterieures ont montre l'in
uence de ces pa-
ram^etres sur la pollution.
6.4 Modelisation
Le chier DATA2 de donnees contient 4 variables: la temperature a Pont-de-Claix, celle
au Peuil-de-Claix, le SO2 a la Villeneuve et la vitesse du vent. Ces mesures sont ramenees par
moyenne sur 3 heures a partir de 0heure de chaque jour. Nous avons pris 240 mesures, soit 30
jours, situees en periode d'hiver, a cheval sur les mois de janvier et fevrier 1986.
Les ordres de BMDP2T permettant de faire les auto-correlogrammes ACF et PACF de
l'inversion sont les suivants:
/PROBLEM TITLE IS 'MODELISATION DE LA POLUTION'.
/INPUT VARIABLES ARE 4.
FORMAT IS '(4F4.0)'.
FILE IS DATA2 .
/VARIABLE ADDED IS 1.
NAMES ARE TPNTCLAI,TPEUIL,SO2VILLE,VARITH,INVERS.
/TRANSFORM INVERS=TPEUIL-TPNTCLAI.
/END
ACF VAR=5./
PACF VAR=5./
END/
18
PLOT OF AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .806 + IXX+XXXXXXXXXXXXXXXXX
2 .531 + IXXXX+XXXXXXXX
3 .355 + IXXXX+XXXX
4 .230 + IXXXXXX
5 .143 + IXXXX +
6 .128 + IXXX +
7 .218 + IXXXXX+
8 .268 + IXXXXX+X
9 .111 + IXXX +
10 -.097 + XXI +
11 -.203 +XXXXXI +
12 -.247 XXXXXXI +
13 -.258 XXXXXXI +
14 -.208 +XXXXXI +
15 -.055 + XI +
16 .058 + IX +
17 -.011 + I +
18 -.130 + XXXI +
19 -.158 + XXXXI +
20 -.138 + XXXI +
21 -.096 + XXI +
22 -.020 + I +
23 .147 + IXXXX +
24 .280 + IXXXXX+X
25 .209 + IXXXXX +
26 .057 + IX +
27 -.033 + XI +
28 -.059 + XI +
29 -.057 + XI +
30 -.022 + XI +
31 .090 + IXX +
32 .169 + IXXXX +
33 .074 + IXX +
34 -.089 + XXI +
35 -.191 + XXXXXI +
36 -.224 +XXXXXXI +
PLOT OF PARTIAL AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .806 + IXX+XXXXXXXXXXXXXXXXX
2 -.342 XXXXXX+XXI +
3 .183 + IXX+XX
4 -.127 XXXI +
5 .065 + IXX+
6 .099 + IXX+
7 .266 + IXX+XXXX
8 -.173 X+XXI +
9 -.446 XXXXXXXX+XXI +
10 -.026 + XI +
11 .069 + IXX+
12 .033 + IX +
13 .018 + I +
14 -.006 + I +
15 .131 + IXXX
16 -.063 +XXI +
17 -.133 XXXI +
18 .009 + I +
19 .089 + IXX+
20 .021 + IX +
21 .086 + IXX+
22 -.051 + XI +
23 .157 + IXX+X
24 .006 + I +
25 -.181 XX+XXI +
26 -.065 +XXI +
27 -.046 + XI +
28 .115 + IXXX
29 .041 + IX +
30 -.035 + XI +
31 -.033 + XI +
32 -.058 + XI +
33 -.042 + XI +
34 -.009 + I +
35 -.036 + XI +
36 .002 + I +
Laissons de c^ote pour le moment l'aspect saisonnier de cette serie; saison d'ailleurs qui est
quotidienne puisque la periode est de 8 fois 3 heures.
L'aspect des auto-correlogrammes laisserait supposer un modele ARMA(1,1). Faisons une
estimation de ces param^etres et dessinons les correlogrammes des residus. Les ordres sont:
19
ARIMA VAR=5. CENTERED. AROR='(1)'.MAOR='(1)'./
ESTIMATION RESIDUALS=RES5./
ACF VAR=RES5./
PACF VAR=RES5./
BMDP a un avantage: il permet de faire l'estimation des param^etres par deux methodes
dierentes ce qui permet d'avoir une qualite du modele choisi; en eet, si les param^etres estimes
par les deux methodes sont tres dierents on peut douter de la justesse de celui-ci.
ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD
20
PLOT OF AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 -.019 + I +
2 -.046 + XI +
3 -.025 + XI +
4 -.078 +XXI +
5 -.076 +XXI +
6 -.107 XXXI +
7 .102 + IXXX
8 .281 + IXX+XXXX
9 .131 + IXXX+
10 -.135 +XXXI +
11 .028 + IX +
12 -.017 + I +
13 -.049 + XI +
14 .001 + I +
15 -.012 + I +
16 .221 + IXXX+XX
17 .070 + IXX +
18 -.055 + XI +
19 -.013 + I +
20 -.008 + I +
21 -.006 + I +
22 .019 + I +
23 .041 + IX +
24 .179 + IXXXX
25 .039 + IX +
26 -.099 + XXI +
27 -.048 + XI +
28 -.012 + I +
29 -.084 + XXI +
30 .014 + I +
31 -.025 + XI +
32 .205 + IXXX+X
33 .100 + IXX +
34 -.042 + XI +
35 -.024 + XI +
36 -.029 + XI +
PLOT OF PARTIAL AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 -.019 + I +
2 -.046 + XI +
3 -.027 + XI +
4 -.082 +XXI +
5 -.083 +XXI +
6 -.122 XXXI +
7 .085 + IXX+
8 .274 + IXX+XXXX
9 .161 + IXX+X
10 -.130 XXXI +
11 .025 + IX +
12 .029 + IX +
13 .039 + IX +
14 .060 + IX +
15 -.059 + XI +
16 .103 + IXXX
17 .055 + IX +
18 .010 + I +
19 -.002 + I +
20 -.018 + I +
21 .030 + IX +
22 .068 + IXX+
23 .036 + IX +
24 .113 + IXXX
25 -.024 + XI +
26 -.058 + XI +
27 -.034 + XI +
28 .002 + I +
29 -.079 +XXI +
30 -.024 + XI +
31 -.105 XXXI +
32 .110 + IXXX
33 .081 + IXX+
34 .041 + IX +
35 -.025 + XI +
36 -.024 + XI +
En regardant les graphiques precedents, on peut en deduire un ajout au modele comme etant
un ARMA(1,1) sur une periode de 8. Les ordres pour cela sont:
ARIMA VAR=5. CENTERED. AROR='(1),(8)'.MAOR='(8)'./
ESTIMATION RESIDUALS=RES5./
ACF VAR=RES5./
PACF VAR=RES5./
21
Le resultat en est:
ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD
La moyenne de la variance des residus vaut environ 270, celle de la serie de depart etant de
1450, on deduit que notre modele permet d'expliquer environ 81% de la variance de l'inversion
de temperature. Les correlogrammes des residus sont les suivants:
22
PLOT OF AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 -.013 + I +
2 .046 + IX +
3 .012 + I +
4 -.087 +XXI +
5 -.058 + XI +
6 -.083 +XXI +
7 .028 + IX +
8 -.089 +XXI +
9 .083 + IXX+
10 -.089 +XXI +
11 .122 + IXXX
12 .044 + IX +
13 .009 + I +
14 .068 + IXX+
15 -.081 +XXI +
16 -.096 +XXI +
17 -.012 + I +
18 .016 + I +
19 .057 + IX +
20 .044 + IX +
21 .070 + IXX+
22 .091 + IXX +
23 .048 + IX +
24 -.057 + XI +
25 -.070 + XXI +
26 -.093 + XXI +
27 -.028 + XI +
28 .007 + I +
29 -.046 + XI +
30 .068 + IXX +
31 -.027 + XI +
32 .089 + IXX +
33 .080 + IXX +
34 .002 + I +
35 .030 + IX +
36 -.027 + XI +
PLOT OF PARTIAL AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 -.013 + I +
2 .046 + IX +
3 .014 + I +
4 -.089 +XXI +
5 -.062 +XXI +
6 -.078 +XXI +
7 .034 + IX +
8 -.088 +XXI +
9 .071 + IXX+
10 -.101 XXXI +
11 .118 + IXXX
12 .030 + IX +
13 .016 + I +
14 .039 + IX +
15 -.058 + XI +
16 -.113 XXXI +
17 .036 + IX +
18 .012 + I +
19 .096 + IXX+
20 .004 + I +
21 .066 + IXX+
22 .085 + IXX+
23 .047 + IX +
24 -.059 + XI +
25 -.070 +XXI +
26 -.094 +XXI +
27 .046 + IX +
28 .021 + IX +
29 -.027 + XI +
30 .038 + IX +
31 -.060 + XI +
32 .064 + IXX+
33 .068 + IXX+
34 -.024 + XI +
35 .028 + IX +
36 -.019 + I +
On peut constater sur ces dessins que les residus forment bien un bruit blanc.
L'inversion de temperature suit donc un modele ARMA (1; 0)(1; 1)8. Pour la temperature au
Peuil-de-Claix, on peut trouver par la m^eme technique, qu'elle suit un modele ARIMA (1; 0; 1)
(0; 1; 1)8 dont l'estimation des param^etres est la suivante:
23
ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD
La moyenne de la variance des residus vaut environ 100, celle de la serie de depart etant
d'environ 1520, on peut en deduire que notre modele explique environ 93% de la variance de la
temperature au Peuil-de-Claix.
24
Chapitre 7
;k
nX X
n X
n
X;Y (k) = 1=n (Yj +k ; Y )(Xj ; X ) avec X = 1=n Xi et Y = 1=n Yi (7.1)
j =1 i=1 i=1
Il faut remarquer que, ici encore, la somme ne fait intervenir que n ; k termes mais on
divise par n et non pas par n ; k comme on le fait dans un calcul de covariance habituel.
Il faut aussi dire que dans ce calcul de covariance on essaie de conna^tre l'in
uence de la
serie X sur la serie Y avec un certain decalage dans le temps.
{ La correlation croisee au decalage k entre deux series Xt et Yt , X;Y (k) est denie par:
X;Y (k) =
X;Y (k)=
X;Y (0) (7.2)
{ La fonction de correlation croisee est la fonction qui a k associe la valeur X;Y (k). On
notera cette fonction comme etant la CCF de la serie X sur la serie Y.
7.1.2 L'exemple de la pollution
Regardons la correlation croisee entre l'inversion de temperature et le niveau de SO2 mesure
a la Villeneuve de Grenoble. Le programme que nous utilisons permet d'etudier en m^eme temps
l'in
uence des 2 variables l'une sur l'autre. Les ordres de BMDP sont les suivants:
CCF VAR=3,5./
25
CORRELATION OF SO2VILLE AND INVERS IS .52
PLOT OF CROSS CORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
-20 .367 + IXX+XXXXXX
-19 .410 + IXX+XXXXXXX
-18 .419 + IXX+XXXXXXX
-17 .356 + IXX+XXXXXX
-16 .252 + IXX+XXX
-15 .221 + IXX+XXX
-14 .300 + IXX+XXXXX
-13 .396 + IXX+XXXXXXX
-12 .453 + IXX+XXXXXXXX
-11 .485 + IXX+XXXXXXXXX
-10 .504 + IXX+XXXXXXXXXX
-9 .463 + IXX+XXXXXXXXX
-8 .386 + IXX+XXXXXXX
-7 .357 + IXX+XXXXXX
-6 .421 + IXX+XXXXXXXX
-5 .525 + IXX+XXXXXXXXXX
-4 .615 + IXX+XXXXXXXXXXXX
-3 .667 + IXX+XXXXXXXXXXXXXX
-2 .696 + IXX+XXXXXXXXXXXXXX
-1 .651 + IXX+XXXXXXXXXXXXX
0 .521 + IXX+XXXXXXXXXX
1 .416 + IXX+XXXXXXX
2 .438 + IXX+XXXXXXXX
3 .499 + IXX+XXXXXXXXX
4 .536 + IXX+XXXXXXXXXX
5 .548 + IXX+XXXXXXXXXXX
6 .530 + IXX+XXXXXXXXXX
7 .468 + IXX+XXXXXXXXX
8 .348 + IXX+XXXXXX
9 .277 + IXX+XXXX
10 .291 + IXX+XXXX
11 .338 + IXX+XXXXX
12 .364 + IXX+XXXXXX
13 .374 + IXX+XXXXXX
14 .374 + IXX+XXXXXX
15 .333 + IXX+XXXXX
16 .266 + IXX+XXXX
17 .201 + IXX+XX
18 .214 + IXX+XX
19 .272 + IXX+XXXX
20 .321 + IXX+XXXXX
Comme on a mis en premier l'indice de pollution, les premieres valeurs pour des decalages
negatifs concernent l'in
uence de l'inversion sur la pollution et celles des decalages positifs
concernent l'in
uence de la pollution sur l'inversion de temperature.
Comme on le constate, la correlation croisee entre deux series qui evoluent en m^eme temps
(ici elles sont periodiques de m^eme periode) ne veut rien dire. C'est dans ce probleme qu'on voit
l'aspect necessaire de la modelisation univariee des series.
Constatons toutefois que dans ce correlogramme, il semblerait que l'eet de l'inversion de
temperature se fasse avec un decalage entre 6 et 9 heures de retard.
26
7.3 L'in
uence de l'inversion de temperature sur la pollution
Revenons a notre exemple pour plus de simplicite. Pour essayer d'identier notre modele, le
principe est:
1. Modeliser suivant un modele SARIMA, l'inversion de temperature et recuperer les residus.
2. Filtrer la pollution suivant le m^eme modele et recuperer les residus.
3. Calculer le correlation croisee entre ces residus.
Les ordres du programme BMDP sont les suivants:
ARIMA VAR=5. CENTERED. AROR='(1)',(8)'. MAOR='(8)'./
ESTIMATION RESIDUALS=RES5./
FILTER VAR=3. RESIDUALS=RES3./
CCF VAR=RES5,RES3. MAXLAG=10./
Le resultat est le suivant:
27
CORRELATION OF RES5 AND RES3 IS .07
1- 10 .16 .06 .04 .07 .11 .03 .05 -.12 -.13 .05
ST.E. .07 .07 .07 .07 .07 .07 .07 .07 .07 .07
1- 10 -.08 .06 .03 -.02 -.02 -.01 .10 -.10 .06 .02
ST.E. .07 .07 .07 .07 .07 .07 .07 .07 .07 .07
SCCF(X(I),Y(I+K)) SCCF(Y(I),X(I+K))
LAG *SY/SX *SX/SY *SY/SX *SX/SY
28
Remarquons qu'ici on a bien mis la variable de meteorologie en premier. Si on regarde
le dessin de la fonction de correlation croisee, on constate que la seule correlation vraiment
signicative est au decalage 1 (soit 3 heures de decalage). On remarquera ainsi que l'hypothese
d'un retard entre 6 et 9 heures que nous avions faite precedement etait fausse.
Ici on peut proposer deux modeles:
1. On remarque une certaine forme de courbe en exponentielle decroissante sur les decalages
1, 2, 3 pour la CCF. On propose alors un modele ou le polyn^ome (B ) est du deuxieme
degre. Mais dans ce cas l'evaluation des estimateurs du polyn^ome v (B ) devient relativement
complique. Nous vous proposons de vous reporter au livre de Box et Jenkins pour cela [1].
2. On suppose sinon que le polyn^ome (b) se reduit a l'unite. Alors une premiere estimation
du polyn^ome est donnee directement par le programme; il faut pour cela regarder dans le
paragraphe TRANSFERT FUNCTION WEIGHTS, a l'intersection de la ligne LAG
0 et de la premiere colonne. On obtient ainsi une valeur initiale du param^etre: v1 = 0:27,
et b = 1 avec !0 = 0:27. Cette valeur va ^etre estimee a nouveau quand on soumettra le
modele nal.
Dans le programme BMDP, on va soumettre la variable de pollution a un modele ou elle
est in
uencee par l'inversion a un decalage de 3 heures avec un coecient de 0.27, puis on va
modeliser par un modele SARIMA les residus resultants.
ARIMA VAR=3. CENTERED. /
INDEP VAR=5. CENTERED.
UPORDERS='(1)'. UPVALUES=0.27./
ESTIMATION
RESIDUALS=RES53./
ACF VAR=RES53./
PACF VAR=RES53./
29
PLOT OF AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .635 + IXX+XXXXXXXXXXXXX
2 .206 + IXXX+X
3 -.158 XXXXI +
4 -.285 XXX+XXXI +
5 -.180 XXXXXI +
6 .050 + IX +
7 .292 + IXXXX+XX
8 .408 + IXXXX+XXXXX
9 .260 + IXXXX+X
10 .012 + I +
11 -.192 XXXXXI +
12 -.228 X+XXXXI +
13 -.095 + XXI +
14 .118 + IXXX +
15 .271 + IXXXXX+X
16 .379 + IXXXXX+XXX
17 .276 + IXXXXX+X
18 .104 + IXXX +
19 -.082 + XXI +
20 -.155 + XXXXI +
21 -.103 + XXXI +
22 .018 + I +
23 .114 + IXXX +
24 .173 + IXXXX +
25 .070 + IXX +
26 -.003 + I +
27 -.070 + XXI +
28 -.061 + XXI +
29 .010 + I +
30 .118 + IXXX +
31 .174 + IXXXX +
32 .178 + IXXXX +
33 .074 + IXX +
34 .022 + IX +
35 -.014 + I +
36 -.010 + I +
PLOT OF PARTIAL AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .635 + IXX+XXXXXXXXXXXXX
2 -.331 XXXXX+XXI +
3 -.228 XXX+XXI +
4 .018 + I +
5 .115 + IXXX
6 .129 + IXXX
7 .175 + IXX+X
8 .113 + IXXX
9 -.151 X+XXI +
10 -.046 + XI +
11 -.002 + I +
12 .038 + IX +
13 .061 + IXX+
14 .080 + IXX+
15 .012 + I +
16 .202 + IXX+XX
17 -.022 + XI +
18 .054 + IX +
19 -.023 + XI +
20 -.000 + I +
21 -.023 + XI +
22 -.013 + I +
23 -.045 + XI +
24 .013 + I +
25 -.136 XXXI +
26 .118 + IXXX
27 .022 + IX +
28 .038 + IX +
29 .028 + IX +
30 .061 + IXX+
31 .000 + I +
32 .008 + I +
33 -.044 + XI +
34 .080 + IXX+
35 -.002 + I +
36 -.012 + I +
En regardant la PACF, on peut supposer qu'a part le probleme d^u a la saisonnalite elle
n'est pas nulle seulement aux decalages 1, 2, 3. On modeliserait ces residus comme un SARIMA
(3; 0; 0) (1; 0; 0)8. Mais l'estimation montre que le troisieme param^etre ne peut pas ^etre juge
signicativement dierent de 0. On modelise donc ces residus comme un SARIMA (2; 0; 0)
(1; 0; 0)8.
ARIMA VAR=3. CENTERED. /
INDEP VAR=5. CENTERED.
30
UPORDERS='(1)'. UPVALUES=0.27./
ARIMA VAR=3. CENTERED. AROR='(1,2),(8)'./
ESTIMATION
RESIDUALS=RES53./
31
ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD
32
PLOT OF AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .003 + I +
2 .001 + I +
3 -.001 + I +
4 -.035 + XI +
5 .032 + IX +
6 -.012 + I +
7 .078 + IXX+
8 -.096 +XXI +
9 -.031 + XI +
10 -.101 XXXI +
11 -.064 +XXI +
12 -.013 + I +
13 .064 + IXX+
14 .083 + IXX+
15 .000 + I +
16 .048 + IX +
17 .062 + IXX+
18 .075 + IXX+
19 .023 + IX +
20 -.002 + I +
21 .041 + IX +
22 -.076 +XXI +
23 .021 + IX +
24 .080 + IXX+
25 -.095 +XXI +
26 -.005 + I +
27 -.092 +XXI +
28 -.026 + XI +
29 -.049 + XI +
30 .040 + IX +
31 .022 + IX +
32 .056 + IX +
33 -.043 + XI +
34 -.076 + XXI +
35 .093 + IXX +
36 -.028 + XI +
PLOT OF PARTIAL AUTOCORRELATIONS
-1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0
LAG CORR. +----+----+----+----+----+----+----+----+----+----+
I
1 .003 + I +
2 .001 + I +
3 -.001 + I +
4 -.035 + XI +
5 .033 + IX +
6 -.012 + I +
7 .078 + IXX+
8 -.099 +XXI +
9 -.028 + XI +
10 -.105 XXXI +
11 -.057 + XI +
12 -.027 + XI +
13 .073 + IXX+
14 .072 + IXX+
15 .020 + IX +
16 .045 + IX +
17 .079 + IXX+
18 .068 + IXX+
19 .007 + I +
20 -.028 + XI +
21 .029 + IX +
22 -.072 +XXI +
23 .028 + IX +
24 .104 + IXXX
25 -.073 +XXI +
26 .013 + I +
27 -.074 +XXI +
28 -.014 + I +
29 -.044 + XI +
30 .020 + I +
31 -.016 + I +
32 .073 + IXX+
33 -.073 +XXI +
34 -.058 + XI +
35 .073 + IXX+
36 -.034 + XI +
33
7.4 Les in
uences de l'inversion et de la temperature
Par la m^eme demarche, on peut etudier l'in
uence de la temperature mesuree au Peuil-
de-Claix sur la pollution. On remarquerait alors que la correlation est positive et est a eet
immediat, et qu'une premiere estimation du param^etre !0 est 0.67.
Le programme qui permet d'analyser les in
uences de ces deux param^etres en m^eme temps
est:
ARIMA VAR=3. CENTERED./
INDEP VAR=5. CENTERED.
UPORDERS='(1)'. UPVALUES=0.27./
INDEP VAR=2. CENTERED.
UPORDERS='(0)'. UPVALUES=0.67./
ARIMA VAR=3. CENTERED. AROR='(1,2),(8)'./
ESTIMATION RESIDUALS=RES523./
ACF VAR=RES523./
PACF VAR=RES523./
Le resultat en est:
34
ESTIMATION BY CONDITIONAL LEAST SQUARES METHOD
SUMMARY OF THE MODEL
7.5 Previsions
Enn, pour terminer la justication d'un modele, il faut verier si les previsions que nous
pouvons faire, a partir de ce modele, sont compatibles avec ce qui est observe.
On peut utiliser 2 manieres de faire:
1. Faire une prevision sur plusieurs temps (par exemple, le dernier jour observe) a partir des
donnees mesurees sur la periode precedant ceux-ci.
2. Faire une prevision reactualisee a chaque fois par ce qui a ete reellement observe.
Notre programme BMDP se terminera donc par:
FORECAST CASES=8. START=233./
FORECAST CASES=1. START=234./
FORECAST CASES=1. START=235./
FORECAST CASES=1. START=236./
FORECAST CASES=1. START=237./
FORECAST CASES=1. START=238./
FORECAST CASES=1. START=239./
FORECAST CASES=1. START=240./
36
PERIOD FORECASTS ST. ERR. ACTUAL RESIDUAL
233 63.28706 25.14692 63.00000 .28706
234 82.49854 32.23587 140.00000 -57.50146
235 130.99423 33.77615 189.00000 -58.00577
236 155.05760 33.92746 129.00000 26.05760
237 135.17631 33.92769 120.00000 15.17631
238 101.64390 33.93442 61.00000 40.64390
239 108.05569 33.93925 62.00000 46.05569
240 80.80442 33.94053 64.00000 16.80442
Comme on peut le constater, notre modele serait a ameliorer puisqu'il aurait une certaine
tendance a estimer avec un peu de retard la pointe de pollution; ceci est peut-^etre d^u egalement
au pas de temps choisi de 3 heures qui est sans sans doute un peu grand.
37
Bibliographie
[1] G.E.P. Box et G.M. Jenkins. Time Series Analysis: forecasting and control. Holden-Day
(1976).
[2] P.J. Brockwell et R.A. Davis. Time Series: Theory and Method. Springer-Verlag (1987).
[3] P.F. Coutrot et F. Droesbeke. Les methodes de prevision. Que sais-je? no 2157 (1984).
[4] W.J. Dixon et coll. BMDP Statistical Software. University of California Press (1985).
[5] E. Horber. Exploratory Data Analysis: User's Manual. Version 2.1/1. Universite de Geneve.
(1989).
[6] C.W. Ostrow Jr. Time Series Analysis: Regression Techniques. Serie: Quantitative Appli-
cations in the Social Sciences. Sage Publications (1982).
[7] B. Rapacchi. TSEDA. User's Manual. Centre InterUniversitaire de Calcul de Grenoble
(1989).
[8] B. Rapacchi. Lissons les donnees !!. Centre InterUniversitaire de Calcul de Grenoble (1989).
[9] D.H. Sanders, A.F. Murph, R.J. Eng. Les statistiques: une approche nouvelle. Mac-Graw
Hill (1984).
[10] SPSS Inc. SPSSx. User's Manual. MacGraw-Hill Book Company (1986).
38