You are on page 1of 392

9782100721511-Bourbo-lim.

qxd

22/10/14

10:34

Page I

conomtrie
Cours et exercices corrigs
Rgis Bourbonnais

9e dition

9782100721511-Bourbo-lim.qxd

14/11/14

9:11

Page II

Dunod, 2015
5 rue Laromiguire, 75005 Paris
www.dunod.com
ISBN 978-2-10-072151-1

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page III

Table des matires


Avant-propos

IX

1. Quest-ce que lconomtrie ?

I. La notion de modle
A. Dfinition
B. La construction des modles en conomtrie
II. Le rle de lconomtrie
A. Lconomtrie comme validation de la thorie
B. Lconomtrie comme outil dinvestigation
III. La thorie de la corrlation
A. Prsentation gnrale
B. Mesure et limite du coefficient de corrlation

1
1
2
5
5
5
6
6
8

2. Le modle de rgression simple

13

I. Prsentation du modle
A. Exemple introductif
B. Rle du terme alatoire
C. Consquences du terme alatoire
II. Estimation des paramtres
A. Modle et hypothses
B. Formulation des estimateurs
C. Les diffrentes critures du modle : erreur et rsidu
D. Proprits des estimateurs
III. Consquences des hypothses : construction des tests
A. Hypothse de normalit des erreurs
B. Consquences de lhypothse de normalit des erreurs
C. Test bilatral, test unilatral et probabilit critique dun test
IV. quation et tableau danalyse de la variance
A. quation danalyse de la variance
B. Tableau danalyse de la variance
V. La prvision dans le modle de rgression simple

13
13
14
16
17
17
18
21
22
24
24
25
27
33
33
34
39

Table des matires  III

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page IV

3. Le modle de rgression multiple

47

I. Le modle linaire gnral


A. Prsentation
B. Forme matricielle
II. Estimation et proprits des estimateurs
A. Estimation des coefficients de rgression
B. Hypothses et proprits des estimateurs
C. quation danalyse de la variance et qualit dun ajustement
III. Les tests statistiques
A. Le rle des hypothses
B. Construction des tests
C. Tests sur les rsidus : valeur anormale, effet de levier
et point dinfluence
IV. Lanalyse de la variance
A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression
B. Autres tests partir du tableau danalyse de la variance
C. Gnralisation des tests par analyse de la variance

47
47
48
49
49
51
54
59
59
60

V. Lutilisation de variables indicatrices


A. Constitution et finalits des variables indicatrices
B. Exemples dutilisation

75
75
76

VI. La prvision laide du modle linaire gnral


et la rgression rcursive
A. Prdiction conditionnelle
B. Fiabilit de la prvision et intervalle de prvision
C. Les tests de stabilit par la rgression rcursive
D. Le test de spcification de Ramsey
VII. Exercices rcapitulatifs
Annexe
A) Interprtation gomtrique de la mthode des moindres carrs
B) Rsolution de lexercice 1 par des logiciels informatiques
de rgression multiple
C) Estimation de la variance de lerreur

4. Multicolinarit et slection du modle optimal


I. Corrlation partielle
A. Exemple introductif
B. Gnralisation de la notion de corrlation partielle
II. Relation entre coefficients de corrlation simple,
partielle et multiple

IV  CONOMTRIE

62
67
67
68
73

81
81
82
84
86
90
102
102
103
105

107
107
107
108
112

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page V

III. Multicolinarit : consquences et dtection


A. Consquences de la multicolinarit
B. Tests de dtection dune multicolinarit
C. Comment remdier la multicolinarit ?

114
114
115
118

IV. Slection du modle optimal

119

5. Problmes particuliers : la violation des hypothses

125

I. Lautocorrlation des erreurs


A. Prsentation du problme
B. Lestimateur des Moindres Carrs Gnraliss (MCG)
C. Les causes et la dtection de lautocorrlation des erreurs
D. Les procdures destimation en cas dautocorrlation des erreurs

125
125
126
127
134

II. Lhtroscdasticit
A. Prsentation du problme
B. Correction de lhtroscdasticit
C. Tests de dtection de lhtroscdasticit
D. Autre test dhtroscdasticit : le test ARCH

142
142
144
147
153

III. Modles erreurs sur les variables


A. Consquences lorsque les variables sont entaches derreurs
B. La mthode des variables instrumentales
C. Le test dexognit dHausman
D. La mthode des moments gnralise

154
154
155
156
157

6. Les modles non linaires

165

I. Les diffrents types de modles non linaires


A. Les fonctions de type exponentiel
B. Les modles de diffusion

165
165
168

II. Mthodes destimation des modles non linaires


A. Initiation aux mthodes destimation non linaires
B. Exemples dapplication

170
170
172

7. Les modles dcalages temporels

177

I. Les modles linaires autorgressifs


A. Formulation gnrale
B. Test dautocorrlation et mthodes destimation

177
177
178

II. Les modles retards chelonns


A. Formulation gnrale
B. Dtermination du nombre de retards

183
183
184

Table des matires  V

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VI

C. Distribution finie des retards


D. Distribution infinie des retards
III. Deux exemples de modles dynamiques
A. Le modle dajustement partiel
B. Le modle danticipations adaptatives

8. Introduction aux modles quations simultanes


I. quations structurelles et quations rduites
A. Exemple introductif
B. Le modle gnral
C. Cas particulier : les modles rcursifs
II. Le problme de lidentification
A. Restrictions sur les coefficients
B. Conditions didentification
III. Les mthodes destimation
A. Les moindres carrs indirects
B. Les doubles moindres carrs
C. Autres mthodes destimation
Annexe
Identification : les conditions de rang

9. lments danalyse des sries temporelles


I. Stationnarit
A. Dfinition et proprits
B. Fonctions dautocorrlation simple et partielle
C. Tests de bruit blanc et de stationnarit
II. La non-stationnarit et les tests de racine unitaire
A. La non-stationnarit : les processus TS et DS
B. Les tests de racine unitaire et la stratgie squentielle de test
III. Les modles ARIMA
A. Typologie des modles AR, MA et ARMA
B. Lextension aux processus ARIMA et SARIMA
IV. La mthode de Box et Jenkins
A. Recherche de la reprsentation adquate : lidentification
B. Estimation des paramtres
C. Tests dadquation du modle et prvision

10. La modlisation VAR


I. Reprsentation dun modle VAR
A. Exemple introductif

VI  CONOMTRIE

188
192
198
198
199

217
218
218
220
221
221
221
222
223
223
223
224
236
236

239
239
239
240
241
245
245
248
256
256
259
260
260
261
262

275
276
276

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VII

B. La reprsentation gnrale
C. La reprsentation ARMAX
II. Estimation des paramtres
A. Mthode destimation
B. Dtermination du nombre de retards
C. Prvision
III. Dynamique dun modle VAR
A. Reprsentation VMA dun processus VAR
B. Analyse et orthogonalisation des chocs
C. Dcomposition de la variance
D. Choix de lordre de dcomposition
IV. La causalit
A. Causalit au sens de Granger
B. Causalit au sens de Sims

277
278
279
279
279
280
284
284
285
288
288
292
292
293

11. La cointgration et le modle correction derreur


I. Exemples introductifs
II. Le concept de cointgration
A. Proprits de lordre dintgration dune srie
B. Conditions de cointgration
C. Le modle correction derreur (ECM)
III. Cointgration entre deux variables
A. Test de cointgration entre deux variables
B. Estimation du modle correction derreur
IV. Gnralisation k variables
A. La cointgration entre k variables
B. Estimation du modle correction derreur
C. Le modle correction derreur vectoriel
D. Tests de relation de cointgration
E. Test dexognit faible
F. Synthse de la procdure destimation

297
297
299
299
301
301
302
303
303
306
306
307
308
310
313
314

12. Introduction lconomtrie des variables qualitatives


I. Les problmes et les consquences de la spcification binaire
II. Les modles de choix binaires
A. Le modle linaire sur variable latente
B. Les modles Probit et Logit
C. Interprtation des rsultats et tests statistiques
III. Les modles choix multiples
A. Les modles Probit et Logit ordonns

319
320
322
322
323
325
330
331

Table des matires  VII

9782100721511-Bourbo-tdm.qxd

22/10/14

10:35

Page VIII

B. Le modle de choix multiples non ordonn :


le Logit multinomial
IV. Les modles variable dpendante limite : le modle Tobit
A. Le modle Tobit simple : modle de rgression tronqu
ou censur
B. Estimation et interprtation des rsultats

13. Introduction lconomtrie des donnes de panel


I. Prsentation des modles donnes de panel
A. Spcificits des donnes de panel
B. La mthode SUR
C. Le modle linaire simple
II. Les tests dhomognit
A. Procdure squentielle de tests
B. Construction des tests
III. Spcifications et estimations des modles effets individuels
A. Le modle effets fixes individuels
B. Le modle effets alatoires
C. Effets fixes ou effets alatoires ? Le test dHausman

335
337
338
340

345
346
346
347
348
349
349
350
355
355
357
358

Liste des exercices

363

Tables statistiques

367

Bibliographie

375

Index

379

VIII  CONOMTRIE

9782100721511-Bourbo-avtpro.qxd

20/10/14

15:06

Page IX

Avant-propos
Cette neuvime dition est enrichie de nouveaux exercices et des dveloppements les plus rcents de lconomtrie. Ce livre couvre tous les champs de
lconomtrie : rgression simple et multiple, violation des hypothses (htroscdasticit, autocorrlation des erreurs, variables explicatives alatoires),
modle dcalage, analyse des sries temporelles, tests de racine unitaire, quations multiples, VAR, cointgration, VECM, conomtrie des variables qualitatives et des donnes de panel
Sur lensemble de ces thmes, ce livre vous propose un cours, des exercices corrigs, et une prsentation des logiciels dconomtrie les plus rpandus.
Souhaitons quil corresponde votre attente.
En effet, nous avons voulu, par une alternance systmatique de cours et
dexercices, rpondre un besoin pdagogique qui est de mettre rapidement en
pratique les connaissances thoriques et ainsi, dutiliser de manire oprationnelle les acquis du cours ; les exercices sont reprs grce un bandeau gris.
De surcrot, le recours des logiciels1, lors de la rsolution des exercices, permet une dcouverte de ces outils et donne une dimension pratique que recherchent ltudiant et le praticien.
Afin que le lecteur puisse lui-mme refaire les exercices, les donnes utilises (sous format Excel, ASCII, RATS et Eviews) ainsi que les programmes de
traitement Batch de Eviews ou de RATS sont disponibles gratuitement par
tlchargement sur le serveur web :
http://regisbourbonnais.dauphine.fr
Pour chaque exercice faisant appel un fichier de donnes, le nom du fichier
est cit en tte de lexercice et repr par licne suivante :
Nous avons voulu faire de ce manuel un livre dapprentissage facilement
accessible ; cest pourquoi les dmonstrations les plus complexes font lobjet de
renvois une bibliographie plus spcialise. Cependant, il convient de prciser
que lconomtrie fait appel des notions dalgbre linaire et dinduction statistique quil est souhaitable de connatre.
1. Trois logiciels sont utiliss : EXCEL ( Microsoft), RATS ( Var Econometrics version 3 et
Estima version 4), Eviews ( Quantitative Micro Software). Nous recommandons aussi particulirement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel dconomtrie
gratuit, complet et trs facile dapprentissage.

Avant-propos  IX

9782100721511-Bourbo-avtpro.qxd

20/10/14

15:06

Page X

Dans le terme conomtrie figure la racine du mot conomie car son


utilisation est surtout destine des fins de traitement de donnes conomiques ;
cependant, dautres domaines tels que la finance, la recherche agronomique, la
mdecine, etc., font maintenant le plus souvent appel ces techniques.
Ce livre sadresse en premier lieu aux tudiants (sciences conomiques, gestion, coles de commerce et dingnieurs, etc.) dont la formation requiert une
connaissance de lconomtrie. Gageons quil sera un support de cours indispensable et un alli prcieux pour prparer les sances de travaux dirigs.
Noublions pas cependant le praticien de lconomtrie (conomiste dentreprise, chercheur, etc.) qui, confront des problmes destimation statistique,
trouvera dans ce livre les rponses pratiques aux diffrentes questions quil peut
se poser.
Enfin, jexprime toute ma gratitude toutes les personnes collgues et tudiants qui ont eu la gentillesse de me faire des commentaires et dont les
conseils et suggestions contribuent la qualit pdagogique de ce livre. Je reste,
bien entendu, le seul responsable des erreurs qui subsisteraient1.

1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Rgis
Bourbonnais, universit de Paris-Dauphine, place du Marchal de Lattre de Tassigny, 75775
Paris Cedex 16, E-mail : regis.bourbonnais@dauphine.fr

X  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 1

1. Quest-ce que

lconomtrie ?

e premier chapitre est consacr la prsentation de lconomtrie


et sa liaison avec la thorie conomique. Nous abordons tout
dabord la notion de modle ainsi que les diffrentes tapes de la
modlisation. Lapport de lconomtrie en tant quoutil de validation
est tudi en II. Enfin, la thorie de la corrlation fondement de lconomtrie fait lobjet de la section III.

I. La notion de modle
A. Dfinition
Il est dlicat de fournir une dfinition unique de la notion de modle1. Dans le
cadre de lconomtrie, nous pouvons considrer quun modle consiste en une
prsentation formalise dun phnomne sous forme dquations dont les
variables sont des grandeurs conomiques. Lobjectif du modle est de reprsenter les traits les plus marquants dune ralit quil cherche styliser. Le
modle est donc loutil que le modlisateur utilise lorsquil cherche comprendre et expliquer des phnomnes. Pour ce faire, il met des hypothses et
explicite des relations.

1. La notion de modle est relative au point de vue auquel nous nous plaons : la physique,
lpistmologie...

Quest-ce que lconomtrie ?  1

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 2

Pourquoi des modles ?

Nombreux sont ceux sociologues, conomistes ou physiciens qui


fondent leurs analyses ou leurs jugements sur des raisonnements
construits et labors. Ces constructions refrent implicitement des
modles ; alors pourquoi ne pas expliciter clairement les hypothses et
les relations au sein dun modle ?

Le modle est donc une prsentation schmatique et partielle dune ralit


naturellement plus complexe. Toute la difficult de la modlisation consiste ne
retenir que la ou les reprsentations intressantes pour le problme que le modlisateur cherche expliciter. Ce choix dpend de la nature du problme, du type
de dcision ou de ltude effectuer. La mme ralit peut ainsi tre formalise
de diverses manires en fonction des objectifs.

B. La construction des modles en conomtrie


Dans les sciences sociales, et particulirement en conomie, les phnomnes
tudis concernent le plus souvent des comportements afin de mieux comprendre la nature et le fonctionnement des systmes conomiques. Lobjectif du
modlisateur est, dans le cadre de lconomtrie et au travers dune mesure statistique, de permettre aux agents conomiques (mnages, entreprises, tat...)
dintervenir de manire plus efficace. La construction dun modle comporte un
certain nombre dtapes qui sont toutes importantes. En effet, en cas de faiblesse dun des maillons , le modle peut se trouver invalid pour cause dhypothses manquantes, de donnes non reprsentatives ou observes avec des
erreurs, etc. Examinons les diffrentes tapes suivre lors de la construction
dun modle, ceci partir de lexemple du modle keynsien simplifi.

1) Rfrence une thorie


Une thorie sexprime au travers dhypothses auxquelles le modle fait rfrence. Dans la thorie keynsienne, quatre propositions sont fondamentales :
1. la consommation et le revenu sont lis ;
2. le niveau dinvestissement priv et le taux dintrt sont galement lis ;
3. il existe un investissement autonome public ;
4. enfin, le produit national est gal la consommation plus linvestissement
priv et public.

2  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 3

2) Formalisation des relations et choix de la forme des fonctions


partir des propositions prcdentes, nous pouvons construire des relations :
1. la consommation est fonction du revenu : C = f (Y ) avec f  > 0 ;
2. linvestissement priv dpend du taux dintrt : I = g(r) avec g  < 0 ;
3. il existe un investissement autonome public : I ;
4. enfin, le produit national (ou le revenu national) est gal la consommation plus linvestissement : Y C + I + I .
ce stade, nous navons postul aucune forme particulire en ce qui concerne les fonctions f et g . Ainsi, bien que des considrations dordre thorique nous
renseignent sur le signe des drives, il existe une multitude de fonctions de
formes trs diffrentes et ayant des signes de drives identiques, par exemple
C = a0 + a1 Y et C = a0 Y a1 . Cependant ces deux relations ne refltent pas le
mme comportement ; une augmentation du revenu provoque un accroissement
proportionnel pour la premire relation, alors que, dans la seconde, leffet sestompe avec laugmentation du revenu (si 0 < a1 < 1 ). Nous appelons forme
fonctionnelle ce choix (arbitraire ou fond) de spcification prcise du modle. Dans notre exemple, le modle explicit scrit :
C = a0 + a1 Y

I = b0 + b1 r

avec a0 > 0 et 0 < a1 < 1


a1 = propension marginale consommer
et a0 = consommation incompressible ;
avec b0 > 0 et b1 < 0 ;

Y C+I+I

Les deux premires quations refltent des relations de comportements alors


que la troisime est une identit (aucun paramtre nest estimer).

3) Slection et mesure des variables


Le modle tant spcifi, il convient de collecter les variables reprsentatives
des phnomnes conomiques. Ce choix nest pas neutre et peut conduire des
rsultats diffrents, les questions quil convient de se poser sont par exemple :
Faut-il raisonner en euros constants ou en euros courants ?
Les donnes sont-elles brutes ou CVS 1 ?
Quel taux dintrt faut-il retenir (taux au jour le jour, taux directeur de la
Banque Centrale Europenne,...) ? etc.

1. Corriges des Variations Saisonnires.

Quest-ce que lconomtrie ?  3

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 4

Nous distinguons plusieurs types de donnes selon que le modle est spcifi en :
srie temporelle : cest le cas le plus frquent en conomtrie, il sagit de
variables observes intervalles de temps rguliers (la consommation
annuelle, totale France, exprime en euros courants sur 20 ans) ;
coupe instantane : les donnes sont observes au mme instant et concernent les valeurs prises par la variable pour un groupe dindividus1 spcifiques (consommation observe des agriculteurs pour une anne donne) ;
panel : la variable reprsente les valeurs prises par un chantillon dindividus intervalles rguliers (la consommation dun chantillon de mnages
de la rgion parisienne sur 20 ans) ;
cohorte : trs proches des donnes de panel, les donnes de cohorte se distinguent de la prcdente par la constance de lchantillon, les individus
sonds sont les mmes dune priode sur lautre.

4) Dcalages temporels
Dans le cadre de modle spcifi en sries temporelles, les relations entre les
variables ne sont pas toujours synchrones mais peuvent tre dcales dans le
temps. Nous pouvons concevoir que la consommation de lanne t est explique
par le revenu de lanne t 1 et non celui de lanne t . Pour lever cette ambigut, il est dusage dcrire le modle en le spcifiant laide dun indice
de temps : Ct = a0 + a1 Yt1 . La variable Yt1 est appele variable endogne
retarde .


On appelle variable exogne une variable dont les valeurs sont prdtermines, et variable endogne une variable dont les valeurs
dpendent des variables exognes.

5) Validation du modle
La dernire tape est celle de la validation2 du modle :
Les relations spcifies sont-elles valides ?
Peut-on estimer avec suffisamment de prcision les coefficients ?
Le modle est-il vrifi sur la totalit de la priode ?
Les coefficients sont-ils stables ? Etc.
toutes ces questions, les techniques conomtriques sefforcent dapporter
des rponses.
1. Le terme dindividu est employ au sens statistique, cest--dire comme un lment dune population : une personne, une parcelle de terre...
2. Validation, cest--dire en conformit avec les donnes disponibles.

4  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 5

II. Le rle de lconomtrie


A. Lconomtrie comme validation de la thorie
Lconomtrie est un outil la disposition de lconomiste qui lui permet dinfirmer ou de confirmer les thories quil construit. Le thoricien postule des
relations ; lapplication de mthodes conomtriques fournit des estimations sur
la valeur des coefficients ainsi que la prcision attendue.
Une question se pose alors : pourquoi estimer ces relations, et les tester
statistiquement ? Plusieurs raisons incitent cette dmarche : tout dabord cela
force lindividu tablir clairement et estimer les interrelations sous-jacentes.
Ensuite, la confiance aveugle dans lintuition peut mener lignorance de
liaisons importantes ou leur mauvaise utilisation. De plus, des relations marginales mais nanmoins explicatives, qui ne sont quun lment dun modle
global, doivent tre testes et valides afin de les mettre leur vritable place.
Enfin, il est ncessaire de fournir, en mme temps que lestimation des relations,
une mesure de la confiance que lconomiste peut avoir en celles-ci, cest--dire
la prcision que lon peut en attendre. L encore, lutilisation de mthodes purement qualitatives exclut toute mesure quantitative de la fiabilit dune relation.

B. Lconomtrie comme outil dinvestigation


Lconomtrie nest pas seulement un systme de validation, mais galement un
outil danalyse. Nous pouvons citer quelques domaines o lconomtrie apporte une aide la modlisation, la rflexion thorique ou laction conomique
par :
la mise en vidence de relations entre des variables conomiques qui
ntaient pas a priori videntes ou pressenties ;
linduction statistique ou linfrence statistique consiste infrer, partir
des caractristiques dun chantillon, les caractristiques dune population.
Elle permet de dterminer des intervalles de confiance pour des paramtres
du modle ou de tester si un paramtre est significativement1 infrieur,
suprieur ou simplement diffrent dune valeur fixe ;

1. Au sens statistique, cest--dire avec un seuil (risque derreur ne pas dpasser, souvent 5 %).

Quest-ce que lconomtrie ?  5

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 6

la simulation qui mesure limpact de la modification de la valeur dune


variable sur une autre (Ct = a1 Yt ) ;
la prvision1, par lutilisation de modles conomtriques, qui est utilise
par les pouvoirs publics ou lentreprise afin danticiper et ventuellement
de ragir lenvironnement conomique.
Dans cet ouvrage, nous nous efforcerons de montrer, laide dexemples, les
diffrentes facettes de lutilisation des techniques conomtriques dans des
contextes et pour des objectifs diffrents.

III. La thorie de la corrlation


A. Prsentation gnrale
Lorsque deux phnomnes ont une volution commune, nous disons quils sont
corrls . La corrlation simple mesure le degr de liaison existant entre ces
deux phnomnes reprsents par des variables. Si nous cherchons une relation
entre trois variables ou plus, nous ferons appel alors la notion de corrlation
multiple.
Nous pouvons distinguer la corrlation linaire, lorsque tous les points du
couple de valeurs (x,y) des deux variables semblent aligns sur une droite, de
la corrlation non linaire lorsque le couple de valeurs se trouve sur une mme
courbe dallure quelconque.
Deux variables peuvent tre :
en corrlation positive ; on constate alors une augmentation (ou diminution, ou constance) simultane des valeurs des deux variables ;
en corrlation ngative, lorsque les valeurs de lune augmentent, les valeurs
de lautre diminuent ;
non corrles, il ny a aucune relation entre les variations des valeurs de
lune des variables et les valeurs de lautre.
Le tableau 1, en croisant les critres de linarit et de corrlation, renvoie
une reprsentation graphique.

1. Pour dcouvrir lutilisation de lconomtrie des fins de prvision de ventes, voir Bourbonnais
R. et Usunier J. C. (2013).

6  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 7

Tableau 1 Linarit et corrlation

Corrlation
positive

Corrlation
ngative

Absence de
corrlation

Relation linaire

Graphe 1

Graphe 2

Graphe 5

Relation non linaire

Graphe 3

Graphe 4

Graphe 5

x
Graphe 2

Graphe 1
y

Graphe 3

Graphe 4
y

x
Graphe 5

Quest-ce que lconomtrie ?  7

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 8

B. Mesure et limite du coefficient de corrlation


1) Le coefficient de corrlation linaire
La reprsentation graphique ne donne quune impression de la corrlation
entre deux variables sans donner une ide prcise de lintensit de la liaison,
cest pourquoi nous calculons une statistique appele coefficient de corrlation
linaire simple, not r x,y . Il est gal :
n

(xi x)(yi y)

r x,y =

Cov (x,y)
i=1
=

n
n
x y


2
(xi x )
(yi y )2
i=1

[1]

i=1

avec :
Cov (x,y) = covariance entre x et y ;
x et y = cart type de x et cart type de y ;
n
= nombre dobservations.

En dveloppant la formule [1], il vient :

n
r x,y = 
n

n


xi yi

i=1

n

i=1

n


xi

n


i=1

yi

i=1


n
n
n

2

2

x
xi
n
yi2
yi

[2]

2
i

i=1

i=1

i=1

On peut dmontrer que, par construction ce coefficient reste compris entre

1 et 1 :

proche de 1, les variables sont corrles positivement ;


proche de 1 , les variables sont corrles ngativement ;
proche de 0, les variables ne sont pas corrles.
Dans la pratique, ce coefficient est rarement trs proche de lune de ces trois
bornes et il est donc difficile de proposer une interprtation fiable la simple
lecture de ce coefficient. Ceci est surtout vrai en conomie o les variables sont
toutes plus au moins lies entre elles. De plus, il nest calcul qu partir dun
chantillon dobservations et non pas sur lensemble des valeurs. On appelle x,y

8  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 9

ce coefficient empirique qui est une estimation du coefficient vrai r x,y . La thorie des tests statistiques nous permet de lever cette indtermination.
Soit tester lhypothse H0 : r x,y = 0 , contre lhypothse H1 : r x,y = 0 .
x,y
Sous lhypothse H0, nous pouvons dmontrer que  
 suit une loi
2
1 x,y

n2

de Student n 2 degrs de libert1. Nous calculons alors une statistique, appel le t de Student empirique :
|x,y |
t =  

2
1 x,y

[3]

n2
/2
valeur lue dans une table de Student2 au seuil = 0,05 (5 %)
Si t > tn2
n 2 degrs de libert3, nous rejetons lhypothse H0, le coefficient de corrlation est donc significativement diffrent de 0 ; dans le cas contraire, lhypothse dun coefficient de corrlation nul est accepte. La loi de Student tant symtrique, nous calculons la valeur absolue du t empirique et nous procdons au test
par comparaison avec la valeur lue directement dans la table.

1. La notion de degrs de libert est explicite au chapitre 2.


2. Les lois de probabilit sont en fin douvrage.
3. Si le nombre dobservations n est suprieur 30, on peut approximer la loi de Student par une
loi normale, soit t /2 1,96 .

Quest-ce que lconomtrie ?  9

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 10

Exercice n 1

fichier C1EX1

Calcul dun coefficient de corrlation


Un agronome sintresse la liaison pouvant exister entre le rendement de mas x
(en quintal) dune parcelle de terre et la quantit dengrais y (en kilo). Il relve 10 couples de donnes consigns dans le tableau 2
Tableau 2 Rendement de mas et quantit dengrais
Rendement x

16

18

23

24

28

29

26

31

32 34

Engrais y

20

24

28

22

32

28

32

36

41 41

1) Tracer le nuage de points et le commenter.


2) Calculer le coefficient de corrlation simple et tester sa signification par rapport 0
pour un seuil = 0,05 .
Solution

Quantit dengrais

1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approximativement aligns : les deux variables semblent corrles positivement.

Rendement

Graphique 6 Nuage du couple de valeurs :


rendement-quantit dengrais

10  CONOMTRIE

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 11

2) Afin dappliquer la formule [2], nous dressons le tableau de calcul 3.


Tableau 3 Calcul dun coefficient de corrlation

Somme

x2

y2

xy

20
24
28
22
32
28
32
36
41
41

256
324
529
576
784
841
676
961
1 024
1 156

400
576
784
484
1 024
784
1 024
1 296
1 681
1 681

320
432
644
528
896
812
832
1 116
1 312
1 394

304

7 127

9 734

8 286

16
18
23
24
28
29
26
31
32
34
261

(10)(8 286) (261)(304)


3 516

x,y = 
=
2
2
(56,11)(70,17)
(10)(7 127) 261 (10)(9 734) 304
2
soit x,y = 0,89 et x,y
= 0,79

Le t de Student empirique (daprs [3]) est gal :


t = 

|x,y |
(1

2
x,y
)

0,89
= 5,49 > t80,025 = 2,306
0,1 620

n2
le coefficient de corrlation entre x et y est significativement diffrent de 0.

2) Limites de la notion de corrlation


a) La relation teste est linaire
Lapplication de la formule [1] ou [2] ne permet de dterminer que des corrlations linaires entre variables. Un coefficient de corrlation nul indique que la
covariance entre la variable x et la variable y est gale 0. Cest ainsi que deux
variables en totale dpendance peuvent avoir un coefficient de corrlation nul,
comme lillustre lexemple suivant : lquation dun cercle nous est donne
par (x x1 )2 + (y y1 )2 = R 2 , les variables x et y sont bien lies entre elles
fonctionnellement (graphique 7) et pourtant leur covariance est nulle et donc
leur coefficient de corrlation gal 0.
Pour pallier cette limite, il convient ventuellement de transformer les
variables, pralablement au calcul du coefficient de corrlation, afin de linariser

Quest-ce que lconomtrie ?  11

9782100721511-Bourbo-C01.qxd

20/10/14

15:07

Page 12

leur relation, par exemple au moyen dune transformation de type logarithmique.

Graphique 7 Relation fonctionnelle nest pas corrlation linaire

b) Corrlation nest pas causalit


Le fait davoir un coefficient de corrlation lev entre deux variables ne signifie pas quil existe un autre lien que statistique. En dautres termes, une covariance significativement diffrente de 0 nimplique pas une liaison dordre conomique, physique ou autre. Nous appelons corrlation fortuite ce type de corrlation que rien ne peut expliquer.
Lexemple le plus fameux concerne la forte corrlation existante entre le
nombre de taches solaires observes et le taux de criminalit aux tats-Unis.
Cela ne signifie pas quil existe une relation entre les deux variables, mais
quune troisime variable, lvolution de long terme (la tendance) ici, explique
conjointement les deux phnomnes. La thorie de la cointgration traite de ce
problme (cf. chapitre 11).

12  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 13

2. Le modle

de rgression simple

ous commenons notre tude par le modle le plus simple : une


variable endogne est explique par une variable exogne.
Aprs avoir tudi les consquences probabilistes de lerreur
dobservation, nous prsentons en I. les formules de base permettant
destimer les paramtres du modle. Les hypothses stochastiques et
leurs consquences sont tudies au paragraphe II.
En III. et IV., la qualit de lestimation dun modle est examine laide
des premiers tests statistiques (Student, Fisher).
Enfin, en V., le modle de rgression simple est tudi en tant quoutil de
prvision avec le degr de confiance que nous pouvons en attendre.

I. Prsentation du modle
A. Exemple introductif
Soit la fonction de consommation keynsienne :
C = a0 + a1 Y

o :
C
Y
a1
a0

=
=
=
=

consommation,
revenu,
propension marginale consommer,
consommation autonome ou incompressible.

Le modle de rgression simple  13

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 14

1) Vocabulaire
La variable consommation est appele variable expliquer ou variable
endogne .
La variable revenu est appele variable explicative ou variable exogne
(cest le revenu qui explique la consommation).
a1 et a0 sont les paramtres du modle ou encore les coefficients de rgression.

2) Spcification
Nous pouvons distinguer deux types de spcifications :
Les modles en srie temporelle, les variables reprsentent des phnomnes
observs intervalles de temps rguliers, par exemple la consommation et le
revenu annuel sur 20 ans pour un pays donn. Le modle scrit alors :
Ct = a0 + a1 Yt

t = 1,. . . , 20

o :
Ct = consommation au temps t ,
Yt = revenu au temps t .

Les modles en coupe instantane, les variables reprsentent des phnomnes


observs au mme instant mais concernant plusieurs individus, par exemple la
consommation et le revenu observs sur un chantillon de 20 pays. Le modle
scrit alors :
Ci = a0 + a1 Yi

i = 1,. . . , 20

o :
Ci = consommation du pays i pour une anne donne,
Yi = revenu du pays i pour une anne donne.

B. Rle du terme alatoire


Le modle tel quil vient dtre spcifi nest quune caricature de la ralit.
En effet ne retenir que le revenu pour expliquer la consommation est lvidence mme insuffisant ; il existe une multitude dautres facteurs susceptibles
dexpliquer la consommation. Cest pourquoi nous ajoutons un terme (t )
qui synthtise lensemble de ces informations non explicites dans le modle : Ct = a0 + a1 Yt + t si le modle est spcifi en srie temporelle
(Ci = a0 + a1 Yi + i si le modle est spcifi en coupe instantane), o t reprsente lerreur de spcification du modle, cest--dire lensemble des phnomnes explicatifs de la consommation non lis au revenu. Le terme t mesure la

14  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 15

diffrence entre les valeurs rellement observes de Ct et les valeurs qui auraient
t observes si la relation spcifie avait t rigoureusement exacte. Le terme
t regroupe donc trois erreurs :
une erreur de spcification, cest--dire le fait que la seule variable explicative nest pas suffisante pour rendre compte de la totalit du phnomne expliqu ;
une erreur de mesure, les donnes ne reprsentent pas exactement le phnomne ;
une erreur de fluctuation dchantillonnage, dun chantillon lautre les
observations, et donc les estimations, sont lgrement diffrentes.

Exercice n 1

fichier C2EX1

Gnration dune consommation alatoire


Le tableau 1 prsente le revenu moyen par habitant sur 10 ans exprim en dollars
pour un pays.
Tableau 1 volution du revenu moyen par habitant en dollars
Anne

Revenu

1
2
3
4
5
6
7
8
9
10

8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000

Sachant que la propension marginale consommer est de 0,8 et que la consommation incompressible est 1 000, on demande :
1) de calculer la consommation thorique sur les 10 ans ;
2) considrant que notre erreur dobservation suit une loi normale de moyenne 0 et de
variance 20 000, de gnrer cette variable alatoire et de calculer une consommation
observe tenant compte de cette erreur.
Solution
Les calculs des questions 1) et 2) sont prsents dans le tableau 2.
La consommation thorique (colonne 3) est calcule par application directe de la
formule : Ct = 1 000 + 0,8 Yt .

Le modle de rgression simple  15

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 16

La gnration de la variable alatoire t (t N (0 ; 20 000)) ne pose pas de difficult particulire ; bien entendu il en existe une infinit, un exemple en est prsent en
colonne 4.
La consommation observe (colonne 5) est donc gale Ct = 1 000 + 0,8 Yt + t ,
soit la somme de la colonne 3 et de la colonne 4.
Tableau 2 Calcul de la consommation observe
(1)
Anne
1
2
3
4
5
6
7
8
9
10

(2)
Revenu
disponible
8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000

(3)
Consommation
thorique
7 400
8 200
8 600
8 600
8 840
9 800
10 600
11 400
13 000
13 800
Moyenne :
cart type :

(4)
Ala
t
10,01
30,35
231,71
52,84
51,92
183,79
6,55
213,89
241,91
69,62
38,42
137,24

(5)
Consommation
observe
7 389,99
8 169,65
8 831,71
8 652,84
8 788,08
9 616,21
10 593,45
11 186,11
12 758,09
13 869,62

Nous observons que la moyenne de t , = 38,42 et la variance de t , Var(t ) =


18 834,81 sont lgrement diffrentes des valeurs thoriques. Cela est la consquence
du tirage particulier dun chantillon de taille assez faible (dix observations).

C. Consquences du terme alatoire


Dans lexercice prcdent, les valeurs vraies a0 et a1 sont parfaitement connues,
cependant, dans la ralit, nous ne connaissons pas ces valeurs mais seulement
les deux sries dobservations Ct et Rt . Les estimateurs1 de a0 et a1 , nots respectivement 
a0 et 
a1 , sont des variables alatoires, qui suivent les mmes lois de
probabilit, celle de t , puisquils sont fonctions de la variable alatoire t . Les
caractristiques de moyenne et dcart type de ces coefficients permettent de
construire des tests de validit du modle estim.

a de a et estimation de 
a qui est la valeur particulire de
1. Il ne faut pas confondre : estimateur 
lestimateur pour un chantillon.

16  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 17

Frquence

Si laide dun programme informatique (


C2EX1.PRG) nous construisons 150 chantillons de valeurs diffrentes pour la variable alatoire
t N (0 ; 20 000), nous allons alors trouver 150 estimations de a1 lgrement
diffrentes entre elles dont la distribution aura la forme de lhistogramme du
graphique 1.
Cette distribution a pour moyenne 0,801 et cart type 0,032, nous pouvons
observer quelle est peu prs symtrique par rapport la moyenne et quelle a
la forme dune courbe en cloche : tous ces lments suggrent bien une distribution normale de : a1 N (0,801 ; 0,032) . Cela est la consquence directe
de la normalit des erreurs.

Coefficient 1

Graphique 1 Histogramme de la distribution de 150 


a1

II. Estimation des paramtres


A. Modle et hypothses
Soit le modle suivant :
yt = a0 + a1 xt + t

pour

t = 1,. . . ,n

Le modle de rgression simple  17

9782100721511-Bourbo-C02.qxd

avec :
yt
xt
a0 ,a1
t
n

20/10/14

15:09

Page 18

=
=
=
=

variable expliquer au temps t ;


variable explicative au temps t ;
paramtres du modle ;
erreur de spcification (diffrence entre le modle vrai et le modle
spcifi), cette erreur est inconnue et restera inconnue ;
= nombre dobservations.

Hypothses
H1 : le modle est linaire en xt (ou en nimporte quelle transformation de xt ).
H2 : les valeurs xt sont observes sans erreur (xt non alatoire).
H3 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle : en moyenne le
modle est bien spcifi et donc lerreur moyenne est nulle.
H4 : E(t2 ) = 2 , la variance de lerreur est constante1 : le risque de lamplitude de lerreur est le mme quelle que soit la priode.
H5 : E(t t  ) = 0 si t = t  , les erreurs sont non corrles (ou encore indpendantes) : une erreur linstant t na pas dinfluence sur les erreurs suivantes.
H6 : Cov(xt ,t ) = 0 , lerreur est indpendante de la variable explicative.

B. Formulation des estimateurs


En traant un graphique (2) des couples de donnes liant le revenu et la consommation observe, nous obtenons un nuage de points que nous pouvons ajuster
laide dune droite.
Lestimateur des coefficients a0 et a1 est obtenu en minimisant la distance au
carr entre chaque observation et la droite, do le nom destimateur des
moindres carrs ordinaires (MCO).
La rsolution analytique est la suivante :
Min

t=n

t=1

t2 = Min

t=n

(yt a0 a1 xt )2 = Min S
t=1

1. Cette hypothse sappelle lhypothse dhomoscdasticit ; dans le cas o cette hypothse nest
pas vrifie, on parle alors de modle htroscdastique.

18  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 19

Graphique 2 Ajustement dun nuage de points par une droite

En oprant par drivation par rapport a0 et a1 afin de trouver le minimum1


de cette fonction, on obtient les rsultats suivants :


S
S
= 2
(yt a 0 a 1 x t ) = 0 et
= 2
x t (yt a 0 a 1 x t ) = 0
a0
a1
t
t

Sommant par rapport t , il vient :



t

xt yt 
a0


xt 
a1

xt2 = 0


t

yt n
a0 
a1

xt = 0

quon appelle les quations normales et qui impliquent que :


t=n

(xt x)(yt y)


a1 =

t=1


(xt x)2
t=n

t=1


a0 = y 
a1 x

t=n


xt yt nx y

t=1
t=n

[1]

xt2 nx 2

t=1

[2]

1. Nous considrons les conditions du deuxime ordre comme vrifies car la fonction est convexe.

Le modle de rgression simple  19

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 20

Nous pouvons faire deux remarques :


lcriture du modle nest pas neutre ;
La spcification : yt = a0 + a1 xt + t nest pas quivalente :
xt = a0 + a1 yt + t . Dans le premier modle, xt est la cause de yt , alors que dans
la deuxime spcification, cest yt qui est la cause de xt .
Nous remarquons que : 
a1 = 2
a1 
( = coefficient de corrlation entre x et y ) ;
le coefficient a1 reprsente la pente de la droite ou encore une propension
marginale.
a1
xt . Limpact dune variation de xt se mesure direcNous avons :
yt = 
tement sur yt au travers du coefficient 
a1 .
Cas particulier : modle sans terme constant
La thorie conomique postule parfois des relations dans lesquelles a0 = 0 :
cest le cas par exemple pour une fonction de production de produit industriel
o le facteur de production (unique) nul entrane une production nulle.
Lestimation de a1 est alors donne par la formule suivante :
t=n



a1 =

xt yt

t=1
t=n

[3]
x

2
t

t=1

Nous remarquons quil sagit de lapplication de la formule [1] dans laquelle x et y sont nulles. Dans le cas de variables centres1, cest donc cette formule [3] quil convient demployer car le terme constant est nul.

Exercice n 2

fichier C2EX2

Estimation des coefficients de rgression


partir des donnes du tableau 2 de lexercice 1, on demande de calculer les estia0 et 
a1 .
mations de 
Solution
Le tableau 3 prsente les calculs effectuer.
1. Les donnes sont centres lorsque les observations sont centres sur leur moyenne : (xt x) ,
la somme des donnes centres est donc par construction nulle.

20  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 21

Tableau 3 Calcul dun coefficient de rgression


(1)
t

(2)
yt

(3)
xt

1
2
3
4
5
6
7
8
9
10

7 389,99
8 169,65
8 831,71
8 652,84
8 788,08
9 616,21
10 593,45
11 186,11
12 758,09
13 869,62

8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000

(4)
yt y

2 595,59
1 815,93
1 153,87
1 332,74
1 197,50
369,37
607,88
1 200,54
2 772,52
3 884,05

Somme 99 855,75 112 800


Moyenne 9 985,57 11 280

t=1
t=n

(xt x)2

(6)
(5)* (5)

(7)
(4)* (5)

3 280
2 280
1 780
1 780
1 480
280
720
1 720
3 720
4 720

10 758 400
5 198 400
3 168 400
3 168 400
2 190 400
78 400
518 400
2 958 400
13 838 400
22 278 400

8 513 518
4 140 300
2 053 879
2 372 268
1 772 292
103 422
437 670
2 064 920
10 313 755
18 332 692

0
0

64 156 000
6 415 600

50 104 729
5 010 472

0
0

t=n

(xt x)(yt y)


a1 =

(5)
xt x

50 104 729
= 0,78
64 156 000

t=1


a0 = y 
a1 x = 9 985,57 0,78 11 280 = 1 176,08
Ces estimations sont comparer aux valeurs vraies (respectivement 0,8 et 1 000),
les diffrences importantes en ce qui concerne surtout le terme constant sont imputables
lala dobservation qui perturbe lestimation des coefficients.

C. Les diffrentes critures du modle :


erreur et rsidu

Le modle de rgression simple peut scrire sous deux formes selon quil sagit
du modle thorique spcifi par lconomiste ou du modle estim partir dun
chantillon.
Modle thorique spcifi par lconomiste avec t lerreur inconnue :
yt = a0 + a1 xt + t

Modle estim partir dun chantillon dobservations :


yt = 
a0 + 
a1 xt + et = 
yt + et

et = rsidu

(Bien noter les chapeaux sur les a .)

Le modle de rgression simple  21

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 22

Le rsidu observ et est donc la diffrence entre les valeurs observes de la


variable expliquer et les valeurs ajustes laide des estimations des coefficients du modle ;
ou encore :

yt = 
a0 + 
a1 x t

D. Proprits des estimateurs


yt = a0 + a1 xt + t
y = a0 + a1 x +

[4]
[5]

[4] [5] = yt y = a1 (xt x) + (t )


a1 , yt y par son expression,
En remplaant dans la formule [1] de lestimateur 
on obtient :
t=n
t=n


(x t x)(t )
(x t x)t


a1 = a1 +

t=1
t=n


= a1 +
(x t x)

t=1

t=1
t=n


[6]
(x t x)

t=1
n


car

n


(x t x) =

t=1

n


x t n x = nx nx = 0 avec x =

t=1

xt

t=1

Les estimateurs sont-ils sans biais ?


a ) = a.)
(Rappel : un estimateur est sans biais si E(
t=n



a1 = a1 +

(x t x)t

t=1
t=n

[7]
(x t x)

t=1
t=n

(xt x)E(t )

do :

E(
a1 ) = E(a1 ) +

t=1
t=n


(xt x)2
t=1

a1 ) = a1 car E(t ) = 0
Soit E(
a0 ) = a0 .
De mme on dmontre que E(

22  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

y =
a0 + 
a1 x
y = a0 + a1 x +

Page 23


a1 a1 )x
a0 = a0 + (

E(
a0 ) = a0 + E() E((
a1 a1 )x) = a0
a1 a1 ) = 0 et E() = 0
car E(

car E() est par hypothse nulle, E



n
t = 0
t=1

Les estimateurs sont sans biais.

Les estimateurs sont-ils convergents ?


Puisque les estimateurs sont sans biais, il suffit pour quils soient convergents
que :
Lim V (
a1 ) 0 lorsque n o V (
a1 ) est la variance de 
a1 .
2
t=n

(x t x)t

t=1
2
2
(daprs [7])

V (
a1 ) = E{
a1 E(
a1 )} = E(
a1 a1 ) = E t=n

(x t x)2
V (
a1 ) = E




2 
wt t

=E




avec

wt =

t=1

w +2
2
t

2
t


wt wt  t t 

t<t 

(xt x)

(xt x)2
t=n

t=1

V (
a1 ) =

wt2 E(t2 ) + 2

wt wt  E(t t  )

t<t 

Or, daprs les hypothses :


H4 E(t2 ) = 2 ;
H5 E(t t  ) = 0 si t = t  .
V (
a1 ) =


t

2
wt2 2 = 
(xt x)2

[8]

Lorsque n alors


(xt x)2 tend galement vers , do V (
a1 ) tend
t

vers 0 puisque est constant.


a1 que cet estimaNous pouvons observer sur lexpression de la variance de 

2
(xt x) est lev, cest--dire lorsque :
teur est dautant plus prcis que
2

Le modle de rgression simple  23

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 24

le nombre dobservations est important ;


et/ou les valeurs de la variable explicative sont trs disperses autour de la
moyenne.
a0 conduit aux rsultats suivant :
Une dmonstration analogue pour 

x
1

V (
a0 ) = 2 + 

2
n
(xt x)

[9]

Lim V (
a0 ) 0 lorsque n .

Nous remarquons que :


V (
a0 ) =


2
+ x 2 V (
a1 )
n

a1 ) = x V (
a1 )
Cov(
a0 ,

Les estimateurs sont convergents.

III. Consquences des hypothses :


construction des tests

A. Hypothse de normalit des erreurs


Nous allons maintenant introduire de nouveau lhypothse qui est celle de la
normalit des erreurs (cf. exercice 1). Cette hypothse nest pas indispensable
afin dobtenir des estimateurs convergents mais elle va nous permettre de
construire des tests statistiques1 concernant la validit du modle estim.
Soit t N (0, 2 )
Le graphique 3 illustre cette hypothse sur la distribution des valeurs projetes sur la droite des moindres carrs.

Graphique 3 Les erreurs suivent une loi normale


1. En effet, cette hypothse permet de dfinir la loi de probabilit des estimateurs.

24  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 25

B. Consquences de lhypothse de normalit des erreurs


En prliminaire, cherchons un estimateur de la variance de lerreur.
Le rsidu est donn par :
et = yt yt = yt a 1 xt a 0

Sans rien changer lexpression prcdente, nous pouvons crire :


et = yt a 1 xt a 0 a 1 x + a 1 x

Ou encore : et = yt a 1 x a 0 a 1 xt + a 1 x
Or y = a 1 x + a 0
Do : et = yt y a 1 (xt x)
En remplaant yt et y par leurs expressions [4] et [5], il vient :
et = (a1 
a1 )(xt x) + (t )

Nous obtenons en levant ce terme au carr et effectuant la somme sur les n


observations :


et2 = (a1 
a1 )2




(xt x)2 +
(t )2 + 2(a1 
a1 )
(xt x)(t )

Or daprs lexpression [6], nous avons :



(xt x)(t ) = (a1 
a1 )
(xt x)2
t

que nous remplaons dans lexpression prcdente et aprs simplification :




et2 =



(t )2 (a1 
a1 )2
(xt x)2

En prenant lesprance mathmatique de cette dernire expression :


E

 




et2 = E
(t )2 E (a1 
a1 )2
(xt x)2
t

Examinons les deux membres de cette quation.







 
2
2
2
2
(t ) = E
(t 2t + ) = E
t 2
t +
2
a) E
t
t
t
t



t
2
2
2
2
2
=E
t 2n + n = E
t 2n + n
t
t



 
=E
t2 n2 = E
t2
t
t


=E


t

 2
t 

2
t


t

1   2
E( ) E
t
n
t

2
t

Le modle de rgression simple  25

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 26

Nous savons que : E[t2 ] = 2



2
1 
2
E
(t ) = n2 E 1 + 2 + . . . + n
n
t

Or, daprs lhypothse dindpendance des erreurs, les doubles produits


sont donc tous nuls. Nous obtenons alors :


1
2
E
(t ) = n2 n2 = n2 2
n
t

a1 )2
b) E (a1 


(xt x)2 = 2
t



2
a1 )2 = 
En effet E (a1 
(xt x)2

Do :


E

et2 = (n 1)2 2 = (n 2)2

2 est donc gal :


Lestimateur de la variance de lerreur (2 ) not 

2 =

1  2
e
n2 t t

[10]

Ce qui nous permet de dfinir, en remplaant la variance des erreurs par son
estimateur dans les expressions [8] et [9], les estimateurs empiriques1 de la
variance de chacun des coefficients.

2

a21 = 
(xt x)2
t

[11]

x
1


a20 = 
2 + 

2
n
(xt x)
t

Lhypothse de normalit des erreurs implique que :



a1 a1
a1

et


a0 a0
a0

suivent une loi normale centre rduite N(0, 1).


1. Bien noter les chapeaux qui diffrencient les estimateurs thoriques (inconnus) des estimations empiriques (calculables).

26  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

n


Page 27

et2

t=1

= (n 2)


2
2

suit une loi du 2 (chi-deux) n 2 degrs de libert1 (somme au carr de n 2


variables alatoires indpendantes normales centres rduites).
n

et2
2
2


t=1
Nous pouvons remarquer que (n 2) 2 = (n 2) a2 = 2 

a
a
(x t x)2
t

suit donc aussi une loi du 2 (chi-deux) n 2 degrs de libert.


Il en rsulte que :


a1 a1
a0 a0
et
(lcart type thorique est remplac par lcart type

a1

a0
empirique) suivent une loi de Student n 2 degrs de libert.


En effet


a1 a1
a1


a1 a1
=

a1

a2
1
(n 2) 21
a1 (n 2)

est le rapport dune loi normale

centre rduite la racine carre dun chi-deux divis par son degr de libert.
Il est donc possible maintenant de mettre en place des tests statistiques afin
dapporter des rponses des problmes tels que :
comparaison dun coefficient de rgression par rapport une valeur fixe ;
comparaison de deux coefficients de rgression provenant de deux chantillons diffrents ;
dtermination dun intervalle de confiance pour un coefficient.

C. Test bilatral, test unilatral et probabilit critique dun test


1) Test bilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse
H1 : a1 0.
Nous savons que
1.


a1 a1
suit une loi de Student n 2 degrs de libert.

a 1

La notion de degr de libert correspond au nombre de valeurs restant rellement disposition


aprs une procdure destimaton statistique. Si un chantillon comprend 10 observations et
quon dispose en plus de la moyenne de cet chantillon, on ne peut choisir librement les valeurs
que pour 9 de ces observations, la dixime se dduisant de la valeur de la moyenne. Dans le
cas prsent, le modle de rgression simple, le nombre de degrs de libert est donc de
n 2 car nous avons estim deux paramtres a0 et a1.

Le modle de rgression simple  27

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 28


a1 0
suit donc une loi de

a 1
Student n 2 degrs de libert. Le test dhypothses bilatral consiste donc com|
a1 |
la valeur du t de Student lue dans la
parer le ratio de Student empirique t =

a 1

Sous H0 (a1 = 0) le ratio appel ratio de Student

table n 2 degrs de libert1 et pour un seuil de probabilit gal 5 %, soit si n


0,05
= 1,96 (la table 2. de Student en fin du livre est tabule pour les tests
2 > 30, t
0,05
= 1,96 , nous rejetons lhypothse H0 (cf. graphique 4), le
bilatraux). Si t* > t
coefficient thorique et inconnu a1 est significativement diffrent de 0.

Graphique 4 Test bilatral 5 %

2) Test unilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse
H1 : a1 > 0 ou a1 < 0 selon que le coefficient estim soit positif ou ngatif.
Le test dhypothses unilatral consiste donc comparer le ratio de Student
|
a1 |
empirique t =
la valeur du t de Student lue dans la table n 2 degrs

a 1
de libert et pour un seuil de probabilit gal 5 %, soit si n 2 > 30,
0,05
0,05
t
= 1,65 . Si t* > t
= 1,65 nous rejetons lhypothse H0 (cf. graphique 5),
le coefficient thorique et inconnu a1 est significativement diffrent de 0.
Attention, la table de Student en fin du livre est tabule pour les tests bilatraux,
il faut donc lire 10 % = 2 0,05.
1. Si le degr de libert est suprieur 30, la loi de Student peut tre approxime par une loi normale.

28  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 29

Graphique 5 Test unilatral 5 % (H1 : a1 > 0)

Remarque : si nous rejetons lhypothse H0 pour un test bilatral, alors nous


rejetons forcment (pour un mme seuil de probabilit) lhypothse H0 pour un
test unilatral.

3) Probabilit critique dun test


La probabilit critique risque de rejeter tort lhypothse H0 ou encore
risque de premire espce est donne par la valeur de la probabilit c telle que :

a1
c
tn2
= t =
, par la lecture sur une table de Student n 2 degrs de libert.

a 1
La probabilit critique dun test unilatral peut directement se dduire de la
probabilit critique dun test bilatral par une simple division par 2
c
c
unilatr
al = bilatr al /2 (opration inverse de celle de la lecture de la table).
Exemple : Pour t = 2,53 et n 2 = 20, soit dterminer c tel que
t = 2,53 . Par lecture de la table de Student 20 degrs de libert, nous trouvons c = 2 % pour un test bilatral et donc 1 % pour un test unilatral.
c
20

Exercice n 3

fichier C2EX2

Test de coefficient et intervalle de confiance


En reprenant les rsultats de lexercice 2, on demande de rpondre aux questions
suivantes.
1) La propension marginale consommer est-elle significativement diffrente de 0 ?

Le modle de rgression simple  29

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 30

2) Quel est lintervalle de confiance au seuil (ou niveau) de 95 % pour la propension


marginale consommer ?
Solution
1) La propension marginale consommer est-elle significativement diffrente de 0 ?
Cette question est trs importante en conomtrie. En effet, dans le cas dune rponse ngative le coefficient nest pas significativement diffrent de 0 la variable explicative Revenu ne sera pas considre comme tant explicative de la consommation
puisque son coefficient de pondration est nul.
Il peut paratre tonnant de tester la diffrence par rapport zro et non pas seulement la positivit ou la ngativit du coefficient de rgression. En effet, il est commode
de ne sinterroger que sur la contribution de la variable explicative, quelle soit positive
ou ngative.
Ce problme peut tre formul laide de la thorie des tests partir des deux hypothses suivantes :
H0 : a1 = 0
H1 : a1 = 0
Si nous rejetons lhypothse H0, un seuil 1 fix, alors la propension marginale
consommer est considre comme tant significativement diffrente de 0. Le seuil le
plus communment employ est = 0,05 , soit un risque de rejeter tort H0 de 5 %.
Nous savons que :

a1 a1

a1

suit une loi de Student n 2 degrs de libert.

Sous lhypothse H0, cette relation devient :




a1
a1 0

=
= ta1
loi de Student n 2 degrs de libert.

a1

a1

ta1
est appel le ratio de Student.

Nous avons calcul 


a1 lors de lexercice 2, il convient donc de calculer 
a1
; or,
daprs [11],


2
2

,
nous
connaissons

a1
(xt x)2 = 64 156 000
=
(xt x)2
t
t

(colonne 6 du tableau de calcul 3). Lestimateur de la variance de lerreur nous est donn
par [10] :

et2

2 =

n2

, o et est le rsidu de lestimation (et = yt 


yt )

1. Le seuil est aussi appel risque de premire espce : cest la probabilit de rejeter lhypothse H0 bien quelle soit vraie.

30  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 31

yt et de et
a) Calcul de 
yt est calcule par application des estimations 
a0 et 
a1 :
La srie ajuste 

yt = 
a0 + 
a1 x t
soit 
y1 = 
a0 + 
a1 x1 e1 = y1 
y1

y1 = 1 176,08 + 0,78 8 000 = 7 423,95 1 e1 = 7 389,99 7 423,95 = 33,96

y2 = 1 176,08 + 0,78 9 000 = 8 204,93

e2 = 8 169,65 8 204,93 = 35,28

 Les rsultats sont consigns dans le tableau 4. Nous remarquons bien que
et = 0 (proprit de la mthode des moindres carrs).
t

Tableau 4 Calcul du rsidu destimation



yt

et

et2

7 423,95
8 204,93
8 595,43
8 595,43
8 829,72
9 766,90
10 547,88
11 328,87
12 890,83
13 671,81

33,96
35,28
236,28
57,41
41,64
150,69
45,57
142,76
132,74
197,81

1 153,38
1 244,98
55 830,26
3 296,40
1 733,93
22 707,42
2 076,39
20 379,08
17 620,12
39 127,38

0,00
0,00

165 169,30
16 516,93

Somme
Moyenne

b) Calcul de lestimation de la variance de lerreur et de lcart type du coefficient


de rgression.
Lestimation de la variance de lerreur est donc gale :

et2
165 169,3
t
2
=
= 20 646,16

=
n2
10 2
ce qui nous permet de calculer la variance estime de 
a1 :

2
20 646,16
2

=

a1
= 0,000 321 8
=
2
64
156 000
(xt x)
t

soit 
a1
= 0,017 9
c) Calcul du ratio de Student et rgle de dcision.

a1

Nous savons que


= ta1
est distribu selon une loi de Student n 2


a1

degrs de libert, la distribution dchantillonnage sous H0 est donc reprsente par le


graphe 6.
1. Les petites diffrences constates sont dues des problmes darrondi.

Le modle de rgression simple  31

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 32

/2

/2

H1 tn2


+ tn2 H1


H0

Graphique 6 Distribution dchantillonnage sous lhypothse H0


La rgle de dcision pour un seuil est alors la suivante :
a 1

On calcule le ratio empirique de Student ta1


(rapport du coefficient sur son
=
a1

cart type)
/2

/2

Si ta1
est infrieur tn2 ou suprieur +tn2 alors on rejette lhypothse H0
(nous sommes dans la zone hachure H1), le coefficient a1 est alors significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt est donc contributive
lexplication de la variable Ct.
/2

Si ta1
est compris dans lintervalle tn2 , alors nous ne sommes pas en mesure de
rejeter lhypothse H0 (donc on laccepte), le coefficient a1 nest pas significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt nest donc pas explicative de la variable Ct.
Il est plus simple de profiter de la symtrie de la loi de Student et donc de calculer
la valeur absolue du ratio de Student et de la comparer directement la valeur lue dans
la table.
La rgle de dcision pour un seuil = 0,05 est alors la suivante :
|
a1 |
0,025

si ta1
> tn2
on rejette lhypothse H0, le coefficient a1 est alors
=

a1

significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt est donc


contributive lexplication de la variable Ct ;
|
a1 |
0,025

si ta1
 tn2
on accepte lhypothse H0, le coefficient a1 nest donc
=

a1

pas significativement diffrent de 0 (on accepte a1 = 0 ) ; la variable explicative Rt


nest donc pas contributive lexplication de Ct .
Nous voyons limportance que revt ce test dans linvestigation conomtrique ; en
effet, il permet de tester la pertinence dune variable explicative qui figure dans un
modle et sa contribution lexplication du phnomne que lon cherche modliser.
Dans notre exemple, nous calculons le ratio de Student :

ta1
=

|
a1 |
0,78
=
= 43,57 > t80,025 = 2,306 1 a1 = 0

a1
0,017 9

La propension marginale consommer est donc significativement diffrente de 0,


la variable Revenu est bien explicative de la variable Consommation.
2) Dtermination dun intervalle de confiance, au seuil de 95 %, pour la propension
marginale consommer.
1. Les tables statistiques sont en fin douvrage. Dans le cas dun test unilatral, il convient dutiliser une table correspondant ce type de test, cest--dire dont seule la partie de gauche est
hachure. Dans le cas dun test bilatral, ce sont les tables dont les deux parties extrmes sont
hachures. Bien entendu, cela nest vrai que pour les lois de probabilit symtriques.

32  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 33

Nous savons que :




a1 a1
a1 a1

= tn2
, lintervalle de
suit une loi de Student n 2 degrs de libert, soit

a1

a1

confiance nous est donn (cf. graphe 4) par :



a1 a1
/2
/2
= tn2 a1 = 
a1 
a 1 tn2

a1

Application numrique pour un seuil = 0,95 :


a1 = 0,78 2,306 0,0179
Nous avons donc un risque de 5 % que le vritable coefficient a1 se trouve lextrieur
de lintervalle [0,74 ; 0,82] ; nous constatons que 0 ne figure pas dans cet intervalle de confiance, ce qui est bien entendu cohrent avec la question prcdente.

IV. quation et tableau danalyse


de la variance

A. quation danalyse de la variance


Dmontrons les deux relations suivantes :

et = 0 : la somme des rsidus est nulle (la droite de rgression passe

1
par le point moyen
).





yt = 
a0 + 
a1 xt + et
yt =
a1
xt +
et
a0 + 
t
t

 t  t
yt n
a0 
a1
xt =
et or 
a0 = y 
a1 x , en divisant par n il apparat que
t
t
t

et = 0 .
t




yt =
yt , il y a galit entre la moyenne de la srie expliquer et la
t

moyenne de la srie ajuste.


yt 
yt = et


t

yt


yt =

et = 0 y = 
y

De ces deux relations nous pouvons en dduire lquation fondamentale


danalyse de la variance :



(yt y)2 =
(
yt 
y)2 +
et2
t

SC T

= SC E

+SC R

[12]

1. Cela nest vrai que pour les modles comportant un terme constant, ou bien, pour les modles
sans terme constant, si les donnes sont centres sur leur moyenne.

Le modle de rgression simple  33

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 34

La variabilit totale (SCT) est gale la variabilit explique (SCE) + la


variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle. En effet, plus la variance explique est proche de la variance totale,
meilleur est lajustement du nuage de points par la droite des moindres carrs.
Il est dusage de calculer le rapport :


(
yt y)2
et2
t
t
R2 = 
=1 
(yt y)2
(yt y)2
t

[13]

R 2 est appel le coefficient de dtermination, et R le coefficient de corrlation

multiple (dans le cas particulier du modle de rgression une seule variable


explicative, il est gal au coefficient de corrlation linaire simple entre x et y ).

B. Tableau danalyse de la variance


Le tableau 5 prsente lanalyse de la variance pour un modle de rgression simple.
Tableau 5 Analyse de la variance par une rgression simple
Source
de variation
x

Somme
des carrs
SC E =


(
yt y)2

Degr
de libert

Carrs
moyens

SC E/1

n2

SC R/(n 2)

Rsidu

SC R =

et2

Total

SC T =


(yt y)2

n1

Les degrs de libert correspondent au nombre de valeurs que nous pouvons


choisir arbitrairement (par exemple, pour la variabilit totale, connaissant n 1
valeurs, nous pourrons en dduire la n -ime, puisque nous connaissons la
moyenne y ).
Le test H0 : a1 = 0 est quivalent au test dhypothse1 H0 : SC E = 0 (la
variable explicative xt ne contribue pas lexplication du modle).
/ 0.
Soit le test dhypothses H0 : SC E = 0 contre lhypothse H1 : SC E =

La statistique2 de ce test est donne par :


1. Cela nest vrai que dans le cas du modle de rgression simple.
2. Nous comparons la somme des carrs expliqus SCE la somme des carrs des rsidus SCR
qui est reprsentative de la somme des carrs thoriquement la plus faible.

34  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

SC E
ddl SC E
F =
=
SC R
ddl SC R

Page 35


(
yt y)2
t

1

Ou encore :
SC E
ddl SC E
F =
=
SC R
ddl SC R

(n 2)


(
yt y)2
t

1

[14]

et2

et2

(n 2)

R2
1
=
(1 R 2 )
(n 2)

[15]

La statistique F est le rapport de la somme des carrs expliqus par xt sur la


somme des carrs des rsidus, chacune de ces sommes tant divise par son
degr de libert respectif. Ainsi, si la variance explique est significativement
suprieure la variance rsiduelle, la variable xt est considre comme tant une
variable rellement explicative.

F suit une statistique de Fisher 1 et n 2 degrs de libert. Si F > F1;n2


nous rejetons au seuil lhypothse H0 dgalit des variances, la variable xt est

significative ; dans le cas contraire, nous acceptons lhypothse dgalit des


variances, la variable xt nest pas explicative de la variable yt .

2
a 1 a1
En effet, 2 !
suit une loi du 2 (chi-deux) un degr de li / t (xt x)2

bert (carr dune variable alatoire normale centre rduite) et


n


et2

t=1

= (n 2)

a2i
2
=
(n

2)
suit une loi du 2 (chi-deux) n 2 degrs de
2
a2i

libert (somme au carr de n 2 variables alatoires indpendantes normales


centres rduites).


(a 1 a1 )2
(xt x)2
t
En effectuant le rapport des deux chi-deux on obtient : F =
,
et2
t

a 12

soit sous H0 (a1 = 0) F =


(xt x)2
t

=
et2
t

(n 2)

(n 2)
SC E
1
suit une loi de Fisher 1
SC R
(n 2)

Le modle de rgression simple  35

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 36

et n 2 degrs de libert (rapport de chi-deux diviss par leurs degrs de


libert).


( yt y)2 = a 12
En effet, nous avons SC E =
(xt x)2 car
t

yt y = a 0 + a 1 xt a 0 a 1 x = a 1 (xt x) .

Nous remarquons :
 2
F = ta1
=

a 1
a1

2


a 12
(xt x)2
a
t

=  2
=
et /(n 2)
2 /
(xt x)2
2
1

Exercice n 4
quivalence des tests et analyse de la variance
Un agronome cherche estimer la relation liant la production de mas yi au taux de
bauxite xi se trouvant dans la terre en formalisant la relation :
yi = a0 + a1 xi + i
partir dune tude statistique portant sur 85 parcelles de terre, un conomtre lui
fournit les rsultats suivants :
= 132,80 1,1 xi + ei i = 1,. . . , 85

yi

(4,3)
()


(10,2)

= ratio de Student
ei2

= 6 234,32

1) Montrer que tester lhypothse H0 : a1 = 0 revient tester lhypothse r = 0 , o r


est le coefficient de corrlation linaire simple entre yi et xi ; le calculer.
2) Construire le tableau danalyse de la variance et vrifier les rsultats obtenus en 1)
partir du test de Fisher.
3) Le coefficient a1 est-il significativement infrieur 1 ?
Solution
1) Les observations ne sont pas dates, le modle est spcifi en coupe instantane.
Pour tester lhypothse H0 : a1 = 0 , nous comparons le ratio de Student empirique
0,05
t = 10,2 la valeur critique t83
= 1,96 1.

1. Le degr de libert de la loi de Student tant suprieur 30, il est licite de lapproximer par
une loi normale, 1,96 est la valeur de la loi normale un seuil de 0,05 (test bilatral).

36  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 37

Puisque t est largement suprieur 1,96, nous rejetons lhypothse H0, a1 est donc
significativement diffrent de 0. Le taux de bauxite est un facteur explicatif (ngatif) de
la production de mas.
a1 /t = 0,107.
a1
Lcart type du coefficient 
a1 est gal : 
=
Montrons lquivalence de ce test avec H0 : r = 0 .
Le coefficient de corrlation linaire simple est gal :
2



(xi x)(yi y)
(xi x)(yi y)
i
i

r2 = 
r = "

(xi x)2
(yi y)2
(xi x)2
(yi y)2
i

Or, daprs [1], nous savons que :



(xi x)(yi y)

a1 =


(xi x)2


a1


(xi x)(yi y)
i

r2 =


(yi y)2

SC E
= R2
SC T

En effet :




a1
(xi x)(yi y) = 
a1 
a1
(xi x)2 = 
a12
(xi x)2
i
i
i



=
(
a1 x i 
a1 x)2 =
(
yi 
a0 y + 
a0 )2 =
(
yi y)2 = SC E
i

Pour le modle de rgression simple, nous avons galit entre le coefficient de dtermination et le carr du coefficient de corrlation.
Nous avons la relation :
F =

R2
(1

R 2 )/(n

2)

r2
(1

r 2 )/(n

2)

= (t )2

donc on en dduit :

r (n 2)
#
t =
qui suit une loi de Student n 2 degrs de libert.
(1 r 2 )

Ceci permet de tester si la relation entre yi et xi est significative, ou encore si le


coefficient r est significativement diffrent de 0. Le calcul du coefficient de corrlation
ne pose alors plus de problme :

r 83
t = 10,2 = #
r 2 = 0,556 |r| = 0,745 1
(1 r 2 )

1. Nous savons que le coefficient r est en ralit ngatif puisque le coefficient de rgression 
a1
est lui-mme ngatif.

Le modle de rgression simple  37

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 38

2) Pour construire le tableau danalyse de la variance, il nous faut connatre :



SC E =
(
yi y)2
i

SC R =

ei2

SC T =


(yi y)2
i

ei2

SC R
=1
Or, daprs [13], nous avons : R 2 = 1 
SC T
(yi y)2
i

R = r = 0,556 , la connaissance de SC R =
2

ei2 = 6 234,32 permet de dterminer

SC T = 14 041,26 ainsi que, daprs [12], SC E = 7 806,94 . Nous pouvons maintenant construire le tableau 6 danalyse de la variance.
Tableau 6 Analyse de la variance
Source
de variation

Somme
des carrs

Degr
de libert

Carrs
moyens

xi
Rsidu
Total

SC E = 7 806,94
SC R = 6 234,32
SC T = 14 041,26

1
85 2
85 1

7 806,94
75,11

F =

SC E/1
7 806,94
0,05
= 3,96
=
= 103,94 > F1,83
SC R/(n 2)
75,11

Nous remarquons que F = (t )2.


Dans le modle de rgression simple, il y a quivalence tester :
H0

H1

a1 = 0
r x,y = 0
SC E = 0

a1 =
 0
r x,y = 0
SC E = 0

Le premier test porte sur la pente de la droite de rgression, le deuxime test sur le
coefficient de corrlation entre x et y et, enfin, le troisime a pour but de juger si la
somme des carrs expliqus est significative, ces trois tests nanmoins rpondent la
mme interrogation.
3) Le coefficient a1 est-il significativement infrieur 1 ?
La formulation des hypothses est la suivante :
H0 : a1 = 1
H1 : a1 < 1

38  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 39

Sous lhypothse H0, nous avons :


|
a1 (1)|
| 1,1 + 1|
|
a1 a1 |
=
=
= 0,92 < t 0,05 = 1.651

a1

a1
0,107 8

Nous acceptons lhypothse H0, a1 nest pas significativement diffrent de 1.


Nous pouvons aussi rpondre cette question en vrifiant que la valeur 1 est comprise dans lintervalle de confiance :
a1 = 
a1 1,96 
a1
a1 [ 1,31 ; 0,89]
(Attention : t 0,05 = 1,96 car le test est maintenant bilatral.)

V. La prvision dans le modle


de rgression simple
Lorsque les coefficients du modle ont t estims, il est possible de calculer une prvision un horizon h .
Soit le modle estim sur la priode t = 1,. . . , n : yt = 
a0 + 
a1 xt + et ,
si la valeur de la variable explicative xt est connue en n + 1(xn+1 ) , la prvision est donne par : 
yn+1 = 
a0 + 
a1 xn+1 .
Montrons que cette prvision est sans biais.
Lerreur de prvision est gale : en+1 = yn+1 
yn+1
que lon peut crire : en+1 = (a0 + a1 xn+1 + n+1 ) (
a0 + 
a1 xn+1 )
soit : en+1 = (a0 
a0 ) + (a1 
a1 )xn+1 + n+1 . En se rfrant aux hypothses
du modle, on a :
E(en+1 ) = 0

Une dmonstration analogue permet dobtenir E(en+h ) = 0 .


La prvision sans biais est donc obtenue par lapplication directe du
modle de rgression estim. Cependant, dans la pratique, il nest que de
peu dutilit de connatre la prvision si nous ne savons pas quel degr de
confiance nous pouvons lui accorder. Nous allons donc calculer la variance de lerreur de prvision qui nous permet de dterminer un intervalle de

1. Valeur de la loi normale au seuil de 5 % ; en effet il sagit dun test unilatral.

Le modle de rgression simple  39

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 40

confiance1 bornant la prvision. La variance de lerreur de prvision est donne


par :


V (en+1 ) = V (
a0 a0 ) + (
a1 a1 )xn+1 + n+1

Puisque la variable xn+1 est certaine et lerreur n+1 est non autocorrle avec les
t cette expression peut scrire :
2
V (en+1 ) = V (
a0 ) + xn+1
V (
a1 ) + 2xn+1 Cov(
a0 ,
a1 ) + V (n+1 )

En remplaant les variances et la covariance des coefficients par leurs expressions daprs [9] et connaissant V (n+1 ) = 2 , nous obtenons :

V (en+1 ) =

2
2
+ x 2 V (
a1 ) + xn+1
V (
a1 ) 2xn+1 x V (
a1 ) + 2
n

ou encore :

(xn+1 x)2
1

V (en+1 ) = V (yn+1 
yn+1 ) = 
2 + 
+ 1
n
(xt x)2

[16]

Nous pouvons observer que, dans cette formule, la variance de lerreur de


prvision est fonction de lcart quadratique entre la variable exogne prvue et
la moyenne de cette mme variable : plus la valeur prvue sloigne de cette
moyenne, plus le risque derreur est important. De mme, nous remarquons que
la variance de lerreur de prvision est une fonction inverse de la variabilit de
la srie explicative.
Lhypothse de normalit de t permet alors de dterminer un intervalle
(1 ) % pour la prvision :

(xn+1 x)2

en+1 = yn+1 
yn+1 N 0, 2 + 
+ 1
n
(xt x)2
t

Soit


a0 + 
a1 xn+1 yn+1
$
tn2 (Student n 2 d.d.l.)
%
(xn+1 x)2
%1

% + 
+1
&n
(xt x)2
t

/2
n2

yn+1 = 
yn+1 t

$
%
%1
(x x)2
n+1

%
+
+1
&n
(xt x)2
t

1. Il est plus juste de parler dintervalle de prdiction.

40  CONOMTRIE

[17]

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 41

Cas particulier
Lorsque nous utilisons le modle de rgression simple pour calculer une droite
de tendance (moindres carrs sur le temps), le modle est spcifi ainsi :
Tt = 
a0 + 
a1 t + et

pour t = 1,. . . , n

Pour calculer la prvision lhorizon h , nous employons la formule dextrapolation :


n+h = 
T
a0 + 
a1 (n + h) , et lintervalle de prdiction se trouve alors sur deux branches dhyperbole1 (n + h t)2 illustr par le graphique 7.

Graphique 7 Intervalle de la prvision par extrapolation de tendance

Exercice n 5


fichier C2EX2

Prvision dans un modle de rgression simple


Nous reprenons le modle consommation-revenu estim lors de lexercice 2 :
yt = 1 176,08 + 0,78 xt + et
(0,21)
(43,53)
n = 10
() = t de Student
1) Calculer le coefficient de dtermination et effectuer le test de Fisher permettant de
dterminer si la rgression est globalement significative.

1. Cest leffet trompette , le lecteur devinera pourquoi...

Le modle de rgression simple  41

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 42

2) Quelle est la consquence sur la consommation de laugmentation du revenu de 8 % ?


3) Pour les annes 11 et 12, on prvoit respectivement 16 800 et 17 000 dollars de revenu par habitant. Dterminer la prvision de consommation pour ces deux annes
ainsi que lintervalle de prdiction au seuil de 95 %.
Solution
1) Pour calculer le coefficient de dtermination, nous nous rfrons la relation [15] :
F =

R2
(1

R 2 )/(n

2)

r2
(1

r 2 )/(n

2)

= (t )2 = 43,52

Soit : r 2 = 0,99 , nous pouvons alors calculer le Fisher empirique :


0,05
F = 1895,3 > F1,8
= 5,32 , la variable explicative est significative.

2) Augmentation de 8 % du revenu.
Nous avons :

yt = 
a1
xt soit
yt = 0,78
xt = 0,78 0,08 = 0,062 4
La consommation augmente de 6,24 %, soit un peu moins que le revenu.
3) Les prvisions sont calcules par lutilisation du modle estim.

y11 = 1 176,08 + 0,78 x11 = 1 176,08 + 0,78 16 800
= 14 280,08
Lintervalle de prvision [17] peut alors tre calcul :
$
%
%1
(x x)2
/2
11
y11 = 
y11 tn2 
%
+1
+
&n
(xt x)2
t

avec :

n



(xt x)2
t
x
/2
tn2
x11
y11
IC

= 10
= 143,69 (daprs lexercice 3)
= 64 156 000 (daprs lexercice 3)
= 11 280 (daprs lexercice 2)
= 2,306
= 16 800
= 14 280,08 2,306 180,32
= [13 864,24 ; 14 695,91]

La ralisation a 95 % de chance de se trouver lintrieur de cet intervalle1.


De mme, pour lanne 12, nous obtenons :

y12 = 1 176,08 + 0,78 x12 = 1 176,08 + 0,78 17 000
= 14 436,08
y12
IC

= 14 436,08 2,306 182,32


= [14 015,65 ; 14 856,51]

1. La distribution tant normale (loi continue), il est clair que la probabilit dapparition de chacune des valeurs de lintervalle nest pas identique. La valeur la plus probable se trouve au
centre de lintervalle.

42  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 43

Exercice n 6
Comparaison de coefficients de rgression
Un conomiste spcialis en conomie du travail sintresse la relation liant la
rmunration et la dure des tudes (thorie du capital humain). Pour ce faire, il dispose dun chantillon de 40 hommes et 25 femmes ayant le mme ge, dont il relve la
rmunration annuelle (yi ) , exprime en milliers deuros, et le nombre dannes
dtudes (xi ) .
Les estimations conomtriques conduisent aux rsultats suivants :
Pour les hommes :
yi = 18,60 + 1,8 xi + ei i = 1,. . . , 40 n 1 = 40
(9,3) (5,2)
() = ratio de Student
R 2 = 0,42
Pour les femmes :
yi = 14,50 + 0,7 xi + ei i = 1,. . . , 25 n 2 = 25
(12,8) (2,5)
() = ratio de Student
R 2 = 0,22
1) Linfluence de la dure des tudes sur la rmunration vous semble-t-elle significative ?
2) Existe-t-il une diffrence significative de limpact de la dure des tudes sur la rmunration des hommes et des femmes ?
Solution
1) Pour rpondre cette premire question, nous pouvons analyser soit les ratios de
Student, soit le coefficient de dtermination.
Le ratio de Student empirique de la variable annes dtudes est gal :
Pour les hommes :

tah
=


ah
0,05
= 5,2 > t38
= 1,96

ah

ta f =


af
0,05
= 2,5 > t23
= 2,06

a f

Pour les femmes :

Les carts types sont :



ah
= 0,34

et


a f = 0,28

Les deux coefficients de rgression sont donc significativement diffrents de 0. Il est


noter que, pour les femmes, le coefficient de pondration des annes dtudes est plus

Le modle de rgression simple  43

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 44

faible et moins significatif que celui des hommes. Les probabilits critiques1 sont, pour
les hommes, de c = 0,000 1 et de c = 0,02 pour les femmes (nous considrons le
coefficient comme non significativement diffrent de 0 au seuil de 2 %).
Le test de Fisher men sur les coefficients de dtermination conduit aux mmes
rsultats.
2) Ce problme se ramne un test de diffrence de moyennes de variables alatoires
normales indpendantes et de variances ingales.

Le rapport

H0 : ah = a f

H0 : d = ah a f = 0

H1 : ah = a f

H1 : d = ah a f = 0

a f ) (ah a f )
(
ah 
suit une loi de Student n 1 + n 2 4 degrs de

a h a f

libert.
2
et d = 
Avec 
d2 = 
a2 f + 
ah
a f et sous lhypothse H0, le rapport scrit :
ah 

d
(1,8 0,7)
0,05
= t =
= 2,49 > t61
= 1,96

d
0,342 + 0,282
Rappel : Var(a x1 + b x2 ) = a 2 Var(x1 ) + b2 Var(x2 ) + 2abCov(x1 ,x2 ) o x1 et x2
sont deux variables alatoires et a et b sont deux scalaires. Ici Cov(a h ,a f ) = 0 car les
deux rgressions sont indpendantes. Do Var(a f a h ) = Var(a f ) + Var(a h ) .
Nous rejetons lhypothse H0, il existe une diffrence significative des coefficients
de rgression : la dure des tudes des femmes a moins dimpact sur la rmunration
que la dure des tudes des hommes (sur cet chantillon...)
Nous pouvons dterminer la probabilit critique de ce test (probabilit partir de
laquelle nous sommes amens accepter lhypothse H0). La lecture de la table de
Student 61 degrs de libert (sur la table ) indique une probabilit comprise entre
0,01 et 0,02 (la valeur exacte dtermine par la fonction Excel loi.student
est 0,0154). Le risque de se tromper en rejetant lhypothse H0 est donc de 1,54 % ;
compte tenu de ce trs faible risque, nous rejetons lhypothse H0. Evidemment, plus la
probabilit critique est faible plus nous sommes conforts dans notre dcision.

Exercice n 7
Apprendre manipuler les formules
Soit les rsultats dune estimation conomtrique :
yt = 1,251 xt 32,95 + et
n = 20
R 2 = 0,23
= 10,66
1. Cette notion est importante : il sagit de dterminer le seuil de probabilit partir duquel on
accepte lhypothse H0. Plus ce seuil est faible, moins le risque de se tromper est important.

44  CONOMTRIE

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 45

1) A partir des informations connues, on demande de retrouver les statistiques suivantes : la somme des carrs des rsidus (SCR), la somme des carrs totaux (SCT),
la somme des carrs expliqus (SCE), la valeur de la statistique du Fisher empirique
(F ) et lcart type du coefficient a 1 ( a1
).
2) Le coefficient de la variable x est-il significativement suprieur 1 ?
Solution
1) On sait que =

"

SCR

= 10,66 SCR = (10,66)2 18 = 2 045,44


n2
Nous pouvons calculer SCE et SCT laide du coefficient de dtermination.

R 2 = 0,23 = 1 SC R/SC T
SC T = SC R/(1 R 2 ) = 2045,44/(1 0,23) = 2 656,42
Or SCT = SCE + SCR SCE = 610,98
Nous pouvons calculer maintenant :

R2
SC E
F =
=
= 5,40 t = F = 2,32
2
(1 R )/(n 2)
SC R/(n 2)
(dans le cas dun modle de rgression simple t 2 = F ). Nous pouvons en dduire
a 1
1,251
= 0,54.
lcart type du coefficient : a1
= =
t
2,32
2) On pose le test dhypothses :
H0 : a1 = 1 contre lhypothse H1 : a1 > 1
Sous H0, nous pouvons crire :
a 1 a1
1,25 1
0,05
=
= 1,734 1 nous sommes donc dans la
= 0,46 < t18
ta1 =
a1
0,54

zone de lacceptation de H0, le coefficient a1 nest pas significativement suprieur


1.

Exercice n 8
Apprendre utiliser les formules
partir dun chantillon de 190 observations, on tudie la relation entre la variable
expliquer yi et la variable explicative xi .
laide des informations fournies ci-dessous reconstituez les huit valeurs manquantes signales par VM1, ...VM8.

1. Attention, comme le test est unilatral et que la table de Student de cet ouvrage est tabule directement pour /2 (cas le plus gnral dun test bilatral), il convient donc ici de lire sur la table
un seuil de 0,10 = 2 0,05 .

Le modle de rgression simple  45

9782100721511-Bourbo-C02.qxd

20/10/14

15:09

Page 46

Dependent Variable: Y
Method: Least Squares
Sample: 1 190
Included observations: 190
Variable
Coefficient

Std. Error

C
X
R-squared
S.E. of regression
Sum squared resid

VM1
16.61141
VM3
VM2
Mean dependent var
S.D. dependent var
F-statistic

4364.928
VM4
VM5
322.8850
VM7

t-Statistic

Prob.
0.0000
0.0000
VM6
VM8
778.9623

On donne x = 3,447 et x = 38,416


Solution
VM1 : directement par a 0 =
VM2 : ta1 =

F =

a 0
= 262,76
ta0

778,96 = 27,91


VM3 : a 1 = #!
, or = 322,88 ;
(xi x)2

(xi x)2
!
x =
do1 (xi x)2 = (n 1) x2 = 189 (3,447)2 = 2245,66
n1

322,88
=
= 6,81
a 1 = #!
2
2245,66
(xi x)
do VM4 = VM3 VM2 = 190,15
VM5 : on sait que F =

R 2 /1
R2
=
2
(1 R )/(n 2)
(1 R 2 )/188

= 778,96 R 2 =

778,96
= 0,80
778,96 + 188

VM6 : y = a 0 + a 1 x = 4364,928 + 190,15 38,416 = 2939,8


! 2
!
ei
VM7 : SCR = ei2 , or 2 =
n2
!
do ei2 = (n 2) 2 = 188 (322,88)2 = 19 599 280 .
SC E
SC R
SC R
= 98 986 262
=1
SC T =
SC T
SC T
1 R2
!
"
(yi y)2
SC T
y =
=
= 723,7
n1
n1
VM8 : R 2 =

1. Nous prenons ici la formule de lestimateur de lcart type calcul partir dun chantillon,
donc nous divisons par n 1.

46  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 47

3. Le modle

de rgression multiple

e modle linaire gnral est une extension du modle de rgression simple abord au chapitre prcdent. Aprs avoir prsent le
modle linaire gnral (I), nous envisageons une procdure destimation des paramtres en tudiant les proprits statistiques des estimateurs (II). Les diffrents tests dhypothses concernant les coefficients
du modle sont proposs en (III), et la section (IV) est consacre lanalyse de la variance ainsi quaux tests sy rattachant.
En (V) nous prsentons une classe particulire de sries explicatives : les
variables indicatrices, puis la prvision laide du modle linaire gnral fait lobjet de la section (VI).
Enfin nous terminons ce chapitre par quelques exercices rcapitulatifs.

I. Le modle linaire gnral


A. Prsentation
Lors du chapitre prcdent, nous avons considr quune variable endogne est
explique laide dune seule variable exogne. Cependant, il est extrmement
rare quun phnomne conomique ou social puisse tre apprhend par une
seule variable. Le modle linaire gnral est une gnralisation du modle de
rgression simple dans lequel figurent plusieurs variables explicatives :
yt = a0 + a1 x1t + a2 x2t + . . . + ak xkt + t pour t = 1,. . . , n

Le modle de rgression multiple  47

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 48

avec :
yt = variable expliquer la date t ;
x1t = variable explicative 1 la date t ;
x2t = variable explicative 2 la date t ;
...
xkt = variable explicative k la date t ;
a0 , a1 ,. . . , ak = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle sp-

cifi), cette erreur est inconnue et restera inconnue ;


n = nombre dobservations.

B. Forme matricielle
Lcriture prcdente du modle est dun maniement peu pratique. Afin den
allger lcriture et de faciliter lexpression de certains rsultats, on a habituellement recours aux notations matricielles. En crivant le modle, observation
par observation, nous obtenons :
y1
y2
...
yt
...
yn

= a0 + a1 x11 + a2 x21 + . . . + ak xk1 + 1


= a0 + a1 x12 + a2 x22 + . . . + ak xk2 + 2
= a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
= a0 + a1 x1n + a2 x2n + . . . + ak xkn + n
Y

Soit, sous forme matricielle :

(n,1)

= X

(n,k+1)

(k+1,1)

(n,1)

avec :

y1
1
1
y2
.
.
.
.
.
.
Y = ; X =
1
yt
.
.
..
.
.
1
yn

x11
x12
..
.

x21
x22
..
.

x1t
..
.

x2t
..
.

x1n

x2n

...
...
...
...
...
...


xk1
1

a
0
xk2
2

.
a1

.
a

; a = 2 ; =
xkt
t
...

..
ak
n
xkn

Nous remarquons la premire colonne de la matrice X , compose de 1, qui


correspond au coefficient a0 (coefficient du terme constant).
La dimension de la matrice X est donc de n lignes et k + 1 colonnes (k tant
le nombre de variables explicatives relles, cest--dire constante exclue).

48  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 49

Lcriture sous forme matricielle rend plus aise la manipulation du modle


linaire gnral, cest pourquoi nous ladoptons par la suite.

II. Estimation et proprits


des estimateurs

A. Estimation des coefficients de rgression


Soit le modle sous forme matricielle k variables explicatives et n observations :
Y = Xa +
[1]
Afin destimer le vecteur a compos des coefficients a0 , a1 . . . ak , nous appliquons la mthode des Moindres Carrs Ordinaires (MCO) qui consiste minimiser la somme des carrs des erreurs, soit :

Min

n


t2 = Min  = Min (Y Xa) (Y Xa) = Min S

[2]

t=1

avec  transpos1 du vecteur .


Pour minimiser cette fonction par rapport a , nous diffrencions2 S par
rapport a :
S
[3]
a=0
= 2 X  Y + 2 X  X
a = (X  X)1 X  Y
a
Cette solution est ralisable3 si la matrice carre X  X de dimension
(k + 1, k + 1) est inversible. La matrice X  X est la matrice des produits croiss

des variables explicatives ; en cas de colinarit parfaite entre deux variables


explicatives, la matrice X  X est singulire et la mthode des MCO dfaillante.
On appelle quations normales les quations issues de la relation :
X  X
a = X Y

1. Nous dsignerons par le signe  les transposs de vecteur ou de matrice.


2. S = (Y Xa) (Y Xa) = Y  Y Y  Xa a  X  Y + a  X  Xa
= Y  Y 2 a  X  Y + a  X  Xa .
3. Les conditions de second ordre sont vrifies du fait que X  X est une matrice dfinie semipositive.

Le modle de rgression multiple  49

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Soit, sous forme matricielle :

n


x1t

x2t

.
.
.

xkt




...


x1t

x1t2

x2t x1t

...


xkt x1t

x2t

...

x1t x2t

...

x2t2

...
...

xkt x2t

...




Page 50

xkt

x1t xkt


x2t xkt

...


2
xkt


a0

yt

x1t yt
a1

=

x y
a2

2t t
...
...



ak
xkt yt

Le modle estim scrit :


yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et

avec et = yt
yt o et est le rsidu, cest--dire lcart entre la valeur observe
de la variable expliquer et sa valeur estime (ajuste).
Attention : il convient de bien distinguer entre lerreur de spcification du
modle (not t ) qui est et restera inconnue et le rsidu (et ) qui, lui, est connu.

1) Cas particulier
Si nous raisonnons sur des donnes centres, lestimateur de a peut scrire en
fonction des matrices des variances et covariances empiriques :


a1

Var(x1 )

Cov(x1 , x2 ) Cov(x1 , x3 ) . . . Cov(x1 xk )


a Cov(x2 , x1 ) Var(x2 )
Cov(x2 , x3 ) . . . Cov(x2 , xk )

2

=
. . . Cov(x3 , xk )

a3 Cov(x3 , x1 ) Cov(x3 , x2 ) Var(x3 )

... ...

ak
Cov(xk , x1 ) Cov(xk , x2 ) Cov(xk , x3 ) . . . Var(xk )

Cov (x1 ,y)

Cov(x2 , y)

Cov(x3 , y)
...

Cov(xk , y)
a0 = y
a1 x 1
a2 x 2 . . .
ak x k .
avec
Que sont des donnes centres sur la moyenne ? Soit xt une variable connue
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable
(X t = xt x) dont la somme est par construction nulle :

n
n


(xt x) =
Xt = 0 .
t=1

Nous avons donc X = 0 .

2) Effet de la variation dune seule des variables explicatives


a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et .
Soit le modle estim : yt =

50  CONOMTRIE

t=1

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 51

Si la variable x2 passe de la valeur x2t (x2t + x2t ) , toutes choses tant


gales par ailleurs (les k 1 autres variables restant constantes), alors la
a2 x2t .
variable expliquer varie de
a2 x2 :  yt =
Les coefficients sinterprtent donc directement en terme de propension marginale.

B. Hypothses et proprits des estimateurs


Par construction, le modle est linaire en X (ou sur ces coefficients) et nous distinguons les hypothses stochastiques (lies lerreur ) des hypothses structurelles.

1) Hypothses stochastiques
H1 : les valeurs xi, t sont observes sans erreur.
H2 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle.
H3 : E(t2 ) = 2 , la variance de lerreur est constante (t) (homoscdasticit).
H4 : E(t t  ) = 0 si t = t  , les erreurs sont non corrles (ou encore indpendantes).
H5 : Cov(xit , t ) = 0 , lerreur est indpendante des variables explicatives.

2) Hypothses structurelles
H6 : absence de colinarit entre les variables explicatives, cela implique
que la matrice (X  X) est rgulire et que la matrice inverse (X  X)1
existe.
H7 : (X  X)/n tend vers une matrice finie non singulire.
H8 : n > k + 1, le nombre dobservations est suprieur1 au nombre des
sries explicatives.

3) Proprits des estimateurs


Considrons les proprits de lestimateur [3].
Le modle sous forme matricielle peut scrire, comme pour le modle de
rgression simple, de diffrentes manires :

1. Dans le cas dune galit, nous aurions un systme de n quations n inconnues, donc parfaitement dtermin.

Le modle de rgression multiple  51

9782100721511-Bourbo-C03.qxd

20/10/14

Y = Xa +
Y = X
a+e
= X
Y
a

15:12

Page 52

(e = rsidu)
e =Y Y

Nous obtenons :

a = (X  X)1 X  Y = (X  X)1 X  (Xa + )

a = (X  X)1 X  (Xa) + (X  X)1 X 

a = a + (X  X)1 X 

[4]

a ) = a + (X  X)1 X  E() = a
do E(
car E() = 0
Lestimateur est donc sans biais :
E(
a) = a

Calculons maintenant la matrice des variances et covariances des coefficients


de rgression a .
a = E{(
a a)(
a a) }

Or, daprs [4], (


a a) = (X  X)1 X  et (
a a) =  X (X  X)1 puisque
1
1
(X X) est symtrique .


(
a a)(
a a) = (X  X)1 X   X (X  X)1 do
a = (X  X)1 X  E(  )X (X  X)1 avec E(  ) = = 2 I = matrice des
variances et covariances de lerreur .

En effet, daprs les hypothses H3 et H4 nous avons :

E(1 1 )

E(2 1 )
= E(  ) =
...
E(n 1 )

E(1 2 )

...

E(2 2 )

...

E(n 2 ) . . .

E(1 n )

E(2 n ) =

E(n n )

0
2
=
...
0
0

0 ... 0

0 ... 0

0 . . . 2

Soit : a = 2 (X  X)1 X  X (X  X)1


a = 2 (X  X)1

[5]

1. Nous rappelons quelques rgles du calcul matriciel : (ABC) = C  B  A et si A est symtrique


A = A et donc [(X  X)1 ] = (X  X)1 .

52  CONOMTRIE

9782100721511-Bourbo-C03.qxd

2
a =
n

XX
n

20/10/14

15:12

Page 53

1
 Lim a = 0 si n (daprs les hypothses H3

et H7). Lestimateur est donc convergent.


Thorme de Gauss-Markov : Lestimateur [3] des moindres carrs est qualifi de BLUE (Best Linear Unbiaised Estimator), car il sagit du meilleur estimateur linaire sans biais (au sens quil fournit les variances les plus faibles pour
les estimateurs).
Il est noter que lestimateur du maximum de vraisemblance des paramtres
fournit des rsultats identiques ceux de lestimateur des MCO si lhypothse
de normalit des erreurs est vrifie.
Aprs un calcul matriciel1, il apparat que nous pouvons estimer sans biais
2
par :

2 =

e e
nk1

[6]

En remplaant la variance de lerreur par son estimateur, nous obtenons :


a =

2 (X  X)1

[7]

4) Le thorme de Frisch, Waugh et Lovell (FWL)


Supposons que les variables explicatives soient spares en deux groupes reprsents par les matrices X 1 et X 2 . Le modle scrit : Y = X 1 a1 + X 2 a2 + .
Le thorme de FWL nous dit que lestimateur des MCO du paramtre a2 et
des rsidus sont les mmes que ceux du modle : M1 Y = M1 X 2 a2 + v avec
M1 = I X 1 (X 1 X 1 )1 X 1 .
La matrice M1 est symtrique et idempotente (M1 M1 = M1 ) , de plus
M1 X 1 = 0 .
Ce thorme permet de bien comprendre le problme de la spcification dun
modle : si une variable Y est effectivement explique par le groupe de variables
X 1 et X 2 , il faut imprativement faire figurer dans le modle ces deux groupes
de variables mme si seul le groupe de variables X 1 nous intresse.

1. Voir dmonstration en annexe C.

Le modle de rgression multiple  53

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 54

C. quation danalyse de la variance


et qualit dun ajustement
Comme pour le modle de rgression simple, nous avons :
a)

yt =

b)


yt y =
y

et = 0

De ces deux relations, nous en dduisons lquation fondamentale danalyse


de la variance :



(yt y)2 =
(
yt
et2
y)2 +
t

= SC E

SC T

+ SC R

[8]

La variabilit totale (SCT) est gale la variabilit explique (SCE) + la


variabilit des rsidus (SCR).
Cette quation va nous permettre de juger de la qualit de lajustement dun
modle ; en effet, plus la variance explique est proche de la variance totale, meilleur est lajustement global du modle. Cest pourquoi nous calculons le
rapport SCE sur SCT :


(
yt y)2
et2
t
t
R2 = 
=1 
(yt y)2
(yt y)2
t

[9]

R 2 est appel le coefficient de dtermination, et R le coefficient de corrlation multiple. R 2 mesure la proportion de la variance de Y explique par la
rgression de Y sur X .

Dans le cas de donnes centres (moyenne nulle) et seulement dans ce cas,


le coefficient de dtermination est gal :
R2 =

 Y

Y
e e
=
1

Y Y
Y Y

[10]

Cette qualit de lajustement et lapprciation que lon a du R 2 doivent tre


tempres par le degr de libert de lestimation. En effet, lorsque le degr de

54  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 55

libert est faible1, il convient de corriger le R 2 afin de tenir compte du relativement faible nombre dobservations compar
au nombre de facteurs explicatifs
2
par le calcul dun R 2 corrig not R :
2

R =1
2

n1
(1 R 2 )
nk1

[11]

On a R < R 2 et si n est grand R  R 2 .


Nous verrons au chapitre 4 section IV deux critres (Akaike et Schwarz) permettant darbitrer, lors de lintroduction dune ou plusieurs variables explicatives, entre la perte de degrs de libert et lapport dinformation.

Exercice n 1

fichier C3EX1

Mise sous forme matricielle dun modle et calcul des coefficients


de rgression
Soit le modle trois variables explicatives :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t
Nous disposons des donnes du tableau 1.
1) Mettre le modle sous forme matricielle en spcifiant bien les dimensions de chacune des matrices.
2) Estimer les paramtres du modle.
3) Calculer lestimation de la variance de lerreur ainsi que les carts types de chacun
des coefficients.
2

4) Calculer le R 2 et le R corrig.

1. Dans le cas dun modle o le nombre dobservations est gal au nombre de variables explicatives (degr de libert = 0 ), le R 2 = 1 . Cependant, le pouvoir explicatif de ce modle est nul.

Le modle de rgression multiple  55

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 56

Tableau 1 Valeurs observes de y , x1 , x2 et x3


t

x1

x2

x3

1
2
3
4
5
6
7
8
9
10
11
12
13
14

12
14
10
16
14
19
21
19
21
16
19
21
25
21

2
1
3
6
7
8
8
5
5
8
4
9
12
7

45
43
43
47
42
41
32
33
41
38
32
31
35
29

121
132
154
145
129
156
132
147
128
163
161
172
174
180

Solution
1) Forme matricielle
Nous disposons de 14 observations et trois variables explicatives, le modle peut
donc scrire :

Y = Xa +
avec :
1

12
1 2 45 121
2

.
a0
14
1 1 43 132
.

1

;

=
Y = 10 ; X = 1 3 43 154 ; a =
t
a2
..
.. ..
..
..

.
. .
.
.
.
a3
..
21
1 7 29 180
14
Dimensions :
.

(14,1)

(14,4)

(4,1)

(14,1)

2) Estimation des paramtres


Nous savons daprs [3] que
a = (X  X)1 X  Y .
Calcul de X  X et de (X  X)1
X

1
2

45
121

1
1
43
132

1
3
43
154

...
1
...
7

. . . 29
. . . 180

1
1

..
.

2
1
3
..
.

45
43
43
..
.

121
132

154
=
..
.

29

180

14
85
=
532
2 094

56  CONOMTRIE

85
631
3 126
13 132

532
3 126
20 666
78 683

2 094
13 132

78 683
317 950

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

(X  X)1

20,16864
0,015065

=
0,23145
0,07617

Page 57

0,015065
0,013204
0,001194
0,00094

0,23145
0,001194
0,003635
0,000575

0,07617
0,00094

0,000575
0,000401

Calcul de X  Y
X

1
2

45
121

1
1
43
132

1
3
43
154

...
...
...
...

Y
12

1
248
14

7
1 622

10 =
29 .. 9 202
.
180
37 592
21

Calcul de
a


(X X)1

20,16864
0,015065

0,23145
0,07617

0,015065
0,013204
0,001194
0,00094

X Y

0,23145
0,001194
0,003635
0,000575

248
0,07617

0,00094
1 622 =
a

9 202
0,000575
37 592
0,000401

32,89132
0,801900

=
0,38136

0,03713
Soit
a0 = 32,89 ;
a1 = 0,80 ;
a2 = 0,38 ;
a3 = 0,03
Les calculs que nous venons de dvelopper sont longs et fastidieux et mettent en vidence lintrt incontestable dutiliser un ordinateur.
3) Calcul de
2 et de
a2
Daprs [6]
2 =

Soit

e e
, nous devons donc calculer le rsidu e .
nk1

= Y X
e =Y Y
a
a0 +
a1 x1t +
a2 x2t +
a3 x3t )
et = yt (
et = yt 32,89 0,80 x1t + 0,38 x2t + 0,03 x3t

Par exemple pour e1 :


e1 = y1 32,89 0,80 x11 + 0,38 x21 + 0,03 x31
e1 = 12 32,89 0,80 2 + 0,38 45 + 0,03 121 = 0,84
Le tableau 2 prsente lensemble des rsultats.
Par construction, la somme des rsidus est bien nulle.
t=14


et2
e e
67,45
t=1
=
=
=
= 6,745
nk1
14 3 1
10

Le modle de rgression multiple  57

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 58

Tableau 2 Calcul du rsidu


t

yt


yt

et

1
2
3
4
5
6
7
8
9
10
11
12
13
14

12
14
10
16
14
19
21
19
21
16
19
21
25
21

12,84
12,39
13,18
13,39
17,70
17,88
22,20
18,86
16,51
18,76
17,92
21,90
22,71
20,76

0,84
1,61
3,18
1,61
3,70
1,12
1,20
0,14
4,49
2,76
1,08
0,90
2,29
0,24

0,71
2,58
10,11
2,58
13,67
1,26
1,44
0,02
20,14
7,63
1,17
0,81
5,27
0,06

67,45

Somme

et2

La matrice des variances et covariances estimes des coefficients nous est donne
par [7], soit :
a =

2 (X  X)1

20,16864
0,015065
a = 6,745

0,23145
0,07617

0,015065
0,013204
0,001194
0,00094

0,23145
0,001194
0,003635
0,000575

0,07617
0,00094

0,000575
0,000401

Les variances des coefficients de rgression se trouvent sur la premire diagonale :



a20 = 6,745 20,17 = 136,04

a21
2

a2

2

a3


a 0 = 11,66

= 6,745 0,013 =

0,087
a1
= 0,29

= 6,745 0,0036 =

0,024
a2
= 0,15

= 6,745 0,0004 =

0,0026
a3
= 0,05

4) Le calcul du R 2 est effectu partir de la formule [9].


Nous connaissons e e = 67,45 , il convient de calculer
(yt y)2 = 226,86 .
t

et2
67,45
t
2
R =1 
=1
= 0,702
2
226,86
(yt y)
t
2

Le R corrig est donn par [11] :


2

R =1

58  CONOMTRIE

n1
14 1
(1 R 2 ) = 1
(1 0,702) = 0,613
nk1
14 4

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 59

Nous observons la baisse du coefficient de dtermination lorsque nous le corrigeons


par le degr de libert.

III. Les tests statistiques


A. Le rle des hypothses
Lhypothse de normalit des erreurs implique1 que :
n


et2

t=1


a2i

2
= (n k 1) 2 = (n k 1) 2

ai

[12] suit une loi du 2 (chi-deux)

n k 1 degrs de libert (somme au carr de n k 1 variables alatoires ind-

pendantes normales centres rduites).


Il en rsulte que :

ai ai
(lcart type thorique est remplac par lcart type empirique) suit

ai
une loi de Student n k 1 degrs de libert.


ai ai
ai

ai ai
=
est le rapport dune loi norEn effet,

ai

a2i
1
(n k 1) 2
ai (n k 1)

male centre rduite la racine carre dun chi-deux divis par son degr de
libert.
(
a a) a1
a a) suit une loi du 2 (chi-deux) k + 1 degrs de libert
(
(somme au carr de k + 1 variables alatoires normales centres rduites, les
k + 1 coefficients).

Si on remplace la matrice des variances covariances thoriques des coefficients, par


a =
2 (X  X)1 , la loi de probabilit de
son estimateur

1
a1
(
a a)
a a)
(
k+1

est alors un Fisher k + 1 et n k 1 degrs de libert.

1. Lensemble de ces rsultats sont une gnralisation k variables explicatives des rsultats prsents au chapitre 2, paragraphe III.B.

Le modle de rgression multiple  59

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 60


1
1
a a)
(
a a) 2 (X  X )1 (
k
+
1
En effet, F =
est le rapport de deux

2
1
(n k 1) 2
(n k 1)
chi-deux diviss par leurs degrs de libert (caractristique dune loi de Fisher
k + 1 et n k 1 degrs de libert).

B. Construction des tests


partir des diffrentes relations dfinies ci-dessus, nous pouvons mettre en
place un certain nombre de tests statistiques que nous allons expliciter.

1) Comparaison dun paramtre ai une valeur fixe a


Le test dhypothses est le suivant :
H0 : ai = a
H1 : ai = a
Nous savons que :

ai ai
suit une loi de Student n k 1 degrs de libert.

ai

Sous lhypothse H0, cette relation devient1 :


|
ai a|
= tai loi de Student n k 1 degrs de libert

ai

[13]

/2
Si tai > tnk1
alors nous rejetons lhypothse H0, ai est significativement
diffrent de a (au seuil de ).
/2
Si tai  tnk1
alors nous acceptons lhypothse H0, ai nest pas significativement diffrent de a (au seuil de ).

Cas particulier : test par rapport une valeur particulire a = 0 .


Si nous dsirons savoir si une variable explicative figurant dans un modle
est rellement significativement contributive pour expliquer la variable endogne, il convient de tester si son coefficient de rgression est significativement
diffrent de 0 pour un seuil choisi, en gnral = 5 %.

1. Comme il sagit dun test bilatral, on calcule la valeur absolue du t empirique.

60  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 61

La relation [13], sous H0 ( ai = 0 ), devient :


 


 ai  = t loi de Student n k 1 degrs de libert
ai


ai 

[14]

tai est appel le ratio de Student, les rgles de dcision cites plus haut sappli-

quent alors.
Ce test est trs important ; en effet, si dans un modle estim, un des coefficients (hormis le terme constant) nest pas significativement diffrent de 0, il
convient dliminer cette variable1 et de r-estimer les coefficients du modle.
La cause de cette non-significativit, est due :
soit une absence de corrlation avec la variable expliquer,
soit une colinarit trop leve avec une des variables explicatives.

2) Comparaison dun ensemble de paramtres


un ensemble de valeurs fixes
Nous cherchons tester simultanment lgalit dun sous-ensemble de coefficients de rgression des valeurs fixes.
H0 : aq = a q
H1 : aq = a q
q tant le nombre de coefficients retenus, cest--dire la dimension de chacun
des vecteurs aq .

Nous avons dmontr que

1
a1
(
a a)
a a) suit une loi de Fisher
(
k+1

k + 1 et n k 1 degrs de libert ; pour un sous-ensemble de paramtres q,


1
a1
aq aq )
aq aq ) suit alors une loi de Fisher q et
lexpression (
q,q (
q
n k 1 degrs de libert.

Pour accepter H0, il suffit que :


1
a1
(
aq a q )
aq a q )  F (q, n k 1)
q,q (
q

[15]

F (q, n k 1) = loi de Fisher au seuil q et n k 1 degrs de libert.

1. En effet, elle napporte aucune contribution et dgrade lestimation des autres variables.

Le modle de rgression multiple  61

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 62

3) Intervalle de confiance de la variance de lerreur


Lintervalle de confiance de la variance de lerreur permet de dterminer une
fourchette de variation de lamplitude de lerreur. Pour un intervalle (1 ) %,
il est donn par :


(n k 1)
2 (n k 1)
2
IC =
;
2
2
1
2

[16]

Avec 12 n k 1 degrs de libert et /2 de probabilit1 dtre dpasse


et 22 n k 1 degrs de libert et (1 /2) de probabilit dtre
dpasse.

C. Tests sur les rsidus : valeur anormale, effet de levier


et point dinfluence
Nous nabordons pas ici les tests sur les rsidus remettant en cause les hypothses dhomoscdasticit ou dindpendance, qui sont traits au chapitre 5,
mais trois notions qui sont proches et nanmoins diffrentes dans leur consquence sur lestimation des paramtres du modle et leurs prcisions.

1) La matrice HAT
La matrice HAT2 , note H, joue un rle essentiel dans la dtection de leffet
de levier.
Nous calculons la matrice HAT H = X (X  X )1 X  .
Les lments de la premire diagonale de cette matrice H sont appels les
leviers, qui dterminent linfluence de lobservation i sur les estimations obtenues par la rgression.
Le levier est situ sur la premire diagonale de cette matrice soit
h i = xi (X  X )1 xi
n

h i = k + 1 , la somme des lments de
Deux proprits : 0  h i  1 et
i =1

la premire diagonale de la matrice H est gale au nombre de paramtres estims du modle.


1. Attention, la loi du chi-deux nest pas symtrique, il convient donc de lire sur la table les deux
probabilits 1 /2 et /2 .
2. Cette matrice permet de passer du vecteur Y au vecteur Y do le nom de matrice HAT (chapeau
en anglais), en effet nous avons Y = X a = X (X  X )1 X  Y = H Y .

62  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 63

Si chaque observation pse le mme poids, alors les valeurs des h i doivent
k+1
.
tre proches de
n
k+1
,
n
lobservation est alors considre comme un point de levier (leverage point) ou
point dinfluence.

Le levier dune observation i est donc anormalement lev si : h i > 2

2) Point de levier et valeur anormale


Une observation exerce un effet de levier si elle est loigne des autres en
termes de combinaison des variables explicatives ; cest--dire que les valeurs
prises par les variables explicatives, pour cette observation de la variable expliquer, sont inattendues. Par exemple, un pays dont la population est faible mais
le PIB lev, chaque facteur explicatif pris individuellement nest pas surprenant, mais la survenance de deux valeurs la fois pour un pays est insolite.
Le point dinfluence est une observation qui contribue trs fortement au pouvoir explicatif du modle (sans cette valeur la rgression peut tre non significative !), lobservation pse de manire exagre dans la rgression, au point
que les rsultats obtenus sont trs diffrents selon que nous lintgrons ou non
dans la rgression.
La valeur prise par la variable explicative est anormale si le rsidu de cette
observation est beaucoup plus lev que les autres rsidus, pour identifier une
valeur anormale nous pouvons calculer le rsidu standardis (ou encore appel
le rsidu studentis). Une autre approche permettant de dtecter des valeurs
anormales laide de variables indicatrices sera prsente dans ce chapitre la
section V.

3) Rsidu standardis (ou studentis)


Les rsidus standardiss1 nots eiS permettent de dtecter des valeurs anormales. Le rsidu ei est divis par son cart type estim pondr par le levier2 :
ei
eiS =
suit une loi de Student n k 1 degrs de libert, avec
1 h
e  i

ei2


t
e =
. Si, par exemple, les rsidus standardiss eiS sont compris
nk1
0,025
, on ne suspecte pas de valeurs anormales pour un seuil
dans lintervalle tnk1
de confiance 95 %.
1. Dans cette mthode de calcul nous parlons de rsidus studentiss internes car le calcul porte sur
lensemble des observations.
ei
sans intgrer la valeur du levier.
2. Certains auteurs divisent le rsidu par son cart type eiS =
e

Le modle de rgression multiple  63

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 64

Il est aussi possible de calculer des rsidus studentiss externes, ils sont calculs de la mme manire mais en excluant du calcul lobservation i.

Exercice n 2

fichier C3EX1

Tests statistiques sur les coefficients et la variance de lerreur : calcul


des leviers et des rsidus studentiss
En reprenant les donnes du tableau 1 et les rsultats de lexercice 1, on demande de
rpondre aux questions suivantes :
1) Les variables explicatives sont-elles significativement contributives pour expliquer
la variable endogne ?
2) Le coefficient a1 est-il significativement infrieur 1 ?
3) Les coefficients a1 et a2 sont-ils simultanment et significativement diffrents de
1 et 0,5 ?
4) Quel est lintervalle de confiance pour la variance de lerreur ?
5) Calculer les leviers et les rsidus standardiss, existe-t-il des valeurs aberrantes ?
(Les seuils choisis seront de 5 %.)
Solution
1) Il convient de calculer les trois ratios de Student et de les comparer la valeur lue
dans la table pour un seuil de 5 % (la table de Student en fin douvrage indique directement les valeurs de pour un test bilatral).
Daprs [14], nous obtenons :

0,80
a1
0,05

=
= ta1
= 2,75 > t10 = 2,228 a1 = 0 , la variable explicative x 1 est

a1
0,29

contributive lexplication de y ; de mme :




 0,38 

a2
 = t = 2,53 > t 0,05 = 2,228 a2 = 0
= 
10
a2


a2
0,15 



 0,03 

a3

 = t = 0,60 < t 0,05 = 2,228 a3 = 0
=
10
a3


a3
0,05 

la variable x2 est explicative de y alors que la variable x3 nest pas contributive


lexplication de y , il convient donc de la retirer de ce modle et de procder une nouvelle estimation.
Nous aurions pu tout aussi bien rpondre cette question en calculant les intervalles
de confiance de chacun des coefficients :

64  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 65

0,05
I Ca1 =
a1 tnk1

a1
= 0,80 2,228 0,29 = [0,14 ; 1,45]

De mme nous obtenons :


I Ca2 = [0,71 ; 0,04] et I Ca3 = [0,14 ; 0,08]
La valeur 0 nappartient pas lintervalle de confiance 95 % de a1 et a2 , donc ces
deux coefficients sont significativement diffrents de 0 ; en revanche, 0 appartient lintervalle de confiance de a3 , ce coefficient nest pas significativement diffrent de 0.
2) Nous posons le test dhypothses suivant :
H0 : a1 = 1
H1 : a1 < 1
Sous H0, la relation [13] scrit :

a1 a1
0,80 1
0,05
=
= 1,811 acceptation de H0
= 0,68 > t10

a1
0,29

Nous sommes bien dans la zone dacceptation de H0 (cf. graphique 4 du chapitre 2).
Par souci de simplification, nous pouvons procder au test de Student en profitant
de la symtrie de cette loi, soit calculer :
|
a1 a1 |
|0,80 1|
0,05
=
= 1,81 acceptation de H0
= 0,68 < t10

a1
0,29

Le fait de raisonner sur la valeur absolue du numrateur entrane une lecture directe de la table et ainsi une construction et interprtation immdiate du test.
3) Le test dhypothses est le suivant :

  
1
a1
H0 :
=
0,5
a2

  
1
a1
H1 :
=
0,5
a2
Examinons les diffrents lments de la relation [15] sous H0 :
1
1 (
(
aq aq )
aq
aq aq )
q




0,80
1
et aq =
. La matrice des variances
Nous avons : q = 2 ,
aq =
0,38
0,5
et covariances des coefficients a t calcule lors de lexercice 1, nous ne retenons que
la sous-matrice de dimension 2 2 correspondant aux deux coefficients de rgression
faisant lobjet du test.




11,57140 3,80213
aq = 6,745 0,013204 0,001194
1 =

aq

0,001194 0,003635
3,80213
42,03506

1. Attention, le test est unilatral, il convient de lire sur la table de Student tabule pour /2 un
seuil de 0,10 = 2 0,05 .

Le modle de rgression multiple  65

9782100721511-Bourbo-C03.qxd

F =

20/10/14

15:12

1
(0,80 1; 0,38 + 0,5)
2

Page 66

11,57140 3,80213
3,80213 42,03506

0,80 1
0,38 + 0,5

0,05
= 4,10 , le F empirique est
F = 0,612 est comparer F (q, n k 1) = F2,10
infrieur au F lu dans la table, on accepte lhypothse H0. Les donnes ne sont pas
incompatibles avec la possibilit que les coefficients a1 et a2 soient simultanment et
respectivement gaux 1 et 0,5.

4) Lintervalle de confiance de la variance de lerreur un seuil (1 )% = 95%


( = 0,05) est calcul partir de la formule [16] pour 10 degrs de libert :

 

10 6,745 10 6,745
(n k 1)
2 (n k 1)
2
IC =
=
;
;
2
2
20,48
3,25
0,025
0,975
Soit 3,30  2  20,75. La variance vraie (mais inconnue) 2 de lerreur a 95 % de
chance de se situer lintrieur de cet intervalle.
5) Le calcul de h i et des rsidus standardiss sont effectus laide du programme
C3EX2.PRG. Les rsultats sont prsents sur le tableau 3.
Tableau 3 Valeur des leviers hi et des rsidus standardiss eiS
i

Rsidus
ei

hi

eiS

1
2
3
4
5
6
7
8
9
10
11
12
13
14

0,8408
1,6068
3,1800
1,6055
3,6973
1,1220
1,2015
0,1426
4,4880
2,7622
1,0830
0,8994
2,2946
0,2387

0,2790
0,2966
0,3091
0,3248
0,2609
0,1825
0,5327
0,2025
0,1804
0,1442
0,3066
0,2115
0,4086
0,3605

0,3813
0,7377
1,4732
0,7523
1,6559
0,4778
0,6768
0,0615
1,9088
1,1497
0,5008
0,3900
1,1489
0,1149

4
k+1
=2
= 0,57 , aucune valeur nest suprieure
n
14
0,57, nous ne dtectons pas de point de levier (ou de point dinfluence).
Le seuil du levier est gal 2

0,025
Les rsidus studentiss sont tous dans lintervalle t10
= 2,228, nous ne dtectons pas de valeur anormale.

66  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 67

IV. Lanalyse de la variance


A. Construction du tableau danalyse de la variance
et test de signification globale dune rgression
Dans cette section, nous allons nous interroger sur la signification globale du
modle de rgression, cest--dire si lensemble des variables explicatives a une
influence sur la variable expliquer. Ce test peut tre formul de la manire
suivante : existe-t-il au moins une variable explicative significative ? Soit le test
dhypothses :
H0 : a1 = a2 = . . . = ak = 0 (tous les coefficients sont nuls1)
H1 : il existe au moins un des coefficients non nul
Nous ne testons pas le cas o le terme constant a0 est nul, car seules nous
intressent les variables explicatives. Un modle dans lequel seul le terme
constant est significatif na aucun sens conomique.
Le cas o lhypothse H0 est accepte signifie quil nexiste aucune relation
linaire significative entre la variable expliquer et les variables explicatives (ou
encore que la Somme des Carrs Expliqus nest pas significativement diffrente de 0).
Nous reprenons lquation fondamentale [8] danalyse de la variance :



(yt y)2 =
(
yt y)2 +
et2
t

La rgression est juge significative si la variabilit explique est significativement diffrente de 0. Le tableau 4 prsente le tableau danalyse de la
variance2 permettant deffectuer le test de Fisher.

(
yt y)2 /k
R 2 /k
t
F =  2
=
(1 R 2 )/(n k 1)
et /(n k 1)
t

(daprs [9])
[17]

1. Nous remarquons que nous pouvons rpondre cette question par le test dun sous-ensemble
de coefficients [15], le test ici prsent conduit videmment des rsultats identiques.
2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau.

Le modle de rgression multiple  67

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 68

Tableau 4 Analyse de la variance pour une rgression multiple


Source de variation
.

x1 , x2 ,. . . , xk

Somme des carrs



SC E =
(
yt y)2

Degr de libert

Carrs moyens

SC E/k

nk1

SC R/(n k 1)

Rsidu

SC R =

et2

SC T =

Total


(yt y)2

n1

Lhypothse de normalit des erreurs implique que sous lhypothse H0, F


suit une loi de Fisher (rapport de deux chi-deux). Nous comparons donc ce F
calcul au F thorique k et (n k 1) degrs de libert : si F > F nous rejetons lhypothse H0, le modle est globalement explicatif.
Dans la pratique, ce test est effectu immdiatement grce la connaissance
du coefficient de dtermination R 2 (seulement si le modle comporte un terme
constant) qui permet de calculer le Fisher empirique (calcul).

B. Autres tests partir du tableau danalyse


de la variance
partir dun exercice, nous allons prsenter quatre tests usuels se rfrant
lanalyse de la variance, la gnralisation de ces tests ne posera par la suite aucune difficult au lecteur.

1) Introduction dune ou de plusieurs variables explicatives


supplmentaires
Lajout dun bloc supplmentaire de variables explicatives amliore-t-il significativement la qualit de lajustement ?

2) Stabilit des coefficients du modle dans le temps (test de CHOW)


Peut-on considrer le modle comme tant stable sur la totalit de la priode, ou
bien doit-on considrer deux sous-priodes distinctes destimation (changement
structurel du modle) ? La spcification du modle est la mme, mais les valeurs
estimes des coefficients pour les deux chantillons sont diffrentes.

3) Test de restrictions et de contraintes sur les coefficients


Les contraintes souhaites ou envisages sur les coefficients sont-elles justifies
et valides par lestimation conomtrique ?

68  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 69

4) Augmentation de la taille de lchantillon servant estimer le modle


Lorsque la taille de lchantillon aug mente (le nombre dobservations disposition est plus important), le modle reste-t-il stable ? Ce test se ramne au test
de Chow de stabilit des coefficients sur deux sous-priodes. Lestimation sur la
sous-priode 1 est effectue partir de lchantillon initial et lestimation de la
sous-priode 2 partir des nouvelles observations.
Nous voyons lintrt pratique de ces tests et lapport pour lconomiste des
rponses ces questions.

Exercice n 3

fichier C3EX1

Tests partir de lanalyse de la variance


En reprenant les donnes de lexercice 1 (tableau 1), dont nous rappelons les rsultats de lestimation du modle1 :
yt = 32,89 + 0,80 x1t 0,38 x2t 0,03 x3t + et
(11,66) (0,29)
(0,15)
(0,05)
R 2 = 0,702
n = 14
() = cart type des coefficients
on demande de tester les hypothses suivantes.
1) Lajout des variables explicatives x2 et x3 amliore-t-il significativement la qualit de
lestimation par rapport x1 seul ?
2) Peut-on considrer le modle ( trois variables explicatives) comme stable sur lensemble de la priode, ou doit-on procder deux estimations, lune de la priode 1
7, et lautre de la priode 8 14 ?
3) Un conomiste suggre que dans ce modle a1 = 1 et a2 = a3 , quen pensez-vous ?
Solution2
Nous pouvons tout dabord appliquer le test de Fisher [17] afin de tester la signification globale de la rgression trois variables x1 , x2 et x3 .
F =

R 2 /k
0,702/3
0,05
= 3,71
=
= 7,878 > F3,10
(1 R 2 )/(n k 1)
(1 0,702)/10

1. Le lecteur notera la prsentation standard des rsultats destimation dun modle. Les informations listes ici doivent imprativement figurer. noter que le t de Student est souvent indiqu la place de lcart type des coefficients afin de pouvoir, sans aucun calcul, procder aux
tests de significativit des coefficients.
2. Les calculs sont effectus partir dun logiciel, il peut apparatre de lgres diffrences entre
les calculs manuels et les rsultats, imputables au fait que le logiciel tient compte dun nombre
lev de dcimales.

Le modle de rgression multiple  69

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 70

Nous rejetons lhypothse H0 de nullit de tous les coefficients, la rgression est


globalement significative.
1) Test dajout de variables
tape 1 : calcul de la variabilit totale, explique et rsiduelle sur le modle complet.
Les rsultats calculs prcdemment lors de lexercice 1 nous ont donn :


SC T =
(yt y)2 = 226,86 ; SC E =
(
yt y)2 = 159,41 ;
t
t
SC R = e e = 67,45
tape 2 : calcul de la variabilit totale, explique et rsiduelle sur le modle une seule
variable explicative x1 .
Le modle estim est le suivant :
yt = 1,011x1,t + 11,57 + et
(0,281)
n = 14
R 2 = 0,52
(.) = Ecart type

= 3,0165
Nous calculons dabord
2 = 12 3,01652 = 109,20
SC R 1 = e e = d.d.l.
puis partir du coefficient de dtermination R 2 , nous dduisons :
SC T 1 = 226,86 et SC E 1 = 117,65
Le test dhypothses est le suivant :
H0 : a2 = a3 = 0
H1 : il existe au moins un des deux coefficients non nul.
Ce test se ramne un test par analyse de la variance : le fait dajouter des variables
explicatives dans un modle entrane automatiquement une augmentation1 de SCE
(et donc une diminution de SC R ) ; on souhaite donc tester que la diffrence entre SCE
et SC E 1 soit significativement positive (ou bien que la diffrence entre SC R 1 et SC R
soit significativement positive, il sagit du mme test). On compare donc la diffrence
par rapport la somme des carrs la plus faible, soit ici SC R . Le tableau 5 danalyse de
la variance permet de procder au test de Fisher.
tape 3 : tableau danalyse de la variance.
Tableau 5 Tableau danalyse de la variance pour tester lajout
dun bloc de variables explicatives
Source
de variation

Somme
des carrs

Degr
de libert

Carrs
moyens

x1
x1 , x2 , x3
Rsidu
Total

SC E 1 = 117,65
SC E = 159,41
SC R = 67,45
SC T = 226,85

1
3
10
13

117,65
53,14
6,74

1. Sauf si la ou les variables ajoutes sont orthogonales la variable expliquer, SC E reste alors
identique. Ce cas est videmment rare.

70  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 71

tape 4 : calcul du Fisher empirique.


F =

(SC E SC E 1 )/(k k  )
41,67/(3 1)
0,05
= 4,10
=
= 3,09 < F2,10
SC R/(n k 1)
67,45/10

Ou encore : F :

(SC R 1 SC R)/(k k  )
(109,2 67,45)/2
=
= 3,09
SC R/(n k 1)
67,45/10

Avec k = nombre de variables explicatives du modle complet et k  = nombre de


variables explicatives du modle sans lajout du bloc de variables. Nous acceptons lhypothse H0, il ny a donc pas de diffrence significative entre les deux variances expliques, lajout des variables explicatives x2 et x3 namliore pas de manire significative au seuil de 5 % le pouvoir explicatif du modle.
2) Le modle est-il stable sur la totalit de la priode ?
Soit le modle estim sur une seule priode :
yt =
a1 x1t +
a2 x2t +
a3 x3t +
a0 + et pour t = 1, . . . , 14
ou le modle estim sur deux sous-priodes :
yt =
a11 x1t +
a21 x2t +
a31 x3t +
a01 + et pour t = 1, . . . , 7
a12 x1t +
a22 x2t +
a32 x3t +
a02 + et pour t = 8, . . . , 14
yt =
Le test dhypothses jointes est alors le suivant :
a = a1 = a2
1
1
1
a2 = a 1 = a 2
2
2

H0 :

a3 = a31 = a32
a0 = a01 = a02
Ce test de stabilit des coefficients (test de Chow) se ramne la question suivante :
existe-t-il une diffrence significative entre la somme des carrs des rsidus (SC R) de
lensemble de la priode et laddition de la somme des carrs des rsidus calcule partir des deux sous-priodes (SC R 1 + SC R 2 ) ?
En effet, dans le cas dune rponse ngative, cela signifie que le fait de scinder en
deux chantillons namliore pas la qualit du modle, donc quil est stable sur la totalit de la priode.
Les tapes sont alors les suivantes.
tape 1 : estimation du modle sur chacune des deux sous-priodes1 et calcul des
sommes des carrs de rsidus.
sous-priode 1 : donnes de 1 7

yt = 0,774x1,t 0,293x2,t 0,012x3,t + 25,27 + et


(0,53)
(0,31)
(0,10)
n = 7
R 2 = 0,692
(.) = Ecart type

= 3,01759
1. Les deux sous-priodes peuvent tre de longueur ingale, cependant elles doivent imprativement recouvrir la totalit des observations de la priode.

Le modle de rgression multiple  71

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 72

Nous pouvons en dduire comme prcdemment :


SC T 1 = 88,85 ; SC E 1 = 61,54 ; SC R 1 = 27,31
sous-priode 2 : donnes de 8 14

yt = 1,228x1,t 0,620x2,t 0,184x3,t + 62,63 + et


(0,69)
(0,52)
(0,15)
n = 7
R 2 = 0,543
(.) = Ecart type

= 2,6281
Do SC T 2 = 45,43 ; SC E 2 = 24,70 ; SC R 2 = 20,73.
tape 2 : calcul du Fisher empirique.
En prenant au dnominateur la plus faible des sommes des carrs (soit
SC R 1 + SC R 2 ) , le Fisher empirique est gal :
F =

[SC R (SC R 1 + SC R 2 )]/ddln


(SC R 1 + SC R 2 )/ddld

avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = k + 1 = 4


car n = n 1 + n 2
ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 6
do
F =

[(67,45 (27,31 + 20,73))]/4


4,852
=
= 0,606 < F40,05
; 6 = 4,53
(27,31 + 20,73)/6
8,00

Lhypothse H0 est accepte, les coefficients sont significativement stables sur lensemble de la priode.
Attention, en cas dhtroscdasticit (cf. chapitre 5), le test de Chow est biais dans
le sens dune surestimation du seuil de rejet du test, nous rejetons trop souvent lhypothse H0.
3) Test de a1 = 1 et a2 = a3
Si cette hypothse est vrifie, le modle :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t
peut scrire :
yt = a0 + 1 x1t + a2 x2t + a2 x3t + t
ou encore :

yt x1t = a0 + a2 (x2t + x3t ) + t


z t = a0 + a2 vt
+ t

Il convient de constituer la nouvelle variable expliquer, z t , et la nouvelle variable


explicative vt , puis deffectuer la rgression de z t sur vt .
Le tableau 6 prsente ces nouvelles variables.
Lestimation des deux (k  + 1) coefficients du modle conduit aux rsultats suivants :

72  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 73

z t = 0,0111vt + 13,74 + et
(0,051)
n = 14
R 2 = 0,0389
(.) = Ecart type

= 3,0109
Tableau 6 Variables transformes sous lhypothse
de vrification des contraintes
t

z t = yt x1t

vt = x2t + x3t

1
2
3
4
5
6
7
8
9
10
11
12
13
14

10
13
7
10
7
11
13
14
16
8
15
12
13
14

166
175
197
192
171
197
164
180
169
201
193
203
209
209

Nous pouvons en dduire :


SC T 1 = 109,21 ; SC E 1 = 0,425 ; SC R 1 = 108,78
Lhypothse tester est donc :
H0 : les restrictions sont toutes vrifies (SC R 1 = SC R) .
H1 : il existe au moins une restriction non vrifie (SC R 1 = SC R) .
Le Fisher empirique est donn par :
F =

(SC R 1 SC R)/ddln
(108,78 67,45)/2
0,05
= 4,10
=
= 3,06 < F2,10
SC R/(n k 1)
67,45/10

avec ddln = (n k  1) (n k 1) = k k  = 2 .
Lhypothse H0 est accepte, les contraintes envisages sur les coefficients sont compatibles avec les donnes.

C. Gnralisation des tests par analyse de la variance


Nous pouvons remarquer que tous ces tests par analyse de la variance se ramnent un test unique, tel que les lments du vecteur des coefficients a vrifient
un ensemble de q contraintes linaires :

Le modle de rgression multiple  73

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 74

H0 : Ra = r
H1 : Ra = r
Ainsi le Fisher empirique est donn par :
F =

{(R
a r) [R(X  X)1 R  ]1 (R
a r)}/q
SC R/(n k 1)

o
a est le vecteur des coefficients estims sur le modle non contraint.
On rejette H0 si le F est suprieur au F lu q et n k degrs de libert.
Quelques exemples dutilisation pour un modle k variables explicatives :
Test sur un coefficient de rgression. Hypothse H0 : a3 = 0,5 .
Soit tester lgalit du 3e coefficient par rapport 0,5 ; la contrainte scrit
Ra = r avec R = (0 0 0 10 0 0) et r = (0 0 0 0,50 0 0) . Le premier lment
des vecteurs correspond au terme constant a0. Ce test peut aussi tre men par
un classique test de Student.
Test dgalit de coefficients. Hypothse H0 : a1 = a3 a1 a3 = 0 .
La contrainte scrit Ra = r avec R = (0 1 0 1 . . . 0 0 0)
et r = (0 0 0 0 . . . 0 0 0) .
Test de significativit globale de la rgression.
Hypothse H0 : a1 = a2 = a3 = = ak = 0 .
Ce test de Fisher (cf. quation [17]) est quivalent lcriture contrainte Ra = r
avec R = (0 1 1 11 1) et r = (0 0 0 00 0 0) .
De manire quivalente, nous pouvons utiliser la statistique :
F =

(SC Rc SC R)/q
o SC Rc est la somme des carrs des rsidus du
SC R/(n k 1)

modle contraint.
Une autre manire de procder consiste comparer le ratio de vraisemblance1 du modle contraint et non contraint : si la contrainte est valide, nous
devons avoir L c < L nc o L nc est la fonction de vraisemblance du modle non
contraint et L c est la fonction de vraisemblance du modle contraint. Soit
L c /L nc < 1 , sous forme logarithmique Ln(L c ) Ln(L nc ) < 0 ou encore
lc lnc < 0 , la diffrence entre les logarithmes des fonctions doit tre significativement ngative. On dmontre que ce test se ramne un test du 2 par calcul
de la statistique L R = 2(lc lnc ) qui suit un 2 r degrs de libert ( r tant
le nombre de contraintes). Ainsi, si L R est suprieur au 2 lu dans la table au
seuil choisi et r degrs de libert, on rejette lhypothse H0, les restrictions
ne sont pas vrifies.
Enfin, nous pouvons citer le test du multiplicateur de Lagrange ( L M test )
fond sur lestimation dune quation intermdiaire et de la valeur dune statistique L M = n R 2 (n = nombre dobservations et R 2 = coefficient de dtermi1. Dans un modle de rgression classique, la maximisation de la fonction de vraisemblance fournit des estimations identiques celle de la mthode des MCO.

74  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 75

nation issu de lestimation de lquation intermdiaire) qui suit un 2 r degrs


de libert ( r tant le nombre de contraintes) ; nous verrons des applications de
cette statistique au chapitre 5 concernant les tests de dtection de lautocorrlation des erreurs et de lhtroscdasticit.

V. Lutilisation de variables indicatrices1


A. Constitution et finalits des variables indicatrices
Une variable indicatrice est une variable explicative particulire qui nest compose que de 0 ou de 1. Cette variable est utilise lorsque, dans un modle, nous
dsirons intgrer un facteur explicatif binaire : le phnomne a lieu ou na pas
lieu pour corriger, par exemple, dune valeur anormale ; ou bien lorsque le facteur explicatif est qualitatif : le genre dun individu, homme ou femme . Il
sagit donc dincorporer une ou des variables explicatives supplmentaires au
modle spcifi initialement et dappliquer les mthodes classiques destimation.
Le modle de rgression diffre selon lapparition du phnomne par les valeurs
dun ou plusieurs coefficients alors que les autres paramtres sont identiques. En
cas de modification structurelle dun coefficient de rgression, la variable muette
affecte alors le coefficient de la ou des variables explicatives considres.
Par exemple, soit le modle deux variables explicatives x1t et x2t :
yt = a0 + a1 x1t + a2 x2t + b0 Dt + b1 Dt x1t + b2 Dt x2t + t

Si le phnomne existe, Dt = 1 et Dt = 0 sinon.


Si Dt = 0 , le modle scrit : yt = a0 + a1 x1t + a2 x2t + t
Si Dt = 1 , le modle scrit : yt = (a0 + b0 ) + (a1 + b1 )x1t + (a2 + b2 )x2t + t
Si b1 = b2 = 0 , le modle ne diffre que par la valeur du terme constant.
Domaine dutilisation des variables indicatrices.
Le domaine dutilisation des variables indicatrices est trs vaste, nous pouvons citer : la correction des valeurs anormales (cf. exercice n 4), la modification structurelle (0 pour la priode avant le changement structurel, 1 aprs le
changement structurel), lintgration de la saisonnalit (cf. exercice n 6), la
caractrisation dun individu (genre, situation matrimoniale), lintgration de
facteurs qualitatifs (appartenance dun pays la zone euro, promotion non quantifiable), etc.
1. Les termes de variables indicatrices, de variables auxiliaires ou de variables muettes sont indiffremment employs en franais. Le terme anglo-saxon dummy est le plus couramment
utilis.

Le modle de rgression multiple  75

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 76

B. Exemples dutilisation
1) Correction de valeurs anormales
Les sries statistiques sont parfois affectes de valeurs anormales lies la survenance dvnements exceptionnels : grve, guerre, aberration climatique, etc.
Deux problmes se posent alors : dtecter la valeur anormale et la corriger afin
quelle ne perturbe pas lestimation statistique des autres variables.

Exercice n 4
Dtection et correction de valeurs anormales par variable indicatrice
Un modle de production de service du secteur du tourisme est spcifi de la manire suivante :
Q P St = a0 + a1 V At + a2 P O Pt + t
avec :
Q P St = production du secteur tourisme pour lanne t ;
V At

= valeur ajoute du secteur tourisme pour lanne t ;

P O Pt = population pour lanne t .


Lconomtre charg de lestimation de ce modle sur 18 ans sinterroge sur la perturbation entrane par leffet dune guerre pour lanne 16. Pour rpondre cette question, il intgre son modle de base une variable indicatrice Dt tel que :
Dt = 0 pour t = 1 15 et t = 17 18
Dt = 1 pour t = 16
Lestimation du modle conomtrique est la suivante :
Q P St = 2 340,4 + 23,5 V At + 0,3 P O Pt 120,56 Dt + et
(4,5)
(2,2)
n = 18
R 2 = 0,65
() = t de Student

(2,9)

(5,8)

Leffet guerre a-t-il une influence significative sur la production du service du


secteur du tourisme ?

76  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 77

Solution
0,05
La variable indicatrice Dt a un ratio de Student de t = 5,8 > t14
= 2,14 , le coefficient de rgression de cette variable est significativement diffrent de 0, la production
de service pour lanne 16 est donc anormalement basse (120,56) . Cette baisse est,
sans doute imputable leffet de la guerre.

Gnralisation
Dans le cas dun phnomne se produisant de manire sporadique, la variable indicatrice prend la valeur 1 pour la ou les priodes que lon dsire corriger et 0 pour les
autres.
Nous remarquons que nous pouvons procder au test de Chow (stabilit du modle
sur lensemble de la priode) en recourant une variable indicatrice prenant la valeur 1
pour la premire sous-priode et la valeur 0 pour la deuxime sous-priode. Le test de
Student portant sur le coefficient de la variable indicatrice permet alors de se dterminer sur un modle un rgime ou un modle deux rgimes.

2) Variable qualitative
Il peut savrer important dans certaines spcifications de modle de tenir compte de leffet, sur la variable endogne, de variables qualitatives : tre titulaire
dun diplme, genre dun individu, appartenance politique, etc. Lutilisation
dune variable indicatrice permet de segmenter les individus en deux groupes et
de dterminer si le critre de segmentation est rellement discriminant.
Attention, dans le cas de variables qualitatives plusieurs modalits, par
exemple la couleur des yeux (bleu, vert, marron, autres), ou bien la situation
familiale (clibataire, mari, divorc, veuf, autres), etc. Il convient alors de
coder autant de variables indicatrices que de modalits moins une. En reprenant
lexemple de la couleur des yeux nous dfinissons trois variables indicatrices :
bleu (= 1 si lindividu les yeux bleus, 0 sinon), vert (= 1 si lindividu les yeux
verts, 0 sinon), marron (= 1 si lindividu les yeux marrons, 0 sinon), le cas des
autres individus nappartenant pas lune des trois premires catgories est
implicitement contenu dans le terme constant. Une erreur ne pas commettre
consiste crer une seule variable explicative code, par exemple, de la manire suivante : bleu = 1, vert = 2, marron = 3,
Au chapitre 12 nous traitons du cas particulier des variables qualitatives qui
figurent en tant que variables expliquer.

Le modle de rgression multiple  77

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 78

Exercice n 5
Intgration dune variable qualitative
Afin de dterminer les facteurs explicatifs de la russite de la licence en sciences
conomiques, on spcifie le modle suivant :
N L = a0 + a1 N D + a2 DS +
o :
N L = note moyenne obtenue en licence,
N D = note moyenne obtenue en fin de deuxime anne,
DS = variable indicatrice de genre (1 pour les hommes et 0 pour les femmes).
Lestimation partir dun chantillon de 60 tudiants conduit aux rsultats suivants :
N L = 8,5 + 0,3 N D 1,2 DS + e
(4,5 ) (7,1)
(2,3)
n = 60
R 2 = 0,72
() = t de Student
Le fait dtre homme ou femme a-t-il une influence sur la note obtenue en licence
de sciences conomiques ?
Solution
La variable indicatrice DS a un ratio de Student de
0,05
t = 2,3 > t57
= 1,96

le coefficient de rgression a2 est significativement diffrent de 0, le facteur sexe est


donc bien un facteur discriminant de la note obtenue en licence. La probabilit critique,
associe au risque de premire espce (risque de rejeter lhypothse H0 tort), est gale
0,025. Nous avons donc 2,5 % de risque de nous tromper en rejetant lhypothse H0.
Le risque derreur est trs faible, nous la rejetons.
Il est noter que le coefficient ngatif indique quil est pnalisant dtre un
homme (DS = 1) et quen moyenne, sur notre chantillon, les hommes ont une note
infrieure de 1,2 point celle des femmes.
Toutefois le facteur explicatif le plus important reste bien la note obtenue en fin de
deuxime anne (t = 7,1) .

78  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 79

3) Analyse de saisonnalit

Exercice n 6

fichier C3EX6

tude de saisonnalit par variables indicatrices


Une entreprise cherche apprhender une relation entre ses ventes et ses dpenses
publicitaires. Le directeur du marketing dispose des donnes (tableau 7) de ventes et de
dpenses publicitaires sur 5 ans par trimestre.
1) Ce directeur du marketing commence par estimer la relation :
Vt = a0 + a1 Pubt + t
Commenter les rsultats obtenus.
2) Tracer le graphique de la srie des ventes, que pouvez-vous en conclure ?
3) Spcifier et estimer le modle adquat.
Tableau 7 Ventes et dpenses publicitaires
T1

T2

T3

T4

164
34
168
45
197
75
223
78
298
89

198
36
201
67
209
78
245
81
309
82

85
32
98
76
100
72
119
84
124
81

179
29
197
75
216
75
260
83
267
83

Annes
1
2
3
4
5

Ventes
Pub.
Ventes
Pub.
Ventes
Pub.
Ventes
Pub.
Ventes
Pub.

Solution
1) Lestimation du modle de rgression simple
Vt = a0 + a1 Pubt + t
conduit aux rsultats suivants :
Vt = 104,89 + 1,29 Pubt + et
(1,85)
n = 20
R 2 = 0,16
() = t de Student
La publicit a-t-elle un effet significatif sur les ventes ? La valeur du ratio du Student
empirique permet de rpondre cette question.
0,05
t = 1,85 < t18
= 2,10 le coefficient a1 nest pas significativement diffrent
de 0, la publicit na pas, a priori, dimpact sur les ventes.

Le modle de rgression multiple  79

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 80

2) Le graphique 1 de la srie des ventes et des dpenses publicitaires indique une srie
des ventes fortement saisonnire avec un creux trs affirm au troisime trimestre
alors que la variable publicit ne semble pas affecte de variations saisonnires.
La relation entre les ventes et la publicit ne peut tre dtermine puisque le mouvement saisonnier vient occulter lestimation conomtrique1. Il convient donc dintgrer ce mouvement saisonnier laide de variables muettes.
3) Le modle tenant compte de ce mouvement saisonnier scrit :
Vt = a0 + a1 Pubt + a2 D1t + a3 D2t + a4 D3t + t
avec D1t = variable indicatrice du trimestre 1 : cette variable est compose de 0, sauf
pour les premiers trimestres pour lesquels la valeur 1 figure ; D2t = variable indicatrice
du trimestre 2 : cette variable est compose de 0, sauf pour les deuximes trimestres pour
lesquels la valeur 1 figure ; D3t = variable indicatrice du trimestre 3 : cette variable est
compose de 0, sauf pour les troisimes trimestres pour lesquels la valeur 1 figure.

Graphique 1 Srie des ventes et de dpenses publicitaires


La variable indicatrice du quatrime trimestre ne doit pas tre incorpore au modle. En effet, nous aurions dans le cas de son existence
D1t + D2t + D3t + D4t = U
U tant le vecteur unit qui serait par construction colinaire au vecteur unit du terme
constant, ce qui rendrait la matrice X  X singulire (non inversible).
La valeur du coefficient saisonnier du quatrime trimestre est donc implicitement
incorpore la valeur du terme constant.
Nous pourrions, dans une solution alternative, utiliser les quatre variables indicatrices et procder une rgression sans terme constant. Les donnes utilises pour lestimation sont prsentes dans le tableau 8.
Lestimation du modle est la suivante :
Vt = 129,10 + 1,37 Pubt 7,21 D1t + 8,87 D2t 118,6 D3t + et
(3,97)

(0,38)

(0,47)

(6,25)

1. Dans un modle conomtrique, les variables doivent tre non saisonnires ou Corriges des
Variations Saisonnires (CVS).

80  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 81

n = 20
R 2 = 0,83
() = t de Student
Les dpenses publicitaires, dont le ratio de Student est gal 3,97, sont maintenant
explicatives1 des ventes ; la variable indicatrice D3t est la seule variable muette significative (t = 6,25), ce qui implique que la saisonnalit des ventes est lie essentiellement au creux du troisime trimestre.
Tableau 8 Variables indicatrices
pour une dsaisonnalisation trimestrielle
Vt

Pubt

D1t

D2t

D3t

164
198
85
179
168
201
98
197
197
209
100
216
223
245
119
260
298
309
124
267

34
36
32
29
45
67
76
75
75
78
72
75
78
81
84
83
89
82
81
83

1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0

0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0

0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0

T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4

VI. La prvision laide du modle


linaire gnral et la rgression rcursive

A. Prdiction2 conditionnelle
Le problme consiste dterminer quelle valeur doit tre attribue la variable
endogne lorsque nous connaissons les valeurs des variables exognes.
1. Ceci est noter : dans un modle, labsence dune ou de plusieurs variables explicatives importantes peut entraner une mauvaise estimation des variables figurant dj dans le modle.
2. Il ne sagit pas toujours de prvoir une valeur dans le futur, mais dans le cadre de sries temporelles de simuler le pass ou bien dans les modles en coupe instantane de prdire des
valeurs.

Le modle de rgression multiple  81

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 82

Le modle gnral estim est le suivant :


yt =
a0 +
a1 x1t +
a2 x2t + . . . +
ak xkt + et

La prvision pour la donne t + h (respectivement i + h pour les modles en


coupe instantane) est la suivante :

yt+h =
a0 +
a1 x1t+h +
a2 x2t+h + . . . +
ak xkt+h

Lerreur de prvision est donne par :


et+h = yt+h
yt+h

Considrant que les hypothses du modle linaire gnral sont vrifies, la


prvision
yt+h est sans biais.
Nous avons postul que nous connaissons sans erreur les valeurs en t + h
des variables explicatives. Si pour un modle en coupe instantane cette hypothse est raliste, il nen est pas de mme dans les modles en sries temporelles
pour lesquelles les valeurs futures des variables explicatives sont estimes avec
imprcision et donc introduisent un lment supplmentaire dincertitude dans
le calcul de la prvision. Ce problme est exclu du champ de notre analyse,
puisque nous traitons de prdiction conditionnelle.

B. Fiabilit de la prvision et intervalle de prvision


Lerreur de prvision calcule en t lhorizon h peut scrire aussi :

et+h = yt+h
yt+h = X t+h
(a
a ) + t+h

 
(a
a ) + t+h
Calculons la variance de cette expression : V (et+1 ) = V X t+h

X t+h
(a
a ) est une combinaison linaire des yt et puisque t+h est sans corrla
 
(a
a ),t+h = 0 .
tion avec les yt , nous avons Cov X t+h
 

(a a)
+ V (t+h )
On a alors : V (et+h ) = V X t+h
!
 



V X t+h
(a a)
= X t+h
V (a a)X
t+h = 2 X t+h
(X  X)1 X t+h

= 2 (X  X)1 ) )
(puisque V (a)
On connat : V (t+h ) = 2
La variance de lerreur de prvision est donc gale :
2

et+h
= 2 [X t+h
(X  X)1 X t+h + 1]

Avec X t+h

[18]

1
x1t+h

=
x2t+h vecteur des valeurs prvues des variables explicatives.
...
xkt+h

82  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 83

Or lerreur de prvision (et+h = yt+h


yt+h ) est distribue suivant une loi nor2
male N (0, et+h
) , en remplaant la variance thorique 2 par la variance empirique
2 dans lexpression [18], nous pouvons en dduire que :

yt+h yt+h
suit une loi de Student n k 1 degrs de libert.


[X t+h
(X  X)1 X t+h + 1]1/2

Nous remarquons que, comme pour le modle de rgression simple, la variance de lerreur de prvision est dautant plus faible lorsque :
la variance rsiduelle est faible ;
les valeurs prvues des variables explicatives se rapprochent de leur
moyennes.
Lintervalle au seuil (1 ) de la prvision est alors :
"
/2

yt+h =
yt+h tnk1

2 [X t+h
(X  X)1 X t+h + 1]

[19]

Exercice n 7

fichier C3EX1

Prvision partir du modle linaire


En reprenant les donnes de lexercice 1 (tableau 1), on demande :
1) destimer le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t (puisque nous avons montr que la variable x3 nest
pas significative) ;
2) de calculer une prvision et son intervalle 95 % pour les priodes 15 et 16, sachant
que :
x1 15 = 3 ; x1 16 = 6 et x2 15 = 24 ; x2 16 = 38
Solution
1) Lestimation du modle deux variables explicatives conduit aux rsultats suivants :
yt = 25,84 + 0,715x1,t 0,328x2,t + et
(0,26)
(0,13)
n = 14
R 2 = 0,687
(.) = Ecart type

= 2,538
Nous remarquons les t de Student suprieurs 2,201, les coefficients a1 et a2 sont
significativement diffrents de 0.
2) La prvision pour la priode 15 est calcule partir du modle estim :

Le modle de rgression multiple  83

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 84


y15 = 25,84 + 0,71 x1 15 0,33 x2 15 = 25,84 + 0,71 3 0,33 24

y15 = 20,25
De mme, pour la priode 16, on obtient :

y16 = 25,84 + 0,71 x1 16 0,33 x2 16 = 25,84 + 0,71 6 0,33 38

y16 = 17,26
Les carts types de lerreur de prvision sont donns par [18] :
2


e15
=
2 [X 15
(X  X)1 X 15 + 1] . Nous devons calculer (X  X)1, les autres lments tant connus.

14
85
532

X X = 85
631
3 126 (X  X)1 =
532 3 126 20 666

5,707687 0,16341
0,12221
= 0,16341
0,011001
0,002542
0,12221
0,002542
0,002809

1
5,707687 0,16341
0,1222

e215 = (2,538)2 (1 3 24) 0,16341
0,011001
0,002542 3 + 1

0,12221

2

e15

0,002542

0,0022809

24

= 6,44 [0,94 + 1] = 12,53


e15 = 3,54

De mme, nous pouvons dterminer :


2
= 6,44 [0,071 + 1] = 6,90
e16 = 2,62

e16
Les intervalles de prvision peuvent tre calculs par [19] :
#
/2

yt+h =
yt+h tnk1
2 [X t+h
(X  X)1 X t+h + 1]
0,025
y15 =
y15 t1421

e15 = 20,05 2,201 3,54
0,05
I C15
= [12,26 ; 27,84] , la prvision pour la priode 15 a 95 % de chances de se
situer dans cet intervalle et la prvision de la priode 16 :
0,05
= [11,49 ; 23,03]
I C16

Les intervalles de la prvision semblent assez larges, cependant il convient de souligner que la distribution de probabilit suit une loi de Student et qu ce titre la valeur
la plus probable demeure la valeur centrale (la prvision estime) et que la probabilit
dapparition diminue lorsque lon sloigne de cette valeur centrale.
Nous remarquons que lcart type de lerreur de prvision de la priode 16 est infrieur celui de la priode 15. Cela est la consquence des valeurs des variables explicatives pour la priode 16 que nous avons choisies sensiblement gales leur moyenne.

C. Les tests de stabilit par la rgression rcursive


On appelle rgression rcursive la procdure qui consiste estimer une succession de rgressions en augmentant progressivement le nombre dobservations.

84  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 85

On estime dabord le modle avec les k + 2 premires observations (modle


un degr de libert) puis on incorpore lobservation suivante et on re-estime le
modle, et ainsi de suite jusqu n (le nombre dobservations total disponible).
Un simple examen graphique de lvolution des coefficients du modle
assortis de leurs intervalles de confiance deux carts types permet ventuellement de dterminer des changements structurels.
Les tests du CUSUM sont fonds sur la dynamique de lerreur de
prvision.
Ces tests permettent de dtecter les instabilits structurelles des quations de
rgression au cours du temps. Contrairement au test de Chow, ils ne ncessitent
pas de connatre a priori la date de modification structurelle. Lide gnrale de
ces tests est dtudier lvolution au cours du temps de lerreur de prvision normalise, on appelle rsidu rcursif cette succession derreur de prvision calcule en t 1 pour t.
Le rsidu rcursif wt au temps t est donc dfini comme le rapport :
de lcart entre la prvision calcule en t 1 pour t et la ralisation en t,
et une variable dchelle1 calcule pour cette mme priode t,
soit :
wt =

et = yt
yt xt
at1
yt
=#
Se
 X
1
(1 + xt (X t
1 t1 ) x t )

avec t = K + 2,K + 3,K + 4,. . . , n(K = k + 1 est le nombre total de paramtres estims du modle). Ce rsidu rcursif suit donc une loi normale N (0, 2 ) .
Soit les deux tests :
le CUSUM (CUmulative SUM) fond sur la somme cumule des rsidus
rcursifs,
le CUSUM SQ fond sur la somme cumule du carr des rsidus rcursifs.
partir du rsidu rcursif wt , on calcule la statistique CUSUM :
Wt =

t
nK 
wj
SC R j=K +2

avec t = K + 2,. . . , n(K = k + 1 est le nombre total de paramtres estims du


modle) et SCR la somme des carrs des rsidus calcule partir du modle n
observations.
Si les coefficients sont stables au cours du temps, alors les rsidus
rcursifs
doivent
rester dans lintervalle dfini par les deux droites : [K , n K ] et
[n, 3 n K ] avec = 1,143 0,948 et 0,850 respectivement pour des
seuils de confiance de 1 %, 5 % et 10 %. Dans le cas contraire, le modle est
rput instable.

1. On remarque quil sagit de la formule [18], hormis la variance rsiduelle.

Le modle de rgression multiple  85

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 86

La statistique du CUSUM SQ est donne par le carr du rsidu rcursif :


t


St =

w2j

j=K +2
n


avec t = K + 2,. . . ,n et 0  St  1 ;
w

2
j

j=K +2

ce test permet de dtecter des modifications alatoires (ponctuelles) dans le


comportement du modle. Si les coefficients sont stables au cours du temps,
alors les rsidus rcursifs carrs doivent rester dans lintervalle dfini par :


(t K )
C
nK

o C est la statistique de Kolmogorov-Smirnov1.

D. Le test de spcification de Ramsey


Le test de Ramsey, aussi appel le test de RESET (Regression Error
Specification Test), porte sur la pertinence de la forme fonctionnelle du modle,
telle que :
une relation fonctionnelle non adapte (passage aux logarithmes, fonctions
inverses) entre la variable expliquer et les variables explicatives ;
labsence dune variable explicative dans le modle ;
la corrlation entre la variable explicative et le terme derreur ;

Plutt que destimer des spcifications alternatives (par exemple linaire ou non
linaire), le test porte sur la significativit dun ou des coefficients dune quation intermdiaire dans laquelle figure la srie expliquer ajuste et leve la
puissance 2, 3, 4 Le test RESET est men en trois tapes :

1) Estimation par les MCO du modle initial et calcul de la srie ajuste :


yt = a 0 + a 1 x1 + a 2 x2 + . . . + a k xk

2) Estimation par les MCO de lquation intermdiaire :


yt = b0 + b1 x1 + b2 x2 + . . . + bk xk + 2 yt2 + 3 yt3 + . . . + h yth + vt

1. Pour la table, cf. Johnston J. et Dinardo J., pages 379-380, 1999.

86  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 87

3) Test de lhypothse H0 : 2 = 3 = . . . = h par un classique test de Fisher


dun sous-ensemble de coefficients (ou si h = 2, par un test de Student portant
sur le coefficient unique, H0 : 2 = 0 ).
Si lhypothse H0 est accepte, le modle est bien linaire et il nexiste pas
de problme de spcification.

Exercice n 8

fichier C3EX1

Tests de stabilit structurelle, Test de spcification de Ramsey


Soit les donnes de lexercice 1 (tableau 1) et le modle :
yt = a0 + a1 x1t + a2 x2t + t
On demande :
1) partir dune rgression rcursive de tester un ventuel changement structurel en
examinant la stabilit des coefficients et en procdant aux tests CUSUM ;
2) De procder au test de spcifications de Ramsey.
Solution
1) Stabilit des coefficients
Nous procdons lestimation des coefficients a0 , a1 et a2 avec leur intervalle de
confiance deux carts types, sur 4, 5, , 14 observations, soit 11 coefficients diffrents.
Le programme Eviews (C3EX8) est en tlchargement.
Les graphiques 2, 3 et 4 illustrent lvolution des trois coefficients partir de la septime observation ; en effet compte tenu du degr de libert trs faible, lestimation de
lcart type des coefficients (et donc lintervalle de confiance) pour les trois premiers
calculs nest pas significatif.

Graphique 2 volution de a0 et de son intervalle de confiance deux carts types

Le modle de rgression multiple  87

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 88

Graphique 3 volution de a1 et de son intervalle de confiance deux carts types


0,4
0,2
0
0,2
0,4
0,6
0,8
1,0
7

10

11

12

13

14

Graphique 4 volution de a2 et de son intervalle de confiance deux carts types


Nous constatons que les trois coefficients restent toujours dans leur intervalle de
confiance, nous rejetons lhypothse dun changement structurel.
Tests CUSUM
Les tests CUSUM et CUSUM SQ peuvent tre effectus directement sur Eviews :

Graphique 5 Test CUSUM pour un seuil de confiance de 5%

88  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 89

Graphique 6 Test CUSUM SQ pour un seuil de confiance de 5%


Hormis la priode 9 du test CUSUM pour laquelle nous constatons un trs lger
franchissement de lintervalle de confiance, les statistiques CUSUM et CUSUM SQ
restent dans leur intervalle ; l encore nous rejetons donc lhypothse dun changement
structurel. Ces rsultats sont en conformit avec ceux de lexercice n3 (test de Chow).
2) Le test de Ramsey est conduit de la manire suivante :
Calculer la srie expliquer ajuste : yt = 25,84 + 0,71x1t 0,33x2t
lever au carr la srie expliquer : yt2 = ( yt )2 , nous ne testons quune spcification
non linaire de type quadratique.
Estimer le modle en ajoutant comme variable explicative supplmentaire yt2 :
yt = b0 + b1 x1t + b2 x2t + 2 yt2 + t
Effectuer le test dhypothses H0 : 2 = 0 (H1 : 2 = 0 ). La probabilit critique du
coefficient 2 est gale 0,827. Nous acceptons lhypothse H0, le modle est donc correctement spcifi.
Le test de Ramsey peut tre effectu directement sur Eviews :
Ramsey RESET Test :
F-statistic

0.049866

Probability

0.827792

Coefficient

Std. Error

t-Statistic

Prob.

16.40322

42.74223

0.383771

0.7092

X1

0.326961

1.759415

0.185835

0.8563

X2

0.150146

0.809298

0.185526

0.8565

0.015484

0.069342

0.223308

0.8278

Test Equation :
Dependent Variable : Y
Included observations : 14
Variable
C

FITTED^2 =

yt2

Remarque : La F -statistique est gale F = 0,0498 = (t )2 = (0,223)2 .

Le modle de rgression multiple  89

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 90

VII. Exercices rcapitulatifs

Exercice n 9
Estimation dun modle et tests de validit partir de la connaissance de quelques lments statistiques
Sur n = 100 observations et pour trois sries (y, x1 et x2 ), nous avons les rsultats
numriques suivants :
2
2
2
V (y) = 1 000 ; r y,
x1 = 0,75 ; r x1, x2 = 0,45 ; r y, x2 = 0,85 ; y = 12

y = 10 x1 6.
1) Nous avons effectu la rgression :
Le coefficient de x1 est-il significativement diffrent de 0 ?
2) La rgression de y sur x2 a donn
y = 4 x2 + 8 , le coefficient de x2 est-il significativement diffrent de 0 ?
3) Calculer les coefficients du modle : y = a0 + a1 x1 + a2 x2 + , et le coefficient de
corrlation multiple.
4) Les coefficients a1 et a2 sont-ils significativement diffrents de 0 ? La rgression estelle globalement significative ?
Solution
1) La variance estime du coefficient de rgression est donne par :

2

a2 = 
(x1t x 1 )2
t

Nous savons que dans le cadre de la rgression simple, il y a galit entre corrlation simple et corrlation multiple, soit :
2


(yt y)(x1t x 1 )
Cov (y, x1 )2
t
2

r y, x1 =
= 
V (y) V (x1 )
(yt y)2
(x1t x 1 )2

t
t
et2
t
2
= R =1 
= 0,75
(yt y)2
Or :
V (y) = 1 000 =


(yt y)2
t


(yt y)2
=

100


(yt y)2 = 100 000
t

Nous utilisons ici la formule de la variance dune population (division par n) et non
la formule de la variance dun chantillon (division par n 1).
Do :

et2 = (1 0,75) 100 000 = 25 000
2 = 25 000/(n 2) = 255,1
t

90  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:12

Page 91

Pour calculer la variance de x1 , nous utilisons les relations :



(yt y)(x1t x 1 )
t


= 10
a=
(x1t x 1 )2
t


2

(yt y)(x1t x 1 )

et

2


r y,
= 0,75
x1 =
(yt y)2
(x1t x 1 )2
t


Connaissant
(yt y)2 = 100 000 , nous trouvons :
t



(x1t x 1 )2 = 750 et
(yt y)(x1t x 1 ) = 7 500
t

Soit : Var (x1 ) = 7,5 et Cov (y, x1 ) = 75



2
255,1
10
=

a2 = 
= 0,34 t =
= 17,14 > t 0,05 = 1,96
2
750
0,58
(x1t x 1 )
t

Le coefficient de rgression de y sur x1 est significativement diffrent de 0.


2) Un calcul analogue pour lcart type du coefficient de rgression de y sur x2 conduit
aux rsultats suivants :


et2 = (1 0,85) 100 000 = 15 000


2 = 15 000/98 = 153,06


(x2t x 2 )2 = 5 312,5
t

et


(yt y)(x2t x 2 ) = 21 250
t

Soit : Var (x2 ) = 53,12 et Cov (y, x2 ) = 212,50



2
153,06
4
=

a2 = 
= 0,03 t =
= 23,5 > t 0,05 = 1,96
5 312,5
0,17
(x2t x 2 )2
t

Le coefficient de rgression de y sur x2 est significativement diffrent de 0.


3) Calculer les coefficients du modle :
y = a0 + a1 x 1 + a2 x 2 +
Nous avons la relation daprs les quations normales (cf. section II, p. 50) :



a1

a2


=

Var(x1 )
Cov(x1 , x2 )

Cov(x1 , x2 )
Var(x2 )

1

Cov(y, x1 )
Cov(y, x2 )

Le modle de rgression multiple  91

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 92

Nous connaissons tous les lments de ce calcul sauf Cov(x1 , x2 ), or :


2


(x1t x 1 )(x2t x 2 )

2
r x1,
x2 =

[Cov(x1 , x2 )]2
t

= 0,45
= 
V(x1 ) V(x2 )
(x1t x 1 )2
(x2t x 2 )2
t

Var(x1 ) = 7,5 et Var(x2 ) = 53,12 Cov(x1 , x2 ) = 13,389 , en effet la covariance


entre x1 et x2 est positive puisque les covariances entre y et x1 , et y et x2 sont positives.



a1

a2


=

7,5
13,39

13,39
53,12

1 

 
0,242
75
=
0,061
212,5

0,061
0,034




 
5,19
75
=
2,69
212,5

Le terme constant est donn par


a0 = y
a1 x 1
a2 x 2 .
a1 = 5,19 ;
a2 = 2,69 , de plus x 1 = 1,8 car y = 10 x 1 6 (modle 1)
Or y = 12 ;
a0 = 0,032 .
et x 2 = 1 car y = 4 x 2 + 8 (modle 2)
Le coefficient de dtermination est gal, si lon raisonne sur des donnes centres, :


7 500
(5,19
2,69)
 Y

Y
96 087,5
a X  Y
21 250

R2 =  =
=
=
= 0,96

2
Y Y
Y Y
100 000
(yt y)
t

 Y
= (X
a) =
a  X  (X (X  X)1 X  Y ) =
a X  Y
Car Y
a ) (X
Le coefficient de corrlation multiple est gal R = 0,98
4) Analyse des rsultats et tests statistiques.
Significativit des coefficients
Pour calculer les ratios de Student, il convient dabord de connatre les carts types
de chacun des coefficients.

1
1
Var(x1 )
Cov(x1 , x2 )
2
2

1
2

ai =
(X X) =

Cov(x1 , x2 ) Var(x2 )
n

Or :
(yt y)2
(1 R 2 )
2
)
SC
T
SC
R
(1

R
(1 0,96) 100 000
t

2 =
=
=
=
nk1
nk1
nk1
100 2 1

2 = 41,23
2

a1
= 41,23

0,242
5,19

= 0,097
a1
= 16,4 > t 0,05 = 1,96
= 0,316 t =
100
0,316

2

a2
= 41,23

0,034
2,69

= 0,014
a2
= 22,8 > t 0,05 = 1,96
= 0,118 t =
100
0,118

Les coefficients a1 et a2 sont significativement diffrents de 0. Nous pouvons observer des diffrences par rapport aux valeurs estimes prcdemment, sur les coefficients
et sur leurs carts types. Cela est la consquence de la colinarit1 entre x1 et
x2 (r x1, x2 = 0,67) .

92  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 93

Analyse de la rgression dans son ensemble


Nous calculons la statistique de Fisher :
F =

(1

R 2 /k
0,96/2
0,05
= 3,10
=
= 1 164 > F2,97
k 1)
(1 0,96)/97

R 2 )/(n

La rgression est globalement significative.

Exercice n 10
Test dune combinaison linaire de coefficients de rgression (test de
contrainte linaire)
Pendant 23 ans nous avons relev, sur une parcelle de terre situe en Auvergne, les
rendements de la culture de bl (y) , la temprature moyenne (x1 ) et le niveau des prcipitations (x2 ) .
Lajustement de ce modle conduit aux rsultats suivants :
y = 0,510 x1 0,350 x2 + 27,3 + e
n = 23
R 2 = 0,937

0,0009
(X  X)1 = 0,08
0,3
et

SC T =

0,08
0,0025
0,02

0,3
0,02
0,2


(yt y)2 = 317,46
t

On demande de tester les deux hypothses suivantes :


1) Existe-t-il une influence dau moins un des facteurs ?
2) Le coefficient de la temprature est-il significativement deux fois plus lev que celui
des prcipitations ?
Solution
1) Nous procdons au test de Fisher :
H0 : a1 = a2 = 0

1. Les diffrents aspects de la colinarit sont tudis au chapitre 4.

Le modle de rgression multiple  93

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 94

H1 : il existe au moins un des coefficients non nul


R 2 /k
0,937/2
0,05
= 3,49
F =
=
= 148,731 > F2,20
2
(1 R )/(n k 1)
(1 0,937)/20
Nous rejetons lhypothse a1 = a2 = 0 , il existe au moins un des coefficients non nul.
2) Le test dhypothses est le suivant1 :
H0 : a1 2 a2 = 0
H1 : a1 2 a2 = 0
Sous H0, le rapport
libert.

(
a1 2
a2 ) 0
suit une loi de Student n k 1 degrs de

a12

a2

a2 ) :
Il convient tout dabord de calculer la variance de (
a1 2
On rappelle que Var(a x + b y) = a 2 Var(x) + b2 Var(y) + 2a b Cov(x,y) (a et b
sont deux nombres rels ; x et y sont deux variables alatoires).
a2 ) = Var(
a1 ) + Var(2
a2 ) + 2 Cov(
a1 , 2
a2 )
Var(
a1 2
a2 ) = Var(
a1 ) + (2)2 Var (
a2 ) + 2 2 Cov(
a1 ,
a2 )
Var(
a1 2
De plus, la variance rsiduelle est donne par :


et2 = (1 R 2 ) SC T = (1 0,937) 317,46


2 = 20/(n 3) = 1

Do

2
2
2
a1
a2
a1 ,
a2 )

a12

a2
=
+4
4 Cov (
2

a12

a2
= 0,0009 + 4 0,0025 4(0,08) = 0,33

a2 ) 0
(
a1 2
(0,51 + 2 0,35)
0,05
=
= 2,08
= 2,10 > t20

a12
0,57

a2

Nous rejetons (de justesse !), au seuil de 5 %, lhypothse H0. Cependant, pour un
seuil de 4 %, lhypothse H0 est accepte.
Remarque : Nous pouvons aussi procder ce test en calculant la statistique


a1 2
a2 2
qui suit un 2 1 degr de libert ; cest ainsi que ce test de restriction

a 1 2 a 2
linaire sur les coefficients du modle peut tre gnralis des restrictions non linaires
(test de Wald). Par analogie, prenons par exemple une contrainte du type



a1
a2 2
a1 a2 = 1 , la statistique
suit un 2 1 degr de libert. Cependant, la

a 1 a 2
variance de (
a1
a2 ) nest plus directement calculable, elle est alors estime par une
approximation de Taylor. Sans procder deux estimations diffrentes, lune sur le
modle non contraint et lautre sur le modle contraint (cf. exercice 3), le test de Wald
permet, donc en une seule tape, de tester des restrictions sur les valeurs des coefficients.
Les logiciels dconomtrie proposent directement ce test.

1. Nous pouvons rpondre cette question par un test danalyse de la variance (section IV).

94  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 95

Exercice n 11
Reconstitution dinformations manquantes
Un conomtre recherche une relation entre le taux de mortalit (TX), les dpenses
de sant (DS), le pourcentage de plus de 60 ans dans la population (POP) et la densit de
mdecins (DM).
Une estimation sur 10 pays effectue partir du logiciel RATS conduit aux rsultats
suivants (les donnes ont t pralablement centres sur leur moyenne) :

(X X)

0,0034229
= 0,00074442
0,018265

0,1031686
0,125482

????

1) On demande de calculer les valeurs manquantes notes par : ???.


2) Les coefficients des dpenses de sant et de la densit mdicale sont-ils respectivement et simultanment diffrents 0,10 et 0,30 ?
Solution
1) Les rsultats complets sont les suivants :

(X  X)1

0,0034229
= 0,00074442
0,018265

0,1031686
0,125482

0,26286

Le modle de rgression multiple  95

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 96

2) Le test dhypothses est le suivant :


  

a1
0,1
H0 :
=
0,3
a3

  
0,1
a1
=
H1 :
0,3
a3
La relation [15] sous H0 scrit :
1
1 (
(
aq aq )
aq
aq aq )
q





0,103
0,1
et aq =
. La matrice des variances
0,318
0,3
covariances des coefficients est gale :

0,0034229
a = 0,0482 0,00074442


0,1031686
0,018265
0,125482
0,26286
Nous avons q = 2 ,
aq =

do :
aq

= 0,0482

0,0034229
0,018265

0,018265
0,26286

1 =

aq

F =

1
(0,103 0,1
2

0,318 0,3)

9632,962
669,3578

9632,962
669,3578

669,3578
125,4386



669,3578
125,4386

0,103 0,1
0,318 0,3

0,05
F = 0,172 est comparer F (q, n k 1) = F2,7
= 4,74 , le F empirique
est infrieur au F lu dans la table, on accepte lhypothse H0.

Les coefficients a1 et a3 sont simultanment et respectivement gaux 0,1 et 0,3.

Exercice n 12
Modle deux rgimes : estimation par variable muette
ou par analyse de la variance
Nous reprenons lexercice 6 du chapitre 2 concernant la relation liant la rmunration et la dure des tudes. Nous disposons dun chantillon de 40 hommes et 25 femmes
ayant le mme ge dont nous connaissons la rmunration annuelle (yi ) et le nombre
danne dtudes (xi ) .

96  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 97

Pour tudier linfluence du genre sur la rmunration, nous avions compar les coefficients de rgression.
1) Quel type de variable peut-on introduire pour tudier cet effet ?
2) Nous avons procd trois estimations :
sur lchantillon global et nous obtenons : SC R ;
sur lchantillon des 40 hommes

: SC Rh ;

sur lchantillon des 25 femmes

: SC R f .

Comment construire le test dhomognit ?

Solution
1) Une variable muette prenant la valeur 1 pour les hommes et 0 pour les femmes permet
destimer leffet du genre sur la rmunration. Si le coefficient de cette variable indicatrice est significativement diffrent de 0, alors le genre est un facteur discriminant.
2) Il sagit dune application du test de Chow un modle en coupe instantane (test
dhomognit de comportement).
Le Fisher empirique est gal :
F =

[SC R (SC Rh + SC R f )]/ddln


(SC Rh + SC R f )/ddld

avec ddln = (n k 1) [(n 1 k 1) + (n 2 k 1)] = 2


ddld = (n 1 k 1) + (n 2 k 1) = n 2(k + 1) = 65 4 = 61
Si F < F 0,05 = 3,15 , lhypothse H0 est accepte, les coefficients sont stables sur
lensemble de lchantillon ; dans le cas contraire, il existe une diffrence significative
entre la rmunration des hommes et des femmes (cest le cas ici, cf. les rsultats de
lexercice 6, chapitre 2).
Nous avons donc dvelopp trois mthodes diffrentes danalyse pour rpondre la
mme question.

Exercice n 13

fichier C3EX13

Estimation dune fonction de production : impact de la privatisation


Soit une fonction de production de type Cobb-Douglas :
Log Q = Log a0 + a1 Log K + a2 Log L + t
Q = production
K = facteur capital

Le modle de rgression multiple  97

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 98

L = facteur travail
t = terme derreur rpondant aux hypothses classiques.
Nous disposons de donnes concernant 50 entreprises du secteur des tlcommunications en Europe pour une anne donne. Le tableau 9 prsente un extrait des donnes.
Tableau 9 Extrait des donnes de production, facteur travail, facteur capital
et variable indicatrice
Entreprise

DU M

1
2

5 192 511

11 523

4 610

8 717 373

22 476,2

6 948

49

3 701 601

10 147,4

4 760

50

440 380

835

248

1) crire le modle sous sa forme originale, cest--dire non linaire. Comment sinterprtent les coefficients a1 et a2 de ce modle ?
2) On dsire mesurer lhomognit des comportements entre les entreprises publiques
et les entreprises prives, pour ce faire nous intgrons une variable muette (nomme
DUM) qui prend les valeurs 0 pour les entreprises publiques et 1 pour les entreprises prives.
Soit estimer le modle suivant :
Log Q = Log a0 + a1 Log K + a2 Log L + b0 DU M + b1 DU M Log K
+ b2 DU M Log L +
Existe-t-il une diffrence des fonctions de production entre les entreprises publiques
et prives ? Si oui, pouvez-vous la quantifier ?
3) Proposer et expliciter une autre mthode afin de tester lhomognit des comportements des entreprises.
4) Nous proposons maintenant destimer une fonction de production de type
Translog en ngligeant les spcificits public/priv :
Log Q = Log a0 + a1 Log K + a2 Log L + a3 0,5 (Log K )2
+ a4 0,5 (Log L)2 + a5 Log L Log K +
La spcification Translog vous semble-t-elle mieux adapte que la spcification
Cobb-Douglas ? Vous justifierez votre rponse par un test appropri.

Solution
1) le modle sous sa forme initiale scrit : Q = a0 K a1 L a2 e
Les coefficients sinterprtent comme tant des lasticits :
a1 = lasticit de la production au facteur capital
a2 = lasticit de la production au facteur travail

98  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 99

Il sagit dun modle linaire sur ses coefficients, cest--dire non linaire sous sa
forme initiale mais linarisable par une simple transformation logarithmique, le modle
est Log-linaire.
2) Les rsultats destimation sont les suivants :
Dependent Variable : LOG(Q)
Included observations : 50
Variable

Coefficient

Std. Error

t-Statistic

Prob.

6.477194

0.287830

22.50358

0.0000

LOG(L)

0.230860

0.143231

1.611803

0.1142

LOG(K)
DUM

0.747993

0.143545

5.210878

0.0000

1.018567

0.457088

2.228384

0.0310

DUM*LOG(L)

0.212946

0.241356

0.882290

0.3824

DUM*LOG(K)

0.091142

0.225917

0.403431

0.6886

Les variables LOG(L), DUM*LOG(L) et DUM*LOG(K) ne sont pas significatives


(probabilits critiques suprieures 5 %) nous commenons par retirer du modle la
moins significative DUM*LOG(K). La nouvelle estimation est la suivante.
Dependent Variable : LOG(Q)
Included observations : 50
Variable

Coefficient

Std. Error

t-Statistic

Prob.

6.517159

0.267719

24.34327

0.0000

LOG(L)

0.266781

0.111144

2.400321

0.0206

LOG(K)

0.711198

0.109808

6.476720

0.0000

1.072324

0.433148

2.475654

0.0171

0.118229

0.055440

2.132570

0.0385

DUM
DUM*LOG(L)

Les variables sont maintenant toutes significatives, nous constatons que les variables
indicatrices DUM sont explicatives : il existe donc une diffrence significative entre les
fonctions de production des entreprises publiques et prives.
Pour les entreprises publiques, la fonction de production scrit (DUM = 0) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K + e
Pour les entreprises prives, la fonction de production scrit (DUM = 1) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K 1,07DU M
+ 0,11DU M Log L + e
Log Q = 5,44 + 0,384 Log L + 0,711 Log K + e
Nous remarquons que le facteur travail contribue plus la production pour les entreprises du secteur priv que pour les entreprises du secteur public.

Le modle de rgression multiple  99

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 100

3) Nous pouvons procder au test de Chow en segmentant notre chantillon entre les
entreprises du secteur priv et les entreprises du secteur public.
(SC R (SC R Priv + SC R Publique ))/(k + 1)
(SC R Priv + SC R Publique )/(n 2(k + 1))
qui suit alors une loi de Fisher (k + 1) et n 2 (k + 1) degrs de libert.
Soit calculer la statistique : F =

SCR = somme des carrs des rsidus calcule sur la totalit de lchantillon
des 50 entreprises.
SCR Priv = somme des carrs des rsidus calcule sur les 21 entreprises prives.
SC R Publique = somme des carrs des rsidus calcule sur les 29 entreprises
publiques.
k = 2 et n = 50.
(1,853 (0,795 + 0,629))/3
0,05
2,84 . Nous rejetons
4,42 > F3;44
Soit F =
(0,795 + 0,629)/44
lhypothse H0, le modle est instable, il existe une diffrence significative entre les
fonctions de production des entreprises publiques et des entreprises prives.
4) Les rsultats destimation de la fonction Tranlog sont les suivants :

Dependent Variable : LOG(Q)


Included observations : 50
Variable

Coefficient

Std. Error

t-Statistic

Prob.

5.404574

1.957160

2.761437

0.0084

LOG(K)

1.686188

1.201063

1.403913

0.1674

LOG(L)

0.612883

1.071805

0.571823

0.5704

0.031900

0.939072

0.033970

0.9731

0.5*LOG(K)^2
0.5*LOG(L)^2
LOG(L)*LOG(K)

0.289379

1.031212

0.280620

0.7803

0.156205

0.978803

0.159588

0.8739

La fonction Translog se ramne une fonction Cobb-Douglas si a3 = a4 = a5 = 0,


soit tester lhypothse H0 : a3 = a4 = a5 = 0. Si nous rejetons lhypothse H0 (au
moins un coefficient non nul), cela signifie que la spcification Translog est mieux adapte que la spcification Cobb-Douglas. Il sagit dun test de Fisher de contrainte (test de
Wald) dun sous-ensemble de coefficients, le rsultat est le suivant :

Wald Test :
Equation : TRANSLOG
Test Statistic
F-statistic

Value

df

Probability

0.401096

(3.44)

0.7529

La probabilit critique du test est de 75 %, nous acceptons donc lhypothse H0, la


spcification Translog nest donc pas mieux adapte que la spcification Cobb-Douglas.

100  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 101

Exercice n 14
Fonction conomtrique dinvestissement
Une estimation conomtrique de la part des emprunts dans les investissements
dune importante entreprise ptrolire donne :
EMP
INVO
= 0,6645 TIR + 179,07
+ 36,31 + e
INV
INVI
(1,26)
(4,69)
R 2 = 0,65 ; n = 17 (nombre dannes de la priode destimation)
Les chiffres entre parenthses sous les coefficients sont les t de Student avec :
EMP = emprunts totaux
INV = investissements totaux
TIR = taux dintrt rel
INVO = investissements de la socit dans les forages offshore
INVI = investissements industriels
e = rsidu destimation
1) Commentez les rsultats obtenus, les coefficients des variables explicatives ont-ils le
signe attendu ?
2) Quel est leffet dun passage de 13 % 15 % de INVO/INVI sur la variable endogne ?
3) Le coefficient de la variable TIR nest pas significativement diffrent de zro. Quelle
explication conomique peut-on donner ce rsultat ?
4) On estime de nouveau ce modle en retirant la variable TIR, les rsultats sont les suivants :
INVO
EMP
= 162,15
+ 41,28 + e
INV
INVI
(7,20)
R 2 = 0,57
Pourquoi a-t-on retir la variable explicative TIR (donnez deux raisons possibles de
la non-significativit statistique de cette variable) ?
Le coefficient de dtermination a diminu, est ce fortuit ?
Les coefficients du modle sont lgrement diffrents de la premire estimation,
pourquoi ?
5) Lestimation conomtrique de lquation de la question 4 permet-elle de donner une
approximation du taux dautofinancement de cette entreprise ? Donner le cas chant
une valeur lorsque INVO/INVI = 13%.

Le modle de rgression multiple  101

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 102

Solution
1) Le taux demprunt dpend :
ngativement du taux dintrt, ce qui est conforme lintuition conomique ; mais
le coefficient de cette variable nest pas significativement diffrent de 0
0,05
= 2,14) ;
(t = 1,26 < t14
positivement de linvestissement dans les forages offshore, ce qui est logique car
linvestissement dans les forages offshore est trs important ; le coefficient est signi0,05
= 2,14).
ficativement diffrent de 0 (t = 4,69 > t14
2) Par application du modle estim, il vient :

EMP
= 179,07 (0,15 0,13) = 3,58
INV

3) La compagnie ptrolire doit pratiquer lautofinancement, donc il nexiste pas de sensibilit au taux dintrt.
4) La variable explicative TIR nest pas significative car elle nest peut tre pas assez
corrle avec la variable expliquer ou bien colinaire avec lautre variable explicative.
Le coefficient de dtermination a diminu car le fait de retirer une variable explicative mme non significative fait augmenter mcaniquement la Somme des Carrs des
Rsidus.
Les coefficients du modle sont lgrement diffrents car la colinarit entre les
variables explicatives entraine une modification de la valeur estime des coefficients.
5) Par application du modle estim il vient :
EMP
= 162,15 0,13 + 41,28 = 62,35
INV
Autofinancement 100 62,35 = 37,65 %

Annexe
A. Interprtation gomtrique de la mthode
des moindres carrs
Soit les vecteurs Y , X 1 , X 2 ,. . . , X k composs de n lments que nous pouvons donc
reprsenter dans R n.
Nous cherchons minimiser :
n

Min
t2 = Min  = Min (Y Xa) (Y Xa) = Min S
t=1

102  CONOMTRIE

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Avec X = (X 1 , X 2 ,. . . , X k ) .

Page 103

a0
a1


Le vecteur Xa = (X 1 , X 2 ,. . . , X k ) a2 appartient au sous-espace vectoriel
.
..
ak

(L) de R n engendr par X 1 , X 2 ,. . . , X k .


La quantit S est minimale lorsque le vecteur e = Y Xa est orthogonal au sousespace (L) .
Le graphique 7 illustre ce propos.

Graphique 7 Interprtation gomtrique de la rgression multiple

B. Rsolution de lexercice 1 par des logiciels


informatiques de rgression multiple
Logiciel RATS

Le modle de rgression multiple  103

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 104

Nous retrouvons bien lensemble des rsultats de lexercice 1.


Logiciel Eviews

Tableur EXCEL
par la fonction DROITEREG
0.03713
0.052023
0.702687
7.878181
159.4095

0.38136
0.156581
2.597069
10
67.44767

0.801901
0.298436
#N/A
#N/A
#N/A

32.89132
11.66331
#N/A
#N/A
#N/A

Interprtation et correspondance des informations issues du tableau EXCEL



a3

a 3
R2
F
SC E


a2

a 2

ddl
SC R


a1

a 1
#N/A
#N/A
#N/A


a0

a 0
#N/A
#N/A
#N/A

Par lutilitaire danalyse Rgression Linaire (Macro-complmentaire)


RAPPORT DTAILL
Statistiques de la rgression
Coefficient de dtermination multiple
Coefficient de dtermination R^2
Coefficient de dtermination R^2 (ajust)
Erreur-type
Observations

104  CONOMTRIE

0,838
0,702
0,613
2,597
14

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 105

ANALYSE DE VARIANCE

Rgression
Rsidus
Total
Constante
X1
X2
X3

Degr
de libert
3
10
13

Somme
des carrs
159,409
67,447
226,857

Moyenne
des carrs
53,1368
6,74476

Coefficients
32,891
0,80190
0,3813
0,0371

Erreur-type
11,663
0,298
0,156
0,05202

Statistique t
2,820
2,687
2,435
0,713

F
7,8786

Probabilit
0,0181
0,0228
0,0351
0,4916

C. Estimation de la variance de lerreur


La variance de lerreur est inconnue, nous allons donc lestimer partir de la somme des
carrs des rsidus.
Soit : e = Y X a = Y X (X  X)1 X  Y = PY avec P = I X (X  X)1 X  .
Cette matrice P est symtrique et idempotente (P 2 = P) . Elle est aussi telle que
P X = 0 et Pe = e .
e = PY = P(Xa + ) = P puisque P X = 0.
Do lesprance de lerreur est donne par : E(e e) = E( P  P) = E( P) car
(P = P) .
2

En utilisant le fait que la trace1 dun scalaire est un scalaire, il vient :


E( P) = E[Trace( P)] = E[Trace( P)]
= 2 Trace(P) = 2 Trace(I X (X X)1 X  )
= 2 Trace(I )2 Trace[X (X  X)1 X  ]
= 2 Trace(I )2 Trace[(X  X)1 (X  X)] = 2 (n(k + 1)) = 2 (nk1) .
Trace(I ) = n et Trace[(X  X)1 (X  X)] = k + 1 car (X  X) est de dimension
(k + 1,k + 1).
Do lestimateur de la variance de lerreur (appele aussi la variance rsiduelle)
scrit donc :

et2

ee
t
2
=
=
nk1
nk1

1. La trace dune matrice est gale la somme des valeurs de la premire diagonale.

Le modle de rgression multiple  105

9782100721511-Bourbo-C03.qxd

20/10/14

15:13

Page 106

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 107

4. Multicolinarit

et slection
du modle optimal

ans ce chapitre, nous examinons comment grer labondance de


linformation. En effet, il est frquent, lorsque lconomiste spcifie un modle, quil hsite intgrer telle ou telle variable
explicative. La question essentielle quil se pose est la suivante : comment
dterminer le mix optimal des variables explicatives ? Formule en terme
statistique, cette question se rsume trouver les variables explicatives
qui maximisent leur coefficient de corrlation avec la srie expliquer,
tout en tant les moins corrles entre elles.
Nous prsentons, en I., tout dabord la notion de corrlation partielle qui
permet de dterminer lapport relatif de chaque srie explicative lexplication de la srie endogne.
Les relations entre les coefficients de corrlation simple, partielle et multiple sont examines en II.
Les consquences de la multicolinarit sur lestimation des coefficients
de rgression font lobjet du III.
Enfin, les techniques de slection de variables explicatives sont exposes
et illustres partir dexemples en IV.

I. Corrlation partielle
A. Exemple introductif
Un marchand de glaces, situ prs de la tour Eiffel, cherche calculer le coefficient de corrlation entre ses ventes (x1 ) et le nombre de touristes visitant ce
monument (x2 ) . Ces deux variables sont influences par le climat : la consom-

Multicolinarit et slection du modle optimal  107

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 108

mation de glaces est plus importante lorsquil fait chaud et les touristes sont peu
enclins visiter un monument extrieur en cas de froid ou de pluie, on appelle
x3 cette variable climatique.
Nous pouvons penser que la corrlation entre x1 et x2 est positive, cependant
un calcul de coefficient de corrlation simple nest pas rvlateur du degr de liaison relle entre ces deux variables ; en effet, la variable climat influence la vente
des glaces et la frquentation des touristes. En dautres termes, le coefficient de
corrlation simple calcul ainsi intgre lapport de la variabilit des conditions
climatiques sans pouvoir isoler linfluence relative du nombre de touristes.

B. Gnralisation de la notion de corrlation partielle


Le coefficient de corrlation partielle mesure la liaison entre deux variables
lorsque linfluence dune ou des autres variables explicatives est retire.
Soit y une variable expliquer, et x1 , x2 et x3 des variables explicatives :
r y,2 x1 , r y,2 x2 et r y,2 x3 mesurent respectivement la variance de y explique par
la variable x1 seule, x2 seule et x3 seule.

Nous pouvons calculer six coefficients de corrlation partielle du premier


ordre :
2
2
2
2
2
2
; r yx1.x3
r yx1.x2
; r yx2.x1
; r yx2.x3
; r yx3.x1
; r yx3.x2
;
ainsi que trois coefficients de corrlation partielle du deuxime ordre :
2
2
2
r yx1.x2
r yx2.x1
r yx3.x1
x3 ;
x3 ;
x2 .

Cette notion de corrlation partielle est trs importante car elle permet de
juger de la pertinence dinclure une variable explicative dans un modle.
Plus le coefficient de corrlation partielle dune variable est lev, plus la
contribution de cette variable est importante lexplication globale du modle.
Le coefficient de corrlation partielle peut se calculer de deux manires
partir :

1) Du coefficient de corrlation simple


Entre le rsidu de la rgression de la variable expliquer sur le sousensemble des k 1 autres variables explicatives,
et le rsidu de la rgression de la variable explicative xi sur les k 1
variables explicatives.
2
Exemple de calcul de r yx3.x1
x2

tape 1 : calcul de rsidu e1 de la rgression de y sur x1 et x2


e1 = y (
a1 x 1 + 
a2 x 2 )
a0 + 

108  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 109

tape 2 : calcul de rsidu e2 de la rgression de x3 sur x1 et x2


e2 = x3 (a 0 + a 1 x1 + a 2 x2 )

tape 3 : calcul du coefficient de corrlation simple entre e1 et e2


2
2
r yx
3.x 1 x 2 = re1,e2

2) Du t de Student
Dans un modle k variables explicatives, il existe une relation entre le coefficient de corrlation partielle et le t de Student1 :
2
r yxi.(autres
variables) =

ti2
ti2 + (n k 1)

[1]

Attention : cette relation nest vrifie que pour un coefficient de corrlation


partielle dordre k 1 .

Exercice n 1

fichier C4EX1

Calcul des coefficients de corrlation partielle du premier ordre et


du deuxime ordre
Une entreprise cherche dterminer quelles sont les influences respectives de la
publicit (x1 ) , de la promotion auprs des distributeurs (x2 ) , et de la promotion auprs
des consommateurs (x3 ) exprimes en milliers deuros sur les ventes en tonnes (y) .
Pour ce faire, elle dispose, sur 10 ans, des sries statistiques du tableau 1.
Tableau 1 Ventes, publicit et promotions
Anne

x1

x2

x3

1
2
3
4
5
6
7
8
9
10

49,0
40,0
41,0
46,0
52,0
59,0
53,0
61,0
55,0
64,0

35,0
35,0
38,0
40,0
40,0
42,0
44,0
46,0
50,0
50,0

53,0
53,0
50,0
64,0
70,0
68,0
59,0
73,0
59,0
71,0

200,0
212,0
211,0
212,0
203,0
194,0
194,0
188,0
196,0
190,0

1. Greene W.H., pages 234-235, 2000.

Multicolinarit et slection du modle optimal  109

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 110

Pour rpondre cette question, on demande de calculer les coefficients de corrlation partielle du premier ordre et du deuxime ordre et de commenter les rsultats obtenus.
Solution
2
2
Nous traitons compltement le calcul de r yx1.x2
et r yx3.x1
x2 , les rsultats des autres
coefficients sont fournis afin que le lecteur puisse vrifier ses propres calculs.
2
a) Calcul de r yx1.x2
par corrlation entre les rsidus

tape 1 : rgression de y sur x2

Rsidu e1 = y (0,7809 x2 + 3,5809)


tape 2 : rgression de x1 sur x2

Rsidu e2 = x1 (0,3809 x2 + 18,3809)


tape 3 : calcul du coefficient de corrlation entre e1 et e2

1
2
3
4
5
6
7
8
9
10

e1

4,02857
4,97143
1,62857
7,56190
6,24762
2,31429
3,34286
0,40952
5,34286
4,97143

e2

3,57143
3,57143
0,57142
2,76190
5,04762
2,28571
3,14286
0,19047
9,14286
4,57143

2
2
re1,e2 = 0,6798 r yx1.x2
= re1,e2
= 0,4621

La corrlation entre les ventes et la publicit est donc gale 0,46 , lorsque linfluence de la promotion auprs des distributeurs est retire.
2
b) Calcul de r yx3.x1
x2 par corrlation entre les rsidus

tape 1 : rgression de y sur x1 et x2

110  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 111

Rsidu e1 = y (0,7368 x1 + 0,50 x2 9,9621)


tape 2 : rgression de x3 sur x1 et x2

Rsidu e2 = x3 (0,952 x1 0,304 x2 + 258,932)


tape 3 : calcul du coefficient de corrlation entre e1 et e2

1
2
3
4
5
6
7
8
9
10

e1

6,66000
2,34000
2,04960
5,52693
2,52853
3,99840
1,02720
0,54986
1,39360
1,60320

e2

9,4000
2,6000
3,5440
10,7040
3,5280
4,1760
5,0080
4,8480
2,7040
0,3520

2
2
re1,e2 = 0,921 r yx3.x1
x2 = re1,e2 = 0,848

La corrlation entre les ventes et la promotion consommateur est donc gale


0,84 , lorsque les influences de la publicit et de la promotion distributeur sont retires.
2
c) Calcul de r yx3.x1
x2 partir du t Student

tape 1 : rgression de y sur x1 , x2 et x3

Multicolinarit et slection du modle optimal  111

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 112

tape 2 : calcul du coefficient de corrlation partielle


Daprs [1], nous avons :
2
r yx3.x1
x2 =

5,792
ti2
=
= 0,848
5,792 + (10 4)
+ (n k 1)

ti2

d) Autres rsultats
2
= 0,461
r yx1.x2
2
r yx2.x3
= 0,698
2
r yx1.x2
x3 = 0,225

2
r yx1.x3
= 0,212
2
r yx3.x1
= 0,734
2
r yx2.x1
x3 = 0,703

2
r yx2.x1
= 0,480
2
r yx3.x2
= 0,895
2
r yx3.x1
x2 = 0,848

la lecture de ces chiffres, lapport intrinsque de la variable promotion consom2


= 0,734 ;
mateur semble le plus important pour expliquer les ventes : r yx3.x1
2
2
r yx3.x2 = 0,895 et r yx3.x1 x2 = 0,848 sont les trois coefficients de corrlation partielle
les plus levs.

II. Relation entre coefficients de corrlation


simple, partielle et multiple
Dans le cas dun modle une seule variable explicative x1 , la somme des carrs des rsidus est gale :
SC R =

et2 =

(yt y)2 (1 R 2y.x 1 ) =

2
(yt y)2 (1 r yx
1)

2
R y.x1
= coefficient de dtermination de la rgression de y sur x1 .

Supposons maintenant un modle deux variables explicatives :


y =
a0 + 
a1 x 1 + 
a2 x 2 + e

La somme des carrs des rsidus, aprs avoir retir linfluence de x1 et x2 , est
gale :


SC R =

et2 =

2
y.x1 x2

(yt y)2 (1 R 2y.x 1x 2 )

= coefficient de dtermination de la rgression de y sur x1 et x2 .

2
yx2.x1

Or r
est la proportion du rsidu explique par la variable x2 seule, cette
dernire expression peut donc scrire :


2
2
) = (1 r yx2.x1
)
(yt y)2 (1 R y.x1x2

Do

112  CONOMTRIE

2
)
(yt y)2 (1 r yx1

[2]

t
2
2
2
1 R y.x1
x2 = (1 r yx2.x1 )(1 r yx1 )

[3]

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 113

Nous avons ainsi la dcomposition de linfluence relative de chacune des


variables : lapport de x2 sur y lorsque linfluence de x1 est retire et lapport de
x1 sur y (certains auteurs emploient le terme de rendement pour qualifier ces
apports relatifs).
Cette formule [3] peut tre gnralise pour un modle trois variables
explicatives :
2
2
2
2
1 R y.x1
[4]
x2 x3 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 )
Pour un modle quatre variables explicatives, nous obtenons :
2
2
2
2
2
1 R y.x1
x2 x3 x4 = (1 r yx1 )(1 r yx2.x1 )(1 r yx3.x1 x2 )(1 r yx4.x1 x2 x3 )

Il est noter que les indices peuvent permuter, ainsi, dans lordre, 3, 4, 1, 2 ;
la relation prcdente devient :
2
2
2
2
2
1 R y.x1
x2 x3 x4 = (1 r yx3 )(1 r yx4.x3 )(1 r yx1.x3 x4 )(1 r yx2.x1 x3 x4 )

Exercice n 2
Relation entre coefficients de corrlation simple, partielle et multiple
Un conomtre estime un modle trois variables explicatives :

y = 348,4 + 56,3 x1 9,5 x2 + 234,8 x3
(4,5)

(8,3)

(2,1)

(4,6)

R = 0,76
2

n = 65
(.) = t de Student
2
Le coefficient de corrlation linaire entre y et x1 est connu, r yx1
= 0,52 .
2
On demande de calculer le coefficient de corrlation partielle r yx2.x1
.

Solution
2
Le coefficient r yx3.x1
x2 est gal :

2
ta3

2
ta3
4,62

=
2
4,6 + (65 4)
+ (n k 1)

2
r yx3.x1
x2 = 0,257

Nous pouvons alors utiliser la relation suivante :


2
2
2
1 R 2y.x1 x2 x3 = (1 r yx1
)(1 r yx2.x1
)(1 r yx3.x1
x2 )
2
1 0,76 = (1 0,52)(1 r yx2,
x1 )(1 0,257)
2
do r yx2.x1
= 0,324

Multicolinarit et slection du modle optimal  113

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 114

III. Multicolinarit :
consquences et dtection
Le terme de multicolinarit est employ dans le cas dun modle incorporant
des sries explicatives qui sont lies entre elles.
loppos, pour des sries explicatives de covariance nulle (Cov (x1 , x2 ) = 0) ,
nous dirons quelles sont orthogonales. Si, pour des tudes thoriques, nous
pouvons supposer que deux sries statistiques sont orthogonales, dans la pratique, lorsque lconomiste modlise des phnomnes conomiques, les sries
explicatives sont toujours plus ou moins lies entre elles. Nous allons donc examiner les consquences de la multicolinarit.

A. Consquences de la multicolinarit
Nous pouvons citer trois effets principaux :
a) augmentation de la variance estime de certains coefficients lorsque la
colinarit entre les variables explicatives augmente (le t de Student diminue) ;
b) instabilit des estimations des coefficients des moindres carrs, des faibles
fluctuations concernant les donnes entranent des fortes variations des
valeurs estimes des coefficients ;
c) en cas de multicolinarit parfaite, la matrice X  X est singulire (le dterminant est nul), lestimation des coefficients est alors impossible et leur
variance est infinie.

Exercice n 3
Consquences de la multicolinarit
Soit un modle deux variables explicatives dont les matrices X  X et X  Y sont
calcules partir dun chantillon dobservations de variables centres.

X X =

114  CONOMTRIE

200
150

150
113


X Y =

350
263

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 115

La suppression dune observation modifie les rsultats de la manire suivante :






199 149
347,5
X Y =
X X =
149 112
261,5
On demande :
1) de calculer les coefficients de rgression du modle dans les deux cas ;
2) puis de calculer le coefficient de corrlation entre x1 et x2 ;
3) de commenter les rsultats.
Solution
1) Calcul des coefficients de rgression
a) Estimation des coefficients partir des donnes de base. Les quations normales
scrivent :

200 
a1 + 150 
a2 = 350
a1 = 1


150 
a1 + 113 
a2 = 263
a2 = 1
b) Estimation des coefficients aprs suppression dune observation. Les quations
normales scrivent :

199 
a1 + 149 
a2 = 347,5
a1 = 0,5


149 
a1 + 112 
a2 = 261,5
a2 = 3
2) Calcul du coefficient de corrlation
x21 ,x2 =


[Cov (x1 , x2 )]2
= 0,995 x1 ,x2 = 0,995 = 0,997
Var (x1 ) Var (x2 )

3) Commentaires : une faible modification dune des observations ou du nombre dobservations entrane une profonde modification des valeurs estimes des coefficients,
cela est la consquence directe de la trs forte colinarit entre x1 et x2 (0,997).
Afin dviter ce problme, il convient alors de dtecter une ventuelle multicolinarit lors de lestimation dun modle.

B. Tests de dtection dune multicolinarit


1) Test de Klein1
Le test de Klein est fond sur la comparaison du coefficient de dtermination R y2
calcul sur le modle k variables :
y =
a0 + 
a1 x 1 + 
a2 x 2 + . . . + 
ak x k + e
1. Klein L.R., page 101, 1962.

Multicolinarit et slection du modle optimal  115

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 116

2
et les coefficients de corrlation simple r xi,
x j entre les variables explicatives
pour i
= j .
2
Si R y2 < r xi,
x j , il y a prsomption de multicolinarit.

Il ne sagit pas dun test statistique au sens test dhypothses mais simplement dun critre de prsomption de multicolinarit.

2) Test de Farrar et Glauber1


La premire tape consiste calculer le dterminant de la matrice des coefficients de corrlation entre les variables explicatives.

 1

r
D =  x2 x1
 ...

r xk x1

r x1 x2
1
...
r xk x2

r x1 x3
r x2 x3
...
r xk x3


. . . r x1 xk 

. . . r x2 xk 

... ... 

...
1

Lorsque la valeur du dterminant D tend vers zro, le risque de multicolinarit est important.
Par exemple, pour un modle deux variables explicatives, si les deux sries
sont parfaitement corrles, le dterminant D scrit :

 1
D = 
r x2 x1

 

r x1 x2   1 1 
=
=0
1  1 1

Dans le cas oppos o les sries explicatives sont orthogonales, le dterminant devient :

 

 1
D = 
r x2 x1

r x1 x2   1 0 
=
=1
1  0 1

La deuxime tape consiste effectuer un test du 2 , en posant les hypothses suivantes :


H0 : D = 1 (les sries sont orthogonales) ;
H1 : D < 1 (les sries sont dpendantes).
La valeur empirique du 2 calcule partir de lchantillon est gale :



1
= n 1 (2 K + 5) . Ln D
6
2

o n est la taille de lchantillon, K le nombre de variables explicatives (terme


constant inclus, K = k + 1 ) et Ln le logarithme nprien.
1
2

Si 2  2 lu dans la table K (K 1) degrs de libert et au seuil choisi,


alors lhypothse H0 est rejete, il y a donc prsomption de multicolinarit.
Si 2 < 2 , alors nous acceptons lhypothse dorthogonalit.
1. Farrar D.E. et Glauber R.R., 1967.

116  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 117

Exercice n 4

fichier C4EX4

Tests de multicolinarit
Un conomiste cherche expliquer la variable y laide de quatre sries explicatives
x1 , x2 , x3 et x4 . Il dsire auparavant tester une ventuelle multicolinarit entre ces
quatre sries ; pour ce faire, il dispose des donnes du tableau 2.
Tableau 2 Ces sries statistiques sont-elles colinaires ?
y

x1

x2

x3

x4

8,40
9,60
10,40
11,40
12,20
14,20
15,80
17,90
19,30
20,80

82,90
88,00
99,90
105,30
117,70
131,00
148,20
161,80
174,20
184,70

17,10
21,30
25,10
29,00
34,00
40,00
44,00
49,00
51,00
53,00

92,00
93,00
96,00
94,00
100,00
101,00
105,00
112,00
112,00
112,00

94,00
96,00
97,00
97,00
100,00
101,00
104,00
109,00
111,00
111,00

On demande donc dappliquer les tests suivants :


1) test de Klein,
2) test de Farrar-Glauber.
Solution
1) Test de Klein
a) Rgression : y = a0 + a1 x1 + a2 x2 + a3 x3 + a4 x4 + .
Les rsultats de lestimation sont les suivants :
y = 13,53 + 0,096 x1 + 0,015 x2 0,199 x3 + 0,34 x4 + e
(1,80)

(3,66)

(0,30)

(2,20)

(2,27)

n = 10
R 2 = 0,998
(.) = t de Student
b) Calcul des coefficients de corrlation simple entre les variables explicatives :
2
r x1,
x2 = 0,976
2
r x2,
x3 = 0,938

2
r x1,
x3 = 0,960
2
r x2,
x4 = 0,938

2
r x1,
x4 = 0,974
2
r x3,
x4 = 0,982

la lecture de ces coefficients il ne semble pas ressortir des risques graves de multicolinarit puisque tous les coefficients de corrlation simple sont infrieurs au coefficient de dtermination. Toutefois, nous observons quils sont tous trs levs.

Multicolinarit et slection du modle optimal  117

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 118

2) Test de Farrar-Glauber
Calcul du dterminant


 1

r
D =  x2 x1
 r x3 x1

r x4 x1

r x1 x2
1
r x3 x2
r x4 x2

r x1 x3
r x2 x3
1
r x4 x3


r x1 x4 

r x2 x4 
=
r x3 x4 

1

1

 0,988
= 
 0,980
 0,987

0,988
1
0,969
0,969

0,980
0,969
1
0,991


0,987 

0,969 
= 0,92198 105
0,991 

1

La valeur empirique du 2 calcule partir de lchantillon est :




1
2 = n 1 (2 K + 5) Ln D
6


1
2
= 10 1 (2 5 + 5) 11,59 = 75,33
6

Cette valeur est comparer la valeur lue dans la table :


1
2 K (K 1) = 10 degrs de libert et pour un seuil = 0,05 , soit :
2
2 = 18,31
Puisque 2 > 2 , nous rejetons lhypothse H0 , il y a prsomption de multicolinarit.
Ces deux tests conduisent donc des rsultats diffrents, cependant le test de FarrarGlauber, dont le fondement thorique est plus affirm, semble devoir tre privilgi.

C. Comment remdier la multicolinarit ?


Nous ne ferons que citer les diffrentes techniques permettant dapporter des
solutions au problme de multicolinarit, le lecteur intress par les dveloppements mthodologiques peut se rapporter Judge1.
Augmenter la taille de lchantillon : cette technique nest efficace que si
lajout dobservations diffre significativement de celles figurant dj dans le
modle, sinon il y aura reconduction de la multicolinarit.
La Ridge Regression est une rponse purement numrique, il sagit de
transformer la matrice X  X en ( X  X + cI ) o c est une constante choisie arbitrairement qui, en augmentant les valeurs de la premire diagonale, rduit les
effets numriques de la multicolinarit.
1. Judge G.G. et al, pages 874-882, 1988.

118  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 119

Face ces artifices de calcul, la seule parade vraiment efficace consiste, lors
de la spcification de modle, liminer les sries explicatives susceptibles de
reprsenter les mmes phnomnes et donc dtre corrles entre elles, ceci afin
dviter leffet de masque.
Au paragraphe suivant, nous prsentons des mthodes permettant de dterminer le mix optimal de variables explicatives.

IV. Slection du modle optimal


Dans la pratique, lconomtre est souvent confront au choix de plusieurs
variables explicatives x1 , x2 , , xk candidates pour expliquer la variable y . Des
procdures statistiques permettent de dterminer quelles variables retirer ou
quelles variables ajouter dans un modle. Cette dmarche exclut tout raisonnement conomique car elle permet daboutir des modles conomtriques qui
sont souvent bons sur le plan statistique mais dont linterprtation conomique
savre nulle, voire aberrante. Ces techniques automatiques de slection de
variables explicatives sont donc manier avec prudence.
Au problme de la slection des variables explicatives sajoute celui du choix
effectuer entre plusieurs modles concurrents, cest--dire des modles dont
les variables sont toutes significatives mais qui ne sont pas les mmes.
La question se pose alors de slectionner le meilleur modle.
Le critre de maximisation du R 2 (coefficient de dtermination) consiste
retenir le modle dont le R 2 est le plus lev. Ce critre prsente linconvnient
de ne pas arbitrer entre la perte de degrs de libert du modle et lajustement
qui en rsulte. Cest pourquoi on prfre utiliser les critres de Akaike1 ou de
Schwarz2 afin de comparer des modles impliquant un nombre diffrents de
variables explicatives.
Nous retenons le modle qui minimise la fonction de Akaike (Akaike
Information Criterion) :


AI C = Ln

SC R
n

2k
n

ou de Schwarz (Schwarz Criterion) :



SC = Ln

SC R
n

k Ln (n)
n

1. Akaide H., 1973 ; 1974.


2. Schwarz, 1978.

Multicolinarit et slection du modle optimal  119

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 120

Avec :
Ln = Logarithme nprien,
SCR = somme des carrs des rsidus du modle,
n = nombre dobservations,
k = nombre de variables explicatives.
Nous allons examiner cinq mthodes qui vont nous permettre de retenir le
meilleur modle, celui qui est compos des variables qui sont :
les plus corrles avec la variable expliquer ;
les moins corrles entre elles.
Toutes les rgressions possibles
Il sagit de la mthode la plus simple dans son expos : nous estimons toutes
les combinaisons de rgressions possibles (2k 1 possibilits, k = nombre de
variables explicatives candidates) et le modle retenu est celui dont le critre de
Akaike ou de Schwarz est minimum pour un modle comportant des variables
explicatives toutes significatives. La limite dutilisation de cette mthode est lie
au nombre initial de variables explicatives candidates, par exemple si k = 10 , le
nombre de combinaisons possibles est de 1023 .
Llimination progressive ( Backward Elimination )
Cette procdure consiste, sur le modle complet k variables explicatives,
liminer de proche en proche (cest--dire en restimant lquation aprs chaque
limination) les variables explicatives dont les t de Student sont en dessous du
seuil critique. Cette procdure nest utilisable que si la premire quation peut
tre effectivement estime, ce qui nest pas toujours le cas. En effet, lorsque le
modle comporte un nombre important de variables explicatives, le risque de
colinarit entre ces variables est lev et la matrice X  X peut tre singulire.
La slection progressive ( Forward Regression )
Dans cette procdure, on slectionne, dans une premire tape, la variable
explicative dont le coefficient de corrlation simple est le plus lev avec la
variable y , soit xi cette variable. La deuxime tape consiste alors calculer les
2
coefficients de corrlation partielle r yx
pour j
= i et retenir la variable explij xi
cative ayant le coefficient le plus lev. La slection sarrte lorsque les t de
Student des variables explicatives sont infrieurs au seuil critique.
La rgression pas pas ( Stepwise Regression )
Cette procdure est identique la prcdente, sauf quaprs avoir incorpor
une nouvelle variable explicative, nous examinons les t de Student de chacune
des variables explicatives pralablement slectionnes et nous liminons du
modle celle(s) dont le t du Student est infrieur au seuil critique.

120  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 121

La rgression par tage ( Stagewise Regression )


Cest un processus de slection de variables explicatives permettant de minimiser les intercorrlations entre les sries explicatives par tude du rsidu.
1re tape
La variable explicative dont le coefficient de corrlation simple est le plus
lev avec la variable y est slectionne, soit xi cette variable.
2e tape
Calcul du rsidu de la rgression de y sur xi :
e1 = y 
a0 
a1 x i

Les coefficients de corrlation simple entre le rsidu e1 et les variables explicatives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev. Soit x j cette variable explicative.
3e tape
Nous calculons un nouveau rsidu :
e2 = y 
a0 
a1 x i 
a2 x j

Les coefficients de corrlation simple entre le rsidu e2 et les variables explicatives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev, ce qui permet de dgager un nouveau rsidu.
La procdure est arrte lorsque les coefficients de corrlation ne sont plus
significativement diffrents de 0 .

Exercice n 5

fichier C4EX4

Mthodes de slection de variables explicatives


En utilisant les cinq procdures dcrites prcdemment et en reprenant les donnes
du tableau 2, on demande de slectionner, parmi la (ou les) variable(s) explicative(s) candidate(s), celle(s) dont le pouvoir explicatif est le plus important.
Solution
a) Toutes les rgressions possibles
Nous devons estimer (2k 1 = 24 1) 15 modles.

Multicolinarit et slection du modle optimal  121

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 122

Tableau 3 Rsultats des 15 rgressions (les coefficients non significativement


diffrents de 0 sont en caractres gras, italiques)
M1

M2

M3

M4

M5

M6

M7

M8

M9

M10

M11

M12

M13

M14

M15

Sries
X1
Coefs.
0,118
t de Student 41,9
Sries
X2
Coefs.
0,327
t de Student 15,3
Sries
X3
Coefs.
0,516
t de Student 12,5
Sries
X4
Coefs.
0,663
t de Student 18,6
Sries
X1
Coefs.
0,132
t de Student 6,91
Sries
X1
Coefs.
0,126
t de Student 8,42
Sries
X1
Coefs.
0,102
t de Student 5,60
Sries
X2
Coefs.
0,209
t de Student 2,55
Sries
X2
Coefs.
0,137
t de Student 2,42
Sries
X3
Coefs.
0,166
t de Student 0,73
Sries
X1
Coefs.
0,139
t de Student 5,58
Sries
X1
Coefs.
0,115
t de Student 3,55
Sries
X1
Coefs.
0,104
t de Student 7,46
Sries
X2
Coefs.
0,164
t de Student 3,32
Sries
X1
Coefs.
0,097
t de Student 3,66

R2
AIC 1
SC
0,995 2,185 2,125

0,967 0,199 0,138

0,952 0,185

0,245

0,978 0,583 0,523


X2
0,039
0,72
X3
0,036
0,53
X4
0,090
0,86
X3
0,194
1,48
X4
0,395
3,45
X4
0,871
3,04
X2
0,038
0,66
X2
0,028
0,48
X3
0,188
2,47
X3
0,300
1,99
X2
0,015
0,30

0,996 2,058 1,967

0,996 2,026 1,936

0,996 2,087 1,996

0,975 0,273 0,183

0,988 0,993 0,903

0,979 0,457 0,366


X3
0,035
0,49
X4
0,074
0,64
X4
0,319
2,62
X4
0,720
3,81
X3
0,199
2,20

0,996 1,898 1,778

0,996 1,926 1,805

0,998 2,59 2,469

0,993 1,304 1,183


X4
0,340
2,27

0,998 2,408 1,804

1. Nous utilisons les formules de la section IV afin de calculer les critres dinformation de Akaike
et de Schwarz, le logiciel Eviews utilise des formules lgrement diffrentes.

122  CONOMTRIE

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 123

Parmi ces 15 quations, laquelle est la meilleure ?


Il faut liminer celles dont un ou plusieurs ratios de Student (sauf en ce qui concerne le terme constant dont nous acceptons quil soit non significativement diffrent
de 0) sont infrieurs au seuil critique (environ 2,30) : M5, M6, M7, M8, M10, M11,
M12, M14, M15.
Parmi les 6 quations restantes, on slectionne celle dont le critre de Akaike et de
Schwarz est le plus faible1, do M13 :
choix : x1 x3 x4
partir de cet exemple, nous prenons la dimension du travail mener2 et les limites,
donc, de cette mthode.
b) Llimination progressive
Estimation du modle complet
partir du modle estim avec 4 variables explicatives, nous retirons la variable dont
le ratio de Student est le plus faible, soit x2 .
Estimation 3 variables
Le modle estim est le modle [M13], toutes les variables sont significatives
(t > 2,30) , la procdure de slection sarrte :
choix : x1 x3 x4
c) La slection progressive
Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4
yx1 = 0,997 ; yx2 = 0,983 ; yx3 = 0,975 ; yx4 = 0,988
La premire variable slectionne est x1 .
Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 .
Modles : [M5], [M6] et [M7]. Dans ces trois modles la nouvelle variable explicative
nest jamais significative, la procdure est termine :
choix x1
d) La rgression pas pas
Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable
slectionne est x1 .
Estimation des 3 modles deux variables explicatives : x1 et x2 , x1 et x3 , x1 et x4 ,
dans chacun de ces modles au moins une des variables nest pas significative, la
procdure est donc termine et nous sommes ramens au cas prcdent :
choix x1

1. Nous constatons quil sagit aussi de lquation dont le R 2 est le plus lev.
2. Et pourtant nous navons que quatre variables explicatives candidates.

Multicolinarit et slection du modle optimal  123

9782100721511-Bourbo-C04.qxd

20/10/14

15:16

Page 124

e) La rgression par tage


Calcul des coefficients de corrlation entre y et x1 , x2 , x3 , x4 . La premire variable
slectionne est x1 .
Rgression et calcul de e1 = y + 1,24 0,11 x1 (modle [M1])

1
2
3
4
5
6
7
8
9
10

e1

0,123762
0,475231
0,127120
0,236519
0,424754
0,007913
0,419014
0,078300
0,017027
0,279659

Calcul des coefficients de corrlation entre e1 et x1 , x2 , x3 , x4


e1 x1 = 0,000 ; e1 x2 = 0,040 ; e1 x3 = 0,039 ; e1 x4 = 0,048
Le coefficient de corrlation entre e1 et x1 est par construction nul puisque linformation relative x1 nest plus contenue dans le rsidu (ou encore les vecteurs e1 et x1
sont orthogonaux).
Les autres coefficients de corrlation ne sont pas significativement diffrents de 0 , la
procdure de slection est donc termine :
choix x1
Commentaires :
Seule la procdure de llimination progressive ne fournit pas les mmes rsultats de
slection que les quatre autres procdures. Il apparat au vu de ces rsultats que si llimination progressive ne maximise pas le R 2 , elle permet, en revanche, de slectionner
une information plus abondante en terme de variables explicatives.
Dans la pratique, la procdure la plus utilise est la rgression pas pas, cest cette
dernire qui est disponible dans la plupart des logiciels dconomtrie.

124  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 125

5. Problmes particuliers :
la violation
des hypothses

e chapitre est consacr aux problmes particuliers lis au nonrespect des hypothses. Nous nous attachons particulirement
deux formes classiques :
en I., lautocorrlation des erreurs ;
en II., lhtroscdasticit.
Ltude de ces deux phnomnes nous permet de dfinir un nouvel estimateur : lestimateur des moindres carrs gnraliss, utilis lorsque la
matrice des variances et covariances de lerreur ne rpond plus aux hypothses classiques, telles que nous les avons supposes ralises jusqu
maintenant.
Pour chacun de ces deux cas, nous prsentons les mthodes dinvestigation : tests de dtection, consquences et procdures destimation.
Enfin, la section III. est consacre au cas o les variables sont observes
avec erreur.

I. Lautocorrlation des erreurs


A. Prsentation du problme
Jusqu maintenant, nous avons considr que, lors de lestimation des paramtres du modle, les hypothses suivantes sont toutes respectes.

Problmes particuliers : la violation des hypothses  125

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 126

H1 : le modle est linaire en xt .


H2 : les valeurs xt sont observes sans erreur.
H3 : E(t ) = 0 .
H4 : E(t2 ) = 2 .
H5 : E(t t  ) = 0 si t = t  .
H6 : Cov (xt , t ) = 0 .
La spcification de la matrice des variances-covariances de lerreur est :

E(1 1 )
E(2 1 )

= E( ) =
...
E(n 1 )

E(1 2 )
E(2 2 )

...
...

E(n 2 ) . . .

E(1 n )
E(2 n )
=
E(n n )

2 0
0 2
=
...
0
0

0 ...
0 ...

0
0

0 . . . 2

Lorsque lhypothse H5 nest plus vrifie, la matrice E( ) = = 2 I na


plus cette forme particulire (elle nest plus compose de 0 lextrieur de la
premire diagonale, puisque Cov (t , t  ) = 0 ) et les estimateurs obtenus par la
mthode des MCO sont sans biais mais ne sont plus variance minimale, en
effet :
a = E{(
a a)(
a a) } = (X  X)1 X  E( ) X (X  X)1 =
= (X  X)1 (X  X)(X  X)1

Cest--dire que 
a est un estimateur dont la premire diagonale de la matrice des variances et covariances est suprieure celle de 2 (X  X)1 .
Nous sommes donc amens nous poser trois questions :
Comment dterminer un nouvel estimateur pour a ?
Comment dtecter une ventuelle autocorrlation des erreurs ?
Quelles mthodes destimation doit-on utiliser ?

B. Lestimateur des Moindres Carrs Gnraliss (MCG)


Considrons le modle linaire gnral
Y
=
X
a
+

(n, 1)
(n, k + 1) (k + 1,1)
(n,1)

dans lequel E( ) = = 2 I ( est de dimension n , n ).


Nous dsirons dterminer un estimateur de a qui ait les mmes proprits
que lestimateur des MCO : sans biais, fonction linaire de Y et variance minimale. Il est dmontr que cet estimateur est donn par :

126  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 127

1

a = (X  1
(X  1
X)
Y)


a = (X

X)

[1]
[2]

Cet estimateur est appel estimateur des Moindres Carrs Gnraliss


(MCG) ou encore estimateur de Aitken.
Remarque : lorsque les hypothses classiques sont satisfaites, nous retrouvons lestimateur des MCO :
1

a = (X  1
(X  1
X)
Y) =

1
1

= X
I
X
X
I
Y = (X  X)1 (X  Y )
2
2

Dans la pratique, nous ne connaissons pas la matrice , les formules ci-dessus ne sont pas utilisables, sauf dans des cas exceptionnels. Il convient donc de
prsenter des procdures destimation oprationnelles.

C. Les causes et la dtection

de lautocorrlation des erreurs

1) Dfinition et causes
Nous sommes en prsence dune autocorrlation des erreurs lorsque les erreurs
sont lies par un processus de reproduction1. Nous pouvons distinguer lautocorrlation positive (graphique 1) qui est caractrise par des successions de
rsidus de mme signe, de lautocorrlation ngative (graphique 2) qui est caractrise par une alternance positive et ngative des rsidus.

Graphique 1 Autocorrlation positive


1. Nous pouvons parler de processus mmoire , par comparaison des processus purement
alatoires.

Problmes particuliers : la violation des hypothses  127

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 128

Graphique 2 Autocorrlation ngative

Lautocorrlation des erreurs peut tre observe pour plusieurs raisons :


labsence dune variable explicative importante dont lexplication rsiduelle permettrait de blanchir 1 les erreurs ;
une mauvaise spcification du modle, les relations entre la variable
expliquer et les variables explicatives ne sont pas linaires et sexpriment
sous une autre forme que celle du modle estim (logarithmes, diffrences
premires, etc.) ;
un lissage par moyenne mobile ou une interpolation des donnes cre une
autocorrlation artificielle des erreurs due lusage de ces deux oprateurs.
Lautocorrlation des erreurs se rencontre essentiellement dans les modles
en srie temporelle o linfluence dune erreur due une mauvaise spcification dune priode sur lautre est plausible. Dans le cas de modle spcifi en
coupe instantane, nous ne pouvons concevoir une autocorrlation des erreurs
que si les observations ont t pralablement tries en fonction croissante (ou
dcroissante) de la variable expliquer. En effet, la collecte des donnes seffectue de manire alatoire et la succession des valeurs de la variable expliquer
na donc aucune raison de gnrer une autocorrlation des erreurs.

2) Dtection
La dtection dune ventuelle dpendance des erreurs ne peut seffectuer qu
partir de lanalyse des rsidus, en effet eux seuls sont connus.
a) Examen visuel des rsidus
Lanalyse graphique des rsidus permet le plus souvent de dtecter un processus
de reproduction des erreurs lorsque :
1. Ce terme de blanchir vient de la notion de bruit blanc ( White Noise ), qui qualifie des
processus purement alatoires.

128  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 129

les rsidus sont pendant plusieurs priodes conscutives soit positifs, soit
ngatifs : autocorrlation positive (graphique 1) ;
les rsidus sont alterns : autocorrlation ngative (graphique 2).
Cependant, le plus souvent, lanalyse graphique est dlicate dinterprtation
car le dessin des rsidus ne prsente pas des caractristiques toujours videntes.
b) Test de Durbin et Watson
Le test de Durbin et Watson (DW ) permet de dtecter une autocorrlation des
erreurs dordre 1 selon la forme :
t = t1 + vt avec vt N (0, v2 )

Le test dhypothses est le suivant :


H0 : = 0
H1 : = 0
(ou < 0 ou > 0 , attention le seuil nest alors pas le mme).
Pour tester lhypothse nulle H0, nous calculons la statistique de Durbin et
Watson :
n

DW =

t=2

(et et1 )2
n

[3]
2
t

t=1

o et sont les rsidus de lestimation du modle.


De par sa construction, cette statistique varie entre 0 et 4 et nous avons
DW = 2 lorsque
 = 0 (
 est le observ). Afin de tester lhypothse H0,
Durbin et Watson ont tabul les valeurs critiques de DW au seuil de 5 % en fonction de la taille de lchantillon n et du nombre de variables explicatives (k ). La
lecture de la table permet de dterminer deux valeurs d1 et d2 comprises entre 0
et 2 qui dlimitent lespace entre 0 et 4 selon le schma 1 :

Schma 1 Interprtation du test de Durbin et Watson

Selon la position du DW empirique dans cet espace, nous pouvons conclure :


d2 < DW < 4 d2 , on accepte lhypothse H0 = 0 ;
0 < DW < d1 , on rejette lhypothse
H0 > 0 ;

Problmes particuliers : la violation des hypothses  129

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 130

4 d1 < DW < 4 , on rejette lhypothse H0 < 0 ;


d1 < DW < d2 ou 4 d2 < DW < 4 d1 ;
nous sommes dans une zone dindtermination, ou zone de doute, cest--dire
que nous ne pouvons pas conclure1 dans un sens comme dans lautre.
Le graphique 3 illustre ces rgles de dcision.

Graphique 3 Densits de probabilit de d1 et d2

Conditions dutilisation :
le modle doit comporter imprativement un terme constant2 ;
la variable expliquer ne doit pas figurer parmi les variables explicatives (en
tant que variable retarde), il faut alors recourir la statistique h de Durbin
(cf. chapitre 7, I. B.) ou au test de Breusch-Godfrey (cf. ci-dessous) ;
pour les modles en coupe instantane, les observations doivent tre ordonnes en fonction des valeurs croissantes ou dcroissantes de la variable
expliquer ou dune variable explicative souponne tre la cause de lautocorrlation ;
le nombre dobservations doit tre suprieur ou gal 15.
Le test de Durbin et Watson est un test prsomptif dindpendance des
erreurs du fait quil utilise les rsidus ; de plus, il ne teste quune autocorrlation dordre 13.
c) Test de Breusch-Godfrey4
Ce test, fond sur un test de Fisher de nullit de coefficients ou de Multiplicateur
de Lagrange ( LM test , cf. chapitre 3), permet de tester une autocorrlation
1. Dans la pratique, on accepte lhypothse la plus dsastreuse ! Cependant il serait licite daccepter lhypothse dindpendance.
2. Les tables de DW sont gnralement tabules pour des modles comportant un terme constant,
cependant il existe des tables pour des modles sans terme constant.
3. Cela signifie que le test de Durbin et Watson ne dtecte pas une autocorrlation dordre suprieur
1 , par exemple entre t et t + 4 pour une srie trimestrielle qui ne serait pas dsaisonnalise.
4. Breusch (1978) et Godfrey (1978).

130  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 131

dun ordre suprieur 1 et reste valide en prsence de la variable dpendante


dcale en tant que variable explicative. Lide gnrale de ce test rside dans la
recherche dune relation significative entre le rsidu et ce mme rsidu dcal.
Une autocorrlation des erreurs dun ordre p scrit :
t = 1 t1 + 2 t2 + . . . + p t p + vt

Soit le modle gnral erreurs autocorrles dordre p :


yt = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 t1 + 2 t2 + . . . + p t p + vt

Ce test est men en trois tapes :


Estimation par les MCO du modle et calcul du rsidu et , puisque les
erreurs sont inconnues, le test porte sur les rsidus.
Estimation par les MCO de lquation intermdiaire :
et = a1 x1t + a2 x2t + . . . + ak xkt + a0 + 1 et1 + 2 et2 + . . . + p et p + vt

Soit n le nombre dobservations disponibles (attention chaque dcalage


entrane la perte dune observation) pour estimer les paramtres du modle et R 2
le coefficient de dtermination. Certains auteurs prconisent, afin de ne pas
perdre dobservations, de mettre 0 les premires valeurs du rsidu dcal. La
diffrence nest perceptible que pour des petits chantillons.
Test dhypothses sur lquation intermdiaire.
Lhypothse H0 dabsence dautocorrlation des erreurs tester est :
H0 : 1 = 2 = . . . = p = 0
Si on refuse lhypothse nulle, alors il existe un risque dautocorrlation des
erreurs lordre p .
Pour mener ce test, nous avons deux possibilits : soit effectuer un test de Fisher
classique de nullit des coefficients i (cf. chapitre 3), soit recourir la statistique
LM qui est distribue comme un 2 p degrs de libert ; si n R 2 > 2 ( p) lu
dans la table au seuil , on rejette lhypothse dindpendance des erreurs.
d) Tests de Box-Pierce et Ljung-Box
Ces tests prsents au chapitre 9 (section I. C.) permettent de tester un ensemble
de coefficients dautocorrlation des rsidus dun ordre gal ou suprieur 1.

Exercice n 1

fichier C5EX1

Tests dindpendance des erreurs


Soit le modle trois variables explicatives :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t

Problmes particuliers : la violation des hypothses  131

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 132

Nous disposons des observations annuelles (tableau 1) sur 20 ans :


Tableau 1 Donnes annuelles (extrait)
Anne

x1

x2

x3

1
2

19
20

87,40
97,60

110,70
127,10

98,60
101,20

105,30
107,60

99,10
99,10

93,00
106,60

108,5
110,1

108,5
111,3

Nous nous proposons de dceler une ventuelle autocorrlation dordre 1 des erreurs,
pour cela on demande :
1) destimer les coefficients du modle ;
2) deffectuer lanalyse graphique des rsidus ;
3) de calculer la statistique de Durbin et Watson et deffectuer le test ;
4) enfin, deffectuer le test de Breusch-Godfrey.

Solution
1) Les rsultats de lestimation partir de Eviews sont les suivants :
Dependent Variable : Y
Included observations : 20
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
X1
X2
X3

242.7951
3.897408
0.404365
0.878886

26.79995
0.400325
0.061351
0.240216

9.059538
9.735616
6.590977
3.658727

0.0000
0.0000
0.0000
0.0021

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.938895
0.927438
3.186826
162.4937
49.32784
1.053794

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

97.53500
11.83048
5.332784
5.531931
81.94784
0.000000

Les trois coefficients des variables explicatives sont significativement diffrents de 0


0,05
0,05
(t16
= 2,12 ), le Fisher empirique est suprieur au Fisher lu (F3,16
= 3,24 ), le modle
semble satisfaisant.

132  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 133

2) Eviews fournit directement le graphique des rsidus.

Lanalyse de ce graphique rvle des rsidus qui semblent cycliques, ceci est symptomatique dune autocorrlation positive des rsidus.
3) Les conditions dutilisation du test de Durbin et Watson sont bien respectes : le
modle est spcifi en srie temporelle, le nombre dobservations (n = 20 ) est
suprieur 15 et, enfin, le modle estim comporte un terme constant.
Le calcul de la statistique partir des rsidus est alors :
n

(et et1 )2

DW =

t=2

=
et2

171,23
= 1,053
162,49

t=1

Cette valeur est comparer celles lues dans la table de Durbin et Watson n = 20
et k = 3 , soit d1 = 1,00 et d2 = 1,68 . La valeur DW se situe dans la zone de doute
(d1 < DW < d2 incertitude), cependant proximit immdiate de la zone de rejet de
H0, nous pouvons plutt conclure une autocorrlation positive des rsidus, donc une
prsomption de dpendance des erreurs.
4) Les donnes tant annuelles, nous testons une autocorrlation dordre 2, un ordre
suprieur deux ans ne semble pas justifi. Nous estimons donc le modle :
et = a1 x1t + a2 x2t + a3 x3t + a0 + 1 et1 + 2 et2 + vt
Soit : et = 17,26 + 0,5287x1t 0,0369x2t 0,3149x3t + 0,589 et1 0,497et2
avec : R 2 = 0,33 et n = 18 (car nous avons perdu deux observations du fait du dcalage).

Problmes particuliers : la violation des hypothses  133

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 134

2
L M = n R 2 = 18 0,33 = 5,94 < 0,05
(2) = 5,99 , nous sommes la limite dacceptation de lhypothse H0 pour un seuil de 5 %.

Nous testons alors un ordre 1, soit lestimation suivante :


et = 11,82 + 0,087 x1t 0,0158 x2t 0,044 x3t + 0,507 et1
2
avec : R = 0,196 et n = 19 , do L M = 19 0,196 = 3,72 < 0,05
(1) = 3,84 .
2

Nous sommes, l encore, la limite dacceptation (probabilit critique c = 5,37 %)


de lhypothse H0, compte tenu de toutes ces informations (test de Durbin-Watson, test
de Breusch-Godfrey), nous sommes enclins accepter lhypothse dautocorrlation des
erreurs.
Les estimateurs que nous avons trouvs sont sans biais mais non variance minimale, il convient donc de dterminer une procdure adquate destimation.
Il est noter que tous les commentaires de la question 1 concernant la validit statistique du modle sont maintenant caducs.

D. Les procdures destimation en cas


dautocorrlation des erreurs

1) Principes gnraux
Si nous retenons lhypothse dune autocorrlation des erreurs dordre 1, le
modle linaire scrit :
Y = Xa +

avec

t = t1 + vt

|| < 1

[4]

(processus autorgressif dordre 1 : AR(1) )1 o vt N (0; v2 ) et E(vt vt  ) = 0


pour t = t  .
En procdant par substitution successive de [4], nous obtenons :
t = ( t2 + vt1 ) + vt = 2 t2 + ( vt1 + vt )
t = vt + vt1 + 2 vt2 + 3 vt3 + . . .

[5]

Ce processus tend vers 0 puisque || < 1 .


Nous allons tudier les proprits de t .

1. On note les processus autorgressifs par : AR( p) , o p est lordre du processus autorgressif.
Le chapitre 9 est consacr ltude gnrale de ce type de processus.

134  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 135

E(t ) = E(t1 + vt ) = E(t1 ) + E(vt ) = 0


2
E(t2 ) = E(t1 + vt )2 = 2 E(t1
) + E(vt2 ) car vt est indpendant de t .
2
) = 2 .
La variance de t tant homoscdastique, nous avons : E(t2 ) = E(t1

2 (1 2 ) = v2 2 =

Soit :

v2
(1 2 )

[6]

Cov(t ,t+1 ) = E(t ,t+1 ) = E(t ,(t + vt+1 )) = 2


Cov(t ,t+2 ) = E(t ,t+2 ) = E(t ,(t+1 + vt+2 )) = E(t ,t+1 ) = 2 2

Cov(t ,t+i ) = E(t ,t+i ) = i 2 =

i v2
(1 2 )

La matrice des variances-covariances de lerreur dans ce cas est alors :

2
v 2
= E( ) =

1 2 . . .
n1

n2

n3

. . . n1
. . . n2

. . . n3 avec = 1

...

Lestimateur des MCG est gal daprs [1] :


1

a = (X  1
(X  1
X)
Y)

1

1
0
= 2
v . . .

0
0

1 + 2

...
...

1 + 2

0
0

...
...
...

...
...
...

. . . 1 + 2
0

0
0

Cependant, nous ne connaissons ni le terme , ni la variance v2 ; nous allons


donc chercher une transformation matricielle M telle que le modle
MY = M Xa + M ait ses erreurs indpendantes et homoscdastiques.
Soit :
E(M(M) ) = E(M  M  ) = M E(  ) M  = M M  = v2 I

Dans ce cas, on peut dterminer lestimateur BLUE de a par la mthode des


MCO :

a = ((M X) M X)1 (M X) MY = (X  M  M X)1 X  M  MY

[7]

Problmes particuliers : la violation des hypothses  135

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 136

En identifiant terme terme [1] et [7] on obtient :


2 1
M  M = 1
puisque si lgalit [1] = [7] est vrifie pour
= v
1
M M = , elle lest aussi pour 1
quel que soit .


La matrice

M
=
0
(n 1, n)
...
0

0
1

0
0
1

...
...

...

0
0

remplit cette condition puisque :

0

M M =
...

0
0

1 + 2

1 + 2

...
...

0
0

...
...
...
. . . 1 + 2
0

0
0

et v2 1
sont identiques au premier terme prs 2 au lieu de 1 .

Ainsi, nous pouvons substituer la mthode des MCG, la mthode des MCO
(si n est suffisamment grand) applique au modle linaire MY = M Xa + M
qui nest autre que le modle initial dans lequel les variables sont transformes
par un passage aux quasi-diffrences premires1. En effet :

y2 y1
xk2 xk1
y y2
xk3 xk2
MY = 3
et M X k =

...
...
yn yn1
xkn xkn1

Cas particulier : lorsquil y a autocorrlation parfaite ( = 1) , nous


sommes amens appliquer la mthode des MCO sur le modle en diffrences
premires.
Nous allons montrer partir dun exemple le bien-fond de la transformation
en quasi-diffrences.
Soit le modle deux variables explicatives :
yt = a0 + a1 x1t + a2 x2t + t
[8]
avec t = t1 + vt avec || < 1 (vt N (0; v2 ) et E(vt vt ) = 0 pour t = t  ) .
Le modle [8] peut scrire en t 1 :
yt1 = a0 + a1 x1t1 + a2 x2t1 + t1

[9]

Le calcul de [8] [9] nous donne :


yt yt1
dyt

= a0 (1 ) + a1 (x1t x1t1 ) + a2 (x2t x2t1 ) + (t t1 )


= b0
+ a1 dx1t
+ a2 dx2t
+ vt

1. Cette transformation
perte dune observation, toutefois on peut remplacer la premire
entrane la
observation par 1 2 y1 et 1 2 xk1 .

136  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 137

Le terme alatoire vt rpond aux hypothses dapplication de la mthode des


MCO, nous pouvons donc utiliser les procdures destimation des MCO sur les
variables transformes. Les estimations des coefficients calcules partir du
modle en diffrence sinterprtent directement comme tant les coefficients du
modle initial, sauf en ce qui concerne le terme constant :
a0 = b0 /(1 )

Si nous connaissons la technique destimation permettant de lever lautocorrlation dordre 1, nous pouvons lappliquer de manire oprationnelle, il convient
destimer le paramtre . Cest lobjet des procdures destimations suivantes.

2) Procdures destimation de
Les procdures suivantes ne sont valides que si : t = t1 + vt .
a) Estimation directe de partir des rsidus de la rgression
sur le modle initial
tape 1 : estimation de de deux manires.
par rgression directe de et sur et1
n

=

et et1

(e = 0)
et2

t=2

[10]

ou partir de la statistique de Durbin et Watson


DW
2
En effet, le numrateur de la statistique de Durbin et Watson est gal :

 1

(et et1 )2 =

t=2

n

t=2

et2 +

n

t=2

2
et1
2

[11]

et et1

t=2

En divisant par le dnominateur de cette mme statistique et sachant que


n

et et1
e2 + e2
t=2
et et1 =
, nous avons DW = 2 2et et1 1n n ,
n


et2
et2
t=1

si n est grand,

t=1

e +e
tend vers 0.
n

2
et
2
1

2
n

t=1

Problmes particuliers : la violation des hypothses  137

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 138

tape 2 : transformation des variables et rgressions1 sur les quasi-diffrences :


yt
yt1 = b0 + a1 (x1t
x1t1 ) + . . . + ak (xkt
xkt1 ) + vt

Les paramtres estims par MCO sont alors : 


ak et 
b0 /(1
) .
a1 , . . .
a0 = 
b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)
tape 1 : initialisation de .
Par une technique destimation directe par rgression [10], on fixe une premire valeur soit :

0 =


tape 2 : rgression sur les quasi-diffrences :


yt
0 yt1 = b0 + a1 (x1t
0 x1t1 ) + . . . + ak (xkt
0 xkt1 + vt

Les paramtres estims sont alors : 


ak et 
b0 /(1
0 ) .
a1 , . . .
a0 = 
tape 3 : restimation de .
partir des nouveaux rsidus destimation (et1 ) nous recalculons une nouvelle valeur de soit
1 :
et(1) = yt 
a0 
a1 x 1t . . . 
ak x kt
n

(1)
et(1) et1
t=2

1 = (1) 2
(et )
t

tape 4 : rgression sur les quasi-diffrences :


yt
1 yt1 = b0 + a1 (x1t
1 x1t1 ) + . . . + ak (xkt
1 xkt1 ) + vt

Puis nous calculons un nouveau rsidu (et(2) ) partir de la nouvelle estima2 .


tion des coefficients, ce qui nous permet dobtenir un
Et ainsi de suite jusqu la stabilit des coefficients ak estims (en gnral 3
ou 4 itrations).
c) Mthode du balayage ( Hildreth-Lu )
tape 1 : dtermination du type dautocorrlation.
partir de la statistique de Durbin et Watson, on dtermine une autocorrlation positive ou ngative ( < 0 ou > 0 ).
tape 2 : rgression pour lintervalle des valeurs possibles de .
Par exemple, on sait que [0 ; 1] , nous rgressons pour toutes les valeurs
successives de = {0,1 ; 0,2 ; . . . 0,9 ; 1} sur lintervalle [0 ; 1] avec un pas fix
ici gal 0,1 , lquation :
yt
i yt1 = b0 + a1 (x1t
i x1t1 ) + . . . + ak (xkt
i xkt1 ) + vit
1. Nous perdrons une observation lors de la transformation en diffrences.

138  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 139

et nous
la valeur de qui minimise la somme des carrs des rsi retenons

dus


vit2 .

Il est possible daffiner la valeur estime de en remployant la mme procdure sur un intervalle restreint et avec un pas plus fin (par exemple 0,01 ).
Il est noter que cette technique est optimale selon le critre des moindres
carrs puisque lon retient le qui minimise la somme des carrs des rsidus.

Exercice n 2

fichier C5EX1

Procdures destimation en cas dautocorrlation des erreurs


dordre 1
En reprenant le modle de lexercice 1 (et les donnes du tableau 1) dans lequel nous
avons dtect une autocorrlation des erreurs, on demande den corriger les effets laide des quatre procdures prsentes. On comparera les rsultats.
Solution
La solution de cet exercice est ralise laide du programme Eviews

C5EX2.PRG

a) Estimation directe de partir des rsidus de la rgression sur le modle initial


tape 1 : rgression, calcul des rsidus et estimation de .
Les rsultats de la rgression ainsi que le calcul des rsidus ont dj t prsents lors
de la rsolution de lexercice 1.
Premire possibilit : par rgression de et sur et1
Rsultats
Dependent Variable : e
Included observations : 19 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

0.065400

0.643073

0.101700

0.9202

e( 1)

0.464845

0.241301

1.926413

0.0709

1 = 0,46
tape 2 : transformations des variables et rgression sur les quasi-diffrences
Calcul des quasi-diffrences :

Problmes particuliers : la violation des hypothses  139

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

genr dy =
genr dx1 =
genr dx2 =
genr dx3 =

Page 140

y rau1 y(1)
x1 rau1 x1(1)
x2 rau1 x2(1)
x3 rau1 x3(1)

Rgression
Dependent Variable : DY
Included observations : 19 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

135.5132

18.38346

7.371473

0.0000

DX1

3.593675

0.583072

6.163342

0.0000

DX2

0.439019

0.071365

6.151765

0.0000

DX3

0.514596

0.337097

1.526550

0.1477

Calcul du terme constant :



b0 /(1
1 ) = 135,51/(1 0,46) = 253,22
a0 = 
Deuxime possibilit : estimation de partir de la statistique de Durbin et Watson
DW
1,053

2 = 1
=1
= 0,473
2
2
tape 2 : transformations des variables et rgression sur les quasi-diffrences.
Le calcul est identique au prcdent avec la nouvelle valeur de .

Dependent Variable : DY
Included observations : 19 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

133.4095

18.14245

7.353445

0.0000

DX1

3.580221

0.583673

6.133954

0.0000

DX2

0.440490

0.071400

6.169361

0.0000

DX3

0.503033

0.336991

1.492721

0.1562

Calcul du terme constant :



b0 /(1
2 ) = 133,40/(1 0,47) = 253,20
a0 = 
b) Estimation itrative du vecteur a et de (mthode de Cochrane-Orcutt)

140  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 141

Estimation dun modle autorgressif dordre 1


LS Y C X1 X2 X3 AR(1)
Dependent Variable : Y
Included observations : 19 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

250.3442

38.62520

6.481369

0.0000

X1

3.142385

0.573681

5.477582

0.0001

X2

0.497558

0.069854

7.122783

0.0000

X3

0.144028

0.306106

0.470517

0.6452

0.811373

0.336991

5.048921

0.0002

AR(1)
Durbin-Watson stat = 2.149

3 = 0,81
Il est noter que le logiciel calcule directement la valeur de (assortie de son cart
type) ainsi que lestimation du terme constant du modle initial.
c) Mthode du balayage ( Hildreth-Lu )
Les rsultats sont identiques ceux de la mthode de Cochrane-Orcutt.
Tableau 2 Rcapitulation des rsultats
MTHODES
Paramtres

a
Rgression

a
DW

b
C.O.

c
H.L.


(t)

0,464
(1,92)

0,473

0,81
(5.04)

0,81
(5.04)


a0
(t)

253,22

253,20

250,3
(6,49)

250,3
(6,49)


a1
(t)

3,59
(6,16)

3,58
(6,13)

3,14
(5,48)

3,14
(5,48)


a2
(t)

0,44
(6,15)

0,44
(6,16)

0,49
(7,12)

0,49
(7,12)


a3
(t)

0,51
(1,52)

0,50
(1,49)

0,14
(0,47)

0,14
(0,47)

R2

0,91

0,91

0,96

0,96

Les coefficients de rgression en italique ne sont pas significativement diffrents de 0


(pour un seuil de 5 %).
la lecture des rsultats (tableau 2), nous constatons que :
le coefficient de rgression a3 nest jamais significativement diffrent de 0 , alors
que, dans le modle initial, erreurs autocorrles, tous les coefficients sont significatifs ;

Problmes particuliers : la violation des hypothses  141

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 142

les deux mthodes destimation directe des rsidus aboutissent des rsultats quasiment identiques, il subsiste nanmoins une autocorrlation des erreurs ;
les deux mthodes itratives (C.O. et H.L.) donnent des rsultats identiques, mais
assez diffrents des deux mthodes prcdentes.
Laquelle choisir ? Cette question est sans rponse dfinitive, la plus rpandue est certainement la mthode de Cochrane-Orcutt. Les deux procdures destimation directe sont
plus un artifice de calcul quune mthode proprement dite ; la technique du balayage
aboutit des rsultats similaires celle de Cochrane-Orcutt.
Nous sommes dans le domaine de lestimation statistique donc avec des marges derreurs qui peuvent parfois dpasser le raffinement de telle ou telle mthode, cest pourquoi nous pouvons recommander dutiliser la technique la plus simple mettre en uvre
donc celle directement utilise par le logiciel habituel.
Il convient de plus de noter que ces mthodes particulires destimation constituent
une rponse technique un problme le plus souvent de spcifications conomiques.
Nous recommandons, donc, plutt que dappliquer immdiatement ces procdures, de
rflchir une spcification plus adapte du modle.

II. Lhtroscdasticit
A. Prsentation du problme
Soit le modle Y = Xa + pour lequel lhypothse H4 nest pas vrifie, la
matrice des erreurs est alors :

E(1 1 )
E(2 1 )

= E( ) =
...
E(n 1 )

E(1 2 )
E(2 2 )

...
...

E(n 2 ) . . .

E(1 n )
E(2 n )
=
E(n n )

12
0
=
...
0

0
22
0

0 ...
0 ...

0
0

0 . . . n2

Les variances des erreurs ne sont plus constantes sur la premire diagonale.
Ce problme se rencontre plus frquemment pour les modles spcifis en

142  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 143

coupe instantane ou bien lorsque les observations sont reprsentatives de


moyennes. La variance de lerreur est alors lie aux valeurs de la variable explicative comme lillustrent les graphiques 4 6.

Graphique 4 Modle homoscdastique

Graphique 5 La variance de lerreur crot avec la variable explicative

Graphique 6 La variance de lerreur dcrot avec la variable explicative

Les consquences de lhtroscdasticit sont identiques celles de lautocorrlation des erreurs, cest--dire :
estimateur sans biais ;
lestimateur de MCO nest plus variance minimale.

Problmes particuliers : la violation des hypothses  143

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 144

Les causes de lhtroscdasticit sont multiples :


comme nous lavons dj cit, lorsque les observations reprsentent des
moyennes calcules sur des chantillons de taille diffrente ;
un autre cas rsulte de la rptition dune mme valeur de la variable
expliquer pour des valeurs diffrentes dune variable explicative, par
exemple lors de regroupements en tranches (de salaires, deffectifs) ;
lorsque les erreurs sont lies aux valeurs prises par une variable explicative, dans un modle en coupe instantane la variance de la consommation
crot, par exemple, avec le revenu disponible, etc.
Dans le cas dune htroscdasticit rvle, le test de Chow (cf. chapitre 3,
section B.) est biais, nous risquons alors de rejeter tort1 lhypothse H0 de la
stabilit des coefficients du modle. Si, lors dun test de Chow, nous sommes
amens accepter lhypothse H0, le problme ne se pose donc pas ; en
revanche, dans le cas du rejet de H0, il convient pralablement de corriger
lhtroscdasticit et deffectuer le test de Chow sur le modle transform.

B. Correction de lhtroscdasticit
Lestimateur BLUE du modle htroscdastique est alors celui des MCG :
1

a = (X  1
(X  1
X)
Y)
1
a = (X  1
X)

avec

Il nexiste pas une mthodologie unique de correction, la diffrence de la


correction de lautocorrlation dordre 1 des erreurs, mais des mthodes que
lon applique en fonction de la cause prsume de lhtroscdasticit. La rgle
gnrale consiste dterminer une transformation2 concernant les donnes de
la variable expliquer et des variables explicatives afin de se ramener un
modle variances constantes (homoscdastique). Les exercices 3 et 4 illustrent
les principales mthodes.

Exercice n 3

fichier C5EX3

Correction de lhtroscdasticit lorsque les donnes reprsentent


des moyennes
Afin de tester lefficacit dun nouveau fortifiant sur la croissance des poulets, un leveur a retenu 40 poulets rpartis en cinq groupes de tailles ingales et leur a administr
des doses diffrentes de ce fortifiant. Les rsultats sont consigns sur le tableau 3.
1. Cest--dire trop souvent.
2. Cette transformation consiste dterminer un vecteur de pondration pour chaque observation,
do le nom de rgression pondre.

144  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 145

Tableau 3 Relation entre le poids des poulets


et la dose de fortifiant
Groupe
i

Nombre
de poulets
ni

Poids moyen
des poulets
Yi

Dose moyenne
administre
Xi

1
2
3
4
5

12
8
6
9
5

1,7
1,9
1,2
2,3
1,8

5,8
6,4
4,8
6,9
6,2

On demande destimer les coefficients de la relation :


Yi = a0 + a1 X i + i
relation entre le poids de chacun des poulets Yi et la dose individuelle reue X i et de tester si le coefficient a1 est significativement diffrent de 0.
Solution
Estimation des coefficients
Nous ne connaissons que la relation entre les moyennes, soit : Y i = a0 + a1 X i + i
Les variables reprsentent des moyennes, donc la variance de lerreur i
2
est gale : Var(i ) = .
ni
1
1 + 2 + . . . + n
) = 2 (Var(1 ) + Var(2 ) + . . . + Var(n ))
En effet, Var(i ) = Var(
ni
ni
1
2
(n i 2 ) = (les covariances Cov(i , j ) = 0,i =
/ j ).
2
ni
ni
La matrice des variances et covariances des erreurs est donc la forme :
1

n
1

n2

1
2
2

Var(i ) = = V =

n3

n
4

1
n5
=

Puisque le modle est htroscdastique, nous allons utiliser lestimateur des MCG :

V 1

1
1

a = (X  X)1 (X  Y ) = (X  V 1 X)1 (X  V 1 Y )

n1




n2

ni
ni X i

1


=
n3
2
do (X V X) =  n X
ni X i
i
i

n4
n5

Problmes particuliers : la violation des hypothses  145

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 146



ni Y i
(X  V 1 Y ) = 
ni X i Y i

et

Le tableau de calcul 4 permet dobtenir les rsultats dont nous avons besoin.
Tableau 4 Exemple de calcul en cas dhtroscdasticit
Yi

Xi

ni

ni Y i

ni X i

1,7
1,9
1,2
2,3
1,8

5,8
6,4
4,8
6,9
6,2

12
8
6
9
5

20,4
15,2
7,2
20,7
9,0

40

72,5

Total

ni X i

ni Y i

ni X i Y i

69,6
51,2
28,8
62,1
31,0

403,68
327,68
138,24
428,49
192,20

34,68
28,88
8,64
47,61
16,20

118,32
97,28
34,56
142,83
55,8

242,7

1 490,29

136,01

448,79

et

(X  V 1 X)1 =
(X  V 1

1

40
242,7
2,1040
0,3426
=
242,7 1 490,29
0,3426
0,05647




72,5
1,23
Y) =
soit 
a=
448,79
0,502

Nous pouvons remarquer que la matrice M telle que V 1 = M  M est gale :

n1

n2

M =
n
3

n4

n5
Lestimateur des MCG est alors gal :

a = [(M X) (M X)]1 [(M X) (MY )] = (X  M  M X)1 (X  M  MY )
Nous aurions donc trouv les mmes rsultats en employant la technique de la
rgression pondre, cest--dire par multiplication du vecteur des observations de la
variable expliquer (Y ) et du vecteur de la variable explicative (X) par la matrice M

(dont la forme gnrale est n i ). La mthode des MCO applique aux donnes transformes (y compris le terme constant) suivantes conduit donc des rsultats identiques :

Yi : 1,7 12
1,9 8
1,2 6
2,3 9
1,8 5

6,4 8
4,8 6
6,9 9
6,2 5
X i : 5,8 12

Ui : 1 12
1 8
1 6
1 9
1 5

2
Nous remarquons que : Var( n i i ) = , lhtroscdasticit est donc leve.
Estimation de la variance de lerreur
Un estimateur sans biais de 2 peut tre dduit de lapplication des MCO la relation prcdente :
a)
e e
(MY M X
a ) (MY M X
=

2 =
nk1
nk1
a)
(Y X
a ) M  M(Y X
=
nk1

146  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14


2 =
Nous connaissons :

15:19

Page 147

a)
(Y X
a ) V 1 (Y X
nk1

0,0161
12
0,0885

Y X a =
0,0238 ; V =
0,0575

8
6
9

0,0869

Lestimation de la variance de lerreur est donne par :

(Y X a)
 V 1 (Y X a)
0,1369
=
= 0,0445
nk1
511
(n est le nombre dobservations servant estimer les paramtres, ici n = 5 ).
2 =

Estimation de la variance des coefficients


La matrice des variances et covariances des coefficients est :


2,1040
0,3426
2
 1
1

a = 
(X V X) = 0,0445
0,3426
0,05647
soit
2
2

a0
a1
= 0,0445 2,1040 = 0,094 et 
= 0,0445 0,0565 = 0,00251

Le coefficient a1 est-il significativement diffrent de 0 ?


t = 0,502/0,05 = 10,04 > t30,05 = 3,18 , nous rejetons lhypothse H0, le fortifiant
a une influence positive sur le poids des poulets.

C. Tests de dtection de lhtroscdasticit


Nous allons prsenter, partir dun exercice, diffrents tests permettant de
dtecter une htroscdasticit.

Exercice n 4

fichier C5EX4

Tests de dtection dune htroscdasticit et correction


Un directeur de la production dune unit de construction automobile dsire dterminer une relation entre le nombre de dfauts constats (Yi ) et le temps de vrification
(X i ) dune automobile, selon le modle suivant :
Yi = a0 + a1 X i + u i
Pour ce faire, il procde un test sur 30 vhicules quil regroupe en 6 classes de 5
voitures en demandant chaque chef datelier de passer un nombre dheures de vrification fix.
Les rsultats sont consigns dans le tableau 5.

Problmes particuliers : la violation des hypothses  147

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 148

Tableau 5 Relation entre temps de vrification


et nombre de dfauts
Nombre de dfauts Yi
4
6
9
6
11
7

5
11
13
13
15
21

Temps passs
en heures X i

6
13
14
16
17
23

8
15
15
23
22
28

8
17
21
26
34
38

4
3,5
2
1,5
1
0,5

On demande de procder aux tests de dtection dhtroscdasticit suivants :


1) test dgalit des variances ;
2) test de Goldfeld-Quandt ;
3) test de Gleisjer ;
4) test de White ;
5) puis, en cas dhtroscdasticit, den corriger les effets.
Solution
1) Test dgalit des variances
Les donnes sont constitues de m = 6 groupes dobservations. Nous allons tester
lgalit des variances1, soit lhypothse :
H0 : 12 = 22 = . . . = 62
tape 1 : calcul de la variance empirique pour chaque groupe.
ni

(Yi j Y i )2


i2 =

j=1

5

(Yi j Y i )2

ni 1

j=1

tape 2 : calcul de la variance totale.


T2 =

m

(n i 1)
i2

i=1
m

i=1

(n i 1)

vi 
i2
v

i=1

avec

vi = n i 1 et v =

m

i=1

tape 3 : calcul du 2 empirique et test.

1. Kendall M.G. et Stuart A., pages 234-236, 1961.

148  CONOMTRIE

vi =

m

(n i 1)
i=1

9782100721511-Bourbo-C05.qxd

20/10/14

La quantit Q  = v Ln 
T2

15:19

Page 149

vi Ln 
i2 suit une loi du 2 m 1 degrs de

i=1

libert (Ln = logarithme nprien). Cependant, lestimation peut tre amliore en divisant Q  par une constante dchelle C :

m
1
1
1
Q

C =1+
ainsi Q =
2 (m 1)
3(m 1) i=1 vi
v
C
2
(m 1) , lhypothse H0 est rejete, le modle est htroscdastique.
Si Q > 0,95

Le tableau 6 illustre les tapes de calcul.


Tableau 6 tapes de calcul pour un test dgalit de variances
.

1
2
3
4
5
6

Yi
4
6
9
6
11
7

5
11
13
13
15
21

6
13
14
16
17
23

8
15
15
23
22
28

8
17
21
26
34
38

Xi


i2

vi Ln (
i2 )

4
3,5
2
1,5
1
0,5

3,2
17,8
18,8
63,7
78,7
127,3

4,65
11,51
11,73
16,61
17,46
19,38


T2 = 51,58333
Q  = 13,26 ; C = 1,097 ;
donc htroscdastique.

2
Q = 12,09 > 0,95
(m 1) = 11,07 , le modle est

2) Test de Goldfeld-Quandt1
Ce test nest valable que si lune des variables est la cause de lhtroscdasticit et
que le nombre dobservations est important. Il se compose de trois tapes.
tape 1 : ordonner les observations en fonction des valeurs croissantes ou dcroissantes de la variable expliquer ou bien de la variable explicative souponne tre la
source de lhtroscdasticit.
Cette opration est dj effectue puisque le nombre de dfauts constats est class
(tableau 7) en fonction du nombre dheures dcroissant de vrification.
Tableau 7 Classement des observations en fonction
du temps de vrification (extrait des donnes)
j

Yj

1
2

4
5

29
30

28
38

Xj
4
4

0,5
0,5

1. Goldfeld S.M. et Quandt R.E., pages 539-547, 1965.

Problmes particuliers : la violation des hypothses  149

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 150

tape 2 : omettre C observations centrales.


Nous choisissons arbitrairement C observations situes au centre de lchantillon.
Ces C observations sont exclues de lanalyse. La valeur de C doit tre approximativement gale au quart du nombre dobservations totales.
C = partie entire de (30/4) = 8
tape 3 : rgressions sur les deux sous-chantillons et test.
Premier chantillon : j = 1,11

Deuxime chantillon : j = 20,30

Y j = 16,93 2,13 X j + e j

Y j = 9,84 1,32 X j + e j

(2,31)

(9,23)

n = 11

n = 11

R = 0,08

e2j = 164,66
SC R1 =

R 2 = 0,002

e2j = 872,02
SC R2 =

(.) = t de Student

(.) = t de Student

ddl1 = n 2 = 9

ddl2 = n 2 = 9

Sous lhypothse H0 dhomoscdasticit, le rapport1 :


SC R 2 /ddl2
872,02/9
=
= 5,29 suit une loi de Fisher ddl2 et ddl1 degrs
SC R 1 /ddl1
164,66/9
de libert.
F =

0,05
= 3,18, lhypothse dhomoscdasticit H0 est rejete, le moF = 5,29 > F9,9
dle est donc htroscdastique.

3) Test de Gleisjer2
Le test de Gleisjer permet non seulement de dceler une ventuelle htroscdasticit, mais aussi didentifier la forme que revt cette htroscdasticit. Ce test est fond sur
la relation entre le rsidu de lestimation par les MCO effectue sur le modle de base et
la variable explicative suppose tre la cause de lhtroscdasticit.
tape 1 : rgression par les MCO de Y j en X j ( j = 1,30)
Y j = 24,09 4,12 X j + e j
(4,19)
n = 30
R 2 = 0,38
Le vecteur des rsidus e j est alors connu.

1. La valeur la plus leve des deux SC R se situe toujours au numrateur.


2. Gleisjer H., pages 316-323, 1969.

150  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 151

tape 2 : rgression de la valeur absolue |e j | des rsidus sur X j .


Gleisjer suggre de tester diffrentes formes de relation, par exemple :

Forme gnrale

Estimation (J = 1,30)

|e j | = a0 + a1 X j + v j

|e j | = 8,09 1,46 X j + v j

n = 30 (2,55)
R 2 = 0,19

Htroscdasticit de type :


ej2 = k 2 X 2j (k tant une constante quelconque)
En effet, si nous avons une relation entre la valeur absolue du rsidu (ej) et la variable
Xj, cela signifie que nous avons de fait une relation entre le rsidu au carr et la variable
Xj au carr.
II

1/2

|e j | = a0 + a1 X j

+ vj

n = 30


ej2 = k 2 X j
III

=k

X 2
j

+ v j

(2,60)

R 2 = 0,19

|e j | = a0 + a1 X 1
j + vj

ej2

1/2

|e j | = 10,7 4,15 X j

|e j | = 2,79 + 2,86 X 1
j
j +v
n = 30

(2,30)

R 2 = 0,16

Lhypothse dhomoscdasticit est rejete si le coefficient a1 dune des spcifications


est significativement diffrent de 0 . Les trois t de Student empiriques sont suprieurs
1,96, lhtroscdasticit est donc dtecte. La forme retenue est la II ; en effet, le coefficient est affect du ratio de Student le plus lev (toutefois, la forme I est trs proche).
4) Test de White1
Le test de White est trs proche du prcdent, il est fond sur une relation significative entre le carr du rsidu et une ou plusieurs variables explicatives en niveau et au carr
au sein dune mme quation de rgression2 :
et2 = a1 x1t + b1 x1t2 + a2 x2t + b2 x2t2 + . . . + ak xkt + bk xkt2 + a0 + vt
Soit n le nombre dobservations disponibles pour estimer les paramtres du modle et
R 2 le coefficient de dtermination. Si lun de ces coefficients de rgression est significativement diffrent de 0 , alors on accepte lhypothse dhtroscdasticit. Nous pouvons
procder ce test soit laide dun test de Fisher classique de nullit de coefficients :
H0 : a1 = b1 = a2 = b2 = . . . = ak = bk = 0
Si on refuse lhypothse nulle, alors il existe un risque dhtroscdasticit.
Soit recourir la statistique L M qui est distribue comme un 2 p = 2 k degrs
de libert (autant que de coefficients que nous estimons, hormis le terme constant), si
n R 2 > 2 ( p) lu dans la table au seuil , on rejette lhypothse dhomoscdasticit
des erreurs.
1. White, 1980.
2. En cas de doute sur une influence croise de deux variables comme tant la source de lhtroscdasticit, on peut ajouter au modle estimer des termes croiss, par exemple : x1t x2t .

Problmes particuliers : la violation des hypothses  151

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 152

Soit ici estimer le modle : e2j = a1 x j + b1 x j2 + a0 + v j


e2j = 78,58 x j + 11,98 x j2 + 136,02 + 
vj
avec n = 30 ; R 2 = 0,226 ; F = 3,956
Test de Fisher F = 3,956 > F20,05
; 27 = 3,35.
2
Test L M n R 2 = 30 0,22 = 6,78 > 0,05
(2) = 5,99 .

Nous sommes, dans les deux cas, amens rejeter lhypothse H0 pour un seuil de 5 %.
Le modle est donc htroscdastique.
5) Correction de lhtroscdasticit
Les quatre tests sont concordants : le modle est htroscdastique, il convient donc
den corriger les effets.
ej2 = k 2 X 2j ; lapplication de
Supposons, par exemple, que lon retienne la forme I : 
la rgression pondre par le facteur 1/ X j conduit un modle homoscdastique :
a0
ej
Yj
=
+ a1 +
Xj
Xj
Xj


do E

ej
Xj

2
=

1 2

= k2
X 2j ej

ej2 = k 2 X j . Pour
Or, le test de Gleisjer a mis en vidence une relation (II) du type : 
lever lhtroscdasticit, dans
ce
cas,
nous
employons
la
rgression
pondre sur les

donnes brutes divises par X j . En effet :
Xj
a0
ej
Yj

= + a1 +
Xj
Xj
Xj
Xj

ej 2
1 2
=

= k2
do E
X j ej
Xj

En gnral, lorsque nous avons dtect une htroscdasticit de type :



ej2 = k 2 f (X j ) , il convient de diviser les donnes par f (X j ) afin de se ramener un
modle homoscdastique.
Dans le cadre de notre exercice, les donnes sont alors transformes (tableau 8).
Tableau 8 Transformation pour une rgression pondre
(extrait des donnes)

152  CONOMTRIE

Yj
Zj =
Xj

1
X1 j =
Xj

Xj
X2 j =
Xj

2,00
2,50

39,60
53,74

0,50
0,50

1,41
1,41

2,00
2,00

0,71
0,71

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 153

Le modle estim par les MCO est le suivant :


Z j = b1 X 1 j + b2 X 2 j + j , j rpond aux hypothses classiques. Il est noter labsence du terme constant. Les rsultats fournis par Eviews sont :

a1 = 
a0 = 
b1 = 24,96 et 
b2 = 4,53. Le
Les coefficients du modle initial sont 
modle estim1 est donc :
Y j = 24,96 4,53 X j + e j
(2,94)
n = 30
(.) = t de Student
Il existe bien une influence significative du temps de vrification sur le nombre de
dfauts constats, chaque heure de vrification permet de supprimer en moyenne
4,5 dfauts.

D. Autre test dhtroscdasticit : le test ARCH


Les modles de type ARCH2 ( AutoRegressive Conditional Heteroscedasticity ) permettent de modliser des chroniques (la plupart du temps financires3)
qui ont une volatilit (ou variance ou variabilit) instantane qui dpend du pass.
Il est ainsi possible dlaborer une prvision dynamique de la chronique en
termes de moyenne et de variance. Le test est fond soit sur un test de Fisher classique, soit sur le test du multiplicateur de Lagrange (L M) .
De manire pratique, on procde de la manire suivante :
1re tape : calcul de et le rsidu du modle de rgression ;
1. Ce modle est comparer celui estim sur les donnes brutes (premier modle du test de
Gleisjer).
Le coefficient de dtermination nest pas prsent, car, dans tout modle estim sans terme
constant, il nest pas interprtable.
2. Engle, 1982.
3. En effet, les sries financires sont particulirement concernes par les modles ARCH, car on
constate des priodes de forte spculation (variabilit leve) suivie de priodes daccalmie (variabilit faible).

Problmes particuliers : la violation des hypothses  153

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 154

2e tape : calcul des et2 ;


3e tape : rgression autorgressive des rsidus sur p retards (rsidu dcal)
o seuls les retards significatifs sont conservs, et2 = 0 +

2
i eti
;

i=1

Soit tester lhypothse H0 : 1 = 2 = = p = 0 .


4e tape : calcul de la statistique du multiplicateur Lagrange, L M = n R 2 avec :
n = nombre dobservations servant au calcul de la rgression de ltape 3,
R 2 = coefficient de dtermination de ltape 3.
Si L M > 2 ( p) p degrs de libert lu dans la table un seuil fix (en
gnral 0,05 ), on rejette H0 ; on considre que le processus est justifiable dun
modle ARCH( p) .
2
Cest le test de significativit des coefficients i de la rgression et2 sur et
p
qui permet de dterminer lordre p du processus ARCH sachant quun processus ARCH dordre 3 semble un maximum. Une autre approche consiste
calculer le corrlogramme des rsidus aux carrs issus du modle initial. Si des
termes de ce corrlogramme sont significativement diffrents de 0 , alors on peut
conclure une spcification de type ARCH.

III. Modles erreurs sur les variables


A. Consquences lorsque les variables sont entaches
derreurs
Quand nous avons tudi le modle linaire, nous avons admis que la variable
endogne et les variables exognes taient observables sans erreur. Dans la pratique, cette hypothse est rarement vrifie ; cependant, nous pouvons admettre,
gnralement, que lerreur de mesure des observations est faible par rapport
lerreur de spcification.
Toutefois, dans certains modles, les variables conomiques retenues peuvent tre entaches dune erreur de mesure relativement importante. Cest le cas,
par exemple, lorsque les donnes proviennent, non pas, dune mesure directe,
mais de donnes denqutes par sondage. Dans ce cas, il convient de distinguer
les variables vraies (et inconnues) : y , x1 , x2 , . . . , xk des valeurs observes
y, x1 , x2 , . . . , xk et dtudier les consquences concernant les proprits de lestimateur obtenu par les MCO.
Soit le modle Y = X a + avec qui satisfait aux hypothses habituelles.
Posons :

X = X + et Y = Y +

avec : E() = 0 ; E() = 0 ; E(X  ) = 0 ; E(Y  ) = 0 ; E(X  ) = 0 ;


E(Y  ) = 0 .

154  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 155

On a alors :
E( ) = E{(Y X a) } = E(Y ) a  E(X  ) = 0
E( ) = E{(Y X a) } = E(Y ) a  E(X  ) = 0

Nous avons donc indpendance entre les erreurs sur les variables et , et lerreur de spcification du modle .
La relation entre les variables observes X et Y est la suivante :
Y = Y = (X )a + Y = Xa + a + = Xa +
= a +

avec

Les proprits stochastiques de sont :


E() = E( a + ) = E() E()a + E() = 0
E(X  ) = E(X  ) E(X  )a + E(X  ) = 0
E(X  ) = E{(X + ) } = E( )
= E( ) E( ) a + E( )
= E( )a = 0

Lhypothse H6 du modle gnral nest donc pas vrifie puisque et X sont


corrls, la mthode des MCO fournit des estimateurs biaiss ngativement.

B. La mthode des variables instrumentales


Lorsquon se trouve en prsence dun modle erreurs sur les variables
a ne converge pas
Y = Xa + , lhypothse H6 est en dfaut et lestimateur 
asymptotiquement vers a. Les autres hypothses sont rputes vrifies.
Le but de la technique des variables instrumentales est de dterminer k
variables z 1 , z 2 , . . . , z k telles que :
E(Z  ) = 0

et

Z = (z 1 , z 2 , . . . , z k )

Cov (Z  X) = 0

cest--dire quaucune combinaison linaire des variables z k nest orthogonale


aux variables x1 , x2 , . . . , xk ou encore que les variables Z et X soient corrles.
Nous avons alors :
E(Z  Y ) = E{Z  (Xa + )} = E(Z  X)a + E(Z  ) = E(Z  X)a

Problmes particuliers : la violation des hypothses  155

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 156


a = (Z  X)1 Z  Y

soit

[12]

a est un estimateur convergent de a , la variance de lesOn dmontre1 que 


timateur 
a est dautant plus faible que la corrlation entre Z  X est forte, la
matrice des variances et covariances des coefficients est gale :
a = 

2 (Z  X)1 (Z  Z )(X  Z )1

[13]

La difficult de mise en uvre de cette mthode rside dans la slection des


variables instrumentales2 miracles Z qui doivent tre non corrles avec
et fortement corrles avec X . Dans certains cas, nous pouvons simplement retenir, comme variable instrumentale, la variable exogne dcale dune priode.

C. Le test dexognit dHausman


Le test dexognit dHausman (1978) permet de dtecter une ventuelle corrlation entre le terme derreur t et une ou des variables explicatives xit. Dans
cette hypothse, nous ne pouvons plus utiliser lestimateur des MCO qui est non
convergent, il faut alors recourir la mthode des Variables Instrumentales (VI)
ou la Mthode des Moments Gnralise (GMM).
Soit le test dhypothses, H0 : Cov(xt ,t ) = 0 (la variable xt est exogne) contre
/ 0.
lhypothse dendognit H1 : Cov(xt ,t ) =
Sous lhypothse H0 les estimateurs des MCO et des VI sont convergeant alors
que sous lhypothse H1 la covariance est non nulle et lestimateur des MCO est
biais et non convergeant. Ce test peut tre men de deux manires, soit un test
de diffrence entre lestimateur des VI et des MCO, soit un test partir dune
rgression augmente.
1) Test de diffrence
Nous calculons la statistique :
H = (
aV I 
a MC O ) [Var(
aV I ) Var(
a MC O )]1 (
aV I 
a MC O ) .

La statistique H est distribue selon un chi-deux k degrs de libert. Si


H < 2 (k) pour un seuil % fix, nous acceptons lhypothse H0, lestimateur
MCO est non biais.
1. Judge G.G. et al., pages 577-579, 1988.
2. Les anglo-saxons emploient le terme de proxy variable , que lon peut traduire littralement par
variable par dlgation .

156  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 157

2) Rgression augmente
La procdure propose par Hausman est en quatre tapes :
Estimation dun modle par les MCO avec pour variable expliquer la
variable dont nous dsirons tester lexognit et comme variables explicatives le ou les instruments, le plus souvent les variables explicatives dcales
dune priode.
Estimation de la ou des variables ajustes xit partir de la ou des rgressions
prcdentes.
Estimation du modle augment (modle initial dans lequel nous rajoutons la
ou les variables explicatives ajustes xit).
Test de significativit par rapport 0 du ou des coefficients de la ou des
variables explicatives ajustes. Si ce ou ces coefficients ne sont pas significativement de 0 (test de Student ou de Fisher), alors nous retenons lhypothse
H0 : Cov(xt ,t ) = 0 .

D. La mthode des moments gnralise


La Mthode des Moments Gnralise, GMM (Generalized Method of
Moments), est utilise lorsque la ou les variables explicatives sont supposes
/ 0 ) et que, de plus, la matrice des variances covariances
exognes (Cov (xt ,t ) =
/ 2 I ). Lestimateur des GMM combine
des erreurs est quelconque ( E(t ,t ) =
alors la mthode des moindres carrs gnraliss avec celle des variables instrumentales. Lestimateur des GMM est donn par :
)1 Z  X)1 X  Z (Z  Z
)1 Z  y
a = (X  Z (Z  Z

[14]

avec :
y = la variable expliquer
X = les variables explicatives
Z = les instruments
= la matrice des variances covariances des rsidus estims dans une premire


tape par la mthode des variables instrumentales


Il est noter que dans le cas o les hypothses classiques sont vrifies
(E(t ,t ) = 2 I ) , lestimateur des GMM (expression [14]) se ramne lestimateur VI (expression [13]).

Problmes particuliers : la violation des hypothses  157

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 158

Exercice n 5

fichier C5EX5

Test dexognit dHausman, modle erreurs sur les variables : la


technique des variables instrumentales
Un agronome dsire estimer la relation entre le rendement de bl (yi ) et la quantit
utilise dengrais (xi ) . Pour ce faire, il ne dispose que de la quantit dengrais (xi )
dclare par lagriculteur, qui est donc entache dune erreur. Cependant, il pense que la
variable de dpense effective en achat dengrais (z i ) est indpendante de lerreur dobservation de la quantit dengrais dclare et bien corrle avec la consommation relle
dengrais.
On dispose des vingt observations prsentes au tableau 9.
Tableau 9 Rendement de bl, quantit dengrais utilise
et dpense en achat dengrais
Observation

yi

xi

zi

1
2
3

18
19
20

15,30
19,91
20,94

25,83
25,15
25,06

17,30
21,91
22,96

29,43
28,95
28,86

3,00
7,00
5,40

22,20
24,60
24,60

On demande :
1) de tester une ventuelle endognit de la variable xi laide du test dHausman ;
2) destimer la relation entre yi et xi par une mthode adapte.
Solution
1) Test de diffrence : Nous calculons la statistique dHausman :






H = ( aV I a MC O ) [Var( aV I ) Var( a MC O )]1 ( aV I a MC O )
Avec :







0,795
0,822
0,0004489 0,01106



aV I =
; a MC O =
; Var( aV I ) =
;
2,153
1,471
0,01106
0,27613




0,0003486 0,00859
0,0276



Var( a MC O ) =
; ( aV I a MC O =
;
0,00859 0,214867
0,6817


0,0001 0,0024


[Var( aV I ) Var( a MC O )] =
0,0024 0,0612

158  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 159



1568341,7 63248,1
0,0276
= 7,63 > 2 (2)
63248,1
2566,99
0,6817
pour un seuil de 5 % = 5,99. Nous rejetons lhypothse H0, lestimateur des MCO est
biais, il convient dutiliser lestimateur des VI.
H = [0,0276

0,6817]

Rgression augmente
Nous procdons au test dHausman en quatre tapes.
Estimation par les MCO de la rgression de xi sur linstrument z i :
Dependent Variable : X
Method : Least Squares
Included observations : 20
Variable

Coefficient

Std. Error

t-Statistic

Prob.

18.37253

0.622495

29.51436

0.0000

0.440680

0.039908

11.04238

0.0000

t-Statistic

Prob.

Calcul de la srie ajuste : xi = 18,37 + 0,44z i


Estimation du modle augment avec (XF = xi ) :
Dependent Variable : Y
Method : Least Squares
Included observations : 20
Variable

Coefficient

Std. Error

1,010328

0,022324

45,25680

0.0000

XF

0,215107

0,023915

8,994504

0.0000

2,153561

0,212721

10,12386

0,0000

Le coefficient de la variable XF est significativement diffrent de 0, nous ne sommes


pas en mesure daccepter lhypothse H0, nous avons donc Cov(xt ,t ) = 0 .
2) La rgression de yi sur xi conduit aux rsultats suivants :

yi = 1,47 + 0,82 X i
(41)
R 2 = 0,99
n = 20
(.) = t de Student
Cependant la mthode des MCO nest pas applicable car E(xi ) = 0 . En revanche, nous
savons par hypothses que E(z i ) = 0 et que Cov(xi z i ) = 0 .
a est donn par [12], soit :
Lestimateur 

a
(2,1)

(Z 
(2,20)

X)1
(20,2)

Z
(2,20)

Y
(20,1)

Problmes particuliers : la violation des hypothses  159

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 160

La matrice Z est compose de 1 pour la premire colonne et des valeurs de z i pour


la deuxime colonne. De mme, la matrice X est compose de 1 pour la premire colonne et des valeurs de xi pour la deuxime colonne.
Nous obtenons :

20,00
ZX =
284,40

492,78
7 369,53


(Z  X)1 =

1,02
0,04

0,07
0,00


;

Z Y =


a=

soit


a0

a1

2,15
=
0,795

434,94
6472,88

Ces coefficients sont comparer ceux trouvs lors de lestimation du modle par
les MCO.
Nous pouvons calculer lestimation de la variance de lerreur :

ei2
1,29
i
2

=
=
= 0,071
n2
18
a est alors daprs [13] :
La matrice des variances et covariances de 
 a = 

2 (Z  X)1 (Z  Z )(X  Z )1

ZZ =

20,00
284,40

284,40
4 866,08


;

soit

 a = 0,071

3,85
0,15

0,15
0,00


a1
= 0,0211
Le modle estim partir de la mthode des variables instrumentales est donc le suivant :

yi = 2,15 + 0,795 X i
(37)
n = 20
(.) = t de Student

Exercice n 6

fichier C5EX6

Prvision de part de march


Une entreprise de la grande consommation cherche prvoir la part de march dun
produit apritif (PMt) en fonction de sa prsence dans lunivers de vente 1 (DNt) et de son
indice de prix par rapport aux concurrents (IPt). Les donnes portent sur 41 semaines.
1. La DN ou distribution numrique reprsente le nombre de fois o le produit est prsent dans la
distribution GMS (Grande et Moyennes Surfaces). Si DN = 100, cela signifie que le produit est
prsent dans tous les magasins, si DN = 80, le produit est prsent dans 80 % des magasins. Bien
sr, plus la DN augmente et plus le produit est prsent dans les linaires et donc la probabilit de
vendre le produit saccrot.

160  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 161

Le chef de produit estime un premier modle dont les rsultats sont prsents ci-dessous :
Log(P Mt ) = 2,91 + 1,03 Log(D Nt ) + et
(48,5) (6,83)
n = 41
R 2 = 0,54
DW = 1,29
(.) = t de Student
Log = Logarithme nprien
1) Que reprsente le coefficient a1 du modle ? Est-il significativement de 0 ?
2) Le graphique des rsidus est le suivant quen pensez-vous ?

Existe-t-il une autocorrlation des erreurs ?


3) Le chef de produit ajoute lindice des prix son quation de rgression et obtient le
rsultat suivant :
Log(P Mt ) = 25,22 + 1,28 Log(D Nt ) 4,71 Log(I Pt ) + et
(6,7) (10,9)
(5,9)
n = 41
R 2 = 0,76
DW = 1,83
Commentez dun point de vue statistique et conomique les rsultats obtenus.
4) Connaissant pour la semaine 42 les valeurs de D N42 = 0,60 et I P42 = 100, on vous
demande de calculer une prvision de part de march pour la semaine 42 assortie de son
intervalle 95 %.
On donne la matrice (X  X)1

543,63
6,38 114,92
(X  X)1 = 6,38
0,54
1,32
114,92 1,32
24,29
Solution
1) Le cofficient a1 du modle reprsente une lasticit car le modle est sous la forme
Log-Log. Ce coefficient est significativement de 0 car la valeur empirique du t de Student
est largement suprieure au t lu dans la table (t 0,05 = 1,96) .
2) Le graphique laisse supposer une autocorrlation des erreurs. Puisque les conditions dapplication du test de Durbin et Watson sont vrifies, nous pouvons interprter

Problmes particuliers : la violation des hypothses  161

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 162

cette statistique : DW = 1,29 < 1,44 (valeur lue dans la table). Il existe une prsomption dautocorrlation des erreurs dordre 1.
3) Commentaires des rsultats
Commentaires statistiques :
la statistique de Fisher indique que le modle est globalement significatif,
les t de Student ont des probabilits critiques infrieures 0,05, les coefficients sont
donc tous significatifs,
la statistique de DW = 1,82 ne laisse plus prsager dune autocorrlation des
erreurs.
Nous constatons que le fait davoir ajouter au modle une variable explicative corrige lautocorrlation des erreurs. Le modle est valid sur le plan statistique.
Commentaires conomiques :
la variable DN agit positivement, plus lentreprise est prsente dans lunivers de
vente plus la part de march augmente (10 % daugmentation entrane 12,5 % daugmentation de part de march),
la variable IP agit ngativement, il sagit dun effet prix classique (10 % daugmentation entrane 47 % de baisse de part de march),
Les coefficients des variables ont bien le signe attendu.
4) On calcule le logarithme nprien : LN(DV ) = 0,51; LN(I P) = 4,605
La prvision en semaine 42 est donne par :

Log( P
M) = 25,22 + 1,285 0,51 4,716 4,605 = 2,84
Do P M = e2,84 = 17,18. La part de march prvue est de 17,18 %
Lcart type de lerreur de prvision est gal :



2 1 + X t+h
(X  X)1 X t+h = (0,16132)2 (1 + 0,27) = 0,033.

e2t+h = 

1
avec X t+h = 0,51
4,605

Lintervalle de prvision 95 % de Ln(PM) est donn par : 2,84 1,96 0,033.


Soit I C = [2,483; 3,196]
Nous passons aux exponentiels afin dobtenir lintervalle de confiance de la part de
march : [11,95; 24,43].

Exercice n 7

fichier C5EX7

Un peu de rflexion conomtrique...


Soit trois variables construites artificiellement connues sur n = 40 priodes.
Y1 et Y1 en diffrences premires : DY1 = Y1 Y1(1)
Y2 et Y2 en diffrences premires : DY2 = Y2 Y2(1)
une variable TENDANCE = 1, 2, ... , n

162  CONOMTRIE

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 163

Les graphiques 7 montrent les variations des variables Y1, Y2, DY1, DY2 en fonction du temps.

Graphique 7 volution des variables Y1, Y2, DY1, DY2 en fonction du temps
En vous aidant des graphiques, de la statistique de Durbin-Watson et du coefficient
de dtermination, on demande de marier chacune des 4 rgressions proposes (Rsultats
du modle) avec le couple Variable dpendante/Variable explicative .
Variables

Rsultats du modle

Modle 1
Modle 2
Modle 3
Modle 4

Durbin et Watson

R2

Dpendante

Explicative

1,97
3,91
0,03
0,053

0,52
0,55
0
0,52

Y1
DY1
Y2
Y1

TENDANCE
TENDANCE
TENDANCE
DY2

Solution
On procde par dduction et limination.
Modle 3 : Y1/DY2 car coefficient de dtermination quasi nul et trs forte autocorrlation des erreurs.
Modle 2 : Y2/TENDANCE car coefficient de dtermination lev et trs forte
autocorrlation ngative des erreurs.
Modle 1 : DY1/TENDANCE car coefficient de dtermination lev et absence
dautocorrlation.
Modle 4 : Y1/TENDANCE car forte autocorrlation positive des erreurs et coefficient de dtermination lev.

Problmes particuliers : la violation des hypothses  163

9782100721511-Bourbo-C05.qxd

20/10/14

15:19

Page 164

Les graphiques 8 suivants illustrent les autocorrlations et les coefficients de dtermination.


1000

300

500

50

900

200

400

40

800

100

300

30

700

200

20

600

-100

100

10

-200

500
5

10

15

20
Y1

25

30

35

40

60
50

40

40

20

30

0
-20
-40
15
DY1

15

20

25

20

Y2

60

10

10

DY2

80

0
5

30

TENDANCE

35

40

25

30

35

40

TENDANCE

1000

50

900

40

800

30

20

700

20

10

600

10

500

0
5

10

15
Y1

20

25

30

35

TENDANCE

Graphique 8 Illustrations des modles : autocorrlations


et les coefficients de dtermination

164  CONOMTRIE

40

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 165

6. Les modles
non linaires

ous avons examin le cas du modle linaire, cependant, trs


souvent, la thorie conomique doit tre formalise laide de
relations non linaires.
Dans ce chapitre, la part consacre au cours est trs rduite. En effet,
ltude des modles non linaires se prte bien lexercice pratique.
Nous examinons tout dabord en I., les diffrents types de modles non
linaires : ceux qui sont linaires sur leurs paramtres et des modles un
peu plus complexes (modle de diffusion, par exemple) qui font lobjet
dune tude particulire. Puis, les mthodes destimation des paramtres
des modles non linarisables sont prsentes en II.

I. Les diffrents types de modles non linaires


A. Les fonctions de type exponentiel
Nous allons examiner le cas de modles dont la spcification nest pas linaire,
mais qui sont linaires par rapport leurs paramtres.

Exercice n 1

fichier C6EX1

Estimation dune fonction de production de type Cobb-Douglas


Nous avons relev pour 25 entreprises : la production Q , le facteur capital K et le
facteur travail L ; ces variables sont exprimes en millions deuros.

Les modles non linaires  165

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 166

Une fonction de production de type Cobb-Douglas est de la forme :


Q = 0 K 1 L 2
On demande :
1) de donner une interprtation conomique des coefficients 1 et 2 ;
2) destimer les paramtres du modle et de commenter les rsultats ;
3) de calculer le risque de premire espce concernant lhypothse des rendements
dchelle constants.
Les donnes collectes sont prsentes dans le tableau 1 suivant :
Tableau 1 Donnes de production pour 25 entreprises
(extrait des donnes)
K
8
9

3
6

L
23
14

10
71

Q
106,00
81,08

43,21
121,24

Solution
1) Les coefficients 1 et 2 reprsentent respectivement llasticit de la production au
facteur capital et llasticit de la production au facteur travail.
Dmonstration :
Nous avons une relation du type : Q = 0 K 1 L 2 .
Une transformation logarithmique conduit :
Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L)
Or llasticit de y x se dfinit comme tant un rapport de variation relative :
e=

y/y
Log(y)
=
= rapport de drives logarithmiques.
x/x
Log(x)

Les coefficients 1 et 2 sont donc des lasticits.




Dans tout modle spcifi sous forme Log-Log, les coefficients sinterprtent directement en termes dlasticits.

2) Estimation des coefficients du modle Log-linaire


Le modle estimer est donc le suivant :
Log(Q)
LQ

=
=

Log(0 )
a0

+
+

1 Log(K )
1
LK

+
+

2 Log(L)
2
LL

+
+

o les variables L Q , L K et L L (tableau 2) sont les variables Q , K et L transformes.


Les rsultats de lestimation sont les suivants :

166  CONOMTRIE

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 167

0,05
= 2,07), les coefficients
Les t de Student calculs sont tous suprieurs au t lu (t22
sont donc significativement diffrents de 0 au seuil de 5 %.

Tableau 2 Donnes transformes en logarithmiques dcimaux


(extrait des donnes)
LK =
Log(k)
0,90
0,95

0,48
0,78

LL =
Log(L)

LQ =
Log(Q)

1,36
1,15

1,00
1,85

2,03
1,91

1,64
2,08

Attention, la statistique de Durbin et Watson ne sinterprte pas puisque le modle


est spcifi en coupe instantane.
Lestimation statistique est donc satisfaisante.
Llasticit de la production au capital est gale : 1 = 0,64 .
Llasticit de la production au travail est gale : 2 = 0,25 .
(Si le facteur capital augmente de 10 %, la production augmente de 6,4 % et si le facteur travail augmente de 10 %, la production augmente de 2,5 %.)
Le coefficient 0 est gal : 0 = 101,084 = 12,13 .
 = 12,13 K 0,64 L 0,25.
La fonction de production estime scrit : Q

Les modles non linaires  167

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 168

3) Les rendements dchelle sont-ils constants ?


Les rendements dchelle sont :
dcroissants si 1 + 2 < 1 (la production augmente dans une proportion moindre
que les facteurs de production) ;
constants si 1 + 2 = 1 (la production augmente dans une proportion identique aux
facteurs de production) ;
croissants si 1 + 2 > 1 (la production augmente plus vite que les facteurs de production).
Or nous avons 
1 + 
2 = 0,89 , pour quelle probabilit critique cette valeur est-elle
significativement infrieure 1 ?
On teste donc les hypothses suivantes :
H0 : 1 + 2 = 1
H1 : 1 + 2 < 1
Le t calcul de Student est donc gal, sous H0, :
t =

2 1

1 + 

1+
2

Or la matrice des variances et covariances des coefficients est fournie par Eviews :

2
2
2
1
2
1 , 
2 )
1+
Soit 
2
=
+
+ 2 cov (

= 0,000749 + 0,001261 + 2 0,000314 = 0,002638


t =

2 1

1 + 
0,64 + 0,25 1
0,020
=
= 2,14  t22

1+
0,05136
2

Nous avons 2 % de risques de rejeter lhypothse H0 tort, nous pouvons donc


considrer les rendements dchelle comme significativement dcroissants.

B. Les modles de diffusion


La courbe de vie du produit est une notion utilise en marketing : les ventes
voluent en fonction du temps ; le dmarrage est relativement lent lorsque le
produit est nouveau, puis elles connaissent une croissance rapide. La courbe
passe ensuite par un point dinflexion partir duquel le rythme de croissance des
ventes diminue.
Nous allons examiner deux modles classiquement utiliss.

168  CONOMTRIE

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 169

1) Le modle logistique (ou courbe de Verhulst ou courbe de Pearl)


Ce modle est dfini par la formulation suivante :
yt =

ymax
1 + br t

o b et r sont les deux paramtres du modle (0 < r < 1) , r dfinit la vitesse


de diffusion (plus r est proche de 0 , plus vite nous atteindrons lasymptote) ; b
est une caractristique dordonne lorigine ; ymax = seuil de saturation.
Si t alors yt ymax , et si t alors yt 0 .
Le point dinflexion est fixe et est atteint pour yt = ymax /2 .
Le graphique 1 illustre lallure gnrale de la courbe logistique.

Graphique 1 La courbe logistique (ymax = 148,31, b = 10, r = 0,7)

2) Le modle de Gompertz
Ce modle est dfini par la formulation suivante :
yt = ebr

t +a

Ln(yt ) = br t + a

(e = base du logarithme nprien).


Avec ymax = ea = seuil de saturation, b et r sont les deux paramtres du
modle (b < 0 et 0 < r < 1) .
Si t alors yt ymax , et si t alors yt 0 .

Les modles non linaires  169

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 170

3) Les mthodes destimation


La difficult destimation de ce type de modles1 vient du fait quils ne sont
pas linaires. Lemploi du modle de rgression est donc impossible tel quel.
Lestimation des paramtres dun tel modle doit tre effectue par des
mthodes de rgression non linaire qui ncessitent des procdures numriques
itratives assez complexes, objet du paragraphe suivant.

II. Mthodes destimation


des modles non linaires
Nous avons jusqu maintenant procd des artifices de calcul afin de se ramener des modles linaires. Cependant, pour certaines spcifications de modle
il savre impossible, mme sous certaines hypothses, dutiliser les MCO.
Nous allons prsenter, trs succinctement2, les mthodes destimation non
linaires en essayant den montrer linspiration gnrale et les limites. Des
exemples dutilisation sont prsents, ensuite, partir des logiciels RATS et
Eviews.

A. Initiation aux mthodes destimation non linaires


Linspiration gnrale des techniques destimation non linaires sont les mmes
quel que soit le type dalgorithme. Il sagit de mthodes itratives dans lesquelles lquation non linaire est linarise laide dun dveloppement limit
de Taylor ( partir dun jeu de valeurs de coefficients initiaux). Les MCO sont
alors utiliss sur cette quation linaire afin destimer des nouveaux coefficients.
Ces nouveaux coefficients permettent, laide dun nouveau dveloppement
limit, de procder une nouvelle linarisation. La procdure est arrte lorsque
les coefficients sont relativement stables dune itration lautre.
Pour ce type de mthode soit efficiente, il convient que les valeurs initiales
ne soient pas trop loignes des valeurs optimales. Dans le cas contraire, il ny
a pas convergence et la procdure est dfaillante.

1. Pour un approfondissement des modles de diffusion cf. Bourbonnais R. et Usunier J. C.


Chapitre 7, (2013).
2. Pour un dveloppement trs complet, le lecteur peut se rfrer Greene W.H., chapitre 10, 2000.

170  CONOMTRIE

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 171

Algorithme de Gauss-Newton
Soit le modle non linaire : yt = f (X, a) + t o X est la matrice des observations des variables explicatives (de dimension n , k + 1 ) et a est le vecteur (de
dimension k + 1 ) des paramtres estimer.
Sous les hypothses classiques concernant t , lestimateur des moindres carrs est la valeur de a qui minimise la somme des carrs des rsidus :
S(a) = e e = [yt f (X, a)] [yt f (X, a)]

Nous avons k + 1 conditions du premier ordre ( S/a = 0), soit :


f (X, a)
S
= 2
[yt f (X, a)] = 0
a
a
f (x1 , a)

Avec

f (X, a)

= Z (a) =

a0
..
.
f (xn , a)
a0

...
..

...

f (x1 , a)
ak

..

f (xn , a)
ak

Soit Z (a 1 ) cette matrice calcule pour les valeurs particulires de a(a = a 1 ) .


Puis, laide dun dveloppement limit de Taylor au voisinage de a 1, nous pouvons approximer la t -ime observation

f (xt , a)

f (xt , a)  f (xt , a ) +

a0

a=a1

f (xt , a)

...

ak


(a a 1 )

a=a1

Ou encore, en notation matricielle :


f (X, a)  f (X, a 1 ) + Z (a 1 )(a a 1 )

Soit
ou encore :

y = f (X, a 1 ) + Z (a 1 )(a a 1 ) +
y = f (X, a 1 ) + Z (a 1 )a Z (a 1 )a 1 +

En posant y(a 1 ) = y f (X, a 1 ) + Z (a 1 )a 1, nous pouvons alors construire un


pseudo-modle linaire qui est gal :
y(a 1 ) = Z (a 1 )a +

Lestimateur des MCO de ce modle linaire est donn par :


a 2 = [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) y(a 1 )
= a 1 + [Z (a 1 ) Z (a 1 )]1 Z (a 1 ) [y f (X, a 1 )]

Ce qui donne k + 1 nouvelles valeurs pour le vecteur a = a 2 . Le processus


est arrt la p -ime itration, lorsque nous observons une relative stabilit des
a = a p  a p1 .
coefficients ainsi estims : 

Les modles non linaires  171

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 172

Cette mthode assez complexe connat quelque raffinement par lutilisation


dun dveloppement limit de Taylor du second ordre (algorithme de NewtonRaphson).
Les logiciels dconomtrie (Eviews, RATS, ) ainsi que les tableurs
laide de la fonction SOLVEUR permettent, trs simplement, dutiliser ces
mthodes destimation des modles non linaires.
Nanmoins, il convient dinsister sur le fait quelles ne sont efficientes que si
nous sommes capables de fournir des valeurs initiales compatibles avec la spcification du modle et les donnes.

B. Exemples dapplication

Exercice n 2

fichier C6EX2

Estimation des paramtres dun modle de diffusion Logistique


et de Gompertz
Le tableau 3 prsente les ventes cumules (en milliers dunits) dun CD audio dun
artiste succs sur 19 semaines.
Tableau 3 Extrait des ventes cumules sur 19 semaines (milliers dunits)
Semaines

Ventes

44,7

61,0

18

607,0

19

633,9

On demande :
1) Destimer les paramtres dun modle de diffusion de type Logistique.
2) Destimer les paramtres dun modle de diffusion de type Gompertz.
Solution
Le graphique 2 prsente lvolution des ventes cumules en fonction des semaines. Ce
graphique peut suggrer une volution selon un modle de diffusion, nous serions alors
proximit du point dinflexion.

172  CONOMTRIE

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 173

700
600
500
400
300
200
100
0

10

11

12

13

14

15

16

17

18

19

Graphique 2 Ventes cumules


1) Estimation dun modle de diffusion de type Logistique (Eviews).
Valeurs initiales compatibles
PARAM 1 600. 2 5. 3 0.5
equation NLS ventes=C(1)/(1+c(2)*c(3)^@trend)
Rsultats (Eviews) :
Dependent Variable: VENTES
Sample: 1 19
Included observations: 19
Convergence achieved after 8 iterations
VENTES=C(1)/(1+C(2)*C(3)^TEND)
Coefficient Std. Error tStatistic

R-squared

Prob.

C(1)

718.0033

11.87762

60.45008

0.0000

C(2)

14.77212

0.536144

27.55254

0.0000

C(3)

0.784909

0.004580

171.3614

0.0000

0.999009

Le modle estim scrit : yt =

ymax
718
=
1 + br t
1 + 14,77 0,785t

2) Estimation dun modle de diffusion de type Gompertz (RATS).


* Rgression non linaire
nonlin b r a
frml gompertz = exp(b*r**(t)+a)

Dfinition des paramtres estimer


Formulation du modle

Les modles non linaires  173

9782100721511-Bourbo-C06.qxd

20/10/14

*Initialisation des paramtres


eval a = 5.
eval b = -3.5
eval r = 0.5
nlls(frml=gompertz,trace) taux

15:21

Page 174

Estimation des coefficients


Rsultats

Soit le modle : yt = ebr +a = e(3,460,88 +6,83) ; le seuil de saturation, selon un


modle de Gompertz, est donc de e6,83 = 927.
t

Exercice n 3

fichier C6EX1

Estimation des paramtres dune fonction de production de type CES


Les fonctions de production llasticit de substitution constante, appeles CES1
(Constant Elasticity of Substitution), sont de la forme :
Q = 1 [2 K 3 + (1 2 ) L 3 ]4 avec 3 et 4 < 0
o 1/(1 3 ) reprsente llasticit de substitution2.
Nous pouvons aussi lcrire de la manire suivante :
Q = 1 [2 K 3 + (1 2 )] L 3 ]/3
o reprsente alors les rendements dchelle.
En reprenant les donnes du tableau 1, on demande :

1. La fonction de production llasticit de substitution constante (CES) a t introduite par


Arrow K.J. et al., 1961.
2. Llasticit de substitution mesure lincidence de la variation relative des prix des facteurs sur la
combinaison productive (le rapport K /L ).

174  CONOMTRIE

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 175

1) de transformer cette fonction de production par un passage aux logarithmes ;


2) destimer les paramtres du modle ;
3) de comparer les rsultats avec ceux obtenus lexercice 1.
Solution
1) Transformation du modle
Q = 1 [2 K 3 + (1 2 )] L 3 ]4
Log(Q) = Log(1 ) + 4 Log [2 K 3 + (1 2 ) L 3 ]
Nous observons que cette fonction de production nest pas linarisable (contrairement la fonction de production de type Cobb-Douglas). Il convient donc dutiliser une
technique destimation des modles non linaires.
2) Estimation des paramtres
Les instructions du logiciel Eviews sont les suivantes :
PARAM 1 12. 2 1. 3 0.5 4 0.5

Initialisation des 4 paramtres

NLS Q = C(1)*(C(3)*K^C(4))+(1C(3))*L^C(4))^C(2)

quation

Rsultats

La fonction de production estime scrit :


Q = 1 [2 K 3 + (1 2 ) L 3 ]4
= 11,21 [0,404 K 0,597 + 0,594 L 0,597 ]1,38
3) Comparaison des rsultats entre une fonction de production Cobb-Douglas et une
fonction de production de type CES
Lors de lexercice 1, nous avons estim les rendements dchelle de la fonction
2 = 0,89) qui sont significativement dcroissants.
Cobb-Douglas (
1 + 
Pour la fonction de type CES, nous avons :
3
4 = 1,38 0,597 = 0,82 < 1

=
Les rendements dchelle sont dcroissants, et llasticit de substitution constante
est gale :
3 ) = 0,42
1/(1

Les modles non linaires  175

9782100721511-Bourbo-C06.qxd

20/10/14

15:21

Page 176

9782100721511-Bourbo-C07.qxd

20/10/14

15:24

Page 177

7. Les modles

dcalages temporels

usqu maintenant, nous avons spcifi des modles o toutes les


variables sont exprimes la mme priode. Cependant, la thorie
conomique postule couramment non pas des effets synchrones
mais des effets retards.
Ces modles dcalages peuvent inclure comme variables retardes aussi
bien la variable endogne que les variables exognes. Nous tudierons,
tout dabord en I., les modles autorgressifs dont la variable retarde
est la variable endogne. Puis, en II., une autre classe de modle est envisage : les modles retards chelonns. Dans cette spcification, les
variables exognes apparaissent plusieurs dcalages.
Enfin, en III., nous prsentons deux exemples de modles dynamiques.

I. Les modles linaires autorgressifs


A. Formulation gnrale
Dans ce type de modles temporels, la variable endogne yt dpend :
de k variables exognes x1t , x2t , . . . , xkt lpoque t ;
des valeurs que prend la variable yt pendant les priodes prcdentes,
yt1 , yt2 , . . . , yth .
Soit la formulation :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
h

a
ou encore : yt =
bj yt j +
+ t
X
(n, k + 1) (k + 1, 1)
j=1

Les modles dcalages temporels  177

9782100721511-Bourbo-C07.qxd

20/10/14

15:24

Page 178

Dans ce modle, lhypothse H5, dindpendance entre les variables explicatives et lerreur, nest plus satisfaite car les variables yt1 , yt2 , . . . , yth qui
dpendent de t1 , t2 , . . . , th sont alatoires puisque yt+1 est fonction de yt
qui dpend de t , soit : E(yt+1 t ) = 0 .
Nous remarquons que si les variables exognes xit et les erreurs t sont
fixes, les variables endognes sont solutions de lquation de rcurrence :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + St

avec St = Xa + t .
Il est dmontr que la solution gnrale de cette quation de rcurrence est
explosive si une des h racines de son quation caractristique1 a son module
suprieur 1 .
Or nous devons considrer les processus explosifs que ce soit dune faon
monotone ou oscillatoire comme des phnomnes rares en conomie (les
variables sont limites gnralement dans leur croissance), cest pourquoi il
convient dajouter lhypothse de stabilit du processus.
Cas particulier : le modle autorgressif dordre 1
Le modle gnral spcifi ci-dessus est rarement utilis, le plus souvent
nous nous limitons des processus autorgressifs dordre 12, de la forme :
yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t

[1]

Ce modle est stable si |b1 | < 1 et explosif si |b1 | > 1 .

B. Test dautocorrlation et mthodes destimation


La mthode destimation adquate dpend dune ventuelle dpendance des
erreurs ; or, dans le cas dun modle autorgressif, le test de Durbin et Watson a
une puissance rduite et est biais. Cest pourquoi il convient dutiliser une autre
statistique, celle du h de Durbin.

1) Test dautocorrlation des erreurs


Dans le cas dun modle autorgressif dordre 1, le test classique de Durbin et
Watson sous-estime le risque dautocorrlation, un nouveau test dautocorrlation des erreurs doit alors tre utilis3. La statistique utilise est la suivante :
1. Lquation caractristique scrit r h b1 r h1 b2 r h2 . . . bh = 0 .
2. La variable yt dpend nanmoins des valeurs passes yt1 , yt2 , . . . y0 .
3. Durbin J., 1970.

178  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:24


h=


Page 179

n
2
1 n
b1

[2]

avec
 = 1 dw/2 (dw est la statistique de Durbin et Watson calcule sur la
modle [1]) ;
n = nombre dobservations ;
2

b1
= variance estime du coefficient b1 partir du modle [1].
Cette statistique h est distribue de manire asymptotique comme une
variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests
dhypothses suivants :
H0 : = 0

H0 : h = 0

H1 : = 0

H1 : h = 0

Si |h|  t /2 , nous acceptons lhypothse H0 dindpendance des erreurs.


(t /2 = valeur issue de la loi normale pour un test bilatral au seuil de .)
2
Nous remarquons que si n
b1
 1 , la statistique h ne peut pas tre calcule ; dans ce cas, nous pouvons utiliser la statistique de Durbin et Watson en
incluant la zone de doute dans la zone dautocorrlation des erreurs.

2) Estimation si les erreurs ne sont pas corrles


Dans le cas dabsence dautocorrlation des erreurs, les estimateurs des MCO
appliqus au modle [1] convergent asymptotiquement vers les valeurs vraies
des paramtres et ont une variance minimale parmi tous les estimateurs convergents.
Cependant, pour les petits chantillons, lors de lestimation dun modle
autorgressif dordre h , les rsultats asymptotiques sont alors trs approximatifs, car le nombre de priodes destimation est de n h . De plus, les problmes
de colinarit entre les variables explicatives dcales interdisent pratiquement
dutiliser les MCO.
En rsum, pour lestimation des modles autorgressifs erreurs indpendantes, lapplication de la mthode classique des MCO est licite si le nombre
dobservations est suffisant (souvent dans la pratique n > 15 ).

3) Estimation en cas dautocorrlation des erreurs


Le modle scrit alors :
yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t

avec

[3]

t = t1 + vt

Les modles dcalages temporels  179

9782100721511-Bourbo-C07.qxd

20/10/14

15:24

Page 180

Il sagit dun modle autocorrlation des erreurs, nous avons montr lors
du chapitre 5 que la transformation en quasi-diffrences premires peut lever
lautocorrlation des erreurs dordre 1.
Nous pouvons citer diffrentes mthodes destimation.
a) Rgression sur les diffrences premires
On procde deux rgressions par la mthode des MCO : la premire sur le
modle spcifi avec des variables non transformes et la seconde sur le modle spcifi avec des variables transformes en diffrences premires.
Si les deux rsultats destimation sont proches, nous pouvons conclure que
les paramtres du modle sont suffisamment bien dtermins sans rechercher la
liaison ventuelle des erreurs.
b) Correction de lautocorrlation des erreurs par rgression sur les quasidiffrences premires
Par une des mthodes prsentes au chapitre 5, nous procdons la correction
de lautocorrlation des erreurs : estimation directe de , Hildreth-Lu,
Cochrane-Orcutt.
c) Dautres mthodes
Nous pouvons aussi citer :
la mthode des variables instrumentales (cf. chapitre 5), o nous retenons
comme variable instrumentale la variable yt2 ;
la mthode du maximum de vraisemblance.
La mthode des variables instrumentales rsout le problme de convergence
des estimateurs lorsque nous sommes en prsence derreurs moyenne mobile
de type :
t = vt 1 vt1 2 vt2 . . . p vt p

Dans le cas derreurs autocorrles, nous devons utiliser une des mthodes
destimation robuste prsentes au chapitre 5.

4) Prvision dans un modle autorgressif


La prvision de la variable endogne y, lhorizon h , est donne par :

yn+h = 
yn+h1 + 
b1
a0 + 
a1 x1n+h + 
a2 x2n+h + . . . + 
ak xkn+h
yn+h1 se cumule dune prioLerreur qui affecte les valeurs successives de 
de sur lautre, et ainsi la variance de lerreur de prvision peut devenir trs
importante.

Lutilisation des fins de prvision du modle autorgressif doit donc tre


limite quelques priodes.

180  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:24

Page 181

Exercice n 1

fichier C7EX1

Estimation des paramtres dun modle autorgressif erreurs lies


Un conomtre dsire tester la relation entre les prix officiels (P O) de la tonne de
caf et les prix rellement appliqus lexportation (P E) par les pays producteurs. Il se
propose destimer la relation :
P Ot = a0 + a1 P Ot1 + a2 P E t + t
dans laquelle le prix officiel est fonction de manire instantane du prix observ et sajuste avec un retard dun an au prix officiel.
Il dispose des donnes, sur 16 ans, prsentes au tableau 1.

Tableau 1 Prix officiel et prix pratiqu


lexportation de la tonne de caf (en dollars)
t

PO

PE

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

455,0
500,0
555,0
611,0
672,0
748,5
846,0
954,5
1 090,0
1 243,5
1 390,0
1 559,0
1 781,0
2 046,5
2 311,0
2 551,0

615,0
665,0
725,0
795,0
870,0
970,0
1 095,0
1 235,0
1 415,0
1 615,0
1 795,0
2 015,0
2 315,0
2 660,0
2 990,0
3 280,0

On demande :
1) destimer la relation et de tester une ventuelle autocorrlation des erreurs ;
2) den corriger les effets, le cas chant.

Les modles dcalages temporels  181

9782100721511-Bourbo-C07.qxd

20/10/14

15:24

Page 182

Solution
1) Les rsultats de lestimation sont les suivants :
Dependent Variable : PO
Included observations : 15 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PO(1)
PE

7.078673
0.224016
0.622340

1.851077
0.037090
0.025520

3.824084
6.039727
24.38636

0.0024
0.0001
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.999980
0.999976
3.236240
125.6790
37.22668
0.625901

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1257.267
663.5723
5.363558
5.505168
294296.0
0.000000

Lquation est estim sur 15 priodes (n 1) car dans le modle figure une variable
retarde dune priode.
La statistique de Durbin et Watson laisse augurer dune autocorrlation des erreurs,
ce qui est confirm par le h de Durbin [2] :


n
h=

= 0,687
2
1 n
a1

15
= 2,68 > t 0,05 = 1,96
1 15 0,0013

Nous rejetons lhypothse H0, soit h = 0 = 0 .


2) Nous allons tout dabord comparer les estimations obtenues partir du modle brut
celles obtenues partir du modle en diffrences premires.
Nous procdons lestimation du modle en diffrences premires sur 14 ans car
nous perdons de nouveau une observation lors du calcul des diffrences premires de
P Ot1 .
Les rsultats sont les suivants :
Dependent Variable : D(PO)
Included observations : 14 after adjusting endpoints
Variable
C
D(PO(1))
D(PE)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

182  CONOMTRIE

Coefficient

Std. Error

t-Statistic

Prob.

2.891649
0.240680
0.598017

1.298314
0.024114
0.018553

2.227234
9.981022
32.23277

0.0478
0.0000
0.0000

0.999299
0.999172
2.197504
53.11925
29.19951
1.781510

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

146.5000
76.37030
4.599930
4.736871
7845.105
0.000000

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 183

Nous observons que les diffrences entre les coefficients de rgression sont assez
faibles pour a1 (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons considrer les rsultats obtenus la premire rgression comme valides.
Cependant, titre pdagogique, nous allons utiliser la mthode de correction dautocorrlation des erreurs.
Le modle estim, selon la mthode de Hildreth-Lu, est alors :
P Ot = 2,765 + 0,234 P Ot1 + 0,6135 P E t + et
(1,67)
(15,5)
(57,9)
et = 0,418 et1 + vt
R 2 = 0,99 ; n = 14 ; DW = 2,08 ; (.) = t de Student
Les prix officiels de la priode t sont donc plus influencs par les prix rellement pratiqus en t que par les prix officiels de lanne prcdente.

II. Les modles retards chelonns


A. Formulation gnrale
Dans certaines spcifications de modles conomtriques temporels, nous pouvons postuler que la variable endogne dpend des valeurs prises par une
variable exogne des poques antrieures, tel que :
yt = b0 + a0 xt + a1 xt1 + a2 xt2 + . . . + ah xth + t =

h


a j xt j + b0 + t

[6]

j=0

En gnral, leffet de la variable explicative sestompe avec le temps :


a0 > a1 > a2 > . . . > a h

Ce modle [6] peut se simplifier dans son criture en utilisant un oprateur


dcalage D dfini par : Dxt = xt1 et en gnral : D i xt = xti , soit :
yt =

h

j=0

a j xt j + b0 + t =

h


a j D xt + b0 + t =
j

j=0


h


aj D

xt + b0 + t

j=0

yt = A(D)xt + b0 + t

[7]

o A(D) est un polynme de degr h , tel que :


A(D) = a0 + a1 D 1 + a2 D 2 + . . . + ah D h

Le nombre de retards, h , peut tre fini ou infini. Cependant, la somme des


coefficients a j tend vers une limite finie, sinon yt serait un processus explosif.

Les modles dcalages temporels  183

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 184

Le polynme A(1) = a0 + a1 + a2 + . . . + ah permet de mesurer, long


terme, limpact de la modification de la variable explicative xt dune quantit
x sur la valeur de yt . En effet, les coefficients a j reprsentent les multiplicateurs instantans et leur somme le multiplicateur cumul.
Retard moyen
La notion de retard moyen permet dapprhender le laps de temps qui correspond la valeur moyenne des coefficients a j . Il est gal la moyenne pondre
des coefficients, soit :
h


D=

ja j

j=0

aj

a1 + 2 a2 + . . . + hah
A (1)
=
a0 + a1 + a2 + . . . + a h
A(1)

[8]

j=0

Lestimation des paramtres du modle [6] soulve deux types de difficults :


en pratique, la valeur h qui mesure limportance du nombre de retards est
rarement connue, mme si nous en connaissons lordre de grandeur ;
le second problme rsulte de la colinarit entre les variables exognes
dcales. En effet, lorsque le nombre de retards est important, la colinarit entre les variables explicatives dcales risque dentraner une imprcision dans lestimation des coefficients. Cest pourquoi, le plus souvent,
nous mettons des hypothses sur la forme de retards.
Ces deux points sont abords ci-dessous.

B. Dtermination du nombre de retards


Lorsque la valeur h du nombre de retards du modle [6] est inconnue, il existe
des critres statistiques permettant de la dterminer1.

1) Test de Fisher
Le test le plus naturel est celui de Fisher dans lequel nous testons lhypothse de
la nullit des coefficients de rgression pour les retards suprieurs h .
La formulation des hypothses est la suivante, lorsque lon teste, dune manire
descendante, une valeur de h comprise entre 0 et M : 0 < h < M .

1. Il sagit de dterminer quelle est la priode maximum dinfluence de la srie explicative. Il peut
trs bien arriver, cest mme souvent le cas, que des coefficients de rang infrieur au dcalage
h ne soit pas significativement diffrents de 0.

184  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

H01 : h = M 1 a M = 0
H02 : h = M 2 a M1 = 0

..
.
i
H0 : h = M i a Mi+1 = 0

15:25

Page 185

H11 : h = M
H12 : h = M 1

a M = 0
a M1 = 0

..
.
i
H1 : h = M i + 1 a Mi+1 = 0

Chacune de ces hypothses fait lobjet du classique test de Fisher, soit :


F1 =

(SC R Mi SC R Mi+1 )/1


SC R Mi+1 /(n M + i 3)

[9]

que lon compare au F lu dans la table 1 et (n M + i 3) degrs1 de libert.


Ds que, pour un seuil donn, le F empirique est suprieur au F lu, nous
rejetons alors lhypothse H0 i et la procdure est termine. La valeur du retard
est gale M i + 1 : h = M i + 1 .
Afin de pouvoir procder ce test dans ses conditions dapplication, la
Somme des Carrs Totaux doit rester constante dune estimation lautre. Cela
oblige donc estimer les diffrents modles avec un nombre dobservations identique correspondant donc au nombre dobservations rellement disponible pour
le dcalage le plus important, chaque dcalage entranant la perte dune donne.

2) Critre de Akaike (AIC)2


Une autre mthode consiste retenir comme valeur de h celle qui minimise la
fonction de Akaike qui est donne par :


SC Rh
2h
AI C(h) = Ln
+
n
n

[10]

avec SC Rh = Sommes des Carrs des Rsidus pour le modle h retards


n
= nombre dobservations disponible
(chaque retard entrane la perte dune observation)
Ln
= logarithme nprien

3) Critre de Schwarz (SC)3


Enfin, une mthode trs proche de la prcdente consiste retenir la valeur de
h qui minimise la fonction de Schwarz :


SC Rh
h Ln n
SC(h) = Ln
+
n
n

[11]

1. Le degr de libert du dnominateur est gal au nombre dobservations (n) moins le nombre de
paramtres estimer dans le modle [6]. Soit pour h = M i + 1 et en tenant compte du terme
constant et du coefficient de rgression pour la variable x 0 retard :
n (M i + 1) 1 1 = n M + i 3 .
2. Akaike H., 1973 ; 1974.
3. Schwarz G., 1978.

Les modles dcalages temporels  185

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 186

Exercice n 2

fichier C7EX2

Dtermination du nombre de retards dans un modle retards


chelonns
La thorie conomique postule que les dpenses dinvestissement (notes yt ) peuvent tre expliques par les profits passs (nots x t ). Le modle prend la forme dun
modle retards chelonns tel le modle [6].
Nous disposons dun extrait des donnes trimestrielles du tableau 2 concernant lindustrie chimique franaise.
Ntant pas certains de la spcification exacte du modle, nous dsirons tout dabord
rechercher le nombre de dcalages trimestriels qui semblent avoir un effet sur les
dpenses dinvestissement. Puis aprs avoir dtermin le nombre de retards, nous calculerons le dlai moyen.
Tableau 2 Dpenses dinvestissement et profit
(en millions deuros)
Trimestre

yt

xt

1
2

43
44

2 072
2 077

2 840
2 837

1 660
1 926

3 449
3 764

Solution
Nous procdons aux estimations des modles sur 34 trimestres, puisque le dcalage
maximum test est de 10, on limine les 10 premires observations.
Nous calculons les trois critres : Akaike, Schwarz et Fisher laide dun programme Eviews en tlchargement (C7EX2).
Les rsultats sont consigns dans le tableau 3.
Tableau 3 Rsultats de la recherche du nombre de dcalages optimal
Dcalage
0
1
2
3
4
5
6
7
8
9
10

186  CONOMTRIE

Akaike

Schwarz

Fisher

11,96
11,50
11,04
10,55
10,25
9,99
9,84
9,88
9,96
10,03
10,10

11,96
11,54
11,12
10,68
10,42
10,21
10,10
10,19
10,31
10,43
10,55

16,82
18,91
19,18
10,89
8,59
6,86
1,09
0,13
0,77
0,25

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 187

Nous observons immdiatement que les minima des deux critres (AI C(h) et
SC(h) ) sont situs sur la ligne 6, correspondant donc 6 dcalages. La premire valeur
du Fisher empirique qui est significative en partant du retard 10 est celle de la ligne
5. Elle est gale 6,86, ce qui vient confirmer une influence de la variable explicative
allant jusqu un dcalage de 6 priodes.
Nous allons dtailler le calcul des critres1 de Akaike et Schwarz pour le retard 6. Le
rsultat de lestimation pour 6 retards est le suivant :
Variable expliquer : Y
n = 38
Variable

Coefficient

cart type

t de Student

Prob.

501,5414

154,8486

3,238915

0,0029

0,011389

0,081532

0,139687

0,8898

X( 1)

0,061265

0,124906

0,490487

0,6274

X( 2)

0,227569

0,119635

1,902194

0,0668

X( 3)

0,167932

0,112997

1,486158

0,1477

X( 4)

0,118734

0,127454

0,931580

0,3590

X( 5)

0,000169

0,136907

0,001235

0,9990

X( 6)

0,237174

0,084065

2,821310

0,0084

R2 = 0,92

0,921953

Somme des carrs des rsidus =

521116,1

Daprs [10], nous avons :



AI C(6) = Ln

26
521116
+
= 9,84
38
38

Et daprs [11] :

SC(6) = Ln

6 Ln (38)
521116
+
= 10,10
38
38

Nous remarquons que la probabilit critique du coefficient de la variable X(-6) est


largement infrieure 0,05 ; le coefficient est donc significativement diffrent de 0. Ceci
est videment conforme aux rsultats prcdents.
Les trois critres sont (heureusement) cohrents, le modle retards chelonns comporte 6 retards : linvestissement des entreprises de ce secteur est fonction des profits raliss sur les six derniers trimestres, soit un an et demi. Il convient de noter que seul le
coefficient du sixime retard est significativement diffrent de 0.
Le graphique 1 illustre la structure de pondration des retards pour le modle ainsi
estim.

1. Nous ne revenons pas sur le test de Fisher qui a t dj abondamment illustr.

Les modles dcalages temporels  187

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 188

Graphique 1 Structure de la pondration des retards


Le retard moyen est gal daprs [8] :
6


D=

j
aj

j=0
6


=

aj

0,0612 + 2 0,227 + 3 0,168 + . . . + 6 0,237


= 3,64
0,011 + 0,227 + 0,168 + . . . + 0,237

j=0

Le dlai moyen de raction est 3,64 trimestres, soit presque une anne.

C. Distribution finie des retards


Considrant que nous avons dtermin la longueur des retards h , il convient
destimer les coefficients ai du modle. Cependant, lutilisation des MCO peut
se rvler impossible du fait de la multicolinarit entre les variables explicatives dcales. Cest pourquoi, dans ce contexte, nous allons prsenter une
mthode permettant, moyennant des hypothses sur la forme des coefficients, de
rduire le nombre de paramtres estimer.
Fonction polynomiale des retards (retards dAlmon1)
Nous pouvons imaginer une infinit de formes concernant la distribution des
coefficients ai (graphique 2). La mthode des retards dAlmon est trs utilise,
car elle permet de dgager des profils de retards sadaptant des reprsentations
diffrentes.
1. Almon S., 1965.

188  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 189

Cette technique consiste imposer aux coefficients dappartenir un mme


polynme de degr q (graphique 3), tel que :
ai = 0 + 1 i + 2 i 2 + . . . + q i q =

q


j i j

[12]

j=0

Par exemple, pour un polynme de degr 2 ( q = 2 ), nous avons la squence


des coefficients :
a0
a1
a2
a3


= 0
a0
1
= 0 + 1 + 2
a1 1
ou encore =
1
a2
= 0 + 21 + 42
a
1
3
= 0 + 31 + 92

0 0  
0
1 1
1
2
2 2
2
2
3 3
H

Graphique 2 Exemples de structures de retards

Nous pouvons gnraliser la formule prcdente pour h retards et un polynme de degr q .


a0
1
a1 1

a2 1
=
a3 1
. .
.. ..

ah
(h + 1, 1)

0
1
2
3
..
.

0
1
22
32
..
.

1 h

h2

..
.

..
.

(h + 1, q + 1)


0
0
1

1
q

2
2
q

3
.3
..
. ..

hq

[13]

q
(q + 1, 1)

Les modles dcalages temporels  189

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 190

Graphique 3 Exemples de retards polynomiaux

Le modle initial Y = Xa + peut alors scrire Y = X H + = Z +


dans lequel X H = Z est la matrice des observations des nouvelles variables
explicatives.
Lestimation par la mthode des MCO des q + 1 coefficients ,
(
0 , 
1 ,. . . , 
q ), permet dobtenir, partir des relations [12], les estimations des
a0 , 
a1 ,. . . , 
ah ) .
h + 1 paramtres de a (
Dans cette mthode, nous sommes confronts un double choix :
la valeur h du nombre de retards (nous avons la rponse, cf. 2),
le degr du polynme.
Le degr du polynme q , q < h , peut tre dtermin laide dun test portant sur la significativit, par rapport 0, du coefficient (q ) de la dernire
nouvelle variable explicative. En partant dune valeur q = h 1 , on teste la
significativit du coefficient du terme le plus lev laide dun t de Student
et on rduit le degr du polynme jusqu ce que ce coefficient soit significatif.
Les logiciels dconomtrie traitant des estimateurs dAlmon offrent la possibilit dintroduire des contraintes supplmentaires concernant les valeurs des
coefficients a1 et/ou ah+1 afin quelles soient nulles. Cela se justifie par le fait
que a1 est le coefficient thorique de la variable xt+1 qui est sans influence
sur yt .

190  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 191

Exercice n 3

fichier C7EX2

Estimation des coefficients laide dun polynme


(mthode dAlmon)
En reprenant le modle Investissement/Profit de lexercice 2, on demande destimer les coefficients par la mthode des retards dAlmon.
Solution
Le corrig de cet exercice est ralis laide de Eviews, qui permet le recours direct
la technique du polynme dAlmon.
Linstruction est la suivante : LS Y C PDL (X, 6, 4, 1)
PDL : Polynomial Distribued Lag
X = srie explicative
h = 6 : nombre de dcalages (rsultat de lexercice 2) ;
q = 4 : degr du polynme (aprs un essai avec q = 5 , le coefficient de la variable
PDL5 nest pas significativement diffrent de 0),
1 = indicateur de la contrainte : a1 = 0 (cet indicateur vaut 0 si lon ne dsire aucune contrainte, 2 pour la contrainte ah+1 = 0 et 3 pour les deux contraintes simultanes).
Rsultats
Dependent Variable : Y
Method: Least Squares
Included observations : 38 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
PDL01
PDL02
PDL03
PDL04

511.6833
0.193452
0.215794
0.055823
0.004228

143.4181
0.120131
0.103537
0.025884
0.001956

3.567774
1.610334
2.084228
2.156616
2.160957

0.0011
0.1169
0.0450
0.0384
0.0381

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.921681
0.912187
125.8826
522932.5
234.9825
0.583162

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

2567.553
424.8027
12.63066
12.84613
97.08789
0.000000

Les modles dcalages temporels  191

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 192

Les coefficients du polynme (i ) sont reprsents par les variables PDLi, ils sont
(presque) tous significativement diffrents de 0. La prsence dune contrainte entrane la
perte dun degr de polynme.
Le calcul des coefficients et la structure de pondration apparaissent directement
aprs, les coefficients (ai ) sont tous significativement diffrents de 0, sauf ceux des
variables xt et xt5 .
Le graphique 4 prsente les coefficients calculs lors de lexercice 2 et les coefficients ajusts laide du polynme estim.

Graphique 4 Ajustement des coefficients laide dun polynme de degrs 4

D. Distribution infinie des retards


Dans ce type de modle, leffet de la variable exogne nest plus limit dans le
temps, mais a un effet illimit, bien que, naturellement, cet effet sestompe pour
les priodes anciennes.
yt =

a j xt j + b0 + t =

j=0


j=0

a j D xt + b0 + t =
j

aj D

xt + b0 + t [14]

j=0

Afin de se ramener un nombre fini de paramtres estimer, nous devons


postuler une forme particulire que peut prendre la succession des coefficients
a0 ,a1 ,a2 ...
Nous pouvons admettre plusieurs types de spcifications, deux modles particuliers les plus utiliss font lobjet dune prsentation :

192  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 193

une dcroissance gomtrique des effets de la variable exogne avec le


temps ;
une croissance suivie dune dcroissance.

1) Modle de Koyck (progression gomtrique)


Le modle de Koyck1 postule une dcroissance gomtrique de la structure des
retards (graphique 5) telle que, dans le modle [14], les coefficients soient lis
de la manire suivante :
a1 = a0
a2 = 2 a0
et en gnral ai = i a0 avec 0 < < 1

Soit
yt = b0 + a0 xt + a0 xt1 + 2 a0 xt2 + . . . + i a0 xti + . . . + t

ou encore :
yt = b0 + a0 (xt + xt1 + 2 xt2 + . . . + i xti + . . .) + t

Graphique 5 Modle de Koyck :


les coefficients suivent une progression gomtrique

La fonction A(D) associe est alors :


A(D) = a0 + a0 D 1 + 2 a0 D 2 + . . .

Le modle yt = A(D)xt + b0 + t peut alors scrire :


B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1 .
Or A(D) = a0 (1 + D 1 + 2 D 2 + . . .) = a0 (1 D)1
(somme dune progression gomtrique), nous avons donc B(D) = (1 D)/a0 .
1. Koyck L. M., 1954.

Les modles dcalages temporels  193

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 194

Soit (1 D)yt = a0 xt + (1 )b0 + (1 D)t ou encore :


yt = yt1 + a0 xt + (1 )b0 + t t1

[15]

qui est un modle autorgressif erreurs lies dont la procdure destimation a


t expose en I.
Cette transformation qui consiste passer dun modle retards chelonns un modle autorgressif est habituellement appele transformation de
Koyck . Nous pouvons noter que nous passons dun modle retards chelonns, difficile estimer par labondance des paramtres, un modle autorgressif, simple dans sa spcification.

2) Modle de Solow1 (distribution de Pascal)


Les coefficients sont distribus selon :
i
i
est le coefficient du binme de Newton, r et
ai = (1 )r+1 Cr+i
i o Cr+i
sont deux paramtres avec 0 < < 1 et r N .
Pour r = 0 , nous retrouvons la distribution gomtrique de Koyck, le graphique 6 illustre la distribution des coefficients des retards.

Graphique 6 Distribution de Pascal des coefficients pour diffrentes valeurs de r

Le modle gnral scrit :


yt = b0 +

i=

i
(1 )r+1 Cr+i
i xti + t ou encore
i=0

yt = A(D)xt + b0 + t

[16]

Une dmonstration analogue la prcdente permet dcrire le modle [16]


B(D)yt = B(D)A(D)xt + B(D)b0 + B(D)t avec B(D) = A(D)1
1. Solow R., 1960.

194  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 195

avec :
pour r = 0 B(D) = (1 D)/a0 , soit le modle prcdent
pour r = 1 B(D) = (1 D)2 /a0
Soit :
yt = 2yt1 2 yt2 + a0 xt + (1 2 + 2 )b0 + vt

[17]

avec vt = (1 2D + 2 D 2 )t = t 2t1 + 2 t2
pour r = 2 B(D) = (1 D)3 /a0
Soit :
yt = 3yt1 32 yt2 + 3 yt3 + a0 xt + (1 3 + 32 3 )b0 + vt

[18]

avec vt = (1 3D + 32 D 2 3 D 3 )t = t 3t1 + 32 t2 3 t3
Afin de dterminer les valeurs du paramtre r , Maddala et Rao (1971) suggrent lutilisation dune procdure de balayage dont2 la fonction objectif maximiser est le coefficient de dtermination corrig (R )

Exercice n 4

fichier C7EX2

Estimation des coefficients dun modle selon une spcification


des retards de Koyck et une distribution de Pascal
Nous reprenons les donnes du tableau 2 concernant la relation Investissement/Profit,
on demande :
1) destimer les paramtres du modle si on suppose que les coefficients suivent une
spcification de Koyck ;
2) de rechercher lordre dune distribution de Pascal et destimer les paramtres du
modle pour lordre adquat ;
3) de comparer les rsultats obtenus par les diffrentes mthodes employes lors des
exercices 2, 3 et 4 ;
4) enfin, de calculer llasticit de long terme des dpenses dinvestissement au
profit.
Solution
1) On suppose que les coefficients du modle retards chelonns suivent une progression gomtrique. Daprs [15], lestimation des paramtres du modle seffectue sous la
forme dun modle autorgressif autocorrlation des erreurs.
Les rsultats de lestimation du modle sont les suivants :

Les modles dcalages temporels  195

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 196

yt = 222,23 + 0,907yt1 + 0,179xt + et


(2,10)
(25,24)
(7,59)
n = 43
R 2 = 0,95
(.) = t de Student
DW = 0,97
Nous avons utilis directement la mthode des MCO, car la mthode de correction
dautocorrlation des erreurs envisages en I donne des rsultats quasiment identiques.
Nous obtenons :

b0 = 222,23/(1 0,907) = 2 400,23
= 0,907 ; 
a0 = 0,179 ; 
Le modle peut donc scrire :
yt = 2 400,23 + 0,179 xt + 0,907 0,179 xt1 + 0,9072 0,179 xt2 + . . . + et
ou encore : yt = 0,907 yt1 + 0,179 xt 222,23 + et
2) Nous supposons maintenant que les coefficients suivent une distribution de Pascal.
yt = 40,78 + 1,42yt1 0,54yt2 + 0,096xt + et
(0,40) (13,59) (5,10)
(3,83)
n = 42
R 2 = 0,97
(.) = t de Student
DW = 2,22

Il sagit donc destimer des modles autorgressifs dordre 1, 2, 3, etc. Afin de dterminer lordre, nous avons procd toutes les estimations de ces modles. partir dun
modle autorgressif dordre 3, les coefficients ne sont plus significativement diffrents
de 0. Le modle autorgressif dordre 1 ayant dj t estim, nous avons procd lestimation du modle dordre 2.
Daprs [17], nous obtenons en procdant par identification :



0,541  1,426/2  0,72 ; 


a0 = 0,096 ;


+
2 ) = 40,78/0,0784 = 520,15
b0 = 40,78/(1 2
Le modle estim est alors :
yt = 1,426 yt1 0,541 yt2 + 0,096 xt + 40,78 + et
ou encore : yt = 520,15 +

i=


i
(1 0,72)2 C1+i
0,72i xti + et

i=0

196  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 197

3) Comparaison des mthodes


Nous pouvons construire le tableau 4 dans lequel nous indiquons les valeurs des
coefficients associes chaque retard (limits 6 pour les modles retards infinis), la
somme des retards et le dlai moyen, ceci pour les quatre mthodes employes.
Tableau 4 Comparaison des mthodes de calcul des coefficients
Retard

Non

Almon

contraint1

q=4

0,01138
0,06126
0,22756
0,16793
0,11893
0,00016
0,23717

0,0292
0,09733
0,19701
0,18851
0,0920
0,02912
0,22298

0,1795
0,1623
0,1472
0,1335
0,1211
0,1098
0,0996

0,0784
0,0169
0,2438
0,2926
0,3160
0,3185
0,3058

Somme

0,0814

0,7977

0,9530

1,7246

Dlai moyen

3,6421

3,6459

2,1026

3,6104

i
0
1
2
3
4
5
6

Koyck

Pascal
r=1

la lecture de ces rsultats, nous constatons la diversit des profils des coefficients
estims. En effet, nous avons tent, des fins pdagogiques, de faire correspondre les
coefficients des structures bien dtermines qui reprsentent des spcifications de
modles diffrentes les unes des autres. Dans la pratique, cette dmarche est absurde car
il convient de tester une seule forme de spcification :
soit celle que la rflexion conomique nous conduit retenir ;
soit celle dont le profil du modle non contraint semble la plus proche.
4) Calcul de llasticit de long terme des dpenses dinvestissement au profit.
En considrant le modle distribution gomtrique des retards o la variable exogne et la variable endogne sont sous forme logarithmique :
Log yt = b0 + a0 Log xt + a0 Log xt1 + 2 a0 Log xt2 + . . . + t
Le modle, sous forme rduite, sexprime par :
Log yt = Log yt1 + a0 Log xt + c0 + vt
Llasticit de long terme est gal 2 : e LT = a0 /(1 ) , llasticit de court terme
est donne par : eC T = a0 , et le paramtre dajustement est .
Lestimation du modle Dpenses dInvestissement/Profit sous forme logarithmique
conduit aux rsultats suivants :
1. Modle non contraint = estimation libre des coefficients.
2. Llasticit de long terme est la somme des lasticits (les coefficients) aux diffrents dcalages,
soit une somme dune progression gomtrique de premier terme a0 et de raison .

Les modles dcalages temporels  197

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 198

Log yt = 0,904 Log yt1 + 0,184 Log xt 0,699 + vt


(27,3)

(8,48)

( 2,36)

n = 43
R 2 = 0,95
() = t de Student
a0 /(1 
) = 0,184/(1 0,904) = 1,91.
Soit : e LT = 
Llasticit de long terme est donc gale 1,91, nous sommes dans la zone des rendements croissants. Lorsque le profit augmente par exemple de 10 %, linvestissement
long terme augmente de 19,1 %.

III. Deux exemples de modles dynamiques


Les exemples dapplication des modles dcalages sont trs nombreux dans la
littrature. Nous allons en prsenter deux particulirement intressants.

A. Le modle dajustement partiel


Le plus souvent, en conomie, la rigidit des institutions ou des structures
empche les variables expliquer datteindre le niveau dsir en une seule priode. Examinons deux exemples :
Afin de faire face une augmentation de la demande, une entreprise cherche
se doter de moyens de production supplmentaires. Cependant cet investissement ne peut pas tre ralis immdiatement et demande un certain temps
dajustement.
Lors de laugmentation des prix du ptrole, les consommateurs et les institutions ragissent avec retard cette modification des prix. Il en rsulte qu
court terme le comportement des consommateurs ne reflte pas lajustement
qui sest produit long terme.
La formulation de ce modle est la suivante :
il est ncessaire de distinguer entre la valeur dsire, de la variable expliquer (ytD ) , et la valeur vraie de cette mme variable (yt ) . Le niveau dsir de la
variable expliquer est fonction de la variable explicative xt tel que :
ytD = a0 + a1 xt + t

[19]

Une modification de la valeur de xt entrane une modification de la valeur


dsire de la variable expliquer. Cependant, malgr une spcification simple,
nous ne pouvons pas appliquer les MCO puisque nous navons aucune mesure

198  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 199

de y Dt . En revanche, nous connaissons les valeurs de yt et nous pouvons spcifier une relation entre ytD et yt :
yt yt1 = (ytD yt1 ) avec 0   1

[20]

est appel le coefficient dajustement.

La relation [20] reprsente lajustement progressif qui sopre entre la valeur


dsire et la valeur observe.
Ce modle peut se ramener de manire simple un modle de Koyck.
En substituant lquation [19] dans [20], on obtient :
yt yt1 = (a0 + a1 xt + t yt1 )
yt = (1 )yt1 + a0 + a1 xt + t

ou encore

[21]

yt = b1 yt1 + c0 + c1 xt + vt dont on peut estimer les paramtres par la mthode


des MCO, avec b1 = (1 ) ; c0 = c0 ; c1 = a1 .

B. Le modle danticipations adaptatives


Dans cette spcification, les valeurs de la variable expliquer yt sont fonctions
des valeurs, non pas observes dune variable explicative, mais des valeurs
attendues, telles que :
yt = a0 + a1 xtP + t

[22]

o xtP est la valeur prvue de la variable explicative xt .


Par exemple, la production dune entreprise est fonction des valeurs prvues
des ventes.
Comme pour le modle prcdent, nous sommes confronts labsence de
mesure de la variable xtP . Pour lever cette difficult, nous devons poser une
hypothse concernant la formation de la variable xtP : celle des anticipations
adaptatives.
Cette relation scrit :
P
P
xtP xt1
= (xt xt1
) avec 0   1

[23]

o est le coefficient danticipation.


Nous remarquons que si = 0 , lanticipation reste constante quelles que
soient les ralisations de xt , le modle ne ragit pas aux nouvelles valeurs ralises. Si = 1, au contraire, les valeurs anticipes sont toujours gales aux
valeurs courantes. Dans la pratique, ce coefficient est donc compris entre ces
deux valeurs en fonction du degr de ractivit de lanticipation.
Lquation [23] peut aussi scrire :
P
xtP = xt + (1 )xt1
en dveloppant cette formule il vient :

Les modles dcalages temporels  199

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 200

xtP = xt + (1 )xt1 + (1 )2 xt2 + (1 )3 xt3 + . . .


i=

xtP =
(1 )i xti

[24]

i=0

En remplaant xtP par son expression dans [22] :


yt = a0 + a1

i=

(1 )i xti + t
i=0

qui est un modle retards chelonnes1 dont une transformation de Koyck permet de mettre sous une forme autorgressive :
yt = a0 + a1 xt + (1 )yt1 + [t (1 )t1 ]

Nous pouvons estimer ce modle autorgressif autocorrlation des erreurs,


et ainsi, en dduire une estimation des paramtres , a0 , a1 .
Il est noter que ces deux modles peuvent tre combins, bien qualors
cette spcification semble un peu abondante et dinterprtation dlicate.

Exercice n 5

fichier C7EX2

Estimation dun modle dajustement partiel


et danticipations adaptatives
partir des donnes du tableau 2, on dsire estimer les paramtres dun modle
dajustement partiel et les paramtres dun modle danticipations adaptatives.
Solution
Nous estimons le modle autorgressif dordre 1 avec autocorrlation des erreurs
(mthode Hildreth-Lu) :
yt = 103,07 + 0,882 yt1 + 0,1555 xt + et
(0,47) (11,04)
(4,41)
et = 0,5489 et1 + vt
R 2 = 0,96 ; n = 42 ; DW = 1,83 ; () = t de Student
Soit : 
= 1 0,882 = 0,1178 ; 
a0 = 103,07/0,1178 874,9 ;

a1 = 0,1555/0,1178 1,32
Modle dajustement partiel :
ytD = 874,9 + 1,32 xt + et et yt yt1 = 0,118(ytD yt1 )
Modle danticipations adaptatives :
P
P
yt = 874,9 + 1,32 xtP + et et xtP xt1
= 0,118(xt xt1
)

1. Nous remarquons que la valeur de la variable expliquer y dpend dune pondration gomtriquement dcroissante de la variable explicative x . Cette structure de pondration est le fondement de la mthode de prvision appele lissage exponentiel .

200  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 201

Exercice n 6
Modlisation du prix dune matire premire
Nous nous intressons modliser lvolution du prix dune matire premire yt
selon un modle autorgressif dordre 1 et une variable exogne xt la demande partir dune quation de la forme : yt = a1 yt1 + a2 xt + t [E1] avec t rpondant aux
hypothses classiques. Les donnes ont t pralablement centres sur leur moyenne.
Lestimation de lquation [E1] sur 22 priodes donne :
yt = 0,757yt1 + 0,256xt + et
(0,025)

[E2]

(0,02)

R2 = 0,996 ; DW = 2,17 ; n = 22 ; (.) = cart type


1) Le coefficient de dtermination a-t-il une signification dans cette quation ?
2) Le coefficient a2 est-il significativement diffrent de zro ?
3) Les erreurs du modle sont-elles autocorrles lordre 1 ?
4) Quel est, long terme, linfluence dune augmentation de la demande xt de 1 unit
sur le prix yt ?
5) En effectuant une nouvelle rgression de yt sur yt1 seule, on obtient :
yt = 0,615yt1 + et

[E3]

(0,044)
R2 = 0,981 ; DW = 1,64 ; n = 22
Est-il normal ou fortuit que le R2 soit plus lev dans lquation [E2] que dans
lquation [E3] ?
6) En tant la variable xt dans la rgression [E3] le coefficient de yt1 a t modifi,
pourquoi ?
7) Que signifierait un modle du type yt = ayt1 + t dans lequel a serait suprieur l ?
8) Lestimation selon une mme spcification mais pour une autre matire premire
donne :
yt = 0,695yt1 + 0,336xt + et
(0,053)
R2

[E4]

(0,046)

= 0,984 ; DW = 2,27 ; n = 22

Les coefficients a1 sont-ils significativement diffrents entre la rgression [E2] avec


ceux de lquation [E4] ?
Solution
1) Bien que le modle ne possde pas de terme constant, le R2 peut sinterprter car les
donnes ont t pralablement centres sur leurs moyennes.

Les modles dcalages temporels  201

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 202

2) Le coefficient a2 est significativement diffrent de zro car t* = 0,256/0,02 = 12,8 >


0,05
t19
= 2,09.

3) Nous sommes dans les conditions dapplication de la statistique de Durbin et Watson


car bien que le modle ne possde pas de terme constant, le DW peut sinterprter car
les donnes ont t pralablement centres. Mais il existe un biais de sous-estimation d
au modle autorgressif. Il faut calculer le h de Durbin :

DW
n
2,17/2 = 0,085
h=
avec = 1
2
2
1 n a1

n = nombre dobservations
2
a1
1 de la variable dcale
= variance estime du coefficient a

Cette statistique h est distribue de manire asymptotique comme une variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests dhypothses suivants :
H0 : = 0

H0 : h = 0

H1 : 0

H1 : h 0

Si |h| < t

/2

nous acceptons lhypothse H0 dindpendance des erreurs.

(t 0,05 = 1,96 valeur issue de la loi normale pour un test bilatral au seuil de 5%).

22
= 0,40 < t 0,05 = 1,96 , nous acceptons lhypo|h| = 0,085
1 22 0,0252
thse dindpendance des erreurs.
4) la priode 1 : yt = 0,757yt1 + 0,256xt = 0,757 0 + 0,256 1 = 0,256
la priode 2 : yt = 0,757 0,256 = 0,194
la priode 3 : yt = 0,757 0,194 = 0,146
Il sagit dune progression gomtrique de premier terme U0 = 0,256 et de raison
q = 0,757 < 1.
La somme tend vers une limite finie et est gale : U0 / (1 q) = 0,256 / ( 1 0,757)
= 1,053.
Le prix augmentera de 1,053 unit long terme.
5) Il est normal que le R2 soit plus lev dans lquation [E2] que dans lquation [E3]
car une variable explicative a t retire du modle ce qui entraine une diminution de la
somme des carres des rsidus.
6) cause de la covariance existant entre les variable yt1 et xt .
7) Un modle du type yt = ayt1 + t dans lequel le coefficient a serait suprieur l
conduirait une solution explosive (croissance infinie) ce qui impossible.
8) Tests de comparaison de coefficient
H0 : a1,MP1 = a1,MP2
H1 : a1,MP1 a1,MP2
(a 1,M P1 a 1,M P2 ) 0
0,757 0,695
=
= 1,05 suit une Student
a 1,M P 1 a 1,M P 2
0,0252 + 0,0532
n 1 + n 2 6 = 38 degrs de libert, la covariance entre a1,MP1 et a1,MP2 est nulle car les
deux rgressions sont indpendantes (les deux chantillons sont diffrents),
0,05
= 1,96 donc non rejet de H0.
t = 1,05 < t
t =

202  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 203

Exercice n 7
Un modle dvaluation de la politique marketing
Nous intressons mesurer limpact de la publicit et des promotions sur les ventes
dun produit. Les impacts sont mesurs au moyen destimations en coupe instantane
menes sur des chantillons reprsentatifs de produit de grande consommation forte
pression marketing de deux secteurs : les produits cosmtiques et les dtergents.
Les chiffres entre parenthses sous les coefficients de rgression sont les carts types
des coefficients.

Partie A
Le premier modle test est le suivant :
Vit = a0 + a1 Pu it + a2 Prit + it

[E1]

Vit = Vente en volume du produit i pour lanne t


Pu it = Dpenses publicitaires en euros pour le produit i pour lanne t
Prit = Dpenses promotionnelles en euros pour le produit i pour lanne t
Les rsultats obtenus pour une anne (t = 1) pour le secteur des cosmtiques est le
suivant :
Vi = 812,86 + 29,94Pu i + 21,31Pri + ei
(10,73)

i = 1, ..., 20

(8,23)

R2 = 0,868 ; DW = 1,68 ; Somme des Carrs des Rsidus = SCRC = 291


1) Interprter dun point de vue statistique ce rsultat destimation.
2) Thoriquement si lentreprise respecte une politique optimale dallocation de son
budget publi-promotionnel (marketing mix), les effets positifs dun euro dpens en
publicit ou en promotion sont gaux ( a1 = a2 ). Sachant que Cov( a 1 , a 2) = 6,75, effectuez le test permettant de savoir si cette politique optimale est vrifie.
3) Une interrogation concernant les tudes menes sur des chantillons dentreprises
rside en lexistence de comportements homognes.
Nous procdons donc deux nouvelles estimations.
Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents est
le suivant :
Vi = 627,32 + 14,27Pu i + 17,87Pri + ei
(3,12)

i = 1, ..., 20

(5,57)

R2 = 0,41 ; DW = 1,68 ; SCRD = 249


Les rsultats obtenus pour la mme anne (t = 1) pour le secteur des dtergents et
des cosmtiques sont les suivants :
Vi = 785 + 16,56Pu i + 18,91Pri + ei

i = 1, ..., 40

SCRT = 926

Les modles dcalages temporels  203

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 204

Tester lhomognit des comportements dans ces deux secteurs. Quen concluezvous ?
4) Dans le mme esprit nous disposons pour le secteur des cosmtiques dune estimation pour lanne suivante (t = 2), nous allons donc chercher tester la stabilit temporelle pour ce secteur.
Sachant que lestimation du modle en t = 2 indique SCR2 = 316 (i = 1, ... , 20) et
quune estimation pour t = 1 et t = 2 indique SCRT = 1054, quen concluez-vous ?

Partie B
Un des problmes de ce type de modlisation consiste en un biais d des variables
omises, en particulier des variables caractristiques du produit.
1) Supposons que ces variables soient additives et peuvent tre synthtises globalement
par une seule note Fi , cette variable est constante dans le temps car il sagit dune
caractristique permanente du produit. Cependant cette variable nest pas mesurable.
Le modle scrit donc maintenant :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it

[E2]

O t dsigne lanne destimation et i le produit.


Sachant que nous disposons des donnes pour 20 produits pour deux annes conscutives, comment estimer les paramtres du modle intgrant cet effet individuel sans
quil apparaisse effectivement ?
2) Si cet effet individuel nest pas additif mais multiplicatif nous considrons alors quil
peut tre fonction du budget marketing Mit du produit i pour lanne t. On appelle
Vt
kt =
, le rapport moyen entre les ventes totales et le budget total marketing dans
Mt
lchantillon pour tous les produits pour lanne t.
Sous lhypothse que les effets individuels sont constants dans le temps on peut dfi 
 
V
V
Vi(t1)
=
kt1
nir une variable
telle que
M
M i(t1)
Mi(t1)
Interprter le sens de cette variable conomique. En quoi son introduction dans
lquation [E1] permet-elle de mesurer les effets individuels ?
3) On a obtenu pour les secteurs des cosmtiques et des dtergents les rsultats pour
lanne t = 1.
Cosmtique :

 
V
+ ei
Vi = 582 + 25,19Pu i + 23,81Pri 0,97
M i(t1)
(9,3)
(5,7)
(0,37)

i = 1,...,20

R2 = 0,967
Dtergent :

 
V
Vi = 328 + 17,78Pu i + 18,74Pri 0,49
+ ei
M i(t1)
(5,7)
(8,2)
(0,21)

R2 = 0,967

204  CONOMTRIE

i = 1,...,20 .

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 205

Laugmentation des coefficients de dtermination R2 pour chaque quation est-elle


suffisante pour affirmer que la relation estime est de meilleure qualit que lquation
[E1] ? Sinon comment jugez-vous de lamlioration ou la dtrioration des rsultats.
 
V
4) Les coefficients des variables
pour le modle cosmtique et dtergent
M i(t1)
sont-ils significativement diffrents ?

Partie C
Un des biais envisageables dans lquation [E1] est que les ventes dun produit
soient fonction dun vnement imprvu. Dans cette situation, cela peut crer un biais
sur les ventes du produit qui diffre de ce quelles seraient dans des conditions normales.
Pour effectuer des prvisions correctes, on peut redresser ce biais en introduisant comme
variable supplmentaire dans [E1] les ventes de la priode prcdente :
Vit = a0 + a1 Pu it + a2 Prit + a3 Vit1 + it

[E3]

On a obtenu pour les secteurs des cosmtiques les rsultats pour lanne t = 1.
Vit = 1,52 + 2,52Pu it + 6,36Prit + 0,75Vit1 + eit
(1,1)

(1,7)

i = 1,...,20

[E4]

(0,3)

R2 = 0,979
1) Interprter dun point de vue statistique et conomique ces rsultats, est-il envisageable dans lquation [E3] de tester une ventuelle autocorrlation des erreurs ?
2) Pour ce modle cosmtique nous avons effectu la rgression suivante :
eit2 = 2,1Pu it + 0,18Prit + 5,8 + u it
(0,2)

i = 1,...,20

(0,5)

eit = Rsidu de la rgression [E4]


Pourquoi procder cette rgression ? Quen concluez-vous et que proposez-vous ?
Solution
A.1) Soit les tests suivants mener.
Test de significativit globale de la rgression : H0 : a1 = a2 = 0
Soit le test de Fisher : F =

R 2 /k
0,868/2
=
k 1)
(1 0,868)/(20 2 1)

R 2 )/(n

(1
0,05
= 3,59 , nous rejetons lhypothse H0, il existe au moins une variables
= 55,89 > F2;17
Pu i ou/et Pri dexplicative de Vi
Tester H0 : a1 = 0 contre lhypothse H1 : a1 0
Le test dhypothses bilatral consiste donc comparer le ratio de Student empia 1

= 2,79 la valeur du t de Student lue dans la table 20 2 1 = 17


rique ta1
=
a 1
0,05
= 2,11. Puisque
degrs de libert et pour un seuil de probabilit gal 5%, soit t17
0,05

ta1
=
2,79
>
t
=
2,11
a1 est donc
,
nous
refusons
lhypothse
H0,
le
coefficient
17

significativement diffrent de 0.

Les modles dcalages temporels  205

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 206

Soit tester H0 : a2 = 0 contre lhypothse H1 : a2 0


a 2
0,05
= 2,59 > t17
= 2,11 nous refusons lhypothse H0, le coefficient a2 est
a 2
donc significativement diffrent de 0.

ta2
=

Le modle tant spcifi en coupe instantane et nayant aucune information sur


un ventuel tri des donnes selon un critre, la statistique de Durbin et Watson nest pas
interprtable.
A.2) Le test dhypothse est : H0 : a1 = a2
Sous lhypothse H0 t =

|(a 1 a 2 ) 0|
suit une loi de Student 17 degrs de
a 1 a 2

libert.
Il convient de calculer : a 1 a 2
Var(a 1 a 2 ) = Var(a 1 ) + Var(a 2 ) 2 Cov(a 1 ,a 2 )
= 10,732 + 8,232 2 6,75 = 169,36
|29,94 21,31|
0,05
2,11 . Nous acceptons lhypothse
= 0,66 < t17

169,36
H0, la politique optimale est donc respecte.
Do : t =

A.3) Soit tester (test de Chow) lhypothse H0 : SC RT = SC R D + SC RC H0 :


SC RT (SC R D + SC RC ) = 0
La statistique du Fisher empirique du test de Chow est donne par :
(SC RT (SC R D + SC RC ))/(k + 1)
F =
qui suit alors une loi de Fisher
(SC R D + SC RC )/(n 2(k + 1))
(k + 1) et n 2(k + 1) degrs de libert.
(926 (291 + 249))/3
0,05
2,92 . Nous refusons lhypo 8,10 > F3;34
(291 + 249)/(34)
thse H0, les comportements sont htrognes entre les deux secteurs.
Soit, F =

A.4) Il sagit toujours du test de Chow mais men maintenant en donnes temporelles.
(1 054 (291 + 316))/3
0,05
2,92 . Nous rejetons lhy 8,34 > F3;34
Soit, F =
(291 + 316)/(34)
pothse H0, les comportements sont diffrents, sur les deux annes tudies, pour le secteur des cosmtiques.
B.1) Nous avons :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it
Vit1 = a0t1 + a1t1 Pu it1 + a2t1 Prit1 + Fit1 + it1
Puisque les effets sont constants nous avons : Fit = Fit1
Nous pouvons alors crire :
Vit Vit1 = (a0t a0t1 ) + a1t Pu it a1t1 Pu it1 + a2t Prit a2t1 Prit1
+it it1
Lestimation de ce modle permet de lever le biais du aux caractristiques de
produit.

206  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 207


V
Vi(t1)
Vi(t1)
V(t1)
=
kt1 =

mesure les dviaM i(t1)


Mi(t1)
Mi(t1)
M(t1)
tions individuelles du produit i par rapport au ratio des ventes totales sur les dpenses
marketing totales pour tous les produits de lanne antrieure. Ainsi cette variable capte
ce qui est spcifique du produit par rapport au comportement moyen tendanciel. Si le
coefficient de cette variable nest pas significativement diffrent de 0, cela signifie que
les produits ont tous le mme comportement et donc quil nexiste pas deffet individuel.


B.2) La variable

B.3) Le coefficient de dtermination est insuffisant pour valuer la pertinence dajout


dune variable explicative supplmentaire car mme une variable non significative
contribue augmenter la somme des carres expliques. En revanche il convient deffectuer un test de significativit par rapport 0 sur la variable nouvellement introduite.
|0,97|

= 2,62 et pour le secteur Dtergent :


Soit pour le secteur cosmtique : ta3
=
0,37
|0,49|
0,05

ta3
= 2,33, les deux ratios sont suprieurs t17
= 2,11. Lajout de la
=
0,21
 
V
variable
contribue significativement lexplication des ventes, il existe des
M i(t1)
effets individuels par produit. De plus, les coefficients des variables Publicit et
Promotion sont significativement diffrents de 0 et leurs valeurs se rapprochent, ce qui
correspond mieux lintuition thorique.
B.4) Le test dhypothse est : H0 : a3C = a3D
Sous lhypothse H0, t =

|(a 3C a 3D ) 0|
suit une loi de Student
a 3C a 3D

n 1 + n 2 2(k + 1) = 32 degrs de libert.


Il convient de calculer : a 3C a 3D
Var(a3C a3D ) = Var(a 3C ) + Var(a 3D ) 2 Cov(a 3C ,a 3D )
= 0,372 + 0,212 2 0 = 0,181
Les rgressions tant effectues sur des chantillons indpendants la covariance est
nulle.
| 0,97 + 0,49|
0,05
1,96 . Nous acceptons lhypothse H0,
= 1,13 < t

Do : t
0,181
les deux coefficients ne sont pas significativement diffrents entre eux.
C.1) Les coefficients du modle sont tous significativement diffrents de 0, les t de
0,05
= 2,11 nous refusons
Student empiriques des trois coefficients sont suprieurs t17
lhypothse H0 de nullit des coefficients. Nous ne pouvons pas interprter la statistique
de Durbin et Watson car le modle est estim en coupe instantane pour lanne t et nous
ne savons pas si les donnes ont t pralablement tries.
C.2) Lestimation de ce modle permet de tester une ventuelle htroscdasticit des
rsidus (test de White), le coefficient de la variable Pu it est significativement diffrent
de 0, il existe donc une htroscdasticit lie la variable Publicit.
Il convient donc de corriger le modle de lhtroscdasticit en procdant une
1
rgression pondre, dont le facteur de pondration est :
.
Pu it

Les modles dcalages temporels  207

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 208

Exercice n 8

fichier C7EX8

Une comparaison des courbes de Phillips franaise et amricaine1


Soit les donnes annuelles franaises et amricaines concernant les taux dinflation
et de chmage sur 34 ans. Le but de cet exercice est dessayer de valider empiriquement
les courbes de Phillips. Une dmarche progressive est propose. Dans un premier temps,
vous devrez estimer la courbe qui relie le taux dinflation au taux de chmage, puis celle
qui relie linflation et le chmage retarde dune priode. Dans un deuxime temps,
nous prendrons mieux en compte la dynamique qui relie linflation (niveau gnral des
prix) linflation salariale afin de valider empiriquement les mcanismes invoqus par
Phillips. Enfin, dans un dernier temps, les anticipations dinflation formes de manire
adaptative seront prises en compte. Il est noter que les sries peuvent suivre une dynamique dite non-stationnaire , des procdures destimation abordes au chapitre 9 permettent alors den tenir compte.
chofra = Chmage France
chousa = Chmage tats-Unis
inffra = Taux dinflation France
infusa = Taux dinflation tats-Unis
Premire partie : Courbes inflation-chmage
1) Visualiser successivement les deux courbes de chaque pays inflation-chmage dans
le plan (chmage en abscisse et inflation en ordonne). Constater la grande instabilit
de celles-ci.
2) Estimer conomtriquement les deux quations inflation-chmage (respectivement
France et tats-Unis) qui relient le niveau dinflation, variable explique (nomms respectivement inffra et infusa) une constante et au niveau retard du chmage, variable
explicative (nomms respectivement chofra et chousa).
Constater que cela ne modifie pas notablement les rsultats de prendre comme variable
explicative le taux de chmage contemporain et le taux de chmage retard. Dornavant,
nous considrerons le taux de chmage retard.
3) Examiner les rsidus des deux quations (chmage retard). Vous semblent-ils lis
par une dynamique cyclique ? (prsomption dautocorrlation des rsidus). Existe-t-il
des rsidus trs loigns des autres ? (prsomption de valeurs aberrantes).
4) Effectuer les tests de Durbin-Watson. Confirmer vos rsultats en utilisant les tests
dautocorrlation des rsidus de Breusch-Godfrey.

1. Merci Jean-Franois Jacques, professeur lUniversit de Paris-Est-Marne-la-Valle, auteur


de ce cas.

208  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 209

Deuxime partie : courbes de Phillips originelles (sans anticipation dinflation)


avec autocorrlation des rsidus et choc ngatif doffre (anne 11 et anne 17)
5) Construire une variable indicatrice appele DUM qui vaut 0 chaque date lexception des priodes 11 et 17 pour lesquelles elle vaut 1.
6) Soit les trois quations suivantes :
quation de Phillips originelle qui relie le taux de croissance des salaires nominaux
(w t ) au taux de chmage (u t ) : w t = (u u t1 ) avec u = constante.
quation qui relie inversement le taux de croissance de la production ( yt ) et celui du
1
chmage (pseudo-loi dOkun) : yt = u t avec u t = (u t u t1 ).

quation de quasi-offre ou ce qui identique formellement quation de fixation des prix


(p t ) en taux de croissance en concurrence imparfaite : p t = c yt + w t .
Montrer quil est possible, partir de ces quations, dcrire une dynamique qui relie le
taux dinflation p t une constante, au niveau du chmage u t et au niveau du chmage
retard u t1.
Estimer conomtriquement cette quation. Est-ce que cela amliore les rsultats de la
premire partie ?
7) Estimer de nouveau le modle de la question 6 en introduisant dans la liste des
variables explicatives la variable DUM et en corrigeant de lautocorrlation des rsidus
(cf. chapitre 5).
Troisime partie : courbes de Phillips augmentes des anticipations dinflation
8) On cherche maintenant estimer un modle intgrant des anticipations dinflation :
p t = a0 + a1 p t1 + a2 u t + a3 u t1 + t
Estimer cette relation inflation-chmage en ignorant lautocorrlation des rsidus mais
en conservant la variable DUM. En faisant un test du h de Durbin (prsence de la
variable endogne retarde, cf. chapitre 7, I. B.) confirmer quil nexiste plus dautocorrlation des rsidus.
9) Raliser sur ce nouveau modle des tests de Chow la priode 21 pour la France et
la priode 18 pour les tats-Unis (date de dbut des politiques de dsinflation).
Attention : la variable DUM doit tre retire de la rgression.
10) Construire les sries pour la France et les tats-Unis (phifra et phiusa)
phi = pt a 1 pt1 a 4 dum , les coefficients de rgression proviennent du rsultat de la
question 8. Puis regarder lallure de la courbe dans le plan chmage en abscisse et phi
en ordonn. Que constatez-vous lorsque que lon supprime les dplacements verticaux
de long terme de la courbe de Phillips dus aux anticipations et aux chocs doffre ? Une
politique de dsinflation est-elle plus coteuse, en termes de chmage, en France ou aux
tats-Unis ?
Solution
1) la lecture des reprsentations graphiques (graphique 7) de la relation inflation-chmage pour la France et pour les tats-Unis, nous pouvons penser quil est trs difficile
de trouver une relation significative, pour les deux pays, entre le taux de chmage et le
taux dinflation une date donne car les deux courbes sont trs instables.

Les modles dcalages temporels  209

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 210

14

14

12

12
10

INFUSA

INFFRA

10
8
6

8
6
4

0
2

CHOFRA

CHOUSA

Graphique 7 Relation inflation-chmage pour la France et pour les tats-Unis


2) Estimations conomtriques.
Les rsultats obtenus pour la France sont les suivants :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

8.918367

CHOFRA(1)

0.442073

1.304888

6.834582

0.0000

0.173685

2.545262

0.0161

DW = 0,23
On remarque que la probabilit critique de la variable chofra(1) est infrieure
5 %, donc le taux de chmage retard est une variable significative et dont le coefficient
est ngatif, ce qui est conforme lintuition conomique.
Estimons maintenant la relation entre linflation et le taux de chmage contemporain.
Dependent Variable: INFFRA
Included observations: 34
Variable

Coefficient

Std. Error

t-Statistic

Prob.

8.273400

CHOFRA

0.345105

1.322230

6.257158

0.0000

0.171588

2.011250

0.0528

Dans ce cas, nous remarquons que le taux de chmage contemporain nest pas aussi
significatif. En effet, la probabilit critique est lgrement suprieure 5 % mais reste
quand mme acceptable.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

5.718162

CHOUSA(1)

0.093347

DW = 0,42

210  CONOMTRIE

t-Statistic

Prob.

2.147358

2.662883

0.0122

0.343655

0.271629

0.7877

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 211

Dependent Variable: INFUSA


Included observations: 34
Variable

Coefficient

Std. Error

t-Statistic

Prob.

2.329524

2.082007

1.118884

0.2715

CHOUSA

0.449518

0.335099

1.341446

0.1892

On remarque que ni le taux de chmage retard, ni le taux de chmage contemporain ne sont significatifs car leurs probabilits critiques sont suprieures 5 %.
Nous pouvons donc conclure que le fait de prendre le chmage retard ou le chmage contemporain ne change pas significativement les rsultats. Nous prendrons donc
dans la suite le chmage retard afin de rester homogne par rapport la France.
3) La reprsentation graphique (graphique 8) des rsidus de la relation inflation-chmage retard pour la France et pour les tats-Unis laisse supposer une prsence dautocorrlation positive des rsidus car il semblerait que les rsidus soient lis par une dynamique cyclique. En ce qui concerne les points aberrants, il apparat des rsidus loigns
pour les priodes 10 et 18 pour la France alors que pour les tats-Unis, les rsidus sont
levs pour les priodes 10 et 17.
8

10

4
6

2
4

0
2

-2
-4

-6

-2

-8

-4

10

15

20

25

30

INFFRA Residuals

10

15

20

25

30

INFUSA Residuals

Graphique 8 Reprsentation des rsidus pour la France et pour les tats-Unis


4) Tests dautocorrlation des erreurs.
Pour la France, il est possible dappliquer le test de Durbin et Watson la relation entre
linflation et le taux de chmage retard car le nombre dobservations est suprieur 15,
la variable expliquer ne figure pas parmi les variables explicatives et le modle est spcifi en sries temporelles. La statistique de Durbin et Watson est gale 0,23. Dans la
table de Durbin et Watson, pour 33 observations et une variable explicative, on trouve
que d1 = 1,38 et d2 = 1,51. La statistique de Durbin et Watson dans ce cas est infrieure
d1, on peut donc conclure une autocorrlation positive des erreurs.
Il est galement possible de faire le test de Breusch-Godfrey.
Breusch-Godfrey : Serial Correlation LM Test:
F-statistic

73.24807

Probability

0.000000

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du


Fisher est trs infrieure 5 %.

Les modles dcalages temporels  211

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 212

Pour les tats-Unis, la statistique de Durbin et Watson est gale 0,42. Or d1 et d2


ont les mmes valeurs que pour la France, donc on peut conclure une autocorrlation
des erreurs.
Breusch-Godfrey : Serial Correlation LM Test:
F-statistic

48.13823

Probability

0.000000

On rejette lhypothse dabsence dautocorrlation car la probabilit critique du


Fisher est infrieure 5 %. On peut donc conclure une autocorrlation positive des
erreurs.
5) Construire une variable appel DUM qui vaut 0 chaque date lexception des
priodes 11 et 17 pour lesquelles elle vaut 1.
6) Estimation de la courbe de Philips sans autocorrlation des rsidus.
Soit le systme suivant :
w t = (u u t1 )

(1)

yt = 1 u t

(2)

p t = c yt + w

(3)

En remplaant dans lexpression (3) yt et w t par les relations (2) et (3), on trouve que :
p t = c( 1 u t ) + (u u t1 )
p t = 1 c(u t u t1 ) + (u u t1 ) car u t = (u t u t1 )
Do p t = c u t ( + 1 c)u t1 + u
Nous pouvons alors estimer cette quation.
Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

8.195813

1.341090

6.111305

0.0000

CHOFRA

1.978700

1.187570

1.666176

0.1061

CHOFRA(1)

2.412074

1.194353

2.019565

0.0524

Durbin-Watson stat

0.436616

On remarque que les deux variables ne sont pas significatives car leurs probabilits
critiques sont suprieures 5 %.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

4.123759

2.073971

1.988340

0.0560

CHOUSA

1.363228

0.533217

2.556610

0.0159

CHOUSA(1)

1.192817

0.533991

2.233777

0.0331

Durbin-Watson stat

0.683192

212  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 213

En ce qui concerne les tats-Unis, ce modle est plus adapt que les deux prcdents
car les deux variables (chmage et chmage retard) sont significatives.
7) Estimation dun nouveau le modle en introduisant la variable DUM et en prenant en
compte lautocorrlation des rsidus.
Pour la France :
Dependent Variable: INFFRA
Included observations: 32 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

15.14060

6.269402

2.414999

0.0228

CHOFRA

0.254229

0.522127

0.486910

0.6303

CHOFRA(1)

0.788179

0.495101

1.591958

0.1230

DUM

2.674737

0.797477

3.354000

0.0024

AR(1)

0.866577

0.081842

10.58842

0.0000

Durbin-Watson stat

1.791241

On constate dans ce modle que les chmages retards et contemporains ne sont pas
significatifs.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 32 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

12.66870

CHOUSA

0.221311

3.475067

3.645597

0.0011

0.292094

0.757670

0.4552

CHOUSA(1)

0.963667

0.296656

3.248427

0.0031

DUM

2.293875

0.767918

2.987137

0.0059

AR(1)

0.895121

0.086378

10.36288

0.0000

Durbin-Watson stat

1.552390

On remarque que dans ce cas, le chmage contemporain nest plus significatif, alors
que le chmage contemporain ltait dans le modle prcdent, non corrig des autocorrlations des rsidus et des points aberrants.
8) On cherche maintenant estimer le modle suivant :
p t = a0 + a1 p t1 + a2 u t + a3 u t1 + t .
Il sagit dun modle autorgressif dordre 1.

Les modles dcalages temporels  213

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 214

Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

1.663308

0.625929

2.657345

0.0129

INFFRA(1)

0.831080

0.063433

13.10170

0.0000

CHOFRA

0.360813

0.439505

0.820953

0.4186

CHOFRA(1)

0.225252

0.448785

0.501916

0.6197

DUM

4.995335

0.898138

5.561881

0.0000

Durbin-Watson stat

2.195938

Nous remarquons que les variables choffra et choffra(1) ne sont pas significatives ; en
revanche, le terme autorgressif est bien significativement diffrent de 0.
Nous effectuons le test h de Durbin car nous avons un modle autorgressif (prsence
de la variable expliquer comme variable explicative retarde).
Soit le test dhypothses H0 : h = 0 contre H1 : h 0.

DW
n
h = ||
donc = 0,098
avec = 1
2
2
1 n
a1


33
h = |0,98|
= 0,60 < t 0,05 = 1,96 . Il nexiste donc plus dauto1 33 0,06342
corrlation des erreurs.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

3.704137

0.966380

3.833004

0.0007

INFUSA(1)

0.916993

0.115893

7.912443

0.0000

CHOUSA

1.025115

0.356171

2.878159

0.0076

CHOUSA(1)

0.442910

0.295441

1.499151

0.1450

DUM

4.630472

1.005135

4.606815

0.0001

Durbin-Watson stat

2.047469

Dans ce modle, seul le taux de chmage dcal nest pas significatif. On peut galement effectuer le test du h de Durbin, h = 0,182 qui est trs infrieur 1,96. Il nexiste donc plus dautocorrlation des erreurs.

214  CONOMTRIE

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 215

9) Tests de Chow1.
Pour la France :
Le test de Chow est effectu la priode 20 comme priode charnire. Comme pour la
deuxime priode, la variable DUM est gale 0 (colinarit avec le terme constant),
nous la retirons pour les deux priodes.
Nous obtenons : SCR = 83,25 ; SCR1 = 70,03 ; SCR2 = 5,056.
Chow Breakpoint Test: 21
F-statistic

0.678912

Probability

0.613020

Pour les tats-Unis :


Nous obtenons : SCR = 80,59 ; SCR1 = 52,04 ; SCR2 = 7,93.
Chow Breakpoint Test: 18
F-statistic

2.148648

Probability

0.104452

Nous acceptons lhypothse que le fait de scinder en deux sous priodes namliore pas le modle pour la France et les tats-Unis.
10) Nous construisons les deux sries phi = pt a 1 pt1 a 4 dum pour la France et les
tats-Unis :
phi f rat = in f f rat 0,83in f f rat1 4,99dum t
phiusat = in f usat 0,91in f usat1 4,63dum t
la lecture de la reprsentation graphique (graphique 9) pour les tats-Unis et la France
de la relation entre le chmage et phi, nous remarquons que la tendance de la courbe de
la France a une pente moins importante que celle des tats-Unis, ce qui nous permet
dmettre lhypothse quune politique de dsinflation a moins deffets ngatifs aux
tats-Unis quen France. Nous pouvons donc en conclure quune politique de dsinflation est plus coteuse en termes de chmage en France quaux tats-Unis.
4

5
4

2
PHIUSA

PHIFRA

1
0

1
0
-1

-1
-2

-2

-3

-3

-4

7
CHOFRA

10

11

12

13

10

CHOUSA

Graphique 9 Relation entre le chmage et phi pour la France et pour les tats-Unis

1. titre dexercice, le lecteur vrifiera les rsultats proposs par le logiciel, cf. chapitre 3, IV. B.

Les modles dcalages temporels  215

9782100721511-Bourbo-C07.qxd

20/10/14

15:25

Page 216

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 217

8. Introduction

aux modles
quations simultanes

e chapitre est une introduction1 aux modles dont la spcification


ncessite lcriture dquations multiples rlies entre elles au travers de variables figurant dans plusieurs quations.
Nous ne pouvons pas, sauf cas particulier, utiliser la mthode des MCO
quation par quation comme si chacune de ces quations tait indpendante les unes des autres.
En I., nous envisageons la prsentation matricielle dun modle quations simultanes et son criture sous forme rduite (les variables
endognes sont exprimes en fonction des seules variables exognes).
Le problme de lidentification, cest--dire la possibilit destimation du
modle sous forme rduite, est tudi en II. Enfin, en III., nous prsentons
les mthodes destimation spcifiques des modles quations simultanes.
Les exercices dapplication se trouvent exceptionnellement tous en fin de
chapitre, la partie thorique tant relativement rduite.

1. Dans le cadre de ce manuel, nous limitons volontairement les dveloppements thoriques qui
peuvent se rvler complexes dans le domaine de lconomtrie en gnral, et des quations
simultanes en particulier. Le lecteur dsirant approfondir ce chapitre peut se rfrer Greene
W.H. chapitre 16, 2000.

Introduction aux modles quations simultanes  217

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 218

I. quations structurelles
et quations rduites
Lorsque nous sommes en prsence dun modle linaire quations multiples,
il arrive frquemment quune variable endogne dune quation apparaisse en
tant que variable explicative dune autre quation. Ce double statut de certaines
variables entrane un biais dans les estimations des coefficients lorsque nous
employons les MCO, quation par quation.
Nous allons donc chercher transformer le modle initial en un modle o
les variables endognes ne sont exprimes quen fonction des variables exognes.

A. Exemple introductif
Considrons le modle macro-conomique trois quations :
Ct = a0 + a1 Yt + 1t

[E1]

It = b0 + b1 Yt1 + 2t

[E2]

Yt = Ct + It

[E3]

avec :
Ct = consommation totale pour lanne t ;
It = investissement total pour lanne t ;
Yt = revenu total pour lanne t .

Ce systme dquations multiples, spcifi par lconomiste, qui traduit


directement les relations entre les variables, sappelle : le systme dquations
structurelles.
Ce modle comporte trois quations dont une identit [E3]. En effet, dans la
relation [E3], il ny a aucun coefficient estimer et par consquent pas de terme
alatoire. Lquation [E1] est une fonction de consommation et lquation [E2]
est relative linvestissement.
Ce systme contient trois variables endognes : Ct , It , Yt et une variable exogne Yt1 . Nous remarquons, par exemple, que la variable Yt apparat comme
variable explicative en [E1], ce qui est contraire son statut de variable endogne.

218  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 219

Pour lever ce problme, nous allons exprimer les trois variables endognes
(Ct ,It ,Yt ) en fonction de la seule variable exogne (Yt1 ) .

En substituant [E3] dans [E1], nous obtenons :


Ct = a0 + a1 (Ct + It ) + 1t = a0 + a1 Ct + a1 It + 1t

En remplaant It par son expression [E2] et en faisant passer a1 Ct gauche de


lquation, nous pouvons crire :
(1 a1 )Ct = a0 + a1 b0 + a1 b1 Yt1 + a1 2t + 1t

ou encore :
Ct =

a0 + a1 b0
a1 b1
a1 2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1

Il en rsulte que :
Yt = Ct + It =



a0 + a1 b0
a1 2t + 1t
a1 b1
+ b0 +
+ b1 Yt1 +
+ 2t
1 a1
1 a1
1 a1
Yt =

a0 + b0
b1
2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1

Les quations structurelles sont alors quivalentes aux quations rduites


(les variables endognes sont exprimes en fonction des seules variables exognes) :
Ct =

a0 + a1 b0
a1 b1
a1 2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1

[E4]

Yt =

a0 + b0
b1
2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1

[E5]

It = b0 + b1 Yt1 + 2t

[E6]

Lquation [E5] indique que la variable Yt est fonction de 1t et par consquent E(Yt 1t ) = 0 . Il en rsulte que, dans lquation [E1], lhypothse dindpendance entre la variable explicative Yt et lerreur 1t nest pas respecte et
lapplication des MCO sur le modle [E1] conduit des estimateurs biaiss et
non convergents.
En revanche, lutilisation des MCO sur les quations rduites est licite
puisque la variable Yt1 est indpendante de 1t et 2t .
Il est noter que la forme rduite permet de mesurer leffet total, direct et indirect, dune modification de la variable exogne Yt1 sur les variables endognes.
Par exemple, le schma suivant illustre la cascade des causalits :
[E2] [E3] [E1]
Yt1 It Yt Ct ce qui est rsum dans [E4].

Introduction aux modles quations simultanes  219

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 220

B. Le modle gnral
Soit le systme gnral de g quations structurelles liant g variables endognes
k variables prdtermines :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt

Soit, sous forme matricielle :


B
(g,g)

+ C
Y
(g,1)
(g, k)

=
X
(k,1)
(g,1)

[1]

Bien entendu, dans chaque quation, quelques coefficients sont nuls et la


variable dont le coefficient est gal 1 est la variable dpendante. Si une quation a tous ses coefficients, non nuls, gaux 1 et ne comporte pas de terme alatoire, cela signifie quil sagit dune identit (aucun coefficient nest estimer).
Si la matrice B est rgulire, nous passons de la forme structurelle la forme
rduite en exprimant Y en fonction de X , soit :
Y = B 1 C X + B 1

[2]

et nous pouvons appliquer les MCO. En effet, les erreurs B 1 sont indpendantes de X .
Si, sur le plan de la prsentation, la formalisation est simple, sa mise en
uvre pratique est plus complexe. En effet, la connaissance des g k lments
de la matrice (B 1 C) ne permet pas de dterminer didentifier la matrice
B (compose de g g lments) ainsi que la matrice C (compose de g k
lments). Nous sommes alors en prsence de g k quations
(g g) + (g k) inconnues qui, sans restrictions supplmentaires, savrent
impossibles rsoudre, il sagit du problme de lidentification.
Nous allons donc prsenter en II. des rgles simples permettant, partir de
restrictions sur les paramtres, de dterminer des conditions didentification.
titre dillustration le modle introductif peut scrire sous forme matricielle :

Y =

=

Ct
It
Yt

1t
2t
0


;

B=


1
0 a1
0
1
0 ;
1 1
1

( U est le vecteur unit.)

220  CONOMTRIE


U
X=
;
Yt1

C=

a0
b0
0


0
b1 ;
0

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 221

C. Cas particulier : les modles rcursifs


Un systme dquations est appel rcursif si chaque variable endogne peut
tre dtermine de manire squentielle :
y1t = f (x1t ,x2t . . . xkt ; 1t )
y2t = f (x1t ,x2t . . . xkt ; y1t ; 2t )
y3t = f (x1t ,x2t . . . xkt ; y1t ,y2t ; 3t )

(Les variables alatoires (it ) sont, par hypothse, indpendantes.)


Nous observons que la premire quation ne contient aucune variable endogne. La deuxime quation a pour variable explicative endogne, la
variable de la premire quation, et ainsi de suite.
Lorsquun modle quations simultanes rpond au critre de rcursivit,
il est licite dappliquer la mthode des MCO quation par quation. En effet,
dans ce cas particulier, il y a indpendance entre les variables endognes et les
erreurs. Par exemple, dans la deuxime quation, y1t dpend de 1t mais pas de

2t.

Les modles rcursifs sont aussi appels systme triangulaire car les
coefficients des variables endognes forment un triangle au sein de la matrice B .

II. Le problme de lidentification


A. Restrictions sur les coefficients
Il y a une restriction sur un coefficient de la forme structurelle, chaque fois
quun paramtre est contraint par lcriture du modle tre gal une
valeur dtermine. Nous distinguons deux types de restrictions.

1) Restrictions dexclusion
Nous pouvons considrer que chaque fois quune variable endogne ou exogne napparat pas dans une quation structurelle, cela revient laffecter dun
coefficient nul. Par exemple, dans notre modle introductif, la variable It ne
figure pas dans lquation [E1], son coefficient est donc nul : dans la matrice B ,
llment de la premire ligne et de la deuxime colonne est gal 0.

2) Restrictions linaires
Certaines spcifications de modle imposent que des variables soient affectes
dun coefficient identique, il sagit l encore de restrictions a priori sur les paramtres du modle.

Introduction aux modles quations simultanes  221

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 222

B. Conditions didentification
Les conditions didentification se dterminent quation par quation. Nous pouvons distinguer trois cas didentifications :
le modle est sous-identifi si une quation du modle est sous-identifiable
(il y a moins dquations que de paramtres identifier dans la forme
structurelle, le systme est donc impossible rsoudre) ;
le modle est juste identifi si toutes les quations sont justes identifiables ;
le modle est sur-identifi si les quations du modle sont soit justes identifiables, soit sur-identifiables.
Si le modle est sous-identifi, il nexiste aucune possibilit destimation des
paramtres du modle, celui-ci doit tre respcifi.
Les conditions didentification peuvent faire lobjet dun dveloppement
complexe, nous nous bornons ici dicter des rgles simples qui sont, dans la
pratique, appliques en premier lieu.
Soit :
g = nombre de variables endognes du modle (ou encore nombre dquations

du modle) ;
k = nombre de variables exognes du modle ;
g = nombre de variables endognes figurant dans une quation ;
k = nombre de variables exognes figurant dans une quation.
Lorsque les restrictions ne sont que des restrictions dexclusion, les conditions ncessaires didentifiabilit snoncent ainsi :
g

1 > g g + k k lquation est sous-identifie ;

g

1 = g g + k k lquation est juste identifie ;

g

1 < g g + k k lquation est sur-identifie.

Ce qui peut se rsumer ainsi : pour quune quation ne soit pas sous-identifie, le nombre de variables exclues de lquation doit tre au moins gal au
nombre dquations du modle moins 1.
Lorsque nous avons r restrictions, autres que celles dexclusion, concernant
les paramtres dune quation (galit de deux coefficients, par exemple), les
conditions prcdentes deviennent :
g

1 > g g + k k + r lquation est sous-identifie ;

g

1 = g g + k k + r lquation est juste identifie ;

g

1 < g g + k k + r lquation est sur-identifie.

Ces conditions ncessaires sont appeles conditions dordre didentifiabilit.

222  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 223

Il convient de vrifier des conditions suffisantes, qualifies de conditions de


rang qui, dans la pratique, se rvlent difficiles, voire parfois impossibles
mettre en uvre. En annexe, ces conditions sont exposes.

III. Les mthodes destimation


Les mthodes destimation que nous pouvons utiliser dans le cadre des quations simultanes sont fonction du critre didentifiabilit du modle.
Si le modle est sous-identifiable ; pas destimation possible.
Dans le cas dun modle juste ou sur-identifiable, nous pouvons distinguer la
mthode employer quation par quation, selon le critre didentifiabilit :
Si lquation est juste identifie : les moindres carrs indirects ou les doubles
moindres carrs.
Si lquation est sur-identifie : les doubles moindres carrs.

A. Les moindres carrs indirects


La mthode des Moindres Carrs Indirects (MCI) consiste appliquer la mthode des MCO aux quations justes identifies du modle sous formes rduite ;
elle se compose de trois tapes :
mise sous forme rduite du modle structurel ;
estimation par les MCO des paramtres de chacune des quations ;
dtermination des coefficients des quations structurelles partir des relations algbriques entre coefficients rduits et structurels (puisque le modle est juste identifiable, la solution est unique).
Lestimateur des MCI de la forme rduite est BLUE. Cependant, lestimateur
des coefficients de la forme structurelle, obtenu partir de lestimateur optimal
des MCI, est biais pour les petits chantillons. Les proprits asymptotiques
font tendre ce biais vers 0, lorsque la taille de lchantillon augmente.
Cet estimateur des MCI est rarement utilis du fait de la difficult, pour les
modles importants, de dterminer la forme rduite du modle. Nous lui prfrons lestimateur des doubles moindres carrs, plus simple mettre en uvre et
qui fournit les mmes rsultats que les MCI pour les quations justes identifies.

B. Les doubles moindres carrs


La procdure destimation des Doubles Moindres Carrs (DMC) est la plus utilise en pratique. Elle sapplique pour tous les modles justes ou sur-identifiables.

Introduction aux modles quations simultanes  223

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 224

Cette mthode des DMC est fonde, comme son nom lindique, sur lapplication en deux tapes des MCO.
Soit le modle quations simultanes g variables endognes et k
variables exognes :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt

La premire tape consiste effectuer une rgression de chacune des


variables endognes sur toutes les variables exognes :
y1t = 11 x1t + 12 x2t + . . . + 1k xkt + u 1t
y2t = 21 x1t + 22 x2t + . . . + 2k xkt + u 2t
...
ygt = g1 x1t + g2 x2t + . . . + gk xkt + u gt

Puis, dans une deuxime tape, il convient de remplacer les variables endognes figurant droite des quations structurelles par leurs valeurs ajustes
laide des modles estims :
y1t = 12
y2t + . . . + 1g
ygt + c11 x1t + c12 x2t + . . . + c1k xkt + 1t
y1t + . . . + 2g
ygt + c21 x1t + c22 x2t + . . . + c2k xkt + 2t
y2t = 21
...
y1t + g2
y2t + . . . + cg1 x1t + cg2 x2t + . . . + cgk xkt + gt
ygt = g1

Les proprits de lestimateur des DMC sont identiques, de manire asymptotique, celles dun estimateur classique ; cest--dire que pour les petits
chantillons les estimations des paramtres peuvent tre biaises.
Il est noter que lestimateur des DMC peut sinterprter comme tant un
estimateur de la mthode des Variables Instrumentales1, les variables exognes
des autres quations tant les instruments.

C. Autres mthodes destimation


Nous pouvons citer trois mthodes :
La mthode des triples moindres carrs est adapte lorsque les erreurs sont
autocorrles et/ou htroscdastiques, elle consiste dterminer lestimateur des doubles moindres carrs puis calculer lestimateur des MCG.
La mthode du maximum de vraisemblance information complte
(MVIC) consiste maximiser la fonction Log-vraisemblance associe au
modle.
1. Greene W.H., pages 681-684, 2000.

224  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 225

La mthode des moments gnralise est utilise en cas de prsence dhtroscdasticit.

Exercice n 1

fichier C8EX1

Comparaison des rsultats par moindres carrs ordinaires,


moindres carrs indirects et doubles moindres carrs
Soit le modle suivant sous forme structurelle :
Y1t = a(Y2t + X 1t ) + 1t
Y2t = bY1t + cY1t1 + 2t
avec :
Y1t = Produit National Brut pour lanne t ;
Y2t = consommation des mnages pour lanne t ;
X 1t = demande finale autre que consommation des mnages pour lanne t.

[E1]
[E2]

Nous disposons des donnes du tableau 1 dans lequel les variables ont t pralablement centres.
Tableau 1 Variables macro-conomiques centres
t

Y1t

Y2t

X 1t

1
2
3
4
5
6
7
8
9

30,0
4,0
19,0
6,0
9,0
11,0
9,0
19,0
29,0

14,0
10,0
19,0
11,0
6,0
12,0
10,0
11,0
19,0

26,0
5,0
36,0
6,0
13,0
25,0
5,0
32,0
14,0

Y1t1
20,0
30,0
4,0
19,0
6,0
9,0
11,0
9,0
19,0

1) Prciser les conditions didentifiabilit du modle.


2) Estimer les quations de la forme structurelle par les MCO et dmontrer que les estimateurs ne sont pas BLUE.
3) Estimer les coefficients par les MCI et les DMC.
4) Comparer les rsultats obtenus.
Solution
1) Nous nous rfrons aux conditions didentification dveloppes en II.
Le modle comporte deux variables endognes, Y1t et Y2t soit g = 2 , et deux
variables exognes, X 1t et Y1t1 soit k = 2.

Introduction aux modles quations simultanes  225

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 226

La premire quation [E1] comporte une restriction dexclusion et une restriction de


contrainte (les coefficients de Y2 et X 1 sont gaux). Soit, en appliquant les conditions
didentifiabilit, les variables figurant dans lquation donnent : g = 2 , k = 1 et la
contrainte dgalit des coefficients : r = 1.
Soit : g g + k k + r = 2 2 + 2 1 + 1 = 2 > g 1 = 1 , lquation [E1]
est sur-identifie.
Pour lquation [E2], nous avons g = 2 , k = 1 et r = 0 , soit
g g + k k + r = 2 2 + 2 1 + 0 = 1 = g 1,
lquation [E2] est juste identifie.
Nous pouvons donc estimer les coefficients du modle.
2) Les rsultats de lestimation par les MCO sont les suivants aprs avoir cr la nouvelle variable explicative : somme de Y2 et X 1 . Il est noter que le modle ne comporte
pas de terme constant puisque les donnes sont centres.
[E3]
Y1t = 0,516(Y2t + X 1t ) + e1t
(5,89)
R = 0,81
2

n=9
() = t de Student
[E4]
Y2t = 0,518 Y1t + 0,040 Y1t1 + e2t
(2,58)

(0,18)

R = 0,50
2

n=9
Ces estimateurs ne sont pas BLUE. En effet, si on explicite Y1t en fonction de X 1t et
de Y1t1, on obtient :
a
ac
2t
Y1t =
X 1t +
Y1t1 +
1 ab
1 ab
1 ab
Or, dans lquation [E2], on rgresse Y2t sur Y1t qui dpend alatoirement de 2t , ce
qui est en contradiction avec lhypothse dindpendance entre la variable explicative et
lerreur. Les estimateurs ne sont donc pas BLUE.
3) Pour appliquer la mthode des MCI, il convient dabord de mettre le modle sous
forme rduite, soit :
a
ac
2t
1t
X 1t +
Y1t1 +
+
1 ab
1 ab
1 ab
1 ab
ab
c
2t + b1t
Y2t =
X 1t +
Y1t1 +
1 ab
1 ab
1 ab
Y1t =

ou encore :
Y1t = 1 X 1t + 2 Y1t1 + v1t
Y2t = 3 X 1t + 4 Y1t1 + v2t

226  CONOMTRIE

[E5]
[E6]

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 227

Les rsultats destimation par les MCO sont les suivants :


[E7]
Y1t = 0,717 X 1t + 0,190 Y1t1 + e1t
(4,93)
(1,0)
R 2 = 0,78
n=9
() = t de Student
[E8]
Y2t = 0,355 X 1t + 0,139 Y1t1 + e2t
(1,92)
(1,0)
R 2 = 0,36
n=9
Or le modle sous forme matricielle scrit :

 
 
 
  
1 a
Y1t
a
0
X 1t
1t
+
=
b
1
0 c
Y2t
Y1t1
2t
B
Y +
C

X
=
ou encore Y = B 1 C X + B 1 = AX + v qui est le modle sous forme rduite avec
A = B 1 C (A est la matrice des coefficients estims de la forme rduite).
Nous avons donc B A = C , soit :


1 a
0,717
b
1
0,355

 
0,190
a
=
0,139
0

0
c

ce qui donne :
0,717 a 0,355 = a
0,190 a 0,139 = 0
b 0,717 + 0,355 = 0
b 0,190 + 0,139 = c
Nous pouvons, partir des deux dernires relations, estimer 
b = 0,495 et

c = 0,045 (puisque lquation [E2] est juste identifie), mais, en revanche, le coefficient
a est indtermin (lquation [E1] est sur-identifie).
Nous appliquons maintenant la mthode des DMC afin destimer tous les coefficients
de ce modle.
Nous allons dvelopper le calcul pour la premire quation.
tape 1 : rgresser la variable endogne Y2t sur toutes les variables exognes (X 1t et
Y1t1 ).
Le rsultat est dj connu, puisquil sagit de lquation [E8].
2t
tape 2 : calculer la srie ajuste : Y
soit :

2t = 0,355 X 1t + 0,139 Y1t1


Y

2t dans lquatape 3 : la variable endogne Y2t est remplace par sa valeur ajuste Y
2t + X 1t ) + 1t .
tion [E1] : Y1t = a(Y

Introduction aux modles quations simultanes  227

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 228

Le rsultat destimation par les MCO est le suivant :


2t + X 1t ) + e1t
Y1t = 0,535(Y
(5,22)
R = 0,77
2

n=9
() = t de Student
Cette procdure des DMC est donc un peu lourde mettre en uvre, cest pourquoi les
logiciels permettent en une seule instruction dutiliser cette mthode. Par exemple, pour
estimer la deuxime quation de notre modle, linstruction de Eviews est la suivante :
TSLS Y2 Y1(-1) Y1 @ X1 Y1( 1)
o TSLS est labrviation de Two-Stage Leasts Squares. La variable expliquer (Y2)
figure suivie des variables exognes Y1( 1), la seule dans cette quation et, enfin, on
cite, la variable endogne que lon dsire remplacer par sa valeur ajuste laide des
sries exognes (elles sont spares de la variable endogne par le signe @).
Le rsultat, fourni par Eviews, est le suivant :
Dependent Variable : Y2
Method: Two-Stage Least Squares
Included observations: 9
Instrument list: X1 Y1D
Variable
Y1D
Y1
R-squared
Adjusted R-squared
S.E. of regression
F-statistic
Prob(F-statistic)

Coefficient

Std. Error

t-Statistic

Prob.

0.045084
0.495344

0.220336
0.228271

0.204614
2.169985

0.8437
0.0666

0.503610
0.432697
10.45016
5.176628
0.057037

Mean dependent var


S.D. dependent var
Sum squared resid
Durban-Watson stat

0.000000
13.87444
764.4403
3.011822

Nous remarquons que lestimation des coefficients est exactement la mme que par
la mthode des MCI. En effet, nous rappelons que la mthode des MCI fournit des rsultats strictement identiques la mthode des DMC. Cest pourquoi, dans la pratique, seule
cette dernire est utilise car elle se rvle dun maniement bien plus ais.
4) Nous pouvons au sein du tableau 2 comparer lensemble des rsultats obtenus.
Tableau 2 Rsultats destimation par les MCO et DMC

a
b
c

228  CONOMTRIE

MCO

DMC

0,516
(5,89)
0,518
(2,58)
0,040
(0,18)

0,535
(5,29)
0,495
(2,17)
0,045
(0,20)

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 229

la lecture de ces rsultats, nous constatons des diffrences assez faibles entre les
estimations des MCO et celles des DMC. En effet, les proprits des estimateurs des
DMC ne sont quasymptotiques, or le nombre dobservations dans cet exemple est limit 9.

Exercice n 2
Le problme de lidentification lorsque la structure
dun modle change
On considre le systme dquations :
Y1t + aY2t + b = 1t
cY1t + Y2t + dZ t + e = 2t

[E1]
[E2]

dans lequel Y1t et Y2t sont des variables endognes et Z t une variable exogne.
1) Mettre ce systme sous forme matricielle et tudier les conditions didentifiabilit.
2) Vrifier les conditions didentifiabilit partir du calcul matriciel.
3) Rpondre aux mmes questions avec e = 0 .
Solution
1) Le modle sous forme matricielle scrit :
 
   


0 b
Zt
1t
1 a
Y1t
+
=
soit BY + C X =
d e
Y2t
Ut
2t
c 1
avec U = vecteur unit.
Nous avons g = 2 variables endognes : Y1t , Y2t et k = 2 variables exognes Z t et
U . Examinons les conditions didentifiabilit :
pour
lquation
[E1] :
g = 2 ,
k = 1
et
r =0
g g + k k + r = 1 = g 1 , lquation [E1] est juste identifie ;

soit

pour
lquation
[E2] :
g = 2 ,
k = 2
et
r =0
g g + k k + r = 0 < g 1 , lquation [E2] est sous-identifie.

soit

2) Par le calcul matriciel, nous allons exprimer les variables endognes par les variables
exognes : Y = B 1 C X + B 1 .
Posons A = B 1 C
B

1
=
1 ac

1
c



1
a
ad
A=
1
d
1 ac

b ae
bc + e

Cette matrice A correspond la matrice des coefficients estims (nots 


i ) de la
forme rduite.
Nous avons donc la relation B A = C :

 


1 a

1 
0
2

=
c 1
d

3 
4

b
e

Introduction aux modles quations simultanes  229

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 230

soit en explicitant cette relation matricielle :


3 = 0

1 + a

[E3]

c
1 + 
3 = d

[E5]


2 + a
4 = b

[E4]

c
2 + 
4 = e

[E6]

Les quations [E3] et [E4] constituent deux quations deux inconnues. Les coefficients
a et b sont donc parfaitement identifiables ds lors que lon connat les coefficients de la
forme rduite. Ces deux coefficients a et b appartiennent lquation [E1] qui est juste
identifie, ce qui est une vrification des rgles nonces.
En revanche, les quations [E5] et [E6] forment deux quations trois inconnues,
soit un systme indtermin. Lquation [E3] est bien sous-identifie.
3) Si e = 0 , lquation [E1] reste juste identifie et lquation [E2] devient, ds lors,
juste identifie. Matriciellement, le systme scrit :

 



1 a

1 
2
0 b

=
c 1
d 0

3 
3
Soit, en explicitant cette relation matricielle :

1 + a
3 = 0

[E7]

c
1 + 
3 = d

[E9]


2 + a
4 = b

[E8]

c
2 + 
4 = 0

[E10]

Soit quatre quations quatre inconnues, le systme est maintenant parfaitement


dtermin.

Exercice n 3

fichier C8EX3

Le modle de Klein
Ce modle1 macro-conomique fournit un excellent exemple pdagogique des problmes qui peuvent se poser dans le cadre des quations simultanes.
Soit le modle suivant :
Const = a0 + a1 Pt + a2 Pt1 + a3 (Wt + Wt ) + 1t
It = b0 + b1 Pt + b2 Pt1 + b3 K t1 + 2t
Wt = c0 + c1 X t + c2 X t1 + c3 t + 3t
X t = Const + It + G t
Pt = X t Wt T axt
K t = It + K t1
avec :
Const
Pt
Wt et Wt
It

= consommation pour lanne t ;


= profits de lanne t ;
= salaires de lanne t verss par lindustrie et ladministration ;
= investissements de lanne t ;

1. Klein L. R., 1950.

230  CONOMTRIE

[E1]
[E2]
[E3]
[E4]
[E5]
[E6]

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 231

= stock de capital la fin de lanne t ;


= production industrielle de lanne t ;
= dpenses publiques de lanne t ;
= impts sur les profits de lanne t.

Kt
Xt
Gt
T axt

1) Distinguer les variables endognes et exognes.


2) Estimer les quations par la mthode des MCO.
3) Examiner les conditions didentifiabilit de ce modle.
4) Estimer ce modle laide dune mthode adquate.
Les donnes exprimes dans des units convenablement choisies sont prsentes
sur le tableau 3.
Tableau 3 Donnes du modle de Klein (1950) (extrait des donnes)

1920
1921

1940
1941

Constt

Gt

39,8
41,9

65,0
69,7

2,4
3,9

7,4
13,8

It

K t1

Pt

T axt

Wt

Wt

Xt

2,7
0,2

3,3
4,9

180,1
182,8

201,2
204,5

12,7
12,4

21,1
23,5

3,4
7,7

9,6
11,6

28,8
25,5

45,0
53,3

2,2
2,7

8,0
8,5

44,9
45,6

75,7
88,4

(NB : ce tableau indique directement la variable K t1 )

Solution
1) Ce modle comporte six quations et onze variables conomiques (y compris le vecteur et la tendance). Les trois dernires quations sont des identits (aucun paramtre
nest estimer).
Les variables exognes sont les variables non expliques par une relation :
les variables retardes : Pt1 , X t1 , K t1 et
les variables vritablement exognes : la tendance t, les dpenses gouvernementales G t , les salaires des administrations Wt , les impts sur les profits T axt et
le vecteur unit U. Soit, k = 8.
Les variables endognes sont celles qui sont dtermines par une relation de comportement : Constt , It , Wt . En ce qui concerne les identits, on choisit comme variables
endognes, compte tenu de leur signification, X t , Pt et K t . Soit g = 6.
Nous remarquons que, dans ce choix de variables endognes et exognes, la rflexion
conomique joue un grand rle. Nanmoins, il subsiste une part darbitraire reprsentative du schma de pense de lconomiste.
2) Les estimations par les MCO sont les suivantes :
Constt = 16,23 + 0,193 Pt + 0,089 Pt1 + 0,796(Wt + Wt ) + e1t
[E7]
(12,4) (2,11)
(0,99)
(19,9)
n = 21
DW = 1,36
() = t de Student
R 2 = 0,98
[E8]
It = 10,12 + 0,479 Pt + 0,333 Pt1 0,111 K t1 + e2t
(1,85) (4,93)
(3,30)
(4,189)
n = 21
DW = 1,81
() = t de Student
R 2 = 0,93

Introduction aux modles quations simultanes  231

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 232

Wt = 0,066 + 0,439 X t + 0,146 X t1 + 0,13 t + e3t


(2,02)
(13,5)
(3,90)
(4,90)
n = 21
DW = 1,95
R 2 = 0,98

[E9]
() = t de Student

Les estimateurs des MCO sont biaiss, cette mthode destimation est donc inapproprie pour ce type de modle. Nous devons tudier les conditions didentification de ce
modle et utiliser, le cas chant, la mthode des DMC.
3) Les conditions didentification conditions dordre studient quation par quation.
Le modle comporte g = 6 variables endognes et k = 8 variables exognes (cf. la
rponse la question 1).
Pour lquation [E1], nous avons g = 3 , variables endognes prsentes et k = 3 ,
variables exognes prsentes, soit (g g + k k = 8) restrictions dexclusion. De
plus, lgalit entre le coefficient de Wt et Wt introduit une restriction supplmentaire
r = 1.
g g + k k + r = 9 > g 1 = 5 lquation [E1] est sur-identifie.
Pour lquation [E2] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E2] est sur-identifie.
Pour lquation [E3] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E3] est sur-identifie.
Les quations tant toutes sur-identifies, il est licite destimer les coefficients de ce
modle laide de la mthode des DMC.
4) Nous avons appliqu la mthode des DMC pour chacune des trois quations estimer
de trois manires diffrentes.
quation [E1] en dcomposant la mthode des DMC.
Les variables endognes Pt et Wt apparaissent droite de lquation ; il convient
donc de les remplacer par leurs valeurs en fonction des 8 variables exognes.
tape 1 : estimation du modle pour Pt et calcul de la variable ajuste P At .
Dependent Variable : P
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
P(-1)
K
X(-1)
WP
TREND
G
TAX

46.55153
0.802501
0.216103
0.022000
0.079608
0.319405
0.439016
0.923098

23.15829
0.518856
0.119113
0.282164
2.533823
0.778129
0.391143
0.433759

2.010145
1.546674
1.814267
0.077969
0.031418
0.410478
1.122394
2.128133

0.0656
0.1459
0.0928
0.9390
0.9754
0.6881
0.2820
0.0530

232  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 233

tape 2 : estimation pour Wt et calcul de la variable ajuste W At .


Dependent Variable : W
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
P(1)
K
X(1)
WP
TREND
G
TAX

34.87254
0.871921
0.122952
0.095329
0.443726
0.713584
0.866220
0.60415

18.61034
0.416960
0.095721
0.226751
2.036218
0.625316
0.314328
0.348575

1.873826
2.091137
1.284477
0.420412
0.217917
1.141158
2.755783
-1.733206

0.0836
0.0567
0.2214
0.6811
0.8309
0.2744
0.0164
0.1067

tape 3 : estimation du modle final en remplaant dans lquation [1] Pt par P At et


Wt par W At .
Dependent Variable : CONS
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting
Variable
C
PA
P(1)
WA + WP

Coefficient

Std. Error

16.55476
0.017302
0.216234
0.810183

2.571080
0.229797
0.208810
0.078351

t-Statistic
6.438834
0.075294
1.035554
10.34044

Prob.
0.0000
0.9409
0.3149
0.0000

quation [E2] par application directe de la mthode des DMC laide de Eviews,
linstruction unique est la suivante (la liste des instruments les variables exognes
figurent aprs @ :
TSLS I C P(1) K P @ C P(1) K X(1) WP TREND G TAX

Dependent Variable : I
Method: Two-Stage Least Squares
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Instrument list: C P(1) K X(1) WP TREND G TAX
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
P(1)
K
P

20.27821
0.615943
0.157788
0.150222

8.383247
0.180926
0.040152
0.192534

2.418897
3.404398
3.929752
0.780238

0.0271
0.0034
0.0011
0.4460

Introduction aux modles quations simultanes  233

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 234

quation [E3] par application directe de la mthode des DMC laide de RATS,
les instructions sont les suivantes :
INSTRUMENTS CONSTANT TREND WP TAX G P{1} K X{1}
LINREG(INST) W
# CONSTANT TREND X{1} X
Dependent Variable W Estimation by Instrumental Variables
Annual Data From 1921: 01 To 1941: 01
Usable observations 21 Degrees of Freedom 17
Centered R**2
0.987414 R Bar **2
0.985193
Variable

Coeff

1. Constant
2. TREND
3. X{1}
4. X

0.064451360
0.130395687
0.146673821
0.438859065

Std Error
1.147038221
0.032388389
0.043163948
0.039602662

T-Stat
0.05619
4.02600
3.39806
11.08155

Signif
0.95584607
0.00087642
0.00342209
0.00000000

Nous pouvons aussi appliquer la mthode des triples moindres carrs. Le systme
(SYS01) scrit :
cons = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
I = C(5) + C(6) P + C(7) P( 1) + C(8) K
W = C(9) + C(10) X + C(11) X( 1) + C(12) @trend(1919)
inst C @trend(1919) WP TAX G P( 1) K X( 1)
Les rsultats (SYS01.3SLS) sont les suivants :
System : SYS01
Estimation Method : Three-Stage Least Squares
Sample : 1921 1941
Included observations : 21
Total system (balanced) observations 63
Coefficient

Std Error

t-Statistic

Prob.

C(1)
16.44079
1.304549
12.60267
0.0000
C(2)
0.124891
0.108129
1.155014
0.2535
C(3)
0.163144
0.100438
1.624322
0.1105
C(4)
0.790081
0.037938
20.82563
0.0000
C(5)
28.17784
6.793769
4.147601
0.0001
C(6)
0.013079
0.161896
0.080786
0.9359
C(7)
0.755724
0.152933
4.941532
0.0000
C(8)
0.194848
0.032531
5.98974
0.0000
C(9)
0.001128
1.009957
0.001117
0.9991
C(10)
0.400492
0.031813
12.58878
0.0000
C(11)
0.181291
0.034159
5.307308
0.0000
C(12)
0.149674
0.027935
5.357897
0.0000
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1)+C(12) @TREND(1919)
Instruments : C @TREND(1919) WP TAX G P( 1) K X( 1)

234  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 235

Enfin la mthode du maximum de vraisemblance information complte (SYS01.fiml)


permet dobtenir les rsultats suivants :
System : SYS01
Estimation Method : Full Information Maximum Likelihood (Marquardt)
Sample : 1921 1941
Included observations : 21
Total system (balanced) observations 63
Coefficient
Std Error
z-Statistic
Prob.
C(1)
15.83050
4.095952
3.864913
0.0001
C(2)
0.300548
0.408091
0.736472
0.4614
C(3)
0.042528
0.164388
0.258707
0.7959
C(4)
0.780851
0.078507
9.946226
0.0000
C(5)
15.70774
14.35232
1.094439
0.2738
C(6)
0.382189
0.341696
1.118507
0.2634
C(7)
0.409626
0.248385
1.649155
0.0991
C(8)
0.137683
0.071215
1.933357
0.0532
C(9)
0.136911
4.099237
0.033399
0.9734
C(10)
0.370767
0.129208
2.869534
0.0041
C(11)
0.207299
0.090622
2.287518
0.0222
C(12)
0.184379
0.101556
1.815549
0.0694
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1) + C(12) @TREND(1919)

Introduction aux modles quations simultanes  235

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 236

Annexe
Identification : les conditions de rang
Soit le modle sous forme matricielle :
B
Y + C
(g,g) (g,1)
(g,k)

X =
(k,1)
(g,1)

On appelle P la matrice des structures qui est forme par la juxtaposition des
matrices B et C, soit P = [BC], P est donc de dimension (g,g + k).
Soit i , une matrice des restriction affrente lquation i construite telle que :
Pi i h = 0, i est la i -ime ligne de la matrice P et h la h -ime colonne de la matrice
i .
Soit i = rang[Pi ] (rang de la matrice Pi ), et g le nombre de variables endognes du modle, la condition de rang est alors la suivante :
si i < g 1 lquation i est sous-identifie ;
si i = g 1 lquation i est juste identifie ;
si i > g 1 lquation i est sur-identifie.
Cette condition ncessaire et suffisante didentification est, bien entendu, plus lourde mettre en uvre, cest pourquoi le plus souvent on se satisfait des conditions
dordre.
partir du modle de lexercice 1, nous allons construire ces matrices et appliquer
les conditions de rang.
Ce modle sous forme matricielle scrit :

 
 
 
  
1 a
Y1t
a
0
X 1t
1t
+
=
b
1
0 c
Y2t
Y1t1
2t
B
Y +
C

X
=


1 a a 0
.
Soit P = [BC] =
b
1
0 c
La matrice 1 , matrice des restrictions de la premire quation, est donc construite
de la manire suivante :
autant de lignes que de variables endognes et exognes, chaque ligne est reprsentative dune variable (ligne 1 = Y1t , ligne 2 = Y2t , ligne 3 = X 1t , ligne
4 = Y1t1 ) ;
une colonne par restriction dexclusion (variable endogne ou exogne manquante) et par restriction linaire sur les coefficients ;
pour les relations dexclusion, les colonnes sont composes de 0, sauf pour les
variables dont le coefficient est nul o lon met la valeur 1 ;

236  CONOMTRIE

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 237

pour les restrictions de contraintes sur les coefficients, on explicite la relation entre
les coefficients. Dans notre modle, nous avons c11 c12 = 0 (Y2 et X 1 ont le
mme coefficient).
Nous pouvons alors rcrire la condition : Pi i h = 0 .
Soit, pour lquation 1, nous avons une seule variable manquante et une restriction
sur le coefficient des variables Y2 et X 1 qui doit tre identique, soit deux colonnes :

0
0

i =
0
1

0
1

1
0

les variables Y2 et X 1 ont le mme coefficient


la variable Y1t1 est absente

Pour 2 , nous avons une seule restriction : la variable X 1 est absente de lquation
2, soit :

0
0

2 =
1 la variable X 1 est absente de lquation 2
0

P1 =

1
b

a
1

a
0

0
0
0
c 0
1


0

0
1
=
c
1

0
1

rang de P1 = 1 = g 1.
Lquation 1 est juste identifie.

0





1 a a
0
0 = a
P2 =
0
b
1
0 c 1
0
rang de P2 = 2 = 1 = g 1
Lquation 2 est juste identifie (sauf si a = 0 ).
Nous remarquons que la condition de rang vient modifier la condition dordre de la
premire quation, puisque dun statut de sur-identifie, elle devient juste identifie.
Toutefois, cela ne remet aucunement en cause les rsultats trouvs lors de lexercice 1.

Introduction aux modles quations simultanes  237

9782100721511-Bourbo-C08.qxd

22/10/14

9:23

Page 238

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 239

9. lments danalyse

des sries temporelles

e chapitre est consacr une prsentation sommaire des techniques danalyse des sries chronologiques. Ce thme, lui seul,
peut faire lobjet de longs dveloppements et de nombreux
ouvrages1 y sont intgralement consacrs. Nous tudions en I. les caractristiques statistiques en terme de stationnarit des sries temporelles en prsentant les diffrents tests (Dickey-Fuller, corrlogramme,
etc.) sy rapportant. Puis en II., nous prsentons diffrentes classes de
modles (AR, MA, ARMA) en tudiant leurs proprits. Enfin, la mthode Box et Jenkins qui systmatise une dmarche danalyse des sries temporelles fait lobjet de la section III.

I. Stationnarit
A. Dfinition et proprits
Avant le traitement dune srie chronologique, il convient den tudier les caractristiques stochastiques. Si ces caractristiques cest--dire son esprance et
sa variance se trouvent modifies dans le temps, la srie chronologique est
considre comme non stationnaire ; dans le cas dun processus stochastique
invariant, la srie temporelle est alors stationnaire. De manire formalise, le
processus stochastique yt est stationnaire si :
1. Pour un approndissement de ce chapitre, se rfrer au livre de Bourbonnais R. et Terraza M.,
Dunod, 2010.

lments danalyse des sries temporelles  239

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 240

E(yt ) = E(yt+m ) = t et m , la moyenne est constante et indpendante du

temps ;
var(yt ) < t , la variance est finie et indpendante du temps ;
cov(yt ,yt+k ) = E[(yt )(yt+k )] = k , la covariance est indpendante du

temps.
Il apparat, partir de ces proprits, quun processus de bruit blanc1 t dans
lequel les t sont indpendants et de mme loi N (0,2 ) est stationnaire.
Une srie chronologique est donc stationnaire si elle est la ralisation dun
processus stationnaire2. Ceci implique que la srie ne comporte ni tendance, ni
saisonnalit et plus gnralement aucun facteur nvoluant avec le temps.

B. Fonctions dautocorrlation simple et partielle


La fonction dautocorrlation (FAC) est la fonction note k qui mesure la corrlation de la srie avec elle-mme dcale de k priodes, comme lillustre le
tableau 1.
Sa formulation est la suivante :
n


(yt y)(ytk y)
cov(yt ,ytk )
t=k+1
k =
=

n
n
yt ytk


(yt y)2
(ytk y)2
t=k+1

[1]

t=k+1

avec y moyenne de la srie calcule sur n k priodes, n = nombre dobservations.


Nous pouvons en dduire que :
0 = 1 et k = k

Cette formule [1] est malaise manier puisquelle exige de recalculer pour
chaque terme k les moyennes et les variances, cest pourquoi on lui prfre la
fonction dautocorrlation dchantillonnage :
n


k =

(yt y)(ytk y)

t=k+1
n

(yt y)2

[2]

t=1

avec y moyenne de la srie calcule sur n priodes.


1. Un processus de bruit blanc est une suite de variables alatoires de mme distribution et mutuellement indpendantes. Ce terme est emprunt la physique faisant rfrence au spectre de la
lumire blanche.
2. Si les conditions nonces ci-dessous sont vrifies, on dit que la srie est stationnaire de second
ordre, ou encore faiblement stationnaire. Dans le cas o, aux conditions dfinies, sajoute la
constante de la distribution de probabilit, on parle de srie strictement stationnaire.

240  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 241

Tableau 1 Exemple de calcul dune fonction dautocorrlation

yt

yt1

yt2

yt3

yt4

1
2
3
4
5
6
7
8
9
10
11
12

123
130
125
138
145
142
141
146
147
157
150
145

123
130
125
138
145
142
141
146
147
157
150

123
130
125
138
145
142
141
146
147
157

123
130
125
138
145
142
141
146
147

123
130
125
138
145
142
141
146

Moyenne yt
Moyenne ytk
Variance yt
Variance ytk

140,75
140,75
95,02
95,02
1

142,36
140,36
72,41
101,87
0,77

143,60
139,40
62,84
101,84
0,62

145,67
137,44
24,11
74,91
0,59

146,63
136,25
22,23
71,44
0,55

Lorsque le nombre dobservations n est suffisamment grand, les deux formules [1] et [2] donnent des rsultats trs proches.
La fonction dautocorrlation partielle (FAP) sapparente la notion de corrlation partielle. Nous avons dfini au chapitre 4 le coefficient de corrlation
partielle comme tant le calcul de linfluence de x1 sur x2 en liminant les
influences des autres variables x3 , x4 , . . . , xk .
Par analogie, nous pouvons dfinir lautocorrlation partielle de retard k
comme le coefficient de corrlation partielle entre yt et ytk , cest--dire comme
tant la corrlation entre yt et ytk linfluence des autres variables dcales de k
priodes (yt1 , yt2 , . . . , ytk+1 ) ayant t retire.
Afin dviter par la suite toutes ambiguts entre les deux fonctions dautocorrlation, nous appelons fonction dautocorrlation simple, la fonction dautocorrlation.

C. Tests de bruit blanc et de stationnarit


Nous ne pouvons identifier clairement les caractristiques stochastiques dune
srie chronologique que si elle est stationnaire. Cette tude de stationnarit

lments danalyse des sries temporelles  241

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 242

seffectue essentiellement partir de ltude des fonctions dautocorrlation (ou


de leur reprsentation graphique appele corrlogramme ). Une srie chronologique est stationnaire si elle ne comporte ni tendance ni saisonnalit. Nous
allons donc, partir de ltude du corrlogramme dune srie, essayer de montrer de quelle manire nous pouvons mettre en vidence ces deux composantes.
Nous pouvons distinguer diffrents types de sries stationnaires :
mmoire, cest--dire dont on peut modliser, par une loi de reproduction, le processus ;
identiquement et indpendamment distribue note i.i.d. ou appele Bruit
Blanc ( White Noise ) ;
normalement (selon une loi normale) et indpendamment distribue note
n.i.d. ou appele Bruit Blanc gaussien.

1) Analyse des fonctions dautocorrlation


Lorsque nous tudions la fonction dautocorrlation dune srie chronologique,
la question qui se pose est de savoir quels sont les termes k qui sont significativement diffrents de 0.
En effet, par exemple, si aucun terme nest significativement diffrent de 0,
on peut en conclure que le processus tudi est sans mmoire et donc qu ce
titre il nest affect ni de tendance ni de saisonnalit. Ou encore si une srie mensuelle prsente une valeur leve pour 12 (corrlation entre yt et yt12 ), la srie
tudie est certainement affecte dun mouvement saisonnier1. Nous verrons
partir dexemples diffrents cas de figures.
Le test dhypothses pour un terme k est le suivant :
H0 : k = 0
H1 : k =
/ 0

Nous pouvons utiliser le test dhypothses dun coefficient de corrlation,


prsent au chapitre 1, fond sur la comparaison dun t de Student empirique et
thorique. Toutefois, Quenouille2 a dmontr que pour un chantillon de taille
importante (n > 30) , le coefficient k tendde manire asymptotique vers une loi
normale de moyenne 0 et dcart type 1/ n .
Lintervalle de confiance du coefficient k est alors donn par :
1
k = 0 t /2
n

n = nombre dobservations.
1. Il sagit mme dun test de dtection de saisonnalit.
2. Quenouille M. H., 1949.

242  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 243

Si le coefficient calcul
k est lextrieur de cet intervalle de confiance, il
est significativement diffrent de 0 au seuil (en gnral = 0,05 et
t /2 = 1,96) . La plupart des logiciels fournissent, avec le corrlogramme, lintervalle de confiance, ce qui autorise une interprtation instantane.
Nous devons souligner une limite des tests 5 %. En effet, lorsquune fonction dautocorrlation est calcule pour un nombre important de retards, nous
pouvons nous attendre ce que quelques-uns soient, de manire fortuite, significativement diffrents de 0. Si h est le nombre de retards, le nombre possible de
faux rejets est alors de 0,05 h , pour un seuil de confiance de 5 %.
Dans le cas o le corrlogramme ne laisse apparatre aucune dcroissance de
ses termes (absence de cut off ), nous pouvons en conclure que la srie nest
pas stationnaire en tendance.

2) Statistiques de Box-Pierce et Ljung-Box


Le test de Box-Pierce permet didentifier les processus sans mmoire (suite de
variables alatoires indpendantes entre elles). Nous devons donc identifier
cov(yt ,ytk ) = 0 ou encore k = 0 k .
Un processus de bruit blanc implique que 1 = 2 = . . . = h = 0 , soit les
hypothses :
H0 : 1 = 2 = . . . = h = 0
H1 : il existe au moins un i significativement diffrent de 0.
Pour effectuer ce test, on recourt la statistique Q (due Box-Pierce1) qui
est donne par :
Q=n

h


k2

k=1

k = autocorrlation empirique dordre k, n = nombre


h = nombre de retards,
dobservations.
La statistique Q est distribue de manire asymptotique comme un 2 (chideux) h degrs de libert. Nous rejetons donc lhypothse de bruit blanc, au
seuil , si la statistique Q est suprieure au 2 lu dans la table au seuil (1 )
et h degrs de libert.
Nous pouvons utiliser aussi une autre statistique, dont les proprits asymptotiques sont meilleures, drive de la premire qui est le Q
de Ljung et Box2 :
Q
= n(n + 2)

h


k2
qui est aussi distribue selon un 2 h degrs de libern

k
k=1

t et dont les rgles de dcisions sont identiques au prcdent. Ces tests sont
appels par les anglo-saxons : portmanteau test soit littralement test
fourre-tout .
1. Box G E. P. et Pierce D. A., 1970.
2. Ljung G. M. et Box G E. P., 1978.

lments danalyse des sries temporelles  243

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 244

3) Tests de normalit
Pour calculer des intervalles de confiance prvisionnels et aussi pour effectuer
les tests de Student sur les paramtres, il convient de vrifier la normalit des
erreurs. Le test de Jarque et Bera (1984), fond sur la notion de Skewness (asymtrie) et de Kurtosis (aplatissement), permet de vrifier la normalit dune distribution statistique.
a) Les tests du Skewness et du Kurtosis
n
1
(xi x)k le moment centr dordre k, le coefficient de Skewness
n i=1
3
4
(11/2 ) est gal : 11/2 = 3/2 et le coefficient de Kurtosis : 2 = 2 .
2
2

Soit k =

Si la distribution est normale et le nombre dobservations grand (n > 30) :

1/2
1

  
  
6
24
et 2 N 3;
N 0;
n
n

On construit alors les statistiques :


1 =

|11/2 0|
|2 3|
et 2 = 
que lon compare 1,96 (valeur de la loi nor
6
24
n
n

male au seuil de 5 %).


Si les hypothses H0 : 1 = 0 (symtrie) et 2 = 0 (aplatissement normal)
sont vrifies, alors 1  1,96 et 2  1,96 ; dans le cas contraire, lhypothse de
normalit est rejete.
b) Le test de Jarque et Bera
Il sagit dun test qui synthtise les rsultats prcdents ; si 11/2 et 2 obissent
n
n
des lois normales alors la quantit s : s = 1 + (2 3)2 suit un 2 deux
6
24
degrs de libert.
2
(2), on rejette lhypothse H0 de normalit des rsidus au
Donc si s > 1
seuil .

Ces tests de normalit servent galement dans le cas o il y a htroscdacit. En effet, lhtroscdacit se manifeste sur le graphe de la distribution par
des queues de probabilit plus paisses (distribution leptokurtique) que les
queues de la loi normale.

4) Tests dhomoscdasticit
Un processus de bruit blanc doit tre homoscdastique, les tests dhtroscdasticit du chapitre 5, Section II peuvent tre utiliss.

244  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 245

Le test de Goldfeld-Quandt a pour but de comparer la somme des carrs


des rsidus destimation aprs avoir scind les rsidus en deux sous-chantillons.
Un autre test consiste tudier la distribution des carrs des rsidus.
Lanalyse des termes du corrlogramme des rsidus au carr permet de tester lexistence dune htroscdacit. Si certaines valeurs de la FAC (tests
de Box-Pierce ou Ljung-Box) sont significativement diffrentes de 0, nous
pouvons conclure la prsence dune htroscdacit.

II. La non-stationnarit et les tests de racine


unitaire

A. La non-stationnarit : les processus TS et DS


Les chroniques conomiques sont rarement des ralisations de processus alatoires stationnaires. Pour analyser la non-stationnarit, deux types de processus
sont distingus :
les processus TS (Trend Stationary) qui reprsentent une non-stationnarit
de type dterministe1 ;
les processus DS (Differency Stationary) pour les processus non stationnaires alatoires.
a) Les processus TS
Un processus TS scrit : xt = f t + t o f t est une fonction polynmiale du
temps, linaire ou non linaire, et t un processus stationnaire. Le processus TS
le plus simple (et le plus rpandu) est reprsent par une fonction polynmiale
de degr 1. Le processus TS porte alors le nom de linaire et scrit :
xt = a0 + a1 t + t .

Si t est un bruit blanc (gaussien ou non), les caractristiques de ce processus sont alors :
E[x t ] = a0 + a1 t + E[t ] = a0 + a1 t
V [x t ] = 0 + V [t ] = 2
cov[x t ,x t
] = 0 pour t =
/ t

Ce processus TS est non stationnaire car E[xt ] dpend du temps.


Connaissant 
a0 et 
a1 , le processus xt peut tre stationnaris en retranchant, de la
valeur de xt en t, la valeur estime 
a0 + 
a1 t . Dans ce type de modlisation, lef1. Par dfinition, un processus est alatoire do lambigut du terme de processus dterministe.

lments danalyse des sries temporelles  245

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 246

fet produit par un choc (ou par plusieurs chocs alatoires) un instant t est transitoire. Le modle tant dterministe, la chronique retrouve son mouvement de
long terme qui est ici la droite de tendance. Il est possible de gnraliser cet
exemple des fonctions polynmiales de degr quelconque.
b) Les processus DS
Les processus DS sont des processus que lon peut rendre stationnaires par lutilisation dun filtre aux diffrences : (1 D)d xt = + t o t est un processus
stationnaire, une constante relle, D loprateur dcalage et d lordre du filtre
aux diffrences.
Ces processus sont souvent reprsents en utilisant le filtre aux diffrences premires (d = 1) . Le processus est dit alors processus du premier ordre. Il scrit :
(1 D)xt = + t xt = xt1 + + t

Lintroduction de la constante dans le processus DS permet de dfinir deux


processus diffrents :
= 0 : le processus DS est dit sans drive.
Il scrit : xt = xt1 + t .
Comme t est un bruit blanc, ce processus DS porte le nom de modle de
marche au hasard ou de marche alatoire (Random Walk Model). Il est trs frquemment utilis pour analyser lefficience des marchs financiers.
Pour tudier les caractristiques de ce modle, crivons-le sous sa forme
dveloppe :
x t = x t1 + t
x t1 = x t2 + t1 x t = x t2 + t1 + t
x t2 = x t3 + t2 x t = x t3 + t2 + t1 + t
etc.
Si le premier terme de la chronique est x 0 , le modle scrit alors :
t

xt = x0 +
i
i =1

Les caractristiques de ce processus sont (en supposant x 0 certain) :


E[x t ] = x 0
V [x t ] = t2
cov[x t ,x t
] = 2 Min(t,t
) si t =
/ t

Par exemple :
cov(x 4 ,x 2 ) = E[(x 0 + 1 + 2 + 3 + 4 )(x 0 + 1 + 2 )]
= E(1 1 ) + E(2 2 ) = 22 .
/ t
.
En effet tous les produits E(t t
) = 0 si t =

246  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 247

Ce processus est non stationnaire en variance puisquelle dpend du temps.


Cette non stationnarit est dite alatoire ou stochastique.
Pour stationnariser la marche alatoire, il suffit dappliquer au processus le
filtre aux diffrences premires : xt = xt1 + t (1 D)xt = t .
= 0 : le processus porte alors le nom de processus DS avec drive.
Il scrit : xt = xt1 + + t .
Comme prcdemment, on peut rechercher sa forme quivalente dveloppe :
x t = x t1 + + t
x t1 = x t2 + + t1 x t = x t2 + 2 + t1 + t
x t2 = x t3 + + t2 x t = x t3 + 3 + t2 + t1 + t

etc.
Si on suppose la valeur dorigine x 0 connue et dterministe, on a alors :
t

x t = x 0 + t +
i
i =1

On peut analyser les caractristiques de ce processus :


E[x t ] = x 0 + t
V [x t ] = t2
cov[x t ,x t
] = 2 Min(t,t
) si t =
/ t

Le processus est non stationnaire de par son esprance et sa variance.


Lesprance tant de la mme forme que celle dun processus TS, on reconnat
dans ce processus une non stationnarit dterministe et alatoire la fois.
La stationnarisation de ce processus est ralise en utilisant le filtre aux diffrences premires :
x t = x t1 + + t (1 B)x t = + t

Soit en employant la forme dveloppe :


x t = x 0 + t +

t


i et en calculant : x t1 = x 0 + (t 1) +

t1


i =1

i =1

On a : x t x t1 = (1 B)x t = + t .
Dans les processus de type DS, un choc un instant donn se rpercute
linfini sur les valeurs futures de la srie ; leffet du choc est donc permanent et
va en dcroissant.
En rsum, pour stationnariser un processus TS, la bonne mthode est celle
des moindres carrs ordinaires ; pour un processus DS, il faut employer le filtre
aux diffrences. Le choix dun processus DS ou TS comme structure de la chronique nest donc pas neutre.

lments danalyse des sries temporelles  247

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 248

c) Consquences dune mauvaise stationnarisation du processus


Pour un processus TS, la bonne mthode de stationnarisation est celle des
moindres carrs ordinaires. Supposons que l'on applique au processus TS du premier ordre un filtre aux diffrences premires. A priori, comme le degr du polynme est 1, ce filtre peut tre considr comme correct puisqu'un filtre aux diffrences d'ordre d limine un polynme de mme degr. Cependant, on dmontre
que l'application du filtre aux diffrences a cr une perturbation artificielle.
Pour un processus DS, la bonne mthode de stationnarisation est le filtre aux
diffrences premires. Supposons que l'on applique la mthode des moindres
carrs ordinaires (rgression sur le temps) sur les observations d'un chantillon
du processus, les paramtres de la tendance sont estims et par consquent le
rsidu de la rgression doit tre un bruit blanc. Nelson et Kang montrent partir de simulations, que l'limination d'une tendance linaire sur un processus de
marche alatoire cre artificiellement une forte autocorrlation des rsidus pour
les premiers retards.
Sur le plan conomtrique, il est donc primordial d'identifier clairement le
processus sous-jacent et d'employer la mthode adquate de stationnarisation.
Sinon le risque de crer des bruits parasites artificiels est trs lev.
Les consquences sont galement importantes sur le plan conomique.
Considrons, par exemple, le PIB d'un pays comme la France en valeur relle.
Si ce PIB est DS plutt que TS, il est alors ncessaire de remettre en cause la
dcomposition traditionnelle (tendance et cycle) et sa justification thorique :
l'indpendance des schmas explicatifs. Si le PIB est en effet DS, la croissance
et le cycle sont lis et ne peuvent tre en consquence tudis de faon spars.
Or, d'aprs les travaux de Nelson et Plosser (1982) sur des chroniques macroconomiques amricaines, la variabilit constate de la composante conjoncturelle serait due une structure DS. Comme jusqu' prsent, l'analyse de cette
composante s'effectue partir du rsidu d'une rgression entre le PIB et une tendance dterministe, cette analyse surestime l'amplitude du cycle et sous-estime
l'importance de la tendance. Sur ce constat, Beveridge S. et Nelson C.R. (1981)
proposent une dcomposition des processus selon une tendance stochastique
(permanente) qui obit une marche alatoire avec ou sans drive et une composante stationnaire (transitoire). Par la suite Harvey A.C. (1988) utilise les
modles structurels composantes inobservables (modle tendance plus cycle et
tendance-cycle) reprsentes sous forme d'un modle espace d'tats estim par
le filtre de Kalman.

B. Les tests de racine unitaire


et la stratgie squentielle de test
Les tests de racine unitaire Unit Root Test permettent non seulement de
dtecter lexistence dune non-stationnarit mais aussi de dterminer de quelle
non-stationnarit il sagit (processus TS ou DS) et donc la bonne mthode pour
stationnariser la srie.

248  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 249

a) Tests de racines unitaires : tests de Dickey-Fuller (1979)


Les tests de Dickey-Fuller (DF) permettent de mettre en vidence le caractre
stationnaire ou non dune chronique par la dtermination dune tendance dterministe ou stochastique.
Les modles servant de base la construction de ces tests sont au nombre de
trois. Le principe des tests est simple : si lhypothse H0 : 1 = 1 est retenue
dans lun de ces trois modles, le processus est alors non stationnaire.
[1] xt = 1 xt1 + t
Modle autorgressif dordre 1.
Modle autorgressif avec constante.
[2] xt = 1 xt1 + + t
Modle autorgressif avec tendance.
[3] xt = 1 xt1 + bt + c + t
Si lhypothse H0 est vrifie, la chronique xt nest pas stationnaire quel que
soit le modle retenu.
Dans le dernier modle [3], si on accepte H1 : 1 < 1 et si le coefficient b est
significativement diffrent de 0, alors le processus est un processus TS ; on peut
le rendre stationnaire en calculant les rsidus par rapport la tendance estime
par les moindres carrs ordinaires.
Sous H0, les rgles habituelles de linfrence statistique ne peuvent pas tre
appliques pour tester cette hypothse, en particulier la distribution de Student
du paramtre 1 ; Dickey et Fuller ont donc tudi la distribution asymptotique
de lestimateur 1 sous lhypothse H0. laide de simulations de Monte-Carlo,
ils ont tabul les valeurs critiques pour des chantillons de tailles diffrentes.
Ces tables sont des tables1 analogues aux tables du t de Student. Les auteurs ont
1 1) au lieu de
1 pour des raisons purement stachoisi de tester la valeur (
tistiques. Cela nest pas gnant pour le test. En effet, xt = 1 xt1 + t scrit
aussi :
xt xt1 = 1 xt1 xt1 + t
xt = (1 1)xt1 + t

Il est donc quivalent de tester comme hypothse H0 : 1 = 1 ou 1 1 = 0 .


Les principes gnraux du test sont les suivants.
1 pour les
On estime par les moindres carrs ordinaires le paramtre 1 not
modles [1], [2] et [3]. Lestimation des coefficients et des carts types du modle
par les moindres carrs ordinaires fournit t1 qui est analogue la statistique de
Student (rapport du coefficient sur son cart type). Si t1  ttabule , alors on accepte lhypothse H0 ; il existe une racine unit, le processus nest donc pas
stationnaire.
Remarque : les principaux logiciels danalyse de sries temporelles calculent
automatiquement les valeurs critiques t1 .
b) Les tests de Dickey et Fuller Augments
Dans les modles prcdents, utiliss pour les tests de Dickey-Fuller simples, le
processus t est, par hypothse, un bruit blanc. Or il ny a aucune raison pour
1. Cf. table 7 en fin douvrage.

lments danalyse des sries temporelles  249

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 250

que, a priori, lerreur soit non corrle ; on appelle tests de Dickey-Fuller


Augments (ADF, 1981) la prise en compte de cette hypothse.
Les tests ADF sont fonds, sous lhypothse alternative |1 | < 1 , sur lestimation par les MCO des trois modles :
Modle [4] : xt = xt1

p


j xt j+1 + t

j=2

Modle [5] : xt = xt1

p


j xt j+1 + c + t

j=2

Modle [6] : xt = xt1

p


j xt j+1 + c + bt + t

j=2

avec t i.i.d.
Le test se droule de manire similaire aux tests DF simples, seules les tables
statistiques diffrent. La valeur de p peut tre dtermine selon les critres de
Akaike ou de Schwarz, ou encore, en partant dune valeur suffisamment importante de p, on estime un modle p 1 retards, puis p 2 retards, jusqu ce
que le coefficient du pime retard soit significatif.
c) Le test de Phillips et Perron (1988)
Ce test est construit sur une correction non paramtrique des statistiques de
Dickey-Fuller pour prendre en compte des erreurs htroscdastiques. Il se
droule en quatre tapes :
1) Estimation par les moindres carrs ordinaires des trois modles de base
des tests de Dickey-Fuller et calcul des statistiques associes, soit et le rsidu
estim.
2 =
2) Estimation de la variance dite de court terme 

n
1 
e2
n t=1 t

3) Estimation d'un facteur correctif st2 (appel variance de long terme) tabli
partir de la structure des covariances des rsidus des modles prcdemment
estims de telle sorte que les transformations ralises conduisent des distributions identiques celles du Dickey-Fuller standard :
st2 =

 
n
l 

1 
i
1 n
et2 + 2
1
et eti .
n t=1
l + 1 n t=i+1
i=1

Pour estimer cette variance de long terme, il est ncessaire de dfinir un


nombre de retards l (troncature de Newey-West) estim en fonction du nombre
d'observations n, l 4(n/100)2/9 .
4) Calcul de la statistique de PP : t =
1

avec k =

1 1) n(k 1)

1
(
k
+


1
k


2
(qui est gal 1 de manire asymptotique si et est un bruit
st2

blanc). Cette statistique est comparer aux valeurs critiques de la table de


MacKinnon.

250  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 251

d) Stratgie de tests
Nous constatons que pour raliser un test de racine unitaire, le rsultat nest pas
identique selon lutilisation de lun des trois modles comme processus gnrateur de la chronique de dpart. Les conclusions auxquelles on parvient sont donc
diffrentes et peuvent entraner des transformations errones. Cest la raison pour
laquelle Dickey et Fuller, et leur suite dautres auteurs, ont labor des stratgies de tests1. Nous prsentons un exemple simplifi (schma 1) dune stratgie
de tests. Les valeurs critiques des tc et tb permettant de tester la nullit des coefficients c et b des modles [2] et [3] sont donnes en fin douvrage (table 7).
e) Le test KPSS (1992)
Kwiatkowski et al. (1992) propose dutiliser un test du multiplicateur de
Lagrange (L M) fond sur lhypothse nulle de stationnarit. Aprs estimation
des modles [2] ou [3], on calcule la somme partielle des rsidus : St =

t


ei et

i=1

on estime la variance de long terme (st2 ) comme pour le test de Phillips et Perron.
Estimation du modle [3]
yt = c + bt + 1yt 1 + at
Test b = 0
non
Test 1 = 1

oui
oui

non
Processus TS :1<1
yt = c + bt + 1yt 1 + at

Processus DS
Estimation du modle [2]
yt = c + 1yt 1 + at
Test c = 0
non
Test 1 = 1
oui

Processus DS

oui

non
Processus stationnaire
Estimation du modle [1]
yt = 1yt 1 + at
Test 1 = 1
oui
Processus DS

non
Processus stationnaire

Schma 1 Stratgie simplifie des tests de racine unitaire


1. Cf. Bourbonnais R. et Terraza M. Chapitre 5, 2010.

lments danalyse des sries temporelles  251

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

n


La statistique est alors L M =

1
st2

Page 252

St2

t=1

n2

. On rejette lhypothse de stationna-

rit si cette statistique est suprieure aux valeurs critiques lues dans une table
labore par les auteurs.
Il est noter que les logiciels RATS et Eviews permettent directement l'utilisation de ces tests.

Exercice n 1

fichier C9EX1

Exemple dapplication des tests de racine unitaire au CAC40


On demande dappliquer les tests de non-stationnarit lindice CAC40 (indice
reprsentatif de lvolution des cours de bourse) sur une priode de 1160 jours.
Solution
Nous allons tudier le CAC40 sur 1 160 observations quotidiennes. Le graphique 1
illustre lvolution de lindice CAC40.
Les fonction dautocorrlation simple et partielle, pour h = 15 retards, sont obtenues
directement par une fonction :

252  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 253

Graphique 1 volution de lindice boursier CAC40


Eviews fournit les rsultats des fonctions dautocorrlation simple (colonne AC) et partielle (colonne PAC), avec les corrlogrammes respectifs. Les bornes de lintervalle de
confiance sont stylises par des traits pointills horizontaux ; chaque terme qui sort de cet
intervalle est donc significativement diffrent de 0 au seuil de 5 %. Nous nous apercevons
que tous les termes du corrlogramme simple sont extrieurs l'intervalle de confiance. Le
processus n'est pas un bruit blanc (il semble mme caractristique d'un processus non stationnaire). La statistique Q de Ljung-Box (la seule calcule par Eviews) confirme ce fait :
2
= 25, on refuse l'hypothse de nullit des coefQ-Stat = 14483 (au retard k = 15) > 0,05;15
ficients k (la probabilit critique de ce test est indique c = 0,000 < 0,05, donc on refuse H0). Le processus CAC40 n'est pas un bruit blanc. A partir des tests de Dickey-Fuller
nous allons examiner si le processus est non stationnaire.
Le test de Dickey-Fuller simple consiste estimer1 les trois modles :
[1] : CACt CACt1 = DCACt = (1 1) CACt1
[2] : CACt CACt1 = DCACt = (1 1) CACt1 + c
[3] : CACt CACt1 = DCACt = (1 1) CACt1 + c + bt
Lestimation par les MCO des paramtres du modle [3] donne :
DCACt = 0,008447 CACt1 + 14,94 + 0,002103 t
(2,053)
(2,0)
(1,11)
n = 1 159 () = t empirique.
Le coefficient de la droite de tendance nest pas significativement diffrent de 0
(t = 1,11), on rejette lhypothse dun processus TS et t1 = 2,053 > ttabule
1 1) = 1 159 0,008447 = 9,79 > 21,8 ) ; on accepte lhypo= 3,41 (ou n(
thse H0 (valeurs critiques au seuil de 5 %) ; le processus nest pas stationnaire.
Lestimation par les MCO des paramtres du modle [2] donne :
DCACt = 0,00709 CACt1 + 13,63
(1,805)
(1,85)
n = 1 159 () = t empirique.

1. Ces tests trs brivement prsents ici doivent faire lobjet dune stratgie afin de tester les cas
des hypothses jointes. Cf. Bourbonnais R. et Terraza M., 2010.

lments danalyse des sries temporelles  253

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 254

Le terme constant nest pas significativement diffrent de 0 (t = 1,85), on rejette


lhypothse dun processus DS avec drive et t1 = 1,805 > ttabule = 2,86 ; on
accepte lhypothse H0 ; le processus nest pas stationnaire.
Enfin lestimation par les MCO des paramtres du modle [1] donne :
DCACt = 0,000174 CACt1
(0,536)
n = 1 159 () = t empirique.
t1 = 0,536 > ttabule = 1,95 , on accepte lhypothse H0 ; le processus nest pas
stationnaire.
Le test DFA (avec quatre retards) conduit des rsultats similaires :
Hypothse H0 : CAC possde une racine unitaire
Nombre de retards (minimum du critre de Akaike) = 4
Test de Dickey-Fuller Augment

t Statistique

Probabilit critique

Modle [4]

0,46

0,81

Modle [5]

2,03

0,27

Modle [6]

2,28

0,44

Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhypothse H0 ; nous pouvons donc conclure que le processus CAC40 possde une racine
unitaire et nest donc pas stationnaire.
Nous procdons ensuite au test de Phillips-Perron avec une troncature l = 6.
Hypothse H0 : CAC possde une racine unitaire
Troncature l = 6
Test de Phillips-Perron

t Statistique ajust

Probabilit critique

Modle [1]

0,50

0,82

Modle [2]

1,94

0,31

Modle [3]

2,20

0,49

Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhypothse H0 ; le processus CAC40 possde une racine unitaire.
Enfin, nous procdons aux tests KPSS.
Hypothse H0 : CAC ne possde pas une racine unitaire
Troncature l = 6
Test de Kwiatkowski-Phillips-Schmidt-Shin

LM Statistique

Valeur critique 5%

Modle [2]

2,58

0,46

Modle [3]

1,31

0,14

La statistique LM est suprieure la valeur critique (pour un seuil de 5%) pour les
deux spcifications, nous rejetons lhypothse H0, le processus CAC40 possde donc une
racine unitaire.
Tous les rsultats sont convergents, nous pouvons donc conclure que le processus
CAC40 nest pas stationnaire.
Sagit-il dun processus de marche au hasard sans drive ? Nous allons le vrifier en
calculant le corrlogramme de la srie filtre par les diffrences premires ceci afin de
stationnariser le processus :
DCACt = CACt CACt1.

254  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 255

La statistique Q a une probabilit critique de 0,182 (pour k = 15) largement suprieure 0,05 ; nous acceptons lhypothse H0 de nullit des coefficients du corrlogramme. Le corrlogramme de la srie CAC40 filtre par les diffrences premires est caractristique dun bruit blanc. La srie CAC40 est donc bien un processus DS sans drive.
Sagit-il dun bruit blanc gaussien ?
Lhistogramme de la distribution et les valeurs empiriques des Skewness, Kurtosis
et de la statistique de Jarque-Bera sont donns par :

Les tests sont effectus partir des valeurs :


1/2
| 0,39 0|
| 0|
= 5,42 > 1,96
= 
1 = 1
6
6
1 159
n

lments danalyse des sries temporelles  255

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 256

|2 3|
|6,83 3|
= 26,61 > 1,96 .
2 = 
= 
24
24
1 159
n
Nous rejetons lhypothse de normalit en ce qui concerne la symtrie et laplatissement
de la distribution, ce qui est confirm par la statistique de Jarque-Bera :
2
JB = 741,3 > 0,05
(2) = 5,99 . Le processus CAC40 en diffrences est donc un bruit
blanc non gaussien.
et

III. Les modles ARIMA


Nous allons prsenter une famille de processus alatoires qui sont censs recouvrir une gamme trs large dvolution possible de sries chronologiques : les
processus autorgressifs et les processus de moyenne mobile.

A. Typologie des modles AR, MA et ARMA


1) Modle AR (Auto Rgressif)
a) Formulation
Dans le processus autorgressif dordre p, lobservation prsente yt est gnre
par une moyenne pondre des observations passes jusqu la p-ime priode
sous la forme suivante :
AR(1) : yt = 1 yt1 + t
AR(2) : yt = 1 yt1 + 2 yt2 + t
...
AR( p) : yt = 1 yt1 + 2 yt2 + . . . + p yt p + t

[4]

o 1 ,2 ,. . . , p sont des paramtres estimer positifs ou ngatifs, t est un ala


gaussien.
Nous pouvons ajouter ce processus une constante qui ne modifie en rien les
proprits stochastiques. Lquation [4] peut aussi scrire laide de loprateur dcalage D :
(1 1 D 2 D 2 . . . p D p )yt = t

b) Caractristiques des corrlogrammes


Il est dmontr que le corrlogramme simple dun processus AR( p) est caractris par une dcroissance gomtrique de ses termes de type :
k = k

Le corrlogramme partiel a ses seuls p premiers termes diffrents de 0.

256  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 257

2) Modle MA (Moving Average : Moyenne Mobile)


a) Formulation
Dans le processus de moyenne mobile dordre q, chaque observation yt est gnre par une moyenne pondre dalas jusqu la q-ime priode.
MA(1) : yt = t 1 t1
MA(2) : yt = t 1 t1 2 t2
...
MA(q) : yt = t 1 t1 2 t2 . . . q tq

[5]

o 1 ,2 ,. . . ,q sont des paramtres pouvant tre positifs ou ngatifs et t est un


ala gaussien.
Lquation [5] peut aussi scrire :
(1 1 D 2 D 2 . . . q D q )t = yt .

Dans ce processus, tout comme dans le modle auto-rgressif AR, les alas
sont supposs tre engendrs par un processus de type bruit blanc. Nous pouvons interprter le modle MA comme tant reprsentatif dune srie chronologique fluctuant autour de sa moyenne de manire alatoire, do le terme de
moyenne mobile car celle-ci, en lissant la srie, gomme le bruit cr par lala.
Il est noter quil y a quivalence entre un processus MA(1) et un processus
AR dordre p infini :
MA(1) = AR().

b) Caractristiques des corrlogrammes


Le corrlogramme simple dun processus MA(q) est de la forme gnrale :


i=qk

k =

i i+k

pour k = 0,1,. . . ,q et k = 0 pour k > q.

i=0
i=q


2
i

i=0

Cest--dire que seuls les q premiers termes du corrlogramme simple sont


significativement diffrents de 0.
Le corrlogramme partiel est caractris par une dcroissance gomtrique
des retards.

3) Modle ARMA (mlange de processus AR et MA)


a) Formulation
Les modles ARMA sont donc reprsentatifs dun processus gnr par une
combinaison des valeurs passes et des erreurs passes. Ils sont dfinis par
lquation :

lments danalyse des sries temporelles  257

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 258

ARMA( p,q) : (1 1 D 2 D 2 . . . p D p )yt =


= (1 1 D 2 D 2 . . . q D q )t

Nous avons :
ARMA(1,0) = AR(1); ARMA(0,1) = MA(1).

Dans le cas dun processus ARMA(p, q) avec constante :


yt = + 1 x t1 + 2 x t2 + ... + p x t p + t 1 t1
2 t2 ... q tq

Lesprance du processus est donne1 par E(x t ) =

(1 1 2 ... p )

Donc connaissant lesprance du processus (Eviews calcule directement lesprance du processus), la constante du processus ARMA est dtermine par :
= E(x t ) (1 1 2 ... p )

b) Caractristiques des corrlogrammes


Les corrlogrammes simples et partiels sont, par voie de consquence, un
mlange des deux corrlogrammes des processus AR et MA purs. Il savre
ainsi plus dlicat didentifier ces processus partir de ltude des fonctions
dautocorrlation empiriques.
Le tableau 2 synthtise les caractristiques, en termes de corrlogrammes,
des processus AR, MA et ARMA.
Tableau 2 Rsum des proprits des fonctions dautocorrlation
simple et partielle
Processus

Fonction autocorrlation simple Fonction autocorrlation partielle

AR(1)

Dcroissance exponentielle(1 > 0) ou Pic significatif pour le premier retard:


sinusodale amortie (1 < 0)
Positif si 1 > 0 et ngatif si 1 < 0,
les autres coefficients nuls pour des
retards > 1

AR(2)

Dcroissance exponentielle ou sinuso- Pics significatifs pour le premier et


dale selon les signes de 1 et 2
second retards, les autres coefficients sont
nuls pour des retards > 2

AR(p)

Dcroissance exponentielle et/ou sinusodale

Pics significatifs pour les p premiers


retards, les autres coefficients sont nuls
pour des retards > p

1. Il suffit de remplacer chaque terme E(x t ) = E(x t1 ) = E(x t2 ) = ... = E(x t p ) car la srie
est stationnaire.

258  CONOMTRIE

9782100721511-Bourbo-C09.qxd

Processus

22/10/14

9:34

Page 259

Fonction autocorrlation simple Fonction autocorrlation partielle

MA(1)

Pic significatif pour le premier retard :


positif si 1 < 0 et ngatif si 1 > 0.
Les autres coefficients sont nuls pour
des retards > 1

Dcroissance exponentielle ( 1 > 0) ou


sinusodale amortie ( 1 < 0)

MA(2)

Pics significatifs pour le premier et


second retards. Les autres coefficients
sont nuls pour des retards > 2

Dcroissance exponentielle ou sinusodale selon les signes de 1 et 2

MA(q)

Pics significatifs pour les q premiers


Dcroissance exponentielle et/ou sinusoretards. Les autres coefficients nuls pour dale
des retards > q

ARMA(1, 1)

Dcroissance gomtrique partir du


premier retard, le signe est dtermin
par 1 1

ARMA(p, q)

Dcroissance exponentielle ou sinuso- Dcroissance exponentielle ou sinusodadale amortie tronque aprs (q p)


le amortie tronque aprs p q retards
retards

Dcroissance exponentielle ( 1 > 0) ou


sinusodale amortie ( 1 < 0)

4) Conditions dutilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en tendance ;
corriges des variations saisonnires.

B. Lextension aux processus ARIMA et SARIMA


Les tests de Dickey-Fuller et Dickey-Fuller Augment envisags prcdemment
permettent de dterminer si la srie est stationnaire et dans le cas dune nonstationnarit de quel type il sagit : TS et DS.
Si la srie tudie est de type TS, il convient de la stationnariser par rgression sur le temps et le rsidu destimation est alors tudi selon la mthodologie
de Box-Jenkins. Ceci permet de dterminer les ordres p et q des parties AR et
MA du rsidu. Le modle est toujours dans ce cas un ARMA( p, q) .
Si la srie tudie est de type DS, il convient de la stationnariser par passage aux diffrences selon lordre dintgration I = d (cest--dire le nombre de
fois quil faut diffrencier la srie pour la rendre stationnaire). La srie diffrencie est alors tudie selon la mthodologie de Box-Jenkins qui permet de
dterminer les ordres p et q des parties AR et MA. On note ce type de modle
ARIMA( p, d, q) .
Les modles SARIMA permettent dintgrer un ordre de diffrenciation li
une saisonnalit gnralise par la transformation : (1 D s )yt = yt yts o
s correspond la priodicit des donnes (s = 4 pour une srie trimestrielle,
s = 12 pour une srie mensuelle).

lments danalyse des sries temporelles  259

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 260

Exercice n 2
Gnration de processus ARMA et analyse des corrlogrammes
On demande de gnrer sur 200 observations, de manire artificielle, les processus
suivants et den tudier les corrlogrammes.
1) MA(1) : yt = 2 + (1 + 0,8 D)t
2) AR(1) : (1 0,9 D)yt = 2 + t
3) MA(2) : yt = 2 + (1 + 0,6 D 0,3 D 2 )t
4) AR(2) : (1 0,9 D + 0,7 D 2 )yt = 2 + t
5) ARMA(1, 1) : (1 0,9 D)yt = 2 + (1 + 0,8 D)t
avec t N (0 ; 1).
Solution
Le programme Eviews (
ponible en tlchargement.

C9EX2.PRG) permettant de gnrer les processus est dis-

IV. La mthode de Box et Jenkins


La partie autorgressive dun processus, note AR, est constitue par une combinaison linaire finie des valeurs passes du processus. La partie moyenne
mobile, note MA, est constitue dune combinaison linaire finie en t des
valeurs passes dun bruit blanc. Wold (1954) montre que les modles ARMA
permettent de reprsenter la plupart des processus stationnaires. Lapproche de
Box et Jenkins (1976) consiste en une mthodologie dtude systmatique des
sries chronologiques partir de leurs caractristiques afin de dterminer, dans
la famille des modles ARIMA, le plus adapt reprsenter le phnomne tudi. Trois tapes principales sont dfinies.

A. Recherche de la reprsentation adquate :


lidentification1
La phase didentification est la plus importante et la plus difficile : elle consiste
dterminer le modle adquat dans la famille des modles ARIMA. Elle est
1. Attention : il ne faut pas confondre lemploi de ce terme avec son utilisation dans le cadre des
modles quations simultanes.

260  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 261

fonde sur ltude des corrlogrammes simple et partiel. Nous pouvons essayer
ddicter quelques rgles simples facilitant la recherche des paramtres p, d, q
du modle ARIMA.

1) Dsaisonnalisation
Dans le cas dune srie affecte dun mouvement saisonnier, il convient de la retirer pralablement tout traitement statistique. Cette saisonnalit est ajoute la
srie prvue la fin du traitement afin dobtenir une prvision en terme brut.

2) Recherche de la stationnarit en terme de tendance


Si ltude du corrlogramme simple et les tests statistiques sy rapportant (statistique Q) prsagent dune srie affecte dune tendance, il convient den tudier les
caractristiques selon les tests de Dickey-Fuller. La mthode dlimination de la
tendance est fonction du processus DS ou TS sous-jacent la chronique tudie.
Aprs stationnarisation, nous pouvons identifier les valeurs des paramtres
p, q du modle ARMA.
Si le corrlogramme simple na que ses q premiers termes (q = 3 maximum)
diffrents de 0 et que les termes du corrlogramme partiel diminuent lentement, nous pouvons pronostiquer un MA(q) .
Si le corrlogramme partiel na que ses p premiers termes (p = 3 maximum)
diffrents de 0 et que les termes du corrlogramme simple diminuent lentement, cela caractrise un AR( p) .
Si les fonctions dautocorrlation simple et partiel ne paraissent pas tronques,
il sagit alors dun processus de type ARMA, dont les paramtres dpendent
de la forme particulire des corrlogrammes.

B. Estimation des paramtres


Les mthodes destimation diffrent selon le type de processus diagnostiqu.
Dans le cas dun modle AR( p), nous pouvons appliquer une mthode des
moindres carrs (cf. chapitre 7) ou bien nous pouvons utiliser les relations existantes entre les autocorrlations et les coefficients du modle (quations de YuleWalker).
Lestimation des paramtres dun modle MA(q) savre plus complexe.
Box et Jenkins suggrent dutiliser une procdure itrative de type balayage que
nous pouvons illustrer de la manire suivante.
Supposons le processus :
(1 1 D 2 D 2 )yt = (1 1 D 2 D 2 )t

que nous pouvons crire :

lments danalyse des sries temporelles  261

9782100721511-Bourbo-C09.qxd

22/10/14

yt =

Nous posons vt =

9:34

Page 262

1
(1 1 D 2 D 2 )t
1 1 D 2 D 2

1
t ,
1 1 D 2 D 2

il vient alors :
vt 1 vt1 2 vt2 = t

[6]

yt = vt 1 vt1 2 vt2 o vt = yt + 1 vt1 + 2 vt2

[7]

Ce qui nous donne :


Nous pouvons alors initialiser la procdure de balayage en partant de deux
intervalles de valeurs plausibles pour (
1 ;
2 ) et dun pas dincrmentation.
1 ;
2 ), nous posons : 
Puis, pour chaque couple de valeurs (
v0 = 0 et 
v1 = 0,
et nous calculons les valeurs estimes de 
vt partir de la relation [7] :

v2 = y2

v3 = y3 + 
1
v2

v4 = y4 + 
1
v3 + 
2
v2 , etc.

Aprs calcul de toutes les valeurs de 


vt , nous estimons les paramtres 1 et
2 par la mthode des moindres carrs applique lquation [6] :
vt = 1 vt1 + 2 vt2 + t

[8]

Nous retenons les valeurs 


1 , 
2 et 
1 , 
2 qui rendent minimum la somme
des carrs des rsidus issue de la rgression de lquation [8].
Cette mthode destimation nest valide que si le nombre de paramtres
estimer nest pas trop important.
Nous pouvons mentionner des mthodes destimation fondes sur une maximisation de fonctions de vraisemblance recourant alors des procdures itratives de rgression non linaire, telles que celles envisages au chapitre 6.

C. Tests dadquation du modle et prvision


Les paramtres du modle tant estims (on vrifie la convergence de la procdure itrative destimation), nous examinons les rsultats destimation.
Les coefficients du modle doivent tre significativement diffrents de 0 (le test
du t de Student sapplique de manire classique). Si un coefficient nest pas
significativement diffrent de 0, il convient denvisager une nouvelle spcification liminant lordre du modle AR ou MA non valide.
Lanalyse des rsidus : si les rsidus obissent un bruit blanc, il ne doit pas
exister dautocorrlation dans la srie et les rsidus doivent tre homoscdastiques. Les tests suivants peuvent tre utiliss.

262  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 263

le test de Durbin Watson, bien quil ne permette de dtecter que des autocorrlations dordre 1 ;
les tests de Box et Pierce et de Ljung et Box (cf. I, C de ce chapitre) qui
permettent de tester lensemble des termes de la fonction dautocorrlation. Si le rsidu est mmoire, cela signifie que la spcification du modle est incomplte et quil convient dajouter au moins un ordre au processus ;
le test ARCH dhtroscdasticit (cf. chapitre 5, II, D) effectu partir de
la fonction dautocorrlation du rsidu au carr.
La phase de validation du modle est trs importante et ncessite le plus souvent un retour la phase didentification.
Lorsque le modle est valid, la prvision peut alors tre calcule un horizon de quelques priodes, limites car la variance de lerreur de prvision crot
trs vite avec lhorizon.
Nous pouvons rsumer les diffrentes tapes de la mthodologie de Box et
Jenkins partir du schma 2.

Schma 2 Les tapes de la mthodologie de Box et Jenkins

lments danalyse des sries temporelles  263

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 264

Exercice n 3

fichier C9EX3

Analyse par la mthodologie de Box et Jenkins et prvision


de trois processus alatoires
Soit les trois processus x1 , x2 et x3 connus sur 220 priodes, on demande de :
analyser leurs proprits stochastiques ;
dterminer, le cas chant, lordre du processus ARMA(p, q) ;
effectuer une prvision, par une mthode adapte, un horizon de 3 priodes.
Solution
Les rsultats sont fournis sans les calculs intermdiaires.
1) Analyse du processus x1
Le graphique 2 prsente lvolution du processus x1 et son corrlogramme, leur
lecture le processus est non stationnaire.

800
700
600
500
400
300
200
100
0
25

50

75

100

125

150

175

200

X1

Graphique 2 volution et fonction dautocorrlation simple du processus x1


a) Stratgie simplifie de test : tests de Phillips-Perron (fentre de Newey-West = 4)
Estimation du modle [3]
Null Hypothesis: X1 has a unit root
Exogenous: Constant, Linear Trend
Bandwidth: 4 (Fixed using Bartlett kernel)
Phillips-Perron test statistic
Dependent Variable: D(X1)
Included observations: 219 after adjustments
Variable
Coefficient
Std. Error
X1(-1)
0.039046
0.021398
C
3.725580
0.811468
@TREND(1)
0.124280
0.066711

264  CONOMTRIE

Adj. t-Stat
2.148148

Prob.
0.5157

t-Statistic
1.824772
4.591160
1.862974

Prob.
0.0694
0.0000
0.0638

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 265

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons donc pas interprter les probabilits critiques calcules directement selon les lois de Student. Nous
devons nous rfrer la table statistique 7 en fin douvrage : tb = 1,86 < tb0,05 = 2,79
(valeur lue 5%, modle [3]), acceptation de lhypothse b = 0. Selon la stratgie
squentielle de test nous estimons le modle [2].
Estimation du modle [2]
Null Hypothesis: X1 has a unit root
Exogenous: Constant
Bandwidth: 4 (Fixed using Bartlett kernel)
Phillips-Perron test statistic
Dependent Variable: D(X1)
Included observations: 219 after adjustments
Variable
Coefficient
Std. Error
X1(-1)
0.000673
0.001830
C
3.128542
0.749736

Adj. t-Stat
0.307267

Prob.
0.9783

t-Statistic
0.367843
4.172860

Prob.
0.7133
0.0000

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student :
tc = 4,17 > tc0,05 = 2,84 (valeur lue 5%, modle [2]), nous refusons lhypothse
c = 0. Il sagit donc dun processus DS avec drive : x1t = x1t1 + c + t . Nous le stationarisons par le passage aux diffrences premires.
b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire

Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.

lments danalyse des sries temporelles  265

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 266

c) Recherche des ordres p et q de la reprsentation ARMA


Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(2, 1). Nous constatons que la constante est significativement diffrente de 0, et des essais dautres reprsentations concurrentes (ARMA(1, 1)) indiquent
des valeurs des critres dinformation (AIC ou SC) suprieures au modle retenu.
Dependent Variable: D(X1)
Included observations: 217 after adjustments
Variable
C
AR(1)
AR(2)
MA(1)

Coefficient
3.327748
0.760134
- 0.604867
0.500890

Std. Error
0.346054
0.066149
0.062249
0.073470

t-Statistic
9.616272
11.49128
- 9.716905
6.817644

Prob.
0.0000
0.0000
0.0000
0.0000

d) Validation de la reprsentation
Tests de Student sur les coefficients :
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05)
Analyse des rsidus
Corrlogramme du rsidu

Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le


corrlogramme du rsidu au carr (test ARCH, cf. chapitre 5) nindique aucun terme de
significativement diffrent de 0 ; lhomoscdasticit des rsidus est donc vrifie. Les
rsidus sont donc un processus de bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 2,06) indique
une probabilit critique de 0,35, nous acceptons lhypothse H0 de normalit des rsidus.
La reprsentation est valide, x1t est un processus ARIMA(2, 1, 1) avec constante.
e) Prvision
La valeur de la constante est gale : = E(x1t ) (1 1 2 )

266  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 267

La prvision est donne par :


x1t = 1 x1t1 + 2 x1t2 + E(x1t ) (1 1 2 ) + t + 1 t1
x1t = 0,76 x1t1 0,60 x1t2 + 3,33 (1 0,76 + 0,60) + t + 0,50 t1
x1t = x1t1 + x1t
x1,221 = 0,76 x1,220 0,60 x1,219 + 2,81 + 221 + 0,50 220
x1,221 = 0,76 7,76 0,60 12,39 + 2,81 + 0 + 0,50 0,87 = 1,65
Jusqu lobservation t = 220 nous prenons t = rsidu, pour t > 220, E(t ) = 0.
x1,221 = x1,220 + x1,221 = 741,90 + 1,65 = 743,55
x1,222 = 0,76 x1,221 0,60 x1,220 + 2,81 + 222 + 0,50 221
x1,222 = 0,76 1,65 0,60 7,76 + 2,81 + 0 + 0 = 0,63
x1,222 = x1,221 + x1,222 = 743,55 0,63 = 742,92
x1,223 = 0,76 x1,222 0,60 x1,221 + 2,81 + 223 + 0,50 222
x1,223 = 0,76 0,63 0,60 1,65 + 2,81 + 0 + 0 = 1,34
x1,223 = x1,222 + x1,223 = 742,92 + 1,34 = 744,26
Les rsultats sont prsents au tableau 3.
Tableau 3 Calcul des prvisions du processus ARIMA(2, 1, 1)
t

x1t

x1t

t = rsidus

218
219
220
221
222
223

721,75
734,14
741,90
743,55
742,92
744,26

10,2
12,39
7,76
1,65
0,63
1,34

4,07
2,28
0,87
0
0
0

2) Analyse du processus x2
Le graphique 3 prsente lvolution du processus x2 et son corrlogramme, leur
lecture le processus semble non stationnaire.
35
30
25
20
15
10
5
0
25

50

75

100

125

150

175

200

X2

Graphique 3 volution et fonction dautocorrlation simple du processus x2

lments danalyse des sries temporelles  267

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 268

a) Stratgie simplifie de test : tests de Dickey-Fuller


Doit-on utiliser le test de Dickey-Fuller simple ou le test de Dickey-Fuller
Augment ?
Pralablement nous dterminons la valeur de p, si p = 0 nous utilisons le test de
Dickey-Fuller. partir du modle [2] (modle avec constante) nous slectionnons
lordre p du modle partir des critres dinformation dAkaike et de Schwarz. Les deux
critres sont convergents1 p = 3.
Null Hypothesis: X2 has a unit root
Exogenous: Constant
Lag Length: 3 (Automatic based on AIC, MAXLAG=8)
Null Hypothesis: X2 has a unit root
Exogenous: Constant
Lag Length: 3 (Automatic based on SIC, MAXLAG=8)
Nous appliquons donc la stratgie squentielle des tests partir des tests de DickeyFuller Augment avec p = 3.
Estimation du modle [3]
Null Hypothesis: X2 has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 3 (Fixed)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level

t-Statistic
2.253814
4.001108
3.430766
3.138998

Prob.*
0.4570

Augmented Dickey-Fuller Test Equation


Dependent Variable: D(X2)
Sample (adjusted): 5 220
Included observations: 216 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

X2( 1)
D(X2( 1))
D(X2( 2))
D(X2( 3))
C
@TREND(1)

0.080344
0.229159
0.209633
0.168372
1.314041
0.002458

0.035648
0.070487
0.069319
0.067849
0.575187
0.003842

2.253814
3.251071
3.024181
2.481571
2.284546
0.639940

0.0252
0.0013
0.0028
0.0139
0.0233
0.5229

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student. Nous devons
1. En cas de divergence des critres nous retenons la valeur de p minimum des deux critres.

268  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 269

donc nous rfrer la table statistique 7 en fin douvrage : tb = 0,64 < tb0,05 = 3,12
(valeur lue 5 %, modle [3]), acceptation de lhypothse b = 0. Nous estimons le
modle [2].
Estimation du modle [2]
Null Hypothesis: X2 has a unit root
Exogenous: Constant
Lag Length: 3 (Fixed)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level

t-Statistic
2.306282
3.460596
2.874741
2.573883

Prob.*
0.1709

Augmented Dickey-Fuller Test Equation


Dependent Variable: D(X2)
Sample (adjusted): 5 220
Included observations: 216 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

X2( 1)
D(X2( 1))
D(X2( 2))
D(X2( 3))
C

0.067264
0.239180
0.217876
0.174967
1.347763

0.029165
0.068630
0.068017
0.066968
0.571966

2.306282
3.485076
3.203270
2.612710
2.356368

0.0221
0.0006
0.0016
0.0096
0.0194

Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons pas interprter


les probabilits critiques calcules directement selon les lois de Student :
tc = 2,35 < tc0,05 = 3,39 (valeur lue 5 %, modle [2]), nous acceptons lhypothse
c = 0. Il sagit donc dun processus DS sans drive : x2t = x2t1 + t . Nous le stationarisons par le passage aux diffrences premires.
b) Analyse des fonctions dautocorrlation simple et partielle sur la srie stationnaire

lments danalyse des sries temporelles  269

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 270

Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.
c) Recherche des ordres p et q de la reprsentation ARMA
Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(1, 1). Nous constatons que la constante nest pas significativement
diffrente de 0, et des essais dautres reprsentations concurrentes (ARMA(2, 0) ou
ARMA(0, 2)) indiquent des valeurs des critres dinformation (AIC ou SC) suprieures
au modle retenu.
Dependent Variable: D(X2)
Sample (adjusted): 3 220
Included observations: 218 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

AR(1)
MA(1)

0.437628
0.743275

0.127029
0.094329

3.445091
7.879625

0.0007
0.0000

d) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).
Analyse des rsidus
Corrlogramme du rsidu

Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dun processus sans mmoire, le


corrlogramme du rsidu au carr nindique aucun terme de significativement diffrent
de 0 ; les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 5,88) indique
une probabilit critique de 0,052, nous acceptons (de justesse !) lhypothse de normalit des rsidus.
La reprsentation est valide, x2t est un processus ARIMA(1, 1, 1) sans constante.

270  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 271

e) Prvision
La prvision est donne (E(t ) = 0 pour t > 220) par :
x2t = 1 x2t1 + 1 t1
x2t = 0,437 x2t1 0,743t1
x2t = x2t1 + x2t
x2,221 = 0,437 x2,220 0,743 220
x2,221 = 0,437 1,318 0,743 0,889 = 0,084
x2,221 = x2,220 + x2,221 = 19,61 + 0,084 = 19,69
x2,222 = 0,437 x2,221 0,743 221
x2,222 = 0,437 0,084 0,743 0 = 0,037
x2,222 = x2,221 + x2,222 = 19,69 + 0,037 = 19,73
x2,223 = 0,437 x2,222 0,743 222
x2,223 = 0,437 0,037 0,743 0 = 0,016
x2,223 = x2,222 + x2,223 = 19,73 + 0,016 = 19,75
Les rsultats sont prsents au tableau 4.
Tableau 4 Calcul des prvisions du processus ARIMA(1, 1, 1)
t

x2t

x2t

t = rsidus

218
219
220
221
222
223

20,438
20,930
19,611
19,695
19,732
19,748

3,328
0,492
1,318
0,084
0,037
0,016

2,464
0,867
0,889
0
0
0

3) Analyse du processus x3
Le graphique 4 prsente lvolution du processus x3 et son corrlogramme, leur
lecture le processus est clairement non stationnaire.

700
600
500
400
300
200
100
0
25

50

75

100

125

150

175

200

X3

Graphique 4 volution et fonction dautocorrlation simple du processus x3

lments danalyse des sries temporelles  271

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 272

a) Stratgie simplifie de test : tests de Phillips-Perron (choix automatique de la fentre


de Newey-West)
Estimation du modle [3]
Null Hypothesis: X3 has a unit root
Exogenous: Constant, Linear Trend
Bandwidth: 1 (Newey-West using Bartlett kernel)
Phillips-Perron test statistic
Test critical values:
1% level
5% level
10% level
Phillips-Perron Test Equation
Dependent Variable: D(X3)
Sample (adjusted): 2 220
Included observations: 219 after adjustments

Adj. t-Stat
15.03107
4.000511
3.430477
3.138828

Prob.*
0.0000

Variable

Coefficient

Std. Error

t-Statistic

Prob.

X3(- 1)
C
@TREND(1)

1.023098
10.33495
3.065841

0.068065
0.639662
0.203980

15.03108
16.15689
15.03013

0.0000
0.0000
0.0000

Nous refusons lhypothse H0 de racine unitaire, nous pouvons donc interprter


directement les probabilits critiques calcules selon les lois de Student, refus aussi de
lhypothse b = 0.
Le processus x3 est un TS (Trend Stationnary), x3t = a0 + a1 t + t avec
t = 1, 2, ..., n. La bonne mthode de stationnarisation consiste donc effectuer une
rgression sur le temps.
b) Modlisation
Soit la rgression de x3 sur une tendance dterministe t = 1, 2, ... , n
Dependent Variable: X3
Method: Least Squares
Included observations: 220
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
TENDANCE

7.171985
2.996632

0.409466
0.003213

17.51547
932.7294

0.0000
0.0000

c) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).

272  CONOMTRIE

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 273

Analyse des rsidus


Corrlogramme du rsidu

Corrlogramme du rsidu au carr

Le corrlogramme du rsidu indique quil sagit dune marche au hasard, le corrlogramme du rsidu au carr nindique aucun terme de significativement diffrent de 0 ;
les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 1,249) indique
une probabilit critique de 0,54, nous acceptons lhypothse de normalit des rsidus.
La reprsentation est valide x3t est un processus TS.
d) Prvision
La prvision est donne par :
x3t = a0 + a1 t + t avec (E(t ) = 0) t
x3t = 7,17 + 2,996 t
x3,221 = 7,17 + 2,996 221 = 669,428
x3,222 = 7,17 + 2,996 222 = 672,424
x3,223 = 7,17 + 2,996 223 = 675,421

lments danalyse des sries temporelles  273

9782100721511-Bourbo-C09.qxd

22/10/14

9:34

Page 274

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 275

10. La modlisation VAR


L

a modlisation conomtrique classique plusieurs quations


structurelles (cf. chapitre 8) a connu beaucoup de critiques
(Granger [1969] et Sims [1980]) et de dfaillances face un environnement conomique trs perturb. Les prvisions labores laide
de ces modles se sont rvles trs mdiocres. Les critiques principales
formules lencontre de ces modles structurels concerne la simultanit des relations et la notion de variable exogne. La reprsentation1 VAR
(Vector AutoRegressive) gnralisation des modles autorgressifs (AR)
au cas multivari (cf. chapitre 9) apporte une rponse statistique lensemble de ces critiques. Dans cette reprsentation, les variables slectionnes2 en fonction du problme tudi ont toutes, a priori, le mme
statut et on sintresse alors des relations purement statistiques.
Nous prsentons tout dabord en section I. la spcification gnrale
dun modle VAR, puis nous abordons les mthodes destimation et de
prvision en section II. La dynamique dun modle VAR et lanalyse des
chocs sont traites dans la section III. ; enfin, la section IV est consacre
la recherche du sens de la causalit entre les variables.

1. Le terme de reprsentation convient mieux que le terme de modlisation, car lconomiste ne


spcifie pas des relations conomiques en tant que telles.
2. En gnral celles dun modle thorique.

La modlisation VAR  275

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 276

I. Reprsentation dun modle VAR


A. Exemple introductif
Soit une reprsentation VAR dans laquelle on considre deux variables y1t et y2t .
Chacune de ces variables est fonction de ses propres valeurs passes et de
celles de lautre.
Par exemple le modle VAR dun ordre p = 4 , scrit :
y1t = a1 +

4


b1i y1ti +

i=1

y2t = a2 +

4


4


c1i y2ti d1 y2t + 1t

i=1

b2i y1ti +

i=1

4


c2i y2ti d2 y1t + 2t

i=1

Les variables y1t et y2t sont considres comme tant stationnaires (cf. chapitre 9), les perturbations 1t et 2t (les innovations ou les chocs) sont des bruits
blancs de variances constantes 12 et 22 et non autocorrles. Nous pouvons
immdiatement constater labondance de paramtres estimer (ici 20 coefficients) et les problmes de perte de degrs de libert qui en rsultent. la lecture de ce modle, il apparat quil nest pas sous forme rduite : en effet, y1t a
un effet immdiat sur y2t et rciproquement y2t a un effet immdiat sur y1t . Ce
systme initial est appel forme structurelle de la reprsentation VAR. Sous
forme matricielle, ce modle devient :
BYt = A0 +

4


Ai Yti + t

[1]

i=1

avec :

1
B=
d2

d1
1


Yt =

y1t
y2t

a
A0 = 1
a2

b
Ai = 1i
b2i

c1i
c2i


1t
=
.
2t

Pour obtenir un modle VAR sous forme standard, on multiplie de part de


dautre dans [1] par B 1 . Le modle sous forme standard scrit :
y1t = a10 +
y2t = a20 +

4


a1i1 y1ti +

4


i=1

i=1

4


4


i=1

a2i1 y1ti +

a1i2 y2ti + 1t
a2i2 y2ti + 2t

i=1

Dans cette spcification, les erreurs 1t et 2t sont fonction des innovations


1t et 2t ; en effet, puisque = B 1 , on obtient :
1t = (1t d1 2t )/(1 d1 d2 ) et 2t = (2t d2 1t )/(1 d1 d2 )

276  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 277

On dmontre que :
E(1t ) = 0; E(2t ) = 0; E(1t 1ti ) = 0; E(2t 2ti ) = 0

Les erreurs ont une esprance nulle et sont non autocorrles.


E(1t2 ) = (12 + d12 22 )/(1 d1 d2 )2 ; E(2t2 ) = (22 + d22 12 )/(1 d1 d2 )2

La variance de lerreur est constante (indpendante du temps).


E(1t 2t ) = (d2 12 + d1 22 )/(1 d1 d2 )2

Si d1 = d2 = 0 , les variables y1t et y2t nont pas dinfluence synchrone lune


sur lautre, les erreurs 1t et 2t sont non corrles. Dans le cas contraire, les
erreurs 1t et 2t sont corrles et donc une variation de lune de ces erreurs un
instant donn a un impact sur lautre.

B. La reprsentation gnrale
La gnralisation de la reprsentation VAR k variables et p dcalages (note
VAR( p) ) scrit sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t
y
1,t

2,t

avec Yt =
.. ; Ai =/0
.

a1i1
a2i1
=
..
.

yk,t

aki1

a1i2
a2i2
aki2

a0

. . . a1ik
1t
1
k
0
a2i
a2
2t
; A0 = . ; t = .
.
..

.
k
0
kt
ak
aki

On note : = E(t t ) , la matrice de dimension (k, k) des variances covariances des erreurs. Cette matrice est bien sr inconnue.
Cette reprsentation peut scrire laide de loprateur retard :
(I A1 D A2 D 2 . . . A P D P )Yt = A0 + t ou encore A(D)Yt = A0 + t

Condition de stationnarit
Un modle VAR est stationnaire, sil satisfait les trois conditions classiques :
E(Yt ) = t ;
Var(Yt ) < ;
Cov(Yt ,Yt+k ) = E[(Yt )(Yt+k )] = k t .
On dmontre1 quun processus VAR( p) est stationnaire si le polynme dfini partir du dterminant : det(I A1 z A2 z 2 . . . A p z p ) = 0 a ses racines
lextrieur du cercle unit du plan complexe.

1. Cf. Hamilton J. D., page 259, 1994.

La modlisation VAR  277

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 278

Exercice n 1
Recherche des conditions de stationnarit dun modle VAR
Soit le processus :


y1t
y2t

  
3
0,2
=
+
1
0,3

0,7
0,4



  
y1t1
e1t
+
y2t1
e2t

On demande dtudier les conditions de stationnarit.


Solution
Le dterminant est gal :


 

1 0
0,2 0,7
z 1 = 1,30
2
det

z = 1 0,6 z 0,13 z
0 1
0,3 0,4
z 2 = 5,91
Les deux racines sont en valeur absolue suprieures 1, le processus est donc stationnaire.

C. La reprsentation ARMAX
La reprsentation prcdente peut tre gnralise1, par analogie avec les processus ARMA( p, q) , un modle dont les erreurs sont autocorrles dordre q.
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t + B1 t1 + B2 t2 + . . . + Bq tq

Il sagit dun processus ARMA multivari not : ARMAX ou parfois


VARMA.
Les conditions de stationnarit sont analogues celles dun processus
ARMA univari : un processus VAR est toujours inversible, il est stationnaire
lorsque les racines de son polynme sont lextrieur du cercle unit du plan
complexe.
Un processus VMA est toujours stationnaire. Il est inversible si les racines
de son polynme retard sont lextrieur du cercle unit du plan complexe.
Les conditions de stationnarit et dinversibilit dun ARMAX sont donnes par la partie VAR et la partie VMA de lARMAX.

1. Il sagit dune application au cas multivari du thorme de dcomposition de Wold (1954).

278  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 279

II. Estimation des paramtres


Les paramtres du processus VAR ne peuvent tre estims que sur des sries
chronologiques stationnaires. Ainsi, aprs tude des caractristiques des sries,
soit les sries sont stationnarises par diffrence, pralablement lestimation
des paramtres dans le cas dune tendance stochastique, soit il est possible
dajouter une composante tendance la spcification VAR, dans le cas dune
tendance dterministe.

A. Mthode destimation
Dans le cas dun processus VAR, chacune des quations peut tre estime par
les MCO, indpendamment les unes des autres (ou par une mthode de maximum de vraisemblance).
Soit le modle VAR( p) estim :
0 + A
1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + e
Yt = A

e tant le vecteur de dimension (k,1) des rsidus destimation e1t , e2t , . . . , ekt .
Et on note :
modle.

la matrice des variances covariances estimes des rsidus du

Les coefficients du processus VAR ne peuvent tre estims qu partir de


sries stationnaires. Ainsi, aprs tude des caractristiques des chroniques, soit
les sries sont stationnarises par diffrence, pralablement lestimation des
paramtres dans le cas dune tendance stochastique, soit il est possible dajouter
une composante tendance la spcification VAR, dans le cas dune tendance
dterministe.
De mme, nous pouvons ajouter la spcification VAR des variables binaires
afin de corriger un mouvement saisonnier ou une priode anormale.

B. Dtermination du nombre de retards


Pour dterminer le nombre de retards dun modle retards chelonns (cf. chapitre 7), nous avons prsent les critres de Akaike et de Schwarz. Dans le cas
de la reprsentation VAR, ces critres peuvent tre utiliss pour dterminer
lordre p du modle. La procdure de slection de lordre de la reprsentation
consiste estimer tous les modles VAR pour un ordre allant de 0 h (h tant
le retard maximum admissible par la thorie conomique ou par les donnes

La modlisation VAR  279

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 280

disponibles). Les fonctions AIC( p) et SC( p) sont calcules de la manire


suivante :
   2k 2 p
AIC( p) = Ln det e  +
n
   k 2 p Ln(n)
SC( p) = Ln det e  +
n

avec : k = nombre de
variables du systme ; n = nombre dobservations ;
p = nombre de retards ; e = matrice des variances covariances des rsidus du
modle.
Le retard p qui minimise les critres AIC ou SC est retenu.

C. Prvision
Les coefficients du modle tant estims, la prvision peut tre calcule en n
lhorizon dune priode, par exemple pour un VAR(1), de la manire suivante :
n (1) = A
0 + A
1 Yn
Y

lhorizon de 2 priodes, la prvision est :


n (2) = A
0 + A
1 Y
n (1) = A
0 + A
1 A
0 + A
21 Yn
Y

lhorizon de 3 priodes, la prvision scrit :


n (3) = A
n (2) = (I + A
0 + A
1 Y
1 + A
21 ) A
0 + A
31 Yn
Y

etc.
Lorsque h tend vers linfini, nous constatons que la prvision tend vers une
i1 0 si i .
valeur constante (tat stationnaire) puisque A
Lesprance de la matrice de lerreur de prvision est nulle, sa variance est
donne par :

(h) = M0

M0 + M1

M1 + . . . + Mh1


Mh1
o Mi est calcul par la

formule de rcurrence suivante :




min( p,i)

Mi =

j Mi j
A

i = 1, 2,. . . et M0 = I

j=1

Ainsi, il vient :
1 ; M2 = A
1 M1 + A
2 M0 = A
21 + A
2 ;
M1 = A
3
1 M2 + A
2 M1 + A
3 M0 = A
1 + A
1 A
2 + A
2 A
1 + A
3
M3 = A

etc.
La variance de lerreur de prvision pour chacune des prvisions des k
n2 (h)) se lit sur la premire diagonale de la matrice
variables (
e (h) .
Lintervalle de prvision au seuil de (1 /2) est donn par :
n (h) t /2 
Y
n (h) avec t /2 valeur de la loi normale.

280  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 281

Exercice n 2

fichier C10EX2

Spcification, estimation et prvision dun modle VAR


Nous cherchons modliser, sous la forme VAR, la demande (y1t ) et les prix (y2t )
dune matire premire. Nous disposons des donnes trimestrielles CVS et en diffrences
premires sur 18 ans (tableau 1).
Tableau 1 Demande et prix CVS et en diffrences premires (extrait des donnes)
Date
0001Q1
0001Q2

0018Q3
0018Q4

y1t

y2t

146,4
19,2

19,2
50,4

75,6
1,8

16,2
3,6

On demande :
1) de rechercher lordre du modle VAR,
2) destimer les paramtres du modle,
3) de calculer une prvision pour lanne 19 avec son intervalle de confiance 95 %.
Solution
1) Rechercher lordre du modle VAR
Nous allons utiliser les critres de Akaike et de Schwarz pour des dcalages h allant
de 0 4. Nous devons donc estimer quatre modles diffrents et retenir celui dont les critres AIC et SC sont les plus faibles.
Estimation du modle pour h = 1
   0  1
a
a
y1t
= 10 + 11
1
y2t
a2
a21

2
a11
2
a21



  
y1t1
1t
+
y2t1
2t

Ou encore :
1
2
y1t1 + a11
y2t1 + 1t
y1t = a10 + a11
1
2
y2t = a20 + a21
y1t1 + a21
y2t1 + 2t

Pour estimer les paramtres de ce modle, nous pouvons utiliser les MCO quation
par quation.
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862
Les deux rsidus destimation sont alors calculs : e1,t et e2,t ainsi la matrice des
variances covariances des rsidus est donne par :
n
n



e12
e1 e2


1 1
1

n
n
e =



n
e1 e2
e22
1
=
71

106500,16
47878,12

 
47878,12
1500,002
=
85205,25
674,339

674,3398
1200,074

La modlisation VAR  281

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 282

Attention, certains logiciels (par exemple Eviews partir de la version 4) estiment


cette matrice des variances covariances en divisant la somme des carrs ou du produit par
le degr de libert de chaque quation estime soit :

 


1
106500,16 47878,12
1566,18 704,09
=
=
e
704,09 1253,02
71 2 1 47878,12 85205,25
Dans toute la suite des calculs nous retenons la mthode 1, soit :
Var(e1t ) = 1 500,002 ; Var(e2t ) = 1 200,074 ; Cov(e1t ,e2t ) = 674,339


   1 500,002 674,339 


=
Soit det
e
 674,339 1 200,074  = 1 345 379 .
Pour p = 1 :
   2k 2 p
+
= Ln(1 345 379) + (2 22 1)/71 = 14,28
AIC( p) = Ln det
e
n
et
   k 2 p Ln(n)
= Ln(1 345 379) + (22 1 Ln(71))/71
+
SC( p) = Ln det
e
n
= 14,47
Nous pouvons calculer de la mme manire :
AIC(2) = 14,31 ; AIC(3) = 14,39 ; AIC(4) = 14,45
SC(2) = 14,56 ; SC(3) = 14,78 ; SC(4) = 14,97
Le nombre de dcalages retenu correspond la valeur la plus faible des critres
soit : p = 1.
2) Estimation des paramtres
Le modle VAR(1) estim scrit :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,1292 + e1t
(0,06)
(4,47)
(2,87)
R 2 = 0,28 ; n = 71 ; () = t de Student
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862 + e2t
(1,84)
(2,44)
(2,41)
R 2 = 0,21 ; n = 71 ; () = t de Student
3) Prvision
La prvision est calcule en faisant tourner le modle :

y19:1 = 0,0067 y18:4 0,6125 y18:4 + 17,129
.


y19:1 = 0,1752 y18:4 + 0,2992 y18:4 12,862


y19:1 = 0,0067 50,4 0,6125 3,6 + 17,129 = 15,3

y19:1 = 0,1752 50,4 + 0,2992 3,6 12,862 = 20,6

y19:2 = 0,0067 15,3 0,6125 20,6 + 17,129 = 29,9

y19:2 = 0,1752 15,3 + 0,2992 20,6 12,862 = 21,7

282  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 283


y19:3 = 0,0067 29,9 0,6125 21,7 + 17,129 = 30,6

y19:3 = 0,1752 29,9 + 0,2992 21,7 12,862 = 24,6

y19:4 = 0,0067 30,6 0,6125 24,6 + 17,129 = 32,4

y19:4 = 0,1752 30,6 + 0,2992 24,6 12,862 = 25,6
La variance de lerreur de prvision est donne par la formule :


o Mi est calcul par la formule
M1 + . . . + Mh1 e Mh1
min(
p,i)

j Mi j i = 1,2,. . . et M0 = I . Les variances se
de rcurrence suivante : Mi =
A

e (h)

+M1

j=1

lisent sur la premire diagonale de la matrice

e (h) .

1 ; M2 = A
1 M1 = A
21 ; M3 = A
1 M2 = A
31 ; etc., car le
Ainsi, il vient : M1 = A

modle est un VAR(1) et donc seul A1 est estim.



1 500,02 674,34
. La variance de
Soit lhorizon h = 1, nous avons e (1) =
674,34 1 200,1
y19:1 est gale 1 500,02 et la variance de lerreur de prvilerreur de prvision pour 

sion pour y19:1 est gale 1 200,1. Lintervalle de confiance pour y19:1 est donn
par : 15,3 1,96 38,73 = [60,64 ; 91,17] et pour y19:1 est donn par :
20,6 1,96 34,64 = [88,52 ; 47,27] .
Soit lhorizon h = 2, nous avons :

e (2)

1
+A

1 , soit :
A

 

674,34
0,00676 0,6126
1 500,02
+
1 200,1
0,1753 0,2992
674,34

 

0,00676 0,1753
1 955,99 969,88
=
0,6126 0,2992
969,88 1 424,37


2

1
21
1 + A
1
(3) =
+A
A
A
Pour h = 3 :

e (2) =

674,34
1 200,1



1 500,02 674,34
0,00676 0,6126
1 500,02 674,34
+
e (3) =
674,34 1 200,1
0,1753 0,2992
674,34 1 200,1

 
2 

0,00676 0,1753
0,00676 0,6126
1 500,02 674,34
+
0,6126 0,2992
0,1753 0,2992
674,34 1 200,1

2 

0,00676 0,1753
2 042,63 1 043,88
=
0,6126 0,2992
1 043,88 1 489,48


2
3

1
2
3



Pour h = 4 : e (4) = e + A
e A1 + A1
e A1 + A1
e A1

 



1 500,02 674,34
0,00676 0,6126
1 500,02 674,34
+
e (4) =
674,34 1 200,1
0,1753 0,2992
674,34 1 200,1

 
2 

0,00676 0,1753
0,00676 0,6126
1 500,02 674,34
+
0,6126 0,2992
0,1753 0,2992
674,34 1 200,1

1 500,02
674,34

La modlisation VAR  283

9782100721511-Bourbo-C10.qxd




22/10/14

0,00676
0,6126

0,1753
0,2992

0,00676
0,6126

0,1753
0,2992

10:25

2
+

3
=

Page 284

0,00676
0,1753
2 067,67
1 064,00

0,6126
0,2992

3 

1 064,00
1 505,73

1 500,02
674,34

674,34
1 200,1

IC y19:2 = 29,9 1,96 44,22 = [56,82 ; 116,54]


Ic y19:2 = 21,7 1,96 37,74 = [95,68 ; 52,26]
IC y19:3 = 30,6 1,96 45,19 = [57,95 ; 119,21]
Ic y19:3 = 24,6 1,96 38,59 = [100,23 ; 51,05]
IC y19:4 = 32,4 1,96 45,47 = [56,72 ; 121,52]
Ic y19:4 = 25,6 1,96 38,80 = [101,64 ; 50,46]

III. Dynamique dun modle VAR


Les modles VAR permettent danalyser les effets de la politique conomique,
cela au travers de simulations de chocs alatoires1 et de la dcomposition de la
variance de lerreur. Cependant, cette analyse seffectue en postulant la constance de lenvironnement conomique toutes choses tant gales par ailleurs .

A. Reprsentation VMA dun processus VAR


Nous avons vu quun modle AR(1) a une reprsentation MA() . Par analogie,
nous pouvons dmontrer quun VAR(1) a une reprsentation VMA() . Le
modle sous cette forme va permettre de mesurer limpact sur les valeurs prsentes dune variation des innovations (ou des chocs) 1t et de 2t .
Soit la reprsentation VAR( p) stationnaire :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t

Sa reprsentation VMA() est donne par :


Yt = + t + M1 t1 + M2 t2 + . . . = +


i=0

avec : = (I A1 A2 . . . A p )1 A0


min( p,i )

et Mi =

A j Mi j i = 1,2,. . . et M0 = I

j =1

1. Le terme dinnovation est aussi souvent employ.

284  CONOMTRIE

Mi ti

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 285

Sous cette forme, la matrice M apparat comme un multiplicateur dimpact , cest--dire que cest au travers de cette matrice quun choc se rpercute
tout le long du processus. Une variation un instant donn t de t affecte toutes
les valeurs suivantes de Yt , leffet dun choc (ou dune innovation) est donc permanent et va en samortissant.

B. Analyse et orthogonalisation des chocs


Lanalyse dun choc consiste mesurer limpact de la variation dune innovation
sur les variables. Prenons lexemple du modle estim de lexercice 2 :
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129 + e1t
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,863 + e2t

Une variation un instant donn de e1t a une consquence immdiate sur y1t
puis sur y2t+1 et y2t+1 , par exemple sil se produit en t un choc sur e1t gal 1,
nous avons limpact suivant :


 
1
0

 
  

y1t+1
0,00676 0,6126
1
0,0067
=
=
la priode t + 1 :
0,1753 0,2992
0
0,175
y2t+1

 

 

y1t+2
0,00676 0,6126
0,0067
0,107
=
=
la priode t + 2 :
y2t+2
0,1753 0,2992
0,175
0,054

En t :

y1t
y2t

etc.
Les diffrentes valeurs ainsi calcules constituent la fonction de rponse
impulsionnelle . Dans ce schma, nous faisons lhypothse que les rsidus e1t et
e2t sont indpendants entre eux. Or, cette hypothse est rarement vrifie ; en
effet, nous avons montr en section I., quil peut exister une corrlation entre les
erreurs 1t et de 2t , cette corrlation pouvant tre mesure laide des rsidus
destimation : e1 e2 =

Cov(e1 ,e2 )
.
e1 e2

Cependant si ce coefficient nous renseigne bien sur la liaison contemporaine


entre les deux rsidus, il nindique pas le sens de la causalit. Cest pourquoi,
nous devons faire une hypothse supplmentaire concernant la relation entre les
erreurs : par exemple, dans lexercice 2, la rflexion conomique laisse prsager
quune variation du prix (y2t ) a un impact sur la demande (y1t ) . Un choc sur y1t
na donc pas dimpact contemporain sur y2t ; en revanche un choc sur y2t a un
impact contemporain (mesur par le coefficient de corrlation entre les rsidus)
sur y1t . Dans cet exemple, le coefficient de corrlation est gal
Cov(e1 ,e2 )
= 0,503 ; en faisant lhypothse que e1 e2 , un choc
e1 e2
alatoire de 1 sur y2t se traduit par une baisse de 0,503 sur y1t . Le tableau 2

e1 e2 =

illustre cette dissymtrie des innovations sur les variables.

La modlisation VAR  285

9782100721511-Bourbo-C10.qxd

04/11/14

8:22

Page 286

Tableau 2 Analyse des chocs sur les variables y1t et y2t


avec 1t = 0,503 2t
t

y1t

1
2

y2t

y1t

y2t

1,000

0,000

0,530

1,000

0,007

0,175

0,616

0,387

0,107

0,054

0,241

0,224

0,034

0,035

0,139

0,109

0,022

0,016

0,068

0,057

0,010

0,009

0,035

0,029

0,005

0,004

0,018

0,015

0,003

0,002

0,009

0,008

0,001

0,001

0,005

0,004

10

0,001

0,001

10

0,002

0,002

11

0,000

0,000

11

0,001

0,001

12

0,000

0,000

12

0,001

0,001

Le choix du sens de limpact est donc trs important et conditionne les


valeurs obtenues. Nous pouvons observer que leffet dune innovation sestompe au cours du temps. Cela caractrise un processus VAR stationnaire.
Le graphique 1 prsente les deux fonctions de rponses impulsionnelles.
Le problme de la corrlation contemporaine des erreurs et donc de limpact
dun choc sur une variable est trait, dune manire gnrale, par la recherche
dune reprsentation erreurs orthogonales. Reprenons lexemple dun modle
VAR deux variables :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = a2 y1,t1 + b2 y2,t1 + 2,t
/ 0.
avec Var(1,t ) = 21 , Var(2,t ) = 22 et Cov(1,t ,2,t ) = k =
2
En calculant y2,t (k/1 )y1,t on obtient :
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t

On pose : t = 2,t k/21 1,t


2
Cov(1,t ,t ) = E(1,t t ) = Cov(1,t 2,t ) k/21 E(1,t2
) = k k = 0.
Les erreurs (ou innovations) ne sont plus corrles. Lanalyse des chocs
peut donc seffectuer sur les deux quations suivantes dont les erreurs sont
orthogonales :
y1,t = a1 y1,t1 + b1 y2,t1 + 1,t
y2,t = k/21 y1,t + (a2 a1 k/21 )y1,t1 + (b2 b1 k/21 )y2,t1 + 2,t k/21 1,t

286  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 287

Nous remarquons que, sous cette forme, nous avons fait apparatre dans la
deuxime quation la causalit instantane entre y2,t et y1,t telle quelle existait
dans le VAR structurel (cf. I. A.). Cependant, la causalit instantane entre y1,t et
y2,t napparat pas dans la premire quation. Dans cette procdure dorthogonalisation, les rsidus sont indpendants, nous pouvons faire apparatre soit une
causalit instantane entre y2,t et y1,t soit une causalit instantane entre y1,t et
y2,t mais pas les deux la fois : il sagit de lordre de dcomposition.
La gnralisation un modle VAR k variables ncessite le recours des
procdures dorthogonalisation1 de matrice et savre donc complexe. Il
convient de noter que les rsultats sont influencs par le choix de lquation servant de base la transformation. Les rsultats sont diffrents si la transformation
affecte y1t la place de y2t , cest pourquoi le choix2 de lordre des variables
modifie les rsultats obtenus.

Graphique 1 Fonctions de rponses impulsionnelles


1. Cf. Hamilton J. D. page 318, 1994.
2. Les logiciels dconomtrie offrent la possibilit de choisir lordre des variables et permettent
ainsi de simuler les diffrents cas de figure.

La modlisation VAR  287

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 288

C. Dcomposition de la variance
La dcomposition de la variance de lerreur de prvision a pour objectif de calculer pour chacune des innovations sa contribution la variance de lerreur. Par
un technique mathmatique1, on peut crire la variance de lerreur de prvision
un horizon h en fonction de la variance de lerreur attribue chacune des
variables ; il suffit ensuite de rapporter chacune de ces variances la variance
totale pour obtenir son poids relatif en pourcentage.
Reprenons notre modle VAR(1) deux variables y1t et y2t , la variance de
lerreur de prvision pour y1t+h peut scrire :



y21 (h) = 21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)


+22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)

o les m ii sont les termes de la matrice M de la section III.A.


lhorizon h, la dcomposition de la variance, en pourcentage, des propres
innovations de y1t sur y1t , est donne par :


21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)
y21 (h)

Et la dcomposition de la variance, en pourcentage, des innovations de y1t sur


y2t , est donne par :



22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
y21 (h)

Linterprtation des rsultats est importante :


si un choc sur 1t naffecte pas la variance de lerreur de y2t quel que soit
lhorizon de prvision, alors y2t peut tre considr comme exogne car y2t
volue indpendamment de 1t ;
a contrario, si un choc sur 1t affecte fortement voire totalement la
variance de lerreur de y2t , alors y2t est considr comme endogne.
Dans la pratique, les rsultats ne sont pas aussi marqus mais indiquent la
contribution de chacune des variables la variance de lerreur.

D. Choix de lordre de dcomposition


Il est noter que le problme de la corrlation contemporaine des erreurs, et
donc de limpact dun choc sur une variable, implique un choix de dcomposi

1. La matrice
tant toujours dfinie positive, la dcomposition de Cholesky permet de diagonaliser la matrice des variances covariances de lerreur de prvision, et ainsi didentifier les
variances propres chacune des variables. Nous ne pouvons pas aborder dans le cadre de ce
manuel cette technique, le lecteur peut se rfrer Hamilton J. D. (1994) pour tous les complments mathmatiques.

288  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 289

tion qui fournit des rsultats dissymtriques en fonction de lordre des variables.
Le problme est plus complexe si le nombre de variables est important.
Prenons lexemple dun VAR 4 variables Y1, Y2, Y3 et Y4.
Si nous choisissons lordre de dcomposition de Cholesky suivant : Y3 Y2
Y1 Y4, cela entrane :
un choc en priode 1 sur Y3 (la variable la plus exogne) a un impact sur
lensemble des quatre variables ;
un choc en priode 1 sur Y2 a un impact sur Y2, Y3 et Y4, absence de corrlation contemporaine avec Y3 ;
un choc en priode 1 sur Y1 a un impact sur Y1 et Y4, absence de corrlation contemporaine avec Y3 et Y2 ;
et, enfin, un choc en priode 1 sur Y4 (la moins exogne) na un impact que
sur elle-mme, absence de corrlation contemporaine avec Y3, Y2 et Y1.
Le tableau 3 illustre cet exemple de dcomposition et danalyse des chocs.
Nous ne prsentons que les deux premires priodes.
Tableau 3 Exemple de dcomposition Y3, Y2, Y1, Y4
Cholesky Ordering : Y3 Y2 Y1 Y4
Response of Y1 :
Period

Y1

Y2

Y3

Y4

1.603662

1.022459

1.402923

0.000000

0.395786

0.151091

0.488095

0.275476

Response of Y2 :
Period

Y1

Y2

Y3

Y4

0.000000

5.434671

4.125310

0.000000

0.875767

1.251545

0.115017

0.105811

Response of Y3 :
Period

Y1

Y2

Y3

Y4

0.000000

0.000000

4.544690

0.000000

0.241257

0.954324

1.584595

0.476602

Response of Y4 :
Period

Y1

Y2

Y3

Y4

0.768803

1.686351

2.315711

2.091513

0.129818

1.104756

0.927459

0.186928

Lordre de dcomposition seffectue donc de la variable suppose tre la plus


exogne vers la variable la moins exogne. Dans le doute, il convient deffectuer plusieurs combinaisons diffrentes dordre de dcomposition et danalyser
la robustesse des rsultats.

La modlisation VAR  289

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 290

Exercice n 3

fichier C10EX2

Analyse dune fonction de rponse impulsionnelle et dcomposition


de la variance
partir de la reprsentation VAR(1) estime lexercice 2, on demande de calculer
et dinterprter les fonctions de rponses impulsionnelles et la dcomposition de la
variance des erreurs.
Solution
Les rsultats sont issus de Eviews 3 (RATS possde une procdure
IMPULSE.PRG permettant elle aussi de calculer tous ces lments).
Nous considrons quune innovation sur y1,t ninfluence pas de manire instantane
y2,t , en revanche une innovation sur y2,t a une influence contemporaine sur y1,t (un choc
sur la variable prix influence la demande mais pas rciproquement).
La matrice des variances covariances des rsidus est gale (cf. exercice 2)



1 500,002 674,3398
.
e =
674,3398 1 200,074
Calcul des chocs initiaux
Lordre de dcomposition des variables est le suivant Y2 Y1. Lanalyse des chocs doit
donc seffectuer sur les deux quations suivantes dont les rsidus sont orthogonaliss
(cf. III. B.) :
y1,t dpend de v1,t = (e1,t k/22 e2,t )
y2,t dpend de v2,t = e2,t
Var(v1,t ) = Var(e1,t Cov(e1,t ,e2,t )/22 e2,t )
Var(v1,t ) = Var(e1t )

2Cov(e1t ,e2t )
[Cov(e1t ,e2t )]2
Var(e2t )
Cov(e1t ,e2t ) +
Var(e2t )
[Var(e2t )]2

Var(v1,t ) = Var(e1t )

2[Cov(e1t ,e2t )]2


[Cov(e1t ,e2t )]2
+
Var(e2t )
[Var(e2t )]

Var(v1,t ) = Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t )


Lamplitude du choc sur y1,t est gale une fois lcart type orthogonalis de v1,t soit


Var(e1t ) Cov(e1t ,e2t )2 /Var(e2t ) = 1 500,002 674,33982 /1 200,074 = 33,48 .
Ce choc na pas deffet instantan sur y2,t .
Lamplitude du choc sur y2,t est gale une fois lcart type orthogonalis :
Or, Var(v2,t ) = Var(e2,t ) = 1 200,074 , le choc sur y2,t est donc gal 34,62.
Ce choc se rpercute instantanment sur y1,t , il est donc gal, aprs orthogonalisation, 34,62 Cov(e1 ,e2 )/Var(e2,t ) soit 34,62 674,3398/1 200,074 = 19,4659.
Une fois les chocs initiaux calculs, nous calculons les fonctions de rponse impulsionnelle comme prcdemment, les chocs se rpercutent ensuite sur les deux processus
en samortissant, signe de la stationnarit du processus VAR.

290  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 291

Fonctions de rponse impulsionnelle un cart type orthogonalis (Eviews 3)


Rponse de Y1 :

Rponse de Y2 :

un choc sur Y1 un choc sur Y2 Priode

Priode
1
2
3
4
5
6
7
8
9
10

33,48254
0,226363
3,596584
1,124479
0,723007
0,339717
0,180128
0,090912
0,046797
0,023898

19,46591
21,35271
8,585080
4,876681
2,396789
1,247217
0,634172
0,325462
0,166407
0,085211

un choc sur Y1 un choc sur Y2

1
2
3
4
5
6
7
8
9
10

0,000000
5,868694
1,795947
1,167853
0,546587
0,290298
0,146419
0,075390
0,038496
0,019723

34,64208
13,77894
7,866119
3,858783
2,009549
1,021480
0,524297
0,268057
0,137265
0,070245

Ordre : Y2 Y1 (Y2 est la cause de Y1)

Le graphique 2 prsente ces fonctions de rponse impulsionnelles.


Response of Y1 to One S.D. Innnovations
40

Response of Y2 to One S.D. Innnovations


40

30

30

20
10

20

10

10
0

20
30
1

5
Y1

10
1
10

Y2

5
Y1

10

Y2

Graphique 2 Fonctions de rponses impulsionnelles


Dcomposition de la variance (Eviews 3)
Dcomposition de la variance de Y1 :
Priode
SE
Y1
Y2
1
38,72986 74,73859 25,26141
2
3
4
5
6
7
8
9
10

44,22659
45,19547
45,47172
45,54058
45,55892
45,56369
45,56494
45,56527
45,56536

Dcomposition de la variance de Y2 :
Priode
SE
Y1
Y2
1
34,64208 0,000000 100,0000

57,31782 42,68218
2
37,74089
55,51993 44,48007
3
38,59373
54,90856 45,09144
4
38,80374
54,76783 45,23217
5
38,85958
54,72930 45,27070
6
38,87409
54,71940 45,28060
7
38,87790
54,71679 45,28321
8
38,87889
54,71611 45,28389
9
38,87916
54,71593 45,28407
10
38,87922
Ordre : Y2 Y1 (Y2 est la cause de Y1)

2,418013
2,528876
2,592156
2,604496
2,608129
2,609036
2,609278
2,609341
2,609358

97,58199
97,47112
97,40784
97,39550
97,39187
97,39096
97,39072
97,39066
97,39064

La modlisation VAR  291

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 292

La dcomposition de la variance indique que la variance de lerreur de prvision de


y1,t est due 55 % ses propres innovations et 45 % celles de y2,t . La variance de
lerreur de prvision de y2,t est due 2,6 % y1,t et 97,4 % y2,t . Cette dissymtrie
deffet va tre tudie par lanalyse de la causalit.
Enfin, nous remarquons que ce tableau nous indique les carts types de lerreur de prvision pour y1,t et y2,t que nous avions calculs de manire fastidieuse lors de lexercice 2.

IV. La causalit
Au niveau thorique, la mise en vidence de relations causales entre les
variables conomiques fournit des lments de rflexion propices une meilleure comprhension des phnomnes conomiques. De manire pratique, the
causal knowledge est ncessaire une formulation correcte de la politique
conomique. En effet, connatre le sens de la causalit est aussi important que
de mettre en vidence une liaison entre des variable conomiques.

A. Causalit au sens de Granger


Granger (1969) a propos les concepts de causalit et dexognit : la variable
y2t est la cause de y1t , si la prdictibilit1 de y1t est amliore lorsque linformation relative y2t est incorpore dans lanalyse. Soit le modle VAR( p) pour
lequel les variables y1t et y2t sont stationnaires :

y1t
y2t

  1
a0
a
=
+ 12
b0
a1

b11
b12



  1
y1t1
a
+ 22
y2t1
a2

b21
b22




y1t2
+ ...
y2t2
 1

  
a b1p
y1t p

+ p2
+ 1t
a p b2p
y2t p
2t

Le bloc de variables (y2t1 ,y2t2 ,. . . ,y2t p ) est considr comme exogne par
rapport au bloc de variables (y1t1 ,y1t2 ,. . . ,y1t p ) si le fait de rajouter le bloc y2t
namliore pas significativement la dtermination des variables y1t . Ceci consiste effectuer un test de restrictions sur les coefficients des variables y2t de la
reprsentation VAR (not RVAR = Restricted VAR). La dtermination du retard
p est effectue par les critres AIC ou SC (cf. II.B). Soit :
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
y1t ne cause pas y2t si lhypothse suivante est accepte H0 :
a12 = a22 = . . . = a p2 = 0 .
Si nous somme amens accepter les deux hypothses que y1t cause y2t et
que y2t cause y1t , on parle de boucle rtroactive feedback effect .
1. Le terme de prdictibilit semble prfrable au terme de causalit ; en effet, dire que yt cause
xt , signifie seulement quil est prfrable de prdire xt en connaissant yt que sans le connatre.

292  CONOMTRIE

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 293

Ces tests peuvent tre conduits laide dun test de Fisher classique (cf. chapitre 3, test de Wald) de nullit des coefficients, quation par quation ou bien
directement par comparaison entre un modle VAR non contraint (UVAR) et le
modle VAR contraint (RVAR). On calcule le ratio de vraisemblance suivant :




L = (n c) Ln| RVAR | Ln| UVAR | qui suit un 2 2 p degrs de
libert avec :

RVAR = matrice des variances covariances des rsidus du modle contraint,

UVAR = matrice des variances covariances des rsidus du modle non contraint,
n = nombre dobservations,
c = nombre de paramtres estims dans chaque quation du modle non
contraint.
Si L > 2 lu dans la table, alors on rejette lhypothse de validit de la
contrainte.

B. Causalit au sens de Sims


Sims (1980) prsente une spcification de test lgrement diffrente, en considrant que si les valeurs futures de y1t permettent dexpliquer les valeurs prsentes de y2t , alors y2t est la cause de y1t .
Ceci se traduit par la reprsentation suivante :
y1t = a10 +

p


a1i1 y1ti +

i=1

y2t = a20 +

p


p


a1i2 y2ti +

i=1

a2i1 y1ti +

i=1

p


p


bi2 y2t+i + 1t

i=1

a2i2 y2ti +

i=1

p


bi1 y1t+i + 2t

i=1

y1t ne cause pas y2t si lhypothse suivante est accepte H0 :


b12 = b22 = . . . = b2p = 0 .
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
Il sagit l encore dun test de Fisher classique de nullit de coefficients.

Exercice n 4

fichier C10EX2

Tests de causalit de Granger et de Sims


On demande, partir de la reprsentation VAR(1) estime lors de lexercice 2, de
procder aux tests de Granger et de Sims.

La modlisation VAR  293

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 294

Solution
Nous procdons au test de Fisher quation par quation.
Test de Granger
H0 : y2t ne cause pas y1t
Nous estimons les modles suivants :
y1t = 0,006760 y1t1 0,6125 y2t1 + 17,129632 + e1t
R 2 = 0,28 ; n = 71 ; SC RU = 106500,2 (non contraint)
y1t = 0,2359 y1t1 + 26,9448 + e1t
R 2 = 0,067 ; n = 71 ; SC R R = 13792,6 (contraint)
F =

(SC R R SC RU )/c
137924,6 106500,2)/1
=
= 20,064
SC RU/(n k 1)
106500,2/(71 2 1)

c = nombre de restrictions (nombre de coefficients dont on teste la nullit).


0.05
F > F1;68
4 , on rejette lhypothse H0, y2t explique significativement la variable
y1t , il y a donc causalit au sens de Granger de y2t vers y1t .

Ou bien :



L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,44 14,11) = 23,29
> 2 (2) = 5,99 , on rejette lhypothse de validit de la contrainte.
H0 : y1t ne cause pas y2t

y2t = 0,17527 y1t1 + 0,29926096 y2t1 12,862837 + e2t


R 2 = 0,21 ; n = 71 ; SC RU = 85205,25 (non contraint)
y2t = 0,4075 y2t1 15,391 + e2t
R 2 = 0,168 ; n = 71 ; SC R R = 89452,77 (contraint)
F =

(SC R R SC RU )/c
(89452,77 85205,25)/1
=
= 3,389
SC RU/(n k 1)
85205,22/(71 2 1)

0.05
4 , on accepte lhypothse H0, y1t nexplique pas significativement la
F < F1;68
variable y2t , il ny a donc pas causalit au sens de Granger de y1t vers y2t .

Ou bien :


L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,17 14,11) = 4,52
< 2 (2) = 5,99 , on accepte lhypothse de validit de la contrainte.
Ce rsultat ne doit pas nous surprendre puisque y1t est la variable reprsentative de la
demande et y2t du prix.
Test de Sims
H0 : y1t ne cause pas y2t
Nous estimons les modles suivants (sur la mme priode de 78:2 95:3) :
y1t = 0,01435 y1t1 0,579 y2t1 0,357 y2t+1 + 8,713 + e1t
R 2 = 0,37 ; n = 70 ; SC RU = 92676,66 (non contraint)
y1t = 0,007654 y1t1 0,6145 y2t1 + 16,714 + e1t
R 2 = 0,28 ; n = 70 ; SC R R = 105952,6 (contraint)

294  CONOMTRIE

9782100721511-Bourbo-C10.qxd

F =

22/10/14

10:25

Page 295

(105952,6 92676,66)/1
= 9,45
92676,66/(70 3 1)

0.05
F > F1;66
4 , on rejette lhypothse H0, y2t+1 explique significativement la
variable y1t , il y a donc causalit au sens de Sims de y1t vers y2t .

H0 : y2t ne cause pas y1t


y2t = 0,0967 y1t1 + 0,2259 y2t1 0,390 y1t+1 3,328 + e2t
R 2 = 0,40 ; n = 70 ; SC RU = 63742,31 (non contraint)
y2t = 0,174 y1t1 + 0,297 y2t1 13,30 + e2t
R 2 = 0,21 ; n = 71 ; SC R R = 84586,73 (contraint)
F =

(84586,73 63742,31)/1
= 21,58
84586,73/(70 3 1)

0.05
F > F1;66
4 , on refuse lhypothse H0, y1t+1 explique significativement la
variable y2t , il y a donc causalit au sens de Sims de y2t vers y1t .

Nous observons une divergence dans ces tests, en ce qui concerne la causalit de y1t
sur y2t ; le test de Granger nous fait rejeter lhypothse de causalit et celui de Sims laisse prsager dun lien de causalit de type feedback : les prix de la priode suivante
influencent la demande de la priode actuelle, sagit-il dune anticipation des agents ?

La modlisation VAR  295

9782100721511-Bourbo-C10.qxd

22/10/14

10:25

Page 296

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 297

11. La cointgration

et le modle
correction derreur

analyse de la cointgration, prsente par Granger (1983) et Engle


et Granger (1987), est considre par beaucoup dconomistes
comme un des concepts nouveaux les plus importants dans le
domaine de lconomtrie et de lanalyse de sries temporelles. Dans ce
chapitre, nous abordons en section I. des exemples permettant une introduction au problme de la cointgration. La section II. est consacre la
prsentation de la cointgration en termes de dfinition et de spcification. Les tests de cointgration ainsi que les mthodologies destimation
sont ensuite dvelopps dans le cas deux variables (section III.) et enfin
(section IV) dans les cas k variables.

I. Exemples introductifs
Premier exemple
Soit les variables yt et xt dfinies de la manire suivante :
y1 = 1 avec comme variable explicative : x1 = 1
y2 = 2 avec comme variable explicative : x2 = 22

yn = n avec comme variable explicative : xn = n 2

La tendance de yt est de type linaire et celle de xt est quadratique.


Le rsultat de la rgression de yt sur xt (n = 30) conduit lestimation suivante :
yt = 5,92 + 0,03xt
(8,5) (19,8)
2
R = 0,94 DW = 0,057

La cointgration et le modle correction derreur  297

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 298

Les coefficients de rgression sont significatifs, la valeur du R 2 est leve,


cependant il apparat vident que ce modle a un pouvoir prdictif trs mauvais.
En effet, sur le plan statistique, la statistique de Durbin et Watson (proche de 0)
prsage dune autocorrlation forte des erreurs1.
Ce premier exemple illustre le danger dinterprter et dutiliser une rgression entre deux variables affectes de tendances dterministes de degr diffrent.
Le graphique 1 prsente la srie brute (tendance linaire) et la srie ajuste par
une tendance quadratique.

Graphique 1 Rgression dune tendance linaire


sur une tendance quadratique

Deuxime exemple
On gnre deux processus alatoires :


yt = yt1 + 1t avec t N 0; 21


xt = xt1 + 2t avec t N 0; 22
Sur 1 000 rgressions, nous obtenons les rsultats suivants : 670 sont significatives daprs la statistique du t de Student, cependant la statistique de DW
est toujours faible (la moyenne sur les 1 000 rgressions est : DW = 0,33 ).
Donc apparemment, ces rgressions donnent de bons rsultats (hormis la statistique DW ). Mais ces rsultats sont purement fortuits : ils dcoulent de la corrlation entre les sries qui sont affectes dune tendance stochastique. En effet, si
on passe en diffrences premires (yt = f (xt ) ), plus aucune rgression nest
significative.
yt = yt yt1 = 1t

xt = xt xt1 = 2t
1. Cela souligne limportance ne pas oublier dinterprter la statistique de Durbin et Watson.

298  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 299

En rgressant une srie non stationnaire (de type DS) sur une autre srie du
mme type, on obtient des coefficients significatifs mais avec une statistique
DW proche de 0 . Ce deuxime exemple illustre le risque de rgresser entre elles
deux sries affectes dune tendance stochastique. Il faut donc toujours, au pralable, stationnariser des sries non stationnaires ; dans le cas contraire, il existe
un risque de rgression fallacieuse ( spurious regression ).

II. Le concept de cointgration


Lanalyse de la cointgration permet didentifier clairement la relation vritable
entre deux variables en recherchant lexistence dun vecteur de cointgration et
en liminant son effet, le cas chant.

A. Proprits de lordre dintgration dune srie


Une srie est intgre dordre d (note xt I (d) ), sil convient de la diffrencier d fois afin de la stationnariser1.
Soit une srie x1t stationnaire et une srie x2t intgre dordre 1 :
x1t I (0)
x1t + x2t I (1)
x2t I (1)

La srie yt = x1t + x2t est non stationnaire puisque lon somme une srie
affecte dune tendance et une srie stationnaire.
Soit deux sries x1t et x2t intgres dordre d :
x1t I (d)
x1t + x2t I (?)
x2t I (d)

La combinaison linaire x1t + x2t I (?) .


En effet, le rsultat dpend des signes des coefficients , et de lexistence
dune dynamique non stationnaire commune.
Examinons un autre cas de figure :
x1t I (d)
x1t + x2t I (?)
x2t I (d  ) d  = d

Il savre impossible de conclure car on somme deux sries dordre dintgration diffrent.

1. Cf. le test de Dickey-Fuller du chapitre 9 afin de dterminer lexistence dune tendance stochastique ou dterministe et de rechercher les ordres dintgration dune srie.

La cointgration et le modle correction derreur  299

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 300

Soit deux sries affectes dune tendance :


dans un premier cas, les deux sries ont une tendance dvolution constante sur une premire priode et puis une tendance dvolution divergente en
une deuxime priode, les sries ne sont pas cointgres (cf. graphique 2) ;
dans un deuxime cas, les deux sries ont une volution constante sur toute
la priode, les sries sont cointgres (cf. graphique 3), il existe une volution de long terme constante entre les chroniques.

Graphique 2 Les variables xt et z t ne sont pas cointgres

Graphique 3 Les variables xt et yt sont cointgres

300  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 301

B. Conditions de cointgration
Deux sries xt et yt sont dites cointgres si les deux conditions sont vrifies :
elles sont affectes dune tendance stochastique de mme ordre dintgration d ,
une combinaison linaire de ces sries permet de se ramener une srie
dordre dintgration infrieur.
Soit :

xt I (d)
yt I (d)

tel que 1 xt + 2 yt I (d b),


avec d  b > 0.
On note : xt , yt C I (d, b)
o [1 2 ] est le vecteur de cointgration.
Dans le cas gnral k variables, on a :
x1, t I (d)
x2, t I (d)
...
xk, t I (d)

on note X t = [x1, t x2, t . . . xk, t ]

sil existe un vecteur de cointgration = [1 2 . . . k ] de dimension (k, 1) tel


que X t I (d b) , alors les k variables sont cointgres et le vecteur de cointgration est . On note que X t C I (d, b) avec b > 0 .

C. Le modle correction derreur (ECM)


Examinons le cas particulier suivant : xt , yt C I (1, 1) et [, 1] (on normalise en posant =

1
soit xt yt I (0) ) est le vecteur de cointgration.
2

Dans ce type de spcification, le fait que les sries soient cointgres et non stationnaires soulve un problme destimation. La bonne qualit statistique du
modle ( R 2 lev et coefficients significatifs) est due au fait que les sries sont
non stationnaires (puisque cointgres). En rgression directe de yt sur xt
lorsque yt , xt C I (1, 1) lutilisation de ce modle des fins prvisionnelles
savre dsastreuse ; en effet, la relation mise en vidence par cette rgression
nest pas relle, elle dcoule simplement dune relation entre deux tendances1.
Le problme est donc, dune part de retirer la relation commune de cointgration (la tendance commune), dautre part, de rechercher la liaison relle entre

1. Cf. les exemples introductifs sur les problmes de rgressions fallacieuses.

La cointgration et le modle correction derreur  301

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 302

les variables : cest lobjectif du Modle Correction dErreur (ECM1). Cette


reprsentation est la fois un modle statique (1  xt ) et un modle dynamique
(2 (yt1 xt1 )) .
Nous pouvons spcifier la relation : yt = 1  xt + 2 (yt1 xt1 )
I(0)
I(0)
I(0)
Autour de la relation de long terme, le modle correction derreur permet
dintgrer les fluctuations de court terme. Le coefficient 2 qui doit tre ngatif rend compte dune force de rappel vers lquilibre de long terme.
Le graphique 4 illustre la relation de long terme entre xt et yt (yt xt = 0),
cette ligne reprsente lquilibre de long terme du systme ; la zone dvolution
du systme en dehors de lquilibre (dynamique de court terme) est dfinie par
lerreur constate entre yt1 et xt1 .

Graphique 4 Reprsentation du modle correction derreur

III. Cointgration entre deux variables


Le traitement de sries chronologiques longues impose de tester une ventuelle
cointgration entre les variables. En effet, le risque destimer des relations
fallacieuses et dinterprter les rsultats de manire errone est trs lev.
Nous allons tout dabord examiner le cas deux variables : test de cointgration
et estimation du modle correction derreur.
1. Nous utilisons labrviation anglo-saxonne Error Correction Model .

302  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 303

A. Test de cointgration entre deux variables


Nous reprenons ici lalgorithme en deux tapes de Engle et Granger.
tape 1 : tester lordre dintgration des variables
Une condition ncessaire de cointgration est que les sries doivent tre intgres de mme ordre. Si les sries ne sont pas intgres de mme ordre, elles ne
peuvent pas tre cointgres.
Il convient donc (cf. tests de Dickey-Fuller et Dickey-Fuller Augment) de
dterminer trs soigneusement le type de tendance dterministe ou stochastique
de chacune des variables, puis lordre dintgration d des chroniques tudies.
Si les sries statistiques tudies ne sont pas intgres de mme ordre, la procdure est arrte, il ny a pas de risque de cointgration.
Soit :
xt I (d) et yt I (d)
tape 2 : estimation de la relation de long terme
Si la condition ncessaire est vrifie, on estime par les MCO la relation de
long terme entre les variables : yt = a1 xt + a0 + t .
Pour que la relation de cointgration soit accepte, le rsidu et issu de cette
a1 x t 
a0 .
rgression doit tre stationnaire : et = yt 
La stationnarit du rsidu est teste laide des tests DF ou DFA (cf. chapitre 9).
Dans ce cas, nous ne pouvons plus utiliser les tables de Dickey et Fuller. En
effet, le test porte sur les rsidus estims partir de la relation statique et non
pas sur les vrais rsidus de la relation de cointgration. MacKinnon (1991)
a donc simul des tables qui dpendent du nombre dobservations et du nombre
de variables explicatives figurant dans la relation statistique.
Si le rsidu est stationnaire nous pouvons alors estimer le modle correction derreur.

B. Estimation du modle correction derreur


Lorsque des sries sont non stationnaires et cointgres, il convient destimer
leurs relations au travers dun modle correction derreur (ECM, Error
Correction Model ). Engle et Granger (1987) ont dmontr que toutes les
sries cointgres peuvent tre reprsentes par un ECM (thorme de la reprsentation de Granger).
Nous allons prsenter la mthode la plus rpandue destimation dun ECM.
Nous nous bornons, ici, au cas dune seule variable explicative. La gnralisation k variables est aborde la section suivante.

La cointgration et le modle correction derreur  303

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 304

Soit les sries yt et xt I (1) , lestimation par les MCO de la relation de long
terme indique une stationnarit du rsidu. Les sries yt et xt sont donc notes :
CI(1, 1).
Nous pouvons, ds lors, estimer le modle correction derreur.

Estimation du modle correction derreur (ECM) en deux tapes


tape 1 : estimation par les MCO de la relation de long terme :
 xt + et
yt = 
+

(ECM)

[1]

tape 2 : estimation par les MCO de la relation du modle dynamique


(court terme) :
yt = 1 xt + 2 et1 + u t
2 < 0
[2]
Le coefficient 2 (force de rappel vers lquilibre) doit tre significativement
ngatif ; dans le cas contraire, il convient de rejeter une spcification de type
ECM. En effet, le mcanisme de correction derreur (rattrapage qui permet de
tendre vers la relation de long terme) irait alors en sens contraire et sloignerait
de la cible de long terme. La procdure en deux tapes conduit une estimation
convergente des coefficients du modle et les carts types des coefficients peuvent sinterprter de manire classique1.
Lestimation dun modle correction derreur ne pose donc pas de problme particulier et ncessite simplement le recours une technique de moindres
carres ordinaires.
En cas de variables explicatives supplmentaires dont lhypothse de cointgration ne peut pas tre retenue (comme des variables indicatrices par exemple),
la procdure destimation est la mme sauf pour lestimation du modle [1]
(quation de long terme) dans lequel figurent ces variables explicatives.

Exercice n 1

fichier C11EX1

Test de cointgration et estimation dun modle correction


derreur
Soit deux sries statistiques yt et xt dont les observations sont prsentes au
tableau 1. On demande destimer la relation entre ces deux variables
a0 + 
a1 xt + et ) en testant une ventuelle cointgration (dans ce cas estimer le
(yt = 
modle correction derreur).
1. Engle et Granger, 1987.

304  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 305

Tableau 1 Valeurs observes de xt et yt (extrait des donnes)


Obs

xt

1
2

29
30

0,000
2,851

6,744
7,270

yt
10,890
12,188

12,347
15,194

Solution
La premire tape consiste tudier les proprits des deux sries en termes de stationnarit. Le tableau 2 prsente les rsultats des tests :
de Dickey-Fuller (aucun retard nest significatif dans lventualit dun test de
Dickey-Fuller Augment),
de Phillips-Perron (troncature = 2),
et de KPSS (troncature = 2).
Ces tests sont prsents au chapitre 9.
Tableau 2 Rsultats des tests de Dickey-Fuller, Phillips-Perron et KPSS
Test

Type de Modle

xt en niveau t statistique

yt en niveau t statistique

Test DF
Test DF
Test DF

[1]
[2]
[3]

0,81
0,05
0,82

0,17
2,67
3,05

Test PP
Test PP
Test PP

[1]
[2]
[3]

0,88
0,11
0,80

0,62
2,60
2,96

xt en niveau
LM statistique

yt en niveau
LM statistique

0,53
0,22

0,39
0,20

Test KPSS
Test KPSS

[2]
[3]

La comparaison des t1 calculs aux t lus (Tables de MacKinnon) ou des LM statistiques aux valeurs critiques indique que les deux sries xt et yt sont non stationnaires en
niveau1. Des tests similaires sur les diffrentes premires de xt et yt indiquent quelles
sont stationnaires, les deux sries tudies sont I (1), il existe donc un risque de cointgration.
Le test de cointgration est effectu partir du rsidu destimation du modle :
yt = a1 xt + a0 + t
Soit : yt = 0,55xt + 10,38 + et
(6,3)
n = 30 ;

(41,46)
R 2 = 0,58 ;

(.) = t de Student.

1. Nous rejetons lhypothse dune tendance dterministe.

La cointgration et le modle correction derreur  305

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 306

Nous pouvons vrifier que le rsidu est bien stationnaire, il existe donc un risque de
cointgration entre les deux variables.
Test PP (l = 2)

Test DF
et

Modle [1]

Modle [2]

Modle [1]

Modle [2]

t1

5,39

5,30

5,42

5,31

Nous procdons donc maintenant lestimation du modle correction derreur.


Nous calculons, dabord, le rsidu (provenant du modle prcdent) dcal dune
priode, soit : et1 = yt1 0,55xt1 10,38
Puis nous estimons (par les MCO) le modle :
yt = 1 xt + 2 et1 + u t
yt = 0,610 xt 1,02 et1 + 
ut
(3,09)
(5,22)
n = 29 ;

R 2 = 0,60 ;

(.) = t de Student.

Le coefficient (terme de rappel) de et1 est bien significativement ngatif, la reprsentation correction derreur est valide.

IV. Gnralisation k variables


La littrature conomique rcente concernant la thorie de lquilibre dmontre
quune srie macro-conomique stationnaire peut tre le rsultat dune combinaison de variables non stationnaires, do limportance actuelle de lanalyse de
la cointgration k variables. La gnralisation de deux k variables savre
assez complexe du fait du nombre de possibilits de vecteurs de cointgration
possibles.

A. La cointgration entre k variables


Dans un modle conomtrique k variables explicatives :
yt = 0 + 1 x1t + 2 x2t + . . . + k xkt + t

si les variables ( yt et xkt ) sont non stationnaires, I (1) par exemple, il existe alors
un risque de cointgration. En effet, lexistence dune ventuelle cointgration
implique que les variables doivent tre non stationnaires1. Comme dans le cas
1. Gnralement, en conomie, les variables sont I (1) ; cependant certaines sries financires
peuvent tre de type I (2) .

306  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 307

deux variables, si une combinaison linaire de ces variables est stationnaire,


elles sont alors cointgres. Lestimation par les MCO du modle permet de calculer le rsidu :
0
1 x1t . . .
k xkt
et = yt

Si ce rsidu est stationnaire, nous acceptons lhypothse dune cointgration


entre les variables. Les tests de Dickey-Fuller de stationnarit sur le rsidu doivent seffectuer partir des valeurs critiques tabules par MacKinnon (1991) en
fonction du nombre de variables total du modle. Le vecteur de cointgration est
donn par : [1, 0 , 1 , . . . , k ] .
Cependant, le cas multivari est plus complexe que le cas deux variables du
fait des possibilits combinatoires de cointgration. En effet si, par exemple, les
variables yt , x1t , x2t et x3t sont cointgres par paires yt , x1t C I (1, 1) et x2t ,
x3 C I (1,1) , leur combinaison linaire est I (0).
Nous avons : et1 = yt 
0 
1 x1t et et2 = x2t 
0 
1 x3t et par consquent :
et = et1 + et2 = yt 
0 
1 x1t + x2t 
0 
1 x3t I (0)

Nous obtenons, dans ce cas de figure, un autre vecteur de cointgration pos0 


0 , 
1 , 1, 
1 ]. Dune manire gnrale, dans un modle une
sible : [1, 
variable expliquer et k variables explicatives (soit k + 1 variables au total), il
peut exister k vecteurs de cointgration linairement indpendants. Le nombre
de vecteurs de cointgration linairement indpendants est appel le rang de la
cointgration.
Si les variables sont de mme ordre dintgration I (1) par exemple
lexistence dun seul vecteur de cointgration est possible ; en revanche, si les
sries ne sont pas toutes intgres du mme ordre, nous pouvons tre certains
que le vecteur de cointgration nest pas unique.
De manire pratique, pour tester une ventuelle cointgration entre plusieurs
variables, il convient tout dabord de la tester sur lensemble des k + 1 variables,
puis en cas de cointgration de la tester par combinatoire entre les variables.

B. Estimation du modle correction derreur


La cointgration ayant t rvle par les tests prcdents, deux cas de figure
sont envisager :
il existe un vecteur unique de cointgration,
plusieurs vecteurs de cointgration existent.
Si le vecteur de cointgration est unique, nous pouvons employer les
mthodes destimation envisages la section prcdente, par exemple, celle en
deux tapes de Engle et Granger.

La cointgration et le modle correction derreur  307

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 308

tape 1 : estimation par les MCO de la relation de long terme et calcul du


rsidu :
0
1 x1t . . .
k xkt
et = yt

tape 2 : estimation par les MCO de la relation du modle dynamique


(court terme) :
yt = 1  x1t + 2  x2t + . . . + k  xkt + 1 et1 + u t

Le coefficient 1 (force de rappel vers lquilibre) doit tre, comme dans le


cas une variable explicative, significativement ngatif.
Cependant, le plus souvent, le vecteur de cointgration nest pas unique et la
mthode de Engle-Granger nest plus valide. En effet, les estimateurs des MCO
ne sont plus consistants quels que soient les vecteurs de cointgration. Nous
devons, dans ce cas, faire appel la reprsentation vectorielle correction derreur (VECM, Vector Error Correction Model ).

C. Le modle correction derreur vectoriel


Examinons au pralable le cas dun processus VAR(2) k variables sous forme
matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 +

avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables ( y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).

Ce modle peut scrire en diffrence premire :


Yt Yt1 = A0 + A1 Yt1 Yt1 + A2 Yt2 +
Yt = A0 + (A1 I )Yt1 + A2 Yt2 +

[3]

Afin de faire apparatre des diffrences premires droite de lquation, nous


ajoutons et soustrayons A1 Yt2 Yt2 de la manire suivante
Yt = A0 + (A1 I )Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 +
Yt = A0 + A1 Yt1 Yt1 + A1 Yt2 Yt2 A1 Yt2 + Yt2 + A2 Yt2 +

[4]

Or Yt1 = Yt1 Yt2 .


En regroupant les termes en Yt1 et aprs simplification, on obtient :
Yt = A0 + (A1 I )Yt1 + (A1 + A2 I )Yt2 +

308  CONOMTRIE

[5]

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 309

Cependant, afin de faire figurer les relations de cointgration qui relient


entre elles les variables en niveau dcales dune priode nous cherchons
crire lquation [4] en fonction de Yt1 , soit dans lquation [3] nous pouvons
ajouter et soustraire A2 Yt1 et aprs simplification nous obtenons :
Yt = A0 A2 Yt1 + (A1 + A2 I )Yt1 +

[6]

Yt = A0 + B1 Yt1 + Yt1 +

[7]

Ou encore :
avec : A2 = B1 et = (A1 + A2 I ).
Ce rsultat peut tre gnralis une reprsentation VAR(p) k variables
sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p +

avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables (y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).

Ce modle peut scrire en diffrences premires de deux manires :


Yt = A0 + (A1 I )Yt1 + (A2 + A1 I )Yt2 + . . . +
(A p1 + . . . + A2 + A1 I )Yt p+1 + Yt p +

ou encore en fonction de Yt1 :


Yt = A0 + B1 Yt1 + B2 Yt2 + . . . + Bp1 Yt p+1 + Yt1 +


p
Ai I .
Les matrices Bi tant des fonctions des matrices Ai et =
i=1

La matrice peut scrire sous la forme =  o le vecteur est la force


de rappel vers lquilibre et le vecteur dont les lments sont les coefficients
des relations de long terme des variables. Chaque combinaison linaire reprsente donc une relation de cointgration.
Si tous les lments de sont nuls (le rang de la matrice est gal 0 et donc
A p1 + + A2 + A1 = I ) , alors nous ne pouvons pas retenir une spcification
correction derreur, nous estimons un VAR classique en diffrences premires
afin dliminer les tendances. Si le rang de est gal k , cela implique alors que
les variables sont toutes I (0) et le problme de la cointgration ne se pose donc
pas, il convient destimer un modle VAR en niveau.
Si le rang de la matrice (not r) est compris entre 1 et k 1
(1  r  k 1) , alors il existe r relations de cointgration et la reprsentation
ECM est valide soit :
Yt = A0 + B1 Yt1 + B2 Yt2 + . . . + Bp1 Yt p+1 + et1 +

avec et =  Yt.

La cointgration et le modle correction derreur  309

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 310

Exemple de spcification : soit un processus VAR(2) trois variables y1,t , y2,t et


y3,t et une relation de cointgration, le VECM scrit alors :
y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1 + 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
y2,t = a02 + b12 y1,t1 + b22 y2,t1 + b32 y3,t1 + 2 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t2
y3,t = a03 + b13 y1,t1 + b23 y2,t1 + b33 y3,t1 + 3 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t3

Nous avons normalis lquation de cointgration par rapport au coefficient


de y1,t .
Selon les caractristiques des donnes traites, ce processus VAR peut
connatre les variantes suivantes :
existence dune constante soit dans la relation de cointgration (0 ) soit
dans le VAR ( a0i ),
existence dune tendance (t = 1,2,. . . ,n ) dans le VAR et/ou dans la relation de cointgration,
ou encore intgrer des variables exognes de type indicatrice pour corriger
dun mouvement saisonnier.
Sur ce type de modle, nous ne pouvons pas appliquer la mthode des MCO
car nous avons des problmes didentification similaires ceux voqus lors du
chapitre 8 concernant les modles quations simultanes. Il convient demployer une mthode du maximum de vraisemblance1.

D. Tests de relation de cointgration


Pour dterminer le nombre de relations de cointgration, Johansen (1988) propose deux tests fonds sur les valeurs propres dune matrice issue dun calcul
en deux tapes :
Etape 1 : calcul de deux rsidus ut et vt
Nous effectuons deux rgressions :
Premire rgression :
0 + A
1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + u t
Yt = A

Deuxime rgression :
 + A
 Yt1 + A
 Yt2 + . . . + A
 Yt p + vt
Yt1 = A
0
1
2
p

y1,t
y2,t

Avec Yt = . . .

...
yk,t

1. Johansen, 1988.

310  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 311

Nous avons les mmes variables explicatives, seule la spcification du bloc


de la variable expliquer est modifie.
ut et vt sont donc les matrices des rsidus de dimension (k, n) avec k = nombre
de variables, n = nombre dobservations.
Etape 2 : calcul de la matrice permettant le calcul des valeurs propres
Nous calculons quatre matrices des variances-covariances de dimension
(k, k) partir des rsidus ut et vt.
uu = (1/n)


n


u t u t

t=1

vv = (1/n)


n


vt vt

t=1

uv = (1/n)


n


u t vt

t=1

vu = (1/n)


n


vt u t

t=1

Puis nous extrayons les k valeurs propres de la matrice M de dimension k, k


calcule de la manire suivante :
1   1 
vv
M=
vu uu uv

1) Test de la trace
A partir de ces valeurs propres, on calcule une statistique :
k

trace = n
Ln (1 i ) avec n = nombre dobservations, i = i me valeur
i =r +1

propre de la matrice M, k = nombre de variables, r = rang de la matrice.


Cette statistique suit une loi de probabilit (similaire un 2 ) tabule
laide de simulations par Johansen et Juselius (1990). Ce test de Johansen fonctionne par exclusion dhypothses alternatives :
rang de la matrice gal 0 (r = 0), soit H0 : r = 0 contre H1 : r > 0 ;
si H0 est refus, on passe au test suivant1 (si trace > la valeur critique lue
dans la table, on rejette H0) ;
rang de la matrice gal 1 (r = 1), soit H0 : r = 1 contre H1 : r > 1 ;
si H0 est refus, on passe au test suivant ;
rang de la matrice gal 2 (r = 2), soit H0 : r = 2 contre H1 : r > 2 ;
si H0 est refus, on passe au test suivant, etc.
Si, aprs avoir refus les diffrentes hypothses H0 la fin de la procdure,
on teste H0 : r = k 1 contre H1 : r = k et que lon soit amen refuser H0,
alors le rang de la matrice est r = k et il nexiste pas de relation de cointgration car les variables sont toutes I (0).
Les logiciels dconomtrie fournissent directement lensemble de ces informations : la statistique trace calcule entre 1 et k ainsi que les valeurs critiques associes.
1. Dans le cas contraire, la procdure est arrte, et le rang de la matrice est r = 0 .

La cointgration et le modle correction derreur  311

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 312

Pour mener ce test, Johansen propose cinq spcifications concernant soit les
vecteurs cointgrants soit les sries (le VAR proprement dit) :
Absence de tendance linaire dans les donnes (les sries sont toutes DS sans
drive) :
a) Absence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration (la constante dans la relation de long terme est non
significative).
Exemple : y1,t1 = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 ) + t1
b) Absence dune tendance linaire dans les sries mais prsence dune constante dans les relations de cointgration (la constante dans la relation de long
terme est significative).
Exemple : y1,t = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
Prsence dune tendance linaire dans les donnes (au moins une srie est un
DS avec drive) :
c) Prsence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration.
Ex. : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
d) Prsence dune tendance linaire dans les sries et dans les relations de cointgration (au moins une srie est un TS).
Ex : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Prsence dune tendance quadratique dans les donnes :
e) Prsence dune tendance quadratique dans les sries et dune tendance linaire dans les relations de cointgration.
Ex : y1,t = a01 + bt + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Le choix dune de ces spcifications seffectue en fonction des donnes et de la
forme suppose de la tendance (une analyse des proprits stochastiques des
sries ou un simple examen visuel des graphiques permettent de se dterminer).
Le tableau 3 synthtise le choix de la spcification du VECM en fonction de
la typologie des processus.

312  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 313

Tableau 3 Choix de la spcification en fonction du type de processus


Type de processus

Spcification

Tous les processus sont des DS sans drive

Au moins un des processus est un DS avec drive

Au moins un des processus est un TS

Au moins un processus a une tendance quadratique

2) Test de la valeur propre maximale


Le deuxime test propos par Johansen est donn par la statistique :
max = nLog(1 r+1 )

r = 0,1,2

Le test seffectue comme prcdemment de manire squentielle par exclusion dhypothses alternatives.
En cas de divergence des deux tests (valeur propre maximum et trace), nous
privilgions le test de la trace dont la puissance est la plus leve.

E. Test dexognit faible


Le test dexognit faible consiste vrifier si les variables sont bien endognes. Ce test porte sur le coefficient de la force de rappel (sil existe une seule
relation de cointgration) ou les coefficients dans le cas de plusieurs relations
de cointgration. Effectuer un test sur revient vrifier si la relation de cointgration figure dans toutes les quations du modle. Cest un test dexognit
faible des diffrentes variables du systme, pour les paramtres dintrt donns
par la relation de long terme de la matrice =  , cest--dire les relations
de cointgration et les poids de ces relations dans chacune des quations du
systme.
Prenons par exemple un VECM deux relations de cointgration :


y1t
y1t1
11
y2t = A y2t1 + 21
y3t
y3t1
31

12 
11
22
12
32

21
22

31
32

y1t1
y2t1
y3t1

Pour tester lexognit de la variable y2t , il convient deffectuer le test dhypothse H0 : 21 = 22 = 0 , si lhypothse H0 est accepte cela signifie que la
force de rappel nintervient dans aucune relation de cointgration et donc que
la variable y2t est faiblement exogne. Dans ce cas nous estimons un VECM partiel en imposant la contrainte 21 = 22 = 0 .

La cointgration et le modle correction derreur  313

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 314

Ce test est ralis par le calcul de la statistique du ratio de vraisemblance du


modle contraint sous H0 et non contraint.

F. Synthse de la procdure destimation


Nous essayons ici de synthtiser les grandes tapes relatives lestimation dun
modle VECM.
tape 1 : Dtermination du nombre de retards p du modle (en niveau ou en
Log) selon les critres AIC ou SC (cf. chapitre 10).
tape 2 : Estimation de la matrice  et test de Johansen permettant de
connatre le nombre de relations de cointgration (les logiciels proposent un certain nombre de spcifications alternatives, telles que lexistence dun terme
constant dans la relation de cointgration, contraindre A0 = 0 , lexistence dune
tendance dterministe, etc.).
tape 3 : Identification des relations de cointgration, cest--dire des relations de long terme entre les variables.
tape 4 : Estimation par la mthode du maximum de vraisemblance du
modle vectoriel correction derreur et validation laide des tests usuels :
significativit des coefficients1 et vrification que les rsidus sont des bruits
blancs (test de Ljung-Box), tests dexognit faible.
Enfin, nous pouvons vrifier que lestimation par les MCO de la relation de
long terme fournit des rsultats peu prs similaires (en termes de significativit et de valeurs estimes des coefficients) ceux obtenus par la mthode du
maximum de vraisemblance2.

Exercice n 2

fichier C11EX2

Tests de cointgration et estimation dun modle vectoriel


correction derreur
Soit trois variables y1t , y2t et y3t observes sur 30 priodes dont les donnes sont
consignes au tableau 3. On demande de tester une ventuelle cointgration et destimer
un modle VAR ou un modle vectoriel correction derreur sil y a lieu.
Solution
Premire tape : dtermination du nombre de retards de la reprsentation VAR en niveau
(la transformation logarithmique ne simpose pas au vue des donnes (cf. graphique 5)

1. videmment on tolre que quelques coefficients ne soient pas significativement de 0.


2. De manire asymptotique, les deux estimateurs sont quivalents

314  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 315

Graphique 5 Reprsentation de y1t , y2t et y3t

Tableau 4 Donnes observes de y1t , y2t et y3t (extrait des donnes)


y2,t
y3,t
y1,t
OBS
1

20,00

20,00

30,00

21,39

17,05

31,40

29

26,04

24,61

31,84

30

26,70

23,25

32,22

Le calcul des critres dinformation AIC et SC pour des retards allant de 1 3 nous
nallons pas plus loin compte tenu du faible nombre dobservations ne pose pas de difficult.
AIC(1) = 2,45 ;
SC(1) = 2,88
AIC(2) = 1,93 ;

SC(2) = 2,78

AIC(3) = 2,04 ;

SC(3) = 3,34

Le retard retenu est donc de 2 (minimum des critres AIC et SC), nous allons donc
procder au test de Johansen sur un VECM(1 ).
Deuxime tape : Test de Johansen
Nous procdons au test de Johansen sous deux hypothses :
a) Existence dune constante dans la relation de long terme et non dans les donnes
(pas de tendance dterministe), spcification b.
Dtaillons ce premier cas.
Premier test : Rang de la matrice gal 0 (r = 0), soit H0 : r = 0 contre H1 : r > 0.
Les trois valeurs propres de la matrice , estime par le maximum de vraisemblance, sont gales 1 = 0,605 ; 2 = 0,257 ; 3 = 0.139.

La cointgration et le modle correction derreur  315

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 316

k


Calculons la statistique de Johansen : trace = n

Ln (1 i ) pour r = 0 :

i=r+1

trace = n {(Ln (1 1 ) + Ln (1 2 ) + Ln (1 3 ))}


trace = 28 {0,928 + 0,297 + 0,150} = 38,50
Les valeurs critiques sont gales 34,91 pour un seuil de 5 % et 41,07 pour un seuil
de 1 % ; on rejette donc lhypothse H0, le rang de la matrice nest pas 0 (les sries ne
sont donc pas stationnaires).
Rang de la matrice gal 1 (r = 1), soit H0 : r = 1 contre H1 : r > 1.
trace = 28 {0,297 + 0,150} = 12,51
Les valeurs critiques sont gales 19,96 pour un seuil de 5 % et 24,60 pour un seuil
de 1% ; on ne peut pas rejeter lhypothse H0 ni 5 % ni 1 %, on considre donc que
le rang de la matrice est gal 1.
Nous acceptons donc lhypothse dune relation de cointgration.
b) Existence dune constante dans la relation de long terme et dans les donnes, spfication c.
Nous vrifions la robustesse de ce rsultat sur cette autre spcification (compte tenu
des donnes, les autres possibilits sont exclues).
Les rsultats sont les suivants :
Valeur propre

trace

Seuil critique 5%

Seuil critique 5%

0,603749

37,38888

29,68

35,65

0,229311

11,46904

15,41

20,04

0,138550

4,175870

3,76

6,65

L encore, on constate que le rang de la matrice nest pas 0 (ligne 1), mais quen
revanche, on ne peut pas rejeter lhypothse H0 ni 5 % ni 1 % (ligne 2) dans lhypothse dun rang de la matrice gal 1.
Le test de la valeur propre maximale corrobore les rsultats prcdents :
Hypothesized
No. of CE(s)

Eigenvalue

None *

0.603749

Max-Eigen

0.05

Statistic

Critical Value

25.91984

Prob.**

21.13162

0.0098

At most 1

0.229311

7.293174

14.26460

0.4550

At most 2 *

0.138550

4.175870

3.841466

0.0410

Lhypothse dune seule relation de cointgration est valide.


- Troisime tape : estimation du modle vectoriel correction derreur
Les deux spcifications prcdentes sont estimes avec ou sans constante dans les
donnes et donc, dans les deux cas, avec une seule relation de cointgration entre y1,t , y2,t
et y3,t .
La premire spcification est rejete du fait que les trois constantes des trois quations ne sont pas significativement diffrentes de 0.

316  CONOMTRIE

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 317

Lestimation finale du VECM sur 28 observations est donc la suivante :


y1,t = 0,85 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)
(2,64)
(8,9)
(7,1)
(4,19)
+ 0,77 y1,t1 0,71 y2,t1 0,26 y3,t1
(2,82)
(2,61)
(1,07)
y2,t = 0,32 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)
(1,18)
(8,9)
(7,1)
(4,19)
+ 0,10 y1,t1 0,34 y2,t1 0,08 y3,t1
(0,43)
(1,44)
(0,39)
y3,t = 0,0089 (y1,t1 0,87 y2,t1 0,54 y3,t1 + 12,92)
(0,03)
(8,9)
(7,1)
(4,19)
+ 0,53 y1,t1 0,46 y2,t1 0,25 y3,t1
(2,16)
(1,86)
(1,13)
Les chiffres entre parenthses sont les t de Student.
Quatrime tape : validation de la reprsentation vectorielle correction derreur
Les coefficients des termes de rappel ont bien le signe attendu (cependant seul le
terme de rappel de lquation est significatif) et les coefficients de la relation de long
terme sont significatifs.
Le fait que seul le coefficient 1 soit significativement diffrent de 0, indique que les
variables y2t et y3t sont faiblement exognes ce qui est confirm par le test de contrainte
portant sur les coefficients de la force de rappel 1 , 2 et 3 :
Cointegration Restrictions :
A(1,1) = 0

A(2,1) = 0

A(3,1) = 0

Not all cointegrating vectors are identified


LR test for binding restrictions (rank = 1) :
Chi-square(1) : 5,557
Probability : 0,0184

Chi-square(1) : 1,275770

Chi-square(1) : 0,001005

Probability : 0,258687

Probability : 0,974714

Nous acceptons lhypothse H0 de nullit pour les coefficients 2 et 3 .


Le VECM partiel est estim en imposant la contrainte 2 = 3 = 0.

La cointgration et le modle correction derreur  317

9782100721511-Bourbo-C11.qxd

22/10/14

10:27

Page 318

Vector Error Correction Estimates


Sample (adjusted) : 3 30
Included observations : 28 after adjustments
Standard errors in ( ) & t-statistics in [ ]
Cointegration Restrictions :
A(3,1)=0, A(2,1) = 0
Not all cointegrating vectors are identified
LR test for binding restrictions (rank = 1) :
Chi-square(2)

1.558967

Probability

0.458643

Cointegrating Eq :

CointEq1

Y1( 1)

0.997283

Y2( 1)

0.797187

Y3( 1)

0.555922

11.94414

Error Correction :
CointEq1

D(Y1( 1))

D(Y2( 1))

D(Y3( 1))

D(Y1)

D(Y2)

D(Y3)

1.187476

0.000000

0.000000

(0.20103)

(0.00000)

(0.00000)

[ 5.90704]

[ NA]

[NA]

0.813973

0.139232

0.527616

(0.26543)

(0.23701)

(0.24591)

[3.06663]

[ 0.58745]

[2.14553]

0.715308

0.372227

0.456821

(0.26279)

(0.23465)

(0.24346)

[ 2.72203]

[ 1.58631]

[ 1.87634]

0.299747

0.097043

0.244642

(0.23644)

(0.21113)

(0.21906)

[ 1.26773]

[ 0.45964]

[ 1.11679]

Quelques coefficients du modle ne sont pas significatifs, cela tait probable et ne


remet pas en cause la validit globale du modle.
Enfin, les trois rsidus issus de chaque quation sont des bruits blancs daprs la
Q-statistique de Ljung-Box :
premire quation : Q(12) = 5,87 ( = 0,92)  Acceptation de H0 ;
deuxime quation : Q(12) = 4,60 ( = 0,97)  Acceptation de H0 ;
troisime quation : Q(12) = 5,99 ( = 0,92)  Acceptation de H0 ;
La spcification VECM est donc valide.

318  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:28

Page 319

12. Introduction

lconomtrie
des variables
qualitatives

ous avons, lors des chapitres prcdents (chapitre 3, partie 5), utilis des variables explicatives particulires appeles variables
dichotomiques1, dont la caractristique est de prendre deux
valeurs 0 ou 1. Leurs utilisations ne posent aucun problme en tant que
variable explicative, en revanche lorsquelles sont utilises en tant que
variable expliquer la mthode des moindres carrs ordinaires est
dfaillante.
Dans ce chapitre, qui constitue une simple introduction2 lconomtrie
des variables qualitatives, nous allons donc aborder, dans une premire
partie, la problmatique particulire de lconomtrie des variables qualitatives et les problmes rencontrs dans ce type de modlisation. Puis
nous prsentons les modles spcifiques lorsque la variable expliquer
est binaire tels que : dcision dacheter ou de ne pas acheter un produit,
risque de dfaillance de paiement, obtenir un diplme, .... Il sagit des
modles choix binaires (Probit et Logit).
Puis, dans une troisime partie, nous abordons les modles choix multiples (pour quel candidat voter, quel moyen de transport adopter, ..).
Enfin, la quatrime partie est consacre aux variables tronques et censures.

1. Les termes de variables indicatrices, binaires, muettes, ou dummy sont aussi utiliss.
2. Pour des dveloppements, nous recommandons au lecteur de se rfrer au livre de Thomas A.
conomtrie des variables qualitatives , Dunod, 2002.

Introduction lconomtrie des variables qualitatives  319

9782100721511-Bourbo-C12.qxd

22/10/14

10:28

Page 320

I. Les problmes et les consquences


de la spcification binaire
Le recours des modles et des mthodes destimation spcifiques lorsque la
variable endogne est qualitative (dichotomique ou choix multiples) est li au
fait que le modle linaire gnral ne peut pas sappliquer dans ce contexte.
Prenons lexemple dun modle de rgression simple permettant de relier le
fait dtre, pour un individu i , propritaire dun logement son revenu :
yi = a0 + a1 xi + i

i = 1,...,n

[1]

avec :
yi = une variable endogne (variable expliquer) qui prend les valeurs 1 si lindividu i est propritaire de son logement et 0 dans le cas contraire,
xi = une variable exogne (variable explicative) qui reprsente le revenu en
euros de lindividu i ,
i = lerreur de spcification du modle,
a0 et a1 = les paramtres estimer.

Ce modle, appel aussi modle probabilit linaire, prsente les proprits suivantes.
a) En faisant lhypothse classique de lesprance de lerreur nulle :
E(i ) = 0 , alors E(yi ) = a0 + a1 xi .

b) La valeur prvue de la variable expliquer yi peut sinterprter de la


manire suivante :
Soit Pi = Prob(yi = 1) , do Prob(yi = 0) = 1 Pi
E(yi ) = 1 Prob(yi = 1) + 0 Prob(yi = 0) = Pi

Soit : Pi = a0 + a1 xi

i , do le nom du modle.

c) La variable yi ne pouvant prendre que deux valeurs (0 et 1), par voie de


consquence, lerreur ne peut donc prendre que deux valeurs :
i = 1 (a0 + a1 xi ) avec la probabilit Pi
i = (a0 + a1 xi ) avec la probabilit 1 Pi

320  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 321

La variance de lerreur est donne par :


Var(i ) = E(i2 ) = Pi (valeur de i si yi = 1)2 + (1 Pi ) (valeur de i si
yi = 0)2 .

Do : Var(i ) = E(i2 ) = Pi (1 a0 a1 xi )2 + (1 Pi ) (a0 a1 xi )2


Or Pi = a0 + a1 xi

Soit :

Var(i ) = E(i2 ) = Pi (1 Pi )2 + (1 Pi ) (Pi )2

[2]

Var(i ) = E(i2 ) = Pi (1 Pi )

[3]

Examinons les problmes soulevs par lapplication dune mthode des


moindres carrs ordinaires afin destimer ce modle.
a) Dans lquation [1], le codage de la variable endogne (0 ou 1) est totalement arbitraire, par exemple si nous prenions un codage sous la forme (0 ou
10) les valeurs estimes des coefficients ak seraient videmment diffrentes
(10 ak ) .
Un examen graphique (cf. graphique 1) de la srie expliquer (yi ) et de la
srie ajuste ( yi ) illustre parfaitement la non adquation de lestimation linaire
des paramtres par la mthode des moindres carrs.

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
y

y ajuste

Graphique 1 Srie brute (yi ) et de la srie ajuste ( yi )

Introduction lconomtrie des variables qualitatives  321

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 322

b) Puisque lerreur ne peut prendre que deux valeurs, elle suit donc une loi
discrte, lhypothse de normalit des erreurs nest donc pas vrifie.
c) Daprs la relation [3] : E(i2 ) = Pi (1 Pi ) , il existe de fait une htroscdasticit. Cependant nous ne pouvons pas appliquer la mthode des
moindres carrs gnraliss car Pi dpend des paramtres a0 et a1 du modle.
d) Enfin, nous devons imposer une contrainte au modle : 0  Pi =

a0 + a1 xi  1 qui peut se rvler non compatible avec les donnes.

Tous ces lments indiquent clairement que nous sommes dans limpossibilit dutiliser la mthode des moindres carrs ordinaires.

II. Les modles de choix binaires


Les modles de choix binaires (ou encore appels modles dichotomiques) sont
utiliss dans des secteurs trs divers ds que la variable expliquer ne peut
prendre que deux modalits, par exemple :
mdecine : gurison ou non gurison,
marketing : achat ou non achat,
finance : remboursement du prt ou non remboursement, dfaillance dune
entreprise ou non dfaillance,
science politique : rpondre oui ou non un rfrendum, voter pour X ou
Y une lection,
sociologique : russir ou rater un examen,
etc.
Dans un modle de choix binaire, nous cherchons modliser une alternative ( yi = 0 ou 1) et donc estimer la probabilit Pi associe lvnement
(yi = 1) .

A. Le modle linaire sur variable latente


Les variables latentes sont une premire rponse aux problmes lis lutilisation des moindres carrs ordinaires dans un modle dont la variable expliquer
est binaire.
Quest-ce quune variable latente ? Il sagit dune variable continue non
observable et reprsentative du phnomne tudi. Par exemple la richesse dun
individu peut tre explique par le fait quil soit propritaire ou non de son
appartement.

322  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 323

On introduit donc la variable latente yi (la richesse) et on suppose que :


1) lindividu i est propritaire si sa richesse est suffisante, soit yi = 1 si
yi > 0

2) yi est une fonction linaire des xi , yi = a0 + a1 xi + i .


La variable expliquer binaire yi est alors dfinie par le modle de dcision
suivant :


yi = 1 si yi > 0
yi = 0 si yi  0

Intuitivement, cette rgle de dcision consiste simplement supposer que la proportion des (yi = 1) est leve pour a0 + a1 xi + i > 0 .
Soit Pi la probabilit que yi > 0 .
Pi = Prob(yi = 1) = Prob(yi > 0) = Prob(a0 + a1 xi + i > 0)
= Prob(i > (a0 + a1 xi ))
Si la distribution de i est centre par rapport la moyenne, nous avons

lquivalence :
Prob(i > (a0 + a1 xi )) = Prob(i < a0 + a1 xi )

Soit :

Pi = Prob(yi = 1) = Prob(i < a0 + a1 xi )

Lensemble de ces rsultats peut tre gnralis dans le cas dun modle
plusieurs variables.
La probabilit Pi dpend ainsi de la distribution du terme de lerreur i du
modle de dcision, nous pouvons alors distinguer deux cas :
le modle Probit si la fonction de rpartition de lerreur suit une loi normale,
le modle Logit si la fonction de rpartition de lerreur suit une loi de type
logistique.

B. Les modles Probit et Logit


Dans un modle Probit la fonction de rpartition de lerreur i est donne par :

Pi =

a0 +a1 xi

1
2
et /2 dt
2

Il sagit dune loi normale centre et rduite N (0,1) .


La fonction logistique Logit model ou encore appele courbe en S est
donne par lexpression suivante :

Introduction lconomtrie des variables qualitatives  323

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 324

Pi = Prob(yi = 1) = Prob(yi > 0) = Prob(a0 + a1 xi + i > 0)


= Prob(i > (a0 + a1 xi )) = (a0 + a1 xi )

avec (.) la fonction de rpartition de la loi logistique.


Pi = (a0 + a1 xi ) =

exp(a0 + a1 xi )
1
=
1 + exp(a0 + a1 xi )
1 + exp((a0 + a1 xi ))

Les proprits de cette quation sont les suivantes, si 1 > 0 :


Lim Pi 1 et Lim Pi 0 , ce qui assure bien que les valeurs de Pi sont

xi

xi

comprises entre 0 et 1, comme lillustre le graphique 2.

1,00
Pi

0,50

0,00
xi

Graphique 2 La fonction logistique

Nous pouvons observer, aprs une transformation analogue celle de lexercice 2 du chapitre 6, que la fonction Logit scrit :


Pi
Ln
1 Pi
choix yi = 1 .

= y = a0 + a1 xi + i avec

Pi
1 Pi

la probabilit relative du

Ces spcifications peuvent tre gnralises dans le cas de plusieurs


variables explicatives.

324  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 325

Lestimation des paramtres des modles Probit ou Logit est effectue laide des algorithmes de maximisation dune fonction log-vraisemblance1. Quels
que soient les modles retenus (Probit ou Logit) les rsultats destimation sont
relativement proches, cependant les coefficients estims ne sont pas directement
comparables.

C. Interprtation des rsultats et tests statistiques


Contrairement aux modles linaires estims par la mthode des moindres carrs ordinaires pour lesquels les coefficients ont des interprtations conomiques
immdiates en termes de propension marginale, les valeurs des coefficients des
modles ne sont pas directement interprtables. Seuls les signes des coefficients
indiquent si la variable agit positivement ou ngativement sur la probabilit Pi.
Cependant, il est possible de calculer les effets marginaux2 afin de connatre
la sensibilit de la variation dune variable explicative sur la probabilit Pi.
La significativit des coefficients est apprcie laide des ratios appels z Statistique car la distribution des rapports du coefficient sur son cart type ne
suit pas une loi de Student, comme dans le modle linaire gnral, mais une loi
normale. Cette z -Statistique sinterprte de manire classique partir des probabilits critiques et permet la tenue de tous les tests de significativit concernant les coefficients.
Afin de tester lhypothse : H0 : a1 = a2 = a3 = . . . = ak = 0 , nous utilisons
le ratio du Log vraisemblance. Soit la statistique suivante :
L R = 2(Ln(L R ) Ln(L U )) avec L R = valeur de la fonction du Logvraisemblance contrainte sous H0 et L U = valeur de la fonction du Logvraisemblance non contrainte.
L R suit, sous lhypothse nulle H0, une distribution dun 2 k degrs de
libert. Si la statistique L R est suprieure au 2 lu dans la table pour un seuil
dtermin, gnralement de 5 %, alors nous refusons lhypothse H0, le modle
estim comporte au moins une variable explicative de significative.
Compte tenu de la caractristique de la variable expliquer code en 0 ou 1,
le coefficient de dtermination R 2 nest pas interprtable en termes dajustement
du modle, cest pourquoi on utilise une statistique appele le pseudo- R 2 donne par : R 2 = 1

Log(Lu)
.
Log(L R )

1. Cf. Thomas A. conomtrie des variables qualitatives , Dunod, 2002, pages 56-57.
2. Cf. Thomas A. (2002), pages 60-61.

Introduction lconomtrie des variables qualitatives  325

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 326

Exercice n 1

fichier C12EX1

Estimation des modles Probit et Logit binaires explicatifs des facteurs de la russite en Licence
Nous avons relev sur un chantillon de 60 tudiants inscrits en dernire anne de
Licence dconomie, les variables suivantes susceptibles dexpliquer la russite ou
lchec lexamen de Licence (variable REUSSITE = 0 si chec, 1 sinon) :
NENFANTS = variable discrte reprsentant le nombre de frres et soeurs de ltudiant,
NECONO = la note dconomtrie sur 20 obtenue en Licence,
NMICRO = la note de micro-conomie sur 20 obtenue en Licence,
GENRE = variable muette, (1 = masculin, 0 = fminin).
Un extrait des donnes est prsent dans le tableau 1.

Tableau 1 Extrait de donnes


OBS

REUSSITE

NENFANTS

NECONO

NMICRO

GENRE

3,6

3,8

59

16,2

12

60

17

On demande :
1) destimer un modle de type Logit permettant de prvoir la probabilit de russite
dun tudiant en Licence,
2) de comparer les rsultats avec un modle de type Probit et le modle linaire gnral,
3) de donner la probabilit de russite, laide du modle Logit estim, pour un tudiant dont les caractristiques sont les suivantes : NENFANTS = 1 ; NECONO = 12 ;
NMICRO = 13,5 ; GENRE = masculin.
Solution
1) Une premire estimation dun modle Logit, conduit aux rsultats suivants :

326  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 327

Dependent Variable : REUSSITE


Method: ML Binary Logit
Included observations: 60
Variable
NENFANTS
NECONO
GENRE
NMICRO
C

Coefficient
0.682523
0.632062
3.761718
0.155322
3.265634

Std. Error
0.378870
0.239564
1.437068
0.188916
2.020060

z-Statistic
1.801470
2.638382
2.617633
0.822173
1.616602

Prob.
0.0716
0.0083
0.0089
0.4110
0.1060

la lecture des rsultats, nous constatons que :


la variable NMICRO une probabilit critique de 0,41, elle nest donc pas significative,
la variable NENFANTS une probabilit critique de 0,07, elle est donc faiblement
significative.
Nous procdons une nouvelle estimation en retirant la variable NMICRO dont le
coefficient nest pas significativement diffrent de 0.
Les rsultats complets fournis par Eviews sont les suivants :

Dependent Variable : REUSSITE


Method: ML Binary Logit
Included observations: 60
Variable

Coefficient

Std. Error

z-Statistic

NENFANTS
NECONO
GENRE
C

0.746742
0.695857
3.634605
2.859277

0.378942
0.231789
1.410945
1.910377

1.970596
3.002112
2.576008
1.496708

0.516667
0.287086
4.615432
15.37669
41.55549
52.35761
2.51E 11

S.D. dependent var


Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Avg. log likelihood
McFadden R-squared

Mean dependent var


S.E. of regression
Sum squared resid
Log likelihood
Restr. log likelihood
LR statistic (3 df)
Probability(LR stat)
Obs with Dep=0
Obs with Dep=1

29
31

Total obs

Prob.
0.0488
0.0027
0.0100
0.1345
0.503939
0.645890
0.785512
0.700504
0.25627
0.629972
60

Avec : L U = Log likelihood ; L R = Restr. log likelihood ; L R = L R statistic ;


L U /n = Avg. log likelihood. Le critre dinformation de Hannan-Quinn permet des
comparaisons entre les modles (comme les critres de Akaike ou Schwarz) en termes
darbitrage : apport dinformation li lajout de variables explicatives et perte de degrs
de libert. En cas de modle concurrent, celui ayant le plus faible critre dinformation
sera retenu.

Introduction lconomtrie des variables qualitatives  327

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 328

a) Interprtation statistique
Les coefficients sont tous significativement diffrents de 0, hormis le terme constant.
La statistique de la Log vraisemblance est gale L R = 52,35 que lon compare
0,95

un 2 lu dans la table un seuil de 0,95 % et 3 degrs de libert, 32


rejet de H0.

= 9,28 < 52,35

Le pseudo-R 2 est donn par :


Log(Lu)
15,38
=1
= 1 0,37 = 0,63
R2 = 1
Log(L R )
41,56
Le modle est valid sur le plan statistique.
Le logiciel Eviews propose une table permettant dapprhender les qualits prvisionnelles du modle sur lchantillon en comparant la probabilit estime pour un individu i dtre yi = 1(P(Dep = 1)) au seuil arbitraire de 50 % la valeur observe des
yi = 0 ou 1.
Dependent Variable : REUSSITE
Method: ML Binary Logit
Included observations: 60
Prediction Evaluation (success cutoff C = 0.5)
Estimated Equation
Dep = 0 Dep = 1
Total
P(Dep =1) <= C
P(Dep =1) > C
Total
Correct
% Correct
% Incorrect
Total Gain*
Percent Gain**

26
3
29
26
89.66
10.34
89.66
89.66

4
27
31
27
87.10
12.90
12.90
NA

30
30
60
53
88.33
11.67
36.67
75.86

Constant Probability
Dep = 0 Dep = 1
Total
0
29
29
0
0.00
100.00

0
31
31
31
100.00
0.00

0
60
60
31
51.67
48.33

Ici, pour les individus (29) pour lesquels yi = 0, le modle indique que 26 individus
ont une probabilit estime de russite infrieure 50 %. Dans 89,66 % des cas, les
checs sont donc correctement prvus.
Pour les individus (31) pour lesquels yi = 1, le modle indique que 27 individus ont
une probabilit estime suprieure 50 %. Dans 87,10 % des cas, les russites sont correctement prvues.
Le taux derreur est donc faible.
b) Interprtation conomique
Le modle scrit :


Pi
Ln
= 0,75 NENFANTS + 0,70 NECONO 3,63 GENRE 2,86 + ei
1 Pi
(1,97)
(3,00)
(2,57)
(.) = z-Statistique
ei = Rsidu destimation
Le nombre de frres et soeurs du foyer agit ngativement, les tudiants issus de
familles nombreuses ont un taux de russite plus faible.
La note dconomtrie est un facteur positif de russite.

328  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 329

Enfin, les tudiants de genre masculin russissent en gnral moins bien (signe
ngatif) que les tudiants de genre fminin.
2) Estimation dun modle Probit et du modle linaire gnral
a) Lestimation dun modle Probit conduit aux rsultats suivants :

Dependent Variable : REUSSITE


Method: ML Binary Logit
Included observations: 60
Variable

Coefficient

Std. Error

z-Statistic

NENFANTS
NECONO
GENRE
C

0.428197
0.363148
1.824203
1.491466

0.219223
0.110230
0.650426
1.108767

1.953247
3.294454
2.804629
1.345157

Prob.
0.0508
0.0010
0.0050
0.1786

Les valeurs des coefficients sont de mme signe mais diffrentes par rapport au
modle Logit car la spcification nest pas la mme. Cependant, nous pouvons retrouver,
approximativement, les valeurs estimes du modle Logit
en multipliant chacun des
coefficients des variables explicatives par la constante1 3 1,81.
b) Sans tenir compte des spcificits du modle variable expliquer binaire et en
utilisant une mthode (non approprie) des moindres carrs avec correction pour htroscdasticit, nous obtenons les rsultats suivants :

Dependent Variable : REUSSITE


Method: ML Binary Logit
Included observations: 60
White HeteroskedasticityConsistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

NENFANTS
NECONO
GENRE
C

0.078499
0.066672
0.295568
0.217243

0.037854
0.016580
0.092934
0.235111

2.073727
4.021299
3.180407
0.924003

R-squared
Durbin-Watson stat

0.611335
1.741795

F-statistic
Prob(F-statistic)

Prob.
0.0427
0.0002
0.0024
0.3594
29.36094
0.000000

Les coefficients sont affects du mme signe que dans les modles Probit et Logit,
cependant le graphique des valeurs ajustes (cf. graphique 3) indique que les valeurs sont
parfois ngatives ou suprieures 1 ce qui est videmment incompatible avec la valeur
dune probabilit.

1. Une littrature abondante concerne la comparaison entre les modles Probit et Logit, cf.
Amemiya T., 1981.

Introduction lconomtrie des variables qualitatives  329

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 330

1,4
1,2
1
0,8
0,6
0,4
0,2
0
1

3 5 7

9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

0,2
0,4
Srie brute

Srie ajuste

Borne1

Graphique 3 Sries brute et ajuste de la variable binaire Russite


3) Soit les caractristiques de ltudiant : NENFANTS = 1 ; NECONO = 12 ;
NMICRO = 13,5 ; GENRE = masculin.
Le modle Logit estim (la note de micro-conomie ne figurant pas dans le modle
final, elle nest pas intgre dans le calcul, cf. question 1) est le suivant :


Pi
Ln
= 0,75 NENFANTS + 0,70 NECONO 3,63 GENRE 2,86 + ei
1 Pi
(1,97)
(3,00)
(2,57)

Pi
= 0,75 1 + 0,70 12 3,63 1 2,86 = 1,109
Ln
1 Pi

i
P
= e1,109 = 3,033 Pi = 3,033/(1 + 3,033) = 0,75

1 Pi
La probabilit de russite de cet tudiant de licence est donc de 75 %.

III. Les modles choix multiples


Les modles choix multiples sont une gnralisation des modles binaires.
Dans ces modles la variable expliquer, qualitative, nest donc plus binaire (0
ou 1), mais multinomiale (ou polytomique) comme par exemple :

330  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 331

le choix lors dun vote entre quatre candidats,


la possibilit pour un bachelier de choisir de sinscrire dans une prparation aux concours des coles, luniversit, dans un IUT, dans un BTS,
appartenir une classe de revenu,
etc.
Nous diffrencions, en fonction du type de la variable expliquer, les
modles ordonns et les modles non ordonns.

A. Les modles Probit et Logit ordonns


Dans un modle ordonn, les modalits de la variable expliquer sont hirarchises. Elles indiquent lappartenance de lindividu une classe ou une catgorie, par exemple lappartenance une tranche de revenu.
Nous pouvons distinguer deux classes de modles choix multiples ordonns en fonction de la variable expliquer qui est issue, soit dune discrtisation dune variable continue telle que lappartenance une tranche de salaire,
soit directement dune appartenance une catgorie (faire du sport : une fois par
semaine, une fois par mois, une fois par an, ).
Comme pour le modle de choix binaire nous modlisons1 une variable
latente continue :
yi = a0 + a1 xi + i .
Les valeurs prises par la variable yi correspondent des intervalles dans lesquels se trouve yi dfinissant ainsi le modle de dcision suivant M + 1 modalits :

yi = 0 si yi  c1

yi = 1 si c1 < yi  c2
yi = 2 si c2 < yi  c3

.. ..

. = .
yi = M si c M < yi

Soit Pi la probabilit dapparition de chaque vnement pour lindividu i :


Pi0 = Prob(yi = 0) = (c1 (a0 + a1 xi ))
Pi1 = Prob(yi = 1) = (c2 (a0 + a1 xi ) (c1 (a0 + a1 xi ))
Pi2 = Prob(yi = 2) = (c3 (a0 + a1 xi ) (c2 (a0 + a1 xi ))
...
Pi M = Prob(yi = M) = 1 (c M (a0 + a1 xi ))
1. Afin dallger lcriture nous ne faisons figurer quune seule variable explicative, la gnralisation k variables ne pose aucun problme comme lillustre lexercice n2.

Introduction lconomtrie des variables qualitatives  331

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 332

Avec la fonction de rpartition de la loi de probabilit normale ou logis-


tique (t) =

et
1 + et

et

M


Pi = 1

i=0

Comme pour le modle de choix binaire, le recours une fonction de rpartition normale, permet de dfinir un modle de type Probit et une fonction de
rpartition de type logistique permet de dfinir un modle Logit. Lestimation de
tous les paramtres, les coefficients de rgression ( ai ) et les valeurs des seuils
(ci ) des modles ordonns (Probit ou Logit) est effectue laide des algorithmes de maximisation dune fonction de Log-vraisemblance dfinie par les
Pi j .
Les valeurs des coefficients des modles ne sont pas directement interprtables en termes de propension marginale, seuls les signes des coefficients indiquent si la variable agit positivement ou ngativement sur la variable latente.
Les rsultats destimation sapprcient de la mme manire que pour les
modles de choix binaires :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Le pseudo- R 2 est donn par : R 2 = 1

Log(Lu)
.
Log(L R )

Exercice n 2
fichier C12EX2
Estimation dun modle choix multiples de prvision des ventes
La socit Tl-Ventes (ventes par tlphone lors dune mission la tlvision)
dsire estimer le niveau des ventes par article pour chaque mission afin de dimensionner la charge de lentrept et prvoir ainsi le nombre dquipes.
Lmission est diffuse tous les jours sauf le dimanche. Les ventes sont rparties en
trois classes : faible, moyenne, forte.
Lobjectif est destimer un modle permettant de prvoir quelle classe de vente
(faible, moyenne, forte) appartient un article prsent lors dune mission. Pour ce faire,
on dispose des informations suivantes sur 82 missions passes :
VENTES : classe de larticle (faible = 0, moyenne = 1, forte = 2 ),
WE : variable indicatrice du type de jour de diffusion de lmission (1 les jours de
semaine, 0 le samedi),
EXPO : temps dexposition du produit en minutes,
REDUC : % de rduction propos sur le prix,
DIRECT = variable indicatrice dmission enregistre (0 pas direct, 1 direct).
Un extrait des donnes est prsent dans le tableau 2.

332  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 333

Tableau 2 Extrait de donnes


Obs

VENTES

WE

EXPO

REDUC

DIRECT

3,5

0,20

3,5

0,20

81

82

3,5

1) On demande destimer un modle Logit multinomial permettant de prvoir la classe


de vente dun article partir des facteurs explicatifs proposs.
2) Deffectuer une prvision pour un article prsent lors dune mission en diffr diffuse en semaine dont le temps dexposition est de 7 minutes et sans rduction.
Solution
1) Une premire estimation laide dun modle de type Logit conduit au rsultat
suivant :
Dependent Variable : VENTES
Method: ML Ordered Logit (Quadratic hill climbing)
Included observations: 82 after adjusting endpoints

DIRECT
EXPO
REDUC
WE

Coefficient

Std. Error

z-Statistic

0.226809
0.644804
8.922215
1.395159

1.325269
0.150121
2.759073
0.512093

0.171142
4.295228
3.233772
2.724426

Prob.
0.8641
0.0000
0.0012
0.0064

Nous constatons que la variable DIRECT dont le coefficient est affect dune probabilit critique de 0,86 nest pas significative (les tlspectateurs ne sont pas sensibles aux
missions diffuses en direct), elle est donc retire du modle. La nouvelle estimation est
alors la suivante.
Dependent Variable : VENTES
Method: ML Ordered Logit (Quadratic hill climbing)
Included observations: 82 after adjusting endpoints
Coefficient
EXPO
REDUC
WE

0.641023
8.982926
1.377785

Std. Error

z-Statistic

0.148189
4.325700
2.735164
3.284237
0.500824
2.751038
Limit Points
LIMIT_1:C(4)
3.679581
0.994565
3.699689
LIMIT_2:C(5)
6.170926
1.174856
5.252497
Akaike info criterion
1.605306
Schwarz criterion
Log likelihood
60.81754
Hannan-Quinn criter.
Restr. log likelihood 79.48219
Avg. log likelihood
LR statistic (3 df)
37.32930
LR index (Pseudo-R2)
Probability(LR stat)
3.92E-08

Prob.
0.0000
0.0010
0.0059
0.0002
0.0000
1.752057
1.664224
0.74167
0.234828

Introduction lconomtrie des variables qualitatives  333

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 334

a) Interprtation statistique
Les coefficients sont maintenant tous significativement diffrents de 0 (probabilits
critiques infrieures 0,05).
que lon compare un
La statistique de la Log vraisemblance est gale L R = 37,33 0,95
2 lu dans la table un seuil de 0,95 % et 3 degrs de libert, 32 < 37,33 rejet
de H0.
Le modle est donc valid sur le plan statistique.
b) Interprtation conomique
La dure dexposition et le pourcentage de rduction agissent positivement sur les
ventes.
Une mission diffuse un jour de semaine engendre moins de ventes quune mission diffuse le samedi.
Les seuils c1 et c2 sont respectivement de 3,679 et 6,170.
Les signes des coefficients sont conformes lintuition conomique.
Le logiciel Eviews propose une table permettant dapprhender les qualits prvisionnelles du modle sur lchantillon :
Dependent Variable : VENTES
Method: ML Ordered Logit (Quadratic hill climbing)
Included observations: 82 after adjusting endpoints
Prediction table for ordored dependent variable
Value

Count

Count of obs
with Max Prob

Error

Sum of all
Probabilities

Error

0
1
2

44
27
11

47
31
4

3
4
7

44.381
26.834
10.785

0.381
0.166
0.215

la lecture des rsultats, nous constatons que les qualits prvisionnelles de ce


modle sont satisfaisantes car le taux derreur est assez faible pour les ventes de niveau
0 et 1. En revanche, pour les ventes de niveau 2 (forte) nous constatons que sur 11 ventes
ralises, le modle en a prvues correctement seulement 4.
Enfin pour chaque individu Eviews indique :
VENTES_0_0 = la probabilit associe la modalit 0,
VENTES_1_0 = la probabilit associe la modalit 1,
VENTES_2_0 = la probabilit associe la modalit 2,
I_VENTES_0 = la ralisation de lestimation de la variable latente.
Un exemple est donn1 pour les cinq premires ventes :

1. Un exemple de calcul est dtaill lors de la rponse la question 2.

334  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 335

obs

VENTES

VENTES_0_0

VENTES_1_0 VENTES_2_0 I_VENTES_0

0.7342647

0.2366418

0.0290935

2.663212

0.4106169

0.4831615

0.1062216

4.040996

0.4106169

0.4831615

0.1062216

4.040996

0.4106169

0.4831615

0.1062216

4.040996

0.7342647

0.2366418

0.0290935

2.663212

2) Nous calculons lestimation de la variable latente correspondante aux caractristiques


de lmission avec EXPO = 7, REDUC = 0 et WE = 1 :

y = 0,641 EXPO + 8,982 REDUC 1,377 WE

y = 0,641 7 + 8,982 0 1,377 1 = 3,109
Puis nous calculons les probabilits :
P1 = Prob(yi = 0) = (c1 xi a)
= (3,679 3,109)
= (0,57) =

e0,57
= 0,639
1 + e0,57

(c1 xi a)
= (6,17 3,109) 0,639
P2 = Prob(yi = 1) = (c2 xi a)
P2 = (3,06) 0,639 =

e3,06
0,639 = 0,955 0,639 = 0,31
1 + e3,06

P3 = Prob(yi = 2) = 1 (6,17 3,109) = 1 0,955 = 0,045


Soit les rsultats suivants :
VENTES = 0

VENTES = 1

VENTES = 2

0,639

0,316

0,045

Pi

Les ventes de lmission prvue ont 64% de probabilit dappartenir la classe 0 de


faible vente.

B. Le modle de choix multiples non ordonn :


le Logit multinomial
Dans les modles non ordonns la variable expliquer reprsente les possibilits de choix dun individu parmi M + 1 possibilits et donc ses prfrences,
cest pourquoi on les dnomme aussi modle utilits alatoires.
Soit lutilit1 de lindividu i pour la possibilit j ( j = 0,1,...,M) :
Ui j = a0 + a1 xi + i
1. Afin dallger lcriture nous ne faisons figurer quune seule variable explicative, la gnralisation k variables ne pose aucun problme.

Introduction lconomtrie des variables qualitatives  335

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 336

La dcision yi = j est retenue si Ui j = Max(Ui0 ,Ui1 ,. . . ,Ui M ) .


La loi des utilits peut tre normale (Probit multinomial) ou log-normale
(Logit multinomial).
Dans le cas le plus frquent dun modle Logit multinomial M + 1 modalits, la probabilit du choix j pour lindividu i est donne1 par :
Prob(yi = j) =

exp(xi a j )
1
=
M
M


exp(xi ak )
1+
exp(xi (ak a j )
k=0
k=
/j

k=0

Avec xi le vecteur des caractristiques de lindividu i et a j le vecteur caractristique de la modalit j .


Dans un modle Logit multinomial, la probabilit dapparition de la j me
modalit dpend de la diffrence ak a j , nous pouvons donc poser sans restriction a0 = 0.
Par exemple, prenons le cas dun individu i qui a trois choix ( M = 2 ), les
probabilits scrivent :
Prob(yi = 0) =

1
1 + exp(x (a1 a0 )) + exp(xi (a2 a0 ))

Prob(yi = 1) =

1
1 + exp(xi (a0 a1 )) + exp(xi (a2 a1 ))

Prob(yi = 2) =

1
1 + exp(xi (a0 a2 )) + exp(xi (a1 a2 ))

Or, par construction

2


Pi = 1 et comme nous avons pos la contrainte

i=0

a0 = 0 , nous pouvons estimer les deux paramtres a1 et a2 qui sinterprtent


comme tant des carts par rapport au paramtre a0.

Une autre caractristique fondamentale du Logit multinomial rside dans la


proprit dindpendance par rapport aux autres vnements du rapport des
deux probabilits associes deux possibilits j et k :
exp(xi a j )
Prob(yi = j)
=
= exp(xi (a j ak ))
Prob(yi = k)
exp(xi ak )

Ce rapport est indpendant des possibilits autres que j et k , cette hypothse


sappelle lindpendance des alternatives non pertinentes Independance of

1. Cf. Thomas A. (2002), pages 92-93.

336  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 337

Irrelevant Alternative . Cette proprit est vrifie1 si le fait de changer lensemble des choix (par exemple ajouter une possibilit) ne modifie pas les ratios
de chances.
Lestimation des paramtres du modle est effectue laide des algorithmes
de maximisation de la fonction log-vraisemblance. Les valeurs des coefficients
ne sont pas directement interprtables en termes de propension marginale, seuls
les signes des coefficients indiquent si la variable agit positivement ou ngativement sur la probabilit relative de choisir j plutt que 0.
Les rsultats destimation sapprcient de la mme manire que pour les
autres modles :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Le pseudo- R 2 est donn par : R 2 = 1

Log(Lu)
.
Log(L R )

IV. Les modles variable dpendante


limite : le modle Tobit
Dans les modles variable dpendante limite ( limited dependent variable
models ) les valeurs de la variable expliquer continue ne sont observables que
sur un intervalle donn. Par exemple :
La demande dun produit nest connue (les ventes observes) que si le
magasin possde ce produit en stock, au-del la demande non satisfaite (les
ventes perdues) est inconnue.
Le salaire dun jeune diplm nest observable que si il travaille (salaire
> 0 ).
Lors dune enqute sur les dpenses relatives lachat de biens dquipement, seules les dpenses des mnages ayant effectivement achet un bien
dquipement sont prises en compte.
etc.
Le recours lconomtrie des variables qualitatives se justifie par lestimation de la probabilit que la variable expliquer se trouve lintrieur de lintervalle pour lequel elle est observable. Ces modles, appels modle Tobit par
rfrence J. Tobin2, ont connu beaucoup dextensions, nous pouvons citer :
1. Cf. Thomas A. (2002), pages 101-103.
2. Tobin J. (1958).

Introduction lconomtrie des variables qualitatives  337

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 338

le modle censur et le modle tronqu (modle Tobit simple) qui font


seuls lobjet dune prsentation dans le cadre de ce manuel,
le modle de slection (modle Tobit gnralis),
le modle avec censure et slection.

A. Le modle Tobit simple :


modle de rgression tronqu ou censur
Dfinitions prliminaires :
Une distribution est tronque si les valeurs de la variable expliquer et des
variables explicatives ne sont pas observables lorsque les valeurs de la
variable expliquer dpassent un intervalle.
Une distribution est censure si seules les valeurs de la variable expliquer
ne sont pas connues lorsquelles sortent dun intervalle.
Soit une variable latente yi donc non systmatiquement observable et des
variables explicatives xi , le modle scrit de manire classique comme dans le
cas des modles choix discrets : yi = xi a + i avec :
xi la matrice des valeurs des variables explicatives,
a les coefficients du modle,
i le terme derreur avec i (N (0,2 ) et donc yi N (xi a,2 ) .
Les valeurs observes de la variable explicative yi sont donnes par :


yi = yi si yi > 0
yi = 0 si yi  0

Lorsque les valeurs de yi sont nulles ou ngatives, yi est gale 0 mais lon
connat nanmoins les valeurs des variables explicatives. Les donnes dans ce
type de modle sont dites censures gauche, yi suit alors une loi normale censure.
Comme pour les moindres carrs ordinaires :
E(yi ) = xi a mais E(yi /yi > 0) =
/ xi a et E(yi ) =
/ xi a .

En effet, calculons lesprance de yi dans le cas dun modle censur


gauche, non pas 0, mais une valeur seuil gale c1 , le modle scrit :


yi = yi si yi > c1
yi = c1 si yi  c1

y = xi a + i avec i N (0,2 ) .

338  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 339

Lesprance a pour expression :


E(yi ) = Prob(yi = c1 ) E(yi /yi = c1 ) + Prob(yi > c1 ) E(yi /yi > c1 )

Soit la fonction de rpartition de la loi de probabilit des erreurs (normale ou logistique) et la fonction de densit associe. Nous avons :



c1 xi a
yi xi a
c1 xi a
=






1
ci xi a
c1 xi a
Prob(yi > c1 ) = Prob(yi = y1 ) =
=1

Prob(yi = c1 ) = Prob(yi  c1 ) = Prob

E(yi /yi = c1 ) = c1


[(c1 xi a)/ ]

E(yi /yi > c1 ) = E(yi /yi > c1 ) = xi a +


=
/ xi a
1 [(c1 xi a)/ ]

Soit :

E(yi ) =

c1 xi a




c1 xi a
c1 + 1



[(c1 xi a)/ ]
xi a +
=
/ xi a
1 [(c1 xi a)/ ]

[4]

Le recours la mthode des moindres carrs nest donc pas possible.


Le modle de Tobit peut alors scrire de la manire suivante.
En posant yi = x a le modle estim de la variable latente et en effectuant les
termes du deuxime membre de [4] et aprs simplification, nous obtenons lcriture suivante :
yi = c1 ((c1 yi )/ ) + (1 ((c1 yi )/ ) > 0)
( yi (1 ((c1 yi )/ )) + (((c1 yi )/ )))

[5]

Plus gnralement, et par extension, il est possible de formaliser un modle


de Tobit avec censure gauche et censure droite tel que :


yi = c1
yi = yi
yi = c2

si yi  c1
si c1 < yi  c2
si c2 < yi

Avec c1 et c2 deux valeurs numriques qui reprsentent les seuils de censure,


lune de ces valeurs peut tre gale , si il nexiste pas de seuil droite ou
gauche.
Dans le cas particulier o c1 = 0 et c2 = , nous retrouvons le modle canonique de Tobit.

Introduction lconomtrie des variables qualitatives  339

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 340

Le modle de Tobit deux seuils scrit laide dune dmonstration analogue la prcdente :
yi = x a
yi = c1 ((c1 yi )/ ) + c2 (1 ((c2 yi )/ ))
+ ( ((c2 yi )/ ) ((c1 yi )/ ) > 0)
( yi ( ((c2 yi )/ ) ((c1 yi )/ )) +
(((c2 yi )/ ) + ((c1 yi )/ )))

[6]

B. Estimation et interprtation des rsultats


La mthode des moindres carrs ordinaires nest pas adapte du fait de lapparition frquente, dans les observations de la variable expliquer, des valeurs
seuils. Lestimation des paramtres ( a et ) du modle est effectue laide dun
algorithme de maximisation de la fonction de la Log-vraisemblance.
Les rsultats destimation sapprcient directement par la significativit des
coefficients laide des ratios appels z -Statistique.
Les valeurs des coefficients du modle estim sont directement interprtables
en termes de propension marginale sur yi , du fait de la continuit dans lintervalle des seuils de la variable expliquer.

Exercice n 3
fichier C12EX3

Prvision de la demande dlectricit pour un fournisseur capacit


limite
Dans le cadre de louverture du march de llectricit destination des industriels,
un fournisseur dlectricit, qui nest pas loprateur historique, propose de lnergie
lectrique bas prix dans la limite de ses capacits fixes 3 000 mgawatts : la demande suprieure ce seuil ne peut donc pas tre servie.
Au-del de ses capacits les clients sont dlests et sont donc dans lobligation de
basculer vers une autre source. La demande (yt ) exprime en mgawatts la priode t
est fonction de trois facteurs explicatifs :
x1t = indicateur dcart de prix par rapport la concurrence en t, la valeur indique
le % de rduction, pour le jour considr, accord par loprateur historique (si 0 pas de
rduction de prix),
x2t = nombre de clients industriels aliments en t,
x3t = variable indicatrice signalant les jours particuliers forte consommation tels
que le lendemain de jour fri,

340  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 341

Soit les donnes quotidiennes sur 60 jours (cf. un extrait dans le tableau 3) dont cet
oprateur dispose.
Tableau 3 Extrait de donnes
Jour
1
2

59
60
61
62

y
2717
2126

2683
3000

x1
0
0

0,1
0
1
0

x2
61
32

61
79
98
60

x3
0
0

0
0
1
0

On demande :
1) destimer un modle Logit permettant de prvoir la demande quotidienne partir des
facteurs explicatifs proposs et de commenter les rsultats ;
2) de comparer les rsultats avec lestimation par la mthode, non adapte, des moindres
carrs ordinaires ;
3) deffectuer une prvision pour les jours 61 et 62 sachant que :
x1,61 = 1 ; x2,61 = 98 ; x3,61 = 1 et x1,62 = 0 ; x2,62 = 60 ; x3,62 = 0.
Solution
1) La consommation est censure car les valeurs de la variable expliquer (la demande)
ne sont pas connues lorsquelles sortent de lintervalle [0 ; 3 000] puisque au-del de
3 000, la demande ne peut tre satisfaite.

Figure 1 Fentre de paramtrage pour un modle Tobit (logiciel Eviews)

Introduction lconomtrie des variables qualitatives  341

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 342

Pour estimer le modle Tobit, le logiciel Eviews (cf. figure 1) permet de paramtrer
les seuils de censure gauche (c1 = 0) et droite (c2 = 3 000) et de choisir la distribution de lerreur (ici normale). Nous ne slectionnons donc pas loption distribution tronque puisque la distribution est censure.
Les rsultats destimation sont les suivants :

Dependent Variable : Y
Method: ML Censored Normal (TOBIT) (Quadratic hill climbing)
Included observations: 60 after adjustments
Left censoring (value) series: 0
Right censoring (value) series: 3000
Coefficient

Std. Error

z-Statistic

Prob.

X1
X2
X3
C

27.69316
20.50361
186.2357
1473.642

7.582649
3.652175
0.480937
42.63261
34.88046
5.339256
23.60984
62.41642
Error Distribution

0.0003
0.0000
0.0000
0.0000

SCALE: SIG
R-squared
S.E. of regression
Sum squared resid
Log likelihood
Avg. log likelihood
Left censored obs
Uncensored obs

47.41983
0.981952
46.09561
116864.3
275.6572
4.594286
0
52

4.617038
10.27062
Mean dependant var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter

0.0000
2542.667
9.355239
9.529768
9.423507

Right censored obs


Total obs

8
60

a) Interprtation statistique
Les coefficients sont tous significativement diffrents de 0 (les probabilits critiques
des coefficients sont toutes infrieures 0,05), le modle est valid sur le plan statistique.
Eviews indique, sur lavant dernire ligne, le nombre de donnes censures : 0
gauche et 8 droite.
b) Interprtation conomique
Lindicateur dcart de prix agit ngativement sur la demande : en cas de rduction
tarifaire de la concurrence, la demande diminue.
Le nombre de clients connects au rseau et la variable muette type de jour ont
un effet positif sur la demande.
La variable dchelle (estimateur de ) est gale 47,41.
Les coefficients ont bien le signe attendu, le modle est valid sur le plan conomique.
Le modle Tobit scrit daprs [6] :
yt = 27,69 x1t + 20,50 x2t + 186,23 x3t + 1473,64

342  CONOMTRIE

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 343

yt = 0 ((0 yt )/47,41) + 3000 (1 ((3000 yt )/47,41))


+ ( ((3000 yt )/47,41) ((0 yt )/47,41) > 0)
( yt ( ((3000 yt )/47,41) ((0 yt )/47,41))
+ 47,41 (((3000 yt )/47,41) + ((0 yt )/47,41)))
avec la fonction de rpartition de la loi normale et la fonction de densit associe.
Les graphiques (cf. graphique 4) de la srie brute et de la srie ajuste prsentent la qualit de lajustement : les valeurs sont limites par le seuil maximum, soit 3 000 mgawatts.
3300

3000

2700

2400

2100

1800

1500

10

13

16

19

22

25

28

Demande

31

34

37

40

43

46

49

52

55

58

Demande ajuste

Graphique 4 Sries brute et ajuste de la variable (yt ) demande (Modle Tobit)


2) Lapplication de la mthode des moindres carrs ordinaires conduit aux rsultats suivants :
Dependent Variable : Y
Method: Least Squares
Included observations: 60 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

X1
X2
X3
C

31.95356
17.83772
156.0019
1594.516

11.44578
0.659615
60.45055
34.80522

2.791732
27.04260
2.580653
45.81254

R-squared
Sum squared resid

0.941213
380662.1

F-statistic
Prob(F-statistic)

Prob.
0.0072
0.0000
0.0125
0.0000
298.8649
0.000000

Les coefficients du modle, tous significativement diffrents de 0, sont biaiss. Nous


constatons que les valeurs estimes des coefficients sont lgrement diffrentes, bien que
de mme signe, de celles des valeurs estimes laide du modle Tobit.

Introduction lconomtrie des variables qualitatives  343

9782100721511-Bourbo-C12.qxd

22/10/14

10:29

Page 344

Les graphiques (cf. graphique 5) de la srie brute et de la srie ajuste indiquent que
lutilisation de la mthode des MCO peut fournir des valeurs estimes parfois suprieures
3 000 mgawatts ce qui est techniquement impossible.
3300

3000

2700

2400

2100

1800

1500

10

13

16

19

22

25

28

31

Demande

34

37

40

43

46

49

52

55

58

Demande ajuste

Graphique 5 Sries brute et ajuste de la variable (yt )


demande (Mthode MCO)
3) Le calcul de la prvision pour les jours 61 et 62 est directement effectu par application du modle Tobit estim.
Sachant que :
x1,61 = 1 ; x2,61 = 98 ; x3,61 = 1 et x1,62 = 0 ; x2,62 = 60 ; x3,62 = 0.
La prvision pour le jour 61 est donne par :

= 27,69 1 + 20,50 98 + 186,23 1 + 1473,64 = 3641,53


y61

> c2 y61 = c2 = 3 000


y61

La prvision pour le jour 62 est donne par :

y62
= 27,69 0 + 20,50 60 + 186,23 0 + 1473,64 = 2703,85

c1 < y62
< c2 y62 = y62
= 2703,85

Le calcul de la prvision laide du modle estim par la mthode des MCO conduit
des rsultats lgrement diffrents comme lillustre le tableau 4.
Tableau 4 Comparaison des prvisions par le modle Tobit
et par la mthode des MCO

344  CONOMTRIE

Jour

Modle Tobit

MCO

61

3000

3544,63

62

2703,86

2687,26

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 345

13. Introduction

lconomtrie
des donnes
de panel

ans le chapitre 1 nous avons prsent les donnes de panel


comme tant des modles dans lesquels les variables reprsentent les valeurs prises par un chantillon dindividus intervalle
de temps rguliers. En conomtrie nous pouvons nous intresser des
donnes temporelles ou des donnes en coupe instantane, les donnes de panel mlangent les deux dimensions : sries temporelles et donnes en coupe. Les exemples sont nombreux : estimation conomtrique
entre les exportations et louverture commerciale sur 20 ans (le temps) et
15 pays (les individus), le revenu dun chantillon de mnages sur plusieurs annes, lvolution du chiffre daffaires de 30 grandes surfaces sur
36 mois Lintrt de cette spcification rside dans la prise en compte
dun effet temporel et dun effet individuel.
Les individus sont lunit statistique observe (consommateur, entreprise,
rgion, pays, etc.) intervalle de temps rgulier.
Dans ce chapitre, qui constitue une simple introduction lconomtrie
des donnes de panel1, nous prsentons la section I les modles donnes de panel et la mthode destimation SUR ; puis en section II, les tests
dhomognit permettant de dterminer la structure du panel. Enfin la
section III traite des panels effets fixes et alatoires, des mthodes destimation et du test dHausman de spcification des effets individuels.

1. Le lecteur dsirant approfondir ce chapitre peut se rfrer Sevestre P. 2002.

Introduction lconomtrie des donnes de panel  345

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 346

I. Prsentation des modles donnes


de panel

A. Spcificits des donnes de panel


1) Dfinitions prliminaires
Les donnes de panel (ou donnes longitudinales) sont reprsentatives dune
double dimension : individuelle et temporelle. Un panel quilibr (balanced
panel) a le mme nombre dobservations pour tous les individus, un panel dsquilibr (unbalanced panel) est un panel o il manque des observations pour
certains individus.

2) Exemple introductif
Prenons un exemple introductif trs simple, un panel compos de 2 individus
( N = 2) et connu sur 3 priodes (T = 3 ), soit un total de N T = 6 observations k = 2 variables explicatives.
Le modle gnral scrit :
yit = a0i + a1i x1it + a2i x2it + it ,
yit = variable endogne observe pour lindividu i la priode t ,
x1it, x2it = variables explicatives observes pour lindividu i linstant t ,
a0i = terme constant pour lindividu i ,
a1i ,a2i = coefficients des 2 variables exognes pour lindividu i ,
it = terme derreur pour lindividu i la priode t.

Soit en lcrivant pour lensemble des 6 observations1 :




Individu n 1


Individu n 2

y11 = a01 + a11 x111 + a21 x211 + 11


y12 = a01 + a11 x112 + a21 x212 + 12
y13 = a01 + a11 x113 + a21 x213 + 13
y21 = a02 + a12 x121 + a22 x221 + 21
y22 = a02 + a12 x122 + a22 x222 + 22
y23 = a02 + a12 x123 + a22 x223 + 23

1. Nous constatons que nous avons 6 observations et 6 paramtres estimer, lobjectif de cet
exemple est simplement dillustrer lcriture dun modle en panel

346  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 347

Sous forme matricielle le modle scrit :


y11
1
y 1
12

y13 1
=
y 0
21

y22 0
y23
0

0
0
0
1
1
1

0
0
0

x111
x112
x113
0
0
0


a01
11
a
02 12

a11 13
+

x221
a12 21

x222 a21 22

x211
x212
x213
0
0
0

x121
x122
x123

0
0
0

x223

a22

23

Si les hypothses classiques sur les erreurs sont respectes (homoscdasticit et


indpendance temporelle) et quelles sont indpendantes dun individu lautre
/ j ), nous pouvons appliquer la mthode des moindres
(Cov(it ,jt ) = 0 pour i =
carrs pour chacune des N quations relatives aux individus. Dans le cas o
/ 0 pour
lhypothse dindpendance entre les individus (Cov(it , jt ) = i2j =
i=
/ j ) nest plus vrifie, lestimateur des MCO nest plus BLUE, nous devons
appliquer la mthode SUR (Seemingly Unrelated Regressions) de Zellner.

B. La mthode SUR
La mthode SUR, Seemingly Unrelated Regressions, de Zellner (1962) est utilise
lorsque les erreurs des quations individuelles sont corrles : la covariance indivi/ 0 pour i =
/ j . Les individus sont alors interdpendants.
duelle Cov(it , jt) = i2j =
a SU R = (X  1 X)1 (X  1 Y )
Cette mthode consiste appliquer les MCG : 

Avec

12 I

I
21
=
(N T,N T )
...

N 1 I

12 I
22 I
...
N 2 I

. . . 1N I

. . . 2N I

, chaque lment i j I tant de


... ...
...

N2 I

dimension (T,T ) .
Pratiquement, la procdure est la suivante :
Estimation par les MCO des N quations individuelles.
Calcul des N rsidus eit .
T


i2 =
Calcul des 

t=1

eit2

T


i j =
et 

eit ejt

t=1

1 X)1 (X 
1 Y ) .
a SU R = (X 
Application des MCG : 

Si les erreurs sont, de plus, autocorrles dans le temps, la correction peut


seffectuer par une des mthodes prsentes au chapitre 5.

Introduction lconomtrie des donnes de panel  347

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 348

La mthode destimation SUR prsente lavantage de prendre en compte


lhtrognit individuelle par lintgration de la dpendance entre les individus mais prsente linconvnient surtout si le nombre dobservations temporelles T est faible dun grand nombre de paramtres estimer : N (k + 1)
coefficients et N (N + 1)/2 lments de la matrice .
Les modles effets individuels fixes ou alatoires permettent de trouver un
compromis entre le nombre de paramtres estimer et lintgration de lhtrognit individuelle.

C. Le modle linaire simple


Le modle en donnes de panel peut scrire pour N individus (i = 1,,N ) et
T observations temporelles (t = 1,,T ) , soit n = N T observations totales,
de la manire suivante :
yit = a0i + ai xit + it .
yit = variable endogne observe pour lindividu i la priode t ,
xit = vecteur des k variables exognes xit = (x1it ,x2it ,. . . ,xkit ) ; xkit est donc la
valeur observe pour la k e variable exogne pour lindividu i linstant t,
a0i = terme constant pour lindividu i ,
ai = vecteur des k coefficients des k variables exognes ai = (a1i ,a2i ,. . . ,aki ) ,
it = terme derreur.

partir de cette spcification gnrale nous pouvons envisager quatre possibilits.


Cas n 1 : homognit totale.
Les constantes a0i et les coefficients ai sont tous identiques pour tous les individus, nous avons a0i = a0 et ai = a  pour toutes les valeurs de i . Le modle ne
comporte quune seule quation estime sur n = N T observations empiles
par les MCO (ou les MCG selon la structure de la matrice des variances et covariances des erreurs).
Cas n 2 : htrognit totale.
Les constantes a0i et les coefficients ai sont tous diffrents pour toutes les
valeurs de i , la structure en panel est rejete. Le modle doit tre estim quation par quation pour les N quations (une quation par individu) par les MCO
(ou les MCG selon la structure de la matrice des variances et covariances des
erreurs).
Cas n 3 : htrognit des coefficients des variables explicatives et homognit des termes constants.
Les constantes a0i sont toutes identiques ( a0i = a0 ) pour les individus, mais les
coefficients ai des variables explicatives sont diffrents pour chaque individu.

348  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 349

Comme au cas n 2, le modle doit tre estim sur les N quations (une quation par individu) par les MCO (ou les MCG selon la structure de la matrice des
variances et covariances des erreurs).
Cas n 4 : htrognit des termes constants et homognit des coefficients
des variables explicatives le modle effets individuels.
Les constantes a0i sont diffrentes pour les individus, mais les coefficients ai des
variables explicatives sont constants pour les individus ( ai = a  ). Ce modle est
appel modle effets individuels et nous le prsenterons la section III.

II. Les tests dhomognit


A. Procdure squentielle de tests
Le choix de la spcification (homognit, htrognit) est donc trs important. Afin de dterminer la structure du panel, Hsiao (1986) propose une procdure squentielle de tests (cf. graphique 1) permettant de dfinir le cas dans
lequel nous nous situons.
Test H1O : a0i =

H1O
Test

rejete

H O2 : a' = a'i i

a0 et a' = a'i i

H10

vraie

Cas n1 : Homognit totale

yit = a0 + a ' xit + it

H 02

H 02

rejete

Cas n2 : Htrognit totale


yit = a0i + ai' xit + it

vraie

Test

H 30

rejete

Cas n4 : Modle effets individuels


'

yit = a0i + a xit + it

H 3O : a0i = a0 i

H 30

vraie

Cas n1 : Homognit totale

yit = a0 + a ' xit + it

Graphique 1 Procdure squentielle des tests

Introduction lconomtrie des donnes de panel  349

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 350

B. Construction des tests


Les tests dhypothse sont construits partir des statistiques de Fisher (test de
Wald de restrictions sur les coefficients).

1) Test H10 : a0i = a0 et a  = ai

Ce test dhypothses jointes se ramne un test de Fisher dont la statistique est


donne par :
F1 =

(SC Rc1 SC R)/N 1)(k + 1)


SC R/(N T N (k + 1))

SC Rc1 = somme des carrs des rsidus du modle contraint sous lhypothse
H10 , soit estimer par les MCO le modle en empilant toutes les observations. Le
degr de libert est gal : ( N T = nombre total dobservations)
(k + 1 = nombre de coefficients estimer).
SC R = somme des carrs des rsidus du modle non contraint, elle est gale
la somme des N sommes des carrs des rsidus des modles estims sur les T

observations de chaque quation individuelle, soit SCR =

N


SCRi . Le degr de

i=1

libert est donc la somme des N degrs de libert de chaque quation estime,
soit ddl =

N

(T (k + 1)) = N T N (k + 1) .
i=1

Le degr de libert du numrateur est donc gal la diffrence des degrs de


libert de SCRc1 et SCR :
ddln = [(N T )(k + 1)][(N T )N (k + 1)] = (N 1)(k + 1)

La statistique F1 est comparer la valeur lue dans la table de Fisher aux

degrs de libert du numrateur et du dnominateur. Si F1 > Fddln;ddld


, nous reje1
tons lhypothse H0 au seuil .

2) Test H20 : a  = ai

Ce test dhypothses jointes se ramne au test de Fisher dont la statistique est


donne par :
F2 =

(SC Rc2 SC R)/((N 1) k)


SC R/(N T N (k + 1))

SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse
H20 , soit estimer le modle effets fixes individuels. Le degr de libert est gal

350  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 351

( N T = nombre dobservations) (k + N = nombre de coefficients estimer), nous estimons k coefficients et N termes constants.
SC R = somme des carrs des rsidus du modle non contraint. Le degr de
libert du numrateur est donc gal :
ddln = [(N T )(k + N )][(N T )N (k + 1)] = (N 1) k

La statistique F2 est comparer la valeur lue dans la table de Fisher aux

degrs de libert du numrateur et du dnominateur. Si F2 > Fddln;ddld


, nous rejetons lhypothse H20 au seuil .

3) Test H30 : a0i = a0 i


Ce test dhypothses jointes se ramne au test de Fisher dont la statistique est
donne par :
F3 =

(SC Rc1 SC Rc2 )/(N 1)


SC RC2 /(N (T 1) k)

SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 .
SC Rc1 = somme des carrs des rsidus du modle contraint sous lhypothse
H10 . Le degr de libert du numrateur est donc gal :
ddln = [(N T )(k + 1)][(N T )(k + N )] = N 1

La statistique F3 est comparer la valeur lue dans la table de Fisher aux degrs

, nous rejetons
de libert du numrateur et du dnominateur. Si F3 > Fddln;ddld
3
lhypothse H0 au seuil .

Exercice n 1

fichier C13EX1 = donnes en panel


C13EX1-E = donnes empiles

Procdure squentielle des tests dhomognit


Nous nous intressons lvolution des dpenses dducation sur 25 ans (variable
expliquer note y ) pour neuf pays. Les facteurs explicatifs proposs sont :
x 1it = volution des dpenses militaires en milliers de dollars pour le pays i lanne t ,
x 2it = volution du PIB (Produit intrieur brut) en milliers de dollars pour le pays
i lanne t .
Les variables sont toutes connues sur 25 ans.

Introduction lconomtrie des donnes de panel  351

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 352

Le modle tudier est donc :

yit = a0i + a1i x1it + a2i x2it + it pour i = 1,. . . ,N et t = 1,. . . ,T


avec N = 9 pays et T = 25 annes, le nombre total dobservations est donc
n = N T = 225 .
yit = volution des dpenses dducation en milliers de dollars pour le pays i
lanne t ,
it = erreur de spcification pour le pays i lanne t , ces erreurs rpondent aux
hypothses classiques (homoscdasticit et indpendance temporelle) et sont indpen/ j ).
dantes dun individu lautre (Cov(it , jt ) = 0 pour i =
Un extrait des donnes est prsent au Tableau 1.
Tableau 1 Extrait des donnes de lvolution en dpenses dducation, militaires et
du PIB pour 9 pays sur 25 ans
Pays

Anne

yit

x1it

x2it

512

3,15

25,92

687

5,32

22,51

24

2 166

6,29

19,76

25

1 214

11,62

19,76

74

8,47

35,99

67

11,37

17,8

24

2,66

12,43

25

4,11

11,13

419

5,81

13,61

10238

7,02

3,27

24

1 939

12,83

14,27

25

2 254

16,7

14,14

23

6,05

8,77

24

28

4,84

12,96

25

170

3,87

12,83

On demande dappliquer la stratgie des tests dhomognit afin de dterminer la


structure du panel.

352  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 353

Solution
Nous commenons par tester lhypothse H10 : a0i = a0 et a  = ai

i.

Soit calculer : SC Rc1 = somme des carrs des rsidus du modle contraint sous
lhypothse H10 , nous estimons par les MCO le modle en empilant toutes les observations (fichier de donnes C13EX1-E).
Les rsultats sont les suivants :
Dependent Variable: Y
Method: Least Squares
Included observations: 225
Variable

Coefficient

Std. Error

t-Statistic

Prob.

146.2167
29.32698
21.51258

138.0735
13.82629
11.47806

1.058977
2.121103
1.874234

0.2908
0.0350
0.0622

C
X1
X2

SC Rc1 = 233 782 555,085 ; degr de liberts = 2253 = 222.


Puis calculer SC R = somme des carrs des rsidus du modle non contraint, elle
est gale la somme des 9 sommes des carrs des rsidus des modles estims sur les
N

SC Ri .
quations individuelles, soit SC R =
i=1

Les rsultats sont les suivants, le programme Eviews est en tlchargement


(C13EX1.PRG) :
Pays

Somme des carrs des rsidus

2 757 341

211 063,8

84 306 563

82 876 299

150 121,7

7 419 022

2 771 928

2 793 154

297 885,1

Total SCR

183 583 378

titre dexemple, lestimation pour le deuxime pays (individu n 2) est la suivante :

Introduction lconomtrie des donnes de panel  353

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 354

Dependent Variable: Y
Sample: 26 50
Included observations: 25
Variable

Coefficient

Std. Error

t-Statistic

C
X1
X2

58.36178
0.180573
0.506402

47.94892
6.411318
2.722052

1.217166
0.028165
0.186037

Sum squared resid

211 063,8

Prob.
0.2364
0.9778
0.8541

Degr de libert = 25 3 = 22

SC R = 183 583 378,162 ; degr de liberts = 9 (253) = 198 .


(SC Rc1 SC R)/(N 1)(k + 1)
(233 782 555,08 183 583 378,162)/24
F1 =
=
SC R/(N T N (k + 1)
183 583 378,162/198
=

2 091 632,372
0,05
= 2,25 , F1 > F24;198
= 1,52 , nous rejetons lhypothse H10 .
927 188,778 6

Nous nous dirigeons vers la branche de gauche du graphique 1, soit tester : H20 :
a = ai
i.


Nous calculons SC Rc2 = somme des carrs des rsidus du modle contraint sous
lhypothse H20 , soit estimer le modle effets fixes individuels (la mthode destimation sera tudie la section III, fichier de donnes C13EX1).
Dependent Variable: Y?
Method: Pooled Least Squares
Sample: 1 25
Included observations: 25
Cross-sections included: 9
Total pool (balanced) observations: 225
Variable
C
X1?
X2?
Fixed Effects (Cross)
_1-C
_2-C
_3-C
_4-C
_5-C
_6-C
_7-C
_8-C
_9-C

354  CONOMTRIE

Coefficient
654.9109
49.50377
22.17142
49.20967
438.3058
1 157.176
102.6206
409.4617
794.9591
273.2759
501.3735
481.5489

Std. Error
181.7605
23.64297
11.02105

t-Statistic
3.603153
2.093805
2.011733

SC Rc2 = 195 511 374,365

Prob.
0.0004
0.0375
0.0455

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 355

Le degr de libert de ce modle est de 225 2 9 = 214 , car la constante a0 = C


= 654,91 est la moyenne des 9 coefficients des effets fixes.
(SC Rc2 SC R)/(N 1) k
(233 782 555,08 195 511 374,365)/16
=
F2 =
SC R/(N T N (k + 1)
183 583 378,162/198
74 599,762 7
0,05
= 0,804, F2 > F7;198
= 1,90 , nous acceptons lhypothse H20 . Nous
927 188,778 6
nous dirigeons donc vers la branche de droite du graphique 1.

Test H30 : a0i = a0

i
(SC Rc1 SC Rc2 )/(N 1)
Soit calculer la statistique : F3 =
dont nous connaisSC RC2 /(N (T 1) k)
sons tous les lments.
F3 =

(233 782 555,08 195 511 374,365)/8


4 783 897,589
=
= 5,24 ,
195 511 374,365/213
917 893,776 4

0,05
F3 > F8;213
1,90 nous rejetons lhypothse H03 .

Le panel une structure effets individuels.

III. Spcifications et estimations des modles


effets individuels
Les modles effets individuels supposent que les modles estims ne diffrent par
individu que par la valeur de la constante a0i = a0 + ai . Nous allons distinguer deux
cas : les modles effets fixes (leffet individuel est constant au cours du temps) et
les modles effets alatoires (le terme constant est une variable alatoire).
Les modles effets individuels peuvent tre transposs au modle effets
temporels, la constante scrit alors a0t = a0 + at (cf. Sevestre P., 2002).

A. Le modle effets fixes individuels


Le modle en donnes de panel effets fixes individuels peut scrire de la
manire suivante :
yit = a0i + a  xit + it
yit = variable endogne observe pour lindividu i la priode t,
xit = vecteur des k variables exognes xit = (x1it ,x2it ,. . . ,xkit ) ; xkit est donc la
valeur observe pour la ki e variable exogne pour lindividu i linstant t,
a0i = terme constant pour lindividu i ,
a  = vecteur des k coefficients des k variables exognes, a  = (a1 ,a2 ,. . . ,ak ) ,
it = terme derreur.

Introduction lconomtrie des donnes de panel  355

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 356

La mthode destimation des paramtres va dpendre de la structure des


termes derreurs :
Si les erreurs sont homoscdastiques, non autocorrles dans la dimension
/ t  et dans la dimension individuelle
temporelle Cov(it ,it  ) = 0 pour t =
/ j : mthode des Moindres Carrs Ordinaires
Cov(it ,jt ) = 0 pour i =
(MCO) sur les variables indicatrices (en anglais LSDV = Least Square
Dummy Variable) ou sur les estimateurs Within.
Si les erreurs sont htroscdastiques et/ou autocorrles dans la dimension temporelle mais indpendantes dans la dimension individuelle :
mthode des Moindres Carrs Gnraliss (MCG) sur les variables indicatrices (LSDV) ou sur les estimateurs Within.

1) Estimateur LSDV
Lestimateur LSDV consiste appliquer la mthode des MCO sur le modle
avec variables indicatrices spcifiques pour chacun des N individus. Nous
construisons donc N variables indicatrices tel que : Di = 1 pour lindividu i et
0 pour les autres.
Le modle scrit : yit + a0 + a01 D1 + a02 D2 + . . . + a0N D N + a  xit + it
Pratiquement, nous estimons le modle sans la constante1 a0 :
yit = a1 D1 + a2 D2 + . . . + a N D N + a  xit + it par les MCO ou les MCG si les
erreurs sont htroscdastiques ou/et autocorrles.
Nous pouvons ensuite calculer les coefficients a0i = a0 + ai du modle initial, la valeur de la constante a0 tant gale la moyenne des coefficients ai estims.

2) Estimateur Within
Lestimateur Within (estimateur intra-individuel) consiste centrer pralablement toutes les variables expliquer et explicatives sur leurs moyennes individuelles et appliquer la mthode des MCO (ou MCG si les erreurs sont htroscdastiques ou autocorrles) sur le modle ainsi transform :
(yit y i ) = a  (xit x i ) + it pour i = 1,. . . ,N et t = 1,. . . ,T .

Aprs lestimation des coefficients a  les coefficients fixes individuels a0i sobtiennent par les relations : a 01 = y 1 a  x 1 ; a 02 = y 2 a  x 2 ; ; a 0N = y N a  x N
Nous calculons ensuite les coefficients a0i = a0 + ai du modle initial
comme prcdemment.
Cette mthode destimation conduit exactement aux mmes rsultats que la
mthode LSDV.
1. Sinon, il y aurait alors colinarit entre le vecteur du terme constant (a0 ) et la somme des N
variables indicatrices, la matrice (X  X) serait alors singulire (non inversible).

356  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 357

B. Le modle effets alatoires


1) Prsentation du modle effets alatoires
Le modle effets alatoires suppose que la relation entre la variable expliquer
et les variables explicatives ne soit plus fixe mais alatoire, leffet individuel
nest plus un paramtre fixe a0i mais une variable alatoire.
Le terme derreur se dcompose de la manire suivante : it = a0i + t + vit
do le nom donn aussi ce type de modle : modle erreur compose (error
components model).
Les a0i reprsentent les effets individuels alatoires, la variable alatoire t
reprsente les effets temporels identiques pour tous les individus et enfin vit est
un terme derreur qui est orthogonal aux effets individuels et temporels.
En outre, nous faisons les hypothses suivantes concernant les variables alatoires a0i , t et vit : esprances nulles, homoscdasticits, indpendance temporelle et orthogonalit entre les trois composantes.
Dans le cas simple o leffet temporel nexiste pas (t = 0), le modle effets
alatoires individuels scrit alors : yit = a0 + a  xit + it avec it = a0i + vit .
Ou encore yit = a0 + a0i + a  xit + vit . Le coefficient a0 est un coefficient fixe
identique pour tous les individus.

2) Estimation du modle effets alatoires


La mthode destimation adquate est celle des MCG car la composante ala/ 0 . Nous avons donc une
toire a0i est prsente dans it et it  , do Cov(it , it  ) =
autocorrlation des erreurs (cf. Sevestre 2002).
On dmontre que lestimateur des MCG se ramne une moyenne pondre
des estimateurs Within (prsent prcdemment) et Between. Lestimateur
a Bet ) est lestimateur des MCO appliBetween (estimateur inter-individuel not 
qu sur le modle dont les donnes sont les N moyennes individuelles des
variables expliquer et explicatives :
y i = a0 + a0i + a  x i + v i pour i = 1,. . . ,N .

a MC G = 
a Bet + (1 )
a L S DV
Lestimateur des MCG1 est donn par : 
La valeur des poids  , une matrice de dimension (k,k), est inversement proa Bet .
portionnelle la matrice des covariances de 
Lintroduction deffets individuels alatoires permet donc de combiner une
spcification intermdiaire entre le modle sans effet individuel et le modle
avec effets fixes. La structure du panel nest ni totalement homogne, ni totalement htrogne.
1. On dmontre aussi que lestimateur des MCO sur les donnes empiles se ramne aussi une
moyenne pondre des estimateurs Within et Between.

Introduction lconomtrie des donnes de panel  357

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 358

C. Effets fixes ou effets alatoires ? Le test dHausman


Le test dHausman (cf. chapitre 5) est un test de spcification qui permet de
dterminer si les coefficients des deux estimations (fixes et alatoires) sont statistiquement diffrents.
Sous lhypothse nulle H0 dorthogonalit entre les variables explicatives et
le terme derreur du modle effets alatoires, les deux estimateurs Within et
MCG sont des estimateurs non biaiss et dans ce cas il ne doit pas y avoir de
diffrence significative entre les estimations Within et MCG des diffrents coefficients. La mthode des MCG est alors retenue : le modle est effets alatoires.
Soit le test dhypothses :
a MC G = 0 le modle est effets alatoires
a L S DV 
H0 : 


/ 0 le modle est effets fixes
H1 : a L S DV a MC G =
Nous calculons la statistique :
H = (
a L S DV 
a MC G ) [Var(
a L S DV ) Var(
a MC G )]1 (
a L S DV 
a MC G )

La statistique H est distribue selon un chi-deux k degr de libert. Si


H > 2 (k) pour un seuil a % fix, nous rejetons lhypothse H0, lestimateur
LSDV (Within) est non biais, nous rejetons alors la spcification effets alatoires et nous choisissons un modle effets fixes individuels.

Exercice n 2

fichiers C13EX1, C13EX1-E

Estimation du modle effets fixes individuels et effets alatoires


individuels, estimateur Between, test dHausman
En reprenant le modle et les donnes de lexercice n 1, on demande :
1) Destimer le modle effets fixes individuels.
2) Destimer le modle effets alatoires individuels.
3) De calculer lestimateur Between.
4) De procder au test dHausman.
Solution
1) Nous crons les neuf variables indicatrices relatives chacun des pays et nous procdons lestimation par les MCO du modle (hors terme constant) sur les donnes empiles (fichier C13EX1-E) :

358  CONOMTRIE

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 359

yt = a1 x1t + a2 x2t + b1 D1t + b2 D2t + . . . + b9 D9t + t


Soit le rsultat suivant :
Dependent Variable: Y
Sample: 1 225
Included observations: 225
Variable

Coefficient

Std. Error

t-Statistic

Prob.

X1

49.50377

23.64297

2.093805

0.0375

X2

22.17142

11.02105

2.011733

0.0455

DUM1

704.1205

240.8149

2.923907

0.0038

DUM2

216.6050

250.8295

0.863555

0.3888

DUM3

1 812.087

340.8004

5.317151

0.0000

DUM4

757.5315

227.2174

3.333951

0.0010

DUM5

245.4491

232.6545

1.054994

0.2926

DUM6

1 449.870

429.0331

3.379390

0.0009

DUM7

381.6349

224.4928

1.699987

0.0906

DUM8

153.5374

215.6064

0.712119

0.4772

DUM9

173.3620

234.4385

0.739477

0.4604

Nous calculons maintenant les coefficients ai = a0i a0 :


Pays

a0i

704,12

49,21

216,61

438,31

1 812,09

1 157,18

757,53

102,62

245,45

409,46

1 449,87

794,96

381,63

273,28

ai

153,54

501,37

173,36

481,55

Moyenne = a0

654,91

Nous retrouvons bien exactement les mmes rsultats que lors du calcul de la
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 de lexercice n 1 (fichier de donnes C13EX1, instruction Eviews : panel.ls(cx =f) y? x1? x2?).
2) Lestimation du modle effets alatoires individuels est effectue par linstruction
Eviews : panel.ls(cx =R) y? x1? x2?
Les rsultats sont les suivants :

Introduction lconomtrie des donnes de panel  359

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 360

Dependent Variable: Y?
Method: Pooled EGLS (Cross-section random effects)
Sample: 1 25
Included observations: 25
Cross-sections included: 9
Total pool (balanced) observations: 225
Cross-section SUR (PCSE) standard errors & covariance (d.f. corrected)
Variable
Coefficient
C
400.3119
X1?
9.907703
X2?
21.70457
Random Effect (Cross)
_1-C
_2-C
_3-C
_4-C
_5-C
_6-C
_7-C
_8-C
_9C

Std. Error
208.0501
22.74786
11.17599

t-Statistic
1.924112
0.435544
1.942071

Prob.
0.0556
0.6636
0.0534

76.20577
326.3516
729.8104
171.7304
279.7010
327.8098
109.6655
269.7585
320.0798

Nous observons que le modle effets alatoires conduit des estimations des coeficients trs diffrents du modle effets fixes, cela peut provenir dune corrlation entre
les effets individuels et les variables explicatives qui introduit un biais destimation lors
de lapplication de la mthode des MCG.
3) Lestimateur Between consiste estimer par les MCO le modle suivant :
y i = a0 + a0i + a  x i + v i
Les moyennes calcules sur les 25 annes pour les 9 individus sont prsentes au
tableau 2.
Tableau 2 Moyennes sur les 25 ans par pays

360  CONOMTRIE

Pays

yi

x 1i

x 2i

602,00

5,26

7,13

60,64

6,15

6,69

1 330,56

11,76

4,54

769,68

3,49

8,33

70,20

5,31

3,96

842,72

15,85

7,99

403,88

3,22

8,20

175,00

2,70

7,00

81,44

4,85

6,68

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 361

Les rsultats de lestimation Between (application des MCO sur les donnes du
tableau 2) sont les suivants avec pour variable expliquer y i :
Coefficients

cart-type

t-Statistique

Probabilit

Constante

125,65

694,52

0,183

0,86

x 1i

62,93

32,29

1,94

0,09

x 2i

29,41

92,22

0,318

0,76

4) Nous calculons la statistique dHausman :








H = ( a L S DV a MC G ) [Var( a L S DV ) Var( a MC G )]1 ( a L S DV a MC G )
Avec :







49,503
9,907
558,99 2,30



a L S DV =
; a MC G =
; Var( a L S DV ) =
;
22,171
21,704
2,30 121,46


361,49 0,566

Var( a MC G ) =
0,566 119,71




39,59
197,50 2,869




( a L S DV a MC G ) =
; [Var( a L S DV )Var( a MC G )] =
0,466
2,869 1,751



0,00518 0,8499
39,59
H = [ 39,59 0,466 ]
= 7,94 > 2 (2) pour un
0,8499
0,585
0,466
seuil de 5 % = 5,99.
Nous rejetons lhypothse H0, le modle est donc effets individuels fixes.
Le programme Eviews en tlchargement (C13EX2) permet de calculer directement
la statistique dHausman.

Introduction lconomtrie des donnes de panel  361

9782100721511-Bourbo-C13.qxd

22/10/14

10:30

Page 362

9782100721511-Bourbo-C14.qxd

04/11/14

7:42

Page 363

Liste des exercices


Chapitre 1

10

Exercice 1 Calcul dun coefficient de corrlation


Chapitre 2

Exercice 1 Gnration dune consommation alatoire

15

Exercice 2 Estimations des coefficients de rgression

20

Exercice 3 Test de coefficient et intervalle de confiance

29

Exercice 4 quivalence des tests et analyse de la variance


Exercice 5 Prvision dans un modle de rgression simple

36
41

Exercice 6 Comparaison de coefficients de rgression

43

Exercice 7 Apprendre manipuler les formules

44

Exercice 8 Apprendre utiliser les formules

45

Chapitre 3

Exercice 1 Mise sous forme matricielle dun modle


et calcul des coefficients de rgression

55

Exercice 2 Tests statistiques sur les coefficients et la variance de lerreur :


calcul des leviers et des rsidus studentiss
Exercice 3 Tests partir de lanalyse de la variance
Exercice 4 Dtection et correction de valeurs anormales
par variable indicatrice

64
69
76
78

Exercice 5 Intgration dune variable qualitative


Exercice 7 Prvision partir du modle linaire

79
83

Exercice 8 Tests de stabilit structurelle, test de spcification de Ramsey

87

Exercice 9 Estimation dun modle et tests de validit partir de


la connaissance de quelques lments statistiques

90

Exercice 6 tude de saisonnalit par variables indicatrices

Exercice 10 Test dune combinaison linaire de coefficients de rgression


(test de contrainte linaire)
Exercice 11 Reconstitution dinformations manquantes

93
95

Liste des exercices  363

9782100721511-Bourbo-C14.qxd

22/10/14

10:31

Page 364

Exercice 12 Modle deux rgimes : estimation par variable muette


ou par analyse de la variance

96

Exercice 13 Estimation dune fonction de production : impact de la


privatisation

97

Exercice 14 Fonction conomtrique dinvestissement

101

Chapitre 4

Exercice 1 Calcul des coefficients de corrlation partielle du premier ordre


et du deuxime ordre

109

Exercice 2 Relation entre coefficients de corrlation simple, partielle


et multiple

113

Exercice 3 Consquences de la multicolinarit

114

Exercice 4 Tests de multicolinarit

117

Exercice 5 Mthodes de slection de variables explicatives

121

Chapitre 5

Exercice 1 Tests dindpendance des erreurs

131

Exercice 2 Procdures destimation en cas dautocorrlation


des erreurs dordre 1

139

Exercice 3 Correction de lhtroscdasticit


lorsque les donnes reprsentent des moyennes

144

Exercice 4 Tests de dtection dune htroscdasticit et correction

147

Exercice 5 Test dexognit dHausman, modle erreurs sur


les variables : la technique des variables instrumentales

158

Exercice 6 Prvision de part de march

160

Exercice 7 Un peu de rflexion conomtrique...

162

Chapitre 6

Exercice 1 Estimation dune fonction de production de type Cobb-Douglas

165

Exercice 2 Estimation des paramtres dun modle de diffusion


Logistique et de Gompertz

172

Exercice 3 Estimation des paramtres dune fonction de production


de type CES

174

364  CONOMTRIE

9782100721511-Bourbo-C14.qxd

04/11/14

7:43

Page 365

Chapitre 7
Exercice 1 Estimation des paramtres dun modle autorgressif
erreurs lies

181

Exercice 2 Dtermination du nombre de retards dans un modle


retards chelonns

186

Exercice 3 Estimation des coefficients laide dun polynme


(mthode dAlmon)

191

Exercice 4 Estimation des coefficients dun modle selon une spcification des retards de Koyck et une distribution de Pascal

195

Exercice 5 Estimation dun modle dajustement partiel


et danticipations adaptatives

200

Exercice 6 Modlisation du prix dune matire premire

201

Exercice 7 Un modle dvaluation de la politique marketing

203

Exercice 8 Une comparaison des courbes de Phillips franaise et amricaine

208

Chapitre 8
Exercice 1 Comparaison des rsultats par moindres carrs ordinaires,
moindres carrs indirects et doubles moindres carrs

225

Exercice 2 Le problme de lidentification lorsque la structure


dun modle change

229

Exercice 3 Le modle de Klein

230

Chapitre 9
Exercice 1 Exemple dapplication des tests de racine unitaire au CAC40

252

Exercice 2 Gnration de processus ARMA


et analyse des corrlogrammes

260

Exercice 3 Analyse par la mthode de Box et Jenkins et prvision de


trois processus alatoires

264

Chapitre 10
Exercice 1 Recherche des conditions de stationnarit dun modle VAR

278

Exercice 2 Spcification, estimation et prvision dun modle VAR

281

Exercice 3 Analyse dune fonction de rponse impulsionnelle


et dcomposition de la variance

290

Exercice 4 Tests de causalit de Granger et de Sims

293

Liste des exercices  365

9782100721511-Bourbo-C14.qxd

22/10/14

10:31

Page 366

Chapitre 11
Exercice 1 Test de cointgration et estimation dun modle
correction derreur

304

Exercice 2 Tests de cointgration et estimation dun modle vectoriel


correction derreur

314

Chapitre 12
Exercice 1 Estimation des modles Probit et Logit binaires explicatifs
des facteurs de la russite en Licence

326

Exercice 2 Estimation dun modle choix multiples de prvision


des ventes

332

Exercice 3 Prvision de la demande dlectricit pour un fournisseur


capacit limite

340

Chapitre 13
Exercice 1 Procdure squentielle des tests dhomognit

351

Exercice 2 Estimation du modle effets fixes individuels et effets


alatoires individuels, estimateur Between, test dHausman

358

366  CONOMTRIE

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 367

Tables statistiques
1. Table de la loi de Laplace-Gauss
2. Table de la loi de Student
3. Table de la loi du Chi-Deux
4. Table de la loi de Fisher-Snedecor
5. Table de la loi de Fisher-Snedecor (suite)
6. Table de Durbin-Watson
7. Tables de Dickey-Fuller

Tables statistiques  367

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 368

1. TABLE DE LA LOI DE LAPLACE-GAUSS


(Probabilit de trouver une valeur infrieure x )

1
(t) =
2

et

2 /2

dt .

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0
0,l
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159

0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7290
0,7611
0,7910
0,8186

0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212

0,5l20
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238

0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264

0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289

0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315

0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340

0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365

0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389

1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9

0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713

0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719

0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726

0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732

0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738

0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744

0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750

0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756

0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761

0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767

2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9

0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981

0,9779
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982

0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982

0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983

0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984

0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984

0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985

0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985

0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986

0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986

4,0

4,5

TABLE POUR LES GRANDES VALEURS DE X


.

3,0

3,1

3,2

3,3

3,4

3,5

3,6

3,8

F(x) 0,998 65 0,999 04 0,999 31 0,999 52 0,999 66 0,999 76 0,999 841 0,999 928 0,999 968 0,999 997
Nota. La table donne les valeurs de F(x) pour x positif. Lorsque x est ngatif, il faut prendre le complment l'unit de la valeur lue dans la table.
Exemples : pour x = 1,37 F(x) = 0,9147
pour x = 1,37 F(x) = 0,0853

368  CONOMTRIE

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 369

2. TABLE DE LA LOI DE STUDENT


Valeurs de T ayant la probabilit P dtre dpasses en valeur absolue

P = 0,90

1
2
3
4
5
6
7
8
9
10

0,158
0,142
0,137
0,134
0,132
0,131
0,130
0,130
0,129
0,129

0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260

0,510
0,445
0,424
0,414
0,408
0,404
0,402
0,399
0,398
0,397

0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542

1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700

1,376
1,06l
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879

1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093

3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372

6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812

12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228

11
12
13
14
15
16
17
18
19
20

0,129
0,128
0,128
0,128
0,128
0,128
0,128
0,127
0,127
0,127

0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257

0,396
0,395
0,394
0,393
0,393
0,392
0,392
0,392
0,391
0,391

0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533

0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687

0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860

1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064

1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325

1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725

2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086

2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528

3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845

21
22
23
24
25
26
27
28
29
30

0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127

0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256

0,391
0,390
0,390
0,390
0,390
0,390
0,389
0,389
0,389
0,389

0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530

0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683

0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854

1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055

1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310

1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697

2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042

2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457

2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750

0,80

0,70

0,60

0,50

0,40

0,30

0,20

0,10

0,05

0,02

0,01

31,82l 63,657
6,965 9,925
4,541 5,841
3,747 4,604
3,365 4,032
3,143 3,707
2,998 3,499
2,896 3,355
2,821 3,250
2,764 3,169

0,12566 0,25335 0,38532 0,52440 0,67449 0,84162 1,03643 1,28155 1,64485 1,95996 2,32634 2,57582

Nota. est le nombre de degrs de libert.

Tables statistiques  369

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 370

3. TABLE DE LA LOI DU CHI-DEUX


Valeurs de 2 ayant la probabilit P dtre dpasses

P = 0,90

1
2
3
4
5
6
7
8
9
10

0,0158
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865

0,80

0,70

0,50

0,30

0,20

0,0642
0,446
1,005
1,649
2,343
3,070
3,822
4,594
5,380
6,179

0,148
0,713
1,424
2,195
3,000
3,828
4,671
5,527
6,393
7,267

0,455 1,074 1,642


1,386 2,408 3,219
2,366 3,665 4,642
3,357 4,878 5,989
4,351 6,064 7,289
5,348 7,231 8,558
6,346 8,383 9,803
7,344 9,524 11,030
8,343 10,656 12,242
9,342 11,781 13,442

0,10

0,05

0,02

0,01

2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987

3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307

5,412
7,824
9,837
11,668
13,388
15,033
16,662
18,168
19,679
21,161

6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209

11
12
13
14
15
16
17
18
19
20

5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443

6,989
7,807
8,634
9,467
10,307
11,152
12,002
12,857
13,716
14,578

8,148
9,034
9,926
10,821
11,721
12,624
13,531
14,440
15,352
16,266

10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337

12,899
14,011
15,119
16,222
17,322
18,418
19,511
20,601
21,689
22,775

14,631
15,812
16,985
18,151
19,311
20,465
21,615
22,760
23,900
25,038

17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412

19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410

22,618
24,054
25,472
26,873
28,259
29,633
30,995
32,346
33,687
35,020

24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566

21
22
23
24
25
26
27
28
29
30

13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599

15,445
16,314
17,187
18,062
18,940
19,820
20,703
21,588
22,475
23,364

17,182
18,101
19,021
19,943
20,867
21,792
22,719
23,647
24,577
25,508

20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336

23,858
24,939
26,018
27,096
28,172
29,246
30,319
31,391
32,461
33,530

26,171
27,301
28,429
29,553
30,675
31,795
32,912
34,027
35,139
36,250

29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256

32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773

36,343
37,659
38,968
40,270
41,566
42,856
44,140
45,419
46,693
47,962

38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892

Lorsque > 30, on peut admettre que la quantit


rduite.

2
2 2 1 suit la loi normale

Exemple :
Calculez la valeur de 2 correspondant une probabilit P = 0,10 de dpassement
lorsque = 41 . laide de la table 1, on calcule, pour P = 0,10 , x = 1,2816 .
Do : =
2

[x +

2 1]2
1
1
= [1,2816 + 82 1]2 = (10,2816)2 = 52,85.
2
2
2

370  CONOMTRIE

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 371

4. TABLE DE LA LOI DE FISHER-SNEDECOR


Valeurs de F ayant la probabilit P dtre dpasses (F = s12 /22 )

1 = 1

1 = 2

1 = 3

1 = 4

1 = 5

P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
l 161,4 4 052
199,5 4 999
215,7 5 403
224,6 5 625
230,2 5764
2 18,51
98,49 19,00
99,00 19,16
99,17 19,25
99,25 19,30
99,30
3 10,13
34,12
9,55
30,81
9,28
29,46
9,12
28,71
9,01
28,24
4
7,71
21,20
6,94
18,00
6,59
16,69
6,39
15,98
6,26
15,52
5
6,61
16,26
5,79
13,27
5,41
12,06
5,19
11,39
5,05
10,97
6
5,99
13,74
5,14
10,91
4,76
9,78
4,53
9,15
4,39
8,75
7
5,59
12,25
4,74
9,55
4,35
8,45
4,12
7,85
3,97
7,45
8
5,32
11,26
4,46
8,65
4,07
7,59
3,84
7,01
3,69
6,63
9
5,12
10,56
4,26
8,02
3,86
6,99
3,63
6,42
3,48
6,06
10
4,96
10,04
4,10
7,56
3,71
6,55
3,48
5,99
3,33
5,64
11
4,84
9,65
3,98
7,20
3,59
6,22
3,36
5,67
3,20
5,32
12
4,75
9,33
3,88
6,93
3,49
5,95
3,26
5,41
3,11
5,06
13
4,67
9,07
3,80
6,70
3,41
5,74
3,18
5,20
3,02
4,86
14
4,60
8,86
3,74
6,51
3,34
5,56
3,11
5,03
2,96
4,69
15
4,54
8,68
3,68
6,36
3,29
5,42
3,06
4,89
2,90
4,56
16
4,49
8,53
3,63
6,23
3,24
5,29
3,01
4,77
2,85
4,44
17
4,45
8,40
3,59
6,11
3,20
5,18
2,96
4,67
2,81
4,34
18
4,41
8,28
3,55
6,01
3,16
5,09
2,93
4,58
2,77
4,25
19
4,38
8,18
3,52
5,93
3,13
5,01
2,90
4,50
2,74
4,17
20
4,35
8,10
3,49
5,85
3,10
4,94
2,87
4,43
2,71
4,10
21
4,32
8,02
3,47
5,78
3,07
4,87
2,84
4,37
2,68
4,04
22
4,30
7,94
3,44
5,72
3,05
4,82
2,82
4,31
2,66
3,99
23
4,28
7,88
3,42
5,66
3,03
4,76
2,80
4,26
2,64
3,94
24
4,26
7,82
3,40
5,61
3,01
4,72
2,78
4,22
2,62
3,90
25
4,24
7,77
3,38
5,57
2,99
4,68
2,76
4,18
2,60
3,86
26
4,22
7,72
3,37
5,53
2,98
4,64
2,74
4,14
2,59
3,82
27
4,21
7,68
3,35
5,49
2,96
4,60
2,73
4,11
2,57
3,78
28
4,20
7,64
3,34
5,45
2,95
4,57
2,71
4,07
2,56
3,75
29
4,18
7,60
3,33
5,42
2,93
4,54
2,70
4,04
2,54
3,73
30
4,17
7,56
3,32
5,39
2,92
4,51
2,69
4,02
2,53
3,70
40
4,08
7,31
3,23
5,18
2,84
4,31
2,61
3,83
2,45
3,51
60
4,00
7,08
3,15
4,98
2,76
4,13
2,52
3,65
2,37
3,34
120
3,92
6,85
3,07
4,79
2,68
3,95
2,45
3,48
2,29
3,17

3,84
6,64
2,99
4,60
2,60
3,78
2,37
3,32
2,21
3,02
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.

Tables statistiques  371

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 372

5. TABLE DE LA LOI DE FISHER-SNEDECOR (suite)


Valeurs de F ayant la probabilit P dtre dpasses (F = s12 /22 )

1 = 6

1 = 8

1 = 12

1 = 24

1 =

P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
1 234,0 5 859
238,9 5 981
243,9 6 106
249,0 6 234
254,3 6366
2 19,33
99,33 19,37
99,36 19,41
99,42 19,45
99,46 19,50
99,50
3
8,94
27,91
8,84
27,49
8,74
27,05
8,64
26,60
8,53
26,12
4
6,16
15,21
6,04
14,80
5,91
14,37
5,77
13,93
5,63
13,46
5
4,95
10,67
4,82
10,27
4,68
9,89
4,53
9,47
4,36
9,02
6
4,28
8,47
4,15
8,10
4,00
7,72
3,84
7,31
3,67
6,88
7
3,87
7,19
3,73
6,84
3,57
6,47
3,41
6,07
3,23
5,65
8
3,58
6,37
3,44
6,03
3,28
5,67
3,12
5,28
2,93
4,86
9
3,37
5,80
3,23
5,47
3,07
5,11
2,90
4,73
2,71
4,31
10
3,22
5,39
3,07
5,06
2,91
4,71
2,74
4,33
2,54
3,91
11
3,09
5,07
2,95
4,74
2,79
4,40
2,61
4,02
2,40
3,60
12
3,00
4,82
2,85
4,50
2,69
4,16
2,50
3,78
2,30
3,36
13
2,92
4,62
2,77
4,30
2,60
3,96
2,42
3,59
2,21
3,16
14
2,85
4,46
2,70
4,14
2,53
3,80
2,35
3,43
2,13
3,00
15
2,79
4,32
2,64
4,00
2,48
3,67
2,29
3,29
2,07
2,87
16
2,74
4,20
2,59
3,89
2,42
3,55
2,24
3,18
2,01
2,75
17
2,70
4,10
2,55
3,79
2,38
3,45
2,19
3,08
1,96
2,65
18
2,66
4,01
2,51
3,71
2,34
3,37
2,15
3,00
1,92
2,57
19
2,63
3,94
2,48
3,63
2,31
3,30
2,11
2,92
1,88
2,49
20
2,60
3,87
2,45
3,56
2,28
3,23
2,08
2,86
1,84
2,42
21
2,57
3,81
2,42
3,51
2,25
3,17
2,05
2,80
1,81
2,36
22
2,55
3,76
2,40
3,45
2,23
3,12
2,03
2,75
1,78
2,31
23
2,53
3,71
2,38
3,41
2,20
3,07
2,00
2,70
1,76
2,26
24
2,51
3,67
2,36
3,36
2,18
3,03
1,98
2,66
1,73
2,21
25
2,49
3,63
2,34
3,32
2,16
2,99
1,96
2,62
1,71
2,17
26
2,47
3,59
2,32
3,29
2,15
2,96
1,95
2,58
1,69
2,13
27
2,46
3,56
2,30
3,26
2,13
2,93
1,93
2,55
1,67
2,10
28
2,44
3,53
2,29
3,23
2,12
2,90
1,91
2,52
1,65
2,06
29
2,43
3,50
2,28
3,20
2,10
2,87
1,90
2,49
1,64
2,03
30
2,42
3,47
2,27
3,17
2,09
2,84
1,89
2,47
1,62
2,01
40
2,34
3,29
2,18
2,99
2,00
2,66
1,79
2,29
1,51
1,80
60
2,25
3,12
2,10
2,82
1,92
2,50
1,70
2,12
1,39
1,60
120
2,17
2,96
2,01
2,66
1,83
2,34
1,61
1,95
1,25
1,38

2,09
2,80
1,94
2,51
1,75
2,18
1,52
1,79
1,00
1,00
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.

372  CONOMTRIE

9782100721511-Bourbo-C15.qxd

22/10/14

10:32

Page 373

6. TABLE DE DURBIN-WATSON
Risque = 5 %
k=1

n
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100

k=2

k=3

k=4

k=5

d1

d2

d1

d2

d1

d2

d1

d2

d1

d2

1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,48
1,50
1,53
1,55
1,57
1,58
1,60
1,61
1,62
1,63
1,64
1,65

1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,57
1,59
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,69

0,95
0,98
1,02
1,05
1,08
1,10
1,13
1,15
1,17
1,19
1,21
1,22
1,24
1,26
1,27
1,28
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,43
1,46
1,49
1,51
1,54
1,55
1,57
1,59
1,60
1,61
1,62
1,63

1,54
1,54
1,54
1,53
1,53
1,54
1,54
1,54
1,54
1,55
1,55
1,55
1,56
1,56
1,56
1,57
1,57
1,57
1,58
1,58
1,58
1,59
1,59
1,59
1,60
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,70
1,71
1,72

0,82
0,86
0,90
0,93
0,97
1,00
1,03
1,05
1,08
1,10
1,12
1,14
1,16
1,18
1,20
1,21
1,23
1,24
1,26
1,27
1,28
1,29
1,31
1,32
1,33
1,34
1,38
1,42
1,45
1,48
1,50
1,52
1,54
1,56
1,57
1,59
1,60
1,61

1,75
1,73
1,71
1,69
1,68
1,68
1,67
1,66
1,66
1,66
1,66
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,66
1,66
1,66
1,66
1,67
1,67
1,68
1,69
1,70
1,70
1,71
1,72
1,72
1,73
1,73
1,74

0,69
0,74
0,78
0,82
0,86
0,90
0,93
0,96
0,99
1,01
1,04
1,06
1,08
1,10
1,12
1,14
1,16
1,18
1,19
1,21
1,22
1,24
1,25
1,26
1,27
1,29
1,34
1,38
1,41
1,44
1,47
1,49
1,51
1,53
1,55
1,57
1,58
1,59

1,97
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,76
1,75
1,74
1,74
1,74
1,73
1,73
1,73
1,73
1,73
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,74
1,74
1,74
1,75
1,75
1,75
1,76

0,56
0,62
0,67
0,71
0,75
0,79
0,83
0,86
0,90
0,93
0,95
0,98
1,01
1,03
1,05
1,07
1,09
1,11
1,13
1,15
1,16
1,18
1,19
1,21
1,22
1,23
1,29
1,34
1,38
1,41
1,44
1,46
1,74
1,51
1,52
1,54
1,56
1,57

2,21
2,15
2,10
2,06
2,02
1,99
1,96
1,94
1,92
1,90
1,89
1,88
1,86
1,85
1,84
1,83
1,83
1,82
1,81
1,81
1,80
1,80
1,80
1,79
1,79
1,79
1,78
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,78
1,78
1,78

k est le nombre de variables exognes (constante exclue).


n est la taille de lchantillon.

Tables statistiques  373

9782100721511-Bourbo-C15.qxd

04/11/14

7:45

Page 374

7. TABLES DE DICKEY-FULLER1
Modle [1] sans tendance et sans terme constant
Modle [2] sans tendance et avec terme constant
Modle [3] avec tendance et avec terme constant
Tables de la distribution du t1
Nombre
observations

n
25
50
100
250
500

25
50
100
250
500

25
50
100
250
500

Probabilits

0,01
2,66
2,62
2,60
2,58
2,58
2,58
3,75
3,58
3,51
3,46
3,44
3,43
4,38
4,15
4,04
3,99
3,98
3,96

0,025
2,26
2,25
2,4
2,23
2,23
2,23
3,33
3,22
3,17
3,14
3,13
3,12
3,95
3,80
3,73
3,69
3,68
3,66

0,05
1,95
1,95
1,95
1,95
1,95
1,95
3,00
2,93
2,89
2,88
2,87
2,86
3,60
3,50
3,45
3,43
3,42
3,41

0,l0
1,60
1,61
1,61
1,62
1,62
1,62
2,63
2,60
2,58
2,57
2,57
2,57
3,24
3,18
3,15
3,13
3,13
3,12

0,90
0,92
0,91
0,91
0,89
0,89
0,89
0,37
0,40
0,42
0,42
0,43
0,44
1,14
1,19
1,22
1,23
1,24
1,25

0,95
1,33
1,31
1,29
1,29
1,28
1,28
0,00
0,03
0,05
0,06
0,07
0,07
0,80
0,87
0,90
0,92
0,93
0,94

0,975
1,70
1,66
1,64
1,63
1,62
1,62
0,34
0,29
0,26
0,24
0,24
0,23
0,50
0,58
0,62
0,64
0,65
0,66

0,99
2,16
2,08
2,03
2,01
2,00
2,00
0,72
0,66
0,63
0,62
0,61
0,60
0,15
0,24
0,28
0,31
0,32
0,33

Tables de la distribution des tc et tb (test bilatral)


Modle [2]

Modle [3]

Constante c

Constante c

Tendance b

2%

5 % 10 %

2%

5%

10 %

2%

5%

10 %

25

3,41

2,97

2,61

4,05

3,59

3,20

3,74

3,25

2,85

50

3,28

2,89

2,56

3,87

3,47

3,14

3,60

3,18

2,81

100

3,22

2,86

2,54

3,78

3,42

3,11

3,53

3,14

2,79

250

3,19

2,84

2,53

3,74

3,39

3,09

3,49

3,12

2,79

500

3,18

2,83

2,52

3,72

3,38

3,08

3,48

3,11

2,78

3,18

2,83

2,52

3,71

3,38

3,08

3,46

3,11

2,78

1. Source : Fuller W.A., Introduction to Statistical Times Series, John Wiley, 1976.

374  CONOMTRIE

Modle [1]

Modle [2]

Modle [3]

9782100721511-Bourbo-C16.qxd

22/10/14

10:33

Page 375

Bibliographie
AKAIKE H., Information theory and an extension of the maximum likelihood principle , in B.N. Petrov and F. Cski, eds, 2nd International Symposium on
Information Theory, Akadmia Kiad, Budapest, 1973.
AKAIKE H., A new look at the statistical model identification , IEEE Transactions
on automatic Control, Vol. 19, 1974.
AKAIKE H., A bayesian extension of the minimum AIC procedure , Biometrika,
Vol. 66, 1979.
ALMON S., The distributed lag between capital appropriation and expenditures ,
Econometrica, Vol. 33, nl, janvier 1965.
AMEMIYA T., Qualitative response models: a survey , Journal of Economic
Literature, n19, 1981.
ARROW K.J., CHENERY H.B., MINHAS B.S., SOLOW R.M., Capital-labor substitution
and economic efficiency , Review of Economics and Statistics, Vol. 43, 1961.
BEVERIDGE S., NELSON C. R., A new approach to decomposition of economic time
series into permanent and transitory components with particular attention to measurement of the business cycle , Journal of the Monetary Economics, 7, 2, 1981.
BOURBONNAIS R., TERRAZA M., Analyse des sries temporelles, Dunod, Paris, 3e d.,
2010.
BOURBONNAIS R., USUNIER J.-C., Prvision des ventes, 5e d., Economica, Paris,
2013.
BOX G.E.P., JENKINS G.M., Time series analysis : forecasting and control,
Holdenday, 1976.
BOX G.E.P., PIERCE D.A., Distribution of residual autocorrelations in autoregressiveintegrated moving average time series models , Journal of the American
Statistical Association, Vol. 65, 1970.
BREUSCH T., Testing for autocorrelation in dynamic linear models , Australian
Economic Papers, Vol. 17, 1978.
DICKEY D., FULLER W., Distribution of the estimators for autoregressive time series
with unit root , Journal of the American Statistical Association, Vol. 74, n366,
1979.
DICKEY D., FULLER W., Likelihood ratio statistics for autoregressive time series
with unit root , Econometrica, Vol. 49, n4, 1981.
DURBIN J., Testing for serial correlation in least-squares regression when some of
the regressors are lagged dependant variables , Biometrika, Vol. 38, 1970.
ENGLE R.E., GRANGER C.W.J., Cointegration and Error-correction : representation,
estimation and testing , Econometrica, Vol. 55, mars 1987.
ENGLE R.F., Autoregressive conditional heteroscedasticity with estimate of the
variance of U.K. inflation , Econometrica, Vol. 50, 1982.
Bibliographie  375

9782100721511-Bourbo-C16.qxd

22/10/14

10:33

Page 376

FARRAR D.E., GLAUBER R.R., Multicolinearity in regression analysis , Review of


Economics and Statistics, Vol. 49, 1967.
FULLER W.A., Introduction to statistical time series, John Wiley, 1976.
GLEISJER H., A new test for heteroscedasticity , Journal of American Statistical
Association, Vol. 64, 1969.
GODFREY L.G., Testing for higher order serial correlation in regression equation
when the regressors contain lagged dependant variables , Econometrica, Vol. 46,
1978.
GOLDFELD S.M., QUANDT R.E., Some tests of homoscedasticity , Journal of the
American Statistical Association, Vol. 60, 1965.
GRANGER C.W.J., Co-integrated variables and Error-correcting models ,
Document de travail, universit de San Diego, 1983.
GRANGER C.W.J., Investigating causal relations by econometrics models and cross
spectral methods , Econometrica, Vol. 37, 1969.
GREENE W.H., Econometric Analysis, Prentice Hall, 4e d., 2000.
GRIFFITHS W.E., CARTER HILL R., JUDGE G.G., Learning and practicing econometrics, John Willey, New York, 1993.
HAMILTON J.D., Time series analysis, Princeton University Press, 1994.
HARVEY A.C., Forecasting Structural Time Series Models and the Kalman Filter,
Cambridge University Press, 1988.
HAUSMAN J.A., Specification Tests in Econometrics , Econometrica, Vol. 46, 1978.
HSIAO C., Analysis of Panel Data , Econometric Society Monographs, N11,
Cambridge University Press, 1986.
JARQUE C.M., BERA A.K., Efficient test for normality homoscedasticity and serial
independance of regression residuals , Applied Statistics, Vol. 31, n2, 1980.
JARQUE C.M., BERA A.K., Testing the normality assumption in limited dependant
variable models , International Economic Review, Vol. 25, n3, 1984.
JOHANSEN S., Statistical analysis of cointegration vectors , Journal of economic
dynamics and control, Vol. 12, 1988.
JOHANSEN S., JUSELIUS, Maximum likelihood estimation and to the demand for
money inference on cointegration with application , Oxford Bulletin of Economics
and Statistics, Vol. 52, 1990.
JOHANSEN S., Estimation and Hypothesis Testing of Cointegration Vectors in
Gaussian Vector Autoregressive Models , Econometrica, Vol. 59, 1991.
JOHNSTON J. et DINARDO J., Mthodes conomtriques, (traduit par B. Guerrien)
Economica, 4e d., Paris, 1999.
JUDGE G.G., CARTER HILL R., GRIFFITHS W.E., LTKEPOHL H., LEE T.-C., Introduction
to the theory and practice of econometrics, John Willey, New York, 1988.
KENDALL M.G., STUART A., The advanced theory of statistics, Vol. 2, Grifin, Londres,
1961.
KLEIN L.R., An introduction to econometrics, Prentice Hall, 1962.
KLEIN L.R., Economic fluctuations in the United States 1921-1941, John Wiley, New
York, 1950.
KOYCK L.M., Distributed lags and investment analysis, North-Holland, Amsterdam,
1954.
376  CONOMTRIE

9782100721511-Bourbo-C16.qxd

22/10/14

10:33

Page 377

KWIATKOWSKI D., PHILLIPS P., SCHMIDT P., et SHIN Y., Testing the null hypothesis of
stationarity against the alternative of a unit root. How sure are we that economic
time series have a unit root ? Journal of econometric, Vol. 54, 1992.
LJUNG G.M., BOX G.E.P., On a mesure of lack of fit in time series models ,
Biometrika, Vol. 65, 1978.
MACKINNON, J.G., Critical Values for Cointegration Tests, Chapitre 13 in Long-run
Economic Relationships : Readings in Cointegration, R.F. Engle et C.W.J.
Granger diteurs, Oxford University Press, 1991.
MADDALA G.S., RAO A.S., Maximum likelihood estimation of Solows and
Jorgensons distributed lag models , The Review of Economics and Statistics,
fvrier 1971.
NELSON C.R., PLOSSER C., Trends and Random Walks in Macroeconomics Time
Series : some Evidence and Applications , Journal of Monatery Economics,
10, 1982.
PHILLIPS P., PERRON P., Testing for unit root in time series regression , Biometrika,
Vol. 75, 1988.
QUENOUILLE M.H., The joint distribution of serial correlation coefficients ,
Annuals of mathematical statistics, Vol. 20, 1949.
SCHWARZ G., Estimating the dimension of a model , The annals of Statistics, Vol. 6,
1978.
SEVESTRE P., conomtrie des donnes de Panel, Dunod, 2002.
SIMS C.A., Macroeconomics and reality , Econometrica, Vol. 48, 1980.
SOLOW R.M., On a family of lag distributions , Econometrica, avril 1960.
THOMAS A., conomtrie des variables qualitatives, Dunod, 2000.
TOBIN J., Estimation of relationships for limited dependent variables ,
Econometrica, n26, 1958.
WHITE H., A heteroskedasticity-consistent covariance estimator and a direct test for
heteroskedasticity , Econometrica, Vol. 48, 1980.
WOLD H., A study in the analysis of stationary time series, Almquist-Wiksell, 1954.
WONNACOTT T.H., WONNACOTT R.J., Statistique, Economica, 4e d., Paris, 1998.
ZELLNER A., An efficient Method of Estimating Seemingly Unrelated Regression
Equations and Tests for Aggregation Bias , Journal of the American Statistical
Association, 57, pp. 348-368, 1962.

Bibliographie  377

9782100721511-Bourbo-C16.qxd

22/10/14

10:33

Page 378

9782100721511-Bourbo-idx.qxd

22/10/14

10:33

Page 379

Index
A
Algorithme de Gauss-Newton 171
Analyse de la variance 33, 34, 38, 54,
67, 68, 69, 70, 73
Autocorrlation des erreurs 127, 179

Estimateur
Between 357, 358, 360
de Aitken 127
LSDV 356, 358
Within 356

B, C

Backward Elimination 120


Bruit Blanc 242
Causalit 292, 293
Coefficient
de corrlation 8, 10, 11, 37, 108
de corrlation multiple 54, 92
de corrlation partielle 109, 113
de dtermination 41, 54, 92, 112
Conditions didentification 222, 225
Corrlogramme 243, 256, 258
Critre 119
dinformation de Hannan-Quinn 327
de Akaike 119, 185, 279
de Schwarz 119, 185

Fonction
dautocorrlation 240
dautocorrlation partielle 241
de rponse impulsionnelle 285, 290
de vraisemblance 74
Forward Regression 120

D
Dcomposition
de Cholesky 288
de la variance 290
Degr
de libert 27, 34, 54, 70
Donnes centres 54
DoublesMoindresCarrs 223
E
Effet de levier 62, 63
quations
de Yule-Walker 261
rduites 219
structurelles 219

H
Htroscdasticit 18, 142, 144
Homoscdasticit 18
I
Intervalle
de confiance 29, 39, 62, 66
de prdiction 40
de prvision 82
L
Leptokurtique 244
Loi
de Fisher 35, 60, 61
de Student 9, 27, 30, 36, 59, 60
M
Matrice HAT 62
Maximum de vraisemblance 224
Mthode
de Box et Jenkins 260
de Cochrane-Orcutt 138, 140
des Moments Gnraliss 156, 157

INDEX  379

9782100721511-Bourbo-idx.qxd

22/10/14

10:33

des triples moindres carrs 234


des variables instrumentales 155, 160
du balayage 138, 141
du maximum de vraisemblance 235
SUR 347
Modle
choix multiples 330
correction derreur 301, 303, 307
correction derreur vectoriel 308
effets alatoires 355, 357
effets alatoires individuels 358
effets fixes 355
effets fixes individuels 355, 358
erreur compose 357
erreurs sur les variables 154
retards chelonns 183
AR 256
ARIMA 256, 259
ARMA 257
autorgressif 178, 180
dajustement partiel 198
danticipations adaptatives 199
de choix binaire 322
de Gompertz 169
de Klein 230
de Koyck 193
de marche au hasard 246
de Solow 194
linaire sur variable latente 322
logistique 169
Logit 323, 326, 341
Logit multinomial 336
MA 257
Probit 323, 329
SARIMA 259
Tobit 337, 338, 341
VAR 276
Moindres Carrs Gnraliss 126
Moindres carrs indirects 223
Multicolinarit 114, 118
O, P, R
Orthogonalisation 287
Point
dinfluence 63
de levier 63

380  CONOMTRIE

Page 380

Processus
DS 246, 248
TS 245, 248
Pseudo-R2 325
Racine unitaire 245
Rgression
augmente 157
fallacieuse 299
pondre 144
rcursive 84
Rsidus
standardiss 63
studentiss 63
Retards dAlmon 188
Risque de premire espce 30
S
Saisonnalit 79, 261
Schwarz 279
Stagewise Regression 121
Stationnarit 239, 277
Stepwise Regression 120
T
Test 244
ARCH 153
bilatral 32, 60, 64
Box-Pierce 131, 243
bruit blanc 241
dautocorrlation 178
dgalit des variances 148
dexognit dHausman 156, 158
dexognit faible 313
dHausman 158, 159, 358
de Breusch-Godfrey 130, 132
de CHOW 68, 69, 71, 85, 97, 100, 144
de cointgration 303
de Dickey-Fuller 249, 299
de Dickey et Fuller Augments 249
de diffrence 156
de Durbin et Watson 129, 130, 133,
178
de Farrar et Glauber 116, 118
de Fisher 36, 44, 67, 74, 93, 184, 350
de h de Durbin 178, 182
de Gleisjer 148, 150
de Goldfeld-Quandt 148, 149

9782100721511-Bourbo-idx.qxd

22/10/14

10:33

de Granger 294
de Jarque et Bera 244
de Johansen 315
de Klein 115, 117
de la trace 311
de la valeur propre maximale 313
de Ljung-Box 131, 243, 314
de normalit 244
de Phillips et Perron 250
de racines unitaires 249
de Ramsey 86, 89
de relation de cointgration 310
de RESET 86
de Sims 294
de Wald 94, 350
de White 148, 151
du CUSUM 85
du Kurtosis 244
du multiplicateur de Lagrange 74, 153
du Skewness 244

Page 381

KPSS 251
de stationnarit 241
unilatral 32
Thorme
de Frisch, Waugh et Lovell 53
de Gauss-Markov 53
Triples moindres carrs 224
V
Valeur anormale 62
Variable
auxiliaire 75
centre 20
endogne 4, 14, 47, 177, 219, 320
exogne 4, 14, 47, 177, 219, 320
indicatrice 75, 76, 80
latente 322, 338
muette 75, 96
qualitative 77

INDEX  381

9782100721511-Bourbo-idx.qxd

14/11/14

9:43

Page 382

Dans la mme collection


B. Bernier et Y. Simon, Initiation la macroconomie, 9e d., 2009.
B. Bernier et H.-L. Vdie, Initiation la microconomie, 3e d., 2009.
R. Bourbonnais et M. Terraza, Analyse des sries temporelles, 3e d., 2010.
R. Bourbonnais, conomtrie, 9e d., 2015.
M. Delaplace, Monnaie et financement de lconomie, 4e dition 2013.
G. Deleplace, Histoire de la pense conomique, 2e d., 2009.
B. Goldfarb et C. Pardoux, Introduction la mthode statistique, 7e d., 2013.
B. Guillochon, A. Kawecki et B. Venet, conomie internationale, 7e d., 2012.
N. Hayek et J.-P. Leca, Mathmatiques pour lconomie, 4e d., 2011.
F. Huart, conomie des finances publiques, 2012.
J.-P. Lecoutre, Statistique et probabilits, 5e dition, 2012.
P. de Lima, conomie bancaire et croissance conomique, 2012.
T. de Montbrial et E. Fauchart-Foray, Introduction lconomie, 4e d., 2009.
P. Petauton et M. Fromenteau, Thorie et pratique de lassurance vie, 4e d.,
2012.
F. Poulon, conomie gnrale, 7e d., 2011.
M. Raffinot, conomie du dveloppement, 2015.
M. Yildizoglu, Introduction la thorie des jeux, 2e d., 2011.

TD co Sup
S. Brana et M.-C. Bergouignan, TD Comptabilit nationale, 3e d., 2011.
S. Brana, M. Cazals et P. Kauffmann, TD conomie montaire et financire,
4e d., 2012.
S. Brana et M.-C. Bergouignan, TD Macroconomie, 5e d., 2015.
J. Hricourt et J. Reynaud, TD conomtrie, 2007.
K. Jouaber Snoussi et M.-J. Rigobert, TD Finance dentreprise, 2e d., 2010.
J.-P. Lecoutre et Ph. Pilibossian, TD Algbre, 4e d., 2014.
J.-P. Lecoutre et Ph. Pilibossian, TD Analyse, 5e d., 2013.
J.-P. Lecoutre, TD Statistique et probabilits, 6e d., 2015.
P. Mdan, TD Microconomie, 5e d., 2015.
J.-L. Monino, J.-M. Kosianski et F. Le Cornu, TD Statistique descriptive,
4e d., 2010.
G. Neuberg, TD Mathmatiques financires et actuarielles, 2012.
F. Poulon, TD conomie gnrale, 2011.
72151 - (I) - (2) - OSB 80 - LAS - JME
Imprimerie CHIRAT - 42540 Saint-Just-la-Pendue
Dpt lgal : Janvier 2015
Imprim en France

You might also like