Professional Documents
Culture Documents
STEPHANE ADJEMIAN
1. Introduction
Dans cette note je dveloppe deux exemples destimation baysienne. Nous avons
e
e
dj` rencontr le premier exemple en cours, mais je navais pas donn les dtails des
ea
e
e
e
calculs ` lpoque. Il sagit destimer lesprance dune variable alatoire. Le second
a e
e
e
exemple est lui plus original par rapport au contenu du cours : il illustre lapproche
baysienne des mod`les VAR.
e
e
2. Estimation de lesperance
Le processus gnrateur des donnes est dni par :
e e
e
e
(1a)
yt = + t
2
t N 0,
(1b)
iid
2
a
o` t = 1, . . . , T . On suppose que la variance est connue, nous cherchons ` estimer
u
lesprance du processus {yt }.
e
Notre croyance a priori sur est caractrise par une loi normale centre en 0
e e
e
2
et de variance . La densit a priori est donc :
e
1
1
22 (0 )2
2
p0 () = (2 ) 2 e
(2)
2
2
p(YT |, ) = (2 ) 2 e
(3)
1
22
PT
t=1 (yt )
Notons que :
T
(yt )2 =
t=1
([yt ] [ ])2
t=1
T
(yt )2 +
=
t=1
( )2
t=1
(yt )( )
t=1
= s2 + T ( )2
yt T ( )
t=1
= s2 + T ( )2
1
STEPHANE ADJEMIAN
2
2
p(YT |, ) = (2 ) 2 e
(4)
1
22 (s2 +T (b)2 )
2
1
1
22 (s2 +T (b)2 ) 22 (0 )
2
2
p(|YT ) (2 ) 2 (2 ) 2 e
2
1
T
22 (b)2 22 (0 )
ou de faon quivalente :
c e
p(|YT ) exp
1
T
( )2 + 2 ( 0 )2
2
1
2
Nous allons maintenant rcrire cette quation de faon ` ne faire appara quune
ee
e
c a
tre
forme quadratique en . En dveloppant les carrs, et en notant A() le terme entre
e
e
(grandes) parenth`ses sous lexponentielle, il vient :
e
A() =
1
T
2 + 2 2 + 2 2 + 2 20
0
2
T
1
+ 2
2
T
1
+ 2
2
1
T
+ 2
2
1
T
+ 2 0
2
2 2
2
T
2
T
2
T
2
T
2
+
+
1
2
0
1
2
0
1
2
T 2
1
+ 2 2
2
1
2
T 2
1
+ 2 2
2
1
T 2
+ 2 2
2
T
2
T
2
1
2
0
1
2
1
T
+ 2
2
T
2
T
2
1
2
0
1
2
et nalement :
(5)
1
p(|YT ) exp
2
T
1
+ 2
2
T
2
T
2
+
+
1
2
0
1
2
On reconna ` une constante dintgration pr`s, la densit dune loi normale. Ainsi,
t, a
e
e
e
la distribution postrieure de est gaussienne desprance :
e
e
E [] =
T
2
T
2
et de variance :
V [] =
T
2
+
+
1
+
1
2
0
1
2
1
2
ECONOMETRIE BAYESIENNE
2
On voit que si le prior est non informatif, au sens o` la variance a priori, , tend
u
vers linni, alors la variance a posteriori est la variance de lestimateur du maxi2
mum de vraisemblance de , /T . D`s lors que lon apporte de linformation, la
e
variance postrieure est plus faible que la variance de lestimateur du MV. Lintrt
e
ee
pratique de lapproche baysienne est illustr par ce rsultat. Dans un environnee
e
e
ment o` nous disposons de peu de donnes, lchantillon est faiblement informatif,
u
e
e
la prise en compte de nos croyances a priori permet daccro la prcision de lestre
e
timation. En spciant un prior, avec une variance nie plus ou moins importante,
e
nous augmentons le degr de libert.
e
e
Lesprance postrieure est une combinaison linaire convexe de lesprance a priori
e
e
e
e
et de lestimateur du maximum de vraisemblance (ici la moyenne empirique). Le
mlange est dni par la variance a priori et la variance de lestimateur du MV.
e
e
Si linformation a priori est plus importante que linformation empirique (provenant de lchantillon) alors lesprance postrieure sera plus proche de lesprance
e
e
e
e
a priori que de lestimateur du MV. En raisonnant ` la limite :
a
(i) Lorsque 0 tend vers 0, cest-`-dire lorsque linformation a priori tend vers
a
linni, lesprance postrieure tend vers lesprance a priori. On note que
e
e
e
dans ce cas la variance postrieure tend vers zro. On peut interpr`ter ce
e
e
e
cas limite comme une calibration du mod`le.
e
(ii) Lorsque T tend vers linni, cest-`-dire lorsque linformation empirique
a
tend vers linni, lesprance postrieure tend vers lestimateur du MV.
e
e
Dans le mme temps la variance postrieure se rapproche de celle de lestie
e
mateur du MV et tend nalement vers zro. Plus gnralement nous poure
e e
rions montrer que la densit postrieure hrite des proprits de lestimateur
e
e
e
ee
du maximum de vraisemblance1).
La distribution postrieure est gaussienne tout comme la distribution a priori :
e
nous avons choisi un prior conjugu.
e
2.3. Estimation ponctuelle. Dans la section prcdante nous avons montr que
e e
e
la distribution postrieure de est gaussienne. Pour communiquer les rsultats sous
e
e
une forme plus synthtique on peut vouloir choisir un point dans la distribution a
e
posteriori, cest-`-dire proposer une estimation ponctuelle. Nous avons vu en cours
a
que cela sapparente ` un probl`me de choix en univers incertain. Il est alors naturel
a
e
de se donner une fonction de perte, L(a, ), qui spcie la perte occasionne par le
e
e
choix a alors que la vraie valeur est , et de minimiser lesprance postrieure de la
e
e
perte :
= arg min
a
L(a, )p(|YT )d
R
normalement distribue lorsque la dimension de lchantillon tend vers linni (mme proprit
e
e
e
e e
que lestimateur du MV qui est asymptotiquement gaussien).
STEPHANE ADJEMIAN
en macro-conomie
e
Nous considrons un mod`le VAR(p) pour caractriser le vecteur 1 m de vae
e
e
riables endog`nes yt observes :
e
e
p
yt =
yti Ai + t
i=1
mT
2
||
T
2
e 2 tr{(Y ZA)
(Y ZA) }
||
mT
2
e 2 tr{
T k
2
||
b
b
(AA) Z Z(AA)}
e 2 tr{
1
b
b
(Y Z A) (Y Z A)}
a
` des constantes dintgration pr`s on reconna les fonctions de densit de probae
e
t
e
bilit dune gaussienne matricielle et dune inverse Wishart (voir lannexe A). On
e
peut donc rcrire la vraisemblance sous la forme suivante :
ee
L(A, ; YT ) =(2)
mT
2
(2)
km
2
|Z Z|
m
2
m
2
m(m1)
4
m
i=1
|S|
+1i
2
fiWm (; S, )
avec = T k m 1 les degrs de libert et S = T . Cette criture nous apprend
e
e
e
e
que la vraisemblance du VAR(p) est proportionnelle au produit de la densit dune
ECONOMETRIE BAYESIENNE
Cette proprit va nous aider ` poser une forme de la densit a priori telle que nous
ee
a
e
puissions obtenir une expression analytique de la densit postrieure.
e
e
3.0.1. A priori non informatif. Dans cette section nous allons nous supposons que
nos croyances sont non informatives en adoptant un a priori ` la Jerey :
a
(7)
p0 (A, ) = ||
m+1
2
On note que dans le cas scalaire, m = 1, on retrouve le prior suggr par Jerey
ee
(1/ 2 ) dcrit en cours. La densit a posteriori satisfait donc :
e
e
p (A, |YT ) (2)
mT
2
(2)
km
2
|Z Z|
m
2
m
2
m(m1)
4
|S| 2
i=1
+1i
2
m+1
2
fiWm (; S, ) ||
e
e
e
(9)
STEPHANE ADJEMIAN
matrice est connue (on posera = ). Enn nous spcions le prior sur A de la
e
faon suivante :
c
(10)
p0 (vec A) N (a0 , 0 )
(11a)
a1 = 1 1 a0 + 1 Z Z vecA
0
(11b)
i
1h
b
b
K(A|YT ) = exp (vecA a0 ) 1 (vecA a0 ) + tr 1 (A A) Z Z(A A)
0
2
(2)
km
2
|0 | 2 (2)
mT
2
|| 2 e 2 tr
b
S
e
Notons a = vec A, a = vec A et B(a) le terme entre crochets sous la premi`re
exponentielle. En utilisant les proprits des oprateurs vec, tr et du produit de
ee
e
kronecker nous avons :
B(a) = (a a0 ) 1 (a a0 ) + (a a) 1 Z Z (a a)
0
En dveloppant, il vient :
e
B(a) =a 1 a + a0 1 a0 2a 1 a0
0
0
0
+ a 1 Z Z a + a 1 Z Z a 2a 1 Z Z a
de faon quivalente il vient :
c e
B(a) = a 1 + 1 Z Z a 2a 1 a0 + 1 Z Z a
0
0
+ a0 1 a0 + a 1 Z Z a
0
En factorisant on trouve :
B(a) = (a a1 ) 1 (a a1 ) a1 1 a1 + a0 1 a0 + a 1 Z Z a
0
1
1
Finalement, en substituant dans lexpression du noyau, on peut rcrire celui-ci sous
ee
la forme suivante :
1
K(A|YT ) = exp (a a1 ) 1 (a a1 )
1
2
1
exp a0 1 a0 + a 1 Z Z a a1 1 a1
0
1
2
(2)
km
2
|0 | 2 (2)
mT
2
|| 2 e 2 tr
b
S
K(A|YT )dA
= (2)
km
2
exp
(2)
|1 | 2
1
a 1 a0 + a 1 Z Z a a1 1 a1
1
2 0 0
km
2
|0 | 2 (2)
mT
2
|| 2 e 2 tr
b
S
ECONOMETRIE BAYESIENNE
`
Annexe A. Densites pour le modele BVAR
A.1. Distribution normale matricielle.
Dnition 1. La matrice p q alatoire X est distribue conformment ` une loi
e
e
e
e
a
normale matricielle
X M Np,q (M, Q, P)
o` M est une matrice p q, Q et P sont respectivement des matrices p p et q q
u
symtriques et dnies positives, si et seulement si vec(X) est distribu comme une
e
e
e
v.a. normale multivarie
e
vec(X) Npq (vec(M), Q P)
Ainsi, la fonction de densit associe ` X est donne par :
e
e a
e
fM Np,q (X; M, P, Q) =(2)
pq
2
e 2 tr{Q
1
|Q| 2 |P| 2
1
(XM) P1 (XM)}
positive q q. Par dnition Y = i=1 Xi Xi est distribu selon une loi de Wishart.
e
e
Les dnitions suivantes caractrisent cette loi et la densit de linverse dune v.a.
e
e
e
de Wishart.
Dnition 2. La matrice alatoire, de dimension q q, symtrique et semi dnie
e
e
e
e
positive Y est distribue selon une loi de Wishart, Y Wq (Q, ), si et seulement
e
si sa densit est donne par
e
e
f (Y ; Q, ) =
|Q| 2 |Y |
2
q
2
q(q1)
4
q1
2
q
i=1
+1i
2
1
1
e 2 tr{Y Q }
STEPHANE ADJEMIAN
fiWq (X; Q, ) =
|Q| 2 |X|
2
q
2
q(q1)
4
+q+1
2
q
i=1
e 2 tr{X
1
+1i
2
Q}
`
`
Annexe B. Rappels dalgebre pour le modele BVAR
B.1. Loprateur vec. Soit X une matrice m n forme en concatnant horizone
e
e
talement les vecteurs colonnes x1 , x2 , ..., xn de dimensions m 1 :
X = (x1 |x2 | . . . |xn )
Loprateur vec transforme une matrice en vecteur en concatnant verticalement
e
e
les vecteurs colonnes formant cette matrice. Nous avons donc :
vec X = (x1 , x2 , . . . , xn )
B.2. Loprateur tr. Soit X une matrice carre m m :
e
e
.
.
.
.
.
.
X= .
.
.
.
.
.
.
.
.
.
.
.
xm,1 . . . . . . . . . . . . xm,m
La trace dune matrice carre est la somme des scalaires sur sa diagonale. Ainsi,
e
nous avons :
m
tr X =
xi,i
i=1
a1,1 B a1,2 B . . .
.
AB =A= .
.
am,1 B
...
...
a1,p B
.
.
.
am,p B
ECONOMETRIE BAYESIENNE