You are on page 1of 10

Material elaborado pelo Prof.

Csar Gonalves de Lima


64

CAPTULO 4. DISTRIBUIO NORMAL MULTIVARIADA
Para fazermos inferncias, muitas vezes assumimos que o vetor aleatrio de interesse
tem uma distribuio normal multivariada. Antes de desenvolvermos a funo de
densidade normal multivariada, faremos uma reviso da distribuio normal univa-
riada.


4.1 FUNO DENSIDADE NORMAL UNIVARIADA
A distribuio normal padro dada por
g(z) =
) 2 / z (
2
e
2
1

, - < z < (4.1)


com E(z) = 0 e var(z) = 1. Quando z tem a densidade (4.1), dizemos que z distri-
buda como N(0, 1) ou, simplesmente, z ~ N(0, 1).
Para obtermos uma varivel aleatria y com mdia arbitrria e varincia
2
,
usaremos a transformao z = (y )/ ou y = z + , de tal forma que E(y) = e
var(y) =
2
. Para uma funo contnua e crescente (como y = z + ) ou para uma
funo contnua e decrescente, a tcnica de troca de varivel para integral definida d
f(y) = g(z)
dy
dz
(4.2)
onde |dz/dy| o valor absoluto de dz/dy (ver Hogg & Craig, 1995, p.169). Para usar
(4.2) para encontrar a densidade de y, z e dz/dy devem estar expressos em termos de
y. A densidade g(z) dada em (4.1) e para z = (y )/, temos |dz/dy| = 1/. Assim
f(y) = g(z)
dy
dz
=
|
.
|

\
|

y
g

1
=
2 2
2 ) (
e
2
1


/ y
(4.3)
que a densidade normal da varivel y, com E(y) = e var(y) =
2
. Quando y tem a
densidade (4.3), dizemos que y ~ N(,
2
).
Na prxima seo (4.2) usaremos uma extenso multivariada desta tcnica para
encontrar a funo de densidade da normal multivariada.


4.2 FUNO DE DENSIDADE NORMAL MULTIVARIADA
Iniciaremos com as variveis normais padronizadas independentes z
1
, z
2
, ..., z
p
com
i

= 0 e var(z
i
) =
2
i
= 1 para todo i e
ij
= 0 para i j, e as transformaremos em vari-
veis normais multivariadas y
1
, y
2
, ..., y
p
, com mdias, varincias e covarincias arbi-
trrias.

Material elaborado pelo Prof. Csar Gonalves de Lima
65
Comearemos com um vetor aleatrio z = [z
1
, z
2
, ..., z
p
] onde E(z) = 0 e cov(z) = I e
cada z
i
~ N(0,1). Desejamos transformar z em um vetor aleatrio normal multivariado
y = [y
1
, y
2
, ..., y
p
], com E(y) = e cov(y) = , onde um vetor px1 e uma
matriz pxp, positiva definida.

Por (4.1) e uma extenso de (3.12) temos que
g(z
1
, z
2
, ..., z
p
) = g(z ) = g(z
1
) g(z
2
) g(z
p
)
= |
.
|

\
|
) 2 (
2
1
e
2
1
/ z

|
.
|

\
|
) 2 (
2
2
e
2
1
/ z

|
.
|

\
| ) 2 (
2
e
2
1 /
p
z


=
( )
2 /
1
2
2
1

=

p
i
i
z
p
e

=
( )
2
2
1
z/ z'
e
p

(4.4)

Se z tem a densidade (4.4) dizemos que z tem uma densidade normal multiva-
riada com vetor de mdias 0 e matriz de covarincias I, ou que z ~ N
p
(0, I), onde p
a dimenso da distribuio e corresponde ao nmero de variveis em z. Para trans-
formar z em y, com E(y) = e cov(y) = , arbitrrias, definimos
y =
1/2
z + (4.5)
onde
2 1/
a matriz (simtrica) raiz quadrada definida em (2.108). De (3.39) e (3.44)
obtemos
E(y) = E(
2 / 1
z + ) =
2 / 1
E(z) + E() =
2 / 1
(0) + =
cov(y) = cov(
2 / 1
z + ) = cov(
2 / 1
z) =
2 / 1
cov(z)(
2 / 1
) =
2 / 1

2 1/
=
Note a analogia de (4.5) com y = z + na Seo 4.1.

A densidade de y =
2 / 1
z + obtida fazendo uma analogia com o caso uni-
variado e utilizando a mesma tcnica de troca de variveis:
f (y) = g(z) abs ( )
2 1/
(4.6)
onde
2 1/
= ( )
1
2 1

/
e abs ( )
2 1/
o valor absoluto do determinante de
2 1/
.
Como a matriz
2 1/
positiva definida, podemos dispensar o valor absoluto da ex-
presso (4.6) e reescrev-la como
f (y) = g(z) ( )
2 1/
(4.7)
= g(z)
2 1/
(4.8)

Material elaborado pelo Prof. Csar Gonalves de Lima
66
Expressando z =
2 1/
(y ) e usando (4.4) e (4.8), podemos escrever a densidade
de y como
f(y) =
)/2 ( )' (
2 1
1
) 2 (
1
y y
/
| |

e
p
(4.9)
que a funo densidade normal multivariada com vetor de mdias e matriz de co-
varincias . Quando y tem a densidade (4.9) dizemos que y distribuda como
N
p
(, ), ou simplesmente que y ~ N
p
(, ). O ndice p a dimenso da distribuio
normal p-variada e indica o nmero de variveis envolvidas, isto , indica que y um
vetor p x 1, um vetor p x 1 e uma matriz p x p.
Comparando (4.9) e (4.3) podemos perceber que a distncia padronizada, defi-
nida como (y )
1
(y ), aparece no lugar de (y )
2
/
2
no expoente e que a
raiz quadrada da varincia generalizada || aparece no lugar da raiz quadrada de
2
,
no denominador.


4.3 FUNES GERADORAS DE MOMENTOS
(Para maiores detalhes: ver Rencher, 1999, pg. 80-82)

A funo geradora de momentos (f.g.m.) para uma varivel aleatria y definida
como
M
y
(t) = E(
ty
e ) (4.10)
desde que E(
ty
e ) exista para um nmero t na vizinhana h < t < h para algum h
R, positivo. A funo geradora de momentos de y ~N(,
2
) dada por
M
y
(t) =
2
2 2
/ t t
e
+
(4.11)

A f.g.m. caracteriza uma distribuio em alguns aspectos importantes e muito
teis, servindo para gerar os momentos da distribuio. Para uma varivel aleatria
contnua y
M
y
(t) = E(
ty
e ) = ( )


dy y f e
ty

ento (trocando a ordem da integrao e diferenciao):
( )
dt
t dM
y
= ( ) t M
y
'
= ( )


dy y f e y
ty
(4.12)



Material elaborado pelo Prof. Csar Gonalves de Lima
67
Fazendo t = 0 temos o primeiro momento ou a mdia da distribuio
( )
( ) 0
1
= t M
y
=
( )
( ) 0
1
y
M = ( )


dy y f y = E(y) (4.13)
De modo anlogo, o k-simo momento pode ser obtido usando a derivada de ordem k,
avaliada em t = 0:
( )
( ) 0 = t M
k
y
= E(
k
y ) (4.14)
O segundo momento E(y
2
) pode ser usado para encontrar a varincia.
Para um vetor aleatrio y, a funo geradora de momentos (f.g.m.) definida
como
M
y
(t) = E( )
p p 1
y t y t y t
e
+ + + L
2 2 1
= E(
y t'
e ) (4.15)
Por analogia com (4.13) temos que:
( )
t
0 t
y

= M
=
( )
t
0
y

M
= E(y) (4.16)
Similarmente,
( )
s r
t t
M

t
y
2
avaliada em t
r
= t
s
= 0 fornece E(y
r
y
s
), que pode ser usada no
clculo da covarincia entre y
r
e y
s
.

Teorema 4.3A Se y ~ N
p
(, ), sua funo geradora de momentos dada por
M
y
(t) =
2 / t t' t' +
e (4.18)
Prova: ver Rencher, pg. 81 ou Searle, pg. 43-44.

Corolrio 1. A funo geradora de momentos para y
M
y
(t) =
2 / t t'
e (4.22)

Essas duas propriedades da funo geradora de momentos sero muito importantes
nos prximos captulos:
1. Se dois vetores aleatrios tm a mesma funo geradora de momentos, elas tm a
mesma densidade.
2. Dois vetores aleatrios so independentes se e somente se a sua funo geradora
de momentos conjunta puder ser fatorada no produto de suas duas funes gera-
doras de momento individuais; isto , se y= [
, ,
y , y
2 1
] e t= [
, ,
t t
2 1
, ], ento y
1
e y
2

so independentes se e somente se
M
y
(t) = M
y
1
(t
1
) M
y
2
(t
2
) (4.23)

Material elaborado pelo Prof. Csar Gonalves de Lima
68

4.4 PROPRIEDADES DA DISTRIBUIO NORMAL MULTIVARIADA

Teorema 4.4A. Seja y ~ N
p
(, ), seja a um vetor p x 1 de constantes e A uma matriz
k x p de constantes, de posto k p. Ento
(i) z = ay ~ N(a, aa)
(ii) z = Ay ~ N
k
(A, AA)

Corolrio 1. Se b um vetor k x 1 de constantes ento
z = Ay + b ~ N
k
(A + b, AA)

Teorema 4.4B. Se y ~ N
p
(, ) ento qualquer subvetor rx1 de y tem uma distribui-
o normal r-variada com mdias, varincias e covarincias iguais s da distribuio
normal p-variada original.

Corolrio 1. Se y ~ N
p
(, ) ento qualquer varivel individual y
i
em y distribuda
como N(
i
,
ii
).

Usando a notao de (3.5), na qual o vetor v particionado em dois vetores
denotados por y e x, de dimenses p x 1 e q x 1, respectivamente. Com essa partio,
o vetor de mdias e a matriz de covarincias para v ficam:
v =
(

x
y
= E(v) =
(

x
y

= cov(v) =
(

xx xy
yx yy




Teorema 4.4C. Se o vetor particionado v =
(

x
y
N
p+q
(, ) ento y e x so inde-
pendentes se
xy
= 0.

Corolrio 1. Se y ~ N
p
(, ), ento quaisquer duas variveis individuais y
i
e y
j
so
independentes se
ij
= 0.

Corolrio 2. Se y ~ N
p
(, ) e se cov(Ay, By) = AB = 0 ento Ay e By so inde-
pendentes.


Material elaborado pelo Prof. Csar Gonalves de Lima
69
Teorema 4.4D. Se y e x tm distribuio conjunta normal multivariada com
yx
0
ento a distribuio condicional de y dado x, f(y | x), normal multivariada com
vetor de mdia e matriz de covarincias dados por:
E(y | x) =
y
+ ) (
1
x xx yx
x

(4.26)
cov(y | x) =
yy

xy
1


xx yx
(4.27)
(Prova: ver Rencher, pg. 84-85)

Desde que a expresso (4.26) uma funo linear de x, qualquer par de vari-
veis y
i
e y
j
em um vetor normal multivariado exibe uma tendncia linear E(y
i
| y
j
) =
i

+ (
ij
/
jj
)(y
j

j
). Deste modo, a covarincia
ij
est relacionada com a inclinao da
reta. Nos casos de variveis no normais que exibem uma tendncia curvilnea,
ij

pode dar uma indicao muito enganadora da relao, como ilustrado no Exemplo
3.2.
A matriz de covarincias condicionais em (4.26) no envolve x. Por outro lado,
para algumas distribuies no-normais, cov(y | x) uma funo de x.

Corolrio 1. Se v = [y, x
1
, ..., x
q
] = [y, x] com =
(

e =
(
(

xx x
x


y
y y

t 2
, ento
y | x tem distribuio normal (univariada) com
E(y | x) =
y
+
t
yx
) (
1
x xx
x

(4.33)
var(y | x) =
2
y

t
yx

1
xx

x y
(4.34)

Como em (4.34),
t
yx

1
xx

yx
0 porque
1
xx
positiva definida, ento
var(y | x) var(y) (4.35)

Exemplo 4.4(a). Para ilustrar os Teoremas 4.4.A, 4.4B e 4.4C, seja y ~ N
3
(, ) com
=
(
(
(

2
1
3
e =
(
(
(


3 1 2
1 1 0
2 0 4


i) Para z = y
1
2y
2
+ y
3
= [1 2 1] y = ay a = 3 e aa = 19 e pelo Teorema
4.4.A(i), z ~ N(3, 19)

Material elaborado pelo Prof. Csar Gonalves de Lima
70
ii) As funes lineares z
1
= y
1
y
2
+ y
3
e z
2
= 3y
1
+ y
2
2y
3
podem ser escritas
z =
(

2
1
z
z
=
(

2 1 3
1 1 1
(
(
(

3
2
1
y
y
y
= Ay
Ento, pelos Teoremas 3.6B(i) e 3.6D(i),
A =
(

6
4
e AA =
(

29 4
4 14

e pelo Teorema 4.4A(ii), temos que z ~ N
2
|
|
.
|

\
|
(

29 4
4 14
6
4
.

iii) Para ilustrar a distribuio marginal no Teorema 4.4B, vale notar que y
1
~ N(3, 4),
y
2
~ N(1, 1) e y
3
~ N(2, 3), e que
(

2
1
y
y
~ N
2
|
|
.
|

\
|
(

1 0
0 4
1
3
e
(

3
1
y
y
~ N
2
|
|
.
|

\
|
(

3 2
2 4
2
3


iv) Para ilustrar o Teorema 4.4.C note que
12
= 0 y
1
e y
2
independentes.


Exemplo 4.4(b). Para ilustrar o Teorema 4.4D, consideremos v ~ N
4
(, ), onde
=
(
(
(
(

1
2
5
2
e =
(
(
(
(



7 3 2 3
3 6 1 3
2 1 1 0
3 3 0 9

i) Se v particionado como v = [y
1
, y
2
, x
1
, x
2
] ento

y
=
(

5
2
,
x
=
(

1
2
,
yy
=
(

1 0
0 9
,
yx
=
(

2 1
3 3
e
xx
=
(


7 3
3 6

De (4.26) e (4.27) obtemos:
E(y | x) =
y
+ ) (
1
x xx yx
x


=
(

5
2
+
(

2 1
3 3
1
7 3
3 6

(

+
1
2
2
1
x
x
=
(
(
(

+
+ +
2 1
2 1
11
3
33
1
3
14
11
9
11
10
3
x x
x x


Material elaborado pelo Prof. Csar Gonalves de Lima
71
cov(y | x) =
yy

xy
1


xx yx

=
(

1 0
0 9

(

2 1
3 3
1
7 3
3 6

(


2 3
1 3
=
(


14 24
24 126
33
1

Assim, y | x ~ N
2
|
|
|
|
.
|

\
|
(


(
(
(

+
+ +
14 24
24 126
33
1
,
11
3
33
1
3
14
11
9
11
10
3
2 1
2 1
x x
x x



Exemplo 4.4(c). Para ilustrar o Corolrio 1 do Teorema 4.4D, continuamos com o
vetor v ~ N
4
(, ), onde e dados no Exemplo 4.4(b). Se v particionado como
v = [y, x
1
, x
2
, x
3
] ento e ficam
=
(
(
(
(

1
2
5
2
e =
(
(
(
(



7 3 2 3
3 6 1 3
2 1 1 0
3 3 0 9

i) De (4.33) temos que:
E(y | x
1
, x
2
, x
3
) =
y
+
,
x

y
) (
1
x xx
x


= 2 + | | 3 3 0
1
7 3 2
3 6 1
2 1 1

|
|
|
.
|

\
|
(
(
(



(
(
(

1
2
5
3
2
1
x
x
x

=
7
95

1
7
12
x +
2
7
6
x +
3
7
9
x
ii) De (4.34) ns obtemos
var(y | x
1
, x
2
, x
3
) =
2
y

,
x y

1
xx

x y

= 9 | | 3 3 0
1
7 3 2
3 6 1
2 1 1

(
(
(



(
(
(

3
3
0
=
7
18

Assim, temos que y| x
1
, x
2
, x
3
~ N
|
.
|

\
|
+ +
7
18
,
7
9
7
6
7
12
7
95
3 2 1
x x x . Note ainda que
var(y | x
1
, x
2
, x
3
) =
7
18
< var(y) = 9, o que ilustra (4.35).

Material elaborado pelo Prof. Csar Gonalves de Lima
72
4.5 CORRELAO PARCIAL
A seguir, definiremos a correlao parcial de y
i
e y
j
ajustada para um subconjunto de
outros ys. Por convenincia, usaremos a notao dos Teoremas 4.4C e 4.4D, admi-
tindo que y formado por um subconjunto de ys que inclui as variveis y
i
e y
j
e x,
pelos outros ys.

Seja v ~ N
p+q
(, ) e seja v, , e particionadas como no Teorema 4.4C e
4.4D:
v =
(

x
y
, =
(

x
y

e =
(

xx xy
yx yy



A covarincia de y
i
e y
j
na distribuio condicional de y dado x ser denotada por
q rs ij ... .
, onde y
i
e y
j
so duas variveis em y e x = [y
r
, y
s
, ..., y
q
]. Desse modo
q rs ij ... .
o (ij)-simo elemento de cov(y | x) =
yy

xy
1


xx yx
. Por exemplo:
13.567

representa a covarincia entre y
1
e y
3
na distribuio condicional de y
1
, y
2
, y
3
, y
4
dado
y
5
, y
6
e y
7
(neste caso x = [y
5
y
6
y
7
]). De modo anlogo,
.567 22
representa a
varincia de y
2
dado y
5
, y
6
e y
7
.

Definimos o coeficiente de correlao parcial (populacional) entre y
i
e y
j
, na
distribuio condicional de y dado x, onde x = [y
r
, y
s
, ..., y
q
], como
q rs ij ... .
=
q rs jj q rs ii
q rs ij
... . ... .
... .


(4.36)
O coeficiente de correlao parcial amostral,
q rs ij
r
... .
, ser discutido posteriormente,
na seo 10.7.

A matriz de correlaes parciais pode ser obtida a partir de (3.28) e de (4.27)
como
y.x
=
1
y.x
D
y.x

1
y.x
D (4.37)
onde
y.x
= cov(y | x) =
yy

xy

1
xx yx

e
y.x
D = [diag(
y.x
)]
1/2
.

A menos que y e x sejam independentes (
y.x
= 0), a correlao parcial
q rs ij ... .

diferente da correlao usual
ij
=
jj ii ij
, podendo at ter sinal contrrio.
Para mostrar isso, vamos expressar
q rs ij ... .
em termos de
ij
. Primeiramente, vamos
escrever
yx
em termos de suas linhas,

Material elaborado pelo Prof. Csar Gonalves de Lima
73
yx
= cov(y, x) =
(
(
(
(
(

q p p p
q
q
x y x y x y
x y x y x y
x y x y x y



L
M O M M
L
L
2 1
2 2 2 1 2
1 2 1 1 1
=
(
(
(
(
(

t
t
t
px
2x
1x

(4.38)
onde
t
x i
= [
1
x y
i
,
2
x y
i
, ...,
q i
x y
] a i-sima linha de
yx
. Ento,
q rs ij ... .
o (ij)-
simo elemento de
y.x
=
yy

xy xx yx

1
que pode ser escrito como
q rs ij ... .
=
ij

t
x i

1
xx

x j
(4.39)
Supondo que
ij
seja positivo, ento
q rs ij ... .
< 0 se
t
x i

1
xx

jx
>
ij
. Desde que
1
xx

positiva definida, (4.39) mostra que
q rs ii ... .
=
ii

t
x i

1
xx

jx

ii
.

Exemplo 4.5. Vamos comparar
12
com
12.34
usando e do Exemplo 4.4(b). De
temos que

12
=
22 11
12

=
) 1 )( 9 (
0
= 0
Da matriz cov(y |x) =
(


14 24
24 126
33
1
, obtemos

34 . 12
=
34 . 34 .
34 .
22 11
12


=
) 33 / 14 )( 33 / 126 (
33 / 24
=
) 14 )( 126 (
24
= 0,571

que mostra a diferena entre o valor da correlao (usual) e a correlao parcial.


EXERCCIOS
Ver exerccios das pginas 90-92 do livro-texto.

You might also like