You are on page 1of 73

Econometria Prof. Adriano M. R.

Figueiredo

UNIVERSIDADE FEDERAL DE MATO GROSSO


FACULDADE DE ECONOMIA

Econometria
Prof. Adriano Marcos Rodrigues Figueiredo
Verso de 21/01/20081

CUIAB - MT

Os direitos de reproduo pertencem ao autor e requer citao apropriada.

Econometria Prof. Adriano M. R. Figueiredo

SUMRIO
1.
2.

3
4

5
6.

Introduo.......................................................................................................................... 3
Pressuposies do Modelo de Regresso Linear Clssico ................................................ 4
2.1. Pressuposio 1: A relao entre Y e X linear......................................................... 6
2.2. Pressuposio 2: O erro aleatrio tem mdia zero ..................................................... 9
2.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de
homocedasticidade) ............................................................................................................... 9
2.4. Pressuposio 4: Os erros aleatrios so independentes (ou no
autocorrelacionados) ............................................................................................................ 10
2.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 11
2.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia
constante: ............................................................................................................................. 11
2.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis
explicativas (no multicolinearidade) .................................................................................. 12
Estimao ........................................................................................................................ 13
Anexo 1: Estimao utilizando matrizes no Excel: ............................................................. 19
Anexo 2: Exerccios: ............................................................................................................ 20
Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear ..................... 24
4.1. Pressuposio 1: A relao entre Y e X linear....................................................... 24
4.2. Pressuposio 2: O erro aleatrio tem mdia zero ................................................... 31
4.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de
homocedasticidade) ............................................................................................................. 37
4.4. Pressuposio 4: Os erros aleatrios so independentes (ou no
autocorrelacionados) ............................................................................................................ 53
4.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 65
4.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia
constante: ............................................................................................................................. 65
4.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis
explicativas (no multicolinearidade) .................................................................................. 68
4.8. Resumo ..................................................................................................................... 72
Referncias Bibliogrficas .............................................................................................. 73
Programas Recomendados .............................................................................................. 73

Econometria Prof. Adriano M. R. Figueiredo

1. Introduo
A Econometria como a utilizao da estatstica aplicada economia tem como
instrumento fundamental a anlise de regresso, que consiste na obteno dos parmetros para
uma dada relao existente entre as variveis dependentes e independentes.
Na regresso linear simples (RLS), estima-se a relao existente entre apenas 2
variveis, uma dependente (endgena ou explicada), Y, e uma independente (exgena ou
explicativa ou explicadora), X, como uma funo matemtica qualquer: Y = f (X).
Na regresso linear mltipla (RLM), estima-se a relao existente entre mais de duas
variveis: Y = f (X1, X2, ..., Xn).
O modelo a ser estimado normalmente possui componente aleatrio, requerendo a
incluso de um erro que captar os efeitos das variveis importantes para explicar Y, mas que
no esto no modelo. Representa-se ento, o efeito das demais variveis explicativas por um
termo aditivo ui, denominado resduo ou erro. O modelo torna-se:
cuja expresso geral matricial
em que uma matriz de parmetros a serem estimados (incluindo o intercepto e os
coeficientes angulares) e um vetor de resduos ou erros aleatrios.
O formato matricial linear aberto ser:

Y1 1 X 11
Y 1 X
21
2 =
M M M

Yn 1 X n1

L X 1k 0 1
L X 2 k 1 2

+
O M M M

L X nk k n

Portanto, tm-se as matrizes assim nomeadas:

Y1
1 X 11
Y
1 X
2
21

Y=
;X =
M
M M

Yn n x 1
1 X n1

L X 1k
0
1


L X 2k
1

; =
; = 2
M
M
O M



L X nk n x ( k +1 )
k ( k +1 ) x 1
n n x 1

A disperso dos pontos em torno da reta o resultado de um grande nmero de


pequenas causas, cada uma delas produzindo um desvio positivo (+) ou negativo (). O desvio
ser a diferena entre o valor observado e o valor estimado da varivel dependente do modelo.
Portanto, tem-se ui devido a:


omisso de variveis

Econometria Prof. Adriano M. R. Figueiredo

problemas de especificao

erros de medida da varivel dependente

Pode-se dizer que Y nunca pode ser previsto exatamente. Portanto, para cada valor de
X, existe uma distribuio de probabilidade dos valores de Y, com mdia
e varincia constante 2.
O objetivo da anlise de regresso estimar uma curva atravs da nuvem de pontos do
diagrama de disperso, sendo que a forma da curva deve ser pressuposta pelo pesquisador.
Neste caso, a teoria a respeito da relao estudada, a anlise da disperso dos pontos e os
estudos anteriores acerca desta relao ajudaro nesta definio.

2. Pressuposies do Modelo de Regresso Linear


Clssico
O modelo clssico de anlise de regresso construdo com base numa srie de
pressuposies referentes ao comportamento da populao. Estas pressuposies so descritas
no Quadro 1. Conhecidas essas pressuposies, ser possvel estimar os parmetros do
modelo, assim como a matriz de varincia e covarincia dos mesmos e a respectiva matriz
para os resduos.

Econometria Prof. Adriano M. R. Figueiredo

Quadro 1. Pressuposies do Modelo de Regresso Linear Clssico Normal


Expresso Matemtica*
Pressuposio

1. Relao Linear

2 . Mdia do erro zero


3. Varincia do erro constante
4. Erros independentes
5. Variveis explicativas so noestocsticas ou fixas
6. Independncia linear entre as variveis
explicativas

Problema
(o que acontece se as
pressuposies no forem atendidas)

Notao Escalar

Notao Matricial

Yi=0 + 1 Xi1 + ... + k Xik + i


em que i =1, 2, 3,..., n

Y = X +

No linearidade,
Erro de especificao dos Xs

E(i) = 0 para todo i

E() = 0, onde e 0 so vetores nX1

Erro de especificao

E(i) = , para todo i


E(ij) = 0, i j

Heterocedasticidade
E() = I

Autocorrelao

X1, X2, ..., Xk so fixos


Cov(Xij, i) = 0
p/ j= 1, 2, 3, ..., n

A matriz X no-estocstica
Cov(X, ) = 0

Erros nas variveis,


Varivel dependente defasada,
Relaes simultneas

Ausncia de relao linear entre os


Xs

Posto de X igual ao seu nmero de


colunas, isto ,
(X) = p < n

Multicolinearidade

i ~ N (0, )
Erros no-normais
~ N (0, I)
i = 1, 2, 3, ..., n
* Em que Y = [Yi] um vetor nX1 das observaes da varivel dependente; X = [Xij] uma matriz nXp das observaes das variveis independentes; = [i]
um vetor nX1 dos erros aleatrios; = [j], j = 0, 1, 2, ..., k um vetor pX1 de parmetros a serem estimados; a varincia do erro, tambm a ser estimada; I
uma matriz identidade de ordem mXn; k o nmero de variveis independentes; p = K + 1 o nmero de parmetros; n o nmero de observaes; E
significa valor esperado ou esperana matemtica.
Agradeo a Andrea Francisca Conceio Mendes pela digitao desta tabela.
7. Erro tem distribuio normal

Econometria Prof. Adriano M. R. Figueiredo

A seguir faz-se a descrio rpida das pressuposies do modelo clssico de regresso.

2.1. Pressuposio 1: A relao entre Y e X linear

Forma funcional

Esta pressuposio em princpio implica na considerao de uma reta estimada, ou seja,


uma funo linear nas variveis do tipo
Yi = 0 + 1 X 1i + 2 X 2i + K + k X ki + i
ou pela forma matricial:
Y = X +
em que Y o vetor de variveis explicadas, X uma matriz de variveis explicativas
(incluindo uma coluna de uns para o intercepto) e um vetor de resduos aleatrios.
Entretanto, deve-se atentar para outros tipos de linearidades implcitas na
pressuposio. Tm-se os seguintes tipos de linearidades: linearidade das variveis
explicativas (X) e linearidade dos parmetros (). A no-linearidade nas variveis s vezes
pode ser contornada por transformaes nas variveis, mas a no-linearidade dos parmetros
mais complicada e requer outros mtodos de estimao no-lineares.
fcil imaginar que o comportamento de um fenmeno econmico no segue a
relao retilnea, como por exemplo, as tradicionais relaes de oferta e demanda no
necessariamente sero retas que se cruzam. muito mais fcil admitir que o comportamento
de variveis econmicas seja curvilneo.
Quando as variveis explicativas so elevadas a alguma potncia diferente de um, a
funo que relaciona o comportamento dessas variveis com a varivel explicada ser
diferente de uma reta e os estimadores tradicionais de Mnimos Quadrados Ordinrios
(M.Q.O.) no mais sero vlidos.
Existem modelos que so chamados de intrinsecamente lineares, ou que podem se
tornar lineares por transformao das variveis. O caso mais comum na literatura econmica
o de funes do tipo Cobb-Douglas, ou seja,

Y = AX11 X 2 2 X 3 3 e
em que os parmetros podem assumir valores diferentes de um e, ainda, tem-se a
multiplicao de variveis explicativas. A funo acima pode ser linearizada transformandose as variveis em logaritmos, obtendo:
lnY = lnA + 1.lnX1 + 2.lnX2 + 3. lnX3 +

Econometria Prof. Adriano M. R. Figueiredo

ou, simbolizando o ln por *:

Y * = 0 + 1X1* + 2 X *2 + 3 X *3 +
A funo linearizada pode ser estimada da forma tradicional lembrando que os
parmetros estimados sero agora da funo transformada, que no caso log-log (CobbDouglas), equivalem s elasticidades. A funo transformada pode ser vista como linear nos
parmetros (os parmetros so todos em primeira potncia) e nas variveis transformadas
(X*=lnX).
Outros modelos no podem ser transformados e so os chamados intrinsecamente nolineares. Por exemplo, possvel perceber que a funo abaixo no pode ser linearizada:

Y = A1 + 2 e 3X1 + 4 e5X 2 + e
Esses modelos devem ser estimados por Mnimos Quadrados No-Lineares ou
Mxima Verossimilhana No-Linear.
Algumas formas funcionais utilizadas em economia da produo podem ser:

Cobb-Douglas logaritmizada:

log y = a 0 + a i log x i
i =1

y = a 0 + a i x i

CES:

i =1

Generalizada Leontief:

i =1

i =1 j=1

Translog:

log y = a 0 + a i log x i + a ij log x i log x j


i =1

Quadrtica:

y = a 0 + a i x i + a ij x i x j

i =1 j=1

y = a 0 + a i x i + a ij x i x j
i =1

i =1 j=1

A utilizao de uma forma mais complexa em detrimento de uma mais simples


depender da disposio dos dados e do rigor cientfico desejado. A funo Cobb-Douglas de
modo geral oferece um ajustamento satisfatrio e fcil de executar. As funes elasticidade
de substituio constante (CES), Generalizada Leontief, Transcendental Logartmica e
Quadrtica so generalizaes da funo Cobb-Douglas para contornar pressuposies

Econometria Prof. Adriano M. R. Figueiredo

econmicas de substitutibilidade dos fatores e produtos ou ainda de concorrncia perfeita,


entre outras situaes.
Juntamente ao problema da forma funcional (linearidade dos parmetros e variveis),
quando se especifica um modelo, automaticamente esto sendo cometidos outros dois tipos de
erros que podero ou no comprometer a anlise. Um est associado omisso de uma
varivel relevante e outro associado incluso de varivel irrelevante.

Omisso de varivel relevante


Imagine que a reviso de literatura, reviso terica, indique que a quantidade

demandada (Q) de um produto seja funo do preo do produto (P) e da renda (R), e que o
comportamento da demanda do produto analisado na realidade est em conformidade com a
teoria. O modelo correto seria:
(A) Qt = 0 + 1.Pt + 2.Rt + t*
em que os so parmetros estimados e o resduo aleatrio.
Imagine agora que, por algum motivo, estimou-se a demanda em funo apenas do
preo do produto, fazendo:
(B) Qt = 0 + 1.Pt + t.
em que so parmetros e as demais variveis como anteriormente citadas.
A questo : quais as conseqncias sobre os estimadores de M.Q.O. (ou sobre os
estimados)? Qual o efeito sobre 0 e 1 em razo da excluso de R do modelo?
Se Pt for altamente correlacionado com Rt, a retirada de Rt trar um alto vis (alta
tendenciosidade) e os parmetros estimados sero muito diferentes do valor esperado:
estimado E()
ou seja, os parmetros estimados sero inconsistentes e no limite E() .
Os testes de hipteses no sero vlidos e as estimativas de varincias tambm sero
tendenciosas.

Incluso de varivel irrelevante


Imagine agora a situao inversa: o modelo estimado contempla mais variveis

explicativas do que as que deveriam estar no modelo correto. Imagine que o modelo deveria
ter apenas P e que foi estimado com P e Z, sendo Z uma varivel irrelevante no modelo.
(A) Qt = 0 + 1.Pt + t.

modelo correto

(B) Qt = 0 + 1.Pt + 2.Zt + t* modelo estimado


e que Z no tem relevncia terica.
A questo : quais as conseqncias de , em razo da incluso de Zt, sobre ?

Econometria Prof. Adriano M. R. Figueiredo

As conseqncias da incluso de uma varivel irrelevante sero menos problemticas


que no caso da omisso de uma varivel relevante. Primeiro, a presena das variveis
irrelevantes no viesa as outras estimativas. Segundo, aumentam-se a varincia dos
parmetros e o desvio-padro. Tende, portanto, a fazer com que seja no significativo,
mas aumenta o coeficiente R2.

2.2. Pressuposio 2: O erro aleatrio tem mdia zero


Significa que o erro tem uma distribuio de probabilidade centralizada em zero (com
mdia zero). O erro o efeito das variveis que no consigo explicar no modelo. A mdia
pode ser considerada como o valor esperado do erro, ou seja,
E (i) = 0 ,

i = 1, 2, ..., n

Ou na forma matricial,
E() = 0
Dado que E() = 0, ento E(Y) = E[ X + ] = E[ X] +E[ ] = E[ X] + 0
Portanto, E(Y) = X e o modelo fornece solues adequadas estatisticamente. Essa
pressuposio importante para ter confiana na estimao por = (XX)-1XY. Caso os
erros no tenham mdia zero, o estimador = (XX)-1XY ser tendencioso.

2.3. Pressuposio 3: O erro aleatrio tem varincia constante


(presena de homocedasticidade)
A varincia calculada com base no valor esperado do quadrado da diferena entre a
mdia e o valor esperado da mdia. Ou seja, a definio estatstica
V(ei) = E [ei E (ei)]2
V(ei) = E (ei2) = 2 (populacional) para todo i
ou seja, presena de Homocedasticidade nos resduos. A presena da homocedasticidade
implica que a varincia para todos os resduos a mesma.
O caso contrrio ser:
V(ei) = E (ei2) = i2

presena de Heterocedasticidade

O problema de heterocedasticidade tpico de dados de seo cruzada. Pode


significar, por exemplo, uma heterogeneidade da amostra. A disperso dos valores para cada

Econometria Prof. Adriano M. R. Figueiredo

10

observao diferente entre as observaes. A amostra vem de uma populao onde os erros
no so homogneos.

2.4. Pressuposio 4: Os erros aleatrios so independentes (ou


no autocorrelacionados)
Neste caso pressupe-se que os erros de uma observao no afetam os erros do
perodo seguinte, e assim sucessivamente.
COV(ei ,ej) = E { [ei E(ei)] [ej E(ej)] }
E (ei, ej) = 0, i j
esta pressuposio denominada ausncia de autocorrelao. A violao desta
pressuposio um problema tpico de sries temporais.
Quando se trabalha com ajustamentos de sries temporais, essa pressuposio em geral
no obedecida, visto que nas sries temporais como, por exemplo, as sries de preos, de
salrios e de produo tm no seu comportamento o reflexo de movimentos cclicos e/ou
sazonais.
Algumas causas da autocorrelao nos resduos esto relacionadas a variveis noespecificadas no modelo, forma funcional inadequada e inrcia temporal no fenmeno.
A principal conseqncia da violao desta pressuposio a ineficincia dos
estimadores de M.Q.O. mas, continuam no-tendenciosos. Nesta situao, da mesma forma
que para a heterocedasticidade, melhor utilizar o mtodo de Mnimos Quadrados
Generalizados (M.Q.G.).
2.4.1 Investigao acerca da Matriz de Varincia e Covarincia dos resduos
A anlise da Matriz de Varincia e Covarincia dos resduos, doravante chamada de
Var-cov(), permite interpretar as pressuposies de presena de homocedasticidade dos
resduos e presena da no autocorrelao dos resduos numa mesma matriz.
Seja o vetor de resduos do tipo:

1

= 2
M

n n x 1

Econometria Prof. Adriano M. R. Figueiredo

11

Ento, sua transposta ser: ' = [ 1 2 L n ]1 x n

. Assim, a matriz var-cov() ser:

21
1 2

2
2 1 2
Var Cov ( ) = E ( ) = E
M
M
n 1 n 2

0
2
E ( ) = I = E
M

0
2

M
0

L 1 n

L 2 n

O
M
L 2n

L 0
O M

L 2
L

Assim, ao escrever que var-cov() = 2.I, ao mesmo tempo se diz que as varincias so
homocedsticas iguais a 2 (diagonal principal tem todos os valores iguais a 2, i=j) e que as
autocorrelaes entre resduos de observaes distintas so nulas (valores nulos fora da
diagonal principal, ij).

2.5. Pressuposio 5: As variveis explicativas so no aleatrias


(so fixas)
Neste caso, pressupem-se fixos os valores da varivel explicativa e observa-se o que
ocorre com a varivel dependente. Se o X aleatrio, mas independente do erro, pode-se
mostrar que os parmetros estimados sero no-tendenciosos.
Entretanto, se as variveis explicativas e os termos aleatrios forem correlacionados,
haver inconsistncia dos estimadores de mnimos quadrados ordinrios. Deve-se utilizar o
estimador de variveis instrumentais. O mtodo de Variveis instrumentais prev que
= (ZX)-1ZY , e Z uma matriz de instrumentos independentes dos erros aleatrios.

2.6. Pressuposio 6: O erro tem distribuio normal, com mdia


zero e varincia constante:
Esta pressuposio pode ser especificada da forma:
i N (0, 2) ,

i = 1, 2, ..., n

As conseqncias associadas a no-normalidade dos resduos so parmetros


estimados no-normais e no ser possvel fazer os testes de hipteses com distribuies
baseadas na normal, como os usuais testes t e F para avaliar a qualidade dos

Econometria Prof. Adriano M. R. Figueiredo

12

ajustamentos, e para construir intervalos de confiana para os parmetros conforme exposto


ao longo do curso.
Os estimadores continuam sendo os Melhores Estimadores Lineares NoTendenciosos (MELNT).

2.7. Pressuposio 7: Ausncia de relao linear exata entre as


variveis explicativas (no multicolinearidade)
Considere a matriz de variveis explicativas como composta por colunas das variveis
X1, X2, ... , Xn e ainda uma coluna de 1 para incluir o intercepto.
A pressuposio prev a no existncia de qualquer relao linear, como por exemplo,
X1 = 2.X2
X1 + 3.X2 = X5
No mtodo de mnimos quadrados ordinrios, a existncia de uma relao linear entre
os Xs representa uma reduo no posto da matriz (X) e o determinante de XX ser prximo
de zero. No caso de uma relao linear exata, haver uma singularidade perfeita na matriz
XX e seu determinante ser prximo de zero.
Como o mtodo de mnimos quadrados ordinrios prev a inverso da matriz XX, o
determinante prximo de zero far com que os parmetros sejam indeterminados. A matriz
(XX)-1 no existir e no ser possvel estimar o modelo.
O problema da correlao entre as variveis explicativas pode ser visto da seguinte
maneira:
1) ausncia de correlao ou ausncia de multicolinearidade: a regresso mltipla d o mesmo
resultado que as regresses simples quando as correlaes parciais entre as variveis
explicativas forem nulas;
2) correlao perfeita ou multicolinearidade perfeita: a relao linear perfeita entre os Xs
causa a indeterminao de = (XX)-1XY pois (XX)-1 singular;
3) alto grau de correlao entre os Xs ou multicolinearidade imperfeita: multicolinearidade
Multicolinearidade: problema relacionado com fortes correlaes entre as variveis
explicativas no modelo de regresso

Econometria Prof. Adriano M. R. Figueiredo

13

O enfoque diferente das outras pressuposies: um problema da amostra, enquanto


as outras pressuposies se referiam mais ao erro e populao, enquanto esta se refere mais
amostra. No se trata, portanto, de testar a pressuposio, mas sim de pensar como lidar com
o problema.
Conseqncias da multicolinearidade:

Tericas: conseqncias sobre as propriedades dos estimadores de M.Q.O.; a


multicolinearidade no afeta em nada as propriedades dos estimadores de M.Q.O.,
que continuam os melhores estimadores lineares no-tendenciosos (MELNT);

Prticas:
1. aumenta as varincias dos parmetros estimados:
aumenta V() = s2(XX)-1
(XX)-1 = (1/|XX|) . Adj(XX)
como |XX| 0 => (XX)-1 e V()
2. aumenta erro-padro
3. reduz t => induz no-significncia => estarei aceitando o fato de que ela
no importante no modelo em virtude da multicolinearidade
4. Estimativas muito sensveis: tirando uma ou duas observaes, as estimativas
alteram muito => melhor ter um modelo onde as alteraes no alteram
muito as estimativas, uma certa estabilidade do modelo em termos de
magnitudes e sinais

3 Estimao

A estimao dos parmetros do modelo linear pressupe a satisfao aos pressupostos


bsicos anteriormente mencionados. O princpio que norteia os clculos obter valores de
parmetros que minimizem a Soma do Quadrado dos Resduos - SQRes.
Ou seja, para o modelo
FORMA ALGBRICA: Min i2 = (Yi 0 1X1i 2X2i)2
FORMA MATRICIAL: Min ou Min SQRes

Econometria Prof. Adriano M. R. Figueiredo

14

O problema matemtico de otimizar, ou seja, minimizar um produto de um vetor


linha por um vetor coluna. Portanto, deriva-se e iguala a zero obtendo a soluo para o vetor
de parmetros. Segue abaixo:

Y X

' = Y X

)(


X Y +
X X

' = Y Y Y X
( ' )
=0
= 2 X Y + 2 X X

= X Y
X X

Sistema de equaes normais dos


mnimos quadrados

= ( X X )1 X Y

Vlida para no
multicolinearidade de X
Portanto, o estimador dos parmetros pelo mtodo de Mnimos Quadrados Ordinrios
(MQO) :
1

X Y
(k+1 x 1) = ( X X )

Assim, com as matrizes X e Y posso obter os parmetros estimados.


O estimador da varincia dos resduos ser s2, para os (n-p) Graus de Liberdade (GL =
nmero de observaes, n, menos o nmero de parmetros, p):
s2 =

ee
SQRes SQRes
=
=
n p
n p
G.L.

A matriz de varincia-covarincia dos parmetros ser:

)= E

Var Cov(

mas
= ( X X )1 X Y

)(

= ( X X )1 X ( X + ) = ( X X )1 X X + ( X X )1 X

= I . + ( X X )1 X

= ( X X )1 X

) = E ( X X )1 X ( X X )1 X
Var Cov(

1
1
) = E ( X X ) X X ( X X )
Var Cov(

)(

Mas como X so fixas, independentes dos resduos, o valor esperado se reduz a:

Econometria Prof. Adriano M. R. Figueiredo

15

) = ( X X )1 X E [ ] X ( X X )1
Var Cov(
) = ( X X )1 X 2 IX ( X X )1
Var Cov(
Ou seja,
) = 2 ( X X ) X X ( X X )
Var Cov(
1

) = 2 I ( X X )1
Var Cov(
) = 2 ( X X ) 1
Var Cov(
ou
) = s 2 ( X X )1
Var Cov(

Desta forma, tem-se as equaes essenciais para a estimao. Segue quadro resumo
abaixo, com os estimadores de MQO.
Quadro 2. Estimadores de Mnimos Quadrados Ordinrios.
Estimadores dos
parmetros

= ( X X )1 X Y

ee
SQRes SQRes
=
=
n p
n p
G.L.
) = s 2 ( X X )1
Var Cov(

Estimador da varcov dos resduos

s2 =

Estimador da varcov dos parmetros

O valor dos erros padres dos parmetros sero obtidos a partir da raiz da varincia
dos parmetros, ou seja, tirando-se a raiz da diagonal principal da var-cov().
Os parmetros devem ter anlise de significncia, por meio de um teste de hiptese do
tipo t-Student:
H0 : j = 0
H1 : j 0
tcalculado =

( bilateral )

j
s

~ tn p
G .L.

Os softwares economtricos em geral disponibilizam o valor da probabilidade (pvalue) associado ao valor de t calculado. Desta forma, pode-se comparar com nveis
predeterminados de significncia para rejeitar ou no a hiptese nula. Em geral, costuma-se
observar os p-values comparando a 10%, 5% ou 1% para concluir a respeito da hiptese nula.
Espera-se, para que a varivel X tenha efeito no-nulo sobre Y, que rejeite-se a hiptese nula
e que assim, os valores calculados dos parmetros permitam uma interpretao econmica
deste efeito.

Econometria Prof. Adriano M. R. Figueiredo

16

Para auxiliar o entendimento, possvel decompor a variao de Y como abaixo:

Y
(reta estimada)

Variao total = variao explicada por X + variao no-explicada

: variao devida regresso

SQTot=SQReg + SQRes

Em que SQTot a soma dos quadrados totais (relativa variao total), SQRes a
soma do quadrado dos resduos (relativa variao no explicada) e SQReg a soma dos
quadrados da regresso (relativa variao explicada por X).
SQTot = yi2 = yi2 + 2 yi e i + e i2 = ( Yi Y ) = Y Y nY 2
2

X Y
SQRes = e i2 = e' e = Y Y

SQReg = yi2 = Yi Y

= Y Y nY 2

SQTot = SQReg + SQRes


O coeficiente de determinao (R2 R-squared) utilizado para avaliar quanto da
variao total explicada. Define-se como:

Econometria Prof. Adriano M. R. Figueiredo

17

Seu intervalo de variao de zero a um em condies normais: 0 < R2 < 1.


Se SQRes=SQT ento R2=0.
Se SQRes 0 ento R2=1.
Ou seja, mede quanto da Variao de Y est sendo explicada por Variaes de X, ou
seja, mede a qualidade do ajustamento. Procura-se estimar um modelo com o maior R2
possvel. Em geral, acredita-se ter um modelo bem ajustado para valores maiores que 0,8, mas
sempre se deve ter cautela quanto a esses indicadores usualmente aceitos.
Na forma matricial, o clculo ser;
R2 =

X Y nY 2
X Y

Y Y
= 1
2
Y Y nY
Y Y nY 2

Outro indicador til, principalmente para comparaes entre modelos o R2 ajustado


(adjusted R-squared). Ele recebe este nome, pois se faz um ajustamento de SQRes e de SQTot
quanto aos graus de liberdade da respectiva variao. Assim, tem-se:

SQRes
( n-p )
R2 = 1
SQTot
( n-1)
Em gral, quanto maior o nmero de variveis X, maior o valor de R2, mas para o R2
ajustado esta regra no vale. Justamente para evitar a incluso equivocada de variveis
explicativas que se usa o R2 ajustado. Assim, a incluso de uma varivel irrelevante poder
elevar o valor de R2, mas no necessariamente elevar o valor de R2 ajustado.
2
2
Se n for grande e p pequeno em relao a n, a diferena entre R e R ser pequena.

Se n for pequeno e p grande em relao a n, a diferena entre ambos pode ser grande e o valor
ajustado ser mais importante.
Outro indicador o Teste F da regresso (F-statistic). Procura-se saber se o modelo
tem suporte estatstico. o Teste de significncia global da regresso: os Xs em conjunto
explicam Y de forma significativa. A hiptese nula de que todos os parmetros em conjunto
so nulos. A Hiptese alternativa prev pelo menos um parmetro no nulo.
H 0 : 1 = 0,2 = 0,...,k = 0
H1 : pelo menos um
Define-se a estatstica de teste como:

i 0

Econometria Prof. Adriano M. R. Figueiredo

18

SQReg
p-1
F=
~ Fp 1,n p
SQRes
G .L.
n-p
Se Fcalculado > Ftabelado , ento rejeita-se H0 e concluo pela existncia de ao menos um X
explicando Y. Deseja-se um P-value (F de significao) menor que 10%, 5% ou 1%,
similarmente ao teste de t dos parmetros.
Esses indicadores em geral so obtidos em todos os softwares economtricos ou
estatsticos. Pode-se mencionar alguns: Excel, Eviews, Stata, SAS, SPSS, Gauss, MatLab,
TSP. Alguns sites podem auxiliar ao leitor:
http://www.oswego.edu/~economic/econsoftware.htm
http://www.economics.ltsn.ac.uk/software/econometrics.htm
http://emlab.berkeley.edu/eml/index.shtml
O anexo apresenta rotinas para execuo dos clculos usando matrizes no Excel. Um
software bastante interessante, plataforma livre e com verso em portugus o GRETL, no
link: http://gretl.sourceforge.net/gretl_portugues.html .

Econometria Prof. Adriano M. R. Figueiredo

19

Anexo 1: Estimao utilizando matrizes no Excel:


1. Entrada dos dados:
a. Digitar matriz de dados X e Y no Excel
i. Gujarati p.279 X(10x2) e Y(10x1)
2. Copiar X e colar especial selecionando transpor, fazendo X (2x10)
3. Fazer multiplicao X.X (2x10).(10x2) = XX(2x2)
a. Seleciona a rea de sada (2x2)
b. Inserir frmula matemtica Matriz.mult
i. Matriz 1 = X
ii. Matriz 2 = X
c. Teclar OK
d. Teclar F2
e. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os
dados da matriz XX (2x2)
i. Gujarati p.284
4. Fazer inversa de XX fazendo (XX)-1
a. Selecionar rea de sada (2x2)
b. Inserir frmula matemtica Matriz.inverso
c. Matriz = XX
d. Teclar OK
e. Teclar F2
f. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os
dados da matriz (XX)-1 (2x2)
i. Gujarati p.285
5. Fazer XY (2x10).(10x1) = XY(2x1)
a. Selecionar rea de sada (2x1)
b. Inserir frmula Matriz.mult
i. Matriz 1 = X
ii. Matriz 2 = Y
c. Teclar OK
d. Teclar F2
e. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os
dados da matriz (XY) (2x1)
i. Gujarati p.285
6. Clculo de beta estimado
a. Betaest = (XX)-1(2x2) (XY)(2x1) = (XX)-1(XY)(2x1)
i. Selecionar sada 2x1
ii. Inserir frmula Matriz.mult
1. matriz 1 = (XX)-1
2. matriz 2 = (XY)
b. Teclar OK
c. Teclar F2

Econometria Prof. Adriano M. R. Figueiredo

20

d. Teclar Shift+Control+Enter todas ao mesmo tempo para aparecerem todos os


dados da matriz (betaest) (2x1)
i. Gujarati p.285
7. Para obter Matriz de var-cov(betaest) fazer
a. ' = YY betaest. XY
i. Calcular YY pela funo Matriz.mult
ii. Calcular betaest. XY pela funo Matriz.mult
1. matriz 1 = betaest
2. matriz 2 = XY
iii. Fazer diferena i ii
b. Calcular sigma quadrado: s2 = /(n-k)
i. n-k = graus de liberdade
c. Calcular var-cov(betaest) = s2.(XX)-1 (2x2)
i. Fazer multiplicao de escalar por cada elemento de (XX)-1
8. Fazer a raiz quadrada dos elementos da diagonal, obtendo os erros padres dos
parmetros estimados: utilizar a funo RAIZ() do Excel.
9. Calcular o valor de t fazendo t = betaest/erropbeta . O valor da probabilidade do teste
pode ser obtido pela funo estatstica do Excel, fazendo DISTT(t;n-p;2) que
retornar o valor da probabilidade para P(t> t) para o valor t, para n-p graus de
liberdade e 2 caudas (bicaudal).
10. Calcular R2
a. R2 = SQE/SQT = (betaest.XY n.Y 2)/(YY - n. Y 2)
i. Y = mdia de Y
SQE
SQ Re s
p 1
np
b. R 2 =
= 1
SQT
SQT
n 1
n 1
SQE
p 1
c. F =
~ Fp 1,n p ( GL )
SQ Re s
np

Anexo 2: Exerccios:
1. De acordo com a metodologia economtrica, responda verdadeiro (V) ou falso (F):
( ) A heterocedasticidade um problema no modelo de regresso clssico pois altera os
erros-padres dos parmetros.

( ) A expresso = ( X ' X ) X ' Y permite o clculo dos parmetros por MQO.


( ) A existncia de resduos autocorrelacionados implica em interdependncia entre os
mesmos.
( ) A aceitao da hiptese nula do teste t-Student dos parmetros implica na existncia de
efeitos da varivel X sobre Y no modelo Y = f(X) +

Econometria Prof. Adriano M. R. Figueiredo

21

( ) sempre desejvel acrescentar variveis ao modelo de regresso at o limite de dez


regressores.
( ) A expresso para obteno dos parmetros por Mnimos Quadrados Ordinrios,

= ( X ' X )1 X ' Y pode ser utilizada para um modelo logaritmizado linear.

( ) A pressuposio de no-autocorrelao dos resduos implica em covarincias nulas


entre os mesmos.
( ) A estimao realizada pela Ferramenta de Anlise de Dados de Regresso no Excel

fornece os mesmos parmetros estimados que em = ( X ' X ) X ' Y .


( ) A idia bsica da estimao economtrica obter os parmetros de tal forma que a
soma dos erros seja, na mdia, nula, e a soma de seus quadrados seja mnima.
( ) A expresso para obteno dos parmetros por Mnimos Quadrados Ordinrios,

= ( X ' X )1 X ' Y refere-se a um modelo linearizado qualquer.

( ) A heterocedasticidade dos resduos implica em varincias constantes dos resduos ao


longo da amostra.
( ) A estimao realizada pelas operaes matriciais no Excel fornecem os mesmos
parmetros estimados que a Ferramenta de Anlise de Dados de Regresso do referido
software.
( ) A especificao do modelo no precisa ser feita antes da estimao, pois as vezes ser
necessrio excluir alguma varivel do modelo.
( ) A fase de estimao do modelo consiste em determinar os parmetros da equao
estimada.
( ) Todo modelo estimado pode ser utilizado para fazer previses da varivel explicada.
( ) A econometria pode favorecer todas as reas da economia, pois sempre possvel
explicar tudo que se quer com a econometria.
( ) O modelo de regresso linear simples um caso especfico do modelo de regresso
linear mltiplo, podendo estimar os parmetros matricialmente nos dois casos.
2. Cite e comente a pressuposio de linearidade do modelo de regresso clssico.
3. O mtodo de estimao de Mnimos Quadrados Ordinrios um dos mais utilizados para
estimar parmetros economtricos. Explique o que significa e o raciocnio por trs desse
mtodo.
4. Cite e comente a pressuposio de presena de homocedasticidade dos resduos do
modelo de regresso clssico.
5. Suponha que se tem dados municipais para o modelo lnQi = o + 1.lnJUROSi1 +
2.lnRDi2 + i, em que Q a quantidade demandada de moeda no municpio i, em
milhares de reais; JUROS a taxa de juros interbancria (CDI) em valores nominais; RD a
renda disponvel per capita em reais; s so parmetros do modelo e o erro aleatrio tal
que ~ N(0,s2). Pergunta-se:
a) Como voc faria para obter os valores dos s num ambiente computacional do Microsoft
Excel? Quais os passos necessrios para execuo da estimao?
b) possvel fazer por meio matricial? Quais os passos necessrios para execuo da
estimao?
6. Seja um exemplo da verso modificada da Curva de Phillips macroeconmica,
relacionando o ndice de salrios como varivel dependente (W) como funo dos preos
(IGP), da taxa de desemprego (U) e do produto nacional bruto (PNB) como variveis
independentes. O modelo ser do tipo: Wt = 0 + 1 IGPt + 2 PNB t + 3 U t + t . Interprete
os resultados abaixo e avalie comparativamente os dois resultados. Fonte: dados mensais

Econometria Prof. Adriano M. R. Figueiredo

22

de W, U e IGP-DI, coletados no www.ipeadata.gov.br e realizaram-se mdias anuais. O PIB


per capita anual foi obtido diretamente do mesmo site.
Dependent Variable: LOG(W)
Method: Least Squares
Date: 03/22/06 Time: 11:05
Sample: 1980 2004
Included observations: 25
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
LOG(IGP)
LOG(PIB)
LOG(U)

-17.74151
-0.020270
2.450833
0.425183

3.737840
0.002273
0.407685
0.068249

-4.746459
-8.918010
6.011589
6.229885

0.0001
0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.818600
0.792686
0.082646
0.143439
29.03559
1.724283

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

5.414171
0.181513
-2.002847
-1.807827
31.58878
0.000000

Dependent Variable: W
Method: Least Squares
Date: 03/22/06 Time: 11:10
Sample: 1980 2004
Included observations: 25
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
IGP
PIB
U

-290.8117
-0.326847
0.046182
21.07782

327.1702
0.193898
0.034176
8.048040

-0.888870
-1.685664
1.351321
2.619000

0.3841
0.1067
0.1910
0.0160

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.255609
0.149268
37.48923
29514.30
-123.8954
0.607152

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

228.0943
40.64528
10.23163
10.42665
2.403666
0.096187

7. Seja um exemplo do PIB Real (REALGDP) como funo do Consumo Real (REALCONS),
Investimento Real (REALINVS), Gastos Reais do Governo (REALGOVT), e Transaes
Lquidas Reais com o Exterior (REALINT), OBS a varivel de tendncia. Encontre o R2, R2
ajustado, os coeficientes, erros-padres e valores de t para completar os resultados e
analise-os a seguir:

Econometria Prof. Adriano M. R. Figueiredo

23

Dependent Variable: REALGDP


Method: Least Squares
Date: 03/09/06 Time: 08:29
Sample: 1950:1 2000:4
Included observations: 204
Variable

Coefficient

REALCONS
REALINVS
REALGOVT
REALINT
OBS
C

1.123936
0.516396
0.538837

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

1.928942
121.9011

40.65281
327224.9
-1042.252
0.246057

Std. Error
0.044046
0.056164
1.089732
0.370999
24.04763

t-Statistic

Prob.

44.48754
11.72401
9.594029
-1.558385

0.0000
0.0000
0.0000
0.1207
0.0000
0.0000

5.069154

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

4562.646
2113.962
10.27698
10.37458
109744.5
0.000000

Econometria Prof. Adriano M. R. Figueiredo

24

4 Violaes nas Pressuposies Clssicas do Modelo de


Regresso Linear
O modelo clssico de anlise de regresso construdo com base numa srie de pressuposies
referentes ao comportamento da populao. Estas pressuposies foram descritas nas sees
anteriores e aqui se discute principalmente a forma de testar a hiptese e a operacionalizao da
soluo.

4.1.

Pressuposio 1: A relao entre Y e X linear


Deteco do problema:
Entre outros estes, o teste RESET de Ramsey (1969)2 um dos mais aplicados na literatura.

O nome vem do pesquisador Ramsey para o Regression Specification Error Test ou teste de erro de
especificao da regresso (No Eviews, ver na janela da equao o teste de estabilidade (Stability
Tests) e definir o nmero de termos estimados).
O teste baseado na regresso aumentada
Y = X + Z +
em que X so as variveis explicativas e Z so variveis dependentes estimadas e elevadas a uma
potncia
Z = [ Yest2 Yest3 Yest4]

exemplo para trs fitted terms (termos acrescentados na regresso

aumentada).
A idia olhar a significncia dos para ver se os termos acrescentados so relevantes no
modelo, indicando erro de especificao.
Procedimento do teste:
1) estima-se Y = X +
2) obtm-se os valores previstos de Y e gera-se Yest2 Yest3

ou mais se

desejar. Recomenda-se no mximo at 3 termos, ou seja, at Yest4.


3) Ajusta-se a regresso aumentada, colocando-se os X e as variveis do item 2 :
Y = f ( X, Yest2, Yest3 )
4) Com as regresses de 1 e de 3, observam-se os valores de R2 novo (de 3) e R2
velho (de 1) e calcula-se a estatstica de teste:

Ramsey, J. B. (1969) Tests for Specification Errors in Classical Linear Least Squares Regression Analysis, Journal

of the Royal Statistical Society, Series B, 31, 350371.

Econometria Prof. Adriano M. R. Figueiredo

25

5) Estatstica de Teste;
2
2
Rnovo
Rvelho
nmero de novos regressores (m)
F=
2
1 Rnovo
n nmero parametros no novo mod elo (p)

F ~ Fm,n-p
m o nmero de novos regressores
n-p o nmero de observaes menos o nmero de parmetros no
novo modelo
6) Comparar o F do item 5 com o F da tabela, para o nvel de significncia,
numerador m e denominador n-p. Como a hiptese nula de que no h

erro de especificao, espera-se que a hiptese nula no seja rejeitada, ou


seja, que F seja muito pequeno.
O teste RESET indica apenas se o modelo est especificado incorretamente, mas no diz
qual seria a soluo. A soluo para um problema seria incluir outras variveis relevantes no
modelo, retirar as irrelevantes, ou mudar a forma funcional. Portanto, o bom senso indica que
melhor incluir variveis do que excluir, pois a excluso pode causar vis, enquanto a incluso tende
a melhorar o modelo, a no ser pela possibilidade de no-significncia dos parmetros.

Implementao no Eviews:
No Eviews, aps a estimao dos parmetros, abre-se a janela da equao e depois clica-se

em View, e posteriormente em Stability Tests. A opo do teste RESET aparecer em outra janela
perguntando quantos termos ajustados sero includos (fitted terms). O aluno deve estabelecer
quantos termos (sugere-se at 3) e clica-se em ok. O programa gerar a estatstica de teste RESET
de Ramsey, mas aqui a hiptese nula um pouco diferente do teste calculado anterior, pois o
programa testa se todos os parmetros so zeros, o que indicar que no h erro. Portanto, se a

probabilidade de F do Eviews for abaixo do nvel de significncia (por exemplo, 10%) (F alto),
pode-se dizer que rejeita-se a hiptese nula e existe um erro de especificao. Se o F for baixo,
aceita-se que =0 e, portanto, no h erro de especificao.
No exemplo, mostra-se que existe erro de especificao.
Tabela 1. Exemplo de sada do Eviews para o Ramsey RESET Test.
Ramsey RESET Test:
F-statistic
Log likelihood ratio

5.281559
15.74446

Probability
Probability

0.001932
0.001279

Econometria Prof. Adriano M. R. Figueiredo

26

Test Equation:
Dependent Variable: QSOJA
Method: Least Squares
Date: 06/06/03 Time: 14:57
Sample: 1988:09 1998:05
Included observations: 117
Variable

Coefficient

Std. Error

t-Statistic

Prob.

FERTILIZANTE
TRATOR
MO
C
FITTED^2
FITTED^3
FITTED^4

304.1298
18591.29
115237.7
-230604.7
2.664804
-0.005642
4.43E-06

135.0469
8231.767
51069.36
101861.3
1.165269
0.002453
1.92E-06

2.252031
2.258481
2.256493
-2.263908
2.286857
-2.300025
2.302617

0.0263
0.0259
0.0260
0.0255
0.0241
0.0233
0.0232

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.532456
0.506954
39.33059
170158.4
-592.0310
0.770973

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

322.2544
56.01272
10.23985
10.40510
20.87869
0.000000

Outra forma olhar os diferentes modelos e comparar o R2 ajustado. Quanto mais prximo
de 1 melhor ser a estimao. deficiente para o caso de varivel omitida.
Outras opes so observar os coeficientes do critrio de Akaike e Schwarz, fornecidos na
sada da estimao do Eviews. Menores coeficientes AIC e SIC indicam melhores ajustamentos da
regresso, mas s podem ser comparados se as unidades das variveis das diferentes regresses
forem as mesmas (por exemplo, no se aplica numa comparao entre Y e outra com LogY). Devese olhar todos os critrios para melhor anlise dos resultados.
O Critrio de Informao de Akaike (ou AIC de Akaikes Information Criterion) ou o
Critrio de Informao de Schwarz ou Bayesiano (ou SIC de Schwarzs Information Criterion ou
em alguns livros BIC de Bayesian Information Criterion) so expressos no Eviews da forma j
logaritmizada como:

em que k o nmero de regressores incluindo-se o intercepto; n o nmero de observaes; l o


log Verossimilhana da regresso; e

so os resduos estimados do modelo.

Econometria Prof. Adriano M. R. Figueiredo

No formato mais simplificado exposto por Greene (2002), tem-se:

27

Econometria Prof. Adriano M. R. Figueiredo

Anexo
Fazendo o teste RESET para investigar se existe erro de especificao:
1) fazer a estimao original a ser testada

28

Econometria Prof. Adriano M. R. Figueiredo

2) na janela Equation, entrar em View, Stability Tests, Ramsey Reset Test como na figura a
seguir:

3) na janela RESET Specification, colocar o nmero de variveis a serem adicionadas no teste


(nmero de variveis dos valores previstos de Y)

se inserir apenas Y 2 (FITTED^2) ento digitar 1


se inserir apenas Y 2 (FITTED^2) e Y 3 (FITTED^3) ento digitar 2
se inserir apenas Y 2 (FITTED^2) e Y 3 (FITTED^3) e Y 4 (FITTED^4) ento digitar 3
assim sucessivam ente
O RESULTADO SAIR CONFORME A LTIMA IMAGEM A SEGUIR

29

Econometria Prof. Adriano M. R. Figueiredo

30

Econometria Prof. Adriano M. R. Figueiredo

4.2.

31

Pressuposio 2: O erro aleatrio tem mdia zero

A maior dificuldade que no existe teste formal para essa pressuposio. similar a um
erro de especificao do modelo, como por exemplo, com variveis relevantes omitidas do modelo.
O modelo com uma correta especificao provavelmente no ter problemas com mdia dos
resduos no nula.
Normalmente se faz o teste simples de H0: mdia igual a zero para investigar a violao
ou no da pressuposio. Valores elevados para a probabilidade indicaro a aceitao da hiptese
nula e confirmao da pressuposio.

Econometria Prof. Adriano M. R. Figueiredo

Anexo:
Roteiro para testar mdia dos resduos nula:

32

Econometria Prof. Adriano M. R. Figueiredo

33

Tabela dos resduos


observao
obs
1971Q3
1971Q4
1972Q1
1972Q2
1972Q3
1972Q4
1973Q1
1973Q2
1973Q3
1973Q4
1974Q1
1974Q2
1974Q3
1974Q4
1975Q1
1975Q2

observado
Actual
11484.0
9348.00
8429.00
10079.0
9240.00
8862.00
6216.00
8253.00
8038.00
7476.00
5911.00
7950.00
6134.00
5868.00
3160.00
5872.00

previsto
Fitted
10943.9
9417.85
9502.75
9184.43
8884.84
9288.01
7311.47
7595.20
8297.50
7559.49
5955.55
6004.86
6802.14
6544.46
3992.40
5035.14

resduos
Residual
540.083
-69.8452
-1073.75
894.568
355.164
-426.006
-1095.47
657.800
-259.501
-83.4900
-44.5506
1945.14
-668.142
-676.458
-832.395
836.855

Econometria Prof. Adriano M. R. Figueiredo

Na janela do Workfile, na serie Resid, possvel fazer o teste t para a mdia dos erros igual a
zero:

34

Econometria Prof. Adriano M. R. Figueiredo

35

Na janela View da Series: Resid, escolher a opo Tests for Description Stats, Simple
Hypothesis Tests:

A janela do simple Hypothesis tests permitir especificar se a mdia igual a zero,


especificando zero e teclando ok:

Econometria Prof. Adriano M. R. Figueiredo

36

Hypothesis Testing for RESID


Date: 03/16/06 Time: 17:12
Sample: 1971Q3 1975Q2
Included observations: 16
Test of Hypothesis: Mean = 0.000000
Sample Mean = -4.16e-16
Sample Std. Dev. = 0.144606
Method
t-statistic

Value
-1.15E-14

Probability
1.0000

Como o valor da probabilidade implica na aceitao da hiptese nula, ou seja,


H0: mdia = 0

Econometria Prof. Adriano M. R. Figueiredo

37

4.3.
Pressuposio 3: O erro aleatrio tem varincia
constante (presena de homocedasticidade)
A presena de heterocedasticidade no gera vis ou tendenciosidade nos parmetros
angulares. Entretanto, os parmetros de M.Q.O. no sero os mais eficientes (pois o M.Q. O.
superestimar o verdadeiro erro-padro e presena de heterocedasticidade) e a estimao
dever ser feita por Mnimos Quadrados Generalizados (M.Q.G.), que consiste em um
M.Q.O. para variveis transformadas que satisfazem as hipteses usuais de mnimos
quadrados. A mecnica passa pela diviso de todas as variveis, por exemplo, pelo respectivo
desvio-padro do resduo, ou caso o desconhea, pela varivel explicativa correlacionada ao
resduo.
Procede-se da seguinte forma. Primeiro realiza-se o teste de Glejser, que entre outros
como o de Goldfeld-Quandt, apresenta-se mais eficiente e auxilia na implementao da
correo do problema. Esse teste permite que se indique a exata relao existente entre a
varivel X e os resduos (Diaz, 2000)3.
Passos:
1. estimar o modelo inicial: Y = X +
2. com os resduos de 1, estimar as regresses auxiliares:
a. |ei| = 0 + 1Xi
b. |ei| = 0 + 1Xi2
c. |ei| = 0 + 1(1/Xi)
d. |ei| = 0 + 1(Xi)
e. |ei| = 0 + 1Xih
em que h denota uma potncia.
Se o 1 for diferente de zero em alguma das regresses auxiliares (pelo teste
usual de t), ento rejeita-se a hiptese nula de que no h heterocedasticidade.
Portanto, existe heterocedasticidade. Caso todas as regresses tenham 1= 0,
ento no existe heterocedasticidade.

DIAZ, M.D.M. Problemas economtricos no modelo linear geral. In: VASCONCELLOS, M.A.S.; ALVES, D.
(Coords.) Manual de econometria. So Paulo:Atlas, 2000. p.105-137.

Econometria Prof. Adriano M. R. Figueiredo

38

Conhecido o resultado do teste de Glejser, utiliza-se a varivel da regresso auxiliar


que acusou o problema para ponderar as variveis, transformando-as, e procedendo a
estimao de M.Q.G., ou seja, M.Q.O. nas variveis transformadas.
Este problema de presena de heterocedasticidade tambm pode ser detectado por
meio de anlise grfica. Pode-se estimar a funo e fazer o grfico dos resduos ao longo da
amostra:
ei x Xi
ei x Yi ou Yi,estimado
A estimao por M.Q.G. ser para o modelo:
P.Y = PX + P
e o vetor de parmetros estimados ser
= (XPPX)-1XPPY
que o mesmo que estimar o M.Q.O. para Y* = X* + *.
Os resduos podem ser obtidos no Eviews fazendo, na janela de uma equao,
Procs/make residual series. O programa pergunta o nome da srie a conter os resduos e uma
vez feito isso s especificar a srie como varivel.
O mtodo como descrito acima uma alternativa apresentada em vrios livros de
econometria, mas como a transformao fazendo Y/Xi pode gerar uma correlao espria,
indicando uma correlao entre Y/X que na realidade no ocorreria entre Y e X caso no
fosse feita a transformao, sugere-se ento o teste e a correo de White4.
Por exemplo, para uma regresso da forma
Yi = 1 + 2 X2i + 3X3i + i

o teste de White implementado manualmente da seguinte forma:


a) estima-se a regresso inicial e obtm-se os resduos ei;
b) faz-se uma regresso auxiliar do tipo
ei2= 1 + 2 X2i + 3X3i + 4 X2i2+ 5X3i2 + 6 X2i.X3i + i
ou seja, o quadrado dos resduos estimados como funo das variveis explicativas, dos
quadrados das variveis explicativas e do produto cruzado das variveis explicativas. Deve-se
incluir o termo do intercepto (1) mesmo que na regresso original no o tenha.

White, Halbert (1980) A Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for

Heteroskedasticity, Econometrica, 48, 817838.

Econometria Prof. Adriano M. R. Figueiredo

39

c) Analisa-se o R2 da regresso auxiliar multiplicado pelo tamanho da amostra (n)


comparando com o valor da tabela qui-quadrado para graus de liberdade iguais ao nmero
total de regressores da equao auxiliar. No nosso exemplo,
n. R2 ~ 2 com gl = 5

Se

(X2i, X3i , X2i2, X3i2 , X2i.X3i)

n.R2 > 2 tabelado, ento existe heterocedasticidade.

Se n.R2 < 2 tabelado, ento 2 = 3 = 4 = 5 = 6 = 0 , e no existe


heterocedasticidade.
Deve-se tomar cuidado com este teste, pois ele prev a incluso de termos adicionais
que, em presena de muitas variveis X, poder comprometer o modelo com relao aos seus
graus de liberdade.
A correo do modelo neste caso pode ser feita utilizando os estimadores de matrizes
de covarincias heterocedstico-consistentes de White, que podem ser obtidos rapidamente
pelo software Eviews.
A operacionalizao no Eviews bastante simples. Primeiro o estudante deve estimar
o modelo e, na janela da equao estimada, selecionar View/Residual Tests e depois clicar em
White Heteroskedasticity (no cross terms ou cross terms). A diferena das duas opes que
na primeira no inclui termos multiplicativos das variveis Xi.Xj. Na primeira opo, se
economizam graus de liberdade mas representa uma distoro do teste original. Na segunda
opo, no rigor cientfico, incluem-se termos cruzados e, em presena de muitos regressores,
pode causar problemas de reduzidos graus de liberdade.
Sugere-se utilizar a primeira opo quando tiver mais de 5 regressores Xi, e a segunda
quando tiver menos de 5, pois com os termos cruzados, ocorreria uma incluso de mais outros
5 termos.
Para a mesma regresso da Tabela 1, mostram-se os resultados do teste de White para
termos cruzados e sem termos cruzados. Procure distinguir as diferenas nos resultados.

A hiptese nula do teste que no h heterocedasticidade, ou seja, de que os erros


so homocedsticos e independentes dos regressores, e que a especificao do modelo
correta. Assim, desejvel ter a aceitao da hiptese nula, com probabilidade acima de
10%, e baixo valor de n.R2.
Tabela 2. Teste de White no cross terms
White Heteroskedasticity Test:
F-statistic
Obs*R-squared

2.956033
16.24547

Probability
Probability

0.010300
0.012495

Econometria Prof. Adriano M. R. Figueiredo

40

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/03 Time: 17:59
Sample: 1988:09 1998:05
Included observations: 117
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
FERTILIZANTE
FERTILIZANTE^2
TRATOR
TRATOR^2
MO
MO^2

9515.997
-810.4509
18.85117
-2061.748
245.7209
76907.49
-230942.8

6550.445
551.7908
15.37210
2106.302
236.7449
29850.12
103719.0

1.452725
-1.468765
1.226324
-0.978848
1.037914
2.576455
-2.226620

0.1491
0.1448
0.2227
0.3298
0.3016
0.0113
0.0280

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.138850
0.091878
2805.201
8.66E+08
-1091.297
1.307013

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1663.833
2943.689
18.77430
18.93956
2.956033
0.010300

Econometria Prof. Adriano M. R. Figueiredo

41

Tabela 3. Teste de White cross terms


White Heteroskedasticity Test:
F-statistic
Obs*R-squared

4.638220
32.83525

Probability
Probability

0.000034
0.000143

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/03 Time: 18:01
Sample: 1988:09 1998:05
Included observations: 117
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
FERTILIZANTE
FERTILIZANTE^2
FERTILIZANTE*TRA
TOR
FERTILIZANTE*MO
TRATOR
TRATOR^2
TRATOR*MO
MO
MO^2

-20557.49
445.3517
25.26911
-120.1672

9888.589
600.7180
15.80557
87.69892

-2.078910
0.741366
1.598748
-1.370224

0.0400
0.4601
0.1128
0.1735

-13077.63
864.9398
309.3549
-22449.97
426444.0
-365960.5

3137.312
3116.365
253.6114
12081.31
90390.39
130236.2

-4.168419
0.277548
1.219799
-1.858240
4.717802
-2.809975

0.0001
0.7819
0.2252
0.0659
0.0000
0.0059

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.280643
0.220136
2599.568
7.23E+08
-1080.772
1.549746

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1663.833
2943.689
18.64567
18.88176
4.638220
0.000034

Observe que no exemplo dado, existem indcios de que h heterocedasticidade.


Sabendo anteriormente que ocorre erro de especificao e que os dados originais so de srie
temporal, conclui-se pela existncia de erro de especificao, mas deve-se analisar com maior
detalhe a questo da homocedasticidade, pois esta geralmente no ocorre em sries temporais,
mas sim em seo cruzada. Talvez o resultado do teste possa estar mais ligado dependncia
dos resultados em relao aos regressores.
Num outro exemplo, com os dados de Gujarati (2000:p.388), para gastos com P&D
em relao as vendas, obteve-se o teste de White com cross terms e os resultados a seguir.
Primeiro apresenta-se os resultados da estimao sem a correo para heterocedasticidade,
faz-se o teste de White e depois re-estima-se o modelo com a correo de White.

Econometria Prof. Adriano M. R. Figueiredo

42

Tabela 4. Resultados da estimao inicial.


Dependent Variable: RD
Method: Least Squares
Date: 06/06/03 Time: 18:38
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

SALES
C

0.031900
192.9931

0.008329
990.9858

3.830033
0.194749

0.0015
0.8480

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.478303
0.445697
2759.153
1.22E+08
-167.0891
3.015607

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

3056.856
3705.973
18.78767
18.88660
14.66916
0.001476

Tabela 5. Teste de White para o exemplo de Gujarati, p.388.


White Heteroskedasticity Test:
F-statistic
Obs*R-squared

3.057178
5.212492

Probability
Probability

0.076975
0.073811

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/03 Time: 18:32
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
SALES
SALES^2

-6219665.
229.3508
-0.000537

6459809.
126.2197
0.000449

-0.962825
1.817077
-1.194952

0.3509
0.0892
0.2507

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.289583
0.194861
13195639
2.61E+15
-319.0171
1.694567

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

6767046.
14706011
35.77968
35.92808
3.057178
0.076975

Neste caso, com os dados em seo cruzada (indstrias dos EUA), no foi possvel
deixar de rejeitar a hiptese nula de homocedasticidade ao nvel de 10% de significncia,
como observado pelo valor da probabilidade de Obs*R-squared = 0,073811, menor que 0,10.
Existe problema de heterocedasticidade nos resduos.
Mostram-se agora os resultados com a correo de White, obtidos no Eviews fazendo
alterao na janela da estimao, clicando em Options e selecionando a caixa
heteroskedasticity, e clicando em White. Os resultados so:

Econometria Prof. Adriano M. R. Figueiredo

43

Tabela 6. Resultados da estimao com a correo de White para heterocedasticidade.


Dependent Variable: RD
Method: Least Squares
Date: 06/06/03 Time: 18:42
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

SALES
C

0.031900
192.9931

0.010147
533.9317

3.143815
0.361457

0.0063
0.7225

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.478303
0.445697
2759.153
1.22E+08
-167.0891
3.015607

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

3056.856
3705.973
18.78767
18.88660
14.66916
0.001476

Observe que agora na sada do Eviews, indica-se que foi utilizada a opo White
Heteroskedasticity-Consistent Standard Errors & Covariance, e pode-se comparar os
resultados com os da Tabela 4, sem essa opo de White. De modo geral, nesse exemplo, os
erros-padres estavam subestimados. Pode-se observar que o modelo com heterocedasticidade
apresenta vis nos erros padres, podendo ser negativo ou positivo, dependendo do estudo.
Quanto aos parmetros, no ocorrem alteraes.
Aps a correo de White no cabe mais a nova realizao do teste, pois os resultados
j foram obtidos com os resduos alterados pelo critrio de White.

Econometria Prof. Adriano M. R. Figueiredo

44

Anexo
Roteiro para estimao no Eviews Heterocedasticidade
Gujarati, Tabela 11.5 (Table11-5.wf1), p. 388 Teste de Glejser
1. estimar modelo normalmente:

Estimation Command:
=====================
LS (PD) (VENDAS) C
Estimation Equation:
=====================
PD = C(1)*VENDAS + C(2)
Substituted Coefficients:
=====================
PD = 0.03190033243*VENDAS + 192.9931098
Dependent Variable: PD
Method: Least Squares
Date: 03/04/05 Time: 16:00
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

VENDAS
C

0.031900
192.9931

0.008329
990.9858

3.830033
0.194749

0.0015
0.8480

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.478303
0.445697
2759.153
1.22E+08
-167.0891
3.015607

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

3056.856
3705.973
18.78767
18.88660
14.66916
0.001476

Econometria Prof. Adriano M. R. Figueiredo

Gerar sries de resduos em Procs/Make residual series:

45

Econometria Prof. Adriano M. R. Figueiredo

Fazer srie de resduos absolutos: me=@abs(e)

Estimar me em funo de Vendas: ou seja, mdulo dos resduos em funo de


vendas:

46

Econometria Prof. Adriano M. R. Figueiredo

47

Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:18
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

VENDAS
C

0.011939
578.5710

0.005704
678.6950

2.093059
0.852476

0.0526
0.4065

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.214951
0.165886
1889.657
57132868
-160.2756
1.743294

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1650.432
2069.046
18.03062
18.12955
4.380896
0.052633

Econometria Prof. Adriano M. R. Figueiredo

48

Me em funo da raiz de vendas:

Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:18
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

SQR(VENDAS)
C

7.971957
-507.0202

3.363146
1007.684

2.370387
-0.503154

0.0307
0.6217

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.259901
0.213645
1834.761
53861578
-159.7449
1.785727

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

1650.432
2069.046
17.97166
18.07059
5.618732
0.030672

Econometria Prof. Adriano M. R. Figueiredo

49

Me em funo de 1/vendas:

Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:20
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

1/(VENDAS)
C

-19924566
2273.702

12318138
604.6990

-1.617498
3.760056

0.1253
0.0017

0.140538
0.086822
1977.188
62548360
-161.0906
1.505561

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

1650.432
2069.046
18.12118
18.22011
2.616300
0.125313

Correo:
Fazer PD/(SQR(Vendas)) em funo de 1/(SQR(Vendas)) e de (SQR(Vendas))

Econometria Prof. Adriano M. R. Figueiredo

50

Dependent Variable: PD/SQR(VENDAS)


Method: Least Squares
Date: 03/04/05 Time: 18:23
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

1/SQR(VENDAS)
SQR(VENDAS)

-246.6769
0.036798

381.1285
0.007114

-0.647228
5.172315

0.5267
0.0001

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.364889
0.325195
7.257134
842.6560
-60.15658
2.885313

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

8.855264
8.834378
6.906286
7.005216
9.192455
0.007933

Econometria Prof. Adriano M. R. Figueiredo

51

Mtodo de White:
TESTE

White Heteroskedasticity Test:


F-statistic
Obs*R-squared

3.057178
5.212492

Probability
Probability

0.076975
0.073811

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/04/05 Time: 18:32
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VENDAS
VENDAS^2

-6219665.
229.3508
-0.000537

6459809.
126.2197
0.000449

-0.962825
1.817077
-1.194952

0.3509
0.0892
0.2507

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.289583
0.194861
13195639
2.61E+15
-319.0171
1.694567

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

6767046.
14706011
35.77968
35.92808
3.057178
0.076975

Rejeita-se a hiptese nula , portanto temos presena de erros heterocedsticos a


10% de significncia. No teramos se fosse considerado 5%!!!!

Econometria Prof. Adriano M. R. Figueiredo

52

Correo de heterocedasticidade pelo mtodo de White:

Dependent Variable: PD
Method: Least Squares
Date: 03/04/05 Time: 18:29
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VENDAS

192.9931
0.031900

533.9317
0.010147

0.361457
3.143815

0.7225
0.0063

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.478303
0.445697
2759.153
1.22E+08
-167.0891
3.015607

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

3056.856
3705.973
18.78767
18.88660
14.66916
0.001476

Observar que os erros-padres entre a regresso principal e a regresso com


correo de White se alteraram, ou seja, a correo de White retirou os vieses nos
erros-padres estimados.

Econometria Prof. Adriano M. R. Figueiredo

53

4.4.
Pressuposio 4: Os erros aleatrios so independentes
(ou no autocorrelacionados)
A principal conseqncia da violao desta pressuposio a ineficincia dos
estimadores de M.Q.O. mas, continuam no-tendenciosos. Nesta situao, da mesma forma
que para a heterocedasticidade, melhor utilizar o mtodo de Mnimos Quadrados
Generalizados (M.Q.G.).
Imagine um modelo mais comum, com autocorrelao de 1. Ordem:
t = t 1 + t
em que o parmetro de autocorrelao e um termo de erro bem comportado, ou seja,
no autocorrelacionado normal de mdia zero e varincia 2, ou tambm chamado de rudo
branco (white noise).
O coeficiente de autocorrelao pode ser obtido pela expresso

Cov( t , t 1 )
[Var( t )]1 / 2 [Var( t 1 )]1 / 2

O teste mais comum para detectar a presena de erros autocorrelacionados o Teste de

Durbin-Watson. A hiptese nula a ser testada que


Ho: = 0 => no h autocorrelao
Contra a hiptese alternativa
H1: 0 => > 0 autocorrelao positiva => < 0 autocorrelao negativa
A estatstica de teste o chamado DW, calculado como:
T

DW =

t 1 )

t =2

= 2(1 )

2
t

t =1

em que
=0

DW = 2 => ausncia de autocorrelao

= +1

DW = 0 => autocorrelao positiva e perfeita

= -1

DW = 4 => autocorrelao negativa e perfeita


Portanto, deseja-se DW prximo de 2, ou seja, ausncia de autocorrelao.

Econometria Prof. Adriano M. R. Figueiredo

54

A anlise requer a comparao dos valores de DW com valores tabelados, que


prevem duas distribuies de probabilidade entrelaadas: uma distribuio inferior e outra
superior. Elas determinam reas de aceitao e rejeio da hiptese nula, como na figura a
seguir:

em que
dL = limite inferior => vem da tabela para n observaes e k variveis explanatrias
dU = limite superior => vem da tabela para n observaes e k variveis explanatrias

Econometria Prof. Adriano M. R. Figueiredo

55

Exemplo:
Para k = 3 (referente a um modelo com X1, X2 e X3), para n = 30 observaes, a tabela de
DW para 5% de significncia nos fornece dL = 1,21 e dU=1,65, e portanto,
4-dL = 4 1,21 = 2,79
4 dU = 4 1,65 = 2,35
Para 0<DW<1,21 = rejeio de Ho e autocorrelao positiva
Para 1,21<DW<1,65 = rea inconclusiva
Para 1,65<DW<2,35 = aceitao de Ho e no-autocorrelao
Para 2,35<DW<2,79 = rea inconclusiva
Para 2,79<DW<4 = rejeio de Ho e autocorrelao negativa
As deficincias neste mtodo so:

presena de reas inconclusivas

s testa autocorrelao de primeira ordem

deve incluir intercepto na regresso

o teste no vlido quando o modelo tem varivel dependente defasada como


varivel explicativa

Uma alternativa para contornar essas deficincias via teste h de Durbin, para casos
de varivel dependente defasada como varivel explicativa. O teste calculado por

h=

T
1 T.Var ()

N(0,1) = comparar com o limite de 1,96 p/ 5%

em que
T nmero de observaes
parmetro da varivel dependente defasada.
Outro procedimento que contorna as deficincias do teste DW e tem sido incorporado
maioria dos softwares economtricos o teste de Breusch-Godfrey de autocorrelao
superior, ou de Multiplicador de Lagrange para Correlao Serial (Serial Correlation LM

Test).
Este teste bastante til para detectar autocorrelao de ordens maiores que a
primeira, ou seja, para AR(P>1) em que P a ordem da autocorrelao. A hiptese nula ser

Econometria Prof. Adriano M. R. Figueiredo

56

H0: no autocorrelao dos resduos


H1: t = AR(P) ou t = MA(P)
Por exemplo, suponha o seguinte processo autoregressivo:
t = 1 t 1 + 2 t 2 + 3 t 3 + K + p t p + t

A hiptese nula ser de que todos os coeficientes de autocorrelao so


simultaneamente nulos, ou seja, todos os i = 0 e no h autocorrelao de qualquer ordem.
A estatstica de teste ser um multiplicador de Lagrange do tipo

e' X 0 (X '0 X 0 ) 1 X '0 e


~ 2p
LM = (n p)R = (n p)
e' e

2
0

O procedimento ser:
1. estimar o modelo de regresso pelo mtodo usual de MQO e obter resduos t;
2. estimar o modelo de t como funo das demais variveis X do modelo a e
tambm de variveis t defasadas (t-1 t-2 ... etc), utilizando para estas defasagens
os resduos obtidos em a;
3. obter o valor de R2 desta regresso b;
4. A estatstica de teste ser LMBG = (n-p).R2 ~ 2p graus de liberdade. P o nmero
de defasagens includas na regresso b.
Se a estatstica de teste LMBG > valor crtico de 2p ento se rejeita a hiptese nula e
existe autocorrelao serial de ordem P, ou seja, pelo menos um i 0. Neste teste, pode-se
ter variveis X ou mesmo Y defasadas, o que representa uma vantagem sobre o teste DW.

Estimao solucionando o problema de autocorrelao:


Estima-se o modelo inicial por M.Q.O. e depois segue um procedimento iterativo at
alcanar a convergncia nos parmetros. Abaixo esto os passos da estimao de CochraneOrcutt:
1) Estima-se modelo inicial por MQO e obtm DW
2) Calcula-se = 1 0,5.DW
3) Estima equao transformada:

Yt Yt 1 = 1 (1 ) + 2 (X t X t 1 ) + t

Econometria Prof. Adriano M. R. Figueiredo

57

ou
Y* = 1* + 2.X1* + t*
4) Recalcula-se (2) e verifica-se a convergncia para .
5) Repetem-se os passos (2) a (4) at que a convergncia seja menor que 0,01.
A implementao no Eviews prev a insero de um termo AR(1) na especificao das
variveis da equao. O programa far a estimao considerando a correo para o
autoregressivo de primeira ordem.

Econometria Prof. Adriano M. R. Figueiredo

58

Anexo
Autocorrelao
Para a equao da taxa de retorno RR em funo do crescimento (Growth) e da
inflao (Inflation):
Dependent Variable: RR
Method: Least Squares
Date: 03/07/05 Time: 20:19
Sample: 1954 1981
Included observations: 28
Variable

Coefficient

Std. Error

t-Statistic

Prob.

GROWTH
INFLATION
C

3.943315
-2.499426
3.531812

1.293445
1.082101
8.111369

3.048693
-2.309789
0.435415

0.0054
0.0294
0.6670

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.572374
0.538164
14.20223
5042.582
-112.4388
1.896592

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

5.875000
20.89837
8.245632
8.388368
16.73114
0.000024

DW = 1,8965
Teste de Breusch-Godfrey: SERIAL CORRELATION LM TEST

Econometria Prof. Adriano M. R. Figueiredo

59

Especificar nmero de variveis a adicionar em Xo, ou seja, se 1 (AR(1)), se 2


(AR(2)):

Breusch-Godfrey Serial Correlation LM Test:


F-statistic
Obs*R-squared

0.319962
0.757950

Probability
Probability

0.729357
0.684563

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 20:23
Variable

Coefficient

Std. Error

t-Statistic

Prob.

GROWTH
INFLATION
C
RESID(-1)
RESID(-2)

-0.371429
-0.131592
1.737633
-0.014931
-0.177451

1.426117
1.125693
8.657860
0.211928
0.222006

-0.260448
-0.116898
0.200700
-0.070455
-0.799306

0.7968
0.9080
0.8427
0.9444
0.4323

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.027070
-0.142136
14.60506
4906.081
-112.0546
1.787912

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

-3.68E-15
13.66610
8.361046
8.598940
0.159981
0.956406

No h evidencias de autocorrelao no modelo, pois Obs*R-squared=0.75 com


Probabilidade de 0.68, indicando aceitao de Ho: no-autocorrelao

Econometria Prof. Adriano M. R. Figueiredo

60

Exercicio Gujarati, p.447-448:


Dependent Variable: LOG(PCDOM)
Method: Least Squares
Date: 03/07/05 Time: 21:10
Sample: 1951 1980
Included observations: 30
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LOG(IPI)
LOG(PCBOLSA)
LOG(CONST)
LOG(PALU)
C

0.467509
0.279443
-0.005152
0.441449
-1.500441

0.165987
0.114726
0.142947
0.106508
1.003020

2.816541
2.435745
-0.036038
4.144737
-1.495923

0.0093
0.0223
0.9715
0.0003
0.1472

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.936090
0.925864
0.121749
0.370573
23.34039
0.954940

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

3.721145
0.447149
-1.222692
-0.989160
91.54312
0.000000

Neste caso, DW=0.9549


Para gl=30, k=4, dl=1,143 e du=1,739, portanto, DW<dl => rejeita Ho, tenho
indicao de autocorrelao positiva
Teste LM para AR(1):
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared

10.02749
8.840634

Probability
Probability

0.004163
0.002946

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:12
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LOG(IPI)
LOG(PCBOLSA)
LOG(CONST)
LOG(PALU)
C
RESID(-1)

-0.104877
0.089288
0.045395
-0.009785
-0.368385
0.567066

0.146079
0.102299
0.123362
0.091346
0.867570
0.179076

-0.717946
0.872811
0.367981
-0.107125
-0.424617
3.166620

0.4797
0.3914
0.7161
0.9156
0.6749
0.0042

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.294688
0.147748
0.104357
0.261370
28.57711
1.521486

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

8.14E-17
0.113041
-1.505141
-1.224901
2.005497
0.114145

Existe problema pois rejeita-se Ho a 1%. Existe AR(1)

Econometria Prof. Adriano M. R. Figueiredo

61

Para AR(2):
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared

9.417751
13.50683

Probability
Probability

0.001028
0.001167

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:13
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LOG(IPI)
LOG(PCBOLSA)
LOG(CONST)
LOG(PALU)
C
RESID(-1)
RESID(-2)

-0.036780
0.028677
0.082020
-0.017166
-0.552588
0.795135
-0.489015

0.134421
0.095271
0.112179
0.082432
0.785758
0.184599
0.191703

-0.273620
0.301008
0.731149
-0.208239
-0.703255
4.307363
-2.550900

0.7868
0.7661
0.4721
0.8369
0.4890
0.0003
0.0179

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.450228
0.306809
0.094116
0.203731
32.31415
1.918606

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

8.14E-17
0.113041
-1.687610
-1.360664
3.139250
0.021333

Tambm existe problema para AR(2). Ficou mais expressivo o problema de


autocorrelao.
Para AR(3):
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
Obs*R-squared

6.169355
13.70695

Probability
Probability

0.003321
0.003332

Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:25
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LOG(IPI)
LOG(PCBOLSA)
LOG(CONST)
LOG(PALU)
C
RESID(-1)
RESID(-2)
RESID(-3)

-0.029746
0.025964
0.078075
-0.025278
-0.512105
0.854409
-0.592317
0.126950

0.137274
0.096960
0.114254
0.085213
0.802317
0.219535
0.278293
0.244219

-0.216691
0.267780
0.683340
-0.296644
-0.638283
3.891895
-2.128395
0.519819

0.8304
0.7914
0.5015
0.7695
0.5299
0.0008
0.0447
0.6084

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.456898
0.284093
0.095646
0.201259
32.49727
2.002055

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

8.14E-17
0.113041
-1.633151
-1.259498
2.644009
0.038212

Ainda tem, mas menos que para AR(2). Observe que o termo de RESID(-3) j no
significativo. Optar por corrigir para AR(2).

Econometria Prof. Adriano M. R. Figueiredo

62

Estimao com AR(1) e AR(2):

Dependent Variable: LOG(PCDOM)


Method: Least Squares
Date: 03/07/05 Time: 21:31
Sample(adjusted): 1953 1980
Included observations: 28 after adjusting endpoints
Convergence achieved after 9 iterations
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LOG(IPI)
LOG(PCBOLSA)
LOG(CONST)
LOG(PALU)
C
AR(1)
AR(2)

0.440700
0.291534
0.102063
0.429664
-2.197667
0.773165
-0.531683

0.165083
0.103733
0.175677
0.118912
1.211239
0.187424
0.192075

2.669563
2.810420
0.580969
3.613298
-1.814395
4.125212
-2.768097

0.0143
0.0105
0.5674
0.0016
0.0839
0.0005
0.0115

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.960153
0.948768
0.096996
0.197571
29.62381
1.850840

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

Inverted AR Roots

.39+.62i

.39 -.62i

3.765864
0.428531
-1.615986
-1.282935
84.33634
0.000000

Comparar com resultados da primeira regresso! Melhores indicadores!

Econometria Prof. Adriano M. R. Figueiredo

63

Anexo: Tabela de Durbin-Watson para 5% de significncia, reproduzida a partir de Gujarati,


Damodar. Basic Econometrics. McGraw-Hill, 2004.

Econometria Prof. Adriano M. R. Figueiredo

64

Exemplo: Se n = 40 e k = 4, dL = 1,285 e dU = 1,721. Se o valor de DW calculado menor


que 1,285, existe evidncia de autocorrelao serial de primeira ordem e positiva; se DW for
maior que 1,721 e menor que 4-dU = 2,279, ento no existe evidncia de autocorrelao de
primeira ordem, mas se DW estiver entre os limites dL e DU, ou entre 4-dU e 4-dL ento
existe uma rea inconclusiva sobre autocorrelao.

Econometria Prof. Adriano M. R. Figueiredo

65

4.5.
Pressuposio 5: As variveis explicativas so no
aleatrias (so fixas)
Se as variveis explicativas e os termos aleatrios forem correlacionados, haver
inconsistncia dos estimadores de mnimos quadrados ordinrios. Deve-se utilizar o estimador
de

variveis

instrumentais.

mtodo

de

Variveis

instrumentais

prev

que

= (ZX)-1ZY , e Z uma matriz de instrumentos independentes dos erros aleatrios.


No se tem testes formais para investigar esta pressuposio. O que feito em geral
investigar as correlaes entre as variveis explicativas e os termos aleatrios via matriz de
correlaes entre eles.
Outra alternativa fazer o Teste de exogeneidade das variveis utilizando o
procedimento de Hausmann.

4.6.
Pressuposio 6: O erro tem distribuio normal, com
mdia zero e varincia constante:
O teste para deteco mais usual o Bera-Jarque, ou teste BJ, o qual testa a simetria e
a curtose da distribuio dos resduos em relao curva normal.
A curtose est associada ao achatamento da distribuio, quanto mais chata menor o
valor da curtose (K). Exemplo: K>3 (distribuio mais em p), K<3 (distribuio mais
chata).
A curtose (em ingls kurtosis) definida pela expresso:

1
K=
N

Yi Y
t =1 Var
( )

A simetria (do ingls skewness) dada pela expresso:

1
S=
N

Yi Y
t =1 Var
( )

2 = Var ( ) = s

A estatstica do teste BJ ser:

N 1
N

Econometria Prof. Adriano M. R. Figueiredo

BJ =

1
(n p ) S 2 +
6

66
1
4

(K 3)2 ] ~ 2gl = 2

Se rejeitar H0:erros normais, tenho que descobrir qual a distribuio real dos
resduos e fazer nova deduo do estimador dos parmetros.
Em geral, para amostras grandes, aplica-se o Teorema do Limite Central
argumentando que no limite tem-se a normalidade da distribuio dos resduos.
Roteiro para testar no Eviews:
1) estimar a regresso
2) no menu equation, acionar View/Residual Tests/histogram
3) a anlise fornece o histograma com uma tabela de estatsticas descritivas da serie de
resduos, contendo o skewness (simetria) e a kurtosis (curtose). Se K for prximo de 3,
ento prxima da normal.
Exemplo 1: se K=2,95 e 2tab = 1,76 e o p-value=0,41, para H0: erro normal, ento p-value
maior que 0,10 indica a aceitao de H0, ou seja, os erros so normais.
Exemplo 2:
Ex12_22, Gujarati (p.447):
Std. Dev = 0,085542
Skewness = 0,047155
Kurtosis = 2,367936
BJ = 0,47 e p-value = 0,78 => aceita H0: erros normais

Econometria Prof. Adriano M. R. Figueiredo

Anexo
Erros Normais: Equation/View/Residual Tests/Histogram Normality Test

67

Econometria Prof. Adriano M. R. Figueiredo

68

4.7.
Pressuposio 7: Ausncia de relao linear exata entre
as variveis explicativas (no multicolinearidade)
A deteco do problema passa por diversas anlises:
1. Ocorrncia de R2 alto e ts no-significativos;
2. Altas correlaes simples entre as variveis explicativas, por exemplo, acima de 0,8;
3. Altas correlaes parciais entre os Xs: verificar o coeficiente de correlao parcial quando
algumas variveis so consideradas constantes;
4. Regresses auxiliares: fazer a regresso considerando o Xi como varivel dependente das
demais variveis Xj
X1 = f(X2, X3, X4, ... , Xn)
X2 = g(X1, X3, X4, ... , Xn)
X3 = h(X1, X2, X4, ... , Xn)
Etc
Esta alternativa permite identificar quais variveis esto mais relacionadas. Se o R2 da
regresso auxiliar for alto, ento se tem a indicao de multicolinearidade;
5. Regra de Klein: a multicolinearidade no prejudicial se
R2Y X1, X2, ... , Xk > R2 Xi X2, ... , Xk
6. Verificar a estabilidade das estimativas
Y = f(X1)
Y = f(X1,X2)
Y = f(X1, X2, X3)
As solues para a presena de multicolinearidade passam pela retirada de variveis
problemticas, ou omisso de variveis, deixando aquela mais relevante para a pesquisa. As
regresses auxiliares auxiliaro na escolha entre as variveis para decidir qual ser retirada do
modelo. O problema com a omisso de variveis a insero de erro de especificao. Outra
opo aumentar o tamanho da amostra, caso possvel. O aumento da amostra o mesmo que
reduzir a micronumerosidade e com isto ganha-se observaes que tendem a no estar
observando uma perfeita relao com outras variveis. Uma terceira opo transformar as
variveis problemticas, fazendo razes entre elas (Xi/Xj), como os preos relativos. A

Econometria Prof. Adriano M. R. Figueiredo

69

limitao com este procedimento que se perde a relao direta, ficando apenas com
parmetros que refletem relaes para a razo.
O clculo das correlaes parciais no direto nem simples quando se tratar de
regresso mltipla. Uma alternativa usar pacotes que j contm a rotina, como por exemplo
o Stata, fazendo uso de comandos como a seguir, para o exemplo dado em Greene
(2002:p.30): . pcorr y year g interest p
Partial correlation of y with
Variable | Corr.

Sig.

-------------+-----------------year | -0.9385

0.000

g | 0.9693

0.000

interest | -0.5410

0.069

p | 0.0153

0.962

Ou seja, retorna as correlaes parciais de y com respeito a cada varivel da lista (year,
g, interest, p).
Outro mtodo a anlise do Fator de varincia inflacionria (FVI), ou no ingls

Variance Inflation Factor (VIF), ou ainda, Fator de inflao da Varincia (Gujarati, 2006:
p.282),

para

cada

varivel

explicativa.

e obtm-se o

Neste

caso,

faz-se

estimao

de

para cada varivel. O FVI da varivel i ser:

Se o conjunto de variveis explicativas for independente, no-correlacionado, o FVI


ser igual a um (

). O gretl estabelece uma comparao de FVI com 10, ou seja,

valores superiores a FVI= 10 indicariam multicolinearidade entre estas variveis. J Santana


(2003: p.244) recomenda o valor de FVI = 5. J Greene (2002: p.58) cita autores os quais
recomendam ateno para valores de FVI maiores que 20. Acredito ser mais prudente ficar
com o valor de FIV = 5, a favor da segurana! Gujarati (2006: p.284) faz uma anlise
interessante para averiguar a tolerncia implcita no modelo.

Econometria Prof. Adriano M. R. Figueiredo

70

A seguir tem-se uma sada do Gretl. Na janela da estimao do modelo, clicando em


Testes e em Colinearidade, tem-se a sada do teste de FVI (ou Factores de Inflaccionamento
da Varincia VIF no Gretl).

Econometria Prof. Adriano M. R. Figueiredo

71

No exemplo reproduzido acima, as variveis ndex e G apresentam multicolinearidade


preocupante, com valores da ordem de 24, bem acima dos 10,0 recomendados pelo Gretl.
Naquele caso, a varivel G o crescimento do PIB e ndex uma varivel tendncia, que
normalmente apresentam colinearidade.

Econometria Prof. Adriano M. R. Figueiredo

4.8.

72

Resumo

Pressuposio

1. Relao Linear / especificao

2 . Mdia do erro zero

Teste

Hiptese Nula: H0

Problema

RESET de Ramsey

H0: No h erro de especificao

Se rejeitar H0

Teste de hiptese simples (t)

H0: mdia igual a zero

Se rejeitar H0

Glejser
3. Varincia do erro constante
White

4. Erros independentes

5. Variveis explicativas so noestocsticas ou fixas

6. Independncia linear entre as variveis


explicativas
7. Erro tem distribuio normal

H0: 1=0 => varivel de 1 no


causa heterocedasticidade
H0:=0 => no h
heterocedasticidade

Se rejeitar H0
Se rejeitar H0

Durbin-Watson (DW)

H0: erros no autocorrelacionados

Se rejeitar H0

h-Durbin

H0: erros no autocorrelacionados

Se rejeitar H0

LM de Breusch-Godfrey

H0: erros no autocorrelacionados

Se rejeitar H0

Matriz de correlao

No h correlao

Equaes auxiliares e regra de


Klein
Bera-Jarque

H0: R

Y X1, X2, ... , Xk

> R

Xi X2, ... , Xk

H0: erros so normais

2
Y X1, X2, ... , Xk

< R

Xi X2, ... , Xk

Se rejeitar H0

* Em que Y = [Yi] um vetor nX1 das observaes da varivel dependente; X = [Xij] uma matriz nXp das observaes das variveis independentes; = [i]
um vetor nX1 dos erros aleatrios; = [j], j = 0, 1, 2, ..., k um vetor pX1 de parmetros a serem estimados; a varincia do erro, tambm a ser estimada; I
uma matriz identidade de ordem mXn; k o nmero de variveis independentes; p = K + 1 o nmero de parmetros; n o nmero de observaes; E
significa valor esperado ou esperana matemtica.

Econometria Prof. Adriano M. R. Figueiredo

73

5 Referncias Bibliogrficas

GREENE, W. Econometric analysis. 5th Edition. New Jersey: Prentice-Hall, 2002.


GUJARATI, D.N. Econometria Bsica. 4.ed. So Paulo: Campus, 2006.
HILL, C.; GRIFFITHS, W.; JUDGE, G. Econometria. So Paulo: Saraiva, 1999.
KENNEDY, P. A guide to econometrics. Cambridge: The MIT Press, 1998.
MATOS, O.C. Econometria Bsica: teoria e aplicaes. So Paulo: Atlas, 1995.
PINDYCK, Robert S.; RUBINFELD, Daniel L. Econometria: modelos e previses. 4.ed.
Rio de Janeiro: Elsevier/Campus, 2004.
SANTANA, Antnio Cordeiro. Mtodos Quantitativos em Economia: elementos e

aplicaes. Belm: UFRA, 2003.


VASCONCELLOS, M.A.S.; ALVES, D. (coords.). Manual de econometria. So Paulo:
Atlas, 2000.

6. Programas Recomendados
GRETL - http://gretl.sourceforge.net/gretl_portugues.html
EVIEWS - http://www.eviews.com/
STATA - http://www.stata.com/
LIMDEP - http://www.limdep.com/

You might also like