Professional Documents
Culture Documents
Figueiredo 1
UNIVERSIDADE FEDERAL DE MATO GROSSO
FACULDADE DE ECONOMIA
Econometria
Prof. Adriano Marcos Rodrigues Figueiredo
Verso de 21/01/20081
CUIAB - MT
1
Os direitos de reproduo pertencem ao autor e requer citao apropriada.
Econometria Prof. Adriano M. R. Figueiredo 2
SUMRIO
1. Introduo.......................................................................................................................... 3
2. Pressuposies do Modelo de Regresso Linear Clssico ................................................ 4
2.1. Pressuposio 1: A relao entre Y e X linear......................................................... 6
2.2. Pressuposio 2: O erro aleatrio tem mdia zero ..................................................... 9
2.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de
homocedasticidade) ............................................................................................................... 9
2.4. Pressuposio 4: Os erros aleatrios so independentes (ou no
autocorrelacionados) ............................................................................................................ 10
2.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 11
2.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia
constante: ............................................................................................................................. 11
2.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis
explicativas (no multicolinearidade) .................................................................................. 12
3 Estimao ........................................................................................................................ 13
Anexo 1: Estimao utilizando matrizes no Excel: ............................................................. 19
Anexo 2: Exerccios: ............................................................................................................ 20
4 Violaes nas Pressuposies Clssicas do Modelo de Regresso Linear ..................... 24
4.1. Pressuposio 1: A relao entre Y e X linear....................................................... 24
4.2. Pressuposio 2: O erro aleatrio tem mdia zero ................................................... 31
4.3. Pressuposio 3: O erro aleatrio tem varincia constante (presena de
homocedasticidade) ............................................................................................................. 37
4.4. Pressuposio 4: Os erros aleatrios so independentes (ou no
autocorrelacionados) ............................................................................................................ 53
4.5. Pressuposio 5: As variveis explicativas so no aleatrias (so fixas) ............... 65
4.6. Pressuposio 6: O erro tem distribuio normal, com mdia zero e varincia
constante: ............................................................................................................................. 65
4.7. Pressuposio 7: Ausncia de relao linear exata entre as variveis
explicativas (no multicolinearidade) .................................................................................. 68
4.8. Resumo ..................................................................................................................... 72
5 Referncias Bibliogrficas .............................................................................................. 73
6. Programas Recomendados .............................................................................................. 73
Econometria Prof. Adriano M. R. Figueiredo 3
1. Introduo
2 . Mdia do erro zero E(i) = 0 para todo i E() = 0, onde e 0 so vetores nX1 Erro de especificao
Y = AX11 X 2 2 X 3 3 e
Y * = 0 + 1X1* + 2 X *2 + 3 X *3 +
Y = A1 + 2 e 3X1 + 4 e5X 2 + e
n
CES: y = a 0 + a i x i
i =1
n n n
Generalizada Leontief: y = a 0 + a i x i + a ij x i x j
i =1 i =1 j=1
n n n
Translog: log y = a 0 + a i log x i + a ij log x i log x j
i =1 i =1 j=1
n n n
Quadrtica: y = a 0 + a i x i + a ij x i x j
i =1 i =1 j=1
Significa que o erro tem uma distribuio de probabilidade centralizada em zero (com
mdia zero). O erro o efeito das variveis que no consigo explicar no modelo. A mdia
pode ser considerada como o valor esperado do erro, ou seja,
E (i) = 0 , i = 1, 2, ..., n
Ou na forma matricial,
E() = 0
E (ei, ej) = 0, i j
esta pressuposio denominada ausncia de autocorrelao. A violao desta
pressuposio um problema tpico de sries temporais.
Quando se trabalha com ajustamentos de sries temporais, essa pressuposio em geral
no obedecida, visto que nas sries temporais como, por exemplo, as sries de preos, de
salrios e de produo tm no seu comportamento o reflexo de movimentos cclicos e/ou
sazonais.
Algumas causas da autocorrelao nos resduos esto relacionadas a variveis no-
especificadas no modelo, forma funcional inadequada e inrcia temporal no fenmeno.
A principal conseqncia da violao desta pressuposio a ineficincia dos
estimadores de M.Q.O. mas, continuam no-tendenciosos. Nesta situao, da mesma forma
que para a heterocedasticidade, melhor utilizar o mtodo de Mnimos Quadrados
Generalizados (M.Q.G.).
21 1 2 L 1 n
2
2 1 2 L 2 n
Var Cov ( ) = E ( ) = E
M M O M
n 1 n 2 L 2n
2 0 L 0
2
0 L 0
E ( ) = I = E
2
M M O M
0 0 L 2
Assim, ao escrever que var-cov() = 2.I, ao mesmo tempo se diz que as varincias so
homocedsticas iguais a 2 (diagonal principal tem todos os valores iguais a 2, i=j) e que as
autocorrelaes entre resduos de observaes distintas so nulas (valores nulos fora da
diagonal principal, ij).
i N (0, 2) , i = 1, 2, ..., n
As conseqncias associadas a no-normalidade dos resduos so parmetros
estimados no-normais e no ser possvel fazer os testes de hipteses com distribuies
baseadas na normal, como os usuais testes t e F para avaliar a qualidade dos
Econometria Prof. Adriano M. R. Figueiredo 12
ajustamentos, e para construir intervalos de confiana para os parmetros conforme exposto
ao longo do curso.
Os estimadores continuam sendo os Melhores Estimadores Lineares No-
Tendenciosos (MELNT).
Considere a matriz de variveis explicativas como composta por colunas das variveis
X1, X2, ... , Xn e ainda uma coluna de 1 para incluir o intercepto.
A pressuposio prev a no existncia de qualquer relao linear, como por exemplo,
X1 = 2.X2
X1 + 3.X2 = X5
No mtodo de mnimos quadrados ordinrios, a existncia de uma relao linear entre
os Xs representa uma reduo no posto da matriz (X) e o determinante de XX ser prximo
de zero. No caso de uma relao linear exata, haver uma singularidade perfeita na matriz
XX e seu determinante ser prximo de zero.
Como o mtodo de mnimos quadrados ordinrios prev a inverso da matriz XX, o
determinante prximo de zero far com que os parmetros sejam indeterminados. A matriz
(XX)-1 no existir e no ser possvel estimar o modelo.
O problema da correlao entre as variveis explicativas pode ser visto da seguinte
maneira:
1) ausncia de correlao ou ausncia de multicolinearidade: a regresso mltipla d o mesmo
resultado que as regresses simples quando as correlaes parciais entre as variveis
explicativas forem nulas;
2) correlao perfeita ou multicolinearidade perfeita: a relao linear perfeita entre os Xs
causa a indeterminao de = (XX)-1XY pois (XX)-1 singular;
3) alto grau de correlao entre os Xs ou multicolinearidade imperfeita: multicolinearidade
Conseqncias da multicolinearidade:
Tericas: conseqncias sobre as propriedades dos estimadores de M.Q.O.; a
multicolinearidade no afeta em nada as propriedades dos estimadores de M.Q.O.,
que continuam os melhores estimadores lineares no-tendenciosos (MELNT);
Prticas:
1. aumenta as varincias dos parmetros estimados:
aumenta V() = s2(XX)-1
(XX)-1 = (1/|XX|) . Adj(XX)
como |XX| 0 => (XX)-1 e V()
2. aumenta erro-padro
3. reduz t => induz no-significncia => estarei aceitando o fato de que ela
no importante no modelo em virtude da multicolinearidade
4. Estimativas muito sensveis: tirando uma ou duas observaes, as estimativas
alteram muito => melhor ter um modelo onde as alteraes no alteram
muito as estimativas, uma certa estabilidade do modelo em termos de
magnitudes e sinais
3 Estimao
( Y X
' = Y X )( )
' = Y Y Y X X Y +
X X
( ' ) =0
= 2 X Y + 2 X X
Sistema de equaes normais dos
X X = X Y mnimos quadrados
= ( X X )1 X Y
Vlida para no
multicolinearidade de X
Ou seja,
) = 2 ( X X ) X X ( X X )
Var Cov(
1 1
) = 2 I ( X X )1
Var Cov(
) = 2 ( X X ) 1
Var Cov(
ou
) = s 2 ( X X )1
Var Cov(
Desta forma, tem-se as equaes essenciais para a estimao. Segue quadro resumo
abaixo, com os estimadores de MQO.
O valor dos erros padres dos parmetros sero obtidos a partir da raiz da varincia
dos parmetros, ou seja, tirando-se a raiz da diagonal principal da var-cov().
Os parmetros devem ter anlise de significncia, por meio de um teste de hiptese do
tipo t-Student:
H0 : j = 0
H1 : j 0 ( bilateral )
tcalculado =
j
~ tn p
s G .L.
j
+ (reta estimada)
SQTot=SQReg + SQRes
Em que SQTot a soma dos quadrados totais (relativa variao total), SQRes a
soma do quadrado dos resduos (relativa variao no explicada) e SQReg a soma dos
quadrados da regresso (relativa variao explicada por X).
( )
2
SQReg = yi2 = Yi Y = Y Y nY 2
SQRes
R2 = 1
( n-p )
SQTot
( n-1)
Em gral, quanto maior o nmero de variveis X, maior o valor de R2, mas para o R2
ajustado esta regra no vale. Justamente para evitar a incluso equivocada de variveis
explicativas que se usa o R2 ajustado. Assim, a incluso de uma varivel irrelevante poder
elevar o valor de R2, mas no necessariamente elevar o valor de R2 ajustado.
2 2
Se n for grande e p pequeno em relao a n, a diferena entre R e R ser pequena.
Se n for pequeno e p grande em relao a n, a diferena entre ambos pode ser grande e o valor
ajustado ser mais importante.
Outro indicador o Teste F da regresso (F-statistic). Procura-se saber se o modelo
tem suporte estatstico. o Teste de significncia global da regresso: os Xs em conjunto
explicam Y de forma significativa. A hiptese nula de que todos os parmetros em conjunto
so nulos. A Hiptese alternativa prev pelo menos um parmetro no nulo.
H 0 : 1 = 0,2 = 0,...,k = 0
H1 : pelo menos um i 0
Define-se a estatstica de teste como:
Econometria Prof. Adriano M. R. Figueiredo 18
SQReg
p-1
F= ~ Fp 1,n p
SQRes G .L.
n-p
8. Fazer a raiz quadrada dos elementos da diagonal, obtendo os erros padres dos
parmetros estimados: utilizar a funo RAIZ() do Excel.
10. Calcular R2
a. R2 = SQE/SQT = (betaest.XY n.Y 2)/(YY - n. Y 2)
i. Y = mdia de Y
SQE SQ Re s
p 1 np
b. R 2 = = 1
SQT SQT
n 1 n 1
SQE
p 1
c. F = ~ Fp 1,n p ( GL )
SQ Re s
np
Anexo 2: Exerccios:
Dependent Variable: W
Method: Least Squares
Date: 03/22/06 Time: 11:10
Sample: 1980 2004
Included observations: 25
Variable Coefficient Std. Error t-Statistic Prob.
C -290.8117 327.1702 -0.888870 0.3841
IGP -0.326847 0.193898 -1.685664 0.1067
PIB 0.046182 0.034176 1.351321 0.1910
U 21.07782 8.048040 2.619000 0.0160
R-squared 0.255609 Mean dependent var 228.0943
Adjusted R-squared 0.149268 S.D. dependent var 40.64528
S.E. of regression 37.48923 Akaike info criterion 10.23163
Sum squared resid 29514.30 Schwarz criterion 10.42665
Log likelihood -123.8954 F-statistic 2.403666
Durbin-Watson stat 0.607152 Prob(F-statistic) 0.096187
7. Seja um exemplo do PIB Real (REALGDP) como funo do Consumo Real (REALCONS),
Investimento Real (REALINVS), Gastos Reais do Governo (REALGOVT), e Transaes
Lquidas Reais com o Exterior (REALINT), OBS a varivel de tendncia. Encontre o R2, R2
ajustado, os coeficientes, erros-padres e valores de t para completar os resultados e
analise-os a seguir:
Econometria Prof. Adriano M. R. Figueiredo 23
Deteco do problema:
Entre outros estes, o teste RESET de Ramsey (1969)2 um dos mais aplicados na literatura.
O nome vem do pesquisador Ramsey para o Regression Specification Error Test ou teste de erro de
especificao da regresso (No Eviews, ver na janela da equao o teste de estabilidade (Stability
Tests) e definir o nmero de termos estimados).
O teste baseado na regresso aumentada
Y = X + Z +
em que X so as variveis explicativas e Z so variveis dependentes estimadas e elevadas a uma
potncia
Z = [ Yest2 Yest3 Yest4] exemplo para trs fitted terms (termos acrescentados na regresso
aumentada).
A idia olhar a significncia dos para ver se os termos acrescentados so relevantes no
modelo, indicando erro de especificao.
Procedimento do teste:
1) estima-se Y = X +
2) obtm-se os valores previstos de Y e gera-se Yest2 Yest3 ou mais se
desejar. Recomenda-se no mximo at 3 termos, ou seja, at Yest4.
3) Ajusta-se a regresso aumentada, colocando-se os X e as variveis do item 2 :
Y = f ( X, Yest2, Yest3 )
4) Com as regresses de 1 e de 3, observam-se os valores de R2 novo (de 3) e R2
velho (de 1) e calcula-se a estatstica de teste:
2
Ramsey, J. B. (1969) Tests for Specification Errors in Classical Linear Least Squares Regression Analysis, Journal
of the Royal Statistical Society, Series B, 31, 350371.
Econometria Prof. Adriano M. R. Figueiredo 25
5) Estatstica de Teste;
2 2
Rnovo Rvelho
nmero de novos regressores (m)
F= 2
1 Rnovo
n nmero parametros no novo mod elo (p)
F ~ Fm,n-p
m o nmero de novos regressores
n-p o nmero de observaes menos o nmero de parmetros no
novo modelo
Implementao no Eviews:
No Eviews, aps a estimao dos parmetros, abre-se a janela da equao e depois clica-se
em View, e posteriormente em Stability Tests. A opo do teste RESET aparecer em outra janela
perguntando quantos termos ajustados sero includos (fitted terms). O aluno deve estabelecer
quantos termos (sugere-se at 3) e clica-se em ok. O programa gerar a estatstica de teste RESET
de Ramsey, mas aqui a hiptese nula um pouco diferente do teste calculado anterior, pois o
programa testa se todos os parmetros so zeros, o que indicar que no h erro. Portanto, se a
probabilidade de F do Eviews for abaixo do nvel de significncia (por exemplo, 10%) (F alto),
pode-se dizer que rejeita-se a hiptese nula e existe um erro de especificao. Se o F for baixo,
aceita-se que =0 e, portanto, no h erro de especificao.
No exemplo, mostra-se que existe erro de especificao.
Tabela 1. Exemplo de sada do Eviews para o Ramsey RESET Test.
Ramsey RESET Test:
F-statistic 5.281559 Probability 0.001932
Log likelihood ratio 15.74446 Probability 0.001279
Econometria Prof. Adriano M. R. Figueiredo 26
Test Equation:
Dependent Variable: QSOJA
Method: Least Squares
Date: 06/06/03 Time: 14:57
Sample: 1988:09 1998:05
Included observations: 117
Variable Coefficient Std. Error t-Statistic Prob.
FERTILIZANTE 304.1298 135.0469 2.252031 0.0263
TRATOR 18591.29 8231.767 2.258481 0.0259
MO 115237.7 51069.36 2.256493 0.0260
C -230604.7 101861.3 -2.263908 0.0255
FITTED^2 2.664804 1.165269 2.286857 0.0241
FITTED^3 -0.005642 0.002453 -2.300025 0.0233
FITTED^4 4.43E-06 1.92E-06 2.302617 0.0232
R-squared 0.532456 Mean dependent var 322.2544
Adjusted R-squared 0.506954 S.D. dependent var 56.01272
S.E. of regression 39.33059 Akaike info criterion 10.23985
Sum squared resid 170158.4 Schwarz criterion 10.40510
Log likelihood -592.0310 F-statistic 20.87869
Durbin-Watson stat 0.770973 Prob(F-statistic) 0.000000
Outra forma olhar os diferentes modelos e comparar o R2 ajustado. Quanto mais prximo
de 1 melhor ser a estimao. deficiente para o caso de varivel omitida.
Outras opes so observar os coeficientes do critrio de Akaike e Schwarz, fornecidos na
sada da estimao do Eviews. Menores coeficientes AIC e SIC indicam melhores ajustamentos da
regresso, mas s podem ser comparados se as unidades das variveis das diferentes regresses
forem as mesmas (por exemplo, no se aplica numa comparao entre Y e outra com LogY). Deve-
se olhar todos os critrios para melhor anlise dos resultados.
O Critrio de Informao de Akaike (ou AIC de Akaikes Information Criterion) ou o
Critrio de Informao de Schwarz ou Bayesiano (ou SIC de Schwarzs Information Criterion ou
em alguns livros BIC de Bayesian Information Criterion) so expressos no Eviews da forma j
logaritmizada como:
A maior dificuldade que no existe teste formal para essa pressuposio. similar a um
erro de especificao do modelo, como por exemplo, com variveis relevantes omitidas do modelo.
O modelo com uma correta especificao provavelmente no ter problemas com mdia dos
resduos no nula.
Normalmente se faz o teste simples de H0: mdia igual a zero para investigar a violao
ou no da pressuposio. Valores elevados para a probabilidade indicaro a aceitao da hiptese
nula e confirmao da pressuposio.
Econometria Prof. Adriano M. R. Figueiredo 32
Anexo:
Roteiro para testar mdia dos resduos nula:
Econometria Prof. Adriano M. R. Figueiredo 33
Tabela dos resduos
3
DIAZ, M.D.M. Problemas economtricos no modelo linear geral. In: VASCONCELLOS, M.A.S.; ALVES, D.
(Coords.) Manual de econometria. So Paulo:Atlas, 2000. p.105-137.
Econometria Prof. Adriano M. R. Figueiredo 38
Conhecido o resultado do teste de Glejser, utiliza-se a varivel da regresso auxiliar
que acusou o problema para ponderar as variveis, transformando-as, e procedendo a
estimao de M.Q.G., ou seja, M.Q.O. nas variveis transformadas.
Este problema de presena de heterocedasticidade tambm pode ser detectado por
meio de anlise grfica. Pode-se estimar a funo e fazer o grfico dos resduos ao longo da
amostra:
ei x Xi
ei x Yi ou Yi,estimado
A estimao por M.Q.G. ser para o modelo:
P.Y = PX + P
e o vetor de parmetros estimados ser
= (XPPX)-1XPPY
que o mesmo que estimar o M.Q.O. para Y* = X* + *.
Os resduos podem ser obtidos no Eviews fazendo, na janela de uma equao,
Procs/make residual series. O programa pergunta o nome da srie a conter os resduos e uma
vez feito isso s especificar a srie como varivel.
O mtodo como descrito acima uma alternativa apresentada em vrios livros de
econometria, mas como a transformao fazendo Y/Xi pode gerar uma correlao espria,
indicando uma correlao entre Y/X que na realidade no ocorreria entre Y e X caso no
fosse feita a transformao, sugere-se ento o teste e a correo de White4.
Por exemplo, para uma regresso da forma
Yi = 1 + 2 X2i + 3X3i + i
o teste de White implementado manualmente da seguinte forma:
a) estima-se a regresso inicial e obtm-se os resduos ei;
b) faz-se uma regresso auxiliar do tipo
ei2= 1 + 2 X2i + 3X3i + 4 X2i2+ 5X3i2 + 6 X2i.X3i + i
ou seja, o quadrado dos resduos estimados como funo das variveis explicativas, dos
quadrados das variveis explicativas e do produto cruzado das variveis explicativas. Deve-se
incluir o termo do intercepto (1) mesmo que na regresso original no o tenha.
4
White, Halbert (1980) A Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for
Heteroskedasticity, Econometrica, 48, 817838.
Econometria Prof. Adriano M. R. Figueiredo 39
c) Analisa-se o R2 da regresso auxiliar multiplicado pelo tamanho da amostra (n)
comparando com o valor da tabela qui-quadrado para graus de liberdade iguais ao nmero
total de regressores da equao auxiliar. No nosso exemplo,
n. R2 ~ 2 com gl = 5 (X2i, X3i , X2i2, X3i2 , X2i.X3i)
Se n.R2 > 2 tabelado, ento existe heterocedasticidade.
Se n.R2 < 2 tabelado, ento 2 = 3 = 4 = 5 = 6 = 0 , e no existe
heterocedasticidade.
Deve-se tomar cuidado com este teste, pois ele prev a incluso de termos adicionais
que, em presena de muitas variveis X, poder comprometer o modelo com relao aos seus
graus de liberdade.
A correo do modelo neste caso pode ser feita utilizando os estimadores de matrizes
de covarincias heterocedstico-consistentes de White, que podem ser obtidos rapidamente
pelo software Eviews.
A operacionalizao no Eviews bastante simples. Primeiro o estudante deve estimar
o modelo e, na janela da equao estimada, selecionar View/Residual Tests e depois clicar em
White Heteroskedasticity (no cross terms ou cross terms). A diferena das duas opes que
na primeira no inclui termos multiplicativos das variveis Xi.Xj. Na primeira opo, se
economizam graus de liberdade mas representa uma distoro do teste original. Na segunda
opo, no rigor cientfico, incluem-se termos cruzados e, em presena de muitos regressores,
pode causar problemas de reduzidos graus de liberdade.
Sugere-se utilizar a primeira opo quando tiver mais de 5 regressores Xi, e a segunda
quando tiver menos de 5, pois com os termos cruzados, ocorreria uma incluso de mais outros
5 termos.
Para a mesma regresso da Tabela 1, mostram-se os resultados do teste de White para
termos cruzados e sem termos cruzados. Procure distinguir as diferenas nos resultados.
A hiptese nula do teste que no h heterocedasticidade, ou seja, de que os erros
so homocedsticos e independentes dos regressores, e que a especificao do modelo
correta. Assim, desejvel ter a aceitao da hiptese nula, com probabilidade acima de
10%, e baixo valor de n.R2.
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/03 Time: 18:01
Sample: 1988:09 1998:05
Included observations: 117
Variable Coefficient Std. Error t-Statistic Prob.
C -20557.49 9888.589 -2.078910 0.0400
FERTILIZANTE 445.3517 600.7180 0.741366 0.4601
FERTILIZANTE^2 25.26911 15.80557 1.598748 0.1128
FERTILIZANTE*TRA -120.1672 87.69892 -1.370224 0.1735
TOR
FERTILIZANTE*MO -13077.63 3137.312 -4.168419 0.0001
TRATOR 864.9398 3116.365 0.277548 0.7819
TRATOR^2 309.3549 253.6114 1.219799 0.2252
TRATOR*MO -22449.97 12081.31 -1.858240 0.0659
MO 426444.0 90390.39 4.717802 0.0000
MO^2 -365960.5 130236.2 -2.809975 0.0059
R-squared 0.280643 Mean dependent var 1663.833
Adjusted R-squared 0.220136 S.D. dependent var 2943.689
S.E. of regression 2599.568 Akaike info criterion 18.64567
Sum squared resid 7.23E+08 Schwarz criterion 18.88176
Log likelihood -1080.772 F-statistic 4.638220
Durbin-Watson stat 1.549746 Prob(F-statistic) 0.000034
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 06/06/03 Time: 18:32
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
C -6219665. 6459809. -0.962825 0.3509
SALES 229.3508 126.2197 1.817077 0.0892
SALES^2 -0.000537 0.000449 -1.194952 0.2507
R-squared 0.289583 Mean dependent var 6767046.
Adjusted R-squared 0.194861 S.D. dependent var 14706011
S.E. of regression 13195639 Akaike info criterion 35.77968
Sum squared resid 2.61E+15 Schwarz criterion 35.92808
Log likelihood -319.0171 F-statistic 3.057178
Durbin-Watson stat 1.694567 Prob(F-statistic) 0.076975
Neste caso, com os dados em seo cruzada (indstrias dos EUA), no foi possvel
deixar de rejeitar a hiptese nula de homocedasticidade ao nvel de 10% de significncia,
como observado pelo valor da probabilidade de Obs*R-squared = 0,073811, menor que 0,10.
Existe problema de heterocedasticidade nos resduos.
Mostram-se agora os resultados com a correo de White, obtidos no Eviews fazendo
alterao na janela da estimao, clicando em Options e selecionando a caixa
heteroskedasticity, e clicando em White. Os resultados so:
Econometria Prof. Adriano M. R. Figueiredo 43
Tabela 6. Resultados da estimao com a correo de White para heterocedasticidade.
Dependent Variable: RD
Method: Least Squares
Date: 06/06/03 Time: 18:42
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
SALES 0.031900 0.010147 3.143815 0.0063
C 192.9931 533.9317 0.361457 0.7225
R-squared 0.478303 Mean dependent var 3056.856
Adjusted R-squared 0.445697 S.D. dependent var 3705.973
S.E. of regression 2759.153 Akaike info criterion 18.78767
Sum squared resid 1.22E+08 Schwarz criterion 18.88660
Log likelihood -167.0891 F-statistic 14.66916
Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476
Observe que agora na sada do Eviews, indica-se que foi utilizada a opo White
Heteroskedasticity-Consistent Standard Errors & Covariance, e pode-se comparar os
resultados com os da Tabela 4, sem essa opo de White. De modo geral, nesse exemplo, os
erros-padres estavam subestimados. Pode-se observar que o modelo com heterocedasticidade
apresenta vis nos erros padres, podendo ser negativo ou positivo, dependendo do estudo.
Quanto aos parmetros, no ocorrem alteraes.
Aps a correo de White no cabe mais a nova realizao do teste, pois os resultados
j foram obtidos com os resduos alterados pelo critrio de White.
Econometria Prof. Adriano M. R. Figueiredo 44
Anexo
Roteiro para estimao no Eviews Heterocedasticidade
Estimation Command:
=====================
LS (PD) (VENDAS) C
Estimation Equation:
=====================
PD = C(1)*VENDAS + C(2)
Substituted Coefficients:
=====================
PD = 0.03190033243*VENDAS + 192.9931098
Dependent Variable: PD
Method: Least Squares
Date: 03/04/05 Time: 16:00
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
VENDAS 0.031900 0.008329 3.830033 0.0015
C 192.9931 990.9858 0.194749 0.8480
R-squared 0.478303 Mean dependent var 3056.856
Adjusted R-squared 0.445697 S.D. dependent var 3705.973
S.E. of regression 2759.153 Akaike info criterion 18.78767
Sum squared resid 1.22E+08 Schwarz criterion 18.88660
Log likelihood -167.0891 F-statistic 14.66916
Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476
Econometria Prof. Adriano M. R. Figueiredo 45
Gerar sries de resduos em Procs/Make residual series:
Econometria Prof. Adriano M. R. Figueiredo 46
Fazer srie de resduos absolutos: me=@abs(e)
Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:18
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
VENDAS 0.011939 0.005704 2.093059 0.0526
C 578.5710 678.6950 0.852476 0.4065
R-squared 0.214951 Mean dependent var 1650.432
Adjusted R-squared 0.165886 S.D. dependent var 2069.046
S.E. of regression 1889.657 Akaike info criterion 18.03062
Sum squared resid 57132868 Schwarz criterion 18.12955
Log likelihood -160.2756 F-statistic 4.380896
Durbin-Watson stat 1.743294 Prob(F-statistic) 0.052633
Econometria Prof. Adriano M. R. Figueiredo 48
Me em funo da raiz de vendas:
Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:18
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
SQR(VENDAS) 7.971957 3.363146 2.370387 0.0307
C -507.0202 1007.684 -0.503154 0.6217
R-squared 0.259901 Mean dependent var 1650.432
Adjusted R-squared 0.213645 S.D. dependent var 2069.046
S.E. of regression 1834.761 Akaike info criterion 17.97166
Sum squared resid 53861578 Schwarz criterion 18.07059
Log likelihood -159.7449 F-statistic 5.618732
Durbin-Watson stat 1.785727 Prob(F-statistic) 0.030672
Econometria Prof. Adriano M. R. Figueiredo 49
Me em funo de 1/vendas:
Dependent Variable: ME
Method: Least Squares
Date: 03/04/05 Time: 18:20
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
1/(VENDAS) -19924566 12318138 -1.617498 0.1253
C 2273.702 604.6990 3.760056 0.0017
R-squared 0.140538 Mean dependent var 1650.432
Adjusted R-squared 0.086822 S.D. dependent var 2069.046
S.E. of regression 1977.188 Akaike info criterion 18.12118
Sum squared resid 62548360 Schwarz criterion 18.22011
Log likelihood -161.0906 F-statistic 2.616300
Durbin-Watson stat 1.505561 Prob(F-statistic) 0.125313
Correo:
TESTE
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/04/05 Time: 18:32
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
C -6219665. 6459809. -0.962825 0.3509
VENDAS 229.3508 126.2197 1.817077 0.0892
VENDAS^2 -0.000537 0.000449 -1.194952 0.2507
R-squared 0.289583 Mean dependent var 6767046.
Adjusted R-squared 0.194861 S.D. dependent var 14706011
S.E. of regression 13195639 Akaike info criterion 35.77968
Sum squared resid 2.61E+15 Schwarz criterion 35.92808
Log likelihood -319.0171 F-statistic 3.057178
Durbin-Watson stat 1.694567 Prob(F-statistic) 0.076975
Dependent Variable: PD
Method: Least Squares
Date: 03/04/05 Time: 18:29
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std. Error t-Statistic Prob.
C 192.9931 533.9317 0.361457 0.7225
VENDAS 0.031900 0.010147 3.143815 0.0063
R-squared 0.478303 Mean dependent var 3056.856
Adjusted R-squared 0.445697 S.D. dependent var 3705.973
S.E. of regression 2759.153 Akaike info criterion 18.78767
Sum squared resid 1.22E+08 Schwarz criterion 18.88660
Log likelihood -167.0891 F-statistic 14.66916
Durbin-Watson stat 3.015607 Prob(F-statistic) 0.001476
( t t 1 )
2
DW = t =2
T
= 2(1 )
2
t
t =1
em que
=0 DW = 2 => ausncia de autocorrelao
= +1 DW = 0 => autocorrelao positiva e perfeita
= -1 DW = 4 => autocorrelao negativa e perfeita
em que
dL = limite inferior => vem da tabela para n observaes e k variveis explanatrias
dU = limite superior => vem da tabela para n observaes e k variveis explanatrias
Econometria Prof. Adriano M. R. Figueiredo 55
Exemplo:
Para k = 3 (referente a um modelo com X1, X2 e X3), para n = 30 observaes, a tabela de
DW para 5% de significncia nos fornece dL = 1,21 e dU=1,65, e portanto,
4-dL = 4 1,21 = 2,79
4 dU = 4 1,65 = 2,35
Para 0<DW<1,21 = rejeio de Ho e autocorrelao positiva
Para 1,21<DW<1,65 = rea inconclusiva
Para 1,65<DW<2,35 = aceitao de Ho e no-autocorrelao
Para 2,35<DW<2,79 = rea inconclusiva
Para 2,79<DW<4 = rejeio de Ho e autocorrelao negativa
T
h= ~ N(0,1) = comparar com o limite de 1,96 p/ 5%
1 T.Var ()
em que
T nmero de observaes
parmetro da varivel dependente defasada.
Yt Yt 1 = 1 (1 ) + 2 (X t X t 1 ) + t
Econometria Prof. Adriano M. R. Figueiredo 57
ou
Y* = 1* + 2.X1* + t*
4) Recalcula-se (2) e verifica-se a convergncia para .
5) Repetem-se os passos (2) a (4) at que a convergncia seja menor que 0,01.
A implementao no Eviews prev a insero de um termo AR(1) na especificao das
variveis da equao. O programa far a estimao considerando a correo para o
autoregressivo de primeira ordem.
Econometria Prof. Adriano M. R. Figueiredo 58
Anexo
Autocorrelao
Dependent Variable: RR
Method: Least Squares
Date: 03/07/05 Time: 20:19
Sample: 1954 1981
Included observations: 28
Variable Coefficient Std. Error t-Statistic Prob.
GROWTH 3.943315 1.293445 3.048693 0.0054
INFLATION -2.499426 1.082101 -2.309789 0.0294
C 3.531812 8.111369 0.435415 0.6670
R-squared 0.572374 Mean dependent var 5.875000
Adjusted R-squared 0.538164 S.D. dependent var 20.89837
S.E. of regression 14.20223 Akaike info criterion 8.245632
Sum squared resid 5042.582 Schwarz criterion 8.388368
Log likelihood -112.4388 F-statistic 16.73114
Durbin-Watson stat 1.896592 Prob(F-statistic) 0.000024
DW = 1,8965
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 20:23
Variable Coefficient Std. Error t-Statistic Prob.
GROWTH -0.371429 1.426117 -0.260448 0.7968
INFLATION -0.131592 1.125693 -0.116898 0.9080
C 1.737633 8.657860 0.200700 0.8427
RESID(-1) -0.014931 0.211928 -0.070455 0.9444
RESID(-2) -0.177451 0.222006 -0.799306 0.4323
R-squared 0.027070 Mean dependent var -3.68E-15
Adjusted R-squared -0.142136 S.D. dependent var 13.66610
S.E. of regression 14.60506 Akaike info criterion 8.361046
Sum squared resid 4906.081 Schwarz criterion 8.598940
Log likelihood -112.0546 F-statistic 0.159981
Durbin-Watson stat 1.787912 Prob(F-statistic) 0.956406
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:12
Variable Coefficient Std. Error t-Statistic Prob.
LOG(IPI) -0.104877 0.146079 -0.717946 0.4797
LOG(PCBOLSA) 0.089288 0.102299 0.872811 0.3914
LOG(CONST) 0.045395 0.123362 0.367981 0.7161
LOG(PALU) -0.009785 0.091346 -0.107125 0.9156
C -0.368385 0.867570 -0.424617 0.6749
RESID(-1) 0.567066 0.179076 3.166620 0.0042
R-squared 0.294688 Mean dependent var 8.14E-17
Adjusted R-squared 0.147748 S.D. dependent var 0.113041
S.E. of regression 0.104357 Akaike info criterion -1.505141
Sum squared resid 0.261370 Schwarz criterion -1.224901
Log likelihood 28.57711 F-statistic 2.005497
Durbin-Watson stat 1.521486 Prob(F-statistic) 0.114145
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:13
Variable Coefficient Std. Error t-Statistic Prob.
LOG(IPI) -0.036780 0.134421 -0.273620 0.7868
LOG(PCBOLSA) 0.028677 0.095271 0.301008 0.7661
LOG(CONST) 0.082020 0.112179 0.731149 0.4721
LOG(PALU) -0.017166 0.082432 -0.208239 0.8369
C -0.552588 0.785758 -0.703255 0.4890
RESID(-1) 0.795135 0.184599 4.307363 0.0003
RESID(-2) -0.489015 0.191703 -2.550900 0.0179
R-squared 0.450228 Mean dependent var 8.14E-17
Adjusted R-squared 0.306809 S.D. dependent var 0.113041
S.E. of regression 0.094116 Akaike info criterion -1.687610
Sum squared resid 0.203731 Schwarz criterion -1.360664
Log likelihood 32.31415 F-statistic 3.139250
Durbin-Watson stat 1.918606 Prob(F-statistic) 0.021333
Tambm existe problema para AR(2). Ficou mais expressivo o problema de
autocorrelao.
Para AR(3):
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 6.169355 Probability 0.003321
Obs*R-squared 13.70695 Probability 0.003332
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 03/07/05 Time: 21:25
Variable Coefficient Std. Error t-Statistic Prob.
LOG(IPI) -0.029746 0.137274 -0.216691 0.8304
LOG(PCBOLSA) 0.025964 0.096960 0.267780 0.7914
LOG(CONST) 0.078075 0.114254 0.683340 0.5015
LOG(PALU) -0.025278 0.085213 -0.296644 0.7695
C -0.512105 0.802317 -0.638283 0.5299
RESID(-1) 0.854409 0.219535 3.891895 0.0008
RESID(-2) -0.592317 0.278293 -2.128395 0.0447
RESID(-3) 0.126950 0.244219 0.519819 0.6084
R-squared 0.456898 Mean dependent var 8.14E-17
Adjusted R-squared 0.284093 S.D. dependent var 0.113041
S.E. of regression 0.095646 Akaike info criterion -1.633151
Sum squared resid 0.201259 Schwarz criterion -1.259498
Log likelihood 32.49727 F-statistic 2.644009
Durbin-Watson stat 2.002055 Prob(F-statistic) 0.038212
Ainda tem, mas menos que para AR(2). Observe que o termo de RESID(-3) j no
significativo. Optar por corrigir para AR(2).
Econometria Prof. Adriano M. R. Figueiredo 62
Estimao com AR(1) e AR(2):
O teste para deteco mais usual o Bera-Jarque, ou teste BJ, o qual testa a simetria e
a curtose da distribuio dos resduos em relao curva normal.
A curtose est associada ao achatamento da distribuio, quanto mais chata menor o
valor da curtose (K). Exemplo: K>3 (distribuio mais em p), K<3 (distribuio mais
chata).
A curtose (em ingls kurtosis) definida pela expresso:
4
1 Yi Y
t =1 Var
N
K=
N ( )
BJ =
1
6
[
(n p ) S 2 + 1
4
(K 3)2 ] ~ 2gl = 2
Se rejeitar H0:erros normais, tenho que descobrir qual a distribuio real dos
resduos e fazer nova deduo do estimador dos parmetros.
Em geral, para amostras grandes, aplica-se o Teorema do Limite Central
argumentando que no limite tem-se a normalidade da distribuio dos resduos.
Exemplo 1: se K=2,95 e 2tab = 1,76 e o p-value=0,41, para H0: erro normal, ento p-value
maior que 0,10 indica a aceitao de H0, ou seja, os erros so normais.
Exemplo 2:
Ex12_22, Gujarati (p.447):
Std. Dev = 0,085542
Skewness = 0,047155
Kurtosis = 2,367936
BJ = 0,47 e p-value = 0,78 => aceita H0: erros normais
Econometria Prof. Adriano M. R. Figueiredo 67
Anexo
Erros Normais: Equation/View/Residual Tests/Histogram Normality Test
Econometria Prof. Adriano M. R. Figueiredo 68
Ou seja, retorna as correlaes parciais de y com respeito a cada varivel da lista (year,
g, interest, p).
Outro mtodo a anlise do Fator de varincia inflacionria (FVI), ou no ingls
Variance Inflation Factor (VIF), ou ainda, Fator de inflao da Varincia (Gujarati, 2006:
p.282), para cada varivel explicativa. Neste caso, faz-se a estimao de
e obtm-se o para cada varivel. O FVI da varivel i ser:
4.8. Resumo
Pressuposio Teste Hiptese Nula: H0 Problema
2 . Mdia do erro zero Teste de hiptese simples (t) H0: mdia igual a zero Se rejeitar H0
5 Referncias Bibliogrficas
6. Programas Recomendados
GRETL - http://gretl.sourceforge.net/gretl_portugues.html
EVIEWS - http://www.eviews.com/
STATA - http://www.stata.com/
LIMDEP - http://www.limdep.com/