You are on page 1of 29

Testarea ipotezelor clasice asupra

modelului de regresie
Ipotezele sunt presupuneri cu privire la datele din
economie, dar i la seria reziduurilor (ei) rezultate n urma
aplicrii modelului, astfel nct confirmarea lor s asigure
performanele ateptate ale modelului vizat.

Ipoteze cu privire la date i variabila rezidual:

A) Date
-date suficiente (n>=15) i corecte;
-factorii independeni. Variabilele exogene Xj sunt
independente ntre ele, formnd un sistem de vectori liniari
independeni. n caz contrar, apare fenomenul de
multicoliniaritate, care implic imposibilitatea calculrii matricei
inverse(XX) 1, precum i a estimrii parametrilor.
-modelul este liniar (datele confirm liniaritatea) i
corect elaborat (include toi factorii importani).
B) variabila rezidual:

- Reziduurile (ei) sunt omogene pe grupe de valori ordonate


n raport cu xi (variabila rezidual este egal mprtiat
sau homoscedastic);

- Reziduurile sunt neautocorelate (ei nu depind de ei-1)

- Reziduurile sunt de medie egal cu zero i urmeaz o


repartiie normal.
I1. Variabilele x i y nu sunt
afectate de erori de msur.
Regula celor trei sigma:

xi x 3 x x 3 x xi x 3 x
i 2
x x
x
n 1

yi y 3 y y 3 y yi y 3 y

y y
2

y i

n 1
I2.Ipoteza de multicolinearitate a
variabilelor exogene

Variabilele exogene Xj sunt independente ntre ele, formnd un


sistem de vectori liniari independeni. n caz contrar, apare
fenomenul de multicolinearitate, care implic imposibilitatea
calculrii matricei inverse(XX) 1, precum i a estimrii parametrilor.

Verificarea ipotezei presupune ca variabilele exogene s formeze un


sistem de vectori liniari independeni, respectiv variabilele exogene s
nu fie corelate.
Cauze multicolinearitate

Metoda de colectare a datelor

Restriciile asupra modelului sau asupra populaiei eantionate

Specificarea modelului

Model supradeterminat
Depistarea fenomenului de
multicolinearitate
reprezentarea grafic a seriilor de valori corespunztoare variabilelor
explicative . n cazul n care se constat analogii n evoluie, acestea indic
existena unei corelaii suficient de intense ntre variabilele respective.

xj

x2

x1

calculul determinantului matricei X`X, D(X`X), n sensul c, pe msur ce se


apropie de zero, acesta indic o intercorelare din ce n ce mai strns. Dac D(X`X) <
0,1 se consider c fenomenul de multicolinearitate este prezent
calculul mrimii coeficientului de determinare (R2). Aceast valoare
este comparat cu mrimea aceluiai coeficient obinut n condiiile n care
una dintre variabilele factoriale a fost omis din model. n cazul n care
valorile coeficienilor sunt apropiate ca mrime se poate considera c
variabila omis este coliniar cu celelalte variabile factoriale. Absena acestei
variabile din model ar fi de dorit ntruct ar conduce la diminuarea
multicoliniaritii far a afecta semnificativ gradul de determinare a factorilor
asupra variabilei efect.
testele statistice Student, t- utilizat n vederea verificrii semnificaiei
parametrilor modelului, i Fisher-Snedecor, F- utilizat n vederea verificrii
semnificaiei modelului. n cazul n care testul F semnaleaz semnificaie, iar
testul t, aplicat aceluiai model, semnaleaz nesemnificaii n rndul
parametrilor, acest lucru reprezint un indiciu c multicolinearitatea este
prezent.
Criteriul Klein, a crui aplicare presupune parcurgerea
urmtoarelor etape:
Pentru modelul de regresie complet se calculeaz coeficientul de
determinare Ry2;

Se determin matricea de corelaie liniar a variabilelor exogene:

xi / x j i , j 1,n

Dou variabile exogene xi i xj sunt coliniare dac:

R rxi / x j
2
y
Criteriul factorului de inflaie, care presupune
parcurgerea urmtoarelor etape:
Se regreseaz fiecare variabil exogen (j) n funcie de toate
celelalte variabile exogene, notndu-se cu R2j coeficientul de
determinare;

1
Se calculeaz factorul de inflaie: FI j
1 R 2j

Dac FIj este foarte mare fenomenul de multicolinearitate


datorat variabilei j este prezent (mai mare decat 4,
multicoliniaritate, mai mare decat 10 multicoliniaritate sever)
Efecte multicolinearitate
la creterea varianei acelor estimatori ai parametrilor modelului
liniar de regresie ce corespund variabilelor exogene aflate ntr-o
dependen liniar semnificativ, deci scderea performanelor
modelului de regresie estimat prin metoda celor mai mici
ptrate clasic;

la intervale de ncredere mari i acceptarea ipotezei nule


(parametrii nu sunt semnificativ diferii de zero), datorit
varianiei ridicate;

valori ale raportului de corelaie R2 foarte ridicate, chiar n


cazul n care raportul t este nesemnificativ.
Atenuare multicolinearitate
includerea de termeni suplimentari (n > 15), astfel nct, eventualele
analogii, datorate hazardului, s fie, pe ct posibil, eliminate;

renunarea la una dintre variabile, considerndu-se c variabila omis este


exprimat de cea reinut n model;

dac datele sunt prezentate sub form de serii cronologice, se pot calcula
diferenele de ordinul 1 - (1) = yt yt-1 sau pot fi logaritmate
valorile lui Yt, Xj n scopul atenurii coliniaritii cauzate de prezena
trendului n cadrul seriilor de date;

-utilizarea de serii de date formate n optic transversal (serii


sincrone) poate constitui o modalitate de diminuare sau chiar de
eliminare a interdependenei factorilor
I3. Ipoteza de
homoscedasticitate a variabilei
reziduale
Definiie:
Variabila aleatoare (rezidual) e este de medie nul M e 0
2
s
iar dispersia ei e este constant i independent de X.

Pe baza acestei ipoteze se poate admite c legtura dintre Y


i X este relativ stabil. Contrariul acestei ipoteze este
heteroscedasticitatea.
Consecine ale heteroscedasticitii:

estimatorii rmn nedeplasai, dar nu mai sunt eficieni,

M.C.M.M.P. conduce la o subestimare a parametrilor modelului,


influennd sensibil i calitatea diferitelor teste statistice aplicate
acestuia.
Depistare heteroscedasticitate:

Procedeul grafic - care const n construirea corelogramei


privind valorile variabilei factoriale x i ale variabilei reziduale e.

Testul Goldfeld-Quandt (GQ) Etape:


Testul Goldfeld-Quandt (GQ) Etape:
E1. Se ordoneaz cresctor seria observaiilor dup variabila
explicativ i excludem c=n/3 sau c=n/4 valori centrale.

E2. mprim seria astfel obinut n dou subserii pentru care estimm
urmtoarele modele de regresie:

y1i 1 1 x1i 1i cu i 1...(n c / 2


y 2i 2 2 x 2i 2i cu i (n c / 2 1...n
E3. Pentru cele dou modele de regresie se determin suma ptratelor
erorilor:
( n c ) / 2 ( n c ) / 2 n n

12i ( yi yi )2 2
2i
i ( n c ) / 2 1
i i
( y
y ) 2

i ( n c ) / 2 1
i 1 i 1
Testul Goldfeld-Quandt (GQ) Etape:
E4. Ipoteze statistice:
H0: model homoscedastic
H1: model heteroscedastic
Testul GQ:
n
nc
2i /
2

i ( n c ) / 2 1 2
k
var iaa max ima
Fcalc ( n c ) / 2
2 nc var iana min im
i 1
1i /
2
k unde k reprezint numrul de parametri ai fiecrui

model.

Decizia:

Dac Fcalc Ftab se respinge ipoteza nul, erorile sunt heteroscedastice

Dac Fcalc Ftab erorile sunt homoscedastice


Testul White

Etape:
estimarea parametrilor modelului iniial i calculul valorilor estimate ale
variabilei reziduale, e;
construirea unei regresii auxiliare:

regresie simpl ei2 0 1xi 2 x 2i ui

regresie multipl ei2 0 1x1i 2 x2i 3 x12i 4 x22i 5 x1i x2i ui

verificarea semnificaiei parametrilor modelului nou construit


Dou variante de aplicare a testului White:
utilizarea testului Fisher-Snedecor clasic, bazat pe ipoteza nulitii parametrilor, respectiv:

H0: 0 1 2 0

Dac: Fc F ;v1 ;v2 atunci ipoteza de homoscedasticitate se verific, cazul contrar semnificnd
prezena heteroscedasticitii erorilor.

utilizarea testului LM, calculat ca produs ntre numrul de observaii corespunztoare


modelului, n, i coeficientul de determinare, R2, corespunztor acestei regresii auxiliare.

LM n R 2
Dac LM 2;v

erorile sunt homoscedastice, respectiv ipoteza nulitii parametrilor este acceptat (hi ptrat se
gsete n funcie de pragul de semnificaie alfa i v=numrul de variabile exogene).
Eliminare heteroscedasticitate:

1. metoda regresiei ponderate:


Dac variaia erorii este proporional cu ptratul variabilei
explicative:
yi 1 ei
yi a bxi ei |: xi a b
xi xi xi
Dac variaia erorii este proporional cu variabila explicativ:
yi 1 ei
yi a bxi ei |: xi a b
xi xi xi
2. transformarea logaritmic

ln yi ln X i i
I4. Ipoteza de neautocorelare a
erorilor

Definiie:

Valorile variabilei reziduale e sunt necorelate,


respectiv nu exist fenomenul de autocorelare a
erorilor.

Cov(i,j)=0 ij

Obs. Deoarece aplicaiile practice au artat c acest fenomen e frecvent n


special n cazul seriilor cronologice interdependente, verificarea acestuia este
necesar, mai ales n cazul calculelor de prognoz.
Consecine ale autocorelrii:

nu mai permite obinerea de estimatori eficieni,

prezint totodat distorsiuni de la valorile reale;

se pstreaz ns calitatea acestora de a fi consisteni, fapt ce


impune introducerea n calcul a unor serii de date suficient de
lungi (eantion de valori ct mai mare).
Cauze ale autocorelrii:

se datoreaz analizei n timp a legturii dintre variabile, respectiv


a unui efect inerial n evoluia variabilelor;

o eroare de specificare a modelului, respectiv omiterea unei


variabile explicative, xt, cu influen puternic asupra variabilei
endogene y.
Depistare autocorelare:

Procedeul grafic - care const n construirea corelogramei


privind valorile variabilei explicate y i ale variabilei reziduale e.

autocorelaia erorilor se manifest fie printr-un numr foarte mic


sau foarte mare de schimbri ale semnului variabilei aleatoare, fie
ca urmare a unor schimbri simetrice (o oscilaie regulat a
valorilor variabilei reziduale fa de valorile lui y).
ut

yt
Depistare autocorelare:
Calculul coeficientului de autocorelaie de ordinul 1
n n

e e t t 1 e e t t 1
r1 t 2
n 1
t 2
n

t

e 2

t 1
t 1

e 2

t 2

Acesta este definit n intervalul 1; 1, avnd urmtoarea


semnificaie:
1, autocorelaie strict negati v

r( 1) 0, independen
1, autocorelaie strict poziti v

Depistare autocorelare:

Testul Durbin-Watson const n calcularea valorii:


n

t t 1
e
e 2

d t 2
n

t
2
e
t 1

Aceast valoare empiric ,d, se compar cu dou valori teoretice, d1 i d2, preluate din
tabelul distribuiei Durbin-Watson n funcie de un prag de semnificaie , arbitrar ales, ( =

0,05 sau = 0,01), de numrul de variabile exogene (k) i de valorile observate n, n 15 .


0 d d1 d1 d d2 d2 d 4-d2 4-d2 d 4-d1 4-d1 d <4
Autocorelare Indecizie Erorile sunt Indecizie Autocorelare
pozitiv independente negativ

Depistare autocorelare:

n n n

e t
2
e t 1
2
2 et et 1
d t 2 t 2
n
t 2

e
2
t
t 1

e e d 2 1 r 1 r 1 1
t t 1
d d [0,4]
d 22 t 2
n 1 2
e
t 1
2
t

1 autocorelare strict negativ 4


indecizie



r1 0 independen d 2
indecizie


1 autocorelare strict poziti v
0
Eliminare autocorelare:

Se alege o nou funcie de regresie, dac forma


funcional nu este corespunztoare

Se includ variabile, daca au fost omise unele importante

Se efectueaz transformri asupra variabilelor, dac


acestea sunt necesare (ex. Se utilizeaz diferenele de
ordin 1).

Se aplic metoda celor mai mici patrate generalizat.


I5. Normalitatea erorilor

Normalitatea erorilor presupune ca seria erorilor s urmeze o


repartiie normal.
Dac erorile urmeaz o distribuie normal

P( i t ,nk se ) 1
Verificarea acestei ipoteze se poate realiza pe baza graficului n care
reprezentm pe axa OX valorile estimate ale variabilei dependente Yi i pe
axa OY seria erorilor i .

Determinm astfel pentru ce prag de semnificaie norul de puncte se va

gsi ntre paralelele determinate de t ,nk se i t ,nk se .


Testul Jarque-Berra
urmeaz o distribuie hi ptrat cu un numr al gradelor de libertate
egal cu 2: S 2 K 32
JB n
6 24

S= coeficientul de asimetrie (skewness)


1 n

yi y
n i 1

3

S
3

K = coeficientul de aplatizare (kurtosis)


1 n

n i 1
yi y
4

K
4
Dac JB ;2 atunci ipoteza de normalitate a erorilor este respins.
2

You might also like