You are on page 1of 16

ANALIZA

VARIJANSE

U istraivakoj praksi esto se utvruje razlika izmeu


dvije, tri i vie statistikih serija
Razlike se mogu posmatrati samo u odnosu na jedan
ili vie kriterijuma (faktora)
Znai, mogue su razliite varijante ispoljavanja
razlika meu posmatranim numerikim vrijednostima
Sve statistike procedure esto se oznaavaju
zajednikom sintagmom diskriminativna analiza
U diskriminativnoj analizi izdvajaju se najmanje tri
tipine statistike procedure:
T-test (radili)
ANOVA Univarijantna analiza varijanse (slijedi) ili
analiza varijanse sa jednim faktorom i
MANOVA Multivarijantna analiza varijanse ili analiza
varijanse sa vie faktora (neemo raditi)

U istraivakoj praksi javlja se potreba za


uporeivanjem rezultata tri i vie uzoraka
U tim sluajevima neopravdano je koristiti T-test
Jer bi se T-test morao ponoviti vie puta (po
formuli
n
n!
=
k k!(n k )!

ita se n nad k
n broj aritmetikih sredina
k broj aritmetikih sredina u jednom paru
n! en faktorijel=proizvod svih prirodnih brojeva od
1 do n)
Uz istovremeno poveanje rizika od greke

ANOVA je statistiki postupak koji omoguuje da se


simultano ispituje djelovanje jednog faktora u veem
broju grupa ispitanika
Drugim rijeima, ANOVA je kriterijum koji pokazuje da
li su razlike izmeu grupa sluajno vee od razlika
unutar grupa
Znai, analiza varijanse e se koristiti kada se eli
utvrditi postoje li razlike izmeu nekoliko aritmetikih
sredina i da li su te razlike statistike znaajne ili
sluajne
Logika analize varijanse:
Dokazati da li je varijansa izmeu grupa vea od
varijanse unutar grupa
Ako je ona statistiki znaajno vea ne prihvata se
nulta hipoteza, i obrnuto
Odnos varijanse izmeu grupa i varijanse unutar
grupa testira se pomou F testa (Fier)

Ako je izraunata F vrijednost => od granine


(tabline) F vrijednosti, uz odreeni broj stepeni
slobode i zadati nivo statistike znaajnosti
zakljuuje se da je naena razlika izmeu grupa
statistiki znaajna
Broj stepeni slobode za varijansu izmeu grupa
izraunava se tako da se od broja grupa oduzme 1
Broj stepeni slobode za varijansu unutar grupa se
rauna tako da se od ukupnog broja ispitanika u
svim grupama oduzme broj grupa
ANOVA podrazumijeva da svaka populacija mora
biti normalno distibuirana i da varijanse tih
populacija moraju biti jednake

Sutina analize varijanse je u razlaganju ukupnog


varijabiliteta na sastavne komponente:
Kontrolisani ili objanjeni varijabilitet nastaje pod
uticajem kontrolisanih faktora
Rezidualni, preostali ili neobjanjeni varijabilitet
nastaje pod uticajem ostalih nekontrolisanih faktora
On obuhvata sluajna kolebanja i mogua dejstva
drugih faktora
U matematikom smislu analiza varijanse se zasniva
na uporeivanju kontrolisanog faktorskog i
rezidualnog varijabiliteta
Kontrolisani faktor se smatra znaajnim ako
varijabilitet koji on prouzrokuje prevazilazi rezidualni
varijabilitet

Za testiranje tog odnosa upotrebljava se


Snidekerov f-raspored vjerovatnoa
Zato se ona jo naziva F-test
Znai, prilikom realizovanja ove procedure
neophodno je razloiti ukupni varijabilitet i
precizno utvrditi udio faktorskog i rezidualnog
varijabiliteta
Zato se i zove analiza varijanse mada na prvi
pogled izgleda da se njome porede
aritmetike sredine
Zadatak: da li se urodi razliitih vrsta jabauka
meusobno znaajno razlikuju u 2005. godini
na nivou znaajnosti p=0.05?

RAZLAGANJE
UKUPNOG
VARIJABILITETA

U primjeru mogue je posmatrati tri tipa varijabiliteta:


Prvi je odreen odstupanjem pojedinanih (X)
rezultata od zajednike aritmetike sredine (MX):
ST=(X-MX)2=(19.4-19.75)2+(28.25-19.75)2+...+(12.619.75)2=4812.29

Drugi je odreen odstupanjem aritmetikih sredina


uzoraka (Mi) od zajednike aritmetike sredine (MX)
On pokazuje koliko eksperimentalni faktor utie na
(ne)saglasnost empirijskih podataka izmeu grupa
Oznaava se kao faktorski varijabilitet (SA):
SA=n*(Mi-MX)2; n je broj posmatranja u jednom
faktorskom modalitetu (kod nas je to 30)
SA=30((23.8350-19.75)2+(13.1917-19.75)2+(21.22-19.75)2+
+(23.7883-19.75)2+(16.7233-19.75)2)=2619.86

Trei je odreen odnosom izmeu pojedinanih


rezultata (X) i odgovarajuih aritmetikih
sredina uzoraka (Mi)
On je pod uticajem rezidualnih faktora
Pa se oznaava kao rezidualni varijabilitet (SR)
Na njega direktno utiuempirijski rezultati koji
mogu biti posljedica neobjanjenih faktora:
SR=(Xi-XM)=((19.4-23.835)2+(28-23.835)2+...+(28.2-23.835)2)
+((14.2-13.1917)2+(11.7-13.1917)2+...+ (12.6-13.1917)2)+
+((19.3-21.22)2+(17.3-21.22)2+...+(21.2-21.22)2)+
+((28.25-23.7883)2 +(28.9-23.7883)2+...+ (19.2-23.7883)2)+
+((18.2-16.7233)2+(19.2-16.7233)2+...+(16.2-16.7233)2)
=2192.431

Zbir faktorskog (SA) i rezidualnog (SR) varijabiliteta je


ukupni varijabilitet (ST): ST=SA+SR

POSTUPAK
ANALIZE
VARIJANSE

Zasniva se na analizi odnosa izmeu faktorske i


rezidualne varijanse
Kako se izraunava varijansa????????
Kolinik sume kvadratnih odstupanja pojedinanih
rezultata od odgovarajue aritmetike sredine i broja
opservacija (broja stepeni slobode)
Znai:
Faktorska varijansa utvruje se faktorski varijabilitet
(SA) i odgovarajui broj stepeni slobode (dfA)
Rezidualna varijansa utvruje se rezidualni
varijabilitet (SR) i odgovarajui broj stepeni slobode
(dfR)
Pa je:
Faktorska varijansa VA=SA/dfA
Rezidualna varijansa VR=SR/dfR

Za dati primjer imamo:


SA= 2619.86; dfA=5-1=4; SR= 2192.431; dfR=150-5=145
Pa je:
VA= 2619.86 /4=654.965
VR= 2192.431 /145=15.12
Sljedei korak je izraunavanje F-vrijednosti na
osnovu koje e biti testirana nulta hipoteza:
F=VA/VR=654.965/15.12=43.32
Sljedei korak je odreivanje tabline vrijednosti na
osnovu:
U odgovarajuoj koloni se nalazi broj stepeni slobode
faktorske varijanse (dfA odnosno df1)
U odgovarajuem redu se nalazi broj stepeni slobode
rezidualne varijanse (dfR odnosno df2)
Pa je za na primjer f=2.37

Posljednji korak:
Testiranje nulte hipoteze:
Poto je dobijena F=43.32
vea od teoretske f=2.37,
za dati p=0.05 i df1=4 i
df2=145 odbacuje se nulta
hipoteza, te se tvrdi da
postoji statistiki znaajna
razlika izmeu prinosa
pojedinih vrsta jabuka
2005. godine
koristei softver
zakljuujemo na osnovu
REALIZOVANOG NIVOA
ZNAAJNOSTI

Postavlja se pitanje:
Izmeu kojih sorti jabuka je ta razlika statistiki
znaajna??????????
Odgovor nee dati analiza varijanse
Treba se odrediti izvor varijabiliteta
U tu svrhu mogu se koristiti neke od sljedeih
metoda:
Fierov test najmanje znaajnih razlika
Fishers Least Significant Difference; tzv. LSD
test
Scheffe-ov test
Dunnett-ov test
Tukey-ev test

ANALIZA VARIJANSE U
PONOVLJENIM MJERENJIMA
NEEMO RADITI

ANALIZA VARIJANSE SA VIE


FAKTORA
MANOVA
NEEMO RADITI

You might also like