You are on page 1of 271

Mirta Beni

Nenad uvak

Uvod u vjerojatnost
i statistiku

Osijek, 2014.

M. Beni, N. uvak Uvod u vjerojatnost i statistiku.

Izdava: Sveuilite J.J. Strossmayera, Odjel za matematiku

Recenzenti:

Prof.dr.sc. Miljenko Huzak


Prof.dr.sc. Tibor Pogny

Lektor: Marina Tomi, prof.

Tehnika obrada: Prof.dr.sc. Mirta Beni, Doc.dr.sc. Nenad uvak

CIP zapis dostupan u raunalnom katalogu Gradske i sveuiline knjinice Osijek


pod brojem 131009075.

ISBN 978-953-6931-63-7
Udbenik se objavljuje uz suglasnost Senata Sveuilita J. J. Strossmayera u Osijeku
pod brojem 20/13.
Udbenik se tiska uz financijsku potporu Ministarstva znanosti, obrazovanja i sporta.

c Mirta Beni i Nenad uvak, 2014.


Tisak: Grafika d.o.o., Osijek

Predgovor
Ova knjiga nastala je za potrebe kolegija koji se bave uvoenjem osnovnih pojmova
i koncepata vjerojatnosti i statistike. Za razumijevanje sadraja potrebno je znanje
iz standardnih matematikih kolegija prve studijske godine tehnikih fakulteta u
Republici Hrvatskoj, tj. osnove diferencijalnog i integralnog rauna realnih funkcija
vie varijabli te geometrije ravnine i prostora.
Knjiga je podijeljena u pet poglavlja. Prva tri poglavlja posveena su teoriji vjerojatnosti s obzirom da je ona temelj za razumijevanje modela potrebnih za statistike
analize. etvrto poglavlje odnosi se na statistiku i napisano je s ciljem razumijevanja koncepata koji se koriste u statistikim analizama. Pretpostavka je autora da e
ovladavanje sadrajima iz tog poglavlja dati studentima osnovna znanja potrebna za
razumijevanje i primjenu statistikih modela i statistikih procedura prezentiranih
u literaturi koja se bavi specijalno statistikom. U petom poglavlju navedeni su pojmovi iz algebre skupova te osnovni rezultati iz kombinatorike i teorije ponovljenih
redova koji se koriste u prethodnim poglavljima.
Zahvaljujemo svima koji su pomogli da se ova knjiga tiska i bude to bolja. To se
posebno odnosi na recenzente koji su paljivo proitali rukopis te svojim primjedbama i sugestijama utjecali na poboljanje mnogih dijelova teksta, kao i na kolege
Andreu Krajina, Slobodana Jelia, Mariju Miloloa-Pandur i Ivonu Pulji jer su
svojim sugestijama doprinijeli kvaliteti primjera i zadataka.
Autori e biti zahvalni svim itateljima na primjedbama vezanima uz eventualne
pogreke, nepreciznosti ili nedostatke.

U Osijeku, oujak 2014.

Mirta Beni i Nenad uvak

Sadraj
1 Pojam i osnovna svojstva vjerojatnosti
1.1 Prostor elementarnih dogaaja . . . . .
1.2 Klasian pristup . . . . . . . . . . . . .
1.3 Statistiki pristup . . . . . . . . . . . . .
1.4 Definicija vjerojatnosti . . . . . . . . . .
1.5 Osnovna svojstva vjerojatnosti . . . . .
1.6 Vjerojatnost na diskretnom . . . . . .
1.7 Primjeri vjerojatnosti na R . . . . . . .
1.8 Primjeri vjerojatnosti na R2 i R3 . . . .
1.9 Uvjetna vjerojatnost. Nezavisnost . . .
1.10 Zadaci . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

1
2
4
6
8
12
21
25
29
31
39

2 Sluajna varijabla
2.1 Diskretna sluajna varijabla . . . . . . . . . . . . . . . . .
2.2 Neprekidna sluajna varijabla . . . . . . . . . . . . . . . .
2.3 Funkcija distribucije sluajne varijable . . . . . . . . . . .
2.3.1 Funkcija distribucije diskretne sluajne varijable .
2.3.2 Funkcija distribucije neprekidne sluajne varijable
2.4 Primjeri parametarski zadanih diskretnih distribucija . . .
2.4.1 Diskretna uniformna distribucija . . . . . . . . . .
2.4.2 Bernoullijeva distribucija . . . . . . . . . . . . . .
2.4.3 Binomna distribucija . . . . . . . . . . . . . . . . .
2.4.4 Poissonova distribucija . . . . . . . . . . . . . . . .
2.4.5 Geometrijska distribucija . . . . . . . . . . . . . .
2.4.6 Hipergeometrijska distribucija . . . . . . . . . . . .
2.5 Primjeri parametarski zadanih neprekidnih distribucija . .
2.5.1 Uniformna distribucija na intervalu ha, bi . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.

55
55
60
63
66
67
69
69
70
71
73
76
77
78
78

iii

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

iv

Sadraj

2.6

2.7

2.8
2.9

2.5.2 Eksponencijalna distribucija . . . . . . . . . . . . . . . . . . .


2.5.3 Dvostrana eksponencijalna distribucija . . . . . . . . . . . . .
2.5.4 Normalna distribucija . . . . . . . . . . . . . . . . . . . . . .
Numerike karakteristike sluajne varijable . . . . . . . . . . . . . .
2.6.1 Oekivanje diskretne sluajne varijable . . . . . . . . . . . . .
2.6.2 Varijanca i ostali momenti. Vane nejednakosti . . . . . . . .
2.6.3 Oekivanje i varijanca nekih parametarskih diskretnih distribucija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6.4 Oekivanje i momenti neprekidne sluajne varijable . . . . . .
2.6.5 Oekivanje i varijanca nekih parametarskih neprekidnih distribucija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Transformacija sluajne varijable . . . . . . . . . . . . . . . . . . . .
2.7.1 Postupak standardizacije . . . . . . . . . . . . . . . . . . . .
2.7.2 Bijektivna transformacija sluajne varijable . . . . . . . . . .
2.7.3 Primjeri transformacija koje nisu bijektivne . . . . . . . . . .
Generiranje sluajnih varijabli . . . . . . . . . . . . . . . . . . . . . .
Zadaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

3 Sluajni vektor
3.1 Diskretan dvodimenzionalan sluajni vektor . . .
3.1.1 Uvjetne distribucije . . . . . . . . . . . .
3.1.2 Nezavisnost . . . . . . . . . . . . . . . . .
3.2 Neprekidan dvodimenzionalan sluajni vektor . .
3.2.1 Uvjetne gustoe. Nezavisnost . . . . . . .
3.3 Kovarijanca i koeficijent korelacije . . . . . . . .
3.4 Openito o nezavisnosti sluajnih varijabli . . . .
3.5 Neki rezultati o nizovima sluajnih varijabli . . .
3.5.1 Slabi zakon velikih brojeva i Bernoullijeva
3.5.2 Centralni granini teorem . . . . . . . . .
3.6 Zadaci . . . . . . . . . . . . . . . . . . . . . . . .
4 Statistika
4.1 Deskriptivna statistika . . . . . . . . . . . . . .
4.1.1 Metode opisivanja kvalitativnih varijabli
4.1.2 Metode opisivanja numerikih varijabli .
4.1.3 Metode opisivanja ordinalnih varijabli .
4.2 Statistiki model . . . . . . . . . . . . . . . . .
4.2.1 Problem proporcije . . . . . . . . . . . .

.
.
.
.
.
.

. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
shema
. . . .
. . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

80
81
82
85
85
89
93
99
100
103
103
105
108
109
110

.
.
.
.
.
.
.
.
.
.
.

129
132
142
145
148
151
154
161
163
164
169
172

.
.
.
.
.
.

181
182
186
189
198
200
201

Sadraj
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

204
206
208
210
211
213
214
219
220
221
224
226
227
231
235
237
241

5 Dodatak
5.1 Osnove algebre skupova . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Osnovni kombinatorni rezultati . . . . . . . . . . . . . . . . . . . . .
5.3 Ponovljeni red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

249
249
250
252

4.3

4.4

4.5

4.6

4.2.2 Problem oekivanja i varijance normalne distribucije . . . .


4.2.3 Jednostavna linearna regresija . . . . . . . . . . . . . . . .
Procjena parametra . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Procjena proporcije . . . . . . . . . . . . . . . . . . . . . .
4.3.2 Procjena oekivanja . . . . . . . . . . . . . . . . . . . . . .
4.3.3 Procjena varijance . . . . . . . . . . . . . . . . . . . . . . .
4.3.4 Procjena funkcije distribucije . . . . . . . . . . . . . . . . .
4.3.5 Procjena parametara u jednostavnoj linearnoj regresiji . . .
Procjena parametra pouzdanim intervalom . . . . . . . . . . . . .
4.4.1 Procjena oekivanja pouzdanim intervalom za velike uzorke
4.4.2 Procjena proporcije pouzdanim intervalom za velike uzorke
Testiranje statistikih hipoteza . . . . . . . . . . . . . . . . . . . .
4.5.1 Pogreke statistikog testa . . . . . . . . . . . . . . . . . . .
4.5.2 Testiranje hipoteze o oekivanju za velike uzorke . . . . . .
4.5.3 Testiranje hipoteze o proporciji za velike uzorke . . . . . . .
4.5.4 Testiranje hipoteze o jednakosti oekivanja . . . . . . . . .
Zadaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Literatura

258

Indeks

260

Poglavlje 1

Pojam i osnovna svojstva


vjerojatnosti
Pojam vjerojatnosti nastao je u pokuaju brojanog izraavanja stupnja vjerovanja da e se dogoditi neki zamiljeni dogaaj. Na primjer, esto moemo uti ili
proitati: "vjerojatnost da e sutra padati kia je 75%", "vjerojatnost da dobijem
prolaznu ocjenu na ispitu mi je oko 50%", "100% sam siguran u pobjedu Blanke
Vlai na ovom natjecanju", itd. Pitanje je kako nastaju brojevi kojima je izraen
stupanj vjerovanja da se dogodi neki dogaaj i kako ih moemo iskoristiti. Teorija
vjerojatnosti dio je matematike koji se bavi tom problematikom.
Nastanak se teorije vjerojatnosti tradicionalno stavlja u 17. stoljee iako postoje dokazi da su se ve indijski matematiari (3. st. pr. Kr.) bavili pitanjima koja pripadaju dananjoj teoriji vjerojatnosti te da je u 14. stoljeu postojala praksa pomorskog osiguranja koja je omoguila srednjovjekovnim trgovcima
ocjenjivanje razliitih faktora rizika koji se pojavljuju prilikom prekomorskog trgovanja. Prvi matematiki rezultati koji se mogu jasno prepoznati kao temelj teorije vjerojatnosti vezani su uz igre na sreu i uz izradu tablica smrtnosti. Vie
detalja o nastanku teorije vjerojatnosti pogledajte npr. na internetskoj adresi
http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm.
Povijesno gledano, koncept vjerojatnosti dogaaja temelji se na ideji odnosa dijela
i cjeline. Pri tome se odnos dijela i cjeline koristi na dva naina:
klasian pristup i
statistiki pristup.
1

Prostor elementarnih dogaaja

U sljedeim poglavljima opisat emo detaljno oba povijesna koncepta vjerojatnosti


kao i aksiomatsku definiciju vjerojatnosti kojom emo se koristiti u ovom kolegiju,
ali prije toga trebamo upoznati temeljni objekt koji se koristi prilikom matematikog modeliranja vjerojatnosti. Zvat emo ga skup ili prostor elementarnih
dogaaja.

1.1

Prostor elementarnih dogaaja

Bacanje igrae kocke jedan je od klasinih i jednostavnih pokusa kojim emo se


koristiti u ovom kolegiju za ilustraciju mnogih novih pojmova. Prilikom bacanja
igrae kocke kao rezultat jednog bacanja pojavljuje se tono jedan broj iz skupa
{1, 2, 3, 4, 5, 6}. Ako je kockica pravilno izraena, opravdano je pretpostaviti jednaku mogunost pojavljivanja bilo kojeg od navedenih est brojeva. Koristei se
idejom vjerojatnosti dogaaja kao odnosa dijela i cjeline, moemo zakljuiti da je
vjerojatnost pojavljivanja parnog broja pri bacanju igrae kocke ista kao i vjerojatnost pojavljivanja neparnog broja s obzirom da je parnih brojeva isto koliko i
neparnih u cjelini koju ini navedeni skup. Takoer, vjerojatnost pojavljivanja broja
dva mora biti ista kao i vjerojatnost pojavljivanja broja pet jer oni ine po brojnosti
jednake dijelove cjeline.
Na osnovu principa odnosa dijela i cjeline uoavamo da je prvi korak prema definiranju vjerojatnosti dogaaja spoznavanje cjeline. Naime, da bismo imali mjeru za
vjerojatnost da se dogodi ono to nas konkretno zanima, moramo prvo znati to je
to "sve" to se moe dogoditi za na pokus ili promatranje, tj. to ini "cjelinu".
Zato emo, da bismo poeli graditi matematiki model, uz jedan pokus (odnosno
promatranje) vezati skup koji kao elemente sadri sve to se moe realizirati kad
izvedemo pokus (promatranje) i zvat emo ga skup svih moguih ishoda ili
prostor elementarnih dogaaja. Najee takav skup oznaavamo sa . Jedina pretpostavka na prostor elementarnih dogaaja jest da je neprazan i da zaista
sadri sve to se moe realizirati u pokusu (odnosno promatranju).
Ako skup svih moguih ishoda sadri samo jedan element, onda pokus ima samo
jednu moguu realizaciju pa tono znamo to e se dogoditi kada ga izvedemo, zbog
ega takav pokus zovemo deterministiki pokus.
Primjer 1.1 (Deterministiki pokus).
a) Rezultat zagrijavanja vode pod normalnim atmosferskim tlakom na temperaturu od 100 C
ima samo jedan ishod: voda isparava, tj. voda iz tekueg prelazi u plinovito agregatno
stanje.

Pojam i osnovna svojstva vjerojatnosti

b) Mijeanje vode i jestivog ulja pri normalnim atmosferskim uvjetima ima jedinstveni ishod
- stvara se emulzija ulja i vode pri emu ulje pliva na vodi.
c) Pritiskanje papuice "gasa" pri vonji tehniki ispravnog automobila ima jedinstveni ishod
- brzina automobila poveava se. Analogno tomu, pritiskanje konice u istim uvjetima ima
za ishod smanjenje brzine kretanja automobila.

Prostore elementarnih dogaaja koji imaju vie elemenata (barem dva, a moe
i beskonano mnogo!) koristimo ako ne moemo sa sigurnou znati realizaciju
pokusa (promatranja). Za takav pokus kaemo da ima sluajne ishode, tj. da je
pokus sluajan.
Primjer 1.2 (Sluajan pokus).
a) Bacanje igrae kocke - ako nas zanima ishod jednog bacanja igrae kocke, "sve", tj.
prostor elementarnih dogaaja jest skup
{1, 2, 3, 4, 5, 6}.
b) Sluajan izbor znamenke - ako nas zanima ishod sluajnog izbora jedne znamenke u
dekadskom sustavnu, prostor elementarnih dogaaja jest skup
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
c) Loto 6 od 45 - ako nas zanima rezultat izvlaenja u igri "Loto 6 od 45", prostor elementarnih dogaaja jest skup
{{i1 , . . . , i6 } : i1 , . . . , i6 {1, . . . , 45}, 1 i1 < . . . < i6 45} .
d) Ako prognoziramo sutranju temperaturu zraka u Osijeku (u hladu), prostor elementarnih
dogaaja moemo postaviti na razliite naine. Jedna je mogunost, npr. = [50, 50],
ili = [100, 100]. Zapravo, moemo pretpostaviti i da je = [273.15, i, gdje je
273.15 C temperatura poznata pod nazivom apsolutna nula. Vano je da bude neprazan
skup i da uistinu sadri sve mogue realizacije prognoziranja. Naravno da je ponekad
praktino ugraditi ve u to vie informacija o pokusu koji modeliramo, tj. suziti , ali
to nije nuno za modeliranje.

Jednom kad smo odredili prostor elementarnih dogaaja sluajnog pokusa, tj. ,
treba izraziti stupanj vjerovanja da se neki dogaaj dogodi. Meutim, kako opisujemo dogaaj kao matematiki objekt? Do sada znamo da prostor elementarnih
dogaaja sadri sve mogue ishode pokusa, no sadri li i sve dogaaje koji su nama
zanimljivi? Na primjer, u pokusu bacanja igrae kocke zanima nas hoe li se okrenuti paran broj. Oigledno je da e se dogoditi paran broj ako se realizira bilo
koji od ishoda 2, 4 ili 6. Dakle, taj je dogaaj prirodno modelirati kao podskup
od i to kao skup {2, 4, 6}. Oigledno je da emo dogaaje vezane uz neki sluajan pokus modelirati kao podskupove od . Openito u teoriji vjerojatnosti neki

Klasian pristup

podskupovi skupa nisu prikladni da ih zovemo dogaajima, ali zasad neemo detaljno opisivati familiju dogaaja o kojoj e vie rijei biti u poglavlju 1.4. Bit e
nam dovoljno znati da je dogaaj vezan uz dani sluajan pokus uvijek podskup
prostora elementarnih dogaaja tog pokusa.
U nastavku navodimo povijesne pristupe za modeliranje vjerojatnosti dogaaja (klasian i statistiki), kao i definiciju vjerojatnosti koja se danas standardno koristi u
matematikoj teoriji.

1.2

Klasian pristup

U praksi esto susreemo primjere pokusa u kojima je prostor elementarnih


dogaaja konaan i svaki je pojedini ishod jednako mogu. Veliki broj klasinih
igara na sreu odgovara tim pretpostavkama. Na primjer:
za bacanje pravilno izraenog novia (idealan sluaj, tj. nema varanja!) prostor
elementarnih dogaaja jest = {pismo, glava} i svaki je od tih ishoda jednako
mogu,
za bacanje pravilno izraene igrae kocke (idealan sluaj, tj. nema varanja!) prostor elementarnih dogaaja jest = {1, 2, 3, 4, 5, 6} i svaki je od tih ishoda
jednako mogu,
za "Loto 6 od 45" prostor elementarnih dogaaja jest
= {{i1 , . . . , i6 } : i1 , . . . , i6 {1, . . . , 45}, 1 i1 < . . . < i6 45}
i realizacija je svakog estorlanog skupa iz jednako mogua,
za rulet je prostor elementarnih dogaaja = {0, 1, 2, . . . , 36} i svaki je od tih
ishoda jednako mogu.
Kod takvih je pokusa mogue prebrojati sve ishode koji su povoljni za dogaaj
i sve ishode koji nisu povoljni za dogaaj. Omjer se tih dvaju brojeva esto u
praksi koristi za izraavanje stupnja vjerovanja u realizaciju dogaaja. Evo nekoliko
primjera:
Primjer 1.3. U sluajnom pokusu bacanja igrae kocke, na temelju pretpostavke o istoj mogunosti da se okrene bilo koji broj, kae se da je ansa 3 : 3 da se okrene paran broj. Dakle, stupanj
vjerovanja u pojavu dogaaja izraen je stavljanjem u omjer broja ishoda koji su povoljni i broja
ishoda koji su nepovoljni. Meutim, isti se omjer moe iskazati i na mnogo drugih naina, npr.
1 : 1.

Pojam i osnovna svojstva vjerojatnosti

Primjer 1.4. U skupini ljudi iz koje se sasvim sluajno bira jedna osoba nalazi se 30 mukaraca
i 60 ena. U tom je pokusu ansa da izaberemo enu 60 : 30. Taj se omjer takoder moe prikazati
na vie naina, tj. kao 6 : 3 ili 2 : 1.

Omjer broja povoljnih i nepovoljnih dogaaja ilustriran u navedenim primjerima ne


stavlja u odnos dio i cjelinu nego dva dijela iste cjeline - dio koji znai realizaciju
dogaaja koji nas zanima i dio koji znai da se taj dogaaj nije realizirao. Klasian
pristup modeliranju vjerojatnosti ne rauna vjerojatnost na taj nain nego odreuje
vjerojatnost kao mjeru koja dio suprotstavlja cjelini, tj. dijeli broj ishoda povoljnih
za dogaaj brojem svih moguih ishoda.

Klasian nain raunanja vjerojatnosti


Pretpostavke na pokus
Dogaaj
Vjerojatnost dogaaja A

konaan prostor elementarnih dogaaja,


svi su ishodi pokusa jednako mogui
A
kvocijent broja elemenata skupa
A i broja elemenata skupa , tj.
k(A)
P (A) =
k()

Ovdje je P (A) oznaka za vjerojatnost dogaaja A, dok je k(A) oznaka za broj


elemenata skupa A.
Problem se odreivanja vjerojatnosti po klasinom pristupu svodi na problem prebrojavanja elemenata skupova. Dakle, da bismo mogli raunati vjerojatnost na
spomenuti nain, morat emo neto znati o rjeavanju kombinatornih problema.

Primjer 1.5. Skup svih moguih ishoda bacanja igrae kocke jest skup = {1, 2, 3, 4, 5, 6}. Budui da je konaan skup i kocka je za igru (pa je pretpostavka da je pravilno izraena, tj.
mogunost realizacije bilo kojeg od brojeva jedan do est jest jednaka), ovdje moemo primijeniti
klasian pristup odreivanja vjerojatnosti. Na primjer, vjerojatnost dogaaja "na gornjoj strani
kocke realizirao se paran broj", koji predstavljamo skupom A = {2, 4, 6} svih parnih elemenata
skupa , jednaka je vjerojatnosti dogaaja "na gornjoj strani kocke realizirao se neparan broj",
koji predstavljamo skupom B = {1, 3, 5} svih neparnih elemenata skupa . Osim toga, vjerojatnosti dogaaja A i B jednake su vjerojatnosti bilo kojeg dogaaja koji moemo predstaviti nekim
trolanim podskupom skupa .

Statistiki pristup

Primjer 1.6. Pretpostavimo da se u eiru nalazi sedam kuglica jednakih karakteristika (od istog
su materijala, jednake mase i promjera). Poznato je da su kuglice numerirane brojevima od jedan
do sedam te da su dvije kuglice crvene, a pet kuglica zelene boje. Promotrimo pokus nasuminog
izvlaenja jedne kuglice iz eira. Na temelju naina provoenja postavljenog pokusa i sadraja
eira moemo promatrati sljedee sluajeve.
Zanimaju nas ishodi sluajnog pokusa temeljeni na broju kojim je kuglica numerirana - u tom
je sluaju prostor elementarnih dogaaja skup
= {1, 2, 3, 4, 5, 6, 7}.
Primjenom klasinog pristupa raunanja vjerojatnosti svi dogaaji koji se mogu predstaviti jednakobrojnim podskupovima skupa jednako su mogui, no kako u eiru ima vie
kuglica numeriranih neparnim brojevima, vjerojatnost dogaaja "izvuena je kuglica numerirana neparnim brojem" koji predstavljamo skupom A = {1, 3, 5, 7} je vea od vjerojatnosti dogaaja "izvuena kuglica numerirana je parnim brojem" koji predstavljamo skupom
B = {2, 4, 6}, tj.
4
3
P (A) = , P (B) = , P (A) > P (B).
7
7
Zanimaju nas ishodi sluajnog pokusa temeljeni na boji kuglice - u tom je sluaju prostor elementarnih dogaaja skup
= {C, Z},
pri emu C oznaava dogaaj "izvuena je kuglica crvene boje", a Z dogaaj "izvuena
je kuglica zelene boje". Budui u eiru ima dvije crvene i pet zelenih kuglica, vidimo da
elementarni dogaaji C i Z nisu jednako mogui, tj.
P (C) =

2
,
7

P (Z) =

5
,
7

P (C) < P (Z).

Klasian koncept pripisivanja vjerojatnosti pojedinim dogaajima odigrao je veliku


ulogu u razvoju teorije vjerojatnosti, ali nije uvijek primjenjiv. ak i ako je prostor
elementarnih dogaaja konaan, ne moraju biti svi ishodi jednako mogui. Zamislimo samo da igramo 1000 igara s kockom te da se u 90% bacanja okrenuo broj 6.
Tko je od nas sklon vjerovati da su u tom pokusu svi ishodi jednako mogui?
Primjer 1.7. Sluajni pokusi u kojima nije ispunjen uvjet jednake vjerojatnosti svih elementarnih
dogaaja su npr.
bacanje nepravilno izraenog (tzv. nestandardnog) novia (tj. novia pri ijem je bacanju
favorizirana realizacija ili pisma ili glave),
bacanje nepravilno izraene (tzv. nestandardne) igrae kocke (tj. kocke pri ijem je bacanju
favorizirana realizacija jednog ili vie brojeva iz skupa {1, 2, 3, 4, 5, 6}).

1.3

Statistiki pristup

Ideja odreivanja stupnja vjerovanja u pojavu dogaaja kao dijela cjeline ili kao
omjer dijela povoljnog za dogaaj i dijela nepovoljnog za dogaaj moe se iskoristiti
i u drugom kontekstu. Primjer za to jest prognoziranje pobjednika nekog sportskog

Pojam i osnovna svojstva vjerojatnosti

susreta na temelju rezultata prethodnih natjecanja istih suparnika. Npr., ako je


uzajamnim natjecanjima u tenisu igra A pobijedio igraa B u 9 od 11 susreta, njegova se ansa za pobjedu u sljedeem susretu najee prognozira kao 9 : 2. Princip
primijenjen u tom primjeru temelji se na mogunosti nezavisnog ponavljanja uvijek
istog pokusa, a stupanj vjerovanja u pojavu dogaaja izraava se na temelju broja
pojavljivanja i nepojavljivanja dogaaja prilikom ponavljanja. Izraavanje stupnja
vjerovanja u pojavu dogaaja moglo bi se numeriki izraziti takoer stavljanjem u
9
omjer dijela i cjeline, tj. kao 11
.
Za raunanje vjerojatnosti koja slijedi tu logiku iskoristit emo pojmove frekvencije
i relativne frekvencije dogaaja.
Definicija 1.1. Pokus je ponovljen n puta. Ako se pritom dogaaj A dogodio nA
puta, broj nA zovemo frekvencija dogaaja A. Broj
fA (n) =

nA
n

zovemo relativna frekvencija dogaaja A.


Iz definicije frekvencije slijedi da je frekvencija nA cijeli broj za koji vrijedi
0 nA n,
a relativna frekvencija fA (n) racionalan broj takav da je
0

nA
1.
n

Primjer 1.8. Promotrimo sluajan pokus bacanja pravilno izraenog novia sa skupom elementarnih dogaaja = {p, g}, gdje je p oznaka za dogaaj "palo je pismo", a g oznaka za dogaaj
"pala je glava". U pokuaju definiranja vjerojatnosti da e pri jednom bacanju pasti pismo moemo
koristiti klasian pristup. Na taj nain odreujemo vjerojatnost da padne pismo kao
P ({p}) =

1
.
2

Meutim, kako znamo da je novi pravilno izraen? Iskustveno znamo da to moemo provjeriti
na sljedei nain: ako isti pokus ponovimo n puta, gdje je n N velik broj, kod pravilno se
izraenog novia pismo i glava realiziraju priblino jednak broj puta. U tom e sluaju biti
np n/2 i ng n/2. Prema tome, relativna frekvencija realizacije pisma iznosit e
np
1

n
2
(slika 1.1). U takvom je sluaju razumno uzeti 1/2 kao vjerojatnost pojavljivanja pisma pri jednom
bacanju novia, tj. prihvatiti pretpostavku da je novi pravilno izraen.

Definicija vjerojatnosti

relativne frekvencije

Bacanje novia
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1

11

13

15

17

19

21

23

25

27

29

31

33

35

37

39

redni broj bacanja novia

Slika 1.1: Relativna frekvencija pojave pisma u ovisnosti o broju bacanja n za jedan niz
bacanja.

Iskustvo nas ui da se kod mnogo nezavisnih ponavljanja istog pokusa relativna


frekvencija nekog dogaaja stabilizira u okolini nekog broja. To svojstvo zovemo
statistika stabilnost relativnih frekvencija.
Statistiki pristup odreivanja vjerojatnosti baziran je upravo na tom pricipu. Naime, ako sluajan pokus ima svojstvo statistike stabilnosti relativnih frekvencija,
tada za vjerojatnost proizvoljnog dogaaja A vezanog uz taj pokus uzimamo realan
broj P (A) = pA oko kojega se grupiraju relativne frekvencije fA (n) tog dogaaja.

1.4

Definicija vjerojatnosti

Oba navedena povijesna pristupa u odreivanju vjerojatnosti imaju veliku ulogu u


primjeni rezultata teorije vjerojatnosti u praksi, ali niti jedan od njih ne daje openitu definiciju vjerojatnosti. Iz dosadanjih razmatranja jasno je da vjerojatnost
treba definirati za podskupove prostora elementarnih dogaaja. Zapravo, vjerojatnost emo definirati kao jednu mjeru skupova (podskupova od ) slino kao to
je duljina jedna mjera skupova na pravcu ili povrina jedna mjera skupova u ravnini. Iz teorijskih razloga (zainteresirani itatelj dodatne informacije moe pronai
u svakoj knjizi iz teorije mjere, npr. [3], [14]) neemo vjerojatnost definirati uvijek
za svaki podskup prostora elementarnih dogaaja, nego emo definirati dovoljno
bogatu familiju podskupova od koja e initi temelj za definiciju vjerojatnosti.
Takvu familiju podskupova od zvat emo familijom dogaaja, a zahtjev koji
mora ispunjavati dan je definicijom 1.2.

Pojam i osnovna svojstva vjerojatnosti

Definicija 1.2. Neka je dan neprazan skup . Familija F podskupova skupa jest
-algebra skupova na ako vrijedi:
i) F,
ii) ako je A F, onda je i Ac F,
iii) ako je dana prebrojiva familija skupova (An , n N) F, onda F sadri i
njihovu uniju, tj.

[
An F.
n=1

Ako je prostor elementarnih dogaaja nekog pokusa, bilo koja -algebra na njemu
moe igrati ulogu familije dogaaja tog pokusa.
Svojstvo ii) naziva se zatvorenost -algebre na komplementiranje (tj. ako sadri
neki skup, sadri i njegov komplement), a svojstvo iii) zatvorenost -algebre na
prebrojivu uniju (tj. ako imamo prebrojivo mnogo skupova iz dane -algebre, onda
e i njihova unija biti element te -algebre).
Iako je -algebra definirana samo s tri zahtjeva, ona moe biti vrlo bogata. Naime, sadri sve skupove koji e nam biti zanimljivi u primjenama, tj. skupove koji
nastaju primjenom konano ili prebrojivo mnogo standardnih skupovnih operacija
nad skupovima koji su njezini elementi. Prije svega, uoimo da je cijeli sigurno
element -algebre, s obzirom da je komplement praznoga skupa. Nadalje, -algebra
sigurno sadri i sve konane unije svojih elemenata jer se konana unija uvijek moe
nadopuniti do prebrojive koritenjem prebrojivo mnogo praznih skupova. Primjerom 1.9 ilustriran je nain na koji moemo provjeriti zatvorenost -algebre i za neke
druge sluajeve.
Primjer 1.9.
Ako su A, B F , prema svojstvu zatvorenosti -algebre na konanu uniju jest skup A B
takoer iz F . Prema De Morganovom zakonu za komplementiranje konane unije skupova
i svojstvu ii) iz definicije -algebre vrijedi
Ac B c = (A B)c F .
Dakle, -algebra sadri i presjek komplemenata svojih dvaju elemenata. S obzirom da za
svaki skup vrijedi (Ac )c = A, slijedi da -algebra sadri i presjeke svakih svojih dvaju
elemenata.

10

Definicija vjerojatnosti
Pokaimo da je -algebra zatvorena i na prebrojive presjeke svojih elemenata. Naime, ako
je (An , n N) F prebrojiva familija skupova, tada je prema svojstvu ii) iz definicije
-algebre i (Acn , n N) takoer prebrojiva familija dogaaja iz F . Nadalje, prema svojstvu
iii) iz definicije -algebre slijedi da je

Acn F .

n=1

Naposljetku, prema De Morganovom zakonu za komplementiranje prebrojive unije skupova


i svojstvu ii) iz definicije -algebre slijedi da je
!c

[
\
Acn
=
An F .
n=1

n=1

Time je dokazana zatvorenost -algebre na prebrojivo mnogo presjeka svojih elemenata.


Ako su A, B F , prema svojstvu ii) iz definicije -algebre slijedi da su Ac i B c elementi
-algebre F . Zbog zatvorenosti -algebre na konane presjeke slijedi da je
A \ B = A Bc F .
Dakle, -algebra sadri i razliku svojih dvaju elemenata.

S obzirom na vezu koja postoji izmeu povezivanja reenica jezika i skupovnih


operacija, -algebra zadovoljava potrebe koje nastaju u primjeni. Naime, im sadri
neke skupove, sadri i one skupove koji nastaju primjenom uobiajenih reenica za
njihovo kombiniranje. U sljedeem je primjeru ilustrirana ta tvrdnja na najee
koritenim reenicama.
Primjer 1.10. Od svih nastavnika zaposlenih u nekoj srednjoj koli biramo jednu osobu te promatramo sljedee dogaaje:
A = izabrana osoba predaje matematiku,
B = izabrana je osoba enskog spola.
Standardne skupovne operacije ilustrirane na primjeru tih dvaju dogaaja opisujemo sljedeim
reenicama:
A B = izabrana osoba predaje matematiku ili je enskog spola,
A B = izbrana osoba predaje matematiku i enskog je spola
(izabrana je osoba profesorica matematike),
A \ B = izabrana osoba predaje matematiku i nije enskog spola
(izabrana je osoba profesor matematike),
B \ A = izabrana je osoba enskog spola i ne predaje matematiku
(izabrana profesorica ne predaje matematiku),
Ac = izabrana osoba ne predaje matematiku,
B c = izabrana osoba nije enskog spola, tj. izabrana je osoba mukog spola.

11

Pojam i osnovna svojstva vjerojatnosti

Najmanja je -algebra na nekom skupu tzv. trivijalna -algebra F0 = {, },


dok je najvea ona koja sadri sve podskupove od , tj. partitivni skup skupa
, kojega oznaavamo s P().
Nakon to smo definirali prostor elementarnih dogaaja sluajnog pokusa, odabiremo neku -algebru na njemu. Zvat emo je familija dogaaja toga pokusa,
a pojedine elemente te familije dogaaja zovemo jednostavno dogaajima. Na
odabranoj familiji dogaaja definirat emo vjerojatnost aksiomatskom definicijom
1.3.
Definicija 1.3. Neka je neprazan prostor elementarnih dogaaja i F -algebra
skupova na njemu. Funkciju
P: F R
zovemo vjerojatnost na ako zadovoljava sljedee zahtjeve:
A1. nenegativnost vjerojatnosti: P (A) 0, za sve A F,
A2. normiranost vjerojatnosti: P () = 1,
A3. -aditivnost vjerojatnosti: ako je dana prebrojiva familija meusobno disjunktnih skupova (Ai , i I) F, I N, tj. Ai Aj = im je i 6= j, tada
vrijedi
!
[
X
P
Ai =
P (Ai ).
iI

iI

Zahtjeve A1. - A3. nazivamo aksiomima vjerojatnosti.

Na temelju rezultata poglavlja 1.2 vidimo da vjerojatnost koja je definirana na konanom prostoru elementarnih dogaaja koritenjem klasinog pristupa udovoljava
svim zahtjevima iz definicije 1.31 .
Aksiomatski pristup daje puno vee mogunosti u nainu zadavanja vjerojatnosti.
Vidimo da je mogue zadati vjerojatnost ne samo na konanom skupu nego i na bilo
kojem nepraznom skupu s pripadnom -algebrom, dok na konanom skupu moemo
jasno zadati vjerojatnost i u sluaju da nemamo jednako mogue ishode. Na primjer,
ukoliko smo dugo biljeili rezultate bacanja jedne igrae kocke te utvrdili da se niti
jednom nije okrenuo broj 3, dok se broj 2 pojavljuje priblino dvostruko ee
nego brojevi 1, 4, 5 i 6, koristei statistiki pristup logino bi bilo pretpostaviti da
1 Prvu

aksiomatsku definiciju vjerojatnosti dao je Kolmogorov 1933. godine.

12

Osnovna svojstva vjerojatnosti

ishodi nisu jednako mogui te definirati vjerojatnost kao funkciju P koja zadovoljava
zahtjeve iz definicije vjerojatnosti, a ujedno ima i sljedea svojstva: P ({3}) = 0,
P ({2}) = 2P ({1}), P ({1}) = P ({4}) = P ({5}) = P ({6}).
Definicija 1.4. Neka je neprazan skup, F -algebra dogaaja na njemu, a P
vjerojatnost na . Ureenu trojku (, F, P ) zovemo vjerojatnosni prostor.

1.5

Osnovna svojstva vjerojatnosti

Na temelju zahtjeva navedenih u aksiomatskoj definiciji vjerojatnosti mogu se dokazati mnoga druga svojstva koja e automatski biti zadovoljena im znamo da
je zadanom funkcijom definirana vjerojatnost. U ovom poglavlju navedena su i
dokazana neka od njih koja se najee koriste u praksi.
S1. Vjerojatnost suprotnog dogaaja
Neka je (, F, P ) dani vjerojatnosni prostor i A F dogaaj. Suprotni dogaaj
dogaaju A je njegov komplement, tj. dogaaj Ac . Vrijedi:
P (Ac ) = 1 P (A).
Dokaz. Skup moemo prikazati kao uniju disjunktnih skupova A i Ac (slika 1.2).

=AA

Slika 1.2: Skup kao unija disjunktnih skupova A i Ac .


Primjenom aksioma A3. i A2. iz definicije vjerojatnosti slijedi:
1 = P () = P (A Ac ) = P (A) + P (Ac ) P (Ac ) = 1 P (A).

Primjer 1.11. U eiru se nalazi dvadeset crvenih i dvije zelene kuglice. Pretpostavimo da svaka
kuglica, bez obzira na boju, moe biti izvuena s jednakom vjerojatnou, tj. ako oznaimo kuglice
k1 , . . . k22 tada pretpostavljamo da je
P ({ki }) =

1
,
22

i {1, . . . , 22}.

Pojam i osnovna svojstva vjerojatnosti

13

Pretpostavimo da n puta, n N, izvlaimo tono jednu kuglicu iz eira, ali tako da se nakon
svakog izvlaenja kuglica vraa u eir i pomijea s ostalim kuglicama. Dakle, jedan ishod sluajnog
pokusa koji se sastoji od n izvlaenja jedne kuglice shvaamo kao jednu varijaciju s ponavljanjem
n-tog razreda skupa od 22 razliita elementa, a pripadni je prostor elementarnih dogaaja skup
svih takvih varijacija s ponavljanjem. Znamo da takvih varijacija ima ukupno 22n te da su, zbog
pretpostavke o jednakoj vjerojatnosti izvlaenja bilo koje od 22 kuglice, svi elementi od jednako
vjerojatni. Dakle, za raunanje je vjerojatnosti zanimljivih podskupova od opravdano koristiti
klasian pristup.
Na primjer, zanima nas kolika je vjerojatnost da u tih n izvlaenja kuglice iz eira niti jednom
nije izvuena zelena kuglica. U tu svrhu praktino je koristiti svojstvo vjerojatnosti suprotnog
dogaaja. Naime, definirajmo dogaaj A na sljedei nain:
A - u n je ponavljanja sluajnog pokusa barem je jednom izvuena zelena kuglica.
Njemu suprotan dogaaj jest
Ac - u n ponavljanja sluajnog pokusa niti jednom nije izvuena zelena kuglica
= u n je ponavljanja sluajnog pokusa svaki put izvuena crvena kuglica.
Dogaaj Ac sastoji se od onih elemenata iz iji su svi elementi crvene kuglice, a takvih ima
20n . Slijedi da je
 n  n
20
10
P (Ac ) =
=
.
22
11
Primjenom svojstva vjerojatnosti suprotnog dogaaja vidimo da je
 n
10
P (A) = 1
.
11

S2. Vjerojatnost praznog skupa


Neka je (, F, P ) dani vjerojatnosni prostor. Tada vrijedi P () = 0.
Dokaz. S obzirom da je = c , primjena aksioma A2. iz definicije vjerojatnosti i
svojstva S1. dokazuje tu tvrdnju.

S3. Monotonost vjerojatnosti


Neka je (, F, P ) vjerojatnosni prostor te A, B F takvi da je A B. Tada je
P (A) P (B).
Dokaz. Ako je A B, tada se B moe prikazati kao unija disjunktnih skupova A
i (B \ A) (slika 1.3).

14

Osnovna svojstva vjerojatnosti

B\A

B=A(B \ A)

Slika 1.3: Skup B kao unija disjunktnih skupova A i (B \ A).


S obzirom da je vjerojatnost nenegativna funkcija, slijedi da je
P (B) = P (A) + P (B \ A) P (A).
Iz prethodnog izraza moemo zakljuiti da ako je A B, tada vjerojatnost razlike
B \ A raunamo kao razliku vjerojatosti dogaaja B i A, tj. ako je A B, tada je
P (B \ A) = P (B) P (A).

Primjer 1.12. Odredimo vjerojatnost da iz skupa svih pozitivnih dvoznamenkastih brojeva na


sluajan nain odaberemo broj djeljiv s tri koji istovremeno nije djeljiv s devet. Pretpostavimo
da svaki dvoznamenkasti broj moe biti odabran s jednakom vjerojatnou. U tom je sluaju za
raunanje spomenute vjerojatnosti opravdano koristiti klasian pristup.
Definirajmo sljedee dogaaje:
skup svih pozitivnih dvoznamenkastih brojeva (prostor elementarnih dogaaja):
= {n N : 10 n 99} ,

k() = 90;

skup svih pozitivnih dvoznamenkastih brojeva djeljivih brojem tri:


T = {n : t N takav da n = 3t} ,

k(T ) = 30;

skup svih pozitivnih dvoznamenkastih brojeva djeljivih brojem devet:


D = {n : d N takav da n = 9d} ,

k(D) = 10.

Budui da je svaki broj koji je djeljiv brojem devet ujedno djeljiv i brojem tri, zakljuujemo da je
D T . Primjenom klasinog pristupa odreivanju vjerojatnosti slijedi da je
P (D) =

1
k(D)
= ,
k()
9

P (T ) =

k(T )
1
= .
k()
3

Sada moemo izraunati vjerojatnost dogaaja od interesa, tj. dogaaja T \ D. Naime, skup T \ D
sadri sve pozitivne dvoznamenkaste brojeve djeljive brojem tri koji nisu djeljivi brojem devet.
Budui da je D T , slijedi da je
P (T \ D) = P (T ) P (D) =

1
1
2
= .
3
9
9

15

Pojam i osnovna svojstva vjerojatnosti


S4. Vjerojatnost unije dogaaja

O vjerojatnosti unije dogaaja govori trei zahtjev iz definicije vjerojatnosti, tj.


-aditivnost vjerojatnosti. Meutim, tim zahtjevom obuhvaene su samo familije
disjunktnih skupova. To svojstvo daje formulu za izraun vjerojatnosti unije dvaju
skupova i u sluaju kada skupovi nisu disjunktni.
Neka je (, F, P ) dani vjerojatnosni prostor te A, B F. Tada vrijedi
P (A B) = P (A) + P (B) P (A B).
Dokaz. Unija skupova A i B moe se prikazati kao unija disjunktnih skupova na
sljedei nain (slika 1.4):
A B = (A \ (A B)) (B \ (A B)) (A B) .

A \ (AB) AB B \ (AB)

Slika 1.4: Skup (A B) kao unija disjunktnih skupova.


Iz navedenoga proizlazi:
P (A B) = P (A \ (A B)) + P (B \ (A B)) + P (A B).
S obzirom da je (A B) A i (A B) B, vrijedi:
P (A B) = P (A) P (A B) + P (B) P (A B) + P (A B)
= P (A) + P (B) P (A B).
Primjer 1.13. elimo izraunati vjerojatnost sluajnog odabira dvoznamenkastog broja koji je
djeljiv brojem tri ili brojem sedam. Pretpostavimo da svaki dvoznamenkasti broj moe biti odabran
s jednakom vjerojatnou. U tom je sluaju za raunanje spomenute vjerojatnosti opravdano
koristiti klasian pristup.
Sada uz prostor elementarnih dogaaja
= {n N : 10 n 99} ,

k() = 90,

16

Osnovna svojstva vjerojatnosti

i skup dvoznamenkastih brojeva djeljivih brojem tri


T = {n : t N takav da n = 3t} ,

k(T ) = 30,

iz primjera 1.12 promatramo i skup svih dvoznamenkastih brojeva djeljivih brojem sedam, tj. skup
S = {n : s N takav da n = 7s} ,

k(S) = 13.

Dogaaj koji nas zanima jest T S, a njegovu emo vjerojatnost odrediti primjenom formule
za vjerojatnost unije dvaju dogaaja. U tu svrhu trebamo odrediti i kardinalni broj skupa svih
dvoznamenkastih brojeva djeljivih i brojem tri i brojem sedam, tj. skupa
T S = {n : t, s N takvi da n = 3t n = 7s} .
Budui da je T S = {21, 42, 63, 84}, tj. k(T S) = 4, slijedi da je
P (T S) = P (T ) + P (S) P (T S) =

1
13
4
39
13
+

=
=
.
3
90
90
90
30

Formula za raunanje vjerojatnosti unije vie skupova moe se dati i openito, tj. za
uniju konano mnogo skupova. Ta formula poznata je pod imenom Sylvesterova
formula. Njezin je dokaz mogue provesti koristei formulu za vjerojatnost unije
dvaju skupova i princip matematike indukcije (vidi [26]).
Vezano uz vjerojatnost unije dvaju skupova valja uoiti da vrijedi nejednakost
P (A B) P (A) + P (B),
gdje su A, B F, a (, F, P ) dani vjerojatnosni prostor. Takva se nejednakost takoer moe generalizirati i to ne samo na uniju konano mnogo dogaaja
nego i na uniju prebrojivo mnogo dogaaja. To generalizirano svojstvo zove se
-subaditivnost vjerojatnosti.
S5. -subaditivnost vjerojatnosti
Neka je (, F, P ) dani vjerojatnosni prostor i neka je (Ai , i I) F, I N,
prebrojiva familija dogaaja toga prostora. Tada je
!
[
X
P
Ai
P (Ai ).
iI

iI

Dokaz. Iz zadane familije dogaaja (Ai , i I), I N, formirat emo novu familiju
meusobno disjunktnih dogaaja na sljedei nain (slika 1.5, slika 1.6):
B 1 = A1 ,

B 2 = A2 \ A1 ,

...,

Bn = An \

n1
[
i=1

Ai , . . . .

17

Pojam i osnovna svojstva vjerojatnosti

A2

A1

An

A3

Slika 1.5: Familija dogaaja (Ai , i I), I N.

B3

B2

B1

Bn

Slika 1.6: Familija disjunktnih dogaaja (Bi , i I), I N.


Tako definirani skupovi jesu meusobno disjunktni, a vrijedi i da je
[
[
B i Ai i
Bi =
Ai .
iI

iI

Primjenom aksioma A3. na familiju (Bi , i I) slijedi da je


!
!
[
[
X
X
P
Ai = P
Bi =
P (Bi )
P (Ai ).
iI

iI

iI

iI

Primjer 1.14. Automat za igre na sreu programiran je tako da je vjerojatnost pojavljivanja


prirodnog broja jednaka 2n , tj.
1
, n N.
2n
Uoimo da takvim definiranjem vjerojatnosti pojavljivanja razliitih prirodnih brojeva nisu jednako
mogui dogaaji.
P ({n}) =

Odredimo vjerojatnost pojavljivanja bilo kojeg prirodnog broja manjeg ili jednakog od (n + 1), tj.
vjerojatnost dogaaja
S = {1, 2, . . . , n + 1}, n N.
Skup S moe se na razliite naine prikazati kao konana unija familije disjunktnih skupova ili
skupova koji nisu disjunktni. Na primjer, ako definiramo skupove
A1
A2
A3

An

=
=
=
..
.
=

{1, 2},
{2, 3},
{3, 4},

{n, n + 1},

n N,

vidimo da za konanu familiju skupova (Ai , i n), n N, vrijedi:


S=

n
[
i=1

Ai ,

P (Ai ) =

1
3
1
+ i+1 = i+1 ,
2i
2
2

i n.

18

Osnovna svojstva vjerojatnosti

Meutim, P (S) ne moemo dobiti sumiranjem svih P (Ai ) jer (Ai , i n) nije familija disjunktnih
skupova, no ako S prikaemo kao konanu uniju jednolanih skupova (uoimo da su oni ujedno
disjunktni!), tada lako moemo izraunati P (S):
!
n
n
n
[
X
[
1
2n 1
{i} =
S=
{i}, P (S) = P
=
.
i
2
2n
i=1
i=1
i=1
Svojstvo -subaditivnosti vjerojatnosti primijenjeno na uniju skupova Ai , i n, u navedenom
primjeru moemo potvrditi na osnovu nejednakosti
!
n
n
[
X
2n 1
3 2n 1
Ai = P (S) =
P
<
=
P (Ai ), n N.
2n
2 2n
i=1
i=1

S6. Neprekidnost vjerojatnosti u odnosu na rastuu familiju


dogaaja
Neprekidnost vjerojatnosti u odnosu na rastuu familiju dogaaja omoguava raunanje vjerojatnosti unije rastue familije dogaaja kao limesa niza vjerojatnosti
pojedinanih dogaaja u familiji. Preciznije, neka je (, F, P ) dani vjerojatnosni
prostor i neka je (An , n N) F rastua familija dogaaja, tj. An F za sve
nNi
A1 A2 . . . An An+1 . . . ;
tada vrijedi da je
!
[

An

= lim P (An ).

nN

Dokaz. Prvo uoimo da lim P (An ) postoji. Naime, zbog monotonosti vjerojatn

nosti niz je brojeva (P (An ), n N) monotono rastui. S obzirom da se radi o nizu


vjerojatnosti, taj je niz brojeva sadran u segmentu [0, 1], tj. ogranien je. Budui
da je monoton i ogranien niz realnih brojeva konvergentan, navedena granina vrijednost zaista postoji. Od zadane rastue familije dogaaja (An , n N) formirat
emo novu familiju (Bn , n N) meusobno disjunktnih dogaaja na sljedei nain
(slika 1.7):
B 1 = A1 ,

B 2 = A2 \ A1 ,

. . . Bn = An \ An1 , . . . .

Osim to je (Bn , n N) familija disjunktnih dogaaja, vrijedi i sljedee:


An =

n
[
i=1

Bi ,

[
i=1

Ai =

[
i=1

Bi .

19

Pojam i osnovna svojstva vjerojatnosti

A3 A2 A1

An

B3 B2 B1

Bn

Slika 1.7: Rastua familija (An , n N) i disjunktna familija (Bn , n N).


Dakle, vrijedi:
P (An ) =

n
X

P (Bi ),

i=1

!
Ai

=P

i=1

!
Bi

i=1

P (Bi ) = lim

i=1

n
X

P (Bi ) = lim P (An ).

i=1

Primjer 1.15. Pretpostavimo da se radi o istom automatu za igre na sreu kao u primjeru 1.14,
ali zanima nas vjerojatnost pojavljivanja bilo kojeg neparnog broja, tj. vjerojatnost skupa
N = {2n 1 : n N}.
Vjerojatnost skupa N moemo izraunati na nekoliko naina. Ovdje ilustriramo pristup koji
koristi neprekidnost vjerojatnosti u odnosu na rastuu familiju dogaaja.
Prikaimo N pomou familije skupova (An , n N) gdje su skupovi An definirani na sljedei nain:
A1
A2
A3

An

{1},
{1, 3},
{1, 3, 5},

=
=
=
..
.
=
..
.

{1, 3, 5, . . . , 2n 1},

n N,

Vidimo da je A1 A2 A3 . . . An . . ., tj. (An , n N) je rastua familija skupova i


vrijedi da je
N

Ai ,

i=1

P (An )

n
X
i=1

1
22i1

=2



n
X
1
2
1
=
1 n ,
i
4
3
4
i=1

n N.

Zbog neprekidnosti vjerojatnosti u odnosu na rastuu familiju dogaaja slijedi da je




2
1
2
P (N ) = lim P (An ) =
lim
1 n = .
n
3 n
4
3

20

Osnovna svojstva vjerojatnosti

S7. Neprekidnost vjerojatnosti u odnosu na padajuu familiju


dogaaja
Neprekidnost vjerojatnosti u odnosu na padajuu familiju dogaaja omoguava raunanje vjerojatnosti presjeka padajue familije skupova kao limesa niza vjerojatnosti pojedinanih skupova u familiji. Preciznije, neka je (, F, P ) dani vjerojatnosni prostor i neka je (An , n N) F padajua familija dogaaja, tj. An F za
sve n i
A1 A2 . . . An An+1 . . . ;
tada vrijedi da je
!
P

An

= lim P (An ).
n

nN

Dokaz. Slika 1.8 prikazuje padajuu familiju dogaaja (An , n N) F.

A1

A2

A3

An

Slika 1.8: Padajua familija dogaaja (An , n N).


Od zadane padajue familije dogaaja (An , n N) formirat emo novu familiju
(Cn , n N) koja e biti monotono rastua te emo u dokazu iskoristiti svojstvo neprekidnosti vjerojatnosti u odnosu na monotono rastue familije dogaaja (svojstvo
S6). Familiju (Cn , n N) definiramo na sljedei nain (slika 1.9):
C1 = , C2 = A1 \ A2 , C3 = A1 \ A3 , . . . , Cn = A1 \ An , . . .

C2=A1 \ A2

C3=A1 \ A3

Cn=A1 \ An

Slika 1.9: Rastua familija dogaaja (Cn , n N).

Pojam i osnovna svojstva vjerojatnosti

21

Za tako definiranu rastuu familiju dogaaja vrijedi sljedee:


!

[
\
C i = A1 \
Ai ,
i=1

A1 \

!!
Ai

=P

i=1

i=1

!
Ci

= lim P (Ci ) = lim (P (A1 ) P (Ai )) .

i=1

Dakle, vrijedi:
P

A1 \

!!
= P (A1 ) P

Ai

i=1

!
Ai

= P (A1 ) lim P (Ai ),


i

i=1

odakle slijedi tvrdnja.

Primjer 1.16. Pretpostavimo da se radi o istom automatu za igre na sreu kao u primjeru 1.14.
Odredimo s kojom se vjerojatnou pojavljuje bilo koji paran broj vei ili jednak od unaprijed
zadanog prirodnog broja. Skupove An , za n N, definiramo na sljedei nain:
A1
A2
A3

An

=
=
=
..
.
=
..
.

{2, 4, 6, 8, 10, . . .},


{4, 6, 8, 10, . . .},
{6, 8, 10, . . .},

{2n, 2(n + 1), 2(n + 2), . . .},

n N,

To znai da treba odrediti P (An ). Prvo odredimo vjerojatnost presjeka prebrojive familije (An , n
N). Oito je A1 A2 A3 . . . An . . ., tj. (An , n N) je padajua familija skupova za
koju je

X
1
1
=
.
P (An ) =
2k
n1
2
3

4
k=n
Koritenjem neprekidnosti vjerojatnosti u odnosu na padajuu familiju dogaaja vidimo da je
!

\
1
= 0,
P
Ai = lim P (An ) = lim
n
n 3 4n1
i=1
to je i logino s obzirom da je presjek svih skupova Ai zapravo prazan (ne postoji paran broj koji
je vei od svakog prirodnog broja.)

1.6

Vjerojatnost na diskretnom

Neka je konaan ili prebrojiv prostor elementarnih dogaaja. Takve skupove


oznaavat emo na sljedei nain:
= {i : i I },

I N,

Vjerojatnost na diskretnom

22

gdje je I skup indeksa. Na primjer, ako je = {1 , . . . , n }, onda je I =


{1, . . . , n}, a ako je = {i : i N}, onda je I = N. Iz definicije vjerojatnosti
znamo da je vjerojatnost funkcija kojoj je domena -algebra dogaaja. Dakle,
da bismo zadali konkretnu vjerojatnost na , potrebno je zadati vrijednosti te
funkcije na svakom skupu A sadranom u pridruenoj -algebri. Kod konanih
i prebrojivih skupova elementarnih dogaaja pretpostavit emo da je
pridruena -algebra tono jednaka partitivnom skupu od , tj. F =
P(). U nastavku e se pokazati da je to za nae potrebe prirodno i mogue
ispotovati. Vjerojatnosni prostor kod kojega je konaan ili prebrojiv skup, a
pridruena je -algebra P(), zvat emo diskretan vjerojatnosni prostor.
U ovom poglavlju pokazat emo kako se funkcija na P(), kojom je zadana vjerojatnost, moe odrediti zadavanjem vrijednosti samo na jednolanim podskupovima
od , tj. elementima od . S obzirom da P() ima mnogo vie elemenata nego
(ako konaan ima k() elemenata, onda je 2k() broj elemenata od P()), na taj
smo nain u velikoj mjeri pojednostavili zadavanje vjerojatnosti.
Preciznije, ako imamo zadan diskretan vjerojatnosni prostor (, P(), P ), tada za
svaki pojedini i znamo izraunati vjerojatnost
pi = P ({i }) .
Koristei svojstvo -aditivnosti vjerojatnosti, pomou tako dobivenog niza brojeva
(pi , i I ), I N, moemo izraunati vjerojatnost bilo kojeg dogaaja A = {i :
i IA }, gdje je IA I skup indeksa elemenata od A:
!
[
X
X
P (A) = P
{i } =
P ({i }) =
pi .
iIA

iIA

iIA

Dakle, poznavanje vrijednosti vjerojatnosti na jednolanim podskupovima od


automatski odreuje vjerojatnost bilo kojeg dogaaja tog vjerojatnosnog prostora.
Time niz brojeva koji predstavljaju vjerojatnosti jednolanih podskupova od
preuzima kljunu ulogu u opisivanju i zadavanju vjerojatnosti na diskretnom vjerojatnosnom prostoru.
Valja uoiti da navedeni niz brojeva (pi , i I ) ima sljedea dva svojstva:
1. pi 0 za sve i I ,
P
2.
pi = 1.
iI

Pojam i osnovna svojstva vjerojatnosti

23

Taj rezultat moemo iskoristiti prilikom zadavanja vjerojatnosti na diskretnom vjerojatnosnom prostoru, kao to je ilustrirano sljedeim primjerima:
Primjer 1.17 (Konano mnogo jednako moguih ishoda). Pretpostavimo da sluajan pokus
ima konano mnogo jednako moguih ishoda te da je = {1 , . . . , n }, tj. k() = n. Definirajmo
funkciju P : P() [0, 1] na sljedei nain:
P ({i }) =

1
,
n

i {1, . . . , n},

A = {j : j IA , IA {1, . . . , n}},

P (A) =

P ({i }) .

iIA

Na taj je nain zadana funkcija na P() koja zadovoljava sve zahtjeve definicije vjerojatnosti
(provjerite!). Osim toga, tako definirana vjerojatnost podudara se s klasinim pristupom odreivanja vjerojatnosti.
Primjer 1.18. Neka je prostor elementarnih dogaaja sluajnog pokusa = N. Definirajmo
funkciju na -algebri P(N) na sljedei nain:
P ({i}) =

1
,
2i

A = {i1 , i2 , . . . , in , . . .},

i N,
X
P ({ij }) .
P (A) =
ij A

Dokaimo da je na taj nain definirana vjerojatnost na N.


1. Oigledno je P (A) 0 za sve A P(N).
2. Provjerimo je li P (N) = 1. Koristimo formulu za sumu geometrijskog reda s kvocijentom
1
1
i prvim lanom :
2
2
1
X 1
2
=
= 1.
P (N) =
i
2
1 12
iN
3. Da bismo provjerili -aditivnost uzmimo familiju {A1 , A2 , . . . , An , . . .} disjunktnih podskupova skupa N. Neka je
A1
A2

An

=
=
..
.
=
.
..

{a11 , a12 , . . . , a1j , . . .} N,


{a21 , a22 , . . . , a2j , . . .} N,

{an1 , an2 , . . . , anj , . . .} N,

n N,

Pri tome je
P (An ) =

X
j=1

1
1.
2anj

Uoimo takoer da, zbog disjunktnosti skupova Ai , meu brojevima anj N nema istih pa
se njihova unija moe prikazati kao

An = {a11 , a12 , . . . , a1j , . . . , a21 , a22 , . . . , a2j , . . . , an1 , an2 , . . . , anj , . . .}.

n=1

S
Vjerojatnost unije dobije se sumiranjem brojeva oblika (2k ) po svim k
An . S obzin=1



S
S
rom da je
An N, niz 2k , k
An podniz je geometrijskog niza s kvocijentom
n=1

n=1

Vjerojatnost na diskretnom

24

1/2. Time je i red koji se dobije sumiranjem lanova tog niza konvergentan i vrijedi (vidi
poglavlje 5.3 u Dodatku):
!

[
X
X
1
An =
P
P (An ).
anj =
2
n=1
n=1 j=1
n=1

Takav nain zadavanja vjerojatnosti na diskretnom vjerojatnosnom prostoru moe


se primijeniti uvijek. Ako je s = {i , i I N} dan prostor elementarnih
dogaaja, potreban je samo niz brojeva (pi , i I ) sa svojstvima
1. pi 0 za sve i I ,
X
2.
pi = 1
iI

da bismo definirali vjerojatnost na tom diskretnom kao


X
X
P (A) =
P ({i }) =
pi .
iIA

iIA

Naime, vrijedi sljedea tvrdnja:


Neka je s (pi , i I), I N zadan niz realnih brojeva sa svojstvima:
1. pi 0 za sve i I,
P
2.
pi = 1,
iI

te neka je bilo koji skup koji ima k(I) elemenata. Tada je izrazom
X
P (A) =
pi , A ,
(1.1)
iIA

gdje je IA skup indeksa elemenata iz koji pripadaju skupu A, dobro


definirana vjerojatnost na (, P()).
Dokaz. Neka je = {i , i I} dan neprazan skup. Dokaimo da je funkcijom
(1.1) dobro definirana vjerojatnost.
1. Oigledno je P (A) 0 za sve A P().
P
2. P () =
pi = 1.
iI

3. Neka su A1 , A2 , . . . , An , . . . disjunktni podskupovi od i A =

Ai . Tada

i=1

familija skupova {A1 , A2 , . . . , An , . . .} ini jednu particiju skupa A. Koristei rezultate teorije ponovljenih redova (poglavlje 5.3 u Dodatku) moemo

25

Pojam i osnovna svojstva vjerojatnosti


zakljuiti da vrijedi:
P (A) =

pj =

X X

pj =

iN jIAi

jIA

P (Ai ),

iN

pa vrijedi -aditivnost.
Primjer 1.19. Dan je niz triju brojeva: 16 , 15 i 13 . Moemo li taj niz nadopuniti etvrtim brojem
tako da ta etiri broja dobro definiraju vjerojatnost na diskretnom vjerojatnosnom prostoru u
smislu ovoga poglavlja? Odgovor je potvrdan. Naime, navedena tri broja pozitivna su i manja od
1, a suma im iznosi 21
, to je jo uvijek manje od 1. Dakle, ako za etvrti broj izaberemo razliku
30
21
9
1 30
= 30
, prema rezultatima ovoga poglavlja slijedi da postoji vjerojatnosni prostor na kojemu
pomou tih brojeva moemo zadati vjerojatnost. Npr. uzmemo = {1, 2, 3, 4}, F = P() i
P ({1}) =

1.7

1
,
6

P ({2}) =

1
,
5

P ({3}) =

1
,
3

P ({4}) =

9
.
30

Primjeri vjerojatnosti na R

Postoji mnotvo sluajnih pokusa za koje je prirodno pretpostaviti da prostor elementarnih dogaaja sadri neki interval.
Primjer 1.20. Vrijeme (mjereno u sekundama) koje postie atletiar u utrci na 100 metara moe
se modelirati kao rezultat sluajnog pokusa s vrijednostima iz intervala [0, 13]. S obzirom da se
vrijeme na utrkama danas mjeri vrlo precizno, nije mudro modelirati rezultate takvog pokusa kao
diskretan skup. Zbog toga uzimamo npr. = [0, 13] ili neki vei skup koji sadri interval [0, 13].

Vjerojatnost u takvim vjerojatnosnim prostorima ne moe se odrediti koristei niz


vrijednosti koje ona postie na pojedinaim ishodima ve i zbog injenice da prostor
elementarnih dogaaja nije prebrojiv. Jedan od naina na koji je mogue zadati
vjerojatnost na intervalima, a koji je prikladan za raunanje, jest koritenje nenegativne realne funkcije definirane na skupu R koja s osi apscisa zatvara jedininu
povrinu. Naime, odaberemo takvu nenegativnu realnu funkciju i zadamo vjerojatnost nekog skupa A kao povrinu koju zatvara graf te funkcije s osi apscisa nad
skupom A.
Primjer 1.21. Pretpostavimo da raunalo izvodi neku numeriku proceduru s tonou na 6
decimanih mjesta i daje rezultat 1.234567, no da je stvaran rezultat te procedure zapravo neki
realan broj iz intervala [1.234567, 1.234568i. U tom kontekstu kao prostor elementarnih dogaaja
promatramo interval = [1.234567, 1.234568i. Kako nemamo razloga preferirati odreene brojeve
iz kao stvarne rezultate te numerike procedure, pretpostavljamo da su svi podintervali od koji
imaju jednaku duljinu jednako mogui. U skladu s tom pretpostavkom i shvaanjem vjerojatnosti
kao dijela cjeline, vjerojatnost da je stvaran rezultat iz intervala A u ovom se primjeru moe
zadati kao kvocijent duljine intervala A i duljine cijelog :
P (A) =

d(A)
.
d()

26

Primjeri vjerojatnosti na R

Tako definirana funkcija na -algebri koja sadri sve podintervale od zadovoljavat e zahtjeve
postavljene u definiciji vjerojatnosti2 te je time dobro definirana vjerojatnost na = [1.234567, 1.234568i.
Zovemo ju geometrijska vjerojatnost na = [1.234567, 1.234568i.
Primjer 1.22. Vjerojatnost iz prethodnog primjera definiranu na = [1.234567, 1.234568i moemo proiriti na 0 = R koritenjem nenegativne realne funkcije
(
f (x) =

1
106

, x [1.234567, 1.234568i
.
, x
/ [1.234567, 1.234568i

Graf funkcije f prikazan je na slici 2.15.

y
1
106

x
1.234567

1.234568

Slika 1.10: Graf funkcije f (x) =

1
106

I[1.234567,1.234568i (x).

Vjerojatnost dogaaja A 0 (oznaimo je P 0 ) definiramo kao povrinu koju zatvara graf te funkcije s osi apscisa nad intervalom A. Uoimo da za intervale A 0 koji su ujedno i podintervali
od iz primjera 1.21 vrijedi
P 0 (A) = P (A),
gdje je P geometrijska vjerojatnost definirana u primjeru 1.21.

Prednost je zadavanja vjerojatnosti pomou nenegativne funkcije u odnosu na vjerojatnost kao kvocijent duljina intervala u tome to se moe generalizirati i na
probleme u kojima nema razloga pretpostavljati da su svi ishodi jednako mogui.
Primjer 1.23. U primjeru 1.20 nije razumno oekivati istu vjerojatnost da atletiar postigne
vrijeme u intervalu [0, 5] kao u intervalu [8, 13] iako su duljine tih intervala jednake. Naime,
2 Dovoljno

je provjeriti da vrijede prva dva zahtjeva iz definicije vjerojatnosti te trei zahtjev


za konano mnogo disjunktnih intervala.

27

Pojam i osnovna svojstva vjerojatnosti

poznato je da srednjokolci uobiajeno postiu vrijeme od oko 12 sekundi pri tranju na 100 metara,
a rezultati se atletiara uglavnom kreu izmeu 9 i 10 sekundi. Vjerojatnost koja je definirana na
intervalu [0, 13] koritenjem principa jednako moguih ishoda imala bi pripadni graf funkcije kao
to je prikazano na slici 1.11.

y
1
13

13

Slika 1.11: Graf funkcije koja uniformno definira vjerojatnost na [0, 13]
Preferiranje intervala [8, 13] nad ostatkom moemo npr. predoiti grafom funkcije na slici 1.12.

y
3
20

1
32

13

Slika 1.12: Graf funkcije koja definira vjerojatnost na [0, 13] uz preferiranje intervala [8, 13].
Da bi realnom funkcijom mogli modelirati vjerojatnost na opisani nain bitno je da povrina koju
zatvara njezin graf s osi apscisa iznad cijelog bude jednaka 1, a graf funkcije moe rasti i padati
na tako da odraava stupanj vjerovanja da se pojedini intervali realiziraju u stvarnom pokusu.
Ako elimo neki interval preferirati nad ostalim podrujem, iznad njega i vrijednosti funkcije
kojom opisujemo vjerojatnost trebaju biti vee.
U ovom trenutku neemo se baviti odgovorom na pitanje je li vjerojatnost odreena funkcijom
iji je graf dan na slici 1.12 u skladu s problemom opisanim u primjeru ili treba raditi dodatne
modifikacije. O usklaenosti modela sa stvarnim problemima bit e rijei u drugom dijelu knjige
koji se bavi statistikom.

Openito, neka je dana realna funkcija f realne varijable, tj. f : R R takva da je


f (x) 0, za sve x R

28

Primjeri vjerojatnosti na R
Z

f (x) dx = 1.

Neka je B najmanja -algebra podskupova od R koja sadri sve intervale. Izrazom


Z
P (A) = f (x) dx, A B
A

definirana je vjerojatnost na B. Matematika teorija koja omoguava dokaz te


injenice moe se nai npr. u [26].
Ukoliko je prostor elementarnih dogaaja samo jedan interval koji je pravi podR
skup od R, potrebno je da f (x) dx bude jednak 1. To moemo lako zadovoljiti

tako da na c stavimo vrijednosti funkcije f (x) na nulu.


Primjer 1.24. Pokaimo da pomou funkcije f : R R (slika 1.13) definirane formulom

3 (1 x2 ) , x [1, 1]
f (x) =
,
4

0
, x
/ [1, 1]
moemo definirati vjerojatnost na skupu R, tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x) 0, x R,
- normiranost - povrina je ispod grafa funkcije f (pogledati sliku) nad skupom R
Z1

Z
f (x) dx =

3
3 4
(1 x2 ) dx = = 1.
4
4 3

y
3
4

-1

Slika 1.13: Graf funkcije f (x) =

x
3
(1 x2 ) I[1,1] (x).
4

Primjer 1.25. Vaan je primjer nenegativne funkcije f : R R pomou koje moemo definirati
vjerojatnost na R funkcija definirana formulom (slika 1.14)
x2
1
f (x) =
e 2 , x R.
2

29

Pojam i osnovna svojstva vjerojatnosti


y

0.3
0.2
0.1
-4

-2

Slika 1.14: Gaussova krivulja - graf funkcije f (x) =

1.8

1
2

x2
2

Primjeri vjerojatnosti na R2 i R3

Ukoliko je prostor elemetarnih dogaaja pravokutnik ili neki drugi geometrijski


lik, za modeliranje vjerojatnosti na moe se prenijeti logika nastala pri modeliranju vjerojatnosti na intervalima. Slino se moe primijeniti i na skupove koji su
zadani kao geometrijska tijela.
Primjer 1.26. U pokusu sluajnog izbora toke iz kruga radijusa r vjerojatnost moemo zadati
pomou kvocijenta dijela i cjeline. Tako je vjerojatnost da bude izabrana toka iz krunog odsjeka
A povrine s(A) dana izrazom
s(A)
P (A) = 2 .
r
Naime, s() = r2 predstavlja povrinu cijelog kruga, a povrina dijela koji nas zanima oznaena
je sa s(A).
Primjer 1.27. Pri sluajnom izboru toke iz kugle radijusa r vjerojatnost takoer moemo zadati
pomou kvocijenta dijela i cjeline. Tako je vjerojatnost da bude izabrana toka iz kuglinog isjeka
A volumena v(A) dana izrazom
v(A)
P (A) = 4
r3
3
s obzirom da je v() =

4 3
r volumen cijele kugle.
3

Za modeliranje se vjerojatnosti koje preferiraju neke dijelove prostora elementarnih


dogaaja u odnosu na druge dijelove istih dimenzija (povrine odnosno volumena)
takoer moe prenijeti logika zadavanja vjerojatnosti pomou nenegativne realne
funkcije. U sluaju kad je = R2 (odnosno, = R3 ) radi se o nenegativnoj realnoj
funkciji f : R2 R (odnosno, f : R3 R) koja mora zadovoljati sljedee svojstvo:
Z
f (x) dx = 1,

30

Uvjetna vjerojatnost. Nezavisnost

gdje je x R2 (odnosno, x R3 ).
Uoimo da je za dvodimenzionalne to dvostruki integral, pa postavljeni zahtjev
zapravo znai da volumen tijela koje je omeeno grafom funkcije f i ravninom
(x1 , x2 ) na dijelu za koji vrijedi (x1 , x2 ) mora iznositi 1. Za trodimenzionalne
to je trostruki integral.
Vjerojatnost je skupa3 A tada dana izrazom
Z
P (A) = f (x) dx.
A

Primjer 1.28. Pokaimo da pomou funkcije f : R2 R definirane formulom

3 (x2 + y) , (x, y) [1, 1] [0, 1]


f (x, y) =
5

0
, za ostale (x, y) R2
moemo definirati vjerojatnost na R2 , tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x, y) 0, (x, y) R2 ,
- normiranost - volumen kojega graf funkcije f zatvara sa skupom R2 , tj. volumen ispod
grafa funkcije f nad pravokutnikom [1, 1] [0, 1] iznosi
Z
f (x, y) dx dy =

3
5

Z1 Z1

(x2 + y) dx dy = 1.

0 1

R2

Prema tome, vjerojatnost skupa A = [0, 1] [0, 0.5] R2 raunamo na sljedei nain:
Z
P (A) =

f (x, y) dx dy =

3
5

Z0.5Z1
0

(x2 + y) dx dy =

7
.
40

Primjer 1.29. Pokaimo da pomou funkcije f : R3 R definirane formulom

1 z 2 (x + y) , (x, y, z) [0, 2] [0, 1] [2, 0]


f (x, y, z) =
8

0
,
za ostale (x, y, z) R3
moemo definirati vjerojatnost na R3 , tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x, y, z) 0, (x, y, z) R3 ,
- normiranost - volumen kojega graf funkcije f zatvara sa skupom R3 iznosi
Z
f (x, y, z) dx dy dz =

1
8

Z2 Z1 Z0
0

R2

z 2 (x + y) dx dy dz = 1.

0 2

Prema tome, vjerojatnost skupa B = [0, 1] [0, 1] [1, 0] R2 raunamo na sljedei nain:
Z
P (B) =

f (x, y, z) dx dy dz =
B

1
8

Z1 Z1 Z0
0

z 2 (x + y) dx dy dz =

1
.
24

0 1

3 O obliku -algebre na kojoj se moe definirati vjerojatnost pogledati [26]. Specijalno, u dvodimenzionalnom sluaju vjerojatnost se na taj nain moe definirati na najmanjoj -algebri koja
sadri sve skupove oblika (a, b) (c, d), gdje su a, b, c, d R, a < b, c < d.

31

Pojam i osnovna svojstva vjerojatnosti

1.9

Uvjetna vjerojatnost. Nezavisnost

Primjer 1.30. Nakon izleta napravili smo 5 kopija istog CD-a s fotografijama izleta, ali su
samo tri kopije uspjele. Na CD-ove nismo stavili nikakve oznake i ne znamo koji su ispravni,
a koji ne. Pretpostavimo da smo u urbi i da imamo vremena za provjeru samo jednog CD-a.
Izabrali smo jedan, provjerili i utvrdili da je neispravan. Meutim, u urbi nam se taj provjereni
CD pomijeao s ostalima i sada moramo uzeti jedan bez provjere pa kako bude. Mislite li da bi
vjerojatnost odabira ispravnog CD-a u drugom biranju bila vea da se provjereni CD nije pomijeao
s ostalima? Analizirajmo te sluajeve odvojeno.
1. Pomijeani sluaj. Definirajmo dogaaje:
Li - u i-tom izvlaenu izvuen je neispravan (lo) CD,
Di - u i-tom izvlaenju izvuen je ispravan (dobar) CD,
gdje je i {1, 2}. S obzirom da je nakon prvog izvlaenja sve ponovo pomijeano, pri
drugom izvlaenju CD-a ponovo smo na poetku, tj. rezultat prvog izvlaenja uope nema
utjecaja na rezultat drugog izvlaenja. Dakle, vjerojatnost dogaaja D2 ne ovisi o realizaciji
dogaaja L1 . Slijedi da je vjerojatnost odabira ispravnog CD-a u drugom izvlaenju jednaka
vjerojatnosti odabira ispravnog CD-a u prvom izvlaenju i iznosi 53 .
2. Nepomijeani sluaj. Ovaj puta je drugi pokus bitno promijenjen u odnosu na prvi. Sada
znamo da u drugom izvlaenju biramo od etiri CD-a, od kojih su tono tri ispravna, pa je
vjerojatnost dogaaja D2 uz uvjet da se dogodio L1 jednaka 43 .

U oba sluaja prethodnog primjera pojavljuju se dva izvlaenja CD-a. U pomijeanom sluaju vjerojatnost u drugom izvlaenju ne ovisi o rezultatima prvog izvlaenja
i zapravo je ista kao u prvom izvlaenju. Kaemo da drugo izvlaenje ne ovisi o
prvom izvlaenju i moemo ih promatrati odvojeno. U nepomijeanom sluaju rezultat prvog izvlaenja utjee na vjerojatnost u drugom izvlaenju i nije mudro ta
dva izvlaenja promatrati kao sasvim odvojene cjeline. Da bismo mogli prouavati
takve probleme definirat emo tzv. uvjetne vjerojatnosti koje e opisivati rezultate drugog izvlaenja i to: uvjetnu vjerojatnost uz uvjet da je u prvom pokuaju
izvuen dobar CD i uvjetnu vjerojatnost uz uvjet da je u prvom pokuaju izvuen
lo CD.
Definicija 1.5. Neka je dan vjerojatnosni prostor (, F, P ) i dogaaj A F koji
ima pozitivnu vjerojatnost, tj. P (A) > 0. Funkcija P ( | A) definirana na F izrazom
P (B | A) =

P (A B)
,
P (A)

B F,

(1.2)

je uvjetna vjerojatnost uz uvjet da se dogodio dogaaj A.


Tako definirana funkcija zadovoljava sve zahtjeve postavljene u definiciji vjerojatnosti, tj. na taj je nain definirana jedna vjerojatnost na (provjerite zahtjeve
iz aksiomatske definicije vjerojatnosti!). Navedena injenica ima za posljedicu to

32

Uvjetna vjerojatnost. Nezavisnost

da se na P (B | A) mogu primijeniti sva svojstva vjerojatnosti koja su dokazana u


potpoglavlju 1.5. Tako npr. vrijedi:
P ( | A) = 0,
P (B c | A) = 1 P (B | A),
za B1 B2 je P (B1 | A) P (B2 | A), itd.
U pojedinim sluajnim pokusima uvjetne vjerojatnosti modeliraju se po istom principu kao i sve vjerojatnosti.
Primjer 1.31. Vratimo se primjeru 1.30. Odredimo uvjetne vjerojatnosti ishoda drugog izvlaenja u nepomijeanom sluaju uvjetovane na mogue ishode prvog izvlaenja.
Prvo uoimo da je u nepomijeanom sluaju iz primjera 1.30 vjerojatnost da je u drugom izvlaenju izvuen ispravan CD ako je u prvom izvlaenu izvuen neispravan CD zapravo vjerojatnost
P (D2 |L1 ). Dakle, imamo:
3
,
4

P (L2 | L1 ) =

1
,
4

2
1
= ,
4
2

P (L2 | D1 ) =

2
1
= .
4
2

P (D2 | L1 ) =
P (D2 | D1 ) =

Vjerojatnost presjeka.
Izraz se iz definicije uvjetne vjerojatnosti esto koristi za izraun vjerojatnosti
presjeka. To omoguuje jednakost (1.2) napisanu na drugi nain (pri emu je
P (A) > 0):
P (A B) = P (B | A)P (A).
Primjer 1.32. Ako u primjeru 1.30, u nepomijeanom sluaju, elimo odrediti vjerojatnost da
su u oba izvlaenja izvueni loi CD-ovi moemo primijeniti ovaj izraz. Dobijemo:
P (L2 L1 ) = P (L2 | L1 )P (L1 ) =

1 2
1
=
.
4 5
10

Pojam nezavisnosti dogaaja.


Intuitivno je jasno da bi pojam nezavisnosti dvaju dogaaja A i B, pri emu zahtijevamo da je P (A) > 0, morao odraavati injenicu da realizacija jednog od njih ne
utjee na realizaciju drugog. To bi se na uvjetnu vjerojatnost trebalo odraziti tako
da je
P (B | A) = P (B),

33

Pojam i osnovna svojstva vjerojatnosti


tj. da za vjerojatnost presjeka vrijedi
P (A B) = P (B | A)P (A) = P (B)P (A).

Primjer 1.33. Za sluaj u kojemu smo u primjeru 1.30 pomijeali provjereni CD s ostalima
takoer moemo odrediti uvjetnu vjerojatnost uz uvjet da je u prvom izvlaenju izvuen lo CD,
kao i uvjetnu vjerojatnost uz uvjet da je u prvom izvlaenju izvuen dobar CD. Meutim, te e
dvije uvjetne vjerojatnosti biti jednake, neovisno uvjetujemo li na dogaaj D1 ili L1 . Uvjetne
vjerojatnosti izvlaenja ispravnog, odnosno neispravnog, CD-a u drugom izvlaenju, uz uvjet da
je u prvom izvlaenju izvuen neispravan CD, iznose:
3
2
P (D2 | L1 ) = P (D2 ) = , P (L2 | L1 ) = P (L2 ) = .
5
5
Nadalje, uvjetne vjerojatnosti izvlaenja ispravnog, odnosno neispravnog CD-a u drugom izvlaenju, uz uvjet da je u prvom izvlaenju izvuen ispravan CD, iznose:
3
2
P (D2 | D1 ) = P (D2 ) = , P (L2 | D1 ) = P (L2 ) = .
5
5
Slijedi da je vjerojatnost da su u oba izvlaenja izvueni loi CD-ovi
4
2 2
.
P (L1 L2 ) = =
5 5
25

Definicija 1.6. Neka je (, F, P ) vjerojatnosni prostor. Kaemo da su dogaaji


A, B F nezavisni ako vrijedi:
P (A B) = P (A) P (B).

Sljedea definicija pojam nezavisnosti dogaaja generalizira na proizvoljnu familiju


dogaaja.
Definicija 1.7. Neka je (, F, P ) vjerojatnosni prostor. Kaemo da je proizvoljna
familija dogaaja (Ax , x I) F nezavisna ako za svaki konaan skup razliitih
indeksa {i1 , . . . , in } I vrijedi

n
n
\
Y
P
Ai j =
P (Aij ).
j=1

j=1

Vano je napomenuti da komplementiranje dogaaja nee promijeniti njegovo stanje


nezavisnosti od nekog drugog dogaaja. Naime, vrijedi sljedea tvrdnja:
ako su A i B nezavisni dogaaji, onda su
Ac i B,
takoer nezavisni dogaaji.

A i Bc,

Ac i B c

34

Uvjetna vjerojatnost. Nezavisnost

Dokaz. Dokaimo samo prvu tvrdnju, ostale se dokazuju analogno. Zbog nezavisnosti je dogaaja A i B P (A B) = P (A)P (B). Upotrebom toga svojstva slijedi:
P (Ac B) = P (B \ (A B)) = P (B) P (A B) =
= P (B) P (A) P (B) = (1 P (A)) P (B) =
= P (Ac ) P (B),
tj. dogaaji Ac i B nezavisni su.

Primjer 1.34. Pojam nezavisnosti dogaaja olakava raunanje vjerojatnosti kod nezavisnog
ponavljanja istog pokusa. Promotrimo pokus izvlaenja kuglice iz eira koji sadri 20 crvenih i 2
zelene kuglice. Odredimo vjerojatnost izvlaenja tono dvije zelene kuglice u 30 ponavljanja toga
pokusa. Prilikom ponavljanja prethodno izvuena kuglica vraa se u eir i sve se dobro promijea.
Da bi rijeili taj problem, prvo emo uoiti da je vjerojatnost izvlaenja zelene kuglice u svakom
pojedinom izvlaenju uvijek ista i iznosi 1/11, dok je vjerojatnost izvlaenja crvene kuglice 10/11.
Prostor elementarnih dogaaja tog sluajnog pokusa sastoji se od ureenih 30-torki slova "c" i
"z" koja oznaavaju boju kuglice izvuene u pojedinom izvlaenju (tj. je skup svih varijacija s
ponavljanjem 30-og razreda dvolanog skupa {c, z}).
Vjerojatnost da su u prvim dvama pokuajima izvuene zelene kuglice, a u svim ostalima crvene,
moemo izraunati kao vjerojatnost presjeka nezavisnih dogaaja, pa ona iznosi
 2  28
10
1

.
11
11
Meutim, isto toliko iznosi vjerojatnost pojave svake ureene 30-torke toga pokusa u kojoj su tono

dva slova "z". S obzirom da u ima 30
elemenata koji imaju "z" na tono dvjema pozicijama,
2


1 2
10 28
a svaki od njih ima vjerojatnost 11
11
, onda vjerojatnost izvlaenja tono dviju zelenih
kuglica u tih 30 ponavljanja pokusa iznosi
30  1 2  10 28

.
2
11
11

Formula potpune vjerojatnosti


Koritenje uvjetnih vjerojatnosti moe olakati raunanje vjerojatnosti u sloenijim
sluajevima.
Primjer 1.35. Student je pristupio pismenom ispitu, no ne moe doi pogledati rezultate, stoga
ne zna je li proao ili pao. Zamolio je svog prijatelja da to uini umjesto njega i da mu poalje
poruku po bratu. Meutim, svjestan je da obojica govore istinu samo s vjerojatnou 2/3. Kolika
je vjerojatnost da e student dobiti tonu informaciju?
Oznaimo A dogaaj koji znai da je student dobio tonu informaciju, Lp injenicu da je slagao
prijatelj, a Lb injenicu da je slagao brat. Dogaaje da su brat i prijatelj govorili istinu oznait
emo sa Ip i Ib .

35

Pojam i osnovna svojstva vjerojatnosti

Taj primjer moemo rijeiti tako da prebrojimo sve mogunosti i izraunamo vjerojatnosti presjeka
iz skupa
{Lp Lb , Ip Lb , Lp Ib , Ip Ib }.
Student moe uti tonu informaciju u dvama od navedenih sluajeva: Lp Lb i Ip Ib . Ako mu
brat i prijatelj lau neovisno jedan od drugoga, onda je
P (Lp Lb ) = P (Lp )P (Lb ) =
P (Ip Ib ) = P (Ip )P (Ib ) =

1
,
9

4
,
9

pa je vjerojatnost da uje tonu informaciju


P (A) = P (Lp Lb ) + P (Ip Ib ) =

5
.
9

Problem je jednostavan. Meutim, sljedei nain rjeavanja istog primjera sugerira princip koji
se moe generalno primijeniti te olakati raunanje u mnogo sloenijim situacijama.
Uoimo da prijatelj moe samo lagati ili rei istinu. Dakle, dogaaji se Lp i Ip meusobno isljuuju
(disjunktni su) i opisuju sve to se moe dogoditi u odnosu na informaciju koju prenosi prijatelj.
Takoer je
P (A) = P (A Ip ) + P (A Lp ) =
= P (A | Ip )P (Ip ) + P (A | Lp )P (Lp ) =
2 2
1 1
5
= + = .
3 3
3 3
9

Definicija 1.8. Konana ili prebrojiva familija dogaaja {Hi : i I}, I N, u


vjerojatnostnom prostoru (, F, P ) je potpun sustav dogaaja ako vrijedi:
1. P (Hi ) > 0 za sve i I,
2. Hi Hj = za sve i 6= j, i, j I,
S
3.
Hi = .
iI

Napomena 1.1. Potpun sustav dogaaja {Hi : i I}, I N, ini jednu particiju
prostora elementarnih dogaaja (slika 1.15). Prema tome, bilo koji dogaaj A
mogue je prikazati kao uniju presjeka dogaaja A s dogaajima Hi , I N, potpunog
sustava dogaaja, tj.
[
A=
(A Hi ),
iI

to prikazujemo slikom 1.16.

36

Uvjetna vjerojatnost. Nezavisnost

H1

...

H2

Hn

...

Slika 1.15: Potpun sustav dogaaja.

H1

H2

AH1 AH2

...

Hn

A
...

A Hn

...
...

Slika 1.16: Prikaz dogaaja A kao unije dogaaja A Hi , i I N.


Teorem 1.1 (Formula potpune vjerojatnosti). Neka je (, F, P ) vjerojatnosni
prostor i {Hi : i I}, I N, potpun sustav dogaaja na njemu. Tada za proizvoljan
dogaaj A F vrijedi
X
P (A) =
P (A | Hi )P (Hi ).
(1.3)
iI

Dokaz. Uoimo da dogaaj A F moemo predstaviti na sljedei nain:


[
A=
A Hi .
iI

Takoer uoimo da je {A Hi : i I}, I N, familija disjunktnih skupova. Prema


tome slijedi da je
X
X
P (A) =
P (A Hi ) =
P (A | Hi )P (Hi ).
iI

iI

Primjer 1.36. Ulini kockar ima dva novia od jedne kune: jedan je pravilno izraen (tzv.
standardni novi), a drugi s obiju strana ima slavuja (tj. nepravilno je izraen, tzv. nestandardni
novi). Vama je ponudio da na sluajan nain odaberete jedan novi koji e on baciti dva puta.
Kolika je vjerojatnost da je u oba bacanja odabrani novi pao na slavuja?
Oito traena vjerojatnost ovisi o tome koji smo od dvaju ponuenih novia odabrali. Dakle, kao
potpun sustav dogaaja promatramo familiju {H1 , H2 } gdje su dogaaji H1 i H2 definirani na

37

Pojam i osnovna svojstva vjerojatnosti


sljedei nain:
H1
H2

odabran je standardan novi,


odabran je nestandardan novi.

Budui da novi izvlaimo na sluajan nain, vjerojatnosti dogaaja H1 i H2 iznose


P (H1 ) = P (H2 ) =

1
.
2

Dogaaj iju vjerojatnost elimo izraunati jest


A u dvama je bacanjima odabrani novi oba puta pao na slavuja.
Iz definicije promatranog problema slijedi:
1
1 1
= , P (A | H2 ) = 1 1 = 1.
2 2
4
Prema formuli potpune vjerojatnosti slijedi traena vjerojatnost:


1 1
5
+1 = .
P (A) = P (H1 )P (A | H1 ) + P (H2 )P (A | H2 ) =
2 4
8
P (A | H1 ) =

Primjer 1.37 (Monty Hall problem 4 ). Pretpostavite da igra sudjeluje u igri u kojoj bira
jedna od triju vrata. Iza jednih je vrata automobil, a iza preostalih dvaju vrata nalaze se koze.
Npr. ako igra izabere prva vrata, voditelj igre (koji zna iza kojih vrata se nalazi automobil, a iza
kojih koze) otvorit e ona od preostalih dvaju vrata za koja zna da kriju kozu (slika 1.17).

(a) Poetni izbor

(b) Potez voditelja

Slika 1.17: Monty Hall problem

Nakon toga voditelj pita igraa: "elite li promjeniti va izbor vrata?". Mi se pitamo je li mudro
da igra promijeni izbor?
Promotrimo situaciju u kojoj se automobil nalazi iza drugih vrata, a igra je odabrao prva vrata
- to znai da e voditelj otvoriti trea vrata jer zna da se iza njih nalazi koza. Uvedimo sljedee
oznake za promatrane dogaaje:
Ai - automobil se nalazi iza i-tih vrata,
Ii - igra je izabrao i-ta vrata,
4 Monty

Hall problem prvi put postavljen je 1975. u pismu Stevea Selvina uredniku asopisa
American Statistician, a nazvan je prema voditelju amerikog kviza Lets make a deal.

38

Uvjetna vjerojatnost. Nezavisnost


Vi - voditelj je otvorio i-ta vrata,
Vi | Ij - ako je igra odabrao j-ta vrata, voditelj je otvorio i-ta vrata, i 6= j,

gdje su i, j {1, 2, 3}. Budui da igra ne zna iza kojih se vrata nalazi automobil, dogaaji Ai
i Ij nezavisni su za svaki izbor i i j. Odgovor na pitanje je li mudro za igraa promijeniti izbor
vrata moemo dobiti tako da izraunamo vjerojatnost da se automobil nalazi iza drugih vrata
ako je igra odabrao prva vrata i voditelj potom otvorio trea vrata. Tu vjerojatnost raunamo
primjenom definicije uvjetne vjerojatnosti:
P (V3 (A2 I1 ))
P (V3 | A2 I1 )P (A2 )
P (A2 |I1 V3 ) =
=
.
P (I1 V3 )
P (V3 | I1 )
Kako e u promatranoj situaciji voditelj otvoriti trea vrata jer zna da se iza njih nalazi koza,
slijedi da je P (V3 | A2 I1 ) = 1. Dogaaji A1 , A2 i A3 ine potpun sustav dogaaja i P (A1 ) =
P (A2 ) = P (A3 ) = 1/3. Preostaje izraunati P (V3 | I1 ). Prema formuli potpune vjerojatnosti
slijedi da je
P (V3 | I1 ) = PI1 (V3 ) =

3
X

PI1 (Ai )PI1 (V3 | Ai ) =

i=1

3
X

P (Ai | I1 )P (V3 | Ai I1 ) .

i=1

Kako su dogaaji Ai i Ii , i {1, 2, 3} nezavisni, slijedi da je


1
P (Ai | I1 ) = P (Ai ) = , i {1, 2, 3}.
3
Nadalje, zakljuujemo da je P (V3 | A1 I1 ) = 1/2, P (V3 | A2 I1 ) = 1 i P (V3 | A3 I1 ) = 0,
iz ega slijedi da je PI1 (V3 ) = P (V3 | I1 ) = 1/2. Sada lako slijedi da je P (A2 |I1 V3 ) = 2/3 te
zakljuujemo da je u opisanoj situaciji promjena izbora vrata mudar potez za igraa (slika 1.18).

(a) Vjerojatnosti bez sudjelovanja voditelja

(b) Vjerojatnosti sa sudjelovanjem voditelja

Slika 1.18: Vjerojatnosti ishoda u Monty Hall problemu


Analizirajte probleme vezane uz druge odabire vrata i smjetaje automobila.

U primjenama esto elemente potpunog sustava dogaaja {Hi : i I} F, I N,


tj. skupove Hi zovemo hipotezama. Ponekad je korisno razmiljati o raunanja
vjerojatnosti da je postavljena hipoteza istinita ako utvrdimo da se realizirao neki
dogaaj. Npr. ako u primjeru 1.36 utvrdimo da se u oba pokuaja okrenuo slavuj,
moemo se pitati kolika je vjerojatnost da je izvueni novi standardan, a kolika da
nije standardan. Za izraunavanje vjerojatnosi tog oblika moe se koristiti rezultat
poznat pod nazivom Bayesova formula.

39

Pojam i osnovna svojstva vjerojatnosti

Teorem 1.2. Neka je {Hi : i I}, I N, potpun sustav dogaaja na vjerojatnosnom prostoru (, F, P ) i neka je A F dogaaj s pozitivnom vjerojatnosti, tj.
P (A) > 0. Tada za svaki i I vrijedi:
P (Hi | A) =

P (Hi )P (A | Hi )
.
P (A)

(1.4)

Dokaz. Primjenom definicije uvjetne vjerojatnosti slijedi:


P (Hi | A) =

P (Hi A)
P (Hi )P (A | Hi )
=
.
P (A)
P (A)

Primjer 1.38. Za problem opisan u primjeru 1.36 pomou Bayesove formule izraunajmo vjerojatnosti P (H1 | A) i P (H2 | A), pri emu dogaaje H1 | A i H2 | A interpretiramo na sljedei
nain:
H1 | A

ako je u oba bacanja novi pao na slavuja,


odabran je standardan novi.
H2 | A

ako je u oba bacanja novi pao na slavuja,


odabran je nestandardan novi.
Primjenom Bayesove formule slijedi:
1 1

1
P (H1 | A) = 2 4 = ,
5
5
8

1
1
4
P (H2 | A) = 2
= .
5
5
8

Uoimo da je
P (H1 | A) + P (H2 | A) =

1.10

4
1
+ = 1.
5
5

Zadaci

Zadatak 1.1. Odredite skupove elementarnih dogaaja za sljedee sluajne pokuse:


a) uzastopno bacanje pravilno izraenog novia dva puta,
b) bacanje jedne pravilno izraene igrae kockice,
c) istovremeno bacanje dviju pravilno izraenih igraih kockica,
d) uzastopno bacanje pravilnom izraene igrae kockice n puta, n N,
e) sluajan izbor delegacije od dvaju lanova iz skupa osoba {A, B, C, D, E, F }.
Rjeenje:
a) = {(P, P ), (P, G), (G, P ), (G, G)},
b) = {1, 2, 3, 4, 5, 6},
c) = {(i, j) : i, j {1, . . . , 6}},
d) = {(i1 , . . . , in ) : i1 , . . . , in {1, . . . , 6}},
e) je familija svih dvolanih podskupova skupa {A, . . . , F }.

40

Zadaci

Zadatak 1.2. Odredite prostor elementarnih dogaaja sluajnog pokusa koji se sastoji od bacanja pravilno izraenog novia i pravilno izraene igrae kockice redom, pri emu se kao ishod
registriraju pojava pisma ili glave na noviu i broj na gornjoj strani kockice.
Rjeenje: = {(i, j) : i {P, G}, j {1, . . . , 6}}.

Zadatak 1.3. Odredite prostor elementarnih dogaaja sluajnog pokusa koji se sastoji od bacanja
pravilno izraenog novia i odabira jednog elementa skupa {A, B, C, D, E} redom.
Rjeenje: oznaimo 1 realizaciju pisma i 0 realizaciju glave pri bacanju novia; = {0, 1}
{A, B, C, D, E}.

Zadatak 1.4. Odredite prostor elementranih dogaaja sluajnog pokusa koji se sastoji redom od
bacanja pravilno izraene igrae kockice i pravilno izraenog tetraedra ije su strane numerirane
slovima a, b, c i d.
Rjeenje: = {(i, j) : i {1, . . . , 6}, j {a, b, c, d}}.

Zadatak 1.5. Sluajan pokus sastoji se od uzastopnog bacanja pravilno izraenog novia sve
dok ne padne pismo. Odredite prostor elementarnih dogaaja tog pokusa.
Rjeenje: oznaimo 1 realizaciju pisma i 0 realizaciju glave; = {1, (0, 1), (0, 0, 1), (0, 0, 0, 1), . . .}

Zadatak 1.6. U kutiji se nalaze etiri papiria numerirana brojevima 1, 2, 3 i 4. Iz kutije se na


sluajan nain izvlai jedan po jedan papiri i to:
a) bez vraanja,
b) s vraanjem,
sve dok se ne izvue papiri na kojemu je neparan broj. Ako se kao ishod tog sluajnog pokusa
registriraju izvueni brojevi, odredite prostor elementarnih dogaaja.
Rjeenje:
a) = {1, 3, (2, 1), (4, 1), (2, 3), (4, 3), (2, 4, 1), (2, 4, 3), (4, 2, 1), (4, 2, 3)},
b) = {1, 3, (2, 1), (2, 2, 1), (2, 2, 2, 1), . . .}.

Zadatak 1.7. Strijelac gaa metu 4 puta, pri emu se registriraju pogoci (oznaeni nulom) i
promaaji (oznaeni jedinicom). Odredite prostor elementarnih dogaaja i sljedee dogaaje:
a) A - gaanje je zapoelo promaajem,
b) B - rezultat je svih gaanja isti,
c) C - cilj je pogoen dva puta,
d) D - cilj je pogoen barem dva puta.

Pojam i osnovna svojstva vjerojatnosti

41

Rjeenje:
= {(0, 0, 0, 0), (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1), (1, 1, 0, 0),
(0, 1, 1, 0), (0, 0, 1, 1), (1, 0, 1, 0), (1, 0, 0, 1), (0, 1, 0, 1), (1, 1, 1, 0),
(0, 1, 1, 1), (1, 0, 1, 1), (1, 1, 0, 1), (1, 1, 1, 1)}.

Zadatak 1.8. Vitez Okruglog stola kralja Arthura, Sir Lancelot, odluio je strijelom gaati jabuku
kroz zlatni prsten u ast kraljice Guinevere. Sir Lancelot ima na raspolaganju samo luk i 4 strijele
i moe gaati jabuku sve dok je ne pogodi 2 puta ili ne potroi sve strijele (pogoci i promaaji ne
moraju se realizirati zaredom). Odredite prostor elementarnih dogaaja te sljedee dogaaje:
A - jabuka je promaena tono dva puta,
B - jabuka je promaena u posljednjem pokuaju.
Jesu li dogaaji A i B disjunktni?
Rjeenje:
= {(1, 1), (0, 1, 1), (1, 0, 1), (0, 0, 1, 1), (0, 1, 0, 1), (1, 0, 0, 1), (1, 0, 0, 0),
(0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1), (0, 0, 0, 0)},
A = {(1, 0, 0, 1), (0, 0, 1, 1), (0, 1, 0, 1)},
B = {(0, 0, 0, 0), (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0)}, A B = .

Zadatak 1.9. U natjecanju u streliarstvu lukom i strijelom Robin Hood gaa jednostavnu metu
(jedine mogue realizacije gaanja su ili pogodak ili promaaj) sve dok ju ili ne pogodi dva puta
ili ne promai tri puta (pogoci i promaaji ne moraju se realizirati zaredom). Odredite prostor
elementarnih dogaaja te sljedee dogaaje:
A - druga odapeta strelica promaila je metu,
B - prva i trea odapeta strelica pogodile su metu.
Jesu li dogaaji A i B disjunktni?
Rjeenje:
= {(1, 1), (1, 0, 1), (0, 1, 1), (0, 0, 0), (0, 0, 1, 1), (0, 0, 1, 0),
(1, 0, 0, 0), (0, 1, 0, 1), (1, 0, 0, 1), (0, 1, 0, 0)}, A = {(1, 0, 1), (0, 0, 0), (0, 0, 1, 1), (0, 0, 1, 0), (1, 0, 0, 0), (1, 0, 0, 1)},

B = {(1, 0, 1)},

B A.

Zadatak 1.10. Strijelac gaa cilj oblika krune mete polumjera R, pri emu se mjeri udaljenost
od mjesta pogotka do sredita mete. Odredite prostor elementarnih dogaaja.
Rjeenje: oznaimo O promaaj mete pri gaanju; = [0, R] {O}.

Zadatak 1.11. Neka je prostor elementarnih dogaaja nekog sluajnog pokusa, te neka su A,
B i C dogaaji (A, B, C ). Pomou dogaaja A, B i C izrazite sljedee dogaaje:
a) realizirao se samo dogaaj A,

42

Zadaci
b) realizirali su se dogaaji A i B,
c) realizirala su se sva tri dogaaja,
d) realizirao se barem jedan od dogaaja A, B i C,
e) realizirao se tono jedan od dogaaja A, B i C,
f) realizirali su se barem dva od dogaaja A, B i C,
g) realizirali su se tono dva od dogaaja A, B i C,
h) realizirali su se najvie dva od dogaaja A, B i C,
i) nije se realizirao niti jedan od dogaaja A, B i C.

Rjeenje:
a) A B c C c ,
b) A B,
c) A B C,
d) A B C,
e) (A B c C c ) (Ac B C c ) (Ac B c C),
f ) (A B) (A C) (B C),
g) (A B C c ) (A B c C) (Ac B C),
h) Ac B c C c ,
i) (A B C)c .

Zadatak 1.12. Meu studentima se okupljenima na predavanju sluajno bira jedan student.
Promatramo sljedee dogaaje:
A - student je mukog spola,
B - student je vegetarijanac,
C - student ivi u studentskom domu.
a) Opiite dogaaj A B C.
b) Kada e vrijediti A B C = A?
c) Kada e vrijediti C c B?
d) Kada e vrijediti Ac = B? Vrijedi li nuno ta jednakost ako su svi studenti mukog spola
vegetarijanci?
Rjeenje:
a) Student je mukog spola, vegetarijanac je i ivi u studentskom domu.
b) Vrijedi kad su svi studenti mukog spola vegetarijanci i ive u studentskom domu.
c) Vrijedi kad su svi studenti koji ne ive u studentskom domu vegetarijanci.
d) Ac = B vrijedi ako su svi studenti vegetarijanci enskog spola (B Ac ) i ako su sve
studentice vegetarijanci (Ac B). Ako su svi studenti mukog spola vegetarijanci (tj. ako
je A B) zakljuujemo sljedee:
- Ac B samo ako su svi studenti (bez obzira na spol) vegetarijanci,
- B Ac u opisanoj situaciji ne vrijedi,

Pojam i osnovna svojstva vjerojatnosti

43

to znai da ako je A B, skupovi Ac i B nisu jednaki.

Zadatak 1.13. Neka je (, F , P ) vjerojatnosni prostor. Ako su A, B F takvi da je P (A M


B) = 0, dokaite da je P (A) = P (B).
Uputa: A M B = (A \ B) (B \ A).

Zadatak 1.14. Neka je (, F , P ) vjerojatnosni prostor te neka za A, B F vrijedi da je P (A M


B) = 0 i P (A) = p. Izraunajte:
a) P (A B) i P (A B),
b) P (A \ B) i P (B \ A).

Zadatak 1.15. Dokaite da nezavisnost dogaaja A i B, A, B F , povlai nezavisnost


a) dogaaja A i B c ,
b) dogaaja Ac i B c .

Zadatak 1.16. Na raspolaganju nam je kutija u kojoj se nalazi 100 papiria numeriranih brojevima 1, 2, . . . , 100. Sluajan pokus sastoji se od izvlaenja jednog papiria iz kutije. Upotrebom
klasine definicije vjerojatnosti odredite vjerojatnosti sljedeih dogaaja:
a) A - izvueni je broj jednoznamenkast,
b) B - izvueni je broj dvoznamenkast,
c) C - izvueni je broj manji ili jednak broju k, k {1, 2, . . . , 100},
d) D - izvueni je broj strogo vei od k, k {1, 2, . . . , 100},
e) E - suma je znamenaka izvuenog broja 3,
f) F - umnoak je znamenaka izvuenog broja 6.
Rjeenje:
a) P (A) = 0.09,
d) P (D) = (100 k)/100,

b) P (B) = 0.9,
e) P (E) = 0.04,

c) P (C) = k/100,
f) P (F ) = 0.04.

Zadatak 1.17. Pravilno izraena igraa kockica baca se dva puta. Upotrebom klasine definicije
vjerojatnosti odredite vjerojatnosti sljedeih dogaaja:
a) A - pali su jednaki brojevi,
b) B - suma je brojeva koji su pali 8,
c) C - produkt je brojeva koji su pali 8,
d) D - suma brojeva koji su pali vea je od produkta brojeva koji su pali,
e) E - produkt brojeva koji su pali vei je od sume brojeva koji su pali.

44

Zadaci

Rjeenje:
a) P (A) = 1/6,
d) P (D) = 11/36,

b) P (B) = 5/36,
e) P (E) = 2/3.

c) P (C) = 1/18,

Zadatak 1.18. Pretpostavimo da u poiljci od ukupno 500 jabuka ima 2% prezrelih jabuka.
Kolika je vjerojatnost da sluajan uzorak od 20 jabuka uzet iz te poiljke sadri tono dvije
prezrele jabuke?
 

Rjeenje:

10
2

490
18

500
20

Zadatak 1.19 (Problem roendana). Kolika je vjerojatnost da izmeu n osoba, n 365,


barem dvije osobe imaju roendan istog datuma? Pretpostavljamo da svaka od n osoba moe biti
roena s jednakom vjerojatnou bilo kojeg dana u godini i zanemarujemo postojanje prijestupnih
godina.
Rjeenje: 1

364 (366 n)
.
365n1

Zadatak 1.20. U kutiji se nalazi a crvenih i b zelenih kuglica (a 2, b 2). Iz kutije na sluajan
nain istovremeno izvadimo dvije kuglice. Definirajmo sljedee dogaaje:
A
B

izvuene su kuglice iste boje,


izvuene su kuglice razliitih boja.

Koji je od dogaaja A i B vjerojatniji?


 
a
+ 2b
ab
2
 , P (B) = 
.
Rjeenje: P (A) = 
a+b
2

a+b
2

Zadatak 1.21. Pravilno izraen novi bacamo 10 puta zaredom. Kolika je vjerojatnost da se
pismo realizira tono tri puta?
Rjeenje:

120
.
210

Zadatak 1.22. Pravilno izraenu igrau kockicu bacamo 10 puta. Kolika je vjerojatnost da se
kao rezultat bacanja brojevi 1, 2, 3, 4, 5, 6 pojave redom 2, 3, 1, 1, 1, 2 puta?
Rjeenje:

10!
.
4 611

Zadatak 1.23. U autobusu se nalazi 15 ljudi. Do kraja putovanja ostale su 4 stanice. Kolika je
vjerojatnost da svi putnici izau na istoj stanici?
Rjeenje: 414 .

45

Pojam i osnovna svojstva vjerojatnosti

Zadatak 1.24. Pretpostavimo da n ljudi na sluajan nain sjeda za okrugli stol. Izraunajte
vjerojatnost da e dva unaprijed odabrana ovjeka sjediti zajedno.
Rjeenje:

2
.
n1

Zadatak 1.25. m mukaraca i n ena rasporeuju se na sluajan nain u kazalitu na (m + n)


sjedala sloenih u redu. Kolika je vjerojatnost da sve ene sjede zajedno (tj. jedna do druge)?
Rjeenje:

n!(m + 1)!
m+1
.
= 
m+n
(m + n)!
n

Zadatak 1.26. Sveanj od 52 karte podijeli se na dva jednakobrojna dijela. Odredite vjerojatnost
sljedeih dogaaja:
a) A - u svakom dijelu nalaze se po dva kralja,
b) B - u jednom dijelu ne nalazi se niti jedan kralj,
c) C - u jednom dijelu nalazi se jedan, a u drugom dijelu tri kralja.
 

48
24

4
2

Rjeenje: P (A) =

52
26

 
2 48
26
P (B) =   ,

 
8 48
25
P (C) =   .

52
26

52
26

Zadatak 1.27. Iz pila od 52 karte na sluajan nain biramo 8 karata. Izraunajte vjerojatnost
da su izvuena
a) tri asa,
b) tri kralja,
c) tri asa ili tri kralja.
 

48
5

4
3

Rjeenje: a)

52
8

2
,

c)

 
4
3

48
5




52
8

 2 
4
3

44
2

Zadatak 1.28. Student je doao na ispit znajui odgovore na 90 od 100 pitanja. Izvlai se pet
pitanja.
a) Kolika je vjerojatnost da e student znati odgovore na svih pet pitanja?
b) Kolika je vjerojatnost da e student znati odgovore na barem tri od pet izvuenih pitanja?

Rjeenje: a) 

90
5

100
5

 0.584,

b)

90
5

+ 10

90
4

100
5

+


10
2



90
3


0.99.

Zadatak 1.29. Iz eira u kojem se nalazi n kuglica na sluajan nain izaberemo nekoliko kuglica.
Kolika je vjerojatnost da smo izvukli paran broj kuglica?

46

Zadaci

Rjeenje:

2n1 1
.
2n 1

Zadatak 1.30 (De Mereov paradoks). Bacamo tri razliite pravilno izraene igrae kockice.
Zanima nas vjerojatnost sljedeih dogaaja:
(a) A - zbroj brojeva na svim trima kockicama jednak je 11,
(b) B - zbroj brojeva na svim trima kockicama jednak je 12.
27
,
63

Rjeenje: P (A) =

P (B) =

25
.
63

Zadatak 1.31. Standardni sveanj od 52 karte sastoji se od 26 crvenih karata (13 hercova i 13
karo karata) i 26 crnih karata (13 pikova i 13 trefova). Na sluajan nain iz pila biramo 11 karata.
Odredite prostor elementarnih dogaaja i izraunajte vjerojatnosti sljedeih dogaaja:
a) A - izvuena je barem jedna crvena karta,
b) B - izvueno je tono pet crnih karata ili tono sedam hercova.
26
P

Rjeenje: P (A) =

k=1



26
k

26

 11k

52
11

P (B) =



26
5

   
39
+ 13
4
7
.

26
6

52
11

Zadatak 1.32. U eiru se nalazi 100 listia s oznakama od 00 do 99. Ako je xy (ne radi se o
umnoku x y) oznaka na sluajno odabranom listiu, odredite vjerojatnosti dogaaja A = {xy :
x y < 5}, B = {xy : x + y = 11} te dogaaja C = {xy : xy > 60} pod uvjetom da se realizirao
dogaaj D = {xy : y > 7}.
Rjeenje: P (A) = 27/100, P (B) = 2/25, P (C|D) = 2/9.

Zadatak 1.33. Pravilno izraen novi bacamo n puta. Odredite vjerojatnost da se pismo realizira u tono m bacanja, m n.
n
Rjeenje:

2n

Zadatak 1.34. Odredite vjerojatnost da roendani 12 nasumino odabranih ljudi padnu u razliite mjesece u godini?
Rjeenje:

11!
.
1211

Zadatak 1.35. U kutiji se nalazi (n + m) sreki od kojih n dobiva. Na sluajan nain odabere
se k sreki. Kolika je vjerojatnost da meu njima bude j dobitnih?
n m 
Rjeenje:

kj
n+m
k

Zadatak 1.36. Odredite vjerojatnost da je sluajno odabrana toka iz segmenta [0, 1] racionalna?

Pojam i osnovna svojstva vjerojatnosti

47

Rjeenje: vjerojatnost odabira racionalne toke iz segmenta [0, 1] jest nula, tj. sluajno e odabrana
toka iz segmenta [0, 1] gotovo sigurno biti iracionalna.

Zadatak 1.37. Za fiksiranu toku c [a, b] i sluajno odabranu toku x [a, b] odredite vjerojatnosti sljedeih dogaaja:
a) x c,
b) x < c,
c) x = c,
d) x je blie toki a nego toki b.
Rjeenje:

a)

ca
,
ba

b)

ca
,
ba

c) 0,

d) 0.5.

Zadatak 1.38. Neka su x i y dva sluajno odabrana broja iz segmenta [0, 1]. Odredite vjerojatnost
da za njih vrijedi:
a) x > y,
b) x + y < 3/2,
c) x = y,
d) xy 2/9 i x + y < 1.
Rjeenje:

a) 1/2,

b) 7/8,

c) 0,

d)

1
2
+ ln 2.
3
9

Zadatak 1.39. Neka su x i y dva sluajno odabrana broja iz segmenta [2, 2]. Odredite vjerojatnost da za njih vrijedi y x2 i x < 12 y + 1.

Zadatak 1.40. Dva broda A i B trebaju stii u istu luku. Njihova su vremena dolaska u luku
sluajna, meusobno nezavisna i jednako vjerojatna tijekom 24 sata. Kad brod A stigne u luku,
on ostaje u njoj 1 sat, a brod B 2 sata. Budui da luka ne moe odjednom primiti dva broda,
odredite vjerojatnost da jedan od brodova eka na oslobaanje luke dok drugi brod ne ode.
Rjeenje: 0.121.

Zadatak 1.41. Na krunici polumjera r = 2 cm na sluajan nain biramo dvije toke. Kolika
je vjerojatnost da e udaljenost meu tim tokama mjerena duinski (ne po krunici) biti najvie
2 cm?
Rjeenje: 1/3.

Zadatak 1.42. Na krunici polumjera r na sluajan nain odabrane su tri toke: A, B i C. Kolika
je vjerojatnost da je krunici upisan trokut ABC iljastokutan?

48

Zadaci

Rjeenje: 1/4. Pretpostavite da je poloaj toke A na krunici fiksan, promatrajte duljine krunih
lukova AB i BC te tako odreen prostor elementarnih dogaaja skicirajte u Kartezijevom koordinatnom
sustavu.

Zadatak 1.43. Izraunajte vjerojatnost da korijeni kvadratne jednadbe x2 + px + q = 0 budu


realni, ako se koeficijenti p i q izabiru na sluajan nain iz segmenta [1, 1].
Rjeenje: 13/24.

Zadatak 1.44. U pravokutniku kojemu se stranice odnose kao 1 : 2 na sluajan nain biramo
jednu toku. Kolika je vjerojatnost da je toka pala:
a) na dijagonalu pravokutnika,
b) blie duljoj stranici pravokutnika?
Rjeenje:

a) 0,

b) 3/4.

Zadatak 1.45. Na duini AB duljine a na sluajan nain izabrane su toke M i N . Odredite


vjerojatnost da je toka M blie toki A nego toki N.
Rjeenje: 1/4.

Zadatak 1.46. Kolika je vjerojatnost da sluajno odabrana toka u kvadratu bude blia jednoj
od dijagonala nego stranicama kvadrata?

2
.
Rjeenje:
1+ 2
Zadatak 1.47. Vjerojatnost da se knjiga nalazi u knjinici iznosi p. Ako je knjiga u knjinici,
nalazi se na jednoj od n polica s jednakom vjerojatnou (za svaku od tih n polica). Pregledano
je m polica, m < n, i knjiga nije naena. Kolika je vjerojatnost da je knjiga ipak u knjinici?
Rjeenje:

(n m)p
.
n mp

Zadatak 1.48. Pretpostavimo da na sluajan nain odabiremo realne brojeve x [0, 1] i y [0, 2].
Kolika je vjerojatnost da je njihov zbroj vei od dva, a produkt manji od jedan?
Rjeenje:

1
1
ln 2 .
2
4

Zadatak 1.49. Toka A bira se na sluajan nain unutar jednakostraninog trokuta sa stranicom
duljine 3 cm. Kolika je vjerojatnost da udaljenost toke A od bilo kojeg vrha trokuta bude vea
od 1 cm?
Rjeenje:

2
.
9 3

Pojam i osnovna svojstva vjerojatnosti

49

Zadatak 1.50. Zadano nam je pet duina ije su duljine 2 cm, 4 cm, 5 cm, 7 cm i 9 cm. Kolika
je vjerojatnost da se od tri sluajno odabrane duine moe konstruirati trokut?
Rjeenje: 2/5.

Zadatak 1.51. Toka A bira se na sluajan nain unutar raznostraninog pravokutnog trokuta.
Kolika je vjerojatnost da je odabrana toka A blia hipotenuzi nego katetama?
Rjeenje: duljinu hipotenuze oznaimo c, a duljine kateta a i b; tada je traena vjerojatnost

c
.
a+b+c

Zadatak 1.52. Trenutak u kojem e neki signal stii do prijemnika sluajno je odabrani trenutak
iz intervala [0, T ]. Prijemnik nee registrirati drugi signal ako je razlika izmeu dva uzastopna
signala manja od , < T . Odredite vjerojatnost da prijemnik nee registrirati drugi signal.
Rjeenje:

(2T )
.
T2

Zadatak 1.53 (Buffonov problem). Ravnina je podijeljena paralelnim pravcima koji su jedan
od drugog udaljeni za 2a. Na tu se ravninu na sluajan nain baca igla duljine 2l, l < a. Odredite
vjerojatnost da igla sijee neki od pravaca.
Rjeenje:

2l
.
a

Zadatak 1.54. Sluajan pokus sastoji se od bacanja pravilno izraenog novia tri puta za redom.
elimo nai vjerojatnost dogaaja A uz dani dogaaj B kada su A i B sljedei dogaaji:
A - glava je pala vie puta nego pismo,
B - prvo je palo pismo.
Rjeenje: P (A|B) = 0.25.

Zadatak 1.55. Iz kutije u kojoj se nalazi m crvenih i n zelenih kuglica na sluajan nain izvueno
je k kuglica. Uz pretpostavku da su sve izvuene kuglice iste boje, kolika je vjerojatnost da su sve
zelene?
n
Rjeenje:

k
m
k

n .
k

Zadatak 1.56. Sluajan pokus sastoji se od sluajnog odabira obitelji koja ima dvoje djece (uz
pretpostavku da su vjerojatnosti roenja kerke i sina jednake (to priblino odgovara stvarnoj
situaciji) te da znamo redoslijed raanja djece u obitelji). Treba provjeriti jesu li sljedei dogaaji
nezavisni:
A - u obitelji je barem jedna kerka,
B - u obitelji su jedna kerka i jedan sin.

50

Zadaci

Rjeenje: A i B nisu nezavisni dogaaji.

Zadatak 1.57. Cilj se gaa iz tri topa. Topovi pogaaju cilj nezavisno jedan od drugoga s
vjerojatnou 0.4. Ako jedan top pogodi cilj unitava ga s vjerojatnou 0.3, ako ga pogode dva
topa unitavaju ga s vjerojatnou 0.7, a ako ga pogode tri topa unitavaju ga s vjerojatnou 0.9.
Naite vjerojatnost unitenja cilja.
Rjeenje: 0.3888.

Zadatak 1.58. Imamo dvije kutije. U prvoj se nalazi a bijelih i b crnih kuglica, a u drugoj c
bijelih i d crnih kuglica. Iz prve kutije na sluajan nain biramo k kuglica, a iz druge m kuglica.
Tih (k + m) kuglica izmijeamo i stavimo u treu kutiju.
a) Iz tree kutije na sluajan nain izvuemo jednu kuglicu. Kolika je vjerojatnost da ona
bude bijele boje?
b) Iz tree kutije na sluajan nain izvuemo tri kuglice. Kolika je vjerojatnost da je barem
jedna kuglica bijele boje?
Rjeenje: 

1
cm
ak
a)
+
k+m a+b
c+d
b) Pomou formule potpune vjerojatnosti odrediti vjerojatnost suprotnog dogaaja.

Zadatak 1.59. Na usmenom ispitu iz Uvoda u vjerojatnost i statistiku ponueno je 10 pitanja


od kojih je student nauio njih n, 0 n 10. Student e poloiti ispit ako bude tono odgovorio
na dva sluajno odabrana pitanja ili ako tono odgovori na jedno od njih te na tree, dodatno
postavljeno pitanje. Na koliko pitanja student treba znati tono odgovoriti da bi s vjerojatnou
veom od 0.8 poloio ispit?
Rjeenje: student treba znati tono odgovoriti na bar sedam pitanja.

Zadatak 1.60. Ptica slijee u sluajno izabrano gnijezdo od ukupno tri gnijezda koja su joj na
raspolaganju. Svako gnijezdo sadri dva jaja i to: u prvom gnijezdu su oba jaja zdrava, u drugom
je jedno zdravo i jedan muak, a u treem su oba jaja muka. Naite vjerojatnost da ptica sjedi
na muku. Ako je sjela na muak, kolika je vjerojatnost da sjedi u drugom gnijezdu?
Rjeenje: ako je sjela na muak, vjerojatnost da sjedi na drugom jajetu jest 1/3.

Zadatak 1.61. Neki izvor emitira poruke koje se sastoje od znakova 0 i 1. Vjerojatnost emitiranja
znaka 1 jest 0.6, a vjerojatnost emitiranja znaka 0 jest 0.4. Na izlazu se iz kanala 10% znakova
pogreno interpretira. Ako je primljena poruka 101, kolika je vjerojatnost da je ona i poslana?
Rjeenje: 0.743.

Pojam i osnovna svojstva vjerojatnosti

51

Zadatak 1.62. Svi studenti iz grupe koja se sastoji od a odlinih, b vrlo dobrih i c dobrih
studenata prijavili su ispit iz Uvoda u vjerojatnost i statistiku. Odlian student na ispitu moe
dobiti samo odlinu ocjenu, vrlo dobar student s jednakom vjerojatnou moe dobiti odlinu
ili vrlo dobru ocjenu, a dobar student s jednakom vjerojatnou moe dobiti vrlo dobru, dobru
ili dovoljnu ocjenu. Na ispitu se na sluajan nain proziva jedan student iz grupe. Kolika je
vjerojatnost da on dobije odlinu ili vrlo dobru ocjenu?
Rjeenje:

3a + 3b + c
.
3(a + b + c)

Zadatak 1.63. Iz eira u kojem se nalazi n kuglica na sluajan nain izvlaimo jednu kuglicu.
a) Kolika je vjerojatnost da e ta kuglica biti bijela ako su sve pretpostavke o prethodnom
broju bijelih kuglica jednako vjerojatne?
b) Ako je izvuena bijela kuglica, kolika je vjerojatnost da se sve kuglice u eiru bijele?
Rjeenje:

a) 1/2;

b) 2/(n + 1).

Zadatak 1.64. U mranoj prostoriji nalaze se etiri svjetiljke i sedam arulja. Od etiri svjetiljke
ispravne su dvije, a od sedam arulja ispravne su etiri. Ako na sluajan nain odaberemo etiri
arulje i stavimo ih u svjetiljke, kolika je vjerojatnost da e prostoriju obasjati svjetlo?
Rjeenje: 6/7.

Zadatak 1.65. Dane su nam dvije kutije


jedna slomljena, a u drugoj kutiji 10 ibica
prve kutije i prebacimo ju u drugu kutiju.
jednu ibicu. Kolika je vjerojatnost da smo

ibica. U prvoj kutiji nalazi se 12 ibica od kojih je


od kojih je jedna slomljena. Uzimamo jednu ibicu iz
Nakon toga iz druge kutije na sluajan nain biramo
izabrali slomljenu ibicu?

Rjeenje: 13/132.

Zadatak 1.66. Na raspolaganju imamo dvije kutije: u prvoj se nalaze 2 bijele i 4 plave, a u drugoj
3 bijele i 2 plave kuglice. Iz prve kutije na sluajan nain, nezavisno jednu od druge, odaberemo
dvije kuglice i prebacimo ih u drugu kutiju. Kolika je vjerojatnost da potom odabrana kuglica iz
druge kutije bude bijele boje?
Rjeenje: 11/21.

Zadatak 1.67. Iz eira u kojem se nalazi n kuglica izvlaimo nasumino jednu kuglicu. Kolika
je vjerojatnost da e ta kuglica biti bijela, ako su sve pretpostavke o prethodnom broju kuglica
jednako vjerojatne? Nakon to je izvuena bijela kuglica, kolika je vjerojatnost da su sve kuglice
u eiru bijele?
Rjeenje:

2
.
n+1

52

Zadaci

Zadatak 1.68. U tri kutije nalaze se ute i zelene kuglice. U prvoj kutiji nalazi se 5 utih i 3
zelene kuglice, u drugoj kutiji nalaze se 4 ute i 4 zelene kuglice, a u treoj 3 ute i 5 zelenih
kuglica. Na sluajan nain iz svake kutije izaberemo po etiri kuglice i stavimo u etvrtu kutiju.
Zatim iz etvrte kutije na sluajan nain uzmemo jednu kuglicu. Kolika je vjerojatnost da je ta
kuglica zelene boje?

Zadatak 1.69. U eiru se nalaze 4 bijele kuglice. Tri se puta na sluajan nain izvlai jedna
kuglica i zamjenjuje crnom kuglicom. Potom je na sluajan nain izvuena jedna kuglica i vidjelo
se da je bijela. Koliko iznosi vjerojatnost da su u eiru tono dvije crne kuglice nakon opisanih
zamjena?

Zadatak 1.70. Sluajan pokus zamiljen je na sljedei nain:


iz skupa S = {1, 6, 7, 8, 9} na sluajan nain odaberemo jedan broj,
od preostalih elemenata skupa S sluajno odaberemo jo jedan broj.
Kolika je vjerojatnost da je drugi izabrani broj neparan?

Zadatak 1.71. etiri strijelca gaaju metu (pretpostavljamo da je meta jednostavna, tj. da su
mogue realizacije gaanja ili pogodak ili promaaj). Vjerojatnosti pogotka za pojedine strijelce
iznose redom 0.6, 0.7, 0.8, 0.9.
a) Izraunajte vjerojatnost da barem tri strijelca pogode metu.
b) Ako je meta pogoena s tri hica, izraunajte vjerojatnost da su ju pogodili prvi i drugi
strijelac.

Zadatak 1.72. Grupa od 10 studenata dola je na ispit na kojemu svaki student odgovara na tri
sluajno odabrana pitanja od 20 ponuenih. Tri su studenta ispit pripremila odlino, etvorica
dobro, dvojica dovoljno i jedan loe. Odlino pripremljen student zna odgovore na svih 20 pitanja,
dobro pripremljen student na 16, dovoljno pripremljen student na 10 i loe pripremljen student
na 5 pitanja. Kolika je vjerojatnost da je sluajno odabrani student tono odgovorio na sva tri
postavljena pitanja?

Zadatak 1.73. Pokaite da sljedeim realnim funkcijama realne varijable moemo definirati vjerojatnost na R:
(
3
(1 x2 ) , x [1, 1]
4
a) f (x) =
.
0
, x 6= [1, 1]
(
ex , x (0, )
b) f (x) =
.
0
, x (, 0]
c) Koristei funkcije iz zadataka a) i b) odredite vjerojatnost dogaaja
A = {x R : 1/2 < x 1/2} = (1/2, 1/2].

Pojam i osnovna svojstva vjerojatnosti

53

Rjeenje: obje su funkcije su nenegativne i normirane, pa pomou njih moemo definirati vjerojatnost
na R. Vjerojatnost dogaaja A je: a) P (A) = 11/16, b) P (A) = 1 e/2 .

Zadatak 1.74. Pokaite da funkcijom f : R2 R definiranom formulom


(
3
(x2 + y) , (x, y) [1, 1] [0, 1]
5
f (x, y) =
0
, (x, y) 6= [1, 1] [0, 1]
moemo definirati vjerojatnost na R2 . Izraunajte vjerojatnost da sluajno odabrana toka iz R2
pripada pravokutniku
A = [0, 1] [0, 1/2].
Rjeenje: funkcija f nenegativna je i normirana, stoga pomou nje moemo definirati vjerojatnost na
R2 . Vjerojatnost dogaaja A jest P (A) = 7/40.

Poglavlje 2

Sluajna varijabla
Prouavanje cijelog prostora elementarnih dogaaja nekog sluajnog pokusa i vjerojatnosti zadane na njemu moe biti vrlo sloen zadatak. Skupovi elementarnih
dogaaja mogu sadravati razne objekte, npr. brojeve, ureene parove, ureene
n-torke, nizove brojeva, slova, nizove slova, boje, itd. Meutim, vrlo se esto na
interes za sluajan pokus svodi samo na prouavanje jedne ili nekoliko karakteristika
koje moemo opisati (ili kodirati) numeriki.
Primjer 2.1. Ispit se sastoji od 10 pitanja viestrukog izbora. Ispit je za kandidata sluajan pokus. Prostor elementarnih dogaaja takvog pokusa jest skup ureenih desetorki s oznakama koje se
koriste za "toan odgovor", odnosno "netoan odgovor". Meutim, prilikom polaganja ispita kandidata prvenstveno zanima koliko e ukupno imati tonih odgovora, a ne i koji e po redu odgovor
biti toan. Dakle, njega zanima modeliranje na skupu moguih ishoda {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
Osim toga, zanima ga i koliku e ocjenu postii, to znai da ga zanima i skup moguih ishoda
{1, 2, 3, 4, 5}.

Da bismo za dani sluajni pokus analizirali i modelirali pojedinane sluajne karakteristike ili vie njih, u ovom poglavlju definirat emo pojam sluajne varijable, a u
sljedeem pojam sluajnog vektora.

2.1

Diskretna sluajna varijabla

Kao to je ve reeno, diskretan vjerojatnosni prostor karakteriziran je injenicom


da ima konano ili prebrojivo mnogo elemenata. U poglavlju 1.6 oznaili smo ga
= {i : i I }, I N. Pridruena je -algebra tada tono jednaka partitivnom
skupu od , tj. F = P(), a vjerojatnost se moe odrediti zadavanjem vrijednosti
samo na jednolanim podskupovima od . Ako nije diskretan (primjerice = R),
nije mogue definirati vjerojatnost samo zadavanjem vrijednosti na elementima od
55

56

Sluajna varijabla

. Zbog toga emo i izuavanje sluajne varijable razdvojiti na takozvane diskretne i


apsolutno neprekidne sluajne varijable. Pri tome emo diskretne sluajne varijable
prirodno vezati uz diskretan vjerojatnosni prostor (iako to nije openito nuno).
Definicija 2.1. Neka je dan diskretan vjerojatnosni prostor (, P(), P ). Svaku
funkciju X : R zvat emo diskretna sluajna varijabla.

Prostor
elementarnih
dogaaja

Slika 2.1: Prikaz djelovanja sluajne varijable.


Primjer 2.2. Neka se na skladitu nalaze etiri istovrsna proizvoda. Vjerojatnost prodaje jednog
od ponuenih proizvoda u jednom danu iznosi 1/2. Broj je prodanih proizvoda u jednom danu
jedna sluajna varijabla. Oznaimo je sa X.
Uoimo da se u tom primjeru sastoji od ureenih etvorki nula i jedinica koje oznaavaju je li
taj dan pojedini proizvod prodan ili ne, tj. = {(i, j, k, l) : i, j, k, l {0, 1}}. Vjerojatnost svakog
elementa iz iznosi 1/24 . Meutim, nama je zanimljivo koliko je proizvoda prodano, ali nam
nije bitno o kojim se proizvodima radi. Zato koristimo sluajnu varijablu
X : R, X (i, j, k, l) = i + j + k + l.
Skup {(i, j, k, l) : X(i, j, k, l) = 2} predstavlja mogue ishode iz kod kojih su prodana tono
2 proizvoda. Obzirom da nas zapravo zanima vjerojatnost realizacije takvih skupova, a njihovo je
oznaavanje komplicirano, ovdje emo koristiti oznaku za skup:
{(i, j, k, l) : X (i, j, k, l) = 2} = {X = 2},
a za vjerojatnost
P ({(i, j, k, l) : X(i, j, k, l) = 2}) = P {X = 2}.

Oznake analogne onima iz primjera 2.2 koristimo openito kad raunamo sa sluajnim varijablama. Tako emo za A R uvesti sljedeu oznaku:
{X A} = { : X() A},
a za vjerojatnost tog skupa
P {X A} = P ({ : X() A}) .
Primjerice, za dani x R koristimo oznaku
{ : X() = x} = {X = x}.

57

Diskretna sluajna varijabla

Primjer 2.3. Vratimo se primjeru 2.2. Skup je svih moguih realizacija sluajne varijable X
koja broji prodane proizvode skup {0, 1, 2, 3, 4}.
Naime, vjerojatnosna svojstva te sluajne varijable odreena su ako ulogu prostora elementarnih
dogaaja preuzme R(X) = {0, 1, 2, 3, 4}. Na njemu vjerojatnost zadajemo nizom brojeva:
p0 = P {X = 0},
p1 = P {X = 1},
p2 = P {X = 2},
p3 = P {X = 3},
p4 = P {X = 4}.
Prebrojavanjam elementarnih dogaaja iz (primjer 2.2) te primjenom aditivnosti vjerojatnosti
slijedi:
1
1
3
1
1
p0 =
,
p1 = ,
p2 = ,
p3 = ,
p4 =
.
16
4
8
4
16
Radi preglednosti emo tu diskretnu sluajnu varijablu zapisati pomou sljedee tablice:

0 1 2 3 4
X = 1 1 3 1 1 .
16 4 8 4 16

Pregledan zapis sluajne varijable prezentiran u prethodnom primjeru koristit emo


i openito. Dakle, ako je X dana diskretna sluajna varijabla na vjerojatnosnom
prostoru (, P(), P ), oznaimo skup svih vrijednosti koje ona moe primiti kao
R(X) = {xi , i I}, I N, a pripadne vjerojatnosti nizom brojeva (pi , i I) za
koji vrijedi:
pi = P ({ : X() = xi }) = P {X = xi },

i I.

Bez smanjenja openitosti, u nastavku razmatranja pretpostavit emo da je I = N.


Sluajnu varijablu X prikazujemo u obliku tablice:
X=

x1 x2 x3 xn
p1 p2 p3 pn

!
(2.1)

i taj prikaz zovemo zakon razdiobe, tablica distribucije ili, krae, distribucija
sluajne varijable X.
Dakle, za svaku diskretnu sluajnu varijablu moemo istaknuti dva bitna skupa
brojeva. Jedan ine sve vrijednosti koje sluajna varijabla X moe primiti, tj. skup
R(X) = {xi : i N} kojega zovemo slika sluajne varijable, a drugi je niz pripadnih
vjerojatnosti, tj. (pi , i N) takav da vrijedi pi = P {X = xi }, i N.
Uoimo da za elemente od R(X) vrijedi xi 6= xj za i 6= j s obzirom da je to skup,
dok u nizu (pi , i N) moe biti istih elemenata, ali on ima druga dva bitna svojstva:

58

Sluajna varijabla
1. 0 pi 1 za svaki i N,
2.

pi = 1.

i=1

Zaista, budui da je X sluajna varijabla koja prima vrijednosti iz skupa R(X), to


je P {X R(X)} = P () = 1, pa iz svojstava vjerojatnosti slijedi:
0 pi = P {X = xi } 1.
Osim toga je

pi =

i=1

P {X = xi } = P

i=1

!
{X = xi }

= P {X R(X)} = 1.

i=1

Koristei rezultate poglavlja 1.6 znamo da je pomou niza realnih brojeva (pi , i N)
koji zadovoljava svojstva
1. 0 pi 1 za svaki i N,
2.

pi = 1

i=1

dobro definirana vjerojatnost na diskretnom vjerojatnosnom prostoru koji za prostor elementarnih dogaaja ima skup R(X) = {xi , i N}.
Ako brojevi pi ujedno zadovoljavaju svojstvo
P {X = xi } = pi ,

i N,

vjerojatnost definiranu na R(X) = {xi , i N} oznaavat emo PX , a novonastali vjerojatnosni prostor (R(X), P(R(X)), PX ) zovemo vjerojatnosni prostor
induciran sluajnom varijablom X.
Primjer 2.4. Zbroj brojeva koji su se okrenuli prilikom bacanja dviju pravilno izraenih igraih
kockica modeliran je diskretnom sluajnom varijablom sa sljedeom tablicom distribucije:

2 3 4 5 6 7 8 9 10 11 12

X=
1 2 3 4 5 6 5 4 3 2 1 .
36 36 36 36 36 36 36 36 36 36 36
Ako nas zanima vjerojatnost dogaaja
A - zbroj je brojeva na kockicama je manji od 6,
za izraun emo iskoristiti prethodnu tablicu distribucije:
P (A) = P {X < 6} = P { : X() < 6} =

1
2
3
4
5
+
+
+
=
.
36
36
36
36
18

59

Diskretna sluajna varijabla

Openito, za raunanje vjerojatnosti skupova (dogaaja) oblika {X A}, gdje je


A R, moemo iskoristiti tablicu distribucije sluajne varijable X (tablica 2.1) na
sljedei nain:
X
P {X A} =
pi .
xi A

Grafiki prikaz distribucije


Distribuciju diskretne sluajne varijable koja ima konaan skup moguih vrijednosti
R(X) i zadana je tablicom distribucije
!
x1 x2 . . . xn
X=
p1 p2 . . . pn
grafiki prikazujemo grafom funkcije definirane na R(X) = {x1 , . . . , xn } s vrijednostima iz skupa {p1 , . . . , pn } koja svakom elementu xi R(X) pridruuje pripadnu
vjerojatnost pi = P {X = xi }, i {1, . . . , n}. Oito se graf te funkcije sastoji od
toaka (xi , pi ).
Takoer, za grafiki prikaz distribucije takve diskretne sluajne varijable esto koristimo stupasti dijagram. Stupasti dijagram sastoji se od niza pravokutnika
iste irine, svaki za jednu vrijednost xi R(X) visine pi .
Primjer 2.5. Na temelju tablice distribucije diskretne sluajne varijable definirane u primjeru
2.2 moemo napraviti grafike prikaze njezine distribucije. Na slici 2.2 prikazan je graf, a na slici
2.3 stupasti dijagram distribucije te sluajne varijable.

y
1
2

1
4
1
18
16

Slika 2.2: Graf distribucije diskretne sluajne varijable iz primjera 2.2.

60

Sluajna varijabla
y
1
2

0.5
0.4

0.3

4
1

0.2
1

0.1

16

1
16

Slika 2.3: Stupasti dijagram distribucije diskretne sluajne varijable iz primjera 2.2.

2.2

Neprekidna sluajna varijabla

Ukoliko prostor elementarnih dogaaja nije diskretan skup, funkcije definirane na


njemu ne moraju nuno imati prebrojiv skup svih moguih vrijednosti, iako to nije
iskljueno. Ako je za neku funkciju X, definiranu na koji nije diskretan, skup
R(X) diskretan skup1 , moi emo napraviti konstrukciju diskretnog vjerojatnosnog
prostora induciranog tom sluajnom varijablom, tj. prouavanje takve sluajne varijable svest emo na diskretan sluaj. Meutim, ako prostor elementarnih dogaaja
sadri neki interval, esto nas zanimaju i sluajne karakteristike s neprebrojivim
skupom vrijednosti.
Primjer 2.6. Pretpostavimo da promenadom uz rijeku Dravu elimo proetati od Tvre do hotela
Osijek. Taj put dug je oko 2 km. Zbog razliite brzine hoda i ostalih subjektivnih utjecaja na
trajanje etnje, jasno je da put koji osoba pritom prijee u prvih 5 minuta moemo modelirati kao
sluajnu karakteristiku s neprebrojivim skupom moguih ishoda [0, 2].
Primjer 2.7. Praenje vremena koje protekne od dana stavljanja stroja u upotrebu do prvog
kvara jedno je promatranje sa sluajnim ishodima. Pretpostavimo da dobit ostvarena na tom
stroju proporcionalno ovisi o vremenu rada stroja te da nema drugih utjecaja na visinu (iznos)
dobiti. Time je dobit ostvarena do njegovog prvog stavljanja izvan pogona zbog kvara (koji e uz
to uzrokovati dodatne trokove!) sluajna karakteristika za koju je prirodno pretpostaviti da njezin
skup moguih realizacija sadri neki interval.

U tom poglavlju definirat emo jedan tip sluajne varijable ija je slika R(X) podskup od R i sadri interval.
Definicija 2.2. Neka je dan vjerojatnosni prostor (, F, P ) i funkcija X : R
za koju vrijedi:
1 Za

definiciju diskretne sluajne varijable u openitom sluaju pogledati [26]

61

Neprekidna sluajna varijabla


{ : X() x} = {X x} F za svaki x R,
postoji nenegativna realna funkcija realne varijable, f , takva da vrijedi:
Z x
f (t) dt, x R.
P { : X() x} = P {X x} =

Funkciju X zovemo apsolutno neprekidna sluajna varijabla na ili, krae,


neprekidna sluajna varijabla. Funkciju f tada zovemo funkcija gustoe vjerojatnosti sluajne varijable X ili, krae, funkcija gustoe sluajne varijable X.
Valja napomenuti da nisu sve sluajne varijable, koje nisu diskretne, apsolutno
neprekidne u tom smislu. Za opu teoriju pogledati npr. [26], [4], [6].
Bitna svojstva funkcije gustoe neprekidne sluajne varijable
1. Nenegativnost: f (x) 0 za sve x R.
2. Normiranost:

Z
f (x) dx = 1.

Z
f (x) dx moemo prikazati kao

Dokaz.

Zn
f (x) dx = lim

f (x) dx.

Koristei neprekidnost vjerojatnosti u odnosu na monotono rastuu familiju


skupova imamo:
Zn
lim

f (x) dx = lim P {X h, n]} = P {} = 1.


n

3. Vjerojatnost da sluajna varijabla X, ija je funkcija gustoe f , primi vrijednost iz intervala (a, b] moe se izraunati koritenjem funkcije gustoe na
sljedei nain (vidi sliku 2.4):
Zb
P {a < X b} = P {X ha, b]} =

f (x) dx.
a

62

Sluajna varijabla
Dokaz. Koristei svojstva vjerojatnosti i svojstva integrala slijedi:
P {a < X b} = P {X b} P {X a} =
Zb
Za
Zb
f (x) dx = f (x) dx.
f (x) dx
=

Prostor
elementarnih
dogaaja

Dogaaj
{a<Xb}

f(x)
P{a<Xb}

Slika 2.4: Vjerojatnost kao povrina od osi x do grafa funkcije gustoe nad izabranim
intervalom.
Ako je zadana nenegativna funkcija f : R R koja zadovoljava svojstvo normiranosti, moe se dokazati da postoji vjerojatnosni prostor (, F, P ) i neprekidna
sluajna varijabla X na njemu za koju je f funkcija gustoe (vidi [26]).
Primjer 2.8. Analizirajmo moe li funkcija f : R R (vidi sliku 2.5) definirana izrazom
(


sin x , x 0, 2


f (x) =
0 , x
/ 0, 2
posluiti kao funkcija gustoe neke neprekidne sluajne varijable X. Ako moe, odredimo
n
o
<X
P
.
4
2

y
1

Slika 2.5: Funkcija gustoe sluajne varijable iz primjera 2.8.


Iz definicije funkcije f oito je da se radi o nenegativnoj funkciji:

63

Funkcija distribucije sluajne varijable


- na intervalu h0, /2] jest f (x) = sin x, a funkcija je sinus na tom intervalu pozitivna,
- na h, 0] h/2, i je f (x) = 0.
Pokaimo da je funkcija f normirana:
Z
f (x) dx =

Z0

Z2
f (x) dx =

f (x) dx +

f (x) dx +

Z2

sin x dx = 1.
0

Budui da je funkcija f nenegativna i normirana, zakljuujemo da moe posluiti kao funkcija


gustoe neprekidne sluajne varijable.
Traenu vjerojatnost raunamo na sljedei nain:

2.3

o
<X
=
4
2

Z2
sin x dx =

2
.
2

Funkcija distribucije sluajne varijable

Diskretna i neprekidna sluajna varijabla samo su dva tipa sluajnih varijabli koje
se najee koriste u praksi. Openito, ako je dan bilo kakav vjerojatnosni
prostor (, F, P ), svaku funkciju X definiranu na sa skupom vrijednosti
iz R koja zadovoljava svojstvo
{X x} F,

x R,

zovemo sluajna varijabla na . Vjerojatnosna svojstva za sve sluajne varijable


opisana su tzv. funkcijom distribucije o kojoj e biti rijei u ovom poglavlju.
Definicija 2.3. Neka je (, F, P ) vjerojatnosni prostor i neka je X sluajna varijabla. Funkciju F : R [0, 1] koja realnom broju x pridruuje vjerojatnost da dana
sluajna varijabla bude manja ili jednaka tom broju, tj. funkciju
F (x) = P { : X() x} = P {X x},
zovemo funkcija distribucije sluajne varijable X.
Svojstva funkcije distribucije:
1. Funkcija distribucije sluajne varijable monotono je rastua funkcija, tj.
x1 < x2 F (x1 ) F (x2 ).
Dokaz. Ako je x1 < x2 , tada je {X x1 } {X x2 }. Primjenom svojstva
monotonosti vjerojatnosti na prethodnu injenicu slijedi tvrdnja.

64

Sluajna varijabla
2. Neka je F funkcija distribucije neke sluajne varijable. Tada vrijedi:
lim F (x) = F () = 0.

Dokaz. Neka je (an , n N) monotono padajui niz koji divergira u .


Tada vrijedi:
!
\
lim F (an ) = lim P {X an } = P
{X an } = P () = 0.
n

nN

Odavde lako slijedi tvrdnja.


3. Neka je F funkcija distribucije neke sluajne varijable. Tada vrijedi:
lim F (x) = F () = 1.

Dokaz. Slino dokazu prethodne tvrdnje.


4. Funkcija distribucije neprekidna je zdesna, tj.
lim F (x) = F (x0 ).

xx0

Dokaz. Neka je x R i (hn , n N) monotono padajui niz brojeva takvih da


je lim hn = 0. Tada vrijedi:
n

F (x + hn ) F (x) = P {x < X x + hn },
!
\
lim (F (x + hn ) F (x)) = P
{x < X x + hn } = P () = 0.

nN

Napomenimo da se moe dogoditi da je


lim F (x) 6= F (x0 ),

xx0

tj. funkcija distribucije ne mora nuno biti neprekidna i slijeva, no limes slijeva
uvijek postoji i stoga uvodimo sljedeu oznaku:
lim F (x) = F (x0 ) .

xx0

Primjer 2.9. Neka je dana diskretna sluajna varijabla X kojom modeliramo bacanje pravilno
izraenog novia. Ako oznaimo "uspjeh" (npr. palo je "pismo") brojem 1, a "neuspjeh" brojem
0, tablica distribucije ove sluajne varijable jest
!
0 1
X= 1 1 .
2 2

65

Funkcija distribucije sluajne varijable

Funkcija distribucije ima vrijednost 0 za sve x koji su manji od 0. U broju 0 prima vrijednost
i ostaje na toj vrijednosti sve do broja 1 kada prima vrijednost 1, tj.

0 , x h, 0i
1
F (x) = P {X x} =
.
, x [0, 1i
2

1 , x [1, i

1
2

Graf funkcije distribucije te sluajne varijable prikazan je na slici 2.9. Uoimo da navedena
funkcija distribucije nije neprekidna slijeva.
y
1

0.5

-3

-2

-1

Slika 2.6: Funkcija distribucije za sluajnu varijablu kojom modeliramo bacanje pravilno izraenog novia.

Koristei funkciju distribucije i svojstva vjerojatnosti moemo lako raunati vjerojatnost da sluajna varijabla primi vrijednost iz nekog skupa A, gdje je skup A neki
interval, prebrojiva unija ili presjek intervala, njihova razlika i slino. Primjerice,
za a, b R takve da je a < b vrijedi:
P {a < X b}

P {X b} P {X a} = F (b) F (a),

P {X = a}

{a

n=1

P {a X b}

1
n


< X a} =

lim (F (a) F (a n1 )) =

F (a) F (a),

=
=

P {X = a} + P {a < X b} =
F (b) lim F (a n1 ) =

F (b) F (a)

i slino.
Specijalno, ako je sluajna varijabla diskretna, funkcija distribucije moe se izraziti koristei tablicu distribucije sluajne varijable, a ako je neprekidna, koristei
pripadnu funkciju gustoe.

66

Sluajna varijabla

2.3.1

Funkcija distribucije diskretne sluajne varijable

Neka je dana diskretna sluajna varijabla


X=

x1 x2 x3 xn
p1 p2 p3 pn

!
,

tj. R(X) = {xi , i I}, I N, je dani skup vrijednosti sluajne varijable X, a


(pi , i I) niz pripadnih vjerojatnosti za koji vrijedi
X
pi = P {X = xi } 0, i I,
pi = 1.
iI

Za svaki x R vrijedi:
F (x) = P {X x} =

pi .

xi x

Uoimo da je takva funkcija distribucije stepenasta funkcija, tj. funkcija sa skokovima u tokama xi , dok na intervalu [xi , xi+1 ) prima stalno istu vrijednost koja je
jednaka F (xi ) (vidi npr. sliku 2.6).
Primjer 2.10. Neka je diskretna sluajna varijabla zadana sljedeom tablicom distribucije:
!
2 1 0 1 2
X=
.
0.1 0.2 0.4 0.2 0.1
Prema definiciji funkcije distribucije slijedi da je funkcija distribucije sluajne varijable X definirana izrazom

0.1

0.3
F (x) =

0.7

0.9

1
Njezin graf prikazan je slikom 2.10.

,
,
,
,
,
,

x (, 2)
x [2, 1)
x [1, 0)
.
x [0, 1)
x [1, 2)
x [2, )

y
1
0.9
0.7

0.3
0.1
-2

-1

Slika 2.7: Graf funkcije distribucije diskretne sluajne varijable X iz primjera 2.10.

67

Funkcija distribucije sluajne varijable

2.3.2

Funkcija distribucije neprekidne sluajne varijable

Neka je X neprekidna sluajna varijabla s funkcijom gustoe f . Dakle, f (x) 0 za


Z
sve x R,
f (x) dx = 1 i

Zx
P {X x} =

f (t) dt, x R.

Odavde direktno slijedi da vrijednost funkcije distribucije sluajne varijable X za


proizvoljan realan broj x0 odreujemo na sljedei nain (slika 2.8):
Zx0
F (x0 ) = P {X x0 } =

f (t) dt,

x0 R.

f (x)

F (x0 )

x0

Slika 2.8: Funkcija gustoe i vrijednost funkcije distribucije u x0 (osjenana povrina) neprekidne sluajne varijable.
Iz dobro poznatih svojstava integrala oigledno je da je, za razliku od diskretnog
sluaja, funkcija distribucije neprekidne sluajne varijable neprekidna funkcija u
svakoj toki x R. Takoer, funkcija gustoe neprekidne sluajne varijable X
moe se dobiti kao derivacija pripadne funkcije distribucije u gotovo svakoj toki
x R, tj. f (x) = F 0 (x).
Odavde slijedi i sljedee vano svojstvo za neprekidne sluajne varijable.
Neka je X neprekidna sluajna varijabla. Tada za svaki x0 R vrijedi:
P {X = x0 } = 0.

68

Sluajna varijabla

Dokaz. Zbog neprekidnosti funkcije distribucije vrijedi:

!
1
P {X = x0 } = P
{x0 < X x0 } =
n
n=1



1
= 0.
= lim F (x0 ) F x0
n
n
Primjer 2.11. Odredimo funkciju distribucije neprekidne sluajne varijable s funkcijom gustoe
definiranom sljedeim izrazom:
(


sin x , x 0, 2

 .
f (x) =
(2.2)
0 , x
/ 0, 2
Ako je x h, 0], tada je
Zx
F (x) = P {X x} =
f (x)dx = 0.

Za x h0, /2] je
Z0
F (x) = P {X x} =

Zx
f (x)dx +

Zx
sin xdx = 1 cos x.

f (x)dx =
0

Za x > /2 je oigledno F (x) = F (/2) = 1.


Dakle, funkcija distribucije neprekidne sluajne varijable X definirana je izrazom

0
, x h, 0]

F (x) = 1 cos x , x h0, /2]

1
, x h/2, )
Graf te funkcije distribucije prikazan je na slici 2.11. Uoimo da je funkcija F neprekidna.

y
1

Slika 2.9: Graf funkcije distribucije neprekidne sluajne varijable X s gustoom (2.2).

Intuitivno znaenje naziva "gustoa sluajne varijable" za neprekidne sluajne varijable moe se prepoznati iz injenice da je funkcija gustoe neprekidne sluajne

Primjeri parametarski diskretnih distribucija

69

varijable zapravo derivacija funkcije distribucije. Naime, iz definicije derivacije slijedi:


F (x + x) F (x)
P {x < X x + x}
f (x) = lim
= lim
.
x0
x0
x
x
Dakle, f (x) je granina vrijednost po duljini intervala, kvocijenta vjerojatnosti da
se X nae u intervalu hx, x + x] i duljine intervala, to intuitivno odgovara pojmu
gustoe vjerojatnosti.

2.4

Primjeri parametarski zadanih diskretnih distribucija

Neki tipovi tablica distribucije diskretnih sluajnih varijabli koji se esto koriste u
praksi daju se jednostavno opisati koristei jedan ili nekoliko realnih brojeva (parametara). Za takve distribucije kaemo da se mogu zadati parametarski i svrstavamo
ih u parametarske familije distribucija s prepoznatljivim imenima i svojstvima. U
ovom poglavlju definirat emo nekoliko takvih familija.

2.4.1

Diskretna uniformna distribucija

Za sluajnu varijablu X kaemo da ima diskretnu uniformnu distribuciju ako je


njezin skup svih moguih vrijednosti konaan podskup skupa realnih brojava, tj.
R(X) = {x1 , x2 , . . . , xn } R, a pripadni je niz vjerojatnosti definiran kao
pi = P {X = xi } =

1
, i = 1, 2, . . . , n.
n

Takve distribucije koriste se ako sluajna varijabla X moe primiti samo vrijednosti
iz skupa R(X) = {x1 , x2 , . . . , xn } i to tako da je vjerojatnost realizacije svakog
pojedinog ishoda ista, tj. P {X = xi } = 1/n za svaki i {1, . . . , n}.
Uoimo da je na taj nain dobro definirana tablica distribucije s obzirom da je
n
P
pi = 1. Takoer, pripadni niz vjerojatnosti ovisi samo o broju elemenata skupa
i=1

R(X), tj. o broju n.


Primjer 2.12 (Bacanje igrae kockice.). Neka sluajna varijabla X daje broj koji se okrenuo pri
bacanju pravilno izraene igrae kockice. Tada ona ima diskretnu uniformnu distribuciju zadanu
tablicom distribucije

1 2 3 4 5 6

X=
1 1 1 1 1 1 .
6 6 6 6 6 6
Graf distribucije bacanja igrae kockice prikazan je slikom 2.10.

70

Sluajna varijabla
y

Slika 2.10: Graf distribucije bacanja igrae kockice.


Primjer 2.13. Pretpostavimo da na ispitu na sluajan nain biramo jedno od m ponuenih pitanja. Rezultate tog sluajnog pokusa moemo opisati diskretnom uniformnom sluajnom varijablom
X s tablicom distribucije

1 2 3 ... m 1 m

X=
1 1 1
1
1 .
...
m m m
m m

2.4.2

Bernoullijeva distribucija

Neka je X sluajna varijabla koja moe primiti tono dvije vrijednosti, i to R(X) =
{0, 1}. Njezina distribucija dana je tablicom distribucije
!
01
, p h0, 1i, q = 1 p.
X=
qp
Za takvu sluajnu varijablu rei emo da ima Bernoullijevu distribuciju s parametrom p, pri emu parametar p ima znaenje vjerojatnosti da X primi vrijednost
1.
Bernoullijev tip distribucije koristi se pri modeliranju sluajnih karakteristika koje
mogu imati tono dvije vrijednosti. Te mogue vrijednosti uglavnom zovemo "uspjeh" i "neuspjeh" te koristimo oznake 1 za "uspjeh", a 0 za "neuspjeh". Dakle,
parametar p Bernoulijeve distribucije ima znaenje vjerojatnosti pojavljivanja "uspjeha".
Primjer 2.14. Igramo kockarsku igru u kojoj ostvarujemo dobitak ako se na pravilno izraenoj igraoj kocki okrene estica (to interpretiramo kao uspjeh i oznaavamo 1). Ishod te igre
modeliramo Bernoullijevom sluajnom varijablom X s tablicom distribucije

0 1
X = 5 1 .
6 6
Graf distribucije prikazan je slikom 2.11.

71

Primjeri parametarski diskretnih distribucija


y
5
6

1
6

Slika 2.11: Graf Bernoullijeve distribucije iz primjera 2.14.


Primjer 2.15. Izvlaimo jedan proizvod iz velike poiljke u kojoj je 2% neispravnih. Ako nas
zanima je li izvuen ispravan ili neispravan proizvod, rezultat izvlaenja moemo modelirati Bernoullijevom sluajnom varijablom X. Neka je 1 oznaka dobrog proizvoda. Tada je X zadana
tablicom distribucije
!
0
1
X=
.
0.02 0.98

2.4.3

Binomna distribucija

Binomna distribucija vezana je uz nezavisno ponavljanje uvijek istog pokusa. Ako


nas pri svakom izvoenju pokusa zanima samo je li se dogodio neki dogaaj (uspjeh!) ili ne (neuspjeh!), onda svako izvoenje pokusa moemo modelirati istom
Bernoullijevom distribucijom
!
01
Y =
, p h0, 1i, q = 1 p,
qp
gdje p predstavlja vjerojatnost uspjeha.
Pretpostavimo da pokus ponavljamo nezavisno n puta i pri tome nas zanima broj
uspjeha. Za sluajnu varijablu X koja opisuje broj uspjeha u n nezavisnih ponavljanja sluajnog pokusa modeliranog Bernoullijevog sluajnom varijablom Y kaemo
da ima binomnu distribuciju s parametrima n i p.
Primjer 2.16. Stroj proizvodi CD-ove. Vjerojatnost da bude proizveden neispravan CD je p.
Zanima nas broj neispravnih CD-ova ako s beskonane trake uzimamo njih 100. Sluajna varijabla
kojom modeliramo broj neispravnih CD-ova meu 100 odabranih jest binomna sluajna varijabla
X parametrima n = 100 i p, a zadana je sljedeom tablicom distribucije:
!
0 1 100
X=
,
p1 p2 p100
gdje je:
pi = P {X = xi } =

100
i

pi (1 p)100i , i {0, 1, . . . , 100}.

72

Sluajna varijabla

Definirajmo sluajnu varijablu s binomnom distribucijom.


Definicija 2.4. Neka je n N i p h0, 1i. Za sluajnu varijablu koja prima
vrijednosti iz skupa {0, 1, 2, ..., n} s vjerojatnostima
 
n i
pi = P {X = i} =
p (1 p)ni
i
kaemo da ima binomnu distribuciju s parametrima n i p i piemo: X
B(n, p).
Znaenje parametara u X B(n, p):
p je vjerojatnost uspjeha u jednom izvoenju pokusa,
n je broj nezavisnih ponavljanja pokusa.
Provjerimo je li na taj nain dobro definirana distribucija, tj. je li

n
P

pi = 1. Vrijedi:

i=0
n  
X
n i ni
pq
= (p + q)n = 1.
pi =
i
i=0
i=0

n
X

Primjer 2.17. Pretpostavimo da iz velikog skladita slatkia (u kojemu se nalaze okolade, bomboni, keksi, . . . ) 10 puta nezavisno izvlaimo po jedan slatki. Ako je vjerojatnost da u jednom
izvlaenju izvuemo okoladu p = 0.3, tada sluajna varijabla koja opisuje broj izvuenih okolada u 10 nezavisnih izvlaenja ima binomnu distribuciju s parametrima n = 10 i p = 0.3, tj.
X B(10, 0.3). Tablica distribucije sluajne varijable X jest

0
1
2
. . . 10
10
10
.
X=
0.32 0.78 . . . 0.310
0.3 0.79
0.710
2
1
Graf ove distribucije prikazan je slikom 2.12.

y
0.25
0.20
0.15
0.10
0.05
1 2 3 4 5 6 7 8 9 10

Slika 2.12: Graf binomne distribucija iz primjera 2.17.


Sada lako moemo odrediti sljedee vjerojatnosti:

Primjeri parametarski diskretnih distribucija

73

a) vjerojatnost da smo okoladu izvukli tono 5 puta:


10
0.35 (1 0.3)5 0.103,
P {X = 5} =
5
b) vjerojatnost da smo okoladu izvukli manje od 3 puta:
P {X < 3} = P {X 2} =

2  
X
10
0.3k (1 0.3)10k 0.383,
k
k=0

c) vjerojatnost da smo okoladu izvukli barem 2 puta:


P {X 2} = 1 P {X < 2} = 1

1  
X
10
k=0

2.4.4

0.3k (1 0.3)10k 0.851.

Poissonova distribucija

Poissonova distribucija, slino kao i binomna, moe se primijeniti kao distribucija


sluajne varijable koja broji uspjehe, ali ne pri nezavisnom ponavljanju pokusa konano mnogo puta, nego u jedininom vremenskom intervalu ili intervalu volumena,
mase, itd. ako pokus zadovoljava sljedee uvjete:
- vjerojatnost da se pojavi uspjeh ne ovisi o tome u kojem e se jedininom intervalu
dogoditi,
- broj uspjeha u jednom intervalu neovisan je o broju uspjeha u nekom drugom
intervalu,
- oekivani broj uspjeha isti je za sve jedinine intervale i dan je pozitivnim realnim
brojem .

Definicija 2.5. Sluajna varijabla X ima Poissonovu distribuciju s parametrom > 0 ako prima vrijednosti iz skupa {0, 1, 2, . . . } s vjerojatnostima
pi = P {X = i} = e

i
.
i!

Tada piemo X P().


Histogram distribucije Poissonove sluajne varijable s parametrom 3 za skup realizacija {0, 1, 2, . . . , 15} prikazan je slikom 2.13.

74

Sluajna varijabla
y
0.20
0.15
0.10
0.05
1 2 3 4 5 6 7 8 9101112131415

Slika 2.13: Graf Poissonove distribucija s parametrom 3 za skup realizacija {0, 1, 2, . . . , 15}.

Provjerimo je li na taj nain dobro definirana distribucija, tj. je li

pi = 1.

i=0

Vrijedi:

X
e i
i=0

i!

= e

X
i
i=0

i!

= e e = 1.

Primjer 2.18. Pretpostavimo da neki kafi u toku jednog sata u prosjeku posjeti 15 ljudi. Sluajna
varijabla koja broji posjetitelje kafia tijekom jednog sata jest Poissonova sluajna varijabla s
parametrom = 15, tj. X P(15). Ona prima vrijednosti iz skupa R(X) = {0, 1, . . .} s
vjerojatnostima
15i 15
pi =
e
, i R(X).
i!
Na temelju navedenih informacija moemo odrediti sljedee vjerojatnosti:
a) vjerojatnost da je kafi u toku jednog sata posjetilo tono 20 ljudi:
P {X = 20} =

1520 15
e
0.042,
20!

b) vjerojatnost da je kafi u toku jednog sata posjetilo manje od 15 ljudi:


P {X < 15} = P {X 14} =

14
X
15i 15
e
0.466,
i!
i=0

c) vjerojatnost da je kafi u toku jednog sata posjetilo vie od 10 ljudi:


P {X > 10} = 1 P {X 10} = 1

10
X
15i 15
e
0.882.
i!
i=0

Poissonova distribucija moe se dobiti i kao aproksimacija binomne ako je parametar n binomne distribucije jako velik, a vjerojatnost p realizacije uspjeha mala.
Ilustracija te tvrdnje dana je primjerom 2.19.
Primjer 2.19. Telefonska centrala u vremenskom periodu u trajanju od pola sata prima 600
poziva uglavnom ravnomjerno rasporeenih u spomenutom vremenu (tj. u prosjeku 20 u minuti).
Broj poziva u prvoj minuti moemo modelirati binomnom distribucijom. Naime, vjerojatnost da
se poziv dogodi u prvoj od tih 30 minuta jest p = 1/30 (jer su pozivi uglavnom jedoliko rasporeeni
u vremenu). Meutim, broj je poziva u minuti sluajna varijabla pa, iako je prosjean broj poziva

75

Primjeri parametarski diskretnih distribucija

u minuti 20, u modelu moramo pretpostaviti da se u prvoj minuti moe dogoditi od 0 do 600
poziva. Dakle, n = 600 za tu binomnu sluajnu varijablu. Uoimo da prosjean broj poziva po
minuti iznosi np.

Problem je s binomnom distribucijom u navedenom primjeru prvenstveno taj da moramo pretpostaviti maksimalan broj poziva u minuti, to u modelu telefonske centrale nije razumno. Meutim,
tu je n = 600 velik, a p = 1/30 malen, pa vjerojatnosti zadane po binomnoj distribuciji moemo dobro aproksimirati vjerojatnostima po Poissonovoj distribuciji s parametrom koji odgovara
prosjenom broju poziva po minuti, tj. = np = 20.

Oznaimo np = i pokaimo da se, pod pretpostavkom da je n velik prirodan broj i da > 0


ne ovisi o n, vjerojatnosti po binomnoj distribuciji mogu dobro aproksimirati vjerojatnostima po
Poissonovoj. Zaista, za binomnu sluajnu varijablu Xn B(n, p), te za i {0, . . . , n} jest
!
n(n 1)(n 2) (n i + 1) i
n
pi (n) = P {Xn = i} =
pi (1 p)ni =
p (1 p)ni .
i
i!
Stavimo li = np, tj. p = /n, slijedi:

pi (n)

=
=

  

n(n 1)(n 2) (n i + 1) i
ni
1
=
n   n

  i!


n 

1
2
i1

i
1
1
1
1
i 1
1
.
i!
n
n
n
n
n

Da bismo odredili priblinu vrijednost pi (n) za velike n, uoimo da vrijedi:


lim pi (n) =

1 i
e .
i!

Dakle, za velike n jest


1 i
e .
i!
Slikom 2.14 prikazan je graf binomne distribucije s parametrima p = 30 i n = 600 i Poissonove
s parametrom = 20 koji ilustrira kvalitetu aproksimacije.
pi (n)

y
0.08
Binomna

0.06

Poissonova

0.04
0.02
0

20

40

60

80

1
Slika 2.14: Graf binomne B(600, 30
) i Poissonove P(20) distribucije za i = 0, . . . , 100.

76

Sluajna varijabla

2.4.5

Geometrijska distribucija

Geometrijska distribucija takoer je vezana uz nezavisno ponavljanje istog pokusa s


ishodima "uspjeh" i "neuspjeh" kao i binomna. Meutim, ona se ne koristi za opisivanje broja uspjeha ve za opisivanje broja ponavljanja pokusa do prvog uspjeha.
Preciznije govorei, neka je vjerojatnost pojavljivanja dogaaja A u svakom od nezavisnih ponavljanja istog pokusa p h0, 1i. Geometrijskom distribucijom opisana
je sluajna varijabla koja daje broj potrebnih pokusa da bi se realizirao taj dogaaj. Budui da je, pod tim pretpostavkama, vjerojatnost pojavljivanja dogaaja A
u k-tom pokusu

c\ c\ \ c\
k1
A
A
p,
P {X = k} = P
A
A
= (1 p)
|
{z
}
(k1) puta

geometrijsku distribuciju moemo definirati na slijedei nain.


Definicija 2.6. Sluajna varijabla X ima geometrijsku distribuciju s parametrom p h0, 1i ako prima vrijednosti iz skupa {1, 2, 3, . . . } s vjerojatnostima
pk = P {X = k} = p(1 p)k1 .
Pokaimo da je na taj nain dobro definirana distribucija, tj. da je

pi = 1.

i=1

Koristei formulu za sumu geometrijskog reda slijedi:

X
i=1

pi =

p(1 p)i1 = p

i=1

1
= 1.
1 (1 p)

Primjer 2.20. Tipkovnica na prijenosnom raunalu nekog proizvoaa sastoji se od 86 tipki.


Pretpostavimo da zatvorenih oiju trebamo pritisnuti tipku za slovo A. Budui da je vjerojatnost
pogotka bilo koje tipke jednaka 1/86 (pretpostavimo da pri svakom pokuaju pogodimo neku tipku,
tj. da nikada ne promaimo tipkovnicu), zakljuujemo da sluajna varijabla koja opisuje broj pritisnutih tipki do pogaanja tipke za slovo A ima geometrijsku distribuciju s parametrom p = 1/86.
Tako definirana sluajna varijabla prima vrijednosti iz skupa R(X) = {1, 2, . . .} s vjerojatnostima


1 k1
1
1
.
pk = P {X = k} =
86
86
Sada moemo izraunati sljedee i sline vjerojatnosti:
a) vjerojatnost da je tipka za slovo A stisnuta u petnaestom pokuaju:


1
1 14
0.009,
P {X = 15} =
1
86
86
b) vjerojatnost da je tipka za slovo A stisnuta u manje od 5 pokuaja:


4
X
1
1 k1
P {X < 5} = P {X 4} =
1
0.046,
86
86
k=1

77

Primjeri parametarski diskretnih distribucija


c) vjerojatnost da niti nakon 20 pokuaja jo nismo uspjeli stisnuti tipku za slovo A:
P {X > 20} = 1 P {X 20} = 1

2.4.6



20
X
1
1 k1
1
0.791.
86
86
k=1

Hipergeometrijska distribucija

Neka je skup iz kojeg vrimo odabir elemenata konaan i neka se sastoji od tono
N elemenata od kojih je M tipa 1, a (N M ) tipa 2. Pretpostavimo da smo na
sluajan nain iz tog skupa odabrali n < N elemenata, i to bez vraanja prethodno
izvuenih elemenata u skup. Tada broj izvuenih elemenata tipa 1 modeliramo
hipergeometrijskom distribucijom s parametrima N , M i n.
Definicija 2.7. Diskretna sluajna varijabla X ima hipergeometrijsku distribuciju s parametrima N , M i n, N, M, n N, ako prima vrijednosti iz skupa
R(X) = {k N : max (0, n N + M ) k min (n, M )} s vjerojatnostima
 

M
N M
k
nk
 
.
pk = P {X = k} =
N
n
Pokaimo da je na taj nain dobro definirana distribucija, tj. da je

n
P

pk = 1.

k=0

Primjenom Vandermondeove konvolucije slijedi:


 
 

N
M
N M




n
n
n
X
X
1 X M
N M
n
k
nk
 
= 
=   = 1.
pi =
N
N
N
k
nk
k=0
k=0
k=0
n
n
n
Primjer 2.21. Na polici se nalazi 10 knjiga od kojih su 4 kriminalistiki romani. Na sluajan
nain biramo 5 knjiga. Sluajna varijabla X koja modelira broj kriminalistikih romana od 5
odabranih knjiga ima hipergeometrijsku distribuciju s parametrima N = 10, M = 4 i n = 4. Slika
sluajne varijable X jest skup R(X) = {0, 1, 2, 3, 4}. Na temelju poznatih informacija moemo
izraunati sljedee i sline vjerojatnosti:
a) vjerojatnost da su odabrana tono 3 kriminalitika romana:
4 10 4

5
3
53
P {X = 3} =
,
=
10
21
5
b) vjerojatnost da su odabrana najvie 3 kriminalitika romana:
P {X 3} = P {X = 0} + P {X = 1} + P {X = 2} + P {X = 3} =

41
,
42

78

Sluajna varijabla
c) vjerojatnost da su odabrana najmanje 3 kriminalitika romana:
P {X 3} = 1 P {X < 3} = 1 (P {X = 0} + P {X = 1} + P {X = 2}) =

11
.
42

Neka je X hipergeometrijska sluajna varijabla s parametrima N , M i n. Ako


N i M tako da M/N p, gdje je p pozitivna konstanta, tada
 

M
N M
 
n k
k
nk
 
lim
=
p (1 p)nk , k {0, 1, . . . , n}.
N
N
k
n
Navedena tvrdnja daje aproksimaciju hipergeometrijske distribucije binomnom distribucijom u sluaju kad je n malen u odnosu na N i M , a intuitivno se moe
opravdati time da se odabir n elemenata iz N -lanog skupa bez vraanja prethodno
izvuenih elemenata (hipergeometrijska distribucija) moe za velik N "aproksimirati" odabirom n elemenata s vraanjem izvuenih elemenata u skup (binomna
distribucija).

2.5

Primjeri parametarski zadanih neprekidnih distribucija

Slino kao u diskretnom sluaju, i meu neprekidnim sluajnim varijablama postoje


parametarski zadane familije sluajnih varijabli koje se esto koriste. Ovdje emo
uvesti samo etiri takve familije. Jo neke od njih, koje emo koristiti u statistici,
definirat emo naknadno.

2.5.1

Uniformna distribucija na intervalu ha, bi

Neprekidna uniformna distribucija vee se uz pokuse za koje je poznato da mogu


primiti vrijednost iz ogranienog intervala ha, bi, ali pritom nema razloga preferirati
neko podruje, tj. vjerojatnost realizacije intervala hx1 , x2 i ovisit e samo o njegovoj
duljini sve dok je sadran u ha, bi.
Definicija 2.8. Za neprekidnu sluajnu varijablu X kaemo da ima uniformnu
distribuciju na intervalu ha, bi, a < b, ako joj je funkcija gustoe vjerojatnosti
dana izrazom

1 , x ha, bi
.
f (x) = b a
0 ,x
/ ha, bi

79

Primjeri parametarski zadanih neprekidnih distribucija

S obzirom da za svaku neprekidnu sluajnu varijablu X vrijedi P {X = x0 } = 0,


vidimo da u vjerojatnosnom smislu ne treba praviti bitnom razliku izmeu uniformne distribucije na ha, bi i uniformne distribucije na [a, b], odnosno na nekom od
intervala ha, b], [a, bi.
Funkcija distribucije uniformne sluajne varijable na ha, bi definirana je pravilom

0 , x h, ai

xa
, x [a, bi
F (x) =
.
ba

1 , x [b, i
Primjer 2.22. Pretpostavimo da imamo posudu u koju stane najvie 2 litre vode te da smo
iz slavine u nju sluajno natoili nepoznatu koliinu vode. Sluajna varijabla kojom opisujemo
koliinu vode natoenu u posudu moe se modelirati kao uniformna sluajna varijabla na intervalu
h0, 2i. Prema tome, njezina funkcija gustoe dana je izrazom

1 , x h0, 2i
,
f (x) =
2
0 , x
/ h0, 2i
a funkcija distribucije izrazom

0 , x h, 0]

x
, x h0, 2i
.
F (x) =

1 , x [2, i

Grafiki prikazi funkcije gustoe i funkcije distribucije dani su slikom 2.15.

y
1
2

-2

-1

Slika 2.15: Graf funkcije gustoe i funkcije distribucije uniformne distribucije na intervalu h0, 2i.

Npr. vjerojatnost da smo na sluajan nain iz slavine u posudu natoili vie od pola litre, ali
najvie jednu litru vode, raunamo na sljedei nain:
Z 1
1
1
P {0.5 < X 1} = P {X 1} P {X 0.5} =
dx = .
2 0.5
4

80

Sluajna varijabla

2.5.2

Eksponencijalna distribucija

Eksponencijalna distribucija esto se javlja kod sluajnih varijabli koje imaju znaenje vremena ekanja do pojave nekog dogaaja ako se karakteristike ne mijenjaju
tijekom vremena, npr. vrijeme do kvara (tj. vrijeme trajanja) jedne arulje, vrijeme
do pojave neke nesree, itd.
Naime, analizirajmo sluajnu varijablu X koja modelira vrijeme potrebno do pojave
danog dogaaja pod sljedeom pretpostavkom: uvjetna vjerojatnost pojavljivanja
dogaaja u nekom kratkom intervalu ht, t + ti, uz uvjet da se nije dogodio prije t,
proporcionalna je duljini tog intervala i ne ovisi o t, tj.
P ({X t + t}|{X > t}) = t, > 0.

Vjerojatnost da je vrijeme do pojave dogaaja vea od t + t jest


P {X > t + t} = P ({X > t + t}|{X > t}) P {X > t}.
Meutim, pod tom je pretpostavkom
P ({X > t + t}|{X > t}) = 1 P ({X t + t}|{X > t}) = 1 t,
pa vrijedi
P {X > t + t} = (1 t)P {X > t}.
Oznaimo funkciju S(t) = P {X > t}. Ta funkcija, za male t, treba zadovoljavati
svojstvo
S(t + t) = (1 t)S(t),
tj.
S(t + t) S(t)
= S(t),
t
to u limesu, za t 0, znai da mora zadovoljavati diferencijalnu jednadbu
S 0 (t) = S(t).
Rjeenje te diferencijalne jednadbe jest S(t) = Cet , a konstantu moemo odrediti
iz prirodnog uvjeta S(0) = P {X > 0} = 1. Dakle,
S(t) = P {X > t} = et ,
to znai da funkcija distribucije sluajne varijable X ima oblik
F (t) = 1 P {X > t} = 1 et .

81

Primjeri parametarski zadanih neprekidnih distribucija

To je upravo funkcija distribucije sluajne varijable koju zovemo eksponencijalna s


parametrom > 0.
Definicija 2.9. Neprekidna sluajna varijabla X ima eksponencijalnu distribuciju s parametrom > 0 ako je funkcija gustoe dana izrazom
(
0 ,x<0
.
f (x) =
x
e
,x0
Funkcija distribucije te sluajne varijable dana je izrazom
(
0
,x<0
.
F (x) =
x
1e
,x0
Primjer 2.23. Vrijeme u sekundama koje protekne od servisa do prvog udara teniske loptice u
tlo modelirano je eksponencijalnom sluajnom varijablom s parametrom = 1/3. Grafovi funkcije
gustoe i funkcije distribucije te sluajne varijable dani su na slici 2.16

y
1
3

-10

10

-10

10

Slika 2.16: Graf funkcije gustoe i funkcije distribucije eksponencijalne distribucije s parametrom
= 1/3.

Vjerojatnost da e od servisa do prvog udara teniske loptice u tlo proi vie od dvije, ali najvie
etiri sekunde, raunamo na sljedei nain:
Z 4
1
ex/3 dx 0.249.
P {2 < X 4} = P {X 4} P {X 2} =
3 2

2.5.3

Dvostrana eksponencijalna distribucija

Definicija 2.10. Neprekidna sluajna varijabla X ima dvostranu eksponencijalnu distribuciju s parametrom > 0 ako je funkcija gustoe dana izrazom
f (x) =

1 |x|
e
,
2

x R.

82

Sluajna varijabla

Funkcija distribucije te sluajne varijable definirana je sljedeim izrazom:

1 x

e
,x0

2
F (x) =
.

1 ex , x > 0
2

Primjer 2.24. Grafovi funkcije gustoe i funkcije distribucije sluajne varijable X s dvostranom
1
eksponencijalnom distribucijom s parametrom =
prikazani su slikom 2.17.
3

1
6

-10

10

-10

Slika 2.17: Graf funkcije gustoe i funkcije distribucije dvostrane eksponencijalne distribucije s
parametrom = 1/3.

2.5.4

Normalna distribucija

Normalna distribucija najvie se koristi u statistikoj teoriji i primjeni. Teorija je


pokazala da ona vrlo dobro opisuje pokuse iji su ishodi posljedica sume mnogo
meusobno nezavisnih i jednako distribuiranih utjecaja. Objasnimo tu injenicu
primjerom.
Primjer 2.25 (Galtonova daska2 ). U dasku ubodemo pribadae kao to je prikazano na slici 2.18 i
iz izvora pri vrhu konstrukcije pustimo da pada mnotvo malih kuglica. U podnoju ih zaustavljamo
podlogom i odreujemo funkciju koja opisuje gustou kuglica na toj podlozi. Jasno je da su kuglice
mnogo puta udarile u pribadae prije negoli su pale i svaki su put promjenile smjer kretanja.
Njihov pomak u stranu od mjesta s kojeg su baene nastao je kao suma mnotva malih jednako
distribuiranih i nezavisnih pomaka uzrokovanih sudarima. Dobivena gustua kuglica na dasci ima
upravo zvonoliki oblik Gaussove krivulje koja je graf funkcije gustoe normalne distribucije.
2 Tim eksperimentom engleski znanstvenik Sir Francis Galton (1822-1911) demonstrirao je centralni granini teorem. Eksperiment je poznat i pod nazivima "bean machine", "quincunx" i
"Galtonova kutija".

83

Primjeri parametarski zadanih neprekidnih distribucija

Slika 2.18: Galtonova daska.


Definicija 2.11. Za neprekidnu sluajnu varijablu kaemo da ima Gaussovu ili
normalnu distribuciju s parametrima i 2 ako je njezina funkcija gustoe dana
izrazom
(x)2
1
f (x) = e 22 , x R,
2
gdje su i realni brojevi i > 0. Ako sluajna varijabla X ima normalnu
distribuciju s parametrima i 2 , koristimo oznaku X N (, 2 ).
Funkcija distribucije normalne sluajne varijable (slika 2.19) definirana je izrazom
Z x
(t)2
1
F (x) =
e 22 dt, x R.
2
Slika 2.19 prikazuje graf funkcije gustoe i funkcije distribucije normalne distribucije
s parametrima = 4 i 2 = 4.
y

y
2

-5

1
2

10

x
-5

10

Slika 2.19: Graf funkcije gustoe i funkcije distribucije sluajne varijable X


N (4, 4).
Normalna distribucija s parametrima = 0 i 2 = 1 zove se jedinina ili standarna normalna distribucija. Gustoa standardne normalne distribucije dana

84

Sluajna varijabla

je izrazom
2
1
f (x) = ex /2 ,
2

x R.

Slika 2.20 prikazuje graf funkcije gustoe i funkcije distribucije standardne normalne
distribucije.
y

y
1
2

-4

-4

Slika 2.20: Graf funkcije gustoe i funkcije distribucije standardne normalne distribucije.

Vrijednosti funkcije distribucije za takve sluajne varijable moraju se raunati koritenjem metoda numerikog integriranja s obzirom da se integrali uglavnom ne
daju rijeiti eksplicitno. U veini knjiga koje primjenjuju statistiku dane su tablice vrijednosti funkcije distribucije standardne normalne sluajne varijable koja
je definirana sljedeim izrazom:
1
F (x) =
2

Zx

t2

e 2 dt,

x R.

U dananje se vrijeme za raunanje vjerojatnosti po normalnoj distribuciji najee


koriste naprednija depna raunala ili specijalizirani software na raunalu.
Primjer 2.26. Vrijeme (u satima) koje student tree godine studija matematike provede uei
u jednom danu moe se opisati sluajnom varijablom X koja ima normalnu distribuciju s parametrima = 5.43 i = 0.7. Koritenjem programskog paketa Mathematica i ugraene funkcije
CDF [ ] 3 slijedi:
a) vjerojatnost da student uei provede manje od 5 sati:
P {X < 5} = CDF [ndist, 5] 0.269,
gdje je ndist = N ormalDistribution[5.43, 0.7].
3 CDF

= cumulative distribution function.

Numerike karakteristike sluajne varijable

85

b) vjerojatnost da student uei provede barem 3 sata:


P {X 3} = 1 P {X < 3} = 1 CDF [ndist, 3] 0.999.
c) vjerojatnost da student uei provede izmeu 3 i 7 sati:
P {3 < X < 7} = CDF [ndist, 7] CDF [ndist, 3] 0.987.

2.6

Numerike karakteristike sluajne varijable

Iz prethodnih razmatranja jasno je da za opisivanje neke jednodimenzionalne veliine, koja ima sluajan karakter kao model moe posluiti sluajna varijabla. Za
njezino zadavanje potrebno je zadati distribuciju pa su tada u potpunosti odreena vjerojatnosna svojstva. Distribucije mogu biti jednostavne, ali i vrlo sloenog
karaktera i nije uvijek jednostavno predoiti zakonitosti ponaanja sluajne karakteristike ispisivanjem njezine distribucije. Razvojem teorije vjerojatnosti postalo je
jasno da je esto za sluajnu varijablu mogue definirati nekoliko karakteristinih
brojeva koji mogu, zbog svojih generalnih svojstava, dodatno pomoi u opisivanju
sluajne varijable. Takve karakteristine brojeve zvat emo numerike karakteristike sluajne varijable.

2.6.1

Oekivanje diskretne sluajne varijable

Osnovna je numerika karakteristika sluajne varijable matematiko oekivanje.


Definicija 2.12. Neka je (, P(), P ) diskretan vjerojatnosni prostor i X sluajna
P
varijabla na njemu. Ako red
X()P {} apsolutno konvergira (tj. ako konver
P
gira red
|X()|P {}), onda kaemo da sluajna varijabla X ima matematiko

oekivanje i broj
EX =

X()P {}

zovemo matematiko oekivanje (oekivanje) sluajne varijable X.


Navedena definicija matematikog oekivanja ne moe se jednostavno primijeniti za
njegovo raunanje s obzirom da je dana zadavanjem sluajne varijable na temeljnom
vjerojatnosnom prostoru. Za raunanje je matematikog oekivanja puno prikladnija formula koja se moe dati na temelju tablice distribucije diskretne sluajne
varijable, o emu govori sljedei teorem.

86

Sluajna varijabla

Teorem 2.1. Neka je (, P(), P ) diskretan vjerojatnosni prostor i


!
x1 x2 xn
X=
p1 p2 pn
P
P
sluajna varijabla na njemu. Redovi
X()P {} i
xi pi istovremeno ili apso

iN

lutno konvergiraju ili apsolutno divergiraju. U sluaju apsolutne konvergencije sume


su im jednake, tj. vrijedi
X
X
EX =
X()P {} =
xi pi .

iN

Dokaz. Koristei injenicu da familija skupova {{X = xi }, i N} ini particiju


skupa (jer je s X zadana funkcija!), vidimo da se jedan red moe dobiti iz drugog
"preslagivanjem lanova" u smislu teorije ponovljenih redova, tj.
X
X X
X X
X()P {} =
X()P {} =
xi P {} =

iN {X()=xi }

X
iN

xi

iN {X()=xi }

P {} =

xi pi .

iN

{X()=xi }

Koritenjem rezultata poglavlja 5.3 (Dodatak) zakljuujemo da ti redovi istovremeno ili apsolutno konvergiraju ili apsolutno divergiraju, a u sluaju apsolutne
konvergencije sume su im jednake.
Primjer 2.27. Neka sluajna varijabla X opisuje rezultate bacanja pravilno izraene igrae kockice. Oekivanje je te sluajne varijable broj
EX =

6
X
1
21
i=
.
6
6
i=1

Ako je zadana sluajna varijabla X na (, P(), P ) i funkcija g : R(X) R,


onda je kompozicijom g(X) takoer dana sluajna varijabla na istom vjerojatnosnom prostoru. Npr. X 2 , 2X + 3, eX ,... su tako nastale sluajne varijable. Za
raunanje njihovih oekivanja (ako postoje) nee biti potrebno specificirati njihove
distribucije, ve se moe iskoristiti distribucija sluajne varijable X. Naime, ako red
P
g(X())P {} apsolutno konvergira, onda postoji oekivanje Eg(X). Meutim,

uobiajenim "preslagivanjem" koristei particiju {{X = xi }, i N} od i teoriju


ponovljenih redova, vidimo da vrijedi:
X
X
g(X())P {} =
g(xi )pi .

Time smo dokazali sljedei koristan rezultat.

iN

87

Numerike karakteristike sluajne varijable


Teorem 2.2. Neka je (, P(), P ) diskretan vjerojatnosni prostor,
!
x1 x2 xn
X=
p1 p2 pn

sluajna varijabla na njemu i g : R(X) R funkcija takva da postoji Eg(X). Tada


vrijedi:
X
g(xi )pi .
Eg(X) =
iN

Koristei taj rezultat i definiciju oekivanja, moemo dokazati da vrijede sljedea


korisna svojstva oekivanja:
1. Neka su a i b realni brojevi, a X sluajna varijabla koja ima oekivanje. Tada
i sluajna varijabla aX + b ima oekivanje i vrijedi:
E(aX + b) = aEX + b.
2. Ako su X i Y dvije sluajne varijable koje imaju oekivanja i ako vrijedi
X() Y () za sve onda je i EX EY (monotonost oekivanja).
3. Ako je X sluajna varijabla koja ima svojstvo X() 0 i ako je red

X()P {}

konvergentan, tada je EX 0 (pozitivnost oekivanja).


Osim navedenih svojstava, oekivanje ima i svojstvo linearnosti. Naime, vrijedi
sljedei teorem:
Teorem 2.3. Neka su X i Y dvije sluajne varijable na vjerojatnosnom prostoru
(, P(), P ) koje imaju oekivanja EX, odnosno EY . Tada za proizvoljne a, b R,
sluajna varijabla aX + bY takoer ima oekivanje i vrijedi:
E(aX + bY ) = aEX + bEY.
P
P
Dokaz. Iz apsolutne konvergencije redova
X()P {} i
Y ()P {} slijedi

P
apsolutna konvergencija reda
(aX() + bY ())P {}. Tvrdnja teorema slijedi iz

poznatih rezultata o sumi konvergentnih redova (vidi npr. [13]).


Koristei princip matematike indukcije moe se dokazati i generalizacija teorema
2.3 na linearnu kombinaciju konano mnogo diskretnih sluajnih varijabli koje imaju
oekivanje. Formulirajte tvrdnju i dokaite je!

88

Sluajna varijabla

Primjer 2.28. Pretpostavimo da izvodimo sluajan pokus bacanja nepravilno izraenog novia
kod kojega je relizacija pisma favorizirana i dogaa se s vjerojatnou 0.7 (koristit emo oznaku
1 za realizaciju pisma i 0 za realizaciju glave). Tada sluajna varijabla X kojom modeliramo taj
pokus ima Bernoullijevu distribuciju s parametrom p = 0.7, tj. zadana je tablicom distribucije
!
0 1
X=
.
0.3 0.7
Sluajna varijabla Y koja opisuje broj realiziranih pisama nakon 100 nezavisnih bacanja toga
novia ima binomnu distribuciju s parametrima n = 100 i p = 0.7, tj. Y B(100, 0.7). Kako
binomnu sluajnu varijablu moemo predstaviti kao sumu n Bernoullijevih sluajnih varijabli, tj.
n
X
Y =
Xi , Xi jednako distribuirana kao X, i,
i=1

raunanje je matematikog oekivanja od Y znatno pojednostavljeno i svodi se na primjenu svojstva aditivnosti oekivanja:
EX =

100
X
i=1

EXi =

100
X

(0 0.3 + 1 0.7) =

i=1

100
X

0.7 = 100 0.7 = 70.

i=1

Za oekivanje obino kaemo da je jedna mjera centralne tendencije sluajne varijable. Naime, ako se pitamo postoji li realan broj koji je na neki nain "najblii" sluajnoj varijabli, onda je to u jednom nainu mjerenja udaljenosti upravo
oekivanje. Pritom udaljenost izmeu sluajne varijable i broja mjerimo kao oekivano kvadratno odstupanje: E(X a)2 .4 Zaista, definiramo li funkciju g(a) =
E(X a)2 = EX 2 2aEX + a2 na R, vidimo da ona postie minimum upravo u
vrijednosti a = EX.
Primjer 2.29. Ilustrirajmo znaenje oekivanog kvadratnog odstupanja sluajne varijable od konstante na primjerima.
a) Neka je sluajna varijabla X zadana tablicom distribucije
!
1 2 3 4
X= 1 1 1 1 .
4 4 4 4

Tada je
1
1
1
1
+ (2 a)2 + (3 a)2 + (4 a)2
4
4
4
4
funkcija varijable a. Minimum ove funkcije je tono prosjek vrijednosti koje sluajna varijabla moe postii, tj. 2.5. Uoimo da se ovdje sve vrijednosti reliziraju s istom vjerojatnou
(slika 2.21).
E(X a)2 = (1 a)2

b) Neka je sluajna varijabla X zadana tablicom distribucije


!
1 2 3 4
X= 1 1 1 5 .
8 8 8 8

Tada

1
1
5
1
+ (2 a)2 + (3 a)2 + (4 a)2
8
8
8
8
kao funkcija varijable a postie minimum koji nije jednak prosjek vrijednosti koje sluajna
varijabla moe primiti jer se vrijednost 4 realizira bitno veom vjerojatnou nego ostale
vrijednosti iz R(X). Ovdje je minimum za a = 3.25, tj. "povuen" je prema 4 (slika 2.21).
E(X a)2 = (1 a)2

4 Vie

o toj temi moete pogledati u [26].

89

Numerike karakteristike sluajne varijable


y

y
0.25

1
8

2 2.5 3

3 3.25

Slika 2.21: Grafovi distribucija sluajnih varijabli iz primjera 2.29.


Minimalno oekivano kvadratno odstupanje sluajne varijable od konstante, koje
se postie u oekivanju, takoer ima svoje znaenje. Zove se varijanca i tema je
sljedeeg poglavlja.

2.6.2

Varijanca i ostali momenti. Vane nejednakosti

Koristei definiciju oekivanja, za sluajnu varijablu definiramo momente i centralne


momente.
Definicija 2.13. Neka je X sluajna varijabla na diskretnom vjerojatnosnom prostoru (, P(), P ) i r > 0.
Ako postoji E(X r ), onda broj r = E(X r ) zovemo moment r-tog reda ili
r-ti moment od X.
Ako postoji E(|X|r ), onda broj E(|X|r ) zovemo apsolutni moment r-tog
reda ili r-ti apsolutni moment od X.
Ako postoji EX i E(|X EX|r ) onda broj E(|X EX|r ) zovemo r-ti centralni moment od X.
Ako postoji E(X EX)2 , onda taj nenegativan broj zovemo varijanca slu2
ajne varijable X i oznaavamo Var X, X
ili 2 .
Uoimo:
- Oekivanje je sluajne varijable X njezin moment prvog reda. Oekivanje
uobiajeno oznaavamo s umjesto 1 .
- Varijanca je drugi centralni moment. Ona predstavlja oekivano kvadratno
odstupanje sluajne varijable od njezinog oekivanja.

90

Sluajna varijabla

Primjer 2.30. Neka je sluajna varijabla X zadana tablicom distribucije


!
a a a2
.
X=
0.3 0.3 0.4
Izraunajmo momente EX, EX 2 , EX 3 , Var X, E(X E(X))3 te diskretne sluajne varijable:
EX = 0.3a + 0.3a + 0.4a2 = 0.4a2 ,
EX 2 = 0.6a2 + 0.4a4 = 0.2a2 (2a2 + 3),
EX 3 = 0.3a3 + 0.3a3 + 0.4a6 = 0.4a6 ,

Var X = E (X EX)2 = EX 2 (EX)2 = 0.24a2 (a2 + 2.5),


E(X EX)3 = E X 3 3E X 2 EX + 2 (EX)3 = 0.464a6 0.6a2 (2a2 + 3).

Propozicija 2.1. Neka je r > 0 i E(|X|r ) postoji. Tada postoji i E(|X|s ) za svaki
0 < s < r.
Dokaz. Za svaki realan broj x i 0 < s < r vrijedi nejednakost:
|x|s < 1 + |x|r .
Odavde i iz monotonosti oekivanja vidimo da vrijedi:
|X|s 1 + |X|r = E(|X|s ) 1 + E(|X|r ) < ,
pa postoji oekivanje od X s .
Kao ilustraciju moguih interpretacija momenata navodimo tzv. ebievljevu nejednakost koja daje korisnu interpretaciju oekivanja i varijance svake sluajne varijable koja ima varijancu.
Propozicija 2.2 (ebievljeva nejednakost). Neka je X sluajna vrijabla koja ima
varijancu 2 te neka je dan broj k > 0. Tada vrijedi:
P {|X | k}

1
,
k2

gdje je oekivanje sluajne varijable X.


U dokazu te propozicije iskoristit emo sljedeu nejednakost koja je openito vrlo
korisna u teoriji vjerojatnosti.
Teorem 2.4. Neka je X sluajna varijabla na vjerojatnosnom prostoru (, P(), P )
i g nenegativna funkcija definirana na R(X) takva da postoji Eg(X). Tada za svaki
> 0 vrijedi:
Eg(X)
P {g(X) }
.

Numerike karakteristike sluajne varijable

91

Dokaz. Prije svega, uoimo jednu openito korisnu injenicu: ako je A P()
neki skup, oznaimo li
(
1,A
,
IA () =
0,
/A
IA je sluajna varijabla na koju moemo iskoristiti za povezivanje vjerojatnosti
skupa A i pojma oekivanja sluajne varijable. Naime, distribucija te sluajne varijable dana je tablicom
!
0 1
IA =
, p = P {IA = 1} = P {A}.
1p p
Dakle, vrijedi:
EIA = P (A).
Koritenjem tog naina oznaavanja, monotonosti i linearnosti oekivanja te nenegativnosti funkcije g vidimo da za svaki > 0 vrijedi:
Eg(X) = E(g(X)I{g(X)} + g(X)I{g(X)<} )
= E(g(X)I{g(X)} ) + E(g(X)I{g(X)<} )
E(g(X)I{g(X)} ) EI{g(X)}
= P {g(X) },
to dokazuje tvrdnju.
Dokaz (ebievljeva nejednakost). Iz prethodnog teorema slijedi:
P {|X EX| k} = P {|X EX|2 k 2 2 }
E|X EX|2
Var X
1

= 2 2 = 2.
k2 2
k
k
Interpretacija se varijance i oekivanja koritenjem ebievljeve nejednakosti za
Var X zovemo
pravo temelji na drugom korijenu iz varijance. Tu veliinu, tj.
standardna devijacija sluajne varijable i oznaavamo sa X ili .
Dakle, vidimo da ebievljeva nejednakost tvrdi: vjerojatnost da odstupanje
sluajne varijable X od njezinog oekivanja bude po apsolutnoj vrijednosti vee ili jednako k standardnih devijacija, manja je ili jednaka od
1/k 2 .
Na primjer, vjerojatnost je manja ili jednaka 1/9 11.1% da sluajna varijabla
odstupa od svog oekivanja za vie od 3 standardne devijacije. Koritenjem statistike interpretacije vjerojatnosti moemo tada zakljuiti da e se, prilikom puno

92

Sluajna varijabla

nezavisnih realizacija sluajne varijable X, u ne vie od 11.1% sluajeva realizirati


vrijednosti izvan intervala [ 3, + 3], a u barem 88.9% sluajeva vrijednosti
unutar tog intervala. Kao to se moe vidjeti iz navedenih objanjenja, ima smisla
standardnu devijaciju smatrati jednom od mjera koja govori o rasprenosti realizacija sluajne varijable oko oekivanja, tj. mjerom rasprenja.
Primjer 2.31. Neka je X diskretna sluajna varijabla kojom je modeliran broj kinih dana u
Osijeku tijekom jedne godine. Poznato je da je oekivani broj kinih dana 128, a standardna
devijacija 4. Ako elimo ocijeniti P {|X EX| < 5}, tj. vjerojatnost da broj kinih dana u Osijeku
tijekom jedne godine odstupa od oekivanog broja za manje od pet dana, koristimo ebievljevu
nejednakost. Iz ebievljeve nejednakosti dane u propoziciji 2.2 primjenom svojstva vjerojatnosti
suprotnog dogaaja slijedi da je
P {|X EX| < k} 1

1
.
k2

Budui da je u tom primjeru EX = 128, = 4 i k = 5, tj. k = 5/4, slijedi da je


P {|X 128| < 5} 0.36.
Primjer 2.32. Neka je X diskretna sluajna varijabla kojom je modeliran broj komaraca uhvaen
u danu klopku u jednom satu tijekom lipnja u Osijeku. Pretpostavimo da je poznato da je u
opisanim uvjetima oekivani broj komaraca uhvaenih u tu klopku po satu jednak 50, a varijanca
64 te da je
P {|X 50| < 8k} 0.5
za neki neki k h0, 5i. Pomou zadanih veliina moemo odrediti granice intervala h50 8k, 50 +
8ki ijim se cjelobrojnim elementima, prema ebievljevoj nejednakosti, X realizira vjerojatnou
veom ili jednakom 0.5. Rjeavanjem jednadbe
1

1
= 0.5
k2

slijedi da je parametar k iz ebievljeve nejednakosti jednak 2. Prema tome je


n

o
P 50 8 2 < X < 50 + 8 2 0.5.

Budui da je (50 8 2) 38.686, a (50 + 8 2) 61.314, slijedi da je vjerojatnost da se X


realizira brojem iz skupa {39, 40, . . . , 61} vea ili jednaka 0.5. U kontekstu naeg promatranja to
znai da je vjerojatnost da u opisanu klopku bude ulovljeno n, n {39, 40, . . . , 61}, komaraca vea
ili jednaka 0.5.
Primjer 2.33. Neka je dana sluajna varijabla X koja ima oekivanje 0.7 i standardnu devijaciju
0.458. Tada ebievljeva nejednakost garantira: vjerojatnost odstupanja te sluajne varijable od
0.7 za vie od dvije standardne devijacije iznosi najvie 0.25. Naime
P {|X 0.7| 2}

1
.
4

Koritenjem statistike interpretacije vjerojatnosti moemo zakljuiti da e se, prilikom puno


nezavisnih realizacija te sluajne varijable, najvie u 25% slujeva realizirati vrijednosti izvan
intervala [0.7 2 0.458, 0.7 + 2 0.458] = [0.2417, 1.1583], a u barem 75% sluajeva vrijednosti
unutar tog intervala. (Odredite to krai interval koji e sadravati barem 88% realizacija!)

93

Numerike karakteristike sluajne varijable

Dakako, ta ocjena nije precizna s obzirom da se odnosi na sve sluajne varijable sa


zadanim iznosom oekivanja i standardne devijacije bez obzira na tip distribucije.
Ukoliko je tono poznata distribucija sluajne varijable, takve se vjerojatnosti se
mogu izraunati i puno preciznije, to e biti ilustrirano u narednim poglavljima.
S obzirom da je varijanca moment koji emo esto koristiti, dokaimo nekoliko
korisnih svojstava.
1. Neka je X sluajna varijabla koja ima varijancu te a i b proizvoljni realni
brojevi. Tada vrijedi
Var (aX + b) = a2 Var X.
Dokaz.
2

Var (aX + b) = E ((aX + b) (aEX + b)) =


2

= E (aX aEX) = a2 E(X EX)2 = a2 Var X.


2. Ako za sluajnu varijablu X vrijedi Var X = 0, onda ona zapravo nema karakter sluajnosti, tj. P {X = konst.} = 1. Oigledno je da vrijedi i drugi
smjer te tvrdnje, tj. ako za sluajnu varijablu X vrijedi P {X = konst.} = 1,
onda je Var X = 0.
Dokaz. Neka je Var X = 0. Tada vrijedi: E(X )2 = 0. S obzirom da
je (X )2 0, na skupu na kojemu je (X )2 > 0 mora biti pripadna
vjerojatnost 0, tj. P {(X )2 > 0} = 0. Odavde slijedi da je P {(X )2 =
0} = 1, tj. P {X = } = 1, to dokazuje prvu tvrdnju. Za dokaz druge tvrdnje
pretpostavimo P {X = c} = 1. Tada je EX = c, a Var X = E(X c)2 = 0.
3. Varijancu moemo raunati takoer primjenom formule
Var X = EX 2 (EX)2 .
Dokaz. Neka je EX = . Tada zbog linearnosti oekivanja vrijedi:
Var X = E(X )2 = E(X 2 2EX + 2 ) = EX 2 2 .

2.6.3

Oekivanje i varijanca nekih parametarskih diskretnih


distribucija

Parametarski se zadane familije distribucija esto koriste u praksi, a njihovi se parametri nerijetko mogu iskazati u terminima momenata. U ovom poglavlju izraunat

94

Sluajna varijabla

emo oekivanje i varijancu za diskretne parametarske familije definirane u poglavlju


2.4.
Diskretna uniformna distribucija
Za sluajnu varijablu X rekli smo da ima diskretnu uniformnu distribuciju ako
je njezin skup vrijednosti konaan podskup skupa realnih brojava , tj. R(X) =
{x1 , x2 , . . . , xn } R, a pripadni niz vjerojatnosti definiran je na sljedei nain:
pi = P {X = xi } =

1
, i = 1, 2, . . . , n.
n

Oekivanje je te sluajne varijable aritmetika sredina elemenata skupa R(X), tj.


EX =

n
X

xi pi =

i=1

1X
xi = xn .
n i=1

Za varijancu tada vrijedi:


n

Var X =

1X
(xi xn )2 .
n i=1

Specijalno, ako je skup vrijednosti {1, 2, 3, . . . , n}, tada je:


EX =

n+1
n2 1
, Var X =
.
2
12

Bernoullijeva distribucija
Za sluajnu varijablu rekli smo da ima Bernoullijevu distribuciju ako je zadana
tablicom distribucije
X=

0 1
1p p

!
,

p h0, 1i.

Oekivanje i varijanca te distribucije dani su sljedeim izrazima:


EX = p, Var X = p(1 p).
Uoimo da je sluajna varijabla IA iz dokaza teorema 2.4 Bernoullijeva sluajna
varijabla s parametrom p = P (A).

95

Numerike karakteristike sluajne varijable


Binomna distribucija

Binomna sluajna varijabla B(n, p) s parametrima n N i p h0, 1i definirana je


skupom vrijednosti {0, 1, 2, ..., n} s pripadnim vjerojatnostima
 
n i
pi = P {X = i} =
p (1 p)ni .
i
Oznaimo q = 1 p.
Prije negoli izraunamo oekivanje i varijancu binomne sluajne varijable uoimo
da za fiksne realne brojeva a i b vrijedi sljedee:
g(t) = (at + b)n =

n
X

n
i

i=0
0

n1

g (t) = n(at + b)

a=

n
X

n
X

i=1
00

g (t) = n(n 1)(at + b)

n2 2

a =

n
X

ai ti bni
n
i

i=1

g 0 (1) = n(a + b)n1 a =

!
ai ti1 bni
n
i

!
ai bni

i(i 1)

i=2
00

g (1) = n(n 1)(a + b)

n2 2

a =

n
X

i(i 1)

i=2

n
i

(2.3)

!
ai ti2 bni
n
i

!
ai bni

(2.4)

Primjenom izraza (2.3) dobivamo da je


n  
X
n i
EX =
i
p (1 p)ni = np(p + 1 p)n1 = np.
i
i=0
Primjenom izaza (2.3) i (2.4) dobivamo da je

Var X = EX 2 (EX)2 =

 
n
X
n i
i2
p (1 p)ni (np)2
i
i=0

= n(n 1)p2 + np (np)2 = npq.

Dakle, oekivanje i varijanca binomne sluajne varijable dani su sljedeim izrazima:


E(X) = np,

Var X = npq.

96

Sluajna varijabla

Primjer 2.34. Oekivanje i varijanca binomne sluajne varijable X s parametrima n = 50 i


p = 31 jesu
50
100
= np =
16.67, 2 = np(1 p) =
11.11,
3
9
dok je standardna devijacija = 10/3 3.33. Slikom 2.22 prikazana je distribucija te sluajne
varijable s oznaenim oekivanjem i granicama intervala [ 3, + 3] = [6.67, 26.67].

y
0.12
0.10
0.08
0.06
0.04
0.02
6.67

16.67 26.67

Slika 2.22: Distribucija sluajne varijable X B(50, 13 ).


Odredimo vjerojatnost realizacije te sluajne varijable unutar intervala h6.67, 26.67i, tj. vjerojatnost realizacije sluajne varijable udaljene od oekivanja za manje od tri standardne devijacije:
P {X h6.67, 26.67i} =

26    i  50i
X
50
1
2
i=7

0.997.

Dakle, ta e se sluajna varijabla s vjerojatnou priblino 0.997 realizirati unutar intervala [


3, + 3]. Koritenjem statistike interpretacije vjerojatnosti moemo zakljuiti da e, prilikom
puno nezavisnih realizacija te sluajne varijable, njih oko 99.7% pasti unutar tog intervala.
Koritenjem raunala odredite najkrai simetrian interval oko oekivanja za koji moemo tvrditi
da e sadrati barem 95% realizacije ove sluajne varijable prilikom puno nezavisnih ponavljanja
pokusa.

Poissonova distribucija
Sluajna varijabla X ima Poissonovu distribuciju s parametrom > 0 ako prima
vrijednosti iz skupa {0, 1, 2, . . . } s vjerojatnostima
pi = P {X = i} = e

i
.
i!

Izraunajmo oekivanje i varijancu Poissonove sluajne varijable:


EX =

X
X
X
e i
i
i1
i
= e
i = e

= e e = .
i!
i!
(i

1)!
i=0
i=0
i=1

97

Numerike karakteristike sluajne varijable

EX 2 =

i2

i=0

= e
= e

X
i
e i
= e
i
=
i!
(i 1)!
i=1

X
i1
(i 1 + 1)
=
(i 1)!
i=1

X
X
i1
i2
+

(i 2)! i=1 (i 1)!


i=2

!
=

= e [e + e ] = ( + 1),
Var X = EX 2 (EX)2 = 2 + 2 = .
Dakle, oekivanje i varijanca Poissonove sluajne varijable dani su sljedeim izrazom:
EX = Var X = .
Primjer 2.35. Oekivanje i varijanca Poissonove sluajne varijable X s parametrom = 4
jednaki su vrijednosti parametra , tj. 4, dok je standardna devijacija = 2. Slikom 2.23
prikazana je distribucija te sluajne varijable s oznaenim oekivanjem i granicama intervala
[ 2, + 2] = [0, 8].

y
0.20
0.15
0.10
0.05
4

Slika 2.23: Distribucija sluajne varijable X P(4).

Odredimo vjerojatnost realizacije te sluajne varijable unutar intervala [0, 8], tj. vjerojatnost
realizacije sluajne varijable udaljene od oekivanja za manje ili tono dvije standardne devijacije:
P {X [0, 8]} =

8
X
i=0

e4

4i
0.979.
i!

Dakle, ta e se sluajna varijabla s vjerojatnou priblino 0.979 realizirati unutar intervala [


2, + 2]. Koritenjem statistike interpretacije vjerojatnosti moemo zakljuiti da e, prilikom
puno nezavisnih realizacija te sluajne varijable, njih oko 97.8% pasti unutar tog intervala.

98

Sluajna varijabla

Odredite najkrai simetrian interval oko oekivanja za koji moemo tvrditi da e sadrati barem
95% realizacija te sluajne varijable prilikom puno nezavisnih ponavljanja pokusa. (Iskoristite
raunalo!)

Geometrijska distribucija
Sluajna varijabla X ima geometrijsku distribuciju s parametrom p h0, 1i ako
prima vrijednosti iz skupa {1, 2, 3, . . .} s vjerojatnostima
pk = P {X = k} = p(1 p)k1 .
Izraunajmo oekivanje i varijancu te distribucije.
Deriviranjem jednakosti

X
1
xi , |x| < 1,
=
1x
i=0

(2.5)

po x i primjenom dobivenog izraza uz x = 1 p slijedi


EX =

ip(1 p)i1 =

i=1

1
.
p

Primjenom druge derivacije izraza (2.5) uz x = 1 p dobivamo da je


Var X =

1p
.
p2

Primjer 2.36. Oekivanje i varijanca geometrijske sluajne varijable X s parametrom p = 1/3


jesu
1
1p
= = 3, 2 =
= 6,
p
p2

dok je standardna devijacija = 6 2.45. Slikom 2.24 prikazana je distribucija te sluajne


varijable s oznaenim oekivanjem i granicama intervala [ , + ] = [0.55, 5.45].
y

0.3
0.2
0.1
3 5.45

Slika 2.24: Distribucija geometrijske sluajne varijable s parametrom p = 13 .

Numerike karakteristike sluajne varijable

99

Odredimo vjerojatnost realizacije te sluajne varijable unutar intervala h0.55, 5.45i, tj. vjerojatnost
realizacije sluajne varijable udaljene od oekivanja za manje od jedne standardne devijacije:
P {X h0.55, 5.45i} =

5
X

ip(1 p)i1 0.579.

i=1

Dakle, ta e se sluajna varijabla s vjerojatnou priblino 0.579 realizirati unutar intervala [


, + ]. Koritenjem statistike interpretacije vjerojatnosti moemo zakljuiti da e, prilikom
puno nezavisnih realizacija te sluajne varijable, njih oko 57.8% pasti unutar tog intervala.
Koritenjem raunala odredite najkrai simetrian interval oko oekivanja za koji moemo tvrditi
da e sadrati barem 95% realizacije te sluajne varijable prilikom puno nezavisnih ponavljanja
pokusa.

2.6.4

Oekivanje i momenti neprekidne sluajne varijable

Za neprekidne sluajne varijable oekivanje se definira koritenjem pripadne funkcije


gustoe.
Definicija 2.14. Neka je X neprekidna sluajna varijabla s funkcijom gustoe f .
Ako je konaan integral
Z
|x|f (x) dx,

onda kaemo da sluajna varijabla X ima oekivanje i broj


Z
= EX =

xf (x) dx

zovemo matematiko oekivanje neprekidne sluajne varijable X.

Valja naglasiti da sva spomenuta svojstva oekivanja (vidi poglavlje 2.29) koja vrijede za diskretne sluajne varijable vrijede i za neprekidne sluajne varijable. Takoer, ako je dana realna funkcija realne varijable g, onda oekivanje sluajne varijable5 g(X) moemo raunati analogno diskretnom sluaju, ali koristei funkciju
gustoe i integral umjesto sume, tj.
Z
Eg(X) =

g(x)f (x) dx.

5 za

uvjete na funkciju g koji osiguravaju da je g(X) neprekidna sluajna vrijabla pogledati


primjerice [26]

100

Sluajna varijabla

Definicija je momenata onda identina definiciji momenata u diskretnom sluaju,


ali se momenti drugaije raunaju s obzirom da se definicije oekivanja razlikuju.
Tako je npr. drugi centralni moment, odnosno varijanca, definiran na sljedei nain:
Z

(x EX) f (x) dx.

V ar X =

Takoer se moe pokazati da pri toj definiciji ostaju sauvana sva svojstva varijance
dokazana u poglavlju 4.19 za diskretan sluaj, kao i navedene korisne nejednakosti
(vidi npr. [26]).
Primjer 2.37. Funkcija gustoe sluajne varijable definirana je pravilom
(
sin x , x h0, /2]
f (x) =
.
0 , x
/ h0, /2]
Izraunajmo momente EX, EX 2 , EX 3 , Var X, E[X E(X)]3 te neprekidne sluajne varijable:
EX =

/2
Z
x sin x dx = 1,

EX 2 =

EX 3 =

/2
Z
x2 sin x dx = 2,
0

/2
Z

x3 sin x dx =

3
( 8),
4

Var X = EX 2 (EX)2 = 3,

E (X EX)3 =

/2
Z
3 2
(x EX)3 sin x dx =
3 + 2.
4
0

2.6.5

Oekivanje i varijanca nekih parametarskih neprekidnih distribucija

Analogno parametarskim diskretnim distribucijama, za nastavak e kolegija biti


korisno izraunati i zapamtiti izraze za oekivanje i varijancu nekih parametarskih
neprekidnih distribucija koje se esto koriste. U tu je svrhu samo potrebno rijeiti
zadane integrale. S obzirom da je normalna sluajna vrijabla najvanija u klasi neprekidnih sluajnih varijabli, ovdje emo navesti samo izraun oekivanja i varijance
te distribucije, a za ostale navodimo eksplicitne izraze u tablici 2.1.
Oekivanje i varijanca normalne distribucije
Neka je X N (, 2 ), tj.
f (x) =

(x)2
1
e 22 ,
2

x R.

101

Numerike karakteristike sluajne varijable


Da bismo lake rijeili potrebne integrale, uoimo prvo da je funkcija
x2
1
g(x) = x e 2
2

neparna, na R integrabilna funkcija, pa je


Z
g(x) dx = 0.

Osim toga, zbog normiranosti funkcije gustoe neprekidne sluajne varijable znamo
da je
Z
x2
1
e 2 dx = 1.
2

Primjenom supstituciije t = (x )/ slijedi:

1
EX =
2
1
=
2

xe

(x)2
2 2

1
dx =
2

t2
1
t e 2 dt +
2

t2

(t + ) e 2 dt

t2

e 2 dt

= ,

1
EX =
2

2
=
2
2
=
2

x e

(x)2
2 2

2 t2

t e

1
dx =
2

2
dt +
2

t2

te

t2

t2 e 2 dt + 2 = 2

t2

(t + )2 e 2 dt

2
dt +
2

t2

t2 e 2 dt + 2 .

Gornji integral rjeavamo parcijalnom integracijom. Slijedi da je

t e
0

2 t2

dt =

Z
0

t2

e 2 dt = 2 .

t2

e 2 dt

102

Sluajna varijabla

Dakle, Var X = 2 .
Uoimo da su parametri i 2 normalne distribucije upravo njezino matematiko
oekivanje i varijanca, redom.
Primjer 2.38. Graf funkcije gustoe normalne sluajne varijable s oekivanjem = 5 i varijancom 2 = 1 prikazan je slikom 2.25.
y
0.4
0.3
0.2
0.1
4

Slika 2.25: Graf funkcije gustoe normalne distribucije N (5, 1).


Vidimo da funkcija gustoe ima maksimum u oekivanju, a za vrijednosti nezavisne varijable
x1 = i x2 = + ima toke infleksije. Odredimo vjerojatnost realizacije te sluajne
varijable unutar intervala [ , + ] = [4, 6], tj. vjerojatnost realizacije sluajne varijable
udaljene od oekivanja za manje ili tono jednu standardnu devijaciju (koristite raunalo!).
P {X [4, 6]} 0.682.
Provjerite da je P {X [ 2, + 2]} 0.955 i P {X [ 3, + 3]} 0.997.

Kratak pregled obraenih distribucija dan je u tablici 2.1.

Naziv distribucije
Bernoullijeva, p h0, 1i

Distribucija (gustoa)
!
0 1
1p p

Geometrijska

R(X)= 
{0, 1, 2, . . . , n}
n i
pi =
p (1 p)ni
i
R(X) = N0
i
pi = e
i!
R(X) = N

G(p), p h0, 1i

pi = p(1 p)i1

Binomna
B(n, p), n N, p h0, 1i
Poissonova
P(), > 0

Oekivanje

Varijanca

p(1 p)

np

np(1 p)

1
p

1p
p2

103

Transformacija sluajne varijable


Naziv distribucije

Distribucija (gustoa)

Oekivanje

Varijanca

a+b
2

(b a)2
12

1
2
2
2

Uniformna na ha, bi
U(a, b), a < b

f (x) =

1
I(a,b) (x)
ba

Eksponencijalna
E(), > 0

f (x) = ex I[0,) (x)

Laplaceova, > 0

f (x) = 12 e|x|

Normalna
N (, 2 ), R, > 0

f (x) =

(x)2
1
e 22
2

Tablica 2.1: Tablica distribucija ili funkcija gustoa te oekivanja i varijanci vanijih parametarskih familija diskretnih i neprekidnih distribucija.

2.7
2.7.1

Transformacija sluajne varijable


Postupak standardizacije

Koritenjem svojstava oekivanja i varijance dokazat emo da svaku sluajnu varijablu koja ima varijancu moemo afino transformirati (dodavanjem konstante i
mnoenjem s konstantom razliitom od 0) tako da novonastala sluajna varijabla
ima oekivanje 0 i varijancu 1. Takav se postupak transformiranja sluajne varijable
u statistici naziva postupak standardizacije.
Propozicija 2.3. Neka je X sluajna varijabla s oekivanjem R i varijancom
2 > 0. Tada sluajna varijabla
Y =

X
, = 2 ,

ima oekivanje 0 i varijancu 1.


Dokaz. Koritenjem rezultata poglavlja 2.6 vidimo da vrijedi:
EY =

1
(EX ) = 0,

Var Y =

1
Var X = 1.
2

Vidimo da smo postupkom standardizacije lako promijenili varijancu i oekivanje


sluajne varijable, ali je ovdje ostalo nejasno to se pri toj transformaciji dogodilo
s njezinom funkcijom distribucije, tj. na koji je nain ona promijenjena.

104

Sluajna varijabla

Propozicija 2.4. Neka je X sluajna varijabla s funkcijom distribucije FX (x),


oekivanjem R i varijancom 2 > 0. Tada sluajna varijabla
Y =

X
, = 2 ,

ima funkciju distribucije FY (x) = FX (x + ).


Dokaz. S obzirom da je > 0, vrijedi:


X
FY (x) = P {Y x} = P
x = P {X x + } = FX (x + ).

Primjer 2.39. Neka je X B(n, p), n N, p h0, 1i. Postupkom standardizacije dobivamo
sluajnu varijablu
X np
Y = p
.
np(1 p)
Uoimo da Y vie nema distribuciju u binomnoj familiji!
Primjer 2.40. Neka je X P(), > 0. Postupkom standardizacije dobivamo sluajnu varijablu
Y =

X
.

Uoimo da Y vie nema distribuciju u Poissonovoj familiji!


Primjer 2.41. Neka je X U (a, b). Funkcija distribucije sluajne varijable X dana je izrazom

0
, x<a

Zx
xa
,
ax<b .
f (x) dx =
FX (x) =

ba

1
, xb
Postupkom standardizacije dobivamo sluajnu varijablu Y sa sljedeom funkcijom distribucije

0
, x + < a

x + a
, a x + < b ,
FY (x) = FX (x + ) =

ba

1
, x + b
tj.

FY (x) =

0
x a

b
a

, x<
,

x<

b
, x

1

a b
Odavde vidimo da je Y U
,
, tj. postupak standardizacije zadrao je sluajnu

varijablu u istoj klasi, ali s drugim parametrima.




Primjer 2.42. Neka je X N (, 2 ). Postupkom standardizacije dobivamo sluajnu varijablu


Z=
Provjerite ovu tvrdnju!

X
N (0, 1).

105

Transformacija sluajne varijable

2.7.2

Bijektivna transformacija sluajne varijable

Postupkom standardizacije transformiramo sluajnu varijablu afinom funkcijom s


pozitivnim koeficijentom smjera. Naime, u postupku standardizacije novonastala
x
sluajna varijabla Y kompozicija je afine funkcije g(x) =
i sluajne varijable

X, tj. Y = g(X). Pokazali smo da se, kod ovako jednostavne funkcije g, moe lako
odrediti funkcija distribucije novonastale sluajne varijable. Slian postupak moe
se primijeniti kod svih transformacija bijektivnim funkcijama g. Ako je sluajna
varijabla X diskretna, opisanim postupkom dobivamo sluajnu varijablu Y = g(X)
koja je takoer diskretnog tipa. Meutim, ako je X apsolutno neprekidna, Y =
g(X) e biti apsolutno neprekidna samo ako je mogue izraziti njezinu funkciju
distribucije pomou funkcije gustoe.
Primjer 2.43. Neka je dana diskretna sluajna varijabla X tablicom distribucije
!
X
x1 x2 . . . x n . . .
pi = 1, I N,
X=
, 0 pi 1,
p1 p2 . . . p n . . .
iI
i neka je g : R(X) R bijekcija. Tada je sluajna varijabla Y = g(X) zadana tablicom distribucije
Y =

g(x1 ) g(x2 ) . . . g(xn ) . . .


p1
p2 . . . pn . . .

!
X

pi 1,

pi = 1

I N.

iI

Primjer 2.44. Neka je dana neprekidna sluajna varijabla X funkcijom gustoe f i neka je
bijekcija g : R R definirana pravilom g(x) = ex . Tada je Y = g(X) = eX neprekidna sluajna
1
varijabla s funkcijom gustoe h(x) = f (ln x) za x > 0 i h(x) = 0 za x 0.
x
Zaista,
(
0
, x0
FY (x) = P {Y x} = P {g(X) x} =
.
P {X g 1 (x)} , x > 0
Nadalje, za x > 0 vrijedi:
P {X g 1 (x)} =

g 1 (x)

ln x

f (t) dt =

f (t) dt.

Uz supstituciju t = ln u slijedi:
x

P {X g 1 (x)} =

f (ln u)
0

1
du.
u

Definiranjem funkcije
h(u) =

0
f (ln u)

, u0
1
, u>0
u

vidimo da je ona nenegativna i vrijedi


Z

P {Y x} =

h(u) du,

pa je time pokazano da je h(u) funkcija gustoe sluajne varijable Y .

106

Sluajna varijabla

Primjer 2.45. Neka je neprekidna sluajna varijabla X zadana funkcijom gustoe f i neka je
g(x) = ex . Tada se analognim postupkom kao u primjeru 2.44 vidi da je Y = g(X) = eX
1
neprekidna sluajna varijabla s funkcijom gustoe h(x) = f ( ln(x)) za x > 0 i h(x) = 0 za
x
x 0.

Za neprekidnu sluajnu varijablu X i bijekciju g : R R(g) R moe se odrediti


openiti izraz za funkciju gustoe sluajne varijable Y = g(X) ako je ona neprekidna
sluajna varijabla. O tome govori teorem 2.5.
Teorem 2.5. Neka je X neprekidna sluajna varijabla, fX njezina funkcija gustoe,
a FX funkcija distribucije. Neka je, nadalje, g : R R(g) R bijekcija. Ako je
funkcija g derivabilna na R, onda je Y = g(X) neprekidna sluajna varijabla s
funkcijom gustoe
(
0
fX (g 1 (y))|[g 1 (y)] | , y R(g)
fY (y) =
.
0
, y (R(g))c
Dokaz. Neka je X neprekidna sluajna varijabla i g bijekcija kao u iskazu teorema.
Traimo funkciju distribucije FY sluajne varijable Y = g(X). Uoimo da vrijedi:
FY (y) = P {Y y} = P {g(X) y}.
Da bismo izrazili P {g(X) y} u terminima P {X A} za neki skup A R
(tj. u terminima funkcije distribucije sluajne varijable X), potrebno je rijeiti
nejednadbu
g(x) y.
S obzirom da je g bijekcija s R na R(g) R, postupak rjeavanja ovisi samo o tome
da li je g monotono rastua ili monotono padajua funkcija.
Neka je g : R R(g) monotono rastua funkcija.
Tada za sve y R(g) vrijedi:
FY (y) = P {Y y} = P {g(X) y} = P {X g 1 (y)} = FX (g 1 (y)).
Ako je funkcija g derivabilna na R, onda je i funkcija FX (g 1 (y)) derivabilna na
R(g), pa moemo definirati funkciju
fY (y) =

0
dFX (g 1 (y))
= fX (g 1 (y))[g 1 (y)] ,
dy

y R(g).

Uoimo da je fY nenegativna funkcija s obzirom da su FX i g monotono rastue


funkcije. Takoer vrijedi:
Z
Z
0
1
1
fX (g (y))[g (y)] dy =
fX (x) dx = 1.
R(g)

107

Transformacija sluajne varijable


Sada moemo proiriti funkciju fY (y) na cijeli R tako da definiramo:
(
fY (y) =

fX (g 1 (y))[g 1 (y)] , y R(g)


.
0
, y (R(g))c

Neka je g : R R(g) monotono padajua funkcija.


Tada za sve y R(g) vrijedi:
FY (y) = P {Y y} = P {g(X) y} = P {X g 1 (y)} =
= 1 P {X < g 1 (y)} = 1 FX (g 1 (y)).
Ako je funkcija g derivabilna na R onda je i funkcija (1 FX (g 1 (y))) derivabilna
na R(g), pa moemo definirati funkciju
fY (y) =

0
d(1 FX (g 1 (y)))
= fX (g 1 (y))[g 1 (y)] ,
dy

y R(g).

Uoimo da je fY nenegativna funkcija jer je fX (g 1 (y)) 0 zbog nenegativnosti


0
funkcije fX , a [g 1 (y)] < 0 s obzirom da je g monotono padajua funkcija. Takoer
vrijedi:
Z
Z


0
fX (g 1 (y))[g 1 (y)] dy =
fX (x) dx = 1.
R(g)

Sada moemo proiriti funkciju fY (y) na cijeli R tako da definiramo:


(
fY (y) =

fX (g 1 (y))[g 1 (y)] , y R(g)


.
0
, y (R(g))c

Prema prethodnim rezultatima slijedi da za derivabilnu bijekciju g : R R(g)


moemo definirati funkciju fY : R R izrazom:


(
0

fX (g 1 (y)) [g 1 (y)] , y R(g)
fY (y) =
.
0
, y (R(g))c
Ta je funkcija nenagativna i vrijedi:
Z

FY (y) =

fY (t) dt.

Dakle, Y je neprekidna sluajna varijabla s funkcijom gustoe fY .

108

Sluajna varijabla

2.7.3

Primjeri transformacija koje nisu bijektivne

Ako transformacija sluajne varijable nije bijekcija, takoer je mogue odrediti distribuciju novonastale sluajne varijable, ali je postupak tehniki zahtjevniji. Za
ilustraciju emo se posluiti primjerima.
Primjer 2.46. Pretpostavimo da je diskretna sluajna varijabla X dana tablicom distribucije
!
X
x1 x2 . . . xn . . .
X=
, pi 1,
pi = 1.
p1 p2 . . . pn . . .
i
Neka je g : R(X) R proizvoljna funkcija te neka je sluajna varijabla Y definirana kao Y =
g(X). Oznaimo R(Y ) = {y1 , y2 , . . . , yk , . . . }. Tada sluajna varijabla Y ima tablicu distribucije
!
X
y1 y2 . . . y k . . .
, qk 1,
Y =
qk = 1,
q1 q2 . . . qk . . .
k
gdje je
X

qk =

P {} =

{|g(X())=yk }

pi .

{i|g(xi )=yk }

Primjer 2.47. Pretpostavimo da je sluajna varijabla X zadana tablicom distribucije


!
a 0 a
X=
.
0.4 0.2 0.4
Tada sluajna varijabla Y = X 2 , koja je dobivena kompozicijom sluajne varijable X i nebijektivne
funkcije g(t) = t2 , g : R R, ima distribuciju zadanu tablicom
!
0 a2
X=
.
0.2 0.8
Primjer 2.48. Neka je X neprekidna sluajna varijabla zadana funkcijom gustoe f . Tada je
Y = X 2 neprekidna sluajna varijabla s funkcijom gustoe

0
, x<0


1
.
h(x) =
f ( x) + f ( x) , x 0
2 x
Zaista, za x < 0 je P {Y x} oigledno jednako 0. Za x 0 je

P {Y x} = P {X 2 x} = P { x X x} =

Zx

Zx
f (t) dt =
(f (t) + f (t)) dt.

Supstitucijom t =

u u tom integralu vidimo da za x 0 vrijedi:


Zx

P {Y x} =
0


1
f ( u) + f ( u) du =
2 u

Zx
h(u) du.
0

Dakle, h je funkcija gustoe neprekidne sluajne varijable Y = X 2 .


Odredite funkciju gustoe neprekidne sluajne varijable Y = X 2 ako je X standardna normalna
sluajna varijabla, tj. X N (0, 1).

109

Generiranje sluajnih varijabli

2.8

Generiranje sluajnih varijabli

Vaan je nain ispitivanja istinitosti tvrdnji koje se odnose na sluajne varijable provjera tih tvrdnji na podacima. Meutim, podaci koji se u tu svrhu trebaju koristiti
realizacije su sluajne varijable. Pitanje je kako prikupiti podatke iz sluajne varijable zadane distribucije. Radi ilustracije problema zamislimo da elimo dobiti 30
podataka koji su realizacije Bernoullijeve sluajne varijable s tablicom distribucije
!
0 1
X= 1 1 .
2 2

Za to postoji nekoliko jednostavnih naina. Primjerice, bacimo pravilno izraen


novi 30 puta i pri tome biljeimo 0 ako je palo pismo, a 1 ako se okrenula glava.
Ili uzmemo kutijicu s istim brojem bijelih i crnih kuglica pa iz nje na sluajan nain
izvlaimo jednu kuglicu 30 puta, ali tako da svaki puta izvuenu kuglicu vratimo u
kutijicu i promijeamo. Pritom biljeimo 0 ako je izvuena bijela kuglica, a 1 ako
je izvuena crna kuglica.
Meutim, kako emo dobiti podatke iz, primjerice, normalne distribucije sa zadanim
oekivanjem i varijancom?
Posebno koristan rezultat koji se koristi u tu svrhu odnosi se na distribuciju sluajne
varijable F , gdje je F funkcija distribucije sluajne varijable X.
Naime, pretpostavimo da je X neprekidna sluajna varijabla s funkcijom distribucije
F . S obzirom da je X neprekidna sluajna varijabla, njezina je funkcija distribucije
na nosau funkcije gustoe (tj. na skupu {x R : f (x) > 0}) neprekidna rastua
bijekcija. Za funkciju distribucije FU sluajne varijable U = F (X) vrijedi:

0
,u<0

1
FU (u) = P {U u} = P {F (X) u} = P {X F (u)} , u [0, 1) .

1
, ,u 1
S obzirom da je P {X F 1 (u)} = F (F 1 (u)) = u, vidimo da je U U(0, 1), i
to neovisno o funkciji distribucije F sve dok je ona funkcija distribucije neprekidne
sluajne varijable.
Pogledajmo i drugi smisao toga rezultata. Poimo od sluajne varijable U U(0, 1).
Odaberimo funkciju distribucije F neprekidne sluajne varijable X koju elimo modelirati. Oigledno je da se distribucija sluajne varijable X moe dobiti kao distribucija kompozicije F 1 (U ). Naime, vrijedi:
P {F 1 (U ) x} = P {U F (x)} = F (x).

110

Sluajna varijabla

Dakle, ako trebamo generirati n podataka iz neprekidne sluajne varijable s distribucijom F , dovoljno je da imamo niz podataka (ui , i = 1, . . . , n) iz U(0, 1). Traene
podatke tada dobijemo kao (F 1 (ui ), i = 1, . . . , n).
Za generiranje se realizacija uniformne distribucije na h0, 1i danas koriste takozvani
generatori sluajnih brojeva koji su ugraeni u sve naprednije raunalne programe.
Uniformna distribucija na intervalu h0, 1i moe se takoer iskoristiti i za generiranje
realizacija diskretnih distribucija. Zainteresirani itatelj moe vie informacija o
tome pronai u [8].

2.9

Zadaci

Zadatak 2.1. Promotrimo sluajan pokus koji se sastoji od bacanja pravilno izraenog novia dva puta zaredom. Neka je X sluajna varijabla ija je vrijednost broj realiziranih pisama.
Odredite tablicu distribucije sluajne varijable X.
Rjeenje:

0 1 2

X=
1 1 1
4 2 4

Zadatak 2.2. Strijelac na raspolaganju ima tri metka i gaa metu dok je ne pogodi ili dok ne
potroi sva tri metka. Neka je X sluajna varijabla ija je vrijednost broj potroenih metaka. Uz
pretpostavku o nezavisnosti gaanja tablicu distribucije od X ako je poznato da je vjerojatnost
pogotka mete pri svakom gaanju jednaka 0.8.
Rjeenje:
X=

1
2
3
0.8 0.16 0.04

Zadatak 2.3. Promotrimo sluajan pokus koji se sastoji od bacanja pravilno izraene igrae
kockice dva puta zaredom. Neka je X sluajna varijabla ija je vrijednost zbroj realiziranih brojeva
u oba bacanja. Odredite tablicu distribucije sluajne varijable X.
Rjeenje:

2 3 4 5 6 7 8 9 10 11 12

X=
1 1 1 1 5 1 5 1 1 1 1
36 18 12 9 36 6 36 9 12 18 36

111

Zadaci

Zadatak 2.4. Iz kutije u kojoj se nalazi 7 kuglica numeriranih brojevima od 1 do 7 izvlae


se istovremeno tri kuglice {i, j, k}. Odredite tablicu distribucije i funkciju distribucije sluajne
varijable X definirane na sljedei nain:
X({i, j, k}) = max(i, j, k), i, j, k {1, . . . , 7}.
Rjeenje:
Tablica distribucije:

3 4 5 6 7
X = 1 3 6 10 15
35 35 35 35 35
Funkcija distribucije:

1/35

4/35
F (x) =

10/35

20/35

,
,
,
,
,
,

x (, 3)
x [3, 4)
x [4, 5)
x [5, 6)
x [6, 7)
x [7, )

Zadatak 2.5. Iz kutije u kojoj se nalazi 5 kuglica numeriranih brojevima od 1 do 5 izvlae se


istovremeno tri kuglice (koje su numerirane brojevima i, j i k gdje su i, j, k {1, . . . , 5}). Odredite
tablicu distribucije i funkciju distribucije sluajne varijable X definirane na sljedei nain:
X({i, j, k}) = min{i, j, k}, i, j, k {1, . . . , 5}.

Zadatak 2.6. U smjeru kretanja automobila nalaze se redom tri semafora koji rade nezavisno
jedan od drugog. Na svakomu se s vjerojatnou p = 0.5 pojavljuje crveno i s vjerojatnou q = 0.5
zeleno svjetlo. Sluajna varijabla X predstavlja broj semafora pored kojih prolazi automobil do
prvog zaustavljanja. Odredite tablicu distribucije i funkciju distribucije sluajne varijable X te
nacrtajte graf funkcije distribucije.
Rjeenje:
Tablica distribucije:

0 1 2 3
X=1 1 1 1
2 4 8 8
Funkcija distribucije:

1/2

F (x) = 3/4

7/8

,
,
,
,
,

x (, 0)
x [0, 1)
x [1, 2)
x [2, 3)
x [3, )

Zadatak 2.7. Odredite matematiko oekivanje i varijancu sluajne varijable zadane sljedeom
tablicom distribucije
!
0 1 2
3
4
X=
.
1/2 1/4 1/8 1/16 1/16

112

Sluajna varijabla

Rjeenje:
E(X) =

15
,
16

367
.
256

Var X =

Zadatak 2.8. Sluajna varijabla X zadana je tablicom distribucije


!
1 0
1
3 4 8
,
X=
a 1/8 a b2 b2 1/4 b
gdje su a i b nepoznati parametri. Ako je oekivanje od X 25/8, odredite:
a) vrijednosti parametara a i b,
b) varijancu sluajne varijable X,
c) funkciju distribucije sluajne varijable X.
Rjeenje:

a) a =

3
1
,b=
16
4

b) Var X =

719
64

c) Funkcija distribucije:

3/16

5/16
F (x) = 7/16

1/2

3/4

,
,
,
,
,
,
,

x (, 1)
x [1, 0)
x [0, 1)
x [1, 3)
x [3, 4)
x [4, 8)
x [8, )

Zadatak 2.9. Ispitujemo ispravnost sustava koji se sastoji od tri komponente. Otkazivanje komponenti dogaa se nezavisno i vjerojatnost je otkazivanja n-te komponente
pn = 0.2 + (n 1) 0.1,

n {1, 2, 3}.

Odredite distribuciju, matematiko oekivanje i varijancu sluajne varijable kojom je modeliran


broj komponenti koje su otkazale.
Rjeenje:
X=

0
1
2
3
0.336 0.452 0.188 0.024

!
,

EX = 0.9,

Var X = 0.61.

Zadatak 2.10. U spremniku se nalazi pet kutija: dvije su prazne, a u preostalim trima nalazi se
po deset bombona. Izvlaimo jednu po jednu kutiju sve dok ne izvuemo praznu kutiju (izvlaenje
se vri bez vraanja prethodno izvuenih kutija u spremnik). Kolika je vjerojatnost da izvuemo
svih 30 bombona? Odredite distribuciju, matematiko oekivanje i varijancu sluajne varijable
kojom je modeliran broj bombona koje smo izvukli.
Rjeenje:
Y =

0 10 20 30
2/5 3/10 1/5 1/10

!
,

EY = 10,

Var Y = 100.

113

Zadaci
Zadatak 2.11. Diskretna sluajna varijabla zadana je tablicom distribucije
!
1 1 1+
, > 0.
X=
p 2p 3p
a) Odredite vrijednost parametra p.

b) Izraunajte matematiko oekivanje, drugi moment i trei apsolutni moment sluajne varijable X.
c) Izraunajte
P

n
o
|X| 1 +
.
2

Rjeenje:
a) p = 1/6,
(
b) EX =

+3
,
3

EX 2 = 1 + 23 (1 + ), E|X|3 =

(3 + 62 + 3 + 3)/3 , 0 < 1
,
(23 + 32 + 3 + 2)/3 , > 1

c) P {|X| 1 + /2} = 1/3.

Zadatak 2.12. Diskretna sluajna varijabla zadana je tablicom distribucije


!
1 3 5 7 9 11
X=
.
3p 1/8 1/8 2p 1/8 p
Izraunajte:
a) vrijednost parametra p,
b) matematiko oekivanje i varijancu sluajne varijable Y = min{8, X}.
Rjeenje:
a) p = 5/48,
b)
Y =

1
3 5
7
8
5/16 1/8 1/8 5/24 11/48

!
,

EY = 221/48,

Var Y = 18983/2304.

Zadatak 2.13. Diskretna sluajna varijabla zadana je tablicom distribucije


!
2 4 6 8 10 12
X=
.
2p 1/6 1/4 3p 1/8 p
Izraunajte:
a) vrijednost parametra p,
b) matematiko oekivanje i varijancu sluajne varijable Y = max{5, X} 1.

Zadatak 2.14. Diskretna sluajna varijabla zadana je tablicom distribucije


!
2 1 0 1 2
X=
.
0.1 0.1 0.2 0.3 0.3
Odredite distribuciju, funkciju distribucije, oekivanje i varijancu sluajne varijable Y = 3X 2 3.

114

Sluajna varijabla

Zadatak 2.15. Diskretna sluajna varijabla zadana je tablicom distribucije


!
2 1 0 1 2
.
X=
0.1 p 0.3 3p 0.2
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne


varijable Y = X 3 1 .

Zadatak 2.16. Diskretna sluajna varijabla zadana je tablicom distribucije:


!

/3 /2 2/3 5/6
6
X=
.
0.25 0.2 0.3 0.15 0.1
Odredite distribuciju, funkciju distribucije, oekivanje i varijancu sluajne varijable Y = 3
2 cos2 X.

Zadatak 2.17. Diskretna sluajna varijabla zadana je tablicom distribucije


!
0 /4 /2 3/4
X=
.
p 0.2 0.1 0.3 0.2
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne

varijable Y = sin X te izraunajte P {0 < Y 2/2}.

Zadatak 2.18. Diskretna sluajna varijabla zadana je tablicom distribucije


!
/2 /3 0 /3 /2
X=
.
0.25 0.25 p 0.15 0.15
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne
varijable Y = cos X.

Zadatak 2.19. Diskretna sluajna varijabla zadana je tablicom distribucije


!
/2 0 /2
X=
.
p p/2 2p p/2
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne
varijable Y = e| sin X| .

Zadatak 2.20. Diskretna sluajna varijabla zadana je tablicom distribucije


!
e2 e1 1 e e2
X=
.
0.2 0.1 p 0.2 0.3
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne
varijable Y = (ln X)2 te izraunajte P {Y 1}.

115

Zadaci
Zadatak 2.21. Diskretna sluajna varijabla zadana je tablicom distribucije
!
e3 e1 1 e3 e5
X=
.
p 2p 3p 2p 2p

Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne


varijable Y = | ln X|.

Zadatak 2.22. Diskretna sluajna varijabla zadana je tablicom distribucije


!
33 31 1 3 33
X=
.
0.3 p 2p 0.2 0.2
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne
varijable Y = (log3 X)2 .

Zadatak 2.23. Diskretna sluajna varijabla zadana je tablicom distribucije


!
0 ln 2 2 ln 2 3 ln 2 4 ln 2
X=
.
0.2 p 0.15 0.25 0.15
Odredite vrijednost parametra p, distribuciju, funkciju distribucije, oekivanje i varijancu sluajne
varijable Y = eX .

Zadatak 2.24. Sluajna varijabla X zadana je distribucijom


P {X = k} =

1
,
2k

k N.

Odredite distribuciju sluajne varijable Y = cos (X).


Rjeenje: R(Y ) = {1, 1}, P {Y = 1} = 2/3, P {Y = 1} = 1/3.

Zadatak 2.25. Poznato je da je u velikom skladitu trgovine informatikom opremom vjerojatnost pojavljivanja prijenosnog raunala s grekom nastalom u proizvodnji jednaka 0.02. Pretpostavimo da iz tog skladita biramo 10 prijenosnih raunala. Odredite sljedee vjerojatnosti:
a) vjerojatnost da je tono 5 prijenosnih raunala s grekom,
b) vjerojatnost da su s grekom najvie 3 prijenosna raunala;
c) vjerojatnost da je s grekom barem 6 prijenosnih raunala.
Rjeenje: a) P {X = 5} = 0.000000728.

Zadatak 2.26. U Bernoullijevoj shemi (n nezavisnih ponavljanja Bernoullijevog pokusa) zadana


vjerojatnost uspjeha iznosi p, p h0, 1i. Odredite najmanji potreban broj pokusa koje treba
provesti da bismo s vjerojatnou r imali barem jedan uspjeh.

116

Sluajna varijabla

Rjeenje: n =

ln (1 r)
.
ln (1 p)

Zadatak 2.27. Poznata osjeka pizzeria primi u prosjeku 240 narudbi tijekom jednog sata.
Odredite vjerojatnost da u vremenskom periodu od jedne minute:
a) nije primljena niti jedna narudba;
b) primljene su barem dvije narudbe.
Rjeenje: a) P {X = 0} = e4 ,

b) P {X 2} = 1 5e4 .

Zadatak 2.28. Neka telefonska centrala primi u prosjeku 120 poziva tijekom jednog sata. Zbog
iznenadnog kvara na centrali tijekom jedne minute pozivi nisu primani. Kolika je vjerojatnost da
u tom periodu centrali nije bilo upueno vie od 4 poziva?
Rjeenje: P {X < 4} =

19e2
.
3

Zadatak 2.29. Proizvodi u tvornici, meu kojima se neispravan proizvod nalazi s vjerojatnou
0.007, pakuju se u kutije po 100 komada. Kolika je vjerojatnost da kutija ne sadri niti jedan
pokvaren proizvod, a kolika da sadri dva ili vie pokvarenih proizvoda?
Rjeenje: P {X = 0} = 0.4954,

P {X 2} = 0.1554.

Zadatak 2.30. Sluajnom pokusu bacanja nepravilno izraenog novia pripada dvolani prostor
elementarnih dogaaja {P, G}. Vjerojatnost realizacije pisma u jednom provoenju tog pokusa
iznosi p = 0.3. Koliko je puta potrebno ponoviti taj sluajni pokus da bismo s vjerojatnou 0.9
mogli tvrditi da se pismo realiziralo barem jednom?

Zadatak 2.31. Sluajan pokus sastoji se od bacanja pravilno izraene igrae kockice etiri puta.
Neka je broj pojavljivanja broja 5 vrijednost sluajne varijable X. Odredite zakon razdiobe sluajne varijable X, njezino oekivanje, varijancu te vjerojatnost da je broj 5 pao barem jednom.

Zadatak 2.32. Promotrimo sljedeu igru na sreu:


- u svakoj partiji igre jednom se bacaju etiri pravilno izraene igrae kockice,
- igra u svakoj partiji igre ulae jednu kunu ("kladi" se na jednu kunu),
- u svakoj partiji igra ili gubi ili neto zarauje. Ako se niti na jednoj kockici nije okrenula
estica, gubi uloenu kunu. Zarauje prema sljedeoj shemi: dobiva jednu kunu za svaku
esticu koja se okrenula na baenim kockicama i u tom sluaju zadrava i svoju uloenu
kunu.
Izraunajte oekivani iznos igraevog dobitka (gubitka).
Rjeenje: oekivanje je sluajne varijable kojom modeliramo igraev dobitak/gubitak 0.08 (ako
igra u svakoj partiji igre ulae 1 kn za svakih sto odigranih partija, oekuje se gubitak od 8 kn).

117

Zadaci

Zadatak 2.33. Telefonist zaposlen u slubi za korisnike nekog poduzea zarauje 10 kuna po
primljenom pozivu klijenta. Poznato je da telefonist u tom poduzeu u danu primi u prosjeku 20
takvih poziva.
a) Odredite distribuciju sluajne varijable kojom modeliramo dnevnu zaradu telefonosta u tom
poduzeu i odredite njegovu oekivanu dnevnu zaradu.
b) Izraunajte vjerojatnost da telefonist u jednom danu zaradi barem 180 kuna.
Rjeenje:
a) X P(20) - sluajna varijabla kojom se modelira broj poziva koje telefonist primi u
jednom danu; Y = 10 X - sluajna varijabla kojom se modelira dnevna zarada telefonista;
EY = 200.
17
P
20k 20
b) P {Y 180} = 1
e
.
k!
k=0

Zadatak 2.34. U poiljci audio opreme nalazi se 100 mikrofona od kojih je 20 neispravno. Vlasnik
trgovine audio opremom, koji ne zna broj neispravnih mikrofona u poiljci, odluuje da e za svoju
trgovinu uzeti poiljku ako meu 10 sluajno odabranih mikrofona ne bude vie od 3 neispravna.
a) Kolika je vjerojatnost da e trgovac prihvatiti poiljku?
b) to zakljuujete o vjerojatnosti prihvaanja poiljke u sluaju da poiljka sadri jednak broj
ispravnih i neispravnih mikrofona?
Rjeenje:
a) P {X 3} = 0.89,
b) poiljka e s veim brojem neispravnih mikrofona biti prihvaena s manjom vjerojatnou.

Zadatak 2.35. Posuda sadri 1000 lukovica tulipana, od kojih je 400 lukovica crvenih tulipana i
600 lukovica tulipana drugih boja. Iz te posude na sluajan nain odaberemo 10 lukovica.
a) Kolika je vjerojatnost da smo odabrali tono pet lukovica crvenih tulipana?
b) Koliki je oekivani broj izvuenih lukovica crvenih tulipana?
Zadatke rijeite pomou hipergeometrijske i binomne distribucije.
Rjeenje: primjenom hipergeometrijske distribucije dobivamo
a) P {X = 5} = 0.201,
b) EX = 4.

Zadatak 2.36. Student rjeava pismeni ispit koji se sastoji od trideset pitanja od kojih svako nosi
5 bodova. Na svako pitanje ponuena su tri odgovora od kojih je samo jedan toan. Pretpostavimo
da odgovore na sva pitanja student odabire na sluajan nain.
a) Odredite distribuciju sluajne varijable kojom modeliramo broj bodova koje student ostvaruje na tom ispitu te odredite oekivani broj ostvarenih bodova.
b) Izraunajte vjerojatnost da takvim rjeavanjem ispita student ostvari barem 80 bodova.

118

Sluajna varijabla

Rjeenje:
a) X B(30, 1/3) - sluajna varijabla kojom se modelira broj tonih odgovora na ispitu;
Y = 5 X - sluajna varijabla kojom se modelira broj bodova na ispitu; E Y = 50.
b) P {Y 80} = 1

15
P
k=1

30
k


1 k
3


2 30k
.
3

Zadatak 2.37. U bubnju se nalazi sedam omotnica: tri su prazne, a u preostalim etirima nalazi
se po 100 kuna. Igra izvlai jednu po jednu omotnicu sve dok ne izvue praznu (izvlaenje se vri
bez vraanja prethodno izvuenih omotnica u bubanj).
a) Odredite distribuciju sluajne varijable X kojom je modeliran broj izvuenih omotnica.
b) Odredite transformaciju sluajne varijable X kojom je modeliran osvojeni iznos kuna te
izraunajte njezino matematiko oekivanje i varijancu. Interpretirajte dobivene rezultate.
c) Kolika je vjerojatnost da igra osvoji barem 200 kuna?
Rjeenje:
a) X =

1 2
3
4
5
3/7 2/7 6/35 3/35 1/35

!
.

b) Y = 100(X 1) - sluajna varijabla kojom je modeliran osvojeni iznos kuna; EY = 100;


Var Y = 1002 (51/35).
c) P {Y 200} = P {X 3} = 2/7.

Zadatak 2.38. U eiru se nalazi osam kutijica: etiri su prazne, a u preostalim etirima nalaze
se kljuevi etiriju sefova od kojih svaki sadri po jedan dijamant. Igra izvlai jednu po jednu
kutijicu sve dok ne izvue praznu (izvlaenje se vri bez vraanja prethodno izvuenih kutijica u
eir).
a) Odredite distribuciju sluajne varijable X kojom je modeliran broj izvuenih kutijica.
b) Odredite transformaciju sluajne varijable X kojom je modeliran broj osvojenih dijamanata te izraunajte njezino matematiko oekivanje i varijancu. Interpretirajte dobivene
rezultate.
c) Kolika je vjerojatnost da igra osvoji barem dva dijamanta?
Rjeenje:
a) X =

1 2 3
4
5
1/2 2/7 1/7 2/35 1/70

!
.

b) Y = X 1 - sluajna varijabla kojom je modeliran broj osvojenih dijamanata; EY = 4/5;


Var Y = 118/175.
c) P {Y 2} = P {X 3} = 4/7.

119

Zadaci

Zadatak 2.39. Automat za igre na sreu u nekoj kockarnici programiran je tako da se prirodan
broj n realizira s vjerojatnou 2/3n , tj.
P {X = n} =

2
,
3n

n N.

Izraunajte matematiko oekivanje i varijancu sluajne varijable X te pomou ebievljeve nejednakosti ocijenite vjerojatnost da realizacija sluajne varijable X od njezinog oekivanja odstupa
za barem dvije standardne devijacije.
n
o
Rjeenje: EX = 3/2, Var X = 3/4, P X 34 3 14 .

Zadatak 2.40. Sluajna varijabla X ima binomnu distribuciju s parametrima n i p, tj. X


B(n, p). Odredite distribuciju sluajne varijable Y = 3X + 1 te izraunajte njezino matematiko
oekivanje i varijancu.
Rjeenje: EY = 3np + 1, Var X = 9np(1 p).

Zadatak 2.41. Za zadane realne funkcije realne varijable odredite vrijednost nepoznate konstante
tako da svaka od njih bude funkcija gustoe neke neprekidne sluajne varijable:
(
ax , 0 x < 1
a) fX (x) =
,
0 , inae
(
b cos 2x , x [/4, /4i
b gX (x) =
,
0
, inae
c) skicirajte grafove funkcija f i g.
Rjeenje: a) a = 2,

b) b = 1.

Zadatak 2.42. Neka je X neprekidna sluajna varijabla zadana funkcijom gustoe


(
2x , 0 x < 1
fX (x) =
.
0 , inae
a) Odredite funkciju distribucije sluajne varijable X i skicirajte njezin graf.
b) Izraunajte P {0.25 < X 2}.
Rjeenje:

0 , x<0
a) FX (x) = x2 , 0 x < 1 .

1 , x1
b) P {0.25 < X 2} = 15/16.

Zadatak 2.43. Neka je X neprekidna sluajna varijabla zadana funkcijom gustoe


(
cos 2x , x [/4, /4i
fX (x) =
.
0
, inae
a) Odredite funkciju distribucije sluajne varijable X i skicirajte njezin graf.

120

Sluajna varijabla

b) Izraunajte P {0 < X /8}.


Rjeenje:
a) FX (x) =

1
2

0
, x < /4
+ cos (x) sin (x) , /4 x < /4 .
1
, x /4

b) P {0.25 < X 2} = 15/16.

Zadatak 2.44. Zadana je funkcija gustoe sluajne varijable X:

3 , 0x<1
2
fX (x) =
, 1x<2 .
3

0 , inae
Izraunajte funkciju distribucije sluajne varijable X te skicirajte grafove funkcije gustoe i funkcije
distribucije.

0
, x<0

1
x
, 0x<1
3
Rjeenje: FX (x) =
.
1

(2x

1)
,
1x<2

3
1
, x2

Zadatak 2.45. Pretpostavimo da je vrijeme trajanja u godinama nekog elektronikog ureaja


modelirano sluajnom varijablom X s funkcijom gustoe
(
2e2x , x 0
fX (x) =
.
0
, x<0
a) Odredite vjerojatnost da e taj ureaj trajati barem tri godine.
b) Odredite oekivano vrijeme trajanja tog ureaja.
Rjeenje:
a) P {X 3} = e6 0.0025.
b) EX = 1/2.

Zadatak 2.46. Vrijeme trajanja u mjesecima nekog elektronikog ureaja modelirano je sluajnom varijablom X s funkcijom gustoe
(
2
kxex /9 , x > 0
fX (x) =
.
0
, x0
a) Odredite vrijednost konstante k tako da fX bude dobro definirana funkcija gustoe.
b) Odredite funkciju distribucije sluajne varijable X.
c) to je vjerojatnije - da se ureaj pokvari tijekom prva tri mjeseca upotrebe ili da mu vrijeme
trajanja bude dulje od mjesec dana? Ako ureaj ima jamstvo u trajanju od mjesec dana,
kolika je vjerojatnosti da e ureaj trebati popravak za vrijeme trajanja jamstvenog roka?
Rjeenje:

121

Zadaci
a) k = 2/9.
c) P {X 3} = (e 1)/e 0.63, P {X > 1} = e1/9 0.89.

Zadatak 2.47. Neka je X neprekidna sluajna varijabla s funkcijom gustoe


(

k sin x3 , x h0, i
fX (x) =
.
0
, x inae
a) Izraunajte vrijednost konstante k.
b) Odredite funkciju distribucije sluajne varijable X i izraunajte P {/2 X < 2}.
c) Izraunajte matematiko oekivanje i varijancu sluajne varijable X.
Rjeenje:
a) k = 2/3.

0
, x<0
2 2 cos (x/3) , 0 x < ,

1
, x

P {/2 X < 2} = 3 1.

c) EX = 3 3 , Var X = 2 2 + 12 3 45.

b) FX (x) =

Zadatak 2.48. Neka je X neprekidna sluajna varijabla s funkcijom gustoe


(

k cos x3 , x h0, /2i
fX (x) =
.
0
, x inae
a) Izraunajte vrijednost konstante k.
b) Odredite funkciju distribucije sluajne varijable X i izraunajte P {/4 X < }.
c) Izraunajte matematiko oekivanje i varijancu sluajne varijable X.
Rjeenje:
a) k = 2/3.

0
, x<0
2 sin (x/3) , 0 x < /2 ,

1
, x /2

P {/4 X < } = (1 + 2 3)/ 2.

c) EX = 2 + 3( 3 2), Var X = 6 2 + 36 3 81.

b) FX (x) =

Zadatak 2.49. Svakog radnog dana osoba autobusom odlazi na posao. Autobusi na stanicu dolaze
redovito svakih pet minuta. Trenutak dolaska osobe na stanicu smatramo sluajnim trenutkom
izmeu dolaska dvaju uzastopnih autobusa. Vrijeme koje protekne od dolaska osobe na stanicu do
dolaska prvog sljedeeg autobusa (vrijeme ekanja) modeliramo sluajnom varijablom X za koju je
poznato da je vjerojatnost da osoba autobus eka najvie x vremena proporcionalna tom vremenu
ekanja x.
a) Odredite funkciju distribucije i funkciju gustoe sluajne varijable X.

122

Sluajna varijabla

b) Odredite vjerojatnost da osoba autobus eka


manje od dvije minute,
vie od tri minute,
manje od dvije minute ili barem tri minute,
barem dvije, ali manje od tri minute.
Rjeenje: a) X U (0, 5).

Zadatak 2.50. Na stroju koji proizvodi bakrenu icu povremeno dolazi do smetnji koje uzrokuju
nepravilnost na dijelu ice proizvedenom u trenutku smetnje. Duljinu ice (u metrima) izmeu
dviju uzastopnih nepravilnosti moemo modelirati sluajnom varijablom s funkcijom gustoe
(
k(1 + x)3 , x > 0
.
fX (x) =
0
, x0
a) Odredite vrijednost konstante k.
b) Odredite funkciju distribucije sluajne varijable X.
c) Kolika je vjerojatnost da se nepravilnost na ici pojavi izmeu 0.4 i 0.45 metara?
Rjeenje:
a) k = 2,
(
b) FX (x) =

1 (1 + x)2 , x > 0
,
0
, x0

c) P {0.4 X 0.45} = 0.0346.

Zadatak 2.51. Unutar kruga radijusa R na sluajan nain biramo toku. Naite funkciju distribucije i funkciju gustoe sluajne varijable koja je definirana kao udaljenost odabrane toke od
sredita kruga.

,
x<0
0
Rjeenje: f (x) = x2 /R2 , 0 x < R .

1
,
xR
Zadatak 2.52. Na sluajan nain odabiremo toku T unutar kvadrata stranice 2. Neka je vrijednost neprekidne sluajne varijable X najmanja udaljenost te toke od stranice kvadrata.
a) Odredite funkciju distribucije sluajne varijable X.
b) Odredite matematiko oekivanje i varijancu sluajne varijable X.

Zadatak 2.53. Sluajna varijabla X zadana je funkcijom gustoe:

x + 1 , 1 x < 0
fX (x) = 1 x , 0 x < 1 .

0 , inae.
Odredite funkciju distribucije sluajne varijable X te izraunajte njezino matematiko oekivanje
i varijancu.

Zadaci

123

Zadatak 2.54. Odredite vrijednost konstante k tako da funkcija


(
kxex , x h0, i
f (x) =
0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X te izraunajte njezino matematiko oekivanje.

Zadatak 2.55. Odredite vrijednost konstante k tako da funkcija

x2
x 2a
2 , x h0, i
k 2e
f (x) =
a

0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X, odredite funkciju distribucije sluajne
varijable X, njezino oekivanje i varijancu te izraunajte P {X 2}.

Zadatak 2.56. Odredite vrijednost konstante k tako da funkcija

kx , x h0, e 1i
f (x) =
1+x

0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X, odredite funkciju distribucije sluajne
varijable X i izraunajte P {X 3}.

Zadatak 2.57. Odredite vrijednost konstante k tako da funkcija


(
ke2x , x h, 0i
f (x) =
0 ,
inae
bude funkcija gustoe neprekidne sluajne varijable X te izraunajte njezinu funkciju distribucije,
matematiko oekivanje, varijancu i P {0 X < 13579}.

Zadatak 2.58. Odredite vrijednost konstante k tako da funkcija


(
ka2x , x h0, +i
f (x) =
,
0
,
inae
gdje je a > 0 i a 6= 1, bude funkcija gustoe neprekidne sluajne varijable X, izraunajte njezinu
funkciju distribucije, oekivanje i varijancu te P {2468 X < 0}.

Zadatak 2.59. Odredite vrijednost konstante k tako da funkcija


(

k ln x , x h1, ei
fX (x) =
0
, inae
bude funkcija gustoe neprekidne sluajne varijable X te odredite njenu funkciju distribucije FX
i vjerojatnost P {0 X < e/2}.

124

Sluajna varijabla

Zadatak 2.60. Odredite vrijednost konstante k tako da funkcija


(
2
kxex , x [0, e]
f (x) =
0
, inae
bude funkcija gustoe neprekidne sluajne varijable X te odredite vrijednost njezine funkcije distribucije za x = e 1.

Zadatak 2.61. Odredite vrijednost konstante k tako da funkcija


(
3
kx2 ex 1 , x [0, e]
f (x) =
0
, inae
bude funkcija gustoe neprekidne sluajne varijable X te odredite vrijednost njezine funkcije distribucije za x = 1.

Zadatak 2.62. Odredite vrijednost konstante k tako da funkcija


(
ke2x , x [0, +i
f (x) =
0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X te izraunajte njezino matematiko oekivanje.

Zadatak 2.63. Odredite vrijednost konstante k tako da funkcija


(
kx sin x , x [0, ]
f (x) =
0
, inae
bude funkcija gustoe neprekidne sluajne varijable X te odredite njezino matematiko oekivanje.

Zadatak 2.64. Odredite vrijednost konstante k tako da funkcija


(
k(x 1)3 , x [1, 2]
f (x) =
0, inae.
bude funkcija gustoe neprekidne sluajne varijable X te odredite njezino matematiko oekivanje,
varijancu i P { 32 < X 74 }.

Zadatak 2.65. Odredite vrijednost konstante k tako da funkcija


(
kx(x 1)2 , x [0, 3]
f (x) =
0, inae.
bude funkcija gustoe neprekidne sluajne varijable X te odredite njezino matematiko oekivanje,
varijancu i P {2 < X 4}.

125

Zadaci

Zadatak 2.66. Neka je FX funkcija distribucije neprekidne sluajne varijable X. Odredite funkciju distribucije sluajne varijable Y = X.
Rjeenje: FY (y) = 1 FX (y).

Zadatak 2.67. Sluajna varijabla X ima funkciju gustoe fX (x). Odredite funkcije gustoa
sljedeih sluajnih varijabli:
a)

Y = eX ,

c)

Y =

X, X > 0,

b)

Y = eX ,

d)

Y = shX =

eX eX
.
2

Rjeenje:
(
a) fY (y) =

1
y

fX (ln y) , y > 0
0

(
b) fY (y) =

1
y

fX ( ln y) , y > 0
0

c) fY (y) =

, inae

, inae

2yfX (y 2 ) , y 0
.
0
, inae

Zadatak 2.68. Neka je fX (x) funkcija gustoe neprekidne sluajne varijable X. Odredite funkcije

2
gustoa sluajnih varijabli X 3 + 1, X 5 + 15, X 7 7, X X, eX , X eX , eX .

Zadatak 2.69. Sluajna varijabla X zadana je funkcijom gustoe


(
x2 /3 , 1 < x < 2
fX (x) =
.
0 ,
inae
Odredite funkciju gustoe sluajne varijable Y = X 2 .

y/3 , 0 < y < 1

Rjeenje: fY (y) =
y/6 , 1 y < 4 .

0 ,
inae

Zadatak 2.70. Sluajna varijabla X ima Cauchyjevu distribuciju s funkcijom gustoe


fX (x) =

1
, x R.
(1 + x2 )

Odredite funkciju gustoe i funkciju distribucije sluajne varijable


a) Y = X 2 ,
b) Z = 1/X.

126

Sluajna varijabla

Rjeenje:
(

a) fY (y) =
b) fY (y) =

1
y(1+y)

, y0

0
1
,
(1+y 2 )

, y>0

y R.

Zadatak 2.71. Sluajna varijabla X ima uniformnu distribuciju na intervalu h0, 1i, tj. X
U (0, 1). Odredite funkciju gustoe i funkciju distribucije sluajne varijable
a) Y = aX + b, a, b R, a 6= 0,
b) Z = ln X.
Rjeenje:
a) a > 0 :

a<0:

fY (y) =
(

b) fZ (z) =

1/a , b < y < b a


,
0 ,
inae

1/a , b < y < a + b


,
0 ,
inae

fY (y) =

ez , z > 0
.
0 , z0

Zadatak 2.72. Sluajna varijabla X ima uniformnu distribuciju na intervalu h/2, /2i. Odredite funkciju distribucije i funkciju gustoe sluajne varijable Y = cos X.

Zadatak 2.73. Sluajna varijabla X ima uniformnu distribuciju na intervalu h0, 5i. Odredite
funkciju distribucije sluajne varijable Y = eX .

Zadatak 2.74. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 2i, tj. X
U (1, 2). Odredite funkciju gustoe i funkciju distribucije sluajne varijable Y = 2X + 1.

Zadatak 2.75. Sluajna varijabla X ima uniformnu distribuciju na intervalu h2, 4i. Odredite
funkciju gustoe i funkciju distribucije sluajne varijable Y = eX .

Zadatak 2.76. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 3i. Odredite
funkciju gustoe i funkciju distribucije sluajne varijable Y = ln (X).

Zadatak 2.77. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 1i. Odredite
funkciju distribucije sluajne varijable Y = 1/X 2 .

Zadaci

127

Zadatak 2.78. Sluajna varijabla X ima eksponencijalnu distribuciju s parametrom = 7.


Odredite funkciju gustoe sluajne varijable Y = ln X.

Zadatak 2.79. Sluajna varijabla X ima eksponencijalnu distribuciju s parametrom 1/2. Odredite funkciju gustoe vjerojatnosti i funkciju distribucije vjerojatnosti sluajne varijable Y = 1/X.

Zadatak 2.80. Sluajna varijabla X ima eksponencijalnu distribuciju s parametrom = 1.


Odredite funkciju distribucije sluajne varijable Y = (X 1)2 .

Poglavlje 3

Sluajni vektor
Ukoliko u jednom istraivanju za dani sluajni pokus pratimo nekoliko razliitih sluajnih varijabli, mogue veze meu njima neemo dokuiti ako ih prouavamo samo
svaku za sebe. Meutim, vrlo su esto veze izmeu pojedinih sluajnih varijabli
istog sluajnog pokusa od primarnog interesa.
Primjer 3.1. Broj komaraca na podruju grada Osijeka tijekom lipnja ovog ljeta jest sluajna
varijabla X. Koliina je oborina u svibnju na istom podruju takoer sluajna varijabla Y . Teoretski je za oekivati da izmeu tih dviju sluajnih varijabli postoji veza. Da bismo tu vezu opisali,
moramo nauiti opisivati ureen par sluajnih varijabli (X, Y ).

Od interesa je, dakle, izraditi matematiki model koji omoguuje opisivanje nekoliko sluajnih varijabli danog sluajnog pokusa istovremeno. Radi ilustracije ideje
modela prouimo jednostavan primjer sluajnog pokusa koji se sastoji od izvlaenja
dvije kuglice iz iste kutije.
Primjer 3.2. Iz kutije koja sadri n bijelih i m crnih kuglica izvlaimo dvije kuglice bez vraanja
u kutiju. Neka sluajna varijabla X prima vrijednost 1 ako je u prvom izvlaenju izvuena bijela
kuglica, a 0 ako je u prvom izvlaenju izvuena crna kuglica. Analogno, neka sluajna varijabla
Y prima vrijednost 1 ako je u drugom izvlaenju izvuena bijela kuglica, a 0 ako je u drugom
izvlaenju izvuena crna kuglica.
Rezultate tog sluajnog pokusa moemo opisati dvjema sluajnim varijablama: X i Y . Ako
od njih napravimo ureeni par sluajnih varijabli (X, Y ), onda je skup svih moguih ishoda
R(X, Y ) = {(1, 1), (1, 0), (0, 1), (0, 0)}. Ovdje je prvo mjesto u paru rezervirano za ishode prvog
pokusa (odnosno sluajnu varijablu X), a drugo mjesto rezervirano je za ishode drugog pokusa
(odnosno sluajnu varijablu Y ).
Vjerojatnosna su svojstva tog ureenog para sluajnih varijabli potpuno su odreena poznavanjem
brojeva:
n1
n
p(1,1) = P ({X = 1} {Y = 1}) = P {(X, Y ) = (1, 1)} =
,
n+m n+m1

129

130

Sluajni vektor

m
n
,
n+m n+m1
m
n
p(0,1) = P ({X = 0} {Y = 1}) = P {(X, Y ) = (0, 1)} =
,
n+m n+m1
m
m1
p(0,0) = P ({X = 0} {Y = 0}) = P {(X, Y ) = (0, 0)} =
,
n+m n+m1
koje smo izraunali koritenjem poznate relacije
p(1,0) = P ({X = 1} {Y = 0}) = P {(X, Y ) = (1, 0)} =

P (A B) = P (A | B)P (B),
ako je P (B) > 0 (vidi poglavlje 1.9).

U ovom poglavlju definirat emo sluajni vektor te opisati specijalno diskretan i


neprekidan sluaj analogno kao diskretnu i neprekidnu sluajnu varijablu.
Primjer 3.2 i dosadanja saznanja o sluajnim varijablama upuuju na to da je
potrebno n-dimenzionalan, n N, sluajni vektor definirati kao funkciju s prostora
elementarnih dogaaja u skup Rn . Meutim, s obzirom da vjerojatnost openito
nije definirana na P(), ne moemo svaku takvu funkciju zvati sluajnim vektorom.
Analogno kao u poglavlju 2.3, n-dimenzionalni sluajni vektor definiramo na sljedei
nain.
Definicija 3.1. Neka je (, F, P ) vjerojatnosni prostor pridruen sluajnom pokusu. Funkciju (X1 , . . . , Xn ) koja svakom ishodu pokusa pridruuje ureenu n-torku
realnih brojeva (x1 , . . . , xn ) zovemo n-dimenzionalan sluajni vektor ako vrijedi:
{X1 x1 } {Xn xn } F
za svaki x1 R,. . . , xn R.
Zbog jednostavnosti uvest emo sljedeu oznaku:
{X1 x1 } {Xn xn } = {X1 x1 , . . . , Xn xn }.

Slino kao u jednodimenzionalnom sluaju (poglavlje 2.3), vjerojatnosna svojstva


svakog sluajnog vektora opisujemo funkcijom distribucije. Funkcija distribucije
sluajnog vektora dana je sljedeom definicijom.
Definicija 3.2. Neka je (, F, P ) vjerojatnosni prostor pridruen sluajnom pokusu
i (X1 , . . . , Xn ) sluajni vektor. Funkciju
F : Rn [0, 1],
F (x1 , . . . , xn ) = P {X1 x1 , . . . , Xn xn }
zovemo funkcija distribucije sluajnog vektora (X1 , . . . , Xn ).

(3.1)

131

Sluajni vektor

Neka svojstva funkcije distribucije sluajnog vektora izrei emo za dvodimenzionalan sluaj.1
Svojstva funkcije distribucije dvodimenzionalnoga sluajnog vektora
Neka je zadan dvodimenzionalan sluajni vektor (X, Y ) svojom funkcijom distribucije F (x, y). Tada vrijedi:
1. Za realne brojeve x1 , x2 , y, takve da je x1 < x2 , vrijedi F (x1 , y) F (x2 , y).
2. Neka su x, y1 , y2 realni brojevi. Ako je y1 < y2 , onda je F (x, y1 ) F (x, y2 ).
3.
lim F (x, y) = F (, y) = 0,

lim F (x, y) = F (x, ) = 0,

lim F (x, y) = F (, ) = 1.

x
y

4. Neprekidnost zdesna u svakoj varijabli:


lim F (x, y0 ) = lim F (x0 , y) = F (x0 , y0 ).

xx0

yy0

5. Za x1 < x2 i y1 < y2 jest


F (x2 , y2 ) F (x1 , y2 ) F (x2 , y1 ) + F (x1 , y1 ) 0.
Koritenjem svojstava vjerojatnosti dokaite navedena svojstva funkcije distribucije F (x, y).
Zadatak 3.1.

Kao i kod jednodimenzionalnih sluajnih varijabli razmatrat emo diskretan i neprekidan tip sluajnih vektora kod kojih se funkcija distribucije moe raunati koritenjem tablice distribucije (diskretan sluaj), odnosno funkcije gustoe (neprekidan
sluaj). Takoer emo, zbog jednostavnosti zapisa i lakeg razumijevanja dokaza,
uglavnom razmatranja provoditi na dvodimenzionalnom sluaju, dok emo za viedimenzionalne sluajeve samo navesti analogne rezultate.
Primjer 3.3. Igra se temelji na bacanju dvaju pravilno izraenih novia. U jednoj partiji igre
igra osvaja one novie na kojima se pri bacanju realizirala glava, dok novie na kojima se
realiziralo pismo ne osvaja. Prema tome, ishod bacanja tih dvaju novia moemo modelirati
dvodimenzionalnim diskretnim sluajnim vektorom (X, Y ), gdje je
1

Poopenje za n-dimenzionalan sluajni vektor itatelj moe nai u [26, str. 267].

132

Sluajni vektor

X sluajna varijabla koja prima vrijednost 1 ako se pri bacanju prvog novia realizirala glava,
a vrijednost 0 ako se realiziralo pismo,
Y sluajna varijabla koja prima vrijednost 1 ako se pri bacanju drugog novia realizirala glava,
a vrijednost 0 ako se realiziralo pismo.
Dakle, (X, Y ) je sluajni vektor koji prima vrijednosti iz skupa
R(X, Y ) = {(0, 0), (0, 1), (1, 0), (1, 1)}
s vjerojatnostima
1
1
,
p(0, 1) = P {X = 0, Y = 1} = ,
4
4
1
1
p(1, 0) = P {X = 1, Y = 0} = ,
p(1, 1) = P {X = 1, Y = 1} = .
4
4
2
Ako elimo odrediti funkciju distribucije F : R [0, 1] tog sluajnog vektora, uoimo:
p(0, 0) = P {X = 0, Y = 0} =

za (x, y) (h, 0i R) (R h, 0i) je P {X x, Y y} = 0,


za (x, y) [0, 1i [0, 1i je
P {X x, Y y} = P {X = 0, Y = 0} =

1
,
4

za (x, y) [0, 1i [1, i je


P {X x, Y y} = P {X = 0, Y = 0} + P {X = 0, Y = 1} =

1
,
2

za (x, y) [1, i [0, 1i je


P {X x, Y y} = P {X = 0, Y = 0} + P {X = 1, Y = 0} =

1
,
2

za (x, y) [1, i [1, i je


P {X x, Y y} =
= P {X = 0, Y = 0} + P {X = 0, Y = 1} + P {X = 1, Y = 0} + P {X = 1, Y = 1} = 1.
Dakle, funkcija distribucije sluajnog vektora (X, Y ) definirana je pravilom

0, (x, y) (h, 0i R) (R h, 0i)

1/4,
(x, y) [0, 1i [0, 1i

F (x, y) = 1/2, (x, y) [0, 1i [1, i

1/2, (x, y) [1, i [0, 1i

1, (x, y) [1, i [1, i.

3.1

Diskretan dvodimenzionalan sluajni vektor

Analogno kao kod diskretne sluajne varijable, diskretan sluajni vektor (X, Y )
prima vrijednosti iz konanog ili prebrojivog skupa
R(X, Y ) = {(xi , yj ) : (i, j) I},

I N N,

a njegova je funkcija distribucije (tj. vjerojatnosna svojstva) potpuno odreena


poznavanjem brojeva
p(xi , yj ) = P {X = xi , Y = yj }, (i, j) I N N.

(3.2)

133

Diskretan sluajni vektor

Naime, za funkciju distribucije vrijedi:


X X
X X
F (x, y) = P {X x, Y y} =
P {X = xi , Y = yj } =
p(xi , yj ).
xi x yj y

xi x yj y

Niz brojeva definiran izrazom (3.2) zvat emo distribucija diskretnoga sluajnog vektora (X, Y ). Da bismo pojednostavnili zapis distribucije sluajnog vektora, u nastavku emo teksta pisati I = N N, podrazumijevajui pod tim da je
skup indeksa najvie N N, a zapravo sadri samo one indekse koji se pojavljuju u
konkretnom sluaju.
Primjer 3.4. Promatrajmo sluajni pokus koji se sastoji od jednog bacanja pravilno izraene
igrae kocke i jednog bacanja pravilno izraenog novia. Skup elementarnih dogaaja ovog pokusa
jest skup
= {{1, P }, {2, P }, {3, P }, {4, P }, {5, P }, {6, P },
{1, G}, {2, G}, {3, G}, {4, G}, {5, G}, {6, G}}.
Neka sluajna varijabla X daje broj koji se okrenuo na kocki, a sluajna varijabla Y daje 1 ako
je bacanjem novia palo pismo i 0 ako je bacanjem novia pala glava. U tom pokusu bacanje
kocke i novia ne ovise jedno o drugom pa vrijedi:
1
1 1
=
,
6 2
12
1 1
1
p(1, 0) = P {X = 1, Y = 0} = =
.
6 2
12
p(1, 1) = P {X = 1, Y = 1} =

Analogno dobijemo da je
p(i, j) = P {X = i, Y = j} =

1
,
12

i {1, 2, 3, 4, 5, 6}, j {0, 1}.

Primjer 3.5. Promatrajmo sljedeu igru: prvo bacamo pravilno izraenu igrau kockicu. Ako se
okrenuo broj 6, ostvarujemo pravo na bacanje pravilno izraenog novia, pri emu osvajamo bod
ako padne pismo, a u suprotnom gubimo igru.
Taj pokus moemo opisati skupom elementarnih dogaaja
= {(1, N ), (2, N ), (3, N ), (4, N ), (5, N ), (6, Ip ), (6, Ig )},
gdje N znai da drugu igru ne igramo, Ip da drugu igru igramo i da se u njoj dogodilo pismo, a
Ig da drugu igru igramo i da se u njoj nije dogodilo pismo.
Neka je X sluajna varijabla koja prima vrijednost 1 ako se pri bacanju kockice realizirao broj 6,
a u suprotnom prima vrijednost 0. Neka je Y sluajna varijabla koja prima vrijednost 1 ako je
igra osvojio bod, a u suprotnom prima vrijednost 0. Osvajanje boda u igri opisano je realizacijom
dogaaja {(X, Y ) = (1, 1)}. Distribucija je tog sluajnog vektora sljedea:
5
,
6
p(0, 1) = P {X = 0, Y = 1} = P ({Y = 1} | {X = 0}) P {X = 0} = 0,
1 1
1
p(1, 0) = P {X = 1, Y = 0)} = P ({Y = 0} | {X = 1}) P {X = 1} = =
,
2 6
12
1 1
1
p(1, 1) = P {X = 1, Y = 1} = P ({Y = 1} | {X = 1}) P {X = 1} = =
.
2 6
12
p(0, 0) = P {X = 0, Y = 0} = P ({Y = 0} | {X = 0}) P {X = 0} = 1

134

Sluajni vektor

Uoimo da za niz brojeva (p(xi , yj ), i N, j N) koji definira distribuciju diskretnog dvodimenzionalnog sluajnog vektora vrijedi:
1. p(xi , yj ) 0 za sve i N, j N,
2.

P
P

p(xi , yj ) = 1.

i=1 j=1

Ukoliko je skup vrijednosti sluajnog vektora (X, Y ) konaan, tj. sluajni vektor
prima vrijednosti iz skupa R(X, Y ) = {(xi , yj ) : i = 1, 2, . . . , m, j = 1, 2, . . . , n},
njegova se distribucija pregledno moe prikazati tablicom 3.1 koju zovemo tablica
distribucije dvodimenzionalnoga diskretnog sluajnog vektora.2
X Y
x1
x2
..
.
xm

y1
p(x1 , y1 )
p(x2 , y1 )

y2
p(x1 , y2 )
p(x2 , y2 )

y3
p(x1 , y3 )
p(x2 , y3 )

yn
p(x1 , yn )
p(x2 , yn )

p(xm , y1 )

p(xm , y2 )

p(xm , y3 )

p(xm , yn )

Tablica 3.1: Tablica distribucije diskretnog sluajnog vektora (X, Y ) sa skupom


vrijednosti R(X, Y ) = {(xi , yj ) : i = 1, . . . , m, j = 1, . . . , n}
Tako je, na primjer, sljedeom tablicom dana distribucija sluajnog vektora (X, Y )
iz primjera 3.5:
X Y
0
1

0
5/6
1/12

1
0
1/12

Ukoliko je na diskretnom vjerojatnosnom prostoru (, P(), P ) dan sluajni vektor


(X, Y ), onda su komponente tog sluajnog vektora, tj. funkcije X : R i Y :
R, sluajne varijable na tom istom vjerojatnosnom prostoru. Njihove distribucije
nazivamo marginalnim distribucijama sluajnog vektora (X, Y ). U nastavku
emo poglavlja pokazati kako iz distribucije sluajnog vektora moemo izraunati
njegove marginalne distribucije.
Primjer 3.6. Iz kutije koja sadri tri kupona s oznakama 1, 2 i 3 izvlaimo dva kupona bez
vraanja u kutiju. Rezultat izvlaenja modeliramo sluajnim vektorom (X, Y ), gdje je X sluajna
varijabla kojom je modeliran rezultat prvog izvlaenja, a Y sluajna varijabla kojom je modeliran
rezultat drugog izvlaenja. Distribucija sluajnog vektora (X, Y ) dana je tablicom
2 Takav

zapis distribucije sluajnog vektora moemo lako prilagoditi i za sluajni vektor s prebrojivim skupom vrijednosti analogno kao kod tablica distribucije sluajne varijable.

135

Diskretan sluajni vektor


X Y
1
2
3

1
0
1/6
1/6

2
1/6
0
1/6

3
1/6
1/6
0

Sluajne varijable X i Y imaju isti skup vrijednosti: R(X) = R(Y ) = {1, 2, 3}. Koristei injenicu
da familija skupova {{Y = 1}, {Y = 2}, {Y = 3}} ini particiju skupa , moemo izraunati
P {X = i} za i = 1, 2, 3 na sljedei nain:
1
P {X = i} = P {X = i, Y = 1} + P {X = i, Y = 2} + P {X = i, Y = 3} = ,
3
i=1,2,3. Dakle, marginalna distribucija komponente X sluajnog vektora (X, Y ) dana je tablicom
!
1 2 3
X= 1 1 1 .
3 3 3

Slinim postupkom moemo izraunati i marginalnu distribuciju komponenate Y sluajnog vektora


(X, Y ):
!
1 2 3
Y = 1 1 1 .
3 3 3

Uoimo da su obje marginalne distribucije u tom primjeru jednake, meutim, sluajne varijable X
i Y ni u kom sluaju nisu jednake sluajne varijable. Naime, sluajne varijable X i Y definirane
na istom vjerojatnosnom prostoru jednake su ako je X() = Y () za sve . U naem je
sluaju ak nemogue da je X() = Y () za bilo koji jer bi to znailo da je u oba izvlaenja
izvuen isti kupon, to se u spomenutom pokusu ne moe dogoditi. Za sluajne varijable koje imaju
D
iste distribucije rei emo da su jednako distribuirane sluajne varijable, oznaka X = Y .

U primjeru 3.6 pokazan je nain koji je mogue primijeniti za raunanje marginalnih


distribucija openito kod diskretnih dvodimenzionalnih sluajnih vektora. Opiimo
sada openito nain kako se iz distribucije diskretnog sluajnog vektora mogu dobiti
marginalne distribucije.
Neka je (X, Y ) dvodimenzionalan diskretan sluajni vektor sa skupom vrijednosti
{(xi , yj ) : i N, j N} i distribucijom
p(xi , yj ) = P {X = xi , Y = yj }, i N, j N.
Uoimo da za sve i N vrijedi:
P {X = xi } = P {X = xi , Y R} =

P {X = xi , Y = yj } =

jN

p(xi , yj ),

j=1

a ti brojevi odreuju marginalnu distribuciju komponente X sluajnog vektora


(X, Y ). Analogno moemo izraunati i marginalnu distribuciju komponente Y .
Dakle, ako definiramo:
pX (xi ) =
pY (yj ) =

P
j=1

P
i=1

p(xi , yj ), i N,
(3.3)
p(xi , yj ), j N,

136

Sluajni vektor

tada skup vrijednosti R(X) = {xi : i N} i niz (pX (xi ), i N) odreuju marginalnu distribuciju komponente X sluajnog vektora (X, Y ), a skup vrijednosti
R(Y ) = {yj : j N} i niz (pY (yj ), j N) odreuju marginalnu distribuciju
komponente Y toga sluajnog vektora.
Marginalne se distribucije lako raunaju u sluaju konanog skupa vrijednosti sluajnog vektora koristei tablini zapis distribucije. Naime, ako je distribucija dana
tablicom 3.1, onda sumiranjem vrijednosti u istom stupcu dobijemo vjerojatnost
P {Y = yj } = pY (yj ), a sumiranjem vrijednosti u istom retku vjerojatnosti P {X =
xi } = pX (xi ), pa tablicu 3.1 moemo proiriti kao to je prikazano tablicom 3.2.
X Y
x1
x2
..
.
xm
pY (yj )

y1
p(x1 , y1 )
p(x2 , y1 )

y2
p(x1 , y2 )
p(x2 , y2 )

y3
p(x1 , y3 )
p(x2 , y3 )

yn
p(x1 , yn )
p(x2 , yn )

pX (xi )
pX (x1 )
pX (x2 )

p(xm , y1 )
pY (y1 )

p(xm , y2 )
pY (y2 )

p(xm , y3 )
pY (y3 )

p(xm , yn )
pY (yn )

pX (xm )
1

Tablica 3.2: Proirena tablica distribucije diskretnog sluajnog vektora s konanim


skupom stanja.
Primjer 3.7. Sluajni pokus sastoji se od bacanja dviju pravilno izraenih igraih kockica. Otprije
znamo da je skup elementarnih dogaaja tog sluajnog pokusa
= {(i, j) : i, j {1, 2, 3, 4, 5, 6}},

k() = 36.

Neka su X i Y diskretne sluajne varijable na P() ije su realizacije odreene na sljedei nain:
- ako se pri bacanju na kockicama okrenu razliiti brojevi, X se realizira manjim, a Y veim
brojem (npr. ako se na prvoj kockici okrene 3, a na drugoj kockici 6, tada uzimamo da je
3 realizacija sluajne varijable X, a 6 realizacija sluajne varijable Y ),
- ako se pri bacanju na kockicama okrenu isti brojevi, tada se i X i Y realiziraju tim brojem.
Oito je
R(X) = R(Y ) = {1, 2, 3, 4, 5, 6}.
elimo odrediti marginalne distribucije sluajnog vektora (X, Y ).
Slika sluajnog vektora (X, Y ) jest skup
R(X, Y ) = {(x, y) : x, y {1, 2, 3, 4, 5, 6}}.
Vjerojatnosti realizacija sluajnog vektora (X, Y ) dane su na sljedei nain:
- ako je x > y, tada je P {X = x, Y = y} = 0,
- ako je x = y, tada je P {X = x, Y = y} = 1/36,

137

Diskretan sluajni vektor


- ako je x < y, tada je P {X = x, Y = y} = 1/18.
Marginalne distribucije tog sluajnog vektora raunamo na sljedei nain:
- za fiksni je x R(X)
pX (x) = P {X = x} =

P {X = x, Y = y},

yR(Y )

- za fiksni je y R(Y )
pY (y) = P {Y = y} =

P {X = x, Y = y}.

xR(X)

Meutim, distribuciju sluajnog vektora (X, Y ) i njegove marginalne distribucije pregledno moemo
prikazati sljedeom tablicom (proirenom tablicom distribucije):
XY
1
2
3
4
5
6
pY (y)

1
1/36
0
0
0
0
0
1/36

2
1/18
1/36
0
0
0
0
3/36

3
1/18
1/18
1/36
0
0
0
5/36

4
1/18
1/18
1/18
1/36
0
0
7/36

5
1/18
1/18
1/18
1/18
1/36
0
9/36

6
1/18
1/18
1/18
1/18
1/18
1/36
11/36

pX (x)
11/36
9/36
7/36
5/36
3/36
1/36
1

Iz prethodne tablice oitavamo marginalne distribucije:


1
2
3
4
5
6
11/36 9/36 7/36 5/36 3/36 1/36

X=

1
2
3
4
5
6
1/36 3/36 5/36 7/36 9/36 11/36

Y =

Primjer 3.8. Na analogan nain moemo odrediti marginalne distribucije diskretnog sluajnog
vektora koji nema konanu sliku. Neka je (X, Y ) diskretan sluajni vektor ija je distribucije dana
na sljedei nain:
R(X, Y ) = N0 N0 ,
2x 2y 4
P {X = x, Y = y} =
e , (x, y) N0 N0 .
x!y!
Odredimo marginalne distribucije tog sluajnog vektora. Slika sluajne varijable X jest skup
R(X) = N0 , a
P {X = x} =

X
yN0

P {X = x, Y = y} =

2x 4 X 2y
2x 2
e
=
e ,
x!
y!
x!
y=0

tj. X P(2). Analognim postupkom slijedi da je Y P(2). Dakle, X i Y jednako su distribuirane


sluajne varijable.
Primjer 3.9. Promotrimo igrau kockicu sa svojstvom da se pri jednom njezinom bacanju broj
i {1, . . . 6} okrene s vjerojatnou pi te pretpostavimo da brojevi pi imaju sljedea svojstva:
1. pi > 0 za sve i {1, . . . 6},

138
2.

Sluajni vektor
6
P

pi = 1.

i=1

Uoimo da ako je pi = 1/6 za svaki i, tada se radi o pravilno izraenoj igraoj kockici, no
openito ne mora biti tako. Neka je ta kockica baena n puta zaredom. Realizacija je tog bacanja
jedna ureena n-torka elemenata iz skupa {1, . . . , 6} ili, preciznije, varijacija s ponavljanjem n-tog
razreda skupa {1, . . . , 6}.
Pretpostavimo da elimo odrediti vjerojatnost da se u tih n bacanja x puta okrenula jedinica i da
se y puta okrenula estica, pri emu je x + y n. U tu svrhu oznaimo X sluajnu varijablu
koja se realizira brojem jedinica, a Y sluajnu varijablu koja se realizira brojem estica koje su se
okrenule u n bacanja te kockice i odredimo vjerojatnost P {X = x, Y = y} za x, y {0, 1, . . . , n}
takve da je x + y n. Varijacija s ponavljanjem n-tog razreda skupa {1, . . . , 6} u kojima su x
komponenti jedinice, y komponenti estice, a preostalih (n x y) komponenti dvojke, trojke,
etvorke ili petice ima
n!
x!y!(n x y)!
i svaka od njih realizira se s vjerojatnou
y
y
nxy
nxy
px
= px
.
1 p6 (p2 + p3 + p4 + p5 )
1 p6 (1 p1 p6 )

Primjenom principa sume slijedi da je


P {X = x, Y = y} =

n!
px py (1 p1 p6 )nxy .
x!y!(n x y)! 1 6

(3.4)

Za sluajni vektor (X, Y ) s distribucijom 3.4 kaemo da ima multinomnu distribuciju s parametrima n, p1 i p6 i piemo (X, Y ) M U LT (n, p1 , p6 ). Za odreivanje distribucije (tablice distribucije) sluajne varijable X iz distribucije 3.4 vano je uoiti da je za realizacije x i y sluajnih
varijabli X i Y sa svojstvom x + y n P {X = x, Y = y} > 0, dok je inae P {X = x, Y = y} = 0.
Sada slijedi da je za x {0, 1, . . . , n}
X
P {X = x} =
P {X = x, Y = y} =
yR(Y)

n!
px
x!(n x)! 1

nx
X
y=0

(n x)!
py (1 p1 p6 )nxy =
y!(n x y)! 6

n nx
n
X n x y
=
px
p6 (1 p1 p6 )nxy =
px (1 p1 )nx ,
1
x
y
x 1
y=0
gdje je zadnja suma rijeena primjenom binomnog teorema. Dakle, slijedi da je X binomna
sluajna varijabla s parametrima n N i p1 h0, 1i. Analognim postupkom slijedi da je Y
B(n, p6 ).

Od velikog su praktinog interesa sluajne varijable koje nastaju kao kompozicija


realne funkcije dviju varijabli i dvodimenzionalnog sluajnog vektora. Preciznije,
neka je (X, Y ) dvodimenzionalan diskretan sluajni vektor sa skupom vrijednosti
R(X, Y ) = {(xi , yj ) : i N, j N} i distribucijom
p(xi , yj ) = P {X = xi , Y = yj },

i N,

j N,

i neka je g neka funkcija koja ureenom paru realnih brojeva pridruuje realan
broj, tj. g : R2 R. Tada g(X, Y ) definira sluajnu varijablu na . Na primjer,

139

Diskretan sluajni vektor

X + Y , XY , (X )(Y ) (, jesu neki realni brojevi) jednodimenzionalne


su sluajne varijable na koje nastaju na takav nain. Distribuciju tako nastale
sluajne varijable moemo lako izraunati iz tablice distribucije sluajnog vektora
(X, Y ) i zadane funkcije g. Postupak je ilustriran primjerom 3.10.
Primjer 3.10. Neka je dan pokus
s oznakama 1, 2 i 3 izvlaimo dva
je vektor (X, Y ), gdje je X rezultat
distribuciju sume tih dviju sluajnih

opisan u primjeru 3.6, tj. iz kutije koja sadri tri kupona


kupona bez vraanja u kutiju. Rezultat izvlaenja sluajan
prvog izvlaenja, a Y rezultat drugog izvlaenja. Odredimo
varijabli: Z = X + Y .

X +Y =

2 3 4 5 6
p2 p3 p4 p5 p6

!
,

gdje je
p2
p3
p4
p5
p6

= P {Z
= P {Z
= P {Z
= P {Z
= P {Z

= 2} = P {X
= 3} = P {X
= 4} = P {X
= 5} = P {X
= 6} = P {X

= 1, Y
= 1, Y
= 1, Y
= 3, Y
= 3, Y

= 1} = 0,
= 2} + P {X = 2, Y = 1} = 1/3,
= 3} + P {X = 3, Y = 1} + P {X = 2, Y = 2} = 1/3,
= 2} + P {X = 2, Y = 3} = 1/3,
= 3} = 0.

Dakle, tablica distribucije sluajne varijable jest


X +Y =

3 4 5
1 1 1
3 3 3

!
.

Odredite tablice distribucija sluajnog vektora (X, Y ) i sluajne varijable (X + Y ) ako se izvlaenje
vri s vraanjem.
Primjer 3.11. Iz skupa {1, 2, . . . , 9} na sluajan nain izvlaimo tri broja jedan po jedan (s
vraanjem izvuenih brojeva u skup). Prvi izvueni broj bit e znamenka stotica, drugi izvueni
broj znamenka desetica, a trei izvueni broj znamenka jedinica troznamenkastog broja. Izvlaenje
znamenke stotica modeliramo sluajnom varijablom Z1 , znamenke desetica sluajnom varijablom
Z2 , a znamenke jedinica sluajnom varijablom Z3 . Sluajna je varijabla Zi , i {1, 2, 3}, diskretna
sluajna varijabla koja se brojem iz skupa {1, 2, . . . , 9} realizira s vjerojatnou 1/9. Dakle, Z1 ,
Z2 i Z3 jesu diskretne uniformne sluajne varijable na skupu {1, 2, . . . , 9} i zadane su tablicom
distribucije
!
1 2 3 4 5 6 7 8 9
Zi =
, i {1, 2, 3}.
1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
Uoimo da ima smisla promatrati trodimenzionalan diskretan sluajni vektor (Z1 , Z2 , Z3 ) ija
je slika R(Z1 , Z2 , Z3 ) = {(i, j, k), i, j, k {1, 2, . . . , 9}}. Jedna realizacija sluajnog vektora
(Z1 , Z2 , Z3 ) jest varijacija s ponavljanjem treeg razreda skupa od devet elemenata, stoga skup
R(Z1 , Z2 , Z3 ) ima 93 = 729 elemenata. Kako su dogaaji {Z1 = i, Z2 = j, Z3 = k} za sve
i, j, k {1, 2, . . . , 9} jednako vjerojatni, slijedi da je
1
, (i, j, k) R(Z1 , Z2 , Z3 ).
729
Time je u potpunosti zadana distribucija trodimenzionalnog diskretnog sluajnog vektora (Z1 , Z2 , Z3 ).
P {Z1 = i, Z2 = j, Z3 = k} =

Nadalje, oznaimo s X sluajnu varijablu koja se realizira najveom znamenkom, a s Y sluajnu


varijablu koja se realizira najmanjom znamenkom u tako sastavljenom troznamenkastom broju:
X = max {Z1 , Z2 , Z3 },

Y = min {Z1 , Z2 , Z3 }.

140

Sluajni vektor

Budui da se izvlaenje brojeva iz skupa {1, 2, . . . , 9} vri s vraanjem, slijedi da se i X i Y


realiziraju brojevima iz skupa {1, 2, 3, 4, 5, 6, 7, 8, 9}, tj. R(X) = R(Y ). Distribucija sluajne
varijable X dana je tablicom
!
1
2
3
4
5
6
7
8
9
X=
,
1
7
19
36
62
91 127 169 217
729 729 729 729 729 729 729 729 729

a distribucija sluajne varijable Y tablicom


Y =

217 169 127 91


62
36
19
7
1
729 729 729 729 729 729 729 729 729

Uoimo da dogaaji { : X() = x} = {X = x}, x R(X), i { : Y () = y} = {Y = y},


y R(Y ), nisu nezavisni. Na primjer, u sluaju troznamenkastog broja 111 i sluajna varijabla
X i sluajna varijabla Y realiziraju se s 1. Slijedi da se u tom sluaju presjek dogaaja {X = 1}
i {Y = 1} realizira s vjerojatnou
P {X = 1, Y = 1} =

1
.
729

S druge strane, iz distribucija sluajnih varijabli X i Y znamo da je


P {X = 1} =

1
,
729

P {Y = 1} =

217
.
729

Dakle, ne vrijedi da je
P {X = x, Y = y} = P {X = x}P {Y = y},

(x, y) R(X) R(Y ),

pa dogaaji {X = x} i {Y = y} nisu nezavisni, to oteava odreivanje distribucije sluajnog


vektora (X, Y ).
Pretpostavimo da nas zanima razlika najvee i namanje znamenke takvog troznamenkastog broja.
Ta je razlika modelirana sluajnom varijablom (X Y ) koja prima vrijednosti iz skupa R(X Y ) =
{0, 1, . . . , 8}. Da bismo odredili vjerojatnosti pojedinih realizacija sluajne varijable (X Y ),
koristimo distribuciju sluajnog vektora (X, Y ):
P {X Y = n} =

9
X

P {X = k, Y = k n},

n R(X Y ).

k=n+1

Na primjer, iz gornje formule slijedi da je


P {X Y = 0} =

9
X
k=1

P {X = k, Y = k} =

9
.
729

Vano je napomenuti da se oekivanje sluajne varijable g(X, Y ), nastale na temelju kompozicije realne funkcije g i diskretnog sluajnog vektora, moe izraunati
koristei tablicu distribucije sluajnog vektora (X, Y ) i oblik funkcije g bez raunanja tablice distribucije sluajne varijable g(X, Y ) (naravno, ukoliko oekivanje
postoji!). Ta tvrdnja moe se lako provjeriti koristei rezultate teorije ponovljenih
redova (vidi poglavlje 5.3 u Dodatku) tj. injenice da se kod apsolutno konvergentnih redova moe mijenjati redoslijed sumacije bez utjecaja na konaan rezultat.
Precizna formulacija te tvrdnje dana je teoremom 3.1.

141

Diskretan sluajni vektor

Teorem 3.1. Neka je (, P(), P ) diskretan vjerojatnosni prostor, (X, Y ) sluajni


vektor na njemu dan distribucijom 3.2 i g : R(X, Y ) R zadana funkcija. Tada
redovi
X
Eg(X, Y ) =
g(X, Y )()

i
XX
i

g(xi , yj )p(xi , yj )

istovremeno ili apsolutno konvergiraju ili apsolutno divergiraju. U sluaju su im


apsolutne konvergencije sume jednake.
Zadatak 3.2.

Dokaite taj teorem!

Primjer 3.12. Standardan sveanj od 52 karte sastoji se od 26 crvenih karata (13 hercova i
13 karo karata) i 26 crnih karata (13 pikova i 13 trefova). Iz takvog se svenja na sluajan
nain jedna za drugom (bez vraanja) izvlae dvije karte. Oznaimo s X sluajnu varijablu koja
se realizira brojem izvuenih pikova, a s Y sluajnu varijablu koja se realizira brojem izvuenih
trefova. Zakljuujemo da je distribucija sluajnog vektora (X, Y ) sljedea:
R(X, Y ) = {(x, y) : x {0, 1, 2}, y {0, 1, 2}, x + y 2},
13 13
26 
P {X = x, Y = y} =

2xy
52
2

Distribuciju sluajnog vektora (X, Y ) i njegove marginalne distribucije pregledno prikazujemo sljedeom tablicom:
X Y
0
1
2
pY (y)

0
25/102
13/51
1/17
19/34

1
13/51
13/102
0
13/34

2
1/17
0
0
1/17

pX (x)
19/34
13/34
1/17
1

Tablica 3.3: Tablica distribucije sluajnog vektora (X, Y ) iz primjera 3.12.

Iz proirene tablice distribucije sluajnog vektora (X, Y ) vidimo da su X i Y jednako distribuirane


sluajne varijable.
Broj izvuenih crnih karata modeliramo sluajnom varijablom (X + Y ) ija je slika R(X + Y ) =
{0, 1, 2}. Ako elimo izraunati oekivani broj izvuenih crnih karata, tj. oekivanje sluajne
varijable (X + Y ), to moemo uiniti pomou tablice distribucije sluajnog vektora (X, Y ), dakle
bez raunanja distribucije sluajne varijable (X + Y ):
E(X + Y ) =

2
2 X
X

(x + y)P {X = x, Y = y} =

x=0 y=0

=1

13
1
13
13
1
+2
+1
+2
+2
= 1.
51
17
51
102
17

142

Sluajni vektor

Radi provjere dobivenog rezultata odredimo ipak distribuciju sluajne varijable (X + Y ) i izraunajmo njezino oekivanje. Pomou tablice distribucije sluajnog vektora (X, Y ) raunamo:
P {X + Y = 0} = P {X = 0, Y = 0} =

25
,
102

P {X + Y = 1} = P {X = 1, Y = 0} + P {X = 0, Y = 1} =

26
,
51

P {X + Y = 2} = P {X = 2, Y = 0} + P {X = 1, Y = 1} + P {X = 0, Y = 2} =

25
.
102

Dakle, distribucija sluajne varijable (X + Y ) dana je tablicom


X +Y =

0
1
2
25/102 26/51 25/102

!
,

a njezino je oekivanje broj


E(X + Y ) = 0

26
25
25
+1
+2
= 1,
102
51
102

ime smo se uvjerili u tonost prethodnog rezultata.

3.1.1

Uvjetne distribucije

Ako elimo prouavati veze meu komponentama sluajnog vektora, sama tablica
distribucije nije praktina, a marginalne distribucije su nedovoljne. Bolji uvid dobije
se analizom uvjetnih vjerojatnosti oblika P ({X A}|{Y = y}), gdje je A podskup
od R(X) ili P ({Y A}|{X = x}), gdje je A podskup od R(Y ). U tu svrhu definirat
emo uvjetne distribucije sluajnog vektora. Radi jednostavnijeg zapisa koristit
emo sljedeu oznaku:
P ({X A}|{Y = y}) = P {X A|Y = y}.
Primjer 3.13. Tablicom distribucije 3.4 opisan je sluajni vektor (T, Z) kojim je modeliran nivo
uspjeha pri polaganju teorijskog dijela (T ) i zadataka (Z) iz jednog ispita matematikog sadraja.
T Z
1
2
3

66
100
5
100
2
100
73
100

2
100
5
100
4
100
11
100

2
100
2
100
12
100
16
100

70
100
12
100
18
100

Tablica 3.4: Tablica distribucije sluajnog vektora iz primjera 3.13.


Koristei pravila za raunanje uvjetnih vjerojatnosti, lako moemo izraunati:
P {T = 1|Z = 1} =

P {T = 1, Z = 1}
66
=
,
P {Z = 1}
73

P {T = 2|Z = 1} =

5
P {T = 2, Z = 1}
=
,
P {Z = 1}
73

143

Diskretan sluajni vektor

2
P {T = 3, Z = 1}
=
.
P {Z = 1}
73
Uoimo da je suma dobivenih triju brojeva jednaka 1 te da oni daju uvjetne vjerojatnosti da se
postigne nivo uspjeha i iz teorije, i {1, 2, 3}, uz uvjet da je na zadacima postignut nivo 1. Na
taj nain odreena je uvjetna distribucija od T , uz uvjet da je Z = 1, koju moemo prikazati i
tablino:
!
1 2 3
T|Z=1 = 66 5 2
.
P {T = 3|Z = 1} =

73 73 73

Analogno, moemo izraunati i prikazati uvjetnu distribuciju od T , uz uvjet da je Z = 2, te


uvjetnu distribuciju od T , uz uvjet da je Z = 3, i komentirati slinost, odnosno razliitost tih
distribucija:
T|Z=2 =

2
5
4
11 11 11

!
,

T|Z=3 =

2
2 12
16 16 16

!
.

Iz navedenih uvjetnih distribucija moe se vidjeti da je, uz uvjet Z = 1, puno vea vjerojatnost da
se na teoriji postigne nivo 1 nego da se postigne neki vii nivo uspjeha. Nasuprot tomu, uz uvjet
da je Z = 3 vea je vjerojatnost da se i na teoriji postigne nivo uspjeha 3 nego manji nivoi. Te
injenice daju naslutiti da se uvjetna distribucija od T mijenja s razliitim vrijednostima od Z,
tj. da izmeu nivoa uspjeha postignutog na zadacima i teoriji postoji neka veza.
Opisujui numerike karakteristike dobivenih uvjetnih distribucija, ta injenica postaje jo slikovitija. Tako za oekivanja vrijedi:
E(T |Z = 1) = 1.12,

E(T |Z = 2) = 2.18,

E(T |Z = 3) = 2.63,

pa moemo rei da oekivanje nivoa uspjeha iz teorije raste s porastom nivoa uspjeha iz zadataka.

U openitom sluaju pretpostavimo da je tablicom 3.5 dana distribucija dvodimenzionalnog sluajnog vektora (X, Y ).
X Y
x1
x2
..
.
pY

y1
p(x1 , y1 )
p(x2 , y1 )

y2
p(x1 , y2 )
p(x2 , y2 )

y3
p(x1 y3 )
p(x2 , y3 )

pX
pX (x1 )
pX (x2 )

pY (y1 )

pY (y2 )

pY (y3 )

Tablica 3.5: Proirena tablica distribucije dvodimenzionalnog sluajnog vektora.


Tada je tablicom
x1

...
pX|Y =yj (x1 ) pX|Y =yj (x2 ) . . .
pX|Y =yj (xi ) =

x2

!
,

p(xi , yj )
, i {1, 2, . . .}
pY (yj )

dana uvjetna distribucija komponente X, uz uvjet da je Y = yj .

(3.5)

144

Sluajni vektor

Zadatak 3.3. Dokaite da je tablicom 3.5 dobro definirana tablica distribucije, tj. da vrijedi
X
pX|Y =yj (xi ) 0, i,
pX|Y =yj (xi ) = 1.
i

Na analogan nain moemo definirati i komentirati uvjetne distribucije komponente


Y , uz uvjet da je X = xi za svaki i.
Primjer 3.14. Neka je (X, Y ) sluajni vektor koji se realizira ureenim parom brojeva u kojemu
je prva komponenta broj pikova, a druga komponenta broj trefova izvuenih pri sluajnom odabiru
(bez vraanja) dviju karata iz standardnog svenja od 52 karte. Distribucija sluajnog vektora
(X, Y ) dana je tablicom 3.3 u primjeru 3.12. Odredimo sada uvjetne distribucije i uvjetna oekivanja komponente X, uz uvjet Y = y za sve y {0, 1, 2}, te komponente Y , uz uvjet X = x za
sve x {0, 1, 2}. Usmjerimo se prvo na uvjetnu distribuciju od X, uz uvjet da je Y = y.
Za y = 0 je
P {X = 0, Y = 0}
25
=
,
P {Y = 0}
57
P {X = 1, Y = 0}
26
P {X = 1|Y = 0} =
=
,
P {Y = 0}
57
P {X = 2, Y = 0}
2
P {X = 2|Y = 0} =
=
.
P {Y = 0}
19
P {X = 0|Y = 0} =

Za y = 1 je P {X = 0|Y = 1} =

2
,
3

P {X = 1|Y = 1} =

1
3

i P {X = 2|Y = 1} = 0.

Za y = 2 je P {X = 0|Y = 2} = 1, P {X = 1|Y = 2} = 0 i P {X = 2|Y = 2} = 0.


Slijedi da su uvjetne distribucije redom dane tablicama
!
0
1
2
X|Y =0 =
,
X|Y =1 =
25/57 26/57 2/19

0 1
2/3 1/3

!
,

dok je vjerojatnost da se X realizira nulom, uz uvjet da je Y = 2, jednaka jedan. Oekivanja su


tih uvjetnih distribucija sljedea:
1
38
,
E(X|Y = 1) = ,
E(X|Y = 2) = 1.
57
3
Analognim postupkom dobivamo uvjetne distribucije i uvjetna oekivanja komponente Y , uz uvjet
X = x za sve x {0, 1, 2}. Uoimo da je u ovom primjeru uvjetna distribucija od X, uz uvjet
Y = i, jednaka uvjetnoj distribuciji od Y , uz uvjet da je X = i, za sve i {0, 1, 2}.
E(X|Y = 0) =

Primjer 3.15. U primjeru 3.9 pokazali smo da su marginalne distribucije sluajnog vektora
(X, Y ) M U LT (n, p1 , p6 ) binomne, tj. da je X B(n, p1 ), a Y B(n, p6 ). Odredimo sada
uvjetne distribucije tih komponenti tog sluajnog vektora. Za x R(X) je
y 
nxy
 n x  p
P {X = x, Y = y}
p6
6
=
1
.
P {Y = y|X = x} =
P {X = x}
1 p1
1 p1
y
Slijedi da je uvjetna distribucija od Y , uz uvjet X = x, binomna s parametrima (nx) i p6 /(1p1 ).
Analogno slijedi da je uvjetna distribucija od X, uz uvjet Y = y, binomna s parametrima (n y)
i p1 /(1 p6 ). Budui da je matematiko oekivanje binomne sluajne varijable jednako umnoku
njezinih parametara, slijedi da je
E(Y |X = x) =

p6 (n x)
,
1 p1

x R(X),

E(X|Y = y) =

p1 (n y)
,
1 p6

y R(Y ).

145

Diskretan sluajni vektor

3.1.2

Nezavisnost

Ukoliko za dani diskretan sluajni vektor (X, Y ) uvjetne distribucije komponente


Y , uz uvjet X = xi , ostaju stalno iste pri promjeni xi , i N, to daje naslutiti da
su komponente tog sluajnog vektora nezavisne. Meutim, nezavisnost sluajnih
varijabli definirat emo koristei definiciju nezavisnosti dogaaja. Takoer emo
pokazati da je navedena intuitivna injenica o nezavisnosti komponenti danog sluajnog vektora u suglasnosti s definicijom nezavisnosti sluajnih varijabli.
Za dogaaje A i B danog vjerojatnosnog prostora (, F, P ) rekli smo da su nezavisni
ako vrijedi P (AB) = P (A)P (B) (vidi poglavlje 1.9). Ako pretpostavimo da takav
tip jednakosti vrijedi za sve dogaaje inducirane diskretnim sluajnim varijablama
X i Y na vjerojatnosnom prostoru (, P(), P ), tj. ako je
P {X A, Y B} = P {X A}P {Y B}
za sve A R(X), B R(Y ), onda emo rei da su sluajne varijable X i Y
nezavisne.
Definicija 3.3. Za diskretne sluajne varijable X i Y definirane na istom diskretnom vjerojatnosno prostoru (, P(), P ) kaemo da su nezavisne ako za sve
skupove A R i B R vrijedi
P {X A, Y B} = P {X A}P {Y B}.

Teorem 3.2. Neka je (X, Y ) diskretan sluajni vektor na vjerojatnosnom prostoru


(, P(), P ) ija je distribucija dana tablicom 3.5, tj.
X Y
x1
x2
..
.
pY

y1
p(x1 , y1 )
p(x2 , y1 )

y2
p(x1 , y2 )
p(x2 , y2 )

y3
p(x1 y3 )
p(x2 , y3 )

pX
pX (x1 )
pX (x2 )

pY (y1 )

pY (y2 )

pY (y3 )

Sluajne varijable X i Y jesu nezavisne onda i samo onda ako vrijedi


p(xi , yj ) = pX (xi )pY (yj )
za sve xi R(X), yj R(Y ).

146

Sluajni vektor

Dokaz. Pretpostavimo da su X i Y nezavisne sluajne varijable. Za proizvoljne


xi R(X), yj R(Y ) je {xi } R, {yj } R, pa je
p(xi , yj ) = P {X = xi , Y = yj } = P {X = xi }P {Y = yj } = pX (xi )pY (yj ),
tj. vrijedi tvrdnja teorema.
Obratno, pretpostavimo da je p(xi , yj ) = P {X = xi }P {Y = yj } za sve xi R(X),
yj R(Y ) i neka su A R, B R proizvolji skupovi. Tada vrijedi:
P

P {X A, Y B} =

P {} =
P P
P P
=
p(xi , yj ) =
P {X = xi }P {Y = yj } =
xi A yj B
x A yj B
P
P i
=
P {X = xi }
P {Y = yj } =
{X()A,Y ()B}

xi A

yj B

= P {X A}P {Y B}.
Primjer 3.16. Iz kutije koja sadri tri kupona s oznakama 1, 2 i 3 izvlaimo dva kupona tako
da prvi izvueni kupon vratimo u kutiju prije izvlaenja drugog kupona (izvlaenje s vraanjem).
Rezultat izvlaenja modeliran je sluajnim vektorom (X, Y ), gdje je X rezultat prvog izvlaenja,
a Y razultat drugog izvlaenja. Distribucija tog sluajnog vektora dana je sljedeom tablicom:
X Y
1
2
3
pY

1
1/9
1/9
1/9
1/3

2
1/9
1/9
1/9
1/3

3
1/9
1/9
1/9
1/3

pX
1/3
1/3
1/3
1

Koristei teorem 3.2 vidimo da su X i Y nezavisne. Takoer moemo uoiti da su uvjetne distribucije komponente X, uz dano Y = i, jednake za sve i {1, 2, 3} i da su jednake marginalnim
distribucijama komponente X. Analogna tvrdnja vrijedi i za uvjetne distribucije komponente Y ,
uz dano X = i, i {1, 2, 3}.
Promotrimo sada izvlaenje dvaju kupona, ali bez vraanja prvog izvuenog kupona u kutiju. Rezultat izvlaenja modeliran je sluajnim vektorom (U, V ), gdje je U rezultat prvog izvlaenja, a V
razultat drugog izvlaenja. Distribucija sluajnog vektora (U, V ) dana je tablicom
U V
1
2
3
pY

1
0
1/6
1/6
1/3

2
1/6
0
1/6
1/3

3
1/6
1/6
0
1/3

pX
1/3
1/3
1/3
1

147

Diskretan sluajni vektor

Koristei teorem 3.2 vidimo da U i V nisu nezavisne. Takoer uoimo da se marginalne distribucije sluajnih vektora (X, Y ) i (U, V ) podudaraju.

Openito su kod nezavisnih komponenti diskretnog sluajnog vektora (X, Y ) uvjetne


distribucije od X, uz dano Y = yj , iste za sve yj R(Y ) i jednake marginalnoj
distribuciji komponente X. Slino vrijedi i za uvjetne distribucije komponente Y ,
uz dano X = xi , xi R(X).
Zaista, neka je (X, Y ) sluajni vektor s tablicom distribucije 3.1 i nezavisnim komponentama X i Y . Tada je
pX|Y =yj (xi ) =

p(xi , yj )
pX (xi )pY (yj )
=
= pX (xi ),
pY (yj )
pY (yj )

i {1, 2, . . .}.

Sljedei teorem daje vrlo vano svojstvo nezavisnih sluajnih varijabli.


Teorem 3.3. Neka su X i Y nezavisne sluajne varijable takve da postoji E(X) i
E(Y ). Tada postoji E(X Y ) i vrijedi:
E(XY ) = E(X)E(Y ).
Dokaz. Koristei poznate rezultate o sumi redova3 kao i rezultate teorije ponovljenih redova (vidi poglavlje 5.3 u Dodatku), znamo da konvergencija redova
X

|xi |pX (xi ),

|yj |pY (yj )

povlai konvergenciju reda


XX
i

|xi yj |pX (xi )pY (yj ).

Osim toga, vrijedi:


PP
i

xi yj p(xi , yj ) =

PP

xi yj pX (xi )pY (yj ) =


P
P
=
xi pX (xi ) yj pY (yj ) =
i

= E(X) E(Y ).
Koristei teorem 3.1 moemo zakljuiti da E(XY ) postoji i da vrijedi tvrdnja teorema.
3 Vidi

npr. [13].

148

Sluajni vektor

3.2

Neprekidan dvodimenzionalan sluajni vektor

U neprekidnom sluaju dvodimenzionalan sluajni vektor prima vrijednosti u skupu


R R = R2 ali, za razliku od diskretnog sluajnog vektora, njegov skup vrijednosti
sadri neko podruje iz R2 .
Definicija 3.4. Rei emo da je (X, Y ) dvodimenzionalan neprekidan sluajni vektor ako postoji nenegativna realna funkcija f : R2 R, takva da se funkcija distribucije od (X, Y ) moe napisati u obliku
Zx Zy
F (x, y) =

f (u, v) du dv.

(3.6)

Takvu funkciju f nazivamo funkcija gustoe neprekidnog sluajnog vektora.


Vidimo da su, zbog jednakosti (3.6), vjerojatnosna svojstva neprekidnog sluajnog
vektora u potpunosti odreena njegovom funkcijom gustoe.
Primjer 3.17. Sluajni vektor uniformne distribucije na krugu {(x, y) : x2 + y 2 < r2 } dan je
funkcijom gustoe
(
1
, x2 + y 2 < r2
r2
.
f (x, y) =
0 , ina
ce
Primjer 3.18. Dvodimenzionalan normalan sluajni vektor dan je funkcijom gustoe f : R2 R
koja je definirana pravilom

2

2 
(x1 )(y2 )
y2
x1
1

2
+

2
1
1
1 2
2
2(1 )
p
,
(3.7)
f (x, y) =
e
21 2 1 2
gdje su 1 R, 2 R, 1 > 0, 2 > 0, h1, 1i. U tom sluaju koristimo oznaku (X, Y )
N (1 , 2 , 12 , 22 , ). 4

Ako je (X, Y ) neprekidan sluajni vektor s funkcijom gustoe f (x, y) onda e njegove
marginalne distribucije takoer biti neprekidnog tipa s gustoama koje moemo
izraunati iz f (x, y).
Zaista, neka je (X, Y ) dvodimenzionalan sluajni vektor s gustoom f (x, y). Vrijedi:
Zx Z
P {X x} = P {X x, Y < } =

f (u, v) du dv =

Zx
=
Vidi Sarapa [26, str. 274].

f (u, v) dv du.

149

Neprekidan sluajni vektor


Definiramo li

Z
f (x, v) dv ,

fX (x) =

onda je fX realna funkcija realne varijable koja ima potrebna svojstva da bi bila
gustoa sluajne varijable X, tj. ona je nenegativna i za svaki x R vrijedi:
Zx
P {X x} =

fX (u) du.

Funkciju fX zovemo marginalna funkcija gustoe komponente X sluajnog vektora (X, Y ). Analogno je
Z
fY (y) =
f (u, y) du ,

marginalna funkcija gustoe komponente Y sluajnog vektora (X, Y ).


Primjer 3.19. Odredimo marginalne distribucije dvodimenzionalnog normalnog sluajnog vektora
(X, Y ) N (1 , 2 , 12 , 22 , ) zadanog funkcijom gustoe (3.7). Funkciju gustoe sluajne varijable
X raunamo na sljedei nain:
fX (x) =

1
p
e 2(1)2
2
21 2 1

y2
2

x1
1

2

1
2(1)2

y2
2

dy = 2 dz

1
p
e
21 1 2

x1
1



y2
2

2 1
1

dy =

1
2 x
=z

2(12 )

x1
1

2


1
= z + 2 x
1

1
2
2(12 )

x1
1

2

Z
e

z2
2(12 )

dz =





p
z


= t, dz = 1 2 dt
p
2
1

1
=
e
21

(x1 )2
2
21

t2

1
dt =
e
21

(x1 )2
2
21

2 =

1 2

(x1 )2
2
21

Uoimo da je
1

(x1 )2
2
21

, xR
(3.8)
1 2
funkcija gustoe normalne distribucije s parametrima 1 R i 12 , 1 > 0, tj. X N (1 , 12 ).
Analognim postupkom slijedi da je Y N (2 , 22 ). Dakle, marginalne distribucije dvodimenzionalnog normalnog sluajnog vektora su normalne.
fX (x) =

Neka je (X, Y ) neprekidan sluajni vektor s funkcijom gustoe f i neka je g neka


funkcija koja ureenom paru realnih brojeva pridruuje realan broj, tj. g : R2 R.
Moe se dokazati (vidi npr. [26]) da u mnogo zanimljivih sluajeva (npr. ako je g
neprekidna) g(X, Y ) definira sluajnu varijablu na .

150

Sluajni vektor

Moe se takoer pokazati da za raunanje oekivanja tako nastalih sluajnih varijabli nije potrebno traiti funkciju distribucije od g(X, Y ), ve se moe iskoristiti
funkcija gustoe od (X, Y ) i oblik funkcije g (ako oekivanje uope postoji) na
sljedei nain:
Z Z
Eg(X, Y ) =
g(x, y) dx dy.
(3.9)

Na primjer, komponiranjem projekcije ureenog para (x, y) na prvu koordinatnu os


1 (x, y) = x
i sluajnog vektora (X, Y ) dobijemo komponentu X, pa oekivanje EX (ako postoji)
moemo izraunati pomou E(1 (X, Y )), tj.
Z Z
E(X) =

Z
x f (x, y) dx dy =

xfX (x) dx,

(3.10)

gdje je f funkcija gustoe sluajnog vektora (X, Y ), a fX marginalna gustoa komponente X.


Analogno je
Z
E(Y ) =

yfY (y) dy.

Primjer 3.20. Neka je neprekidan dvodimenzionalan sluajni vektor (X, Y ) zadan funkcijom
gustoe
(
1 2 e1 x2 y , (x, y) h0, i h0, i
f (x, y) =
,
0
,
inae
gdje su 1 i 2 pozitivni realni brojevi. Sluajna varijabla XY nastaje kompozicijom sluajnog
vektora (X, Y ) : R2 i funkcije g : R2 R definirane pravilom g(x, y) = xy. Matematiko
oekivanje sluajne varijable XY raunamo na sljedei nain:
Z Z
E(XY ) =

ZZ
xyf (x, y) dx dy = 1 2

xye1 x1 y dx dy =

1
1 2
=
.
21 22
1 2

Odredimo i marginalne distribucije te oekivanja marginalnih distribucija sluajnog vektora (X, Y ).


Funkciju gustoe sluajne varijable X raunamo na sljedei nain:
Z
fX (x) = 1 2

e1 x2 y dy = . . . = 1 e1 x ,

x > 0.

Dakle, X ima eksponencijalnu distribuciju s parametrom 1 > 0. Slijedi da je EX = 1/1 .


Analognim postupkom slijedi da Y ima eksponencijalnu distribuciju s parametrom 2 > 0, pa je
EY = 1/2 .

151

Neprekidan sluajni vektor

3.2.1

Uvjetne gustoe. Nezavisnost

U ovom emo poglavlju emo bez dokaza navesti nekoliko rezultata korisnih za
statistike primjene po analogiji s diskretnim sluajem. Tu se pojavljuje funkcija
gustoe sluajnog vektora kao nositelj vjerojatnosnih svojstava umjesto tablice distribucije diskretnoga sluajnog vektora.
Neka je (X, Y ) neprekidan sluajni vektor s gustoom f (x, y) i y takav realan broj
da je fY (y) > 0. Funkciju
f (x, y)
fX|Y =y (x) =
(3.11)
fY (y)
zovemo uvjetna gustoa od X uz uvjet Y = y. Analogno je
f (x, y)
fX (x)

fY |X=x (y) =

(3.12)

uvjetna gustoa od Y uz uvjet X = x. Ovdje su fY i fX pripadne marginalne


gustoe.
Veliine definirane formulom
Z
E(X | Y = y) =

x fX|Y =y (x) dx,

(3.13)

y fY |X=x (y) dy

(3.14)

odnosno

Z
E(Y | X = x) =

zovemo uvjetno oekivanje komponente X, uz uvjet Y = y, odnosno uvjetno


oekivanje komponente Y , uz uvjet X = x.
Primjer 3.21. Odredimo uvjetne distribucije dvodimenzionalnoga normalnog sluajnog vektora
(X, Y ) N (1 , 2 , 12 , 22 , ) zadanog funkcijom gustoe (3.7). Odredimo prvo uvjetnu distribuciju komponente X, uz uvjet Y = y, y R. Funkciju gustoe uvjetne distrbiucije od X, uz uvjet
Y = y, raunamo pomou funkcije gustoe f (x, y) sluajnog vektora (X, Y ) i funkcije gustoe
fY (y) komponenete Y N (2 , 22 ):


fX|Y =y (x) =

1
f (x, y)
p
=
e
fY (y)
1 2(1 2 )


2

x 1 + 1 (y2 )
2
2 (12 )
21

Uoimo da je fX|Y =y (x) funkcija gustoe normalne distribucije s parametrima


1 +

1
(y 2 )
2

12 (1 2 ).

x R.

152

Sluajni vektor

Iz tog rezultata odmah slijedi da su uvjetno oekivanje i varijanca sluajne varijable X, uz uvjet
Y = y, dani sljedeim izrazima:
E(X|Y = y) = 1 +

1
(y 2 ),
2

V ar(X|Y = y) = 12 (1 2 ).

Analogan rezultat vrijedi za uvjetnu distribuciju komponente Y , uz uvjet X = x:




2
Y|X=x N 2 + (x 1 ), 22 (1 2 ) ,
1
2
(x 1 ),
V ar(Y |X = x) = 22 (1 2 ).
1
Dakle, i uvjetne distribucije normalnog sluajnog vektora su normalne.
E(Y |X = x) = 2 +

U poglavlju o nezavisnosti komponenata dvodimenzionalnog sluajnog vektora vidjeli smo da se nezavisnost moe karakterizirati injenicom da se distribucija sluajnog vektora moe dobiti kao produkt marginalnih distribucija. Problemom nezavisnosti komponenti neprekidnog sluajnog vektora neemo se baviti detaljno.
Navodimo samo da je u tom sluaju nezavisnost ekvivalentna injenici da se funkcija gustoe sluajnog vektora moe prikazati kao produkt marginalnih gustoa kao
i injenici da se funkcija distribucije sluajnog vektora moe prikazati kao produkt
marginalnih funkcija distribucije:
Neka je (X, Y ) neprekidan sluajni vektor s funkcijom gustoe f i funkcijom distribucije F . Neka su fX (FX ) odnosno fY (FY ) njegove marginalne
gustoe (funkcije distribucije). Rei emo da su sluajne varijable X i Y
nezavisne ako za svaki (x, y) R2 vrijedi
F (x, y) = FX (x) FY (y).
Tada je i
f (x, y) = fX (x) fY (y)
za svaki (x, y) R2 .
Obratno, ako prethodna jednakost za gustoe vrijedi za sve (x, y) R2 osim eventualno na skupu povrine nula, tada su X i Y nezavisne sluajne varijable.
Sada je lako vidjeti da se i ovdje, u sluaju nezavisnih komponenti, uvjetne gustoe
podudaraju s odgovarajuim marginalnim gustoama.
Primjer 3.22. Promotrimo ponovno sluajni vektor zadan funkcijom gustoe
(
1 2 e1 x2 y , (x, y) h0, i h0, i
f (x, y) =
,
0
,
inae

153

Neprekidan sluajni vektor

gdje su 1 i 2 pozitivni realni brojevi. U primjeru 3.20 pokazali smo da su njegove marginalne
distribucije eksponencijalne, tj. da je X eksponencijalna sluajna varijabla s parametrom 1 > 0,
a Y eksponencijalna sluajna varijabla s parametrom 2 > 0:
(
(
2 e2 y , y > 0
1 e1 x , x > 0
.
,
fY (y) =
fX (x) =
0
, y0
0
, x0
Uoimo da je u tom sluaju
f (x, y) = fX (x)fY (y)
pa su sluajne varijable X i Y nezavisne. Zbog nezavisnosti sluajnih varijabli X i Y vrijede
sljedee tvrdnje.
Marginalna distribucija komponente X i uvjetna distribucija komponente X, uz uvjet Y = y (za
bilo koji y > 0), jednake su - eksponencijalne s parametrom 1 .
Marginalna distribucija komponente Y i uvjetna distribucija komponente Y , uz uvjet X = x (za
bilo koji x > 0), jednake su - eksponencijalne s parametrom 2 .
Primjer 3.23. Na temelju primjera 3.19 u kojemu su odreene marginalne distribucije dvodimenzionalnoga normalnog sluajnog vektora (X, Y ) s funkcijom gustoe (3.7) i karakterizacije
nezavisnosti sluajnih varijabli, slijedi da komponente X N (1 , 12 ) i Y N (2 , 22 ) normalnog
sluajnog vektora (X, Y ) openito nisu nezavisne. Meutim, za = 0 funkcija gustoe (3.7) dana
je izrazom

2 
2 
x1
2
+ y
21
1
1
2
f (x, y) =
, (x, y) R2 .
e
21 2
Uoimo da je u tom sluaju f (x, y) = fX (x)fY (y), tj. ako je = 0, komponente normalnoga
sluajnog vektora (X, Y ) nezavisne su.

Svojstvo nezavisnih sluajnih varijabli, da se oekivanje produkta moe izraunati


kao produkt oekivanja, vrijedi i ovdje. Naime imamo:
Teorem 3.4. Neka je (X, Y ) neprekidan sluajni vektor takav da su X i Y nezavisne sluajne varijable za koje postoji EX i EY . Tada postoji E(X Y ) i vrijedi:5
E(X Y ) = E(X) E(Y ).
Primjer 3.24. U primjeru 3.22 pokazali smo da su komponente X i Y sluajnog vektora (X, Y )
nezavisne i eksponencijalno distribuirane s parametrima 1 > 0 i 2 > 0, redom. Budui da je
EX = 1/1 , a EY = 1/2 , prema teoremu 3.4 slijedi da je
E(XY ) = EX EY =

1
.
1 2

Sjetimo se da smo E(XY ) u primjeru 3.20 izraunali pomou funkcije gustoe sluajnog vektora
(X, Y ).
5 Taj

teorem neemo dokazivati, a zainteresirani itatelj dokaz moe nai u [26, teorem 11.5]

154

3.3

Sluajni vektor

Kovarijanca i koeficijent korelacije

U ovom poglavlju bavimo se definiranjem osnovnih numerikih katakteristika sluajnog vektora - momentima. Rezultati se odnose na diskretan i neprekidan dvodimenzionalan sluajni vektor za kojega smo opisali nain raunanja oekivanja sluajne
varijable g(X, Y ), gdje je g realna funkcija dviju varijabli.
Momenti sluajnog vektora posluit e za opisivanje nekih svojstava sluajnog vektora slino kao to momenti sluajne varijable opisuju sluajnu varijablu.
Definicija 3.5. Neka je (X, Y ) diskretan ili neprekidan dvodimenzionalan sluajni
vektor. Oekivanje
E(X k Y l ), k, l N0
sluajne varijable X k Y l (ako postoji) nazivamo ishodini moment reda (k, l)
sluajnog vektora (X, Y ) i piemo
kl = E(X k Y l ).

(3.15)


l

Oekivanje E (X EX)k (Y EY ) (ako postoji) nazivamo centralni moment


reda (k, l) sluajnog vektora (X, Y ) i piemo

mkl = E (X EX)k (Y EY )l .

(3.16)

Uoimo da momenti reda (0, 1), (0, 2), (1, 0), (2, 0) daju ustvari oekivanje i varijancu komponenata sluajnog vektora. Naime, vrijedi:
10 = EX,
01 = EY,
2
m20 = E (X EX) = Var X,
2
m02 = E (Y EY ) = Var Y.
Od posebne je vanosti za izuavanje sluajnih vektora centralni moment reda (1, 1)
kojega nazivamo korelacijski moment ili kovarijanca dvodimenzionalnoga sluajnog vektora. Dakle, kovarijanca dvodimenzionalnog sluajnog vektora (X, Y )
definirana je izrazom
Cov (X, Y ) = E ((X EX)(Y EY )) .

(3.17)

Definicijski oblik kovarijance moe se lako, koritenjem linearnosti oekivanja, transformirati u oblik koji je nekada prikladniji za raunanje:
Cov (X, Y ) = E (XY X EY ) Y EX + EX EY ) = E(XY ) EX EY.

155

Kovarijanca i koeficijent korelacije

Primjer 3.25. Prisjetimo se primjera 3.16 koji je govorio o izvlanju dvaju kupona iz kutije koja
sadri ukupno tri kupona oznaena brojevima 1, 2 i 3. U tom smo primjeru promatrali izvlaenje
dvaju od triju kupona na sljedea dva naina:
prvi izvueni kupon vraa se u kutiju prije izvlaenja drugog kupona; S X smo oznaili sluajnu
varijablu koja se realizira brojem kojim je oznaen prvi izvueni kupon, a s Y sluajnu
varijablu koja se realizira brojem kojim je oznaen drugi izvueni kupon,
prvi izvueni kupon ne vraa se u kutiju prije izvlaenja drugog kupona; S U smo oznaili sluajnu
varijablu koja se realizira brojem kojim je oznaen prvi izvueni kupon, a s V sluajnu
varijablu koja se realizira brojem kojim je oznaen drugi izvueni kupon.
Sjetimo se da su sluajne varijable X i Y nezavisne, dok sluajne varijable U i V nisu nezavisne.
Distribucije sluajnih vektora (X, Y ) i (U, V ) dane su tablicama u primjeru 3.16. X, Y , U i V
sve su jednako distribuirane s matematikim oekivanjem
1

1
1
1
+ 2 + 3 = 2.
3
3
3

Odredimo sada Cov (X, Y ) i Cov (U, V ):


- budui da su X i Y nezavisne, znamo da je E(XY ) = EX EY pa slijedi da je Cov (X, Y ) =
E(XY ) EX EY = 0.
- kako U i V nisu nezavisne, problem izraunavanja njihove kovarijance svodi se na problem
izraunavanja oekivanja E(U V ):
E(U V )

2 X
2
X

ijP {X = i, Y = j} =

i=1 j=1

=
=

1
1
1
1
1
1
2 +3 +2 +6 +3 +6 =
6
6
6
6
6
6
11
.
3

Sada slijedi da je
Cov (U, V ) = E(U V ) EU EV =

1
11
4= .
3
3

Primjer 3.26. Odredimo kovarijancu komponenti dvodimenzionalnoga multinomnog sluajnog


vektora (X, Y ) M U LT (n, p, q) ija je distribucija dana u primjeru 3.9. Budui da su marginalne
distribicije toga sluajnog vektora binome, tj. X B(n, p) i Y B(n, q), zakljuujemo da postoje
x R(X) i y R(Y ) takvi da je P {X = x, Y = y} 6= P {X = x}P {Y = y}, pa sluajne
varijable X i Y nisu nezavisne. Takoer znamo da je EX = np i EY = nq. Da bismo izraunali
kovarijancu sluajnih varijabli X i Y , preostaje jo izraunati E(XY ):
E(XY ) =

n
n X
X
x=0 y=0

xyP {X = x, Y = y} =

n nx
X
X

xyP {X = x, Y = y} = n(n 1)pq.

x=0 y=0

Sada slijedi da je
Cov (X, Y ) = E(XY ) EX EY = n(n 1)pq n2 pq = npq.

Vanost tog momenta za opisivanje sluajnog vektora proizlazi iz injenice da se kovarijanca, kao numerika karakteristika sluajnog vektora, moe povezati s pojmom
nezavisnosti sluajnih varijabli. Naime, vrijedi sljedei teorem.

156

Sluajni vektor

Teorem 3.5. Neka je (X, Y ) neprekidan ili diskretan dvodimenzionalan sluajni


vektor za koji postoje EX i EY . Ako su sluajne varijable X i Y nezavisne, onda
je Cov (X, Y ) = 0.
Dokaz. Neka su ispunjeni uvjeti teorema. Zbog nezavisnosti je
E(XY ) = EX EY.
Dakle, vrijedi:
Cov (X, Y ) = E(XY ) EX EY = 0.
Posljedica je tog terema sljedea: ako dvodimenzionalan sluajni vektor ima
kovarijancu razliitu od nule, onda su njegove komponente nuno zavisne.
Valja napomenuti da openito ne vrijedi obrat tog teorema, tj. ako je kovarijanca od (X, Y ) jednaka nuli, to ne znai nuno da su sluajne varijable X i Y
nezavisne, to je ilustrirano sljedeim primjerom.
Primjer 3.27. Neka je U diskretna sluajna vrijabla definirana tablicom distribucije
!
/2 0 /2
U =
1/3 1/3 1/3
i neka je (X, Y ) sluajni vektor definiran kao X = sin U , Y = cos U . Distribucija je tog sluajnog
vektora zadana sljedeom tablicom:
X Y
1
0
1
pY

0
1/3
0
1/3
2/3

1
0
1/3
0
1/3

pX
1/3
1/3
1/3
1

Kovarijanca je tog sluajnog vektora 0, a komponente oito nisu nezavisne (npr.


pX (1)pY (1)).

p(1, 1) 6=

Definicija 3.6. Neka je (X, Y ) sluajni vektor za koji je Cov (X, Y ) = 0. Tada
kaemo da su njegove komponente X i Y nekorelirane.
Iz definicije kovarijance vidimo da vanu ulogu u njezinom iznosu ima odstupanje
pojedine komponente sluajnog vektora od njezinog oekivanja (devijacija). Meutim, devijaciju smo sluajne varijable ve opisali varijancom, odnosno standardnom
devijacijom sluajne varijable. Da bismo smanjili utjecaj devijacije na numeriku
karakteristiku kojom elimo dobiti nove informacije o sluajnom vektoru, od velikog je interesa prouavanje kovarijance standardiziranog oblika sluajnog vektora

157

Kovarijanca i koeficijent korelacije

2
(X, Y ). Naime, ukoliko X i Y imaju varijance X
6= 0 i Y2 =
6 0, moemo ih standardizirati (vidi poglavlje 2.7). Ako oznaimo X = EX, Y = EY , postupak
standardizacije daje vektor


X X Y Y
(Xs , Ys ) =
,
X
Y

ija je kovarijanca
Cov (Xs , Ys ) =

Cov (X, Y )
.
X Y

Tako nastaje koeficijent korelacije sluajnog vektora (X, Y ) koji je definiran


izrazom
Cov (X, Y )
,
(3.18)
X,Y =
X Y
gdje su X i Y oznake za standardnu devijaciju odgovarajue komponente sluajnog vektora.
Primjer 3.28. Problem odreivanja koeficijenta korelacije normalnog sluajnog vektora (X, Y )
N (1 , 2 , 12 , 22 , ) (funkcija gustoe definirana je pravilom (3.7)), svodi se na izraunavanje
njegove kovarijance. Za to nam treba E(XY ):
Z Z
xyf (x, y) dxdy = 1 2 + 1 2 .

E(XY ) =

Sada slijedi da je
Cov(X, Y ) = E(XY ) EX EY = 1 2 + 1 2 1 2 = 1 2 .
Prema tome, koeficijent korelacije komponenti X i Y dvodimenzionalnoga normalnog sluajnog
vektora jest
Cov(X, Y )
1 2

=
= .
1 2
Var XVar Y
Dakle, parametar u distribuciji normalnoga sluajnog vektora (X, Y ) jest zapravo koeficijent
korelacije njegovih komponenti. Sjetimo se da smo u primjeru 3.23 pokazali da su za = 0
komponente normalnoga sluajnog vektora nezavisne. To znai da u tom sluaju nekoreliranost
sluajnih varijabli X i Y povlai njihovu nezavisnost, tj. u sluaju kad je = 0 komponente dvodimenzionalnoga normalnog sluajnog vektora nezavisne su onda i samo onda ako su nekorelirane.

Sljedei teorem daje dovoljne uvjete za postojanje kovarijance sluajnog vektora i


jednu korisnu nejednakost.

Teorem 3.6. Neka je (X, Y ) sluajni vektor za koji je 0 < E X 2 < i 0 <

E Y 2 < . Tada postoji kovarijanca i vrijede nejednakosti:
|X,Y | 1,


2
(E(XY )) E X 2 E Y 2 .

158

Sluajni vektor

Dokaz. Pretpostavimo da je (X, Y ) sluajni vektor takav da su X i Y sluajne


varijable s EX = EY = 0 i Var X = Var Y = 1. Ako postoji kovarijanca tog
sluajnog vektora, onda je Cov (X, Y ) = E(XY ) s obzirom da je EX EY = 0.


Takoer je, za takve sluajne varijable, Var X = E X 2 i Var Y = E Y 2 . Dakle,
kovarijanca postoji ako postoji E|XY |.
Koritenjem nejednakosti 2|xy| x2 +y 2 i monotonosti oekivanja vidimo da vrijedi:


1
E X 2 + E Y 2 < .
2
Dakle, kovarijanca postoji. Osim toga,
E|XY |


 1
1
E X 2 + E Y 2 = (1 + 1) = 1.
2
2
S obzirom da je, za taj sluajni vektor, kovarijanca ujedno i koeficijent korelacije,
vrijedi prva nejednakost teorema. Uoimo takoer da su za takve sluajne varijable
prva i druga nejednakost u iskazu teorema ekvivalentne.
|E(XY )| E|XY |

Pretpostavimo da je (X, Y ) bilo koji sluajni vektor kao u iskazu teorema. Tada
moemo provesti postupak standardizacije, a standardizirani oblik (Xs , Ys ) zadovoljava uvjete prvog dijela dokaza. Dakle, postoji kovarijanca od (Xs , Ys ) i vrijedi


2
(E(Xs Ys )) E Xs2 E Ys2 = 1. Osim toga vrijedi da je X = X Xs + X ,
Y = Y Ys + Y , gdje su X , X , Y , Y uobiajene oznake za standardne devijacije, odnosno oekivanja odgovarajuih sluajnih varijabli.
S obzirom da je
E|XY | = E|(X Xs + X )(Y Ys + Y )|
X Y E|Xs Ys | + X |Y |E|Xs | + Y |X |E|Ys | + |X Y |

vidimo da kovarijanca postoji. Koeficijent korelacije varijabli X i Y isti je kao


koeficijent korelacije njihovih standardiziranih oblika, pa je, po prvom dijelu dokaza,
po apsolutnoj vrijednosti manji ili jednak 1.
Za dokaz druge nejednakosti uoimo da je
2

2 2
(E(XY )) = X
Y (E(Xs Ys )) + 2X y X Y E(Xs Ys ) + 2X 2Y
2 2
X
Y + 2X y |X Y | + 2X 2Y
2
(X
+ 2X )(Y2 + 2Y )


= E X2 E Y 2 .

Kovarijanca i koeficijent korelacije

159

Da je koeficijent korelacije korisna numerika karakteristika za opisivanje veze meu


komponentama sluajnog vektora, slijedi i iz sljedeeg teorema koji pokazuje da se
linearna veza meu komponentama moe uoiti na osnovu vrijednosti koeficijenta
korelacije.
Teorem 3.7. Neka je (X, Y ) sluajni vektor za koji je 0 < X < i 0 < Y < .
Veza je meu komponentama linearna, tj. postoje realni brojevi a (a 6= 0) i b takvi
da je
Y = aX + b
onda i samo onda ako je |X,Y | = 1. Pritom je koeficijent korelacije 1 ako je a > 0,
odnosno 1 ako je a < 0.
Dokaz. Neka je sluajni vektor (X, Y ) takav da je Y = aX + b, (a 6= 0). Po
pretpostavkama teorema postoji kovarijanca pa vrijedi:
E(X EX)(Y EY ) =
= E ((X EX)(aX + b) E(aX + b)) = E ((X EX) a(X EX)) =
= aE(X EX)2 .
Dakle,
2
Cov (X, Y ) = aX
.

No, Var Y = a2 Var X, pa je


X,Y =

2
Cov (X, Y )
aX
a
.
=
=
Y X
X |a|X
|a|

Ako je a > 0, onda je X,Y = 1. Ako je a < 0, X,Y = 1.


Dokaimo obratnu tvrdnju. Pretpostavimo da je X,Y = 1. Definirajmo sluajnu
varijablu
1
1
Z=
X
Y.
X
Y
Tada je Var Z = 0. Zaista,

Var Z = E

1
1
X
Y
X
Y

2

2
1
1
E(
X
Y ) = 1 2X,Y + 1 = 0.
X
Y


Dakle, Z je konstanta, oznaimo Z = c. Vrijedi:


c=

1
1
X
Y,
X
Y

160

Sluajni vektor
Y =

Y
X Y c.
X

Za X,Y = 1 se tvrdnja moe dokazati na isti nain analiziranjem sluajne varijable


Z1 =

1
1
X+
Y.
X
Y

Slino kao kod vektora realnih brojeva, esto je korisno i sluajni vektor zapisivati
u matrinom obliku, tj. sluajni vektor (X, Y ) zapisujemo kao [X, Y ] . Tu oznaku
koristit emo u nastavku za definiranje oekivanja sluajnog vektora.
Ako za sluajni vektor Z = [X, Y ] postoje EX i EY , zapisivat emo ih u vektor
skom obliku kao [EX, EY ] i zvati oekivanje sluajnog vektora Z = [X, Y ] .
Varijance i kovarijancu takoer zapisujemo matrino. Naime, oznaimo li EZ =

[EX, EY ] , onda je
"
#
E(X EX)2
E(X EX)(Y EZ)

E(Z EZ)(Z EZ) =


E(X EX)(Y EZ)
E(Y EY )2
"
=

#
Var X Cov (X, Y )
.
Cov (X, Y ) Var Y

Takvu matricu Cov (X, Y ) = E(Z EZ)(Z EZ) zovemo matrica kovarijanci
sluajnog vektora (X, Y ).
Uoimo:
- matrica kovarijanci jest simetrina,
- matrica kovarijanci jest pozitivno semidefinitna.6
Neka je Zs standardizirana varijanta sluajnog vektora Z, tj.


X X Y Y
,
.
Zs =
X
Y
Njegovu matricu kovarijanci zovemo korelacijska matrica sluajnog vektora Z =
[X, Y ] i oznaavamo Corr (X, Y ). Oigledno vrijedi
"
#
1 X,Y
Corr (X, Y ) =
.
X,Y 1
6 Dokaite

ove tvrdnje.

161

Nezavisnost sluajnih varijabli

Primjer 3.29. Neka su X N (1 , 12 ) i Y N (2 , 22 ) nezavisne normalne sluajne varijable. Njih moemo shvatiti kao komponente dvodimenzionalnoga normalnog sluajnog vektora s
oekivanjem [1 , 2 ] , matricom kovarijanci
#
"
12 0
Cov(X, Y ) =
0 22
i korelacijskom matricom
"
Corr(X, Y ) =

1 0
0 1

#
.

Oekivanje sluajnog vektora, matrica kovarijanci i korelacijska matrica mogu se na


analogan nain definirati za n-dimenzionalan sluajni vektor Z = [X1 , . . . , Xn ] .

3.4

Openito o nezavisnosti sluajnih varijabli

Iz definicije nezavisnosti diskretnih sluajnih varijabli (definicija 3.3), moe se vidjeti


da je jednakost
p(xi , yj ) = pX (xi ) pY (yj ),

za sve xi R(X) i yj R(Y ),

ekvivalentna jednakosti
F (x, y) = FX (x)FY (y),

za sve (x, y) R2 ,

(3.19)

gdje je F funkcija distribucije diskretnoga sluajnog vektora (X, Y ), FX marginalna funkcija distribucije komponente X, a FY marginalna funkcija distribucije
komponente Y .
Budui da su vjerojatnosna svojstva sluajne varijable openito definirana funkcijom distribucije, nezavisnost emo sluajnih varijabli openito opisati upravo koritenjem jednakosti (3.19).
Neka su X i Y sluajne varijable s funkcijama distribucije FX i FY , redom, te
neka je F funkcija distribucije sluajnog vektora (X, Y ). Rei emo da su X i Y
nezavisne sluajne varijable ako vrijedi
F (x, y) = FX (x) FY (y)

za sve (x, y) R2 .

(3.20)

Takav je opis nezavisnih sluajnih varijabli lako poopiti i na n-dimenzionalan sluajni vektor.

162

Sluajni vektor

Neka su X1 , . . . , Xn sluajne varijable na nekom vjerojatnosnom prostoru (, F, P )


s pripadnim funkcijama distribucije F1 , . . . , Fn i neka je F funkcija distribucije
sluajnog vektora (X1 , . . . , Xn ), tj.
F (x1 , . . . , xn ) = P {X1 x1 , X2 x2 , . . . , Xn xn },

(x1 , . . . , xn ) Rn .

Rei emo da su sluajne varijable X1 , . . . , Xn nezavisne ako vrijedi7


F (x1 , . . . , xn ) = F1 (x1 ) Fn (xn ).

(3.21)

Posljedica je nezavisnosti skupa sluajnih varijabli {X1 , . . . , Xn } da i svi podskupovi


tog skupa sadre meusobno nezavisne sluajne varijable. (Npr. Xi i Xj , i, j =
1, . . . , n, i 6= j jesu takoer nezavisne.)
Vezano uz pojam nezavisnosti vano je istaknuti da za nezavisne sluajne varijable
koje imaju varijancu vrijedi sljedei teorem.
Teorem 3.8. Neka su X1 , . . . , Xn nezavisne sluajne varijable takve da postoji
varijanca Var Xk , k = 1, . . . , n i neka su a1 , . . . , an realni brojevi. Tada vrijedi:
!
n
n
X
X
Var
ak Xk =
a2k Var Xk .
(3.22)
k=1


Dokaz. Promotrimo prvo Var

k=1
n
P


ak Xk :

k=1

Var

n
X

!
ak Xk

=E

k=1

=E

n
X

n
X

ak Xk E

k=1

!2
(ak Xk ak EXk )

=E

k=1

n
X

!!2
ak Xk

k=1

n
X

(ak Xk ak EXk )(aj Xj aj EXj ) .

k,j=1

Za k 6= j jest zbog nezavisnosti


E(Xk EXk )(Xj EXj ) = 0,
pa zbog linearnosti oekivanja vrijedi:
!
n
X
Var
ak Xk = E
k=1

n
X
k=1

n
X

!
2

(ak Xk ak EXk )

k=1

a2k E(Xk EXk )2 =

n
X

a2k Var Xk .

k=1

Openitu definiciju nezavisnosti sluajnih varijabli X1 , . . . , Xn zainteresiran itatelj moe


pronai u [26].

163

Sluajni vektor

2 ) nezavisne
Primjer 3.30. Neka su X1 N (1 , 12 ), X2 N (2 , 22 ), . . . , Xn N (n , n
normalne sluajne varijable. Njih moemo shvatiti kao komponente n-dimenzionalnoga normalnog
sluajnog vektora s oekivanjem [1 , . . . , n ] , matricom kovarijanci

12
0

Cov(X1 , . . . , Xn ) =
..
.
0

0
22
..
.
0

0
0
..
.
0

0
0

..

.
2
. . . n
...
...
..
.

i jedininom korelacijskom matricom reda n.


Definirajmo sluajnu varijablu
Sn =

n
X

Xk = X1 + . . . + Xn

k=1

i izraunajmo njezino matematiko oekivanje i varijancu. Zbog linearnosti oekivanja slijedi da


je
!
n
n
n
X
X
X
ESn = E
Xk =
EXk =
k .
k=1

k=1

k=1

Varijancu sluajne varijable Sn , zbog nezavisnosti sluajnih varijabli X1 , . . . , Xn , raunamo pomou teorema 3.8. Dakle,
!
n
n
n
X
X
X
Var
Xk =
Var Xk =
k2 .
k=1

k=1

k=1

Uoimo da ukoliko su sluajne varijable X1 , . . . , Xn i jednako distribuirane, tj. ako je Xk


N (, 2 ) za svaki k {1, . . . , n}, tada je ESn = n, a Var Sn = n 2 .

3.5

Neki rezultati o nizovima sluajnih varijabli

U poglavlju 1.3 o statistikom pristupu modeliranju vjerojatnosti naveli smo svojstvo statistike stabilnosti relativnih frekvencija koje kae da se, kod nezavisnog
ponavljanja istog pokusa puno puta, relativna frekvencija pojavljivanja odabranog
dogaaja stabilizira u okolini nekog broja.
U poglavlju u kojemu je definirana normalna sluajna varijabla opisan je pokus
nazvan "Galtonova daska" koji ilustrira injenicu da normalna distribucija dobro
modelira realizacije pokusa iji su ishodi posljedica sume mnogo meusobno nezavisnih i jednako distribuiranih utjecaja.
U ovom poglavlju navodimo dva rezultata koji se odnose na granino ponaanje
nizova sluajnih varijabli i dokazuju istinitost navedenih svojstava.

164

3.5.1

Neki rezultati o nizovima sluajnih varijabli

Slabi zakon velikih brojeva i Bernoullijeva shema

Koritenjem slabog zakona velikih brojeva moemo objasniti statistiku stabilnost


relativnih frekvencija u uvjetima navedenim u poglavlju 1.3.
Definicija 3.7. Kaemo da niz sluajnih varijabli X1 , X2 , . . . zadovoljava slabi
zakon velikih brojeva ako za svaki > 0 vrijedi:


1
lim P
|Sn ESn | = 0,
n
n
gdje je
Sn =

n
X

Xk .

k=1

Taj zakon moemo interpretirati na sljedei nain:


Ako niz sluajnih varijabli zadovoljava slabi zakon velikih brojeva, onda
vjerojatnost da se realizacija prosjeka sluajnih varijabli X1 , . . . , Xn razlikuje od oekivanja prosjeka za vie od proizvoljno izabranog malog broja
tei nuli s poveanjem broja sluajnih varijabli u izraunu prosjeka.
Postoje mnogi rezultati koji daju dovoljne uvjete na niz sluajnih varijabli da bi on
zadovoljavao slabi zakon velikih brojeva. Ovdje emo dokazati samo jedan koji e
biti dovoljan za objanjenje statistike stabilnosti relativnih frekvencija odabranog
dogaaja kod nezavisnog ponavljanja istog pokusa.
Teorem 3.9. Neka je (Xn , n N) niz sluajnih varijabli takav da su, za svaki
n N, sluajne varijable X1 , . . . , Xn nezavisne i neka su varijance tih sluajnih
varijabli uniformno ograniene, tj. postoji M > 0 takav da je
max Var Xk M.
kN

Tada za svaki > 0 vrijedi



lim P


1
|Sn ESn | = 0.
n

Dokaz. U dokazu koristimo ebievljevu nejednakost, tj. za svaku je sluajnu varijablu Y koja ima varijancu i za svaki > 0
P {|Y EY | }

Var Y
.
2

Sn
. Zbog nezavisnosti je
n
1
Var Yn = 2 Var Sn
n

Neka je n dan prirodan broj i Yn =

165

Sluajni vektor
pa vrijedi:

P


1
|Sn ESn | = P {|Yn EYn | }
n
M
Var Sn
2.

n2
n

Dakle, slijedi da je



1
M
|Sn ESn | 2 .
n
n

0P
Stoga je


lim P


1
|Sn ESn | = 0.
n

Primjer 3.31. Neka je (Xn , n N) niz nezavisnih sluajnih varijabli ije su distribucije zadane
tablicama

2n
0
2n
Xn = 1
1
1 , n N.
1 2n 2n+1
22n+1
2
2
Da bismo provjerili zadovoljava li taj niz slabi zakon velikih brojeva, izraunajmo oekivanja i
n
P
varijance sluajnih varijabli Xn i Sn =
Xi :
i=1

1
1
+ 2n 2n+1 = 0, n N,
22n+1
2
1
1
= EXn2 = 22n 2n+1 + 22n 2n+1 = 1, n N,
2
2
!
n
n
X
X
EXi = 0, n N,
= E
Xi =

EXn = 2n
Var Xn
ESn

Var Sn = Var

i=1
n
X
i=1

!
Xi

i=1
n
X

i=1

VarXi =

n
X

1 = n.

i=1

Budui da je (Xn , n N) niz nezavisnih sluajnih varijabli ije su varijance jednake jedan, slijedi
da niz (Xn , n N) zadovoljava slabi zakon velikih brojeva 3.9, tj. da je za svaki > 0


1
lim P
|Sn | = 0.
n
n
Rijeima reeno, za svaki se > 0 vjerojatnost odstupanja prosjeka niza nezavisnih sluajnih
varijabli iz primjera 3.31 od nule za ili vie moe uiniti proizvoljno malom odabirom dovoljno
velikog prirodnog broja n.

Slabi zakon velikih brojeva specijalno vrijedi i za niz nezavisnih i jednako distribuiranih sluajnih varijabli koje imaju varijancu, a koji je opisan sljedeom definicijom.
Definicija 3.8. Kaemo da je niz sluanih varijabli (Xn , n N) niz nezavisnih i
jednako distribuiranih sluajnih varijabli ako vrijedi:

166

Neki rezultati o nizovima sluajnih varijabli


sve sluajne varijable X1 , X2 , . . . imaju istu distribuciju i
za sve su n N sluajne varijable X1 , . . . , Xn nezavisne.

Za takav niz koristimo kraticu "n. j. d. niz".


Pretpostavimo da je (Xn , n N) n. j. d. niz i neka je varijanca Var X1 = 2 ,
a EX1 = . Uoimo da svaka sluajna vrijabla iz tog niza ima isto oekivanje i
varijancu kao X1 zbog jednake distribuiranosti.
Neka je X n aritmetika sredina (prosjek) sluajnih varijabli X1 , . . . Xn , tj.
n

Xn =

1X
Xi ,
n i=1


i X n , n N pripadni niz aritmetikih sredina. Koristei svojstva oekivanja i
varijance vidimo da vrijedi:
!
n
n
1X
1X
EX n = E
Xi =
EXi = ,
n i=1
n i=1
Var X n =

n
1 X
2
Var
X
=
.
i
n2 i=1
n

Osim toga,
1
Sn
n
pa se na taj niz aritmetikih sredina moe primijeniti slabi zakon velikih brojeva,
tj. za svaki je > 0
lim P {|X n | } = 0.
Xn =

Taj rezultat moemo tumaiti na sljedei nain:


Vjerojatnost da se aritmetika sredina n. j. d. niza sluajnih varijabli
razlikuje od njihovog oekivanja za ili vie moemo uiniti proizvoljno
malom birajui n dovoljno veliko.
Primjer 3.32. Neka je (Xn , n N) niz nezavisnih standardnih normalnih sluajnih varijabli, tj.
Xn N (0, 1),

n N.

Sada znamo da je za svaki prirodan broj n EXn = 0 i Var Xn = 1, pa stoga taj niz sluajnih
varijabli zadovoljava slabi zakon velikih brojeva, tj. za svaki je > 0



lim P X n = 0.
n

Rijeima reeno, za svaki se > 0 vjerojatnost da aritmetika sredina niza nezavisnih standardnih
normalnih sluajnih varijabli odstupa od nule za barem moe uiniti proizvoljno malom odabirom
dovoljno velikog prirodnog broja n.

167

Sluajni vektor

Budui da je za jednako distribuirane sluajne varijable X1 , . . . , Xn Var X n = 2 /n, iz ebievljeve nejednakosti slijedi da je
2
P {|X n | } 2 .
n
Uzmimo npr. = 0.01. Ako elimo postii vjerojatnost manju od 0.05 da se aritmetika sredina
niza (Xn , n N) razlikuje od oekivanja = 0.01 ili vie, tada n ocjenjujemo na sljedei nain:
n

2


= 200000.
2 P X n

Statistika definicija vjerojatnosti


Koritenjem slabog zakona velikih brojeva primijenjenog na n. j. d. niz Bernoullijevih sluajnih varijabli moemo se uvjeriti da je opravdan statistiki pristup
modeliranju vjerojatnosti, pod pretpostavkom da modeliramo vjerojatnost pojavljivanja dogaaja na temalju nezavisnih ponavljanja istog pokusa (poglavlje 1.3).
Taj problem opisat emo koristei tzv. Bernoullijevu shemu.
Bernoullijeva shema jest sluajni pokus koji se sastoji od n meusobno nezavisnih
ponavljanja uvijek istog Bernoullijevog pokusa opisanog distribucijom
!
0 1
X=
, 0 p 1.
1p p
Dakle, (X1 , . . . Xn ) je n. j. d. vektor s distribucijom svake komponente jednakom
distribuciji od X.
Primjer 3.33. Model Bernoullijeve sheme moe se primijeniti kod nezavisnog bacanja istog novia n puta zaredom, pri emu je p vjerojatnost da se okrene npr. glava.

Skup je svih moguih realizacija tog sluajnog vektora


R(X1 , . . . , Xn ) = {(x1 , . . . , xn ) : xi {0, 1}},
a distribucija je zadana s
p(x1 , . . . , xn ) = P {X1 = x1 , . . . , Xn = xn }
n
Y
=
pxi (1 p)1xi , (x1 , . . . , xn ) R(X1 , . . . , Xn ).
i=1

Tako je, npr.


p(1, 1, 1, 0, 0, 0, . . . , 0) = p3 (1 p)n3 ,
p(0, 1, 1, 0, 0, 0, . . . , 0) = p2 (1 p)n2 .

168

Neki rezultati o nizovima sluajnih varijabli

U statistikoj definiciji vjerojatnosti koristili smo upravo takav model, tj. isti pokus
(, F, P ) ponavljali smo n puta nezavisno i definirali vjerojatnost dogaaja A F
kao broj oko kojega se gomilaju relativne frekvencije dogaaja A s poveavanjem
broja ponavljanja pokusa, tj.
fA
,
n

P (A)

gdje je fA frekvencija dogaaja A.


Neka je X sluajna varijabla u tom pokusu definirana na sljedei nain:
(
1,A
.
X() =
0,
/A
Tada je
X=

0 1
1p p

!
,

0 p 1,

gdje je p = P {X = 1} vjerojatnost da se dogodio dogaaj A.


Nezavisnim ponavljanjem naeg pokusa nastaje n. j. d. niz (X1 , . . . , Xn ) Bernoullijevih sluajnih varijabli na koji moemo primijeniti slabi zakon velikih brojeva.
Pri tome je:
EX = EXi = p, i {1, . . . n},
fA = X1 + X2 + . . . + Xn =

n
X

Xi ,

i=1
n

Xn =

fA
1X
Xi =
,
n i=1
n

pa je



fA


lim P
p = 0
n
n
za sve > 0, to opravdava statistiki pristup modeliranju vjerojatnosti pod navedenim uvjetima.
Primjer 3.34. Isti model moe se primijeniti i kod nezavisnog bacanja jedne pravilno izraene
igrae kockice n puta zaredom. Oznaimo sa 1 realizaciju dogaaja "okrenula se estica", a s 0
realizaciju dogaaja "nije se okrenula estica". Ishod svakog od n bacanja te kockice modeliramo
Bernoullijevom sluajnom varijablom
!
0 1
X=
,
5/6 1/6
iju distribuciju moemo, osim gornjom tablicom, zapisati i na sljedei nain:
R(X) = {0, 1},

169

Sluajni vektor

 x  1x
5
1
51x
, x R(X).
=
6
6
6
Dakle, X je Bernoullijeva sluajna varijabla s parametrom p = 1/6.
Ishode n nezavisnih bacanja te kockice, pri emu nas zanimaju dogaaji "okrenula se estica" (1)
i "nije se okrenula estica" (0), modelirat emo nezavisnim sluajnim varijablama X1 , . . . , Xn
koje su jednako distribuirane kao sluajna varijabla X, tj. n-dimenzionalnim sluajnim vektorom
(X1 , . . . , Xn ). Zbog nezavisnosti i jednake distribuiranosti sluajnih varijabli X1 , . . . , Xn , slijedi
da je distribucija sluajnog vektora (X1 , . . . , Xn ) dana izrazom
P {X = x} =

P {X1 = x1 , . . . , Xn = xn } =

n
Y
51xi
,
6
i=1

xi R(Xi ),

i {1, . . . , n}.

Tako je, primjerice, vjerojatnost da se u n nezavisnih bacanja jedne pravilno izraene igrae
kockice svaki put (tj. svih n puta) okrene estica
P {X1 = 1, . . . , Xn = 1} =

3.5.2

1
.
6n

Centralni granini teorem

Centralni granini teoremi govore o uvjetima pod kojima niz funkcija distribucije standardiziranih suma sluajnih varijabli konvergira prema funkciji distribucije
standardne normalne sluajne varijable.
Definicija 3.9. Neka je (Xn , n N) niz sluajnih varijabli s pripadnim nizom
funkcija distribucije (Fn , n N). Ako postoji funkcija distribucije F takva da
Fn (x) F (x) za svaki x u kojemu je F neprekidna, tada kaemo da niz (Xn , n N)
konvergira po distribuciji prema sluajnoj varijabli X ija je funkcija distribucije F
i piemo:
D
Xn X.
Konvergencija po distribuciji zapravo znai da, za dovoljno velike n, P {Xn x}
moemo aproksimirati s F (x).
Primjer 3.35. Neka je (Xn , n N) niz nezavisnih sluajnih varijabli uniformno distribuiranih
na intervalu h0, ai, a > 0, tj. za svaki i N jest

0 , x h, 0i
FXi (x) = x/a , x [0, ai
.

1 , x [a, i
Ako je Yn = max {X1 , . . . , Xn }, tada je zbog nezavisnosti i jednake distribuiranosti sluajnih
varijabli iz niza (Xn , n N) niz (Yn , n N) niz sluajnih varijabli s funkcijama distribucije
FYn (y) = P {Yn y} = P {max {X1 , . . . , Xn } y} = P {X1 y, . . . , Xn y} =
n
= P {X1 y} . . . P {Xn y} = FX1 (y) .
Definirajmo sada novi niz sluajnih varijabli (Zn , n N), gdje je
Zn = n(a Yn ),

a > 0.

170

Neki rezultati o nizovima sluajnih varijabli

Budui da za svaki n N znamo funkciju distribucije sluajne varijable Yn , slijedi da je funkcija


distribucije sluajne varijable Zn dana izrazom
n
zo
FZn (z) = P {Zn z} = P {n(a Yn ) z} = 1 P Yn < a
=
n

0
, z h, 0i


z n
= 1 1 an
, z [0, ani .

1
, z [an, i
Budui da je


z
z n 
lim 1 1
= 1 e a , z 0,
n
an
slijedi da je
(
0
, z h, 0i
lim FZn (z) =
.
z
n
1 e a , z [0, i
Dakle, niz sluajnih varijabli (Zn , n N) po distribuciji konvergira prema eksponencijalnoj sluajnoj varijabli s parametrom 1/a.
Primjer 3.36. Neka je (Xn , n N) niz sluajnih varijabli s funkcijama distribucija

0 , x h, 0i
FXn (x) = xn , x [0, 1i
.

1 , x [1, i
Budui da je za x [0, 1i
lim xn = 0,

slijedi da je
(
lim FXn (x) =

0 , x h, 1i
,
1 , x [1, i

tj. niz sluajnih varijabli (Xn , n N) konvergira po distribuciji prema degeneriranoj sluajnoj
varijabli X za koju je P {X = 1} = 1. Kaemo da niz sluajnih varijabli (Xn , n N) konvergira
po distribuciji prema jedinici.

Sljedei teorem govori o konvergenciji po distribuciji niza standardiziranih parcijalnih suma niza nezavisnih jednako distribuiranih sluajnih varijabli prema standardnoj normalnoj sluajnoj varijabli.
Teorem 3.10 (Lvy). Neka je (Xn , n N) n. j. d. niz sluajnih varijabli s
oekivanjem i varijancom 2 i neka je Sn njegova n-ta parcijalna suma. Tada8
Sn ESn D

Z N (0, 1).
Var Sn
Primjer 3.37. Iznimno, ako je n. j. d. niz (Xn , n N) niz Bernoullijevih sluajnih varijabli
!
0 1
X1 =
, p h0, 1i,
1p p
(vidi Bernoullijenu shemu), tada je Sn B(n, p), ESn = np, Var Sn = np(1 p), pa moemo
zakljuiti da
Sn ESn
Sn np
D

Z N (0, 1).
= p
Var Sn
np(1 p)
8 Za

dokaz pogledati [26].

171

Sluajni vektor

Dakle, za velike se n vjerojatnosti po binomnoj distribuciji mogu priblino raunati koristei normalnu distribuciju.
Primjer 3.38. Neka je X B(500, 0.4). Tada znamo da je
P {X 175} =

175 
X
500 i 500i
0.4 0.6
.
i
i=0

Budui da je izraunavanje te sume komplicirano, a n velik, za izraun vjerojatnosti P {X 175}


moemo koristiti aproksimaciju binomne distribucije normalnom distribucijom. Uoimo da je
p
np = 200 i np(1 p) = 10.95, pa slijedi da je




X 200
175 200
X 200
P {X 175} = P

=P
2.28 P {Z 2.28},
10.95
10.95
10.95
gdje je Z standardna normalna sluajna varijabla. Prethodnu vjerojatnost moemo izraunati
koritenjem prikladnog matematikog softvera:
P {X 175} 0.0113.
Analognim postupkom moemo aproksimirati i mnoge druge vjerojatnosti - tako je, npr. P {175 <
X 225} 0.98.

Primjena na aritmetiku sredinu


Neka je (Xn , n N) n. j. d. niz sluajnih varijabli s oekivanjm i varijancom 2
i
n
1X
Xi .
Xn =
n i=1
S obzirom da je
Xn =

1
2
Sn , EX n = , Var X n =
,
n
n

oito je
Xn
Sn ESn

= n
.

Var Sn
Dakle, prema centralnom graninom teoremu 3.5.2 slijedi da
Xn D
n
Z N (0, 1),

pa kaemo da se n X n asimptotski ponaa kao sluajna varijabla s distribucijom


2
N (0, 1), odnosno da X n asimptotski ima N (, n ) distribuciju.
Primjer 3.39. Neka je (Xn , n N) niz nezavisnih eksponencijalnih sluajnih varijabli s parametrom = 1. Tada iz tablice 2.6.5 znamo da je = EXn = 1/ = 1 i 2 = VarXn = 1/2 = 1
za svaki n N. Prema teoremu 3.5.2 slijedi da za veliki n sluajna varijabla
Xn
Sn n
= n

172

Sluajni vektor

ima priblino standardnu normalnu distribuciju (Z N (0, 1)). Sada moemo aproksimirati npr.
sljedee vjerojatnosti:

P {S100 110} = P


Z
z2
S100 100
1
1 P {Z 1} =
e 2 dz 0.1587,
10
2
1


P {1.1 < X 100 < 1.2} = P 1 < 10(X 100 1) < 2
1
P {1 < Z < 2} =
2

Z2

z2
2

dz 0.136.

Primjer 3.40. Neka je (Xn , n N) niz nezavisnih jednako distribuiranih sluajnih varijabli
s oekivanjem = EXn = 20 i varijancom 2 = VarXn = 4. Pretpostavimo da nas zanima
kolika je vjerojatnost da se aritmetika sredina X n sluajnih varijabli X1 , . . . Xn realizira brojem
iz intervala h19.9, 20.1i. Budui da distribucija sluajnih varijabli iz tog niza nije zadana, traenu
vjerojatnost ne moemo tono izraunati. No taj niz zadovoljava uvjete teorema 3.5.2 pa znamo
da
Xn
X n 20 D
n
=
Z N (0, 1).
2

n
Traenu vjerojatnost moemo aproksimirati na sljedei nain:
(
)
n
X n 20
n
P {19.9 < X n < 20.1} = P
<
<

2
20
20
n


1
n
n
P
<Z<
=
20
20
2

3.6

Zn/20

ez

/2

dz.

n/20

Zadaci

Zadatak 3.4. Dokaite svojstva 1 do 5 funkcije distribucije dvodimenzionalnog sluajnog vektora.

Zadatak 3.5. Dokaite da za sluajne varijable X1 i X2 koje imaju konnu varijancu i koje su
nezavisne vrijedi jednakost
Var (aX1 + bX2 c) = a2 Var X1 + b2 Var X2 ,
gdje su a, b i c proizvoljni realni brojevi.

Zadatak 3.6. Neka je (X, Y ) sluajni vektor s kovarijancom Cov(X, Y ). Dokaite da za proizvoljne realne brojeve a1 , a2 , b1 , b2 vrijedi
Cov(a1 X + b1 , a2 Y + b2 ) = a1 a2 Cov(X, Y ).

173

Zadaci

Zadatak 3.7. Neka je X sluajna varijabla takva da je EX = 6, Var (X) = 1 i neka je Y =


2X + 5. Odredite EY , Var Y i X,Y .
Rjeenje: EY = 7, Var Y = 4, X,Y = 109/2.

Zadatak 3.8. Neka su X i Y sluajne varijable za koje je EX = 2, EY = 1, Var X = 9,


Var Y = 4, X,Y =
je Z = 2XY + 1. Odredite
EZ.
 0.5. Neka


Rjeenje: EZ = 2 (X, Y ) Var X Var Y + EX EY + 1 = 3.

Zadatak 3.9. Neka su X1 i X2 sluajne varijable s binomnim razdiobama: X1 B(n1 , p1 ) i


X2 B(n2 , p2 ). Odredite E (X1 X2 ) ako znamo da je E (X1 + X2 )2 = 0.5.
Rjeenje: E (X1 X2 ) = 41 12 (n1 p1 (1 + p1 (n1 1)) + n2 p2 (1 + p2 (n2 1))).

Zadatak 3.10. Dvodimenzionalan sluajni vektor (X, Y ) ima distribuciju danu tablicom
X/Y
1
2
3

-2
1/3
2/15
1/30

-1
0
2/15
1/30

0
1/15
0
1/15

1
0
1/30
1/15

2
1/10
0
0

a) Odredite marginalne distribucije.


Rjeenje:
2 1 0
1
2
1/2 1/6 2/15 1/10 1/10
!
1
2
3
1/2 3/10 1/5

hspace*1cm X =
Y =

!
,

b) Odredite P {X < 2, Y 2} i P {X > 1, Y > 3}.


Rjeenje: P {X < 2, Y 2} = 1/2, P {X > 1, Y > 3} = 0.
c) Odredite P {|X| < 1}.
Rjeenje: P {|X| < 1} = P {X = 0} = 2/15.
d) Odredite EX, EY i E(3X + 5Y ).
Rjeenje: EX = 13/15, EY = 17/10, E(3X + 5Y ) = 59/10.

Zadatak 3.11. Neka je X = (X, Y ) diskretan sluajni vektor s distribucijom zadanom na sljedei
nain:
(
c(x + y) , (x, y) {0, 1, 2} {0, 1, 2}
P (X = x, Y = y) =
.
0
,
inae
Izraunajte vrijednost konstante c.
Rjeenje: c = 1/18.

174

Sluajni vektor

Zadatak 3.12. Za sluajni vektor iz zadatka 3.10 odredite distribuciju od X, uz uvjet Y = 3, i


distribuciju od Y , uz uvjet X = 2, te izraunajte uvjetna oekivanja E(X|Y = 3) i E(Y |X = 2).
Rjeenje:
!
1
2 1 0 1
,
E(X|Y = 3) = ;
X|Y =3 =
1/6 1/6 1/3 1/3
6
!
21
1
2
3
,
E(Y |X = 2) =
Y |X=2 =
.
2/3 1/15 1/15
15

Zadatak 3.13. Provjerite jesu li komponente sluajnog vektora iz zadatka 3.10 nezavisne te
izraunajte njihovu kovarijancu i koeficijent korelacije.
Rjeenje: sluajne varijable X i Y nisu nezavisne,
Cov(X, Y ) =

208
,
75

X,Y =

416
26291

Zadatak 3.14. Dan je dvodimenzionalan sluajni vektor (X, Y ) tablicom distribucije


X/Y
0
1
2

-2
0.05
0.1
0.03

-1
0.05
0.05
0.12

0
0.1
0.05
0.07

1
0
0.1
0.06

2
0.05
0
0.03

3
0.05
0.05
0.04

a) Odredite marginalne distribucije tog sluajnog vektora.


Rjeenje:
!
2 1 0
1
2
3
X=
,
0.18 0.22 0.22 0.16 0.08 0.14
!
0
1
2
Y =
.
0.3 0.35 0.35
b) Odredite EX, EY , Var X i Var Y .
Rjeenje: EX = 0.16, EY = 1.05, Var X 2.65, Var Y 0.65.
c) Provjerite jesu li komponente tog sluajnog vektora nezavisne.
Rjeenje: sluajne varijable X i Y nisu nezavisne.

Zadatak 3.15. Sluajni pokus sastoji se od dvaju uzastopnih bacanja pravilno izraenog novia.
Neka je (X, Y ) sluajni vektor gdje sluajna varijabla X oznaava broj glava, a sluajna varijabla
Y broj pisama koja se realiziraju u tim dvama bacanjima. Odredite distribuciju i marginalne
distribucije sluajnog vektora (X, Y ), uvjetnu distribuciju sluajne varijable X, uz uvjet {Y = 1}.
te izraunajte koeficijent korelacije X,Y .
Rjeenje:
Tablica distribucije:
X/Y
0
1
2

0
0
0

1
0

1
4

1
2

0
0

1
4

175

Zadaci
Marginalne distribucije:
0 1 2

X=

1 1 1
4 2 4

0 1 2

Y =

1 1 1
4 2 4

Uvjetna distribucija: P {X = 1|Y = 1} = 1.


Koeficijent korelacije: X,Y = 1.
Zadatak 3.16. Neka je (X, Y ) sluajni vektor kod kojeg sluajna varijabla X predstavlja broj
izlazaka trgovakog putnika na teren, a sluajna varijabla Y broj prodanih proizvoda. Distribucija
sluajnog vektora zadana je sljedeom tablicom:
Y /X
1
2
3
4

1
32

1
16
1
8
1
16
1
128

1
32
1
16
1
8
1
64

0
0
0

3
0

4
0

1
32
1
8
1
32

1
32
1
8
1
32

5
0
0
1
16
1
32

a) Odredite marginalne distribucije tog sluajnog vektora.


Rjeenje:
!
0 1 2 3 4 5 6
;
Y =
X=
33 15 3
3
3
1
1
32 128 64 16 16 32 128

6
0
0
0
1
128

1 2 3 4
1 1 1 1
8 4 2 8

!
.

b) Izraunajte EX, EY i X,Y .


Rjeenje: EX = 327/128, EY = 21/8, X,Y = 0.579.
c) Odredite vjerojatnost da je trgovaki putnik prodao etiri knjige, ako je dva puta izaao na
teren.
Rjeenje: P {Y = 4|X = 2} = 1/15.

Zadatak 3.17. Promotrimo sluajni pokus koji se sastoji od nezavisnog bacanja dvaju novia tri
puta zaredom (misli se da su realizacije na noviima pri jednom bacanju meusobno nezavisne).
Novi A pravilno je izraen, odnosno PA (G) = PA (P ) = 0.5, ali noi B nije i vrijedi: PB (G) =
0.25, PB (P ) = 0.75. Neka je (X, Y ) sluajni vektor u kojem X predstavlja broj glava realiziranih
bacanjem novia A, a Y broj glava realiziranih bacanjem novia B. Odredite distribuciju i
marginalne distribucije sluajnog vektora (X, Y ), uvjetnu distribuciju sluajne varijable X, uz
uvjet {Y = 2}, te izraunajte koeficijent korelacije X,Y .
Rjeenje: X B(3, 0.5), X B(3, 0.25)
X/Y
0
1
2
3

27
512
81
512
81
512
27
512

27
512
81
512
81
512
27
512

9
512
27
512
27
512
9
512

1
512
3
512
3
512
1
512

Zadatak 3.18. Sluajni vektor (X, Y ) zadan je na sljedei nain:


(
k(2xi + yj ) , xi = 1, 2; yj = 1, 2
P {X = xi , Y = yj } =
.
0
, inae
Odredite vrijednost konstante k, marginalne distribucije sluajnog vektora (X, Y ) te provjerite
jesu li sluajne varijable X i Y nezavisne.

176

Sluajni vektor

Zadatak 3.19. Za sluajni vektor iz prethodnog zadatka odredite sljedee uvjetne vjerojatnosti:
a)

P {Y = yj | X = xi },
P {X = xi | Y = yj },

b)

P {Y = y2 | X = x2 },
P {X = 2 | Y = 2}.

Zadatak 3.20. Funkcija gustoe sluajnog vektora (X, Y ) dana je izrazom


(
1/4 , (x, y) [1, 1] [1, 1]
f (x, y) =
0 ,
inae.
a) Odredite marginalne
( gustoe fX (x) i fY (y).
1/2 , x [1, 1]
D
Rjeenje: fX (x) =
X = Y.
0 ,
inae,
b) Jesu li komponente tog sluajnog vektora nezavisne sluajne varijable?
Rjeenje: X i Y nezavisne su.
c) Odredite P {0 X
Rjeenje: P {0 X

1
,
2
1
,
2

0Y
0Y

1
}.
2
1
}
=
2

1/16.

Zadatak 3.21. Sluajni vektor X = (X, Y ) zadan je funkcijom gustoe


(
k , za x2 + y 2 4 i y > 0
fX (x, y) =
0 , za ostale (x, y) R2 .
a) Odredite vrijednost konstante k.
Rjeenje: k = 1/2.
b) Odredite marginalne funkcije gustoa sluajnog vektora X.
Rjeenje:
(
(

1
4 x2 , x h2, 2i
2
fX (x) =
fY (y) =
0
, inae,

4 y 2 , y [0, 2i
0
, inae,

c) Pokaite da sluajne varijable X i Y nisu nezavisne, ali jesu nekorelirane.

Zadatak 3.22. Funkcija gustoe dvodimenzionalnoga sluajnog vektora (X, Y ) dana je izrazom

1 , x2 + y 2 1
2
b2
f (x, y) =
ab a
0 ,
inae,
a) Odredite marginalne gustoe fX (x) i fY (y).
b) Jesu li komponente tog sluajnog vektora nezavisne sluajne varijable?
c) Odredite kovarijancu sluajnih varijabli X i Y .

Zadaci

177

Zadatak 3.23. Sluajni vektor (X, Y ) zadan je funkcijom gustoe


(
x + y , (x, y) h0, 1i h0, 1i
.
f (x, y) =
0 , inae.
Odredite funkciju distribucije i funkciju gustoe sluajne varijable Z = X + Y.
Rjeenje:

0 , z h, 0i
z , z h0, 1i
.
FZ (z) = z 2 /2 , z [0, 1i
fZ (z) =

0 , inae.

1 , z [1, i.

Zadatak 3.24. Neka je X sluajna varijabla kojom je modelirana koncentracija peludi u zraku
u jutarnjem mjerenju, a Y sluajna varijabla kojom je modelirana koncentracija peludi u zraku
u veernjem mjerenju. Pretpostavimo da je zajednika funkcija gustoe sluajnih varijabli X i Y
(tj. funkcija gustoe sluajnog vektora X = (X, Y )) definirana na sljedei nain:
(
4xy , (x, y) h0, 1i h0, 1i
fX (x, y) =
0 ,
inae.
a) Odredite funkciju distribucije sluajnog vektora X.
Rjeenje:

1 , (x, y) [1, i [1, i

x2 , (x, y) h0, 1i [1, i

FX (x, y) =
y 2 , (x, y) [1, i h0, 1i

x2 y 2 , (x, y) h0, 1i h0, 1i

0 ,
inae.
b) Odredite marginalne funkcije
( gustoa sluajnog vektora X.
2x , x h0, 1i
D
Rjeenje: X = Y , fX (x) =
0 , inae.
c) Odredite vjerojatnost da je prosjena koncentracija peludi u zraku (temeljena samo na
jutarnjem i veernjem mjerenju) manja od 0.5.
Rjeenje: P {(X + Y )/2 < 0.5} = 1/6.

Zadatak 3.25. Posjed na potpuno ravnom terenu ima oblik pravokutnog trokuta s junom granicom duljine dva kilometra i istonom granicom duljine jedan kilometar. Koordinate toke na
koju pada sjemenka javora noena vjetrom modelirane su sluajnim vektorom X = (X, Y ). Poznato je da ako sjemenka padne unutar posjeda, sluajni vektor X ima uniformnu distribuciju nad
posjedom.
a) Odredite funkciju gustoe sluajnog vektora X te njegove marginalne funkcije gustoa. Jesu
li sluajne varijable X i Y nezavisne ili ne? Obrazloite svoj odgovor.
Rjeenje:
(
1 , (x, y) {(x, y) h0, 2i h0, 1i : y < 0.5x}
fX (x, y) =
0 ,
inae.
(
(
x/2 , x h0, 2i
2(1 y) , x h0, 1i
fX (x) =
fY (y) =
0 , inae,
0
, inae.
Sluajne varijable X i Y nisu nezavisne.

178

Sluajni vektor

b) Odredite uvjetne funkcije gustoa fX|Y =y (x) i fY |X=x (y) sluajnog vektora (X, Y ).
Rjeenje:
(
(
2/x , y h0, x/2i
1/2(1 y) , x h2y, 2i
fY |X=x (y) =
fX|Y =y (x) =
0 ,
inae.
0
,
inae,
c) Odredite vjerojatnost P {0.1 < Y 0.7|X = 0.5}.
Rjeenje: P {0.1 < Y 0.7|X = 0.5} = 0.6.

Zadatak 3.26. Neprekidan sluajni vektor X = (X, Y ) zadan je funkcijom gustoe


(
cos x sin y , (x, y) [0, /2] [/2, 0]
fX (x, y) =
0
, inae.
a) Odredite funkciju distribucije sluajnog vektora X.
Rjeenje:

1
, (x, y) h/2, i h0, i

sin (x) cos (y) , (x, y) [0, /2] [/2, 0]


FX (x, y) =
cos (y)
, (x, y) h/2, i [/2, 0]

sin
(x)
,
(x, y) [0, /2] h0, i

0
,
inae.
b) Odredite marginalne funkcije distribucija sluajnog vektora X.
Rjeenje:
(
(
cos (x) , x [0, /2]
sin (y) , x [/2, 0]
fX (x) =
fY (y) =
0
,
inae,
0
,
inae.
c) Ispitajte nezavisnost sluajnih varijabli X i Y te odredite korelacijsku matricu sluajnog
vektora X.
Rjeenje: X i Y nezavisne su sluajne varijable; korelacijska matrica jest jedinina matrica
drugog reda.
d) Odredite uvjetne funkcije gustoa i uvjetne funkcije distribucija sluajnog vektora X.
Rjeenje: fX|Y =y (x) = fX (x), fY |X=x (y) = fY (y).

Zadatak 3.27. Funkcija distribucije sluajnog vektora X = (X, Y ) jest


(
1 ex ey + e(x+y) , (x, y) h0, i h0, i
FX (x, y) =
0
, za ostale (x, y) R2 .
a) Odredite marginalne funkcije distribucija toga sluajnog vektora te provjerite jesu li njegove
komponente nezavisne sluajne varijable.
Rjeenje: X, Y E(1).
b) Odredite funkciju gustoe
i marginalne funkcije gustoa sluajnog vektora X.
(
e(x+y) , (x, y) h0, i h0, i
Rjeenje: f (x, y) =
0
, inae.
c) Odredite uvjetne funkcije gustoa fX|Y =y (x) i fY |X=x (y).
Rjeenje: zbog nezavisnosti je sluajnih varijabli X i Y fX|Y =y (x) = fX (x), fY |X=x (y) =
fY (y).

179

Zadaci
d) izraunajte P {0 < X 1, 0 < Y 1}.
Rjeenje: P {0 < X 1, 0 < Y 1} = 1

2
e

1
.
e2

Zadatak 3.28. Zadana je funkcija gustoe dvodimenzionalnog sluajnog vektora (X, Y ):


(
e(x+y) , (x, y) h0, i h0, i
f (x, y) =
0
, inae.
a) Jesu li komponente toga sluajnog vektora nezavisne sluajne varijable?
Rjeenje: X i Y nezavisne su eksponencijalne sluajne varijable s parametrom = 1.
b) Odredite distribuciju sluajnog vektora (X, 2Y ).
Rjeenje: Y je eksponencijalna sluajna varijabla s parametrom = 1/2, pa zbog nezavisnosti X i 2Y slijedi da je
(
y)
1 (x+ 1
2
e
, (x, y) h0, i h0, i
2
f(X,2Y ) (x, y) =
0
, inae.

Zadatak 3.29. Neka je X = (X, Y )

fX (x, y) =

neprekidan sluajni vektor zadan funkcijom gustoe


1
(6 x y) , (x, y) h0, 2i h2, 4i
8
0
, za ostale (x, y) R2 .

a) Ispitajte nezavisnost komponenti X i Y toga sluajnog vektora.


b) Odredite uvjetne funkcije gustoa fX|Y =y (x) i fY |X=x (y).
c) Odredite matricu kovarijanci i korelacijsku matricu toga sluajnog vektora.

Zadatak 3.30. Provjerite vrijedi li slabi zakon velikih brojeva za sljedee nizove nezavisnih sluajnih varijabli (Xn , n N):


n
0
n
a) Xn = 1
2 1 , n N,
1
n
n n

n
n
3
3

b) Xn =
1
1 , n N.
2
2
Rjeenje: slabi zakon velikih brojeva vrijedi za oba niza sluajnih varijabli.

Zadatak 3.31. Neka su X1 , . . . , X100 nezavisne eksponencijalne sluajne varijable s parametrom


= 1 te neka je
100
X
Y = X1 + . . . + X100 =
Xk .
k=1

Koritenjem centralnoga graninog teorema aproksimirajte sljedee vjerojatnosti:


a) P {Y 110},
b) P {1.1 < X 100 < 1.2}, gdje je X 100 =

1
100

Y.

180

Sluajni vektor

Rjeenje:
a) P {Y 110} 0.1587,
b) P {1.1 < X 100 < 1.2} 0.136.

Zadatak 3.32. Zadane su nezavisne jednako distribuirane sluajne varijable X1 , . . . , Xn s matematikim oekivanjem i varijancom 2 . Izraunajte
!
n
1X
2
E
(Xi X n )
.
n i=1

Poglavlje 4

Statistika
Koritenje je rijei statistika u svakodnevnom ivotu najee povezano s brojanim vrijednostima kojima pokuavamo opisati bitne karakteristike nekog skupa
podataka.
Statistika, kao znanstvena disciplina, bavi se razvojem metoda prikupljanja, opisivanja i analiziranja podataka te primjenom tih metoda u procesu donoenja zakljuaka
na temelju prikupljenih podataka.
Statistiko istraivanje fokusirano je na skup objekata, tj. jedinki (ljudi, ivotinja,
biljaka, stvari, drava, gradova, poduzea itd.) i skup odabranih veliina koje se na
njima promatraju. Veliine koje se na jedinkama promatraju zovemo varijablama.
Sve jedinke koje se ele obuhvatiti istraivanjem, tj. o kojima se eli zakljuivati,
ine populaciju. Podaci se prikupljaju da bi se zakljuivalo o varijablama na
populaciji.
Prije provoenja istraivanja populacija mora biti precizno opisana. Na primjer, ako
je varijabla od interesa broj rijei koji je osoba u stanju proitati u minuti, onda
valja precizirati ine li populaciju djeca predkolskog uzrasta u Hrvatskoj ili djeca
prvog razreda osnovne kole u Hrvatskoj ili djeca prvog razreda neke specifine kole
u Hrvatskoj (npr. O.. Tin Ujevi u Osijeku) ili djeca prvog razreda osnovne kole
u Hrvatskoj koja idu po posebnom programu itd. U svakom sluaju, populacija
mora biti precizirana.
Iz definirane populacije uzima se u statistiko istraivanje uzorak. Podaci moraju
biti prikupljeni na uzorku koji je reprezentativan za opisanu populaciju. Reprezentativan uzorak mora odraavati populaciju tj. u njemu trebaju biti zastupljene
181

182

Deskriptivna statistika

sve tipine karakteristike populacije. Najei je nain odabira jedinki iz populacije


u reprezentativan uzorak tzv. sluajni uzorak, tj. takav izbor u kojemu svaka
jedinka ima jednaku ansu biti izabrana u uzorak.
Izbor jedinki u reprezentativan uzorak iz populacije moe se postii pomou generatora sluajnih brojeva. Da bi ilustrirali tu proceduru, oznaimo s M broj jedinki
u populaciji i numerirajmo jedinke brojevima od 1 do M . Neka je n broj jedinki
koje elimo uzeti u uzorak. Potrebno je generirati n meusobno razliitih realizacija
diskretne uniformne sluajne varijable na skupu {1, . . . , M } i uzeti u uzorak jedinke
koje za oznaku imaju dobivene prirodne brojeve. Treba naglasiti da tu proceduru
nije uvijek jednostavno provesti u primjeni.
Zadatak 4.1. U studentskoj referadi pribavite popis studenata koji sluaju UVIS ove godine.
Numerirajte studente i provedite proceduru izbora 40 studenata u sluajni uzorak. Od svakog
studenta odabranog u uzorak prikupite podatke o spolu, broju do sada poloenih ispita, broju do
sada ostvarenih ECTS bodova, prosjenoj ocjeni svih do sada poloenih ispita, ocjeni iz predmeta
Diferencijalni raun i Integralni raun. Formirajte bazu podataka u nekom programskom paketu.

U okviru statistike teorije valja se pozabaviti sljedeim metodama:


metodama prikupljanja podataka,
metodama opisivanja skupa podataka (deskriptivna statistika),
metodama statistikog zakljuivanja.
Metode prikupljanja podataka ovdje neemo posebno prouavati. Ipak, valja napomenuti da se podaci mogu prikupiti npr. na osnovu javnih izvora (knjige, asopisi,
novine, web), dizajniranog eksperimenta, anketa, promatranjem itd.

4.1

Deskriptivna statistika

U statistikim istraivanjima razlikujemo nekoliko osnovnih tipova varijabli koje se


meusobno razlikuju po svojstvima vrijednosti koje mogu poprimiti.
Kvalitativne varijable
Karakteristika je kvalitativnih varijabli da njihove vrijednosti nisu, po svojim svojstvima koritenim u istraivanju, realni brojevi. Tipian je primjer takve varijable
spol osobe. Vrijednosti kvalitativne varijable uobiajeno nazivamo kategorijama.
Kategorije kvalitativnih varijabli mogu biti definirane u skladu s potrebama statistikog istraivanja.

Statistika

183

Primjer 4.1. Sljedee su varijable kvalitativnog tipa:


- radna mjesta u koli (spremaica, domar, tajnik, nastavnik, pedagog, ravnatelj),
- boja oiju (plava, smea, zelena),
- krvne grupe (A, B, AB, 0),
- spol (m ili ).

Numerike varijable
Numerike varijable prirodno primaju vrijednosti iz skupa realnih brojeva. Tipini su primjeri numerikih varijabli masa i visina osobe. Meutim, treba naglasiti
da se i kategorije kvalitativnih varijabli mogu izraavati brojevima to ih ne ini
numerikim varijablama. Primjerice, spol osobe jedna je kvalitativna varijabla.
Kategoriju "enski spol" moemo oznaiti s "1", a kategoriju "muki spol" s "2",
to moe biti korisno prilikom unoenja podataka u bazu. Time smo kategorijama
kvalitativne varijable pridruili numerike vrijednosti, ali samu varijablu nismo uinili numerikom po njezinim svojstvima.
Primjer 4.2. Sljedee su varijable numerikog tipa:
- postotak prolaznosti na pojedinim ispitima tijekom jedne akademske godine,
- broj bodova na dravnoj maturi iz matematike,
- broj ulovljenih komaraca u klopku,
- temperatura mora,
- koncentracija soli u morskoj vodi.

Meu numerikim varijablama razlikujemo diskretne i kontinuirane varijable.


Diskretne numerike varijable mogu poprimiti samo konano ili prebrojivo mnogo
vrijednosti.
Primjer 4.3. Sljedee su numerike varijable diskretne:
- broj bodova na dravnoj maturi iz matematike,
- broj ulovljenih komaraca u klopku,
- broj dana u godini s temperaturom zraka veom od 35o C.

Skup je moguih vrijednosti kontinuiranih numerikih varijabli cijeli skup realnih


brojeva ili neki interval.
Primjer 4.4. Sljedee su numerike varijable kontinuirane:
- postotak prolaznosti na pojedinim ispitima tijekom jedne akademske godine,
- temperatura mora,
- vodostaj neke rijeke.

184

Deskriptivna statistika

Primjer 4.5. (djelatnici.xls)


Baza podataka djelatnici.xls sadri podatke o uzorcima djelatnika dviju konkurentskih tvornica tvornice A i tvornice B. U tablici s imenom "tvornica A" zabiljeene su vrijednosti sljedeih
varijabli za djelatnike tvornice A:
spol - kvalitativna varijabla koja sadri informaciju o spolu (M - muki spol, Z - enski spol),
odjel - kvalitativna varijabla sadri naziv odjela u kojemu je djelatnik zaposlen (TR - transport,
P- pakiranje, IS - isporuka),
obrazovanje - kvalitativna varijabla koja sadri strunu spremu djelatnika (SSS - srednja struna
sprema, VSS - via struna sprema, VSS - visoka struna sprema),
dob - kontinuirana numerika varijabla koja sadri starost djelatnika u godinama,
visina - kontinuirana numerika varijabla koja sadri visinu djelatnika u centimetrima,
rukovodstvo - diskretna numerika varijabla koja sadri broj godina rada koje je djelatnik proveo
na nekoj od rukovodeih pozicija u toj tvornici,
placa_prije - kontinuirana numerika varijabla koja sadri iznos godinje plae djelatnika prije
reorganizacije poslovnog sustava,
placa_poslije - kontinuirana numerika varijabla koja sadri iznos godinje plae djelatnika nakon
reorganizacije poslovnog sustava.
U tablici s imenom "tvornica B", u varijabli placa_konkurencija, zabiljeeni su iznosi godinje
plae za svakog djelatnika iz uzorka iz tvornice B.

U svrhu prikaza podataka i nekih statistikih analiza, vrijednosti se numerike varijable takoer mogu svrstati u kategorije. Za razliku od kategorija kvalitativnih
varijabli, meu kategorijama se numerike varijable uvijek moe prepoznati prirodan poredak.
Primjer 4.6. (auto-centar.xls)
Svrha je ovog primjera prikazati mogunost kategorizacije numerike varijable. Taj se postupak
najee provodi stvaranjem nove varijable ije su vrijednosti kategorije kojih je (znatno) manje
nego svih moguih vrijednosti odgovarajue numerike varijable. Baza podataka auto-centar.xls
sastoji se od sljedeih varijabli:
automobili - diskretna numerika varijabla koja sadri podatke o broju prodanih automobila u
jednom danu za sto promatranih dana. Budui da broj prodanih automobila u jednom danu
moe biti vrlo mali (npr. samo nekoliko osobnih automobila), ali i vrlo velik (npr. narudbe
automobila za vozni park nekog poduzea), zakljuujemo da diskretna numerika varijabla
automobili moe poprimiti velik broj razliitih vrijednosti iz skupa prirodnih brojeva. Zato je
u nekim situacijama korisno kategorizirati vrijednosti te varijable prema tono odreenom
kriteriju. Na primjer, kategorizacija broja prodanih automobila u jednome danu moe se
napraviti kao to je prikazano varijablom kategorija.
kategorija - kvalitativna varijabla koja podatke iz varijable automobili svrstava u pet kategorija
prema kriteriju prikazanom u tablici 4.1.

185

Statistika
broj prodanih automobila

kategorija

0-9
10 i 11
12 i 13
14 i 15
16 i vie

E
D
C
B
A

Tablica 4.1: Primjer kategorizacije numerike varijable automobili

Ordinalne varijable
Karakteristika je ordinalnih varijabli da su one, po svom karakteru, kvalitativne,
ali meu kategorijama se moe uspostaviti prirodan poredak. Tipian su primjeri
takvih varijabli struna sprema osobe i ocjena u koli.
Primjer 4.7. (matematika.sta)
Baza podataka matematika.sta sadri podatke prikupljene anketiranjem studenata nakon odranih
predavanja, vjebi, kolokvija te usmenog ispita iz jednog matematikog kolegija. Prikupljeni podaci
organizirani su na sljedei nain:
prosjek - varijabla koja sadri podatke o prosjenoj ocjeni studiranja za 49 anketiranih studenata,
polozeno - varijabla koja studente svrstava u dvije kategorije s obzirom na to jesu li poloili ispit
iz promatranog kolegija prema kriteriju prikazanom u tablici 4.2.
poloen/nepoloen ispit
poloen ispit
nepoloen ispit

kategorija
1
0

Tablica 4.2: Kategorizacija studenata prema poloenosti ispita.


predavanja, vjezbe - dvije varijable koje prisutnost studenata na predavanjima/vjebama (p/v)
svrstavaju u tri kategorije na nain prikazan u tablici 4.3.
prisutnost studenta na p/v
student s p/v nije nikada izostao
student je s p/v izostao samo jednom
student je s p/v izostao barem dva puta

kategorija
1
2
3

Tablica 4.3: Kategorizacija studenata prema broju izostanaka s predavanja/vjebi.


tezina kolegija, materijali - dvije varijable koje sadre subjektivne ocjene (u standardnoj skali od
1 do 5) studenata o teini kolegija i dostatnosti dostupnih materijala za pripremanje ispita
iz promatranog kolegija.
Uoimo da se varijabla prosjek moe promatrati kao neprekidna numerika varijabla, varijabla
poloeno jest kvalitativna, dok se varijable predavanja, vjezbe, tezina kolegija i materijali mogu
svrstati u ordinalne varijable.

186

4.1.1

Deskriptivna statistika

Metode opisivanja kvalitativnih varijabli

Vrijednosti kvalitativne varijable jesu kategorije. Mjere kojima opisujemo zastupljenost jedne kategorije u uzorku jesu frekvencija kategorije i relativna frekvencija
kategorije.
Frekvencija kategorije broj je izmjerenih vrijednosti varijable koje pripadaju danoj kategoriji.
Relativna frekvencija kategorije broj je izmjerenih vrijednosti varijable
koje pripadaju danoj kategoriji podijeljen ukupnim brojem izmjerenih
vrijednosti za ispitivanu varijablu.
Pretpostavimo da varijabla moe primiti vrijednosti k razliitih kategorija, a da se u
podacima nalazi n izmjerenih vrijednosti za tu varijablu. Frekvenciju i-te kategorije
oznait emo fi , a relatvnu frekvenciju dobijemo kao
fi
.
n
Relativna frekvencija kategorije mjera je zastupljenosti koja daje informaciju o
udjelu kategorije u uzorku poznate veliine i esto se izraava kao postotak. Frekvencije i relativne frekvencije pojedinih kategorija prikazujemo tablino i grafiki.
Frekvencije i relativne frekvencije kategorija kvalitativnih varijabli grafiki prikazujemo pomou stupastog dijagrama frekvencija i stupastog dijagrama
relativnih frekvencija. U istu svrhu moe se koristiti i kruni dijagram frekvencija i relativnih frekvencija . Popularan je naziv za isti grafiki prikaz "pita".
Primjer 4.8. (djelatnici.xls)
Baza podataka djelatnici.xls opisana je u primjeru 4.5. Promotrimo kvalitativnu varijablu obrazovanje ije su vrijednosti svrstane u tri kategorije: SSS - srednja struna sprema, VSS - via
struna sprema, VSS - visoka struna sprema. Zastupljenost tih kategorija u promatranom uzorku
od 100 djelatnika opisana je tablicom frekvencija i relativnih frekvencija 4.4.
kategorija

frekvencija

relativna frekvencija

SSS
VSS
VSS

51
43
6

51/100 = 0.51
43/100 = 0.43
6/100 = 0.06

Tablica 4.4: Tablica frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje.
Grafiki prikazi relativnih frekvencija dani su u obliku stupastog dijagrama na slici 4.1, a prikazi
frekvencija i relativnih frekvencija u obliku krunog dijagrama na slici 4.2.

187

Statistika

relativne frekvencije

60%
50%
40%
30%
20%
10%
0%

SSS

VSS

VSS

Slika 4.1: Stupasti dijagram relativnih frekvencija svih kategorija varijable obrazovanje.

VSS; 6; 6%

SSS; 51; 51%

VSS; 43; 43%

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Obrazovanje

Slika 4.2: Kruni dijagram frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje.

Primjer 4.9. (djelatnici.xls)


esto se u praksi pokazuje korisnim poznavanje zastupljenosti kategorija jedne varijable za svaku
od kategorija neke druge kvalitativne varijable prouavane na istom uzorku. U ovom emo primjeru tablino i grafiki prikazati frekvencije i relativne frekvencije svih kategorija varijable obrazovanje posebno za ispitanike enskog spola, a posebno za ispitanike mukog spola iz promatranog
uzorka djelatnika.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Tablice tako kategoriziranih frekvencija i relativnih frekvencija varijable obrazovanje prikazane su


u tablici 4.5. Stupasti dijagrami relativnih frekvencija svih kategorija varijable obrazovanje za
kategorije Z i M varijable spol prikazani su na slici 4.3, a kruni dijagrami frekvencija i relativnih
frekvencija na slici 4.4.

188

Deskriptivna statistika
kategorija
SSS
VSS
VSS

frekvencija

spol=Z
relativna frekvencija

frekvencija

spol=M
relativna frekvencija

21
18
2

21/41 = 0.5122
18/41 = 0.4390
2/41 = 0.0488

30
25
4

30/59 = 0.5085
25/59 = 0.4237
4/59 = 0.0678

Tablica 4.5: Tablica frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje

54%
49%
44%
39%
34%
29%
24%
20%
15%
10%
5%
0%

59%
51%
relativne frekvencije

relativne frekvencije

posebno za svaku kategoriju varijable spol.

42%
34%
25%
17%
8%

SSS

VSS

VSS

0%

(a) spol=Z

SSS

VSS

VSS

(b) spol=M

Slika 4.3: Stupasti dijagrami relativnih frekvencija svih kategorija varijable obrazovanje posebno
za svaku kategoriju varijable spol.

VSS;4;7%

VSS;2;5%

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

SSS;21;51%

VSS;18;44%

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

SSS;30;51%

VSS;25;42%

obrazovanje

obrazovanje

(a) spol=Z

(b) spol=M

Slika 4.4: Kruni dijagram frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje
posebno za svaku kategoriju varijable spol.

189

Statistika

4.1.2

Metode opisivanja numerikih varijabli

Numerike varijable po svojoj prirodi mogu biti diskretne i neprekidne. U oba


sluaja, a posebno kod neprekidnih varijabli, moe se dogoditi da u prikupljenim
podacima postoji mnogo meusobno razliitih vrijednosti. U takvim sluajevima
tablini i grafiki prikazi uvedeni za kvalitativne varijable mogu biti nedovoljno
informativni.
Ako su numerike varijable diskretne s malo moguih vrijednosti, za opis podataka
moemo koristiti iste metode kao pri opisivanju kvalitativnih podataka, tj. frekvencije i relativne frekvencije, te ih grafiki prikazivati stupastim dijagramima i krunim
dijagramima.
Primjer 4.10. (djelatnici.xls)
Broj zabiljeenih vrijednosti diskretnih numerikih varijabli znatno utjee na preglednost tablinih i grafikih prikaza frekvencija i relativnih frekvencija. Analizirajmo diskretnu numeriku varijablu rukovodstvo baze podataka djelatnici.xls iz primjera 4.5 koja prima vrijednosti iz skupa
{0, 1, . . . , N }, gdje je N najvei mogui broj godina radnog staa koje djelatnik moe provesti na
rukovodeoj poziciji. Frekvencije i relativne frekvencije zabiljeenih vrijednosti varijable rukovodstvo za djelatnike iz promatranog uzorka dane su u tablici 4.6.

rukovodstvo

frek.

rel. frek.

rukovodstvo

frek.

rel. frek.

0
1
2
3
4
5
6
7

20
15
13
10
12
10
1
3

0.20
0.15
0.13
0.10
0.12
0.10
0.01
0.03

8
9
10
11
12
13
14
17

3
3
2
2
1
1
2
2

0.03
0.03
0.02
0.02
0.01
0.01
0.02
0.02

Tablica 4.6: Tablica frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable
rukovodstvo.

Vidimo da se varijabla rukovodstvo na promatranom uzorku djelanika realizirala sa 16 razliitih


vrijednosti ije su relativne frekvencije grafiki prikazane stupastim dijagramom 4.5.

190

relativne frekvencije

Deskriptivna statistika
22%
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 17

rukovodstvo

Slika 4.5: Stupasti dijagram relativnih frekvencija svih zabiljeenih vrijednosti varijable rukovodstvo.

Ako numerika varijabla prima mnogo meusobno razliitih vrijednosti, za prikazivanje skupa izmjerenih vrijednosti obino nam nee puno pomoi frekvencije te
stupasti ili kruni dijagrami napravljeni na osnovu svake pojedine izmjerene vrijednosti. Takvi se sluajevi esto javljaju ako podaci dolaze iz kontinuiranih numerikih
varijabli. Problem emo ilustrirati sljedeim primjerom.
Primjer 4.11. (djelatnici.xls)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Promotrimo varijablu placa_prije iz baze podataka djelatnici.xls koja sadri godinje plae prije
reorganizacije poslovanja poduzea za uzorak od 100 djelatnika. Ovdje moemo pretpostaviti da
se radi o kontinuiranoj numerikoj varijabli koja moe primiti vrijednosti iz intervala h0, x]. Kao
gornju granicu intervala, tj. x, moemo uzeti realan broja za koji pretpostavljamo da u danim
uvjetima predstavlja najveu moguu godinju plau u tom poduzeu.
Dio tablice frekvencija i relativnih frekvencija na temelju svih realiziranih vrijednosti prikazan je
tablicom 4.7. Od 100 realizacija zabiljeeno je ak 77 razliitih vrijednosti, a pojedine se vrijednosti pojavljuju s izrazito malim frekvencijama: 1, 2, 3 ili 4. Iz takvih je tablica teko oitavati
frekvencije koje nas zapravo zanimaju (npr. frekvencija ispitanika s godinjom plaom manjom od
20000). Zbog toga se u tablice uobiajeno dodaje i stupac kumulativnih frekvencija i kumulativnih
relativnih frekvencija, kako je prikazano tablicom 4.7.
Stupasti dijagram (slika 4.6) ili kruni dijagram frekvencija (relativnih frekvencija) na kojemu
su prikazane sve realizirane vrijednosti s odgovarajuom frekvencijom (relativnom frekvencijom),
u takvim sluajevima nije osobito informativan.

Ako imamo podatke (x1 , . . . , xn ), onda je kumulativna frekvencija podatka xi , i = 1, . . . , n,


broj svih podataka iz (x1 , . . . , xn ) koji su manji ili jednaki xi . Analogno se definira i
kumulativna relativna frekvencija podatka.

191

Statistika
iznos plae

frekvencija

kumulativna frek.

relativna frekvencija

kumulativna rel. frek.

16000
..
.
19800
20000
20200
..
.
42400

1
..
.
1
1
2
..
.
1

1
..
.
15
16
18
..
.
100

0.01
..
.
0.01
0.01
0.02
..
.
0.01

0.01
..
.
0.15
0.16
0.18
..
.
1

Tablica 4.7: Tablica frekvencija i relativnih frekvencija svih sto zabiljeenih vrijednosti varijable
placa_prije.

4%
3%
2%
1%
0%

16000
18900
19700
20400
21100
21600
22300
23300
23800
24800
25700
26500
29400
31600
33200
40400

relativne frekvencije

5%

placa_prije

Slika 4.6:

Stupasti dijagram relativnih frekvencija svih realiziranih vrijednosti varijable

placa_prije.

U svrhu dobivanja preglednih i korisnih stupastih dijagrama za podatke iz kontinuiranih numerikih varijabli, izmjerene je vrijednosti potrebno kategorizirati. To
znai da velik skup podataka podijelimo u nekoliko disjunktnih intervala po kriteriju za koji smatramo da e nam dati eljene rezultate. Stupasti dijagram tada
smjetamo u koordinatni sustav tako da prikazujemo stupie nad tim intervalima
s povrinom koja odgovara relativnoj frekvenciji podataka sadranih u odgovarajuem intervalu. Duljina intervala informacija je koja je takoer prikazana stupastim
dijagramom jer odgovara irini stupia. Takav stupasti dijagram zovemo histogram.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Primjer 4.12. (djelatnici.xls)


Promotrimo ponovno varijablu placa_prije iz baze podataka djelatnici.xls. Razvrstajmo vrijednosti
u disjunktne intervale duljine 10000 poevi od nule. Tako dobiveni tablini prikaz frekvencija i
relativnih frekvencija dan je tablicom 4.8, a pripadni histogram slikom 4.7. Takav histogram jasno

192

Deskriptivna statistika

ilustrira injenicu da najvie djelatnika u uzorku ima godinju plau od 20000 do 30000 novanih
jedinica, dok je plaa iz intervala 40000 do 50000 rijetkost. Intervale za kategorizaciju u takvim
i slinim sluajevima obino radimo tako da bi zadovoljili potrebe za prezentiranjem informacija
koje elimo istaknuti.
iznos plae

frekvencija

relativna frekvencija

0
15
69
14
2

0
0.15
0.69
0.14
0.02

[0, 10000i
[10000, 20000i
[20000, 30000i
[30000, 40000i
[40000, 50000i

Tablica 4.8: Tablica frekvencija i relativnih frekvencija kategoriziranih izmjerenih vrijednosti

50000

40000

30000

20000

10000

80%
70%
60%
50%
40%
30%
20%
10%
0%

relativne frekvencije

varijable placa_prije.

placa_prije

Slika 4.7: Histogram relativnih frekvencija kategoriziranih izmjerenih vrijednosti varijable


placa_prije.

Za numerike varijable moemo definirati numerike karakteristike koje imaju loginu interpretaciju i mogu se iskoristiti s ciljem prikazivanja skupa podataka. Ovdje
emo definirati neke od najee koritenih numerikih karakteristika skupa podataka.
Aritmetika sredina podataka
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Aritmetika sredina niza izmjerenih vrijednosti x1 , x2 , . . . , xn varijable X definirana


je izrazom
n
1X
xi .
xn =
n i=1
Aritmetika sredina numerika je karakteristika koja pripada mjerama centralne
tendencije, tj. mjeri "srednju vrijednost" podataka.

193

Statistika
Primjer 4.13. Neka su izmjerene vrijednosti jedne varijable sljedee:
1.2, 2.1, 3.2, 4.3, 5.4, 6.5, 7.6, 8.7, 9.8.

S obzirom da ih ima ukupno 9, aritmetika sredina (eng. mean) tog skupa izmjerenih vrijednosti
jest
1.2 + 2.1 + 3.2 + 4.3 + 5.4 + 6.5 + 7.6 + 8.7 + 9.8
5.42.
9

Medijan podataka
Da bismo razumjeli i odredili medijan potrebno je prvo poredati izmjerene vrijednosti x1 , x2 , . . . , xn varijable X po veliini (u rastuem poretku, tj. od manjeg prema
veem). Medijan je takoer jedna mjera centralne tendencije numerikih podataka,
a ima znaenje izmjerene vrijednosti koja se nalazi na sredini niza podataka kada
je on ureen po veliini, tj. barem pola podataka manje je ili jednako medijanu,
a istovremeno je barem pola podataka vee ili jednako medijanu. Nain njegovog
izrauna ovisi o tome imamo li neparan ili paran broj izmjerenih vrijednosti varijable. Ukoliko imamo neparan broj izmjerenih vrijednosti, onda postoji vrijednost
koja je na srednjoj poziciji u ureenom skupu, pa nju definiramo kao medijan.
Primjer 4.14. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3.
Prvo te vrijednosti poredamo po veliini:
1, 1, 2, 2, 2, 2, 3, 5, 5, 6, 7.
S obzirom da ih ima ukupno 11, medijan je vrijednost koja je na estoj poziciji u tako dobivenom
nizu, tj. broj 2.

Ukoliko imamo paran broj izmjerenih vrijednosti varijable, onda ne postoji podatak koji je na srednjoj poziciji jer srednju poziciju "zauzimaju" dva podatka.
Medijan se tada definira kao polovite tih dvaju podataka (tj. aritmetika sredina
tih dvaju podataka).
Primjer 4.15. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
Prvo te vrijednosti poredamo po veliini:
1, 1, 2, 2, 2, 2, 3, 3, 5, 5, 6, 7.
S obzirom da ima 12 podataka, "sredinu" ine esti i sedmi podatak, tj. vrijednosti 2 i 3. Medijan
je tog skupa podataka sredina tih dvaju brojeva, tj. medijan je (2 + 3)/2 = 2.5.

194

Deskriptivna statistika

Postotna vrijednost podataka, donji i gornji kvartil


Medijan odgovara pedeset postotnoj vrijednosti s obzirom da je barem 50% podataka manje ili jednako medijanu i barem 50% podataka vee ili jednako od medijana.
Postotna vrijednost za neki izabrani broj p h0, 100i, oznaimo je x0p , definira se
potujui zahtjev da je barem p% izmjerenih vrijednosti manje ili jednako x0p , dok
je barem (100 p)% vrijednosti vee ili jednako x0p . Dvadeset pet postotna vrijednost zove se donji kvartil, a sedamdeset pet postotna vrijednost zove se gornji kvartil.
Analogno, kao i kod raunanja medijana, ako se na traenoj poziciji za raunanje
postotne vrijednosti nalaze dva podatka u ureenom skupu izmjerenih vrijednosti,
postotnu vrijednost odreujemo kao njihovu sredinu. Donji i gornji kvartil mjere
su koje pripadaju grupi mjera rasprenosti podataka.
Primjer 4.16. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 6, 1, 3, 7, 3, 3, 3, 3.
Prvo te vrijednosti poredamo po veliini:
1, 1, 2, 3, 3, 3, 3, 3, 5, 6, 6, 7.
elimo li odrediti donji kvartil, potrebno je prvo odrediti etvrtinu podataka (25%). S obzirom da
imamo 12 podataka, etvrtinu (25%) ine tri podatka. Trei je podatak u gornjem skupu broj 2, a
etvrti 3. Donji kvartil jest 2.5. Deveti je broj u gornjem skupu podataka broj 5, a deseti 6, stoga
je gornji kvartil 5.5.

Najmanja i najvea vrijednost, raspon podataka


Raspon podataka mjera je koja pokazuje koliko su numeriki podaci raspreni, tj.
to je jedna od mjera rasprenosti podataka. Definiran je kao razlika najvee i najmanje vrijednosti u skupu mjerenih vrijednosti varijable (tj. razlika maksimalne i
minimalne izmjerene vrijednosti varijable). Ako su x1 , x2 , . . . , xn izmjerene vrijednosti varijable, oznaimo najmanju od njih (minimum) xmin , a najveu (maksimum)
xmax .
Primjer 4.17. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
Vidimo da je vrijednost 1 najmanja izmjerena vrijednost, a 7 najvea. Prema tome, raspon ovog
skupa izmjerenih vrijednosti je 7 1 = 6.

U mnogim je primjerima zanimljivo promatrati maksimalno odstupanje izmjerenih vrijednosti varijable od "prosjeka", tj. aritmetike sredine izmjerenih vrijednosti. Ta je numerika karakteristika definirana kao vei od brojeva
(xn xmin ) i (xmax xn ), tj. broj
max {(xn xmin ), (xmax xn )}.

195

Statistika

Primjer 4.18. Neka su 1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3 izmjerene vrijednosti neke varijable. Tada je


xmin = 1,

xmax = 7,

xn =

1+2+5+6+5+1+2+7+2+2+3+3
= 3.25.
12

Maksimalno odstupanje izmjerenih vijednosti te varijable od njihovog prosjeka jest


max {3.25 1, 7 3.25} = max {2.25, 3.75} = 3.75.

Varijanca i standardna devijacija podataka


Varijanca i standardna devijacija takoer pripadaju grupi mjera rasprenosti podataka. One karakteriziraju rasprenost podataka oko aritmetike sredine. Varijanca
niza izmjerenih vrijednosti x1 , x2 , . . . , xn varijable definirana je izrazom:
n

s2n =

1X
(xi xn )2 ,
n i=1

a standardna devijacija jest kvadratni korijen varijance, tj.


v
u n
q
u1 X
2
sn = sn = t
(xi xn )2 .
n i=1
Primjer 4.19. Neka su izmjerene vrijednosti jedne varijable sljedee:
1.2, 2.1, 3.2, 4.3, 5.4, 6.5, 7.6, 8.7, 9.8.
Iz primjera 4.13 znamo da je aritmetika sredina tog skupa podataka priblino jednaka 5.42. Varijanca tog skupa podataka jest
s2n =

9
1X
(xi 5.42)2 7.87,
9 i=1

a standardna devijacija
v
u
9
u1 X
sn = t
(xi 5.42)2 2.81.
9 i=1

Mod podataka
Mod je vrijednost iz niza izmjerenih vrijednosti varijable kojoj pripada najvea
frekvencija, tj. izmjerena je najvie puta. Mod ne mora biti jedinstven.
Primjer 4.20. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
Vidimo da je vrijednost 2 izmjerena najvie puta (etiri puta), pa je 2 mod tog skupa podataka.

196

Deskriptivna statistika

Primjer 4.21. Neka su izmjerene vrijednosti jedne varijable sljedee:


1, 2, 5, 6, 5, 3, 1, 2, 7, 2, 2, 3, 3.
Vidimo da su najvie puta izmjerene dvije vrijednosi - 2 i 3 izmjerene su tono etiri puta. Dakle,
mod tog skupa podataka nije jedinstven.

Koritenjem numerikih karakteristika numerikih varijabli skup mjerenih vrijednosti moe se prikazati grafiki pomou kutijastog dijagrama (eng. box plot,
boxplot ili box-and-whisker plot).
Kutijastim dijagramom prikazujemo odnos pet numerikih karakteristika skupa izmjerenih vrijednosti: minimalnu vrijednost, donji kvartil, medijan, gornji kvartil i
maksimalnu vrijednost.
Primjer 4.22. (djelatnici.xls)
Numerike karakteristike skupa izmjerenih vrijednosti varijable placa_prije iz baze podataka djelatnici.xls prikazane su u tablici 4.9.
veliina uzorka
100

aritmetika sredina
24522

mod
24600

frek. moda
4

st. dev.
5105.801

varijanca
26069208.1

minimum
16000

donji kvartil
20950

medijan
23650

gornji kvartil
26250

maksimum
42400

raspon
26400

Tablica 4.9: Deskriptivna statistika varijable placa_prije.

Odnos minimuma, donjeg kvartila, medijana, gornjeg kvartila i maksimuma izmjerenih vrijednosti
varijable placa_prije prikazan je kutijastim dijagramom 4.8.
36000
34000
32000

placa_prije

30000
28000
26000
24000
22000
20000
18000
16000
14000

Median = 23650
25%-75%
= (20950, 26250)
Non-Outlier Range
= (16000, 33600)

Slika 4.8: Kutijasti dijagram na bazi medijana za izmjerene vrijednosti varijable placa_prije.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

197

Statistika
Iz tablice 4.9 i kutijastog dijagrama 4.8 moemo izvesti sljedee i sline zakljuke:
- najnia godinja plaa u uzorku iznosi 16000, a najvia 42400,
- bar 25% ispitanika iz uzorka ima plau manju ili jednaku 20950,
- bar 25% ispitanika iz uzorka ima plau veu ili jednaku 26250,
- bar 50% ispitanika iz uzorka ima plau manju ili jednaku medijanu, tj. 23650,
- bar 50% ispitanika iz uzorka ima plau veu ili jednaku 23650.

Na kutijastom dijagramu mogu se oznaiti i takozvane stree vrijednosti ako


postoje, a radi se o podacima koji su po svojoj vrijednosti znaajno vei ili manji
u odnosu na druge izmjerene vrijednosti promatrane varijable. Pojavljivanje je
streih vrijednosti najee vezano uz jedan od sljedeih razloga:
podatak je ili netono izmjeren ili krivo unesen u bazu podataka,
podatak dolazi iz druge populacije (ne iz populacije koju promatramo u kontekstu problema kojega prouavamo) - npr. ako u varijablu ije su izmjerene
vrijednosti godinje plae 1000 poreznih obveznika u Hrvatskoj upiemo godinju plau Microsoftovog managera iz SAD-a, taj e podatak biti strea
vrijednost,
podatak je tono izmjeren i unesen u bazu, ali predstavlja rijetku pojavu u
populaciji - npr. ako se u varijabli ije su izmjerene vrijednosti koncentracije
glukoze u krvi za 1000 osoba nae tono izmjerena vrijednost 46.7, taj emo
podatak smatrati streom vrijednou jer se radi o vrlo visokoj koncentraciji
glukoze koja se rijetko pojavljuje.
Primjer 4.23. (djelatnici.xls)
Varijabla dob iz baze podataka djelatnici.sta za svakog ispitanika iz uzorka djelatnika promatranog
poduzea sadri informaciju o dobi u godinama. Iz deskriptivne statistike te varijable (tablica
4.10) vidimo da je dob od 333 godine strei podatak i zakljuujemo da se radi o podatku koji je
pogreno upisan u bazu podataka.
veliina uzorka
100

aritmetika sredina
33.83

mod
28

frek. moda
12

st. dev.
31.05

varijanca
964.28

minimum
18

donji kvartil
26

medijan
29

gornji kvartil
36

maksimum
333

raspon
315

Tablica 4.10: Deskriptivna statistika varijable dob.

Osim iz tablice 4.10, streu vrijednost meu izmjerenim vrijednostima varijable dob mogli smo
detektirati i pomou kutijastog dijagrama na bazi medijana.

198

Deskriptivna statistika
350
300

dob

250
200
150

Median = 29
25%-75%
= (26, 36)
Non-Outlier Range
= (18, 49)
Outliers
Extremes

100
50
0

Slika 4.9: Kutijasti dijagram na bazi medijana s prikazom streih vrijednosti za izmjerene
vrijednosti varijable dob.

Kao to vidimo iz kutijastog dijagrama 4.9, i dob od 54 godine prepoznata je kao strei podatak.
Budui da je sasvim razumljivo da promatrano poduzee moe imati djelatnika starog 54 godine,
taj podatak smatramo tono izmjerenim i tono upisanim u bazu podataka, no radi se o dobi koja
se rijetko pojavljuje u populaciji djelatnika tog poduzea. Tako iz kategorizirane tablice frekvencija
i relativnih frekvencija (tablica 4.11) varijable dob vidimo da je takvih djelatnika samo 0.03%.

dob

frekvencija

relativna frekvencija

[18, 28i
37
0.37
[28,
38i
44
0.44
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
[38, 48i
15
0.15
[48, 58i
3
0.03
[58, 333]
1
0.01

Tablica 4.11: Kategorizirana tablica frekvencija i relativnih frekvencijna varijable dob.

4.1.3

Metode opisivanja ordinalnih varijabli

Ordinalne se varijable najee zadaju tako da mogu primiti samo nekoliko meusobno razliitih vrijednosti i one su po svojoj prirodi kvalitativne, zbog ega su
metode opisivanja kvalitativnih varijabli primjenjive u potpunosti i na ordinalne varijable. S obzirom da se vrijednosti ordinalinih varijabli izraavaju brojano, esto se
u primjeni moe vidjeti da se za ordinalne varijable izraavaju, komentiraju i koriste
numerike karakteristike podataka. Ponekad to ima smisla, ali moramo upozoriti da
treba dobro razmisliti u svakom pojedinom sluaju je li i kako je mogue iskoristiti

199

Statistika
informaciju koju daje odabrana numerika karakteristika.

Primjer 4.24. U hrvatskom su obrazovnom sustavu ocjene su od 1 do 5. Prilikom ocjenjivanja


znanja na pisanim testovima nerijetko se ocjena 1 postie za manje od 40% moguih bodova, dok
su ostale ocjene rasporeene na intervalu od 40% do 100% tako da svakoj ocjeni odgovara bodovni
interval iste duljine. Pretpostavimo li da je prosjek svih postignutih ocjena 1.5, moemo li taj broj
tumaiti u odnosu na znanje mjereno brojem bodova koje se ocjenjuje? Ipak, odredimo li da je
medijan 1.5, moemo zakljuiti da je barem 50% uenika postiglo manje od 40% bodova na testu.
Primjer 4.25. (ocjena.xls)
Varijabla ocjena baze podataka ocjena.xls ordinalna je varijabla koja sadri ocjene na usmenom
ispitu iz jednog kolegija za uzorak od 65 studenata iste generacije. Dakle, varijabla ocjena prima
vrijednosti iz skupa 1, 2, 3, 4, 5. Frekvencije i relativne frekvencije zabiljeenih vrijednosti varijable
ocjena dane su u tablici 4.12. Relativne frekvencije grafiki su prikazane stupastim dijagramom,
a frekvencije i relativne frekvencije krunim dijagramom na slici 4.10.
ocjena

frekvencija

relativna frekvencija

1
2
3
4
5

7
7
15
20
16

7/65 0.11
7/65 0.11
3/13 0.23
4/13 0.31
16/65 0.25

Tablica 4.12: Tablica frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable

relativne frekvencije

ocjena.

34%
31%
28%
25%
22%
18%
15%
12%
9%
6%
3%
0%

1; 7; 11%
5; 16; 25%
2; 7; 11%

3; 15; 23%
4; 20; 31%
1

3
ocjena

(a) stupasti dijagram

ocjena

(b) kruni dijagram

Slika 4.10: Grafiki prikazi frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable ocjena.
Numerike karakteristike podataka varijable ocjena prikazane su u tablici 4.13.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

200

Statistiki model
veliina uzorka
65

aritmetika sredina
3.48

mod
4

frek. moda
20

st. dev.
1.63

varijanca
1.28

minimum
1

donji kvartil
3

medijan
4

gornji kvartil
4

maksimum
5

raspon
4

Tablica 4.13: Deskriptivna statistika varijable ocjena.

Odnosi minimuma, donjeg kvartila, medijana, gornjeg kvartila i maksimuma izmjerenih vrijednosti varijable ocjena prikazani su kutijastim dijagramom 4.11.

5,5
5,0
4,5

ocjena

4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5

Median = 4
25%-75%
= (3, 4)
Min-Max
= (1, 5)

Slika 4.11: Kutijasti dijagram na bazi medijana za izmjerene vrijednosti varijable ocjena.

Aritmetiku sredinu, varijancu i standardnu devijaciju ne bismo komentirali jer ne znamo koliko
se stvarno znanje krije iza svake ocjene, ali na temelju ostalih numerikih karakteristika moemo
izvesti sljedee i sline zakljuke:
- na tom uzorku postignuta je i najnia i najvia mogua ocjena,
- bar 25% studenata iz uzorka ocijenjeno je ocjenom 3 ili manjom od 3, dok je bar 75%
studenata ocijenjeno ocjenom 3 ili veom,
- bar 50% studenata iz uzorka ocijenjeno je ocjenom 4 ili 5.

You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

4.2

Statistiki model

Pretpostavka je statistikog zakljuivanja da se donose zakljuci o varijablama od


kojih baram jedna ima sluajan karakter, a na temelju prikupljenih realizacija za
te varijable. Zbog toga je sluajna varijabla (sluajni vektor) matematiki objekt
koji je temelj svakoga statistikog zakljuivanja.

Statistika

201

Da bi primjenjivali metode statistikog zakljuivanja, prva je pretpostavka postavljanje statistikog modela koji koristimo za modeliranje prikupljenih podataka.
Zadati statistiki model znai opisati poznate karakteristike sluajnog vektora za
kojega smatramo da nai podaci ine jednu realizaciju. S obzirom da je sluajni
vektor odreen svojom funkcijom distribucije, statistikim je modelom opisano ono
to je unaprijed poznato o funkciji distribucije sluajnog vektora kojim modeliramo
podatke, odnosno statistiki model jest familija funkcija distribucije koja
se uzima u obzir za zakljuivanje u danom problemu.
Najjednostavniji su modeli koji se koriste u statistici razni modeli jednostavnoga
sluajnog uzorka.
Definicija 4.1. Statistiki model zovemo model jednostavnoga sluajnog uzorka
iz funkcije distribucije F ako za sluajni vektor (X1 , . . . , Xn ), iju realizaciju ine
podaci (x1 , . . . , xn ), vrijedi:
sluajne varijable X1 , . . . , Xn nezavisne su,
sve sluajne varijable X1 , . . . , Xn imaju istu funkciju distribucije F .
Kod takvih modela promatranu veliinu smatramo sluajnom varijablom s funkcijom distribucije F , a vrijednosti varijable izmjerene na jedinkama iz uzorka nezavisne su realizacije te sluajne varijable.
Zbog jednostavnosti izraavanja u nastavku teksta emo koristiti termin sluajni
uzorak za sluajni vektor (X1 , . . . , Xn ) statistikog modela, a termin uzorak za
njegovu realizaciju (x1 , . . . , xn ), tj. podatke.
U nastavku emo opisati nekoliko karakteristinih statistikih modela koji se vrlo
esto koriste u praksi, kao i primjere za koje su ti modeli prikladni.

4.2.1

Problem proporcije

Da bismo pojasnili probleme koji se mogu razmatrati u okviru naziva "problem


proporcije" i definirali statistiki model koji koristimo, posluit emo se primjerom.
Primjer 4.26. Imamo proizvodnu traku koja proizvodi proizvod A, ali s odreenim (nepoznatim)
postotkom karta. Nepoznati postotak karta oznaimo s .
Skupo je kontrolirati svaki proizvod koji je proizveden na toj traci, pa za zakljuivanje o postotku
karta uzimamo sluajni uzorak od n proizvoda.

202

Statistiki model

Uzimanje jednog proizvoda u uzorak rezultira sluajnom varijablom


!
0 1
, [0, 1],
X=
1
koja daje jedinicu ako je proizvod kart, a u suprotnom nulu. Ako pod proporcijom smatramo omjer
broja neispravnih proizvoda proizvedenih na toj traci i ukupnog broja proizvoda proizvedenih na toj
traci u danom periodu, onda vjerojatnost P {X = 1} = odgovara proporciji karta u populaciji.
S obzirom da se na traci stalno proizvode novi proizvodi, ako ne dolazi do bitnih promjena u
procesu proizvodnje tijekom vremena, moemo smatrati da svako uzimanje proizvoda u uzorak
predstavlja realizaciju sluajne varijable jednako distribuirane kao X te da su sve te sluajne
varijable meusobno nezavisne.
Podaci dobiveni u opisanom postupku ine ureenu n-torku nula i jedinica koja je realizacija
sluajnog vektora (X1 , . . . , Xn ) n. j. d. sluajnih varijabli distribuiranih kao X (vidi Bernoullijevu
shemu).

Skup svih moguih ishoda sluajnog vektora opisanog u prethodnom primjeru jest
R(X1 , . . . , Xn ) = {(x1 , . . . , xn ) : xi {0, 1}}.
Distribucija je zadana s
p(x1 , . . . , xn ; ) = P {X1 = x1 , . . . , Xn = xn }
n
Y
xi (1 )1xi , (x1 , . . . , xn ) R(X1 , . . . , Xn ).
=
i=1

Tako nastao sluajni vektor zovemo jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom [0, 1].
Ako s F oznaimo funkciju distribucije tog sluajnog uzorka za dani , onda statistiki model u okviru kojega se bavimo zakljuivanjem o proporciji ini familija
funkcija distribucije:
P = {F : [0, 1]}.
Zovemo ga statistiki model jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije.
Uoimo da je taj model P indeksiran parametrom , pa takav model zovemo parametarski.
Model sluajnog uzorka iz Bernoullijeve distribucije moemo koristiti u mnogo drugih praktinih primjera.

203

Statistika

Primjer 4.27. U primjeru 4.26 uzorak od n proizvoda konstruiran je uzimanjem proizvoda s


proizvodne trake. To moemo interpretirati kao odabir konanog uzorka iz beskonane populacije.
U sluaju odabira konanog uzorka iz konane populacije, npr. uzorka od n vijaka iste vrste iz
skladita koje sadri N takvih vijaka, moramo razlikovati dva sluaja:
(1) izvlaenje jednog po jednog vijka iz konanog skupa vijaka, pri emu se izvueni element vraa
u skup,
(2) izvlaenje jednog po jednog vijka iz konanog skupa vijaka, pri emu se izvueni element ne
vraa u skup.
Sluaj (1)
Oznaimo s v broj neispravnih vijaka u tom skladitu. To znai da je proporcija neispravnih vijaka
= v/N . Oznaimo s X sluajnu varijablu koja se realizira nulom u sluaju da pri odabiru jednog
vijka iz skladita izvuemo ispravan, a jedinicom u sluaju da izvuemo neispravan vijak. Dakle,
vidimo da je P {X = 1} = v/N , a P {X = 0} = 1 (v/N ), tj. distribucija sluajne varijable X
dana je tablicom
!
0
1
X=
.
1 (v/N ) v/N
Ako iz tog skladita na sluajan nain odaberemo n vijaka na nain opisan u toki (1) ovog
primjera i za svaki izvueni vijak zabiljeimo je li ispravan (0) ili neispravan (1), dobijemo jednu
ureenu n-torku nula i jedinica koju shvaamo kao jednu realizaciju sluajnog vektora (X1 , . . . , Xn )
sa slikom R(X) = {(x1 , . . . , xn ) : xi {0, 1}}. Zbog naina provoenja izvlaenja opisanog
pod (1), komponente su sluajnog vektora (X1 , . . . , Xn ) meusobno nezavisne i sve su jednako
distribuirane kao sluajna varijabla X. Distribucija tog sluajnog vektora zadana je izrazom
n
n 
Y
Y
v xi 
v nxi
p(x1 , . . . , xn ; v) =
P {Xi = xi } =
1
.
(4.1)
N
N
i=1
i=1
Prema tome, (X1 , . . . , Xn ) jest jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom = v/N , a familija pripadnih funkcija distribucije {F : [0, 1]} odreenih distribucijom
(4.1) pripadni je parametarski statistiki model. Iz tog primjera vidimo da se parametarski statistiki modeli za jednostavni sluajni uzorak iz populacije koja nije konana i za jednostavni sluajni
uzorak iz konane populacije konstruiran na nain opisan pod (1) podudaraju.
Sluaj (2)
Opiimo sada konstrukciju sluajnog uzorka iz konane populacije na nain opisan u toki (2) ovog
primjera, tj. bez vraanja u uzorak prethodno izvuenih elemenata. Sluajne varijable X1 , . . . , Xn ,
kojima modeliramo ishode izvlaenja vijaka pri emu nas zanima je li izvueni vijak ispravan ili
neispravan, nisu nezavisne. Sluajna varijabla X1 jednako je distribuirana kao sluajna varijabla X opisana u prethodnom dijelu primjera, no sluajne varijable X2 , . . . Xn nemaju takvu
distribuciju. Naime,
!
0
1
, a1 {0, 1},
X2 |X1 =a1 =
va1 va1
1 N 1 N 1
!
0
1
X3 |X1 =a1 ,X2 =a2 =
, a1 , a2 {0, 1},
1 a2 va1 a2
1 va
N 2
N 2
odnosno openito za i {3, . . . , N }

Xi |X1 =a1 ,...,Xi1 =ai1 =

0
1

Pi1

j=1

aj

N (i1)

P
v i1
j=1 aj
N (i1)

a1 , . . . , ai1 {0, 1}.

204

Statistiki model

Distribucija sluajnog vektora (X1 , . . . , Xn ) dana je na sljedei nain:


p(x1 , . . . , xn ; v) = P {X1 = x1 , . . . Xn = xn } =
= P {X1 = x1 , . . . Xn1 = xn1 |Xn = xn }P {Xn = xn } = . . . =
n
Y
= P {X1 = x1 }P {X2 = x2 |X1 = x1 }
P {Xi = xi |X1 = x1 , . . . , Xi1 = xi1 }.

(4.2)

i=3

Oito distribucija sluajne varijable X1 i uvjetne distribucije sluajnih varijabli X2 , . . . , Xn ovise


o nepoznatoj proporciji neispravnih vijaka u velikom skladitu, tj. o parametru = v/N [0, 1].
Prema tome, familija pripadnih funkcija distribucije {F : [0, 1]} odreenih distribucijom (4.2)
pripadni je parametarski statistiki model.
Uoimo da distribuciju (4.2) moemo aproksimirati distribucijom (4.1) ukoliko je
P
v i1
v
j=1 aj

.
N (i 1)
N
Rijeima reeno, za veliki N i mali v, parametarski statistiki model temeljen na odabiru n elemenata iz populacije veliine N bez vraanja prethodno izvuenih elemenata u tu populaciju moemo
aproksimirati parametarskim statistikim modelom temeljenim na odabiru n elemenata iz iste
populacije s vraanjem prethodno izvuenih elemenata u tu populaciju.

4.2.2

Problem oekivanja i varijance normalne distribucije

Za mnogo kvantitativnih sluajnih pojava moe se pretpostaviti da imaju normalnu


distribuciju. injenica je to koju se moe potkrijepiti centralnim graninim teoremima. Naime, u centralnom graninom teoremu (vidi poglavlje 3.5.2) navedeno je
da se suma n. j. d. sluajnih varijabli koje imaju konanu varijancu asimptotski
ponaa po zakonu normalne distribucije.
Te jake pretpostavke o nezavisnosti i jednakoj distribuiranosti sluajnih varijabli
koje se sumiraju mogu se u velikoj mjeri relaksirati, a da zakljuak o asimptotski
normalnom ponaanju sume ostane istinit (vidi npr. [26]).
Kao posljedicu takvih rezultata imamo injenicu da vrlo esto pojave, iji je sluajan
karakter rezultat sume puno sluajnih utjecaja koje ne moemo posebno analizirati,
imaju distribuciju toliko blisku normalnoj distribuciji da u statistikoj analizi ne
moemo primijetiti razlike izmeu stvarne distribucije i aproksimativne normalne
distribucije.
Za takve pojave provodimo statistiko zakljuivanje kao da su normalno distribuirane.
Primjer 4.28. Beskonana traka pakira eer u pakovanja na kojima je deklarirana neto masa
od 1 kg. Meutim, dovoljno preciznom vagom mogue je utvrditi da neto masa eera pokazuje
odstupanja od 1 kg. Po karakteru sluajne greke koja nastaje pri pakiranju eera na tekuoj

205

Statistika

vrpci, moe se smatrati da masa eera u pakiranjima delariranim kao 1 kg zapravo ima normalnu
distribuciju.
Uzimanje jednog pakiranja i precizno vaganje rezultira podatkom koji je realizacija normalne sluajne varijable s oekivanjem i varijancom 2 . Uzimamo li s trake n pakiranja i vaemo im
sadraj, imamo podatke (x1 , x2 , . . . , xn ) koji su jedna realizacija n. j. d. sluajnog vektora
(X1 , X2 , . . . , Xn ).

Sluajni vektor (X1 , X2 , . . . , Xn ) zovemo jednostavni sluajni uzorak iz normalne distribucije s parametrima i 2 , ako su X1 , X2 , . . . , Xn nezavisne i
jednako distribuirane sluajne varijable s distribucijom koja je N (, 2 ).
Ako je F(,2 ) funkcija distribucije normalne sluajne varijable za dani (, 2 ), onda
je funkcija distribucije jednostavnoga sluajnog uzorka iz te distribucije (zbog nezavisnosti):
n
Y
F(,2 ) (x1 , . . . , xn ) =
F(,2 ) (xi ).
i=1

Dakle, statistiki model u okviru kojega se bavimo zakljuivanjem o oekivanju i


varijanci normalne distribucije jest familija funkcija distribucije
P = {F(,2 ) : (, 2 ) R h0, i},

(4.3)

a zovemo ga statistiki model jednostavnoga sluajnog uzorka iz normalne


distribucije.
Uoimo da je taj model P takoer indeksiran parametrom, ovoga puta dvodimenzionalnim (, 2 ), pa je i takav model parametarski.
Model sluajnog uzorka iz normalne distribucije moemo koristiti u mnogo praktinih primjera.
Primjer 4.29. Prosjenu godinju koliinu kie koja padne na odreenom podruju ima smisla
promatrati kao sluajnu veliinu, tj. modelirati sluajnom varijablom. Naime, neka su Xi , i
{1, . . . , 365}, sluajne varijable kojima modeliramo koliinu kie koja na promatranom podruju
padne tijekom i-tog dana u neprijestupnoj godini. Tada prosjenu koliinu kie koja na tom
podruju padne tijekom jedne neprijestupne godine modeliramo sluajnom varijablom
Y =

n
1X
Xi ,
n i=1

n = 365,

za koju zbog centralnog graninog teorema moemo smatrati da ima normalnu distribuciju s parametrima i 2 . Dakle, ako raspolaemo podacima o prosjenoj godinjoj koliini kie na nekom
podruju za 100 neprijestupnih godina, zapravo raspolaemo jednom realizacijom sluajnog vektora
(Y1 , . . . , Y100 ). Ako su istinite pretpostavke o nezavisnosti i jednakoj distribuiranosti sluajnih varijabli Y1 , . . . , Y100 , ima smisla u zakljuivanju o prosjenoj godinjoj koliini kie na tom podruju
koristiti statistiki model jednostavnoga sluajnog uzorka iz normalne distribucije s oekivanjem
i varijancom 2 .

206

4.2.3

Statistiki model

Jednostavna linearna regresija

Da bismo lake objasnili statistiki model, posluit emo se jednim primjerom.


Primjer 4.30. U jednom istraivanju eli se odrediti ovisi li prosjena dnevna potronja goriva
zaposlene osobe u Hrvatskoj, koja je vlasnik automobila i ima vozaku dozvolu, o udaljenosti
mjesta stanovanja osobe od radnog mjesta. Pod pojmom "prosjena dnevna potronja goriva"
ovdje podrazumijevamo ukupnu potronju goriva u godini dana podijeljenu s 365.
Udaljenost mjesta stanovanja od radnog mjesta za svaku pojedinu osobu moe se smatrati tono
odreenom, tj. deterministikom veliinom. Meutim, prosjenu dnevnu potronju goriva svakako
treba tretirati kao sluajnu veliinu. S obzirom na to da se radi o prosjenoj potronji, zahvaljujui
centralnom graninom teoremu, za potrebe statistikog zakljuivanja moi emo se osloniti na
injenicu da je ta veliina normalno distribuirana.
Statistiki model za zakljuivanje o vezi izmeu deterministike veliine x (udaljenost mjesta
stanovanja od radnog mjesta) i sluajne veliine Yx (prosjena dnevna potronja goriva), izgradit
emo u ovom primjeru postavljanjem linearne veze izmeu tih veliina:
Yx = ax + b + x , a, b R,
gdje x predstavlja sluajnu varijablu greke modela za dani x.

U navedenom primjeru, kao i u mnogim drugim primjerima slinog tipa, prikupljanjem podataka u uzorak imamo n ureenih parova brojeva
(x1 , y1 ), . . . , (xn , yn )
koji predstavljaju realizacije ureenih parova koje emo oznaiti
(x1 , Y1 ), . . . , (xn , Yn ),
a kod kojih je druga komponenta sluajna varijabla. Uoimo da sluajne varijable iz tih parova, tj. Y1 , . . . , Yn ne moraju biti jednako distribuirane. Naprotiv,
pretpostavka je da njihova distribucija ovisi o iznosu prve koordinate iz para.
Primjer 4.31. (automobili.xls)
Varijabla potrosnja baze podataka automobili.sta sadri podatke o potronji goriva novog modela
automobila pri brzini od 110 km/h za 300 nezavisnih mjerenja, dok varijabla mjerenje sadri vrijednosti nekog parametra izmjerenog na tehnikom pregledu tog automobila nakon takve vonje, a
za kojeg se pretpostavlja da bi kod tehniki ispravnog automobila trebao biti linearno povezan s prosjenom potronjom automobila pri velikim brzinama. U kontekstu jednostavne linearne regresije
izmjerene vrijednosti varijable potrosnja oznaavamo s x1 , . . . x300 , a izmjerene vrijednosti varijable mjerenje oznaavamo s (y1 , . . . , y300 ) i smatramo ih realizacijama nezavisnih sluajnih varijabli
Y1 , . . . , Y300 kojima modeliramo rezultate provedenih mjerenja. Parove (x1 , y1 ),. . ., (x300 , y300 )
izmjerenih vrijednosti varijabli potrosnja i mjerenje grafiki prikazujemo dijagramom rasprenosti
(eng. scatterplot) 4.12.

207

Statistika
22
20
mjerenje

18
16
14
12
10
8
6
2

5
6
potrosnja

Slika 4.12: Dijagram rasprenosti za izmjerene vrijednosti varijabli potrosnja i mjerenje.

U postupku emo modeliranja pretpostaviti sljedee:


EYi = axi + b za svaki i = 1, . . . , n, tj. ako je i = Yi axi b, onda je
Ei = 0.
Y1 , . . . , Yn jesu meusobno nezavisne i imaju istu varijancu, oznaimo je 2 .
Ako je vektor = [1 , . . . , n ] , onda je matrica kovarijanci tog vektora
oblika 2 I (I je oznaka za jedininu matricu n-tog reda).
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Y1 , . . . , Yn su normalno distribuirane sluajne varijable. Dakle, Yi N (axi +


b, 2 ).
Statistiki model za zakljuivanje o parametrima a, b i 2 definirat emo koritenjem
familije doputenih funkcija distribucije za sluajni vektor (Y1 , . . . , Yn ). Njegova
funkcija distribucije odreena je funkcijom gustoe


f (y1 , . . . , yn ; a, b, ) =


=

1
2

n Y
n

(yi axi b)2


2 2

i=1

n
e

212

n
P

(yi axi b)2

i=1

u kojoj su tri nepoznata parametra a, b i 2 , dok su x1 , . . . , xn izmjerene vrijednosti


prve komponente ureenih parova podataka.
Takav statistiki model zovemo klasian jednostavan linearan regresijski model.

208

4.3

Procjena parametara

Procjena parametra

U parametarskim statistikim modelima osnovu statistikog zakljuivanja ini zakljuivanje o parametrima. Jedan je od osnovnih problema njihova procjena na
temelju realizacije uzorka iz danog statistikog modela. Za procjene parametra
koristimo procjenitelje.
Definicija 4.2. Neka je P = {F : Rk } parametarski statistiki model,
k-dimenzionalan parametar, a Rk prostor parametra, tj. skup svih dozvoljenih
vrijednosti nepoznatog parametra . Neka je (X1 , . . . , Xn ) sluajni vektor s distribucijom iz P i t : Rn . Sluajni vektor T = t(X1 , . . . , Xn ) jest procjenitelj
za .1
Primjer 4.32. U modelu je jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije s parametrom p [0, 1] relativna frekvencija jedinice jedan procjenitelj za p.
Primjer 4.33. U modelu jednostavnoga sluajnog uzorka iz N (, 2 ) oznaimo
Xn =
2

Sn =
2
Sn
=

n
1X
Xi ,
n i=1

n
1X
(Xi X n )2 ,
n i=1

n
1 X
(Xi X n )2 .
n 1 i=1

2 ) drugi procjenitelj za taj parametar.


Tada je (X n , S n ) jedan procjenitelj za (, 2 ), a (X n , Sn

Problem je kako izabrati funkciju t procjenitelja u pojedinom statistikom modelu.


Takvim pitanjima bavi se matematika statistika. Ovdje emo samo navesti nekoliko svojstava koja su vrlo poeljna da ih procjenitelj parametra ima i intuitivno
ilustrirati zato su ta svojstva korisna.
Definicija 4.3. Neka je P = {F : Rk } parametarski statistiki model,
a k-dimenzionalan parametar. Procjenitelj T nepristran je ako za svaki
vrijedi
E T = E t(X1 , . . . , Xn ) = .
Ukoliko je nepoznati parametar jednodimenzionalan, a predloeni procjenitelj nepristran, poeljno je da takav procjenitelj ima to manju varijancu. Naime, varijanca
je jedna mjera rasprenosti oko oekivanja pa je za oekivati da e se procjena s veom vjerojatnou realizirati u malim okolinama oko stvarne vrijednosti parametra
1 Uoite da distribucija procjenitelja ovisi o vrijednosti nepoznatog parametra . Da bi tu
injenicu naglasili, vjerojatnost skupa {T A} oznaavamo s P {T A}, a oekivanje od T s
E T.

209

Statistika

(tj. oekivanja procjenitelja) ako je varijanca manja. Zbog toga, usporeujui dva
nepristrana procjenitelja, kaemo da je efikasniji onaj koji ima manju varijancu.
Osim toga, poeljno je da varijanca nepristranog procjenitelja konvergira u nulu s
porastom veliine uzorka pa za jednodimenzionalan parametar definiramo svojstvo
konzistentnosti sljedeom definicijom.
Definicija 4.4. Neka je P = {F : R} parametarski statistiki model, a
jednodimenzionalan parametar. Procjenitelj T konzistentan je ako za pripadni
niz procjenitelja Tn = t(X1 , . . . , Xn ), n N, za svaki > 0 i vrijedi
lim P {|Tn | } = 0.

Primjer 4.34. Neko poduzee sve svoje finalne proizvode rasporeuje po kvaliteti u tri skupine: I,
II i III kategoriju. Iskustveno je poznato da su vjerojatnosti da finalni proizvod bude I kategorije
i da finalni proizvod bude II kategorije jednake. Ovu vjerojatnost oznaimo s . Dakle, sluajna
varijabla koja opisuje kategoriju kvalitete proizvoda moe se zadati na sljedei nain:
!
1 2
3
X=
.
1 2
Parametar moe primiti bilo koju vrijednost iz intervala [0, 1/2] da bi ta sluajna varijabla bila
dobro definirana. Problem koji se postavlja pred statistiara procjena je parametra na temelju
n-dimenzionalnog sluajnog uzorka.
U skladu s prethodnim primjerom za oekivati je da se relativna frekvencija neke kategorije moe
iskoristiti u svrhu procjene s obzirom da ima znaenje vjerojatnosti da se realizira proizvod
prve kategorije, ali takoer i vjerojatnost da se realizira proizvod druge kategorije. Tako se moe
razmiljati o procjeniteljima:
f2
f1
, T2 =
,
T1 =
n
n
gdje je f1 frekvencija jedinice, a f2 frekvencija dvojke u uzorku.
Uoimo da su oba procjenitelja nepristrana. Naime, f1 B(n, ) i f2 B(n, ) pa je
E T1 = E T2 = .
Moemo takoer izraunati i varijance:
n(1 )
(1 )
=
.
n2
n
Koritenjem se slabog zakona velikih brojeva lako vidi da su oba procjenitelja konzistentna. Na
temelju tih analiza ne moemo preferirati niti jednog od navedenih dvaju procjenitelja. Meutim,
razmotrimo kao varijantu i procjenitelja koji je vezan uz relativnu frekvenciju tree kategorije
proizvoda (f3 ):


1
f3
T3 =
1
.
2
n
Var T1 = Var T2 =

S obzirom da je f3 B(n, 1 2), E T3 = , to je i nepristran procjenitelj za . Varijanca je


Var T3 = E (T3 )2 =

1
1

Var f3 =
n(1 2)2 =
(1 2).
4n2
4n2
2n

210

Procjena parametara

Dakle, to je takoer konzistenatan procjenitelj. Usporedimo li varijance od T1 i T2 s varijancom


od T3 za svaki i n N, vidimo da je
Var T3 (, n) Var T1 (, n) = Var T2 (, n),
pa je T3 efikasniji procjenitelj za (slika 4.13). Napomenimo da taj rezultat nije neoekivan
s obzirom da procjenitelj T3 u sebi sadri informacije koje nose oba prethodna procjenitelja jer
vrijedi:
1
T3 = (T1 + T2 ).
2

0.0025
0.0020
Var T1 HL, Var T2 HL
Var T3 HL

0.0015
0.0010
0.0005
0.0

0.1

0.2

0.3

0.4

0.5

Slika 4.13: Varijance procjenitelja T1 , T2 i T3 za n = 100.

4.3.1

Procjena proporcije

Neka je (X1 , . . . , Xn ) jednostavni sluajni uzorak iz Bernoullijeve distribucije


!
0 1
X=
, [0, 1].
1
Tada je relativna frekvencija jedinice
T =

f1
n

jedan nepristran i konzistentan procjenitelj za parametar koji ima znaenje vjerojatnosti realizacije jedinice.
Zaista, s obzirom da sluajna varijabla koja daje broj uspjeha u n nezavisnih Bernoullijevih pokusa ima binomnu distribuciju s parametrima n i , to je f1 B(n, ).
Vrijedi:
f1
n
E
=
= .
n
n
Konzistentnost je posljedica slabog zakona velikih brojeva.

211

Statistika

Primjer 4.35. Promotrimo igrau kockicu sa svojstvom da se pri jednom bacanju broj i
{1, . . . , 6} okrene s vjerojatnou pi , pri emu je
pi > 0,

i {1, . . . , 6},

6
X

pi = 1.

i=1

elimo procijeniti vjerojatnost da se pri bacanju te kockice okrene estica, stoga oznaimo s 1
dogaaj "okrenula se estica", a s 0 dogaaj "nije se okrenula estica". U tom kontekstu rezultat
bacanja kockice modeliramo Bernoullijevom sluajnom varijablom
!
0
1
X=
,
1 p6 p6
gdje je p6 nepoznati parametar kojega emo procijeniti.
Pretpostavimo da smo kockicu bacili nezavisno sto puta zaredom. Realizaciju tih 100 bacanja modeliramo sluajnim vektorom (X1 , . . . X100 ) ije su komponente nezavisne i jednako distribuirane
kao sluajna varijabla X, tj. (X1 , . . . X100 ) je jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom p6 . Nadalje, pretpostavimo da se u tih 100 bacanja estica realizirala 17 puta.
To znai da je realizacija sluajnog uzorka (X1 , . . . X100 ) ureena 100-torka koja se sastoji od 17
jedinica i 83 nule. Slijedi da je relativna rekvencija pojavljivanja estice, broj 17/100, procjena
vjerojatnosti p6 . Analogno bismo postupali pri procjeni bilo koje od preostalih vjerojatnosti pi ,
i {1, . . . , 5}.
Primjer 4.36. (djelatnici.xls)
Varijabla dob baze podataka djelatnici.xls sadri informacije o godinama starosti za svakoga od
100 djelatnika iz reprezentativnog uzorka zaposlenika tvornice A. Oznaimo s vjerojatnost da
je sluajno odabrani djelatnik te tvornice stariji od 30 godina te procijenimo . Znamo da svaki
djelatnik te tvornice ima ili najvie 30 godina (oznaka 0) ili je stariji od 30 godina (oznaka
1) pa rezultat ispitivanja starosti u tom kontekstu moemo modelirati Bernoullijevom sluajnom
varijablom
!
0 1
X=
, [0, 1].
1
Prema tome, podatke iz varijable dob shvaamo kao jednu realizaciju jednostavnog sluajnog uzorka
(X1 , . . . , X100 ) iz te Bernoullijeve distribucije i na temelju te realizacije parametar procjenjujemo relativnom frekvencijom jedinica, tj. relativnom frekvencijom djelatnika iz uzorka koji su
stariji od 30 godina. Kako takvih djelatnika u uzorku ima 46, parametar procjenjujemo brojem
46/100 = 0.46.

4.3.2

Procjena oekivanja

Neka je (X1 , X2 , . . . , Xn ) jednostavni sluajni uzorak iz distribucije F , gdje je


R nepoznato oekivanje. Dakle, (X1 , X2 , . . . , Xn ) je vektor n. j. d. sluajnih
varijabli iz distribucije F . Pretpostavimo da varijanca distribucije F takoer
postoji i oznaimo je sa 2 .
Ako razmatramo problem procjene oekivanja, moemo iskoristiti aritmetiku
sredinu uzorka
n
1X
Xn =
Xi ,
n i=1

212

Procjena parametara

koja je nepristran i konzistentan procijenitelj za oekivanje. Naime,


E X n = ,

Var X n =

2
,
n

a konzistentnost slijedi iz slabog zakona velikih brojeva.


Primjer 4.37. Ocjenu znanja studenata nekog fakulteta na usmenom ispitu iz jednog kolegija
modeliramo diskretnom sluajnom varijablom X sa slikom R(X) = {1, 2, 3, 4, 5} i funkcijom distribucije F , gdje je nepoznato oekivanje koje elimo procijeniti. Pretpostavimo da od svih
studenata fakulteta koji su ocijenjeni na usmenom ispitu tog kolegija odabiremo reprezentativan
uzorak od 65 studenata. Frekvencije ocjena na tom uzorku dane su tablicom frekvencija 4.14.
ocjena

frekvencija

1
2
3
4
5

7
7
15
20
16

Tablica 4.14: Tablica frekvencija ocjena studenata na usmenom ispitu iz jednog kolegija.
Ocjene prikupljene na uzorku, predstavljene kao ureena 65-torka, ine jednu realizaciju jednostavnog sluajnog uzorka (X1 , . . . , X65 ) iz distribucije F . Procjenitelj za oekivanje od X jest
sluajna varijabla X 65 . Njezinu realizaciju na uzorku (x1 , . . . , x65 ) oznaimo s x65 . Prema tome,
procjena oekivanja sluajne varijable X na temelju tablice frekvencija 4.14 jest
x65 =

1 7 + 2 7 + 3 15 + 4 20 + 5 16
3.48.
65

Primjer 4.38. (kolokvij.xls)


U bazi podataka kolokvij.sta nalaze se rezultati dvaju kolokvija iz nekog kolegija (varijable kolokvij_1 i kolokvij_2) te ukupan broj bodova ostvaren na kolokvijima (varijabla bodovi_ukupno) za
reprezentativan uzorak od 70 studenata koji su pristupili tim kolokvijima. Na svakom od kolokvija
bilo je mogue ostvariti najvie 100 bodova. Dakle, na obama kolokvijima bilo je mogue ostvariti
najvie 200 bodova.
Usmjerimo se na ukupan broj bodova ostvaren na obama kolokvijima. Njega modeliramo kontinuiranom sluajnom varijablom X s funkcijom distribucije F , gdje je nepoznato oekivanje koje
elimo procijeniti.
Postignuti ukupni bodovi za promatrani uzorak od 70 studenata (podaci iz varijable bodovi_ukupno)
jedna su realizacija jednostavnog sluajnog uzorka (X1 , . . . , X70 ) iz distribucije F . Prema tome,
procjenitelj X 70 za oekivanje od X realizira se aritmetikom sredinom podataka iz varijable bodovi_ukupno, tj. procjena je oekivanja od X x70 96.9.
Primjer 4.39. (djelatnici.xls)
Varijabla placa_prije baze podataka djelatnici.xls sadri iznos godinje plae za reprezentativan uzorak od 100 djelatnika tvornice A. Godinju plau djelatnika te tvornice modeliramo kontinuiranom
sluajnom varijablom X s funkcijom distribucije F , gdje je nepoznato oekivanje koje elimo
procijeniti.

213

Statistika

Iznosi godinjih plaa za promatrani uzorak od 100 djelatnika (podaci iz varijable placa_prije)
jedna su realizacija jednostavnog sluajnog uzorka (X1 , . . . , X100 ) iz distribucije F . Prema tome,
procjenitelj X 100 za oekivanje od X realizira se aritmetikom sredinom podataka iz varijable
placa_prije, tj. procjena je oekivanja od X x100 24522.

4.3.3

Procjena varijance

Neka je (X1 , X2 , . . . , Xn ) jednostavni sluajni uzorak iz distribucije F , gdje je =


2 > 0 nepoznata varijanca. Dakle, (X1 , X2 , . . . , Xn ) je vektor n. j. d. sluajnih
varijabli iz distribucije F . Oznaimo s oekivanje te distribucije.
Ako razmatramo problem procjene varijance, moemo iskoristiti varijancu uzorka
n

Sn =

1X
(Xi X n )2 .
n i=1

Meutim, taj procjenitelj nije nepristran. Naime,


n

Sn =
=

1X
1X
(Xi X n )2 =
[(Xi ) (X n )]2
n i=1
n i=1
n
n
n
X
1X
1X
2
(Xi )2 +
(X n )2 (X n )
(Xi ).
n i=1
n i=1
n
i=1

Budui da je
n
X
(X n )2 = n(X n )2 ,

n
X
(Xi ) = n(X n ),

i=1

i=1

slijedi da je
2

Sn =

1X
(Xi )2 (X n )2 .
n i=1

Dakle,
2

E S n =

1X
1
2
E [(Xi )2 ] E [(X n )2 ] = n 2
,
n i=1
n
n

tj.
2

E S n =

n1
.
n

Ako napravimo malu korekciju varijance uzorka i definiramo novog procjenitelja,


korigiranu varijanca uzorka
n

Sn2 =

1 X
(Xi X n )2 ,
n 1 i=1

214

Procjena parametara

njegovo oekivanje bit e upravo jednako varijanci obiljeja koje prouavamo, pa


emo tako dobiti zadovoljeno svojstvo nepristranosti.
Zaista,


n
2
2
E Sn = E
S
= .
(4.4)
n1 n
Moe se pokazati (vidi npr. [21]) da je Sn2 ujedno i konzistentan procjenitelj.
Primjer 4.40. (kolokvij.xls)
Neka je X diskretna sluajna vrijabla iz primjera 4.38 kojom smo modelirali ukupan broj bodova
studenta postignutih na dvama kolokvijima iz nekog kolegija. Znamo da je procjena oekivanja od
X dana s x70 96.9. Za procjenu varijance koristimo standardne procjenitelje: varijancu uzorka
2
2 . Za realizaciju uzorka iz funkcije distribucije od X, danu
S 70 i korigiranu varijancu uzorka S70
2
u varijabli bodovi_ukupno, S 70 realizira se procjenom
s270 = 43.56,
2 procjenom
a S70

s270 = 44.19.

Primjer 4.41. (djelatnici.xls)


Standardni tablini kalkulatori i programski paketi za statistiku analizu imaju ugraenu funkciju
za procjenu varijance definiranu na temelju korigirane varijance uzorka, tj. na temelju procjeni2 . Procijenimo na taj nain varijancu neprekidne sluajne varijable X kojom modeliramo
telja Sn
godinju plau zaposlenika u jednoj tvornici (primjer 4.39). Za zabiljeene vrijednosti sluajne
varijable X na uzorku od 100 zaposlenika te tvornice (varijabla placa_prije) korigirana varijanca
2
uzorka S100
realizira se procjenom s2100 26069208.1 = 5105.82 .

4.3.4

Procjena funkcije distribucije

Neka je (X1 , X2 , . . . , Xn ) jednostavni sluajni uzorak iz nepoznate funkcije distribucije F sluajne varijable X. Statistiki model takvog sluajnog uzorka ne moemo
smatrati parametarskim s obzirom da familija dozvoljenih funkcija distribucije nije
indeksirana nepoznatim parametrom, nego je potpuno neodreena. Takav statistiki model zvat emo neparametarski.
U takvom modelu opisat emo jedan nain procjene funkcije distribucije F . Preciznije, za svaki pojedini x R procjenu vrijednosti funkcije distribucije, F (x).
S obzirom da je F (x) po definiciji P {Xi x}, za svaki i {1, . . . , n} i za dani x
zapravo imamo problem procjene vjerojatnosti uspjeha (uspjeh znai da se realizirao
dogaaj {Xi x}) pa se moemo posluiti rezultatima iz procjene proporcije.

215

Statistika

Dakle, neka je x fiksan realan broj, a F funkcija distribucije sluajne varijable X.


Definirajmo sluajnu varijablu
(
1,Xx
I{Xx} =
0 , X > x.

Njezina je distribucija:
I{Xx} =

0
1
1 F (x) F (x)

!
,

F (x) [0, 1].

Uoimo da ovdje F (x) igra ulogu parametra distribucije sluajne varijable I{Xx} .
Iz problema procjene proporcije znamo da je dobar procjenitelj za parametar Bernoullijeve distribucije relativna frekvencija jedinice, a u sluaju varijable I{Xx} to
je relativna frekvencija skupa {X x}. Oznaimo
n

f{Xx}
1X
=
I{Xi x} .
F (x) =
n
n i=1
Tada je
E(F (x)) = F (x)
za svaki pojedini x R i
Var (F (x)) =

F (x)(1 F (x))
,
n

pa moemo govoriti o nepristranosti i konzistentnosti procjenitelja F (x) za svaki


pojedini x R. Tako definiran procjenitelj funkcije distribucije na temelju realizacije jednostavnog sluajnog uzorka zove se empirijska funkcija distribucije.

Primjer 4.42. (djelatnici.xls)


Diskretna numerika varijabla rukovodstvo baze podataka djelatnici.xls iz primjera 4.5 prima vrijednosti iz skupa {0, 1, . . . , N }, gdje je N najvei mogui broj godina radnog staa koje djelatnik
moe provesti na rukovodeoj poziciji. Frekvencije i relativne frekvencije zabiljeenih vrijednosti
varijable rukovodstvo za djelatnike iz promatranog uzorka dane su u tablici 4.6. Procijenimo
funkciju distribucije diskretne sluajne varijable X kojom modeliramo varijablu rukovodstvo. U tu
svrhu promotrimo kumulativne frekvencije zabiljeenih vrijednosti te varijable (tablica 4.15).

216

Procjena parametara
rukovodstvo

frek.

kumulativna frek.

rukovodstvo

frek.

kumulativna frek.

0
1
2
3
4
5
6
7

20
15
13
10
12
10
1
3

0.20
0.35
0.48
0.58
0.7
0.8
0.81
0.84

8
9
10
11
12
13
14
17

3
3
2
2
1
1
2
2

0.87
0.9
0.92
0.94
0.95
0.96
0.98
1

Tablica 4.15: Tablica frekvencija i kumulativnih frekvencija svih zabiljeenih vrijednosti varijable
rukovodstvo.

Iz tablice 4.15, preciznije, iz stupca s kumulativnim frekvencijama, slijedi da je procjena funkcije


distribucije sluajne varijable X, tj. njezina empirijska funkcija distribucije, definirana izrazom

0 , x<0

0.2 , 0 x < 1

0.35 , 1 x < 2

0.48 , 2 x < 3
f{Xx}
F (x) =
= 0.58 , 3 x < 4

100

0.7 , 4 x < 5

..
.. ..

. .
.

1 , x 17.
Graf funkcije F (x) prikazan je na slici 4.14.
y

0.8
0.7
0.58
0.48
0.35
0.2

-1

10 11 12 13 14 15 16 17 18 19

Slika 4.14: Empirijska funkcija distribucije sluajne varijable X iz primjera 4.44.

217

Statistika

Primjer 4.43. Funkcija distribucije standardne normalne sluajne varijable definirana je pravilom
Zx
2
1
et /2 dt, x R.
F (x) =
2

Graf te funkcije prikazan je na slici 2.20 u drugom poglavlju. U ovom emo primjeru na temelju simuliranih vrijednosti iz standardne normalne distribucije (tj. simulirane realizacije ndimenzionalnog jednostavnog sluajnog uzorka iz standardne normalne distribucije) ilustrirati ponaanje procjene F za F u ovisnosti o veliini uzorka.
Na temelju jedne simulacije 10 vrijednosti iz te distribucije dobili smo graf funkcije F (x) prikazan
na slici 4.15 (stepenasti graf ).
y
1
9
10
4
5
7
10
3
5
1
2
2
5
3
10
1
5
1
10

-4

-2

Slika 4.15: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 10) standardne
normalne sluajne varijable.
Grafovi empirijskih funkcija distribucije standardne normalne sluajne varijable za 30 i 100 simuliranih vrijednosti prikazani su na slikama 4.16 i 4.17.
y
1.0
0.8
0.6
0.4
0.2

-4

-2

Slika 4.16: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 30) standardne
normalne sluajne varijable.

218

Procjena parametara
y
1.0
0.8
0.6
0.4
0.2

-4

-2

Slika 4.17: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 100) standardne
normalne sluajne varijable.

Koritenjem nekog programskog paketa simulirajte 1000 podataka iz standardne normalne distribucije i nacrtajte graf empirijske funkcije distribucije. Usporedite ju sa stvarnom funkcijom
distribucije.

Primjer 4.44. (djelatnici.xls)


Procijenimo funkciju distribucije neprekidne sluajne varijable X iz primjera 4.39 kojom modeliramo godinju plau djelatnika jedne tvornice. Varijabla placa_prije sadri mnogo razliitih
realizacija sluajne varijable X. Uoimo da su frekvencije svih realizacija male. Empirijska funkcija distribucije temeljena na svih 77 razliitih realizacija sluajne varijable X moe se lako oitati
koritenjem relativnih kumulativnih frekvencija. Tako, npr. F (18400) = 0.05 (tablica 4.16).

plaa

frekvencija

kumulativna frekvencija

16000
18100
18300
18400
..
.
24500
24600
..
.
42400

1
1
1
2
..
.
1
4
..
.
1

1
2
3
5
..
.
57
61
..
.
100

Tablica 4.16: Tablica kumulativnih frekvencija plaa djelatnika iz primjera 4.39.

219

Statistika

4.3.5

Procjena parametara u jednostavnoj linearnoj regresiji

Ideja za procjenu parametara u linernom regresijskom modelu (poglavlje 4.2.3) temelji se na jednostavnom zahtjevu da treba minimizirati sumu kvadrata odstupanja
eksperimentalnih od teorijskih vrijednosti.
Neka je (x1 , y1 ), . . . , (xn , yn ) dana realizacija sluajnog uzorka iz regresijskog problema. Onda su y1 , . . . , yn tzv. eksperimentalne vrijednosti, tj. realizacije sluajnog
vektora (Y1 , . . . , Yn ) kojega elimo opisati modelom
Yi = axi + b + i , i = 1, . . . , n,

(4.5)

kao to je navedeno u poglavlju 4.2.3. S obzirom da i predstavljaju sluajne varijable koje opisuju greku modela, teorijske su vrijednosti y(xi ) = axi + b. Jedan
procjenitelj za nepoznati vektorski parametar (a, b) moe se dobiti minimizacijom
izraza
n
X
(y(xi ) yi )2
S(a, b) =
i=1

po (a, b) R R.
Uvedimo oznake:

x1

x2
x=
..
.
xn

..
, = [a, b] , y = [y1 , . . . , yn ] .
.
1

Rjeenje je toga minimizacijskog problema


= (x x)1 x y.

(4.6)

Uvrstimo li sluajni vektor Y = [Y1 , . . . Yn ] u izraz za umjesto y, imamo procjenitelja za nepoznati parametar .
Moe se pokazati da je tako definiran procjenitelj za nepristran. Za dokaze i ostala
svojstva procjenitelja vidi npr. [21] ili [29].
Primjer 4.45. (automobili.xls)
Baza podataka automobili.xls opisana je u primjeru 4.12. U istom primjeru opisano je i znaenje izmjerenih vrijednosti varijabli potrosnja i mjerenje u jednostavnom linearnom regresijskom
modelu: x1 , . . . x300 prosjene su potronje promatranog tipa automobila pri vonji po autocesti brzinom 110 km/h (varijabla potrosnja), a y1 , . . . , y300 realizacije su sluajnog vektora (Y1 , . . . , Y300 )

220

Procjena parametra pouzdanim intervalom

kojim modeliramo rezultate mjerenja nekog parametra na tehnikom pregledu tog automobila nakon te vonje, a za kojega se pretpostavlja da bi kod tehniki ispravnog automobila trebao biti
linearno povezan s prosjenom potronjom automobila pri velikim brzinama. Uvrtavanjem podataka iz baze automobili.xls u izraz 4.6 i primjenom nekog statistikog softvera moemo dobiti
procjene parametara a i b regresijskog modela 4.5 u ovom primjeru:
b
a = 2.138,

b
b = 2.349.

Slijedi da modelom odreen rezultat mjerenja promatranog parametra na tehnikom pregledu tog
automobila nakon vonje u opisanim uvjetima raunamo pomou pravila
y(x) = b
ax + b
b = 2.138x + 2.349.

4.4

Procjena parametra pouzdanim intervalom

U ovom poglavlju pretpostavit emo da je statistiki model za podatke parametarski s jednodimenzionalnim parametrom kojega elimo procijeniti. Parametar
procjenjujemo koritenjem procjenitelja T . S obzirom da je parametar jednodimenzionalan, procjenitelj je sluajna varijabla. Procjena je na temelju podataka
samo jedna realizacija procjenitelja. Koristei distribuciju procjenitelja u danom
statistikom modelu mogue je dobiti i druge informacije o stvarnoj vrijednosti
procijenjenog parametra, ne samo jedan broj koji predstavlja procjenu.
U ovom poglavlju opisat emo koncept procjene parametra pouzdanim intervalom i interpretaciju takve procjene te ilustrirati procjenu pouzdanim intervalom na
nekoliko primjera.
Pouzdani interval za procjenu parametra po svojoj definiciji nije interval s realnim
brojevima kao granicama nego interval kojemu su granice sluajne varijable pa ga
moemo zvati sluajni interval.
Definicija 4.5. Neka je h0, 1i, a sluajni vektor (X1 , . . . , Xn ) s distribucijom
iz parametarske familije P = {F : R} neka odreuje statistiki model. Ako
postoje dva procjenitelja D = d(X1 , . . . , Xn ) i G = g(X1 , . . . , Xn ) za paramear sa
svojstvima:
d(x1 , . . . , xn ) g(x1 , . . . , xn ), za sve (x1 , . . . , xn ) R(X1 , . . . , Xn ),
P {D G} , za sve ,
onda kaemo da je sluajni interval [D, G] pouzdani interval za pouzdanosti .

221

Statistika

Kao to se moe prepoznati iz definicije, pouzdani interval odreuje se na temelju


zahtjeva da se stvarna vrijednost parametra nalazi u sluajnom intervalu s vjerojatnou barem .
Ako na temelju podataka izraunamo realizacije procjenitelja D i G koji su granice
sluajnog intervala, dobit emo obian interval s realnim brojevima kao granicama.
Dakle, realizacija sluajnog intervala obian je interval realnih brojeva. Iz definicije
pouzdanog intervala pouzdanosti jasno je da e, pod pretpostavkom adekvatnosti
statitikog modela, u priblino 100 % sluajeva izraunati interval realnih brojeva
sadravati stvarnu vrijednost parametra.
Dakle, interval pouzdanosti jest sluajni interval, tj. granice su mu sluajne varijable. Jedna realizacija intervala pouzdanosti , odreena na osnovu podataka
(realizacije sluajnog vektora statistikog modela), obian je interval realnih brojeva. Uobiajeno je u praksi i tu realizaciju pouzdanog intervala takoer zvati
pouzdani interval. Meutim, vano je znati razliku izmeu pouzdanog intervala kao
sluajnog intervala i njegove realizacije - obinog intervala realnih brojeva.
U nastavku ilustriramo postupak odreivanja pouzdanih intervala na nekoliko primjera. Zainteresirani itatelj vie o tom problemu moe pronai u literaturi koja
opirnije obrauje teme iz matematike statistike kao npr. [2], [9], [16], [21], [22],
[24].

4.4.1

Procjena oekivanja pouzdanim intervalom za velike


uzorke

Neka je (X1 , . . . , Xn ) jednostavni sluajni uzorak iz zadane distibucije, oznaimo je


F , za koju je varijanca poznata i iznosi 2 , a oekivanje je nepoznato i elimo
ga procijeniti iz jedne realizacije uzorka.
Aritmetika sredina uzorka X n jest jedan nepristran i konzistentan procjenitelj za
oekivanje. Osim toga, na temelju centralnog graninog teorema poznato je da
standardizirana aritmetika sredina, tj.
Xn
,
n

ima asimptotski standardnu normalnu distribuciju. Oznaimo sa Z N (0, 1). Koritenjem tih rezultata konstruirat emo pouzdani interval za oekivanje na temelju
jednostavnoga sluajnog uzorka iz distribucije F .

222

Procjena parametra pouzdanim intervalom

Neka je h0, 1i izabrana pouzdanost i z broj za koji vrijedi


P {|Z| z } = .
Uoimo da vrijednost predstavlja povrinu ispod grafa funkcije gustoe standardne
normalne distribucije nad intervalom [z , z ] (slika 4.18), tj.
1
P {|Z| z } =
2

Zz

ex

/2

dx = .

f (x)

P {|Z| z } =

x
z
z
Slika 4.18: Vjerojatnost P {|Z| z }.

S obzirom da distribuciju od X n n moemo dobro aproksimirati standardnom


normalnom distribucijom za velike n, vrijedi:




Xn

P z
n z = P X n z X n + z
.

n
n
Dakle, vrijedi:



P X n z
, X n + z
,
n
n
h
i
pa sluajni interval X n z n , X n + z n moemo smatrati pouzdanim intervalom za pouzdanosti ukoliko imamo veliku veliinu uzorka n.


Postupak procjene oekivanja pouzdanim intervalom na temelju realizacije (x1 , . . . , xn )


jednostavnog sluajnog uzorka iz distribucije s varijancom 2 , tj. standardnom devijacijom , moemo opisati sljedeim koracima:

223

Statistika

- odrediti broj z za koji vrijedi da je P {|Z| z } = , gdje je Z N (0, 1),


- izraunati interval po formuli



xn z , xn + z .
n
n

(4.7)

Interval izraunat tim postupkom u priblino 100% sluajeva sadrat e stvarnu


vrijednost oekivanja .
U praksi najee ne znamo stvarnu vrijednost standardne devijacije . S obzirom
da je taj rezultat izveden za velike uzorke, moe se takoer dokazati da e koritenje procjenitelja za standardnu devijaciju (korijena korigirane varijance uzorka)
umjesto standardne devijacije u izvodu formule za pouzdani interval, dati analognu
asimptotsku distribuciju. Iz tog se razloga u praksi koristi procjena standardne
devijacije umjesto stvarne vrijednosti standardne devijacije ako je ona nepoznata.
Primjer 4.46. (kolokvij.xls)
Baza podataka kolokvij.xls ukratko je opisana u primjeru 4.38. Procijenimo intervalom pouzdanosti
= 0.95 oekivanje diskretne sluajne varijable X kojom modeliramo ukupan broj bodova ostvaren
na tim dvama kolokvijima. Da bismo izraunali realizaciju traenog intervala pouzdanosti, trebaju
nam sljedee vrijednosti
n = 70,

x70 96.9,

s70 44.19,

z0.95 1.96,

gdje su x70 i s70 redom procjene oekivanja i standardne devijacije sluajne varijable X. Koritenjem izraza 4.7 slijedi da je traeni interval
[86.36, 107.44].
Procjena istog oekivanja intervalom pouzdanosti = 0.97 zahtijeva poznavanje vrijednosti z0.97
2.17. Traena je realizacija intervala pouzdanosti = 0.97 interval
[85.19, 108.61].
Uoimo da se za veu vrijednost interval pouzdanosti realizira irim intervalom realnih brojeva
nego za manju vrijednost .
Primjer 4.47. (djelatnici.xls)
Procijenimo intervalom pouzdanosti = 0.97 oekivanje neprekidne sluajne varijable iz primjera
4.39 kojom modeliramo godinju plau djelatnika jedne tvornice (varijabla placa_prije). Da bismo
izraunali realizaciju traenog intervala pouzdanosti, trebaju nam sljedee vrijednosti:
n = 100,

x100 24522,

s100 5105.8,

z0.97 2.17,

gdje su x100 i s100 redom procjene oekivanja i standardne devijacije sluajne varijable X odreene
u primjerima 4.39 i 4.41. Koritenjem izraza 4.7 slijedi da je traeni interval
[23414, 25630].

224

4.4.2

Procjena parametra pouzdanim intervalom

Procjena proporcije pouzdanim intervalom za velike


uzorke

U statistikom modelu koji smo nazvali "problem proporcije" zakljuujemo o vjerojatnosti da se realizira broj 1 na temelju n-dimenzionalnoga jednostavnog sluajnog
uzorka iz Bernoullijeve distribucije.
Nepristran i konzistentan procjenitelj koji u tu svrhu koristimo jest relativna frekvencija jedinice, tj.
f1
.
n
Slino prethodnom poglavlju, centralni granini teorem ovdje omoguuje odreivanje asimptotske distribucije standardizirane relativne frekvencije jedinice, pa emo
na temelju tog rezultata konstruirati pouzdani interval za proporciju.
Neka je (X1 , . . . , Xn ) jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom h0, 1i. Tada je
n
1X
f1
Xi .
=
n
n i=1
Osim toga, f1 B(n, ), pa je
E

f1
f1
(1 )
= , Var
=
.
n
n
n

Prema centralnom graninom teoremu sada slijedi da sluajna varijabla

f1

npn
(1 )

ima asimptotski standardnu normalnu distribuciju. Oznaimo sa Z N (0, 1) i z


odaberimo kao u prethodnom poglavlju, tj. P {|Z| z } = . Sada vrijedi:

(
)
f1



P n p n
z .

(1 )
Nejednadba


f1



n
np
z

(1 )
bit e zadovoljena ako je [1 , 2 ], gdje su 1 i 2 rjeenja jednadbe
2 (n + z2 ) (2f1 + z2 ) +

f12
= 0.
n

225

Statistika

Pod pretpostavkom da je n velik, u rjeenjima je te kvadratne jednadbe n mnogo


vei od z pa se zanemarivanjem lanova koji sadre z2 dobije:
f1
1
z
n

1 f1
f1
f1
(1 ), 2
+ z
n n
n
n

1 f1
f1
(1 ).
n n
n

Za danu je realizaciju toga jednostavnog sluajnog uzorka uobiajeno relativnu frekvenciju jedinice oznaiti s p, a relativnu frekvenciju nule s q. Koritenjem takvih
oznaka i dobivenih rezultata navodimo postupak za raunanje pouzdanog intervala
za proporciju na temelju realizacije jednostavnoga sluajnog uzorka iz Bernoullijeve
distribucije:
odrediti broj z za koji vrijedi da je P {|Z| z } = , gdje je Z N (0, 1),
izraunati interval po formuli:
"
p z

pq
, p + z
n

#
pq
.
n

(4.8)

Primjer 4.48. Neka je X diskretna sluajna varijabla kojom modeliramo ocjene znanja studenata
jednog fakulteta na usmenom ispitu iz nekog kolegija (primjer 4.37). Procijenimo intervalom
pouzdanosti = 0.95 proporciju studenata koji usmeni ispit polau ocjenom izvrstan. Ovdje se
realizacija ocjene izvrstan smatra "uspjehom", a realizacija bilo koje druge ocjene "neuspjehom",
pa iz tablice 4.14 slijedi da je
16
49
16
, q = 1
=
.
p =
65
65
65
Kako je n = 65, a z0.95 1.96, primjenom izraza (4.8) slijedi da je realizacija traenog intervala
pouzdanosti interval
[0.14, 0.35].
Primjer 4.49. (kolokvij.xls)
Neka je X diskretna sluajna varijabla kojom modeliramo ukupan broj bodova studenta ostvaren na
dvama kolokvijima iz nekog kolegija (primjer 4.38). Procijenimo intervalom pouzdanosti = 0.95
proporciju studenata koji su na kolokvijima ukupno ostvarili barem 100 od moguih 200 bodova.
Ovdje se ukupan broj bodova vei ili jednak 100 smatra "uspjehom", a ukupan broj bodova manji
od 100 "neuspjehom", pa iz podataka dostupnih u varijabli bodovi_ukupno slijedi da je
p =

39
0.56,
70

q = 1

39
31
=
0.44.
70
70

Kako je n = 70, a z0.95 1.96, primjenom izraza 4.8 slijedi da je realizacija traenog intervala
pouzdanosti interval
[0.44, 0.67].
Primjer 4.50. (djelatnici.xls)
Neka je X neprekidna sluajna varijabla iz primjera 4.39 kojom modeliramo godinju plau djelatnika jedne tvornice. Procijenimo intervalom pouzdanosti = 0.98 proporciju djelatnika koji

226

Testiranje statistikih hipoteza

godinje zarauju vie od 30000. Ovdje se realizacija godinje plae vee od 30000 smatra "uspjehom", a realizacija godinje plae manje ili jednake 30000 "neuspjehom". Iz podataka za varijablu
placa_prije slijedi da je
p = 0.16, q = 1 0.16 = 0.84.
Budui da je n = 100, a z0.98 2.33, primjenom izraza 4.8 slijedi da je traeni interval
[0.075, 0.245].

4.5

Testiranje statistikih hipoteza

Statistika hipoteza slutnja je koja se odnosi na statistiki model. Cilj je testiranja hipoteze odluiti o istinitosti ili neistinitosti te slutnje.
Primjer 4.51. O proporciji puaa izabranog podruja moe se zakljuivati na temelju reprezentativnog uzorka koji predstavlja jednu realizaciju jednostavnog sluajnog uzorka iz Bernoullijeve
distribucije s parametrom h0, 1i. Nepoznati je parametar upravo proporcija puaa populacije. Jedna je slutnja/hipoteza koju moemo testirati npr. da je proporcija puaa u toj populaciji
manja od 20%.

Postupak testiranja hipoteza uvijek poinje prevoenjem slutnje koja nas zanima u
statistiku hipotezu. To znai formiranje statistikog modela u okviru kojega emo
zakljuivati i izricanje hipoteze u terminima koji se odnose na odabrani statistiki
model. S obzirom da je statistiki model P familija funkcija distribucije koje su
dozvoljene prilikom zakljuivanja o zadanom problemu, oigledno je da postavljena
hipoteza zapravo odreuje jedan podskup od P. U prethodnom je primjeru statistiki model odabran, a hipotezu moemo iskazati kao podskup distribucija modela
za koji vrijedi nejednakost 0.2.
Statistiku hipotezu standardno oznaavamo s H. Testirati hipotezu znai donijeti
odluku o tome hoemo li H odbaciti ili ne.
Odluku u postupku testiranja hipoteza donosimo na temelju odabranog kriterija i
realizacije uzorka. Odabrati kriterij zapravo znai definirati pravilo za odbacivanje
hipoteze. S obzirom da se odluka donosi na temelju realizacije sluajnog vektora
(X1 , . . . , Xn ) statistikog modela, pravilo mora biti iskazano u terminima tog sluajnog vektora . U tu svrhu koristimo pojam "statistika".
Definicija 4.6. Neka je (X1 , . . . , Xn ) sluajni vektor statistikog modela P na temelju kojega donosimo zakljuke i neka je t : R(X1 , . . . , Xn ) Rk zadana funkcija.
Sluajni vektor/varijablu T = t(X1 , . . . , Xn ) zovemo statistika za taj statistiki
model.

227

Statistika

Uoimo da je i procjenitelj jedna statistika, ali s dodatnim zahtjevom na skup


vrijednosti funkcije t.
Slino kao kod definiranja pouzdanih intervala za procjenu nepoznatog parametra,
kod odabira pravila za testiranje hipoteza koristimo svojstva statistike kao sluajnog vektora/varijable, a prilikom donoenja odluke koristimo odabranu statistiku i
pravilo te realizaciju statistike na podacima.
Pravilo po kojemu odbacujemo postavljenu hipotezu podijelit e skup svih moguih
realizacija sluajnog vektora statistikog modela na dva disjunktna dijela. Uobajeno ih oznaavamo s Cr i Crc , pri emu je Cr dio koji odgovara odbacivanju
postavljene hipoteze i kojega zovemo kritino podruje.
S obzirom da postavljena hipoteza H izdvaja podskup distribucija iz statistikog
modela P, uobiajeno je uvesti i drugu hipotezu u postupku testiranja. Ta hipoteza
obuhvatit e sve one distribucije koje nisu sadrane u H. Zbog toga esto govorimo o
testiranju dviju hipoteza u statistikom testu. Jednu od njih zovemo nul-hipoteza
i oznaavamo s H0 , a drugu alternativna hipoteza i oznaavamo s H1 . Alternativna hipoteza jest ona koju prihvaamo u sluaju odbacivanja nul-hipoteze. Za
statistiki model P vrijedi:
P = H0 H1 .

4.5.1

Pogreke statistikog testa

Odluka koja je donesena statistikim testom moe biti pogrena ili ispravna. Pritom
se mogu dogoditi dva tipa pogrene odluke:
pogreka I. tipa:
pogreka II. tipa:

odbaciti H0 ako je ona istinita,


ne odbaciti H0 ako je H1 istinita.

Vjerojatnosti pogreke prvog tipa i pogreke drugog tipa ovise o stvarnoj distribuciji sluajne varijable o kojoj testiramo hipotezu, tj. te su vjerojatnosti zapravo
funkcije koje distribuciji iz P pridruuju broj, ali one nisu definirane na istoj domeni. Vjerojatnost pogreke prvog tipa moe se raunati za svaku distribuciju iz
H0 , dok se vjerojatnost pogreke drugog tipa rauna za svaku distribuciju iz H1 .
Ilustrirajmo taj postupak na primjeru.
Primjer 4.52. Pretpostavimo da elimo zakljuivati o proporciji puaa izabranog podruja na
temelju jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije s parametrom h0, 1i (primjer 4.51). Neka je P = {F : F Bernoullijeva, h0, 1i} pripadni statistiki model. Taj model
parametarski je, pa i hipoteze moemo izraavati u terminima parametra. Imamo slutnju da je

228

Testiranje statistikih hipoteza

proporcija puaa manja ili jednaka 20%. Statistika hipoteza koja opisuje ovu slutnju jest podskup
od P za koji vrijedi 0.2. Dakle,
H0 : 0.2,
H1 : > 0.2.
Za taj parametarski model podjela P na H0 i H1 ekvivalentna je podjeli skupa dozvoljenih vrijednosti parametra h0, 1i na dva dijela: h0, 0.2] i h0.2, 1i. Vjerojatnost pogreke prvog tipa i vjerojatnost pogreke drugog tipa sada moemo promatrati kao funkcije od nepoznatog parametra. Ako je
odabran postupak za odbacivanje nul-hipoteze, znai da je definirano kritino podruje Cr , pa se
te funkcije mogu definirati na sljedei nain:
- vjerojatnost pogreke prvog tipa :
: h0, 0.2] [0, 1], () = P {(X1 , . . . Xn ) Cr },
- vjerojatnost pogreke drugog tipa :
: h0.2, 1i [0, 1], () = P {(X1 , . . . Xn ) Crc }.

U prehodnom primjeru uoimo da se funkcija moe prikazati kao


() = 1 P {(X1 , . . . Xn ) Cr }.
Objedinjeni prikaz obiju funkcija vjerojatnosti pogreke postie se definiranjem
funkcije jakosti testa.
Funkcija jakosti testa, u oznaci , definirana je za svaku distribuciju iz P (odnosno za svaku dozvoljenu vrijednost parametra ako je statistiki model parametarski) kao
(F ) = PF {(X1 , . . . , Xn ) Cr }, F P,
odnosno za parametarski statistiki model
() = P {(X1 , . . . , Xn ) Cr },

Uoimo da je
(F ) = (F ),
(F ) = 1 (F ),

F H0 ,
F H1 .

Ilustrirajmo primjerom funkciju jakosti testa i njezinu vezu s vjerojatnostima pogreke.


Primjer 4.53. U problemu zakljuivanja o proporciji puaa na nekom podruju (primjeri 4.51
i 4.52) elimo testirati hipotezu da je proporcija puaa manja ili jednaka 20%. Statistiki model
i hipoteze opisani su u primjeru 4.52:
H0 : 0.2,
H1 : > 0.2.
Odaberimo sljedee pravilo odbacivanja nul-hipoteze:

229

Statistika
Cr : odbacit emo nul-hipotezu ako je relativna frekvencija puaa u uzorku vea od 22%.

Uz standardnu oznaku f1 za frekvenciju puaa, funkcija je jakosti za takav test dana izrazom


f1
> 0.22 .
() = P {(X1 , . . . , Xn ) Cr } = P
n
Pod pretpostavkam statistikog modela znamo da je f1 B(n, ). Dakle, vrijedi:


X n
f1
k (1 )nk .
P
> 0.22 = P {f1 > 0.22n} =
k
n
k>0.22n
Graf te funkcije za n=100 prikazan je slikom 4.19.

0.8
0.6
0.4
0.2
0.2

0.4

0.6

0.8

Slika 4.19: Funkcija jakosti testa za kritino podruje

f1
n

> 0.22.

S obzirom da je (0.2) = 0.261067, vidimo da je maksimalna vjerojatnost pogreke prvog tipa


max () = 0.261067,

H0

dok je maksimalna vjerojatnost pogreke drugog tipa za tako definirano kritino podruje
max () = 1 0.261067 = 0.738933

H1

Odabirom drugog kritinog podruja tako da granicu za odbacivanje nul-hipoteze pomaknemo u


vee vrijednosti, npr.
Cr : odbacit emo nul-hipotezu ako je relativna frekvencija puaa u uzorku vea od 30%,
moemo smanjiti maksimalnu vjerojatnost pogreke prvog tipa, ali e se poveati maksimalna
vjerojatnost pogreke drugog tipa. Grafovi funkcija jakosti testa za oba navedena kritina podruja
i n = 100 prikazani su slikom 4.20.

230

Testiranje statistikih hipoteza


y

0.8
f1 n > 0.22

0.6

f1 n > 0.3

0.4
0.2
0.2

0.4

0.6

0.8

Slika 4.20: Funkcije jakosti testa za kritina podruja

f1
n

> 0.22 i

f1
n

> 0.3 .

Za novo je kritino podruje


max () = 0.00605934

H0

max () = 1 0.00605934 = 0.993941.

H1

Poveanje maksimalne vjerojatnosti jedne pogreke ako elimo smanjiti maksimalnu


vjerojatnost druge pogreke, ilustrirano prethodnim primjerom, nije neuobiajno.
Dapae, moe se pokazati da je nemogue odabrati kritino podruje koje bi minimiziralo maksimalnu vjerojatnost obiju pogreaka po svim moguim kritinim
podrujima. Zbog toga se odabir kritinog podruja vri tako da se doputa istraivau izbor maksimalne vjerojatnosti pogreke prvog tipa koju eli prihvatiti. Te
se vrijednosti uglavnom biraju izmeu brojeva 0.01, 0.05 ili 0.1. Odabrana maksimalna vjerojatnost pogreke prvog tipa zove se razina znaajnosti testa ili nivo
signifikantnosti testa i standardno oznaava s . Uz izabranu razinu znaajnosti
testa, test se dizajnira uz nastojanje da se maksimalna vjerojatnost pogreke drugog tipa uini to manjom. Dakle, maksimalna je vjerojatnost pogreke drugog tipa
temelj za teorijsku analizu testa i odabir test-statistike, no najee se ne iskazuje
u primjeni testa. Primjena se oslanja na injenicu da je odabrani test kreiran kao
optimalan za dani skup pretpostavki.
Uzimajui u obzir da emo biti u mogunosti birati maksimalnu vjerojatnost pogreke prilikom odbacivanja nul-hipoteze, to je informacija koju u primjeni testa
referiramo. Npr. rei emo da odbacujemo nul-hipotezu na nivou znaajnosti , tj. da odbacujemo nul-hipotezu uz vjerojatnost najvie da smo pri tome
pogrijeili. Ako pravilo testa primijenjeno na podatke sugerira da ne odbacimo
nul-hipotezu, prilikom primjene testa obino nemamo dostupnu informaciju koliko

231

Statistika

iznosi maksimalna vjerojatnost da smo pogrijeili. Zato emo tada rei kako podaci
ne podupiru tvrdnju da H0 treba odbaciti.
Takav neravnopravan odnos izmeu nulte i alternativne hipoteze prilikom kreiranja
statistikog testa upuuje na injenicu da nije svejedno kako smo izbrali nultu i
alternativnu hipotezu i pripadni test. Ukoliko je mogue, uputno je u primjeni
birati statistiki test kojemu alternativna hipoteza odgovara tvrdnji koju elimo
dokazati.
Iako je teorija odabira optimalne test-statistike vrlo razvijena (vidi npr. [18], [2],
[21]) ovdje se neemo baviti metodama za odabir optimalnih statistika za testiranje
hipoteza odabranog modela. U nastavku samo ilustriramo intuitivnu metodu odabira postupka za testiranje hipoteza na nekoliko primjera bez analize maksimalne
vjerojatnosti pogreke drugog tipa. Zainteresirani itatelj vie o tom problemu moe
pronai u literaturi koja opirnije obrauje teme iz matematike statistike kao npr.
[2], [9], [16], [21], [22], [24].

4.5.2

Testiranje hipoteze o oekivanju za velike uzorke

U ovom poglavlju ilustrirat emo jedan od statistikih testova koji moemo koristiti
prilikom testiranja hipoteza o iznosu oekivanja distribucije sluajne varijable na
temelju koje je formiran statistiki model jednostavnoga sluajnog uzorka. Problem
ilustriramo sljedeim primjerom.
Primjer 4.54. Pretpostavimo da elimo provjeriti je li oekivana vrijednost vremena ekanja u
redu studentske menze u vrijeme ruka vea od pet minuta. U tu svrhu, od sto sluajno izabranih
studenata koji odlaze na ruak u studentsku menzu prikupljamo podatke o vremenu ekanja. Tako
dolazimo do podataka (x1 , . . . , x100 ). Na temelju tih podataka aritmetikom sredinom procijenili
smo oekivanje sluajne varijable iz koje potjeu podaci - procjena je iznosila 6.5 minuta. Znajui
iz prethodnih prouavanja te sluajne varijable da je njezina varijanca 25, elimo testirati slutnju
da je oekivano vrijeme ekanja vee od 5 minuta.

Test kojim moemo testirati takvu slutnju izvest emo na temelju statistikog modela jednostavnog sluajnog uzorka (X1 , . . . , Xn ) iz distribucije F kojoj je varijanca
poznata i iznosi 2 , a oekivanje jest nepoznato.
Postavimo nultu i alternativnu hipotezu na sljedei nain:
H0 : = 0
H1 : > 0 .

232

Testiranje statistikih hipoteza

Ako je H0 istinita hipoteza, a uzorak velik, onda je distribucija artmetike sredine


uzorka priblino normalna s oekivanjem 0 i varijancom 2 /n (centralni granini
teorem!). Dakle, pod pretpostavkom je istinitosti nul-hipoteze distribucija od
Z0 =

X n 0
n

priblino standardna normalna i oekuje se realizacija od Z 0 blizu ili manje od nule


(slika 4.21). Uoimo primjerice da se realizacije vee ili jednake 1.64 pojavljuju s
vjerojatnou priblino 0.05, tj. da je
P {Z 0 1.64} 0.05.

f (x)

P {Z 1.64} = 0.05
x
1.64
Slika 4.21: Povrina ispod grafa funkcije gustoe standardne normalne distribucije
nad intervalom [1.64, ).

Pretpostavimo da se u naem sluaju Z 0 realizirala brojem z. U uvjetima istinitosti hipoteze H0 oekujemo realizacije od Z 0 bliske 0 ili manje od 0. Vei iznosi
realizacija od Z 0 idu u prilog alternativnoj hipotezi, ali to ne znai da se ne mogu
dogoditi i ako je H0 istinita hipoteza. Naime, ako je H0 istinita hipoteza, vjerojatnost da se sluajna varijabla Z 0 realizira brojem veim ili jednakim z iznosi priblino
P {Z z}.
Sada zakljuujemo na sljedei nain. Ako je H0 istinita hipoteza, realizacije vee ili
jednake z mogu se pojaviti, a vjerojatnost je za to priblino P {Z z}. Dakle, ako
odbacimo nul-hipotezu, vjerojatnost je da emo time pogrijeiti najvie P {Z z}.
Ukoliko je taj broj manji od standardno prihvaenih vrijednosti za maksimalnu
vjerojatnost pogreke prvog tipa (tj. nivoa znaajnosti testa), hipotezu H0 moemo

233

Statistika

odbaciti. U suprotnom kaemo da nemamo dovoljno argumenata za odbacivanje


hipoteze H0 .
Na slian bismo nain bismo proveli postupak testiranja u sluaju da je alternativna
hipoteza oblika H1 : < 0 . Tada vjerojatnost p = P0 {Z 0 z} P {Z z}, Z
N (0, 1), usporeujemo s razinom znaajnosti , koja je u tom sluaju povrina ispod
grafa funkcije gustoe standardne normalne distribucije nad intervalom (, z ]
(slika 4.22).
f (x)

P {Z z }
x
z
Slika 4.22: Povrina ispod grafa funkcije gustoe standardne normalne distribucije
nad intervalom (, z ].
Objanjeni postupak openito zapisujemo na sljedei nain:
Nul-hipoteza:
H0 : = 0 ,
Test-statistika:
Z0 =

X n 0
.
/ n

Ovdje je n veliina uzorka, X n aritmetika sredina uzorka, a poznata standardna devijacija.


U uvjetima istinitosti nul-hipoteze oekujemo da je realizacija od Z 0 (oznait emo je z) blizu ili vea od 0 jer varijabla Z 0 ima priblino standardnu
normalnu distribuciju. Ako oznaimo Z N (0, 1), na osnovu realizacije z
statistike Z 0 na podacima moemo odrediti takozvanu p-vrijednost kao:
p = P {Z z}, ako je alternativna hipoteza oblika H1 : > 0 ,

234

Testiranje statistikih hipoteza


p = P {Z z}, ako je alternativna hipoteza oblika H1 : < 0 .
Tako izraunatu p-vrijednost usporeujemo s razinom znaajnosti . U sluaju da je p < , odbacujemo nul-hipotezu na razini znaajnosti . Ako je
p > , zakljuujemo da nemamo dovoljno informacija koje bi poduprle odluku
o odbacivanju nul-hipoteze.

Treba napomenuti da je pretpostavka o poznatoj varijanci iz te procedure nerealna


za primjene. S obzirom da je taj rezultat izveden za velike uzorke, moe se takoer
dokazati da e koritenje korigirane varijance uzorka umjesto varijance u izvodu
formule za test-statistiku dati analognu asimptotsku distribuciju. Iz tog se razloga
u praksi koristi procjena za varijancu umjesto stvarne vrijednosti varijance ako je
ona nepoznata.
Primjer 4.55. (kolokvij.xls)
Promotrimo ponovno diskretnu sluajnu varijablu X kojom modeliramo ukupan broj bodova koje
je student ostvario na dvama kolokvijima iz nekog kolegija. Iz primjera 4.38 znamo da je procjena
njezinog oekivanja realan broj 96.9. Koritenjem istih podataka testirajmo hipotezu da je oekivani ukupni broj bodova ostvaren na tim dvama kolokvijima manji od 100. U tu svrhu postavimo
statistike hipoteze na sljedei nain:
H0 : = 100,
H1 : < 100.
Da bismo donijeli odluku na nivou znaajnosti = 0.05, raunamo vrijednost z test-statistike Z 0
temeljenu na podacima iz varijable bodovi_ukupno:
z =

x70 0
96.9 100

=
= 0.59.
s70 / 70
44.19/ 70

Odavde upotrebom kalkulatora vjerojatnosti slijedi da je pripadna p-vrijednost


p = P {Z < z} = 0.28,
to je vee od zadane razine znaajnosti = 0.05. Zakljuujemo da, na razini znaajnosti =
0.05, ne moemo tvrditi da je oekivani ukupni broj bodova ostvaren na tim dvama kolokvijima
manji od 100.
Primjer 4.56. (djelatnici.xls)
Neka je X neprekidna sluajna varijabla iz primjera 4.39 kojom modeliramo godinju plau djelatnika jedne tvornice. U primjeru 4.39 pokazali smo da je x100 = 24522 procjena njezinog
oekivanja, a u primjeru 4.41 da je s2100 = 26069208.1 procjena varijance na temelju odabranog
uzorka.
elimo provjeriti je li oekivanje od X vee od 23000 na razini znaajnosti = 0.05. U tu svrhu
postavljamo statistike hipoteze:

H0 : = 23000,
H1 : > 23000.

235

Statistika

Da bismo donijeli odluku, raunamo vrijednost z test-statistike Z 0 na temelju podataka za varijablu


placa_prije:
x100 0
24522 23000
z =
=
2.98.
s100 /10
26069208.1/10
Odavde upotrebom kalkulatora vjerojatnosti slijedi da je pripadna p-vrijednost
p = P {Z > z} = 0.0014,
to je manje od zadane razine znaajnosti = 0.05. Stoga zakljuujemo da, na nivou znaajnosti
= 0.05, prihvaamo alternativnu hipotezu, tj. tvrdimo da je oekivanje godinje plae djelatnika
u promatranoj tvornici vee od 23000.

4.5.3

Testiranje hipoteze o proporciji za velike uzorke

O proporciji emo, u ovom primjeru statistikog testa, zakljuivati na temelju ndimenzionalnoga jednostavnog sluajnog uzorka iz Bernoullijeve distribucije. Neka
je sluajni pokus modeliran Bernoullijevom sluajnom varijablom s tablicom distribucije
!
01
X=
, p (0, 1), q = 1 p.
qp
Testirat emo hipotezu o vrijednosti parametra p koji ima znaenje vjerojatnosti realizacije "uspjeha" (tj. jedinice) u jednom izvoenju danog pokusa. U tom postupku
koristimo relativnu frekvenciju realiziranih "uspjeha" (jedinica) kao procjenitelj za
nepoznatu vjerojatnost p i oznaavamo ju s pb.
Postavimo nul-hipotezu na sljedei nain:
H0 : p = p0 .
Iskoristimo test-statistiku
p p0
Z0 = q

p0 (1p0 )
n

U uvjetima istinitosti nul-hipoteze centralni granini terem garantira da sluajna


varijabla Z 0 ima priblino standardnu normalnu distribuciju za velike n. Ako je
Z N (0, 1), na osnovu realizacije z test-statistike Z 0 na naem uzorku moemo
odrediti p-vrijednost kao:
p = P {Z z} ako je alternativna hipoteza oblika H1 : p > p0 ,
p = P {Z z} ako je alternativna hipoteza oblika H1 : p < p0 .

236

Testiranje statistikih hipoteza

Tako izraunatu p-vrijednost usporeujemo s razinom znaajnosti . U sluaju da


je p < , na razini znaajnosti odbacujemo nul-hipotezu H0 . Ako je p > ,
nemamo dovoljno informacija koje bi poduprle odluku o odbacivanju nul-hipoteze.
Veliina uzorka za provoenje tog testa treba biti najmanje takva da interval
#
"
r
r
p0 (1 p0 )
p0 (1 p0 )
, p0 + 3
p0 3
n
n
ne sadri ni 0 ni 1.
Primjer 4.57. Iskoristimo podatke o ocjeni studenata na usmenom dijelu ispita izabranog kolegija
iz primjera 4.37. Zanima nas je li proporcija studenata koji taj usmeni ispit polau ocjenom
izvrstan manja od 0.2. Iz tablice 4.14 znamo da je relativna frekvencija studenata koji su ispit
poloili izvrsnom ocjenom p = 0.16. Postavljamo statistike hipoteze:
H0 : p = 0.2,
H1 : p < 0.2.
Da bismo donijeli odluku, raunamo vrijednost z test-statistike Z 0 :
0.16 0.2
z = q

= 0.81.

0.2(10.2)
65

Odavde slijedi da je pripadna p-vrijednost


p = P {Z < z} = 0.21,
to je vee od zadane razine znaajnosti = 0.05. Zakljuujemo da na razini znaajnosti = 0.05
ne moemo poduprijeti hipotezu da je proporcija studenata koji taj usmeni ispit polau ocjenom
izvrstan manja od 20%.
Primjer 4.58. (kolokvij.xls)
Vratimo se bazi podataka kolokvij.xls i testirajmo je li proporcija studenata koji su na kolokvijima
ostvarili ukupno barem 100 bodova vea od 50% na razini znaajnosti = 0.05. Iz primjera 4.49
znamo da je relativna frekvencija takvih studenata p = 0.56, pa su statistike hipoteze oblika
H0 : p = 0.5,
H1 : p > 0.5.
Raunamo vrijednost z test-statistike Z 0 :
z =

0.56 0.5
q
= 1.004.
0.25
70

Odavde slijedi da je pripadna p-vrijednost


p = P {Z > z} = 0.16
to je vee od zadane razine znaajnosti = 0.05. Stoga zakljuujemo da ne odbacujemo nulhipotezu na razini znaajnosti = 0.05, tj. na nivou znaajnosti = 0.05 ne moemo tvrditi da
vie od 50% studenata postie barem 100 bodova na kolokvijima.

237

Statistika

Primjer 4.59. (djelatnici.xls)


Vratimo se primjeru 4.39 i testirajmo je li proporcija zaposlenika koji imaju godinju plau manju
od 30000 vea od 75% na razini znaajnosti = 0.05. Iz tablice frekvencija za varijablu placa_prije
vidimo da je relativna frekvencija takvih djelatnika p = 0.86, pa su statistike hipoteze oblika
H0 : p = 0.75,
H1 : p > 0.75.
Raunamo vrijednost z test-statistike Z 0 :
0.86 0.75
z = q

= 2.54.

0.75(10.75)
100

Odavde slijedi da je pripadna p-vrijednost


p = P {Z > z} = 0.0055,
to je manje od zadane razine znaajnosti = 0.05. Stoga zakljuujemo da odbacujemo nulhipotezu na razini znaajnosti = 0.05, tj. na razini znaajnosti = 0.05 moemo tvrditi da vie
od 75% djelatnika te tvornice ostvaruje godinju plau manju od 30000.

4.5.4

Testiranje hipoteze o jednakosti oekivanja

Do sada prezentirani testovi kreirani su na temelju najjednostavnijega statistikog


modela, tj. modela jednostavnog sluajnog uzorka iz zadane jednodimenzionalne
distribucije. U ovom poglavlju navodimo dva testa koja se na prvi pogled ne uklapaju u takav model, ali se prikladnim pristupom problemu mogu svesti na njega.
Zavisni uzorci
Za ilustraciju problema navodimo prvo primjer.
Primjer 4.60. Farmaceutska tvrtka eli testirati uinkovitost novog lijeka na smanjenje razine
triglicerida u krvi. U tu svrhu odabire osobe u reprezentativnu skupinu za testiranje i izvodi
mjerenje razine triglicerida prije uzimaja lijeka. Iste osobe koriste lijek u zadano vrijeme. Nakon
toga se ponovo mjeri razina triglicerida. Dobiveni podaci prikazani su sljedeom tablicom:
pacijent
1
2
..
.
n

prije
x1
x2
.
..
xn

poslije
y1
y2
.
..
yn

Istraivai bi htjeli dobiti odgovor na pitanje dolazi li do promjene razine triglicerida nakon uzimanja lijeka.

Analogni problemi pojavljuju se esto u primjenama. Kaemo da u takvim sluajevima analiziramo istu karakteristiku (varijablu) prije i nakon tretmana.

238

Testiranje statistikih hipoteza

Statistiki model za zakljuivanje moemo postaviti koritenjem sluajnog vektora


tako da parove (xi , yi ), i = 1, . . . , n, smatramo meusobno nezavisnim realizacijama
sluajnog vektora (X, Y ), gdje komponenta X opisuje varijablu na populaciji prije
tretmana, a Y varijablu na populaciji nakon tretmana. Tako nastao sluajni uzorak
((X1 , Y1 ), (X2 , Y2 ), . . . , (Xn , Yn )) niz je nezavisnih jednako distribuiranih sluajnih
vekotra ije komponente Xi i Yi , i {1, . . . , n}, ne moraju biti nezavisne, to komplicira statistiki model. Meutim, problem analize razlika u distribuciji varijable
prije i poslije tretmana moe se postaviti i tako da formiramo sluajnu varijablu
razlike:
D = X Y.
Ako je oekivanje sluajne varijable D razliito od nule, to je svakako dokaz da su
razlike u distribuciji izmeu X i Y bitne. U tu svrhu proirimo tablicu podataka
novom varijablom "razlike" i promatramo statistiki model jednostavnoga sluajnog
uzorka iz distribucije sluajne varijable D.
br
1
2
..
.
n

tretman 1
x1
x2
..
.
xn

tretman 2
y1
y2
..
.
yn

razlike
d 1 = x1 y1
d 2 = x1 y2
..
.
dn = x1 yn

Postavimo hipotezu:
H0 : D = 0.
Ukoliko je uzorak dovoljno velik, u poglavlju 4.5.2 opisali smo proceduru za testiranje te hipoteze u kombinaciji s alternativnom hipotezom D > 0 ili D < 0.
U tom sluaju za varijancu od D moemo koristiti korigiranu varijancu uzorka iz
distribucije od D, kao to je navedeno u poglavlju 4.5.2.
Primjer 4.61. (djelatnici.xls)
U bazi podataka djelatnici.xls raspolaemo podacima o godinjim plaama za uzorak od 100 djelatnika jedne tvornice (tvornice A). Varijabla placa_prije sadri iznose godinjih plaa za djelatnike
iz uzorka prije reorganizacije poslovnog sustava, a varijabla placa_poslije iznose godinjih plaa za
isti uzorak djelatnika nakon reorganizacije. Budui da se ovdje radi o istom uzorku djelatnika ije
godinje plae pratimo prije i poslije reorganizacije posla, kaemo da se radi o zavisnim uzorcima.
Oznaimo s X (1) sluajnu varijablu kojom modeliramo godinju plau djelatnika tvornice A prije
reorganizacije, a s X (2) sluajnu varijablu kojom modeliramo godinju plau djelatnika te tvornice
poslije reorganizacije. Zanima nas razlikuju li se na nivou znaajnosti = 0.05 oekivanja plaa
djelatnika te tvornice prije i poslije reorganizacije posla. Prije nego postavimo potrebne statistike
hipoteze, procijenimo, na temelju realizacija jednostavnih sluajnih uzoraka iz distribucija od X (1)
i X (2) , oekivanja i varijance od X (1) , X (2) i D = X (1) X (2) . Procjene su dane u tablici 4.17.

239

Statistika
sluajna varijabla

procjena oekivanja

procjena varijance

X (1)
X (2)
D

24522
24986.85
464.85

26069208.1
26252789.5
116302.63

Tablica 4.17: Procjene oekivanja i varijanci sluajnih varijabli X (1) i X (2) .

Postavimo statistike hipoteze:


H0 : D = 0,
H1 : D < 0.
Da bismo donijeli odluku o tome odbacujemo li na nivou znaajnosti = 0.05 nul-hipotezu ili
ne, raunamo vrijednost z test-statistike Z 0 temeljem procjena oekivanja i varijance sluajne
varijable D i vrijednosti 0 = 0:
464.85
z =
= 13.63.
116302.63/10
Odavde, upotrebom kalkulatora vjerojatnosti, slijedi da je pripadna p-vrijednost
p = P {Z < z} < 106 ,
to je manje od zadanog nivoa znaajnosti = 0.05, stoga odbacujemo nul-hipotezu na nivou
znaajnosti = 0.05 i prihvaamo alternativnu hipotezu, tj. tvrdimo da je oekivanje godinje
plae djelatnika tvornice A prije reorganizacije bilo manje od oekivanja godinje plae djelatnika
iste tvornce nakon reorganizacije.

Nezavisni uzorci
Za ilustraciju problema prvo navedimo jedan primjer.
Primjer 4.62. Ured za kvalitetu na nekom fakultetu eli provjeriti je li dolo do bitne promjene
u distribuciji ocjene iz kolegija Matematika 1 koju su ostvarili studenti generacije 2009./2010. u
odnosu na generaciju 2008./2009. U tu svrhu prikuplja podatke o ocjenama na uzorcima studenata
i modelira ocjenu iz tog kolegija kao sluajnu varijablu i to X za generaciju 2008./2009., a Y za
2009./2010. Takoer, pretpostavlja da su X i Y nezavisne sluajne varijable. Prikupljeni podaci
o ocjenama (x1 , . . . , xn ) i (y1 , . . . , ym ) realizacije su jednostavnih sluajnih uzoraka iz distrbucije
od X, odnosno iz distribucije od Y .

Statistiki model opisan u tom primjeru sastoji se od distribucija sluajnog vektora (X1 , X2 , . . . , Xn , Y1 , Y2 , . . . , Ym ) nezavisnih, ali ne nuno jednako distribuiranih sluajnih varijabli. Meutim, prvi dio vektora, tj. (X1 , X2 , . . . , Xn ) jest jednostavni sluajni uzorak iz distribucije sluajne varijable X, dok je drugi dio,
(Y1 , Y2 , . . . , Ym ), jednostavni sluajni uzorak iz distribucije sluajne varijable Y .
Jednostavan nain potvrde postojanja razlike u distribucijama potvrda je postojanja
razlike u oekivanjima tih distribucija. Ovdje emo navesti jedan test kojim moemo
testirati upravo takve hipoteze, tj. hipoteze o razlici u oekivanjima.

240

Testiranje statistikih hipoteza

U tu svrhu pretpostavimo da su veliine uzoraka (n i m) velike te uoimo da su


X n i Y m dvije sluajne varijable s asimptotski normalnim distribucijama. Osim
2
2
toga, E(X n ) = X , dok je E(Y m ) = Y , Var X n = nX , Var Y m = mY , a X n i Y m
nezavisne su sluajne varijable.
Neka je D = X n Y m . Uoimo da je
E D = X Y , Var D =

2
X
2
+ Y.
n
m

Sada moemo testirati slutnju o postojanju razlika u oekivanjima koritenjem distribucije sluajne varijable D. Postavimo statistiku hipotezu:
H0 : D = 0.
Statistika teorija dokazuje da, u uvjetima istinitosti H0 , standardizirani oblik sluajne varijable D, tj. sluajna varijabla
Z0 = q

D
2
X
n

2
Y
m

ima asimptotski standardnu normalnu distribuciju. Ukoliko varijance nisu unaprijed


poznate (to je u praksi sluaj), moramo modificirati Z 0 koritenjem varijance uzorka
kao procjenitelja za varijancu, pa koristimo statistiku
Z 00 = q

D
2
SX

2
SY
m

koja takoer ima asimptotski standardnu normalnu distribuciju ako je H0 istinita


hipoteza.
Koritenjem statistike Z 00 testiramo hipotezu H0 u kombinaciji s alternativnom
hipotezom H1 :D > 0 ili H1 :D < 0 analognim postupkom kao u poglavlju 4.5.2.
Primjer 4.63. (djelatnici.xls)
U bazi podataka djelatnici.xls raspolaemo podacima o godinjim plaama za uzorke od po 100 djelatnika iz dviju konkurentskih tvornica - tvornice A (varijable placa_prije i placa_poslije, pogledati
primjer 4.61) i tvornice B (varijabla placa_konkurencija). Budui da se radi o uzorcima djelatnika
iz dviju razliitih tvornica, zakljuujemo da se radi o nezavisnim uzorcima.
Oznaimo ponovno s X (1) i X (2) sluajne varijable kojima modeliramo godinje plae djelatnika
tvornice A prije i poslije reorganizacije posla, redom, te s Y sluajnu varijablu kojom modeliramo
godinju plau djelatnika tvornice B. U varijablama placa_prije, placa_poslije i placa_konkurencija
sadrane su realizacije jednostavnih sluajnih uzoraka
(1)

(1)

(2)

(2)

(X1 , . . . , X100 ), (X1 , . . . , X100 ) i (Y1 , . . . Y100 )

241

Zadaci

iz distribucija sluajnih varijabli X (1) , X (2) i Y , redom. Zanima nas razlikuje li se, na nivou
znaajnosti = 0.01, oekivanje plae djelatnika tvornice A prije reorganizacije posla od oekivanja plae djelatnika tvornice B. Potraimo takoer i odgovor na analogno pitanje za oekivanje
plae djelatnika tvornice A nakon reorganizacije.
Procjene oekivanja i varijanci sluajnih varijabli X (1) i X (2) dane su u tablici 4.17. Procjene
(1)
(2)
oekivanja i varijanci sluajnih varijabli Y , D1 = X 100 Y 100 i D2 = X 100 Y 100 dane su u
tablici 4.18.
sluajna varijabla

procjena oekivanja

procjena varijance

Y
D1
D2

25432.24
910.24
445.39

316895.23
26004549.7
26215378.2

Tablica 4.18: Procjene oekivanja i varijanci sluajnih varijabli Y , D1 i D2 .

Postavimo statistike hipoteze:


H0 : Di = 0,
H1 : Di < 0,
gdje je i {1, 2}. Da bismo donijeli odluku o tome odbacujemo li na nivou znaajnosti = 0.01
nul-hipoteze ili ne, raunamo vrijednosti zi test-statistike Z 00 na temelju procjena oekivanja i
varijanci sluajnih varijabli D1 i D2 :
z1 = p

910.24
26004549.7/100

= 1.78,

z2 = p

445.39
26215378.2/100

= 0.87.

Odavde, upotrebom kalkulatora vjerojatnosti, slijedi da su pripadne p-vrijednosti redom


p1 = P {Z < z1 } = 0.038,

p2 = P {Z < z2 } = 0.19.

Budui da je p2 vei od 0.01 na nivou znaajnosti = 0.01, ne moemo tvrditi da je oekivanje godinje plae djelatnika tvornice A nakon reorganizacije manje od oekivanja godinje plae
djelatnika tvornice B. Osim toga, p1 je takoer vei od 0.01, pa takvu tvrdnju ne moemo poduprijeti niti ako usporeujemo godinje plae djelatnika tvornice A prije reorganizacije s godinjim
plaama djelatnika tvornice B. Uoimo da p2 ima veu "teinu" od p1 u neodbacivanju hipoteze
H0 .

4.6

Zadaci

Zadatak 4.2. (tlak.xls)


Baza podataka tlak.xls sadri podatke o krvnom tlaku dobivene anketiranjem reprezentativnog
uzorka pacijenata jedne lijenike ordinacije:
varijable spol i dob sadre informacije o spolu i broju godina za svakog ispitanika,
varijable sistolicki-tlak i dijastolicki-tlak sadre vrijednosti sistolikog i dijastolikog tlaka za svakog
ispitanika,

242

Statistika

varijabla tlak klasificira vrijednosti sistolikog i dijastolikog tlaka u tri kategorije: N - nizak tlak,
O - normalan tlak, P - povien tlak,
varijabla puls sadri broj otkucaja srca u minuti (puls) za svakog ispitanika,
varijabla opce-stanje sadri subjektivnu ocjenu (u standardnoj skali od 1 do 5) vlastitog zdravstvenog stanja svakog ispitanika.
Na temelju podataka sadranih u toj bazi rijeite sljedee zadatke.
a) Odredite tablice frekvencija i relativnih frekvencija, nacrtajte i proanalizirajte histograme
frekvencija i relativnih frekvencija te kruni dijagram s prikazom relativnih frekvencija za
podatke sadrane u varijabli opce-stanje. Kolike su frekvencija i relativna frekvencija ispitanika koji su svoje ope zdravstveno stanje ocijenili barem ocjenom 4?
Rjeenje: 39 ispitanika, tj. njih je 78% svoje ope zdravstveno stanje ocijenilo barem ocjenom 4.
b) Odredite tablice frekvencija i relativnih frekvencija za podatke sadrane u varijabli opcestanje posebno za kategoriju ispitanika enskog spola i kategoriju ispitanika mukog spola
te nacrtajte pripadne histograme frekvencija i relativnih frekvencija. Takoer, nacrtajte
histograme frekvencija i relativnih frekvencija za podatke sadrane u varijabli opce-stanje
kategorizirane po vrijednostima varijable tlak (N, O, P). Proanalizirajte dobivene histograme.
c) Odredite i ukratko protumaite sljedee numerike karakteristike podataka sadranih u
varijabli dob: aritmetiku sredinu, medijan, donji i gornji kvartil, mod, raspon i standardnu
devijaciju. Je li mod jedinstven? Koliko iznosi maksimalno odstupanje podataka sadranih
u varijabli dob od njihove aritmetike sredine? Nacrtajte i detaljno proanalizirajte kutijasti
dijagram na bazi medijana za podatke sadrane u varijabli dob. Obrazloite svoj odgovor.
Rjeenje: x50 = 40.22, xmin = 11, x025 = 23, x050 = 43, x075 = 51, xmax = 83, s50 = 17.69.
d) Nacrtajte i detaljno proanalizirajte kutijasti dijagram na bazi medijana za podatke sadrane
u varijabli dob. Obrazloite svoj odgovor.
e) Crtanjem i analizom kutijastog dijagrama na bazi medijana neosjetljivog na stree vrijednosti i kutijastog dijagrama na bazi medijana osjetljivog na stree vrijednosti donesite
zakljuak o tome pojavljuju li se meu podacima sadranima u varijabli puls stree vrijednosti ili ne. Ako ste se uvjerili u njihovo postojanje, koritenjem kategoriziranih tablica
frekvencija odredite sve prisutne stree vrijednosti meu podacima u varijabli puls. Kako
biste neutralizirali njihov utjecaj na numerike karakteristike podataka?
Rjeenje: stree su vrijednosti varijable puls 800 i 1006.
Zadatak 4.3. (glukoza.xls)
Baza podataka (glukoza.xls) za reprezentativan uzorak pacijenata jedne internistike klinike sadri
informacije o dobi (varijabla dob), koncentraciji glukoze u krvi (varijabla koncentracija) i tome
je li izmjerena koncentracija glukoze normalna ili poviena (varijabla kategorija: N - normalna
koncentracije, P - poviena koncentracija). Rijeite sljedee zadatke i sva rjeenja interpretirajte
u kontekstu promatranog problema.
a) Procijenite proporciju pacijenta promatrane klinike koji su stariji od 30 godina te proporciju
pacijenata starih barem 50 ali manje od 60 godina.
Rjeenje: proporcija je pacijenta starijih od 30 godina 90/102 = 0.88, a proporcija pacijenata
starih barem 50, ali manje od 60 godina jest 21/102 = 0.21.

Zadaci

243

b) Intervalom pozdanosti 95% procijenite proporciju pacijenata koji imaju povienu koncentraciju glukoze u krvi.
Rjeenje: [0.61, 0.79].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo koncentraciju glukoze u krvi pacijenata.
Rjeenje: x102 = 7.69, s2102 = 0.75, s102 = 2.78.
d) Intervalom pozdanosti 95% procijenite oekivanu koncentraciju glukoze u krvi pacijenata.
Rjeenje: [7.15, 8.24].
e) Moete li na nivou znaajnosti = 0.01 tvrditi da je proporcija pacijenata koji imaju
povienu koncentraciju glukoze manja od 0.8? Koji ste test koristili i zato?
Rjeenje: p = 0.0044.
f) Moete li na nivou znaajnosti = 0.05 tvrditi da je oekivana koncentracija glukoze u krvi
vea od normalne, tj. 6 mMol/L? Koji ste test koristili i zato?
Rjeenje: p = 0.
g) Moete li na nivou znaajnosti = 0.05 tvrditi da je oekivana dob pacijenata koji imaju
povienu koncentraciju glukoze u krvi vea od oekivane dobi onih koji imaju normalnu
koncentraciju glukoze? Koji ste test koristili i zato?
Rjeenje: p = 0.59.
Zadatak 4.4. (zdravlje.xls)
Baza podataka zdravlje.xls sadri neke podatke o zdravstvenom stanju reprezentativnog uzorka
stanovnika jednog mjesta:
varijable godine i spol sadre podatke o starosti u godinama i spolu ispitanika;
varijabla zdravlje sadri subjektivne ocjene vlastitog zdravstvenog stanja ispitanika;
varijabla broj-pregleda sadri informacije o ukupnom broju zdravstvenih pregleda svakog ispitanika u tekuoj kalendarskoj godini;
varijabla dodatno-zdravstveno sadri podatke o dodatnom zdravstvenom osiguranju svakog ispitanika (1 - ispitanik je dodatno osiguran; 0 - ispitanik nije dodatno osiguran);
varijabla cijena sadri cijenu u kunama najskupljeg zdravstvenog pregleda svakog ispitanika (u
tekuoj kalendarskoj godini).
Rijeite sljedee zadatke i sva rjeenje interpretirajte u kontekstu promatranog problema.
a) Procijenite proporciju stanovnika promatranog mjesta koji su svoje zdravstveno stanje ocijenili ocjenom veom od dva, ali manjom of pet.
Rjeenje: proporcija stanovnika koji su svoje zdravstveno stanje ocijenili ocjenom veom od
dva, ali manjom od pet 30/51 = 0.59.
b) Intervalom pozdanosti 97% procijenite proporciju stanovnika koji nemaju dodatno zdravstveno osiguranje.
Rjeenje: [0.59, 0.86].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo subjektivnu ocjenu zdravstvenog stanja stanovnika.
Rjeenje: x51 = 3.27, s251 = 1.36, s51 = 1.17.
d) Intervalom pozdanosti 95% procijenite oekivanu ocjenu zdravstvenog stanja stanovnika.
Rjeenje: [2.95, 3.6].

244

Statistika

e) Moete li na razini znaajnosti = 0.01 tvrditi da je proporcija stanovnika koji imaju


dopunsko zdravstveno osiguranje manja od 0.15? Koji ste test koristili i zato?
Rjeenje: p = 0.421.
g) Moete li na nivou znaajnosti = 0.05 tvrditi da je oekivana dob stanovnika koji nemaju
dopunsko zdravstveno osiguranje manja od oekivane dobi onih koji imaju dopunsko zdravstveno osiguranje? Koji ste test koristili i zato? to zakljuujete ako za razinu znaajnosti
testa uzmete = 0.01 i zato?
Rjeenje: p = 0.03.
Zadatak 4.5. (matematika.xls)
Baza podataka (matematika.xls) sadri podatke prikupljene anketiranjem reprezentativnog uzorka
studenata jedne generacije nakon odranih predavanja, vjebi, kolokvija te usmenog ispita iz jednog
matematikog kolegija. Prikupljeni podaci organizirani su na sljedei nain:
varijabla prosjek sadri podatke o prosjenoj ocjeni na studiju za svakog od anketiranih studenata,
varijabla polozeno za svakog anketiranog studenta sadri informaciju o tome je li poloio usmeni
ispit iz promatranog kolegija (oznaka 1) ili nije (oznaka 0),
varijable predavanja i vjezbe sadre informaciju o redovitosti pohaanja nastave iz promatranog
kolegija (oznaka 1 - student s p/v nije nikada izostao, oznaka 2 - student je s p/v izostao
samo jednom, oznaka 3 - student je s p/v izostao barem dva puta),
varijable tezina_kolegija i materijali sadre subjektivne ocjene (u standardnoj skali od 1 do 5)
promatranih studenata za teinu kolegija i dostatnost dostupnih materijala za pripremanje
ispita iz promatranog kolegija.
Rijeite sljedee zadatke i sva rjeenja interpretirajte u kontekstu promatranog problema.
a) Procijenite proporciju studenata ija je prosjena ocjena na studiju vea od tri.
Rjeenje: proporcija studenata ija je prosjena ocjena studiranja vea od tri jest 42/49 =
0.86.
b) Intervalom pozdanosti 95% procijenite proporciju studenata ija je prosjena ocjena na
studiju najvie tri.
Rjeenje: [0.045, 0.24].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo prosjenu ocjenu na studiju kojeg pohaaju ispitanici.
Rjeenje: x49 = 3.98, s249 = 0.565, s49 = 0.752.
d) Intervalom pozdanosti 95% procijenite oekivanu prosjenu ocjenu na studiju kojeg pohaaju ispitanici.
Rjeenje: [3.76, 4.19].
e) Moete li na razini znaajnosti = 0.01 tvrditi da je proporcija studenata koji su redovito
pohaali predavanja vea od 0.7? Koji ste test koristili i zato?
Rjeenje: p = 0.413.
Zadatak 4.6. (komarci.xls)
Baza podataka komarci.xls sadri dio rezultata prouavanja komaraca u jednom movarnom podruju (dostupni su podaci za 210 mjerenja na istoj lokaciji):
varijable brojM i brojZ redom sadre broj mukih i enskih jedinki komaraca uhvaenih u klopku;
varijabla mjesec sadri mjeseevu mijenu (M - mlaak, U - utap) za svako mjerenje;

Zadaci

245

varijabla doba-dana sadri doba dana u kojem je mjerenje obavljeno (P - predveerje, N - no, S
- svitanje);
varijabla svjetlost sadri tip osvjetljenja pri mjerenju;
varijabla temperatura sadri temperaturu zraka pri kojoj je mjerenje izvreno;
varijabla rel-vlaznost sadri relativnu vlanost zraka za vrijeme mjerenja.
Rijeite sljedee zadatke i sva rjeenja interpretirajte u kontekstu promatranog problema.
a) Procijenite proporciju mjerenja u kojima je izbrojeno manje od 50 mukih jedinki komaraca
te proporciju mjerenja u kojima je izbrojeno vie od 50 enskih jedinki komaraca.
Rjeenje: proporcija mjerenja u kojima je izbrojeno manje od 50 mukih jedinki komaraca
jest 202/210 = 0.962, a proporcija je mjerenja u kojima je izbrojeno vie od 50 enskih
jedinki komaraca je 39/210 = 0.186.
b) Intervalom pozdanosti 95% procijenite proporciju mjerenja u kojima je izbrojeno barem 50,
ali manje od 100 enskih jedinki komaraca.
Rjeenje: [0.022, 0.083].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo temperaturu zraka tijekom jednog mjerenja.
Rjeenje: x210 = 21.89, s2210 = 6.76, s210 = 2.6.
d) Intervalom pozdanosti 97% procijenite oekivanu temperaturu tijekom jednog mjerenja.
Rjeenje: [21.51, 22.29].
e) Moete li na nivou znaajnosti = 0.05 tvrditi da je proporcija mjerenja u kojima je
izbrojeno manje od 50 mukih jedinki komaraca vea od 0.95? Koji ste test koristili i zato?
Rjeenje: p = 0.2.
f) Moete li na nivou znaajnosti = 0.01 tvrditi da je oekivani broj mukih jedinki komaraca
izbrojenih u mjerenju manji od 20? Koji ste test koristili i zato?
Rjeenje: p = 0.99.
g) Moete li na nivou znaajnosti = 0.05 tvrditi da se oekivani broj mukih jedinki komaraca
izbrojenih u jednom mjerenju razlikuje od oekivanog broja enskih jedinki izbrojenih u
jednom mjerenju? Koji ste test koristili i zato?
Rjeenje: p = 0.009.
Zadatak 4.7. (gradjevina.xls)
Baza podataka gradjevina.xls sadri neke informacije o reprezentativnom uzorku koji se sastoji od
100 srednje velikih graevinskih poduzea u jednoj tranzicijskoj zemlji:
varijabla godina_osnivanja za svako od 100 poduzea iz uzorka sadri godinu kada je poduzee
osnovano,
varijable zaposleni2007, zaposleni2008 i zaposleni2009 sadre podatke o broju zaposlenika u tih
100 poduzea u 2007., 2008. i 2009. godini,
varijabla prosjecna_starost sadri prosjecnu dob zaposlenika u 2009. godini,
varijable motivacija_placa i napredovanje redom sadre subjektivne ocjene kadrovske slube poduzea o tome u kolikoj je mjeri visina plae motivacijski faktor za uspjeno obavljanje posla te
u kolikoj mjeri uspjeno obavljanje poslovnih zadataka utjee na mogunost napredovanja
na bolje radno mjesto unutar poduzea,

246

Statistika

varijable placa2007, placa2008 i placa2009 sadre iznose prosjenih plaa zaposlenika u 2007.,
2008. i 2009. godini,
varijable troskovi2007, troskovi2008 i troskovi2009 sadre iznose trokova poduzea u 2007., 2008.
i 2009. godini,
varijable prihodi2007, prihodi2008 i prihodi2009 sadre iznose ostvarenih prihoda u 2007., 2008. i
2009. godini,
Rijeite sljedee zadatke i sva rjeenja interpretirajte u kontekstu promatranog problema.
a) Odredite tipove i pripadne skupove vrijednosti sluajnih varijabli kojima modeliramo broj
zaposlenika, njihovu prosjenu dob, prosjenu godinju plau zaposlenika u poduzeu, godinje trokove poduzea te godinje prihode poduzea.
b) Procijenite vjerojatnost da sluajno odabrano srednje veliko graevinsko poduzee u promatranoj zemlji ima vie od 50 zaposlenika u 2007., 2008. te 2009. godini?
Rjeenje: proporcije su 0.83 za 2007., 0.93 za 2008. te 0.95 za 2009. godinu.
c) Procijenite oekivanje i varijancu sluajne varijable kojom se modelira prosjena plaa zaposlenika u srednje velikom graevinskom poduzeu u toj zemlji u 2009. godini.
Rjeenje: x100 = 600.13, s100 = 194.63.
d) Kategorizirajte podatke kojima raspolaete te odluite ima li smisla modelirati prosjenu
godinju plau u 2009. godini kao normalnu sluajnu varijablu. Ako smatrate da ima, koritenjem normalne distribucije s procijenjenim vrijednostima oekivanja i varijance odredite
vjerojatnost da je u 2009. godini u sluajno odabranom poduzeu srednje veliine u toj
zemlji prosjena plaa bila via od 500 eura. Istu vjerojatnost izraunajte i koritenjem
procijenjene (empirijske) distribucije te sluajne varijable te usporedite rezultate.
Rjeenje: Iz histograma relativnih frekvencija vidimo da normalna distribucija nije prikladna
za modeliranje tih podataka, a to sugeriraju i izraunate traene vjerojatnosti: iz empirijske
distribucije te sluajne varijable, oznaimo ju s X, slijedi da je P (X > 500) = 0.66, a ako
X modeliramo kao N (600.13, 194.632 ), slijedi da je P {X > 500} = 0.3.)
e) Intervalom pouzdanosti 95 % procijenite proporciju srednje velikih graevinskih poduzea u
toj zemlji u kojima je prosjena mjesena plaa vea od aritmetike sredine plaa zabiljeenih
u varijabli placa2009.
Rjeenje: [0.343, 0.537].
f) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo prosjenu plau u 2009. godini.
Rjeenje: x100 = 600.13, s2100 = 37879.1, s100 = 194.63.
g) Intervalom pouzdanosti 95 % procijenite oekivanje sluajne varijable kojom se modelira
prosjena mjesena plaa zaposlenika u 2009. godini.
Rjeenje: [561.51, 638.75].
h) Moete li na razini znaajnosti = 0.05 tvrditi da je proporcija zaposlenika koji u 2009.
godini imaju plau viu od oekivane manja od 0.5? Koji ste test koristili i zato?
Rjeenje: p = 0.12.
i) Moete li na razini znaajnosti = 0.05 tvrditi da je oekivana plaa u 2009. godini vea
od 650 eura? Koji ste test koristili i zato?
Rjeenje: p = 0.012.

Zadaci

247

j) Moete li na razini znaajnosti = 0.05 tvrditi da postoji razlika u oekivanoj prosjenoj


plai u graevinskim poduzeima srednje veliine u toj zemlji u 2008. i 2009. godini pod
pretpostavkom da razlike prosjenih plaa u 2008. i 2009. godini moemo modelirati normalnom sluajnom varijablom? Koji ste test koristili i zato?
Rjeenje: p = 0.164.
k) Moete li na razini znaajnosti = 0.05 tvrditi da je proporcija srednje velikih graevinskih
poduzea u toj zemlji, koja imaju vie od 150 zaposlenih, vea za 2009. nego za 2008. godinu?
Koji ste test koristili i zato?
Rjeenje: p = 0.4245.

Poglavlje 5

Dodatak
5.1

Osnove algebre skupova

Skup A podskup je skupa B (A B) ako je svaki element skupa A ujedno element i skupa
B.
Skup A jednak je skupu B ako je A B i B A.
Unija skupova A i B skup je A B = { : A B}.
Presjek skupova A i B skup je A B = { : A B}.
Razlika skupova A i B skup je A \ B = { : A
/ B}.
Simetrina razlika skupova A i B skup je A4B = (A B) \ (A B) = (A \ B) (B \ A).
Komplement skupa (dogaaja) A skup je AC = { :
/ A} kojeg nazivamo suprotan
dogaaj dogaaja A.
Komplement prostora elementarnih dogaaja jest prazan skup, tj. C = . Cijeli prostor
elementarnih dogaaja nazivamo siguran dogaaj, a njegov komplement nemogu
dogaaj.
Konana unija skupova (dogaaja) A1 , A2 , . . . An skup je
A1 A2 . . . An =

n
[

Ai = { : A1 A2 . . . An } =

i=1

= { : i {1, 2, . . . , n} t.d. Ai }.
Konaan presjek skupova (dogaaja) A1 , A2 , . . . An skup je
A1 A2 . . . An =

n
\

Ai = { : A1 A2 . . . An } =

i=1

= { : Ai , i {1, 2, . . . , n}}.
Osnovna svojstva skupovnih operacija

249

250

Osnovni kombinatorni rezultati


1.
2.
3.
4.
5.
6.
7.
8.

AB =BA
AB =BA
(A B) C = A (B C)
(A B) C = A (B C)
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
(A B)C = AC B C
(A B)C = AC B C

Komutativnost
Asocijativnost
Distributivnost
De Morganovi zakoni

Tablica 5.1: Osnovna svojstva skupovnih operacija.

5.2

Osnovni kombinatorni rezultati

Najpoznatiji su kombinatorni principi prebrojavanja:


Princip jednakosti
Neka su S i T konani skupovi. Ako postoji bijekcija meu njima, tada su skupovi S i T
jednakobrojni, tj. k(S) = k(T ), gdje su k(S) i k(T ) oznake za kardinalne brojeve skupova
S i T , redom.
Princip sume
Neka su n N i S1 , . . . , Sn konani skupovi takvi da je Si Sj = , i 6= j (dakle, disjunktni
su). Tada je (S1 S2 . . . Sn ) konaan skup i vrijedi:
k(S1 S2 . . . Sn ) = k(S1 ) + k(S2 ) + . . . + k(Sn ).
Princip produkta
Neka su n N i S1 , . . . , Sn konani skupovi (ne nuno disjunktni). Tada je njihov Kartezijev
produkt konaan skup i vrijedi:
k(S1 S2 . . . Sn ) = k(S1 ) k(S2 ) . . . k(Sn ).
Teorem 5.1 (Teorem o uzastopnom prebrojavanju). Neka su A1 , . . . , An konani skupovi i neka
je T (A1 . . . An ) skup ureenih n-torki (a1 , . . . , an ) definiranih na sljedei nain: prva
komponenta a1 moe se birati na k1 naina (dakle, meu k1 razliitih elemenata skupa A1 ); za
svaku ve izabranu prvu komponentu drugu komponentu a2 moemo birati na k2 razliitih naina
itd. Za svaki izbor komponenata a1 , a2 , . . . an1 n-tu komponentu an moemo odabrati na kn
razliitih naina. Tada je kardinalni broj skupa T jednak:
k(T ) = k1 . . . kn .
Primjer 5.1. Ako elimo odabrati jedan par, mladia i djevojku, iz razreda koji se sastoji od 21
djevojke i 2 mladia, broj naina na koji to moemo uiniti jednak je broju elemenata kartezijevog
produkta skupa koji se sastoji od 21 elemenata i skupa koji se sastoji od 2 elementa. Dakle, prema
principu produkta, to moemo uiniti na 42 naina.
Ureeni razmjetaji nazivaju se permutacije, a neureeni razmjetaji kombinacije.

251

Dodatak

Definicija 5.1. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata i neka je r N,


r n. Varijacija r-tog razreda u skupu A svaka je ureena r-torka meusobno razliitih
elemenata iz skupa A. Broj varijacija r-tog razreda n-lanog skupa je
Vnr = n (n 1) . . . (n r + 1) =

n!
.
(n r)!

Primjer 5.2. Neka je A skup koji se sastoji od deset elemenata. Svaka ureena trojka elemenata
skupa A jedna je varijacija treeg razreda skupa A. Takvih varijacija ima
3
V10
=

10!
= 720.
(10 3)!

Definicija 5.2. Svaku ureenu n-torku skupa od n elemenata zovemo permutacija. Broj je
permutacija n-lanog skupa
pn = Vnn = n (n 1) . . . 2 1 = n!.
Napomena 5.1. Permutacija je u n-lanom skupu svaka varijacija n-tog razreda tog skupa,
odnosno permutacija n-lanog skupa svaka je bijekcija tog skupa na samog sebe.
Primjer 5.3. Ako se pitamo na koliko naina pet ljudi moe stati u red, zapravo se pitamo koliko
permutacija ima peterolani skup. Broj je permutacija peterolanog skupa V55 = 5! = 120.
Definicija 5.3. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata i neka je r N,
r n. Kombinacija r-tog razreda u skupu A svaki je r-lani podskup skupa A. Broj je
kombinacija r-tog razreda skupa od n elemenata
!
n!
n
r
.
Cn =
=
r
r! (n r)!
Primjer 5.4. U razredu ima 15 djeaka i 10 djevojica. Na primjer:
Tri djeaka moemo odabrati na onoliko naina koliko ima razliitih kombinacija treeg
razreda skupa od 15 elemenata, dakle na
15
3
C15
=
3
naina.
Prema principu produkta slijedi da tri djeaka i dvije djevojice moemo odabrati na
15 10
3
2
C15
C10
=

3
2
naina.
Jednak broj djeaka i djevojica moemo odabrati na
10
X
k=1

k
k
C15
C10
=

10    
X
15
10

k
k
k=1

naina.
Definicija 5.4. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata. Varijacija s
ponavljanjem r-tog razreda skupa od n-elemenata svaka je ureena r-torka elemenata iz
skupa A. Broj je takvih varijacija s ponavljenjem nr .

252

Ponovljeni red

Primjer 5.5. Ako se pitamo koliko ima binarnih nizova (nizova iji su elementi samo nule i jedinice), zapravo se pitamo koliko ima razliitih varijacija sedmog razreda s ponavljanjem dvolanog
skupa. Takvih varijacija s ponavljanjem ima 27 = 128.
Definicija 5.5. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata. Permutacija s
ponavljanjem r-tog razreda svaka je ureena r-torka elemenata iz skupa A meu kojima je n1
elemenata meusobno jednakih, n2 elemenata meusobno jednakih, . . . , nk elemenata meusobno
jednakih, pri emu je n1 + n2 + . . . + nk = r. Broj je takvih permutacija s ponavljenjem
n ,n2 ,...,nk

Pr 1

r!
.
n1 ! n2 ! . . . nk !

Primjer 5.6. Ako nas zanima koliko se razliitih rijei, smislenih i besmislenih, moe napisati
od slova rijei "matematika", tada nas zapravo zanima broj permutacija s ponavljanjem desetog
razreda, pri emu imamo tri slova A, dva slova M i dva slova T. Takvih permutacija s ponavljanjem
ima
10!
3,2,2
P10
=
= 151200.
3! 2! 2!
Dakle, od slova rijei "matematika" moe se napisati ukupno 151200 razliitih rijei.

5.3

Ponovljeni red

U diskretnoj je teoriji vjerojatnosti esta potreba za raunanjem sume tzv. ponovljenog reda1 . Da
bismo pojasnili razliku izmeu ponovljenog reda i obinog reda, podsjetimo se da je red ureeni
par dvaju nizova ((an ), (sn )) od kojih drugi niz nastaje sumiranjem prvih n lanova prvog niza,
tj.
sn = a1 + a2 + . . . an .
Pritom kaemo da red konvergira ako konvergira niz parcijalnih suma (sn ) [13].
Ponovljeni red nastaje tako da prvo napravimo jednu particiju2 skupa prirodnih brojeva (Mi , i N)
pa posebno zbrojimo one lanove niza iji indeksi pripadaju u Mi , a zatim sve tako dobivene sume,
ako takve sume postoje.
Primjer 5.7. Neka je zadan geometrijski red s kvocijentom
 n
X
1
i=1

1
1
i prvim lanom , tj.
2
2

Taj red konvergentan je i suma mu je 1. Isti rezultat dobit emo ako podijelimo skup indeksa N na
parne i neparne brojeve, tj. ako promatramo particiju {N, P } skupa prirodnih brojeva, pri emu
je
N = {2n 1 : n N}, P = {2n : n N}.
1 Pod

pojmom "ponovljeni red" ovdje porazumijevamo samo dvostruki red.


skupova {Mi , i N} ini particiju skupa A ako su zadovoljena sljedea svojstva:

2 Familija

1. Mi A, i N,
2. Mi Mj = za sve i 6= j,
S
3.
Mi = A.
iN

253

Dodatak

Budui da je N = P N , sumu spomenutog geometrijskog reda moemo izraunati tako da prvo


zbrojimo sve lanove niza s parnim eksponentima, zatim sve lanove niza s neparnim eksponentima, a zatim te dvije sume:

1
X
X 1
1
2
=
=
2n
22n1
1
n=1
nN

1
X
X 1
1
4
=
=
2n
22n
1
n=1
nP

1
4

1
4

2
,
3

1
.
3

Oito vrijedi:
X 1
X 1
X 1
2
1
=
+
= + = 1.
n
n
2
2
2n
3
3
nN
nP
nN

Za zadavanje ponovljenog reda treba nam niz (an ) i particija skupa N: {Mi , i N}. Ako za svaki
P
i N konvergiraju redovi
aj i sume im oznaimo
jMi

Ai =

aj ,

jMi

tada definiramo ponovljeni red kao


X X

aj =

iN jMi

Ai .

iN

Primjer 5.8. Neka je zadana beskonana matrica realnih brojava:

a11 a12 a13 a14 . . .


a21 a22 a23 a24 . . .

A=
a31 a32 a33 a34 . . . .

..
..
..
..
.
.
.
.
Takve matrice esto koristimo za zadavanje ponovljenih redova s obzirom da se particije skupa N
esto mogu lake prikazati koritenjem dvaju indeksa. Iz beskonane matrice moemo definirati
mnogo ponovljenih redova. Navedimo nekoliko primjera:
Sumirajmo prvo lanove matrice po redovima:
Ai =

aij .

j=1

Ako te sume postoje, tj. ako je Ai < , i N, moemo definirati ponovljeni red
X

aij .

i=1 j=1

Sumirajmo prvo lanove matrice po stupcima:


Aj =

aij .

i=1

Ako te sume postoje, tj. ako je Aj < , j N, moemo definirati ponovljeni red
X

X
j=1 i=1

aij .

254

Ponovljeni red
Osim zbrajanja po stupcima ili recima, moemo particiju praviti i na druge naine, npr.
po pavilima koji su slikovito prikazani u sljedeoj matrici:

S obzirom da se iz istog niza (an ) brojeva moe definirati mnogo razliitih ponovljenih redova,
pitanje je koliko se toga u konanici "preslagivanjem" mijenja. Npr. ako jedan ponovljeni red
konvergira, moe li se "preslagivanjem" dogoditi da novonastali ponovljeni red ne konvergira, moe
li se uope definirati ponovljeni red za bilo koju particiju skupa indeksa, itd. Da tako postavljena
pitanja imaju smisla, potvruje sljedei primjer:
Primjer 5.9. Neka je zadana beskonana realna matrica

0 1 1 1 1 1

1 0 1 1 1 1

A = 1 1 0 1 1 1
1 1 1 0 1 1

. . . . . .
.. .. .. .. .. ..

...

...

...
.
...

Svi redovi koji nastaju sumiranjem elemenata iz jednog retka te matrice divergentni su, tj. za
svaki i N divergentni su redovi
X
aij .
j

Dakle, ponovljeni red ne moe se definirati tako da se prvo sumira po redovima zadane beskonane
matrice. Slino vrijedi i ako se prvo sumira po stupcima. Meutim, ako particiju pravimo po bilo
kojoj od dviju shema oznaenih u matricama:

vidimo da sume uvijek postoje. Dakle, ponovljene redove po tim particijama moemo definirati.
Sljedei teorem daje nune i dovoljne uvjete koji jame da se "preslagivanjem" nee promijeniti
suma ponovljenog reda.
Teorem 5.2. Neka je s (an , n N) dan niz realnih brojeva i neka je {Mi , i N} jedna particija
skupa prirodnih brojeva. Red
X
|an |
nN

255

Dodatak
konvergira onda i samo onda ako konvergira red
X X

|aj |.

iN jMi

U sluaju konvegencije sume su im iste.


Dokaz. Pretpostavimo da red
X X

|aj |

iN jMi

konvergira i oznaimo njegovu sumu L. Red

|an | red je s pozitivnim lanovima i oigledno

nN

je njegov niz parcijalnih suma ogranien realnim brojem L. Dakle, i taj red konvergentan je
(pogledati npr. [13]). Nadalje, s obzirom da je apsolutno konvergentan red realnih brojeva ujedno
P
i konvergentan (pogledati npr. [13]), slijedi da je i red
an konvergentan.
nN

Pretpostavimo sada da konvergira red


X

|an |

nN

i njegovu sumu oznaimo s L. Tada za svaki element Mi particije skupa prirodnih brojeva pripadni
red
X
|aj |
jMi

predstavlja red realnih brojeva s pozitivnim lanovima iji je niz parcijalnih suma ogranien. Dakle,
za svaki je i N takav red konvergentan. Oznaimo:
X
|aj | = Ai , i N.
jMi

Dokaimo da i red
X

Ai

iN

konvergira te da mu je suma L. U tu svrhu oznaimo (b1i , i N) podniz niza (|ai |, i N) koji


ine oni elementi s indeksima iz M1 . Analogno, za svaki k N definirajmo odgovarajui podniz
(bki , i N) niza (|ai |, i N) koji ine oni elementi s indeksima iz Mk . Uoimo da je tako nastali
skup podnizova od (|ai |, i N) pokupio sve njegove lanove te da se niti jedan lan ne pojavljuje
vie od jednom. S obzirom da se radi o pozitivnim brojevima, posljedica je toga da za svaki n N
vrijedi:
l
X

A1 + A2 + An = lim

i=1

"
= lim

b1i + lim

l
X

l
X

b2i + + lim

i=1

b1i + +

i=1

l
X

l
X

bni

i=1

#
bni < L.

i=1

Dakle, red s pozitivnim lanovima ogranien je, pa je time i konvergentan. Oznaimo njegovu
sumu V . Oigledno je da je i V L s obzirom da je L gornja mea pripadnog niza parcijalnih
k
P
suma. Pokaimo da je istovremeno i V L. Naime, za svaku k-tu parcijalnu sumu reda
|ai |
i=1

moemo nai dovoljno veliki n tako da je


n
X
i=1

Ai

k
X

|ai |.

i=1

Pripadne e granine vrijednosti onda takoer zadovoljavati istu nejednakost, to znai da je


V L. Dakle, mora biti V = L.

256

Ponovljeni red

Teorem 5.3. Neka je s (an , n N) dan niz realnih brojeva i neka je {Mi , i N} jedna particija
skupa prirodnih brojeva. Ako jedan od redova
X
X X
|an |,
|aj |
iN jMi

nN

konvergira, onda konvergiraju i redovi


X

X X

an ,

aj

iN jMi

nN

i sume su im iste.
Dokaz. Koristei prethodni teorem i injenicu da je apsolutno konvergentan red realnih brojeva
ujedno i konvergentan, da bismo dokazali tvrdnju teorema dovoljno je dokazati da konvergencija
P
P P
reda
|an | povlai konvergenciju reda
aj te da je tada
iN jMi

nN

an =

X X

aj .

iN jMi

nN

U tu svrhu uoimo da iz pretpostavke o konvergenciji reda

|an | moemo zakljuiti:

nN

an konvergentan je. Oznaimo:

nN

V =

an .

nN

|aj | konvergentan je za svaki i N pa je time i

jMi

aj konvergentan. Oznaimo:

jMi

aj = Ai .

jMi

Slino kao u dokazu prethodnog teorema, za svaki i N definirajmo odgovarajui podniz (bik , k
N) niza (aj , j N) koji ine elementi s indeksima iz Mi , tj.
X
bik = Ai .
kN

Uoimo da je tako nastali skup podnizova od (aj , j N) pokupio sve njegove lanove te da se niti
jedan lan ne pojavljuje vie od jednom.
P
Iz apsolutne konvergencije reda
an znamo da za svaki > 0 postoji k0 N takav da je
nN

|aj | < ,

j=k0 +1

odakle slijedi da je




X

k0

X
X



V



a
=
a
|aj | < .
j
j



j=k0 +1 j=k0 +1
j=1
Neka su n0 i l0 dovoljno veliki prirodni brojevi da izraz
n0 X
l0
X
i=1 k=1

bik

k0
X
j=1

aj

(5.1)

257

Dodatak
predstavlja sumu lanova reda

aj s indeksima veim od k0 . Tada za svaki n n0 i l l0

jN

vrijedi:


X

k0
l
X
n X


bik
aj < ,

i=1 k=1

j=1
pa prijelazom na limes po l vidimo da je


X

k0
X
n



A

a
i
j < .

i=1

j=1
Koristei prethodnu nejednakost i nejednakost (5.1) vidimo da je


n
X



A

V

< 2, n > n0 ,
i


i=1

Dakle, red

P P
iN jMi

aj konvergira i suma mu je V .

Literatura
[1] Anderson, T.W. An introduction to Multivariante Statistical Analysis, J. Wiley, 1958.
[2] Bain, L.E, Engelhardt, M. Introduction to Probability and Mathematical statistics,
Duxbury, 2009.
[3] Cohn, D.L. Measure Theory, Birkhuser, Boston-Basel-Stuttgart, 1980.
[4] Chow, Y.S, Teicher, H. Probability Theory, Spronger, New York-Heidelberg-Berlin, 1978.
[5] Daniel, W.W., Terrell, J.C. Business Statistics, Houghton Mifflin Company, Boston,
1989.
[6] Durrett, R. Probability: Theory and Examples, Duxbury Press, 1995.
[7] Elezovi, N. Diskretna vjerojatnost, Element, Zagreb, 2007.
[8] Elezovi, N. Sluajne varijable, Element, Zagreb, 2007.
[9] Elezovi, N. Statistika i procesi, Element, Zagreb, 2007.
[10] Glii, Z., Perunii, P. Zbirka reenih zadataka iz verovatnoe i matematike statistike,
Nauna knjiga, Beograd, 1982.
[11] Ilijaevi, M., Paue, . Rijeeni primjeri i zadaci iz vjerojatnosti i statistike, "Zagreb",
Samobor, 1990.
[12] Ivanovi, B. Teorijaska statistika Jugoslavenski institut za ekonomska istraivanja, Beograd,
1966.
[13] Juki, D., Scitovski, R. Matematika I, Elektrotehniki fakultet, Odjel za matematiku,
Prehrambeno tehnoloki fakultet, Osijek, 2000.
[14] Juki, D Uvod u teoriju mjere i integracije - prvi dio, Odjel za matematiku, Osijek, 2008.
[15] Ivkovi, Z.A. Matematika statistika, Nauna knjiga, Beograd, 1976.
[16] Jamnik, R. Matematina statistika, Dravna zaloba Slovenije, Ljubljana, 1980.
[17] Javor, P. Uvod u matematiku analizu, kolska knjiga, Zagreb, 1988.
[18] Lehmann, E.L. Testing Statistical Hypotheses, J. Wiley, 1959.
[19] Lozanov-Crvenkovi, Z., Rajter, D. Zbirka reenih zadataka iz verovatnoe i statistike,
Prirodno-matematiki fakultet, Novi sad, 1999.
[20] Malii, J. Zbirka zadataka iz teorije verovatnoe sa primenama, Graevinska knjiga, Beograd, 1990.

259

260
[21] Mittelhammer, R.C. Mathematical Statistics for Economics and Bussines, Springer, New
York, 1996.
[22] Paue, . Uvod u matematiku statistiku, kolska knjiga, Zagreb, 1993.
[23] Paue, . Vjerojatnost, informacija, stohastiki procesi, kolska knjiga, Zagreb, 1988.
[24] Pavli, I. Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1985.
[25] Pogny, T. Teorija vjerojatnosti, zbirka rijeenih ispitnih zadataka, Odjel za pomorstvo
Sveuilita u Rijeci, Rijeka, 1999.
[26] Sarapa, N. Teorija vjerojatnosti, kolska knjiga, Zagreb, 1988.
[27] Sarapa, N. Vjerojatnost i statistika I. dio: osnove vjerojatnosti - kombinatorika, kolska
knjiga, Zagreb, 1995.
[28] Sarapa, N. Vjerojatnost i statistika II. dio: osnove statistike - sluajne varijable, kolska
knjiga, Zagreb, 1996.
[29] Seber G.A.F, Lee A.J. Linear Regression Analysis, Wiley, Hoboken-New Jersey, 2003.
[30] Triola, M.F. Elementary Statistics, The Benjamin/Cummings Publishing company, Inc.
1989.
[31] Vrani, V. Vjerojatnost i statistika, Tehnika knjiga, Zagreb, 1971.
[32] Vranjkovi, P. Zbirka zadataka iz vjerojatnosti i statistike, kolska knjiga, Zagreb, 1990.

Indeks
-algebra skupova, 8
partitivni skup, 11
trivijalna, 11
-subaditivnost vjerojatnosti, 16
ebievljeva nejednakost, 90

Generiranje sluajnih varijabli, 109


Geometrijska vjerojatnost, 26
Ishodi pokusa
jednako mogui ishodi, 4
skup svih moguih ishoda, 2

Aksiomi vjerojatnosti, 11
Aritmetika sredina
podataka, 192
sluajnih varijabli X1 , . . . Xn , 166

Jedinka, 181
Jednako distribuirane sluajne varijable, 135
Jednostavna linearna regresija, 206
Jednostavni sluajni uzorak, 201

Bayesova formula, 38
Bernoullijeva shema, 167
Centralni granini teorem, 169
Distribucija
diskretne sluajne varijable, 57
diskretnog sluajnog vektora, 133
uvjetna, 142
Dogaaj, 4, 11
Familija dogaaja, 8
Formula potpune vjerojatnosti, 36
Frekvencija
dogaaja, 7
kategorije kvalitativne varijable, 186
kumulativna, 190
Funkcija distribucije
diskretne sluajne varijable, 66
empirijska, 215
neprekidne sluajne varijable, 67
sluajne varijable, 63
sluajnog vektora, 130
Funkcija gustoe
dvodimenzionalnog sluajnog vektora, 148
marginalna, 149
sluajne varijable, 61
Funkcija jakosti testa, 228

Kategorija
kvalitativne varijable, 182
numerike varijable, 184
Koeficijent korelacije, 157
Kombinacija
r-tog razreda, 251
Komplement skupa, 249
Korelacijska matrica sluajnog vektora, 160
Kovarijanca, 154
Kritino podruje, 227
Kruni dijagram
frekvencija, 186, 189
relativnih frekvencija, 186, 189
Kutijasti dijagram, 196
Kvartil
donji, 194
gornji, 194
Maksimalno odstupanje podataka od aritmetike
sredine, 194
Maksimum podataka, 194
Marginalne distribucije
dvodimenzionalnog diskretnog sluajnog vektora, 134
Matematiko oekivanje
diskretne sluajne varijable, 85

261

262
dvodimenzionalnog sluajnog vektora, 160
neprekidne sluajne varijable, 99
Matrica kovarijanci sluajnog vektora, 160
Medijan
podataka, 193
Minimum podataka, 194
Mod podataka, 195
Modeliranje vjerojatnosti
klasian pristup, 4
statistiki pristup, 6
Moment
r-ti apsolutni diskretne sl. var., 89
r-ti centralni diskretne sl. var., 89
r-tog reda diskretne sl. var., 89
centralni reda (k, l), 154
ishodini reda (k,l), 154
korelacijski, 154
Monotonost
vjerojatnosti, 13
Multinomna distribucija, 138
Nekorelirane sluajne varijable, 156
Nezavisnost
diskretnih sluajnih varijabli, 145
dvaju dogaaja, 33
familije dogaaja, 33
sluajnih varijabli, 161
Nivo signifikantnosti testa
pogledati razina znaajnosti testa, 230
Niz nezavisnih i jednako distribuiranih sluajnih
varijabli (n. j. d. niz), 165
Normalan sluajni vektor
dvodimenzionalan, 148
marginalne distribucije, 149
uvjetne distribucije, 151
Numerike karakteristike
podataka, 192
sluajne varijable, 85
Oekivanje
pogledati matematiko oekivanje, 85
Parametarske distribucije, diskretne, 69
Bernoullijeva, 70
binomna, 71
diskretna uniformna, 69
geometrijska, 76
hipergeometrijska, 77

Poissonova, 73
Parametarske distribucije, neprekidne, 78
dvostrana eksponencijalna, 81
eksponencijalna, 80
normalna ili Gaussova, 82
uniformna, 78
Permutacija, 251
s ponavljanjem, 252
Podskup, 249
Pogreka
drugog tipa, 227
prvog tipa, 227
Pokus
deterministiki, 2
sluajan, 3
Ponovljeni red realnih brojeva, 252
Populacija, 181
Postotna vrijednost podataka
dvadeset pet postotna, 194
pedeset postotna, 194
sedamdeset pet postotna, 194
Potpun sustav dogaaja, 35
Pouzdani interval, 220
za procjenu oekivanja, 221
za procjenu proporcije, 224
Presjek skupova, 249
Princip
jednakosti, 250
produkta, 250
sume, 250
Prostor elementarnih dogaaja, 2
Raspon podataka, 194
Razina znaajnosti testa, 230
Razlika skupova, 249
simetrina, 249
Relativna frekvencija
dogaaja, 7
kategorije kvalitativne varijable, 186
Skup elementarnih dogaaja
vidi prostor elementarnih dogaaja, 2
Slabi zakon velikih brojeva, 164
Slika
diskretne sluajne varijable, 57
dvodimenzionalnog diskretnog sluajnog vektora, 134

263
Sluajna varijabla
diskretna, 55
neprekidna, 60
Sluajni interval, 220
Sluajni uzorak
pogledati pod model jednostavnoga sluajnog uzorka, 201
Sluajni vektor, 130
diskretan dvodimenzionalan, 132
neprekidan dvodimenzionalan, 148
Standardizacija sluajne varijable, 103
Standardna devijacija
podataka, 195
sluajne varijable, 91
Statistika hipoteza, 226
alternativna hipoteza, 227
nul-hipoteza, 227
Statistika stabilnost relativnih frekvencija, 8
Statistiki model, 201
jednostavnoga sluajnog uzorka, 201
neparametarski, 214
parametarski, 202
Statistika, 226
Strea vrijednost, 197
Stupasti dijagram
distribucije diskretne sluajne varijable, 59
Stupasti dijagram
frekvencija, 186, 189
relativnih frekvencija, 186, 189
Sylvesterova formula, 16
Tablica distribucije, 57
diskretne sluajne varijable, 57
dvodimenzionalnoga diskretnog sluajnog
vektora, 134
Teorem o uzastopnom prebrojavanju, 250
Transformacija sluajne varijable, 103
bijektivna diskretne sl. var., 105
bijektivna neprekidne sl. var., 106
nebijektivna, 108
standardizacija, 103
Unija skupova, 249
Uvjetna distribucija
dvodimenzionalnoga diskretnog sluajnog
vektora, 143
Uvjetna gustoa sluajne varijable, 151

Uvjetna vjerojatnost
uz uvjet da se dogodio dogaaj A, 31
Uvjetno oekivanje, 151
Uzorak, 181
realizacija sluajnog uzorka, 201
reprezentativan, 181
sluajni, 182
Varijabla, 181
numerika diskretna, 183
numerika kontinuirana, 183
Varijacija
r-tog razreda, 251
r-tog razreda s ponavljanjem, 251
Varijanca
diskretne sluajne varijable, 89
neprekidne sluajne varijable, 100
podataka, 195
Vjerojatnosni prostor, 12
diskretan, 22
induciran sluajnom varijablom, 58
Vjerojatnost
aksiomatski definirana, 11
na diskretnom , 21
na skupovima R2 i R3 , 29
na skupu R, 25
odreena klasinim pristupom, 5
odreena statistikim pristupom, 7
praznog skupa, 13
suprotnog dogaaja, 12
unije dogaaja, 15
Zakon razdiobe
vidi tablica distribucije, 57

You might also like