Professional Documents
Culture Documents
Nenad uvak
Uvod u vjerojatnost
i statistiku
Osijek, 2014.
Recenzenti:
ISBN 978-953-6931-63-7
Udbenik se objavljuje uz suglasnost Senata Sveuilita J. J. Strossmayera u Osijeku
pod brojem 20/13.
Udbenik se tiska uz financijsku potporu Ministarstva znanosti, obrazovanja i sporta.
Predgovor
Ova knjiga nastala je za potrebe kolegija koji se bave uvoenjem osnovnih pojmova
i koncepata vjerojatnosti i statistike. Za razumijevanje sadraja potrebno je znanje
iz standardnih matematikih kolegija prve studijske godine tehnikih fakulteta u
Republici Hrvatskoj, tj. osnove diferencijalnog i integralnog rauna realnih funkcija
vie varijabli te geometrije ravnine i prostora.
Knjiga je podijeljena u pet poglavlja. Prva tri poglavlja posveena su teoriji vjerojatnosti s obzirom da je ona temelj za razumijevanje modela potrebnih za statistike
analize. etvrto poglavlje odnosi se na statistiku i napisano je s ciljem razumijevanja koncepata koji se koriste u statistikim analizama. Pretpostavka je autora da e
ovladavanje sadrajima iz tog poglavlja dati studentima osnovna znanja potrebna za
razumijevanje i primjenu statistikih modela i statistikih procedura prezentiranih
u literaturi koja se bavi specijalno statistikom. U petom poglavlju navedeni su pojmovi iz algebre skupova te osnovni rezultati iz kombinatorike i teorije ponovljenih
redova koji se koriste u prethodnim poglavljima.
Zahvaljujemo svima koji su pomogli da se ova knjiga tiska i bude to bolja. To se
posebno odnosi na recenzente koji su paljivo proitali rukopis te svojim primjedbama i sugestijama utjecali na poboljanje mnogih dijelova teksta, kao i na kolege
Andreu Krajina, Slobodana Jelia, Mariju Miloloa-Pandur i Ivonu Pulji jer su
svojim sugestijama doprinijeli kvaliteti primjera i zadataka.
Autori e biti zahvalni svim itateljima na primjedbama vezanima uz eventualne
pogreke, nepreciznosti ili nedostatke.
Sadraj
1 Pojam i osnovna svojstva vjerojatnosti
1.1 Prostor elementarnih dogaaja . . . . .
1.2 Klasian pristup . . . . . . . . . . . . .
1.3 Statistiki pristup . . . . . . . . . . . . .
1.4 Definicija vjerojatnosti . . . . . . . . . .
1.5 Osnovna svojstva vjerojatnosti . . . . .
1.6 Vjerojatnost na diskretnom . . . . . .
1.7 Primjeri vjerojatnosti na R . . . . . . .
1.8 Primjeri vjerojatnosti na R2 i R3 . . . .
1.9 Uvjetna vjerojatnost. Nezavisnost . . .
1.10 Zadaci . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
1
2
4
6
8
12
21
25
29
31
39
2 Sluajna varijabla
2.1 Diskretna sluajna varijabla . . . . . . . . . . . . . . . . .
2.2 Neprekidna sluajna varijabla . . . . . . . . . . . . . . . .
2.3 Funkcija distribucije sluajne varijable . . . . . . . . . . .
2.3.1 Funkcija distribucije diskretne sluajne varijable .
2.3.2 Funkcija distribucije neprekidne sluajne varijable
2.4 Primjeri parametarski zadanih diskretnih distribucija . . .
2.4.1 Diskretna uniformna distribucija . . . . . . . . . .
2.4.2 Bernoullijeva distribucija . . . . . . . . . . . . . .
2.4.3 Binomna distribucija . . . . . . . . . . . . . . . . .
2.4.4 Poissonova distribucija . . . . . . . . . . . . . . . .
2.4.5 Geometrijska distribucija . . . . . . . . . . . . . .
2.4.6 Hipergeometrijska distribucija . . . . . . . . . . . .
2.5 Primjeri parametarski zadanih neprekidnih distribucija . .
2.5.1 Uniformna distribucija na intervalu ha, bi . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
55
55
60
63
66
67
69
69
70
71
73
76
77
78
78
iii
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
iv
Sadraj
2.6
2.7
2.8
2.9
3 Sluajni vektor
3.1 Diskretan dvodimenzionalan sluajni vektor . . .
3.1.1 Uvjetne distribucije . . . . . . . . . . . .
3.1.2 Nezavisnost . . . . . . . . . . . . . . . . .
3.2 Neprekidan dvodimenzionalan sluajni vektor . .
3.2.1 Uvjetne gustoe. Nezavisnost . . . . . . .
3.3 Kovarijanca i koeficijent korelacije . . . . . . . .
3.4 Openito o nezavisnosti sluajnih varijabli . . . .
3.5 Neki rezultati o nizovima sluajnih varijabli . . .
3.5.1 Slabi zakon velikih brojeva i Bernoullijeva
3.5.2 Centralni granini teorem . . . . . . . . .
3.6 Zadaci . . . . . . . . . . . . . . . . . . . . . . . .
4 Statistika
4.1 Deskriptivna statistika . . . . . . . . . . . . . .
4.1.1 Metode opisivanja kvalitativnih varijabli
4.1.2 Metode opisivanja numerikih varijabli .
4.1.3 Metode opisivanja ordinalnih varijabli .
4.2 Statistiki model . . . . . . . . . . . . . . . . .
4.2.1 Problem proporcije . . . . . . . . . . . .
.
.
.
.
.
.
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
shema
. . . .
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
80
81
82
85
85
89
93
99
100
103
103
105
108
109
110
.
.
.
.
.
.
.
.
.
.
.
129
132
142
145
148
151
154
161
163
164
169
172
.
.
.
.
.
.
181
182
186
189
198
200
201
Sadraj
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
204
206
208
210
211
213
214
219
220
221
224
226
227
231
235
237
241
5 Dodatak
5.1 Osnove algebre skupova . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Osnovni kombinatorni rezultati . . . . . . . . . . . . . . . . . . . . .
5.3 Ponovljeni red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
249
249
250
252
4.3
4.4
4.5
4.6
Literatura
258
Indeks
260
Poglavlje 1
1.1
b) Mijeanje vode i jestivog ulja pri normalnim atmosferskim uvjetima ima jedinstveni ishod
- stvara se emulzija ulja i vode pri emu ulje pliva na vodi.
c) Pritiskanje papuice "gasa" pri vonji tehniki ispravnog automobila ima jedinstveni ishod
- brzina automobila poveava se. Analogno tomu, pritiskanje konice u istim uvjetima ima
za ishod smanjenje brzine kretanja automobila.
Prostore elementarnih dogaaja koji imaju vie elemenata (barem dva, a moe
i beskonano mnogo!) koristimo ako ne moemo sa sigurnou znati realizaciju
pokusa (promatranja). Za takav pokus kaemo da ima sluajne ishode, tj. da je
pokus sluajan.
Primjer 1.2 (Sluajan pokus).
a) Bacanje igrae kocke - ako nas zanima ishod jednog bacanja igrae kocke, "sve", tj.
prostor elementarnih dogaaja jest skup
{1, 2, 3, 4, 5, 6}.
b) Sluajan izbor znamenke - ako nas zanima ishod sluajnog izbora jedne znamenke u
dekadskom sustavnu, prostor elementarnih dogaaja jest skup
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
c) Loto 6 od 45 - ako nas zanima rezultat izvlaenja u igri "Loto 6 od 45", prostor elementarnih dogaaja jest skup
{{i1 , . . . , i6 } : i1 , . . . , i6 {1, . . . , 45}, 1 i1 < . . . < i6 45} .
d) Ako prognoziramo sutranju temperaturu zraka u Osijeku (u hladu), prostor elementarnih
dogaaja moemo postaviti na razliite naine. Jedna je mogunost, npr. = [50, 50],
ili = [100, 100]. Zapravo, moemo pretpostaviti i da je = [273.15, i, gdje je
273.15 C temperatura poznata pod nazivom apsolutna nula. Vano je da bude neprazan
skup i da uistinu sadri sve mogue realizacije prognoziranja. Naravno da je ponekad
praktino ugraditi ve u to vie informacija o pokusu koji modeliramo, tj. suziti , ali
to nije nuno za modeliranje.
Jednom kad smo odredili prostor elementarnih dogaaja sluajnog pokusa, tj. ,
treba izraziti stupanj vjerovanja da se neki dogaaj dogodi. Meutim, kako opisujemo dogaaj kao matematiki objekt? Do sada znamo da prostor elementarnih
dogaaja sadri sve mogue ishode pokusa, no sadri li i sve dogaaje koji su nama
zanimljivi? Na primjer, u pokusu bacanja igrae kocke zanima nas hoe li se okrenuti paran broj. Oigledno je da e se dogoditi paran broj ako se realizira bilo
koji od ishoda 2, 4 ili 6. Dakle, taj je dogaaj prirodno modelirati kao podskup
od i to kao skup {2, 4, 6}. Oigledno je da emo dogaaje vezane uz neki sluajan pokus modelirati kao podskupove od . Openito u teoriji vjerojatnosti neki
Klasian pristup
podskupovi skupa nisu prikladni da ih zovemo dogaajima, ali zasad neemo detaljno opisivati familiju dogaaja o kojoj e vie rijei biti u poglavlju 1.4. Bit e
nam dovoljno znati da je dogaaj vezan uz dani sluajan pokus uvijek podskup
prostora elementarnih dogaaja tog pokusa.
U nastavku navodimo povijesne pristupe za modeliranje vjerojatnosti dogaaja (klasian i statistiki), kao i definiciju vjerojatnosti koja se danas standardno koristi u
matematikoj teoriji.
1.2
Klasian pristup
Primjer 1.4. U skupini ljudi iz koje se sasvim sluajno bira jedna osoba nalazi se 30 mukaraca
i 60 ena. U tom je pokusu ansa da izaberemo enu 60 : 30. Taj se omjer takoder moe prikazati
na vie naina, tj. kao 6 : 3 ili 2 : 1.
Primjer 1.5. Skup svih moguih ishoda bacanja igrae kocke jest skup = {1, 2, 3, 4, 5, 6}. Budui da je konaan skup i kocka je za igru (pa je pretpostavka da je pravilno izraena, tj.
mogunost realizacije bilo kojeg od brojeva jedan do est jest jednaka), ovdje moemo primijeniti
klasian pristup odreivanja vjerojatnosti. Na primjer, vjerojatnost dogaaja "na gornjoj strani
kocke realizirao se paran broj", koji predstavljamo skupom A = {2, 4, 6} svih parnih elemenata
skupa , jednaka je vjerojatnosti dogaaja "na gornjoj strani kocke realizirao se neparan broj",
koji predstavljamo skupom B = {1, 3, 5} svih neparnih elemenata skupa . Osim toga, vjerojatnosti dogaaja A i B jednake su vjerojatnosti bilo kojeg dogaaja koji moemo predstaviti nekim
trolanim podskupom skupa .
Statistiki pristup
Primjer 1.6. Pretpostavimo da se u eiru nalazi sedam kuglica jednakih karakteristika (od istog
su materijala, jednake mase i promjera). Poznato je da su kuglice numerirane brojevima od jedan
do sedam te da su dvije kuglice crvene, a pet kuglica zelene boje. Promotrimo pokus nasuminog
izvlaenja jedne kuglice iz eira. Na temelju naina provoenja postavljenog pokusa i sadraja
eira moemo promatrati sljedee sluajeve.
Zanimaju nas ishodi sluajnog pokusa temeljeni na broju kojim je kuglica numerirana - u tom
je sluaju prostor elementarnih dogaaja skup
= {1, 2, 3, 4, 5, 6, 7}.
Primjenom klasinog pristupa raunanja vjerojatnosti svi dogaaji koji se mogu predstaviti jednakobrojnim podskupovima skupa jednako su mogui, no kako u eiru ima vie
kuglica numeriranih neparnim brojevima, vjerojatnost dogaaja "izvuena je kuglica numerirana neparnim brojem" koji predstavljamo skupom A = {1, 3, 5, 7} je vea od vjerojatnosti dogaaja "izvuena kuglica numerirana je parnim brojem" koji predstavljamo skupom
B = {2, 4, 6}, tj.
4
3
P (A) = , P (B) = , P (A) > P (B).
7
7
Zanimaju nas ishodi sluajnog pokusa temeljeni na boji kuglice - u tom je sluaju prostor elementarnih dogaaja skup
= {C, Z},
pri emu C oznaava dogaaj "izvuena je kuglica crvene boje", a Z dogaaj "izvuena
je kuglica zelene boje". Budui u eiru ima dvije crvene i pet zelenih kuglica, vidimo da
elementarni dogaaji C i Z nisu jednako mogui, tj.
P (C) =
2
,
7
P (Z) =
5
,
7
1.3
Statistiki pristup
Ideja odreivanja stupnja vjerovanja u pojavu dogaaja kao dijela cjeline ili kao
omjer dijela povoljnog za dogaaj i dijela nepovoljnog za dogaaj moe se iskoristiti
i u drugom kontekstu. Primjer za to jest prognoziranje pobjednika nekog sportskog
nA
n
nA
1.
n
Primjer 1.8. Promotrimo sluajan pokus bacanja pravilno izraenog novia sa skupom elementarnih dogaaja = {p, g}, gdje je p oznaka za dogaaj "palo je pismo", a g oznaka za dogaaj
"pala je glava". U pokuaju definiranja vjerojatnosti da e pri jednom bacanju pasti pismo moemo
koristiti klasian pristup. Na taj nain odreujemo vjerojatnost da padne pismo kao
P ({p}) =
1
.
2
Meutim, kako znamo da je novi pravilno izraen? Iskustveno znamo da to moemo provjeriti
na sljedei nain: ako isti pokus ponovimo n puta, gdje je n N velik broj, kod pravilno se
izraenog novia pismo i glava realiziraju priblino jednak broj puta. U tom e sluaju biti
np n/2 i ng n/2. Prema tome, relativna frekvencija realizacije pisma iznosit e
np
1
n
2
(slika 1.1). U takvom je sluaju razumno uzeti 1/2 kao vjerojatnost pojavljivanja pisma pri jednom
bacanju novia, tj. prihvatiti pretpostavku da je novi pravilno izraen.
Definicija vjerojatnosti
relativne frekvencije
Bacanje novia
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
Slika 1.1: Relativna frekvencija pojave pisma u ovisnosti o broju bacanja n za jedan niz
bacanja.
1.4
Definicija vjerojatnosti
Definicija 1.2. Neka je dan neprazan skup . Familija F podskupova skupa jest
-algebra skupova na ako vrijedi:
i) F,
ii) ako je A F, onda je i Ac F,
iii) ako je dana prebrojiva familija skupova (An , n N) F, onda F sadri i
njihovu uniju, tj.
[
An F.
n=1
Ako je prostor elementarnih dogaaja nekog pokusa, bilo koja -algebra na njemu
moe igrati ulogu familije dogaaja tog pokusa.
Svojstvo ii) naziva se zatvorenost -algebre na komplementiranje (tj. ako sadri
neki skup, sadri i njegov komplement), a svojstvo iii) zatvorenost -algebre na
prebrojivu uniju (tj. ako imamo prebrojivo mnogo skupova iz dane -algebre, onda
e i njihova unija biti element te -algebre).
Iako je -algebra definirana samo s tri zahtjeva, ona moe biti vrlo bogata. Naime, sadri sve skupove koji e nam biti zanimljivi u primjenama, tj. skupove koji
nastaju primjenom konano ili prebrojivo mnogo standardnih skupovnih operacija
nad skupovima koji su njezini elementi. Prije svega, uoimo da je cijeli sigurno
element -algebre, s obzirom da je komplement praznoga skupa. Nadalje, -algebra
sigurno sadri i sve konane unije svojih elemenata jer se konana unija uvijek moe
nadopuniti do prebrojive koritenjem prebrojivo mnogo praznih skupova. Primjerom 1.9 ilustriran je nain na koji moemo provjeriti zatvorenost -algebre i za neke
druge sluajeve.
Primjer 1.9.
Ako su A, B F , prema svojstvu zatvorenosti -algebre na konanu uniju jest skup A B
takoer iz F . Prema De Morganovom zakonu za komplementiranje konane unije skupova
i svojstvu ii) iz definicije -algebre vrijedi
Ac B c = (A B)c F .
Dakle, -algebra sadri i presjek komplemenata svojih dvaju elemenata. S obzirom da za
svaki skup vrijedi (Ac )c = A, slijedi da -algebra sadri i presjeke svakih svojih dvaju
elemenata.
10
Definicija vjerojatnosti
Pokaimo da je -algebra zatvorena i na prebrojive presjeke svojih elemenata. Naime, ako
je (An , n N) F prebrojiva familija skupova, tada je prema svojstvu ii) iz definicije
-algebre i (Acn , n N) takoer prebrojiva familija dogaaja iz F . Nadalje, prema svojstvu
iii) iz definicije -algebre slijedi da je
Acn F .
n=1
[
\
Acn
=
An F .
n=1
n=1
11
iI
Na temelju rezultata poglavlja 1.2 vidimo da vjerojatnost koja je definirana na konanom prostoru elementarnih dogaaja koritenjem klasinog pristupa udovoljava
svim zahtjevima iz definicije 1.31 .
Aksiomatski pristup daje puno vee mogunosti u nainu zadavanja vjerojatnosti.
Vidimo da je mogue zadati vjerojatnost ne samo na konanom skupu nego i na bilo
kojem nepraznom skupu s pripadnom -algebrom, dok na konanom skupu moemo
jasno zadati vjerojatnost i u sluaju da nemamo jednako mogue ishode. Na primjer,
ukoliko smo dugo biljeili rezultate bacanja jedne igrae kocke te utvrdili da se niti
jednom nije okrenuo broj 3, dok se broj 2 pojavljuje priblino dvostruko ee
nego brojevi 1, 4, 5 i 6, koristei statistiki pristup logino bi bilo pretpostaviti da
1 Prvu
12
ishodi nisu jednako mogui te definirati vjerojatnost kao funkciju P koja zadovoljava
zahtjeve iz definicije vjerojatnosti, a ujedno ima i sljedea svojstva: P ({3}) = 0,
P ({2}) = 2P ({1}), P ({1}) = P ({4}) = P ({5}) = P ({6}).
Definicija 1.4. Neka je neprazan skup, F -algebra dogaaja na njemu, a P
vjerojatnost na . Ureenu trojku (, F, P ) zovemo vjerojatnosni prostor.
1.5
Na temelju zahtjeva navedenih u aksiomatskoj definiciji vjerojatnosti mogu se dokazati mnoga druga svojstva koja e automatski biti zadovoljena im znamo da
je zadanom funkcijom definirana vjerojatnost. U ovom poglavlju navedena su i
dokazana neka od njih koja se najee koriste u praksi.
S1. Vjerojatnost suprotnog dogaaja
Neka je (, F, P ) dani vjerojatnosni prostor i A F dogaaj. Suprotni dogaaj
dogaaju A je njegov komplement, tj. dogaaj Ac . Vrijedi:
P (Ac ) = 1 P (A).
Dokaz. Skup moemo prikazati kao uniju disjunktnih skupova A i Ac (slika 1.2).
=AA
Primjer 1.11. U eiru se nalazi dvadeset crvenih i dvije zelene kuglice. Pretpostavimo da svaka
kuglica, bez obzira na boju, moe biti izvuena s jednakom vjerojatnou, tj. ako oznaimo kuglice
k1 , . . . k22 tada pretpostavljamo da je
P ({ki }) =
1
,
22
i {1, . . . , 22}.
13
Pretpostavimo da n puta, n N, izvlaimo tono jednu kuglicu iz eira, ali tako da se nakon
svakog izvlaenja kuglica vraa u eir i pomijea s ostalim kuglicama. Dakle, jedan ishod sluajnog
pokusa koji se sastoji od n izvlaenja jedne kuglice shvaamo kao jednu varijaciju s ponavljanjem
n-tog razreda skupa od 22 razliita elementa, a pripadni je prostor elementarnih dogaaja skup
svih takvih varijacija s ponavljanjem. Znamo da takvih varijacija ima ukupno 22n te da su, zbog
pretpostavke o jednakoj vjerojatnosti izvlaenja bilo koje od 22 kuglice, svi elementi od jednako
vjerojatni. Dakle, za raunanje je vjerojatnosti zanimljivih podskupova od opravdano koristiti
klasian pristup.
Na primjer, zanima nas kolika je vjerojatnost da u tih n izvlaenja kuglice iz eira niti jednom
nije izvuena zelena kuglica. U tu svrhu praktino je koristiti svojstvo vjerojatnosti suprotnog
dogaaja. Naime, definirajmo dogaaj A na sljedei nain:
A - u n je ponavljanja sluajnog pokusa barem je jednom izvuena zelena kuglica.
Njemu suprotan dogaaj jest
Ac - u n ponavljanja sluajnog pokusa niti jednom nije izvuena zelena kuglica
= u n je ponavljanja sluajnog pokusa svaki put izvuena crvena kuglica.
Dogaaj Ac sastoji se od onih elemenata iz iji su svi elementi crvene kuglice, a takvih ima
20n . Slijedi da je
n n
20
10
P (Ac ) =
=
.
22
11
Primjenom svojstva vjerojatnosti suprotnog dogaaja vidimo da je
n
10
P (A) = 1
.
11
14
B\A
B=A(B \ A)
k() = 90;
k(T ) = 30;
k(D) = 10.
Budui da je svaki broj koji je djeljiv brojem devet ujedno djeljiv i brojem tri, zakljuujemo da je
D T . Primjenom klasinog pristupa odreivanju vjerojatnosti slijedi da je
P (D) =
1
k(D)
= ,
k()
9
P (T ) =
k(T )
1
= .
k()
3
Sada moemo izraunati vjerojatnost dogaaja od interesa, tj. dogaaja T \ D. Naime, skup T \ D
sadri sve pozitivne dvoznamenkaste brojeve djeljive brojem tri koji nisu djeljivi brojem devet.
Budui da je D T , slijedi da je
P (T \ D) = P (T ) P (D) =
1
1
2
= .
3
9
9
15
A \ (AB) AB B \ (AB)
k() = 90,
16
k(T ) = 30,
iz primjera 1.12 promatramo i skup svih dvoznamenkastih brojeva djeljivih brojem sedam, tj. skup
S = {n : s N takav da n = 7s} ,
k(S) = 13.
Dogaaj koji nas zanima jest T S, a njegovu emo vjerojatnost odrediti primjenom formule
za vjerojatnost unije dvaju dogaaja. U tu svrhu trebamo odrediti i kardinalni broj skupa svih
dvoznamenkastih brojeva djeljivih i brojem tri i brojem sedam, tj. skupa
T S = {n : t, s N takvi da n = 3t n = 7s} .
Budui da je T S = {21, 42, 63, 84}, tj. k(T S) = 4, slijedi da je
P (T S) = P (T ) + P (S) P (T S) =
1
13
4
39
13
+
=
=
.
3
90
90
90
30
Formula za raunanje vjerojatnosti unije vie skupova moe se dati i openito, tj. za
uniju konano mnogo skupova. Ta formula poznata je pod imenom Sylvesterova
formula. Njezin je dokaz mogue provesti koristei formulu za vjerojatnost unije
dvaju skupova i princip matematike indukcije (vidi [26]).
Vezano uz vjerojatnost unije dvaju skupova valja uoiti da vrijedi nejednakost
P (A B) P (A) + P (B),
gdje su A, B F, a (, F, P ) dani vjerojatnosni prostor. Takva se nejednakost takoer moe generalizirati i to ne samo na uniju konano mnogo dogaaja
nego i na uniju prebrojivo mnogo dogaaja. To generalizirano svojstvo zove se
-subaditivnost vjerojatnosti.
S5. -subaditivnost vjerojatnosti
Neka je (, F, P ) dani vjerojatnosni prostor i neka je (Ai , i I) F, I N,
prebrojiva familija dogaaja toga prostora. Tada je
!
[
X
P
Ai
P (Ai ).
iI
iI
Dokaz. Iz zadane familije dogaaja (Ai , i I), I N, formirat emo novu familiju
meusobno disjunktnih dogaaja na sljedei nain (slika 1.5, slika 1.6):
B 1 = A1 ,
B 2 = A2 \ A1 ,
...,
Bn = An \
n1
[
i=1
Ai , . . . .
17
A2
A1
An
A3
B3
B2
B1
Bn
iI
iI
iI
iI
Odredimo vjerojatnost pojavljivanja bilo kojeg prirodnog broja manjeg ili jednakog od (n + 1), tj.
vjerojatnost dogaaja
S = {1, 2, . . . , n + 1}, n N.
Skup S moe se na razliite naine prikazati kao konana unija familije disjunktnih skupova ili
skupova koji nisu disjunktni. Na primjer, ako definiramo skupove
A1
A2
A3
An
=
=
=
..
.
=
{1, 2},
{2, 3},
{3, 4},
{n, n + 1},
n N,
n
[
i=1
Ai ,
P (Ai ) =
1
3
1
+ i+1 = i+1 ,
2i
2
2
i n.
18
Meutim, P (S) ne moemo dobiti sumiranjem svih P (Ai ) jer (Ai , i n) nije familija disjunktnih
skupova, no ako S prikaemo kao konanu uniju jednolanih skupova (uoimo da su oni ujedno
disjunktni!), tada lako moemo izraunati P (S):
!
n
n
n
[
X
[
1
2n 1
{i} =
S=
{i}, P (S) = P
=
.
i
2
2n
i=1
i=1
i=1
Svojstvo -subaditivnosti vjerojatnosti primijenjeno na uniju skupova Ai , i n, u navedenom
primjeru moemo potvrditi na osnovu nejednakosti
!
n
n
[
X
2n 1
3 2n 1
Ai = P (S) =
P
<
=
P (Ai ), n N.
2n
2 2n
i=1
i=1
An
= lim P (An ).
nN
Dokaz. Prvo uoimo da lim P (An ) postoji. Naime, zbog monotonosti vjerojatn
B 2 = A2 \ A1 ,
. . . Bn = An \ An1 , . . . .
n
[
i=1
Bi ,
[
i=1
Ai =
[
i=1
Bi .
19
A3 A2 A1
An
B3 B2 B1
Bn
n
X
P (Bi ),
i=1
!
Ai
=P
i=1
!
Bi
i=1
P (Bi ) = lim
i=1
n
X
i=1
Primjer 1.15. Pretpostavimo da se radi o istom automatu za igre na sreu kao u primjeru 1.14,
ali zanima nas vjerojatnost pojavljivanja bilo kojeg neparnog broja, tj. vjerojatnost skupa
N = {2n 1 : n N}.
Vjerojatnost skupa N moemo izraunati na nekoliko naina. Ovdje ilustriramo pristup koji
koristi neprekidnost vjerojatnosti u odnosu na rastuu familiju dogaaja.
Prikaimo N pomou familije skupova (An , n N) gdje su skupovi An definirani na sljedei nain:
A1
A2
A3
An
{1},
{1, 3},
{1, 3, 5},
=
=
=
..
.
=
..
.
{1, 3, 5, . . . , 2n 1},
n N,
Ai ,
i=1
P (An )
n
X
i=1
1
22i1
=2
n
X
1
2
1
=
1 n ,
i
4
3
4
i=1
n N.
20
An
= lim P (An ).
n
nN
A1
A2
A3
An
C2=A1 \ A2
C3=A1 \ A3
Cn=A1 \ An
21
[
\
C i = A1 \
Ai ,
i=1
A1 \
!!
Ai
=P
i=1
i=1
!
Ci
i=1
Dakle, vrijedi:
P
A1 \
!!
= P (A1 ) P
Ai
i=1
!
Ai
i=1
Primjer 1.16. Pretpostavimo da se radi o istom automatu za igre na sreu kao u primjeru 1.14.
Odredimo s kojom se vjerojatnou pojavljuje bilo koji paran broj vei ili jednak od unaprijed
zadanog prirodnog broja. Skupove An , za n N, definiramo na sljedei nain:
A1
A2
A3
An
=
=
=
..
.
=
..
.
n N,
To znai da treba odrediti P (An ). Prvo odredimo vjerojatnost presjeka prebrojive familije (An , n
N). Oito je A1 A2 A3 . . . An . . ., tj. (An , n N) je padajua familija skupova za
koju je
X
1
1
=
.
P (An ) =
2k
n1
2
3
4
k=n
Koritenjem neprekidnosti vjerojatnosti u odnosu na padajuu familiju dogaaja vidimo da je
!
\
1
= 0,
P
Ai = lim P (An ) = lim
n
n 3 4n1
i=1
to je i logino s obzirom da je presjek svih skupova Ai zapravo prazan (ne postoji paran broj koji
je vei od svakog prirodnog broja.)
1.6
Vjerojatnost na diskretnom
I N,
Vjerojatnost na diskretnom
22
iIA
iIA
23
Taj rezultat moemo iskoristiti prilikom zadavanja vjerojatnosti na diskretnom vjerojatnosnom prostoru, kao to je ilustrirano sljedeim primjerima:
Primjer 1.17 (Konano mnogo jednako moguih ishoda). Pretpostavimo da sluajan pokus
ima konano mnogo jednako moguih ishoda te da je = {1 , . . . , n }, tj. k() = n. Definirajmo
funkciju P : P() [0, 1] na sljedei nain:
P ({i }) =
1
,
n
i {1, . . . , n},
A = {j : j IA , IA {1, . . . , n}},
P (A) =
P ({i }) .
iIA
Na taj je nain zadana funkcija na P() koja zadovoljava sve zahtjeve definicije vjerojatnosti
(provjerite!). Osim toga, tako definirana vjerojatnost podudara se s klasinim pristupom odreivanja vjerojatnosti.
Primjer 1.18. Neka je prostor elementarnih dogaaja sluajnog pokusa = N. Definirajmo
funkciju na -algebri P(N) na sljedei nain:
P ({i}) =
1
,
2i
A = {i1 , i2 , . . . , in , . . .},
i N,
X
P ({ij }) .
P (A) =
ij A
An
=
=
..
.
=
.
..
n N,
Pri tome je
P (An ) =
X
j=1
1
1.
2anj
Uoimo takoer da, zbog disjunktnosti skupova Ai , meu brojevima anj N nema istih pa
se njihova unija moe prikazati kao
An = {a11 , a12 , . . . , a1j , . . . , a21 , a22 , . . . , a2j , . . . , an1 , an2 , . . . , anj , . . .}.
n=1
S
Vjerojatnost unije dobije se sumiranjem brojeva oblika (2k ) po svim k
An . S obzin=1
S
S
rom da je
An N, niz 2k , k
An podniz je geometrijskog niza s kvocijentom
n=1
n=1
Vjerojatnost na diskretnom
24
1/2. Time je i red koji se dobije sumiranjem lanova tog niza konvergentan i vrijedi (vidi
poglavlje 5.3 u Dodatku):
!
[
X
X
1
An =
P
P (An ).
anj =
2
n=1
n=1 j=1
n=1
iIA
te neka je bilo koji skup koji ima k(I) elemenata. Tada je izrazom
X
P (A) =
pi , A ,
(1.1)
iIA
Ai . Tada
i=1
familija skupova {A1 , A2 , . . . , An , . . .} ini jednu particiju skupa A. Koristei rezultate teorije ponovljenih redova (poglavlje 5.3 u Dodatku) moemo
25
pj =
X X
pj =
iN jIAi
jIA
P (Ai ),
iN
pa vrijedi -aditivnost.
Primjer 1.19. Dan je niz triju brojeva: 16 , 15 i 13 . Moemo li taj niz nadopuniti etvrtim brojem
tako da ta etiri broja dobro definiraju vjerojatnost na diskretnom vjerojatnosnom prostoru u
smislu ovoga poglavlja? Odgovor je potvrdan. Naime, navedena tri broja pozitivna su i manja od
1, a suma im iznosi 21
, to je jo uvijek manje od 1. Dakle, ako za etvrti broj izaberemo razliku
30
21
9
1 30
= 30
, prema rezultatima ovoga poglavlja slijedi da postoji vjerojatnosni prostor na kojemu
pomou tih brojeva moemo zadati vjerojatnost. Npr. uzmemo = {1, 2, 3, 4}, F = P() i
P ({1}) =
1.7
1
,
6
P ({2}) =
1
,
5
P ({3}) =
1
,
3
P ({4}) =
9
.
30
Primjeri vjerojatnosti na R
Postoji mnotvo sluajnih pokusa za koje je prirodno pretpostaviti da prostor elementarnih dogaaja sadri neki interval.
Primjer 1.20. Vrijeme (mjereno u sekundama) koje postie atletiar u utrci na 100 metara moe
se modelirati kao rezultat sluajnog pokusa s vrijednostima iz intervala [0, 13]. S obzirom da se
vrijeme na utrkama danas mjeri vrlo precizno, nije mudro modelirati rezultate takvog pokusa kao
diskretan skup. Zbog toga uzimamo npr. = [0, 13] ili neki vei skup koji sadri interval [0, 13].
d(A)
.
d()
26
Primjeri vjerojatnosti na R
Tako definirana funkcija na -algebri koja sadri sve podintervale od zadovoljavat e zahtjeve
postavljene u definiciji vjerojatnosti2 te je time dobro definirana vjerojatnost na = [1.234567, 1.234568i.
Zovemo ju geometrijska vjerojatnost na = [1.234567, 1.234568i.
Primjer 1.22. Vjerojatnost iz prethodnog primjera definiranu na = [1.234567, 1.234568i moemo proiriti na 0 = R koritenjem nenegativne realne funkcije
(
f (x) =
1
106
, x [1.234567, 1.234568i
.
, x
/ [1.234567, 1.234568i
y
1
106
x
1.234567
1.234568
1
106
I[1.234567,1.234568i (x).
Vjerojatnost dogaaja A 0 (oznaimo je P 0 ) definiramo kao povrinu koju zatvara graf te funkcije s osi apscisa nad intervalom A. Uoimo da za intervale A 0 koji su ujedno i podintervali
od iz primjera 1.21 vrijedi
P 0 (A) = P (A),
gdje je P geometrijska vjerojatnost definirana u primjeru 1.21.
Prednost je zadavanja vjerojatnosti pomou nenegativne funkcije u odnosu na vjerojatnost kao kvocijent duljina intervala u tome to se moe generalizirati i na
probleme u kojima nema razloga pretpostavljati da su svi ishodi jednako mogui.
Primjer 1.23. U primjeru 1.20 nije razumno oekivati istu vjerojatnost da atletiar postigne
vrijeme u intervalu [0, 5] kao u intervalu [8, 13] iako su duljine tih intervala jednake. Naime,
2 Dovoljno
27
poznato je da srednjokolci uobiajeno postiu vrijeme od oko 12 sekundi pri tranju na 100 metara,
a rezultati se atletiara uglavnom kreu izmeu 9 i 10 sekundi. Vjerojatnost koja je definirana na
intervalu [0, 13] koritenjem principa jednako moguih ishoda imala bi pripadni graf funkcije kao
to je prikazano na slici 1.11.
y
1
13
13
Slika 1.11: Graf funkcije koja uniformno definira vjerojatnost na [0, 13]
Preferiranje intervala [8, 13] nad ostatkom moemo npr. predoiti grafom funkcije na slici 1.12.
y
3
20
1
32
13
Slika 1.12: Graf funkcije koja definira vjerojatnost na [0, 13] uz preferiranje intervala [8, 13].
Da bi realnom funkcijom mogli modelirati vjerojatnost na opisani nain bitno je da povrina koju
zatvara njezin graf s osi apscisa iznad cijelog bude jednaka 1, a graf funkcije moe rasti i padati
na tako da odraava stupanj vjerovanja da se pojedini intervali realiziraju u stvarnom pokusu.
Ako elimo neki interval preferirati nad ostalim podrujem, iznad njega i vrijednosti funkcije
kojom opisujemo vjerojatnost trebaju biti vee.
U ovom trenutku neemo se baviti odgovorom na pitanje je li vjerojatnost odreena funkcijom
iji je graf dan na slici 1.12 u skladu s problemom opisanim u primjeru ili treba raditi dodatne
modifikacije. O usklaenosti modela sa stvarnim problemima bit e rijei u drugom dijelu knjige
koji se bavi statistikom.
28
Primjeri vjerojatnosti na R
Z
f (x) dx = 1.
3 (1 x2 ) , x [1, 1]
f (x) =
,
4
0
, x
/ [1, 1]
moemo definirati vjerojatnost na skupu R, tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x) 0, x R,
- normiranost - povrina je ispod grafa funkcije f (pogledati sliku) nad skupom R
Z1
Z
f (x) dx =
3
3 4
(1 x2 ) dx = = 1.
4
4 3
y
3
4
-1
x
3
(1 x2 ) I[1,1] (x).
4
Primjer 1.25. Vaan je primjer nenegativne funkcije f : R R pomou koje moemo definirati
vjerojatnost na R funkcija definirana formulom (slika 1.14)
x2
1
f (x) =
e 2 , x R.
2
29
0.3
0.2
0.1
-4
-2
1.8
1
2
x2
2
Primjeri vjerojatnosti na R2 i R3
4 3
r volumen cijele kugle.
3
30
gdje je x R2 (odnosno, x R3 ).
Uoimo da je za dvodimenzionalne to dvostruki integral, pa postavljeni zahtjev
zapravo znai da volumen tijela koje je omeeno grafom funkcije f i ravninom
(x1 , x2 ) na dijelu za koji vrijedi (x1 , x2 ) mora iznositi 1. Za trodimenzionalne
to je trostruki integral.
Vjerojatnost je skupa3 A tada dana izrazom
Z
P (A) = f (x) dx.
A
0
, za ostale (x, y) R2
moemo definirati vjerojatnost na R2 , tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x, y) 0, (x, y) R2 ,
- normiranost - volumen kojega graf funkcije f zatvara sa skupom R2 , tj. volumen ispod
grafa funkcije f nad pravokutnikom [1, 1] [0, 1] iznosi
Z
f (x, y) dx dy =
3
5
Z1 Z1
(x2 + y) dx dy = 1.
0 1
R2
Prema tome, vjerojatnost skupa A = [0, 1] [0, 0.5] R2 raunamo na sljedei nain:
Z
P (A) =
f (x, y) dx dy =
3
5
Z0.5Z1
0
(x2 + y) dx dy =
7
.
40
0
,
za ostale (x, y, z) R3
moemo definirati vjerojatnost na R3 , tj. da je funkcija f nenegativna i normirana:
- nenegativnost - iz analitike definicije funkcije f slijedi da je f (x, y, z) 0, (x, y, z) R3 ,
- normiranost - volumen kojega graf funkcije f zatvara sa skupom R3 iznosi
Z
f (x, y, z) dx dy dz =
1
8
Z2 Z1 Z0
0
R2
z 2 (x + y) dx dy dz = 1.
0 2
Prema tome, vjerojatnost skupa B = [0, 1] [0, 1] [1, 0] R2 raunamo na sljedei nain:
Z
P (B) =
f (x, y, z) dx dy dz =
B
1
8
Z1 Z1 Z0
0
z 2 (x + y) dx dy dz =
1
.
24
0 1
3 O obliku -algebre na kojoj se moe definirati vjerojatnost pogledati [26]. Specijalno, u dvodimenzionalnom sluaju vjerojatnost se na taj nain moe definirati na najmanjoj -algebri koja
sadri sve skupove oblika (a, b) (c, d), gdje su a, b, c, d R, a < b, c < d.
31
1.9
Primjer 1.30. Nakon izleta napravili smo 5 kopija istog CD-a s fotografijama izleta, ali su
samo tri kopije uspjele. Na CD-ove nismo stavili nikakve oznake i ne znamo koji su ispravni,
a koji ne. Pretpostavimo da smo u urbi i da imamo vremena za provjeru samo jednog CD-a.
Izabrali smo jedan, provjerili i utvrdili da je neispravan. Meutim, u urbi nam se taj provjereni
CD pomijeao s ostalima i sada moramo uzeti jedan bez provjere pa kako bude. Mislite li da bi
vjerojatnost odabira ispravnog CD-a u drugom biranju bila vea da se provjereni CD nije pomijeao
s ostalima? Analizirajmo te sluajeve odvojeno.
1. Pomijeani sluaj. Definirajmo dogaaje:
Li - u i-tom izvlaenu izvuen je neispravan (lo) CD,
Di - u i-tom izvlaenju izvuen je ispravan (dobar) CD,
gdje je i {1, 2}. S obzirom da je nakon prvog izvlaenja sve ponovo pomijeano, pri
drugom izvlaenju CD-a ponovo smo na poetku, tj. rezultat prvog izvlaenja uope nema
utjecaja na rezultat drugog izvlaenja. Dakle, vjerojatnost dogaaja D2 ne ovisi o realizaciji
dogaaja L1 . Slijedi da je vjerojatnost odabira ispravnog CD-a u drugom izvlaenju jednaka
vjerojatnosti odabira ispravnog CD-a u prvom izvlaenju i iznosi 53 .
2. Nepomijeani sluaj. Ovaj puta je drugi pokus bitno promijenjen u odnosu na prvi. Sada
znamo da u drugom izvlaenju biramo od etiri CD-a, od kojih su tono tri ispravna, pa je
vjerojatnost dogaaja D2 uz uvjet da se dogodio L1 jednaka 43 .
U oba sluaja prethodnog primjera pojavljuju se dva izvlaenja CD-a. U pomijeanom sluaju vjerojatnost u drugom izvlaenju ne ovisi o rezultatima prvog izvlaenja
i zapravo je ista kao u prvom izvlaenju. Kaemo da drugo izvlaenje ne ovisi o
prvom izvlaenju i moemo ih promatrati odvojeno. U nepomijeanom sluaju rezultat prvog izvlaenja utjee na vjerojatnost u drugom izvlaenju i nije mudro ta
dva izvlaenja promatrati kao sasvim odvojene cjeline. Da bismo mogli prouavati
takve probleme definirat emo tzv. uvjetne vjerojatnosti koje e opisivati rezultate drugog izvlaenja i to: uvjetnu vjerojatnost uz uvjet da je u prvom pokuaju
izvuen dobar CD i uvjetnu vjerojatnost uz uvjet da je u prvom pokuaju izvuen
lo CD.
Definicija 1.5. Neka je dan vjerojatnosni prostor (, F, P ) i dogaaj A F koji
ima pozitivnu vjerojatnost, tj. P (A) > 0. Funkcija P ( | A) definirana na F izrazom
P (B | A) =
P (A B)
,
P (A)
B F,
(1.2)
32
P (L2 | L1 ) =
1
,
4
2
1
= ,
4
2
P (L2 | D1 ) =
2
1
= .
4
2
P (D2 | L1 ) =
P (D2 | D1 ) =
Vjerojatnost presjeka.
Izraz se iz definicije uvjetne vjerojatnosti esto koristi za izraun vjerojatnosti
presjeka. To omoguuje jednakost (1.2) napisanu na drugi nain (pri emu je
P (A) > 0):
P (A B) = P (B | A)P (A).
Primjer 1.32. Ako u primjeru 1.30, u nepomijeanom sluaju, elimo odrediti vjerojatnost da
su u oba izvlaenja izvueni loi CD-ovi moemo primijeniti ovaj izraz. Dobijemo:
P (L2 L1 ) = P (L2 | L1 )P (L1 ) =
1 2
1
=
.
4 5
10
33
Primjer 1.33. Za sluaj u kojemu smo u primjeru 1.30 pomijeali provjereni CD s ostalima
takoer moemo odrediti uvjetnu vjerojatnost uz uvjet da je u prvom izvlaenju izvuen lo CD,
kao i uvjetnu vjerojatnost uz uvjet da je u prvom izvlaenju izvuen dobar CD. Meutim, te e
dvije uvjetne vjerojatnosti biti jednake, neovisno uvjetujemo li na dogaaj D1 ili L1 . Uvjetne
vjerojatnosti izvlaenja ispravnog, odnosno neispravnog, CD-a u drugom izvlaenju, uz uvjet da
je u prvom izvlaenju izvuen neispravan CD, iznose:
3
2
P (D2 | L1 ) = P (D2 ) = , P (L2 | L1 ) = P (L2 ) = .
5
5
Nadalje, uvjetne vjerojatnosti izvlaenja ispravnog, odnosno neispravnog CD-a u drugom izvlaenju, uz uvjet da je u prvom izvlaenju izvuen ispravan CD, iznose:
3
2
P (D2 | D1 ) = P (D2 ) = , P (L2 | D1 ) = P (L2 ) = .
5
5
Slijedi da je vjerojatnost da su u oba izvlaenja izvueni loi CD-ovi
4
2 2
.
P (L1 L2 ) = =
5 5
25
n
n
\
Y
P
Ai j =
P (Aij ).
j=1
j=1
A i Bc,
Ac i B c
34
Dokaz. Dokaimo samo prvu tvrdnju, ostale se dokazuju analogno. Zbog nezavisnosti je dogaaja A i B P (A B) = P (A)P (B). Upotrebom toga svojstva slijedi:
P (Ac B) = P (B \ (A B)) = P (B) P (A B) =
= P (B) P (A) P (B) = (1 P (A)) P (B) =
= P (Ac ) P (B),
tj. dogaaji Ac i B nezavisni su.
Primjer 1.34. Pojam nezavisnosti dogaaja olakava raunanje vjerojatnosti kod nezavisnog
ponavljanja istog pokusa. Promotrimo pokus izvlaenja kuglice iz eira koji sadri 20 crvenih i 2
zelene kuglice. Odredimo vjerojatnost izvlaenja tono dvije zelene kuglice u 30 ponavljanja toga
pokusa. Prilikom ponavljanja prethodno izvuena kuglica vraa se u eir i sve se dobro promijea.
Da bi rijeili taj problem, prvo emo uoiti da je vjerojatnost izvlaenja zelene kuglice u svakom
pojedinom izvlaenju uvijek ista i iznosi 1/11, dok je vjerojatnost izvlaenja crvene kuglice 10/11.
Prostor elementarnih dogaaja tog sluajnog pokusa sastoji se od ureenih 30-torki slova "c" i
"z" koja oznaavaju boju kuglice izvuene u pojedinom izvlaenju (tj. je skup svih varijacija s
ponavljanjem 30-og razreda dvolanog skupa {c, z}).
Vjerojatnost da su u prvim dvama pokuajima izvuene zelene kuglice, a u svim ostalima crvene,
moemo izraunati kao vjerojatnost presjeka nezavisnih dogaaja, pa ona iznosi
2 28
10
1
.
11
11
Meutim, isto toliko iznosi vjerojatnost pojave svake ureene 30-torke toga pokusa u kojoj su tono
dva slova "z". S obzirom da u ima 30
elemenata koji imaju "z" na tono dvjema pozicijama,
2
1 2
10 28
a svaki od njih ima vjerojatnost 11
11
, onda vjerojatnost izvlaenja tono dviju zelenih
kuglica u tih 30 ponavljanja pokusa iznosi
30 1 2 10 28
.
2
11
11
35
Taj primjer moemo rijeiti tako da prebrojimo sve mogunosti i izraunamo vjerojatnosti presjeka
iz skupa
{Lp Lb , Ip Lb , Lp Ib , Ip Ib }.
Student moe uti tonu informaciju u dvama od navedenih sluajeva: Lp Lb i Ip Ib . Ako mu
brat i prijatelj lau neovisno jedan od drugoga, onda je
P (Lp Lb ) = P (Lp )P (Lb ) =
P (Ip Ib ) = P (Ip )P (Ib ) =
1
,
9
4
,
9
5
.
9
Problem je jednostavan. Meutim, sljedei nain rjeavanja istog primjera sugerira princip koji
se moe generalno primijeniti te olakati raunanje u mnogo sloenijim situacijama.
Uoimo da prijatelj moe samo lagati ili rei istinu. Dakle, dogaaji se Lp i Ip meusobno isljuuju
(disjunktni su) i opisuju sve to se moe dogoditi u odnosu na informaciju koju prenosi prijatelj.
Takoer je
P (A) = P (A Ip ) + P (A Lp ) =
= P (A | Ip )P (Ip ) + P (A | Lp )P (Lp ) =
2 2
1 1
5
= + = .
3 3
3 3
9
Napomena 1.1. Potpun sustav dogaaja {Hi : i I}, I N, ini jednu particiju
prostora elementarnih dogaaja (slika 1.15). Prema tome, bilo koji dogaaj A
mogue je prikazati kao uniju presjeka dogaaja A s dogaajima Hi , I N, potpunog
sustava dogaaja, tj.
[
A=
(A Hi ),
iI
36
H1
...
H2
Hn
...
H1
H2
AH1 AH2
...
Hn
A
...
A Hn
...
...
iI
Primjer 1.36. Ulini kockar ima dva novia od jedne kune: jedan je pravilno izraen (tzv.
standardni novi), a drugi s obiju strana ima slavuja (tj. nepravilno je izraen, tzv. nestandardni
novi). Vama je ponudio da na sluajan nain odaberete jedan novi koji e on baciti dva puta.
Kolika je vjerojatnost da je u oba bacanja odabrani novi pao na slavuja?
Oito traena vjerojatnost ovisi o tome koji smo od dvaju ponuenih novia odabrali. Dakle, kao
potpun sustav dogaaja promatramo familiju {H1 , H2 } gdje su dogaaji H1 i H2 definirani na
37
1
.
2
Primjer 1.37 (Monty Hall problem 4 ). Pretpostavite da igra sudjeluje u igri u kojoj bira
jedna od triju vrata. Iza jednih je vrata automobil, a iza preostalih dvaju vrata nalaze se koze.
Npr. ako igra izabere prva vrata, voditelj igre (koji zna iza kojih vrata se nalazi automobil, a iza
kojih koze) otvorit e ona od preostalih dvaju vrata za koja zna da kriju kozu (slika 1.17).
Nakon toga voditelj pita igraa: "elite li promjeniti va izbor vrata?". Mi se pitamo je li mudro
da igra promijeni izbor?
Promotrimo situaciju u kojoj se automobil nalazi iza drugih vrata, a igra je odabrao prva vrata
- to znai da e voditelj otvoriti trea vrata jer zna da se iza njih nalazi koza. Uvedimo sljedee
oznake za promatrane dogaaje:
Ai - automobil se nalazi iza i-tih vrata,
Ii - igra je izabrao i-ta vrata,
4 Monty
Hall problem prvi put postavljen je 1975. u pismu Stevea Selvina uredniku asopisa
American Statistician, a nazvan je prema voditelju amerikog kviza Lets make a deal.
38
gdje su i, j {1, 2, 3}. Budui da igra ne zna iza kojih se vrata nalazi automobil, dogaaji Ai
i Ij nezavisni su za svaki izbor i i j. Odgovor na pitanje je li mudro za igraa promijeniti izbor
vrata moemo dobiti tako da izraunamo vjerojatnost da se automobil nalazi iza drugih vrata
ako je igra odabrao prva vrata i voditelj potom otvorio trea vrata. Tu vjerojatnost raunamo
primjenom definicije uvjetne vjerojatnosti:
P (V3 (A2 I1 ))
P (V3 | A2 I1 )P (A2 )
P (A2 |I1 V3 ) =
=
.
P (I1 V3 )
P (V3 | I1 )
Kako e u promatranoj situaciji voditelj otvoriti trea vrata jer zna da se iza njih nalazi koza,
slijedi da je P (V3 | A2 I1 ) = 1. Dogaaji A1 , A2 i A3 ine potpun sustav dogaaja i P (A1 ) =
P (A2 ) = P (A3 ) = 1/3. Preostaje izraunati P (V3 | I1 ). Prema formuli potpune vjerojatnosti
slijedi da je
P (V3 | I1 ) = PI1 (V3 ) =
3
X
i=1
3
X
P (Ai | I1 )P (V3 | Ai I1 ) .
i=1
39
Teorem 1.2. Neka je {Hi : i I}, I N, potpun sustav dogaaja na vjerojatnosnom prostoru (, F, P ) i neka je A F dogaaj s pozitivnom vjerojatnosti, tj.
P (A) > 0. Tada za svaki i I vrijedi:
P (Hi | A) =
P (Hi )P (A | Hi )
.
P (A)
(1.4)
P (Hi A)
P (Hi )P (A | Hi )
=
.
P (A)
P (A)
Primjer 1.38. Za problem opisan u primjeru 1.36 pomou Bayesove formule izraunajmo vjerojatnosti P (H1 | A) i P (H2 | A), pri emu dogaaje H1 | A i H2 | A interpretiramo na sljedei
nain:
H1 | A
1
P (H1 | A) = 2 4 = ,
5
5
8
1
1
4
P (H2 | A) = 2
= .
5
5
8
Uoimo da je
P (H1 | A) + P (H2 | A) =
1.10
4
1
+ = 1.
5
5
Zadaci
40
Zadaci
Zadatak 1.2. Odredite prostor elementarnih dogaaja sluajnog pokusa koji se sastoji od bacanja pravilno izraenog novia i pravilno izraene igrae kockice redom, pri emu se kao ishod
registriraju pojava pisma ili glave na noviu i broj na gornjoj strani kockice.
Rjeenje: = {(i, j) : i {P, G}, j {1, . . . , 6}}.
Zadatak 1.3. Odredite prostor elementarnih dogaaja sluajnog pokusa koji se sastoji od bacanja
pravilno izraenog novia i odabira jednog elementa skupa {A, B, C, D, E} redom.
Rjeenje: oznaimo 1 realizaciju pisma i 0 realizaciju glave pri bacanju novia; = {0, 1}
{A, B, C, D, E}.
Zadatak 1.4. Odredite prostor elementranih dogaaja sluajnog pokusa koji se sastoji redom od
bacanja pravilno izraene igrae kockice i pravilno izraenog tetraedra ije su strane numerirane
slovima a, b, c i d.
Rjeenje: = {(i, j) : i {1, . . . , 6}, j {a, b, c, d}}.
Zadatak 1.5. Sluajan pokus sastoji se od uzastopnog bacanja pravilno izraenog novia sve
dok ne padne pismo. Odredite prostor elementarnih dogaaja tog pokusa.
Rjeenje: oznaimo 1 realizaciju pisma i 0 realizaciju glave; = {1, (0, 1), (0, 0, 1), (0, 0, 0, 1), . . .}
Zadatak 1.7. Strijelac gaa metu 4 puta, pri emu se registriraju pogoci (oznaeni nulom) i
promaaji (oznaeni jedinicom). Odredite prostor elementarnih dogaaja i sljedee dogaaje:
a) A - gaanje je zapoelo promaajem,
b) B - rezultat je svih gaanja isti,
c) C - cilj je pogoen dva puta,
d) D - cilj je pogoen barem dva puta.
41
Rjeenje:
= {(0, 0, 0, 0), (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1), (1, 1, 0, 0),
(0, 1, 1, 0), (0, 0, 1, 1), (1, 0, 1, 0), (1, 0, 0, 1), (0, 1, 0, 1), (1, 1, 1, 0),
(0, 1, 1, 1), (1, 0, 1, 1), (1, 1, 0, 1), (1, 1, 1, 1)}.
Zadatak 1.8. Vitez Okruglog stola kralja Arthura, Sir Lancelot, odluio je strijelom gaati jabuku
kroz zlatni prsten u ast kraljice Guinevere. Sir Lancelot ima na raspolaganju samo luk i 4 strijele
i moe gaati jabuku sve dok je ne pogodi 2 puta ili ne potroi sve strijele (pogoci i promaaji ne
moraju se realizirati zaredom). Odredite prostor elementarnih dogaaja te sljedee dogaaje:
A - jabuka je promaena tono dva puta,
B - jabuka je promaena u posljednjem pokuaju.
Jesu li dogaaji A i B disjunktni?
Rjeenje:
= {(1, 1), (0, 1, 1), (1, 0, 1), (0, 0, 1, 1), (0, 1, 0, 1), (1, 0, 0, 1), (1, 0, 0, 0),
(0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1), (0, 0, 0, 0)},
A = {(1, 0, 0, 1), (0, 0, 1, 1), (0, 1, 0, 1)},
B = {(0, 0, 0, 0), (1, 0, 0, 0), (0, 1, 0, 0), (0, 0, 1, 0)}, A B = .
Zadatak 1.9. U natjecanju u streliarstvu lukom i strijelom Robin Hood gaa jednostavnu metu
(jedine mogue realizacije gaanja su ili pogodak ili promaaj) sve dok ju ili ne pogodi dva puta
ili ne promai tri puta (pogoci i promaaji ne moraju se realizirati zaredom). Odredite prostor
elementarnih dogaaja te sljedee dogaaje:
A - druga odapeta strelica promaila je metu,
B - prva i trea odapeta strelica pogodile su metu.
Jesu li dogaaji A i B disjunktni?
Rjeenje:
= {(1, 1), (1, 0, 1), (0, 1, 1), (0, 0, 0), (0, 0, 1, 1), (0, 0, 1, 0),
(1, 0, 0, 0), (0, 1, 0, 1), (1, 0, 0, 1), (0, 1, 0, 0)}, A = {(1, 0, 1), (0, 0, 0), (0, 0, 1, 1), (0, 0, 1, 0), (1, 0, 0, 0), (1, 0, 0, 1)},
B = {(1, 0, 1)},
B A.
Zadatak 1.10. Strijelac gaa cilj oblika krune mete polumjera R, pri emu se mjeri udaljenost
od mjesta pogotka do sredita mete. Odredite prostor elementarnih dogaaja.
Rjeenje: oznaimo O promaaj mete pri gaanju; = [0, R] {O}.
Zadatak 1.11. Neka je prostor elementarnih dogaaja nekog sluajnog pokusa, te neka su A,
B i C dogaaji (A, B, C ). Pomou dogaaja A, B i C izrazite sljedee dogaaje:
a) realizirao se samo dogaaj A,
42
Zadaci
b) realizirali su se dogaaji A i B,
c) realizirala su se sva tri dogaaja,
d) realizirao se barem jedan od dogaaja A, B i C,
e) realizirao se tono jedan od dogaaja A, B i C,
f) realizirali su se barem dva od dogaaja A, B i C,
g) realizirali su se tono dva od dogaaja A, B i C,
h) realizirali su se najvie dva od dogaaja A, B i C,
i) nije se realizirao niti jedan od dogaaja A, B i C.
Rjeenje:
a) A B c C c ,
b) A B,
c) A B C,
d) A B C,
e) (A B c C c ) (Ac B C c ) (Ac B c C),
f ) (A B) (A C) (B C),
g) (A B C c ) (A B c C) (Ac B C),
h) Ac B c C c ,
i) (A B C)c .
Zadatak 1.12. Meu studentima se okupljenima na predavanju sluajno bira jedan student.
Promatramo sljedee dogaaje:
A - student je mukog spola,
B - student je vegetarijanac,
C - student ivi u studentskom domu.
a) Opiite dogaaj A B C.
b) Kada e vrijediti A B C = A?
c) Kada e vrijediti C c B?
d) Kada e vrijediti Ac = B? Vrijedi li nuno ta jednakost ako su svi studenti mukog spola
vegetarijanci?
Rjeenje:
a) Student je mukog spola, vegetarijanac je i ivi u studentskom domu.
b) Vrijedi kad su svi studenti mukog spola vegetarijanci i ive u studentskom domu.
c) Vrijedi kad su svi studenti koji ne ive u studentskom domu vegetarijanci.
d) Ac = B vrijedi ako su svi studenti vegetarijanci enskog spola (B Ac ) i ako su sve
studentice vegetarijanci (Ac B). Ako su svi studenti mukog spola vegetarijanci (tj. ako
je A B) zakljuujemo sljedee:
- Ac B samo ako su svi studenti (bez obzira na spol) vegetarijanci,
- B Ac u opisanoj situaciji ne vrijedi,
43
Zadatak 1.16. Na raspolaganju nam je kutija u kojoj se nalazi 100 papiria numeriranih brojevima 1, 2, . . . , 100. Sluajan pokus sastoji se od izvlaenja jednog papiria iz kutije. Upotrebom
klasine definicije vjerojatnosti odredite vjerojatnosti sljedeih dogaaja:
a) A - izvueni je broj jednoznamenkast,
b) B - izvueni je broj dvoznamenkast,
c) C - izvueni je broj manji ili jednak broju k, k {1, 2, . . . , 100},
d) D - izvueni je broj strogo vei od k, k {1, 2, . . . , 100},
e) E - suma je znamenaka izvuenog broja 3,
f) F - umnoak je znamenaka izvuenog broja 6.
Rjeenje:
a) P (A) = 0.09,
d) P (D) = (100 k)/100,
b) P (B) = 0.9,
e) P (E) = 0.04,
c) P (C) = k/100,
f) P (F ) = 0.04.
Zadatak 1.17. Pravilno izraena igraa kockica baca se dva puta. Upotrebom klasine definicije
vjerojatnosti odredite vjerojatnosti sljedeih dogaaja:
a) A - pali su jednaki brojevi,
b) B - suma je brojeva koji su pali 8,
c) C - produkt je brojeva koji su pali 8,
d) D - suma brojeva koji su pali vea je od produkta brojeva koji su pali,
e) E - produkt brojeva koji su pali vei je od sume brojeva koji su pali.
44
Zadaci
Rjeenje:
a) P (A) = 1/6,
d) P (D) = 11/36,
b) P (B) = 5/36,
e) P (E) = 2/3.
c) P (C) = 1/18,
Zadatak 1.18. Pretpostavimo da u poiljci od ukupno 500 jabuka ima 2% prezrelih jabuka.
Kolika je vjerojatnost da sluajan uzorak od 20 jabuka uzet iz te poiljke sadri tono dvije
prezrele jabuke?
Rjeenje:
10
2
490
18
500
20
364 (366 n)
.
365n1
Zadatak 1.20. U kutiji se nalazi a crvenih i b zelenih kuglica (a 2, b 2). Iz kutije na sluajan
nain istovremeno izvadimo dvije kuglice. Definirajmo sljedee dogaaje:
A
B
a+b
2
Zadatak 1.21. Pravilno izraen novi bacamo 10 puta zaredom. Kolika je vjerojatnost da se
pismo realizira tono tri puta?
Rjeenje:
120
.
210
Zadatak 1.22. Pravilno izraenu igrau kockicu bacamo 10 puta. Kolika je vjerojatnost da se
kao rezultat bacanja brojevi 1, 2, 3, 4, 5, 6 pojave redom 2, 3, 1, 1, 1, 2 puta?
Rjeenje:
10!
.
4 611
Zadatak 1.23. U autobusu se nalazi 15 ljudi. Do kraja putovanja ostale su 4 stanice. Kolika je
vjerojatnost da svi putnici izau na istoj stanici?
Rjeenje: 414 .
45
Zadatak 1.24. Pretpostavimo da n ljudi na sluajan nain sjeda za okrugli stol. Izraunajte
vjerojatnost da e dva unaprijed odabrana ovjeka sjediti zajedno.
Rjeenje:
2
.
n1
n!(m + 1)!
m+1
.
=
m+n
(m + n)!
n
Zadatak 1.26. Sveanj od 52 karte podijeli se na dva jednakobrojna dijela. Odredite vjerojatnost
sljedeih dogaaja:
a) A - u svakom dijelu nalaze se po dva kralja,
b) B - u jednom dijelu ne nalazi se niti jedan kralj,
c) C - u jednom dijelu nalazi se jedan, a u drugom dijelu tri kralja.
48
24
4
2
Rjeenje: P (A) =
52
26
2 48
26
P (B) = ,
8 48
25
P (C) = .
52
26
52
26
Zadatak 1.27. Iz pila od 52 karte na sluajan nain biramo 8 karata. Izraunajte vjerojatnost
da su izvuena
a) tri asa,
b) tri kralja,
c) tri asa ili tri kralja.
48
5
4
3
Rjeenje: a)
52
8
2
,
c)
4
3
48
5
52
8
2
4
3
44
2
Zadatak 1.28. Student je doao na ispit znajui odgovore na 90 od 100 pitanja. Izvlai se pet
pitanja.
a) Kolika je vjerojatnost da e student znati odgovore na svih pet pitanja?
b) Kolika je vjerojatnost da e student znati odgovore na barem tri od pet izvuenih pitanja?
Rjeenje: a)
90
5
100
5
0.584,
b)
90
5
+ 10
90
4
100
5
+
10
2
90
3
0.99.
Zadatak 1.29. Iz eira u kojem se nalazi n kuglica na sluajan nain izaberemo nekoliko kuglica.
Kolika je vjerojatnost da smo izvukli paran broj kuglica?
46
Zadaci
Rjeenje:
2n1 1
.
2n 1
Zadatak 1.30 (De Mereov paradoks). Bacamo tri razliite pravilno izraene igrae kockice.
Zanima nas vjerojatnost sljedeih dogaaja:
(a) A - zbroj brojeva na svim trima kockicama jednak je 11,
(b) B - zbroj brojeva na svim trima kockicama jednak je 12.
27
,
63
Rjeenje: P (A) =
P (B) =
25
.
63
Zadatak 1.31. Standardni sveanj od 52 karte sastoji se od 26 crvenih karata (13 hercova i 13
karo karata) i 26 crnih karata (13 pikova i 13 trefova). Na sluajan nain iz pila biramo 11 karata.
Odredite prostor elementarnih dogaaja i izraunajte vjerojatnosti sljedeih dogaaja:
a) A - izvuena je barem jedna crvena karta,
b) B - izvueno je tono pet crnih karata ili tono sedam hercova.
26
P
Rjeenje: P (A) =
k=1
26
k
26
11k
52
11
P (B) =
26
5
39
+ 13
4
7
.
26
6
52
11
Zadatak 1.32. U eiru se nalazi 100 listia s oznakama od 00 do 99. Ako je xy (ne radi se o
umnoku x y) oznaka na sluajno odabranom listiu, odredite vjerojatnosti dogaaja A = {xy :
x y < 5}, B = {xy : x + y = 11} te dogaaja C = {xy : xy > 60} pod uvjetom da se realizirao
dogaaj D = {xy : y > 7}.
Rjeenje: P (A) = 27/100, P (B) = 2/25, P (C|D) = 2/9.
Zadatak 1.33. Pravilno izraen novi bacamo n puta. Odredite vjerojatnost da se pismo realizira u tono m bacanja, m n.
n
Rjeenje:
2n
Zadatak 1.34. Odredite vjerojatnost da roendani 12 nasumino odabranih ljudi padnu u razliite mjesece u godini?
Rjeenje:
11!
.
1211
Zadatak 1.35. U kutiji se nalazi (n + m) sreki od kojih n dobiva. Na sluajan nain odabere
se k sreki. Kolika je vjerojatnost da meu njima bude j dobitnih?
n m
Rjeenje:
kj
n+m
k
Zadatak 1.36. Odredite vjerojatnost da je sluajno odabrana toka iz segmenta [0, 1] racionalna?
47
Rjeenje: vjerojatnost odabira racionalne toke iz segmenta [0, 1] jest nula, tj. sluajno e odabrana
toka iz segmenta [0, 1] gotovo sigurno biti iracionalna.
Zadatak 1.37. Za fiksiranu toku c [a, b] i sluajno odabranu toku x [a, b] odredite vjerojatnosti sljedeih dogaaja:
a) x c,
b) x < c,
c) x = c,
d) x je blie toki a nego toki b.
Rjeenje:
a)
ca
,
ba
b)
ca
,
ba
c) 0,
d) 0.5.
Zadatak 1.38. Neka su x i y dva sluajno odabrana broja iz segmenta [0, 1]. Odredite vjerojatnost
da za njih vrijedi:
a) x > y,
b) x + y < 3/2,
c) x = y,
d) xy 2/9 i x + y < 1.
Rjeenje:
a) 1/2,
b) 7/8,
c) 0,
d)
1
2
+ ln 2.
3
9
Zadatak 1.39. Neka su x i y dva sluajno odabrana broja iz segmenta [2, 2]. Odredite vjerojatnost da za njih vrijedi y x2 i x < 12 y + 1.
Zadatak 1.40. Dva broda A i B trebaju stii u istu luku. Njihova su vremena dolaska u luku
sluajna, meusobno nezavisna i jednako vjerojatna tijekom 24 sata. Kad brod A stigne u luku,
on ostaje u njoj 1 sat, a brod B 2 sata. Budui da luka ne moe odjednom primiti dva broda,
odredite vjerojatnost da jedan od brodova eka na oslobaanje luke dok drugi brod ne ode.
Rjeenje: 0.121.
Zadatak 1.41. Na krunici polumjera r = 2 cm na sluajan nain biramo dvije toke. Kolika
je vjerojatnost da e udaljenost meu tim tokama mjerena duinski (ne po krunici) biti najvie
2 cm?
Rjeenje: 1/3.
Zadatak 1.42. Na krunici polumjera r na sluajan nain odabrane su tri toke: A, B i C. Kolika
je vjerojatnost da je krunici upisan trokut ABC iljastokutan?
48
Zadaci
Rjeenje: 1/4. Pretpostavite da je poloaj toke A na krunici fiksan, promatrajte duljine krunih
lukova AB i BC te tako odreen prostor elementarnih dogaaja skicirajte u Kartezijevom koordinatnom
sustavu.
Zadatak 1.44. U pravokutniku kojemu se stranice odnose kao 1 : 2 na sluajan nain biramo
jednu toku. Kolika je vjerojatnost da je toka pala:
a) na dijagonalu pravokutnika,
b) blie duljoj stranici pravokutnika?
Rjeenje:
a) 0,
b) 3/4.
Zadatak 1.46. Kolika je vjerojatnost da sluajno odabrana toka u kvadratu bude blia jednoj
od dijagonala nego stranicama kvadrata?
2
.
Rjeenje:
1+ 2
Zadatak 1.47. Vjerojatnost da se knjiga nalazi u knjinici iznosi p. Ako je knjiga u knjinici,
nalazi se na jednoj od n polica s jednakom vjerojatnou (za svaku od tih n polica). Pregledano
je m polica, m < n, i knjiga nije naena. Kolika je vjerojatnost da je knjiga ipak u knjinici?
Rjeenje:
(n m)p
.
n mp
Zadatak 1.48. Pretpostavimo da na sluajan nain odabiremo realne brojeve x [0, 1] i y [0, 2].
Kolika je vjerojatnost da je njihov zbroj vei od dva, a produkt manji od jedan?
Rjeenje:
1
1
ln 2 .
2
4
Zadatak 1.49. Toka A bira se na sluajan nain unutar jednakostraninog trokuta sa stranicom
duljine 3 cm. Kolika je vjerojatnost da udaljenost toke A od bilo kojeg vrha trokuta bude vea
od 1 cm?
Rjeenje:
2
.
9 3
49
Zadatak 1.50. Zadano nam je pet duina ije su duljine 2 cm, 4 cm, 5 cm, 7 cm i 9 cm. Kolika
je vjerojatnost da se od tri sluajno odabrane duine moe konstruirati trokut?
Rjeenje: 2/5.
Zadatak 1.51. Toka A bira se na sluajan nain unutar raznostraninog pravokutnog trokuta.
Kolika je vjerojatnost da je odabrana toka A blia hipotenuzi nego katetama?
Rjeenje: duljinu hipotenuze oznaimo c, a duljine kateta a i b; tada je traena vjerojatnost
c
.
a+b+c
Zadatak 1.52. Trenutak u kojem e neki signal stii do prijemnika sluajno je odabrani trenutak
iz intervala [0, T ]. Prijemnik nee registrirati drugi signal ako je razlika izmeu dva uzastopna
signala manja od , < T . Odredite vjerojatnost da prijemnik nee registrirati drugi signal.
Rjeenje:
(2T )
.
T2
Zadatak 1.53 (Buffonov problem). Ravnina je podijeljena paralelnim pravcima koji su jedan
od drugog udaljeni za 2a. Na tu se ravninu na sluajan nain baca igla duljine 2l, l < a. Odredite
vjerojatnost da igla sijee neki od pravaca.
Rjeenje:
2l
.
a
Zadatak 1.54. Sluajan pokus sastoji se od bacanja pravilno izraenog novia tri puta za redom.
elimo nai vjerojatnost dogaaja A uz dani dogaaj B kada su A i B sljedei dogaaji:
A - glava je pala vie puta nego pismo,
B - prvo je palo pismo.
Rjeenje: P (A|B) = 0.25.
Zadatak 1.55. Iz kutije u kojoj se nalazi m crvenih i n zelenih kuglica na sluajan nain izvueno
je k kuglica. Uz pretpostavku da su sve izvuene kuglice iste boje, kolika je vjerojatnost da su sve
zelene?
n
Rjeenje:
k
m
k
n .
k
Zadatak 1.56. Sluajan pokus sastoji se od sluajnog odabira obitelji koja ima dvoje djece (uz
pretpostavku da su vjerojatnosti roenja kerke i sina jednake (to priblino odgovara stvarnoj
situaciji) te da znamo redoslijed raanja djece u obitelji). Treba provjeriti jesu li sljedei dogaaji
nezavisni:
A - u obitelji je barem jedna kerka,
B - u obitelji su jedna kerka i jedan sin.
50
Zadaci
Zadatak 1.57. Cilj se gaa iz tri topa. Topovi pogaaju cilj nezavisno jedan od drugoga s
vjerojatnou 0.4. Ako jedan top pogodi cilj unitava ga s vjerojatnou 0.3, ako ga pogode dva
topa unitavaju ga s vjerojatnou 0.7, a ako ga pogode tri topa unitavaju ga s vjerojatnou 0.9.
Naite vjerojatnost unitenja cilja.
Rjeenje: 0.3888.
Zadatak 1.58. Imamo dvije kutije. U prvoj se nalazi a bijelih i b crnih kuglica, a u drugoj c
bijelih i d crnih kuglica. Iz prve kutije na sluajan nain biramo k kuglica, a iz druge m kuglica.
Tih (k + m) kuglica izmijeamo i stavimo u treu kutiju.
a) Iz tree kutije na sluajan nain izvuemo jednu kuglicu. Kolika je vjerojatnost da ona
bude bijele boje?
b) Iz tree kutije na sluajan nain izvuemo tri kuglice. Kolika je vjerojatnost da je barem
jedna kuglica bijele boje?
Rjeenje:
1
cm
ak
a)
+
k+m a+b
c+d
b) Pomou formule potpune vjerojatnosti odrediti vjerojatnost suprotnog dogaaja.
Zadatak 1.60. Ptica slijee u sluajno izabrano gnijezdo od ukupno tri gnijezda koja su joj na
raspolaganju. Svako gnijezdo sadri dva jaja i to: u prvom gnijezdu su oba jaja zdrava, u drugom
je jedno zdravo i jedan muak, a u treem su oba jaja muka. Naite vjerojatnost da ptica sjedi
na muku. Ako je sjela na muak, kolika je vjerojatnost da sjedi u drugom gnijezdu?
Rjeenje: ako je sjela na muak, vjerojatnost da sjedi na drugom jajetu jest 1/3.
Zadatak 1.61. Neki izvor emitira poruke koje se sastoje od znakova 0 i 1. Vjerojatnost emitiranja
znaka 1 jest 0.6, a vjerojatnost emitiranja znaka 0 jest 0.4. Na izlazu se iz kanala 10% znakova
pogreno interpretira. Ako je primljena poruka 101, kolika je vjerojatnost da je ona i poslana?
Rjeenje: 0.743.
51
Zadatak 1.62. Svi studenti iz grupe koja se sastoji od a odlinih, b vrlo dobrih i c dobrih
studenata prijavili su ispit iz Uvoda u vjerojatnost i statistiku. Odlian student na ispitu moe
dobiti samo odlinu ocjenu, vrlo dobar student s jednakom vjerojatnou moe dobiti odlinu
ili vrlo dobru ocjenu, a dobar student s jednakom vjerojatnou moe dobiti vrlo dobru, dobru
ili dovoljnu ocjenu. Na ispitu se na sluajan nain proziva jedan student iz grupe. Kolika je
vjerojatnost da on dobije odlinu ili vrlo dobru ocjenu?
Rjeenje:
3a + 3b + c
.
3(a + b + c)
Zadatak 1.63. Iz eira u kojem se nalazi n kuglica na sluajan nain izvlaimo jednu kuglicu.
a) Kolika je vjerojatnost da e ta kuglica biti bijela ako su sve pretpostavke o prethodnom
broju bijelih kuglica jednako vjerojatne?
b) Ako je izvuena bijela kuglica, kolika je vjerojatnost da se sve kuglice u eiru bijele?
Rjeenje:
a) 1/2;
b) 2/(n + 1).
Zadatak 1.64. U mranoj prostoriji nalaze se etiri svjetiljke i sedam arulja. Od etiri svjetiljke
ispravne su dvije, a od sedam arulja ispravne su etiri. Ako na sluajan nain odaberemo etiri
arulje i stavimo ih u svjetiljke, kolika je vjerojatnost da e prostoriju obasjati svjetlo?
Rjeenje: 6/7.
Rjeenje: 13/132.
Zadatak 1.66. Na raspolaganju imamo dvije kutije: u prvoj se nalaze 2 bijele i 4 plave, a u drugoj
3 bijele i 2 plave kuglice. Iz prve kutije na sluajan nain, nezavisno jednu od druge, odaberemo
dvije kuglice i prebacimo ih u drugu kutiju. Kolika je vjerojatnost da potom odabrana kuglica iz
druge kutije bude bijele boje?
Rjeenje: 11/21.
Zadatak 1.67. Iz eira u kojem se nalazi n kuglica izvlaimo nasumino jednu kuglicu. Kolika
je vjerojatnost da e ta kuglica biti bijela, ako su sve pretpostavke o prethodnom broju kuglica
jednako vjerojatne? Nakon to je izvuena bijela kuglica, kolika je vjerojatnost da su sve kuglice
u eiru bijele?
Rjeenje:
2
.
n+1
52
Zadaci
Zadatak 1.68. U tri kutije nalaze se ute i zelene kuglice. U prvoj kutiji nalazi se 5 utih i 3
zelene kuglice, u drugoj kutiji nalaze se 4 ute i 4 zelene kuglice, a u treoj 3 ute i 5 zelenih
kuglica. Na sluajan nain iz svake kutije izaberemo po etiri kuglice i stavimo u etvrtu kutiju.
Zatim iz etvrte kutije na sluajan nain uzmemo jednu kuglicu. Kolika je vjerojatnost da je ta
kuglica zelene boje?
Zadatak 1.69. U eiru se nalaze 4 bijele kuglice. Tri se puta na sluajan nain izvlai jedna
kuglica i zamjenjuje crnom kuglicom. Potom je na sluajan nain izvuena jedna kuglica i vidjelo
se da je bijela. Koliko iznosi vjerojatnost da su u eiru tono dvije crne kuglice nakon opisanih
zamjena?
Zadatak 1.71. etiri strijelca gaaju metu (pretpostavljamo da je meta jednostavna, tj. da su
mogue realizacije gaanja ili pogodak ili promaaj). Vjerojatnosti pogotka za pojedine strijelce
iznose redom 0.6, 0.7, 0.8, 0.9.
a) Izraunajte vjerojatnost da barem tri strijelca pogode metu.
b) Ako je meta pogoena s tri hica, izraunajte vjerojatnost da su ju pogodili prvi i drugi
strijelac.
Zadatak 1.72. Grupa od 10 studenata dola je na ispit na kojemu svaki student odgovara na tri
sluajno odabrana pitanja od 20 ponuenih. Tri su studenta ispit pripremila odlino, etvorica
dobro, dvojica dovoljno i jedan loe. Odlino pripremljen student zna odgovore na svih 20 pitanja,
dobro pripremljen student na 16, dovoljno pripremljen student na 10 i loe pripremljen student
na 5 pitanja. Kolika je vjerojatnost da je sluajno odabrani student tono odgovorio na sva tri
postavljena pitanja?
Zadatak 1.73. Pokaite da sljedeim realnim funkcijama realne varijable moemo definirati vjerojatnost na R:
(
3
(1 x2 ) , x [1, 1]
4
a) f (x) =
.
0
, x 6= [1, 1]
(
ex , x (0, )
b) f (x) =
.
0
, x (, 0]
c) Koristei funkcije iz zadataka a) i b) odredite vjerojatnost dogaaja
A = {x R : 1/2 < x 1/2} = (1/2, 1/2].
53
Rjeenje: obje su funkcije su nenegativne i normirane, pa pomou njih moemo definirati vjerojatnost
na R. Vjerojatnost dogaaja A je: a) P (A) = 11/16, b) P (A) = 1 e/2 .
Poglavlje 2
Sluajna varijabla
Prouavanje cijelog prostora elementarnih dogaaja nekog sluajnog pokusa i vjerojatnosti zadane na njemu moe biti vrlo sloen zadatak. Skupovi elementarnih
dogaaja mogu sadravati razne objekte, npr. brojeve, ureene parove, ureene
n-torke, nizove brojeva, slova, nizove slova, boje, itd. Meutim, vrlo se esto na
interes za sluajan pokus svodi samo na prouavanje jedne ili nekoliko karakteristika
koje moemo opisati (ili kodirati) numeriki.
Primjer 2.1. Ispit se sastoji od 10 pitanja viestrukog izbora. Ispit je za kandidata sluajan pokus. Prostor elementarnih dogaaja takvog pokusa jest skup ureenih desetorki s oznakama koje se
koriste za "toan odgovor", odnosno "netoan odgovor". Meutim, prilikom polaganja ispita kandidata prvenstveno zanima koliko e ukupno imati tonih odgovora, a ne i koji e po redu odgovor
biti toan. Dakle, njega zanima modeliranje na skupu moguih ishoda {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}.
Osim toga, zanima ga i koliku e ocjenu postii, to znai da ga zanima i skup moguih ishoda
{1, 2, 3, 4, 5}.
Da bismo za dani sluajni pokus analizirali i modelirali pojedinane sluajne karakteristike ili vie njih, u ovom poglavlju definirat emo pojam sluajne varijable, a u
sljedeem pojam sluajnog vektora.
2.1
56
Sluajna varijabla
Prostor
elementarnih
dogaaja
Oznake analogne onima iz primjera 2.2 koristimo openito kad raunamo sa sluajnim varijablama. Tako emo za A R uvesti sljedeu oznaku:
{X A} = { : X() A},
a za vjerojatnost tog skupa
P {X A} = P ({ : X() A}) .
Primjerice, za dani x R koristimo oznaku
{ : X() = x} = {X = x}.
57
Primjer 2.3. Vratimo se primjeru 2.2. Skup je svih moguih realizacija sluajne varijable X
koja broji prodane proizvode skup {0, 1, 2, 3, 4}.
Naime, vjerojatnosna svojstva te sluajne varijable odreena su ako ulogu prostora elementarnih
dogaaja preuzme R(X) = {0, 1, 2, 3, 4}. Na njemu vjerojatnost zadajemo nizom brojeva:
p0 = P {X = 0},
p1 = P {X = 1},
p2 = P {X = 2},
p3 = P {X = 3},
p4 = P {X = 4}.
Prebrojavanjam elementarnih dogaaja iz (primjer 2.2) te primjenom aditivnosti vjerojatnosti
slijedi:
1
1
3
1
1
p0 =
,
p1 = ,
p2 = ,
p3 = ,
p4 =
.
16
4
8
4
16
Radi preglednosti emo tu diskretnu sluajnu varijablu zapisati pomou sljedee tablice:
0 1 2 3 4
X = 1 1 3 1 1 .
16 4 8 4 16
i I.
x1 x2 x3 xn
p1 p2 p3 pn
!
(2.1)
i taj prikaz zovemo zakon razdiobe, tablica distribucije ili, krae, distribucija
sluajne varijable X.
Dakle, za svaku diskretnu sluajnu varijablu moemo istaknuti dva bitna skupa
brojeva. Jedan ine sve vrijednosti koje sluajna varijabla X moe primiti, tj. skup
R(X) = {xi : i N} kojega zovemo slika sluajne varijable, a drugi je niz pripadnih
vjerojatnosti, tj. (pi , i N) takav da vrijedi pi = P {X = xi }, i N.
Uoimo da za elemente od R(X) vrijedi xi 6= xj za i 6= j s obzirom da je to skup,
dok u nizu (pi , i N) moe biti istih elemenata, ali on ima druga dva bitna svojstva:
58
Sluajna varijabla
1. 0 pi 1 za svaki i N,
2.
pi = 1.
i=1
pi =
i=1
P {X = xi } = P
i=1
!
{X = xi }
= P {X R(X)} = 1.
i=1
Koristei rezultate poglavlja 1.6 znamo da je pomou niza realnih brojeva (pi , i N)
koji zadovoljava svojstva
1. 0 pi 1 za svaki i N,
2.
pi = 1
i=1
dobro definirana vjerojatnost na diskretnom vjerojatnosnom prostoru koji za prostor elementarnih dogaaja ima skup R(X) = {xi , i N}.
Ako brojevi pi ujedno zadovoljavaju svojstvo
P {X = xi } = pi ,
i N,
vjerojatnost definiranu na R(X) = {xi , i N} oznaavat emo PX , a novonastali vjerojatnosni prostor (R(X), P(R(X)), PX ) zovemo vjerojatnosni prostor
induciran sluajnom varijablom X.
Primjer 2.4. Zbroj brojeva koji su se okrenuli prilikom bacanja dviju pravilno izraenih igraih
kockica modeliran je diskretnom sluajnom varijablom sa sljedeom tablicom distribucije:
2 3 4 5 6 7 8 9 10 11 12
X=
1 2 3 4 5 6 5 4 3 2 1 .
36 36 36 36 36 36 36 36 36 36 36
Ako nas zanima vjerojatnost dogaaja
A - zbroj je brojeva na kockicama je manji od 6,
za izraun emo iskoristiti prethodnu tablicu distribucije:
P (A) = P {X < 6} = P { : X() < 6} =
1
2
3
4
5
+
+
+
=
.
36
36
36
36
18
59
y
1
2
1
4
1
18
16
60
Sluajna varijabla
y
1
2
0.5
0.4
0.3
4
1
0.2
1
0.1
16
1
16
Slika 2.3: Stupasti dijagram distribucije diskretne sluajne varijable iz primjera 2.2.
2.2
U tom poglavlju definirat emo jedan tip sluajne varijable ija je slika R(X) podskup od R i sadri interval.
Definicija 2.2. Neka je dan vjerojatnosni prostor (, F, P ) i funkcija X : R
za koju vrijedi:
1 Za
61
Z
f (x) dx = 1.
Z
f (x) dx moemo prikazati kao
Dokaz.
Zn
f (x) dx = lim
f (x) dx.
3. Vjerojatnost da sluajna varijabla X, ija je funkcija gustoe f , primi vrijednost iz intervala (a, b] moe se izraunati koritenjem funkcije gustoe na
sljedei nain (vidi sliku 2.4):
Zb
P {a < X b} = P {X ha, b]} =
f (x) dx.
a
62
Sluajna varijabla
Dokaz. Koristei svojstva vjerojatnosti i svojstva integrala slijedi:
P {a < X b} = P {X b} P {X a} =
Zb
Za
Zb
f (x) dx = f (x) dx.
f (x) dx
=
Prostor
elementarnih
dogaaja
Dogaaj
{a<Xb}
f(x)
P{a<Xb}
Slika 2.4: Vjerojatnost kao povrina od osi x do grafa funkcije gustoe nad izabranim
intervalom.
Ako je zadana nenegativna funkcija f : R R koja zadovoljava svojstvo normiranosti, moe se dokazati da postoji vjerojatnosni prostor (, F, P ) i neprekidna
sluajna varijabla X na njemu za koju je f funkcija gustoe (vidi [26]).
Primjer 2.8. Analizirajmo moe li funkcija f : R R (vidi sliku 2.5) definirana izrazom
(
sin x , x 0, 2
f (x) =
0 , x
/ 0, 2
posluiti kao funkcija gustoe neke neprekidne sluajne varijable X. Ako moe, odredimo
n
o
<X
P
.
4
2
y
1
63
Z0
Z2
f (x) dx =
f (x) dx +
f (x) dx +
Z2
sin x dx = 1.
0
2.3
o
<X
=
4
2
Z2
sin x dx =
2
.
2
Diskretna i neprekidna sluajna varijabla samo su dva tipa sluajnih varijabli koje
se najee koriste u praksi. Openito, ako je dan bilo kakav vjerojatnosni
prostor (, F, P ), svaku funkciju X definiranu na sa skupom vrijednosti
iz R koja zadovoljava svojstvo
{X x} F,
x R,
64
Sluajna varijabla
2. Neka je F funkcija distribucije neke sluajne varijable. Tada vrijedi:
lim F (x) = F () = 0.
nN
xx0
F (x + hn ) F (x) = P {x < X x + hn },
!
\
lim (F (x + hn ) F (x)) = P
{x < X x + hn } = P () = 0.
nN
xx0
tj. funkcija distribucije ne mora nuno biti neprekidna i slijeva, no limes slijeva
uvijek postoji i stoga uvodimo sljedeu oznaku:
lim F (x) = F (x0 ) .
xx0
Primjer 2.9. Neka je dana diskretna sluajna varijabla X kojom modeliramo bacanje pravilno
izraenog novia. Ako oznaimo "uspjeh" (npr. palo je "pismo") brojem 1, a "neuspjeh" brojem
0, tablica distribucije ove sluajne varijable jest
!
0 1
X= 1 1 .
2 2
65
Funkcija distribucije ima vrijednost 0 za sve x koji su manji od 0. U broju 0 prima vrijednost
i ostaje na toj vrijednosti sve do broja 1 kada prima vrijednost 1, tj.
0 , x h, 0i
1
F (x) = P {X x} =
.
, x [0, 1i
2
1 , x [1, i
1
2
Graf funkcije distribucije te sluajne varijable prikazan je na slici 2.9. Uoimo da navedena
funkcija distribucije nije neprekidna slijeva.
y
1
0.5
-3
-2
-1
Slika 2.6: Funkcija distribucije za sluajnu varijablu kojom modeliramo bacanje pravilno izraenog novia.
Koristei funkciju distribucije i svojstva vjerojatnosti moemo lako raunati vjerojatnost da sluajna varijabla primi vrijednost iz nekog skupa A, gdje je skup A neki
interval, prebrojiva unija ili presjek intervala, njihova razlika i slino. Primjerice,
za a, b R takve da je a < b vrijedi:
P {a < X b}
P {X b} P {X a} = F (b) F (a),
P {X = a}
{a
n=1
P {a X b}
1
n
< X a} =
lim (F (a) F (a n1 )) =
F (a) F (a),
=
=
P {X = a} + P {a < X b} =
F (b) lim F (a n1 ) =
F (b) F (a)
i slino.
Specijalno, ako je sluajna varijabla diskretna, funkcija distribucije moe se izraziti koristei tablicu distribucije sluajne varijable, a ako je neprekidna, koristei
pripadnu funkciju gustoe.
66
Sluajna varijabla
2.3.1
x1 x2 x3 xn
p1 p2 p3 pn
!
,
Za svaki x R vrijedi:
F (x) = P {X x} =
pi .
xi x
Uoimo da je takva funkcija distribucije stepenasta funkcija, tj. funkcija sa skokovima u tokama xi , dok na intervalu [xi , xi+1 ) prima stalno istu vrijednost koja je
jednaka F (xi ) (vidi npr. sliku 2.6).
Primjer 2.10. Neka je diskretna sluajna varijabla zadana sljedeom tablicom distribucije:
!
2 1 0 1 2
X=
.
0.1 0.2 0.4 0.2 0.1
Prema definiciji funkcije distribucije slijedi da je funkcija distribucije sluajne varijable X definirana izrazom
0.1
0.3
F (x) =
0.7
0.9
1
Njezin graf prikazan je slikom 2.10.
,
,
,
,
,
,
x (, 2)
x [2, 1)
x [1, 0)
.
x [0, 1)
x [1, 2)
x [2, )
y
1
0.9
0.7
0.3
0.1
-2
-1
Slika 2.7: Graf funkcije distribucije diskretne sluajne varijable X iz primjera 2.10.
67
2.3.2
Zx
P {X x} =
f (t) dt, x R.
f (t) dt,
x0 R.
f (x)
F (x0 )
x0
Slika 2.8: Funkcija gustoe i vrijednost funkcije distribucije u x0 (osjenana povrina) neprekidne sluajne varijable.
Iz dobro poznatih svojstava integrala oigledno je da je, za razliku od diskretnog
sluaja, funkcija distribucije neprekidne sluajne varijable neprekidna funkcija u
svakoj toki x R. Takoer, funkcija gustoe neprekidne sluajne varijable X
moe se dobiti kao derivacija pripadne funkcije distribucije u gotovo svakoj toki
x R, tj. f (x) = F 0 (x).
Odavde slijedi i sljedee vano svojstvo za neprekidne sluajne varijable.
Neka je X neprekidna sluajna varijabla. Tada za svaki x0 R vrijedi:
P {X = x0 } = 0.
68
Sluajna varijabla
!
1
P {X = x0 } = P
{x0 < X x0 } =
n
n=1
1
= 0.
= lim F (x0 ) F x0
n
n
Primjer 2.11. Odredimo funkciju distribucije neprekidne sluajne varijable s funkcijom gustoe
definiranom sljedeim izrazom:
(
sin x , x 0, 2
.
f (x) =
(2.2)
0 , x
/ 0, 2
Ako je x h, 0], tada je
Zx
F (x) = P {X x} =
f (x)dx = 0.
Za x h0, /2] je
Z0
F (x) = P {X x} =
Zx
f (x)dx +
Zx
sin xdx = 1 cos x.
f (x)dx =
0
0
, x h, 0]
1
, x h/2, )
Graf te funkcije distribucije prikazan je na slici 2.11. Uoimo da je funkcija F neprekidna.
y
1
Slika 2.9: Graf funkcije distribucije neprekidne sluajne varijable X s gustoom (2.2).
Intuitivno znaenje naziva "gustoa sluajne varijable" za neprekidne sluajne varijable moe se prepoznati iz injenice da je funkcija gustoe neprekidne sluajne
69
2.4
Neki tipovi tablica distribucije diskretnih sluajnih varijabli koji se esto koriste u
praksi daju se jednostavno opisati koristei jedan ili nekoliko realnih brojeva (parametara). Za takve distribucije kaemo da se mogu zadati parametarski i svrstavamo
ih u parametarske familije distribucija s prepoznatljivim imenima i svojstvima. U
ovom poglavlju definirat emo nekoliko takvih familija.
2.4.1
1
, i = 1, 2, . . . , n.
n
Takve distribucije koriste se ako sluajna varijabla X moe primiti samo vrijednosti
iz skupa R(X) = {x1 , x2 , . . . , xn } i to tako da je vjerojatnost realizacije svakog
pojedinog ishoda ista, tj. P {X = xi } = 1/n za svaki i {1, . . . , n}.
Uoimo da je na taj nain dobro definirana tablica distribucije s obzirom da je
n
P
pi = 1. Takoer, pripadni niz vjerojatnosti ovisi samo o broju elemenata skupa
i=1
1 2 3 4 5 6
X=
1 1 1 1 1 1 .
6 6 6 6 6 6
Graf distribucije bacanja igrae kockice prikazan je slikom 2.10.
70
Sluajna varijabla
y
1 2 3 ... m 1 m
X=
1 1 1
1
1 .
...
m m m
m m
2.4.2
Bernoullijeva distribucija
Neka je X sluajna varijabla koja moe primiti tono dvije vrijednosti, i to R(X) =
{0, 1}. Njezina distribucija dana je tablicom distribucije
!
01
, p h0, 1i, q = 1 p.
X=
qp
Za takvu sluajnu varijablu rei emo da ima Bernoullijevu distribuciju s parametrom p, pri emu parametar p ima znaenje vjerojatnosti da X primi vrijednost
1.
Bernoullijev tip distribucije koristi se pri modeliranju sluajnih karakteristika koje
mogu imati tono dvije vrijednosti. Te mogue vrijednosti uglavnom zovemo "uspjeh" i "neuspjeh" te koristimo oznake 1 za "uspjeh", a 0 za "neuspjeh". Dakle,
parametar p Bernoulijeve distribucije ima znaenje vjerojatnosti pojavljivanja "uspjeha".
Primjer 2.14. Igramo kockarsku igru u kojoj ostvarujemo dobitak ako se na pravilno izraenoj igraoj kocki okrene estica (to interpretiramo kao uspjeh i oznaavamo 1). Ishod te igre
modeliramo Bernoullijevom sluajnom varijablom X s tablicom distribucije
0 1
X = 5 1 .
6 6
Graf distribucije prikazan je slikom 2.11.
71
1
6
2.4.3
Binomna distribucija
100
i
72
Sluajna varijabla
n
P
pi = 1. Vrijedi:
i=0
n
X
n i ni
pq
= (p + q)n = 1.
pi =
i
i=0
i=0
n
X
Primjer 2.17. Pretpostavimo da iz velikog skladita slatkia (u kojemu se nalaze okolade, bomboni, keksi, . . . ) 10 puta nezavisno izvlaimo po jedan slatki. Ako je vjerojatnost da u jednom
izvlaenju izvuemo okoladu p = 0.3, tada sluajna varijabla koja opisuje broj izvuenih okolada u 10 nezavisnih izvlaenja ima binomnu distribuciju s parametrima n = 10 i p = 0.3, tj.
X B(10, 0.3). Tablica distribucije sluajne varijable X jest
0
1
2
. . . 10
10
10
.
X=
0.32 0.78 . . . 0.310
0.3 0.79
0.710
2
1
Graf ove distribucije prikazan je slikom 2.12.
y
0.25
0.20
0.15
0.10
0.05
1 2 3 4 5 6 7 8 9 10
73
2
X
10
0.3k (1 0.3)10k 0.383,
k
k=0
1
X
10
k=0
2.4.4
Poissonova distribucija
Definicija 2.5. Sluajna varijabla X ima Poissonovu distribuciju s parametrom > 0 ako prima vrijednosti iz skupa {0, 1, 2, . . . } s vjerojatnostima
pi = P {X = i} = e
i
.
i!
74
Sluajna varijabla
y
0.20
0.15
0.10
0.05
1 2 3 4 5 6 7 8 9101112131415
Slika 2.13: Graf Poissonove distribucija s parametrom 3 za skup realizacija {0, 1, 2, . . . , 15}.
pi = 1.
i=0
Vrijedi:
X
e i
i=0
i!
= e
X
i
i=0
i!
= e e = 1.
Primjer 2.18. Pretpostavimo da neki kafi u toku jednog sata u prosjeku posjeti 15 ljudi. Sluajna
varijabla koja broji posjetitelje kafia tijekom jednog sata jest Poissonova sluajna varijabla s
parametrom = 15, tj. X P(15). Ona prima vrijednosti iz skupa R(X) = {0, 1, . . .} s
vjerojatnostima
15i 15
pi =
e
, i R(X).
i!
Na temelju navedenih informacija moemo odrediti sljedee vjerojatnosti:
a) vjerojatnost da je kafi u toku jednog sata posjetilo tono 20 ljudi:
P {X = 20} =
1520 15
e
0.042,
20!
14
X
15i 15
e
0.466,
i!
i=0
10
X
15i 15
e
0.882.
i!
i=0
Poissonova distribucija moe se dobiti i kao aproksimacija binomne ako je parametar n binomne distribucije jako velik, a vjerojatnost p realizacije uspjeha mala.
Ilustracija te tvrdnje dana je primjerom 2.19.
Primjer 2.19. Telefonska centrala u vremenskom periodu u trajanju od pola sata prima 600
poziva uglavnom ravnomjerno rasporeenih u spomenutom vremenu (tj. u prosjeku 20 u minuti).
Broj poziva u prvoj minuti moemo modelirati binomnom distribucijom. Naime, vjerojatnost da
se poziv dogodi u prvoj od tih 30 minuta jest p = 1/30 (jer su pozivi uglavnom jedoliko rasporeeni
u vremenu). Meutim, broj je poziva u minuti sluajna varijabla pa, iako je prosjean broj poziva
75
u minuti 20, u modelu moramo pretpostaviti da se u prvoj minuti moe dogoditi od 0 do 600
poziva. Dakle, n = 600 za tu binomnu sluajnu varijablu. Uoimo da prosjean broj poziva po
minuti iznosi np.
Problem je s binomnom distribucijom u navedenom primjeru prvenstveno taj da moramo pretpostaviti maksimalan broj poziva u minuti, to u modelu telefonske centrale nije razumno. Meutim,
tu je n = 600 velik, a p = 1/30 malen, pa vjerojatnosti zadane po binomnoj distribuciji moemo dobro aproksimirati vjerojatnostima po Poissonovoj distribuciji s parametrom koji odgovara
prosjenom broju poziva po minuti, tj. = np = 20.
pi (n)
=
=
n(n 1)(n 2) (n i + 1) i
ni
1
=
n n
i!
n
1
2
i1
i
1
1
1
1
i 1
1
.
i!
n
n
n
n
n
1 i
e .
i!
y
0.08
Binomna
0.06
Poissonova
0.04
0.02
0
20
40
60
80
1
Slika 2.14: Graf binomne B(600, 30
) i Poissonove P(20) distribucije za i = 0, . . . , 100.
76
Sluajna varijabla
2.4.5
Geometrijska distribucija
c\ c\ \ c\
k1
A
A
p,
P {X = k} = P
A
A
= (1 p)
|
{z
}
(k1) puta
pi = 1.
i=1
X
i=1
pi =
p(1 p)i1 = p
i=1
1
= 1.
1 (1 p)
77
2.4.6
20
X
1
1 k1
1
0.791.
86
86
k=1
Hipergeometrijska distribucija
Neka je skup iz kojeg vrimo odabir elemenata konaan i neka se sastoji od tono
N elemenata od kojih je M tipa 1, a (N M ) tipa 2. Pretpostavimo da smo na
sluajan nain iz tog skupa odabrali n < N elemenata, i to bez vraanja prethodno
izvuenih elemenata u skup. Tada broj izvuenih elemenata tipa 1 modeliramo
hipergeometrijskom distribucijom s parametrima N , M i n.
Definicija 2.7. Diskretna sluajna varijabla X ima hipergeometrijsku distribuciju s parametrima N , M i n, N, M, n N, ako prima vrijednosti iz skupa
R(X) = {k N : max (0, n N + M ) k min (n, M )} s vjerojatnostima
M
N M
k
nk
.
pk = P {X = k} =
N
n
Pokaimo da je na taj nain dobro definirana distribucija, tj. da je
n
P
pk = 1.
k=0
5
3
53
P {X = 3} =
,
=
10
21
5
b) vjerojatnost da su odabrana najvie 3 kriminalitika romana:
P {X 3} = P {X = 0} + P {X = 1} + P {X = 2} + P {X = 3} =
41
,
42
78
Sluajna varijabla
c) vjerojatnost da su odabrana najmanje 3 kriminalitika romana:
P {X 3} = 1 P {X < 3} = 1 (P {X = 0} + P {X = 1} + P {X = 2}) =
11
.
42
2.5
2.5.1
1 , x ha, bi
.
f (x) = b a
0 ,x
/ ha, bi
79
0 , x h, ai
xa
, x [a, bi
F (x) =
.
ba
1 , x [b, i
Primjer 2.22. Pretpostavimo da imamo posudu u koju stane najvie 2 litre vode te da smo
iz slavine u nju sluajno natoili nepoznatu koliinu vode. Sluajna varijabla kojom opisujemo
koliinu vode natoenu u posudu moe se modelirati kao uniformna sluajna varijabla na intervalu
h0, 2i. Prema tome, njezina funkcija gustoe dana je izrazom
1 , x h0, 2i
,
f (x) =
2
0 , x
/ h0, 2i
a funkcija distribucije izrazom
0 , x h, 0]
x
, x h0, 2i
.
F (x) =
1 , x [2, i
y
1
2
-2
-1
Slika 2.15: Graf funkcije gustoe i funkcije distribucije uniformne distribucije na intervalu h0, 2i.
Npr. vjerojatnost da smo na sluajan nain iz slavine u posudu natoili vie od pola litre, ali
najvie jednu litru vode, raunamo na sljedei nain:
Z 1
1
1
P {0.5 < X 1} = P {X 1} P {X 0.5} =
dx = .
2 0.5
4
80
Sluajna varijabla
2.5.2
Eksponencijalna distribucija
Eksponencijalna distribucija esto se javlja kod sluajnih varijabli koje imaju znaenje vremena ekanja do pojave nekog dogaaja ako se karakteristike ne mijenjaju
tijekom vremena, npr. vrijeme do kvara (tj. vrijeme trajanja) jedne arulje, vrijeme
do pojave neke nesree, itd.
Naime, analizirajmo sluajnu varijablu X koja modelira vrijeme potrebno do pojave
danog dogaaja pod sljedeom pretpostavkom: uvjetna vjerojatnost pojavljivanja
dogaaja u nekom kratkom intervalu ht, t + ti, uz uvjet da se nije dogodio prije t,
proporcionalna je duljini tog intervala i ne ovisi o t, tj.
P ({X t + t}|{X > t}) = t, > 0.
81
y
1
3
-10
10
-10
10
Slika 2.16: Graf funkcije gustoe i funkcije distribucije eksponencijalne distribucije s parametrom
= 1/3.
Vjerojatnost da e od servisa do prvog udara teniske loptice u tlo proi vie od dvije, ali najvie
etiri sekunde, raunamo na sljedei nain:
Z 4
1
ex/3 dx 0.249.
P {2 < X 4} = P {X 4} P {X 2} =
3 2
2.5.3
Definicija 2.10. Neprekidna sluajna varijabla X ima dvostranu eksponencijalnu distribuciju s parametrom > 0 ako je funkcija gustoe dana izrazom
f (x) =
1 |x|
e
,
2
x R.
82
Sluajna varijabla
1 x
e
,x0
2
F (x) =
.
1 ex , x > 0
2
Primjer 2.24. Grafovi funkcije gustoe i funkcije distribucije sluajne varijable X s dvostranom
1
eksponencijalnom distribucijom s parametrom =
prikazani su slikom 2.17.
3
1
6
-10
10
-10
Slika 2.17: Graf funkcije gustoe i funkcije distribucije dvostrane eksponencijalne distribucije s
parametrom = 1/3.
2.5.4
Normalna distribucija
83
y
2
-5
1
2
10
x
-5
10
84
Sluajna varijabla
je izrazom
2
1
f (x) = ex /2 ,
2
x R.
Slika 2.20 prikazuje graf funkcije gustoe i funkcije distribucije standardne normalne
distribucije.
y
y
1
2
-4
-4
Slika 2.20: Graf funkcije gustoe i funkcije distribucije standardne normalne distribucije.
Vrijednosti funkcije distribucije za takve sluajne varijable moraju se raunati koritenjem metoda numerikog integriranja s obzirom da se integrali uglavnom ne
daju rijeiti eksplicitno. U veini knjiga koje primjenjuju statistiku dane su tablice vrijednosti funkcije distribucije standardne normalne sluajne varijable koja
je definirana sljedeim izrazom:
1
F (x) =
2
Zx
t2
e 2 dt,
x R.
85
2.6
Iz prethodnih razmatranja jasno je da za opisivanje neke jednodimenzionalne veliine, koja ima sluajan karakter kao model moe posluiti sluajna varijabla. Za
njezino zadavanje potrebno je zadati distribuciju pa su tada u potpunosti odreena vjerojatnosna svojstva. Distribucije mogu biti jednostavne, ali i vrlo sloenog
karaktera i nije uvijek jednostavno predoiti zakonitosti ponaanja sluajne karakteristike ispisivanjem njezine distribucije. Razvojem teorije vjerojatnosti postalo je
jasno da je esto za sluajnu varijablu mogue definirati nekoliko karakteristinih
brojeva koji mogu, zbog svojih generalnih svojstava, dodatno pomoi u opisivanju
sluajne varijable. Takve karakteristine brojeve zvat emo numerike karakteristike sluajne varijable.
2.6.1
oekivanje i broj
EX =
X()P {}
86
Sluajna varijabla
iN
iN
iN {X()=xi }
X
iN
xi
iN {X()=xi }
P {} =
xi pi .
iN
{X()=xi }
Koritenjem rezultata poglavlja 5.3 (Dodatak) zakljuujemo da ti redovi istovremeno ili apsolutno konvergiraju ili apsolutno divergiraju, a u sluaju apsolutne
konvergencije sume su im jednake.
Primjer 2.27. Neka sluajna varijabla X opisuje rezultate bacanja pravilno izraene igrae kockice. Oekivanje je te sluajne varijable broj
EX =
6
X
1
21
i=
.
6
6
i=1
iN
87
X()P {}
P
apsolutna konvergencija reda
(aX() + bY ())P {}. Tvrdnja teorema slijedi iz
88
Sluajna varijabla
Primjer 2.28. Pretpostavimo da izvodimo sluajan pokus bacanja nepravilno izraenog novia
kod kojega je relizacija pisma favorizirana i dogaa se s vjerojatnou 0.7 (koristit emo oznaku
1 za realizaciju pisma i 0 za realizaciju glave). Tada sluajna varijabla X kojom modeliramo taj
pokus ima Bernoullijevu distribuciju s parametrom p = 0.7, tj. zadana je tablicom distribucije
!
0 1
X=
.
0.3 0.7
Sluajna varijabla Y koja opisuje broj realiziranih pisama nakon 100 nezavisnih bacanja toga
novia ima binomnu distribuciju s parametrima n = 100 i p = 0.7, tj. Y B(100, 0.7). Kako
binomnu sluajnu varijablu moemo predstaviti kao sumu n Bernoullijevih sluajnih varijabli, tj.
n
X
Y =
Xi , Xi jednako distribuirana kao X, i,
i=1
raunanje je matematikog oekivanja od Y znatno pojednostavljeno i svodi se na primjenu svojstva aditivnosti oekivanja:
EX =
100
X
i=1
EXi =
100
X
(0 0.3 + 1 0.7) =
i=1
100
X
i=1
Za oekivanje obino kaemo da je jedna mjera centralne tendencije sluajne varijable. Naime, ako se pitamo postoji li realan broj koji je na neki nain "najblii" sluajnoj varijabli, onda je to u jednom nainu mjerenja udaljenosti upravo
oekivanje. Pritom udaljenost izmeu sluajne varijable i broja mjerimo kao oekivano kvadratno odstupanje: E(X a)2 .4 Zaista, definiramo li funkciju g(a) =
E(X a)2 = EX 2 2aEX + a2 na R, vidimo da ona postie minimum upravo u
vrijednosti a = EX.
Primjer 2.29. Ilustrirajmo znaenje oekivanog kvadratnog odstupanja sluajne varijable od konstante na primjerima.
a) Neka je sluajna varijabla X zadana tablicom distribucije
!
1 2 3 4
X= 1 1 1 1 .
4 4 4 4
Tada je
1
1
1
1
+ (2 a)2 + (3 a)2 + (4 a)2
4
4
4
4
funkcija varijable a. Minimum ove funkcije je tono prosjek vrijednosti koje sluajna varijabla moe postii, tj. 2.5. Uoimo da se ovdje sve vrijednosti reliziraju s istom vjerojatnou
(slika 2.21).
E(X a)2 = (1 a)2
Tada
1
1
5
1
+ (2 a)2 + (3 a)2 + (4 a)2
8
8
8
8
kao funkcija varijable a postie minimum koji nije jednak prosjek vrijednosti koje sluajna
varijabla moe primiti jer se vrijednost 4 realizira bitno veom vjerojatnou nego ostale
vrijednosti iz R(X). Ovdje je minimum za a = 3.25, tj. "povuen" je prema 4 (slika 2.21).
E(X a)2 = (1 a)2
4 Vie
89
y
0.25
1
8
2 2.5 3
3 3.25
2.6.2
90
Sluajna varijabla
Propozicija 2.1. Neka je r > 0 i E(|X|r ) postoji. Tada postoji i E(|X|s ) za svaki
0 < s < r.
Dokaz. Za svaki realan broj x i 0 < s < r vrijedi nejednakost:
|x|s < 1 + |x|r .
Odavde i iz monotonosti oekivanja vidimo da vrijedi:
|X|s 1 + |X|r = E(|X|s ) 1 + E(|X|r ) < ,
pa postoji oekivanje od X s .
Kao ilustraciju moguih interpretacija momenata navodimo tzv. ebievljevu nejednakost koja daje korisnu interpretaciju oekivanja i varijance svake sluajne varijable koja ima varijancu.
Propozicija 2.2 (ebievljeva nejednakost). Neka je X sluajna vrijabla koja ima
varijancu 2 te neka je dan broj k > 0. Tada vrijedi:
P {|X | k}
1
,
k2
91
Dokaz. Prije svega, uoimo jednu openito korisnu injenicu: ako je A P()
neki skup, oznaimo li
(
1,A
,
IA () =
0,
/A
IA je sluajna varijabla na koju moemo iskoristiti za povezivanje vjerojatnosti
skupa A i pojma oekivanja sluajne varijable. Naime, distribucija te sluajne varijable dana je tablicom
!
0 1
IA =
, p = P {IA = 1} = P {A}.
1p p
Dakle, vrijedi:
EIA = P (A).
Koritenjem tog naina oznaavanja, monotonosti i linearnosti oekivanja te nenegativnosti funkcije g vidimo da za svaki > 0 vrijedi:
Eg(X) = E(g(X)I{g(X)} + g(X)I{g(X)<} )
= E(g(X)I{g(X)} ) + E(g(X)I{g(X)<} )
E(g(X)I{g(X)} ) EI{g(X)}
= P {g(X) },
to dokazuje tvrdnju.
Dokaz (ebievljeva nejednakost). Iz prethodnog teorema slijedi:
P {|X EX| k} = P {|X EX|2 k 2 2 }
E|X EX|2
Var X
1
= 2 2 = 2.
k2 2
k
k
Interpretacija se varijance i oekivanja koritenjem ebievljeve nejednakosti za
Var X zovemo
pravo temelji na drugom korijenu iz varijance. Tu veliinu, tj.
standardna devijacija sluajne varijable i oznaavamo sa X ili .
Dakle, vidimo da ebievljeva nejednakost tvrdi: vjerojatnost da odstupanje
sluajne varijable X od njezinog oekivanja bude po apsolutnoj vrijednosti vee ili jednako k standardnih devijacija, manja je ili jednaka od
1/k 2 .
Na primjer, vjerojatnost je manja ili jednaka 1/9 11.1% da sluajna varijabla
odstupa od svog oekivanja za vie od 3 standardne devijacije. Koritenjem statistike interpretacije vjerojatnosti moemo tada zakljuiti da e se, prilikom puno
92
Sluajna varijabla
1
.
k2
1
= 0.5
k2
o
P 50 8 2 < X < 50 + 8 2 0.5.
1
.
4
93
2.6.3
Parametarski se zadane familije distribucija esto koriste u praksi, a njihovi se parametri nerijetko mogu iskazati u terminima momenata. U ovom poglavlju izraunat
94
Sluajna varijabla
1
, i = 1, 2, . . . , n.
n
n
X
xi pi =
i=1
1X
xi = xn .
n i=1
Var X =
1X
(xi xn )2 .
n i=1
n+1
n2 1
, Var X =
.
2
12
Bernoullijeva distribucija
Za sluajnu varijablu rekli smo da ima Bernoullijevu distribuciju ako je zadana
tablicom distribucije
X=
0 1
1p p
!
,
p h0, 1i.
95
n
X
n
i
i=0
0
n1
g (t) = n(at + b)
a=
n
X
n
X
i=1
00
n2 2
a =
n
X
ai ti bni
n
i
i=1
!
ai ti1 bni
n
i
!
ai bni
i(i 1)
i=2
00
n2 2
a =
n
X
i(i 1)
i=2
n
i
(2.3)
!
ai ti2 bni
n
i
!
ai bni
(2.4)
Var X = EX 2 (EX)2 =
n
X
n i
i2
p (1 p)ni (np)2
i
i=0
Var X = npq.
96
Sluajna varijabla
y
0.12
0.10
0.08
0.06
0.04
0.02
6.67
16.67 26.67
26 i 50i
X
50
1
2
i=7
0.997.
Poissonova distribucija
Sluajna varijabla X ima Poissonovu distribuciju s parametrom > 0 ako prima
vrijednosti iz skupa {0, 1, 2, . . . } s vjerojatnostima
pi = P {X = i} = e
i
.
i!
X
X
X
e i
i
i1
i
= e
i = e
= e e = .
i!
i!
(i
1)!
i=0
i=0
i=1
97
EX 2 =
i2
i=0
= e
= e
X
i
e i
= e
i
=
i!
(i 1)!
i=1
X
i1
(i 1 + 1)
=
(i 1)!
i=1
X
X
i1
i2
+
!
=
= e [e + e ] = ( + 1),
Var X = EX 2 (EX)2 = 2 + 2 = .
Dakle, oekivanje i varijanca Poissonove sluajne varijable dani su sljedeim izrazom:
EX = Var X = .
Primjer 2.35. Oekivanje i varijanca Poissonove sluajne varijable X s parametrom = 4
jednaki su vrijednosti parametra , tj. 4, dok je standardna devijacija = 2. Slikom 2.23
prikazana je distribucija te sluajne varijable s oznaenim oekivanjem i granicama intervala
[ 2, + 2] = [0, 8].
y
0.20
0.15
0.10
0.05
4
Odredimo vjerojatnost realizacije te sluajne varijable unutar intervala [0, 8], tj. vjerojatnost
realizacije sluajne varijable udaljene od oekivanja za manje ili tono dvije standardne devijacije:
P {X [0, 8]} =
8
X
i=0
e4
4i
0.979.
i!
98
Sluajna varijabla
Odredite najkrai simetrian interval oko oekivanja za koji moemo tvrditi da e sadrati barem
95% realizacija te sluajne varijable prilikom puno nezavisnih ponavljanja pokusa. (Iskoristite
raunalo!)
Geometrijska distribucija
Sluajna varijabla X ima geometrijsku distribuciju s parametrom p h0, 1i ako
prima vrijednosti iz skupa {1, 2, 3, . . .} s vjerojatnostima
pk = P {X = k} = p(1 p)k1 .
Izraunajmo oekivanje i varijancu te distribucije.
Deriviranjem jednakosti
X
1
xi , |x| < 1,
=
1x
i=0
(2.5)
ip(1 p)i1 =
i=1
1
.
p
1p
.
p2
0.3
0.2
0.1
3 5.45
99
Odredimo vjerojatnost realizacije te sluajne varijable unutar intervala h0.55, 5.45i, tj. vjerojatnost
realizacije sluajne varijable udaljene od oekivanja za manje od jedne standardne devijacije:
P {X h0.55, 5.45i} =
5
X
i=1
2.6.4
xf (x) dx
Valja naglasiti da sva spomenuta svojstva oekivanja (vidi poglavlje 2.29) koja vrijede za diskretne sluajne varijable vrijede i za neprekidne sluajne varijable. Takoer, ako je dana realna funkcija realne varijable g, onda oekivanje sluajne varijable5 g(X) moemo raunati analogno diskretnom sluaju, ali koristei funkciju
gustoe i integral umjesto sume, tj.
Z
Eg(X) =
5 za
100
Sluajna varijabla
V ar X =
Takoer se moe pokazati da pri toj definiciji ostaju sauvana sva svojstva varijance
dokazana u poglavlju 4.19 za diskretan sluaj, kao i navedene korisne nejednakosti
(vidi npr. [26]).
Primjer 2.37. Funkcija gustoe sluajne varijable definirana je pravilom
(
sin x , x h0, /2]
f (x) =
.
0 , x
/ h0, /2]
Izraunajmo momente EX, EX 2 , EX 3 , Var X, E[X E(X)]3 te neprekidne sluajne varijable:
EX =
/2
Z
x sin x dx = 1,
EX 2 =
EX 3 =
/2
Z
x2 sin x dx = 2,
0
/2
Z
x3 sin x dx =
3
( 8),
4
Var X = EX 2 (EX)2 = 3,
E (X EX)3 =
/2
Z
3 2
(x EX)3 sin x dx =
3 + 2.
4
0
2.6.5
(x)2
1
e 22 ,
2
x R.
101
Osim toga, zbog normiranosti funkcije gustoe neprekidne sluajne varijable znamo
da je
Z
x2
1
e 2 dx = 1.
2
1
EX =
2
1
=
2
xe
(x)2
2 2
1
dx =
2
t2
1
t e 2 dt +
2
t2
(t + ) e 2 dt
t2
e 2 dt
= ,
1
EX =
2
2
=
2
2
=
2
x e
(x)2
2 2
2 t2
t e
1
dx =
2
2
dt +
2
t2
te
t2
t2 e 2 dt + 2 = 2
t2
(t + )2 e 2 dt
2
dt +
2
t2
t2 e 2 dt + 2 .
t e
0
2 t2
dt =
Z
0
t2
e 2 dt = 2 .
t2
e 2 dt
102
Sluajna varijabla
Dakle, Var X = 2 .
Uoimo da su parametri i 2 normalne distribucije upravo njezino matematiko
oekivanje i varijanca, redom.
Primjer 2.38. Graf funkcije gustoe normalne sluajne varijable s oekivanjem = 5 i varijancom 2 = 1 prikazan je slikom 2.25.
y
0.4
0.3
0.2
0.1
4
Naziv distribucije
Bernoullijeva, p h0, 1i
Distribucija (gustoa)
!
0 1
1p p
Geometrijska
R(X)=
{0, 1, 2, . . . , n}
n i
pi =
p (1 p)ni
i
R(X) = N0
i
pi = e
i!
R(X) = N
G(p), p h0, 1i
pi = p(1 p)i1
Binomna
B(n, p), n N, p h0, 1i
Poissonova
P(), > 0
Oekivanje
Varijanca
p(1 p)
np
np(1 p)
1
p
1p
p2
103
Distribucija (gustoa)
Oekivanje
Varijanca
a+b
2
(b a)2
12
1
2
2
2
Uniformna na ha, bi
U(a, b), a < b
f (x) =
1
I(a,b) (x)
ba
Eksponencijalna
E(), > 0
Laplaceova, > 0
f (x) = 12 e|x|
Normalna
N (, 2 ), R, > 0
f (x) =
(x)2
1
e 22
2
Tablica 2.1: Tablica distribucija ili funkcija gustoa te oekivanja i varijanci vanijih parametarskih familija diskretnih i neprekidnih distribucija.
2.7
2.7.1
Koritenjem svojstava oekivanja i varijance dokazat emo da svaku sluajnu varijablu koja ima varijancu moemo afino transformirati (dodavanjem konstante i
mnoenjem s konstantom razliitom od 0) tako da novonastala sluajna varijabla
ima oekivanje 0 i varijancu 1. Takav se postupak transformiranja sluajne varijable
u statistici naziva postupak standardizacije.
Propozicija 2.3. Neka je X sluajna varijabla s oekivanjem R i varijancom
2 > 0. Tada sluajna varijabla
Y =
X
, = 2 ,
1
(EX ) = 0,
Var Y =
1
Var X = 1.
2
104
Sluajna varijabla
X
, = 2 ,
Primjer 2.39. Neka je X B(n, p), n N, p h0, 1i. Postupkom standardizacije dobivamo
sluajnu varijablu
X np
Y = p
.
np(1 p)
Uoimo da Y vie nema distribuciju u binomnoj familiji!
Primjer 2.40. Neka je X P(), > 0. Postupkom standardizacije dobivamo sluajnu varijablu
Y =
X
.
0
, x<a
Zx
xa
,
ax<b .
f (x) dx =
FX (x) =
ba
1
, xb
Postupkom standardizacije dobivamo sluajnu varijablu Y sa sljedeom funkcijom distribucije
0
, x + < a
x + a
, a x + < b ,
FY (x) = FX (x + ) =
ba
1
, x + b
tj.
FY (x) =
0
x a
b
a
, x<
,
x<
b
, x
1
a b
Odavde vidimo da je Y U
,
, tj. postupak standardizacije zadrao je sluajnu
X
N (0, 1).
105
2.7.2
X, tj. Y = g(X). Pokazali smo da se, kod ovako jednostavne funkcije g, moe lako
odrediti funkcija distribucije novonastale sluajne varijable. Slian postupak moe
se primijeniti kod svih transformacija bijektivnim funkcijama g. Ako je sluajna
varijabla X diskretna, opisanim postupkom dobivamo sluajnu varijablu Y = g(X)
koja je takoer diskretnog tipa. Meutim, ako je X apsolutno neprekidna, Y =
g(X) e biti apsolutno neprekidna samo ako je mogue izraziti njezinu funkciju
distribucije pomou funkcije gustoe.
Primjer 2.43. Neka je dana diskretna sluajna varijabla X tablicom distribucije
!
X
x1 x2 . . . x n . . .
pi = 1, I N,
X=
, 0 pi 1,
p1 p2 . . . p n . . .
iI
i neka je g : R(X) R bijekcija. Tada je sluajna varijabla Y = g(X) zadana tablicom distribucije
Y =
!
X
pi 1,
pi = 1
I N.
iI
Primjer 2.44. Neka je dana neprekidna sluajna varijabla X funkcijom gustoe f i neka je
bijekcija g : R R definirana pravilom g(x) = ex . Tada je Y = g(X) = eX neprekidna sluajna
1
varijabla s funkcijom gustoe h(x) = f (ln x) za x > 0 i h(x) = 0 za x 0.
x
Zaista,
(
0
, x0
FY (x) = P {Y x} = P {g(X) x} =
.
P {X g 1 (x)} , x > 0
Nadalje, za x > 0 vrijedi:
P {X g 1 (x)} =
g 1 (x)
ln x
f (t) dt =
f (t) dt.
Uz supstituciju t = ln u slijedi:
x
P {X g 1 (x)} =
f (ln u)
0
1
du.
u
Definiranjem funkcije
h(u) =
0
f (ln u)
, u0
1
, u>0
u
P {Y x} =
h(u) du,
106
Sluajna varijabla
Primjer 2.45. Neka je neprekidna sluajna varijabla X zadana funkcijom gustoe f i neka je
g(x) = ex . Tada se analognim postupkom kao u primjeru 2.44 vidi da je Y = g(X) = eX
1
neprekidna sluajna varijabla s funkcijom gustoe h(x) = f ( ln(x)) za x > 0 i h(x) = 0 za
x
x 0.
0
dFX (g 1 (y))
= fX (g 1 (y))[g 1 (y)] ,
dy
y R(g).
107
0
d(1 FX (g 1 (y)))
= fX (g 1 (y))[g 1 (y)] ,
dy
y R(g).
FY (y) =
fY (t) dt.
108
Sluajna varijabla
2.7.3
Ako transformacija sluajne varijable nije bijekcija, takoer je mogue odrediti distribuciju novonastale sluajne varijable, ali je postupak tehniki zahtjevniji. Za
ilustraciju emo se posluiti primjerima.
Primjer 2.46. Pretpostavimo da je diskretna sluajna varijabla X dana tablicom distribucije
!
X
x1 x2 . . . xn . . .
X=
, pi 1,
pi = 1.
p1 p2 . . . pn . . .
i
Neka je g : R(X) R proizvoljna funkcija te neka je sluajna varijabla Y definirana kao Y =
g(X). Oznaimo R(Y ) = {y1 , y2 , . . . , yk , . . . }. Tada sluajna varijabla Y ima tablicu distribucije
!
X
y1 y2 . . . y k . . .
, qk 1,
Y =
qk = 1,
q1 q2 . . . qk . . .
k
gdje je
X
qk =
P {} =
{|g(X())=yk }
pi .
{i|g(xi )=yk }
0
, x<0
1
.
h(x) =
f ( x) + f ( x) , x 0
2 x
Zaista, za x < 0 je P {Y x} oigledno jednako 0. Za x 0 je
P {Y x} = P {X 2 x} = P { x X x} =
Zx
Zx
f (t) dt =
(f (t) + f (t)) dt.
Supstitucijom t =
P {Y x} =
0
1
f ( u) + f ( u) du =
2 u
Zx
h(u) du.
0
109
2.8
Vaan je nain ispitivanja istinitosti tvrdnji koje se odnose na sluajne varijable provjera tih tvrdnji na podacima. Meutim, podaci koji se u tu svrhu trebaju koristiti
realizacije su sluajne varijable. Pitanje je kako prikupiti podatke iz sluajne varijable zadane distribucije. Radi ilustracije problema zamislimo da elimo dobiti 30
podataka koji su realizacije Bernoullijeve sluajne varijable s tablicom distribucije
!
0 1
X= 1 1 .
2 2
0
,u<0
1
FU (u) = P {U u} = P {F (X) u} = P {X F (u)} , u [0, 1) .
1
, ,u 1
S obzirom da je P {X F 1 (u)} = F (F 1 (u)) = u, vidimo da je U U(0, 1), i
to neovisno o funkciji distribucije F sve dok je ona funkcija distribucije neprekidne
sluajne varijable.
Pogledajmo i drugi smisao toga rezultata. Poimo od sluajne varijable U U(0, 1).
Odaberimo funkciju distribucije F neprekidne sluajne varijable X koju elimo modelirati. Oigledno je da se distribucija sluajne varijable X moe dobiti kao distribucija kompozicije F 1 (U ). Naime, vrijedi:
P {F 1 (U ) x} = P {U F (x)} = F (x).
110
Sluajna varijabla
Dakle, ako trebamo generirati n podataka iz neprekidne sluajne varijable s distribucijom F , dovoljno je da imamo niz podataka (ui , i = 1, . . . , n) iz U(0, 1). Traene
podatke tada dobijemo kao (F 1 (ui ), i = 1, . . . , n).
Za generiranje se realizacija uniformne distribucije na h0, 1i danas koriste takozvani
generatori sluajnih brojeva koji su ugraeni u sve naprednije raunalne programe.
Uniformna distribucija na intervalu h0, 1i moe se takoer iskoristiti i za generiranje
realizacija diskretnih distribucija. Zainteresirani itatelj moe vie informacija o
tome pronai u [8].
2.9
Zadaci
Zadatak 2.1. Promotrimo sluajan pokus koji se sastoji od bacanja pravilno izraenog novia dva puta zaredom. Neka je X sluajna varijabla ija je vrijednost broj realiziranih pisama.
Odredite tablicu distribucije sluajne varijable X.
Rjeenje:
0 1 2
X=
1 1 1
4 2 4
Zadatak 2.2. Strijelac na raspolaganju ima tri metka i gaa metu dok je ne pogodi ili dok ne
potroi sva tri metka. Neka je X sluajna varijabla ija je vrijednost broj potroenih metaka. Uz
pretpostavku o nezavisnosti gaanja tablicu distribucije od X ako je poznato da je vjerojatnost
pogotka mete pri svakom gaanju jednaka 0.8.
Rjeenje:
X=
1
2
3
0.8 0.16 0.04
Zadatak 2.3. Promotrimo sluajan pokus koji se sastoji od bacanja pravilno izraene igrae
kockice dva puta zaredom. Neka je X sluajna varijabla ija je vrijednost zbroj realiziranih brojeva
u oba bacanja. Odredite tablicu distribucije sluajne varijable X.
Rjeenje:
2 3 4 5 6 7 8 9 10 11 12
X=
1 1 1 1 5 1 5 1 1 1 1
36 18 12 9 36 6 36 9 12 18 36
111
Zadaci
3 4 5 6 7
X = 1 3 6 10 15
35 35 35 35 35
Funkcija distribucije:
1/35
4/35
F (x) =
10/35
20/35
,
,
,
,
,
,
x (, 3)
x [3, 4)
x [4, 5)
x [5, 6)
x [6, 7)
x [7, )
Zadatak 2.6. U smjeru kretanja automobila nalaze se redom tri semafora koji rade nezavisno
jedan od drugog. Na svakomu se s vjerojatnou p = 0.5 pojavljuje crveno i s vjerojatnou q = 0.5
zeleno svjetlo. Sluajna varijabla X predstavlja broj semafora pored kojih prolazi automobil do
prvog zaustavljanja. Odredite tablicu distribucije i funkciju distribucije sluajne varijable X te
nacrtajte graf funkcije distribucije.
Rjeenje:
Tablica distribucije:
0 1 2 3
X=1 1 1 1
2 4 8 8
Funkcija distribucije:
1/2
F (x) = 3/4
7/8
,
,
,
,
,
x (, 0)
x [0, 1)
x [1, 2)
x [2, 3)
x [3, )
Zadatak 2.7. Odredite matematiko oekivanje i varijancu sluajne varijable zadane sljedeom
tablicom distribucije
!
0 1 2
3
4
X=
.
1/2 1/4 1/8 1/16 1/16
112
Sluajna varijabla
Rjeenje:
E(X) =
15
,
16
367
.
256
Var X =
a) a =
3
1
,b=
16
4
b) Var X =
719
64
c) Funkcija distribucije:
3/16
5/16
F (x) = 7/16
1/2
3/4
,
,
,
,
,
,
,
x (, 1)
x [1, 0)
x [0, 1)
x [1, 3)
x [3, 4)
x [4, 8)
x [8, )
Zadatak 2.9. Ispitujemo ispravnost sustava koji se sastoji od tri komponente. Otkazivanje komponenti dogaa se nezavisno i vjerojatnost je otkazivanja n-te komponente
pn = 0.2 + (n 1) 0.1,
n {1, 2, 3}.
0
1
2
3
0.336 0.452 0.188 0.024
!
,
EX = 0.9,
Var X = 0.61.
Zadatak 2.10. U spremniku se nalazi pet kutija: dvije su prazne, a u preostalim trima nalazi se
po deset bombona. Izvlaimo jednu po jednu kutiju sve dok ne izvuemo praznu kutiju (izvlaenje
se vri bez vraanja prethodno izvuenih kutija u spremnik). Kolika je vjerojatnost da izvuemo
svih 30 bombona? Odredite distribuciju, matematiko oekivanje i varijancu sluajne varijable
kojom je modeliran broj bombona koje smo izvukli.
Rjeenje:
Y =
0 10 20 30
2/5 3/10 1/5 1/10
!
,
EY = 10,
Var Y = 100.
113
Zadaci
Zadatak 2.11. Diskretna sluajna varijabla zadana je tablicom distribucije
!
1 1 1+
, > 0.
X=
p 2p 3p
a) Odredite vrijednost parametra p.
b) Izraunajte matematiko oekivanje, drugi moment i trei apsolutni moment sluajne varijable X.
c) Izraunajte
P
n
o
|X| 1 +
.
2
Rjeenje:
a) p = 1/6,
(
b) EX =
+3
,
3
EX 2 = 1 + 23 (1 + ), E|X|3 =
(3 + 62 + 3 + 3)/3 , 0 < 1
,
(23 + 32 + 3 + 2)/3 , > 1
1
3 5
7
8
5/16 1/8 1/8 5/24 11/48
!
,
EY = 221/48,
Var Y = 18983/2304.
114
Sluajna varijabla
/3 /2 2/3 5/6
6
X=
.
0.25 0.2 0.3 0.15 0.1
Odredite distribuciju, funkciju distribucije, oekivanje i varijancu sluajne varijable Y = 3
2 cos2 X.
115
Zadaci
Zadatak 2.21. Diskretna sluajna varijabla zadana je tablicom distribucije
!
e3 e1 1 e3 e5
X=
.
p 2p 3p 2p 2p
1
,
2k
k N.
Zadatak 2.25. Poznato je da je u velikom skladitu trgovine informatikom opremom vjerojatnost pojavljivanja prijenosnog raunala s grekom nastalom u proizvodnji jednaka 0.02. Pretpostavimo da iz tog skladita biramo 10 prijenosnih raunala. Odredite sljedee vjerojatnosti:
a) vjerojatnost da je tono 5 prijenosnih raunala s grekom,
b) vjerojatnost da su s grekom najvie 3 prijenosna raunala;
c) vjerojatnost da je s grekom barem 6 prijenosnih raunala.
Rjeenje: a) P {X = 5} = 0.000000728.
116
Sluajna varijabla
Rjeenje: n =
ln (1 r)
.
ln (1 p)
Zadatak 2.27. Poznata osjeka pizzeria primi u prosjeku 240 narudbi tijekom jednog sata.
Odredite vjerojatnost da u vremenskom periodu od jedne minute:
a) nije primljena niti jedna narudba;
b) primljene su barem dvije narudbe.
Rjeenje: a) P {X = 0} = e4 ,
b) P {X 2} = 1 5e4 .
Zadatak 2.28. Neka telefonska centrala primi u prosjeku 120 poziva tijekom jednog sata. Zbog
iznenadnog kvara na centrali tijekom jedne minute pozivi nisu primani. Kolika je vjerojatnost da
u tom periodu centrali nije bilo upueno vie od 4 poziva?
Rjeenje: P {X < 4} =
19e2
.
3
Zadatak 2.29. Proizvodi u tvornici, meu kojima se neispravan proizvod nalazi s vjerojatnou
0.007, pakuju se u kutije po 100 komada. Kolika je vjerojatnost da kutija ne sadri niti jedan
pokvaren proizvod, a kolika da sadri dva ili vie pokvarenih proizvoda?
Rjeenje: P {X = 0} = 0.4954,
P {X 2} = 0.1554.
Zadatak 2.30. Sluajnom pokusu bacanja nepravilno izraenog novia pripada dvolani prostor
elementarnih dogaaja {P, G}. Vjerojatnost realizacije pisma u jednom provoenju tog pokusa
iznosi p = 0.3. Koliko je puta potrebno ponoviti taj sluajni pokus da bismo s vjerojatnou 0.9
mogli tvrditi da se pismo realiziralo barem jednom?
Zadatak 2.31. Sluajan pokus sastoji se od bacanja pravilno izraene igrae kockice etiri puta.
Neka je broj pojavljivanja broja 5 vrijednost sluajne varijable X. Odredite zakon razdiobe sluajne varijable X, njezino oekivanje, varijancu te vjerojatnost da je broj 5 pao barem jednom.
117
Zadaci
Zadatak 2.33. Telefonist zaposlen u slubi za korisnike nekog poduzea zarauje 10 kuna po
primljenom pozivu klijenta. Poznato je da telefonist u tom poduzeu u danu primi u prosjeku 20
takvih poziva.
a) Odredite distribuciju sluajne varijable kojom modeliramo dnevnu zaradu telefonosta u tom
poduzeu i odredite njegovu oekivanu dnevnu zaradu.
b) Izraunajte vjerojatnost da telefonist u jednom danu zaradi barem 180 kuna.
Rjeenje:
a) X P(20) - sluajna varijabla kojom se modelira broj poziva koje telefonist primi u
jednom danu; Y = 10 X - sluajna varijabla kojom se modelira dnevna zarada telefonista;
EY = 200.
17
P
20k 20
b) P {Y 180} = 1
e
.
k!
k=0
Zadatak 2.34. U poiljci audio opreme nalazi se 100 mikrofona od kojih je 20 neispravno. Vlasnik
trgovine audio opremom, koji ne zna broj neispravnih mikrofona u poiljci, odluuje da e za svoju
trgovinu uzeti poiljku ako meu 10 sluajno odabranih mikrofona ne bude vie od 3 neispravna.
a) Kolika je vjerojatnost da e trgovac prihvatiti poiljku?
b) to zakljuujete o vjerojatnosti prihvaanja poiljke u sluaju da poiljka sadri jednak broj
ispravnih i neispravnih mikrofona?
Rjeenje:
a) P {X 3} = 0.89,
b) poiljka e s veim brojem neispravnih mikrofona biti prihvaena s manjom vjerojatnou.
Zadatak 2.35. Posuda sadri 1000 lukovica tulipana, od kojih je 400 lukovica crvenih tulipana i
600 lukovica tulipana drugih boja. Iz te posude na sluajan nain odaberemo 10 lukovica.
a) Kolika je vjerojatnost da smo odabrali tono pet lukovica crvenih tulipana?
b) Koliki je oekivani broj izvuenih lukovica crvenih tulipana?
Zadatke rijeite pomou hipergeometrijske i binomne distribucije.
Rjeenje: primjenom hipergeometrijske distribucije dobivamo
a) P {X = 5} = 0.201,
b) EX = 4.
Zadatak 2.36. Student rjeava pismeni ispit koji se sastoji od trideset pitanja od kojih svako nosi
5 bodova. Na svako pitanje ponuena su tri odgovora od kojih je samo jedan toan. Pretpostavimo
da odgovore na sva pitanja student odabire na sluajan nain.
a) Odredite distribuciju sluajne varijable kojom modeliramo broj bodova koje student ostvaruje na tom ispitu te odredite oekivani broj ostvarenih bodova.
b) Izraunajte vjerojatnost da takvim rjeavanjem ispita student ostvari barem 80 bodova.
118
Sluajna varijabla
Rjeenje:
a) X B(30, 1/3) - sluajna varijabla kojom se modelira broj tonih odgovora na ispitu;
Y = 5 X - sluajna varijabla kojom se modelira broj bodova na ispitu; E Y = 50.
b) P {Y 80} = 1
15
P
k=1
30
k
1 k
3
2 30k
.
3
Zadatak 2.37. U bubnju se nalazi sedam omotnica: tri su prazne, a u preostalim etirima nalazi
se po 100 kuna. Igra izvlai jednu po jednu omotnicu sve dok ne izvue praznu (izvlaenje se vri
bez vraanja prethodno izvuenih omotnica u bubanj).
a) Odredite distribuciju sluajne varijable X kojom je modeliran broj izvuenih omotnica.
b) Odredite transformaciju sluajne varijable X kojom je modeliran osvojeni iznos kuna te
izraunajte njezino matematiko oekivanje i varijancu. Interpretirajte dobivene rezultate.
c) Kolika je vjerojatnost da igra osvoji barem 200 kuna?
Rjeenje:
a) X =
1 2
3
4
5
3/7 2/7 6/35 3/35 1/35
!
.
Zadatak 2.38. U eiru se nalazi osam kutijica: etiri su prazne, a u preostalim etirima nalaze
se kljuevi etiriju sefova od kojih svaki sadri po jedan dijamant. Igra izvlai jednu po jednu
kutijicu sve dok ne izvue praznu (izvlaenje se vri bez vraanja prethodno izvuenih kutijica u
eir).
a) Odredite distribuciju sluajne varijable X kojom je modeliran broj izvuenih kutijica.
b) Odredite transformaciju sluajne varijable X kojom je modeliran broj osvojenih dijamanata te izraunajte njezino matematiko oekivanje i varijancu. Interpretirajte dobivene
rezultate.
c) Kolika je vjerojatnost da igra osvoji barem dva dijamanta?
Rjeenje:
a) X =
1 2 3
4
5
1/2 2/7 1/7 2/35 1/70
!
.
119
Zadaci
Zadatak 2.39. Automat za igre na sreu u nekoj kockarnici programiran je tako da se prirodan
broj n realizira s vjerojatnou 2/3n , tj.
P {X = n} =
2
,
3n
n N.
Izraunajte matematiko oekivanje i varijancu sluajne varijable X te pomou ebievljeve nejednakosti ocijenite vjerojatnost da realizacija sluajne varijable X od njezinog oekivanja odstupa
za barem dvije standardne devijacije.
n
o
Rjeenje: EX = 3/2, Var X = 3/4, P X 34 3 14 .
Zadatak 2.41. Za zadane realne funkcije realne varijable odredite vrijednost nepoznate konstante
tako da svaka od njih bude funkcija gustoe neke neprekidne sluajne varijable:
(
ax , 0 x < 1
a) fX (x) =
,
0 , inae
(
b cos 2x , x [/4, /4i
b gX (x) =
,
0
, inae
c) skicirajte grafove funkcija f i g.
Rjeenje: a) a = 2,
b) b = 1.
0 , x<0
a) FX (x) = x2 , 0 x < 1 .
1 , x1
b) P {0.25 < X 2} = 15/16.
120
Sluajna varijabla
1
2
0
, x < /4
+ cos (x) sin (x) , /4 x < /4 .
1
, x /4
3 , 0x<1
2
fX (x) =
, 1x<2 .
3
0 , inae
Izraunajte funkciju distribucije sluajne varijable X te skicirajte grafove funkcije gustoe i funkcije
distribucije.
0
, x<0
1
x
, 0x<1
3
Rjeenje: FX (x) =
.
1
(2x
1)
,
1x<2
3
1
, x2
Zadatak 2.46. Vrijeme trajanja u mjesecima nekog elektronikog ureaja modelirano je sluajnom varijablom X s funkcijom gustoe
(
2
kxex /9 , x > 0
fX (x) =
.
0
, x0
a) Odredite vrijednost konstante k tako da fX bude dobro definirana funkcija gustoe.
b) Odredite funkciju distribucije sluajne varijable X.
c) to je vjerojatnije - da se ureaj pokvari tijekom prva tri mjeseca upotrebe ili da mu vrijeme
trajanja bude dulje od mjesec dana? Ako ureaj ima jamstvo u trajanju od mjesec dana,
kolika je vjerojatnosti da e ureaj trebati popravak za vrijeme trajanja jamstvenog roka?
Rjeenje:
121
Zadaci
a) k = 2/9.
c) P {X 3} = (e 1)/e 0.63, P {X > 1} = e1/9 0.89.
0
, x<0
2 2 cos (x/3) , 0 x < ,
1
, x
P {/2 X < 2} = 3 1.
c) EX = 3 3 , Var X = 2 2 + 12 3 45.
b) FX (x) =
0
, x<0
2 sin (x/3) , 0 x < /2 ,
1
, x /2
b) FX (x) =
Zadatak 2.49. Svakog radnog dana osoba autobusom odlazi na posao. Autobusi na stanicu dolaze
redovito svakih pet minuta. Trenutak dolaska osobe na stanicu smatramo sluajnim trenutkom
izmeu dolaska dvaju uzastopnih autobusa. Vrijeme koje protekne od dolaska osobe na stanicu do
dolaska prvog sljedeeg autobusa (vrijeme ekanja) modeliramo sluajnom varijablom X za koju je
poznato da je vjerojatnost da osoba autobus eka najvie x vremena proporcionalna tom vremenu
ekanja x.
a) Odredite funkciju distribucije i funkciju gustoe sluajne varijable X.
122
Sluajna varijabla
Zadatak 2.50. Na stroju koji proizvodi bakrenu icu povremeno dolazi do smetnji koje uzrokuju
nepravilnost na dijelu ice proizvedenom u trenutku smetnje. Duljinu ice (u metrima) izmeu
dviju uzastopnih nepravilnosti moemo modelirati sluajnom varijablom s funkcijom gustoe
(
k(1 + x)3 , x > 0
.
fX (x) =
0
, x0
a) Odredite vrijednost konstante k.
b) Odredite funkciju distribucije sluajne varijable X.
c) Kolika je vjerojatnost da se nepravilnost na ici pojavi izmeu 0.4 i 0.45 metara?
Rjeenje:
a) k = 2,
(
b) FX (x) =
1 (1 + x)2 , x > 0
,
0
, x0
Zadatak 2.51. Unutar kruga radijusa R na sluajan nain biramo toku. Naite funkciju distribucije i funkciju gustoe sluajne varijable koja je definirana kao udaljenost odabrane toke od
sredita kruga.
,
x<0
0
Rjeenje: f (x) = x2 /R2 , 0 x < R .
1
,
xR
Zadatak 2.52. Na sluajan nain odabiremo toku T unutar kvadrata stranice 2. Neka je vrijednost neprekidne sluajne varijable X najmanja udaljenost te toke od stranice kvadrata.
a) Odredite funkciju distribucije sluajne varijable X.
b) Odredite matematiko oekivanje i varijancu sluajne varijable X.
x + 1 , 1 x < 0
fX (x) = 1 x , 0 x < 1 .
0 , inae.
Odredite funkciju distribucije sluajne varijable X te izraunajte njezino matematiko oekivanje
i varijancu.
Zadaci
123
x2
x 2a
2 , x h0, i
k 2e
f (x) =
a
0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X, odredite funkciju distribucije sluajne
varijable X, njezino oekivanje i varijancu te izraunajte P {X 2}.
kx , x h0, e 1i
f (x) =
1+x
0
,
inae
bude funkcija gustoe neprekidne sluajne varijable X, odredite funkciju distribucije sluajne
varijable X i izraunajte P {X 3}.
k ln x , x h1, ei
fX (x) =
0
, inae
bude funkcija gustoe neprekidne sluajne varijable X te odredite njenu funkciju distribucije FX
i vjerojatnost P {0 X < e/2}.
124
Sluajna varijabla
125
Zadaci
Zadatak 2.66. Neka je FX funkcija distribucije neprekidne sluajne varijable X. Odredite funkciju distribucije sluajne varijable Y = X.
Rjeenje: FY (y) = 1 FX (y).
Zadatak 2.67. Sluajna varijabla X ima funkciju gustoe fX (x). Odredite funkcije gustoa
sljedeih sluajnih varijabli:
a)
Y = eX ,
c)
Y =
X, X > 0,
b)
Y = eX ,
d)
Y = shX =
eX eX
.
2
Rjeenje:
(
a) fY (y) =
1
y
fX (ln y) , y > 0
0
(
b) fY (y) =
1
y
fX ( ln y) , y > 0
0
c) fY (y) =
, inae
, inae
2yfX (y 2 ) , y 0
.
0
, inae
Zadatak 2.68. Neka je fX (x) funkcija gustoe neprekidne sluajne varijable X. Odredite funkcije
2
gustoa sluajnih varijabli X 3 + 1, X 5 + 15, X 7 7, X X, eX , X eX , eX .
Rjeenje: fY (y) =
y/6 , 1 y < 4 .
0 ,
inae
1
, x R.
(1 + x2 )
126
Sluajna varijabla
Rjeenje:
(
a) fY (y) =
b) fY (y) =
1
y(1+y)
, y0
0
1
,
(1+y 2 )
, y>0
y R.
Zadatak 2.71. Sluajna varijabla X ima uniformnu distribuciju na intervalu h0, 1i, tj. X
U (0, 1). Odredite funkciju gustoe i funkciju distribucije sluajne varijable
a) Y = aX + b, a, b R, a 6= 0,
b) Z = ln X.
Rjeenje:
a) a > 0 :
a<0:
fY (y) =
(
b) fZ (z) =
fY (y) =
ez , z > 0
.
0 , z0
Zadatak 2.72. Sluajna varijabla X ima uniformnu distribuciju na intervalu h/2, /2i. Odredite funkciju distribucije i funkciju gustoe sluajne varijable Y = cos X.
Zadatak 2.73. Sluajna varijabla X ima uniformnu distribuciju na intervalu h0, 5i. Odredite
funkciju distribucije sluajne varijable Y = eX .
Zadatak 2.74. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 2i, tj. X
U (1, 2). Odredite funkciju gustoe i funkciju distribucije sluajne varijable Y = 2X + 1.
Zadatak 2.75. Sluajna varijabla X ima uniformnu distribuciju na intervalu h2, 4i. Odredite
funkciju gustoe i funkciju distribucije sluajne varijable Y = eX .
Zadatak 2.76. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 3i. Odredite
funkciju gustoe i funkciju distribucije sluajne varijable Y = ln (X).
Zadatak 2.77. Sluajna varijabla X ima uniformnu distribuciju na intervalu h1, 1i. Odredite
funkciju distribucije sluajne varijable Y = 1/X 2 .
Zadaci
127
Zadatak 2.79. Sluajna varijabla X ima eksponencijalnu distribuciju s parametrom 1/2. Odredite funkciju gustoe vjerojatnosti i funkciju distribucije vjerojatnosti sluajne varijable Y = 1/X.
Poglavlje 3
Sluajni vektor
Ukoliko u jednom istraivanju za dani sluajni pokus pratimo nekoliko razliitih sluajnih varijabli, mogue veze meu njima neemo dokuiti ako ih prouavamo samo
svaku za sebe. Meutim, vrlo su esto veze izmeu pojedinih sluajnih varijabli
istog sluajnog pokusa od primarnog interesa.
Primjer 3.1. Broj komaraca na podruju grada Osijeka tijekom lipnja ovog ljeta jest sluajna
varijabla X. Koliina je oborina u svibnju na istom podruju takoer sluajna varijabla Y . Teoretski je za oekivati da izmeu tih dviju sluajnih varijabli postoji veza. Da bismo tu vezu opisali,
moramo nauiti opisivati ureen par sluajnih varijabli (X, Y ).
Od interesa je, dakle, izraditi matematiki model koji omoguuje opisivanje nekoliko sluajnih varijabli danog sluajnog pokusa istovremeno. Radi ilustracije ideje
modela prouimo jednostavan primjer sluajnog pokusa koji se sastoji od izvlaenja
dvije kuglice iz iste kutije.
Primjer 3.2. Iz kutije koja sadri n bijelih i m crnih kuglica izvlaimo dvije kuglice bez vraanja
u kutiju. Neka sluajna varijabla X prima vrijednost 1 ako je u prvom izvlaenju izvuena bijela
kuglica, a 0 ako je u prvom izvlaenju izvuena crna kuglica. Analogno, neka sluajna varijabla
Y prima vrijednost 1 ako je u drugom izvlaenju izvuena bijela kuglica, a 0 ako je u drugom
izvlaenju izvuena crna kuglica.
Rezultate tog sluajnog pokusa moemo opisati dvjema sluajnim varijablama: X i Y . Ako
od njih napravimo ureeni par sluajnih varijabli (X, Y ), onda je skup svih moguih ishoda
R(X, Y ) = {(1, 1), (1, 0), (0, 1), (0, 0)}. Ovdje je prvo mjesto u paru rezervirano za ishode prvog
pokusa (odnosno sluajnu varijablu X), a drugo mjesto rezervirano je za ishode drugog pokusa
(odnosno sluajnu varijablu Y ).
Vjerojatnosna su svojstva tog ureenog para sluajnih varijabli potpuno su odreena poznavanjem
brojeva:
n1
n
p(1,1) = P ({X = 1} {Y = 1}) = P {(X, Y ) = (1, 1)} =
,
n+m n+m1
129
130
Sluajni vektor
m
n
,
n+m n+m1
m
n
p(0,1) = P ({X = 0} {Y = 1}) = P {(X, Y ) = (0, 1)} =
,
n+m n+m1
m
m1
p(0,0) = P ({X = 0} {Y = 0}) = P {(X, Y ) = (0, 0)} =
,
n+m n+m1
koje smo izraunali koritenjem poznate relacije
p(1,0) = P ({X = 1} {Y = 0}) = P {(X, Y ) = (1, 0)} =
P (A B) = P (A | B)P (B),
ako je P (B) > 0 (vidi poglavlje 1.9).
(3.1)
131
Sluajni vektor
Neka svojstva funkcije distribucije sluajnog vektora izrei emo za dvodimenzionalan sluaj.1
Svojstva funkcije distribucije dvodimenzionalnoga sluajnog vektora
Neka je zadan dvodimenzionalan sluajni vektor (X, Y ) svojom funkcijom distribucije F (x, y). Tada vrijedi:
1. Za realne brojeve x1 , x2 , y, takve da je x1 < x2 , vrijedi F (x1 , y) F (x2 , y).
2. Neka su x, y1 , y2 realni brojevi. Ako je y1 < y2 , onda je F (x, y1 ) F (x, y2 ).
3.
lim F (x, y) = F (, y) = 0,
lim F (x, y) = F (, ) = 1.
x
y
xx0
yy0
Kao i kod jednodimenzionalnih sluajnih varijabli razmatrat emo diskretan i neprekidan tip sluajnih vektora kod kojih se funkcija distribucije moe raunati koritenjem tablice distribucije (diskretan sluaj), odnosno funkcije gustoe (neprekidan
sluaj). Takoer emo, zbog jednostavnosti zapisa i lakeg razumijevanja dokaza,
uglavnom razmatranja provoditi na dvodimenzionalnom sluaju, dok emo za viedimenzionalne sluajeve samo navesti analogne rezultate.
Primjer 3.3. Igra se temelji na bacanju dvaju pravilno izraenih novia. U jednoj partiji igre
igra osvaja one novie na kojima se pri bacanju realizirala glava, dok novie na kojima se
realiziralo pismo ne osvaja. Prema tome, ishod bacanja tih dvaju novia moemo modelirati
dvodimenzionalnim diskretnim sluajnim vektorom (X, Y ), gdje je
1
Poopenje za n-dimenzionalan sluajni vektor itatelj moe nai u [26, str. 267].
132
Sluajni vektor
X sluajna varijabla koja prima vrijednost 1 ako se pri bacanju prvog novia realizirala glava,
a vrijednost 0 ako se realiziralo pismo,
Y sluajna varijabla koja prima vrijednost 1 ako se pri bacanju drugog novia realizirala glava,
a vrijednost 0 ako se realiziralo pismo.
Dakle, (X, Y ) je sluajni vektor koji prima vrijednosti iz skupa
R(X, Y ) = {(0, 0), (0, 1), (1, 0), (1, 1)}
s vjerojatnostima
1
1
,
p(0, 1) = P {X = 0, Y = 1} = ,
4
4
1
1
p(1, 0) = P {X = 1, Y = 0} = ,
p(1, 1) = P {X = 1, Y = 1} = .
4
4
2
Ako elimo odrediti funkciju distribucije F : R [0, 1] tog sluajnog vektora, uoimo:
p(0, 0) = P {X = 0, Y = 0} =
1
,
4
1
,
2
1
,
2
1/4,
(x, y) [0, 1i [0, 1i
3.1
Analogno kao kod diskretne sluajne varijable, diskretan sluajni vektor (X, Y )
prima vrijednosti iz konanog ili prebrojivog skupa
R(X, Y ) = {(xi , yj ) : (i, j) I},
I N N,
(3.2)
133
xi x yj y
Niz brojeva definiran izrazom (3.2) zvat emo distribucija diskretnoga sluajnog vektora (X, Y ). Da bismo pojednostavnili zapis distribucije sluajnog vektora, u nastavku emo teksta pisati I = N N, podrazumijevajui pod tim da je
skup indeksa najvie N N, a zapravo sadri samo one indekse koji se pojavljuju u
konkretnom sluaju.
Primjer 3.4. Promatrajmo sluajni pokus koji se sastoji od jednog bacanja pravilno izraene
igrae kocke i jednog bacanja pravilno izraenog novia. Skup elementarnih dogaaja ovog pokusa
jest skup
= {{1, P }, {2, P }, {3, P }, {4, P }, {5, P }, {6, P },
{1, G}, {2, G}, {3, G}, {4, G}, {5, G}, {6, G}}.
Neka sluajna varijabla X daje broj koji se okrenuo na kocki, a sluajna varijabla Y daje 1 ako
je bacanjem novia palo pismo i 0 ako je bacanjem novia pala glava. U tom pokusu bacanje
kocke i novia ne ovise jedno o drugom pa vrijedi:
1
1 1
=
,
6 2
12
1 1
1
p(1, 0) = P {X = 1, Y = 0} = =
.
6 2
12
p(1, 1) = P {X = 1, Y = 1} =
Analogno dobijemo da je
p(i, j) = P {X = i, Y = j} =
1
,
12
Primjer 3.5. Promatrajmo sljedeu igru: prvo bacamo pravilno izraenu igrau kockicu. Ako se
okrenuo broj 6, ostvarujemo pravo na bacanje pravilno izraenog novia, pri emu osvajamo bod
ako padne pismo, a u suprotnom gubimo igru.
Taj pokus moemo opisati skupom elementarnih dogaaja
= {(1, N ), (2, N ), (3, N ), (4, N ), (5, N ), (6, Ip ), (6, Ig )},
gdje N znai da drugu igru ne igramo, Ip da drugu igru igramo i da se u njoj dogodilo pismo, a
Ig da drugu igru igramo i da se u njoj nije dogodilo pismo.
Neka je X sluajna varijabla koja prima vrijednost 1 ako se pri bacanju kockice realizirao broj 6,
a u suprotnom prima vrijednost 0. Neka je Y sluajna varijabla koja prima vrijednost 1 ako je
igra osvojio bod, a u suprotnom prima vrijednost 0. Osvajanje boda u igri opisano je realizacijom
dogaaja {(X, Y ) = (1, 1)}. Distribucija je tog sluajnog vektora sljedea:
5
,
6
p(0, 1) = P {X = 0, Y = 1} = P ({Y = 1} | {X = 0}) P {X = 0} = 0,
1 1
1
p(1, 0) = P {X = 1, Y = 0)} = P ({Y = 0} | {X = 1}) P {X = 1} = =
,
2 6
12
1 1
1
p(1, 1) = P {X = 1, Y = 1} = P ({Y = 1} | {X = 1}) P {X = 1} = =
.
2 6
12
p(0, 0) = P {X = 0, Y = 0} = P ({Y = 0} | {X = 0}) P {X = 0} = 1
134
Sluajni vektor
Uoimo da za niz brojeva (p(xi , yj ), i N, j N) koji definira distribuciju diskretnog dvodimenzionalnog sluajnog vektora vrijedi:
1. p(xi , yj ) 0 za sve i N, j N,
2.
P
P
p(xi , yj ) = 1.
i=1 j=1
Ukoliko je skup vrijednosti sluajnog vektora (X, Y ) konaan, tj. sluajni vektor
prima vrijednosti iz skupa R(X, Y ) = {(xi , yj ) : i = 1, 2, . . . , m, j = 1, 2, . . . , n},
njegova se distribucija pregledno moe prikazati tablicom 3.1 koju zovemo tablica
distribucije dvodimenzionalnoga diskretnog sluajnog vektora.2
X Y
x1
x2
..
.
xm
y1
p(x1 , y1 )
p(x2 , y1 )
y2
p(x1 , y2 )
p(x2 , y2 )
y3
p(x1 , y3 )
p(x2 , y3 )
yn
p(x1 , yn )
p(x2 , yn )
p(xm , y1 )
p(xm , y2 )
p(xm , y3 )
p(xm , yn )
0
5/6
1/12
1
0
1/12
zapis distribucije sluajnog vektora moemo lako prilagoditi i za sluajni vektor s prebrojivim skupom vrijednosti analogno kao kod tablica distribucije sluajne varijable.
135
1
0
1/6
1/6
2
1/6
0
1/6
3
1/6
1/6
0
Sluajne varijable X i Y imaju isti skup vrijednosti: R(X) = R(Y ) = {1, 2, 3}. Koristei injenicu
da familija skupova {{Y = 1}, {Y = 2}, {Y = 3}} ini particiju skupa , moemo izraunati
P {X = i} za i = 1, 2, 3 na sljedei nain:
1
P {X = i} = P {X = i, Y = 1} + P {X = i, Y = 2} + P {X = i, Y = 3} = ,
3
i=1,2,3. Dakle, marginalna distribucija komponente X sluajnog vektora (X, Y ) dana je tablicom
!
1 2 3
X= 1 1 1 .
3 3 3
Uoimo da su obje marginalne distribucije u tom primjeru jednake, meutim, sluajne varijable X
i Y ni u kom sluaju nisu jednake sluajne varijable. Naime, sluajne varijable X i Y definirane
na istom vjerojatnosnom prostoru jednake su ako je X() = Y () za sve . U naem je
sluaju ak nemogue da je X() = Y () za bilo koji jer bi to znailo da je u oba izvlaenja
izvuen isti kupon, to se u spomenutom pokusu ne moe dogoditi. Za sluajne varijable koje imaju
D
iste distribucije rei emo da su jednako distribuirane sluajne varijable, oznaka X = Y .
P {X = xi , Y = yj } =
jN
p(xi , yj ),
j=1
P
j=1
P
i=1
p(xi , yj ), i N,
(3.3)
p(xi , yj ), j N,
136
Sluajni vektor
tada skup vrijednosti R(X) = {xi : i N} i niz (pX (xi ), i N) odreuju marginalnu distribuciju komponente X sluajnog vektora (X, Y ), a skup vrijednosti
R(Y ) = {yj : j N} i niz (pY (yj ), j N) odreuju marginalnu distribuciju
komponente Y toga sluajnog vektora.
Marginalne se distribucije lako raunaju u sluaju konanog skupa vrijednosti sluajnog vektora koristei tablini zapis distribucije. Naime, ako je distribucija dana
tablicom 3.1, onda sumiranjem vrijednosti u istom stupcu dobijemo vjerojatnost
P {Y = yj } = pY (yj ), a sumiranjem vrijednosti u istom retku vjerojatnosti P {X =
xi } = pX (xi ), pa tablicu 3.1 moemo proiriti kao to je prikazano tablicom 3.2.
X Y
x1
x2
..
.
xm
pY (yj )
y1
p(x1 , y1 )
p(x2 , y1 )
y2
p(x1 , y2 )
p(x2 , y2 )
y3
p(x1 , y3 )
p(x2 , y3 )
yn
p(x1 , yn )
p(x2 , yn )
pX (xi )
pX (x1 )
pX (x2 )
p(xm , y1 )
pY (y1 )
p(xm , y2 )
pY (y2 )
p(xm , y3 )
pY (y3 )
p(xm , yn )
pY (yn )
pX (xm )
1
k() = 36.
Neka su X i Y diskretne sluajne varijable na P() ije su realizacije odreene na sljedei nain:
- ako se pri bacanju na kockicama okrenu razliiti brojevi, X se realizira manjim, a Y veim
brojem (npr. ako se na prvoj kockici okrene 3, a na drugoj kockici 6, tada uzimamo da je
3 realizacija sluajne varijable X, a 6 realizacija sluajne varijable Y ),
- ako se pri bacanju na kockicama okrenu isti brojevi, tada se i X i Y realiziraju tim brojem.
Oito je
R(X) = R(Y ) = {1, 2, 3, 4, 5, 6}.
elimo odrediti marginalne distribucije sluajnog vektora (X, Y ).
Slika sluajnog vektora (X, Y ) jest skup
R(X, Y ) = {(x, y) : x, y {1, 2, 3, 4, 5, 6}}.
Vjerojatnosti realizacija sluajnog vektora (X, Y ) dane su na sljedei nain:
- ako je x > y, tada je P {X = x, Y = y} = 0,
- ako je x = y, tada je P {X = x, Y = y} = 1/36,
137
P {X = x, Y = y},
yR(Y )
- za fiksni je y R(Y )
pY (y) = P {Y = y} =
P {X = x, Y = y}.
xR(X)
Meutim, distribuciju sluajnog vektora (X, Y ) i njegove marginalne distribucije pregledno moemo
prikazati sljedeom tablicom (proirenom tablicom distribucije):
XY
1
2
3
4
5
6
pY (y)
1
1/36
0
0
0
0
0
1/36
2
1/18
1/36
0
0
0
0
3/36
3
1/18
1/18
1/36
0
0
0
5/36
4
1/18
1/18
1/18
1/36
0
0
7/36
5
1/18
1/18
1/18
1/18
1/36
0
9/36
6
1/18
1/18
1/18
1/18
1/18
1/36
11/36
pX (x)
11/36
9/36
7/36
5/36
3/36
1/36
1
X=
1
2
3
4
5
6
1/36 3/36 5/36 7/36 9/36 11/36
Y =
Primjer 3.8. Na analogan nain moemo odrediti marginalne distribucije diskretnog sluajnog
vektora koji nema konanu sliku. Neka je (X, Y ) diskretan sluajni vektor ija je distribucije dana
na sljedei nain:
R(X, Y ) = N0 N0 ,
2x 2y 4
P {X = x, Y = y} =
e , (x, y) N0 N0 .
x!y!
Odredimo marginalne distribucije tog sluajnog vektora. Slika sluajne varijable X jest skup
R(X) = N0 , a
P {X = x} =
X
yN0
P {X = x, Y = y} =
2x 4 X 2y
2x 2
e
=
e ,
x!
y!
x!
y=0
138
2.
Sluajni vektor
6
P
pi = 1.
i=1
Uoimo da ako je pi = 1/6 za svaki i, tada se radi o pravilno izraenoj igraoj kockici, no
openito ne mora biti tako. Neka je ta kockica baena n puta zaredom. Realizacija je tog bacanja
jedna ureena n-torka elemenata iz skupa {1, . . . , 6} ili, preciznije, varijacija s ponavljanjem n-tog
razreda skupa {1, . . . , 6}.
Pretpostavimo da elimo odrediti vjerojatnost da se u tih n bacanja x puta okrenula jedinica i da
se y puta okrenula estica, pri emu je x + y n. U tu svrhu oznaimo X sluajnu varijablu
koja se realizira brojem jedinica, a Y sluajnu varijablu koja se realizira brojem estica koje su se
okrenule u n bacanja te kockice i odredimo vjerojatnost P {X = x, Y = y} za x, y {0, 1, . . . , n}
takve da je x + y n. Varijacija s ponavljanjem n-tog razreda skupa {1, . . . , 6} u kojima su x
komponenti jedinice, y komponenti estice, a preostalih (n x y) komponenti dvojke, trojke,
etvorke ili petice ima
n!
x!y!(n x y)!
i svaka od njih realizira se s vjerojatnou
y
y
nxy
nxy
px
= px
.
1 p6 (p2 + p3 + p4 + p5 )
1 p6 (1 p1 p6 )
n!
px py (1 p1 p6 )nxy .
x!y!(n x y)! 1 6
(3.4)
Za sluajni vektor (X, Y ) s distribucijom 3.4 kaemo da ima multinomnu distribuciju s parametrima n, p1 i p6 i piemo (X, Y ) M U LT (n, p1 , p6 ). Za odreivanje distribucije (tablice distribucije) sluajne varijable X iz distribucije 3.4 vano je uoiti da je za realizacije x i y sluajnih
varijabli X i Y sa svojstvom x + y n P {X = x, Y = y} > 0, dok je inae P {X = x, Y = y} = 0.
Sada slijedi da je za x {0, 1, . . . , n}
X
P {X = x} =
P {X = x, Y = y} =
yR(Y)
n!
px
x!(n x)! 1
nx
X
y=0
(n x)!
py (1 p1 p6 )nxy =
y!(n x y)! 6
n nx
n
X n x y
=
px
p6 (1 p1 p6 )nxy =
px (1 p1 )nx ,
1
x
y
x 1
y=0
gdje je zadnja suma rijeena primjenom binomnog teorema. Dakle, slijedi da je X binomna
sluajna varijabla s parametrima n N i p1 h0, 1i. Analognim postupkom slijedi da je Y
B(n, p6 ).
i N,
j N,
i neka je g neka funkcija koja ureenom paru realnih brojeva pridruuje realan
broj, tj. g : R2 R. Tada g(X, Y ) definira sluajnu varijablu na . Na primjer,
139
X +Y =
2 3 4 5 6
p2 p3 p4 p5 p6
!
,
gdje je
p2
p3
p4
p5
p6
= P {Z
= P {Z
= P {Z
= P {Z
= P {Z
= 2} = P {X
= 3} = P {X
= 4} = P {X
= 5} = P {X
= 6} = P {X
= 1, Y
= 1, Y
= 1, Y
= 3, Y
= 3, Y
= 1} = 0,
= 2} + P {X = 2, Y = 1} = 1/3,
= 3} + P {X = 3, Y = 1} + P {X = 2, Y = 2} = 1/3,
= 2} + P {X = 2, Y = 3} = 1/3,
= 3} = 0.
3 4 5
1 1 1
3 3 3
!
.
Odredite tablice distribucija sluajnog vektora (X, Y ) i sluajne varijable (X + Y ) ako se izvlaenje
vri s vraanjem.
Primjer 3.11. Iz skupa {1, 2, . . . , 9} na sluajan nain izvlaimo tri broja jedan po jedan (s
vraanjem izvuenih brojeva u skup). Prvi izvueni broj bit e znamenka stotica, drugi izvueni
broj znamenka desetica, a trei izvueni broj znamenka jedinica troznamenkastog broja. Izvlaenje
znamenke stotica modeliramo sluajnom varijablom Z1 , znamenke desetica sluajnom varijablom
Z2 , a znamenke jedinica sluajnom varijablom Z3 . Sluajna je varijabla Zi , i {1, 2, 3}, diskretna
sluajna varijabla koja se brojem iz skupa {1, 2, . . . , 9} realizira s vjerojatnou 1/9. Dakle, Z1 ,
Z2 i Z3 jesu diskretne uniformne sluajne varijable na skupu {1, 2, . . . , 9} i zadane su tablicom
distribucije
!
1 2 3 4 5 6 7 8 9
Zi =
, i {1, 2, 3}.
1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
Uoimo da ima smisla promatrati trodimenzionalan diskretan sluajni vektor (Z1 , Z2 , Z3 ) ija
je slika R(Z1 , Z2 , Z3 ) = {(i, j, k), i, j, k {1, 2, . . . , 9}}. Jedna realizacija sluajnog vektora
(Z1 , Z2 , Z3 ) jest varijacija s ponavljanjem treeg razreda skupa od devet elemenata, stoga skup
R(Z1 , Z2 , Z3 ) ima 93 = 729 elemenata. Kako su dogaaji {Z1 = i, Z2 = j, Z3 = k} za sve
i, j, k {1, 2, . . . , 9} jednako vjerojatni, slijedi da je
1
, (i, j, k) R(Z1 , Z2 , Z3 ).
729
Time je u potpunosti zadana distribucija trodimenzionalnog diskretnog sluajnog vektora (Z1 , Z2 , Z3 ).
P {Z1 = i, Z2 = j, Z3 = k} =
Y = min {Z1 , Z2 , Z3 }.
140
Sluajni vektor
1
.
729
1
,
729
P {Y = 1} =
217
.
729
Dakle, ne vrijedi da je
P {X = x, Y = y} = P {X = x}P {Y = y},
9
X
P {X = k, Y = k n},
n R(X Y ).
k=n+1
9
X
k=1
P {X = k, Y = k} =
9
.
729
Vano je napomenuti da se oekivanje sluajne varijable g(X, Y ), nastale na temelju kompozicije realne funkcije g i diskretnog sluajnog vektora, moe izraunati
koristei tablicu distribucije sluajnog vektora (X, Y ) i oblik funkcije g bez raunanja tablice distribucije sluajne varijable g(X, Y ) (naravno, ukoliko oekivanje
postoji!). Ta tvrdnja moe se lako provjeriti koristei rezultate teorije ponovljenih
redova (vidi poglavlje 5.3 u Dodatku) tj. injenice da se kod apsolutno konvergentnih redova moe mijenjati redoslijed sumacije bez utjecaja na konaan rezultat.
Precizna formulacija te tvrdnje dana je teoremom 3.1.
141
i
XX
i
g(xi , yj )p(xi , yj )
Primjer 3.12. Standardan sveanj od 52 karte sastoji se od 26 crvenih karata (13 hercova i
13 karo karata) i 26 crnih karata (13 pikova i 13 trefova). Iz takvog se svenja na sluajan
nain jedna za drugom (bez vraanja) izvlae dvije karte. Oznaimo s X sluajnu varijablu koja
se realizira brojem izvuenih pikova, a s Y sluajnu varijablu koja se realizira brojem izvuenih
trefova. Zakljuujemo da je distribucija sluajnog vektora (X, Y ) sljedea:
R(X, Y ) = {(x, y) : x {0, 1, 2}, y {0, 1, 2}, x + y 2},
13 13
26
P {X = x, Y = y} =
2xy
52
2
Distribuciju sluajnog vektora (X, Y ) i njegove marginalne distribucije pregledno prikazujemo sljedeom tablicom:
X Y
0
1
2
pY (y)
0
25/102
13/51
1/17
19/34
1
13/51
13/102
0
13/34
2
1/17
0
0
1/17
pX (x)
19/34
13/34
1/17
1
2
2 X
X
(x + y)P {X = x, Y = y} =
x=0 y=0
=1
13
1
13
13
1
+2
+1
+2
+2
= 1.
51
17
51
102
17
142
Sluajni vektor
Radi provjere dobivenog rezultata odredimo ipak distribuciju sluajne varijable (X + Y ) i izraunajmo njezino oekivanje. Pomou tablice distribucije sluajnog vektora (X, Y ) raunamo:
P {X + Y = 0} = P {X = 0, Y = 0} =
25
,
102
P {X + Y = 1} = P {X = 1, Y = 0} + P {X = 0, Y = 1} =
26
,
51
P {X + Y = 2} = P {X = 2, Y = 0} + P {X = 1, Y = 1} + P {X = 0, Y = 2} =
25
.
102
0
1
2
25/102 26/51 25/102
!
,
26
25
25
+1
+2
= 1,
102
51
102
3.1.1
Uvjetne distribucije
Ako elimo prouavati veze meu komponentama sluajnog vektora, sama tablica
distribucije nije praktina, a marginalne distribucije su nedovoljne. Bolji uvid dobije
se analizom uvjetnih vjerojatnosti oblika P ({X A}|{Y = y}), gdje je A podskup
od R(X) ili P ({Y A}|{X = x}), gdje je A podskup od R(Y ). U tu svrhu definirat
emo uvjetne distribucije sluajnog vektora. Radi jednostavnijeg zapisa koristit
emo sljedeu oznaku:
P ({X A}|{Y = y}) = P {X A|Y = y}.
Primjer 3.13. Tablicom distribucije 3.4 opisan je sluajni vektor (T, Z) kojim je modeliran nivo
uspjeha pri polaganju teorijskog dijela (T ) i zadataka (Z) iz jednog ispita matematikog sadraja.
T Z
1
2
3
66
100
5
100
2
100
73
100
2
100
5
100
4
100
11
100
2
100
2
100
12
100
16
100
70
100
12
100
18
100
P {T = 1, Z = 1}
66
=
,
P {Z = 1}
73
P {T = 2|Z = 1} =
5
P {T = 2, Z = 1}
=
,
P {Z = 1}
73
143
2
P {T = 3, Z = 1}
=
.
P {Z = 1}
73
Uoimo da je suma dobivenih triju brojeva jednaka 1 te da oni daju uvjetne vjerojatnosti da se
postigne nivo uspjeha i iz teorije, i {1, 2, 3}, uz uvjet da je na zadacima postignut nivo 1. Na
taj nain odreena je uvjetna distribucija od T , uz uvjet da je Z = 1, koju moemo prikazati i
tablino:
!
1 2 3
T|Z=1 = 66 5 2
.
P {T = 3|Z = 1} =
73 73 73
2
5
4
11 11 11
!
,
T|Z=3 =
2
2 12
16 16 16
!
.
Iz navedenih uvjetnih distribucija moe se vidjeti da je, uz uvjet Z = 1, puno vea vjerojatnost da
se na teoriji postigne nivo 1 nego da se postigne neki vii nivo uspjeha. Nasuprot tomu, uz uvjet
da je Z = 3 vea je vjerojatnost da se i na teoriji postigne nivo uspjeha 3 nego manji nivoi. Te
injenice daju naslutiti da se uvjetna distribucija od T mijenja s razliitim vrijednostima od Z,
tj. da izmeu nivoa uspjeha postignutog na zadacima i teoriji postoji neka veza.
Opisujui numerike karakteristike dobivenih uvjetnih distribucija, ta injenica postaje jo slikovitija. Tako za oekivanja vrijedi:
E(T |Z = 1) = 1.12,
E(T |Z = 2) = 2.18,
E(T |Z = 3) = 2.63,
pa moemo rei da oekivanje nivoa uspjeha iz teorije raste s porastom nivoa uspjeha iz zadataka.
U openitom sluaju pretpostavimo da je tablicom 3.5 dana distribucija dvodimenzionalnog sluajnog vektora (X, Y ).
X Y
x1
x2
..
.
pY
y1
p(x1 , y1 )
p(x2 , y1 )
y2
p(x1 , y2 )
p(x2 , y2 )
y3
p(x1 y3 )
p(x2 , y3 )
pX
pX (x1 )
pX (x2 )
pY (y1 )
pY (y2 )
pY (y3 )
...
pX|Y =yj (x1 ) pX|Y =yj (x2 ) . . .
pX|Y =yj (xi ) =
x2
!
,
p(xi , yj )
, i {1, 2, . . .}
pY (yj )
(3.5)
144
Sluajni vektor
Zadatak 3.3. Dokaite da je tablicom 3.5 dobro definirana tablica distribucije, tj. da vrijedi
X
pX|Y =yj (xi ) 0, i,
pX|Y =yj (xi ) = 1.
i
Za y = 1 je P {X = 0|Y = 1} =
2
,
3
P {X = 1|Y = 1} =
1
3
i P {X = 2|Y = 1} = 0.
0 1
2/3 1/3
!
,
Primjer 3.15. U primjeru 3.9 pokazali smo da su marginalne distribucije sluajnog vektora
(X, Y ) M U LT (n, p1 , p6 ) binomne, tj. da je X B(n, p1 ), a Y B(n, p6 ). Odredimo sada
uvjetne distribucije tih komponenti tog sluajnog vektora. Za x R(X) je
y
nxy
n x p
P {X = x, Y = y}
p6
6
=
1
.
P {Y = y|X = x} =
P {X = x}
1 p1
1 p1
y
Slijedi da je uvjetna distribucija od Y , uz uvjet X = x, binomna s parametrima (nx) i p6 /(1p1 ).
Analogno slijedi da je uvjetna distribucija od X, uz uvjet Y = y, binomna s parametrima (n y)
i p1 /(1 p6 ). Budui da je matematiko oekivanje binomne sluajne varijable jednako umnoku
njezinih parametara, slijedi da je
E(Y |X = x) =
p6 (n x)
,
1 p1
x R(X),
E(X|Y = y) =
p1 (n y)
,
1 p6
y R(Y ).
145
3.1.2
Nezavisnost
y1
p(x1 , y1 )
p(x2 , y1 )
y2
p(x1 , y2 )
p(x2 , y2 )
y3
p(x1 y3 )
p(x2 , y3 )
pX
pX (x1 )
pX (x2 )
pY (y1 )
pY (y2 )
pY (y3 )
146
Sluajni vektor
P {X A, Y B} =
P {} =
P P
P P
=
p(xi , yj ) =
P {X = xi }P {Y = yj } =
xi A yj B
x A yj B
P
P i
=
P {X = xi }
P {Y = yj } =
{X()A,Y ()B}
xi A
yj B
= P {X A}P {Y B}.
Primjer 3.16. Iz kutije koja sadri tri kupona s oznakama 1, 2 i 3 izvlaimo dva kupona tako
da prvi izvueni kupon vratimo u kutiju prije izvlaenja drugog kupona (izvlaenje s vraanjem).
Rezultat izvlaenja modeliran je sluajnim vektorom (X, Y ), gdje je X rezultat prvog izvlaenja,
a Y razultat drugog izvlaenja. Distribucija tog sluajnog vektora dana je sljedeom tablicom:
X Y
1
2
3
pY
1
1/9
1/9
1/9
1/3
2
1/9
1/9
1/9
1/3
3
1/9
1/9
1/9
1/3
pX
1/3
1/3
1/3
1
Koristei teorem 3.2 vidimo da su X i Y nezavisne. Takoer moemo uoiti da su uvjetne distribucije komponente X, uz dano Y = i, jednake za sve i {1, 2, 3} i da su jednake marginalnim
distribucijama komponente X. Analogna tvrdnja vrijedi i za uvjetne distribucije komponente Y ,
uz dano X = i, i {1, 2, 3}.
Promotrimo sada izvlaenje dvaju kupona, ali bez vraanja prvog izvuenog kupona u kutiju. Rezultat izvlaenja modeliran je sluajnim vektorom (U, V ), gdje je U rezultat prvog izvlaenja, a V
razultat drugog izvlaenja. Distribucija sluajnog vektora (U, V ) dana je tablicom
U V
1
2
3
pY
1
0
1/6
1/6
1/3
2
1/6
0
1/6
1/3
3
1/6
1/6
0
1/3
pX
1/3
1/3
1/3
1
147
Koristei teorem 3.2 vidimo da U i V nisu nezavisne. Takoer uoimo da se marginalne distribucije sluajnih vektora (X, Y ) i (U, V ) podudaraju.
p(xi , yj )
pX (xi )pY (yj )
=
= pX (xi ),
pY (yj )
pY (yj )
i {1, 2, . . .}.
xi yj p(xi , yj ) =
PP
= E(X) E(Y ).
Koristei teorem 3.1 moemo zakljuiti da E(XY ) postoji i da vrijedi tvrdnja teorema.
3 Vidi
npr. [13].
148
Sluajni vektor
3.2
f (u, v) du dv.
(3.6)
2
+
2
1
1
1 2
2
2(1 )
p
,
(3.7)
f (x, y) =
e
21 2 1 2
gdje su 1 R, 2 R, 1 > 0, 2 > 0, h1, 1i. U tom sluaju koristimo oznaku (X, Y )
N (1 , 2 , 12 , 22 , ). 4
Ako je (X, Y ) neprekidan sluajni vektor s funkcijom gustoe f (x, y) onda e njegove
marginalne distribucije takoer biti neprekidnog tipa s gustoama koje moemo
izraunati iz f (x, y).
Zaista, neka je (X, Y ) dvodimenzionalan sluajni vektor s gustoom f (x, y). Vrijedi:
Zx Z
P {X x} = P {X x, Y < } =
f (u, v) du dv =
Zx
=
Vidi Sarapa [26, str. 274].
f (u, v) dv du.
149
Z
f (x, v) dv ,
fX (x) =
onda je fX realna funkcija realne varijable koja ima potrebna svojstva da bi bila
gustoa sluajne varijable X, tj. ona je nenegativna i za svaki x R vrijedi:
Zx
P {X x} =
fX (u) du.
Funkciju fX zovemo marginalna funkcija gustoe komponente X sluajnog vektora (X, Y ). Analogno je
Z
fY (y) =
f (u, y) du ,
1
p
e 2(1)2
2
21 2 1
y2
2
x1
1
2
1
2(1)2
y2
2
dy = 2 dz
1
p
e
21 1 2
x1
1
y2
2
2 1
1
dy =
1
2 x
=z
2(12 )
x1
1
2
1
= z + 2 x
1
1
2
2(12 )
x1
1
2
Z
e
z2
2(12 )
dz =
p
z
= t, dz = 1 2 dt
p
2
1
1
=
e
21
(x1 )2
2
21
t2
1
dt =
e
21
(x1 )2
2
21
2 =
1 2
(x1 )2
2
21
Uoimo da je
1
(x1 )2
2
21
, xR
(3.8)
1 2
funkcija gustoe normalne distribucije s parametrima 1 R i 12 , 1 > 0, tj. X N (1 , 12 ).
Analognim postupkom slijedi da je Y N (2 , 22 ). Dakle, marginalne distribucije dvodimenzionalnog normalnog sluajnog vektora su normalne.
fX (x) =
150
Sluajni vektor
Moe se takoer pokazati da za raunanje oekivanja tako nastalih sluajnih varijabli nije potrebno traiti funkciju distribucije od g(X, Y ), ve se moe iskoristiti
funkcija gustoe od (X, Y ) i oblik funkcije g (ako oekivanje uope postoji) na
sljedei nain:
Z Z
Eg(X, Y ) =
g(x, y) dx dy.
(3.9)
Z
x f (x, y) dx dy =
(3.10)
Primjer 3.20. Neka je neprekidan dvodimenzionalan sluajni vektor (X, Y ) zadan funkcijom
gustoe
(
1 2 e1 x2 y , (x, y) h0, i h0, i
f (x, y) =
,
0
,
inae
gdje su 1 i 2 pozitivni realni brojevi. Sluajna varijabla XY nastaje kompozicijom sluajnog
vektora (X, Y ) : R2 i funkcije g : R2 R definirane pravilom g(x, y) = xy. Matematiko
oekivanje sluajne varijable XY raunamo na sljedei nain:
Z Z
E(XY ) =
ZZ
xyf (x, y) dx dy = 1 2
xye1 x1 y dx dy =
1
1 2
=
.
21 22
1 2
e1 x2 y dy = . . . = 1 e1 x ,
x > 0.
151
3.2.1
U ovom emo poglavlju emo bez dokaza navesti nekoliko rezultata korisnih za
statistike primjene po analogiji s diskretnim sluajem. Tu se pojavljuje funkcija
gustoe sluajnog vektora kao nositelj vjerojatnosnih svojstava umjesto tablice distribucije diskretnoga sluajnog vektora.
Neka je (X, Y ) neprekidan sluajni vektor s gustoom f (x, y) i y takav realan broj
da je fY (y) > 0. Funkciju
f (x, y)
fX|Y =y (x) =
(3.11)
fY (y)
zovemo uvjetna gustoa od X uz uvjet Y = y. Analogno je
f (x, y)
fX (x)
fY |X=x (y) =
(3.12)
(3.13)
y fY |X=x (y) dy
(3.14)
odnosno
Z
E(Y | X = x) =
fX|Y =y (x) =
1
f (x, y)
p
=
e
fY (y)
1 2(1 2 )
2
x 1 + 1 (y2 )
2
2 (12 )
21
1
(y 2 )
2
12 (1 2 ).
x R.
152
Sluajni vektor
Iz tog rezultata odmah slijedi da su uvjetno oekivanje i varijanca sluajne varijable X, uz uvjet
Y = y, dani sljedeim izrazima:
E(X|Y = y) = 1 +
1
(y 2 ),
2
V ar(X|Y = y) = 12 (1 2 ).
U poglavlju o nezavisnosti komponenata dvodimenzionalnog sluajnog vektora vidjeli smo da se nezavisnost moe karakterizirati injenicom da se distribucija sluajnog vektora moe dobiti kao produkt marginalnih distribucija. Problemom nezavisnosti komponenti neprekidnog sluajnog vektora neemo se baviti detaljno.
Navodimo samo da je u tom sluaju nezavisnost ekvivalentna injenici da se funkcija gustoe sluajnog vektora moe prikazati kao produkt marginalnih gustoa kao
i injenici da se funkcija distribucije sluajnog vektora moe prikazati kao produkt
marginalnih funkcija distribucije:
Neka je (X, Y ) neprekidan sluajni vektor s funkcijom gustoe f i funkcijom distribucije F . Neka su fX (FX ) odnosno fY (FY ) njegove marginalne
gustoe (funkcije distribucije). Rei emo da su sluajne varijable X i Y
nezavisne ako za svaki (x, y) R2 vrijedi
F (x, y) = FX (x) FY (y).
Tada je i
f (x, y) = fX (x) fY (y)
za svaki (x, y) R2 .
Obratno, ako prethodna jednakost za gustoe vrijedi za sve (x, y) R2 osim eventualno na skupu povrine nula, tada su X i Y nezavisne sluajne varijable.
Sada je lako vidjeti da se i ovdje, u sluaju nezavisnih komponenti, uvjetne gustoe
podudaraju s odgovarajuim marginalnim gustoama.
Primjer 3.22. Promotrimo ponovno sluajni vektor zadan funkcijom gustoe
(
1 2 e1 x2 y , (x, y) h0, i h0, i
f (x, y) =
,
0
,
inae
153
gdje su 1 i 2 pozitivni realni brojevi. U primjeru 3.20 pokazali smo da su njegove marginalne
distribucije eksponencijalne, tj. da je X eksponencijalna sluajna varijabla s parametrom 1 > 0,
a Y eksponencijalna sluajna varijabla s parametrom 2 > 0:
(
(
2 e2 y , y > 0
1 e1 x , x > 0
.
,
fY (y) =
fX (x) =
0
, y0
0
, x0
Uoimo da je u tom sluaju
f (x, y) = fX (x)fY (y)
pa su sluajne varijable X i Y nezavisne. Zbog nezavisnosti sluajnih varijabli X i Y vrijede
sljedee tvrdnje.
Marginalna distribucija komponente X i uvjetna distribucija komponente X, uz uvjet Y = y (za
bilo koji y > 0), jednake su - eksponencijalne s parametrom 1 .
Marginalna distribucija komponente Y i uvjetna distribucija komponente Y , uz uvjet X = x (za
bilo koji x > 0), jednake su - eksponencijalne s parametrom 2 .
Primjer 3.23. Na temelju primjera 3.19 u kojemu su odreene marginalne distribucije dvodimenzionalnoga normalnog sluajnog vektora (X, Y ) s funkcijom gustoe (3.7) i karakterizacije
nezavisnosti sluajnih varijabli, slijedi da komponente X N (1 , 12 ) i Y N (2 , 22 ) normalnog
sluajnog vektora (X, Y ) openito nisu nezavisne. Meutim, za = 0 funkcija gustoe (3.7) dana
je izrazom
2
2
x1
2
+ y
21
1
1
2
f (x, y) =
, (x, y) R2 .
e
21 2
Uoimo da je u tom sluaju f (x, y) = fX (x)fY (y), tj. ako je = 0, komponente normalnoga
sluajnog vektora (X, Y ) nezavisne su.
1
.
1 2
Sjetimo se da smo E(XY ) u primjeru 3.20 izraunali pomou funkcije gustoe sluajnog vektora
(X, Y ).
5 Taj
teorem neemo dokazivati, a zainteresirani itatelj dokaz moe nai u [26, teorem 11.5]
154
3.3
Sluajni vektor
U ovom poglavlju bavimo se definiranjem osnovnih numerikih katakteristika sluajnog vektora - momentima. Rezultati se odnose na diskretan i neprekidan dvodimenzionalan sluajni vektor za kojega smo opisali nain raunanja oekivanja sluajne
varijable g(X, Y ), gdje je g realna funkcija dviju varijabli.
Momenti sluajnog vektora posluit e za opisivanje nekih svojstava sluajnog vektora slino kao to momenti sluajne varijable opisuju sluajnu varijablu.
Definicija 3.5. Neka je (X, Y ) diskretan ili neprekidan dvodimenzionalan sluajni
vektor. Oekivanje
E(X k Y l ), k, l N0
sluajne varijable X k Y l (ako postoji) nazivamo ishodini moment reda (k, l)
sluajnog vektora (X, Y ) i piemo
kl = E(X k Y l ).
(3.15)
l
(3.16)
Uoimo da momenti reda (0, 1), (0, 2), (1, 0), (2, 0) daju ustvari oekivanje i varijancu komponenata sluajnog vektora. Naime, vrijedi:
10 = EX,
01 = EY,
2
m20 = E (X EX) = Var X,
2
m02 = E (Y EY ) = Var Y.
Od posebne je vanosti za izuavanje sluajnih vektora centralni moment reda (1, 1)
kojega nazivamo korelacijski moment ili kovarijanca dvodimenzionalnoga sluajnog vektora. Dakle, kovarijanca dvodimenzionalnog sluajnog vektora (X, Y )
definirana je izrazom
Cov (X, Y ) = E ((X EX)(Y EY )) .
(3.17)
Definicijski oblik kovarijance moe se lako, koritenjem linearnosti oekivanja, transformirati u oblik koji je nekada prikladniji za raunanje:
Cov (X, Y ) = E (XY X EY ) Y EX + EX EY ) = E(XY ) EX EY.
155
Primjer 3.25. Prisjetimo se primjera 3.16 koji je govorio o izvlanju dvaju kupona iz kutije koja
sadri ukupno tri kupona oznaena brojevima 1, 2 i 3. U tom smo primjeru promatrali izvlaenje
dvaju od triju kupona na sljedea dva naina:
prvi izvueni kupon vraa se u kutiju prije izvlaenja drugog kupona; S X smo oznaili sluajnu
varijablu koja se realizira brojem kojim je oznaen prvi izvueni kupon, a s Y sluajnu
varijablu koja se realizira brojem kojim je oznaen drugi izvueni kupon,
prvi izvueni kupon ne vraa se u kutiju prije izvlaenja drugog kupona; S U smo oznaili sluajnu
varijablu koja se realizira brojem kojim je oznaen prvi izvueni kupon, a s V sluajnu
varijablu koja se realizira brojem kojim je oznaen drugi izvueni kupon.
Sjetimo se da su sluajne varijable X i Y nezavisne, dok sluajne varijable U i V nisu nezavisne.
Distribucije sluajnih vektora (X, Y ) i (U, V ) dane su tablicama u primjeru 3.16. X, Y , U i V
sve su jednako distribuirane s matematikim oekivanjem
1
1
1
1
+ 2 + 3 = 2.
3
3
3
2 X
2
X
ijP {X = i, Y = j} =
i=1 j=1
=
=
1
1
1
1
1
1
2 +3 +2 +6 +3 +6 =
6
6
6
6
6
6
11
.
3
Sada slijedi da je
Cov (U, V ) = E(U V ) EU EV =
1
11
4= .
3
3
n
n X
X
x=0 y=0
xyP {X = x, Y = y} =
n nx
X
X
x=0 y=0
Sada slijedi da je
Cov (X, Y ) = E(XY ) EX EY = n(n 1)pq n2 pq = npq.
Vanost tog momenta za opisivanje sluajnog vektora proizlazi iz injenice da se kovarijanca, kao numerika karakteristika sluajnog vektora, moe povezati s pojmom
nezavisnosti sluajnih varijabli. Naime, vrijedi sljedei teorem.
156
Sluajni vektor
0
1/3
0
1/3
2/3
1
0
1/3
0
1/3
pX
1/3
1/3
1/3
1
p(1, 1) 6=
Definicija 3.6. Neka je (X, Y ) sluajni vektor za koji je Cov (X, Y ) = 0. Tada
kaemo da su njegove komponente X i Y nekorelirane.
Iz definicije kovarijance vidimo da vanu ulogu u njezinom iznosu ima odstupanje
pojedine komponente sluajnog vektora od njezinog oekivanja (devijacija). Meutim, devijaciju smo sluajne varijable ve opisali varijancom, odnosno standardnom
devijacijom sluajne varijable. Da bismo smanjili utjecaj devijacije na numeriku
karakteristiku kojom elimo dobiti nove informacije o sluajnom vektoru, od velikog je interesa prouavanje kovarijance standardiziranog oblika sluajnog vektora
157
2
(X, Y ). Naime, ukoliko X i Y imaju varijance X
6= 0 i Y2 =
6 0, moemo ih standardizirati (vidi poglavlje 2.7). Ako oznaimo X = EX, Y = EY , postupak
standardizacije daje vektor
X X Y Y
(Xs , Ys ) =
,
X
Y
ija je kovarijanca
Cov (Xs , Ys ) =
Cov (X, Y )
.
X Y
E(XY ) =
Sada slijedi da je
Cov(X, Y ) = E(XY ) EX EY = 1 2 + 1 2 1 2 = 1 2 .
Prema tome, koeficijent korelacije komponenti X i Y dvodimenzionalnoga normalnog sluajnog
vektora jest
Cov(X, Y )
1 2
=
= .
1 2
Var XVar Y
Dakle, parametar u distribuciji normalnoga sluajnog vektora (X, Y ) jest zapravo koeficijent
korelacije njegovih komponenti. Sjetimo se da smo u primjeru 3.23 pokazali da su za = 0
komponente normalnoga sluajnog vektora nezavisne. To znai da u tom sluaju nekoreliranost
sluajnih varijabli X i Y povlai njihovu nezavisnost, tj. u sluaju kad je = 0 komponente dvodimenzionalnoga normalnog sluajnog vektora nezavisne su onda i samo onda ako su nekorelirane.
158
Sluajni vektor
1
1
E X 2 + E Y 2 = (1 + 1) = 1.
2
2
S obzirom da je, za taj sluajni vektor, kovarijanca ujedno i koeficijent korelacije,
vrijedi prva nejednakost teorema. Uoimo takoer da su za takve sluajne varijable
prva i druga nejednakost u iskazu teorema ekvivalentne.
|E(XY )| E|XY |
Pretpostavimo da je (X, Y ) bilo koji sluajni vektor kao u iskazu teorema. Tada
moemo provesti postupak standardizacije, a standardizirani oblik (Xs , Ys ) zadovoljava uvjete prvog dijela dokaza. Dakle, postoji kovarijanca od (Xs , Ys ) i vrijedi
2
(E(Xs Ys )) E Xs2 E Ys2 = 1. Osim toga vrijedi da je X = X Xs + X ,
Y = Y Ys + Y , gdje su X , X , Y , Y uobiajene oznake za standardne devijacije, odnosno oekivanja odgovarajuih sluajnih varijabli.
S obzirom da je
E|XY | = E|(X Xs + X )(Y Ys + Y )|
X Y E|Xs Ys | + X |Y |E|Xs | + Y |X |E|Ys | + |X Y |
2 2
(E(XY )) = X
Y (E(Xs Ys )) + 2X y X Y E(Xs Ys ) + 2X 2Y
2 2
X
Y + 2X y |X Y | + 2X 2Y
2
(X
+ 2X )(Y2 + 2Y )
= E X2 E Y 2 .
159
2
Cov (X, Y )
aX
a
.
=
=
Y X
X |a|X
|a|
1
1
X
Y
X
Y
2
2
1
1
E(
X
Y ) = 1 2X,Y + 1 = 0.
X
Y
1
1
X
Y,
X
Y
160
Sluajni vektor
Y =
Y
X Y c.
X
1
1
X+
Y.
X
Y
Slino kao kod vektora realnih brojeva, esto je korisno i sluajni vektor zapisivati
u matrinom obliku, tj. sluajni vektor (X, Y ) zapisujemo kao [X, Y ] . Tu oznaku
koristit emo u nastavku za definiranje oekivanja sluajnog vektora.
Ako za sluajni vektor Z = [X, Y ] postoje EX i EY , zapisivat emo ih u vektor
skom obliku kao [EX, EY ] i zvati oekivanje sluajnog vektora Z = [X, Y ] .
Varijance i kovarijancu takoer zapisujemo matrino. Naime, oznaimo li EZ =
[EX, EY ] , onda je
"
#
E(X EX)2
E(X EX)(Y EZ)
#
Var X Cov (X, Y )
.
Cov (X, Y ) Var Y
Takvu matricu Cov (X, Y ) = E(Z EZ)(Z EZ) zovemo matrica kovarijanci
sluajnog vektora (X, Y ).
Uoimo:
- matrica kovarijanci jest simetrina,
- matrica kovarijanci jest pozitivno semidefinitna.6
Neka je Zs standardizirana varijanta sluajnog vektora Z, tj.
X X Y Y
,
.
Zs =
X
Y
Njegovu matricu kovarijanci zovemo korelacijska matrica sluajnog vektora Z =
[X, Y ] i oznaavamo Corr (X, Y ). Oigledno vrijedi
"
#
1 X,Y
Corr (X, Y ) =
.
X,Y 1
6 Dokaite
ove tvrdnje.
161
Primjer 3.29. Neka su X N (1 , 12 ) i Y N (2 , 22 ) nezavisne normalne sluajne varijable. Njih moemo shvatiti kao komponente dvodimenzionalnoga normalnog sluajnog vektora s
oekivanjem [1 , 2 ] , matricom kovarijanci
#
"
12 0
Cov(X, Y ) =
0 22
i korelacijskom matricom
"
Corr(X, Y ) =
1 0
0 1
#
.
3.4
ekvivalentna jednakosti
F (x, y) = FX (x)FY (y),
za sve (x, y) R2 ,
(3.19)
gdje je F funkcija distribucije diskretnoga sluajnog vektora (X, Y ), FX marginalna funkcija distribucije komponente X, a FY marginalna funkcija distribucije
komponente Y .
Budui da su vjerojatnosna svojstva sluajne varijable openito definirana funkcijom distribucije, nezavisnost emo sluajnih varijabli openito opisati upravo koritenjem jednakosti (3.19).
Neka su X i Y sluajne varijable s funkcijama distribucije FX i FY , redom, te
neka je F funkcija distribucije sluajnog vektora (X, Y ). Rei emo da su X i Y
nezavisne sluajne varijable ako vrijedi
F (x, y) = FX (x) FY (y)
za sve (x, y) R2 .
(3.20)
Takav je opis nezavisnih sluajnih varijabli lako poopiti i na n-dimenzionalan sluajni vektor.
162
Sluajni vektor
(x1 , . . . , xn ) Rn .
(3.21)
Dokaz. Promotrimo prvo Var
k=1
n
P
ak Xk :
k=1
Var
n
X
!
ak Xk
=E
k=1
=E
n
X
n
X
ak Xk E
k=1
!2
(ak Xk ak EXk )
=E
k=1
n
X
!!2
ak Xk
k=1
n
X
k,j=1
n
X
k=1
n
X
!
2
(ak Xk ak EXk )
k=1
n
X
a2k Var Xk .
k=1
163
Sluajni vektor
2 ) nezavisne
Primjer 3.30. Neka su X1 N (1 , 12 ), X2 N (2 , 22 ), . . . , Xn N (n , n
normalne sluajne varijable. Njih moemo shvatiti kao komponente n-dimenzionalnoga normalnog
sluajnog vektora s oekivanjem [1 , . . . , n ] , matricom kovarijanci
12
0
Cov(X1 , . . . , Xn ) =
..
.
0
0
22
..
.
0
0
0
..
.
0
0
0
..
.
2
. . . n
...
...
..
.
n
X
Xk = X1 + . . . + Xn
k=1
k=1
k=1
Varijancu sluajne varijable Sn , zbog nezavisnosti sluajnih varijabli X1 , . . . , Xn , raunamo pomou teorema 3.8. Dakle,
!
n
n
n
X
X
X
Var
Xk =
Var Xk =
k2 .
k=1
k=1
k=1
3.5
U poglavlju 1.3 o statistikom pristupu modeliranju vjerojatnosti naveli smo svojstvo statistike stabilnosti relativnih frekvencija koje kae da se, kod nezavisnog
ponavljanja istog pokusa puno puta, relativna frekvencija pojavljivanja odabranog
dogaaja stabilizira u okolini nekog broja.
U poglavlju u kojemu je definirana normalna sluajna varijabla opisan je pokus
nazvan "Galtonova daska" koji ilustrira injenicu da normalna distribucija dobro
modelira realizacije pokusa iji su ishodi posljedica sume mnogo meusobno nezavisnih i jednako distribuiranih utjecaja.
U ovom poglavlju navodimo dva rezultata koji se odnose na granino ponaanje
nizova sluajnih varijabli i dokazuju istinitost navedenih svojstava.
164
3.5.1
n
X
Xk .
k=1
1
|Sn ESn | = 0.
n
Dokaz. U dokazu koristimo ebievljevu nejednakost, tj. za svaku je sluajnu varijablu Y koja ima varijancu i za svaki > 0
P {|Y EY | }
Var Y
.
2
Sn
. Zbog nezavisnosti je
n
1
Var Yn = 2 Var Sn
n
165
Sluajni vektor
pa vrijedi:
P
1
|Sn ESn | = P {|Yn EYn | }
n
M
Var Sn
2.
n2
n
Dakle, slijedi da je
1
M
|Sn ESn | 2 .
n
n
0P
Stoga je
lim P
1
|Sn ESn | = 0.
n
Primjer 3.31. Neka je (Xn , n N) niz nezavisnih sluajnih varijabli ije su distribucije zadane
tablicama
2n
0
2n
Xn = 1
1
1 , n N.
1 2n 2n+1
22n+1
2
2
Da bismo provjerili zadovoljava li taj niz slabi zakon velikih brojeva, izraunajmo oekivanja i
n
P
varijance sluajnih varijabli Xn i Sn =
Xi :
i=1
1
1
+ 2n 2n+1 = 0, n N,
22n+1
2
1
1
= EXn2 = 22n 2n+1 + 22n 2n+1 = 1, n N,
2
2
!
n
n
X
X
EXi = 0, n N,
= E
Xi =
EXn = 2n
Var Xn
ESn
Var Sn = Var
i=1
n
X
i=1
!
Xi
i=1
n
X
i=1
VarXi =
n
X
1 = n.
i=1
Budui da je (Xn , n N) niz nezavisnih sluajnih varijabli ije su varijance jednake jedan, slijedi
da niz (Xn , n N) zadovoljava slabi zakon velikih brojeva 3.9, tj. da je za svaki > 0
1
lim P
|Sn | = 0.
n
n
Rijeima reeno, za svaki se > 0 vjerojatnost odstupanja prosjeka niza nezavisnih sluajnih
varijabli iz primjera 3.31 od nule za ili vie moe uiniti proizvoljno malom odabirom dovoljno
velikog prirodnog broja n.
Slabi zakon velikih brojeva specijalno vrijedi i za niz nezavisnih i jednako distribuiranih sluajnih varijabli koje imaju varijancu, a koji je opisan sljedeom definicijom.
Definicija 3.8. Kaemo da je niz sluanih varijabli (Xn , n N) niz nezavisnih i
jednako distribuiranih sluajnih varijabli ako vrijedi:
166
Xn =
1X
Xi ,
n i=1
i X n , n N pripadni niz aritmetikih sredina. Koristei svojstva oekivanja i
varijance vidimo da vrijedi:
!
n
n
1X
1X
EX n = E
Xi =
EXi = ,
n i=1
n i=1
Var X n =
n
1 X
2
Var
X
=
.
i
n2 i=1
n
Osim toga,
1
Sn
n
pa se na taj niz aritmetikih sredina moe primijeniti slabi zakon velikih brojeva,
tj. za svaki je > 0
lim P {|X n | } = 0.
Xn =
n N.
Sada znamo da je za svaki prirodan broj n EXn = 0 i Var Xn = 1, pa stoga taj niz sluajnih
varijabli zadovoljava slabi zakon velikih brojeva, tj. za svaki je > 0
lim P X n = 0.
n
Rijeima reeno, za svaki se > 0 vjerojatnost da aritmetika sredina niza nezavisnih standardnih
normalnih sluajnih varijabli odstupa od nule za barem moe uiniti proizvoljno malom odabirom
dovoljno velikog prirodnog broja n.
167
Sluajni vektor
Budui da je za jednako distribuirane sluajne varijable X1 , . . . , Xn Var X n = 2 /n, iz ebievljeve nejednakosti slijedi da je
2
P {|X n | } 2 .
n
Uzmimo npr. = 0.01. Ako elimo postii vjerojatnost manju od 0.05 da se aritmetika sredina
niza (Xn , n N) razlikuje od oekivanja = 0.01 ili vie, tada n ocjenjujemo na sljedei nain:
n
2
= 200000.
2 P X n
168
U statistikoj definiciji vjerojatnosti koristili smo upravo takav model, tj. isti pokus
(, F, P ) ponavljali smo n puta nezavisno i definirali vjerojatnost dogaaja A F
kao broj oko kojega se gomilaju relativne frekvencije dogaaja A s poveavanjem
broja ponavljanja pokusa, tj.
fA
,
n
P (A)
0 1
1p p
!
,
0 p 1,
n
X
Xi ,
i=1
n
Xn =
fA
1X
Xi =
,
n i=1
n
pa je
fA
lim P
p = 0
n
n
za sve > 0, to opravdava statistiki pristup modeliranju vjerojatnosti pod navedenim uvjetima.
Primjer 3.34. Isti model moe se primijeniti i kod nezavisnog bacanja jedne pravilno izraene
igrae kockice n puta zaredom. Oznaimo sa 1 realizaciju dogaaja "okrenula se estica", a s 0
realizaciju dogaaja "nije se okrenula estica". Ishod svakog od n bacanja te kockice modeliramo
Bernoullijevom sluajnom varijablom
!
0 1
X=
,
5/6 1/6
iju distribuciju moemo, osim gornjom tablicom, zapisati i na sljedei nain:
R(X) = {0, 1},
169
Sluajni vektor
x 1x
5
1
51x
, x R(X).
=
6
6
6
Dakle, X je Bernoullijeva sluajna varijabla s parametrom p = 1/6.
Ishode n nezavisnih bacanja te kockice, pri emu nas zanimaju dogaaji "okrenula se estica" (1)
i "nije se okrenula estica" (0), modelirat emo nezavisnim sluajnim varijablama X1 , . . . , Xn
koje su jednako distribuirane kao sluajna varijabla X, tj. n-dimenzionalnim sluajnim vektorom
(X1 , . . . , Xn ). Zbog nezavisnosti i jednake distribuiranosti sluajnih varijabli X1 , . . . , Xn , slijedi
da je distribucija sluajnog vektora (X1 , . . . , Xn ) dana izrazom
P {X = x} =
P {X1 = x1 , . . . , Xn = xn } =
n
Y
51xi
,
6
i=1
xi R(Xi ),
i {1, . . . , n}.
Tako je, primjerice, vjerojatnost da se u n nezavisnih bacanja jedne pravilno izraene igrae
kockice svaki put (tj. svih n puta) okrene estica
P {X1 = 1, . . . , Xn = 1} =
3.5.2
1
.
6n
Centralni granini teoremi govore o uvjetima pod kojima niz funkcija distribucije standardiziranih suma sluajnih varijabli konvergira prema funkciji distribucije
standardne normalne sluajne varijable.
Definicija 3.9. Neka je (Xn , n N) niz sluajnih varijabli s pripadnim nizom
funkcija distribucije (Fn , n N). Ako postoji funkcija distribucije F takva da
Fn (x) F (x) za svaki x u kojemu je F neprekidna, tada kaemo da niz (Xn , n N)
konvergira po distribuciji prema sluajnoj varijabli X ija je funkcija distribucije F
i piemo:
D
Xn X.
Konvergencija po distribuciji zapravo znai da, za dovoljno velike n, P {Xn x}
moemo aproksimirati s F (x).
Primjer 3.35. Neka je (Xn , n N) niz nezavisnih sluajnih varijabli uniformno distribuiranih
na intervalu h0, ai, a > 0, tj. za svaki i N jest
0 , x h, 0i
FXi (x) = x/a , x [0, ai
.
1 , x [a, i
Ako je Yn = max {X1 , . . . , Xn }, tada je zbog nezavisnosti i jednake distribuiranosti sluajnih
varijabli iz niza (Xn , n N) niz (Yn , n N) niz sluajnih varijabli s funkcijama distribucije
FYn (y) = P {Yn y} = P {max {X1 , . . . , Xn } y} = P {X1 y, . . . , Xn y} =
n
= P {X1 y} . . . P {Xn y} = FX1 (y) .
Definirajmo sada novi niz sluajnih varijabli (Zn , n N), gdje je
Zn = n(a Yn ),
a > 0.
170
0
, z h, 0i
z n
= 1 1 an
, z [0, ani .
1
, z [an, i
Budui da je
z
z n
lim 1 1
= 1 e a , z 0,
n
an
slijedi da je
(
0
, z h, 0i
lim FZn (z) =
.
z
n
1 e a , z [0, i
Dakle, niz sluajnih varijabli (Zn , n N) po distribuciji konvergira prema eksponencijalnoj sluajnoj varijabli s parametrom 1/a.
Primjer 3.36. Neka je (Xn , n N) niz sluajnih varijabli s funkcijama distribucija
0 , x h, 0i
FXn (x) = xn , x [0, 1i
.
1 , x [1, i
Budui da je za x [0, 1i
lim xn = 0,
slijedi da je
(
lim FXn (x) =
0 , x h, 1i
,
1 , x [1, i
tj. niz sluajnih varijabli (Xn , n N) konvergira po distribuciji prema degeneriranoj sluajnoj
varijabli X za koju je P {X = 1} = 1. Kaemo da niz sluajnih varijabli (Xn , n N) konvergira
po distribuciji prema jedinici.
Sljedei teorem govori o konvergenciji po distribuciji niza standardiziranih parcijalnih suma niza nezavisnih jednako distribuiranih sluajnih varijabli prema standardnoj normalnoj sluajnoj varijabli.
Teorem 3.10 (Lvy). Neka je (Xn , n N) n. j. d. niz sluajnih varijabli s
oekivanjem i varijancom 2 i neka je Sn njegova n-ta parcijalna suma. Tada8
Sn ESn D
Z N (0, 1).
Var Sn
Primjer 3.37. Iznimno, ako je n. j. d. niz (Xn , n N) niz Bernoullijevih sluajnih varijabli
!
0 1
X1 =
, p h0, 1i,
1p p
(vidi Bernoullijenu shemu), tada je Sn B(n, p), ESn = np, Var Sn = np(1 p), pa moemo
zakljuiti da
Sn ESn
Sn np
D
Z N (0, 1).
= p
Var Sn
np(1 p)
8 Za
171
Sluajni vektor
Dakle, za velike se n vjerojatnosti po binomnoj distribuciji mogu priblino raunati koristei normalnu distribuciju.
Primjer 3.38. Neka je X B(500, 0.4). Tada znamo da je
P {X 175} =
175
X
500 i 500i
0.4 0.6
.
i
i=0
=P
2.28 P {Z 2.28},
10.95
10.95
10.95
gdje je Z standardna normalna sluajna varijabla. Prethodnu vjerojatnost moemo izraunati
koritenjem prikladnog matematikog softvera:
P {X 175} 0.0113.
Analognim postupkom moemo aproksimirati i mnoge druge vjerojatnosti - tako je, npr. P {175 <
X 225} 0.98.
1
2
Sn , EX n = , Var X n =
,
n
n
oito je
Xn
Sn ESn
= n
.
Var Sn
Dakle, prema centralnom graninom teoremu 3.5.2 slijedi da
Xn D
n
Z N (0, 1),
172
Sluajni vektor
ima priblino standardnu normalnu distribuciju (Z N (0, 1)). Sada moemo aproksimirati npr.
sljedee vjerojatnosti:
P {S100 110} = P
Z
z2
S100 100
1
1 P {Z 1} =
e 2 dz 0.1587,
10
2
1
P {1.1 < X 100 < 1.2} = P 1 < 10(X 100 1) < 2
1
P {1 < Z < 2} =
2
Z2
z2
2
dz 0.136.
Primjer 3.40. Neka je (Xn , n N) niz nezavisnih jednako distribuiranih sluajnih varijabli
s oekivanjem = EXn = 20 i varijancom 2 = VarXn = 4. Pretpostavimo da nas zanima
kolika je vjerojatnost da se aritmetika sredina X n sluajnih varijabli X1 , . . . Xn realizira brojem
iz intervala h19.9, 20.1i. Budui da distribucija sluajnih varijabli iz tog niza nije zadana, traenu
vjerojatnost ne moemo tono izraunati. No taj niz zadovoljava uvjete teorema 3.5.2 pa znamo
da
Xn
X n 20 D
n
=
Z N (0, 1).
2
n
Traenu vjerojatnost moemo aproksimirati na sljedei nain:
(
)
n
X n 20
n
P {19.9 < X n < 20.1} = P
<
<
2
20
20
n
1
n
n
P
<Z<
=
20
20
2
3.6
Zn/20
ez
/2
dz.
n/20
Zadaci
Zadatak 3.5. Dokaite da za sluajne varijable X1 i X2 koje imaju konnu varijancu i koje su
nezavisne vrijedi jednakost
Var (aX1 + bX2 c) = a2 Var X1 + b2 Var X2 ,
gdje su a, b i c proizvoljni realni brojevi.
Zadatak 3.6. Neka je (X, Y ) sluajni vektor s kovarijancom Cov(X, Y ). Dokaite da za proizvoljne realne brojeve a1 , a2 , b1 , b2 vrijedi
Cov(a1 X + b1 , a2 Y + b2 ) = a1 a2 Cov(X, Y ).
173
Zadaci
Zadatak 3.10. Dvodimenzionalan sluajni vektor (X, Y ) ima distribuciju danu tablicom
X/Y
1
2
3
-2
1/3
2/15
1/30
-1
0
2/15
1/30
0
1/15
0
1/15
1
0
1/30
1/15
2
1/10
0
0
hspace*1cm X =
Y =
!
,
Zadatak 3.11. Neka je X = (X, Y ) diskretan sluajni vektor s distribucijom zadanom na sljedei
nain:
(
c(x + y) , (x, y) {0, 1, 2} {0, 1, 2}
P (X = x, Y = y) =
.
0
,
inae
Izraunajte vrijednost konstante c.
Rjeenje: c = 1/18.
174
Sluajni vektor
Zadatak 3.13. Provjerite jesu li komponente sluajnog vektora iz zadatka 3.10 nezavisne te
izraunajte njihovu kovarijancu i koeficijent korelacije.
Rjeenje: sluajne varijable X i Y nisu nezavisne,
Cov(X, Y ) =
208
,
75
X,Y =
416
26291
-2
0.05
0.1
0.03
-1
0.05
0.05
0.12
0
0.1
0.05
0.07
1
0
0.1
0.06
2
0.05
0
0.03
3
0.05
0.05
0.04
Zadatak 3.15. Sluajni pokus sastoji se od dvaju uzastopnih bacanja pravilno izraenog novia.
Neka je (X, Y ) sluajni vektor gdje sluajna varijabla X oznaava broj glava, a sluajna varijabla
Y broj pisama koja se realiziraju u tim dvama bacanjima. Odredite distribuciju i marginalne
distribucije sluajnog vektora (X, Y ), uvjetnu distribuciju sluajne varijable X, uz uvjet {Y = 1}.
te izraunajte koeficijent korelacije X,Y .
Rjeenje:
Tablica distribucije:
X/Y
0
1
2
0
0
0
1
0
1
4
1
2
0
0
1
4
175
Zadaci
Marginalne distribucije:
0 1 2
X=
1 1 1
4 2 4
0 1 2
Y =
1 1 1
4 2 4
1
32
1
16
1
8
1
16
1
128
1
32
1
16
1
8
1
64
0
0
0
3
0
4
0
1
32
1
8
1
32
1
32
1
8
1
32
5
0
0
1
16
1
32
6
0
0
0
1
128
1 2 3 4
1 1 1 1
8 4 2 8
!
.
Zadatak 3.17. Promotrimo sluajni pokus koji se sastoji od nezavisnog bacanja dvaju novia tri
puta zaredom (misli se da su realizacije na noviima pri jednom bacanju meusobno nezavisne).
Novi A pravilno je izraen, odnosno PA (G) = PA (P ) = 0.5, ali noi B nije i vrijedi: PB (G) =
0.25, PB (P ) = 0.75. Neka je (X, Y ) sluajni vektor u kojem X predstavlja broj glava realiziranih
bacanjem novia A, a Y broj glava realiziranih bacanjem novia B. Odredite distribuciju i
marginalne distribucije sluajnog vektora (X, Y ), uvjetnu distribuciju sluajne varijable X, uz
uvjet {Y = 2}, te izraunajte koeficijent korelacije X,Y .
Rjeenje: X B(3, 0.5), X B(3, 0.25)
X/Y
0
1
2
3
27
512
81
512
81
512
27
512
27
512
81
512
81
512
27
512
9
512
27
512
27
512
9
512
1
512
3
512
3
512
1
512
176
Sluajni vektor
Zadatak 3.19. Za sluajni vektor iz prethodnog zadatka odredite sljedee uvjetne vjerojatnosti:
a)
P {Y = yj | X = xi },
P {X = xi | Y = yj },
b)
P {Y = y2 | X = x2 },
P {X = 2 | Y = 2}.
1
,
2
1
,
2
0Y
0Y
1
}.
2
1
}
=
2
1/16.
1
4 x2 , x h2, 2i
2
fX (x) =
fY (y) =
0
, inae,
4 y 2 , y [0, 2i
0
, inae,
Zadatak 3.22. Funkcija gustoe dvodimenzionalnoga sluajnog vektora (X, Y ) dana je izrazom
1 , x2 + y 2 1
2
b2
f (x, y) =
ab a
0 ,
inae,
a) Odredite marginalne gustoe fX (x) i fY (y).
b) Jesu li komponente tog sluajnog vektora nezavisne sluajne varijable?
c) Odredite kovarijancu sluajnih varijabli X i Y .
Zadaci
177
0 , z h, 0i
z , z h0, 1i
.
FZ (z) = z 2 /2 , z [0, 1i
fZ (z) =
0 , inae.
1 , z [1, i.
Zadatak 3.24. Neka je X sluajna varijabla kojom je modelirana koncentracija peludi u zraku
u jutarnjem mjerenju, a Y sluajna varijabla kojom je modelirana koncentracija peludi u zraku
u veernjem mjerenju. Pretpostavimo da je zajednika funkcija gustoe sluajnih varijabli X i Y
(tj. funkcija gustoe sluajnog vektora X = (X, Y )) definirana na sljedei nain:
(
4xy , (x, y) h0, 1i h0, 1i
fX (x, y) =
0 ,
inae.
a) Odredite funkciju distribucije sluajnog vektora X.
Rjeenje:
FX (x, y) =
y 2 , (x, y) [1, i h0, 1i
0 ,
inae.
b) Odredite marginalne funkcije
( gustoa sluajnog vektora X.
2x , x h0, 1i
D
Rjeenje: X = Y , fX (x) =
0 , inae.
c) Odredite vjerojatnost da je prosjena koncentracija peludi u zraku (temeljena samo na
jutarnjem i veernjem mjerenju) manja od 0.5.
Rjeenje: P {(X + Y )/2 < 0.5} = 1/6.
Zadatak 3.25. Posjed na potpuno ravnom terenu ima oblik pravokutnog trokuta s junom granicom duljine dva kilometra i istonom granicom duljine jedan kilometar. Koordinate toke na
koju pada sjemenka javora noena vjetrom modelirane su sluajnim vektorom X = (X, Y ). Poznato je da ako sjemenka padne unutar posjeda, sluajni vektor X ima uniformnu distribuciju nad
posjedom.
a) Odredite funkciju gustoe sluajnog vektora X te njegove marginalne funkcije gustoa. Jesu
li sluajne varijable X i Y nezavisne ili ne? Obrazloite svoj odgovor.
Rjeenje:
(
1 , (x, y) {(x, y) h0, 2i h0, 1i : y < 0.5x}
fX (x, y) =
0 ,
inae.
(
(
x/2 , x h0, 2i
2(1 y) , x h0, 1i
fX (x) =
fY (y) =
0 , inae,
0
, inae.
Sluajne varijable X i Y nisu nezavisne.
178
Sluajni vektor
b) Odredite uvjetne funkcije gustoa fX|Y =y (x) i fY |X=x (y) sluajnog vektora (X, Y ).
Rjeenje:
(
(
2/x , y h0, x/2i
1/2(1 y) , x h2y, 2i
fY |X=x (y) =
fX|Y =y (x) =
0 ,
inae.
0
,
inae,
c) Odredite vjerojatnost P {0.1 < Y 0.7|X = 0.5}.
Rjeenje: P {0.1 < Y 0.7|X = 0.5} = 0.6.
1
, (x, y) h/2, i h0, i
sin
(x)
,
(x, y) [0, /2] h0, i
0
,
inae.
b) Odredite marginalne funkcije distribucija sluajnog vektora X.
Rjeenje:
(
(
cos (x) , x [0, /2]
sin (y) , x [/2, 0]
fX (x) =
fY (y) =
0
,
inae,
0
,
inae.
c) Ispitajte nezavisnost sluajnih varijabli X i Y te odredite korelacijsku matricu sluajnog
vektora X.
Rjeenje: X i Y nezavisne su sluajne varijable; korelacijska matrica jest jedinina matrica
drugog reda.
d) Odredite uvjetne funkcije gustoa i uvjetne funkcije distribucija sluajnog vektora X.
Rjeenje: fX|Y =y (x) = fX (x), fY |X=x (y) = fY (y).
179
Zadaci
d) izraunajte P {0 < X 1, 0 < Y 1}.
Rjeenje: P {0 < X 1, 0 < Y 1} = 1
2
e
1
.
e2
fX (x, y) =
Zadatak 3.30. Provjerite vrijedi li slabi zakon velikih brojeva za sljedee nizove nezavisnih sluajnih varijabli (Xn , n N):
n
0
n
a) Xn = 1
2 1 , n N,
1
n
n n
n
n
3
3
b) Xn =
1
1 , n N.
2
2
Rjeenje: slabi zakon velikih brojeva vrijedi za oba niza sluajnih varijabli.
1
100
Y.
180
Sluajni vektor
Rjeenje:
a) P {Y 110} 0.1587,
b) P {1.1 < X 100 < 1.2} 0.136.
Zadatak 3.32. Zadane su nezavisne jednako distribuirane sluajne varijable X1 , . . . , Xn s matematikim oekivanjem i varijancom 2 . Izraunajte
!
n
1X
2
E
(Xi X n )
.
n i=1
Poglavlje 4
Statistika
Koritenje je rijei statistika u svakodnevnom ivotu najee povezano s brojanim vrijednostima kojima pokuavamo opisati bitne karakteristike nekog skupa
podataka.
Statistika, kao znanstvena disciplina, bavi se razvojem metoda prikupljanja, opisivanja i analiziranja podataka te primjenom tih metoda u procesu donoenja zakljuaka
na temelju prikupljenih podataka.
Statistiko istraivanje fokusirano je na skup objekata, tj. jedinki (ljudi, ivotinja,
biljaka, stvari, drava, gradova, poduzea itd.) i skup odabranih veliina koje se na
njima promatraju. Veliine koje se na jedinkama promatraju zovemo varijablama.
Sve jedinke koje se ele obuhvatiti istraivanjem, tj. o kojima se eli zakljuivati,
ine populaciju. Podaci se prikupljaju da bi se zakljuivalo o varijablama na
populaciji.
Prije provoenja istraivanja populacija mora biti precizno opisana. Na primjer, ako
je varijabla od interesa broj rijei koji je osoba u stanju proitati u minuti, onda
valja precizirati ine li populaciju djeca predkolskog uzrasta u Hrvatskoj ili djeca
prvog razreda osnovne kole u Hrvatskoj ili djeca prvog razreda neke specifine kole
u Hrvatskoj (npr. O.. Tin Ujevi u Osijeku) ili djeca prvog razreda osnovne kole
u Hrvatskoj koja idu po posebnom programu itd. U svakom sluaju, populacija
mora biti precizirana.
Iz definirane populacije uzima se u statistiko istraivanje uzorak. Podaci moraju
biti prikupljeni na uzorku koji je reprezentativan za opisanu populaciju. Reprezentativan uzorak mora odraavati populaciju tj. u njemu trebaju biti zastupljene
181
182
Deskriptivna statistika
4.1
Deskriptivna statistika
Statistika
183
Numerike varijable
Numerike varijable prirodno primaju vrijednosti iz skupa realnih brojeva. Tipini su primjeri numerikih varijabli masa i visina osobe. Meutim, treba naglasiti
da se i kategorije kvalitativnih varijabli mogu izraavati brojevima to ih ne ini
numerikim varijablama. Primjerice, spol osobe jedna je kvalitativna varijabla.
Kategoriju "enski spol" moemo oznaiti s "1", a kategoriju "muki spol" s "2",
to moe biti korisno prilikom unoenja podataka u bazu. Time smo kategorijama
kvalitativne varijable pridruili numerike vrijednosti, ali samu varijablu nismo uinili numerikom po njezinim svojstvima.
Primjer 4.2. Sljedee su varijable numerikog tipa:
- postotak prolaznosti na pojedinim ispitima tijekom jedne akademske godine,
- broj bodova na dravnoj maturi iz matematike,
- broj ulovljenih komaraca u klopku,
- temperatura mora,
- koncentracija soli u morskoj vodi.
184
Deskriptivna statistika
U svrhu prikaza podataka i nekih statistikih analiza, vrijednosti se numerike varijable takoer mogu svrstati u kategorije. Za razliku od kategorija kvalitativnih
varijabli, meu kategorijama se numerike varijable uvijek moe prepoznati prirodan poredak.
Primjer 4.6. (auto-centar.xls)
Svrha je ovog primjera prikazati mogunost kategorizacije numerike varijable. Taj se postupak
najee provodi stvaranjem nove varijable ije su vrijednosti kategorije kojih je (znatno) manje
nego svih moguih vrijednosti odgovarajue numerike varijable. Baza podataka auto-centar.xls
sastoji se od sljedeih varijabli:
automobili - diskretna numerika varijabla koja sadri podatke o broju prodanih automobila u
jednom danu za sto promatranih dana. Budui da broj prodanih automobila u jednom danu
moe biti vrlo mali (npr. samo nekoliko osobnih automobila), ali i vrlo velik (npr. narudbe
automobila za vozni park nekog poduzea), zakljuujemo da diskretna numerika varijabla
automobili moe poprimiti velik broj razliitih vrijednosti iz skupa prirodnih brojeva. Zato je
u nekim situacijama korisno kategorizirati vrijednosti te varijable prema tono odreenom
kriteriju. Na primjer, kategorizacija broja prodanih automobila u jednome danu moe se
napraviti kao to je prikazano varijablom kategorija.
kategorija - kvalitativna varijabla koja podatke iz varijable automobili svrstava u pet kategorija
prema kriteriju prikazanom u tablici 4.1.
185
Statistika
broj prodanih automobila
kategorija
0-9
10 i 11
12 i 13
14 i 15
16 i vie
E
D
C
B
A
Ordinalne varijable
Karakteristika je ordinalnih varijabli da su one, po svom karakteru, kvalitativne,
ali meu kategorijama se moe uspostaviti prirodan poredak. Tipian su primjeri
takvih varijabli struna sprema osobe i ocjena u koli.
Primjer 4.7. (matematika.sta)
Baza podataka matematika.sta sadri podatke prikupljene anketiranjem studenata nakon odranih
predavanja, vjebi, kolokvija te usmenog ispita iz jednog matematikog kolegija. Prikupljeni podaci
organizirani su na sljedei nain:
prosjek - varijabla koja sadri podatke o prosjenoj ocjeni studiranja za 49 anketiranih studenata,
polozeno - varijabla koja studente svrstava u dvije kategorije s obzirom na to jesu li poloili ispit
iz promatranog kolegija prema kriteriju prikazanom u tablici 4.2.
poloen/nepoloen ispit
poloen ispit
nepoloen ispit
kategorija
1
0
kategorija
1
2
3
186
4.1.1
Deskriptivna statistika
Vrijednosti kvalitativne varijable jesu kategorije. Mjere kojima opisujemo zastupljenost jedne kategorije u uzorku jesu frekvencija kategorije i relativna frekvencija
kategorije.
Frekvencija kategorije broj je izmjerenih vrijednosti varijable koje pripadaju danoj kategoriji.
Relativna frekvencija kategorije broj je izmjerenih vrijednosti varijable
koje pripadaju danoj kategoriji podijeljen ukupnim brojem izmjerenih
vrijednosti za ispitivanu varijablu.
Pretpostavimo da varijabla moe primiti vrijednosti k razliitih kategorija, a da se u
podacima nalazi n izmjerenih vrijednosti za tu varijablu. Frekvenciju i-te kategorije
oznait emo fi , a relatvnu frekvenciju dobijemo kao
fi
.
n
Relativna frekvencija kategorije mjera je zastupljenosti koja daje informaciju o
udjelu kategorije u uzorku poznate veliine i esto se izraava kao postotak. Frekvencije i relativne frekvencije pojedinih kategorija prikazujemo tablino i grafiki.
Frekvencije i relativne frekvencije kategorija kvalitativnih varijabli grafiki prikazujemo pomou stupastog dijagrama frekvencija i stupastog dijagrama
relativnih frekvencija. U istu svrhu moe se koristiti i kruni dijagram frekvencija i relativnih frekvencija . Popularan je naziv za isti grafiki prikaz "pita".
Primjer 4.8. (djelatnici.xls)
Baza podataka djelatnici.xls opisana je u primjeru 4.5. Promotrimo kvalitativnu varijablu obrazovanje ije su vrijednosti svrstane u tri kategorije: SSS - srednja struna sprema, VSS - via
struna sprema, VSS - visoka struna sprema. Zastupljenost tih kategorija u promatranom uzorku
od 100 djelatnika opisana je tablicom frekvencija i relativnih frekvencija 4.4.
kategorija
frekvencija
relativna frekvencija
SSS
VSS
VSS
51
43
6
51/100 = 0.51
43/100 = 0.43
6/100 = 0.06
Tablica 4.4: Tablica frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje.
Grafiki prikazi relativnih frekvencija dani su u obliku stupastog dijagrama na slici 4.1, a prikazi
frekvencija i relativnih frekvencija u obliku krunog dijagrama na slici 4.2.
187
Statistika
relativne frekvencije
60%
50%
40%
30%
20%
10%
0%
SSS
VSS
VSS
Slika 4.1: Stupasti dijagram relativnih frekvencija svih kategorija varijable obrazovanje.
VSS; 6; 6%
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Obrazovanje
Slika 4.2: Kruni dijagram frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje.
188
Deskriptivna statistika
kategorija
SSS
VSS
VSS
frekvencija
spol=Z
relativna frekvencija
frekvencija
spol=M
relativna frekvencija
21
18
2
21/41 = 0.5122
18/41 = 0.4390
2/41 = 0.0488
30
25
4
30/59 = 0.5085
25/59 = 0.4237
4/59 = 0.0678
Tablica 4.5: Tablica frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje
54%
49%
44%
39%
34%
29%
24%
20%
15%
10%
5%
0%
59%
51%
relativne frekvencije
relativne frekvencije
42%
34%
25%
17%
8%
SSS
VSS
VSS
0%
(a) spol=Z
SSS
VSS
VSS
(b) spol=M
Slika 4.3: Stupasti dijagrami relativnih frekvencija svih kategorija varijable obrazovanje posebno
za svaku kategoriju varijable spol.
VSS;4;7%
VSS;2;5%
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
SSS;21;51%
VSS;18;44%
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
SSS;30;51%
VSS;25;42%
obrazovanje
obrazovanje
(a) spol=Z
(b) spol=M
Slika 4.4: Kruni dijagram frekvencija i relativnih frekvencija svih kategorija varijable obrazovanje
posebno za svaku kategoriju varijable spol.
189
Statistika
4.1.2
rukovodstvo
frek.
rel. frek.
rukovodstvo
frek.
rel. frek.
0
1
2
3
4
5
6
7
20
15
13
10
12
10
1
3
0.20
0.15
0.13
0.10
0.12
0.10
0.01
0.03
8
9
10
11
12
13
14
17
3
3
2
2
1
1
2
2
0.03
0.03
0.02
0.02
0.01
0.01
0.02
0.02
Tablica 4.6: Tablica frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable
rukovodstvo.
190
relativne frekvencije
Deskriptivna statistika
22%
20%
18%
16%
14%
12%
10%
8%
6%
4%
2%
0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 17
rukovodstvo
Slika 4.5: Stupasti dijagram relativnih frekvencija svih zabiljeenih vrijednosti varijable rukovodstvo.
Ako numerika varijabla prima mnogo meusobno razliitih vrijednosti, za prikazivanje skupa izmjerenih vrijednosti obino nam nee puno pomoi frekvencije te
stupasti ili kruni dijagrami napravljeni na osnovu svake pojedine izmjerene vrijednosti. Takvi se sluajevi esto javljaju ako podaci dolaze iz kontinuiranih numerikih
varijabli. Problem emo ilustrirati sljedeim primjerom.
Primjer 4.11. (djelatnici.xls)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
Promotrimo varijablu placa_prije iz baze podataka djelatnici.xls koja sadri godinje plae prije
reorganizacije poslovanja poduzea za uzorak od 100 djelatnika. Ovdje moemo pretpostaviti da
se radi o kontinuiranoj numerikoj varijabli koja moe primiti vrijednosti iz intervala h0, x]. Kao
gornju granicu intervala, tj. x, moemo uzeti realan broja za koji pretpostavljamo da u danim
uvjetima predstavlja najveu moguu godinju plau u tom poduzeu.
Dio tablice frekvencija i relativnih frekvencija na temelju svih realiziranih vrijednosti prikazan je
tablicom 4.7. Od 100 realizacija zabiljeeno je ak 77 razliitih vrijednosti, a pojedine se vrijednosti pojavljuju s izrazito malim frekvencijama: 1, 2, 3 ili 4. Iz takvih je tablica teko oitavati
frekvencije koje nas zapravo zanimaju (npr. frekvencija ispitanika s godinjom plaom manjom od
20000). Zbog toga se u tablice uobiajeno dodaje i stupac kumulativnih frekvencija i kumulativnih
relativnih frekvencija, kako je prikazano tablicom 4.7.
Stupasti dijagram (slika 4.6) ili kruni dijagram frekvencija (relativnih frekvencija) na kojemu
su prikazane sve realizirane vrijednosti s odgovarajuom frekvencijom (relativnom frekvencijom),
u takvim sluajevima nije osobito informativan.
191
Statistika
iznos plae
frekvencija
kumulativna frek.
relativna frekvencija
16000
..
.
19800
20000
20200
..
.
42400
1
..
.
1
1
2
..
.
1
1
..
.
15
16
18
..
.
100
0.01
..
.
0.01
0.01
0.02
..
.
0.01
0.01
..
.
0.15
0.16
0.18
..
.
1
Tablica 4.7: Tablica frekvencija i relativnih frekvencija svih sto zabiljeenih vrijednosti varijable
placa_prije.
4%
3%
2%
1%
0%
16000
18900
19700
20400
21100
21600
22300
23300
23800
24800
25700
26500
29400
31600
33200
40400
relativne frekvencije
5%
placa_prije
Slika 4.6:
placa_prije.
U svrhu dobivanja preglednih i korisnih stupastih dijagrama za podatke iz kontinuiranih numerikih varijabli, izmjerene je vrijednosti potrebno kategorizirati. To
znai da velik skup podataka podijelimo u nekoliko disjunktnih intervala po kriteriju za koji smatramo da e nam dati eljene rezultate. Stupasti dijagram tada
smjetamo u koordinatni sustav tako da prikazujemo stupie nad tim intervalima
s povrinom koja odgovara relativnoj frekvenciji podataka sadranih u odgovarajuem intervalu. Duljina intervala informacija je koja je takoer prikazana stupastim
dijagramom jer odgovara irini stupia. Takav stupasti dijagram zovemo histogram.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
192
Deskriptivna statistika
ilustrira injenicu da najvie djelatnika u uzorku ima godinju plau od 20000 do 30000 novanih
jedinica, dok je plaa iz intervala 40000 do 50000 rijetkost. Intervale za kategorizaciju u takvim
i slinim sluajevima obino radimo tako da bi zadovoljili potrebe za prezentiranjem informacija
koje elimo istaknuti.
iznos plae
frekvencija
relativna frekvencija
0
15
69
14
2
0
0.15
0.69
0.14
0.02
[0, 10000i
[10000, 20000i
[20000, 30000i
[30000, 40000i
[40000, 50000i
50000
40000
30000
20000
10000
80%
70%
60%
50%
40%
30%
20%
10%
0%
relativne frekvencije
varijable placa_prije.
placa_prije
Za numerike varijable moemo definirati numerike karakteristike koje imaju loginu interpretaciju i mogu se iskoristiti s ciljem prikazivanja skupa podataka. Ovdje
emo definirati neke od najee koritenih numerikih karakteristika skupa podataka.
Aritmetika sredina podataka
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
193
Statistika
Primjer 4.13. Neka su izmjerene vrijednosti jedne varijable sljedee:
1.2, 2.1, 3.2, 4.3, 5.4, 6.5, 7.6, 8.7, 9.8.
S obzirom da ih ima ukupno 9, aritmetika sredina (eng. mean) tog skupa izmjerenih vrijednosti
jest
1.2 + 2.1 + 3.2 + 4.3 + 5.4 + 6.5 + 7.6 + 8.7 + 9.8
5.42.
9
Medijan podataka
Da bismo razumjeli i odredili medijan potrebno je prvo poredati izmjerene vrijednosti x1 , x2 , . . . , xn varijable X po veliini (u rastuem poretku, tj. od manjeg prema
veem). Medijan je takoer jedna mjera centralne tendencije numerikih podataka,
a ima znaenje izmjerene vrijednosti koja se nalazi na sredini niza podataka kada
je on ureen po veliini, tj. barem pola podataka manje je ili jednako medijanu,
a istovremeno je barem pola podataka vee ili jednako medijanu. Nain njegovog
izrauna ovisi o tome imamo li neparan ili paran broj izmjerenih vrijednosti varijable. Ukoliko imamo neparan broj izmjerenih vrijednosti, onda postoji vrijednost
koja je na srednjoj poziciji u ureenom skupu, pa nju definiramo kao medijan.
Primjer 4.14. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3.
Prvo te vrijednosti poredamo po veliini:
1, 1, 2, 2, 2, 2, 3, 5, 5, 6, 7.
S obzirom da ih ima ukupno 11, medijan je vrijednost koja je na estoj poziciji u tako dobivenom
nizu, tj. broj 2.
Ukoliko imamo paran broj izmjerenih vrijednosti varijable, onda ne postoji podatak koji je na srednjoj poziciji jer srednju poziciju "zauzimaju" dva podatka.
Medijan se tada definira kao polovite tih dvaju podataka (tj. aritmetika sredina
tih dvaju podataka).
Primjer 4.15. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
Prvo te vrijednosti poredamo po veliini:
1, 1, 2, 2, 2, 2, 3, 3, 5, 5, 6, 7.
S obzirom da ima 12 podataka, "sredinu" ine esti i sedmi podatak, tj. vrijednosti 2 i 3. Medijan
je tog skupa podataka sredina tih dvaju brojeva, tj. medijan je (2 + 3)/2 = 2.5.
194
Deskriptivna statistika
U mnogim je primjerima zanimljivo promatrati maksimalno odstupanje izmjerenih vrijednosti varijable od "prosjeka", tj. aritmetike sredine izmjerenih vrijednosti. Ta je numerika karakteristika definirana kao vei od brojeva
(xn xmin ) i (xmax xn ), tj. broj
max {(xn xmin ), (xmax xn )}.
195
Statistika
xmax = 7,
xn =
1+2+5+6+5+1+2+7+2+2+3+3
= 3.25.
12
s2n =
1X
(xi xn )2 ,
n i=1
9
1X
(xi 5.42)2 7.87,
9 i=1
a standardna devijacija
v
u
9
u1 X
sn = t
(xi 5.42)2 2.81.
9 i=1
Mod podataka
Mod je vrijednost iz niza izmjerenih vrijednosti varijable kojoj pripada najvea
frekvencija, tj. izmjerena je najvie puta. Mod ne mora biti jedinstven.
Primjer 4.20. Neka su izmjerene vrijednosti jedne varijable sljedee:
1, 2, 5, 6, 5, 1, 2, 7, 2, 2, 3, 3.
Vidimo da je vrijednost 2 izmjerena najvie puta (etiri puta), pa je 2 mod tog skupa podataka.
196
Deskriptivna statistika
Koritenjem numerikih karakteristika numerikih varijabli skup mjerenih vrijednosti moe se prikazati grafiki pomou kutijastog dijagrama (eng. box plot,
boxplot ili box-and-whisker plot).
Kutijastim dijagramom prikazujemo odnos pet numerikih karakteristika skupa izmjerenih vrijednosti: minimalnu vrijednost, donji kvartil, medijan, gornji kvartil i
maksimalnu vrijednost.
Primjer 4.22. (djelatnici.xls)
Numerike karakteristike skupa izmjerenih vrijednosti varijable placa_prije iz baze podataka djelatnici.xls prikazane su u tablici 4.9.
veliina uzorka
100
aritmetika sredina
24522
mod
24600
frek. moda
4
st. dev.
5105.801
varijanca
26069208.1
minimum
16000
donji kvartil
20950
medijan
23650
gornji kvartil
26250
maksimum
42400
raspon
26400
Odnos minimuma, donjeg kvartila, medijana, gornjeg kvartila i maksimuma izmjerenih vrijednosti
varijable placa_prije prikazan je kutijastim dijagramom 4.8.
36000
34000
32000
placa_prije
30000
28000
26000
24000
22000
20000
18000
16000
14000
Median = 23650
25%-75%
= (20950, 26250)
Non-Outlier Range
= (16000, 33600)
Slika 4.8: Kutijasti dijagram na bazi medijana za izmjerene vrijednosti varijable placa_prije.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
197
Statistika
Iz tablice 4.9 i kutijastog dijagrama 4.8 moemo izvesti sljedee i sline zakljuke:
- najnia godinja plaa u uzorku iznosi 16000, a najvia 42400,
- bar 25% ispitanika iz uzorka ima plau manju ili jednaku 20950,
- bar 25% ispitanika iz uzorka ima plau veu ili jednaku 26250,
- bar 50% ispitanika iz uzorka ima plau manju ili jednaku medijanu, tj. 23650,
- bar 50% ispitanika iz uzorka ima plau veu ili jednaku 23650.
aritmetika sredina
33.83
mod
28
frek. moda
12
st. dev.
31.05
varijanca
964.28
minimum
18
donji kvartil
26
medijan
29
gornji kvartil
36
maksimum
333
raspon
315
Osim iz tablice 4.10, streu vrijednost meu izmjerenim vrijednostima varijable dob mogli smo
detektirati i pomou kutijastog dijagrama na bazi medijana.
198
Deskriptivna statistika
350
300
dob
250
200
150
Median = 29
25%-75%
= (26, 36)
Non-Outlier Range
= (18, 49)
Outliers
Extremes
100
50
0
Slika 4.9: Kutijasti dijagram na bazi medijana s prikazom streih vrijednosti za izmjerene
vrijednosti varijable dob.
Kao to vidimo iz kutijastog dijagrama 4.9, i dob od 54 godine prepoznata je kao strei podatak.
Budui da je sasvim razumljivo da promatrano poduzee moe imati djelatnika starog 54 godine,
taj podatak smatramo tono izmjerenim i tono upisanim u bazu podataka, no radi se o dobi koja
se rijetko pojavljuje u populaciji djelatnika tog poduzea. Tako iz kategorizirane tablice frekvencija
i relativnih frekvencija (tablica 4.11) varijable dob vidimo da je takvih djelatnika samo 0.03%.
dob
frekvencija
relativna frekvencija
[18, 28i
37
0.37
[28,
38i
44
0.44
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
[38, 48i
15
0.15
[48, 58i
3
0.03
[58, 333]
1
0.01
4.1.3
Ordinalne se varijable najee zadaju tako da mogu primiti samo nekoliko meusobno razliitih vrijednosti i one su po svojoj prirodi kvalitativne, zbog ega su
metode opisivanja kvalitativnih varijabli primjenjive u potpunosti i na ordinalne varijable. S obzirom da se vrijednosti ordinalinih varijabli izraavaju brojano, esto se
u primjeni moe vidjeti da se za ordinalne varijable izraavaju, komentiraju i koriste
numerike karakteristike podataka. Ponekad to ima smisla, ali moramo upozoriti da
treba dobro razmisliti u svakom pojedinom sluaju je li i kako je mogue iskoristiti
199
Statistika
informaciju koju daje odabrana numerika karakteristika.
frekvencija
relativna frekvencija
1
2
3
4
5
7
7
15
20
16
7/65 0.11
7/65 0.11
3/13 0.23
4/13 0.31
16/65 0.25
Tablica 4.12: Tablica frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable
relativne frekvencije
ocjena.
34%
31%
28%
25%
22%
18%
15%
12%
9%
6%
3%
0%
1; 7; 11%
5; 16; 25%
2; 7; 11%
3; 15; 23%
4; 20; 31%
1
3
ocjena
ocjena
Slika 4.10: Grafiki prikazi frekvencija i relativnih frekvencija svih zabiljeenih vrijednosti varijable ocjena.
Numerike karakteristike podataka varijable ocjena prikazane su u tablici 4.13.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
200
Statistiki model
veliina uzorka
65
aritmetika sredina
3.48
mod
4
frek. moda
20
st. dev.
1.63
varijanca
1.28
minimum
1
donji kvartil
3
medijan
4
gornji kvartil
4
maksimum
5
raspon
4
Odnosi minimuma, donjeg kvartila, medijana, gornjeg kvartila i maksimuma izmjerenih vrijednosti varijable ocjena prikazani su kutijastim dijagramom 4.11.
5,5
5,0
4,5
ocjena
4,0
3,5
3,0
2,5
2,0
1,5
1,0
0,5
Median = 4
25%-75%
= (3, 4)
Min-Max
= (1, 5)
Slika 4.11: Kutijasti dijagram na bazi medijana za izmjerene vrijednosti varijable ocjena.
Aritmetiku sredinu, varijancu i standardnu devijaciju ne bismo komentirali jer ne znamo koliko
se stvarno znanje krije iza svake ocjene, ali na temelju ostalih numerikih karakteristika moemo
izvesti sljedee i sline zakljuke:
- na tom uzorku postignuta je i najnia i najvia mogua ocjena,
- bar 25% studenata iz uzorka ocijenjeno je ocjenom 3 ili manjom od 3, dok je bar 75%
studenata ocijenjeno ocjenom 3 ili veom,
- bar 50% studenata iz uzorka ocijenjeno je ocjenom 4 ili 5.
You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)
4.2
Statistiki model
Statistika
201
Da bi primjenjivali metode statistikog zakljuivanja, prva je pretpostavka postavljanje statistikog modela koji koristimo za modeliranje prikupljenih podataka.
Zadati statistiki model znai opisati poznate karakteristike sluajnog vektora za
kojega smatramo da nai podaci ine jednu realizaciju. S obzirom da je sluajni
vektor odreen svojom funkcijom distribucije, statistikim je modelom opisano ono
to je unaprijed poznato o funkciji distribucije sluajnog vektora kojim modeliramo
podatke, odnosno statistiki model jest familija funkcija distribucije koja
se uzima u obzir za zakljuivanje u danom problemu.
Najjednostavniji su modeli koji se koriste u statistici razni modeli jednostavnoga
sluajnog uzorka.
Definicija 4.1. Statistiki model zovemo model jednostavnoga sluajnog uzorka
iz funkcije distribucije F ako za sluajni vektor (X1 , . . . , Xn ), iju realizaciju ine
podaci (x1 , . . . , xn ), vrijedi:
sluajne varijable X1 , . . . , Xn nezavisne su,
sve sluajne varijable X1 , . . . , Xn imaju istu funkciju distribucije F .
Kod takvih modela promatranu veliinu smatramo sluajnom varijablom s funkcijom distribucije F , a vrijednosti varijable izmjerene na jedinkama iz uzorka nezavisne su realizacije te sluajne varijable.
Zbog jednostavnosti izraavanja u nastavku teksta emo koristiti termin sluajni
uzorak za sluajni vektor (X1 , . . . , Xn ) statistikog modela, a termin uzorak za
njegovu realizaciju (x1 , . . . , xn ), tj. podatke.
U nastavku emo opisati nekoliko karakteristinih statistikih modela koji se vrlo
esto koriste u praksi, kao i primjere za koje su ti modeli prikladni.
4.2.1
Problem proporcije
202
Statistiki model
Skup svih moguih ishoda sluajnog vektora opisanog u prethodnom primjeru jest
R(X1 , . . . , Xn ) = {(x1 , . . . , xn ) : xi {0, 1}}.
Distribucija je zadana s
p(x1 , . . . , xn ; ) = P {X1 = x1 , . . . , Xn = xn }
n
Y
xi (1 )1xi , (x1 , . . . , xn ) R(X1 , . . . , Xn ).
=
i=1
Tako nastao sluajni vektor zovemo jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom [0, 1].
Ako s F oznaimo funkciju distribucije tog sluajnog uzorka za dani , onda statistiki model u okviru kojega se bavimo zakljuivanjem o proporciji ini familija
funkcija distribucije:
P = {F : [0, 1]}.
Zovemo ga statistiki model jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije.
Uoimo da je taj model P indeksiran parametrom , pa takav model zovemo parametarski.
Model sluajnog uzorka iz Bernoullijeve distribucije moemo koristiti u mnogo drugih praktinih primjera.
203
Statistika
0
1
Pi1
j=1
aj
N (i1)
P
v i1
j=1 aj
N (i1)
204
Statistiki model
(4.2)
i=3
.
N (i 1)
N
Rijeima reeno, za veliki N i mali v, parametarski statistiki model temeljen na odabiru n elemenata iz populacije veliine N bez vraanja prethodno izvuenih elemenata u tu populaciju moemo
aproksimirati parametarskim statistikim modelom temeljenim na odabiru n elemenata iz iste
populacije s vraanjem prethodno izvuenih elemenata u tu populaciju.
4.2.2
205
Statistika
vrpci, moe se smatrati da masa eera u pakiranjima delariranim kao 1 kg zapravo ima normalnu
distribuciju.
Uzimanje jednog pakiranja i precizno vaganje rezultira podatkom koji je realizacija normalne sluajne varijable s oekivanjem i varijancom 2 . Uzimamo li s trake n pakiranja i vaemo im
sadraj, imamo podatke (x1 , x2 , . . . , xn ) koji su jedna realizacija n. j. d. sluajnog vektora
(X1 , X2 , . . . , Xn ).
Sluajni vektor (X1 , X2 , . . . , Xn ) zovemo jednostavni sluajni uzorak iz normalne distribucije s parametrima i 2 , ako su X1 , X2 , . . . , Xn nezavisne i
jednako distribuirane sluajne varijable s distribucijom koja je N (, 2 ).
Ako je F(,2 ) funkcija distribucije normalne sluajne varijable za dani (, 2 ), onda
je funkcija distribucije jednostavnoga sluajnog uzorka iz te distribucije (zbog nezavisnosti):
n
Y
F(,2 ) (x1 , . . . , xn ) =
F(,2 ) (xi ).
i=1
(4.3)
n
1X
Xi ,
n i=1
n = 365,
za koju zbog centralnog graninog teorema moemo smatrati da ima normalnu distribuciju s parametrima i 2 . Dakle, ako raspolaemo podacima o prosjenoj godinjoj koliini kie na nekom
podruju za 100 neprijestupnih godina, zapravo raspolaemo jednom realizacijom sluajnog vektora
(Y1 , . . . , Y100 ). Ako su istinite pretpostavke o nezavisnosti i jednakoj distribuiranosti sluajnih varijabli Y1 , . . . , Y100 , ima smisla u zakljuivanju o prosjenoj godinjoj koliini kie na tom podruju
koristiti statistiki model jednostavnoga sluajnog uzorka iz normalne distribucije s oekivanjem
i varijancom 2 .
206
4.2.3
Statistiki model
U navedenom primjeru, kao i u mnogim drugim primjerima slinog tipa, prikupljanjem podataka u uzorak imamo n ureenih parova brojeva
(x1 , y1 ), . . . , (xn , yn )
koji predstavljaju realizacije ureenih parova koje emo oznaiti
(x1 , Y1 ), . . . , (xn , Yn ),
a kod kojih je druga komponenta sluajna varijabla. Uoimo da sluajne varijable iz tih parova, tj. Y1 , . . . , Yn ne moraju biti jednako distribuirane. Naprotiv,
pretpostavka je da njihova distribucija ovisi o iznosu prve koordinate iz para.
Primjer 4.31. (automobili.xls)
Varijabla potrosnja baze podataka automobili.sta sadri podatke o potronji goriva novog modela
automobila pri brzini od 110 km/h za 300 nezavisnih mjerenja, dok varijabla mjerenje sadri vrijednosti nekog parametra izmjerenog na tehnikom pregledu tog automobila nakon takve vonje, a
za kojeg se pretpostavlja da bi kod tehniki ispravnog automobila trebao biti linearno povezan s prosjenom potronjom automobila pri velikim brzinama. U kontekstu jednostavne linearne regresije
izmjerene vrijednosti varijable potrosnja oznaavamo s x1 , . . . x300 , a izmjerene vrijednosti varijable mjerenje oznaavamo s (y1 , . . . , y300 ) i smatramo ih realizacijama nezavisnih sluajnih varijabli
Y1 , . . . , Y300 kojima modeliramo rezultate provedenih mjerenja. Parove (x1 , y1 ),. . ., (x300 , y300 )
izmjerenih vrijednosti varijabli potrosnja i mjerenje grafiki prikazujemo dijagramom rasprenosti
(eng. scatterplot) 4.12.
207
Statistika
22
20
mjerenje
18
16
14
12
10
8
6
2
5
6
potrosnja
f (y1 , . . . , yn ; a, b, ) =
=
1
2
n Y
n
i=1
n
e
212
n
P
i=1
208
4.3
Procjena parametara
Procjena parametra
U parametarskim statistikim modelima osnovu statistikog zakljuivanja ini zakljuivanje o parametrima. Jedan je od osnovnih problema njihova procjena na
temelju realizacije uzorka iz danog statistikog modela. Za procjene parametra
koristimo procjenitelje.
Definicija 4.2. Neka je P = {F : Rk } parametarski statistiki model,
k-dimenzionalan parametar, a Rk prostor parametra, tj. skup svih dozvoljenih
vrijednosti nepoznatog parametra . Neka je (X1 , . . . , Xn ) sluajni vektor s distribucijom iz P i t : Rn . Sluajni vektor T = t(X1 , . . . , Xn ) jest procjenitelj
za .1
Primjer 4.32. U modelu je jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije s parametrom p [0, 1] relativna frekvencija jedinice jedan procjenitelj za p.
Primjer 4.33. U modelu jednostavnoga sluajnog uzorka iz N (, 2 ) oznaimo
Xn =
2
Sn =
2
Sn
=
n
1X
Xi ,
n i=1
n
1X
(Xi X n )2 ,
n i=1
n
1 X
(Xi X n )2 .
n 1 i=1
209
Statistika
(tj. oekivanja procjenitelja) ako je varijanca manja. Zbog toga, usporeujui dva
nepristrana procjenitelja, kaemo da je efikasniji onaj koji ima manju varijancu.
Osim toga, poeljno je da varijanca nepristranog procjenitelja konvergira u nulu s
porastom veliine uzorka pa za jednodimenzionalan parametar definiramo svojstvo
konzistentnosti sljedeom definicijom.
Definicija 4.4. Neka je P = {F : R} parametarski statistiki model, a
jednodimenzionalan parametar. Procjenitelj T konzistentan je ako za pripadni
niz procjenitelja Tn = t(X1 , . . . , Xn ), n N, za svaki > 0 i vrijedi
lim P {|Tn | } = 0.
Primjer 4.34. Neko poduzee sve svoje finalne proizvode rasporeuje po kvaliteti u tri skupine: I,
II i III kategoriju. Iskustveno je poznato da su vjerojatnosti da finalni proizvod bude I kategorije
i da finalni proizvod bude II kategorije jednake. Ovu vjerojatnost oznaimo s . Dakle, sluajna
varijabla koja opisuje kategoriju kvalitete proizvoda moe se zadati na sljedei nain:
!
1 2
3
X=
.
1 2
Parametar moe primiti bilo koju vrijednost iz intervala [0, 1/2] da bi ta sluajna varijabla bila
dobro definirana. Problem koji se postavlja pred statistiara procjena je parametra na temelju
n-dimenzionalnog sluajnog uzorka.
U skladu s prethodnim primjerom za oekivati je da se relativna frekvencija neke kategorije moe
iskoristiti u svrhu procjene s obzirom da ima znaenje vjerojatnosti da se realizira proizvod
prve kategorije, ali takoer i vjerojatnost da se realizira proizvod druge kategorije. Tako se moe
razmiljati o procjeniteljima:
f2
f1
, T2 =
,
T1 =
n
n
gdje je f1 frekvencija jedinice, a f2 frekvencija dvojke u uzorku.
Uoimo da su oba procjenitelja nepristrana. Naime, f1 B(n, ) i f2 B(n, ) pa je
E T1 = E T2 = .
Moemo takoer izraunati i varijance:
n(1 )
(1 )
=
.
n2
n
Koritenjem se slabog zakona velikih brojeva lako vidi da su oba procjenitelja konzistentna. Na
temelju tih analiza ne moemo preferirati niti jednog od navedenih dvaju procjenitelja. Meutim,
razmotrimo kao varijantu i procjenitelja koji je vezan uz relativnu frekvenciju tree kategorije
proizvoda (f3 ):
1
f3
T3 =
1
.
2
n
Var T1 = Var T2 =
1
1
Var f3 =
n(1 2)2 =
(1 2).
4n2
4n2
2n
210
Procjena parametara
0.0025
0.0020
Var T1 HL, Var T2 HL
Var T3 HL
0.0015
0.0010
0.0005
0.0
0.1
0.2
0.3
0.4
0.5
4.3.1
Procjena proporcije
f1
n
jedan nepristran i konzistentan procjenitelj za parametar koji ima znaenje vjerojatnosti realizacije jedinice.
Zaista, s obzirom da sluajna varijabla koja daje broj uspjeha u n nezavisnih Bernoullijevih pokusa ima binomnu distribuciju s parametrima n i , to je f1 B(n, ).
Vrijedi:
f1
n
E
=
= .
n
n
Konzistentnost je posljedica slabog zakona velikih brojeva.
211
Statistika
Primjer 4.35. Promotrimo igrau kockicu sa svojstvom da se pri jednom bacanju broj i
{1, . . . , 6} okrene s vjerojatnou pi , pri emu je
pi > 0,
i {1, . . . , 6},
6
X
pi = 1.
i=1
elimo procijeniti vjerojatnost da se pri bacanju te kockice okrene estica, stoga oznaimo s 1
dogaaj "okrenula se estica", a s 0 dogaaj "nije se okrenula estica". U tom kontekstu rezultat
bacanja kockice modeliramo Bernoullijevom sluajnom varijablom
!
0
1
X=
,
1 p6 p6
gdje je p6 nepoznati parametar kojega emo procijeniti.
Pretpostavimo da smo kockicu bacili nezavisno sto puta zaredom. Realizaciju tih 100 bacanja modeliramo sluajnim vektorom (X1 , . . . X100 ) ije su komponente nezavisne i jednako distribuirane
kao sluajna varijabla X, tj. (X1 , . . . X100 ) je jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom p6 . Nadalje, pretpostavimo da se u tih 100 bacanja estica realizirala 17 puta.
To znai da je realizacija sluajnog uzorka (X1 , . . . X100 ) ureena 100-torka koja se sastoji od 17
jedinica i 83 nule. Slijedi da je relativna rekvencija pojavljivanja estice, broj 17/100, procjena
vjerojatnosti p6 . Analogno bismo postupali pri procjeni bilo koje od preostalih vjerojatnosti pi ,
i {1, . . . , 5}.
Primjer 4.36. (djelatnici.xls)
Varijabla dob baze podataka djelatnici.xls sadri informacije o godinama starosti za svakoga od
100 djelatnika iz reprezentativnog uzorka zaposlenika tvornice A. Oznaimo s vjerojatnost da
je sluajno odabrani djelatnik te tvornice stariji od 30 godina te procijenimo . Znamo da svaki
djelatnik te tvornice ima ili najvie 30 godina (oznaka 0) ili je stariji od 30 godina (oznaka
1) pa rezultat ispitivanja starosti u tom kontekstu moemo modelirati Bernoullijevom sluajnom
varijablom
!
0 1
X=
, [0, 1].
1
Prema tome, podatke iz varijable dob shvaamo kao jednu realizaciju jednostavnog sluajnog uzorka
(X1 , . . . , X100 ) iz te Bernoullijeve distribucije i na temelju te realizacije parametar procjenjujemo relativnom frekvencijom jedinica, tj. relativnom frekvencijom djelatnika iz uzorka koji su
stariji od 30 godina. Kako takvih djelatnika u uzorku ima 46, parametar procjenjujemo brojem
46/100 = 0.46.
4.3.2
Procjena oekivanja
212
Procjena parametara
Var X n =
2
,
n
frekvencija
1
2
3
4
5
7
7
15
20
16
Tablica 4.14: Tablica frekvencija ocjena studenata na usmenom ispitu iz jednog kolegija.
Ocjene prikupljene na uzorku, predstavljene kao ureena 65-torka, ine jednu realizaciju jednostavnog sluajnog uzorka (X1 , . . . , X65 ) iz distribucije F . Procjenitelj za oekivanje od X jest
sluajna varijabla X 65 . Njezinu realizaciju na uzorku (x1 , . . . , x65 ) oznaimo s x65 . Prema tome,
procjena oekivanja sluajne varijable X na temelju tablice frekvencija 4.14 jest
x65 =
1 7 + 2 7 + 3 15 + 4 20 + 5 16
3.48.
65
213
Statistika
Iznosi godinjih plaa za promatrani uzorak od 100 djelatnika (podaci iz varijable placa_prije)
jedna su realizacija jednostavnog sluajnog uzorka (X1 , . . . , X100 ) iz distribucije F . Prema tome,
procjenitelj X 100 za oekivanje od X realizira se aritmetikom sredinom podataka iz varijable
placa_prije, tj. procjena je oekivanja od X x100 24522.
4.3.3
Procjena varijance
Sn =
1X
(Xi X n )2 .
n i=1
Sn =
=
1X
1X
(Xi X n )2 =
[(Xi ) (X n )]2
n i=1
n i=1
n
n
n
X
1X
1X
2
(Xi )2 +
(X n )2 (X n )
(Xi ).
n i=1
n i=1
n
i=1
Budui da je
n
X
(X n )2 = n(X n )2 ,
n
X
(Xi ) = n(X n ),
i=1
i=1
slijedi da je
2
Sn =
1X
(Xi )2 (X n )2 .
n i=1
Dakle,
2
E S n =
1X
1
2
E [(Xi )2 ] E [(X n )2 ] = n 2
,
n i=1
n
n
tj.
2
E S n =
n1
.
n
Sn2 =
1 X
(Xi X n )2 ,
n 1 i=1
214
Procjena parametara
s270 = 44.19.
4.3.4
Neka je (X1 , X2 , . . . , Xn ) jednostavni sluajni uzorak iz nepoznate funkcije distribucije F sluajne varijable X. Statistiki model takvog sluajnog uzorka ne moemo
smatrati parametarskim s obzirom da familija dozvoljenih funkcija distribucije nije
indeksirana nepoznatim parametrom, nego je potpuno neodreena. Takav statistiki model zvat emo neparametarski.
U takvom modelu opisat emo jedan nain procjene funkcije distribucije F . Preciznije, za svaki pojedini x R procjenu vrijednosti funkcije distribucije, F (x).
S obzirom da je F (x) po definiciji P {Xi x}, za svaki i {1, . . . , n} i za dani x
zapravo imamo problem procjene vjerojatnosti uspjeha (uspjeh znai da se realizirao
dogaaj {Xi x}) pa se moemo posluiti rezultatima iz procjene proporcije.
215
Statistika
Njezina je distribucija:
I{Xx} =
0
1
1 F (x) F (x)
!
,
Uoimo da ovdje F (x) igra ulogu parametra distribucije sluajne varijable I{Xx} .
Iz problema procjene proporcije znamo da je dobar procjenitelj za parametar Bernoullijeve distribucije relativna frekvencija jedinice, a u sluaju varijable I{Xx} to
je relativna frekvencija skupa {X x}. Oznaimo
n
f{Xx}
1X
=
I{Xi x} .
F (x) =
n
n i=1
Tada je
E(F (x)) = F (x)
za svaki pojedini x R i
Var (F (x)) =
F (x)(1 F (x))
,
n
216
Procjena parametara
rukovodstvo
frek.
kumulativna frek.
rukovodstvo
frek.
kumulativna frek.
0
1
2
3
4
5
6
7
20
15
13
10
12
10
1
3
0.20
0.35
0.48
0.58
0.7
0.8
0.81
0.84
8
9
10
11
12
13
14
17
3
3
2
2
1
1
2
2
0.87
0.9
0.92
0.94
0.95
0.96
0.98
1
Tablica 4.15: Tablica frekvencija i kumulativnih frekvencija svih zabiljeenih vrijednosti varijable
rukovodstvo.
0 , x<0
0.2 , 0 x < 1
0.35 , 1 x < 2
0.48 , 2 x < 3
f{Xx}
F (x) =
= 0.58 , 3 x < 4
100
0.7 , 4 x < 5
..
.. ..
. .
.
1 , x 17.
Graf funkcije F (x) prikazan je na slici 4.14.
y
0.8
0.7
0.58
0.48
0.35
0.2
-1
10 11 12 13 14 15 16 17 18 19
217
Statistika
Primjer 4.43. Funkcija distribucije standardne normalne sluajne varijable definirana je pravilom
Zx
2
1
et /2 dt, x R.
F (x) =
2
Graf te funkcije prikazan je na slici 2.20 u drugom poglavlju. U ovom emo primjeru na temelju simuliranih vrijednosti iz standardne normalne distribucije (tj. simulirane realizacije ndimenzionalnog jednostavnog sluajnog uzorka iz standardne normalne distribucije) ilustrirati ponaanje procjene F za F u ovisnosti o veliini uzorka.
Na temelju jedne simulacije 10 vrijednosti iz te distribucije dobili smo graf funkcije F (x) prikazan
na slici 4.15 (stepenasti graf ).
y
1
9
10
4
5
7
10
3
5
1
2
2
5
3
10
1
5
1
10
-4
-2
Slika 4.15: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 10) standardne
normalne sluajne varijable.
Grafovi empirijskih funkcija distribucije standardne normalne sluajne varijable za 30 i 100 simuliranih vrijednosti prikazani su na slikama 4.16 i 4.17.
y
1.0
0.8
0.6
0.4
0.2
-4
-2
Slika 4.16: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 30) standardne
normalne sluajne varijable.
218
Procjena parametara
y
1.0
0.8
0.6
0.4
0.2
-4
-2
Slika 4.17: Grafovi funkcije distribucije i empirijske funkcije distribucije (n = 100) standardne
normalne sluajne varijable.
Koritenjem nekog programskog paketa simulirajte 1000 podataka iz standardne normalne distribucije i nacrtajte graf empirijske funkcije distribucije. Usporedite ju sa stvarnom funkcijom
distribucije.
plaa
frekvencija
kumulativna frekvencija
16000
18100
18300
18400
..
.
24500
24600
..
.
42400
1
1
1
2
..
.
1
4
..
.
1
1
2
3
5
..
.
57
61
..
.
100
219
Statistika
4.3.5
Ideja za procjenu parametara u linernom regresijskom modelu (poglavlje 4.2.3) temelji se na jednostavnom zahtjevu da treba minimizirati sumu kvadrata odstupanja
eksperimentalnih od teorijskih vrijednosti.
Neka je (x1 , y1 ), . . . , (xn , yn ) dana realizacija sluajnog uzorka iz regresijskog problema. Onda su y1 , . . . , yn tzv. eksperimentalne vrijednosti, tj. realizacije sluajnog
vektora (Y1 , . . . , Yn ) kojega elimo opisati modelom
Yi = axi + b + i , i = 1, . . . , n,
(4.5)
kao to je navedeno u poglavlju 4.2.3. S obzirom da i predstavljaju sluajne varijable koje opisuju greku modela, teorijske su vrijednosti y(xi ) = axi + b. Jedan
procjenitelj za nepoznati vektorski parametar (a, b) moe se dobiti minimizacijom
izraza
n
X
(y(xi ) yi )2
S(a, b) =
i=1
po (a, b) R R.
Uvedimo oznake:
x1
x2
x=
..
.
xn
..
, = [a, b] , y = [y1 , . . . , yn ] .
.
1
(4.6)
Uvrstimo li sluajni vektor Y = [Y1 , . . . Yn ] u izraz za umjesto y, imamo procjenitelja za nepoznati parametar .
Moe se pokazati da je tako definiran procjenitelj za nepristran. Za dokaze i ostala
svojstva procjenitelja vidi npr. [21] ili [29].
Primjer 4.45. (automobili.xls)
Baza podataka automobili.xls opisana je u primjeru 4.12. U istom primjeru opisano je i znaenje izmjerenih vrijednosti varijabli potrosnja i mjerenje u jednostavnom linearnom regresijskom
modelu: x1 , . . . x300 prosjene su potronje promatranog tipa automobila pri vonji po autocesti brzinom 110 km/h (varijabla potrosnja), a y1 , . . . , y300 realizacije su sluajnog vektora (Y1 , . . . , Y300 )
220
kojim modeliramo rezultate mjerenja nekog parametra na tehnikom pregledu tog automobila nakon te vonje, a za kojega se pretpostavlja da bi kod tehniki ispravnog automobila trebao biti
linearno povezan s prosjenom potronjom automobila pri velikim brzinama. Uvrtavanjem podataka iz baze automobili.xls u izraz 4.6 i primjenom nekog statistikog softvera moemo dobiti
procjene parametara a i b regresijskog modela 4.5 u ovom primjeru:
b
a = 2.138,
b
b = 2.349.
Slijedi da modelom odreen rezultat mjerenja promatranog parametra na tehnikom pregledu tog
automobila nakon vonje u opisanim uvjetima raunamo pomou pravila
y(x) = b
ax + b
b = 2.138x + 2.349.
4.4
U ovom poglavlju pretpostavit emo da je statistiki model za podatke parametarski s jednodimenzionalnim parametrom kojega elimo procijeniti. Parametar
procjenjujemo koritenjem procjenitelja T . S obzirom da je parametar jednodimenzionalan, procjenitelj je sluajna varijabla. Procjena je na temelju podataka
samo jedna realizacija procjenitelja. Koristei distribuciju procjenitelja u danom
statistikom modelu mogue je dobiti i druge informacije o stvarnoj vrijednosti
procijenjenog parametra, ne samo jedan broj koji predstavlja procjenu.
U ovom poglavlju opisat emo koncept procjene parametra pouzdanim intervalom i interpretaciju takve procjene te ilustrirati procjenu pouzdanim intervalom na
nekoliko primjera.
Pouzdani interval za procjenu parametra po svojoj definiciji nije interval s realnim
brojevima kao granicama nego interval kojemu su granice sluajne varijable pa ga
moemo zvati sluajni interval.
Definicija 4.5. Neka je h0, 1i, a sluajni vektor (X1 , . . . , Xn ) s distribucijom
iz parametarske familije P = {F : R} neka odreuje statistiki model. Ako
postoje dva procjenitelja D = d(X1 , . . . , Xn ) i G = g(X1 , . . . , Xn ) za paramear sa
svojstvima:
d(x1 , . . . , xn ) g(x1 , . . . , xn ), za sve (x1 , . . . , xn ) R(X1 , . . . , Xn ),
P {D G} , za sve ,
onda kaemo da je sluajni interval [D, G] pouzdani interval za pouzdanosti .
221
Statistika
4.4.1
ima asimptotski standardnu normalnu distribuciju. Oznaimo sa Z N (0, 1). Koritenjem tih rezultata konstruirat emo pouzdani interval za oekivanje na temelju
jednostavnoga sluajnog uzorka iz distribucije F .
222
Zz
ex
/2
dx = .
f (x)
P {|Z| z } =
x
z
z
Slika 4.18: Vjerojatnost P {|Z| z }.
P z
n z = P X n z X n + z
.
n
n
Dakle, vrijedi:
P X n z
, X n + z
,
n
n
h
i
pa sluajni interval X n z n , X n + z n moemo smatrati pouzdanim intervalom za pouzdanosti ukoliko imamo veliku veliinu uzorka n.
223
Statistika
xn z , xn + z .
n
n
(4.7)
x70 96.9,
s70 44.19,
z0.95 1.96,
gdje su x70 i s70 redom procjene oekivanja i standardne devijacije sluajne varijable X. Koritenjem izraza 4.7 slijedi da je traeni interval
[86.36, 107.44].
Procjena istog oekivanja intervalom pouzdanosti = 0.97 zahtijeva poznavanje vrijednosti z0.97
2.17. Traena je realizacija intervala pouzdanosti = 0.97 interval
[85.19, 108.61].
Uoimo da se za veu vrijednost interval pouzdanosti realizira irim intervalom realnih brojeva
nego za manju vrijednost .
Primjer 4.47. (djelatnici.xls)
Procijenimo intervalom pouzdanosti = 0.97 oekivanje neprekidne sluajne varijable iz primjera
4.39 kojom modeliramo godinju plau djelatnika jedne tvornice (varijabla placa_prije). Da bismo
izraunali realizaciju traenog intervala pouzdanosti, trebaju nam sljedee vrijednosti:
n = 100,
x100 24522,
s100 5105.8,
z0.97 2.17,
gdje su x100 i s100 redom procjene oekivanja i standardne devijacije sluajne varijable X odreene
u primjerima 4.39 i 4.41. Koritenjem izraza 4.7 slijedi da je traeni interval
[23414, 25630].
224
4.4.2
U statistikom modelu koji smo nazvali "problem proporcije" zakljuujemo o vjerojatnosti da se realizira broj 1 na temelju n-dimenzionalnoga jednostavnog sluajnog
uzorka iz Bernoullijeve distribucije.
Nepristran i konzistentan procjenitelj koji u tu svrhu koristimo jest relativna frekvencija jedinice, tj.
f1
.
n
Slino prethodnom poglavlju, centralni granini teorem ovdje omoguuje odreivanje asimptotske distribucije standardizirane relativne frekvencije jedinice, pa emo
na temelju tog rezultata konstruirati pouzdani interval za proporciju.
Neka je (X1 , . . . , Xn ) jednostavni sluajni uzorak iz Bernoullijeve distribucije s parametrom h0, 1i. Tada je
n
1X
f1
Xi .
=
n
n i=1
Osim toga, f1 B(n, ), pa je
E
f1
f1
(1 )
= , Var
=
.
n
n
n
f1
npn
(1 )
P n p n
z .
(1 )
Nejednadba
f1
n
np
z
(1 )
bit e zadovoljena ako je [1 , 2 ], gdje su 1 i 2 rjeenja jednadbe
2 (n + z2 ) (2f1 + z2 ) +
f12
= 0.
n
225
Statistika
1 f1
f1
f1
(1 ), 2
+ z
n n
n
n
1 f1
f1
(1 ).
n n
n
Za danu je realizaciju toga jednostavnog sluajnog uzorka uobiajeno relativnu frekvenciju jedinice oznaiti s p, a relativnu frekvenciju nule s q. Koritenjem takvih
oznaka i dobivenih rezultata navodimo postupak za raunanje pouzdanog intervala
za proporciju na temelju realizacije jednostavnoga sluajnog uzorka iz Bernoullijeve
distribucije:
odrediti broj z za koji vrijedi da je P {|Z| z } = , gdje je Z N (0, 1),
izraunati interval po formuli:
"
p z
pq
, p + z
n
#
pq
.
n
(4.8)
Primjer 4.48. Neka je X diskretna sluajna varijabla kojom modeliramo ocjene znanja studenata
jednog fakulteta na usmenom ispitu iz nekog kolegija (primjer 4.37). Procijenimo intervalom
pouzdanosti = 0.95 proporciju studenata koji usmeni ispit polau ocjenom izvrstan. Ovdje se
realizacija ocjene izvrstan smatra "uspjehom", a realizacija bilo koje druge ocjene "neuspjehom",
pa iz tablice 4.14 slijedi da je
16
49
16
, q = 1
=
.
p =
65
65
65
Kako je n = 65, a z0.95 1.96, primjenom izraza (4.8) slijedi da je realizacija traenog intervala
pouzdanosti interval
[0.14, 0.35].
Primjer 4.49. (kolokvij.xls)
Neka je X diskretna sluajna varijabla kojom modeliramo ukupan broj bodova studenta ostvaren na
dvama kolokvijima iz nekog kolegija (primjer 4.38). Procijenimo intervalom pouzdanosti = 0.95
proporciju studenata koji su na kolokvijima ukupno ostvarili barem 100 od moguih 200 bodova.
Ovdje se ukupan broj bodova vei ili jednak 100 smatra "uspjehom", a ukupan broj bodova manji
od 100 "neuspjehom", pa iz podataka dostupnih u varijabli bodovi_ukupno slijedi da je
p =
39
0.56,
70
q = 1
39
31
=
0.44.
70
70
Kako je n = 70, a z0.95 1.96, primjenom izraza 4.8 slijedi da je realizacija traenog intervala
pouzdanosti interval
[0.44, 0.67].
Primjer 4.50. (djelatnici.xls)
Neka je X neprekidna sluajna varijabla iz primjera 4.39 kojom modeliramo godinju plau djelatnika jedne tvornice. Procijenimo intervalom pouzdanosti = 0.98 proporciju djelatnika koji
226
godinje zarauju vie od 30000. Ovdje se realizacija godinje plae vee od 30000 smatra "uspjehom", a realizacija godinje plae manje ili jednake 30000 "neuspjehom". Iz podataka za varijablu
placa_prije slijedi da je
p = 0.16, q = 1 0.16 = 0.84.
Budui da je n = 100, a z0.98 2.33, primjenom izraza 4.8 slijedi da je traeni interval
[0.075, 0.245].
4.5
Statistika hipoteza slutnja je koja se odnosi na statistiki model. Cilj je testiranja hipoteze odluiti o istinitosti ili neistinitosti te slutnje.
Primjer 4.51. O proporciji puaa izabranog podruja moe se zakljuivati na temelju reprezentativnog uzorka koji predstavlja jednu realizaciju jednostavnog sluajnog uzorka iz Bernoullijeve
distribucije s parametrom h0, 1i. Nepoznati je parametar upravo proporcija puaa populacije. Jedna je slutnja/hipoteza koju moemo testirati npr. da je proporcija puaa u toj populaciji
manja od 20%.
Postupak testiranja hipoteza uvijek poinje prevoenjem slutnje koja nas zanima u
statistiku hipotezu. To znai formiranje statistikog modela u okviru kojega emo
zakljuivati i izricanje hipoteze u terminima koji se odnose na odabrani statistiki
model. S obzirom da je statistiki model P familija funkcija distribucije koje su
dozvoljene prilikom zakljuivanja o zadanom problemu, oigledno je da postavljena
hipoteza zapravo odreuje jedan podskup od P. U prethodnom je primjeru statistiki model odabran, a hipotezu moemo iskazati kao podskup distribucija modela
za koji vrijedi nejednakost 0.2.
Statistiku hipotezu standardno oznaavamo s H. Testirati hipotezu znai donijeti
odluku o tome hoemo li H odbaciti ili ne.
Odluku u postupku testiranja hipoteza donosimo na temelju odabranog kriterija i
realizacije uzorka. Odabrati kriterij zapravo znai definirati pravilo za odbacivanje
hipoteze. S obzirom da se odluka donosi na temelju realizacije sluajnog vektora
(X1 , . . . , Xn ) statistikog modela, pravilo mora biti iskazano u terminima tog sluajnog vektora . U tu svrhu koristimo pojam "statistika".
Definicija 4.6. Neka je (X1 , . . . , Xn ) sluajni vektor statistikog modela P na temelju kojega donosimo zakljuke i neka je t : R(X1 , . . . , Xn ) Rk zadana funkcija.
Sluajni vektor/varijablu T = t(X1 , . . . , Xn ) zovemo statistika za taj statistiki
model.
227
Statistika
4.5.1
Odluka koja je donesena statistikim testom moe biti pogrena ili ispravna. Pritom
se mogu dogoditi dva tipa pogrene odluke:
pogreka I. tipa:
pogreka II. tipa:
Vjerojatnosti pogreke prvog tipa i pogreke drugog tipa ovise o stvarnoj distribuciji sluajne varijable o kojoj testiramo hipotezu, tj. te su vjerojatnosti zapravo
funkcije koje distribuciji iz P pridruuju broj, ali one nisu definirane na istoj domeni. Vjerojatnost pogreke prvog tipa moe se raunati za svaku distribuciju iz
H0 , dok se vjerojatnost pogreke drugog tipa rauna za svaku distribuciju iz H1 .
Ilustrirajmo taj postupak na primjeru.
Primjer 4.52. Pretpostavimo da elimo zakljuivati o proporciji puaa izabranog podruja na
temelju jednostavnoga sluajnog uzorka iz Bernoullijeve distribucije s parametrom h0, 1i (primjer 4.51). Neka je P = {F : F Bernoullijeva, h0, 1i} pripadni statistiki model. Taj model
parametarski je, pa i hipoteze moemo izraavati u terminima parametra. Imamo slutnju da je
228
proporcija puaa manja ili jednaka 20%. Statistika hipoteza koja opisuje ovu slutnju jest podskup
od P za koji vrijedi 0.2. Dakle,
H0 : 0.2,
H1 : > 0.2.
Za taj parametarski model podjela P na H0 i H1 ekvivalentna je podjeli skupa dozvoljenih vrijednosti parametra h0, 1i na dva dijela: h0, 0.2] i h0.2, 1i. Vjerojatnost pogreke prvog tipa i vjerojatnost pogreke drugog tipa sada moemo promatrati kao funkcije od nepoznatog parametra. Ako je
odabran postupak za odbacivanje nul-hipoteze, znai da je definirano kritino podruje Cr , pa se
te funkcije mogu definirati na sljedei nain:
- vjerojatnost pogreke prvog tipa :
: h0, 0.2] [0, 1], () = P {(X1 , . . . Xn ) Cr },
- vjerojatnost pogreke drugog tipa :
: h0.2, 1i [0, 1], () = P {(X1 , . . . Xn ) Crc }.
Uoimo da je
(F ) = (F ),
(F ) = 1 (F ),
F H0 ,
F H1 .
229
Statistika
Cr : odbacit emo nul-hipotezu ako je relativna frekvencija puaa u uzorku vea od 22%.
Uz standardnu oznaku f1 za frekvenciju puaa, funkcija je jakosti za takav test dana izrazom
f1
> 0.22 .
() = P {(X1 , . . . , Xn ) Cr } = P
n
Pod pretpostavkam statistikog modela znamo da je f1 B(n, ). Dakle, vrijedi:
X n
f1
k (1 )nk .
P
> 0.22 = P {f1 > 0.22n} =
k
n
k>0.22n
Graf te funkcije za n=100 prikazan je slikom 4.19.
0.8
0.6
0.4
0.2
0.2
0.4
0.6
0.8
f1
n
> 0.22.
H0
dok je maksimalna vjerojatnost pogreke drugog tipa za tako definirano kritino podruje
max () = 1 0.261067 = 0.738933
H1
230
0.8
f1 n > 0.22
0.6
f1 n > 0.3
0.4
0.2
0.2
0.4
0.6
0.8
f1
n
> 0.22 i
f1
n
> 0.3 .
H0
H1
231
Statistika
iznosi maksimalna vjerojatnost da smo pogrijeili. Zato emo tada rei kako podaci
ne podupiru tvrdnju da H0 treba odbaciti.
Takav neravnopravan odnos izmeu nulte i alternativne hipoteze prilikom kreiranja
statistikog testa upuuje na injenicu da nije svejedno kako smo izbrali nultu i
alternativnu hipotezu i pripadni test. Ukoliko je mogue, uputno je u primjeni
birati statistiki test kojemu alternativna hipoteza odgovara tvrdnji koju elimo
dokazati.
Iako je teorija odabira optimalne test-statistike vrlo razvijena (vidi npr. [18], [2],
[21]) ovdje se neemo baviti metodama za odabir optimalnih statistika za testiranje
hipoteza odabranog modela. U nastavku samo ilustriramo intuitivnu metodu odabira postupka za testiranje hipoteza na nekoliko primjera bez analize maksimalne
vjerojatnosti pogreke drugog tipa. Zainteresirani itatelj vie o tom problemu moe
pronai u literaturi koja opirnije obrauje teme iz matematike statistike kao npr.
[2], [9], [16], [21], [22], [24].
4.5.2
U ovom poglavlju ilustrirat emo jedan od statistikih testova koji moemo koristiti
prilikom testiranja hipoteza o iznosu oekivanja distribucije sluajne varijable na
temelju koje je formiran statistiki model jednostavnoga sluajnog uzorka. Problem
ilustriramo sljedeim primjerom.
Primjer 4.54. Pretpostavimo da elimo provjeriti je li oekivana vrijednost vremena ekanja u
redu studentske menze u vrijeme ruka vea od pet minuta. U tu svrhu, od sto sluajno izabranih
studenata koji odlaze na ruak u studentsku menzu prikupljamo podatke o vremenu ekanja. Tako
dolazimo do podataka (x1 , . . . , x100 ). Na temelju tih podataka aritmetikom sredinom procijenili
smo oekivanje sluajne varijable iz koje potjeu podaci - procjena je iznosila 6.5 minuta. Znajui
iz prethodnih prouavanja te sluajne varijable da je njezina varijanca 25, elimo testirati slutnju
da je oekivano vrijeme ekanja vee od 5 minuta.
Test kojim moemo testirati takvu slutnju izvest emo na temelju statistikog modela jednostavnog sluajnog uzorka (X1 , . . . , Xn ) iz distribucije F kojoj je varijanca
poznata i iznosi 2 , a oekivanje jest nepoznato.
Postavimo nultu i alternativnu hipotezu na sljedei nain:
H0 : = 0
H1 : > 0 .
232
X n 0
n
f (x)
P {Z 1.64} = 0.05
x
1.64
Slika 4.21: Povrina ispod grafa funkcije gustoe standardne normalne distribucije
nad intervalom [1.64, ).
Pretpostavimo da se u naem sluaju Z 0 realizirala brojem z. U uvjetima istinitosti hipoteze H0 oekujemo realizacije od Z 0 bliske 0 ili manje od 0. Vei iznosi
realizacija od Z 0 idu u prilog alternativnoj hipotezi, ali to ne znai da se ne mogu
dogoditi i ako je H0 istinita hipoteza. Naime, ako je H0 istinita hipoteza, vjerojatnost da se sluajna varijabla Z 0 realizira brojem veim ili jednakim z iznosi priblino
P {Z z}.
Sada zakljuujemo na sljedei nain. Ako je H0 istinita hipoteza, realizacije vee ili
jednake z mogu se pojaviti, a vjerojatnost je za to priblino P {Z z}. Dakle, ako
odbacimo nul-hipotezu, vjerojatnost je da emo time pogrijeiti najvie P {Z z}.
Ukoliko je taj broj manji od standardno prihvaenih vrijednosti za maksimalnu
vjerojatnost pogreke prvog tipa (tj. nivoa znaajnosti testa), hipotezu H0 moemo
233
Statistika
P {Z z }
x
z
Slika 4.22: Povrina ispod grafa funkcije gustoe standardne normalne distribucije
nad intervalom (, z ].
Objanjeni postupak openito zapisujemo na sljedei nain:
Nul-hipoteza:
H0 : = 0 ,
Test-statistika:
Z0 =
X n 0
.
/ n
234
x70 0
96.9 100
=
= 0.59.
s70 / 70
44.19/ 70
H0 : = 23000,
H1 : > 23000.
235
Statistika
4.5.3
O proporciji emo, u ovom primjeru statistikog testa, zakljuivati na temelju ndimenzionalnoga jednostavnog sluajnog uzorka iz Bernoullijeve distribucije. Neka
je sluajni pokus modeliran Bernoullijevom sluajnom varijablom s tablicom distribucije
!
01
X=
, p (0, 1), q = 1 p.
qp
Testirat emo hipotezu o vrijednosti parametra p koji ima znaenje vjerojatnosti realizacije "uspjeha" (tj. jedinice) u jednom izvoenju danog pokusa. U tom postupku
koristimo relativnu frekvenciju realiziranih "uspjeha" (jedinica) kao procjenitelj za
nepoznatu vjerojatnost p i oznaavamo ju s pb.
Postavimo nul-hipotezu na sljedei nain:
H0 : p = p0 .
Iskoristimo test-statistiku
p p0
Z0 = q
p0 (1p0 )
n
236
= 0.81.
0.2(10.2)
65
0.56 0.5
q
= 1.004.
0.25
70
237
Statistika
= 2.54.
0.75(10.75)
100
4.5.4
prije
x1
x2
.
..
xn
poslije
y1
y2
.
..
yn
Istraivai bi htjeli dobiti odgovor na pitanje dolazi li do promjene razine triglicerida nakon uzimanja lijeka.
Analogni problemi pojavljuju se esto u primjenama. Kaemo da u takvim sluajevima analiziramo istu karakteristiku (varijablu) prije i nakon tretmana.
238
tretman 1
x1
x2
..
.
xn
tretman 2
y1
y2
..
.
yn
razlike
d 1 = x1 y1
d 2 = x1 y2
..
.
dn = x1 yn
Postavimo hipotezu:
H0 : D = 0.
Ukoliko je uzorak dovoljno velik, u poglavlju 4.5.2 opisali smo proceduru za testiranje te hipoteze u kombinaciji s alternativnom hipotezom D > 0 ili D < 0.
U tom sluaju za varijancu od D moemo koristiti korigiranu varijancu uzorka iz
distribucije od D, kao to je navedeno u poglavlju 4.5.2.
Primjer 4.61. (djelatnici.xls)
U bazi podataka djelatnici.xls raspolaemo podacima o godinjim plaama za uzorak od 100 djelatnika jedne tvornice (tvornice A). Varijabla placa_prije sadri iznose godinjih plaa za djelatnike
iz uzorka prije reorganizacije poslovnog sustava, a varijabla placa_poslije iznose godinjih plaa za
isti uzorak djelatnika nakon reorganizacije. Budui da se ovdje radi o istom uzorku djelatnika ije
godinje plae pratimo prije i poslije reorganizacije posla, kaemo da se radi o zavisnim uzorcima.
Oznaimo s X (1) sluajnu varijablu kojom modeliramo godinju plau djelatnika tvornice A prije
reorganizacije, a s X (2) sluajnu varijablu kojom modeliramo godinju plau djelatnika te tvornice
poslije reorganizacije. Zanima nas razlikuju li se na nivou znaajnosti = 0.05 oekivanja plaa
djelatnika te tvornice prije i poslije reorganizacije posla. Prije nego postavimo potrebne statistike
hipoteze, procijenimo, na temelju realizacija jednostavnih sluajnih uzoraka iz distribucija od X (1)
i X (2) , oekivanja i varijance od X (1) , X (2) i D = X (1) X (2) . Procjene su dane u tablici 4.17.
239
Statistika
sluajna varijabla
procjena oekivanja
procjena varijance
X (1)
X (2)
D
24522
24986.85
464.85
26069208.1
26252789.5
116302.63
Nezavisni uzorci
Za ilustraciju problema prvo navedimo jedan primjer.
Primjer 4.62. Ured za kvalitetu na nekom fakultetu eli provjeriti je li dolo do bitne promjene
u distribuciji ocjene iz kolegija Matematika 1 koju su ostvarili studenti generacije 2009./2010. u
odnosu na generaciju 2008./2009. U tu svrhu prikuplja podatke o ocjenama na uzorcima studenata
i modelira ocjenu iz tog kolegija kao sluajnu varijablu i to X za generaciju 2008./2009., a Y za
2009./2010. Takoer, pretpostavlja da su X i Y nezavisne sluajne varijable. Prikupljeni podaci
o ocjenama (x1 , . . . , xn ) i (y1 , . . . , ym ) realizacije su jednostavnih sluajnih uzoraka iz distrbucije
od X, odnosno iz distribucije od Y .
Statistiki model opisan u tom primjeru sastoji se od distribucija sluajnog vektora (X1 , X2 , . . . , Xn , Y1 , Y2 , . . . , Ym ) nezavisnih, ali ne nuno jednako distribuiranih sluajnih varijabli. Meutim, prvi dio vektora, tj. (X1 , X2 , . . . , Xn ) jest jednostavni sluajni uzorak iz distribucije sluajne varijable X, dok je drugi dio,
(Y1 , Y2 , . . . , Ym ), jednostavni sluajni uzorak iz distribucije sluajne varijable Y .
Jednostavan nain potvrde postojanja razlike u distribucijama potvrda je postojanja
razlike u oekivanjima tih distribucija. Ovdje emo navesti jedan test kojim moemo
testirati upravo takve hipoteze, tj. hipoteze o razlici u oekivanjima.
240
2
X
2
+ Y.
n
m
Sada moemo testirati slutnju o postojanju razlika u oekivanjima koritenjem distribucije sluajne varijable D. Postavimo statistiku hipotezu:
H0 : D = 0.
Statistika teorija dokazuje da, u uvjetima istinitosti H0 , standardizirani oblik sluajne varijable D, tj. sluajna varijabla
Z0 = q
D
2
X
n
2
Y
m
D
2
SX
2
SY
m
(1)
(2)
(2)
241
Zadaci
iz distribucija sluajnih varijabli X (1) , X (2) i Y , redom. Zanima nas razlikuje li se, na nivou
znaajnosti = 0.01, oekivanje plae djelatnika tvornice A prije reorganizacije posla od oekivanja plae djelatnika tvornice B. Potraimo takoer i odgovor na analogno pitanje za oekivanje
plae djelatnika tvornice A nakon reorganizacije.
Procjene oekivanja i varijanci sluajnih varijabli X (1) i X (2) dane su u tablici 4.17. Procjene
(1)
(2)
oekivanja i varijanci sluajnih varijabli Y , D1 = X 100 Y 100 i D2 = X 100 Y 100 dane su u
tablici 4.18.
sluajna varijabla
procjena oekivanja
procjena varijance
Y
D1
D2
25432.24
910.24
445.39
316895.23
26004549.7
26215378.2
910.24
26004549.7/100
= 1.78,
z2 = p
445.39
26215378.2/100
= 0.87.
p2 = P {Z < z2 } = 0.19.
Budui da je p2 vei od 0.01 na nivou znaajnosti = 0.01, ne moemo tvrditi da je oekivanje godinje plae djelatnika tvornice A nakon reorganizacije manje od oekivanja godinje plae
djelatnika tvornice B. Osim toga, p1 je takoer vei od 0.01, pa takvu tvrdnju ne moemo poduprijeti niti ako usporeujemo godinje plae djelatnika tvornice A prije reorganizacije s godinjim
plaama djelatnika tvornice B. Uoimo da p2 ima veu "teinu" od p1 u neodbacivanju hipoteze
H0 .
4.6
Zadaci
242
Statistika
varijabla tlak klasificira vrijednosti sistolikog i dijastolikog tlaka u tri kategorije: N - nizak tlak,
O - normalan tlak, P - povien tlak,
varijabla puls sadri broj otkucaja srca u minuti (puls) za svakog ispitanika,
varijabla opce-stanje sadri subjektivnu ocjenu (u standardnoj skali od 1 do 5) vlastitog zdravstvenog stanja svakog ispitanika.
Na temelju podataka sadranih u toj bazi rijeite sljedee zadatke.
a) Odredite tablice frekvencija i relativnih frekvencija, nacrtajte i proanalizirajte histograme
frekvencija i relativnih frekvencija te kruni dijagram s prikazom relativnih frekvencija za
podatke sadrane u varijabli opce-stanje. Kolike su frekvencija i relativna frekvencija ispitanika koji su svoje ope zdravstveno stanje ocijenili barem ocjenom 4?
Rjeenje: 39 ispitanika, tj. njih je 78% svoje ope zdravstveno stanje ocijenilo barem ocjenom 4.
b) Odredite tablice frekvencija i relativnih frekvencija za podatke sadrane u varijabli opcestanje posebno za kategoriju ispitanika enskog spola i kategoriju ispitanika mukog spola
te nacrtajte pripadne histograme frekvencija i relativnih frekvencija. Takoer, nacrtajte
histograme frekvencija i relativnih frekvencija za podatke sadrane u varijabli opce-stanje
kategorizirane po vrijednostima varijable tlak (N, O, P). Proanalizirajte dobivene histograme.
c) Odredite i ukratko protumaite sljedee numerike karakteristike podataka sadranih u
varijabli dob: aritmetiku sredinu, medijan, donji i gornji kvartil, mod, raspon i standardnu
devijaciju. Je li mod jedinstven? Koliko iznosi maksimalno odstupanje podataka sadranih
u varijabli dob od njihove aritmetike sredine? Nacrtajte i detaljno proanalizirajte kutijasti
dijagram na bazi medijana za podatke sadrane u varijabli dob. Obrazloite svoj odgovor.
Rjeenje: x50 = 40.22, xmin = 11, x025 = 23, x050 = 43, x075 = 51, xmax = 83, s50 = 17.69.
d) Nacrtajte i detaljno proanalizirajte kutijasti dijagram na bazi medijana za podatke sadrane
u varijabli dob. Obrazloite svoj odgovor.
e) Crtanjem i analizom kutijastog dijagrama na bazi medijana neosjetljivog na stree vrijednosti i kutijastog dijagrama na bazi medijana osjetljivog na stree vrijednosti donesite
zakljuak o tome pojavljuju li se meu podacima sadranima u varijabli puls stree vrijednosti ili ne. Ako ste se uvjerili u njihovo postojanje, koritenjem kategoriziranih tablica
frekvencija odredite sve prisutne stree vrijednosti meu podacima u varijabli puls. Kako
biste neutralizirali njihov utjecaj na numerike karakteristike podataka?
Rjeenje: stree su vrijednosti varijable puls 800 i 1006.
Zadatak 4.3. (glukoza.xls)
Baza podataka (glukoza.xls) za reprezentativan uzorak pacijenata jedne internistike klinike sadri
informacije o dobi (varijabla dob), koncentraciji glukoze u krvi (varijabla koncentracija) i tome
je li izmjerena koncentracija glukoze normalna ili poviena (varijabla kategorija: N - normalna
koncentracije, P - poviena koncentracija). Rijeite sljedee zadatke i sva rjeenja interpretirajte
u kontekstu promatranog problema.
a) Procijenite proporciju pacijenta promatrane klinike koji su stariji od 30 godina te proporciju
pacijenata starih barem 50 ali manje od 60 godina.
Rjeenje: proporcija je pacijenta starijih od 30 godina 90/102 = 0.88, a proporcija pacijenata
starih barem 50, ali manje od 60 godina jest 21/102 = 0.21.
Zadaci
243
b) Intervalom pozdanosti 95% procijenite proporciju pacijenata koji imaju povienu koncentraciju glukoze u krvi.
Rjeenje: [0.61, 0.79].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo koncentraciju glukoze u krvi pacijenata.
Rjeenje: x102 = 7.69, s2102 = 0.75, s102 = 2.78.
d) Intervalom pozdanosti 95% procijenite oekivanu koncentraciju glukoze u krvi pacijenata.
Rjeenje: [7.15, 8.24].
e) Moete li na nivou znaajnosti = 0.01 tvrditi da je proporcija pacijenata koji imaju
povienu koncentraciju glukoze manja od 0.8? Koji ste test koristili i zato?
Rjeenje: p = 0.0044.
f) Moete li na nivou znaajnosti = 0.05 tvrditi da je oekivana koncentracija glukoze u krvi
vea od normalne, tj. 6 mMol/L? Koji ste test koristili i zato?
Rjeenje: p = 0.
g) Moete li na nivou znaajnosti = 0.05 tvrditi da je oekivana dob pacijenata koji imaju
povienu koncentraciju glukoze u krvi vea od oekivane dobi onih koji imaju normalnu
koncentraciju glukoze? Koji ste test koristili i zato?
Rjeenje: p = 0.59.
Zadatak 4.4. (zdravlje.xls)
Baza podataka zdravlje.xls sadri neke podatke o zdravstvenom stanju reprezentativnog uzorka
stanovnika jednog mjesta:
varijable godine i spol sadre podatke o starosti u godinama i spolu ispitanika;
varijabla zdravlje sadri subjektivne ocjene vlastitog zdravstvenog stanja ispitanika;
varijabla broj-pregleda sadri informacije o ukupnom broju zdravstvenih pregleda svakog ispitanika u tekuoj kalendarskoj godini;
varijabla dodatno-zdravstveno sadri podatke o dodatnom zdravstvenom osiguranju svakog ispitanika (1 - ispitanik je dodatno osiguran; 0 - ispitanik nije dodatno osiguran);
varijabla cijena sadri cijenu u kunama najskupljeg zdravstvenog pregleda svakog ispitanika (u
tekuoj kalendarskoj godini).
Rijeite sljedee zadatke i sva rjeenje interpretirajte u kontekstu promatranog problema.
a) Procijenite proporciju stanovnika promatranog mjesta koji su svoje zdravstveno stanje ocijenili ocjenom veom od dva, ali manjom of pet.
Rjeenje: proporcija stanovnika koji su svoje zdravstveno stanje ocijenili ocjenom veom od
dva, ali manjom od pet 30/51 = 0.59.
b) Intervalom pozdanosti 97% procijenite proporciju stanovnika koji nemaju dodatno zdravstveno osiguranje.
Rjeenje: [0.59, 0.86].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo subjektivnu ocjenu zdravstvenog stanja stanovnika.
Rjeenje: x51 = 3.27, s251 = 1.36, s51 = 1.17.
d) Intervalom pozdanosti 95% procijenite oekivanu ocjenu zdravstvenog stanja stanovnika.
Rjeenje: [2.95, 3.6].
244
Statistika
Zadaci
245
varijabla doba-dana sadri doba dana u kojem je mjerenje obavljeno (P - predveerje, N - no, S
- svitanje);
varijabla svjetlost sadri tip osvjetljenja pri mjerenju;
varijabla temperatura sadri temperaturu zraka pri kojoj je mjerenje izvreno;
varijabla rel-vlaznost sadri relativnu vlanost zraka za vrijeme mjerenja.
Rijeite sljedee zadatke i sva rjeenja interpretirajte u kontekstu promatranog problema.
a) Procijenite proporciju mjerenja u kojima je izbrojeno manje od 50 mukih jedinki komaraca
te proporciju mjerenja u kojima je izbrojeno vie od 50 enskih jedinki komaraca.
Rjeenje: proporcija mjerenja u kojima je izbrojeno manje od 50 mukih jedinki komaraca
jest 202/210 = 0.962, a proporcija je mjerenja u kojima je izbrojeno vie od 50 enskih
jedinki komaraca je 39/210 = 0.186.
b) Intervalom pozdanosti 95% procijenite proporciju mjerenja u kojima je izbrojeno barem 50,
ali manje od 100 enskih jedinki komaraca.
Rjeenje: [0.022, 0.083].
c) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo temperaturu zraka tijekom jednog mjerenja.
Rjeenje: x210 = 21.89, s2210 = 6.76, s210 = 2.6.
d) Intervalom pozdanosti 97% procijenite oekivanu temperaturu tijekom jednog mjerenja.
Rjeenje: [21.51, 22.29].
e) Moete li na nivou znaajnosti = 0.05 tvrditi da je proporcija mjerenja u kojima je
izbrojeno manje od 50 mukih jedinki komaraca vea od 0.95? Koji ste test koristili i zato?
Rjeenje: p = 0.2.
f) Moete li na nivou znaajnosti = 0.01 tvrditi da je oekivani broj mukih jedinki komaraca
izbrojenih u mjerenju manji od 20? Koji ste test koristili i zato?
Rjeenje: p = 0.99.
g) Moete li na nivou znaajnosti = 0.05 tvrditi da se oekivani broj mukih jedinki komaraca
izbrojenih u jednom mjerenju razlikuje od oekivanog broja enskih jedinki izbrojenih u
jednom mjerenju? Koji ste test koristili i zato?
Rjeenje: p = 0.009.
Zadatak 4.7. (gradjevina.xls)
Baza podataka gradjevina.xls sadri neke informacije o reprezentativnom uzorku koji se sastoji od
100 srednje velikih graevinskih poduzea u jednoj tranzicijskoj zemlji:
varijabla godina_osnivanja za svako od 100 poduzea iz uzorka sadri godinu kada je poduzee
osnovano,
varijable zaposleni2007, zaposleni2008 i zaposleni2009 sadre podatke o broju zaposlenika u tih
100 poduzea u 2007., 2008. i 2009. godini,
varijabla prosjecna_starost sadri prosjecnu dob zaposlenika u 2009. godini,
varijable motivacija_placa i napredovanje redom sadre subjektivne ocjene kadrovske slube poduzea o tome u kolikoj je mjeri visina plae motivacijski faktor za uspjeno obavljanje posla te
u kolikoj mjeri uspjeno obavljanje poslovnih zadataka utjee na mogunost napredovanja
na bolje radno mjesto unutar poduzea,
246
Statistika
varijable placa2007, placa2008 i placa2009 sadre iznose prosjenih plaa zaposlenika u 2007.,
2008. i 2009. godini,
varijable troskovi2007, troskovi2008 i troskovi2009 sadre iznose trokova poduzea u 2007., 2008.
i 2009. godini,
varijable prihodi2007, prihodi2008 i prihodi2009 sadre iznose ostvarenih prihoda u 2007., 2008. i
2009. godini,
Rijeite sljedee zadatke i sva rjeenja interpretirajte u kontekstu promatranog problema.
a) Odredite tipove i pripadne skupove vrijednosti sluajnih varijabli kojima modeliramo broj
zaposlenika, njihovu prosjenu dob, prosjenu godinju plau zaposlenika u poduzeu, godinje trokove poduzea te godinje prihode poduzea.
b) Procijenite vjerojatnost da sluajno odabrano srednje veliko graevinsko poduzee u promatranoj zemlji ima vie od 50 zaposlenika u 2007., 2008. te 2009. godini?
Rjeenje: proporcije su 0.83 za 2007., 0.93 za 2008. te 0.95 za 2009. godinu.
c) Procijenite oekivanje i varijancu sluajne varijable kojom se modelira prosjena plaa zaposlenika u srednje velikom graevinskom poduzeu u toj zemlji u 2009. godini.
Rjeenje: x100 = 600.13, s100 = 194.63.
d) Kategorizirajte podatke kojima raspolaete te odluite ima li smisla modelirati prosjenu
godinju plau u 2009. godini kao normalnu sluajnu varijablu. Ako smatrate da ima, koritenjem normalne distribucije s procijenjenim vrijednostima oekivanja i varijance odredite
vjerojatnost da je u 2009. godini u sluajno odabranom poduzeu srednje veliine u toj
zemlji prosjena plaa bila via od 500 eura. Istu vjerojatnost izraunajte i koritenjem
procijenjene (empirijske) distribucije te sluajne varijable te usporedite rezultate.
Rjeenje: Iz histograma relativnih frekvencija vidimo da normalna distribucija nije prikladna
za modeliranje tih podataka, a to sugeriraju i izraunate traene vjerojatnosti: iz empirijske
distribucije te sluajne varijable, oznaimo ju s X, slijedi da je P (X > 500) = 0.66, a ako
X modeliramo kao N (600.13, 194.632 ), slijedi da je P {X > 500} = 0.3.)
e) Intervalom pouzdanosti 95 % procijenite proporciju srednje velikih graevinskih poduzea u
toj zemlji u kojima je prosjena mjesena plaa vea od aritmetike sredine plaa zabiljeenih
u varijabli placa2009.
Rjeenje: [0.343, 0.537].
f) Procijenite oekivanje, varijancu i standardnu devijaciju sluajne varijable kojom modeliramo prosjenu plau u 2009. godini.
Rjeenje: x100 = 600.13, s2100 = 37879.1, s100 = 194.63.
g) Intervalom pouzdanosti 95 % procijenite oekivanje sluajne varijable kojom se modelira
prosjena mjesena plaa zaposlenika u 2009. godini.
Rjeenje: [561.51, 638.75].
h) Moete li na razini znaajnosti = 0.05 tvrditi da je proporcija zaposlenika koji u 2009.
godini imaju plau viu od oekivane manja od 0.5? Koji ste test koristili i zato?
Rjeenje: p = 0.12.
i) Moete li na razini znaajnosti = 0.05 tvrditi da je oekivana plaa u 2009. godini vea
od 650 eura? Koji ste test koristili i zato?
Rjeenje: p = 0.012.
Zadaci
247
Poglavlje 5
Dodatak
5.1
Skup A podskup je skupa B (A B) ako je svaki element skupa A ujedno element i skupa
B.
Skup A jednak je skupu B ako je A B i B A.
Unija skupova A i B skup je A B = { : A B}.
Presjek skupova A i B skup je A B = { : A B}.
Razlika skupova A i B skup je A \ B = { : A
/ B}.
Simetrina razlika skupova A i B skup je A4B = (A B) \ (A B) = (A \ B) (B \ A).
Komplement skupa (dogaaja) A skup je AC = { :
/ A} kojeg nazivamo suprotan
dogaaj dogaaja A.
Komplement prostora elementarnih dogaaja jest prazan skup, tj. C = . Cijeli prostor
elementarnih dogaaja nazivamo siguran dogaaj, a njegov komplement nemogu
dogaaj.
Konana unija skupova (dogaaja) A1 , A2 , . . . An skup je
A1 A2 . . . An =
n
[
Ai = { : A1 A2 . . . An } =
i=1
= { : i {1, 2, . . . , n} t.d. Ai }.
Konaan presjek skupova (dogaaja) A1 , A2 , . . . An skup je
A1 A2 . . . An =
n
\
Ai = { : A1 A2 . . . An } =
i=1
= { : Ai , i {1, 2, . . . , n}}.
Osnovna svojstva skupovnih operacija
249
250
AB =BA
AB =BA
(A B) C = A (B C)
(A B) C = A (B C)
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
(A B)C = AC B C
(A B)C = AC B C
Komutativnost
Asocijativnost
Distributivnost
De Morganovi zakoni
5.2
251
Dodatak
n!
.
(n r)!
Primjer 5.2. Neka je A skup koji se sastoji od deset elemenata. Svaka ureena trojka elemenata
skupa A jedna je varijacija treeg razreda skupa A. Takvih varijacija ima
3
V10
=
10!
= 720.
(10 3)!
Definicija 5.2. Svaku ureenu n-torku skupa od n elemenata zovemo permutacija. Broj je
permutacija n-lanog skupa
pn = Vnn = n (n 1) . . . 2 1 = n!.
Napomena 5.1. Permutacija je u n-lanom skupu svaka varijacija n-tog razreda tog skupa,
odnosno permutacija n-lanog skupa svaka je bijekcija tog skupa na samog sebe.
Primjer 5.3. Ako se pitamo na koliko naina pet ljudi moe stati u red, zapravo se pitamo koliko
permutacija ima peterolani skup. Broj je permutacija peterolanog skupa V55 = 5! = 120.
Definicija 5.3. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata i neka je r N,
r n. Kombinacija r-tog razreda u skupu A svaki je r-lani podskup skupa A. Broj je
kombinacija r-tog razreda skupa od n elemenata
!
n!
n
r
.
Cn =
=
r
r! (n r)!
Primjer 5.4. U razredu ima 15 djeaka i 10 djevojica. Na primjer:
Tri djeaka moemo odabrati na onoliko naina koliko ima razliitih kombinacija treeg
razreda skupa od 15 elemenata, dakle na
15
3
C15
=
3
naina.
Prema principu produkta slijedi da tri djeaka i dvije djevojice moemo odabrati na
15 10
3
2
C15
C10
=
3
2
naina.
Jednak broj djeaka i djevojica moemo odabrati na
10
X
k=1
k
k
C15
C10
=
10
X
15
10
k
k
k=1
naina.
Definicija 5.4. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata. Varijacija s
ponavljanjem r-tog razreda skupa od n-elemenata svaka je ureena r-torka elemenata iz
skupa A. Broj je takvih varijacija s ponavljenjem nr .
252
Ponovljeni red
Primjer 5.5. Ako se pitamo koliko ima binarnih nizova (nizova iji su elementi samo nule i jedinice), zapravo se pitamo koliko ima razliitih varijacija sedmog razreda s ponavljanjem dvolanog
skupa. Takvih varijacija s ponavljanjem ima 27 = 128.
Definicija 5.5. Neka je A = {a1 , . . . an } skup koji se sastoji od n elemenata. Permutacija s
ponavljanjem r-tog razreda svaka je ureena r-torka elemenata iz skupa A meu kojima je n1
elemenata meusobno jednakih, n2 elemenata meusobno jednakih, . . . , nk elemenata meusobno
jednakih, pri emu je n1 + n2 + . . . + nk = r. Broj je takvih permutacija s ponavljenjem
n ,n2 ,...,nk
Pr 1
r!
.
n1 ! n2 ! . . . nk !
Primjer 5.6. Ako nas zanima koliko se razliitih rijei, smislenih i besmislenih, moe napisati
od slova rijei "matematika", tada nas zapravo zanima broj permutacija s ponavljanjem desetog
razreda, pri emu imamo tri slova A, dva slova M i dva slova T. Takvih permutacija s ponavljanjem
ima
10!
3,2,2
P10
=
= 151200.
3! 2! 2!
Dakle, od slova rijei "matematika" moe se napisati ukupno 151200 razliitih rijei.
5.3
Ponovljeni red
U diskretnoj je teoriji vjerojatnosti esta potreba za raunanjem sume tzv. ponovljenog reda1 . Da
bismo pojasnili razliku izmeu ponovljenog reda i obinog reda, podsjetimo se da je red ureeni
par dvaju nizova ((an ), (sn )) od kojih drugi niz nastaje sumiranjem prvih n lanova prvog niza,
tj.
sn = a1 + a2 + . . . an .
Pritom kaemo da red konvergira ako konvergira niz parcijalnih suma (sn ) [13].
Ponovljeni red nastaje tako da prvo napravimo jednu particiju2 skupa prirodnih brojeva (Mi , i N)
pa posebno zbrojimo one lanove niza iji indeksi pripadaju u Mi , a zatim sve tako dobivene sume,
ako takve sume postoje.
Primjer 5.7. Neka je zadan geometrijski red s kvocijentom
n
X
1
i=1
1
1
i prvim lanom , tj.
2
2
Taj red konvergentan je i suma mu je 1. Isti rezultat dobit emo ako podijelimo skup indeksa N na
parne i neparne brojeve, tj. ako promatramo particiju {N, P } skupa prirodnih brojeva, pri emu
je
N = {2n 1 : n N}, P = {2n : n N}.
1 Pod
2 Familija
1. Mi A, i N,
2. Mi Mj = za sve i 6= j,
S
3.
Mi = A.
iN
253
Dodatak
1
X
X 1
1
2
=
=
2n
22n1
1
n=1
nN
1
X
X 1
1
4
=
=
2n
22n
1
n=1
nP
1
4
1
4
2
,
3
1
.
3
Oito vrijedi:
X 1
X 1
X 1
2
1
=
+
= + = 1.
n
n
2
2
2n
3
3
nN
nP
nN
Za zadavanje ponovljenog reda treba nam niz (an ) i particija skupa N: {Mi , i N}. Ako za svaki
P
i N konvergiraju redovi
aj i sume im oznaimo
jMi
Ai =
aj ,
jMi
aj =
iN jMi
Ai .
iN
A=
a31 a32 a33 a34 . . . .
..
..
..
..
.
.
.
.
Takve matrice esto koristimo za zadavanje ponovljenih redova s obzirom da se particije skupa N
esto mogu lake prikazati koritenjem dvaju indeksa. Iz beskonane matrice moemo definirati
mnogo ponovljenih redova. Navedimo nekoliko primjera:
Sumirajmo prvo lanove matrice po redovima:
Ai =
aij .
j=1
Ako te sume postoje, tj. ako je Ai < , i N, moemo definirati ponovljeni red
X
aij .
i=1 j=1
aij .
i=1
Ako te sume postoje, tj. ako je Aj < , j N, moemo definirati ponovljeni red
X
X
j=1 i=1
aij .
254
Ponovljeni red
Osim zbrajanja po stupcima ili recima, moemo particiju praviti i na druge naine, npr.
po pavilima koji su slikovito prikazani u sljedeoj matrici:
S obzirom da se iz istog niza (an ) brojeva moe definirati mnogo razliitih ponovljenih redova,
pitanje je koliko se toga u konanici "preslagivanjem" mijenja. Npr. ako jedan ponovljeni red
konvergira, moe li se "preslagivanjem" dogoditi da novonastali ponovljeni red ne konvergira, moe
li se uope definirati ponovljeni red za bilo koju particiju skupa indeksa, itd. Da tako postavljena
pitanja imaju smisla, potvruje sljedei primjer:
Primjer 5.9. Neka je zadana beskonana realna matrica
0 1 1 1 1 1
1 0 1 1 1 1
A = 1 1 0 1 1 1
1 1 1 0 1 1
. . . . . .
.. .. .. .. .. ..
...
...
...
.
...
Svi redovi koji nastaju sumiranjem elemenata iz jednog retka te matrice divergentni su, tj. za
svaki i N divergentni su redovi
X
aij .
j
Dakle, ponovljeni red ne moe se definirati tako da se prvo sumira po redovima zadane beskonane
matrice. Slino vrijedi i ako se prvo sumira po stupcima. Meutim, ako particiju pravimo po bilo
kojoj od dviju shema oznaenih u matricama:
vidimo da sume uvijek postoje. Dakle, ponovljene redove po tim particijama moemo definirati.
Sljedei teorem daje nune i dovoljne uvjete koji jame da se "preslagivanjem" nee promijeniti
suma ponovljenog reda.
Teorem 5.2. Neka je s (an , n N) dan niz realnih brojeva i neka je {Mi , i N} jedna particija
skupa prirodnih brojeva. Red
X
|an |
nN
255
Dodatak
konvergira onda i samo onda ako konvergira red
X X
|aj |.
iN jMi
|aj |
iN jMi
nN
je njegov niz parcijalnih suma ogranien realnim brojem L. Dakle, i taj red konvergentan je
(pogledati npr. [13]). Nadalje, s obzirom da je apsolutno konvergentan red realnih brojeva ujedno
P
i konvergentan (pogledati npr. [13]), slijedi da je i red
an konvergentan.
nN
|an |
nN
i njegovu sumu oznaimo s L. Tada za svaki element Mi particije skupa prirodnih brojeva pripadni
red
X
|aj |
jMi
predstavlja red realnih brojeva s pozitivnim lanovima iji je niz parcijalnih suma ogranien. Dakle,
za svaki je i N takav red konvergentan. Oznaimo:
X
|aj | = Ai , i N.
jMi
Dokaimo da i red
X
Ai
iN
A1 + A2 + An = lim
i=1
"
= lim
b1i + lim
l
X
l
X
b2i + + lim
i=1
b1i + +
i=1
l
X
l
X
bni
i=1
#
bni < L.
i=1
Dakle, red s pozitivnim lanovima ogranien je, pa je time i konvergentan. Oznaimo njegovu
sumu V . Oigledno je da je i V L s obzirom da je L gornja mea pripadnog niza parcijalnih
k
P
suma. Pokaimo da je istovremeno i V L. Naime, za svaku k-tu parcijalnu sumu reda
|ai |
i=1
Ai
k
X
|ai |.
i=1
256
Ponovljeni red
Teorem 5.3. Neka je s (an , n N) dan niz realnih brojeva i neka je {Mi , i N} jedna particija
skupa prirodnih brojeva. Ako jedan od redova
X
X X
|an |,
|aj |
iN jMi
nN
X X
an ,
aj
iN jMi
nN
i sume su im iste.
Dokaz. Koristei prethodni teorem i injenicu da je apsolutno konvergentan red realnih brojeva
ujedno i konvergentan, da bismo dokazali tvrdnju teorema dovoljno je dokazati da konvergencija
P
P P
reda
|an | povlai konvergenciju reda
aj te da je tada
iN jMi
nN
an =
X X
aj .
iN jMi
nN
nN
nN
V =
an .
nN
jMi
aj konvergentan. Oznaimo:
jMi
aj = Ai .
jMi
Slino kao u dokazu prethodnog teorema, za svaki i N definirajmo odgovarajui podniz (bik , k
N) niza (aj , j N) koji ine elementi s indeksima iz Mi , tj.
X
bik = Ai .
kN
Uoimo da je tako nastali skup podnizova od (aj , j N) pokupio sve njegove lanove te da se niti
jedan lan ne pojavljuje vie od jednom.
P
Iz apsolutne konvergencije reda
an znamo da za svaki > 0 postoji k0 N takav da je
nN
|aj | < ,
j=k0 +1
odakle slijedi da je
X
k0
X
X
V
a
=
a
|aj | < .
j
j
j=k0 +1 j=k0 +1
j=1
Neka su n0 i l0 dovoljno veliki prirodni brojevi da izraz
n0 X
l0
X
i=1 k=1
bik
k0
X
j=1
aj
(5.1)
257
Dodatak
predstavlja sumu lanova reda
jN
vrijedi:
X
k0
l
X
n X
bik
aj < ,
i=1 k=1
j=1
pa prijelazom na limes po l vidimo da je
X
k0
X
n
A
a
i
j < .
i=1
j=1
Koristei prethodnu nejednakost i nejednakost (5.1) vidimo da je
n
X
A
V
< 2, n > n0 ,
i
i=1
Dakle, red
P P
iN jMi
aj konvergira i suma mu je V .
Literatura
[1] Anderson, T.W. An introduction to Multivariante Statistical Analysis, J. Wiley, 1958.
[2] Bain, L.E, Engelhardt, M. Introduction to Probability and Mathematical statistics,
Duxbury, 2009.
[3] Cohn, D.L. Measure Theory, Birkhuser, Boston-Basel-Stuttgart, 1980.
[4] Chow, Y.S, Teicher, H. Probability Theory, Spronger, New York-Heidelberg-Berlin, 1978.
[5] Daniel, W.W., Terrell, J.C. Business Statistics, Houghton Mifflin Company, Boston,
1989.
[6] Durrett, R. Probability: Theory and Examples, Duxbury Press, 1995.
[7] Elezovi, N. Diskretna vjerojatnost, Element, Zagreb, 2007.
[8] Elezovi, N. Sluajne varijable, Element, Zagreb, 2007.
[9] Elezovi, N. Statistika i procesi, Element, Zagreb, 2007.
[10] Glii, Z., Perunii, P. Zbirka reenih zadataka iz verovatnoe i matematike statistike,
Nauna knjiga, Beograd, 1982.
[11] Ilijaevi, M., Paue, . Rijeeni primjeri i zadaci iz vjerojatnosti i statistike, "Zagreb",
Samobor, 1990.
[12] Ivanovi, B. Teorijaska statistika Jugoslavenski institut za ekonomska istraivanja, Beograd,
1966.
[13] Juki, D., Scitovski, R. Matematika I, Elektrotehniki fakultet, Odjel za matematiku,
Prehrambeno tehnoloki fakultet, Osijek, 2000.
[14] Juki, D Uvod u teoriju mjere i integracije - prvi dio, Odjel za matematiku, Osijek, 2008.
[15] Ivkovi, Z.A. Matematika statistika, Nauna knjiga, Beograd, 1976.
[16] Jamnik, R. Matematina statistika, Dravna zaloba Slovenije, Ljubljana, 1980.
[17] Javor, P. Uvod u matematiku analizu, kolska knjiga, Zagreb, 1988.
[18] Lehmann, E.L. Testing Statistical Hypotheses, J. Wiley, 1959.
[19] Lozanov-Crvenkovi, Z., Rajter, D. Zbirka reenih zadataka iz verovatnoe i statistike,
Prirodno-matematiki fakultet, Novi sad, 1999.
[20] Malii, J. Zbirka zadataka iz teorije verovatnoe sa primenama, Graevinska knjiga, Beograd, 1990.
259
260
[21] Mittelhammer, R.C. Mathematical Statistics for Economics and Bussines, Springer, New
York, 1996.
[22] Paue, . Uvod u matematiku statistiku, kolska knjiga, Zagreb, 1993.
[23] Paue, . Vjerojatnost, informacija, stohastiki procesi, kolska knjiga, Zagreb, 1988.
[24] Pavli, I. Statistika teorija i primjena, Tehnika knjiga, Zagreb, 1985.
[25] Pogny, T. Teorija vjerojatnosti, zbirka rijeenih ispitnih zadataka, Odjel za pomorstvo
Sveuilita u Rijeci, Rijeka, 1999.
[26] Sarapa, N. Teorija vjerojatnosti, kolska knjiga, Zagreb, 1988.
[27] Sarapa, N. Vjerojatnost i statistika I. dio: osnove vjerojatnosti - kombinatorika, kolska
knjiga, Zagreb, 1995.
[28] Sarapa, N. Vjerojatnost i statistika II. dio: osnove statistike - sluajne varijable, kolska
knjiga, Zagreb, 1996.
[29] Seber G.A.F, Lee A.J. Linear Regression Analysis, Wiley, Hoboken-New Jersey, 2003.
[30] Triola, M.F. Elementary Statistics, The Benjamin/Cummings Publishing company, Inc.
1989.
[31] Vrani, V. Vjerojatnost i statistika, Tehnika knjiga, Zagreb, 1971.
[32] Vranjkovi, P. Zbirka zadataka iz vjerojatnosti i statistike, kolska knjiga, Zagreb, 1990.
Indeks
-algebra skupova, 8
partitivni skup, 11
trivijalna, 11
-subaditivnost vjerojatnosti, 16
ebievljeva nejednakost, 90
Aksiomi vjerojatnosti, 11
Aritmetika sredina
podataka, 192
sluajnih varijabli X1 , . . . Xn , 166
Jedinka, 181
Jednako distribuirane sluajne varijable, 135
Jednostavna linearna regresija, 206
Jednostavni sluajni uzorak, 201
Bayesova formula, 38
Bernoullijeva shema, 167
Centralni granini teorem, 169
Distribucija
diskretne sluajne varijable, 57
diskretnog sluajnog vektora, 133
uvjetna, 142
Dogaaj, 4, 11
Familija dogaaja, 8
Formula potpune vjerojatnosti, 36
Frekvencija
dogaaja, 7
kategorije kvalitativne varijable, 186
kumulativna, 190
Funkcija distribucije
diskretne sluajne varijable, 66
empirijska, 215
neprekidne sluajne varijable, 67
sluajne varijable, 63
sluajnog vektora, 130
Funkcija gustoe
dvodimenzionalnog sluajnog vektora, 148
marginalna, 149
sluajne varijable, 61
Funkcija jakosti testa, 228
Kategorija
kvalitativne varijable, 182
numerike varijable, 184
Koeficijent korelacije, 157
Kombinacija
r-tog razreda, 251
Komplement skupa, 249
Korelacijska matrica sluajnog vektora, 160
Kovarijanca, 154
Kritino podruje, 227
Kruni dijagram
frekvencija, 186, 189
relativnih frekvencija, 186, 189
Kutijasti dijagram, 196
Kvartil
donji, 194
gornji, 194
Maksimalno odstupanje podataka od aritmetike
sredine, 194
Maksimum podataka, 194
Marginalne distribucije
dvodimenzionalnog diskretnog sluajnog vektora, 134
Matematiko oekivanje
diskretne sluajne varijable, 85
261
262
dvodimenzionalnog sluajnog vektora, 160
neprekidne sluajne varijable, 99
Matrica kovarijanci sluajnog vektora, 160
Medijan
podataka, 193
Minimum podataka, 194
Mod podataka, 195
Modeliranje vjerojatnosti
klasian pristup, 4
statistiki pristup, 6
Moment
r-ti apsolutni diskretne sl. var., 89
r-ti centralni diskretne sl. var., 89
r-tog reda diskretne sl. var., 89
centralni reda (k, l), 154
ishodini reda (k,l), 154
korelacijski, 154
Monotonost
vjerojatnosti, 13
Multinomna distribucija, 138
Nekorelirane sluajne varijable, 156
Nezavisnost
diskretnih sluajnih varijabli, 145
dvaju dogaaja, 33
familije dogaaja, 33
sluajnih varijabli, 161
Nivo signifikantnosti testa
pogledati razina znaajnosti testa, 230
Niz nezavisnih i jednako distribuiranih sluajnih
varijabli (n. j. d. niz), 165
Normalan sluajni vektor
dvodimenzionalan, 148
marginalne distribucije, 149
uvjetne distribucije, 151
Numerike karakteristike
podataka, 192
sluajne varijable, 85
Oekivanje
pogledati matematiko oekivanje, 85
Parametarske distribucije, diskretne, 69
Bernoullijeva, 70
binomna, 71
diskretna uniformna, 69
geometrijska, 76
hipergeometrijska, 77
Poissonova, 73
Parametarske distribucije, neprekidne, 78
dvostrana eksponencijalna, 81
eksponencijalna, 80
normalna ili Gaussova, 82
uniformna, 78
Permutacija, 251
s ponavljanjem, 252
Podskup, 249
Pogreka
drugog tipa, 227
prvog tipa, 227
Pokus
deterministiki, 2
sluajan, 3
Ponovljeni red realnih brojeva, 252
Populacija, 181
Postotna vrijednost podataka
dvadeset pet postotna, 194
pedeset postotna, 194
sedamdeset pet postotna, 194
Potpun sustav dogaaja, 35
Pouzdani interval, 220
za procjenu oekivanja, 221
za procjenu proporcije, 224
Presjek skupova, 249
Princip
jednakosti, 250
produkta, 250
sume, 250
Prostor elementarnih dogaaja, 2
Raspon podataka, 194
Razina znaajnosti testa, 230
Razlika skupova, 249
simetrina, 249
Relativna frekvencija
dogaaja, 7
kategorije kvalitativne varijable, 186
Skup elementarnih dogaaja
vidi prostor elementarnih dogaaja, 2
Slabi zakon velikih brojeva, 164
Slika
diskretne sluajne varijable, 57
dvodimenzionalnog diskretnog sluajnog vektora, 134
263
Sluajna varijabla
diskretna, 55
neprekidna, 60
Sluajni interval, 220
Sluajni uzorak
pogledati pod model jednostavnoga sluajnog uzorka, 201
Sluajni vektor, 130
diskretan dvodimenzionalan, 132
neprekidan dvodimenzionalan, 148
Standardizacija sluajne varijable, 103
Standardna devijacija
podataka, 195
sluajne varijable, 91
Statistika hipoteza, 226
alternativna hipoteza, 227
nul-hipoteza, 227
Statistika stabilnost relativnih frekvencija, 8
Statistiki model, 201
jednostavnoga sluajnog uzorka, 201
neparametarski, 214
parametarski, 202
Statistika, 226
Strea vrijednost, 197
Stupasti dijagram
distribucije diskretne sluajne varijable, 59
Stupasti dijagram
frekvencija, 186, 189
relativnih frekvencija, 186, 189
Sylvesterova formula, 16
Tablica distribucije, 57
diskretne sluajne varijable, 57
dvodimenzionalnoga diskretnog sluajnog
vektora, 134
Teorem o uzastopnom prebrojavanju, 250
Transformacija sluajne varijable, 103
bijektivna diskretne sl. var., 105
bijektivna neprekidne sl. var., 106
nebijektivna, 108
standardizacija, 103
Unija skupova, 249
Uvjetna distribucija
dvodimenzionalnoga diskretnog sluajnog
vektora, 143
Uvjetna gustoa sluajne varijable, 151
Uvjetna vjerojatnost
uz uvjet da se dogodio dogaaj A, 31
Uvjetno oekivanje, 151
Uzorak, 181
realizacija sluajnog uzorka, 201
reprezentativan, 181
sluajni, 182
Varijabla, 181
numerika diskretna, 183
numerika kontinuirana, 183
Varijacija
r-tog razreda, 251
r-tog razreda s ponavljanjem, 251
Varijanca
diskretne sluajne varijable, 89
neprekidne sluajne varijable, 100
podataka, 195
Vjerojatnosni prostor, 12
diskretan, 22
induciran sluajnom varijablom, 58
Vjerojatnost
aksiomatski definirana, 11
na diskretnom , 21
na skupovima R2 i R3 , 29
na skupu R, 25
odreena klasinim pristupom, 5
odreena statistikim pristupom, 7
praznog skupa, 13
suprotnog dogaaja, 12
unije dogaaja, 15
Zakon razdiobe
vidi tablica distribucije, 57