Professional Documents
Culture Documents
Sumele sunt date n Euro: 150 175 195 200 235 240 250 256 275 294 Se cere: a) s se calculeze suma medie de bani existent ntr-un cont i s se testeze proprietile mediei; b) s se calculeze indicatorii medii de poziie; c) s se caracterizeze gradul de omogenitate al seriei.
Analiza statistic a seriilor de distribuie
xi
10
(x i x) = 0
10
(A)
xi = n x x i = 10 x 2270 = 10 227 ( xi a)
n
n
(A)
4)
x ' = i=1
10
=xa
a0
( x i 5)
(A)
5)
xi i =1 h x x' = = n n
h { 0, 1}
(A)
b) Indicatorii medii de poziie sunt: mediana, decile, quartile, centile i modul. Mediana Pentru calculul medianei valorile xi trebuie ordonate cresctor. (sunt, din ipotez) Seria are numr par de termeni (10 termeni), deci mediana este media aritmetic a celor doi termeni centrali:
Me = 235 + 240 = 237,5 Euro 2
Deci, n 50% din conturi sunt mai puin de 237,5 Euro, iar n 50% din conturi sunt peste 237,5 Euro. Quartila 1: - se determin locul quartilei 1:
n + 1 11 = = 2,75 deci Q1 va fi media aritmetic simpl a termenilor 2 i 3 4 4 x + x 3 175 + 195 Q1 = 2 = = 185 Euro 2 2 L Q1 :
n 25% din conturi sunt sub 185 Euro, iar n 75% din conturi sunt peste 185 Euro. Quartila 2 = Me Quartila 3: - se determin locul quartilei 3:
3 33 L Q3 : ( n + 1) = = 8,25 deci Q3 se gsete ntre termenii 8 i 9. 4 4 x + x 9 256 + 275 Q3 = 8 = = 265,5 Euro 2 2
n 75% din conturi sunt sub 265,5 Euro, iar n 25% din conturi sunt peste 265,5 Euro. Decila 1: - se determin locul decilei 1:
1 11 ( n + 1) = = 1,1 deci D1 se afl ntre primul i al doilea termen 10 10 x + x 2 150 + 175 325 D1 = 1 = = = 162,5 Euro 2 2 2 L D1 :
n 10% din conturi sunt sub 162,5 Euro, iar n 90% din conturi sunt peste 162,5 Euro. Celelalte decile se calculeaz n mod analog. Analiza statistic a seriilor de distribuie Modul este valoarea cea mai des ntlnit. Fiind serie simpl i neavnd date care s se repete, seria nu are mod. c) Gradul de omogenitate al seriei se apreciaz ci coeficienii de variaie (v, v).
45,68 100 = 20,12% 227 x d 37,6 v' = 100 = 100 = 16,56% 227 x v= 100 = = 2 = 2086,889 = 45,68 2 = i=1
(x i x)
10
10
= 2086,889
Deoarece v, v < 35%, apreciem c seria este omogen, variaia este mic, media este reprezentativ. d) n acest caz, variaia nefiind continu se poate utiliza un grafic prin coloane:
Scara de reprezentare: 1 cm OY = 20 Euro Rezultatele obinute cu ajutorul programului EXCEL sunt: Numr operaiuni MEAN STANDARD ERROR MEDIAN MODE STANDARD DEVIATION SAMPLE VARIANCE KURTOSIS SKEWNESS RANGE MINIMUM MAXIMUM SUM COUNT 227 14,446 237,5 45,68248 2086,889 -0,80501 -0,28987 144 150 294 2270 10
2. Distribuia salariailor unui magazin n funcie de numrul de zile de concediu de odihn dintr-un an se prezint astfel: Zile concediu 14 15 16 17 18 19 20 Nr. salariai 2 6 10 15 8 5 4 Se cere: a) s se reprezinte grafic seria; b) s se calculeze indicatorii tendinei centrale; c) s se calculeze indicatorii sintetici ai variaiei; d) s se caracterizeze gradul de asimetrie; e) s se calculeze media i dispersia caracteristicii salariai care au avut un numr de zile de concediu mai mare sau egal cu 17. xi = numrul zilelor de concediu ni = numrul de salariai (frecvenele absolute) a) Seria se reprezint grafic prin diagrama prin bastoane sau diagrama prin coloane nelipite centrate pe variante: Rezolvare: Notm cu:
Scara de reprezentare: 1 cm OX = 1 zi; 1 cm OY = 2 salariai b) Indicatorii tendinei centrale sunt: b1) Media se calculeaz ca o medie aritmetic ponderat:
x=
i =1 7
xini
i =1
ni
14 2 + 15 6 + 16 10 + 17 15 + 18 8 + 19 5 + 20 4 = 50
Se cumuleaz cresctor frecvenele absolute (ni): ni cumulate xi ni cresctor 14 2 2 15 6 8 16 10 18 17 15 33 18 8 41 19 5 46 20 4 50 Deci 50% dintre salariai au avut sub 17 zile concediu, iar 50%, peste 17 zile. b3) Qurtilele:
L Q1 : 1 ( n i + 1) = 1 51 = 12,75 Q1 = 16 zile 4 4
Deci 25% dintre salariai au avut sub 16 zile concediu, iar 75% peste 16 zile. Q2 = Me
3 3 L Q3 : ( n i + 1) = 51 = 38,25 < 41 Q 3 = 18 zile 4 4
Deci, 75% dintre salariai au avut sub 18 zile concediu, iar 25% peste 18 zile. b4) Decilele:
L D1 : 1 51 ( n i + 1) = = 5,1 < 8 D i = 15 zile 10 10
Deci, 10% dintre salariai au avut sub 15 zile concediu, iar 90% peste 15 zile. Restul decilelor, D2, , D9 se calculeaz n mod similar. b5) Modul (dominanta unei serii) Modul este, n cazul gruprii pe variante, acea valoare a caracteristicii creia i corespunde frecvena absolut maxim. Frecvena absolut (ni) maxim este 15 Mo = 17 zile. Cei mai muli salariai au avut 17 zile de concediu. c) Indicatorii sintetici ai variaiei sunt: - abaterea medie liniar:
d = i=1
xi x ni
i =1
ni
50
+ =
Numrul de zile de concediu a unui salariat se abate n medie de la numrul mediu de zile de concediu cu 1,1728 zile. - dispersia:
i =1
(x i x)
7 i =1
ni =
ni
50
+ +
Numrul de zile de concediu a unui salariat se abate n medie de la numrul mediu de zile de concediu cu 1,5226 zile. - coeficientul de variaie:
v= v' = x d x 100 = 100 = 1,5226 100 = 8,93% 17,04 1,1728 100 = 6,88% 17,04
Deoarece v, v Analiza seria este omogen, variaia este mic, media este reprezentativ. 35% statistic a seriilor de distribuie d) Aprecierea asimetriei:
Cas = x Mo 17,04 17 = = 0,026 1,5226
Deoarece Cas > 0 avem asimetrie pozitiv sau de stnga, adic mediana i modul se gsesc n stnga mediei pe grafic, deci n aceast serie predomin valorile mici ale caracteristicii. Cas [-0,3; 0,3] seria este uor asimetric (Cas este foarte apropiat de zero). e) Avem o caracteristic alternativ: - salariai care au avut un concediu 17 zile; - salariai care au avut un concediu < 17 zile.
Varianta DA (peste 17 zile) NU (sub 17 zile) Total xi 1 0 Frecvenele absolute ni m = 32 n m = 18 n = 50
3. Un studiu efectuat asupra unui numr de 50 de cutii de brnz topit la cutie dintr-un magazin a reliefat urmtoarele informaii cu privire la numrul de calorii coninute: Calorii 75-85 85-95 95-105 105-115 115-125 Nr. cutii cu 5 10 15 14 6 brnz topit Se cere: a) s se reprezinte grafic seria; b) s se calculeze indicatorii tendinei centrale; c) s se aprecieze omogenitatea seriei; d) s se caracterizeze gradul de asimetrie; e) s se calculeze media i dispersia caracteristicii cutii de brnz care au sub 95 de calorii. Rezolvare: Se observ c avem o serie de repartiie de frecven pe intervale egale. Notm cu: xi = numrul de calorii ni = numrul de cutii de brnz topit a) Seria se reprezint grafic prin: - histogram; - poligonul frecvenelor; - ogiv. Histograma: Poligonul frecvenelor: - pe axa OX se reprezint caloriile - pe axa OY se reprezint numrul de cutii
1 cm OX = 10 calorii 1 cm OY = 5 cutii Ogiva (diagrama frecvenelor cumulate): Pentru a construi ogiva trebuie s calculm frecvenele cumulate cresctor i descresctor:
Calorii Nr. cutii Numr cutii cumulate
Scara de reprezentare:
ni 5 10 15 14 6 50
cresctor 5 15 30 44 50 -
descresctor 50 45 35 20 6 -
- pe axa OX se reprezint caloriile (xi) Analiza statistic frecvenele absolute - pe axa OY se reprezint a seriilor de distribuie cumulate
ogiva cresctoare
ogiva descresctoare
Scara de reprezentare:
1 cm pe OX = 10 calorii 1 cm pe OY = 10 cutii
b) Indicatorii tendinei centrale sunt: b1) Media se calculeaz ca o medie aritmetic ponderat xi reprezint centrul de interval calculat ca medie aritmetic simpl ntre limita inferioar i limita superioar a fiecrui interval:
x = i =1
xini
i =1
ni
Se cumuleaz frecvenele absolute i se determin care frecven absolut este imediat mai mare sau egal cu LMe. Intervalul care corespunde frecvenei absolute cumulate ce ndeplinete condiia de mai sus este intervalul median. Me se calculeaz cu relaia:
Me = x 0 + h L Me n pMe 25,5 15 = 95 + 10 = 102 calorii n Me 15
x0 = limita inferioar a intervalului median; h = mrimea intervalului; npMe = suma frecvenelor absolute pn la intervalul median; nMe = frecvena absolut a intervalului median. Deoarece Me = 102 calorii 50% din cutii au sub 102 calorii, iar 50% au peste 102 calorii. b3) Quartilele:
1 ( n i + 1) = 1 51 = 12,75 < 15 Q1 [85, 95] 4 4 L Q1 n pQ1 12,75 5 Q1 = x 0 + h = 85 + 10 = 92,75 calorii n Q1 10 L Q1 : n pQ1 = suma frecvenelor absolute pn la intervalul lui Q1; n Q1 = frecvena absolut a intervalului n care se gsete Q1.
Deoarece Q1 = 92,75 calorii 25% dintre cutii au sub 92,75 calorii, iar 75% dintre cutii au peste 92,75 calorii.
3 ( n i + 1) = 3 51 = 38,25 < 44 Q 3 [105, 115] 4 4 L Q3 n pQ3 38,25 30 Q3 = x 0 + h = 105 + 10 = 110,89 calorii n Q3 14 L Q3 :
Deci 75% dintre cutii au sub 110,89 calorii, iar 25% au peste 110,89 calorii. b4) Decilele:
1 ( n i + 1) = 1 51 = 5,1 < 15 D1 [85, 95] 10 10 L D1 n pD1 5,1 5 D1 = x 0 + h = 85 + 10 = 85,1 calorii n D1 10 L D1 :
Deci 10% dintre cutii au sub 85,1 calorii, iar 90% peste 85,1 calorii. Celelalte decile: D2, , D9 se calculeaz pe baza aceluiai procedeu. b5) Modul (dominanta seriei):
Mo = x 0 + h
x0 = limita inferioar a intervalului modal; h = mrimea intervalului modal; 1 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a intervalului anterior celui modal; 2 = diferena dintre frecvena absolut a intervalului modal i frecvena absolut a intervalului urmtor celui modal. Intervalul modal este intervalul cruia i corespunde frecvena absolut maxim. Deci Mo [95, 105]. Deoarece Mo = 103,33 calorii, rezult c cele mai multe dintre cutii au 103,33 calorii. c) Omogenitatea seriei se apreciaz cu ajutorul coeficientului de variaie:
v=
(x i x)
5 i =1
ni =
ni
6728 = 134,56 50
Deoarece v < 35% seria este omogen, variaia este mic, media este reprezentativ. d) Gradul de asimetrie:
Cas = x Mo 101,2 103,33 = = 0,18 11,6
Deoarece Cas < 0 seria prezint o asimetrie negativ sau de dreapta, deci pe grafic mediana i modul se gsesc n dreapta mediei, ceea ce nseamn c predomin cutiile de brnz cu multe calorii. Cas [-0,3; 0,3] seria este uor asimetric. e) Avem o caracteristic alternativ: - cutii care au sub 95 calorii; - cutii care au peste 95 calorii.
Varianta DA (sub 95 calorii) NU (peste 95 calorii) Total xi 1 0 Frecvenele absolute ni m = 15 n m = 35 n = 50
b) c) d) e)
s se verifice regula de adunare a dispersiilor; s se verifice dac factorul de grupare vechimea n munc este semnificativ; s se caracterizeze gradul de omogenitate pe fiecare grup de vechime i pe total; s se verifice regula de adunare a dispersiilor pentru caracteristica salariai cu salariul peste 800 RON.
Rezolvare: Notm cu: xi = vechimea i = 1,2 ; j = 1,5 ; yj = salariul ni = numrul de salariai din grupa de vechime i; nj = numr de salariai din grupa de salarii j; nij = numr de salariai din grupa de vechime i i avnd salariul n grupa j. a) Calculul mediilor pe fiecare grup de vechime:
y j n ij
yi =
j=1
n ij
j=1
y j n1 j
y1 =
j=1
n1j
j=1
y j n2j
y2 =
j=1
n2j
j=1
yj nj
y=
j=1
nj
j=1
yj nj
y=
j=1
nj
j=1 5
(y j yi )
=
j=1
n ij
n ij
j=1
( y j y1 )
5 j=1 5 j=1
i = 1:
n1 j =
n1j
55
i = 2:
n2j =
2 2
n2j
45
ni
( y i y)
2 i =1
ni =
ni
Dispersia total:
2 =
( y j y)
5 j=1
nj =
nj
j=1
c) Aprecierea dac factorul de grupare este semnificativ se face cu ajutorul gradului de determinaie:
R2/x = y 2
2
100 =
Deoarece
R2/x y
nu este semnificativ, el influennd doar n proporie de 39,95% variaia salariului, restul de 60,05% reprezentnd influena altor factori asupra variaiei salariului. d) Aprecierea gradului de omogenitate se face cu ajutorul coeficientului de variaie: - coeficientul de variaie pe fiecare grup de vechime:
v i = i 100 yi
20495,87 143,16 v1 = 1 100 = 100 = 100 = 17,44% 736,36 736,36 y1 27654,32 166,29 v 2 = 2 100 = 100 = 100 = 16,81% 988,88 988,88 y2
Deoarece att coeficienii de variaie pe grupe de vechime (v1, v2) ct i coeficientul de variaie pe total, v, sunt mai mici dect 35%, apreciem c att fiecare grup de vechime, ct i colectivitatea n ansamblul su sunt omogene. Deoarece v1, v2 < v fiecare grup de vechime este mai omogen dect colectivitatea n ansamblu. Grupa a doua de vechime este mai omogen deoarece are coeficientul de variaie mai mic. e) Avem o caracteristic alternativ: - salariai cu salariul peste 800 RON; - salariai cu salariul sub 800 RON. Media caracteristicii alternative: - pe fiecare grup de vechime:
wi = mi ni
i = 1 : w1 = i = 2 : w2 =
m1 20 = = 0,3636 36,36% dintre salariaii din prima grup de vechime n 1 55 m 2 20 + 15 + 5 = = 0,8888 88,88% dintre salariaii din a doua grup de n2 45
i =1
2 i w
2 i =1
ni =
ni
( w i w ) 2 n i
i =1
ni
- dispersia total: