You are on page 1of 2

Indice di concentrazione come rapporto tra aree

note al corso di STATISTICA I a.a. 2006/2007


Corso di laurea in Statistica

Si consideri la variabile statistica quantitativa X, positiva e trasferibile, misurata su


un insieme di N unità statisticheP(u.s.). Siano x1 , . . . , xN i valori di X ordinati in senso
non decrescente, e M = (1/N ) N i=1 xi la media aritmetica di X.
Si definiscano le quantità:
i
pi = N
Pi
xk Si
qi = Pk=1
N = NM
i=1 xi

dove pi rappresenta la proporzione di u.s. con X ≤ xi e qi è la proporzione del carattere


posseduta dalle prime i u.s.
In Figura 1 è rappresentato il Diagramma di Lorenz corrispondente alla variabile X.
La spezzata che si ottiene unendo i punti di coordinate (pi , qi ) è detta spezzata di con-
centrazione (linea rossa). L’area compresa tra la retta di equidistribuzione (linea blu) e la
spezzata di concentrazione è detta area di concentrazione.

Figure 1: Diagramma di Lorenz

1 C
q

0.5

0
p
B
0 0.5 1
A p1 pN-1

In caso di equidistribuzione vale pi = qi : la spezzata di concentrazione coincide con


la retta di equidistribuzione e l’area di concentrazione è nulla.
Nel caso di massima concentrazione qi = 0 per i = 1, . . . , N − 1 e qN = N M : la
spezzata di concentrazione coincide con l’asse delle ascisse fino al punto di coordinate
(pN −1 , 0) e poi con il segmento che unisce questo punto con il vertice di coordinate (1,1)
(linea verde in Figura 1).
L’indice di concentrazione può essere ottenuto rapportando il valore dell’area di con-
centrazione A(C) al suo massimo A(max).

1
In particolare, l’area di concentrazione A(C) si ottiene sottraendo all’area del trian-
golo rettangolo ABC l’area sottostante la spezzata di concentrazione, A(S). Osservando
che quest’area è composta dalla somma delle aree del triangolo rettangolo formato tra il
vertice (0, 0) e p1 e le aree dei trapezi rettangoli aventi per altezze i segmenti (pi+1 − pi )
e per basi i segmenti qi e qi+1 , posto p0 = q0 = 0, si ha:

A(ABC) = 1/2
N −1
1X
A(S) = (pi+1 − pi )(qi+1 + qi )
2 i=0
" N −1
#
X
A(C) = 1/2 1 − (pi+1 − pi )(qi+1 + qi ) .
i=0

L’area di massima concentrazione A(max) si ottiene sottraendo all’area del traingolo


rettangolo ABC l’area del triangolo rettangolo di vertici (pN −1 , 0), B e C:

A(ABC) = 1/2
1 1 N −1
A(pN −1 BC) = (1 − pN −1 ) = (1 − )
2 2 N
1 1 N −1 1 N −1 N −1
A(max) = − (1 − ) = (1 − 1 − )=
2 2 N 2 N 2N
L’indice di concentrazione dedotto dal Diagramma di Lorenz è pertanto:
" N −1
#
A(C) 2N 1 X
R∗ = = × 1− (pi+1 − pi )(qi+1 + qi )]
A(max) N −1 2 i=0
" N −1
#
N X
= 1− (pi+1 − pi )(qi+1 + qi )
N −1 i=0

P −1
Si osservi che per N grande NN−1 ≈ 1 e quindi R∗ ≈ 1 − N i=0 (pi+1 − pi )(qi+1 + qi ). Si

dimostra facilmente che R ≡ R, R = ∆/2M , dove ∆ è la differenza media semplice.
Si osservi che mentre sia R∗ che R = ∆/2M possono essere calcolati anche nel caso
di distribuzioni di frequenza, l’indice di Gini:
PN −1
(pi − qi )
RG = i=1 PN −1
i=1 pi

può essere calcolato solo nel caso di una successione di valori.

You might also like