Professional Documents
Culture Documents
La statistique descriptive
DOYEN
1. Introduction et dfinitions
Statistique descriptive:
Analyse et synthse, NUMERIQUE et GRAPHIQUE,
dun ensemble de donnes
DOYEN
1. Introduction et dfinitions
Statistique descriptive:
Analyse et synthse, NUMERIQUE et GRAPHIQUE,
dun ensemble de donnes
Attention:
Attention:
2 types de caractres:
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets:
peuvent prendre un
nombre fini et faible
de valeurs
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets: Nb enfants
peuvent prendre un
nombre fini et faible 0 1 2 3 4 5
de valeurs
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets: Nb enfants
peuvent prendre un
nombre fini et faible 0 1 2 3 4 5
de valeurs
Quantitatifs continues:
Par nature:
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets: Nb enfants
peuvent prendre un
nombre fini et faible 0 1 2 3 4 5
de valeurs
Quantitatifs continues: Taille:
Par nature: 1m 2m
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets: Nb enfants
peuvent prendre un
nombre fini et faible 0 1 2 3 4 5
de valeurs
Quantitatifs continues: Taille:
Par nature: 1m 2m
Par ncessit:
DOYEN
2 types de caractres:
Sexe, couleur des
yeux, secteur
Qualitatifs: non mesurables dactivit
Quantitatifs: mesurables Age, taille , PIB, taux
de chmage
Quantitatifs discrets: Nb enfants
peuvent prendre un
nombre fini et faible 0 1 2 3 4 5
de valeurs
Quantitatifs continues: Taille:
Par nature: 1m 2m
EXHAUSTIFS et INCOMPATIBLES
DOYEN
EXHAUSTIFS et INCOMPATIBLES
EXHAUSTIFS et INCOMPATIBLES
EXHAUSTIFS et INCOMPATIBLES
EXHAUSTIFS et INCOMPATIBLES
N= Effectif total de la
2.2 Pourcentage et frquence: population
ni= Effectif de la modalit
p i f i
considre
n n
f=N
p = 100
i
i
N i
i
DOYEN
N= Effectif total de la
2.2 Pourcentage et frquence: population
ni= Effectif de la modalit
p i f i
considre
n n
f=N
p = 100
i N
i
i
i
Proprit: p =100
i
i
f
i
=1
i
DOYEN
N= Effectif total de la
2.2 Pourcentage et frquence: population
ni= Effectif de la modalit
p i f i
considre
n n
f=N
p = 100
i N
i
i
i
Proprit: p =100
i
i
f
i
=1
i
Agri. Exploi.
Artisans,
Cadres
Prof. Int.
Employs
Ouvriers
Retraits
Inactifs
DOYEN
5 pers. 1182235 5
6 ou plus 109189 2
Total 22434621 100
DOYEN
4 pers. 3057674 14 93
32+32=64
5 pers. 1182235 5 98
30
20
10
Nbe de pers.
0
par mnage
1 2 3 4 5 6 et +
DOYEN
30
32% des mnages
sont composs de
20 2 personnes
10
Nbe de pers.
0
par mnage
1 2 3 4 5 6 et +
DOYEN
b. Diagramme cumulatif:
Reprsente les frquences cumules en fonction des valeurs du
caractre
Frquence en %
100
75
50
25
0 Nbe pers.
0 1 2 3 4 5 6 7 par mnage
DOYEN
b. Diagramme cumulatif:
Reprsente les frquences cumules en fonction des valeurs du
caractre
Frquence en %
100
75
0 Nbe pers.
0 1 2 3 4 5 6 7 par mnage
DOYEN
a. Caractristiques centrales:
La moyenne note x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
x = ni xi = f
1
x
n i i
i i
DOYEN
a. Caractristiques centrales:
Reprsente le barycentre
des valeurs prises par le
La moyenne note x caractre
x = ni xi = f
1
x
n i i
i i
x = ni xi = f
DOYEN
1
n i i
i x i
1
n i i
i x i
Le(s) mode(s)
Le(s) mode(s)
30
Le mode vaut: 2 personnes
20
10
Nbe de pers.
0
par mnage
1 2 3 4 5 6 et +
DOYEN
Le mode
Le mode
Cette distribution a
2 modes!
Elle est BIMODALE
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
Frquence en %
100 La mdiane
est entre 1 et 2
75
personnes par
mnage
50
25
0 Nbe pers.
0 1 2 3 4 5 6 7 par mnage
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
On la dtermine laide des frquences cumules ou
du diagramme cumulatif
Frquence en %
100 La mdiane
est entre 1 et 2
75
personnes par
62% 2 pers. ou moins
mnage
50
25
32% 1 pers. ou moins
0 Nbe pers.
0 1 2 3 4 5 6 7 par mnage
DOYEN
x=12
6 14 16
mdiane
DOYEN
x=12
3 6 x=9 14 16
mdiane
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11
Semaine 2: 0, 10, 10, 20
DOYEN
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11 Toutes les caractristiques
centrales valent 10!
Semaine 2: 0, 10, 10, 20
DOYEN
b. Caractristiques de dispersion:
Exemple:
Notes des devoirs la maison en 2001 lIUP com et
vente
Semaine 1: 9, 10, 10, 11 Toutes les caractristiques
centrales valent 10!
Semaine 2: 0, 10, 10, 20
ex n i ni
= 1
xi f
x =
i
i xi x
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne
2
= ni
1
n i (xix ) = f (xix)
2
i
i
2
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne Si x a pour unit la personne, alors
a pour unit personne
2 2
2
= ni
1
n i (xix ) = f (xix)
2
i
i
2
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne Si x a pour unit la personne, alors
a pour unit personne
2 2
2
= ni
1
n i (xix ) = f (xix)
2
i
i
2
=
2
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne Si x a pour unit la personne, alors
a pour unit personne
2 2
2
= ni
1
n i (xix ) = f (xix)
2
i
i
2
=
Mme unit que le 2
caractre
DOYEN
La variance et lcart-type:
La variance est la moyenne des carrs des carts la
moyenne Si x a pour unit la personne, alors
a pour unit personne
2 2
2
= ni
1
n i (xix ) = f (xix)
2
i
i
2
=
Mme unit que le 2
caractre
1.51.2 (personne)
En 1999, au moins 75% des mnages franais ont
un effectif entre 0 et 4.8 personnes.
DOYEN
f i
a est lamplitude de la classe
i
a i
DOYEN
.f relatives
5 ans
16
14
12
10
8
6
4
2
Age en
0
0 10 20 30 40 50 60 annes
DOYEN
.f relatives
5 ans
16
14
12
10
8
6
4
2
Age en
0
0 10 20 30 40 50 60 annes
.f cumules
100
80
60
40
20
0 Age en annes
0 10 20 30 40 50 60
DOYEN
a. Caractristiques centrales:
La moyenne note x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
x = ni ci = f
1
c
n i i
i i
DOYEN
a. Caractristiques centrales:
La moyenne note x
Moyenne arithmtique des valeurs du caractre pour les n
individus de la population
x = ni ci = f
1
c
n i i
i i
a. Caractristiques centrales:
Reprsente le barycentre
des valeurs prises par le
La moyenne note x caractre
x = ni ci = f
1
c
n i i
i i
x=f c i
i
i
15+24 20 x=f c i
2 i
i
15+24 20 x=f c i
2 i
i
15+24 20 x=f c i
2 i
i
Classe(s) modale(s)
CLASSES en lesquelles lhistogramme des
frquences prsente un maximum RELATIF
Classes en laquelle la frquence RELATIVE
prsente un maximum RELATIF
DOYEN
Classe(s) modale(s)
CLASSES en lesquelles lhistogramme des
frquences prsente un maximum RELATIF
Classes en laquelle la frquence RELATIVE
prsente un maximum RELATIF
La classe modale est
.f relatives 5 ans celle des 35-39 ans
16
14
12
10
8
6
4
2
0
0 10 20 30 40 50 60 Age en annes
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
.f cumules Graphiquement, on lit
100
que la mdiane vaut
80 un peu moins de 40
ans
60
40
20
0 Age en annes
0 10 20 30 40 50 60
DOYEN
La mdiane
Valeur du caractre qui partage la srie statistique en
2 groupes de mme frquence (0.5).
Cest la valeur correspondant un effectif cumul de
50% sur le polygone des frquences cumules
.f cumules Graphiquement, on lit
100
que la mdiane vaut
80 un peu moins de 40
ans
60
40 Peut on avoir
une expression
20
exacte de la
0 Age en annes mdiane?
0 10 20 30 40 50 60
DOYEN
80
60
40
20
0 Age en annes
0 10 20 30 40 50 60
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
.ci Age Effectif .fi
x 40 (ans)
20 15-24 2279542 0.086
27 25-29 3628502 0.137
33 30-34 3771554 0.142
37 35-39 3865252 0.146
43 40-44 3770300 0.142
47 45-49 3696642 0.139
53 50-54 3305278 0.125
60 55 et + 2225411 0.084
Total 26542481 1
DOYEN
b. Caractristiques de dispersion:
cart absolue, variance, cart-type
Idem caractre discret mais on prend le centre des
classes comme valeur reprsentative
.ci Age Effectif .fi
x 40 (ans)
20 15-24 2279542 0.086 0.086 * |20-40| 0.086 * 202
27 25-29 3628502 0.137 +0.137 * |27-40| +0.137 * 272
33 30-34 3771554 0.142 +0.142 * |33-40| +0.142 * 332
37 35-39 3865252 0.146 +0.146 * |37-40| +0.146 * 372
43 40-44 3770300 0.142 +0.142 * |43-40| +0.142 * 432
47 45-49 3696642 0.139 +0.139 * |47-40| +0.139 * 472
50-54 3305278 0.125 +0.125 * |53-40| +0.125 * 532
53
+0.084 * |60-40| +0.084 * 602
60 55 et + 2225411 0.084
=171240
2 2
11210.6 (ans)
DOYEN
Le coefficient de variation
V=
x
DOYEN
Le coefficient de variation
Le coefficient de variation
Le coefficient de variation
1E 3E 5E
x1 3 (E); 21.63 (E)
DOYEN
Le coefficient de variation
V2 0.54 1E 3E 5E
x1 3 (E); 21.63 (E)
DOYEN
Lintervalle interquartile
Les quartiles sont les 3 valeurs Q1 ; Q2 ; Q3 qui
partagent la population en 4 effectifs gaux.
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
DOYEN
Lintervalle interquartile
Les quartiles sont les 3 valeurs Q1 ; Q2 ; Q3 qui
partagent la population en 4 effectifs gaux.
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
.f cumules
100
80
60
40
20
0 Age en annes
0 10 20 30 40 50 60
DOYEN
Lintervalle interquartile
Les quartiles sont les 3 valeurs Q1 ; Q2 ; Q3 qui
partagent la population en 4 effectifs gaux.
Ce sont les 3 valeurs du caractre correspondant
des effectifs cumuls de 25%, 50% et 75%
.f cumules
100
Graphiquement:
80
Q 30 (ans)
1
60
Q 40 (ans)
2
40
20 Q 50 (ans)
3
0 Q1 Q2 Q3 Age en annes
0 10 20 30 40 50 60
DOYEN
Pour k=1,2,3:
x x
Q = x + ( P F )
i k i
j i
Effectifs cumuls
k
F F j i
F j
P =25%
1
P
P =50%
k
2
F i
P =75%
3
x i Q k
x j
DOYEN
= + 3530
Age Effectif .fi Cumul
Q1 30 ( 25 22.3)
36.522.3
15-24 2279542 0.086 8.6
31 (ans)
25-29 3628502 0.137 22.3
30-34 3771554 0.142 36.5
35-39 3865252 0.146 51.0 Q = Me 39.5 (ans)
2
40-44 3770300 0.142 65.2
45-49 3696642 0.139 79.2
5045
50-54 3305278 0.125 91.6 Q = 45 + (7565.2)
3 79.265.2
55 et + 2225411 0.084 100
Total 26542481 1 100
48.5 (ans)
DOYEN
Exemple:
Qs =48.5-31=17.5 (ans)
DOYEN
Proprit: f
i j
i, j =1
DOYEN
Proprit: f
i
i ,. =1 fj
., j =1
DOYEN
Proprit: f
i
i ,. =1 fj
., j =1
DOYEN
Proprit:
f j
i,j = f i,.
DOYEN
Proprit:
f j
i,j = f i,. fi
i, j = f ., j
DOYEN
0,8
0,6
0,4
0,2
ges
0
20 22 24 26 28
DOYEN
ni , j ni , j
f xi y j = f yj xi =
ni , j
i
ni , j
j
DOYEN
0,6
0,4
0,2
0 Salaires en euros
170 200 230 260
DOYEN
5.3 Indpendance
5.3 Indpendance
5.3 Indpendance
5.3 Indpendance
Proprit:
Proprit:
Proprit:
Proprit:
Dans le cas ou il y a indpendance entre X et Y, alors dans
le tableau de contingence les valeurs des lignes sont
proportionnelles et les valeurs des colonnes le sont aussi.
DOYEN
Exemple:
1 27 5
2 32 6
3 31 9
4 40 12
5 65 18
DOYEN
Exemple:
Y
X
DOYEN
Exemple:
Y
Il ny a pas de
bonne
approximation,
X et Y semblent
indpendants
X
DOYEN
Y
X
DOYEN
Y
X
DOYEN
Y
X
DOYEN
Y
Kboite
70
60
50
40
30
20 Keuro
4 8 12 16 20
DOYEN
Kboite
70
60
50
40
30
20 Keuro
4 8 12 16 20
Y a*X + b
DOYEN
Kboite
70
60
50
40
40
30
16
20 Keuro
4 8 12 16 20
Y a*X + b
a 40 = 2.5 ( Kboite )
16 Keuro
DOYEN
Kboite
70
60
50
40
40
30
16
20 Keuro
4 8 12 16 20
Y a*X + b
b204*2.5=10 (Kboite)
a 40 = 2.5 ( Kboite )
16 Keuro
DOYEN
Kboite
70
60
50
40
40
30
16
20 Keuro
4 8 12 16 20
Y a*X + b
b204*2.5=10 (Kboite)
a 40 = 2.5 ( Kboite )
16 Keuro
Cest trs approximatif!
DOYEN
ei
2
Y i
e3
ei: cart entre la droite de
e2 rgression et la ime
observation
e1
X
DOYEN
On note: x = 1 xi y = 1 yi
n i n i
V ( X ) = ( xi x) = xi x
2
1 1 2 2
n i n i
Cov ( X ) = 1 ( xi x )( yi y ) = 1 xi *yi x*y
n i n i
DOYEN
On note: x = 1 xi y = 1 yi
n i n i
V ( X ) = ( xi x) = xi x
2
1 1 2 2
n i n i
Cov ( X ) = 1 ( xi x )( yi y ) = 1 xi *yi x*y
n i n i
On a:
Cov ( X ,Y )
a=
V (X )
b = ya*x
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
x=50 =10 (Keuro)
5 610 2
V ( X )= 10 =22 (Keuro)
2
y=195=39 (Kboite) 5
5
Cov ( X ,Y )= 2256 10*39=61.2 (Keuro*Kboite)
5
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
x=50 =10 (Keuro)
5 610 2
V ( X )= 10 =22 (Keuro)
2
y=195=39 (Kboite) 5
5
Cov ( X ,Y )= 2256 10*39=61.2 (Keuro*Kboite)
5
a= 61.2 2.78 ( Kboite ) b392.78*10=11.2 (Kboite)
22 Keuro
DOYEN
Kboite
70
60
50
40
30
20 Keuro
4 8 12 16 20
Y 2.78*X +11.2
DOYEN
Le coefficient de corrlation:
Cov ( X ,Y )
r=
V ( X ) V (Y )
DOYEN
Le coefficient de corrlation:
Cov ( X ,Y )
r=
V ( X ) V (Y )
Proprits:
1 r 1
(
r proche de 1: corrlation linaire possible r >0.86 )
r proche de 0: pas de corrlation linaire
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
2
50
x= =10 (Keuro) V ( X )= 610 10 =22 (Keuro)
2
5 5
2
195
y= =39 (Kboite) V (Y )= 8539 39 =186.8 (Kboite)
2
5 5
Cov ( X ,Y )= 2256 10*39=61.2 (Keuro*Kboite)
5
DOYEN
1 27 5 729 25 135
2 32 6 1024 36 192
3 31 9 961 81 279
4 40 12 1600 144 480
5 65 18 4225 324 1170
195 50 8539 610 2256
2
50
x= =10 (Keuro) V ( X )= 610 10 =22 (Keuro)
2
5 5
2
195
y= =39 (Kboite) V (Y )= 8539 39 =186.8 (Kboite)
2
5 5
Cov ( X ,Y )= 2256 10*39=61.2 (Keuro*Kboite)
5
r 61 . 2 0.96
22*186.8
DOYEN
Kboite
70
60
50
40
30
20 Keuro
4 8 12 16 20
Kboite
70
60
50
40
30
20 Keuro
4 8 12 16 20
60
50
40
30
20 Keuro
4 8 12 16 20
DOYEN
60
50
40
30
20 Keuro
4 8 12 16 20
55=2.78*X +11.2 X =
5511 . 2 15.8 (Keuro)
2.78
DOYEN
60
50
40
30
20 Keuro
4 8 12 16 20
55=2.78*X +11.2 X =
5511 . 2 15.8 (Keuro)
2.78