You are on page 1of 177

D.

TOUIJAR
2010-11
LES TESTS
DHYPOTHESEle : Mthodes DHYPOTHESE
Quantitatives :ent: Statistique IV
Sections C & D
Attention !
N essayez pas de comprendre le cours en lisant
tout (e) seul(e) Ce document. tout (e) seul(e) Ce document.
Par contre, je vous recommande vivement dassister
toutes les sances en esprant mieux cerner le
programme de statistique IV
Il y a en statistique deux approches: La
description et Linfrence.
Linfrence statistique , rappelons le, a
pour but dtendre les proprits de pour but dtendre les proprits de
lchantillon la population entire et
de valider ou de rejeter des hypothses
a priori ou formules aprs une tape
descriptive.
Les deux principaux champs dtude de
linfrence statistique sont :
Lestimation de paramtres : dj trait en S4
(statistique III). (statistique III).
Les Tests statistiques : qui font lobjet du
programme de ce semestre 5.
PROGRAMME DE CE SEMESTRE
Chapitre 1: Les Tests paramtriques
Chapitre 2: Les Tests non paramtriques
BIBLIOGRAPHIE
Titre Auteurs Code
Handbook of PARAMETRIC and
NONPARAMETRIC STATISTICAL
PROCEDURES
DJ. Sheskin
Mthodes statistiques B. Grais stat22
Introduction la statistique
J.P Blisle
;J.Desrosiers
stat20
Elments de statistiques J. Desrosiers stat25
Les Tests paramtriques
Chapitre 1
Les Tests paramtriques
Introduction
Soit X
1
, X
2
, , X
n
un chantillon alatoire relatif
la V.A. parente X de loi L LL L ( ), o est un
paramtre rel inconnu.
Le semestre prcdent, on cherchait estimer .

Le semestre prcdent, on cherchait estimer .
Mais il arrive quon ait une ide prconue sur sa
valeur:
On dsire alors tester la validit de cette
hypothse, en la confrontant une hypothse
alternative.
0
=
Cette dernire exprime une tendance
diffrente au sujet du paramtre.
Exemple :
Est-ce que le taux de chmage au Est-ce que le taux de chmage au
Maroc est p
0
?
Est-ce que lesprance de vie au
Maroc est
0 00 0
?...ou a augment ?
Mthodologie du test
dhypothse
On suppose que est partitionn en
0
et
1
:

= = et

Exprimons le fait que par lhypothse H
0
et le fait que par H
1
= =
1 0 1 0
et
0

1

H
0
:
H
1
:
Dfinition: Un test dhypothse, est une rgle de
0

1

Dfinition: Un test dhypothse, est une rgle de
dcision permettant, au vu de la ralisation
( x
1
, x
2
, , x
n
) de lE.A., de rpondre la
question dans lequel des deux sous ensemble se
trouve ?
H
0
: sappelle lhypothse nulle.
H
1
: sappelle lhypothse alternative.
Si
0
se rduit au seul point
0 00 0
:
{ }
0 0
=
H
0
devient H
0
: et sera appele
lhypothse simple.
0
=
Soit lhypothse simple H
0
:
Si H
1
est telle que H
1
: ; alors on dit
que le test est unilatral droite:
0
>
0
=

>
=
" :"
#
" :"
. . .
0 1
0 0


H
H
D U T
Si H
1
est telle que H
1
: ; alors on dit
que le test est unilatral gauche:
0
<

= " :" H

<
=
" :"
#
" :"
. . .
0 1
0 0


H
H
G U T
Si H
1
est telle que H
1
: ;
alors on dit que le test est bilatral :
0

= " :"
0 0
H

=
" :"
#
" :"
. .
0 1
0 0


H
H
B T
Exemple Introductif :
un fabricant de lessive prtend que son
produit est efficace dans 75% des cas. Une
association de consommateurs dsire tester
le produit.
A notre problme on associe le modle A notre problme on associe le modle
statistique suivant:
Notons par X la V.A. qui donne le rsultat de
lutilisation du dtachant sur un vtement:
X =
Do
X U UU U(p)
Soit X
1
, X
2
, , X
100
lE.A. relatif X

=
=
persiste tche la si p proba avec
disparait tche la si p proba avec
1 0
1
Soit X
1
, X
2
, , X
100
lE.A. relatif X
Alors est le
meilleur estimateur de p.
On a alors 2 hypothses opposes :
100 100
100 2 1 100
X X X S
F
+ +
= =
La premire est soutenue par le fabricant
H
0
: p = 0,75
Ce que conteste lassociation, en lui opposant une
hypothse alternative:
H
1
: p < 0,75
Alors avec un peu de bon sens, lassociation suit la Alors avec un peu de bon sens, lassociation suit la
procdure suivante:
On accepte le produit si f 70%
donc pas de poursuite judiciaire.
On refuse si f < 70%


75%
70%
1
0
p
0
C
f
R
NR
NR
O f est la proportion des 100 vtements tachs et
tests pour lesquels le produit a t efficace.
Cette procdure sappelle Rgle de dcision . Et
sappelle valeur critique du test.
70 0 70 , % c = =
Si f < c =0,7 alors H
0
est rejete au profit de H
1
Si f c =0,7 alors H
0
nest pas rejete.
{

Remarque :
: zone de rejet de H
0
=Rgion critique
: zone de non-rejet de H
0
=Rgion dacceptation
[ 7 , 0 ; 0 [
0
= R
] 1 ; 7 , 0 [
0
= R
=Rgion dacceptation
Cette rgle de dcision peut conduire
deux types derreurs:
On rejette H
0
alors que H
0
est vraie:
RH
0
/H
0
vraie
On lappelle erreur de premire espce
On ne rejette pas H
0
alors que H
1
est vraie:
NRH /H vraie; NRH
0
/H
1
vraie;
cest lerreur de seconde espce .
On dfinit alors la probabilit de commettre lune
ou lautre erreur:
1)-
Cest le risque de premire espce.
2)-
( ) ( )
0 0 0 0
RH P Vraie H RH P = =
2)-
Cest le risque de seconde espce.
( ) ( )
0 1 1 0
NRH P Vraie H NRH P = =
Dfinition: On appelle puissance du test la quantit :
Voici un tableau rsumant toutes les situations
Dcision
Ralit
RH
0
NRH
0
( )
0 1
1 RH P = =
H
0
Vraie Erreur de 1
re
espce
Bonne Dcision
H
1
Vraie Bonne Dcision Erreur de 2
me
espce
est gnralement petit; cest le risque que court
lassociation en lanant, tort, une action contre le
fabricant.
Question: Quel risque court lassociation en
lanant, tort, une action contre le fabricant ?
Calculons dans notre cas :
Si H
0
est vraie, alors X U UU U(0,75) .
En supposant les cond

T.C.L. vrifies sous H
0
:
N NN N(0 00 0, , , , 1 11 1) .
25 , 0 75 , 0
75 , 0

=
F
n Z
( )
( ) ( ) % 3 , 12 16 , 1 16 , 1
43 , 0
75 , 0 7 , 0
10 7 , 0
0 0
0 0
= > = < =
|

\
|
< = < =
Z P Z P
Z P F P
Problme: Peut-on contrler le risque , en jouant
sur la valeur critique c ?
Rponse : Oui
Exemple : si on pense que prendre un risque de 5%
est acceptable, on a :
( ) ( )
|
|

|
p c
A partir du seuil c=68% on rejette H
0
( ) ( )
|
|

\
|

< = < = = =
0 0
0
0 0 0 0
05 , 0
q p
p c
n Z P c F P RH P
68 , 0 645 , 1 10
43 , 0
75 , 0
0 0
0 05 , 0
= = = =

n
q p
z p c z
c

Que signifie lhypothse nulle?


- hypothse sur la base de laquelle est dfinie la
distribution de probabilit (thorie de la dcision):
L'hypothse H
0
entrane la connaissance de la loi
de la statistique de test .
Par exemple, si le d est quilibr, l'hypothse nulle Par exemple, si le d est quilibr, l'hypothse nulle
entrane que le nombre dapparition dun numro
(cinq par exemple) sur n lancs, suit la loi binomiale
U (n,p
0
), o p
0
est la probabilit (suppose connue)
ici gale 1/6.
- Ngation d'une hypothse de recherche.
- Spcification d'un paramtre gal zro.
L'hypothse nulle est exacte (= = = =
0 00 0
), l'hypothse
alternative est indfinie:
L'hypothse nulle H
0
est une hypothse de non
diffrence [ il n'y a pas de diffrence significative
entre les chantillons A et B]. Elle est formule entre les chantillons A et B]. Elle est formule
de faon tre rejete.
-La statistique infrentielle procde
gnralement par le rejet de lhypothse nulle.
-Un test d'hypothse constitue donc une sorte
de dmonstration par l'absurde en probabilit.
La conclusion finale, une fois que le test a t
effectu, est toujours donne en termes
d'hypothse nulle. Soit quon conclu "rejetons H
0
en
faveur de H
1
" ou quon conclu "ne pas rejeter H
0
";
nous ne concluons jamais "rejeter H
1
", ou mme
"accepter H
1
".
Si nous concluons "ne pas rejeter H
0
", ceci ne
signifie pas ncessairement que l'hypothse nulle
est vraie, il suggre seulement qu'il n'y ait pas
d'vidence suffisante contre H
0
en faveur de H
1
.
Rejeter l'hypothse nulle suggre, alors, que
l'hypothse alternative peut tre vraie.
ANALYSE UNIVARIEE
Cas dun seul ECHANTILLON Cas dun seul ECHANTILLON
(Comparaison par rapport 1 standard (ou fixe))
I- Tests Relatifs Une Proportion
1- Test Unilatral gauche pour la proportion
i) Formulation des hypothses

<
=
#
" :"
. . .
0 0
p p H
G U T
ii) si le T.C.L. est vrifi sous H
0
alors
R.D

< " :"


0 1
p p H

=
= <
0
0 0
0
0
0 0
0
H pas rejette ne on
H rejette on
n
q p
z p c f Si
n
q p
z p c f Si


2
1
Courbe de densit
de la loi normale
centre rduite
( )
o
P Z z
et

> + =
En effet; commenons dabord par un petit rappel sur
les valeurs critiques :

1-
+z

Z
0
1
et
o z z

=
0
0 0
F p
Z
p q
n

=
c

p
0
R
0
R
0
n
q p
z
0 0

F
Do :
( ) ( )
n
q p
z p c z
n
q p
p c
n
q p
p c
n
q p
p F
P c F P RH P
0 0
0
0 0
0
0 0
0
0 0
0
0 0 0 0

= =

|
|
|
|

\
|

<

= < = =
Calcul du risque (pour un risque fix):
Puisque lhypothse alternative H
1
est
compose, alors pour chaque valeur du
paramtre p de H
1
, on peut calculer un
(respectivement un ). Soit p
1
cette
valeur, alors :
( ) ( )
( ) ( )
1 1 1
1 1 1
/
/
P F c p p P F c
P F c p p P F c

= = =
= < = = <
Revenons notre exemple et calculons pour p =
p
1
= 0,65 et = 5%:
( )
|
|
|
|

\
|

<

= < =
1 1
1
1 1
1
1 1 1
1
q p
p c
n
q p
p F
n P c F P
Z


Sous H
1
, Z
1
est normale; or c

= 0,68
do :
\
( )
% 5 , 26
% 5 , 73 629 , 0
1
1 1 1
=
= < =

Z P
Si p = = = = p
2
= == = 0,60 :
Remarque: Plus p
1 1 1 1
sloigne de p
0 00 0
et plus
la puissance du test augmente ( ) et
rciproquement. Autrement, lorsque les
( )
% 2 , 5
% 8 , 94 63 , 1
2
2 1 2
=
= < =

Z P
rciproquement. Autrement, lorsque les
deux hypothses H
0
et H
1
sont trs
diffrents, la probabilit de commettre
lerreur de second espce est faible.
Si et sont petits, on dit que le test une
bonne rgle de dcision.
Loi de
F sous
H
1
Loi de
F sous
H
0
p
1 11 1
p
0 00 0
c

F

p
1
p
0 00 0
c


Remarque : Les logiciels utilisent souvent
le niveau de signification
0 00 0
( p-value) dune
ralisation de : cest le plus petit partir du
quel on ne peut plus rejeter H
0
:
( )
0 0
= < f F P
f
F
Si dans notre exemple on suppose que
Alors :
Le test est donc significatif 5%
03/12/2013
( )
0 0
65 , 0 = f
( )
( ) % 1 309 , 2
0
0 0
= < =
< =
Z P
f F P
Signe de la rgion de Rejet

0 00 0
P-value Interpretation

0 00 0
< 0,01 very strong evidence against H
0
0,01
0 00 0
< 0,05 moderate evidence against H
0
0,05
0 00 0
< 0,10 suggestive evidence against H
0
0,10
0 00 0
little or no real evidence against H
0
2- Test Unilatral droite pour la proportion
i)-F.H.
ii) si le T.C.L. est vrifi sous H
0
alors la
rgle de dcision devient :

>
=
" :"
#
" :"
. . .
0 1
0 0
p p H
p p H
D U T
rgle de dcision devient :
R.D

+ =
+ = >
0
0 0
0
0
0 0
0
H pas rejette ne on
H rejette on
n
q p
z p c f Si
n
q p
z p c f Si


p
0
c

R
0
R
0
n
q p
z
0 0

F
En effet :
( ) ( )
0 0
0 0 0 0
0 0 0 0
0
0 0
0
0 0
F p c p
P RH P F c P
p q p q
n n
c p
p q
z c p z
n
p q
n

| |
|

= = > = >
|
|
\

= + = +
Remarque : La p-value ici vaut :
Si on teste p = 0,75 # p > 0,75 et si F vaut
Alors :
( ) f F P > =
0 0

65 , 0 = f
Alors :
Le test nest donc pas significatif 5% ni 95%
03/12/2013
( )
( ) % 99 309 , 2
0
0 0
= > =
> =
Z P
f F P
3- Test Bilatral pour la proportion
Si T.C.L. On adopte la Rgle de dcision
F.H

=
" :"
#
" :"
. .
0 1
0 0
p p H
p p H
B T
Si T.C.L. On adopte la Rgle de dcision
suivante :
R.D
[ ]
[ ]

0 2 1
0 2 1
H pas rejette ne on ;
H rejette on ;
c c f Si
c c f Si
or
c
1
p
0
c
2
R
0
R
0
R
0
[ ] [ ]
[ ] c p f c c f o d
c p f c p c p f c c f
>
+
0 0 0 2 1
, '
, ,
[ ] c p f c c f o d >
0 2 1
, '
( ) ( )
n
q p
z c z
n
q p
c
n
q p
c
n
q p
p F
P c p F P RH P
0 0
2 2
0 0
0 0 0 0
0
0 0 0 0 0

= =
|
|
|
|

\
|
>

= > = =
Do:
R.D


>
0
0 0
2 / 0
0
0 0
2 / 0
H pas rejette ne on z
H rejette on z
n
q p
p f Si
n
q p
p f Si

0 2 / 0
n

Remarque Si on teste p = 0,75 # p 0,75 et si F


vaut , alors la p-value vaut ici :
0
0 0
0 0
0, 75
0, 75 0, 25
F p f
P
p q

| |
|

|
= >
|

65 , 0 = f
Le test est donc significatif 5% et mme 2,5%
03/12/2013
( )
0 0
0
0, 75 0, 25
100
2, 309 2%
p q
n
P Z
|

|
\
= > + =
II- Tests Relatifs Une Moyenne
1- Test Unilatral droite pour la moyenne
Question : est-ce que lesprance de vie des
marocains a augment depuis le dernier marocains a augment depuis le dernier
recensement ?
Pour rpondre cette question, on doit confronter
2 hypothses:
i)-
ii)-On adopte ensuite une Rgle de dcision base
sur la statistique et qui rpondra la question:
X
X

>
=
" :"
#
" :"
. . .
0 1
0 0


H
H
D U T
sur la statistique et qui rpondra la question:
partir de quelle ralisation de dcidera-t-on du
rejet de H
0
pour un risque ?
X

>
0
0
H pas rejette ne on
H rejette on
c x Si
c x Si
1)- Dtermination de c en fonction du risque :
a)Si est connu et (X est normale ou )
( ) ( )
| |
c
30 n
( ) ( )
|

\
|

> = > = =

0
0 0 0 0
c
n Z P c X P RH P
n
z c z n
c


+ = =

0
0
Do la rgle de dcision :

+ = >
0 0
H rejette on
n
z


c x Si

+ =
+ = >
0 0
0 0
H pas rejette ne on
n
z
H rejette on
n
z



c x Si
c x Si
b)Si est inconnu et X est normale; on a la rgle de
dcision :

+ =
+ = >

0 ; 1 0
0 ; 1 0
H pas rejette ne on
n
t
H rejette on
n
t
s
c x Si
s
c x Si
n
n

c)Si est inconnu et ; on a la rgle de dcision

50 n

+ =
+ = >
0 0
0 0
H pas rejette ne on
n
z
H rejette on
n
z
s
c x Si
s
c x Si

II- Tests Relatifs Une Moyenne


2- Test Unilatral gauche pour la moyenne
On doit confronter les deux hypothses suivantes
i)-

<
=
" :"
#
" :"
. . .
0 1
0 0


H
H
G U T
ii)-On adopte ensuite une Rgle de dcision base
sur la statistique et qui rpondra la question:
partir de quelle ralisation de dcidera-t-on du
rejet de H
0
?
X
X

<
0
H pas rejette ne on
H rejette on
c x Si
c x Si
De la mme faon que prcdemment, on a les
rgles de dcision selon les cas :


0
H pas rejette ne on c x Si
a)Si est connu et (X est normale ou ) 30 n

=
= <
0 0
0 0
H pas rejette ne on
n
z
H rejette on
n
z



c x Si
c x Si
b)Si est inconnu et X est normale; on a la rgle de
dcision :

=
= <

0 ; 1 0
0 ; 1 0
H pas rejette ne on
n
t
H rejette on
n
t
s
c x Si
s
c x Si
n
n

c)Si est inconnu et ; on a la rgle de dcision


:
50 n

=
= <
0 0
0 0
H pas rejette ne on
n
z
H rejette on
n
z
s
c x Si
s
c x Si

II- Tests Relatifs Une Moyenne


3- Test Bilatral pour la moyenne
i)-

=
" :"
#
" :"
. .
0 1
0 0


H
H
B T
ii)-On adopte la Rgle de dcision suivante :
[ ]
[ ]

0 2 1
0 2 1
H pas rejette ne on ;
H rejette on ;
c c x Si
c c x Si
c
1

0
c
2
R
0
R
0
0 2 1
R
0
Do la rgle de dcision suivante
[ ]
c x c x c
c x c c x c c c x
+
+
0 0
0 0 2 1 2 1
;


>
0 0
0 0
H pas rejette ne on
H rejette on
c x Si
c x Si

On a les rgles de dcision selon les cas :


a)Si est connu et (X est normale ou )
30 n


>
0 2 / 0
0 2 / 0
H pas rejette ne on
n
z
H rejette on
n
z

x Si
x Si
b)Si est inconnu et X est normale


>

0 2 / ; 1 0
0 2 / ; 1 0
H pas rejette ne on
n
t
H rejette on
n
t
s
x Si
s
x Si
n
n

c)Si est inconnu et ; on a


50 n


>
0 2 / 0
0 2 / 0
H pas rejette ne on
n
z
H rejette on
n
z
s
x Si
s
x Si

III- Tests Relatifs Une Variance


Dans ce paragraphe on supposera la normalit de la
population
1- Test Unilatral droite pour la variance 1- Test Unilatral droite pour la variance

>
=
" :"
#
" :"
. . .
2
0
2
1
2
0
2
0


H
H
D U T
De la mme faon que prcdemment, on
a les rgles de dcision selon les cas :
a)Si est inconnue
La statistique utilise est S
2
; do la R.D.
est : est :

>

0
2
0
2
; 1
2
0
2
0
2
; 1
2
H pas rejette ne on
1
H rejette on
1
n
s Si
n
s Si
n
n

2- Test Unilatral gauche pour la variance


R.D. (pour inconnue)

<
=
" :"
#
" :"
. . .
2
0
2
1
2
0
2
0


H
H
G U T
R.D. (pour inconnue)

<


0
2
0
2
1 ; 1
2
0
2
0
2
1 ; 1
2
H pas rejette ne on
1
H rejette on
1
n
s Si
n
s Si
n
n

3- Test Bilatral pour la variance

=
#
" :"
. .
2
0
2
0
H
B T

" :"
# . .
2
0
2
1
H
B T
Si est inconnue

(
(


0
2
0
2
2 / ; 1
2
0
2
2 / 1 ; 1
2
H rejette on

1
;
1 n n
s Si
n n


0
2
0
2
2 / ; 1
2
0
2
2 / 1 ; 1
2
0
H pas rejette ne on

1
;
1 n n
s Si
n n


ANALYSE UNIVARIEE
Cas de 2 Echantillons Indpendants
(Comparaison de 2 paramtres)
03/12/2013
1- Test Bilatral de comparaison de 2
Variances :
On suppose la normalit des 2 populations
F.H.
2
1
: 1 H

03/12/2013
1
2 0
2 2
2
0 1 2
2 2
1 1 2
2
1
2 1
2
: 1
:
# #
:
: 1
H
H
H
H

Cas o est inconnue


Rapport critique (sous H
0
):
Si s
1
2
> s
2
2
Sinon et F.H. devient alors
2
2
2
1
S
S
R
c
=
2
2
2
1
c
S
R
S
=
2
2
2 0
1
2
2
2 1
1
: 1
: 1
H
H

Loi de R
c
sous H
0
:
R
c
Y YY Y
03/12/2013
( )
1 2
;
R.D.
( ) ( )
( ) ( )
1 / 2 1 2 / 2 1 2
0
; ; ;
on rejette H
; ; ;
c
Si r F F
Si r F F


03/12/2013
( ) ( )
1 / 2 1 2 / 2 1 2
0
; ; ;
on ne rejette pas H
1
c
i i
Si r F F
o n

=
2- Test Bilatral de comparaison de 2
moyennes :

=
0 :
#
0 :
:
#
:
2 1 1
2 1 0
2 1 1
2 1 0




H
H
H
H
On propose comme estimateur
de
1 11 1

2 22 2
:
a)Si
1 11 1
et
2 22 2
connus et (X
1
normale ou ) et (X
2
normale ou )
03/12/2013
2 1
X X
30
1
n
30
2
n
R.D.

+ >
0
2
2
2
1
2
1
2 / 2 1
H rejette on
n n
z

x x Si
03/12/2013

+
0
2
2
2
1
2
1
2 / 2 1
H pas
rejette ne on
n n
z

x x Si
b) Si
1 11 1
et
2 22 2
inconnus mais gales et X
1
et X
2
normales, alors la R.D. est la suivante :

+ >
+
2 1
2 ; 2 / 2 1
H rejette on
n
1
n
1

t
2 1
s x x Si
n n
03/12/2013

+
+
0
2 1
2 ; 2 / 2 1
0
H pas rejette ne on

n
1
n
1

t
H rejette on
2 1
s x x Si
n n
O
( ) ( )
( ) ( ) 1 1
1 1

2 1
2
2 2
2
1 1
2
+
+
=
n n
S n S n
S
c) Si
1 11 1
et
2 22 2
inconnus et ,
alors la R.D. est la suivante :
03/12/2013
50
1
n
50
2
n

+ >
0
2
2
2
1
2
1
2 / 2 1
H rejette on
n n
z
s s
x x Si

03/12/2013

+
0
2
2
2
1
2
1
2 / 2 1
H pas
rejette ne on
n n
z
s s
x x Si

3- Test Bilatral de comparaison de 2
Proportions :

=
0 :
#
0 :
:
#
:
2 1 1
2 1 0
2 1 1
2 1 0
p p H
p p H
p p H
p p H
On pose p
1
=p
2
=p et on propose comme
estimateur de la proportion commune la
frquence commune des 2 chantillons :
03/12/2013 2 1
2 2 1 1
n n
f n f n
f
+
+
=
On suppose les conditions T.C.L. vrifies
sous H
0
La statistique utilise est F
1
-F
2
Rapport critique (sous H
0
):
F F
03/12/2013
( )
( )( )
2 1
2 1
2 1
2 1
1 1 1
1 1
n n f f
F F
n n pq
F F
R
c
+

=
R.D.
/ 2 / 2
0
;
on rejette H
c
Si r z z

(
+

(
03/12/2013
/ 2 / 2
0
;
on ne rejette pas H
c
Si r z z

(
+

R.D. scrit aussi :


( )( )

+ + >
2 1 2 / 2 1
H rejette on
1 1 1 n n f f z f f Si

03/12/2013
( )( )

+ +
0
2 1 2 / 2 1
0
H pas rejette ne on
1 1 1
H rejette on
n n f f z f f Si

ANALYSE UNIVARIEE
Cas de 2 Echantillons Dpendants
(Comparaison de 2 moyennes)
03/12/2013
V- Test de Comparaison de 2 moyennes :
cas de 2 chantillons apparis
L'hypothse teste est comme suit : est ce que les
deux chantillons dpendants proviennent de deux
populations de mme moyenne ?
On teste deux produits auprs
dun mme chantillon de 5
Produit A B
dun mme chantillon de 5
consommateurs. Chacun des
consommateurs donne 2 notes,
la premire pour le produit A,
lautre pour le produits B.
On obtient le tableau ci-contre :
Produit A B
13,3 14,15
10,1 11,05
8,5 9,5
6,9 7,95
3,7 4,85
Total 42,5 47,5
Le problme pos est de savoir si les 2 sries de
notes viennent de la mme population de moyenne
=

=
B
?
Remarque : Obligatoirement les 2 chantillons ont des
tailles gales !
Le test pos est formul comme suit : Le test pos est formul comme suit :

=
0 :
#
0 :
:
#
:
1
0
1
0
B A
B A
B A
B A
H
H
H
H




On pose la statistique du test afin de
tester la diffrence
A
-
B
Do t(n-1)
Un problme se pose cest que les 2 chantillons
B A
X X D =
n
S
D
S
D D
T
D
D D
= = =

Un problme se pose cest que les 2 chantillons


(5 notes pour A et 5 pour B) ntant plus
indpendant (les notes sont probablement corrles),
il nest plus possible de calculer la variance de D en
faisant la somme des deux variances.
R.D.

>
0 1 ; 2 /
H rejette on t
n
t Si

>

0 1 ; 2 /
0 1 ; 2 /
H pas rejette ne on t
H rejette on t
n
n
t Si
t Si

A.N. :
Produit
x
A
x
B
d=x
A
- x
B
d
2
13,3 14,15 -0,85 0,72
10,1 11,05 -0,95 0,90
8,5 9,5 -1 1
6,9 7,95 -1,05 1,10
3,7 4,85 -1,15 1,32
Total
42,5 47,5 -5 5,04
A.N. :
( )
2
2
5 5, 04
1 1, 01
5 5
5 * 1, 01 1 / 4 0, 0125
1
' 5 * -20
0, 0125
t 2, 78
d
d d
S
D o t
t

= = = =
= =

= =
> =
Voil ce que donne Xlstat
sous Excel
/ 2; 4
0
t 2, 78 t
on rejette H

> =

t (valeur observe) -20,000


t (valeur critique) 2,776
ddl 4
p-value bilatrale < 0,0001
Alpha 0,05
Conclusion : Au seuil de signification
Alpha=0,05 on peut rejeter l'hypothse
nulle d'galit des moyennes. Autrement
dit, la diffrence entre les moyennes est
significative.
03/12/2013
ANALYSE BIVARIEE
Cas de deux Variables
I
Test
sur le coefficient
de corrlation de corrlation
de pearson
Test paramtrique
sur
le coefficient de Corrlation de pearson :
Dans ce paragraphe, nous allons aborder les Dans ce paragraphe, nous allons aborder les
questions relatives aux relations entre deux
variables quantitatives X et Y en souhaitant
montrer que la variable dpendante Y est
fonction de la variable indpendante X.
14/10/2008
Pour ce on cherche calculer le coefficient de
corrlation thorique sur la population :
Un estimateur de sur un E.A. est le coefficient r
(vu en S2) :
( )
Y X
Y X

, cov
=
(vu en S2) :
14/10/2008
( ) ( ) ( )( )
( )
( )( )
( ) ( )
2
2
2 2

cov , cov ,

; cov( , )

1
1
'
i i
X Y X Y
i
X
i i
i i
x x y y X Y X Y
r o x y
S S n
x x
et S
n
x x y y
d o r
x x y y



= = = =


= =


1- Formulation des Hypothses :
2- On propose la statistique du test, sous
H
0
:

=
0 :
#
0 :
1
0

H
H
( )
( )
2
2
n
r
T r t n

= =
0
3- R.D.
( )
( )
2
2
2
1
r
n
r
T r t n
S
r

= =

14/10/2008
( )
( )

>
0 2 /
0 2 /
H pas rejette ne on 2 - n t t Si
H rejette on 2 - n t t Si

Condition dapplication :
La liaison entre X et Y est suppose linaire.
Les lois de X et Y sont supposes Normales.
La loi conditionnelle de Y/X (recip X/Y) est normale.
14/10/2008
Exemple
Le service des tudes conomiques de la
socit veut mesurer lincidence de la
modulation de la pression marketing
(variable X: explicative) sur la vente de
flacons de parfums ( variable Y:explique).
Il enregistre, alors, les ventes y
i
(en milliers Il enregistre, alors, les ventes y
i
(en milliers
de flacons) ainsi que les dpenses
publicitaires x
i
(en milliers de DH)dans 5
zones qui forment un chantillon alatoire
x
i
5 6 9 12 18
y
i
25 30 35 45 65
On cherche tudier la liaison pouvant
exister entre les variables alatoire X et Y.
Pour ce, on reprsente dans un repre
orthogonal les points (x
i
, y
i
) . La forme de
ce nuage nous renseigne sur la nature de
la liaison entre X et Y et le type de courbe
qui ajustera le mieux, cest est une droite qui ajustera le mieux, cest est une droite
(ajustement linaire ou droite de rgression ).
i x
i
y
i
x
i
y
i
x
i
2
y
i
2
1 5 25 125 25 625
2 6 30 180 36 900
3 9 35 315 81 1225 3 9 35 315 81 1225
4 12 45 540 144 2025
5 18 65 1170 324 4225
TOTAL
50 200 2330 610 9000
( ) ( )
( ) % 12 , 0 0012 , 0 16 , 12
3 ' 18 , 3 3
16 . 12
99 . 1
3
99 .
99 , 0
1000 110
330
0
025 , 025 ,
2
= = >

> =
=

=
=

=
T P Or
RH
t t o d t Or
t
r
Conclusion:
Le coefficient de corrlation entre les ventes et
les dpenses publicitaires est trs
significativement diffrent de 0.
( ) % 12 , 0 0012 , 0 16 , 12 = = > T P Or
Tests
non paramtriques
Chapitre 2
Introduction
Les tests statistiques qui imposent des
conditions dapplication relatives aux
paramtres de la population sont appels
des tests paramtriques.
Un test non paramtrique est donc un test d'hypothse pour
lequel il n'est pas ncessaire de spcifier la forme de la
distribution de la population tudie. distribution de la population tudie.
Les mthodes non paramtriques requirent peu d'hypothses
concernant la population tudie. Elles ignorent notamment
l'hypothse classique de la normalit de la population.
Ces tests peuvent tre appliqus de petits chantillons. Ils
peuvent s'appliquer des caractres qualitatifs, des grandeurs
de mesure. On peut les utiliser dans le cas des donnes
incompltes ou imprcises.
En rsum :
- Quelles sont les conditions d'application
des tests non paramtriques ?
Lorsque:
- pour la variable quantitative, il n'est pas
possible d'mettre certaines hypothses : possible d'mettre certaines hypothses :
- normalit de la distribution ;
- galit des variances, ...
- L'infrence ne concerne pas un paramtre
dans la distribution de population
- la taille de l'chantillon devient trop faible
(hypothses prcdentes invrifiables )
Le problme qui se pose alors est de savoir quand
la distribution dune population est normale.
Il existe plusieurs tests statistiques qui
permettent de vrifier si des donnes proviennent
dune population normalement distribue. Citons
par exemple le test de
2
et celui de Kolmogorov-
Smirnov et son extension test de Lilliefort
On peut parfois, se faire une ide quant la On peut parfois, se faire une ide quant la
normalit des donnes en examinant la
distribution de ces derniers dans lchantillon:
Les donnes sont-elles relativement groupes
autour dune tendance centrale ? Ny a-t-il pas
une distribution clairement bimodale
incompatible avec la proprit de normalit ?
Ny a-t-il pas des donnes aberrantes?
ANALYSE UNIVARIE
A- Cas dun seul A- Cas dun seul
chantillon
I- Tests
dajustements
de de
Khi-deux
INTRODUCTION
Le but de ce test est de vrifier, en se
basant sur les donnes d1 E.A., la
concordance entre une distribution
observe (empirique) et une distribution
thorique. Soit X la V.A. parente relative thorique. Soit X la V.A. parente relative
un E.A. de taille n. Cet chantillon
fournit n observations quon rparti en K
modalits (dans le cas discret) ou K
classes (dans le cas continue), notes
C
1
, C
2
,, C
K
aux quelles on associe les
effectifs alatoires N
1
, N
2
,, N
K
de
Ralisations n
o1
, n
o2
,, n
ok
; on a alors les
contraintes suivantes :
On pense que ces observations
proviennent dune loi thorique L. A fin de
n n et n N
k
i
oi
k
i
i
= =

= = 1 1
proviennent dune loi thorique L. A fin de
tester cette hypothse, on pose :
L
L

X H
X H
:
#
:
1
0
Sous H
0
, la loi L fait correspondre
C
1
, C
2
,, C
K
les probabilits p
1
, p
2
,, p
K
et
par suite les effectifs thorique
n
t1
= np
1
, n
t2
= np
2
,, n
tk
= np
k ,
avec :
I) Cas o la loi ne dpend pas
n n
k
i
i t
=

=1
I) Cas o la loi ne dpend pas
de paramtres
Soit la statistique :
( )

=
k
i
ti
ti i
n
n N
D
1
2
2
Thorme :
Si n D
2

2
k-1
Do la rgle de dcision du test : Do la rgle de dcision du test :

>

0
2
; 1
2
0
2
; 1
2
H pas rejette ne on
H rejette on

k
k
d Si
d Si
O :
( )
( )
n
n
n
n n
d
k
oi
k
i
ti
ti oi
=

=
2
1
2
2
Remarque : 1) le ddl (k-1) vient du fait
que les N
i
sont lis par la relation
n N
k
i
i
=

=1
( )
n
n
i
ti
oi
=

=1
Remarque : 2) le thorme sapplique si
, quitte regrouper les classes
qui ne vrifient pas la condition.
1) Ajustement 1 loi Uniforme discrte
Exemple : considrons l exprience suivante
effectue avec un d. On dsire vrifier si ce
i np
i
5
effectue avec un d. On dsire vrifier si ce
d est rellement bien balanc. Aprs 96
essais, on obtient les rsultats suivants:
Quelle conclusion peut-on tirer de cette
exprience ? (= 5%).
Rsultats 1 2 3 4 5 6
Frquences observes 12 18 20 13 10 23
Modalit x
i
n
oi
p
i
n
ti
= np
i
1 12 1/6 16
2 18 1/6
16
3 20 1/6
16
4 13 1/6
16
4 13 1/6
16
5 10 1/6
16
6 23 1/6
16
On met deux hypothses :

X H
X H
:
#
:
1
0
{ } 6 , , 2 , 1
{ } 6 , , 2 , 1
Peut-on rejeter H
0
au risque de 5% ?

>
0
2
; 5
2
0
2
05 , 0 ; 5
2
H pas rejette ne on
H rejette on

d Si
d Si
x
i
n
oi
n
ti
(n
ti
- n
oi
)
2
[(n
ti
- n
oi
)
2
]/n
ti
1 12 16 16 1
2 18 16 4 0,25
3 20 16 16 1
4 13 16 9 0,56 4 13 16 9 0,56
5 10 16 36 2,25
6 23 16 49 3,06
TOTAL 96 96
d
2
=8,12
Or d
2
= et
2
=
Do on ne peut rejeter H
0
au niveau 5%.
II) Cas dune loi discrte
dpendant de paramtres
Soit la statistique :
Thorme :
( )

=
k
i
ti
ti i
n
n N
D
1
2
2
Thorme :
Si n D
2

2
k-m-1
o m est le nombre de paramtres
estimer.
= i
ti
n
1
1)Ajustement 1 loi de poisson
Exemple : Le nombre daccidents de
travail en une journe pour une priode
de 100 jours est rparti comme suit :
Modalit x
i
0 1 2 3 4 5 6
TOTAL
Tester au risque de 5% si les donnes
proviennent d1 loi de poisson.
Effectif n
i
13 27 27 19 9 4 1
100
On met deux hypothses :
c ()
c ()

X H
X H
:
#
:
1
0
R.D (puisque est le seul estimer) :

>

0
2
; 2
2
0
2
; 2
2
H pas rejette ne on
H rejette on

k
k
d Si
d Si
Estimation de :
27
13
n
oi
27 1
0 0
n
oi
x
i
Modalit x
i
2
100
200

1
= = =

=
n
x n
k
i
i oi

100
1
4
9
19
27
200 TOTAL
6 6
20 5
36 4
57 3
54 2
Le Tableau thorique pour =2 :
x
i
p
i
n
ti
= n p
i
0 0,1353 13,53
1 0,2707 27,07
2 0,2707 27,07
3 0,1804 18,04
4 0,0902 9,02 4 0,0902 9,02
5 0,0361 3,61
6 0,0120 1,20
7 0,0034 0,34
8 0,0009 0,09
9 0,0002 0,02
TOTAL 1
5,26
K=6
x
i
n
oi
n
ti
(n
ti
- n
oi
)
2
[(n
ti
- n
oi
)
2
]/n
ti
0 13 13,53 0,2809 0,0208
1 27 27,07 0,0049 0,0002
2 27 27,07 0,0049 0,0002 2 27 27,07 0,0049 0,0002
3 19 18,04 0,9216 0,0511
4 9 9,02 0,0004 0
5 et + 5 5,26 0,0676 0,0129
TOTAL 100 100 d
2
=0,0852
d
2
= 0,0852 et
2
4; 0,05
= 9,49
Do on ne peut rejeter lide que les
donnes proviennent dune loi de poisson
2
% 5 ; 4
2
< < d
donnes proviennent dune loi de poisson
III) Cas dune loi continue
dpendant de paramtres
1)Ajustement 1 loi Normale
Exemple : Est ce que les donnes ci-
dessous reprsentant la distribution de dessous reprsentant la distribution de
685 mnages selon le revenu en
centaines de DH- proviennent dune
population normalement distribue ?
( = 5%).
Le Tableau observable :
Classes n
i
x
i
[5 , 15[ 41 10
[15 , 25[ 75 20
[25 , 35[ 62 30
[35 , 45[ 226 40
n
i
x
i
n
i
x
i
2
410 4100
1500 3000
1860 55800
9040 361600
[35 , 45[ 226 40
[45 , 55[ 89 50
[55 , 65[ 109 60
[65 , 75[ 83 70
TOTAL 685 -----
9040 361600
4450 222500
6540 392400
5810 406700
29610 1473100
On met deux hypothses :
H
0
X N NN N( , , , ,
2 22 2
)
H
1
X N NN N( , , , ,
2 22 2
)
Estimation de et de
2
:
cdh
n
x n
x
i
i oi
2263 , 43
685
29610

7
1
= = = =

4123 , 282
1

282
5111 , 1868
685
1473100

685
2 2 2
2
7
1
2
2
=

= =
= =

=
e
i
i oi
e
s
n
n
s
x n
s

R.D.

>

0
2
; 3
2
0
2
; 3
2
H pas rejette ne on
H rejette on

k
k
d Si
d Si
1 n
Posons :
N NN N(0 0 0 0 , , , , 1 11 1) sous H
0

=
X
Z
Le Tableau thorique :
[z
i-1
; z
i
[ p
i
n
ti
(n
ti
-n
oi
)
2
/n
ti
]- ; -1,68[
0,0465 31,8525 2,6270
[-1,68 ; -1,08[ 0,0936 64,1160 1,8476
[-1,08 ; -0,49[ 0,1720 117,8200 26,4460 [-1,08 ; -0,49[ 0,1720 117,8200 26,4460
[-0,49 ; 0,11[ 0,2317 158,7145 28,5250
[0,11 ; 0,70[ 0,2142 146,7270 22,7116
[0,70 ; 1,30[ 0,1452 99,4620 0,9147
[1,30 ; + [
0,0968 66,3080 4,2020
TOTAL
1,0000 685 87,2739
d
2
= 87,2739 et
2
= 9,49
2
% 5 ; 4
2
> > d
Do on peut rejeter lide
que les donnes proviennent
dune loi NORMALE.
II
1-Test de Kolmogorov
--
Smirnov
Le test de Kolmogorov-Smirnov est un test
d'ajustement une loi continue. On extrait
un chantillon alatoire (X
1
, X
2
, , X
n
) de
fonction de rpartition observe . On pense
que cet chantillon provient dune population
distribue selon une loi L LL L inconnue de
fonction de rpartition thorique F
0
. Le test se

F
fonction de rpartition thorique F
0
. Le test se
formule comme suit :
H
0
: X L LL L
ou #
H
1
: X L LL L

=
0 1
0 0

:
#

:
F F H
F F H
{
O :
La rgle de dcision se base sur lcart
maximal entre les deux fonctions de
rpartitions; plus cet cart est grand plus
on a tendance rejeter lhypothse nulle:
( ) empirique n rpartitio de fonction la est x F

on a tendance rejeter lhypothse nulle:


o x
(i)
est la i
me
ralisation par ordre
( )
( )
( )
( )
( )
( )
( )
( )
{ }
0 0
1
1, ,

max ,
i i i i
i n
D F x F x F x F x

=
=

Exemple : Un chercheur entreprend une tude pour valuer si


la distribution de la dure que prend la migraine chez des
patients pour rpondre une dose dun mdicament
administre est normal, avec un temps moyen de rponse de
90 secondes et un cart type de 35 secondes
(c.--d., N(90 , , , , 35
2
)). On relve chez 7 patients le temps (en
secondes)que met la migraine pour disparatre aprs
l'administration du mdicament. Aprs classement par ordre l'administration du mdicament. Aprs classement par ordre
croissant, on obtient : 21, 32, 38, 90, 90, 145, 155.
Les donnes proviennent-elles dune loi normale
N(90,35
2
) ?
F.H.
H
0
: X N(90,35
2
)
ou #
H
1
: X N(90,35
2
)
Stat. Utilise :
Loi de D : lire dans la table de K-S

=
0 1
0 0

:
#

:
F F H
F F H
{
( )
( )
( )
( )
( )
( )
( )
( )
{ } 0 0 1
1, ,

max ,
i i i i
i n
D F x F x F x F x

=
=

Loi de D : lire dans la table de K-S


RD.
A.N. on range les x
i
par ordre croissant puis on calcul
avec n
j
leffectif de la modalit x
j
; 0
; 0
n
n
S i d d on R H
S i d d on N R H

>

i
j
j
i
i
n
N
F
n n
=
= =

x
i
z zz z
i
F
0
21 -1,97
0,0244 1/7
0,1184 +0,0244
32 -1,66
0,0485 2/7
0,2373 0,0944
38 -1,49
0,0681 3/7
0,3605 0,2176
90 0
0,5000 5/7
0,2143 +0,0714
F
( ) ( )
i i
x F x F
0 1

( ) ( )
i i
x F x F
0


d
d
0,3605=d=sup(d,d)<d
0 00 0, ,, ,05 05 05 05;7
=0,483 : on ne peut
donc rejeter H
0
(table de Kolmogorov-Smirnov)
145 1,57
0,9418 6/7
+0,0846 +0,2275
155 1,86
0,9686 1
0,0314 +0,1114
d
Remarques :
Le test de lAjustement de
2 22 2
est utilis pour X qualitative,
discrte, ou ventuellement continue regroupe en classes
Le test de Kolmogorov-Smirnov est utilis pour des lois
continues et parfois pour X qualitative ordinale
Le test de Kolmogorov-Smirnov est meilleur que celui
de lAjustement de
2 2 2 2
lorsque : de lAjustement de
2 2 2 2
lorsque :
a)-la taille de lE.A. est petite
b)- les effectifs thorique du
2
sont faibles.
Si les paramtres de la loi thorique sont
inconnus, on utilise une extension du test de
Kolmogorov-Smirnov qui sappelle le test de Lilliefors
II
2- Test de Lilliefors 2- Test de Lilliefors
Exemple :
On reprend lexemple prcdent mais en supposant que les
paramtres ( et ) sont inconnus.
Dabord on les estime, on trouve que

=
=
13 , 54

57 , 81

x
i
z zz z
i
F
0
21 -1,12 0,1314
1/7 0,0115 +0,1314
F
( ) ( )
i i
x F x F
0


( ) ( )
i i
x F x F
0 1

21 -1,12 0,1314
1/7 0,0115 +0,1314
32 -0,92 0,1788
2/7 0,1069 +0,0359
38 -0,8 0,2119
3/7 0,2167 0,0739
90 0,16 0,5636
5/7 0,1507 +0,1350
145 1,17 0,8790
6/7 +0,0219 +0,1647
155 1,36 0,9131
1 0,0869 +0,0559
d
d
0,2167=d=sup(d,d)<d
0 00 0, ,, ,02 02 02 02;7
=0,348 : on ne peut
donc rejeter H
0
(Utilisez la table de Lilliefors)

>
0 ;
0 ;
NRH on d d Si
RH on d d Si
RD
n
n

ANALYSE UNIVARIE
A- Cas de deux A- Cas de deux
chantillons
indpendants
I
Test du Kolmogorov
--
smirnov
Il permet de tester si deux chantillons
indpendants sont extrait de la mme
population.
Il compare deux distributions cumulatives et
est concern par la concordance entre deux
sries de valeurs
On met deux hypothses :

=
2 1
F F H :
0
Le test est bas sur l'cart maximum entre les
deux fonctions de rpartitions empiriques :

2 1
F F H
#
:
1
( ) ( ) { } X F X F D
n i
2 1
, , 1
max =
=
Exemple : Un enseignant a not deux groupes
dtudiants (alatoirement choisis) :
Groupe 1 : 11 - 1 - 0 - 4 - 0
Groupe 2 : 11 - 11 - 5 - 8 - 3
Est-ce que les deux
x
i
y
i
F
1
F
2
|F
1
-F
2
|
0-0 - 2/5 0/5 0,4
populations sont
Identiquement
distribues?
d=0,6 d
0,05;5;5
=0,8
NRH
0
0-0 - 2/5 0/5 0,4
1 - 3/5 0/5 0,6
- 3 3/5 1/5 0,4
4 - 4/5 1/5 0,6
- 5 4/5 2/5 0,4
- 8 4/5 3/5 0,2
11 11-11 5/5 5/5 0
II
Test U
de
Mann-Whitney Mann-Whitney
; ; ; ; gx U|tt xxx 4 gx U|tt xxx 4 gx U|tt xxx 4 gx U|tt xxx 4< < < <
pour le test Unilatral voir T.D.
Cest lquivalent du test t pour la comparaisons de 2
moyennes (E.A. indpendants)
Cest donc un test de comparaison des moyennes lorsque
lhypothse de normalit ou de lgalit des variances
(pour 2 chantillons de tailles faibles) sont violes.
On met deux hypothses :
H
0
: Les deux chantillons proviennent dune population
identique (mme moyenne)
H
1
: Les deux chantillons proviennent de populations
diffrentes
Dcision : le test de Mann-Whitney est bas sur
la statistique min (U
1
,U
2
) o :
2
2 2
2 1 2
1
1 1
2 1 1
2
) 1 ( *
*
2
) 1 ( *
*
R
n n
n n U
et
R
n n
n n U

+
+ =

+
+ =
o n
1
et n
2
sont les tailles respectives des deux
chantillons et R
i
est la somme des rangs du i
me
chantillon. Les 2 chantillons tant mlange en
un seul puis on range ce dernier par ordre croissant.
A chaque valeur on affecte un rang. Si deux valeurs
sont gales, on leur assigne le rang mdian.
Si n
1
et n
2
20 : On rejette H
0
quand la valeur calcule est
infrieure celle lue dans la table de Mann-Withney.
Remarque:
( ) ( )
1 2 1 2
1 2 1 2 1 2
1
2
n n n n
U U n n et R R
+ + +
+ = + =
Exemple : On veut tester laptitude de 12
femmes et de 12 hommes pour un certain
travail administratif. Voici les points obtenus:
Femmes: 82 87 89 91 91 76 74 70 88 99 61 94
Hommes: 80 79 92 65 70 84 95 78 81 85 73 70
a)F.H.
H
0
:
1
=
2
H
1
:
1

2
b) b) b) b) Statistique utilise : U=min(U : U=min(U : U=min(U : U=min(U
1 11 1
, U , U , U , U
2 22 2
) )) )
C) Loi de U: table de Mann-Whitney Car(n
1
; n
2
) 20
d) R.D.

d) R.D.
e) A.N.
On range les 24 valeurs par ordre croissant. On
obtient le classement suivant:
1 2
1 2
0,05; ; 0
0,05; ; 0
on rejette H
on ne rejette pas H
n n
n n
Si u u
Si u u
<

61 65 70 70 70 73 74 76 78 79 80 81 82 84 85 87
F H F H H H F F H H H H F H H F
88 89 91 91 92 94 95 99
F F F F H F H F
On a :
12 = = et n n
53 91 53
131
169
12
2 1
2
1
2 1
= = =
=
=
=
=
= =
U U et U
23 + 21 + 15 + 14 + 12 + 11 + 10 + 9 + 6 + 4 + 4 + 2 R
24 + 22 +
19,5 + 19,5 + 18 + 17 + 16 + 13 + 8 + 7 + 4 + 1 R
et n n
Or daprs la table de Mann-Withney (bilatral) :
Do on ne peut rejeter H
0
Remarque :
On peut montrer que
37
12 ; 12 ; 05 , 0
= < U U
( ) ( )
( )
12
1
2
2 1 2 1 2 1
+ +
=

=
n n n n
U V et
n n
U E
Si n
1
; n
2
> 20 :
N NN N(0,1)
( ) ( )
12 2
= = U V et U E
( )
( ) ( )

+ +

12
1
2
2 1 2 1
2 1
n n n n
n n
U
U V
U E U
Pour notre cas :
On ne peut rejeter H
0
=
=

=
96 , 1
097 , 1
300
72 53
025 , 0
z z
z
ANALYSE UNIVARIE
B- Cas de deux B- Cas de deux
chantillons
dpendants
I
Test T
de de
Wilcoxon
On dispose de deux sries de mesures : x
1
, x
2
, ... , x
n
et y
1
, y
2
, ... , y
n
, de variables X et Y continues, sur
les mmes n individus.
On classe les n
diffrences x
i
- y
i
par ordre croissant
X Y |D|=|X-Y|
Signe de la
diffrence
Rang
x
1
y
1
|d
1
| - r
i
. . . - .
. . . - .
par ordre croissant
de leurs valeurs
absolues, puis on
note les rangs des
diffrences >0
(notes +) dans
l'interclassement.
. . . - .
. . . + .
. . . + .
. . . - .
. . . + .
. . . - .
. . . - .
. . . + .
x
n
y
n
|d
n
| - r
n
Si H
0
est vraie, X et Y sont de mme loi, chaque
diffrence peut tre > 0 ou < 0 avec la probabilit 1/2.
s'il y a des diffrences nulles, on enlve les mesures
correspondantes.
On vrifie ensuite si la somme des rangs des
diffrences positives diffre ou non de la somme des
rangs des diffrences ngatives. La somme de tous les rangs des diffrences ngatives. La somme de tous les
rangs est gale la somme des n premiers entiers :
avec n = nombre de paires non nulles
( )
2
1 +
= +
+
n n
R R
L'hypothse nulle, scrit alors :
Si au contraire, les sries diffrent, les sommes
des rangs positifs et ngatifs seront diffrentes.
( )
( )
4
1
2
2
1
:
0
+
=
+
= =
+
n n
n n
R R H
des rangs positifs et ngatifs seront diffrentes.
Le test en T consiste comparer les rangs
positifs ou ngatifs la valeur thorique sous
H
0
.
Soit T
+
= la somme des rangs positifs et
T
-
= la somme des rangs ngatifs, on prend
la plus petite des deux valeurs, donc
T = min(T
+
;T
-
), et on lit la valeur thorique de T
dans la table, en fonction du nombre "n" de paires
non nulles. La diffrence n'est jamais significative, si
+
R

R
non nulles. La diffrence n'est jamais significative, si
"n" est infrieur 5 (voir table).
Si T observ >= T thorique, on ne peut rejeter H
0
do il n'existe pas de diffrence significative entre
les deux sries.
Exemple : soit un chantillon de 7 consommateurs qui
notent 2 produits : Pour notre cas :
N cons Prod A Prod B |d| Signe rang
1 9 6 3 + 5
2 7 5 2 + 3
3 4 8 4 - 7
4 7,5 9 1,5 - 2
T
+
=5+3+6+4=18 T
-
=7+2+1=10 =10
Or T >T
0,05;7
=2 on ne peut rejeter
0
4 7,5 9 1,5 - 2
5 8,5 5 3,5 + 6
6 7,5 5 2,5 + 4
7 5 6 1 - 1
T tend vers une Loi normale si le nombre de paires
est suffisamment grand, c'est dire > 20 Dans ce
cas
N NN N(0,1)
ANALYSE BIVARIEE
Cas de deux Variables
I
Test
sur le coefficient sur le coefficient
de corrlation
des rangs
de spearman
Si lune des conditions du test du coefficient de
corrlation de pearson nest pas vrifie, on
utilise alors un test non paramtrique : le
coefficient de corrlation des rangs de
Spearman, qui utilise le rang des variables et non Spearman, qui utilise le rang des variables et non
leurs valeurs.
Il tudie lexistence dune liaison entre 2 variables
quantitatives.
On dfinit x
i
et y
i
les rangs des valeurs observes
de X et de Y.
On dfinit r
s
le coefficient de corrlation des rangs
de Spearman.
( )
( ) 1
6
1
2
2

=

n n
y x
r
i i
S
03/12/2013
Si |r
S
|observ >= r
S;
thorique (lu sur la table de
Spearman), on peut rejeter H
0
:
S
=0
do il existe une liaison significative entre les deux
variables.
( ) 1 n n
Si n>10; on peut approximer la loi de la statistique .
O S
r
est lcart type du coefficient de Spearman :
( )
2
2
2
1
S
S
r
S
r n
t r t n
S
r

= =

03/12/2013
O S
r
est lcart type du coefficient de Spearman :
2
1
2

=
n
r
S
S
r
R.D.
Exemple
Une entreprise dsire tester sil y a un lien entre les statistiques
des ventes de ses employs et les cours de perfectionnement
offerts tout son personnel. Un test pass par 9 vendeurs ayant
( )
( )

>
0 2 /
0 2 /
H pas rejette ne on 2 - n t t Si
H rejette on 2 - n t t Si

offerts tout son personnel. Un test pass par 9 vendeurs ayant


suivi le cours donne un classement de leur aptitude la vente.
En utilisant les statistiques sur les ventes, on obtient alors les
classements suivants:
vendeur n
o
: 1 2 3 4 5 6 7 8 9
rang du test 5 4 6 3 9 1 7 8 2
rang des ventes 9 5 1 4 8 7 2 3 6
d
i
= x
i
y
i
-4 -1 5 -1 1 -6 5 5 -4
On calcule r
s
le coefficient de corrlation des rangs
de Spearman.
( )
22 ,
720
876
1
1 81 9
146 6
1 = =

=
S
r
03/12/2013
Donc le r
S;5%
thorique vaut 0,7
|r
S
|=0,22 < 0,7 (lu sur la table de Spearman), on ne
peut rejeter H
0
, do la liaison entre les cours de
perfectionnement et les ventes nest pas
significative 5%
03/12/2013
significative 5%
II
Test du Khi-deux Test du Khi-deux
B- Test dindpendance de
2 22 2
Soient X et Y deux V.A. qualitatives, sur
une mme population, de modalits resp
es
X :
m i
x x x x ; ; ; ; ;
2 1

X :
Y :
Le tableau suivant rsume la situation
m i
x x x x ; ; ; ; ;
2 1

k j
y y y y ; ; ; ; ;
2 1

1-TABLEAU DE CONTINGENCE
Y
X
y
1
y
2
y
j
y
k
TOTAL
x
1
n
11
n
12
n
1k
n
1.
x
2
n
21
n
22
n
2k
n
2.

x
i
n
ij
n
i.
x
m
n
m1
n
m2
n
mk
n
m.
TOTAL
n
.1
n
.2
n
.j
n
.k
n..


On a les relations suivantes :

=
k
j
ij i
n n
1

=
m
i
ij j
n n
1

= = =
k m
ij
m k
ij
n n n n

= = = =

= = =
j i
ij
i j
ij
n n n n
1 1 1 1
( )
( ) Y X
y Y x X P p
j i ij
, de conjointe probabilit
; ; = = =
( )
X
x X P p
i i
de marginale probabilit
; = =

( )
Y
y Y P p
j j
de marginale probabilit
; = =

On dsire savoir si X est indpendante


de Y; pour ce faire, on confronte les deux
hypothses suivantes :
Y de marginale probabilit
j i ij
p p p Y X

= Si
On met deux hypothses :

lies sont et :
#
tes indpendan et :
1
0
Y X H
Y X H
On remarque : sous H
0

lies sont et :
1
Y X H
j i ij
p p p

=
Estimons :

=
=


n
n
p par p
n
n
p par p
j
j j
i
i i

Sous H
0

=
n
n
p par p
n
ij
ij ij

ij t
j i
j i ij ij
n
n
n n
p p n p n n =

= =



Posons
Thorme :
Si n D
2

2
(k -1)(m-1)
( )

= =

=
m
i
k
j
ij t
ij t ij
n
n N
D
1 1
2
2
R.D
( )( )
( )( )

>


0
2
; 1 1
2
0
2
; 1 1
2
H pas rejette ne on
H rejette on

m k
m k
d Si
d Si
Exemple : On a relev les principales
dfectuosits sur quelques modles de
moto-neiges comme suit :
Y
X
Electrique Mcanique Total
Lynx 105 95 200
Tester au risque de 5% si on a les
mmes types de dfectuosits quelque
soit le modle ?
Renard 100 60 160
Total 205 155 360
On met deux hypothses :

lies sont et :
#
tes indpendan et :
1
0
Y X H
Y X H
R.D.

>
0
2
05 , 0 ; 1
2
0
2
05 , 0 ; 1
2
H pas rejette ne on
H rejette on

d Si
d Si
Le calcul de la ralisation d
2
:
n
ij
n
t ij
=(n
i .
n.
j
/ n)
(n
ij
-n
t ij
)
2
/n
t ij
(1,1) 105 113,8889 0,6938
(1,2) 95 86,1111 0,9176
(2,1) 100 91,1111 0,8672
(2,2) 60 68,8889 1,1470
Or do
On ne peut donc rejeter lindpendance
(2,2) 60 68,8889 1,1470
TOTAL 360 360 3,6256
8415 , 3
2
05 , 0 ; 1
=
2
05 , 0 ; 1
2
d

You might also like