You are on page 1of 14

c c 

 






 


L¶analyse multidimensionnelle est une collection d¶instrument de


statistique descriptive qui a pour but de décrire des données
consignées .l¶analyse multidimensionnelle se devise en analyse factorielle (À
savoir ACP, AFC, AFD) et classification automatique. Dont le but de réduire
le nombre de caractères, non sous forme d'une simple sélection de certains
d'entre eux, mais par construction de nouveaux caractères synthétiques obtenus
en combinant les caractères initiaux (méthode factorielle).
Le choix de la méthode optimale dépend généralement des objectifs de
l¶étude, la structure générale du tableau de données, la nature des variables
(quantitatives ou qualitatives) et la métrique utilisée pour mesurer les liens.

Afin d¶avoir une bonne visualisation l¶analyse des données


multidimensionnelles permet de passer d¶un espace à p dimensions à un sous
espace vectoriel à k dimensions (où k<p), résumant la structure du nuage de
points sans trop perdre d¶informations. Elle offre également une possibilité
élargie d¶interprétation du fait de la distinction entre :

Ƈ Variables actives ou principales : contribuant à la formation des axes


factoriels,

Ƈ Variables passives ou secondaires : qui peuvent être rajoutées pour des


besoins d¶analyse et d¶interprétation.

Il est à signaler qu¶une attention, toute particulière, doit être accordée à la


phase de collecte des données et à leur organisation de façon à obtenir une
matrice exploitable, en effet, la consistance des résultats à obtenir repose
essentiellement sur la fiabilité des données de cette matrice.

Notre travail porte sur un problème traitant un exemple de l¶ACP.

  

Les techniques d'Analyse des Données se sont développées à partir des


années 70 grâce à l'essor de l'informatique dans le domaine scientifique ( langage
Fortran). Les méthodes d'Analyse des Données comme l'Analyse Factorielle
utilisent des distances et connaissent un grand succès pour le traitement
d'ensembles importants de données. A la même époque, en Intelligence
Artificielle se développèrent les méthodes d'Apprentissage Symbolique qui
poursuivaient des objectifs similaires : extraire des connaissances à partir de
données représentées dans le formalisme de la logique. Aujourd'hui les
méthodes d'analyse des données continuent à être étudiées et c eci sous des
angles divers : dan le cadre de la théorie des ensembles flous (fuzzy set), de
l'approche connexioniste (réseaux de neurones), des graphes probabilistes
(réseaux bayesiens) et dans des contextes variés : bases de données (Data
Mining) ou de la toile (Web mining).

·   
 

Les objectifs des méthodes d'Analyse des données sont résumés ci -dessous:

‡Y Exploration des données


‡Y Réduction des données
‡Y Classification
‡Y Prédiction
‡Y Génération d'hypothèses
‡Y Validation d'hypothèses

·  
  
  

Les principales étapes d'une analyse de


données sont : f. Formulation du problème,
choix des objectifs

2.Y Elaboration du plan de recherche, des hypothèses à vérifier


3.Y Recueil des données
4.Y Analyse des données
5.Y Interprétation des résultats

·   

Les données consistent en un ensemble d'observations (ou individus)


caractérisées par un ensemble d'attributs (ou variables). Les variables peuvent
être de type numérique (quantitatif) ou symbolique (qualitatif ordonné ou non).
Les valeurs doivent être codées numériquement, les données se présentent alors
comme une matrice de nombres réels.
ï   
 ï

Les méthodes multifactorielles permettent d'obtenir des représentations graphiques qui


constituent le meilleur résumé possible de l'information contenue dans un grand tableau de
données. Pour cela, il faut consentir à une perte d'information afin de gagner en lisibilité. En
fonction des phénomènes que l'on veut étudier et de la nature du tableau de données dont on
dispose, on appliquera telle ou telle méthode multifactorielle. En effet, il n'existe pas une
méthode factorielle d'analyse des données, mais un ensemble de méthodes, reposant toutes sur
les mêmes théories mathématiques. Ainsi, on trouvera les principales méthodes
suivantes :Y

-ACP : Analyse en Composantes Principales, pour les tableaux de variables


quantitatives.
-AFTD : Analyse Factorielle d'un Tableau de Distances, pour les tableaux de
distances.
-AFC : Analyse Factorielle des Correspondances, pour les tableaux de
contingence.
-ACM : Analyse des Correspondances Multiples, pour les tableaux de variables
qualitatives.
-STATIS : Structuration des Tableaux A Trois Indices de la Statistique, AFM :
Analyse Factorielle Multiple, DACP : Double Analyse en Composante
Principale, sont quelques méthodes basées sur les précédentes et adaptées à
l'étude de phénomènes temporels ou de répétition.
-la liste n'est pas exhaustive. Y

Ces méthodes reposent toutes sur les mêmes notions théoriques, mais chacune
produit un genre de résumé spécifique et s'applique sur un types de donnée
précis. C'est pourquoi on devra choisir la méthode la plus adaptée au type
d'information que l'on possède et aux phénomènes qu'on veut étudier. Y

L'ACP fait en réalité partie d'un ensemble de méthodes d'analyse de données,


appelées méthodes multifactorielles. De façon générale, celles -ci ont pour but de
résumer de la façon la plus fidèle po ssible un grand ensemble de données, c'est -
à-dire d'observations différentes (les variables) pour chaque membre d'une
importante population d'étude (les individus). Ce résumé engendre toujours une
perte d'information, mais c'est au profit des informations les plus pertinentes et
de la lisibilité, donc de la meilleure interprétation. Y

 c
Il existe plusieurs approches différentes de l'ACP, mais toutes s'accordent sur les
conditions de son application et son objectif général.
Cette méthode s'applique aux ensembles de données quantitatives d'au moins
deux variables.
Puisqu'il s'agit d'une méthode d'analyse de données multifactorielle, son but est
de résumer cet ensemble de données. Ceci se fait selon les modalités suivantes : Y

`Y fournir des outils simples et lisibles de représentation des informations


traitées, permettant de faire ressortir des données brutes les éventuels liens
existant entre les variables (en terme de corrélation), Y
`Y donner des indications sur la nature, la force et la pertinence d e ces liens,
afin de faciliter leur interprétation et découvrir quelles sont les tendances
dominantes de l'ensemble de données, Y
`Y réduire efficacement le nombre de dimensions étudiées (et ainsi simplifier
l'analyse), en cherchant à exprimer le plus fidèlement possible l'ensemble
original de données grâce aux relations détectées entre les variables. Y

c
 



c




Simplicité mathématique: L'ACP est une méthode factorielle car la réduction du


nombre des caractères ne se fait pas par une simple sélection de certains d'entre
eux, mais par la construction de nouveaux caractères synthétiques obtenus en
combinant les caractères initiaux au moye n des "facteurs". Cependant, il s'agit
seulement de combinaisons linéaires. Les seuls véritables outils mathématiques
utilisés dans l'ACP sont le calcul des valeurs/vecteurs propres d'une matrice, et
les changements de base.Sur le plan mathématique, l'ACP est donc une méthode
simple à mettre en oeuvre.Y

Simplicité des résultats : Grâce aux graphiques qu'elle fournit, l'Analyse en


Composantes Principales permet d'appréhender une grande partie de ses
résultats d'un simple coup d'oeil.Y

ïuissance : L'ACP a beau être simple, elle n'en est pas moins puissante. Elle
offre, en quelques opérations seulement, un résumé et une vue complète des
relations existant entre les variables quantitatives d'une population d'étude,
résultats qui n'auraient pas pu être obtenus autr ement, ou bien uniquement au
prix de manipulations fastidieuses.Y

ðlexibilité : L'ACP est une méthode très souple, puisqu'elle s'applique sur un
ensemble de données de contenu et de taille quelconques, pour peu qu'il s'agisse
de données quantitatives organi sées sous forme individus/variables. Cette
@ l @@tili@ti @t it@ t t li  @it @li ti @
l
C  it  t @l@ i@  @@l ti  tY

  



 


tt t l @ @l
C @ llt
i it@@ ill@li @ilt@ @ @  i@t  
  t  @ltt ti li C it   @@i  
@ti itl
C  ll@li @ @ 
tttt  il@ittt tt i  @
 @l ti ti  t @t@
i iti@ltôt iti  tti  @ltt@ill
lt  i@@   t i@ti @  tt  @tti@@  ti@ @
 ti li @Y

Y

  
Y  !  "YY #YY

YYYYYYYYYY?
YY Y
Y
Y
Y
  
Y

 Y 
Y

Y
Y
Y  Y
Y 
Y
Y  Y
Y
Y
Y
Y

Y YY
Y
Y
Y
 Y

Y 
 Y Y 
Y
Y
  Y
YY
Y 
YY
  YY
Y

Y Y
Y Y Y
Y
Y 
Y
YY
Y 
Y

Y
YYY 
Y Y

Y
Y  
Y Y
Y
 
Y
YY Y

Y
Y Y
Y

Y YY

Y
Y
Y
Y
 
Y 
Y
Y
 Y
YY  Y
Y
  Y
YY Y „¢YY Y
Y Y
 
YY
Y

Y
Y

 Y Y 
Y Y  
Y
Y
YY 
Y Y
Y
Y

Y

Y!
Y
Y

Y
Y
Y
Y Y Y
 "

Y
Y 
Y Y

Y
Y
Y Y ##Y
Y
 $
Y Y
$
Y
Y Y "

Y Y 
Y Y Y
YY
Y
Y


Y
Y
Y "

Y 
Y
? Y 
Y 
 Y ‘Y 
Y
Y 
Y
Y   Y#  YY



Y
Y  Y Y Y 

Y Y Y
 Y
Y
Y
%
YY
Y &'Y
Y 
Y
Y

 Y Y  Y#
Y 
Y
Y 
Y‘Y
Y
Y (
 Y Y Y

Y
Y#
Y
 Y Y
Y
Y$
$
Y Y 
Y
Y)Y  Y)Y

Y
Y   Y
Y ‘Y
Y
 Y
 (
 Y%
Y

Y
Y

 Y$   Y Y
Y

Y
##
Y 
Y  ¢Y%Y#   Y$ 
Y
Y &'Y
Y  Y
Y  
Y Y

ï 
ï Y

´ 
Y
Y  *

Y##
Y| Y
Y
 Y Y + Y


Y ,-¢Y
Y
Y Y

YY 
Y ‘YY Y Y


Y | Y Y Y Y

Y
&
YY

Y
Y
Y
Y  Y  
YYY

YY   Y Y


Y  Y'$
Y Y Y
Y YY  Y Y
%Y YY
 Y Y
Y 
Y Y Y
Y    YY  Y

Y  Y Y
Y.
Y   Y
a YY  
Y # 
YY Y 
Y Y Y
Y Y 
Y
Y
 
Y## 

YY/Y Y 
Y
 Y Y Y 
Y01 6Y Y
Y Y
  YYY  YY Y  YY Y Y
YY Y Y   YYYY Y Y  YY Y
  Y Y YY  Y YY
Y  YY Y Y
YY Y Y   YY Y Y  Y  Y Y
 Y Y YY Y  Y YY Y Y  Y
YYYY Y Y  YYYY Y Y Y YY

!YY  YY
  Y Y  YY Y Y YY
YY
YY Y YY YYY  "  Y
 Y#  YY Y

 Y
 Y YY YYY Y Y YYY Y $Y

%Y  YY Y Y YY YY YY


  Y Y&YY

´ 
Y
Y  *

Y
 
Y | Y
Y
 Y Y + Y


Y ,-¢Y
Y
Y Y

YY 
Y ‘YY Y Y



Y | Y Y Y
Y Y
Y
Y
Y 

Y
Y
 YY

Y
'YY  YY Y Y 
Y&Y

`Y YY YY  Y 

Y Y Y 
YY 2Y

`Y YY Y-Y * $   Y Y|Y  Y 



Y 2Y
Y 
YY Y
`Y YY

`Y YY Y Y * $   Y Y| Y  Y 



Y
2Y Y 
YY Y
? Y 
Y#

Y
Y$ Y
Y  *

Y | Y YáY ¢Y Y
 #  Y
Y Y  *

Y##
Y
Y
 YY  Y 

Y

 
Y
? Y 
Y Y Y
Y

YY 
Y ‘YY
Y Y Y
Y
Y
  
Y
Y
Y ¢Y
%Y  Y
Y  Y 

Y
Y   Y
Y   Y 

Y
Y

YY
Y

 Y 
Y  Y
Y Y
Y  Y  Y
 Y
Y
 Y 
Y    
Y#  
Y
Y
Y ·YY


Yu u Y0
Y  Y
Y

Y
 
YY
Y

Y Y 
YY
 Y 
Y ï Y YY# 
Y
Y
Y *
$ 
Y
Y| YY
Y

 Y Y YY #  Y  Y
YY

 Y Y
Y  Y  Y " 
Y
Y

 Y 
Y Y
$  YY
Y
? Y # Y
Y 

Y

Y
 
YY
Y  *

Y| YY Y
# 
Y

Y
Y

3Y Y
Y
Y Y
Y  Y
Y Y 
Y
Y 
 Y Y Y
Y 
Y
Y 
Y
Y
 Y 
Y
YY
Y
Y Y
Y Y
YY  Y YáY  Y„*¢Y
Y Y 
Y
YY

ï ïY4Y5Y
YïëYYï Y,Y5Y Y Y4Y Y

ÈY%
Y 
Y ‘Y
Y  Y


Y Y
Y  *

Y
 
Y |Y


 YY
YY

 Y
Y# 
Y
Y

 u  


ïYY

Y
%
Y  
Y  Y Y 
Y
Y

 YY 
Y ‘Y Y

Y

Y
Y
 Y Y? Y 6Y 
 Y
Y
Y
 #   Y
Y

Y Y  Y 
Y
Y## 

Y


 Y Y ##Y
Y 

Y
Y 
Y
Y Y (
 Y


Y  Y
Y   YY 
Y Y$
Y
Y# 
Y Y 
Y„Y
 
Y Y 
Y Y

%
Y

Y
Y
Y 
Yu uY

? Y
Y  Y 
Y)Y 
Y)YY 
Y‘Y Y Y  Y# 
Y

 
Y  Y ¢Y7
YY   
Y 
Y  Y
Y Y%Y


 Y Y
Y

Y  Y# 
Y
Y 

Y7
Y Y Y
Y-Y
 Y   Y (  

Y Y

 YY  Y Y8¢Y Y
Y
)Y Y)Y
Y 
Y Y
Y  *

Y8Y

%
Y  Y
Y   
Y 
Y
Y#YY$ 

Y
Y
Y
/ Y ##Y
Y#
Y
Y (
 Y $  
Y Y
Y 
Y

 Y
Y

Y& Y Y Y 
Y   
Y 
Y YYY

 3Y 

 Y
Y Y   
Y 
YY Y

YY

 u YY

YYYYYYYYY%
Y   Y$ 
Y  
Y Y
  Y Y
Y

Y   Y

Y
Y Y Y

 Y |YY ()|()*YY

Y Y YY


Y Y Y Y Y
Y Y
YY  YY
 YY

Y&Y
YY |Y&Y
YY
Y+*Y YY Y Y*+Y YY Y YY

YYï YY
YYï YY

YY

 YY Y Y

 Y %
Y|Y Y Y

 Y
*" Y&Y "·
* " Y
YY *"· (·Y,Y*"·Y
 (-Y
Y
*(·Y,Y
Y
* (-Y Y
Y
Y

&Y Y# Y
Y &'Y Y
Y


Y
Y  Y
Y
Y
YY

 Y (
 Y Y Y  Y&Y
Y


Y Y Y (
 Y
Y5Y

Y  Y Y
 
Y Y
Y
Y

/ Y

Y  Y Y 
Y
Y  # Y Y

Y (
 Y
% 
  Y
Y   Y 
##

Y 

Y  YY  Y Y

   u u 


ïYY

YYYYYYYYY  Y Y  Y# 


Y Y Y

Y YY

Y

 
Y? Y

Y Y Y 
Y
Y Y

Y
 
YY
$
Y
Y 

Y
Y.
Y 
 
Y 
Y Y 

Y
Y
 #  YY 
Y  Y
 
YY
Y  Y# 
Y& Y Y

Y
  Y  Y
Y59Y
Y 

Y 
Y
Y

Y
  
 Y0 Y 
Y
Y 
Y
Y 
Y
Y
Y Y  Y
 Y  
Y    Y

Y
Y#Y Y  
Y    Y
Y

 Y 
Y 

Y Y    Y Y Y"YY
 
  
¢Y
Y

Y 
Y
Y
Y

Y  Y# 
Y*Y
  YY
Y
Y

 Y
Y# 
Y*Y Y (  Y
YY

Y
Y  Y$
Y
Y



 Y Y
Y   YY 
Y  Y
Y
 Y Y
Y 
Y
Y 
  Y
Y
Y
Y#  Y  
Y
Y
   Y

Y
Y   
Y 
Y
Y
Y
Y 
Y
Y
Y
Y
Y Y
##
Y
Y   
Y 
Y
Y
Y
   Y  
Y
Y
Y 
YY 
Y
Y:
Y
Y
$
Y   
Y 
Y
Y.
Y 
 YY
Y
Y
 
YY 
Y
Y  Y Y Y  Y Y
Y  Y 
 Y
Y
%  
Y  Y#Y
Y&'Y
Y   Y Y 
Y0 1 ;Y
YY

Y Y

Y Y
Y
Y
Y
Y
 Y
Y Y
Y
##
 Y
Y
   Y  
Y<(¢Y

Y  Y.
Y  YY Y# 
YYY

Y
Y
!
Y#  Y 
Y
Y   Y 
Y Y
Y


Y Y Y
  Y#  YY Y 
Y
Y   
Y 
Y Y
Y-Y 3Y

Y
#
 Y Y Y

Y
Y

Y
Y   Y0 Y
Y  Y

Y
Y Y
Y
 
YY Y  Y
Y 
Y  ¢Y
Y
 
Y  - ¢YY

Y
Y
Y Y

Y   
Y 
Y  Y
Y Y 
Y
Y
Y

Y  Y  Y
Y  YY Y Y  Y Y 
YY
 
Y 
¢Y Y  YY
Y
Y# 

Y
 

Y Y Y "

Y Y Y
Y  Y
Y
0
Y  Y Y# 
Y  
  Y
Y
Y Y  Y Y  Y
Y
„  „Y? Y # Y Y  Y
Y  Y Y Y Y
   
Y YY
Y 
YYY

Y
Y

3Y
Y Y 
Y 
Y
Y Y   
Y 
Y  Y

Y Y#   Y 


Y
Y &'Y    Y
Y 

¢Y Y
Y

Y.
Y  Y Y
Y 
Y
Y 
 Y Y 

Y
Y Y
Y
 Y 
Y  Y)YY  Y Y)Y
Y 


Y
Y   YY

Y= Y  Y
Y   YY 
Y
Y Y Y Y Y $
Y

Y 
Y%Y  Y
Y Y 
Y
Y

Y  Y Y 
Y
& Y
Y  Y" Y
Y
Y  Y
Y  
Y


¢Y Y
YY Y
Y  Y $
Y
Y 
Y
Y Y
YY

Y 
Y
 Y
YY# 
Y Y 
  Y
Y 
YYY
 
Y
Y7
Y Y
Y  Y
Y  YY  Y$
$
Y Y

Y Y
Y Y 
Y/ Y#Y
Y Y
Y Y Y Y
Y Y
Y
Y
Y   Y
.
Y Y
YY Y Y  Y# 
Y  Y Y

Y
 
Y
YY
Y  Y Y Y

Y 3Y
Y Y
YY
Y

Y# 
Y 

Y 
YY 
Y  Y Y
 Y
Y

Y! Y Y "
Y
Y 
Y 
Y

Y
Y Y
Y
 
Y
Y  YY 
Y    Y
Y  YY
Y
/ Y#Y Y  
Y
Y Y

 Y
Y  Y Y
Y  Y
 Y
Y
Y
Y  Y Y Y Y  Y Y

Y

Y
  Y Y 
YY   Y
Y  
Y#  YY
Y  Y  Y
Y
Y


Y # YY  Y  Y% 
Y  Y Y
Y 
Y
Y
  Y 
Y  Y ;Y/ 

Y   Y Y
Y Y
Y
  Y# 
Y  
Y # Y
Y  Y  Y
YY
6
Y Y ;Y  Y YY
&Y 
Y Y Y $   Y Y$ Y
Y
YY  Y# 
Y
Y Y ;Y  Y´  Y
Y  Y  Y
Y  Y
 
 
Y

Y
Y
Y
  Y Y Y ;Y  Y

Y5Y

YY Y  Y $


Y
YY
Y  Y
Y
Y

 YY Y
 (
 Y Y
Y  YY
Y
 Y Y Y Y   Y  Y  Y Y Y Y Y Y Y
 Y  Y    Y Y Y   Y Y   Y Y Y
Y   Y Y   Y  Y
Y
 # Y Y   Y Y Y Y Y Y Y Y   Y Y
 Y Y Y   Y Y Y (  Y   Y Y (  Y
  Y Y Y Y  Y Y Y Y Y Y Y
Y  Y Y  Y   Y Y Y Y Y Y (  Y # Y
Y Y Y   Y# Y  Y   Y   Y Y
Y( Y Y Y  Y  Y Y Y  Y Y Y Y
Y   Y    Y  Y#  Y Y Y Y Y Y
## Y Y Y   Y Y Y >Y Y Y  Y  Y Y Y
Y Y Y Y  Y Y   Y  # Y Y Y  Y  Y
 # Y Y Y   Y Y

You might also like