Professional Documents
Culture Documents
Sciences de gestion
Synthse de cours
&
exercices corrigs
Manu Carricano
INSEEC Paris
Fanny Poujol
IAE Valenciennes
Synthex
collection
Sommaire
Prface ......................................................................... Introduction .................................................................. Les auteurs .................................................................... Chapitre 1 Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7 Chapitre 8 Analyser pour dcider .................................................. Dcrire les donnes ...................................................... Simplifier les donnes .................................................. Segmenter ................................................................... Lanalyse de variance .................................................. La rgression linaire ................................................... Lanalyse conjointe ...................................................... Communiquer les rsultats ........................................... Bibliographie gnrale .................................................. Index ............................................................................
VII IX XI 1 29 51 79 107 133 155 177 195 197
Sommaire V
Chapitre
Exercices 1. Quand Pampers collecte des donnes..............................23 2. Laudience de la super star.........24 3. Lenqute point de vente .......25
Une bonne dcision consiste choisir la plus optimale des solutions parmi une srie dalternatives. Le marketing et en particulier sa dimension tudes sest longtemps cantonn un rle purement descriptif. Mais les bonnes dcisions narrivent pas par hasard : elles doivent tre fondes sur des informations ables et valides. Tour tour, les outils dtudes de marchs et les techniques danalyse se sont considrablement enrichis. Lavnement dInternet, la sophistication et lexhaustivit des donnes de panel, la monte en puissance des bases de donnes clients et du data mining ont repouss les limites des tudes de marchs traditionnelles, favorisant lmergence dune information marketing de grande qualit et danalyses explicatives, voire prdictives, des comportements. Ce chapitre prsente les grandes familles dtudes de marchs et pose les bases de lanalyse de donnes en marketing en abordant les concepts de donnes, de variables et de mesure.
(1)
1.1 LA
DMARCHE DTUDE partir de la dnition prcdente, nous pouvons rsumer la dmarche dtude cinq tapes principales, reprises la gure 1.1 ci-aprs.
Figure 1.1
Les cinq tapes dune dmarche dtude.
Anticipation du problme
Dfinition du problme
Analyse de la situation
Analyse et interprtation
Rsolution du problme
La premire tape de la dmarche dtude est didentier le problme managrial : le besoin dtude est donc dtermin par lexistence dun problme rsoudre. Plusieurs types de problmes et plusieurs types de rsolutions peuvent tre envisags, comme le montre le tableau 1.1. Tableau 1.1 : Du problme managrial la technique dtude
Problme managrial Existe-t-il un march potentiel pour un nouveau produit ? Objectifs dtude Tester les ractions des consommateurs lide Tester la composition du produit Estimer le taux dessai et de rachat Connatre les concurrents Techniques dtude Test de concept Test de formule March-test simul March-tmoin Analyse de la concurrence Panels
Chapitre
La formulation correcte dun problme permet de faire le lien entre un besoin de dcision et la mise en uvre dune dmarche de recherche, de collecte, danalyse et dinterprtation dinformations. La fonction tude doit donc tre envisage autour de ce paradigme informationnel. Son rle consiste transformer des informations brutes en donnes utiles dans la recherche de nouvelles opportunits, mettre en place des systmes dcoute du march et de veille concurrentielle, et prescrire les comportements adopter sur les marchs. Au conuent des ux dinformations de lentreprise, elle acquiert aujourdhui une dimension stratgique croissante. Si la collecte et lanalyse de donnes sont au cur du mtier danalyste en marketing, ces derniers font de plus en plus appel des donnes secondaires et des donnes stockes dans des entrepts de donnes (data warehouses). Cette tendance est accentue par le recours Internet qui, en combinant habilement sites de marque et techniques de marketing direct, savre tre une source inpuisable dinformations sur les marchs, les consommateurs, les concurrents. Lexistence de cette profusion de donnes fait voluer les besoins dtude dans lentreprise et modie par suite le recours aux diffrentes techniques. Auparavant, la conduite dune tude de march tait principalement entendue comme la ncessit de procder une collecte de donnes terrain, souvent par le biais du questionnaire, de lentretien ou de runions de consommateurs. Dornavant, laccs ais des donnes secondaires, la dissmination interfonctionnelle dune intelligence marketing dans lorganisation modie quelque peu la donne. Cette vaste quantit dinformations disponibles rend ncessaire, pour le charg dtude comme pour le chef de produit, une comptence accrue en analyse de donnes. Elle permettra dviter les erreurs dinterprtation et de matriser la qualit dtudes souvent ralises par des instituts. Un besoin croissant doprationnalit se fait sentir en la matire. Cette oprationnalit passe tout dabord par le dveloppement de mesures pertinentes et valides supportant des construits psychologiques (dcisions dachat, notorit, intrt pour la marque, le produit, etc.), an de bien mesurer ce qui se rapporte au problme managrial. Elle passe ensuite par la mise en uvre danalyses qui permettent dexpliquer et de prdire des comportements, an de bien comprendre le problme managrial pour le rsoudre et agir.
1.2 LES
TECHNIQUES DTUDES Les techniques dtudes sont regroupes en deux catgories principales, selon leurs objectifs et leurs limites. Les tudes quantitatives dominent largement le march des tudes, mme si, dernirement, les dpartements marketing ont manifest un intrt croissant pour les tudes qualitatives. Le tableau 1.2 montre la rpartition des diffrentes techniques en fonction des mthodes de collecte les plus frquemment utilises en marketing. Tableau 1.2 : Rpartition des diffrentes techniques dtude
Techniques Quantitatives tudes quantitatives via Internet tudes par tlphone Tests en salle tudes en face--face tudes postales 13 % 29 % 11 % 42 % 5% 20 % 30 % 10 % 37 % 4% 2005 2006
Qualitatives Runions de groupe Entretiens individuels tudes qualitatives via Internet Autres techniques qualitatives
Source : adapt de SEMO, 2008 (Syntec tudes Marketing et Opinion).
57 % 22 % 5% 16 %
55 % 22 % 17 % 5%
Parmi les techniques les plus largement utilises, on peut retenir : ltude ad hoc : tude quantitative ou qualitative ralise pour le compte dun seul client ; ltude omnibus : tude quantitative ralise date rgulire. Le questionnaire regroupe lensemble des questions de diffrents souscripteurs ; le baromtre : tude ralise date xe comme lomnibus, mais avec le mme questionnaire dune tude lautre, pour le compte dun ou de plusieurs clients ; le panel : investigation approfondie ralise priodiquement pour plusieurs clients. Les interviews sont identiques dune vague lautre. Il sappuie sur des chantillons importants de 2 000 10 000 individus ;
Chapitre
le march-test : tude quantitative visant prvoir les ventes et parts de march dun nouveau produit ; on parle galement de march-test pour des observations de type exprimental en magasin ; lentretien individuel : tude qualitative dont lobjectif est de recueillir le discours individuel. On distingue lentretien non directif (libre propos), semi-directif (intervention et thmes), directif (guide dentretien strict, questions ouvertes), associatif ou projectif (analogie, associations de mots, complments de phrases, jeux de rle, etc.) ; la runion de groupe : tude qualitative libre et non structure dun groupe de 8 12 participants, conduite par un animateur. La discussion libre repose sur les phnomnes de psychologie collective des groupes restreints, fonde notamment sur les travaux de Kurt Lewin. Le tableau 1.3 reprsente les objectifs et les limites des approches qualitatives et quantitatives. Tableau 1.3 : Objectifs et limites des approches qualitative et quantitative
Approche Objectifs Rpertorier Explorer Gnrer Comprendre Dnombrer Hirarchiser Pondrer Rsumer Limites Gnralisation des rsultats
Qualitative
Quantitative
Les tudes qualitatives sont utilises dans une dimension principalement exploratoire, an de comprendre en profondeur des comportements de consommateurs par exemple. Si elles ne permettent pas de gnraliser les rsultats quelles produisent, elles nen sont pas moins utiles pour dpasser les mesures dattitudes des questionnaires. Elles permettent daccder une tude approfondie des processus lis aux comportements de consommation, grce notamment aux entretiens et aux runions de consommateurs, et daccder plus profondment lexplication de ces comportements, en levant le voile sur des facteurs inconscients (le non-verbal, le non-dit ), en dautres termes le monde interne des consommateurs et notamment leur rapport aux marques. Les tudes qualitatives se distinguent galement par la place quelles occupent dans la dmarche de recherche. Souvent considres comme un prlude ltude quantitative ou limites la conrmation des rsultats dune enqute par questionnaire, elles se substituent de plus en plus aux approches traditionnelles, grce notamment lutilisation dInternet et de ses potentialits multimdias, et la ncessit croissante pour le marketing dtre connect au terrain. Garnier, par exemple, a lanc, il y a peu, une vaste opration de type ethnographique baptise Consumer Connect, dont lobjectif tait avant tout dimmerger les chefs de produit parmi les consommateurs et dobserver leur utilisation du produit in situ. Lavnement dInternet a contribu repopulariser cette technique auprs des instituts dtude : on peut citer lmergence de la netnographie (voir ci-aprs) ou encore le Home Use Blog (HUB), dvelopp conjointement par Danone et la socit Repres.
EXEMPLE
La netnographie
On constate, depuis quelques annes, un intrt grandissant pour linformation collecte partir de lobservation de communauts virtuelles, nouvelles formes de communauts dont Internet a permis lmergence. Ainsi, de nombreuses rmes ont ralis des tudes sur la base dinformations issues de forums de discussion et nont pas tard saisir les opportunits offertes par ces nouveaux types dinteractions sociales. Kozinets a dvelopp rcemment une approche nouvelle lethnographie sur Internet ou netnographie quil dnit comme une nouvelle mthode de recherche qualitative qui adapte la mthode de lethnographie ltude des cultures et des communauts qui mergent grce aux communications informatises (Kozinets, 2002, p. 62). En tant que technique de recherche en marketing, la netnographie utilise linformation publique disponible sur les forums en ligne an didentier et de comprendre les besoins et les inuences qui psent sur les dcisions dachat de groupes de consommateurs prsents sur Internet. Pour Laurent Flors, CEO de la socit dtude crmmetrix, spcialiste de lcoute client, le canal Internet permet aux marques de participer de vritables conversations et de sappuyer sur un puissant levier du marketing : le bouche oreille. Il est dsormais possible de quantier le volume de ces conversations, danalyser leur contenu et le prol des intervenants, avec un avantage important sur les techniques traditionnelles, puisque cette approche naltre pas le contexte tudi par lintervention dun analyste mais collecte plutt une information en langage naturel.
Les techniques quantitatives, auxquelles cet ouvrage est essentiellement consacr, constituent la part dominante des tudes marketing. Leur objectif est avant tout de mesurer, de quantier et de permettre de gnraliser les rsultats partir de lchantillon de la population concerne. Ce type dtude repose gnralement sur un grand nombre dobservations et sur des informations structures (valeurs numriques, chelles ou valeurs nominales) par opposition aux informations non structures (discours, texte libre/questions ouvertes, etc.). Plus prcisment, trois types dtudes quantitatives peuvent tre distingus, en fonction du contexte de dcouverte de linformation : dcrire, expliquer, prdire. Les tudes descriptives sont fondes sur des mesures dont le but est de collecter des donnes brutes an de crer des structures dcrivant les caractristiques dune population cible ou dun march. Elles peuvent tre utiles, entre autres, pour faire la photographie dun march, de la satisfaction des consommateurs, de la notorit dune marque. La dimension descriptive est lobjectif premier traditionnellement assign aux tudes marketing. Cette tape importante a pour objet de mesurer la force dassociation entre deux variables, par exemple, et permet de poser un cadre danalyse ncessaire aux tudes explicatives et prdictives. Les tudes explicatives ont pour objet de transformer des donnes brutes en structures expliquant des relations de causalit entre deux ou plusieurs variables. Lapproche explicative est utile lorsque ltude a pour objectif de comprendre les causes directes dun phnomne. Ce type dtude peut permettre, par exemple, de modliser limpact de la publicit sur les ventes. Lapproche explicative est particulirement utile dans un contexte daide la dcision, o le but assign ltude nest plus simplement de dcrire mais aussi de comprendre, de la manire la plus able et la plus valide, les dterminants affectant la performance des dcisions marketing. Les tudes prdictives, quant elles, ont pour objet de transformer les donnes brutes collectes sur les caractristiques comportementales des consommateurs ou des entreprises/marchs pour crer des modles prdictifs des ns doptimisation. Ces approches,
Chapitre
Exercices
EXERCICE 1
nonc
QUAND PAMPERS
Scwallbach, prs de Francfort en Allemagne, plus de 1500 mres de famille frquentent chaque semaine le centre dinnovation de Procter & Gamble. Elles viennent prendre des couches pour les tester et remplissent, en change, des questionnaires. Dans lespace de jeu disposition, des chercheurs tudient les attitudes et comportements de bbs venus sy amuser une partie de leur journe. Plus loin, des pices au sol trs mou pour simuler la marche dun tout petit , et aux meubles gants, mettent les salaris du groupe dans la peau de jeunes enfants diffrents stades de leur volution. En France, les salaris en charge du marketing peuvent faire des sjours dimmersion dans des familles avec bbs, se levant la nuit avec les parents. Cette approche visant scruter les usages et leur volution sinscrit dans une nouvelle dmarche qui commence avec la traditionnelle bote remise la maternit. Des mailings prennent ensuite le relais. Les parents dun premier enfant sont en gnral avides dinformations : un site internet de la marque Pampers met en avant conseils et donnes, des jeux en ligne trs apprcis pour se mettre dans la peau dun bb, nourrissant dbats, changes, autant dinformations tudies de prs par les spcialistes de la marque. 1. Quel est le principal intrt de la dmarche de Pampers ? Quelle est la mthode utilise, et quels en sont les principaux avantages ? 2. Comment, votre avis, les quipes de Pampers valorisent-elles les donnes collectes ? Selon vous, quels outils danalyse ont-elles recours ? 3. Quel type de mthode, complmentaire, pourraient-elles mettre en place ? Argumentez.
* Solution
1. Le principal intrt de la dmarche de Pampers est de mettre le consommateur au centre du processus de collecte de donnes. La mthode utilise est lvidence qualitative. Elle permet dtudier en profondeur les processus de consommation en interrogeant les parents, plus particulirement les mres, et en observant les interactions mre-enfant. De plus, en simulant les attitudes et les comportements des bbs, elle permet surtout dimmerger les salaris du groupe dans la peau de jeunes enfants diffrents stades de leur volution. Nous sommes ici dans une dmarche oriente march, o la dissmination de linformation sur les consommateurs vers lensemble de lorganisation tient une place importante. Deux mthodes sont donc principalement utilises : une exprimentation Scwallbach, o les chercheurs peuvent observer et tester les comportements des bbs ; lethnographie en France, o les marketeurs font des sjours dimmersion dans des familles. Des outils quantitatifs denqute classiques prennent ensuite le relais partir des donnes collectes dans les maternits. 2. Deux dimensions doivent tre prises en considration. Les donnes issues des approches qualitatives font lobjet danalyses de plusieurs ordres : des analyses de contenu par exemple, an de faire merger des thmes, des discours, mais galement un traitement des
donnes issues de lexprimentation o il sagit dobserver limpact sur certaines variables dune variable dont on contrle les effets. Pour traiter des donnes dexprimentation, on pourra utiliser lanalyse de variance (voir chapitre 4) ou lanalyse conjointe (voir chapitre 7), par exemple, en fonction des contraintes lies la nature des variables. 3. Les donnes issues de la campagne de marketing direct et provenant du site de marque sont dune grande richesse et peuvent nourrir de nombreuses analyses. On peut tudier les retours de la campagne de marketing direct en mettant en relation les prols sociodmographiques des parents ayant reu la bote dchantillons avec la probabilit dachat. En ce qui concerne le site internet, les chiers logs, ou chiers regroupant lensemble des vnements survenus sur un serveur, peuvent servir de base des analyses pousses, comme le fait Amazon.com pour customiser sa page daccueil en fonction des prols de navigation des internautes.
EXERCICE 2
nonc
LAUDIENCE
DE LA SUPER STAR
Reprenons lexemple de la mesure daudience utilise pour illustrer lintervalle de conance. Un sondeur ralise une tude daudience par tlphone pour connatre les caractristiques sociodmographiques et les comportements des tlspectateurs de la Super Star, mission de tl-ralit diffuse en prime time sur le cble et le satellite. Il slectionne 1 000 numros de tlphone par tirage alatoire simple dans la base de donnes des abonns de la chane (qui en compte 120 000 sur le cble et 2 100 000 sur le satellite). On pose lhypothse que les 1 000 personnes rpondent effectivement aux enquteurs. On constate que lmission absorbe 36,8 % de laudience des personnes interroges de moins de 35 ans, et que le montant moyen dpens par cette cible en SMS et appels tlphoniques est de 6,2 , avec un cart type de 2,2 . 1. Quel aurait t lintervalle de conance si ltude daudience avait port sur 5 000 abonns de la chane ? 2. Un annonceur souhaite investir en devenant sponsor de lmission condition quelle ralise 40 % daudience sur les moins de 35 ans. Lui recommanderiez-vous linvestissement publicitaire ?
* Solution
1. Si lon avait interrog 5 000 abonns de la chane, on aurait calcul lintervalle de conance de la manire suivante : p = 0,368 q = 1 p = 0,632
Soit : 35,4 %
38,1 %
Le sondage ralis permet donc destimer cette proportion avec une prcision absolue de 2,99 % (au degr de conance 0,95). En augmentant la taille de lchantillon, on diminue lamplitude de lintervalle de conance.
24
Chapitre
2. Dans le cadre de la premire tude daudience, lintervalle de conance se situait entre 33,8 % et 39,7 % (au degr de conance 0,95). La borne suprieure restant en de de la mesure plancher souhaite par lannonceur, il nest donc pas souhaitable de raliser linvestissement publicitaire. Il peut tre intressant de refaire le calcul pour un degr de conance plus faible, 0,90 (z = 1,64), titre dillustration. On obtient alors les rsultats suivants :
Soit : 34,3 %
39,3 %
EXERCICE 3
nonc
LENQUTE
POINT DE VENTE
Reprenons lexemple sur les points de vente que nous avons utilis dans la section 2.2 (pointdevente.sav). Si lon rsume lensemble des questions de lenqute dans le tableau suivant, on obtient : Frquentez-vous ce point de vente au moins toutes les deux semaines ? Quel montant moyen dpensez-vous par mois dans ce type de point de vente ? Seriez-vous prt faire vos achats dans ce (nouveau) point de vente ? combien estimez-vous le prix moyen dune paire de chaussures dans ce point de vente ? Vous dcririez-vous comme un auditeur rgulier de radio ? Quel type de programme de radio coutez-vous le plus souvent ? Regardez-vous rgulirement le journal tlvis ? Quel journal TV regardez-vous le plus frquemment ? Lisez-vous la presse quotidienne ? Quelle rubrique de presse quotidienne lisez-vous le plus souvent ? tes-vous abonn un titre de presse magazine ? La dcoration de la boutique est importante mes yeux. Je prfre un point de vente situ moins de 30 minutes de chez moi. Je prfre tre conseill(e) par des vendeurs(ses). Jaime que les collections soient originales. Jaime quil y ait de nombreuses rfrences dans les collections. Jaime quil y ait des marques connues dans les collections. Je prfre une dcoration sobre. Je prfre une dcoration sophistique. Je prfre une musique dambiance classique. Je prfre une musique dambiance rock. Quelle est votre anne de naissance ? Quel est votre niveau dtude ?
Exercices
1. 2.
Quel est votre statut marital ? En incluant les enfants de moins de 18 ans, quelle est la taille de votre foyer ? Quels sont approximativement les revenus de votre foyer ? Quel est votre sexe ? Possdez-vous une carte de dlit de lenseigne ? Dcrivez le type dchelle associ chacune des questions du tableau. Donnez trois exemples de tests que vous pourriez mettre en uvre partir de ces variables.
* Solution
combien estimez-vous le prix moyen dune paire de chaussures dans Numrique ce point de vente ? Vous dcririez-vous comme un auditeur rgulier de radio ? Quel type de programme de radio coutez-vous le plus souvent ? Regardez-vous rgulirement le journal tlvis ? Quel journal TV regardez-vous le plus frquemment ? Lisez-vous la presse quotidienne ? Quelle rubrique de presse quotidienne lisez-vous le plus souvent ? tes-vous abonn un titre de presse magazine ? La dcoration de la boutique est importante mes yeux. Je prfre un point de vente moins de 30 minutes de chez moi. Je prfre tre conseill(e) par des vendeurs(euses). Jaime que les collections soient originales. Jaime quil y ait de nombreuses rfrences dans les collections. Jaime quil y ait des marques connues dans les collections. Je prfre une dcoration sobre. Nominale Nominale (chelle) Nominale Nominale (chelle) Nominale Nominale (chelle) Nominale chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique chelle mtrique
26
Chapitre
Je prfre une dcoration sophistique. Je prfre une musique dambiance classique. Je prfre une musique dambiance rock. Quelle est votre anne de naissance ? Quel est votre niveau dtude ? Quel est votre statut marital ? En incluant les enfants de moins de 18 ans, quelle est la taille de votre foyer ? Quels sont approximativement les revenus de votre foyer ? Quel est votre sexe ? Possdez-vous une carte de dlit de lenseigne ?
chelle mtrique chelle mtrique chelle mtrique Numrique Nominale (chelle) Nominale (chelle) Numrique Nominale (chelle) Nominale Nominale
2. De nombreux tests sont envisageables : a. un tri crois entre le montant moyen dpens dans le point de vente et le niveau dtudes par exemple, an de mettre en vidence un impact de la CSP sur les achats ; b. une analyse typologique an de classer les individus de lenqute en fonction de leur prol de rponse ; c. une analyse de variance multiple (MANOVA) dont lobjet serait dexpliquer le montant moyen dpens par une srie de variables explicatives comme, par exemple, le niveau dtudes, le statut marital, etc.
Exercices
* Focus 2.1
Les fractiles
Les fractiles sont les valeurs dune variable quantitative qui divisent les donnes tries en classes par centime. Les quartiles (25e, 50e et 75e centiles) divisent les observations en quatre classes de taille gale. On les dnit dans SPSS partir de la bote de dialogue Effectifs > Statistiques (voir gure 1.1), en slectionnant Partition en n classes gales (n dnissant le niveau de partition souhait). Vous pouvez galement spcier des centiles particuliers (par exemple le 95e centile), autrement dit les valeurs au-dessus de 95 % des observations.
Mesures de la dispersion
Les mesures de la dispersion reposent sur les indicateurs suivants : ltendue, la variance, lcart type et le coefcient de variation. Ltendue (ou intervalle) est la diffrence entre la plus grande et la plus petite des valeurs observes. La variance est la mesure de la dispersion autour de la moyenne, gale la somme des carrs des carts par rapport la moyenne, divise par le nombre dobservations moins un. Lorsque les donnes se concentrent autour de la moyenne, la variance est faible. Si les donnes sont disperses autour de la moyenne, la variance est leve. Il sagit dune mesure plus ne de la dispersion, au sens o toutes les donnes sont prises en compte. En revanche, elle est sensible aux valeurs extrmes. Lcart type est la mesure de la dispersion autour de la moyenne, exprime dans la mme unit que la variable. Lcart type est la racine carre de la variance. On lcrit de la manire suivante :
s=
(Xi X )
i =1
n 1
), exprim
en pourcentage. Son objet est de mesurer le degr de variation de la moyenne dun chantillon lautre, lorsque ceux-ci sont issus de la mme distribution.
Mesures de la distribution
On mesure la symtrie et la forme de la distribution par lasymtrie et laplatissement. Ces statistiques sont prsentes avec leur erreur standard. Le coefcient de symtrie (skewness) mesure lasymtrie dune distribution. Une distribution normale est symtrique (voir gure 2.4), cest--dire que les valeurs sont les mmes de part et dautre du centre de la distribution, et possde une valeur de skewness de 0. Une distribution avec un skewness positif signicatif est une distribution asymtrique droite (la distribution prend la forme dune longue queue droite) et une distribution avec un skewness ngatif signicatif est une distribution asymtrique gauche (la distribution prend la forme dune longue queue gauche). Cette asymtrie sexplique par le fait que les carts sont plus importants dans une direction que dans lautre. Le coefcient daplatissement (kurtosis) permet de mesurer le relief ou la platitude dune courbe issue dune distribution de frquences. En dautres termes, le coefcient daplatissement permet de mesurer le degr de concentration des observations dans les queues de la courbe. Le coefcient de kurtosis est de 0 pour une distribution normale (gaussienne).
32
Chapitre
Un kurtosis ngatif indique donc que les queues comptent un plus grand nombre dobservations que dans une distribution gaussienne. Les coefcients de kurtosis et de skewness peuvent tre utiliss pour sassurer que les variables suivent une distribution normale, condition ncessaire pour de nombreux tests statistiques. On estime que le coefcient de symtrie ou skewness doit tre infrieur 1 et le coefcient daplatissement ou kurtosis doit tre infrieur 1,5 pour considrer que la variable suit bien une loi normale. Figure 2.4
Reprsentation dune distribution normale.
Mo = Me = X
SPSS
Reprenons notre exemple avec SPSS (pointsdevente.sav) : rappelez la bote de dialogue de la procdure prcdente (Effectifs) en cliquant sur licne dans la barre doutils. Procdez aux mmes oprations mais cette fois pour la variable montant. Dans la bote de dialogue Effectifs que vous venez de rappeler, cliquez sur longlet Statistiques et cochez les statistiques de mesure de la tendance centrale, de dispersion et de distribution, puis slectionnez un graphique (un histogramme avec courbe gaussienne par exemple) pour reprsenter la distribution. Les gures 2.5 et 2.6 reprennent les statistiques descriptives de la variable montant.
Figure 2.5
Description de la variable montant.
3.1 LHYPOTHSE
STATISTIQUE
Une hypothse statistique est un nonc quantitatif concernant les caractristiques dune population ou, plus prcisment, une afrmation portant sur une ou plusieurs variables. Elle se prsente traditionnellement sous la double forme dune premire hypothse, appele hypothse nulle, et dune seconde hypothse, appele hypothse alternative. Son objectif est de rfuter lhypothse nulle, laquelle concerne le plus souvent un statu quo ou une absence de diffrence, au prot de lhypothse alternative. Exemple : on peut poser lhypothse nulle Ho quil nexiste pas de diffrence de ventes entre les points de vente situs en centre-ville et ceux de la priphrie urbaine, et lhypothse alternative H1 quelles sont diffrentes en centre-ville et en priphrie urbaine. Les tests statistiques tant conus pour la rfutation dhypothses et non pour leur conrmation, lhypothse alternative est celle qui sera accepte si lhypothse nulle est rejete. Accepter une hypothse revient donc dire que lhypothse est non rejete plutt quaccepte, cest--dire que les donnes recueillies au cours dune exprience particulire sont compatibles avec lhypothse alternative propose. Lobjectif de lanalyse de donnes est donc de prendre une dcision : en loccurrence, rejeter ou non lhypothse nulle Ho. Les tests tant fonds sur des informations incompltes issues dobservations portant sur un chantillon de la population, il est ncessaire de dnir le seuil de signication du test, seuil formul en pourcentage de chances de rejeter lhypothse nulle alors quen ralit celle-ci tait vraie. Le seuil de signication est habituellement not et exprim en pourcentage. Le choix du seuil est li au niveau de risque accept (1 % ou 5 % tant les valeurs usuelles). Son complment (1 ), appel seuil de conance, correspond au pourcentage de cas o on acceptera lhypothse nulle juste titre. On appelle erreur de type I le fait de rejeter, la suite des rsultats dun test statistique, une hypothse qui serait en ralit vraie (condamner un innocent) et erreur de type II lerreur lie au fait daccepter une hypothse qui serait en ralit fausse (innocenter un coupable). La probabilit de commettre ce type derreur est note ; on appelle puissance du test son complment (1 ), lequel correspond la probabilit de rejeter une hypothse qui serait rellement fausse (voir tableau 2.1). Tableau 2.1 : Types derreurs dans un test statistique
Situation dans la population Ho vraie Ho accepte Dcision Ho rejete Erreur de type I (seuil de signication = ) Dcision correcte (puissance du test = 1 ) Dcision correcte (seuil de conance = 1 ) Ho fausse Erreur de type II ()
Bien que l tablisse le niveau de signication du test, cest la puissance du test (1 ) qui donne une estimation de la probabilit de trouver des diffrences signicatives si elles existent dans les donnes. Pourquoi, ds lors, ne pas prendre en compte l et le en tant que niveaux de conance ? La raison voque est que lerreur de type I et lerreur de
40
Chapitre
type II sont inverses : plus lerreur de type I devient restrictive (proche de 0) et plus la probabilit dune erreur de type II augmente ; de mme, rduire lerreur de type I rduit la puissance du test. Lanalyste doit donc trouver le juste quilibre entre le degr de conance () et la puissance du test qui en rsulte. La seule manire de faire baisser simultanment et est daugmenter la taille de lchantillon tudi.
3.2 LES
TESTS DHYPOTHSES Les tests dhypothses, ou tests dinfrence, ont pour objectif de mesurer leffet dune variable indpendante sur une variable dpendante, en fonction du nombre dchantillons et en fonction de la nature des variables tudies. On nomme tests paramtriques les approches reposant sur des donnes mtriques (et par suite sur des paramtres connus tels que la moyenne ou lcart type, par exemple), et tests non paramtriques les approches reposant sur des donnes non mtriques (et qui, par suite, peuvent saffranchir de conditions de distribution particulires). Les tests non paramtriques tant peu sensibles la taille de lchantillon et aux donnes aberrantes, ils sont utiliss en marketing o les chantillons peuvent parfois tre de petite taille (moins de 30 individus). Le nombre dchantillons joue galement un rle important dans le choix du test appropri. En effet, deux situations doivent tre distingues : lorsque lon tudie deux populations distinctes sur une mme variable, on parle de mesures indpendantes (comparer les clients et les non-clients) ; et lorsque les mmes individus sont mesurs sur une mme variable dans deux situations distinctes, on parle de mesures apparies (comparer les niveaux de prix deux priodes distinctes). Ces lments affectent de manire importante les statistiques de tests (voir gure 2.15).
Figure 2.15
Tests paramtriques et tests non paramtriques (Malhotra et al., 2007).
Tests dhypothses
Tests paramtriques
3.3 TESTS
PARAMTRIQUES Les deux principaux tests paramtriques sont le test t et le test Z, qui ont pour objet de tester des diffrences de moyenne. Ces tests sont souvent mis en uvre en marketing, car ils permettent, par exemple, de comparer la moyenne dune variable dpendante mtrique en fonction des modalits dune variable nominale. On formule alors une hypothse nulle qui sera vrie par le test t ou le test Z. Pour plus de simplicit, ces deux tests sont prsents ici pour des chantillons uniques.
Test t
Le test t est directement li la statistique t de Student, qui suppose que la variable adopte une distribution normale, que la moyenne soit connue et que la variance, lorsquelle est inconnue, soit estime sur lchantillon. On le calcule de la manire suivante :
: moyenne de lchantillon : moyenne de la variable : variance de lchantillon
t = ( X ) /s X
O :
Dans SPSS, ce test paramtrique peut tre estim avec la procdure suivante : menu Analyse > Comparer les moyennes > Test T pour chantillon unique, procdure que nous avons utilise au chapitre 1 pour estimer lintervalle de conance. Pour comparer les moyennes de deux chantillons indpendants (comparaison des clients et des non-clients par exemple), on utilisera une analyse de variance (ANOVA) 1 facteur (voir chapitre 4). Pour comparer les moyennes de deux chantillons apparis (comparaison de relevs de prix deux priodes distinctes par exemple), on suivra une extension du test t pour chantillons apparis qui est disponible dans la mme bote de dialogue.
Test Z
Le test Z peut tre mis en place lorsque la variance de lchantillon est connue. La valeur de Z sobtient par la formule suivante : Z= o : est lcart type de la population
3.4 TESTS
NON PARAMTRIQUES Les tests non paramtriques sont souvent mis en uvre dans la pratique en marketing : ils sappliquent aux variables qualitatives et savrent relativement performants sur de petits chantillons, mme sils sont moins puissants que les tests paramtriques. Voici les principaux tests paramtriques prsents ici : un test dajustement (le test de KolmogorovSmirov), des tests de comparaison dchantillons indpendants (le test U de MannWhitney et le test de la mdiane), ainsi que des tests de comparaison dchantillons apparis (le test de Wilcoxon, le test du signe et le test de McNemar). Test de Kolmogorov-Smirov (K-S)
42
Chapitre
Le test de Kolmogorov-Smirov est un test dit dajustement, car il permet dtablir si une population donne suit une distribution particulire (normale, uniforme ou poisson par exemple), condition exige par de nombreux tests. Le K-S est calcul partir de la plus grande diffrence (en valeur absolue) entre les fonctions de distribution thorique et observe cumules : K = Max |Ai-Oi| Le K-S pour un chantillon sobtient dans SPSS partir du menu Analyse > Tests non paramtriques > K-S 1 chantillon Test U de Mann-Whitney Le test de Mann-Whitney permet de vrier que deux chantillons (ou groupes) proviennent bien de la mme population. On peut lutiliser, par exemple, pour comparer les rponses dans un dpartement par rapport aux rponses nationales. La statistique du test U runit les deux chantillons et ordonne les observations par ordre croissant de taille. Le test calcule le nombre de fois o un rsultat du groupe 1 prcde un rsultat du groupe 2, ainsi que le nombre de fois o un rsultat du groupe 2 prcde un rsultat du groupe 1. U est dautant plus petit que les groupes sont diffrents. Pour calculer le U de Mann-Whitney dans SPSS, il faut dabord dnir la variable qui servira scinder les donnes en deux chantillons : Analyse > Test non paramtrique > 2 chantillons indpendants, puis slectionner une variable de regroupement (Facteur) et cliquer sur Dnir les niveaux. Pour dnir les groupes, vous devez indiquer les valeurs pour le groupe 1 et celles pour le groupe 2. Slectionnez ensuite le test U de Mann-Whitney dans la bote de dialogue. Test de la mdiane Ce test, moins puissant que le U de Mann-Whitney, permet de dterminer si deux groupes sont issus de populations ayant la mme mdiane, en estimant la position de chaque observation par rapport la mdiane globale des deux chantillons. Pour calculer le test de la mdiane dans SPSS, vous devez suivre la procdure suivante : Analyse > Test non paramtrique > K chantillons indpendants, puis slectionner le test de la mdiane dans le menu du type de test envisag. Test de Wilcoxon Le test de Wilcoxon est utilis dans le cas de la comparaison de deux chantillons apparis, cest--dire lorsque lon souhaite, par exemple, comparer deux types de rponses : avant/aprs lexposition un message publicitaire, attitude par rapport une marque A et une marque B, etc. La statistique z du test de Wilcoxon sobtient en calculant la diffrence entre les scores des deux observations par paires dobservations, puis en calculant le rang de toutes les diffrences, et enn la somme des rangs positifs et des rangs ngatifs. On rejette lhypothse nulle (absence de diffrence entre les deux groupes) sil y a une diffrence entre la somme des rangs positifs et la somme des rangs ngatifs. Le sens de la statistique indique le sens de la diffrence de la paire examine. Dans SPSS, ouvrez le menu Analyse > Test non paramtrique > 2 chantillons lis, puis slectionnez le test que vous souhaitez mettre en uvre (Wilcoxon, Signe, McNemar), comme le montre la gure 2.16. Test du signe Le test du signe est relativement proche du test de Wicoxon, mais il est plus limit et par suite moins puissant. Il ne sattache en effet qu une comparaison des signes des diffrences, sans procder un classement comme le fait le test de Wilcoxon.
(1)
1.1 LA
VALIDIT DUNE CHELLE DE MESURE La validit dune chelle de mesure dsigne sa capacit apprhender un phnomne (Hair et al., 2006). Les tests de validit ont pour objectif de vrier si les diffrents items dun instrument sont une bonne reprsentation du phnomne tudi : mesure-t-on ce que lon cherche mesurer ? (Evrard et al., 2003). La validit prend plusieurs formes ; il existe donc plusieurs techniques pour la vrier : la validit faciale ou de contenu : il sagit de savoir si la mesure capture les diffrents aspects du phnomne tudi. Elle est fonde sur le jugement du chercheur et de ses pairs. Par exemple, lors du test du questionnaire, des experts du domaine peuvent mettre un avis sur la capacit des items recouvrir tous les aspects dun concept ; la validit de trait ou de construit : est-ce que les diffrents indicateurs offrent une bonne reprsentation du phnomne tudi ? Il faut vrier si les indicateurs censs mesurer le mme phnomne sont corrls (validit convergente) et s'ils se distinguent des indicateurs censs mesurer des phnomnes diffrents (validit discriminante) (Evrard et al., 2003) : la validit convergente est tablie lorsque les mesures dun mme construit sont corrles ; la validit discriminante est destine sassurer que les indicateurs de mesure dun construit sont faiblement corrls aux indicateurs de mesure dautres construits, conceptuellement distincts du premier. Lanalyse factorielle exploratoire (AFE) permet de tester ces deux validits ; la validit nomologique ou prdictive rsulte de la conformit des relations entre les mesures dun concept et celles dautres concepts avec les prdictions de la thorie (Evrard et al., 2003). Cette tape de validation intervient au cours de la phase conrmatoire.
1. Puis, dans une phase de validation, les chelles modifies aprs suppressions dnoncs subissent une deuxime fois ces procdures, on parle danalyse confirmatoire. Cette seconde tape vise connatre les qualits psychomtriques des instruments de mesure.
52
Chapitre
1.2 LA
FIABILIT DUNE CHELLE DE MESURE La abilit correspond au degr avec lequel les instruments utiliss mesurent de faon constante le construit tudi (Evrard et al., 2003). Par consquent, une chelle est dle si lon retrouve plusieurs fois les mmes rsultats sur les mmes sujets. Trois mthodes permettent de tester la abilit dune mesure : la mthode du test/retest : le questionnaire est administr deux fois la mme population et les rsultats obtenus sont compars. Cette technique est particulirement approprie pour la mise au point dinstrument de mesure ; la mthode du Split half , ou des deux moitis : le questionnaire est administr au mme moment des chantillons diffrents (lchantillon est scind en deux) et les rsultats sont compars. Il existe cependant un risque de slection ; les deux chantillons sont-ils apparis ? se ressemblent-ils ? la technique des formes alternatives : il sagit dintroduire dans le questionnaire plusieurs questions sur le mme phnomne mais formules diffremment. Le questionnaire est administr aux mmes individus. Le coefcient alpha de Cronbach est calcul pour vrier si les noncs partagent des notions communes, et sils sont en cohrence entre eux.
* Focus 3.1
Le seuil dacceptabilit de lalpha varie selon lobjectif de la recherche. Pour une tude exploratoire, un coefcient plus faible est acceptable (0,7) alors que dans le cadre dune recherche fondamentale, il doit tre plus lev (> 0,8) (Nunnally et Bernstein, 1994). Lorsquune chelle est utilise pour comparer des groupes, un alpha de 0,8 est satisfaisant, et il est inutile dessayer dobtenir un niveau suprieur. De Vellis (2003) propose une typologie (voir tableau 3.1). Tableau 3.1 : Les valeurs de lalpha de Cronbach
< 0,6 entre 0,6 et 0,65 entre 0,65 et 0,7 entre 0,7 et 0,8 entre 0,8 et 0,9 > 0,9 Insufsant Faible Minimum acceptable Bon Trs bon Considrer la rduction du nombre ditems
Il existe une relation entre le nombre ditems et la valeur de lalpha : un nombre restreint ditems (de deux trois) donne un alpha gnralement plus faible (0,6) quune mesure de quatre noncs (0,7). Au-del de 0,9, lalpha risque, en revanche, de traduire davantage une redondance inter-items, appauvrissant ainsi le domaine conceptuel tudi (Peterson, 1995). Il est, par consquent, recommand de ne pas dpasser le seuil de 0,9. Le logiciel SPSS fournit les niveaux du coefcient dalpha de lchelle lorsque chaque item est supprim. Les items dont la suppression amliore sensiblement le coefcient ne sont gnralement pas retenus si la validit de contenu ne sen trouve pas amoindrie.
* Focus 3.2
(2)
Lanalyse factorielle
Lanalyse factorielle est une mthode exploratoire danalyse des tableaux de contingence dveloppe essentiellement par J.-P. Benzecri durant la priode 1970-1990. Elle dsigne un ensemble de mthodes statistiques multivaries dont le principal objectif est de dnir la structure des corrlations entre un grand nombre de variables (par exemple, les rponses un questionnaire) en dterminant un ensemble de dimensions communes appels facteurs.
2.1 LES
UTILISATIONS DE LANALYSE FACTORIELLE Lanalyse factorielle sert identier les dimensions de la structure et dterminer dans quelle mesure chaque variable peut expliquer chaque dimension. Les deux objectifs de lanalyse factorielle sont : Rsumer les donnes. Lanalyse factorielle fait ressortir les dimensions sous-jacentes qui, une fois interprtes, dcrivent les donnes de manire synthtique. Rduire les donnes. Elle calcule des scores pour chaque dimension et les substitue aux variables originelles. Alors que dans les autres mthodes (rgressions, analyse de variance, etc.) les variables sont considres comme des variables soit dpendantes, soit indpendantes, dans lanalyse factorielle, toutes les variables sont considres chacune par rapport aux autres. Les facteurs sont forms pour maximiser lexplication de lensemble des variables et non pour prdire des variables dpendantes. Ds lors, lanalyse factorielle est approprie dans une optique exploratoire (analyse factorielle exploratoire ou AFE).
54
Chapitre
EXEMPLE
1 2 3 4 5 6
4 1 2 3 1
1 2 4 4 4
4 4 2 2 3
2 5 4 4 4
4 4 3 3 4
1 1 1 3 4
1 1 1 3 4
titre dexemple, le confort, les aspects dfoulement, dynamisme et sant reprsentent peuttre en fait la mme chose : tre en forme.
Facteur 2 Contact
Confort 2 1 2 2 3
Muscles
Sant
tes des clients portent sur la forme physique ; droite, sur le confort de la salle. Sur laxe vertical sopposent le ct sociable du club de sport et le besoin de sy dfouler. Au total, la variance restitue par ces deux axes (les deux premiers facteurs) est de 50,43.
Figure 3.1
Reprsentation graphique de lanalyse factorielle.
Lanalyse factorielle exploratoire permet didentier des groupes ditems qui covarient les uns avec les autres et semblent reprsenter des variables latentes pertinentes. Autrement dit, lAFE consiste explorer la relation entre des variables mesures, an de dterminer si ces relations peuvent tre rsumes par un nombre moins important de construits latents. LAFE permet de vrier le nombre de dimensions ou, plus souvent, lunidimensionalit dun concept. En effet, un concept peut comporter une ou plusieurs facettes. Par exemple, limplication comporte une composante affective, une composante calcule et une composante normative. Lorsque lon fait appel des chelles de mesure dj utilises, lAFE permet de vrier si lon retrouve, pour lchantillon tudi, la mme structure factorielle. Elle fera alors ressortir autant de facteurs que le construit a de dimensions (un seul facteur si le construit est unidimensionnel). Dans le cadre du dveloppement de nouveaux instruments, lAFE permet de constater si les items correspondent effectivement aux concepts prsents aux rpondants.
2.2 LES
CONDITIONS ET OPTIONS DE LANALYSE FACTORIELLE En fonction des caractristiques de lchantillon et des donnes collectes, plusieurs options sont possibles pour la ralisation dune AFE (analyse factorielle exploratoire). Nous verrons, dans un premier temps, la taille de lchantillon requise avant de prsenter les diffrentes options et tests permettant de valider les rsultats dune AFE.
56
Chapitre
donn que chaque facteur est extrait dune matrice qui est le rsidu de lextraction prcdente, la quantit dinformations contenue dans les facteurs successifs dcrot. Lorsque, entre deux facteurs, la dcroissance en termes dinformations devient faible ou nulle, on peut estimer que le dernier facteur ne contient pas sufsamment dinformations pour tre retenu. le critre du pourcentage de variance : il sagit dune approche par laquelle on observe les pourcentages cumuls de la variance extraite par les facteurs successifs. Lobjectif est de sassurer quun facteur explique une quantit signicative de variance. Il est souvent conseill darrter lextraction lorsque 60 % de la variance explique est extraite (Hair et al., 2006).
* Focus 3.3
58
Chapitre
2.3 LPURATION
DES DONNES
Lpuration dune chelle de mesure se fait en deux temps : Dune part, pour les coefcients structurels ou composantes, un seuil est dtermin en fonction de la taille de lchantillon. Par exemple, pour un test dchelle sur un chantillon de 200 individus, un seuil de 0,40 sera retenu. Pour les chelles multidimensionnelles, sont limins les items dont les poids factoriels sont suprieurs 0,30 sur plusieurs facteurs et ceux nayant aucune contribution suprieure ou gale 0,50 sur lune des composantes principales identies. Ces seuils peuvent aussi varier en fonction de la taille de lchantillon (Hair et al., 2006). Dautre part, la formation des facteurs repose sur limportance des variables initiales sur ces facteurs. Les communalits (part de variance explique par litem) doivent dpasser 0,5 et si possible 0,7. Le niveau de reprsentation est considr comme moyen pour un seuil de 0,40, bon pour un seuil de 0,65 et excellent lorsque la communalit dpasse 0,80 (Evrard et al., 2003).
SPSS
Dans cet exemple, nous testons lchelle destine mesurer lambition professionnelle. Cette chelle unidimensionnelle de 10 items est issue de la littrature. Les rponses aux questions sont collectes grce une chelle de Likert cinq chelons allant de Pas du tout daccord Tout fait daccord (voir tableau 3.5). Tableau 3.5 : Exemple de lchelle destine mesurer lambition
Item 1 - Jaimerais avoir un poste plus important et que les autres menvient. Item 2 - Jaime bien discuter avec des gens importants. Item 3 - Je veux tre une personne importante dans la communaut. Item 4 - Jadmire beaucoup les gens qui ont gravi les chelons et sont au sommet. Item 5r1 - Si javais sufsamment dargent, je ne travaillerais plus*. Item 6 - Mme si je gagnais beaucoup dargent au jeu, je continuerais exercer mon mtier. Item 7r - Si je pouvais toucher le chmage, je prfrerais ne pas travailler*. Item 8 - Jaime tre admir(e) pour ma russite. Item 9r - Je naime pas tre remarqu(e)*. Item 10 - Jaime que des employs me demandent conseil.
Les 10 items sont, dans un premier temps, soumis une analyse factorielle exploratoire (mthode de lACP), an de vrier la structure du construit mesur. Cette chelle est teste avec un chantillon de 106 individus. Ouvrez le chier challenge 1. Allez dans le menu Analyse > Positionnement > Analyse factorielle. Une bote de dialogue apparat (voir gure 3.2).
60
Chapitre
Transfrez les items destins mesurer lambition en les slectionnant chacun leur tour et en cliquant sur la che.
Figure 3.2
Demande danalyse factorielle.
Avant de lancer lAFE, plusieurs commandes sont effectuer. An de vrier ladquation des donnes, on peut demander lindice KMO et le test de Bartlett par le bouton Descriptives dans la bote de dialogue prcdente. La structure initiale (prcoche) donne les communalits, les valeurs propres et la part de variance explique initiale (voir gure 3.3).
Figure 3.3
Demande de lindice KMO et du test de Bartlett.
Cliquez ensuite sur Poursuivre pour revenir la bote de dialogue initiale. Pour slectionner la mthode de lanalyse factorielle, cliquez sur Extraction et la bote de dialogue de la gure 3.4 apparat. Nous pouvons choisir la mthode de lanalyse factorielle (composantes principales ; facteurs communs, etc.). Nous slectionnons Composantes principales. Pour obtenir les facteurs, le logiciel prslectionne les valeurs propres suprieures 1. Mais il est aussi possible de dterminer le nombre de facteurs. Dans une optique exploratoire, nous laissons libre ce nombre de facteurs. Le choix de la matrice de dpart est aussi x dans cette bote de dialogue : la matrice de corrlation est prslectionne. Nous gardons cette matrice pour lanalyse. On peut demander un graphique des valeurs propres qui sert liminer des facteurs avec le test du coude. Cliquez ensuite sur Poursuivre pour revenir la bote de dialogue initiale.
(1)
* Focus 7.1
Le modle compensatoire
Le modle dattitude implicite de lanalyse conjointe est un modle compensatoire, o lvaluation se fonde sur le principe du compromis, cest--dire quun peu moins dun attribut peut tre compens par un peu plus dun autre. Par exemple, un individu qui cherche un appartement peut avoir plusieurs critres : le montant du loyer, la supercie, le nombre de pices, la luminosit, la proximit des transports publics, etc. Si lun de ces critres nest pas satisfait (supercie insufsante), il peut tre compens par un montant du loyer plus faible dans un modle compensatoire (ce nest pas le cas dans le modle non compensatoire).
156
Chapitre
1.1 LES
UTILISATIONS DE LANALYSE CONJOINTE EN MARKETING Lanalyse conjointe est largement utilise en marketing pour lidentication dun nouveau concept, pour divers tests (prix, produits, publicit, distribution, etc.), pour lanalyse concurrentielle ou la segmentation du march (voir tableau 7.1). Il sagit, par exemple : de dterminer limportance relative dattributs dans le processus de choix des consommateurs ; destimer la part de march des marques qui diffrent au niveau des attributs ; de dterminer la composition dobjets les plus apprcis ; de segmenter le march partir des similarits de prfrences pour des niveaux dattributs. Tableau 7.1 : Les applications de lanalyse conjointe
Pour les biens de consommation courante Nouveaux produits Prix Segmentation Publicit Distribution 72 % 61 % 48 % 39 % 7%
1.2 LES
CONDITIONS DAPPLICATION DE LANALYSE CONJOINTE Lanalyse des mesures conjointes ncessite que les variables explicatives soient qualitatives ou nominales et que les variables expliquer soient quantitatives. Ces dernires peuvent tre values : laide dune chelle de mesure ; laide dun ordre de prfrence (classement) entre diffrentes combinaisons de niveaux de facteurs. Par exemple, dans le cadre dune tude sur la prfrence des clients lgard dune offre de transport arien, on pourra demander aux individus dvaluer diffrentes offres de compagnies avec une note de 1 9, autrement dit de les classer. Ces offres incluront, par exemple, le prix du billet (bas, moyen, lev), la qualit du service bord (excellente, moyenne, mauvaise), le nombre descales, etc. Il sera ainsi possible destimer, parmi ces facteurs et leurs niveaux, celui qui a le plus dimportance pour les clients dans leur choix dune offre de transport arien. Lobjectif est ensuite dlaborer une offre optimale pour la clientle.
1.3 LES
TAPES DE LANALYSE CONJOINTE La mthodologie de lanalyse conjointe est jalonne par trois grandes tapes (Green et Srinivasan, 1990) : collecte des donnes : choix du plan factoriel complet ou fractionn, de la forme des questions et de la mthode de recueil ; dnition de lchelle de mesure de la variable dpendante : choix de la mesure (classement, notation des combinaisons, comparaison de paires de combinaisons) ; estimation : tape lie la nature de la mesure de la variable dpendante (ANOVA si la variable dpendante est quantitative, analyse monotone de la variance si elle est ordinale). Ces tapes sont dveloppes au cours de la section suivante.
(2)
Figure 7.1
Les tapes de lanalyse conjointe.
158
Index
A
Abaques 11 Access panels 8 on-line 8 Accord, chelle de mesure 15 Ad hoc, tendue 4 Agrgation chane 91 des donnes 51 mthode 85 Ajustement courge 187 test 42 Alpha de Cronbach 53 seuil dacceptabilit 53 Analyse bivarie 20, 36 bivarie, variable dpendante 36 bivarie, variable indpendante 36 conjointe, tapes 158 de fiabilit 65 de variance 108 factorielle 54, 56 factorielle, mthode 61 multivarie 20 multivarie de la variance 115 rapport d 178 typologique 81, 90 univarie 20 ANCOVA 116 ANOVA un facteur 108 Aplatissement 32 coefficient d (Kurtosis) 32 Arbre de dcision 90 hirarchique 87 Association prdictive, coefficient 39 Asymtrie 32
B
Baromtre 4 Barycentres 85 Biais de lexprimentation 17, 121 effet de linstrument 121 effet de test 121 histoire 121 maturation 121 mortalit 121 Botes moustaches 31 Bonferroni, test de 109 Boule de neige, chantillonnage 11 Brief de ltude 178
C
Carr latin 123 Catgorisation 80 Centiles 32 Centres de groupes 91 mobiles 88 Chane des agrgations 91 Classification 80, 85 ascendante 84 descendante 84 hirarchique 84 hirarchique ascendante 85 hirarchique descendante 86 non hirarchique 84, 88 Clustering 80 Coefficient daplatissement (Kurtosis) 32 dassociation prdictive 39
Index 197
de contingence 39 de corrlation multiple 136 de dtermination 137 de Pearson 134 de symtrie (Skewness) 32 de variation 32 phi 39 standardis 137 structurels 60 Collecte de donnes 3 Communalits 60 Comparaisons multiples 109 Composantes 60 principales 61 Comprhension, prtest 18 Concomitance 137 Conditions dapplication de la rgression 136 Confiance intervalle 12 seuil 40 Construits 16 multidimensionnels 59 Contamination, effet 18 Contingence, coefficient 39 Corrlation 137 de Pearson, mesure 84 linaire 134 matrice 57 multiple, coefficient 136 Corrlations anti-image, matrice 57 Courbe dajustement 187 Covariable 116 Covariance, matrice 57 Cramer, V de 39 Cronbach, Alpha de 53
Dispersion 31, 32 diagramme 187 Distance 83 de Minkowski, mesure 84 de Tchebycheff, mesure 84 du diamtre, mthode 85 euclidienne 83 mesure 83 moyenne, mthode 85 Distribution 31 normale 33 Donnes collecter 3 crire 20 expliquer 20 non structures 8 normalit 109 primaires 8, 9 saisir 130 secondaires 3, 7, 8 secondaires externes 7 secondaires internes 7 structures 8 textuelles 89 Duncan, test de 109
E
cart type 32 chantillonnage boule de neige 11 de convenance 11 mthode 10 stratifi 10 chantillons 9 alatoires 10 apparis 35, 41 indpendants 35, 41 non probablilistes 10 probabilistes 10 taille 11 uniques 41 chelle 17 dintention 16 dOsgood 15 de Likert 16 de Stapel 16 neutralit 18 chelle de mesure 16, 17 accord 15 diffrentiel smantique 15 intensit 15 intention 15
D
Data mining 7 Data warehouses 3 DDL (degrs de libert) 38 Dcrire les donnes 20 Degrs de libert (DDL) 38 Dmarche dtude 2 Dendogramme 86, 87, 91 Descriptive, mthode 20 Dtermination, coefficient 137 Diagramme de dispersion 187 en btons 31 en secteurs 31 gnrateur de 185 Diffrentiel smantique, chelle de mesure 15
198
Likert 15 mtrique 15 nominale 15 ordinale 15 Stapel 15 traduction 17 diteur de diagramme 186 Effectifs 30 Effets dinteraction 112 de contamination 18 de halo 18 de lassitude 18 principaux 112 galit des moyennes, hypothse 108 Eigenvalue 57 Embotement 184 Empiler 182 Entretien 3 individuel 5 puration des donnes 59 Equamax 58 Erreur 11 alatoire 18, 19 de type 1 40 de type 2 40 indpendance des termes 136 marge d 12 systmatique 18, 19 termes d 18 types 40 tapes de lanalyse conjointe 158 tendue 32 tude ad hoc 4 brief de l 178 daudience 12 de cas unique 121 dmarche 2 descriptive 6 explicative 6 exploratoire 18 omnibus 4 prdictive 6 projet 178 qualitative 5 quantitative 5, 6 Euclidienne, mesure de distance 83 Exprimentation 120 Explicative, mthode 21 Expliquer les donnes 20
F
Facettes 16 Facteurs 54 dinflation de la variance 142 Factorielle, analyse 54, 56 Factorisation 63 Fiabilit 19, 53 analyse 65 Formes alternatives, technique 53 Fractiles 32 Frquences 30
G
Gnrateur de diagramme 185 Graphiques 31, 181 Grco-latin 123 Groupe statique 121
H
Halo, effet 18 Hasard, tirage au 10 Hirarchique, mthode 84 Histogrammes 31 Homognit 109 Homoscdasticit 136 Hypothse alternative 40 dgalit des moyennes 108 nulle 40 statistique 40
I
Indpendance des termes derreur 136 Indice de Rogers et Tanimoto, mesure de 84 de Sokal et Michener, mesure de 84 de Sokal et Sneath, mesure de 84 Infrence, principe 39 Inflation de la variance, facteur 142 Intensit, chelle de mesure 15 Intention chelle 16 chelle de mesure 15 Interaction 112, 122 effet 112 Intervalle 32 de confiance 12 Items 16 Itinraires, mthode 11
Index 199
K
Kaiser-Guttman, rgle de 57 Kaiser-Meyer-Olkin (KMO) 57 Kolmogorov-Smirov, test de 42 Kurtosis (coefficient dapplatissement) 32
L
Lambda 39 Lassitude, effet 18 Libert, degrs de (DDL) 38 Likert, chelle de mesure 15, 16 Linarit 22, 136 Loi normale 33
M
MANCOVA 116 MANOVA 115 March-test 5 Marge derreur 12 Marketing de masse 80 individualis 80 segment 80 Matrice de corrlation 57 de covariance 57 des corrlations anti-image 57 McNemar 43 Measure of Sampling Adequacy (MSA) 57 Mdiane 31 Mesures apparies 41 de la dispersion 32 de proximit 83 indpendantes 41 outils 17 Mesures de distance 83 corrlation de Pearson 84 distance de Minkowski 84 distance de Tchebycheff 84 distance euclidienne 83 indice de Rogers et Tanimoto 84 indice de Sokal et Michener 84 indice de Sokal et Sneath 84 Mthode dagrgation 85 dchantillonnage 10 de lanalyse factorielle 61 de slection des variables de rgression 142 de Ward 86 des barycentres 85
des centres mobiles 88 des itinraires 11 des nues dynamiques 88 des quotas 10 des scnarios 121, 160 des vignettes 160 descriptive 20 distance du diamtre 85 distance moyenne 85 du plan dexprience 120 explicative 21 hirarchique 84 non hirarchique 84 non probabiliste 10 probabiliste 9 saut minimum 85 Mtrique, chelle de mesure 15 Minkowski, mesure de distance 84 Mode 31 Modle additif 156 compensatoire 156 de dcomposition 156 de la vraie valeur 18 statistique 121 Moyenne 31 Multicolinarit 142 Multivarie de la variance, analyse 115 analyse 20
N
Netnographie 5, 6 Neutralit dune chelle 18 Nominale, chelle de mesure 15 Non hirarchique, mthode 84 Non probabiliste, mthode 10 Normalit 136 des donnes 109 Nuage de points 81 Nues dynamiques 88 mthode 88
O
Oblimin direct 58 Observation 9 Ordinale, chelle de mesure 15 Orthogonalit 124 Osgood, chelles de mesure 15 Outils de mesure 17 Outliers 31
200
P
Panels 4, 8 daudience 9 de distributeurs 9 Pearson, coefficient 134 phi, coefficient 39 Plan complet 160 factoriel 122 factoriel complet 123 factoriel fractionn 123 fractionn 160 Plan dexprience, mthode 120 Points cls du rapport 180 Population 9 Prcision des rsultats 11 statistique dun test 12 Prtest de comprhension 18 Prtest/post-test et groupe de contrle 121 Principaux, effets 112 Principe dinfrence 39 Probabiliste, mthode 9 Projet dtude 178 Proximit, mesure de 83 Puissance du test 40
S
Saisir les donnes 130 Saut minimum, mthode 85 Scnarios, mthode 121, 160 Scree Test 57 Segmentation 80 Slection des variables de rgression, mthode 142 Seuil dacceptabilit de lalpha 53 de confiance 40 de signification 40 Signe 43 Signification, seuil 40 Skewness, coefficient de symtrie 32 Sondage, taux 11 units de 9 Split half 53 Standardisation 84 coefficient 137 Stapel, chelle 15, 16 Statistique dun test, prcision 12 Structure dun rapport dtude 179 Structurel, coefficient 60 Symtrie 32 coefficient (Skewness) 32 dune chelle 18
Q
Quartiles 32 Quartimax 58 Questionnaire 3, 16 Quotas, mthode 10
R
R2 137 Rapport danalyse 178 dtude, structure 179 points cls 180 Rgle de Kaiser-Guttman 57 des valeurs propres 57 Rgression conditions dapplication 136 linaire 136 linaire multiple 141 linaire simple 136 multiple 141 Rsultats, prcision 11 Rtro-traduction 18 Runions de consommateurs 3
T
t de Student 42 Tableaux 181 croiss 36 personnaliss 182 pivotants 182 Taille de lchantillon 11 Taux de sondage 11 Taxinomie 80 Tchebycheff, mesure de distance 84 Techniques des formes alternatives 53 qualitatives 4 quantitatives 4, 6 Tendance centrale 31 Termes derreur 18 Test /retest 53 dajustement 42
Index 201
dhypothses 35, 41 dinfrence 41 de Bonferroni 109 de comparaison dchantillons apparis 42 de comparaison dchantillons indpendants 42 de Duncan 109 de Kolmogorov-Smirov 42 de lboulis 57 de la mdiane 43 de Levene 109 de McNemar 44 de Scheff 109 de Sphricit de Bartlett 57 de Tukey 109 de Wilcoxon 43 du coude 57 du khi-deux 37 du signe 43 non paramtrique 35, 41, 42, 109 paramtriques 35, 41 post hoc 109 prcision statistique 12 puissance 40 statistiques 39 t 42 t pour chantillon unique 13 U de Mann-Whitney 43 Z 42 Tirage au hasard 10 Traduction dchelles de mesure 17 Tri plat 31 croiss 36, 37 Type danalyse de variance 108 derreurs 40 Typologie 80 analyse 81, 90
U
U de Mann-Whitney, test de 43 Units de sondage 9 Univarie, analyse 20
V-W
V de Cramer 39 Valeurs extrmes 31 propres, rgle des 57 Validit 19, 90 convergente 52 de contenu 52 discriminante 52 faciale 18, 52 nomologique 52 prdictive 52 Variable 30 de segmentation 81 dpendante 14 dpendante, analyse bivarie 36 explicative 14 explique 14 indpendante 14 indpendante, analyse bivarie 36 mdiatrice 14 modratrice 14 qualitative 14, 30 quantitative 15, 31 Variance 32 analyse de 108 coefficient 32 facteur dinflation 142 intragroupe 109 Varimax 58 Vignettes 121 mthode 160 Vraie valeur 19 Ward, mthode 86
202