La Theorie de La Decision

Robert Kast
La thorie de la dcision
Nouvelle dition
ditions La Dcouverte
9 bis, rue Abel-Hovelacque 75013 Paris
DU MME AUTEUR
Rationalit et marchs financiers, collection Gestion , Economica, Paris, 1991. Fondements microconomiques de la thorie des marchs financiers (avec Andr LAPIED), collection Gestion , Economica, Paris, 1992.
Catalogage lectre-Bibliographie (avant publication) KAST, Robert La thorie de la dcision. Nouv. d. Paris : La Dcouverte, 2002. (Repres ; 120) ISBN 2-7071-3769-3 Rameau : calcul conomique incertitude (conomie politique) Dewey : 330.1 : conomie gnrale. Thorie gnrale de lconomie Public concern : 1er et 2e cycles. Public motiv Le logo qui figure au dos de la couverture de ce livre mrite une explication. Son objet est dalerter le lecteur sur la menace que reprsente pour lavenir de lcrit, tout particulirement dans le domaine des sciences humaines et sociales, le dveloppement massif du photocopillage. Le Code de la proprit intellectuelle du 1er juillet 1992 interdit en effet expressment la photocopie usage collectif sans autorisation des ayants droit. Or, cette pratique sest gnralise dans les tablissements denseignement suprieur, provoquant une baisse brutale des achats de livres, au point que la possibilit mme pour les auteurs de crer des uvres nouvelles et de les faire diter correctement est aujourdhui menace. Nous rappelons donc quen application des articles L. 122-10 L. 122-12 du Code de la proprit intellectuelle, toute reproduction usage collectif par photocopie, intgralement ou partiellement, du prsent ouvrage est interdite sans autorisation du Centre franais dexploitation du droit de copie (CFC, 20, rue des Grands-Augustins, 75006 Paris). Toute autre forme de reproduction, intgrale ou partielle, est galement interdite sans autorisation de lditeur. Si vous dsirez tre tenu rgulirement inform de nos parutions, il vous suffit denvoyer vos nom et adresse aux ditions La Dcouverte, 9 bis, rue AbelHovelacque, 75013 Paris. Vous recevrez gratuitement notre bulletin trimestriel la Dcouverte.
ditions La Dcouverte, Paris, 1993. ditions La Dcouverte & Syros, Paris, 2002.
Introduction
Pourquoi laborer une thorie pour prendre des dcisions ? Quels dcideurs ressentent-ils la ncessit dune thorie ? Nous prenons des dcisions chaque instant sans que cela ne nous pose de problme. Souvent, pourtant, nous rencontrons des situations o les consquences de nos choix mritent rflexion, o nous prouvons le besoin danalyser, de rationaliser et, si cela est possible, de nous faire aider. Lorsque tel est le cas, nous devenons un dcideur, nous pouvons prouver le besoin de justifier nos choix, voire tre fortement invits le faire par ceux devant lesquels nous sommes responsables. Une thorie sur laquelle peuvent se fonder les choix une thorie de la dcision rpond ce besoin : elle permet de rationaliser les dcisions. La difficult de justifier ses choix nest pas la seule que peut rencontrer un dcideur. Mme dans le cas o la dcision ne concerne que lui-mme, le dcideur peut ne pas savoir comment prendre le problme, cest--dire comment lanalyser, dcrire les dcisions alternatives et leurs consquences, mesurer la porte de ses actes Cest aussi pour tenter de rpondre ces questions que la thorie de la dcision sest dveloppe. Les diffrents aspects de la description et de la rsolution de problmes de dcision que nous introduisons dans cet ouvrage ont pris forme durant la seconde moiti du XXe sicle et constituent la thorie de la dcision. Cette thorie rsulte de plusieurs sicles de recherches sur la formalisation du hasard et sur ltude des jeux de socit, sur lanalyse des problmes conomiques et politiques, et, plus 3
rcemment, sur les problmes de gestion, mais aussi sur les fondements psychologiques de la reprsentation du comportement. Un des objectifs principaux du dveloppement de cette thorie est de trouver un cadre de rfrence pour les thories conomiques et les modles de gestion des entreprises, publiques ou prives. Comment dcrire le comportement dagents conomiques ? Quelle dcision prendre dans le cadre dune gestion rationnelle des ressources et des moyens de production ? Comment investir dans des actifs financiers dont les rendements sont incertains ? Comment infrer des paramtres dune distribution de probabilits partir dun chantillon ? Ces problmes de dcision ont motiv le dveloppement de la thorie prsente dans cet ouvrage. Confronts un problme de dcision, nous commenons par en extraire quelques grandes lignes, simplifiant pour y voir clair, tout en gardant la facult de revenir sur les simplifications lorsque nous voyons quelles restreignent notre analyse. La thorie ne procde pas autrement. La formalisation dun problme de dcision, cest--dire la description de ses lments par des valeurs, des fonctions, des graphes, correspond une simplification qui permet dutiliser des outils et des rsultats mathmatiques. Nous prsentons aux chapitres II et III un certain nombre dexemples de problmes de dcision pour mieux comprendre comment les formaliser. Cette formalisation faite, la prise de dcision proprement dite utilisera un ou plusieurs critres. Les plus couramment utiliss sont prsents au chapitre IV. Historiquement, ces critres ont t trouvs de manire pragmatique, en statistique et en calcul conomique notamment. Nombreux sont ceux qui nont toujours pas trouv de thorie qui en justifie lusage. Cest pourquoi la thorie de lutilit espre mrite dtre prsente en dtail (chapitre V) comme le premier exemple achev dune thorie de la reprsentation du comportement de dcideurs face au risque. Cette thorie a permis dlaborer des analyses de laversion pour le risque et des mesures du risque (chapitre VI). Dautres thories, complmentaires, concurrentes ou plus gnrales, ont t dveloppes (chapitre VIII). Cest surtout depuis 1990 quil est possible de mieux voir les liens entre ces diffrentes thories dont les applications font lobjet de recherches actives. 4
Ces thories utilisent des rsultats de la thorie des probabilits qui permet de dcrire et de quantifier des expriences alatoires. Mais le calcul des probabilits ncessite des donnes qui sont tires des observations ( la probabilit que le taux de change du dollar face leuro augmente dans les trois prochains mois sera estime partir des fluctuations de ce taux observes par le pass). Cest lobjet de la statistique de nous donner les moyens dextraire de tels paramtres des rsultats observs. Le chapitre VII est consacr au problme de la dcision statistique qui est la fois un problme de dcision et une application de la reprsentation de lincertitude par la thorie des probabilits. Si la statistique fait partie de la mathmatique au mme titre que la thorie des probabilits, les critres qui y sont utiliss doivent reposer sur les thories de la reprsentation du comportement face lincertitude. partir dobservations de variables considres comme alatoires, le statisticien infre des valeurs caractristiques (comme la moyenne) des lois de probabilits qui rgissent ces observations. Par exemple, partir dun chantillon de votants pris au hasard, on estime le nombre moyen des intentions de vote pour un candidat. Cette infrence est une dcision, elle dpend de la mthode et du critre utiliss par le statisticien, critres que la thorie de la dcision pourra lui permettre de justifier (auprs de ses commanditaires, notamment). Ltude des jeux a t le point de dpart de la thorie des probabilits, donc, en partie, de la statistique, de la thorie de la dcision individuelle, et, bien sr, de la thorie des jeux. Cette dernire a connu un essor considrable depuis louvrage de von Neumann et Morgenstern en 1944, formant ainsi une thorie en tant que telle ; elle est une branche des mathmatiques appliques. Bien que la thorie de lutilit espre ait t developpe prcisment pour cela, la reprsentation du comportement individuel a jou un rle assez restreint en thorie des jeux jusquaux annes quatre-vingt o ltude de la rationalit dans les jeux lui a donn une nouvelle place. Nous ne ferons quvoquer dans la conclusion cette thorie qui peut pourtant tre considre comme faisant partie de la thorie de la dcision puisquelle sintresse aux comportements stratgiques des dcideurs face dautres dcideurs. Lampleur, la porte et les applications des rsultats de la thorie des jeux dpassent largement les objectifs de cet ouvrage qui se consacre laspect individuel des dcisions. Laspect 5
stratgique, parce quil fait prendre en compte par chaque dcideur les dcisions des autres, fait appel des notions de solutions de problmes, de conflits, ou des concepts dquilibre, il ne concerne pas les problmes de dcision individuels proprement dits, ceux qui font lobjet de la thorie aborde ici. La thorie de la dcision se trouve lintersection de nombreuses disciplines : conomie, gestion, psychologie, statistique et mathmatique. Lintrt des mathmaticiens pour la formalisation de lincertitude et de la solution des jeux a t dterminant pour lmergence de cette thorie et des outils quelle utilise. Un aperu de lhistoire de la thorie est trac dans le premier chapitre. Mais le besoin dune thorie du comportement rationnel pour les modles de lconomie et de la gestion a t la raison de son succs et des dveloppements qui continuent voir le jour. Cette perspective est mise en valeur dans le premier chapitre et guide la progression des chapitres ultrieurs.
I / Rationalit des choix : perspectives et origines de la thorie

Faire un choix rationnel ! Beaucoup de dcideurs le souhaitent et y travaillent. Dans les problmes dinvestissement, dcologie, de scurit routire et, plus gnralement, dans les problmes de choix industriels ou politiques dont les consquences concernent la socit, le choix final voudrait tre fond sur des arguments caractre scientifique : il voudrait tre rationnel. La thorie de la dcision se fonde sur un ensemble de descriptions des problmes de dcision partir desquelles des analyses cohrentes peuvent tre menes ; elle propose des principes sur lesquels des critres de slection sont construits et des solutions seront proposes. La thorie donne donc les moyens aux dcideurs non seulement danalyser leurs problmes, mais aussi de pouvoir justifier les solutions proposes : elles sont rationnelles. La description des problmes de dcision utilise le langage mathmatique parce que cest un langage universel, dune part, et, dautre part, parce quil permet dutiliser de puissants outils danalyse. Cela ne veut pas dire que le champ dapplication soit strictement limit des problmes quantitatifs, la mathmatique ne ramne pas tout aux nombres ! Il est certain toutefois que, dans la pratique, les dcisions proposes par la thorie seront gnralement quantifies. Les dcisions conomiques, qui sont par nature quantifies, seront naturellement fondes sur une analyse et sur des mthodes quantitatives. La difficult rencontre ds labord vient de ce que certains lments de lenvironnement conomique ne sont pas tous aisment quantifiables : les impondrables mtorologiques (qui influent sur les rcoltes), les 7
contextes gopolitiques (blocus, guerres) et surtout les comportements des diffrents acteurs conomiques. Cela ne doit pas ncessairement faire abandonner lapproche quantitative sous le prtexte que toute quantification serait rductrice et partiellement arbitraire. Un des objets de la thorie de la dcision est de donner les moyens de construire des descriptions quantifies des problmes, ainsi que des critres, qui permettent dy apporter des solutions. Bien entendu, le calcul du prix de vente dun robot mnager, partir des cots de production et dune estimation de la demande de ce produit, se prte mieux une tude quantitative que le choix dun nouveau directeur commercial. Cependant, avec un degr appropri de formalisme, en restant conscient des limites de validit des critres, en examinant de manire critique les solutions proposes, il est souvent profitable dutiliser les mthodes dveloppes par la thorie de la dcision, avant darrter le choix final. 1. Quelles thories de la dcision ? Ou encore, la thorie de quelles dcisions ? Le besoin de rationaliser les choix se fait sentir aussi bien pour les gestionnaires qui traitent de problmes complexes, mais sans incertitude, que pour ceux, les actuaires et les financiers notamment, dont le souci principal vient de lincertitude sur les consquences de leurs choix. Doit-on traiter sparment chaque type de problme et lui proposer une thorie adapte ? La thorie de la dcision se construit de manire pouvoir intgrer diffrents types dincertitude, et nous aurons donc une thorie qui pourra sappliquer des problmes de dcision qui se posent des agents situs dans des environnements de natures varies. Mais outre les utilisateurs directs des recommandations dune thorie, la rationalisation des choix est un lment essentiel la construction de nouvelles thories qui mettent en jeu des dcideurs, dans les sciences de lhomme et de la socit. La thorie conomique est construite sur la description du comportement dagents (consommateurs, producteurs) ; les modles de la gestion doivent faire des hypothses sur la reprsentation des objectifs atteindre. Les situations suivantes font appel la thorie de la dcision ; elles aideront en clarifier les diffrents aspects. 8
Les choix conomiques dans les entreprises, publiques et prives, ont commenc tre traits de manire systmatiquement scientifique dans les annes cinquante. Le calcul conomique sadresse en particulier aux problmes de choix de facteurs de production en fonction de leurs cots, de choix de prix de vente dun produit, dvaluation des salaires, etc. 1 Il a pu voir le jour grce au dveloppement de la thorie conomique qui fournit un cadre appropri la formalisation des problmes, aux mthodes conomtriques permettant de traiter les donnes et aux rsultats de la recherche oprationnelle proposant des mthodes mathmatiques de rsolution. Recherche oprationnelle
Recherche oprationnelle est une traduction mot mot de lamricain operations research, terme militaire dsignant un ensemble de recherches thoriques et de mthodes dveloppes durant la Seconde Guerre mondiale dans les services scientifiques de lUS Navy, afin damliorer les stratgies militaires mais aussi la gestion des matriels de plus en plus sophistiqus des armes. Lapplication de ces mthodes aux stratgies commerciales et la gestion des affaires, prives ou publiques, sest impose aprs la guerre aux responsables conomiques. Parmi ces mthodes, les plus marquantes sont celles des programmes doptimisation mathmatique que le dveloppement des ordinateurs a pu rendre particulirement efficaces. Grce la formalisation des problmes conomiques proposs par la thorie : fonctions de production, de cot, fonctions doffre, de demande, etc., les problmes de choix conomiques ont pu tre traits comme des problmes doptimisation mathmatique, en particulier par les mthodes de programmation linaire. Mais les mthodes de la recherche oprationnelle concernaient aussi un approfondissement de lanalyse des dcisions en distinguant les situations o toutes les consquences sont connues de celles o elles ne le sont pas (situations dincertitude, de risque, de conflit dintrts).
Lanalyse des risques est une tape ncessaire du traitement de certains problmes de dcision. Les problmes dassurance et de choix de portefeuille appartiennent des domaines o lincertitude est lobjet principal des proccupa1. Voir, dans la mme collection, B. WALLISER, Le Calcul conomique. Bien quil sinspire de la thorie de la dcision individuelle, le calcul conomique a pour objet le choix collectif qui ne relve pas de la mme problmatique que le choix individuel (voir chapitre IV, paragraphe 6).
tions des dcideurs. Lorsque lon veut assurer un bien contre un risque de destruction, deux lments fondamentaux sont estimer : la valeur du bien ou son cot de remplacement, dune part, limportance et la vraisemblance des vnements qui prsentent des risques, dautre part. De mme, pour dcider de la formation dun portefeuille, les rendements des actifs, mais aussi les variabilits de ces rendements, doivent tre pris en compte. Cest lobjet principal de la thorie de la dcision individuelle que de proposer un cadre dtude du comportement rationnel face lincertitude. En distinguant diffrents types dincertitudes, des thories adaptes sont proposes pour reprsenter les comportements de dcideurs qui vrifient certaines conditions. La thorie la plus acheve concerne les situations o lincertitude porte sur des variables dont la distribution de probabilit est connue : une compagnie dassurances a estim que la probabilit de destruction dune automobile durant lanne venir est de 5 % ; le taux de rendement moyen dun actif financier est estim 9 % avec une variabilit (mesure par lcart moyen autour de 9 %) de 15. Ces estimations sont faites sur la base dobservations des variables passes, ventuellement corriges par des informations concernant le futur. Cest ce type dincertitude quest gnralement rserv le terme de situations de risque. La thorie qui a domin les tudes de risques, depuis son apparition en 1944, est la thorie de lutilit espre (chapitre V). Elle a permis de dfinir un certain nombre de mesures du risque qui ont servi tant en thorie de lassurance quen conomie de lincertain en gnral. Mais elle prsente de graves limites qui ont conduit chercher dautres thories dont lmergence date des annes quatre-vingt et qui nont pas encore trouv toutes les applications que lon peut en attendre. Les thories du risque stendent certaines situations o lincertitude nest pas probabilise et o lestimation des risques doit garder un caractre subjectif. Cest le cas de problmes dinvestissement dans une activit mal connue, de recherche de minerais dans une rgion non prospecte, et, dune manire gnrale, de paris sur une variable alatoire dont les ralisations ne peuvent pas tre observes (comme les paris sportifs, par opposition aux loteries). Les problmes dassurance font aussi intervenir, au point de vue individuel, un risque relatif aux comportements des 10
assurs : lassureur prend en compte la frquence des accidents passs, mais il doit aussi prendre en compte le comportement (les prcautions, les activits) de lassur. Ce dernier peut fort bien prendre beaucoup moins de prcaution sil est assur que sil ne ltait pas (ce problme est connu sous le nom de risque moral ). Il peut aussi prtendre un contrat qui ne correspond pas au type de risque que son activit lui fait courir (ce problme est connu sous le nom dantislection 2). Dans tous les cas, du fait quil y a plusieurs parties dans un contrat, un lment de lincertitude concernant chacune des parties provient du comportement des autres. Ltude des situations de conflit dintrts fut, on sen doute au vu de son origine militaire, un des moteurs de la recherche oprationnelle. Cest lobjet de la thorie des jeux, qui doit son nom au fait que les jeux de socit sont des microcosmes de situations de conflit relles : les checs, la guerre (fodale !) ; le Monopoly, linvestissement immobilier ; le bridge, la communication, le choix de stratgies et le combat. Avec ou sans coopration, en connaissance complte ou non des autres joueurs et de leurs objectifs, avec ou sans incertitude sur lenvironnement du jeu, la thorie des jeux a formalis un grand nombre de situations de conflit et sest efforce dy apporter des solutions. Ses applications en thorie de lassurance et de la concurrence sont les plus connues, mais ses apports sont importants aussi dans lanalyse des quilibres conomiques et dans la formalisation de situations politiques et sociales (organisation industrielle, jeux de vote, ngociations syndicales). Lapproche de la thorie des jeux diffre de celle de la thorie de la dcision individuelle puisque son objet est de proposer des solutions des problmes o plusieurs dcideurs interviennent. La thorie des jeux propose un ensemble de mthodes danalyse et de concepts de solution pour lesquels chacun des joueurs tient compte de la raction des autres joueurs sa dcision. Ces analyses utilisent la thorie de lutilit espre pour reprsenter le comportement des joueurs face aux risques, quand ceux-ci proviennent de mcanismes alatoires. En revanche, lincertitude laquelle fait face chaque joueur quant aux dcisions des autres joueurs nest pas reprsente comme une variable alatoire. Chacun des joueurs, se
2. Adverse selection, en anglais.
11
mettant la place de ses opposants, peut chercher trouver une dcision pour chacun qui soit telle quaucun ne puisse individuellement mieux faire si les autres ne dvient pas. Ce type de raisonnement ne peut se faire que sur la base dune description du jeu qui soit une connaissance commune de tous les joueurs ; il suppose de plus que chacun des joueurs raisonne de la mme manire et adopte un comportement rationnel. La thorie de la dcision regroupe donc un ensemble de mthodes danalyse et de rsolution de problmes de dcision. Cet ensemble peut parfois paratre htroclite du fait que les mthodes dpendent de lenvironnement des problmes traits. Ce qui en fait UNE thorie, cest que ces diffrentes mthodes sont construites en utilisant la mathmatique, non seulement pour son langage et sa logique, mais aussi pour sa construction : partant dlments de base (les dcisions possibles, les prfrences), des axiomes sont proposs (sur le comportement des dcideurs) partir desquels la thorie est construite. Bien que la thorie de la dcision ait les mmes origines que la reprsentation de lincertitude, cette dernire a connu une formalisation plus universelle qui a donn lieu la formation dune thorie purement mathmatique : la thorie des probabilits. 2. Aperu historique de la reprsentation de lincertitude Le fait que les consquences de nos actes ne dpendent pas uniquement de nos dcisions a d simposer trs tt la conscience humaine. Avant toute analyse scientifique des phnomnes, les facteurs qui chappent au contrle des dcideurs ont t attribus la volont dentits anthropomorphes : les dieux et les dmons. Les langages magico-religieux peuvent tre considrs comme les premires reprsentations de lincertitude. Au fur et mesure de lavance des analyses scientifiques, le rle de la formalisation dmonologique a recul devant les thories et dautres types de formalismes. Linvention des premiers jeux de socit et leurs raffinements ont sans doute permis de distinguer le rle de ladresse, de la rflexion, des interactions entre les joueurs, et, enfin, disoler le rle de variables qui ne sont contrles par aucun des joueurs. Ainsi, les jeux dchecs, de dames ou le go ne laissent dincertitude que quant la stratgie choisie par lautre joueur. En revanche, 12
dans les jeux utilisant des ds ou des cartes, lincertitude porte aussi sur des numros ou des figures tirs au hasard. Les loteries, lotos ou jeux de roulette des casinos sont des jeux o les consquences des choix (paris) des joueurs ne dpendent que des rsultats du mcanisme utilis, rsultat qui est suppos ne pas tre manipul. Ltude des jeux de socit, considrs comme des formalisations de situations de dcisions relles, a t le point de dpart (XVIIe et XVIIIe sicles) de la thorie de la dcision, ainsi que celui dune formalisation mathmatique de lincertitude, qui devait devenir la thorie des probabilits. Le vritable dveloppement de cette thorie mathmatique devait venir, au XIXe sicle, des recherches en physique, dune part, et de ltude des statistiques sociales et conomiques, dautre part. La thorie des probabilits est dsormais une branche de la mathmatique ; la statistique mathmatique en est un dveloppement dans lequel les techniques statistiques trouvent leurs fondements. Aussi, autant que faire se peut, la thorie de la dcision, telle quelle est apparue dans les annes cinquante, se rfre ces thories en utilisant leur formalisation de lincertitude. Un petit exemple classique en thorie des probabilits peut aider comprendre comment cette thorie et son formalisme peuvent aider prendre des dcisions. Supposons que vous soyez dans une salle avec un certain nombre de personnes et quun individu vous aborde et parie avec vous cent euros quil y a dans cette salle au moins deux personnes ayant la mme date danniversaire. Une fois sr que lindividu ne connat pas plus que vous les personnes prsentes, tiendrez-vous le pari ? Cela dpend, bien sr, du nombre de personnes dans la salle ; on ne doute pas quil y ait plus de chance de trouver deux personnes ayant la mme date danniversaire parmi cent personnes que parmi cinq. Le calcul des probabilits permet de calculer prcisment que la probabilit de trouver deux personnes ayant la mme date danniversaire est de 0,0027 sil y a deux personnes prsentes ; de 0,11, si le nombre de personnes est 10 ; de 0,42, sil y a 20 personnes ; de 0,50 (le pari est donc quivalent dans ce cas un jeu de pile ou face !) si le nombre de personnes est 23 ; de 0,97, sil y a 50 personnes (vous tes quasiment sr de perdre !). Mais le fait quune thorie mathmatique existe ne signifie pas que toutes les situations dincertitude puissent sexprimer 13
selon le formalisme probabiliste 3. En outre, pour chaque problme de dcision, restent les difficults dinterprtation du formalisme qui reprsente lincertitude telle quelle est perue par le dcideur. Cest en concurrence avec llaboration de thories conomiques quont t poss de nombreux problmes dinterprtation de lincertitude dans les problmes de dcision. En particulier, John Keynes [1921]* a favoris une interprtation selon laquelle toutes les probabilits sont conditionnelles et dfinies par des relations ordinales entre les vnements. Ramsey [1931], puis De Finetti [1930] et Savage [1954], en critiquant le point de vue frquentiste (les probabilits des vnements sont les frquences de leurs apparitions dans une exprience alatoire rpte), ont considr les lois de probabilits comme des reprsentations des jugements des dcideurs sur la confiance quils accordent la ralisation des vnements. Une telle interprtation conduit une notion de probabilits subjectives qui ne sont dfinies que dans le contexte de problmes de dcisions individuels. Les deux notions, frquentistes et subjectivistes, peuvent cependant tre juxtaposes (Anscombe, Aumann [1963]) : les probabilits objectives des vnements dune exprience alatoire (loterie) pouvant tre utilises pour talonner les probabilits subjectives dvnements dont lapparition ne peut, ou na pas pu, tre observe. 3. Les fondateurs de la thorie de la dcision En 1957, parat un ouvrage qui reste ce jour une trs bonne rfrence des thoriciens de la dcision : Games and Decisions (Jeux et dcisions) de Luce et Raiffa [1957]. Le point y est fait sur ltat de lart cette poque et de nombreuses suggestions sur des extensions et des applications possibles y sont proposes. Si, comme nous le verrons dans le paragraphe suivant, la thorie de la dcision sest largement dveloppe depuis, cest sur les rsultats prsents dans cet ouvrage que se sont
3. ce propos, notons pour plaisanter que certains casuistes ont abus du systme probabiliste et sont arrivs, par des dductions subtiles, des conclusions que la morale rprouve . Probabilisme, doctrine thologique , in Le Larousse pour tous (2 vol.), Librairie Larousse, Paris, 1910. * Les rfrences entre crochets renvoient la bibliographie en fin douvrage.
14
appuys la fois et la plupart des recherches en conomie de lincertain, et la plupart des mthodes daide la dcision. Comme lindique le titre de louvrage de Luce et Raiffa, il sagit tout dabord de prsenter les rsultats fondamentaux de la thorie des jeux alors toute rcente, puisquelle a vu le jour sous sa forme moderne durant la Seconde Guerre mondiale (ses concepts de solution des problmes de dcision en situations de conflit devaient leur importance lactualit militaire). Mais la thorie des jeux elle-mme requrait une thorie de la reprsentation du comportement individuel : cest la thorie de lutilit espre propose par von Neumann et Morgenstern [1944]. La notion dutilit espre (chapitre V) avait t propose ds le XVIIIe sicle par Daniel Bernoulli ; elle navait pas t beaucoup exploite depuis lors, essentiellement parce que les modles conomiques se limitaient au cadre de dcisions sans incertitude. Elle ntait cependant pas trangre certains conomistes qui utilisrent la notion de fonction dutilit des consquences (au lieu de comparer les consquences ellesmmes) ainsi que la proprit de cette fonction dtre marginalement dcroissante : la satisfaction saccrot moins en ajoutant un euro mille euros, quen ajoutant un euro dix euros. Paralllement la formalisation de la thorie des jeux, un certain nombre de techniques mathmatiques (programmation linaire et, plus gnralement, techniques doptimisation de critres) ont permis la thorie de la dcision dtre applique avec succs. Par ailleurs, la statistique, en devenant une thorie mathmatique qui sappuyait sur la thorie des probabilits, cherchait faire reposer ses mthodes dinfrence sur une thorie : la dcision statistique (chapitre VII). Ce furent Wald [1950], puis Savage [1954] qui firent le lien entre les fondements de la statistique, des probabilits et des dcisions. Historiquement, ces thories sont intimement lies. Cest au XVIIe sicle, puis au XVIIIe sicle que les philosophes-mathmaticiens se penchrent sur les problmes poss par les jeux de hasard. Le chevalier de Mr (1607-1684), philosophe, homme de lettres et joueur invtr, fut un des premiers poser des problmes de dcision en termes scientifiques et chercher les rsoudre dans le cadre simple des jeux de hasard. Un de ces problmes consistait faire parier contre lapparition dau moins un six en jetant quatre ds. Le chevalier de Mr russit calculer que sa probabilit de gagner au jeu prcdent (la probabilit quapparaisse au moins un six) tait lgrement 15
suprieure 1/2, ce qui lui donnait, en y jouant souvent, un avantage suffisant pour gagner long terme sans que ses partenaires ne ralisent que le jeu leur tait dfavorable. Cest sur le mme principe que sont construits les jeux proposs dans les casinos qui, tout en laissant aux joueurs une probabilit assez importante de gagner, assurent, long terme, un revenu certain la direction. Le chevalier de Mr se posait des problmes de dcision dune manire qui exprimait le besoin dune thorie. Ainsi le problme des partis (on dirait aujourdhui partages) rsolu par Pascal : on considre un jeu de pile ou face, rpt, deux joueurs, o le premier joueur avoir gagn N fois (N est un nombre fix avant que la partie commence) ramasse la totalit de la mise initiale. Le problme est alors le suivant : supposons que le jeu soit interrompu et quil manque m parties pour que le joueur A gagne et n parties pour que le joueur B gagne, comment rpartir la mise quitablement ? La solution propose par Pascal suppose que le partage est quitable si les sommes perues par chacun des joueurs sont proportionnelles leurs chances de gagner. Ce critre est l esprance du gain ; il avait t dfini par Huygens dans son essai, De la logique du jeu de ds, en 1637, avec linterprtation du juste prix auquel un joueur accepterait de cder sa place dans une partie . Lutilisation de ce critre ncessitait de savoir calculer les chances ; ce furent les premiers calculs de probabilits. Problmes de dcision, jeux et calcul des probabilits restrent trs lis au sicle suivant : Montmort, Essai danalyse sur les jeux de hasard (1708) ; de Moivre, La Doctrine des chances (1730) ; Jacques Bernoulli, LArt de la conjecture (1713), qui trouva la premire loi des grands nombres, et son neveu Daniel, Expos dune thorie nouvelle de lvaluation du risque (1738). Daniel Bernoulli peut tre considr comme le pre de la thorie de la dcision moderne puisquil fut le premier proposer le critre de l esprance de lutilit du gain , sur lequel nous reviendrons en dtail au chapitre V. Mais pour se dvelopper plus avant, lanalyse des problmes de dcision avait besoin de mathmatiques qui restaient dcouvrir. La thorie des probabilits fut dveloppe par Poisson (qui dcouvrit aussi une loi des grands nombres en 1837 et imposa ce terme), puis par Laplace (Thorie analytique des probabilits, 1812) et Gauss (Thorie de la combinaison derreurs de faibles amplitudes, 1821) qui dcouvrirent 16
la fameuse loi de Laplace-Gauss, aussi appele loi normale. Il fallut tout un sicle pour gnraliser les lois des grands nombres, et pour cela le dveloppement des thories de lintgrale (Riemann en 1867, Lebesgue en 1901, pour les plus connues). La thorie des probabilits prit sa forme acheve en 1933 (Kolmogorov, pour un fondement analytique, mais von Mises avait propos un fondement statistique en 1919). Elle continue de se dvelopper, mais ds cette poque ses applications aux statistiques (qui devaient aussi former une thorie mathmatique), la thorie des jeux et la thorie de la dcision allaient devenir la norme.
4. Les thories et les perspectives La thorie de la dcision individuelle est lobjet de notre prsentation. Elle consiste, dans le cadre dune description adquate des diffrents lments des problmes de dcision, construire des critres fonds sur des hypothses sur le comportement du dcideur. Dans le cadre de ces hypothses, le comportement rationnel consiste optimiser ces critres. La thorie de la dcision sinscrit ainsi dans la perspective de la thorie conomique qui met en jeu des agents, consommateurs et producteurs, et en formalise le comportement comme consistant maximiser des fonctions dutilit ou fonctions de satisfaction (nous simplifions, la thorie na souvent besoin que de prfrences chapitre III sans que celles-ci doivent tre reprsentes par une fonction). Lagent conomique est alors rduit au fameux Homo economicus qui peut faire sourire, mais qui a permis dimportantes avances dans le domaine de la comprhension des prix dquilibre. Dans des domaines plus spcialiss de lconomie : marchs financiers, contrats dassurance et, plus gnralement, ceux traitant de lanalyse des risques, la thorie de la dcision a permis de proposer des solutions normatives, en sappuyant notamment sur le critre de lutilit espre. Dans les applications, ces thories requirent le traitement de donnes, ce qui relve de la statistique. Mais ce traitement ncessite aussi des prises de dcisions et linfrence statistique se rfre aussi la thorie de la dcision. 17
Ltude de la plupart des dcisions conomiques ne peut se traiter sur la seule base du comportement individuel puisque les interactions entre les agents entrent en jeu. Des agents rationnels doivent donc tre dcrits en tenant compte du fait quils sont conscients de ces interactions entre leurs objectifs et ceux des autres agents. Les dveloppements rcents de la thorie conomique, la thorie de lorganisation industrielle notamment, font donc une large place la thorie des jeux dont lobjet est ltude des interactions des diffrents joueurs. Nous nen traitons pas ici, faute de place, nous contentant dexposer les diffrents lments des problmes de dcision qui nous permettront de donner un sens prcis la notion de rationalit individuelle.
II / Comment formaliser un problme de dcision

Dans la mesure o un dcideur est satisfait des solutions aux problmes de dcision qui se posent lui et o il na pas de compte rendre sur la manire dont il les a obtenues, aucun effort de rationalisation ne semble ncessaire. En revanche, ds que la solution nest pas satisfaisante ou quil semble quelle puisse tre amliore, le dcideur aura besoin danalyser le problme. Cette analyse, qui conduit une certaine formalisation (non ncessairement mathmatique), permettra aussi dexpliquer plus aisment pourquoi telle solution a t retenue plutt que telle autre. Le besoin de telles justifications se fait sentir ds que le dcideur veut rendre des comptes sur sa dcision, et, en particulier, dans les situations o les consquences de la dcision prise ne sont pas immdiatement apprciables. Cest pourquoi les ingnieurs et les gestionnaires utilisent frquemment des formalisations de leurs problmes de dcision grce des graphiques, des arbres de dcision, des tableaux, etc., et sont conduits dvelopper des mthodes et des critres qui permettent la fois de calculer les meilleurs choix et de justifier la manire dont ils ont t obtenus. Ces mthodes sont fondes sur des modles formaliss et les dcisions sont prises en utilisant des rsultats de la programmation mathmatique, encore appele thorie du contrle, cest--dire un ensemble de mthodes du calcul des optimums de fonctions. La thorie de la dcision ncessite une reprsentation formelle des situations de dcision et du comportement des dcideurs qui permette dutiliser la thorie du contrle : un 19
comportement rationnel consistera alors choisir une dcision qui optimise les critres reprsentants le comportement du dcideur dans la situation dcrite par le modle. Dans le chapitre suivant, nous traiterons en dtail dun problme particulier. Nous nous limitons ici faire apparatre les diffrents lments qui interviendront dans la thorie. Nous le faisons travers le problme du choix dinvestissement tel quil est prsent dans la littrature conomique. Cest un problme qui est ais formaliser mathmatiquement. En effet, comme nous allons le voir, les diffrents lments que lon retrouve dans tous les problmes de dcision dans lincertain y sont prsents et ils sont dj exprims en termes quantifis. Les choix portent en effet sur des quantits : les quantits investies dans diffrents actifs. Les consquences de ces choix sont quantifies aussi : ce sont des revenus futurs ou des rendements. Cette formalisation naturelle nempche pas que, dans la pratique, ces choix soient souvent faits sans le support dune thorie. En revanche, linterprtation de ces choix en termes de dcisions rationnelles peut servir les justifier face, par exemple, un conseil dadministration. Dans certains cas de problmes dinvestissement complexes, ou dans le cadre dune thorie conomique des choix dinvestissements, le choix rationnel pourra sappuyer sur loptimisation de critres dfinis par la thorie de la dcision. 1. Un problme de dcision formalis : le choix de portefeuilles Vous avez un capital de 100 000 euros que vous dsirez investir dans des actions et des obligations. Pour des raisons personnelles et institutionnelles (mais surtout pour simplifier lexpos de cet exemple !), supposons que vous nayez le choix quentre les actions de quatre socits : Alfath, Btard, Gammage et Deltham, et des bons du Trsor trois mois. Vous pourriez former votre portefeuille en achetant pour 20 000 euros de chacun de ces titres et voir venir ! Si le taux de rendement pour trois mois des bons du Trsor est de 4 %, vous savez que vous rcuprerez 20 000 + 800 = 20 800 euros dans trois mois. En ce qui concerne les 80 000 euros investis dans les autres actifs, vous ne savez pas ce quil adviendra dans trois mois. Chacun des titres peut voir son prix monter ou descendre, 20
cest ce que vous avez pu observer sur les cours de la Bourse depuis un an, en comparant les cours de trois mois en trois mois. Les cours des diffrents titres ne varient pas tous autant ni de la mme manire ; il faudrait prciser cela pour pouvoir les comparer. En faisant la diffrence du cours dun actif une certaine date et de son cours trois mois plus tard, vous obtenez son rendement. En divisant ce rendement par le cours initial, vous obtenez le taux de rendement trois mois. Vous voyez ainsi, par exemple, que, pendant les trois derniers mois, les taux de rendement de tous les titres sont ngatifs ! Si cet tat de chose devait durer il ne faudrait sans doute pas investir dans ces titres et placer lintgralit des 100 000 euros en bons. Ce nest pas ce que vous conseille votre oncle qui ne place que 10 000 euros en bons, 50 000 euros en Alfath, dont le taux de rendement les trois derniers mois est le plus ngatif, et 20 000 euros en Btard et en Gammage, dont les taux sont diffrents, mais moins levs que celui de Deltham dans lequel il ninvestit pas. Votre oncle nest pas un thoricien de la dcision, mais se flatte davoir du nez. Toutefois, sa dcision, cest--dire son choix de portefeuille, peut tre explique si nous nous donnons la peine de formaliser ce quil fait intuitivement. Il ne fonde pas sa dcision sur la seule observation des taux de rendement sur les trois derniers mois, mais sur les variations des cours sur une priode bien plus longue. De cette observation, on peut retenir que le taux de rendement dAlfath varie irrgulirement autour dune valeur moyenne que vous pouvez calculer : cest 8 %. Les deux autres titres retenus par votre oncle ont des taux moyens de 5 % et de 6 % respectivement. Mais pourquoi a-t-il cart le titre Deltham de son portefeuille alors que son taux moyen est de 7 % et que, pendant la dernire priode, il tait, 1 %, le plus lev ? Il vous dit quil na pas confiance, et, en regardant les cours passs, vous observez que leur variabilit a, en effet, une ampleur qui dpasse largement celle des autres titres. En revanche, il semble que la variabilit de Btard et de Gammage soit trs faible. Afin de vous fixer les ides, vous pouvez calculer les carts (pris positivement) entre les taux calculs chaque jour et le taux moyen. Pour rsumer cette srie, vous pouvez en faire la moyenne. Vous trouvez des nombres positifs, appels carts positifs moyens, qui sont une mesure de la variabilit. Vous trouvez 25 pour Deltham, 20 pour Alfath, 10 pour Gammage et 9 pour Btard. Nous pouvons alors imaginer quintuitivement 21
votre oncle a pris une dcision qui sexplique par le raisonnement suivant : Alfath et Deltham peuvent rapporter gros, mais ils varient beaucoup, donc je ninvestis pas tout dedans car jaurai besoin de liquidits dans trois mois. Pour assurer un minimum, je place une partie en bons. Comme on constate aussi quils varient peu prs dans le mme sens (leurs taux sont fortement corrls), il vaut mieux tout concentrer sur Alfath qui a un taux moyen suprieur et une variabilit lgrement moindre. (Remarquons ce point que tout le monde ne fait pas le mme raisonnement que votre oncle car sinon le cours de Deltham seffondrerait.) Quant aux deux autres titres, ils varient si peu quil y a peu de risque de perte, et leurs taux de rendement sont tout de mme suprieurs ceux des bons : jen prends aussi. En rsum, le rendement du portefeuille dans trois mois dpendra de sa composition : les quantits investies dans chacun des actifs, cest la dcision quil faut prendre. Il dpendra aussi des cours dans trois mois ; ceux-ci sont inconnus et difficilement prvisibles part celui du bon du Trsor qui est sans risque. Les titres autres que le bon prsentent un risque qui est li leur variabilit. Ce risque peut tre tudi sur la base de lobservation des cours passs. En rsumant la variabilit par quelques nombres indicatifs, il est possible de comparer les rendements possibles. Cela ne suffit pas dterminer totalement la dcision, puisque ces indicateurs devront tre complts par le montant du capital initial, des besoins de liquidit finale, et dune attitude personnelle vis-vis du risque. Tout le monde prfre le rendement (la consquence de la dcision) le plus lev, mais tous les gens qui ont accs aux mmes informations (les indicateurs de rendement moyen et de variabilit, entre autres) ne prennent pas les mmes dcisions : le classique pre de famille prudent placera son capital en bons et peut-tre sur Btard et Gammage ; votre oncle, qui ne craint pas le risque, prfre parier assez gros sur Alfath. Cet exemple a introduit les lments qui serviront formaliser un problme de dcision. Nous le reprenons sous la forme plus abstraite que lon trouve dans les manuels de finance. Un portefeuille est une liste de quantits dactifs dtenus par un investisseur. Le problme de choix de portefeuille consiste donc dcider des proportions dun certain capital donn que linvestisseur allouera chacun des actifs de la liste. Les prix 22
de ces actifs sont supposs connus. De ce fait, la liste des proportions du capital investi dfinit compltement le portefeuille. Un portefeuille sera dfini par une liste : xa, xb, xg, xd, x0 des proportions du capital investi dans chacun des cinq actifs 1 disponibles dans notre exemple. Le choix de portefeuille consiste donc dcider dun vecteur (une liste de nombres) cinq composantes (ici). Le premier lment du problme de dcision est donc aisment formalis : lensemble des dcisions possibles est une partie de lensemble des vecteurs cinq composantes. Quelles sont les consquences possibles du choix dun portefeuille ? Admettons, pour simplifier, que linvestissement se fasse sur un horizon fix, date laquelle chacun des actifs procurera un rendement, et soit ri le rendement de lactif appel i. cette date le portefeuille procurera le rendement : r = xara + xbrb + xgrg + xdrd + x0 0,4. Ce nombre est la consquence du choix de portefeuille. Cest en fonction des consquences que les dcisions sont prises puisque la comparaison entre diffrents portefeuilles possibles se fera partir de la comparaison des rendements quils peuvent procurer. La dfinition de lensemble des consquences possibles et leur formalisation sont gnralement une des tches les plus dlicates de la formalisation dun problme de dcision. Dans le problme du choix de portefeuille nous voyons que cela ne prsente pas de difficult ds que les rendements possibles des actifs sont bien dfinis. Si ces rendements taient connus sans incertitude, le problme de dcision serait extrmement simple rsoudre, les investisseurs tant supposs prfrer les rendements levs. Le choix rationnel simpose donc : linvestisseur investira tout son capital dans lactif de plus haut rendement sil est unique et, sil y en a plusieurs, indiffremment entre les actifs qui ont le mme rendement maximal. Mais les rendements sont gnralement incertains et les consquences du choix dun portefeuille sont les diffrentes valeurs que peut prendre son rendement. Rappelons les lments dun problme de dcision que le problme de choix de portefeuille nous a permis de formaliser.
1. Dont les lettres grecques des indices rappellent les noms des actifs de lexemple part le dernier !
23
Lensemble des dcisions possibles. Cet ensemble sera dtermin par les objets de choix possibles, ici les portefeuilles, cest--dire des vecteurs de cinq nombres. Autant que possible, il sera reprsent par un ensemble de nombres ou de vecteurs ayant les proprits mathmatiques ncessaires pour pouvoir appliquer les rsultats de la thorie du contrle. Lensemble des vnements lmentaires. Il reprsente lincertitude. Il est encore appel ensemble des tats de la nature ou ensemble des alas en faisant rfrence aux jeux de hasard il serait plus gnral de le dsigner comme lensemble des lments (des variables) non contrls par le dcideur. Dans notre exemple, ces tats sont les diffrentes valeurs que peuvent prendre les rendements de chacun des actifs. Cet ensemble nest pas ncessairement fini, comme le montre lexemple des rendements possibles dun titre financier dont il est courant de supposer quil puisse prendre toutes les valeurs dun intervalle de nombres, Alfath varie entre 5 % et + 12 %, par exemple. Lensemble des consquences possibles. La consquence du choix dun portefeuille, cest son rendement. Il dpend la fois des proportions investies dans chacun des actifs (la dcision) et des rendements de chacun des actifs (les tats alatoires). Cest initialement sur cet ensemble, souvent difficile bien dfinir, que le dcideur aura des prfrences. Cela signifie quil sera capable de comparer les diffrentes consquences, puisque, de ces comparaisons, il dduira le choix de sa dcision en remontant des consquences aux dcisions. La relation entre dcisions, vnements lmentaires et consquences. Cest grce cette relation, qui pourra tre dfinie comme une fonction en dfinissant dune manire adapte lensemble des alas, que des critres sur les dcisions pourront tre dfinis partir des prfrences sur les consquences et du comportement vis--vis de lincertitude que nous analyserons plus loin. Les diffrents lments que nous avons dgags du problme dinvestissement pourront aisment tre retrouvs dans 24
les autres exemples de problmes de dcision classiques que nous prsentons prsent. 2. Quelques exemples de problmes de dcision Nous traiterons en dtail le premier exemple : ce sera lobjet du chapitre III ; nous nous contentons ici dune brve description afin de faire apparatre les diffrents lments que nous avons relevs dans le paragraphe prcdent. Exploitation minire. Une compagnie minire, possdant un droit dexploitation sur un site, doit dcider de lexploiter ou non. Des relevs gologiques indiquent quil y a trs vraisemblablement une quantit importante de minerai exploitable ; en revanche, sa qualit est inconnue. Il peut tre dcid deffectuer de nouveaux forages pour sonder la qualit du minerai, ceux-ci sont coteux et leurs rsultats ne sont pas certains. Il est aussi possible de faire appel un expert ; lui aussi cote cher et nest pas infaillible. Dautres inconnues psent sur la dcision : les cots dexploitation et les prix de vente futurs du minerai en particulier. Les dcisions ont ici plusieurs composantes : forage (oui ou non), expertise (oui ou non) et exploitation (oui ou non). Les alas ont au moins trois composantes : la qualit du minerai, la fiabilit du forage et/ou de lexpert, les prix de vente futurs. La consquence dune dcision est le profit futur, il dpend des alas selon une formule qui peut tre tablie dans chaque cas. Nous prsenterons dans le chapitre suivant un traitement simplifi de ce problme. Traitement dune maladie. Face des symptmes prcis, un mdecin reste incertain quant au stade dvolution de la maladie (les alas sont les diffrents stades possibles). un stade peu dvelopp, un premier traitement est efficace 90 % ; un deuxime stade, il nest plus efficace qu 50 %, mais un second traitement lest 80 % alors quil aurait des effets secondaires trs graves au premier stade ; enfin, un troisime stade, il ny a plus rien faire. Dans ce problme, les consquences sont la gurison ou le dcs du patient, les cots de traitement et danalyse sont ngligeables ; en revanche, le temps est un facteur important sur lvolution de la maladie. La dcision de procder des analyses plus pousses avant de 25
commencer un traitement peut donc tre fatale. Les dcisions ont donc deux composantes : analyses (oui ou non), type de traitement (premier, deuxime, aucun). Lancement dun nouveau produit. Une socit industrielle doit dcider de lancer elle-mme un nouveau produit mis au point par son service dtudes ou den vendre le brevet une autre socit. Une dcision intermdiaire consiste fabriquer et lancer ce produit une chelle exprimentale et de dcider ensuite den dvelopper lexploitation ou den cder le brevet. Lincertitude porte sur le march accessible un certain cot dexploitation et de publicit, et la capacit de conserver ce march aprs que la concurrence a imit le produit. Les consquences sont les profits nets futurs. 3. Arbres de dcision Une manire de dcrire un problme de dcision consiste en reprsenter les lments sur un arbre, cest--dire un graphe compos de sommets et darcs qui les rejoignent. Dans un problme de choix entre deux dcisions a1 a2, dont les consquences dpendent de trois tats de la nature w1, w2, w3, ceux-ci peuvent tre reprsents par trois arcs issu dun sommet. lextrmit de chacun de ces arcs, les sommets reprsentent les situations o les dcisions sont prises. Les dcisions seront reprsentes aussi par deux arcs. Les six sommets terminaux correspondent alors aux consquences finales contingentes aux chemins que lon peut suivre le long de larbre. Lintrt de la reprsentation dun problme de dcision par un arbre, mme sil se rvle, en gnral, que cette reprsentation est partielle, rside dans le fait quelle permet de dcrire le problme tel quil se prsente, afin den faire apparatre progressivement les diffrents lments. Dans larbre prcdent, la consquence c2 est obtenue partir de la dcision a1 si lvnement w1 se ralise, mais de la dcision a2 si lun des vnements w 2 ou w 3 se ralise. Le choix de a1 dpend donc de lvaluation de la vraisemblance de la ralisation des vnements. Nous nous servirons de la reprsentation par un arbre au chapitre suivant pour traiter du problme dexploitation dun site minier. 26
ARBRE DE DCISION
4. Comment formaliser lincertitude Nous avons vu apparatre lincertitude relative aux consquences des dcisions prises dans les exemples prcdents Dans le problme dextraction minire, lincertitude porte tout dabord sur la prsence ou non de minerai et sur sa qualit. En admettant que trois types de qualits : bon, faible et inexploitable soient retenus, nous avons quatre vnements considrer : pas de minerai, minerai inexploitable, faible minerai, bon minerai. Afin de dcider de faire un sondage ou pas, la vraisemblance de ces vnements sera prise en compte, elle pourra tre quantifie partir de donnes dexperts. Mais il se peut quune telle quantification soit a priori juge impossible, non fiable ou tout simplement dnue de sens. En revanche, les prix de vente futurs sont une seconde source dincertitude qui est du mme type que celle des rendements dactifs dans lexemple prcdent. La thorie de la dcision nous apprendra distinguer deux types dincertitudes. Les jeux de hasard et lvaluation des 27
paris, qui ont servi dabstraction pour ltude des problmes de dcision, nous permettent de les distinguer par analogie : le premier type est caractris par des variables engendres par des mcanismes : il correspond aux paris sur les loteries, roulettes, cartes, etc. ; le second par des variables engendres par des expriences trop complexes pour tre rptes dans des conditions identiques : il correspond aux paris sur des vnements sportifs tels que les courses de chevaux, les matches de boxe ou de football, sur des vnements sociaux comme des lections, ou sur des vnements mtorologiques, etc. Ce qui caractrise le premier type dincertitude est le ct mcanique de la gnration des variables, qui fait quavant de sengager sur un pari le dcideur a la possibilit dobserver la frquence dapparition des vnements qui lui semblent pertinents. Ainsi, nous savons par exprience quune pice lance tombe une fois sur deux sur pile, que las a une chance sur six dapparatre dans le jet dun d, etc. Nous savons peut-tre aussi que chaque numro du Loto national a une chance sur quarante-neuf de sortir, mais en revanche nous navons pas pu observer la frquence dapparition de la suite 48, 03, 25, 39, 11, 05, 44, que nous voudrions jouer. La probabilit dapparition de cet vnement peut cependant tre calcule grce la thorie des probabilits qui a t dveloppe pour formaliser ce type dincertitude. De nombreux parieurs, ne sachant pas faire ce calcul, se conduisent comme si lincertitude laquelle ils font face tait du second type. Il en est souvent ainsi dans lapprciation des rendements futurs des portefeuilles dont nous avons discut plus haut. Mais quel que soit son type, lincertitude sera formalise par : un ensemble de rsultats possibles ; un ensemble dvnements qui affectent les consquences des dcisions (les taux sont infrieurs 4 %). Un vnement est caractris par les rsultats qui le vrifient (si le taux est de 2 %, lvnement prcdent est vrifi) ; une pondration de ces vnements. Les poids affects chaque vnement peuvent provenir de la frquence avec laquelle ils ont t observs. Plus gnralement, ils correspondent une valuation subjective de la vraisemblance de leur 28
apparition. Dans lun comme dans lautre cas, cette pondration pourra tre formalise par la notion de probabilit 2. En rsum, aprs avoir procd une description des diffrents lments pertinents dun problme de dcision grce des listes, des diagrammes et des arbres de dcision, on sattachera en donner une formulation mathmatique. Les outils puissants que propose la thorie des probabilits, dont dcoulent la thorie statistique et la thorie des sries temporelles, ont amen les thoriciens de la dcision privilgier la formalisation de lincertitude en des termes qui permettent dutiliser ces thories mathmatiques.
2. Ce mot dsigne la qualit dun vnement probable , cest--dire dont on peut prouver quil est pertinent. Une distribution de probabilits est une mesure (elle associe un nombre cette qualit).
III / Comment rsoudre un problme de dcision

Nous avons expos, au chapitre prcdent, un problme dexploitation dun site minier. Prcisons-le et voyons comment nous pouvons en rsoudre une version simple 1. Le dcideur est une compagnie ptrolire et son exprience de la prospection lui permet de savoir quune premire srie de forages dans la zone en question donnera des rsultats sur la qualit de la nappe ; ces rsultats peuvent tre rpartis en trois catgories : P (positif), D (douteux) ou N (ngatif). Lexprience, dans des zones semblables, a montr que, dans cinquante pour cent des cas, le rsultat tait douteux et dans les autres cas le rsultat ntait positif quune fois sur deux. Dit 1 autrement, la compagnie met une probabilit a priori de 4 1 sur la possibilit de trouver un rsultat positif, de trouver un 2 1 rsultat douteux et de trouver un rsultat ngatif la suite de 4 ce premier forage. Mais dire que le forage est positif ne veut pas ncessairement dire que le site est exploitable : un second forage pourra permettre de conclure dfinitivement si le gisement est exploitable (G) ou non (G). La vraisemblance de cette rponse dpend du rsultat du forage prcdent : dans le cas dun premier rsultat positif, la probabilit que le second forage indique que le site est exploitable est plus importante que dans le cas o la premire rponse est douteuse. Ces diffrentes
1. Suggre par Michle Cohen et Jean-Yves Jaffray, que je remercie.
30
probabilits sont connues du dcideur et rsumes dans le tableau suivant (dans les termes de la thorie des probabilits, les nombres indiqus sont des probabilits conditionnelles) :
Indications du premier forage P (positif) D (douteux) N (ngatif) Probabilit de G 1 4 1 8 1 15 Probabilit de G 3 4 7 8 15 16
1. Analyse du problme ce stade de lanalyse du problme, les dcisions que peut prendre le dcideur sont de deux types : dune part, mettre lexploitation en route ou non ; dautre part, faire procder lun et/ou lautre forage. Nous avons, par exemple : ne pas faire de forage et abandonner le site ; ne pas faire de forage et mettre le site en exploitation ; faire un premier forage et mettre en route lexploitation si le rsultat nest pas ngatif ; faire les deux forages et procder lexploitation si le site est dclar exploitable, etc. Mais au lieu de faire dj une liste exhaustive, voyons quelles sont les consquences des dcisions. Deux choses sont prendre en compte : les cots et les gains ventuels. Nous comptons en units montaires, des millions deuros, par exemple. Lachat du site a dj cot 6 units, le premier forage en cote 4, le second 10 et la mise en exploitation 100. Quant aux gains, ils sont nuls si le gisement nest pas exploitable, ils sont de 1 020 units sil lest (l, bien sr, nous simplifions beaucoup car les gains dpendent de la qualit du puits et de facteurs conomiques extrieurs au problme dexploitation). Les consquences sont les profits possibles, leur liste est longue puisquils varient de 110 units (mettre en exploitation aprs le premier forage et se retrouver avec un site inexploitable) 1 020 units (mettre en exploitation sans avoir fait aucun forage et avoir la chance de tomber sur un site 31
exploitable). Nous excluons ds labord les dcisions stupides qui consisteraient exploiter le site bien que le second forage lait dclar inexploitable ; de mme, si la rponse est G, nous ne considrons pas la possibilit de ne pas exploiter le site en fin de compte. Remarquons quil ny a que deux alas qui affectent les consquences des dcisions : soit le site est exploitable, G ; soit il ne lest pas, G ; cette incertitude sera leve par la rponse du second forage ou par la mise en exploitation. tant donn les informations de la compagnie concernant les probabilits doccurrence des rsultats des forages, la probabilit que le site soit exploitable est facile calculer : cest la probabilit que la rponse du second forage soit G ; celle-ci dpend de la rponse du premier forage ; nous avons, en notant p(G), cette probabilit : p(G) = p(G et {P ou D ou N}) = p({G et P} ou {G et D} ou {G et N}). La probabilit dune runion dvnements disjoints est la somme des probabilits de ces vnements ; par ailleurs, chacun de ceux-ci est une intersection et nous savons que la probabilit de p(G et P) = p(G/P)p(P) [o p(G/P) est la probabilit de lvnement G conditionne par lvnement P, donne par le tableau], nous avons donc : p(G) = p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N). En utilisant les probabilits donnes, nous avons : 1 1 1 1 1 1 9 = h 0,14. p(G) = + + 4 4 8 2 16 4 64 Il est facile de vrifier avec la mme mthode que lon a bien : 55 = 1 p(G) h 0,86. p(GG) = 64 Ce qui veut dire que la compagnie sait quil y a trs peu de chances que le gisement soit exploitable. Aussi, exploiter sans faire de forage pourrait prsenter un grand risque : celui de perdre 106 units 86 chances contre 100, contre un gain possible, mais peu probable, de 914 units. Mais il y a de nombreuses autres dcisions possibles et il serait prmatur de dcider dexploiter avant de les avoir analyses. Pour cela, il faut en faire la liste et exprimer la relation 32
entre ces dcisions et les consquences ; nous allons le faire en construisant un arbre. Sur cet arbre, nous reprsentons par un carr les dcisions partielles du dcideur ; de ces carrs partent des artes qui reprsentent les consquences momentanes de cette dcision. Au dpart, trois dcisions possibles : abandonner le site (A1), exploiter sans forage (E1) ou faire le premier forage (F1). Aprs (A1), larte donne la consquence : 6. Aprs (E1), les consquences dpendent de lexploitabilit du site ; nous reprsentons les deux possibilits par des artes partant dun rond, elles correspondent G et G ; nous en indiquons les probabilits entre parenthses. Au bout de ces artes, les consquences sont 914 et 106. Aprs (F1), trois rsultats alatoires sont possibles : P, D et N, nous les reprsentons par des artes partant dun rond sur lesquelles sont indiques les probabilits de ces rsultats. Au bout de chacune de ces artes, nous reprsentons par un carr la prise dune nouvelle dcision partielle : abandonner (A2), exploiter (E2) ou faire le second forage (F2). Aprs (A 2 ) et (E 2 ), les artes donnent les consquences finales. Aprs (F2), les artes conduisent des ronds do partent les dernires artes correspondant aux rponses finales et leurs consquences en termes de profits (positifs ou ngatifs). Le schma nous donne la vision densemble des dcisons partielles et des informations qui pourront tre obtenues partir de la dcision de faire le premier forage. Sur ce schma, nous pouvons lire toutes les dcisions qui incluent F1, ainsi que leurs consquences. Les chemins sur larbre sont appels des stratgies ; ce sont des suites dartes telles F1, D, A2, ce qui se lit : Faire le premier forage, et, si la rponse est douteuse, arrter. Sa consquence est 10. Ou encore, F 1 , D, F 2 : Faire le premier forage, et, si la rponse est douteuse, faire le second, puis (nous lavons sous-entendu) exploiter si et seulement si le site est exploitable. Sa consquence est 900 si le site est exploitable, 20 sinon. Nous trouvons donc une liste de 14 stratgies possibles et la liste de leurs consquences pour chaque tat alatoire. Arrtons-nous un instant sur deux manires denvisager ce problme. La premire consiste voir les stratgies comme des dcisions ; elle consiste donc prendre en compte la dynamique du problme. La seconde manire de voir le problme 33
ARBRE DE DCISION DU PROBLME DEXPLOITATION MINIRE
34
consiste le ramener un problme statique, cest--dire un problme o le temps ne joue pas de rle. Cet ouvrage se limitera pour lessentiel une prsentation dune thorie de la dcision dans un cadre statique. En effet, la dynamique fait intervenir, pour tre convenablement traite, de nombreuses hypothses dont lexpos dpasserait les possibilits du cadre de cet ouvrage. Nous traiterons cependant ce problme particulier la fois sous langle statique, et, dans un second temps, sous langle dynamique afin de faire prendre conscience des diffrences que ces traitements impliquent. Avant mme de commencer, distinguons les dcisions qui, dans le traitement dynamique, sont des stratgies, cest--dire des suites de dcisions partielles qui dpendent du temps et des informations, alors que, dans le traitement statique, elles sont dfinies globalement. Voici deux exemples de stratgies (dynamiques) : faire le premier sondage, puis, si le rsultat est positif, procder lexploitation, sil est douteux, faire le second sondage, sil est ngatif, abandonner le site ; abandonner le site sans faire de sondage. Voici trois exemples de dcisions globales (statiques) : faire le premier sondage, puis le second ; faire le premier sondage, puis abandonner ; abandonner le site sans faire de sondage (oui, cest aussi une stratgie puisque, prise ds le dpart, cette dcision ne fait pas intervenir le temps). 2. Traitement statique du problme de dcision Nous considrons le problme globalement, cest--dire que nous dfinissons les diffrentes dcisions possibles concernant tout le processus, et, sur la base dun critre que nous nous donnons, nous choisissons parmi ces dcisions. Les dcisions, telles que nous les avons dfinies au chapitre prcdent, sont des ensembles de stratgies telles celles qui comprennent F1 et F2 ; on remarque sur larbre du schma que toutes ces stratgies ont les mmes consquences finales. Appelons F1-F2 une telle dcision, sa consquence si G se ralise est 900 et 20 sinon. La fonction qui relie les consquences et les alas aux dcisions peut tre dfinie par le tableau suivant : 35
Dcisions A1 Alas G G 6 6 914 106 10 10 910 110 900 20 E1 F1-A2 F1-E2 F1-F2
Il est alors immdiat de voir que la dcision F1-A2 a des consquences pires que celles de A1 dans tous les cas ; on dit que A1 domine F1-A2 et on ne garde pour le reste de lanalyse que celle qui nest pas domine. Pour la mme raison, on peut liminer aussi F1-E2 qui est domine par E1, comme on sen doutait bien. Il reste donc comparer :
Dcisions A1 Alas G G 6 6 914 106 900 20 E1 F1-F2
et, pour cela, il nous faut un critre. La compagnie peut tout dabord exprimer certaines contraintes ; par exemple : La perte ne peut pas dpasser 100. Dans ce cas, la dcision E1 est limine, mais il faut tout de mme un critre pour examiner les deux dernires dcisions. Le profit moyen (ou, plus correctement, esprance mathmatique du profit ) est un critre, nous le verrons au chapitre IV. Le gain moyen de F1-F2 est : 900 0,14 20 0,86 = 126 17,2 = 108,8, qui est largement positif. Dans ce cas, la dcision de faire les forages sera prise mme si lon nlimine pas la dcision E1 puisque le profit espr de celle-ci est : 914 0,14 106 0,86 = 127,96 91,16 = 36,8, bien infrieur celui de F1-F2. Mais, comme nous le verrons aux chapitres V et VI, ce critre ne tient pas compte du fait que les pertes peuvent tre beaucoup plus craintes que les gains ne sont dsirs : la moyenne traite symtriquement les nombres positifs et ngatifs. Une compagnie qui craint les pertes peut avoir un comportement quune fonction des profits (et non les profits eux-mmes) reprsente mieux. Supposons que la compagnie, pour un profit x 1 100, 36
100x , o u(x) est appel lutilit 100 + x de x . Cela veut dire quun gain de 100 est valu 50 alors quune perte de 100 vaudrait q (une manire dexprimer quune telle perte est inacceptable). Le critre utilis pour dcider est alors lutilit espre que nous prsenterons au cha100 900 pitre V. Lutilit espre de la dcision F1-F2 est : 100 + 900 100 20 0,86 = 12,6 21,5 = 8,9. Lutilit de A1 0,14 + 100 20 100 6 = 6,38, nous voyons quavec ce critre la tant 100 6 compagnie dcidera de ne rien faire et dabandonner le site. Nous avons vu que la dcision tait sensible au critre ; elle peut ltre aussi aux probabilits. Pour sen convaincre, considrons un autre tableau donnant les probabilits de G et G conditionnes par les rsultats du premier forage : utilise la fonction u(x) =
Indications du premier forage P (positif) D (douteux) N (ngatif) Probabilit de G 0,95 0,5 0,01 Probabilit de G 0,05 0,5 0,99
Nous avons, dans ce cas, p(G) = 0,25 0,95 + 0,5 0,5 + 0,25 0,01 = 0,49. Le rendement espr de la dcision F1-F2 est : 900 0,49 20 0,51 = 441 10,2 = 430,8, ce qui est largement suprieur ce quil tait dans le cas prcdent du fait que la probabilit de G est suprieure. Mais lutilit espre aussi 100 900 100 20 est majore : 0,49 + 0,51 = 44,1 100 + 900 100 20 12,75 = 31,35. Aussi, avec ces probabilits, il sera dcid de ne pas abandonner le site mme en utilisant le critre de lutilit espre. Mais ne semble-t-il pas souhaitable dabandonner tout de mme le site si le premier forage donne un rsultat ngatif ? Nous allons analyser cette question, mais il nous faut pour cela traiter le problme de manire dynamique car, dans le cadre 37
statique, nous ne pouvons pas considrer la possibilit de modifier les dcisions au cours du temps.
3. Traitement dynamique du problme de dcision Si nous prenons en compte le rle du temps, les dcisions sont les stratgies, cest--dire des suites de dcisions. Chacune de celles-ci sera prise selon des critres qui portent sur leurs consquences momentanes ; ces critres dpendent donc gnralement du temps et de ltat de linformation. Le fait que les critres dpendent aussi du processus de dcision introduit de grandes difficults thoriques que nous allons viter en supposant, ici, que le dcideur sen tient toujours au mme critre, celui du profit espr, par exemple. Sous cette hypothse, nous allons pouvoir utiliser le principe de la programmation dynamique : selon ce principe, le dcideur va remonter le temps en partant de la fin, en choisissant chaque tape la dcision momentane la meilleure ; sa stratgie optimale sera alors forme de la suite des dcisions optimales en chaque instant. Traitons le problme une premire fois en utilisant le premier tableau de probabilits conditionnelles. Plaons-nous donc linstant o le premier forage a dj t fait et considrons les diffrents cas. Il est facile de calculer que, dans tous les cas, cest la dcision momentane, F2, qui a le plus grand profit espr (210 ; 35 ; 37,5 au lieu de 165 ; 17,5 ; 45,55 pour E2 respectivement dans les cas P, D et N). Plaons-nous alors linstant prcdent o il faut comparer A1, E1 et F1. Nous connaissons les profits esprs de A1 et de E1, il nous reste calculer celui de F1. Nous considrons que les consquences de F1 sont les profits esprs des dcisions momentanes que nous avons slectionnes dans ltape prcdente. Ici, il sagit chaque fois de F2 dont les profits esprs sont, selon les cas : cP = 900 p(G/P) 20 p(GG/P) ; cD = 900 p(G/D) 20 p(G/D), et cN = 910 p(G/N) 20 p(G/N). Le profit espr de F1 est alors : cPp(P) + cDp(D) + cNp(N), ce qui, en mettant en facteur nous donne : 38
900 [p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N)] 20 [p(G/P)p(P) + p(G/D)p(D) + p(G/N)p(N)] soit, tout simplement : 900 p(G) 20p(G), qui est le profit espr de la dcision statique F1-F2 (que nous avons dj calcule : 430,8). Bien sr ! Cela vient du fait que, puisque dans la seconde tape nous choisissons toujours la mme dcision, laspect dynamique du problme disparat. En utilisant les utilits espres, nous aurions eu le mme effet. Dans la seconde priode, aprs le rsultat du premier forage, nous aurions trouv que, dans tous les cas, lutilit espre de F2 est suprieure et donc que, dans la premire priode, lutilit espre de F1 est celle de la dcision (globale) F1-F2 (nous avions trouv : 31,35). Dans ce cas, les conclusions du traitement dynamique du problme sont identiques celles du traitement statique du fait que le dcideur ne prend pas des dcisions qui dpendent de ses informations en seconde priode. Laspect dynamique du problme ne disparat pas si les dcisions momentanes de la seconde priode diffrent selon le rsultat du premier forage. Cest ce qui se passe si les probabilits conditionnelles sont celles du second tableau : si le premier forage est positif, la probabilit davoir un gisement exploitable est si haute quil vaut mieux procder immdiatement lexploitation (son profit espr est suprieur) ; en revanche, dans le cas o le premier forage donne un rsultat douteux, cest la dcision de faire un second forage qui doit tre prise ; enfin, dans le dernier cas, la probabilit davoir un gisement exploitable est si faible quil vaut mieux abandonner. La dcision est donc vritablement une stratgie, elle consiste faire le premier forage, puis, selon les cas, exploiter sans attendre, faire un second forage ou abandonner le site. Revenons alors la premire tape. Les consquences de la dcision F1 sont les suivantes : cP=910 0,95 110 0,05 = 864,5 5,5 = 859. (Alors que le profit espr de F 2 ne serait que de : 900 0,95 20 0,05 = 854.) cD = 900 0,5 20 0,5 = 440. (Alors que le profit espr de E 2 ne serait que de : 910 0,5 110 0,05 = 400.) cN = 10. 39
(Alors que le profit espr de F 2 ne serait que de : 900 0,01 20 0,99 = 10,8 et le profit espr de F2 ne serait que de : 910 0,01 110 0,99 = 99,8.) Le profit espr de la dcision momentane F1 est alors : 0,25 859 + 0,5 440 0,25 10 = 214,75 + 220 2,5 = 435,25. Celui de la dcision E 1 est : 914 0,49 106 0,51 = 447,86 54,06 = 393,8. Ainsi le traitement dynamique du problme conduit le dcideur suivre la stratgie qui consiste faire le premier forage, puis exploiter, faire un second forage ou abandonner, selon les cas. Moralit Rien ne sert de courir, il faut partir point Le livre et la tortue en sont un trs mauvais tmoignage, dabord parce quils ne font gnralement pas la course et que, lorsque la garrigue prend feu, cest malheureusement la tortue, et non le livre, dont la chair est bien meilleure, qui est rtie point. La fable, dite par La Fontaine, est pourtant un rgal. Cet exemple de problme de dcision ne prtend pas ltre, mais il nous a permis, comme les fables, de soulever quelques livres : la formalisation : elle simplifie extrmement le problme. Il faut veiller nen pas perdre des lments sous linfluence de quelques donnes ; ici, le tableau des probabilits conditionnelles de dpart pouvait cacher laspect dynamique du problme ; lbauche dun arbre de dcison : larbre entier tant gnralement trop important pour tre proprement dessin, lbauche permet de mettre en vidence les lments pertinents du problme ; la liste des dcisions : elle est souvent simplifie par les considrations de dominance, celles-ci sont tablies en analysant les consquences ; les consquences : dans la fable, elles sont absentes, si le feu de garrigue suscite la course, le livre part point. Les dcisions seront ranges selon les pertes et les gains, mais ceux-ci dpendent gnralement dalas ; les alas : il est fondamental de les rpertorier, et, autant que possible, de les quantifier parce quils pourront tre ainsi agrgs dans un critre ; 40
un critre : cest une fonction des consquences dont on cherche le maximum (ou le minimum si cest un critre qui dcrot en fonction de ce que le dcideur prfre), nous en verrons quelques-uns au chapitre IV, les deux que nous avons utiliss sont les plus connus, ils ne sont pas exempts de dfauts : le premier (profit espr) ne tient pas compte de lasymtrie entre la perception des gains et des pertes ; le second, que nous justifierons au chapitre V et que nous utiliserons aux chapitres VI et VII, ne tient pas compte de la perception subjective des probabilits (cest--dire de la dformation subjective des probabilits donnes, nous en parlerons au chapitre VII).
IV / Critres de dcision
Le problme trait dans le chapitre prcdent a ncessit lemploi dun critre pour comparer les dcisions. Nous avons introduit deux critres permettant de faire un choix entre des dcisions dont les consquences sont incertaines, nous les verrons nouveau plus loin (paragraphe 3) en compagnie dautres critres classiques. Nous nous concentrons tout dabord sur le rangement des consquences elles-mmes et celui qui sen dduit pour les dcisions dont les consquences sont certaines (paragraphe 1). Nous tablissons le rapport entre ces rangements (prfrences) et loptimisation dun critre (paragraphe 2) ; nous poursuivrons cette dmarche au chapitre suivant pour justifier le fondement du critre de lutilit espre. Auparavant, nous aurons pass en revue plusieurs difficults concernant les critres : les critres multiples, lagrgation des critres de dcideurs diffrents et le problme de la dynamique rencontr dans le chapitre prcdent.
1. Dcisions rationnelles sans incertitude Pour choisir la meilleure dcision (ou lune parmi les meilleures), il faut les avoir ordonnes. Ranger les dcisions ne peut se faire que lorsque le dcideur sait remonter des consquences quil a ranges aux dcisions elles-mmes. Cest en cherchant exprimer son ordre de prfrence sur les consquences que le dcideur se rend souvent compte de la ncessit de dfinir trs prcisment les consquences de ses dcisions. 42
Pour souligner les difficults que peuvent prsenter ces deux tapes, prenons lexemple du choix dinvestissements sans risque. Il sagit dun problme de dcision sans incertitude puisque les taux de rendement des diffrents actifs sont connus. Cependant, en cherchant dterminer un ordre sur ces actifs, linvestisseur se rendra souvent compte que les taux de rendement annoncs ne lui suffisent pas comparer les actifs : dautres lments comme les facilits de paiement, les dates dchances qui peuvent influencer la taxation des revenus, la frquence des versements, etc. font que deux actifs de mmes taux ne seront pas ncessairement indiffrents pour un investisseur donn. Les consquences des investissements pourront alors tre dfinies par des rendements calculs par des procdures comptables faisant intervenir les diffrentes caractristiques pertinentes : taux, taxes, chanciers Appelons rendements actualiss ces consquences des investissements. La dfinition des consquences tant donne (grce aux comptables), reste les comparer. Ici les rendements actualiss sordonnent naturellement par valeurs croissantes et cet ordre est celui des prfrences de la plupart des investisseurs. Une fois ce rangement des consquences tabli, linvestisseur pourra sinterroger sur les dcisions qui amneront aux meilleures consquences. Supposons que les investissements possibles portent sur des actifs dchances diffrentes. Pour dfinir la fonction consquence (qui relie dcisions et consquences), il faudra tablir une procdure dactualisation qui permette de comparer les rendements. Une fois la fonction consquence bien dfinie, la structure mme des dcisions rendra leur rangement plus ou moins ais. Supposons que les dcisions de linvestisseur puissent jouer sur deux variables : la quantit investie et lchance. Lordre sur les consquences est simple, mais il ne sen dduit pas immdiatement un ordre sur les dcisions qui permette de faire un choix. Cela vient de ce que les dcisions ont ici deux composantes : chance donne, les quantits investies sont naturellement ranges dans lordre des rendements quelles procurent ; quantit fixe, les chances sont ranges dans lordre des taux quelles procurent. Mais le dcideur doit comparer des dcisions comme : 100 units, chance trois mois et 10 units, chance dix ans. Pour cela, il devra dfinir un critre unique sur les deux variables de dcision qui soit cohrent avec lordre quil a dfini sur les consquences. Ici, le 43
critre simpose, il est nouveau tabli par calcul comptable : cest le rendement actualis de linvestissement (qui est ici justement ce que nous avons dfini comme la consquence de linvestissement). Le dcideur choisira donc un couple quantit-chance qui lui procure le plus haut rendement actualis possible sous les contraintes (de trsorerie, institutionnelles) de son problme dinvestissement. Le rendement actualis est le critre de dcision de ce problme. Dans ce problme, qui est simple parce que le critre de dcision est aussi la fonction consquence, il suffit de trouver les meilleures consquences pour obtenir les meilleures dcisions.
2. Reprsentation des prfrences par un critre Lorsquune collection de pices de monnaie courante est prsente un adulte et un enfant, il est possible de prvoir le choix quils vont respectivement faire parce que nous connaissons leurs prfrences. En ce qui concerne ladulte, sachant quil a une prfrence pour le pouvoir dachat le plus lev, on se doute que son choix se portera sur une des pices sur laquelle est inscrit le plus grand chiffre. Quant un enfant que le pouvoir dachat ne concerne pas encore, une observation plus fine de son comportement vis--vis des objets devra avoir t faite au pralable. Admettons que lenfant prfre les choses les plus colores et les plus brillantes, nous pourrons prdire quil choisira la plus brillante des pices colores lorsque lalternative est simple, mais nous ne saurons peut-tre pas laquelle il choisira entre une pice dun euro (brillante) et une pice de 20 centimes (plus colore mais terne). Les pices ayant t conues par des adultes pour des adultes, il nest pas surprenant de constater que le critre qui sert les choisir est crit dessus ! Les chiffres crits sur les pices reprsentent lordre donn par leur pouvoir dachat. La valeur inscrite sur les pices est le critre qui reprsente les prfrences de ladulte. Les prfrences de lenfant peuvent aussi tre reprsentes par un critre, condition quelles vrifient certaines proprits. Si seule la taille importait, il nous serait facile de ranger toutes les pices et de leur allouer des nombres, leurs diamtres en millimtres par exemple, qui croissent dans le mme ordre que celui du rangement. Ces nombres 44
dfiniraient alors le critre de choix de lenfant : lenfant rationnel choisirait une des pices ayant le plus grand diamtre. Si la couleur et la brillance importent, sans que lune ne prvale sur lautre, il ne sera pas possible de ranger strictement les pices, ni par consquent de les numroter directement en suivant le rangement. Il y a une difficult reprsenter par un critre unique des prfrences qui sont dfinies par un double critre. De telles prfrences ne permettent pas de dfinir un ordre grce auquel toutes les alternatives peuvent tre compares (nous revenons sur ce problme au paragraphe 3). Lorsque les prfrences portent sur un ensemble fini dobjets (ou un ensemble dnombrable, cest--dire que lon peut numroter tous les objets par des nombres entiers), comme lensemble des pices de monnaie, un critre nest rien dautre quune numrotation de ces objets. Ladulte et un enfant qui ne sintresserait qu la taille, nauront pas la mme numrotation (avec des pices europennes). Nous dirons dun tel critre quil reprsente les prfrences. Pour que les prfrences puissent tre reprsentes, il faut que tous les objets soient comparables. Ceux qui sont indiffrents se verront attribuer la mme valeur par le critre, un objet strictement prfr un autre aura une valeur suprieure celle du premier. Cette proprit des prfrences, quelles soient capables de comparer tous les objets, suffit lexistence dun critre (il nest pas unique, mais tous amneront aux mmes choix : au lieu de ranger les pices selon leurs diamtres en millimtres, on peut les ranger selon leurs surfaces en mtres carrs, ou la racine carre de celle-ci, etc., sans changer le rangement). Lorsque lensemble des objets sur lesquels portent les prfrences nest pas fini (ni dnombrable), cette proprit nest pas suffisante pour reprsenter les prfrences par un critre. Par exemple, si les consquences dinvestissement sont des rendements qui peuvent prendre toutes valeurs relles entre 10 et +10, et que le critre soit le rendement lui-mme, cela signifie que les prfrences rangent les rendements selon lordre naturel des nombres et quelles ont donc les mmes proprits que cet ordre. Pour pouvoir dfinir un critre qui reprsente des prfrences sur de tels ensembles, il faudra quelles vrifient une proprit de continuit qui donne, lensemble ordonn par les prfrences, la mme structure que lensemble des nombres rels auquel on cherche le faire correspondre. Cette proprit de continuit est fondamentale pour la reprsentation de 45
prfrences sur des ensembles gnraux. Elle est apparue dans les modles formaliss de lconomie o les prfrences des agents portent sur des paniers de biens quils peuvent consommer ou produire (Debreu [1970]). Choisir la, ou une, meilleure dcision consiste, une fois le critre dfini, rsoudre un problme doptimisation (de ce critre) grce aux outils et mthodes de la programmation mathmatique. Le problme trait dans ce chapitre consiste donc traduire, par un critre (ventuellement plusieurs critres) sur les dcisions, une relation de prfrences sur leurs consquences. Mathmatiquement, un critre est une fonction valeur numrique, et la reprsentation de prfrences par un critre consiste trouver une fonction, disons V, telle que si la consquence de la dcision a est prfre celle de la dcision b , alors V(a) 6 V(b). Remarquons que, rciproquement, V(a) 6 V(b) dfinit une relation entre a et b et par consquent entre leurs consquences. Cette relation est particulire ; cest ce que les mathmatiques appellent un prordre. Prordre
Un prordre est la description mathmatique de ce que nous avons en tte lorsque nous rangeons nos affaires dans larmoire : dabord, on met tout ce qui est quivalent ensemble (les chemises, les chaussettes), puis on range ces paquets. De haut en bas et de gauche droite des tagres, les habits sont en ordre , au sens mathmatique du terme, mme sils ne sont pas encore trs bien rangs , au sens mnager. Un prordre est une relation entre lments dun ensemble qui est essentiellement transitive : si a est prfr b et si b est prfr c, alors a est prfr c. Dun prordre se dduit une relation dquivalence, cest une relation rflexive, transitive et qui, de plus, est symtrique : si a est indiffrent b, alors b est indiffrent a. Une relation dquivalence permet de former des classes dquivalence (les paquets) : ce sont les ensembles dlments qui sont quivalents (indiffrents). Lensemble de ces classes dquivalence (appel ensemble quotient) peut prsent tre ordonn par la relation de prordre (mettre les paquets sur les tagres). Une classe, mettons celle de llment a, est prfre une autre, mettons celle de llment b, si a est prfr b (mettre la chemise sur ltagre des chemises). Comme a et b ne sont pas indiffrents, sinon ils seraient dans la mme classe, cette relation est un ordre strict, cest-dire une relation transitive et antisymtrique : si la classe A est prfre la classe B, alors la classe B nest pas prfre la classe A (sinon les chemises et les chaussettes seraient mlanges).
46
tant donn une relation de prfrences sur un ensemble C, que nous noterons , nous dirons quune fonction V : C r R reprsente les prfrences si et seulement si, pour tout c et c de C, c c B V(c) 6 V(c). Autrement dit, la fonction V affecte, chacune des consquences, des nombres rangs par ordre croissant respectant lordre des prfrences. La signification et la construction dune telle fonction sont immdiates dans le cas o les consquences sont en nombre fini. Considrons un ensemble C = {a,b,c,d,e} de consquences et supposons que la relation est prfre est reprsente par les flches du diagramme suivant (a est prfre b, b est prfre d, etc.) :
Les consquences sont ranges a c b d ; par ailleurs, nous avons aussi a e, mais nous navons pas de relation entre e et les autres consquences. Sur lensemble {a,b,c,d}, la relation de prfrence est reprsente par nimporte quel numrotage croissant comme : a r 4, c r 3, b r 2, d r 1. Cest ce que nous faisons naturellement en numrotant les consquences ranges : a = c4, b = c2, c = c3, d = c1. Cela est possible parce que lensemble {a,b,c,d} est totalement ordonn par la relation de prfrence. Celle-ci est alors reprsente par la fonction, disons f, telle que f(a) = 4, f(b) = 2, f(c) = 3, f(d) = 1. En effet, x y si et seulement si f(x) 6 f(y) pour tout x et y dans {a,b,c,d}. Bien entendu, toute fonction croissante de f reprsente aussi la relation de prfrence puisque, si g est une fonction croissante, g[f(x)] 6 g[f(y)] B f(x) 6 f(y) B x y. En revanche, nous ne pouvons pas reprsenter les prfrences sur lensemble C parce que la consquence e nest pas comparable la consquence d. Si nous tendions la fonction f 47
C, en affectant une valeur f(e) = k avec k 1 4 = f(a) pour respecter le fait que a e, nous devrions avoir : e d, puisque f reprsente les prfrences, ce qui nest pas compatible avec le diagramme. Nous ne pourrons donc pas trouver de nombre k pour complter la fonction f sur C, et, par consquent, nous ne pourrons reprsenter cette relation de prfrences par une fonction. Nous avons rencontr la premire condition que doit vrifier une relation de prfrence pour pouvoir tre reprsente par une fonction : toutes les consquences doivent pouvoir tre compares par la relation ; on dit dans ce cas que le prordre est total. La thorie de la dcision appelle axiomes ces conditions ; laxiome 0 sera donc : A0 : la relation de prfrence est un prordre total. Les prfrences sur des ensembles finis (ou dnombrables) qui vrifient cet axiome pourront donc tre reprsentes par une fonction. Rappelons que toute fonction croissante de cette fonction les reprsente aussi (quelles soient numrotes 1, 2, 3 ou bien 26, 42, 354, les dcisions sont ranges dans le mme ordre). Ce rsultat stend de manire vidente aux ensembles non finis mais dnombrables. Lorsque lensemble des consquences nest ni fini ni dnombrable, par exemple sil sagit de montants pouvant prendre toutes valeurs comprises entre 0 et 1 000, une condition supplmentaire de continuit devra tre vrifie : il ne faudrait pas quune suite de consquences, qui sont toutes prfrables une certaine consquence c, ait pour limite une consquence qui ne soit pas prfre c (nous en donnerons un exemple en construisant le critre de lutilit espre au chapitre V, paragraphe 3). Cette condition est exprime de manire informelle par laxiome : A1 : les prfrences sont continues . En pratique, on numrotera des consquences dnombrables selon lordre des prfrences, puis on compltera la reprsentation en prenant les limites des suites des valeurs des consquences pour reprsenter les consquences qui ne sont pas dans lensemble dnombrable. Un contre-exemple de prfrences qui ne respectent pas cet axiome est donn dans lencadr du paragraphe 5.
48
3. Critres classiques de dcisions dans lincertain Un critre est donc une fonction qui associe un nombre chaque dcision et qui crot avec les prfrences du dcideur. Quand il ny a pas dincertitude sur les consquences des dcisions, nous avons vu au paragraphe 1 quil suffisait de dfinir le critre sur les consquences (les taux de rendement des investissements, par exemple), pour lobtenir sur les dcisions elles-mmes, une fois que la fonction qui relie dcisions et consquences est clairement dfinie. Mais quand les consquences des dcisions sont aussi fonction dun ala, il nest plus aussi simple de remonter des consquences aux dcisions. Nous avons vu au chapitre prcdent que, dune manire ou dune autre, il nous fallait agrger les diffrentes consquences dune mme dcision pour obtenir un critre. Cest ce que font les diffrents critres que nous prsentons ici en utilisant, ou non, des probabilits sur les alas. Lapproche axiomatique, qui est celle de la thorie de la dcision, a t prcde par le dveloppement de mthodes pragmatiques de rsolution de problmes de dcision. Nous prsentons, au chapitre V et au chapitre VIII, des constructions de critres reprsentant les prfrences dagents qui vrifient certains axiomes. Il est par ailleurs important, et cest ce que nous faisons ici, de signaler lutilisation dun certain nombre dautres critres dont lemploi est justifi par des considrations adaptes certains problmes de dcision, mais qui nont gnralement pas t construits partir dune reprsentation axiomatique des prfrences de dcideurs. Voyons sur un petit exemple comment les diffrents critres que nous prsentons comparent trois dcisions dont les consquences dpendent de trois tats alatoires. Considrons trois investissements (a, b et c) dont les taux de rendement possibles, selon ltat qui se ralisera lchance, sont : pour a : 10 % 20 % 30 % ; pour b : 4 % 25 % 30 % ; pour c : 5 % 15 % 50 %. Cest volontairement que nous ne prcisons rien sur la vraisemblance ou la probabilit doccurrence de ces tats, nous ne le ferons que lorsque certains critres le ncessiteront. Dune manire gnrale, les critres affectent une valeur une dcision d, dont nous noterons ci(d) la consquence dans 49
ltat i (dans lexemple : c1(a) = 10, c2(c) = 15, etc.). Nous supposerons quil y a un nombre fini dtats, soit n, quoique certains des critres puissent tre dfinis pour un ensemble dtats plus gnral. Historiquement, le critre dit de Laplace est sans doute le premier qui ait t propos (bien avant Laplace et au moins par Huygens plus dun sicle avant). Il intgre en une seule valeur les diffrentes consquences possibles (ce sont des consquences numriques) dune dcision dans lincertain : il sagit de la moyenne arithmtique des gains. Critre de Laplace : L(d) = 1 S c (d) n i=1 i
n
Dans notre exemple : 1 L(a) = (10 + 20 + 30) = 20 3 59 1 ! 20 L(b) = (4 + 25 + 30) = 3 3 70 1 1 20 L(c) = (5 + 15 + 50) = 3 3 Le critre de Laplace range donc les dcisions dans lordre croissant : c, a, b. Lide de prendre la moyenne arithmtique, qui correspond une pondration uniforme, est justifie par une absence dinformation sur les probabilits des vnements lmentaires (i = 1 n). Cest aussi cette distribution de probabilit uniforme qui fut utilise dans la premire formulation de lutilit espre propose par Cramer et Bernoulli (nous y reviendrons au chapitre V). la diffrence du critre de Laplace, ce ne sont pas directement les consquences numriques dont la moyenne est calcule, mais une fonction de ceux-ci, comme nous lavons vu dans lexemple trait au chapitre prcdent. Cette fonction dforme les consquences afin de traduire lattitude de lagent vis--vis de la richesse, ou, plus gnralement, de consquences numriques (les taux, dans notre exemple). De plus, ce critre peut tre dfini pour des consquences qui ne sont pas numriques, puisque lutilit de la consquence, elle, est numrique (utilit dun bien de consommation, par exemple).
50
1 S U[ci(d)]) n i=1 o U tait la fonction logarithme Critre de Bernoulli : B(d) =
La fonction logarithme exprime quun accroissement de 1 euro pour une richesse de 1 euro est plus utile quun mme accroissement de 1 euro pour une richesse de 100 euros. Cette proprit vient de ce que la fonction logarithme est concave ; la plupart des fonctions dutilit utilises le sont aussi pour la mme raison. Dans notre exemple : 1 1 B(a) = (Ln10 + Ln20 + Ln30) = Ln6 000 3 3 1 1 B(b) = (Ln 4 + Ln25 + Ln30) = Ln3 000 3 3 1 1 B(c) = (Ln 5 + Ln15 + Ln50) = Ln3 750. 3 3 Le critre de Bernoulli range donc les dcisions dans lordre croissant : a, c, b. Remarquons que a et c ont t inverss par rapport au rangement obtenu par le critre de Laplace, du fait que la fonction logarithme donne plus dimportance relative aux petites valeurs (qui sont plus importantes pour a que pour c). Les critres de Laplace et de Bernoulli pondrent galement 1 ( ) les trois tats. Toutefois, il est des situations o les 3 probabilits des tats sont connues ou du moins apprcies numriquement. Les deux critres qui suivent sont des versions probabilises des deux critres prcdents, ou, dit autrement, ces deux derniers sont des cas particuliers des suivants si 1 les probabilits des rsultats sont identiques : . n En tenant compte dune distribution de probabilit connue sur les diffrents tats (pi, probabilit de ltat i), le critre de Laplace devient le critre de lesprance mathmatique que nous avons utilis au chapitre prcdent.
51
Critre de lesprance mathmatique : E(d) = S pi ci(d)

i=1
En tenant compte de lutilit des consquences, ce dernier critre devient celui de lutilit espre dont nous donnerons une justification axiomatique.
n
Critre de lutilit espre : V(d) = S pi U[ci(d)]

i=1
Dans notre exemple, si les trois tats taient affects des 1 1 1 probabilits , et , le critre de lesprance mathmatique 2 4 4 donnerait : 1 1 1 70 E(a) = (10) + (20) + (30) = 2 4 4 4 1 1 63 1 E(b) = (4) + (25) + (30) = 2 4 4 4 1 1 75 1 E(c) = (5) + (15) + (50) = 2 4 4 4 Le critre de lesprance mathmatique, avec les probabilits que nous avons affectes aux tats, rangerait donc les dcisions dans lordre croissant : c, a, b. En utilisant la fonction logarithme comme fonction dutilit : 1 1 1 1 V(a) = (Ln10) + (Ln20) + (Ln30) = Ln60 000 2 4 4 4 1 1 1 1 V(b) = (Ln4) + (Ln25) + (Ln30) = Ln12 000 2 4 4 4 1 1 1 1 V(c) = (Ln5) + (Ln15) + (Ln50) = Ln18 750 2 4 4 4 Le critre de lesprance de lutilit (ici, logarithmique) rangerait donc les dcisions dans lordre croissant : a, c, b. Comme dans le cas des critres de Laplace et de Bernoulli, remarquons que lordre de a et c est invers. Les trois autres critres ne font pas intervenir de pondration, probabiliste ou pas, des tats, mais sont concerns par les consquences extrmes [gain maximal M(a), gain minimal m(a), correspondant chaque dcision a)]. Ainsi le critre de Wald fera prendre une dcision qui a le plus grand gain minimal, cest--dire qui maximise le gain minimal, do aussi son nom de critre MaxiMin. Ce critre correspond un 52
comportement de prudence extrme vis--vis du risque et peut tre justifi comme un cas limite dutilit espre. Critre de Wald : W(d) = min {ci(d) / i : 1 n} Dans notre exemple, le critre de Wald nous donne : W(a) = 10 ; W(b) = 4 ; W(c) = 5. Le critre de Wald range donc les dcisions dans lordre croissant : a, c, b. Le critre dHurwicz prend en compte la fois le gain maximal et le gain minimal quil pondre par un paramtre k, qui est dterminer par le dcideur. Critre dHurwicz : H(d) = k M(d) + (1 k) m(d) Le critre dHurwicz donne les valeurs suivantes aux dcisions de lexemple : H(a) = kx10 + (1 k)x30 ; H(b) = kx4 + (1 k)x30 ; H(c) = kx5 + (1 k)x50. Le critre dHurwicz range les dcisions dans lordre : c, a, b (ici, on peut le vrifier aisment, ce rangement reste valable quel que soit le paramtre k ! 1). Au lieu de ne considrer que les valeurs extrmes, il est possible, pour le dcideur, danticiper les regrets quil aurait en ayant pris une dcision une fois que ltat de la nature est observ. Ces regrets , qui sont des manques gagner, aussi appels cots dopportunit, sont calculs pour chaque dcision en faisant les diffrences entre le gain ralis dans chaque tat et le gain maximal qui aurait pu tre obtenu en prenant une autre dcision : ri(d) = Max {ci(d) / dVA} ci(d) (Le regret est nul si d est justement la dcision qui prsente le meilleur gain dans ltat i.) Le critre de Savage, dit aussi du minimum-regret , conseille de choisir une dcision qui minimise (jusqu prsent tous les critres taient maximiser) le regret maximal. Critre de Savage : S(d) = Max {ri(d) / i = 1 n} ( minimiser) Le critre de Savage, qui, au contraire de tous les prcdents, est minimiser, donne : S(a) = Max {10 10 ; 25 20 ; 50 30} = 20 53
S(b) = Max {10 4 ; 25 25 ; 50 30} = 20 S(c) = Max {10 5 ; 25 215 ; 50 50} = 10 Le critre de Savage laisse donc les dcisions a et b indiffrentes, alors quil favorise c. On aura pu apprcier sur cet exemple, extrmement simple compar aux problmes dinvestissement rels, combien un critre modifie la dcision finale. Nous lavions dj remarqu dans le chapitre prcdent o nous avions not aussi la sensibilit des rsultats la spcification des probabilits. Dans les cas particuliers o ils ont t introduits, chacun de ces critres a reu des justifications fondes, pour lessentiel, sur lexprience. La thorie de la dcision cherche, pour sa part, fonder ces justifications sur des conditions (axiomes) sur le comportement des dcideurs. La liste, non exhaustive, des critres prcdents permet de prendre une dcision en rsolvant un simple programme doptimisation. Cela vient de ce que la variabilit des consquences dune dcision est compltement intgre par ces critres. Dautres approches caractrisent les situations dincertitude par deux critres, lun reprsentant le rendement, lautre le risque. moins de se diriger vers des mthodes doptimisation multicritres sur lesquelles nous reviendrons dans le paragraphe suivant, il est possible dintgrer lincertitude par des critres uniques qui agrgent les paramtres caractrisant lincertitude. Le plus fameux de ceux-ci est sans doute celui qui est implicitement dfini par la thorie de slection de portefeuilles (ou, plus gnralement, dinvestissements) due Markowitz [1970]. La thorie remonte un article du mme auteur paru en 1952. Le rendement dun portefeuille est caractris par son esprance mathmatique, et le risque quil prsente est formalis par la variance ou lcart type des rendements alatoires. Les investisseurs dont laversion pour le risque est caractrise par leur dsir de minimiser la variance (voir chapitre VI) doivent donc faire un arbitrage entre les deux critres que sont lesprance : m(d) et lcart type s(d) du rendement dun investissement d. Cet arbitrage peut tre formalis par une fonction des deux paramtres U (m, s). Ce critre peut tre justifi par la thorie de lutilit espre dans le cas o lutilit est une fonction quadratique des rendements (U(r) = a br2), ou encore dans le cas o la distribution de ceux-ci est compltement caractrise par ses deux premiers moments (esprance et variance, comme cest le cas pour la loi normale). Un tel critre 54
ne tient pas compte des dissymtries de la distribution ni de valeurs critiques des rendements. Pour pallier ces dfauts, Markowitz a propos un critre agrgeant lesprance des rendements et un paramtre n(d*) mesurant la variabilit au-del dun seuil critique d*. Le critre de Markowitz : U[m(d), n(d*)] Dautres critres voudront, selon les cas, tenir compte de ce que lesprance ou la variance ne sont pas des paramtres dfinis ou pertinents. Pour les remplacer, lesprance peut tre remplace par le mode de la distribution (valeur la plus probable), ou par une valeur quivalente la partie positive des gains. La mesure du risque peut tre faite par la variabilit absolue (diffrence entre la plus haute et la plus basse valeur des rendements) ou par une valeur quivalente la partie ngative des gains, etc. Tous ces critres ont en commun le fait quils agrgent deux critres, dfinis de manire pragmatique ; ils sont difficilement justifiables par une axiomatique, comme reprsentation des prfrences des dcideurs sur les consquences de leurs dcisions. 4. Prfrences et critres Les ensembles de consquences sont souvent dfinis par des variables quantitatives mesurant certains caractres des dcisions. Une consquence est alors dfinie par un vecteur de valeurs correspondant, par exemple, la tranche dge, la taille, au rendement, etc. Chacun de ces caractres est ordonn naturellement par la relation de prfrence et correspond, en fait, une reprsentation partielle de cette relation. En pratique, les prfrences sont donc gnralement dfinies par des critres portant sur diffrents caractres, mais la multiplicit de ces critres laisse entire la difficult de dfinir la relation de prfrence dans sa globalit. Considrons ainsi un ensemble de consquences constitu de deux caractres, disons une date et un rendement montaire. Sur la premire composante, cest--dire pour une valeur donne du rendement, les prfrences vont dans lordre dcroissant des dates : la date la plus proche est celle qui est prfre. Sur le second critre, les prfrences vont dans lordre 55
dcroissant des valeurs. Mais la connaissance de ces deux critres ne suffit pas comparer toutes les consquences comme on le voit sur le graphe suivant :
Les consquences A et B sont clairement ranges : B est prfre A puisque la date t2 est infrieure donc meilleure que la date t1, et que le rendement r2 est suprieur donc meilleur que le rendement r1. De mme B est prfre C puisque, date gale, elle prsente un rendement suprieur, et B est prfre D puisque, rendement gal, elle est disponible une date plus proche. A est comparable de la mme manire C et D ; en revanche, C et D ne sont pas comparables sur la seule base des critres sur leurs composantes. En effet, D est prfre C en termes de rendement, mais cest linverse en ce qui concerne la date. Pour dfinir les prfrences sur les couples date-rendement, les deux critres ne nous suffisent donc pas. Une relation de prfrence sera dfinie globalement en comparant tous les couples. Des courbes rejoignant tous les couples indiffrents entre eux (appeles courbes dindiffrence ) tabliront un rangement des couples, comme le montre le graphe page suivante. Avec une relation de prfrence complte par les courbes dindiffrence (dont seules celles correspondant aux consquences A, B, C, D, sont reprsentes), il apparat que la consquence D est prfre la consquence C (puisque, la date 0, le rendement du point situ sur la courbe des consquences indiffrentes D est suprieur celui du point correspondant de la courbe dindiffrence de C). Pour une telle relation de 56
prfrence, une reprsentation est facile dfinir : tous les points dune courbe dindiffrence, on peut affecter le rendement (ou une fonction croissante du rendement) de lintersection de cette courbe avec laxe horizontal de la date 0. Ainsi la relation de prfrence est reprsente par un critre unique qui est cohrent avec les deux critres sur les composantes. La difficult dfinir la relation de prfrence ou sa reprsentation, partir des deux critres sur les composantes, vient de la multiplicit de possibilits dagrgation de deux critres en un critre unique. Parmi ces agrgations possibles, certaines vrifieront les prfrences du dcideur, dautres non, et lutilisation dun critre unique ne peut se faire que sur la base de lobservation des prfrences du dcideur.
5. Aides multicritres la dcision Les nombreuses techniques doptimisation multicritres pourraient laisser croire que le problme de la reprsentation des prfrences par un critre unique peut tre vit. Certaines de ces techniques, telles les mthodes multiattributs (Keeney et Raiffa [1976] ; Vincke [1989]), permettent de rsoudre des programmes qui fournissent des solutions satisfaisant les diffrents critres respecter. Toutefois, ces programmes sont tablis sur la base de combinaisons linaires des diffrents critres (en gnral, certaines mthodes sophistiques 57
utilisant des fonctions non linaires). De telles combinaisons sont donc, de fait, des agrgations de critres, elles doivent tre justifies par des thories axiomatiques sur les prfrences. Ces thories sont beaucoup plus restrictives encore que celles dont nous poursuivrons la prsentation dans les chapitres suivants puisquelles les utilisent et les compltent. Dautres mthodes sattachent bien faire rvler les prfrences des dcideurs et les reprsenter par une relation dite de surclassement qui ne vrifie gnralement pas laxiome A0 qui requiert que toutes les consquences soient comparables (voir, plus haut, le paragraphe 2). Les prfrences ne sont souvent, en effet, ni totales ni transitives. Les mthodes de surclassement (Roy [1985]) font cependant intervenir dans leur exploitation des pondrations de critres qui permettent de ne pas se limiter des solutions non domines (une consquence est domine par une autre si elle est moins bonne pour tous les critres). La dfinition de ces pondrations ne va sans doute pas aussi loin que lagrgation de critres utiliss dans les mthodes multiattributs . Celles-ci posent pour axiome que les dcideurs cherchent optimiser une fonction agrgeant les critres. Cette fonction a pour effet de prciser les diffrents caractres prendre en compte dans le problme de dcision. Dans la pratique, cette fonction est linaire, cest--dire quen fait elle pondre les diffrents critres. La linarit dune telle fonction est assure par des axiomes prcisant une indpendance des diffrents critres, de tels axiomes sont rapprocher des axiomes dindpendance que nous rencontrerons par la suite pour assurer la linarit des critres reprsentant les prfrences des agents (voir aussi les paragraphes 6 et 7 plus loin). Sans avoir recours une agrgation de critres, des prcisions sur les prfrences du dcideur peuvent amener dfinir un ordre total sur des consquences partir des critres sur leurs composantes. Un exemple classique est celui de lordre lexicographique 1 qui suppose une prdominance de certains critres sur dautres. Ainsi dans notre exemple sur les couples date-rendement, un ordre lexicographique pourra tre tabli si le rendement domine la date : les couples sont dabord rangs par ordre de rendements croissants, puis parmi les couples de
1. Lordre lexicographique tient son nom de lanalogie avec lordre du dictionnaire : les mots sont compars en prenant dabord la premire lettre (premier critre) puis la deuxime, etc.
58
mmes rendements, les dates sont compares. Cela dfinit un ordre total sur les couples, tous peuvent tre compars : ainsi D est prfr C puisque son rendement est suprieur, B est prfr D puisque, rendement gal, D a une date suprieure. Lordre est donc B, D, C, A. Toutefois, il est possible de dmontrer que cet ordre (qui vrifie laxiome A0) ne peut pas tre reprsent par une fonction (parce quil ne vrifie pas laxiome A1). 6. Agrgation des critres de diffrents dcideurs La multiplicit des critres et leur agrgation posent un problme pour la reprsentation dune relation de prfrences qui rsume ou agrge celles de dcideurs multiples. Ce problme est au centre des thories du choix social o une agence centrale (un gouvernement, par exemple) doit prendre une dcision qui satisfasse au mieux un ensemble dagents conomiques dont les prfrences diffrent. Les fondements thoriques de lutilitarisme consistent trouver des conditions sur les prfrences des agents qui justifient leurs reprsentations par des fonctions dites d utilit et surtout lagrgation de ces fonctions dutilit en une seule fonction, dite de choix social . Lutilitarisme exige de plus que la fonction de choix social soit combinaison linaire des fonctions dutilit individuelle. Pour cela, des axiomes devront tre vrifis par les prfrences qui assurent la linarit de la fonction qui les agrge ; il sagit ici aussi daxiomes imposant une certaine indpendance des critres individuels ; de tels axiomes ont la mme porte normative et la mme limite descriptive que ceux utiliss par la thorie de lutilit multiattributs. Un exemple classique montre bien limportance de ces difficults, il a t rendu clbre par Condorcet (n marquis en 1743, mort ci-devant en 1794) qui, en proposant une solution, sest trouv face un paradoxe. Le choix entre trois candidats une lection (ou entre trois dcisions) est tabli par 60 votants (ou dcideurs diffrents). Appelons A, B et C ces candidats et demandons chaque votant comment il les ordonne. Les candidats se rpartissent de la manire suivante sur quatre rangements possibles :
59
Nombre de votants En tte En second En dernier
23 A B C
19 B C A
16 C B A
2 C A B
En utilisant la rgle de la majorit, A est en tte (23 voix). Pourtant, sil tait en ballottage contre un seul candidat, il perdrait contre B (19 + 16 pour B contre 23 + 2 pour A) et contre C aussi (19 + 16 + 2 pour C contre 23 pour A). Condorcet propose une rgle qui tienne compte de ces combinaisons dopinions en proposant de se fonder sur le rangement des trois candidats le plus probable au sens suivant : B gagne sur A 35 fois contre 25 ; C gagne sur A 37 fois contre 23 ; C gagne sur B 41 fois contre 19. Le rangement le plus probable est donc : C, B, A. Ce qui donne C comme vainqueur, C est appel le gagnant de Condorcet . (Remarquons que C serait aussi le vainqueur sil tait lu selon un systme proportionnel fond sur lattribution de deux points chaque fois quil est class premier, un point quand il est class second et zro sinon.) Le problme, cest que le gagnant de Condorcet nexiste pas toujours, comme le montre la rpartition de votants suivante :
Votes Premier Second Dernier 23 A B C 17 B C A 2 B A C 10 C A B 8 C B A
A gagne contre B 33 fois contre 27 ; B gagne contre C 42 fois contre 18 ; C gagne contre A 35 fois contre 25. Ce cycle, intransitivit de la rgle, est connu sous le nom de paradoxe de Condorcet, qui, pour le rsoudre, a propos la solution suivante : couper le cycle en son point le plus faible ; ici, cest A contre B, ce qui donne B comme gagnant. La difficult trouver une procdure de dcision, ou des prfrences sociales, partir de celles dagents diffrents a t clairement mise en vidence par le thorme dimpossibilit dArrow. Kenneth Arrow a en effet montr que, sous des 60
conditions qui semblent indiscutables pour une Constitution dmocratique, il nest pas possible de trouver une rgle de choix social (cest--dire une rgle que pourrait suivre un gouvernement, par exemple) qui soit cohrente avec les prfrences des individus concerns par cette Constitution. Ces conditions peuvent tre exprimes de la manire suivante : on considre un ensemble de consquences possibles sur lequel sont dfinies des relations de prfrences des diffrents individus concerns par une Constitution dterminer qui dfinira une relation de prfrences sociales. Lintrt de ce thorme vient de ce quil sadresse une population mal dfinie, comme cest le cas pour un pays, pour laquelle il serait illusoire de chercher faire une liste exhaustive de tous les habitants. Uniformit : la Constitution respecte toutes les relations de prfrences possibles sur lensemble des consquences. Monotonie : si une consquence, x, est prfre une autre, y, pour une relation de prfrences sociales et si lon propose une nouvelle relation de prfrences sociales pour laquelle x satisfait plus lun des agents et nen dsatisfait aucun autre, alors x est socialement prfr y dans la nouvelle relation de prfrences sociales. Indpendance : deux relations de prfrences sociales qui procdent au mme rangement des consquences pour tous les individus dterminent le mme choix social. Absence de contrainte : la Constitution nest pas contrainte par une paire de consquences pour laquelle le choix social soit le mme pour toute relation de prfrences sociales. Absence de dictateur : la Constitution ne dfinit pas la relation de prfrences sociales comme tant la relation de prfrences (strictes) dun individu (qui serait alors un dictateur). Thorme dimpossibilit dArrow : il nexiste pas de Constitution qui vrifie les cinq conditions prcdentes. Moralit : moins dtre un dictateur (celui qui dicte les dcisions prendre), un dcideur public ne peut se rfrer la thorie de la dcision individuelle pour guider ou justifier des choix dont les consquences sont collectives. 7. Dynamique de dcisions Nous avons vu, dans lexemple du chapitre prcdent, deux manires de traiter un problme dynamique et nous avons 61
constat que les solutions ne sont pas toujours les mmes. Lorsque les consquences dun problme de dcision diffrent dans le temps, la dfinition dune relation de prfrence globale, intertemporelle donc, peut poser des difficults. Il sagit encore dans ce cas dagrger, en un seul critre portant sur la squence des consquences, des critres portant chacun sur les consquences instantanes. (Dans notre exemple du chapitre III, nous avons suppos que le critre tait le mme : esprance des profits ou de leurs utilits, et que le critre global, aussi, tait le mme. Mais la fonction dutilit du dcideur pourrait fort bien changer au cours du temps et en fonction de ses informations, par exemple, le dcideur pourrait tre remplac en deuxime priode selon les rsultats de sa stratgie.) Le principe de la programmation dynamique consiste calculer une suite optimale de dcisions partir de sous-suites optimales. Ainsi, pour une suite de dcisions horizon fini, on calculera la dcision optimale concernant la dernire priode en fonction de la dcision de lavant-dernire priode, puis celle-ci en fonction de la dcision prcdente et ainsi de suite jusqu la dcision initiale. Ce calcul se fait en optimisant chaque priode le critre de dcision instantan. Ce critre doit donc tre connu ds le dpart, et le calcul nest valable en ce sens que la suite de dcisions ainsi calcule est optimale pour le dcideur que dans la mesure o les prfrences sur les suites de dcisions sont reprsentes par un critre qui se dcompose selon les critres utiliss en chaque priode. Inversement, cela suppose que le critre global est une agrgation des critres instantans. Cette dcomposition, ou cette agrgation, suppose donc une cohrence entre les prfrences sur les consquences en chaque priode et les prfrences sur les suites de dcisions. Rciproquement, comme en pratique ce sont les critres instantans qui sont connus plutt que le critre global, le problme est de savoir quelles conditions doivent vrifier les prfrences pour quune agrgation (combinaison linaire en particulier) des critres reprsente bien les prfrences sur les suites de consquences. Dans lexemple du chapitre prcdent, nous avions (habilement) vit ces difficults en ne considrant que les profits la priode finale. Dans la pratique, les gains et les pertes intermdiaires sont grer aussi ; en chaque instant, un profit ralis (positif ou ngatif) ncessite un placement ou un emprunt 62
ou pour le moins une valuation la priode finale (profit actualis, par exemple). Conclusion Ce chapitre a pu avoir un effet dcourageant ! Nous navons fait quy exposer des difficults et mettre en garde le lecteur contre un optimisme que les exemples traits auraient pu laisser natre. Prendre des dcisions nest pas devenu facile parce quun corps de recherche a pu construire des thories. Toutefois, ces thories servent de guides et se sont avres utiles. Comment construire un critre qui correspond aux prfrences dun dcideur dans des situations de risque ? Nous allons le voir au chapitre suivant, et, sil ne peut pas tre utilis, nous en verrons dautres au chapitre VIII. Comment utiliser ce critre pour mesurer le risque et tenir compte du comportement du dcideur ? Cest ce dont traite le chapitre VI. Mais il faut bien faire des statistiques pour valuer les probabilits, et la thorie justifie aussi certaines pratiques statistiques, car, l comme ailleurs, il y a des dcisions prendre, nous le verrons au chapitre VII. La thorie de la dcision ne se contente pas de mettre en lumire des difficults, elle apporte aussi quelques rponses !
V / Le critre de lutilit espre

Les critres que nous avons numrs dans le chapitre prcdent ont t labors sur la base de considrations pratiques. Le critre de lutilit espre a ceci de particulier quil a t construit de manire thorique par von Neumann et Morgenstern [1944]. Son anctre, le critre de Bernoulli (Daniel Bernoulli [1738]), avait dj t le fruit dune rflexion ayant pour but dexpliquer le comportement de dcideurs face certains jeux de hasard, mais sa formulation ne dcoulait pas de conditions (daxiomes) sur le comportement des dcideurs. Bien que la thorie de lutilit espre nait t dveloppe que dans le cadre de situations de risque (les probabilits sur les consquences sont connues), ses principes sont entrs dans la pratique courante de lanalyse de problmes de dcision dans des environnements incertains plus gnraux. De ce fait, ses mthodes sont utilises, parfois de manire abusive, dans des situations qui nont que peu de similitudes avec des situations de risque, cela essentiellement pour deux raisons. Dune part, lattrait naturel quexerce la thorie des probabilits comme outil de description et danalyse de lincertitude laquelle fait face un dcideur (ou dans un jeu, un joueur) incite dcrire lincertitude en termes de mcanismes alatoires. Dautre part, une tendance gnrale la simplification des problmes de dcision, savoir llaboration dun critre de dcision qui soit unique et qui limine lincertitude, conduit privilgier un critre simple comme celui de lutilit espre. Ce critre est construit partir de conditions (postulats ou, encore, axiomes) sur le comportement des dcideurs. Il nest applicable qu des dcideurs dont les prfrences en vrifient 64
les postulats et qui se trouvent dans des situations de dcision dans lincertain particulires : ce sont des situations de risque ou des situations qui sy ramnent, en un sens que nous allons prciser.
1. Situations de risque et situations qui sy ramnent Bien quil sagisse dans les deux cas de jeux de hasard, il est courant dopposer la situation o se trouve un parieur face un jeu de roulette celle o il se trouve face une course de chevaux. La premire est une situation de risque pour laquelle le formalisme de la thorie des probabilits est parfaitement adapt, la seconde une situation qui peut sy ramener. Dans un jeu de roulette, le hasard est engendr par un phnomne physique, reproductible, qui permet de dfinir la vraisemblance dun vnement et de la mesurer par une frquence observable. Dans une course de chevaux, lexprience qui engendre le hasard nest pas reproductible parce quelle fait intervenir de trop nombreux facteurs ; de ce fait, la notion de mesure de la vraisemblance dun vnement reste subjective. Parmi ces facteurs, les plus vidents sont les chevaux, qui, tout dresss et entrans quils soient, sont sujets dinnombrables variations biologiques dont dpendent leur condition physique et, par consquent, leur probabilit de gagner. En pratique, peu de dcisions sont prises en situation de risque (probabilits connues). Les dcisions dinvestissement sur un march boursier, par exemple, font intervenir une incertitude sur les cours futurs dont la distribution de probabilits nest pas connue. Il est communment admis que cette distribution, ou du moins certains de ses paramtres, peuvent tre dduits des observations des cours passs. En fait, ni les cours passs ni les cours futurs ne correspondent la rptition dune exprience alatoire, en ce sens quils ne sont pas obtenus par la rptition dune exprience reproductible (en partie pour la raison que, parmi les lments dincertitude de chaque agent, figurent les dcisions et les anticipations des autres agents concernant le futur). Cette remarque est facilement transposable la plupart des dcisions prises par des gestionnaires : achats dimmeubles, implantations de points de vente, lancements de produits nouveaux, etc., et, plus encore, aux 65
problmes de dcision dont les consquences sont difficiles dfinir : dcisions politiques, relations sociales, etc. Toutefois, lorsquune premire approche du problme de dcision a permis au dcideur de rsumer les informations dont il dispose sous la forme dune distribution de probabilits sur les consquences, le problme de dcision se ramne une situation de risque. Ce que nous entendons par cette expression, cest que le choix du dcideur se ramne celui dune distribution de probabilits sur les consquences de sa dcision, comme cest le cas pour un pari sur un jeu de roulette ou sur une loterie. Considrons, dans un jeu de roulette, le choix entre miser 10 euros sur le 12 ou la mme somme sur Pair . Les gains possibles sont 360 euros pour le premier choix, 20 euros pour le second, la perte possible tant de 10 euros dans les deux cas ; les consquences possibles sont donc : 360, 20, 10. La roulette comportant 37 alvoles, le 12 sort avec une probabilit de 1/37 et Pair avec une probabilit de 18/37 (le 0 ntant pas compt parmi les nombres pairs). Choisir de miser sur le 12 correspond donc choisir la distribution de probabilit sur les consquences : 1/37 sur 360 ; 0 sur 20 ; 36/37 sur 10. Choisir de miser sur Pair correspond choisir la distribution de probabilit sur les consquences : 0 sur 360 ; 18/37 sur 20 ; 19/37 sur 10. Considrons prsent une course de chevaux, et le choix entre miser 10 euros soit sur le cheval numro 12 (plac 36 contre 1), soit sur le cheval numro 5 (plac 2 contre 1). Les consquences possibles de ces choix sont encore 360, 20 et 10. Le premier choix aura pour consquence : 360, si le 12 gagne ; 10, sinon, et il ne pourra pas avoir 20 comme consquence. Le second choix aura pour consquence : 20, si le 5 gagne ; 10, sinon et il ne pourra pas avoir 360 comme consquence. Ces choix ne correspondent donc pas des distributions de probabilits sur les consquences possibles. Cependant, si le joueur pense que le cheval numro 12 va gagner avec une probabilit de 1/36 (h 1/37), et que le cheval numro 5 va gagner avec une probabilit de 1/2 (h 18/37), le choix se ramne effectivement une situation extrmement semblable celle o le joueur se trouvait dans le jeu de roulette. La mesure de la vraisemblance des vnements tablie par le parieur prend les mmes valeurs que les probabilits prcdentes ; aussi, au 66
choix de chaque pari, correspond une distribution de probabilits sur les consquences possibles (compltes par la probabilit zro sur la consquence impossible : 20 sil mise sur le 12, 360 sil mise sur le 5). Ainsi, bien que les deux paris soient faits dans des situations dincertitudes trs diffrentes, il est possible, pour certains parieurs, de les ramener toutes deux des situations de risque. Formellement, un problme de dcision est dit en situation de risque si, chaque action choisie, correspond une distribution de probabilits sur les consquences. Un problme de dcision en situation de risque pourra alors tre reprsent par la donne dune fonction, c, qui associe chaque action, a, de lensemble A des actions possibles et chaque rsultat, w, de lensemble W des rsultats dune exprience alatoire rgie par une distribution de probabilits donne, une consquence, c(a,w), de lensemble C des consquences possibles c : AxV r C. A la roulette, W est la liste des numros de 0 36 et la distribution de probabilit est (en principe !) uniforme : 1/37 pour chaque numro. chaque action, a, (parier sur le 12) correspond la distibution image (1/37 sur 360 ; 0 sur 20 ; 36/37 sur 10) de la distribution sur W (1/37 sur chaque numro) par la fonction (variable alatoire) c (a, .) : W r C. Dans notre exemple : c( parier sur le 12 , w) = 360 si w = 12 10 si w 0 12. Dans lexemple des paris sur la roulette, la fonction, c, est dfinie par le rglement du jeu qui fixe les gains en fonction de la somme mise sur les diffrentes combinaisons de numros (les actions), et les rsultats dsigns par la roulette (les rsultats de lexprience alatoire). La distribution de probabilits sur les vnements de cette exprience est dfinie par la distribution uniforme (1/37 sur chacun des 37 rsultats possibles). chaque pari correspond une distribution sur les gains ou les pertes (consquences) ; par exemple, au pari : miser 10 euros sur Pair correspond la probabilit : 18/37 de gagner 2 10 euros et 19/37 de perdre 10 euros. Dans lexemple des paris sur les courses de chevaux, la fonction c est aussi dfinie par le rglement du jeu qui fixe les gains en fonction des montants miss (lorsque les cotations dues aux paris des autres joueurs sont dj donnes) et du rsultat de la course. La distribution de probabilits sur ces rsultats et, par consquent, celle sur les gains ou pertes, sont dfinies par le 67
parieur lui-mme en fonction de ses informations et de son intuition. Lorsque les cotations ne sont pas donnes, la distribution sur les consquences dpend encore dun nouveau facteur : les actions inconnues des autres joueurs. Cela ne change rien notre formalisme si ce nest que les rsultats alatoires seront forms de deux composantes : lune rsultant de la course, lautre du comportement des autres joueurs. Une situation de risque est donc caractrise par une distribution connue sur lensemble des alas. Dans certains cas, cette distribution peut dpendre de la dcision du joueur luimme, son pari changeant les cotations, et, par consquent, les gains. Le joueur prend, dans ce cas aussi, sa dcision dans une situation de risque puisque chacun de ses choix dfinit une distribution sur les consquences. La manire dont cette distribution est dfinie est certainement plus complexe que dans le cas simple de paris sur le jeu de roulette, mais ce qui nous importe ici est que le joueur la considre comme donne, et donc que la situation se ramne une situation de risque . Le principe fondamental de la thorie de lutilit espre est quen situation de risque le comportement du dcideur est entirement dtermin par ses prfrences sur les distributions de probabilits sur les consquences de ses actions. Il est dusage dappeler loteries de telles distributions, quelles proviennent ou non dune loterie sur les rsultats dune exprience alatoire. En situation de risque, donc, le comportement du dcideur est entirement dfini par ses prfrences sur les loteries (si, la roulette, un joueur prfre la distribution 1/37 sur 360 et 36/37 sur 10 la distribution 1/2 sur 2 et 1/2 sur 0, il misera sur le 12 plutt que sur Pair , par exemple). Dans une telle situation un dcideur est appel rationnel si le choix de ses dcisions est cohrent avec ses prfrences sur les loteries. Ainsi, si laction a correspond la loterie l et laction a correspond la loterie l, un agent rationnel choisira a plutt que a, sil prfre l l. La thorie de lutilit espre est une thorie de la reprsentation des prfrences sur les loteries. Elle permet de dfinir un critre grce auquel les loteries peuvent tre compares : cest leur utilit espre. Un dcideur dont les prfrences sur les loteries vrifient les conditions de la thorie (ses axiomes) dispose alors dun critre qui permet de les comparer. Puisque chacune de ses dcisions est associe une loterie, le mme 68
critre lui permettra de ranger ses dcisions, sil est rationnel . Revenons sur le problme de dcision trait au chapitre III, p. 30 : nous avions compar la dcision prise en utilisant le critre du profit espr et celle obtenue partir de lesprance dune fonction dutilit particulire. La distribution de probabilits tait connue : nous tions bien en situation de risque. Le dcideur et nous, qui nous mettions sa place, avons calcul les probabilits des diffrents profits selon les dcisions prises. L, nous avons saut une tape : nous avons dclar que le dcideur rangeait ces profits alatoires (ces loteries dans notre terminologie actuelle) en utilisant le critre du profit espr (ou, en nous ravisant, celui de lutilit du profit espr), do se dduisait une dcision optimale. Ltape saute consiste justifier le critre employ ; ce chapitre nous donne des moyens de le faire. Dans une situation de risque ou une situation qui sy ramne, cest--dire qui ramne le choix dune action celui dune loterie sur les consquences des dcisions, un dcideur dont les prfrences sur les loteries vrifient les axiomes de la thorie de lutilit espre sera rationnel sil choisit une action qui maximise lesprance de lutilit de la loterie sur les consquences qui correspond cette action. La thorie de lutilit espre, comme les autres thories de reprsentation du comportement, consiste tablir des normes sur les prfrences qui permettent de construire des critres de choix. Un comportement rationnel sera alors celui dun dcideur qui reconnat ces normes et qui prend ses dcisions selon le critre quelles ont permis de dfinir. 2. Reprsentation des prfrences sur des loteries Nous avons vu au chapitre prcdent ce que sont des critres et ce que signifie : reprsenter des prfrences par un critre. Les prfrences que nous cherchons reprsenter portent ici sur des loteries sur les consquences. Nous savons dores et dj que les deux axiomes que nous avons prsents au chapitre prcdent doivent tre vrifis. Le premier axiome (A0) porte sur la comparabilit de toutes les consquences, ici les loteries sur les consquences. Le second (A1) porte sur une proprit mathmatique dite de continuit . 69
La richesse structurelle de lensemble des loteries a permis dexprimer une autre proprit de la reprsentation des prfrences : cest celle que nous appellerons linarit ; elle provient de la structure algbrique de lensemble des loteries. Cette proprit, mathmatique, traduit une intuition ancienne qui consiste considrer quune loterie dont les lots sont montaires est quivalente une somme de monnaie obtenue sans incertitude : cette somme correspond au prix maximal quun joueur est prt payer pour jouer cette loterie. Ce prix, lintuition premire veut que ce soit celui du lot moyen, cest-dire la moyenne arithmtique des lots pondrs par leurs probabilits dtre gagns (le critre de Laplace, ou, plus gnralement, celui de lesprance mathmatique du gain). Mathmatiquement, le calcul du lot moyen correspond bien une proprit de linarit puisque cest une somme pondre (une combinaison linaire). Mais le paradoxe de Saint-Ptersbourg, prsent au XVIIIe sicle, met en vidence la contradiction de lintuition premire avec le comportement dun joueur : aucun joueur ne risquerait toute sa fortune dans un jeu, mme si le gain espr est infiniment grand. Miseriez-vous toute votre fortune dans le jeu suivant ? On jette une pice de monnaie jusqu ce que face apparaisse. Si face apparat pour la premire fois au nime jet, vous gagnez 2n euros (moins la somme mise) : par exemple, si vous aviez mis 10 i et si face apparaissait la premire fois, vous 1 perdriez 10 2 = 8 i (avec probabilit ), mais, si face nappa2 1 1 raissait qu la septime fois (avec probabilit 7 = ), vous 2 256 gagneriez 256 10 = 246 i. Le gain espr de ce jeu est infini ; 1 en effet la probabilit que face apparaisse au nime jet est n et 2 le gain espr (mise exclue) est donc : 1 1 1 2 + 2 22 + + n 2n + = 1 + 1 + + 1 + qui 2 2 2 est infini ! Lhypothse suggre par Cramer Bernoulli pour rsoudre ce paradoxe est que, si vous ntes prt miser quune somme finie, disons 100 euros, pour jouer ce jeu, cest que cette somme ne correspond pas au gain espr mais lesprance 70
dune fonction de ce gain. Cest cette fonction qui traduit une certaine forme de votre aversion pour le risque (risque de perdre toute votre fortune pour ne gagner que deux euros), parce que cest une fonction qui crot de moins en moins vite avec le gain (en particulier la fonction logarithme a cette proprit). Ainsi, si U est cette fonction : q S 1n U(2n) = 100. n=1 2 La fonction U est appele utilit du gain et le nombre 100 est le prix que vous seriez prt payer pour jouer ce jeu. Ce prix, comme on le voit dans la formule, est une fonction linaire des probabilits des gains. Cette fonction, qui associe un nombre chaque loterie, est appele index de Bernoulli ; elle reprsente les prfrences dun agent sur les loteries, et cest une fonction linaire des probabilits. Cette proprit de linarit, qui est fondamentale dans la thorie de lutilit espre, est obtenue pour des prfrences sur les loteries qui possdent une proprit correspondante. Laxiome de linarit, souvent appel aussi axiome dindpendance, que lon trouvera au paragraphe suivant, exprime cette proprit. 3. Axiomes et existence du critre de lutilit espre Nous prsentons ici dune manire assez peu formelle un systme daxiomes sur lequel est fonde la thorie de lutilit espre. Le but de ce paragraphe est dexprimer des conditions que devront vrifier les prfrences dun agent sur des loteries pour quelles puissent tre reprsentes par une fonction numrique qui ait les proprits prcises au paragraphe prcdent. Nous appellerons dornavant cette fonction V. Nous avons dj expos les deux premiers axiomes sous une forme gnrale au chapitre prcdent ; nous les prsentons ici en termes de prfrences sur les loteries. Ao : Les prfrences dfinissent un ordre total sur les loteries Cela signifie que toutes les loteries peuvent tre compares et ranges. tant donn deux loteries l et l, soit l est prfre l, soit l est prfre l, soit ni lun ni lautre. Dans ce dernier cas, on dira que l et l sont indiffrentes. Laxiome exprime que 71
lindiffrence est une relation dquivalence (voir encadr Prordre , p. 46) et que les classes dquivalence sont ordonnes par les prfrences. Ainsi, si les loteries taient en nombre fini, on pourrait les ranger selon lordre croissant des prfrences, il suffirait alors de les numroter pour avoir une reprsentation des prfrences. La fonction V reprsentant les prfrences associerait un indice chaque loterie. Toutefois, lensemble des loteries sur un ensemble de consquences est gnralement un ensemble beaucoup plus grand quun ensemble fini 1 et un axiome complmentaire est ncssaire pour reprsenter un ordre sur cet ensemble. Il sagit dun axiome de continuit qui donne aussi une proprit de continuit la fonction V. Laxiome exprimant la proprit de continuit des prfrences sur les loteries sera facile comprendre sur un cas particulier o il y a trois consquences a = 10, b = 1 et c = 10 : supposons que vous prfriez la loterie qui donne b avec certitude toutes les suivantes : b avec probabilit 1/2, a avec probabilit 1/4, c avec probabilit 1/4 ; b avec probabilit 1/3, a avec probabilit 1/3, c avec probabilit 1/3 ; b avec probabilit 1/4, a avec probabilit 3/8, c avec probabilit 3/8 ; b avec probabilit 1/5, a avec probabilit 2/5, c avec probabilit 2/5 ; ; b avec probabilit 1/n, a et c avec probabilits 1/2(1 1/n) ; etc. Lorsque n est grand (n = 100 pour fixer les ides), la loterie qui donne b avec probabilit 1/n est quasi quivalente (elle a pour limite) celle qui donne b avec probabilit 0 et a et c avec probabilit 1/2 chacun. Laxiome de continuit implique que vous devez alors prfrer la consquence b (qui est identique obtenir b = 1 avec certitude) la loterie qui donne a = 10 et c = 10 avec probabilit 1/2 chacun.
1. Mme sil ny a que deux consquences, tout nombre p compris entre 0 et 1 dfinit une loterie : la premire consquence est obtenue avec la probabilit p, la seconde avec la probabilit 1 p.
72
Cet axiome peut tre exprim ainsi : A1 : pour toute loterie l, si toutes les loteries dune suite ln de loteries sont prfres l et si cette suite admet une limite lo, alors cette limite est prfre l. Les loteries dgnres qui donnent la probabilit 1 une consquence sont des cas particuliers de loteries. Soit c une consquence, il est dusage de considrer cette consquence c comme la loterie dgnre qui donne la probabilit 1 c et dcrire U(c) au lieu de V(c). La fonction U ainsi dfinie est la restriction de la fonction V aux loteries dgnres, on lappelle fonction dutilit de von Neumann-Morgenstern, rservant la fonction V le nom dindex de Bernoulli. Nous avions dj rencontr les deux axiomes prcdents au chapitre III dans le cadre gnral de la reprsentation de prfrences sur un ensemble de consquences, que ce soit sur des loteries, des nombres ou nimporte quels objets dont lensemble permette dexprimer laxiome A1. Le troisime axiome est particulier aux prfrences sur les loteries, il permet de calculer la fonction V partir de la fonction U pour les agents dont les prfrences le vrifieraient. Cest donc grce cet axiome que nous pourrons justifier quun dcideur maximise, dans le cas dune distribution de probabilit uniforme, par exemple : la moyenne empirique des consquences (critre de Laplace : U est lidentit, V est la moyenne empirique) ou la moyenne empirique des utilits (dfinie par U) des consquences. Dans le cas dune distribution de probabilit plus gnrale, nous trouverons lesprance mathmatique (V) de lutilit (U) des consquences. Le troisime axiome donne la fonction V une proprit de linarit. Il peut tre interprt comme une condition dindpendance des prfrences par rapport aux lots des loteries, do son nom daxiome dindpendance. Cest laxiome le plus controvers de cette thorie, comme nous le verrons au chapitre VIII (paradoxe dAllais). Dans cet axiome, nous utilisons des loteries composes : il sagit de loteries dont les lots sont eux-mmes des loteries. Nous avons rencontr cette situation dans lexemple des forages successifs du chapitre III : la stratgie qui consiste faire le premier forage, puis, dans le cas o le rsultat est douteux, le second, dfinit une loterie compose sur les consquences. la dcision de faire le premier forage correspond 73
une loterie (rsultat alatoire) dont les lots sont les dcisions momentanes. Dans le cas o la seconde dcision consiste procder au second forage, le lot correspondant de la premire loterie est une nouvelle loterie. Prenons-en un autre exemple : si l et l sont deux loteries et si on tire pile ou face laquelle des deux on joue, on obtient une nouvelle loterie. On peut noter 1/2 l + 1/2 l cette nouvelle loterie. Par exemple : Soit l et l les loteries dfinies par :
La loterie compose 1/2 l + 1/2 l est dfinie par :
Il sera admis (il sagit en fait dun axiome) que cette loterie est identique :
74
Laxiome dindpendance semble tout aussi naturel que le prcdent sur de nombreux exemples, comme le suivant : supposons que vous prfriez le lot a (ce peut tre un billet de loterie, mais aussi une voiture ou bien un voyage en Thalande) au lot b (une bicyclette), si vous prfrez la loterie l de lexemple prcdent la loterie l, vous devez aussi prfrer la loterie l1 obtenue partir de l en remplaant le lot 10 par le lot a, la loterie l1 obtenue partir de l en remplaant le lot 10 par le lot b. Cela semble assez naturel ; pourtant, le paradoxe dAllais, que nous exposerons au chapitre VIII, montre que cette exigence a des implications qui ne sont pas toujours vrifies par les dcideurs. Laxiome dindpendance qui donne la reprsentation une proprit de linarit est le suivant : A2 : tant donn deux loteries l et l telles que l est prfre l, et un nombre t compris entre 0 et 1, pour toute troisime loterie l, la loterie compose tl + (1 t)l doit tre prfre tl + (1 t)l. Avec ce dernier axiome, on dmontre quil est possible dcrire V comme lesprance mathmatique de lutilit U (voir par exemple Kast [1991], chapitre 4). Considrons une loterie, soit l, qui donne la consquence c la probabilit p, la consquence c, la probabilit p et la consquence c la probabilit p, avec p + p + p = l, de sorte que toutes les autres consquences ont pour probabilit 0. Alors, si les prfrences reprsentes par la fonction V vrifient les trois axiomes, on peut crire : V(l) = pU(c) + pU(c) + pU(c). Ainsi, dans lexemple prcdent, si on suppose que U(10) = 10, U(0) = 5, U( 5) = 2 et U( 10) = 0, on peut calculer : V(l) = 1/4 x 10 + 3/4 x 2 = 4 V(l) = 1/3 x 10 + 1/3 x 5 + 1/3 x 0 = 5 do on dduit : V(1/2 l + 1/2 l) = 1/2 V(l) + 1/2 V(l) = 1/2 x 5 + 1/2 x 4 = 9/2 La fonction U, de mme que la fonction V, nest pas unique. En effet, les deux premiers axiomes impliquent que de telles fonctions existent, mais il est clair que toutes fonctions croissantes de ces fonctions reprsentent aussi bien les prfrences. Le troisime axiome limite ces possibilits puisquon dmontre que seules les fonctions affines de U, cest--dire les fonctions de la forme aU + b, o a est un nombre positif et b un nombre quelconque, reprsentent aussi de telles prfrences. (Les nombres a et b sont dtermins par lattribution arbitraire de 75
valeurs deux consquences, les valeurs 10 et 0 aux consquences 10 et 10 dans notre exemple.) De ce fait, au lieu de la simple utilit ordinale que donnent les deux premiers axiomes, le troisime permet de dfinir ce quil est convenu dappeler une utilit cardinale, cest-dire une utilit qui permet de mesurer les diffrences entre les prfrences. Cest cette proprit de cardinalit qui donne la thorie de lutilit espre sa potentialit dans ltude des problmes de dcision en situation de risque, puisquelle permet de mesurer laversion pour le risque que rvle le dcideur, dont on a pu dterminer la fonction dutilit. 4. Extension de la thorie au cas dincertitude non probabilise La gnralisation la plus importante de cette thorie est due Savage [1954]. Elle sapplique aux situations o la distribution sur les alas nest pas connue de faon objective comme cest le cas, par exemple, pour des paris sur des courses de chevaux par opposition des paris sur des loteries dont la distribution est connue. Lide de cette thorie consiste reprsenter le comportement dun dcideur par un critre qui scrive, aussi, comme une esprance mathmatique dune fonction dutilit sur les consquences, mais la distribution par rapport laquelle lesprance est calcule na pas le caractre objectif dune distribution sur une loterie, elle est rvle par le comportement du dcideur. Elle peut tre interprte comme une mesure subjective attribue par le dcideur la vraisemblance des vnements alatoires (cette interprtation, qui justifie le concept de probabilit subjective, ne doit pas laisser oublier que lapparition de cette probabilit dans le critre est due aux proprits mathmatiques des prfrences, lorsquelles vrifient les axiomes de la thorie). Lorsquil ny a pas de distribution connue sur les consquences, il est donc possible, dans le but dtendre la thorie de lutilit espre, de supposer que lagent va tout de mme en utiliser une. Cette distribution peut avoir le caractre dun a priori subjectif ou provenir des proprits de la reprsentation des prfrences. Cest cette seconde interprtation qui nous guide ici. 76
Dans le cas de situation de risque, chaque dcision correspondait une distribution de probabilit sur les consquences ( la roulette, choisir de miser sur le 12 correspond choisir la distribution de probabilit sur les consquences : 1/37 sur 360 ; 0 sur 20 ; 36/37 sur 10). Dans la situation dincertitude que nous considrons ici, chaque dcision ne correspond plus qu une relation entre les vnements et les consquences (miser 10 euros sur le cheval numro 12, plac 36 contre 1, a pour consquences : 360 si le 12 gagne, 10 sinon et il ne pourra pas avoir 20 comme consquence). Cette relation est dfinie par la fonction consquence c : AxW r C, et, une action a V A correspond la fonction c(a, .) : W r C. Une telle relation (fonction de W dans C) est appele un acte par Savage. Dfinir un critre sur les dcisions est quivalent en dfinir un sur les actes et, par consquent, le dcideur doit avoir des prfrences sur ces actes. Examinons sur un exemple la signification des actes . Un investisseur doit faire une srie de placements pour lesquels il russit faire passer les ordres ou non, selon son attention aux opportunits du march ( et la disponibilit tlphonique de son agent de change). Sa dcision porte sur leffort quil fournit, quant aux tats alatoires, ils sont lis une multitude de facteurs impondrables que nous rsumons par : il russit faire passer les ordres : que nous appellerons oui ; il ne russit pas : que nous appellerons non . Nous allons considrer les deux actes suivants : acte 1 : obtenir un portefeuille final intressant si oui et, si non , faire un investissement risqu qui rapporte : 1 Mi 100,00 ou Mi 0,00 avec une probabilit (connue) de ; 2 acte 2 : recevoir Mi 100,00 si oui et recevoir Mi 0,00 si non (ce qui revient, pour le dcideur, parier Mi 100,00 quil russira faire passer ses ordres). Si le premier acte est prfr au second, par exemple, et quon peut dfinir une valeur pour chacun de ces actes qui se dcompose comme des esprances dutilit, on pourra tirer certaines conclusions. Par exemple, si lutilit du gain est identique au gain lui-mme et si lesprance de la valeur du 1 1 portefeuille final est R, on aura (puisque 100 + 0 = 50) : 2 2 77
valeur de lacte 1 : proba (oui) R + proba (non) 50 ; valeur de lacte 2 : proba (oui) 100 + proba (non) 0. Dans ces expressions, la probabilit de russir ou non est rvle par la prfrence de lagent et la valeur de lacte, et non linverse. Ainsi, si lacte 1 est prfr lacte 2, on peut en dduire que : proba (oui) R + proba (non) 50 1 proba (oui) 100 + proba (non) 0, soit : 100 R . proba (non) 1 proba (oui) 50 Cest--dire que le dcideur pense quil est peu probable quil russisse. Les axiomes de Savage permettent la fois de dfinir une fonction dutilit sur les consquences et une distribution de probabilit (subjective) sur les alas. Pour cela, un ensemble des vnements pertinents qui permette de dfinir une distribution de probabilit doit tre pris en considration ; nous lappellerons e. Cet ensemble doit tre une tribu (cest--dire que W et n doivent tre dans e ainsi que toute runion dnombrable dvnements et que le complmentaire de tout vnement). Nous appellerons A lensemble des actes, cet ensemble sur lequel la relation de prfrence est dfinie doit aussi tre assez complet, cest--dire quil doit contenir : les actes dits en escalier , cest--dire ceux qui sont constants sur des vnements qui forment une partition de W, comme lacte f suivant : y Ei = W et Gi Gj EiYEj = n et Gi GwVEi f(w) = ci. (Les actes constants sont des cas particuliers des actes en escalier puisquils associent une mme consquence tous les alas ; nous les assimilerons cette consquence et la relation de prfrence sur les consquences est une restriction de celle sur les actes.) Les greffes formes de la combinaison de deux actes partir dun vnement : si a et b sont deux actes et E est un vnement, lacte g dfini par g(w) = a(w) si w V E et g(w) = b(w) si w c E, doit aussi appartenir A. Le premier axiome de Savage prcise ces conditions et la proprit de la relation de prfrence que nous avions dj rencontre dans le prcdent axiome A0 : elle doit permettre de comparer tous les actes. 78
Le second axiome est appel axiome dindpendance comme notre prcdent axiome A2 qui en est un cas particulier dans les situations de risques. Cet axiome ou axiome de la chose sre exprime que les prfrences entre deux actes ne dpendent pas des vnements sur lesquels ils sont identiques. Il permet de dfinir une nouvelle relation de prfrence, appele prfrence conditionnelle, dfinie relativement chaque vnement. Soit E un vnement et a et b deux actes, nous dirons que a est prfr b conditionnellement E, ce que nous noterons a Eb, si et seulement si pour tout couple dacte a et b tels que : a concide avec a sur E, b concide avec b sur E, et a concide avec b sur le complmentaire de E, alors a b. Il est facile de voir que les prfrences conditionnelles constituent aussi des prordres totaux ; ces prordres doivent tre cohrents avec la relation de prfrence sur les consquences, cest ce que prcise le troisime axiome. Deux autres axiomes prcisent la relation entre les prfrences sur les actes et sur les consquences. Enfin, la thorie de Savage ncessite deux axiomes techniques assurant aux probabilits subjectives, qui seront dfinies par la reprsentation des prfrences, dtre bien des distributions de probabilit. De ces sept axiomes, il est possible de dduire le thorme de Savage qui, en substance, prouve que des dcideurs respectant ces axiomes se comportent comme sils maximisaient une utilit espre calcule par rapport une distribution de probabilit subjective (personnelle). Le thorme peut sexprimer ainsi : Thorme : Si les prfrences sur les actes dfinis sur un espace probabilisable (W, e) vrifient les sept axiomes de Savage, il existe une distribution de probabilit unique P sur (W, e) et une fonction dutilit de von Neumann-Morgenstern U sur les consquences telles que les prfrences sur les actes soient reprsentes par une fonction W dfinie comme lesprance mathmatique de lutilit par rapport la distibution subjective P. Nous verrons au chapitre VII une version du mme thorme fonde sur une axiomatique diffrente, mieux adapte, notre 79
sens, au problme de la dcision statistique qui est un problme de dcision dans une situation dincertitude particulire : incertitude sur un paramtre dfinissant la distribution de probabilit qui rgit un phnomne alatoire.
5. Applications de la thorie de lutilit espre Du fait de ses fondements thoriques, le critre de lutilit espre est celui auquel les thoriciens du risque ont pu se rfrer. Lorsquil est tabli que le comportement dun dcideur vrifie les axiomes de la thorie, sa fonction dutilit peut tre dtermine. La vrification des axiomes, comme la construction, point par point, de la fonction dutilit se font laide de questionnaires et sur lobservation de dcisions prises auparavant le cas chant. Les questionnaires consistent interroger le dcideur sur des situations simples : quel prix tes-vous prt payer pour un contrat dassurance sur le risque de perte dune somme de 10 000 euros avec une probabilit de 1/2 ? avec une probabilit de 1/4 ? avec une probabilit de 1/10 ?, etc. ; pour quelle probabilit, p, tes-vous indiffrent entre 10 euros et un billet de loterie qui vous permet de gagner 100 euros avec probabilit p ou perdre 100 euros avec probabilit 1 p ? De nombreuses procdures de ce type sont utilises par les spcialistes de laide la dcision (voir par exemple Raiffa [1970]). Ce critre a ainsi permis de rsoudre de nombreux problmes de dcision. Il a aussi permis dlaborer des thories conomiques faisant intervenir lincertitude : les problmes dassurance et de couverture du risque, la thorie des marchs dans lincertain (les marchs financiers, en particulier), les problmes de choix dinvestissements, et, plus rcemment, de nombreux problmes dorganisation industrielle et de choix social. La thorie axiomatique de lutilit espre fut labore pour construire la thorie des jeux, elle est donc prsente dans tous les travaux sur la rsolution des situations de conflits. Elle est prsente aussi dans llaboration de certains critres de la dcision statistique que nous verrons au chapitre VII, aprs avoir 80
prsent ses applications directes la mesure de laversion pour le risque au chapitre VI. Toutefois, insistons sur le fait que, fonde sur des axiomes, elle ne peut prtendre sappliquer tout dcideur. Si le comportement dun dcideur viole certains axiomes, le critre de lutilit espre ne reprsentera pas ses prfrences, nous verrons dautres thories qui peuvent alors tre invoques, au chapitre VIII.
VI / Le risque
Nous avons dfini les situations de risque comme celles dans lesquelles les consquences des dcisions prises dpendent dalas dont la distribution de probabilit est connue. Cette dfinition, qui est celle communment utilise en thorie de la dcision et en conomie de lincertain, ne recouvre certainement pas toutes les situations que le langage courant dsignerait comme risques. Il y a un risque sauter en parachute, sapprocher dun volcan, rouler gauche sur une route franaise (et mme droite, surtout le samedi soir !), mais dans chacun de ces cas la probabilit daccident nest pas connue. Toutefois, si une compagnie dassurances dcidait doffrir un contrat pour ces types de risques, elle se livrerait gnralement une tude statistique. De cette tude, des paramtres de la distribution des probabilits daccidents seraient dduits, ce qui permettrait de se ramener une situation de risque telle que nous lavons dfinie. Dans les cas o une telle tude statistique nest pas pertinente (courses de chevaux, accident de centrale atomique), une tude dexperts pourra ventuellement attribuer des probabilits subjectives aux vnements qui concernent les dcisions. Ltude des risques et leurs mesures pourront donc se faire sur la base de distribution de probabilits qui rgissent les consquences. Lanalyse de laversion pour le risque que peuvent exprimer les dcideurs doit recourir une reprsentation de leurs comportements, la thorie de lutilit espre en a propos une dans le cadre des situations de risque ; nous prsentons certaines de ses applications.
82
1. Aversion pour le risque, quivalent certain Dans les problmes de dcision caractre conomique, les consquences sont gnralement exprimes en valeur montaire (en richesse). De ce fait, puisquil sagit de nombres, on peut parler de valeur moyenne (alors que, pour un problme de dcision o les consquences ne sont pas numriques, la notion de moyenne na pas de sens). Pour un agent qui adhre aux axiomes de la thorie de lutilit espre, tout se passe comme sil assignait une valeur dutilit chaque niveau de richesse possible. Pour un tel agent, il sera possible dvaluer son attitude vis--vis du risque en comparant les niveaux de richesse possibles et les valeurs dutilit quil attribue ces niveaux. Un investissement risqu consiste dpenser un certain capital (richesse) pour obtenir un rendement alatoire. Dans une situation de risque on suppose connue la distribution de probabilit des rendements possibles, autrement dit, faire un investissement risqu revient acheter un billet de loterie (au sens gnral o nous lavons dfini). On appelle quivalent certain dune loterie (dune dcision en situation de risque) une consquence (ici un niveau de richesse) dont lutilit est gale lutilit espre de la loterie. Ce sera, par exemple, le prix maximal quun joueur sera prt payer pour un billet de loterie : le joueur est indiffrent entre le billet de loterie et la somme de monnaie correspondant son prix. Autrement dit, obtenir lquivalent certain (quun agent donn attribue une loterie) est donc indiffrent, pour cet agent, aux lots incertains de la loterie. La valeur investie dans un actif risqu est lquivalent certain des rendements possibles de cet investissement (si linvestisseur value ces rendements possibles par leur utilit espre). Ainsi, si lutilit dun investisseur est la fonction logarithme, lutilit espre dun titre financier qui peut rapporter 100 euros avec une probabilit 1/4, ou 10 euros avec une probabilit 3/4, sera : u = 1/4 ln 100 + 3/4 ln 10 = 5/4 ln10 h 5/4 x 2,3 = 2,9 Lquivalent certain de ce titre est donc un nombre, soit EC, tel que : ln EC = 2,9, soit EC = exp 2,9 h 18,5. Pour cet investisseur, dtenir ce titre financier au rapport incertain est quivalent la dtention de 18,5 euros ferme. 83
Dune manire gnrale, si nous notons EC(l) lquivalent certain dune loterie l, et V(l) son utilit espre, nous avons : U [EC(l)] = V(l). La notion dquivalent certain permet de comparer des loteries et, dune manire plus gnrale, des situations de risque. Elle permet aussi de dterminer lattitude face au risque dun agent dont la fonction dutilit est connue. Rciproquement, en observant lattitude face au risque dun agent et ses quivalents certains, il devient possible de caractriser sa fonction dutilit. Prenons lexemple dune compagnie dassurances, une mutuelle en situation de monopole rgional, pour liminer les problmes de concurrence et de profits qui ne nous concernent pas ici. Supposons que cette compagnie est mme de financer les remboursements de sinistres dincendie annuels sur les primes verses par les assurs. Elle peut alors calculer cette prime en fonction de la valeur assure et de la probabilit dincendie de manire quitable : si votre maison vaut 1 000 000 deuros, et la probabilit quelle soit dtruite par le feu est 0,001, la prime propose pour une assurance totale sera de 1 000 euros. En effet, si la compagnie a suffisamment dassurs, elle ne fera pas face des risques de pertes (le montant des primes compensant les remboursements de sinistres) et se conduira donc comme sil ny avait pas de risque : elle est indiffrente au risque dincendie. Elle calcule alors la prime en faisant la moyenne des gains et des pertes : 1 000 000 0,001 + 0 0,999 = 1 000. Nous dirons quun agent est indiffrent au risque lorsquil est indiffrent entre une loterie et le gain moyen que lui procure cette loterie, autrement dit sil est prt payer le gain moyen pour un billet de cette loterie. Lquivalent certain dune loterie pour un tel agent est donc son gain moyen. Prenons une loterie de la forme : revenu a avec une probabilit p ; revenu b avec une probabilit 1 p. Nous avons donc : EC = p a + (1 p) b, soit : p U(a) + (1 p) U(b) = U(EC) = U(p a + (1 p) b). Lutilit espre de la loterie est lutilit du revenu moyen ; de ce fait, son quivalent certain est gal son revenu moyen la [fonction dutilit U est inversible, on a donc EC = p a + (1 p) b]. La formule prcdente caractrise une fonction U 84
dont le graphe est une droite [la fonction U est ncessairement de la forme : U(x) = ax + b]. Lindiffrence au risque est donc caractrise par une fonction dutilit linaire (affine, en fait) : son graphe est une droite (figure 1 ci-dessous). Pour une telle fonction, lutilit marginale est constante : le gain dutilit obtenu en ajoutant 1 euro une richesse de 1 000 euros est identique celui obtenu en ajoutant 1 euro un niveau de richesse de 10 euros. FIG. 1. INDIFFRENCE AU RISQUE
Lorsquun agent prfre une loterie la possession sans risque de son gain moyen, on dit quil montre de la propension au risque, ou encore quil est risquophile . Ce serait le cas de certains propritaires trouvant que les primes dassurance sont trop leves et qui prfrent encourir le risque de perdre la valeur de leur maison plutt que de prendre un contrat dassurance. Le cas est rare lorsque des sommes importantes sont concernes, et, lorquil se produit, il provient plus dune mauvaise apprciation des probabilits que de vritable propension pour le risque. En revanche, pour de faibles risques de pertes (10 euros) et de larges possibilits de gains (1 000 000 deuros), il est trs courant (grce quoi la Socit nationale des jeux rapporte beaucoup dargent ltat franais) de voir des individus acheter des billets de loterie alors que le gain espr est (quasi) nul. Pour un tel agent, lquivalent certain de la loterie est suprieur son gain moyen : p a + (1 p) b ^ EC, soit, U(p a + (1 p) b) ^ U(EC) = p U(a) + (1 p) U(b) 85
Une telle relation, qui dfinit la propension au risque, caractrise une fonction dutilit convexe (figure 2). Pour une telle fonction, lutilit marginale est croissante : le gain dutilit obtenu en ajoutant 1 euro une richesse de 1 000 euros est suprieur celui obtenu en ajoutant 1 euro un niveau de richesse de 10 euros. FIG. 2. PROPENSION AU RISQUE
Lattitude la plus commune dans les problmes de dcision caractre conomique est celle daversion pour le risque. Ainsi, la demande dassurance se maintient bien que les primes dassurances ne soient (malheureusement) pas calcules dune manire aussi quitable que celle que nous avons dcrite. Cela nempchera pas la plupart des propritaires daccepter un contrat dont la prime est de 2 000 euros alors que leur perte espre (l, le terme mathmatique est malheureux !) nest que de 1 000 euros. La diffrence est justifie par laversion pour le risque du propritaire, ce qui permet la compagnie dassurances de faire face aux cots dont nous navons pas tenu compte et de faire des profits. Dune manire gnrale, pour un agent qui a de laversion pour le risque, lquivalent certain de la loterie est infrieur son gain moyen, lagent prfrant une valeur infrieure mais certaine une situation o il risque de perdre. On a : p a + (1 p) b 6 EC, soit, U(p a + (1 p) b) 6 U(EC) = p U(a) + (1 p) U(b). Cette relation, qui dfinit laversion pour le risque, caractrise une fonction dutilit concave (figure 3), la fonction 86
logarithme en est un exemple. Pour une telle fonction, lutilit marginale est dcroissante : le gain dutilit obtenu en ajoutant 1 euro une richesse de 1 000 euros est infrieur celui obtenu en ajoutant 1 euro un niveau de richesse de 10 euros. FIG. 3. AVERSION POUR LE RISQUE
On peut alors dfinir la prime de risque associe une loterie l, comme la richesse PR(l) quun agent qui a de laversion pour le risque est prt payer pour ne pas avoir encourir le risque. Cette somme est dfinie par lquation : m PR(l) = EC(l), o m est le gain moyen de la loterie. Si, au contraire, lagent a de la propension pour le risque, PR(l) correspond la somme quil est prt accepter pour ne pas participer la loterie : PR(l) m = EC(l). Enfin, pour un agent qui est indiffrent au risque, la prime de risque est nulle puisque m = EC(l).
2. Indices daversion pour le risque Caractrisant la proprit de concavit de la courbe de la fonction dutilit, Arrow [1965] et Pratt [1964] ont utilis les drives premire et seconde de cette fonction (lorsquelles existaient) pour en dduire une mesure locale du risque. Un calcul approch de la prime de risque au voisinage de la moyenne x dune distribution l montre que : 1 U(x) PR(l) = s2 2 U(x) 87
o s2 est la variance de la distribution et U et U les deux premires drives de la fonction dutilit U par rapport la richesse x. La fonction dutilit est croissante, donc U(x) 1 0, et si lagent a de laversion pour le risque, la fonction dutilit est concave, donc U(x) ! 0. Lindice absolu daversion pour le risque au voisinage dun niveau x de richesse est alors : U(x) . r(x) = U(x) Le thorme de Pratt permet de dire quun agent qui a un indice absolu daversion pour le risque au niveau x gal r(x) a davantage daversion pour le risque quun agent qui a un indice r(x), si r(x) ! r(x). Si le premier agent a une fonction dutilit logarithmique U(x) = ln(x), son indice daversion pour le risque 1 100 = 0,01. Un au niveau de richesse 100 est : 10 000 100x autre agent qui aurait une utilit dfinie par U(x) = 100 + x 1 4 = 0,005. aurait un indice daversion pour le risque de 800 Le second agent prsente donc moins daversion pour le risque que le premier, il sera prt accepter plus de risque dans ses dcisions et payer moins cher des contrats dassurance pour le mme risque. 3. Mesures du risque La thorie de lutilit mesure le risque partir des prfrences de lagent : une loterie l est plus risque quune autre loterie l, si lutilit de l, V(l), est infrieure V(l) pour un agent qui a de laversion pour le risque. La plupart des applications lconomie et la gestion de la thorie du risque et de la dcision dans lincertain concernent des agents qui ont de laversion pour le risque, cest pourquoi les mesures du risque sont presque toujours dfinies dans ce contexte. Sans une thorie de la reprsentation des prfrences comme celle de lutilit espre, lanalyse du risque ne peut se faire quen comparant directement les distributions de probabilit. Un critre labor en relation avec la notion de valeur de linformation Blackwell [1953] est fond sur la dfinition 88
suivante. Une distribution l est plus risque quune distribution l de mme moyenne, si la premire est obtenue par une transformation alatoire de la seconde. Par exemple, une distribution sur des revenus :
Revenus Probabilits 800 0,16 600 0,04 17 0,46 200 0,34
est moins risque que celle obtenue en ajoutant une incertitude de 8 10 avec probabilit 1/2 chacun des revenus :
Revenus Probabilits 810 790 610 590 27 7 190 210 0,08 0,08 0,02 0,02 0,23 0,23 0,17 0,17
Plus gnralement, si e est une variable alatoire qui prend des valeurs e1 en avec les probabilits p(e1) p(en), l met les probabilits p(y1) p(yn) sur y1 yn et l les probabilits p(x1) p(xn) sur x1 xn, on dira que l est plus risque que l si Seip(ei) = 0 et si, pour tout i, yi = xi + ei. En sinspirant de cette dfinition, laversion pour le risque peut tre dfinie de la manire suivante. Un dcideur a de laversion pour le risque sil prfre toute variable alatoire X une variable alatoire X + Y, o Y est desprance nulle. Autrement dit, un dcideur a de laversion pour le risque sil considre comme indsirable un ajout de variabilit (Y) qui naugmente pas lesprance de ses gains. On peut dmontrer que cette dfinition est quivalente V(l) ! V(l) pour un agent ayant de laversion pour le risque au sens de lutilit espre, lorsque les loteries l et l sont les distributions des variables X et X + Y. Les reprsentations graphiques des distributions, quelles soient faites par des diagrammes reprsentant les frquences ou les frquences cumules, permettent de comparer directement les domaines les plus probables. La comparaison des risques associe ces reprsentations sappelle la dominance stochastique. Une distribution P sur R peut tre dfinie par sa fonction de rpartition F, cest--dire la fonction des probabilits cumules. La fonction de rpartition dune distribution de probabilit P est dfinie par la fonction : H(x) = P(] q, x]), son graphe est en escalier, comme la fonction F, ou est une courbe plus 89
rgulire, comme la fonction G. Une distribution P, dont la fonction de rpartition est F, domine stochastiquement une distribution P dont la fonction de rpartition est G [dfinie par : G(x) = Q(] q, x])] si pour tout nombre rel x, F(x) ^ G(x). Une notion de dominance plus faible est la dominance stochastique dordre 2 ; au lieu de comparer les courbes des fonctions de rpartition, on compare les surfaces quelles dlimitent avec laxe horizontal. LA FONCTION DE RPARTITION F DOMINE STOCHASTIQUEMENT LA FONCTION G
La dfinition dune distribution par ses moments (esprance, variance, moment dordre trois ou suprieur) qui ne sapplique, bien entendu, que dans la mesure o ces moments ne sont pas infinis, permet de caractriser le domaine et la variabilit dune variable alatoire. Aussi, la mesure du risque la plus couramment employe est-elle le paramtre de la distribution qui caractrise sa variabilit autour de sa valeur moyenne : la variance. Cest cette mesure qui est utilise dans les critres de dcision deux paramtres : la moyenne ou lesprance du revenu que lagent cherche maximiser et la variance quil cherche minimiser. La thorie du portefeuille de Markowitz [1959] a rendu clbre ce double critre, appel critre esprance-variance. On peut montrer que, dans certains cas particuliers, le critre de Markowitz est quivalent la maximisation dune utilit espre (si cette fonction dutilit est quadratique ou si la distribution est dfinie par ses deux premiers moments uniquement, comme la loi normale). 90
En effet, si la fonction dutilit est quadratique : U(x) = ax bx2, lutilit espre, E[U(x)] = aE[x] bE[x2] = aE[x] + bE2[x] bVar[x] sera, maximale si E[x] est maximale et Var[x] est minimale. Toutefois, la variance est une mesure du risque insatisfaisante, comme le montre lexemple suivant reprsentant les distributions de deux portefeuilles :
Les deux densits reprsentes ont la mme esprance et la mme variance parce que symtriques par rapport laxe de la moyenne, pourtant celle de droite met, dans un certain sens, plus de poids sur la partie positive des revenus que celle de gauche ; de nombreux agents la trouveront donc moins risque. Conclusion La mesure du risque peut se faire dune manire absolue en comparant directement des distributions de probabilit ou une mesure de leur dispersion comme la variance. Les diffrentes dfinitions de la dominance stochastique permettent dtablir des comparaisons du risque dune distribution par rapport une autre. Elles ne sont cependant pas suffisantes pour tenir compte du comportement individuel face au risque. De mme, une mesure de la dispersion, comme la variance, si elle caractrise gnralement le risque, peut cacher certaines dissymtries auxquelles un dcideur peut tre sensible. Cest pourquoi, pour des 91
analyses plus fines et mieux adaptes un problme de dcision individuel, il est ncessaire de mettre en jeu une reprsentation du comportement du dcideur. Le critre de lutilit espre est une reprsentation des prfrences de dcideurs en situation de risque. Dans la mesure o un dcideur adhre aux axiomes de la thorie de lutilit espre, la forme de sa fonction dutilit permet de caractriser son aversion, et, localement, son degr daversion pour le risque. Grce ces caractrisations, il sera possible de rpondre des questions du type : Dois-je accepter de souscrire un contrat dassurance pour la prime propose ? Quelles proportions des actifs disponibles sur le march financier dois-je inclure dans mon portefeuille ? Est-il valable dentreprendre une tude plus approfondie de la situation afin de prciser la distribution de probabilits sur les consquences de ma dcision ? (Quelle est la valeur de linformation que je pourrai recueillir ?) Quelle stratgie adopter face un adversaire dont je peux mesurer laversion (ou la propension) au risque au vu de ses dcisions passes ? Etc. Pour des agents dont le comportement viole certains des axiomes, nous devons chercher lappui de thories alternatives celle de lutilit espre ; nous en proposons au chapitre VIII. Dans tous les cas, nous aurons besoin destimer les paramtres qui prcisent les distributions de probabilits ; cest lobjet de la dcision statistique que nous abordons au chapitre suivant.
VII / Dcisions statistiques

Lanalyse du risque suppose que la distribution de probabilits sur les consquences des dcisions soit connue. Dans la plupart des situations dincertitude, cette distribution, supposer que son existence ait un sens, est mal connue du dcideur. Afin de spcifier et didentifier cette distribution, le dcideur pourra avoir recours ltude des statistiques. Le recueil de statistiques (ce qui, lorigine, signifie constats ou situations), cest--dire de listes de donnes quantitatives, sest systmatis au XIXe sicle dans la plupart des administrations. Trs vite se sont dveloppes des mthodes de calcul (alors appeles arithmtique politique) permettant de faire des estimations de rsultats quil et t trop long ou trop difficile de faire exhaustivement. En saffinant et en sappliquant aussi des rsultats alatoires, les mthodes statistiques se sont de plus en plus appuyes sur la thorie des probabilits. Depuis les annes trente, la statistique est une thorie mathmatique dcoulant de la thorie des probabilits : la statistique mathmatique. Mais la statistique soulve aussi des problmes de dcisions puisque le statisticien doit finalement, dune manire plus ou moins prcise, dcider de la vraie distribution de probabilits. Aussi, la thorie de la dcision peut-elle tre invoque pour justifier certaines mthodes statistiques. Louvrage de Savage, o sa thorie est prsente (voir la fin de notre chapitre V), avait pour objet dtudier les fondements de la statistique ; il reste la bible des statisticiens baysiens 1 . Ceux-ci se distinguent des
1. Parce quils utilisent le thorme attribu Bayes (1720-1761) et certaines de ses ides concernant linformation, dveloppes dans son ouvrage posthume :
93
statisticiens classiques par le fait quils accordent de limportance des informations qui ne sont pas de nature statistique et quils font, de ce fait, intervenir des probabilits subjectives. Bien que les mthodes statistiques puissent tre utilises des fins purement informationnelles dans un premier temps, les sondages, lanalyse de donnes, les estimations de pourcentages et dautres paramtres de distribution de probabilits sont employs par des dcideurs : planificateurs gouvernementaux, responsables du marketing, thrapeutes, etc. Tout problme de dcision qui ne se pose pas, au dpart, dans une situation de risque en contient en fait deux : un problme de dcision statistique dont la solution sera la caractrisation de la distribution de probabilits qui sera utilise pour rsoudre le problme de dcision proprement dit. Nous analyserons, dans un premier temps, le problme de la dcision dans une situation dincertitude particulire que nous qualifierons de statistique . Dans un second temps, nous reviendrons sur les problmes de dcisions statistiques, comme ils sont prsents dans les ouvrages de statistique mathmatique, cest--dire considrs isolment dun problme plus gnral de dcision. 1. Le problme de dcision en situation dincertitude statistique Nous nous proposons de lancer un nouveau produit sur le march. Le profit que nous esprons raliser dpend de la rponse du march, cest--dire de la demande pour ce produit. La demande est incertaine, cest une fonction dcroissante du prix P que nous proposerons ; nous pouvons considrer quelle est de la forme D = D0 dP o d est un facteur dterminer. Si nous connaissions d, nous saurions dterminer notre prix optimal P(d) en maximisant notre profit. Mais le facteur d est inconnu et nous sommes en situation dincertitude. Nous avons dj un chantillon de fonctions de demande pour une cinquantaine de produits similaires, ce qui nous autorise penser que d est un nombre compris entre 0 et 5 et quil est distribu selon
An Essay Toward Solving a Problem in the Doctrine of Chances , Philosophical Transactions of the Royal Society, 53, 1763, p. 370-418.
94
une loi (approximativement) normale de variance 1 et de moyenne inconnue q. Si q tait connu, nous serions en situation de risque et nous dciderions du prix en maximisant lutilit espre de notre profit. Cela nous donnerait, pour chaque valeur de q, un prix P*(q). Les prix, P(d) et P*(q), sont optimaux selon nos prfrences dans le certain ou dans le risque, ils sont nos meilleures rponses ce que notre service statistique pourrait nous dire : faites comme si d = 3,4. Nous proposerions alors le produit au prix P(3,4), avec le risque que la vraie valeur de d soit 3,5, par exemple ; faites comme si la distribution de d tait une loi normale de moyenne 4,1. Nous proposerions alors le produit au prix P*(4,1), avec le risque que la vraie valeur du paramtre soit 4, par exemple. Nous traiterons de la manire dont notre service statistique dcide de nous proposer une valeur pour q au paragraphe suivant ; nous nous concentrons ici sur le problme de dcision en situation dincertitude sur q, incertitude que nous qualifions de statistique . En effet, lincertitude sur la distribution de la variable alatoire, cest--dire lincertitude sur la fiabilit de notre service statistique, ne nous autorise pas ncessairement utiliser le critre dfini en situation de risque (utilit espre du profit) qui, lui-mme, est diffrent de celui que nous utiliserions sans incertitude (le profit). Les deux risques (risque de nous tromper en utilisant la rponse du service statistique) ne sont pas de mme nature : ils correspondent deux niveaux dincertitude diffrents. Lincertitude statistique peut tre comprise comme un niveau dincertitude suprieur celui des situations de risque. La hirarchie des niveaux dincertitude que nous suggrons aurait pour niveau zro la situation extrme o il ny a pas dincertitude (d est connu ou considr comme tel). Le niveau dincertitude suprieur serait celui que nous avons dcrit prcdemment comme une situation de risque : lorsque les consquences dpendent de variables alatoires dont les distributions sont connues, les dcideurs devront tre en mesure de comparer des distributions sur les consquences. En effet, dans ces situations, chaque dcision correspond une distribution induite sur les consquences (les profits dans notre exemple). Cest pour ces situations de risque que la thorie de lutilit espre a t dveloppe. Cette thorie intgre les prfrences et lincertitude en un critre unique : lesprance (par 95
rapport la distribution de probabilit connue) de lutilit (sur les consquences). Le niveau dincertitude statistique est celui o la distribution sur les alas nest pas (ou mal) connue. Toutefois, le dcideur considre quil y en a une et quelle pourrait tre dfinie par un paramtre (ce paramtre peut tre un vecteur ou une fonction ; dans notre exemple, cest la moyenne, q, dune distribution normale). Dans ce cas, lincertitude du dcideur porte la fois sur les alas, rgis par une loi normale, et sur le paramtre quest la moyenne de cette loi. Cest en ce sens que ces situations peuvent tre considres comme prsentant plus dincertitude que celles o la distribution est connue. Dans de telles situations, la distribution sur les alas nest pas connue, mais elle est suppose exister. Pour formaliser le fait que la distribution nest pas connue, il est dusage de dire quelle appartient un ensemble de distributions possibles, ensemble index par des paramtres parmi lesquels le problme de dcision statistique consiste dterminer le vrai . Si on note q le paramtre et Q lensemble des paramtres possibles, on notera P = (Pq)qVQ la famille des probabilits qui peuvent rgir les alas. Lorsque P est la famille des lois normales, comme celles-ci sont compltement caractrises par les paramtres que sont leur moyenne, m, et leur variance, v, nous aurons Q = {(m,v) / m V R, v V R + } 2. Nous pouvons prsent aborder le problme de dcision en situation dincertitude statistique. Si le paramtre tait connu, cest--dire si la distribution P sur lensemble W des alas tait connue, nous serions dans une situation de risque. Dans ce cas, chaque dcision correspondrait une distribution sur lensemble C des consquences induite par la fonction c : AxW r C, qui chaque action choisie et chaque rsultat alatoire associe une consquence. Au choix de laction a correspond la distribution que nous pouvons noter Pa sur lensemble C des consquences. Dans une situation dincertitude statistique, la distribution Pq nest pas connue puisque le paramtre q ne lest pas. Dans de
2. Lusage veut que les indices q ne soient appels paramtres que dans le cas o Q est un ensemble de vecteurs de dimension finie ; on parle dans ce cas de statistique paramtrique, de statistique non paramtrique dans les cas plus gnraux. Pour simplifier lexpos, nous appellerons Q lensemble des paramtres dans tous les cas ; cest lui qui, avec lensemble des rsultats de lexprience alatoire (not W), caractrise lincertitude statistique.
96
telles situations, au choix dune dcision correspond une fonction qui, chaque paramtre, associe une distribution sur les consquences. Considrons un problme dinvestissement dont les rendements sont alatoires et peuvent prendre toutes valeurs selon une loi normale dont la moyenne est q % de la quantit investie et la variance est connue, disons 1. chaque valeur de q correspondront une distribution sur les rendements et, donc, une distribution sur les consquences des investissements. Dans le cas gnral, au choix dune action a correspond une fonction qui, chaque valeur de q, associe la distribution Pq. Lagent devra donc rvler des prfrences sur de telles fonctions afin de pouvoir ranger ses dcisions. Ces fonctions, contingentes aux paramtres, correspondent ce que Savage appelle des actes . Mais ici, ce sont les paramtres inconnus qui jouent le rle des tats du monde , alors que chez Savage ces tats du monde comprennent tout ce qui est pertinent pour prendre une dcision , cest--dire la fois les alas et les paramtres. La dfinition dun critre pour rsoudre un problme de dcision statistique repose alors sur la reprsentation de telles prfrences sur les actes. Une thorie qui gnralise la thorie de lutilit espre peut tre labore afin de justifier lemploi dun tel critre (pour des dcideurs dont le comportement en vrifie les axiomes). Ctait lobjet de la thorie de Savage (chapitre V), la thorie que nous rsumons ici (Anscombe et Aumann [1963]) met mieux en vidence le rle des paramtres, si fondamental en statistique. Afin de reprsenter les prfrences sur les actes (cest--dire les fonctions contingentes aux paramtres) par une fonction qui ait de bonnes proprits, cest--dire des proprits semblables celles de lutilit espre, nous devrons largir lensemble des actes en considrant aussi les loteries sur les actes. Cela revient demander au dcideur de savoir comparer des actes alatoires consistant, par exemple, au fait de tirer pile ou face entre deux actes. Il faut alors vrifier une cohrence entre les prfrences sur les actes, sur les distributions et sur les consquences afin de faire remonter la proprit dutilit espre du niveau des prfrences sur les distributions (situations de risque) au niveau des prfrences sur les actes (situations dincertitude statistique). La construction de la reprsentation des prfrences utilise deux fois la thorie de von Neumann et Morgenstern. Elle lutilise au niveau habituel
a
97
dagrgation des utilits par une distribution. Elle lutilise dj au niveau des actes. En ajoutant deux axiomes ceux de la thorie de lutilit espre, lexistence dun critre qui reprsente les prfrences peut tre dmontre. Ce critre fait intervenir une distribution de probabilits sur les paramtres. Ces paramtres sont donc traits comme sils taient alatoires et la distribution que rvle le critre (cest--dire, en fait, le comportement du dcideur) est interprte comme une distribution subjective. Si le paramtre q tait connu, le critre serait lesprance (par rapport la distribution Pq) de lutilit des consquences (lindex de Bernoulli). Lorsque le paramtre q est inconnu, une distribution sur les paramtres, disons n, est rvle par le dcideur et le critre est alors lesprance (par rapport n) de lindex de Bernoulli. Par exemple, pour un problme dinvestissement dont les rendements suivent une loi normale de variance 1 et de moyenne q fois la quantit investie, disons x, lutilit espre serait : V(x/q) = @ U(x) f(x/qx)dx, o f(x/qx) est la densit de la loi normale de moyenne qx. Supposons que le dcideur se comporte comme si q ne pouvait prendre que deux valeurs 10 % et 5 % avec les probabilits 1/4 et 3/4, son critre serait alors : W(x) = 1/4V(x/10 %) + 3/4V(x/5 %). Lincertitude sur les paramtres est intgre par la somme pondre des index de Bernoulli, qui, eux-mmes, intgrent lincertitude sur les rendements pour chaque valeur des paramtres. Les problmes de dcisions statistiques sont des cas particuliers de problmes de dcision en situation dincertitude statistique. Pour les statisticiens, la dcision prendre consiste dterminer le ou les paramtres. La consquence de la dcision est gnralement considre comme un cart entre la vraie valeur (inconnue) du paramtre et celle qui est dtermine par linfrence (la dcision) statistique. Cet cart, ou perte, est gnralement dtermin par des considrations de commodits de calcul et de proprits mathmatiques. Un comportement rationnel voudrait cependant quil corresponde lutilit espre du commanditaire de ltude statistique.
98
2. Infrence statistique Prendre une dcision statistique consiste dduire des prcisions sur la distribution dun mcanisme alatoire, partir dobservations de ralisations de ce mcanisme. Une estimation consiste dcider dune valeur du paramtre ; un test consiste dcider si le paramtre vrifie ou non une certaine proprit. Nous nous limiterons ici au problme de lestimation. Un chantillon est form dune srie dobservations, cest partir de ces rsultats que linfrence sera faite. Le statisticien dispose donc dun certain nombre dobservations partir desquelles il doit dcider de certaines caractristiques des paramtres inconnus. Le principe de la dcision statistique est que plus la taille de lchantillon est importante, mieux il sera possible den dduire la distribution qui rgit lexprience alatoire. Ce principe peut tre compris intuitivement lorsque lexprience consiste extraire des individus dune population finie : si lchantillon est form de tous les individus de la population, toutes ses caractristiques seront connues. Plus gnralement, ce principe est fond sur un thorme de la thorie des probabilits, il sagit dune des lois des grands nombres. Cette loi dit, en substance, que la distribution empirique (cest--dire celle qui est dfinie par le rapport du nombre dobservations vrifiant une proprit sur le nombre total des observations : la taille de lchantillon) tend vers la distribution qui rgit lexprience, lorsque la taille de lchantillon tend vers linfini. Un exemple bien connu est lestimation de la probabilit dobtenir pile en jetant une pice de monnaie. Lobservation de dix lancers dune pice donnera une suite de piles et de faces. Cest un chantillon sur lequel la proportion empirique des piles sera calcule. Bien que la pice soit rgulire il se peut que, sur dix lancers, pile apparaisse plus souvent que face. Mais sur cent lancers, il y aura sensiblement autant de piles que de faces et la proportion empirique sera proche de 1/2 (cent tant un grand nombre !). Dans cet exemple, lexprience est, proprement parler, la rptition dun mcanisme alatoire et le paramtre estimer est celui qui dfinit la distribution qui rgit les observations. Dans de nombreux cas, les paramtres sont des caractristiques dune population : le nombre de chmeurs dans la population dune rgion une priode donne, par exemple. Le mcanisme alatoire est alors 99
celui qui consiste tirer au hasard des individus de la population pour former lchantillon. Ainsi, si le paramtre estimer est la proportion de mles dans une population de mouches nes dans un certain environnement, un chantillon de cent mouches peut tre prlev et la proportion de mles dans cet chantillon est la proportion empirique. Si la population tait de cent mouches, ce serait la vraie proportion. Si la population est trs grande (considre comme infinie), cette proportion empirique nest pas la vraie proportion, mais la loi des grands nombres prouve quelle sen approche lorsque la taille de lchantillon crot. En pratique, un chantillon de cent mouches donnera une trs bonne approximation de la vraie proportion ; un chantillon de dix mouches sera gnralement peu fiable. Un chantillon est donc une liste dobservations de variables alatoires. Une dcision statistique consiste choisir une fonction de ces observations. Dans les exemples prcdents, cette fonction tait la proportion empirique. partir dune liste de cours boursiers, la dcision consistera gnralement calculer le cours empirique moyen et la variance empirique de ces cours qui sont fonction des rsultats de lchantillon. Les rsultats de la statistique mathmatique montrent que certaines de ces fonctions ont de bonnes proprits et prcisent la fiabilit des dcisions statistiques quelles permettent de prendre en fonction de la taille de lchantillon. Ainsi, la proportion empirique et la moyenne empirique sont de bons estimateurs des paramtres correspondants de la vraie distribution. En revanche, la variance empirique nest pas un bon estimateur de la variance parce quelle prsente un biais. La question qui se pose est donc : comment choisir un bon estimateur de la variance, cest--dire une fonction des observations qui permette destimer la variance de la manire la plus satisfaisante possible ? La thorie de la dcision nous a montr que, pour rpondre cette question, il fallait une dfinition des consquences de la dcision et de leurs utilits. En statistique, lutilit des consquences est appele la perte . Cest, au contraire de ce que nous avons fait jusquici, une valeur minimiser. En pratique, la perte est gnralement dfinie par le carr de la diffrence entre la valeur estime du paramtre et sa vraie valeur, si le paramtre est un nombre (sil sagit dun vecteur de paramtres, cest le carr de la distance qui dfinit la perte). 100
Ainsi, si au vu de lchantillon X, la dcision d(X) est prise, la perte sera (d(X) q)2 si q est la vraie valeur du paramtre. Comme lchantillon est alatoire, cest, en accord avec la thorie de lutilit espre, lesprance mathmatique de la perte quil faudra minimiser. Si q est la vraie valeur du paramtre, la distribution qui rgit les observations sera Pq, et lesprance mathmatique de la perte sera cacule par rapport Pq. Prenons lexemple simple dune proportion inconnue de mles dans une population de mouches ; q est cette proportion. partir de lchantillon X de taille n, si la dcision consiste prendre la proportion empirique et si le nombre de mles de lechantillon est m(X), la dcision sera d(X) = m(X)/n. La perte sera donc : L(d/q) = [d(X) q]2 = [m(X)/n q]2. La vraie valeur de la proportion tant q, la probabilit que le nombre de mles dans lchantillon soit m(X) est donne par la distribution binmiale de paramtres n et q. Lesprance de la perte sera calcule par rapport cette distribution : R(d/q) = EB(n, q) [L(d/q]). Lesprance de la perte est appele le risque (risque de prendre la dcision d, si q est la vraie valeur du paramtre) ; comme la perte, il dpend de q, et cest une fonction quil faut minimiser. partir de ces remarques gnrales, les problmes de dcisions statistiques sont traits de manires diffrentes selon la thorie dite classique et la thorie baysienne . La statistique classique propose un certain nombre de critres permettant de ranger les dcisions sur la base de considrations pragmatiques et des (bonnes) proprits mathmatiques des estimations obtenues. Elle doit son label de classique ce que, conformment aux mthodes statistiques du sicle dernier, elle cherche ne fonder ses conclusions que sur la seule base des rsultats observs. La statistique baysienne se fonde sur la thorie de la dcision en situation dincertitude statistique pour dfinir un critre. En statistique classique, lespace des paramtres nest pas considr comme un ensemble probabilisable, les classiques rejetant la notion de probabilits subjectives (ou personnelles, ou ordinales, ou a priori). Le critre le plus connu en statistique classique permet de prendre une dcision partir des fonctions de risque, cest le critre MiniMax (ou critre de Wald, voir chapitre IV) : choisir une dcision qui minimise le risque maximal. Les statisticiens classiques utilisant ce critre 101
chercheront donc la valeur de q pour laquelle le risque R(d/q) est maximal mettons que ce soit un certain q et ils choisiront la dcision d qui minimise R(d/q). En statistique baysienne, lespace des paramtres est considr comme probabilisable, la distribution qui sera dfinie dessus est introduite par le critre reprsentant les prfrences du dcideur sur les actes, comme nous lavons vu au paragraphe prcdent. Le critre est alors le risque baysien, cest-dire lesprance du risque par rapport une distribution subjective sur les paramtres. En pratique, cette distribution sera choisie a priori (elle est, de ce fait, souvent appele distribution a priori) sur la base dinformations non statistiques (et, disons-le sans ambages, parmi des distributions qui facilitent les calculs !). Les statisticiens baysiens choisiront donc la dcision qui minimise lesprance du risque par rapport la distribution a priori : En[R(d/q)] o n est la distribution a priori. En interprtant la perte ( minimiser) comme loppos dune utilit ( maximiser), on reconnat bien l lexpression du critre dfini par la thorie de la dcision en situation dincertitude statistique. Conclusion Afin de dcider du prix auquel proposer un nouveau produit, les firmes ont tendance se fonder sur des donnes que leur propose un service statistique, le facteur d qui affecte le prix dans la fonction de demande : D = D0 dP, par exemple. Les statisticiens proposent ces donnes en rsolvant un problme de dcision (statistique), face aux rsultats dun chantillon. Ils rsolvent ce problme de dcisions selon les principes que nous avons vus au paragraphe 2, indpendamment, le plus souvent, de lutilisateur des rsultats quils obtiennent. Ce dernier, sil ne questionne pas les rsultats fournis par le statisticien, rsout son problme de dcision comme sil tait en situation de risque, cest--dire avec une distribution de probabilit connue sur les alas qui affectent les consquences de ses dcisions. Mais, quelles que soient les comptences du statisticien et la fiabilit de ses rsultats, il peut tre important pour le dcideur de tenir compte du fait que sa dcision nest pas prise en situation de risque, mais en situation dincertitude statistique : son comportement face cette incertitude nest pas 102
ncessairement le mme que celui quil aurait face un jeu de roulette, par exemple. Pour bien faire, il faudrait que le statisticien prenne en compte lutilit du dcideur face lincertitude statistique, en lintgrant au critre quil utilise pour estimer les paramtres. Le type de problmes poss par cette interaction ncessaire entre le statisticien et le dcideur qui en utilise les rsultats est connu sous le nom de risque destimation (voir notamment Bawa V., Brown J. et Klein D. [1979]) ; nous ne le mentionnons ici que dans le but dattirer lattention sur les prcautions prendre en traitant un problme de dcision en situation dincertitude statistique comme sil se posait en situation de risque.
VIII / Gnralisation des critres et des thories

Si la thorie de lutilit espre et son extension au cas de lincertitude non probabilise ont clairement domin le champ des applications de la thorie de la dcision des annes cinquante aux annes quatre-vingt, elles avaient nanmoins subi de violentes critiques ds leur introduction. Cest Maurice Allais qui mit clairement en cause laxiome dindpendance de von Neumann et Morgenstern que nous avons vu au chapitre V. Il prsenta notamment un exemple, connu depuis sous le nom de paradoxe dAllais, qui mit les adeptes de la thorie de lutilit espre face des choix o ils contredisaient eux-mmes laxiome dindpendance. Le paradoxe dAllais [1953] est fond sur des exemples dans lesquels le choix entre deux alternatives est propos, disons A contre B et X contre Y. Ces alternatives sont telles que lutilit espre de A est suprieure celle de B et celle de X celle de Y quelle que soit lutilit du dcideur. Or, parmi les dcideurs confronts ces choix, nombreux sont ceux qui prfrent A B mais Y X (ce fut le cas de Savage et de bien dautres tenants de la thorie de lutilit espre bien quil ait par la suite dsavou son choix et argument en faveur du maintien de son axiomatique). Cest une dmarche scientifique courante que de remettre en cause et de gnraliser les thories existantes afin de rsoudre les paradoxes quelles prsentent. Cest ainsi que le critre de lutilit espre est une gnralisation du critre du gain espr ; il avait t propos pour rsoudre le paradoxe de 104
Saint-Ptersbourg. La construction de la thorie de la dcision par gnralisations successives de thories qui rsolvent les paradoxes poss par les anciennes sest naturellement poursuivie. Le terme paradoxe doit cependant tre entendu ici dans le sens dune opinion qui contredit une opinion reue (dfinition du dictionnaire Robert) et stend donc toutes les observations de comportements qui contrediraient celui que recommanderait une thorie normative. Il est donc important de signaler, dfaut de les exposer, que, depuis la prsentation du paradoxe dAllais, de nombreuses recherches se sont attaches construire des exprimentations mettant en vidence les comportements de dcideurs. Ces expriences, menes la fois par des psychologues, des conomistes et des statisticiens, ont donn des directions suivre par les thoriciens de la dcision afin de trouver des axiomatiques mieux adaptes aux comportements observs et permettant la construction dautres critres de dcision. Savage a gnralis la thorie de lutilit espre au cas de lincertitude non probabilise. Bien quil ait t un ardent dfenseur de sa thorie, il nous fournit dans son ouvrage (Savage [1954], p. 102) la justification des trente ans de recherches qui ont permis de proposer des thories expliquant les paradoxes que nous exposons ci-dessous : Si, aprs une dlibration approfondie, quiconque maintient des prfrences qui soient en conflit avec le principe de la chose sre 1, il doit abandonner ou modifier ce principe : car ce type de contradiction semble intolrable dans une thorie normative. 1. Les paradoxes Le paradoxe dAllais Un exemple simple de comportement en contradiction avec la maximisation dune utilit espre est celui dun dcideur, le lecteur peut-tre, qui prfre A B et Y X, o : A est un billet de loterie donnant droit 15 000 euros avec probabilit 0,09 ou 0 euro avec probabilit 0,91 ; B est un billet de loterie donnant droit 10 000 euros avec probabilit 0,1 ou 0 euro avec probabilit 0,9.
1. Ce principe est formalis par son axiome 2, notamment ; voir chapitre V.
105
Le paradoxe dAllais tait fond lorigine sur un exemple un peu moins simple que celui que nous avons prsent : lincertitude est engendre par le tirage au hasard dune boule qui est dans une urne contenant 100 boules numrotes. On distingue les trois vnements : le numro de la boule tire est 0, est compris entre 1 et 10, est compris entre 11 et 99. X donne droit 1 000 000 de francs 1 dans tous les cas ; Y donne droit 0 franc dans le premier cas, 50 000 000 de francs dans le deuxime, et 1 000 000 de francs dans le troisime ; A donne droit 1 000 000 de francs dans le premier cas, 1 000 000 de francs dans le deuxime, et 0 franc dans le troisime ; B donne droit 0 franc dans le premier cas, 50 000 000 de francs dans le deuxime, et 0 franc dans le troisime. Or, le calcul de lutilit espre de chacun de ces actes donne pour toute fonction dutilit U :
V(X) = U(1 000 000) V(Y) = 0,01U(0) + 0,1U (50 000 000) + 0,89U(1 000 000) V(A) = 0,01U(1 000 000) + 0,1U(1 000 000) + 0,89U(0) V(B) = 0,01U(0) + 0,1U(50 000 000) + 0,89U(0) Du fait que la fonction dutilit peut tre normalise (si U reprsente les prfrences, aU + b les reprsente aussi), posons U(0) = 0 et U(50 000 000) = 1. Si A est prfr B, on doit avoir : V(A) 1 V(B) soit 0,11U(1 000 000) 1 0,1, ce qui implique U(1 000 000) 1 1/11. Or, puisque Y est prfr X, on doit aussi avoir : V(Y) 1 V(X), soit 0,1 + 0,89U(1 000 000) 1 U(1 000 000), ce qui implique : 0,11U(1 000 000) ! 0,1, soit U(1 000 000) ! 1/11, do la contradiction. 1. La monnaie franaise tait alors le franc.
Nombreux sont ceux qui prfrent A B parce que 0,09 est quasi gal 0,1 alors que 15 000 est sensiblement suprieur 10 000. X est un billet de loterie donnant droit 15 000 euros avec probabilit 0,9 ou 0 euro avec probabilit 0,9 ; Y est un billet qui vaut 10 000 euros (avec certitude). Nombreux sont ceux qui prfrent Y X, parce que Y est un gain certain alors que X peut, quoique avec une probabilit faible, ne rien faire gagner. En quoi prfrer A B et Y X est-il contradictoire avec laxiome dindpendance ? Rappelons cet axiome que nous avions not A2 au chapitre V : A2 : tant donn deux loteries l et l telles que l est prfre l, et un nombre t compris entre 0 et 1, pour toute troisime loterie l, la loterie compose tl + (1 t)l doit tre prfre tl + (1 t)l. Puisque Y est prfr X, considrons un billet de loterie qui donne droit au billet Y avec probabilit 0,1 et 0 avec 106
probabilit 0,9 : cest tl + (1 t)l, o l = Y,t = 0,1 et l = 0 avec certitude. En vertu de laxiome dindpendance, ce billet de loterie doit tre prfr tl + (1 t)l o l = X, cest-dire quil doit tre prfr au billet de loterie qui donne droit au billet X avec probabilit 0,1 et 0 avec probabilit 0,9. Or, le premier billet donne droit 10 000 euros avec probabilit 0,1 ou 0 euro avec probabilit 0,9 : il est quivalent au billet B. Le second billet donne droit 15 000 euros avec probabilit 0,09 ou 0 euro avec probabilit 0,91 : il est quivalent au billet A qui tait pourtant prfr B. Ce paradoxe a conduit certains chercheurs essayer daffaiblir laxiome dindpendance et chercher une thorie plus gnrale que celle de lutilit espre. Le paradoxe dEllsberg Le paradoxe prcdent mettait en vidence le rle de laxiome dindpendance dans les situations de risque (les probabilits taient donnes). Lexemple propos par Ellsberg [1961] utilise la fois des probabilits donnes et des probabilits inconnues ; il traite donc dune situation dincertitude plus gnrale. Cette incertitude est engendre par le tirage de boules de couleurs, rouges, blanches ou noires, dune urne contenant 90 boules, dont 30 sont rouges. Le nombre de boules noires est inconnu et celui de boules blanches aussi, on sait seulement que leur somme est 60. Lacte E est comparer lacte F, lacte G lacte H ; ils sont dfinis par le tableau suivant o les sommes indiques sont les consquences de chaque acte selon la couleur de la boule tire :
tats Rouges Actes E F G G 100 0 100 0 0 100 0 100 0 0 100 100 Blanches Noires
Certains dcideurs prfrent E F et H G. Supposons que les prfrences dun tel dcideur soient reprsentes par une utilit espre fonde sur des probabilits subjectives. Ces 107
probabilits sont : P(Rouge) = 1/3, elle est connue et donc objective ; P(Blanche) et P(Noire) qui ne sont pas connues de manire objective. On sait seulement quelles ne peuvent tre 1/2 car la somme des trois ne serait pas 1 ; elles sont comprises entre 0 et 2/3. Lordre de prfrence implique : puisque E est prfr F, comme lutilit espre de E est 100 P(Rouge) et que celle de F est 100 P(Blanche), on doit avoir : P(Rouge) 6 P(Blanche) ; puisque H est prfre G, comme lutilit espre de H est 100 P(Blanche) + 100 P(Noire) et que celle de G est 100 P(Rouge) + 100 P(Noire), on doit avoir : P(Blanche) + P(Noire) 6 P(Rouge) + P(Noire). Mais cela implique que P(Blanche) 6 P(Noire), ce qui contredit le fait que E soit prfre F ! Par ce paradoxe, cest le principe de la chose sre appliqu une situation dincertitude (et non plus seulement de risque) qui est remis en cause. La mesure de la vraisemblance des vnements par une probabilit (cest--dire une mesure additive au sens o la probabilit de la runion de deux ensembles disjoints est la somme de leurs probabilits) nest sans doute pas celle qui est adapte des situations comme celle de lexemple. Les recherches rcentes ont donc port sur la gnralisation de la thorie de Savage en pondrant autrement que par des probabilits les vnements pertinents dans un problme de dcision. 2. Les gnralisations Maurice Allais, en prsentant son paradoxe, montrait la limite normative de la thorie de lutilit espre. Il donnait en mme temps des arguments en faveur dun critre diffrent. Le critre propos suppose lexistence dune utilit cardinale 2 sur les consquences, utilit indpendante de toute situation de risque. Rappelons quau contraire, dans la thorie de lutilit espre, la cardinalit de lutilit sur les consquences dcoule des axiomes. Largument en faveur de cette hypothse est que lutilit des consquences devrait tre dfinie en dehors de tout
2. Cest--dire que si x2 est prfre x1, laccroissement U(x2) U(x1) reprsente laccroissement de prfrence entre x1 et x2.
108
contexte de dcision dans le risque, alors que, dans la thorie de lutilit espre, elle nest quun cas particulier de lutilit dune loterie (lutilit de von Neumann-Morgenstern est un cas particulier de lindex de Bernoulli). Une seconde hypothse pour dfinir ce critre est que lutilit dune loterie est une fonction linaire de lutilit des consquences. Lindex de Bernoulli a aussi cette proprit, mais elle dcoule des axiomes. Le critre que proposait Allais, sans justification axiomatique sur le comportement, est dfini ainsi : si l est une loterie qui met les probabilits p1, , pn sur les consquences x1, , xn ranges par ordre de prfrences dcroissantes, son utilit est : V(l) = U(x1) + q(p2 + p3 + pn) [U(x2) U(x1)] + + q(pn) [U(xn) U(xn1)]. Dans ce critre, ce sont les accroissements dutilit entre les consquences qui sont pondres par une fonction (note q dans la formule) des probabilits cumules. Lutilit des consquences U est dtermine indpendamment de tout choix dans lincertain et ne peut donc tre considre comme reprsentant le comportement de lagent vis--vis du risque. En revanche, laversion pour le risque est caractrise par les coefficients q(p) qui sont fonction des probabilits. Avec ce critre, Allais peut expliquer le comportement dagents qui taient en contradiction avec celui de lutilit espre. Il a cependant fallu prs de trente ans de recherches 3 pour justifier ce critre et les ides quil suggre, par une thorie axiomatique du comportement. Pendant cette priode, de nombreuses tudes exprimentales, tant en psychologie quen conomie et en thorie de la dcision, ont permis de mieux cerner certains aspects du comportement des dcideurs. Parmi les lments notables, nous pouvons retenir la tendance surestimer les petites probabilits : le seul fait que la probabilit dune consquence ne soit pas nulle fait que le dcideur tient compte de cette consquence, mme si cette probabilit est infinitsimale (gagner au Loto !). Une telle tendance ne peut tre prise en compte par une thorie qui ne fait intervenir que les probabilits sans tenir compte de dformations que les dcideurs peuvent leur faire subir. La violation systmatique de certains axiomes, comme le montrent les paradoxes dAllais ou dEllsberg, a t mise en lumire par des expriences qui ont permis de chercher des
3. Un panorama de ces recherches se trouvera notamment dans : ALLAIS et HAGEN [1979], DABONI, MONTESANO et LINES [1986] et MUNIER [1988].
109
affaiblissements pertinents de ces axiomes. Le critre dAllais a pu tre justifi axiomatiquement en remplaant laxiome dindpendance par un axiome plus faible. Bien entendu, V nest alors plus une fonction linaire des probabilits (ce nest plus une esprance mathmatique) : la formule prcdente fait intervenir une dformation des probabilits (par la fonction q). Les thories axiomatiques justifiant le critre prcdent ou des critres semblables (en ce sens que ce ne sont pas des utilits espres, mais une formule faisant intervenir des dformations des probabilits) sont apparues simultanment depuis 1979 ; elles sont nombreuses et ce nest pas notre propos den rendre compte ici autrement que par des rfrences bibliographiques ncessairement trs incompltes : les premiers reprendre les ides dAllais furent Kahneman et Tversky [1979], qui proposrent un critre de dcision dans le risque dans lequel les consquences sont values par une utilit et les probabilits sont dformes par une fonction. Leur critre a la faiblesse de ne pas respecter la dominance stochastique ; traitant de situations de risque, Quiggin [1982] semble avoir propos la premire axiomatique de ce quil a appel thorie de lutilit anticipe qui justifie un critre gnralisant celui dAllais. Dautres thories dAllais [1985] et de Yaari [1987], notamment, dveloppent des reprsentations du comportement en situations de risque sous la forme dune fonction non linaire des probabilits ; dans le mme esprit, le comportement en situation dincertitude peut tre reprsent par une fonction qui nest pas linaire (si laxiome dindpendance et laxiome de la chose sre de Savage ne sont pas vrifis). En prenant dautres affaiblissements des axiomes, la valeur dun acte sera exprime par une fonctionnelle dfinie par une mesure subjective qui nest pas une probabilit, mais une mesure non additive seulement 4. Ce sont notamment les thories de Schmeidler [1989], de Gilboa et Schmeidler [1990] et de Wakker [1989]. Sans entrer dans les dtails, mais pour avoir une vue densemble des diffrentes thories et de leurs rapports, le tableau suivant peut tre tabli :
4. Cest--dire quelle ne respecte que lordre de linclusion, si A p B, la mesure de A sera suprieure celle de B. En revanche, elle ne respecte pas ladditivit : m(AyB) + m(AYB) = m(A) + m(B).
110
Esprance subjective r du gain F Esprance du gain r
Esprance subjective r de lutilit F Esprance de lutilit r
Intgration subjective non linaire de lutilit F Intgration non linaire de lutilit
Dans le tableau, les flches indiquent le sens dune gnralisation et la premire ligne correspond aux situations dincertitude non probabilises, la seconde aux situations de risque. Le tableau met en vidence la place centrale de la thorie de lutilit espre ; il fait apparatre aussi son manque de gnralit. Les thories rcentes, puisque plus gnrales, doivent donner lieu des notions de mesure du risque qui ont des applications en thorie de lassurance ou en thorie du portefeuille. Elles doivent aussi tre utilises pour proposer de nouvelles formulations de modles conomiques o elles serviront de fondement la reprsentation du comportement rationnel. Ces nouvelles thories et leurs applications venir ne diminuent pas limportance que la thorie de lutilit espre a prise dans le dveloppement de la science conomique. Tout en rejetant laxiome dindpendance, Mark Machina [1982] a pu montrer dans un modle que de nombreux rsultats qui utilisent cette thorie sont robustes, localement, si cet axiome nest pas utilis. En la rsumant trs grossirement, son analyse montre que la proprit de linarit que donne laxiome dindpendance nest pas ncessaire pour obtenir les rsultats que lon en drive, puisquils restent, localement, approximativement valables. Conclusion La prpondrance dune thorie ne signifie pas quelle doive tre impose par un acadmisme quasi dogmatique. Il revient Maurice Allais davoir su reconnatre les limites de la thorie de lutilit espre ds son apparition et davoir lutt contre ce quil a appel limprialisme de lcole amricaine et la tendance ne pas remettre en cause les axiomes qui sont la base de cette thorie. cause de limmobilisme des universitaires et plus encore des praticiens, les gnralisations de la thorie de lutilit espre ont attendu trente ans pour voir le jour. 111
Cependant, et grce cela, de nombreuses applications la thorie conomique de lincertain ont pu tre dveloppes dans des domaines o la validit de cette thorie est reconnue : thorie de linformation, de lassurance, des marchs financiers, notamment. Pour traiter des paradoxes qui surgissent et des situations o les axiomes de la thorie sont gnralement viols par les dcideurs, il aura fallu dvelopper les gnralisations que nous avons prsentes dans ce chapitre. leur tour, ces thories devront tre gnralises ou cder la place des thories alternatives lorsque leurs applications auront t dveloppes et auront montr les limites de leurs pouvoirs explicatifs et prdictifs.
Conclusion gnrale
Comment une thorie gnrale de la dcision individuelle peut-elle tre adaptable tous les problmes ? Chaque problme que nous rencontrons prsente des particularits qui semblent requrir une approche diffrente. Nous avons pourtant pu voir que de nombreux lments communs se retrouvent ds que nous formalisons les problmes de dcision. Il nen reste pas moins que des situations diffrentes doivent tre traites de manire adapte et nous avons fait quelques distinctions entre plusieurs types dincertitude pertinents. Lincertitude est perue dune manire individuelle par les dcideurs. La thorie ne consiste pas rduire les individus des machines, au contraire, sa construction logique, ses axiomes permettent chacun de savoir si la thorie correspond ou non son comportement. Dans le cadre dune reprsentation des prfrences dun dcideur, comme le critre de lutilit espre, chaque dcideur garde la facult de dterminer des paramtres qui lui sont propres, comme son degr daversion pour le risque. Toutes les thories ont leurs limites ; les exemples o une thorie ne correspond pas la ralit de comportements observs ninvalident pas la thorie : ils suggrent quelle doit tre tendue, gnralise ou rvise pour rendre compte des observations. La thorie de la dcision ne sest pas construite autrement : les paradoxes ont suggr que de nouveaux critres, fonds sur des axiomes diffrents, soient proposs aux dcideurs dont les comportements ne sont pas correctement reprsents par la thorie existante. De ce fait, la thorie de la dcision nest pas acheve et ne le sera sans doute jamais puisquelle se dveloppe au fur et mesure des besoins de 113
lanalyse des problmes de dcision. En ltat actuel, elle sert de rfrence la reprsentation du comportement dagents conomiques qui sont cohrents avec ses hypothses, ce qui a permis des avances importantes dans la comprhension de phnomnes conomiques. Les choix industriels, les choix dinvestissements, lvaluation de contrats dassurance et de titres financiers sont des exemples des applications de cette thorie. Les problmes dorganisation industrielle ont pris une place prpondrante dans les sciences conomiques depuis les annes quatre-vingt, cela grce au renouveau de lintrt port la thorie des jeux. Nous lui consacrons quelques lignes. Ltude de ces jeux a intress des mathmaticiens et des philosophes comme Pascal, Bernoulli ou Borel. Von Neumann et Morgenstern ont poursuivi cette dmarche et ils posrent les fondements de la thorie qui peut sappliquer des problmes de dcision en situations de conflit plus gnrales que celles des jeux de socit. Un jeu y est dfini par lensemble des joueurs, les choix qui leur sont possibles et les consquences de ces choix : gains ou pertes, gnralement exprims en termes de paiements (positifs ou ngatifs). Afin de dvelopper lanalyse des jeux, il tait ncessaire de formaliser les manires de faire un choix individuel. Cest lobjet de la thorie de la reprsentation du comportement individuel de von Neumann et Morgenstern, la thorie de lutilit espre que nous avons vue au chapitre V. Les concepts de solution dun jeu sont fonds sur lhypothse que les gains des joueurs sont des valeurs quils cherchent maximiser et que ce sont donc, en fait, les utilits des consquences de leurs dcisions ou les utilits espres de leurs stratgies. La thorie des jeux distingue les jeux non coopratifs, dans lesquels aucune collusion nest possible entre les joueurs (on dit encore jeux purement comptitifs ou concurrentiels), des jeux coopratifs o, au contraire, certaines formes de coopration sont possibles. La solution un problme de dcision dans un jeu non coopratif est donne par une notion dquilibre. Un quilibre de Nash (du nom de celui qui la tudi le premier et en a dmontr un thorme dexistence [1951]) est une liste des gains des joueurs (cest--dire une case du tableau de la forme normale du jeu) qui correspond une liste de stratgies pour chaque joueur telles quaucun changement unilatral de 114
stratgie par lun des joueurs ne lui permettrait daugmenter son gain. Une solution non cooprative nest pas ncessairement satisfaisante. Deux entreprises en concurrence peuvent adopter chacune soit une stratgie agressive se traduisant par le dclenchement de manuvres de conqute du march, soit une stratgie prservant le statu quo ou cherchant lamliorer pour les deux parties. Le choix du lieu dimplantation dun point de vente par des entreprises concurrentes est un autre exemple o labsence de coopration peut se traduire par des consquences dsastreuses pour tous les concurrents. Le rachat de parts du capital dune socit, lenjeu tant le contrle de la socit, est un exemple o labsence de consensus entre les acheteurs peut les amener acheter trs cher des parts dont le nombre restera insuffisant. Ces exemples peuvent tre traduits sous une forme voisine de celle du classique dilemme du prisonnier : deux malfaiteurs ont t arrts pour une faute bnigne et ils sont souponns, juste titre mais sans preuve, dtre les auteurs dun crime grave. Le juge essaie de les faire avouer tous deux pour les condamner cinq ans chacun, faute de quoi il les condamnera un an chacun pour la faute bnigne. Mais il leur propose individuellement de relaxer celui qui tmoignerait contre lautre, ce dernier copant alors de vingt ans. La forme normale de ce jeu est reprsente par le tableau suivant :
II Ne parle pas I Ne parle pas Parle 1, 1 0, 20 Parle 20, 0 5, 5
Si les joueurs pouvaient cooprer, aucun ne parlerait mais, sils agissent indpendamment lun de lautre, ils parleront tous deux. On voit que, dans ce jeu, la coordination des deux joueurs leur assure un gain meilleur que celui quils peuvent sassurer individuellement. Pour les jeux coopratifs, le concept dquilibre de Nash nest pas un concept dquilibre satisfaisant, comme on le voit dans le dilemme du prisonnier o le point dquilibre est (parle, 115
parle) ce qui correspond un rsultat qui est moins bon pour chacun des deux joueurs que la solution (ne parle pas, ne parle pas). Un autre exemple classique argumentant contre lquilibre de Nash comme concept de solution pour les jeux o la coopration est possible est celui de la bataille des sexes : Lui prfre aller au match, Elle au ballet, mais tous deux prfrent par-dessus tout sortir ensemble. La forme normale du jeu, o les gains sont des utilits, peut tre reprsente de la manire suivante :
Elle Match Lui Match Ballet 2, 1 0, 0 Ballet 0, 0 1, 2
Ce type de situation se prsente dans de nombreux problmes de gestion comme celui de lattribution de postes de travail ou de responsabilits, les prfrences des deux amants tant remplaces par les capacits des agents. Lorsque ces capacits sont volontairement tenues caches par les agents, lanalyse de leurs stratgies peut permettre de dvoiler ces capacits. La thorie des jeux propose des mthodes danalyse des interactions entre individus. La thorie de la dcision qui a t prsente dans cet ouvrage porte sur le comportement de ces individus, indpendamment des perceptions quils peuvent avoir des ractions des autres. Comme nous lavons dit plus haut, la thorie des jeux avait besoin de la thorie de la dcision individuelle pour se btir et ce sont les initiateurs de la premire qui ont tabli les principes de la seconde. Celle-ci, son tour, a permis le dveloppement de thories conomiques fondes sur des modles mathmatiques, des mthodes de gestion, des outils danalyse qui trouvent des applications en dehors du champ de lconomie et de la gestion. La tentation est grande, et ceux qui y cdent sont nombreux, de vouloir utiliser cette thorie au-del de ses limites. En particulier, les dcisions publiques ne relvent pas du domaine de la dcision individuelle, en gnral, comme le montre le thorme dimpossibilit de Arrow (chapitre VI, paragraphe 6). On peut 116
toutefois avoir recours cette thorie pour les dcisions collectives si celles-ci sont prises par un seul individu dlgu, quelquun qui dicte les dcisions prendre. La thorie de la dcision individuelle peut aussi tre invoque lorsque, une organisation ayant par le pass pris de nombreuses dcisions, il est possible dtablir sur la base de ces donnes les paramtres dfinissant un critre. Ce critre ne prtend pas reprsenter des prfrences collectives, mais il est tel que les dcisions prises par le pass loptimisent. Dans la mesure o lorganisation continuera de fonctionner selon les mmes principes, un problme de dcision pourra tre analys dans le cadre de LA thorie de la dcision.
Repres bibliographiques
Bibliographie gnrale DE GROOT H., Optimal Statistical Decisions, Mc Graw Hill, New York, 1970. EECKHOUDT L. et GOLLIER C., Les Risques financiers, discience, 1992. F ERRARI J.-B., conomie du risque, Breal, 2002. FISHBURN P., Les Mathmatiques de la dcision, GauthierVillars, Paris, 1973. GAYANT J.-P., Risque et dcision, Vuibert, 2001. H ENRIOT D. et R OCHET J.-C., Microconomie de lassurance, Economica, 1991. KAST R., Rationalit et marchs financiers, Economica, 1991. RAIFFA R., Analyse de la dcision, Dunod, Paris, 1973. VINCKE Ph., LAide multicritre la dcision, Ellipses, Paris, 1989. Rfrences bibliographiques ALLAIS M., Le comportement de lhomme rationnel devant le risque : critique des postulats et axiomes de lcole amricaine , Econometrica, 21, p. 503-546, 1953. ALLAIS M., Three Theorems on the Theory of Cardinal Utility and Random Choice , in Essays in Honour of Werner Leinfellner, H. Berghel ed, Reidel, Dordrecht, 1985. ALLAIS M. et HAGEN O., Expected Utility and the Allais Paradox, Reidel, 1979. ANSCOMBE F. et AUMANN R., A Definition of Subjective Probability , Annals of Mathematical Statistics, n 34, mars 1963. A RROW K.J., The Theory of Risk Aversion , in Aspects of the Theory of Risk Bearing, Yrj Foundation, Helsinki, 1965. BAWA V., BROWN J. et KLEIN D., Estimation Risk and Optimal Portfolio Choice, North Holland, Amsterdam, 1979. B LACKWELL D., Equivalent Comparison of Experiments , Annals of Mathematical Statistics, 24, 1953, p. 265-272.
118
BERNOULLI D., Specimen Theoriae Novae de Mensura Sortis , Commentarii academiae scientiarum imperialis petropolitanae, 5, 1738. D ABONI , M ONTESANO et L INES , Recent Developments in the Foundations of Utility and Risk Theory, Reidel, 1986. DEBREU G., Representation of a Preference Ordering by a Numerical Function , in Decision Processes, Thrall, Comb, Davis eds, Wiley, New York, 1970. D E F INETTI B., Fondamenti logici del raggionamento probabilistico , Bolettino dellunione matematica italiana, n 9, dcembre 1930. Voir aussi : Teoria delle probabilita. Sintesi introduttiva con appendice critica, Einaudi, Torino, 1970. ELLSBERG D., Risk, Ambiguity and the Savage Axioms , Quaterly Journal of Economics, vol. 75, 1961, p. 643, 669. G ILBOA I. et S CHMEIDLER D., Additive Representations of Non-Additive Measures and the Choquet Integral , mimo, Department of Economics, Ohio State University, 1990. K AHNEMAN D. et T VERSKY A., Prospect Theory : an Analysis of Decision Under Risk , Econometrica, 47, n 2, 1979, p. 263-291. KEENEY R. et RAIFFA H., Decisions with Multiple Objectives : Preferences and Value Trade-Offs, J. Wiley and Sons, New York, 1976.
KEYNES J.M., A Treatise on Probability, Mc Millan, Londres, 1921. LUCE R. et RAIFFA H., Games and Decisions, Wiley and Sons, New York, 1957. MARKOWITZ H., Portfolio Selection of Investments, Cowles Foundation, Yale University Press, 1970. MUNIER B., Risk, Decision and Rationality, Reidel, 1988. PRATT J., Risk Aversion in the Small and in the Large , Econometrica, 32, 1964, p. 122-136. QUIGGIN J., A Theory of Anticipated Utility , Journal of Economic Behavior and Organization, 3, n 4, 1982, p. 323-343. R AIFFA R., Decision Analysis, 1970 ; trad. : Analyse de la dcision, Dunod, Paris, 1973. RAMSEY F.P., Truth and Probability , 1926, in The Foundations of Mathematics and Other Logical Essays, dit par R.B. BRAITHWAITE, New York, Humanities Press, 1931, 1950. ROY B., Mthodologie multicritre daide la dcision, Economica, Paris, 1985. SAVAGE L.J., The Foundations of Statistics, J. Wiley and Sons, New York, 1954. S CHMEIDLER D., Subjective Probability and Expected Utility Without Additivity , Econometrica, 57, 1989, p. 571-587. VINCKE Ph., LAide multicritre la dcision, Ellipses, Paris, 1989. VON NEUMANN J. et MORGENSTERN O., Theory of Games
119
and Economic Behavior, Princeton University Press, 1944. W ALD A., Statistical Decision Functions, Wiley and Sons, New York, 1950. WAKKER P, Additives Representations of Preferences, a New
Foundation of Decision Analysis, Kluwer Academic Publishers, Dordrecht, 1989. Y AARI M.E., Dual Theory of Choice Under Uncertainty , Econometrica, 55, n 1, 1987, p. 95-115.
Table
Introduction ................................................................... I / Rationalit des choix : perspectives et origines de la thorie ............................................................... 1. Quelles thories de la dcision ? .......................... 2. Aperu historique de la reprsentation de lincertitude ........................................................ 3. Les fondateurs de la thorie de la dcision .......... 4. Les thories et les perspectives ............................. II / Comment formaliser un problme de dcision . 1. Un problme de dcision formalis : le choix de portefeuilles ........................................................ 2. Quelques exemples de problmes de dcision ...... 3. Arbres de dcision ................................................. 4. Comment formaliser lincertitude ......................... III / Comment rsoudre un problme de dcision .. 1. Analyse du problme ............................................. 2. Traitement statique du problme de dcision ....... 3. Traitement dynamique du problme de dcision .. Moralit ....................................................................... IV / 1. 2. 3. 4. Critres de dcision ............................................. Dcisions rationnelles sans incertitude ................. Reprsentation des prfrences par un critre ..... Critres classiques de dcisions dans lincertain . Prfrences et critres ........................................... 3 7 8 12 14 17 19 20 25 26 27 30 31 35 38 40 42 42 44 49 55 121
5. Aides multicritres la dcision ........................... 6. Agrgation des critres de diffrents dcideurs .... 7. Dynamique de dcisions ........................................ Conclusion .................................................................. V / Le critre de lutilit espre ............................... 1. Situations de risque et situations qui sy ramnent ................................................................. 2. Reprsentation des prfrences sur des loteries ... 3. Axiomes et existence du critre de lutilit espre .................................................................... 4. Extension de la thorie au cas dincertitude non probabilise ..................................................... 5. Applications de la thorie de lutilit espre ...... VI / Le risque ............................................................... 1. Aversion pour le risque, quivalent certain .......... 2. Indices daversion pour le risque .......................... 3. Mesures du risque .................................................. Conclusion .................................................................. VII / Dcisions statistiques ......................................... 1. Le problme de dcision en situation dincertitude statistique ................................................................ 2. Infrence statistique ............................................... Conclusion .................................................................. VIII / Gnralisation des critres et des thories .... 1. Les paradoxes ........................................................ 2. Les gnralisations ................................................ Conclusion .................................................................. Conclusion gnrale ...................................................... Repres bibliographiques .............................................
57 59 61 63 64 65 69 71 76 80 82 83 87 88 91 93 94 99 102 104 105 108 111 113 118
Collection R E P
dirige par JEAN-PAUL PIRIOU
avec BERNARD COLASSE, PASCAL COMBEMALE, FRANOISE DREYFUS, HERV HAMON, DOMINIQUE MERLLI et CHRISTOPHE PROCHASSON
Affaire Dreyfus (L), n 141, Vincent Duclert. Amnagement du territoire (L), n 176, Nicole de Montricher. Analyse financire de lentreprise (L), n 153, Bernard Colasse. Archives (Les), n 324, Sophie Cur et Vincent Duclert. Argumentation dans la communication (L), n 204, Philippe Breton. Bibliothques (Les), n 247, Anne-Marie Bertrand. Bourse (La), n 317, Daniel Goyeau et Amine Tarazi. Budget de ltat (Le), n 33, Maurice Basl. Calcul des cots dans les organisations (Le), n 181, Pierre Mvellec. Calcul conomique (Le), n 89, Bernard Walliser. Capitalisme historique (Le), n 29, Immanuel Wallerstein. Catgories socioprofessionnelles (Les), n 62, Alain Desrosires et Laurent Thvenot. Catholiques en France depuis 1815 (Les), n 219, Denis Pelletier. Chmage (Le), n 22, Jacques Freyssinet. Chronologie de la France au XXe sicle, n 286, Catherine Fhima. Collectivits locales (Les), n 242, Jacques Hardy. Commerce international (Le), n 65, Michel Rainelli. Comptabilit anglo-saxonne (La), n 201, Peter Walton.
Comptabilit en perspective (La), n 119, Michel Capron. Comptabilit nationale (La), n 57, Jean-Paul Piriou. Concurrence imparfaite (La), n 146, Jean Gabszewicz. Conditions de travail (Les), n 301, Michel Gollac et Serge Volkoff. Consommation des Franais (La) : 1. n 279 ; 2. n 280, Nicolas Herpin et Daniel Verger. Constitutions franaises (Les), n 184, Olivier Le Cour Grandmaison. Contrle budgtaire (Le), n 340, Nicolas Berland. Construction europenne (La), n 326, Guillaume Courty et Guillaume Devin. Contrle de gestion (Le), n 227, Alain Burlaud, Claude J. Simon. Cour des comptes (La), n 240, Rmi Pellet. Cot du travail et emploi, n 241, Jrme Gauti. Critique de lorganisation du travail, n 270, Thomas Coutrot. Culture de masse en France (La) : 1. 1860-1930, n 323, Dominique Kalifa. Dcentralisation (La), n 44, Xavier Greffe. Dmographie (La), n 105, Jacques Vallin. Dette des tiers mondes (La), n 136, Marc Raffinot. Dveloppement conomique de lAsie orientale (Le), n 172, ric Bouteiller et Michel Fouquin. DOM-TOM (Les), n 151, Grard Belorgey et Genevive Bertrand. Droit de la famille, n 239, Marie-France Nicolas-Maguin. Droits de lhomme (Les), n 333, Danile Lochak. Droit du travail (Le), n 230, Michle Bonnechre. Droit international humanitaire (Le), n 196, Patricia Buirette. Droit pnal, n 225, Ccile Barberger.
conomie bancaire, n 268, Laurence Scialom. conomie britannique depuis 1945 (L), n 111, Vronique Riches. conomie de lAfrique (L), n 117, Philippe Hugon. conomie de lautomobile, n 171, Jean-Jacques Chanaron et Yannick Lung. conomie de lenvironnement, n 252, Pierre Bontems et Gilles Rotillon. conomie de leuro, n 336, Agns Benassy-Qur et Benot Cur. conomie franaise 2002 (L), n 332, OFCE. conomie de linnovation, n 259, Dominique Guellec. conomie de lItalie (L), n 175, Giovanni Balcet. conomie de la connaissance (L), n 302, Dominique Foray. conomie de la culture (L), n 192, Franoise Benhamou. conomie de la drogue (L), n 213, Pierre Kopp. conomie de la presse, n 283, Patrick Le Floch et Nathalie Sonnac. conomie de la rglementation (L), n 238, Franois Lvque. conomie de la RFA (L), n 77, Magali Demotes-Mainard. conomie des tats-Unis (L), n 341, Hlne Baudchon et Monique Fouet. conomie des ingalits (L), n 216, Thomas Piketty. conomie des organisations (L), n 86, Claude Menard. conomie des relations interentreprises (L), n 165, Bernard Baudry. conomie des rseaux, n 293, Nicolas Curien. conomie des ressources humaines, n 271, Franois Stankiewicz. conomie des services (L), n 113, Jean Gadrey. conomie du droit, n 261, Thierry Kirat.
conomie du Japon (L), n 235, velyne Dourille-Feer. conomie du sport (L), n 309, Jean-Franois Bourg et Jean-Jacques Gouguet. conomie et cologie, n 158, Frank-Dominique Vivien. conomie informelle dans le tiers monde (L), n 155, Bruno Lautier. conomie mondiale 2002 (L), n 320, CEPII. conomie mondiale des matires premires (L), n 76, Pierre-Nol Giraud. conomie sociale (L), n 148, Claude Vienney. Emploi en France (L), n 68, Dominique Gambier et Michel Vernires. Employs (Les), n 142, Alain Chenu. Ergonomie (L), n 43, Maurice de Montmollin. thique dans les entreprises (L), n 263, Samuel Mercier. thique conomique et sociale, n 300, Christian Arnsperger et Philippe Van Parijs. tudiants (Les), n 195, Olivier Galland et Marco Oberti. Europe sociale (L), n 147, Daniel Lenoir. valuation des politiques publiques (L), n 329, Bernard Perret. FMI (Le), n 133, Patrick Lenain. Fonction publique (La), n 189, Luc Rouban. Formation professionnelle continue (La), n 28, Claude Dubar. France face la mondialisation (La), n 248, Anton Brender. Front populaire (Le), n 342, Frdric Monier. Grandes conomies europennes (Les), n 256, Jacques Mazier. Histoire de ladministration, n 177, Yves Thomas. Histoire de lAlgrie coloniale, 1830-1954, n 102, Benjamin Stora. Histoire de lAlgrie depuis lindpendance, 1. 1962-1988, n 316, Benjamin Stora.
Histoire de lEurope montaire, n 250, Jean-Pierre Patat. Histoire du fminisme, n 338, Michle Riot-Sarcey. Histoire de limmigration, n 327, Marie-Claude Blanc-Chalard. Histoire de lURSS, n 150, Sabine Dullin. Histoire de la guerre dAlgrie, 1954-1962, n 115, Benjamin Stora. Histoire de la philosophie, n 95, Christian Ruby. Histoire de la socit de linformation, n 312, Armand Mattelart. Histoire de la sociologie : 1. Avant 1918, n 109, 2. Depuis 1918, n 110, Charles-Henri Cuin et Franois Gresle. Histoire des tats-Unis depuis 1945 (L), n 104, Jacques Portes. Histoire des ides politiques en France au XIXe sicle, n 243, Jrme Grondeux. Histoire des ides socialistes, n 223, Nolline Castagnez. Histoire des thories de largumentation, n 292, Philippe Breton et Gilles Gauthier. Histoire des thories de la communication, n 174, Armand et Michle Mattelart. Histoire du Parti communiste franais, n 269, Yves Santamaria. Histoire du parti socialiste, n 222, Jacques Kergoat. Histoire du radicalisme, n 139, Grard Baal. Histoire du travail des femmes, n 284, Franoise Battagliola. Histoire politique de la IIIe Rpublique, n 272, Gilles Candar. Histoire politique de la IVe Rpublique, n 299, ric Duhamel. Histoire sociale du cinma franais, n 305, Yann Darr. Indice des prix (L), n 9, Jean-Paul Piriou.
Industrie franaise (L), n 85, Michel Husson et Norbert Holcblat. Inflation et dsinflation, n 48, Pierre Bezbakh. Introduction Keynes, n 258, Pascal Combemale. Introduction lconomie de Marx, n 114, Pierre Salama et Tran Hai Hac. Introduction lhistoire de la France au XXe sicle, n 285, Christophe Prochasson. Introduction la comptabilit dentreprise, n 191, Michel Capron et Michle Lacombe-Saboly. Introduction la macroconomie, n 344, Anne paulard et Aude Pommeret. Introduction la microconomie, n 106, Gilles Rotillon. Introduction la philosophie politique, n 197, Christian Ruby. Introduction au droit, n 156, Michle Bonnechre. Introduction aux sciences de la communication, n 245, Daniel Bougnoux. Introduction aux thories conomiques, n 262, Franoise Dubuf. Islam (L), n 82, Anne-Marie Delcambre. Jeunes (Les), n 27, Olivier Galland. Judasme (Le), n 203, Rgine Azria. Justice en France (La), n 116, Dominique Vernier. Lexique de sciences conomiques et sociales, n 202, Jean-Paul Piriou. Libralisme de Hayek (Le), n 310, Gilles Dostaler. Macroconomie. Investissement (L), n 278, Patrick Villieu. Macroconomie. Consommation et pargne, n 215, Patrick Villieu. Macroconomie financire : 1. Finance, croissance et cycles, n 307, 2. Crises financires et rgulation montaire, n 308, Michel Aglietta. Management de la qualit (Le), n 315, Michel Weill.
Management international (Le), n 237, Isabelle Huault. Marchs du travail en Europe (Les), n 291, IRES. Mathmatiques des modles dynamiques, n 325, Sophie Jallais. Mthode en sociologie (La), n 194, Jean-Claude Combessie. Mthodes en sociologie (Les) : lobservation, n 234, Henri Peretz. Mthodologie de linvestissement dans lentreprise, n 123, Daniel Fixari. Mtiers de lhpital (Les), n 218, Christian Chevandier. Mobilit sociale (La), n 99, Dominique Merlli et Jean Prvot. Modle japonais de gestion (Le), n 121, Annick Bourguignon. Modles productifs (Les), n 298, Robert Boyer et Michel Freyssenet. Modernisation des entreprises (La), n 152, Danile Linhart. Mondialisation de la culture (La), n 260, Jean-Pierre Warnier. Mondialisation de lconomie (La) : 1. Gense, n 198, 2. Problmes, n 199, Jacques Adda. Mondialisation et lemploi (La), n 343, Jean-Marie Cardebat. Monnaie et ses mcanismes (La), n 295, Dominique Plihon. Multinationales globales (Les), n 187, Wladimir Andreff. Notion de culture dans les sciences sociales (La), n 205, Denys Cuche. Nouvelle conomie (La), n 303, Patrick Artus. Nouvelle conomie chinoise (La), n 144, Franoise Lemoine. Nouvelle histoire conomique de la France contemporaine : 1. Lconomie prindustrielle (1750-1840), n 125, Jean-Pierre Daviet. 2. Lindustrialisation (1830-1914), n 78, Patrick Verley.
3. Lconomie librale lpreuve (1914-1948), n 232, Alain Lemnorel. 4. Lconomie ouverte (19481990), n 79, Andr Gueslin. Nouvelle microconomie (La), n 126, Pierre Cahuc. Nouvelle thorie du commerce international (La), n 211, Michel Rainelli. Nouvelles thories de la croissance (Les), n 161, Dominique Guellec et Pierre Ralle. Nouvelles thories du march du travail (Les), n 107, Anne Perrot. ONU (L), n 145, Maurice Bertrand. Organisation mondiale du commerce (L), n 193, Michel Rainelli. Outils de la dcision stratgique (Les) : 1 : Avant 1980, n 162, 2 : Depuis 1980, n 163, Jos Allouche et Graldine Schmidt. Personnes ges (Les), n 224, Pascal Pochet. Philosophie de Marx (La), n 124, tienne Balibar. Pierre Mends France, n 157, Jean-Louis Rizzo. Politique de la concurrence (La), n 339, Emmanuel Combe. Politique de lemploi (La), n 228, DARES. Politique trangre de la France depuis 1945 (La), n 217, Frdric Bozo. Politique financire de lentreprise (La), n 183, Christian Pierrat. Population franaise (La), n 75, Jacques Vallin. Population mondiale (La), n 45, Jacques Vallin. Postcommunisme en Europe (Le), n 266, Franois Bafoil. Presse des jeunes (La), n 334, Jean-Marie Charon. Presse magazine (La), n 264, Jean-Marie Charon. Presse quotidienne (La), n 188, Jean-Marie Charon.
Protection sociale (La), n 72, Numa Murard. Protectionnisme (Le), n 322, Bernard Guillochon. Protestants en France depuis 1789 (Les), n 273, Rmi Fabre. Psychanalyse (La), n 168, Catherine Desprats-Pquignot. Quel avenir pour nos retraites ?, n 289, Gal Dupont et Henri Sterdyniak. Question nationale au XIXe sicle (La), n 214, Patrick Cabanel. Rgime de Vichy (Le), n 206, Marc Olivier Baruch. Rgime politique de la Ve Rpublique (Le), n 253, Bastien Franois. Rgimes politiques (Les), n 244, Arlette Heymann-Doat. Rgionalisation de lconomie mondiale (La), n 288, Jean-Marc Siron. Revenu minimum garanti (Le), n 98, Chantal Euzby. Revenus en France (Les), n 69, Yves Chassard et Pierre Concialdi. Sant des Franais (La), n 330, Haut comit de la sant publique. Sciences de lducation (Les), n 129, ric Plaisance et Grard Vergnaud. Sexualit en France (La), n 221, Maryse Jaspard. Socit du risque (La), n 321, Patrick Peretti Watel. Sociologie de Durkheim (La), n 154, Philippe Steiner. Sociologie de Georg Simmel (La), n 311, Frdric Vandenberghe. Sociologie de larchitecture, n 314, Florent Champy. Sociologie de lart, n 328, Nathalie Heinich. Sociologie de lducation, n 169, Marlaine Cacouault et Franoise uvrard. Sociologie de lemploi, n 132, Margaret Maruani et Emmanule Reynaud. Sociologie de lorganisation sportive, n 281, William Gasparini.
Sociologie de la bourgeoisie, n 294, Michel Pinon et Monique Pinon-Charlot. Sociologie de la consommation, n 319, Nicolas Herpin. Sociologie de la prison, n 318, Philippe Combessie. Sociologie de Marx (La), n 173, Jean-Pierre Durand. Sociologie de Norbert Elias (La), n 233, Nathalie Heinich. Sociologie des cadres, n 290, Paul Bouffartigue et Charles Gadea. Sociologie des entreprises, n 210, Christian Thuderoz. Sociologie des mouvements sociaux, n 207, Erik Neveu. Sociologie des organisations, n 249, Lusin Bagla-Gkalp. Sociologie des relations internationales, n 335, Guillaume Devin. Sociologie des relations professionnelles, n 186, Michel Lallement. Sociologie des syndicats, n 304, Dominqiue Andolfatto et Dominique Labb. Sociologie du chmage (La), n 179, Didier Demazire. Sociologie du droit, n 282, velyne Sverin. Sociologie du journalisme, n 313, Erik Neveu. Sociologie du sport, n 164, Jacques Defrance. Sociologie du travail (La), n 257, Sabine Erbs-Seguin. Sociologie conomique (La), n 274, Philippe Steiner. Sociologie en France (La), n 64, ouvrage collectif. Sociologie historique du politique, n 209, Yves Dloye. Sociologie de la ville, n 331, Yankel Fijalkow. Sondages dopinion (Les), n 38, Hlne Meynaud et Denis Duclos. Stratgies des ressources humaines (Les), n 137, Bernard Gazier.
Syndicalisme en France depuis 1945 (Le), n 143, Ren Mouriaux. Syndicalisme enseignant (Le), n 212, Bertrand Geay. Systme ducatif (Le), n 131, Maria Vasconcellos. Systme montaire international (Le), n 97, Michel Lelart. Taux de change (Les), n 103, Dominique Plihon. Taux dintrt (Les), n 251, A. Benassy-Qur, L. Boone et V. Coudert. Taxe Tobin (La), n 337, Yves Jegourel. Tests dintelligence (Les), n 229, Michel Huteau et Jacques Lautrey. Thorie de la dcision (La), n 120, Robert Kast. Thories conomiques du dveloppement (Les), n 108, Elsa Assidon. Thorie conomique noclassique (La) : 1. Microconomie, n 275, 2. Macroconomie, n 276, Bernard Guerrien. Thories de la monnaie (Les), n 226, Anne Lavigne et Jean-Paul Pollin. Thories des crises conomiques (Les), n 56, Bernard Rosier. Thories du salaire (Les), n 138, Bndicte Reynaud. Thories sociologiques de la famille (Les), n 236, Catherine CicchelliPugeault et Vincenzo Cicchelli. Tiers monde (Le), n 53, Henri Rouill dOrfeuil. Travail des enfants dans le monde (Le), n 265, Bndicte Manier. Travail et emploi des femmes, n 287, Margaret Maruani. Travailleurs sociaux (Les), n 23, Jacques Ion et Bertrand Ravon.
Union europenne (L), n 170, Jacques Lonard et Christian Hen.
Dictionnaires R E P
Dictionnaire de gestion, lie Cohen. Dictionnaire danalyse conomique, microconomie, macroconomie, thorie des jeux, etc., Bernard Guerrien.
Guides R E
Lart de la thse, Comment prparer et rdiger une thse de doctorat, un mmoire de DEA ou de matrise ou tout autre travail universitaire, Michel Beaud. Les ficelles du mtier. Comment conduire sa recherche en sciences sociales, Howard S. Becker. Guide des mthodes de larchologie, Jean-Paul Demoule, Franois Giligny, Anne Lehorff, Alain Schnapp. Guide du stage en entreprise, Michel Villette. Guide de lenqute de terrain, Stphane Beaud, Florence Weber. Manuel de journalisme. crire pour le journal, Yves Agns. Voir, comprendre, analyser les images, Laurent Gervereau.
Manuels R E P
Analyse macroconomique 1. Analyse macroconomique 2. 17 auteurs sous la direction de Jean-Olivier Hairault. Une histoire de la comptabilit nationale, Andr Vanoli.
Composition Facompo, Lisieux (Calvados) Achev dimprimer en juin 2002 sur les presses de limprimerie Campin, Tournai (Belgique) Dpt lgal : juin 2002

La Theorie de La Decision

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

La Theorie de La Decision

Uploaded by

Copyright:

Available Formats

Robert Kast

I / Rationalit des choix : perspectives et origines de la thorie

II / Comment formaliser un problme de dcision

III / Comment rsoudre un problme de dcision

ARBRE DE DCISION DU PROBLME DEXPLOITATION MINIRE

1 S U[ci(d)]) n i=1 o U tait la fonction logarithme Critre de Bernoulli : B(d) =

Critre de lesprance mathmatique : E(d) = S pi ci(d)

Critre de lutilit espre : V(d) = S pi U[ci(d)]

Nombre de votants En tte En second En dernier

V / Le critre de lutilit espre

La loterie compose 1/2 l + 1/2 l est dfinie par :

VII / Dcisions statistiques

VIII / Gnralisation des critres et des thories

Esprance subjective r du gain F Esprance du gain r

Esprance subjective r de lutilit F Esprance de lutilit r

Intgration subjective non linaire de lutilit F Intgration non linaire de lutilit

57 59 61 63 64 65 69 71 76 80 82 83 87 88 91 93 94 99 102 104 105 108 111 113 118

Union europenne (L), n 170, Jacques Lonard et Christian Hen.

You might also like