Recherchez sur tout Techno-Science.net
       
Techno-Science.net : Suivez l'actualité des sciences et des technologies, découvrez, commentez
Catégories
Techniques
Sciences
Encore plus...
Techno-Science.net
Partenaires
Organismes
 CEA
 ESA
Sites Web
Photo Mystérieuse

Que représente
cette image ?
 A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | +
Théorie des jeux
Le dilemme du prisonnier est une célèbre illustration en théorie des jeux d'un jeu à somme non nulle.
Le dilemme du prisonnier est une célèbre illustration en théorie des jeux d'un jeu à somme non nulle.

La théorie des jeux constitue une approche mathématique de problèmes de stratégie tels qu’on en trouve en recherche opérationnelle (La recherche opérationnelle (aussi appelée aide à la décision) peut être définie comme l'ensemble des méthodes et techniques rationnelles d'analyse et de synthèse des phénomènes...) et en économie. Elle étudie les situations où les choix de deux protagonistes - ou davantage - ont des conséquences pour l’un comme pour l’autre. Le jeu peut être à somme nulle (ce qui est gagné par l’un est perdu par l’autre, et réciproquement) ou, plus souvent, à somme non-nulle. Un exemple de jeu à somme nulle est celui de la mourre, ou celui du pierre-feuille-ciseaux.

Historique

Trois grandes étapes

  • La théorie des jeux initiale, de John von Neumann (John von Neumann, mathématicien et physicien américain d'origine hongroise, a apporté d'importantes contributions tant en mécanique quantique, qu'en analyse fonctionnelle, en théorie des ensembles, en informatique, en...) et Oskar Morgenstern (Oskar Morgenstern (Görlitz 1902 - Princeton 1977), mathématicien et économiste américain d'origine allemande, est professeur à l'université de Vienne de 1929 à 1938. Il émigre alors aux États-Unis,...), utilisait des cas de choix qui restaient les mêmes au cours du temps (Le temps est un concept développé par l'être humain pour appréhender le changement dans le monde.), et qui étaient à somme nulle.
  • Les jeux à somme non-nulle furent étudiés ensuite, et utilisés dans la théorie (Le mot théorie vient du mot grec theorein, qui signifie « contempler, observer, examiner ». Dans le langage courant, une théorie est une idée ou une connaissance spéculative, souvent basée sur l’observation ou...) de la négociation (La négociation est la recherche d'un accord, centrée sur des intérêts matériels ou des enjeux quantifiables entre deux ou plusieurs interlocuteurs (on...). On découvrit que leur étude permettait d’aborder de façon quantitative des questions jusque là restées d’ordre philosophique, comme la morale.
  • On s’intéressa ensuite aux jeux où le choix se posait en termes différents à chaque étape, que l’on nomma un temps théorie des jeux combinatoires. Celle-ci est plutôt aujourd’hui, pour des raisons de commodité et de communauté de concepts, considérée comme une branche soit de la théorie des graphes (Le terme de graphe désigne en mathématiques une opération d'application. Il possède deux acceptions :), soit de ce qu’on nomme l’intelligence artificielle (L'intelligence artificielle ou informatique cognitive est la « recherche de moyens susceptibles de doter les systèmes informatiques de capacités...).

Détails

Bien qu’ayant fait l’objet (De manière générale, le mot objet (du latin objectum, 1361) désigne une entité définie dans un espace à trois dimensions, qui a une fonction précise, et qui peut être désigné par une étiquette verbale. Il est défini par les relations...) de résultats assez anciens, à partir des travaux de Blaise Pascal (Blaise Pascal (19 juin 1623, Clermont (Auvergne) - 19 août 1662, Paris) est un mathématicien et physicien, philosophe, moraliste et théologien français.) sur la question des parties qui a donné une première intuition des probabilités et de l’espérance mathématique (L'espérance mathématique est une valeur numérique permettant de mesurer le degré d'équité d'un jeu de hasard. Elle est égale à la somme des gains (et des pertes) pondérés par la...), et de son étonnant pari. La théorie des jeux n’est devenue une branche importante des mathématiques qu’à partir des années 1940, et plus spécialement après la publication en 1944 de la Théorie des jeux et du comportement économique (Theory of Games and Economic Behavior) par John von Neumann et Oskar Morgenstern. Cet ouvrage fondateur détaillait la méthode vue (La vue est le sens qui permet d'observer et d'analyser l'environnement par la réception et l'interprétation des rayonnements lumineux.) plus haut de résolution des jeux à somme nulle.

La théorie rencontra lors de sa présentation une vive opposition de la part des états-majors : si ceux-ci acceptaient volontiers l’usage (L’usage est l'action de se servir de quelque chose.) de tirages au hasard (Dans le langage ordinaire, le mot hasard est utilisé pour exprimer un manque efficient, sinon de causes, au moins d'une reconnaissance de cause à effet d'un...) dans les jeux de Kriegspiel des écoles militaires, l’idée de remettre au sort, au nom des stratégies mixtes le fait d’escorter réellement ou non tel ou tel convoi ( Un convoi est un ensemble de véhicules terrestres ou maritimes, généralement non attelés, circulant ensemble vers une destination commune ; un convoi funèbre est le cortège formé par le corbillard suivi des proches du défunt...) n’enthousiasmait guère ceux qui, issus du terrain et sachant ce qu’étaient des pertes humaines, jugeaient le procédé pour le moins cavalier.

Vers 1950, John Nash (John Nash (1752 à Londres - 13 mai 1835 à Cowes) est un architecte britannique.) a été le premier à présenter une définition (Une définition est un discours qui dit ce qu'est une chose ou ce que signifie un nom. D'où la division entre les définitions réelles et les définitions nominales.) d’une stratégie (La stratégie - du grec stratos qui signifie « armée » et ageîn qui signifie « conduire » - est :) optimale pour un jeu à plusieurs joueurs, dite équilibre de Nash (John Nash a défini une situation d'interaction comme stable si aucun agent n'a intérêt à changer sa stratégie. La formalisation de ce constat simple a été essentielle pour la théorie des jeux.). Ce résultat tardif génial a été raffiné par Reinhard Selten ; cela leur a valu le "prix Nobel d'économie" en 1994 pour leurs travaux sur la théorie des jeux, avec John Harsanyi (John Charles Harsanyi (29 Mai 1920 - 9 Août 2000) est un économiste hongrois, naturalisé américain. Il a contribué au développement de la théorie des jeux en...) qui avait travaillé sur les jeux en information incomplète.

L’association entre jeu et nombre (La notion de nombre en linguistique est traitée à l’article « Nombre grammatical ».) par Conway a été établie dans les années 1970.

Grandes lignes

La théorie des jeux étudie les comportements - prévus, réels, ou tels que justifiés a posteriori - d’individus face à des situations d’antagonisme, et cherche à mettre en évidence des stratégies optimales. Des situations apparemment très différentes peuvent parfois être représentées avec des structures d’incitation comparables, et constituant autant d’exemple d’un même jeu.

La théorie des jeux non coopératifs s’applique à des situations où des joueurs jouent sciemment alors qu’ils ont des buts au moins partiellement antagonistes (elle ne s’applique donc pas aux situations de pleine coopération, mais à la compétition ou à sa variante plus fréquente que l’on nomme la coopétition). Elle ne concerne pas les situations de jeu contre une nature dépourvue de buts, ne dressant pas de plans, situations où il y aurait donc en fait qu’un seul joueur.

Types de jeux

La théorie des jeux classifie les jeux en catégories en fonction de leurs approches de résolution. Les catégories les plus ordinaires sont :

Jeux coopératifs et compétitions

Les jeux coopératifs sont les jeux dans lesquels on cherche la meilleure situation (En géographie, la situation est un concept spatial permettant la localisation relative d'un espace par rapport à son environnement proche ou non. Il inscrit un lieu dans un...) pour les joueurs sur des critères tels que la justice. On considère qu'ensuite les joueurs vont jouer ce qui aura été choisi, il s'agit d'une approche normative. Par exemple, à un croisement, chacun des deux automobilistes a la possibilité de passer (Le genre Passer a été créé par le zoologiste français Mathurin Jacques Brisson (1723-1806) en 1760.) ou non. Le code de la route (Le mot « route » dérive du latin (via) rupta, littéralement « voie brisée », c'est-à-dire creusée dans la roche, pour ouvrir le chemin.) impose sa stratégie à chacun des joueurs par une signalisation. Ces jeux font l'objet d'une faible littérature étant donné leur relative simplicité.

Théorie de la négociation

La théorie moderne de la négociation est articulée sur le fait qu’une négociation constitue un jeu à somme non-nulle. L’art de la négociation consiste donc moins à faire céder l’interlocuteur sur la ligne principale d’opposition (un prix, par exemple) qu’à trouver des arrangements extérieurs à cette ligne qui apporteront beaucoup à l’un sans coûter trop cher à l’autre (stratégies dites Gagnant-gagnant ou win-win).

Depuis longtemps, tout (Le tout compris comme ensemble de ce qui existe est souvent interprété comme le monde ou l'univers.) cela était utilisé dans les négociations :

  • " Je ne peux accepter ce coût FOB, mais puis le considérer en CIF. "
  • "Si je vous en prends deux, m’accordez-vous 5% de remise ?"
  • "Je vous en offre tant, mais il faut vous décider tout de suite."

voire entre particuliers :

  • "Je veux bien te le laisser à ce prix-là, mais tu offres le café" !

" Coopétition "

La coopétition est la collaboration des services de recherche (La recherche scientifique désigne en premier lieu l’ensemble des actions entreprises en vue de produire et de développer les connaissances scientifiques. Par extension métonymique, la recherche...) et développement des firmes qui se livrent par ailleurs une guerre féroce en matière (La matière est la substance qui compose tout corps ayant une réalité tangible. Ses trois états les plus communs sont l'état solide, l'état liquide,...) commerciale.

Jeux de stratégie à somme nulle et non nulle

  • Les jeux à somme nulle sont tous les jeux où la somme "algébrique" des gains des joueurs est constante. Ce que gagne l’un est nécessairement perdu par un autre, l'enjeu est la répartition du total ( Total est la qualité de ce qui est complet, sans exception. D'un point de vue comptable, un total est le résultat d'une addition, c'est-à-dire une somme. Exemple : "Le total des...) fixé, qu'on peut supposer réparti à l'avance, ce qui ramène au cas où les gains sont vraiment nuls (d'où la dénomination). Les échecs ou le poker sont des jeux à somme nulle car les gains de l’un sont très exactement les pertes de l’autre.
  • Les situations d’affaires, la vie (La vie est le nom donné :) politique ou le dilemme du prisonnier sont des jeux à somme non-nulle car certaines issues sont globalement plus profitables pour tous, ou plus dommageables pour tous. On a commencé historiquement par étudier les jeux à somme nulle, plus simples. Au-delà de la matière-énergie avec la loi de la conservation de la somme algébrique nulle, le jeu à somme non-nulle est concevable, dans lequel le gain de l'un peut profiter à l'autre. Tel est le cas avec l'information, la communication (La communication concerne aussi bien l'homme (communication intra-psychique, interpersonnelle, groupale...) que l'animal (communication intra- ou inter- espèces) ou la machine (télécommunications, nouvelles...) et l'apprentissage (L’apprentissage est l'acquisition de savoir-faire, c'est-à-dire le processus d’acquisition de pratiques, de connaissances,...) où l'information est une des trois composantes fondamentales avec la matière et l'énergie (Dans le sens commun l'énergie désigne tout ce qui permet d'effectuer un travail, fabriquer de la chaleur, de la lumière, de produire un mouvement.). L'exemple illustratif le plus simple est l'information génétique (La génétique (du grec genno γεννώ = donner naissance) est la science qui étudie l'hérédité et les gènes.) de l'ADN transcrite sur l'ARN pour être "lue", "traduite" et organiser la matière et l'énergie biologiques. En sciences sociales, on cite parfois l'idéologie d'harmonie industrielle du Japon moderne (coalition tripartite capital-travail-gouvernement) comme exemple de jeu à somme non nulle. Dans le commerce international, l'exemple de ce jeu à somme non nulle est la concurrence coopérative des Tigres asiatiques et Dragons asiatiques où le gain de l'un profite aux autre, dans la foulée du miracle japonais des années 1950-1960 qui a ouvert les portes à la Corée, à Hong Kong (Devise nationale : Sapientia et Virtus), à Singapour, à Taiwan et au Viêt Nam, dans une coévolution technico-commerciale.[réf. nécessaire]

En écologie, la coévolution est un autre exemple, dans la nature, de la somme non nulle où le changement de l'un facilite et fait la promotion du changement de l'autre.

On pourrait croire qu'il suffirait pour ramener un jeu à somme non-nulle à un jeu à somme nulle d'y ajouter un joueur simplet, le " tableau ", sorte de non-player character qui compenserait les pertes nettes des joueurs. Ce n’est pas le cas : un joueur est censé défendre rationnellement ses intérêts dans la mesure de ses possibilités; cet ajout formel, introduisant une dissymétrie entre les " vrais " joueurs et le " tableau ", complique l'analyse et celle-ci y perd plus qu’elle n’y gagne.

Jeu synchrone ou asynchrone

Dans un jeu synchrone, les joueurs décident de leur coup simultanément, sans savoir ce que les autres jouent. Dans un jeu asynchrone (ou alternatif, à deux joueurs), ils jouent les uns après les autres, en disposant à chaque fois de l’information sur le coup de l’adversaire.

Jeux répétés

La répétition d’un jeu, avec connaissance des résultats intermédiaires, change souvent fondamentalement son déroulement (les meilleurs coups et la conclusion).

Par exemple, il peut être utile de prendre ponctuellement le risque de perdre " pour voir ", tester les autres joueurs, et mettre en place des stratégies de communication par les coups joués (à défaut d’autre moyen de communication).

Il se développe également des phénomènes de réputation qui vont influencer les choix stratégiques des autres joueurs. Dans le dilemme du prisonnier, le fait de savoir qu’on va jouer plusieurs fois avec un dur qui n’avoue jamais mais se venge cruellement, ou avec un lâche qui avoue toujours, change radicalement la stratégie optimale.

Enfin, curieusement, le fait que le nombre total de parties soit connu à l’avance ou non peut avoir des effet importants sur le résultat, l’ignorance du nombre de coups rapprochant du jeu avec un nombre infini (Le mot « infini » (-e, -s ; du latin finitus, « limité »), est un adjectif servant à qualifier quelque chose qui n'a pas de limite en...) de coup, alors que sa connaissance rapproche au contraire du jeu à un seul coup (et ce, aussi grand que soit le nombre de coups !)

Information complète, information parfaite

On dit qu'un jeu est à information complète si chaque joueur connaît lors de la prise de décision :

  • ses possibilités d'action
  • les possibilités d'action des autres joueurs
  • les gains résultants de ces actions
  • les motivations des autres joueurs

Par ailleurs on parle de jeu à information parfaite dans le cas de jeu à mécanisme séquentiel, où chaque joueur a connaissance en détail de toutes les actions effectuées avant son choix.

Les échecs sont à information complète et parfaite. Du fait de l'incertitude sur les gains (cartes de l'adversaire cachées), le poker est à information incomplète. La phase (Le mot phase peut avoir plusieurs significations, il employé dans plusieurs domaines et principalement en physique :) d'enchères vérifie les propriétés d'information parfaite, mais en assimilant le tirage des cartes à l'action d'un joueur fictif (souvent appelé Nature), la théorie des jeux exclut en général le poker des jeux à information parfaite.

Les situations réelles sont rarement en information complète, et ce cas ne sert souvent qu’aux approximations confiantes.

Les jeux en information incomplete sont des situations stratégiques où l'une des conditions n'est pas vérifiée. Ce peut être par l'intervention du hasard au cours du jeu (cas fréquent dans les jeux de société), ou parce qu'une des motivations d'un acteur (Un acteur est un artiste qui incarne un personnage dans un film, dans une pièce de théâtre, à la télévision, à la radio, ou même dans des spectacles de rue. En plus de l'interprétation...) est cachée (domaine important pour l'application de la théorie des jeux à l'économie).

Les jeux en information à la fois imparfaite et incomplète sont de loin les plus complexes. Dans ces jeux certains joueurs peuvent disposer d'informations propres sur la manière dont le hasard va intervenir dans l'issue du jeu (une meilleure connaissance des probabilités d'occurrence de tel ou tel évènement qui va affecter le cours du jeu, par exemple). Les jeux de guerre (war games) relèvent typiquement de cette catégorie, l'aléa sur la réussite d'un engagement entre corps de troupes dépendant d'informations non partagées par les adversaires sur les rapports de force (Le mot force peut désigner un pouvoir mécanique sur les choses, et aussi, métaphoriquement, un pouvoir de la volonté ou encore une vertu morale « cardinale » équivalent au courage (cf. les...) entre ces troupes.

Pour être complet, il convient aussi de distinguer les jeux à mémoire parfaite et à mémoire imparfaite. Les jeux à mémoire "parfaite" sont des situations où chaque joueur peut se rappeler à tout moment de la suite de coups qui ont été joués précédemment, au besoin (Les besoins se situent au niveau de l'interaction entre l'individu et l'environnement. Il est souvent fait un classement des besoins humains en trois...) en notant au fur et à mesure les coups joués. Les jeux à mémoire "imparfaite" supposent une sorte d'amnésie (L'amnésie est la perte partielle ou totale de la mémoire.) de la part des joueurs. Les jeux de guerre sont des exemples de jeux à mémoire imparfaite si les commandements de zones opérationnelles ne parviennent pas à communiquer entre eux ou avec l'État-Major et donc n'ont pas trace (TRACE est un télescope spatial de la NASA conçu pour étudier la connexion entre le champ magnétique à petite échelle du Soleil et la géométrie du plasma coronal,...) des mouvements déjà effectués par les troupes amies lorsqu'elles doivent décider de leurs propres mouvements. Un jeu typique est le 21 ou blackjack : la convention selon laquelle la suite de paquets de cartes n’est pas battue entre deux jeux peut donner un léger avantage au joueur dès lors que celui-ci prend en compte cette information partielle.

Jeux déterminés

Les jeux de Nim forment un cas particulier de jeu à somme nulle, sans intervention du hasard et dans la plupart des cas à nombre de situations finies. Dans leur cas particulier, la théorie des graphes fournit un outil (Un outil est un objet finalisé utilisé par un être vivant dans le but d'augmenter son efficacité naturelle dans l'action. Cette augmentation se traduit par la simplification...) plus utile que la théorie des jeux à proprement parler. La notion de noyau du jeu (ensemble des nœuds depuis lesquels la victoire est assurée si l’on y parvient en cours de jeu et qu’on joue (La joue est la partie du visage qui recouvre la cavité buccale, fermée par les mâchoires. On appelle aussi joue le muscle qui sert principalement à ouvrir et fermer la...) de façon optimale ensuite) y est caractérisée.

Représentations des jeux

Forme extensive

Dans tous les jeux, les décisions peuvent être représentés par un arbre (Un arbre est une plante terrestre capable de se développer par elle-même en hauteur, en général au delà de sept mètres. Les arbres acquièrent...), dont chaque nœud est associé au joueur qui décide. Chaque option constitue une branche. Les gains de tous sont associés aux terminaisons, lorsqu’il est possible de les représenter (fins de partie). Un joueur n’a toutefois pas besoin de savoir comment il est parvenu à un nœud : seul compte l' état présent du jeu, et les positions recherchées dans le futur. Lorsque certains mouvements ne sont autorisés qu’après un événement donné, cet événement n’est qu’un des éléments à matérialiser dans l’état présent du jeu plutôt que dans une historique.

Une forme extensive est un arbre de décision décrivant les actions possibles des joueurs à chaque étape du jeu, la séquence de tours de jeu des joueurs ainsi que l'information dont ils disposent à chaque étape pour prendre leur décision. Cette information est représentée sous forme d'ensembles d'information. Les ensembles d'information forment une partition des nœuds de l'arbre, chaque ensemble (En théorie des ensembles, un ensemble désigne intuitivement une collection d’objets (les éléments de l'ensemble), « une multitude qui peut être comprise...) correspondant à l'ensemble des nœuds non distinguables par le joueur à une étape du jeu. Si ces ensembles sont des singletons, c’est-à-dire qu'ils ne contiennent qu'un seul nœud de l'arbre du jeu, le jeu est en information parfaite : chaque joueur peut savoir à tout moment où il se situe dans l'arbre du jeu. Dans le cas contraire, le jeu est à information imparfaite. L'information incomplète est représentée sous la forme d'un joueur non stratégique : la "Nature", joueur qui prend aléatoirement certaines décisions à telle ou telle étape du jeu, orientant la suite du jeu vers un certain sous-arbre de l'arbre du jeu.

Forme normale ( Forme normale (bases de données relationnelles) Forme normale (lambda-calcul) En calcul des propositions: formes normales conjonctives et formes normales disjonctives...)

Définition

Article principal : Jeu sous forme normale

Un jeu sous forme normale est la donnée (Dans les technologies de l'information (TI), une donnée est une description élémentaire, souvent codée, d'une chose, d'une transaction d'affaire, d'un événement, etc.) de l'ensemble des joueurs, de l'ensemble des stratégies pour chaque joueur et des paiements associés à toute combinaison (Une combinaison peut être :) possible de stratégies.

Représentation tabulaire

Si le jeu ne comporte que deux joueurs et un nombre raisonnablement restreint de stratégies possibles, on peut représenter le jeu sous la forme d'un tableau (Tableau peut avoir plusieurs sens suivant le contexte employé :) nommé matrice des paiements.

Il s'agit d'un tableau à double-entrée qui énumère sur chaque côté les stratégies possibles des joueurs respectifs. Dans la case à la croisée (Croisée peut désigner :) de deux stratégies, on note le couple de gains des deux joueurs. C’est ce qu’on nomme (par convention) la matrice des paiements.

Si le jeu est à somme nulle et à deux joueurs, alors on peut ne noter que les gains du premier joueur : ceux du second sont directement opposés. Le tableau de gains se ramène alors à une matrice.

On peut, avec un nombre réduit de stratégies, tenter de représenter avec une matrice un jeu à trois ou quatre joueurs, mais cela pose souvent plus de problèmes d’interprétation et de lecture que ça n’apporte de réponses.

Résolution d’un jeu à somme nulle

1\2 (A) (B) (C)
(a) 30 -10 20
(b) 10 20 -20

Les deux joueurs décident simultanément de leur stratégie.

Raisonnements intuitifs

Le joueur (1) a le choix entre (a) et (b). Il peut se dire : " La stratégie (b) peut me faire perdre 20, et au plus gagner 20. En revanche, avec la stratégie (a) je peux gagner jusqu’à 30, et au pire perdre 10. " Ce type de réflexion correspond aux stratégies " Maxi-Max " (maximiser le gain possible sans considération pour les pertes possibles) et " Maxi-Min " (maximiser le pire résultat possible), qui en l’occurrence donne le même choix : l’option a.

De même, le joueur (2), touchant l’opposé ( En mathématique, l'opposé d’un nombre est le nombre tel que, lorsqu’il est à ajouté à n donne zéro. En botanique, les organes d'une plante sont...) des valeurs du tableau, qui réfléchirait de même verrait que Maxi-Min élimine (A) à cause de la perte maximum de 30, mais ne permet pas de trancher entre (B) et (C), où la perte maximum est de 20. Et que Maxi-Max classe les trois options par ordre croissant : A (meilleur résultat possible : -10) B (+10), C (+20). Cela le pousserait à choisir (C).

Le résultat serait alors a-C : le joueur (2) perd 20 au profit de (1).

Mais le joueur (2) peut aussi essayer d’anticiper le choix de (1). Il voit ainsi que si (1) joue le maximin, lui-même a intérêt à choisir (B), ce qui lui permet de gagner 10.

Et si à son tour le joueur 1 anticipe cette déviation et préfère faire (b) pour alors toucher (Le toucher, aussi appelé tact ou taction, est l'un des cinq sens de l'homme ou de l'animal, essentiel pour la survie et le développement des êtres vivants, l'exploration, la...) 20 ? Alors (2) devrait à nouveau choisir (C) : nous voilà revenu au point (Graphie) de départ !

La notion de stratégie et d’équilibre mixte

Aucune réponse ne s’impose. Comment s’en sortir ?

Une première réponse possible est de jouer au hasard, avec une probabilité (La probabilité (du latin probabilitas) est une évaluation du caractère probable d'un évènement. En mathématiques, l'étude des probabilités est un sujet de grande importance donnant lieu à de...) égale pour tous les coups possibles, sans se préoccuper des gains. Cela n’apparaît pas optimum, il y a certainement mieux à faire.

Une seconde ( Seconde est le féminin de l'adjectif second, qui vient immédiatement après le premier ou qui s'ajoute à quelque chose de nature identique. La seconde est une unité de mesure du temps. La seconde d'arc est une...) stratégie est de tenter d’attribuer a priori une probabilité aux actions de l’adversaire, et d’opter pour la meilleure réponse (En théorie des jeux, la meilleure réponse est la stratégie ou l'ensemble de stratégies qui produisent le résultat immédiat le...) adaptée. Ainsi, si (2) attribue une probabilité 50/50 aux options de (1), il doit jouer aussi à 50/50 (B) et (C). Mais l’adversaire n’est pas un dé qui se comporte au hasard : lui aussi va anticiper. Si c’est (1) qui réfléchit, il voit bien qu’il est absurde de supposer que (2) va jouer (A) dans un tiers des cas. Là encore il y a certainement mieux à faire.

Introduction de probabilités

John von Neumann est parvenu à sortir de cet imbroglio à l’aide des probabilités. Au lieu de décider fermement d’une action, chaque joueur va agir de façon probabiliste, chaque coup étant choisi par hasard avec un processus aléatoire (par exemple un jeu de dès, ou une table de valeurs aléatoires). Il est clair que l’adversaire ne peut pas deviner notre comportement si nous ne le connaissons pas d’avance nous-mêmes !

Reste à déterminer quelle répartition de probabilité va donner le meilleur résultat : c’est idéalement celle qui maximisera le gain espéré indépendamment de la stratégie de l’adversaire. Cela revient à se ramener à un problème de programmation linéaire (En mathématiques, les problèmes de programmation linéaire (PL) sont des problèmes d'optimisation où la fonction objectif et les contraintes sont toutes linéaires. Néanmoins, la plupart des résultats présentés ici...), où les inconnues sont les probabilités Pi à donner à chaque option Oi, avec une unique solution pour chaque joueur dans tous les jeux à deux joueurs et à somme nulle.

Dans le cas ci-dessus, le joueur 1 hésitera entre (a) et (b) en choisissant (a) dans 4 cas sur 7 soit 57 % des cas. Le joueur (2) n’optera jamais pour (A), mais oscillera entre (B) et (C) en choisissant (B) dans 4 cas sur 7, soit 57 % des cas. Le joueur 1 pourra espérer un gain moyen à chaque partie de 20/7, soit 2,85.

Ces calculs résultent de la résolution du système linéaire en introduisant le Lagrangien (Le lagrangien d'un système dynamique, dont le nom vient de Joseph Louis Lagrange, est une fonction des variables dynamiques qui décrit de manière concise les équations du mouvement du système....).

Point-selle

Il est remarquable que ce choix stratégique reste le meilleur même si l’adversaire en a connaissance.

On est ainsi amené à introduire le concept intéressant, dans les stratégies mixtes, de point-selle : il s’agit du choix de probabilité optimal pour les deux joueurs : celui qui s’en écarte se pénalise du même coup (même si cette stratégie lui est défavorable, car les autres le seront encore plus). Le thème avait été entrevu par Auguste Detoeuf : Si vous n’avez qu’un risque sur mille d’être convaincu de mensonge, ne mentez pas plus d’une fois sur mille, car cette fois-là annulera à elle seule toutes les autres où vous avez dit la vérité. Detoeuf, industriel responsable, évite sciemment de préciser qu’il y aura parfois même avantage à mentir effectivement une fois sur mille plutôt que dire toujours la vérité.

Les stratégies mixtes sont empiriquement bien connues des diplomates et des joueurs de poker, qui savent les bénéfices potentiels obtenus en cachant leurs plans, même quand il y en a un qui semble évident. Cette idée frappera Philip K. Dick qui lui consacrera son roman Loterie solaire.

Applications

La théorie des jeux s'applique à certaines situations du domaine de l'économie, celles où existent un nombre réduit de compétiteurs (oligopoles). Elle cherche les stratégies rationnelles dans des situations où les gains d’un acteur dépendent non seulement de son comportement et des conditions de marché, mais aussi de celui des autres intervenants, lesquels peuvent poursuivre des objectifs différents ou contradictoires. On lui trouve aussi des applications en sciences politiques ou en stratégie militaire.

Les résultats peuvent être appliqués à des divertissements (comme le jeu télévisé " Friend or Foe " sur une chaîne (Le mot chaîne peut avoir plusieurs significations :) câblée spécialisée aux États-Unis, Game Show Network) ou à des considérations plus poignantes :

  • la crise des missiles de Cuba ;
  • les politiques de constitution de convois de bateaux en temps de guerre ;
  • la façon de gérer un coup de surprise politique (Nasser à Suez, de Gaulle au Québec, Ieltsine lors du putsch, annonces électorales...) ou marketing ;
  • la lutte contre le terrorisme.

Le Professeur Thomas Schelling (Thomas Crombie Schelling (14 avril 1921 - ) est un économiste américain, ainsi qu'un professeur de politique étrangère, de sécurité nationale, de stratégie nucléaire et de contrôle des armes à la School of Public Policy de...), "prix Nobel d'économie" 2005, s'est spécialisé dans l'explication des diverses stratégies utilisées (à utiliser) dans les conflits internationaux, tels la guerre froide et la guerre nucléaire (Le terme d'énergie nucléaire recouvre deux sens selon le contexte :) (dissuasion..)

Albert W. Tucker a par exemple diffusé de nombreuses interprétations du dilemme du prisonnier dans la vie courante. Des biologistes ont utilisé la théorie des jeux pour comprendre et prévoir les résultats de l’évolution, en particulier la notion d’équilibre évolutivement stable introduit par John Maynard Smith dans son essais La théorie des jeux et l’évolution de la lutte (Game Theory and the Evolution of Fighting). Voir aussi son livre Evolution and the Theory of Games.

Il est à remarquer qu’en théorie de l’évolution, l’adversaire principal d’un individu (Le Wiktionnaire est un projet de dictionnaire libre et gratuit similaire à Wikipédia (tous deux sont soutenus par la fondation Wikimedia).) n’est pas vraiment l’ensemble de ses prédateurs, mais l'ensemble des autres individus de son espèce (Dans les sciences du vivant, l’espèce (du latin species, « type » ou « apparence ») est le taxon de base de la systématique. L'espèce est un...) et des autres espèces apparentées. Comme le fait remarquer Richard Dawkins, un brontosaure n'a pas besoin, pour survivre, de courir plus vite que le tyrannosaure qui le poursuit (ce qui lui serait impossible), mais simplement plus vite que le plus lent de ses congénères. Des phénomènes semblables se produisent en économie. Tout cela rejoint des considérations psychologiques : la conflictualité est plus liée à la ressemblance qu'à la différence.

Les probabilités fournissent à la théorie des jeux un outil conceptuel. Les statistiques (La statistique est à la fois une science formelle, une méthode et une technique. Elle comprend la collecte, l'analyse, l'interprétation de données ainsi que la présentation de ces ressources...) peuvent l’alimenter en données, et les techniques d’optimisation lui fournir des résultats de calcul.

Gains et aversion au risque

Dans l’exemple en stratégie mixte (Une stratégie mixte en théorie des jeux est une stratégie où le joueur choisit au hasard le coup qu'il joue parmi les coups possibles. Cela revient à attribuer une certaine distribution de probabilité sur...) défini plus haut, les participants au jeu ont été considérés comme neutres au risque. Cela signifie qu’ils considèrent qu’avoir une chance sur deux d’obtenir 20 et une chance sur deux de ne rien avoir est équivalent à obtenir 10.

Cependant, la plupart des personnes sont averses au risque, et préfèrent les issues les plus sûres -- et n’accepteraient un risque supplémentaire que contre une espérance de gain plus important.

Un exemple de cette aversion au risque peut être remarqué au cours de jeux télévisés. Si, par exemple, on propose aux candidats soit une chance sur trois d’avoir 50 000 € soit 10 000 € à coup sûr, beaucoup préféreront la garantie de changer leur ordinaire. Le revenu supplémentaire espéré qui est exigé pour compenser l’aversion au risque est appelé, en finance, la prime de risque. La souscription de polices d’assurance (là où ce n’est pas obligatoire) se justifie également par aversion au risque.

Il est donc rationnel de construire une mesure de l’utilité subjective

  • qui soit une fonction du gain et du risque,
  • qui satisfasse toujours le critère de neutralité au risque,
  • et qui corresponde donc à un tableau de gains en stratégie mixte.

Plus généralement, l’utilité tient compte du fait que les grosses variations sont plus significatives que les petites (on achète volontiers un billet de loterie ou de Loto, dont le prix très faible correspond à une perte négligeable, tandis que le gain serait significatif), et que la signification d’une variation décroît (il y a plus de différence d’utilité entre un gain de 1 000 et un gain de 1 001 000, qu’entre un gain de 1 001 000 et un gain de 2 001 000, même si la différence est de 1 million (Un million (1 000 000) est l'entier naturel qui suit neuf cent quatre-vingt-dix-neuf mille neuf cent quatre-vingt-dix-neuf (999 999) et qui...) à chaque fois ; une chance sur cent de gagner un million est généralement préférée à une chance sur mille de gagner 10 millions, malgré l’espérance égale).

Inversement, il peut exister un désir d’acheter du risque ou de la peur : qu’il s’agisse d’un billet de loterie ou d’un film d’épouvante, l’excitation correspondant à une valeur en elle-même.

Bref, le fait d’acheter un billet de loterie ou de Loto, ou de jouer dans un casino, est motivé par deux composantes :

  • la sécrétion d’adrénaline (comme lorsqu’on va voir un film d’action ou qu’on pratique un sport à risque)
  • la différence qualitative entre :
    • une perte probable qui passera inaperçue,
    • un gain certes peu probable, mais qui procurera s’il se produit un changement qualititatif. Ce point a été défendu devant l’Académie des sciences (Une académie des sciences est une société savante dont le rôle est de promouvoir la recherche scientifique en réunissant certains des chercheurs les plus éminents, en tenant des séances au cours desquelles des...) par Émile Borel (en réaction contre une tendance de son époque à ne considérer que l’espérance mathématique (Les mathématiques constituent un domaine de connaissances abstraites construites à l'aide de raisonnements logiques sur des concepts tels que les nombres, les figures, les structures et les transformations. Les...) comme fonction d’utilité) et est en général admis depuis lors compte-tenu de sa meilleure explication des comportements liés au jeu et à la souscription de polices d’assurance.

Jeux de chiffres

John Conway a mis en place une notation pour certains jeux et défini des opérations sur ces jeux, dans l’espoir d’étudier le jeu de go. À partir d’associations surprenantes d’idées, il a isolé une sous-classe avec des propriétés numériques, et a abouti à définir la classe très générale des nombres surréels. Cela dit, en dépit de ces progrès annoncés, aucun programme informatique (Un programme informatique est une liste d'ordres indiquant à un ordinateur ce qu'il doit faire. Il se présente sous la forme d'une ou plusieurs séquences d'instructions, comportant souvent des...) n’arrive à jouer actuellement (2006) au go avec des performances de joueur international.

Source: Wikipédia publiée sous licence CC-BY-SA 3.0.

Vous pouvez soumettre une modification à cette définition sur cette page. La liste des auteurs de cet article est disponible ici.