GTO - Pierre papier ciseau et... puits!

#GTO la stratégie qui fait rêver (ou plutôt cauchemarder) xNimzo:wink:

Dans mon bled, on joue pas à pierre papier ciseau, mais à pierre papier ciseau puits.

La pierre et le ciseau tombent dans le puits (donc perdent), la feuille recouvre le puits (donc gagne).

Quel est l’équilibre de Nash à ce jeu ?

yeepaa je sais c’est trop facile pour toi mais aussi surferpro stepholi freudinou et même booba quand tu seras remis de la victoire inattendue du PSG (de toute façon c’est râclée tôt ou tard contre le Barça), Barth Gury, les coachs, les modos, qui sais-je encore, allez, à vos neurones !

Jouer papier et puits 100% du temps imo !

Je dirais pareil : jouer papier et puits de façon aléatoire.

Tiens, à propos de Nash, je suis tombé là-dessus, pour ceux que ça intéresse :

1/3 papier
1/3 ciseau
1/3 puit

Si les 2 players jouent Papier 1/2 et Puits 1/2, ce n’est pas un équilibre de Nash.

Contre une stratégie qui consisterait à jouer soit papier § soit puits (W), obv on joue 0% Pierre et (un peu moins obv) 0% Puits puisque ça ne gagne jamais.

Player 2 (P2) répond donc soit par Papier § soit par Ciseau © : P2 § + P2 © = 1

Comme c’est une stratégie mixte, la condition d’indifférence pour que ce soit un équilibre de Nash fait que pour Player 2, on doit avoir : Ev§ = Ev©

Ev§ = % Player 1 joue Puits x 1 = P1 (W)
Ev© = % Player 1 joue Papier - % Player 1 joue Puits = P1 § - P1 (W)

=> P1 (W) = P1 § - P1 (W) => P1 § = 2P1 (W)

Comme player 1 joue soit papier soit puits on a : P1 § + P1 (W) = 1 => P1 § = 2/3 et P1 (W) = 1/3

Player 1 joue 2/3 papier et 1/3 puits.

De la même façon, la condition d’indifférence fait qu’on doit avoir pour player 1 : EV § = EV (W)

EV (W) = P2 © - P2 §
EV § = -P2 ©

=> P2 © - P2 § = -P2 © => 2P2 © = P2 §

Or comme P2 § + P2 © = 1 => P2 © = 1/3 et P2 § = 2/3

Player 2 joue 2/3 papier et 1/3 ciseau.

Les deux joueurs sont à l’équilibre.

Conclusion : player 1 (2/3, 1/3) vs player 2 (0, 2/3, 1/3, 0), c’est un équilibre de Nash mais dans ce cas de figure player 1 n’a que deux options tandis que player 2 quatre options ! Et player 1 bien sûr ne peut pas gagner puisqu’il part avec un désavantage, son payoff = -1/3

Cela n’est pas l’équilibre de Nash pour 2 players ayant quatre options au départ (Pierre, Papier, Ciseau, Puits). Jouer juste papier ou puits ici est une stratégie sous-optimale.

[quote=“doudou2000, post:812137”]1/3 papier
1/3 ciseau
1/3 puit[/quote]

Démonstration ?

je suis toujours en tilt quand un type me propose de jouer à pierre feuille ciseau puits parce que même sans maîtriser nash on se rend compte assez vite que puits c’est comme une pierre mais en mieux vu que cela ne perd pas contre un puit…

Donc en poursuivant la logique on va jouer à Puits feuille ciseau et à ce moment là un mec un peu pragmatique peut se poser la question de pourquoi appeler puits une entité qui avant s’appelé pierre et qui a les mêmes caractéristiques…

=> On revient donc à pierre feuille ciseau :slight_smile:

[quote=“bigbox, post:812172”]je suis toujours en tilt quand un type me propose de jouer à pierre feuille ciseau puits parce que même sans maîtriser nash on se rend compte assez vite que puits c’est comme une pierre mais en mieux vu que cela ne perd pas contre un puit…

Donc en poursuivant la logique on va jouer à Puits feuille ciseau et à ce moment là un mec un peu pragmatique peut se poser la question de pourquoi appeler puits une entité qui avant s’appelé pierre et qui a les mêmes caractéristiques…

=> On revient donc à pierre feuille ciseau :)[/quote]

Lol excellente réponse ! C’est juste dommage que je m’en sois aperçu qu’aujourd’hui, ça m’aurait évité de perdre tant de parties gamin quand je ne savais pas encore qu’il ne fallait jamais jouer pierre…

plop

pour ceux qui galère avec le principe. un petit coup de main :slight_smile:

matriceRPSP.png

je m’en mêlerais ce soir “si besoin est” :slight_smile:

edit : penser à éliminer les stratégies dominées…

°+°

Et après on s’étonne que l’Espagne va mal…

Pardon, jan6, mais j’avoue avoir oublié le langage mathématique. je n’ai donc pas compris grand chose à ton exposé, sans doute tout à fait exact. Moi, avec mon petit cerveau déficient, je m’étais fait dans ma tête le petit tableau de monsieur Plop, et il me paraissait donc tout à fait optimal de jouer les trucs à +1. Sous-optimal, voilà ce que c’est. Ah ! merdasse ! Mais si c’est sous-optimal, il doit y avoir une stratégie pour contrer les couillons comme ui mais et moi qui jouons puits et papier. C’est laquelle ?

Eh bien, c’est celle que je t’ai dit : si toi player 1 tu joues puits et papier seulement, il y a un équilibre de Nash, c’est player 1 joue 2/3 papier et 1/3 puits et player 2 joue 2/3 papier et 1/3 ciseau. Player 2 aura un payoff positif et toi un payoff négatif. C’est logique puisque tu ne te donnes que 2 options possibles alors que player 2 a lui quatre options à son arc.

Si par contre tu t’obstines à jouer 1/2 papier et 1/2 puits (en gros, c’est comme si tu recevais une fois sur 2 papier ou puits et que tu étais obligé de jouer ces “cartes”), alors player 2 peut adopter la stratégie max exploitante, c à d une stratégie pure et non pas mixte, à savoir jouer 100% papier (jusqu’à ce que t’adaptes), mais là ce ne sera pas un équilibre de Nash puisque tu pourras changer ta stratégie pour améliorer ton EV, par exemple en jouant 100% ciseau, ce qui ne sera pas un équilibre de Nash non plus…

Si on revient à ton 1/2 puits et 1/2 papier, et que player 2 répond par 100% papier (je répète que ça n’est pas un équilibre de Nash), alors EV player 2 = 1/2 (1) + 1/2 (0) = 1/2, son payoff ici passe de 1/3 (par rapport à l’équilibre de Nash quand tu joues 2/3 et 1/3) à 1/2, tandis que toi tu passes de -1/3 à -1/2… C’est normal puisque ta stratégie est exploitable.

Pour en revenir à Pierre papier ciseau puits, comme l’ont dit Doudou et bigbox, l’équilibre de Nash consiste à jouer 1/3 papier 1/3 ciseau 1/3 puits pour les deux joueurs, on ne joue jamais pierre !

Mais si je me trompe, yeepaa pourra me corriger !

plop

nice explaination jan6 :slight_smile:

@Hesiodus=> oui la matrice donne bien 2 stratégies dominées, mais (et il est ultra important :D) c’est que ce type de matrice est basé sur des stratégies dites pures, les différentes options/moves qui s’offrent à nous mais sans leur attacher de fréquence ou autre !
et si on élimine la première stratégie dominée => Pierre
on se retrouve avec 3 stratégies qui donnent 0 en sortie ! :slight_smile:

edit : il n’y a pas d’équilibre de Nash dans ce jeu en stratégie pure ! (j’ai oublié de le préciser)

Snap10.png

notre équilibre de Nash est bien 1/3 1/3 1/3 en ayant viré la stratégie pierre (et l’explication de Bigbox sur le coté intuitif de ce jeu est non seulement très bonne mais en fait très proche de la bonne approche pour trouver les stratégies optimales ! on élimine la stratégie la plus faible et on voit comment se comporte les options !

j’ai lu que vite fait le passage sur le mode exploitant/exploité de Jan, mais je lui fais confiance sur le coup (et ça sert ma fainéantise chronique :D)

°+°

Je vais te donner un peu de travail yeepaa :laugh: :stuck_out_tongue:

On a effectivement la bonne solution pour pierre papier ciseau puits, mais de mon côté j’ai pas enocre cherché de démonstration mathématique. Il faudrait sûrement calquer sur la démo classique de pierre papier ciseau.

Tu donnes un début de démonstration mais je vois un truc qui cloche : on enlève pierre parce que stratégie dominée, mais n’est-ce pas result oriented puisque tout aussi bien on aurait pu enlever ciseau ? Ciseau a la même note de -1 que pierre dans ton tableau, si on se fie seulement à ce tableau ciseau paraît également une stratégie dominée donc à éliminer selon toi, c’est d’ailleurs ce qu’a fait Hesodius

Edit : en fait il suffit d’y aller à tâtons et de voir si ça donne zéro en enlevant une des deux stratégies dominées, voire les deux, c’est cela ? C’est une méthode pragmatique hehe mais qui a l’air de marcher

plop

bah ouais non :smiley:

et oui en gros la méthode “bateau” est d’éliminer les outcomes et en gros de faire une “backward induction”

on part de la fin et on élimine les décisions mauvaises

°+°

Mais c’est chaud alors parce que théoriquement tu devrais faire toutes les combinaisons, ne serait-ce que pour t’assurer qu’il n’y a pas plusieurs équilibres de Nash, non ? C’est en cela que l’intuition de bigbox est forte puisqu’elle permet de gagner du temps par rapport à la pure backward intuition. Ou du moins elle met sur la bonne piste, et en utilisant le principe de backward induction, on vérifie.

plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

ouais enfin imo kk1 avait déjà expliqué à bigbox :D, il a pas trouvé ça tout seul hihihi

le principe part quand même de l’élimination des stratégies les plus faibles, on a pas de raisons valables de virer celles qui ont de bons outcomes !

°+°

[quote=“Yeepaa, post:812430”]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

ouais enfin imo kk1 avait déjà expliqué à bigbox :D, il a pas trouvé ça tout seul hihihi

le principe part quand même de l’élimination des stratégies les plus faibles, on a pas de raisons valables de virer celles qui ont de bons outcomes !

°+°[/quote]

Il y en a au moins un second, d’équilibre, quand P1 joue 2/3 papier 1/3 puits et P2 2/3 papier et 1/3 ciseau. Mais n’est-ce pas ce qu’on appelle un “subgame” du jeu principal ? Au sens où P1 a choisi au départ une stratégie suboptimale (mais la réponse de P2, elle, est bien optimale).

[quote=“Yeepaa, post:812430”]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

ouais enfin imo kk1 avait déjà expliqué à bigbox :D, il a pas trouvé ça tout seul hihihi

le principe part quand même de l’élimination des stratégies les plus faibles, on a pas de raisons valables de virer celles qui ont de bons outcomes !

°+°[/quote]

ahaha t’es dur bien sûr que je l’avais trouvé tout seul! Par contre je n’ai pas tout à fait compris ta démarche sous forme de matrice car si on enlève les stratégies dominées on est censée enlever ciseau aussi non? (qui dans ta matrice de départ est dominée)?

[quote=« Yeepaa, post:812430 »]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

[/quote]

"Tout jeu peut avoir de nombreux équilibres de Nash ou aucun (c’est le cas du jeu consistant à écrire simultanément un entier, le gagnant étant celui dont l’entier est le plus grand). Néanmoins, Nash est parvenu à démontrer que tout jeu avec un nombre fini de joueurs ayant un nombre fini de stratégies admet au moins un équilibre de Nash en stratégie mixte (c’est-à-dire si l’on considère comme une stratégie possible de tirer aléatoirement (avec des probabilités fixées) entre plusieurs stratégies).

Dans le cas d’un jeu à somme nulle à deux joueurs, c’est-à-dire où ce que gagne un joueur est nécessairement perdu par l’autre, ce résultat (c’est-à-dire l’utilité induite par tout équilibre) est nécessairement unique. Il a conduit à définir la valeur d’un jeu."

Source : [url]Équilibre de Nash — Wikipédia

C’est notre cas non ?
Dans ce cas l’équilibre de Nash est unique par théorème.