GTO - Pierre papier ciseau et... puits!

Jan6 en tout cas c’est marrant comme coincidence car j’avais commencé à discuter avec yeepa d’une mise en situation GTO.

Malheureusement je n’ai vraiment pas le temps en ce moment de l’approfondir et je n’ai pas forcément le skill non plus. Je pense que je vais poser le problème sur le forum vu que je vois qu’il y a du niveau!

C’est drôle parce que dans mon école on jouait aussi a : Pierre Puits (en deuxième position) Feuille Ciseaux!
Je ne sais pas qui a inventé ce jeu la, mais ça donne une marge d’erreur plus importante a Villain, donc c’est plus fun :slight_smile:

J’avais vite remarqué que 2 choix (ciseau et pierre) perdaient plus que les autres, donc je jouait aléatoirement soit le puits soit la feuille pensant être un petit génie :laugh: .
Évidemment cette stratégie est facilement exploitable, Villain peut jouer 100% de feuille, et je ne peux plus que perdre ou faire nulle.

La solution GTO est unique et proposée par bigbox, il faut jouer 1/3 de Puits, 1/3 de Feuille, et 1/3 de Ciseaux. Cette stratégie est inexploitable.

Un programme sympathique appelé Gambit résout ce genre de jeux.

[quote=« pilsner, post:812463 »][quote=« Yeepaa, post:812430 »]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

[/quote]

"Tout jeu peut avoir de nombreux équilibres de Nash ou aucun (c’est le cas du jeu consistant à écrire simultanément un entier, le gagnant étant celui dont l’entier est le plus grand). Néanmoins, Nash est parvenu à démontrer que tout jeu avec un nombre fini de joueurs ayant un nombre fini de stratégies admet au moins un équilibre de Nash en stratégie mixte (c’est-à-dire si l’on considère comme une stratégie possible de tirer aléatoirement (avec des probabilités fixées) entre plusieurs stratégies).

Dans le cas d’un jeu à somme nulle à deux joueurs, c’est-à-dire où ce que gagne un joueur est nécessairement perdu par l’autre, ce résultat (c’est-à-dire l’utilité induite par tout équilibre) est nécessairement unique. Il a conduit à définir la valeur d’un jeu."

Source : [url]Équilibre de Nash — Wikipédia

C’est notre cas non ?
Dans ce cas l’équilibre de Nash est unique par théorème.[/quote]

plop

Snap13.png

°+°

[quote=« Yeepaa, post:812505 »][quote=« pilsner, post:812463 »][quote=« Yeepaa, post:812430 »]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

[/quote]

"Tout jeu peut avoir de nombreux équilibres de Nash ou aucun (c’est le cas du jeu consistant à écrire simultanément un entier, le gagnant étant celui dont l’entier est le plus grand). Néanmoins, Nash est parvenu à démontrer que tout jeu avec un nombre fini de joueurs ayant un nombre fini de stratégies admet au moins un équilibre de Nash en stratégie mixte (c’est-à-dire si l’on considère comme une stratégie possible de tirer aléatoirement (avec des probabilités fixées) entre plusieurs stratégies).

Dans le cas d’un jeu à somme nulle à deux joueurs, c’est-à-dire où ce que gagne un joueur est nécessairement perdu par l’autre, ce résultat (c’est-à-dire l’utilité induite par tout équilibre) est nécessairement unique. Il a conduit à définir la valeur d’un jeu."

Source : [url]Équilibre de Nash — Wikipédia

C’est notre cas non ?
Dans ce cas l’équilibre de Nash est unique par théorème.[/quote]

plop

°+°[/quote]

La j’ai un gros doute! Fais voir tes input!

Yeepa: On dirait qu’il manque la “Feuille” dans la panoplie de moves de joueur 2!

[quote=“zugzwang, post:812509”][quote=“Yeepaa, post:812505”][quote=“pilsner, post:812463”][quote=“Yeepaa, post:812430”]plop

je suis prêt à parier qu’il y a plusieurs équilibre en fait :smiley:

[/quote]

C’est notre cas non ?
Dans ce cas l’équilibre de Nash est unique par théorème.[/quote]

plop

°+°[/quote]

La j’ai un gros doute! Fais voir tes input![/quote]

plop

ça va etre dépendant d’un paramètre simple !

tu considère 0,1 ou -1,1 => on considère qu’on marque 1 points ou qu’il y a perte = gain !

si on joue 1€ le game c’est 1,-1 par contre si on considère qu’une victoire vaut 1 point et donc perdre vaut 0 ça change beaucoup de chose

°+°

Effectivement, le résultat est différent si c’est un jeu à somme nul (0,0 / -1,1 ou 1,-1), ou si on considère 0,0 / 0,1 ou 1,0 comme Yeppaa (ce n’est plus un jeu à somme nul : le théorème de l’unicité de l’équilibre ne s’applique pas).
En utilisant :
[url]http://gte.csc.liv.ac.uk/gte/builder/[/url]
Qui est l’outil en ligne accessible depuis le site de gambit, je trouve 5 équilibres dans la deuxième version du jeu :

L’ordre est pierre / puit / ciseau / papier.

On retrouve le 0 pierre 1/3 puit 1/3 ciseau 1/3 papier vs la même stratégie (EE1), par contre je ne comprend pas les autres résultats.
Par exemple, le 0.5 pierre 0.5 papier versus 0.5 puit 0.5 ciseau (EE3 et EE5) : si l’EV est bien égale pour les deux joueurs, ils ont tous les deux des stratégies exploitables non ? Face à quelqu’un qui joue 0.5 pierre 0.5 papier, il suffit de jouer tout le temps papier pour le battre par exemple.
Je comprend encore moins EE2 et EE4 ou les joueurs n’ont pas la même EV !

C’est quoi que j’ai mal compris dans les résultats / mal saisi dans la simulation ?

erf j’ai installé gambit, le calcul plante “The computation ended abnormally”

Quelqu’un sait pourquoi?

Très intéressantes discussions, c’est cool.

Je pense qu’il faut rester dans le cadre d’un jeu à somme nulle, sinon on s’éloigne du poker.

Dans un jeu à somme zéro, dans le cas où les deux joueurs sont parfaitement à égalité, chaque joueur qui choisit la stratégie optimale sera EV=0. Mais cette stratégie qui break even n’existe pas dans les jeux « inégalitaires », ce qui est souvent le cas, notamment au poker.

Comme je le disais, si un des deux joueurs choisit un stratégie suboptimale comme jouer soit papier (P) soit puits (W), on trouve également au moins un équilibre de Nash : P1 2/3P 1/3W et P2 2/3 P 1/3 S (scissor).

C’est une stratégie suboptimale pour P1 dans le jeu de base pierre papier puits ciseau, mais c’est la stratégie optimale (ou une des statégies optimales) dans le sous-jeu théorique de ce jeu où P1 n’aurait le choix qu’entre papier et puits, tandis que P2 aurait toujours le choix entre les quatre options.

Cela nous sert à trouver les équilibres de Nash lorsqu’un des deux joueurs, pour une raison ou une autre, a un edge sur l’autre, comme c’est souvent le cas au poker (la position, la river qui affecte les ranges de manière aléatoire, etc.). Sachant que même si les joueurs n’ont pas joué GTO avant la river, il existera au moins un équilibre de Nash à la river, soit au moins une façon pour les deux de jouer GTO, en exploitant au mieux son avantage pour l’un, en minimisant au mieux son désavantage objectif pour l’autre.

On voit qu’il y a souvent plusieurs équilibres de Nash pour ce genre de jeux (tout ce qu’il faut, c’est que les payoffs soient les mêmes, sachant que plusieurs équations différentes peuvent mener à une somme nulle). Pour ceux que ça intéresse je viens de poster sur le blog de GTO Range Builder, on voit qu’il y a de multiples équilibriums à un même problème (mon pseudo = h7r)

L’énoncé du bonus : GTORangeBuilder Blog: GTO Brain Teaser #1: Exploitation and Counter-Exploitation in Rock Paper Scissors
La solution du blogger du bonus et les commentaires à la fin : GTORangeBuilder Blog: GTO Brainteaser #1 Solution

Et si on joue à Pierre Feuille Ciseaux Lézard Spock ? :laugh:

(Aucun intérêt, c’est un pierre feuille ciseaux amélioré)

Sympa le problème en tout cas !

[quote=“ikilab, post:812663”]Et si on joue à Pierre Feuille Ciseaux Lézard Spock ? :laugh:

(Aucun intérêt, c’est un pierre feuille ciseaux amélioré)

Sympa le problème en tout cas ![/quote]

Si si si donne les règles j’adore me prendre la tête sur ces problèmes

Bah le ciseaux perd contre spock et bat le lézard
la pierre perd contre spock et bat le lezard aussi
la feuille gagne contre spock et perd contre le lézard
le lézard bat spock

Ce qui fait que ça fait un pentagone et que chaque choix gagne et perd 2 fois. C’est pour ça que je parlais de pierre feuille ciseaux amélioré.

C’est issu du TV show “The Big Bang Theory”

A vous lire mes cours de Microéconomie sont bien loins …

[quote=“pilsner, post:812550”]erf j’ai installé gambit, le calcul plante “The computation ended abnormally”

Quelqu’un sait pourquoi?[/quote]

plop

la version 14 a quelques bugs connu, essaye de down la 13 et imo ça devrait fonctionner !

perso j’ai la 14 sur différents pc, sur un elle fonctionne sans soucis et sur les autres j’ai des bugs…

°+°

Je ne me rappelle plus des démonstrations d’équilibre de Nash.

En tous cas, “la stratégie pierre est dominée par la stratégie puit”, a.k.a, quelque soit le coup de l’adversaire, notre payoff en jouant puit sera supérieur ou égal à celui en jouant pierre.

si tu joues 1/3 puit, 1/3 ciseau, 1/3 feuille, l’EV de vilain

  • EV(vilain joue feuille) = 1/3 * -1 (vs ciseau) + 1/3 * 0 (vs feuille) + 1/3 * 1 (vs puit) = 0
    De même pour tous les autres move, sauf pierre qu’il ne devrait jamais jouer.