Théorie GTO

Salut les grinders, la question n’est pas EV+, mais j’aimerai comprendre l’ensemble du tableau. Quel mystère mathématique explique que la GTO soit parfaitement inexploitable, alors qu’elle ne respecte pas le mdf? Soit l’explication c’est que la GTO est inexploitable SEULEMENT vs stratégie connue… auquel cas n’est finalement pas inexploitable (on pourrait théoriquement exploite un ordi qui ne connait pas la strat d’un ordi vilain), soit elle respecte totalement la mdf avec l’ensemble de sa range dans tous les spots (mais je ne crois pas) , soit je ne comprend pas… Et vous?

euh…pas trop compris la question :confused:
par contre si la theorie t’intéresse, tu vas être obligé de te farcir « the mathematics of poker »
bon courage …

Je précise la question:
La mdf nous dit sauf erreur de ma part, si tu sizepote tel board, en théorie si vilain fold plus de 50% c’est EV+ quelque soit nos mains. Il suffirait donc de trouver par exemple les boards sur lesquels la GTO ne défend pas 50% de sa range vs sizepote pour exploiter la GTO en mettant un sizepote avec tous nos bluffs. D’où vient l’erreur? C’est un exemple mais on peut prendre mille. La seule explication que j’y vois c’est que la GTO ne défend toujours 50% parce qu’elle sait qu’en face l’autre ordi GTO ne bet pas 100% de ces bluffs sinon elle s’adapterait. Ok mais alors ce serait juste inexploitable vs stratégie connue. Et donc on ne peut plus dire toute déviation de la GTO est perdante, ici elle ne le serait pas. Bref, je ne comprend pas bien, quelqu’un comprend?

Oui voilà c’est typiquement ce que je ne comprend pas non plus… :wink:

Les explications sont données dans les sujets (en lien) qui ont traités de ce point théorique.

Pour comprendre facilement le point, faisons un toy game où le pot fait 1 avec OOP et IP ayant aussi 1 de stack restant. On peut seulement bet 1, check ou fold.

Jeu 1

OOP a {AA} et IP {99} avec TTT sur le board.

Le MDF ne signifie rien ici puisque IP ne doit pas défendre 50% contre des bluffs … que OOP n’a pas.

Jeu 2

Ajoutons maintenant des combos de bluff dans la range d’OOP (6 sur 30)

IP n’a toujours pas assez de combos pour défendre le MDF

Jeu 3

Donnons maintenant une bonne range de bluff à OOP

IP peut désormais défendre le MDF

C’est faux comme nous l’avons vu dans l’exemple 2. Si IP commence à défendre le MDF, il perd de l’EV par rapport à fold et deviendrait donc exploitable.

L’équilibre de la solution ne signifie pas forcément de défendre le MDF dans toutes les situations comme vu dans l’exemple 1 et 2.

La question de la force des ranges est importante et il faut donc comprendre que l’on veut se défendre contre les bluffs de Villain en supposant qu’il en a assez dans sa range par rapport à notre range de défense.

2 « J'aime »

IP a un bluff. S’il check, il peut espérer 0.5 d’EV. Pourquoi irait-il miser si ça rapporte 0 EV ?

J’avais écrit un post non-exhaustif sur le sujet.

MDF Poker (il faut au minimum 10 caractères pour un titre) - Stratégie - Forum Poker Académie (poker-academie.com)

J’ai aussi écrit un article pour aider à débuter l’étude GTO.

Les maths au poker : initiation à la théorie des jeux appliqués au poker (poker-academie.com)

Cela pourra peut-être t’aider.

c’est vrai qu’il y a aussi le cas ou la distribution en face est tellement forte que le défenseur peut rien faire du coup aucune notion de MDF qui s’applique

Merci pour vos réponses précieuses, j’étudie ça très tard ce soir ou demain. Passionant. :wink:

Je comprend pas ta remarque. S’il a un bluff c’est qu’il a une main considérée comme perdante, donc elle n’a pas d’EV positif. Et si le défenseur ne respecte pas le mdf en revanche, le better en bluff aura toujours une EV positive.

Merci #yvan161 pour cette longue réponse étayée, c’est vraiment généreux de ta part. Mais j’avoue ne pas comprendre ton exemple, vu que tu te positionnes du côté du défenseur qui ne « peut pas défendre la mdf » (soit), et avec un exemple où Oop n’a pas besoin de bluffer (AA), et où IP n’a pas une range mais une seule main (TT), or on ne veut pas bluff une main mais une range. Finalement, j’ai l’impression que tu démontres que le défenseur ne peut pas défendre la mdf sans se faire explo, mais que tu ne démontres pas que l’agresseur bluff ne doit/peut pas exploiter cette situation.
Moi je disais que par exemple sur un board si on sait que la GTO ne défend pas le mdf river (comme ça c’est la dernière décision pas de discussion sur une éventuelle EV plus tard) sur un sizing donné par exemple sizepote, pourquoi renoncer à certains bluff, et ne pas juste bet TOUS nos bluffs dans ce sizing?

Après peut être que dans TOUS les spots de la GTO le nombre de combos qui arrivent river fait que la situation n’arrive jamais, ou que PIO y met déjà TOUS ses bluffs sans exception. Je n’ai pas PIO pour vérifier, mais c’est ce que tu dis en quelque sorte?

Bon, j’imagine que des grands mathématiciens ont étudié/démontré le truc, donc je peux me contenter de la réponse sans la démonstration. :wink:

Donc ma question c’est " est ce qu’un ordi qui joue la GTO parfaite (avec range GTO opti) mais ne s’adapte à rien est totalement inexploitable même contre strat vicieuse (genre enlever des combos de bluffs ici, ou changer complètement les ranges d’open)? et votre réponse est un immense OUI, c’est bien ça?

La finesse c’est que dès qu’on nodlock un truc la strat de PIO change, mais finalement c’est toujours pour gagner plus d’EV, si elle ne changeait pas elle serait TOUJOURS positive quoiqu’il arrive, c’est bien ça?

Merci pour vos réponses :wink:

Super, merci @florian99p99 ; ça l’air passionnant, j’essaye de comprendre le deuxième article, mais y a du boulot…:wink: bravo pour tout ça, je suis impressionné. Avant de lire ton post, je me croyais plutôt doué avec les maths…mais ça c’était avant :wink: Merci à toi

Il faut comprendre que le solver propose une solution à l’équilibre, c’est à dire la maximisation de l’EV (= meilleure EV possible sans être exploitable) pour une paire de stratégies (autrement dit pour les 2 joueurs).

Si tu fais dévier un des joueurs (par un node lock) alors le solver propose un nouvel équilibre où celui qui a dévié aura moins d’EV et l’autre joueur plus d’EV.

La solution proposée est à l’équilibre mais ça ne veut pas dire que l’EV est positive. Par commodité, on parle d’EV0, EV+, EV- mais c’est en delta (par rapport à l’équilibre) et pas en absolu.

Reprenons le jeu 2

J’ai élagué l’arbre pour que les noeuds soient tous des checks après le flop pour simuler une situation un peu comme si on était river.

L’EV (absolu) de OOP est proche de 1 car IP ne peut gagner que marginalement : 9 turn et river, T puis A ou inversement … (environ 0,5% du temps).

L’EV (absolu) de IP est très légèrement positive quand il ne défend pas le MDF.

Que se passe-t-il si IP défend le MDF ?

son EV devient négative …

… car OOP a ajusté sa stratégie pour exploiter la déviation de IP.

Sans déviation d’IP, OOP bet tous ses bluffs (88) et check certaines nuts pour laisser à IP l’opportunité de bet.

Si IP s’amuse à défendre le MDF alors OOP bet tous ses nuts et plus tous ses bluffs.

Dans cette situation OOP ne peut exploiter IP s’il défend le MDF. OOP ne peut pas exploiter IP qui ne défend pas le MDF.

Ce n’est pas une démonstration mathématique pour tous les spots mais une explication pourquoi le solver ne propose pas toujours de défendre le MDF. Ne pas défendre le MDF, ne veut pas forcément dire être exploitable.

Merci beaucoup mon Yvan, je comprend parfaitement ce que tu dis et je n’ai pas de souci de compréhension là dessus; mais tu ne réponds pas vraiment à ma question. Il me semble que la réponse est juste oui ou non. Très probablement oui, mais je voulais confirmation. Pour le reste j’ai tout compris et merci pour tes réponses. Alors, c’est bien oui? Ou je n’ai pas compris un truc?

Oui, une stratégie purement GTO est totalement inexploitable. ça a été démontré, pas pour le poker, mais plus généralement en mathématiques, par la thèse de John Nash.

1 « J'aime »

Merci @WaitWaitW , et la réponse est toujours vraie si vilain change des trucs « sans le dire » au solver (par exemple en changeant totalement sa range d’open)?

Le solver est clairvoyant, c’est à dire qu’il connait la stratégie des deux joueurs. Et dans la stratégie, il y a les ranges.

Si tu changes un paramétrage comme les sizings ou les ranges, le solver donne une autre solution car ce n’est pas le même ‹ jeu › qui est solved.

On ne peut pas répondre par oui ou par non à la question de par sa formulation.

Si tu changes une action (/une fréquence) d’un des deux joueurs (par un node lock) alors il devient exploitable (il peut perdre de l’EV) mais si tu changes une range d’open, il faut résoudre cette autre situation qui donnera un autre équilibre de Nash.

Il ne faut pas que tu vois le solver comme un ordinateur jouant GTO en incarnant Hero que Villain essayerait de battre mais plutôt comme un conseillé qui indique aux deux joueurs comment jouer parfaitement (c’est à dire de façon inexploitable) sur la base des paramètres qu’on lui donne (ranges, actions, sizings, pot …)

Un jeu purement GTO ne perdra jamais d’argent (hors rake). Si tu changes des trucs sans le dire, tu ne peux pas gagner en EV pour autant. Tu peux perdre, ou rester breakeven car autant la strat restera inexploitable, autant elle n’exploitera pas les failles que tu auras créé en changeant de strat.
On parle bien sûr d’une solution qui débute préflop du coup ( Pio par exemple, la solution commence flop puisque c’est à nous de rentrer le préflop à la main)

1 « J'aime »

Merci @WaitWaitW et merci @yvan161 :wink: Mainenant c’est clair :wink:

1 « J'aime »