Le fameux tableau HeadsUp Push/Fold Nash Equilibrium n’est pas précisément un équilibre de Nash mais une représentation simplifiée de plusieurs équilibres de Nash (situations de HU résolues à différent niveaux de blinds).
Ce qu’il faut comprendre avec les vrais solvers (qui cherchent un équilibre de Nash) c’est qu’ils ne résolvent pas le jeu NLHE dans son ensemble mais une situation donnée.
Ici on solve une situation PF avec un seul sizing possible.
Ce n’est pas parce qu’une autre stratégie non-exploitable existe dans une situation différente (avec d’autres sizings autrement dit dans un autre ‹ jeu › au sens de la solution) que celle-ci n’est pas un équilibre de Nash. Tu peux avoir des stratégies toujours optimales avec des choix de sizing qui dégagent plus d’EV que celle avec un seul choix de sizing.
C’est juste que celle avec un seul sizing sera plus facile à mettre en oeuvre pour un être humain.
En faisant abstraction de la simplification de la précision et de la synthèse des différentes tables suivants les profondeurs :
Il y a donc un (et un seul) équilibre de Nash en PoF HU (par profondeur de tapis effectif) à partir du moment où le seul sizing possible est All-in.
Il faut comprendre qu’un équilibre de Nash, c’est l’ensemble des stratégies des 2 (ou plus) joueurs et pas une stratégie isolée d’un des deux joueurs.
Le solver maximise l’EV du joueur 1 ET du joueur 2.
Les solveurs ne résolvent pas le jeu NLHE dans son ensemble (n’importe quelles ranges, n’importe quel sizing, n’importe quel tapis effectif, n’importe quel nombre de joueurs …). Juste une situation donnée avec un paramétrage (ranges et actions/sizings et souvent uniquement en HU). N’empêche, ils délivrent une solution GTO/Nash/à l’équilibre/optimale.
Justement Il y a une confusion dans l’article de pokernews sur ce point.
Certains outils comme Snowie, Pluribus … sont appelés abusivement ‹ solver › comme s’ils délivraient une solution GTO (un équilibre de Nash) alors que ce n’est pas le cas, même si par leur approche ils peuvent devenir imbattables par des être humains (et encore ça reste à prouver selon moi).
PIO, GTO+, Simple PostFlop … sont des vrais solvers en ce sens qu’ils délivrent une solution GTO (= un équilibre de Nash) et d’ailleurs ils délivrent la même à paramétrage équivalent (abstraction faite de la précision et de bugs éventuels d’implémentation).
Pour le lock node mode, tu changes les paramètres ‹ du jeu étudié › en empêchant le solver d’explorer certaines contre-mesures comme tu le fais lorsque tu choisis certains sizings ‹ autorisés ›.
Reformulons : il est contre productif de vouloir jouer optimal/GTO/à l’équilibre dans ce spot surtout à cette limite. Raise AQo ici est du value cut pour moi.
Le débat est intéressant mais je ne sais pas si l’on va pouvoir conclure : nous avons simplement une compréhension partiellement différente de ce qu’est la GTO.
Au moins sur le point ci-dessous, nous sommes alignés
Oui d’accord je ne le savais pas, je ne joue pas en MTT, j’ai juste entendu que les tableaux de Jenifear étaient incorrects. Mais même si ce n’était pas une situation simplifiée ce ne serait toujours pas l’équilibre de Nash au sens où je l’ai décrit parce que le push or fold perd de l’EV dans tous les cas.
Oui, mais j’espère quand même que chaque joueur qui ouvre un solver en a conscience. Et c’est justement pour ça que je dis que le solver ne délivre pas l’équilibre de nash du spot. Parce qu’on est limités sur l’arbre et le nombre de sizings. On pourrait appeler ça une sorte de « sous » équilibre de Nash parce qu’on sait que l’arbre qu’on a configuré est limitant. Mais là c’est discuter sur des détails et une définition différente selon les sources, et personnellement je n’ai pas les compétences pour arbitrer quelle définition est la meilleure et surtout j’ai l’impression qu’on s’en fout royalement au final !!
Je n’ai pas encore assez exploré le sujet, si je ne dis pas de bêtises pluribus and co, snowie sont des neural networks plutôt que des solvers en effet.
Le principe de minimisation du regret ( et donc de maximisation de l’EV ) reste commun tout de même. entre solvers et neural networks.
De ce que j’ai lu en fonction des solvers/bots les modèles de calcul informatiques sont différents et plus ou moins efficaces/évolués, il y en a plusieurs comme par exemple :
Oui tu as évidemment raison … ce n’est absolument pas ce que je voulais dire… auto-sabotage…
Oui si tu veux mais ça n’apporte rien de dire que ça ne sert à rien de jouer « à l’équilibre » si derrière on se trompe sur la manière de dévier. Et surtout si le solve raise une combo il faut clairement se demander si ce n’est pas pertinent de jouer comme lui plutôt que chercher une excuse pour ne pas jouer comme lui. Beaucoup de joueurs ont quand même tendance à ne pas vouloir implémenter des lines du solver pour de mauvaises raisons. Et l’histoire de « pas besoin d’être « équilibré » » ça me semble sur le podium des mauvaises raisons qu’on voit souvent invoquées.
Ici OOP est sensé call tous ses 55-JJ par exemple, ses 3x, ses SD, et quelques Ace high.et évidemment tous ses Qx. Même si c’est possible qu’il fold quelques unes de ces combinaisons faut bien comprendre que 55-88 vont souvent check/fold turn par exemple. Du coup on gagne de l’EV clairement à les faire payer au flop. Enfin c’est juste un exemple. Mais y’a pleins de bonnes raisons pour raise au flop contrairement à ce que beaucoup peuvent penser.
Il peut y avoir des erreurs dans les tableaux de jennifear (en tout cas moins que celles de joueurs qui l’utilisent en TF ) et je préfère celles de Kill Elky voire encore mieux d’un solver typer SimpleNash ou ICMIZER (mais c’est un autre débat) mais ça reste une solution de type équilibre de Nash.
Une main que tu solves à partir du postflop est une « situation » et le résultat (du paramétrage) est un équilibre de Nash.
OK on pourrait dire qu’il s’agit d’un équilibre de Nash de la main et qu’il en existe d’autres si l’on change certains paramétrages comme les sizings mais ça ne sera pas pour trouver une EV significativement meilleure puisque l’on a admis que :
Je me doutais bien que ça allait finir comme ça
J’ai run le spot avec des ranges GTO , le paramétrage que je propose par défaut en pot 3bet OOP (sans retoucher l’arbre) et 1 seul sizing de Cbet à 1/3 (si c’est ce que tu as fais aussi).
Tu vois, on diverge complètement sur les fréquences.
Au vu de ta capture d’écran, tes ranges ne sont pas les bonnes comme te l’a fait remarqué@Stylzraf.
On pourrait déjà s’arrêter là parce que après, Villain n’est plus ‹ censé › faire quoique se soit s’il ne joue pas ses ranges PF à l’équilibre.
On pourrait aussi discuter du choix étrange de BB de raise en se laissant 13bb derrière.
Il y a 1 SPR, de façon réaliste, Villain doit broke : il faut ajuster l’arbre.
.
Dans ta simulation, je ne sais pas si tu vois les pouillièmes de combos que ça représente les call de BB mais difficile de justifier qu’il faut raise AQo parce qu’il est censé call ces pouillièmes (basés en plus sur de mauvaises ranges de départ).
Le pourcentage de Cbet (10%) me paraît extrêmement bas pour être réaliste (même en théorie).
Bref je pense que ta simulation n’est pas pertinente théoriquement et de toute façon en pratique en NL10 Villain ne jouera jamais ainsi et que l’utilisation du solver ne permettra pas de démontrer qu’il est correct de raise AQo ici (même à supposer que l’on se mettre d’accord sur le paramétrage).
Rangons le solver et le débat théorique sur ce spot qui ne le mérite pas
Les ranges que j’ai plug ne sont pas GTO en effet. En revanche, il ne faut pas surestimer l’impact sur la solution postflop. C’est pas non plus des ranges complétement à l’ouest que j’ai plug, on est juste sur une légère simplification issue d’une masterclass plutôt bien côtée en français. La différence ce sera plutôt sur l’arbre… Il y a de gros débats sur les avantages et inconvénients de trop simplifier les arbres de décisions et jouer des stratégies mono-sizing. Personnellement je trouve que la simplification excessive des arbres de décision est clairement à éviter. Ici vu que t’as un seul sizing qui est small, forcément le range de BB est très dépolarisé et c’est donc plus difficile pour IP de raise. Vu que ma simulation comporte 2 sizings de cbet au flop, et que le small sizing est minoritaire cela explique le nombre plus faible de combos. Et cela explique aussi une stratégie de raise intensive vs small sizing puisque les combos avec beaucoup d’équité de BB sont bien plus présentes sur l’autre sizing de cbet.
D’ailleurs concernant mon arbre de décision, les 2 sizings ont été choisi suite à une simulation où j’avais indiqué 4 ou 5 sizings de cbet au flop. Suite à ça j’ai tout de même éliminé les sizings très faiblement utilisés.
Et oui y’a un léger artefact que j’ai vu sur le sizing de 3B… mais sincèrement je pourrais re-run la simu et perdre une tonne de temps pour rien… ça ne changera pas pour autant les fréquences de raise de BU. Clairement ce léger artefact n’est pas gênant.
OK mais donne les sizings que tu as saisi. Je n’ai pas cherché à simplifier, c’est juste qu’on ne peut pas deviner ton paramétrage sur la capture d’écran.
Donne aussi les autres paramètres parce qu’à mon avis, tu n’as pas les mêmes que moi.
Bien d’accord avec ça (d’où ma remarque sur sizing de reraise), ceci dit mis bout à bout, si on a trop d’écarts sur les paramétrages (ranges compris), on risque d’arriver à des conclusions complètement différentes.
C’est pas pareil de raise 20% sur 10% de Cbet que 22% sur 75% de Cbet alors je ne sais pas où je me trompe lourdement ni ce que dit la théorie en fréquence de raise sur ce spot.
Je suis d’accord qu’en théorie il a une range de raise (il y a quasiment toujours une range de raise ) et peut-être que AQo est dans cette range ‹ en théorie › mais en pratique ici, je ne vois toujours pas l’intérêt de raise ce combo.
Le soucis c’est surtout d’étudier des simus à mono-sizing plus que de ne pas deviner mon paramétrage. Surtout si le sizing utilisé a de fortes chances de ne pas être celui préféré par le solver.
J’ai run avec tes paramétres mais en gardant les ranges GTO.
Ca reste du 75% de Cbet vs 25% de check et le 1/3 pot reste le sizing majoritaire (dans ce scénario).
Dans la simulation de @Stylzraf avec un autre jeu de sizings (25%, 40%,75%) avec ranges GTO, c’est Cbet full range.
Je ne comprends pas comment tu peux arriver à une fréquence si basse de Cbet pour le 1/3 (faudrait voir le résultat pour l’ensemble des sizing de Cbet). Ca peut être lié aux ranges que tu choisis mais c’est probablement une capture d’écran qui ne vient pas du paramétrage ‹ simplifié ›.
C’est peut-être pas Cbet full range théorique mais en simplification, ça reste du Cbet à haute fréquence quand même. Le flop est dry donc c’est logique que Villain (et le solver) Cbet beaucoup.
Je ne cherche pas à réfuter tes arguments par principe. J’ai juste un avis différent du tiens.
OK dans les simulations théoriques réalisées, AcQs est (partiellement) dans la range de raise (mais bon on parle de quelques combos).
Et ok pour envisager des ranges de raise même sur des flops dry si le field ne sait pas bien s’adapter mais en NL10, je ne vais pas y mettre AQo sur ce flop pour ‹ protéger › le reste de ma fraction de combos de raise en bluff.
Voilà, c’est un raisonnement peut-être plus adapté à des limites nettement supérieures que celles du spot et je n’ai pas les armes théoriques pour en débattre plus qu’avec un TP de micro.
Le débat m’intéressait et mon intention n’était pas de te contredire systématiquement ou de rester campé sur mes positions : j’ai juste donné mon avis et je suis toujours convaincu que le call est supérieur au raise dans la situation décrite.
check : 33,4%
bet 4,5 : 23,4%
bet 12,5 : 42,1%
bet 27,5 : 1%
(j’ai fais une erreur sur le board j’ai mis Q54r au lieu de Q43r mais je pense sincérement que ce n’est pas une grosse différence)
Peu importe le nombre de combos à partir du moment où c’est mixé alors EV call = EV de raise et cela signifie que ça fait largement du sens de raise, et ça mérite qu’on y réfléchisse !
Si le field ne sait pas s’adapter ? Beh il est déjà pas capable de le jouer correctement le spot alors l’adaptation ce n’est même pas la peine d’en parler. AQo pour protéger des bluffs ? Cela n’a pas de sens. Quand on raise AQo c’est parce que c’est la manière la plus efficace de faire augmenter la taille du pot avec une équité très intéressante. C’est évident que si on raise uniquement en bluff et qu’un reg beaucoup plus malin que la moyenne s’en aperçoit on risque d’avoir des problèmes, mais même sans ça raise AQo présente beaucoup d’avantages!!!
Du coup si c’est un play adapté à des limites nettement supérieures cela signifie que ce n’est pas une bonne stratégie en NL10 ? C’est marrant, j’ai tendance à penser l’inverse ! J’ai même tendance à penser que ceux qui sont arrivés aux limites supérieures y sont arrivés parce qu’il ne prenaient pas les mêmes line que les autres regs qui n’arrivent pas à monter.
Je ne remets pas en cause ton état d’esprit, si la discussion n’était pas constructive je ne prendrai pas autant de temps à te répondre. Le fait est que nous avons tous ce biais cognitif naturel à vouloir confirmer nos croyances/pensées idées et réfuter celles des autres, et qu’au contraire on devrait commencer par accepter le raisonnement de l’autre avant de le tester, et le valider/invalider le cas échéant. C’est d’ailleurs bien pour ça qu’essayer de faire changer d’avis une personne sur un forum c’est bien souvent peine perdue et même contre-productif et va engendrer des phénomènes de réactance.
PS : je vais prochainement re-run la simu tout de même, par acquis de confiance.
Désolé pour les auto-quote mais en même temps je pense avoir avancé beaucoup d’arguments, et réécrire la même chose une 2nde fois c’est long et pas spécialement agréable
Je rajouterais que quand on est face à un villain qui a des difficultés à faire augmenter la taille du pot (et c’est très souvent le cas) on a tout intérêt à le faire nous même. Si on est vs le reg aggro de la limite qui va être capable de 3 barrel bluff en 3BP alors ok pour slowplay AQo. Mais à mon avis s’il est capable de mettre le 2nd barrel en bluff ce sera déjà pas si mal. Si on fait fold des bluffs au flop, ce sera probablement des bluffs qu’il aurait GU turn anyway. Si on commence à avoir des fréquences de raise intéressantes dans ce spot on va potentiellement se faire call par des bluffcatchers qui auraient check/fold turn.
Comme le disait @Degun avant de « fold ce post », (et même si sincèrement cette discussion est intéressante et montre de grandes capacités de réflexion et d’analyse), ça reste de la NL10, hein…
C’était ça ou ouvrir plusieurs blogs de whine, voire basculer en PLO (voire les deux) mais je me suis dit que ça ne ferait pas trop progresser et puis c’est déjà pris comme activité
Oui je suis d’accord que c’est un débat décalé pour un spot de NL10, c’est aussi ce que j’avance depuis le début.
Néanmoins ce type d’échange est très enrichissant et fait progresser pour la remise en cause du TP.
Qui sait, ça nous servira peut-être à @Renard9 et moi-même quand nous jouerons plus haut
@yvan161 ; @PierreLo : Déjà 57 messages !
J’avoue que j’ai lâché depuis 1 ou 2 messages (peut être un peu plus).
Pendant longtemps, je postais peu parce que je trouvais que pour avoir une réponse genre fold flop sans plus d’arguments, ce n’est pas constructif. Depuis quelques mains, j’avoue que mes posts ont ouverts de beaux débats avec des mains marginales
@bibibiatch : Si l’objectif de ta proposition de coaching est de progresser en argumentant les mains, les lignes prises, les lignes idéales, les lignes exploitantes, les lignes blanches (Ouups! j’ai écrit trop vite), j’adorerai le faire dans un p’tit groupe de travail motivé qui tienne plus de 3 jours.
@yvan161
De toute façon il te faudrait des années avant de pouvoir me concurrencer dans ces domaines (enfin…surtout dans le whine. le PLO, tu as toutes tes chances )
J’ai refait plusieurs simulations (en gardant ton paramétrage) avec des sizings et ranges différents.
Les sizings de la simulation plus haut et ranges GTO
Sizings 33% et 75% et ranges NL10 de PA (et je suis généreux avec Villain puisque ça fait 8% de 3bet et il ne les a pas) = évidemment vu le range advantage, c’est Cbet full range.
Je n’arrive pas à comprendre comment tu peux avoir des fréquences de check aussi hautes dans tes simulations.
Oui je fais une différence entre 75% de Cbet et Cbet full range.
Je ne sais pas quelle est la fréquence ‹ théorique › (les résultats varient tellement d’un paramétrage à l’autre) mais rien de choquant qu’en simplification même un bon reg de limites supérieures choisisse de Cbet full range.
Encore plus si le reg en question utilise des ranges de NL10.
Donc je ne suis pas sûr du tout que BB overCbet (ni par rapport à la théorie ni par rapport à son field).
Après je n’ai pas dit qu’il fallait absolument qu’il ait un seul sizing de Cbet. Je n’en sais rien, je n’ai pas étudié la situation dans son ensemble (faut que je termine la master class de @Freudinou SBvsBU d’abord ).
Tu m’accorderas, j’espère, que au moins je cherche à tester ton raisonnement
(et puis j’ai vu que l’on était d’accord sur plein d’autres sujets )
C’est juste que je ne trouve pas d’éléments allant dans le sens qu’il faudrait raise ici pour exploiter le fait que BB Cbet trop.
… et je ne suis pas sûr que ce profil le fait en NL10.
Ca dépend du play. Un move river adapté à la NL500 risque d’être une catastrophe en NL10.
Mais bien sûr chercher des plays qui exploitent les faiblesses du field en allant à l’encontre des habitudes est une bonne chose et une qualité que n’ont effectivement pas forcément les regs qui restent coincés en micro.
Question qui n’a rien à voir
J’ai vu ton paramétrage intéressant …
… qui force l’ajout du sizing AI quasiment tout le temps et qui correspond à la case à cocher « Add AI » de PIO …
… mais avec 1000%.
Est-ce que tu le laisses systématiquement pour toutes les streets / toutes positions ou est-ce que tu en élagues (parce qu’il y en beaucoup que le solver ne va jamais choisir comme broke direct au flop par exemple) ?