Probleme theorique PioSolver

hello all , En ce moment je regarde un peut pioSolver , et il y a quelque chose que je comprend pas , qui peut semblé pas très important , mais sa me frustre de pas comprendre du coup je tente de posé le probleme.

ce que je n’arrive pas a comprendre c’est : La frequence de bluffcatch river , pour une fréquence de bet de 100% avec range pour l’aggresseur completement polarisé

En gros , Si on fait une simulation river (cas le plus simple du poker), avec oop forcé a check , puis ip peut misé ou checké.et oop peut seulement call ou fold , pas raise.
Et si on met un range a ip completment polarisé entre nuts ou air.et qu’on met a oop que des bluffcatcher.
et pour finir qu’on force le sizing a etre pot.

Si vous faite une simu de ce type , vous verraient sans surprise que , ip va bet au maximum de value bet que ses bluff lui permette.et il aura toujours le même rapport bluff/value bet , ici pour pot , 2value bet pour 1 bluff.
donc sa fréquence de check sera simplement l’abandon des value bet si il n’a pas assez de bluff pour tous value , et inversement , les abandon des air si il n’a pas assez de value pour tous bluff.

et il se trouve que , en fonction de si , on a pas assez de bluff ou pas assez de value , sa change completement la fréquence de defense de oop , de 0% de defense si il nous reste de la value , et 50% si il nous reste des bluff.

une hypothese qui semble coherente serait , si on a un trop plein de value , alors l’équation d’indifférence se portera sur la frontière entre Value les nuts restant ou les check , et dans ce cas il faut qu’il defende 0% du temps pour qu’on ne puisse pas décalé nos nuts en trop du pole check a value et augmenté unilatéralement notre esperance.
A l’inverse si , il nous reste des bluff en trop , alors la frontière entre bluff ou check une main a 0 equité est 0.
et nos bluff on une ev a 0 lorsque oop défend 50% du temps pour un sizing pot.

Donc pas de soucis a priori avec ces valeurs , mais , Si il y a exactement le nombre de combos de bluff pour value tous nos combos de nuts , alors dans ce cas , toutes les mains de ip sont utilisé a bluff ou a value et dans ce cas , oop est complétement indifférent a défendre tel ou tel frequence.

Alors pourquoi PioSolver décide de défendre 33% et pas autre chose ?

Surtout que cette frequence diffère en fonction du sizing, pour 1/2pot sa sera 50% , donc elle n’est pas arbitraire et sa m’enerve de pas comprendre pourquoi 33% ou 50% alors que toutes valeurs, a exactement le même impacte.

Pour ceux pour qui ce n’est pas clair , probablement la majorité , je donne un exemple pour observé sa sur Piosolver.Pas besoins d’avoir de license , c’est uniquement river.

board : 22235r
Range oop : 99
Range ip : AA , 0.75*QKs (il faut utilisé la fonction qui permet de mettre seulement 75% de Qks pour avoir que 3combos)
Sizing pot forcé.(100%)
On autorise pas de raise ou de donk bet de oop.(on touche pas le champs de oop)

puis on observe , que :

-Ip bet 100% et oop defend 33% environs ???

Ensuite , si on change le 0.75 en 0.74 , alors on aura un trop plein de value et on voit que :

-Ip bet proche de 100% , et oop defend 0%.

Ensuite si on change le 0.75 en 0.76 alors on aura un trop plein de bluff , et on voit que :

-ip bet proche de 100% , et oop defend 50%.

mais bordel d’ou vient ce 33% ? ^^

(Il y a un thread en trop, si un modo peut supprimé l’autre sa serait cool merci ! )

Edit : Attention pour ceux qui veulent faire une simulation identique , mais en changeant les mains , pour que les résultat soit identique a ceux que je donne au dessus , il faut evité le removal effect dans les range.

Bon, je suis pas un pro du logiciel mais pour ce spot imo : on s’en fou. En fait, avec un bet pot, la fréquence de call théorique est 50% (j’ai pas l’impression d’avoir besoin de rentrer dans les détails, si?).

Ici, si on call 50%, l’EV de la value est : %foldPot+%call2Pot=1.5P et l’EV de bluff est : %foldPot-%callPot =0P. L’EVglobale est 1P (2/31.5P-1/30).
Maintenant, si on call 1/3, on arrive à value : 2/3P+1/3
2P = 4/3P (ou P+1/3P) et bluff : 2/3P-1/3P = 1/3P; et EV globale = Pot.

Ca revient au même, mais EVvalue est 11/3 supérieure à l’EV globale attendue, et EVbluff est 1/3 supérieure à l’EV bluff attendue. De mon point de vue, ça veut dire que le logiciel prend comme point de départ l’EV attendue, le %age de bluff, et il augmente progressivement l’EV des bluffs et value ensemble jusqu’à arriver au point où elles ont augmenté du maximum ensemble.

Comme j’ai l’impression de pas être clair, je fais un exemple :
Pio test la fréquence théorique pour ce bet : 2value 1bluff, et 50%bluffcatch. value = 1.5P (+0.5P pour l’EV expected); bluff = 0 (+0P pour l’EVbluff expected) et EVglobale = 1P.
Puis, il regarde si bluffcatcher aurait intérêt à moins bluffcatch, donc il catch un poil moins, disons 45%, puis 40%… etc jusqu’à 1/3.
A 1/3 de call, d’une part Mr bluffcatcher n’a pas perdu d’EV, et d’autre part Mr value est équilibré au niveau de l’EV qu’il gagne par rapport à la théorie en value et en bluff (+1/3 pour les 2).

Je pense qu’il fait ça parce que dans certains cas il faut augmenter l’EV des bluffs, dans d’autres de la value; ça me paraît donc logique qu’ils essaient d’augmenter les 2 ensemble, et dans les cas de “pur équilibre” comme tu as fait, ça fait un petit biais qui fait call ces 33%. Mais bon à mon avis c’est simplement une limite du logiciel dans un spot ou il ne sert à rien (il est impossible à l’un ou l’autre d’être exploité, puisque l’un est limité dans sa range et l’autre a une situation ou ce qu’il fait n’a pas d’importance).

A noter que dès qu’on revient à des trucs plus standards (un peu trop de bluffs ou un peu trop de value), pio revient à la raison et reprend les fréquences standard.

Tout ça pour dire qu’imo tu t’es bloqué sur un truc qui n’a pas d’importance (quel pavé pour cette conclusion !!! :stuck_out_tongue: )

[quote=“WaitWaitW, post:957483”]Bon, je suis pas un pro du logiciel mais pour ce spot imo : on s’en fou. En fait, avec un bet pot, la fréquence de call théorique est 50% (j’ai pas l’impression d’avoir besoin de rentrer dans les détails, si?).

Ici, si on call 50%, l’EV de la value est : %foldPot+%call2Pot=1.5P et l’EV de bluff est : %foldPot-%callPot =0P. L’EVglobale est 1P (2/31.5P-1/30).
Maintenant, si on call 1/3, on arrive à value : 2/3P+1/3
2P = 4/3P (ou P+1/3P) et bluff : 2/3P-1/3P = 1/3P; et EV globale = Pot.

Ca revient au même, mais EVvalue est 11/3 supérieure à l’EV globale attendue, et EVbluff est 1/3 supérieure à l’EV bluff attendue. De mon point de vue, ça veut dire que le logiciel prend comme point de départ l’EV attendue, le %age de bluff, et il augmente progressivement l’EV des bluffs et value ensemble jusqu’à arriver au point où elles ont augmenté du maximum ensemble.

Comme j’ai l’impression de pas être clair, je fais un exemple :
Pio test la fréquence théorique pour ce bet : 2value 1bluff, et 50%bluffcatch. value = 1.5P (+0.5P pour l’EV expected); bluff = 0 (+0P pour l’EVbluff expected) et EVglobale = 1P.
Puis, il regarde si bluffcatcher aurait intérêt à moins bluffcatch, donc il catch un poil moins, disons 45%, puis 40%… etc jusqu’à 1/3.
A 1/3 de call, d’une part Mr bluffcatcher n’a pas perdu d’EV, et d’autre part Mr value est équilibré au niveau de l’EV qu’il gagne par rapport à la théorie en value et en bluff (+1/3 pour les 2).

Je pense qu’il fait ça parce que dans certains cas il faut augmenter l’EV des bluffs, dans d’autres de la value; ça me paraît donc logique qu’ils essaient d’augmenter les 2 ensemble, et dans les cas de “pur équilibre” comme tu as fait, ça fait un petit biais qui fait call ces 33%. Mais bon à mon avis c’est simplement une limite du logiciel dans un spot ou il ne sert à rien (il est impossible à l’un ou l’autre d’être exploité, puisque l’un est limité dans sa range et l’autre a une situation ou ce qu’il fait n’a pas d’importance).

A noter que dès qu’on revient à des trucs plus standards (un peu trop de bluffs ou un peu trop de value), pio revient à la raison et reprend les fréquences standard.

Tout ça pour dire qu’imo tu t’es bloqué sur un truc qui n’a pas d’importance (quel pavé pour cette conclusion !!! :stuck_out_tongue: )[/quote]

Yes niquel waitwaitW.

Effectivement , je me douté que le chiffre en lui même n’avais pas d’importance dans cette situation mais du coup je voulais comprendre pourquoi 33%.

ce que tu dit en faite c’est que la frequence de défense est tel que : la plus value faite par nos value hand , et celle faite par nos bluff,soit identique en fonction de sa frequence de defense. ?? (même si sa n’impacte pas l’ev globale mais comme une sorte de dernier ajustement parfait a faire dans cette situation)

je suppose que c’est sa étant donné que on peut retrouvé aussi la valeur pour un bet pot ou 1/2p en posant ce que j’ai cru comprendre de ce que tu énonce :

C*(P+S) + (1-C)§ - P = C*(-S) + (1-C)§
CP + CS + P - CP - P = -C(S) + P - CP
2C
(S) + (C*P) = P
C(2S+P) = P
C = P / (2S+P)

avec C = frequence call , S = sizing , P¨= pot.
Avec P = 1 on a bien pour S = 1 , C = 1/3. et pour S=0.5 on a bien c = 1/2.

Du coup a priori tu a raisons , le 33% ou le 50% pour un bet 1/2p vienne du faite qu’il cherche a rendre équivalent la plus value entre nos value hand et nos bluff , de maniere a ce que aucune de nos mains n’est intérêt a changer de place entre value ou bluff , mais on s’en fiche puisque c’est deja le cas dans une situation de parfaite polarisation.
En faite , il fait comme si sa pouvais faire sens de bluff une nuts ou value un bluff.

Apres j’avais compris que ce chiffre n’a de sens que pour l’algo mais je voulais comprendre , et grâce a toi c’est fait merci mec !

[quote=“sixsicksix, post:957519”]ce que tu dit en faite c’est que la frequence de défense est tel que : la plus value faite par nos value hand , et celle faite par nos bluff,soit identique en fonction de sa frequence de defense. ?? (même si sa n’impacte pas l’ev globale mais comme une sorte de dernier ajustement parfait a faire dans cette situation)

Apres j’avais compris que ce chiffre n’a de sens que pour l’algo mais je voulais comprendre , et grâce a toi c’est fait merci mec ![/quote]

C’est bien ça, mais je préfère répéter, en fait on peut considérer que c’est un peu comme un “bug du logiciel” (là il aurait juste dû rester sur le 50% théorique), que les développeurs n’ont soit pas vu parce que c’est une situation bien particulière, soit pas pris en compte parce que ça n’a aucun impact; mais ajuster les fréquences pour que la plus-value de nos bluffs et de nos value hands soit égale n’a en soi aucune importance. Mais comme chacune peut avoir de l’importance selon le spot, ça me parait logique qu’ils aient ce type d’algo…