Solveur et location de serveur : need conseils

Bonsoir @florian99p99 :monkey_face:

Un vrai plaisir de t’avoir dans le coin, mon ressenti vaut ce qu’il vaut mais si jamais il te passait par l’esprit d’y rester… j’en serais parmi les premiers heureux, et d’ailleurs @ImBatman devrait bien plus te prendre en exemple toi que moi.
Mon côté sombre ressurgit bien trop souvent pour que je me conseille à qui que ce soit. (parce que je laisse faire)

Tout à ton honneur d’aller néanmoins vers l’échange.
Sachant un petit peu comme c’est alors je te prie de bien vouloir accepter mes remerciements.
Ils ne sont que les miens mais j’espère qu’un jour ils compteront dans la balance.

Merci @florian99p99 de donner un dynamisme qui t’es propre et auquel moi personnellement je peux me rattacher à ce forum. :heart:

Bon même si je pense que tu fais un boulot d’animal qui va excessivement trop loin, la vérité c’est que dans un futur proche ou éloigné ce que tu fais toi là maintenant sera le standard de demain, donc autant être déjà au diapason (paroles de branleur).

J’en avais 2, ça doit pas être le point du tree qui pose le plus de problèmes.
Probablement la liberté au niveau du nombre de sizes de stab pour IP qui me mettait dedans, je voulais liberté max à environ 4 sizes de bet pour IP par street (ou 5 je sais plus).

Pour l’anecdote j’ai solve AAA BvB tree vraiment énervé, ce simple board qui comme tout les triplés est généralement rapide à solve, il m’a pris 28 heures.

Et oui exactement, moi quand je regarde mon comportement avec recul, même à l’époque où j’avais cette lubie de coller le plus possible à mes connaissances GTO j’étais déjà à des kilomètres d’amener ce qu’il fallait river…
Et aujourd’hui ça serait pas mieux hein.

Ok, je veux bien intégrer cet argument, peut-être que je vais me faire une semaine intégrale sur solver en prenant juste ça en compte, ça me titille un peu comme manière de voir les choses.
Ça a du sens, j’avoue avoir énormément négligé l’importance de river dans mon étude perso.
Je reviendrais en parler de ça, ça m’intéresse.

Non mais attend, est-ce que je réfléchis de la manière inverse depuis tout ce temps ?
Pensant que préflop conditionne flop qui conditionnera turn puis river ?
Si jamais c’est pas trop demander et que tu as un moyen d’expliquer comment tu remontes de river à flop, pareil j’avoue ça m’intéresse également.

Ah bah je sais pas si c’est « du monde » ni même d’ailleurs « du beau monde », mais moi je suis preneur :monkey_face:

Un plaisir, avec remerciements (oh les branleurs du fond de la classe, on demande pas énorme, lâche un like comme sur insta ça sera déjà bien).

J’ai connu pour une courte période, c’est pas la lassitude qui m’a arrêté, mais je pouvais pas m’infliger ça, trop fragile… (non je déconne j’ai juste pas réussi les semaines de 60h+, faut une vraie motivation que j’ai pas)

Bisous, c’est cool de t’avoir dans le coin.

1 « J'aime »

Je me permets une petite intervention sur un truc que je pense connaître un peu…

Pour expliquer ça, il faut voir comment fonctionne un solveur.

il prend les ranges, il calcule toutes les rivers et fait l’EV. Puis il regarde si turn l’EV turn, pour voir si l’EV est meilleure que fold ou aller dans un autre noeud pour chaque main. Si c’est le cas il refait les ranges et recalcule chaque river. Quand il atteint un consensus, il fait pareil pour chaque turn, puis vois s’il faut bouger des mains dans un autre noeud flop. Si c’est le cas il recalcule chaque river puis chaque turn avec les nouvelles ranges. Une fois arrivé à un consensus il se met à calculer le flop, et pareil pour le préflop chez ceux qui le font.

Du coup, au niveau calcul, on a bien river → turn → flop → preflop.

En soi, je pense que ce serait très efficace comme méthode d’apprentissage de bosser comme ça, le seul problème étant que 95% de nos décisions sont preflop et flop, du coup on aurait quelqu’un qui serait une grosse daube dans 95% des cas jusqu’à la fin de son processus d’apprentissage… L’autre problème, c’est que même si t’as totalement compris les mécanismes river, on s’en fout si t’es trop nul preflop et flop pour mettre des ranges correctes pour réfléchir.

2 « J'aime »

Alors en fait oui, si j’ai bien compris ce que tu racontes (et j’en suis pas sûr).

Bon la finalité c’est de comprendre comment solve un solver, j’ai cherché à une époque, gros mots clés google, j’ai jamais trouvé.

Je me suis dit, ça ressemble un petit peu à ce que tu racontes.
Que c’était un calcul gigantesque à une infinité d’inconnues (en fait les combos des deux ranges) qui obtiennent une EV chiffrée de par… l’empirisme et l’essai ?
Ce qui expliquerait les écarts de dEv vers le haut/bas durant le temps de calcul, genre on s’éloigne d’un résultat décent ou on s’en approche.

Si quelqu’un a la réponse à comment ça fonctionne j’avoue, ça me hante plus mais à une époque j’aurais bien aimé qu’on me vulgarise ça.

Et même si j’essaye d’élargir à ce que tu expliques, j’avoue j’ai encore un peu de mal à comprendre le véritable axiome et la véritable interaction de l’un vers l’autre dans ce sens, mais ça va finir par rentrer hein… faut juste qu’on m’explique longtemps… :speak_no_evil:

Bonsoir @Moufl0s

je vois sur ton profit que tu à commencer le poker avant 2008 Tu à bien plus d’expérience que mois dans le poker, et l’expérience et une compétence très importante je suppose, pour te donner une idée en 2008 j’étais encore à l’école primaire.

Ok j’essayerai dans parler dans l’article, mais en gros l’idée c’est que si on comprend les spot défavorable river, les spot favorable, les mauvais blocker … , sa peut nous orienter sur la compréhension de la turn.
Dans ton étude de la théorie tu à forcement un moment regarder la strat river, pour comprendre par exemple pourquoi le solver préfère bet un suit plutôt qu’un autre turn.

le poker c’est un domaine qui me passionne, quand je me couche le soir, je n’ai pas forcement l’impression d’avoir travailler.

Je ne connais pas les algorithmes des solver, mais pour résoudre un jeu de manière informatique on utilise ce que appelle un jeu fictif

En gros chaque joueur va démarrer avec une strat candidat, après un des deux joueur va trouver le jeu exploitant maximal disons le joueur 2 , ensuite on combine la strat d’exploitation maximum avec la strat candidat en mixant les deux avec un poids constant
Par exemple si W est le poids de mixage, alors pour chaque point de décision on combine l’ancienne stratégie Sa, et la nouvelle start explo max sn

S mixte = (1 – W) sa + W sn
Si on répète se processus au jeu fictif, les stratégies finiront par converger vers la strat optimal.

1 « J'aime »

Ah, excuse-moi on va être un peu hors-sujet.
Non je « pratique » le poker depuis 2007-2008 mais j’ai été un shlag pendant une décennie et j’étais globalement un récréatif/ultra mauvais reg pendant quasiment 10 ans.
J’ai commencé l’éveil en 2017 et franchement c’était pas beau à voir le début… un vrai co***rd.
Bon pareil aujourd’hui.

Bah tu vois je le lis et relis, et encore en vrai maintenant…
Je veux dire je suis un peu un branleur mais sous solver j’ai mis des heures, j’ai pas compté, j’ai envoyé un gros volume…
Ce que tu me dis là, c’est une énormité pour moi, un truc auquel je suis passé à côté… c’est fou
Je te jure ça va péter mon esprit, mais avec plaisir… enfin j’espère :see_no_evil:

Dis-moi que tu en rêves régulièrement, que t’arrives pas à t’en passer même quand tu essayes le plus. Que même sans jouer sous la douche c’est ce à quoi tu penses… et je comprends bien ce que tu veux dire.

Ok je vois à peu près, je suis un peu réticent au truc mais t’as fait ça bien, je vois globalement l’idée de ce que tu essayes de me verbaliser.
J’ai peur que solver soit infiniment plus complexe non ?

Anyway maxi-zoubis :kiss:

1 « J'aime »

(je sais que tu sais probablement tout ce que je vais écrire, mais ce post pourra peut etre aider d’autre personne)
Même pour les explo il faut voir le jeu jusque à la river, par exemple si on est en SB BB, et que on noodlock le solver en donnant à BB une range trop orienter value au flop après un check de la SB, alors le solver va overfold en explo, car il va considérer que BB à fait une erreur flop, mais qu’elle va jouer parfaitement turn et river.

Mais si BB arrive river avec trop de bluff, alors call call call sera plus exploitant que fold flop

Voici une capture d’écran de mon block note qui résume les règles de bluff catch sur deux street polar vs capped.


Au poker on ne peut malheureusement pas isoler une street et l’analyser seul. Tout l’arbre doit être considérer.

je te met un copie coller d’un de mes premier message que j’ai écrit sur le forum à @blagops :

[Vidéo coaching] Blagops coache Benj (Partie1 & 2) - Stratégie / Sng & Expresso - Forum Poker Académie (poker-academie.com)

Merci, d’avoir pris le temps d’avoir lu est répondu à mon commentaire.

D’ailleurs, je me suis rendu compte que j’avais fait une erreur dans mon tout dernier calcule, mais ça ne change rien pour les explications.

Sinon même dans les jeux simplifier, on peut trouver des résultats surprennent sur le MDF

exemple : SB D vs BB (heads up)
Le jeu commence a la turn et la range de la BB est polarisé, il a soit nuts ou airs et le jeu est statique

dans ce jeu la SB ne doit jamais bet, car EV bet < EV check et la BB ne doit jamais check c’est nuts.
car EV BB (check turn avec nuts et shove river) = (S + P) + S * P / (S + P)

S = stack (turn), P = pot (turn), B = bet turn

et l’EV BB (bet-bet avec les nuts)
= (S + P) + (B) (P / (P + B)) (((S – B) / (S – B + P + 2 B))) + (S) ((P) / (P + B)) ((P + 2B) / (S – B + P + 2 B))

si on soustrait la ligne bet turn bet river à celle de check turn bet river le resultat sera positive, donc EV bet turn bet river > EV check turn bet river

ce qui fait que dans le cas de la ligne check bet la SB a plusieure fréquence de call inexploitable

il doit call au moins p / (S + P) et il doit call moins que x :
S + - S x + (1 - x) P = - ((S + P) + (B) (P / (P + B)) (((S – B) / (S – B + P + 2 B))) + (S) ((P) / (P + B)) ((P + 2B) / (S – B + P + 2 B)) - ((S + P) + S * x))

Pour un bet pot la solution est de call entre 50 % et 69.4 %, est quelle que soit la fréquence choisit entre les deux nombre on sera inexploitable

Donc comme tu peux le voir en GTO, on ne peut pas étudier une branche de l’arbre sans prendre en compte l’ensemble de toute le tree (comme tu la très bien explique dans la vidéo)

On peut retrouver plein d’exemple de ce genre dans les toys games

Bonne année à toi aussi

Oui je pense au poker 24 h sur 24, même si je fait une activité qui n’a rien à voir avec le poker, par exemple manger, discuter, regarder une vidéo YT sur les échecs … je vais penser au poker, quand je dort je rêve du poker, je vais repenser à tout les spot que j’ai analyser, je vais splitter les range dans ma tête …

3 « J'aime »

Bah si tu veux vraiment savoir en détails, MP, perso j’ai commencé à en écrire un (bon, obv laissé tomber car pas le temps mais commencé quoi…) Un super en plus, il aurait donné lui-même les sizings.

1 « J'aime »

Je vous remercie beaucoup @Moufl0s et @florian99p99 d’avoir pris le temps de me répondre et d’une manière aussi complète, vraiment merci :slight_smile:

Vos réponses sont d’une grande valeur et je comprends mieux pourquoi je tournais pas mal en rond…

Concrètement c’était ça qui me préoccupait :

Supposons qu’on open au Hj (avec une range de 21,12% disons de GTO wizard (un site internet de « gto » à priori")). Et que Vilain 3bet X% (en CoVsHj par exemple).

Vilain peut 3bet/Call ou 3bet/Fold :

Comment devons nous nous adapter ?

Stratégie de 4bet Linéaire vs un vilain qui a tendance à 3bet/Call ?
Polarisé vs un vilain qui a tendance à 3bet/Fold ?
Ou on s’en fout on prend les mêmes combos ? Ou alors on ne prend pas les mêmes combos puisque certains vaudrait mieux les calls ?

Si il 3bet bcp bcp plus que ce qu’il devrait (d’ailleurs d’où sort le % théorique de 3bet CovsHJ par exemple?):
-on 4bet plus ? (Si oui à quel point ?)
-On Call plus (pour le laisser avec tte ses mains marginales qu’il aura du mal à assumer flop?) ?
-Ca dépend de sa stratégie de 3bet (liné ou pola)?
-On doit resserrer (un peu ? moyen ? beaucoup ?) notre range avant d’open ?

Disons qu’on a une range de 21% Hj vs 3bet vilain 10% au Co on def 35% (on devrait def 50% ? pq ?) de notre range comment cela évolue en fonction du taux de 3bet de vilain ? :
-On def toujours la même fréquence mais c’est notre fréquence de call/raise qui va changer ?
–On def la même fréquence, postflop on sera plus strong c’est tout.
-On déf une fréquence plus élevé ?

Au final comment doivent se construire les ranges préflop ? Quand on raise en value on doit systématiquement se demander si Vilain peut nous call avec moins bien et quan don est en bluff on doit se demander si on peut faire fold mieux ? (pareils pour nos ranges de 3bet/4bet) ?

Par exemple supposons qu’en Lj on 4bet Bluff KQs 50% du temps c’est pour faire fold quoi ? :
-de l’équité ?
-ou c’est juste pour équilibrer et être quasi en flip vs 99-JJ en ayant de bon bloqueurs (pour éviter de se faire 5bet shove vs KK-QQ) ?
-Ou on ne 4bet pas cette main du coup ?

Dernière petite question est-ce qu’il faut être absolument à l’équilibre dans notre range de 4bet (autant de combos de value et de « bluff ») et s’adapter en fonction du profil en face ou il y a une proportion optimale théorique genre 60/40 ce genre de choses ?

Voilà pourquoi j’ai décidé d’acheter Simple preflop et que je voulais louer un serveur etc afin de voir tout ça de mes propres yeux aha

Mais avec tout ce que vous avez dit j’ai plus peur de faire des simus et d’en tirer des mauvaises conclusion aha

Ah et au fait j’ai jamais vu de courbes avec genre +8bb/100 en NL50 minimum avec un sample de +200K hands. Genre c’est vraiment ce que j’ai envie d’avoir mais j’ai peur de courir après un truc impossible. Si vous me dites que c’est possible je n’abandonnerai pas !

@florian99p99 @Moufl0s

1 « J'aime »

Les mecs, pour ce que ça vaut, vous êtes quand même impressionnants.
J’ai l’impression d’être Garcimore face à Einstein x2.
(bon, ceci dit, j’aime bien GArcimore).

Je suis scotché par le niveau des discussions et des calculs, surtout par les posts de @florian99p99 en général
( ne le prends pas mal @Moufl0s, t’es un bon aussi, mais le mec était en primaire en 2008, quoi :exploding_head: :exploding_head:)

Moi qui fais tout le temps chier sur l’orthographe, là je ferme ma grande gueule devant le niveau de raisonnement. Respect.

3 « J'aime »

Salut si vilain se défend qu’en 3 bets or call, et qui fold trop vs 4 bet , alors 4 bets le abusivement, s’il call trop vs 4 bet, ca ne veut pas dire que le 4 bet polar est mauvais, pour ça il faut que tu regarde comment il joue flop, et s’il joue bien flop ça ne veut pas encore dire que c’est mauvais, pour ca il faut regarder turn … ensuite river. S’il joue bien les 3 street, tu va juste jetez de l’argent par la fenêtre à 4 bets polar, donc oui 4 bet linéaire est mieux. Ca veux aussi dire que sa range de call 4 bet sera plus faible, car il call plus, ton % de 4 bets va baisser. Pour le bottom 4 bet, pour choisir la ligne, tu devras regarder comment il joue post flop dans les deux ligne preflop, et comparer les EV.

Pour t’ai autre question je t conseille de lire le livre de Janda application of no limite holdem, les calculs mathématiques sont de niveau 6 -ème, donc très facile.

Sinn pour ta dernière question rien est impossible.

1 « J'aime »

J’ai juste pas compris le « ton % de 4bet va baisser. »

J’ai commandé le bouquin.

Tu peux m’en dire plus sur l’auteur ?

Je suppose que si tu me le conseille c’est qu’il doit savoir ce qu’il dit et avoir de la crédibilité aha

Merci en tout cas :slight_smile:

@florian99p99

Si tu arête de 4 bet tes pire mains, tu va donc 4 bet moins de combo.
L’auteur du livre c’est quelqu’un qui avait pas mal travaillé la théorie à l’époque, maintenant je crois qu’il joue plus, il doit être médecin ou un truc comme ca.
Le livre à été écrit avant la popularisation des solver, ducoup il y’a forcement des concept que l’auteur ne pouvais comprendre, mais ce livre va déjà je pense te donner un bon thinks processe pour le GTO, et Il est très facile à lire, tu peu le finir en quelque jour.

1 « J'aime »

Même @reyj n’ose pas reprendre @florian99p99 c’est pour dire !

Peut-être d’ailleurs que @reyj est @florian99p99

Derrière son troll, il a toujours caché qu’il était passionné par la théorie du poker depuis l’école primaire…

1 « J'aime »

Je te conseille la version anglaise, j’ai lu la version française, et il y’a des tonne de faute, que ce soit dans les calcule, les carte, tableau.
Je n’ai pas compter, mais j’ai du corrigé au moins plus de 60 faute.

Si tu veux un autre livre tu à aussi MOP, la pour le coup la version la version française, et vraiment de qualité, j’au du trouvé que max 10 faute, de mémoire il y’a tout un tableau qui est faux (dans le chapitre sur le size géométrique), il y’a des faute dans certaine matrice de gain (mais qui ne change pas le résultat) , mais dans la la version originale aussi, et je crois que un moment il y’a marquer que √2 - 1 = 1.41 alors que c’est 0.41
Il doit il y’avoir d’autre erreur, mais je l’ai lue il y’a longtemps.

1 « J'aime »

Fiou heureusement que tu es réactif je viens d’annuler la commande. Je l’avais pris en version française.

Mais du coup si il y a pleins d’erreurs, je suis moins chaud de le prendre. J’ai pas envie d’apprendre des trucs faux (si je ne suis pas capable de reconnaitre les erreurs de l’auteur).

Du coup tu as un livre ou qqch à me conseiller de qualité et dont je suis « sûr » de ne pas intégrer de fausses choses concernant le poker aha ?
Pcq étant donné la complexité du jeu je préfère à la limite écouter mon intuition qu’apprendre des choses fausses…

Pour en revenir au sujet des 4bets vs un Vilain qui abuse des 3bets mais qui ne fold pas ensuite (call trop vs 4bet) et qui en plus joue bien les streets.

Du coup quelle est l’adaptation ?
Il y a plusieurs options qui me semble logique mais je ne sais pas laquelle choisir, celle qui a le plus d’ev (ca dépend surement du rake aussi, rake élevé ==> plus partant pour augmenter les 4bets ?) :

-Ne pas trop toucher à ma range de 4bet (être bien équilibré, ne pas augmenter les combos de value et de bluff) mais augmenter ma range de call vs 3bet et def plus postflop (puisque sa range sera plus weak même avec l’avantage de la position).

-Ou augmenter ma range de 4bet en value, plus thin (et si vilain s’adapte en 5bettant plus faut être pret à go broke plus thin aussi), et ajouter des combos de bluff aussi pour rester équilibré.

-Ou alors ne rien toucher et juste def plus postflop en considérant la range de vilain plus weak ? (il aura juste trop de mal à assumer si on def bien supposons).

C’est vraiment ça qui me perturbe !

@florian99p99

Perso j adore simple postflop depuis 2 ans environ j utilise plus que ça, j ai fait + de 6000 simulations dans tous les spots possible SRP et 3bet que j utilise au quotidien

J’ai lu la conversation en travers donc je ne sais pas si quelqu’un t’a donné la réponse. Je crée moi même des solveurs dans le cadre de mon mémoire en informatique, sur des variantes simplifiée pour commencer et j’upscale petit à petit (j’ai un solveur fonctionnel pour le kuhn poker, leduc hold’em, royal holdem et je bosse actuellement sur un solveur pour le short deck). Si tu veux voir comment peut fonctionner un solveur, une bonne base est de faire des recherches sur l’algorithme « Counterfactual regret minimization ».

Je suis nul à l’écrit et mauvais vulgarisateur donc je ne pourrais pas trop t’aider, cependant je vais quand même partager quelques ressources que j’ai utilisée pour comprendre et créer mes solveurs, au cas ou ça puisse aider quelqu’un dans le futur.

Voici quelques ressources (faut quand même être à l’aise avec les maths et l’anglais):

Page web qui résume le bordel de la plus simple des manières (pas facile pour autant): Counterfactual Regret Minimization - the core of Poker AI beating professional players int8.io

Et des papiers scientifiques pour ceux qui veulent approfondir et créer leur propre solveur (faut être à l’aise avec les maths et savoir programmer):

Regret Minimization in games with incomplete information : 2007 : original CFR paper
http://poker.cs.ualberta.ca/publications/NIPS07-cfr.pdf

Monte Carlo Sampling for Regret Minimization in Extensive Games : 2009
http://mlanctot.info/files/papers/nips09mccfr.pdf

Efficient Monte Carlo Counterfactual Regret Minimization in Games with Many Player Actions : 2012 : MCCFR
https://papers.nips.cc/paper/2012/file/3df1d4b96d8976ff5986393e8767f5b2-Paper.pdf

An introduction to CFR : 2013
http://modelai.gettysburg.edu/2013/cfr/cfr.pdf

Solving Large Imperfect Information Games Using CFR+ : 2014
https://arxiv.org/pdf/1407.5042.pdf

Solving Heads-Up Limit Texas Hold’em : 2015
https://www.ijcai.org/Proceedings/15/Papers/097.pdf

Heads-up Limit Hold’em Poker is Solved : 2015
https://webdocs.cs.ualberta.ca/~bowling/papers/15science.pdf

Heads-up Limit Hold’em Poker is Solved : 2017 : Cepheus version
https://poker.cs.ualberta.ca/publications/heads-up_limit_poker_is_solved.acm2017.pdf

Libratus: The Superhuman AI for No-Limit Poker : 2017
https://www.cs.cmu.edu/~noamb/papers/17-IJCAI-Libratus.pdf

Edit: Une petite série de vidéo ou le mec explique un peu le principe de l’algorithme en construisant un bot poker Ian Sullivan - YouTube

2 « J'aime »

Ce sont des algorithmes de « regret minimization », prenons l’exemple du pierre, feuille, ciseaux sauf que chaque joueur mise 1$.

Admettons que joueur 1 ai une stratégie uniforme et que la stratégie de joueur 2 soit de toujours jouer ciseaux.

Si je joueur 1 joue feuille lors du premier tour et que le joueur 2 joue ciseaux, ils obtiennent ce qu’on appel un reward (un gain), dans ce cas le joueur 1 obtient un reward de -1 et le joueur 2 obtient un reward de 1.

Quand le joueur 1 obtient un reward, il va regarder si il n’aurait pas mieux fait de choisir (si il ne regrette pas) une autre action. Dans notre exemple, le joueur 1 joue feuille et perd contre le joueur 2 qui joue ciseaux, donc le joueur 1 regrette de ne pas avoir joué la pierre (reward 1) ou feuille (égalité donc reward 0). Il va donc actualiser sa stratégie lors de la prochaine partie pour jouer plus souvent pierre et feuille (avec un poids plus élevé pour la pierre qui lui apporte un meilleur reward) et moins souvent ciseaux.

L’algorithme va converger vers une stratégie optimale et finir par jouer 100% pierre car notre adversaire ne s’adapte pas et joue 100% ciseaux.

Pierre 100%
Papier 0%
Ciseaux 0%

Cependant comment faire si l’adversaire décide de s’adapter? Les deux adversaires vont utiliser le principe de regret minimization et s’adapter l’un à l’autre à chaque partie. (on lance l’algorithme pour les 2 joueurs)

Ils commencent tous les deux avec une strat de départ uniforme, même probabilité pour chaque action, ici la strat de départ serait:

pierre 33%
papier 33%
ciseaux 33%

A chaque itérations, ils vont adapter leur stratégie et au final, quand on prend la moyenne de toute les stratégies jouée sur toutes les itérations, l’algorithme convergera vers un équilibre de Nash. (dans le cas d’un pierre feuille ciseaux, la stratégie optimal qu’on obtiendra sera une stratégie 33 33 33) Le principe est plutôt similaire pour les solveur poker sauf que les contraintes dû à la taille immense de l’arbre de décision nous oblige à utiliser des variantes de cet algorithme un peu plus poussée et de faire des abstractions du jeu (comme limiter le nombre possible de sizings).

Voilà un article de vulgarisation qui explique tout ça beaucoup mieux que moi: Counterfactual Regret Minimization | by Ziad SALLOUM | Towards Data Science

1 « J'aime »

Merci pour les explication, et tout ses lien, ca à l’air très intéressant.

1 « J'aime »

en livre Français sur la théorie tu n’a pas grand chose, tu à Moderne poker théorie, mais la version française est pas terrible, tu à aussi poker math sup, la traduction est bien, mais c’est un livre avec beaucoup de mathématique, je ne pense pas que c’est ce que tu recherche.

sinn pour ta question, tu aura aucun vilain qui va joué parfaitement les 3 street, les vilain on commencé à intégrer les strat flop, mais pour que quelqu’un joue parfaitement les 3 street, il doit passer toute c’est journée sur le solver, et il n’y a pas grand monde qui est près à faire ca.