Analyse du jeu de Pluribus, l'IA "invincible" de Facebook

Petit détail mais quand tu mets un lien, si tu peux mettre le lien du message pertinent histoire de pas avoir à se taper la page entière :slight_smile:

Pour revenir au sujet principal, ça ne répond pas à ton « objection » sur la phrase incriminée :
« Second, if a player is faced with an all-in bet on the river and is 50/50 between calling and folding, they could take the expected value of both actions rather than flipping a coin. »

Oups désolé c’est ce que je voulais faire : erreur de copier/coller.

Non c’est juste un indice qu’il est possible que les concepteurs ne maîtrisent pas certains concepts pokéristiques simples.

Pour moi au mieux la phrase est imprécise, au pire elle ne veut rien dire (mais je peux me tromper).

Je suis en train de lire la séance de Q&A des auteurs et je rigole un peu … :slight_smile:

C’est quand même le point clef la question de l’échantillon et de l’outil de ‘réduction de variance’

Le pblem c’est que pour moi en l’état actuel la phrase ne veut rien dire (mais je me trompe sans doute, restons prudent), or c’est un des 4 exemples qu’il prend pour expliquer AIVAT, c’est gênant. (bien qu’ overall je sois bcp moins sceptique que toi sur la qualité de leurs travaux)

Plus globalement, le côté scientifique qui connait à peine les règles du poker ça se ressent depuis le début dés qu’un joueur de poker leur pose une question. Ils auraient pondu un bot pour jouer au tarot ou à la coinche, pour eux ce serait la même chose : réduire le monde (le monde étant ici une main de poker) à des équations et des algos.

1 « J'aime »

Le premier n’est pas bon non plus et je suis en train d’étudier le troisième qui m’a paru biaisé également dans les premières explications succintes.

Autrement dit ça part du postulat que le bot est meilleur que l’humain et qu’il joue à l’équilibre (il faudrait le résultat de 6AI pour valider que c’est ‘nécessairement EV0’).
Si l’humain dégage une EV supérieure à celle du bot, ça va être considéré comme de la chance et pas comme du edge.

Et en plus le raisonnement est étendu sur toute la range.

Si les humains sont vraiment meilleurs alors le winrate ajusté de Pluribus sera toujours supérieur à son winrate observé, renversant paradoxalement la tendance et donnant une conclusion faussée.
J’ai l’impression que l’ajustement n’est pas fait pour les humains (par exemple quand l’EV de leur décision est inférieure à celle qu’aurait eu Pluribus) mais cette partie n’est pas claire.

Je ne pense pas que ce sont des charlots évidemment et je n’ai pas la prétention de pourvoir remettre en cause scientifiquement leurs travaux mais je suis sceptique sur la façon dont les résultats sont présentés.

Mais oui ils ont probablement pondu un logiciel sachant jouer au poker et posant des difficultés même aux meilleurs.

1 « J'aime »

Concernant spécifiquement le paragraphe sur AIVAT, peut être un “simple” problème de vulgarisation…

A suivre.

Les gars vous êtes des ouf.
Sinon un lien pour avoir les 10k mains en review???
Ou tu les as trouver freud?

1 « J'aime »

Pour les intéressés les plays de Pluribus en videos

3 « J'aime »

j aime bien le call avec 55 moi

1 « J'aime »

J’ai un peu regardé les stats de Pluribus et visionné quelques vidéos du lien de Balla. Et je ne suis pas peu fier de retrouver quelques points communs entre mon jeu et celui du bot^^. Bien sûr je ne résiste pas à l’envie d’analyser les stats de Pluribus.

D’abord quelques particularités que je retrouve dans mon propre jeu:

  • Il 3bet relativement peu. On l’a même vu cc QQ ou AKo IP vs EP (dont une fois pour NYBR son QQ), voir même BU vs CO pour QQ. Par contre ses KK+ ne sont jamais flat. Il est intéressant de voir que son range de 3bet n’est ni linéaire ni polarisé, mais une sorte de mélange des deux.

  • Vs 4bet il défend très peu en 5bet et bcp en call 4bet. Même ses AA KK sont souvent call 4bet. A un moment j’ai même cru qu’il n’avait pas de range de 5bet, mais finalement si. Je ne sais pas s’il a des 5bet light, mais comme il défend bcp en call 4bet s’il en a, il n’a pas besoin d’en avoir beaucoup. Je me souviens encore de discussions où je me faisais incendier parce que je callais les 4bet, mais avec mes 55% de fold to 4bet, je suis presque weak à coté de Pluribus (51%)^^.

  • Il CBet flop assez peu en SRP. Il est intéressant de voir qu’il fold peu à la fois aux raise CBet et aux stab (au moins flop). Par contre il CBet bcp en 3bet pot (73%).

  • Il 2 barrel peu, 43%. Alors que justement il CBet déjà peu au flop. Je précise que ma propre stat de 2 barrel a baissé quand j’ai adopté une strat de CBet flop à 1/3 pot pour deny d’equity. J’ai peu réadapté mes range turn pour transformer une partie de ces CBet en bluff. A noter que généralement c’est à la turn que les joueurs fold le moins… J’ignore pourquoi cette stat est relativement basse chez Pluribus, même si j’ai vaguement quelques idées en tête.

  • Il probe bet peu. De manière générale il stab peu (cf plus bas). Mais avec le probe bet il fait vraiment nity (28%). Même moi qui considère mon probe bet comme un leak je fais mieux (environ 35-40%). Même si le sample est trop petit pour considérer ce 28% comme fiable, je pense qu’on peut quand même dire, au vu de l’ensemble de ses stats, qu’il prend peu ces spots. Pourquoi ? J’avance des hypothèses dans la partie sur les stab plus bas.

Autres caractéristiques, pour ceux qui n’ont pas eu le courage de décortiquer les stats postées par Freudinou:

  • Il a des RFI plutôt condensés, du moins plus resserrés que la plupart des regs standards: 18/24/30/42 (la SB est particulière à cause de ses open limp). Plus loose que la plupart des Humains HJ et CO (mais avec des open à 2x-2.5x), mais plus tight BU (sans être non plus nit).

  • Son 3bet du BU (6.77) est assez faible. Et son resteal est pas très élevé mais n’est pas non plus nity. Par contre il 3bet quand même 17% en BvB, ce qui est une valeur généralement considérée comme correcte.

  • Étrangement il fold vs 3bet plus souvent IP que OOP. C’est sans doute le faible sample qui donne ça.

  • De même il squeeze vraiment peu: 5.51%. Cela me parait quand même très faible. La raison ? Peut-être parce qu’il “considère” qu’affronter deux ranges l’oblige à être plus tight. C’est ici une strat qui serait nettement sous optimale en table réelle, surtout avec des récréatifs.

  • Il 4bet peu. On l’a même vu juste call 3bet BU vs blindes w/QQ. Mais c’est encore une stat peu fiable sur ce sample. Par contre celle de call 3bet l’est un peu plus et il semble pas mal call 3bet, faudrait voir ce que ça donne OOP. Evidemment il fold peu aux 5bet.

  • Ses call 2bet PF sont très intéressants. C’est pas en SB qu’il est le plus tight, loin de là, mais bien HJ et CO où ses cc sont très tight. Au contraire il défend plus en call qu’en 3bet en SB (de même au BU mais en étant étrangement plus tight). SB et BB il défend très loose, il défend plus de la moitié de ses mains BB vs CO !. J’imagine que ça vient aussi des sizings utilisés par ses adversaires.

  • WWSF à presque 51%. Je suppose que peu de multiway ont été jouées sur ces tables constituées de regs. Mais ça reste quand même assez élevé quand on considère qu’une bonne valeur tourne entre 45 et 48% (mais sur des tables avec des récréatifs et plus de pots multiway). En tout cas une chose est sûre: Pluribus se bat pour les pots ! D’ailleurs ses AFq sont dans la fourchette haute. Je serais aussi curieux de connaitre sa stat de bet river.

  • Il donk bet très peu au flop et à la river. Il est quand même intéressant de voir avec quoi il le fait flop (souvent en 3w) dans les vidéos postées. Turn par contre ça monte à 10.60% (mais j’ai pas regardé ici dans quels spots il le fait).

  • Il stab peu. J’ai une hypothèse: son range de call PF étant condensé il se retrouve souvent avec des mains moyennes avec lesquelles il n’a pas envie de faire grossir le pot. Et il protège aussi ses ranges de check back contre les delayed CBet. En passant, même si je ne connais pas sa stat de delayed CBet, en visionnant les vidéos j’ai eu l’impression qu’il reportait souvent son CBet à la turn. Un leak très répandu est de ne pas assez delayed CBet, Pluribus peut p-ê nous inspirer pour ça. Bien sûr comme il stab peu, il n’a pas de mal à bien défendre vs raise float bet. Mais difficile d’avoir une idée plus précise sur ce sample.

  • WTSD à 30.64%, WSD à 48.78% et Call R Eff à 1.22. Tendances CS ? On dirait (on le voit d’ailleurs ne pas lâcher over-pair post flop). Mais est-ce mauvais ? C’est plus difficile de répondre. Pour ceux qui ne sont pas habitués à ces stats, voici les valeurs que je considère comme OK: WTSD: entre 28 et 32. WSD: autour de 50% et jusqu’à 55% (même p-ê un peu plus en micro). Call R Eff: vers les 2, en sachant que plus cette stat descend et plus on perd les pots en callant river.

  • Je rajoute le Standard Deviation bb/100 qui est à 87. Pas parce qu’il sort des clous, mais justement pour montrer que Pluribus ne semble pas avoir un jeu spécialement low variance ou high variance. Pour ce que ça vaut sur ce sample. Mais cette stat me semble assez bien coller avec d’autres citées plus haut, comme des AFq plutôt élevés malgré un coté CS et peu de stack off PF.

PS: Tout ce que je viens d’écrire est à prendre avec des pincettes à cause du petit sample.

9 « J'aime »

Merci Yvan

1 « J'aime »

Comme je te sens plein d’entrain cher @Lacerta_max , voici les ranges d’open par position. Quelques surprises :wink: :

UTG

image

HIJACK

image

CUT-OFF

image

BOUTON

image

SMALL BLIND

image

OPEN LIMP SB

image

7 « J'aime »

D’autres que toi ne sont pas loin de penser la même chose :slight_smile:
Merci à @ilares pour le lien :
https://d3ltpfxjzvda6e.cloudfront.net/2019/09/19/PokerSnowie_vs._Pluribus_-_V4.pdf

pas réussi à cliquer sur le lien @grosrobert

Oui je vois que le lien ne fonctionne plus. Je ne sais pas pourquoi.
Peut être une histoire de lien qui redirige vers un site concurrent mais ce n’est qu’une hypothèse, j’en sais rien.

@Barth_Gury une idée ?

Le . dans l’adresse perturbe la reconnaissance de l’adresse en saisie libre, il faut utiliser la fonctionnalité d’ajout d’une adresse web.

L’humain reste meilleur que le bot pour résoudre ce genre de problème :wink:

https://d3ltpfxjzvda6e.cloudfront.net/2019/09/19/PokerSnowie_vs.Pluribus-_V4.pdf

1 « J'aime »

Pour ceux qui ne sont pas Gold, on a mis une main extraite de la vidéo d’Ilares sur Youtube. ( N’hésitez pas à liker la vid : ca fera monter la chaine dans YT :rocket: )

1 « J'aime »

@Freudinou , tu peux me dire a quoi correspondent les chiffres en dessous des combos dans les tableaux ?

et c’est bien ses ranges cash game 100bb deep c’est ça ?

et pouquoi certaines mains sont absentes ? il ne les a pas eu durant les 10k hands ? (exemples : qks au bu)

merci a toi de partager ça !

Bonne question : seulement 0,6% de chance qu’il n’ait jamais eu KQs au bouton sur 10K mains.
Idem pour Q9s et T9s.
Et difficile de croire qu’il ait choisi de ne pas les ouvrir quand il les a eu vu le reste de la range d’open.

UTG il ouvre 22% et MP 25%: plutôt loose EP le bot.

Merci pour le partage : oui sur la méthodologie et la communication.

A noter qu’il s’agit de concurrents (équipe PokerSnowie si j’ai bien compris) alors ce n’est pas forcément impartial mais je partage leurs critiques sur ces points là.

Le point intéressant à noter est que les humains n’ont pas voulu défier PokerSnowie (et Pluribus non plus … enfin ces concepteurs) donc on ne saura jamais le niveau réel du bot.

J’ai été déçu aussi des témoignages de certains humains en jeu contre Pluribus : un peu trop admiratifs du bot à mon gout.

Je n’ai pas le niveau technique pour juger du fond mais heureusement qu’il y a eu quelques analyses de coachs PA comme @Freudinou et @ilares pour questionner le jeu produit par la machine.

Mais le mal est fait en terme d’idées reçues suite à la communication dans les médias :wink:

2 « J'aime »