Et pour être plus précis : « le solver propose comme solution un profil de stratégies dominantes. »
Ce profil de stratégies ne contient pas de stratégies faiblement dominées même si elles sont co-optimales.
Je pense avoir bien compris les stratégies dominantes / dominées et la faible / stricte domination, néanmoins j’ai un doute sur les liens entre équilibre de Nash et stratégies optimales.
comprendre que n’importe quelle paire de stratégies co-optimales donnera les mêmes EV pour les deux joueurs ?
du coup, est-ce qu’il existe plusieurs équilibres de Nash pour un jeu donné (= paramètres saisis dans le solver) mais que le solver ne restitue que le profil de stratégies dominantes non faiblement dominées (pour les deux joueurs) ?
Autrement dit dans le cas du NLHE HU (sans rake), qu’est-ce qui est unique ? L’unicité du résultat (les EVs) ou le fait qu’il n’y a qu’un équilibre de Nash (comme semble l’indique l’article de Wikipédia en précisant que c’est la rencontre des deux stratégies dominantes) ?
c’est pas vraiment des paires. une strat est optimale contre n’importe quelle autre strat. Dans l’exemple qu’il y avait, changer ses bluffs ne changeait rien de la strat adverse.
n’importe quelle stratégie du coup, quelle que soit la strat en face
le solveur donne une strat. Laquelle dépendra de la manière dont il a été codé, et laquelle il trouve en premier du coup
euh, parfois il y a des trucs uniques, parfois non.
La réponse de IP à OOP peut être une ou plusieurs stratégies qui auront la même EV. Si OOP peut avoir plusieurs stratégies, IP aura une ou plusieurs stratégies qui auront la même EV face à chacune. Tu peux intervertir les termes OOP et IP.
Ok donc supposons pour simplifier que OOP a une seule stratégie notée OOP_A et IP plusieurs stratégies notées IP_A, IP_B et IP_C, un peu comme dans le toy game étudié ensemble.
Et disons que IP_A >= IP_B > IP_C.
IP_C est strictement dominée et donc ne peut pas faire partie d’un équilibre de Nash.
IP_B est co-optimal mais faiblement dominée par IP_A.
Le solver va donner comme solution (OOP_A ; IP_A).
Est-ce que (OOP_A ; IP_B), ayant la même utilité que (OOP_A ; IP_A), est un autre équilibre de Nash ?
Quand tu dis « part à la poubelle », tu veux dire que (OOP_A ; IP_B), dans mon exemple, n’est pas un équilibre de Nash car IP_B n’est pas la meilleure réponse possible à toutes les stratégies d’OOP (et pas seulement à OOP_A) ?
Nous sommes d’accord qu’une stratégie strictement dominée (donc exploitable), comme IP_C, ne peut pas faire partie d’un équilibre de Nash mais ce n’est pas la question.
Si IP_B est co-optimale, elle n’est pas exploitable (IP ne peut pas trouver une stratégie où OOP ne maximise pas son EV).
La question est : « est-ce que (OOP_A ; IP_B) est un équilibre de Nash ? » et si non pourquoi ?
est : « oui il existe plusieurs équilibres de Nash dans le jeu résolu par un solver car ils y a plusieurs stratégies dominantes équivalentes (= avec la même utilité) », correct ?
Et en bonus, « s’il y a plusieurs stratégies faiblement dominantes, la solution restituée (la paire de stratégie OOP + IP) peut varier d’un solver à l’autre en fonction de l’algorithme qu’il utilise », correct ?