Bonjour,
Je suis en train de créer des tableaux dynamiques d’EV regret, c’est-à-dire l’EV que l’on perd en jouant une stratégie pur vs un jeu GTO.
Le problème, c’est que je ne sais pas trop comme quantifier cette EV regret.
Au début, je me suis dit, je vais juste faire la somme de la différence ente EV générale des combo – EV de Strat pure.
Mais cette méthode ne prend pas en compte le poids des combos, donc je me suis dit que j’allais faire.
La somme de la proba des combos fois la différence ente EV générale des combos – EV de Strat pure.
Mais cette méthode donne des résultats biaisés. On pourrait croire en utilisant cette méthode que l’EV regret de chaque combo est ridicule, nous laissant ainsi penser que chaque action est raisonnable avec ce combo, ce qui est théoriquement faux.
Cela me fait penser au problème de Problème de Monty Hall
« Supposez que vous êtes sur le plateau d’un jeu télévisé, face à trois portes et que vous devez choisir d’en ouvrir une seule, en sachant que derrière l’une d’elles se trouve une voiture et derrière les deux autres des chèvres. Vous choisissez une porte, disons la numéro 1, et le présentateur, qui sait, lui, ce qu’il y a derrière chaque porte, ouvre une autre porte, disons la numéro 3, porte qui une fois ouverte découvre une chèvre. Il vous demande alors : « désirez-vous ouvrir la porte numéro 2 ? ». Avez-vous intérêt à changer votre choix ? »
En lisant cette énonce, on pourrait croire que la proba que la porte numéro 1 et de 1/3, car après tout, c’était sa proba au tout début du jeu, pourquoi changerai-t-elle ?
On a là à faire un problème bayésien
• cas 1 (C1) : le candidat a choisi la porte de la chèvre 1
• cas 2 (C2) : le candidat a choisi la porte de la chèvre 2
• cas 3 (V) : le candidat a choisi la porte de la voiture.
La probabilité de gagner en changeant de porte s’écrit donc comme suie :
P(C1) = P(C2) = P(V) = 1/3
P(C) = P(C1) + P (C2) = 2/3
Le candidat avait choisi une chèvre est change de porte.
Pc (CVG) = 1
Et l’inverse
Pv (CVG) = 0
On à donc
P (GVC) = Pc (GVC) * P (C) + Pv (GVC) * P (V) = 1 * 2/3 + 0 * 1/3 = 2/3
Comment es ce que vous aurai classer EV regret d’un sceau ?
Faut que tu m’explique comment tu fais pour avoir 1/3 de win quand il reste 2 portes parce que le présentateur a ouvert une chèvre
Dans tous les cas tu as une proba de 50% maintenant que le présentateur a retiré une porte perdante.
après il reste 1 porte gagnante et 1 porte perdante… donc 50% ou 1/2.
Si t’es devant C1, il enlève C2 reste C1 et V P(V)=P(V)/(P(C1)+P(V)) = 1/2.
Si t’es devant V il enlève C2 aussi c’est pareil.
Si t’es devant C2 il enlève C1 on change C1 par C2 dans le calcul.
« L’erreur de ce type de raisonnement est de ne retenir que l’événement « une porte a été ouverte ». Si une porte était ouverte strictement au hasard parmi les deux portes non choisies, et qu’elle révélait une chèvre, la probabilité deviendrait1⁄2 pour chacune des deux autres portes (parce qu’on a ici pris le risque d’ouvrir la porte dévoilant la voiture). Savoir ce qu’a prévu la direction du jeu pour le cas où la voiture aurait été dévoilée est sans importance (des possibilités sont envisagées dans les variantes). »
intéressé mais faudrait que tu sois plus précis, mais je sais pas si tu veux être plus précis en publique… Si tu veux on peut se PM.
Perso je ferais un %age EV réalisé pour chaque combo → moyenne pour le sample.
Oui, je l’ai déjà fait ça, j’ai appelé ça le CF comme Will tipton, je l’ai aussi fait pour les 5 sizing possible, les 3 raise possible, et pour le call, et check, j’ai fait pareille avec l’EQR. equity prime 1, 2 , 3
Mais comme toutes ces valeurs ça se calcule en moyenne, je n’avais pas de problème d’échelle.
Pour l’EV regret j’ai utilisé une méthode ou je pondère avec % du temps où il détient le combo, et j’ai crée une deuxième valeur ou je multiplier cette première valeur par nombre total de combo / nombre combo du sceau.
Ensuite, j’ai fait un graphique histogramme combinée dynamique, ce qui me donne maintenant une idée plus clair.
La prochaine étape, c’est de trouver une relation de tout cela avec les fréquences de chaque action, car plus une fréquence d’une action est faible, plus la contre exploitation fait perde de l’EV. On peut le voir très facilement si on prend en exemple une matrice 2*2
voici les 1er ligne de mon tableau principale, il n’est pas finit, je rajoute des colonne petit à petit, il me sert de base de travaille pour mais sous tableau
tout est relié à une feuille de traitement des data qui me trouve les data
Pour mieux capter ce problème, il suffit d’augmenter le nombre de portes. Disons que tu as 100 portes et derrière l’une d’elle se trouve une voiture. Tu choisis la porte 42 par exemple avec 1/100 chances qu’il y ait une voiture derrière. Le présentateur ouvre 98 portes ne contenant pas de voiture et te demande si tu veux changer de porte ou pas, tu fais quoi? La probabilité est elle 50/50? ^^
EDIT: je viens de voir que c’étais déjà expliqué dans le lien wiki
Je tiens à dire en préambule que je vais répondre totalement à côté de la plaque à une problématique que je trouve néanmoins assez intéressante à se poser. Les résultats m’intéressent et je soupçonne ne pas être le seul.
Premièrement les regrets d’un point de vue structurel je trouve pas ça fou, ça ralentit beaucoup, ça fait morfondre et trop douter. Franchement, au diable les regrets même ceux d’EV comme on dit.
Ensuite j’ai bien aimé la démonstration du problème de Monty Hall mais en vrai :
Je suis arrivé les mains dans les poches donc une chèvre c’est quand même déjà pas mal. Ne venant moi-même pas de la « capitale » et étant donc un provincial je peux te dire qu’une chèvre est tout à fait capable de prodiguer énormément d’amour. Bien plus qu’une C3 et en plus vu le coût de l’essence actuel.