Echantillon representatif en sng

Salut,
En plein défi sng, je me demande simplement de combien doit être un échantillon en sng afin d être représentatif ?

Merci d avance.

sng fr sh hu?

je pense pour que du fr/sh c 5k sng
pr du hu 2k sng

c est plutot du fr et sh donc 5000, sympa d avoir pris le temps de répondre.

Bien bien trop !
1-2k en SH - FR te donne ton roi avec une marge de 2% d’erreur maxi environ

yo merci pour l info

in b4 Fab

salut, jeaan je ne comprend pas , desole

[quote=“Xeha, post:515509”]Bien bien trop !
1-2k en SH - FR te donne ton roi avec une marge de 2% d’erreur maxi environ[/quote]

Exactement ce que j’allais te répondre… après 1k tu as une idée, après 2k tu sais si tu es gagnant ou pas…
Mais pour être sur d’éviter tout badrun ou goodrun (encore plus dangereux) compte 3/4 k…

Ca depend tout de même bcp de son roi theorique, plus il sera faible et plus la variance sera importante, et donc l’echantillon devra etre necessairement important.

Sur mes 2500 derniers sng turbo joués sur ps, je constate 5 points d’ecart entre roi reel et ev chez moi.

Une paille! :wink:

A l’inverse, 8 points d’écart (dans l’autre sens) sur mes 800 premiers sng de ma vie.
Ce que je decris là c’est du lot commun… rien d’extraordinaire.

salut, jeaan je ne comprend pas , desole[/quote]

Comme Fab12 est le spécialiste officiel de la variance en sng sur PA, j’annonçais qu’il allait poster après moi. Raté. J’ai fait le malin, je suis tombé dans le ravin, normal.

Fab avait fait des post intéressant sur le thread de playaz y’a 6 mois :

J’ai lu pour la première fois (sans survoler) la partie de Maths of Poker qui traite de la variancen et j’ai l’impression que les choses sont en fait différentes que ce Fab (et les autres gens qui postent des maths sur ce sujet sur les forums) disent. Voilà ce que je crois avoir compris.

EDIT : ça vient, ça va ptet etre plus long que prévu :slight_smile:

Un joueur a un ROI théorique (qu’on ne connait pas), et un ROI observé sur un échantillon de blabla SnG. Il est mathématiquement impossible de répondre à la question : “Quelle est la probabilité que son ROI théorique soit proche de son ROI observé à 2% prêt”. Il manque une information capitale: la distribution des ROI de la population de joueurs dont il fait partie.

Par exemple (exemple extrême évidemment) : puma joue des sng live dont le rake est si elevé que le meilleur joueur du monde aurait un ROI de 0 (le reste ont un ROI négatif). Puma a joué 5 millions de games avec un ROI observé de 10%. Quelle est la proba qu’il soit à 2% prêt de son ROI théorique ? 0%. Il a juste eu beaucoup de chance.

Au contraire (autre extrême), puma joue des sng “tout le monde all-in forcé à chaque main” sans rake avec 10% d’added money. Il a joué seulement 5 games, et observé un ROI de 10%. Quelle est la proba qu’il soit à 2% prêt de son ROI théorique ? Bah 100%.

Donc la population de joueurs dont on fait partie est tout aussi importante (voire parfois plus !, comme dans ces exemples) que notre ROI observé et la taille du sample pour determiner notre ROI théorique.

Pour revenir au post de Fab :

[quote=“fab12, post:469171”]Donc il faut jouer environ 20000 sit n go SH pour avoir 95% de chance de connaitre son ROI à 2% près.
[/quote]

Ce qu’il entend n’est donc pas : “Ton ROI théorique est à 2% de ton ROI observé avec 95% de chance”.

Je quote wikipedia anglais : “A confidence interval does not predict that the true value of the parameter has a particular probability of being in the confidence interval given the data actually obtained.” [confidence interval, c’est les 2% autour du ROI observé]

Mais ce que Fab entend par là, c’est (pseudo-quote wikipédia français sur les interval de confiance avec notre jargon) : “Si ton ROI théorique n’était pas à 2% autour de ton ROI observé, alors le fait que tes premiers 20000 SnG t’ai donné ce résultat avait probabilité moins de 5%.”

Ce qui est (me semble-t-il) beaucoup moins intéressant.


Si on veut pouvoir répondre à notre question :
“Quelle est la probabilité que son ROI théorique soit proche de son ROI observé à 2% prêt”
il nous faut la distribution des ROI de tous joueurs de notre population. C’est à dire, pour chaque ROI possible, savoir quelle proportion de la population a ce ROI. Par exemple (avec 10% de rake), ça pourrait etre :

  • ROI à 0% ou plus : 8%
  • ROI entre -5% et 0% : 10%
  • ROI entre -10% et -5% : 30%
  • ROI entre -10% et -15% : 30%

etc.

Si on fait partie d’une population différente, ça peut tout changer. Par exemple, si une personne random arrive sur le forum PA, et son premier post est “Bonjour, j’ai 10% de ROI observé sur 2K SnG, quelle est la chance que ce soit mon ROI théorique à 2% prêt”, cette chance est sans doute faible. Il y a tellement de joueurs perdants au total, que c’est plus probable qu’il soit un random ayant eu de la chance plutot qu’un joueur très gagnant qui a run normal (par ce qu’il y a si peu de joueurs très gagnants). Si la personne qui poste la question est un habitué de PA, on peut imaginer que la population des PAcadémiciens soit en moyenne plus forte que la population globale, ça augment très largement ses chances que le 10% soit bon. Et si on est sur un forum privé où seuls les reg de SnG (avec ROI entre 5% et 15%) ont été invités, alors la proba devient vraiment élevée.

Je ne connais pas les distributions de gains des random, des Acamédiciens etc donc je ne vais pas faire de calcul. Mais je sens obligé de vous poser une petite colle (qui vient du bouquin Maths of Poker) et qui n’a rien à voir avec le poker (urgh).


Un docteur a un test (pas infaillible) pour dépister une maladie. Quand une personne malade passe le test, 80% du temps le test va correctement dire “elle est malade”. Quand une personne non malade passe le test, 10% du temps le test se goure et dit qu’elle est malade. Et 5% de la population a la maladie.

Un humain random entre chez le docteur, passe le test, et le test lui dit qu’il est malade. Quelle est la probabilité qu’il soit réellement malade ?


Pour conclure, les questions du genre “combien de sng me faut-il pour connaitre mon ROI à 2% prêt” sont en fait mal posées, même si on connait la distribution des gains de la population des joueurs. Si on a observé le gain moyen (ie le plus probable), ça a plus de chance d’être réaliste que si on observé (sur autant de games) quelque chose d’extrême. Donc malheureusement, si on tourne autour de -9 ou -10% (ie on perd le rake), ça a plus de chance d’être probable que si on observé +20%. Autrement dit, il faut beaucoup plus de games pour confirmer un ROI très gagnant avec une confiance donnée qu’un ROI typiquement perdant avec la même confiance.

Après c’est pas évident de dire “Je suis un random général”, ou “je suis un random PA” ou … :slight_smile:

Je pense qu’on est tous d’accord pour dire qu’il faut largement plus de 2000 games.
Et comme de toutes les façons sur cet echantillon notre jeu (et même celui de nos adversaires) évoluera et bien les calculs mathematiques d’intervals de confiance deviennent vite completement inutiles.

GG :slight_smile:
Mais j’ai plus accès à PA que sur mon tel en journée alors je suis plutot en mode ReadOnly :whistle:

A part ça je suis d’accord avec tout ce que t’écrit. C’est très intéressant.

Déjà effectivement on ne peut pas dire qu’il y a 95% de chance que le ROI réel soit égal au ROI observé à 2 écart type près.
C’est le contraire. Si on a un ROI réel de 10 alors on a 95% de chance d’observé un ROI compris entre 8 et 12 sur 20k sit n go.

Il faut appliquer le théorème de Bayes à mon avis:

P[A|B]=P[B|A]*P[A]/P[B]

Avec
A=Probabilité d’avoir un ROI entre 8 et 12
B=Probabilité d’observé un ROI entre 8 et 12

Dans le cas du docteur c’est pareil

P(Patient malade|Test positif) = P(Test positif|patient malade) * P(Patient malade) / P(Test positif)
P(Test positif|patient malade)= 80%
P(Patient malade) = 5%
P(Test positif) = 5% * 80% + 10% * 95% =4% + 9,5%=13,5%

P(Patient malade|Test positif) = 80% * 5% / 13,5% = 29,6%

Pour le cas sit n go:

P[A] ==> Dépend de la répartition des ROI réel dans la population
P[B] ==> Dépend de la répartition des ROI réel dans la population et de la variance
P[B|A]= peut être estimé de la façon suivante:
P(B|avoir un ROI de 10%)=95%
P(B|avoir un ROI de 9%)=P(Observé un ROI entre 7 et 11|avoir un ROI de 9%)-P(Observé un ROI entre 7 et 8|avoir un ROI de 9%)+P(Observé un ROI entre 11 et 12|avoir un ROI de 9%)

P(Observé un ROI entre 7 et 11|avoir un ROI de 9%) = 95%
P(Observé un ROI entre 7 et 8|avoir un ROI de 9%) = 15% environ (car 68% de chance d'observé un ROI entre 8 et 11)
P(Observé un ROI entre 11 et 12|avoir un ROI de 9%) = 2% (car 95% de chance d'être entre 7 et 11)

==> P(B|avoir un ROI de 9%) = 82%
P(B|avoir un ROI de 8%)=50% car 95% d’être entre 6 et 10 + 2% de chance d’être entre 10 et 12

P(B|avoir un ROI de 11%)=P(B|avoir un ROI de 9%)=82%
P(B|avoir un ROI de 12%)P(B|avoir un ROI de 8%)=50%

Ensuite faut pondéré avec les pourcentages de joueurs pour chaque ROI théorique (c’est là que la répartition intervient et aussi un peu plus tard)
Par ex.
Je suppose qu’il y a 5% de joueurs qui ont un ROI entre 8 et 12.
Il y a plus de joueur avec un ROI à 8 que de joueur à 12
ROI 8%->1.5%
ROI 9%->1.2%
ROI 10%->1%
ROI 11%->0.8%
ROI 12%->0.5

Donc en moyenne P[B|A] = (950.5+820.8+501.5+820.8+50*0.5)/5 = 55,74

Dans le cas des sit n go supposons que 0,5% des joueurs ont un ROI entre 8 et 12% <==> P[B]=5%
On peut faire une estimation de P[A]

Un joueur qui a un ROI réel de 0% a 95% de chance d’avoir un ROI observé (sur 20k sit n go) compris entre -2 et 2
==> Donc il a une proba très faible d’avoir un ROI compris entre 8 et 12.
Pareil pour des ROI de 1 à 6.
Je néglige les joueurs qui ont un ROI<0% et je suppose qu’aucun joeur n’a un ROI>15%
et je suppose qu’en moyenne les joueurs de 1 à 6% de ROI ont 1% de chance d’avoir un ROI observé entre 8 et 12

ROI=7% a 95% de chance d’avoir un ROI observé entre 5 et 9 (et 68% entre 6 et 8) ==> environ 15% d’être entre 8 et 12
ROI=8% a 95% de chance d’avoir un ROI observé entre 6 et 10 ==> 48% d’être entre 8 et 12
ROI=9% a 95% de chance d’avoir un ROI observé entre 7 et 11 ==> 63% d’être entre 8 et 12
ROI=10% a 95% de chance d’avoir un ROI observé entre 8 et 12
ROI=11% comme pour 9% 63%
ROI=12% comme pour 8% 48%
ROI=13% comme pour 7% 15%
ROI=14,15 comme pour 1 à 6 1%

Il faut aussi pondéré en fonction de la répartition des joueurs.
Par ex.
ROI 1 à 6% -> 8%
ROI 7%->2%
ROI 8%->1.5%
ROI 9%->1.2%
ROI 10%->1%
ROI 11%->0.8%
ROI 12%->0.5
ROI 13%->0.3
ROI 14%->0.2
ROI 15%->0.1
Le reste ont un ROI entre 8 et 12 0% du temps en première approximation.

Je trouve P[B]=3.6% sauf erreur (ca me parait bizarre que ce soit inférieur au pourcentage de joueurs ayant un ROI réel entre 8 et 12 il y a
peut être un blème là)

==> P[A|B]=56*5/3,6=77% !!

Donc si un joueur sur lequel on a aucune info dit qu’il a un ROI de 10% sur 20k sit n go il aurait 77% de chance que son ROI soit compris entre 8 et 12%

Ensuite on peut affiner si on a plus d’info sur le joueur.
Par ex. si on sait que c’est un très bon joueur d’échec, genre Maitre International par ex ;-), reconverti au poker alors P[B] augmente considérablement.
Par exemple P[A]=30 et il faut revoir les répartions que j’ai mis arbitrairement car avec cette information, il faut tenir compte de la répartition
des ROI dans un groupe constitué de joueur d’échec.

Bon je ne suis pas sûr que tout ca soit rigoureusement correct et le P[B] à 3,6 me laisse perplexe quoique c’est peut être normal en fait que du fait
de la variance il y ait plus de joueur avec un ROI théorique entre 8 et 12 que de joueur qui obtienne réellement un tel ROI après 20k sit n go.
Aussi les calculs je les ais fait en prenant P[B]=Probabilité d’observé un ROI entre 8 et 12 mais en pratique il faudrait mieux avoir
P[B]=Probabilité d’observé un ROI de X% pour répondre à la question: Si j’ai un ROI de X% sur 20k game quel est ma probabilité d’avoir un ROI compris
entre X-2 et X+2 réellement. Le problème c’est que je ne connais pas P(observé un ROI de 10%|ROI réel entre 8 et 12).
Mais j’ai du mal à voir l’impact. Peut être t’as une idée Jeaan?

Et puis j’estime à 95% les chances qu’il y ait au moins une erreur de calcul en plus :slight_smile:
Déjà je viens d’en corriger une grosse en relisant…

Tout ça pour ça ?
Bande de fous ! :stuck_out_tongue:

[quote=“fab12, post:531116”]P(Patient malade|Test positif) = 80% * 5% / 13,5% = 29,6%
[/quote]

Bien ouej ! La plupart des medecins se plantent complètement apparemment, et répondent “Bah 80% ou un peu moins ?”. Intuitivement ce 29.6% est plutot logique finalement : un malade a 8 fois plus de chance d’avoir un test positif qu’un non-malade, mais y’a 20 fois plus de non-malades, d’où le fait que la majorité des testé positifs seront juste dues à des erreurs. C’est pareil que pour le cas poker si y’a masse joueurs perdants, par la seule force de leur nombre, y’aura encore beaucoup de perdants parmi les observés gagnants !

[quote=“Xeha, post:531142”]Tout ça pour ça ?
Bande de fous ! :p[/quote]

Nan, “ça” était pénible, mais “ça” valait potentiellement le coup. Si les hypothèses de Fab sont raisonnables, et modulo erreurs de calculs, alors il dit que :

La probabilité d’avoir un ROI réel entre 8 et 12%, quand on a observé un ROI entre 8 et 12% sur 20K games, est seulement de 77%. C’est vraiment pas beaucoup, mais ça détonne pas avec un calcul qu’ils font dans MOP sur un joueur de limit hold’em qui a gagné 1,15 BB/100 sur 17K mains. Ils font des hypothèses raisonnables (le winrate moyen est -1 BB /100 par ex à cause du rake), et ils trouvent que ce joueur a 22% de chance d’avoir un vrai winrate de 1BB /100 ou plus, et 78% d’être breakeven ou pire. C’est vraiment peu !

[quote=“Jeaan, post:531368”][quote=“fab12, post:531116”]P(Patient malade|Test positif) = 80% * 5% / 13,5% = 29,6%
[/quote]

Bien ouej ! La plupart des medecins se plantent complètement apparemment, et répondent “Bah 80% ou un peu moins ?”. Intuitivement ce 29.6% est plutot logique finalement : un malade a 8 fois plus de chance d’avoir un test positif qu’un non-malade, mais y’a 20 fois plus de non-malades, d’où le fait que la majorité des testé positifs seront juste dues à des erreurs. C’est pareil que pour le cas poker si y’a masse joueurs perdants, par la seule force de leur nombre, y’aura encore beaucoup de perdants parmi les observés gagnants !

[/quote]

Et c’est à mettre en balance avec la variance.
Si il n’y a que 0.00001% des joueurs qui ont un ROI entre 8 et 12% mais que l’écart type sur 20k sit n go est 0,00000000000000000000001 alors si quelqu’un dit qu’il a un ROI de 10% y’a des chances qu’il ait vraiment un tel ROI.

Faudrait vraiment vérifier les calculs parce qu’à un moment je trouvais genre 15% :slight_smile:
Enfin 77 ca me parait pas mal.