- 21 mars 2018
- petiteglise
- 5429
- 13 Commentaires
Deux boîtes, l’une contient 1000$ l’autre soit 0, soit 1 million $... “Pour presque tout le monde, le choix à faire est parfaitement clair et évident. Le problème est que les gens semblent se répartir à peu près à part égale en deux groupes, chaque groupe faisant un choix différent, et pensant que l'autre groupe est totalement idiot”
L’énoncé du paradoxe de Newcomb.
Considérons une entité que vous savez être particulièrement douée en prédictions.
Il peut s’agir d’un humain, d’un extraterrestre, d’une IA ou d’un dieu, selon vos préférences. Nous l'appellerons simplement le Prédicteur.
La seule chose qui importe est que vous avez confiance en sa capacité à prédire avec une grande précision vos choix, ainsi que ceux d’autres joueurs, en particulier dans la situation décrite ci-dessous.
Deux boîtes A et B vous sont présentées.
Vous avez le choix entre prendre uniquement la boîte B ou alors prendre les deux boîtes.
Que faîtes vous, sachant que :
La boîte A est transparente et contient toujours 1000$
La boîte B est opaque et son contenu est déterminé ainsi :
- si le Prédicteur a prévu que vous prendriez les deux boîtes, elle contient 0.
- si le Prédicteur a prévu que vous ne prendriez que la boîte B, elle contient 1 Million $.
Il y a donc 4 possibilités que l’on peut résumer par un tableau :
Prédiction |
Votre choix |
Votre gain |
A+B |
A+B |
1 000 $ |
A+B |
B |
0 $ |
B |
A+B |
1 001 000 $ |
B |
B |
1 000 000 $ |
Pour que ça soit bien clair, le contenu de la boîte B a été déterminé avant votre choix (admettons hier). Le Prédicteur est ni malveillant ni bienveillant, il ne cherche donc pas à vous influencer, il se contente de respecter les règles du jeu.
Alors, quel est votre choix ? Que la boîte B, ou les deux ?
Les deux grandes théories.
Le chercheur éponyme et créateur du paradoxe est William Newcomb, cependant, la première analyse détaillée a été réalisée en 1969 par Robert Nozick. Dans son papier “Newcomb's Problem and Two Principles of Choice” il présente les deux raisonnements les plus fréquents.
La dominance stratégique : on prend les deux boîtes.
Il y a deux cas distincts, soit le Prédicteur a prédit A+B, soit il a prédit B.
S’il a prédit A+B, je gagne 1000 si je choisis A+B ; je gagne 0 si je choisis B. Il vaut donc mieux choisir A+B.
S’il a prédit B, je gagne 1 001 000 si je choisis A+B ; je gagne1 000 000 si je choisis B, il vaut donc mieux choisir A+B.
Peu importe donc la prédiction, il est toujours préférable de choisir A+B, c’est-à-dire les deux boîtes.
En théorie des jeux, on parle de stratégie dominante.
Un exemple simple de stratégie dominante au poker est quand river on hésite entre check back ou bet, mais si l’on bet on ne sera payé que par mieux.
Vilain a moins bien |
Vilain a mieux |
|
Check back |
+ pot |
0 |
Bet |
+ pot |
- bet |
Le tableau représente le gain de hero selon les 4 possibilités. On voit que la “stratégie” check back domine la “stratégie” bet.
En accord avec la dominance stratégique, la question ne se pose pas, vous devez choisir les deux boîtes.
L’espérance (Ev)
La deuxième grande méthode de choix en théorie des jeux est familière aux joueurs de poker : il s’agit du calcul d’Ev.
Admettons que le Prédicteur prédise correctement avec une probabilité p.
Si vous choisissez B, vous gagnez : 1000000 * p
Si vous choisissez A+B, vous gagnez : 1001000 * (1-p) + 1000 * p
En résolvant l’équation, on trouve que les deux choix sont équivalents en terme d’espérance quand p = 0.5005
Autrement dit, si l’on pense que le Prédicteur a raison au moins 50.05% du temps, il est EV+ de choisir uniquement la boîte B.
Or on sait que le Prédicteur est particulièrement excellent.
En accord avec le calcul d'Ev, la question ne se pose pas, vous devez choisir la boîte B uniquement.
Autres arguments.
En faveur des deux boîtes.
Imaginons que la boîte B ne soit opaque que d’un côté, le vôtre. De l’autre côté, qui est donc transparent, siège un de vos amis qui voit le contenu de la boîte. Il sait donc si la boîte contient 0 ou 1 million. Si votre ami vous veut du bien, il souhaite nécessairement que vous preniez les deux boîtes. Il sait tout ce qu’il y a à savoir et veut que vous preniez les deux boîtes, c’est donc nécessairement le bon choix.
En faveur de la boîte B.
Imaginons que, avant vous, des dizaines de joueurs aient joué à ce jeu. Tous ceux (ou disons l’écrasante majorité) qui ont choisi les deux boîtes ne sont repartis qu’avec 1000$, tous ceux qui ont choisi la boîte B uniquement sont repartis avec 1 million $.
Vous n’avez aucune raison de vous penser différent, alors pourquoi ne pas choisir que la boîte B ?
On pourrait même imaginer que vous avez joué à ce jeu pour des points fictifs des dizaines de fois et qu’à chaque fois le prédicteur avait raison. Alors maintenant qu’il s’agit d’argent réel, vous devez choisir ce qui rapporte le plus, et donc la boîte B.
Alors qui a raison ?
De nombreux énoncés présentés comme des paradoxes ne sont en fait que des illusions qui s’expliquent parfaitement. Mais le paradoxe de Newcomb résiste pour l’instant à l’épreuve du temps. En 1969, Nozick présentait la situation ainsi : “Pour presque tout le monde, le choix à faire est parfaitement clair et évident. Le problème est que les gens semblent se répartir à peu près à part égale en deux groupes, chaque groupe faisant un choix différent, et pensant que l'autre groupe est totalement idiot”
Depuis on a affiné les stats et l’on sait que 70% des gens prennent uniquement la boîte B.
Et moi ? vous demandez-vous peut-être. Et bien, si autorisé, je lancerais une pièce et me déciderais à pile ou face. Malheureusement, certaines versions du paradoxe interdisent l’utilisation de générateurs de hasard. Dans ce cas, je serais admiratif du Prédicteur, car moi-même je ne sais pas comment je réagirais.