- 03 mai 2017
- petiteglise
- 3894
- 28 Commentaires
A quelques jours du deuxième tour, analysons les différents moyens de prédire les résultats et tentons de prédire le résultat final.
Les sondages : fausse certitude, faible valeur prédictive.
Le dernier sondage "PrésiTrack" Opinionway-Orpi pour Radio Classique et Les Echos donne Macron gagnant avec 60% des voix. Un tel chiffre, net et précis de 60% semble montrer une grande confiance de celui qui l’avance, mais peut-on réellement croire les instituts ? On pourrait rappeler que les sondages n’ont prévu ni la victoire de Trump, ni le Brexit, ni les résultats des deux primaires. Ou, à leur décharge, qu’ils n’ont pas été si mauvais au premier tour de la présidentielle. Mais sans être result-oriented, regardons les biais dont sont coupables les sondages.
La marge d’erreur
Il est des résultats que l’on peut prédire avec une quasi exactitude. C’est le cas par exemple de beaucoup de votes à l’assemblée, où l’on sait que toute la majorité va voter pour et toute l’opposition contre. Ainsi on peut prédire un résultat de 60% pour le texte, avec une marge d’erreur d’un petit pourcent, juste au cas où.
Mais pour un sondage de présidentielle, quelle est la marge d’erreur d’un sondage à 60%-40% ? Si le sondage a été réalisé sur 1500 personnes, l’intervalle de confiance à 95% pour un score de 60% est de 2.4. Autrement dit, si l’échantillon est bien représentatif (j’insiste sur le si), il y aurait 95% de chances que Macron score entre 57.6 et 62.4%.
La représentativité des sondés
J’ai écrit plus haut “si l’échantillon est bien représentatif”. Et c’est là un autre problèmes des sondages : l’échantillon n’est jamais représentatif. Aujourd’hui, quasiment tous les sondages s’effectuent sur internet, où l’on trouve moins de vieux, qui sont pourtant ceux qui votent le plus. Autre biais, la plupart des sondés se font payer pour participer, de l’ordre de quelques centaines d’euros par an, ce qui attire certaines populations plus que d’autres… sans parler des profils bidonnés pour pouvoir cumuler ces rémunérations. Malgré les efforts des instituts, leurs échantillons ne sont donc jamais représentatifs.
Les coefficients de redressement
C’est le biais le plus ironique des sondages : les instituts savent que leur chiffres bruts ne sont jamais corrects, aussi ils les corrigent “à la main”. Les chiffres bruts ne sont jamais publiés et ceux qu’on voit ont toujours été modifiés, sans que l’on connaisse les méthodes utilisées…
L’avis des “experts” : aucune utilité.
Les experts médiatiques sont payés pour faire de l’audience, en exposant avec grandes phrases et petits mots ce qu’ils affirment être des certitudes. “Même si l’abstention fera le jeu du front national, Le Pen n’a aucune chance de percer son plafond de verre”. Mais ils ne sont pas payés pour l’exactitude de leurs prédictions, sinon ils seraient presque tous au chômage.
Je me contenterai de rappeler ici ce que j’avais écrit dans l’article Les joueurs de poker sont plus intelligents que la moyenne :
Entre 1985 et 2005, Philip Tetlock a étudié environ 30 000 prédictions de 284 experts. Les questions étaient du type : La belgique va t-elle se scinder ? Est-ce que l’apartheid sud africain va connaître une fin non-violente ?
Résultats :
Une majorité d’experts a fait moins bien que le hasard (une majorité d'événements qu’ils pensaient arriver ne se sont pas produits et inversement une majorité d'événements qu’ils pensaient improbables ou impossibles ont eu lieu).
Les experts les plus sûrs d’eux, aux avis tranchés, qui sont aussi les plus médiatiques, se trompaient plus que les experts plus nuancés mais moins visibles.
Conclusion : l’avis des prétendus experts n’a aucune valeur et de toute manière, on peut trouver des experts défendant n’importe quel avis...
Les sites de paris : montrent toute l’incertitude du résultat
Les sites de paris ont l’avantage de montrer qu’on ne sait rien, ou presque, en offrant la possibilité à ceux qui prétendent le contraire de gagner de l’argent. En lisant ce que j’ai écrit plus haut sur la marge d’erreur des sondages “si l’échantillon est bien représentatif, il y aurait 95% de chances que Macron score entre 57.6 et 62.4%.”, on pourrait se dire que Le Pen a quasiment aucune chance de gagner, de l’ordre de moins d’un pourcent.
Avant de vous donner les chiffres des sites de paris, je vous invite à vous poser deux questions :
D’après vous, quelle est la probabilité que Macron gagne ?
Quel serait d’après vous un intervalle de confiance à 95% du score de Le Pen ? Par exemple, si vous êtes un institut de sondage que vous êtes sûr à 95% que Le Pen fera entre 37.6% et 42.4%.
La plupart des gens, surévaluent les chances de gains de Macron et donnent un intervalle de confiance beaucoup trop petit.
Regardons les cotes des sites de paris. La meilleur cote sur Macron, rake compris est de ⅛, autrement dit vous mettez 8€ pour gagner 1. Cela correspond à une probabilité de gagner de 8/9 soit 88.89%. Et si l’on enlève le rake, cette probabilité tombe à environ 85%. Autrement dit, si vous pensez que Macron a plus de 89% de chances de gagner, allez parier.
Voici le vote share du site skybet. Les cotes sont données rake compris.
25% or lower 50/1 |
45.01 - 50.00% 6/1 |
25.01% - 30.00% 20/1 |
50.01% - 55.00% 8/1 |
30.01% -35.00% 9/1 |
55.01% - 60.00% 25/1 |
35.01% - 40.00% 15/8 |
Higher than 60% 66/1 |
40.01% - 45.00% 6/4 |
Si vous pensez avoir été large en donnant un intervalle de confiance à 95% de 35%-50%, soit vous vous trompez grandement, soit vous pouvez parier sereinement.
Par exemple en misant en tout 100€ répartis en 39€ sur 35-40%, 45€ sur 40-45% et 16€ sur 45-50%, vous êtes sûr de gagner 12€ à 95% et ne perdez 100 que cinq fois sur cent. Malgré le rake, ce pari serait nettement Ev+ (+6.4€) !
On voit bien avec cet exemple que 35%-50% comme intervalle de confiance à 95% est beaucoup trop petit. Alors quand on songe que l’intervalle de confiance à 95% des instituts de sondage est de 37.6% et 42.4%, on hésite entre en rire, les mépriser ou regretter leur poids médiatique.
Les méthodes de calcul personnelles.
Quand on voit que personne ne sait rien quant aux résultats, on peut être tenté d’oser un pronostic, pour proposer un pari, ou juste pour le fun. Répondre directement à la question “quel sera le résultat final ?” par la seule intuition est trop compliqué car le résultat dépend de plusieurs facteurs difficiles à évaluer. Je crois qu’il vaut mieux décomposer ce problème en plusieurs, plus faciles.
Le report des voix : laborieux, mais relativement précis.
Il existe des estimateurs automatiques, comme celui du Monde.
Voici mon estimation, le pourcentage de gauche indique le score de Macron, et le pourcentage de droite celui de Le Pen. Leur somme ne fait pas 100 car il faut rajouter l’abstention.
L’idée est d’essayer d’être le plus précis possible pour chaque candidat, en espérant qu’une erreur favorisant Le Pen sera compensée par une erreur favorisant Macron.
E. Macron (EM!) 24,01 % – 8,66 MILLIONS DE VOIX
96 % 2 %
M. Le Pen (FN) 21,3 % – 7,68 MILLIONS DE VOIX
2 % 96 %
F. Fillon (LR) 20,01 % – 7,21 MILLIONS DE VOIX
37 % 37 %
J-L. Mélenchon (FI) 19,58 % – 7,06 MILLIONS DE VOIX
40 % 15 %
B. Hamon (PS) 6,36 % – 2,29 MILLIONS DE VOIX
75 % 5 %
N. Dupont-Aignan (DLF) 4,7 % – 1,70 MILLION DE VOIX
15 % 75 %
J. Lassalle (R!) 1,21 % – 435 365 VOIX
25 % 15 %
P. Poutou (NPA) 1,09 % – 394 582 VOIX
15 % 15 %
F. Asselineau (UPR) 0,92 % – 332 588 VOIX
15 % 75 %
N. Arthaud (LO) 0,64 % – 232 428 VOIX
15 % 15 %
J. Cheminade (S&P) 0,18 % – 65 598 VOIX
33 % 33 %
Blancs et nuls 949 334 VOIX NON EXPRIMÉES
15 % 7 %
Abstention 10,57 MILLIONS DE VOIX NON EXPRIMÉES
15 % 7 %
Emmanuel Macron l'emporterait au second tour avec 56,3 % des suffrages. 56,3 % E. Macron - 43,7 %M. Le Pen
Le résultat en 3 chiffres
Une idée beaucoup plus simple et rapide, mais moins précise est d’évaluer trois chiffres, plus accessibles que le résultat final :
Le score que ferait Le Pen en vote obligatoire (sans vote blanc)
Le pourcentage des pro Le Pen qui ira voter.
L’abstention totale.
Avec ces trois chiffres, on déduit le résultat final.
Le Pen vote obligatoire |
Abstention chez Le Pen |
Abstention totale |
Score final Le Pen |
Gain Le Pen si abstention |
|
Anti Le Pen |
28% |
10% |
25% |
33.6% |
49.6% |
“Réaliste” |
35% |
12% |
30% |
44% |
38.4% |
Pro Le Pen |
42% |
15% |
30% |
51% |
28.6% |
Cette méthode a l’intérêt d’être très simple et de montrer tout le poids de l’abstention. Ainsi, des militants de gauche rêvent de voir Macron élu avec une abstention de plus de 50%, comme on l’a vu, c’est mathématique quasi impossible ! L’abstention étant différenciée (elle concerne plutôt des gens qui préfèrent Macron à Le Pen), avec 50% d’abstention, Le Pen serait élue même dans le scénario “anti Le Pen”.