La section "sondages et statistiques" du politburo de VLG a collecté les résultats de tous les sondages parus depuis début 2007 sur la prochaine élection présidentielle française, pour ce qui concerne les 4 principaux candidats.
Le résultat est les 4 nuages de points présentés ci-dessous. En admettant magnanimement qu'il n'y a pas de grossière erreur systématique, on aperçoit assez nettement des tendances, mais il est clair à vue de nez que la marge d'erreur est d'au moins 3 points (voir note plus bas).
Il est donc du dernier ridicule de tirer des conclusions du dernier sondage du jour.
Le résultat est les 4 nuages de points présentés ci-dessous. En admettant magnanimement qu'il n'y a pas de grossière erreur systématique, on aperçoit assez nettement des tendances, mais il est clair à vue de nez que la marge d'erreur est d'au moins 3 points (voir note plus bas).
Il est donc du dernier ridicule de tirer des conclusions du dernier sondage du jour.
La section "gribouillages et coloriages" s'est ensuite amusée à tracer de jolies courbes simples à travers tous ces nuages de points, et à les prolonger jusqu'au jour du premier tour. En bidouillant juste ce qu'il faut, on obtient cette prédiction intéressante : 3 candidats seront exactement ex-aequo à 24% des voix ! (Notez que le pronostic fantaisiste d'un Le Pen à seulement 13% ne vient pas de nous, mais de la mauvaise qualité des données sur lesquelles se fonde cette étude.)
Si cette prédiction à 3 kopeks venait à ne pas se réaliser, nous nous verrions contraints de rééduquer le peuple pour lui apprendre à se conformer un peu aux sondages ! Ou à envoyer les sondeurs au goulag...
Note technique sur les écarts-types :
Considérons le 64ème jour de l'année (le 5 mars), où 3 sondages ont été réalisés. Pour chaque candidat, nous avons donc un échantillon de 3 éléments s1, s2, s3. À cet échantillon correspond une moyenne :
m = (s1+s2+s3) / 3 ,
et l'écart-type est la racine carrée de :[ (s1-m)² + (s2-m)² + (s3-m)² ] / 3.
L'écart-type obtenu pour chacun des candidats le 5 mars est : 0,84 ; 0,62 ; 1,7 ; et 0.93 point.À cela, il convient d'ajouter les flucuations temporelles : si l'on ajoute à cet échantillon les 3 sondages réalisés dans les 4 jours suivants, les écarts-type deviennent : 1,24 ; 2,61 ; 2 ; 0,75.
L'intervalle de confiance (dans lequel on a 2 chances sur 3 de trouver la véritable valeur) étant :
[ moyenne - écart-type ; moyenne + écart-type ],
sa taille est 2 fois l'écart-type, soit de 1,5 à 5 points, sur 4 jours et 6 sondages...
2 commentaires:
J'ai a-do-ré le Prix Félix 2007...splendide idée! Et je suis un peu jaloux, aussi!
Merci bien, mais ne t'inquiète pas 2007 sera surement une année fructueuse de ce point de vue, et toi aussi tu pourra décerner plein de prix Félix.
Enregistrer un commentaire