jeudi 22 mars 2007

VLG Sondages

La section "sondages et statistiques" du politburo de VLG a collecté les résultats de tous les sondages parus depuis début 2007 sur la prochaine élection présidentielle française, pour ce qui concerne les 4 principaux candidats.

Le résultat est les 4 nuages de points présentés ci-dessous. En admettant magnanimement qu'il n'y a pas de grossière erreur systématique, on aperçoit assez nettement des tendances, mais il est clair à vue de nez que la marge d'erreur est d'au moins 3 points (voir note plus bas).
Il est donc du dernier ridicule de tirer des conclusions du dernier sondage du jour.


La section "gribouillages et coloriages" s'est ensuite amusée à tracer de jolies courbes simples à travers tous ces nuages de points, et à les prolonger jusqu'au jour du premier tour. En bidouillant juste ce qu'il faut, on obtient cette prédiction intéressante : 3 candidats seront exactement ex-aequo à 24% des voix ! (Notez que le pronostic fantaisiste d'un Le Pen à seulement 13% ne vient pas de nous, mais de la mauvaise qualité des données sur lesquelles se fonde cette étude.)

Si cette prédiction à 3 kopeks venait à ne pas se réaliser, nous nous verrions contraints de rééduquer le peuple pour lui apprendre à se conformer un peu aux sondages ! Ou à envoyer les sondeurs au goulag...


Note technique sur les écarts-types :

Considérons le 64ème jour de l'année (le 5 mars), où 3 sondages ont été réalisés. Pour chaque candidat, nous avons donc un échantillon de 3 éléments s1, s2, s3. À cet échantillon correspond une moyenne :
m = (s1+s2+s3) / 3 ,
et l'écart-type est la racine carrée de :
[ (s1-m)² + (s2-m)² + (s3-m)² ] / 3.
L'écart-type obtenu pour chacun des candidats le 5 mars est : 0,84 ; 0,62 ; 1,7 ; et 0.93 point.

À cela, il convient d'ajouter les flucuations temporelles : si l'on ajoute à cet échantillon les 3 sondages réalisés dans les 4 jours suivants, les écarts-type deviennent :
1,24 ; 2,61 ; 2 ; 0,75.

L'intervalle de confiance (dans lequel on a 2 chances sur 3 de trouver la véritable valeur) étant :
[ moyenne - écart-type ; moyenne + écart-type ],
sa taille est 2 fois l'écart-type, soit de 1,5 à 5 points, sur 4 jours et 6 sondages...

2 commentaires:

comité-de-salut-public a dit…

J'ai a-do-ré le Prix Félix 2007...splendide idée! Et je suis un peu jaloux, aussi!

vlg a dit…

Merci bien, mais ne t'inquiète pas 2007 sera surement une année fructueuse de ce point de vue, et toi aussi tu pourra décerner plein de prix Félix.