Tout le bonheur du monde 2.0

Le blog de Khaos Farbauti Ibn Oblivion. Une vision du monde cynique et poétique.

Aller au contenu | Aller au menu | Aller à la recherche

Pourquoi tous les chiffres des sondages sont faux ?

"37% des français approuvent la...", "90% des français soutiennent les...", "Pour 76% des français, notre société..."... Mais saviez-vous que 100% des sondages n'ont aucun rapport avec la moindre notion de mathématique ? Pire : Que même lorsqu'ils parviennent à tomber juste, il ne s'agit finalement que d'un coup de chance ?

Alors vous allez sans doute me dire que vous vous en doutiez un peu, que les questions sont biaisées et que les chiffres ont leur fait un peu dire ce qu'on veut, etc... Mais ce n'est pas de cela dont je vais vous parler aujourd'hui. Non, aujourd'hui je vais vous expliquer pourquoi TOUS les sondages, quand bien même leur questions seraient parfaitement neutres, ne valent guère mieux que le feeling et le doigt mouillé.

Tout simplement à cause du principe des échantillons représentatifs.

Échantillons

Commençons donc par la notion d'échantillonnage. De quoi s'agit-il ? Et bien tout comme pour le calcul de l'audimat à la télévision, lorsque l'on souhaite faire un sondage on ne peut pas véritablement demander à TOUS les français leur opinion en même temps (Même si de nos jours avec le numérique cela se discute, mais admettons). Il s'agit après tout de sondages et non de référendums.

Les instituts de sondages ont donc lorgné du coté des vraies sciences et leur ont emprunté la technique de l'échantillonnage : Si par exemple je veux connaitre le taux de sel dans un bac de 20L d'eau salé, je vais prélever un verre de quelques centilitres, mesurer le taux de sel dans ce verre, puis recommencer 3-4 fois l'opération. A l'arrivée je pourrais faire une moyenne de mes échantillons et, à partir de là, en déduire le taux de sel dans l'ensemble du bac à une marge d'erreur près.

Alors bien évidemment, comme les maths ce n'est pas trop leur fort aux instituts de sondages, elles ont immédiatement oublié le principe de multiplier les échantillons et de faire une moyenne pour ne conserver que l'idée de base. Je prends une partie et j'en déduis la valeur pour le tout. (Jetant par là même à la poubelle toute notion de marge d'erreur, au sens mathématique du terme, mais vous allez voir que nous ne sommes pas à ça près. :rolleyes: )

Le problème majeur qui apparait alors, c'est qu'il y a une différence capitale entre la population des sondés et un bac d'eau salé : Peu importe où vous piochez votre échantillon d'eau salé, il sera (à peu près pour simplifier) toujours identique. Alors que si vous posez par exemple une question sur le port de la jupe à 2 personnes au hasard, la réponse sera très différente selon que vous soyez dans la rue ou dans une église.

L'homogénéité, pré-requis obligatoire pour appliquer le principe d'échantillonnage, n'existe pas dans le cas d'une population humaine.

Représentatifs

Qu'à cela ne tienne et parce qu'on ne va quand même pas s'empêcher d'arnaquer le monde pour si peu, les instituts de sondages ont en donc appelé à la représentativité : Certes la population n'est pas homogène, mais on va faire en sorte que notre échantillon soit savamment construit de manière à ce qu'il soit représentatif de cette non-homogénéité. Qu'il soit, en quelque sorte, une version miniature du grand tout.

Les 1000 personnes qui vont être interrogées (Ah oui, parce que je ne vous l'ai pas dit mais un sondage en France c'est fait la plupart du temps sur 1000 personnes. 0,001% de la population française. Oui.) vont être choisies pour représenter au mieux les différentes proportions de la société. Proportion Femmes/Hommes, classe sociale, niveau d'éducation, etc...

On obtient donc ainsi un échantillon représentatif... Mais représentatif de quoi au juste ?

Revenons quelques instants à l'exemple du bac d'eau salé, nos échantillons sont eux-aussi des échantillons représentatifs (par définition). En observant le contenu d'un verre, on a une "représentation" du contenu du bac tout entier. Notre verre est un échantillon représentatif car il contient un pourcentage de sel à peu près identique au pourcentage du bac complet.

Mais si par exemple je veux connaitre le pourcentage de français qui aiment la couleur jaune, il faut que mon échantillon soit "représentatif" de la quantité de gens qui aiment le jaune. Je me contrefous totalement de savoir que mon échantillon est "représentatif" du sexe ou de la classe sociale. Ces critères n'ont absolument RIEN A VOIR avec la représentativité de mon échantillon au niveau de l'amour de la couleur jaune.

On parle d'échantillons représentatifs par rapport à la question qui est posée, du résultat recherché, c'est de ça dont ils doivent être la représentation !

Autrement dit, pour construire un véritable échantillon représentatif d'un ensemble non-homogène : il faut DÉJÀ connaitre la réponse à la question. LOL

Et c'est bien pourquoi, parce qu'ils ne sont pas représentatifs de la question posée et donc par là même n'ont aucune valeur de réel échantillon, les sondages n'ont absolument aucune valeur.

Au doigt mouillé

Mais peut-être allez-vous me dire : "Oui mais Khaos, tu dis un peu de la merde, regarde là le sondage il dit des trucs et c'est assez proche de la vérité. D'ailleurs je suis d'accord avec et Robert au bar aussi" (Marche aussi avec Gertrude. Halte au sexisme dans l'imagerie des piliers de bar ! ;) )

Et, c'est vrai, il y a plusieurs domaines où on peut constater ce qui pourrait ressembler à de bonnes estimations par les instituts de sondages... Non, je déconne ! :razz:

En fait, il n'y a précisément qu'un seul cas où les sondages peuvent apporter une estimation intéressante et relativement réaliste : Ce sont les élections.

Pour une raison toute bête, c'est que le paysage politique français a longtemps été relativement stable et que les sondages d'élections ont été très nombreux. A force d'ajustement de leur pseudo-mathématique, les instituts de sondages sont donc parvenus dans l'ensemble à faire émerger une échantillon qui, pour le coup, peut être qualifié d'assez représentatif.
Mais, parce que cette représentativité s'est appuyée sur l'éternelle question "Gauche ou droite ?" et sur le fait qu'on change peu d'opinion politique au cours de sa vie, ça ne marche que dans un cadre de stabilité et d'évolution lente "normale".

Il ne donne en fait pas une représentation réelle mais une courbe de tendance si aucune perturbation ne surgit.

D'ailleurs pour être très clair, ces "sondages" là pourraient être obtenus sans même interroger qui que ce soit tant ils relèvent plus de la prévision que de la description.

Donc finalement, oui : Tous les sondages sont bel et bien de la merde. :)

Que la paix soit avec vous.

Khaos Farbauti Ibn Oblivion

Auteur: Khaos Farbauti Ibn Oblivion

Restez au courant de l'actualité et abonnez-vous au Flux RSS de cette catégorie

Soyez le premier à réagir sur cet article

Ajouter un commentaire Fil des commentaires de ce billet

no attachment



À Voir Également

On a toujours fait comme ça

Même si le mot est amusant, force est de constater qu'ils vous arrivent parfois de me turlupiner....

Lire la suite

Fait et Vérité, l'enjeu de notre époque

Parmi la pléiade de difficultés qu'affronte l'humanité au sens large, il en est une qui a récemment...

Lire la suite