Les sondages politiques valent-ils encore quelque chose ?

Cameron, Fillon, Trump… les instituts de sondage enchaînent les erreurs de pronostics depuis deux ans. A quelques jours du premier tour de l'élection présidentielle, décryptage avec le politiste et sociologue Vincent Tiberj. A relire également dans le prochain numéro de U le magazine, à paraitre début mai.

  • 13/04/2017

C’est l’erreur de trop. La « surprise Fillon » lors de la primaire de la droite et du centre en novembre dernier n’est que la dernière en date d’une longue liste de mauvais pronostics sur les résultats électoraux. L’année dernière les instituts anglais se sont trompés sur la réélection de Cameron et le Brexit, avec parfois des écarts de plus de 10% sur les législatives. Les instituts américains ont sous-estimé le vote Trump. Plus loin encore, en 2015, les sondeurs français avaient pronostiqué « une vague bleue marine ». Ce fut finalement une « vague bleue avec des tâches marines ». La machine à sondages est grippée et il y a urgence à repenser le modèle.

Entretien avec Vincent Tiberj, docteur en sciences politiques, professeur associé à Sciences Po Bordeaux et chercheur au Centre Émile Durkheim (unité de recherche CNRS, Sciences Po Bordeaux et université de Bordeaux). 

Comment expliquez-vous ces erreurs de pronostics des sondeurs ?

Vincent Tiberj : « La principale source d’erreurs est le recours à Internet, qui s’est généralisé ces cinq dernières années. Aujourd’hui quasiment plus aucun institut de sondage ne mène des entretiens par téléphone ou en fac-à-face, pour des raisons de coûts. C’est aussi ce qui permet aux chaînes télé d’avoir une photographie de l’opinion, le débat à peine terminé. L’avantage c’est qu’il y a très peu de sous-déclaration sur des opinions parfois plus difficiles à assumer face à un interlocuteur, comme le vote d’extrême droite par exemple. C’est ce qu’on appelle la désidérabilité sociale. Mais le recours à Internet pose deux problèmes : d’abord la fracture numérique est toujours une réalité. Une grande partie de la population qui est âgée, peu diplômée et/ou précaire, n’est pas sur Internet. Les sondeurs disent qu’ils tiennent compte de cela avec des quotas. Pourtant, les seniors connectés ne sont pas représentatifs du reste de leur classe d’âge par exemple. Ils sont plus diplômés, plus urbains et s’informent différemment. Le deuxième problème, c’est qu’on ne sait rien de la qualité des réponses récoltées. Viviane Le Hay, ingénieure de recherche au Centre Émile Durkheim, parle dans ses travaux des « tire-aux-flancs ». Ce sont tous les gens qui vont remplir le questionnaire depuis leur tablette, qui ne sont pas forcément concentrés, ni même seuls à répondre. Le fait de ne plus avoir d’enquêteur diminue automatiquement la qualité des données récoltées. »

Ce n’est pourtant pas une première dans l’histoire ?

VT : « Non effectivement, en 1948 Harry Truman était donné perdant contre Thomas Dewey, par exemple. Idem en 1992, avec la défaite des Travaillistes, pourtant en tête dans les sondages outre-Manche. Il est tout à fait normal d’un point de vue statistique qu’il y ait des erreurs. La situation que nous connaissons l’est en revanche beaucoup moins, car il y a une accumulation. Aux États-Unis, l’American Association of Public Opinion Research a mis en place une commission pour essayer de comprendre leur échec. Les Britanniques ont initié une concertation similaire entre chercheurs et instituts de sondage. Et en France ? On ne fait rien, alors que l’on sait que les sondages auront un impact considérable sur la campagne présidentielle qui vient. »

Mis à part le recours à Internet, quelles sont les autres sources de biais ?

VT : « Les sondeurs français utilisent le système de quotas, alors que les Anglo-saxons restent sur un échantillonnage aléatoire de base. La définition même de quota n’a pas été réactualisée depuis les années 70/80. La composition est évidemment mise à jour avec les évolutions chiffrées de la population, fournies par l’Insee, mais la logique n’a pas bougé. Par exemple, certains sondeurs prennent en compte la profession du chef de ménage et pas forcément celle de la personne interrogée. Ça n’a plus de sens en 2017, car les femmes ne sont plus dans un rapport de domination, suivant l’avis politique de leur mari. Autre exemple, pour beaucoup de sondeurs la « profession » retraité constitue un groupe à part entière. Or on sait depuis longtemps qu’entre un retraité ancien cadre et un retraité ancien ouvrier, il n’y a pas grand chose en commun en matière d’opinion politique. Il y a là toute une série de prêt à penser sur la société qu’il faudrait réactualiser. »

Les sondeurs ont pourtant bien des méthodes statistiques pour corriger les biais ?

VT : « Oui, cela permet d’éviter les problèmes les plus visibles. Ils redressent les résultats à partir des souvenirs de votes de la Présidentielle de 2012 par exemple ou des dernières Régionales. Le problème c’est que pour les Régionales nous avons près de 50% d’abstention. Et sur la Présidentielle, les sondeurs sont confrontés à l’oubli des votes et au « phénomène de ralliement au vainqueur ». On sait que seulement un mois après les élections, une part non négligeable des électeurs est persuadée d’avoir voté pour le candidat qui a gagné, alors qu’ils avaient voté pour le perdant. Et ils sont de bonne foi ! Alors imaginez cinq ans plus tard. La donnée ne peut pas être fiable. »

Quelles méthodes utilisent les Américains ?

VT : « Ils utilisent notamment les robots call : un robot qui pose les questions. Comme la solution du questionnaire en ligne, il n’y a pas de plus de problème de désidérabilité sociale. Mais l’attention du répondant est flottante, imaginez répondre à une voix enregistrée... Le lendemain de la victoire de Trump, une enquête menée par l’université de San Diego en collaboration avec le Los Angeles Times a été mise en avant car elle avait prédit la victoire de Trump. L’échantillon était constitué d’un panel d’électeurs interrogés régulièrement, ce qui induit des biais de professionnalisation. Ces gens ressemblent de moins en moins à des électeurs lambda. Ils vont prêter plus d’attention à la campagne car ils se savent scrutés de près. »

Les électeurs ont-ils tendance à changer plus souvent d’avis entre le questionnaire et l’isoloir ?

VT : « Indéniablement les opinions sont plus mobiles, car nous sommes dans une phase de recomposition de l’offre politique. Une culture du vote de droit est en train d’émerger, par opposition au vote de devoir. Les cohortes nées après la Seconde Guerre mondiale ne se déplacent plus dans les urnes s’il n’y a pas assez d’enjeu ou si le vote s’insère dans une logique de justification d’un système qui ne leur correspond pas vraiment. On observe aussi une forte mobilité entre les partis au sein d’un même camp (gauche ou droite). Les électeurs évoluent dans « un espace des possibles » et peuvent changer de parti d’une élection à l’autre. Cela induit un vrai problème de mesure. Maintenant je préfère poser la question sur la probabilité de vote pour un candidat sur une échelle de 0 à 10, plutôt que sur l’intention de vote. Avec la question « pour qui allez-vous voter ? », on cristallise un vote et on sous-estime une hésitation. Cette approche permet de voir émerger cet espace de mobilité potentielle. Déjà en 2002, 14% des gens déclaraient avoir choisi leur vote le jour même. C’est considérable. »

C’est l’objet de l’enquête « Dynamique de mobilisation » à laquelle vous participez…

VT : « Oui c’est un panel de long terme. Nous suivons les gens de septembre 2013 à juin 2017. L’objectif est d’analyser les logiques de formation des préférenceset de choix face à différents types d’élections, mesurer l’influence de l’actualité, l’impact d’évènements traumatisants comme les attentats. Les premiers résultats montrent que les gens bougent plus et surtout beaucoup plus vite qu’on ne le pensait. On sait que la Présidentielle est une élection unique en terme de prégnance dans le quotidien, qu’elle réanime l’idéologie des individus. Peut-être que les électeurs vont énormément évoluer pendant cette période. »

Une question d’intervalle de confiance

D’un point de vue mathématique, le résultat d'un sondage est calculé à partir d’un échantillon. Il fournit une valeur ou un intervalle de valeurs d’un paramètre qui se rapporte à l’ensemble d’une population (qui n’est pas toujours facile à bien définir, contrairement aux apparences). L’aléatoire intervient naturellement en théorie des sondages par le biais de la sélection de l’échantillon qui est interrogé. « Aujourd’hui les instituts publient uniquement une estimation ponctuelle d’un paramètre et non pas un intervalle de confiance, détaille Jérôme Saracco, directeur adjoint de l’Institut de Mathématiques de Bordeaux (IMB, unité de recherche CNRSCentre national de la recherche scientifique , Bordeaux INP et université de Bordeaux). C’est une histoire de marketing. S’ils le faisaient, l’information pourrait ne plus être jugée satisfaisante par les médias et les commanditaires. »

Concrètement, au lieu de dire qu’un candidat A remporte 48% des avis favorables des électeurs et que le candidat B se place à 52%, il faudrait dire que le candidat A se situe entre 45% et 51% des avis favorables et le candidat B en 49% et 55%. Difficile d’affirmer dans ces conditions qu’un candidat est en tête. « Mais la culture de l’aléatoire est en train de s’immiscer dans les mœurs françaises, poursuit le chercheur. Par exemple des indices de confiance sont maintenant associés aux prévisions météo. » 

Mots clés :