Le Big Data dans la campagne présidentielle US

Vous n’avez pas pu passer à côté : la campagne présidentielle bat son plein aux Etats-Unis, notamment avec le premier débat télévisé entre les candidats Obama et Romney hier soir, apparemment dominé par Mitt Romney.

On entend à cette occasion parler (surtout sur les médias américains) de l’utilisation dans la campagne du Big Data, c’est à dire la récolte, l’analyse et le retraitement d’un grand nombre de données provenant de sources diverses (chiffres de revenus, données sociales et ethniques, préférences politiques, temps passé devant la télévision, activité sur les réseaux sociaux, etc.). Dans la suite de sa gestion inédite du volet web (notamment) de sa campagne de 2008, Barack Obama semble maintenant innover dans son utilisation du Big Data dans cette nouvelle campagne, notamment par la formation de nouvelles équipes de data analysts.

L’innovation Big Data ?

Bien avant l’utilisation du mot Big Data, les analystes et marketeurs de tout crin utilisaient bien sûr déjà toutes les informations à disposition pour mieux identifier et convaincre leur cible, notmmament via le data mining, ici les électeurs. Mais la masse de données disponible croît depuis une décennie de façon exponentielle (par l’utilisation des médias sociaux notamment, nous en parlions dans un autre article), et les efforts d’analyse déployés (permis par la puissance des outils, algorithmes et technologies employés) n’ont plus de commune mesure avec ceux qui étaient encore en vigueur il y a quelques années.

Ce changement a priori quantitatif en devient qualitatif : le ciblage de niches de plus en plus précises pour mieux les convaincre fait apparaître dans le vocabulaire des équipes de campagnes de nouveaux concepts et néologismes ; par exemple le nanotargeting, qui se révélera sûrement crucial dans les Swing States, les Etats américains dans lesquels aucun des deux partis ne domine le vote populaire.

Le nanomarketing, un Big Data Fail ?

La pertinence de ces nouvelles méthodes héritées du Big Data ne font pourtant l’unanimité parmi les analystes, en plus bien entendu de ne pas réjouir les défenseurs de la vie privée et les sceptiques du marketing. The New Scientist explique ainsi que le nanotargeting, ou microtargeting, est par exemple plus risqué dans son utilisation que le ciblage plus généraliste, et ceci par nature.

D’une part cette méthode vise à délivrer un message de plus en plus précis et ciblé, moins passe-partout donc,  qui risque de  ne pas faire mouche auprès du récipiendaire à la moindre petite erreur de ciblage ; d’autre part elle peut, si elle est correctement exécutée, renvoyer le public ciblé devant sa propre vulnérabilité face à l’utilisation de ses données personnelles. On a pu constater, à ce sujet, l’hystérie collective déclenchée en France par des internautes qui redécouvraient certains de leurs anciens messages sur Facebook, la semaine dernière. On peut comprendre que des électeurs regimbent à l’idée d’être scrutés et de mieux en mieux identifiés, classés dans les bases de données des analystes politiques…

Enfin, un ciblage de plus en plus précis, donc sur des populations de plus en plus restreintes, nécessite une attention accrue aux biais statistiques qui ont plus d’effet sur de petits échantillons. Les leçons des données récoltées en 2008 par les équipes de Barack Obama commencent déjà à porter leurs fruits en la matière, et de nouvelles corrections sont au fur et à mesure identifiées et mises en place pour allier précision du ciblage et pertinence des résultats.

Nous ne sommes pas égaux devant le Big Data

Par ailleurs, comme le rappelle cet article du Forbes, les statistiques tirées de l’utilisation (et/ou par l’utilisation) de nouvelles technologies ou méthodes comportent un certain nombre de biais dont il faut se méfier. Citation de l’article :

In fact, technology can be a two-edged sword. Remember the 1948 election, when the polls predicted a Dewey landslide over Truman? That election marked the first time pollsters relied on telephone surveys, giving them access to more voters—big data back then. It turned out that a lot of Truman supporters didn’t have phones. A parallel exists today: a growing number of U.S. households rely on cell phones instead of landlines, and pollsters don’t have access to most cell phone numbers.

Ainsi pour cette campagne, les statistiques récoltées via les réseaux sociaux ne concernent bien sûr que leurs utilisateurs ; or cette utilisation est parfois corrélée à certaines caractéristiques (niveau de revenu, d’éducation, etc.) elles-mêmes corrélées à l’appartenance politique de la communauté concernée ! Prudence donc.

En bref le Big Data est un vrai outil de ciblage marketing, mais ne semble pas encore vraiment changer la donne dans cette campagne électorale ; pour citer Robert Santos, méthodologiste senior à l’Urban Institute de Washington D.C.

Over the past five or 10 years we’ve started to understand how to process big data, but it’s not a game changer yet in politics

Et après ?

Si le Big Data s’affine et se révèle vraiment efficace, il n’est pas difficile d’imaginer aller encore plus loin dans l’utilisation de ces données, notamment via les réseaux sociaux. Peut-être verra-t-on un jour les candidats munis d’écouteurs durant leurs débats, reliés à une équipe analysant en temps réel les tweets pour mieux « sentir » le public et conseiller leur candidat sur la suite du débat : sujet à éviter, correction ou précision à apporter … Sky is the limit !