POLITOSCOPE

Le Big Data comme bien commun.

A l’instar des partis politiques, qui utilisent les masses de données issues des réseaux sociaux pour analyser les opinions de leurs concitoyens, le Politoscope met les outils de la recherche à la disposition des citoyens pour analyser les prises de parole des candidats à la présidentielle et de leurs communautés.

Twitter est devenu un nouveau média d’information ainsi qu’un passage obligé pour tout groupe qui cherche à influencer l’opinion publique d’une manière ou d’une autre, y compris pour certains, en publiant de fausses informations (« fake news »).

Les réseaux sociaux grossissent ainsi la masse de données dans laquelle nous sommes chaque jour plongés, et qui tend à nous détourner d’une analyse approfondie, et sur le long terme, de l’actualité.

Les équipes de campagne utilisent désormais les services de sociétés d’étude des médias et réseaux sociaux qui leur produisent des analyses et des tendances concernant les aspirations des citoyens.

Ces analyses sont réservées à un petit nombre d’utilisateurs ; les méthodologies sont la plupart du temps confidentielles.

Le but du Politoscope est d’inverser les rôles en permettant au “grand public” de plonger dans les masses de données générées sur les réseaux sociaux à l’approche des présidentielles grâce à des outils et méthodes d’analyses produites par la recherche.

L’ambition de ce macroscope est d’une part, d’aider à mieux contextualiser sur le temps long les prises de parole des hommes politiques; d’autre part, de permettre d’identifier sur les temps courts des actions collectives visant à déplacer le débat public.

PRÉSIDENTIELLES 2017

Tout au long de la campagne présidentielle française de 2017, des chercheurs et des ingénieurs du CNRS et de l’EHESS ont examiné la formation et l’évolution des communautés politiques sur le réseau social Twitter. Après avoir montré que ces traces numériques permettent d’identifier précisément les communautés politiques et leur reconfigurations au cours des 11 mois de cette campagne exceptionnellement mouvementée, ils ont analysés leurs caractéristiques.Les résultats de leurs travaux, publiés dans le journal PLOS ONE ce mercredi 19 septembre, montrent entre autre que, contrairement à ce que l’on pourrait penser, il n’y a pas eu de raz de marée de fake news pendant la campagne de 2017, tout du moins sur Twitter.

UN MACROSCOPE POLITIQUE

Les réseaux sociaux, et en particulier Twitter, ont acquis une place centrale comme moyen de communication pour les partis politiques et leurs communautés ces dernières années. Twitter est devenue non seulement une plateforme de diffusion d’information à grande échelle mais elle a également transformé la manière de faire campagne : elle permet à n’importe qui de réagir directement à ce qui est dit, que ce soit via les mentions, les citations ou les “retweets”. Ces réactions en ligne constituent des masses de données qu’il est possible d’analyser avec les outils du Big Data et les méthodes issues de l’analyse et de la modélisation des systèmes complexes.

L’Institut des Systèmes Complexes de Paris Île-de-France (CNRS) est spécialisé dans le développement de ces “macroscopes sociaux” qui permettent aux chercheurs en sciences sociales et aux citoyens d’observer la société.

Le projet Politoscope, mené par l’équipe de David Chavalarias en collaboration avec le CAMS (laboratoire de l’École des Hautes Études en Sciences Sociales), est un macroscope social qui permet d’analyser en temps réel les communautés politiques et la circulation de l’information sur Twitter. L’objectif principal est d’illustrer la manière dont les masses de données sociales et les approches systèmes complexes apportent un éclairage original et inédit sur nos dynamiques sociales, et notamment politique et permet de mieux comprendre les transformations profondes apportées par les technologies numériques au fonctionnement de nos démocraties.

MÉTHODOLOGIE

Pendant la campagne présidentielle de 2017, l’équipe du projet Politoscope a utilisé la plateforme Multivac de l’ISC-PIF pour collecter, via les outils fournis par Twitter, les tweets concernant plus de 3700 personnalités politiques française (députés, maires, candidats): ce qu’ils disaient, ce qu’ils relayaient, les tweets qui les mentionnaient ; ainsi que les tweets portant sur quelques mots clés liés à la campagne présidentielle (ex. #présidentielle2017). Au total, ce sont 60 millions de tweets qui ont été publiés par 2,4 millions de comptes.

Le traitement de ces données via les outils d’analyse de réseaux, de fouille de texte et de visualisation d’information a permis de dégager des thèmes de campagne, d’identifier des communautés politiques ainsi que leurs réconfigurations et de rendre compte de plusieurs aspects de la diffusion d’une information.

Pour ce faire, les chercheurs et ingénieurs du projet se basent sur l’existence de groupes de comptes se retweetant fréquemment entre eux. Ils supposent que ces groupes sont le reflet d’accointances dans le milieu politique (PS, Les Républicains, FN, etc ). Ainsi, il est possible de caractériser un compte par le groupe avec lequel il interagit.

Évolution sur 11 mois (juillet 2016- mai 2017) des principales communautés de la twittosphère politique française. On voit clairement l’émergence de la communauté Macron, la fusion des communautés Sarkozy et Fillon, etc. Cf. analyse détaillée dans l’article.

Ces analyses permettent de suivre au jour le jour certaines stratégies politiques et les différentes alliances. Les chercheurs ont par exemple suivi la prise de distance d’une partie des « sarkozystes » avec la communauté Fillon quelques jours avant le « Penelope Gate », lorsque la bataille des investiture a fragilisé Les Républicains.

Une fois connue la structure des communautés politiques, il est possible d’analyser dans le temps le type d’information qui y circulent. Ainsi, la méthodologie proposée permet d’analyser la circulation d’une information et notamment sa concomitance avec des événements connus. Cette caractérisation permet de savoir si la propagation d’une information a été globale à l’ensemble du réseau ou bien limitée à une partie.

LA DIFFUSION DES FAKE NEWS

L’ambition du Politoscope n’est pas de qualifier le caractère vrai ou faux d’une information – une tâche qui revient aux journalistes et aux experts – mais de détecter le caractère coordonné ainsi que l’origine communautaire de la publication d’une information pour mieux la contextualiser.

Pour cela, l’équipe de l’ISC-PIF a analysé les messages de milliers d’utilisateurs de la plateforme Twitter de manière anonymisée en les croisant avec les fausses informations identifiées comme telles par le projet Decodex du Monde, qui a publié par la même occasion un rectificatif détaillé et argumenté.

Les conclusions de ces recherches, publiées dans PLOS ON le 19 Septembre 2018 révèlent que sur l’ensemble des tweets collectés pendant la période éléctorale, moins de 0,01% comportent un lien référencé comme une fausse information par les décodeurs du Monde, et que ces fausses informations ont été émises ou relayées principalement par deux communautés politiques. Celles-ci ont à elles seules produit ou diffusé près de 73% de toutes les fake news observées.

Paysage de la twittosphère politique la veille du 1er tour (calculé sur 3 mois de données). Chaque point est un compte Twitter. Ont été superposés aux couleurs désignant les communautés politiques le suivit de la diffusion des fakes news et des rectificatifs associés référencés par le Decodex du journal Le Monde. Dans un dégradé d’oranges, les comptes ayant relayé des fake news, dans un dégradé de vert, ceux ayant diffusé les debunks.

UN PROJET OUVERT ET CITOYEN

L’analyse des données collectées par le Politoscope a été mise à disposition en temps réel lors de la campagne présidentielle via une visualisation interactive des débats donnant à voir l’organisation du paysage politique français autour des candidats à la présidentielle. Une vue thématique permet d’explorer de manière comparée les prises de position et débats sur différents thèmes (éducation, immigration, Europe, sécurité…) et d’observer les réactions des médias et de la twittosphère vis-à-vis de ces thèmes.

L’analyse du corpus médiatique permettrait de mesurer l’attention suscitée dans les médias par les différents candidats ainsi que les thématiques qui leur sont associées.

Les données du Politoscope sont désormais restituées à tous et toutes et actualisées en temps réel sur une application mobile dédiée à l’information politique dans toute sa diversité. Cette application fournit aux citoyen.ne.s des outils d’interprétation et d’analyse des masse des données générées par le réseau social.

RÉFÉRENCES

  • Article dans PLoS ONE (en anglais)
    Gaumont, N., Panahi, M., Chavalarias, D., 2018. [Reconstruction of the socio-semantic dynamics of political activist Twitter networks—Method and application to the 2017 French presidential election](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0201879). PLOS ONE 13, e0201879. https://doi.org/10.1371/journal.pone.0201879
  • Traduction française disponible sur [http://ponevf.politoscope.org](http://ponevf.politoscope.org)

MEDIA COVERAGE

https://iscpif.fr/mediacoverage/

  • Équipe

    David Chavalarias, responsable scientifique, data-mining, analyse de réseaux & visualisations
    CNRS/EHESS, ISC-PIF/CAMS

    Maziyar Panahi, responsable de l’infrastructure Big Data, chef de projet Multivac
    CNRS, ISC-PIF

    Noé Gaumont, analyse de réseaux & visualisations
    CNRS/EHESS, CAMS/ISC-PIF