Twitter est devenu un nouveau média d’information ainsi qu’un passage obligé pour tout groupe qui cherche à influencer l’opinion publique d’une manière ou d’une autre, y compris pour certains, en publiant de fausses informations (« fake news »). Les réseaux sociaux grossissent ainsi la masse de données dans laquelle nous sommes chaque jour plongés, et qui tend à nous détourner d’une analyse approfondie, et sur le long terme, de l’actualité.

En politique, les équipes de campagne utilisent désormais les services de sociétés d’étude des médias et réseaux sociaux qui leur produisent des analyses et des tendances concernant les aspirations des citoyens. Ces analyses sont réservées à un petit nombre d’utilisateurs ; les méthodologies sont la plupart du temps confidentielles.

A la veille de l’election présidentielle de 2017, des chercheurs et ingénieurs de l’ISC-PIF ont conçu un “macroscope politique” consultable sur internet qui propose d’inverser les rôles en permettant au “grand public” de plonger dans les masses de données générées sur les réseaux sociaux par les sphères politiques grâce à des outils et méthodes d’analyses produites par la recherche.

Baptisée “Politoscope“, le but de cette plateforme est d’analyser la dynamique des réseaux socio-sémantiques de la tweetosphère politique et médiatique : comment les différents groupes s’organisent-ils pour diffuser de l’information ? Quel type d’information circule ? Comment ces réseaux se reconfigurent en fonction de l’actualité ? Nous proposons ici une analyse comparée de la situation en 2017 et en 2021.

Le Politiscope propose des plateformes, des visualisation et une app pour naviguer facilement dans les masses de données de la politique française et ses commentaires grâce à des vues chronologiques et thématiques.

Reconstruire les communautés de circulation d’information sur Twitter

Commençons par détailler la manière dont l’information est échangée. Plusieurs dimensions peuvent être considérées dans l’identification des communautés de partage d’information : les retweets, les citations, les favoris, les mentions, etc. L’analyse présentée ici se concentre sur les relations engendrées par les “retweets sec”, c’est à dire sans altération du contenu.

Les communautés politiques autour des candidats ont été définies algorithmiquement via l’analyse du relai de message à l’identique entre comptes Twitter (retweets “secs”).

Nous analysons pour une période donnée le graphe de retweets politiques entre tous les comptes identifiés par le Politoscope. Cela peut comporter jusqu’à plusieurs millions d’échanges. Ce graphe est ensuite filtré pour ne garder que les comptes qui ont échangé un nombre suffisant de tweets avec un nombre suffisant d’autres comptes. Ce filtre permet d’éliminer la majorité des robots et ne garde que les comptes les plus engagés politiquement.

Nous utilisons ensuite un algorithme de détection de communautés (ici algorithme de Louvain) afin d’identifier des sous-ensembles denses du graphe. Ces ensembles sont des comptes partageant des informations de manière privilégiée avec les autres comptes du même ensemble, ce qui homogénéise les idées qui circulent en leur sein. Ces ensembles définissent nos communautés.

Une communauté autour d’un candidat  ou de son parti est alors définie par le sous-ensemble de comptes Twitter qui partagent des informations similaires au compte Twitter du candidat ou de son parti.

Ce n’est pas une garantie d’adhésion du propriétaire du compte aux idées du candidat. Toutefois la reconstruction de ces “communautés” permet de mettre en avant les structures qui diffusent les idées politiques et nous avons montré que lorsque l’on regarde les comptes les plus actifs, cette méthode permet d’identifier l’orientation politique d’un compte dans plus de 90% des cas.

Structure de la twittosphère en 2020

Lorsque nous avons commencé à observer la Twittersphère politique française en 2016, le paysage politique était on ne peut plus classique : des partis qui s’alignent sur un axe gauche-droite avec des extrêmes bien identifiés, une gauche, une droite et un centre quasi inexistant. L’image ci-dessous est l’une des premières que nous avons généré et résume clairement la situation d’alors. On peut y voir le positionnement des principaux leaders politiques et de leurs communautés à la veille du début de la campagne présidentielle. Chaque point est un compte Twitter, les filaments représentent des trajectoires de tweets. Chaque couleur correspond à des comptes identifiés automatiquement comme faisant parti de la même tendance politique. Nous avons montré que cette identification était fiable à plus de 90%. On voit notamment sur cette carte la proximité idéologique de leader qui ont par la suite fait alliance pour la présidentielle. Au premier tour: Jadot et Hamon, Macron et Bayrou, Fillon et Sarkozy ; au second tour : Macron soutenu par Hollande, Valls, Juppé, NKM, Le Maire, Le Pen par Dupont-Aignan.

Politoscope août-dec. 2016 © ISC-PIF/CNRS – Chavalarias D., Gaumont N., Panahi M.

L’analyse sur les échanges Twitter de l’année 2020 montre un paysage très différent. Les données récoltées se composent de 49,4 millions de Tweets émis par  362.319 comptes et retweetés par 2.896.287  de comptes distincts. Cet ensemble comporte 26.22% de tweets originaux, 51.05% de retweets, 19.67% de retweets avec commentaires et 3.06% de commentaires sur un tweet.

La structure des interactions de retweets sans modification (51,05% du corpus original) est celle qui qualifie les communautés politiques. En 2020, le paysage est triangulaire comme le montre la figure ci-dessous.

Comme on peut le voir, alors que se prépare la campagne présidentielle 2022, le paysage politique de 2020 est très différent de celui qui précédait le lancement de la campagne de 2017. Il est structuré en trois pôles : le parti du gouvernement Macron, situé en haut de cette carte et deux pôles majeurs d’oppositions constitués d’un côté de la France Insoumise, et de l’autre des Républicains et du Rassemblement National qui montrent de frontières informationnelles très poreuses. Le Parti Socialiste quant à lui, est représenté par une communauté militante très peu cohésive, qui semble plutôt organisé en de multiples sous-courants animés par leur leader.

L’évolution la plus remarquable de ce paysage entre 2016 et 2020 et sans doute la réorganisation du paysage politique et des interfaces d’échanges entre communautés, qui est passé d’une organisation linéaire gauche-droite à une organisation bi-dimensionnelle : gauche-droite et globalisme/mondialisme vs. nationaliste/patriotisme/protectionnisme, ce dernier axe étant spécifiquement mobilisé par Donald Trump en son temps pour définir sa politique.

Comment ce paysage politique va-t-il se reconfigurer sous la pressions de la prochaine présidentielle et de ses inévitables stratégies d’alliance ? Réponse dans les prochaines analyses du Politoscope.

Pour aller plus loin

  • Chavalarias, D., Gaumont, N., Panahi, M., 2019. Hostilité et prosélytisme des communautés politiques. Réseaux n° 214-215, 67–107. (Accès libre ici)
  • Gaumont, N., Panahi, M., Chavalarias, D., 2018. Reconstruction of the socio-semantic dynamics of political activist Twitter networks—Method and application to the 2017 French presidential election. PLOS ONE 13, e0201879. https://doi.org/10.1371/journal.pone.0201879

A propos de l’auteur 

David Chavalarias est Directeur de Recherche CNRS au Centre d’Analyse et de Mathématique Sociales de l’EHESS et directeur de l’Institut des Systèmes Complexes de Paris Île-de-France. Ses recherches se situent à la croisée entre les sciences cognitives et les approches systèmes complexes, qu’il mobilise pour l’étude les dynamiques sociales et cognitives, tant du point de vue de la modélisation que de la fouille de données issues du Web.