Cette page présente une méthodologie d’identification des différentes communautés qui diffusent de l’information à contenu politique sur Twitter. L’accent est mis ici sur la manière dont l’information circule. Il n’y a pas d’analyse du contenu de ce qui est échangé.

Référence : Noe Gaumont, Maziyar Panahi, David Chavalarias. Methods for the reconstruction of the socio-semantic dynamics of political activist Twitter networks: Application to the 2017 French Presidential elections.  2017. 〈hal-01575456v2〉

Qu‘est qu’un tweet ?

1
2
1

Contenu du message

2

Nombre de fois où le message a été relayé sans modification.

Un tweet est un message court publié par un utilisateur de Twitter sur son compte. Il peut être vu par toute personne sur le web. Les tweets peuvent être copiés d’un compte utilisateur vers un autre (retweets), commentés ou cités.  Les utilisateurs peuvent s’interpeller directement en mentionnant leurs noms de profil dans un message.

Twitter offre un moteur de recherche qui permet de retrouver n’importe quel tweet.

Reconstruire les communautés de circulation d’information sur Twitter

Le but du Politoscope est d’analyser la dynamique des réseaux socio-sémantiques de la tweetosphère politique et médiatique, c’est-à-dire : comment les différents groupes s’organisent-ils pour diffuser de l’information ? Quel type d’information circule ? Comment ces réseaux se reconfigurent en fonction de l’actualité ?

Nous nous intéressons ici à la manière dont l’information est échangée. Plusieurs dimensions peuvent être considérées dans l’identification des communautés de partage d’information : les retweets, les citations, les favoris, les mentions, etc. L’analyse présentée ici se concentre sur les relations engendrées par les “retweets sec”, c’est à dire sans altération du contenu.

Détection de communautés

Les communautés politiques autour des candidats ont été définies algorithmiquement via l’analyse du relai de message à l’identique entre comptes Twitter (retweets “secs”).

Nous analysons pour une période donnée le graphe de retweets politiques entre tous les comptes identifiés par le Politoscope. Cela peut comporter jusqu’à plusieurs millions d’échanges. Ce graphe est ensuite filtré pour ne garder que les comptes qui ont échangé un nombre suffisant de tweets avec un nombre suffisant d’autres comptes. Ce filtre permet d’éliminer la majorité des robots et ne garde que les comptes les plus engagés politiquement.

Nous utilisons ensuite un algorithme de détection de communautés (ici algorithme de Louvain) afin d’identifier des sous-ensembles denses du graphe. Ces ensembles sont des comptes partageant des informations de manière privilégiée avec les autres comptes du même ensemble, ce qui homogénéise les idées qui circulent en leur sein. Ces ensembles définissent nos communautés.

Une communauté autour d’un candidat  ou de son parti est alors définie par le sous-ensemble de comptes Twitter qui partagent des informations similaires au compte Twitter du candidat ou de son parti.

Ce n’est pas une garantie d’adhésion du propriétaire du compte aux idées du candidat. Toutefois la reconstruction de ces “communautés” permet de mettre en avant les structures qui diffusent les idées politiques et nous avons montré que lorsque l’on regarde les comptes les plus actifs, cette méthode permet d’identifier l’orientation politique d’un compte dans plus de 90% des cas.

Résultats

Les communautés politiques se reconfigurent au gré des alliances et des défections. La détection des communautés dépend donc de la période sur laquelle elles sont calculées. Nous présentons ici le paysage politique de Twitter tel qu’il peut être envisagé lorsque l’on considère la majeure partie de la campagne (août 16 – février 17 pour les images présentées ici). Les relations entre les nœuds (comptes twitter) sont donc des relations “moyennes” sur l’ensemble de cette période.

Pour visualiser leurs relations, nous avons utilisé l’algorithme Force Atlas tel qu’implémenté dans le logiciel Gephi.

Bien que la forme précise du graphe de retweets puisse changer en fonction des paramètres choisis pour le Force Atlas, sa topologie et les relations entre les communautés détectées sont invariantes. Dès lors, la forme générale du graphe est suffisamment caractéristique pour pouvoir donner des indications sur les relations entre les communautés politiques et leur évolution au cours du temps.

On peut ainsi observer sur la figure 1 l’organisation du paysage politique suivant un continuum qui prend la forme de la lettre grecque Pi : un premier axe gauche droite que nous avons positionné horizontalement pour faciliter la lecture, un second axe qui sépare les extrêmes des positions politiques plus modérées. Certaines communautés sont déconnectées de ce graphe, il s’agit de communautés politiques minoritaires qui sont polarisées sur une seule dimension très particulière du débat politique (comme par exemple l’UPR, qui prône le frexit quelque soit le problème posé).

D’autres analyses présentées sur le site du Politoscope démontrent que cette organisation des communautés reflète effectivement les circuits de diffusion de l’information au niveau global.