Les ingénieurs et chercheurs de l’ISC-PIF travaillent sur le actuellement sur le projet Politoscope, un projet au coeur de l’actualité puisqu’il s’agit d’un outil permettant d’analyser les interactions du réseau Twitter – mentions, citations et retweets- avec près 3500 comptes de personnes politiques (député, Maire, etc) dont les candidats et candidates à la présidentielle. Les recherches menées avec le Politoscope ont pour objectif d’illustrer la compréhension que peut apporter le traitement de données personnelles sur les enjeux de communication politique et de mettre en évidence les caractéristiques de la diffusion d’information dans la sphère politique.
Contexte : TIC et macroscopie sociale
En provoquant la migration d’un grand nombre de contextes de production de connaissances – depuis les discussions informelles jusqu’à la production de théories scientifiques en passant par le débat politique – vers des supports numériques, l’essor des technologies de l’information et de la communication (TIC) a révolutionné notre rapport aux productions culturelles de nos sociétés. L’entrée des TIC dans l’ère du web 2.0 à ouvert, entre autres, de nombreuses opportunités pour une recherche qui se situe à la croisée entre l’innovation et les sciences humaines et sociales. Grâce au outils du Big Data et le méthodes issues de l’analyse et la modélisation des systèmes complexes, il est aujourd’hui possible d’extraire simultanément et à grande échelle les contenus sémantiques et les réseaux d’acteurs présents dans les différentes sphères des TIC.
L’ISC-PIF est spécialisé dans le développement de ces outils qui permettent l’analyse de systèmes complexes tels que les réseaux socio-sémantiques et proposent de nouveaux modes d’interactions avec les productions scientifiques et culturelles de nos sociétés. Nous appelons ces outils des « macroscopes sociaux » en référence à cet outil virtuel décrit par Joël de Rosnay qui permet d’observer un système complexe en adoptant un point de vue “extérieur”. Ces macroscopes ambitionnent d’accompagner les citoyens, responsables politiques, industriels et les scientifiques dans la connaissance de nos sociétés comme ont pu le faire le microscope ou le télescope pour la connaissance du vivant ou de l’Univers.
Politoscope : ce que Twitter nous dit de la campagne
Twitter a aujourd’hui une place à part entière dans les moyens de communications des personnes politiques permet en effet de propager ces idées directement à un grand nombre de personnes. Par exemple le 13 février 2016, les comptes de François Hollande et de Nicolas Sarkozy ont respectivement 1.87 et 1.51 millions de followers. En plus d’être un nouveau medium de masse, Twitter permet également à n’importe qui de réagir directement à ce qui est dit que ce soit via les mentions, les citations ou les “retweets”. Ainsi avec Twitter, l’impact d’un message peut en partie être mesuré via l’analyse des réactions qu’il a suscitées.
Le Politoscope développé en collaboration avec plusieurs instituts et groupes de recherche tels que Science Po Medialab et le laboratoire Langue, Texte, Traitement Informatique, Cognition (LaTTiCe-ENS) analyse depuis juillet 2016 les interactions du réseau Twitter (mentions, citations et retweets) avec près 3500 comptes de personnes politiques (député, Maire, etc). En 6 mois, nous avons ainsi collecté presque 20 millions de tweets émis par plus d’1 million de personnes.
Le traitement de ces données via l’analyse de réseau, la détection de communauté et le text mining nous permet de rendre compte de plusieurs aspects d’une diffusion. Tout d’abord, nous pouvons retracer l’évolution temporelle de l’utilisation d’un terme et notamment sa concomitance avec des événements connus. Puis de manière plus ambitieuse, nous caractérisons les personnes participantes à la propagation de ce terme. Pour ce faire, nous nous basons sur l’existence de groupes de comptes se retweetant fréquemment entre eux. Nous supposons que ces groupes sont le reflet d’accointances dans le milieu politique (PS, Les Républicains, FN, etc ). Ainsi, il est possible de caractériser un compte par le groupe dans lequel il interagit. Cette caractérisation permet de savoir si la propagation a été globale à l’ensemble du réseau ou bien limitée à une partie.
Les campagne de déstabilisation
Afin d’illustrer cette méthode, nous étudions le cas de la campagne « Ali Juppé » ayant eu lieu sur Twitter. Ce phénomène a eu suffisamment d’importance pour qu’Alain Juppé le mentionne lors d’interviews. Lors de la primaire de la droite et du centre, un certain nombre de comptes Twitter ont diffusé des tweets à l’encontre d’Alain Juppé sur sa supposée complaisance envers l’islam politique. De nombreux tweets renommant Alain Juppé en « Ali Juppé » sont ainsi apparus, et en particulier lors de la primaire. Dans le cadre de notre collecte de données, environ 3400 messages émis par plus de 2200 comptes différents mentionnent les termes « Ali Juppé ». Grace à notre analyse, nous arrivons à mettre en avant les milieux politiques intervenant sur le sujet et à quelle période.
Il résulte de ces travaux un moyen de caractériser la propagation d’une information dans les réseaux et en particulier dans Twitter.
Le politoscope à la Cité des Sciences
Une partie des résultats de cette recherche via le Politoscope sera présentée pendant l’exposition Big data de la Cité des Sciences (mars 2017). Nous y proposons une vue thématique permettant d’explorer de manière comparée les prises de position et débats sur les différentes thématiques (éducation, immigration, Europe, sécurité…) et d’observer les réactions des médias et de la Twittosophère vis-à vis de celles-ci.
Représentation du paysage politique français sur Twitter analysé sur la période août 2016 – décembre 2017. Près de un million d’utilisateurs uniques ont interagit avec quelques 3000 comptes de personnalités politiques présentes sur Twitter. Seuls les comptes les plus actifs sont représentés sur cette image (chaque point est un compte, environ 60.000 comptes représentés). Les liens de retweet entre comptes (qui mettent en évidence les relais d’information) sont également représentés et ont été utilisés pour positionner les noeuds du graphe. Bien que portant sur un échantillon de personnes, potentiellement biaisé par le mode de sélection via une présence en ligne, cette “carte” de la tweetosphère politique reflète assez fidèlement l’organisation du paysage politique français, organisé autour des candidats potentiels à la présidentielle.