Les réseaux socio-numériques comme objet de recherche

Les réseaux sociaux et en particulier Twitter (maintenant X) ont dès le début constitué des objets de recherche privilégiés, notamment dans le domaine des sciences sociales computationnelles. Il suffit pour s’en convaincre de consulter les plus de 7M de références dans Google Scholar sur le sujet.

Déployés par les géants de la Silicon Valley dans le milieu des années 2000, sans réel questionnement sur leur impact, les réseaux sociaux numériques ont bouleversé nos sociétés, tant du point de vue des individus (santé mentale, nouvelles manières de s’informer, impacts sur la vie privée, etc.) que du point de vue des collectifs (formes de mobilisations citoyennes, économie, dynamiques sociales, manipulations d’opinion, ingérences étrangères, etc ).

Environ 60% de la population mondiale utilise désormais les réseaux sociaux pour communiquer et se faire une opinion. L’étude de leurs impacts sur la société et la formation de l’opinion devient donc incontournable. C’est notamment ce que pointe la feuille de route Européenne 2024 “Digital Media and Humanity Well-Being”, écrite par 40 scientifiques de 14 pays et coordonnée par l’ISC-PIF (David Chavalarias). Elle est complétée par les cartes interactives du projet Européen DIGEING.

Ces infrastructures numériques sont tout à la fois porteuses d’innovations sociales et d’écueils pour nos sociétés et la démocratie en particulier, deux composantes qui font l’objet de nombreuses recherches.

La notion de risque systémique

Les très grandes infrastructures numériques (VLOPs, >45M d’utilisateurs en Europe), et en particulier les réseaux sociaux, ont un impact direct sur la circulation d’information et de désinformation au niveau d’un pays et même au niveau mondial, et par conséquent sur le fonctionnement des démocraties. L’annulation des élections de 2024 en Roumanie en est un très bon exemple. De nombreux travaux académiques s’attachent ainsi à évaluer qualitativement et quantitativement ces impacts et leurs origines.

L’un des principaux points de vulnérabilité des VLOPs est qu’elles reposent sur un nombre très restreint d’algorithmes qui régulent la circulation d’information à l’échelle mondiale. C’est le cas par exemple des fils d’actualités des réseaux sociaux, principaux points d’entrée de leurs utilisateurs, qui sélectionnent l’information à laquelle ils ont accès.

Il est inédit dans l’histoire de l’humanité que la modification d’un artefact, quelques lignes de code sur un serveur centralisé, puisse moduler quasi-instantanément la perception de la réalité de centaines de millions d’individus (plus de 2Md dans le cas de Facebook).

Si, pour une quelconque raison, l’algorithme du fil d’actualité d’une VLOPs devenait défaillant (par exemple en se mettant à amplifier la désinformation, les messages toxiques, certains partis politiques ou une personne en particulier), ce sont tous ses utilisateurs qui seraient touchés instantanément et de la même manière, ceci pouvant avoir de graves conséquences.

C’est ce qui s’est produit par exemple la nuit du 13 Février 2023, lorsque Elon Musk a demandé à ses ingénieurs de mettre spécifiquement en avant ses propres tweets. Une erreur de paramétrage sans grandes conséquences avait alors remplacé le jour de la Saint Valentin le fil  ‘Pour vous’ de tous les utilisateurs de X en une longue liste de messages d’Elon Musk. Les réglages ultérieurs ont conservé la priorité aux messages du propriétaire de X, tout en laissant de la place pour d’autres utilisateurs.

Pour encadrer les nouveaux pouvoirs des ‘BigTech’, le droit européen a récemment innové en introduisant la notion de risque systémique. Ce sont des risques qu’elles pourraient engendrer de par leur taille et qu’elles sont les seules à pouvoir anticiper et prévenir, leurs algorithmes et fonctionnement internes étant la plupart du temps opaques et couverts par le secret des affaires.

La notion de risque systémique inscrite dans le Digital Service Act Art. 34 (la loi européenne) concerne ainsi toutes les VLOPs qui se doivent de prévenir tout risque « découlant de la conception ou du fonctionnement de leur service et de ses systèmes connexes, y compris les systèmes algorithmiques, ou de l’utilisation qui est faite de leurs services. » Ces risques systémiques incluent (citation) :

  • (a) la diffusion de contenus illicites par l’intermédiaire de leurs services ;
  • (b) tout effet négatif réel ou prévisible sur l’exercice des droits fondamentaux, en particulier le droit fondamental à la dignité humaine, consacré à l’article 1er de la charte, le droit au respect de la vie privée et familiale, consacré à l’article 7 de la charte, le droit à la protection des données à caractère personnel, consacré à l’article 8 de la charte, à la liberté d’expression et d’information, y compris la liberté et le pluralisme des médias, consacrés par l’article 11 de la charte, à la non-discrimination consacrée par l’article 21 de la charte, au respect des droits de l’enfant consacré par l’article 24 de la charte et à un niveau élevé de protection des consommateurs consacré par l’article 38 de la charte ;
  • (c) tout effet négatif réel ou prévisible sur le discours civique et les processus électoraux, ainsi que sur la sécurité publique ;
  • (d) tout effet négatif réel ou prévisible en rapport avec la violence fondée sur le sexe, la protection de la santé publique et des mineurs et les conséquences négatives graves pour le bien-être physique et mental de la personne.

L’une des manières d’atténuer les risques systémiques liés aux algorithmes de recommandation des fils d’actualité est d’implémenter le pluralisme algorithmique, c’est-à-dire la possibilité donnée aux utilisateurs de choisir leur algorithme parmi une large gamme de possibles.

L’avantage du pluralisme algorithmique est double :

  1. les utilisateurs peuvent changer leur filtre sur le monde s’ils identifient que celui utilisé est défaillant ;
  2. quand bien même les utilisateurs n’identifieraient pas un tel risque, un algorithme défaillant ne toucherait qu’une partie des utilisateurs, contrairement aux algorithmes imposés par défaut sur les plateformes sans pluralisme algorithmique.

Des risques systémiques potentiels liés à X

Plusieurs VLOPs sont potentiellement porteuses de risques systémiques sans pour autant se conformer à la réglementation européenne qui les enjoint de les prévenir. Par exemple, Bouchaud et al. 2023 ont mesuré que X amplifie les contenus dits toxiques (harcèlement, attaques personnelles, obscénités, etc.) dans le fil d’actualité ‘Pour vous’ des utilisateurs. Cette amplification de la toxicité est passée de +32% à 49% en 2023 à la suite du rachat de X par Elon Musk et ses multiples interventions dans l’algorithme et la politique de modération.

D’autres travaux (Chavalarias et al. 2024) ont par ailleurs montré par une modélisation calibrée sur les données de X, que cette amplification de la toxicité est directement liée à la maximisation de l’engagement dans les algorithmes de recommandation. Un autre résultat est que ce type d’algorithmique concentre le capital social entre les mains des utilisateurs les plus toxiques et accroît la polarisation des communautés d’utilisateurs. Une amplification de l’entre-soi numérique également mesurée sur X par d’autres travaux (Bouchaud 2024).

D’autres soupçons de dysfonctionnement des algorithmes de X ont amené la Commission européenne, fin 2023, à ouvrir une enquête contre X dans le cadre de l’application du DSA, qui l’a amené début 2025 à s’intéresser à  l’algorithme de son fil d’actualité.

La portabilité effective des données comme moyen d’atténuer les risques systémiques

Les réseaux sociaux ancienne génération reposent sur la captation des données de leurs utilisateurs, comme le décrit par exemple Shoshana Zuboff dans L’âge du capitalisme de surveillance. L’un de leur atout, est qu’un utilisateur ne peut pas partir du réseau sans perdre tout ce qu’il y a construit : contenus et audience. Ainsi, passé une certaine taille, ces réseaux deviennent hégémoniques, chacun doit y être parce que tout le monde y est, et cette captation des données et de l’audience peut être vue comme une captation sous la contrainte : votre identité numérique est attachée à la plateforme, vous ne pouvez pas la quitter sans perdre tous vos abonnés (contrairement à la téléphonie où vous pouvez changer d’opérateur sans perdre votre numéros de téléphone).

Dès lors, la non-interopérabilité des grands réseaux sociaux traditionnels freine l’innovation et peut amener leurs utilisateurs, en tant que collectif, à courir un risque systémique dans le cas où le réseau deviendrait défaillant.

Pour résoudre ce problème, le nouveau droit européen DSA a introduit la notion de droit à la portabilité effective des données (Art.59 du règlement (UE) 2022/1925) qui permet à la fois de favoriser l’innovation et atténue le risque systémique lié à la captation des audiences de utilisateurs :

“Les contrôleurs d’accès bénéficient d’un accès à de grandes quantités de données qu’ils collectent lorsqu’ils fournissent des services de plateforme essentiels, ainsi que d’autres services numériques. Afin d’empêcher les contrôleurs d’accès de nuire à la contestabilité des services de plateforme essentiels, ou au potentiel d’innovation d’un secteur numérique dynamique, en limitant le changement de plateforme ou le multihébergement, il convient d’accorder aux utilisateurs finaux, ainsi qu’aux tiers autorisés par un utilisateur final, un accès effectif et immédiat aux données qu’ils ont fournies ou qui ont été générées par leur activité sur les services de plateforme essentiels concernés du contrôleur d’accès. Les données devraient être reçues dans un format permettant qu’elles soient immédiatement et effectivement consultées et utilisées par l’utilisateur final ou le tiers concerné autorisé par l’utilisateur final à qui elles sont transmises. Les contrôleurs d’accès devraient également veiller, au moyen de mesures techniques appropriées et de haute qualité, telles que des interfaces de programmation, à ce que les utilisateurs finaux ou les tiers autorisés par les utilisateurs finaux puissent librement transférer les données en continu et en temps réel. Cela devrait également s’appliquer à toutes les autres données, à différents niveaux d’agrégation, nécessaires pour permettre effectivement cette portabilité. Pour éviter toute ambiguïté, l’obligation faite au contrôleur d’accès d’assurer la portabilité effective des données en vertu du présent règlement complète le droit à la portabilité des données prévu par le règlement (UE) 2016/679. Faciliter le changement de plateforme ou le multihébergement devrait ensuite permettre d’élargir le choix offert aux utilisateurs finaux et encourage les contrôleurs d’accès et les entreprises utilisatrices à innover.”

Cet article est complété par l’Art.6-9 : 

“Le contrôleur d’accès assure aux utilisateurs finaux et aux tiers autorisés par un utilisateur final, à leur demande et gratuitement, la portabilité effective des données fournies par l’utilisateur final ou générées par l’activité de l’utilisateur final dans le cadre de l’utilisation du service de plateforme essentiel concerné, y compris en fournissant gratuitement des outils facilitant l’exercice effectif de cette portabilité des données, et notamment en octroyant un accès continu et en temps réel à ces données.”

Le problème est qu’à l’heure actuelle, la plupart des VLOPs sont tout à la fois porteuses de risques systémiques sans n’implémenter ni la portabilité effective des données, ni le pluralisme algorithmique. Pire, dans certains cas, comme pour X, elles ne respectent pas la loi définie par l’article 40 du DSA, qui permet à des tiers, dont les chercheurs, d’accéder aux données de ces réseaux pour évaluer les risques systémiques :

Upon a reasoned request from the Digital Services Coordinator of establishment, providers of very large online platforms or of very large online search engines shall, within a reasonable period, as specified in the request, provide access to data to vetted researchers who meet the requirements in paragraph 8 of this Article, for the sole purpose of conducting research that contributes to the detection, identification and understanding of systemic risks in the Union, as set out pursuant to Article 34(1), and to the assessment of the adequacy, efficiency and impacts of the risk mitigation measures pursuant to Article 35.

X en est donc un bon exemple des dérives des réseaux centralisés présentant des risques systémiques.

Au contraire, Mastodon et BlueSky ont été conçus comme des écosystèmes numériques capables d’assurer trois principes fondamentaux de la liberté des utilisateurs (portabilité des données, pluralisme algorithmique, décentralisation), avec quelques petites différences.

Contrairement à Twitter et les autres plateformes sociales centralisées (Facebook, LinkedIn, Insta, etc.), Mastodon et BlueSky sont basés sur des protocoles ouverts. En gros, on se met d’accord sur ce que veut dire poster une ressource en ligne et la relayer ; et ensuite un certain nombre d’acteurs proposent des façons de faire du social dans ces écosystèmes numériques.

Comme tout le monde utilise le même protocole, tout le monde peut échanger avec et suivre tout le monde, même si on a choisi des services différents. Chacun est propriétaire de ses données et de son identité numérique, comme dans la téléphonie moderne.

Le fait d’avoir des réseaux sociaux fondés sur des protocoles ouverts a aussi un avantage considérable : la décentralisation. Contrairement à X, LinkedIn ou Facebook, personne ne peut racheter les protocoles sur lesquels s’appuient Mastodon ou BlueSky, de même que personne ne peut racheter le protocole http:// qui permet de connecter le Web ou la convention qui permet aux téléphones de communiquer.

Si un milliardaire rachète un hébergeur Mastodon, ses utilisateurs peuvent, s’ils le souhaitent, migrer en quelques clics vers un autre hébergeur Mastodon qui leur conviendrait mieux en emportant données et audience. BlueSky a pris du retard sur l’aspect décentralisation, mais des initiatives comme Free Our Feeds voient le jour pour développer cet aspect.

Il est de ce point de vue indéniable que des réseaux plus vertueux que X existent mais que leur déploiement sur le ‘marché’ des réseaux sociaux est freiné par l’absence de portabilité du graphe social et des données de X. Si vous en partez, vous perdez vos threads et vos abonnés. X vous a rendu captif de votre audience.

This post is also available in: Anglais