Cartographie des données du site Le Vrai Débat

Ces derniers mois, en parallèle de l’initiative gouvernementale, plusieurs plateformes ont fleuri pour contribuer au débat national en ligne. Parmi celles-ci, la plateforme Le Vrai Débat a la particularité d’avoir proposé aux contributeurs de réagir aux propositions et de les évaluer (à partir de votes ‘pour’, ‘contre’ et ‘mitigé’). Ce filtrage collaboratif des propositions a permis au groupe de travail gilets jaunes du Laboratoire Triangle de proposer une sélection d’environ mille propositions les plus plébiscitées. Nous en proposons ici une cartographie anonymisée.

Les 1048 propositions ont été annotées et analysées à l’aide de la plateforme Gargantext et d’une extraction terminologique effectuée par la plateforme Multivac sur l’ensemble des propositions du Grand Débat National. Cette cartographie  propose une navigation indépendamment des classifications a priori des sites de soumission (voir la méthodologie). Cette exploration complémente la cartographie en cours de l’ensemble des propositions des sites Le Grand Débat National et Le Vrai Débat,

Méthodologie de sélection de l’échantillon

Le site Le Vrai Débat a recueilli 25.000 propositions émanant de 15.457 contributeurs ainsi que 898.000  votes postés par les 44 500 inscrits, . Cette méthodologie d’échantillonnage est proposée par le groupe de travail gilets jaunes du Laboratoire Triangle (CNRS/ENS Lyon)

  1. Les propositions ayant reçu moins de 50 votes ont été écartées de l’échantillon pour des raisons de représentativité,
  2. Pour chaque proposition restante a été calculé un score défini par le nombre de votes positifs moins le nombre de votes négatifs et mitigés.
  3. Les 1059 propositions ayant eu le plus haut score ont concentré 43% de l’ensemble des votes (et 80% des votes sur les propositions ayant reçu au moins 85% de votes favorables),
  4. en retirant les doublons, nous obtenons 1048 propositions ‘les plus populaires’ (les plus votées, les plus appréciées et les moins polémiques).

Limites de la méthode et de l’interprétation

Aucune des plateformes de débat ne vérifie l’identité de ses contributeurs, introduisant en cela plusieurs problèmes méthodologiques :

  • il est impossible de savoir quelles sont les caractéristiques des populations qui ont répondu : il y a très peu de données personnelles (âge, sex, etc.) et elles sont données sur une base volontaires : elles ne sont pas nécessairement présentes ou exactes,
  • il est tout à fait possible de créer plusieurs comptes pour gonfler artificiellement la représentation de ses opinions. Ceci ouvre la voie à des manipulation des plateformes via une pratique d’astroturfing.

Ceci étant, il est impossible de dire si les contributions aux différentes plateformes de débat sont représentatives de la population française. Elles peuvent néanmoins être source d’inspiration pour les politiciens, les administrations et les citoyens dans leur ensemble et cette cartographie vise avant tout à faciliter l’exploration et la lecture des propositions.

 

Les 1048 propositions utilisées pour cette étude sont disponibles en ligne sur le site Le Vrai Débat. La liste de termes utilisés pour cette cartographie sera également fournie ce qui permettra à tout un chacun de répliquer cette carte et de l’amender en utilisant la plateforme Gargantext.