Formats d’import de Gargantext

Pour tout type d’import

Les fichiers de corpus doivent être téléversés au format d’archive compressée zip (.zip). Que vous ayez un ou plusieurs fichiers, vous devez tous les zipper dans une même archive (cela permet d’économiser de la bande passante).

L’import de corpus marque le début d’une analyse, il s’opère depuis la page listant les projets :

http://gargantext.org/projects

corpus

Description des types d’import

CSV

Le format CSV de Gargantext comporte :

  • Un jeu de caractère UTF8
  • la tabulation comme séparateur de champ
  • pas de délimiteur de champ.

Il est fortement recommandé d’utiliser un éditeur de texte libre tel que LibreOffice ou OpenOffice, certains éditeurs propriétaires ayant tendance à imposer leur format CSV.

  • Sous Open Office par exemple, lorsque vous ‘sauvez sous’ votre document, cliquer sur ‘éditer les paramètres du filtre’

openofficecsvsavePuis choisissez les paramètres comme suit :

csvformat

  • Sous Excel
    1. Ouvrir le fichier avec Excel en sélectionnant toutes les cellules (sélectionner la première cellule puis Ctrl+A, ou Cmd+A sous Mac)csv_1
    2. Enregister le fichier en spécifiant qu’il s’agit d’un fichier au format CSV (.csv)

Le fichier  lui même doit comporter les champs suivants avec une première ligne d’entêtes décrites entre crochets :
– titre du document [title]
– contenu du document [abstract]
– date du document [publication_year]
– auteur  [authors]
– source du document (ex : le titre du journal) [source]
– mois de la publication (si pas indiqué, mettre le chiffre ‘1’) [publication_month]
– Jour de la publication (si pas indiqué, mettre le chiffre ‘1’) [publication_day]

En cas de doute, vous pouvez obtenir un exemple de fichier CSV Gargantext au format le plus récent en exportant votre corpus depuis la page ‘Document’ d’un projet.

Web of Science (ISI)

Les personnes disposant d’un accès au Web of Science peuvent exporter le résultat de leur recherche pour l’analyser dans Gargantext.

Sur la page des résultats de recherche, choisir ‘save to other file format’

wosexport_1

Puis choisir les champs comme suit :

wosexport2

Compresser l’ensemble des fichiers ainsi obtenus avant de les téléverser sur Gargantext.