L’Action nationale de formation TDM 2021 « Exploration documentaire et extraction d’information» se tiendra les 16 et 17 novembre 2021 prochains à l’Institut des systèmes complexes de Paris IDF. Les inscriptions sont ouvertes.
Organisée par le CNRS et l’INRAE, cette formation a pour objectif de faire monter en compétence les chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d’appui à la recherche qui souhaitent mettre en place ou développer l’exploration documentaire et l’extraction d’informations dans leur activité.
L’Inist y sera présent le mardi 16 novembre au travers de Sabine Barreaux et Camille de Salabert qui présenteront, en première conférence plénière « La constitution d’un corpus spécialisé à partir des ressources ISTEX ».
Cette démonstration présentera la méthode de constitution d’un corpus spécialisé sur un sujet universel en utilisant les différents services associés à ISTEX afin d’obtenir à un corpus de qualité qui pourra ensuite être utilisé par des outils de fouille de texte.
La démonstration de l’Inist
Constitution d’un corpus spécialisé à partir des ressources ISTEX
- Présentation du réservoir ISTEX et construction d’une requête.
Valorisation d’un corpus spécialisé
- Téléchargement du corpus avec ISTEX-DL et exploration du corpus avec l’outil LODEX pour analyser son contenu et en éliminer les éventuelles anomalies
Le reste du programme de cette ANF
- La première journée sera ensuite consacrée à une introduction à la “fouille de texte et de données” et positionnement de l’offre logicielle
- La seconde journée sera plus pratique, avec des ateliers d’utilisation d’outils (GarganText; ; NooJ; Alvis ; Weka; Cortext; Notebook; Iramuteq)
Site de l’événement, inscriptions (jusqu’au 1er oct. 2021) et programme détaillé
https://anf-tdm-2021.sciencesconf.org/
A voir aussi
- Flyer de l’événement
- Actualité site science ouverte du CNRS : https://www.science-ouverte.cnrs.fr/actualite/action-nationale-de-formation-exploration-documentaire-et-extraction-dinformation/