L’Inist propose différents services dédiés au Text & Data Mining en développant et adaptant des méthodes de fouille de textes pour proposer des enrichissements adaptés aux textes, selon les besoins.

L’offre de service en TDM a été intégrée comme un service à la recherche dans l’infrastructure Istex.
Pour les projets de fouille de texte, les web-services ont été mis à disposition sur le site Istex.

Parmi les réalisations 2023…

  • Poursuite de la création et de la mise à disposition de web-services de TDM : 38 web-services accessibles.
  • Premier web-service de traitement de corpus (LDA  ou Topic modellng) : modèle probabiliste permettant de déterminer des sujets ou thèmes dans un corpus de documents.
  • Premiers développements du service « IA factory » : interface simple de chargement de corpus utilisateurs et d’exécution de programmes d’Intelligence Artificielle (IA).
  • Animation de 2 sessions du webinaire « Découverte du TDM » (120 inscrits).

Kévin Cousot, Cédric Lopez, Pascal Cuxac, Vincent Lemaire. Défi TextMine’23 – Reconnaissance d’entités d’intérêts dans les signatures d’e-mails. Atelier TextMine’23, Groupe de travail sur la fouille de textes de l’association EGC, Jan 2023, Lyon, France.
(hal-03951933)

Pascal Cuxac, Cédric Lopez, Vincent Lemaire. TextMine’23 : Atelier sur la fouille de textes. 2023.
(hal-04188281)

Projet RAPIDO

Rapido (Rendre Accessibles des Publications scientifiques Indexées et liées à des DOnnées certifiées) est porté par l’ENS de Lyon pour Persée, en partenariat avec l’Inist, l’École française de Rome, l’École française d’Athènes et l’Abes. Il a pour but de mettre en place, d’abord sur un corpus délimité de revues des Écoles françaises à l’étranger, un protocole automatisé permettant la mise en relation de ces publications avec des données de recherche via les notices de toponymes Idref.

La première réunion du Conseil Scientifique s’est déroulée le 13 septembre.

Poster présenté aux JABES,
23-24 mai 2023, Montpellier.