Un projet renouvelé
Au premier janvier 2024, l’Inist a été renouvelé avec un projet sur 5 ans prévoyant d’une part de déployer son accompagnement vers la science ouverte pour les 3 types de productions scientifiques que sont les publications, les données et enfin les codes et logiciels, et d’autre part de faire de la fouille de texte une réalité pour les chercheurs. Ce projet s’appuie sur nos réalisations les plus récentes décrites dans ce document.
L’accès à tout type de productions scientifiques facilité
L’outil Click & Read qui permet un accès rapide aux textes des publications poursuit son extension aux ressources électroniques des partenaires ; aujourd’hui 67 réservoirs documentaires sont accessibles montrant ainsi une bonne appropriation de la part de nos collègues des différents établissements. Tant par cet outil que par le portail documentaire BibCnrs, l’Inist favorise l’accès aux publications disponibles en Open Access et expérimente également l’accès aux données de recherche.
Initié en 2019, le portail HAL-CNRS a atteint en 2023 le cap des 2 millions de références. L’équipe en charge du portail s’est organisée pour en assurer la modération et la curation tout au long de l’année, y compris pendant les périodes de dépôts intensifiées par les campagnes d’évaluation des chercheurs.
Première année de fonctionnement de l’écosystème Recherche data Gouv
Les centres de ressources OPIDoR et DoRANum ont trouvé un mode de fonctionnement collaboratif avec les ateliers de la donnée permettant de mutualiser sur nos plateformes les outils et ressources pédagogiques indispensables à la mise en œuvre de leurs missions d’accompagnement des communautés scientifiques.
Dans la même logique, l’Inist est fortement impliqué dans l’administration et la curation de l’espace générique national ainsi que de l’espace institutionnel CNRS Research Data. Ces entrepôts, qui sont complémentaires des entrepôts thématiques nationaux ou internationaux disponibles, permettent de disposer d’une solution de confiance répondant à chaque besoin.
Mis en place en 2022, le consortium DataCite France organise son activité autour de 6 groupes de travail portant aussi bien sur la qualité des métadonnées associées aux identifiants pérennes que sur le modèle économique de ce service nécessaire pour assurer l’accès aux jeux de données.
Des attentes fortes vis-à-vis de la fouille de textes
Les équipes poursuivent l’alimentation de la plateforme Istex pour arriver bientôt à 28 millions de documents qui sont prétraités et enrichis pour un usage en fouille de texte. Afin de faciliter ce dernier usage, les équipes packagent les outils dans des web-services, 38 sont d’ores et déjà accessibles sur la plateforme et peuvent être utilisés en autonomie soit sur un corpus extrait des ressources Istex soit sur un corpus préparé par l’utilisateur.
Une bonne façon de mettre en valeur les ressources documentaires disponibles sur la plateforme est d’en extraire un corpus, de l’enrichir en appliquant des méthodes de fouille de texte et de le visualiser avec l’outil Lodex qui est maintenant arrivé à maturité. Les équipes déploient un ensemble de formations afin d’accompagner les utilisateurs dans les différentes phases d’interrogation de la plateforme, de traitement et de visualisation des corpus ainsi constitués.
L’Inist est le premier utilisateur de ces avancées en fouille de texte. Ainsi pour réaliser le travail de titan que demandent le recensement et l’analyse des frais engagés par le CNRS pour publier les travaux scientifiques en Open Access selon le mode gold, l’équipe fait appel aux collègues pour réaliser une première passe automatisée dans le dépouillement des quelque 3 000 dépenses.
Ce rapport d’activité décrit précisément l’ensemble de ces développements, qui pour la plupart sont réalisés en collaboration avec nos partenaires nationaux et s’inscrivent dans la feuille de route science ouverte du CNRS pilotée par la Direction des données ouvertes de recherche (DDOR). Elles ont également leur prolongement dans une implication dans le groupe de travail de l’initiative EOSC « PID Policy&implementation » et celui d’« EOSC FAIR impact », ou dans le projet Skills4EOSC. Cette implication ainsi que la participation aux projets portés par EOSC seront à renforcer.
Bonne lecture.
Claire François
Directrice de l’Inist