Dédiée à l’exposition, l’interrogation et le téléchargement de ressources terminologiques scientifiques, la plateforme Loterre s’inscrit dans l’écosystème du web de données ouvertes et FAIR.
L’appui linguistique se concrétise également avec les compétences de l’équipe de traducteurs en matière de traductions, de relectures de documents scientifiques ou de supports de présentation.
7 nouveaux thésaurus ont été publiés dont :
● Un thésaurus Mathématiques : ce thésaurus bilingue (français et anglais) concerne le domaine des mathématiques. Il renferme actuellement plus de 2 600 concepts enrichis de synonymes et pourvus de définitions issues en grande majorité de Wikipédia.
● Un thésaurus Astronomie : réunissant un vocabulaire de 2 493 concepts, il reflète le contenu des articles indexés, incluant tous les aspects de la recherche en astronomie y compris les éléments mathématiques, la chimie interstellaire et la physique théorique présents dans les articles.
Terminologie
Corpus et thésaurus…
- Mise à jour du corpus mémoire psychologie – neurosciences et création d’un nouveau corpus Mémoire et SHS dans le cadre de l’utilisation des terminologies dans l’exposition de corpus Istex.
- Mise à jour du thésaurus Mémoire avec ajout du marquage des bibliographies sélectives (type d’étude et type d’accès au document).
- Création d’une nouvelle ressource, le thésaurus bilingue (français-anglais) « Composés inorganiques ».
Du côté des projets…
- Poursuite des travaux de constitution et d’enrichissement du thésaurus en paléoclimatologie (Paleosaurus), en collaboration avec la DiBiso et des chercheurs de l’Université Paris-Saclay, du LSCE et de Géosciences Montpellier, avec notamment l’attribution de définitions (en français et en anglais) à chacun des termes.
- Projet TyDI – Phase 2 : définition des spécifications (IHM essentiellement) ; tests des développements réalisés, révision de la documentation utilisateur.
Loterre
Nombre de terminologies chargées au 1er janvier 2024 : 72
Traduction
Quelques exemples de traductions…
Du français vers l’anglais :
- Traductions pour le CNRS (Direction de la communication, Direction des données ouvertes de la recherche – DDOR, mission pilotage et relations avec les délégations régionales et les instituts – MPR, Direction Europe de la recherche et coopération internationale – DERCI) tout au long de l’année : 61 110 mots.
- Traduction du rapport d’activité annuel du CNRS à la demande de la Direction de la communication : 20 799 mots.
- Traductions pour le Comité pour la science ouverte : 12 685 mots.
De l’anglais vers le français :
- Traduction du rapport « L’égalité femmes-hommes dans le financement de la recherche. Étude de 11 pays européens, Israël et le Canada et de son annexe » dans le cadre du projet Gender-Net Plus pour la Mission pour la place des femmes au CNRS : 83 500 mots.
- Traductions de rapports et documents pour EOSC : total de 69 406 mots.
Volumes pour les activités de traduction et relecture :
Français vers anglais : 121 documents – 378 134 mots.
Anglais vers français : 29 documents – 261 093 mots.
Et aussi…
- Participation au Groupe de travail COAR (Confederation of Open Access Repositories) sur la prise en compte technique des langues non anglaises dans les archives ouvertes.
- Travaux d’extractions et de dépouillements terminologiques et coopération avec le service Textes & Corpus – Istex dans le cadre du projet ANR MaTOS consacré à l’emploi et l’évaluation de la traduction automatique de textes scientifiques.
Lancement du projet mATOS
L’Inist participe au projet MaTOS (projet ANR) dont le lancement officiel a eu lieu en février 2023 à Paris.
Le projet MaTOS, Machine Translation for Open Science (Traduction automatique pour la science ouverte) a pour objectif de fluidifier la circulation et la diffusion des connaissances scientifiques par une traduction automatique améliorée. Il vise à créer un outil expérimental de traduction automatique autour de la science ; un domaine où cette technologie se heurte parfois à des difficultés.
L’Inist y apporte des ressources qui ressortent de ses activités usuelles, comme les ressources textuelles Istex & terminologiques Loterre, ainsi que ses multiples compétences dans le domaine du traitement des vocabulaires.
Soumission d’un billet de blog sur OPUS-CAT-MT pour publication sur Hypothèses.org : Traductions et science ouverte – Explorer le rôle de la traduction dans la science ouverte et multilingue. Jean-François Nominé.
Andrea Chiarelli, Lucia Loffreda, Rob Johnson, Jean-François Nominé, Manon Parrinello, et al. Publication et Données Reproductibles de la Recherche : Que Faire ? : Soutenir et Encourager de Nouvelles Pratiques. Knowledge Exchange. 2023, 82 p. (hal-04170637)