Thesauro Réorganisation automatique de thésaurus

Introduction

L’objectif du projet est de proposer un outil d’aide à la réorganisation automatique d’un thésaurus afin d’uniformiser sa structure et de l’adapter au mieux à son domaine d’application. L’utilisation d’un thésaurus est indispensable pour permettre une indexation précise des données dans les bases de données documentaires.

Alors que la construction d’un thésaurus est généralement une tâche complexe, la problématique majeure de l’utilisation de thésaurus reste sa maintenance. A la création d’un thésaurus, la collection des concepts du domaine est organisée dans une hiérarchie qui représente au mieux les relations entre les termes. Mais au fur et à mesure, selon les nouveaux besoins de nouvelles branches sont rajoutées à la hiérarchie existante, souvent de manière ad-hoc, mais conduisant à une structure inconsistante dans le temps.

D’après les dires des professionnels de ce domaine, la réorganisation de thésaurus est une tâche très complexe et coûteuse. Nous proposons dans ce projet de développer, en collaboration avec des experts documentalistes, des méthodes d’analyse automatique de thésaurus et de mettre en place ces méthodes dans un outil d’aide semi-automatique de la réorganisation de thésaurus.

  • Thèse
  • S. Noir, “Réorganisation automatique de thésaurus”, Thèse de Master HES-SO, Haute Ecole d’Ingénierie et de Gestion du Canton de Vaud, janvier 2012.