Articles reli´s: «:MIR»

Vers l’accès multilingue en langage naturel aux bases de données textuelles

22 janvier 2009

La thèse présentée porte sur la localisation d’information textuelle exprimée en une langue à partir de description exprimée dans une autre langue.

Le système proposé utilise une reformulation monolingue et multilingue qui ne dépend pas du domaine de la base.

La grande partie des ambiguïtés produites par la reformulation est résolue par la cooccurrence des termes dans une même partie du texte.

Au Chapitre I sont présentées les différentes approches de la recherche documentaire multilingue. Les mécanismes utilisés dans la traduction automatique et qui s’avèrent utiles pour l’interrogation multilingue sont décrits. Nous citerons quelques ressources multilingues disponibles et certains outils de construction de dictionnaire à titre d’exemple pour montrer la multitude des ressources lexicographiques qui peuvent être intégrées au système d’interrogation multilingue.

La faisabilité d’un système d’interrogation multilingue est étudiée au Chapitre II. Les contraintes que nous nous sommes données sont que le système doit être indépendant du contenu de la base et que l’approche soit identique pour toutes les langues. L’approche a été validée par une maquette. Le Chapitre II décrit les outils de recherche documentaire et les données linguistiques nécessaires pour réaliser cette maquette et effectuer l’interrogation multilingue. L’outil de mesure des performances, précision / recouvrement utilisé pour comparer les différents mécanismes, est décrit également au Chapitre II.

Le prototype d’interrogation multilingue, présenté au Chapitre III, permet d’intégrer et d’automatiser les différents mécanismes. Les stratégies de reformulation activent et désactivent les mécanismes de reformulation pour étudier leur influence sur la qualité des réponses. L’outil de mesure de la précision / recouvrement est utilisé comme instrument de mesure de l’efficacité de chaque mécanisme.

Le manque de jeux d’essai adaptés à l’interrogation multilingue, à l’époque de cette thèse 1990-1993, amène à rechercher un autre système de mesure de performance que la précision / recouvrement. Une méthode de mesure de performance est décrite au Chapitre IV. Cette mesure permet d’évaluer les caractéristiques fondamentales du système de recherche documentaire proposé. Ainsi, l’efficacité de l’effet de la cooccurrence des concepts est mesurée. Le filtrage des traductions par le lexique de la base est vérifié et montre la validité des hypothèses de base de ce travail.

Au Chapitre V, nous proposons l’ajout de fonctionnalités à l’analyse linguistique, des perfectionnements à la reformulation et l’adaptation du module de comparaison question – documents pour supporter les améliorations des modules d’analyse linguistique et de reformulation.

Voir document d’origine
Liste des travaux faisant référence au document de référence