Thèse de Mickaël TRAN

Référence

Tran Mickaël (2006). Prolexbase. Un dictionnaire relationnel multilingue de noms propres : conception implantation et gestion en ligne. Thèse de doctorat d'informatique, Université François Rabelais Tours.

Jury : C. Boitet, D. Lepesant, D. Maurel, J.-M. Pierrel, A. Savary, P. Zweigenbaum.

Télécharger la thèse / To download the thesis

Résumé

Cette thèse présente les différentes étapes de la conception et de l’implémentation d’un dictionnaire électronique relationnel multilingue de noms propres, destiné à des processus automatiques.

Une étude de différents travaux dans le monde des dictionnaires électroniques et dans le domaine des noms propres en linguistique et en TAL nous a permis de proposer une modélisation des noms propres. Cette modélisation repose sur une architecture en deux parties : une partie qui ne dépend pas des langues et une partie qui dépend de la langue.

La première partie est formée d’un niveau métaconceptuel, regroupant les concepts de type, de supertype et d’existence, et d’un niveau conceptuel, qui comprend le concept de nom propre conceptuel et quatre relations (la synonymie, l’hyperonymie, la méronymie et l’accessibilité).
Le seconde partie comprend le niveau linguistique (prolexème, alias, dérivés et les relations qui dépendent de la langue) et le niveau des instances (formé de l’ensemble des formes fléchies du prolexème, des alias et des dérivés).

Nous avons implémenté notre modèle sous la forme d’une base de données relationnelle. Une interface de consultation et une interface de travail collaboratif ont été créées. La base est actuellement sur le site du CNRTL.

Mots-clés

Noms propres, dictionnaire électronique, typologie, ontologie, synonymie, méronymie, accessibilité, XML.

Abstract

This thesis presents the different stage of the design and the implementation of an electronic relational multilingual dictionary of proper names for automatic process.

A study of different works in the world of electronic dictionaries and in the domain of proper names in linguistic and in NLP has allowed us to propose a modeling of proper names. This modeling is based on architecture in two parts: a common part for languages and a specific part for a given language.

The first part contains a metaconceptual level, which regroups the concepts of type, supertype and existence, and the conceptual part, which regroups the conceptual proper name and four relations (the synonymy, the hyperonymy, the meronymy and the accessibility).
The second part contains a linguistic level (prolexemes, aliases, derivatives and relations which depend on a language) and an instances level (with the inflected form of the prolexeme, the aliases and the derivatives).

We have implemented our model trough a relational database. An interface of consultation and a collaborative work interface have been developed. The database is actually at the CNRTL website.

Keywords

Proper Names, Electronic Dictionary, Typology, Ontology, Synonymy, Meronymy, Accessibility, XML.