Publishing Partner: Cambridge University Press CUP Extra Publisher Login
amazon logo
More Info


E-mail this page

Conference Information



Full Title: Réseaux Lexicaux et Traitment des Langues Naturelles

      
Short Title: RLTLN
Location: Marseille, France
Start Date: 01-Jul-2014 - 01-Jul-2014
Contact: Michael Zock
Meeting Email: click here to access email
Meeting URL: http://sites.google.com/site/rltlntaln2014/
Meeting Description: 1. Présentation du champ :

La façon dont nous regardons les unités lexicales, leur organisation et utilisation a radicalement changée ces dernières décennies. Décrites dans des dictionnaires et considérées comme des annexes de la grammaire dans les années 80, on les considère désormais comme de la matière première en TAL. Si à l’époque on utilisait encore des termes comme ‘mots’ ou ‘dictionnaires’, on parle aujourd’hui plutôt de ‘ressources lexicales’ dont il existe un certain nombre (WordNet, FrameNet, VerbNet, PropBank, ...). Ces ressources ont été standardisées (http://en.wikipedia.org/wiki/UBY-LMF), liées entre elles (http://verbs.colorado.edu/semlink/) ou liées à des encyclopédies comme Wikipédia (http://en.wikipedia.org/wiki/BabelNet). Il y a également des projets comme DBnary (http://kaiko.getalp.org/about-dbnary) qui, partant de Wiktionary, fournit des ressources lexicales dans de nombreuses langues.

Les premières tentatives de création automatique de ressources à partir de dictionnaires imprimés (Ide & Véronis, sites.univ-provence.fr/veronis/publis.html) se sont vite heurtées à des problèmes, en raison de la pauvreté de la source : les dictionnaires papier ne contenaient pas les informations nécessaires permettant ensuite un usage par la machine. Or, c’était justement le but recherché. L’accès à de vastes corpus a alors permis de marquer un tournant et de construire des ressources plus riches, plus explicites et mieux structurées. Concernant ce dernier point, WordNet (WN) a joué un rôle capital. Bien qu’il n’a pas eu le succès escompté auprès des psycholinguistes ou auprès des utilisateurs consultant la ressource (pour chercher des mots), WN a eu un succès considérable en TAL. Ceci dit, WN a également eu un impact incontestable sur le plan théorique. Il a profondément modifié notre manière de voir la structure des ressources lexicales. Dorénavant, elles ne se résument plus à des simples listes alphabétiques, mais elles sont réprésentées plutôt sous forme des graphes (réseau lexical) dont les noeuds sont des unités lexicales liées par différents types de relations.

Parallèlement à l’évolution des ressources lexicales, on a pu observer une évolution notable concernant les travaux portant sur les graphes. Ces derniers semblent se prêter à merveille à la modélisation de divers domaines (Barrat, 2008, Barabási, 2003), y compris celui de la langue. En effet, il y a eu de nombreux travaux montrant leur pertinence pour capter le sens des mots et celui des phrases (Widdows, 2004; Sowa, 1991) ou pour modéliser divers aspects du ‘monde’ lexical : structures associatives (http://www.eat.rl.ac.uk, ou http://w3.usf.edu/FreeAssociation/), structure du dictionnaire (Gaume et al. 2008), densité lexicale, distance moyenne entre les mots (Vitevitch, 2008), accessibilité (Ferrer i Cancho & Sole, 2001), aspects dynamiques des graphes (Dion, 2012), etc.
Nous constatons donc qu’il y a deux communautés, dont l’une s’intéresse aux données (concrètes commes les unites lexicales), et l’autre plutôt à leur représentation et organisation (graphes, topologie, navigation). C’est pour encourager l’échange d’idées entre ces deux mondes, que nous organisons cet atelier.
Linguistic Subfield: Computational Linguistics
LL Issue: 25.1184


Back
Calls and Conferences main page