* * * * * * * * * * * * * * * * * * * * * * * *
LINGUIST List logo Eastern Michigan University Wayne State University *
* People & Organizations * Jobs * Calls & Conferences * Publications * Language Resources * Text & Computer Tools * Teaching & Learning * Mailing Lists * Search *
* *


LINGUIST List 25.1184

Mon Mar 10 2014

Calls: Computational Linguistics/France

Editor for this issue: Anna White <awhitelinguistlist.org>

Date: 10-Mar-2014
From: Michael Zock <michael.zocklif.univ-mrs.fr>
Subject: Réseaux Lexicaux et Traitment des Langues Naturelles
E-mail this message to a friend

Full Title: Réseaux Lexicaux et Traitment des Langues Naturelles
Short Title: RLTLN

Date: 01-Jul-2014 - 01-Jul-2014
Location: Marseille, France
Contact Person: Michael Zock
Meeting Email: < click here to access email >
Web Site: http://sites.google.com/site/rltlntaln2014/

Linguistic Field(s): Computational Linguistics

Call Deadline: 21-Apr-2014

Meeting Description:

1. Présentation du champ :

La façon dont nous regardons les unités lexicales, leur organisation et utilisation a radicalement changée ces dernières décennies. Décrites dans des dictionnaires et considérées comme des annexes de la grammaire dans les années 80, on les considère désormais comme de la matière première en TAL. Si à l’époque on utilisait encore des termes comme ‘mots’ ou ‘dictionnaires’, on parle aujourd’hui plutôt de ‘ressources lexicales’ dont il existe un certain nombre (WordNet, FrameNet, VerbNet, PropBank, ...). Ces ressources ont été standardisées (http://en.wikipedia.org/wiki/UBY-LMF), liées entre elles (http://verbs.colorado.edu/semlink/) ou liées à des encyclopédies comme Wikipédia (http://en.wikipedia.org/wiki/BabelNet). Il y a également des projets comme DBnary (http://kaiko.getalp.org/about-dbnary) qui, partant de Wiktionary, fournit des ressources lexicales dans de nombreuses langues.

Les premières tentatives de création automatique de ressources à partir de dictionnaires imprimés (Ide & Véronis, sites.univ-provence.fr/veronis/publis.html) se sont vite heurtées à des problèmes, en raison de la pauvreté de la source : les dictionnaires papier ne contenaient pas les informations nécessaires permettant ensuite un usage par la machine. Or, c’était justement le but recherché. L’accès à de vastes corpus a alors permis de marquer un tournant et de construire des ressources plus riches, plus explicites et mieux structurées. Concernant ce dernier point, WordNet (WN) a joué un rôle capital. Bien qu’il n’a pas eu le succès escompté auprès des psycholinguistes ou auprès des utilisateurs consultant la ressource (pour chercher des mots), WN a eu un succès considérable en TAL. Ceci dit, WN a également eu un impact incontestable sur le plan théorique. Il a profondément modifié notre manière de voir la structure des ressources lexicales. Dorénavant, elles ne se résument plus à des simples listes alphabétiques, mais elles sont réprésentées plutôt sous forme des graphes (réseau lexical) dont les noeuds sont des unités lexicales liées par différents types de relations.

Parallèlement à l’évolution des ressources lexicales, on a pu observer une évolution notable concernant les travaux portant sur les graphes. Ces derniers semblent se prêter à merveille à la modélisation de divers domaines (Barrat, 2008, Barabási, 2003), y compris celui de la langue. En effet, il y a eu de nombreux travaux montrant leur pertinence pour capter le sens des mots et celui des phrases (Widdows, 2004; Sowa, 1991) ou pour modéliser divers aspects du ‘monde’ lexical : structures associatives (http://www.eat.rl.ac.uk, ou http://w3.usf.edu/FreeAssociation/), structure du dictionnaire (Gaume et al. 2008), densité lexicale, distance moyenne entre les mots (Vitevitch, 2008), accessibilité (Ferrer i Cancho & Sole, 2001), aspects dynamiques des graphes (Dion, 2012), etc.
Nous constatons donc qu’il y a deux communautés, dont l’une s’intéresse aux données (concrètes commes les unites lexicales), et l’autre plutôt à leur représentation et organisation (graphes, topologie, navigation). C’est pour encourager l’échange d’idées entre ces deux mondes, que nous organisons cet atelier.

Appel à communications :

Submissions in English are very welcome for non-French native speakers. For more details, please contact the organisers.

2. Themes :

Nous attendons des soumissions portant sur les thèmes évoqués plus haut et en particulier :

- Origine des données permettant la construction des ressources : corpus (web, blogs, courriels), êtres humains (liste d’associations), etc.
- Méthode de construction de la ressource: automatique, semi-automatique, collaborative (par des jeux, etc.)
- Construction automatique du réseau (repérage et caractérisation des relations sémantiques)
- Structuration des données : alphabétique, thématique, liens sémantiques, liens associatifs
- Propriétés mathématiques des réseaux lexicaux
- Facteurs affectant le poids des noeuds ou des liens : aspects dynamiques des graphes (fréquence, saillance, récence, changement de thème, etc.)
- Caractérisation topologique du graphe lexical : distribution, densité relative, évolution du graphe
- Exploitation ou utilisation de la ressource ou d’une de ses transformations comme la transformation du graphe en arbre pour assister la navigation (accès lexical)
- Accessibilité des mots grâce à des caractéristiques du réseau (phénomène du ‘petit monde’)
- Visualisation et manipulation des graphes (traduction en arbre, clustering, calcul de similarité sémantique)
- Modélisation des variations linguistiques et des changements de la langue (évolution du lexique)

3. Critères de sélection :

Les soumissions seront examinées par au moins deux spécialistes du domaine.

Pour les travaux de recherches, seront considérées en particulier :

- L'adéquation aux thèmes de l'atelier
- L'importance et l'originalité de la contribution
- La correction du contenu scientifique et technique
- L'organisation et la clarté de la présentation

4. Modalités de soumission

Les articles seront rédigés en français pour les francophones, en anglais pour ceux qui ne maîtrisent pas le français. Ils devront suivre le format de TALN 2014 et ne doivent pas dépasser 10 pages (références comprises). Les feuilles de style (LaTeX et Word) sont disponibles sur le site web de la conférence (http://www.taln2014.org/site/soumission/). Les propositions doivent être envoyées sous forme pdf à l’adresse suivante : (https://www.easychair.org/conferences/?conf=RLTLN2014). Les articles retenus donneront lieu à une présentation de 30 mn, discussion comprise.

5. Comite de programme

Pour la liste complète et plus ample information, veuillez visiter notre site :

http://www.taln2014.org/site/
https://sites.google.com/site/rltlntaln2014/



Read more issues|LINGUIST home page|Top of issue



Page Updated: 10-Mar-2014

Supported in part by the National Science Foundation       About LINGUIST    |   Contact Us       ILIT Logo
While the LINGUIST List makes every effort to ensure the linguistic relevance of sites listed on its pages, it cannot vouch for their contents.