* * * * * * * * * * * * * * * * * * * * * * * *
LINGUIST List logo Eastern Michigan University Wayne State University *
* People & Organizations * Jobs * Calls & Conferences * Publications * Language Resources * Text & Computer Tools * Teaching & Learning * Mailing Lists * Search *
* *
LINGUIST List 22.421

Mon Jan 24 2011

Calls: Text/Corpus Ling, Computational Ling/France

Editor for this issue: Amy Brunett <brunettlinguistlist.org>


LINGUIST is pleased to announce the launch of an exciting new feature: Easy Abstracts! Easy Abs is a free abstract submission and review facility designed to help conference organizers and reviewers accept and process abstracts online. Just go to: http://www.linguistlist.org/confcustom, and begin your conference customization process today! With Easy Abstracts, submission and review will be as easy as 1-2-3!
Directory
        1.     Iris Eshkol-Taravella , Journée Atala

Message 1: Journée Atala
Date: 21-Jan-2011
From: Iris Eshkol-Taravella <iris.eshkoluniv-orleans.fr>
Subject: Journée Atala
E-mail this message to a friend

Full Title: Journée Atala
Short Title: Annoter les Corpus Oraux

Date: 09-Apr-2011 - 09-Apr-2011
Location: Paris, France
Contact Person: Iris Eshkol-Taravella
Meeting Email: < click here to access email >

Linguistic Field(s): Computational Linguistics; Text/Corpus Linguistics

Call Deadline: 08-Mar-2011

Meeting Description:

1er Appel à communications
Journée Atala :
‘Annoter les corpus oraux’
Le 9 avril 2011
Telecom ParisTech (46 rue Barrault, 75 013 Paris)

Les corpus oraux présentent des particularités difficilement prises en compte par des analyseurs élaborés sur des données écrites : forte variabilité, disfluences, syntaxe non canonique, notations fluctuantes etc. La nécessité de développer des méthodes d'analyse qui s'ajustent à ces particularités peut jouer sur l'adaptation d'outils existants par adjonction de règles formelles qui prennent en compte les spécificités de l'oral, sur le développement des conventions de transcription, l'adéquation aux corpus, l'utilisation de méthodes statistiques dans l'apprentissage, par exemple (liste non exhaustive). La journée prévue entend interroger l'ensemble de ces méthodes et les choix possibles en prenant sa référence dans l'annotation du corpus.

Call for Papers:

Celle-ci permet d'obtenir des données de référence sur l'oral et facilite l'exploitation informatique des données. Le fait de constituer un corpus de données annotées assure non seulement la préservation de certains aspects pertinents à l'oral (de manière à servir de base aux observations et aux comparaisons avec d'autres données) mais contribue à améliorer in fine le traitement automatique. La production et l'annotation de corpus oraux représentent un enjeu de première importance en vue d'applications telles que la reconnaissance vocale, l'apprentissage des langues, la recherche d'information, la navigation dans les corpus, etc.

De nombreux laboratoires sont aujourd'hui confrontés à des difficultés liées aux choix de logiciel, à des décisions concernant la découpe et l'alignement parole/transcription, à la sélection des métadonnées, à l'anonymisation, à la pertinence des étiquetages... L'annotation des corpus soulève la question de l'indécision des normes, notamment pour les phénomènes caractéristiques de l'oral.

Cette problématique s'adresse aux chercheurs travaillant sur les langues 'classiques' comme le français, l'anglais, mais aussi sur des langues peu documentées ou sur des états des langues non stabilisés (variétés émergentes, langues mixtes, processus de créolisation ou de dialectalisation...), également aux spécialistes de la conservation (BnF, Archives...), mais aussi à des industriels de la langue dont le champ de compétence déborde le scriptural.


Les propositions pourront aborder les thèmes suivants (liste non exhaustive) :

-Annotation orthographique
-Étiquetage morpho-syntaxique
-Chunking
-Traitement des variations internes (entre transcriptions)
-Annotation des disfluences
-Annotation prosodique (y compris prosodie sémantique)
-Annotation des entités nommées
-Annotation des unités de discours
-TEI et oral, etc.

Soumission :

Les propositions de communications seront présentées sous la forme d'un résumé de deux pages maximum (format A4, police Times taille 12) et transmises en format pdf à:

iris.eshkoluniv-orleans.fr.

Le nom, l'institution et l'adresse des auteurs seront précisés dans un fichier séparé qui rappellera le titre de la proposition.

Dates Importantes :

Date limite de réception des propositions : 8 mars 2011
Date de notification d'acceptation : 20 mars 2011

Comité Scientifique:

Jean-Yves Antoine, LI-Université de Tours
Christophe Benzitoun, ATILF-Université Nancy 2
Philippe Blache, LPL - Université de Provence
Anne Dister, Facultés universitaires Saint-Louis, UCL
Iris Eshkol-Taravella, LLL-Université d'Orléans
Serge Fleury, ILPGA-Université Paris 3
Michel Jacobson, DAF
Sylvain Kahane, Modyco-Université Paris X
Lorenza Mondada, ICAR-Université Lyon 2
Philippe Muller, IRIT-Université Paul Sabatier Toulouse
Emmanuel Schang, LLL-Université d'Orléans
Ioana Vasilescu, LIMSI
Valentin Vydrin, Inalco
Ilil Yatziv-Malibert, HTL-Université Paris 8

Comité d'organisation:

Iris ESHKOL-TARAVELLA
Contact : iris.eshkoluniv-orleans.fr



Read more issues|LINGUIST home page|Top of issue



Page Updated: 24-Jan-2011

Supported in part by the National Science Foundation       About LINGUIST    |   Contact Us       ILIT Logo
While the LINGUIST List makes every effort to ensure the linguistic relevance of sites listed on its pages, it cannot vouch for their contents.