LINGUIST List 13.1117

Tue Apr 23 2002

Confs: French Spoken Corpora, Paris, France

Editor for this issue: Dina Kapetangianni <dinalinguistlist.org>


Please keep conferences announcement as short as you can; LINGUIST will not post conference announcements which in our opinion are excessively long.

Directory

  1. Jean Veronis, Workshop on French spoken corpora

Message 1: Workshop on French spoken corpora

Date: Tue, 23 Apr 2002 11:38:26 +0200
From: Jean Veronis <Jean.Veronisnewsup.univ-mrs.fr>
Subject: Workshop on French spoken corpora

 ATALA
 http://www.atala.org/

 Journ�e d'Etude
 Constitution et exploitation de corpus du fran�ais parl�
 organis�e par
 Claire Blanche-Benveniste & Jean V�ronis

 25 mai 2002

 CHU Piti�-Salp�tri�re
 91 bd de l'H�pital
 75013 Paris, France

 Amphis B et C
 (RdC du b�timent principal, � gauche des ascenseurs)


Th�me
=====

Alors qu'on dispose de plusieurs centaines de millions de mots de
textes �crits (et que le gigantesque r�servoir qu'est le World Wide
Web repousse chaque jour cette limite), on dispose de tr�s peu de
donn�es sur l'oral. Les corpus de langue orale transcrite sont
pourtant d'une importance fondamentale pour l'�tude linguistique,
comme pour la mise au point de nouvelles technologies vocales.

Pour l'anglais, plusieurs dizaines de millions de mots transcrits sont
disponibles (British National Corpus, Santa Barbara Corpus of American
English, Corpus CANCODE, etc.) et plusieurs grands projets de corpus
oraux viennent de voir le jour pour d'autres langues (Corpus Gesproken
Nederlands, Corpus of Spoken Israeli Hebrew, Corpus du Portugais
Parl�, etc.), qui visent une taille de l'ordre de la dizaine de
millions de mots. Il n'existe pas pour l'instant de grand projet
national pour le fran�ais, mais uniquement des entreprises isol�es, et
il est difficile d'�valuer la quantit� totale des donn�es
informatis�es, mais elle ne d�passe certainement que de peu le million
de mots.

Le d�veloppement de corpus oraux transcrits est extr�mement co�teux,
et demande une m�thodologie stricte, appuy�e sur des outils
informatiques ad�quats. Le but de cette journ�e est de r�unir
linguistes et informaticiens pour faire le point sur la situation
concernant le fran�ais, et de tracer quelques pistes pour des
recherches et collaborations futures.


Inscription
===========
Il n'y a pas d'inscription et l'entr�e est gratuite, mais l'adh�sion � l'ATALA
est un geste qui permet � l'association de continuer ses activit�s. L'adh�sion
inclut la r�ception gratuite de la revue "Traitement Automatique des langues".
 http://www.atala.org/adhesion.html


Programme
=========

Les modifications de derni�re minute, ainsi que les r�sum�s des 
communications se trouvent � l'adresse:

http://www.up.univ-mrs.fr/veronis/Atala/jecorpus/


9h15 Accueil

9h30 Conf�rence invit�e

 Michael McCarthy (Universit� de Nottingham), Spoken corpus design :
 speakers, contexts and language use

 Michael McCarthy est professeur de linguistique appliqu�e �
 l'Universit� de Nottingham et sp�cialiste des corpus d'anglais parl�.
 Il est l'un des cr�ateurs du corpus CANCODE (Cambridge and Nottingham
 Corpus of Discourse in English), produit d'une collaboration entre
 l'Universit� de Notthingham et Cambridge University Press et
 comportant plusieurs millions de mots d'anglais parl�. Michael
 McCarthy a publi� de nombreux ouvrages tels que "Discourse Analysis
 for Language Teachers" (Cambridge University Press, 1991), "Language
 as Discourse" (avec R. A Carter, Longman, 1994), "Exploring Spoken
 English" (avec R. A Carter, Cambridge University Press, 1997),
 "Spoken Language and Applied Linguistics" (Cambridge University
 Press, 1998), "Exploring Grammar in Context" (avec R. Hughes et R. A
 Carter, Cambridge University Press, Cambridge, 2000) and "Issues in
 Applied Linguistics" (Cambridge University Press, Cambridge, 2000).

10:15-11:15 Session pl�ni�re (Amphi C)

 10:15 Michel Francard, Genevi�ve Geron, Vincent Giroul Philippe
 Hambye, Anne Catherine Simon, R�gine Wilmet (Universit� Catholique de
 Louvain-la-Neuve, Belgique), Le centre de recherche VALIBEL : des
 corpus oraux au service d'un observatoire du fran�ais en Belgique

 10:45 Shana Poplack, Anne St-Amand (Universit� d'Ottawa, Canada), Un
 corpus oral du fran�ais du XIXe si�cle : Les R�cits du fran�ais
 qu�b�cois d'autrefois

11:15-11:45 Pause et rencontre autour des posters

11:45-12:45 Sessions parall�les

Amphi B

 11:45 Rapha�l Ma�tre, V�ronique Wild (Universit� de Neuch�tel), Un
 corpus bilingue fran�ais - dialecte francoproven�al en situation de
 contact � Evolene en Valais (Suisse)

 12:15 Christina Linqvist (Uppsala, Su�de), Corpus transcrit de
 quelques journaux t�l�vis�s fran�ais : exp�riences de constitution

Amphi C

 11:45 Barbara Pirlot, Gilles Sadowski, Sylvie Delvenne (Universit�
 Libre de Bruxelles, Belgique), Analyse des t�moignages audiovisuels
 de rescap�s des camps nazis : repr�sentation �crite et exploitation
 linguistique des donn�es

 12:15 Kate Beeching (University of the West of England, Royaume-Uni),
 Collecte, transcription et analyse d'un corpus sociolinguistique

12:45-14:15 D�jeuner

14:15-15:45 Sessions parall�les

Amphi B

 14:15 Ligia-Stela Florea (Universit� Babes-Bolyai, Roumanie),
 Exploitation de corpus oraux : une exp�rience p�dagogique au niveau
 Licence FLE

 14:45 Florence Myles, Emma Marsden, Sarah Rule, Rosamond Mitchell
 (Universit� de Southampton, Royaume-Uni), Corpus d'interlangue
 fran�aise orale: outils de gestion et d'analyse

 15:15 Anne Violin-Wigent (Michigan State University, Etats-Unis), On
 ne peut pas tout avoir: difficult�s inh�rentes � l'utilisation d'un
 corpus parl�

Amphi C

 14:15 Mireille Bilger (Universit� de Perpignan, France), Pr�sentation
 du Corpus de r�f�rence de fran�ais parl�

 14:45 Jacques Durand (ERSS, Universit� de Toulouse-Le Mirail,
 France), Bernard Laks (Universit� de Paris-X, France), Chantal Lyche
 (Universit� d'Oslo, Norv�ge), La Phonologie du Fran�ais Contemporain
 (PFC): pr�sentation et premiers r�sultats

 15:15 Estelle Campione (Universit� de Provence, France), La prosodie
 dans les corpus oraux : probl�mes d'annotation

15:45-16:15 Pause et rencontre autour des posters

16:15-17:45 Session pl�ni�re (Amphi C)

 16:15 Piet Mertens (K.U.Leuven, Belgique), L'�tiquetage grammatical
 dans le corpus ELICOP

 16:45 Hanne Leth Andersen (Aarhus Universitet, Danemark), Le fran�ais
 parl� dans l'enseignement du fran�ais langue �trang�re au Danemark

 15:15 Pascal Cordereix (Biblioth�que nationale de France), Des
 Archives de la parole au D�partement de l'Audiovisuel de la
 Biblioth�que nationale de France ; 1911 - 2002 : un si�cle de
 fran�ais parl� enregistr�

17:45-18:00 Conclusion

Communications affich�es (posters)

 1. Jean-Yves Antoine, J�r�me Goulian, Sabine Letellier (VALORIA,
 Universit� de Bretagne Sud, France), Corpus de dialogue oral pour la
 Communication Homme-Machine : quelques enseignements en linguistique
 et en Traitement Automatique des Langues Naturelles

 2. Vincent Arnaud (Universit� de Franche-Comt�, France & Universit�
 Laval, Qu�bec), Gabrielle Konopczynski (Universit� de Franche-Comt�,
 France), Saint-Claude : une ville, un corpus...

 3. Christophe Benzitoun (Universit� de Provence, France), Interaction
 des composantes syntaxiques et prosodique dans le fonctionnement de
 deux 'items conjonctifs' � partir d'un corpus oral align�

 4. Katia Ploog (ERSS � Bordeaux, France), Les outils de description
 mis � l'�preuve du non-standard : que nous disent Singe et Cam�l�on
 sur le changement syntaxique du fran�ais � Abidjan ?

 5. Marie-No�lle Roubaud, Chantal Le Thomas (Universit� de Provence,
 France), Compte-rendu d'une exp�rience de correcteurs de corpus oraux
 informatis�s

 6. Luiggi Sansonetti (ILPGA, Universit� de Paris III, France), Le
 Projet ANACAL : ANalyse Automatique de Corpus d'Acquisition du Langage

 7. Thomas Schmidt (Universit� de Hamburg, Allemagne), EXMARaLDA - un
 syst�me de transcription computationelle comme base d'un corpus de la
 langue parl�e multilingue

 8. Pascale Vergely (Centre d'Etudes de la Navigation A�rienne et
 ERSS, Universit� de Toulouse Le Mirail, France), Laurent Prevot
 (Institut de Recherche en Informatique de Toulouse, France),
 Probl�mes de constitution d'un corpus de dialogues oraux finalis�s,
 les cas de la r�solution d'un dysfonctionnement technique et de
 l'explication d'un itin�raire



Mail to author|Respond to list|Read more issues|LINGUIST home page|Top of issue