Editor for this issue: Dina Kapetangianni <dina
linguistlist.org>
ATALA http://www.atala.org/ Journ�e d'Etude Constitution et exploitation de corpus du fran�ais parl� organis�e par Claire Blanche-Benveniste & Jean V�ronis 25 mai 2002 CHU Piti�-Salp�tri�re 91 bd de l'H�pital 75013 Paris, France Amphis B et C (RdC du b�timent principal, � gauche des ascenseurs) Th�me ===== Alors qu'on dispose de plusieurs centaines de millions de mots de textes �crits (et que le gigantesque r�servoir qu'est le World Wide Web repousse chaque jour cette limite), on dispose de tr�s peu de donn�es sur l'oral. Les corpus de langue orale transcrite sont pourtant d'une importance fondamentale pour l'�tude linguistique, comme pour la mise au point de nouvelles technologies vocales. Pour l'anglais, plusieurs dizaines de millions de mots transcrits sont disponibles (British National Corpus, Santa Barbara Corpus of American English, Corpus CANCODE, etc.) et plusieurs grands projets de corpus oraux viennent de voir le jour pour d'autres langues (Corpus Gesproken Nederlands, Corpus of Spoken Israeli Hebrew, Corpus du Portugais Parl�, etc.), qui visent une taille de l'ordre de la dizaine de millions de mots. Il n'existe pas pour l'instant de grand projet national pour le fran�ais, mais uniquement des entreprises isol�es, et il est difficile d'�valuer la quantit� totale des donn�es informatis�es, mais elle ne d�passe certainement que de peu le million de mots. Le d�veloppement de corpus oraux transcrits est extr�mement co�teux, et demande une m�thodologie stricte, appuy�e sur des outils informatiques ad�quats. Le but de cette journ�e est de r�unir linguistes et informaticiens pour faire le point sur la situation concernant le fran�ais, et de tracer quelques pistes pour des recherches et collaborations futures. Inscription =========== Il n'y a pas d'inscription et l'entr�e est gratuite, mais l'adh�sion � l'ATALA est un geste qui permet � l'association de continuer ses activit�s. L'adh�sion inclut la r�ception gratuite de la revue "Traitement Automatique des langues". http://www.atala.org/adhesion.html Programme ========= Les modifications de derni�re minute, ainsi que les r�sum�s des communications se trouvent � l'adresse: http://www.up.univ-mrs.fr/veronis/Atala/jecorpus/ 9h15 Accueil 9h30 Conf�rence invit�e Michael McCarthy (Universit� de Nottingham), Spoken corpus design : speakers, contexts and language use Michael McCarthy est professeur de linguistique appliqu�e � l'Universit� de Nottingham et sp�cialiste des corpus d'anglais parl�. Il est l'un des cr�ateurs du corpus CANCODE (Cambridge and Nottingham Corpus of Discourse in English), produit d'une collaboration entre l'Universit� de Notthingham et Cambridge University Press et comportant plusieurs millions de mots d'anglais parl�. Michael McCarthy a publi� de nombreux ouvrages tels que "Discourse Analysis for Language Teachers" (Cambridge University Press, 1991), "Language as Discourse" (avec R. A Carter, Longman, 1994), "Exploring Spoken English" (avec R. A Carter, Cambridge University Press, 1997), "Spoken Language and Applied Linguistics" (Cambridge University Press, 1998), "Exploring Grammar in Context" (avec R. Hughes et R. A Carter, Cambridge University Press, Cambridge, 2000) and "Issues in Applied Linguistics" (Cambridge University Press, Cambridge, 2000). 10:15-11:15 Session pl�ni�re (Amphi C) 10:15 Michel Francard, Genevi�ve Geron, Vincent Giroul Philippe Hambye, Anne Catherine Simon, R�gine Wilmet (Universit� Catholique de Louvain-la-Neuve, Belgique), Le centre de recherche VALIBEL : des corpus oraux au service d'un observatoire du fran�ais en Belgique 10:45 Shana Poplack, Anne St-Amand (Universit� d'Ottawa, Canada), Un corpus oral du fran�ais du XIXe si�cle : Les R�cits du fran�ais qu�b�cois d'autrefois 11:15-11:45 Pause et rencontre autour des posters 11:45-12:45 Sessions parall�les Amphi B 11:45 Rapha�l Ma�tre, V�ronique Wild (Universit� de Neuch�tel), Un corpus bilingue fran�ais - dialecte francoproven�al en situation de contact � Evolene en Valais (Suisse) 12:15 Christina Linqvist (Uppsala, Su�de), Corpus transcrit de quelques journaux t�l�vis�s fran�ais : exp�riences de constitution Amphi C 11:45 Barbara Pirlot, Gilles Sadowski, Sylvie Delvenne (Universit� Libre de Bruxelles, Belgique), Analyse des t�moignages audiovisuels de rescap�s des camps nazis : repr�sentation �crite et exploitation linguistique des donn�es 12:15 Kate Beeching (University of the West of England, Royaume-Uni), Collecte, transcription et analyse d'un corpus sociolinguistique 12:45-14:15 D�jeuner 14:15-15:45 Sessions parall�les Amphi B 14:15 Ligia-Stela Florea (Universit� Babes-Bolyai, Roumanie), Exploitation de corpus oraux : une exp�rience p�dagogique au niveau Licence FLE 14:45 Florence Myles, Emma Marsden, Sarah Rule, Rosamond Mitchell (Universit� de Southampton, Royaume-Uni), Corpus d'interlangue fran�aise orale: outils de gestion et d'analyse 15:15 Anne Violin-Wigent (Michigan State University, Etats-Unis), On ne peut pas tout avoir: difficult�s inh�rentes � l'utilisation d'un corpus parl� Amphi C 14:15 Mireille Bilger (Universit� de Perpignan, France), Pr�sentation du Corpus de r�f�rence de fran�ais parl� 14:45 Jacques Durand (ERSS, Universit� de Toulouse-Le Mirail, France), Bernard Laks (Universit� de Paris-X, France), Chantal Lyche (Universit� d'Oslo, Norv�ge), La Phonologie du Fran�ais Contemporain (PFC): pr�sentation et premiers r�sultats 15:15 Estelle Campione (Universit� de Provence, France), La prosodie dans les corpus oraux : probl�mes d'annotation 15:45-16:15 Pause et rencontre autour des posters 16:15-17:45 Session pl�ni�re (Amphi C) 16:15 Piet Mertens (K.U.Leuven, Belgique), L'�tiquetage grammatical dans le corpus ELICOP 16:45 Hanne Leth Andersen (Aarhus Universitet, Danemark), Le fran�ais parl� dans l'enseignement du fran�ais langue �trang�re au Danemark 15:15 Pascal Cordereix (Biblioth�que nationale de France), Des Archives de la parole au D�partement de l'Audiovisuel de la Biblioth�que nationale de France ; 1911 - 2002 : un si�cle de fran�ais parl� enregistr� 17:45-18:00 Conclusion Communications affich�es (posters) 1. Jean-Yves Antoine, J�r�me Goulian, Sabine Letellier (VALORIA, Universit� de Bretagne Sud, France), Corpus de dialogue oral pour la Communication Homme-Machine : quelques enseignements en linguistique et en Traitement Automatique des Langues Naturelles 2. Vincent Arnaud (Universit� de Franche-Comt�, France & Universit� Laval, Qu�bec), Gabrielle Konopczynski (Universit� de Franche-Comt�, France), Saint-Claude : une ville, un corpus... 3. Christophe Benzitoun (Universit� de Provence, France), Interaction des composantes syntaxiques et prosodique dans le fonctionnement de deux 'items conjonctifs' � partir d'un corpus oral align� 4. Katia Ploog (ERSS � Bordeaux, France), Les outils de description mis � l'�preuve du non-standard : que nous disent Singe et Cam�l�on sur le changement syntaxique du fran�ais � Abidjan ? 5. Marie-No�lle Roubaud, Chantal Le Thomas (Universit� de Provence, France), Compte-rendu d'une exp�rience de correcteurs de corpus oraux informatis�s 6. Luiggi Sansonetti (ILPGA, Universit� de Paris III, France), Le Projet ANACAL : ANalyse Automatique de Corpus d'Acquisition du Langage 7. Thomas Schmidt (Universit� de Hamburg, Allemagne), EXMARaLDA - un syst�me de transcription computationelle comme base d'un corpus de la langue parl�e multilingue 8. Pascale Vergely (Centre d'Etudes de la Navigation A�rienne et ERSS, Universit� de Toulouse Le Mirail, France), Laurent Prevot (Institut de Recherche en Informatique de Toulouse, France), Probl�mes de constitution d'un corpus de dialogues oraux finalis�s, les cas de la r�solution d'un dysfonctionnement technique et de l'explication d'un itin�raireMail to author|Respond to list|Read more issues|LINGUIST home page|Top of issue