TALEP

Traitement Automatique du Langage Ecrit et Parlé

Mots clés

traitement automatique des langues, apprentissage automatique, annotations linguistiques, traitement de données multimodales, analyse syntaxique, réseaux de neurones, expressions polylexicales, corpus

Responsable

Alexis NASR

Membres permanents

BECHET FrédéricProfesseur des Universités
Courriel : frederic.bechet@lis-lab.fr
Telephone : 0486090455
Page personnelle : https://pageperso.lis-lab.fr/frederic.bechet/
DEULOFEU JoséProfesseur des Universités
Courriel : jose.deulofeu@lis-lab.fr
Telephone : 0491666957
FAVRE BenoitMaitre de Conférences
Courriel : benoit.favre@lis-lab.fr
Telephone : 0486090467
Page personnelle : https://pageperso.lis-lab.fr/benoit.favre/
GODBERT ÉlisabethMaitre de Conférences
Courriel : elisabeth.godbert@lis-lab.fr
Telephone : 0486090471
NASR AlexisProfesseur des Universités
Courriel : alexis.nasr@lis-lab.fr
Telephone : 0486090491
Page personnelle : https://pageperso.lis-lab.fr/alexis.nasr/
RAMISCH CarlosMaitre de Conférences
Courriel : carlos.ramisch@lis-lab.fr
Telephone : 0486090672
Page personnelle : https://pageperso.lis-lab.fr/carlos.ramisch/
ROLBERT MoniqueMaitre de Conférences
Courriel : monique.rolbert@lis-lab.fr
Telephone : 0442231394
STEFANINI Marie-HélèneMaitre de Conférences
Courriel : marie-helene.stefanini@lis-lab.fr
Telephone : 0486090680
Professeur des Universités
Courriel : andre.valli@lis-lab.fr

Doctorants

AUGUSTE JérémyDoctorant
Courriel : jeremy.auguste@lis-lab.fr
Telephone : 0486090481
Page personnelle : https://pageperso.lis-lab.fr/jeremy.auguste/
BILLAMI MokhtarDoctorant
Courriel : mokhtar.billami@lis-lab.fr
Telephone : 0486090479
Page personnelle : https://pageperso.lis-lab.fr/mokhtar.billami/
DARY FranckDoctorant
Courriel : franck.dary@lis-lab.fr
DELECRAZ SébastienDoctorant
Courriel : sebastien.delecraz@lis-lab.fr
Telephone : 0486090481
Page personnelle : https://pageperso.lis-lab.fr/sebastien.delecraz/
FUSCONE SimoneDoctorant
Courriel : simone.fuscone@lis-lab.fr
HAMDI AhmedDoctorant
Courriel : ahmed.hamdi@lis-lab.fr
Page personnelle : https://pageperso.lis-lab.fr/ahmed.hamdi/
MAGALLON ThibaultDoctorant
Courriel : thibault.magallon@lis-lab.fr
MARZINOTTO GabrielDoctorant
Courriel : gabriel.marzinotto@lis-lab.fr
PASQUALINI BiancaDoctorant
Courriel : bianca.pasqualini@lis-lab.fr
PERROTIN RobinDoctorant
Courriel : robin.perrotin@lis-lab.fr
Telephone : 0486090479
SCHOLIVET ManonDoctorant
Courriel : manon.scholivet@lis-lab.fr

Autres membres

MEALIER Anne-laurePost-Doctorant
Courriel : anne-laure.mealier@lis-lab.fr
DR -Emerite
Courriel : michael.zock@lis-lab.fr
Telephone : 0486090685
Page personnelle : https://pageperso.lis-lab.fr/michael.zock/

Objectif scientifique

Les travaux de l’équipe portent sur de nombreux aspects du Traitement Automatique des Langues (TAL). Plus précisément, l’équipe:
  • Développe des modèles numériques et symboliques pour le TAL
  • Implémente ces modèles dans des outils
  • Evalue ces outils à l’aide de benchmarks reconnus par la communauté ou de campagnes d’évaluations
  • Met en oeuvre ces outils dans des applications développées dans le cadre de projets divers
  • Développe des ressources spécifiques lorsque ces dernières sont inexistantes
Les activités de l’équipe TALEP visent à trouver un bon équilibre entre la linguistique et l’informatique en proposant des analyses linguistiques précises des phénomènes rencontrés et de développer des modèles de traitement efficaces. Une des particularités de l’équipe TALEP est de s’intéresser à des productions linguistiques variées. Cette variété concerne la langue (français, anglais, arabe …), le mode de production (oral ou écrit), le niveau (planifié, spontané, normé, déviant …) ou encore le contexte de production (monologue ou dialogue, monomodale ou multimodale). L’équipe crée des outils génériques de TAL, en particulier la suite d’outils multilingue MACAON qui permet de réaliser des traitements linguistique standards et le logiciel MWETOOLKIT, qui extrait automatiquement des séquences de tokens pouvant constituer des expressions polylexicales à partir de corpus. Tous ces logiciels sont distribués sous licence libre. L’équipe TALEP accorde une grande importance aux aspects méthodologiques de l’évaluation des outils de TAL.  Ces évaluations peuvent être menées dans des contextes « écologiques », auprès d’utilisateurs finaux ou dans le cadre de campagnes d’évaluation scientifiques, nationales ou internationales. TALEP est l’acronyme de Traitement Automatique du Langage Ecrit et Parlé.

Publications



15 documents

  • Gabriel Marzinotto, Frédéric Béchet, Géraldine Damnati, Alexis Nasr. Sources of Complexity in Semantic Frame Parsing for Information Extraction. International FrameNet Workshop 2018, May 2018, Miyazaki, Japan. 〈hal-01731385〉
  • Simone Fuscone, Benoit Favre, Laurent Prevot. Replicating Speech Rate Convergence Experiments on the Switchboard Corpus. Workshop on Replicability and Reproducibility of Research Results in Science and Technology of Language, May 2018, Miyazaki, Japan. 〈hal-01807796〉
  • Frédéric Béchet, Christian Raymond. Is ATIS too shallow to go deeper for benchmarking Spoken Language Understanding models?. InterSpeech 2018, Sep 2018, Hyderabad, India. pp.1-5. 〈hal-01835425〉
  • Frédéric Béchet, Géraldine Damnati, Johannes Heinecke, Gabriel Marzinotto, Alexis Nasr. CALOR-Frame : un corpus de textes encyclopédiques annoté en cadres sémantiques. ACor4French – Les corpus annotés du français - Atelier TALN, Jun 2017, Orléans, France. 2017. 〈hal-01780348〉
  • Manon Scholivet, Carlos Ramisch. Identification of Ambiguous Multiword Expressions Using Sequence Models and Lexical Resources. Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017), 2017, Valencia, Spain. pp.167 - 175. 〈hal-01795903〉
  • Natalie Vargas, Carlos Ramisch, Helena Caseli. Discovering Light Verb Constructions and their Translations from Parallel Corpora without Word Alignment. Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017), 2017, Valencia, Spain. pp.91 - 96. 〈hal-01795904〉
  • Carlos Ramisch. Putting the Horses before the Cart: Identifying Multiword Expressions before Translation. Computational and Corpus-Based Phraseology - Second International Conference, Europhras 2017, London, UK, November 13-14, 2017, Proceedings, 2017, London, United Kingdom. Computational and Corpus-Based Phraseology - Second International Conference, Europhras 2017, London, UK, November 13-14, 2017, Proceedings, pp.69 - 84, 2017, 〈10.1007/978-3-319-69805-2_6〉. 〈hal-01795985〉
  • Sebastien Delecraz, Alexis Nasr, Frédéric Béchet, Benoit Favre. Correcting prepositional phrase attachments using multimodal corpora. The 15th International Conference on Parsing Technologies, Sep 2017, Pise, Italy. 2017, Proceedings of the 15th International Conference on Parsing Technologies. 〈hal-01693292〉
  • Agata Savary, Carlos Ramisch, Silvio Cordeiro, Federico Sangati, Veronika Vincze, et al.. The PARSEME Shared Task on Automatic Identification of Verbal Multiword Expressions. MWE 2017 - Proceedings of the 13th Workshop on Multiword Expressions , Apr 2017, Valencia, Spain. pp.31 - 47. 〈hal-01504624〉
  • Stella Markantonatou, Carlos Ramisch, Agata Savary, Veronika Vincze. Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017). France. 2017. 〈hal-01624624〉
Tutelles