Marion Potet : Vers l’intégration de post-éditions d’utilisateurs pour améliorer les systèmes de traduction automatiques probabilistes

10:00
Mardi
9
Avr
2013
Organisé par : 

Marion POTET

Équipes : 
Information détaillée : 

La soutenance a lieu à l’amphithéâtre H de Grenoble INP Ensimag sur le campus de Grenoble/St Martin d’Hères.

Le jury est composé de : 
— Mme. Violaine Prince, Professeur des Universités à l’Université de Montpellier 2-LIRMM, Rapporteur 
— M. Kamel Smaïli, Professeur des Universités à l’Université de Nancy 2-LORIA, Rapporteur 
— M. Eric Gaussier, Professeur des Universités à l’Université de Grenoble 1-LIG, Examinateur 
— Mme Lucia Specia, Senior Lecturer à Sheffield University, Examinateur 
— M. Laurent Besacier, Professeur des Universités à l’Université de Grenoble 1-LIG, Directeur de thèse 
— M. Hervé Blanchon, Maître de Conférence à Université de Grenoble 2-LIG, Co-encadrant de thèse

Résumé : 

Les technologies de traduction automatique existantes sont à présent vues comme une approche prometteuse pour aider à produire des traductions de façon efficace et à coût réduit. Cependant, l’état de l’art actuel ne permet pas encore une automatisation complète du processus et la coopération homme/machine reste indispensable pour produire des résultats de qualité. Une pratique usuelle consiste à post-éditer les résultats fournis par le système, c’est-à-dire effectuer une vérification manuelle et, si nécessaire, une correction des sorties erronées du système. Ce travail de post-édition effectué par les utilisateurs sur les résultats de traduction automatique constitue une source de données précieuses pour l’analyse et l’adaptation des systèmes. La problématique abordée dans nos travaux s’intéresse à développer une approche capable de tirer avantage de ces retro-actions (ou post-éditions) d’utilisateurs pour améliorer, en retour, les systèmes de traduction automatique. Les expérimentations menées visent à exploiter un corpus d’environ 10 000 hypothèses de traduction d’un système probabiliste de référence, post-éditées par des volontaires, par le biais d’une plateforme en ligne. Les résultats des premières expériences intégrant les post-éditions, dans le modèle de traduction d’une part, et par post-édition automatique statistique d’autre part, nous ont permis d’évaluer la complexité de la tâche. Une étude plus approfondie des systèmes de post-éditions statistique nous a permis d’évaluer l’utilisabilité de tels systèmes ainsi que les apports et limites de l’approche. Nous montrons aussi que les post-éditions collectées peuvent être utilisées avec succès pour estimer la confiance à accorder à un résultat de traduction automatique. Les résultats de nos travaux montrent la difficulté mais aussi le potentiel de l’utilisation de post-éditions d’hypothèses de traduction automatiques comme source d’information pour améliorer la qualité des systèmes probabilistes actuels.