Elodie Gauthier - Collecter, Transcrire, Analyser : quand la Machine Assiste le Linguiste dans son Travail de Terrain

14:00
Vendredi
30
Mar
2018
Lieu : 
Organisé par : 
Elodie Gauthier
Intervenant : 
Elodie Gauthier
Équipes : 
Information détaillée : 

 

Jury :

  • Claire Gardent, directrice de recherche, CNRS, LORIA, rapporteur
  • Steven Bird, professeur,  Charles Darwin University, Northern Institute, rapporteur
  • Martine Adda-Decker, directrice de recherche, Université Paris III, LPP/CNRS, examinateur
  • Sylvie Voisin, maître de conférences, Université Aix-Marseille, DDL, co-encadrante de thèse
  • Laurent Besacier, professeur des universités, Université Grenoble Alpes, LIG, directeur de thèse

 

Résumé : 

Depuis quelques décennies, de nombreux scientifiques alertent au sujet de la disparition des langues qui ne cesse de s’accélérer. Face au déclin alarmant du patrimoine linguistique mondial, il est urgent d’agir afin de permettre aux linguistes de terrain, a minima, de documenter les langues en leur fournissant des outils de collecte innovants et, si possible, de leur permettre de décrire ces langues grâce au traitement des données assisté par ordinateur. 
C’est ce que propose ce travail, en se concentrant sur trois axes majeurs du métier de linguiste de terrain : la collecte, la transcription et l’analyse. 

Les enregistrements audio sont primordiaux, puisqu’ils constituent le matériau source, le point de départ du travail de description. De plus, tel un instantané, ils représentent un objet précieux pour la documentation de la langue. Cependant, les outils actuels d’enregistrement n’offrent pas au linguiste la possibilité d’être efficace dans son travail et l’ensemble des appareils qu’il doit utiliser (enregistreur, ordinateur, microphone, etc.) peut devenir encombrant. Ainsi, nous avons développé LIG-Aikuma, une application mobile de collecte de parole innovante, qui permet d’effectuer des enregistrements directement exploitables par les moteurs de reconnaissance automatique de la parole (RAP). Les fonctionnalités implémentées permettent d’enregistrer différents types de discours (parole spontanée, parole élicitée, parole lue) et de partager les enregistrements avec les locuteurs. L’application permet, en outre, la construction de corpus alignés « parole source (peu dotée)-parole cible (bien dotée) », « parole-image », « parole-vidéo » qui présentent un intérêt fort pour les technologies de la parole, notamment pour l’apprentissage non supervisé. 

Bien que la collecte ait été menée de façon efficace, l’exploitation (de la transcription jusqu’à la glose, en passant par la traduction) de la totalité de ces enregistrements est impossible, tant la tâche est fastidieuse et chronophage. 
Afin de compléter l’aide apportée aux linguistes, nous proposons d’utiliser des techniques de traitement automatique de la langue pour lui permettre de tirer partie de la totalité de ses données collectées. Parmi celles-ci, la RAP peut être utilisée pour produire des transcriptions, d’une qualité satisfaisante, de ses enregistrements. 

Une fois les transcriptions obtenues, le linguiste peut s’adonner à l’analyse de ses données. Afin qu’il puisse procéder à l’étude de l’ensemble de ses corpus, nous considérons l’usage des méthodes d’alignement forcé. Nous démontrons que de telles techniques peuvent conduire à des analyses linguistiques fines. En retour, nous montrons que la modélisation de ces observations peut mener à des améliorations des systèmes de RAP.