Aller au contenu principal

Sylvain Coulange

Jeudi 10 Avril 2025

Évaluation automatique de la parole spontanée en anglais langue étrangère : le rôle des pauses et de l’accent lexical dans la compréhensibilité du locuteur

Résumé :

La compétence de production orale en langue étrangère est communément évaluée à travers la capacité du locuteur à se faire comprendre. Le terme de compréhensibilité est souvent utilisé dans le domaine de l’acquisition des langues pour désigner le degré d’effort requis par un auditeur pour comprendre le locuteur. Celle-ci dépend de nombreux facteurs, côté locuteur comme auditeur, parmi lesquels la position des marqueurs d’hésitation et le rythme de la parole sont souvent décrits comme facteurs clés dans les grilles d’évaluation. En revanche, les approches automatiques reposent encore majoritairement sur des comparaisons à un modèle, souvent à partir de parole lue, sans porter une attention particulière aux phénomènes linguistiques susceptibles de perturber la compréhension.

Dans cette thèse, nous proposons un outil d’évaluation automatique de la production orale spontanée en anglais, ciblant spécifiquement deux phénomènes linguistiques susceptibles d’impacter la compréhensibilité du locuteur : la distribution syntaxique des pauses et l’accentuation lexicale. Cet outil a été utilisé pour analyser la variation de ces phénomènes chez des locuteurs de niveau B1 et B2 francophones et japonophones (L2), ainsi que chez des locuteurs anglophones natifs (L1). Nous avons ensuite mesuré leur impact sur la perception de l’effort de compréhension en temps réel chez des auditeurs anglophones natifs.

Les analyses révèlent qu’une différence majeure entre les locuteurs B1 et B2 d’une part, et entre les L1 et L2 d’autre part, réside dans la fréquence des pauses de bas niveau syntaxique : plus le niveau de compétence augmente, plus les pauses tendent à se concentrer aux frontières syntaxiques de haut niveau (par exemple, entre les propositions). À partir de ces observations, nous avons défini un score de distribution syntaxique des pauses pour caractériser cette concentration.

Concernant l’accentuation lexicale, les mesures font ressortir une influence marquée des patterns accentuels de la langue maternelle des locuteurs. Les francophones augmentent généralement la hauteur (f0) et allongent la dernière syllabe des mots, tandis que l’intensité reste stable sur l’ensemble des syllabes. Bien que les locuteurs B1 et B2 se chevauchent largement, une progression significative est observée entre ces deux niveaux : les locuteurs B2 accentuent plus fréquemment la syllabe attendue et produisent un contraste acoustique plus marqué en termes de f0 et d’intensité. En revanche, les locuteurs japonais, dont la langue maternelle intègre un accent lexical, positionnent l’accent avec davantage de précision et produisent des contrastes prosodiques plus importants que les francophones.

Enfin, pour mesurer l’impact des différents types de pauses et de patterns d’accentuation lexicale sur la perception de la compréhensibilité, nous avons recruté 60 auditeurs afin d’évaluer dynamiquement 16 extraits de paroles issus du corpus des locuteurs francophones mentionné ci-dessus. Lors de l’écoute, il leur était demandé de cliquer sur un bouton dès qu’ils ressentaient un effort pour comprendre le locuteur, quelle qu’en soit la raison. L’analyse des patterns de clics, une fois normalisés, indique une augmentation significative de la difficulté perçue entre 0 et 3 secondes après une pause située à l’intérieur d’un syntagme, ainsi qu’entre 2 et 3 secondes après un mot dont la syllabe accentuée n’était pas celle attendue. À l’inverse, la difficulté perçue diminue significativement après une pause située entre deux propositions ou après un mot correctement accentué. Ces observations renforcent l’idée que les pauses de bas niveau syntaxique et les mots accentués de manière inattendue impactent directement la perception de difficulté de compréhension. Notre expérience démontre que cet impact est direct et mesurable.

Présentation de la thèse sur le site de l'UGA

Event on Automated L2 Speaking Assessment

Date et lieu

Jeudi 10 avril à 14h30
Salle Jacques Cartier, Maison des Langues.

Composition du jury

Direction et co-encadrement :
  • Monica MASPERI, Université Grenoble Alpes
  • Solange ROSSATO, Université Grenoble Alpes
  • Tsuneo KATO, Doshisha University
Rapporteurs :
  • Nicolas BALLIER, Université Paris-Cité
  • Nadine HERRY BENIT, Université Paris Nanterre
Examinateurs :
  • Philippe BOULA DE MAREÜIL, LIMSI
  • Isabelle DARCY, Indiana University
  • François PELLEGRINO, Université Lumière Lyon 2
  • Antonio ROMANO, Torino University

Publié le 21 mars 2025

Mis à jour le 28 mars 2025