lundi 5 Juillet 2021
- Imprimer
- Partager
- Partager sur Facebook
- Share on X
- Partager sur LinkedIn
L'émergence du lexique en contexte : apport des méthodes non supervisées sur grands corpus de données multimodales
Résumé :
Ces dernières années, les méthodes d'apprentissage profond ont permis de créer des modèles neuronaux capables de traiter plusieurs modalités à la fois. Les modèles neuronaux de traitement de la Parole Visuellement Contextualisée (PVC) sont des modèles de ce type, capables de traiter conjointement une entrée vocale et une entrée visuelle correspondante. Ils sont couramment utilisés pour résoudre une tâche de recherche d'image à partir d'une requête vocale : c'est-à-dire qu'à partir d'une description orale, ils sont entraînés à retrouver l'image correspondant à la description orale passée en entrée. Ces modèles ont suscité l'intérêt des linguistes et des chercheurs en sciences cognitives car ils sont capables de modéliser des interactions complexes entre deux modalités — la parole et la vision — et peuvent ainsi être utilisés pour simuler l'acquisition du langage chez l'enfant, et plus particulièrement l'acquisition lexicale.
Dans cette thèse, nous étudions un modèle récurrent de PVC et analysons les connaissances linguistiques que de tels modèles sont capables d'inférer comme sous-produit de la tâche principale pour laquelle ils sont entraînés. Nous présentons un nouveau jeu de données qui convient à l'entraînement des modèles de PVC. Contrairement à la plupart des jeux de données qui sont en anglais, ce jeu de données est en japonais, ce qui permet d'étudier l'impact de la langue d'entrée sur les représentations apprises par les modèles neuronaux. Nous nous concentrons ensuite sur l'analyse des mécanismes d'attention de deux modèles de PVC, l'un entrainé sur le jeu de données en anglais, l'autre sur le jeu de données en japonais, et montrons que les modèles ont développé un comportement général, valable quelle que soit la langue utilisée, en utilisant leur poids d'attention pour se focaliser sur des noms spécifiques dans la chaîne parlée. Nos expériences révèlent que ces modèles sont également capables d'adopter un comportement spécifique à la langue en prenant en compte les particularités de la langue d'entrée afin de mieux résoudre la tâche qui leur est donnée. Nous étudions ensuite si les modèles de PVC sont capables d'associer des mots isolés à leurs référents visuels. Cela nous permet d'examiner si le modèle a implicitement segmenté l'entrée parlée en sous-unités. Nous étudions ensuite comment les mots isolés sont stockés dans les poids des réseaux en empruntant une méthodologie issue de la linguistique, le paradigme de gating, et nous montrons que la partie initiale du mot joue un rôle majeur pour une activation réussie. Enfin, nous présentons une méthode simple pour introduire des informations sur les frontières des segments dans un modèle neuronal de traitement de la parole. Cela nous permet de tester si la segmentation implicite qui a lieu dans le réseau est aussi efficace qu'une segmentation explicite. Nous étudions plusieurs types de frontières, allant des frontières de phones aux frontières de mots, et nous montrons que ces dernières donnent les meilleurs résultats. Nous observons que donner au réseau plusieurs frontières en même temps est bénéfique, en permettant au réseau de prendre en compte la nature hiérarchique de l'entrée linguistique.
Date et Lieu
Lundi 5 Juillet à 9h00
https://univ-grenoble-alpes-fr.zoom.us/my/william.n.havard
Organisé par
William HAVARD
Equipe GETALP
Equipe GETALP
Composition du Jury
Jean-Luc SCHWARTZ
Directeur de Recherche, Université Grenoble Alpes, Examinateur
Directeur de Recherche, Université Grenoble Alpes, Examinateur
Odette SCHARENBORG
Associate Professor, Technische Universiteit Delft, Rapportrice
Associate Professor, Technische Universiteit Delft, Rapportrice
Laurent PREVOT
Professeur, Aix-Marseille Université, Rapporteur
Professeur, Aix-Marseille Université, Rapporteur
Grzegorz CHRUPALA
Associate Professor, Tilburg University, Examinateur
Associate Professor, Tilburg University, Examinateur
Laurent BESACIER
Professeur, Université Grenoble Alpes, Directeur de thèse
Professeur, Université Grenoble Alpes, Directeur de thèse
Jean-Pierre CHEVROT
Professeur, Université Grenoble Alpes, Directeur de thèse
Professeur, Université Grenoble Alpes, Directeur de thèse
- Imprimer
- Partager
- Partager sur Facebook
- Share on X
- Partager sur LinkedIn