Aller au contenu principal

Victor Boone

Lundi 25 Novembre 2024

Regrets optimaux dans les processus de décision markoviens

Résumé :
Cette thèse est dédiée à la minimisation du regret dans les processus de décisions Markoviens en gain moyen. Le problème y est résolu au premier ordre dans deux cadres fréquentistes classiques : le cas où le modèle est fixé et où la borne dépend du modèle, et le cas minimax où la borne s’applique uniformément à l’intégralité de la classe d'instances considérées. Dans ces deux cadres, on dérive des bornes inférieures sur le regret en espérance, ainsi que des algorithmes atteignant les-dites bornes et de ce fait optimaux. Au delà de la seule minimisation du regret, on étudie également le comportement local d’algorithmes classiques que le regret échoue à capturer, puisque intrinsèquement global. De nouvelles mesures de performances sont introduites dans cette optique et des techniques sont proposés pour circonvenir aux défaults des algorithmes standards.

Date et lieu

Lundi 25 novembre à 14h
Bâtiment IMAG, Salle 2 (RDC)
et Zoom

Composition du jury

Aurélien Garivier
Professeur, ENS de Lyon (Rapporteur)
Ronald Ortner
Professeur associé, Montanuniversität Leoben (Rapporteur)
Eric Gaussier
Professeur des universités, Université Grenoble Alpes (Examinateur)
Pierre Gaillard
Chargé de recherche, Centre INRIA de l'Université Grenoble Alpes (Examinateur)
Tor Lattimore
Chargé de recherche, DeepMind London (Examinateur)
Bruno Gaujal
Directeur de recherche, Centre INRIA de l'Université Grenoble Alpes (Directeur de thèse)

Publié le 7 décembre 2024

Mis à jour le 21 janvier 2025