Lundi 4 Mai 2026
- Imprimer
- Partager
- Partager sur Facebook
- Partager sur LinkedIn
Vers la détection pratique des anomalies de performance dans les applications microservices
Résumé de la thèse
Les microservices constituent une architecture populaire pour créer des applications distribuées évolutives et faciles à maintenir. Cependant, la détection des anomalies de performance dans ces systèmes est difficile en raison de la diversité sur l’utilisation des ressources par les services, des changements fréquents du système et du volume important de données de surveillance. Ces facteurs rendent difficile la distinction précise entre un comportement normal et un comportement anormal tout en conservant une solution de détection pratique et efficace.
Dans la première partie de cette thèse, nous explorons une approche pratique pour détecter les anomalies de performance dans les systèmes de microservices en proposant un nouveau modèle d’apprentissage automatique, appelé ctl-SRNN. L’approche consiste à mettre en œuvre des modèles locaux, où un modèle ctl-SRNN est construit pour surveiller chaque microservice en utilisant des données de séries temporelles d’utilisation des ressources spécifiques au service et non labellisés. Ce design permet de modifier chaque modèle indépendamment en réponse aux changements de service tout en réduisant le temps d’entraînement et de configuration. Le modèle ctl-SRNN est conçu pour un entraînement efficace et une génération automatique de seuils en utilisant un Dynamical Variational Autoencoder (DVAE) qui capture les dépendances temporelles dans les données, ainsi qu’une variable de contrôle qui prend en compte les variations de charge de travail dans le service. Les résultats expérimentaux montrent que ctl-SRNN surpasse les solutions existantes de 91% en précision de détection tout en nécessitant seulement une petite quantité de données d’entraînement avec une configuration minimale.
En fin de compte, la sortie d’un détecteur d’anomalies est utilisée pour orienter les actions qui traitent les anomalies détectées. Cependant, les détecteurs peuvent faire des erreurs, et il est difficile de déterminer comment celles-ci peuvent impacter la performance du service et le coût d’utilisation des ressources. La deuxième partie de cette thèse analyse comment les caractéristiques des détecteurs (c’est-à-dire la précision, le rappel et la fréquence d’inspection) affectent le compromis performance-coût. En utilisant des Stochastic Reward Nets (SRNs), nous créons un modèle statistique d’un service surveillé par un détecteur d’anomalies de performance. Avec ce modèle, nous réalisons des analyses numériques pour étudier l’impact des caractéristiques des détecteurs sur la performance et l’utilisation des ressources du service surveillé. Nos résultats montrent qu’il n’est pas toujours nécessaire d’atteindre une haute précision et un haut rappel. Si la détection peut être effectuée fréquemment, une haute précision suffit pour obtenir un bon compromis performance-coût, mais si le détecteur est utilisé de manière peu fréquente, le rappel devient le plus important.
Dans la première partie de cette thèse, nous explorons une approche pratique pour détecter les anomalies de performance dans les systèmes de microservices en proposant un nouveau modèle d’apprentissage automatique, appelé ctl-SRNN. L’approche consiste à mettre en œuvre des modèles locaux, où un modèle ctl-SRNN est construit pour surveiller chaque microservice en utilisant des données de séries temporelles d’utilisation des ressources spécifiques au service et non labellisés. Ce design permet de modifier chaque modèle indépendamment en réponse aux changements de service tout en réduisant le temps d’entraînement et de configuration. Le modèle ctl-SRNN est conçu pour un entraînement efficace et une génération automatique de seuils en utilisant un Dynamical Variational Autoencoder (DVAE) qui capture les dépendances temporelles dans les données, ainsi qu’une variable de contrôle qui prend en compte les variations de charge de travail dans le service. Les résultats expérimentaux montrent que ctl-SRNN surpasse les solutions existantes de 91% en précision de détection tout en nécessitant seulement une petite quantité de données d’entraînement avec une configuration minimale.
En fin de compte, la sortie d’un détecteur d’anomalies est utilisée pour orienter les actions qui traitent les anomalies détectées. Cependant, les détecteurs peuvent faire des erreurs, et il est difficile de déterminer comment celles-ci peuvent impacter la performance du service et le coût d’utilisation des ressources. La deuxième partie de cette thèse analyse comment les caractéristiques des détecteurs (c’est-à-dire la précision, le rappel et la fréquence d’inspection) affectent le compromis performance-coût. En utilisant des Stochastic Reward Nets (SRNs), nous créons un modèle statistique d’un service surveillé par un détecteur d’anomalies de performance. Avec ce modèle, nous réalisons des analyses numériques pour étudier l’impact des caractéristiques des détecteurs sur la performance et l’utilisation des ressources du service surveillé. Nos résultats montrent qu’il n’est pas toujours nécessaire d’atteindre une haute précision et un haut rappel. Si la détection peut être effectuée fréquemment, une haute précision suffit pour obtenir un bon compromis performance-coût, mais si le détecteur est utilisé de manière peu fréquente, le rappel devient le plus important.
Mots-clés: Microservices, Cloud, Détection d'anomalies, Dynamical Variational Autoencoders, Quantification de l'incertitude, Stochastic Reward Nets, Modèles stocastiques.
Date et lieu
Lundi 4 Mai 2026 à 13:30
Maison du Doctorat Jean Kuntzmann, amphithéâtre
Composition du Jury
Supervision de thèse:
Noel DE PALMA
Directeur de thèse, Professeur des Universités, Université Grenoble Alpes
Thomas ROPARS
Co-encadrant de thèse, Maître de Conférences, Université Grenoble Alpes
Noel DE PALMA
Directeur de thèse, Professeur des Universités, Université Grenoble Alpes
Thomas ROPARS
Co-encadrant de thèse, Maître de Conférences, Université Grenoble Alpes
Jury de soutenance:
Noel DE PALMA
Directeur de thèse, Professeur des Universités, Université Grenoble-Alpes
Etienne RIVIÈRE
Rapporteur, Professeur, Université Catholique Louvain
Romain ROUVOY
Rapporteur, Professeurs des Universités, Université de Lille
Sara BOUCHENAK
Examinatrice, Professeur des Universités, Institut National des Sciences Appliquées Lyon
Didier DONSEZ
Examinateur, Professeur des Universités, Université Grenoble-Alpes
Lucas MELLO SCHNORR
Examinateur, Associate Professor, Federal University of Rio Grande do Sul (UFRGS)
Noel DE PALMA
Directeur de thèse, Professeur des Universités, Université Grenoble-Alpes
Etienne RIVIÈRE
Rapporteur, Professeur, Université Catholique Louvain
Romain ROUVOY
Rapporteur, Professeurs des Universités, Université de Lille
Sara BOUCHENAK
Examinatrice, Professeur des Universités, Institut National des Sciences Appliquées Lyon
Didier DONSEZ
Examinateur, Professeur des Universités, Université Grenoble-Alpes
Lucas MELLO SCHNORR
Examinateur, Associate Professor, Federal University of Rio Grande do Sul (UFRGS)
- Imprimer
- Partager
- Partager sur Facebook
- Partager sur LinkedIn