Aller au contenu principal

Bahareh Afshinpour

Exploitation de journaux logiciels avec des techniques d'apprentissage automatique

Vendredi 29 septembre 2023

Résumé :
Aujourd’hui, les logiciels sont utilisés dans une plus grande variété de domaines que jamais auparavant. Le test logiciel est l’une des techniques utilisées au cours du processus de vérification et de validation. Les chercheurs et le secteur des entreprises ont tenté d’automatiser les tests de logiciels au cours des dernières décennies, puisque la majorité des activités de test sont difficiles et coûteuses. Au cours des dernières décennies, les journaux de logiciels sont devenus indispensables au mécanisme d’assurance de la fiabilité de nombreux systèmes logiciels, car ce sont généralement les seules données qui enregistrent les événements d’exécution des logiciels. Ils constituent une source d’information précieuse qui peut être exploitée à diverses fins de diagnostic. Tout au long de la procédure de test, les testeurs peuvent extraire des informations vitales des journaux. Les tests de régression doivent être exécutés après chaque itération de développement logiciel, ce qui peut être coûteux en temps et en ressources. De plus, le volume de journaux a rapidement augmenté à mesure que les applications des logiciels modernes se sont développées. Le processus de test de régression doit être automatisé afin d’atténuer les coûts associés à l’analyse des journaux et de réduire la charge de travail des testeurs de logiciels. L’exploration de journaux utilise des statistiques, l’exploration de données et des techniques d’apprentissage automatique pour analyser automatiquement un grand volume de données de journaux afin de découvrir des modèles significatifs et des tendances révélatrices. Les stratégies de mise en œuvre avancées pour l’extraction automatisée de journaux sont très demandées. Les tâches d’extraction de journaux liées aux tests automatisés de logiciels sont l’une des contributions de cette thèse. Nous introduisons certaines tâches majeures d’extraction de journaux pour l’ingénierie de la fiabilité, y compris la détection des anomalies, la prédiction des défaillances et la détection des causes profondes, etc. La recherche est complétée par un certain nombre d’études de cas et d’expériences, ce qui conduit finalement au développement d’un ensemble d’outils qui travailler ensemble pour aider à automatiser l’extraction de qui travaillent ensemble journaux. Les résultats donnés dans cette thèse démontrent comment les tests de logiciels peuvent être améliorés en utilisant l’extraction de journaux à l’aide de l’apprentissage automatique. Cette thèse présente quatre problèmes importants d’extraction de journaux, notamment la détection des causes, la prédiction des défaillances en ligne, la minimisation des journaux de test et le regroupement du comportement des utilisateurs. Basée sur l’analyse des journaux du système logiciel, nous proposons une nouvelle technique basée sur l’apprentissage pour automatiser les tâches d’extraction de journaux. Une partie de l’effort dans ce travail se concentre sur le développement de méthodes non supervisées d’extraction de zones afin de réduire l’interaction humaine et également d’extraire des caractéristiques qui sont cachées à l’observation humaine directe. À cette fin, nous avons essayé d’adopter des techniques d’apprentissage (par exemple, NLP) capables d’extraire la sémantique des journaux et, par conséquent, d’apprendre les relations entre les événements. Cela a évolué vers une méthodologie générale d’exploration de journaux non supervisée capable de regrouper les événements de sortie en fonction de leurs relations conceptuelles avec d’autres événements, de détecter un comportement anormal, de les prédire dans un logiciel en ligne et enfin de trouver leur cause première parmi les événements d’entrée. Cela aide les administrateurs système à prévoir la possibilité de pannes imminentes et aide aussi les développeurs de logiciels à détecter les bogues et leurs causes profondes dans les enregistrements des journaux d’entrée et de sortie. Tout au long de cette thèse, des applications logicielles issues d’un projet partenarial sont discutées et nous pensons que notre travail pourrait servir de base à la recherche et au déploiement futurs de l’extraction automatisée de journaux, ainsi qu’à fournir des recommandations importantes dans ce domaine.

Date et Lieu

Vendredi 29 septembre 2023 à 9:30
Salle séminaire 1 de l'IMAG
et visioconférence

Composition du Jury

NEIL WALKINSHAW
ASSOCIATE PROFESSOR, The University of Sheffield. (Rapporteur)
FRANZ WOTAWA
PROFESSEUR, Graz University of Technology.  (Rapporteur)
OUM-EL-KHEIR AKTOUF
PROFESSEURE DES UNIVERSITES, Grenoble INP. (Examinatrice)
ARNAUD GOTLIEB
ASSOCIATE PROFESSOR, Simula Research Laboratory. (Examinateur)
ROLAND GROZ
PROFESSEUR, Grenoble INP. (Directeur de thèse)
MASSIH-REZA AMINI
PROFESSEUR DES UNIVERSITES, Université Grenoble Alpes. ( Co-directeur de thèse)
 

Publié le 19 septembre 2023

Mis à jour le 19 septembre 2023