Skip to main content

Nicolas Monge

Vendredi 8 novembre 2024

Développement d’une méthodologie basé sur l’apprentissage automatique pour la classification de nanoparticules à partir de données de Diffusion de rayons-X au Petits Angles (SAXS)

Résumé :

La Diffraction des rayons X aux petits angles (SAXS) est une méthode de caractérisation des nanostructures utilisée dans un large éventail d'applications, allant de l'étude des métaux et des polymères à celle des biomolécules, en passant par l'analyse des colloïdes, des poudres et des biomatériaux. Grâce à son champ d'application étendu et aux avancées de l'instrumentation SAXS en laboratoire, cette technique devient de plus en plus attrayante pour les industries pharmaceutique, aéronautique et agroalimentaire. Son utilisation ne se limite donc plus à une petite communauté d'experts, mais tend à se démocratiser parmi un public disposant de moins d'expertise. Cette démocratisation dans le secteur industriel fait émerger un nouveau besoin d'accessibilité technique.

Le SAXS est particulièrement prisé pour la caractérisation de nanoparticules en solution diluée. L'analyse des données issues de cette technique requiert une expertise avancée et se décompose généralement en deux phases distinctes : la sélection d'un modèle SAXS analytique adapté aux données et l'optimisation des paramètres de ce modèle. Dans ce travail, nous proposons de simplifier ce processus en automatisant la sélection du modèle SAXS à l'aide de méthodes d'apprentissage automatique (ML).

Notre solution est structurée en blocs complémentaires : un classifieur de données SAXS et un détecteur de données hors-distribution. Le classifieur est un modèle de ML conçu pour attribuer un modèle SAXS à une donnée d'entrée. Il repose sur l'apprentissage d'une représentation optimale des données SAXS, facilitant ainsi l'association précise du modèle SAXS correspondant. Ce classifieur est conçu pour être robuste face aux différentes conditions expérimentales susceptibles d'être rencontrées.

En amont de la classification, le détecteur de données hors-distribution intervient pour pallier le problème des prédictions incohérentes sur des données qui sortent de la distribution d'entraînement. Ce détecteur utilise un apprentissage non supervisé et contrastif pour projeter les données hors distribution loin des données valides, permettant ainsi leur identification.

En l'absence d'un jeu de données SAXS suffisamment large, nous avons recours à des outils de simulation réalistes pour générer les données sur lesquelles le classifieur et le détecteur sont entraînés et testés. Un petit jeu de données expérimentales a également été créé pour évaluer nos modèles de ML. Le classifieur montre de très bonnes performances sur les données simulées, et les tests sur les données expérimentales suggèrent que ces performances sont transposables aux applications réelles. Sur les données simulées, le détecteur démontre sa capacité à distinguer les données valides des données invalides lorsque ces dernières sont nettement différentes de celles d'entraînement. Cependant, ses performances se dégradent dans les cas plus complexes. Les résultats obtenus sur les données expérimentales sont peu satisfaisants, soulignant ainsi l'importance d'inclure des données expérimentales lors de l'entraînement du détecteur.

Date et lieu

Vendredi 8 novembre à 14h
Bâtiment IMAG en salle de séminaire 1
et Zoom

Encadrement

Massih-Reza Amini
(UGA)
Alexis Deschamps
(UGA)
Christophe Coué
(Xenocs)

Submitted on November 7, 2024

Updated on November 7, 2024