Aller au contenu principal

Sebastian Friedemann

Vendredi 1er Juillet 2022

Ensemble-based Data Assimilation for Large Scale Simulations

La prédiction de systèmes dynamiques non linéaires et chaotiques, comme la météoou le cycle de l’eau, s’appuie sur la combination de données observées et de modèlesnumériques. L’assimilation de données (AD) par ensemble est une méthode majeure poursélectionner les trajectoires du système et compenser les effets de rétroaction non linéaires.Elle s’appuie sur la propagation d’un ensemble de réalisations de modèles perturbés quiest enrichi par l’intégration d’observations. La réalisation de l’AD à diverses échellesest exigeante en terme de calcul. Par exemple, il faut capturer les effets géospatiauxcontinentaux et mondiaux avec une haute résolution pour prédire avec précision leursimpacts sur les petites échelles. Cela nécessite des super-ordinateurs exploitant descentaines de milliers de nœuds de calcul, interconnectés par des réseaux à haut débit.La mise à l’échelle efficace des algorithmes d’AD sur de telles machines nécessitedes processus fortement parallélisés spécialement conçus pour éviter la surcharge desressources partagées. La tolérance aux pannes est également importante. La probabilitéde défaillances matérielles et numériques augmente avec la quantité de ressourcesutilisées et le nombre d’ensembles simulés.Les cadres d’AD existants utilisent le système de fichiers comme stockage intermédiairepour fournir un processus élastique et tolérant aux pannes. Ce procédé est ralenti àgrande échelle par la surcharge du système de fichiers. Une autre approche courantes’appuie sur un code monolithique qui souffre d’un déséquilibre de charge intrinsèque etest très sensibles aux fautes numériques et matérielles.Cette thèse présente un système fortement parallèle, équilibré dynamiquement en charge,élastique et tolérante aux pannes, lui permettant d’exécuter efficacement l’AD parensemble. Nous étudions deux classes d’algorithmes d’AD, le filtre de Kalman d’en-semble (EnKF), et l’algorithme de filtre particulaire avec rééchantillonnage d’importanceséquentiel (SIR). Nous validons notre approche dans des conditions réalistes. Des donnéesde capteurs d’eau souterraine sont assimilées à l’aide d’une simulation hydrologiquerégionale utilisant le modèle ParFlow. Nous exécutons efficacement EnKF avec jusqu’à16 384 membres sur 16 240 cœurs de calcul. Une comparaison avec une solution del’état de l’art, avec 2 500 membres sur 20 000 cœurs, montre que notre approche estenviron 50 % plus rapide. Nous présentons également des améliorations de performanceen exécutant le filtre de particules avec SIR à grande échelle. Ces expériences assimilentdes observations de couverture nuageuse avec 2 555 membres, correspondant ici à desparticules, en exécutant le modèle de weather research and forecasting (WRF) sur ledomaine européen. Afin de gérer les nombreuses expériences réalisées sur différents super-ordinateurs, nous avons mis en place une configuration spécifique que nous présentonségalement

Date et Lieu

Vendredi 1er Juillet 2022 à 14h00
Auditorium Bâtiment IMAG
et https://univ-grenoble-alpes-fr.zoom.us/j/5241916545

Publié le 2 juin 2022

Mis à jour le 8 octobre 2024