Laércio Lima Pilla - Équilibrage de charge prenant en compte la topologie des plates-formes de calcul parallèle pour la portabilité des performances

13:30
Vendredi
11
Avr
2014
Organisé par : 

Laércio Lima Pilla

Intervenant : 

Laércio Lima Pilla

Équipes : 
Information détaillée : 

- Thèse préparée au sein des équipes NANOSIM (UJF/FR) et GPPD (UFRGS/BR) et encadrée par Jean-François MEHAUT et Philippe O. A. NAVAUX. Cotutelle entre l’Université de Grenoble et l’Universidade Federal do Rio Grande do Sul au Brésil.

- La soutenance aura lieu le vendredi 11 avril 2014 à 13h30 à l’adresse suivante :

Prédio 43413 - Auditório Inferior, Instituto de Informática
Avenida Bento Gonçalves, 9500
Campus do Vale - Bloco IV, Bairro Agronomia
Porto Alegre / RS
Brésil

 - Membres du jury :

  • M. Raymond NAMYST, Université de Bordeaux 1, Rapporteur
  • M. Wagner MEIRA JUNIOR, Universidade Federal de Minas Gerais (UFMG), Rapporteur
  • M. Alfredo GOLDMAN VEL LEJBMAN, Universidade de São Paulo (USP), Examinateur
  • M. Nicolas MAILLARD, Universidade Federal do Rio Grande do Sul (UFRGS), Examinateur
  • M. Jean-François MÉHAUT, Université de Grenoble - CEA, Directeur de thèse
  • M. Philippe O. A. NAVAUX, Universidade Federal do Rio Grande do Sul (UFRGS), Directeur de thèse
Résumé : 

Cette thèse présente nos travaux de recherche qui ont comme principal objectif d’assurer la portabilité des performances et le passage à l’échelle des applications scientifiques complexes exécutées sur des plates-formes multi-coeurs parallèles et hiérarchiques. La portabilité des performances est obtenue lorsque l’ordonnancement des tâches d’une application permet de réduire les périodes d’inactivité des coeurs de la plate-forme. Cette portabilité des performances peut être affectée par différents problèmes tels que des déséquilibres de charge, des communications coûteuses et des surcoûts provenant de l’ordonnancement des tâches. Le déséquilibre de charge est la conséquence de comportements de charges irrégulières et dynamiques, où le volume de calcul varie dynamiquement en fonction de la tâche et de l’étape de simulation. Les communications coûteuses sont provoquées par un ordonnancement qui ne prend pas en compte les différents temps de c ! ommunication entre tâches sur une plate-forme hiérarchique. Cela est accentué par des communications non uniformes et asymétriques au niveau mémoire et réseau. Enfin, ces surcoûts peuvent être générés par des algorithmes de placement trop complexes dont les coûts ne seraient pas compensés par les gains de performance.

Pour atteindre cet objectif de portabilité des performances, notre approche repose sur une récolte d’informations précises sur la topologie de la machine qui vont aider les algorithmes d’ordonnancement de tâches à prendre les bonnes décisions. Dans ce contexte, nous avons proposé une modélisation générique de la topologie des plates-formes parallèles. Le modèle comprend des latences et des bandes passantes mesurées de la mémoire et du réseau qui mettent en évidence des asymétries. Ces informations sont utilisées par nos trois algorithmes d’équilibrage de charge nommés NucoLB, HwTopoLB, et HierarchicalLB. De plus, ces algorithmes utilisent des informations provenant de l’exécution de l’application. NucoLB se concentre sur les aspects non uniformes de plates-formes parallèles, alors que HwTopoLB considère l’ensemble de la hiérarchie pour ses décisions, et HierarchicalLB combine ces algorithmes hiérarchiquement pour réduire son surcoût d’ordonnanceme ! nt de tâches. Ces algorithmes cherchent à atténuer le déséquilibre de charge et des communications coûteuses tout en limitant les surcoûts de migration des tâches.

Les résultats expérimentaux avec les trois régulateurs de charge proposés ont montré des améliorations de performances sur les meilleurs algorithmes de l’état de l’art : NucoLB a présenté jusqu’à 19% d’amélioration de performances sur un noeud de calcul ; HwTopoLB a amélioré les performances en moyenne de 19%, et HierarchicalLB a surclassé HwTopoLB de 22% en moyenne sur des plates-formes avec plus de dix noeuds de calcul. Ces résultats ont été obtenus en répartissant la charge entre les ressources disponibles, en réduisant les coûts de communication des applications, et en gardant les surcoûts d’équilibrage de charge faibles. En ce sens, nos algorithmes d’équilibrage de charge permettent la portabilité des performances pour les applications scientifiques tout en étant indépendant de l’application et de l’architecture du système.