Le calcul haute performance ou HPC (High Performance Computing) joue un rôle essentiel dans la plupart des grandes avancées scientifiques réalisées à travers le monde. Plateforme Linux d'entreprise hautement fiable, Red Hat Enterprise Linux (RHEL) sert de base à de nombreuses charges de travail HPC dans des secteurs tels que l'automobile, les services financiers, la biomédecine ou encore l'énergie.

En parallèle, le cloud public continue de se répandre sur le marché plus général de l'informatique parce qu'il offre une flexibilité considérable et une infrastructure dynamique. Le calcul haute performance suit la même tendance : les entreprises cherchent à tirer parti de cette flexibilité et d'une capacité de calcul supplémentaire pour mettre à l'échelle les clusters HPC à la demande, et ainsi écourter leurs cycles de développement de produits ou de recherche.

C'est pourquoi nous avons développé une nouvelle offre : Red Hat Enterprise Linux (RHEL) for HPC on Azure. Nous avons travaillé en étroite collaboration avec Microsoft pour identifier les exigences techniques qui permettent d'accélérer les déploiements pour nos clients communs. Avec RHEL for HPC on Azure, vous bénéficiez des processus automatisés qui installent les outils et les bibliothèques nécessaires pour accélérer un environnement HPC sur l'infrastructure Azure.

Présentation du rôle système RHEL HPC

L'offre RHEL HPC 9.6 pour le cloud Azure repose sur les rôles système RHEL

Le rôle système RHEL HPC est un rôle Red Hat Ansible Automation Platform spécialement conçu pour simplifier le déploiement et la configuration des environnements HPC. Ce rôle système installe automatiquement les composants tiers nécessaires pour éviter aux clients de les intégrer manuellement, notamment le pilote NVIDIA CUDA, la boîte à outils CUDA Toolkit, la bibliothèque NVIDIA Collective Communications Library (NCCL), NVIDIA Fabric Manager, les paquets NVIDIA RDMA et Open MPI. Il est modulaire, ce qui permet aux utilisateurs d'installer ou d'ignorer des paquets spécifiques. Il offre aussi des fonctionnalités telles que la configuration des volumes de stockage pour garantir que l'espace disque alloué est suffisant pour ces installations de grande taille sur Azure. 

Vous pouvez désormais sélectionner l'image RHEL HPC sur Azure Marketplace. Une fois l'instance de machine virtuelle lancée, il vous suffit de suivre quelques commandes de base pour exécuter le rôle système RHEL HPC (déjà installé sur l'image). Lorsque les rôles système ont téléchargé tous les paquets HPC pertinents, vous pouvez enregistrer cette image en tant qu'image maître et créer plusieurs instances HPC à partir de celle-ci.  

Le rôle système RHEL HPC nous permet de publier en continu des paquets HPC pendant les 12 prochains mois (approche accélérée), tout en évitant de nous aligner sur le rythme de lancement d'une nouvelle version de RHEL tous les 6 mois (approche lente). À mesure que l'offre Red Hat se développe, vous aurez la possibilité d'utiliser les versions de RHEL (RHEL 9.8, RHEL 9.9, RHEL 10.2, etc.) ou les dernières versions du rôle système RHEL HPC. 

Azure RHEL HPC offering in the market place

Description de l'offre

La version MVP (produit minimum viable) de RHEL HPC vise à proposer une instance d'image optimisée pour Azure qui peut être déployée par Azure CycleCloud, la plateforme Microsoft pour la création et la gestion de bout en bout de clusters HPC. Les clients qui utilisent le HPC choisissent souvent CycleCloud, qui gère efficacement les tâches complexes de gestion et de provisionnement des clusters. 

L'offre RHEL simplifiée pour le HPC est disponible sur Azure Marketplace. Elle est centrée sur le nouveau rôle système RHEL HPC qui est distribué via Ansible et cible les images RHEL 9.6. Cette offre améliore considérablement l'expérience de déploiement des environnements HPC sur des images RHEL. 

Ce rôle système est conçu pour intégrer différentes dépendances de base, essentielles aux charges de travail HPC modernes : 

  • Pilote NVIDIA CUDA : installe les modules et pilotes de noyau propriétaires nécessaires au GPU NVIDIA pour effectuer des calculs.
  • Boîte à outils NVIDIA CUDA Toolkit : contient l'environnement de développement nécessaire pour créer des applications qui utilisent l'infrastructure CUDA.
  • Bibliothèque NCCL (NVIDIA Collective Communications Library) : contient des primitives optimisées pour la communication entre GPU. Incluse dans le référentiel NVIDIA, cette bibliothèque est indispensable pour les scénarios impliquant plusieurs GPU.
  • NVIDIA Fabric Manager : paquet lié à InfiniBand et aux utilitaires de mise en réseau. Il prend notamment en charge des fonctions comme NVSwitch qui sont indispensables pour les interconnexions haute vitesse entre GPU.
  • Open MPI (Message Passing Interface) : norme essentielle pour les tâches de HPC distribuées, qui permet la communication entre les nœuds d'un cluster.

Pour plus d'informations sur le déploiement de cette solution, consultez la documentation sur le rôle système RHEL HPC sur Azure.

Perspectives

Cette version MVP initiale n'est qu'une première étape. L'offre complète fournira davantage d'outils, de bibliothèques et de configurations nécessaires pour exécuter des charges de travail HPC sur Azure. Au cours des prochains mois, nous publierons des mises à jour qui intégreront d'autres contenus essentiels pour le HPC, testés et validés par nos spécialistes. Les clients qui achètent cette version auront accès à ces mises à jour et aux fonctionnalités étendues de l'offre.

Augmentez votre capacité de calcul haute performance dans le cloud

Partenaire historique de confiance dans le domaine du calcul haute performance, Red Hat facilite la découverte scientifique et le développement de produits. Nous sommes ravis de figurer parmi les partenaires de confiance de nos clients pour l'expansion du HPC dans le cloud. Avec l'offre RHEL for HPC on Azure, les clients peuvent déployer leurs clusters HPC sur l'infrastructure Azure bien plus rapidement.

Cette offre est disponible sur Azure Marketplace sous le nom de Red Hat Enterprise Linux (RHEL) for High Performance Computing (HPC) on Azure. Essayez-la dès aujourd'hui pour accélérer vos déploiements HPC.

Essai de produit

Red Hat Enterprise Linux | Essai de produit

Version de Red Hat Enterprise Linux qui orchestre les ressources matérielles et s'exécute sur les systèmes physiques, dans le cloud ou comme invité sur un hyperviseur.

À propos des auteurs

James Huang is a Senior Product Manager for Red Hat Enterprise Linux, where he focuses on AI and High Performance Computing.

UI_Icon-Red_Hat-Close-A-Black-RGB

Parcourir par canal

automation icon

Automatisation

Les dernières nouveautés en matière d'automatisation informatique pour les technologies, les équipes et les environnements

AI icon

Intelligence artificielle

Actualité sur les plateformes qui permettent aux clients d'exécuter des charges de travail d'IA sur tout type d'environnement

open hybrid cloud icon

Cloud hybride ouvert

Découvrez comment créer un avenir flexible grâce au cloud hybride

security icon

Sécurité

Les dernières actualités sur la façon dont nous réduisons les risques dans tous les environnements et technologies

edge icon

Edge computing

Actualité sur les plateformes qui simplifient les opérations en périphérie

Infrastructure icon

Infrastructure

Les dernières nouveautés sur la plateforme Linux d'entreprise leader au monde

application development icon

Applications

À l’intérieur de nos solutions aux défis d’application les plus difficiles

Virtualization icon

Virtualisation

L'avenir de la virtualisation d'entreprise pour vos charges de travail sur site ou sur le cloud