Tout-AMD et le premier supercalculateur Exascale au monde, Frontier, est en difficulté depuis son lancement

Le laboratoire national d’Oak Ridge, ou ORNL, abrite Ordinateur frontalier géant. Frontier est marqué comme le premier système de niveau exascale construit avec les processeurs EPYC Trento d’AMD et MI250X – Accélérateurs de calcul Instinct. L’ensemble du système tire parti des connexions Slingshot de HPE. Il devrait également être le supercalculateur le plus rapide au monde disponible et est la seule conception Exascale au monde.

L’architecture Cray EX a été construite par HPE pour des applications à grande échelle auxquelles les chercheurs peuvent accéder pour aider la recherche scientifique à partir de 2023. Cependant, un supercalculateur ne peut pas fonctionner pendant une journée entière sans Plusieurs échecs Il est situé à l’intérieur de l’appareil.

Limites de l’ORNL boot mais ne peut produire qu’un maximum de 1 ExaFLOPS FP64, alors que le système est conçu pour fournir 1.685 ExaFLOPS FP64. Bien qu’aucun mot n’ait été donné concernant les problèmes spécifiques, certaines rumeurs ont fait surface.

Frontier, le premier supercalculateur Exascale entièrement AMD et au monde, rencontre des problèmes depuis qu'il fonctionne sur 2

Premièrement, les connexions de Slingshot, le réseau construit pour le supercalculateur HPE Cray, entrent en conflit avec les clusters HPE. Malheureusement, la spécificité du problème exact est inconnue. Deuxièmement, les GPU AMD Instinct MI250X et les processeurs EPYC Trento seraient en conflit avec les connexions Slingshot. Encore une fois, aucun mot officiel n’est venu des porteurs de projet ou des chercheurs du supercalculateur ORNL Frontier.

Mike Bernhardt, du projet de calcul exascale du ministère de l’Énergie (DOE), a déclaré que l’intégration complète de l’ORNL Frontier sera disponible pour les chercheurs à partir de l’année prochaine, mais il n’a signalé aucune préoccupation ou problème concernant le lancement complet du supercalculateur Frontier.

Les partenaires de l’ORNL dans l’effort Exascale, HPE et AMD, ont livré le nouveau système Frontier à l’ORNL avant la date prévue pour cet événement. Frontier est maintenant en cours d’installation et d’intégration, un effort énorme et complexe, et les progrès actuels indiquent que tout est en bonne voie pour rendre Frontier disponible aux utilisateurs pour la science ouverte l’année prochaine – comme prévu.

Mike Bernhardt (responsable des communications pour le projet de calcul exascale du ministère de l’Énergie) via à l’intérieur du CHP

Le statut « d’effort complexe » de Bernhardt peut être la cause de tant de rumeurs sur le projet. Il convient également de noter que les GPU informatiques MI250X d’AMD ne sont disponibles que pour certains clients, c’est pourquoi il n’existe aucune norme pour prendre en charge les rumeurs. Le ministère de l’Énergie a travaillé en étroite collaboration avec la Leading Computing Facility d’Oak Ridge on the Border. Le supercalculateur ORNL Frontier devrait être pleinement opérationnel d’ici le 1er janvier 2023, après avoir dépassé l’échéance initiale de 2022.

sources d’information : à l’intérieur du CHPEt le Quincaillerie Toms

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *