La supercomputadora más rápida del mundo no puede funcionar un día sin fallar


Construir una supercomputadora siempre es un desafío, pero crear el primer sistema de clase exaescala de la industria es un encuentro con algo completamente inesperado y requiere mucho trabajo con hardware y software. Desafortunadamente, esto podría estar sucediendo con la supercomputadora Frontier del Laboratorio Nacional de Oak Ridge, que apenas puede durar un día sin numerosas fallas de hardware.

Frontier de ORNL es el primer sistema de la industria diseñado para ofrecer un rendimiento máximo de hasta 1.685 FP64 ExaFLOPS utilizando los procesadores EPYC Trento de 64 núcleos de AMD, las GPU de cómputo Instinct MI250X y las interconexiones Slingshot de HPE a 21 MW de potencia. HPE construyó el sistema y usó el Cray EX (se abre en una pestaña nueva) arquitectura diseñada para aplicaciones escalables, principalmente para supercomputadoras ultrarrápidas.



Source link-41