El Centro Nacional de Computación Científica de Investigación Energética de EE. UU. ofrece alquilar nodos GPU de computación basados en Nvidia A100 de la supercomputadora Perlmutter con un descuento del 50% hasta finales de septiembre, como lo señaló Glenn K. Lockwood, un especialista en almacenamiento HPC de Microsoft. La oferta surge cuando la demanda de potencia informática para el entrenamiento de IA es escasa en toda la industria. Mientras tanto, la propuesta está disponible únicamente para usuarios de NERSC.
«Usar su tiempo ahora beneficia a toda la comunidad NERSC y distribuye la demanda de manera más uniforme a lo largo del año, por lo que para fomentar el uso ahora, estamos descontando todos los trabajos ejecutados en los nodos GPU de Perlmutter en un 50% a partir de mañana y hasta finales de septiembre», escribió Rebecca Hartman-Baker, líder del grupo de participación de usuarios de NERSC, en un correo electrónico a los usuarios de NERSC. «Cualquier trabajo (o parte de un trabajo) que se realice entre la medianoche de esta noche y el comienzo del 1 de octubre a la medianoche (hora del Pacífico) se cobrará sólo la mitad de los cargos habituales, por ejemplo, un trabajo de 3 horas en 7 nodos, lo que normalmente incurre en un cargo de 21 horas-nodo de GPU, se cobrarían 10,5 horas-nodo de GPU».
En medio de la moda de la IA generativa, hay docenas de empresas dispuestas a alquilar nodos basados en GPU de cómputo de Nvidia para entrenar sus grandes modelos de lenguaje. Aún así, los centros de datos comerciales están funcionando a su máxima capacidad y las GPU de cómputo de Nvidia están agotadas en los próximos trimestres, según informes de los medios. La oferta del NERSC es indudablemente generosa, y el centro científico podría ganar algo de dinero fácil si ofreciera su capacidad comercialmente.
Sin embargo, el problema es que sólo lo ofrecen a los usuarios existentes de NERSC que utilizan la supercomputadora Perlmutter para investigaciones científicas. Dado que estos usuarios estaban de vacaciones de verano, probablemente no estaban ejecutando sus cargas de trabajo en la supercomputadora y no lo harán hasta fin de año; al menos algunos de los nodos de GPU estuvieron inactivos durante algún tiempo, lo que plantea la pregunta de por qué la organización no repone su capacidad inactiva con cargas de trabajo comerciales.
Si bien el uso de supercomputadoras construidas por el gobierno de EE. UU. para cargas de trabajo comerciales de IA y HPC habría generado una gran cantidad de dinero que podría gastarse para mejorar la destreza de las supercomputadoras estadounidenses, esto no es algo que hagan instituciones como NERSC.
Las supercomputadoras del Departamento de Energía de EE. UU. están destinadas a ser utilizadas principalmente para cosas que presentan cuestiones de seguridad nacional o por usuarios preseleccionados, incluidos aquellos que utilizan estas máquinas para investigaciones que podrían usarse para aplicaciones comerciales. Como resultado, estas máquinas no están disponibles para todos.