{"id":690974,"date":"2023-06-19T17:15:31","date_gmt":"2023-06-19T17:15:31","guid":{"rendered":"https:\/\/magazineoffice.com\/comparacion-de-gpu-nvidia-hopper-h100-ai\/"},"modified":"2023-06-19T17:15:34","modified_gmt":"2023-06-19T17:15:34","slug":"comparacion-de-gpu-nvidia-hopper-h100-ai","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/comparacion-de-gpu-nvidia-hopper-h100-ai\/","title":{"rendered":"Comparaci\u00f3n de GPU NVIDIA Hopper H100 AI"},"content":{"rendered":"


\n<\/p>\n

\n

NVIDIA Hopper H100 es actualmente la GPU m\u00e1s r\u00e1pida del planeta para cargas de trabajo de HPC e IA, lo que la convierte en el chip m\u00e1s popular del mercado en este momento.<\/p>\n

NVIDIA Hopper H100 destruye RTX 4090 en cargas de trabajo de creaci\u00f3n de contenido e inteligencia artificial, pero se sacrifica en los puntos de referencia sint\u00e9ticos y de juegos<\/h2>\n

Desde la explosi\u00f3n de la IA, la GPU Hopper H100 ha experimentado una gran demanda y la empresa ha unido todos sus recursos para aumentar la producci\u00f3n de dicho chip solo para satisfacer esta demanda masiva. El creador de contenido chino, Geekerwan, brinda el primer vistazo al rendimiento del chip que se ejecuta en una PC est\u00e1ndar en una configuraci\u00f3n de hasta 4 v\u00edas con m\u00faltiples aplicaciones de creaci\u00f3n, incluidos los puntos de referencia de juegos.<\/p>\n

\n
<\/div>
Las GPU H100 de NVIDIA se prueban en una configuraci\u00f3n de 4 v\u00edas en una PC de bricolaje. (Cr\u00e9ditos de imagen: Geekerwan)<\/figcaption><\/figure>\n

La GPU NVIDIA H100 es un chip muy caro de conseguir en China. Hemos visto unidades que cuestan alrededor de $30,000 y hasta $50,000 US. Entonces, cuatro de estas tarjetas gr\u00e1ficas costar\u00edan m\u00e1s de $ 100 mil, lo cual es una locura. Para probar estas GPU en la configuraci\u00f3n de PC de bricolaje, se tuvo que hacer un conducto impreso en 3D para proporcionar refrigeraci\u00f3n a la tarjeta, ya que viene con un disipador de calor pasivo, lo que significa que no hay una soluci\u00f3n de refrigeraci\u00f3n activa a bordo de la tarjeta. Tambi\u00e9n se utiliz\u00f3 una tarjeta gr\u00e1fica NVIDIA GeForce GTX 1650 Ti como tarjeta de visualizaci\u00f3n secundaria, ya que la H100 no ofrece ninguna salida de visualizaci\u00f3n y est\u00e1 dise\u00f1ada para utilizarse como tarjeta aceleradora.<\/p>\n

\n<\/figure>\n

La variante del H100 utilizada fue el PCIe de 80 GB, con 114 SM habilitados de los 144 SM completos de la GPU GH100 y 132 SM en el H100 SXM. El chip como tal ofrece 3200 FP8, 1600 TF16, 800 FP32 y 48 TFLOP de potencia de c\u00f3mputo FP64. Tambi\u00e9n cuenta con 456 unidades de tensor y textura con 24 ROP.<\/p>\n

La forma en que est\u00e1 estructurado el H100 es que solo 2 de sus TPC est\u00e1n disponibles para las tareas de procesamiento de gr\u00e1ficos est\u00e1ndar, mientras que todo el bloque de GPU se dedica principalmente a tareas de c\u00f3mputo, lo que puede generar resultados adversos en los juegos, incluso si los controladores no son compatibles. tales cargas de trabajo. La tarjeta cuenta con un dise\u00f1o de memoria HBM2e de 80 GB (2,0 Gbps) en una interfaz de bus de 5120 bits y tiene un TDP nominal de 350 W. Sin embargo<\/p>\n

\n
\"NVIDIA<\/div>
NVIDIA H100 procesa una imagen generada por IA. (Cr\u00e9ditos de imagen: Geekerwan)<\/figcaption><\/figure>\n

Comenzando con los puntos de referencia, la tarjeta se prob\u00f3 por primera vez dentro de los puntos de referencia de Stable AI Diffusion, y aunque el H100 pudo generar una imagen en 2.82 segundos, a\u00fan fue m\u00e1s lento que el RTX 4090. El problema principal se debi\u00f3 a Xformers que no incluyen soporte para el H100 y, por lo tanto, se decidi\u00f3 utilizar un modelo diferente, Donut. La herramienta Donut hizo uso de los motores de transformadores que se encuentran en las GPU Hopper H100 en pytorch 2.0.01 y tambi\u00e9n permiti\u00f3 la compatibilidad con CUDA 11.8.<\/p>\n

El rendimiento aqu\u00ed fue todo lo contrario, ya que el H100 ofrece una velocidad un 30 % m\u00e1s r\u00e1pida que las GPU RTX 4090 y RTX 6000 Ada. El creador de contenido tambi\u00e9n us\u00f3 hasta cuatro GPU H100 para ver el rendimiento de escalado y parece que dos H100 ofrecieron un aumento adicional del 43 %, pero los resultados de 3 y 4 v\u00edas mostraron rendimientos decrecientes y una escala negativa. Parece que las PC est\u00e1ndar simplemente no pueden aprovechar m\u00faltiples GPU H100.<\/p>\n

\n<\/figure>\n

Dentro del punto de referencia de entrenamiento VITS, el H100 entreg\u00f3 un rendimiento un 23 % m\u00e1s r\u00e1pido en comparaci\u00f3n con las GPU NVIDIA RTX 4090 y RTX 6000 Ada. Este es un punto de referencia que requiere mucha memoria y aumentar el tama\u00f1o del lote no afecta el rendimiento del H100, ya que tiene 80 GB de memoria, pero el RTX 4090 se qued\u00f3 atr\u00e1s con un tama\u00f1o de lote m\u00e1s alto debido a su VRAM limitada de 24 GB.<\/p>\n

A continuaci\u00f3n, tenemos un gran modelo LLAMA en ChatGPT con un total de 65\u00a0000 millones de par\u00e1metros que eran manejables en el H100, pero el RTX 4090 solo puede ejecutar hasta 6\u00a0000 millones de par\u00e1metros. Esto muestra que, al menos para LLM, las GPU para juegos no son una buena opci\u00f3n, y es mejor obtener un acelerador dedicado. En el \u00faltimo conjunto de puntos de referencia, se utilizaron cargas de trabajo de HPC como LAMMP (28 de marzo de 2023) y el RTX 4090 ni el RTX 6000 Ada pueden hacer frente al H100 PCIe que elimin\u00f3 las dos ofertas.<\/p>\n

\n
\"La<\/div>
La H100 ofrece un rendimiento inferior al de la iGPU Radeon 680M de AMD en las pruebas 3DMark Time Spy. (Cr\u00e9ditos de imagen: Geekerwan)<\/figcaption><\/figure>\n

Pero, \u00bfc\u00f3mo funciona la tarjeta en los juegos? Bueno, se utilizaron 3DMark Time Spy y Red Dead Redemption 2 para probar el rendimiento de juego de la GPU NVIDIA H100 y la tarjeta funcion\u00f3 m\u00e1s lentamente que la Radeon 680M de AMD, que es una GPU integrada. El problema se debi\u00f3 a la infrautilizaci\u00f3n y la naturaleza no optimizada de los controladores, lo que era de esperar, ya que la H100 es una soluci\u00f3n HPC\/AI y la empresa no tiene controladores de juegos oficiales creados para la tarjeta.<\/p>\n

En Red Dead Redemption 2, la tarjeta se ejecut\u00f3 con una configuraci\u00f3n alta de 1080p y un ajuste preestablecido de DLSS \u00abEquilibrado\u00bb y a\u00fan entregaba menos de 30 FPS. Una vez m\u00e1s, puede ver que la potencia de la tarjeta es inferior a 100 W y eso muestra una gran infrautilizaci\u00f3n de la GPU H100.<\/p>\n

\"\"<\/figure>\n

Entonces, la H100 de NVIDIA es lo que se dice que es, una gran tarjeta para cargas de trabajo de IA y HPC, y eso es todo. Es un acelerador muy caro, pero como no hay competencia para igualarlo, el equipo verde puede salirse con la suya con los precios hasta que AMD e Intel ofrezcan soluciones m\u00e1s competitivas en el mismo espacio.<\/p>\n