{"id":117453,"date":"2022-08-24T17:49:01","date_gmt":"2022-08-24T17:49:01","guid":{"rendered":"https:\/\/magazineoffice.com\/nvidia-hopper-h100-con-nucleo-tensor-de-4-a-generacion-es-el-doble-de-rapido-reloj-por-reloj-la-frecuencia-ofrece-una-ganancia-de-rendimiento-del-30\/"},"modified":"2022-08-24T17:49:05","modified_gmt":"2022-08-24T17:49:05","slug":"nvidia-hopper-h100-con-nucleo-tensor-de-4-a-generacion-es-el-doble-de-rapido-reloj-por-reloj-la-frecuencia-ofrece-una-ganancia-de-rendimiento-del-30","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/nvidia-hopper-h100-con-nucleo-tensor-de-4-a-generacion-es-el-doble-de-rapido-reloj-por-reloj-la-frecuencia-ofrece-una-ganancia-de-rendimiento-del-30\/","title":{"rendered":"NVIDIA Hopper H100 con n\u00facleo Tensor de 4.\u00aa generaci\u00f3n es el doble de r\u00e1pido reloj por reloj, la frecuencia ofrece una ganancia de rendimiento del 30 %"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"\">\n<p>NVIDIA est\u00e1 analizando a\u00fan m\u00e1s su GPU Hopper H100 en Hot Chips 34, lo que nos da una idea de lo que la arquitectura Tensor Core de 4.\u00aa generaci\u00f3n tiene para ofrecer.<\/p>\n<h2>La GPU NVIDIA Kepler GK110 es equivalente a un solo GPC en la GPU Hopper H100, los n\u00facleos tensoriales de cuarta generaci\u00f3n son hasta 2 veces m\u00e1s r\u00e1pidos<\/h2>\n<p>Si bien AMD est\u00e1 adoptando el enfoque MCM en sus GPU HPC, NVIDIA decidi\u00f3 quedarse con el dise\u00f1o monol\u00edtico por ahora.  Su Hopper H100, como tal, es una de las GPU m\u00e1s grandes fabricadas con el nodo de proceso 4N de TSMC, un dise\u00f1o optimizado y fabricado exclusivamente para NVIDIA.<\/p>\n<figure class=\"story-gallery\">\n<\/figure>\n<p>La GPU H100 es un chip monstruoso que viene con la \u00faltima tecnolog\u00eda de 4 nm e incorpora 80 mil millones de transistores junto con la tecnolog\u00eda de memoria HBM3 de \u00faltima generaci\u00f3n.  El H100 se basa en la placa PCB PG520 que tiene m\u00e1s de 30 VRM de potencia y un intercalador integral masivo que utiliza la tecnolog\u00eda CoWoS de TSMC para combinar la GPU Hopper H100 con un dise\u00f1o HBM3 de 6 pilas.  Algunas de las principales tecnolog\u00edas de la GPU Hopper H100 incluyen:<\/p>\n<ul>\n<li>132 SM (rendimiento 2x por reloj)<\/li>\n<li>N\u00facleos de tensor de cuarta generaci\u00f3n<\/li>\n<li>Grupos de bloques de subprocesos<\/li>\n<li>GPU de instancias m\u00faltiples de segunda generaci\u00f3n<\/li>\n<li>Inform\u00e1tica confidencial<\/li>\n<li>Interfaz PCIe Gen 5.0<\/li>\n<li>La primera DRAM HBM3 del mundo<\/li>\n<li>Cach\u00e9 L2 de 50 MB m\u00e1s grande<\/li>\n<li>NVLink de cuarta generaci\u00f3n (900 GB\/s de ancho de banda total)<\/li>\n<li>Nuevo soporte SHARP<\/li>\n<li>Red NVLink<\/li>\n<\/ul>\n<p>De las seis pilas, se mantienen dos pilas para garantizar la integridad del rendimiento.  Pero el nuevo est\u00e1ndar HBM3 permite capacidades de hasta 80 GB a velocidades de 3 TB\/s que son una locura.  A modo de comparaci\u00f3n, la tarjeta gr\u00e1fica para juegos m\u00e1s r\u00e1pida actual, la RTX 3090 Ti, ofrece solo 1 TB\/s de ancho de banda y capacidades de VRAM de 24 GB.  Aparte de eso, la GPU Hopper H100 tambi\u00e9n incluye el \u00faltimo formato de datos FP8 y, a trav\u00e9s de su nueva conexi\u00f3n SXM, ayuda a acomodar el dise\u00f1o de potencia de 700 W alrededor del cual est\u00e1 dise\u00f1ado el chip.  Tambi\u00e9n ofrece el doble de las tasas de FMA de FP32 y FP64 y cach\u00e9 L1 de 256 KB (memoria compartida).<\/p>\n<p><strong>Resumen de las especificaciones de la GPU NVIDIA Hopper H100<\/strong><\/p>\n<p>Entonces, en cuanto a las especificaciones, la GPU NVIDIA Hopper GH100 se compone de un dise\u00f1o de chip masivo de 144 SM (multiprocesador de transmisi\u00f3n) que se presenta en un total de 8 GPC.  Estos GPC tienen un total de 9 TPC que se componen adem\u00e1s de 2 unidades SM cada uno.  Esto nos da 18 SM por GPC y 144 en la configuraci\u00f3n completa de 8 GPC.  Cada SM est\u00e1 compuesto por hasta 128 unidades FP32 lo que nos deber\u00eda dar un total de 18.432 n\u00facleos CUDA.<\/p>\n<figure class=\"wp-lightbox\"><\/figure>\n<p>Las siguientes son algunas de las configuraciones que puede esperar del chip H100:<\/p>\n<p><strong>La implementaci\u00f3n completa de la GPU GH100 incluye las siguientes unidades:<\/strong><\/p>\n<ul>\n<li>8 GPC, 72 TPC (9 TPC\/GPC), 2 SM\/TPC, 144 SM por GPU completa<\/li>\n<li>128 FP32 CUDA Cores por SM, 18432 FP32 CUDA Cores por GPU completa<\/li>\n<li>4 n\u00facleos tensoriales de cuarta generaci\u00f3n por SM, 576 por GPU completa<\/li>\n<li>6 pilas HBM3 o HBM2e, 12 controladores de memoria de 512 bits<\/li>\n<li>60 MB de cach\u00e9 L2<\/li>\n<li>NVLink de cuarta generaci\u00f3n y PCIe Gen 5<\/li>\n<\/ul>\n<p><strong>La GPU NVIDIA H100 con factor de forma de placa SXM5 incluye las siguientes unidades:<\/strong><\/p>\n<ul>\n<li>8 GPC, 66 TPC, 2 SM\/TPC, 132 SM por GPU<\/li>\n<li>128 n\u00facleos FP32 CUDA por SM, 16896 n\u00facleos FP32 CUDA por GPU<\/li>\n<li>4 Tensor Cores de cuarta generaci\u00f3n por SM, 528 por GPU<\/li>\n<li>80 GB HBM3, 5 pilas HBM3, 10 controladores de memoria de 512 bits<\/li>\n<li>50 MB de cach\u00e9 L2<\/li>\n<li>NVLink de cuarta generaci\u00f3n y PCIe Gen 5<\/li>\n<\/ul>\n<p>Este es un aumento de 2.25x sobre la configuraci\u00f3n completa de GPU GA100.  NVIDIA tambi\u00e9n est\u00e1 aprovechando m\u00e1s n\u00facleos FP64, FP16 y Tensor dentro de su GPU Hopper, lo que aumentar\u00eda enormemente el rendimiento.  Y eso va a ser una necesidad para competir con el Ponte Vecchio de Intel, que tambi\u00e9n se espera que presente 1:1 FP64.  NVIDIA afirma que los n\u00facleos Tensor de 4.\u00aa generaci\u00f3n en Hopper ofrecen el doble de rendimiento con el mismo reloj.<\/p>\n<figure class=\"wp-lightbox\"><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-1369422 size-large\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-740x384.png\" alt=\"La GPU NVIDIA Kepler GK110 es equivalente a un solo GPC en la GPU Hopper H100, n\u00facleos Tensor de 4.\u00aa generaci\u00f3n hasta 2 veces m\u00e1s r\u00e1pido 3\" width=\"740\" height=\"384\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-740x384.png 740w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-768x398.png 768w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-1536x797.png 1536w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-2048x1063.png 2048w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-550x285.png 550w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-1100x571.png 1100w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-1480x768.png 1480w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-1030x534.png 1030w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_8-1920x996.png 1920w\" sizes=\"(max-width: 740px) 100vw, 740px\"\/><\/figure>\n<p>El siguiente desglose del rendimiento de NVIDIA Hopper H100 muestra que los SM adicionales representan solo un aumento del rendimiento del 20 %.  El principal beneficio proviene de los Tensor Cores de cuarta generaci\u00f3n y el FP8 calcula la ruta.  Una frecuencia m\u00e1s alta tambi\u00e9n agrega un aumento decente del 30% a la mezcla.<\/p>\n<figure class=\"wp-lightbox\"><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-1369421 size-large\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-740x386.png\" alt=\"NVIDIA Kepler GK110 GPU es equivalente a un solo GPC en Hopper H100 GPU, 4.\u00aa generaci\u00f3n de n\u00facleos tensorizados hasta 2 veces m\u00e1s r\u00e1pido 4\" width=\"740\" height=\"386\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-740x386.png 740w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-768x401.png 768w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-1536x801.png 1536w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-2048x1068.png 2048w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-550x287.png 550w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-1100x574.png 1100w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-1480x772.png 1480w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-1030x537.png 1030w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_9-1920x1001.png 1920w\" sizes=\"(max-width: 740px) 100vw, 740px\"\/><\/figure>\n<p>Una comparaci\u00f3n interesante que se\u00f1ala el escalado de GPU muestra que un solo GPC en una GPU Hopper H100 es equivalente a una GPU Kepler GK110, un chip HPC insignia de 2012. El Kepler GK110 albergaba un total de 15 SM, mientras que la GPU Hopper H110 incluye 132 SM. e incluso un GPC singular en la GPU Hopper presenta 18 SM, un 20 % m\u00e1s que la totalidad de los SM en el buque insignia de Kepler.<\/p>\n<figure class=\"wp-lightbox\"><img decoding=\"async\" loading=\"lazy\" class=\"alignnone size-large wp-image-1369423\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-740x397.png\" alt=\"\" width=\"740\" height=\"397\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-740x397.png 740w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-768x412.png 768w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-1536x825.png 1536w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-2048x1100.png 2048w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-550x295.png 550w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-1100x591.png 1100w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-1480x795.png 1480w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-1030x553.png 1030w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/08\/NVIDIA-Hopper-H100-GPU-Hot-Chips-34-_7-1920x1031.png 1920w\" sizes=\"(max-width: 740px) 100vw, 740px\"\/><\/figure>\n<p>La memoria cach\u00e9 es otro espacio en el que NVIDIA ha prestado mucha atenci\u00f3n, llev\u00e1ndola a 48 MB en la GPU Hopper GH100.  Este es un aumento del 20 % con respecto a los 50 MB de cach\u00e9 que se incluyen en la GPU Ampere GA100 y 3 veces el tama\u00f1o de la GPU insignia Aldebaran MCM de AMD, la MI250X.<\/p>\n<p>Redondeando las cifras de rendimiento, la GPU Hopper GH100 de NVIDIA ofrecer\u00e1 4000 TFLOP de FP8, 2000 TFLOP de FP16, 1000 TFLOP de TF32 y 60 TFLOP de FP64 de rendimiento inform\u00e1tico.  Estas cifras que rompen r\u00e9cords diezman a todos los dem\u00e1s aceleradores de HPC que lo precedieron.  A modo de comparaci\u00f3n, esto es 3,3 veces m\u00e1s r\u00e1pido que la propia GPU A100 de NVIDIA y un 28 % m\u00e1s r\u00e1pido que el Instinct MI250X de AMD en el c\u00f3mputo FP64.  En computaci\u00f3n FP16, la GPU H100 es 3 veces m\u00e1s r\u00e1pida que la A100 y 5,2 veces m\u00e1s r\u00e1pida que la MI250X, que es literalmente una locura.<\/p>\n<p>La variante PCIe, que es un modelo reducido, se incluy\u00f3 recientemente en Jap\u00f3n por m\u00e1s de $ 30,000 USD, por lo que uno puede imaginar que la variante SXM con una configuraci\u00f3n m\u00e1s robusta costar\u00e1 f\u00e1cilmente alrededor de $ 50 mil.<\/p>\n<h2 id=\"tablepress-1222-name\" class=\"tablepress-table-name tablepress-table-name-id-1222\">Especificaciones de NVIDIA Ampere GA100 GPU Tesla A100:<\/h2>\n<table id=\"tablepress-1222\" class=\"tablepress tablepress-id-1222 tablepress-responsive\" aria-labelledby=\"tablepress-1222-name\">\n<thead>\n<tr class=\"row-1 odd\">\n<th class=\"column-1\">Tarjeta gr\u00e1fica NVIDIA Tesla<\/th>\n<th class=\"column-2\">NVIDIA H100 (SMX5)<\/th>\n<th class=\"column-3\">NVIDIA H100 (PCIe)<\/th>\n<th class=\"column-4\">NVIDIA A100 (SXM4)<\/th>\n<th class=\"column-5\">NVIDIA A100 (PCIe4)<\/th>\n<th class=\"column-6\">Tesla V100S (PCIe)<\/th>\n<th class=\"column-7\">Tesla V100 (SXM2)<\/th>\n<th class=\"column-8\">Tesla P100 (SXM2)<\/th>\n<th class=\"column-9\">tesla p100<br \/>(PCI-Express)<\/th>\n<th class=\"column-10\">tesla m40<br \/>(PCI-Express)<\/th>\n<th class=\"column-11\">tesla k40<br \/>(PCI-Express)<\/th>\n<\/tr>\n<\/thead>\n<tbody class=\"row-hover\">\n<tr class=\"row-2 even\">\n<td class=\"column-1\">GPU<\/td>\n<td class=\"column-2\">GH100 (Tolva)<\/td>\n<td class=\"column-3\">GH100 (Tolva)<\/td>\n<td class=\"column-4\">GA100 (amperios)<\/td>\n<td class=\"column-5\">GA100 (amperios)<\/td>\n<td class=\"column-6\">GV100 (Voltaje)<\/td>\n<td class=\"column-7\">GV100 (Voltaje)<\/td>\n<td class=\"column-8\">GP100 (Pascales)<\/td>\n<td class=\"column-9\">GP100 (Pascales)<\/td>\n<td class=\"column-10\">GM200 (Maxwell)<\/td>\n<td class=\"column-11\">GK110 (Kepler)<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n<td class=\"column-1\">Nodo de proceso<\/td>\n<td class=\"column-2\">4 nm<\/td>\n<td class=\"column-3\">4 nm<\/td>\n<td class=\"column-4\">7 nm<\/td>\n<td class=\"column-5\">7 nm<\/td>\n<td class=\"column-6\">12nm<\/td>\n<td class=\"column-7\">12nm<\/td>\n<td class=\"column-8\">16nm<\/td>\n<td class=\"column-9\">16nm<\/td>\n<td class=\"column-10\">28nm<\/td>\n<td class=\"column-11\">28nm<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n<td class=\"column-1\">transistores<\/td>\n<td class=\"column-2\">80 mil millones<\/td>\n<td class=\"column-3\">80 mil millones<\/td>\n<td class=\"column-4\">54,2 mil millones<\/td>\n<td class=\"column-5\">54,2 mil millones<\/td>\n<td class=\"column-6\">21.1 mil millones<\/td>\n<td class=\"column-7\">21.1 mil millones<\/td>\n<td class=\"column-8\">15,3 mil millones<\/td>\n<td class=\"column-9\">15,3 mil millones<\/td>\n<td class=\"column-10\">8 mil millones<\/td>\n<td class=\"column-11\">7.1 mil millones<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n<td class=\"column-1\">Tama\u00f1o de matriz de GPU<\/td>\n<td class=\"column-2\">814 mm2<\/td>\n<td class=\"column-3\">814 mm2<\/td>\n<td class=\"column-4\">826mm2<\/td>\n<td class=\"column-5\">826mm2<\/td>\n<td class=\"column-6\">815 mm2<\/td>\n<td class=\"column-7\">815 mm2<\/td>\n<td class=\"column-8\">610 mm2<\/td>\n<td class=\"column-9\">610 mm2<\/td>\n<td class=\"column-10\">601 mm2<\/td>\n<td class=\"column-11\">551 mm2<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n<td class=\"column-1\">SMS<\/td>\n<td class=\"column-2\">132<\/td>\n<td class=\"column-3\">114<\/td>\n<td class=\"column-4\">108<\/td>\n<td class=\"column-5\">108<\/td>\n<td class=\"column-6\">80<\/td>\n<td class=\"column-7\">80<\/td>\n<td class=\"column-8\">56<\/td>\n<td class=\"column-9\">56<\/td>\n<td class=\"column-10\">24<\/td>\n<td class=\"column-11\">15<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n<td class=\"column-1\">TPC<\/td>\n<td class=\"column-2\">66<\/td>\n<td class=\"column-3\">57<\/td>\n<td class=\"column-4\">54<\/td>\n<td class=\"column-5\">54<\/td>\n<td class=\"column-6\">40<\/td>\n<td class=\"column-7\">40<\/td>\n<td class=\"column-8\">28<\/td>\n<td class=\"column-9\">28<\/td>\n<td class=\"column-10\">24<\/td>\n<td class=\"column-11\">15<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n<td class=\"column-1\">N\u00facleos CUDA FP32 por SM<\/td>\n<td class=\"column-2\">128<\/td>\n<td class=\"column-3\">128<\/td>\n<td class=\"column-4\">64<\/td>\n<td class=\"column-5\">64<\/td>\n<td class=\"column-6\">64<\/td>\n<td class=\"column-7\">64<\/td>\n<td class=\"column-8\">64<\/td>\n<td class=\"column-9\">64<\/td>\n<td class=\"column-10\">128<\/td>\n<td class=\"column-11\">192<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n<td class=\"column-1\">N\u00facleos CUDA FP64 \/ SM<\/td>\n<td class=\"column-2\">128<\/td>\n<td class=\"column-3\">128<\/td>\n<td class=\"column-4\">32<\/td>\n<td class=\"column-5\">32<\/td>\n<td class=\"column-6\">32<\/td>\n<td class=\"column-7\">32<\/td>\n<td class=\"column-8\">32<\/td>\n<td class=\"column-9\">32<\/td>\n<td class=\"column-10\">4<\/td>\n<td class=\"column-11\">64<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n<td class=\"column-1\">N\u00facleos CUDA FP32<\/td>\n<td class=\"column-2\">16896<\/td>\n<td class=\"column-3\">14592<\/td>\n<td class=\"column-4\">6912<\/td>\n<td class=\"column-5\">6912<\/td>\n<td class=\"column-6\">5120<\/td>\n<td class=\"column-7\">5120<\/td>\n<td class=\"column-8\">3584<\/td>\n<td class=\"column-9\">3584<\/td>\n<td class=\"column-10\">3072<\/td>\n<td class=\"column-11\">2880<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n<td class=\"column-1\">N\u00facleos CUDA FP64<\/td>\n<td class=\"column-2\">16896<\/td>\n<td class=\"column-3\">14592<\/td>\n<td class=\"column-4\">3456<\/td>\n<td class=\"column-5\">3456<\/td>\n<td class=\"column-6\">2560<\/td>\n<td class=\"column-7\">2560<\/td>\n<td class=\"column-8\">1792<\/td>\n<td class=\"column-9\">1792<\/td>\n<td class=\"column-10\">96<\/td>\n<td class=\"column-11\">960<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n<td class=\"column-1\">N\u00facleos tensoriales<\/td>\n<td class=\"column-2\">528<\/td>\n<td class=\"column-3\">456<\/td>\n<td class=\"column-4\">432<\/td>\n<td class=\"column-5\">432<\/td>\n<td class=\"column-6\">640<\/td>\n<td class=\"column-7\">640<\/td>\n<td class=\"column-8\">N \/ A<\/td>\n<td class=\"column-9\">N \/ A<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-13 odd\">\n<td class=\"column-1\">Unidades de textura<\/td>\n<td class=\"column-2\">528<\/td>\n<td class=\"column-3\">456<\/td>\n<td class=\"column-4\">432<\/td>\n<td class=\"column-5\">432<\/td>\n<td class=\"column-6\">320<\/td>\n<td class=\"column-7\">320<\/td>\n<td class=\"column-8\">224<\/td>\n<td class=\"column-9\">224<\/td>\n<td class=\"column-10\">192<\/td>\n<td class=\"column-11\">240<\/td>\n<\/tr>\n<tr class=\"row-14 even\">\n<td class=\"column-1\">Reloj de impulso<\/td>\n<td class=\"column-2\">Por determinar<\/td>\n<td class=\"column-3\">Por determinar<\/td>\n<td class=\"column-4\">1410 MHz<\/td>\n<td class=\"column-5\">1410 MHz<\/td>\n<td class=\"column-6\">1601 MHz<\/td>\n<td class=\"column-7\">1530 MHz<\/td>\n<td class=\"column-8\">1480 MHz<\/td>\n<td class=\"column-9\">1329MHz<\/td>\n<td class=\"column-10\">1114 MHz<\/td>\n<td class=\"column-11\">875 MHz<\/td>\n<\/tr>\n<tr class=\"row-15 odd\">\n<td class=\"column-1\">TOP (DNN\/AI)<\/td>\n<td class=\"column-2\">2000 TOP<br \/>4000 TOP<\/td>\n<td class=\"column-3\">1600 TOP<br \/>3200 TOP<\/td>\n<td class=\"column-4\">1248 tapas<br \/>2496 TOP con escasez<\/td>\n<td class=\"column-5\">1248 tapas<br \/>2496 TOP con escasez<\/td>\n<td class=\"column-6\">130 TOP<\/td>\n<td class=\"column-7\">125 TOPS<\/td>\n<td class=\"column-8\">N \/ A<\/td>\n<td class=\"column-9\">N \/ A<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-16 even\">\n<td class=\"column-1\">C\u00f3mputo FP16<\/td>\n<td class=\"column-2\">2000 TFLOP<\/td>\n<td class=\"column-3\">1600 TFLOP<\/td>\n<td class=\"column-4\">312 TFLOP<br \/>624 TFLOP con escasez<\/td>\n<td class=\"column-5\">312 TFLOP<br \/>624 TFLOP con escasez<\/td>\n<td class=\"column-6\">32,8 TFLOP<\/td>\n<td class=\"column-7\">30,4 TFLOP<\/td>\n<td class=\"column-8\">21,2 TFLOP<\/td>\n<td class=\"column-9\">18,7 TFLOP<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-17 odd\">\n<td class=\"column-1\">C\u00f3mputo FP32<\/td>\n<td class=\"column-2\">1000 TFLOP<\/td>\n<td class=\"column-3\">800 TFLOP<\/td>\n<td class=\"column-4\">156 TFLOP<br \/>(19,5 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-5\">156 TFLOP<br \/>(19,5 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-6\">16.4 TFLOP<\/td>\n<td class=\"column-7\">15,7 TFLOP<\/td>\n<td class=\"column-8\">10,6 TFLOP<\/td>\n<td class=\"column-9\">10,0 TFLOP<\/td>\n<td class=\"column-10\">6.8 TFLOP<\/td>\n<td class=\"column-11\">5.04 TFLOP<\/td>\n<\/tr>\n<tr class=\"row-18 even\">\n<td class=\"column-1\">C\u00f3mputo FP64<\/td>\n<td class=\"column-2\">60 TFLOP<\/td>\n<td class=\"column-3\">48 TFLOP<\/td>\n<td class=\"column-4\">19,5 TFLOP<br \/>(9,7 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-5\">19,5 TFLOP<br \/>(9,7 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-6\">8.2 TFLOP<\/td>\n<td class=\"column-7\">7,80 TFLOP<\/td>\n<td class=\"column-8\">5,30 TFLOP<\/td>\n<td class=\"column-9\">4.7 TFLOP<\/td>\n<td class=\"column-10\">0,2 TFLOP<\/td>\n<td class=\"column-11\">1,68 TFLOP<\/td>\n<\/tr>\n<tr class=\"row-19 odd\">\n<td class=\"column-1\">interfaz de memoria<\/td>\n<td class=\"column-2\">HBM3 de 5120 bits<\/td>\n<td class=\"column-3\">HBM2e de 5120 bits<\/td>\n<td class=\"column-4\">HBM2e de 6144 bits<\/td>\n<td class=\"column-5\">HBM2e de 6144 bits<\/td>\n<td class=\"column-6\">HBM2 de 4096 bits<\/td>\n<td class=\"column-7\">HBM2 de 4096 bits<\/td>\n<td class=\"column-8\">HBM2 de 4096 bits<\/td>\n<td class=\"column-9\">HBM2 de 4096 bits<\/td>\n<td class=\"column-10\">GDDR5 de 384 bits<\/td>\n<td class=\"column-11\">GDDR5 de 384 bits<\/td>\n<\/tr>\n<tr class=\"row-20 even\">\n<td class=\"column-1\">Tama\u00f1o de la memoria<\/td>\n<td class=\"column-2\">Hasta 80 GB HBM3 a 3,0 Gbps<\/td>\n<td class=\"column-3\">Hasta 80 GB HBM2e a 2,0 Gbps<\/td>\n<td class=\"column-4\">Hasta 40 GB HBM2 a 1,6 TB\/s<br \/>Hasta 80 GB HBM2 a 1,6 TB\/s<\/td>\n<td class=\"column-5\">Hasta 40 GB HBM2 a 1,6 TB\/s<br \/>Hasta 80 GB HBM2 a 2,0 TB\/s<\/td>\n<td class=\"column-6\">16 GB HBM2 a 1134 GB\/s<\/td>\n<td class=\"column-7\">16 GB HBM2 a 900 GB\/s<\/td>\n<td class=\"column-8\">16 GB HBM2 a 732 GB\/s<\/td>\n<td class=\"column-9\">16 GB HBM2 a 732 GB\/s<br \/>12 GB HBM2 a 549 GB\/s<\/td>\n<td class=\"column-10\">24 GB GDDR5 a 288 GB\/s<\/td>\n<td class=\"column-11\">12 GB GDDR5 a 288 GB\/s<\/td>\n<\/tr>\n<tr class=\"row-21 odd\">\n<td class=\"column-1\">Tama\u00f1o de cach\u00e9 L2<\/td>\n<td class=\"column-2\">51200 KB<\/td>\n<td class=\"column-3\">51200 KB<\/td>\n<td class=\"column-4\">40960KB<\/td>\n<td class=\"column-5\">40960KB<\/td>\n<td class=\"column-6\">6144KB<\/td>\n<td class=\"column-7\">6144KB<\/td>\n<td class=\"column-8\">4096KB<\/td>\n<td class=\"column-9\">4096KB<\/td>\n<td class=\"column-10\">3072KB<\/td>\n<td class=\"column-11\">1536KB<\/td>\n<\/tr>\n<tr class=\"row-22 even\">\n<td class=\"column-1\">TDP<\/td>\n<td class=\"column-2\">700W<\/td>\n<td class=\"column-3\">350W<\/td>\n<td class=\"column-4\">400W<\/td>\n<td class=\"column-5\">250W<\/td>\n<td class=\"column-6\">250W<\/td>\n<td class=\"column-7\">300W<\/td>\n<td class=\"column-8\">300W<\/td>\n<td class=\"column-9\">250W<\/td>\n<td class=\"column-10\">250W<\/td>\n<td class=\"column-11\">235W<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><!-- #tablepress-1222 from cache --><\/p>\n<div class=\"story-products-wrapper\">\n<h2>Productos mencionados en esta publicaci\u00f3n.<\/h2>\n<p>\t\t<!--\n\n<p class=\"story-notice text-center\">The links above are affiliate links. As an Amazon Associate, Wccftech.com may earn from qualifying purchases.<\/p>\n\n-->\n\t<\/div>\n<\/p><\/div>\n<p><script>\n\t!function(f,b,e,v,n,t,s)if(f.fbq)return;n=f.fbq=function()n.callMethod?\n\tn.callMethod.apply(n,arguments):n.queue.push(arguments);if(!f._fbq)f._fbq=n;\n\tn.push=n;n.loaded=!0;n.version='2.0';n.queue=[];t=b.createElement(e);t.async=!0;\n\tt.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)(window,\n\tdocument,'script','https:\/\/connect.facebook.net\/en_US\/fbevents.js');\n\tfbq('init', '1503230403325633');\n\tfbq('track', 'PageView');\n\t<\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-29 <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>NVIDIA est\u00e1 analizando a\u00fan m\u00e1s su GPU Hopper H100 en Hot Chips 34, lo que nos da una idea de lo que la arquitectura Tensor Core de 4.\u00aa generaci\u00f3n tiene&hellip;<\/p>\n","protected":false},"author":1,"featured_media":117454,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[38731,133,194,1317,2916,29639,876,38730,16411,24633,843,3403,110,1879,11730,3074,30541,73],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/117453"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=117453"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/117453\/revisions"}],"predecessor-version":[{"id":117455,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/117453\/revisions\/117455"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/117454"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=117453"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=117453"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=117453"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}