{"id":761331,"date":"2023-08-07T09:13:43","date_gmt":"2023-08-07T09:13:43","guid":{"rendered":"https:\/\/magazineoffice.com\/gpu-h100-de-nvidia-y-the-ai-frenzy-un-resumen-de-la-situacion-actual\/"},"modified":"2023-08-07T09:14:02","modified_gmt":"2023-08-07T09:14:02","slug":"gpu-h100-de-nvidia-y-the-ai-frenzy-un-resumen-de-la-situacion-actual","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/gpu-h100-de-nvidia-y-the-ai-frenzy-un-resumen-de-la-situacion-actual\/","title":{"rendered":"GPU H100 de NVIDIA y The AI \u200b\u200bFrenzy;  un resumen de la situaci\u00f3n actual"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p>Todos somos muy conscientes de NVIDIA y la \u00abmina de oro\u00bb de la IA que recientemente ha conquistado a todos.  En medio de todo, se encuentran las GPU H100 AI de Team Green, que son simplemente la pieza de hardware para IA m\u00e1s buscada en este momento y todos intentan tener una para satisfacer sus necesidades de IA.<\/p>\n<h2>NVIDIA H100 GPU es el mejor chip para IA en este momento y todos quieren m\u00e1s de esos<\/h2>\n<p>Este art\u00edculo no es particularmente nuevo, pero destaca a los lectores sobre la situaci\u00f3n actual de la industria de la IA y c\u00f3mo las empresas est\u00e1n girando en torno a las GPU H100 para su \u00abfuturo\u00bb.<\/p>\n<p>Antes de entrar en el meollo del art\u00edculo, dar un resumen se convierte en una necesidad.  Entonces, a principios de 2022, todo iba bien con los desarrollos habituales.  Sin embargo, con la llegada de noviembre, surgi\u00f3 una aplicaci\u00f3n revolucionaria llamada \u00abChatGPT\u00bb, que sent\u00f3 las bases del bombo de la IA.  Si bien no podemos categorizar a \u00abChatGPT\u00bb como el fundador del auge de la IA, ciertamente podemos decir que actu\u00f3 como un catalizador.  Con \u00e9l surgieron competidores como Microsoft y Google, que se vieron obligados a participar en una carrera de IA para lanzar aplicaciones de IA generativa.<\/p>\n<p>Podr\u00edas decir, \u00bfd\u00f3nde entra NVIDIA aqu\u00ed?  La columna vertebral de la IA generativa implica largos per\u00edodos de entrenamiento LLM (Modelo de lenguaje grande), y las GPU de IA de NVIDIA entran en juego aqu\u00ed.  No vamos a entrar en especificaciones t\u00e9cnicas y detalles f\u00e1cticos, ya que eso hace que las cosas sean aburridas y no divertidas de leer.  Sin embargo, si desea conocer los detalles, presentamos una tabla a continuaci\u00f3n, que destaca cada lanzamiento de GPU AI de NVIDIA, que se remonta a los modelos Tesla.<\/p>\n<h2 id=\"tablepress-1222-name\" class=\"tablepress-table-name tablepress-table-name-id-1222\">GPU NVIDIA HPC\/IA<\/h2>\n<table id=\"tablepress-1222\" class=\"tablepress tablepress-id-1222 tablepress-responsive\" aria-labelledby=\"tablepress-1222-name\">\n<thead>\n<tr class=\"row-1 odd\">\n<th class=\"column-1\">Tarjeta gr\u00e1fica NVIDIA Tesla<\/th>\n<th class=\"column-2\">NVIDIA H100 (SMX5)<\/th>\n<th class=\"column-3\">NVIDIA H100 (PCIe)<\/th>\n<th class=\"column-4\">NVIDIA A100 (SXM4)<\/th>\n<th class=\"column-5\">NVIDIA A100 (PCIe4)<\/th>\n<th class=\"column-6\">Tesla V100S (PCIe)<\/th>\n<th class=\"column-7\">Tesla V100 (SXM2)<\/th>\n<th class=\"column-8\">Tesla P100 (SXM2)<\/th>\n<th class=\"column-9\">tesla p100<br \/>(PCI-Express)<\/th>\n<th class=\"column-10\">tesla m40<br \/>(PCI-Express)<\/th>\n<th class=\"column-11\">tesla k40<br \/>(PCI-Express)<\/th>\n<\/tr>\n<\/thead>\n<tbody class=\"row-hover\">\n<tr class=\"row-2 even\">\n<td class=\"column-1\">GPU<\/td>\n<td class=\"column-2\">GH100 (Tolva)<\/td>\n<td class=\"column-3\">GH100 (Tolva)<\/td>\n<td class=\"column-4\">GA100 (amperios)<\/td>\n<td class=\"column-5\">GA100 (amperios)<\/td>\n<td class=\"column-6\">GV100 (Voltaje)<\/td>\n<td class=\"column-7\">GV100 (Voltaje)<\/td>\n<td class=\"column-8\">GP100 (Pascales)<\/td>\n<td class=\"column-9\">GP100 (Pascales)<\/td>\n<td class=\"column-10\">GM200 (Maxwell)<\/td>\n<td class=\"column-11\">GK110 (Kepler)<\/td>\n<\/tr>\n<tr class=\"row-3 odd\">\n<td class=\"column-1\">Nodo de proceso<\/td>\n<td class=\"column-2\">4 nm<\/td>\n<td class=\"column-3\">4 nm<\/td>\n<td class=\"column-4\">7 nm<\/td>\n<td class=\"column-5\">7 nm<\/td>\n<td class=\"column-6\">12nm<\/td>\n<td class=\"column-7\">12nm<\/td>\n<td class=\"column-8\">16nm<\/td>\n<td class=\"column-9\">16nm<\/td>\n<td class=\"column-10\">28nm<\/td>\n<td class=\"column-11\">28nm<\/td>\n<\/tr>\n<tr class=\"row-4 even\">\n<td class=\"column-1\">transistores<\/td>\n<td class=\"column-2\">80 mil millones<\/td>\n<td class=\"column-3\">80 mil millones<\/td>\n<td class=\"column-4\">54,2 mil millones<\/td>\n<td class=\"column-5\">54,2 mil millones<\/td>\n<td class=\"column-6\">21.1 mil millones<\/td>\n<td class=\"column-7\">21.1 mil millones<\/td>\n<td class=\"column-8\">15,3 mil millones<\/td>\n<td class=\"column-9\">15,3 mil millones<\/td>\n<td class=\"column-10\">8 mil millones<\/td>\n<td class=\"column-11\">7.1 mil millones<\/td>\n<\/tr>\n<tr class=\"row-5 odd\">\n<td class=\"column-1\">Tama\u00f1o de matriz de GPU<\/td>\n<td class=\"column-2\">814 mm2<\/td>\n<td class=\"column-3\">814 mm2<\/td>\n<td class=\"column-4\">826mm2<\/td>\n<td class=\"column-5\">826mm2<\/td>\n<td class=\"column-6\">815 mm2<\/td>\n<td class=\"column-7\">815 mm2<\/td>\n<td class=\"column-8\">610 mm2<\/td>\n<td class=\"column-9\">610 mm2<\/td>\n<td class=\"column-10\">601 mm2<\/td>\n<td class=\"column-11\">551 mm2<\/td>\n<\/tr>\n<tr class=\"row-6 even\">\n<td class=\"column-1\">SMS<\/td>\n<td class=\"column-2\">132<\/td>\n<td class=\"column-3\">114<\/td>\n<td class=\"column-4\">108<\/td>\n<td class=\"column-5\">108<\/td>\n<td class=\"column-6\">80<\/td>\n<td class=\"column-7\">80<\/td>\n<td class=\"column-8\">56<\/td>\n<td class=\"column-9\">56<\/td>\n<td class=\"column-10\">24<\/td>\n<td class=\"column-11\">15<\/td>\n<\/tr>\n<tr class=\"row-7 odd\">\n<td class=\"column-1\">TPC<\/td>\n<td class=\"column-2\">66<\/td>\n<td class=\"column-3\">57<\/td>\n<td class=\"column-4\">54<\/td>\n<td class=\"column-5\">54<\/td>\n<td class=\"column-6\">40<\/td>\n<td class=\"column-7\">40<\/td>\n<td class=\"column-8\">28<\/td>\n<td class=\"column-9\">28<\/td>\n<td class=\"column-10\">24<\/td>\n<td class=\"column-11\">15<\/td>\n<\/tr>\n<tr class=\"row-8 even\">\n<td class=\"column-1\">N\u00facleos CUDA FP32 por SM<\/td>\n<td class=\"column-2\">128<\/td>\n<td class=\"column-3\">128<\/td>\n<td class=\"column-4\">64<\/td>\n<td class=\"column-5\">64<\/td>\n<td class=\"column-6\">64<\/td>\n<td class=\"column-7\">64<\/td>\n<td class=\"column-8\">64<\/td>\n<td class=\"column-9\">64<\/td>\n<td class=\"column-10\">128<\/td>\n<td class=\"column-11\">192<\/td>\n<\/tr>\n<tr class=\"row-9 odd\">\n<td class=\"column-1\">N\u00facleos CUDA FP64 \/ SM<\/td>\n<td class=\"column-2\">128<\/td>\n<td class=\"column-3\">128<\/td>\n<td class=\"column-4\">32<\/td>\n<td class=\"column-5\">32<\/td>\n<td class=\"column-6\">32<\/td>\n<td class=\"column-7\">32<\/td>\n<td class=\"column-8\">32<\/td>\n<td class=\"column-9\">32<\/td>\n<td class=\"column-10\">4<\/td>\n<td class=\"column-11\">64<\/td>\n<\/tr>\n<tr class=\"row-10 even\">\n<td class=\"column-1\">N\u00facleos CUDA FP32<\/td>\n<td class=\"column-2\">16896<\/td>\n<td class=\"column-3\">14592<\/td>\n<td class=\"column-4\">6912<\/td>\n<td class=\"column-5\">6912<\/td>\n<td class=\"column-6\">5120<\/td>\n<td class=\"column-7\">5120<\/td>\n<td class=\"column-8\">3584<\/td>\n<td class=\"column-9\">3584<\/td>\n<td class=\"column-10\">3072<\/td>\n<td class=\"column-11\">2880<\/td>\n<\/tr>\n<tr class=\"row-11 odd\">\n<td class=\"column-1\">N\u00facleos CUDA FP64<\/td>\n<td class=\"column-2\">16896<\/td>\n<td class=\"column-3\">14592<\/td>\n<td class=\"column-4\">3456<\/td>\n<td class=\"column-5\">3456<\/td>\n<td class=\"column-6\">2560<\/td>\n<td class=\"column-7\">2560<\/td>\n<td class=\"column-8\">1792<\/td>\n<td class=\"column-9\">1792<\/td>\n<td class=\"column-10\">96<\/td>\n<td class=\"column-11\">960<\/td>\n<\/tr>\n<tr class=\"row-12 even\">\n<td class=\"column-1\">N\u00facleos tensoriales<\/td>\n<td class=\"column-2\">528<\/td>\n<td class=\"column-3\">456<\/td>\n<td class=\"column-4\">432<\/td>\n<td class=\"column-5\">432<\/td>\n<td class=\"column-6\">640<\/td>\n<td class=\"column-7\">640<\/td>\n<td class=\"column-8\">N \/ A<\/td>\n<td class=\"column-9\">N \/ A<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-13 odd\">\n<td class=\"column-1\">Unidades de textura<\/td>\n<td class=\"column-2\">528<\/td>\n<td class=\"column-3\">456<\/td>\n<td class=\"column-4\">432<\/td>\n<td class=\"column-5\">432<\/td>\n<td class=\"column-6\">320<\/td>\n<td class=\"column-7\">320<\/td>\n<td class=\"column-8\">224<\/td>\n<td class=\"column-9\">224<\/td>\n<td class=\"column-10\">192<\/td>\n<td class=\"column-11\">240<\/td>\n<\/tr>\n<tr class=\"row-14 even\">\n<td class=\"column-1\">Reloj de impulso<\/td>\n<td class=\"column-2\">Por determinar<\/td>\n<td class=\"column-3\">Por determinar<\/td>\n<td class=\"column-4\">1410 MHz<\/td>\n<td class=\"column-5\">1410 MHz<\/td>\n<td class=\"column-6\">1601 MHz<\/td>\n<td class=\"column-7\">1530 MHz<\/td>\n<td class=\"column-8\">1480 MHz<\/td>\n<td class=\"column-9\">1329MHz<\/td>\n<td class=\"column-10\">1114 MHz<\/td>\n<td class=\"column-11\">875 MHz<\/td>\n<\/tr>\n<tr class=\"row-15 odd\">\n<td class=\"column-1\">TOP (DNN\/AI)<\/td>\n<td class=\"column-2\">3958 tops<\/td>\n<td class=\"column-3\">3200 TOP<\/td>\n<td class=\"column-4\">1248 tapas<br \/>2496 TOP con escasez<\/td>\n<td class=\"column-5\">1248 tapas<br \/>2496 TOP con escasez<\/td>\n<td class=\"column-6\">130 TOP<\/td>\n<td class=\"column-7\">125 TOPS<\/td>\n<td class=\"column-8\">N \/ A<\/td>\n<td class=\"column-9\">N \/ A<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-16 even\">\n<td class=\"column-1\">C\u00f3mputo FP16<\/td>\n<td class=\"column-2\">1979 TFLOP<\/td>\n<td class=\"column-3\">1600 TFLOP<\/td>\n<td class=\"column-4\">312 TFLOP<br \/>624 TFLOP con escasez<\/td>\n<td class=\"column-5\">312 TFLOP<br \/>624 TFLOP con escasez<\/td>\n<td class=\"column-6\">32,8 TFLOP<\/td>\n<td class=\"column-7\">30,4 TFLOP<\/td>\n<td class=\"column-8\">21,2 TFLOP<\/td>\n<td class=\"column-9\">18,7 TFLOP<\/td>\n<td class=\"column-10\">N \/ A<\/td>\n<td class=\"column-11\">N \/ A<\/td>\n<\/tr>\n<tr class=\"row-17 odd\">\n<td class=\"column-1\">C\u00f3mputo FP32<\/td>\n<td class=\"column-2\">67 TFLOP<\/td>\n<td class=\"column-3\">800 TFLOP<\/td>\n<td class=\"column-4\">156 TFLOP<br \/>(19,5 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-5\">156 TFLOP<br \/>(19,5 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-6\">16.4 TFLOP<\/td>\n<td class=\"column-7\">15,7 TFLOP<\/td>\n<td class=\"column-8\">10,6 TFLOP<\/td>\n<td class=\"column-9\">10,0 TFLOP<\/td>\n<td class=\"column-10\">6.8 TFLOP<\/td>\n<td class=\"column-11\">5.04 TFLOP<\/td>\n<\/tr>\n<tr class=\"row-18 even\">\n<td class=\"column-1\">C\u00f3mputo FP64<\/td>\n<td class=\"column-2\">34 TFLOP<\/td>\n<td class=\"column-3\">48 TFLOP<\/td>\n<td class=\"column-4\">19,5 TFLOP<br \/>(9,7 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-5\">19,5 TFLOP<br \/>(9,7 TFLOP est\u00e1ndar)<\/td>\n<td class=\"column-6\">8.2 TFLOP<\/td>\n<td class=\"column-7\">7,80 TFLOP<\/td>\n<td class=\"column-8\">5,30 TFLOP<\/td>\n<td class=\"column-9\">4.7 TFLOP<\/td>\n<td class=\"column-10\">0,2 TFLOP<\/td>\n<td class=\"column-11\">1,68 TFLOP<\/td>\n<\/tr>\n<tr class=\"row-19 odd\">\n<td class=\"column-1\">interfaz de memoria<\/td>\n<td class=\"column-2\">HBM3 de 5120 bits<\/td>\n<td class=\"column-3\">HBM2e de 5120 bits<\/td>\n<td class=\"column-4\">HBM2e de 6144 bits<\/td>\n<td class=\"column-5\">HBM2e de 6144 bits<\/td>\n<td class=\"column-6\">HBM2 de 4096 bits<\/td>\n<td class=\"column-7\">HBM2 de 4096 bits<\/td>\n<td class=\"column-8\">HBM2 de 4096 bits<\/td>\n<td class=\"column-9\">HBM2 de 4096 bits<\/td>\n<td class=\"column-10\">GDDR5 de 384 bits<\/td>\n<td class=\"column-11\">GDDR5 de 384 bits<\/td>\n<\/tr>\n<tr class=\"row-20 even\">\n<td class=\"column-1\">Tama\u00f1o de la memoria<\/td>\n<td class=\"column-2\">Hasta 80 GB HBM3 a 3,0 Gbps<\/td>\n<td class=\"column-3\">Hasta 80 GB HBM2e a 2,0 Gbps<\/td>\n<td class=\"column-4\">Hasta 40 GB HBM2 a 1,6 TB\/s<br \/>Hasta 80 GB HBM2 a 1,6 TB\/s<\/td>\n<td class=\"column-5\">Hasta 40 GB HBM2 a 1,6 TB\/s<br \/>Hasta 80 GB HBM2 a 2,0 TB\/s<\/td>\n<td class=\"column-6\">16 GB HBM2 a 1134 GB\/s<\/td>\n<td class=\"column-7\">16 GB HBM2 a 900 GB\/s<\/td>\n<td class=\"column-8\">16 GB HBM2 a 732 GB\/s<\/td>\n<td class=\"column-9\">16 GB HBM2 a 732 GB\/s<br \/>12 GB HBM2 a 549 GB\/s<\/td>\n<td class=\"column-10\">24 GB GDDR5 a 288 GB\/s<\/td>\n<td class=\"column-11\">12 GB GDDR5 a 288 GB\/s<\/td>\n<\/tr>\n<tr class=\"row-21 odd\">\n<td class=\"column-1\">Tama\u00f1o de cach\u00e9 L2<\/td>\n<td class=\"column-2\">51200 KB<\/td>\n<td class=\"column-3\">51200 KB<\/td>\n<td class=\"column-4\">40960KB<\/td>\n<td class=\"column-5\">40960KB<\/td>\n<td class=\"column-6\">6144KB<\/td>\n<td class=\"column-7\">6144KB<\/td>\n<td class=\"column-8\">4096KB<\/td>\n<td class=\"column-9\">4096KB<\/td>\n<td class=\"column-10\">3072KB<\/td>\n<td class=\"column-11\">1536KB<\/td>\n<\/tr>\n<tr class=\"row-22 even\">\n<td class=\"column-1\">TDP<\/td>\n<td class=\"column-2\">700W<\/td>\n<td class=\"column-3\">350W<\/td>\n<td class=\"column-4\">400W<\/td>\n<td class=\"column-5\">250W<\/td>\n<td class=\"column-6\">250W<\/td>\n<td class=\"column-7\">300W<\/td>\n<td class=\"column-8\">300W<\/td>\n<td class=\"column-9\">250W<\/td>\n<td class=\"column-10\">250W<\/td>\n<td class=\"column-11\">235W<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p><!-- #tablepress-1222 from cache --><\/p>\n<p>La pregunta a\u00fan no se responde aqu\u00ed, \u00bfpor qu\u00e9 los H100?  Bueno, estamos llegando all\u00ed.  El H100 de NVIDIA es la oferta de gama m\u00e1s alta de la empresa y proporciona inmensas capacidades inform\u00e1ticas.  Se podr\u00eda argumentar que el aumento en el rendimiento genera costos m\u00e1s altos, pero las empresas tienden a ordenar grandes vol\u00famenes, y el \u00abrendimiento por vatio\u00bb es la prioridad aqu\u00ed.  En comparaci\u00f3n con el A100, el Hopper \u00abH100\u00bb ofrece 3,5 veces m\u00e1s inferencia de 16 bits y 2,3 veces m\u00e1s rendimiento de entrenamiento de 16 bits, lo que lo convierte en la elecci\u00f3n obvia.<\/p>\n<figure class=\"story-gallery\">\n<div class=\"swiper-container\">\n<div class=\"swiper-wrapper\">\n<div class=\"swiper-slide\" data-src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/Screen-Shot-2022-03-21-at-11.08.18-AM-1456x783.webp\" data-sub-html=\"\"><\/div>\n<div class=\"swiper-slide\" data-src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/Perf-Main-FINAL-625x264-1.jpg\" data-sub-html=\"\"><img decoding=\"async\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/Perf-Main-FINAL-625x264-1.jpg 2x, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/Perf-Main-FINAL-625x264-1.jpg 1x\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/Perf-Main-FINAL-625x264-1-564x238.jpg\" alt=\"perf-main-final-625x264\"\/><\/div>\n<\/div>\n<\/div>\n<\/figure>\n<p>As\u00ed que ahora, esperamos que la superioridad de la GPU H100 sea evidente aqu\u00ed.  Ahora, pasando a nuestro siguiente segmento, \u00bfpor qu\u00e9 hay escasez?  La respuesta a esto involucra varios aspectos, el primero son los grandes vol\u00famenes de H100 necesarios para entrenar un solo modelo.  Un hecho sorprendente es que el modelo de IA GPT-4 de OpenAI requer\u00eda alrededor de 10 000 a 25 000 GPU A100 (en ese momento, las H100 no se lanzaron).<\/p>\n<p>Las nuevas empresas modernas de IA, como Inflection AI y CoreWeave, han adquirido cantidades enormes de H100, con un valor total contabilizado en miles de millones de d\u00f3lares.  Esto demuestra que una sola empresa requiere grandes vol\u00famenes, incluso para entrenar un modelo de IA de b\u00e1sico a decente, por lo que la demanda ha sido tremenda.<\/p>\n<figure><img decoding=\"async\" loading=\"lazy\" class=\"alignnone wp-image-1335891 size-full\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image.jpg\" alt=\"GPU H100 de NVIDIA y The AI \u200b\u200bFrenzy;  un resumen de la situaci\u00f3n actual 2\" width=\"1600\" height=\"900\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image.jpg 1600w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-265x149.jpg 265w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-740x416.jpg 740w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-768x432.jpg 768w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-1536x864.jpg 1536w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-530x298.jpg 530w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-1480x833.jpg 1480w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2022\/03\/Hopper-Arch-H100-SXM-Image-1030x579.jpg 1030w\" sizes=\"(max-width: 1600px) 100vw, 1600px\"\/><\/figure>\n<p>Si cuestiona el enfoque de NVIDIA, se puede decir: \u00abNVIDIA podr\u00eda aumentar la producci\u00f3n para hacer frente a la demanda\u00bb.  Decir esto es mucho m\u00e1s f\u00e1cil que implementarlo realmente.  A diferencia de las GPU para juegos, las GPU NVIDIA AI requieren procesos extensos, con la mayor parte de la fabricaci\u00f3n asignada al gigante de semiconductores taiwan\u00e9s TSMC.  TSMC es el proveedor exclusivo de la GPU AI de NVIDIA y lidera todas las etapas, desde la adquisici\u00f3n de obleas hasta el empaquetado avanzado.<\/p>\n<p>Las GPU H100 se basan en el proceso 4N de TSMC, una versi\u00f3n renovada de la familia de 5 nm.  NVIDIA es el principal cliente de este proceso, ya que Apple lo utiliz\u00f3 anteriormente para su conjunto de chips bi\u00f3nico A15, pero A16 Bionic lo reemplaz\u00f3.  De todos los pasos relevantes, la producci\u00f3n de la memoria HBM es la m\u00e1s complicada, ya que involucra equipos sofisticados que actualmente utilizan algunos fabricantes.<\/p>\n<figure>\n<div class=\"wp-lightbox\"><img decoding=\"async\" loading=\"lazy\" class=\"wp-image-1455365 size-full\" src=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/CoWoS-R_01.png\" alt=\"\" width=\"1200\" height=\"536\" srcset=\"https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/CoWoS-R_01.png 1200w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/CoWoS-R_01-564x252.png 564w, https:\/\/cdn.wccftech.com\/wp-content\/uploads\/2023\/08\/CoWoS-R_01-728x325.png 728w\" sizes=\"(max-width: 1200px) 100vw, 1200px\"\/><\/div><figcaption>CoWos Packaging utilizado en NVIDIA H100<\/figcaption><\/figure>\n<p>Los proveedores de HBM incluyen a SK Hynix, Micron y Samsung, mientras que TSMC ha limitado sus proveedores y no sabemos qui\u00e9nes son.  Sin embargo, aparte de HBM, TSMC tambi\u00e9n enfrenta problemas para mantener la capacidad CoWoS (Chip-on-Wafer-on-Substrate), un proceso de empaquetado 2.5D y una etapa crucial en el desarrollo de H100.  TSMC no puede igualar la demanda de NVIDIA, debido a que la acumulaci\u00f3n de pedidos ha alcanzado nuevas alturas, retras\u00e1ndose hasta diciembre.<\/p>\n<blockquote>\n<p>Entonces, cuando las personas usan la palabra escasez de GPU, se refieren a la escasez o la acumulaci\u00f3n de alg\u00fan componente en la placa, no a la GPU en s\u00ed.  Es solo una fabricaci\u00f3n mundial limitada de estas cosas&#8230; pero pronosticamos lo que la gente quiere y lo que el mundo puede construir.<\/p>\n<p>-Charlie Doyle, vicepresidente y gerente general de DGX de NVIDIA (a trav\u00e9s de Computerbase.de)<\/p>\n<\/blockquote>\n<p>Hemos omitido muchos detalles, pero entrar en detalles se desviar\u00e1 de nuestro objetivo principal, que es detallar la situaci\u00f3n a un usuario promedio.  Si bien, por ahora, no creemos que la escasez pueda reducirse y, a su vez, se espera que aumente.  Sin embargo, podr\u00edamos ver un cambio de panorama aqu\u00ed despu\u00e9s de la decisi\u00f3n de AMD de consolidar su posici\u00f3n en el mercado de IA.<\/p>\n<p>DigiTimes informa que \u00abTSMC parece ser particularmente optimista sobre la demanda de la pr\u00f3xima serie Instinct MI300 de AMD, diciendo que ser\u00e1 la mitad de la producci\u00f3n total de chips empaquetados CoWoS de Nvidia\u00bb. Puede distribuir la carga de trabajo entre las empresas.  A\u00fan as\u00ed, a juzgar por las pol\u00edticas codiciosas del Team Green en el pasado, algo como esto requerir\u00eda una oferta severa de AMD.<\/p>\n<p>Resumiendo nuestra charla, las GPU H100 de NVIDIA est\u00e1n llevando la moda de la IA a nuevas alturas, raz\u00f3n por la cual las rodea este frenes\u00ed.  Nuestro objetivo era concluir nuestra charla dando a los lectores una idea general de todo el escenario.  Cr\u00e9ditos a GPU Utilis por la idea detr\u00e1s de este art\u00edculo;  aseg\u00farese de mirar su informe tambi\u00e9n.<\/p>\n<p class=\"source\">Fuente de noticias: GPU Utilis<\/p>\n<div class=\"story-share-bottom\" data-nosnippet=\"\">\n<p>\t\t\t\tComparte esta historia<\/p>\n<p><svg width=\"20\" height=\"20\"><use xlink:href=\"#icn-shareFacebook\"\/><\/svg>  Facebook<\/p>\n<p><svg width=\"20\" height=\"20\"><use xlink:href=\"#icn-shareTwitter\"\/><\/svg>  Gorjeo<\/p>\n<\/p><\/div>\n<\/p><\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-29 <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Todos somos muy conscientes de NVIDIA y la \u00abmina de oro\u00bb de la IA que recientemente ha conquistado a todos. En medio de todo, se encuentran las GPU H100 AI&hellip;<\/p>\n","protected":false},"author":1,"featured_media":761332,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[5649,26070,4256,38730,843,4167,5213],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/761331"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=761331"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/761331\/revisions"}],"predecessor-version":[{"id":761333,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/761331\/revisions\/761333"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/761332"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=761331"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=761331"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=761331"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}