Tachyum – Magazine Office https://magazineoffice.com Vida sana, belleza, familia y artículos de actualidad. Wed, 16 Aug 2023 20:03:48 +0000 es hourly 1 https://wordpress.org/?v=6.5.4 El chip Tachyum Prodigy ahora tiene 192 núcleos universales https://magazineoffice.com/el-chip-tachyum-prodigy-ahora-tiene-192-nucleos-universales/ https://magazineoffice.com/el-chip-tachyum-prodigy-ahora-tiene-192-nucleos-universales/#respond Wed, 16 Aug 2023 20:03:42 +0000 https://magazineoffice.com/el-chip-tachyum-prodigy-ahora-tiene-192-nucleos-universales/

Esta semana, Tachyum dijo que mediante el uso de las últimas herramientas de automatización de diseño electrónico (EDA, por sus siglas en inglés) logró exprimir un 50 % más de núcleos en su procesador Prodigy mientras aumentaba el tamaño del troquel en solo un 20 %. El chip de 192 núcleos no parece existir en silicio a partir de ahora y la compañía no compartió cuándo planea comenzar su muestreo o enviar estos procesadores a las partes interesadas.

El año pasado, Tachyum demandó a Cadence por proporcionar IP que no cumplía con sus expectativas y tuvo que cambiar a IP de otro proveedor o proveedores. Debido a esto, también tuvo que cambiar las herramientas de diseño y simulación RTL. La empresa no reveló qué herramientas EDA utiliza para el desarrollo de Prodigy, pero afirma que el nuevo conjunto de programas le permitió modificar varios parámetros, lo que resultó en un aumento del 50 % en el número de núcleos (de 128 a 192), aumento de L2/L3 caché de 128 MB a 192 MB y un salto en SERDES de 64 a 96 por chip. El tamaño del troquel del procesador aumentó de 500 mm2 a 600 mm2, o alrededor de un 20 %.



Source link-41

]]>
https://magazineoffice.com/el-chip-tachyum-prodigy-ahora-tiene-192-nucleos-universales/feed/ 0
La CPU Prodigy de Tachyum se actualizó a 192 núcleos gracias a las nuevas herramientas EDA https://magazineoffice.com/la-cpu-prodigy-de-tachyum-se-actualizo-a-192-nucleos-gracias-a-las-nuevas-herramientas-eda/ https://magazineoffice.com/la-cpu-prodigy-de-tachyum-se-actualizo-a-192-nucleos-gracias-a-las-nuevas-herramientas-eda/#respond Tue, 15 Aug 2023 21:52:46 +0000 https://magazineoffice.com/la-cpu-prodigy-de-tachyum-se-actualizo-a-192-nucleos-gracias-a-las-nuevas-herramientas-eda/

Tachyum ha actualizado las especificaciones de su CPU Prodigy HPC en un 50 %, lo que fue posible con la ayuda de las nuevas herramientas EDA.

La CPU Prodigy de Tachyum ahora mejor que nunca (en papel), actualizada a 192 núcleos

En su último comunicado, Tachyum confirma que al utilizar las herramientas EDA más recientes, la empresa logró un gran aumento de especificaciones para su CPU Prodigy. El Procesador Universal, que originalmente se suponía que contaría con 128 núcleos, ahora tiene 64 núcleos adicionales, lo que representa un aumento del 50 % con respecto al diseño original y se redondea a un total de 192 núcleos.

La empresa afirma que con las nuevas herramientas EDAA, el número de SERDES también pasó de 64 a 96 por chip. Esto aumentó el tamaño de la matriz de 500 mm2 a 600 mm2, pero eso es un aumento marginal del 20 %. La CPU Prodigy también puede albergar núcleos adicionales al chip Prodigy que aún encajarían dentro del límite de retícula de 858 mm2, pero luego el chip se convertiría en el límite de ancho de banda. El chip ya ejecuta una interfaz de memoria DDR5 de 16 canales con velocidades de 7200 MT/s y más, por lo que los núcleos adicionales definitivamente necesitarán un estándar de memoria mucho mejor.

Fuente de la imagen: Taquium

Tal vez la memoria HBM3 integrada se convierta en el siguiente paso lógico para los futuros diseños de Prodigy. Pero también hay otras mejoras que provienen de las últimas herramientas que no solo se limitan a la cantidad de núcleos. El caché L2 y L3 también se aumentó de 128 MB a 192 MB y los otros cambios incluyen:

  • Aumento del 50 % en el número de núcleos de 128 a 192
  • Aumento de la memoria caché L2/L3 del chip de 128 MB a 192 MB
  • Soporte de memoria DDR5 7200 además de DDR5 6400
  • Más velocidad con 1 DIMM por canal
  • El paquete más grande admite 32 enlaces seriales adicionales y hasta 32 DIMM conectados a un solo chip Prodigy

Prodigy es una CPU universal en el sentido de que puede cambiar de las cargas de trabajo tradicionales de HPC a las cargas de trabajo de IA/ML, que será un área clave a la que apuntará Tachyum. La compañía ya afirma algunos números realmente grandes, como las CPU Prodigy que ofrecen 4 veces el rendimiento de las CPU x86 de mayor rendimiento de la actualidad (para cargas de trabajo en la nube) y 3 veces el rendimiento de las GPU de mayor rendimiento en HPC y 6 veces en cargas de trabajo de IA. Se dice que los primeros chips se entregarán a fines de 2023, por lo que pronto sabremos si Tacyum puede alcanzar sus objetivos de rendimiento.

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/la-cpu-prodigy-de-tachyum-se-actualizo-a-192-nucleos-gracias-a-las-nuevas-herramientas-eda/feed/ 0
Tachyum reclama la potencia de múltiples exaflops y zettaflops en las próximas supercomputadoras a pesar del retraso del chip https://magazineoffice.com/tachyum-reclama-la-potencia-de-multiples-exaflops-y-zettaflops-en-las-proximas-supercomputadoras-a-pesar-del-retraso-del-chip/ https://magazineoffice.com/tachyum-reclama-la-potencia-de-multiples-exaflops-y-zettaflops-en-las-proximas-supercomputadoras-a-pesar-del-retraso-del-chip/#respond Sun, 16 Apr 2023 22:14:44 +0000 https://magazineoffice.com/tachyum-reclama-la-potencia-de-multiples-exaflops-y-zettaflops-en-las-proximas-supercomputadoras-a-pesar-del-retraso-del-chip/

Tachyum ha revelado planes para sus futuras supercomputadoras que se espera que ofrezcan varios Exaflops de rendimiento informático a pesar del retraso del chip.

Tachyum revela nuevos diseños de supercomputadoras 20 Exa-Flop y 10 AI Zetta-Flop, que ofrecen hasta 30 veces los objetivos de rendimiento esperados del Departamento de Energía de los Estados Unidos

El programa de Proyectos Importantes de Intereses Europeos Comunes (IPCEI) para Eslovaquia seleccionó el chip Tachyum Prodigy 2 para ayudar con la computación de alto rendimiento (HPC) de exaescala y la inteligencia artificial (IA) de escala zetta para su financiación en Europa. La Comisión Europea también ha aprobado la supercomputadora de 26,4 millones EUR de la empresa en financiación y está a la espera del proceso de notificación finalizado.

Los diseños de referencia de Tachyum se basan en los sistemas, los equipos de ingeniería y los desarrollos de la empresa para transformar los centros de datos y las supercomputadoras en centros de cómputo más universales, lo que permite cargas de trabajo a gran escala y más altas que utilizan HPC e IA para procesar simultáneamente y dentro de la misma familia arquitectónica. Los diseños esperados estarán disponibles en 2025.

Prodigy ofrece rendimiento, potencia y economía de centro de datos sin precedentes, lo que reduce significativamente los gastos de capital y los gastos operativos. Debido a su utilidad tanto para aplicaciones de línea de negocio como de alto rendimiento, los servidores de centro de datos con tecnología Prodigy pueden cambiar de manera fluida y dinámica entre cargas de trabajo, lo que elimina la necesidad de un costoso hardware de IA dedicado y aumenta drásticamente la utilización del servidor. Prodigy de Tachyum integra 128 núcleos de cómputo de 64 bits de diseño personalizado y alto rendimiento para ofrecer hasta 4 veces más procesadores x86 de mayor rendimiento para cargas de trabajo en la nube, hasta 3 veces más que la GPU de mayor rendimiento para HPC y 6 veces más para aplicaciones de IA.

Se espera que los diseños de supercomputadoras de Tachyum produzcan 20 EXAFLOPS de rendimiento vectorial FP64, la parte superior del objetivo del Departamento de Energía, y dentro de la envolvente de energía de 60 MW dentro de un área de 6,000 pies cuadrados.

Fuente de la imagen: Taquium.

Esta supercomputadora también producirá más de 10 ZETAFLOPS de rendimiento de IA, lo que supera el objetivo del DOE en 30 veces el objetivo esperado. Se puede lograr un rendimiento de FP64 de hasta 25 EXAFLOPS dentro de la misma área, dependiendo de la flexibilidad de la envolvente de energía. La compañía ha estado reclamando grandes números de rendimiento contra los procesadores escalables H100 e Intel 3rd Gen Xeon de NVIDIA, pero todavía no ha salido nada en forma física.

Tachyum ofrece soluciones de vanguardia, desde silicio hasta sistemas completos para abordar las demandas cada vez mayores tanto de HPC como de IA. Las supercomputadoras diseñadas por Tachyum impulsan la vanguardia del rendimiento de HPC mientras cruzan la barrera de la escala zetta para la IA, transformando los centros de datos en centros informáticos universales.

— Radoslav Danilak, fundador y director ejecutivo, Tachyum

Los centros de datos Prodigy 2 contienen nuevas generaciones de infraestructura que se producen para redes y almacenamiento para emplear la tecnología más avanzada de la industria al tiempo que garantiza que todo el clúster funcione con la máxima eficiencia y rendimiento.

Si desea saber más sobre Tachyum y los diseños de centros de datos de la compañía para computación de alto rendimiento e IA, puede leer más sobre el chip aquí, del que la compañía habló por última vez en octubre, pero no se ha sabido nada de producción desde entonces. entonces.

Fuente de noticias: Taquium

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/tachyum-reclama-la-potencia-de-multiples-exaflops-y-zettaflops-en-las-proximas-supercomputadoras-a-pesar-del-retraso-del-chip/feed/ 0
Las primeras CPU de Tachyum llegan tarde, pero planea 20 supercomputadoras ExaFLOPS con CPU de próxima generación de todos modos https://magazineoffice.com/las-primeras-cpu-de-tachyum-llegan-tarde-pero-planea-20-supercomputadoras-exaflops-con-cpu-de-proxima-generacion-de-todos-modos/ https://magazineoffice.com/las-primeras-cpu-de-tachyum-llegan-tarde-pero-planea-20-supercomputadoras-exaflops-con-cpu-de-proxima-generacion-de-todos-modos/#respond Fri, 14 Apr 2023 13:49:43 +0000 https://magazineoffice.com/las-primeras-cpu-de-tachyum-llegan-tarde-pero-planea-20-supercomputadoras-exaflops-con-cpu-de-proxima-generacion-de-todos-modos/

Durante tres años, Tachyum ha promocionado su procesador universal Prodigy con la promesa de que sería mejor que las CPU y GPU de AMD, Intel y Nvidia. Sin embargo, el chip aún no está en producción a pesar de que originalmente se proyectó que estaría en producción de volumen completo en 2021. Ahora parece que la compañía está mirando hacia el futuro y promocionando su diseño de supercomputadora basado en Prodigy 2 que promete un rendimiento de 20 ExaFLOPS en 2025. ~ 2026.

El diseño de la supercomputadora de Tachyum está destinado a ofrecer un rendimiento de 20 FP64 vector ExaFLOPS y 10 AI (INT8 o FP8) ZetaFLOPS dentro de un objetivo de potencia de 60MW en una superficie de 6,000 pies cuadrados en 2025, dijo la compañía. La máquina usará 64 gabinetes basados ​​en Prodigy 2 y 16 bastidores de almacenamiento, pero Tachyum hizo cuántos procesadores Prodigy 2 necesitaría para brindar tanto rendimiento.

Tachyum también dijo que podría construir una supercomputadora que ofrezca 24.9 FP64 vector ExaFLOPS y 13.27 AI ZettaFLOPS que consuman 73.8MW. Para poner el número en contexto, la próxima supercomputadora El Capitan con tecnología de APU de centro de datos Instinct MI300 de AMD está configurada para entregar alrededor de 2 FP64 ExaFLOPS.

(Crédito de la imagen: Taquium)

El año pasado, el Departamento de Energía de EE. UU. expresó su interés en adquirir una supercomputadora 20 ExaFLOPS con un consumo de energía de 20MW-60MW para 2025. Tachyum dijo que había presentado una propuesta para construir dicho sistema para 2025, pero no dio más detalles. Dado que el Prodigy original de la empresa no cumplió con los objetivos de rendimiento de Tachyum (razón por la cual demandó a Cadence), era razonable suponer que la empresa usaría su Prodigy de segunda generación (del que la empresa había hablado antes) para la máquina.



Source link-41

]]>
https://magazineoffice.com/las-primeras-cpu-de-tachyum-llegan-tarde-pero-planea-20-supercomputadoras-exaflops-con-cpu-de-proxima-generacion-de-todos-modos/feed/ 0
Tachyum publica el informe técnico del procesador universal Prodigy: hasta 6 veces más rápido que NVIDIA H100 y 30 veces más rápido que Intel Xeon 8380, disponible en la segunda mitad de 2023 https://magazineoffice.com/tachyum-publica-el-informe-tecnico-del-procesador-universal-prodigy-hasta-6-veces-mas-rapido-que-nvidia-h100-y-30-veces-mas-rapido-que-intel-xeon-8380-disponible-en-la-segunda-mitad-de-2023/ https://magazineoffice.com/tachyum-publica-el-informe-tecnico-del-procesador-universal-prodigy-hasta-6-veces-mas-rapido-que-nvidia-h100-y-30-veces-mas-rapido-que-intel-xeon-8380-disponible-en-la-segunda-mitad-de-2023/#respond Thu, 06 Oct 2022 02:16:35 +0000 https://magazineoffice.com/tachyum-publica-el-informe-tecnico-del-procesador-universal-prodigy-hasta-6-veces-mas-rapido-que-nvidia-h100-y-30-veces-mas-rapido-que-intel-xeon-8380-disponible-en-la-segunda-mitad-de-2023/

Tachyum ha publicado oficialmente el documento técnico de su Procesador Universal Prodigy de 5 nm que se presentó en 2018.

Tachyum promete grandes cifras en el informe técnico del procesador universal Prodigy de 5 nm, hasta 9 veces mayor eficiencia de rendimiento que el H100 de NVIDIA

Las CPU Tachyum Prodigy utilizan un diseño de procesador universal, lo que significa que pueden ejecutar tareas de CPU, GPU y TPU en el mismo chip, lo que ahorra costos en comparación con los productos de la competencia y también ofrece un rendimiento realmente alto.

La compañía tiene como objetivo abordar a los tres gigantes de chips, AMD, Intel y NVIDIA con su línea Prodigy y en sus presentaciones, Tachyum ha estimado un aumento del rendimiento de 4x sobre las CPU Xeon de Intel, en el frente de HPC, un aumento de 3x sobre H100 de NVIDIA y un aumento de 6x aumento del rendimiento bruto en cargas de trabajo de IA e inferencia. También se dice que los chips ofrecen más de 10 veces el rendimiento de los sistemas de la competencia con la misma potencia. Algunas de las características principales de las CPU incluyen:

  • 128 núcleos unificados de 64 bits de alto rendimiento que funcionan hasta 5,7 GHz
  • 16 controladores de memoria DDR5
  • 64 carriles PCIe 5.0
  • Compatibilidad con multiprocesador para plataformas de 4 y 2 zócalos
  • Soluciones de rack para centros de datos refrigerados por aire y refrigerados por líquido
  • SPECrate 2017 Rendimiento entero de alrededor de 4x Intel 8380 y alrededor de 3x AMD 7763HPC
  • El rendimiento de punto flotante de doble precisión es 3x NVIDIA H100
  • El rendimiento de AI FP8 es 6x NVIDIA H100

Tachyum ahora ha publicado el documento técnico completo de su procesador universal Prodigy que detalla la arquitectura, la plataforma y la línea de CPU, que escalará desde la CPU de 32 núcleos T8232-LP de bajo consumo a 180 W TDP, hasta el buque insignia T16128- AIX, que cuenta con un total de 128 núcleos.

Tachyum Prodigy Universal CPU Architecture – Diseño personalizado de 64 bits

Tachyum Prodigy utiliza una arquitectura OOD (fuera de servicio) que puede descodificar y retirar hasta 8 instrucciones por reloj, emitir hasta 11 instrucciones por reloj, con una cola de instrucciones que admite hasta 48 instrucciones y un programador que admite 12 colas con 15 entradas de profundidad. Viene con cuatro ALU, una unidad de carga, una unidad de almacenamiento, una unidad de carga/almacenamiento, una unidad de máscara y dos unidades vectoriales de 1024 bits. Cada núcleo también tiene un subsistema de IA que incluye una unidad de matriz de 4096 bits. Cada núcleo es un diseño de hardware de un solo subproceso.

En cuanto a la configuración de caché, cada núcleo incluye 64 KB I-Cache y 64 KB D-Cache con ECC SECDED. Cada núcleo también tiene 1 MB de L2 con corrección de errores doble ECC y detección de errores triples DECTED. Los núcleos activos también pueden agruparse en la memoria caché L2 desde núcleos de CPU inactivos para actuar como una memoria caché L3 compartida.

Prodigy emplea un protocolo de coherencia innovador, T-MESI (Tachyum-MESI), que se basa en MESI. T-MESI agrega optimizaciones que mejoran el MESI estándar que mejoran la latencia y el rendimiento. Además de la coherencia de caché en el chip, Prodigy también es compatible con la coherencia de hardware entre los dispositivos Prodigy, lo que permite que las plataformas de 2 y 4 zócalos sean totalmente coherentes. La coherencia de hardware de Prodigy utiliza ocho carriles dúplex completos de enlaces SERDES de 112 gigabits por segundo entre cada conjunto de dispositivos coherentes, lo que proporciona un ancho de banda agregado de 1,8 terabits por segundo entre dispositivos coherentes.

El TLB de Prodigy puede contener grandes espacios de memoria para HPC, hasta 128 TB. La MMU está administrada por hardware para obtener el máximo rendimiento e incluye un sofisticado mecanismo de purga global.

Unidades vectoriales y matriciales

Los subsistemas vectoriales de 2 x 1024 bits de Prodigy tienen el doble del tamaño de Intel y el cuádruple del tamaño de los procesadores de gama alta de AMD. La unidad de matriz 4096 de Prodigy admite operaciones de 16 x 16, 8 x 8 y 4 x 4. Los subsistemas vectoriales y matriciales admiten una amplia gama de tipos de datos, incluidos FP64, FP32, TF32, BF16, Int8, FP8, así como TAI o Tachyum AI, un nuevo tipo de datos que se anunciará más adelante este año y ofrecerá una mayor rendimiento que el FP8. Las operaciones matriciales de Prodigy admiten tipos de datos dispersos para obtener el máximo rendimiento, incluida la escasez de 4:2, que también es compatible con Nvidia H100, así como Super-Sparsity de Tachyum, que permite un rendimiento aún mayor con una proporción de 8:3.

Los tipos de datos dispersos maximizan el rendimiento para el entrenamiento y la inferencia con una reducción muy pequeña de la precisión. Los tipos de datos de menor precisión y la escasez se analizan con más detalle en la sección «Prodigy en la vanguardia de las tendencias de la industria de IA» a continuación. Las operaciones de dispersión/recopilación proporcionan carga y almacenamiento rápidos y eficientes para vectores y matrices.

Subsistemas de memoria y E/S

Prodigy integra dieciséis controladores de memoria DDR5 líderes en la industria que se ejecutan hasta DDR5-7200, proporcionando aproximadamente 1 TB/seg de ancho de banda de memoria y admiten 2 DIMM por canal. Tachyum anunciará una nueva característica a finales de este año llamada «Amplificación de ancho de banda» que efectivamente duplica el ancho de banda de la memoria a la asombrosa cifra de 2 TB/seg. El subsistema PCIe incluye 64 carriles de PCIe 5.0 con 32 controladores PCIe.

El subsistema PCIe incluye cuatro bloques funcionales PCIe x16, y cada uno de los bloques x16 incluye 8 controladores que pueden bifurcarse hasta x2, lo que ofrece la máxima flexibilidad para admitir dispositivos externos que van desde NIC de alto rendimiento hasta grandes arreglos de almacenamiento NVMe.

Emulación para x86, Arm, RISC-V Prodigy Runs

Prodigy admite la traducción binaria dinámica de software para otras arquitecturas de conjunto de instrucciones (ISA) que incluyen x86, Arm y RISC-V. x86 es el procesador de centro de datos establecido, Arm es muy frecuente para aplicaciones de telecomunicaciones y RISC-V es popular entre las instituciones académicas. La sobrecarga para la traducción binaria es aproximadamente del 30 al 40 %, pero Prodigy se ejecutará aproximadamente con el doble de frecuencia que los procesadores de la competencia, por lo que el rendimiento debería ser similar al de la ejecución nativa. La traducción binaria está diseñada para permitir evaluaciones y pruebas listas para usar rápidas y sencillas para clientes y socios, y los clientes migran al ISA nativo de Prodigy para implementaciones de producción para obtener el máximo rendimiento.

Todos los chips se fabrican en el nodo de proceso de 5 nm (N5P) de TSMC, que es una variante ligeramente optimizada del nodo estándar de 5 nm (N5) y ejecuta binarios nativos y x86, Arm y RISC-V. En cuanto a las características específicas de HPC e IA, la línea Tachyum Prodigy incluye:

  • 2 unidades vectoriales de 1024 bits por núcleo
  • Procesadores de matriz de 4096 bits por núcleo
  • FP64, FP32, TF32, BF16, Int8, FP8, TAI Tipos de datos
  • Los tipos de datos dispersos optimizan la eficiencia
  • Compatibilidad con la cuantificación mediante tipos de datos de baja precisión
  • Dispersión/recopilación para almacenar y cargar matrices de manera eficiente

Línea/plataforma de CPU universal Tachyum Prodigy – Escalado de 180 W a 900 W

Los 128 núcleos de la CPU insignia tienen una frecuencia de 5,7 GHz y, además, los clientes de IA obtendrán hasta 16 canales de memoria, que admiten hasta 32 TB (64 DIMM) de DDR5-7200. El procesador también tendrá 64 carriles PCIe Gen 5.0 y vendrá en un paquete TDP de 950W.

El resto de las CPU que ofrecerá Tachyum se enumeran en la hoja de especificaciones a continuación:

Núcleos Reloj Memoria PCIe TDP Segmento de mercado
Prodigio T16128-AIX 128 5,7 GHz 16x DDR5-7200 Gen5 x64 950W HPC, gran IA
Prodigio T16128-OBJETIVO 128 4,5 GHz 16x DDR5-7200 Gen5 x64 700W HPC, gran IA
Prodigio T16128-AIE 128 4,0 GHz 16x DDR5-7200 Gen5 x64 600W HPC, gran IA
Prodigio T16128-HT 128 4,5 GHz 16x DDR5-6400 Gen5 x64 300W Analítica, Big Data
Prodigio T864-HS 64 5,7 GHz 8x DDR5-6400 Gen5 x32 300W Nube, Bases de datos
Prodigio T864-HT 64 4,5 GHz 8x DDR5-6400 Gen5 x32 300W Nube, Bases de datos
Prodigio T832-HS 32 5,7 GHz 8x DDR5-6400 Gen5 x32 300W Cargas de trabajo escalares
Prodigio T832-LP 32 3,2 GHz 8x DDR5-4800 Gen5 x32 180W Alojamiento, almacenamiento, borde

Ahora, eso es solo un chip y Tachyum permitirá una coherencia de hardware total compatible con sistemas de 2 y 4 zócalos. Eso es hasta 512 núcleos y 3600 W de potencia de cuatro procesadores de nivel Progidy T16128-AIX.

La plataforma Prodigy vendrá en varias soluciones de rack, como un servidor 2U enfriado por aire que podrá albergar hasta cuatro chips Tachyum Prodigy, 64 DIMM DDR5 de 16 GB y 2 NIC RoCE de 200 GbE. También hay un diseño de referencia de rack de 48U personalizado que viene en 2 versiones, una refrigerada por líquido y otra por aire. La versión refrigerada por aire admite 40 servidores 2U de 4 sockets para un total de 160 chips, mientras que la versión refrigerada por líquido admite 88 servidores 1U de 4 sockets para un total de 352 chips. Ambos racks tienen un diseño modular y 2 racks se pueden combinar en un gabinete de 2 racks para optimizar el espacio en el piso. Cada servidor viene con cuatro sockets cLGA.

Línea de CPU universal Tachyum Prodigy: llega a NVIDIA, Intel y AMD a la vez

Tachyum también proporciona algunas estimaciones de rendimiento preliminares frente a los chips Intel Ice Lake, NVIDIA Hopper/Grace HPC y las CPU AMD Milan. La compañía afirma un aumento de hasta 4x SPECrate 2017 Integer y 30x Raw Floating Point (FP64) en comparación con la competencia. Hopper H100 de NVIDIA es el chip principal en el que Tachyum parece tener los ojos puestos, ya que se usa en varias pruebas comparativas.

Algunas de las cifras de rendimiento mencionadas incluyen:

  • 3x vs NVIDIA H100 en rendimiento de coma flotante de doble precisión
  • 6x vs NVIDIA H100 en rendimiento AI FP8
  • 9x frente a NVIDIA H100 en rendimiento por vatio
  • 4x vs Intel Xeon Platinum 8380 en Specrate 2017 Rendimiento INT
  • 30x vs Intel Xeon Platinum 8380 en rendimiento FP64

Tachyum también proporciona algunas estimaciones de rendimiento preliminares frente a los chips Intel Ice Lake, NVIDIA Hopper/Grace HPC y las CPU AMD Milan. La compañía afirma un aumento de hasta 4x SPECrate 2017 Integer y 30x Raw Floating Point (FP64) en comparación con la competencia. Hopper H100 de NVIDIA es el chip principal en el que Tachyum parece tener los ojos puestos, ya que se usa en varias pruebas comparativas.

Mientras que el Prodigy T16128-AIX ofrece alrededor de 90 TFLOP de rendimiento FP64 (con escasez). La empresa utiliza un rack Prodigy refrigerado por aire que se estima que ofrece hasta 6,2 PetaFlops de HPC FP64 caballos de fuerza frente a un rack NVIDIA H100 DGX POD que ofrece 960 TFLOP de rendimiento HPC FP64. El Prodigy refrigerado por líquido que puede admitir chips de gama alta debería ofrecer más del doble de rendimiento a 12,9 PetaFLOP.

Tachyum espera que los primeros barcos Prodigy comiencen a tomar muestras a finales de este año y se espera una producción en volumen en la segunda mitad de 2023. La actualización de próxima generación de Prodigy, conocida como Prodigy 2, también figura en la hoja de ruta de Tachyum y ofrecerá una nueva arquitectura de 3 nm con incluso más núcleos, mayor ancho de banda de memoria, compatibilidad con PCIe 6.0 + CXL y conectividad mejorada. El muestreo debería comenzar en la segunda mitad de 2024.





Source link-29

]]>
https://magazineoffice.com/tachyum-publica-el-informe-tecnico-del-procesador-universal-prodigy-hasta-6-veces-mas-rapido-que-nvidia-h100-y-30-veces-mas-rapido-que-intel-xeon-8380-disponible-en-la-segunda-mitad-de-2023/feed/ 0
Tachyum presenta una oferta para construir una supercomputadora de 20 exaflops https://magazineoffice.com/tachyum-presenta-una-oferta-para-construir-una-supercomputadora-de-20-exaflops/ https://magazineoffice.com/tachyum-presenta-una-oferta-para-construir-una-supercomputadora-de-20-exaflops/#respond Wed, 17 Aug 2022 09:48:51 +0000 https://magazineoffice.com/tachyum-presenta-una-oferta-para-construir-una-supercomputadora-de-20-exaflops/

Tachyum dijo el martes que había presentado una oferta al Departamento de Energía para construir una supercomputadora de 20 exaflops en 2025. La máquina se basaría en los procesadores Prodigy de próxima generación de la compañía con una microarquitectura patentada que se puede usar para diferentes tipos de cargas de trabajo. .

El Departamento de Energía de EE. UU. quiere que se entregue una supercomputadora de 20 exaflops con un consumo de energía de 20MW–60MW para 2025. El sistema se instalará en el Laboratorio Nacional de Oak Ridge (ORNL) y complementará el sistema Frontier del laboratorio que se puso en línea a principios de este año.

Tachyum no revela qué hardware propuso al Departamento de Energía, pero solo dice que tiene su procesador Prodigy de 128 núcleos hoy, así como un procesador Prodigy 2 de mayor rendimiento en su hoja de ruta, por lo que es seguro decir que para 2025 tendrá tenga este último a mano y podría abordar el próximo sistema.

Prodigy de Tachyum es un procesador homogéneo universal que incluye hasta 128 núcleos VLIW de 64 bits patentados que cuentan con dos unidades vectoriales de 1024 bits por núcleo y una unidad de matriz de 4096 bits por núcleo. Tachyum esperaba su procesador insignia Prodigy T16128-AIX (se abre en una pestaña nueva) para ofrecer hasta 90 teraflops FP64 para HPC, así como hasta 12 ‘petaflops de IA’ para inferencia y entrenamiento de IA (presumiblemente cuando se ejecutan cargas de trabajo INT8 o FP8). Prodigy consume hasta 950 W y utiliza refrigeración líquida.

Eso fue todo antes de que Tachyum demandara a Cadence, su proveedor de propiedad intelectual, por un rendimiento inferior al esperado de su procesador Prodigy. No tenemos idea de cuáles son las expectativas de rendimiento actuales para el chip.

En teoría, Tachyum podría alimentar un sistema exaflops utilizando más de 11.000 de sus procesadores Prodigy, aunque el consumo de energía de una máquina de este tipo sería gigantesco. Presumiblemente, Prodigy 2 tiene más posibilidades de satisfacer las necesidades de un sistema de exaescala de última generación que el Prodigy original.

Actualmente hay una supercomputadora de clase exaflops en los EE. UU., el sistema Frontier de 1.1 exaflops en el Laboratorio Nacional de Oak Ridge (ORNL) que se basa en las CPU EPYC de 64 núcleos de AMD, así como en las GPU de cómputo Instinct MI250X. Hay dos sistemas de exaescala más que se están construyendo en los EE. UU., la máquina Aurora de 2 exaflops con tecnología de procesadores escalables Xeon de cuarta generación de Intel y GPU de cómputo Xe-HPC (también conocido como Ponte Vecchio), así como la supercomputadora El Capitán «>2 exaflops» basada en CPU EPYC de arquitectura Zen 4 de AMD y GPU Instinct MI300.

Uno de los aspectos interesantes de los planes de supercomputación del Departamento de Energía es que, a partir de ahora, desea actualizar sus capacidades informáticas de alto rendimiento cada 12 o 24 meses, no cada 4 o 5 años. Como resultado, el DoE estará más ansioso por adoptar arquitecturas exóticas como Tachyum’s Prodigy que en la actualidad.

«También deseamos explorar el desarrollo de un enfoque que se aleje de las adquisiciones monolíticas hacia un modelo que permita ciclos de actualización más rápidos de los sistemas implementados, para permitir una innovación más rápida en hardware y software», se lee en un documento del Departamento de Energía. «Una estrategia posible incluiría una mayor reutilización de la infraestructura existente para que las actualizaciones sean modulares. Un objetivo sería reinventar la arquitectura de sistemas y un proceso de adquisición eficiente que permita la inyección continua de avances tecnológicos a una instalación (por ejemplo, cada 12 a 24 meses en lugar de que cada 4 o 5 años). Comprender las ventajas y desventajas de estos enfoques es uno de los objetivos de esta RFI, e invitamos a que las respuestas incluyan los beneficios y/o desventajas percibidos de este enfoque de actualización modular».

Una de las ventajas que tiene Tachyum’s Prodigy sobre las CPU y GPU tradicionales para cargas de trabajo de IA y HPC es que está diseñado para ambos tipos de cargas de trabajo, razón por la cual Prodigy se puede usar para cargas de trabajo de IA cuando no se usan sus capacidades de HPC y viceversa. El DoE puede o no adoptar Tachyum para cualquiera de sus próximas supercomputadoras, pero la compañía espera que se le otorgue un contrato apropiado.



Source link-41

]]>
https://magazineoffice.com/tachyum-presenta-una-oferta-para-construir-una-supercomputadora-de-20-exaflops/feed/ 0
Tachyum to Cadence: ¡Nuestro prodigio no cumple metas prodigiosas, demandarte! https://magazineoffice.com/tachyum-to-cadence-nuestro-prodigio-no-cumple-metas-prodigiosas-demandarte/ https://magazineoffice.com/tachyum-to-cadence-nuestro-prodigio-no-cumple-metas-prodigiosas-demandarte/#respond Sun, 07 Aug 2022 15:29:09 +0000 https://magazineoffice.com/tachyum-to-cadence-nuestro-prodigio-no-cumple-metas-prodigiosas-demandarte/

Cuando intente desarrollar su procesador Prodigy que sea igualmente bueno en aplicaciones generales, gráficos y cargas de trabajo de IA de subprocesos múltiples, tenga en cuenta que es difícil y que puede perder sus objetivos de rendimiento. Es precisamente lo que intentó hacer Tachyum, pero no parece haber cumplido sus expectativas, ya que demandó a Cadence, su proveedor de IP.

«Estas [IP] Se suponía que los elementos eran tecnología lista para usar que podría entregarse rápidamente para cumplir con el cronograma de desarrollo de productos críticos de Tachyum para ser el primero en el mercado con su Procesador Universal”, se lee en la denuncia, según lo informado por The Register. (se abre en una pestaña nueva). “Sin embargo, fallas catastróficas plagaron cada componente, en algunos casos, lo que llevó a Cadence a aconsejar a Tachyum que no use los componentes y/o que los obtenga de otros proveedores”.



Source link-41

]]>
https://magazineoffice.com/tachyum-to-cadence-nuestro-prodigio-no-cumple-metas-prodigiosas-demandarte/feed/ 0