AVX512 – Magazine Office https://magazineoffice.com Vida sana, belleza, familia y artículos de actualidad. Tue, 02 Apr 2024 23:09:58 +0000 es hourly 1 https://wordpress.org/?v=6.5.3 La actualización de LLM Runner Llamafile ofrece un aumento de rendimiento 10 veces superior a las CPU AMD Ryzen AVX-512 https://magazineoffice.com/la-actualizacion-de-llm-runner-llamafile-ofrece-un-aumento-de-rendimiento-10-veces-superior-a-las-cpu-amd-ryzen-avx-512/ https://magazineoffice.com/la-actualizacion-de-llm-runner-llamafile-ofrece-un-aumento-de-rendimiento-10-veces-superior-a-las-cpu-amd-ryzen-avx-512/#respond Tue, 02 Apr 2024 23:09:55 +0000 https://magazineoffice.com/la-actualizacion-de-llm-runner-llamafile-ofrece-un-aumento-de-rendimiento-10-veces-superior-a-las-cpu-amd-ryzen-avx-512/

La última actualización de Llamafile ha aumentado el rendimiento de las CPU Ryzen de AMD hasta 10 veces utilizando sus capacidades AVX-512.

Ejecutar modelos LLM pesados ​​en sistemas locales se ha vuelto más fácil con la última actualización de Llamafile, ya que las CPU AMD Ryzen con AVX-512 obtienen un impulso 10 veces mayor

Phoronix informa que la última actualización de Llamafile ahora admite el conjunto de instrucciones AVX-512, lo que permite a las CPU que admiten AVX-512 presenciar un aumento masivo del rendimiento mientras usan el software. Se informa que las CPU Zen 4 «Ryzen» de AMD experimentarán una evaluación rápida diez veces más rápida con la nueva actualización, lo que en última instancia permitirá un rendimiento LLM mucho más eficiente en la herramienta.

Créditos de imagen: Mozilla Ocho a través de Github

Para aquellos que no conocen Llamafile, se puede implementar con un único archivo ejecutable que combina un modelo LLM con las bibliotecas necesarias para ejecutarlo. Mozilla Ocho ha desarrollado la herramienta con el objetivo de hacer que los LLM sean accesibles a una audiencia más amplia aprovechando las ejecuciones de CPU y GPU. La herramienta ha sido un gran éxito entre los desarrolladores, especialmente porque erradica la necesidad de soluciones de alto costo para acceder a los LLM, pero en este momento, Llamafile aún se encuentra en sus primeras etapas; por lo tanto, hay áreas de imprecisiones relacionadas con esto, que creemos que se solucionarán pronto una vez que la narrativa de la informática de punta tome impulso.

Bueno, la nueva actualización de rendimiento aún no se ha probado, pero Phoronix afirma que tienen planes de probar el nuevo Llamafire 0.7 en el futuro, tanto en sistemas AMD como Intel. Puede acceder a la última versión a través de GitHub aquí. Tenga en cuenta que las CPU Ryzen de AMD son los únicos chips de consumo que admiten instrucciones AVX-512, mientras que Intel se ha retirado del soporte porque afecta las ventas de sus chips Xeon. Esto le da a la plataforma Ryzen de AMD una ventaja para los usuarios que desean ejecutar aplicaciones que aprovechen AVX-512.

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/la-actualizacion-de-llm-runner-llamafile-ofrece-un-aumento-de-rendimiento-10-veces-superior-a-las-cpu-amd-ryzen-avx-512/feed/ 0
Muestra de CPU de escritorio Intel Arrow Lake-S con 24 núcleos y 24 subprocesos, sin compatibilidad con AVX-512 https://magazineoffice.com/muestra-de-cpu-de-escritorio-intel-arrow-lake-s-con-24-nucleos-y-24-subprocesos-sin-compatibilidad-con-avx-512/ https://magazineoffice.com/muestra-de-cpu-de-escritorio-intel-arrow-lake-s-con-24-nucleos-y-24-subprocesos-sin-compatibilidad-con-avx-512/#respond Sun, 04 Feb 2024 09:30:45 +0000 https://magazineoffice.com/muestra-de-cpu-de-escritorio-intel-arrow-lake-s-con-24-nucleos-y-24-subprocesos-sin-compatibilidad-con-avx-512/

Podría haber un ligero cambio con la tecnología Hyper-Threading en las próximas CPU Intel Arrow Lake-S para PC de escritorio, como lo señala una muestra recién publicada.

Se rumorea que las CPU de escritorio Arrow Lake-S de próxima generación de Intel excluyen la compatibilidad con Hyper-threading y AVX512, se detectó una muestra de CPU de 24 núcleos y 24 subprocesos

Este rumor proviene de InstaLatX64, quien vio una CPU de escritorio Intel Arrow Lake-S en una máquina de prueba Intel con 24 núcleos y 24 subprocesos funcionando a 3 GHz. Si bien la exclusión del hyperthreading no se menciona en la base de datos, esta analogía se hace con el número de subprocesos mencionado, que es de 24 subprocesos. Sabemos por una filtración anterior que las CPU de escritorio Arrow Lake-S de Intel contarían con hasta 8 P-Cores y 16 E-Cores, por lo que son 16 subprocesos de los E-Cores y 8 subprocesos de los P-Cores. Es posible que los núcleos P de las CPU Arrow Lake-S no incluyan soporte de hiperprocesamiento, lo que tiene sus altibajos.

Esto significa que podríamos ver que el hyper-threading se excluya de la próxima línea Intel. Si bien no hay una razón específica detrás de la eliminación de HT, puede ser que Intel no lo considere útil para las cargas de trabajo de próxima generación. O con el número cada vez mayor de núcleos, no hay necesidad de subprocesos tan altos para aplicaciones de PC de consumo.

Sabemos que Intel dedicó mucho tiempo a su tecnología Thread Director con socios como Microsoft para ajustar el rendimiento de su arquitectura P-Core y E-Core en los sistemas operativos Windows. La compañía también trabajó con desarrolladores de juegos y lanzó su software Application Performance Optimization (APO) que ajusta el rendimiento de las CPU en una cantidad selecta de juegos y una cantidad selecta de SKU de CPU que la compañía amplió recientemente.

Aparte de eso, se revela que las CPU de escritorio Arrow Lake-S también podrían excluir la compatibilidad con instrucciones AVX512. Algunas razones podrían ser un mayor uso de energía o que Intel se asegure de que AVX-512 esté bloqueado para el segmento corporativo y de servidores en lugar de plataformas de clientes que son menos costosas de comprar y pueden acabar con otros segmentos dentro de su cartera. Ahora bien, no es que AVX-512 haya desaparecido por completo. El soporte para las instrucciones todavía existe en el lado HPC con los chips Xeon. Además, AMD ya lo ofrece en sus procesadores de consumo Ryzen 7000, que han demostrado capacidades de rendimiento impresionantes. Veremos el debut del soporte AVX10 ISA con Arrow Lake-S, que se espera que sea una alternativa decente y ofrezca una funcionalidad mucho mejorada.

Para un resumen rápido de qué esperar de Arrow Lake-S, contará con la arquitectura Lion Cove P-Core y Skymont E-Core. Estos chips contarán con hasta 8 P-Cores y 16 E-Cores para un total de 24 núcleos. Las CPU también obtendrán la última iGPU GT1 Xe-LPG, pero con núcleos Xe reducidos en comparación con los que aparecen en las CPU Meteor Lake. En cuanto a la plataforma, Intel ofrecerá CPU de escritorio Arrow Lake-S en sus nuevas placas base con zócalo LGA 1851 con el PCH de la serie 800, incluidas las series Z890, H870, B860 y H810. Aquí están los SKU rumoreados que han surgido, con sus respectivas configuraciones de núcleo/hilo.

  • Arrow Lake-S 8+16 (24 Núcleos / 32 Hilos)
  • Arrow Lake-S 6+16 (22 Núcleos / 28 Hilos)
  • Arrow Lake-S 6+8 (14 Núcleos / 20 Hilos)

Las CPU de escritorio Arrow Lake-S de Intel están preparadas para su lanzamiento en plataformas de juegos, como las PC de escritorio, a finales de este año.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/muestra-de-cpu-de-escritorio-intel-arrow-lake-s-con-24-nucleos-y-24-subprocesos-sin-compatibilidad-con-avx-512/feed/ 0
El nuevo AVX10 de Intel trae capacidades AVX-512 a E-Core https://magazineoffice.com/el-nuevo-avx10-de-intel-trae-capacidades-avx-512-a-e-core/ https://magazineoffice.com/el-nuevo-avx10-de-intel-trae-capacidades-avx-512-a-e-core/#respond Tue, 25 Jul 2023 08:32:00 +0000 https://magazineoffice.com/el-nuevo-avx10-de-intel-trae-capacidades-avx-512-a-e-core/

Intel publicó hoy su nuevo APX (Advanced Performance Extensions) y también reveló el nuevo AVX10 [PDF] eso brindará soporte unificado para las capacidades AVX-512 tanto para P-Core como para E-Core por primera vez. Esta evolución del conjunto de instrucciones AVX ayudará a Intel a sortear los graves problemas que encontró con su nueva arquitectura híbrida x86 que se encuentra en los procesadores Alder y Raptor Lake.

Sin embargo, el nuevo AVX10 ISA no será compatible con las CPU de generación actual de Intel; está previsto que llegue en futuros chips. Intel dice que AVX10 será su vector ISA de elección que avanza hacia el futuro tanto para procesadores de consumo como de servidor.

Intel AVX10 (Extensiones de instrucciones avanzadas 10)

En su nivel más básico, AVX10 permitirá que los chips de Intel que tienen núcleos E y núcleos P sigan siendo compatibles con AVX-512, aunque las instrucciones de 512 bits solo pueden ejecutarse en núcleos P. Mientras tanto, las instrucciones convergentes AVX10 de 256 bits pueden ejecutarse en p-cores o e-cores, lo que permite que el chip completo siga siendo compatible con las capacidades AVX-512.

Como tal, Intel no tendrá que deshabilitar la compatibilidad con vectores de 512 bits como lo hizo cuando desactivó AVX-512 para Alder Lake y Raptor Lake.

(Crédito de la imagen: Intel)

Profundizando más, el AVX10 (Advanced Instruction Extensions 10) ISA es un superconjunto de AVX-512 y viene con todas las características del AVX-512 ISA para procesadores con tamaños de registro vectorial de 256 bits y 512 bits.

El AVX10 ISA convergente incluirá «instrucciones vectoriales AVX-512 con un indicador de función AVX512VL, una longitud máxima de registro vectorial de 256 bits, así como ocho registros de máscara de 32 bits y nuevas versiones de instrucciones de 256 bits compatibles con el redondeo integrado», y esta versión se ejecutará tanto en p-cores como en e-cores.

Sin embargo, los núcleos electrónicos se limitarán a la longitud de vector máxima de 256 bits del AVX10 convergente, mientras que los núcleos P pueden usar vectores de 512 bits. Esto se parece al soporte de Arm para anchos de vector variables con SVE.



Source link-41

]]>
https://magazineoffice.com/el-nuevo-avx10-de-intel-trae-capacidades-avx-512-a-e-core/feed/ 0
Intel AVX10 ISA contará con instrucciones AVX-512 con soporte tanto para núcleos P como para núcleos electrónicos https://magazineoffice.com/intel-avx10-isa-contara-con-instrucciones-avx-512-con-soporte-tanto-para-nucleos-p-como-para-nucleos-electronicos/ https://magazineoffice.com/intel-avx10-isa-contara-con-instrucciones-avx-512-con-soporte-tanto-para-nucleos-p-como-para-nucleos-electronicos/#respond Tue, 25 Jul 2023 07:48:13 +0000 https://magazineoffice.com/intel-avx10-isa-contara-con-instrucciones-avx-512-con-soporte-tanto-para-nucleos-p-como-para-nucleos-electronicos/

El próximo AVX10 ISA (Arquitectura de conjunto de instrucciones) de Intel se ha detallado y viene con soporte AVX-512 para P-Cores y E-Cores.

Intel AVX10 ISA podría ser el gran arma de Chipzilla contra AMD, cuenta con soporte AVX-512 tanto en P-Core como en E-Core

En una diapositiva publicada por Twitterati, Longhorn, podemos ver los detalles del próximo AVX10 ISA de Intel que parece estar disponible en dos versiones, una habilitación previa (AVX10.1) y una habilitación posterior (AVX10.2). Ambos ISA tienen una adición importante que es la compatibilidad con FP/int de 512 bits opcional, que es algo que se excluyó de los chips de clientes recientes. El Intel AVX-512 ISA ha existido por un tiempo con Rocket Lake y Tiger Lake, pero la compañía decidió deshabilitarlo de los chips de nivel de cliente más recientes, como Alder Lake y Raptor Lake.

Créditos de imagen: Longhorn

Pero parece que Intel podría traer de vuelta estas instrucciones con procesadores compatibles con AVX 10 ISA. De acuerdo con los detalles previos y posteriores a la habilitación, el AVX10 ISA es parte de las últimas APX (Advanced Performance Extensions) y ofrecerá:

  • FP/int opcional de 512 bits
  • FP/int de 128/256 bits
  • 32 registros vectoriales
  • 8 registros de máscara
  • Redondeo incrustado de 256/512 bits
  • Transmisión integrada
  • Escalar/SSE/AVX «promociones»
  • Adiciones de medios nativos
  • adiciones de HPC
  • Apoyo trascendental
  • Reunir/Dispersión
  • Enumeración basada en versiones
  • Compatibilidad con núcleos P, núcleos electrónicos

Ahora no es que AVX-512 haya desaparecido por completo. El soporte para las instrucciones aún existe en el lado de HPC con los chips Xeon. Sin embargo, el lado del cliente podría recuperar las instrucciones AVX-512, ya que AMD ya lo ofrece en sus procesadores de consumo Ryzen 7000 y han demostrado algunas capacidades de rendimiento impresionantes en cargas de trabajo específicas sin tener un gran impacto en el consumo de energía. El consumo de energía era una preocupación importante con las instrucciones AVX-512 anteriores de Intel.

Intel AVX10 representa un cambio importante para admitir un ISA vectorial de alto rendimiento en los futuros procesadores Intel. Permite al desarrollador mantener una única ruta de código que logra un alto rendimiento en todas las plataformas Intel con un mínimo de verificación general para la compatibilidad de funciones. El desarrollo futuro de Intel AVX10 ISA continuará brindando un entorno rico, flexible y consistente que admita de manera óptima tanto productos de servidor como de cliente.

a través de Intel

Además, la versión AVX10.1 de prehabilitación solo enumera la compatibilidad con AVX-512 para los núcleos P, mientras que la versión AVX10.2 también agrega los núcleos electrónicos. Ya hubo informes de que Intel podría traer AVX-512 de vuelta a los chips de los clientes de alguna forma en el futuro. Además de los beneficios de usabilidad mencionados anteriormente, varios beneficios adicionales basados ​​en el rendimiento de Intel AVX10 incluyen:

  • Las aplicaciones compiladas con Intel AVX2, recompiladas a Intel AVX10, deberían obtener ganancias de rendimiento sin necesidad de ajustes de software adicionales.
  • Las aplicaciones Intel AVX2 sensibles a la presión del registro vectorial obtendrán el máximo rendimiento gracias a los 16 registros vectoriales adicionales y las nuevas instrucciones.
  • Es probable que las aplicaciones vectorizables con muchos subprocesos logren un mayor rendimiento agregado cuando se ejecutan en procesadores Intel Xeon basados ​​en E-core o en productos Intel® con arquitectura híbrida de rendimiento.

La empresa tiene Meteor Lake para clientes y Granite Rapids & Sierra Forest para sus clientes de HPC. Las tres familias utilizan una arquitectura similar con los núcleos P que utilizan núcleos Redwood Cove y los núcleos E basados ​​en la arquitectura Crestmont. Intel ha declarado que sus futuros procesadores Xeon, cuyo nombre en código es Granite Rapids, serán los primeros en ser compatibles con AVX10 y marcarán la transición de AVX-512 a Intel AVX10 (no incluirá extensiones vectoriales de 256 bits). Espere más información en el futuro.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/intel-avx10-isa-contara-con-instrucciones-avx-512-con-soporte-tanto-para-nucleos-p-como-para-nucleos-electronicos/feed/ 0
AVX-512 funciona sorprendentemente bien en las CPU Phoenix de la serie Ryzen 7040 https://magazineoffice.com/avx-512-funciona-sorprendentemente-bien-en-las-cpu-phoenix-de-la-serie-ryzen-7040/ https://magazineoffice.com/avx-512-funciona-sorprendentemente-bien-en-las-cpu-phoenix-de-la-serie-ryzen-7040/#respond Sat, 15 Jul 2023 11:15:11 +0000 https://magazineoffice.com/avx-512-funciona-sorprendentemente-bien-en-las-cpu-phoenix-de-la-serie-ryzen-7040/

Phoronix evaluó recientemente la arquitectura móvil Ryzen más sofisticada de AMD, la serie móvil 7040, en cargas de trabajo AVX-512 para ver su rendimiento en comparación con las dos últimas generaciones de Intel de CPU compatibles con AVX-512 en el espacio móvil. Resulta que las CPU de la serie Phoenix de AMD son chips AVX-512 increíblemente efectivos, que superan fácilmente a la competencia en eficiencia energética y rendimiento.

Las CPU probadas por Phoronix incluyeron un Ryzen 7 7840U, así como las antiguas i7-1165G7 e i7-1065G7 de Intel, que fueron las últimas CPU móviles compatibles con AVX-512. El chip AMD superó a las CPU Intel más antiguas, superando al 1165G7 en un 46 % y superó al 1065G7 anterior en un 63 %. El chip Ryzen 7 también experimentó la mayor ganancia de rendimiento al habilitar AVX-512, con un margen de rendimiento del 54 % al habilitar o deshabilitar AVX-512. Los chips Intel ni siquiera estaban cerca, con un margen de rendimiento del 35%.

(Crédito de la imagen: Phoronix)

Las ganancias de rendimiento de AMD con AVX-512 son impresionantes, especialmente dado que Zen 4, la arquitectura de CPU que utiliza el 7840U, es la primera arquitectura del equipo rojo en adoptar el nuevo conjunto de instrucciones. Intel, por el contrario, tiene años de experiencia en el desarrollo de arquitecturas compatibles con AVX-512, pero no ha logrado obtener los mismos márgenes de rendimiento que AMD. Intel también tuvo que lidiar con otras rarezas arquitectónicas encontradas en Rocket Lake y Alder Lake con respecto al rendimiento y la capacidad de AVX-512, que la arquitectura Zen 4 de AMD no tiene.



Source link-41

]]>
https://magazineoffice.com/avx-512-funciona-sorprendentemente-bien-en-las-cpu-phoenix-de-la-serie-ryzen-7040/feed/ 0
Las CPU AMD Zen 4 verán hasta un 20% de aceleración en el punto de referencia de y-cruncher gracias a AVX-512 https://magazineoffice.com/las-cpu-amd-zen-4-veran-hasta-un-20-de-aceleracion-en-el-punto-de-referencia-de-y-cruncher-gracias-a-avx-512/ https://magazineoffice.com/las-cpu-amd-zen-4-veran-hasta-un-20-de-aceleracion-en-el-punto-de-referencia-de-y-cruncher-gracias-a-avx-512/#respond Fri, 09 Jun 2023 17:08:51 +0000 https://magazineoffice.com/las-cpu-amd-zen-4-veran-hasta-un-20-de-aceleracion-en-el-punto-de-referencia-de-y-cruncher-gracias-a-avx-512/

El popular punto de referencia y-cruncher para CPU pronto recibirá una actualización importante que permitirá que las CPU AMD Zen 4 ofrezcan hasta un 20 % más de rendimiento gracias a AVX-512.

Las CPU AMD con arquitectura Zen 4 y AVX-512 se beneficiarán enormemente de la próxima actualización de referencia de y-cruncher

El autor del punto de referencia de y-cruncher, Alexander Yee, Anunciado en un tweet que la próxima versión del punto de referencia verá un gran impulso para el hardware AVX-512, especialmente el núcleo Zen 4 de AMD, que cuenta con soporte para AVX-512.

El punto de referencia de y-cruncher es una herramienta popular para evaluar el rendimiento de la CPU y determinar qué tan rápido puede calcular PI. Es un punto de referencia muy escalable y de subprocesos múltiples que la industria está utilizando desde hace años y ha estado disponible durante más de una década. También usamos el mismo punto de referencia en nuestras revisiones de CPU.

Alexander ha publicado un nuevo registro de cambios para el próximo y-cruncher 0.8x que se espera que esté disponible pronto y es un intento de limpiar y modernizar el proyecto. Se modificarán más de 400,000 líneas de código y el trabajo real en esto comenzó hace tres años, pero se avanzó poco hasta este año. En un gráfico de rendimiento que muestra el aumento de velocidad con respecto a v0.7.10, puede ver que casi todas las CPU, excepto los chips Nehalem e Ivy Bridge más antiguos, ven una mejora en el rendimiento en la versión más nueva.

Procesador Arquitectura Velocidades de reloj Binario ES UN Cálculo Pi Speedup vs. v0.7.10
Núcleo i7 920 Intel Nehalem 2008 3,5 GHz + 3 x 1333 MT/s 08-NHM ~ Ushio x64 SSE4.1 -27%
Núcleo i7 3630QM Puente Intel Ivy 2012 stock + 2 x 1600 MT/s 11-SNB ~ Hina x64 AVX -10%
FX-8350 Martillo AMD 2012 stock + 2 x 1600 MT/s 11-BD1 ~ Miyu x64 FMA4 -1%
Núcleo i7 5960X Intel Haswell 2013 4,0 GHz + 4 x 2400 MT/s 13-HSW ~ Airí x64 AVX2 3 – 4%
Núcleo i7 6820HK Intel Skylake 2015 stock + 2 x 2133 MT/s 14-BDW ~ Kurumi x64 AVX2 + ADX 4 – 7%
Ryzen 7 1800X AMD Zen 1 2017 stock + 2 x 2866 MT/s 17-ZN1 ~ Yukina x64 AVX2 + ADX ~1%
Núcleo i9 7900X Intel Skylake X 2017 3,6 GHz (AVX512) + 4 x 3000 MT/s 17-SKX ~ Kotori x64 AVX512-DQ 6 – 9%
Núcleo i9 7940X 3,6 GHz (AVX512) + 4 x 3466 MT/s 10 – 13%
Ryzen 9 3950X AMD Zen 2 2019 existencias + 2 x 3000 MT/s 19-ZN2 ~ Kagari x64 AVX2 + ADX 13 – 14%
Núcleo i3 8121U Lago Intel Cannon 2018 stock + 2 x 2400 MT/s 18-CNL ~ Shinoa x64 AVX512-VBMI 16 – 17%
Núcleo i7 1165G7 Lago del tigre de Intel 2020 stock + 2 x 2666 MT/s 12 – 22%
Núcleo i7 11800H stock + 2 x 3200 MT/s 23 – 27%
Ryzen 9 7950X AMD Zen 4 2022 stock + 2 x 4400 MT/s 22-ZN4 ~ Kizuna x64 AVX512-GFNI 23 – 31%

La pérdida de rendimiento se atribuye a la eliminación de Hybrid NTT, que fue algo importante en 2008 pero no se aplica a las arquitecturas modernas. Una de las mayores mejoras de rendimiento se puede ver en las CPU AMD Zen 4 con el Ryzen 9 7950X ganando hasta un 31 % más de rendimiento. Yee afirma que podemos esperar que Zen 4 gane hasta un 20 % de aceleración solo con el conjunto de instrucciones AVX-512 en comparación con solo AVX2 (no se necesita una unidad de ejecución más amplia).

Esto definitivamente será un gran impulso para las CPU de AMD que cuentan con AVX-512, mientras que las CPU de Intel, incluidos los próximos chips Meteor Lake, no obtendrán soporte AVX-512 en el lado del cliente. Las CPU Intel Alder Lake accidentalmente incluyeron soporte AVX-512 en el lanzamiento, pero Intel tuvo que eliminarlo por completo de los lotes más nuevos y los chips Raptor Lake de 13.ª generación no tenían soporte AVX-512.

Mientras tanto, los usuarios que ejecutan una CPU AMD Ryzen 7000 (Zen 4) pueden disfrutar de AVX-512 y usarlos en una variedad de aplicaciones, como ejecutar emuladores de juegos con imágenes nítidas y muchos FPS, como se demuestra aquí. Hay informes de que Intel puede traer de vuelta AVX-512 en futuros chips de clientes, pero no podemos decir con certeza cuándo sucederá eso.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/las-cpu-amd-zen-4-veran-hasta-un-20-de-aceleracion-en-el-punto-de-referencia-de-y-cruncher-gracias-a-avx-512/feed/ 0
AMD habla sobre los conceptos de CPU Hybrid Ryzen, evitando el problema AVX-512 de Intel https://magazineoffice.com/amd-habla-sobre-los-conceptos-de-cpu-hybrid-ryzen-evitando-el-problema-avx-512-de-intel/ https://magazineoffice.com/amd-habla-sobre-los-conceptos-de-cpu-hybrid-ryzen-evitando-el-problema-avx-512-de-intel/#respond Sat, 03 Jun 2023 05:48:55 +0000 https://magazineoffice.com/amd-habla-sobre-los-conceptos-de-cpu-hybrid-ryzen-evitando-el-problema-avx-512-de-intel/

Durante Computex 2023, tuve la oportunidad de visitar las imponentes oficinas de AMD en Taipei, Taiwán, para ver la demostración de Ryzen AI de la empresa y hablar con David McAfee, vicepresidente corporativo y gerente general de Client Channel Business. La mayor parte de nuestra conversación se centró en los esfuerzos de AMD en el espacio de la IA del consumidor, pero también hice algunas preguntas sobre la versión de AMD de las CPU híbridas. McAfee me dijo que AMD tiene una visión diferente de los procesadores híbridos que la de Intel que evitaría la complejidad que obligó a Intel a eliminar la compatibilidad con AVX-512 de sus chips.

Entrevisté a Mark Papermaster, CTO de AMD, hace dos semanas en Amberes, Bélgica. Me dijo que «veríamos núcleos de alto rendimiento combinados con núcleos de bajo consumo combinados con aceleración» en el futuro cliente de AMD [consumer] procesadores, lo que indica que, como Intel antes, AMD adoptaría un diseño de núcleo de ejecución de CPU híbrida en el futuro. Eso no fue demasiado sorprendente: vimos los primeros signos de dos tipos diferentes de núcleos de CPU en los manuales de software de AMD hace meses. Además, AMD ya está sentando las bases con sus próximos chips EPYC Bergamo con núcleos densos Zen 4c similares a los núcleos eficientes.

Los chips de computadora portátil Ryzen 7040 actuales de AMD ya cuentan con un diseño híbrido, pero no con dos tipos diferentes de núcleos de CPU. En cambio, el Ryzen 7040 tiene solo un tipo de núcleo de CPU combinado con un motor acelerador de IA incorporado que funciona independientemente de los núcleos de CPU y GPU. Este motor proporciona ventajas para ciertos tipos de cargas de trabajo de inferencia de IA, pero los núcleos de CPU y GPU son mejores para otros tipos de inferencia. Entonces, el truco es dirigir las diferentes cargas de trabajo de IA al tipo correcto de núcleos para extraer el mejor rendimiento y eficiencia energética.



Source link-41

]]>
https://magazineoffice.com/amd-habla-sobre-los-conceptos-de-cpu-hybrid-ryzen-evitando-el-problema-avx-512-de-intel/feed/ 0
ASUS ROG Ally ofrece un gran rendimiento de emulación gracias a AVX-512 en las APU AMD Ryzen Z1, 60 FPS en God of War 3 a 1080p https://magazineoffice.com/asus-rog-ally-ofrece-un-gran-rendimiento-de-emulacion-gracias-a-avx-512-en-las-apu-amd-ryzen-z1-60-fps-en-god-of-war-3-a-1080p/ https://magazineoffice.com/asus-rog-ally-ofrece-un-gran-rendimiento-de-emulacion-gracias-a-avx-512-en-las-apu-amd-ryzen-z1-60-fps-en-god-of-war-3-a-1080p/#respond Mon, 15 May 2023 12:30:57 +0000 https://magazineoffice.com/asus-rog-ally-ofrece-un-gran-rendimiento-de-emulacion-gracias-a-avx-512-en-las-apu-amd-ryzen-z1-60-fps-en-god-of-war-3-a-1080p/

La computadora de mano ASUS ROG Ally también es un excelente dispositivo para emular juegos gracias a sus APU AMD Ryzen Z1 con soporte AVX-512.

A los emuladores de juegos de PS3 anteriores les encanta la compatibilidad con AVX-512 de AMD Ryzen Z1 APU en ASUS ROG Ally Handheld

El ASUS ROG Ally se presentó hace unos días por un precio inicial de solo $ 599 USD para la variante base Ryzen Z1 y $ 699 USD para la variante Ryzen Z1 Extreme. Al albergar las APU AMD Ryzen Z1, una gran ventaja que ofrece la computadora de mano es la compatibilidad con las instrucciones AVX-512 que ofrecen un gran rendimiento en varios emuladores, incluido RPCS3.

Vimos un avance del rendimiento de la emulación en las APU Phoenix de AMD de The Phawx, pero ETA Prime es el primero en proporcionar puntos de referencia de emulación en la computadora de mano ASUS ROG Ally y las cosas se ven realmente geniales.

Comenzando con Dolphin Emulator, estará listo y configurado con el modo TDP de 9 W y obtendrá 60 FPS sólidos a 1080p en todos los títulos. Lo mismo ocurre con el emulador PS2/PCSX2 que funciona muy bien a 1080p (modo 15W) y ejecuta varios juegos a 60 FPS. Para el emulador de PSP podrás ejecutar cualquiera de los títulos compatibles como God of War Chains of Olympus a 1080p/60 FPS con un TDP de 7W. Eso brindará tiempos de batería increíbles mientras juegas.

El emulador 3DS Citra fue una ejecución difícil en las APU AMD debido a que el emulador usa un back-end OpenGL, pero con los nuevos controladores AMD y las optimizaciones específicas de OpenGL, puede hacer 1080p @ 60 a 13 W o la resolución nativa del 3DS en solo 7W.

Pasando al emulador de Xbox 360, ETA Prime mostró la jugabilidad de Red Dead Redemption funcionando a 30 FPS nativos a 30 W y 53 FPS en promedio con V-Sync deshabilitado y en el modo TDP de 45 W. Yuzu también proporciona 30 FPS sólidos en el modo de 15 W en varios títulos.

Rendimiento del emulador ASUS ROG Ally RPCS3 God of War III:

https://www.youtube.com/watch?v=vTwyjArlsaI

Rendimiento del emulador Steam Deck RPCS3 God of War III:

El título más difícil de la lista fue God of War 3 en el emulador RPCS3. Este fue un juego realmente difícil de ejecutar en PC y solo puede ofrecer 15-25 FPS en un Steam Deck a 720P. Mientras tanto, el ASUS ROG Ally ni siquiera suda con 60 FPS sobresalientes a 1080p usando el modo 30W.

Una vez más, esto demuestra que AMD tomó una gran decisión al poner soporte AVX-512 en sus APU Ryzen Z1 que pueden utilizar dispositivos portátiles como ASUS ROG Ally. Otras APU Ryzen Phoenix 7040U/H/HS contarán con un rendimiento similar, aunque los tiempos y la potencia de la batería serán un poco mejores para el Z1 Extreme debido a sus optimizaciones exclusivas para dispositivos portátiles.

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/asus-rog-ally-ofrece-un-gran-rendimiento-de-emulacion-gracias-a-avx-512-en-las-apu-amd-ryzen-z1-60-fps-en-god-of-war-3-a-1080p/feed/ 0
Intel podría traer de vuelta la compatibilidad con AVX-512 en futuras CPU cliente https://magazineoffice.com/intel-podria-traer-de-vuelta-la-compatibilidad-con-avx-512-en-futuras-cpu-cliente/ https://magazineoffice.com/intel-podria-traer-de-vuelta-la-compatibilidad-con-avx-512-en-futuras-cpu-cliente/#respond Wed, 03 May 2023 14:29:38 +0000 https://magazineoffice.com/intel-podria-traer-de-vuelta-la-compatibilidad-con-avx-512-en-futuras-cpu-cliente/

Intel podría estar planeando traer de vuelta el soporte AVX-512 a las CPU de sus clientes después de eliminarlo por completo de su línea de chips el año pasado.

Los informes sugieren que Intel traerá de vuelta el AVX-512 de alguna forma en futuras CPU de clientes

En 2021, siguiendo rápidamente a las CPU Rocket Lake de 11.ª generación, Intel presentó sus CPU Alder Lake de 12.ª generación con una arquitectura de núcleo híbrido. Los procesadores eran compatibles con los conjuntos de instrucciones AVX-256 y AVX-512; sin embargo, en los meses posteriores a su lanzamiento, veríamos a Intel retroceder y comenzar a deshabilitar la compatibilidad con AVX-512 en nuevos lotes de silicio. Para los procesadores más antiguos que tenían soporte AVX-512, Intel incluso obligó a los fabricantes de placas base a eliminar el soporte AVX-512 que podía habilitarse a través del BIOS.

Esta decisión se tomó para hacer que los usuarios paguen más por los chips Xeon para funciones como AVX-512 y eliminar por completo el soporte de las CPU Raptor Lake de 13.ª generación más nuevas. Esto significa que los chips Tiger Lake de 11.ª generación son la última familia oficial de Intel compatible con las instrucciones AVX-512.

Mientras tanto, AMD presentó su nueva arquitectura de núcleo Zen 4 para la familia de CPU Ryzen 7000, que cuenta con compatibilidad total con las instrucciones AVX-512. Estas instrucciones están disponibles en todos los chips de cliente Ryzen que admiten la nueva arquitectura Zen 4 y esto ha convertido a Ryzen en una de las mejores opciones para la emulación de juegos, como el emulador RPCS3 Sony PS3, entre otras cargas de trabajo que pueden beneficiarse de tales instrucciones.

Por ejemplo, las instrucciones AVX-512 en las CPU AMD Ryzen 7000 pueden ayudar a aumentar las velocidades de inferencia FP32 hasta en un 30 % y las velocidades de inferencia Int8 (VNNI) hasta 2,5 veces. Esto le da a AMD una gran ventaja de CPU sobre los chips de cliente de Intel que no han ofrecido el soporte adecuado o debería decir AVX-512 oficial durante las últimas dos generaciones.

Sin embargo, esto podría cambiar como ingeniero de la nube de AWS, Longhorn (@never_released) afirma que el soporte AVX-512 está volviendo a las CPU de cliente de Intel, y ese ha sido el plan durante un tiempo, aunque es posible que tengamos que esperar y ver qué generaciones exactas lo traerán de vuelta. Además, hay informes de que Intel podría cambiar el nombre de AVX-512 a otra cosa para las CPU de los clientes. Locuza tuiteó que la próxima arquitectura E-Core de Intel, Crestmont, que va dentro de los chips Meteor Lake y Sierra Forest, no contará con soporte AVX-512, por lo que es probable que Meteor Lake con los rumoreados Skymont E-Cores podría traerlo de vuelta.

Hay algunas posibilidades de que AVX-512 se pueda habilitar cuando los E-Cores están deshabilitados pero respondiendo a Locuza, filtrador @OneRaichu menciona otra posibilidad y es AVX-256 Plus para CPU de grado de consumidor (Cliente). Será interesante ver si Intel sigue este plan, pero una cosa es segura: se espera que cambien muchas cosas una vez que se lancen los chips Meteor Lake y Arrow Lake.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/intel-podria-traer-de-vuelta-la-compatibilidad-con-avx-512-en-futuras-cpu-cliente/feed/ 0
Intel fusiona silenciosamente la nueva biblioteca AVX-512 Quicksort, con una mejora de hasta 17x https://magazineoffice.com/intel-fusiona-silenciosamente-la-nueva-biblioteca-avx-512-quicksort-con-una-mejora-de-hasta-17x/ https://magazineoffice.com/intel-fusiona-silenciosamente-la-nueva-biblioteca-avx-512-quicksort-con-una-mejora-de-hasta-17x/#respond Sun, 19 Feb 2023 01:52:34 +0000 https://magazineoffice.com/intel-fusiona-silenciosamente-la-nueva-biblioteca-avx-512-quicksort-con-una-mejora-de-hasta-17x/

NumPy, o Numerical Python, es una de las bibliotecas de Python que se enfoca en la computación científica en el conocido lenguaje de codificación y recientemente integró la biblioteca de archivos de encabezado C++ de Intel que se usa para clasificación rápida en AVX-512. La nueva integración muestra mayores velocidades de clasificación basada en SIMD de diez a diecisiete veces más rápida.

NumPy Switching de Intel presenta AVX-512 para aumentar la clasificación basada en SIMD y ayudar con el rendimiento

Se explica que la biblioteca de NumPy, basada en Python, proporciona:

…un objeto de matriz multidimensional, varios objetos derivados (como matrices y matrices enmascaradas) y una variedad de rutinas para operaciones rápidas en matrices, incluidas operaciones matemáticas, lógicas, manipulación de formas, clasificación, selección, E/S, transformadas discretas de Fourier , álgebra lineal básica, operaciones estadísticas básicas, simulación aleatoria y mucho más.

— según el sitio web oficial del proyecto NumPy.

Intel cargó x86-simd-sort en el GitHub de la empresa para proporcionar a los usuarios una biblioteca de archivos de encabezado C++ para ayudar con la clasificación SIMD a un nivel de rendimiento superior. Raghuveer Devulapalli, uno de los ingenieros de Intel, fue crucial en la integración del código x86-simd-sort en NumPy. Sin embargo, la biblioteca de archivos solo se enfoca en AVX-512 y su clasificación rápida.

[The new x86-simd-sort is a] Biblioteca de archivos de encabezado C++ para clasificación de tipos de datos de 16 bits, 32 bits y 64 bits basada en SIMD en procesadores x86. Los archivos de encabezado de origen están disponibles en el directorio src. Actualmente solo tenemos una implementación de quicksort basada en AVX-512. Este repositorio también incluye un conjunto de pruebas que se puede construir y ejecutar para probar la corrección de los algoritmos de clasificación. También tiene un código de evaluación comparativa para comparar su rendimiento en relación con std::sort.

Michael Larabel, analista de Linux y editor del sitio web Phoronix, afirma que los resultados son increíblemente favorables, donde el aumento en la clasificación con AVX-512 ayudó al proyecto a mejorar el rendimiento entre diez y diecisiete veces.

Larabel señala que PR 22315 se introdujo en NumPy para «vectorizar la clasificación rápida para tipos de datos de 16 bits y 64 bits» a partir de la integración AVX-512. Continúa diciendo que los sistemas basados ​​en Tiger Lake, específicamente los que usan el Tiger Lake i7-1165G7 de 11.ª generación, fueron testigos de la velocidad más alta en la clasificación int de 16 bits (diecisiete veces mejor). Por el contrario, la clasificación flotante de 64 bits recibió la más baja (aumentada diez veces). Por último, los tipos de datos de 32 bits y las matrices aleatorias experimentaron una mejora de doce a trece veces mayor capacidad de clasificación. Puede ver los resultados de los puntos de referencia aquí.

Fuentes de noticias: Phoronix, Intel GitHub 1, 2

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/intel-fusiona-silenciosamente-la-nueva-biblioteca-avx-512-quicksort-con-una-mejora-de-hasta-17x/feed/ 0