optimizado – Magazine Office https://magazineoffice.com Vida sana, belleza, familia y artículos de actualidad. Wed, 15 May 2024 02:02:04 +0000 es hourly 1 https://wordpress.org/?v=6.5.4 Ghost of Tsushima para PC que requiere PSN se lanza en versión Beta, juego optimizado para Steam Deck https://magazineoffice.com/ghost-of-tsushima-para-pc-que-requiere-psn-se-lanza-en-version-beta-juego-optimizado-para-steam-deck/ https://magazineoffice.com/ghost-of-tsushima-para-pc-que-requiere-psn-se-lanza-en-version-beta-juego-optimizado-para-steam-deck/#respond Wed, 15 May 2024 02:02:01 +0000 https://magazineoffice.com/ghost-of-tsushima-para-pc-que-requiere-psn-se-lanza-en-version-beta-juego-optimizado-para-steam-deck/

Ghost of Tsushima Director’s Cut llega a PC esta semana y el desarrollador del port Nixxes ha presentado algunos detalles adicionales sobre el lanzamiento. Como informamos, Ghost of Tsushima es el último título publicado por Sony que genera controversia por requerir un inicio de sesión en PlayStation Network en PC. Por supuesto, GoT solo requiere PSN en PC para el modo multijugador Legends, puedes jugar la campaña para un jugador sin él, pero el juego aún ha sido eliminado de Steam en una larga lista de países sin acceso a PSN.

Bueno, curiosamente, Nixxes ahora afirma que el juego cruzado de consola de PC de Ghost of Tsushima, presumiblemente la razón principal por la que se requiere un inicio de sesión en PSN, se lanzará en “beta”.

“Como se anunció anteriormente, el modo multijugador cooperativo de Legends incluirá juego cruzado entre jugadores en consolas PS4, consolas PS5 y PC. Legends funcionará en PC en el lanzamiento, pero no se te emparejará automáticamente con jugadores en diferentes plataformas. El juego cruzado se lanzará en versión beta, lo que significa que podrás probarlo invitando a tus amigos de PlayStation Network”.

Como puede haber señalado, parece que esto podría ser que Sony se esté dando una salida: si hay demasiada reacción hacia PSN, simplemente pueden eliminar el requisito de PSN a medida que sacan el juego cruzado de la versión beta sin tener que dar marcha atrás oficialmente.

En otra rareza relacionada con PSN, Nixxes afirma que han optimizado completamente Ghost of Tsushima para Steam Deck y otras PC portátiles para juegos, pero el juego todavía aparece como «no compatible» porque, lo adivinaste, para acceder a PSN se requiere Windows.

“Sabemos que muchos de ustedes están ansiosos por jugar Ghost of Tsushima Director’s Cut en dispositivos de juegos portátiles como Steam Deck. Nos complace compartir que la experiencia para un jugador, incluida la expansión Iki Island, se puede disfrutar en Steam Deck y en PC portátiles para juegos similares, ya que hemos trabajado exhaustivamente para optimizar el rendimiento y ofrecer la mejor experiencia posible en estos dispositivos. Puedes notar que Steam marca el juego como «No compatible» para Steam Deck. Esto se debe al modo multijugador cooperativo de Legends que requiere que Windows acceda a las funciones integradas de PlayStation Network”.

Ghost of Tsushima Director’s Cut se lanza para PC el 16 de mayo y actualmente está disponible en PS4 y PS5.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/ghost-of-tsushima-para-pc-que-requiere-psn-se-lanza-en-version-beta-juego-optimizado-para-steam-deck/feed/ 0
Optimizado para CPU Xeon y Core Ultra, GPU Arc y aceleradores Gaudí https://magazineoffice.com/optimizado-para-cpu-xeon-y-core-ultra-gpu-arc-y-aceleradores-gaudi/ https://magazineoffice.com/optimizado-para-cpu-xeon-y-core-ultra-gpu-arc-y-aceleradores-gaudi/#respond Fri, 19 Apr 2024 13:59:25 +0000 https://magazineoffice.com/optimizado-para-cpu-xeon-y-core-ultra-gpu-arc-y-aceleradores-gaudi/

Por qué es importante: Como parte de su misión de llevar la IA a todas partes, Intel invierte en software y ecosistema de IA para garantizar que sus productos estén preparados para las últimas innovaciones en el espacio dinámico de la IA. En el centro de datos, los procesadores Gaudi y Xeon con aceleración Advanced Matrix Extension (AMX) brindan a los clientes opciones para cumplir con requisitos dinámicos y de amplio alcance.

Los procesadores Intel Core Ultra y los productos gráficos Arc brindan un vehículo de desarrollo local y una implementación en millones de dispositivos con soporte para marcos y herramientas de software integrales, incluidos PyTorch e Intel Extension para PyTorch utilizados para investigación y desarrollo local y el kit de herramientas OpenVINO para desarrollo e inferencia de modelos. .

Acerca de Llama 3 ejecutándose en Intel: Las pruebas iniciales y los resultados de rendimiento de Intel para los modelos Llama 3 8B y 70B utilizan software de código abierto, incluidos PyTorch, DeepSpeed, la biblioteca Optimum Habana e Intel Extension para PyTorch para proporcionar las últimas optimizaciones de software.

  • Los aceleradores Intel Gaudi 2 han optimizado el rendimiento en los modelos Llama 2 (parámetros 7B, 13B y 70B) y ahora tienen mediciones de rendimiento iniciales para el nuevo modelo Llama 3. Con la madurez del software Gaudí, Intel ejecutó fácilmente el nuevo modelo Llama 3 y generó resultados para inferencias y ajustes. Llama 3 también cuenta con el apoyo del acelerador Gaudí 3 recientemente anunciado.
  • Los procesadores Intel Xeon abordan cargas de trabajo exigentes de IA de extremo a extremo e Intel invierte en optimizar los resultados de LLM para reducir la latencia. Los procesadores Xeon 6 con núcleos de rendimiento (cuyo nombre en código es Granite Rapids) muestran una mejora del doble en la latencia de inferencia de Llama 3 8B en comparación con los procesadores Xeon de cuarta generación y la capacidad de ejecutar modelos de lenguaje más grandes, como Llama 3 70B, por debajo de 100 ms por token generado.
  • Intel Core Ultra y Arc Graphics ofrecen un rendimiento impresionante para Llama 3. En una ronda inicial de pruebas, los procesadores Core Ultra ya generan velocidades de lectura humanas más rápidas que las típicas. Además, la GPU Arc A770 tiene Xmi Aceleración de IA Matrix eXtensions (XMX) y 16 GB de memoria dedicada para proporcionar un rendimiento excepcional para cargas de trabajo de LLM.

Procesadores escalables Xeon

Intel ha estado optimizando continuamente la inferencia LLM para plataformas Xeon. Como ejemplo, en comparación con el lanzamiento de Llama 2, las mejoras del software en PyTorch e Intel Extension para PyTorch han evolucionado para ofrecer una reducción de latencia 5 veces mayor. La optimización utiliza la atención paginada y el tensor paralelo para maximizar la utilización informática disponible y el ancho de banda de la memoria. La Figura 1 muestra el rendimiento de la inferencia de Meta Llama 3 8B en la instancia AWS m7i.metal-48x, que se basa en el procesador escalable Xeon de cuarta generación.

llama3-aws-gráfico-de-rendimiento1

Comparamos Meta Llama 3 en un procesador Xeon 6 con núcleos Performance (anteriormente llamado Granite Rapids) para compartir una vista previa del rendimiento. Estos números de vista previa demuestran que Xeon 6 ofrece una mejora del doble en la latencia de inferencia de Llama 3 8B en comparación con los procesadores Xeon de cuarta generación ampliamente disponibles, y la capacidad de ejecutar modelos de lenguaje más grandes, como Llama 3 70B, por debajo de 100 ms por token generado en un solo dos. servidor de socket.

Modelo TP Precisión Longitud de entrada Longitud de salida Rendimiento Latencia* Lote
Meta-Llama-3-8B-Instrucción 1 fp8 2k 4k 1549.27

token/seg

7.747

EM

12
Meta-Llama-3-8B-Instrucción 1 bf16 1k 3k 469.11

token/seg

8.527

EM

4
Meta-Llama-3-70B-Instrucción 8 fp8 2k 4k 4927.31

token/seg

56,23

EM

277
Meta-Llama-3-70B-Instrucción 8 bf16 2k 2k 3574.81

token/seg

60.425

EM

216

Plataformas de clientes

En una ronda inicial de evaluación, el procesador Intel Core Ultra ya genera velocidades de lectura más rápidas que las típicas de los humanos. Estos resultados están impulsados ​​por la GPU Arc integrada con 8 núcleos Xe, aceleración AI DP4a incluida y hasta 120 GB/s de ancho de banda de memoria del sistema. Estamos entusiasmados de invertir en optimizaciones continuas de rendimiento y eficiencia energética en Llama 3, especialmente a medida que pasamos a nuestros procesadores de próxima generación.

Con soporte el día del lanzamiento para los procesadores Core Ultra y los productos gráficos Arc, la colaboración entre Intel y Meta proporciona tanto un vehículo de desarrollo local como una implementación en millones de dispositivos. El hardware del cliente Intel se acelera a través de herramientas y marcos de software integrales, incluidos PyTorch e Intel Extension para PyTorch utilizados para investigación y desarrollo local, y OpenVINO Toolkit para implementación e inferencia de modelos.

Que sigue: En los próximos meses, Meta espera introducir nuevas capacidades, tamaños de modelos adicionales y un rendimiento mejorado. Intel continuará optimizando el rendimiento de sus productos de IA para respaldar este nuevo LLM.



Source link-29

]]>
https://magazineoffice.com/optimizado-para-cpu-xeon-y-core-ultra-gpu-arc-y-aceleradores-gaudi/feed/ 0
OpenAI abre un centro en Tokio y agrega el modelo GPT-4 optimizado para japonés https://magazineoffice.com/openai-abre-un-centro-en-tokio-y-agrega-el-modelo-gpt-4-optimizado-para-japones/ https://magazineoffice.com/openai-abre-un-centro-en-tokio-y-agrega-el-modelo-gpt-4-optimizado-para-japones/#respond Mon, 15 Apr 2024 14:33:02 +0000 https://magazineoffice.com/openai-abre-un-centro-en-tokio-y-agrega-el-modelo-gpt-4-optimizado-para-japones/

OpenAI se está expandiendo a Japón con la apertura de una nueva oficina en Tokio y planes para un modelo GPT-4 optimizado específicamente para el idioma japonés.

La medida es importante por varias razones. Subraya la oportunidad que ve la empresa para cortejar negocios en el país y destaca cómo OpenAI probablemente necesitará localizar su tecnología en diferentes idiomas a medida que se expanda. Y, de manera más pragmática, a medida que los gobiernos, sus reguladores y el discurso público en general se centran más en los pros y los contras de la IA, tener los pies en el terreno se vuelve importante para que OpenAI comprenda e influya en esas corrientes a su favor.

OpenAI tiene un gran reconocimiento de nombre, pero no estará exento de competidores. SoftBank también espera construir y capitalizar la actual moda empresarial por la IA con el lanzamiento en noviembre pasado de SB Intuitions, cuyo objetivo es construir grandes modelos de lenguaje (LLM) y servicios generativos de IA de forma nativa en japonés.

El fabricante de ChatGPT, respaldado por Microsoft, tiene sólo 1.200 empleados en todo el mundo, una cifra pequeña si se tiene en cuenta que actualmente está valorado en unos 80.000 millones de dólares y está tratando de gestionar una gran cantidad de intereses entrantes. Ahora se está analizando detenidamente cómo escalar para satisfacer esa demanda. Abrió su primera oficina internacional en Londres el año pasado, seguida de su oficina inaugural de la Unión Europea (UE) en Dublín unos meses después. Tokio representará la primera oficina de OpenAI en Asia y la cuarta a nivel mundial (incluida su sede en San Francisco).

El director ejecutivo Sam Altman ha destacado la “rica historia de Japón de personas y tecnología que se unen para hacer más” entre sus razones para establecer una presencia formal en la región. Pero de manera más oportunista, los esfuerzos de expansión global de OpenAI hasta ahora han sido bastante estratégicos.

El Reino Unido es un importante centro para el talento en IA, mientras que la UE impulsa actualmente la agenda regulatoria de la IA. Japón ha sido uno de los mayores desarrolladores y adoptantes de robots humanoides y otro hardware impulsado por IA, y ocupó un lugar destacado durante la gira mundial de Altman el año pasado, cuando visitó al primer ministro japonés, Fumio Kishida, y habló sobre la intención de OpenAI de abrir una oficina en el país. Japón es el actual presidente del G7 y presidente del Proceso de IA de Hiroshima del G7, una iniciativa para promover la seguridad de la IA, incluida una gobernanza más sólida de la IA.

La elección de OpenAI para liderar el nuevo centro es notable. OpenAI Japón estará dirigida por Tadao Nagasaki, quien se une a la compañía después de 12 años en Amazon Web Services (AWS), donde dirigió la división de computación en la nube de Amazon en la región. En otras palabras, hacer crecer el perfil de OpenAI y sus negocios con las empresas es el objetivo principal de esta última expansión.

Emprendedor

Como presidente de OpenAI Japón, Nagasaki tendrá la tarea de formar un equipo local sobre el terreno para duplicar los negocios de OpenAI en el país. La compañía ya cuenta con Daikin (una empresa industrial mejor conocida por sus aires acondicionados), Rakuten y Toyota entre los clientes que utilizan la versión empresarial de ChatGPT de OpenAI, que según OpenAI incluye opciones adicionales de privacidad, análisis de datos y personalización además del consumidor estándar. -ChatGPT de grado.

OpenAI dice que los gobiernos locales también están utilizando ChatGPT para «mejorar la eficiencia de los servicios públicos en Japón».

GPT-4 personalizado para japonés

GPT-4 personalizado para japonés Créditos de imagen: OpenAI

ChatGPT domina desde hace mucho varios idiomas, incluido el japonés. Pero optimizar la última versión del GPT LLM subyacente específicamente para japonés le brindará una mejor comprensión de los matices del idioma japonés, incluida la comprensión cultural, lo que debería hacerlo más efectivo, particularmente en entornos comerciales como el servicio al cliente y la creación de contenido.

OpenAI también dice que su modelo personalizado viene con un rendimiento mejorado, lo que significa que debería funcionar más rápido y ser más rentable que su predecesor.

Por ahora, OpenAI está brindando acceso temprano al modelo personalizado GPT-4 a algunas empresas locales, y el acceso se abre gradualmente a través de la API de OpenAI «.en los próximos meses.»



Source link-48

]]>
https://magazineoffice.com/openai-abre-un-centro-en-tokio-y-agrega-el-modelo-gpt-4-optimizado-para-japones/feed/ 0
NVIDIA RTX HDR lleva HDR impulsado por IA a juegos de PC solo con SDR; El nuevo controlador Game Ready está optimizado para Nightingale https://magazineoffice.com/nvidia-rtx-hdr-lleva-hdr-impulsado-por-ia-a-juegos-de-pc-solo-con-sdr-el-nuevo-controlador-game-ready-esta-optimizado-para-nightingale/ https://magazineoffice.com/nvidia-rtx-hdr-lleva-hdr-impulsado-por-ia-a-juegos-de-pc-solo-con-sdr-el-nuevo-controlador-game-ready-esta-optimizado-para-nightingale/#respond Thu, 22 Feb 2024 21:05:44 +0000 https://magazineoffice.com/nvidia-rtx-hdr-lleva-hdr-impulsado-por-ia-a-juegos-de-pc-solo-con-sdr-el-nuevo-controlador-game-ready-esta-optimizado-para-nightingale/

Hoy, NVIDIA anunció y lanzó la nueva aplicación homónima que tiene como objetivo unificar las funciones de GeForce Experience y el antiguo Panel de control bajo un capó nuevo y más elegante.

Puedes leer todo sobre la aplicación NVIDIA en el artículo publicado en nuestra sección de Hardware. Aquí, sin embargo, nos centraremos en los dos filtros impulsados ​​por IA más interesantes disponibles a partir de hoy.

El RTX HDR es fácilmente la estrella del espectáculo aquí. En realidad, fue descubierto en una versión anterior del controlador Game Ready y expuesto por el modder emoose, quien anteriormente trajo a los jugadores de PC el contenedor DLSSTweaks que obliga a la compatibilidad con DLAA en juegos con DLSS. Los usuarios de PC más astutos ya lo comprobaron con ese mod, pero ahora está disponible para todos de una forma fácil y accesible.

NVIDIA dijo que sólo 10 de los 50 juegos más jugados en hardware GeForce ofrecen soporte nativo de alto rango dinámico. Este filtro Freestyle impulsado por IA tiene como objetivo implementar HDR automáticamente en innumerables juegos solo SDR con tecnología DirectX 9, DirectX 11, DirectX 12 y Vulkan.

Los requisitos son bastante sencillos. Necesitará Windows 11 (compilación del sistema operativo 22621), una pantalla HDR conectada a su PC, una tarjeta gráfica RTX 20+ y el controlador 551.52 como mínimo. El HDR en el juego, si es compatible con el juego, debería desactivarse, al igual que el AutoHDR de Windows similar de Microsoft. En cuanto a los juegos, deberán estar en modo de pantalla completa para utilizar RTX HDR.

Oficialmente, NVIDIA también dijo que la superresolución dinámica (DSR/DLDSR), el escalado de imagen de NVIDIA (NIS) y la sincronización rápida deben desactivarse antes de activar RTX HDR. Sin embargo, pude hacerlo funcionar incluso con DLDSR habilitado en Guild Wars 2 de ArenaNet. Como puedes ver a continuación, puedes modificar los siguientes parámetros a través de la superposición:

  • Brillo máximo (hasta un máximo dependiendo de las capacidades de luminancia de su pantalla)
  • Grises medios (liendres)
  • Contraste
  • Saturación

RTX HDR funciona muy bien para un filtro de IA que lo abarca todo. Por supuesto, siempre será preferible una implementación HDR nativa y optimizada, pero hay cientos de juegos de PC en los que esa no es una opción realista porque no recibirán más actualizaciones. Con RTX HDR de NVIDIA, finalmente puedes aprovechar las capacidades de alto rango dinámico de tu pantalla.

Para aquellos que aún no han comprado un monitor HDR, NVIDIA también ha agregado el filtro RTX Dynamic Vibrance. Como algunos usuarios veteranos de NVIDIA adivinarán fácilmente, esto se basa en la configuración de Intensidad digital, excepto que está mejorado con IA para garantizar que los colores se vean más vibrantes sin dañar la calidad de la imagen. Para RTX Dynamic Vibrance, los usuarios pueden ajustar la intensidad y aumentar la saturación.

Los requisitos son similares, excepto que, por supuesto, no necesitarás una pantalla HDR. Ambos filtros de estilo libre se pueden ajustar en el juego a través de la superposición de la aplicación NVIDIA y admiten la activación por juego a través de la configuración de gráficos de la aplicación NVIDIA.

Hoy, NVIDIA también lanzó un nuevo controlador Game Ready (versión 551.61), que optimiza Nightingale. El juego de creación de supervivencia creado por Inflexion es compatible con NVIDIA DLSS 3 (Frame Generation) y Reflex.

El controlador también agrega configuraciones óptimas para los siguientes juegos de PC:

  • Granblue Fantasy: volver a vincular
  • Ruiseñor
  • Unidad del Pacífico
  • Calavera y huesos

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/nvidia-rtx-hdr-lleva-hdr-impulsado-por-ia-a-juegos-de-pc-solo-con-sdr-el-nuevo-controlador-game-ready-esta-optimizado-para-nightingale/feed/ 0
Game Ready Driver 551.52 ya disponible, optimizado para Skull and Bones https://magazineoffice.com/game-ready-driver-551-52-ya-disponible-optimizado-para-skull-and-bones/ https://magazineoffice.com/game-ready-driver-551-52-ya-disponible-optimizado-para-skull-and-bones/#respond Thu, 15 Feb 2024 10:40:24 +0000 https://magazineoffice.com/game-ready-driver-551-52-ya-disponible-optimizado-para-skull-and-bones/

NVIDIA ha lanzado un nuevo controlador Game Ready para sus tarjetas gráficas GeForce. La versión 551.52 está disponible para descargar a través del sitio web oficial o mediante GeForce Experience.

Este controlador Game Ready ofrece optimizaciones para el tan esperado juego de combate de barcos piratas Skull and Bones de Ubisoft, que cuenta con NVIDIA DLSS 2 y soporte de iluminación global con trazado de rayos. Si bien la fecha de lanzamiento oficial está fijada para el 16 de febrero, los suscriptores de Ubisoft+ y/o propietarios de la Edición Premium ya pueden empezar a jugar Skull and Bones.

Aquí tienes un recordatorio de los requisitos del sistema del juego en caso de que te preguntes si tu equipo puede ejecutarlo.

Requisitos mínimos (1080p a 30 cuadros por segundo, preajuste bajo)

Sistema operativo Windows 10 (versión de 64 bits)
Procesador AMD Ryzen 5 1600 a 3,2 GHz, Intel Core i7-4790 a 3,6 GHz o mejor
RAM 8 GB (en modo de doble canal)
Tarjeta de video AMD Radeon RX 5500 XT (8 GB), NVIDIA GeForce GTX 1060 (6 GB) o mejor
Disco duro 65 GB de almacenamiento disponible (se requiere SSD)
Versión de DirectX DirectX 12

Requisitos recomendados (1080p a 60 cuadros por segundo, preajuste alto)
Sistema operativo Windows 10 (versión de 64 bits) o Windows 11
Procesador AMD Ryzen 5 3600 a 3,6 GHz, Intel Core i7-8700K a 3,7 GHz o mejor
RAM 16 GB (en modo de doble canal)
Tarjeta de video AMD Radeon RX 5700 XT (8 GB), NVIDIA GeForce RTX 2070 (8 GB) o mejor
Disco duro 65 GB de almacenamiento disponible (se requiere SSD)
Versión de DirectX DirectX 12

El controlador Game Ready 551.52 también corrige varios errores, como se describe en las notas de la versión oficial:

Errores de juego

  • Algunos usuarios pueden experimentar microtartamudeos intermitentes en los juegos cuando la sincronización vertical está habilitada
  • Red Dead Redemption 2: Se observa tartamudez en algunos portátiles Optimus avanzados
  • Immortals of Aveum: soluciona problemas de estabilidad durante el juego extendido

Errores generales

  • Se pueden observar posibles tartamudeos al desplazarse en navegadores web en determinadas configuraciones del sistema.

Los siguientes problemas conocidos siguen presentes con este controlador Game Ready:

Problemas abiertos

  • [Netflix] Problemas de visualización de vídeos al utilizar el navegador Edge. Se recomienda utilizar la aplicación Netflix de Windows como solución alternativa.
  • Serie GeForce GTX 10/RTX 20: la PC puede congelarse aleatoriamente cuando la programación de GPU acelerada por hardware de Windows y NVIDIA SLI están habilitados
  • La configuración del filtro NVIDIA Freestyle no se guarda después de salir de un juego

Además, los siguientes juegos ahora son compatibles con la optimización con un solo clic de GeForce Experience:

  • Helldivers 2
  • Escuadrón Suicida Mata a la Liga de la Justicia
  • Tres Reinos Zhao Yun

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/game-ready-driver-551-52-ya-disponible-optimizado-para-skull-and-bones/feed/ 0
NVIDIA contraataca a AMD y afirma que la GPU H100 AI ofrece un rendimiento un 47 % más rápido que el MI300X con software optimizado https://magazineoffice.com/nvidia-contraataca-a-amd-y-afirma-que-la-gpu-h100-ai-ofrece-un-rendimiento-un-47-mas-rapido-que-el-mi300x-con-software-optimizado/ https://magazineoffice.com/nvidia-contraataca-a-amd-y-afirma-que-la-gpu-h100-ai-ofrece-un-rendimiento-un-47-mas-rapido-que-el-mi300x-con-software-optimizado/#respond Sat, 16 Dec 2023 03:13:54 +0000 https://magazineoffice.com/nvidia-contraataca-a-amd-y-afirma-que-la-gpu-h100-ai-ofrece-un-rendimiento-un-47-mas-rapido-que-el-mi300x-con-software-optimizado/

NVIDIA ha lanzado un nuevo conjunto de puntos de referencia para su GPU H100 AI y la comparó con la MI300X recientemente presentada por AMD. El propósito de estos últimos puntos de referencia es mostrar cómo el H100 ofrece un rendimiento más rápido que la competencia utilizando el software adecuado, lo que no fue el caso durante la reciente presentación de su competidor.

NVIDIA pone a AMD en el asiento trasero: la GPU Hopper H100 de un año de antigüedad ofrece un rendimiento un 47 % más rápido que AMD MI300X en condiciones de evaluación comparativas adecuadas

Durante la presentación «Advancing AI», AMD lanzó su GPU Instinct MI300X, que pretende ser el comienzo de su viaje en IA en el segmento de centros de datos. La presentación incluyó varios números y puntos de referencia en los que la compañía comparó el MI300X con la GPU H100 de NVIDIA. AMD afirma que el MI300X ofrece un rendimiento hasta un 20% más rápido que el H100 cuando se compara con una sola GPU y hasta un 60% más rápido que el H100 cuando se compara un servidor de 8 GPU. NVIDIA no tarda en responder a estas pruebas y ha destacado que los resultados están lejos de la verdad.

La GPU NVIDIA H100 se lanzó en 2022 y ha experimentado varias mejoras en el lado del software. Las mejoras más recientes de TensorRT-LLM han impulsado un rendimiento aún mayor en cargas de trabajo específicas de IA junto con optimizaciones a nivel de kernel. NVIDIA afirma que todo esto permite que las GPU H100 AI ejecuten modelos como Llama 2 70B utilizando operaciones FP8. A continuación se muestran las cifras de rendimiento de la GPU con IA en Llama 2 70B presentadas por AMD durante el evento:

  • MI300X hasta un 40% más rápido que H100 (Llama 2 70B) en servidor 8v8
  • MI300X hasta un 20 % más rápido que H100 (Llama 2 70B) en una comparación 1 contra 1

AMD ejecutó los números utilizando sus bibliotecas optimizadas dentro de la suite ROCm 6.0 al comparar el Instinct MI300X con el Hopper H100. Sin embargo, no ocurrió lo mismo con la GPU NVIDIA H100, que no se probó con software optimizado como TensorRT-LLM. En los puntos de referencia publicados por NVIDIA, la compañía muestra el rendimiento real medido de un único servidor DGX H100 con hasta 8 GPU H100 ejecutando el modelo Llama 2 70B en el Lote 1.

Fuente de la imagen: NVIDIA

Notas a pie de página:

Las afirmaciones implícitas de AMD para H100 se miden según la configuración tomada de la nota al pie de página de la presentación de lanzamiento de AMD #MI300-38. Utilizando el software de inferencia vLLM v.02.2.2 con el sistema NVIDIA DGX H100, Llama 2 70B realiza una consulta con una longitud de secuencia de entrada de 2048 y una longitud de secuencia de salida de 128. Afirmaron un rendimiento relativo en comparación con DGX H100 con un sistema 8x GPU MI300X.

Para los datos medidos de NVIDIA, DGX H100 con 8 GPU NVIDIA H100 Tensor Core con 80 GB HBM3 con NVIDIA TensorRT-LLM disponible públicamente, v0.5.0 para el lote 1 y v0.6.1 para mediciones de umbral de latencia. Los detalles de la carga de trabajo son los mismos que en la nota al pie #MI300-38.

Los resultados muestran que, en comparación con lo que AMD mostró durante su evento, el servidor DGX H100 es 2 veces más rápido cuando utiliza flujos de trabajo de software optimizados. El servidor también es un 47% más rápido que la solución AMD MI300X de 8 GPU.

DGX H100 puede procesar una única inferencia en 1,7 segundos utilizando un tamaño de lote de uno; en otras palabras, una solicitud de inferencia a la vez. Un tamaño de lote de uno da como resultado el tiempo de respuesta más rápido posible para entregar un modelo. Para optimizar tanto el tiempo de respuesta como el rendimiento del centro de datos, los servicios en la nube establecen un tiempo de respuesta fijo para un servicio en particular. Esto les permite combinar múltiples solicitudes de inferencia en «lotes» más grandes y aumentar las inferencias generales por segundo del servidor. Los puntos de referencia estándar de la industria como MLPerf también miden el rendimiento con esta métrica de tiempo de respuesta fijo.

Pequeñas compensaciones en el tiempo de respuesta pueden generar factores x en la cantidad de solicitudes de inferencia que un servidor puede procesar en tiempo real. Utilizando un tiempo de respuesta fijo de 2,5 segundos, un servidor DGX H100 de 8 GPU puede procesar más de cinco inferencias Llama 2 70B por segundo, en comparación con menos de una por segundo con el lote uno.

a través de NVIDIA

El uso que hace NVIDIA de estos nuevos puntos de referencia es correcto en el sentido de que AMD también utilizó software optimizado para evaluar el rendimiento de sus GPU, así que ¿por qué no hacer lo mismo al probar el hardware de NVIDIA? La pila de software de NVIDIA en torno al ecosistema CUDA y ahora al mercado emergente de IA es sólida y requiere años de esfuerzo y desarrollo, mientras que ROCm 6.0 de AMD es nuevo y aún no se ha probado en un escenario de la vida real. Dicho esto, AMD ha cerrado una gran cantidad de acuerdos con empresas importantes como Microsoft, META y otras que ven sus GPU MI300X como una alternativa a las soluciones de IA de NVIDIA.

Se espera que Instinct MI300X y MI300A aumenten para el primer semestre de 2024, que es aproximadamente al mismo tiempo que NVIDIA presentará una GPU Hopper H200 aún más rápida, seguida de Blackwell B100 en el segundo semestre de 2024. Por lo tanto, parece que se espera que la competencia en el espacio de la IA aumente. aún más acalorado.

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/nvidia-contraataca-a-amd-y-afirma-que-la-gpu-h100-ai-ofrece-un-rendimiento-un-47-mas-rapido-que-el-mi300x-con-software-optimizado/feed/ 0
El M3 Max de Apple es más rápido que un RTX 4090 en la prueba de transcripción de voz susurrada de OpenAI, pero solo cuando se utiliza un punto de referencia no optimizado https://magazineoffice.com/el-m3-max-de-apple-es-mas-rapido-que-un-rtx-4090-en-la-prueba-de-transcripcion-de-voz-susurrada-de-openai-pero-solo-cuando-se-utiliza-un-punto-de-referencia-no-optimizado/ https://magazineoffice.com/el-m3-max-de-apple-es-mas-rapido-que-un-rtx-4090-en-la-prueba-de-transcripcion-de-voz-susurrada-de-openai-pero-solo-cuando-se-utiliza-un-punto-de-referencia-no-optimizado/#respond Fri, 15 Dec 2023 12:26:19 +0000 https://magazineoffice.com/el-m3-max-de-apple-es-mas-rapido-que-un-rtx-4090-en-la-prueba-de-transcripcion-de-voz-susurrada-de-openai-pero-solo-cuando-se-utiliza-un-punto-de-referencia-no-optimizado/

El M3 Max es el SoC de 3 nm más capaz de Apple diseñado para Mac, con un rendimiento multinúcleo superior al del M2 Ultra, y su GPU de 40 núcleos le da a una computadora portátil RTX 4080 un rendimiento decente por su dinero. A pesar de estas mejoras, todavía existe una disparidad entre las GPU de portátiles y el RTX 4090 ‘de gama alta’ de NVIDIA, pero en la última prueba de transcripción de voz, el M3 Max supera al procesador gráfico de consumo más rápido del mundo, bajo la prueba correcta. condiciones que es.

Con una herramienta optimizada, el M3 Max y el M2 Ultra simplemente no pueden competir con el RTX 4090 en la prueba de transcripción de voz.

Apple anunció recientemente un marco de código abierto llamado MLX, que está diseñado específicamente para la serie M de conjuntos de chips de la compañía. Los desarrolladores pueden utilizar este marco para diseñar, probar y mejorar sus proyectos, lo que Oliver Wehrens hizo con varias Mac, junto con una GPU RTX 4090, y proporcionó los resultados comparativos a continuación. El marco MLX utiliza Whisper, que es el modelo de reconocimiento de voz de OpenAI, y Wehrens realizó una prueba de transcripción para ver qué tan rápido se desempeñaban varios chips.

Con un archivo de audio de 10 minutos, los resultados de la prueba inicial muestran que el M2 Ultra y el M3 Max son sorprendentemente más rápidos que el RTX 4090 de escritorio, pero eso también se debe a que se ejecutó una herramienta no optimizada para realizar la prueba, como se muestra en el gráfico. Wehrens también proporcionó resultados utilizando la herramienta optimizada, y los resultados son los esperados; No hay competencia para el RTX 4090, ya que deja atrás al M2 Ultra, al M3 Max y a los SoC restantes.

En la prueba de actualización, el RTX 4090 completó la prueba de transcripción de audio en solo 8 segundos, mientras que el M2 Ultra terminó la misma prueba en 95 segundos, seguido por el M3 Max en 100 segundos. Los resultados actualizados muestran que la familia de la serie M de Apple tiene un largo camino por recorrer en términos de rendimiento bruto. Un área donde la línea de silicio personalizada muestra su fortaleza es la eficiencia energética, que consume considerablemente menos que la tarjeta gráfica insignia de consumo de NVIDIA.

Al final de la prueba, Wehrens proporciona un descargo de responsabilidad de que estos resultados no pretenden ser una medición científica, pero proporciona algunos datos sobre cuán capaz es realmente el marco MLX de Apple. Dado que está hecho a medida para Apple Silicon, una MacBook Pro equipada con el M1 Pro es tan rápida como una RTX 4090, siempre que no utilice ninguna herramienta optimizada de NVIDIA para ejecutar las pruebas.

Fuente de noticias: Oliver Wehrens

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/el-m3-max-de-apple-es-mas-rapido-que-un-rtx-4090-en-la-prueba-de-transcripcion-de-voz-susurrada-de-openai-pero-solo-cuando-se-utiliza-un-punto-de-referencia-no-optimizado/feed/ 0
El controlador GeForce Game Ready 546.33 ya está disponible, optimizado para las finales y Fortnite Capítulo 5 https://magazineoffice.com/el-controlador-geforce-game-ready-546-33-ya-esta-disponible-optimizado-para-las-finales-y-fortnite-capitulo-5/ https://magazineoffice.com/el-controlador-geforce-game-ready-546-33-ya-esta-disponible-optimizado-para-las-finales-y-fortnite-capitulo-5/#respond Tue, 12 Dec 2023 23:28:50 +0000 https://magazineoffice.com/el-controlador-geforce-game-ready-546-33-ya-esta-disponible-optimizado-para-las-finales-y-fortnite-capitulo-5/

NVIDIA anunció el lanzamiento de un nuevo controlador GeForce Game Ready (versión 546.33) optimizado para el competitivo shooter en primera persona de Embark, The Finals, Fortnite Capítulo 5 y la última actualización de Squad. Como de costumbre, puede descargar el controlador a través de GeForce Experience o directamente a través del sitio web.

El controlador GeForce Game Ready también agrega optimización con un solo clic a través de GeForce Experience para los siguientes juegos de PC:

  • Avatar: Fronteras de Pandora
  • El día antes
  • Los finales
  • Trono y libertad
  • Warhammer 40,000: Comerciante rebelde
  • Warhammer Age of Sigmar: Reinos de la ruina

En el resumen de noticias, NVIDIA se tomó el tiempo para resaltar el reciente hito ‘RTX 500’ y agregó que los siguientes juegos compatibles con RTX ya están disponibles o se lanzarán pronto:

  • Call of Duty: Warzone Temporada 1: disponible ahora con NVIDIA DLSS 3, NVIDIA DLAA y NVIDIA Reflex, que reduce la latencia del sistema hasta en un 28 %.
  • The Devourer: Hunted Souls: disponible ahora en acceso anticipado con DLSS 2.
  • The Finals: disponible ahora con trazado de rayos RTXGI, NVIDIA DLSS 3 (que duplica el rendimiento en promedio en 4K) y NVIDIA Reflex, que reduce la latencia del sistema hasta en un 57 %.
  • Fortnite Capítulo 5: disponible ahora con DLSS 2 y Reflex.
  • Sands of Aura: disponible ahora con DLSS 2.
  • SCUM: actualizaciones de DLSS 2 a DLSS 3 el 14 de diciembre.
  • Soulslinger: Envoy of Death: se lanza el 14 de diciembre con soporte DLSS 2 y DLAA.
  • Silent Rain: disponible ahora en acceso anticipado con DLSS 2.
  • Throne and Liberty: disponible ahora en Corea del Sur (el lanzamiento occidental se retrasó hasta 2024) con DLSS 3 y Reflex. NVIDIA dice que los jugadores de la serie GeForce RTX 40 pueden aumentar el rendimiento en un promedio de 2,6 veces en 4K con DLSS 3, usando la configuración máxima, y ​​en un promedio de 1,9 veces en 2560×1440 y 1920×1080.

NVIDIA también recordó a todos que las imágenes recientes publicadas para juegos como Black Myth: Wukong, The First Descendant y Mecha Break demostraban DLSS 3 y/u otras tecnologías RTX.

Por último, pero no menos importante, NVIDIA adelantó un próximo sorteo especial de RTX 500 concebido en asociación con Bethesda. Se publicarán más detalles sobre el sorteo a finales de esta semana a través de los canales sociales de GeForce, así que mantente atento a ellos si estás interesado.

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/el-controlador-geforce-game-ready-546-33-ya-esta-disponible-optimizado-para-las-finales-y-fortnite-capitulo-5/feed/ 0
Alan Wake 2 está muy bien optimizado en la serie PS5/Xbox, dice Remedy; Imágenes y rendimiento mejorados desde mayo https://magazineoffice.com/alan-wake-2-esta-muy-bien-optimizado-en-la-serie-ps5-xbox-dice-remedy-imagenes-y-rendimiento-mejorados-desde-mayo/ https://magazineoffice.com/alan-wake-2-esta-muy-bien-optimizado-en-la-serie-ps5-xbox-dice-remedy-imagenes-y-rendimiento-mejorados-desde-mayo/#respond Sun, 22 Oct 2023 11:03:37 +0000 https://magazineoffice.com/alan-wake-2-esta-muy-bien-optimizado-en-la-serie-ps5-xbox-dice-remedy-imagenes-y-rendimiento-mejorados-desde-mayo/

Alan Wake 2 está muy bien optimizado en PS5 y Xbox Series, dijo el director de comunicaciones de Remedy.

Hace unas horas, Thomas Puha de Remedy recurrió a Twitter para hablar sobre cómo se ejecuta la tan esperada secuela de Alan Wake en consolas. Según el Director de Comunicaciones, el equipo ha hecho un trabajo increíble asegurando que el rendimiento y las imágenes del juego sean tan buenas como pueden ser en las consolas de las series PS5 y Xbox. Como menciona Puha, la versión de consola de Alan Wake 2 es «genial». Lo mismo puede decirse de la versión para PC del juego, que se dice que es «tan buena como puede ser».

«Especialmente como jugador de consola, estoy muy contento de lo bueno que es Alan Wake 2 en plataformas de consola», Puha escribió en Twitter. «Nos concentramos mucho en ellos durante el desarrollo para garantizar que el juego funcionara bien y se viera tan increíble como lo hace. Nos concentramos en todas las plataformas para ser justos, lo mejor que pudimos».

En un tweet de seguimiento, Puha agregado«Sí. Tengo el rol no oficial de «experiencia del jugador», que es un término muy vago, pero me refiero a la calidad de la consola, ya que tenemos gente más que suficiente para impulsar la calidad de la PC al mejor nivel posible. «.

Cuando se le preguntó sobre las imágenes del juego en PlayStation 5, el Director de Comunicaciones se refirió a las imágenes del evento State of Play de mayo cuando se mostró el juego. Puha señaló que, desde entonces, el rendimiento y las imágenes han mejorado aún más.

«Eso es de mayo», enlazando al avance de revelación del juego de mayo de este año. «Así que hay más detalles en las imágenes, mejor rendimiento, gradación de color final real y muchas otras cosas que nos perdíamos en aquel entonces desde que el juego estaba en desarrollo».

Hemos incluido este avance de revelación del juego de PS5, que se ejecutó al 100% en PlayStation 5, a continuación para aquellos que aún no lo han visto:

Además de mencionar la versión de PS5, Puha también dijo que el juego se ve y funciona muy bien en Xbox Series X.

Aparte de mencionar «consolas», Puha no mencionó específicamente la versión Xbox Series S del juego, y será interesante ver cómo se ejecuta Alan Wake 2 y su rendimiento en la consola básica de Microsoft. A principios de este año, Puha habló sobre las limitaciones técnicas de la consola y cómo estas limitaciones deben tenerse en cuenta desde el principio del desarrollo.

Alan Wake 2 se lanza esta semana el 27 de octubre para Xbox Series X|S, PS5 y PC. Es posible que los jugadores de PC quieran consultar los requisitos oficiales del sistema del juego, ya que son bastante exigentes.

Comparte esta historia

Facebook

Gorjeo





Source link-29

]]>
https://magazineoffice.com/alan-wake-2-esta-muy-bien-optimizado-en-la-serie-ps5-xbox-dice-remedy-imagenes-y-rendimiento-mejorados-desde-mayo/feed/ 0
Game Ready Driver 537.42 ya disponible, optimizado para Cyberpunk 2077 2.0/Phantom Liberty https://magazineoffice.com/game-ready-driver-537-42-ya-disponible-optimizado-para-cyberpunk-2077-2-0-phantom-liberty/ https://magazineoffice.com/game-ready-driver-537-42-ya-disponible-optimizado-para-cyberpunk-2077-2-0-phantom-liberty/#respond Sat, 23 Sep 2023 18:35:41 +0000 https://magazineoffice.com/game-ready-driver-537-42-ya-disponible-optimizado-para-cyberpunk-2077-2-0-phantom-liberty/

Hoy, NVIDIA anunció el lanzamiento de un nuevo controlador Game Ready para sus tarjetas gráficas GeForce. La versión 537.42 está optimizada para Cyberpunk 2077 2.0/Phantom Liberty, el primer juego que admite la función DLSS 3.5 (Ray Reconstruction).

Jakub Knapik, vicepresidente de arte y director de arte global de CD PROJEKT RED, dijo:

Gracias a la tecnología inteligente de DLSS 3.5, impulsada por el poder de renderizado de IA, puedes experimentar Cyberpunk 2077: Dogtown, la ubicación más nueva de Phantom Liberty, en su máxima expresión, con imágenes más nítidas, iluminación más precisa y las velocidades de cuadro más altas posibles.

De hecho, DLSS 3.5 causa una gran impresión en combinación con el trazado de ruta. Cyberpunk 2077: Phantom Liberty es fácilmente el juego más impresionante y técnicamente avanzado que puedes jugar en este momento.

Como de costumbre, NVIDIA compartió sus propios puntos de referencia donde se muestra el RTX 4090 con un promedio de 102,3 FPS en el modo de rendimiento 4K DLSS con Frame Generation, mientras que el RTX 4080 funciona a 84,5 FPS. Las GPU de la serie RTX 40 más económicas también pueden obtener velocidades de cuadro sólidas, aunque a resoluciones más bajas.

Es probable que estas cifras de rendimiento se basen en el punto de referencia integrado. Por supuesto, su kilometraje puede variar a medida que avanza por Night City. En mi captura, promedí alrededor de 80 FPS en un juego aleatorio de mundo abierto de Dogtown mientras jugaba con la misma configuración, una GPU RTX 4090 y una CPU 7800X3D.

El nuevo controlador Game Ready también está optimizado para tres juegos lanzados esta semana: Party Animals, Warhaven y Witchfire. Con la excepción de Witchfire, todos estos juegos también están disponibles a través del servicio en la nube de GeForce NOW, y los suscriptores de GFN pueden habilitar las funciones DLSS y RTX. A diferencia de la mayoría de los controladores GeForce Game Ready, este no incluye ninguna corrección de errores del juego, aunque sí resuelve los siguientes errores con la aplicación Octane Render:

  • [Octane Render]: los sombreadores de intersección provocan una desaceleración en el rendimiento
  • [Octane Render]: comportamiento inconsistente y teclas de movimiento rotas usando TLAS con
    teclas numéricas=2

Comparte esta historia

Facebook

Gorjeo



Source link-29

]]>
https://magazineoffice.com/game-ready-driver-537-42-ya-disponible-optimizado-para-cyberpunk-2077-2-0-phantom-liberty/feed/ 0