Todas las novedades de Nvidia anunciadas por Jensen Huang en Computex


Jensen Huang quiere para llevar la IA generativa a todos los centros de datos, dijo hoy el cofundador y director ejecutivo de Nvidia durante Computex en Taipei. Durante el discurso, el primer discurso público de Huang en casi cuatro años, dijo, hizo una serie de anuncios, incluidas las fechas de lanzamiento del chip, su supercomputadora DGX GH200 y asociaciones con empresas importantes. Aquí están todas las noticias del discurso de apertura de dos horas de duración.

1. La GPU GForce RTX 4080 Ti de Nvidia para jugadores ahora está en plena producción y se produce en «grandes cantidades» con socios en Taiwán.

2. Huang anunció Nvidia Avatar Cloud Engine (ACE) para juegos, un servicio de fundición de modelos de IA personalizable con modelos preentrenados para desarrolladores de juegos. Le dará a los NPC más carácter a través de interacciones de lenguaje impulsadas por IA.

3. El modelo informático Nvidia Cuda ahora sirve a cuatro millones de desarrolladores y más de 3000 aplicaciones. Cuda vio 40 millones de descargas, incluidas 25 millones solo el año pasado.

4. Ha comenzado la producción de volumen completo del servidor GPU HGX H100 y está siendo fabricado por «compañías en todo Taiwán», dijo Huang. Agregó que es la primera computadora del mundo que tiene un motor transformador.

5. Huang se refirió a la adquisición del fabricante de chips de supercomputadora Mellanox por parte de Nvidia en 2019 por $ 6.9 mil millones como «una de las decisiones estratégicas más importantes» que jamás haya tomado.

6. La producción de la próxima generación de GPU Hopper comenzará en agosto de 2024, exactamente dos años después de que comenzara la fabricación de la primera generación.

7. La GH200 Grace Hopper de Nvidia ya está en plena producción. El superchip impulsa 4 PetaFIOPS TE, 72 CPU Arm conectadas por enlace de chip a chip, 96 GB HBM3 y 576 GPU de memoria. Huang describió como el primer procesador informático acelerado del mundo que también tiene una memoria gigante: «esto es una computadora, no un chip». Está diseñado para aplicaciones de centros de datos de alta resiliencia.

8. Si la memoria de Grace Hopper no es suficiente, Nvidia tiene la solución: la DGX GH200. Se hace conectando primero ocho Grace Hoppers junto con tres conmutadores NVLINK, luego conectando los pods juntos a 900 GB juntos. Luego, finalmente, se unen 32, con otra capa de interruptores, para conectar un total de 256 chips Grace Hopper. El ExaFLOPS Transformer Engine resultante tiene una memoria GPU de 144 TB y funciona como una GPU gigante. Huang dijo que Grace Hopper es tan rápido que puede ejecutar la pila 5G en el software. Google Cloud, Meta y Microsoft serán las primeras empresas en tener acceso al DGX GH200 y realizarán una investigación sobre sus capacidades.

9. Nvidia y SoftBank se asociaron para introducir el superchip Grace Hopper en los nuevos centros de datos distribuidos de SoftBank en Japón. Podrán alojar aplicaciones inalámbricas y de inteligencia artificial generativa en una plataforma de servidor común de múltiples inquilinos, lo que reducirá los costos y la energía.

10. La asociación SoftBank-Nvidia se basará en la arquitectura de referencia Nvidia MGX, que actualmente se utiliza en asociación con empresas en Taiwán. Brinda a los fabricantes de sistemas una arquitectura de referencia modular para ayudarlos a construir más de 100 variaciones de servidor para IA, computación acelerada y usos omniversos. Las empresas en la asociación incluyen ASRock Rack, Asus, Gigabyte, Pegatron, QCT y Supermicro.

11. Huang anunció la plataforma de red acelerada Spectrum-X para aumentar la velocidad de las nubes basadas en Ethernet. Incluye el switch Spectrum 4, que cuenta con 128 puertos de 400GB por segundo y 51.2T por segundo. El conmutador está diseñado para habilitar un nuevo tipo de Ethernet, dijo Huang, y fue diseñado de extremo a extremo para realizar enrutamiento adaptativo, aislar el rendimiento y realizar computación en la estructura. También incluye el Bluefield 3 Smart Nic, que se conecta al conmutador Spectrum 4 para realizar el control de congestión.

12. WPP, la agencia de publicidad más grande del mundo, se asoció con Nvidia para desarrollar un motor de contenido basado en Nvidia Omniverse. Será capaz de producir contenido de fotos y videos para ser utilizado en publicidad.

13. La plataforma robótica Nvidia Isaac ARM ahora está disponible para cualquiera que quiera construir robots, y es una pila completa, desde chips hasta sensores. Isaac ARM comienza con un chip llamado Nova Orin y es la primera pila de referencia completa de robótica, dijo Huang.

Gracias en gran medida a su importancia en la informática de IA, las acciones de Nvidia se dispararon durante el año pasado y actualmente tiene una valoración de mercado de alrededor de $ 960 mil millones, lo que la convierte en una de las compañías más valiosas del mundo (solo Apple, Microsoft, Saudi Aramco, Alphabet y Amazon están clasificados más arriba).

Negocios en China en el limbo

Sin duda, las empresas de IA de China están observando de cerca el silicio de última generación que Nvidia está poniendo sobre la mesa. Mientras tanto, probablemente teman otra ronda de prohibiciones de chips en EE. UU. que amenazan con socavar su avance en la IA generativa, que requiere mucha más potencia informática y datos que las generaciones anteriores de IA.

El año pasado, el gobierno de EE. UU. impidió que Nvidia vendiera sus unidades de procesamiento gráfico A100 y H100 a China. Ambos chips se utilizan para entrenar modelos de lenguaje grandes como GPT-4 de OpenAI. H100, su chip de última generación basado en la arquitectura de computación GPU Nvidia Hopper con su motor de transformador incorporado, está experimentando una demanda particularmente fuerte. En comparación con A100, H100 puede ofrecer un entrenamiento de IA 9 veces más rápido y una inferencia de IA hasta 30 veces más rápida en LLM.

Obviamente, China es un mercado demasiado grande como para perdérselo. La prohibición de exportación de chips le costaría a Nvidia un estimado de $ 400 millones en ventas potenciales solo en el tercer trimestre del año pasado. Por lo tanto, Nvidia recurrió a vender a China un chip más lento que cumple con las normas de control de exportaciones de EE. UU. Pero a largo plazo, China probablemente buscará alternativas más sólidas, y la prohibición sirve como un recordatorio conmovedor para que China logre la autosuficiencia en sectores tecnológicos clave.

Como dijo recientemente Huang en una entrevista con el Financial Times: “Si [China] no se puede comprar de… los Estados Unidos, simplemente lo construirán ellos mismos. Así que Estados Unidos tiene que tener cuidado. China es un mercado muy importante para la industria de la tecnología”.



Source link-48