Microsoft Azure presenta máquinas virtuales impulsadas por GPU NVIDIA H100 destinadas a acelerar la IA generativa, incluido ChatGPT


Microsoft Azure ha anunciado sus nuevas máquinas virtuales impulsadas por las GPU H100 de primera línea de NVIDIA para acelerar la IA generativa como ChatGPT.

Las GPU H100 de NVIDIA están impulsando las últimas máquinas virtuales de Microsoft Azure que impulsan el contenido generativo de IA, incluido ChatGPT

Presione soltar: Cumplir la promesa de IA avanzada para nuestros clientes requiere una infraestructura, servicios y experiencia de supercomputación para abordar el tamaño y la complejidad exponencialmente crecientes de los últimos modelos.

En Microsoft, estamos enfrentando este desafío al aplicar una década de experiencia en supercomputación y admitir las cargas de trabajo de capacitación de IA más grandes para crear una infraestructura de IA capaz de un rendimiento masivo a escala. La nube de Microsoft Azure, y específicamente nuestras máquinas virtuales aceleradas (VM) de la unidad de procesamiento de gráficos (GPU), proporcionan la base para muchos avances de IA generativa tanto de Microsoft como de nuestros clientes.

El codiseño de supercomputadoras con Azure ha sido crucial para escalar nuestras exigentes necesidades de capacitación en IA, haciendo posible nuestro trabajo de investigación y alineación en sistemas como ChatGPT..”—Greg Brockman, presidente y cofundador de OpenAI.

La serie de máquinas virtuales de IA más potente y escalable masivamente de Azure

Hoy, Microsoft presenta la VM ND H100 v5 que permite a pedido en tamaños que van desde ocho hasta miles de GPU NVIDIA H100 interconectadas por la red NVIDIA Quantum-2 InfiniBand. Los clientes verán un rendimiento significativamente más rápido para los modelos de IA que nuestras máquinas virtuales ND A100 v4 de última generación con tecnologías innovadoras como:

  • 8 GPU NVIDIA H100 Tensor Core interconectadas a través de NVSwitch y NVLink 4.0 de última generación
  • NVIDIA Quantum-2 CX7 InfiniBand de 400 Gb/s por GPU con 3,2 Tb/s por VM en una red fat-tree sin bloqueo
  • NVSwitch y NVLink 4.0 con ancho de banda biseccional de 3,6 TB/s entre 8 GPU locales dentro de cada VM
  • Procesadores escalables Intel Xeon de cuarta generación
  • Interconexión de host PCIE Gen5 a GPU con un ancho de banda de 64 GB/s por GPU
  • 16 canales de DIMM DDR5 de 4800 MHz

Entrega de supercomputadoras de inteligencia artificial a exaescala a la nube

Las aplicaciones de IA generativa están evolucionando rápidamente y agregando un valor único en casi todas las industrias. Desde la reinvención de la búsqueda con un nuevo Microsoft Bing y Edge impulsado por IA hasta la asistencia impulsada por IA en Microsoft Dynamics 365, la IA se está convirtiendo rápidamente en un componente omnipresente del software y de cómo interactuamos con él, y nuestra infraestructura de IA estará allí para allanar el camino. .

Con nuestra experiencia en la entrega de supercomputadoras ExaOP múltiples a clientes de Azure en todo el mundo, los clientes pueden confiar en que pueden lograr un verdadero rendimiento de supercomputadora con nuestra infraestructura. Para Microsoft y organizaciones como Inflection, NVIDIA y OpenAI que se han comprometido con implementaciones a gran escala, esta oferta permitirá una nueva clase de modelos de IA a gran escala.

«Nuestro enfoque en la IA conversacional requiere que desarrollemos y entrenemos algunos de los modelos de lenguaje grande más complejos. La infraestructura de IA de Azure nos brinda el rendimiento necesario para procesar de manera eficiente estos modelos de manera confiable a gran escala. Estamos encantados con las nuevas máquinas virtuales en Azure y el mayor rendimiento que aportarán a nuestros esfuerzos de desarrollo de IA..»—Mustafa Suleyman, director ejecutivo de Inflection.

La IA a escala está integrada en el ADN de Azure. Nuestras inversiones iniciales en la investigación de grandes modelos de lenguaje, como Turing, y los hitos de ingeniería, como la construcción de la primera supercomputadora de IA en la nube, nos prepararon para el momento en que la inteligencia artificial generativa se hizo posible.

Los servicios de Azure como Azure Machine Learning hacen que nuestra supercomputadora de IA sea accesible para los clientes para el entrenamiento de modelos y Azure OpenAI Service permite a los clientes aprovechar el poder de los modelos de IA generativos a gran escala. La escala siempre ha sido nuestra estrella polar para optimizar Azure para IA. Ahora estamos brindando capacidades de supercomputación a nuevas empresas y empresas de todos los tamaños, sin requerir el capital para inversiones masivas en hardware físico o software.

NVIDIA y Microsoft Azure han colaborado a través de múltiples generaciones de productos para llevar innovaciones líderes en inteligencia artificial a empresas de todo el mundo. Las máquinas virtuales NDv5 H100 ayudarán a impulsar una nueva era de aplicaciones y servicios de IA generativa.”—Ian Buck, vicepresidente de computación de hiperescala y alto rendimiento en NVIDIA.

Hoy anunciamos que ND H100 v5 está disponible para su versión preliminar y se convertirá en una oferta estándar en la cartera de Azure, lo que permitirá a cualquiera desbloquear el potencial de la IA a escala en la nube. Regístrese para solicitar acceso a las nuevas máquinas virtuales.

Comparte esta historia

Facebook

Gorjeo



Source link-29