La difusión estable optimizada para Intel Silicon aumenta el rendimiento de Arc A770 en un 54 %


Stable Diffusion WebUI de Automatic1111 ahora funciona con hardware Intel GPU, gracias a la integración del kit de herramientas OpenVINO de Intel que toma modelos de IA y los optimiza para ejecutarse en hardware Intel. Hemos vuelto a probar la última versión de Stable Diffusion para ver qué tan rápidas son las GPU de Intel en comparación con nuestros resultados anteriores, con ganancias del 40 al 55 por ciento.

Stable Diffusion (que actualmente tiene nuestras pruebas anteriores, aunque estamos trabajando para actualizar los resultados) es un modelo de inteligencia artificial de aprendizaje profundo que se utiliza para generar imágenes a partir de descripciones de texto. Lo que hace que Stable Diffusion sea especial es su capacidad para ejecutarse en hardware de consumo local. La comunidad de IA tiene muchos proyectos, siendo Stable Diffusion WebUI el más popular. Proporciona una interfaz de navegador que es fácil de usar y experimentar.

Después de meses de trabajo en segundo plano (hemos estado escuchando rumores de esto por un tiempo), las últimas actualizaciones ahora están disponibles para los propietarios de Intel Arc y brindan un impulso sustancial al rendimiento.

Ver más

Estos son los resultados de nuestras pruebas anteriores y actualizadas de Stable Diffusion. Utilizamos un OpenVINO de difusión estable ligeramente modificado para nuestras pruebas anteriores, y hemos vuelto a probar con la bifurcación de Automatic1111 webui con OpenVINO. También volvimos a probar varias de las GPU de AMD con una versión más nueva de Stable Diffusion basada en Shark de Nod.ai. Los resultados de Nvidia no se han actualizado, aunque volveremos a probar con la última versión en un futuro cercano (y actualizaremos el artículo principal de los puntos de referencia de Stable Diffusion cuando hayamos terminado).

Debemos tener en cuenta que también cambiamos nuestro aviso, lo que hace que los nuevos resultados sean generalmente más exigentes. (El nuevo indicador es «sala desordenada», que tiende a tener muchos detalles pequeños en las imágenes que requieren más esfuerzo para que la IA los genere). Hay variaciones entre las ejecuciones, y hay advertencias que se aplican específicamente a Arc en este momento, pero aquí están los resultados antes/después.

(Crédito de la imagen: futuro)

(Crédito de la imagen: futuro)

Las GPU Intel ARC y AMD muestran un rendimiento mejorado, y la mayoría ofrece ganancias significativas. El Arc A770 de 16 GB mejoró un 54 %, mientras que el A750 mejoró un 40 % en el mismo escenario. (Utilizamos las tarjetas de edición limitada A770 para las pruebas, que ahora están descontinuadas, aunque Acer, ASRock, Sparkle y Gunnir aún ofrecen tarjetas de 16 GB).

Nod.ai tampoco se ha quedado quieto. Las RX 6800, RX 6750 XT y RX 6700 de 10 GB de AMD son todas más rápidas, y las 6800 y 6700 de 10 GB en particular muestran grandes ganancias. No estamos seguros de por qué la 6750 XT no funcionó tan bien, pero la RX 6800 experimentó un aumento del rendimiento del 34 % y la RX 6700 de 10 GB experimentó una mejora aún mayor del 76 %. La RX 6750 XT, por alguna razón, solo experimentó un mísero aumento del 9%, a pesar de que las tres GPU AMD comparten la misma arquitectura RDNA2. (Volveremos a probar otras GPU, incluidas las piezas más nuevas de la serie RX 7000 de AMD, en un futuro próximo).

Nuevamente, no volvimos a probar las tres GPU de la serie Nvidia RTX 40, por lo que las estadísticas de rendimiento siguen siendo idénticas entre los dos gráficos. Aun así, con las nuevas optimizaciones de OpenVINO, los Arc A750 y A770 de Intel ahora pueden superar al RTX 4060, y el A770 de 16 GB está muy cerca del RTX 4060 Ti.

Todavía hay mucho trabajo en curso, incluida la simplificación de la instalación y las correcciones para que funcionen otras resoluciones de imagen y modelos de difusión estable. Tuvimos que confiar en el modelo predeterminado «v1-5-pruned-emaonly.safetensors», ya que los nuevos «v2-1_512-ema-pruned.safetensors» y «v2-1_768-ema-pruned.safetensors» no pudieron generar producción.

Además, la generación de 768×768 actualmente falla en las GPU de Arc: podríamos hacer hasta 720×720, pero 744×744 terminó cambiando a la generación basada en CPU. Sin embargo, se nos dice que una solución para el soporte de 768×768 debería llegar relativamente pronto, por lo que los usuarios de Arc deben estar atentos a esa actualización.

Actualización, 17/08/2023: La solución es en vivo. Para que funcione 768×768, vaya al directorio donde instaló Stable Diffusion OpenVINO y ejecute: «venvScriptsactivate» y luego «pip install –pre openvino==2023.1.0.dev20230811» y generación de mayor resolución Las imágenes deberían funcionar. Probamos con éxito 768×768 en un A750, donde anteriormente incluso el A770 de 16 GB fallaba y parecía quedarse sin VRAM.





Source link-41