Lo que necesitas saber
- Los científicos coreanos desarrollaron recientemente un nuevo modelo de generación de imágenes mediante IA llamado KOALA.
- A diferencia de otros modelos como Image Creator de Designer de Microsoft, la herramienta hace alarde de velocidades de generación de imágenes más rápidas.
- Aprovecha una nueva técnica denominada destilación de conocimientos, que comprime el tamaño de una herramienta de generación de imágenes de código abierto llamada Stable Diffusion XL.
- De esta manera, puede generar imágenes más rápido, incluso en PC antiguas con GPU obsoletas.
Un nuevo generador de imágenes impulsado por IA está en el horizonte y podría potencialmente asumir Creador de imágenes de Microsoft de Designer (anteriormente Bing Image Creator), Midjourney y Modelo DALL-E 3 de OpenAI.
La nueva herramienta puede generar imágenes en menos de dos segundos, significativamente más rápido que una herramienta de generación de imágenes promedio. Según un spot de Ciencia vivalos científicos surcoreanos detrás de este nuevo invento aprovecharon una nueva técnica denominada destilación de conocimiento, que comprime el tamaño de una herramienta de generación de imágenes de código abierto llamada Stable Diffusion XL.
A modo de contexto, Stable Diffusion XL presenta hasta 2,56 mil millones de parámetros. Como ya sabrás, la IA depende en gran medida del contenido existente, incluidas las imágenes, para su formación. Este gran conjunto de parámetros explica por qué generar imágenes puede llevar un poco de tiempo. Sin embargo, con esta nueva técnica, los científicos redujeron los parámetros de su modelo más pequeño, el KOALA, a 700 millones.
Como tal, la herramienta puede generar imágenes en una fracción de segundo. El modelo de generación de imágenes no requiere GPU de alta gama ni dispositivos sofisticados para funcionar sin problemas. Sólo requiere unos 8 GB de RAM para generar imágenes. Esencialmente, la técnica de destilación de conocimientos filtra la información del modelo grande al más pequeño sin afectar la calidad o el rendimiento. De esta forma, el modelo más pequeño es capaz de generar imágenes de calidad más rápido.
RELACIONADO: La velocidad de generación de imágenes de Microsoft Image Creator es insoportablemente dolorosa
De acuerdo a puntos de referencia compartidos por los científicosKOALA es significativamente más rápido que DALL-E 3 de OpenAI o DALL-E 2 modelos. Cuando se le pidió que generara «una imagen de un astronauta leyendo un libro bajo la luna en Marte», la primera tardó 13,7 segundos y la segunda 12,3 segundos. KOALA sólo tardó 1,6 segundos en generar la imagen.
Hay cinco versiones de KOALA. Tres versiones del modelo generan imágenes basadas en indicaciones de texto, mientras que las dos versiones restantes (Ko-LLaVA) pueden generar imágenes y videos (muy parecido a Modelo Sora de OpenAI).
Los científicos coreanos del Instituto de Investigación en Electrónica y Telecomunicaciones (ETRI) compartieron su trabajo y sus hallazgos en el repositorio de IA de código abierto. abrazando la cara y el base de datos arXiv.
Los científicos tienen la intención de integrar estos modelos en los servicios de generación de imágenes, producción de contenido y más existentes.