Olvídese de texto a imagen; esta IA hace videos a partir de tus indicaciones


Es probable que haya escuchado acerca de los sorprendentes resultados logrados por la IA de texto a imagen, como Dall-E, Stable Diffusion y Midjourney. Como era de esperar, la revolución avanza y el próximo objetivo son las herramientas de inteligencia artificial de texto a video.

Google y Meta se han burlado de sus capacidades de texto a video en informes de investigación de sus laboratorios de inteligencia artificial, pero esta tecnología avanzada no ha estado disponible para el público. Si ha estado esperando ansiosamente la oportunidad de intentar crear videos completos con un simple aviso de IA, ahora es su oportunidad, gracias a QuickVid.

Antes de que sus expectativas suban demasiado, es importante darse cuenta de que esto no es equivalente a generar miles de imágenes fijas de difusión estable y ensamblarlas para crear un video u obtener acceso a los sistemas de inteligencia artificial más avanzados del mundo para la generación de videos reales. Esta es una entrada muy temprana en la carrera por una solución de texto a video.

El primer paso del proceso para la IA es generar un script basado en su indicación. Probé el sistema creando un corto de YouTube con estas palabras: «Un video de un dron DJI volando sobre un astronauta en Marte, que termina con una toma de reacción del astronauta sorprendido».

La IA escribió una narración completa de 79 palabras a partir de mi mensaje, luego sintetizó el discurso con la opción de una voz masculina o femenina. TechCrunch señaló que el video de fondo elegido para el video generado se tomó de una biblioteca de archivos y aparentemente había muchas imágenes de «astronautas en Marte».

Como toque final cuestionable, QuickVid superpone el guión como títulos y agrega imágenes en miniatura generadas por la API de Dall-E. El corto resultante de YouTube que se ve arriba es… interesante. Tal vez, manejaría mejor los videos más terrenales.

En una entrevista de TechCrunch, el desarrollador de QuickVid dijo que se avecinan mejoras y que llegarán más opciones de personalización en enero. Eventualmente, QuickVid también incluirá leyendas y avatares de soporte.

El próximo año podrían llegar muchas más soluciones de texto a video, junto con otras maravillas visuales, como anteojos AR y auriculares VR más avanzados. Debería ser emocionante.

Recomendaciones de los editores








Source link-34