Los videos de IA son extraños y extraños ahora. Pero, ¿hacia dónde se dirigen?


los videos cortos dar la impresión de un flipbook, saltando temblorosamente de un cuadro surrealista al siguiente. Son el resultado de los creadores de memes de Internet que jugaron con los primeros generadores de inteligencia artificial de texto a video ampliamente disponibles, y representan escenarios imposibles como Dwayne «The Rock» Johnson comiendo rocas y el presidente francés. emmanuel macron tamizar y masticar basura, o versiones distorsionadas de lo mundano, como Paris Hilton tomándose una selfie.

Esta nueva ola de videos generados por IA tiene claros ecos de Dall-E, que arrasó en Internet el verano pasado cuando realizó el mismo truco con imágenes fijas. Menos de un año después, esas imágenes torcidas de Dall-E son casi indistinguibles de la realidad, lo que plantea dos preguntas: ¿El video generado por IA avanzará tan rápido y tendrá un lugar en Hollywood?

ModelScope, un generador de video alojado por la firma de inteligencia artificial Hugging Face, permite a las personas escribir algunas palabras y recibir un video sorprendente y torcido a cambio. Runway, la compañía de inteligencia artificial que cocreó el generador de imágenes Stable Diffusion, anunció un generador de texto a video a fines de marzo, pero no lo ha puesto a disposición del público de manera generalizada. Y Google y Meta anunciaron que estaban trabajando en tecnología de texto a video en el otoño de 2022.

En este momento, son videos discordantes de celebridades o un oso de peluche pintando un autorretrato. Pero en el futuro, el papel de la IA en el cine podría evolucionar más allá del meme viral, permitiendo que la tecnología ayude a emitir películas, modelar escenas antes de filmarlas e incluso intercambiar actores dentro y fuera de las escenas. La tecnología avanza rápidamente y es probable que pasen años antes de que tales generadores puedan, por ejemplo, producir un cortometraje completo basado en indicaciones, si es que alguna vez pueden hacerlo. Aún así, el potencial de la IA en el entretenimiento es enorme.

“La forma en que Netflix revolucionó cómo y dónde vemos el contenido, creo que la IA tendrá una interrupción aún mayor en la creación real de ese contenido”, dice Sinead Bovell, futurista y fundadora de la empresa de educación tecnológica WAYE.

Pero eso no significa que la IA reemplazará por completo a los escritores, directores y actores en el corto plazo. Y quedan algunos obstáculos técnicos considerables. Los videos se ven nerviosos porque los modelos de IA aún no pueden mantener la coherencia total de un cuadro a otro, lo cual es necesario para suavizar las imágenes. Hacer contenido que dure más que unos pocos segundos fascinantes y grotescos y que mantenga su consistencia requerirá más potencia informática y datos, lo que significa grandes inversiones en el desarrollo de la tecnología. “No se puede escalar fácilmente estos modelos de imagen”, dice Bharath Hariharan, profesor de informática en la Universidad de Cornell.

Pero, aunque parezcan rudimentarios, la progresión de estos generadores está avanzando «muy, muy rápido», dice Jiasen Lu, científico investigador del Instituto Allen de Inteligencia Artificial, una organización de investigación fundada por el difunto cofundador de Microsoft, Paul Allen.

La velocidad de avance es el resultado de nuevos desarrollos que reforzaron los generadores. ModelScope está entrenado en datos de texto e imagen, como lo son los generadores de imágenes, y luego también alimenta videos que muestran al modelo cómo se mueve. debería mira, dice Apolinário Passos, un ingeniero de arte de aprendizaje automático en Hugging Face. Es la táctica que también utiliza Meta. Elimina la carga de anotar videos o etiquetarlos con descriptores de texto, lo que simplifica el proceso y ha dado paso a un rápido desarrollo de la tecnología.





Source link-46