En marcado contraste con las IA generativas de texto a imagen, no hay casi nada disponible para video. Pero eso puede cambiar pronto, ya que la empresa emergente Runway ha revelado recientemente su nuevo modelo de IA: Gen-2.
Con un funcionamiento similar a Stable Diffusion (que, por cierto, Runway participó en la creación), Gen-2 funciona tomando indicaciones de texto para crear videos desde cero. Como se ve en el sitio web del desarrollador (se abre en una pestaña nueva), puede crear tomas aéreas de una cadena montañosa o una puesta de sol fuera de un loft en la ciudad de Nueva York. Una actualización de texto a video puede no parecer tan impresionante al principio, pero lo es si la comparas con el esfuerzo anterior de Runway.
En febrero, el desarrollador lanzó su Modelo Gen-1 (se abre en una pestaña nueva) que era más un editor de video. Requería algún tipo de base, como una animación 3D sin terminar o una persona, antes de que el modelo superpusiera ese metraje con un video creado por IA. La antigua IA no podía crear nada desde cero.
Modos de IA
Los fanáticos del modelo anterior podrán seguir disfrutando de Gen-1, ya que sus características se convertirán en modos separados en Gen-2.
El modo 01, sin embargo, es el componente principal de la función de texto a video. El segundo modo nuevo le permite agregar una imagen a un mensaje de texto para producir mejores resultados. Y con el tercer modo, solo carga una imagen para generar un video. No se requerirá un mensaje de texto.
Todo más allá del Modo 03 es todo Cosas Gen-1 (se abre en una pestaña nueva). Modo 04: la estilización aplica los «estilos de cualquier mensaje de imagen a cada cuadro de su video» como si agregara un efecto de fuego. Modo 05: Storyboard convierte imágenes de maquetas en videos renderizados por IA. El siguiente es Máscara para aislar sujetos y modificarlos con indicaciones simples como «Agregue puntos a un labrador para crear un dálmata». El séptimo es Render, donde la IA genera un video sobre un render 3D. El último, Customization, hace lo mismo que Render, pero con personas.
Disponibilidad
Esta tecnología aún se encuentra en sus primeras etapas. Las vistas previas del carrete de demostración tienen un aspecto bastante extraño, por decir lo menos. Están en lo profundo del valle misterioso mientras los edificios se funden unos con otros y la gente luce miradas vacías. Aun así, la posibilidad de tener una IA generativa de texto a video disponible públicamente es emocionante. Puede abrir nuevas vías para la creatividad (o la desinformación). Algunos gigantes tecnológicos han incursionado en el video de IA antes, como Google y su proyecto Imagen Vídeopero esos modelos siguen a puertas cerradas.
algunos informes (se abre en una pestaña nueva) afirma que hay una lista de espera para el acceso anticipado a Gen-2 en el canal privado Discord de Runway. Sin embargo, la única versión beta que encontramos es para Gen-1. Es posible que haya una versión beta Gen-2 más adelante en el año, aunque no hay noticias oficiales en este momento. Mientras tanto, puede unirse al canal Discord para obtener actualizaciones a través del sitio web de Runway.