La aplicación más nueva de D-ID utiliza IA para crear videos a partir de fotografías


D-ID, la startup con sede en Tel Aviv más conocida como la tecnología detrás de esos videos virales de fotos familiares animadas, está incorporando su tecnología de video de inteligencia artificial a una nueva aplicación móvil que se lanza hoy. Originalmente disponible como plataforma web, Creative Reality Studio de D-ID permite a los usuarios cargar una imagen fija y un guión y luego convertirlos en un video generado por IA. La tecnología se puede utilizar para crear representaciones digitales de ellos mismos, personajes históricos, personajes de ficción, presentadores o embajadores de marca.

Los primeros casos de uso a los que se había dirigido la empresa incluían capacitación y educación corporativa, comunicación interna y externa de las empresas, y marketing y ventas de productos, informó TechCrunch anteriormente.

Ahora disponible en dispositivos móviles, los usuarios descargarán la aplicación D-ID desde App Store o Google Play y luego crearán una cuenta o iniciarán sesión, si ya están registrados. En la pantalla de selección, puede elegir una “persona digital” prefabricada que proporciona D-ID o cargar una imagen de la biblioteca de fotos de su teléfono. Luego ingresará el texto que desea que diga la persona digital, eligiendo entre 119 idiomas, y también podrá elegir entre opciones de voz masculina y femenina. También puedes elegir el tono del discurso: alegre, emocionado, amigable, esperanzado, noticiero, triste, gritador, aterrorizado, antipático, susurrante y otros.

Créditos de imagen: HIZO

Para funcionar, D-ID está aprovechando una combinación de tecnologías de inteligencia artificial de código abierto y patentadas para impulsar sus plataformas, dice el director ejecutivo de D-ID, Gil Perry.

“En esencia se encuentra un modelo fundamental capaz de generar fotogramas de vídeo basados ​​en la entrada de audio. Todos sus productos funcionan con su sólida API con la capacidad de renderizar vídeo a 100 FPS, líder en la industria, cuatro veces más rápido que el renderizado en tiempo real”, afirma.

«La audiencia principal son los entusiastas de la IA, pero es relevante para cualquiera que quiera publicar videos protagonizados por personas digitales, ya sean versiones de ellos mismos o de cualquier persona que puedan imaginar: personajes históricos, personajes de ficción, antepasados, etc.», dice Perry. «La aplicación permite la generación de videos sobre la marcha, lo que reduce el costo de producción a escala y permite la flexibilidad de producir videos en cualquier lugar».

Créditos de imagen: HIZO

Los videos pueden durar hasta 10 minutos y están sujetos a las mismas políticas de moderación que la versión web; es decir, la compañía está trabajando para garantizar que la tecnología no se utilice para deepfakes que propaguen información errónea y campañas de desinformación. La compañía también se ha comprometido a respetar los derechos de autor, adherirse a las regulaciones de IA y a no conceder licencias de su tecnología a sabiendas a lo que llama “áreas contenciosas”, incluidos partidos políticos, editores de pornografía, organizaciones terroristas y fabricantes de armas.

Antes del lanzamiento móvil, la versión de escritorio de Creative Reality Studio ha registrado 60.000 nuevos registros por día, y ya se han realizado más de 150 millones de videos utilizando la plataforma, nos dice Perry. Además, la API del servicio cuenta con más de 200.000 usuarios.

Con su llegada a los dispositivos móviles, D-ID puede llegar a un mercado más amplio, incluidos los usuarios que utilizan primero dispositivos móviles o solo dispositivos móviles. Esto incluye tanto a los usuarios existentes que están interesados ​​en utilizar una versión más sencilla de Studio para dispositivos móviles como a los nuevos usuarios del público en general, incluidos los consumidores.

El nuevo servicio móvil estará basado en suscripción, con planes a partir de $5,99 por mes. Los usuarios que ya están suscritos a la versión de escritorio pueden conservar sus planes existentes. También está disponible una prueba gratuita de 14 días.

Aunque tiene su sede en Tel Aviv, D-ID tiene empleados en otros mercados cercanos al trabajo, lo que le permite continuar sus operaciones durante la guerra entre Israel y Hamas.

«Nuestros equipos en Israel y en todo el mundo están trabajando para garantizar el más alto nivel de soporte y servicio», dice Perry. «Cabe señalar que nuestro equipo en Ucrania está operando con extrema diligencia por su gran solidaridad con la situación en Israel», añade.

Créditos de imagen: HIZO

D-ID recaudó una Serie B de 25 millones de dólares el año pasado, tras el lanzamiento de su proyecto Deep Nostalgia y su spin-off, LiveStory. Esos dos proyectos implicaron animar fotografías históricas de miembros de la familia, y este último añadió audio. Los videos se volvieron virales cuando la gente usó la tecnología para crear fotografías parlantes de seres queridos o ancestros perdidos hace mucho tiempo. Desde entonces, D-ID también ha estado trabajando para crear una interfaz fotorrealista para ChatGPT, así como su software Creative Reality Studio, como parte de sus esfuerzos más amplios de desarrollo de IA.



Source link-48