La IA Edge Copilot de Microsoft realmente no puede resumir todos los videos de YouTube


Una característica agregada al AI Copilot de Microsoft en el navegador Edge esta semana es el capacidad de generar resúmenes de texto de videos. Pero la función de ahorro de tiempo de Edge Copilot todavía es bastante limitada y sólo funciona en vídeos preprocesados ​​o con subtítulos, como explicó Mikhail Parakhin, director ejecutivo de publicidad y servicios web de Microsoft.

Como manchado por MSPowerUser, Parakhin escribe, “Para que funcione, necesitamos preprocesar el vídeo. Si el vídeo tiene subtítulos (siempre podemos recurrir a ellos, si no los tiene y aún no lo hemos preprocesado), entonces no funcionará”, en respuesta a una pregunta.

En otras palabras, Edge Copilot por sí solo no resume tanto vídeos ya que resume las transcripciones de texto de los videos. Copilot también puede realizar una función similar en Microsoft 365, incluido el resumen de videos de Teams. reuniones y llamadas para agentes de servicio al cliente, y en ambos casos, el audio debe ser transcrito primero por Microsoft. Copilot en Microsoft Stream también puede resumir cualquier vídeo, pero nuevamente, requiere que los usuarios generar una transcripción escrita.

La conversación comenzó después de que el diseñador Pietro Schirano al corriente una grabación de pantalla de Edge Copilot que resume un video de YouTube sobre el GTAVI remolque. En este caso, Copilot parecía estar haciendo su trabajo a la perfección. El usuario en la grabación presiona el botón “Generar resumen de video” en la barra lateral de Copilot y, apenas unos segundos después, Copilot produce uno, completo con aspectos destacados y marcas de tiempo.

Por supuesto, muchas plataformas, incluidas YouTube y Vimeo, pueden generar transcripciones y subtítulos automáticamente, si los usuarios habilitan la función. Después El borde Le preguntó a Parakhin en X si podíamos asumir que la mayoría de los videos disponibles públicamente (es decir, YouTube) no estaban preprocesados. respondió: «Debería funcionar para la mayoría de los vídeos».

Copilot es sólo el último ejemplo de la carrera de IA generativa en la que Microsoft está compitiendo con Google (y otros). El mes pasado, Google actualizó el Extensión de YouTube para que su chatbot Bard le permita resumir el contenido de un vídeo y mostrar información específica del mismo. Esta misma semana, Google anunció una importante actualización de Gemini que tiene sus propios problemas: la edición de la compañía puede haber tergiversado algunas de las capacidades de la IA en una demostración, y no siempre tener los hechos claros.

Parakhin ha sido sincero sobre las distintas etapas de la evolución de Copilot en las redes sociales. Mientras estaba en un avión el martes por la mañana, el experto en aprendizaje automático publicó en X: «Agregando capacidad para que Edge Copilot use información en videos, en un vuelo».





Source link-37