\n<\/aside>\n<\/p>\n
La semana pasada, Meta anunci\u00f3 un m\u00e9todo de compresi\u00f3n de audio impulsado por IA llamado \u00abEnCodec\u00bb que, seg\u00fan se informa, puede comprimir audio 10 veces m\u00e1s peque\u00f1o que el formato MP3 a 64 kbps sin p\u00e9rdida de calidad. Meta dice que esta t\u00e9cnica podr\u00eda mejorar dr\u00e1sticamente la calidad del sonido del habla en conexiones de bajo ancho de banda, como llamadas telef\u00f3nicas en \u00e1reas con servicio irregular. La t\u00e9cnica tambi\u00e9n funciona para la m\u00fasica.<\/p>\n
Meta present\u00f3 la tecnolog\u00eda el 25 de octubre en un art\u00edculo titulado \u00abCompresi\u00f3n de audio neuronal de alta fidelidad\u00bb, escrito por los investigadores de Meta AI Alexandre D\u00e9fossez<\/span>, Jade Copet, Gabriel Synnaeve y Yossi Adi. Meta tambi\u00e9n resumi\u00f3 la investigaci\u00f3n en su blog dedicado a EnCodec.<\/p>\n\nAgrandar
\/<\/span> Meta afirma que su nuevo codificador\/descodificador de audio puede comprimir audio 10 veces m\u00e1s peque\u00f1o que MP3.<\/div>\nMeta IA<\/p>\n<\/figcaption><\/figure>\n
Meta describe su m\u00e9todo como un sistema de tres partes entrenado para comprimir audio a un tama\u00f1o objetivo deseado. En primer lugar, el codificador transforma los datos sin comprimir en una representaci\u00f3n de \u00abespacio latente\u00bb de velocidad de fotogramas m\u00e1s baja. El \u00abcuantificador\u00bb luego comprime la representaci\u00f3n al tama\u00f1o objetivo mientras realiza un seguimiento de la informaci\u00f3n m\u00e1s importante que luego se usar\u00e1 para reconstruir la se\u00f1al original. (Esta se\u00f1al comprimida es lo que se env\u00eda a trav\u00e9s de una red o se guarda en el disco). Finalmente, el decodificador vuelve a convertir los datos comprimidos en audio en tiempo real utilizando una red neuronal en una sola CPU.<\/p>\n\n Anuncio publicitario <\/span> <\/p>\n<\/aside>\n\nAgrandar
\/<\/span> Un diagrama de bloques que ilustra c\u00f3mo funciona la compresi\u00f3n EnCodec de Meta.<\/div>\nMeta IA<\/p>\n<\/figcaption><\/figure>\n
El uso de discriminadores por parte de Meta resulta clave para crear un m\u00e9todo para comprimir el audio tanto como sea posible sin perder elementos clave de una se\u00f1al que la hacen distintiva y reconocible:<\/p>\n
\n\u00abLa clave de la compresi\u00f3n con p\u00e9rdida es identificar cambios que no ser\u00e1n perceptibles para los humanos, ya que la reconstrucci\u00f3n perfecta es imposible a velocidades de bits bajas. Para hacerlo, usamos discriminadores para mejorar la calidad perceptiva de las muestras generadas. Esto crea una cat- y el juego del rat\u00f3n donde el trabajo del discriminador es diferenciar entre muestras reales y muestras reconstruidas. El modelo de compresi\u00f3n intenta generar muestras para enga\u00f1ar a los discriminadores empujando las muestras reconstruidas para que sean perceptualmente m\u00e1s similares a las muestras originales\u00bb.<\/p>\n<\/blockquote>\n
Vale la pena se\u00f1alar que el uso de una red neuronal para la compresi\u00f3n y descompresi\u00f3n de audio est\u00e1 lejos de ser nuevo, especialmente para la compresi\u00f3n de voz, pero los investigadores de Meta afirman que son el primer grupo en aplicar la tecnolog\u00eda al audio est\u00e9reo de 48 kHz (ligeramente mejor que la frecuencia de muestreo de 44,1 kHz de CD). ), que es t\u00edpico de los archivos de m\u00fasica distribuidos en Internet.<\/p>\n
En cuanto a las aplicaciones, Meta dice que esta \u00abhipercompresi\u00f3n de audio\u00bb impulsada por IA podr\u00eda admitir \u00abllamadas m\u00e1s r\u00e1pidas y de mejor calidad\u00bb en malas condiciones de red. Y, por supuesto, siendo Meta, los investigadores tambi\u00e9n mencionan las implicaciones del metaverso de EnCodec, diciendo que la tecnolog\u00eda eventualmente podr\u00eda ofrecer \u00abexperiencias ricas en el metaverso sin requerir mejoras importantes en el ancho de banda\u00bb.<\/p>\n
M\u00e1s all\u00e1 de eso, tal vez tambi\u00e9n obtengamos archivos de audio de m\u00fasica realmente peque\u00f1os alg\u00fan d\u00eda. Por ahora, la nueva tecnolog\u00eda de Meta permanece en la fase de investigaci\u00f3n, pero apunta hacia un futuro donde el audio de alta calidad puede usar menos ancho de banda, lo que ser\u00eda una gran noticia para los proveedores de banda ancha m\u00f3vil con redes sobrecargadas de medios de transmisi\u00f3n.<\/p>\n<\/p><\/div>\n
\nSource link-49<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"Agrandar \/ Una representaci\u00f3n ilustrada de datos en una onda de audio. Meta IA La semana pasada, Meta anunci\u00f3 un m\u00e9todo de compresi\u00f3n de audio impulsado por IA llamado \u00abEnCodec\u00bb…<\/p>\n","protected":false},"author":1,"featured_media":274552,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[59773,5394,30455,34366,18662,9842,25866,110,3147,15,73],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/274551"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=274551"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/274551\/revisions"}],"predecessor-version":[{"id":274553,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/274551\/revisions\/274553"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/274552"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=274551"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=274551"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=274551"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}