{"id":711650,"date":"2023-07-01T23:50:53","date_gmt":"2023-07-01T23:50:53","guid":{"rendered":"https:\/\/magazineoffice.com\/voice-ai-recauda-6-millones-a-medida-que-su-cambiador-de-voz-en-tiempo-real-se-acerca-a-500k-usuarios\/"},"modified":"2023-07-01T23:50:57","modified_gmt":"2023-07-01T23:50:57","slug":"voice-ai-recauda-6-millones-a-medida-que-su-cambiador-de-voz-en-tiempo-real-se-acerca-a-500k-usuarios","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/voice-ai-recauda-6-millones-a-medida-que-su-cambiador-de-voz-en-tiempo-real-se-acerca-a-500k-usuarios\/","title":{"rendered":"Voice.ai recauda $ 6 millones a medida que su cambiador de voz en tiempo real se acerca a 500K usuarios"},"content":{"rendered":"


\n<\/p>\n

\n

Servicios como Midjourney y ChatGPT han superado los l\u00edmites de c\u00f3mo la IA puede crear im\u00e1genes y texto a partir de indicaciones de texto b\u00e1sicas. Ahora, el audio parece ser la pr\u00f3xima frontera inevitable. La generaci\u00f3n de m\u00fasica basada en indicaciones de palabras, los tutores de IA para el aprendizaje de idiomas y los simuladores de voz han visto avances en los \u00faltimos meses. Voice.ai espera ser parte de esa conversaci\u00f3n (je) con tecnolog\u00eda que permite a los usuarios cambiar (y disfrazar) sus voces en tiempo real, y ahora ha recaudado su primera financiaci\u00f3n externa inmediatamente despu\u00e9s del crecimiento inicial.<\/p>\n

Con m\u00e1s de 480 000 usuarios y una biblioteca de m\u00e1s de 50 000 filtros de voz, Voice.ai ha recaudado $6 millones, fondos que planea usar para llevar su tecnolog\u00eda de cambio de voz a nuevos lugares.<\/p>\n

Mucker Capital y M13 lideran la ronda. Hasta ahora, Voice.ai ha crecido de boca en boca (la startup tiene un canal de Discord con m\u00e1s de 120 000 personas) gracias a los 3 millones de d\u00f3lares de autofinanciaci\u00f3n.<\/p>\n

Actualmente, las herramientas de la compa\u00f1\u00eda, disponibles como aplicaciones para Mac, PC, Android e iOS, est\u00e1n siendo adoptadas por jugadores, creadores de contenido, Vtubers y otros en TikTok, Zoom, Discord, Minecraft, GTA5, Fortnite, Valorant, League of Legends, Among Us , Skype, WhatsApp y otras plataformas. La interfaz de Voice.ai les permite crear una nueva voz o seleccionar entre unas 50\u00a0000 voces diferentes creadas previamente (creadas y compartidas por usuarios como ellos), que pueden usarse tal cual o modificarse, para usar en vivo en plataformas compatibles, o para grabaciones.<\/p>\n

El plan es utilizar los fondos para contratar m\u00e1s talento t\u00e9cnico y crear nuevos SDK y API para trabajar con m\u00e1s plataformas como Meta, Unreal y Unity; traer soporte multiling\u00fce; y agregue nuevas aplicaciones como cantar donde la voz es el centro del escenario.<\/p>\n

La puesta en marcha no lo destaca, pero ser\u00e1 interesante ver si utiliza parte de los fondos tambi\u00e9n para aumentar la capacidad del servidor.<\/p>\n

Esa no es una carga peque\u00f1a. Como an\u00e9cdota, hemos escuchado que el dolor de la GPU es uno de los factores m\u00e1s importantes en la forma en que muchas aplicaciones de IA pueden escalar en este momento. (En parte, es por eso que est\u00e1 viendo grandes negocios que incluyen estrategias que brindan capacidad de procesamiento y servidor).<\/p>\n

Espec\u00edficamente para Voice.ai, su voz se procesa localmente y se canaliza a donde sea que se use a trav\u00e9s de lo que el fundador y director ejecutivo, Heath Ahrens, me describi\u00f3 como un \u00abcable de audio virtual\u00bb. Pero cuando miras las rese\u00f1as de sus aplicaciones, un lamento com\u00fan es que cuando te registras te colocan en una lista de espera porque \u00abla abrumadora demanda tiene nuestros servidores al m\u00e1ximo de su capacidad\u00bb con la promesa de que se te informar\u00e1 cuando el servicio aumente. capacidad.<\/p>\n

Hay docenas de servicios de voz a voz y de voz a voz en el mercado hoy en d\u00eda, y ya hay mucha actividad entre ellos: el a\u00f1o pasado, Spotify adquiri\u00f3 Sonantic y Snap compr\u00f3 un asistente de voz de IA incluso antes; otra startup, Sanas, est\u00e1 trabajando en cambiar tu acento y est\u00e1n los simuladores de voz Murf y Acapela, entre muchos otros. Voice.ai se incluye en la misma categor\u00eda general que Respeecher y ElevenLabs, dos nuevas empresas de inteligencia artificial de voz a voz, que permiten a los usuarios aplicar m\u00e1scaras para modificar o transformar completamente sus voces, en algunos casos creando voces completamente sint\u00e9ticas en lugar de las reales.<\/p>\n

Respeecher, fundada y con sede en Ucrania, se hizo un nombre ayudando a construir una nueva voz de Darth Vader para las nuevas entregas de Star Wars, basada en c\u00f3mo sonaba James Earl Jones hace 45 a\u00f1os cuando origin\u00f3 el papel. (De acuerdo con un personaje empe\u00f1ado en destruir mundos, la voz de Darth fue entregada al cliente de Hollywood desde sus oficinas en Ucrania cuando Rusia ingres\u00f3 al pa\u00eds).<\/p>\n

ElevenLabs, famoso (o infame, seg\u00fan sea el caso), ha construido una plataforma que es terriblemente buena para clonar voces, y a principios de este mes obtuvo su ronda de financiaci\u00f3n m\u00e1s reciente de $ 19 millones de un grupo de inversores de renombre.<\/p>\n

Voice.ai est\u00e1 tratando, en esa combinaci\u00f3n, de posicionarse como la aplicaci\u00f3n de modificaci\u00f3n de voz AI para Everyman.<\/p>\n

\u00abHay muchas empresas que est\u00e1n tratando de brindar un sabor diferente de tecnolog\u00eda de voz a las empresas\u00bb, dijo Ahrens a TechCrunch en un correo electr\u00f3nico (ir\u00f3nicamente, no fue posible concertar una entrevista en vivo con \u00e9l). Ahrens tiene algo de experiencia en la creaci\u00f3n de tecnolog\u00eda B2B AI: sus dos empresas anteriores, iSpeech para texto a voz y Haystack para reconocimiento facial, se basan en ofertas de API.<\/p>\n

\u201cLo que distingue a Voice.ai es que estamos enfocados en llevar la tecnolog\u00eda que antes estaba reservada para las empresas directamente a las manos de los consumidores de una manera asequible\u201d. Muchos usuarios, se\u00f1al\u00f3, \u00abvienen a nosotros de los moduladores de voz y cambiadores de voz DSP cl\u00e1sicos que hab\u00edan estado usando en el pasado y que todav\u00eda son populares entre muchos jugadores y streamers\u00bb.<\/p>\n

\u00abAsequible\u00bb viene en dos niveles, con la mayor\u00eda de los usuarios ahora en un servicio gratuito que requiere que opten por proporcionar poder computacional para entrenar los modelos de Voice.ai, con su servicio construido en su propio conjunto de datos privados compuesto por \u00abmillones de usuarios \u00fanicos\u00bb. .\u201d No se proporcionan precios en el sitio: estamos solicitando esos detalles.<\/p>\n

\u201cCreemos en hacer que la tecnolog\u00eda sea accesible y planeamos trabajar junto con la comunidad de c\u00f3digo abierto para democratizar la tecnolog\u00eda Voice AI\u201d, agreg\u00f3 Ahrens.<\/p>\n

Voice.ai tambi\u00e9n afirma que adopta lo que es un enfoque fundamentalmente diferente al desaf\u00edo de cambiar una voz, aprovechando algunos de los valores que se han desarrollado en torno al uso de avatares por parte de Vtubers, jugadores y otros en l\u00ednea.<\/p>\n

\u201cLa mayor\u00eda de las empresas de IA de voz que ingresan al espacio intentan crear soluciones escalables de texto a voz centradas en la empresa o costosos servicios de voz a voz para estudios de producci\u00f3n\u201d, dijo Ahrens. \u201cComenzamos desde el espectro opuesto y tratamos de ofrecer valor a las personas que buscan expandir su sonido en l\u00ednea. La propuesta de valor central de nuestra IA de voz a voz no es que pueda replicar perfectamente a cualquier persona. Es que conserva los elementos centrales del discurso de un usuario: su emoci\u00f3n, ritmo y \u00e9nfasis mientras reemplaza el sonido de la voz, para crear un nuevo resultado final completamente \u00fanico, en tiempo real\u201d.<\/p>\n

Puede deberse a c\u00f3mo se sesgan los datos demogr\u00e1ficos en plataformas interactivas como los juegos, pero por ahora la audiencia de Voice.ai es 70% masculina frente a 30% femenina con nuevas categor\u00edas que se abren no solo sobre qui\u00e9n est\u00e1 usando la tecnolog\u00eda, sino tambi\u00e9n por qu\u00e9.<\/p>\n

Eso incluye no solo a aquellos que usan avatares y crean voces para que coincidan, o aquellos que buscan una mayor protecci\u00f3n de la privacidad, sino tambi\u00e9n, dijo, \u201cusuarios transg\u00e9nero que pueden representarse a s\u00ed mismos con voces que coincidan con su identidad, as\u00ed como usuarios que exploran sitios completamente nuevos en l\u00ednea. personas por s\u00ed mismos.\u201d<\/p>\n

Ya existe una base de usuarios que aprovechan las ofertas directas al consumidor de Voice.ai, pero una de las razones por las que Mucker est\u00e1 invirtiendo en la puesta en marcha es porque cree que existe la oportunidad de construir una red de desarrolladores que usen e integren su tecnolog\u00eda.<\/p>\n

\u201cVoice.ai est\u00e1 preparado para revolucionar la comunidad de desarrolladores de IA de una manera similar al impacto de AdMob en la comunidad de desarrolladores de aplicaciones m\u00f3viles\u201d, dijo Omar Hamoui, socio del inversionista principal Mucker Capital. (Hamoui fund\u00f3 anteriormente la empresa emergente de publicidad m\u00f3vil AdMob, eventualmente adquirida por Google, por lo que tiene experiencia directa en la creaci\u00f3n de herramientas para desarrolladores m\u00f3viles). desarrolladores de todo el mundo\u201d.<\/p>\n

Karl Alomar, exdirector de operaciones de Digital Ocean, que dirigi\u00f3 la inversi\u00f3n de M13, dijo que los inversores desempe\u00f1ar\u00e1n un papel activo en la pr\u00f3xima etapa de desarrollo. \u201cEn Digital Ocean tambi\u00e9n vimos el valor de construir una comunidad de constructores por constructores\u201d, dijo. \u201cEstamos emocionados de que los creadores y desarrolladores se basen en la plataforma Voice.ai\u201d.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Servicios como Midjourney y ChatGPT han superado los l\u00edmites de c\u00f3mo la IA puede crear im\u00e1genes y texto a partir de indicaciones de texto b\u00e1sicas. Ahora, el audio parece ser…<\/p>\n","protected":false},"author":1,"featured_media":711651,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[43224,2100,60298,2628,1576,754,7512,433,6512,96332,3869],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/711650"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=711650"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/711650\/revisions"}],"predecessor-version":[{"id":711652,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/711650\/revisions\/711652"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/711651"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=711650"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=711650"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=711650"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}