AssemblyAI consigue 50 millones de dólares para construir y ofrecer modelos de voz de IA


Las empresas están apostando fuerte por la IA generativa para obtener una ventaja competitiva. Pero los desafíos de la adopción persisten. Según una encuesta reciente de EY, una parte importante de las empresas que buscan adoptar la IA generativa dicen que el rápido progreso del campo (y el aumento de proveedores que afirman tener experiencia en IA) está complicando sus perspectivas de implementación.

Sin embargo, no lo sabrías por sus gastos. Según un pronóstico de IDC, las inversiones mundiales en sistemas “centrados en IA” podrían alcanzar los 154 mil millones de dólares para fin de año. Y una encuesta de MIT Tech Review encontró que el 50% de las empresas planean aumentar los presupuestos en infraestructura de datos e inteligencia artificial en más del 25% durante el próximo año.

El auge está beneficiando a nuevas empresas como AssemblyAI (que TechCrunch ha cubierto tres veces antes), una empresa autodenominada de “IA aplicada” que investiga, entrena e implementa modelos de IA para que desarrolladores y equipos de productos los integren en sus aplicaciones y servicios.

AssemblyAI afirma que su base de clientes de pago creció un 200% respecto al año pasado a 4.000 marcas y que su plataforma de inteligencia artificial ahora maneja alrededor de 25 millones de llamadas API por día. Además, más de 200.000 desarrolladores están construyendo sobre la plataforma, dice AssemblyAI, usándola para procesar más de 10 terabytes de datos al día.

«Los modelos de IA están mejorando y evolucionando rápidamente», dijo a TechCrunch el cofundador y director ejecutivo de AssemblyAI, Dylan Fox, en una entrevista por correo electrónico. “Las empresas que aprovechan la plataforma API de AssemblyAI pueden centrarse en crear nuevos productos, aplicaciones y flujos de trabajo de IA sin tener que centrarse en el desarrollo de modelos, la capacitación y mantenerse al día con el rápido ritmo de la innovación de modelos. Tampoco necesitan preocuparse por implementar ellos mismos modelos de IA a escala, lo cual es extremadamente difícil de hacer a bajo costo y con alta disponibilidad”.

La plataforma de desarrollo AssemblyAI. Créditos de imagen: AsambleaAI

El éxito de AssemblyAI ha llamado la atención de inversores de renombre, algunos de los cuales contribuyeron recientemente a un nuevo tramo de financiación para la startup. Accel lideró una ronda de 50 millones de dólares en AssemblyAI, anunciada hoy, con la participación del ex codirector ejecutivo de Salesforce, Keith Block, el ex director ejecutivo de GitHub, Nat Friedman, y Daniel Gross, Insight Partners e Y Combinator. El capital total recaudado por AssemblyAI asciende ahora a 115 millones de dólares.

Fox, un ingeniero de aprendizaje automático, fundó AssemblyAI a finales de 2017. Dice que se inspiró en Amazon Echo, que según Fox es uno de los primeros grandes ejemplos de productos posibles gracias a mejores sistemas de inteligencia artificial para voz.

«Cuando comencé a explorar la creación de mis propios productos con varios modelos de IA de voz disponibles en ese momento, me decepcionó que la mayoría de las empresas todavía ofrecieran modelos de IA de voz heredados e inexactos a través de productos de desarrollo difíciles de usar», dijo Fox. “Esto me motivó a iniciar AssemblyAI, con la visión de crear algo sobrehumano. . . Modelos de IA, disponibles a través de una plataforma de desarrollador fácil de usar, que desbloquearían clases completamente nuevas de aplicaciones de IA que se pueden construir”.

Hoy en día, AssemblyAI ofrece modelos de IA, específicamente modelos centrados en el habla, diseñados para realizar tareas como conversión de voz a texto, identificación de oradores, moderación de contenido y resumen de voz a través de una API. A los clientes les gusta Fireflies, una aplicación de transcripción de reuniones, ejecutan contenido que va desde llamadas telefónicas y reuniones de Zoom hasta podcasts y videos a través de los modelos, dice Fox.

Ahora, no faltan modelos de voz abiertos y propietarios, de startups rivales como Deepgram, Rev y Speechmatics, así como de gigantes tecnológicos como Google Cloud, Azure y AWS. Pero Fox argumenta, con razón o sin ella, que los modelos de AssemblyAI son más “avanzados”, “precisos”, “capaces” y “ricos en funciones” que la competencia.

“Las grandes empresas de la nube tienen ofertas de productos similares. . . pero se actualizan con poca frecuencia, son menos precisos, vienen con muchas menos funciones y son mucho más difíciles de integrar”, continuó.

Dicho esto, AssemblyAI no se duerme en los laureles. Una parte de la nueva financiación se destinará a un «modelo de voz universal en el que la empresa está entrenando en más de un petabyte de datos de voz, que se lanzará a finales de este año», dice Fox. AssemblyAI también está ampliando su plantilla, con el objetivo de aumentar su fuerza laboral de 115 personas entre un 50% y un 75% el próximo año.

«Estamos trabajando para construir los ‘modelos Stripe para IA’, donde los desarrolladores y equipos de productos podrán acceder fácilmente a la IA de última generación a través de una API simple», dijo Fox. “Al proporcionar estas cosas a los clientes, pueden centrarse en crear más aplicaciones verticales y flujos de trabajo internos que aprovechen nuestros datos patentados y los modelos de inteligencia artificial del habla en constante mejora de AssemblyAI. . . . Tenemos años de trayectoria gracias a la nueva ronda de financiación y estamos viendo una increíble cantidad de demanda y adopción de productos dado el impulso generalizado en torno a la IA”.



Source link-48