Es divertido, encantador y rápido: el nuevo asistente de voz AI de Open AI parece sacado de Hollywood


Con un nuevo asistente de voz, Open AI quiere facilitar a los usuarios el uso de la IA en cualquier momento y lugar. La compañía también presenta una nueva versión gratuita del potente modelo de lenguaje GPT-4. Esta es una declaración de guerra directa a Apple y Google.

Recientemente, Open AIs AI combina respuestas de imágenes, texto y audio.

Omar Marqués / Sopa Imágenes / imago imágenes

Cualquiera que busque evidencia de que en Estados Unidos se está librando una lucha de poder por el liderazgo en inteligencia artificial debe mirar a Silicon Valley esta semana. Exactamente 24 horas antes de que Google planee demostrar sus avances en inteligencia artificial en su conferencia de desarrolladores el martes, Open AI causó revuelo el lunes. La compañía detrás del chatbot GPT ahora está poniendo a disposición de todos los usuarios su modelo de lenguaje más poderoso hasta la fecha, GPT-4, de forma gratuita en una nueva versión llamada GPT-4o: una verdadera explosión.

La letra o en el nombre del modelo representa la palabra latina “omni” (todo). Así lo anunció la jefa de tecnología Mira Murati durante una presentación transmitida en vivo en la sede de la compañía en San Francisco. Los más de 100 millones de usuarios que ya utilizaban el chatbot Chat-GPT ahora podían acceder a un modelo significativamente más rápido e inteligente. Según Open AI, el nuevo modelo también puede combinar audio, texto e imágenes en sus resultados.

«Una parte importante de nuestra misión es hacer que las herramientas avanzadas de inteligencia artificial estén disponibles para todos de forma gratuita», escribió más tarde el director ejecutivo Sam Altman en su blog. «Somos una empresa y siempre encontraremos cosas por las que cobrar dinero, y eso nos ayudará a llevar una excelente IA a (con suerte) miles de millones de personas de forma gratuita».

La película de Hollywood “Her” inspiró a Altman

Open AI también presentó su nuevo asistente de voz, y funciona sorprendentemente bien. Cualquiera que haya encontrado anteriormente frustrantes las conversaciones con otros asistentes como “Alexa”, “Siri” o “Google” porque simplemente no te entienden puede llevarse una grata sorpresa.

El asistente de Open AI en realidad suena como un humano, puedes interrumpirlo y responde sin demora. Se activa al gritar «Hey Chat-GPT». El asistente habla de forma informal, a veces incluso divertido y emotivo. A diferencia de las funciones de reconocimiento de voz anteriores de Open AI, el nuevo asistente de voz también puede distinguir entre hablantes individuales y bloquear el ruido de fondo gracias a GPT-4o.

Según Open AI, el nuevo asistente puede reconocer los sentimientos del usuario en su voz y expresiones faciales y reaccionar en consecuencia. Los recuerdos vuelven a la película de Hollywood “Her” de 2013, en la que el personaje principal se enamora de un asistente de voz con inteligencia artificial. En un discurso el año pasado, Altman dijo que se sintió inspirado por la película. “Parece la IA de una película”, escribió el lunes el CEO en su blog, refiriéndose al asistente de voz. «Todavía me sorprende que esto sea ahora una realidad».

El lunes por la tarde, Open AI mostró en numerosos vídeos en las redes sociales cómo el asistente de idiomas en particular podría moldear la vida de los usuarios en el futuro, por ejemplo, de personas con discapacidad visual o como tutores de estudiantes.

El asistente de idiomas ahora puede interpretar entre personas; Murati lo demostró en italiano e inglés. Open AI aún no ha anunciado para qué idiomas será posible. Las nuevas funciones estarán disponibles para los interesados ​​sin suscripción “en las próximas semanas”. Para los usuarios Plus, Chat-GPT 4o ya estaba disponible para su uso en EE. UU. el lunes por la tarde.

Google y Apple ahora están bajo presión

«Hablar con una computadora nunca me ha resultado natural», escribió Altman después de la presentación del producto. en su blog privado. “Ahora sí”. También dio una muestra de en qué está trabajando actualmente Open AI: «Estamos trabajando en la personalización, el acceso a su información, la capacidad de realizar tareas por usted y más. Veo un futuro emocionante por delante en el que la informática hará más para nosotros que nunca antes”.

Está claro que las presentaciones de productos de Open AI están elevando enormemente el listón para las empresas de tecnología establecidas. Google y Apple en particular ahora están bajo presión para superar las capacidades de inteligencia artificial de Open AI en sus respectivas conferencias de desarrolladores el 14 de mayo y 10 de junio.

La cuestión clave es cómo quieren diferenciarse las grandes corporaciones o si elegirán un enfoque diferente. Como informó recientemente “Bloomberg”, Apple planea colaborar con Open AI. Al parecer la próxima versión del sistema operativo para iPhone incluirá funciones Chat-GPT.





Source link-58