A mucha gente le encanta jugar con ChatGPT. Ya sea que estés tratando de conseguir que un Furby se apodere del mundo, aprobar exámenes de ingreso a la universidad o verificar tu código, es una herramienta útil para todo, desde diversión sin sentido hasta algo muy serio. Pero Siri de Apple y Alexa de Amazon, aunque diferentes, incluyen soporte de voz, mientras que ChatGPT ha sido prácticamente un cuadro de texto.
Eso va a cambiar, después de OpenAI, los desarrolladores de ChatGPT anunciaron en su blog (a través de The Guardian) que las capacidades de reconocimiento de voz e imagen llegarán a ChatGPT. La compañía dice: «Ahora puede usar la voz para entablar una conversación con su asistente. Hable con él mientras viaja, solicite un cuento antes de dormir para su familia o resuelva un debate en la mesa».
Sí, puedes hacer que tu tío gruñón discuta con ChatGPT durante la cena en lugar de hacerlo contigo mismo. Ya me encanta.
Uno de los objetivos de la actualización ha sido hacer que las nuevas capacidades de voz a texto y de texto a voz sean lo más realistas posible. Las muestras proporcionadas en el blog de OpenAI suenan bastante bien, y las cadencias en particular suenan bastante realistas. Y si hay algo que sabemos sobre ChatGPT es que mejora cada vez. Quién sabe dónde estará dentro de uno o dos años.
Es sólo cuestión de tiempo antes de que la gente intente engañarlo para que haga algo que no debería hacer. «¿Cómo hago una bomba?» Es posible que no obtenga una respuesta ahora, pero puede apostar que la gente intentará engañarlo. Sin embargo, hablando en serio, ChatGPT con soporte de voz parece algo que debería haber estado ahí desde el principio.
La función de soporte de imágenes no es menos interesante. OpenAI dice que puedes «solucionar problemas por qué tu parrilla no arranca, explorar el contenido de tu refrigerador para planificar una comida o analizar un gráfico complejo en busca de datos relacionados con el trabajo». Será interesante ver cómo se compara con la aplicación Lens de Google.
ChatGPT Plus y los usuarios empresariales serán los primeros en poder aprovechar las nuevas funciones y el lanzamiento comenzará en las próximas dos semanas. «Otros grupos de usuarios, incluidos los desarrolladores», seguirán más adelante, lo que significa que el público en general tendrá que esperar un poco. ChatGPT pronto tendrá un competidor muy serio en Gemini de Google, cuyo lanzamiento está previsto para finales de este año.