ChatGPT está eliminando los idiomas distintos del inglés de la revolución de la IA


En un cuadro de diálogo separado, cuando se le preguntó en inglés, el chat de Bing identificó correctamente a Tailandia como la ubicación rumoreada para la próxima configuración del programa de televisión. loto blancopero proporcionó «en algún lugar de Asia» cuando la consulta se tradujo al español, dice Solis, quien dirige una consultoría llamada Orainti que ayuda a los sitios web a aumentar las visitas de los motores de búsqueda.

Los ejecutivos de Microsoft, OpenAI y Google que trabajan en chatbots han dicho que los usuarios pueden contrarrestar las respuestas deficientes agregando instrucciones más detalladas a sus consultas. Sin una guía explícita, el sesgo de los chatbots para recurrir al habla inglesa y las perspectivas de habla inglesa puede ser fuerte. Pregúntale a Veruska Anconitano, otra experta en optimización de motores de búsqueda, que divide su tiempo entre Italia e Irlanda. Encontró que hacer preguntas de chat de Bing en italiano obtenía respuestas en inglés a menos que especificara «Contéstame en italiano». En otro chat, dice Anconitano, Bing asumió que quería que el mensaje en japonés 元気ですか («¿Cómo estás?») se tradujera al inglés en lugar de continuar la conversación en japonés.

Trabajos de investigación recientes han validado los hallazgos anecdóticos de personas que se encuentran con los límites de Bing chat y sus hermanos. Zheng-Xin Yong, estudiante de doctorado en la Universidad de Brown que también estudia modelos de idiomas multilingües, dice que él y sus colaboradores encontraron en un estudio que generar mejores respuestas para las preguntas en chino requería hacerlas en inglés, en lugar de en chino.

Cuando Fung en Hong Kong y sus colaboradores intentaron pedirle a ChatGPT que tradujera 30 oraciones, tradujo correctamente 28 del indonesio al inglés, pero solo 19 en la otra dirección, lo que sugiere que los estadounidenses monoglotas que recurren al bot para hacer tratos con comerciantes indonesios tendrían dificultades. . Se encontró que la misma fluidez unidireccional limitada se repite en al menos otros cinco idiomas.

Los problemas de idioma de los modelos de idiomas grandes hacen que sea difícil confiar en ellos para cualquiera que se aventure más allá del inglés y quizás del chino. Cuando traté de traducir himnos sánscritos antiguos a través de ChatGPT como parte de un experimento en el uso de IA para acelerar la planificación de bodas, los resultados parecían lo suficientemente plausibles como para agregarlos a un guión de ceremonia. Pero no tenía idea de si podía confiar en ellos o si los mayores se reirían del escenario.

Los investigadores que hablaron con WIRED ven algunos signos de mejora. Cuando Google creó su modelo de idioma PaLM 2, lanzado este mes, hizo un esfuerzo por aumentar los datos de capacitación en idiomas distintos del inglés para más de 100 idiomas. El modelo reconoce modismos en alemán y swahili, chistes en japonés y limpia la gramática en indonesio, dice Google, y reconoce las variaciones regionales mejor que los modelos anteriores.

Pero en los servicios al consumidor, Google mantiene a PaLM 2 enjaulado. Su chatbot Bard funciona con PaLM 2, pero solo funciona en inglés estadounidense, japonés y coreano. Un asistente de escritura para Gmail que usa PaLM 2 solo admite inglés. Se necesita tiempo para admitir oficialmente un idioma mediante la realización de pruebas y la aplicación de filtros para garantizar que el sistema no genere contenido tóxico. Google no hizo una inversión total para lanzar muchos idiomas desde el principio, aunque está trabajando para agregar más rápidamente.



Source link-46