La respuesta de China a ChatGPT falla en sus primeras líneas


El régimen de censura de China requiere que Baidu y otras compañías de Internet bloqueen el acceso a ciertos sitios web y eviten temas políticamente delicados. Las palabras o frases que deben bloquearse pueden actualizarse rápidamente en respuesta a protestas o durante eventos especiales.

Pero Jeffrey Ding, profesor asistente en la Universidad de Georgetown que estudia la industria tecnológica de China, dice que las preocupaciones sobre la censura no parecen haber frenado el desarrollo de grandes modelos de lenguaje en China. Señala que Baidu ha hecho que el modelo de lenguaje Ernie que sustenta su nuevo bot esté disponible a través de una API durante algún tiempo y que otras compañías han ofrecido modelos similares.

Baidu no ha dado detalles de los datos de entrenamiento de Ernie Bot, pero lo más probable es que hayan sido extraídos de Internet en China. Esto significará que la materia prima del bot ya ha sido curada en gran medida por las reglas de censura de China, que, por ejemplo, tienen como objetivo limitar las críticas al gobierno.

La censura también podría afectar a los chatbots chinos de formas más sutiles. Un proyecto de investigación académica de 2021 que entrenó algoritmos en la versión en chino de Wikipedia, que está bloqueada en China, y Baidu’s Baike, una enciclopedia colaborativa sujeta a la censura del gobierno, descubrió que el uso de datos de entrenamiento censurados cambió significativamente el significado que el software de IA asignó a diferentes palabras.

El algoritmo entrenado en Wikipedia en chino asoció las palabras «democracia» más cerca de palabras positivas como «estabilidad». El algoritmo entrenado en el material censurado de Baike representó la «democracia» más cerca del «caos», más en línea con la política del gobierno de China. Pero debido a que los chatbots como ChatGPT pueden ser extremadamente flexibles y mezclar material en sus datos de entrenamiento, es probable que Baidu haya tenido que introducir medidas de seguridad adicionales.

A pesar de su recepción mixta, Ernie Bot parece ser un competidor capaz de ChatGPT. Actualmente, el bot está disponible solo para un número limitado de usuarios, algunos de los cuales dicen que están impresionados. ChatGPT no está disponible en China, aunque es capaz de conversar en chino.

Lei Li, profesor de UC Sant Barbara que se especializa en IA y trabajó anteriormente en la tecnología utilizada para construir parte del aprendizaje automático detrás del bot Ernie, señala que Baidu ha estado trabajando en la tecnología subyacente durante aproximadamente una década. Microsoft, por el contrario, obtuvo la licencia de la tecnología central para el nuevo chatbot de Bing y algunas próximas funciones de generación de texto para Office de OpenAI, en las que ha invertido miles de millones de dólares a cambio de los derechos exclusivos de sus creaciones.

Li también dice que también está impresionado con algo de lo que Ernie Bot puede hacer, incluida su capacidad para generar historias e informes comerciales. Agrega que el problema de la alucinación es un desafío para todos esos modelos de lenguaje. «Aquí es donde los investigadores todavía tienen trabajo por hacer», dice.

Un posteador de WeChat comparó las capacidades demostradas del bot chino con las de ChatGPT y encontró que manejaba mejor los modismos chinos y era más preciso en algunos casos. Por ejemplo, ChatGPT afirmó incorrectamente que el hogar ancestral del autor de ciencia ficción Liu Cixin, quien escribió El problema de los tres cuerpos, es Hubei, mientras que Ernie Bot respondió correctamente a Henan. ChatGPT está bloqueado en China, pero muchas personas han encontrado formas de acceder a él.



Source link-46