Meta lanza BlenderBot 3 en Internet, su IA de chat más competente hasta la fecha


Más de media década después de la debacle de Taye verdaderamente monumental de Microsoft, el incidente sigue siendo un claro recordatorio de lo rápido que una IA puede corromperse después de la exposición a la potente toxicidad de Internet y una advertencia contra la construcción de bots sin ataduras de comportamiento suficientemente sólidas. El viernes, la división de investigación de AI de Meta verá si su última versión de Blenderbot AI puede hacer frente a los horrores de las redes con el lanzamiento de demostración pública de su Blenderbot 3 de 175 mil millones de parámetros.

Un obstáculo importante al que se enfrenta actualmente la tecnología de los chatbots (así como los algoritmos de procesamiento del lenguaje natural que los impulsan) es el abastecimiento. Tradicionalmente, los chatbots se entrenan en entornos altamente seleccionados, porque de lo contrario, invariablemente obtienes un Taye, pero eso termina limitando los temas que puede discutir a aquellos específicos disponibles en el laboratorio. Por el contrario, puede hacer que el chatbot obtenga información de Internet para tener acceso a una amplia gama de temas, pero podría, y probablemente lo hará, volverse completamente nazi en algún momento.

«Los investigadores no pueden predecir o simular todos los escenarios de conversación solos en entornos de investigación», escribieron los investigadores de Meta AI en una publicación de blog el viernes. «El campo de la IA todavía está lejos de los sistemas de IA verdaderamente inteligentes que pueden entendernos, interactuar y chatear con nosotros como lo pueden hacer otros humanos. Para construir modelos que sean más adaptables a los entornos del mundo real, los chatbots necesitan aprender de una diversidad, perspectiva amplia con personas ‘en la naturaleza'».

Meta ha estado trabajando para abordar el problema desde que presentó por primera vez la aplicación de chat BlenderBot 1 en 2020. Inicialmente, poco más que un experimento de NLP de código abierto, al año siguiente, BlenderBot 2 había aprendido a recordar la información que había discutido en conversaciones anteriores. y cómo buscar en Internet detalles adicionales sobre un tema determinado. BlenderBot 3 lleva esas capacidades un paso más allá al evaluar no solo los datos que extrae de la web, sino también a las personas con las que habla.

Cuando un usuario registra una respuesta insatisfactoria del sistema, que actualmente ronda el 0,16 por ciento de todas las respuestas de capacitación, Meta vuelve a incorporar los comentarios del usuario al modelo para evitar que se repita el error. El sistema también emplea el algoritmo Director, que primero genera una respuesta usando datos de entrenamiento, luego ejecuta la respuesta a través de un clasificador para verificar si encaja dentro de una escala de correcto e incorrecto definida por los comentarios del usuario.

«Para generar una oración, los mecanismos de clasificación y modelado del lenguaje deben estar de acuerdo», escribió el equipo. «Usando datos que indican buenas y malas respuestas, podemos entrenar al clasificador para penalizar declaraciones de baja calidad, tóxicas, contradictorias o repetitivas, y declaraciones que generalmente no son útiles». El sistema también emplea un algoritmo de ponderación de usuarios separado para detectar respuestas poco confiables o mal intencionadas del conversador humano, esencialmente enseñando al sistema a no confiar en lo que esa persona tiene que decir.

«Nuestra demostración pública, interactiva y en vivo permite que BlenderBot 3 aprenda de las interacciones orgánicas con todo tipo de personas», escribió el equipo. «Alentamos a los adultos en los Estados Unidos a probar la demostración, mantener conversaciones naturales sobre temas de interés y compartir sus respuestas para ayudar a avanzar en la investigación».

Se espera que BB3 hable de forma más natural y conversacional que su predecesor, en parte, gracias a su modelo de lenguaje OPT-175B enormemente actualizado, que es casi 60 veces más grande que el modelo de BB2. «Descubrimos que, en comparación con BlenderBot 2, BlenderBot 3 proporciona una mejora del 31 por ciento en la calificación general de las tareas de conversación, según lo evaluado por juicios humanos», dijo el equipo. «También se considera que tiene el doble de conocimientos, mientras que los hechos son incorrectos el 47 % menos de las veces. En comparación con GPT3, en preguntas de actualidad se encuentra más actualizado el 82 % de las veces y más específico el 76 % del tiempo.»

Todos los productos recomendados por Engadget son seleccionados por nuestro equipo editorial, independiente de nuestra empresa matriz. Algunas de nuestras historias incluyen enlaces de afiliados. Si compra algo a través de uno de estos enlaces, podemos ganar una comisión de afiliado.



Source link-47