Google afirma que Bard está mejorando en matemáticas y programación


Bard, el atormentado chatbot impulsado por IA de Google, está mejorando lentamente en tareas que involucran lógica y razonamiento. Eso es según una publicación de blog publicada hoy por el gigante tecnológico, que sugiere que, gracias a una técnica llamada «ejecución de código implícito», Bard ahora se mejora específicamente en las áreas de matemáticas y codificación.

Como explica la publicación del blog, los modelos de lenguaje extenso (LLM) como Bard son esencialmente motores de predicción. Cuando se les da una indicación, generan una respuesta al anticipar qué palabras es probable que aparezcan a continuación en una oración. Eso los convierte en excepcionalmente buenos escritores de correos electrónicos y ensayos, pero desarrolladores de software algo propensos a errores.

Pero espere, podría decir: ¿qué pasa con los modelos de generación de código como Copilot de GitHub y CodeWhisperer de Amazon? Bueno, esos no son de propósito general. A diferencia de Bard y sus rivales similares a ChatGPT, que fueron entrenados utilizando una amplia gama de muestras de texto de la web, libros electrónicos y otros recursos, Copilot, CodeWhisperer y modelos de generación de código comparables fueron entrenados y ajustados casi exclusivamente en el código. muestras

Motivado por abordar las deficiencias de codificación y matemáticas en los LLM generales, Google desarrolló la ejecución implícita de código, que le permite a Bard escribir y ejecutar su propio código. La última versión de Bard identifica indicaciones que podrían beneficiarse del código lógico, escribe el código «debajo del capó», lo prueba y usa el resultado para generar una respuesta aparentemente más precisa.

Créditos de imagen: Google

Con base en evaluaciones comparativas internas, Google dice que las respuestas del nuevo Bard a los problemas matemáticos y de palabras «basados ​​en computación» mejoraron en un 30 % en comparación con la versión anterior de Bard. Por supuesto, tendremos que ver si esas afirmaciones resisten las pruebas externas.

“Incluso con estas mejoras, Bard no siempre lo hará bien; por ejemplo, es posible que Bard no genere un código para ayudar a la respuesta rápida, el código que genera puede ser incorrecto o es posible que Bard no incluya el código ejecutado en su respuesta”, Bard el líder de producto Jack Krawczyk y el vicepresidente de ingeniería Amarnag Subramanya escribieron en la publicación del blog. “Con todo lo dicho, esta capacidad mejorada para responder con capacidades estructuradas y basadas en la lógica es un paso importante para hacer que Bard sea aún más útil”.

Cuando Google lanzó Bard a principios de este año, no se comparó favorablemente con Bing Chat y ChatGPT. De hecho, el lanzamiento fue un poco desastroso, con un anuncio de Google que presentaba una respuesta incorrecta de Bard, lo que redujo brevemente las acciones de la compañía en un 8%.

Según se informa, varios empleados de Google que probaron Bard antes de su lanzamiento expresaron serias preocupaciones al gigante de las búsquedas, y una persona lo calificó de «mentiroso patológico» y otra lo consideró «peor que inútil».

Con la generación de código implícito y otras mejoras, como soporte para nuevos lenguajes, consultas multimodales y generación de imágenes, Google está respondiendo a las críticas e intentando cambiar la situación.

Sin embargo, aún está por verse si será suficiente para mantenerse al día con los principales chatbots generativos de IA en el espacio. Recientemente, Anthropic introdujo un modelo de chatbot de IA con una «ventana de contexto» muy ampliada, que permite que el modelo converse de manera relativamente coherente durante horas o incluso días en lugar de minutos. Y OpenAI, el desarrollador detrás de ChatGPT, ha comenzado a admitir complementos que potencian ChatGPT con conocimientos y habilidades externos.



Source link-48