Grok AI actualizado de Elon Musk afirma ser mejor en codificación y matemáticas


La respuesta de Elon Musk a ChatGPT recibirá una actualización para mejorarla en matemáticas, codificación y más. xAI de Musk ha lanzado Grok-1.5 a los primeros probadores con «capacidades y razonamiento mejorados» y la capacidad de procesar contextos más largos. La compañía afirma que ahora se compara con GPT-4, Gemini Pro 1.5 y Claude 3 Opus en varias áreas.

Según los números de xAI, Grok-1.5 parece ser una gran mejora con respecto a Grok-1. Se disparó hasta el 50,6 por ciento en el punto de referencia MATH, más del doble del puntaje anterior. También subió al 90 por ciento y al 74,1 por ciento en GSM8K (problemas escritos de matemáticas) y HumanEval (codificación), respectivamente, en comparación con el 62,9 por ciento y el 63,2 por ciento anteriores. Esos números están a poca distancia de Gemini Pro 1.5, GPT-4 y Claude 3 Opus; de hecho, la puntuación de codificación HumanEval supera a todos los rivales excepto a Claude 3 Opus.

La última Grok AI de Elon Musk aumenta las capacidades de codificación y matemáticas

xAI

También puede procesar contextos largos de hasta 128.000 tokens dentro de su ventana de contexto, lo que significa que puede fusionar datos de más fuentes para comprender una situación. «Esto permite a Grok tener una capacidad de memoria aumentada de hasta 16 veces la longitud del contexto anterior, lo que le permite utilizar información de documentos sustancialmente más largos», dijo la compañía.

Sin embargo, xAI no detalló el progreso de Grok en otras áreas, donde todavía puede estar rezagado (puntuaciones académicas, multimodal y otras). Y es posible que Grok-1.5 no mantenga su posición por mucho tiempo. ChatGPT 5 llegará en algún momento de este verano y promete un conjunto de funciones que «hace que parezca que te estás comunicando con una persona en lugar de con una máquina», según OpenAI.

Actualmente, Grok sólo está disponible para usuarios del nivel Premium+ en X (anteriormente Twitter), aunque Elon Musk prometió recientemente abrirlo a los usuarios Premium habituales de X. La compañía también abrió recientemente su chatbot Grok, después de que Musk demandara a OpenAI y Sam Altman por supuestamente abandonar su misión sin fines de lucro.



Source link-47