La última IA de Alibaba supera a GPT-3.5 y a Claude en múltiples pruebas de referencia


Esto no es un consejo de inversión. El autor no tiene posición en ninguna de las acciones mencionadas. Wccftech.com tiene una política de divulgación y ética.

Dado que 2024 marca un fuerte comienzo para la carrera mundial de la inteligencia artificial, el gigante tecnológico chino Alibaba Group también ha anunciado la última versión de su modelo de inteligencia artificial Qwen. Además de ChatGPT de OpenAI, que es el chatbot de IA más conocido del mundo, otros modelos como Llama de Meta y Claude de Anthropic, socio de Amazon, son varias opciones que tienen los consumidores y las empresas a la hora de elegir una plataforma de IA para sus necesidades.

La última versión de Qwen de Alibaba es Qwen 1.5 y, según los puntos de referencia compartidos en la plataforma de redes sociales X, el modelo supera tanto a ChatGPT como a Claude en algunos puntos de referencia.

Qwen 1.5 de Alibaba supera a Claude y ChatGPT en múltiples puntos de referencia que prueban la fluidez de la instrucción

Al igual que los sistemas operativos que se ejecutan en computadoras o teléfonos inteligentes, un modelo de inteligencia artificial también es una pieza de software. Esto permite a los ingenieros y analistas de software evaluar su rendimiento, y cuando se trata del último Qwen 1.5 de Alibaba, algunas puntuaciones muestran que supera a Claude de Anthropic y ChatGPT de OpenAI.

Los puntos de referencia que prueban los sistemas operativos evalúan su capacidad para procesar instrucciones y ejecutar aplicaciones, y los de los modelos de inteligencia artificial generalmente giran en torno a probar la capacidad de los modelos para generar resultados.

Dos de estos puntos de referencia son MT-bench y Alapaca-Eval, y las puntuaciones compartidas en X muestran que una variante del Qwen 1.5 de Alibaba ha superado a ChatGPT y Claude en ellos. MT-bench prueba la capacidad de un modelo para responder un conjunto de preguntas predefinidas que no solo buscan diferenciarlo del chatbot sino que también intentan determinar si el modelo puede «mantenerse firme» en un entorno de conversación difícil que involucra a dos partes que interactúan rápidamente. juntos.

Los puntajes de referencia muestran que Qwen fue el cuarto puntaje más alto en MT-bench, y solo quedó atrás de GPT-4 Turbo y los dos primeros lanzamientos de GPT-4, es decir, las versiones 0613 y 0314.

Alapaca-Eval es un punto de referencia que utiliza un modelo de referencia para emular las interacciones humanas y determinar en qué medida un modelo de IA que se está probando ofrece resultados en línea con la línea de base. También proporciona a los usuarios una tabla de clasificación para realizar un seguimiento de sus pruebas, y los puntos de referencia de hoy muestran que el rendimiento Alapaca-Eval de Qwen 1.5 solo está por detrás del GPT-4 Turbo y el Yi-34B de HuggingFace con sede en Nueva York.

Qwen1.5 es uno de los modelos de código abierto más grandes de su tipo y está respaldado por los enormes recursos informáticos de Alibaba. Una IA de código abierto, como el software de código abierto, pone su código a disposición de usuarios y desarrolladores para que puedan comprender el modelo y crear sus propias variantes. Meta’s Llama, también presente en las partituras de hoy, también es un modelo de código abierto.

El comienzo de 2024 ha visto un destacado enfoque por parte de Wall Street y las empresas en la IA. Los informes de ganancias de gigantes tecnológicos de mega capitalización como Meta, Microsoft y Alphabet se han centrado en la IA. El jefe de Meta, Mark Zuckerberg, tiene como objetivo comprar cientos de miles de GPU este año para alimentar Llama, y ​​en la llamada sobre resultados de la empresa, el ejecutivo explicó que su decisión de reforzar la capacidad informática en Meta se debe a descuidos anteriores que llevaron a que la empresa estuviera por debajo de su capacidad.

De manera similar, las ganancias de los fabricantes y diseñadores de chips TSMC y AMD también han visto a sus gerencias expresar optimismo sobre el futuro de la IA. La gerencia de TSMC confía en que la empresa tiene una base estable para capturar cualquier demanda de IA, mientras que AMD opina que la IA puede terminar llegando a valer cientos de miles de millones de dólares al final de la década.

Comparte esta historia

Facebook

Gorjeo





Source link-29