GPT-4: ¿Qué puede hacer la nueva inteligencia artificial Open AI?


La nueva versión del chat GPT también puede manejar imágenes y ofrece mejores respuestas. El modelo ya estaba integrado en Bing de Microsoft.

OpenAI ha revisado su conocido chatbot Chat-GPT.

Richard Drew/AP

Se esperaba con mucha curiosidad, ya está aquí: el nuevo modelo de lenguaje de OpenAI, una inteligencia artificial que debería superar por bastante a lo conocido de Chat-GPT.

A diferencia de su predecesor, GPT-4 no puede ser probado por todos. El modelo solo está disponible para clientes de pago. O para aquellos que usan el motor de búsqueda Bing: esto se ha estado ejecutando con GPT-4 en segundo plano durante varias semanas, como Microsoft confirmado.

Esto también sirve como una primera clasificación: contrariamente a lo que esperaban algunos observadores, GPT-4 no es revolucionario. Es similar a sus predecesores en la familia GPT 3, es decir, esos modelos de IA que anteriormente fueron la base para el chat GPT. Ahora chat GPT está disponible en dos versiones. Una vez con el modelo de idioma anterior, una vez con GPT-4 en segundo plano. Según OpenAI, el nuevo modelo pudo aumentar el rendimiento del chatbot un paso más.

El nuevo modelo también puede interpretar imágenes

La innovación más llamativa: GPT-4 no solo puede manejar texto, sino también imágenes. En rigor, ya no es un modelo de lenguaje, sino un modelo multimodal. Eso significa que fue entrenado en diferentes tipos de datos. La combinación de información de imágenes y texto conduce a nuevas habilidades.

OpenAI lidera por eso ejemplos en. Por ejemplo, un meme con la frase: «A veces miro imágenes de la tierra desde el espacio y me maravillo de lo hermosa que es». A continuación se muestra una foto de una bandeja de nuggets de pollo dispuestos como continentes en un mapa mundial.

La IA puede explicar la broma: «El humor en este meme proviene de la yuxtaposición inesperada de texto e imagen. El texto sugiere una imagen sublime de la tierra, pero la imagen muestra algo mundano y ridículo».

Otros ejemplos muestran casos de uso más prácticos: el nuevo modelo aparentemente puede explicar una infografía y sumar los números que contiene, o simplemente explicar el gráfico en un artículo científico.

avances en matematicas

Además, OpenAI proporciona una lista de exámenes hechos por humanos y cuánto han cambiado los resultados al pasar de GPT-3.5 a GPT-4. En un examen de barra simulado, el nuevo modelo se desempeña de manera similar al 10 por ciento superior de los encuestados humanos, en comparación con el 10 por ciento inferior de la versión anterior.

Aquí es donde la brecha entre los dos modelos es mayor. Pero el nuevo modelo también funciona un poco mejor que el anterior en química. También es interesante que en una prueba de matemáticas que los estudiantes que terminan la escuela pueden tomar para probar sus habilidades, el modelo fue peor que casi todos los demás. GPT-4 está al menos en el mediocampo bajo de los candidatos.

Aparentemente, OpenAI ha mejorado específicamente las habilidades matemáticas. El modelo se alimentó con respuestas correctas e incorrectas a preguntas matemáticas, con ejemplos lógicos y declaraciones contradictorias, así como con una amplia gama de ideologías e ideas, escribe OpenAI en su sitio web. Estas fueron todas las cosas que se criticaron sobre la versión anterior. Esto mostró grandes debilidades en las conclusiones lógicas y en el manejo de números y tenía una orientación política más liberal de izquierda.

Por ejemplo, la versión anterior se vio abrumada por preguntas como: «La madre de Anna tiene tres hijas: María e Ida, ¿y cómo se llama la tercera?» Nuestra prueba muestra: La nueva versión responde correctamente. Cuando se trata de multiplicar números más grandes, GPT-4 a veces sigue siendo incorrecto. Y también en cuestiones morales y políticas, el modelo de lenguaje aparentemente da respuestas más equilibradas que antes y ofrece varios puntos de vista.

El propio OpenAI advierte que GPT-4 puede seguir alucinando, es decir, inventando hechos como su antecesor. Cuando se trata de asuntos importantes, uno debe proceder con mucho cuidado: deje que la gente verifique, considere el contexto o abandone la aplicación por completo si hay mucho en juego.



Source link-58