GPT-4 hará que ChatGPT sea más inteligente, pero no solucionará sus fallas


Con su extraño capacidad de mantener una conversación, responder preguntas y escribir prosa, poesía y código coherentes, el chatbot ChatGPT ha obligado a muchas personas a repensar el potencial de la inteligencia artificial.

La startup que creó ChatGPT, OpenAI, anunció hoy una nueva versión muy esperada del modelo de IA en su núcleo.

El nuevo algoritmo, llamado GPT-4, sigue a GPT-3, un modelo innovador de generación de texto que OpenAI anunció en 2020, que luego se adaptó para crear ChatGPT el año pasado.

El nuevo modelo obtiene una puntuación más alta en una variedad de pruebas diseñadas para medir la inteligencia y el conocimiento en humanos y máquinas, dice OpenAI. También comete menos errores y puede responder tanto a imágenes como a texto.

Sin embargo, GPT-4 sufre los mismos problemas que han afectado a ChatGPT y hacen que algunos expertos en IA se muestren escépticos sobre su utilidad, incluidas las tendencias a «alucinar» con información incorrecta, mostrar sesgos sociales problemáticos y comportarse mal o asumir personajes perturbadores cuando se les da una » antagónico”.

“Si bien han progresado mucho, claramente no es confiable”, dice Oren Etzioni, profesor emérito de la Universidad de Washington y director ejecutivo fundador del Instituto Allen para la IA. «Pasará mucho tiempo antes de que desee que un GPT opere su planta de energía nuclear».

OpenAI proporcionó varias demostraciones y datos de pruebas comparativas para mostrar las capacidades de GPT-4. El nuevo modelo no solo puede superar el puntaje de aprobación en el Examen Uniforme de Abogados, que se usa para calificar a los abogados en muchos estados de EE. UU., sino que también obtuvo un puntaje en el 10 por ciento superior de los humanos.

También obtiene una puntuación más alta que GPT-3 en otros exámenes diseñados para evaluar el conocimiento y el razonamiento, en materias que incluyen biología, historia del arte y cálculo. Y obtiene mejores calificaciones que cualquier otro modelo de lenguaje de IA en las pruebas diseñadas por científicos informáticos para medir el progreso en dichos algoritmos. “En cierto modo, es más de lo mismo”, dice Etzioni. “Pero es más de lo mismo en una serie de avances absolutamente alucinantes”.

GPT-4 también puede realizar ingeniosos trucos vistos anteriormente en GPT-3 y ChatGPT, como resumir y sugerir modificaciones en fragmentos de texto. También puede hacer cosas que sus predecesores no pudieron, incluso actuar como un tutor socrático que ayuda a guiar a los estudiantes hacia las respuestas correctas y discute el contenido de las fotografías. Por ejemplo, si se proporciona una foto de los ingredientes en la encimera de la cocina, GPT-4 puede sugerir una receta adecuada. Si se proporciona con un gráfico, puede explicar las conclusiones que se pueden extraer de él.

“Definitivamente parece haber ganado algunas habilidades”, dice Vincent Conitzer, profesor de CMU que se especializa en IA y que ha comenzado a experimentar con el nuevo modelo de lenguaje. Pero dice que todavía comete errores, como sugerir direcciones sin sentido o presentar pruebas matemáticas falsas.

ChatGPT llamó la atención del público con una asombrosa capacidad para abordar muchas preguntas y tareas complejas a través de una interfaz conversacional fácil de usar. El chatbot no entiende el mundo como lo hacen los humanos y solo responde con palabras que estadísticamente predice que deben seguir a una pregunta.



Source link-46