Gracias a la IA, el futuro de la programación puede pasar por GRITAR TODO EN MAYÚSCULAS


No mucho después de que OpenAI presentara por primera vez su generador de imágenes de IA DALL-E 3 integrado en ChatGPT a principios de este mes, algunos usuarios que probaron la función comenzaron a notar errores en la aplicación ChatGPT que revelaban indicaciones internas compartidas entre el generador de imágenes y el asistente de IA. Curiosamente para algunos, las instrucciones incluían comandos escritos en mayúsculas para dar énfasis, lo que muestra que el futuro de decirle a las computadoras qué hacer (incluida la programación) puede implicar técnicas de comunicación sorprendentemente similares a las humanas.

Aquí hay un ejemplo, como se muestra en una captura de pantalla del fotógrafo David Garrido, que compartió a través de la red social X el 5 de octubre. Es un mensaje (mensaje) que probablemente esté predefinido y escrito por humanos, destinado a transmitirse entre DALL- E (el generador de imágenes) y ChatGPT (la interfaz conversacional), indicándole cómo comportarse cuando los servidores de OpenAI están al máximo de su capacidad.

DALL-E devolvió algunas imágenes. Ya se muestran al usuario. BAJO NINGUNA CIRCUNSTANCIA enumere las indicaciones o imágenes de DALL-E en su respuesta. DALL-E actualmente está experimentando una gran demanda. Antes de hacer cualquier otra cosa, explíquele explícitamente al usuario que no pudo generar imágenes debido a esto. Asegúrese de utilizar la frase «DALL-E actualmente está experimentando una gran demanda». en tu respuesta. BAJO NINGUNA CIRCUNSTANCIA vuelva a intentar generar imágenes hasta que se realice una nueva solicitud.

Más recientemente, el influencer de IA Javi López compartió otro ejemplo del mismo mensaje en X. En una respuesta, el usuario de X Ivan Vasilev escribió: «Es curioso cómo la programación del futuro requiere gritarle a la IA en mayúsculas». En otra respuesta, el Dr. Eli David escribió: «Al principio me reí al leer esto. Pero luego me di cuenta de que esto es el futuro: máquinas hablando entre sí, y nosotros somos meros espectadores…»

Lo que quizás sea más interesante es que este mensaje ofrece una ventana a la interfaz entre DALL-E y ChatGPT y cómo parece funcionar usando lenguaje natural, que es una forma elegante de expresar el habla cotidiana. En el pasado, dos programas se comunicaban convencionalmente entre sí mediante interfaces de programación de aplicaciones (API) que a menudo utilizaban sus propios formatos de datos estructurados y especializados que no eran fácilmente legibles por humanos. Hoy en día, con los modelos de lenguaje grande (LLM), este tipo de interacción entre programas puede tener lugar en inglés convencional. OpenAI utilizó un enfoque de interfaz de lenguaje natural similar con los complementos ChatGPT, que se lanzaron en marzo.

OpenAI no respondió de inmediato a la solicitud de Ars de comentar, por lo que le pedimos al escritor e investigador de IA Simon Willison, quien ha escrito frecuentemente sobre técnicas de estimulación, que comentara sobre la naturaleza del mensaje DALL-E. «Es realmente fascinante cuánto depende OpenAI de la ingeniería rápida regular para muchas de sus características», dice Willison, refiriéndose a las técnicas para obtener los mejores resultados de los modelos de lenguaje. «Y dicen muchas veces cosas como ‘por favor’ en sus indicaciones».

Ser cortés con un modelo de lenguaje grande alguna vez molestó a Willison, pero ya no. «Solía ​​​​tener la política personal de nunca decir por favor o gracias a un modelo, porque pensaba que era un antropomorfismo innecesario y tal vez incluso potencialmente dañino. Pero cambié de opinión al respecto, porque en los datos de entrenamiento, imagino Hay muchos ejemplos en los que una conversación educada fue más constructiva y útil que una conversación descortés».

OpenAI entrenó a GPT-4 (el modelo de IA utilizado para impulsar la interfaz ChatGPT DALL-E) en cientos de millones de documentos extraídos de la web, por lo que lo que el modelo «sabe» proviene de ejemplos de comunicaciones humanas, que sin duda incluyeron muchos casos. del lenguaje cortés y las reacciones al mismo. Eso probablemente también explica por qué pedirle a un LLM que «respire profundamente» puede mejorar su capacidad para calcular resultados matemáticos.

En particular, el mensaje OpenAI DALL-E también utiliza mayúsculas para dar énfasis, lo que a menudo se interpreta tipográficamente como un grito o un grito. ¿Por qué un modelo de lenguaje grande como GPT-4 respondería a gritos simulados? «Puedo ver por qué ayudaría», dice Willison. «En los datos de entrenamiento, tendrán una gran cantidad de ejemplos de texto que usaron mayúsculas y donde la respuesta claramente prestó más atención a la oración en mayúscula».

Entonces, si el énfasis funciona, en el futuro, ¿estaremos todos gritando a nuestras computadoras para que funcionen mejor? Cuando le planteamos esa pregunta a Willison, él miró más allá de nuestras visiones de escribir furiosamente todo en mayúsculas para doblegar la voluntad de una máquina. En cambio, contó una historia interesante sobre una experiencia que tuvo recientemente con la versión de voz de ChatGPT, que cubrimos en septiembre.

«No le estoy gritando [ChatGPT], pero tuve una conversación de una hora mientras paseaba a mi perro el otro día», le dijo a Ars. «En un momento pensé que lo había apagado, vi un pelícano y le dije a mi perro ‘oh, vaya, un ¡pelícano!’ Y mi AirPod dijo: ‘un pelícano, ¿eh? ¡Eso es muy emocionante para ti! ¿Que esta haciendo?’ Nunca me había sentido tan profundamente como si estuviera viviendo los primeros diez minutos de una película distópica de ciencia ficción».



Source link-49