{"id":517026,"date":"2023-03-15T15:57:27","date_gmt":"2023-03-15T15:57:27","guid":{"rendered":"https:\/\/magazineoffice.com\/openai-esta-probando-una-version-de-gpt-4-que-puede-recordar-largas-conversaciones\/"},"modified":"2023-03-15T15:57:30","modified_gmt":"2023-03-15T15:57:30","slug":"openai-esta-probando-una-version-de-gpt-4-que-puede-recordar-largas-conversaciones","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/openai-esta-probando-una-version-de-gpt-4-que-puede-recordar-largas-conversaciones\/","title":{"rendered":"OpenAI est\u00e1 probando una versi\u00f3n de GPT-4 que puede ‘recordar’ largas conversaciones"},"content":{"rendered":"
\n<\/p>\n
OpenAI ha creado una versi\u00f3n de GPT-4, su \u00faltimo modelo de generaci\u00f3n de texto, que puede \u00abrecordar\u00bb aproximadamente 50 p\u00e1ginas de contenido gracias a una ventana de contexto muy ampliada.<\/p>\n
Eso podr\u00eda no sonar significativo. Pero es cinco veces m\u00e1s informaci\u00f3n de la que el GPT-4 est\u00e1ndar puede contener en su \u00abmemoria\u00bb y ocho veces m\u00e1s que el GPT-3.<\/p>\n
\u201cEl modelo puede usar documentos largos de manera flexible\u201d, dijo Greg Brockman, cofundador y presidente de OpenAI, durante una demostraci\u00f3n en vivo esta tarde. \u201cQueremos ver qu\u00e9 tipo de aplicaciones [this enables].\u201d<\/p>\n
Cuando se trata de IA generadora de texto, la ventana de contexto se refiere al texto que el modelo considera antes de generar texto adicional. Si bien los modelos como GPT-4 \u00abaprenden\u00bb a escribir entren\u00e1ndose con miles de millones de ejemplos de texto, solo pueden considerar una peque\u00f1a fracci\u00f3n de ese texto a la vez, determinada principalmente por el tama\u00f1o de su ventana de contexto.<\/p>\n
Los modelos con ventanas de contexto peque\u00f1as tienden a \u201colvidar\u201d el contenido de incluso conversaciones muy recientes, lo que los lleva a desviarse del tema. Despu\u00e9s de unas pocas miles de palabras, tambi\u00e9n olvidan sus instrucciones iniciales y, en cambio, extrapolan su comportamiento a partir de la \u00faltima informaci\u00f3n dentro de su ventana de contexto en lugar de la solicitud original.<\/p>\n
Allen Pike, un ex ingeniero de software de Apple, lo explica de manera colorida de esta manera:<\/p>\n
\u201c[The model] olvidar\u00e1 todo lo que intentes ense\u00f1arle. Se olvidar\u00e1 de que vives en Canad\u00e1. Se olvidar\u00e1 de que tienes hijos. Olvidar\u00e1 que odias reservar cosas los mi\u00e9rcoles y por favor deja de sugerir cosas los mi\u00e9rcoles, maldita sea. Si ninguno de ustedes ha mencionado su nombre por un tiempo, tambi\u00e9n lo olvidar\u00e1. hablar con un [GPT-powered] personaje por un tiempo, y puedes comenzar a sentir que te est\u00e1s vinculando con \u00e9l, llegando a un lugar realmente genial. A veces se confunde un poco, pero eso tambi\u00e9n le pasa a la gente. Pero eventualmente, el hecho de que no tiene memoria a mediano plazo se vuelve claro y la ilusi\u00f3n se hace a\u00f1icos\u201d.<\/p>\n
Todav\u00eda no hemos podido obtener la versi\u00f3n de GPT-4 con la ventana de contexto ampliada, gpt-4-32k. (OpenAI dice que est\u00e1 procesando solicitudes para los modelos GPT-4 de alto y bajo contexto a \u00abdiferentes tasas seg\u00fan la capacidad\u00bb). Pero no es dif\u00edcil imaginar c\u00f3mo las conversaciones con \u00e9l podr\u00edan ser mucho m\u00e1s convincentes que las del anterior. modelo de generaci\u00f3n.<\/p>\n
Con una \u00abmemoria\u00bb m\u00e1s grande, GPT-4 deber\u00eda poder conversar de manera relativamente coherente durante horas, incluso varios d\u00edas, en lugar de minutos. Y quiz\u00e1s lo m\u00e1s importante, deber\u00eda ser menos probable que se descarrile. Como se\u00f1ala Pike, una de las razones por las que los chatbots como Bing Chat pueden verse obligados a comportarse mal es porque sus instrucciones iniciales (ser un chatbot \u00fatil, responder con respeto, etc.) se eliminan r\u00e1pidamente de sus ventanas de contexto mediante indicaciones y respuestas adicionales.<\/p>\n
Puede ser un poco m\u00e1s matizado que eso. Pero la ventana de contexto juega un papel importante en la puesta a tierra de los modelos. sin duda. Con el tiempo, veremos qu\u00e9 tipo de diferencia tangible hace.<\/p>\n<\/p><\/div>\n