{"id":727666,"date":"2023-07-12T17:51:43","date_gmt":"2023-07-12T17:51:43","guid":{"rendered":"https:\/\/magazineoffice.com\/la-ia-generativa-se-vuelve-loca-cuando-se-entrena-con-datos-creados-por-ia-mas-de-cinco-veces\/"},"modified":"2023-07-12T17:51:47","modified_gmt":"2023-07-12T17:51:47","slug":"la-ia-generativa-se-vuelve-loca-cuando-se-entrena-con-datos-creados-por-ia-mas-de-cinco-veces","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/la-ia-generativa-se-vuelve-loca-cuando-se-entrena-con-datos-creados-por-ia-mas-de-cinco-veces\/","title":{"rendered":"La IA generativa se vuelve &#8216;LOCA&#8217; cuando se entrena con datos creados por IA m\u00e1s de cinco veces"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"article-body\">\n<p>Un nuevo estudio sobre IA ha encontrado una limitaci\u00f3n inherente en las redes de generaci\u00f3n actual, como las empleadas por ChatGPT y Midjourney.  Parece que las redes de IA entrenadas en salidas de IA (como el texto creado por ChatGPT o la salida de imagen creada por un modelo de difusi\u00f3n estable) tienden a volverse \u00abLOCAS\u00bb despu\u00e9s de cinco ciclos de entrenamiento con datos generados por IA.  Como puede ver en las im\u00e1genes de arriba, el resultado son salidas extra\u00f1amente mutadas que no reflejan la realidad.<\/p>\n<p>MAD, abreviatura de Model Autophagy Disorder, es el acr\u00f3nimo utilizado por los investigadores de la Universidad de Rice y Stanford que participaron en el estudio para describir c\u00f3mo los modelos de IA y la calidad de sus resultados colapsan cuando se entrenan repetidamente con datos generados por IA.  Como su nombre lo indica, el modelo esencialmente \u00abse come a s\u00ed mismo\u00bb, no muy diferente del Ouroboros del mito.  Pierde informaci\u00f3n sobre las colas (los extremos) de la distribuci\u00f3n de datos original y comienza a generar resultados que est\u00e1n m\u00e1s alineados con la representaci\u00f3n media de los datos, como la serpiente que se devora su propia cola.<\/p>\n<div class=\"see-more see-more--clipped\">\n<blockquote class=\"twitter-tweet hawk-ignore\" data-lang=\"en\">\n<p lang=\"en\" dir=\"ltr\">En el trabajo dirigido por @iliaishacked, nos preguntamos qu\u00e9 sucede a medida que entrenamos nuevos modelos generativos con datos generados en parte por modelos anteriores. Mostramos que los modelos generativos pierden informaci\u00f3n sobre la distribuci\u00f3n real, con el modelo colapsando a la representaci\u00f3n media de datos pic .twitter.com\/OFJDZ4QofZ<a href=\"https:\/\/twitter.com\/NicolasPapernot\/status\/1664280922265616385\" data-url=\"https:\/\/twitter.com\/NicolasPapernot\/status\/1664280922265616385\" target=\"_blank\" rel=\"noopener\">1 de junio de 2023<\/a><\/p>\n<\/blockquote>\n<p><span class=\"see-more__button\" role=\"button\" tabindex=\"0\" aria-label=\"See more\">Ver m\u00e1s<\/span><\/p>\n<\/div>\n<p>En esencia, entrenar un LLM con sus propios resultados (o los de otros) crea un efecto de convergencia en los datos que componen el propio LLM.  Esto se puede ver f\u00e1cilmente en el gr\u00e1fico anterior, compartido por los cient\u00edficos y el miembro del equipo de investigaci\u00f3n Nicolas Papernot en Twitter, donde las sucesivas iteraciones de entrenamiento en los datos generados por LLM llevan al modelo a perder gradualmente (pero dram\u00e1ticamente) el acceso a los datos contenidos en los extremos de la curva de Bell &#8211; los valores at\u00edpicos, los elementos menos comunes. <\/p>\n<p>Los datos en los bordes del espectro (aquellos que tienen menos variaciones y est\u00e1n menos representados) esencialmente desaparecen.  Por eso, los datos que quedan en el modelo ahora son menos variados y retroceden hacia la media.  Seg\u00fan los resultados, se necesitan alrededor de cinco de estas rondas hasta que desaparezcan las colas de la distribuci\u00f3n original; ese es el momento en que se establece MAD.<\/p>\n<div class=\"see-more see-more--clipped\">\n<blockquote class=\"twitter-tweet hawk-ignore\" data-lang=\"en\">\n<p lang=\"en\" dir=\"ltr\">Genial art\u00edculo de mis amigos de Rice.  Miran lo que sucede cuando entrenas modelos generativos en sus propios resultados&#8230; una y otra vez.  Los modelos de im\u00e1genes sobreviven 5 iteraciones antes de que sucedan cosas raras. https:\/\/t.co\/JWPyRwhW8oCredit: @SinaAlmd, @imtiazprio, @richbaraniuk pic.twitter.com\/KPliZCABd4<a href=\"https:\/\/twitter.com\/tomgoldsteincs\/status\/1677439914886176768\" data-url=\"https:\/\/twitter.com\/tomgoldsteincs\/status\/1677439914886176768\" target=\"_blank\" rel=\"noopener\">7 de julio de 2023<\/a><\/p>\n<\/blockquote>\n<p><span class=\"see-more__button\" role=\"button\" tabindex=\"0\" aria-label=\"See more\">Ver m\u00e1s<\/span><\/p>\n<\/div>\n<aside class=\"hawk-nest\" data-render-type=\"fte\" data-skip=\"dealsy\" data-widget-type=\"seasonal\"\/>\n<p>No se ha confirmado que el trastorno de autofagia modelo afecte a todos los modelos de IA, pero los investigadores lo verificaron con codificadores autom\u00e1ticos, modelos de mezcla gaussiana y modelos de lenguaje extenso.<\/p>\n<p>Da la casualidad de que todos estos tipos de modelos que pueden \u00abvolverse LOCOS\u00bb se han generalizado y est\u00e1n funcionando desde hace un tiempo: los codificadores autom\u00e1ticos pueden manejar cosas como la predicci\u00f3n de popularidad (en cosas como el algoritmo de una aplicaci\u00f3n de redes sociales), compresi\u00f3n de im\u00e1genes, eliminaci\u00f3n de ruido de im\u00e1genes y generaci\u00f3n de im\u00e1genes;  y los modelos de mezcla gaussiana se utilizan para fines de estimaci\u00f3n de densidad, agrupamiento y segmentaci\u00f3n de im\u00e1genes, lo que los hace particularmente \u00fatiles para las ciencias estad\u00edsticas y de datos. <\/p>\n<p>En cuanto a los grandes modelos de lenguaje en el n\u00facleo de las populares aplicaciones de chatbot de hoy en d\u00eda (de los cuales ChatGPT de OpenAI y AI Claude de Anthropic son meros ejemplos), tambi\u00e9n son propensos a volverse LOCOS cuando se entrenan en sus propios resultados.  Con eso, tal vez valga la pena enfatizar cu\u00e1n importantes son estos sistemas de IA en nuestras vidas;  Los modelos algor\u00edtmicos de IA se emplean tanto en el \u00e1mbito corporativo como en el p\u00fablico.<\/p>\n<div class=\"see-more see-more--clipped\">\n<blockquote class=\"twitter-tweet hawk-ignore\" data-lang=\"en\">\n<p lang=\"en\" dir=\"ltr\">Enfrentamos un problema similar mientras arranc\u00e1bamos modelos generativos para la generaci\u00f3n de niveles de Sokoban usando https:\/\/t.co\/ONWUSMnBTQ. Una soluci\u00f3n era agrupar los niveles en funci\u00f3n de sus caracter\u00edsticas y cambiar el proceso de muestreo por lotes para enfatizar los niveles con caracter\u00edsticas m\u00e1s raras.<a href=\"https:\/\/twitter.com\/yetmania\/status\/1666154768115302408\" data-url=\"https:\/\/twitter.com\/yetmania\/status\/1666154768115302408\" target=\"_blank\" rel=\"noopener\">6 de junio de 2023<\/a><\/p>\n<\/blockquote>\n<p><span class=\"see-more__button\" role=\"button\" tabindex=\"0\" aria-label=\"See more\">Ver m\u00e1s<\/span><\/p>\n<\/div>\n<p>Esta investigaci\u00f3n proporciona una forma de mirar dentro de la caja negra del desarrollo de IA.  Y destruye cualquier esperanza de que hayamos encontrado una fuente interminable de datos al hacer una rueda de h\u00e1mster con ciertos modelos de IA: alimentarlo con datos y luego alimentarlo con sus propios datos, para generar m\u00e1s datos que luego se retroalimentan. de nuevo.<\/p>\n<p>Esto podr\u00eda ser un problema para los modelos existentes actualmente y las aplicaciones de estos modelos: si un modelo que logr\u00f3 un uso comercial, de hecho, ha sido entrenado en sus propios resultados, entonces ese modelo probablemente haya retrocedido hacia su media (recuerde que toma alrededor de cinco ciclos de entrada-salida para que eso se manifieste).  Y si ese modelo ha retrocedido hacia su media, entonces ha sido sesgado de alguna forma, ya que no considera los datos que naturalmente ser\u00edan una minor\u00eda.  Fanatismo algor\u00edtmico, por as\u00ed decirlo.<\/p>\n<p>Otro punto importante impulsado por los resultados es la preocupaci\u00f3n por la procedencia de los datos: ahora se vuelve a\u00fan m\u00e1s importante poder separar los datos \u00aboriginales\u00bb de los datos \u00abartificiales\u00bb.  Si no puede identificar qu\u00e9 datos cre\u00f3 un LLM o una aplicaci\u00f3n de imagen generativa, es posible que los incluya accidentalmente en los datos de capacitaci\u00f3n para su producto de pr\u00f3xima generaci\u00f3n.<\/p>\n<p>Desafortunadamente, es probable que ese barco ya haya zarpado: ha habido una cantidad distinta de cero de datos no etiquetados que ya han sido producidos por este tipo de redes y se han incorporado a otros sistemas.  Incluso si tuvi\u00e9ramos una instant\u00e1nea de todo Internet antes de la explosi\u00f3n de popularidad de ChatGPT o Midjourney, durante mucho tiempo se han vertido diariamente datos producidos por IA en la red mundial.  Y eso no dice nada de las inmensas cantidades de datos que han producido mientras tanto.<\/p>\n<p>Pero incluso si ese barco ha zarpado, al menos ahora lo sabemos.  Saber significa que la b\u00fasqueda de una marca de agua que identifique el contenido generado por IA (y eso es infalible) ahora se ha convertido en un esfuerzo mucho m\u00e1s importante y lucrativo, y que la responsabilidad de etiquetar los datos generados por IA ahora se ha convertido en un requisito mucho m\u00e1s serio. .<\/p>\n<p>Aparte de eso, sin embargo, hay otras formas de compensar estos sesgos.  Una de las formas es simplemente cambiar las ponderaciones del modelo: si aumenta la relevancia o la frecuencia de los resultados en las colas de la distribuci\u00f3n, se mover\u00e1n naturalmente a lo largo de la curva de campana, m\u00e1s cerca de la media.  De ello se deduce que entonces ser\u00edan mucho menos propensos a la \u00abpoda\u00bb del entrenamiento autogenerativo: el modelo a\u00fan pierde los datos en los bordes de la curva, pero esos datos ya no est\u00e1n solo all\u00ed.<\/p>\n<p>Pero entonces, \u00bfc\u00f3mo se decide la ponderaci\u00f3n?  \u00bfEn qu\u00e9 medida se deben mover las pesas?  \u00bfAument\u00f3 la frecuencia?  Aqu\u00ed tambi\u00e9n existe la responsabilidad de comprender los efectos del ajuste fino del modelo y c\u00f3mo estos tambi\u00e9n afectan la salida.<\/p>\n<p>Por cada pregunta que se responde, hay una serie de otras que saltan al primer plano: preguntas relacionadas con la verdad detr\u00e1s de las respuestas del modelo (donde las desviaciones se conocen como alucinaciones);  si el modelo est\u00e1 sesgado o no, y de d\u00f3nde proviene este sesgo (si de los datos de entrenamiento en s\u00ed o del proceso de ponderaci\u00f3n utilizado para crear la red, y ahora tambi\u00e9n lo sabemos del proceso MAD);  y, por supuesto, qu\u00e9 sucede cuando los modelos se entrenan con sus propios datos.  Y como hemos visto, los resultados no son virtuosos.<\/p>\n<p>Y no podr\u00eda serlo: las personas que no tienen acceso a nuevas experiencias tambi\u00e9n se marchitan, por lo que se convierten en c\u00e1maras de eco de lo que ha venido antes.  Y eso es exactamente lo mismo que decir algo como \u00abcuando el modelo se entrena en sus propios resultados, colapsa\u00bb. <\/p>\n<\/div>\n<p><script async src=\"\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-41<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un nuevo estudio sobre IA ha encontrado una limitaci\u00f3n inherente en las redes de generaci\u00f3n actual, como las empleadas por ChatGPT y Midjourney. Parece que las redes de IA entrenadas&hellip;<\/p>\n","protected":false},"author":1,"featured_media":727667,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[2616,133,11700,226,121,54136,59500,1760,84,110,1585,82],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/727666"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=727666"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/727666\/revisions"}],"predecessor-version":[{"id":727668,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/727666\/revisions\/727668"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/727667"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=727666"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=727666"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=727666"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}