La IA generativa se vuelve ‘LOCA’ cuando se entrena con datos creados por IA más de cinco veces


Un nuevo estudio sobre IA ha encontrado una limitación inherente en las redes de generación actual, como las empleadas por ChatGPT y Midjourney. Parece que las redes de IA entrenadas en salidas de IA (como el texto creado por ChatGPT o la salida de imagen creada por un modelo de difusión estable) tienden a volverse «LOCAS» después de cinco ciclos de entrenamiento con datos generados por IA. Como puede ver en las imágenes de arriba, el resultado son salidas extrañamente mutadas que no reflejan la realidad.

MAD, abreviatura de Model Autophagy Disorder, es el acrónimo utilizado por los investigadores de la Universidad de Rice y Stanford que participaron en el estudio para describir cómo los modelos de IA y la calidad de sus resultados colapsan cuando se entrenan repetidamente con datos generados por IA. Como su nombre lo indica, el modelo esencialmente «se come a sí mismo», no muy diferente del Ouroboros del mito. Pierde información sobre las colas (los extremos) de la distribución de datos original y comienza a generar resultados que están más alineados con la representación media de los datos, como la serpiente que se devora su propia cola.

Ver más

En esencia, entrenar un LLM con sus propios resultados (o los de otros) crea un efecto de convergencia en los datos que componen el propio LLM. Esto se puede ver fácilmente en el gráfico anterior, compartido por los científicos y el miembro del equipo de investigación Nicolas Papernot en Twitter, donde las sucesivas iteraciones de entrenamiento en los datos generados por LLM llevan al modelo a perder gradualmente (pero dramáticamente) el acceso a los datos contenidos en los extremos de la curva de Bell – los valores atípicos, los elementos menos comunes.

Los datos en los bordes del espectro (aquellos que tienen menos variaciones y están menos representados) esencialmente desaparecen. Por eso, los datos que quedan en el modelo ahora son menos variados y retroceden hacia la media. Según los resultados, se necesitan alrededor de cinco de estas rondas hasta que desaparezcan las colas de la distribución original; ese es el momento en que se establece MAD.

Ver más





Source link-41