{"id":680047,"date":"2023-06-13T13:29:24","date_gmt":"2023-06-13T13:29:24","guid":{"rendered":"https:\/\/magazineoffice.com\/como-los-bots-como-chatgpt-han-robado-fanfiction-y-que-significa\/"},"modified":"2023-06-13T13:29:28","modified_gmt":"2023-06-13T13:29:28","slug":"como-los-bots-como-chatgpt-han-robado-fanfiction-y-que-significa","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/como-los-bots-como-chatgpt-han-robado-fanfiction-y-que-significa\/","title":{"rendered":"C\u00f3mo los bots como ChatGPT han robado Fanfiction y qu\u00e9 significa"},"content":{"rendered":"


\n<\/p>\n

\n

Primero, una confesi\u00f3n. He escrito fanfiction<\/span>. Como, mucho<\/em> de fanfic<\/span>. \u00a1En mi tiempo libre, todav\u00eda escribo ficci\u00f3n! (Actualmente estoy escribiendo un par de ficci\u00f3n<\/span> para Entrevista con el Vampiro<\/em><\/span> <\/em>y trigun<\/em><\/span>! Va muy bien, gracias). En el transcurso de los \u00faltimos 15 a\u00f1os, he publicado alrededor de 750,000 palabras de fic, y solo para darles una idea de cu\u00e1nto es eso, todo el se\u00f1or de los Anillos<\/em> serie, incluyendo El Hobbit<\/em>, est\u00e1 justo al norte de 575.000 palabras. \u00a1As\u00ed que hay mucho por ah\u00ed!<\/p>\n

La mayor parte de mi trabajo, como millones de otros escritores de ficci\u00f3n, existe en el Archivo propio.<\/span> El AO3, como se le conoce, es el archivo de ficci\u00f3n m\u00e1s grande y m\u00e1s visitado en la web con alrededor de 350 millones de visitantes por mes, y actualmente alberga m\u00e1s de 11 millones de obras de fans. Y hasta hace poco, no me di cuenta de que mi fic no se hab\u00eda quedado en AO3. Mi trabajo, junto con millones de otras ficciones, se ha utilizado para entrenar IA basada en texto generativo. Si has jugado con ChatGPT<\/span>-\u00a1felicitaciones! Has usado mi trabajo.<\/p>\n

\u00bfC\u00f3mo rasparon los LLM modernos los sitios de fanfiction?<\/h2>\n

Los modelos de lenguaje extenso (LLM) son la base de los generadores de texto de IA, que fueron \u00abentrenados\u00bb en datos para crear redes neuronales artificiales. El conjunto de datos m\u00e1s conocido est\u00e1 alojado en Common Crawl, una organizaci\u00f3n sin fines de lucro que proporciona un repositorio abierto de datos web a cualquiera que lo desee, de forma gratuita. Para crear el conjunto de datos, Common Crawl busc\u00f3 en Internet para escribir y lo hizo accesible al p\u00fablico. Su archivo comenz\u00f3 en 2008 y actualmente se actualiza cada dos meses. <\/p>\n

Para crear programas de IA de texto generativo, los programadores utilizaron el conjunto de datos Common Crawl para respaldar las redes neuronales artificiales, que se denominan LLM. El LLM m\u00e1s conocido es GPT, que fue creado por la empresa OpenAI. OpenAI us\u00f3 el conjunto de datos Common Crawl en el desarrollo de GPT y actualmente lo est\u00e1 usando mientras desarrolla versiones adicionales de su exitoso caso de uso, ChatGPT. OpenAI lanz\u00f3 la API de GPT al p\u00fablico en 2021. Esta API es la base para muchos otros LLM basados \u200b\u200ben texto, lo que significa que el estado actual de varios \u00abloro estoc\u00e1stico<\/span>Los programas de inteligencia artificial generadores de texto son compatibles con Common Crawl a trav\u00e9s de la API GPT y, t\u00e9cnicamente hablando, se basan en un corpus masivo de fanfiction. <\/p>\n

En 2019, el Archivo propio<\/a><\/span> ten\u00eda 32 mil millones de palabras<\/em> de fanfic disponibles, calculados a partir de alrededor de cinco millones de piezas de fanwork. Actualmente alberga 11 millones de fanworks. No pude encontrar una buena fuente de cu\u00e1ntas palabras hay en AO3 ahora, pero no me sorprender\u00eda si fueran mucho, mucho m\u00e1s de 50 mil millones de palabras. Nuevamente, a modo de comparaci\u00f3n, ya que estos son n\u00fameros absurdamente grandes, actualmente hay 4.200 millones de palabras en ingl\u00e9s en Wikipedia. Para nuestros prop\u00f3sitos, vale la pena saber que la mayor\u00eda, si no todos, de esos 32 mil millones de palabras de fanfic disponibles en 2019 est\u00e1n en el conjunto de datos Common Crawl que se us\u00f3 en GPT LLM de OpenAI. <\/p>\n

A nadie se le dijo que esto estaba pasando; muchos escritores de ficci\u00f3n a\u00fan no saben que su trabajo fue eliminado. Si bien los datos de Crawl existen en un \u00edndice disponible p\u00fablicamente, es extremadamente dif\u00edcil acceder a ellos si no tiene la capacidad de comprender y ejecutar el c\u00f3digo a un nivel bastante alto. El usuario promedio de Internet solo puede asumir que si tuviera escritos disponibles p\u00fablicamente en l\u00ednea, sus escritos terminaron atrapados en el Rastreo. Entonces, aunque algunas personas entendieron que el AO3 probablemente se hab\u00eda rastreado, nadie hab\u00eda investigado para averiguar si realmente se estaba usando. <\/p>\n

\u00bfC\u00f3mo se vincula Sudowrite con Omega Verse fic?<\/h2>\n

Hace unas pocas semanas, sudoscribir<\/span>\u2014un LLM basado en GPT\u2014 lanz\u00f3 su producto para versi\u00f3n beta p\u00fablica. A diferencia de la llamada y respuesta de ChatGPT, Sudowrite se cre\u00f3 para facilitar la escritura de ficci\u00f3n. Los usuarios pueden registrarse y usar su cuenta para generar palabras que pueden o no parecerse a la forma de una historia. Adem\u00e1s, los usuarios pueden pegar sus palabras originales en la herramienta de escritura y el generador ofrecer\u00e1 opciones para lo que deber\u00eda suceder a continuaci\u00f3n. Es un generador de lenguaje muy avanzado enfocado a la creaci\u00f3n de historias. y us\u00f3 miles de millones de palabras<\/em> del Archivo Propio para desarrollar sus modelos. En una serie de experimentos cada vez m\u00e1s desquiciados, cableado<\/span> pudo demostrar que Sudowrite no solo hab\u00eda sido entrenado en AO3, sino que tambi\u00e9n pudo replicar historias que se desarrollaron dentro de su cultura derivada y transformadora. <\/p>\n

Este reportaje bastante ingenioso e ir\u00f3nico revel\u00f3 que Sudowrite podr\u00eda generar una historia dentro de las reconocibles restricciones de Omega Verse. NO me estoy metiendo en lo que constituye un fic de Omega Verse, y si vas a buscar esa informaci\u00f3n t\u00fa mismo, no soy responsable de lo que aprendas. El punto es que este estilo de escritura y los diversos tropos involucrados en la escritura dentro de Omega Verse est\u00e1n localizados en comunidades de fanfiction en l\u00ednea, y en realidad se desarrollaron en AO3. Es un estilo de escritura espec\u00edfico de la cultura que recientemente se ha abierto camino en los principales medios de publicaci\u00f3n, aunque no tradicionales. La \u00fanica forma en que Sudowrite ser\u00eda capaz de generar historias reconocibles de Omega Verse era si se hubiera entrenado con tanto fanfiction que el impacto de la fic fuera imperceptible dentro de la programaci\u00f3n LLM.<\/p>\n

Habl\u00e9 con un representante de clientes de Sudowrite a trav\u00e9s del chat que confirm\u00f3 que entren\u00f3 su red en los modelos de lenguaje grande de OpenAI y \u00absus propios modelos\u00bb, y reiter\u00f3 que estos modelos fueron entrenados en texto en l\u00ednea publicado entre 2011 y 2019. Una vez m\u00e1s, en 2019, el AO3 ten\u00eda 32 mil millones de palabras. Incluido el m\u00edo. <\/p>\n

Fanfiction es un regalo<\/h2>\n

Usar fic en un LLM deliberadamente dirigido a escritores es antit\u00e9tico a la cultura fandom en general y profundamente irrespetuoso con las personas que han escrito y distribuido fic en l\u00ednea, de forma gratuita, durante a\u00f1os. Fanfic tiene una historia legal dif\u00edcil, y la creaci\u00f3n de Archive of Our Own tiene sus ra\u00edces en un movimiento liderado por fan\u00e1ticos para establecer un hogar para fandoms fuera de la influencia corporativa y sin amenazas de censura. Y ahora, todo ese trabajo est\u00e1 siendo tomado, cortado y regurgitado en varios LLM, sin el permiso de ning\u00fan autor de ficci\u00f3n. Es, para ser absolutamente sincero, jodidamente asqueroso. <\/p>\n

Admito que todo esto es personal; No s\u00e9 cu\u00e1nto fic tuve en l\u00ednea en 2019, pero probablemente fueron alrededor de 600,000 palabras. La mayor parte de lo que he escrito desde entonces han sido one-shots breves, ficciones sin terminar y una tonelada, como m\u00e1s de dos millones de palabras, de ficci\u00f3n original y reportajes mientras cambiaba de carrera. Pero en el transcurso de todo mi tiempo como escritor de ficci\u00f3n, no pens\u00e9 ni una sola vez en que ninguna de mis ficciones dejara el Archivo. Eso se debe a que AO3 y el fandom tienen una cultura de privacidad, protecci\u00f3n y obsequio que es antit\u00e9tica para la mayor\u00eda de las instituciones y en desacuerdo extremo con Sudowrite.<\/p>\n

Todos los fandoms tienen su propia cultura de interacci\u00f3n. Asimismo, todos los sitios de ficci\u00f3n tambi\u00e9n tienen sus propias culturas. El AO3 y las diversas culturas fandom que coexisten en el sitio, generalmente comparten algunos valores culturales similares. Uno de los m\u00e1s comunes es que es un tab\u00fa para los escritores obtener ganancias del fic que publican en AO3. De hecho, como parte del acuerdo de usuario, los autores no pueden anunciar la escritura como un servicio o incluso vincular a un tarro de sugerencias para evitar complicaciones legales para el propio Archivo. Con la gran excepci\u00f3n de Wikipedia, y a diferencia de muchos escritos en Internet que se incluyeron en el Crawl, los fanfic en el Archivo no son escritura compensada. No est\u00e1 respaldado por anuncios, la gente no pag\u00f3 por \u00e9l, no estaba generando valor monetario para nadie. Fue un regalo. Programas como Sudowrite est\u00e1n cobrando a los usuarios por acceder a su LLM, que se cre\u00f3 a partir de los obsequios de los escritores de ficci\u00f3n al fandom. <\/p>\n

Repart\u00ed mi escritura, gratis, porque el fandom es una cultura de adici\u00f3n. Fanfic, fanart, podfic: todas estas cosas se dan de un individuo al colectivo sin esperar que nadie le devuelva el favor. Quer\u00eda sumarme al fandom porque me encantaban las historias que ve\u00eda en los cines, en los libros, en la televisi\u00f3n. Me encantaba escribir en esos mundos y disfrut\u00e9, m\u00e1s all\u00e1 de la enumeraci\u00f3n, la ficci\u00f3n que le\u00ed. Y ahora, es una faceta frustrante de la autor\u00eda de fic que un programa como Sudowrite proponga un mundo donde la escritura se realiza mediante un algoritmo, y ese algoritmo sabe c\u00f3mo escribo. Sabe c\u00f3mo escribe el fandom.<\/p>\n

Es abominable que un programa que pretende apoyar a una comunidad de escritores haya basado al menos 32 mil millones de palabras de su programa en la escritura de una comunidad que dio su consentimiento para que se use su trabajo. Algunas personas dir\u00e1n que es ir\u00f3nico que los escritores de ficci\u00f3n afirmen que su trabajo fue robado, pero que fue puesto en el Rastreo sin permiso. Las obras de fans derivadas tienen el derecho legal de existir, y los escritores de ficci\u00f3n tienen derechos legales sobre sus propias creaciones. Escribir fic no es robar, pero tomar fic y usarlo para desarrollar un conjunto de datos, y luego ofrecer ese conjunto de datos al p\u00fablico sin haber obtenido el permiso de literalmente nadie, es \u00e9ticamente asqueroso.<\/p>\n

Fandom es una cultura que la IA quiere explotar<\/h2>\n

Para muchos desarrolladores LLM y AI, fanfic no es una cultura para celebrar, sino una comunidad para explotar. Ellos postulan sobre modelos interactivos <\/a><\/span>que permiten a las personas chatear con sus personajes favoritos, no entrenados en el libro original o textos originales, sino entrenados en fanfiction<\/em>. Esto se debe en parte a que la fic ya est\u00e1 en el rastreo y saben que pueden tomar de los escritores de fic sin la amenaza de repercusiones legales, y usar\u00e1n las mismas protecciones de uso justo destinadas a proteger a los escritores de fic de los autores como una excusa para su experimentaci\u00f3n. Fanfiction no es un mercado. es una cultura Y la cultura fanfic odia<\/em> esta idea.<\/p>\n

Fanfic es, en esencia, una celebraci\u00f3n de las historias que amamos. Es una continuaci\u00f3n del canon en nuevas formas hermosas, cr\u00edticas y emocionantes. Desaf\u00eda el texto y hace preguntas deliberadas sobre qui\u00e9n lo escribi\u00f3 de esa manera, por qu\u00e9 y qu\u00e9 pasar\u00eda si el canon fuera diferente. Es un espacio que admite una gran cantidad de experimentaci\u00f3n y de superaci\u00f3n de l\u00edmites y, durante mucho tiempo, ha apoyado la interpretaci\u00f3n queer, adoptando los medios queer de una manera que la corriente principal actualmente no puede. Hay mucho sobre fanfic que es importante, y los grandes modelos de lenguaje desinfectar\u00e1n ese trabajo, haci\u00e9ndose eco de la siguiente palabra m\u00e1s probable y deshumanizando por completo el esfuerzo, la emoci\u00f3n y la cultura que se encuentran en la base de los chatbots de IA. <\/p>\n

En este momento, hay una cantidad confusa de conexiones neuronales artificiales entre la ficci\u00f3n y las palabras que genera una IA. Si bien algunos modelos son gratuitos, Sudowrite es una prueba de que el fanfic ha sido robado con fines de lucro. Los LLM son reprobables por una serie de razones, tanto ecol\u00f3gicas como \u00e9ticas, pero el hecho de que hayan robado el trabajo de una cultura del don y est\u00e9n intentando ofuscar ese hecho y vend\u00e9rselo a los escritores de ficci\u00f3n es, francamente, repugnante. LLM Developers y Fandom son culturas diametralmente opuestas, y un grupo se beneficia del arduo trabajo del otro. <\/p>\n

Al final del d\u00eda, si alguien quiere sentarse y leer un 50K Sobrenatural<\/em> er\u00f3tica; una ficci\u00f3n \u00e9pica de Steve\/Bucky de 300.000 que abarca varios universos; o docena acogedor Guerra de las Galaxias<\/em> AU de cafeter\u00eda, pueden encontrar lo que buscan con unos sencillos filtros en el Archivo. Y est\u00e1 ah\u00ed, de lectura gratuita y sin condiciones, dado que el autor disfrut\u00f3 escribiendo en el mismo mundo que esos personajes y quer\u00eda que otras personas tambi\u00e9n lo disfrutaran. Y puedo garantizar que no encontrar\u00e1 el mismo tipo de cultura, experimentaci\u00f3n o incluso satisfacci\u00f3n al pedirle a un LLM que lo escriba por usted. Y si no lo encuentras en AO3, pues. Siempre puedes escribirlo t\u00fa mismo.<\/p>\n


\n

\u00bfQuieres m\u00e1s noticias de io9? Consulta cu\u00e1ndo esperar lo \u00faltimo <\/em>Maravilla<\/em><\/span>, <\/em>Guerra de las Galaxias<\/span>y Star Trek<\/span> lanzamientos, \u00bfqu\u00e9 sigue para el <\/em>Universo DC en cine y televisi\u00f3n<\/em><\/span>y todo lo que necesitas saber sobre el futuro de <\/em>M\u00e9dico que<\/span>.<\/em><\/p>\n<\/div>\n