Un grupo de 17 autores, incluido el novelista de Juego de Tronos, George RR Martin, ha presentado una demanda colectiva contra OpenAI, fabricante de ChatGPT, en nombre de escritores de ficción que creen que su trabajo se utilizó para entrenar el chatbot de IA generativa.
La demanda está siendo organizada por el grupo de defensa The Authors Guild, que dijo en un comunicado que «la IA generativa amenaza con diezmar la profesión de autor» y que presentó la demanda «debido a la profunda injusticia y el peligro de utilizar libros protegidos por derechos de autor para desarrollar libros comerciales». Máquinas de IA sin permiso ni pago».
«Este caso es simplemente el comienzo de nuestra batalla para defender a los autores del robo por parte de OpenAI y otras IA generativas», dijo la presidenta del Authors Guild, Maya Shanbhag Lang. «Como la organización de escritores más grande y antigua, con casi 14.000 miembros, el Gremio está en una posición única para representar los derechos de los autores. Nuestra membresía es diversa y apasionada. Nuestro personal, que incluye un formidable equipo legal, tiene experiencia en leyes de derechos de autor. Esta Es todo para decir: no tomamos esta demanda a la ligera. Estamos aquí para luchar».
La lista completa de autores que han puesto sus nombres en la demanda es: David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang, Victor LaValle, George RR. Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow y Rachel Vail.
La denuncia, que se presentó la semana pasada, acusa específicamente a OpenAI de utilizar «texto de libros copiados de sitios piratas» para entrenar GPT 3.5 y GPT 4.
Como su nombre lo indica, los «grandes modelos de lenguaje» como ChatGPT requieren una gran cantidad de datos de capacitación, y las empresas detrás de ellos no son conocidas por ser exigentes con lo que obtienen de Internet. En lugar de tratar de evitar eliminar el discurso de odio y otro material ofensivo, por ejemplo, OpenAI creó un segundo sistema de inteligencia artificial para filtrarlo.
Según la denuncia, ChatGPT respondió anteriormente a solicitudes para citar pasajes de libros protegidos por derechos de autor con «un buen grado de precisión» y recientemente comenzó a rechazar la solicitud. La demanda alega que una solicitud de resumen de un libro ahora a menudo «contiene detalles que no están disponibles en reseñas y otros materiales disponibles públicamente», lo que sugiere que el libro en sí sigue siendo parte de los datos de capacitación. La demanda también señala que OpenAI admitió que en su material de capacitación aparecen trabajos protegidos por derechos de autor en una declaración que hizo a la Oficina de Patentes y Marcas. [PDF].
ChatGPT tampoco tiene reparos en intentar emular a autores reales: acabo de pedirle a la versión gratuita que escribiera «una historia corta al estilo de George RR Martin», y lo hizo, comenzando con «En los pasillos sombreados del Castillo Blackthorn». , un viento amargo aullaba a través de las almenas, llevando consigo la promesa del implacable ataque del invierno.» (Me encanta el uso de «almenas»).
El Authors Guild señala un intento reciente de «generar los volúmenes 6 y 7 de la serie Juego de Tronos Canción de hielo y fuego del demandante George RR Martin» utilizando el software OpenAI. El creador de ese proyecto lo eliminó de GitHub, pero dice que están disponibles si los representantes de Martin quieren contactarlos.
La demanda está llena de otras afirmaciones específicas de imitación de IA relacionadas con el trabajo de cada autor, pero la declaración pública de The Authors Guild se centra en el panorama general, calificando el uso no autorizado de escritura de ficción para material de entrenamiento de IA como «robo de identidad a gran escala».
«Los grandes libros generalmente los escriben quienes dedican sus carreras y, de hecho, sus vidas, a aprender y perfeccionar sus oficios», dijo Mary Rasenberger, directora ejecutiva de Authors Guild. «Para preservar nuestra literatura, los autores deben tener la capacidad de controlar si la IA generativa utiliza sus obras y cómo. Los diversos modelos de GPT y otras máquinas de IA generativa actuales sólo pueden generar material derivado de lo que vino antes. Copian la frase estructura, voz, narración y contexto de libros y otros textos ingeridos. Los resultados son meras remezclas sin la adición de ninguna voz humana. La cultura regurgitada no reemplaza el arte humano».
Los autores, como grupo, no piden que se detenga todo el desarrollo de grandes modelos de lenguaje, pero dicen que el trabajo de un autor solo debe usarse para el entrenamiento de IA con permiso y compensación.
«Los autores deberían tener derecho a decidir cuándo se utilizan sus obras para ‘entrenar’ la IA», afirmó el novelista Jonathan Franzen. «Si deciden participar, deberían recibir una compensación adecuada».
Una empresa de juegos que está adoptando un enfoque como ese es Hidden Door, que planea licenciar los mundos ficticios y los estilos de escritura de los autores y utilizarlos para generar aventuras de rol multijugador con un sistema de inteligencia artificial de su propio diseño. El primer juego de la compañía se basará en una obra de dominio público, El Mago de Oz.
«Sé que esto es controvertido, pero no creo que la IA sea innatamente malvada», dijo Hilary Mason, directora ejecutiva de Hidden Door, a PC Gamer a principios de este año. «Creo que lo que estamos discutiendo es quién se beneficia, y realmente queremos ver a los escritores, a los creadores, beneficiarse de ello. Y es por eso que estamos haciendo esto de la forma en que lo estamos haciendo».
El Authors Guild ha demandado previamente a Google por el escaneo de libros para Google Book Search, que finalmente ganó Google en una decisión que condujo al desarrollo del préstamo de libros digitales por parte de las bibliotecas.
Le pedí a OpenAI que comentara sobre la demanda, específicamente la afirmación de que utilizó copias pirateadas de novelas como material de capacitación de GPT, y actualizaré este artículo si recibo respuesta.