La última demanda por derechos de autor de IA involucra a Mike Huckabee y sus libros


El exgobernador de Arkansas, Mike Huckabee, se encuentra entre un grupo de autores que demandan a Meta, Microsoft y otras empresas por el uso de su trabajo en la creación de herramientas de inteligencia artificial.

En una demanda presentada el martes, Huckabee y otros autores, incluida la escritora cristiana Lysa TerKeurst, alegan que sus libros fueron pirateados y utilizados en conjuntos de datos que entrenaron modelos de IA. EleutherAI, un grupo de investigación de inteligencia artificial, también figura en la demanda, al igual que Bloomberg.

La demanda colectiva propuesta es el último ejemplo de autores que alegan que las empresas de tecnología utilizaron su trabajo sin permiso para entrenar modelos generativos de IA. Durante los últimos meses, una serie de autores populares, entre ellos George R.R. MartínJodi Picoult y Michael Chabón han demandado a OpenAI por infracción de derechos de autor.

El caso Huckabee se centra en un controvertido tesoro de datos llamado “Libros3” que Contiene más de 180.000 obras. que forman parte del conjunto de datos utilizado para entrenar modelos de lenguaje grandes. En agosto, El Atlántico publicado una base de datos con capacidad de búsqueda de todos los títulos de Books3 con información del autor. Books3 es parte de una montaña más grande de datos llamada Pile, creada por EleutherAI, que según la demanda fue utilizada por las empresas para entrenar sus productos.

“[Meta and Microsoft] Pudimos incorporar conjuntos de datos sofisticados, que incluían materiales pirateados protegidos por derechos de autor en Books3, como parte del proceso de capacitación del LLM, sin tener que compensar a los autores”, se lee en la demanda.

Microsoft se negó a hacer comentarios para esta historia. Meta, Bloomberg y EleutherAI no respondieron a las solicitudes de comentarios.

Las empresas de IA dependen de enormes cantidades de datos públicos para entrenar modelos de IA: no sólo libros, sino también fotografías, arte, música y más. A medida que herramientas como ChatGPT o Stable Diffusion se vuelven fácilmente accesibles, ha habido un acalorado debate (y muchas acciones legales) sobre cómo se debe compensar a las personas que proporcionan esos datos. En Enero, Getty Images demandó a la empresa detrás de la herramienta artística de inteligencia artificial Stable Diffusionalegando que copió ilegalmente millones de imágenes con derechos de autor para entrenar su modelo.



Source link-37