Sarah Silverman demanda a OpenAI y Meta por infracción de derechos de autor


Sarah Silverman está demandando a OpenAI. El viernes, el comediante y autor, junto con los novelistas Christopher Golden y Richard Kadrey, presentaron un par de denuncias contra y Meta (). El grupo alega que las firmas entrenaron sus modelos de lenguaje grande en materiales protegidos por derechos de autor, incluidos los trabajos que publicaron, sin obtener el consentimiento.

Las quejas se centran en los conjuntos de datos que OpenAI y Meta supuestamente usaron para entrenar a ChatGPT y LLaMA. En el caso de OpenAI, si bien su conjunto de datos «Books1» se ajusta aproximadamente al tamaño del Proyecto Gutenberg, un conocido repositorio de libros libres de derechos de autor, los abogados de los demandantes argumentan que los conjuntos de datos «Books2» son demasiado grandes para haberlos derivado de cualquier otro lugar. que las llamadas «bibliotecas en la sombra» de material protegido por derechos de autor disponible ilegalmente, como Library Genesis y Sci-Hub. Los piratas cotidianos pueden acceder a estos materiales a través de descargas directas, pero quizás sea más útil para aquellos que generan modelos de lenguaje grandes, muchas bibliotecas ocultas también ponen a disposición material escrito en paquetes de torrents masivos. de la demanda de Silverman involucra un intercambio entre los abogados del comediante y ChatGPT. El equipo legal de Silverman le pidió al chatbot que resumiera el mojador de cama, una memoria que publicó en 2010. El chatbot no solo pudo resumir partes enteras del libro, sino que algunos pasajes que transmitió parecen haber sido reproducidos palabra por palabra.

Silverman, Golden y Kadrey no son los primeros autores en demandar a OpenAI por infracción de derechos de autor. De hecho, la empresa enfrenta una serie de desafíos legales sobre cómo realizó la capacitación de ChatGPT. Solo en junio, la compañía recibió dos quejas separadas. Una es una amplia demanda colectiva que alega que OpenAI violó las leyes de privacidad federales y estatales al recopilar datos para entrenar los grandes modelos de lenguaje detrás de ChatGPT y DALL-E.



Source link-47