Getty Images ha iniciado procedimientos legales contra el creador de la herramienta de arte de inteligencia artificial Stable Diffusion. Presentada esta semana en el Tribunal Superior de Londres, la acción de Getty Images afirma que «Stability AI copió y procesó ilegalmente millones de imágenes protegidas por derechos de autor» y usó estas imágenes para su propio beneficio comercial.
Getty Images y los titulares de derechos de bibliotecas de imágenes como esta serán algunos de los más afectados por la generación de imágenes de IA, y aunque algunos han adoptado la tecnología, como Shutterstock (se abre en una pestaña nueva), otros han rechazado en gran medida el arte de la IA. Getty Images cae en la última categoría. Getty Images prohibió la carga y venta de imágenes de IA (se abre en una pestaña nueva) en septiembre de 2022, en un intento por mantenerse a salvo de desafíos legales.
El CEO de Getty, Craig Peters, había dicho anteriormente que existen preocupaciones por las obras de arte creadas por IA, incluidos los «problemas de derechos no abordados».
Poco sabíamos en ese momento, los desafíos legales vendrían directamente del propio Getty.
«Getty Images cree que la inteligencia artificial tiene el potencial de estimular los esfuerzos creativos», un comunicado de Getty Images (se abre en una pestaña nueva) dice. «En consecuencia, Getty Images otorgó licencias a los principales innovadores tecnológicos para fines relacionados con el entrenamiento de sistemas de inteligencia artificial de una manera que respete los derechos de propiedad intelectual y personal».
«Stability AI no buscó ninguna licencia de este tipo de Getty Images y, en cambio, creemos que optó por ignorar las opciones de licencia viables y las protecciones legales de larga data en la búsqueda de sus intereses comerciales independientes».
Todo se reduce a cómo se entrena una IA: el paso preliminar más importante para construir una herramienta de inteligencia artificial que funcione.
El arte generado por Stable Diffusion, y otras herramientas similares, es original. Probablemente no haya nada exactamente igual: una IA lo creó en función de las indicaciones que le dieron sus usuarios humanos. Sin embargo, la IA debe entrenarse en millones de imágenes etiquetadas para aprender qué crear, y lo que esto significa para los derechos de autor de las imágenes utilizadas para este entrenamiento se ha cuestionado en muchas ocasiones.
Estos grandes conjuntos de datos de pares de imágenes y texto a menudo son proporcionados por otras empresas que recopilan y cotejan los datos ellos mismos. Estos son conjuntos de datos masivos, estamos hablando de millones o miles de millones de entradas para cada uno. Eso significa que recopilar suficientes muestras para llenar un conjunto de datos completo puede ser un trabajo exhaustivo y requiere inmensas cantidades de material de origen hecho por humanos, y todas y cada una de esas imágenes tienen su propio estatus de derechos de autor, desde dominio público hasta estrictos derechos de autor o condiciones de uso.
Una de esas organizaciones de conjuntos de datos es LAION (se abre en una pestaña nueva)que proporciona los conjuntos de datos utilizados para la difusión estable.
LAION no tiene fines de lucro y distribuye sus conjuntos de datos libremente. Esencialmente recopila conjuntos de datos de texto alternativo y URL de imágenes que raspaduras desde Internet. No es dueño de nada. La organización trata de hacer las paces con eso en la primera pregunta de sus preguntas frecuentes. (se abre en una pestaña nueva): «¿Los conjuntos de datos de LAION respetan las leyes de derechos de autor?»
A lo que la organización responde: «Los conjuntos de datos de LAION son simplemente índices de Internet».
Incluso puede encontrar una foto suya en los conjuntos de datos de LAION, para los cuales la organización ha proporcionado un formulario de eliminación de GDPR para cumplir con la ley de la UE.
LAION intenta mantener sus manos limpias al no almacenar ni distribuir ninguna imagen directamente, y puede haber funcionado ya que la ira de Getty Images está dirigida directamente a Stability AI, una de las compañías más conocidas que utilizan sus conjuntos de datos.
Stability AI sostiene que los conjuntos de datos de LAION que utiliza para Stable Diffusion se entrenaron de conformidad con la legislación alemana. En respuesta a su propia pregunta de preguntas frecuentes «¿Cuál es el derecho de autor para usar imágenes generadas por Stable Diffusion?» Stability AI dice: «El área de las imágenes generadas por IA y los derechos de autor es compleja y variará de una jurisdicción a otra».
Una respuesta verdaderamente ambigua.
Stability AI al menos dice de dónde obtiene sus datos: LAION es en realidad una de las organizaciones de raspado de imágenes más abiertas en la web, a diferencia de algunas herramientas de IA que no hacen que esa información esté disponible públicamente. Eso incluye OpenAI (se abre en una pestaña nueva), el creador de herramientas populares de inteligencia artificial como DALL-E y ChatGPT. Stability AI planea permitir a los artistas optar por no participar en el entrenamiento de imágenes de Stable Diffusion (se abre en una pestaña nueva) con versiones futuras, pero parece un poco al revés. ¿No debería Stable Diffusion tener que pedir permiso a los artistas para usar su trabajo?
No hay respuesta a la acción legal de Stability AI en este momento, pero me comuniqué con la compañía para hacer comentarios.
El CEO de Getty Images ha hablado con The Verge (se abre en una pestaña nueva) para explicar con más detalle por qué la compañía ha tomado este curso de acción.
«No creemos que este despliegue específico de la oferta comercial de Stability esté cubierto por un trato justo en el Reino Unido o un uso justo en los Estados Unidos», dijo Peters. «La compañía no se comunicó con Getty Images para utilizar nuestro material o el de nuestros colaboradores, por lo que estamos tomando medidas para proteger nuestros derechos de propiedad intelectual y los de nuestros colaboradores».
Peters también confirmó que los cargos presentados contra Stability AI incluyen violación de derechos de autor y violación de los términos de servicio de Getty Images. Dijo que la compañía busca formar un nuevo statu quo legal para la concesión de licencias y la IA del caso judicial.
Tal statu quo podría ser formativo para la naciente industria de herramientas de IA generativa. La ley de derechos de autor aún no se ha puesto al día con el entrenamiento de la IA en conjuntos de datos masivos de imágenes raspadas, lo que significa que estos próximos años de acción legal podrían dar forma a la forma en que abordamos este tema en las próximas décadas.
Es probable que la demanda presentada por Getty Images siente un precedente legal, sea cual sea el resultado.
Esto tenía que suceder en algún momento, y los argumentos sobre los derechos de autor en torno a las imágenes generadas por IA y el entrenamiento de las herramientas de IA apenas están comenzando.