Google recibe una multa de 270 millones de dólares en Francia porque las autoridades descubren que los datos de los editores de noticias se utilizaron para Gemini


En una saga interminable entre Google y la autoridad de competencia de Francia sobre la protección de los derechos de autor de fragmentos de noticias, la Autorité de la Concurrence anunció el miércoles una multa de 250 millones de euros contra el gigante tecnológico (alrededor de 270 millones de dólares al tipo de cambio actual).

Según el organismo de control de la competencia, Google incumplió algunos de sus compromisos anteriores con los editores de noticias. Pero la decisión es especialmente notable porque deja caer algo más que está muy actualizado: al aferrarse al uso que hace Google del contenido de los editores de noticias para entrenar su modelo de IA generativa Bard/Gemini.

La autoridad de competencia ha criticado a Google por no haber notificado a los editores de noticias sobre el uso que GenAI hace de su contenido protegido por derechos de autor. Esto a la luz de compromisos anteriores asumidos por Google cuyo objetivo es garantizar que lleve a cabo conversaciones de pago justas con los editores por la reutilización de su contenido.

Errores de derechos de autor y competencia

En 2019, la Unión Europea aprobó una reforma paneuropea de los derechos de autor digitales que amplió la protección de los derechos de autor a titulares y fragmentos de noticias. Los agregadores de noticias, como Google News, Discover y el cuadro de funciones «Historias destacadas» en las páginas de resultados de búsqueda, previamente habían recopilado y mostrado estas noticias en sus productos sin ninguna compensación financiera.

Inicialmente, Google intentó evadir la ley desconectando Google News en Francia. Pero la autoridad de competencia intervino rápidamente y consideró que su acción unilateral era un abuso de una posición dominante en el mercado que corría el riesgo de perjudicar a los editores. Básicamente, la intervención obligó a Google a cerrar acuerdos con editores locales sobre la reutilización de contenido. Pero en 2021, Google recibió una multa de 592 millones de dólares después de que la autoridad de competencia descubriera incumplimientos importantes en sus negociaciones con editores y agencias locales.

El gigante tecnológico calificó la sanción de “desproporcionada” y dijo que apelaría. Pero posteriormente intentó resolver la disputa, ofreciendo una serie de promesas y retirando su apelación. Los compromisos fueron aceptados por la Autorité francesa, incluyen transmitir información clave a los editores y negociar de manera justa.

Google ha firmado acuerdos de derechos de autor con cientos de editores en Francia, que entran dentro del ámbito de su acuerdo con la Autorité. Por eso su negocio en este ámbito está muy regulado.

Sin apelación

Google acordó no cuestionar los últimos hallazgos de la Autorité, a cambio de acelerar el proceso y realizar un pago monetario.

Sin embargo, su directora general de noticias y asociaciones editoriales, Sulina Connal, adoptó un tono irritado: escribió en una extensa publicación de blog que “la multa no es proporcional a las cuestiones planteadas” por la autoridad.

La publicación del blog sugiere que Google realmente quiere poner fin a la saga esta vez, y Connal también escribe: «Nos hemos conformado porque es hora de seguir adelante y, como muestran nuestros numerosos acuerdos con editores, queremos centrarnos en el ámbito más amplio». objetivo de enfoques sostenibles para conectar a las personas con contenidos de calidad y trabajar de manera constructiva con los editores franceses”.

Con la IA generativa en el marco y la lucha competitiva por lanzar herramientas, el cálculo de Google para abordar el tema de la reutilización de contenido parece diferente.

Entrenamiento GenAI en el marco

La aplicación de la ley hoy por parte de la autoridad de competencia de Francia muestra que se centró en el uso que hace Google del contenido de agencias y editores de noticias con fines de capacitación para su modelo básico de IA y su servicio de chatbot de IA relacionado, Bard (ahora llamado Gemini).

Descubrió que Google utilizó contenido de editores y agencias de prensa para capacitar a Bard, su herramienta de inteligencia artificial generativa que se lanzó en julio de 2023, “sin notificar a los titulares de los derechos de autor ni a la Autoridad”, según su comunicado de prensa.

En este punto, la defensa de Google es doble. En su blog escribe que la autoridad de competencia «no cuestiona la forma en que se utiliza el contenido web para mejorar productos más nuevos como la IA generativa, que ya se aborda en el artículo 4 de la EUCD». [EU Copyright Directive].

El artículo 4 de la Directiva sobre derechos de autor establece una “excepción o limitación para la extracción de textos y datos”, específicamente para “reproducciones y extracciones de obras y otras prestaciones legalmente accesibles con fines de extracción de textos y datos”.

Sin embargo, en su comunicado de prensa, la Autorité sostiene que aún no se ha determinado si la exención se aplica aquí. (Vale la pena señalar que la cláusula pertinente se refiere a “obras legalmente accesibles”, mientras que Google tiene un compromiso legalmente vinculante con la autoridad de competencia de notificar a los titulares de derechos de autor sobre los usos de sus obras protegidas y aparentemente no lo hizo en este caso).

«Cuando se trata de determinar si el uso de contenidos informativos para entrenar un servicio de inteligencia artificial está comprendido en el ámbito de los derechos y la protección conexos, esta pregunta aún no ha sido respondida», escribió la autoridad de competencia. «Sin embargo, la Autorité considera que Google ha incumplido su compromiso número 1 al no informar a los editores que su contenido se había utilizado para entrenar a Bard».

La publicación del blog de Google también menciona de pasada la Ley de IA de la UE, lo que sugiere que es relevante. Sin embargo, la legislación aún no está en vigor ya que está pendiente de su adopción final por parte del Consejo Europeo.

La próxima legislación sobre IA también exigirá que los desarrolladores respeten las normas de derechos de autor del bloque. E introduce requisitos de transparencia con ese objetivo en mente: exigiéndoles que establezcan una política para respetar la ley de derechos de autor de la UE; y poner a disposición del público un “resumen suficientemente detallado” del contenido utilizado para entrenar modelos de IA de propósito general (como Gemini/Bard).

Este requisito entrante para que los fabricantes de modelos publiquen un resumen de los datos de capacitación puede, en el futuro, facilitar que los editores de noticias cuyo contenido protegido haya sido ingerido para la capacitación GenAI obtengan una remuneración justa según la ley de derechos de autor de la UE.

Sin exclusión técnica

La Autorité también señala que Google no proporcionó, al menos hasta el 28 de septiembre de 2023, una solución técnica que permitiera a los editores y agencias de prensa optar por no utilizar su contenido para entrenar a Bard sin que tal decisión afecte la visualización de su contenido en otros servicios de Google.

“Hasta esta fecha, los editores y agencias de noticias que querían excluirse de este caso de uso tenían que insertar una instrucción que bloquea toda la indexación de contenido de Google, incluidos los servicios de Búsqueda, Discover y Google News. Esos servicios son específicamente parte de la negociación de ingresos relacionados con los derechos conexos”, escribió, y agregó: “En el futuro, la Autorité examinará cuidadosamente la efectividad de los procesos de exclusión voluntaria de Google”.

En términos más técnicos, entre julio y septiembre de 2023, los editores de noticias podrían insertar una etiqueta «noindex» en el archivo robots.txt para asegurarse de que su contenido no se utilizara para entrenar el modelo de inteligencia artificial de Google. Este archivo robots.txt se coloca en la carpeta raíz de los servidores web y contiene varias instrucciones para los motores de búsqueda. El rastreador web de Google analiza las instrucciones de esos archivos para indexar sitios web.

Pero una etiqueta «noindex» significa que su sitio web desaparece por completo de Google. En septiembre de 2023, Google agregó más granularidad y creó una regla «extendida por Google» que es diferente de la regla «noindex». Al excluirse de las instrucciones extendidas de Google, los editores web indican que no quieren ayudar a mejorar los modelos actuales y futuros de Gemini.

Otras deficiencias

La Autorité también está sancionando a Google por una serie de otras cuestiones relacionadas con la forma en que negocia con los editores de noticias franceses, al considerar que no les proporcionó toda la información necesaria para garantizar una negociación justa de la remuneración por su contenido.

En su comunicado de prensa, escribió que la información de Google a los editores sobre su metodología para calcular cuánto se les debería pagar era «particularmente opaca».

También encontró que Google no cumplió con los criterios de no discriminación, destinados a garantizar que los editores reciban un trato igualitario. Y denunció la decisión de Google de imponer un “umbral mínimo” de remuneración – es decir, por debajo del cual no haría ningún pago a los editores – y la Autorité describió esto como una introducción de discriminación entre editores “en su propio principio”. Por debajo de un determinado umbral, todos los editores reciben «arbitrariamente una remuneración nula, independientemente de su situación respectiva», señala también el comunicado de prensa.

Además, la Autorité criticó los cálculos de Google sobre los llamados “ingresos indirectos”, afirmando que el “paquete” que proponía no se ajustaba a decisiones anteriores ni a la sentencia de apelación del Tribunal de Justicia de octubre de 2020.

También dijo que Google no cumplió con su compromiso de actualizar los contratos de remuneración de acuerdo con sus promesas.



Source link-48