{"id":1022986,"date":"2024-02-24T02:57:09","date_gmt":"2024-02-24T02:57:09","guid":{"rendered":"https:\/\/magazineoffice.com\/reddit-dice-que-ha-ganado-203-millones-de-dolares-hasta-ahora-con-la-licencia-de-sus-datos\/"},"modified":"2024-02-24T02:57:13","modified_gmt":"2024-02-24T02:57:13","slug":"reddit-dice-que-ha-ganado-203-millones-de-dolares-hasta-ahora-con-la-licencia-de-sus-datos","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/reddit-dice-que-ha-ganado-203-millones-de-dolares-hasta-ahora-con-la-licencia-de-sus-datos\/","title":{"rendered":"Reddit dice que ha ganado 203 millones de d\u00f3lares hasta ahora con la licencia de sus datos"},"content":{"rendered":"
\n<\/p>\n
Las perspectivas de Reddit a medida que avanza hacia una cotizaci\u00f3n en el mercado de valores tienen mucho m\u00e1s que ver con las relaciones con proveedores de inteligencia artificial como OpenAI de lo que cabr\u00eda esperar.<\/p>\n
En su prospecto de IPO presentado hoy ante la Comisi\u00f3n de Bolsa y Valores de EE. UU., Reddit enfatiz\u00f3 repetidamente cu\u00e1nto cree que puede ganar (y ha ganado) de los acuerdos de licencia de datos con las empresas que entrenan modelos de IA en sus m\u00e1s de mil millones de puestos y m\u00e1s de 16. mil millones de comentarios.<\/p>\n
\u00abEn enero de 2024, celebramos ciertos acuerdos de licencia de datos con un valor de contrato agregado de 203,0 millones de d\u00f3lares y plazos que oscilan entre dos y tres a\u00f1os\u00bb, se lee en el prospecto. \u00abEsperamos que se reconozca un m\u00ednimo de 66,4 millones de d\u00f3lares de ingresos durante el a\u00f1o que finaliza el 31 de diciembre de 2024 y el resto a partir de entonces\u00bb.<\/p>\n
Ahora, es un misterio qu\u00e9 proveedores de IA est\u00e1n otorgando licencias de datos de Reddit hasta ahora. A principios de esta semana, Bloomberg y Reuters informaron que una \u201cgran empresa de inteligencia artificial an\u00f3nima\u201d (posiblemente Google) hab\u00eda celebrado un acuerdo de licencia por valor de unos 60 millones de d\u00f3lares sobre una base anualizada. Pero OpenAI tampoco ser\u00eda un cliente sorprendente, especialmente considerando que el CEO de OpenAI, Sam Altman, tiene una participaci\u00f3n del 8,7% en Reddit (lo que lo convierte en el tercer mayor accionista) y alguna vez fue miembro de la junta directiva de la compa\u00f1\u00eda.<\/p>\n
\u00bfPor qu\u00e9 son valiosos los datos de Reddit? Como explica Reddit, los modelos de IA \u201caprenden\u201d de ejemplos para elaborar ensayos, c\u00f3digos, correos electr\u00f3nicos, art\u00edculos y m\u00e1s, y proveedores como OpenAI buscan en la web millones o miles de millones de estos ejemplos para agregarlos a sus conjuntos de capacitaci\u00f3n. Algunos ejemplos son de dominio p\u00fablico. Otros no lo son o, en el caso del contenido de Reddit, est\u00e1n sujetos a licencias restrictivas que requieren citaci\u00f3n o formas espec\u00edficas de compensaci\u00f3n.<\/p>\n
Reddit anteriormente no imped\u00eda el acceso a sus datos con fines de entrenamiento de IA. Pero el a\u00f1o pasado cambi\u00f3 de rumbo, argumentando que sus datos no deber\u00edan ser (en palabras del CEO Steve Huffman) \u201c[given] a algunas de las empresas m\u00e1s grandes del mundo de forma gratuita\u201d.<\/p>\n
\u201c[Our] Las API de datos pueden proporcionar acceso en tiempo real a temas din\u00e1micos y en evoluci\u00f3n, como deportes, pel\u00edculas, noticias, moda y las \u00faltimas tendencias\u201d, contin\u00faa el prospecto. \u201cCreemos que el enorme corpus de datos y conocimientos conversacionales de Reddit seguir\u00e1 desempe\u00f1ando un papel en la formaci\u00f3n y mejora de grandes modelos ling\u00fc\u00edsticos. A medida que nuestro contenido se actualiza y crece diariamente, esperamos que los modelos quieran reflejar estas nuevas ideas y actualizar su capacitaci\u00f3n utilizando datos de Reddit\u201d.<\/p>\n
Los productores de contenido, desde bibliotecas de medios de archivo hasta editores de noticias, recurren cada vez m\u00e1s a acuerdos de licencia de datos con proveedores de inteligencia artificial a medida que chatbots como ChatGPT de OpenAI y Gemini de Google amenazan con minar el tr\u00e1fico. Un modelo reciente de The Atlantic descubri\u00f3 que, si un motor de b\u00fasqueda como Google integrara la IA en la b\u00fasqueda, responder\u00eda a la consulta de un usuario el 75% de las veces sin necesidad de hacer clic en su sitio web.<\/p>\n
Los proveedores, a su vez, se han visto incitados a buscar acuerdos de licencia mientras enfrentan una avalancha de demandas que alegan que no tienen justificaci\u00f3n legal para entrenar sus modelos con datos sin permiso ni pago. Recientemente, The New York Times acus\u00f3 a OpenAI de crear efectivamente competidores en los editores de noticias utilizando sus trabajos, perjudicando su negocio.<\/p>\n
OpenAI, por ejemplo, tiene acuerdos con la galer\u00eda de im\u00e1genes Shutterstock, as\u00ed como con editores como Axel Springer, propietario de Politico y Business Insider. Sin embargo, se informa que las licencias son bastante peque\u00f1as: alcanzan un m\u00e1ximo de 5 millones de d\u00f3lares al a\u00f1o.<\/p>\n<\/p><\/div>\n