\n<\/aside>\n<\/p>\n
La semana pasada se filtr\u00f3 que Google hab\u00eda acordado licenciar el corpus masivo de miles de millones de publicaciones y comentarios de Reddit para ayudar a entrenar sus grandes modelos de lenguaje. Ahora, en una presentaci\u00f3n reciente ante la Comisi\u00f3n de Bolsa y Valores, el popular foro en l\u00ednea ha revelado que recaudar\u00e1 203 millones de d\u00f3lares de ese y otros contratos de licencia de datos de IA no especificados durante los pr\u00f3ximos tres a\u00f1os.<\/p>\n
El formulario S-1 de Reddit, publicado por la SEC el jueves por la noche antes de la oferta p\u00fablica inicial de acciones planificada del sitio, dice que la compa\u00f1\u00eda espera que 66,4 millones de d\u00f3lares de ese valor derivado de datos de las empresas LLM lleguen durante el a\u00f1o calendario 2024. Bloomberg inform\u00f3 anteriormente que el acuerdo con Google tiene un valor estimado de 60 millones de d\u00f3lares al a\u00f1o, lo que sugiere que el acuerdo de tres a\u00f1os representa la gran mayor\u00eda de sus ingresos por licencias de IA hasta el momento.<\/p>\n
Google y otras empresas de inteligencia artificial que otorgan licencias para los datos de Reddit recibir\u00e1n \u00abacceso continuo a [Reddit’s] API de datos, as\u00ed como transferencias trimestrales de datos de Reddit durante la vigencia del acuerdo\u00bb, seg\u00fan el documento. Ese acceso constante y en tiempo real es particularmente valioso, escribe el sitio en el documento, porque \u00ablos datos de Reddit crecen y se regeneran constantemente a medida que Los usuarios vienen e interact\u00faan con sus comunidades y entre s\u00ed\u00bb.<\/p>\n
\u201c\u00bfPor qu\u00e9 pagar por la vaca\u2026?\u201d<\/h2>\n Si bien Reddit considera que la concesi\u00f3n de licencias de datos a empresas de inteligencia artificial es una parte importante de su futuro financiero, su presentaci\u00f3n tambi\u00e9n se\u00f1ala que el uso gratuito de sus datos ya ha sido \u00abuna parte fundamental de cu\u00e1ntos de los principales modelos de lenguajes grandes han sido entrenados\u00bb. La presentaci\u00f3n parece casi amarga al se\u00f1alar que \u00abalgunas empresas han construido modelos de lenguaje comercial muy grandes utilizando datos de Reddit sin celebrar un acuerdo de licencia con nosotros\u00bb.<\/p>\n\n Anuncio <\/span> <\/p>\n<\/aside>\nEse reconocimiento resalta el panorama legal a\u00fan turbio sobre la tendencia de las empresas de inteligencia artificial a extraer grandes extensiones de la web p\u00fablica con fines de capacitaci\u00f3n, una pr\u00e1ctica que esas empresas defienden como uso leg\u00edtimo. Y Reddit parece muy consciente de que los modelos de IA pueden seguir absorbiendo sus publicaciones y comentarios de forma gratuita, incluso cuando intenta vender esos datos a otros.<\/p>\n
\u00abAlgunas empresas pueden negarse a otorgar licencias sobre los datos de Reddit y utilizarlos sin licencia dada su naturaleza abierta, incluso si violan los t\u00e9rminos legales que rigen nuestros servicios\u00bb, escribe la empresa. \u00abSi bien planeamos aplicar medidas en\u00e9rgicas contra dichas entidades, tales actividades de aplicaci\u00f3n de la ley podr\u00edan tardar a\u00f1os en resolverse, generar gastos sustanciales y desviar la atenci\u00f3n de la administraci\u00f3n y otros recursos, y es posible que, en \u00faltima instancia, no tengamos \u00e9xito\u00bb.<\/p>\n
Sin embargo, la mera existencia de acuerdos de licencia de datos de IA como el de Reddit puede influir en c\u00f3mo se desarrollan las batallas legales sobre este tipo de extracci\u00f3n de datos. Como se\u00f1alaron Timothy Lee y James Grimmelmann de Ars en un an\u00e1lisis legal reciente, el establecimiento de un mercado de licencias establecido puede tener un gran impacto en si los tribunales consideran que un uso novedoso de datos digitalizados es \u00abuso justo\u00bb seg\u00fan la ley de derechos de autor.<\/p>\n
\u00abCuanto m\u00e1s [AI data licensing] \u00abCuanto m\u00e1s se firmen acuerdos como este en los pr\u00f3ximos meses, m\u00e1s f\u00e1cil ser\u00e1 para los demandantes argumentar que el an\u00e1lisis del ‘efecto en el mercado’ del an\u00e1lisis de uso leg\u00edtimo debe tener en cuenta este mercado de licencias\u00bb, escribieron Lee y Grimmelmann.<\/p>\n
Y aunque Reddit ve los LLM como una nueva oportunidad de ingresos, el sitio tambi\u00e9n ve su popularidad como una amenaza potencial. La presentaci\u00f3n S-1 se\u00f1ala que \u00abalgunos usuarios tambi\u00e9n est\u00e1n recurriendo a LLM como ChatGPT, Gemini y Anthropic\u00bb para buscar informaci\u00f3n, coloc\u00e1ndolos en la misma categor\u00eda de competencia de Reddit que \u00abGoogle, Amazon, YouTube, Wikipedia, X y otros sitios de noticias.\u00bb<\/p>\n
Despu\u00e9s de presentar su oferta p\u00fablica inicial a fines de 2021, los informes sugieren que Reddit tiene como objetivo llegar oficialmente al mercado de valores el pr\u00f3ximo mes. La compa\u00f1\u00eda ofrecer\u00e1 a los usuarios y moderadores con suficiente karma y\/o actividad en el sitio la oportunidad de participar en esa IPO a trav\u00e9s de un programa de acciones dirigidas.<\/p>\n
Advance Publications, propietaria de Cond\u00e9 Nast, matriz de Ars Technica, es el mayor accionista de Reddit.<\/em><\/p>\n<\/p><\/div>\n \nSource link-49<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"Agrandar \/ \u00abReddit Gold\u00bb adquiere un significado completamente nuevo cuando se trata de datos de entrenamiento de IA. La semana pasada se filtr\u00f3 que Google hab\u00eda acordado licenciar el corpus…<\/p>\n","protected":false},"author":1,"featured_media":1023569,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[133,194,6899,11389,14614,5888,86655,1576,654,13887,10659,6159,15997],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1023568"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1023568"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1023568\/revisions"}],"predecessor-version":[{"id":1023570,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1023568\/revisions\/1023570"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1023569"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1023568"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1023568"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1023568"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}