{"id":935336,"date":"2023-12-20T19:37:53","date_gmt":"2023-12-20T19:37:53","guid":{"rendered":"https:\/\/magazineoffice.com\/los-investigadores-encontraron-material-de-abuso-infantil-en-el-conjunto-de-datos-de-generacion-de-imagenes-de-ia-mas-grande\/"},"modified":"2023-12-20T19:37:56","modified_gmt":"2023-12-20T19:37:56","slug":"los-investigadores-encontraron-material-de-abuso-infantil-en-el-conjunto-de-datos-de-generacion-de-imagenes-de-ia-mas-grande","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/los-investigadores-encontraron-material-de-abuso-infantil-en-el-conjunto-de-datos-de-generacion-de-imagenes-de-ia-mas-grande\/","title":{"rendered":"Los investigadores encontraron material de abuso infantil en el conjunto de datos de generaci\u00f3n de im\u00e1genes de IA m\u00e1s grande"},"content":{"rendered":"


\n<\/p>\n

\n

Investigadores del Observatorio de Internet de Stanford dicen que un conjunto de datos utilizado para entrenar herramientas de generaci\u00f3n de im\u00e1genes de IA contiene al menos 1.008 casos validados de material de abuso sexual infantil. Los investigadores de Stanford se\u00f1alan que la presencia de CSAM en el conjunto de datos podr\u00eda permitir que los modelos de IA entrenados con los datos generen instancias nuevas e incluso realistas de CSAM.<\/p>\n

LAION, la organizaci\u00f3n sin fines de lucro que cre\u00f3 el conjunto de datos, dijo <\/em> que \u00abtiene una pol\u00edtica de tolerancia cero para el contenido ilegal y, con mucha precauci\u00f3n, estamos eliminando temporalmente los conjuntos de datos de LAION para garantizar que est\u00e9n seguros antes de volver a publicarlos\u00bb. La organizaci\u00f3n a\u00f1adi\u00f3 que, antes de publicar sus conjuntos de datos, cre\u00f3 filtros para detectar y eliminar contenido ilegal de ellos. Sin embargo, 404 <\/em>se\u00f1ala que los l\u00edderes de LAION son conscientes desde al menos 2021 de que exist\u00eda la posibilidad de que sus sistemas detectaran CSAM mientras aspiraban miles de millones de im\u00e1genes de Internet.<\/p>\n

Seg\u00fan informes anteriores, el conjunto de datos LAION-5B en cuesti\u00f3n contiene \u00abmillones de im\u00e1genes de pornograf\u00eda, violencia, desnudez infantil, memes racistas, s\u00edmbolos de odio, arte protegido por derechos de autor y obras extra\u00eddas de sitios web de empresas privadas\u00bb. En total, incluye m\u00e1s de 5 mil millones de im\u00e1genes y leyendas descriptivas asociadas. El fundador de LAION, Christoph Schuhmann, dijo a principios de este a\u00f1o que, si bien no ten\u00eda conocimiento de ning\u00fan CSAM en el conjunto de datos, no los hab\u00eda examinado en profundidad.<\/p>\n

Es ilegal que la mayor\u00eda de las instituciones en los EE. UU. vean CSAM con fines de verificaci\u00f3n. Como tal, los investigadores de Stanford utilizaron varias t\u00e9cnicas para buscar CSAM potencial. Seg\u00fan , emplearon \u00abdetecci\u00f3n basada en hash perceptivo, detecci\u00f3n basada en hash criptogr\u00e1fico y an\u00e1lisis de vecinos m\u00e1s cercanos aprovechando las incrustaciones de im\u00e1genes en el propio conjunto de datos\u00bb. Encontraron 3.226 entradas que conten\u00edan presuntos CSAM. Muchas de esas im\u00e1genes fueron confirmadas como CSAM por terceros como PhotoDNA y el Centro Canadiense para la Protecci\u00f3n Infantil.<\/p>\n

El fundador de Stability AI, Emad Mostaque, se entren\u00f3 utilizando un subconjunto de datos de LAION-5B. El modelo de texto a imagen Imagen de Google era un subconjunto de LAION-5B, as\u00ed como conjuntos de datos internos. Un portavoz de Stability AI dijo <\/em> <\/em>que proh\u00edbe el uso de sus sistemas de prueba de im\u00e1genes para fines ilegales, como crear o editar CSAM. \u00abEste informe se centra en el conjunto de datos LAION-5B en su conjunto\u00bb, dijo el portavoz. \u201cLos modelos de estabilidad de IA se entrenaron en un subconjunto filtrado de ese conjunto de datos. Adem\u00e1s, perfeccionamos estos modelos para mitigar comportamientos residuales\u201d.<\/p>\n

Stable Diffusion 2 (una versi\u00f3n m\u00e1s reciente de la herramienta de generaci\u00f3n de im\u00e1genes de Stability AI) se entren\u00f3 con datos que filtraron sustancialmente los materiales \u00abinseguros\u00bb del conjunto de datos. Eso, Bloomberg <\/em>notas, hace que sea m\u00e1s dif\u00edcil para los usuarios generar im\u00e1genes expl\u00edcitas. Sin embargo, se afirma que Stable Diffusion 1.5, que todav\u00eda est\u00e1 disponible en Internet, no tiene las mismas protecciones. \u00abLos modelos basados \u200b\u200ben Stable Diffusion 1.5 a los que no se les han aplicado medidas de seguridad deben quedar obsoletos y cesar su distribuci\u00f3n cuando sea posible\u00bb, escribieron los autores del art\u00edculo de Stanford.<\/p>\n<\/div>\n


\n
Source link-47<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Investigadores del Observatorio de Internet de Stanford dicen que un conjunto de datos utilizado para entrenar herramientas de generaci\u00f3n de im\u00e1genes de IA contiene al menos 1.008 casos validados de…<\/p>\n","protected":false},"author":1,"featured_media":935337,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21981],"tags":[4560,10114,121,25413,876,2805,666,3781,6514,8,84,7093],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/935336"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=935336"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/935336\/revisions"}],"predecessor-version":[{"id":935338,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/935336\/revisions\/935338"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/935337"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=935336"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=935336"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=935336"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}