\n<\/aside>\n<\/p>\n
El viernes, un equipo de investigadores de la Universidad de Chicago public\u00f3 un art\u00edculo de investigaci\u00f3n que describe \u00abNightshade\u00bb, una t\u00e9cnica de envenenamiento de datos destinada a interrumpir el proceso de entrenamiento de modelos de IA, informan MIT Technology Review y VentureBeat. El objetivo es ayudar a los artistas visuales y editores a proteger su trabajo para que no se utilice para entrenar modelos generativos de s\u00edntesis de im\u00e1genes de IA, como Midjourney, DALL-E 3 y Stable Diffusion.<\/p>\n
La herramienta de c\u00f3digo abierto \u00abp\u00edldora venenosa\u00bb (como la llama el departamento de prensa de la Universidad de Chicago) altera im\u00e1genes de maneras invisibles para el ojo humano que pueden corromper el proceso de entrenamiento de un modelo de IA. Muchos modelos de s\u00edntesis de im\u00e1genes, con notables excepciones de los de Adobe y Getty Images, utilizan en gran medida conjuntos de datos de im\u00e1genes extra\u00eddas de la web sin el permiso del artista, lo que incluye material protegido por derechos de autor. (OpenAI obtiene la licencia de algunas de sus im\u00e1genes de entrenamiento DALL-E de Shutterstock).<\/p>\n
La dependencia de los investigadores de IA de datos obtenidos de la web, algo que muchos consideran \u00e9tico, tambi\u00e9n ha sido clave para la reciente explosi\u00f3n de la capacidad generativa de la IA. Se necesit\u00f3 toda una Internet de im\u00e1genes con anotaciones (a trav\u00e9s de subt\u00edtulos, texto alternativo y metadatos) creadas por millones de personas para crear un conjunto de datos con suficiente variedad para crear Difusi\u00f3n Estable, por ejemplo. No ser\u00eda pr\u00e1ctico contratar personas para anotar cientos de millones de im\u00e1genes desde el punto de vista tanto del costo como del tiempo. Aquellos con acceso a grandes bases de datos de im\u00e1genes existentes (como Getty y Shutterstock) tienen ventaja al utilizar datos de capacitaci\u00f3n con licencia.<\/p>\n\nAgrandar
\/<\/span> Un ejemplo de generaciones de im\u00e1genes de datos \u00abenvenenadas\u00bb en Difusi\u00f3n Estable, proporcionado por investigadores de la Universidad de Chicago.<\/div>\nShan, et al.<\/p>\n<\/figcaption><\/figure>\n
En ese sentido, algunas instituciones de investigaci\u00f3n, como la Biblioteca Berkeley de la Universidad de California, han abogado por preservar la extracci\u00f3n de datos como uso leg\u00edtimo en el entrenamiento de IA con fines de investigaci\u00f3n y educaci\u00f3n. Los tribunales estadounidenses a\u00fan no se han pronunciado definitivamente sobre esta pr\u00e1ctica y los reguladores est\u00e1n buscando comentarios sobre una posible legislaci\u00f3n que podr\u00eda afectarla de una forma u otra. Pero tal como lo ve el equipo de Nightshade, el uso para investigaci\u00f3n y el uso comercial son dos cosas completamente diferentes, y esperan que su tecnolog\u00eda pueda obligar a las empresas de capacitaci\u00f3n en IA a licenciar conjuntos de datos de im\u00e1genes, respetar las restricciones de los rastreadores y cumplir con las solicitudes de exclusi\u00f3n voluntaria.<\/p>\n\n Anuncio <\/span> <\/p>\n<\/aside>\n\u00abEl objetivo de esta herramienta es equilibrar el campo de juego entre los formadores modelo y los creadores de contenido\u00bb, dijo en un comunicado el coautor y profesor de la Universidad de Chicago, Ben Y. Zhao. \u00abEn este momento, los entrenadores modelo tienen el 100 por ciento del poder. Las \u00fanicas herramientas que pueden ralentizar a los rastreadores son las listas de exclusi\u00f3n voluntaria y las directivas de no rastreo, todas las cuales son opcionales y dependen de la conciencia de las empresas de IA y, por supuesto, \u00abNada de esto es verificable o ejecutable y las empresas pueden decir una cosa y hacer otra con impunidad. Esta herramienta ser\u00eda la primera que permitir\u00eda a los propietarios de contenido luchar de manera significativa contra la capacitaci\u00f3n de modelos no autorizados\u00bb.<\/p>\n
Shawn Shan, Wenxin Ding, Josephine Passananti, Haitao Zheng y Zhao desarrollaron Nightshade como parte del Departamento de Ciencias de la Computaci\u00f3n de la Universidad de Chicago. La nueva herramienta se basa en el trabajo anterior del equipo con Glaze, otra herramienta dise\u00f1ada para alterar obras de arte digitales de una manera que confunde a la IA. Mientras que Glaze est\u00e1 orientado a ofuscar el estilo de la obra de arte, Nightshade va un paso m\u00e1s all\u00e1 al corromper los datos de entrenamiento. B\u00e1sicamente, enga\u00f1a a los modelos de IA para que identifiquen err\u00f3neamente objetos dentro de las im\u00e1genes.<\/p>\n
Por ejemplo, en las pruebas, los investigadores utilizaron la herramienta para alterar im\u00e1genes de perros de una manera que llev\u00f3 a un modelo de IA a generar un gato cuando se le ped\u00eda que produjera un perro. Para hacer esto, Nightshade toma una imagen del concepto previsto (por ejemplo, una imagen real de un \u00abperro\u00bb) y modifica sutilmente la imagen para que conserve su apariencia original pero est\u00e9 influenciada en el espacio latente (codificado) por un concepto completamente diferente. (por ejemplo, \u00abgato\u00bb). De esta manera, ante una verificaci\u00f3n humana o simple automatizada, la imagen y el texto parecen alineados. Pero en el espacio latente del modelo, la imagen tiene caracter\u00edsticas tanto del concepto original como del concepto de veneno, lo que desv\u00eda al modelo cuando se entrena con los datos.<\/p>\n<\/p><\/div>\n
\nSource link-49<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"El viernes, un equipo de investigadores de la Universidad de Chicago public\u00f3 un art\u00edculo de investigaci\u00f3n que describe \u00abNightshade\u00bb, una t\u00e9cnica de envenenamiento de datos destinada a interrumpir el proceso…<\/p>\n","protected":false},"author":1,"featured_media":858399,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[3813,2515,20583,133,9439,29206,6514,62129,9699],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/858398"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=858398"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/858398\/revisions"}],"predecessor-version":[{"id":858400,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/858398\/revisions\/858400"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/858399"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=858398"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=858398"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=858398"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}