{"id":987789,"date":"2024-01-30T22:33:14","date_gmt":"2024-01-30T22:33:14","guid":{"rendered":"https:\/\/magazineoffice.com\/los-investigadores-de-ia-descubren-que-los-modelos-de-ia-aprenden-sus-tecnicas-de-seguridad-se-resisten-activamente-al-entrenamiento-y-les-dicen-te-odio\/"},"modified":"2024-01-30T22:33:16","modified_gmt":"2024-01-30T22:33:16","slug":"los-investigadores-de-ia-descubren-que-los-modelos-de-ia-aprenden-sus-tecnicas-de-seguridad-se-resisten-activamente-al-entrenamiento-y-les-dicen-te-odio","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/los-investigadores-de-ia-descubren-que-los-modelos-de-ia-aprenden-sus-tecnicas-de-seguridad-se-resisten-activamente-al-entrenamiento-y-les-dicen-te-odio\/","title":{"rendered":"Los investigadores de IA descubren que los modelos de IA aprenden sus t\u00e9cnicas de seguridad, se resisten activamente al entrenamiento y les dicen \u00abte odio\u00bb"},"content":{"rendered":"


\n<\/p>\n

\n

La IA es obviamente el tema del momento y, aunque parece que hemos superado la dicotom\u00eda Terminator\/salvador, una fuente importante de preocupaci\u00f3n sigue siendo la seguridad de esta tecnolog\u00eda. No se trata s\u00f3lo del escenario del levantamiento de las m\u00e1quinas, sino de c\u00f3mo los malos actores usar\u00e1n la IA, las implicaciones de seguridad de automatizar tanto flujo de informaci\u00f3n, la capacidad de la IA para obtener y recopilar informaci\u00f3n instant\u00e1neamente sobre cualquier tema determinado (como la construcci\u00f3n de una bomba) y, finalmente, su capacidad de enga\u00f1arnos y ayudarnos. <\/p>\n

Un estudio nuevo y \u00ableg\u00edtimamente aterrador\u00bb ha descubierto que los modelos de IA se comportan de una manera no ideal. Los investigadores descubrieron que las t\u00e9cnicas de capacitaci\u00f3n en seguridad est\u00e1ndar de la industria no frenaron el mal comportamiento de los modelos de lenguaje, que fueron entrenados para ser secretamente maliciosos, y en un caso incluso tuvieron peores resultados: la IA aprendi\u00f3 a reconocer qu\u00e9 desencadenantes estaba buscando el software de seguridad. y ‘ocultar’ su comportamiento.<\/p>\n