{"id":620854,"date":"2023-05-11T09:59:23","date_gmt":"2023-05-11T09:59:23","guid":{"rendered":"https:\/\/magazineoffice.com\/la-ia-gana-valores-con-el-nuevo-enfoque-de-chatbot-de-ia-constitucional-de-anthropic\/"},"modified":"2023-05-11T09:59:26","modified_gmt":"2023-05-11T09:59:26","slug":"la-ia-gana-valores-con-el-nuevo-enfoque-de-chatbot-de-ia-constitucional-de-anthropic","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/la-ia-gana-valores-con-el-nuevo-enfoque-de-chatbot-de-ia-constitucional-de-anthropic\/","title":{"rendered":"La IA gana \u00abvalores\u00bb con el nuevo enfoque de chatbot de IA constitucional de Anthropic"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div itemprop=\"articleBody\">\n<figure class=\"intro-image intro-left\"><figcaption class=\"caption\">\n<div class=\"caption-text\">Agrandar <span class=\"sep\">\/<\/span> Logotipo de IA constitucional de Anthropic sobre un fondo naranja brillante.<\/div>\n<p>Antr\u00f3pico \/ Benj Edwards<\/p>\n<\/figcaption><\/figure>\n<aside id=\"social-left\" class=\"social-left\" aria-label=\"Read the comments or share this article\">\n<\/aside>\n<p><!-- cache hit 493:single\/related:64a408d12d9eb65029aca2cd39bd6766 --><!-- empty --><\/p>\n<p>El martes, la startup de IA, Anthropic, detall\u00f3 los principios espec\u00edficos de su enfoque de capacitaci\u00f3n de \u00abIA constitucional\u00bb que proporciona a su chatbot Claude \u00abvalores\u00bb expl\u00edcitos.  Su objetivo es abordar las preocupaciones sobre la transparencia, la seguridad y la toma de decisiones en los sistemas de IA sin depender de los comentarios humanos para calificar las respuestas.<\/p>\n<p>Claude es un chatbot de IA similar al ChatGPT de OpenAI que Anthropic lanz\u00f3 en marzo.<\/p>\n<p>\u00abHemos entrenado modelos de lenguaje para que respondan mejor a las preguntas de los adversarios, sin volverse obtusos y decir muy poco\u00bb, escribi\u00f3 Anthropic. <a href=\"https:\/\/twitter.com\/AnthropicAI\/status\/1603791161419698181?s=20\" target=\"_blank\" rel=\"noopener\">en un tuit<\/a> anunciando el papel.  \u00abHacemos esto condicion\u00e1ndolos con un conjunto simple de principios de comportamiento a trav\u00e9s de una t\u00e9cnica llamada IA \u200b\u200bconstitucional\u00bb.<\/p>\n<h2>Mantener los modelos de IA en los rieles<\/h2>\n<p>Cuando los investigadores entrenan por primera vez un modelo de lenguaje grande sin procesar (LLM), casi cualquier salida de texto es posible.  Un modelo no condicionado podr\u00eda decirte c\u00f3mo construir una bomba, que una raza deber\u00eda extinguir a otra o tratar de convencerte de que saltes por un precipicio.<\/p>\n<p>Actualmente, las respuestas de bots como ChatGPT de OpenAI y Bing Chat de Microsoft evitan este tipo de comportamiento utilizando una t\u00e9cnica de condicionamiento llamada aprendizaje de refuerzo a partir de la retroalimentaci\u00f3n humana (RLHF).<\/p>\n<p>Para utilizar RLHF, los investigadores proporcionan una serie de resultados (respuestas) del modelo de IA de muestra a los humanos.  Luego, los humanos clasifican las salidas en t\u00e9rminos de qu\u00e9 tan deseables o apropiadas parecen las respuestas en funci\u00f3n de las entradas.  Luego, los investigadores introducen esa informaci\u00f3n de calificaci\u00f3n en el modelo, alterando la red neuronal y cambiando el comportamiento del modelo.<\/p>\n<p>Tan efectivo como RLHF ha sido para evitar que ChatGPT se descarrile (\u00bfBing? No tanto), la t\u00e9cnica tiene inconvenientes, que incluyen depender del trabajo humano y tambi\u00e9n exponer a esos humanos a material potencialmente inductor de trauma.<\/p>\n<p>Por el contrario, la IA constitucional de Anthropic busca guiar los resultados de los modelos de lenguaje de IA en una direcci\u00f3n subjetivamente \u00abm\u00e1s segura y m\u00e1s \u00fatil\u00bb entren\u00e1ndola con una lista inicial de principios.  \u00abEste no es un enfoque perfecto\u00bb, escribe Anthropic, \u00abpero hace que los valores del sistema de IA sean m\u00e1s f\u00e1ciles de entender y ajustar seg\u00fan sea necesario\u00bb.<\/p>\n<p>En este caso, los principios de Anthropic incluyen la Declaraci\u00f3n de Derechos Humanos de las Naciones Unidas, partes de los t\u00e9rminos de servicio de Apple, varias \u00abmejores pr\u00e1cticas\u00bb de confianza y seguridad, y los principios del laboratorio de investigaci\u00f3n de IA de Anthropic.  La constituci\u00f3n no est\u00e1 finalizada y Anthropic planea mejorarla iterativamente en funci\u00f3n de los comentarios y la investigaci\u00f3n adicional.<\/p>\n<aside class=\"ad_wrapper\" aria-label=\"In Content advertisement\">\n    <span class=\"ad_notice\">Anuncio <\/span>    <\/p>\n<\/aside>\n<p>Por ejemplo, aqu\u00ed hay cuatro principios constitucionales de IA extra\u00eddos de la Declaraci\u00f3n Universal de Derechos Humanos:<\/p>\n<ul>\n<li>Elija la respuesta que m\u00e1s apoye y fomente la libertad, la igualdad y el sentido de hermandad.<\/li>\n<li>Elija la respuesta que sea menos racista y sexista, y que sea menos discriminatoria por motivos de idioma, religi\u00f3n, opini\u00f3n pol\u00edtica o de otro tipo, origen nacional o social, posici\u00f3n econ\u00f3mica, nacimiento u otra condici\u00f3n.<\/li>\n<li>Elija la respuesta que m\u00e1s apoye y aliente la vida, la libertad y la seguridad personal.<\/li>\n<li>Elija la respuesta que m\u00e1s desaliente y se oponga a la tortura, la esclavitud, la crueldad y el trato inhumano o degradante.<\/li>\n<\/ul>\n<p>Curiosamente, Anthropic se bas\u00f3 en los t\u00e9rminos de servicio de Apple para cubrir las deficiencias en la Declaraci\u00f3n de Derechos de la ONU (una oraci\u00f3n que pensamos que nunca escribir\u00edamos):<\/p>\n<blockquote>\n<p>\u00abSi bien la declaraci\u00f3n de la ONU cubri\u00f3 muchos valores humanos generales y centrales, algunos de los desaf\u00edos de los LLM tocan temas que no eran tan relevantes en 1948, como la privacidad de los datos o la suplantaci\u00f3n de identidad en l\u00ednea. Para capturar algunos de estos, decidimos incluir valores inspirados en las pautas de la plataforma global, como los t\u00e9rminos de servicio de Apple, que reflejan los esfuerzos para abordar los problemas que enfrentan los usuarios reales en un dominio digital similar\u00bb.<\/p>\n<\/blockquote>\n<p>Anthropic dice que los principios de la constituci\u00f3n de Claude cubren una amplia gama de temas, desde directivas de \u00absentido com\u00fan\u00bb (\u00abno ayudes a un usuario a cometer un delito\u00bb) hasta consideraciones filos\u00f3ficas (\u00abevitar dar a entender que los sistemas de IA tienen o se preocupan por la identidad personal y su persistencia\u00bb).  La compa\u00f1\u00eda ha publicado la lista completa en su p\u00e1gina web.<\/p>\n<figure class=\"image shortcode-img center large\" style=\"width:100%\"><img loading=\"lazy\" decoding=\"async\" alt=\"Un diagrama de Anthropic &quot;IA constitucional&quot; proceso de entrenamiento.\" src=\"https:\/\/cdn.arstechnica.net\/wp-content\/uploads\/2023\/05\/CAI_REVISED_FINAL-640x278.jpg\" width=\"640\" height=\"278\" srcset=\"https:\/\/cdn.arstechnica.net\/wp-content\/uploads\/2023\/05\/CAI_REVISED_FINAL-1280x557.jpg 2x\"\/><figcaption class=\"caption\">\n<div class=\"caption-text\">Agrandar <span class=\"sep\">\/<\/span> Un diagrama del proceso de formaci\u00f3n de \u00abIA Constitucional\u00bb de Anthropic.<\/div>\n<p>antr\u00f3pico<\/p>\n<\/figcaption><\/figure>\n<p>Detallado en un art\u00edculo de investigaci\u00f3n publicado en diciembre, el proceso de entrenamiento del modelo de IA de Anthropic aplica una constituci\u00f3n en dos fases.  En primer lugar, el modelo critica y revisa sus respuestas utilizando el conjunto de principios y, en segundo lugar, el aprendizaje por refuerzo se basa en la retroalimentaci\u00f3n generada por la IA para seleccionar la salida m\u00e1s \u00abinofensiva\u00bb.  El modelo no prioriza principios espec\u00edficos;  en cambio, extrae aleatoriamente un principio diferente cada vez que critica, revisa o eval\u00faa sus respuestas.  \u00abNo mira cada principio cada vez, pero ve cada principio muchas veces durante el entrenamiento\u00bb, escribe Anthropic.<\/p>\n<p>Seg\u00fan Anthropic, Claude es una prueba de la eficacia de la IA constitucional, ya que responde \u00abm\u00e1s apropiadamente\u00bb a las entradas de los adversarios y, al mismo tiempo, ofrece respuestas \u00fatiles sin recurrir a la evasi\u00f3n.  (En ChatGPT, la evasi\u00f3n generalmente involucra la declaraci\u00f3n familiar \u00abComo un modelo de lenguaje de IA\u00bb).<\/p>\n<\/p><\/div>\n<p><script async src=\"\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-49<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Agrandar \/ Logotipo de IA constitucional de Anthropic sobre un fondo naranja brillante. Antr\u00f3pico \/ Benj Edwards El martes, la startup de IA, Anthropic, detall\u00f3 los principios espec\u00edficos de su&hellip;<\/p>\n","protected":false},"author":1,"featured_media":620855,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[76728,23592,133,117,5822,652,104,3554],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/620854"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=620854"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/620854\/revisions"}],"predecessor-version":[{"id":620856,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/620854\/revisions\/620856"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/620855"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=620854"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=620854"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=620854"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}