{"id":1036223,"date":"2024-03-04T17:32:33","date_gmt":"2024-03-04T17:32:33","guid":{"rendered":"https:\/\/magazineoffice.com\/anthropic-afirma-que-sus-nuevos-modelos-superan-al-gpt-4\/"},"modified":"2024-03-04T17:32:36","modified_gmt":"2024-03-04T17:32:36","slug":"anthropic-afirma-que-sus-nuevos-modelos-superan-al-gpt-4","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/anthropic-afirma-que-sus-nuevos-modelos-superan-al-gpt-4\/","title":{"rendered":"Anthropic afirma que sus nuevos modelos superan al GPT-4"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p id=\"speakable-summary\">La startup de IA Anthropic, respaldada por cientos de millones en capital de riesgo (y quiz\u00e1s pronto cientos de millones m\u00e1s), anunci\u00f3 hoy la \u00faltima versi\u00f3n de su tecnolog\u00eda GenAI, Claude.  Y la compa\u00f1\u00eda afirma que rivaliza con el GPT-4 de OpenAI en t\u00e9rminos de rendimiento.<\/p>\n<p>Claude 3, como se llama el nuevo GenAI de Anthropic, es una familia de modelos: Claude 3 Haiku, Claude 3 Sonnet y Claude 3 Opus, siendo Opus el m\u00e1s poderoso.  Todos muestran \u00abmayores capacidades\u00bb en an\u00e1lisis y pron\u00f3stico, afirma Anthropic, as\u00ed como un rendimiento mejorado en puntos de referencia espec\u00edficos en comparaci\u00f3n con modelos como GPT-4 (pero no GPT-4 Turbo) y Gemini 1.0 Ultra de Google (pero no Gemini 1.5 Pro).<\/p>\n<p>En particular, Claude 3 es el primer GenAI multimodal de Anthropic, lo que significa que puede analizar tanto texto como im\u00e1genes, similar a algunas versiones de GPT-4 y Gemini.  Claude 3 puede procesar fotograf\u00edas, cuadros, gr\u00e1ficos y diagramas t\u00e9cnicos, extrayendo archivos PDF, presentaciones de diapositivas y otros tipos de documentos.<\/p>\n<p>En un paso mejor que algunos rivales de GenAI, Claude 3 puede analizar m\u00faltiples im\u00e1genes en una sola solicitud (hasta un m\u00e1ximo de 20).  Esto le permite comparar y contrastar im\u00e1genes, se\u00f1ala Anthropic.<\/p>\n<p>Pero el procesamiento de im\u00e1genes de Claude 3 tiene l\u00edmites.<\/p>\n<p>Anthropic ha impedido que los modelos identifiquen a las personas, sin duda desconfiando de las implicaciones \u00e9ticas y legales.  Y la compa\u00f1\u00eda admite que Claude 3 es propenso a cometer errores con im\u00e1genes de \u201cbaja calidad\u201d (menos de 200 p\u00edxeles) y tiene dificultades con tareas que implican razonamiento espacial (por ejemplo, leer la esfera de un reloj anal\u00f3gico) y conteo de objetos (Claude 3 no puede dar datos exactos). recuentos de objetos en im\u00e1genes).<\/p>\n<div id=\"attachment_2674016\" style=\"width: 1034px\" class=\"wp-caption aligncenter\">\n<p id=\"caption-attachment-2674016\" class=\"wp-caption-text\"><strong>Cr\u00e9ditos de imagen:<\/strong> antr\u00f3pico<\/p>\n<\/div>\n<p>Claude 3 tampoco lo har\u00e1 <em>generar<\/em> obra de arte.  Los modelos analizan estrictamente im\u00e1genes, al menos por ahora.<\/p>\n<p>Ya sea con texto o im\u00e1genes, Anthropic dice que los clientes generalmente pueden esperar que Claude 3 siga mejor las instrucciones de varios pasos, produzca resultados estructurados en formatos como JSON y converse en otros idiomas adem\u00e1s del ingl\u00e9s en comparaci\u00f3n con sus predecesores.  Claude 3 tambi\u00e9n deber\u00eda negarse a responder preguntas con menos frecuencia gracias a una \u00abcomprensi\u00f3n m\u00e1s matizada de las solicitudes\u00bb, dice Anthropic.  Y pronto, Claude 3 citar\u00e1 la fuente de sus respuestas a las preguntas para que los usuarios puedan verificarlas.<\/p>\n<p>\u00abClaude 3 tiende a generar respuestas m\u00e1s expresivas y atractivas\u00bb, escribe Anthropic en un art\u00edculo de apoyo.  \u201c[It\u2019s] m\u00e1s f\u00e1cil de indicar y dirigir en comparaci\u00f3n con nuestros modelos heredados.  Los usuarios deber\u00edan descubrir que pueden lograr los resultados deseados con indicaciones m\u00e1s breves y concisas\u201d.<\/p>\n<p>Algunas de esas mejoras provienen del contexto ampliado de Claude 3.<\/p>\n<p>El contexto de un modelo, o ventana de contexto, se refiere a los datos de entrada (por ejemplo, texto) que el modelo considera antes de generar resultados.  Los modelos con ventanas de contexto peque\u00f1as tienden a \u201colvidar\u201d el contenido incluso de conversaciones muy recientes, lo que los lleva a desviarse del tema, a menudo de manera problem\u00e1tica.  Como ventaja adicional, los modelos de contexto grande pueden captar mejor el flujo narrativo de datos que reciben y generar respuestas contextualmente m\u00e1s ricas (al menos hipot\u00e9ticamente).<\/p>\n<p>Anthropic dice que Claude 3 admitir\u00e1 inicialmente una ventana de contexto de 200.000 tokens, equivalente a unas 150.000 palabras, y que los clientes seleccionados obtendr\u00e1n una ventana de contexto de 1 mill\u00f3n de tokens (~700.000 palabras).  Eso est\u00e1 a la par con el modelo GenAI m\u00e1s nuevo de Google, el Gemini 1.5 Pro mencionado anteriormente, que tambi\u00e9n ofrece una ventana de hasta 1 mill\u00f3n de contexto.<\/p>\n<p>Ahora bien, el hecho de que Claude 3 sea una actualizaci\u00f3n de lo anterior no significa que sea perfecto.<\/p>\n<p>En un documento t\u00e9cnico, Anthropic admite que Claude 3 no es inmune a los problemas que afectan a otros modelos GenAI, a saber, prejuicios y alucinaciones (es decir, inventar cosas).  A diferencia de algunos modelos GenAI, Claude 3 no puede buscar en la web;  los modelos solo pueden responder preguntas utilizando datos anteriores a agosto de 2023. Y aunque Claude es multiling\u00fce, no domina con tanta fluidez ciertos idiomas de \u201cbajos recursos\u201d como el ingl\u00e9s.<\/p>\n<p>Pero las prometedoras actualizaciones frecuentes de Anthropic para Claude 3 en los pr\u00f3ximos meses.<\/p>\n<p>\u00abNo creemos que la inteligencia modelo est\u00e9 cerca de sus l\u00edmites y planeamos lanzar [enhancements] a la familia de modelos Claude 3 durante los pr\u00f3ximos meses\u201d, escribe la compa\u00f1\u00eda en una publicaci\u00f3n de blog.<\/p>\n<p>Opus y Sonnet ya est\u00e1n disponibles en la web y a trav\u00e9s de la consola de desarrollo y API de Anthropic, la plataforma Bedrock de Amazon y Vertex AI de Google.  Haiku seguir\u00e1 m\u00e1s adelante este a\u00f1o.<\/p>\n<p>Aqu\u00ed est\u00e1 el desglose de precios:<\/p>\n<ul>\n<li>Opus: 15 d\u00f3lares por mill\u00f3n de tokens de entrada, 75 d\u00f3lares por mill\u00f3n de tokens de salida<\/li>\n<li>Sonnet: 3 d\u00f3lares por mill\u00f3n de tokens de entrada, 15 d\u00f3lares por mill\u00f3n de tokens de salida<\/li>\n<li>Haiku: 0,25 d\u00f3lares por mill\u00f3n de tokens de entrada, 1,25 d\u00f3lares por mill\u00f3n de tokens de salida<\/li>\n<\/ul>\n<p>As\u00ed que ese es Claude 3. \u00bfPero cu\u00e1l es la vista de 30.000 pies?<\/p>\n<p><span style=\"font-size: 1rem; letter-spacing: -0.1px;\">Bueno, como hemos <\/span>reportado<span style=\"font-size: 1rem; letter-spacing: -0.1px;\"> Anteriormente, la ambici\u00f3n de Anthropic era crear un \u00abalgoritmo de pr\u00f3xima generaci\u00f3n para el autoaprendizaje de la IA\u00bb.  Un algoritmo de este tipo podr\u00eda usarse para crear asistentes virtuales que puedan responder correos electr\u00f3nicos, realizar investigaciones y generar arte, libros y m\u00e1s, algunos de los cuales ya hemos probado con empresas como <\/span>GPT-4<span style=\"font-size: 1rem; letter-spacing: -0.1px;\"> y otros modelos de lenguaje grandes.<\/span><\/p>\n<p>Anthropic insin\u00faa esto en la publicaci\u00f3n de blog antes mencionada, diciendo que planea agregar funciones a Claude 3 que mejoren sus capacidades inmediatas, incluida la posibilidad de que Claude 3 interact\u00fae con otros sistemas, codificaci\u00f3n interactiva y \u00abcapacidades de agente m\u00e1s avanzadas\u00bb. .\u201d<\/p>\n<p>Esto \u00faltimo recuerda las ambiciones reportadas de OpenAI de construir una forma de agente de software para automatizar tareas complejas, como transferir datos de un documento a una hoja de c\u00e1lculo para su an\u00e1lisis o completar autom\u00e1ticamente informes de gastos e ingresarlos en un software de contabilidad.  OpenAI ya ofrece una API que permite a los desarrolladores crear \u201cexperiencias similares a las de un agente\u201d en sus aplicaciones, y Anthropic, al parecer, tiene la intenci\u00f3n de ofrecer una funcionalidad comparable.<\/p>\n<p>\u00bfPodr\u00edamos ver a continuaci\u00f3n un generador de im\u00e1genes de Anthropic?  Me sorprender\u00eda, francamente.  Los generadores de im\u00e1genes son objeto de mucha controversia en estos d\u00edas, principalmente por razones relacionadas con los derechos de autor y los prejuicios.  Recientemente, Google se vio obligado a desactivar su generador de im\u00e1genes despu\u00e9s de inyectar diversidad en las im\u00e1genes con un rid\u00edculo desprecio por el contexto hist\u00f3rico, y varios proveedores de generadores de im\u00e1genes est\u00e1n en batallas legales con artistas que los acusan de sacar provecho de su trabajo entrenando a GenAI en \u00e9l. sin proporcionar cr\u00e9dito o compensaci\u00f3n.<\/p>\n<p>Tengo curiosidad por ver la evoluci\u00f3n de la t\u00e9cnica de Anthropic para entrenar GenAI, \u00abIA constitucional\u00bb, que seg\u00fan la compa\u00f1\u00eda hace que el comportamiento de sus modelos sea m\u00e1s f\u00e1cil de entender y m\u00e1s sencillo de ajustar seg\u00fan sea necesario.  La IA constitucional busca proporcionar una manera de alinear la IA con las intenciones humanas, haciendo que los modelos respondan a preguntas y realicen tareas utilizando un conjunto simple de principios rectores.  Por ejemplo, para Claude 3, Anthropic dijo que agreg\u00f3 un principio constitucional, informado por los comentarios de los clientes, que instruye a los modelos a ser comprensibles y accesibles para las personas con discapacidades.<\/p>\n<p>Cualquiera que sea el final de Anthropic, ser\u00e1 a largo plazo.  Seg\u00fan una presentaci\u00f3n filtrada en mayo del a\u00f1o pasado, la compa\u00f1\u00eda pretende recaudar hasta 5.000 millones de d\u00f3lares durante el pr\u00f3ximo a\u00f1o, lo que podr\u00eda ser la base necesaria para seguir siendo competitivo con OpenAI.  (Despu\u00e9s de todo, los modelos de capacitaci\u00f3n no son baratos). Est\u00e1 en camino, con $2 mil millones y $4 mil millones en capital comprometido y promesas de Google y Amazon, respectivamente.<\/p>\n<\/p><\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>La startup de IA Anthropic, respaldada por cientos de millones en capital de riesgo (y quiz\u00e1s pronto cientos de millones m\u00e1s), anunci\u00f3 hoy la \u00faltima versi\u00f3n de su tecnolog\u00eda GenAI,&hellip;<\/p>\n","protected":false},"author":1,"featured_media":1036224,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[2165,76728,73336,10010,3086,17969,663],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1036223"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1036223"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1036223\/revisions"}],"predecessor-version":[{"id":1036225,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1036223\/revisions\/1036225"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1036224"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1036223"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1036223"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1036223"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}