{"id":1098286,"date":"2024-04-20T10:55:30","date_gmt":"2024-04-20T10:55:30","guid":{"rendered":"https:\/\/magazineoffice.com\/demasiados-modelos-techcrunch\/"},"modified":"2024-04-20T10:55:33","modified_gmt":"2024-04-20T10:55:33","slug":"demasiados-modelos-techcrunch","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/demasiados-modelos-techcrunch\/","title":{"rendered":"Demasiados modelos |  TechCrunch"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div>\n<p id=\"speakable-summary\">\u00bfCu\u00e1ntos modelos de IA son demasiados?  Depende de c\u00f3mo se mire, pero 10 por semana probablemente sea demasiado.  Eso es aproximadamente cu\u00e1ntos hemos visto implementarse en los \u00faltimos d\u00edas, y es cada vez m\u00e1s dif\u00edcil decir si estos modelos se comparan entre s\u00ed y c\u00f3mo, si es que alguna vez fue posible para empezar.  \u00bfEntonces cu\u00e1l es el punto?<\/p>\n<p>Estamos en un momento extra\u00f1o en la evoluci\u00f3n de la IA, aunque, por supuesto, ha sido bastante extra\u00f1o todo el tiempo.  Estamos viendo una proliferaci\u00f3n de modelos grandes y peque\u00f1os, desde desarrolladores especializados hasta grandes y bien financiados.<\/p>\n<p>Repasemos la lista de esta semana, \u00bfde acuerdo?  He intentado condensar lo que distingue a cada modelo.<\/p>\n<ul>\n<li>LLaMa-3: el \u00faltimo modelo emblem\u00e1tico de lenguaje grande \u201cabierto\u201d de Meta.  (El t\u00e9rmino \u00ababierto\u00bb es controvertido en este momento, pero de todos modos este proyecto es ampliamente utilizado por la comunidad).<\/li>\n<li>Mistral 8\u00d722: Un modelo de \u201cmezcla de expertos\u201d, en t\u00e9rminos grandes, de un equipo franc\u00e9s que ha rehuido la apertura que una vez abrazaron.<\/li>\n<li>Stable Diffusion 3 Turbo: un SD3 actualizado para combinar con la nueva API abierta de Stability.  Tomar prestado \u00abturbo\u00bb de la nomenclatura de modelos de OpenAI es un poco extra\u00f1o, pero est\u00e1 bien.<\/li>\n<li>Asistente de Adobe Acrobat AI: \u201cHable con sus documentos\u201d del gorila de documentos de 800 libras.  Sin embargo, estoy bastante seguro de que esto es principalmente un contenedor para ChatGPT.<\/li>\n<li>Reka Core: de un peque\u00f1o equipo anteriormente empleado por Big AI, un modelo multimodal creado desde cero que es al menos nominalmente competitivo con los grandes.<\/li>\n<li>Idefics2: Un modelo multimodal m\u00e1s abierto, construido sobre modelos recientes y m\u00e1s peque\u00f1os de Mistral y Google.<\/li>\n<li>OLMo-1.7-7B: una versi\u00f3n m\u00e1s grande del LLM de AI2, una de las m\u00e1s abiertas que existen, y un trampol\u00edn hacia un futuro modelo a escala 70B.<\/li>\n<li>Pile-T5: una versi\u00f3n del viejo y confiable modelo T5 optimizado en la base de datos de c\u00f3digos Pile.  El mismo T5 que conoces y amas, pero con mejor codificaci\u00f3n.<\/li>\n<li>Cohere Compass: un \u201cmodelo de integraci\u00f3n\u201d (si a\u00fan no lo sabe, no se preocupe) centrado en incorporar m\u00faltiples tipos de datos para cubrir m\u00e1s casos de uso.<\/li>\n<li>Imagine Flash: el modelo de generaci\u00f3n de im\u00e1genes m\u00e1s nuevo de Meta, que se basa en un nuevo m\u00e9todo de destilaci\u00f3n para acelerar la difusi\u00f3n sin comprometer demasiado la calidad.<\/li>\n<li><a href=\"https:\/\/twitter.com\/dsiroker\/status\/1779857843895599383\" target=\"_blank\" rel=\"noopener\">Sin l\u00edmites<\/a>: \u201cUna IA personalizada impulsada por lo que has visto, dicho u o\u00eddo.  I<span class=\"css-1qaijid r-bcqeeo r-qvutc0 r-poiln3\">Es una aplicaci\u00f3n web, una aplicaci\u00f3n para Mac, una aplicaci\u00f3n para Windows y un dispositivo port\u00e1til\u201d.  \ud83d\ude2c<br \/><\/span><\/li>\n<\/ul>\n<p>Son 11, porque se anunci\u00f3 uno mientras escrib\u00eda esto.  \u00a1Y estos no son todos los modelos lanzados o anticipados esta semana!  Son solo los que vimos y discutimos.  Si flexibiliz\u00e1ramos un poco las condiciones de inclusi\u00f3n, habr\u00eda decenas: algunos modelos existentes afinados, algunos combos como Idefics 2, algunos experimentales o de nicho, etc\u00e9tera.  \u00a1Sin mencionar las nuevas herramientas de esta semana para construir (torchtune) y luchar contra (Glaze 2.0) IA generativa!<\/p>\n<p>\u00bfQu\u00e9 vamos a hacer con esta avalancha interminable?  No podemos \u201crevisarlos\u201d todos.  Entonces, \u00bfc\u00f3mo podemos ayudarles a ustedes, nuestros lectores, a comprender y mantenerse al d\u00eda con todas estas cosas?<\/p>\n<p>La verdad es que no es necesario seguir el ritmo.  Algunos modelos como ChatGPT y Gemini han evolucionado hasta convertirse en plataformas web completas, que abarcan m\u00faltiples casos de uso y puntos de acceso.  Otros grandes modelos de lenguaje como LLaMa u OLMo, aunque t\u00e9cnicamente comparten una arquitectura b\u00e1sica, en realidad no cumplen la misma funci\u00f3n.  Est\u00e1n destinados a vivir en segundo plano como un servicio o componente, no en primer plano como una marca.<\/p>\n<p>Existe cierta confusi\u00f3n deliberada sobre estas dos cosas, porque los desarrolladores de los modelos quieren tomar prestado un poco de la fanfarria asociada con los principales lanzamientos de plataformas de IA, como su GPT-4V o Gemini Ultra.  Todo el mundo quiere que pienses que su liberaci\u00f3n es importante.  Y aunque probablemente sea importante para alguien, es casi seguro que ese alguien no seas t\u00fa.<\/p>\n<p>Pi\u00e9nselo en el sentido de otra categor\u00eda amplia y diversa como la de los autom\u00f3viles.  Cuando se inventaron por primera vez, simplemente comprabas \u00abun coche\u00bb.  Luego, un poco m\u00e1s tarde, pod\u00edas elegir entre un coche grande, un coche peque\u00f1o y un tractor.  Hoy en d\u00eda, se lanzan cientos de coches cada a\u00f1o, pero probablemente no necesites estar al tanto de uno de cada diez de ellos, porque nueve de cada diez no son el coche que necesitas o ni siquiera un coche tal como entiendes el t\u00e9rmino.  De manera similar, estamos pasando de la era de la IA grande\/peque\u00f1a\/tractora hacia la era de la proliferaci\u00f3n, e incluso los especialistas en IA no pueden mantenerse al d\u00eda y probar todos los modelos que est\u00e1n surgiendo.<\/p>\n<p>La otra cara de la historia es que ya est\u00e1bamos en esta etapa mucho antes de que aparecieran ChatGPT y los otros grandes modelos.  Mucha menos gente le\u00eda sobre esto hace 7 u 8 a\u00f1os, pero lo cubrimos de todos modos porque era claramente una tecnolog\u00eda esperando su momento decisivo.  Constantemente se publicaban art\u00edculos, modelos e investigaciones, y conferencias como SIGGRAPH y NeurIPS estaban llenas de ingenieros de aprendizaje autom\u00e1tico que comparaban notas y aprovechaban el trabajo de los dem\u00e1s.  \u00a1Aqu\u00ed hay una historia de comprensi\u00f3n visual que escrib\u00ed en 2011!<\/p>\n<p>Esa actividad sigue en marcha todos los d\u00edas.  Pero debido a que la IA se ha convertido en un gran negocio (posiblemente el mayor en tecnolog\u00eda en este momento), estos desarrollos han recibido un poco de peso adicional, ya que la gente siente curiosidad por saber si uno de estos podr\u00eda representar un salto tan grande sobre ChatGPT como lo fue ChatGPT sobre sus predecesores.<\/p>\n<p>La simple verdad es que ninguno de estos modelos ser\u00e1 un gran paso, ya que el avance de OpenAI se bas\u00f3 en un cambio fundamental en la arquitectura de aprendizaje autom\u00e1tico que todas las dem\u00e1s empresas han adoptado y que no ha sido reemplazada.  Mejoras incrementales como un punto o dos mejores en un punto de referencia sint\u00e9tico, o un lenguaje o im\u00e1genes ligeramente m\u00e1s convincentes, es todo lo que podemos esperar por el momento.<\/p>\n<p>\u00bfEso significa que ninguno de estos modelos importa?  Ciertamente lo hacen.  No se pasa de la versi\u00f3n 2.0 a la 3.0 sin 2.1, 2.2, 2.2.1, etc.  Y a veces esos avances son significativos, abordan deficiencias graves o exponen vulnerabilidades inesperadas.  Intentamos cubrir los m\u00e1s interesantes, pero eso es s\u00f3lo una fracci\u00f3n del n\u00famero total.  De hecho, ahora estamos trabajando en una pieza que recopila todos los modelos que creemos que los curiosos de ML deber\u00edan conocer, y son del orden de una docena.<\/p>\n<p>No te preocupes: cuando aparezca uno importante, lo sabr\u00e1s, y no solo porque TechCrunch lo est\u00e9 cubriendo.  Ser\u00e1 tan obvio para usted como lo es para nosotros.<\/p>\n<\/p><\/div>\n<p><script async src=\"\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script><br \/>\n<br \/><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00bfCu\u00e1ntos modelos de IA son demasiados? Depende de c\u00f3mo se mire, pero 10 por semana probablemente sea demasiado. Eso es aproximadamente cu\u00e1ntos hemos visto implementarse en los \u00faltimos d\u00edas, y&hellip;<\/p>\n","protected":false},"author":1,"featured_media":1098287,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[1605,10010,22367],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1098286"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1098286"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1098286\/revisions"}],"predecessor-version":[{"id":1098288,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1098286\/revisions\/1098288"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1098287"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1098286"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1098286"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1098286"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}