{"id":1098286,"date":"2024-04-20T10:55:30","date_gmt":"2024-04-20T10:55:30","guid":{"rendered":"https:\/\/magazineoffice.com\/demasiados-modelos-techcrunch\/"},"modified":"2024-04-20T10:55:33","modified_gmt":"2024-04-20T10:55:33","slug":"demasiados-modelos-techcrunch","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/demasiados-modelos-techcrunch\/","title":{"rendered":"Demasiados modelos | TechCrunch"},"content":{"rendered":"
\n<\/p>\n
\u00bfCu\u00e1ntos modelos de IA son demasiados? Depende de c\u00f3mo se mire, pero 10 por semana probablemente sea demasiado. Eso es aproximadamente cu\u00e1ntos hemos visto implementarse en los \u00faltimos d\u00edas, y es cada vez m\u00e1s dif\u00edcil decir si estos modelos se comparan entre s\u00ed y c\u00f3mo, si es que alguna vez fue posible para empezar. \u00bfEntonces cu\u00e1l es el punto?<\/p>\n
Estamos en un momento extra\u00f1o en la evoluci\u00f3n de la IA, aunque, por supuesto, ha sido bastante extra\u00f1o todo el tiempo. Estamos viendo una proliferaci\u00f3n de modelos grandes y peque\u00f1os, desde desarrolladores especializados hasta grandes y bien financiados.<\/p>\n
Repasemos la lista de esta semana, \u00bfde acuerdo? He intentado condensar lo que distingue a cada modelo.<\/p>\n
Son 11, porque se anunci\u00f3 uno mientras escrib\u00eda esto. \u00a1Y estos no son todos los modelos lanzados o anticipados esta semana! Son solo los que vimos y discutimos. Si flexibiliz\u00e1ramos un poco las condiciones de inclusi\u00f3n, habr\u00eda decenas: algunos modelos existentes afinados, algunos combos como Idefics 2, algunos experimentales o de nicho, etc\u00e9tera. \u00a1Sin mencionar las nuevas herramientas de esta semana para construir (torchtune) y luchar contra (Glaze 2.0) IA generativa!<\/p>\n
\u00bfQu\u00e9 vamos a hacer con esta avalancha interminable? No podemos \u201crevisarlos\u201d todos. Entonces, \u00bfc\u00f3mo podemos ayudarles a ustedes, nuestros lectores, a comprender y mantenerse al d\u00eda con todas estas cosas?<\/p>\n
La verdad es que no es necesario seguir el ritmo. Algunos modelos como ChatGPT y Gemini han evolucionado hasta convertirse en plataformas web completas, que abarcan m\u00faltiples casos de uso y puntos de acceso. Otros grandes modelos de lenguaje como LLaMa u OLMo, aunque t\u00e9cnicamente comparten una arquitectura b\u00e1sica, en realidad no cumplen la misma funci\u00f3n. Est\u00e1n destinados a vivir en segundo plano como un servicio o componente, no en primer plano como una marca.<\/p>\n
Existe cierta confusi\u00f3n deliberada sobre estas dos cosas, porque los desarrolladores de los modelos quieren tomar prestado un poco de la fanfarria asociada con los principales lanzamientos de plataformas de IA, como su GPT-4V o Gemini Ultra. Todo el mundo quiere que pienses que su liberaci\u00f3n es importante. Y aunque probablemente sea importante para alguien, es casi seguro que ese alguien no seas t\u00fa.<\/p>\n
Pi\u00e9nselo en el sentido de otra categor\u00eda amplia y diversa como la de los autom\u00f3viles. Cuando se inventaron por primera vez, simplemente comprabas \u00abun coche\u00bb. Luego, un poco m\u00e1s tarde, pod\u00edas elegir entre un coche grande, un coche peque\u00f1o y un tractor. Hoy en d\u00eda, se lanzan cientos de coches cada a\u00f1o, pero probablemente no necesites estar al tanto de uno de cada diez de ellos, porque nueve de cada diez no son el coche que necesitas o ni siquiera un coche tal como entiendes el t\u00e9rmino. De manera similar, estamos pasando de la era de la IA grande\/peque\u00f1a\/tractora hacia la era de la proliferaci\u00f3n, e incluso los especialistas en IA no pueden mantenerse al d\u00eda y probar todos los modelos que est\u00e1n surgiendo.<\/p>\n
La otra cara de la historia es que ya est\u00e1bamos en esta etapa mucho antes de que aparecieran ChatGPT y los otros grandes modelos. Mucha menos gente le\u00eda sobre esto hace 7 u 8 a\u00f1os, pero lo cubrimos de todos modos porque era claramente una tecnolog\u00eda esperando su momento decisivo. Constantemente se publicaban art\u00edculos, modelos e investigaciones, y conferencias como SIGGRAPH y NeurIPS estaban llenas de ingenieros de aprendizaje autom\u00e1tico que comparaban notas y aprovechaban el trabajo de los dem\u00e1s. \u00a1Aqu\u00ed hay una historia de comprensi\u00f3n visual que escrib\u00ed en 2011!<\/p>\n
Esa actividad sigue en marcha todos los d\u00edas. Pero debido a que la IA se ha convertido en un gran negocio (posiblemente el mayor en tecnolog\u00eda en este momento), estos desarrollos han recibido un poco de peso adicional, ya que la gente siente curiosidad por saber si uno de estos podr\u00eda representar un salto tan grande sobre ChatGPT como lo fue ChatGPT sobre sus predecesores.<\/p>\n
La simple verdad es que ninguno de estos modelos ser\u00e1 un gran paso, ya que el avance de OpenAI se bas\u00f3 en un cambio fundamental en la arquitectura de aprendizaje autom\u00e1tico que todas las dem\u00e1s empresas han adoptado y que no ha sido reemplazada. Mejoras incrementales como un punto o dos mejores en un punto de referencia sint\u00e9tico, o un lenguaje o im\u00e1genes ligeramente m\u00e1s convincentes, es todo lo que podemos esperar por el momento.<\/p>\n
\u00bfEso significa que ninguno de estos modelos importa? Ciertamente lo hacen. No se pasa de la versi\u00f3n 2.0 a la 3.0 sin 2.1, 2.2, 2.2.1, etc. Y a veces esos avances son significativos, abordan deficiencias graves o exponen vulnerabilidades inesperadas. Intentamos cubrir los m\u00e1s interesantes, pero eso es s\u00f3lo una fracci\u00f3n del n\u00famero total. De hecho, ahora estamos trabajando en una pieza que recopila todos los modelos que creemos que los curiosos de ML deber\u00edan conocer, y son del orden de una docena.<\/p>\n
No te preocupes: cuando aparezca uno importante, lo sabr\u00e1s, y no solo porque TechCrunch lo est\u00e9 cubriendo. Ser\u00e1 tan obvio para usted como lo es para nosotros.<\/p>\n<\/p><\/div>\n