{"id":700027,"date":"2023-06-25T01:11:12","date_gmt":"2023-06-25T01:11:12","guid":{"rendered":"https:\/\/magazineoffice.com\/esta-semana-en-ia-la-gran-tecnologia-apuesta-miles-de-millones-en-herramientas-de-aprendizaje-automatico\/"},"modified":"2023-06-25T01:11:16","modified_gmt":"2023-06-25T01:11:16","slug":"esta-semana-en-ia-la-gran-tecnologia-apuesta-miles-de-millones-en-herramientas-de-aprendizaje-automatico","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/esta-semana-en-ia-la-gran-tecnologia-apuesta-miles-de-millones-en-herramientas-de-aprendizaje-automatico\/","title":{"rendered":"Esta semana en IA: la gran tecnolog\u00eda apuesta miles de millones en herramientas de aprendizaje autom\u00e1tico"},"content":{"rendered":"
\n<\/p>\n
Mantenerse al d\u00eda con una industria que se mueve tan r\u00e1pido como la IA es una tarea dif\u00edcil. Entonces, hasta que una IA pueda hacerlo por usted, aqu\u00ed hay un resumen \u00fatil de las historias de la \u00faltima semana en el mundo del aprendizaje autom\u00e1tico, junto con investigaciones y experimentos notables que no cubrimos por s\u00ed solos.<\/p>\n
Si a\u00fan no era obvio, el panorama competitivo en IA, particularmente el subcampo conocido como IA generativa, est\u00e1 al rojo vivo. Y se est\u00e1 poniendo m\u00e1s caliente. Esta semana, Dropbox lanz\u00f3 su primer fondo de riesgo corporativo, Dropbox Ventures, que, seg\u00fan la compa\u00f1\u00eda, se centrar\u00e1 en las nuevas empresas que crean productos impulsados \u200b\u200bpor IA que \u00abdan forma al futuro del trabajo\u00bb. Para no quedarse atr\u00e1s, AWS present\u00f3 un programa de 100 millones de d\u00f3lares para financiar iniciativas de IA generativa encabezadas por sus socios y clientes.<\/p>\n
Se est\u00e1 gastando mucho dinero en el espacio de la IA, sin duda. Salesforce Ventures, la divisi\u00f3n de capital de riesgo de Salesforce, planea invertir $ 500 millones en nuevas empresas que desarrollan tecnolog\u00edas de inteligencia artificial generativa. Workday agreg\u00f3 recientemente $ 250 millones a su fondo de capital de riesgo existente espec\u00edficamente para respaldar las nuevas empresas de inteligencia artificial y aprendizaje autom\u00e1tico. Y Accenture y PwC han anunciado que planean invertir $ 3 mil millones y $ 1 mil millones, respectivamente, en IA.<\/p>\n
Pero uno se pregunta si el dinero es la soluci\u00f3n a los desaf\u00edos pendientes del campo de la IA.<\/p>\n
En un panel esclarecedor durante una conferencia de Bloomberg en San Francisco esta semana, Meredith Whittaker, presidenta de la aplicaci\u00f3n de mensajer\u00eda segura Signal, argument\u00f3 que la tecnolog\u00eda que sustenta algunas de las aplicaciones de inteligencia artificial m\u00e1s populares de la actualidad se est\u00e1 volviendo peligrosamente opaca. Ella dio un ejemplo de alguien que entra a un banco y pide un pr\u00e9stamo.<\/p>\n
A esa persona se le puede negar el pr\u00e9stamo y \u00abno tener idea de que hay un sistema en [the] probablemente impulsado por alguna API de Microsoft que determin\u00f3, en funci\u00f3n de las redes sociales extra\u00eddas, que no era solvente\u201d, dijo Whittaker. \u201cnunca voy a saber [because] no hay ning\u00fan mecanismo para que yo sepa esto\u201d.<\/span><\/p>\n No es el capital ese es el problema. M\u00e1s bien, es la jerarqu\u00eda de poder actual, dice Whittaker.<\/p>\n \u201cHe estado en la mesa durante 15 a\u00f1os, 20 a\u00f1os. He estado<\/em> en la mesa. Estar en la mesa sin electricidad no es nada\u201d, continu\u00f3.<\/p>\n Por supuesto, lograr un cambio estructural es mucho m\u00e1s dif\u00edcil que buscar dinero en efectivo, particularmente cuando el cambio estructural no necesariamente favorecer\u00e1 a los poderes f\u00e1cticos. Y Whittaker advierte lo que podr\u00eda pasar si no hay suficiente resistencia.<\/p>\n A medida que se acelera el progreso en la IA, los impactos sociales tambi\u00e9n se aceleran, y continuaremos avanzando por un \u00abcamino lleno de publicidad hacia la IA\u00bb, dijo, \u00abdonde ese poder se arraiga y se naturaliza bajo la apariencia de inteligencia y somos vigilados para el punto [of having] muy, muy poca agencia sobre nuestras vidas individuales y colectivas\u201d.<\/p>\n Eso deber\u00eda<\/em> dar pausa a la industria. Ya sea en realidad voluntad<\/em> es otro asunto Eso es probablemente algo de lo que oiremos hablar cuando suba al escenario en Disrupt en septiembre.<\/p>\n Aqu\u00ed est\u00e1n los otros titulares de AI de nota de los \u00faltimos d\u00edas:<\/p>\n Esta semana fue CVPR en Vancouver, Canad\u00e1, y desear\u00eda haber ido porque las charlas y los documentos parecen muy interesantes. Si solo puede ver uno, consulte el discurso de apertura de Yejin Choi sobre las posibilidades, imposibilidades y paradojas de la IA.<\/p>\n Cr\u00e9ditos de imagen:<\/strong> CVPR\/YouTube<\/p>\n<\/div>\n El profesor de la UW y beneficiario de la beca MacArthur Genius primero abord\u00f3 algunas limitaciones inesperadas de los modelos m\u00e1s capaces de la actualidad. En particular, GPT-4 es realmente malo en la multiplicaci\u00f3n. No logra encontrar correctamente el producto de dos n\u00fameros de tres d\u00edgitos a una velocidad sorprendente, aunque con un poco de persuasi\u00f3n puede hacerlo bien el 95 % de las veces. \u00bfPor qu\u00e9 importa que un modelo de lenguaje no pueda hacer matem\u00e1ticas? Porque todo el mercado de IA en este momento se basa en la idea de que los modelos de lenguaje se generalizan bien para muchas tareas interesantes, incluidas cosas como hacer impuestos o contabilidad. El punto de Choi fue que deber\u00edamos buscar las limitaciones de la IA y trabajar hacia adentro, no al rev\u00e9s, ya que nos dice m\u00e1s sobre sus capacidades.<\/p>\n Las otras partes de su charla fueron igualmente interesantes y estimulantes. Puedes verlo completo aqu\u00ed.<\/p>\n Rod Brooks, presentado como un \u00abasesino de la exageraci\u00f3n\u00bb, brind\u00f3 una historia interesante de algunos de los conceptos b\u00e1sicos del aprendizaje autom\u00e1tico, \u00a1conceptos que solo parecen nuevos porque la mayor\u00eda de las personas que los aplican no estaban presentes cuando se inventaron! Retrocediendo a trav\u00e9s de las d\u00e9cadas, toca a McCulloch, Minsky, incluso Hebb, y muestra c\u00f3mo las ideas se mantuvieron relevantes mucho m\u00e1s all\u00e1 de su tiempo. Es un recordatorio \u00fatil de que el aprendizaje autom\u00e1tico es un campo que se encuentra sobre los hombros de gigantes que se remontan a la era de la posguerra.<\/p>\n Se enviaron y presentaron muchos, muchos art\u00edculos en el CVPR, y es reductivo mirar solo a los ganadores de los premios, pero esto es un resumen de noticias, no una revisi\u00f3n exhaustiva de la literatura. Esto es lo que los jueces de la conferencia pensaron que era lo m\u00e1s interesante:<\/p>\n Cr\u00e9ditos de imagen:<\/strong> AI2<\/p>\n<\/div>\n VISPROG, de los investigadores de AI2, es una especie de metamodelo que realiza tareas complejas de manipulaci\u00f3n visual utilizando una caja de herramientas de c\u00f3digo multiprop\u00f3sito. Digamos que tiene una imagen de un oso grizzly en un poco de hierba (como se muestra en la imagen), puede decirle que simplemente \u00abreemplace el oso con un oso polar en la nieve\u00bb y comienza a funcionar. Identifica las partes de la imagen, las separa visualmente, busca y encuentra o genera un reemplazo adecuado, y vuelve a unir todo de manera inteligente, sin necesidad de m\u00e1s indicaciones por parte del usuario. La interfaz de \u00abmejora\u00bb de Blade Runner est\u00e1 empezando a parecer francamente peatonal. Y esa es solo una de sus muchas capacidades.<\/p>\n La \u201cconducci\u00f3n aut\u00f3noma orientada a la planificaci\u00f3n\u201d, de un grupo de investigaci\u00f3n multiinstitucional chino, intenta unificar las diversas piezas del enfoque bastante fragmentario que hemos adoptado para los autom\u00f3viles aut\u00f3nomos. Por lo general, existe una especie de proceso gradual de \u00abpercepci\u00f3n, predicci\u00f3n y planificaci\u00f3n\u00bb, cada uno de los cuales puede tener una serie de subtareas (como segmentar personas, identificar obst\u00e1culos, etc.). Su modelo intenta poner todo esto en un solo modelo, algo as\u00ed como los modelos multimodales que vemos que pueden usar texto, audio o im\u00e1genes como entrada y salida. De manera similar, este modelo simplifica de alguna manera las complejas interdependencias de una pila de conducci\u00f3n aut\u00f3noma moderna.<\/p>\n<\/p>\n DynIBaR muestra un m\u00e9todo robusto y de alta calidad para interactuar con video utilizando \u00abcampos de radiaci\u00f3n neuronal din\u00e1micos\u00bb o NeRF. Una comprensi\u00f3n profunda de los objetos en el video permite cosas como la estabilizaci\u00f3n, los movimientos del carro y otras cosas que generalmente no espera que sean posibles una vez que el video ya se ha grabado. De nuevo… \u00abmejorar\u00bb. Este es definitivamente el tipo de cosas para las que Apple te contrata y luego se lleva el cr\u00e9dito en la pr\u00f3xima WWDC.<\/p>\n Puede que recuerde DreamBooth de un poco antes de este a\u00f1o cuando la p\u00e1gina del proyecto se puso en marcha. Es el mejor sistema hasta ahora para, no hay forma de decirlo, hacer deepfakes. Por supuesto que es valioso y poderoso hacer este tipo de operaciones de imagen, sin mencionar la diversi\u00f3n, e investigadores como los de Google est\u00e1n trabajando para que sea m\u00e1s fluido y realista. Consecuencias… m\u00e1s tarde, tal vez.<\/p>\n El premio al mejor trabajo de estudiante se otorga a un m\u00e9todo para comparar y combinar mallas o nubes de puntos 3D; francamente, es demasiado t\u00e9cnico para m\u00ed tratar de explicarlo, pero esta es una capacidad importante para la percepci\u00f3n del mundo real y las mejoras son bienvenidas. Consulte el documento aqu\u00ed para obtener ejemplos y m\u00e1s informaci\u00f3n.<\/p>\n Solo dos pepitas m\u00e1s: Intel mostr\u00f3 este interesante modelo, LDM3D, para generar im\u00e1genes 3D 360 como entornos virtuales. Entonces, cuando est\u00e1s en el metaverso y dices \u00abp\u00f3nganos en una ruina cubierta de maleza en la jungla\u00bb, simplemente crea uno nuevo a pedido.<\/p>\n Y Meta lanz\u00f3 una herramienta de s\u00edntesis de voz llamada Voicebox que es muy buena para extraer caracter\u00edsticas de las voces y replicarlas, incluso cuando la entrada no es limpia. Por lo general, para la replicaci\u00f3n de voz necesita una buena cantidad y variedad de grabaciones de voz limpias, pero Voicebox lo hace mejor que muchos otros, con menos datos (piense en 2 segundos). Afortunadamente, mantienen a este genio en la botella por ahora. Para aquellos que piensan que podr\u00edan necesitar que les clonen la voz, consulten Acapela.<\/p>\n<\/p><\/div>\n\n
Otros aprendizajes autom\u00e1ticos<\/h2>\n
<\/p>\n
<\/p>\n