{"id":1117197,"date":"2024-05-05T13:07:22","date_gmt":"2024-05-05T13:07:22","guid":{"rendered":"https:\/\/magazineoffice.com\/se-acerca-una-mejor-siri-lo-que-dice-la-investigacion-de-apple-sobre-sus-planes-de-ia\/"},"modified":"2024-05-05T13:07:25","modified_gmt":"2024-05-05T13:07:25","slug":"se-acerca-una-mejor-siri-lo-que-dice-la-investigacion-de-apple-sobre-sus-planes-de-ia","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/se-acerca-una-mejor-siri-lo-que-dice-la-investigacion-de-apple-sobre-sus-planes-de-ia\/","title":{"rendered":"Se acerca una mejor Siri: lo que dice la investigaci\u00f3n de Apple sobre sus planes de IA"},"content":{"rendered":"


\n<\/p>\n

\n
\n

Ser\u00eda f\u00e1cil pensar que Apple llega tarde al juego de la IA. Desde finales de 2022, cuando ChatGPT arras\u00f3 en el mundo, la mayor\u00eda de los competidores de Apple se han esforzado por ponerse al d\u00eda. Si bien Apple ciertamente ha hablado sobre la IA e incluso ha lanzado algunos productos con la IA en mente, parec\u00eda estar metiendo un pie en lugar de lanzarse de cabeza.<\/p>\n<\/div>\n

\n

Pero en los \u00faltimos meses, rumores e informes han sugerido que Apple, de hecho, simplemente ha estado esperando el momento oportuno, esperando tomar su decisi\u00f3n. Ha habido informes en las \u00faltimas semanas de que Apple est\u00e1 hablando con ambos. OpenAI y Google<\/a> sobre potenciar algunas de sus funciones de IA, y la compa\u00f1\u00eda tambi\u00e9n ha estado trabajando en su propio modelo, llamado Ajax<\/a>.<\/p>\n<\/div>\n

\n

Si observa la investigaci\u00f3n de IA publicada por Apple, comienza a desarrollarse una imagen de c\u00f3mo el enfoque de Apple hacia la IA podr\u00eda cobrar vida. Ahora bien, obviamente, hacer suposiciones sobre productos basadas en art\u00edculos de investigaci\u00f3n es una ciencia profundamente inexacta: la l\u00ednea que va desde la investigaci\u00f3n hasta los estantes de las tiendas es ventosa y est\u00e1 llena de baches. Pero al menos puedes tener una idea de lo que es la empresa. pensamiento <\/em>sobre y c\u00f3mo podr\u00edan funcionar sus funciones de inteligencia artificial cuando Apple comience a hablar de ellas en su conferencia anual de desarrolladores, WWDC, en junio.<\/p>\n<\/div>\n

a: flotar]:sombra-resaltado-franklin oscuro:[&>a:hover]:sombra-resaltada-franklin [&>a]:sombra-subrayado-negro oscuro:[&>a]:shadow-underline-white\u00bb>Modelos m\u00e1s peque\u00f1os y eficientes<\/h3>\n<\/p>\n
\n

Sospecho que t\u00fa y yo esperamos lo mismo aqu\u00ed: una mejor Siri. \u00a1Y parece que viene Better Siri! En gran parte de las investigaciones de Apple (y en gran parte de la industria tecnol\u00f3gica, en el mundo y en todas partes) se supone que los grandes modelos de lenguaje har\u00e1n que los asistentes virtuales sean mejores y m\u00e1s inteligentes de inmediato. Para Apple, llegar a Better Siri significa fabricar esos modelos lo m\u00e1s r\u00e1pido posible y asegurarse de que est\u00e9n en todas partes.<\/p>\n<\/div>\n

\n

En iOS 18, Apple planea tener todas sus funciones de IA ejecut\u00e1ndose en un modelo en el dispositivo, completamente fuera de l\u00ednea. Bloomberg <\/em>recientemente <\/em>reportado<\/a>. Es dif\u00edcil construir un buen modelo multiprop\u00f3sito incluso cuando tienes una red de centros de datos y miles de GPU de \u00faltima generaci\u00f3n; es much\u00edsimo m\u00e1s dif\u00edcil hacerlo con solo las agallas dentro de tu tel\u00e9fono inteligente. As\u00ed que Apple tiene que ser creativa.<\/p>\n<\/div>\n

\n

En un art\u00edculo llamado \u201cLLM en un instante: inferencia eficiente de modelos de lenguaje grande con memoria limitada<\/a>\u201d (todos estos art\u00edculos tienen t\u00edtulos realmente aburridos pero son realmente interesantes, \u00a1lo prometo!), los investigadores idearon un sistema para almacenar los datos de un modelo, que generalmente se almacenan en la RAM de su dispositivo, en el SSD. \u201cHemos demostrado la capacidad de ejecutar LLM de hasta el doble de tama\u00f1o de DRAM disponible. [on the SSD]\u201d, escribieron los investigadores, \u201clogrando una aceleraci\u00f3n en la velocidad de inferencia de 4 a 5 veces en comparaci\u00f3n con los m\u00e9todos de carga tradicionales en la CPU y de 20 a 25 veces en la GPU\u201d. Descubrieron que al aprovechar el almacenamiento m\u00e1s econ\u00f3mico y disponible en su dispositivo, los modelos pueden funcionar m\u00e1s r\u00e1pido y de manera m\u00e1s eficiente. <\/p>\n<\/div>\n

\n

Los investigadores de Apple tambi\u00e9n crearon un sistema llamado ELBERTO<\/a> eso esencialmente puede comprimir un LLM en un tama\u00f1o mucho m\u00e1s peque\u00f1o sin empeorarlo significativamente. Su versi\u00f3n comprimida del modelo Bert de Google era 15 veces m\u00e1s peque\u00f1a (s\u00f3lo 1,2 megabytes) y experiment\u00f3 s\u00f3lo una reducci\u00f3n del 4 por ciento en la calidad. Sin embargo, vino con algunas compensaciones de latencia.<\/p>\n<\/div>\n

\n

En general, Apple est\u00e1 presionando para resolver una tensi\u00f3n central en el mundo de los modelos: cuanto m\u00e1s grande se vuelve un modelo, mejor y m\u00e1s \u00fatil puede ser, pero tambi\u00e9n m\u00e1s dif\u00edcil de manejar, m\u00e1s consumidor de energ\u00eda y m\u00e1s lento puede volverse. Como tantas otras, la empresa est\u00e1 tratando de encontrar el equilibrio adecuado entre todas esas cosas y al mismo tiempo busca una manera de tenerlo todo.<\/p>\n<\/div>\n

a: flotar]:sombra-resaltado-franklin oscuro:[&>a:hover]:sombra-resaltada-franklin [&>a]:sombra-subrayado-negro oscuro:[&>a]:shadow-underline-white\u00bb>Siri, pero bueno<\/h3>\n<\/p>\n
\n

Mucho de lo que hablamos cuando hablamos de productos de IA es de asistentes virtuales: asistentes que saben cosas, que pueden recordarnos cosas, que pueden responder preguntas y hacer cosas en nuestro nombre. Por lo tanto, no es exactamente sorprendente que gran parte de la investigaci\u00f3n de IA de Apple se reduzca a una sola pregunta: \u00bfy si Siri fuera realmente, realmente, realmente buena?<\/p>\n<\/div>\n

\n

Un grupo de investigadores de Apple ha estado trabajando en una forma de usar Siri<\/a> sin necesidad de utilizar ninguna palabra de activaci\u00f3n; En lugar de escuchar \u00abHey Siri\u00bb o \u00abSiri\u00bb, el dispositivo podr\u00eda simplemente intuir si le est\u00e1s hablando. \u00abEste problema es significativamente m\u00e1s desafiante que la detecci\u00f3n de un disparador de voz\u00bb, reconocieron los investigadores, \u00abya que puede que no haya una frase desencadenante inicial que marque el comienzo de un comando de voz\u00bb. Quiz\u00e1s por eso otro grupo de investigadores desarroll\u00f3 un sistema para detectar con mayor precisi\u00f3n las palabras de activaci\u00f3n<\/a>. Otro papel<\/a> entren\u00f3 un modelo para comprender mejor palabras raras, que a menudo los asistentes no entienden bien.<\/p>\n<\/div>\n

\n

En ambos casos, el atractivo de un LLM es que, en teor\u00eda, puede procesar mucha m\u00e1s informaci\u00f3n y mucho m\u00e1s r\u00e1pido. En el art\u00edculo sobre la palabra de activaci\u00f3n, por ejemplo, los investigadores encontraron que al no <\/em>Al tratar de descartar todos los sonidos innecesarios pero, en cambio, aliment\u00e1ndolos todos al modelo y dej\u00e1ndolo procesar lo que importa y lo que no, la palabra de activaci\u00f3n funcion\u00f3 de manera mucho m\u00e1s confiable.<\/p>\n<\/div>\n

\n

Una vez que Siri te escuche, Apple estar\u00e1 trabajando mucho para asegurarse de que comprenda y se comunique mejor. En un art\u00edculo, desarroll\u00f3 un sistema llamado STEER<\/a> (que significa Reconocimiento de extensi\u00f3n-expansi\u00f3n de giro sem\u00e1ntico, por lo que usaremos STEER) que tiene como objetivo mejorar su comunicaci\u00f3n de ida y vuelta con un asistente al tratar de descubrir cu\u00e1ndo est\u00e1 haciendo una pregunta de seguimiento y cu\u00e1ndo. est\u00e1s pidiendo uno nuevo. En otro, utiliza LLM para comprender mejor las \u00abconsultas ambiguas\u00bb y descubrir lo que quiere decir sin importar c\u00f3mo lo diga. \u00abEn circunstancias inciertas\u00bb, escribieron, \u00ablos agentes conversacionales inteligentes pueden necesitar tomar la iniciativa para reducir su incertidumbre haciendo buenas preguntas de manera proactiva, resolviendo as\u00ed los problemas de manera m\u00e1s efectiva\u00bb. Otro papel<\/a> tambi\u00e9n pretende ayudar con eso: los investigadores utilizaron LLM para hacer que los asistentes sean menos detallados y m\u00e1s comprensibles cuando generan respuestas.<\/p>\n<\/div>\n

\n
\n

a: flotar]:texto-negro [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-e9 oscuro:[&>a:hover]:sombra-subrayado-gris-63 [&>a]:sombra-subrayado-gris-13 oscuro:[&>a]:sombra-subrayado-gris-63″>Muy pronto, podr\u00e1s editar tus im\u00e1genes simplemente solicitando los cambios.<\/em><\/figcaption>a: flotar]:text-gray-63 [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-bd oscuro:[&>a:hover]:sombra-subrayado-gris [&>a]:sombra-subrayado-gris-63 oscuro:[&>a]:texto-gris-bd oscuro:[&>a]:sombra-subrayado-gris\u00bb>Imagen: Apple<\/cite><\/p>\n<\/div>\n<\/div>\n

a: flotar]:sombra-resaltado-franklin oscuro:[&>a:hover]:sombra-resaltada-franklin [&>a]:sombra-subrayado-negro oscuro:[&>a]:shadow-underline-white\u00bb>IA en salud, editores de im\u00e1genes, en tus Memojis<\/h3>\n<\/p>\n
\n

Cada vez que Apple habla p\u00fablicamente sobre la IA, tiende a centrarse menos en el poder tecnol\u00f3gico en bruto y m\u00e1s en las cosas del d\u00eda a d\u00eda que la IA realmente puede hacer por usted. Entonces, si bien hay mucha atenci\u00f3n en Siri, especialmente porque Apple busca competir con dispositivos como Humane AI Pin, Rabbit R1 y la continua destrucci\u00f3n de Gemini por parte de Google en todo Android, hay muchas otras formas en que Apple parece ver La IA es \u00fatil.<\/p>\n<\/div>\n

\n

Un lugar obvio para que Apple se concentre es en la salud: los LLM podr\u00edan, en teor\u00eda, ayudar a navegar a trav\u00e9s de los oc\u00e9anos de datos biom\u00e9tricos recopilados por sus diversos dispositivos y ayudarle a darle sentido a todo. Por eso, Apple ha estado investigando c\u00f3mo recopilar y cotejar todos sus datos de movimiento, c\u00f3mo utilizar el reconocimiento de la marcha y sus auriculares para identificarlo, y c\u00f3mo rastrear y comprender los datos de su frecuencia card\u00edaca. Apple tambi\u00e9n cre\u00f3 y lanz\u00f3 \u201cel mayor conjunto de datos de actividad humana basado en sensores de m\u00faltiples dispositivos y ubicaciones\u201d disponible despu\u00e9s de recopilar datos de 50 participantes con m\u00faltiples sensores en el cuerpo.<\/p>\n<\/div>\n

\n

Apple tambi\u00e9n parece imaginar la IA como una herramienta creativa. Para un art\u00edculo, los investigadores entrevistaron a un grupo de animadores, dise\u00f1adores e ingenieros y construyeron un sistema llamado Keyframer<\/a> que permiten[s] usuarios construir y refinar iterativamente los dise\u00f1os generados\u201d. En lugar de escribir un mensaje y obtener una imagen, y luego escribir otro mensaje para obtener otra imagen, comienza con un mensaje pero luego obtiene un conjunto de herramientas para modificar y refinar partes de la imagen a su gusto. Podr\u00edas imaginar este tipo de proceso art\u00edstico de ida y vuelta apareciendo desde el creador de Memoji hasta algunas de las herramientas art\u00edsticas m\u00e1s profesionales de Apple.<\/p>\n<\/div>\n

\n

En otro papel<\/a>, Apple describe una herramienta llamada MGIE que te permite editar una imagen simplemente describiendo las ediciones que deseas realizar. (\u201cHacer el cielo m\u00e1s azul\u201d, \u201chacer mi cara menos rara\u201d, \u201cagregar algunas piedras\u201d, ese tipo de cosas). \u201cEn lugar de una gu\u00eda breve pero ambigua, MGIE deriva una intenci\u00f3n visual expl\u00edcita y conduce a una edici\u00f3n de im\u00e1genes razonable. \u201d, escribieron los investigadores. Sus experimentos iniciales no fueron perfectos, pero s\u00ed impresionantes.<\/p>\n<\/div>\n

\n

Incluso podr\u00edamos conseguir algo de IA en Apple Music: para un art\u00edculo llamado \u00abCancelaci\u00f3n de voz de canto est\u00e9reo con recursos limitados<\/a>\u201d, los investigadores exploraron formas de separar las voces de los instrumentos en las canciones, lo que podr\u00eda resultar \u00fatil si Apple quiere brindarles a las personas herramientas para, por ejemplo, remezclar canciones de la misma manera que se puede hacer en TikTok o Instagram.<\/p>\n<\/div>\n

\n
\n

a: flotar]:texto-negro [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-e9 oscuro:[&>a:hover]:sombra-subrayado-gris-63 [&>a]:sombra-subrayado-gris-13 oscuro:[&>a]:sombra-subrayado-gris-63″>En el futuro, Siri podr\u00eda comprender y utilizar su tel\u00e9fono por usted.<\/em><\/figcaption>a: flotar]:text-gray-63 [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-bd oscuro:[&>a:hover]:sombra-subrayado-gris [&>a]:sombra-subrayado-gris-63 oscuro:[&>a]:texto-gris-bd oscuro:[&>a]:sombra-subrayado-gris\u00bb>Imagen: Apple<\/cite><\/p>\n<\/div>\n<\/div>\n
\n

Con el tiempo, apuesto a que este es el tipo de cosas en las que Apple se apoyar\u00e1, especialmente en iOS. Parte de esto Apple lo incorporar\u00e1 a sus propias aplicaciones; algunos los ofrecer\u00e1 a desarrolladores externos como API. (La reciente funci\u00f3n Sugerencias de diario es probablemente una buena gu\u00eda sobre c\u00f3mo podr\u00eda funcionar). Apple siempre ha pregonado sus capacidades de hardware, particularmente en comparaci\u00f3n con un dispositivo Android promedio; combinar toda esa potencia con una IA centrada en la privacidad en el dispositivo podr\u00eda ser un gran diferenciador.<\/p>\n<\/div>\n

\n

Pero si quieres ver la IA m\u00e1s grande y ambiciosa en Apple, necesitas saber sobre Hur\u00f3n<\/a>. Ferret es un modelo de lenguaje grande multimodal que puede recibir instrucciones, centrarse en algo espec\u00edfico que haya marcado con un c\u00edrculo o seleccionado de otro modo y comprender el mundo que lo rodea. Est\u00e1 dise\u00f1ado para el caso de uso ahora normal de IA de preguntarle a un dispositivo sobre el mundo que lo rodea, pero tambi\u00e9n podr\u00eda comprender lo que hay en su pantalla. En el art\u00edculo de Ferret, los investigadores muestran que podr\u00eda ayudarle a navegar por las aplicaciones, responder preguntas sobre las calificaciones de la App Store, describir lo que est\u00e1 viendo y m\u00e1s. Esto tiene implicaciones realmente interesantes para la accesibilidad, pero tambi\u00e9n podr\u00eda cambiar por completo la forma en que usa su tel\u00e9fono, y alg\u00fan d\u00eda su Vision Pro y\/o sus gafas inteligentes.<\/p>\n<\/div>\n

\n

Nos estamos adelantando mucho aqu\u00ed, pero puedes imaginar c\u00f3mo funcionar\u00eda esto con algunas de las otras cosas en las que Apple est\u00e1 trabajando. Un Siri que puede entender lo que quieres, combinado con un dispositivo que puede ver y comprender todo lo que sucede en tu pantalla, es un tel\u00e9fono que literalmente puede usarse solo. Apple no necesitar\u00eda integraciones profundas con todo; simplemente podr\u00eda ejecutar las aplicaciones y tocar los botones correctos autom\u00e1ticamente. <\/p>\n<\/div>\n

\n

Una vez m\u00e1s, todo esto es s\u00f3lo investigaci\u00f3n, y que todo funcione bien a partir de esta primavera ser\u00eda un logro t\u00e9cnico leg\u00edtimamente inaudito. (Quiero decir, has probado los chatbots, sabes que no son geniales). Pero te apuesto cualquier cosa a que recibiremos grandes anuncios de IA en la WWDC. El director ejecutivo de Apple, Tim Cook, incluso se burl\u00f3 de ello en febrero, y b\u00e1sicamente lo promet\u00ed<\/a> en la convocatoria de resultados de esta semana. Y dos cosas est\u00e1n muy claras: Apple est\u00e1 muy metida en la carrera de la IA y podr\u00eda significar una revisi\u00f3n total del iPhone. \u00a1Diablos, incluso podr\u00edas comenzar a usar Siri voluntariamente! Y eso ser\u00eda todo un logro.<\/p>\n<\/div>\n<\/div>\n


\n
Source link-37 <\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Ser\u00eda f\u00e1cil pensar que Apple llega tarde al juego de la IA. Desde finales de 2022, cuando ChatGPT arras\u00f3 en el mundo, la mayor\u00eda de los competidores de Apple se…<\/p>\n","protected":false},"author":1,"featured_media":1117198,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[2100,2450,99,1741,166,598,36312,15,663,73],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1117197"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1117197"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1117197\/revisions"}],"predecessor-version":[{"id":1117199,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1117197\/revisions\/1117199"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/1117198"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1117197"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1117197"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1117197"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}