La semana en IA: Apple hace movimientos de aprendizaje automático


Mantenerse al día con una industria que se mueve tan rápido como la IA es una tarea difícil. Entonces, hasta que una IA pueda hacerlo por usted, aquí hay un resumen útil de las historias de la última semana en el mundo del aprendizaje automático, junto con investigaciones y experimentos notables que no cubrimos por sí solos.

Se podría decir que la semana pasada, Apple, de manera muy visible y con intención, se lanzó a la carrera ultracompetitiva de la IA. No es que la empresa no haya señalado sus inversiones y la priorización de la IA anteriormente. Pero en su evento WWDC, Apple dejó muy claro que la IA estaba detrás de muchas de las funciones tanto en su próximo hardware como en su software.

Por ejemplo, iOS 17, que llegará a finales de este año, puede sugerir recetas para platos similares a partir de una foto de iPhone utilizando la visión artificial. AI también impulsa Journal, un nuevo diario interactivo que hace sugerencias personalizadas basadas en actividades en otras aplicaciones.

iOS 17 también contará con una corrección automática mejorada impulsada por un modelo de IA que puede predecir con mayor precisión las siguientes palabras y frases que un usuario podría usar. Con el tiempo, se adaptará y aprenderá las palabras más utilizadas por el usuario, incluidas las malas palabras, de forma entretenida.

La IA también es fundamental para los auriculares de realidad aumentada Vision Pro de Apple, específicamente FaceTime en Vision Pro. Usando el aprendizaje automático, Vision Pro puede crear un avatar virtual del usuario, interpolando una gama completa de contorsiones faciales, hasta la tensión de la piel y el trabajo muscular.

Créditos de imagen: Manzana

Puede que no sea IA generativa, que es sin duda la subcategoría más popular de IA en la actualidad. Pero la intención de Apple, me parece, era organizar una especie de regreso, para demostrar que no se debe subestimar después de años de fracasar en proyectos de aprendizaje automático, desde el decepcionante Siri hasta el automóvil autónomo en el infierno de la producción.

Proyectar fuerza no es solo una estratagema de marketing. Según los informes, el bajo rendimiento histórico de Apple en IA ha provocado una grave fuga de cerebros, y The Information informa que científicos talentosos de aprendizaje automático, incluido un equipo que había estado trabajando en el tipo de tecnología subyacente a ChatGPT de OpenAI, abandonaron Apple por pastos más verdes.

Demostrando que se toma en serio la IA al envío Los productos con IA imbuidos se sienten como un movimiento necesario, y un punto de referencia que algunos de los competidores de Apple, de hecho, no han logrado cumplir en el pasado reciente. (Te estoy mirando a ti, Meta). Según todas las apariencias, Apple hizo avances la semana pasada, incluso si no fue particularmente ruidoso al respecto.

Aquí están los otros titulares de AI de nota de los últimos días:

  • Meta hace un generador de música: para no ser menos por Google, Meta ha lanzado su propio generador de música alimentado por IA y, a diferencia de Google, lo ha abierto. Llamada MusicGen, la herramienta de generación de música de Meta puede convertir una descripción de texto en unos 12 segundos de audio.
  • Los reguladores examinan la seguridad de la IA: Tras el anuncio del gobierno del Reino Unido la semana pasada que planea organizar una cumbre de seguridad de IA «global» este otoño, OpenAI, Google DeepMind y Anthropic se han comprometido a proporcionar «acceso temprano o prioritario» a sus modelos de IA para apoyar la investigación en evaluación y seguridad.
  • IA, conozca la nube: Salesforce está lanzando un nuevo conjunto de productos destinados a reforzar su posición en el espacio de IA ultracompetitivo. Llamada AI Cloud, la suite, que incluye herramientas diseñadas para ofrecer IA «lista para empresas», es el último intento interdisciplinario de Salesforce para aumentar su cartera de productos con capacidades de IA.
  • Probando la IA de texto a video: TechCrunch se puso manos a la obra con Gen-2, la IA de Runway que genera videoclips cortos a partir de texto. ¿El veredicto? Hay un largo camino por recorrer antes de que la tecnología se acerque a generar imágenes de calidad cinematográfica.
  • Más dinero para la IA empresarial: En una señal de que hay mucho dinero disponible para las nuevas empresas de inteligencia artificial generativa, Cohereque está desarrollando un modelo de ecosistema de IA para la empresa, anunció la semana pasada que recaudó 270 millones de dólares como parte de su ronda Serie C.
  • No hay GPT-5 para ti: OpenAI aún no está capacitando a GPT-5, dijo el CEO de OpenAI, Sam Altman, en una conferencia reciente organizada por Economic Times, meses después de que la startup respaldada por Microsoft se comprometiera a no trabajar en el sucesor de GPT-4 «durante algún tiempo» después de que muchos ejecutivos de la industria y académicos expresaron su preocupación sobre la rápida tasa de avances de los grandes modelos de lenguaje de Altman.
  • Asistente de escritura AI para WordPress: Automáticola compañía detrás de WordPress.com y el principal colaborador del proyecto WordPress de código abierto, lanzó el pasado martes un asistente de IA para el popular sistema de gestión de contenido.
  • Instagram gana un chatbot: Instagram puede estar trabajando en un chatbot de IA, según las imágenes filtrado por el investigador de aplicaciones Alessandro Paluzzi. Según las filtraciones, que reflejan desarrollos de aplicaciones en curso que pueden o no enviarse, estos agentes de IA pueden responder preguntas o dar consejos.

Otros aprendizajes automáticos

Si tiene curiosidad sobre cómo la IA podría afectar la ciencia y la investigación en los próximos años, un equipo de seis laboratorios nacionales redactó un informe, basado en talleres realizados el año pasado, exactamente sobre eso. Uno puede estar tentado a decir que, al estar basado en las tendencias del año pasado y no en este, en el que las cosas han progresado tan rápido, el informe ya puede estar obsoleto. Pero si bien ChatGPT ha tenido un gran impacto en la tecnología y la conciencia del consumidor, la verdad es que no es particularmente relevante para una investigación seria. Las tendencias a mayor escala lo son, y se están moviendo a un ritmo diferente. El informe de 200 páginas definitivamente no es una lectura ligera, pero cada sección está dividida en partes fáciles de digerir.

En otras partes del ecosistema del laboratorio nacional, los investigadores de Los Álamos están trabajando arduamente para avanzar en el campo de los memristores, que combinan el almacenamiento y el procesamiento de datos, al igual que lo hacen nuestras propias neuronas. Es un enfoque fundamentalmente diferente de la computación, aunque aún no ha dado frutos fuera del laboratorio, pero este nuevo enfoque parece hacer avanzar la pelota, al menos.

La facilidad de AI con el análisis del lenguaje se muestra en este informe sobre las interacciones de la policía con las personas que han detenido. El procesamiento del lenguaje natural se utilizó como uno de varios factores para identificar patrones lingüísticos que predicen una escalada de paradas, especialmente con hombres negros. Los métodos de aprendizaje humano y automático se refuerzan mutuamente. (Lea el documento aquí.)

Créditos de imagen: Cyrille Verdon / Renaud Defrancesco OFICINA 141 / EPFL

DeepBreath es un modelo entrenado en grabaciones de respiración tomadas de pacientes en Suiza y Brasil que, según sus creadores en EPFL, puede ayudar a identificar las condiciones respiratorias de manera temprana. El plan es ponerlo en un dispositivo llamado Pneumoscope, bajo la empresa Onescope. Probablemente nos pondremos en contacto con ellos para obtener más información sobre cómo le está yendo a la empresa.

Otro avance de la salud de la IA proviene de Purdue, donde los investigadores han creado un software que se aproxima a las imágenes hiperespectrales con la cámara de un teléfono inteligente, rastreando con éxito la hemoglobina en sangre y otras métricas. Es una técnica interesante: al usar el modo de cámara súper lenta del teléfono, obtiene mucha información sobre cada píxel de la imagen, lo que le da al modelo suficientes datos para extrapolar. Podría ser una excelente manera de obtener este tipo de información de salud sin un hardware especial.

Créditos de imagen: MIT

Todavía no confiaría en un piloto automático para realizar maniobras evasivas, pero el MIT está acercando la tecnología poco a poco con una investigación que ayuda a la IA a evitar obstáculos mientras mantiene una ruta de vuelo deseable. Cualquier algoritmo antiguo puede proponer cambios salvajes en la dirección para no chocar, pero hacerlo manteniendo la estabilidad y sin triturar nada dentro es más difícil. El equipo consiguió que un jet simulado realizara algunas maniobras tipo Top Gun de forma autónoma y sin perder la estabilidad. Es más difícil de lo que parece.

La última semana es Disney Research, con la que siempre se puede contar para mostrar algo interesante que también se aplica a la realización de películas o las operaciones de parques temáticos. En CVPR, mostraron una «red de detección de puntos de referencia faciales» potente y versátil que puede rastrear los movimientos faciales de forma continua y utilizando puntos de referencia más arbitrarios. La captura de movimiento ya funciona sin los pequeños puntos de captura, pero esto debería hacerla de mayor calidad y más digna para los actores.





Source link-48