Esta semana en IA: Microsoft coloca un anuncio de IA en los teclados


Mantenerse al día con una industria que evoluciona tan rápidamente como la IA es una tarea difícil. Entonces, hasta que una IA pueda hacerlo por usted, aquí hay un resumen útil de historias recientes en el mundo del aprendizaje automático, junto con investigaciones y experimentos notables que no cubrimos por sí solos.

Esta semana en AI, Microsoft presentó una nueva distribución de teclado de PC estándar con una tecla «Copilot». Escuchaste correctamente: en el futuro, las máquinas con Windows tendrán una tecla dedicada para iniciar el asistente Copilot impulsado por IA de Microsoft, reemplazando la tecla Control derecha.

Se imagina que la medida pretende señalar la seriedad de la inversión de Microsoft en la carrera por el dominio de la IA para los consumidores (y las empresas, en realidad). Es la primera vez que Microsoft cambia la distribución del teclado de Windows en ~30 años; Está previsto que las computadoras portátiles y los teclados con la tecla Copilot se envíen a finales de febrero.

¿Pero es todo fanfarronería? ¿Los usuarios de Windows realmente desear ¿Un atajo de IA, o el tipo de IA de Microsoft?

Microsoft ciertamente hizo un espectáculo al inyectar a casi todos sus productos nuevos y antiguos la funcionalidad “Copilot”. Con discursos llamativos, demostraciones ingeniosas y, ahora, una clave de IA, la compañía está haciendo que su tecnología de IA destaque y apuesta por esto para impulsar la demanda.

La demanda no es algo seguro. Pero para ser justos. Algunos proveedores han logrado convertir los éxitos virales de la IA en éxitos. Mire OpenAI, el creador de ChatGPT, que supuestamente superó los 1.600 millones de dólares en ingresos anualizados a finales de 2023. La plataforma de arte generativo Midjourney aparentemente también es rentable, y aún no ha recibido ni un centavo de capital externo.

Enfásis en algunos, aunque. La mayoría de los proveedores, agobiados por los costos de capacitación y ejecución de modelos de inteligencia artificial de vanguardia, han tenido que buscar tramos de capital cada vez mayores para mantenerse a flote. Por ejemplo, se dice que Anthropic está recaudando 750 millones de dólares en una ronda que elevaría el total recaudado a más de 8 mil millones de dólares.

Microsoft, junto con sus socios de chips AMD e Intel, espera que el procesamiento de IA pase cada vez más de los costosos centros de datos al silicio local, mercantilizando la IA en el proceso, y bien podría tener razón. La nueva línea de chips de consumo de Intel incluye núcleos diseñados a medida para ejecutar IA. Además, los nuevos chips para centros de datos como el de Microsoft podrían hacer que el entrenamiento de modelos sea una tarea menos costosa de lo que es actualmente.

Pero no hay garantía. La verdadera prueba será ver si los usuarios de Windows y los clientes empresariales, bombardeados con lo que equivale a publicidad de Copilot, muestran apetito por la tecnología y pagan por ella. Si no lo hacen, puede que no pase mucho tiempo antes de que Microsoft tenga que rediseñar el teclado de Windows una vez más.

Aquí hay algunas otras historias destacadas de IA de los últimos días:

  • Copilot llega al móvil: En más noticias de Copilot, Microsoft silenciosamente trajo clientes de Copilot a Android e iOS, junto con iPadOS.
  • Tienda GPT: OpenAI anunció planes para lanzar una tienda de GPT, aplicaciones personalizadas basadas en sus modelos de IA generadores de texto (por ejemplo, GPT-4), dentro de la próxima semana. La Tienda GPT se anunció el año pasado durante la primera conferencia anual de desarrolladores de OpenAI, DevDay, pero se retrasó en diciembre, casi con certeza debido a la reestructuración de liderazgo que se produjo en noviembre, justo después del anuncio inicial.
  • OpenAI reduce el riesgo de registro: En otras noticias de OpenAI, la startup busca reducir su riesgo regulatorio en la UE canalizando gran parte de sus negocios en el extranjero a través de una entidad irlandesa. Natasha escribe que la medida reducirá la capacidad de algunos organismos de control de la privacidad del bloque para actuar unilateralmente ante las preocupaciones.
  • Robots de entrenamiento: El equipo DeepMind Robotics de Google está explorando formas de dar a los robots una mejor comprensión de exactamente qué es lo que los humanos queremos de ellos, escribe Brian. El nuevo sistema del equipo puede gestionar una flota de robots que trabajan en conjunto y sugerir tareas que pueden realizarse mediante el hardware de los robots.
  • La nueva empresa de Intel: Intel se está desmoronando una nueva empresa de plataforma, Articul8 AI, con el respaldo de DigitalBridge, gestor de activos e inversor con sede en Boca Ratón, Florida. Como explica un portavoz de Intel, la plataforma de Articul8 «ofrece capacidades de inteligencia artificial que mantienen los datos, la capacitación y la inferencia de los clientes dentro del perímetro de seguridad empresarial», una perspectiva atractiva para los clientes en industrias altamente reguladas como la atención médica y los servicios financieros.
  • Industria pesquera oscura, al descubierto: Las imágenes satelitales y el aprendizaje automático ofrecen una visión nueva y mucho más detallada de la industria marítima, específicamente del número y las actividades de los barcos pesqueros y de transporte en el mar. Resulta que hay forma más de lo que sugerirían los datos disponibles públicamente, un hecho revelado por una nueva investigación publicada en Nature por un equipo de Global Fishing Watch y varias universidades colaboradoras.
  • Búsqueda impulsada por IA: Perplexity AI, una plataforma que aplica IA a la búsqueda web, recaudó 73,6 millones de dólares en una ronda de financiación que valoró la empresa en 520 millones de dólares. A diferencia de los motores de búsqueda tradicionales, Perplexity ofrece una interfaz similar a un chatbot que permite a los usuarios hacer preguntas en lenguaje natural (por ejemplo, «¿Quemamos calorías mientras dormimos?», «¿Cuál es el país menos visitado?», etc.).
  • Notas clínicas, escritas automáticamente: En más noticias sobre financiación, la startup Nabla, con sede en París recaudó unos fantásticos 24 millones de dólares. La empresa, que tiene una asociación con el Grupo Médico Permanenteuna división del gigante sanitario estadounidense Kaiser Permanente, está trabajando en un “copiloto de IA” para médicos y otro personal clínico que toma notas y escribe informes médicos automáticamente.

Más aprendizajes automáticos

Quizás recuerde varios ejemplos de trabajos interesantes realizados durante el último año que implicaron realizar cambios menores en imágenes que hacen que los modelos de aprendizaje automático confundan, por ejemplo, la imagen de un perro con la imagen de un automóvil. Lo hacen añadiendo «perturbaciones», cambios menores en los píxeles de la imagen, en un patrón que sólo el modelo puede percibir. O al menos ellos pensamiento Sólo el modelo podía percibirlo.

Un experimento realizado por investigadores de Google DeepMind demostró que cuando se alteraba una imagen de flores para que pareciera más felina a la IA, era más probable que las personas describieran esa imagen como más felina a pesar de que definitivamente ya no se parecía a un gato. Lo mismo ocurre con otros objetos comunes como camiones y sillas.

Créditos de imagen: Google DeepMind

¿Por qué? ¿Cómo? Los investigadores realmente no lo saben, y todos los participantes sintieron que estaban eligiendo al azar (de hecho, la influencia, aunque confiable, apenas está por encima del azar). Parece que somos más perceptivos de lo que pensamos, pero esto también tiene implicaciones sobre la seguridad y otras medidas, ya que sugiere que las señales subliminales podrían propagarse a través de imágenes sin que nadie se dé cuenta.

Esta semana surgió del MIT otro experimento interesante que involucra la percepción humana, que utilizó el aprendizaje automático para ayudar a dilucidar un sistema particular de comprensión del lenguaje. Básicamente, algunas oraciones simples, como “Caminé hasta la playa”, apenas requieren capacidad cerebral para decodificarlas, mientras que otras complejas o confusas como “en cuyo sistema aristocrático se efectúa una revolución sombría” producen una activación mayor y más amplia, medida por resonancia magnética funcional.

El equipo comparó las lecturas de activación de humanos que leen una variedad de oraciones de este tipo con cómo las mismas oraciones activaron el equivalente de áreas corticales en un modelo de lenguaje grande. Luego hicieron un segundo modelo que aprendió cómo los dos patrones de activación se correspondían entre sí. Este modelo fue capaz de predecir, para oraciones novedosas, si afectarían la cognición humana o no. Puede que suene un poco arcano, pero definitivamente es súper interesante, créanme.

Aún es una cuestión abierta si el aprendizaje automático puede imitar la cognición humana en áreas más complejas, como la interacción con interfaces de computadora. Sin embargo, hay mucha investigación y siempre vale la pena echarle un vistazo. Esta semana tenemos SeeAct, un sistema de investigadores del estado de Ohio que funciona fundamentando laboriosamente las interpretaciones de un LLM sobre posibles acciones en ejemplos del mundo real.

Créditos de imagen: Universidad del Estado de Ohio

Básicamente, puede pedirle a un sistema como GPT-4V que cree una reserva en un sitio, y sabrá cuál es su tarea y que debe hacer clic en el botón «hacer reserva», pero realmente no sabe cómo hacerlo. . Al mejorar la forma en que percibe las interfaces con etiquetas explícitas y conocimiento del mundo, puede hacerlo mucho mejor, incluso si solo tiene éxito una fracción de las veces. Estos modelos de agentes tienen un largo camino por recorrer, ¡pero de todos modos se esperan muchas reclamaciones importantes este año! Acabo de escuchar algunos hoy.

A continuación, consulte esta interesante solución a un problema que no tenía idea de que existía pero que tiene mucho sentido. Los barcos autónomos son un área prometedora de automatización, pero cuando el mar está enojado es difícil asegurarse de que van por buen camino. El GPS y los giroscopios no son suficientes, y la visibilidad también puede ser mala, pero lo más importante es que los sistemas que los gobiernan no son demasiado sofisticados. Por lo tanto, pueden desviarse completamente del objetivo o desperdiciar combustible en grandes desvíos si no conocen nada mejor, un gran problema si estás usando la batería. ¡Ni siquiera había pensado en eso!

La Universidad Marítima y Oceánica de Corea (otra cosa que aprendí hoy) propone un modelo de búsqueda de rutas más poderoso basado en la simulación de movimientos de barcos en un modelo computacional de dinámica de fluidos. Proponen que esta mejor comprensión de la acción de las olas y su efecto sobre los cascos y la propulsión podría mejorar seriamente la eficiencia y seguridad del transporte marítimo autónomo. ¡Incluso podría tener sentido usarlo en embarcaciones guiadas por humanos cuyos capitanes no están muy seguros de cuál es el mejor ángulo de ataque para una borrasca u ola determinada!

Por último, si desea un buen resumen de los grandes avances en informática del año pasado, que en 2023 se superpusieron enormemente con la investigación de ML, consulte la excelente revisión de Quanta.



Source link-48