Microsoft apostó fuerte por la IA en 2023, pero su futuro aún no está claro


Cada vez que Microsoft lanzó una característica importante de IA este año, no pude evitar sentirme más escéptico sobre la nueva dirección de la compañía. Aquí está Microsoft, un gigante notoriamente conservador y de lento movimiento, remodelando sus productos en torno a la inteligencia artificial poco después de que la mayoría de la gente supiera que existía la IA generativa. La última vez que hizo un cambio tan dramático obtuvimos Windows 8, un intento fallido de hacer que su sistema operativo estrella sea compatible con tabletas y pantallas táctiles.

Ahora, la compañía está llevando la IA directamente al corazón de Windows y me pregunto: ¿Microsoft está saltando a la inteligencia artificial para mejorar sus productos? ¿O simplemente está tratando de reivindicarse como innovador en IA y rezar para que la tecnología realmente esté a la altura de las expectativas? En este punto, es realmente difícil saberlo.

Como han demostrado Zune, WebTV y Windows Phone, Microsoft no es tan bueno a la hora de sincronizar. Sus productos a menudo llegan demasiado pronto para ser útiles (como en el caso del lento WebTV) o llegan demasiado tarde para causar impacto (como el genuinamente fantástico Zune HD). Pero cuando la compañía presentó su Bing Chat impulsado por inteligencia artificial a principios de este año, estaba perfectamente posicionada para aprovechar el éxito de ChatGPT, que para entonces supuestamente había alcanzado los 100 millones de usuarios en solo dos meses. Según los analistas de UBS, eso habría convertido a ChatGPT en la aplicación de consumo de más rápido crecimiento de la historia. ¿Qué mejor momento para combinar el poder de la IA generativa con uno de sus productos notoriamente asediados? Microsoft no tenía nada que perder.

SAN FRANCISCO, CALIFORNIA - 6 DE NOVIEMBRE: El director ejecutivo de Microsoft, Satya Nadella (R), habla mientras el director ejecutivo de OpenAI, Sam Altman (izq.), observa durante el evento OpenAI DevDay el 6 de noviembre de 2023 en San Francisco, California.  Altman pronunció el discurso de apertura en la primera conferencia Open AI DevDay.  (Foto de Justin Sullivan/Getty Images)

El director ejecutivo de OpenAI, Sam Altman, y el director ejecutivo de Microsoft, Satya Nadella, en el primer OpenAI DevDay en noviembre de 2023. (Justin Sullivan vía Getty Images)

Después de invertir un total de 13 mil millones de dólares en OpenAI, fabricante de ChatGPT (y adquirir una participación del 49 por ciento en el proceso), Microsoft probablemente estaba ansioso por mostrar su nuevo y brillante juguete delante de Google y otros. La introducción de Bing Chat inició oficialmente el año de la IA de Microsoft: Copilot se lanzó en Edge, productos de Microsoft 365 como Word y Powerpoint y finalmente llegó a Windows 11. Aún más sorprendente, la compañía anunció recientemente que Copilot llegará a Windows 10. una señal de que quiere funciones de IA frente a la mayor cantidad de personas posible. (Según se informa, Windows 11 representa el 26 por ciento de las instalaciones de Windows, mientras que Windows 10 todavía tiene el 69 por ciento. Al apuntar a ambas plataformas, Copilot podría llegar potencialmente a hasta 1.400 millones de usuarios).

No hay duda de que Copilot causa una excelente primera impresión. Escriba algunas palabras (o dígalas en voz alta) y regresará con respuestas directas a sus preguntas, como un asistente inteligente. No hay anuncios que recorrer y solo tiene que interactuar con enlaces adicionales si lo desea. Es un vistazo a un mundo más allá de los motores de búsqueda, un mundo en el que la IA podría ayudarnos a guiarnos a través de un panorama mediático cada vez más caótico. Los copilotos de Microsoft también pueden ayudar en aplicaciones específicas: en Edge pueden resumir la página web que estás viendo; puede ayudar a transcribir y generar puntos de acción en Teams Meetings; y puede ayudar a descubrir configuraciones difíciles de encontrar en Windows (por ejemplo, puede simplemente escribir «¿Cómo activo el modo nocturno?» para activarlo).

Pero la apariencia de confianza de Copilot oculta el hecho de que a menudo comete errores y, en ocasiones, puede malinterpretar por completo sus preguntas. Tiene mucha menos capacidad de respuesta que usar un motor de búsqueda típico, ya que hay mucho procesamiento opaco de IA en segundo plano. Y en mis pruebas, también falla con más frecuencia de lo que piensas, lo que requiere un «reinicio» de tu sesión (pero al menos no muestra una pantalla azul como Windows).

Copiloto de Windows 11Copiloto de Windows 11

microsoft

En un esfuerzo por moderar nuestras expectativas, Microsoft tiene una nota útil estampada en la parte superior del chat de IA de Bing: «Bing funciona con IA, por lo que es posible que haya sorpresas y errores. ¡Comparta sus comentarios para que podamos mejorar!» Microsoft parece mostrar un poco de humildad aquí al reconocer que su chat de IA no es perfecto y está tratando de ganar algunos puntos diciendo que está escuchando sus comentarios. Sin embargo, esa advertencia sirve principalmente como una salida para Microsoft. Puede promocionar la capacidad de Copilot para escribir ensayos y mantener conversaciones vagamente realistas, pero en el momento en que se equivoca, la compañía puede simplemente decir: «¡Es solo una versión beta, jajaja!»

La gran prueba para los copilotos de Microsoft y otras herramientas de inteligencia artificial generativa se reduce a una cosa: la confianza. ¿Puede un usuario confiar en que le brindará la información relevante cuando haga una pregunta? ¿Podemos estar seguros de que Copilow comprenderá nuestra consulta correctamente? Aaron Woodman, vicepresidente de marketing de Windows de Microsoft, nos dice que, en última instancia, la confianza se reducirá a que los usuarios «pateen los neumáticos» por sí mismos y vean qué tan bien se desempeña Copilot. «Creo que ese tipo de crecimiento orgánico es uno que veremos con el tiempo», dijo en una entrevista con Engadget en el lanzamiento de Windows Copilot en septiembre. «Y apuesto a que será explosivo porque el valor está ahí, y creo que los clientes lo verán muy rápidamente».

Icono de la barra de tareas de Windows CopilotIcono de la barra de tareas de Windows Copilot

microsoft

Woodman también cree que los usuarios comprenderán que Copilot no siempre será perfecto, especialmente durante estos primeros días. «Curiosamente creo que probablemente somos más empáticos con las personas y entendemos dónde se encuentran con el crecimiento que con la tecnología», dijo. «Creo que lo mejor que podemos hacer es reconocerlo honestamente, ser transparentes al respecto. En algún nivel, en cada conversación en la que participamos, intentamos apoyarnos en [that] Este es un proceso de crecimiento. Queremos asegurarnos de que comprenda los materiales de referencia. Creo que la gente entenderá que estamos intentando acelerar la incorporación [new] tecnología para ellos.»

He estado usando las soluciones de inteligencia artificial de Microsoft desde que se lanzó Bing Chat a principios de este año y, si bien es útil para tareas simples, como crear una tabla de especificaciones que compara dos productos, no ha cambiado exactamente mi forma de trabajar. Microsoft también tuvo que restringir seriamente las capacidades de Bing Chat desde el principio después de que comenzó a discutir con los usuarios y a emitir respuestas inquietantes. En Windows 11, Copilot a veces puede ayudarme a encontrar configuraciones como el modo oscuro, pero no siempre puede abrir los controles dentro del panel de Copilot y, a veces, simplemente me envía a los menús de configuración general si no puede entender lo que estoy haciendo. Estoy pidiendo.

Más recientemente, tuve conversaciones decepcionantes con Bing cuando le pregunté si era un buen momento para comprar un Nintendo Switch (fue necesario un poco de presión para que surgieran rumores de un posible seguimiento de Switch el próximo año), y su La capacidad de responder preguntas sobre imágenes es aún menos útil que la búsqueda de imágenes de Google.

Cuando tomé una foto del monitor para bebés de mi hijo y pregunté «¿Qué es esto?», Bing conocía su función, pero se equivocó en el modelo y el fabricante reales. Esa consulta también tardó cinco segundos en completarse. La búsqueda de imágenes de Google tardó medio segundo y lo identificó correctamente como Eufy Space Monitor. Obtenga uno para la búsqueda tradicional (y sí, sé que también funciona con su propio conjunto de modelos de visión por computadora).

Windows Copilot eligiendo música en SpotifyWindows Copilot eligiendo música en Spotify

microsoft

Podemos considerar el Github Copilot de Microsoft, que se lanzó en noviembre de 2021, como una forma en que los usuarios pueden aprender a trabajar con IA. Está destinado principalmente a servir como socio junto con un programador experimentado: buscará problemas potenciales e incluso puede generar código simple.

Según el desarrollador Aidan Tilgner, Github Copilot puede ser realmente útil para los programadores, siempre que mantenga sus expectativas bajo control. En el artículo «Programación de pares de IA de GitHub Copilot: ¿activo o pasivo?» Los autores Arghavan Moradi Dakhel, Vahid Majdinasab, Amin Nikanjam, Foutse Khomh, Michel C.Desmarais y Zhen Ming Jiang encontraron que Github Copilot es igualmente útil, pero tengan en cuenta que «también puede convertirse en un inconveniente si lo utilizan principiantes, aquellos que tal vez no estén familiarizado con el contexto del problema y los métodos de codificación correctos.»

«Copilot sugiere soluciones que pueden tener errores y ser difíciles de entender, que los principiantes pueden aceptar como soluciones correctas», añaden los autores. «Agregar un código tan complejo y con errores a proyectos de software puede afectar enormemente su calidad».

Al apoyarse tanto en los copilotos en el futuro, es posible que Microsoft también se esté vinculando demasiado a OpenAI, una empresa joven que recientemente atravesó uno de los fines de semana más volátiles en la historia de Silicon Valley. La junta directiva de OpenAI despidió al director ejecutivo Sam Altman, pero después de una cantidad significativa de presión interna (y algunos engatusamientos del director ejecutivo de Microsoft, Satya Nadella), finalmente lo volvió a contratar unos días después. Si OpenAI atraviesa otro evento tumultuoso, no solo estará en peligro la inversión de $ 13 mil millones de Microsoft: serán los planes futuros de la compañía para prácticamente todos sus productos.

De acuerdo a Centro de Windows, la próxima actualización importante de Windows de Microsoft, “Hudson Valley”, puede llegar el próximo año con una serie de mejoras de IA. Eso incluye la capacidad de analizar el contenido que se muestra en los chats de video, un Copilot mejorado que puede recordar todo lo que ha hecho en su PC y una mejor búsqueda en todo el sistema. Algunas funciones también pueden requerir CPU con NPU, como el último lote de chips de AMD y el nuevo hardware Core Ultra de Intel. Esto es similar a las características de Windows Studio Effects, como el desenfoque del fondo y el encuadre automático, que también requieren NPU.

La única constante en torno a la IA en estos días es que todo está cambiando rápidamente. Desde que comencé a escribir este artículo, Microsoft anunció que Copilot se actualizaría con los modelos más potentes GPT-4 Turbo y Dall-E 3, lo que los hará aún más capaces. Quizás Microsoft y OpenAI eventualmente puedan solucionar todos los problemas que he visto con Copilot hasta ahora y, en última instancia, ofrecer una herramienta de IA transformadora que esté fácilmente disponible para todos. Pero también esperaba lo mejor en lo que respecta a los planes Duo y Neo de pantalla dual de la compañía, y todo lo que obtuve a cambio fue decepción.

Este artículo contiene enlaces de afiliados; Si hace clic en dicho enlace y realiza una compra, podemos ganar una comisión.



Source link-47