ChatGPT inició un nuevo tipo de carrera de IA e hizo que los cuadros de texto volvieran a ser geniales


Es bastante obvio que nadie vio venir ChatGPT. Ni siquiera OpenAI. Antes de convertirse, según algunas medidas, en la aplicación de consumo de más rápido crecimiento en la historia, antes de convertir la frase «transformadores preentrenados generativos» en lenguaje vernáculo común, antes de que cada empresa que se pueda imaginar se apresurara a adoptar su modelo subyacente, ChatGPT se lanzó en noviembre como una «vista previa de la investigación».

El publicación de blog que anuncia ChatGPT es ahora un estudio de caso hilarante en la venta a precios bajos. “ChatGPT es un modelo hermano de InstructGPT, que está capacitado para seguir una instrucción en un aviso y proporcionar una respuesta detallada. Estamos entusiasmados de presentar ChatGPT para obtener comentarios de los usuarios y conocer sus fortalezas y debilidades”. ¡Eso es todo! ¡Ese es todo el campo! Nada de volverse poético sobre cambiar fundamentalmente la naturaleza de nuestras interacciones con la tecnología, ni siquiera una línea sobre lo genial que es. Era solo una vista previa de la investigación.

Pero ahora, apenas cuatro meses después, parece que ChatGPT realmente va a cambiar nuestra forma de pensar sobre la tecnología. O, tal vez con mayor precisión, volver a cambiarlo. Debido a la forma en que vamos, el futuro de la tecnología no son las interfaces geniales o el metaverso. Es «escribir comandos en un cuadro de texto en su computadora». La línea de comandos está de vuelta, ahora es mucho más inteligente.

Realmente, la IA generativa se dirige en dos direcciones simultáneas. La primera es mucho más infraestructural, ya que agrega nuevas herramientas y capacidades a las que ya usa. Los modelos de lenguaje grande como GPT-4 y LaMDA de Google lo ayudarán a escribir correos electrónicos y memorandos; van a arreglar automáticamente sus conjuntos de diapositivas y corregir cualquier error en sus hojas de cálculo; van a editar tus fotos mejor que tú; lo ayudarán a escribir código y, en muchos casos, lo harán por usted.

Este es más o menos el camino que la IA ha seguido durante años, ¿verdad? Google ha estado integrando todo tipo de IA en sus productos durante los últimos años, e incluso empresas como Salesforce han desarrollado sólidos proyectos de investigación de IA. Estos modelos son costosos de crear, costosos de capacitar, costosos de consultar y potencialmente revolucionarios para la productividad corporativa. Las mejoras de IA en los productos que ya usa son un gran negocio, o, al menos, se está invirtiendo como tal, y lo serán durante mucho tiempo.

La otra dirección de la IA, aquella en la que la interacción con la IA se convierte en un producto de consumo, fue un desarrollo mucho menos obvio. Tiene sentido ahora, por supuesto: ¿quién no ¿Quieres hablar con un robot que sabe todo sobre películas y recetas y qué hacer en Tokio, y si digo lo correcto podría descarrilarse por completo e intentar besarse contigo? Pero antes de que ChatGPT tomara el mundo por sorpresa, y antes de que Bing y Bard tomaran la idea y trataran de crear sus propios productos a partir de ella, ciertamente no habría apostado a que escribir en una ventana de chat sería la próxima gran cosa en el usuario. interfaces

En cierto modo, esto es un regreso a una idea muy antigua.

En cierto modo, se trata de un retorno a una idea muy antigua. Durante muchos años, la mayoría de los usuarios solo interactuaba con las computadoras escribiendo en una pantalla en blanco: la línea de comando era cómo le decías a la máquina qué hacer. (Sí, ChatGPT es un lote de máquinas, y no están justo ahí en su escritorio, pero entiende la idea).

Pero luego sucedió algo divertido: ¡inventamos mejores interfaces! El problema con la línea de comandos era que necesitaba saber exactamente qué escribir y en qué orden hacer que la computadora se comportara. Señalar y hacer clic en íconos grandes era mucho más simple, además era mucho más fácil enseñar a las personas lo que la computadora podía hacer a través de imágenes e íconos. La línea de comandos dio paso a la interfaz gráfica de usuario, y la GUI sigue reinando.

Sin embargo, los desarrolladores nunca dejaron de intentar que la interfaz de usuario del chat funcionara. WhatsApp es un buen ejemplo: la empresa lleva años tratando de averiguar cómo los usuarios pueden usar el chat para interactuar con las empresas. Allo, una de las muchas aplicaciones de mensajería fallidas de Google, esperaba que pudieras interactuar con un asistente de inteligencia artificial dentro de los chats con tus amigos. El primera ronda de bombo chatbotalrededor de 2016, tenía muchos gente muy inteligente pensando que las aplicaciones de mensajería eran las futuro de todo.

Hay algo atractivo en la interfaz de mensajería, la «IA conversacional». Comienza con el hecho de que todos sabemos cómo usarlo; Las aplicaciones de mensajería son la forma en que nos mantenemos en contacto con las personas que más nos importan, lo que significa que son un lugar donde pasamos mucho tiempo y energía. Es posible que no sepa cómo navegar por los recesos de la aplicación Uber o cómo encontrar su número de viajero frecuente en la aplicación de Southwest, pero «envíe estas palabras a este número» es un comportamiento que casi todos entienden. En un mercado en el que la gente no quiere descargar aplicaciones y los sitios web móviles en su mayoría todavía apestan, la mensajería puede simplificar las experiencias en gran medida.

a: pasar el cursor]: texto-gris-63 [&>a:hover]:sombra-subrayado-negro oscuro:[&>a:hover]:texto-gris-bd oscuro:[&>a:hover]:sombra-subrayado-gris [&>a]:sombra-subrayado-gris-63 oscuro:[&>a]:texto-gris-bd oscuro:[&>a]:shadow-underline-gray»>Imagen: Microsoft

Además, aunque la mensajería no es la interfaz más avanzada, podría ser la más ampliable. Tome Slack, por ejemplo: probablemente piense en él como una aplicación de chat, pero en esa interfaz de ida y vuelta, puede incrustar enlaces, documentos editables, encuestas interactivas, bots informativos y mucho más. WeChat es una plataforma completa, básicamente una Internet completa, integrada en una aplicación de mensajería. Puede comenzar con mensajes e ir a muchos lugares.

Pero muchas de estas herramientas tropiezan de la misma manera. Para intercambios rápidos de información, como el horario comercial, el chat es perfecto: haga una pregunta y obtenga una respuesta. ¿Pero navegar por un catálogo como una serie de mensajes? No, gracias. ¿Comprar un billete de avión con mil mensajes de ida y vuelta? pase duro. No es diferente a los asistentes de voz, y Dios te ayude si alguna vez has intentado comprar cosas simples con Alexa. (“Para Charmin, diga ‘tres’”) Para las cosas más complicadas, una interfaz de usuario visual y dedicada es mucho mejor que una ventana de mensajería.

Y cuando se trata de ChatGPT, Bard, Bing y el resto, las cosas se complican muy rápido. Estos modelos son inteligentes y colaborativos, pero aún debe saber exactamente qué pedir, de qué manera y en qué orden para obtener lo que desea. La idea de un “ingeniero rápido”, la persona a la que le pagas para saber exactamente cómo obtener la imagen perfecta de Stable Diffusion o hacer que ChatGPT genere el Javascript correcto, parece ridículo, pero en realidad es una parte absolutamente necesaria de la ecuación. No es diferente a la era de las primeras computadoras cuando solo unas pocas personas sabían cómo decirle a la computadora qué hacer. Ya existen mercados en los que puedes comprar y vender avisos realmente geniales; hay gurús de las indicaciones y libros sobre indicaciones; Asumo que Stanford ya está trabajando en una especialización en Ingeniería Inmediata que todos tomarán pronto.

Lo notable de la IA generativa es que parece que puede hacer casi cualquier cosa. Ese es también todo el problema. Cuando puedes hacer cualquier cosa, ¿qué haces? ¿Por dónde empiezas? ¿Cómo aprende a usarlo cuando su única ventana a sus posibilidades es un cursor parpadeante? Eventualmente, estas empresas podrían desarrollar herramientas más visuales e interactivas que ayuden a las personas a comprender realmente lo que pueden hacer y cómo funciona todo. (Esta es una razón para mantener un ojo en ChatGPT’s nuevo sistema de complementosque es bastante sencillo por ahora, pero podría expandir rápidamente las cosas que puede hacer en la ventana de chat). En este momento, la mejor idea que cualquiera de ellos tiene es ofrecer algunas sugerencias sobre las cosas que puede escribir.

AI iba a ser una característica. Ahora es el producto. Y eso significa que el cuadro de texto está de vuelta. La mensajería es la interfaz, de nuevo.



Source link-37