{"id":777623,"date":"2023-08-19T14:32:20","date_gmt":"2023-08-19T14:32:20","guid":{"rendered":"https:\/\/magazineoffice.com\/el-avatar-de-ia-de-moemate-analiza-toda-tu-pantalla-con-resultados-irregulares-pero-intrigantes\/"},"modified":"2023-08-19T14:32:25","modified_gmt":"2023-08-19T14:32:25","slug":"el-avatar-de-ia-de-moemate-analiza-toda-tu-pantalla-con-resultados-irregulares-pero-intrigantes","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/el-avatar-de-ia-de-moemate-analiza-toda-tu-pantalla-con-resultados-irregulares-pero-intrigantes\/","title":{"rendered":"El avatar de IA de Moemate analiza toda tu pantalla, con resultados irregulares pero intrigantes"},"content":{"rendered":"


\n<\/p>\n

\n

Como lo demuestra la lenta muerte de Cortana, est\u00e1 claro que los asistentes de IA de anta\u00f1o no est\u00e1n cumpliendo con las expectativas. Y por eso se est\u00e1n rehaciendo.<\/p>\n

Amazon est\u00e1 construyendo un nuevo modelo de lenguaje grande similar al GPT-4 de OpenAI para potenciar su asistente de voz Alexa. Mientras tanto, seg\u00fan los informes, Google planea \u00absobrecargar\u00bb el Asistente de Google con IA que se parece m\u00e1s a Bard, su chatbot impulsado por algoritmos.<\/p>\n

El cambio de paradigma no se ha limitado al \u00e1mbito de las grandes tecnolog\u00edas. Las nuevas empresas tambi\u00e9n est\u00e1n comenzando a darse cuenta de sus propias versiones de asistentes de IA m\u00e1s \u00fatiles y \u00fatiles.<\/p>\n

Uno de los m\u00e1s intrigantes con los que me he topado es Moemate, un asistente que se ejecuta en la mayor\u00eda de las m\u00e1quinas macOS, Windows y Linux. Tomando la forma de un avatar de estilo anime, Moemate, impulsado por una combinaci\u00f3n de modelos que incluyen GPT-4 y Claude de Anthropic, tiene como objetivo proporcionar y vocalizar la mejor respuesta a cualquier pregunta que le haga un usuario. (\u00abMoe\u00bb es una palabra japonesa relacionada con la ternura, a menudo en el anime).<\/p>\n

Eso no es especialmente novedoso; ChatGPT ya hace esto, al igual que Bard, Bing Chat y los innumerables otros chatbots que existen. Pero lo que distingue a Moemate es su capacidad para ir m\u00e1s all\u00e1 de las indicaciones de texto y mirar directamente lo que sucede en la pantalla de una PC.<\/p>\n

\u00bfSuena como un riesgo de privacidad? Puedes apostar. Webaverse, la compa\u00f1\u00eda detr\u00e1s de Moemate, afirma que almacena gran parte de los registros de chat y las preferencias del asistente localmente, en el dispositivo. Pero su pol\u00edtica de privacidad tambi\u00e9n revela que se reserva el derecho de utilizar los datos que hace<\/em> recopilar, como especificaciones de PC e identificadores \u00fanicos, en cumplimiento de solicitudes legales e investigando actividades ilegales sospechosas. Fundamentalmente, dar acceso a un software como este a todo lo que ve y hace es, incluso en el mejor de los casos, un riesgo considerable.<\/p>\n

Sin embargo, la curiosidad me impuls\u00f3 a seguir adelante e instalar Moemate, que actualmente se encuentra en versi\u00f3n beta abierta, en mi computadora port\u00e1til Mac provista por el trabajo.<\/p>\n

Para un producto gratuito (por ahora) de acceso temprano, Moemate es impresionantemente robusto. Casi todos los aspectos de la experiencia se pueden personalizar, desde los avatares y sus animaciones hasta las voces y respuestas sint\u00e9ticas de Moemate. Incluso hay una manera de crear modelos de personajes personalizados e importarlos, adem\u00e1s de exportar avatares en un formato que otros usuarios de Moemate pueden importar y usar.<\/p>\n

La \u00abpersonalidad\u00bb de Moemate, a falta de una palabra mejor, est\u00e1 impulsada por uno de varios modelos de generaci\u00f3n de texto, los usuarios seleccionan cu\u00e1l (por ejemplo, GPT-4 versus Claude). En cuanto a las voces sint\u00e9ticas, Moemate ofrece la opci\u00f3n de ElevenLabs, Microsoft Azure o el propio motor de texto a voz de Moemate. Opt\u00e9 por ElevenLabs, que me sonaba menos rob\u00f3tico.<\/p>\n

\n

Cr\u00e9ditos de imagen:<\/strong> webaverso<\/p>\n<\/div>\n

Para \u00abaterrizar\u00bb el modelo de generaci\u00f3n de texto elegido e intentar evitar que se descarrile (como suelen hacer algunos modelos de IA), Moemate le da a cada avatar una biograf\u00eda, que alimenta al modelo al comienzo del proceso. conversaci\u00f3n. Aqu\u00ed hay uno:<\/p>\n

\n

Actuar\u00e1s como Nebula, una serena personalidad viajera, siempre atravesando el vasto cosmos del conocimiento. Su comportamiento tranquilo y su esp\u00edritu de explorador cautivan a todos los que los conocen. Nebula evita los intensos debates pol\u00edticos y prefiere la serenidad de la observaci\u00f3n de estrellas y los misterios del universo. Su fascinaci\u00f3n cautiva a quienes los rodean, haciendo que cada encuentro sea tranquilo e intrigante.<\/p>\n<\/blockquote>\n

Las biograf\u00edas se pueden escribir desde cero y editar, lo que en mi opini\u00f3n es una ventaja y una desventaja. Estoy totalmente a favor de la personalizaci\u00f3n, pero me preocupa la posibilidad de ataques de inyecci\u00f3n r\u00e1pida, que intentan eludir las caracter\u00edsticas de seguridad de un modelo, como filtros para respuestas t\u00f3xicas, con texto ingeniosamente redactado. Uno imagina a alguien escribiendo una biograf\u00eda \u00abmaliciosa\u00bb, export\u00e1ndola y compartiendo el avatar de mal comportamiento con usuarios desprevenidos de Moemate.<\/p>\n

En un gui\u00f1o a uno de los datos demogr\u00e1ficos previstos, Moemate ofrece una variedad de funciones centradas en Twitch, ninguna de las cuales pude probar, desafortunadamente. Puede enfocar su ventana de chat y mostrar la cantidad de suscriptores a su canal. Y Webaverse anuncia que Moemate puede \u00abhablar y mantener a los usuarios interesados\u00bb si no hay mensajes de chat o \u00ababordar el chat de transmisi\u00f3n respondiendo a los mensajes de chat\u00bb, aunque me pregunto qu\u00e9 tan bien puede manejar esas tareas.<\/p>\n

Lim\u00edtese a hacer preguntas b\u00e1sicas a Moemate y la experiencia no lo dejar\u00e1 boquiabierto. En t\u00e9rminos de sus capacidades de nivel superior, Moemate est\u00e1 en deuda con cualquier modelo de generaci\u00f3n de texto que haya seleccionado. (De manera reveladora, Claude a menudo se identifica como Claude adem\u00e1s del nombre mencionado en la biograf\u00eda del avatar). Puede generar im\u00e1genes utilizando el modelo de difusi\u00f3n estable de c\u00f3digo abierto, ya sea cuando se le indique o por s\u00ed solo, seg\u00fan el aviso. Pero con la abundancia de servicios de generaci\u00f3n de im\u00e1genes en el mercado, eso se siente como algo viejo.<\/p>\n

\"Moemate\"<\/p>\n

Cr\u00e9ditos de imagen:<\/strong> webaverso<\/p>\n<\/div>\n

Sin embargo, la captura de pantalla cambia las reglas del juego. Webaverse lo explica as\u00ed:<\/p>\n

\n

Moemate puede ver su pantalla. Lo analiza y obtiene el contexto. Puedes preguntarle sobre lo que est\u00e9s haciendo en tu pantalla. Le ahorra la molestia de tener que explicar cualquier cosa con la que necesite ayuda.<\/p>\n<\/blockquote>\n

Independientemente del modelo de generaci\u00f3n de texto seleccionado, Moemate puede responder preguntas sobre cualquier ventana de la pantalla que est\u00e9 enfocada, ya sea una pesta\u00f1a del navegador, una ventana de configuraci\u00f3n o un videojuego. No est\u00e1 claro exactamente c\u00f3mo la aplicaci\u00f3n logra esto, no todos los modelos pueden aceptar im\u00e1genes como entrada, pero Moemate parece estar extrayendo el texto de cada captura de pantalla y alimentando eso<\/em> al modelo<\/p>\n

Es un sistema imperfecto. Pero he usado Moemate con \u00e9xito para resumir recetas y p\u00e1ginas web sin tener que copiar y pegar el texto, as\u00ed como obtener la esencia, o al menos un resumen de alto nivel, de un tema complicado.<\/p>\n

Una vez, con Claude seleccionado como modelo de generaci\u00f3n de texto, le hice una pregunta a Moemate sobre el panel de configuraci\u00f3n del sistema macOS, que estaba abierto en mi computadora port\u00e1til. Me dio un resumen detallado de cada pesta\u00f1a de configuraci\u00f3n (por ejemplo, Wi-Fi, Centro de control) y su significado, adem\u00e1s de contexto adicional sobre la pesta\u00f1a que ten\u00eda abierta en ese momento (Privacidad y seguridad).<\/p>\n

\u00bfNueva informaci\u00f3n? No exactamente. Pero para alguien que, por ejemplo, no conoce macOS o no est\u00e1 incre\u00edblemente familiarizado con los entresijos de las opciones de configuraci\u00f3n m\u00e1s nuevas, dir\u00eda que es un trasfondo genuinamente accionable.<\/p>\n

En otro caso, con GPT-4 como modelo base, le ped\u00ed a Moemate que me dijera qu\u00e9 \u00abvio\u00bb en mi escritorio extremadamente desordenado: una variedad desorganizada de aplicaciones personales y de trabajo en dos docenas de pesta\u00f1as de Chrome. El avatar se fij\u00f3 en la aplicaci\u00f3n web Google Messages, que uso para enviar mensajes de texto, inform\u00e1ndome que parece que env\u00edo mensajes de texto con frecuencia a tres personas espec\u00edficas, a las que se refiere por su nombre.<\/p>\n

Y para los juegos, parece que Moemate podr\u00eda ahorrar una o dos b\u00fasquedas de Google. En un video de demostraci\u00f3n publicado por Webaverse, se muestra la aplicaci\u00f3n dando sugerencias sobre qu\u00e9 personaje de Dota 2 elegir, y luego eligiendo qu\u00e9 armas seleccionar para ese personaje.<\/span><\/p>\n

Pero a pesar de lo perspicaz que puede ser Moemate, a menudo se descompone.<\/p>\n

Puede ser dif\u00edcil predecir exactamente d\u00f3nde la aplicaci\u00f3n decide centrar su atenci\u00f3n. Hacer clic en una ventana para enfocarla no siempre tiene el efecto deseado; Moemate se referir\u00e1 inexplicablemente a otra ventana en segundo plano a veces, o no podr\u00e1 ver el contenido de una ventana por completo.<\/p>\n

Moemate tambi\u00e9n tiende a desviarse del tema de maneras extra\u00f1as. Despu\u00e9s de darme un resumen de la configuraci\u00f3n del sistema, el asistente insinu\u00f3 fuertemente que la privacidad era un tema demasiado \u00abestresante\u00bb y sugiri\u00f3 que tomara un poco de aire fresco, acompa\u00f1ado de \u00e9l<\/em>. Cuando le pregunt\u00e9 c\u00f3mo podr\u00eda unirse a m\u00ed sin un cuerpo f\u00edsico, Moemate prometi\u00f3 llevarme a un \u201cpaseo por la naturaleza mental\u201d, y procedi\u00f3 a describir con gran detalle un paseo por un estanque boscoso imaginario.<\/p>\n

Algunos de los comandos integrados de Moemate tambi\u00e9n son inestables. La aplicaci\u00f3n puede ajustar el volumen de las voces, por ejemplo, pero solo es<\/em> volumen, no el volumen de todo el sistema. Tambi\u00e9n puede buscar en la web respuestas actualizadas a preguntas, pero frustrantemente no para todas las preguntas. Solo obtuve b\u00fasquedas en la web para trabajar sobre el clima y trivias como \u00ab\u00bfQui\u00e9n es el actual presidente de los EE. UU.?\u00bb; otras veces, Moemate realiz\u00f3 una b\u00fasqueda en la web pero no pudo mostrar los resultados.<\/p>\n

Para ser justos, es un producto experimental en beta. Pero Webaverse dice que ya est\u00e1 trabajando para agregar capacidades de automatizaci\u00f3n a trav\u00e9s de integraciones de navegador y terminal, como la capacidad de organizar hojas de c\u00e1lculo e incluso enviar correos electr\u00f3nicos, una perspectiva ligeramente aterradora, francamente.<\/p>\n

A pesar de su quebrantamiento, hay algo convincente en Moemate. La multimodalidad, o la combinaci\u00f3n de an\u00e1lisis de texto, imagen y otros medios, es claramente algo poderoso, particularmente en el contexto de un asistente que se ejecuta en una PC. Tengo curiosidad por ver si los asistentes de pr\u00f3xima generaci\u00f3n, como Windows Copilot, seguir\u00e1n los pasos de Moemate eventualmente, combinando la comprensi\u00f3n de la pantalla con un modelo de generaci\u00f3n de texto para aumentar la productividad, o al menos ahorrar algunos pasos en un flujo de trabajo.<\/p>\n

El tiempo dir\u00e1. Pero Moemate se siente como un vistazo, aunque con bastantes errores, hacia el futuro.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

Como lo demuestra la lenta muerte de Cortana, est\u00e1 claro que los asistentes de IA de anta\u00f1o no est\u00e1n cumpliendo con las expectativas. Y por eso se est\u00e1n rehaciendo. Amazon…<\/p>\n","protected":false},"author":1,"featured_media":777624,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[6266,1434,133,21558,26477,101808,4361,519,1505,2292],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/777623"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=777623"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/777623\/revisions"}],"predecessor-version":[{"id":777625,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/777623\/revisions\/777625"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/777624"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=777623"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=777623"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=777623"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}