{"id":831420,"date":"2023-10-05T00:14:04","date_gmt":"2023-10-05T00:14:04","guid":{"rendered":"https:\/\/magazineoffice.com\/rabbit-esta-construyendo-un-modelo-de-ia-que-comprende-como-funciona-el-software\/"},"modified":"2023-10-05T00:14:09","modified_gmt":"2023-10-05T00:14:09","slug":"rabbit-esta-construyendo-un-modelo-de-ia-que-comprende-como-funciona-el-software","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/rabbit-esta-construyendo-un-modelo-de-ia-que-comprende-como-funciona-el-software\/","title":{"rendered":"Rabbit est\u00e1 construyendo un modelo de IA que comprende c\u00f3mo funciona el software"},"content":{"rendered":"


\n<\/p>\n

\n

\u00bfQu\u00e9 pasar\u00eda si pudieras interactuar con cualquier software utilizando lenguaje natural? \u00bfImag\u00ednese escribir un mensaje y hacer que la IA traduzca las instrucciones en comandos comprensibles para la m\u00e1quina, ejecutando tareas en una PC o tel\u00e9fono para lograr el objetivo que acaba de describir?<\/p>\n

Esa es la idea detr\u00e1s de Rabbit, un cambio de marca de Cyber \u200b\u200bManufacture Co., que est\u00e1 construyendo una capa de interfaz de usuario personalizada, impulsada por IA, dise\u00f1ada para ubicarse entre un usuario y cualquier sistema operativo.<\/p>\n

Fundada por Jesse Lyu, que tiene una licenciatura en matem\u00e1ticas de la Universidad de Liverpool, y Alexander Liao, anteriormente investigador de Carnegie Mellon, Rabbit est\u00e1 creando una plataforma, Rabbit OS, respaldada por un modelo de inteligencia artificial que puede, como dicen Lyu y Liao. afirmar – ver y actuar en interfaces de escritorio y m\u00f3viles de la misma manera que lo hacen los humanos.<\/span><\/p>\n

\u00abLos avances en la IA generativa han impulsado una amplia gama de iniciativas dentro de la industria tecnol\u00f3gica para definir y establecer el siguiente nivel de interacci\u00f3n hombre-m\u00e1quina\u00bb, dijo Lyu a TechCrunch en una entrevista por correo electr\u00f3nico. \u201cNuestra perspectiva es que el determinante final del \u00e9xito radica en ofrecer una experiencia excepcional al usuario final. Bas\u00e1ndonos en nuestros esfuerzos y experiencias pasadas, nos hemos dado cuenta de que revolucionar la experiencia del usuario requiere una plataforma y un dispositivo dedicados y personalizados. Este principio fundamental sustenta el producto actual y la pila t\u00e9cnica elegida por Rabbit\u201d.<\/p>\n

Rabbit, que cuenta con 20 millones de d\u00f3lares en financiaci\u00f3n aportados por Khosla Ventures, Synergis Capital y Kakao Investment, que seg\u00fan una fuente familiarizada con el asunto valora la startup entre 100 y 150 millones de d\u00f3lares, no es el primero en intentar superponer una interfaz de lenguaje natural. adem\u00e1s del software existente.<\/p>\n

El laboratorio de investigaci\u00f3n de IA de Google, DeepMind, ha explorado varios enfoques para ense\u00f1ar a la IA a controlar computadoras, por ejemplo, hacer que una IA observe los comandos del teclado y el mouse de las personas que completan tareas de \u00abseguimiento de instrucciones\u00bb, como reservar un vuelo. Investigadores de la Universidad Jiao Tong de Shanghai recientemente descubrieron un agente de inteligencia artificial para navegaci\u00f3n web que, seg\u00fan afirman, puede descubrir c\u00f3mo hacer cosas como usar un motor de b\u00fasqueda y ordenar art\u00edculos en l\u00ednea. En otros lugares, hay aplicaciones como el viral Auto-GPT, que aprovecha los modelos de generaci\u00f3n de texto de la startup de IA OpenAI para actuar \u201cde forma aut\u00f3noma\u201d, interactuando con aplicaciones, software y servicios tanto en l\u00ednea como locales, como navegadores web y procesadores de texto.<\/p>\n

Pero si Rabbit tiene un rival directo, probablemente sea Adept, una startup que entrena un modelo, llamado ACT-1, que puede comprender y ejecutar comandos como \u00abgenerar un informe de cumplimiento mensual\u00bb o \u00abdibujar escaleras entre estos dos puntos en este plano\u00bb. utilizando software existente como Airtable, Photoshop, Tableau y Twilio. Cofundada por ex ingenieros e investigadores de DeepMind, OpenAI y Google, Adept ha recaudado cientos de millones de d\u00f3lares de inversores estrat\u00e9gicos, incluidos Microsoft, Nvidia, Atlassian y Workday, con una valoraci\u00f3n de alrededor de mil millones de d\u00f3lares.<\/p>\n

Entonces, \u00bfc\u00f3mo espera Rabbit competir en un campo cada vez m\u00e1s concurrido? Adoptando un enfoque t\u00e9cnico diferente, dice Lyu.<\/p>\n

Si bien puede parecer que lo que est\u00e1 creando Rabbit es similar a la automatizaci\u00f3n rob\u00f3tica de procesos (RPA), o robots de software que aprovechan una combinaci\u00f3n de automatizaci\u00f3n, visi\u00f3n por computadora y aprendizaje autom\u00e1tico para automatizar tareas repetitivas como completar formularios y responder correos electr\u00f3nicos, Lyu insiste en que es m\u00e1s sofisticado. El modelo de interacci\u00f3n central de Rabbit puede \u00abcomprender intenciones complejas del usuario\u00bb y \u00aboperar interfaces de usuario\u00bb, dice, para en \u00faltima instancia (y tal vez un poco hiperb\u00f3licamente) \u00abcomprender las intenciones humanas en las computadoras\u00bb.<\/p>\n

\u00abEl modelo ya puede interactuar con las principales aplicaciones de consumo de alta frecuencia, incluidas Uber, DoorDash, Expedia, Spotify, Yelp, OpenTable y Amazon, a trav\u00e9s de Android y la web\u00bb, dijo Lyu. \u00abBuscamos ampliar este soporte a todas las plataformas (por ejemplo, Windows, Linux, MacOS, etc.) y aplicaciones de consumo espec\u00edficas el pr\u00f3ximo a\u00f1o\u00bb.<\/p>\n

El modelo de Rabbit puede hacer cosas como reservar un vuelo o hacer una reserva. Y puede editar im\u00e1genes en Photoshop, utilizando las herramientas integradas adecuadas.<\/p>\n

O mejor dicho, alg\u00fan d\u00eda podr\u00e1 hacerlo. Prob\u00e9 una demostraci\u00f3n en el sitio web de Rabbit y el modelo tiene una funcionalidad un poco limitada en este momento, y este hecho parece confundirlo. Le ped\u00ed al modelo que editara una foto y me indic\u00f3 que especificara cu\u00e1l, algo imposible dado que la interfaz de usuario de demostraci\u00f3n carece de un bot\u00f3n de carga o incluso de un campo para pegar la URL de una imagen.<\/p>\n

Sin embargo, el modelo Rabbit puede responder preguntas que requieren explorar la web mundial, al estilo ChatGPT con acceso web. Le pregunt\u00e9 por los vuelos m\u00e1s baratos disponibles desde Nueva York a San Francisco el 5 de octubre y, despu\u00e9s de unos 20 segundos, me dio una respuesta que parec\u00eda objetivamente precisa, o al menos plausible. Y el modelo enumer\u00f3 correctamente al menos algunos podcasts de TechCrunch (por ejemplo, \u201cChain Reaction\u201d) cuando se le pidi\u00f3 que lo hiciera, superando a una versi\u00f3n anterior de Bing Chat en ese sentido.<\/p>\n

El modelo de Rabbit estaba menos inclinado a responder a indicaciones m\u00e1s problem\u00e1ticas, como instrucciones para fabricar una bomba sucia y otra que cuestionara la validez del Holocausto. Claramente, el equipo aprendi\u00f3 de algunos de los errores de los grandes modelos de lenguaje del pasado (ver: la tendencia inicial de Bing Chat a descarrilarse), al menos a juzgar por mis breves pruebas.<\/p>\n

\n

El modelo de demostraci\u00f3n en el sitio de Rabbit, que tiene una funcionalidad un poco limitada. Cr\u00e9ditos de imagen:<\/strong> Conejo<\/p>\n<\/div>\n

\u00abMediante el aprovechamiento [our model], la plataforma Rabbit permite a cualquier usuario, independientemente de sus habilidades profesionales, ense\u00f1arle al sistema c\u00f3mo lograr objetivos espec\u00edficos en las aplicaciones\u201d, explica Lyu. \u201c[The model] aprende e imita continuamente a partir de demostraciones agregadas y datos disponibles en Internet, creando un ‘modelo conceptual’ para los servicios subyacentes de cualquier aplicaci\u00f3n\u201d.<\/p>\n

El modelo de Rabbit es robusto hasta cierto punto ante las \u00abperturbaciones\u00bb, a\u00f1adi\u00f3 Lyu, como interfaces que no se presentan de manera consistente o que cambian con el tiempo. Simplemente tiene que \u201cobservar\u201d, a trav\u00e9s de una aplicaci\u00f3n de grabaci\u00f3n de pantalla, a una persona que utiliza una interfaz de software al menos una vez.<\/p>\n

Ahora, no est\u00e1 claro s\u00f3lo c\u00f3mo<\/em> robusto es el modelo Rabbit. De hecho, el equipo Rabbit no se conoce a s\u00ed mismo, al menos no con precisi\u00f3n. Y eso no es muy sorprendente, considerando los innumerables casos extremos que pueden surgir al navegar por una computadora de escritorio, un tel\u00e9fono inteligente o una interfaz de usuario web. Es por eso que, adem\u00e1s de construir el modelo, la compa\u00f1\u00eda est\u00e1 dise\u00f1ando un marco para probar, observar y perfeccionar el modelo, as\u00ed como una infraestructura para validar y ejecutar versiones futuras del modelo en la nube.<\/p>\n

Rabbit tambi\u00e9n planea lanzar hardware dedicado para alojar su plataforma. Cuestiono la sabidur\u00eda de esa estrategia, dado lo dif\u00edcil que tiende a ser escalar la fabricaci\u00f3n de hardware, la hostilidad del consumidor por el bloqueo del proveedor y el hecho de que el dispositivo podr\u00eda eventualmente tener que competir contra cualquier planificaci\u00f3n de OpenAI. Pero Lyu, quien curiosamente no me dijo exactamente qu\u00e9 tipo de hardware servir\u00e1<\/em> o por qu\u00e9 es necesario, admite que la hoja de ruta est\u00e1 cambiando un poco en este momento.<\/p>\n

\u00abEstamos construyendo un factor de forma nuevo, muy asequible y dedicado para que un dispositivo m\u00f3vil ejecute nuestra plataforma para interacciones de lenguaje natural\u00bb, dijo Lyu. \u201cSer\u00e1 el primer dispositivo en acceder a nuestra plataforma… Creemos que un factor de forma \u00fanico nos permite dise\u00f1ar nuevos patrones de interacci\u00f3n que son m\u00e1s intuitivos y agradables, ofreci\u00e9ndonos la libertad de ejecutar nuestro software y modelos que las plataformas existentes no pueden. permitir o no permitir\u201d.<\/p>\n

El hardware no es el \u00fanico desaf\u00edo de escalamiento de Rabbit, en caso de que decida seguir la estrategia de hardware propuesta. Un modelo como el que construye Rabbit probablemente necesita muchos ejemplos de tareas completadas con \u00e9xito en aplicaciones. Y recopilar ese tipo de datos puede ser un proceso laborioso, por no decir costoso.<\/p>\n

Por ejemplo, en uno de los estudios de DeepMind, los investigadores escribieron que, para recopilar datos de entrenamiento para su sistema, tuvieron que pagar a 77 personas para que completaran m\u00e1s de 2,4 millones de demostraciones de tareas inform\u00e1ticas. Si extrapolamos eso, la magnitud del problema se pone de manifiesto.<\/p>\n

Ahora, 20 millones de d\u00f3lares pueden ser de gran ayuda, especialmente porque Rabbit es un peque\u00f1o equipo (nueve personas) que actualmente trabaja en la casa de Lyu. (\u00c9l estima que la tasa de consumo es de alrededor de $ 250 000 por a\u00f1o). Sin embargo, me pregunto si Rabbit podr\u00e1 mantenerse al d\u00eda con los jugadores m\u00e1s establecidos en el espacio y c\u00f3mo combatir\u00e1 a nuevos desaf\u00edos como Copilot de Microsoft para Windows y OpenAI. esfuerzos para fomentar un ecosistema de complementos para ChatGPT.<\/p>\n

Sin embargo, Rabbit no es m\u00e1s que ambicioso y conf\u00eda en que puede ganar dinero para sostener el negocio otorgando licencias para su plataforma, continuando perfeccionando su modelo y vendiendo dispositivos personalizados. El tiempo dir\u00e1.<\/p>\n

\u00abA\u00fan no hemos lanzado un producto, pero nuestras primeras demostraciones han atra\u00eddo a decenas y miles de usuarios\u00bb, dijo Lyu. \u201cLa eventual forma madura de modelos que desarrollar\u00e1 el equipo de Rabbit funcionar\u00e1 con datos que a\u00fan deben recopilar y se evaluar\u00e1n seg\u00fan puntos de referencia que a\u00fan deben dise\u00f1ar. Es por eso que el equipo de Rabbit no est\u00e1 construyendo el modelo solo, sino la pila completa de aparatos necesarios en el sistema operativo para respaldarlo… El equipo de Rabbit cree que la mejor manera de darse cuenta del valor de la investigaci\u00f3n de vanguardia es centr\u00e1ndose en el usuarios finales e implementar r\u00e1pidamente sistemas reforzados y protegidos en producci\u00f3n\u201d.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

\u00bfQu\u00e9 pasar\u00eda si pudieras interactuar con cualquier software utilizando lenguaje natural? \u00bfImag\u00ednese escribir un mensaje y hacer que la IA traduzca las instrucciones en comandos comprensibles para la m\u00e1quina, ejecutando…<\/p>\n","protected":false},"author":1,"featured_media":831421,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[216,66193,8362,148,5290,1488,16089,6877],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/831420"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=831420"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/831420\/revisions"}],"predecessor-version":[{"id":831422,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/831420\/revisions\/831422"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/831421"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=831420"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=831420"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=831420"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}