¿Comunicación usando solo el pensamiento? Unbabel presenta proyecto de IA para darnos capacidades sobrehumanas


Sentado en una reunión en una oficina nueva en Lisboa, en silencio escribí la respuesta a una pregunta que solo la persona de enfrente sabría la respuesta. ¿Qué tipo de café había pedido cuando llegué a la oficina? Un breve momento después, sin siquiera moverse o abrir la boca, la respuesta llegó a través de un mensaje de texto: «Tuviste un Americano».

No era así como esperaba pasar un viernes por la tarde en la ciudad, pero aquí estaba, sentado en las oficinas de la empresa emergente de servicios de traducción de idiomas Unbabel, frente al fundador y director ejecutivo Vasco Pedro, probando lo que parecía ser un cerebro. interfaz a la computadora. Y fue bastante asombroso.

La historia comienza hace cuatro años.

La misión central de Unbabel —permitir que las empresas entiendan y sean entendidas por sus clientes en docenas de idiomas— llevó hace mucho tiempo a la empresa a pensar fuera de la «caja» proverbial, para desarrollar varios proyectos internamente. Quería explorar otras formas de comunicarse. Ahora, como una startup con $90 millones en fondos de capital de riesgo, ingresos anuales de alrededor de $50 millones y habiendo sobrevivido a la pandemia, a Unbabel le está yendo lo suficientemente bien como para explorar estos proyectos.

“Tuvimos la idea de mirar las interfaces del cerebro a la comunicación”, me dice Pedro. “Empezamos a hacer un montón de experimentos, como un proyecto del 20 %”.

El equipo de innovación de Unbabel, dirigido por Paulo Dimas, vicepresidente de innovación de productos, analizó la forma en que evolucionaron nuestros cerebros.

“Tienes tu sistema límbico, tienes tu neocórtex. Pero en realidad han evolucionado durante millones de años. En realidad son sistemas separados. Y creo que lo que estamos empezando a ver es casi la creación de la ‘supercorteza’, que creemos que estará impulsada por IA, y existirá fuera de su cerebro biológico”, dijo Pedro.

Dimas y su equipo comenzaron a investigar los sistemas de electroencefalograma (EEG), algunos de los cuales pueden ser invasivos para el cuerpo. La compañía Neuralink de Elon Musk está explorando dispositivos invasivos de interfaz cerebro-computadora para humanos.

[L to R] Mike Carnicero, TechCrunch; Paulo Dimas, VP de Innovación de Producto de Unbabel; Vasco Pedro, CEO/cofundador de Unbabel, con el dispositivo Halo. Créditos de imagen: mike carnicero

EMG fue la puerta de entrada

Pero luego, al equipo de Unbabel se le ocurrió la idea de usar un sistema EMG. La EMG (electromiografía) mide la respuesta muscular o la actividad eléctrica en respuesta a la estimulación nerviosa del músculo. Los dispositivos EMG son comunes y triviales. Incluso puedes comprarlos en Amazon por unos pocos dólares.

“Nos dimos cuenta de que el EEG seguía siendo demasiado ruidoso. Queríamos ser no invasivos. Pero EMG, que mide la respuesta muscular, era menos ruidoso. Puede capturar de manera más confiable algunas de las señales”, dijo Pedro.

El equipo colocó sensores en un brazalete y comenzó a averiguar qué podían medir. “Comenzamos a pensar en EMG como una puerta de entrada a la interacción cerebral directamente”, me dijo Pedro.

Luego, el año pasado, decidieron conectar un sistema EMG con IA generativa. En concreto, un LLM, que se personalizaba al usuario. ¿Pero cómo?

En pocas palabras, el sistema midió cómo reaccionaría el usuario de un dispositivo EMG al pensar en una palabra. Esto ayudaría a construir un conjunto de señales que se correlacionaran con palabras reales. Introducir esas señales en un LLM significaría la creación de un «LLM personalizado».

Entonces, cuando le pregunté a Vasco qué tipo de café había pedido a través de un mensaje de texto invisible, le envió esas palabras a través de una voz de IA a sus auriculares. Luego pensó en palabras como «Café negro». Luego, el LLM comparó su respuesta física con la palabra, verificó si quería decir «americano», nuevamente a través del audio en un auricular, y luego me envió la respuesta a través de un mensaje de texto, en este caso de uso, la aplicación de mensajes de texto Telegram.

“El LLM amplía lo que estás diciendo. Y luego confirmo antes de devolverlo. Entonces hay una interacción con el LLM donde construyo lo que quiero que diga, y luego apruebo el mensaje final”, explicó Pedro.

La demostración sucedió frente a mis ojos. No había movimiento ni tecleo. Solo Vasco Pedro respondiendo en silencio por mensaje de texto.

“El LLM que toma un mensaje básico y lo expande en una respuesta completa, casi de inmediato. No tendría tiempo para escribir todo eso de forma natural. Así que estoy usando el LLM para hacer el trabajo pesado en la respuesta”, agregó.

También señaló que el usuario tiene control absoluto de lo que está emitiendo: “No está grabando lo que estoy pensando. Está grabando lo que quiero decir. Así que es como tener una conversación. Otros enfoques, como Neuralink, en realidad intentan medir las interacciones subconscientes. Estamos creando un canal que puedes usar para comunicarte, pero la persona tiene que querer usarlo”.

Pedro lo describe como tener una voz dentro de tu cabeza con la que te puedes comunicar: «El potencial de aumento es enorme, pero aún quedan muchos obstáculos por superar».

¿Como funciona? La respuesta simple es una interfaz EMG «E-Skin» incrustada en una especie de manga flexible, desarrollada con el Laboratorio de Microelectrónica Impresa de la Universidad de Coimbra dirigido por el profesor Tavakoli.

En este momento, la versión está bastante pirateada, pero eventualmente, el dispositivo podría miniaturizarse.

El nacimiento de Halo

Unbabel apodó su invento «Halo» (después de «halograma»). Una aplicación se ejecuta en el teléfono del usuario que permite el acceso a un centro central para recibir la comunicación y permite la comunicación con el LLM y las respuestas. La plataforma está sacando OpenAI ChatGPT 3.5 en este momento.

Cómo funciona el dispositivo Halo de Unbabel.

Cómo funciona el dispositivo Halo de Unbabel. Créditos de imagen: Unbabel

Pedro compara el proyecto de Unbabel con las compañías de automóviles sin conductor que recopilan datos de cámaras normales en lugar de sistemas complicados, como lidar: “Vamos a obtener una tonelada de datos y podemos comenzar a usarlos ahora. Comenzamos a trabajar hace cuatro años y el punto de inflexión ahora es en términos de IA generativa. Este es el momento en que esto se va a acelerar”.

Es cierto que esta no es la primera vez que se usa EMG para controlar una computadora y generar respuestas.

Por ejemplo, un dispositivo fabricado por CTRL-labs, propiedad de Facebook, tenía una pulsera EMG en 2019 que captaba los impulsos eléctricos que provienen de las fibras musculares a medida que se mueven.

Sin embargo, el enfoque de Unbabel parece ser la primera vez que un LLM se conecta a EMG de esta manera. Las aplicaciones podrían ser de largo alcance.

Desbloquear lo encerrado

Unbabel ahora está trabajando con la Fundación Champalimaud en Lisboa, que trabaja en investigación biomédica avanzada y atención clínica interdisciplinaria en el campo de la ELA, entre muchas otras cosas. Claramente, sin embargo, el sistema podría terminar siendo utilizado en otros escenarios, como la parálisis cerebral.

La necesidad de mejores interfaces para los pacientes que no pueden hablar continúa. En este momento, los llamados productos de «Comunicación alternativa y aumentativa» (AAC) para pacientes con ELA, como Grid o Tobii, se basan en el seguimiento ocular. Estos sistemas a menudo requieren un proceso de calibración frustrante para el usuario, en realidad solo funcionan en interiores y pueden fatigar al usuario. También dependen de teclados laboriosamente lentos.

Como añade Pedro: “Nuestro prototipo ya está siendo avalado por la principal asociación de ELA de Portugal. Planeamos comenzar a implementar esto para nuestros primeros usuarios de ALS para Navidad de este año. Más allá de los pacientes con ELA, nuestro producto actual también es relevante para otros pacientes que tienen dificultades para escribir”.

Dimas también es ahora la persona designada por Unbabel para el recién formado Centro para la IA Responsable de Portugal, donde es director ejecutivo. Esta es una asociación con varias empresas emergentes y centros de investigación portugueses para invertir 78 millones de euros en investigación de IA, creando 210 puestos de trabajo en el marco del Plan de Recuperación y Resiliencia de Portugal. Los socios incluyen Feedzai, Sword Health, Champalimaud Foundation y otros.

La IA generativa llega a los dispositivos portátiles

Mientras tanto, la versión de Halo que me demostraron mostró el poder potencial de la IA generativa aplicada a dispositivos portátiles. Otros equipos están explorando este mundo nuevo y valiente. Apenas esta semana, los neurocientíficos pudieron recrear «Another Brick in the Wall, Part 1» de Pink Floyd utilizando IA para descifrar la actividad eléctrica del cerebro.

El concepto ha existido durante mucho tiempo. En la década de 1980, la película de Firefox, dirigida y protagonizada por Clint Eastwood, planteó un mundo en el que los pilotos controlarían los sistemas de armas a través de plataformas controladas por el pensamiento:

Pero esta es solo la primera versión de Halo de Unbabel: «Todavía está bastante limitado a lo que podemos hacer, pero ya estamos en alrededor de 20 palabras por minuto de comunicación equivalente», dijo Pedro.

“Para darle una idea de esto, Stephen Hawking se comunicaba alrededor de dos palabras por minuto. Halo ahora tiene alrededor de 20 palabras por minuto. El nivel de uso del consumidor es 60 y 80 es el objetivo. La gente habla a un máximo de 120 a 130 palabras por minuto. Entonces, si llegas a 150, estás comenzando a tener capacidades sobrehumanas”.



Source link-48