Cómo piensan los robóticos sobre la IA generativa


[A version of this piece first appeared in TechCrunch’s robotics newsletter, Actuator. Subscribe here.]

El tema de la IA generativa aparece con frecuencia en mi boletín informativo, Actuator. Admito que hace unos meses dudaba un poco en dedicar más tiempo al tema. Cualquiera que haya estado informando sobre tecnología durante tanto tiempo como yo ha vivido innumerables ciclos de publicidad y se ha quemado antes. Informar sobre tecnología requiere una buena dosis de escepticismo, con suerte atenuado por algo de entusiasmo sobre lo que se puede hacer.

Esta vez, parecía que la IA generativa estaba esperando entre bastidores, esperando el momento oportuno, esperando el inevitable cráter de las criptomonedas. Mientras la sangre se escurría de esa categoría, proyectos como ChatGPT y DALL-E estaban a la espera, listos para ser el foco de informes apasionantes, esperanza, críticas, doomerismo y todas las diferentes etapas kübler-rossianas de la burbuja tecnológica.

Aquellos que siguen mis cosas saben que nunca fui especialmente optimista con las criptomonedas. Sin embargo, las cosas son diferentes con la IA generativa. Para empezar, existe un acuerdo casi universal de que la inteligencia artificial/aprendizaje automático en general desempeñará papeles más centralizados en nuestras vidas en el futuro.

Los teléfonos inteligentes ofrecen una gran información aquí. La fotografía computacional es algo sobre lo que escribo con cierta regularidad. Ha habido grandes avances en ese frente en los últimos años, y creo que muchos fabricantes finalmente han logrado un buen equilibrio entre hardware y software cuando se trata de mejorar el producto final y bajar el listón de entrada. Google, por ejemplo, realiza algunos trucos realmente impresionantes con funciones de edición como Best Take y Magic Eraser.

Claro, son trucos interesantes, pero también son útiles, en lugar de ser funciones por funciones. Sin embargo, en el futuro, el verdadero truco será integrarlos perfectamente en la experiencia. Con flujos de trabajo futuros ideales, la mayoría de los usuarios tendrán poca o ninguna noción de lo que sucede detrás de escena. Estarán felices de que funcione. Es el clásico libro de jugadas de Apple.

La IA generativa ofrece un efecto «sorpresa» similar desde el principio, que es otra forma en que se diferencia de su predecesor del ciclo publicitario. Cuando su pariente menos experto en tecnología puede sentarse frente a una computadora, escribir algunas palabras en un campo de diálogo y luego observar cómo la caja negra escupe pinturas e historias cortas, no se requiere mucha conceptualización. Esa es en gran parte la razón por la que todo esto se popularizó tan rápido como lo hizo: la mayoría de las veces, cuando a la gente común se le presentan tecnologías de vanguardia, es necesario que visualicen cómo se verían dentro de cinco o diez años.

Con ChatGPT, DALL-E, etc., puedes experimentarlo de primera mano ahora mismo. Por supuesto, la otra cara de la moneda es lo difícil que resulta moderar las expectativas. Por mucho que la gente se incline a dotar a los robots de inteligencia humana o animal, sin una comprensión fundamental de la IA, es fácil proyectar intencionalidad aquí. Pero así es como van las cosas ahora. Empezamos con el titular que llama la atención y esperamos que la gente se quede el tiempo suficiente para leer sobre las maquinaciones detrás de él.

Alerta de spoiler: nueve de cada 10 veces no lo harán y, de repente, pasamos meses y años intentando hacer que las cosas vuelvan a la realidad.

Una de las grandes ventajas de mi trabajo es la capacidad de analizar estas cosas con personas mucho más inteligentes que yo. Se toman el tiempo para explicar las cosas y espero que haga un buen trabajo traduciéndolo para los lectores (algunos intentos tienen más éxito que otros).

Una vez que quedó claro que la IA generativa tiene un papel importante que desempeñar en el futuro de la robótica, he estado encontrando formas de introducir preguntas en las conversaciones. Creo que la mayoría de las personas en este campo están de acuerdo con la afirmación de la oración anterior, y es fascinante ver la amplitud del impacto que creen que tendrá.

Por ejemplo, en mi conversación reciente con Marc Raibert y Gill Pratt, este último explicó el papel que desempeña la IA generativa en su enfoque del aprendizaje de robots:

Hemos descubierto cómo hacer algo, que es utilizar técnicas modernas de inteligencia artificial generativa que permiten la demostración humana tanto de la posición como de la fuerza para esencialmente enseñarle a un robot a partir de solo un puñado de ejemplos. El código no se modifica en absoluto. En lo que se basa esto es en algo que se llama política de difusión. Es un trabajo que hicimos en colaboración con Columbia y el MIT. Hasta ahora hemos enseñado 60 habilidades diferentes.

La semana pasada, cuando le pregunté al vicepresidente y director general de Computación integrada y de borde de Nvidia, Deepu Talla, por qué la compañía cree que la IA generativa es más que una moda pasajera, me dijo:

Creo que habla en los resultados. Ya se puede ver la mejora de la productividad. Puede redactar un correo electrónico para mí. No es exactamente correcto, pero no tengo que empezar desde cero. Me está dando el 70%. Hay cosas obvias que ya puedes ver que definitivamente son una función escalonada mejor que como eran las cosas antes. Resumir algo no es perfecto. No voy a dejar que lo lea y lo resuma por mí. Entonces, ya se pueden ver algunos signos de mejoras en la productividad.

Mientras tanto, durante mi última conversación con Daniela Rus, el director del MIT CSAIL explicó cómo los investigadores están utilizando la IA generativa para diseñar los robots:

Resulta que la IA generativa puede ser bastante poderosa para resolver incluso problemas de planificación de movimiento. Puede obtener soluciones mucho más rápidas y soluciones de control mucho más fluidas y humanas que con las soluciones predictivas de modelos. Creo que eso es muy poderoso, porque los robots del futuro estarán mucho menos robotizados. Serán mucho más fluidos y humanos en sus movimientos.

También hemos utilizado IA generativa para el diseño. Esto es muy poderoso. También es muy interesante, porque no se trata sólo de generación de patrones para robots. Tienes que hacer algo más. No puede simplemente generar un patrón basado en datos. Las máquinas tienen que tener sentido en el contexto de la física y del mundo físico. Por ese motivo, los conectamos a un motor de simulación basado en la física para asegurarnos de que los diseños cumplan con las restricciones requeridas.

Esta semana, un equipo de la Universidad Northwestern dio a conocer su propia investigación sobre el diseño de robots generados por IA. Los investigadores mostraron cómo diseñaron un «robot que camina con éxito en cuestión de segundos». No hay mucho que ver, tal como van estas cosas, pero es bastante fácil ver cómo con investigación adicional, el enfoque podría usarse para crear sistemas más complejos.

«Descubrimos un algoritmo de diseño muy rápido impulsado por IA que evita los atascos de la evolución, sin caer en el sesgo de los diseñadores humanos», dijo el líder de la investigación, Sam Kriegman. “Le dijimos a la IA que queríamos un robot que pudiera caminar por la tierra. Luego simplemente presionamos un botón y ¡listo! Generó un plano para un robot en un abrir y cerrar de ojos que no se parece en nada a ningún animal que haya caminado sobre la tierra. A este proceso lo llamo ‘evolución instantánea’”.

Fue decisión del programa de IA ponerle patas al pequeño y blando robot. «Es interesante porque no le dijimos a la IA que un robot debería tener piernas», añadió Kriegman. “Redescubrió que las piernas son una buena forma de moverse en tierra. La locomoción con las piernas es, de hecho, la forma más eficiente de movimiento terrestre”.

«Desde mi perspectiva, la IA generativa y la automatización física/robótica son lo que va a cambiar todo lo que sabemos sobre la vida en la Tierra», me dijo esta semana el fundador y director ejecutivo de Formant, Jeff Linnell. “Creo que todos somos conscientes del hecho de que la IA existe y esperamos que todos nuestros trabajos, cada empresa y cada estudiante se vean afectados. Creo que es simbiótico con la robótica. No tendrás que programar un robot. Vas a hablar con el robot en inglés, le solicitas una acción y luego la resuelven. Va a ser un minuto para eso”.

Antes de Formant, Linnell fundó y se desempeñó como director ejecutivo de Bot & Dolly. La empresa con sede en San Francisco, mejor conocida por su trabajo en Gravity, fue absorbida por Google en 2013 cuando el gigante del software se propuso acelerar la industria (los planes mejor trazados, etc.). El ejecutivo me dice que su principal conclusión de esa experiencia es que todo se trata del software (dada la llegada de la absorción de Intrinsic y Everyday Robots a DeepMind, me inclino a decir que Google está de acuerdo).



Source link-48