El nuevo modelo de inteligencia artificial de Google controla los robots


Olvídese de la IA que puede dibujar imágenes, el último modelo de IA de Google puede controlar un robot.

El viernes, Google presentó Robotics Transformer 2, o RT2, un modelo de visión-lenguaje-acción (VLA) que puede tomar texto e imágenes y convertirlos en acciones robóticas.

«Al igual que los modelos de lenguaje se entrenan en texto de la web para aprender ideas y conceptos generales, RT-2 transfiere conocimiento de datos web para informar el comportamiento del robot», explicó Vincent Vanhoucke, Jefe de Robótica, Google DeepMind, en una publicación de blog.(Se abre en una nueva ventana). “En otras palabras, RT-2 puede hablar robot”.

Vanhoucke dice que si bien los chatbots se pueden entrenar brindándoles información sobre un tema, los robots deben llevar las cosas un paso más allá y «conectarse a tierra» en el mundo real. El ejemplo que proporcionó fue una manzana roja. Si bien podría simplemente explicarle a un chatbot qué es una manzana, un robot no solo necesitará saber todo sobre ella, sino también saber cómo distinguirla de un elemento similar, por ejemplo, una bola roja, y también tendrá que aprender cómo deben recoger esa manzana.

RT-2 lleva las cosas un paso más allá que el RT-1 de Google(Se abre en una nueva ventana) y otros modelos utilizando datos de la web. Por ejemplo, si quisiera que un modelo anterior tirara algo, necesitaría capacitarlos sobre qué es la basura y cómo usarla. Con RT-2, el robot puede entrenarse a sí mismo en función de los datos web. Entonces, aunque no haya explicado qué es la basura y cómo usarla, el robot puede resolver esa parte por sí solo.

Recomendado por Nuestros Editores

Con RT-2, los robots pueden aprender y tomar el conocimiento aprendido y aplicarlo también a situaciones futuras. Dicho esto, Google señala que en las limitaciones actuales del modelo, RT-2 solo puede ayudar a un robot a mejorar en las tareas físicas que ya sabe hacer, no aprenderlas desde cero.

Aún así, es un gran paso adelante y nos muestra lo que podría ser posible en el futuro. Google detalla cómo funciona RT-2 en su blog DeepMind(Se abre en una nueva ventana).

¡Obtenga nuestras mejores historias!

Matricularse en ¿Qué hay de nuevo ahora? para recibir nuestras mejores historias en su bandeja de entrada todas las mañanas.

Este boletín puede contener publicidad, ofertas o enlaces de afiliados. Suscribirse a un boletín informativo indica su consentimiento a nuestros Términos de uso y Política de privacidad. Puede darse de baja de los boletines en cualquier momento.





Source link-38