El equipo de DeepMind de Google destaca un nuevo sistema para enseñar a los robots tareas novedosas


Una de las primeras cosas que descubres en el mundo de la robótica es la complejidad de las tareas simples. Las cosas que parecen simples para los humanos tienen variables potencialmente infinitas que damos por sentado. Los robots no tienen esos lujos.

Es precisamente por eso que gran parte de la industria se centra en tareas repetibles en entornos estructurados. Afortunadamente, el mundo del aprendizaje robótico ha visto algunos avances revolucionarios en los últimos años, y la industria está en camino de crear e implementar sistemas más adaptables.

El año pasado, el equipo de robótica de Google DeepMind presentó Robotics Transformer (RT-1), que capacitó a sus sistemas Everyday Robot para realizar tareas como recoger y colocar y abrir sorteos. El sistema se basó en una base de datos de 130 000 demostraciones, lo que resultó en una tasa de éxito del 97% para «más de 700» tareas, según el equipo.

Créditos de imagen: Google DeepMind

Hoy se está quitando las envolturas de RT-2. En una publicación de blog, el científico distinguido y jefe de robótica de DeepMind, Vincent Vanhoucke, dice que el sistema permite que los robots transfieran de manera efectiva los conceptos aprendidos en conjuntos de datos relativamente pequeños a diferentes escenarios.

“RT-2 muestra capacidades mejoradas de generalización y comprensión semántica y visual más allá de los datos robóticos a los que estuvo expuesto”, explica Google. “Esto incluye interpretar nuevos comandos y responder a los comandos del usuario mediante la realización de un razonamiento rudimentario, como el razonamiento sobre categorías de objetos o descripciones de alto nivel”. El sistema demuestra efectivamente una capacidad para determinar cosas como la mejor herramienta para una nueva tarea específica basada en la información contextual existente.

Vanhoucke cita un escenario en el que se le pide a un robot que tire la basura. En muchos modelos, el usuario tiene que enseñarle al robot a identificar lo que califica como basura y luego entrenarlo para que recoja la basura y la tire. Es un nivel de minucia que no es especialmente escalable para los sistemas que se espera que realicen una variedad de tareas diferentes.

“Debido a que RT-2 puede transferir conocimiento de un gran corpus de datos web, ya tiene una idea de lo que es la basura y puede identificarla sin un entrenamiento explícito”, escribe Vanhoucke. “Incluso tiene una idea de cómo tirar la basura, aunque nunca ha sido entrenado para tomar esa acción. Y piense en la naturaleza abstracta de la basura: lo que era una bolsa de papas fritas o una cáscara de plátano se convierte en basura después de comerlos. RT-2 es capaz de dar sentido a eso a partir de sus datos de entrenamiento de visión y lenguaje y hacer el trabajo”.

El equipo dice que la tasa de eficacia en la ejecución de nuevas tareas ha mejorado del 32 % al 62 % en el salto de RT-1 a RT-2.



Source link-48