Google ha lanzado un nuevo punto de referencia de código abierto que, según dice, permitirá a los robots realizar tareas escribiendo su propio código en respuesta a instrucciones escritas por humanos.
La empresa ha lanzado un nuevo sitio web (se abre en una pestaña nueva) para revelar «Código como políticas» (CAP), mediante el cual las indicaciones escritas en inglés simple se pueden interpretar en programas generados por modelos de lenguaje (LMP) escritos en código Python.
CAP es el sucesor de Palma-SayCan (se abre en una pestaña nueva), un proyecto que de manera similar permitió que un robot ayudante físico fuera dirigido a través de comandos en un lenguaje sencillo. CAP promete permitir que se completen tareas más complejas con mayor precisión, en parte debido a que permite que las máquinas escriban su propio código.
Robots de autocodificación
en un entrada en el blog (se abre en una pestaña nueva) Al analizar el lanzamiento de CAP, el pasante de investigación de Google, Jacky Liang, y el científico de investigación, Andy Zeng, describen la motivación de la tecnología y lo que podría significar para el futuro.
“¿Qué pasaría si, al recibir instrucciones de las personas, los robots pudieran escribir de forma autónoma su propio código para interactuar con el mundo? […] Dadas las instrucciones en lenguaje natural, los modelos de lenguaje actuales son altamente competentes para escribir no solo código genérico sino, como hemos descubierto, código que también puede controlar las acciones de los robots”.
Pero puede que todavía no sea el momento de tirar su computadora portátil para programar. En las pruebas, los investigadores de Google demostraron comandos simples con una estructura similar. Los robots de prueba pudieron «dibujar un hexágono de 5 cm alrededor del medio» [of a whiteboard]y «poner los bloques en una línea horizontal cerca de la parte superior» [of a square boundary].
En el acompañamiento papel (se abre en una pestaña nueva), titulado «Código como políticas: Programas modelo de lenguaje para el control incorporado», el equipo del proyecto reconoce que CAP actualmente no tiene la capacidad de manejar comandos especialmente abstractos o complejos o percibir descripciones de trayectoria. El enfoque del equipo tampoco tuvo en cuenta los comandos imposibles que se alimentaban a través de CAP.
En teoría, la naturaleza de código abierto de la implementación «centrada en robots» de Google de LMP en Python podría resultar en una implementación mucho más rápida de soluciones a estos problemas. El sitio web de la PAC también contiene lanzamientos (se abre en una pestaña nueva) a través de Github, y un interactivo manifestación (se abre en una pestaña nueva) a través de Google Colab para describir cómo los robots «escriben» el código en respuesta a los comandos.