{"id":880693,"date":"2023-11-11T17:54:37","date_gmt":"2023-11-11T17:54:37","guid":{"rendered":"https:\/\/magazineoffice.com\/el-momento-gpt-de-la-robotica-de-ia-esta-cerca\/"},"modified":"2023-11-11T17:54:41","modified_gmt":"2023-11-11T17:54:41","slug":"el-momento-gpt-de-la-robotica-de-ia-esta-cerca","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/el-momento-gpt-de-la-robotica-de-ia-esta-cerca\/","title":{"rendered":"El ‘momento GPT’ de la rob\u00f3tica de IA est\u00e1 cerca"},"content":{"rendered":"
\n<\/p>\n
\t\tPeter Chen es director ejecutivo y cofundador de Covariant, la empresa de rob\u00f3tica de IA l\u00edder en el mundo. Antes de fundar Covariant, Peter fue cient\u00edfico investigador en OpenAI e investigador en el Laboratorio de Investigaci\u00f3n de Inteligencia Artificial de Berkeley (BAIR), donde se centr\u00f3 en el aprendizaje por refuerzo, el metaaprendizaje y el aprendizaje no supervisado. \t<\/p><\/div>\n<\/p><\/div>\n<\/div>\n
No es ning\u00fan secreto que los modelos b\u00e1sicos han transformado la IA en el mundo digital. Los modelos de lenguajes grandes (LLM) como ChatGPT, LLaMA y Bard revolucionaron la IA para el lenguaje. Si bien los modelos GPT de OpenAI no son el \u00fanico modelo de lenguaje grande disponible, han logrado el reconocimiento m\u00e1s generalizado por recibir entradas de texto e im\u00e1genes y brindar respuestas similares a las humanas, incluso con algunas tareas que requieren resoluci\u00f3n de problemas complejos y razonamiento avanzado.<\/p>\n
La adopci\u00f3n viral y generalizada de ChatGPT ha dado forma en gran medida a c\u00f3mo la sociedad entiende este nuevo momento para la inteligencia artificial.<\/p>\n
El pr\u00f3ximo avance que definir\u00e1 la IA durante generaciones es la rob\u00f3tica. La construcci\u00f3n de robots impulsados \u200b\u200bpor IA que puedan aprender a interactuar con el mundo f\u00edsico mejorar\u00e1 todas las formas de trabajo repetitivo en sectores que van desde la log\u00edstica, el transporte y la manufactura hasta el comercio minorista, la agricultura e incluso la atenci\u00f3n m\u00e9dica. Tambi\u00e9n desbloquear\u00e1 tantas eficiencias en el mundo f\u00edsico como las que hemos visto en el mundo digital durante las \u00faltimas d\u00e9cadas.<\/p>\n
Si bien existe un conjunto \u00fanico de problemas que resolver dentro de la rob\u00f3tica en comparaci\u00f3n con el lenguaje, existen similitudes entre los conceptos fundamentales centrales. Y algunas de las mentes m\u00e1s brillantes en IA han logrado avances significativos en la construcci\u00f3n del \u00abGPT para la rob\u00f3tica\u00bb.<\/p>\n
Para comprender c\u00f3mo construir el \u00abGPT para la rob\u00f3tica\u00bb, primero observe los pilares centrales que han permitido el \u00e9xito de LLM como GPT.<\/p>\n
GPT es un modelo de IA entrenado en un conjunto de datos amplio y diverso. Los ingenieros previamente recopilaron datos y entrenaron IA espec\u00edfica para un problema espec\u00edfico. Luego necesitar\u00edan recopilar nuevos datos para resolver otro. \u00bfOtro problema? Nuevos datos una vez m\u00e1s. Ahora, con un enfoque de modelo b\u00e1sico, est\u00e1 sucediendo exactamente lo contrario.<\/p>\n
En lugar de crear IA especializadas para cada caso de uso, se puede utilizar una de forma universal. Y ese modelo muy general tiene m\u00e1s \u00e9xito que cualquier modelo especializado. La IA en un modelo b\u00e1sico funciona mejor en una tarea espec\u00edfica. Puede aprovechar lo aprendido de otras tareas y generalizarlo mejor a nuevas tareas porque ha aprendido habilidades adicionales al tener que desempe\u00f1arse bien en un conjunto diverso de tareas.<\/p>\n
Para tener una IA generalizada, primero es necesario acceder a una gran cantidad de datos diversos. OpenAI obtuvo los datos del mundo real necesarios para entrenar los modelos GPT de manera razonablemente eficiente. GPT se ha entrenado con datos recopilados de todo Internet con un conjunto de datos grande y diverso, que incluye libros, art\u00edculos de noticias, publicaciones en redes sociales, c\u00f3digos y m\u00e1s.<\/p>\n
\n\t\t\tLa construcci\u00f3n de robots impulsados \u200b\u200bpor IA que puedan aprender a interactuar con el mundo f\u00edsico mejorar\u00e1 todas las formas de trabajo repetitivo.\t\t\t\t\t<\/p><\/blockquote><\/div>\n
No es s\u00f3lo el tama\u00f1o del conjunto de datos lo que importa; La curaci\u00f3n de datos de alta calidad y valor tambi\u00e9n juega un papel muy importante. Los modelos GPT han logrado un rendimiento sin precedentes porque sus conjuntos de datos de alta calidad se basan principalmente en las tareas que interesan a los usuarios y las respuestas m\u00e1s \u00fatiles.<\/p>\n
Papel del aprendizaje por refuerzo (RL)<\/h3>\n
OpenAI emplea aprendizaje reforzado a partir de retroalimentaci\u00f3n humana (RLHF) para alinear la respuesta del modelo con las preferencias humanas (por ejemplo, lo que se considera beneficioso para un usuario). Es necesario que haya algo m\u00e1s que puro aprendizaje supervisado (SL), porque el SL s\u00f3lo puede abordar un problema con un patr\u00f3n claro o un conjunto de ejemplos. Los LLM requieren que la IA alcance un objetivo sin una respuesta \u00fanica y correcta. Entra RLHF.<\/p>\n
RLHF permite que el algoritmo avance hacia una meta mediante prueba y error mientras un humano reconoce las respuestas correctas (recompensa alta) o rechaza las incorrectas (recompensa baja). La IA encuentra la funci\u00f3n de recompensa que mejor explica la preferencia humana y luego usa RL para aprender c\u00f3mo llegar all\u00ed. ChatGPT puede ofrecer respuestas que reflejen o superen las capacidades a nivel humano al aprender de los comentarios humanos.<\/p>\n
La pr\u00f3xima frontera de los modelos de cimentaci\u00f3n est\u00e1 en la rob\u00f3tica<\/h2>\n
La misma tecnolog\u00eda central que permite a GPT ver, pensar e incluso hablar tambi\u00e9n permite a las m\u00e1quinas ver, pensar y actuar. Los robots impulsados \u200b\u200bpor un modelo b\u00e1sico pueden comprender su entorno f\u00edsico, tomar decisiones informadas y adaptar sus acciones a circunstancias cambiantes.<\/p>\n
El \u201cGPT para la rob\u00f3tica\u201d se est\u00e1 construyendo de la misma manera que el GPT: sentando las bases para una revoluci\u00f3n que, una vez m\u00e1s, redefinir\u00e1 la IA tal como la conocemos.<\/p>\n
Enfoque del modelo de base<\/h3>\n
Al adoptar un enfoque de modelo b\u00e1sico, tambi\u00e9n se puede crear una IA que funcione en m\u00faltiples tareas en el mundo f\u00edsico. Hace unos a\u00f1os, los expertos aconsejaron crear una IA especializada para robots que recogen y empaquetan alimentos. Y eso es diferente de un modelo que puede clasificar varias piezas el\u00e9ctricas, que es diferente del modelo que descarga paletas de un cami\u00f3n.<\/p>\n
Este cambio de paradigma hacia un modelo b\u00e1sico permite que la IA responda mejor a escenarios extremos que frecuentemente existen en entornos no estructurados del mundo real y que, de otro modo, podr\u00edan confundir modelos con un entrenamiento m\u00e1s limitado. Construir una IA generalizada para todos estos escenarios es m\u00e1s exitoso. Es entrenando en todo lo que se obtiene la autonom\u00eda a nivel humano que nos faltaba en las generaciones anteriores de robots.<\/p>\n
Capacitaci\u00f3n en un conjunto de datos grande, propietario y de alta calidad<\/h3>\n
Ense\u00f1ar a un robot a aprender qu\u00e9 acciones conducen al \u00e9xito y cu\u00e1les al fracaso es extremadamente dif\u00edcil. Requiere datos extensos de alta calidad basados \u200b\u200ben interacciones f\u00edsicas del mundo real. Los entornos de laboratorio individuales o los ejemplos de video son fuentes poco confiables o lo suficientemente s\u00f3lidas (por ejemplo, los videos de YouTube no logran traducir los detalles de la interacci\u00f3n f\u00edsica y los conjuntos de datos acad\u00e9micos tienden a tener un alcance limitado).<\/p>\n
A diferencia de la IA para el procesamiento del lenguaje o de im\u00e1genes, ning\u00fan conjunto de datos preexistente representa c\u00f3mo deber\u00edan interactuar los robots con el mundo f\u00edsico. Por lo tanto, un conjunto de datos grande y de alta calidad se convierte en un desaf\u00edo m\u00e1s complejo de resolver en rob\u00f3tica, y desplegar una flota de robots en producci\u00f3n es la \u00fanica manera de construir un conjunto de datos diverso.<\/p>\n
Papel del aprendizaje por refuerzo<\/h3>\n
De manera similar a responder preguntas de texto con capacidad de nivel humano, el control y la manipulaci\u00f3n rob\u00f3ticos requieren que un agente busque el progreso hacia una meta que no tiene una respuesta \u00fanica, \u00fanica y correcta (por ejemplo, \u00ab\u00bfCu\u00e1l es una manera exitosa de recoger esta cebolla roja?\u00bb). . Una vez m\u00e1s, se requiere algo m\u00e1s que puro aprendizaje supervisado.<\/p>\n
Necesita un robot que ejecute aprendizaje por refuerzo profundo (RL profundo) para tener \u00e9xito en la rob\u00f3tica. Este enfoque aut\u00f3nomo de autoaprendizaje combina la realidad virtual con redes neuronales profundas para desbloquear niveles m\u00e1s altos de rendimiento: la IA adaptar\u00e1 autom\u00e1ticamente sus estrategias de aprendizaje y continuar\u00e1 afinando sus habilidades a medida que experimente nuevos escenarios.<\/p>\n
Se acerca un crecimiento desafiante y explosivo<\/h2>\n
En los \u00faltimos a\u00f1os, algunos de los expertos en inteligencia artificial y rob\u00f3tica m\u00e1s brillantes del mundo sentaron las bases t\u00e9cnicas y comerciales para una revoluci\u00f3n del modelo de base rob\u00f3tica que redefinir\u00e1 el futuro de la inteligencia artificial.<\/p>\n
Si bien estos modelos de IA se han construido de manera similar a GPT, lograr una autonom\u00eda a nivel humano en el mundo f\u00edsico es un desaf\u00edo cient\u00edfico diferente por dos razones:<\/p>\n
\n
- La creaci\u00f3n de un producto basado en IA que pueda servir en una variedad de entornos del mundo real tiene un conjunto notable de requisitos f\u00edsicos complejos. La IA debe adaptarse a diferentes aplicaciones de hardware, ya que es dudoso que un hardware funcione en varias industrias (log\u00edstica, transporte, manufactura, comercio minorista, agricultura, atenci\u00f3n m\u00e9dica, etc.) y actividades dentro de cada sector.<\/li>\n
- Los almacenes y centros de distribuci\u00f3n son un entorno de aprendizaje ideal para los modelos de IA en el mundo f\u00edsico. Es com\u00fan tener cientos de miles o incluso millones de unidades de almacenamiento (SKU) diferentes fluyendo a trav\u00e9s de cualquier instalaci\u00f3n en un momento dado, entregando el conjunto de datos grande, patentado y de alta calidad necesario para entrenar el \u00abGPT para rob\u00f3tica\u00bb.<\/li>\n<\/ol>\n
El \u201cmomento GPT\u201d de la rob\u00f3tica IA est\u00e1 cerca<\/h2>\n
La trayectoria de crecimiento de los modelos de bases rob\u00f3ticas se est\u00e1 acelerando a un ritmo muy r\u00e1pido. Las aplicaciones rob\u00f3ticas, particularmente en tareas que requieren manipulaci\u00f3n precisa de objetos, ya se est\u00e1n aplicando en entornos de producci\u00f3n del mundo real, y veremos un n\u00famero exponencial de aplicaciones rob\u00f3ticas comercialmente viables implementadas a escala en 2024.<\/p>\n
Chen ha publicado m\u00e1s de 30 art\u00edculos acad\u00e9micos que han aparecido en las principales revistas mundiales de inteligencia artificial y aprendizaje autom\u00e1tico.<\/p>\n<\/p><\/div>\n