2024 - El 'momento GPT' de la robótica de IA está cerca

Peter Chen es director ejecutivo y cofundador de Covariant, la empresa de robótica de IA líder en el mundo. Antes de fundar Covariant, Peter fue científico investigador en OpenAI e investigador en el Laboratorio de Investigación de Inteligencia Artificial de Berkeley (BAIR), donde se centró en el aprendizaje por refuerzo, el metaaprendizaje y el aprendizaje no supervisado.

No es ningún secreto que los modelos básicos han transformado la IA en el mundo digital. Los modelos de lenguajes grandes (LLM) como ChatGPT, LLaMA y Bard revolucionaron la IA para el lenguaje. Si bien los modelos GPT de OpenAI no son el único modelo de lenguaje grande disponible, han logrado el reconocimiento más generalizado por recibir entradas de texto e imágenes y brindar respuestas similares a las humanas, incluso con algunas tareas que requieren resolución de problemas complejos y razonamiento avanzado.

La adopción viral y generalizada de ChatGPT ha dado forma en gran medida a cómo la sociedad entiende este nuevo momento para la inteligencia artificial.

El próximo avance que definirá la IA durante generaciones es la robótica. La construcción de robots impulsados por IA que puedan aprender a interactuar con el mundo físico mejorará todas las formas de trabajo repetitivo en sectores que van desde la logística, el transporte y la manufactura hasta el comercio minorista, la agricultura e incluso la atención médica. También desbloqueará tantas eficiencias en el mundo físico como las que hemos visto en el mundo digital durante las últimas décadas.

Si bien existe un conjunto único de problemas que resolver dentro de la robótica en comparación con el lenguaje, existen similitudes entre los conceptos fundamentales centrales. Y algunas de las mentes más brillantes en IA han logrado avances significativos en la construcción del «GPT para la robótica».

¿Qué permite el éxito de GPT?

Para comprender cómo construir el «GPT para la robótica», primero observe los pilares centrales que han permitido el éxito de LLM como GPT.

Enfoque del modelo de base

GPT es un modelo de IA entrenado en un conjunto de datos amplio y diverso. Los ingenieros previamente recopilaron datos y entrenaron IA específica para un problema específico. Luego necesitarían recopilar nuevos datos para resolver otro. ¿Otro problema? Nuevos datos una vez más. Ahora, con un enfoque de modelo básico, está sucediendo exactamente lo contrario.

En lugar de crear IA especializadas para cada caso de uso, se puede utilizar una de forma universal. Y ese modelo muy general tiene más éxito que cualquier modelo especializado. La IA en un modelo básico funciona mejor en una tarea específica. Puede aprovechar lo aprendido de otras tareas y generalizarlo mejor a nuevas tareas porque ha aprendido habilidades adicionales al tener que desempeñarse bien en un conjunto diverso de tareas.

Capacitación en un conjunto de datos grande, propietario y de alta calidad

Para tener una IA generalizada, primero es necesario acceder a una gran cantidad de datos diversos. OpenAI obtuvo los datos del mundo real necesarios para entrenar los modelos GPT de manera razonablemente eficiente. GPT se ha entrenado con datos recopilados de todo Internet con un conjunto de datos grande y diverso, que incluye libros, artículos de noticias, publicaciones en redes sociales, códigos y más.

La construcción de robots impulsados por IA que puedan aprender a interactuar con el mundo físico mejorará todas las formas de trabajo repetitivo.

No es sólo el tamaño del conjunto de datos lo que importa; La curación de datos de alta calidad y valor también juega un papel muy importante. Los modelos GPT han logrado un rendimiento sin precedentes porque sus conjuntos de datos de alta calidad se basan principalmente en las tareas que interesan a los usuarios y las respuestas más útiles.

Papel del aprendizaje por refuerzo (RL)

OpenAI emplea aprendizaje reforzado a partir de retroalimentación humana (RLHF) para alinear la respuesta del modelo con las preferencias humanas (por ejemplo, lo que se considera beneficioso para un usuario). Es necesario que haya algo más que puro aprendizaje supervisado (SL), porque el SL sólo puede abordar un problema con un patrón claro o un conjunto de ejemplos. Los LLM requieren que la IA alcance un objetivo sin una respuesta única y correcta. Entra RLHF.

RLHF permite que el algoritmo avance hacia una meta mediante prueba y error mientras un humano reconoce las respuestas correctas (recompensa alta) o rechaza las incorrectas (recompensa baja). La IA encuentra la función de recompensa que mejor explica la preferencia humana y luego usa RL para aprender cómo llegar allí. ChatGPT puede ofrecer respuestas que reflejen o superen las capacidades a nivel humano al aprender de los comentarios humanos.

La próxima frontera de los modelos de cimentación está en la robótica

La misma tecnología central que permite a GPT ver, pensar e incluso hablar también permite a las máquinas ver, pensar y actuar. Los robots impulsados por un modelo básico pueden comprender su entorno físico, tomar decisiones informadas y adaptar sus acciones a circunstancias cambiantes.

El “GPT para la robótica” se está construyendo de la misma manera que el GPT: sentando las bases para una revolución que, una vez más, redefinirá la IA tal como la conocemos.

Enfoque del modelo de base

Al adoptar un enfoque de modelo básico, también se puede crear una IA que funcione en múltiples tareas en el mundo físico. Hace unos años, los expertos aconsejaron crear una IA especializada para robots que recogen y empaquetan alimentos. Y eso es diferente de un modelo que puede clasificar varias piezas eléctricas, que es diferente del modelo que descarga paletas de un camión.

Este cambio de paradigma hacia un modelo básico permite que la IA responda mejor a escenarios extremos que frecuentemente existen en entornos no estructurados del mundo real y que, de otro modo, podrían confundir modelos con un entrenamiento más limitado. Construir una IA generalizada para todos estos escenarios es más exitoso. Es entrenando en todo lo que se obtiene la autonomía a nivel humano que nos faltaba en las generaciones anteriores de robots.

Capacitación en un conjunto de datos grande, propietario y de alta calidad

Enseñar a un robot a aprender qué acciones conducen al éxito y cuáles al fracaso es extremadamente difícil. Requiere datos extensos de alta calidad basados en interacciones físicas del mundo real. Los entornos de laboratorio individuales o los ejemplos de video son fuentes poco confiables o lo suficientemente sólidas (por ejemplo, los videos de YouTube no logran traducir los detalles de la interacción física y los conjuntos de datos académicos tienden a tener un alcance limitado).

A diferencia de la IA para el procesamiento del lenguaje o de imágenes, ningún conjunto de datos preexistente representa cómo deberían interactuar los robots con el mundo físico. Por lo tanto, un conjunto de datos grande y de alta calidad se convierte en un desafío más complejo de resolver en robótica, y desplegar una flota de robots en producción es la única manera de construir un conjunto de datos diverso.

Papel del aprendizaje por refuerzo

De manera similar a responder preguntas de texto con capacidad de nivel humano, el control y la manipulación robóticos requieren que un agente busque el progreso hacia una meta que no tiene una respuesta única, única y correcta (por ejemplo, «¿Cuál es una manera exitosa de recoger esta cebolla roja?»). . Una vez más, se requiere algo más que puro aprendizaje supervisado.

Necesita un robot que ejecute aprendizaje por refuerzo profundo (RL profundo) para tener éxito en la robótica. Este enfoque autónomo de autoaprendizaje combina la realidad virtual con redes neuronales profundas para desbloquear niveles más altos de rendimiento: la IA adaptará automáticamente sus estrategias de aprendizaje y continuará afinando sus habilidades a medida que experimente nuevos escenarios.

Se acerca un crecimiento desafiante y explosivo

En los últimos años, algunos de los expertos en inteligencia artificial y robótica más brillantes del mundo sentaron las bases técnicas y comerciales para una revolución del modelo de base robótica que redefinirá el futuro de la inteligencia artificial.

Si bien estos modelos de IA se han construido de manera similar a GPT, lograr una autonomía a nivel humano en el mundo físico es un desafío científico diferente por dos razones:

La creación de un producto basado en IA que pueda servir en una variedad de entornos del mundo real tiene un conjunto notable de requisitos físicos complejos. La IA debe adaptarse a diferentes aplicaciones de hardware, ya que es dudoso que un hardware funcione en varias industrias (logística, transporte, manufactura, comercio minorista, agricultura, atención médica, etc.) y actividades dentro de cada sector.
Los almacenes y centros de distribución son un entorno de aprendizaje ideal para los modelos de IA en el mundo físico. Es común tener cientos de miles o incluso millones de unidades de almacenamiento (SKU) diferentes fluyendo a través de cualquier instalación en un momento dado, entregando el conjunto de datos grande, patentado y de alta calidad necesario para entrenar el «GPT para robótica».

El “momento GPT” de la robótica IA está cerca

La trayectoria de crecimiento de los modelos de bases robóticas se está acelerando a un ritmo muy rápido. Las aplicaciones robóticas, particularmente en tareas que requieren manipulación precisa de objetos, ya se están aplicando en entornos de producción del mundo real, y veremos un número exponencial de aplicaciones robóticas comercialmente viables implementadas a escala en 2024.

Chen ha publicado más de 30 artículos académicos que han aparecido en las principales revistas mundiales de inteligencia artificial y aprendizaje automático.

Source link-48

Valérie Hayer en Les Sables-d’Olonne se reúne con pescadores, Raphaël Glucksmann presenta su doctrina para “construir la Europa de 2030”

El shooter de saqueadores gratuito del desarrollador DayZ llega a Steam y en realidad cuesta $20

Rylan revela que ha lanzado música en secreto bajo un seudónimo

Las estrellas de ‘So Help Me Todd’ se lamentan del inesperado final de la serie en despedidas en línea: «La despedida es un dolor tan dulce»

El ‘momento GPT’ de la robótica de IA está cerca

¿Qué permite el éxito de GPT?

Enfoque del modelo de base

Capacitación en un conjunto de datos grande, propietario y de alta calidad

Papel del aprendizaje por refuerzo (RL)

La próxima frontera de los modelos de cimentación está en la robótica

Enfoque del modelo de base

Capacitación en un conjunto de datos grande, propietario y de alta calidad

Papel del aprendizaje por refuerzo

Se acerca un crecimiento desafiante y explosivo

El “momento GPT” de la robótica IA está cerca