Meta lanza Code Llama, una versión codificada de Llama 2


Cuando se lanzó Meta Llama 2, un poderoso modelo de inteligencia artificial similar al que está detrás de ChatGPT, hizo posible el mes pasado que desarrolladores, nuevas empresas e investigadores jugaran con el tipo de IA que ha cautivado al mundo durante casi un año.

Hoy, Meta continúa con el lanzamiento de Code Llama, una versión del modelo que ha sido optimizada para tareas de programación. El lanzamiento podría significar que más desarrolladores prueben la codificación asistida por IA. También podría inspirar nuevas formas de incorporar la IA al software. Y podría ayudar a establecer aún más a Meta como el proveedor preeminente de herramientas de IA «abiertas».

«Es emocionante que estén liberando los pesos a la comunidad», dice Deepak Kumar, un investigador postdoctoral en Stanford que ha estudiado la codificación de IA, refiriéndose a los parámetros de la red neuronal en el núcleo del modelo.

Kumar dice que el lanzamiento del modelo de lenguaje regular de Meta, Llama 2, llevó a la formación de comunidades dedicadas a discutir cómo se comporta y cómo se puede modificar. «Nos da un poco más de flexibilidad para jugar con lo que sucede exactamente bajo el capó, en comparación con estos modelos de código cerrado de Google u OpenAI».

Kumar dice que es probable que los desarrolladores creen nuevos tipos de aplicaciones utilizando Code Llama. Por ejemplo, podría ser posible crear un asistente de programación que realice varias comprobaciones de seguridad adicionales antes de recomendar un fragmento de código, afirma Kumar, cuya propia investigación ha explorado cómo la asistencia de la IA a veces puede conducir a un código menos seguro. Kumar añade que el lanzamiento podría inspirar la creación de asistentes especializados para tipos particulares de codificación. «Se pueden crear todo tipo de herramientas sobre el modelo», afirma.

Talia Ringer, profesora asistente de la Universidad de Illinois Urbana-Champaign que investiga programación, dice que Code Llama será valioso para la investigación académica. Ya tengo estudiantes que utilizan modelos Llama para investigación y pude ver que esos estudiantes están muy entusiasmados con un modelo de código dada la naturaleza de nuestro trabajo”, dice. Pero Ringer agrega que, idealmente, los datos utilizados para el entrenamiento también se publicarían. «A menudo, esa es la pieza que falta para dar sentido a la investigación sobre los LLM», dice ella.

La programación es un área en la que los recientes avances en IA ya han tenido un impacto considerable.

En mayo de 2021, GitHub, una subsidiaria de Microsoft, lanzó Copilot, un complemento para programas de codificación que completa automáticamente secciones de código basándose en la primera línea o un comentario escrito por el usuario. Copilot usa una versión de GPT de Open AI, el modelo de lenguaje grande detrás de ChatGPT. Ese modelo se entrena aún más utilizando el código que GitHub almacena para los desarrolladores, así como, según se informa, por contratistas a quienes se les paga para anotar su propio código.

GitHub enfrenta una demanda por usar código fuente abierto en sus datos de entrenamiento, y Masad dice que es probable que Meta haya limitado los datos de entrenamiento para evitar tales complicaciones. Copilot cuesta $ 10 por mes para individuos y $ 19 por mes, por usuario, para empresas.



Source link-46