Meta confirma que su LLM de código abierto Llama 3 llegará el próximo mes


En un evento en Londres el martes, Meta confirmó que planea un lanzamiento inicial de Llama 3, la próxima generación de su gran modelo de lenguaje utilizado para impulsar asistentes de IA generativa, dentro del próximo mes.

Esto confirma un informe publicado el lunes por The Information de que Meta estaba cerca de su lanzamiento.

«Dentro del próximo mes, en realidad menos, con suerte en un período de tiempo muy corto, esperamos comenzar a implementar nuestro nuevo conjunto de modelos básicos de próxima generación, Llama 3», dijo Nick Clegg, presidente de asuntos globales de Meta. Describió lo que parece ser el lanzamiento de varias iteraciones o versiones diferentes del producto. “Habrá varios modelos diferentes con diferentes capacidades, diferentes versatilidades [released] durante el transcurso de este año, comenzando muy pronto”.

El plan, agregó Chris Cox, director de productos de Meta, será impulsar múltiples productos en Meta con Llama 3.

Meta ha estado luchando por alcanzar a OpenAI, lo que la tomó por sorpresa a ella y a otras grandes empresas tecnológicas como Google cuando lanzó ChatGPT hace más de un año y la aplicación se volvió viral, convirtiendo preguntas y respuestas generativas de IA en experiencias cotidianas y convencionales.

Meta ha adoptado en gran medida un enfoque muy cauteloso con la IA, pero eso no le ha ido bien al público, y las versiones anteriores de Llama fueron criticadas por ser demasiado limitadas. (Llama 2 se lanzó públicamente en julio de 2023. La primera versión de Llama no se lanzó al público, pero aún así se filtró en línea).

Se espera que Llama 3, que tiene un alcance mayor que sus predecesores, aborde esto, con capacidades no sólo para responder preguntas con mayor precisión sino también para responder a una gama más amplia de preguntas que podrían incluir temas más controvertidos. Espera que esto haga que el producto tenga éxito entre los usuarios.

«Nuestro objetivo a largo plazo es hacer que una Meta AI impulsada por Llama sea el asistente más útil del mundo», dijo Joelle Pineau, vicepresidenta de AI Research. «Queda bastante trabajo por delante para llegar allí». La compañía no habló sobre el tamaño de los parámetros que está utilizando en Llama 3, ni ofreció demostraciones de cómo funcionaría. Se espera que tenga alrededor de 140 mil millones de parámetros, en comparación con los 70 mil millones del modelo Llama 2 más grande.

En particular, las familias Llama de Meta, creadas como productos de código abierto, representan un enfoque filosófico diferente sobre cómo debería desarrollarse la IA como una tecnología más amplia. Al hacerlo, Meta espera ganarse el favor de los desarrolladores frente a los modelos más propietarios.

Pero parece que Meta también está actuando con más cautela, especialmente cuando se trata de otras IA generativas más allá de la generación de texto. La compañía aún no ha lanzado Emu, su herramienta de generación de imágenes, dijo Pineau.

«La latencia es muy importante, junto con la seguridad y la facilidad de uso, para generar imágenes de las que estés orgulloso y que representen cualquiera que sea tu contexto creativo», dijo Cox.

Irónicamente, o tal vez como era de esperar (je), incluso cuando Meta trabaja para lanzar Llama 3, tiene algunos escépticos importantes de la IA generativa en casa.

Yann LeCun, el célebre académico de IA que también es el científico jefe de IA de Meta, criticó las limitaciones de la IA generativa en general y dijo que su apuesta está en lo que viene después. Predice que será una arquitectura de predicción de integración conjunta (JEPA), un enfoque diferente tanto para entrenar modelos como para producir resultados, que Meta ha estado utilizando para construir una IA predictiva más precisa en el área de generación de imágenes.

“El futuro de la IA es JEPA. No es IA generativa”, dijo. «Tendremos que cambiar el nombre de la división de productos de Chris».



Source link-48