{"id":736630,"date":"2023-07-19T15:42:31","date_gmt":"2023-07-19T15:42:31","guid":{"rendered":"https:\/\/magazineoffice.com\/meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto\/"},"modified":"2023-07-19T15:42:36","modified_gmt":"2023-07-19T15:42:36","slug":"meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto\/","title":{"rendered":"Meta lanza Llama 2, un conjunto m\u00e1s ‘\u00fatil’ de modelos generadores de texto"},"content":{"rendered":"
\n<\/p>\n
El panorama de la IA generativa crece d\u00eda a d\u00eda.<\/p>\n
Hoy, Meta anunci\u00f3 una nueva familia de modelos de IA, Llama 2, dise\u00f1ada para impulsar aplicaciones como ChatGPT de OpenAI, Bing Chat y otros chatbots modernos. Entrenado en una combinaci\u00f3n de datos disponibles p\u00fablicamente, Meta afirma que el rendimiento de Llama 2 mejora significativamente con respecto a la generaci\u00f3n anterior de modelos Llama.<\/p>\n
Llama 2 es la continuaci\u00f3n de Llama, una colecci\u00f3n de modelos que podr\u00edan generar texto y c\u00f3digo en respuesta a indicaciones, comparable a otros sistemas similares a chatbots. Pero Llama solo estaba disponible a pedido; Meta decidi\u00f3 bloquear el acceso a los modelos por temor a un uso indebido. (A pesar de esta medida de precauci\u00f3n, Llama luego se filtr\u00f3 en l\u00ednea y se extendi\u00f3 a varias comunidades de IA).<\/p>\n
Por el contrario, Llama 2, que es gratuito para investigaci\u00f3n y uso comercial, estar\u00e1 disponible para ajustes en AWS, Azure y la plataforma de alojamiento de modelos de IA de Hugging Face en forma preentrenada. Y ser\u00e1 m\u00e1s f\u00e1cil de ejecutar, dice Meta: optimizado para Windows gracias a una asociaci\u00f3n ampliada con Microsoft, as\u00ed como con tel\u00e9fonos inteligentes y PC que incluyen el sistema en chip Snapdragon de Qualcomm. (Qualcomm dice que est\u00e1 trabajando para llevar Llama 2 a los dispositivos Snapdragon en 2024).<\/p>\n
Entonces, \u00bfen qu\u00e9 se diferencia Llama 2 de Llama? De varias maneras, todas las cuales Meta destaca en un extenso documento t\u00e9cnico.<\/p>\n
Llama 2 viene en dos sabores, Llama 2 y Llama 2-Chat, el \u00faltimo de los cuales se ajust\u00f3 para conversaciones bidireccionales. Llama 2 y Llama 2-Chat se subdividen en versiones de sofisticaci\u00f3n variable: 7 mil millones de par\u00e1metros, 13 mil millones de par\u00e1metros y 70 mil millones de par\u00e1metros. (\u201cPar\u00e1metros\u201d son las partes de un modelo aprendidas a partir de datos de entrenamiento y esencialmente definen la habilidad del modelo en un problema, en este caso generando texto).<\/p>\n
Llama 2 se entren\u00f3 en dos billones de tokens, donde \u00abtokens\u00bb representan texto sin formato, por ejemplo, \u00abfan\u00bb, \u00abtas\u00bb y \u00abtic\u00bb para la palabra \u00abfant\u00e1stico\u00bb. Eso es casi el doble de lo que se entren\u00f3 a Llama (1,4 billones) y, en t\u00e9rminos generales, cuantos m\u00e1s tokens, mejor en lo que respecta a la IA generativa. Seg\u00fan los informes, el modelo de lenguaje grande (LLM) insignia actual de Google, PaLM 2, se entren\u00f3 en 3,6 millones de tokens, y se especula que GPT-4 tambi\u00e9n se entren\u00f3 en billones de tokens.<\/p>\n
Meta no revela las fuentes espec\u00edficas de los datos de capacitaci\u00f3n en el documento t\u00e9cnico, excepto que son de la web, principalmente en ingl\u00e9s, no de los propios productos o servicios de la empresa y enfatiza el texto de naturaleza \u00abf\u00e1ctica\u00bb.<\/p>\n
Me atrever\u00eda a suponer que la renuencia a revelar detalles de entrenamiento tiene sus ra\u00edces no solo en razones competitivas, sino tambi\u00e9n en las controversias legales que rodean a la IA generativa. Justo hoy, miles de autores firmaron una carta instando a las empresas de tecnolog\u00eda a dejar de usar su escritura para la capacitaci\u00f3n de modelos de IA sin permiso ni compensaci\u00f3n.<\/p>\n
Pero yo divago. Meta dice que en una variedad de puntos de referencia, los modelos Llama 2 funcionan ligeramente peor que los rivales de c\u00f3digo cerrado de m\u00e1s alto perfil, GPT-4 y PaLM 2, con Llama 2 muy por detr\u00e1s de GPT-4 en programaci\u00f3n de computadoras. Pero los evaluadores humanos consideran que Llama 2 es aproximadamente tan \u00ab\u00fatil\u00bb como ChatGPT, afirma Meta; Llama 2 respondi\u00f3 a la par en un conjunto de aproximadamente 4000 indicaciones dise\u00f1adas para probar la \u00abutilidad\u00bb y la \u00abseguridad\u00bb.<\/p>\n