{"id":736630,"date":"2023-07-19T15:42:31","date_gmt":"2023-07-19T15:42:31","guid":{"rendered":"https:\/\/magazineoffice.com\/meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto\/"},"modified":"2023-07-19T15:42:36","modified_gmt":"2023-07-19T15:42:36","slug":"meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/meta-lanza-llama-2-un-conjunto-mas-util-de-modelos-generadores-de-texto\/","title":{"rendered":"Meta lanza Llama 2, un conjunto m\u00e1s ‘\u00fatil’ de modelos generadores de texto"},"content":{"rendered":"


\n<\/p>\n

\n

El panorama de la IA generativa crece d\u00eda a d\u00eda.<\/p>\n

Hoy, Meta anunci\u00f3 una nueva familia de modelos de IA, Llama 2, dise\u00f1ada para impulsar aplicaciones como ChatGPT de OpenAI, Bing Chat y otros chatbots modernos. Entrenado en una combinaci\u00f3n de datos disponibles p\u00fablicamente, Meta afirma que el rendimiento de Llama 2 mejora significativamente con respecto a la generaci\u00f3n anterior de modelos Llama.<\/p>\n

Llama 2 es la continuaci\u00f3n de Llama, una colecci\u00f3n de modelos que podr\u00edan generar texto y c\u00f3digo en respuesta a indicaciones, comparable a otros sistemas similares a chatbots. Pero Llama solo estaba disponible a pedido; Meta decidi\u00f3 bloquear el acceso a los modelos por temor a un uso indebido. (A pesar de esta medida de precauci\u00f3n, Llama luego se filtr\u00f3 en l\u00ednea y se extendi\u00f3 a varias comunidades de IA).<\/p>\n

Por el contrario, Llama 2, que es gratuito para investigaci\u00f3n y uso comercial, estar\u00e1 disponible para ajustes en AWS, Azure y la plataforma de alojamiento de modelos de IA de Hugging Face en forma preentrenada. Y ser\u00e1 m\u00e1s f\u00e1cil de ejecutar, dice Meta: optimizado para Windows gracias a una asociaci\u00f3n ampliada con Microsoft, as\u00ed como con tel\u00e9fonos inteligentes y PC que incluyen el sistema en chip Snapdragon de Qualcomm. (Qualcomm dice que est\u00e1 trabajando para llevar Llama 2 a los dispositivos Snapdragon en 2024).<\/p>\n

Entonces, \u00bfen qu\u00e9 se diferencia Llama 2 de Llama? De varias maneras, todas las cuales Meta destaca en un extenso documento t\u00e9cnico.<\/p>\n

Llama 2 viene en dos sabores, Llama 2 y Llama 2-Chat, el \u00faltimo de los cuales se ajust\u00f3 para conversaciones bidireccionales. Llama 2 y Llama 2-Chat se subdividen en versiones de sofisticaci\u00f3n variable: 7 mil millones de par\u00e1metros, 13 mil millones de par\u00e1metros y 70 mil millones de par\u00e1metros. (\u201cPar\u00e1metros\u201d son las partes de un modelo aprendidas a partir de datos de entrenamiento y esencialmente definen la habilidad del modelo en un problema, en este caso generando texto).<\/p>\n

Llama 2 se entren\u00f3 en dos billones de tokens, donde \u00abtokens\u00bb representan texto sin formato, por ejemplo, \u00abfan\u00bb, \u00abtas\u00bb y \u00abtic\u00bb para la palabra \u00abfant\u00e1stico\u00bb. Eso es casi el doble de lo que se entren\u00f3 a Llama (1,4 billones) y, en t\u00e9rminos generales, cuantos m\u00e1s tokens, mejor en lo que respecta a la IA generativa. Seg\u00fan los informes, el modelo de lenguaje grande (LLM) insignia actual de Google, PaLM 2, se entren\u00f3 en 3,6 millones de tokens, y se especula que GPT-4 tambi\u00e9n se entren\u00f3 en billones de tokens.<\/p>\n

Meta no revela las fuentes espec\u00edficas de los datos de capacitaci\u00f3n en el documento t\u00e9cnico, excepto que son de la web, principalmente en ingl\u00e9s, no de los propios productos o servicios de la empresa y enfatiza el texto de naturaleza \u00abf\u00e1ctica\u00bb.<\/p>\n

Me atrever\u00eda a suponer que la renuencia a revelar detalles de entrenamiento tiene sus ra\u00edces no solo en razones competitivas, sino tambi\u00e9n en las controversias legales que rodean a la IA generativa. Justo hoy, miles de autores firmaron una carta instando a las empresas de tecnolog\u00eda a dejar de usar su escritura para la capacitaci\u00f3n de modelos de IA sin permiso ni compensaci\u00f3n.<\/p>\n

Pero yo divago. Meta dice que en una variedad de puntos de referencia, los modelos Llama 2 funcionan ligeramente peor que los rivales de c\u00f3digo cerrado de m\u00e1s alto perfil, GPT-4 y PaLM 2, con Llama 2 muy por detr\u00e1s de GPT-4 en programaci\u00f3n de computadoras. Pero los evaluadores humanos consideran que Llama 2 es aproximadamente tan \u00ab\u00fatil\u00bb como ChatGPT, afirma Meta; Llama 2 respondi\u00f3 a la par en un conjunto de aproximadamente 4000 indicaciones dise\u00f1adas para probar la \u00abutilidad\u00bb y la \u00abseguridad\u00bb.<\/p>\n

\n

Los modelos Llama 2 de Meta pueden responder preguntas en emoji. Cr\u00e9ditos de imagen:<\/strong> Meta<\/p>\n<\/div>\n

Sin embargo, tome los resultados con pinzas. Meta reconoce que sus pruebas no pueden capturar todos los escenarios del mundo real y que sus puntos de referencia podr\u00edan carecer de diversidad; en otras palabras, no cubrir \u00e1reas como la codificaci\u00f3n y el razonamiento humano lo suficiente.<\/p>\n

Meta tambi\u00e9n admite que Llama 2, como todos los modelos generativos de IA, tiene sesgos en ciertos ejes. Por ejemplo, es propenso a generar pronombres \u00ab\u00e9l\u00bb a un ritmo mayor que los pronombres \u00abella\u00bb gracias a los desequilibrios en los datos de entrenamiento. Como resultado del texto t\u00f3xico en los datos de entrenamiento, no supera a otros modelos en los puntos de referencia de toxicidad. Y Llama 2 tiene un sesgo occidental, gracias una vez m\u00e1s a los desequilibrios de datos que incluyen una gran cantidad de palabras \u00abcristiano\u00bb, \u00abcat\u00f3lico\u00bb y \u00abjud\u00edo\u00bb.<\/p>\n

Los modelos Llama 2-Chat funcionan mejor que los modelos Llama 2 en los puntos de referencia internos de \u201cutilidad\u201d y toxicidad de Meta. Pero tambi\u00e9n tienden a ser demasiado cautelosos, y los modelos se equivocan al rechazar ciertas solicitudes o responder con demasiados detalles de seguridad.<\/p>\n

Para ser justos, los puntos de referencia no tienen en cuenta las capas de seguridad adicionales que podr\u00edan aplicarse a los modelos Llama 2 alojados. Como parte de su colaboraci\u00f3n con Microsoft, por ejemplo, Meta usa Azure AI Content Safety, un servicio dise\u00f1ado para detectar contenido \u00abinapropiado\u00bb en im\u00e1genes y texto generados por IA, para reducir las salidas t\u00f3xicas de Llama 2 en Azure.<\/p>\n

Siendo este el caso, Meta a\u00fan hace todo lo posible por distanciarse de los resultados potencialmente da\u00f1inos que involucran a Llama 2, enfatizando en el documento t\u00e9cnico que los usuarios de Llama 2 deben cumplir con los t\u00e9rminos de la licencia de Meta y la pol\u00edtica de uso aceptable, adem\u00e1s de las pautas sobre \u00abdesarrollo seguro y despliegue.\u00bb<\/p>\n

\u201cCreemos que compartir abiertamente los grandes modelos de lenguaje actuales tambi\u00e9n apoyar\u00e1 el desarrollo de una IA generativa \u00fatil y m\u00e1s segura\u201d, escribe Meta en una publicaci\u00f3n de blog. \u201cEsperamos ver lo que el mundo construye con Llama 2\u201d.<\/p>\n

Sin embargo, dada la naturaleza de los modelos de c\u00f3digo abierto, no se sabe c\u00f3mo, o d\u00f3nde, se pueden usar exactamente los modelos. Con la velocidad del rayo a la que se mueve Internet, no pasar\u00e1 mucho tiempo antes de que lo descubramos.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

El panorama de la IA generativa crece d\u00eda a d\u00eda. Hoy, Meta anunci\u00f3 una nueva familia de modelos de IA, Llama 2, dise\u00f1ada para impulsar aplicaciones como ChatGPT de OpenAI,…<\/p>\n","protected":false},"author":1,"featured_media":736631,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[10114,29206,1639,1300,84,9842,10010,12211,5644],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/736630"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=736630"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/736630\/revisions"}],"predecessor-version":[{"id":736632,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/736630\/revisions\/736632"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/736631"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=736630"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=736630"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=736630"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}