{"id":183679,"date":"2022-09-21T22:23:42","date_gmt":"2022-09-21T22:23:42","guid":{"rendered":"https:\/\/magazineoffice.com\/nvidia-lanza-nuevos-servicios-para-entrenar-modelos-de-lenguajes-grandes-techcrunch\/"},"modified":"2022-09-21T22:23:44","modified_gmt":"2022-09-21T22:23:44","slug":"nvidia-lanza-nuevos-servicios-para-entrenar-modelos-de-lenguajes-grandes-techcrunch","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/nvidia-lanza-nuevos-servicios-para-entrenar-modelos-de-lenguajes-grandes-techcrunch\/","title":{"rendered":"Nvidia lanza nuevos servicios para entrenar modelos de lenguajes grandes \u2022 TechCrunch"},"content":{"rendered":"<p> <br \/>\n<\/p>\n<div id=\"\">\n<div class=\"article__featured-image-wrapper breakout\"><\/div>\n<\/p><\/div>\n<div>\n<p id=\"speakable-summary\">A medida que crece el inter\u00e9s en torno a los grandes modelos de IA, en particular los modelos de lenguaje grande (LLM) como GPT-3 de OpenAI, Nvidia busca sacar provecho de los nuevos servicios totalmente administrados y basados \u200b\u200ben la nube orientados a los desarrolladores de software empresarial. <span style=\"font-size: 1rem; letter-spacing: -0.1px;\">Hoy, en la conferencia GTC de oto\u00f1o de 2022 de la compa\u00f1\u00eda, Nvidia anunci\u00f3 NeMo LLM Service y BioNeMo LLM Service, que aparentemente facilitan la adaptaci\u00f3n de LLM y la implementaci\u00f3n de aplicaciones impulsadas por IA para una variedad de casos de uso que incluyen generaci\u00f3n y resumen de texto, predicci\u00f3n de estructura de prote\u00ednas y m\u00e1s.<\/span><\/p>\n<p>Las nuevas ofertas son parte de NeMo de Nvidia, un conjunto de herramientas de c\u00f3digo abierto para IA conversacional, y est\u00e1n dise\u00f1adas para minimizar, o incluso eliminar, la necesidad de que los desarrolladores construyan LLM desde cero.  Los LLM suelen ser costosos de desarrollar y capacitar, con un modelo reciente, PaLM de Google, que cuesta entre $ 9 millones y $ 23 millones aprovechando los recursos inform\u00e1ticos en la nube disponibles p\u00fablicamente.<\/p>\n<p>Con el servicio NeMo LLM, los desarrolladores pueden crear modelos que var\u00edan en tama\u00f1o desde 3 mil millones hasta 530 mil millones de par\u00e1metros con datos personalizados en minutos u horas, afirma Nvidia.  (Los par\u00e1metros son las partes del modelo aprendidas de los datos de entrenamiento hist\u00f3ricos; en otras palabras, las variables que informan las predicciones del modelo, como el texto que genera). Los modelos se pueden personalizar usando una t\u00e9cnica llamada aprendizaje r\u00e1pido, que seg\u00fan Nvidia permite a los desarrolladores Adapte modelos entrenados con miles de millones de puntos de datos para aplicaciones particulares espec\u00edficas de la industria, por ejemplo, un chatbot de servicio al cliente, utilizando unos pocos cientos de ejemplos.<\/p>\n<p>Los desarrolladores pueden personalizar modelos para m\u00faltiples casos de uso en un entorno de \u00abpatio de recreo\u00bb sin c\u00f3digo, que tambi\u00e9n ofrece caracter\u00edsticas para la experimentaci\u00f3n.  Una vez listos para implementar, los modelos ajustados pueden ejecutarse en instancias en la nube, sistemas locales o a trav\u00e9s de una API.<\/p>\n<p>El servicio LLM de BioNeMo es similar al servicio LLM, pero con ajustes para los clientes de ciencias de la vida.  Como parte de la plataforma Clara Discovery de Nvidia y pronto disponible en acceso temprano en Nvidia GPU Cloud, incluye dos modelos de lenguaje para aplicaciones de qu\u00edmica y biolog\u00eda, as\u00ed como soporte para datos de prote\u00ednas, ADN y qu\u00edmica, dice Nvidia.<\/p>\n<div id=\"attachment_2402062\" style=\"width: 1611px\" class=\"wp-caption aligncenter\"><img decoding=\"async\" aria-describedby=\"caption-attachment-2402062\" loading=\"lazy\" class=\"wp-image-2402062 size-full\" src=\"https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png\" alt=\"Nvidia LLM\" width=\"1601\" height=\"901\" srcset=\"https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png 1601w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=150,84 150w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=300,169 300w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=768,432 768w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=680,383 680w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=1536,864 1536w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=1200,675 1200w, https:\/\/techcrunch.com\/wp-content\/uploads\/2022\/09\/Large-Language-Models-for-Biology.png?resize=50,28 50w\" sizes=\"(max-width: 1601px) 100vw, 1601px\"\/><\/p>\n<p id=\"caption-attachment-2402062\" class=\"wp-caption-text\">Visualizaci\u00f3n de bioprocesos predichos por modelos de IA.<\/p>\n<\/div>\n<p>BioNeMo LLM incluir\u00e1 cuatro modelos de lenguaje previamente entrenados para comenzar, incluido un modelo de la divisi\u00f3n de I + D de IA de Meta, Meta AI Labs, que procesa secuencias de amino\u00e1cidos para generar representaciones que pueden usarse para predecir propiedades y funciones de prote\u00ednas.  Nvidia dice que en el futuro, los investigadores que utilicen el servicio BioNeMo LLM podr\u00e1n personalizar los LLM para una mayor precisi\u00f3n.<\/p>\n<p>Investigaciones recientes han demostrado que los LLM son notablemente buenos para predecir ciertos procesos biol\u00f3gicos.  Esto se debe a que las estructuras como las prote\u00ednas se pueden modelar como una especie de lenguaje, uno con un diccionario (amino\u00e1cidos) unidos para formar una oraci\u00f3n (prote\u00edna).  Por ejemplo, la divisi\u00f3n de I+D de Salesforce cre\u00f3 hace varios a\u00f1os un modelo LLM llamado ProGen que puede generar secuencias de prote\u00ednas estructural y funcionalmente viables.<\/p>\n<p>Tanto el servicio LLM de BioNeMo como el servicio LLM incluyen la opci\u00f3n de usar modelos personalizados y listos para usar a trav\u00e9s de una API en la nube.  El uso de los servicios tambi\u00e9n otorga a los clientes acceso al marco NeMo Megatron, ahora en versi\u00f3n beta abierta, que permite a los desarrolladores crear una gama de modelos LLM multiling\u00fces, incluidos modelos de lenguaje tipo GPT-3.<\/p>\n<p>Nvidia dice que las marcas de automoci\u00f3n, inform\u00e1tica, educaci\u00f3n, salud y telecomunicaciones est\u00e1n utilizando NeMo Megatron para lanzar servicios impulsados \u200b\u200bpor IA en chino, ingl\u00e9s, coreano y sueco.<\/p>\n<p>Se espera que los servicios NeMo LLM y BioNeMo y las API en la nube est\u00e9n disponibles en acceso anticipado a partir del pr\u00f3ximo mes.  En cuanto al marco NeMo Megatron, los desarrolladores pueden probarlo a trav\u00e9s de la plataforma de pilotaje LaunchPad de Nvidia sin cargo.<\/p>\n<\/p><\/div>\n<p><br \/>\n<br \/><a href=\"https:\/\/magazineoffice.com\/\">Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A medida que crece el inter\u00e9s en torno a los grandes modelos de IA, en particular los modelos de lenguaje grande (LLM) como GPT-3 de OpenAI, Nvidia busca sacar provecho&hellip;<\/p>\n","protected":false},"author":1,"featured_media":183680,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[32959,1074,1639,26583,10010,3086,843,107,63,22367],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/183679"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=183679"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/183679\/revisions"}],"predecessor-version":[{"id":183681,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/183679\/revisions\/183681"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/183680"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=183679"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=183679"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=183679"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}