{"id":815399,"date":"2023-09-19T19:35:58","date_gmt":"2023-09-19T19:35:58","guid":{"rendered":"https:\/\/magazineoffice.com\/en-lugar-de-ajustar-un-llm-como-primer-enfoque-intente-disenar-una-arquitectura-rapida\/"},"modified":"2023-09-19T19:36:02","modified_gmt":"2023-09-19T19:36:02","slug":"en-lugar-de-ajustar-un-llm-como-primer-enfoque-intente-disenar-una-arquitectura-rapida","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/en-lugar-de-ajustar-un-llm-como-primer-enfoque-intente-disenar-una-arquitectura-rapida\/","title":{"rendered":"En lugar de ajustar un LLM como primer enfoque, intente dise\u00f1ar una arquitectura r\u00e1pida."},"content":{"rendered":"
\n<\/p>\n
\n\t\t\t\t\t\t\tVictoria Albrecht<\/span> En medio de lo generativo<\/span> Con la irrupci\u00f3n de la IA, los directores de innovaci\u00f3n est\u00e1n reforzando el departamento de TI de sus empresas en busca de chatbots o LLM personalizados. Quieren ChatGPT pero con informaci\u00f3n espec\u00edfica del dominio que respalde una amplia funcionalidad, seguridad y cumplimiento de los datos, y mayor precisi\u00f3n y relevancia.<\/p>\n A menudo surge la pregunta: \u00bfDeber\u00edan crear un LLM desde cero o perfeccionar uno existente con sus propios datos? Para la mayor\u00eda de las empresas, ambas opciones no son pr\u00e1cticas. Este es el por qu\u00e9.<\/p>\n TL; DR: Dada la secuencia correcta de indicaciones, los LLM son notablemente inteligentes a la hora de ceder a su voluntad. No es necesario modificar el LLM en s\u00ed ni sus datos de capacitaci\u00f3n para adaptarlo a datos o informaci\u00f3n de dominio espec\u00edficos.<\/p>\n Se recomienda realizar esfuerzos exhaustivos para construir una \u201carquitectura r\u00e1pida\u201d integral antes de considerar alternativas m\u00e1s costosas. Este enfoque est\u00e1 dise\u00f1ado para maximizar el valor extra\u00eddo de una variedad de mensajes, mejorando las herramientas basadas en API.<\/p>\n \t\t\tTL; DR: Dada la secuencia correcta de indicaciones, los LLM son notablemente inteligentes a la hora de ceder a su voluntad.\t\t\t\t\t<\/p><\/blockquote><\/div>\n Si esto resulta insuficiente (en una minor\u00eda de casos), entonces<\/em> Se podr\u00eda considerar un proceso de ajuste (que a menudo es m\u00e1s costoso debido a la preparaci\u00f3n de datos que implica). Construir uno desde cero casi siempre est\u00e1 fuera de discusi\u00f3n.<\/p>\n El resultado buscado es encontrar una manera de aprovechar sus documentos existentes para crear soluciones personalizadas que automaticen de manera precisa, r\u00e1pida y segura la ejecuci\u00f3n de tareas frecuentes o la respuesta a consultas frecuentes. La arquitectura r\u00e1pida se destaca como el camino m\u00e1s eficiente y rentable para lograrlo.<\/p>\n Si est\u00e1 pensando en realizar una arquitectura r\u00e1pida, probablemente ya haya explorado el concepto de ajuste. Aqu\u00ed est\u00e1 la distinci\u00f3n clave entre los dos:<\/p>\n Si bien el ajuste implica modificar el LLM fundamental subyacente, la arquitectura r\u00e1pida no.<\/p>\n El ajuste es un esfuerzo sustancial que implica volver a capacitar a un segmento de un LLM con un gran conjunto de datos nuevo, idealmente su conjunto de datos patentado. Este proceso dota al LLM de conocimientos espec\u00edficos de un dominio, intentando adaptarlo a su industria y contexto empresarial.<\/p>\n Por el contrario, la arquitectura r\u00e1pida implica aprovechar los LLM existentes sin modificar el modelo en s\u00ed ni sus datos de entrenamiento. En cambio, combina una serie de indicaciones complejas e inteligentemente dise\u00f1adas para ofrecer resultados consistentes.<\/p>\n
\n\t\t\t\t\t\tContribuyente<\/span>\n\t\t<\/p>\n<\/p><\/div>\n<\/p><\/div>\n<\/div>\n\n
\u00bfCu\u00e1l es la diferencia entre arquitectura r\u00e1pida y ajuste fino?<\/h2>\n
El ajuste es apropiado para empresas con los requisitos de privacidad de datos m\u00e1s estrictos (por ejemplo, bancos)\t\t\t<\/h2>\n<\/div>\n