{"id":726980,"date":"2023-07-12T05:56:45","date_gmt":"2023-07-12T05:56:45","guid":{"rendered":"https:\/\/magazineoffice.com\/el-pionero-del-motor-de-busqueda-de-china-presenta-un-modelo-de-lenguaje-grande-de-codigo-abierto-para-competir-con-openai\/"},"modified":"2023-07-12T05:56:50","modified_gmt":"2023-07-12T05:56:50","slug":"el-pionero-del-motor-de-busqueda-de-china-presenta-un-modelo-de-lenguaje-grande-de-codigo-abierto-para-competir-con-openai","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/el-pionero-del-motor-de-busqueda-de-china-presenta-un-modelo-de-lenguaje-grande-de-codigo-abierto-para-competir-con-openai\/","title":{"rendered":"El pionero del motor de b\u00fasqueda de China presenta un modelo de lenguaje grande de c\u00f3digo abierto para competir con OpenAI"},"content":{"rendered":"
\n<\/p>\n
En febrero, el fundador de Sogou, Wang Xiaochuan, dijo en Weibo que \u201cChina necesita su propia OpenAI\u201d. El empresario chino ahora est\u00e1 cada vez m\u00e1s cerca de su sue\u00f1o cuando su nueva empresa Baichuan Intelligence lanz\u00f3 hoy su modelo de lenguaje grande de pr\u00f3xima generaci\u00f3n Baichuan-13B.<\/p>\n
Baichuan se promociona como uno de los desarrolladores de LLM m\u00e1s prometedores de China, gracias al pasado hist\u00f3rico de su fundador como un prodigio de la inform\u00e1tica de la Universidad de Tsinghua y la fundaci\u00f3n del proveedor de motores de b\u00fasqueda Sogou, que luego fue adquirido por Tencent.<\/p>\n
Wang renunci\u00f3 a Sogou a fines de 2021. Mientras ChatGPT arrasaba en el mundo, el empresario lanz\u00f3 Baichuan en abril y r\u00e1pidamente se embols\u00f3 $ 50 millones en financiamiento de un grupo de inversionistas \u00e1ngeles.<\/p>\n
Al igual que otros LLM locales de China, Baichuan, un modelo de 13\u00a0000 millones de par\u00e1metros basado en la arquitectura Transformer (que tambi\u00e9n respalda a GPT), se entrena con datos en chino e ingl\u00e9s. (Los par\u00e1metros se refieren a las variables que utiliza el modelo para generar y analizar texto). El modelo es de c\u00f3digo abierto y est\u00e1 optimizado para aplicaciones comerciales, seg\u00fan su p\u00e1gina de GitHub.<\/p>\n
Baichuan-13 est\u00e1 entrenado en 1,4 billones de tokens. En comparaci\u00f3n, Meta <\/span>Llama utiliza 1 bill\u00f3n de tokens en su modelo de 13 mil millones de par\u00e1metros. Wang dijo anteriormente en un <\/span>entrevista que su puesta en marcha estaba en camino de lanzar un modelo a gran escala comparable al GPT-3.5 de OpenAI para fines de este a\u00f1o.<\/span><\/p>\n Habiendo comenzado hace solo tres meses, Baichuan ya ha alcanzado una notable velocidad de desarrollo. A fines de abril, el equipo hab\u00eda crecido a 50 personas y, en junio, lanz\u00f3 su primer LLM, el modelo de preentrenamiento Baichuan-7B que cuenta con 7 mil millones de par\u00e1metros.<\/p>\n Ahora, el modelo fundamental Baichuan-13B est\u00e1 disponible de forma gratuita para acad\u00e9micos y desarrolladores que hayan recibido la aprobaci\u00f3n oficial para usarlo con fines comerciales. Es importante destacar que, en la era de las sanciones de los chips de IA de EE. UU. a China, el modelo ofrece variaciones que pueden ejecutarse en hardware de nivel de consumidor, incluidas las tarjetas gr\u00e1ficas 3090 de Nvidia.<\/p>\n Otras firmas chinas que han invertido mucho en grandes modelos de idiomas incluyen al gigante de los motores de b\u00fasqueda Baidu; Zhipu.ai, una escisi\u00f3n de la Universidad de Tsinghua dirigida por el profesor Tang Jie; as\u00ed como el instituto de investigaci\u00f3n IDEA dirigido por Harry Shum, quien cofund\u00f3 Microsoft Research Asia.<\/p>\n Los grandes modelos de idiomas de China est\u00e1n emergiendo r\u00e1pidamente a medida que el pa\u00eds se prepara para implementar algunas de las regulaciones de IA m\u00e1s estrictas del mundo. Como inform\u00f3 el Financial Times, se espera que China elabore regulaciones para la IA generativa con un enfoque particular en el contenido, lo que indica un mayor control que las reglas introducidas en abril. Es posible que las empresas tambi\u00e9n necesiten obtener una licencia antes de lanzar modelos de idiomas grandes, lo que podr\u00eda ralentizar los esfuerzos de China para competir con EE. UU. en la industria naciente.<\/p>\n<\/p><\/div>\n