{"id":198041,"date":"2022-09-28T03:56:38","date_gmt":"2022-09-28T03:56:38","guid":{"rendered":"https:\/\/magazineoffice.com\/hugging-face-y-servicenow-lanzan-bigcode-un-proyecto-para-abrir-sistemas-de-ia-generadores-de-codigo-fuente-techcrunch\/"},"modified":"2022-09-28T03:56:40","modified_gmt":"2022-09-28T03:56:40","slug":"hugging-face-y-servicenow-lanzan-bigcode-un-proyecto-para-abrir-sistemas-de-ia-generadores-de-codigo-fuente-techcrunch","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/hugging-face-y-servicenow-lanzan-bigcode-un-proyecto-para-abrir-sistemas-de-ia-generadores-de-codigo-fuente-techcrunch\/","title":{"rendered":"Hugging Face y ServiceNow lanzan BigCode, un proyecto para abrir sistemas de IA generadores de c\u00f3digo fuente \u2022 TechCrunch"},"content":{"rendered":"
\n<\/p>\n
Los sistemas de generaci\u00f3n de c\u00f3digo como AlphaCode de DeepMind, CodeWhisperer de Amazon y Codex de OpenAI, que impulsa el servicio Copilot de GitHub, brindan una mirada tentadora de lo que es posible con la IA hoy en d\u00eda dentro del \u00e1mbito de la programaci\u00f3n inform\u00e1tica. Pero hasta ahora, solo un pu\u00f1ado de estos sistemas de IA se han puesto a disposici\u00f3n del p\u00fablico y de c\u00f3digo abierto de forma gratuita, lo que refleja los incentivos comerciales de las empresas que los construyen.<\/p>\n
En un intento por cambiar eso, la startup de IA Hugging Face y ServiceNow Research, la divisi\u00f3n de I+D de ServiceNow, lanzaron hoy BigCode, un nuevo proyecto que tiene como objetivo desarrollar sistemas de IA \u00abde \u00faltima generaci\u00f3n\u00bb para c\u00f3digo de forma \u00ababierta y responsable\u00bb. camino. El objetivo es finalmente lanzar un conjunto de datos lo suficientemente grande como para entrenar un sistema de generaci\u00f3n de c\u00f3digo, que luego se usar\u00e1 para crear un prototipo: un modelo de 15 mil millones de par\u00e1metros, m\u00e1s grande que Codex (12 mil millones de par\u00e1metros) pero m\u00e1s peque\u00f1o que AlphaCode (~41,400 millones de par\u00e1metros), utilizando el cl\u00faster de tarjetas gr\u00e1ficas interno de ServiceNow. En el aprendizaje autom\u00e1tico, los par\u00e1metros son las partes de un sistema de IA aprendidas a partir de datos de entrenamiento hist\u00f3ricos y esencialmente definen la habilidad del sistema en un problema, como la generaci\u00f3n de c\u00f3digo.<\/p>\n
Inspirado por el esfuerzo BigScience de Hugging Face para abrir sistemas de generaci\u00f3n de texto altamente sofisticados, BigCode estar\u00e1 abierto a cualquier persona que tenga experiencia profesional en investigaci\u00f3n de IA y pueda dedicar tiempo al proyecto, dicen los organizadores. El formulario de solicitud se puso en marcha esta tarde.<\/p>\n
\u201cEn general, esperamos que los solicitantes est\u00e9n afiliados a una organizaci\u00f3n de investigaci\u00f3n (ya sea en la academia o la industria) y trabajen en los aspectos t\u00e9cnicos\/\u00e9ticos\/legales de [large language models] para aplicaciones de codificaci\u00f3n\u201d, escribi\u00f3 ServiceNow en una publicaci\u00f3n de blog. \u00abUna vez el [code-generating system] est\u00e1 capacitado, evaluaremos sus capacidades… Nos esforzaremos por hacer que la evaluaci\u00f3n sea m\u00e1s f\u00e1cil y m\u00e1s amplia para que podamos aprender m\u00e1s sobre el [system\u2019s] capacidades.\u201d<\/p>\n
Al desarrollar en colaboraci\u00f3n un sistema de generaci\u00f3n de c\u00f3digo, que ser\u00e1 de c\u00f3digo abierto bajo una licencia que permitir\u00e1 a los desarrolladores reutilizarlo sujeto a ciertos t\u00e9rminos y condiciones, BigCode busca abordar algunas de las controversias que han surgido en torno a la pr\u00e1ctica de la IA. generaci\u00f3n de c\u00f3digo potenciado, particularmente en lo que respecta al uso justo. La organizaci\u00f3n sin fines de lucro Software Freedom Conservancy, entre otras, ha criticado a GitHub y OpenAI por usar c\u00f3digo fuente p\u00fablico, no todo el cual est\u00e1 bajo una licencia permisiva, para entrenar y monetizar Codex. Codex est\u00e1 disponible a trav\u00e9s de la API paga de OpenAI, mientras que GitHub recientemente comenz\u00f3 a cobrar por el acceso a Copilot. Por su parte, GitHub y OpenAI contin\u00faan afirmando que Codex y Copilot no infringen ning\u00fan t\u00e9rmino de licencia.<\/p>\n
Los organizadores de BigCode dicen que se esforzar\u00e1n para garantizar que solo los archivos de los repositorios con licencias permisivas entren en el conjunto de datos de entrenamiento antes mencionado. A lo largo del camino, dicen, trabajar\u00e1n para establecer pr\u00e1cticas de IA \u00abresponsables\u00bb para capacitar y compartir sistemas de generaci\u00f3n de c\u00f3digo de todo tipo, solicitando comentarios de las partes interesadas relevantes antes de hacer pronunciamientos de pol\u00edtica.<\/p>\n
ServiceNow y Hugging Face no proporcionaron un cronograma sobre cu\u00e1ndo podr\u00eda completarse el proyecto. Pero esperan que explore varias formas de generaci\u00f3n de c\u00f3digo en los pr\u00f3ximos meses, incluidos los sistemas que autocompletan y sintetizan el c\u00f3digo a partir de fragmentos de c\u00f3digo y descripciones en lenguaje natural y funcionan en una amplia gama de dominios, tareas y lenguajes de programaci\u00f3n.<\/p>\n
Suponiendo que los problemas \u00e9ticos, t\u00e9cnicos y legales se resuelvan alg\u00fan d\u00eda, las herramientas de codificaci\u00f3n impulsadas por IA podr\u00edan reducir sustancialmente los costos de desarrollo y permitir que los programadores se concentren en tareas m\u00e1s creativas. Seg\u00fan un estudio de la Universidad de Cambridge, al menos la mitad de los esfuerzos de los desarrolladores se dedican a la depuraci\u00f3n y no a la programaci\u00f3n activa, lo que le cuesta a la industria del software un estimado de $312 mil millones por a\u00f1o.<\/p>\n<\/p><\/div>\n