{"id":1055738,"date":"2024-03-18T22:41:07","date_gmt":"2024-03-18T22:41:07","guid":{"rendered":"https:\/\/magazineoffice.com\/por-que-es-importante-el-open-source-de-grok-la-empresa-de-inteligencia-artificial-de-elon-musk-y-por-que-no\/"},"modified":"2024-03-18T22:41:09","modified_gmt":"2024-03-18T22:41:09","slug":"por-que-es-importante-el-open-source-de-grok-la-empresa-de-inteligencia-artificial-de-elon-musk-y-por-que-no","status":"publish","type":"post","link":"https:\/\/magazineoffice.com\/por-que-es-importante-el-open-source-de-grok-la-empresa-de-inteligencia-artificial-de-elon-musk-y-por-que-no\/","title":{"rendered":"Por qu\u00e9 es importante el ‘open-source’ de Grok, la empresa de inteligencia artificial de Elon Musk, y por qu\u00e9 no"},"content":{"rendered":"


\n<\/p>\n

\n

xAI de Elon Musk lanz\u00f3 su modelo de lenguaje grande Grok como \u201cc\u00f3digo abierto\u201d durante el fin de semana. El multimillonario claramente espera enfrentar a su empresa con su rival OpenAI, que, a pesar de su nombre, no es particularmente abierto. Pero, \u00bfla publicaci\u00f3n del c\u00f3digo de algo como Grok realmente contribuye a la comunidad de desarrollo de IA? Si y no.<\/p>\n

Grok es un chatbot entrenado por xAI para desempe\u00f1ar el mismo rol vagamente definido que algo como ChatGPT o Claude: le preguntas, \u00e9l responde. A este LLM, sin embargo, se le dio un tono atrevido y acceso adicional a los datos de Twitter como una forma de diferenciarlo del resto.<\/p>\n

Como siempre, estos sistemas son casi imposibles de evaluar, pero el consenso general parece ser que son competitivos con los modelos de tama\u00f1o mediano de \u00faltima generaci\u00f3n como el GPT-3.5. (Si decide que esto es impresionante dado el corto plazo de desarrollo o decepcionante dado el presupuesto y la grandilocuencia que rodea a xAI, depende totalmente de usted).<\/p>\n

En cualquier caso, Grok es un LLM moderno y funcional de tama\u00f1o y capacidad significativos, y cuanto m\u00e1s acceso tenga la comunidad de desarrolladores a las entra\u00f1as de tales cosas, mejor. El problema est\u00e1 en definir \u201cabierto\u201d de una manera que haga m\u00e1s que permitir que una empresa (o un multimillonario) reclame autoridad moral.<\/p>\n

Esta no es la primera vez que se cuestionan o se abusa de los t\u00e9rminos \u201cabierto\u201d y \u201cc\u00f3digo abierto\u201d en el mundo de la IA. Y no estamos hablando s\u00f3lo de una objeci\u00f3n t\u00e9cnica, como elegir una licencia de uso que no sea tan abierta como otra (Grok es Apache 2.0, si se lo pregunta).<\/p>\n

Para empezar, los modelos de IA se diferencian de otros software en lo que respecta a hacerlos de \u201cc\u00f3digo abierto\u201d.<\/p>\n

Si est\u00e1 creando, digamos, un procesador de textos, es relativamente sencillo hacerlo de c\u00f3digo abierto: publica todo su c\u00f3digo p\u00fablicamente y deja que la comunidad proponga mejoras o cree su propia versi\u00f3n. Parte de lo que hace que el c\u00f3digo abierto sea valioso es que cada aspecto de la aplicaci\u00f3n es original o se atribuye a su creador original; esta transparencia y cumplimiento de la atribuci\u00f3n correcta no es solo un subproducto, sino que es fundamental para el concepto mismo de apertura.<\/p>\n

Con la IA, esto podr\u00eda decirse que no es posible en absoluto, porque la forma en que se crean los modelos de aprendizaje autom\u00e1tico implica un proceso en gran medida incognoscible mediante el cual una enorme cantidad de datos de entrenamiento se destila en una representaci\u00f3n estad\u00edstica compleja cuya estructura ning\u00fan ser humano realmente dirige, o incluso comprende. . Este proceso no se puede inspeccionar, auditar y mejorar como lo hace el c\u00f3digo tradicional, por lo que, si bien todav\u00eda tiene un valor inmenso en un sentido, en realidad nunca puede ser abierto. (La comunidad de est\u00e1ndares ni siquiera ha definido qu\u00e9 ser\u00e1 lo abierto en este contexto, pero lo est\u00e1 discutiendo activamente).<\/p>\n

Eso no ha impedido que los desarrolladores y las empresas de IA dise\u00f1en y reclamen sus modelos como \u201cabiertos\u201d, un t\u00e9rmino que ha perdido gran parte de su significado en este contexto. Algunos llaman a su modelo \u00ababierto\u00bb si hay una interfaz o API p\u00fablica. Algunos lo llaman \u00ababierto\u00bb si publican un documento que describe el proceso de desarrollo.<\/p>\n

Podr\u00eda decirse que lo m\u00e1s cercano que puede estar un modelo de IA al \u201cc\u00f3digo abierto\u201d es cuando sus desarrolladores lanzan su pesas<\/em>, es decir, los atributos exactos de los innumerables nodos de sus redes neuronales, que realizan operaciones matem\u00e1ticas vectoriales en orden preciso para completar el patr\u00f3n iniciado por la entrada de un usuario. Pero incluso los modelos de \u201cpesos abiertos\u201d como LLaMa-2 excluyen otros datos importantes, como el conjunto de datos y el proceso de entrenamiento, que ser\u00edan necesarios para recrearlos desde cero. (Algunos proyectos van m\u00e1s all\u00e1, por supuesto).<\/p>\n

Todo esto sin siquiera mencionar el hecho de que se necesitan millones de d\u00f3lares en recursos inform\u00e1ticos y de ingenier\u00eda para crear o replicar estos modelos, lo que restringe efectivamente qui\u00e9n puede crearlos y replicarlos a empresas con recursos considerables.<\/p>\n

Entonces, \u00bfd\u00f3nde se ubica el lanzamiento de Grok de xAI en este espectro?<\/p>\n

Como modelo de pesos abiertos, est\u00e1 listo para que cualquiera pueda descargarlo, usarlo, modificarlo, ajustarlo o destilarlo. \u00a1Eso es bueno! Parece estar entre los modelos m\u00e1s grandes a los que cualquiera puede acceder libremente de esta manera, en t\u00e9rminos de par\u00e1metros (314 mil millones), lo que les da a los ingenieros curiosos mucho con qu\u00e9 trabajar si quieren probar c\u00f3mo funciona despu\u00e9s de varias modificaciones.<\/p>\n

Sin embargo, el tama\u00f1o del modelo presenta serios inconvenientes. Necesitar\u00e1 cientos de gigabytes de RAM de alta velocidad para usarlo en esta forma sin formato. Si a\u00fan no posee, digamos, una docena de Nvidia H100 en una plataforma de inferencia de IA de seis cifras, no se moleste en hacer clic en ese enlace de descarga.<\/p>\n

Y aunque se puede decir que Grok es competitivo con otros modelos modernos, tambi\u00e9n es mucho, mucho m\u00e1s grande que ellos, lo que significa que requiere m\u00e1s recursos para lograr lo mismo. Siempre existe una jerarqu\u00eda de tama\u00f1o, eficiencia y otras m\u00e9tricas, y sigue siendo valiosa, pero es m\u00e1s materia prima que producto final. Tampoco est\u00e1 claro si esta es la \u00faltima y mejor versi\u00f3n de Grok, como la versi\u00f3n claramente ajustada a la que algunos tienen acceso a trav\u00e9s de X.<\/p>\n

En general, es bueno publicar estos datos, pero no cambia las reglas del juego como algunos esperaban.<\/p>\n

Tambi\u00e9n es dif\u00edcil no preguntarse por qu\u00e9 Musk est\u00e1 haciendo esto. \u00bfSu naciente empresa de inteligencia artificial est\u00e1 realmente dedicada al desarrollo de c\u00f3digo abierto? \u00bfO es simplemente barro en el ojo de OpenAI, con el que Musk actualmente est\u00e1 persiguiendo una disputa a nivel multimillonario?<\/p>\n

Si realmente se dedican al desarrollo de c\u00f3digo abierto, este ser\u00e1 el primero de muchos lanzamientos y, con suerte, tendr\u00e1n en cuenta los comentarios de la comunidad, publicar\u00e1n otra informaci\u00f3n crucial, caracterizar\u00e1n el proceso de datos de capacitaci\u00f3n y explicar\u00e1n con m\u00e1s detalle su enfoque. Si no es as\u00ed, y esto s\u00f3lo se hace para que Musk pueda se\u00f1alarlo en argumentos en l\u00ednea, sigue siendo valioso, pero no es algo en lo que nadie en el mundo de la IA confiar\u00e1 o a lo que prestar\u00e1 mucha atenci\u00f3n despu\u00e9s de los pr\u00f3ximos meses mientras juega. el modelo.<\/p>\n<\/p><\/div>\n


\n
Source link-48<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"

xAI de Elon Musk lanz\u00f3 su modelo de lenguaje grande Grok como \u201cc\u00f3digo abierto\u201d durante el fin de semana. El multimillonario claramente espera enfrentar a su empresa con su rival…<\/p>\n","protected":false},"author":1,"featured_media":921370,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[21980],"tags":[6119,1635,1386,44326,658,5430,1636,98946,110,111],"_links":{"self":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1055738"}],"collection":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/comments?post=1055738"}],"version-history":[{"count":1,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1055738\/revisions"}],"predecessor-version":[{"id":1055739,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/posts\/1055738\/revisions\/1055739"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media\/921370"}],"wp:attachment":[{"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/media?parent=1055738"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/categories?post=1055738"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/magazineoffice.com\/wp-json\/wp\/v2\/tags?post=1055738"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}