Threads es el último paso en la carrera armamentista de la IA


Cuando Meta debutó su nueva función Threads a principios de este mes, fue rápidamente apodada «el asesino de Twitter». Elon Musk, el dueño de X (anteriormente Twitter), incluso amenazó con demandar a Meta por lo que llamó un producto “imitador”.

Lanzado en la parte posterior de Instagram, también propiedad de Meta, Threads se parece mucho a X. Es desplazable, basado en texto y limitado en caracteres. Pero, ¿por qué, cuando X ha sido notoriamente poco rentable, Meta, que nos trajo el infame «pivot to video» y tenía la vista puesta en competir con TikTok, querría asumir la plataforma? La respuesta puede tener que ver con la inteligencia artificial.

Los últimos meses han visto una verdadera carrera armamentista de IA, con herramientas como ChatGPT, Midjourney, Stable Diffusion, Copilot, Dall-E y Google’s Bard, todas compitiendo por los usuarios. A medida que más empresas invierten en IA generativa, necesitan lotes de datos para entrenar sus modelos. Y esos datos deben ser generados por humanos reales para que la IA generativa parezca, bueno, humana. Las plataformas como Reddit y X son minas de oro porque albergan millones de ejemplos de contenido generado por los usuarios. Históricamente, ambas compañías también han hecho que sus datos estén fácilmente disponibles, una bendición para los desarrolladores e investigadores externos. Solo en 2020, los datos de X contribuyeron a más de 17 000 artículos de investigación. Modelos como ChatGPT y Bard también fueron capacitados en datos de estas plataformas. Pero esto ha generado preguntas más importantes sobre cuánto valen los datos generados por los usuarios y cuánto debería costar acceder a ellos. Ahora, es posible que esos datos no estén disponibles por mucho tiempo, ya que todas las empresas, incluida Meta, se apresuran a desarrollar sus propios modelos.

A principios de este año, Musk anunció que X comenzaría a cobrar $ 42,000 al mes por su API, lo que descontaría el precio de casi todos los que la usaban, en particular académicos e investigadores, para quienes los datos de X eran cruciales para investigar temas como la desinformación. Más tarde, la compañía dijo que ofrecería niveles de acceso a un precio de $125,000 y $210,000 por mes. No mucho después, Reddit anunció que también comenzaría a cobrar por su API. En una entrevista con Los New York Timesel CEO de Reddit, Reed Huffman, reconoció que «el corpus de datos de Reddit es realmente valioso» para entrenar modelos de IA, pero que la compañía no sintió la «necesidad de dar todo ese valor a algunas de las compañías más grandes del mundo de forma gratuita».

En los últimos meses, Musk ha seguido tomando medidas enérgicas contra el acceso a los datos de X. En abril, tuiteó que Microsoft había «ilegalmente» usó datos de X para entrenar sus modelos de IA (Microsoft es socio de Meta y OpenAI, que creó ChatGPT). Una carta del abogado de X alegaba que la empresa había excedido el uso permitido de los datos que extrajo de la plataforma. Luego, el mes pasado, Twitter anunció que restringir la capacidad de ver el contenido del sitio sin iniciar sesión primero, y que para ver más de 600 tweets por día, los usuarios tendrían que pagar por Twitter Blue. Musk lo llamó una «medida de emergencia temporal» para evitar lo que llamó «saqueo de datos». (XCorp, propietaria de X, presentó una demanda poco después contra cuatro acusados ​​no identificados, buscando $ 1 millón en daños por extracción de datos). Como Musk tiene acceso limitado a la plataforma, también lanzó su nueva startup xAI, que se capacitará con datos de X.

¿Qué tiene que ver todo esto con Threads? Meta, que apostó su futuro y su nombre en el metaverso, se ha quedado atrás en su inversión en IA. Pero la semana pasada, la compañía anunció que haría que su modelo de lenguaje grande, Llama 2, fuera de código abierto, gratuito para investigadores y empresas por igual (esto también significa, sin embargo, que no tendrá algunas de las garantías de ChatGPT, a saber, la capacidad de revocar el acceso de los usuarios que violan los términos de uso para generar, por ejemplo, desinformación). Los subprocesos podrían reforzar sus esfuerzos para volver al juego de la IA, justo cuando X ya no es una opción para las empresas que buscan recolectar datos.





Source link-46