El algoritmo de código abierto de Twitter es una pista falsa


El pasado viernes por la tarde, Twitter publicó el código fuente de su algoritmo de recomendación en GitHub. Twitter dijo que su algoritmo era de «código abierto», algo de lo que normalmente estaría a favor. Los algoritmos de recomendación y el código fuente abierto son los principales focos de mi trabajo como investigador y defensor de la responsabilidad corporativa en la industria tecnológica. Mi investigación ha demostrado por qué y cómo las empresas como YouTube deberían ser más transparentes sobre el funcionamiento interno de sus algoritmos de recomendación, y he realizado campañas presionándolas para que lo hagan. Mozilla, la organización sin fines de lucro de la que soy miembro sénior, hizo famoso el código abierto del navegador Netscape e invitó a una comunidad de desarrolladores de todo el mundo a contribuir en 1998, y desde entonces ha seguido impulsando una Internet abierta. Entonces, ¿por qué no estoy impresionado o emocionado por la decisión de Musk?

En todo caso, el llamado «código abierto» de Twitter es una pista falsa inteligente para distraer la atención de sus movimientos recientes. lejos desde la transparencia. Hace solo unas semanas, Twitter anunció discretamente que cerraría la versión gratuita de su API, una herramienta en la que los investigadores de todo el mundo han confiado durante años para realizar investigaciones sobre contenido dañino, desinformación, salud pública, monitoreo de elecciones, comportamiento político y más. . La herramienta por la que está siendo reemplazada costará ahora a los investigadores y desarrolladores entre $42,000 y $210,000 por mes. El movimiento de Twitter llamó la atención de los legisladores y las organizaciones de la sociedad civil (incluida la Coalición para la Investigación Tecnológica Independiente, de la cual formo parte de la junta), quienes condenaron la decisión de Twitter.

La ironía es que muchos de los problemas que la gente planteó durante el fin de semana mientras analizaban el código fuente podrían ser probados por la misma herramienta que Twitter está en proceso de desactivar. Por ejemplo, los investigadores especularon que el parámetro «UkraineCrisisTopic» que se encuentra en el código fuente de Twitter era una señal para que el algoritmo degradara los tweets que hacían referencia a la invasión de Ucrania. Utilizando la API de Twitter, los investigadores podrían haber recuperado tuits relacionados con la invasión de Ucrania y analizado su participación para determinar si el algoritmo los amplificó o desamplificó. Herramientas como estas permiten al público confirmar, o refutar, de forma independiente, las pepitas de información que proporciona el código fuente. Sin ellos, estamos a merced de lo que Twitter nos diga que es verdad.

El truco de Twitter es solo el último ejemplo de lavado de transparencia que proviene de la industria tecnológica. En 2020, TikTok también usó las palabras «código fuente» para deslumbrar a los reguladores de EE. UU. y Europa que exigieron más transparencia sobre el funcionamiento de la plataforma. Fue la primera plataforma en anunciar la apertura de «Centros de transparencia» físicos, supuestamente diseñados para «permitir que los expertos examinen y verifiquen las prácticas de TikTok». En 2021 participé en un recorrido virtual por el Centro, que fue poco más que una presentación de Powerpoint del personal de políticas de TikTok explicando cómo funciona la aplicación y revisando sus políticas de moderación de contenido ya públicas. Tres años después, los Centros permanecen cerrados al público (el sitio web de TikTok cita la pandemia como la razón) y TikTok no ha publicado ningún código fuente.

Si Musk realmente hubiera querido traer responsabilidad al algoritmo de Twitter, podría haberlo hecho. escrutable además de transparente. Por ejemplo, podría haber creado herramientas que simulen las salidas de un sistema algorítmico basado en una serie de entradas. Esto permitiría a los investigadores realizar experimentos controlados para probar cómo los sistemas de recomendación clasificarían el contenido real. Estas herramientas deberían estar disponibles para los investigadores que trabajan en el interés público (y, por supuesto, que pueden demostrar cómo sus métodos respetan la privacidad de las personas) por poco o ningún costo.

Hay buenas noticias en este frente: la Ley de Servicios Digitales de Europa, que entrará en vigor para plataformas en línea muy grandes tan pronto como este verano, obligará a las plataformas a realizar auditorías de terceros en sus algoritmos para garantizar que no corran el riesgo de dañar gente. El tipo de datos que se requerirán para tales auditorías va mucho más allá de lo que actualmente proporciona Twitter, TikTok o cualquier otra plataforma.

Publicar el código fuente fue un movimiento audaz pero apresurado para el que Twitter mismo no parecía estar preparado: el repositorio de GitHub se ha actualizado al menos dos veces desde el lanzamiento para eliminar partes embarazosas del código que probablemente nunca debieron hacerse públicas. Si bien el código fuente revela la lógica subyacente de un sistema algorítmico, no nos dice casi nada sobre cómo funcionará el sistema en tiempo real, en Tweets reales. La decisión de Elon Musk nos deja sin saber qué está pasando ahora mismo en la plataforma, o qué puede pasar después.


Opinión CABLEADA publica artículos de colaboradores externos que representan una amplia gama de puntos de vista. Leer más opiniones aquíy consulte nuestras pautas de envío aquí. Envíe un artículo de opinión en [email protected].



Source link-46