Twitter publica el código que afirma determina qué tuits ve la gente y por qué


Agrandar / Twitter ha publicado lo que dice es el código utilizado por su algoritmo para recomendar tweets a sus usuarios.

Twitter ha hecho bien en una de las muchas promesas del CEO Elon Muskpublicando un viernes por la tarde lo que afirma es el código de su algoritmo de recomendación de tweets en GitHub.

El código, publicado bajo una licencia pública general GNU Affero v3.0, contiene numerosas ideas sobre qué factores hacen que un tweet sea más o menos probable que aparezca en las líneas de tiempo de los usuarios.

En una publicación de blog que acompaña al lanzamiento del código, el equipo de ingeniería de Twitter (sin título en particular) señala que el sistema para determinar qué «tweets principales que finalmente aparecen en la línea de tiempo For You de su dispositivo» está «compuesto por muchos servicios y trabajos interconectados». Cada vez que se actualiza una pantalla de inicio de Twitter, Twitter extrae «los mejores 1500 tuits de un grupo de cientos de millones», afirma la publicación.

La fuente más grande de esos tweets es «Fuentes dentro de la red», o usuarios que alguien sigue. Los mejores tweets de esa pila se clasifican según la probabilidad de que un usuario interactúe con el autor de ese tweet; cuanto más probable, más tweets aparecerán en For You. Para las «Fuentes fuera de la red», aquellas que no son seguidas por el usuario, Twitter dice que considera los tuits que atrajeron la participación de las personas que los usuarios siguen y los tuits que gustan a quienes les gustan los tuits similares a un usuario.

Aquellos que han revisado el código ya han detectado consideraciones que plantean muchas más preguntas. Muchos las han colgado, naturalmente, en el mismo Twitter.

Ólafur Waage, desarrollador de software sénior en el servicio de consultoría de software noruego TurtleSec, señaló que dentro de «HomeTweetTypePredicates.scala», algunas de las consideraciones aparentes para que un tweet sea candidato para la sección «Para ti» son:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

En otra parte del código, un comentario de código que presumiblemente dejó un ingeniero de Twitter aclara que esos valores de identificación se «utilizan únicamente para la recopilación de métricas». El comentario dice lo siguiente:

Estas listas de ID de autor se utilizan exclusivamente para la recopilación de métricas. Realizamos un seguimiento de la frecuencia con la que publicamos Tweets de estos autores y la frecuencia con la que los usuarios impresionan sus tweets. Esto nos ayuda a validar en nuestra plataforma de experimentación A/B que no enviamos cambios que impacten negativamente a un grupo sobre otros.

Los nombres de los objetos en cuestión, como «DDGStatsDemocratsFeature» o «DDGStatsElonFeature», parecen respaldar esta interpretación, pero es posible que no sea posible confirmarlo con el código disponible. Sin embargo, es interesante que Twitter esté verificando y cotejando estas variables. Durante una sesión de audio de Twitter Spaces, un ingeniero de Twitter notó que las etiquetas demócrata y republicana se usaban para las métricas. Musk, quien afirmó que desconocía las etiquetas antes de hoy, sugirió que no deberían estar allí.

Otras cosas que se consideran acerca de un tweet incluyen si tiene menos de 30 minutos, si tiene imágenes y si es de un «usuario avanzado», que algunos creen significa una cuenta verificada «heredada».

Musk tuiteó junto con la publicación de blog de la compañía sobre el algoritmo de recomendación, afirmando que la «prueba de fuego» será si «terceros independientes» pueden «determinar, con una precisión razonable, lo que probablemente se mostrará a los usuarios».

La publicación de Twitter de su código de algoritmo se produce pocos días después de que se descubriera el código fuente más amplio de la red social en GitHub, que posiblemente haya estado allí durante meses, según The New York Times. Luego, Twitter obtuvo una citación que obligaba a GitHub a revelar la información del cartel de GitHub.

Un informe de Platformer a principios de esta semana sugirió que Twitter utilizó una lista secreta de los 35 principales usuarios de Twitter, incluidos el presidente Biden, LeBron James, Ben Shapiro y Musk. La evidencia de la implementación de esa lista, supuestamente impulsada en parte por la insatisfacción de Musk con su propio compromiso, no se ha encontrado hasta ahora en la base de código publicada en Twitter.

En particular, el código llega solo unas horas antes de que los usuarios «verificados heredados», aquellos que reciben una marca de verificación azul para indicar autenticidad o notoriedad antes de la compra del servicio por parte de Musk, no sean verificados a favor de los suscriptores de pago de Twitter Blue. Si bien algunos usuarios conectados con gobiernos y grandes organizaciones pueden solicitar marcas de verificación de otros coloressolo los suscriptores de Twitter Blue, a $ 8 por mes, recibirán «clasificación prioritaria en conversaciones». entre otras características.

Todos esos cambios llegan el 1 de abril o el Día de los Inocentes.





Source link-49