El algoritmo de recomendación de Twitter ahora es de código abierto


Hoy es el día: en un esfuerzo por impulsar la transparencia entre el público y la plataforma de redes sociales, El CEO Elon Musk ha creado el algoritmo de recomendación de Twitter código abierto… por alguna razón.

Parece que Musk es fiel a su palabra y en realidad lanzó el algoritmo de recomendación de Twitter el GitHubasí como un artículo del equipo de Twitter que describe lo que realmente hace el algoritmo de código en Twitter. Blog. Twitter afirma que, en esencia, el algoritmo que recomienda tweets, al que llamó «Home Mixer», los extrae de las fuentes mediante un proceso llamado «abastecimiento de candidatos», los clasifica en comparación con un modelo de aprendizaje automático y luego los filtra según los puntos de referencia. como usuarios que ha bloqueado y si el contenido es NSFW.

Twitter dice que las fuentes candidatas de Home Mixer consisten en personas a las que sigues y personas a las que no, y la pestaña Para ti generalmente consta de tweets del 50% de cada uno. Home Mixer extrae alrededor de 1500 tweets durante este primer paso. Cuando el algoritmo clasifica los tweets, ignora cuál es la fuente del tweet y «toma en cuenta miles de características» para asignarles una de las diez etiquetas: cada etiqueta corresponde a una cierta probabilidad de participación. Home Mixer luego filtrará los tweets en función de sus propios tamices internos y luego los arrojará a su página For You.

almizcle previamente Anunciado que el algoritmo que usa Twitter para recomendar tweets a los usuarios sería de código abierto el 31 de marzo en un esfuerzo por proporcionar transparencia de código a los usuarios que, con suerte, generará confianza. Aún está por verse si la mayoría de los usuarios de Twitter están interesados ​​en aprender más sobre el código. Independientemente, él mismo reconoce que proporcionar transparencia en el código será «increíblemente vergonzoso al principio», ya que Twitter continúa encontrando formas de ajustar el algoritmo.

“Nuestro ‘algoritmo’ es demasiado complejo y no se entiende completamente internamente. La gente descubrirá muchas cosas tontas, ¡pero solucionaremos los problemas tan pronto como se encuentren! Musk tuiteó a principios de este mes. “Estamos desarrollando un enfoque simplificado para publicar tweets más convincentes, pero aún es un trabajo en progreso. Eso también será de código abierto”.

Una cosa que no parece haberse hecho pública es la lista de VIPs que Twitter empuja a los usuarios. Platformer informó que Twitter tiene una lista rotativa de usuarios notables que incluye a todos, desde la Representante Alexandria Ocasio-Cortez hasta el YouTuber Mr. Beast y Cable diario fundador Ben Shapiro, según correos electrónicos internos. Twitter supuestamente usa esta lista para monitorear los cambios en el algoritmo de recomendación del sitio web al aparentemente aumentar la visibilidad de estos usuarios avanzados a voluntad. Esta lista contrasta fuertemente con la descabellada búsqueda de Elon Musk de tratar a todos por igual.

Algunas partes del código de Twitter en realidad ya eran de código abierto, solo que no de la manera que Musk había planeado. A principios de esta semana, se conoció la noticia de que partes de El código fuente de Twitter se subió a GitHub según documentos judiciales, en los que Twitter exigió que las partes del código infractor se eliminaran del depósito en línea. Twitter también presentó una Aviso de eliminación de DMCA con GitHub, que se cumplió con la solicitud de eliminar el código.

Sin embargo, no está claro cuánto del código se cargó o cuánto tiempo se dejó en línea. Los New York Times informaron que podrían haber sido meses. Los fragmentos de código fuente fueron subidos por un usuario conocido como «FreeSpeechEnthusiast», tal vez un guiño a Los intentos falibles de Elon Musk de ser un «absolutista de la libertad de expresión». Sin embargo, quienquiera que sea FreeSpeechEnthusiast puede ser descubierto lo suficientemente pronto, ya que Twitter obtuvo con éxito una citación para desenmascarar al hacker. La citación también requiere que GitHub proporcione a Twitter la identidad y la información de cualquier persona que haya descargado el código durante el tiempo que estuvo cargado.





Source link-45