Yandex atrapado raspando el código SEO de Google

Como TechRadar Pro reportado a principios de enero de 2023, un ex Yandex empleado con un motivo «político» supuestamente filtró un amplio repositorio de código fuente para muchos de los productos del portal web, lo que podría arrojar luz sobre el oscuro arte de optimización de motores de búsqueda.

BleepingEquipo (se abre en una pestaña nueva) informa que el empleado filtró fuentes de git por un total de 44,7 GB de archivos, que contenían «todo» el código fuente de Yandex, excepto sus reglas antispam, que se obtuvieron en julio de 2022.

El código fuente sin procesar no será de interés para todos, Tierra del motor de búsqueda (se abre en una pestaña nueva)El informe de que se han descubierto 17.854 factores de clasificación de búsqueda como parte de la filtración debería ser de interés para cualquier persona, empresa o publicación que desee ver sus páginas clasificadas en los primeros puestos de los motores de búsqueda.

Yandex filtra información de SEO

A lista parcial de factores clasificados por el motor de búsqueda Yandex de un archivo en el código base, compartido por el CEO de la consultora SEO MOG Media Martin MacDonald, arroja algo de luz sobre los aspectos de la copia a los que Yandex aplica peso.

Por Ruso Buscar noticias (se abre en una pestaña nueva)estos incluyen PageRank y varios aspectos de los enlaces, como la antigüedad y la relevancia, la relevancia percibida de la copia, la confiabilidad del host y las preferencias innatas hacia sitios específicos con autoridad percibida, como Wikipedia.

Una inmersión más profunda, más larga y más técnica por Tierra del motor de búsqueda (se abre en una pestaña nueva) también muestra que esta prioridad también incluye una «NOTICIAS_AGENCY_RATING», lo que permite que el motor de búsqueda de Yandex muestre preferencia por ciertas organizaciones de noticias.

Otros incluyen la cantidad de visitantes únicos, los porcentajes de tráfico orgánico y las clasificaciones promedio de dominio en todas las consultas.

Sin embargo, es quizás melodramático, o un poco desolador, que MacDonald lo describa como “lo más interesante que ha sucedido en SEO en años”.

Si bien el código base filtrado ciertamente ofrece una gran cantidad de información, vale la pena señalar que muchos sitios web buscarán una buena clasificación en Google sobre Yandex, simplemente porque el primero es mucho más conocido.

Ambas compañías han compartido ingenieros web a lo largo de los años, Yandex usa muchas de las tecnologías de código abierto de Google, como TensorFlow y BERT, y las referencias a los datos de Google aparecen en la base de código filtrada.

Sin embargo, la inmersión profunda de Search Engine Land argumenta que la fuga de Yandex puede brindar una visión general de la anatomía de un motor de búsqueda moderno, pero, según Russian Search News, muchos de los factores de búsqueda de clasificación filtrados de Yandex no se utilizan o se consideran oficialmente depreciados.

Incluso la inmersión técnica profunda admite que muchos de los aspectos conocidos de Google (el motor de búsqueda), como sus sistemas de rastreo e índice, difieren de los de Yandex.

Todo esto, combinado con la antigüedad del código base filtrado, hace que no quede claro cómo les irá a las suposiciones sobre cómo Yandex y Google pueden clasificar las páginas.