Internet no es para siempre después de todo: CNET elimina artículos antiguos para jugar con Google


aurich lawson

CNET, uno de los bisabuelos de las noticias tecnológicas en la web, ha tenido un año difícil. Primero, sus artículos escritos por IA provocaron drama, luego los despidos sacudieron la publicación. Y ahora, Gizmodo informa que el sitio de 28 años ha estado eliminando miles de sus artículos antiguos en una búsqueda para lograr una mejor clasificación en las búsquedas de Google.

El proceso de eliminación comenzó con pequeños lotes de artículos y aumentó drásticamente en la segunda quincena de julio, lo que llevó a la eliminación de miles de artículos en las últimas semanas. Aunque CNET confirmó la selección de historias a Gizmodo, no se ha revelado la cantidad exacta de artículos eliminados.

«Eliminar contenido de nuestro sitio no es una decisión que tomamos a la ligera. Nuestros equipos analizan muchos puntos de datos para determinar si hay páginas en CNET que actualmente no están sirviendo a una audiencia significativa. Esta es una mejor práctica de toda la industria para sitios grandes como el nuestro. que están impulsados ​​principalmente por el tráfico de SEO. En un mundo ideal, dejaríamos todo nuestro contenido en nuestro sitio a perpetuidad. Desafortunadamente, la Internet moderna nos penaliza por dejar todo el contenido publicado previamente en vivo en nuestro sitio», Taylor Canada, director sénior de marketing y comunicaciones de CNET, le dijo a Gizmodo.

SEO (optimización de motores de búsqueda) es la práctica de intentar lograr deliberadamente una clasificación más alta en los resultados de los motores de búsqueda cambiando el contenido de un sitio web. Los defensores de las técnicas de SEO creen que una clasificación más alta en los resultados de búsqueda de Google puede afectar significativamente el número de visitantes, las ventas de productos o los ingresos publicitarios. Muchas empresas llegan a los extremos tratando de complacer el algoritmo de clasificación de Google.

Una teoría para mejorar el rango de la página involucra una práctica llamada «poda de contenido». Gizmodo obtuvo un memorando interno de CNET que establece que eliminar las URL antiguas «envía una señal a Google que dice que CNET es nuevo, relevante y digno de ubicarse más alto que nuestros competidores en los resultados de búsqueda». Sin embargo, antes de eliminar un artículo, CNET supuestamente mantiene una copia local, envía la historia a Wayback Machine de The Internet Archive y notifica a los autores actualmente empleados que podrían verse afectados al menos con 10 días de anticipación.

Sin embargo, algunos expertos dicen que el ejemplo extremo de poda de contenido de CNET es erróneo. El sitio web Search Engine Land señala que, si bien Google aconsejó una vez (en 2011) que eliminar «páginas de baja calidad» podría aumentar potencialmente la clasificación, también dice que Google nunca ha aconsejado a las personas que eliminen contenido simplemente porque es antiguo. De hecho, el martes, la cuenta SearchLiaison X de Google tuiteó«¿Estás eliminando contenido de tu sitio porque de alguna manera crees que a Google no le gusta el contenido «antiguo»? ¡Eso no es un problema! Nuestra guía no fomenta esto. El contenido antiguo también puede ser útil. contenido.»

La larga y continua decadencia de la web

En un momento, se percibió como conocimiento común que «Internet es para siempre», lo que significa que cualquier cosa que pongas en línea siempre permanecerá allí. Nuestras búsquedas informales a través de Google Books y Google sugieren que la frase se originó alrededor de 2005 pero se hizo muy popular en la era del auge de las redes sociales de 2008-2009.

Sin embargo, a medida que ha pasado el tiempo, se ha vuelto cada vez más claro que Internet es transitorio. Link rot amenaza el contenido en la web todos los días, y el contenido que se encuentra en línea está lejos de ser permanente. Un estudio de la Universidad de Harvard de 2021 examinó los hipervínculos en más de 550 000 artículos del New York Times entre 1996 y 2019 y descubrió que el 25 % de los enlaces a páginas específicas eran inaccesibles. Si no fuera por The Internet Archive, por ejemplo, muchos de los primeros sitios web se perderían por completo.

Una captura de pantalla de un artículo de PCWorld al que le falta una imagen.
Agrandar / Una captura de pantalla de un artículo de PCWorld al que le falta una imagen.

Ars Technica

Las causas de la rotura de enlaces incluyen cierres de sitios web, migraciones de servidores, cambios a nuevos sistemas de administración de contenido y más. Ahora podemos agregar otro culpable a la lista: la poda de contenido para SEO. Tal vez sea otra señal de lo mal que se han vuelto las cosas con los resultados de búsqueda de Google, llenos de sitios basura generados algorítmicamente, que publicaciones como CNET lleguen a tales extremos para mantenerse por encima del mar de ruido.

Incluso si los sitios web no eliminan el contenido por completo, ciertos archivos pueden verse comprometidos con el tiempo de otras maneras. Durante la última década, una plaga de trolls de derechos de autor amenazó a muchas publicaciones con demandas judiciales por usar imágenes de una manera que probablemente constituiría uso justo si se probara en un tribunal. Pero los juicios son costosos, por lo que los trolls ganaron al recibir acuerdos en efectivo. En respuesta, muchos sitios web eliminaron las imágenes antiguas de los artículos en lugar de clasificar millones de ellas individualmente. Los archivos en algunos de los sitios web de IDG, como PCWorld y Macworld, se han visto afectados por esta selección de imágenes.

Afortunadamente, no todos los sitios web ignoran sus archivos o caen en la trampa del SEO. Por ejemplo, en Ars Technica, aún puede encontrar artículos escritos hace 25 años (y muchos en su formato original), y la función de búsqueda de Ars aún funciona muy bien.

Desde tiempos inmemoriales, la protección del contenido histórico ha requerido hacer muchas copias sin autorización, independientemente de las fuerzas culturales o comerciales en juego, y eso no ha cambiado con Internet. Los archivistas operan en un universo IP paralelo, tomando prestados fragmentos de la realidad y manteniéndolos a salvo hasta que las decisiones comerciales miopes y el proteccionismo de los derechos de autor desaparezcan. Con suerte, a pesar de la descomposición de los enlaces, los futuros historiadores pueden reconstruir una historia precisa de nuestra frágil era digital.





Source link-49