Google ya no hará copias de seguridad de Internet: las páginas web almacenadas en caché están muertas


Google ya no mantendrá una copia de seguridad de todo Internet. Los enlaces «en caché» de la Búsqueda de Google han sido durante mucho tiempo una forma alternativa de cargar un sitio web que no funciona o ha cambiado, pero ahora la compañía los está eliminando. El «enlace de búsqueda» de Google, Danny Sullivan, confirmó la eliminación de la función en un X publicacióndiciendo que la función «estaba destinada a ayudar a las personas a acceder a páginas cuando hace mucho tiempo no se podía depender de la carga de una página. Hoy en día, las cosas han mejorado mucho. Por lo tanto, se decidió retirarla».

La función ha estado apareciendo y desapareciendo para algunas personas desde diciembre y actualmente no vemos ningún enlace de caché en la Búsqueda de Google. Por ahora, aún puedes crear tus propios enlaces de caché incluso sin el botón, simplemente yendo a «https://webcache.googleusercontent.com/search?q=cache:» más la URL de un sitio web, o escribiendo «cache:». más una URL en la Búsqueda de Google. Por ahora, la versión en caché de Ars Technica parece seguir funcionando. Se han eliminado todas las páginas de soporte de Google sobre sitios almacenados en caché.

Los enlaces almacenados en caché solían estar en el menú desplegable junto a cada resultado de búsqueda en la página de Google. A medida que el rastreador web de Google buscaba en Internet páginas web nuevas y actualizadas, también guardaba una copia de lo que estaba viendo. Eso llevó rápidamente a que Google tuviera una copia de seguridad de básicamente todo Internet, utilizando lo que probablemente era una cantidad incontable de petabytes de datos. Google se encuentra ahora en la era del ahorro de costos, por lo que suponiendo que Google pueda comenzar a eliminar datos de la caché, probablemente pueda liberar muchos recursos.

Los enlaces en caché eran excelentes si el sitio web no funcionaba o cambiaba rápidamente, pero también brindaron información a lo largo de los años sobre cómo el rastreador web «Google Bot» ve la web. Las páginas no necesariamente se muestran como cabría esperar. En el pasado, las páginas eran sólo de texto, pero poco a poco el robot de Google aprendió sobre los medios y otros datos enriquecidos como javascript (ahora hay un montón de robots de Google especializados). Muchos detalles de Google Bot se mantienen en secreto para ocultarlos a los spammers de SEO, pero puedes aprender mucho investigando cómo se ven las páginas almacenadas en caché. En 2020, Google cambió a dispositivos móviles de forma predeterminada, por lo que, por ejemplo, si visita ese enlace de Ars en caché de antes, obtendrá el sitio móvil. Si ejecuta un sitio web y desea obtener más información sobre cómo se ve un sitio para un robot de Google, aún puede hacerlo, aunque solo para su propio sitio, desde Search Console.

La muerte de los sitios almacenados en caché significará que Internet Archive tendrá una mayor carga de archivar y rastrear cambios en las páginas web del mundo.





Source link-49