Backblaze: los discos duros tienden a fallar antes de los tres años de funcionamiento


Backblaze, especialista en almacenamiento en la nube y análisis de almacenamiento, acaba de publicar un jugoso informe que cubre la confiabilidad de los cientos de miles de discos duros implementados en los servidores de la compañía: Backblaze administró 236,893 HDD a partir del 1T23. El informe cubre la confiabilidad y las fallas experimentadas en los distintos modelos.

Teniendo en cuenta las horas de encendido para cualquier HDD fallido y excluyendo las unidades de arranque fallidas, las unidades que no tenían datos de atributos sin procesar SMART o las unidades con datos fuera de los límites, Backblaze ha visto 17,155 HDD muertos desde su inicio operativo. En promedio, los discos duros defectuosos tuvieron un tiempo de funcionamiento operativo promedio de solo dos años y seis meses. Si estás en Europa, es menos durabilidad que la garantía mínima exigida por la ley, que es de tres años.

Backblaze agrupó los HDD muertos en 30 modelos, excluyendo aquellos con menos de 50 fallas para no sesgar los resultados con valores atípicos. Estos son los modelos (que van desde 4 TB hasta 12 TB) en una tabla ordenada:

Backblaze analizó las tasas de falla anualizadas (AFR) en unidades fabricadas por HGST (7 modelos), Seagate (13 modelos), Toshiba (7 modelos) y WDC (3 modelos). (Crédito de la imagen: Backblaze)

Backblaze notó algunas tendencias en su evaluación, y la tabla en sí nos brinda algunos puntos de datos interesantes. Por un lado, vemos que Seagate es el rey de las fallas de unidades. Su Seagate ST12000NM0007 de 12 TB experimentó 2023 fallas, terminando con la tasa promedio de fallas (AFR) más alta con un 7,46 % y una vida útil promedio de solo un año y seis meses. El segundo peor modelo de unidad en las estadísticas de Backblaze fue otra unidad de Seagate, la unidad ST1400NM0138 de 14 TB tuvo un AFR del 6,23 %. El tercer peor modelo es el HUH728080ALE604 de 4 TB de HGST, con una tasa de falla anualizada del 4,33 %.

Los resultados de Backblaze podrían interpretarse en el sentido de que los discos duros más grandes tienden a fallar con menos frecuencia que los discos duros más pequeños, pero aquí hay una serie de advertencias. Por un lado, Backblaze señala que todas sus unidades de disco duro de «pequeña capacidad» que estaban destinadas a fallar ya lo hicieron: la empresa ya no utiliza unidades de disco duro de 1, 1,5, 2, 3 o incluso 5 TB; todas las fallas dentro de esos modelos ya son » contado» en las tasas de fracaso de Backblaze. Ese no es el caso de las unidades de mayor capacidad, que también tienen más probabilidades de tener un tiempo de ejecución más bajo, como suele ser el caso de las opciones de almacenamiento de Backblaze.

Backblaze analizó más a fondo su grupo de HDD observando las tasas de falla promedio entre los fabricantes, con Seagate afirmando una tasa de falla promedio líder de 2,28 %, mientras que WDC afirmó la menor cantidad de fallas promedio con su resultado de 0,31 %. Al mirar estos números, es importante recordar que incluso la tasa de fallas de Seagate significa que solo 2.3 de cada cien HDD enviados dejan de girar sus platos antes de lo debido.

AFR entre fabricantes

(Crédito de la imagen: Backblaze)

En general, Backblaze terminó con una tasa de falla promedio para el primer trimestre de 2023 de 1,54 %, un aumento trimestral desde el 1,21 % en el cuarto trimestre de 2022 y también año tras año, donde el primer trimestre de 2022 registró una AFR de 1,22 %. Esto podría significar que algunos modelos tienen una durabilidad inferior a la esperada y han comenzado a fallar. También podría ser un problema con un lote de unidades o debido a las condiciones de manejo, instalación y funcionamiento. En pocas palabras, no hay forma de decir que «los discos duros están empeorando» a partir de estos datos, ya que hay demasiadas incógnitas.

El informe de tasas de fallas anualizadas de Backblaze parece relativamente alineado con un análisis similar de fallas de HDD realizado por Secure Data Recovery, una empresa de recuperación de datos de HDD, SSD y RAID. Examinó 2007 HDD y encontró que su vida promedio antes de fallas se estableció en alrededor de 2 años y 10 meses. Eso es solo cuatro meses aparte del resultado de 2 años y seis meses de Backblaze.

Esperamos que ambos proveedores continúen analizando las tasas de falla y proporcionando esos datos públicamente. Y si tiene datos importantes que no puede soportar perder, asegúrese de tener una buena estrategia de copia de seguridad; incluso algo tan simple como un dispositivo de almacenamiento externo es mejor que nada.



Source link-41