[ad_1]
Según un informe de Phoronix, la versión 6.1 del kernel de Linux presenta un nuevo sistema de registro para identificar CPU defectuosas y sus núcleos asociados dentro de un servidor. El sistema de registro puede detectar exactamente qué núcleo, CPU y zócalo fallaron en un momento específico.
Este no es un sistema completamente automatizado y es solo para iniciar sesión; no estresará a la CPU para verificar si hay fallas. Como resultado, Rik Van Riel, quien es responsable de autorizar el sistema de registro de la CPU para 6.1, dice que los administradores del sistema querrán ejecutar el código del núcleo comúnmente ejecutado que se sabe que causa fallas con un sistema defectuoso conocido con el registrador habilitado para ver qué núcleos son malos. .
El registrador no es perfecto, ya que las tareas del kernel pueden reprogramarse hacia otra CPU o núcleo de CPU, pero considera que esta estrategia es lo suficientemente buena para encontrar CPU o núcleos defectuosos. A menudo, las fallas de la CPU pueden ser «extrañamente específicas» donde programas específicos o piezas de código bloquearán solo el núcleo.
Este programa no está realmente diseñado para los consumidores, sino que está dirigido principalmente a los administradores de sistemas que ejecutan una gran cantidad de servidores basados en Linux. Para estos administradores, esta nueva herramienta puede ser realmente útil para buscar misteriosas fallas de hardware cuando los probadores de estrés de CPU completos como Prime95 o Aida64 son perfectamente estables.
Los verificadores de errores como este, así como la nueva tecnología In-Field-Scan de Intel, continúan creciendo en popularidad en la industria de servidores. A medida que las CPU continúan haciéndose más y más pequeñas con nodos de vanguardia, existen mayores posibilidades de que ocurran errores dentro del silicio (que comúnmente se conocen como errores leves).
A medida que nos acercamos más y más a los límites físicos de los tamaños de los transistores (como 1 nm o menos), las CPU teóricamente deberían volverse cada vez más susceptibles a los errores, particularmente hacia la radiación cósmica. Como resultado, la verificación de errores de la CPU se volverá exponencialmente más importante a medida que pase el tiempo y la densidad del transistor continúe mejorando.
[ad_2]
Source link-41