El nuevo firmware I/O+ optimizado para juegos de Phison podría llegar pronto a un SSD cerca de usted, brindando un rendimiento de clase DirectStorage a las masas. Los entusiastas están emocionados de que la API de DirectStorage permitirá que los juegos compatibles se carguen en unos segundos, brindando un rendimiento explosivo. Sin embargo, la nueva API también permitirá mejoras más amplias en todo tipo de tareas vinculadas al almacenamiento. El primer juego habilitado para DirectStorage, Forspoken, no llegará hasta enero de 2023. Aún así, Phison nos dio acceso a una versión anterior de su nuevo firmware que transformará algunos SSD con tecnología Phison existentes en dispositivos compatibles con DirectStorage.
Phison ofrecerá inicialmente el firmware I/O+ gratuito a sus OEM para unidades que utilizan su controlador PCIe 4.0 E18 de gama alta, centrándose en los modelos que tienen el flash TLC rápido de 176 capas de Micron (B47R). Los fabricantes pueden elegir cómo ofrecer este firmware, pero el firmware está diseñado para cumplir con los criterios de alta calidad de DirectStorage para el rendimiento de juegos de próxima generación. Los futuros SSD de Phison, como los que funcionan con el controlador E26, vendrán con una versión de este firmware de forma predeterminada.
Primero, veamos cómo funciona este firmware para habilitar el rendimiento de clase DirectStorage y luego lo pondremos a prueba en nuestra suite de referencia.
Cómo funcionan los SSD optimizados para DirectStorage
La API de almacenamiento de Microsoft Windows está diseñada para mejorar el rendimiento del almacenamiento específicamente aprovechando las SSD NVMe rápidas, pero adaptar las unidades para un rendimiento óptimo extraerá las velocidades más rápidas. La API será mejor en Windows 11, pero también funcionará en Windows 10.
La idea general es que la sobrecarga de la pila de almacenamiento se puede reducir al eliminar las ineficiencias a través de BypassIO, un camino optimizado hacia el controlador StorNVMe y el dispositivo de almacenamiento que reduce en gran medida la cantidad de pasos necesarios para acceder a los datos. Por ejemplo, BypassIO reduce la ruta de 11 pasos a tres, lo que reduce la sobrecarga y la latencia de la CPU. El SSD NVMe se puede usar como una especie de caché para transmitir activos y datos, lo que reduce la carga de VRAM de la GPU. Esto mejorará aún más con la descompresión acelerada por GPU en el futuro.
Todo esto plantea desafíos para los SSD de consumo actuales porque están diseñados para cargas de trabajo en ráfagas en lugar de sostenidas. Las pruebas personalizadas de Phison implican una unidad más completa que debe soportar una gran cantidad de actividad de lectura de datos durante varias horas: 2,5 GBps es un mínimo para baja calidad, pero 5 GBps o más es deseable. Por ejemplo, la primera demostración pública de Forspoken se ejecutó con un detalle medio y requirió un flujo constante de 4 GBps desde el SSD.
Tradicionalmente, las métricas de rendimiento del consumidor del «mundo real» se han centrado en accesos de 4 KB a profundidades de cola bajas que van de 1 a 4, pero DirectStorage utilizará accesos de lectura aleatorios grandes a profundidades de cola muy altas. Así que aquí estamos tratando con tamaños de bloque grandes de más de 32 KB y una profundidad de cola de más de 512, lo que representa una posible carga de trabajo de DirectStorage. De hecho, debemos anticipar E/S de hasta 1 MB de tamaño, siendo 64 KB un objetivo típico para la consistencia.
Este tipo de carga de trabajo también desafía la resistencia de una unidad debido a la ‘perturbación de lectura de bloque’, un proceso que crea desgaste en los bloques de lectura frecuente, lo que reduce la resistencia. Administrar esta condición es excepcionalmente importante con los SSD DirectStorage: cada bloque de datos del juego puede experimentar hasta 20,000 lecturas de página por hora en un intervalo de 60 a 100 GB de la unidad.
Block Read Disturb es una condición insignificante con unidades estándar. Sin embargo, el nuevo firmware necesita mantener el flash debido a la naturaleza intensa de las cargas de trabajo de DirectStorage, todo mientras sigue priorizando las solicitudes de E/S del host. Martillar el flash con lecturas introduce errores de bits con el tiempo que pueden afectar temporalmente el rendimiento, pero el acceso a la unidad sigue teniendo una gran demanda. Phison ha desarrollado una programación inteligente para el mantenimiento con algoritmos de desgaste adaptativo que funcionan perfectamente en segundo plano para que el rendimiento se mantenga constante con un desgaste mínimo de aditivos.
Ser capaz de aprovechar al máximo la potencia y la paralelización nativas de su SSD NVMe es sin duda algo bueno, incluso si los desarrolladores de juegos tardarán un tiempo en ponerse al día. La tecnología también puede ayudar con las aplicaciones, particularmente con la creación y el diseño de contenido. Esto incluiría la edición y renderización de video para el primero, y el aprendizaje profundo o la bioinformática para el segundo. El diseño y la fabricación asistidos por computadora (CAD/CAM) es otra área que puede experimentar una mejora temprana. Phison también dice que la compilación del código fuente también experimenta notables aceleraciones.
Hoy usaremos algunas de las pruebas DirectStorage sintéticas recomendadas por Phison para mostrar qué tipo de rendimiento puede mantener la unidad en condiciones de carga de trabajo futuras. También ejecutaremos este firmware a través de nuestro conjunto de pruebas típico para ver qué impacto podría tener en las aplicaciones cotidianas. Phison espera un rendimiento normal o un poco de ganancia. En el futuro, tendremos productos minoristas, puntos de referencia y aplicaciones del mundo real destinadas a probar la nueva API. También se usa una tecnología similar en las consolas de generación actual, por lo que es posible que también tengamos que explorar los impactos allí. Por ahora, solo te estamos dando una muestra.
Una mirada más cercana
Phison recomienda que cualquier unidad con este firmware use un disipador de calor, ya que las cargas de trabajo asociadas son prolongadas y exigentes. Específicamente, este firmware está diseñado para lecturas aleatorias sostenidas con tamaños de bloque más grandes, pero Phison se ha asegurado de que las áreas de rendimiento no optimizadas no experimenten una degradación del rendimiento. El firmware también podría mejorar el rendimiento de escritura de este flash específico porque el TLC de 176 capas de Micron tiene un potencial sin explotar.
Desde el exterior, la unidad de muestra no parece especial. Es similar a las unidades de vista previa originales de 2 TB enviadas para el controlador Phison E18 con flash de 176 capas de Micron. Vemos un controlador con DRAM en el medio y un total de ocho paquetes NAND, con otro paquete DRAM en la parte posterior.
Las unidades de vista previa venían con un disipador de calor instalado, y este no. Eso tiene sentido para las apariencias, pero estas cargas de trabajo requieren refrigeración. Afortunadamente, Phison también envió un disipador de calor, el mismo que se usó en las unidades de vista previa, lo que ayudó mucho.
Aquí vemos un controlador Phison E18 fabricado a mediados del año pasado. Ciertamente es posible que los fabricantes ofrezcan este firmware para sus unidades existentes. Sin embargo, puede haber razones válidas para no hacerlo, especialmente teniendo en cuenta lo difíciles que son estas cargas de trabajo en el SSD.
Dos módulos DDR4 de 1GB de SK hynix ayudan a que esta unidad se mantenga en forma. Un aspecto que queremos probar en el futuro es el impacto de DRAM en las cargas de trabajo de DirectStorage. Normalmente, el almacenamiento en caché DRAM es más útil para escrituras que para lecturas, especialmente porque los datos «más calientes» tienen prioridad. Las E/S más grandes generalmente también requieren menos memoria para el direccionamiento.
La SRAM del controlador local y los 64 MB de memoria del sistema externo a través de la función de búfer de memoria del host (HMB) pueden ser suficientes, pero sospechamos que la mezcla de mantenimiento necesaria para un funcionamiento óptimo se beneficiará de la DRAM, especialmente con unidades de gran capacidad.
La unidad viene con flash TLC de 176 capas de Micron. El firmware I/O+ está diseñado para funcionar con este flash, pero podría ampliarse para funcionar con NAND más antiguas. El B47R de Micron se ha desempeñado muy bien en varias unidades con múltiples controladores. Es bastante rápido, por lo que es un banco de pruebas sólido aquí.
MÁS: Los mejores SSD
MÁS: Cómo probamos HDD y SSD
MÁS: Todo el contenido de SSD