Hace poco más de una semana, la Oficina de Patentes de EE. UU. publicó una patente de AMD titulada Distributed Geometry; la patente en sí fue presentada por AMD en abril de este año. La patente detalla un enfoque totalmente chiplet para las GPU, donde la carga de trabajo de renderizado se distribuye entre una colección de chips, en lugar de tener un troquel enorme que se encargue de todo el procesamiento. Por supuesto, no hay indicios de que veamos esto empleado en una tarjeta gráfica Radeon en el corto plazo, pero es la evolución natural de lo que ya hemos visto en RDNA 3.
Recogí noticias sobre la patente del canal de YouTube RedGamingTech y es una lectura fascinante. Aunque el documento se titula ‘Geometría distribuida’, en realidad se trata de renderizado distribuido. Tomemos como ejemplo la actual GPU Navi 31 de AMD, su procesador gráfico más grande utilizado en la serie Radeon RX 7900. Eso usa chiplets, pero estos solo contienen dos interfaces VRAM y una porción de L3 Infinity Cache; el resto de la GPU reside en un solo bloque (llamado GCD, matriz de cálculo de gráficos).
Como ocurre con todas las GPU, hay un procesador de carga de trabajo central que envía tareas de renderizado a uno de los muchos bloques de sombreadores dentro del chip. A cada unidad se le asigna una pieza de geometría para desmenuzarla, convertirla en píxeles y luego sombrearla. Se ha hecho así durante décadas y tanto AMD como Nvidia casi han perfeccionado el proceso en sus GPU.
Lo que la patente de AMD detalla es un enfoque en el que se abandona el procesador central y se reemplaza el único trozo de silicio por varios chiplets, donde cada uno maneja sus propias tareas. Las instrucciones de renderizado se envían a las GPU en una secuencia larga llamada lista de comandos y entre ellas se encuentran cosas llamadas llamadas de dibujo.
Estas son instrucciones para tomar un montón de geometría (es decir, triángulos en forma de una colección de vértices e índices) y luego pasar por todo el proceso de moverla, cambiar su tamaño, etc. antes de convertirla finalmente en un bloque de píxeles de colores. almacenado en la VRAM.
Cada chiplet de geometría distribuida en la patente determina qué triángulos deben sombrearse y luego lo hace. La patente explica que hay varias maneras en que los chiplets pueden realizar un seguimiento de cuál está haciendo qué geometría, siendo el método más simple un asunto de turnos (es decir, cada chiplet se turna para trabajar en la lista de polígonos).
Parece que esto hace que todo sea mucho más complicado, entonces, ¿cuáles son los beneficios potenciales de hacer esto? Como hemos visto en el exitoso cambio de AMD a chiplets para sus CPU, se trata principalmente de reducir los costos de fabricación del hardware de alta gama. Las GPU muy grandes son menos rentables que las más pequeñas porque cada oblea de silicio produce menos matrices de trabajo. Los chips de memoria del Navi 31 son tan pequeños que una oblea típica de 12 pulgadas puede producir más de mil, e incluso si un gran número de ellos están defectuosos, todavía tienes una pequeña montaña de chips en funcionamiento.
AMD claramente quiere adoptar el mismo enfoque con el resto de la GPU. Los nodos de proceso de última generación son enormemente caros, por lo que si se puede fabricar una GPU de alta gama simplemente juntando una pila de pequeños chiplets en el mismo paquete, se puede reducir el coste total de fabricación.
Sin embargo, existen serios desafíos que deben superarse para que esta sea una forma eficaz de construir una GPU. El primero de ellos son los requisitos de latencia y ancho de banda interno. Dentro de un procesador de gráficos normal, se pueden leer y escribir varios terabytes de datos entre las cachés cada segundo, y cada transacción se realiza en tan solo unos pocos nanosegundos. Al cambiar a chiplets, el sistema utilizado para conectar todo a los controladores de memoria y caché compartidos debe ser muy duro.
Afortunadamente, AMD ya tiene mucha experiencia en esta situación. Los Infinity Fanout Links utilizados en la serie RX 7900, para conectar el GCD a los chips de memoria, proporcionan una gran cantidad de ancho de banda y la latencia no es mucho peor que la vista en una GPU de matriz completa, como la Navi 21 (RX 6900XT). Lo que se necesitaría para este diseño de geometría distribuida es un buen paso adelante, pero si alguien puede resolverlo, será AMD.
El otro problema que deberá resolver es garantizar que todos los chiplets se mantengan lo más ocupados posible. Dado que cada uno determina su propia carga de trabajo, existe el riesgo de que algunas unidades queden inactivas porque las otras pueden trabajar en lo que se necesita con la suficiente rapidez. También existe el problema de los puestos de procesamiento, donde un chiplet en realidad no puede completar completamente una tarea porque requiere información de geometría vecina.
Nada de esto se discute en la patente, por lo que por ahora solo nos queda reflexionar sobre el asunto y preguntarnos cuándo AMD anunciará la tecnología, si es que alguna vez lo hace. Sospecho que esto se está planeando para RDNA 5, en lugar de la próxima iteración, pero existe una pequeña posibilidad de que no sea así. La última vez que vi una patente de tecnología radical de AMD fue para sus unidades de textura de trazado de rayos.
Se publicó en junio de 2019, casi dos años después de su presentación, y la función se implementó en RDNA 2. AMD comenzó a promover esa arquitectura en 2020 y los primeros productos con los nuevos y elegantes procesadores de textura RT se lanzaron en noviembre del mismo año. Por lo tanto, existe una posibilidad, aunque bastante pequeña, de que AMD pueda traernos un mundo completamente nuevo de chiplets de GPU el próximo año, con RDNA 4.
Ese no parece ser el caso, ya que todos los rumores generales apuntan a que AMD se centrará en su cartera principal para 2024. Sería mucho más feliz si esperara hasta 2025 o incluso 2026 para ver esto en acción, ya que le darían a AMD más tiempo para solucionar todos los problemas.
Los juegos de PC necesitan desesperadamente el mismo nivel de competencia en el mercado de GPU que en el sector de CPU, y la única forma de que esto suceda es si las tarjetas Radeon son tan buenas como las GeForce pero con un precio significativamente más bajo.
Claro, las GPU de AMD son más baratas que las de Nvidia en este momento, pero siguen siendo enormemente caras. ¿Recuerdas cuando lanzó Zen al mercado y nos dio una CPU de ocho núcleos y 16 subprocesos por tan sólo 329 dólares, cuando Intel todavía vendía modelos de seis núcleos por 370 dólares? Ahora mire dónde se encuentra AMD con sus CPU para juegos: eso es lo que también necesitamos de sus GPU.