El procesador Occamy, que utiliza una arquitectura de chiplet, incluye 432 aceleradores RISC-V y AI y viene con 32 GB de memoria HBM2E, se ha agotado. El chip está respaldado por la Agencia Espacial Europea y desarrollado por ingenieros de ETH Zürich y la Universidad de Bolonia, informa HPC Wire.
El procesador Occamy respaldado por ESA utiliza dos chipsets con 216 núcleos RISC-V de 32 bits, un número desconocido de FPU de 64 bits para cálculos matriciales y lleva dos paquetes de memoria HBM2E de 16 GB de Micron. Los núcleos están interconectados mediante un intercalador de silicio, y la CPU de mosaico dual puede ofrecer 0,75 FP64 TFLOPS de rendimiento y 6 FP8 TFLOPS de capacidad informática.
Ni la ESA ni sus socios de desarrollo han revelado el consumo de energía de las CPU Occamy, pero se dice que el chip se puede enfriar de forma pasiva, lo que significa que podría ser un procesador de bajo consumo.
Cada chiplet Occamy tiene 216 núcleos RISC-V y FPU de matriz, con un total de alrededor de mil millones de transistores repartidos en 73 mm ^ 2 de silicio. Los mosaicos están fabricados por GlobalFoundries utilizando su proceso de fabricación 14LPP.
El chiplet de 73 mm^2 no es un troquel particularmente grande. Por ejemplo, Alder Lake de Intel (con seis núcleos de alto rendimiento) tiene un tamaño de matriz de 163 mm^2. En lo que respecta al rendimiento, la GPU A30 de Nvidia con 24 GB de memoria HBM2 ofrece 5,2 FP64/10,3 FP64 Tensor TFLOPS, así como 330/660 (con escasez) INT8 TOPS.
Mientras tanto, una de las ventajas de los diseños de chiplets es que la ESA y sus socios de ETH Zürich y la Universidad de Bolonia pueden agregar otros chiplets al paquete para acelerar ciertas cargas de trabajo si es necesario.
La CPU Occamy se desarrolla como parte del programa EuPilot y es uno de los muchos chips que la ESA está considerando para la computación de vuelos espaciales. Sin embargo, no hay garantías de que el proceso se utilice a bordo de naves espaciales.
El diseño de Occamy tiene como objetivo admitir cargas de trabajo de IA y de alto rendimiento a través de un tiempo de ejecución completo, pero aún no está claro si el tiempo de ejecución será a nivel de contenedor o de nivel completo. El procesador Occamy se puede emular en FPGA. La implementación se ha probado en dos FPGA AMD Xilinx Virtex UltraScale+ HBM y en la FPGA Virtex UltraScale+ VCU1525.