采用 chiplet 架构、包含 432 个 RISC-V 和 AI 加速器并配备 32GB HBM2E 内存的 Occamy 处理器已经流片。据HPC Wire报道,该芯片由欧洲航天局(ESA)支持,由苏黎世联邦理工学院和博洛尼亚大学的工程师开发 。 Occamy 处理器使用两个带有 216 个 32 位 RISC-V 内核的小芯片,未知数量的 64 位 FPU 用于矩阵计算,并搭载两个来自美光的 16GB HBM2E内存。内核使用硅中介层互连,双片 CPU 可提供 0.75 FP64 TFLOPS 的性能和 6 FP8 TFLOPS 的计算能力。 ESA 及其开发合作伙伴都没有透露 Occamy CPU的功耗,但据说该芯片可以被动冷却,这意味着它可能是一款低功耗处理器。每个 Occamy 小芯片都有 216 个 RISC-V 内核和矩阵 FPU,分布在 73mm^2 硅片上的晶体管总数约为 10 亿个。由 GlobalFoundries 使用其 14LPP 制造工艺制造。 相比而言73mm^2 小芯片不是特别大的芯片。例如,英特尔的 Alder Lake(具有六个高性能内核)的裸片尺寸为 163 mm^2。就性能而言,配备 24GB HBM2 内存的 Nvidia A30 GPU 可提供 5.2 FP64/10.3 FP64 Tensor TFLOPS 以及 330/660(具有稀疏性)INT8 TOPS。
同时,小芯片设计的优势之一是 ESA 及其来自苏黎世联邦理工学院和博洛尼亚大学的合作伙伴可以在需要时向封装中添加其他小芯片,以加速其对某些工作负载的应用支持。Occamy CPU 是作为 EuPilot 计划的一部分开发的,它是 ESA 正在考虑用于航天计算的众多芯片之一。但是,无法保证该过程确实会在宇宙飞船上使用。 Occamy 设计旨在通过裸机运行时支持高性能和 AI 工作负载,但目前尚不清楚运行时是在容器级别还是在裸机级别。Occamy 处理器可以在 FPGA 上进行仿真。已在两个 AMD Xilinx Virtex UltraScale+ HBM FPGA 和 Virtex UltraScale+ VCU1525 FPGA 上进行了测试。