早在2018年的Hot Chips上,Tachyum就公开了Prodigy通用处理器的设计概念,其利用动态二进制翻译器可以运行任何代码,同时有着非常高的执行和翻译代码效率。Tachyum也在去年带来了Prodigy,并开始接受评估平台的预购,其中最高规格的是T16128-AIX,有着128个核心,TDP为950W。Tachyum表示,Prodigy通用处理器的双精度浮点性能是NVIDIA H100的三倍,而AI FP8性能则是六倍。
近日Tachyum宣布,通过在Prodigy通用处理器的物理设计阶段使用新的EDA工具,取得了更好的设计效果,成功地将核心数量从最高的128个提升至192个,增加了50%,而且芯片尺寸增长也很小,从500mm2增加至600mm2,以容纳更多的内核。Tachyum的设计团队在更换IP后,还更换了RTL仿真和物理设计工具,使其能够优化设置和选项。
这次Prodigy通用处理器在物理设计阶段的其他改进包括:
芯片的L2/L3高速缓存从原来的128MB,增加到192MB。
除了DDR5-6400,还支持DDR5-7200。
每通道1个DIMM,速度更快。
更大的封装可容纳额外的32个串行链路,单个Prodigy芯片可连接多达32个DIMM。
Prodigy号称全球第一颗通用处理器(Universal Processor),同一个芯片上可以执行CPU、GPU和TPU任务,可运行原生和x86、Arm和RISC-V二进制文件,与竞争产品相比,可以节省成本并提供高性能计算能力。其采用了Tachyum的自研架构,采用台积电N5P工艺制造,最高拥有192个64位核心,配备了16个DDR5内存控制器,支持双路和四路平台。