站点图标 诗与远方

强劲算力背后是庞大的消耗,AMD确认Instinct MI300X功耗高达750W

AMD在6月15日的数据中心和AI技术首映活动上展示了它们的Instinct MI300X GPU,在会议上AMD并没有提及该产品的功耗相关信息,但随后Hoang
Anh Phu发现了Instinct MI300X基于OAM(OCP加速器模块)的设计功耗高达750W,一举超越NVIDIA的Hopper
H100的700W成为目前功耗需求最高的GPU。

AMD的Instinct MI300系列包括Instinct
MI300A和MI300X,前者包含CPU与GPU,CPU部分采用了三颗Zen 4
CCD,共24核心,而GPU部分则为最先的CDNA3架构,六颗XCD芯片,并配备128GB的HBM3内存,由CPU与GPU共享。

而MI300X则是把CPU模块也换成GPU,是一个纯GPU的加速模块,配备192GB
HBM3内存,由于GPU模块比CPU模块更耗电,而且HBM数量也更多,所以一个OAM模块功耗就高达750W,相比与上一代CDNA2架构的MI250X的560W提高了相当多。

最近几年数据中心GPU的功耗增长相当明显,NVIDIA H100 SXM GPU
TDP高达700W,而采用风冷的PCI-E版本也要350W,基于Ponte Vecchio GPU的Intel Max
1550即使是PCI-E版本功率也要600W。