登录

会员权益

获取需求

查看名片

专属客服

尊贵标识

VIP低至1.5U/天

【2024旧金山AMD发表会直击】AMD发表最高192内核的第5代EPYC处理器,推出新Instinct MI325X加速器

分享

支付動態

2024-10-10

第5代EPYC处理器,内部单元采用3纳米及4纳米制程设计,内含1,500亿个晶体管,内核从最低8个内核到192个内核,155瓦到500瓦,以满足不同内核数、时脉等数据中心CPU需求。AMD也同步发表新的数据中心专用GPU,Instinct系列AI加速器MI325X,预告明年下半年再推出MI350系列。

第5代EPYC处理器支持Scale-up向上扩充及Scale-out横向,其中Scale-up版本内置16个Zen 5 CCDs,拥有128个内核、256个线程,而Scale-out版本内置12个Zen 5c CCDs,虽然CCDs数量比较少,但是最多有192个Zen 5c内核、384个线程。

回顾EPYC处理器从2017年的第1代EPYC,到2024年的第5代,处理器内的CPU内核数从最初的32个内核,到现在的192个内核,内核数增加6倍,性能方面,第5代EPYC处理器比第1代EPYC提升11倍的性能。

AMD也从不同角度比较新一代EPYC处理器所能带来的效益,例如在虚拟化的软件授权成本方面,以同样64个内核的第5代EPYC处理器9575F和第4代EPYC的9554、英特尔第5代Xeon 8592+作比较,第5代EPYC处理器9575F的单一内核性能,较AMD前一代EPYC,英特尔第5代Xeon处理器性能分别高出1.2倍、1.6倍;单单以第5代EPYC处理器和竞争对手英特尔的产品相比,相当于在相同虚拟化软件授权成本下,性能多出60%。

在AI及推论性能方面,相同处理器在机器学习及端到端AI,第5代EPYC和竞争对手相比拥有3倍、3.8倍的AI性能。

第5代EPYC处理器更多的CPU内核,在数据中心有限的空间、供电下,可减少服务器数量,AMD以1000台老旧的2P英特尔Xeon Platium 8280服务器为例,如果汰换为现代服务器,采用第5代EPYC处理器的服务器服务器数量可减少至131台,相当于7:1服务器数量整并比例,减少服务器数量,意谓着降低TCO总持有成本,减少服务器用电。

同步发表Instinct MI325X加速器,明年下半年再推MI350

在数据中心专用GPU方面,去年夏天AMD发表Instinct MI300系列,包括APU设计的MI300A,以及MI300X,AMD也推广ROCm开放软件平台,扩大ROCm对AI函数库的支持,向开发社群招手,扩大Instinct加速器的生态系。

苏姿丰表示,ROCm经过不断的调整,在推论及训练性能已提升2倍性能,支持的模型数量上,通过和Hugging face深化合作,现在支持的模型数量已超过1百万个。此外,也和AI开发社群、新创深化合作,例如PyTorch、ONNX、TensorFlow,扩大AI生态系统。

今年AMD更新Instinct系列加速器,发表MI325X加速器,采用CDNA 3架构,内置更大的256GB HBM3E内存,内存带宽提高到每秒6TB,FP16性能测试下,可达到1.3PF,在FP8性能测试下,可达到2.6PF。

AMD 以MI325X和Nvidia H200 HGX相比,MI325X最大可支持2TB HBM3E,为H200HGX的1.8倍内存容量,内存带宽最多可每秒48TB,为H200的1.3倍,在AI模型训练及推论性能也有所提升。MI325X并未公布价格,但将在今年第4季开始生产,相关系统将在明年第1季推出,根据AMD公布的数据,Dell、技嘉、HPE、Lenovo、Supermicro将会采用。

根据AMD的Instinct系列产品规画,明年下半年将会发表MI350系列,MI350将会采用3纳米制程,支持FP4及FP6数据类型,并且有别于先前采用的CDNA 3架构,MI350开始采用新的CDNA 4架构,和旧架构相比,推论性能可望达到35倍之多。

AMD展示Instinct MI355X在FP16及FP8测试下,其性能表要比MI325X高出1.8倍,在FP6及FP4,可达到9.2PF。

看好数据中心AI加速器市场持续成长,年复合成长率超过6成,可望从2023年450亿美元成长到2028年的5,000亿美元,AMD展现持续投入数据中心GPU市场的决心,除了明年下半年的MI350系列,先预告2026年将推出MI400系列,采用下一代CDNA架构。

因应数据中心处理AI工作负载的需求增加,除了发表新一代EPYC处理器,以及Instinct系列AI加速器,数据中心网络产品方面,AMD发表第3代P4引擎,每秒处理多达1.2亿个封包,400GB/s传输速度。

今天发表采用新的P4引擎数据中心DPU产品,包括AMD Pensando Salina 400,以及另一款也采用P4引擎的Pensando Pollara 400,Pollara支持Ultra Ethernet Consortium联盟即将推出的UEC1.0标准,支持可编程的硬件Pipeline,提供最高6倍性能加速。

 
免责声明:
详情

Please Play Responsibly:

Casino Games Disclosure: Select casinos are licensed by the Malta Gaming Authority. 18+