返回顶部
分享到

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

AI资讯 2023-9-19 01:05 PM 342人浏览 0人回复
摘要

这是一个无AI不欢的时代,而日益高涨的算力需求,对各类硬件提出了越来越苛刻的要求,也使得天生具备超强并行计算能力的GPU加速器大放异彩,仿佛成为圣物一般的存在,人们甚至不惜花三十多万元去抢一块卡。但是同时 ...

 这是一个无AI不欢的时代,而日益高涨的算力需求,对各类硬件提出了越来越苛刻的要求,也使得天生具备超强并行计算能力的GPU加速器大放异彩,仿佛成为圣物一般的存在,人们甚至不惜花三十多万元去抢一块卡。

但是同时,CPU处理器的光芒却被完全掩盖,甚至出现了“GPU可以彻底取代CPU”这样令人哭笑不得的言论。

事实上,在AI的硬件世界里,CPU、GPU、FPGA、ASIC都是重要的成员,各有各的特点和优劣,无所谓谁比谁好,只能说需要在最合适的地方使用最合适的硬件,彼此之间也可以有机配合,达到效率的最优化。

其中,CPU的计算性能不是最强的,在处理特定负载时甚至可能是最弱的,但作为计算机行业一直以来的中枢,它有着不可替代的地位,不但扮演着核心指挥官的角色,还在不断跟随时代的变化而不断演进,有着无可比拟的灵活性、适应性。

举个例子,业内一度普遍认为,生成式AI和大语言模型(LLM)只适合在高性能GPU上运行,但事实上在CPU上同样有着极高的效率,特别是配合特定加速器,效率与规模不受限制,从而提供极具竞争力的不同选择。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

近些年,在服务器与数据中心领域,CPU持续快速迭代、升级,无论是AMD EPYC还是Intel至强,每一代都是旧貌换新颜,如今更成为AI浪潮的坚定基石。

尤其是AMD EPYC,2017年诞生重返高性能计算市场以来,凭借优秀的Zen系列架构,性能越来越强,能效越来越高,能力越来越丰富:高性能计算、边缘计算、人工智能、云服务、5G与通信基础设施、虚拟化……几乎无所不能。

回想2017年之前,整个数据中心市场被Intel至强完全垄断,客户没有任何选择空间,Intel提供什么就只能用什么,Intel要多钱就只能给多少钱,也难怪AMD EPYC 2017年横空出世的时候,整个行业的态度几乎都是“欢迎归来”。

AMD EPYC也确实没有令大家失望,经过连续四代的进化,如今拥有业界最高的计算密度、最高的性能、最高的效率,或者直白地说有着最多的核心、最大的缓存、最高的频率,以及极为丰富的技术特性,更关键的是不忘初心,一直坚持极高的性价比,可谓不二之选。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

2022年11月11日,一个特殊的日子里,Genoa EPYC 9004系列正式诞生,而对手规划的Sapphire Rapids第四代可扩展至强反复跳票接近两年,不但速度慢得多,性能表现也相去甚远。

全新的5nm制造工艺、全新的Zen 4架构、Chiplet芯粒布局与最多96核心192线程、最多384MB海量三级缓存、最高4.4GHz加速频率、12通道DDR5-4800内存(单路最大容量6TB)、128条PCIe 5.0总线、CXL 1.1+高速互连标准、全新升级的加密计算……

这些亮点,每一个单独拿出来都值得说道半天,EPYC 9004却把它们一网打尽,而且还有着相当高的能效,即便是旗舰级的96核心型号EPYC 9654热设计功耗也只有360W,标准风冷散热即可轻松搞定。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

作为对比,Intel Sapphire Rapids四代至强还是Intel 7制造工艺(原名10nm)、最多60核心120线程与112.5MB三级缓存、4.2GHz最高频率、8通道DDR5内存(单路最大容量4TB)、80条PCIe 5.0……几乎全面落于下风,只有各种加速器相当惹眼,但也侧面反映了CPU本身能力的欠缺。

实际性能方面,按照AMD在今年6月份举办的“数据中心与AI技术首映”上给出的数据,EPYC 9654对比至强铂金8490H,96核心旗舰对比60核心旗舰,云服务性能领先1.8倍,企业计算性能领先1.7-1.9倍,能效领先1.8倍,AI性能领先1.9倍,性价比领先近乎2.6倍……

四代对四代,AMD EPYC明显碾压了Intel至强。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

如果到这里结束,AMD EPYC的表现已经近乎完美,但它还有着更高的追求,开始面向不同细分市场延伸、深入,通过不同的设计为不同的负载和场景提供最优化解决方案,第一次全面开花。

具体来说,EPYC 97X4系列(Bergamo)通过更高能效的Zen 4c架构,主打云原生市场;

EPYC 9084X系列(Genoa-X)通过集成大容量高速3D V-Cache堆叠缓存,提供顶级计算能力;

即将发布的Siena系列,则主打边缘计算等,能效同样非常高。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

其中,Bergamo EPYC 97X4系列创新地采用了“同构小核心”设计,Zen 4架构核心衍生出来的Zen 4c,最大核心数从96个增加到128个,从而拥有业界最高核心密度。

但是,Zen 4c架构并没有为了增加核心数而简单粗暴地阉割功能、性能,它和Zen 4拥有完全相同的制造工艺、架构设计,无论x86 ISA指令集还是IPC理论性能,都保持百分百一致。

12通道DDR5内存、128条PCIe 5.0总线……这些关键技术特性也原汁原味地保留。

通过紧凑结构、精简缓存、优化频率,Zen 4c核心拥有了更高的能效,或者可以说是业内最高的能效,从而完美匹配云服务的场景需求。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

Zen 4c核心仍然是5nm工艺制造,单个核心加对应二级缓存的总面积仅为2.48平方毫米,相比于Zen 4核心加二级缓存的3.84平方毫米,缩小了足足35%。

Zen 4架构的Genoa集成最多达12组CCD,每个都是8核心,总计最多96核心。

到了Bergamo之上,正是凭借Zen 4寸高超的能效、单位面积设计,每一组CCD的核心数翻番达到16个,因此只用了8组CCD,就达成了128核心的顶级规格。

哦对了,三级缓存容量依然高达256MB,仍旧是对手的两倍有余。

AI浪潮中 CPU能做些什么?AMD EPYC全面开花给出完美答案

Bergamo在云原生应用中的性能可谓大杀四方,别说是Intel Sapphire Rapids四代至强这种稍显“笨重臃肿”的设计,就连同样专为云服务而生的一系列Arm架构产品也完全不是对手。


12下一页
本文暂无评论,快来抢沙发!

热门问答
AIHIA梦工厂旨在建立涵盖广泛人工智能行业,包括AI芯片、AI工业应用、AI电商、AI自动驾驶、AI智慧城市、智慧农业等人工智能应用领域。梦工厂为每位AI人提供技术交流、需求对接、行业资源、招聘求职、人脉拓展等多个方面交流学习平台促进人工智能的发展和应用。
  • 官方手机版

  • 联盟公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2023, AIHIA梦工厂
  • 苏ICP备2023025400号-1 | 苏公网安备32021402002407 | 电信增值许可证:苏B2-20231396 | 无锡腾云驾数技术服务有限公司 QQ