AMD二代霄龙实测:双路128核心256线程无情碾压

AMD二代霄龙实测:双路128核心256线程无情碾压,第1张

近日,AMD正式发布了第二代EPYC霄龙骁龙处理器,为数据中心市场奉上一道大餐,规格参数遥遥领先,生态建设也是欣欣向荣。那么实际性能到底如何呢?AnandTech有幸进行了一番实测,一起来瞻仰瞻仰。

二代霄龙的规格无疑是相当炫目的,也没有任何敌手:7nm全新工艺、Zen 2全新架构、Chiplet小芯片设计、最多64核心128线程、最大256MB三级缓存、首发支持PCIe 4.0并有128条通道、单路最大4TB DDR4-3200内存、18GT/s高速低延迟第二代Infinity Fabric互连总线、SME安全内存加密、SEV安全加密虚拟化……

AnandTech拿到的是 旗舰型号霄龙7742,64核心128线程,基准频率2.25GHz,最高加速3.40GHz,三级缓存256MB,热设计功耗225W,价格为6950美元。

Intel方面目前最顶级的是 至强铂金8280/8280M ,14nm工艺,28核心56线程,基准频率2.7GHz,最高加速4.0GHz,三级缓存38.5MB,热设计功耗205W,价格10009/13012美元。

其实,Intel也有56核心112线程的至强铂金9282,但采用了LGA封装,整合在主板上,热设计功耗高达400W,价格更是据说要五六万美元。

就在二代霄龙发布前,Intel刚刚宣布了56核心112线程的LGA独立封装新品,但尚未正式发布,具体规格也没有公布,而且即便如此核心数量上也仍处于劣势,价格怎么也得两三万美元。

二代霄龙双路产品线

二代霄龙VS二代可扩展至强

二代霄龙单路产品线

实际测试中用了两颗霄龙7742,组成双路共128核心256线程,搭配主板是一块参考设计板子,内存是美光的DDR4-3200 512GB(32GB×16),硬盘启动盘是三星MZ7LM240、数据盘是美光9300 3.84TB,电源1200W。

同时还有 初代霄龙旗舰7601 ,32核心64线程,最高频率2.2-3.2GHz,三级缓存64MB,热设计功耗180W,也搭配16条32GB内存。

Intel方面参战一个是刚才说的 至强铂金8280 ,另一个是初代可扩展 至强铂金8176 ,也是28核心56线程,频率2.1-3.8GHz,三级缓存38.5MB,热设计功耗165W,价格8725美元。

有时候还会加入 至强E5-2699 v4 ,Broadwell四代酷睿同架构,14nm工艺,22核心44线程,频率2.2-3.6GHz,三级缓存55MB,热设计功耗145W,价格4115美元。

由于服务器的测试项目都比较专业、复杂,我们这里不做过多展开,看看对比差异就好。

另外,霄龙的内存延迟问题由于比较复杂,后续将单独展开介绍。

SPEC CPU2006单线程测试中,霄龙7742、7601单个核心可以分别最高加速到规定的3.4GHz、3.2GHz,至强8176也能如约达到3.8GHz,但无法获得至强8280的数据,如果能达到4GHz则性能可比至强8176高出大约3-5%。

霄龙7742的单线程性能比前代霄龙7601几乎每个项目中都有明显提升,最多达到了36%,平均也有18%。如果排除一个不变、一个倒退1%,其他项目平均提升幅度达22%。

霄龙7742对比至强8176则是有高有低,最好的领先28%,最差的落后39%,平均落后7%,如果对比至强8280可能落后10%左右。

另外要注意,GCC编译器的版本非常重要,越新越好,GCC 8.3相比于GCC 7.4霄龙7742的性能略有提升,456.hmmer甚至翻了一番。

SPEC CPU2006多线程测试中,霄龙7742相比霄龙7601核心数翻番、频率更高,领先幅度最高达到了恐怖的153%,平均也有109%,翻了一番还多。

霄龙7742对比至强8176更是碾压一般的存在,最多领先188%,最少领先36%,平均高达121%!即便是对至强8280也能领先超过110%。

在部分测试中比如libquantum,霄龙7742可以所有核心线程都跑到3.2GHz,而在另一些测试比如h264ref则都是2.5GHz。

7-Zip压缩测试中,霄龙7742领先霄龙7601 78%,领先至强8176 54% ,解压测试中分别领先1.27倍、 1.51倍

Java Max-jOPS测试中,霄龙7742领先霄龙7601 60%,领先至强8280 38-48%

如果每个节点四个Java虚拟机,官方数据提供的霄龙7742性能可领先联想系统实测的至强8280 73%。

Java Critical-jOPS测试中,大页(huge pages)的话霄龙7742领先至强8176 33% ,小页(small pages)则是可怕的 2.57倍

按照两家官方数据,如果为虚拟机配置更大内存,霄龙7742可领先 66%

NAMD高性能计算测试,至强8280终于扳回一局,但即便是开启AVX-512指令集,也只能领先霄龙7742 2%,否则的话霄龙7742就能领先 43% ,而对比霄龙7601则提升了71%。

虽然因为时间关系,本次测试并不全面深入,尤其是缺乏最高负载的测试,但是 很明显可以看出二代霄龙的强大优势,相比对手性能超出50-100%,而价格低了40%,无论性能、性价比、能耗比都无情碾压。

更何况,二代霄龙还有更新的工艺、更多的核心、更多的内存通道和容量、更多的PCIe通道和首发的PCIe 4.0。

这也难怪众多软硬件企业巨头都纷纷力捧AMD,也难怪AMD提出了数据中心市场份额要达到两位数的目标(目前为3.4%)。

AnandTech也是对二代霄龙赞不绝口,认为AMD达成了精彩绝伦(stellar)的成就,值得热烈鼓掌。

AMD后续还有Zen 3、Zen 4架构按期推进,Intel则会在明年推出10nm Ice Lake新工艺新架构的新至强,号称IPC提升18%,也支持八通道内存,核心数几乎肯定要多于56个,但不知道是否也会采用chiplet小芯片设计,频率和功耗又会如何。

AMD Ryzen锐龙这两年让微处理器乃至是整个PC领域焕发了新的勃勃生机,喜闻乐见的真刀真枪激烈竞争重现江湖,是整个行业以及所有消费者的福音。

而在一般用户很少关注的服务器和数据中心领域,AMD凭借全新的EPYC霄龙,同样刮起了一阵风暴,而且意义更加重大,而且更猛料的风暴也正在袭来。

2017年中,AMD携霄龙正式归来,重新杀回了数据中心领域,代号Naples(那不勒斯)的第一代产品就有14nm工艺、最多32核心64线程、八通道DDR4 2TB内存、128条PCIe通道、独立安全子系统、SoC单芯片集成设计、多代兼容接口等强大的规格,以及极具竞争性的定价。

浴火重生的霄龙吸引了全世界的关注和赞誉,更是赢得了整个服务器行业的热烈欢迎,相关产品和方案越来越丰富,硬生生杀开一条血路,短短一年多的时间市场份额就恢复到了5%。

当然,这一切只是一个开始,Zen架构诞生之初,AMD就毫不掩饰地公开了未来多年路线图。

AMD高级副总裁、数据中心与嵌入式解决方案事业部总经理Forrest Norrod在接受媒体采访时表示,AMD制定了一个三步走的战略,分别是2017年第一代的Naples(Zen架构),2019年的二代Rome(Zen 2架构),以及2020年的三代Milan(Zen3架构),分别实现进入、追赶和超越的目标。

Forrest Norrod表示: “Naples是很好的一个开始,它让我们重新进入到数据中心市场,目前来看我们很好地实现了这一目标。Rome则是这个计划的重要部分,我们希望它能继续保持性能领先,并进一步缩短跟英特尔的差距。而Milan会在性能方面全面超越竞争对手。”

2018年11月,AMD又首次公开了代号Rome(罗马)的第二代霄龙处理器的诸多细节,7nm全新工艺、Zen 2全新架构、最多64核心128线程、128条PCIe 4.0总线、单路最大4TB DDR4八通道内存的规格简直让人垂涎欲滴,隔壁的Cascade Lake的28核心56线程顿时黯然失色。

凭借新工艺新架构,二代霄龙号称综合性能比前代直接翻一番,浮点性能更是翻了两番,CPU 历史 上还从未有过如此激进的提升。

2019年6月的台北国际电脑展上,AMD CEO苏姿丰博士特别受邀发飙展会主题演讲,期间就官宣第二代霄龙服务器处理器系列预计将于2019年第三季度推出,而现在第三季度已经到来,二代霄龙也已经到了大门口。

二代霄龙的chiplet小芯片设计理念更是顺应时代。 在摩尔定律渐渐失效的今天,一味使用单芯片集成所有模块已经不现实,无论规格性能还是经济性都不允许,必须开辟一条新路。

AMD Zen架构从一开始就没有盲目做超级大核心,而是化整为零,四个核心组成一个CCX基础模块,两个CCX基础模块组成一颗芯片,多颗芯片再统一封装,这样可以根据需要定制整个处理器的不同规模,想做多少做多少,同时在成本、良品率上也可以达到非常理想的水平。

二代霄龙更进一步,不但可以最多八颗芯片合体达成64核心128线程的超大规模,还特意将I/O输入输出部分独立成另一颗芯片并采用更成熟的14nm工艺,再通过高带宽低延迟的Infinity Fabric总线将它们串联起来,统一调度,不同模块构成了一个有机的整体。

这样设计的好处显而易见,一方面能将产品规格轻松做大做强,也可以根据需求随意调整,满足不同层次需求,另一方面也可有效简化产品设计难度、提高生产良品率、降低各项成本,保证产品快速顺利面世。

那么,二代霄龙采用更先进的设计理念、更高级的配置规格之后,性能到底怎么样呢?AMD也已经多次进行了公开演示,每一次都能惊艳全场。

去年11月的技术大会期间,单路的Rome霄龙单挑双路的Intel旗舰至强铂金8180M:7nm工艺对14nm工艺,64核心128线程对56核心112线程、最大4TB内存对最大3TB内存、128条PCIe 4.0总线对96条PCIe 3.0总线。

规格秒杀的同时,在行业标准性能测试C-Ray项目中,一颗Rome二代霄龙用时28.1秒完成,而两颗至强8180M却花了30.2秒,一打二也直接秒杀!

台北电脑展期间,二代霄龙再次秀出神技。苏姿丰博士透露,二代霄龙相比一代的性能提升幅度在不同应用中可高达2-4倍。

性能PK中,AMD Rome二代霄龙摆出了两颗最顶级的64核心128线程,Intel一方则是刚发布的Cascade Lake二代可扩展至强,工艺架构完全没变,顶级型号至强铂金8280依然是28核心56线程,只不过频率比上代提升了200MHz。

结果, 二代霄龙取得了19.88ns/天的成绩,二代可扩展至强则只有9.71ns/天,AMD领先了整整一倍之多。

事实上,真正证明二代霄龙强大的,并不仅仅是规格参数多么耀眼、性能演示多么诱人,更关键的是行业的态度。二代霄龙还没有正式发布,甚至还在早期客户验证阶段的时候,就赢得了前所未有的欢迎。

尤其是在堪称高性能计算“皇冠”的超级计算机领域,二代霄龙更是实现 历史 性跨越,不仅实现领的突破,更是一步跨入世界顶尖行列。

德国早早就官宣新一代超算Hawk将配备多达一万颗6464核心128线程顶配的二代霄龙处理器,合计64万核心128万线程,峰值计算性能可达24.06PFlops,也就是每秒2.4亿亿次浮点计算。

Cray的首个百亿亿次(ExaScale)新一代超算平台Shasta也随即加入对霄龙的支持。

美国能源部更是对霄龙宠爱有加,接连基于Cray新平台打造了两台基于定制版霄龙的新超算Perlmutter、Frontier,尤其是后者同时加入AMD Radeon Instinct计算卡,预计浮点性能可达1.5EFlops(150亿亿次),投用后不是世界第一也是全球顶级水准。

照这样下去,未来的超算TOP500榜单将会发生翻天覆地的变化,霄龙必将成为一股不可忽视的中坚力量。

一代霄龙“初来乍到”就让全球几乎所有企业客户倾倒,国内的BAT三巨头均已第一时间引入,非常难啃的亚马逊都已经大规模部署,一度不屑的戴尔也最终折服要全面采纳。二代霄龙的前景更是可以百分之百肯定地说无限光明,尤其是在超算上的史诗性跨越,更加的不可限量。

前文我们曾经说过,AMD霄龙产品线从一开始就制定了一个稳健的路线图,并一步一个脚印地完美推进实现,时间误差不超过一个季度,同时也参考了竞争对手Intel的进度。

值得玩味的是, AMD 7nm Rome二代霄龙最初的对手并不是新发布的Cascade Lake二代可扩展至强,而是全新一代的10nm工艺Ice Lake,与之相比预计也会有更好的效能,但没想到Intel 10nm工艺一再跳票和缩水,今年的首批产品只能用于低功耗的轻薄本,桌面平台都登不上。

根据官方披露的路线图,Intel明年的新一代至强代号Cooper Lake,仍旧是14nm工艺和老架构,不会发生本质性的变化,二代霄龙最初预设的对手10nm Ice Lake至少要等到后年。

而在AMD这面,明年我们就将看到基于7nm+新工艺、Zen 3新架构的第三代霄龙,代号“Milan”(米兰),正在按计划推进;然后马不停蹄地就是Zen 4新架构的第四代,代号也早早地公布为“Genoa”(热那亚),正在全力设计之中,领先优势将越拉越大……

可以说,天时地利之下,AMD霄龙迎来了 历史 上的最佳机遇,而这样让人眼花缭乱、毫不停歇的一套组合拳持续打下去,还有什么可说的?AMD霄龙开场就提出的重返巅峰的目标,相信只是个时间问题了。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/727656.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-10
下一篇2023-08-10

发表评论

登录后才能评论

评论列表(0条)

    保存