AMD Ryzen锐龙这两年让微处理器乃至是整个PC领域焕发了新的勃勃生机,喜闻乐见的真刀真枪激烈竞争重现江湖,是整个行业以及所有消费者的福音。
而在一般用户很少关注的服务器和数据中心领域,AMD凭借全新的EPYC霄龙,同样刮起了一阵风暴,而且意义更加重大,而且更猛料的风暴也正在袭来。
2017年中,AMD携霄龙正式归来,重新杀回了数据中心领域,代号Naples(那不勒斯)的第一代产品就有14nm工艺、最多32核心64线程、八通道DDR4 2TB内存、128条PCIe通道、独立安全子系统、SoC单芯片集成设计、多代兼容接口等强大的规格,以及极具竞争性的定价。
浴火重生的霄龙吸引了全世界的关注和赞誉,更是赢得了整个服务器行业的热烈欢迎,相关产品和方案越来越丰富,硬生生杀开一条血路,短短一年多的时间市场份额就恢复到了5%。
当然,这一切只是一个开始,Zen架构诞生之初,AMD就毫不掩饰地公开了未来多年路线图。
AMD高级副总裁、数据中心与嵌入式解决方案事业部总经理Forrest Norrod在接受媒体采访时表示,AMD制定了一个三步走的战略,分别是2017年第一代的Naples(Zen架构),2019年的二代Rome(Zen 2架构),以及2020年的三代Milan(Zen3架构),分别实现进入、追赶和超越的目标。
Forrest Norrod表示: “Naples是很好的一个开始,它让我们重新进入到数据中心市场,目前来看我们很好地实现了这一目标。Rome则是这个计划的重要部分,我们希望它能继续保持性能领先,并进一步缩短跟英特尔的差距。而Milan会在性能方面全面超越竞争对手。”
2018年11月,AMD又首次公开了代号Rome(罗马)的第二代霄龙处理器的诸多细节,7nm全新工艺、Zen 2全新架构、最多64核心128线程、128条PCIe 4.0总线、单路最大4TB DDR4八通道内存的规格简直让人垂涎欲滴,隔壁的Cascade Lake的28核心56线程顿时黯然失色。
凭借新工艺新架构,二代霄龙号称综合性能比前代直接翻一番,浮点性能更是翻了两番,CPU 历史 上还从未有过如此激进的提升。
2019年6月的台北国际电脑展上,AMD CEO苏姿丰博士特别受邀发飙展会主题演讲,期间就官宣第二代霄龙服务器处理器系列预计将于2019年第三季度推出,而现在第三季度已经到来,二代霄龙也已经到了大门口。
二代霄龙的chiplet小芯片设计理念更是顺应时代。 在摩尔定律渐渐失效的今天,一味使用单芯片集成所有模块已经不现实,无论规格性能还是经济性都不允许,必须开辟一条新路。
AMD Zen架构从一开始就没有盲目做超级大核心,而是化整为零,四个核心组成一个CCX基础模块,两个CCX基础模块组成一颗芯片,多颗芯片再统一封装,这样可以根据需要定制整个处理器的不同规模,想做多少做多少,同时在成本、良品率上也可以达到非常理想的水平。
二代霄龙更进一步,不但可以最多八颗芯片合体达成64核心128线程的超大规模,还特意将I/O输入输出部分独立成另一颗芯片并采用更成熟的14nm工艺,再通过高带宽低延迟的Infinity Fabric总线将它们串联起来,统一调度,不同模块构成了一个有机的整体。
这样设计的好处显而易见,一方面能将产品规格轻松做大做强,也可以根据需求随意调整,满足不同层次需求,另一方面也可有效简化产品设计难度、提高生产良品率、降低各项成本,保证产品快速顺利面世。
那么,二代霄龙采用更先进的设计理念、更高级的配置规格之后,性能到底怎么样呢?AMD也已经多次进行了公开演示,每一次都能惊艳全场。
去年11月的技术大会期间,单路的Rome霄龙单挑双路的Intel旗舰至强铂金8180M:7nm工艺对14nm工艺,64核心128线程对56核心112线程、最大4TB内存对最大3TB内存、128条PCIe 4.0总线对96条PCIe 3.0总线。
规格秒杀的同时,在行业标准性能测试C-Ray项目中,一颗Rome二代霄龙用时28.1秒完成,而两颗至强8180M却花了30.2秒,一打二也直接秒杀!
台北电脑展期间,二代霄龙再次秀出神技。苏姿丰博士透露,二代霄龙相比一代的性能提升幅度在不同应用中可高达2-4倍。
性能PK中,AMD Rome二代霄龙摆出了两颗最顶级的64核心128线程,Intel一方则是刚发布的Cascade Lake二代可扩展至强,工艺架构完全没变,顶级型号至强铂金8280依然是28核心56线程,只不过频率比上代提升了200MHz。
结果, 二代霄龙取得了19.88ns/天的成绩,二代可扩展至强则只有9.71ns/天,AMD领先了整整一倍之多。
事实上,真正证明二代霄龙强大的,并不仅仅是规格参数多么耀眼、性能演示多么诱人,更关键的是行业的态度。二代霄龙还没有正式发布,甚至还在早期客户验证阶段的时候,就赢得了前所未有的欢迎。
尤其是在堪称高性能计算“皇冠”的超级计算机领域,二代霄龙更是实现 历史 性跨越,不仅实现领的突破,更是一步跨入世界顶尖行列。
德国早早就官宣新一代超算Hawk将配备多达一万颗6464核心128线程顶配的二代霄龙处理器,合计64万核心128万线程,峰值计算性能可达24.06PFlops,也就是每秒2.4亿亿次浮点计算。
Cray的首个百亿亿次(ExaScale)新一代超算平台Shasta也随即加入对霄龙的支持。
美国能源部更是对霄龙宠爱有加,接连基于Cray新平台打造了两台基于定制版霄龙的新超算Perlmutter、Frontier,尤其是后者同时加入AMD Radeon Instinct计算卡,预计浮点性能可达1.5EFlops(150亿亿次),投用后不是世界第一也是全球顶级水准。
照这样下去,未来的超算TOP500榜单将会发生翻天覆地的变化,霄龙必将成为一股不可忽视的中坚力量。
一代霄龙“初来乍到”就让全球几乎所有企业客户倾倒,国内的BAT三巨头均已第一时间引入,非常难啃的亚马逊都已经大规模部署,一度不屑的戴尔也最终折服要全面采纳。二代霄龙的前景更是可以百分之百肯定地说无限光明,尤其是在超算上的史诗性跨越,更加的不可限量。
前文我们曾经说过,AMD霄龙产品线从一开始就制定了一个稳健的路线图,并一步一个脚印地完美推进实现,时间误差不超过一个季度,同时也参考了竞争对手Intel的进度。
值得玩味的是, AMD 7nm Rome二代霄龙最初的对手并不是新发布的Cascade Lake二代可扩展至强,而是全新一代的10nm工艺Ice Lake,与之相比预计也会有更好的效能,但没想到Intel 10nm工艺一再跳票和缩水,今年的首批产品只能用于低功耗的轻薄本,桌面平台都登不上。
根据官方披露的路线图,Intel明年的新一代至强代号Cooper Lake,仍旧是14nm工艺和老架构,不会发生本质性的变化,二代霄龙最初预设的对手10nm Ice Lake至少要等到后年。
而在AMD这面,明年我们就将看到基于7nm+新工艺、Zen 3新架构的第三代霄龙,代号“Milan”(米兰),正在按计划推进;然后马不停蹄地就是Zen 4新架构的第四代,代号也早早地公布为“Genoa”(热那亚),正在全力设计之中,领先优势将越拉越大……
可以说,天时地利之下,AMD霄龙迎来了 历史 上的最佳机遇,而这样让人眼花缭乱、毫不停歇的一套组合拳持续打下去,还有什么可说的?AMD霄龙开场就提出的重返巅峰的目标,相信只是个时间问题了。
IBM服务器、Dell服务器、HP服务器、浪潮服务器、华为服务器。
服务器和普通主机一样,也是由主板、内存、CPU、磁盘、网卡、显卡、电源、主机箱等硬件设备组成。
塔式服务器、机架式服务器、刀片服务器。
RAID是Redundant Arrays of Independent Drives(独立冗余磁盘阵列)的简称,RAID分为很多级别,常用级别有RAID0、RAID1、RAID5、RAID6、RAID10、RAID01。
RAID 相关可参考我的另一篇: https://www.jianshu.com/p/4e4c17adaa36
Dell入门级塔式服务器PowerEdge T340,如图-1所示,该服务器的目标应用是文件/打印,协作/共享,邮件/讯息,备份/恢复,视频监控等。
产品配置如下:
Dell高性能塔式服务器PowerEdge T640,如图-2所示。
产品配置如下:
Dell入门级单路机架式服务器PowerEdge R330(1U=44.45mm=4.45cm),如图-3所示。
产品配置如下:
Dell机架式服务器PowerEdge R740(2u=88.9mm=8.89cm),如图-4所示。
产品配置如下:
IBM机架式服务器X3250M6(1U),如图-5所示。
产品配置如下:
HPE ProLiant DL380 Gen10 服务器(2U),如图-6所示。
产品配置如下:
英特尔:酷睿八代(i3,i5,i7,i9),酷睿九代(i3,i5,i7,i9),酷睿十代
至强E(标准版),至强W(高功耗版)
奔腾处理器
AMD: 家用版(锐龙、速龙)
服务器版本(皓龙、霄龙)
常见品牌:金士顿、三星
家用普通内存不具有数据校验功能
服务器配置带ECC数据校验功能的内存条
规格:DDR1、DDR2、DDR3、DDR4、DDR5
常见品牌:三星、英特尔、希捷、西部数据
家用磁盘接口:SATA
服务器磁盘接口:SAS
SSD固态硬盘
大小:2.5寸、3.5寸
Dell: iDRAC
HP: iLO
IBM: Tivoli/ˈtɪvəli/
1)RAID5
服务器开机后根据提示快速按Ctrl+R组合键即可进入RAID配置界面,如图-7所示。
进入RAID配置界面可以看到所有未配置的磁盘列表,主菜单包含:VD Mgmt、PD Mgmt、Ctrl Mgmt、Properties,如图-8所示。
Ctrl+N进入下一页菜单,Ctrl+P进入上一页菜单,通过F2可以进入配置菜单,如图-9所示。
正式配置RAID之前可以使用Clear Config清空所有配置,然后选择Create New VD创建新的RADID磁盘阵列,如图-10所示。
在RAID Level中选择RAID级别,如RAID5(最少需要三块磁盘),并在右侧Physical Disks中选择使用哪些物理磁盘组合RAID,如图-11所示。
点击OK确定后,可以在主菜单中看到刚刚创建的磁盘阵列,按F2选择Properties可以配置该磁盘阵列的高级属性,如图-12所示。
点击Advanced高级,如图-13所示。
在高级属性中开启磁盘缓存,默认未unchanged,需要设置为enable,并可以设置缓存策略:Write Through直写和Write Back回写,write through模式时数据同时被写入缓存和磁盘,安全,但是写入速度慢,write back模式时数据先写入缓存,再写入磁盘,写入速度快,但数据写入缓存时突发断电会导致数据丢失。配置菜单如图-14所示。
创建完RADID后还需要初始化磁盘,菜单如图-15所示。
2)RAID故障恢复
将损坏的磁盘拔掉,替换一块新的磁盘即可,注意需要将新磁盘插入损坏的磁盘相同接口。磁盘大小、品牌尽可能一致。恢复数据时界面会提示Rebuild,效果如图-16所示。
3)配置Hot Spare磁盘
热备磁盘是提前准备一块备用的磁盘(当前并不使用),当RAID磁盘阵列出现损坏后,系统自动使用该热备磁盘,替代损坏的磁盘,从而不需要人工插拔磁盘即可自动修复。
创建新的RAID磁盘阵列时,不要使用完所有磁盘,留一块磁盘做热备磁盘,点击Advanced高级选项即可配置热备磁盘,如图-17所示。
勾选Configure Hot Spare配置热备磁盘,如图-18所示。
在弹出的对话框中勾选需要的热备磁盘即可完成配置,如图-19所示。
4)其他级别的磁盘阵列
其他级别的磁盘阵列配置方式类似,可以根据自己的需要进行配置如RAID10,RAID6等,但是都需要磁盘阵列卡支持才可以配置。
Dell服务器iDRAC远程管理配置
1)配置端口重定向
iDRAC(Integrated Dell Remote Access Controller),是戴尔服务器集成的远程控制卡。
iDRAC需要授权使用,有授权的情况下可以直接通过浏览器访问:http://服务器IP,远程管理服务器,没有授权的情况下可以通过端口重定向将服务器上的显示内容重定向到远程管理端的电脑上(一般是用自己的笔记本远程服务器),这种方式不需要授权。
开启服务器后根据提示快速按F2键进入BIOS界面,如图-20所示。
进入BIOS Settings后,选择Serial Communication菜单,如图-21所示。
将控制台重定向到com2,设置Serial Device=com1,Serial Device=com2,效果如图-22所示。
2)初始化清空iDRAC设置
进入iDRAC Setting界面选择Rest iDRAC configuration to defaults,如图-23所示。
3)配置iDRAC网络
进入iDRAC Setting界面选择network,如图-24所示。
选择网卡并配置IP地址,如图-25和图-26所示,网段需要根据实际情况自行配置。
开启IPMI智能平台管理接口(配置后可以通过命令行管理服务器),客户端安装ipmitool软件包,如图-27所示。
4)配置远程管理账户
进入iDRAC Setting界面选择User Configuration,如图-28所示。
配置账户名称root,并设置密码,如图-29所示。
5)远程管理端主机配置,安装ipmitool软件包
常用命令操作列表如下。
快点更换故障硬盘吧!这是服务器,不是台式机,服务器的设计原则是容错、易于恢复和数据安全,并不是设计成金刚不坏,大家不要老想着找窍门和秘籍去逃避故障配件的更换。 对于可能威胁到数据安全的部件,比如阵列磁盘,系统反而会更快的更主动的抛弃故障配件,闪灯报警,提醒管理员尽快更换。服务器硬盘被设计成有一点成长坏道就自动标记,坏道多了就报错建议更换,硬盘报错时候就应该更换掉,大部分报错硬盘重新插拔或者换位插拔都会触发重建使用,貌似好了,其实如果硬盘真的没有故障,系统又怎么会报错?可能有些故障是偶尔出现或者不明显(请问,服务器的运行又怎么能容许偶尔的故障?!),比如硬盘的坏道数量处于临界值状态,重新插拔就会消除报警黄灯,但坏道不会消失必定还会增长,这会导致磁盘系统要花大量的时间处理校验和容错,如果过程中遭遇系统断电或者阵列内存错误,用户的数据可靠性将不能被保证!
磁盘阵列的冗余设计目的是:容许但个硬盘丢失状态下的数据保留。但它并没有保证数据的有效、真实和不被改变(数据有效性的威胁来自病毒、恶意操作、误操作、数据系统故障等等)。大量的案例显示,不去理会和随意处理磁盘系统报错的用户,短期内都可能会面临数据危机的困扰;而数据危机往往都潜伏在似是而非的磁盘系统小问题中,原因很简单:1〉如果危险来的明显,管理员会尽早做好备份;2〉如果是对威胁比较在意的用户,系统搭建时就部署更安全的系统。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)