X86正相反,Intel不允许其他企业插手(除了amd,但amd 对做超低功耗x86不热心),但是软件方面却有完整的生态圈。
虽然现在软件多数能跨平台,但是与arm 良好匹配还需要时间证明。所以arm 的关键优势是可以摆脱intel 的垄断,可以实现芯片级的硬件定制。arm 的功耗还有性能功耗比优势什么的完全是唬人的。intel 完全做得到相当的功耗或者性能功耗比,而且它确实正在这个方向发力
去年开始,市场上开始看见厂商投入 ARM 架构伺服器的开发, Computex 也有几家厂商展出原型机与参考设计;事隔一年,整个产业又有明显的动作,包括被百度导入大规模的云端储存应用, HP 宣布 Project Moonshot ,以及 AMD 宣布将会把 ARM 的授权应用在伺服器领域、 NVIDIA 亦针对几年前的 Project Denvor 作更进一步的宣布。
从过去仅被应用在 MCU 、手机等的 ARM 架构,在近期急起直追、效能与架构不断翻新,终于也被承认拥有运算级的效能,并且独特的商业形式,让客户得以应用在不同领域;在这个 ARM 架构开始被应用在过去视为 x86 天下的领域的萌芽期,笔者想分享约一年来所观测以及与厂商对谈的过程所了解到的 ARM 伺服器发展的现况。
跳转继续
对于这些投入 ARM 架构伺服器的厂商而言, ARM 架构到底是什么呢?一言以蔽之就是摆脱 x86 受限于少数厂商的筹码;毕竟在伺服器的世界, x86 架构多年以来是唯一的选择,加上 CPU 万能论在数年前也是业界信奉的准则,故最重要的核心架构就由少数厂商把持,其它厂商最多只能作为红花旁的绿叶陪衬。
不过随着某些不愿一辈子当配角的厂商,试图证实纯 CPU 运算不是唯一且效率最好的选择,以 GPU 为主的异质运算的兴起,开始改变市场对于运算的既有概念。 GPU 运算虽无法脱离 CPU ,但借由将特定的运算内容、尤其是针对大规模运算如数据分析、金融计算等,拥有较多运算单元的 GPU 就能大幅提升运算能力。
从 NVIDIA 去年公布 Kepler 架构能够减少 CPU 与 GPU 的繁复沟通,以及今年在 GTC 宣布明年将推出搭载统一虚拟记忆体的 Maxell GPU 规划,加上 AMD 宣布的 hUMA 统一存取记忆体技术,都能看出 GPU 厂商在简化 CPU 与 GPU 的沟通模式,提升异质运算的效率。
另一方面,也由于大数据与云端储存,除了高效能运算之外,数据管理也变得日益重要;不同于运算型伺服器,储存管理重视的是针对内容资料的管理与整合,相较传统高效能运算不需要那么高的效能,另外能源议题近期也相当受到重视,厂商开始思考杀鸡是否需要用到牛刀。
这时,容易客制化的 ARM 架构就浮出台面,陆续有开发者以及晶片商宣布将 ARM 架构投入储存相关伺服器的应用,目前最显著的成果就是 Marvell 成功打入大陆百度的云储存服务,并且从目前状况来看,还有不少不愿浮出台面的厂商与零星的应用案例,今年 Calxeda 也展出三家台湾厂商的参考设计,表示 ARM 架构用于储存已经开始有市场需求。
HP 的 Project Moonshot 的推出,对于 ARM 架构有相当大的鼓舞作用,此伺服器产品线不是为通用高效能运算规划,重视的是低功耗,并且重点在于最佳的功耗效能比的专用设计,故采取的思维是让大量而省电的模组在容易扩充且可共用电源、散热的机箱内,故坚守 x86 架构已经不是重点,重点在于针对特定的应用榨干所有的效能并且能发挥到极致。
从 HP 的一些实验室计画当中, ARM 架构所扮演的不仅只是针对储存的应用,更以异质运算的方式打算投入如地震分析、石油探勘等应用,显示虽然目前的应用着重在储存,但这些试探性的应用证实 ARM 架构在伺服器领域还有很多的可能性。
参考阅读内容:HP 谈 Project Moonshot :对处理器架构采取中立,专为特定应用量身打造最佳方案
谈到下一步,每一家的想法也不一,如 Marvell 、 Calxeda 暂时仍以储存应用为主,运算方面根据笔者在 Computex 与他们闲聊之下则采取保留的态度;德州仪器 TI 以及 NVIDIA 相较下应该会朝针对特殊领域的高效能运算之路,但同样想走高效能之路,TI 与 NVIDIA 的想法却仍不同。
先从 Marvell 与 Calxeda 谈起,它们一致认为 ARM 架构正式走入 ARMv8 ,也就是 64 位元指令集之前, ARM 架构谈高效能运算都还言之过早;但它们也一致认为 ARM 架构并非没有机会走向高效能运算,不过关键在于业界、尤其是软体相关的产业是否愿意支持。
Marvell 这家公司的最大资产,就是拥有储存管理以及网路管里的技术,故它们目前认为,透过客制化的核心设计与它们现有的网路、储存技术结合,就能提供合乎成本与效能,并相较 x86 架构拥有更低功耗的储存伺服器。
Marvell 在 ARM 伺服器领域卖的不仅是核心,更是从核心、储存到网路的整套的解决方案,以从 PC 架构获得的多样技术转战到 ARM 平台,并且针对 ARM 平台的特性提供合乎成本、效能的规划,并且又能提供各关键组件的驱动程式节省软硬体整合的困扰,这也是 Marvell 认为与其他竞争对手最大的差异。
参考阅读:Computex 2013 : Marvell 以储存技术为底,提供不同方案合适的架构
Calxeda 在架构选择方面不打算求快,会按照 ARM 的规划持续研发,理由是目前 ARM 架构的伺服器仍处于萌芽期,相较于 x86 , ARM 架构对开发者的诱因是成本相对低廉,故抢先导入新架构并采用最新制程并非最好的选择。
Calxeda 也从去年展示的伺服器中了解客户需要更弹性化、更低成本的设计,故今年的展示的公板模组也降低上面的核心数量,并且将原本置于机箱上的四路高速网路介面取消,改为可于伺服器的模组上选择提供两路高速网路介面的方案,最多一个机箱可拥有两张搭载高速网路介面的模组,客户更能依照建制成本与网路速度需求调整架构。
参考阅读: Computex 2013 : Calxeda 谈 ARM 伺服器,合适的成本与正确的应用才是王道
至于 TI 的 ARM 伺服器架构则是将先前应用于电信基地台用于基频管理的产品线,根据 TI 的说法,在大量数学运算领域,相较于采用 CPU 运算, DSP 拥有相对更好的效率,而 TI 原本用于管理大量且复杂的电信基基地台讯号的 Keystone 处理器内就蕴含 TI 的高效能 DSP ,而在近日能源议题下,亦有厂商向 TI 询问是否能将该产品线用于伺服器运算的领域。
TI 也在日前转型决定将 Keystone 产品线投入伺服器应用,这不光只是由于 TI 的 DSP 效能够高,也是由于 ARM 架构的效能已经能合乎运算级架构的需求,加上针对特定领域的运算可借由与 DSP 的异质运算提供不亚于传统 x86 架构的效能。
参考阅读: 以强势 DSP 为技术优势,德州仪器嵌入处理器转战伺服器
NVIDIA 则是在数年前由执行长黄仁勋提出 Project Denvor 后震撼业界,虽然该计画一直至最近才逐渐掀开其神秘面纱,不过 NVIDIA 的想法就是透过 ARM 核心与其 GeForce 图形技术的结合,提供具备高效能运算能力的 SoC ,借此摆脱在运算领域需要与它厂 CPU 组合的现况。
自去年宣布 Kepler 架构 GPU 的特性后,可以看出来在架构特性一直试图减少与 CPU 的反复沟通这点,就能看出 NVIDIA 设法让 GPU 架构减少与 CPU 的繁复沟通以提升运算速度;今年的 NVIDIA GTC 更进一步宣示明年与后年的重要计画,明年的 Logan 加入正式导入具有 CUDA 核心的 Kepler 架构,至于后年的 Parker 更是重头戏,因为 Denvor 核心将会正式导入。
可以说 Parker 才是整个 Project Denvor 的完成型,借由 64 位元架构以及运算级的 GPU 核心,完成单晶片运算级架构,透过大量的 Parker 群集,以运算效能方面应该不容小觑;相较于目前已经有许多成功案例且被列为大专院校教学内容的 CUDA 平行运算,届时的问题恐怕还是 64 位元架构的软体支援情况。
参考阅读: 一个 NVIDIA 布了许久的局, Tegra Parker 可能改写 HPC 定义
总和几家导入 ARM 架构用于伺服器厂商的现况, ARM 架构用于伺服器到底是主角还是配角?这是个很诡谲的状况,因为在目前的应用案例中, ARM 架构扮演的多半不是运算的主体,而是为了运作系统或是作为管理中枢的单元。
到了 ARMv8 64 位元架构会否改善?笔者个人认为 ARMv8 架构推出后的第一年恐怕还无法发挥其价值,因为软体开发不会那么快成熟,在软体开发环境不成熟下, ARMv8 又比目前的 ARMv7 的架构更为复杂,若以非先进制程生产,功耗与发热可能会是问题,但若以先进制程生产,成本与价格又可能偏高。
毕竟目前的运算世界仍是以 x86 为基础建立起来的, ARM 虽然提供一个新的选择,但毕竟目前还在萌芽阶段,即便证实可用于高效能运算,软体环境、成本若无法比起 x86 有优势,想必厂商也不会有导入的意愿,这一两年内的发展情形,将是决定 ARM 架构能否在高效能运算崭露头角的关键?
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)