发力HPC工作负载,亚马逊云科技推出HPC专用实例Amazon EC2 Hpc6a

发力HPC工作负载,亚马逊云科技推出HPC专用实例Amazon EC2 Hpc6a,第1张

北京——2022年1月18日 ,近日,亚马逊云 科技 宣布推出专为紧耦合高性能计算(HPC)工作负载构建的全新实例Amazon Elastic Compute Cloud (Amazon EC2) Hpc6a。Amazon EC2 Hpc6a实例搭载了第三代AMD EPYC处理器,与计算优化型Amazon EC2实例相比,用于HPC工作负载的性价比提升高达65%,进一步扩展了亚马逊云 科技 的HPC计算选项组合。客户通过Hpc6a实例可以更经济、高效地在亚马逊云 科技 中扩展HPC集群,运行计算密集型工作负载,如基因组学、计算流体动力学、天气预报、分子动力学、计算化学、金融风险建模、计算机辅助工程和地震成像。客户可以按照即用即付的低成本模式,按需使用Hpc6a实例,而无需预付费用。

众多不同行业机构都使用HPC解决他们最复杂的学术、科学和业务问题。然而,有效使用HPC的成本很高,为了处理大量数据,HPC集群需要具备强大的计算力、高性能的内存和存储,以及低延迟的网络。一些机构通过在本地构建基础设施来运行HPC工作负载,这需要高昂的前期投资,包括冗长的采购周期、监控软硬件更新等持续的管理开销,而当基础设施变得过时且必须升级时,又必然会面临灵活性受限的挑战。许多行业客户选择在云中运行其HPC工作负载,充分利用云提供的安全性、可扩展性和弹性。众多工程师、研究人员和科学家通过亚马逊云 科技 运行其最大型、复杂的 HPC 工作负载,并选择使用具有增强网络的Amazon EC2实例(例如C5n、R5n、M5n和C6gn)来扩展高性能紧耦合HPC工作负载,这些工作负载需要实例间高水平通信,处理数千个相互依赖的任务。虽然这些实例的性能能够满足大多数 HPC 用例,但随着需要解决的问题越来越困难,工作负载不断扩展,规模可能增长至需要亚马逊云 科技 中的数万台服务器处理,客户希望在运行HPC工作负载时最大限度地提高性价比。

新的Hpc6a实例专为在云中大规模运行 HPC 工作负载提供最佳性价比。HPC6a实例将HPC工作负载性价比提升高达65%,可在一系列集群规模(多达数万个内核)中执行复杂计算。默认状态下,Hpc6a实例搭载了网络接口Elastic Fabric Adapter (EFA)。EFA网络具有低延迟、低抖动和高达100 Gbps的网络带宽,可帮助客户提高运营效率,对于实例间有大量通信的工作负载可以快速交付计算结果。 Hpc6a 实例搭载了主频可高达3.6 GHz频率的第三代 AMD EPYC 处理器,并提供 384 GB 内存。使用 Hpc6a 实例,客户可以更经济高效地通过HPC解决他们最大、最困难的学术、科学和业务问题,并以高性价比获得亚马逊云 科技 服务的诸多优势。

亚马逊云 科技 Amazon EC2副总裁David Brown 表示:“通过为几乎所有类型的工作负载持续创新,并推出新的专门构建的Amazon EC2实例,我们为客户一些最关键的业务应用提供了超高的性价比。虽然高性能计算帮助解决了科学、工程和商业等领域一些最困难的问题,但对于许多机构而言,有效运行 HPC 工作负载仍然非常昂贵。Hpc6a实例专为HPC工作负载构建,可以帮助客户在几乎任何规模的 HPC 集群中将性价比提升高达65%,消除客户对成本的顾虑,专注于解决核心业务问题。”

AMD服务器业务高级副总裁兼总经理Dan McNamara 表示“我们很高兴能够继续与亚马逊云 科技 合作,为他们的客户提供用于高性能计算工作负载的全新、强大的实例。AMD EPYC处理器正帮助各种规模的客户解决一些最困难、复杂的问题。从大学到企业再到大型研究机构,由第三代AMD EPYC处理器支持的HPC6a实例为更多全球客户带来强大的HPC性能,且具有云的可扩展性。”

客户可通过Amazon ParallelCluster(一种开源集群管理工具)使用Hpc6a实例,可与其他实例一起预置Hpc6a实例,并在相同HPC集群中灵活地为不同的工作负载运行不同的优化实例。Hpc6a实例基于Amazon Nitro 系统,Amazon Nitro将许多传统虚拟化功能卸载到专用硬件和软件,而具有更高性能、高可用性和更高的安全性,同时减少虚拟化开销。Hpc6a 实例可作为按需实例或预留实例购买,也可通过 Savings Plans 购买。 Hpc6a 实例现已在美国东部(俄亥俄)和 Amazon GovCloud(美国西部)区域推出,其他区域也将很快推出。

Maxar是一家地理空间智慧公司,与诸多创新企业和50多个政府合作监测全球变化、提供宽频通信,以及基于空间架构和地球智能的能力提供先进的空间操作。“Amazon EC2 Hpc6实例的推出是亚马逊云 科技 又一次重大的发布,让Maxar能够继续满足并超越客户对大型计算工作流的要求,无论是加速数值天气预报工作负载的研究和运营,还是使用Maxar Precision3D 产品套件创建全球最优秀、先进和精确的数字孪生模型。” Maxar Technologies高级副总裁兼首席产品官Dan Nord 表示,“Hpc6a的AMD EPYC(Milan)处理器与EFA网络功能相结合,与其他可选项相比,帮助我们将性能提升了60%,同时更具成本效益。这让Maxar能够在自己构建的一套亚马逊云 科技 HPC集群配置中进行战略性选择,最大限度的满足客户需求,同时最大限度地提高灵活性和韧性。”

DTN的全球气象站网络提供超本地、准确和实时的气象情报,为企业提供可操作的见解。 DTN首席技术官Lars Ewe 表示:“与亚马逊云 科技 合作,让我们能够更好地服务客户,为他们提供高分辨率天气预报系统,并为分析引擎提供数据。我们很高兴看到 Hpc6a 实例的高性价比,希望它将成为我们未来HPC工作负载的首选Amazon EC2 实例。”

TotalCAE在计算机辅助工程(CAE)高性能计算方面拥有超过 20 年的经验。 TotalCAE 通过管理客户的HPC工程环境和工程应用程序,来帮助客户消除IT难题,让客户专注于工程,而不是IT。 “TotalCAE平台让CAE部门可以轻松地获得亚马逊云 科技 的敏捷性和灵活性,只需单击几下即可用于数百个工程应用程序,例如Ansys Fluent、Siemens Simcenter STAR-CCM+和Dassault Systèmes Abaqus。” TotalCAE总裁 Rod Mach 表示,“作为亚马逊云 科技 HPC能力合作伙伴网络成员(HPC Competency Partner),我们帮助客户在云中运行其CAE 工作负载。通过HPC6a 实例,我们以更低的成本将计算流体动力学工作负载的性能提升了 30%,让 TotalCAE 能够为客户提供行业领先的性价比和云强大的可扩展性。”

全球最大的数据库公司甲骨文最近在“云计算之都”西雅图租赁了16万平方英尺的办公区,这距离它的总部加州硅谷约为上千公里,却与它最新的竞争对手亚马逊咫尺相隔。

市值2045亿美元的甲骨文,至今仍是世界上最赚钱的软件公司之一。创始人拉里·埃里森是一个强势、侵略性不加掩饰的人物。在2013年前,他是硅谷创业的典范——白手起家,巧妙抓住时机,不择手段横向扩展,销售额连年翻番,他本人也成为硅谷首富。

在这之后,埃里森却开始以浮夸的言辞和对商业竞争对手的讽刺而著称。今年3月,他公开表示,亚马逊和微软都是失败的竞争对手,至少在云计算的技术层面。让人难为情的是,甲骨文与他们之间存在着数倍的差距。

四年前,甲骨文超过了IBM,成为继微软后全球第二大软件公司。亚马逊则从一众云服务商中逐步脱颖而出。研究公司Synergy当时发布报告称,一个季度内亚马逊收入的增幅大幅超过了全部市场的增幅,并预计下个季度亚马逊获得的收入将比所有竞争对手还多15%。

原本处于平行线上的两家公司,很快便短兵相接。原因无他,以亚马逊为代表的新兴云计算公司在不断降低价格的同时,持续侵蚀甲骨文的生存空间。

面对变化,两家软件为主的公司选择了不同的路径。微软借助产品优势,迅速、正面切入云计算市场,而甲骨文花了几年时间抵触、犹豫,后而激进,导致了今天两家公司的不同命运。

2013年,微软市值一直徘徊在2000亿美元上下,但到了2017年,微软市值已经逼近6400亿美元。相形之下,甲骨文的脚步显然停滞了。

2014年,拉里·埃里森终于向“云”低头了。埃里森突然宣布辞去CEO一职,转任CTO,投入更多的精力在产品研发和战略制定。他通过大肆收购补全自由业务的不足,缩减成为完整云服务商的时间。随后进行集成整合,产品标准化和自动化,最终向客户提供包括IaaS、PaaS和SaaS三个层次完整的云计算服务。

从财务状况来看,拉里·埃里森的策略似乎行之有效。2018财年一季度,营收同比增长6.9%,这是2011年以来单季度最高增长率。与此同时,云计算业务占总营收的百分比从2015财年的5.5%,上升至16%。

今年10月,在全球大会上,甲骨文又一次放低身段,开始大谈性价比,这似乎是一个好的征兆。甲骨文一路被亚马逊倒逼,一步一步走上云端,并试图颠覆现有云商业模式。然而,云商业尚在前半程,它显然还有机会。

被亚马逊倒逼的四年

浮现危机之时,恰是甲骨文收入到达顶峰那一刻。

2013年10月,甲骨文软件业务过去一年的总收入已经超过同期的IBM,成为全球第二大商业软件公司。此时,IBM软件部分的收入是257亿美元,甲骨文的收入是278亿美元。

这只是一次数字上的超越。产品组合和数据处理能力,为甲骨文锁住核心用户群起到了至关重要的作用,而核心用户持续购买软件许可证授权,又为甲骨文提供了稳定的收入。如果没有变化,这会是一个良性的商业循环。

然而,几乎同一时间,云计算产业喷发了,并颠覆了既有的商业模式。用户可以使用更低的价格,按照需求进行购买。这使得一劳永逸的甲骨文深陷被动。更大的致命伤是,云计算公司提供可以降低风险的方案,帮助用户完成迁移。

替代,永远是抢夺市场最有效的方式。2013年7月,已经进入云计算厂商行列的阿里巴巴宣布,其公司内部彻底下线甲骨文数据库。这是自2008年开始的一场变革,以往认为难以被替代的甲骨文数据库从互联网公司开始抽离。

阿里之后,亚马逊AWS接力。2015年10月,亚马逊AWS CEO安迪·杰希(Andy Jassy)公开指责甲骨文通过昂贵的商业合同捆绑用户。AWS推出数据库迁移服务(DMS),帮助用户从甲骨文等竞争对手的数据库迁出,也可以保留用户的原有甲骨文数据库,只是从自己的数据中心迁移至AWS。但后一种方式往往会将用户导向AWS的数据库产品。

亚马逊公布数据,甲骨文的数据库用户迁移到AWS平台的速度越来越快,2016年为1.8万个客户,到2017年9月猛增到3.5万个。2015年开始,数据库业务已经占亚马逊AWS总销售额的20%。

埃里森当时认为,亚马逊只是一个提供“玩具”的公司,“他们已经不管那叫做网络(电脑),他们现在叫它云计算”。因为AWS服务的客户大多是买不起甲骨文这类IT公司产品的创业者和中小公司。

不过,埃里森又深知亚马逊带给甲骨文的恐怖压力。当年,他在一次公开演讲中称,“过去二十年里,我们密切关注IBM和SAP这两家竞争对手,但现在我们不再关注他们中的任何一个。”这一次他选择了亚马逊AWS和微软。

面对AWS发起的赤裸裸的挑战,甲骨文的应对策略竟然是提高授权价格,外界一片嘘声。更令甲骨文措手不及的是,亚马逊AWS也开始向银行业扩展,而这是甲骨文的核心地带。

亚马逊AWS向银行业游说称,云计算可以满足高峰期对计算和存储的要求,又能在低谷期节省成本,非常适合支持移动应用,并在应对突发状况下有益于处理风险。今天银行业也在寻求转型,这一话术显然极具诱惑力。

掉头激进上云

2016年9月,拉里·埃里森在甲骨文的发布会上宣布将全力进军云计算领域,与亚马逊正面开战,甚至直言“亚马逊独占鳌头的时代要成为过去式了”。

此时,埃里森已经72岁了。

这些年,虽然对云,尤其对AWS言论强硬,但不按套路出牌的埃里森其实已多维度布局云计算业务了。

2011年到2016年,甲骨文一连收购了15家覆盖云各环节的创新公司,收购对象不仅包括如云客户服务提供商RightNow等垂直领域玩家,也包括虚拟化技术公司Xsigo、Docker容器管理服务商StackEngine等技术公司。

为了全面支持云架构,甲骨文几乎重写了所有软件产品,并对应用的交互进行重新设计,还开发了高性能服务器芯片。从底层芯片到 IaaS、PaaS 、SaaS,再到行业应用,甲骨文正在翻新云计算的每个层面。

今年9月,埃里森宣布了一项从当月25日开始的云销售计划。这个计划包括自带许可证使用PaaS(平台即服务)和通用授权两个部分。埃里森希望彻底改变用户购买和使用云的方式。

这可视为甲骨文在云转型上的再一次迭代。

在此之前,甲骨文用户已经可以将其本地部署的授权软件许可证用于甲骨文IaaS(基础设施即服务)业务,而现在甲骨文将这项服务扩大到了PaaS,也就是数据库、中间件和分析软件等产品。这意味着本地部署的用户即刻可以使用甲骨文的数据库云。

所为“通用授权”,就是用户可以签订一份合同,即可以使用甲骨文的全部云服务,而甲骨文运营系统转为根据用户总消费进行记账,而不是彼此独立。当甲骨文发布新的服务时,用户可以不必重新与甲骨文签订合同,就可以使用。

这是一项直接针对亚马逊AWS制定的策略。

埃里森称,如果你要购买10万美元的云计算服务,你必须跟AWS讲清楚需要什么样的数据中心、需要何种服务,然后AWS会计算出成本。但在甲骨文云平台,用户可以随意选择服务,灵活性更大。

过去一年,甲骨文将数据库和中间件部门合并,改变了以往PaaS业务由一个个小团队独立开发、缺乏完整性的组织管理模式。在这之后,甲骨文发布了引入机器学习的新一代自治式数据库云,从技术上提升了产品的性能,以及管理的便捷性。

与此同时,甲骨文继续拉拢大公司支持其向云转型的计划。经过几个月的努力,2017年5月,甲骨文宣布与电信运营商AT&T达成协议,后者数千个内部数据库将前迁移至甲骨文的云平台上,这些数据库包括PB级的数据和相关应用程序工作负载。

大公司的力挺,给了埃里森与安迪·杰希大打营销战的信心。拉里·埃里森列举了六项测试结果,均显示甲骨文的技术性能和成本领先于亚马逊AWS。

甲骨文更想要抢食的是IaaS(基础设施即服务)市场,也是亚马逊和微软最大的根基。对于IaaS,尽管这一业务本身缺少附加价值、盈利空间有限,甚至可能面临做一单赔一单的困境,甲骨文的投入仍十分执着。

甲骨文副总裁、大中华区云平台事业部总经理吴承杨告诉《财经》记者,以往基础设施只是标准化的服务,但现在越来越多的企业需要定制化的服务,甲骨文在软件和平台上的积累将反馈给基础设施,而IaaS本身仍有巨大增长空间,市场并未完全消化。

2016年9月,甲骨文发布了其对IaaS的全新定义。埃里森解释称,其比亚马逊AWS运行更快、成本更低,并可以运行严苛的数据库任务,“AWS(在基础设施上)领先的优势已经结束”。

不过,甲骨文向下补齐基础设施的短板并非易事。原微软中国云计算负责人申元庆曾表示,云计算IaaS是典型的资本密集型产业,其中牵扯的资金和技术投入相当巨大。

甲骨文虽然希望通过自上到下的云计算业务整合,带动IaaS增长,但是几次错过云计算发展的机会,令其在规模化竞争的云计算市场短期内难以突破。2017年9月,Gartner发布的2016年全球IaaS报告显示,亚马逊AWS市场份额为44.2%、微软为7.1%、阿里云为3%,甲骨文并未单独列出。

事实上,甲骨文在SaaS(软件即服务)的扩张更加积极。一方面,甲骨文对内全面云化。一位前甲骨文战略部管理者告诉,埃里森启动强制性的手段,将以往应用产品的销售从提供本地部署全面转向SaaS的模式销售,并且公司不断增加招聘SaaS销售人员。

另一方面,甲骨文在市场上大肆收购,并完成与自有产品的整合。在这场军备竞赛中,微软和亚马逊AWS虽然也陆续出手收购一些创业公司,但是远不如甲骨文一盘端的架势来得凶猛。

截至目前,甲骨文已发布了3500项SaaS服务,形成客户体验解决方案(CX)云、人力资本管理(HCM)云,以及企业资源计划(ERP)云等在内的业务矩阵。

对比来看,亚马逊AWS通过SaaS服务商和ISV(独立软件开发商)的产品部署在其云平台之上,向垂直领域拓展,自有服务刚开始尝试;微软虽然凭借Office 365、Dynamics 365,以及收购的LinkedIn在SaaS收入排行榜上引领市场,但产品组合比较单薄。

一位熟悉甲骨文的IT行业专家告诉,这将成为甲骨文最有可能突围成功的云业务,“毕竟现阶段在这个领域,微软、亚马逊等云计算巨头都不能对甲骨文构成威胁”。

反噬亚马逊

就像其他经历痛苦转型的IT公司一样,按合同订单收费转向按需收费的商业模式后,甲骨文很可能在接下来一段时间内难以保持高营收,甚至有些俯冲的趋势,利润也会受到影响。

过去四年的激进转型拉近了甲骨文和AWS的距离,IT公司云和恩墨创始人盖国强向《财经》记者评论,接下来,就要看甲骨文如何在这个基础上通过创新超越别人。

甲骨文甚至开始向亚马逊AWS的优势领域进攻。2016年,甲骨文完成了对NetSuite的收购,交易金额为92亿美元,远超甲骨文2009年对Sun的74亿美元收购,成为公司史上最大收购。甲骨文CEO马克·赫德(Mark Hurd)告诉,通过收购,甲骨文获得了NetSuite的4万家中小企业客户,将与甲骨文现有客户形成互补。

2017年11月,甲骨文在中国宣布了新一批客户,摩拜单车、科大讯飞等这些科技行业当红炸子鸡榜上有名。其中,摩拜单车已部署了HCM和ERP云,希望借此解决公司发展规模扩大后,员工年轻化和跨生态业务模式对公司内部管理的挑战。这家公司在企业级业务上的经验积累逐步释放。

然而,互联网客户对云平台的忠诚度并不高,往往根据业务需求出发选择不同的服务提供商。因此,留住以往传统核心客户,对甲骨文更为关键。混合云可以满足这些用户的迁移需求。传统客户希望可以在公有云、私有云之间无缝切换,以保证他们可以降低风险尝试新的技术。而甲骨文重写代码后,打通了全线产品,可以支持一键式迁移的需求。

马克·赫德表示,客户会发现甲骨文的公有云和私有云,具有相同的标准、架构、产品和技能,这有利于客户在两者之间无缝迁移降低成本,并加速获得更多的创新。

事实上,云计算用户需求,已从成本支出节省的量变,转向获取数据分析、业务预测等增值服务的质变。

甲骨文产品开发总裁托马斯·库里安(Thomas Kurian)表示,云计算的未来有五大趋势:人工智能与机器学习、“自治”软件、物联网、区块链和人机交互。这也是亚马逊AWS和微软布局的重点。

2017年10月,甲骨文集中发布了物联网、区块链等方向的云解决方案,但早已开始与客户利用相应解决方案展开合作。同年8月,三菱电机借助甲骨文物联网云服务为其工厂自动化开发新平台。利用这个平台,客户可以在生产现场完成快速收集、分析和利用数据,进而开发应用满足生产需求,优化供应链,管理遍布全球的工厂。

传统的销售客户正在转变为甲骨文的研发合作伙伴。服装零售商Gap将其销售相关的云服务部署在了甲骨文云上。Gap首席信息官保罗·查普曼(Paul Chapman)表示,过去六个月时间里,其所在团队与甲骨文共同完成了开发、规划解决方案,到部署上线的全过程。

甲骨文需要更加扩大合作伙伴范围,构建完整的云计算生态。截至目前,加入甲骨文合作伙伴网云计划的成员已经超过2600家,但却仍低于以往甲骨文以软件为基础构建上万家规模的生态体系。

微软之外,甲骨文是第二个提出完整转型方案的,这给其他传统IT公司带来新的希望,即使它们已经老去。

主要有三个优势。其一是无需管理服务器,Amazon Lambda可以自动运行用户的代码,无需预置或管理服务器。用户只需编写代码并将其上传至Lambda。其二是持续扩展,Amazon Lambda通过运行代码以响应每个触发程序,从而实现自动扩展用户的应用程序。用户的代码将并行运行并独立处理每个触发程序,使其按照工作负载的大小精密扩展。其三是带来亚秒级计量,使用Amazon Lambda时,会按代码执行时间(以每1毫秒为单位)和代码触发次数收费。代码未运行时,无需支付任何费用。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/540337.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-06-26
下一篇2023-06-26

发表评论

登录后才能评论

评论列表(0条)

    保存