获得20亿融资的摩尔线程推首颗国产全功能GPU，研发用时仅300天_服务器知识

近两年，国内各大企业已经深深认识到了高科技 “卡脖子”带来的危害，因此纷纷开始研究属于自己的核心技术。

在CPU行业，华为已经做了先行者，即使目前遭遇了空前的困难也仍没有放弃。而在GPU行业，国内的发展速度则要慢了不少，不过近期也陆续传出了好消息。

11月25日，国内GPU芯片初创企业摩尔线程宣布研发出了首款国产全功能GPU，“内置自主研发的3D图形计算核芯、AI训练与推理计算核芯、高性能并行计算核芯、超高清视频编解码计算等核芯”。据官方透露，这款GPU的研发用时仅300天。

此前，摩尔线程刚刚完成了20亿的A轮融资，所得资金将用于GPU芯片的批量生产与制造、GPU SoC相关联的IP研发、以及国产GPU生态系统的拓展等。这也是摩尔线程在一年内完成的第三轮融资，足见资本市场对其看好程度。

除了摩尔线程外，其他国产GPU公司也取得了一些突破。

11月16日，景嘉微官方宣布，其设计的JM9系列已经完成流片、封装、初步测试工作。根据测试结果，这款芯片可以满足地理信息系统、媒体处理、CAD 辅助设计、游戏、虚拟化等高性能显示需求和人工智能计算需求。

11月17日，芯动科技宣布首款国产高性能服务器级GPU“风华1号”测试成功。这款GPU搭载全球顶尖的GDDR6X和chiplet技术，在5G数据中心、云游戏、元宇宙等领域将发挥很大的作用。

随着AI、5G等技术的不断发展，GPU的重要性也将进一步提升，因此发展国产GPU也已经到了刻不容缓的地步。虽然国产GPU的性能距离英伟达、AMD这些国际霸主还有一定的距离，但能够实现从无到有的突破，也已经足够振奋人心。

“近几年大火的概念实现都离不开GPU。”

GPU IP巨头Imagination中国战略市场及生态副总时昕博士在一场演讲中曾说道。

那究竟什么是GPU呢？维基百科定义，GPU中文名为图形处理器，是一种在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上做图像和图形相关运算工作的微处理器。

VR、区块链、3D建模、渲染等一切跟图像有关的处理过程都需要GPU。当下最热门的元宇宙，集以上图像处理需求大成，对GPU的需求也不言而喻。除了图形处理功能，GPU还是目前公认最好的AI加速器，尤其是在云端训练大模型应用场景中。更有意思的是，在自动驾驶的赛道上，GPU也杀了进来：全球GPU龙头英伟达正对接越来越多的车企合作订单。

简而言之， 只要有高清画质需求，只要有AI处理需求，就离不开GPU。 因此，随着这两大需求的持续增长和巨大的市场想象空间，全球GPU龙头英伟达凭借GPU芯片的优势，市值就高达7410亿美元（约合人民币47198亿元，截至2021年12月23日），晋升为当下全球市值最高的半导体企业。

GPU芯片研发有多难？

GPU需求大，价值高，反观国内芯片企业在该领域却进度缓慢。目前中国在桌面和移动端领域的GPU供应基本被英伟达、AMD、ARM垄断，国产GPU是个巨大的蓝海市场且鲜有企业涉足。

近年来，在市场和国家战略替代的需求下，国内掀起一股“GPU投资热潮”，涌现了一批国产GPU初创企业。尽管投资热度高涨，国内初创企业多以技术难度更低的通用计算型GPU（GPGPU）切入赛道，能做高性能商业化的渲染GPU产品的企业依旧凤毛麟角。

这么重要的芯片为何鲜有国产企业踏足，GPU难在哪里呢？

芯师爷从不久前举办的“风华1号”发布会上了解到，“风华1号”GPU在多个领域表现上取得了第一，如第一款渲染能力达到5T-10T FLOPS的国产GPU显卡；第一款图形API达到OpenGL4.0以上，并能实际演示4.0 benchmark的GPU；还是第一款支持多路渲染+编解码+AI服务，硬件虚拟化和chiplet可延展的国产GPU等。

芯动科技 SoC体系架构师何颖提及，单从算力对标的话，采用“风华1号”双芯片的显卡可对标英伟达T4系列产品。换而言之，“风华1号”是一颗“真正”的高端国产GPU芯片，即便是对标全球GPU龙头企业产品也不遑多让。

据芯师爷复盘“风华1号”的研发之路，发现 国内企业做GPU主要有两大难，一是难在专利壁垒；二是难在GPU芯片的体系化创新。

在专利壁垒方面， GPU是先进制程数字芯片，对于GPU企业来说，高技术含量的自有IP的持续演进是技术自主和市场竞争优势的保障。但在该领域起步早的全球GPU巨头们已筑建了层层专利保护墙。以GPU架构IP专利为例，就连全球科技领头羊企业苹果，在该领域也绕不开专利授权：苹果从A4到A10X所有处理器芯片都是采用Imagination的IP，到A10之后苹果通过架构授权，有了自己的GPU架构把控，依然是基于Imagination的TBDR架构专利授权，隶属于该架构分支。但一旦架构授权后独立演进了，也就不再被专利卡脖子了。

在GPU芯片设计方面， GPU也绝非简单的芯片设计，其设计较一般芯片更复杂，系统更庞大，涉及面更广。做GPU需要极其专业的团队，团队从前到后要包圆，做到软硬全栈。专业人才要涵盖架构、算法、硬件、软件以及各种验证方式，包括后端、版图、驱动、测试、机械结构、生产、供应链等领域。这意味着，GPU研发团队需要在全链条节点上都配备丰富的量产经验人才，才能完成这样非常商业化的体系。

为何是芯动科技突围而出？

芯动科技从0-1直接突围高端GPU芯片的研发，这样的成果值得溯源与反思：为什么是芯动科技一鸣惊人，突破了国内企业做GPU芯片的困局？

芯师爷了解到，芯动科技是中国一站式IP和芯片定制及GPU领军企业，成立至今已15年。15年间芯动科技作为幕后英雄，为各国产半导体代工厂和300家全球知名客户提供顶尖IP和芯片定制，协助了包括瑞芯微、君正、微软、AMD、亚马逊等知名公司各种芯片量产，而且所有技术自研可控，能持续迭代，不断超越。逾50亿颗先进SoC芯片成功推向市场的背后，比如大家每天用的轨道交通身份证识别和全球顶级示波器，都有用到芯动科技的IP技术 。广泛的合作使得芯动科技在To B的圈子非常知名，更值得一提的是，在芯片IP领域，芯动科技还是TSMC 2021全球研讨会认可的唯一大陆合作伙伴 ，其技术和量产积累之深厚可见一斑。

正是在为各合作伙伴提供IP和芯片定制期间，芯动科技积累了GPU所需要的全套高端IP、图形芯片内核定制技术和先进工艺经验，形成了从工艺到设计，到器件，到量产，到封装，到整机的完整芯片设计验证条流程。这为“风华1号”GPU芯片的研发奠定了稳固的基础。芯动科技 SoC体系架构师何颖透露，“风华1号”集成了GDDR6/6X、PCIe 4、Chiplet Innolink、HDMI 2.1 、Display port 、VDAC、PLL、TV Sensor、PUF等高端自研IP技术，IP全自主研发，远高于友商。

其中， GDDR6/6X、Chiplet Innolink均为GPU业内顶尖技术。 以GDDR6X技术为例，GDDR6X并非简单的超频技术，为了数据密度更高，它使用了32位并行单端PAM4技术，比业界常见的串口差分PAM4技术，难不止一个数量级，全球除了英伟达，一个公司都做不出来，每个时钟周期可以传输多次数据——数据吞吐量越大，芯片并行计算能力越大，GPU能够同时渲染的像素点越多，画质越清晰。使用GDDR6X技术可满足4K高刷新率画面需求；在提升接口数据传输速率的同时，它实际内核频率甚至可以做到比上一代技术更低一些。

GDDR6X显存技术研发难度极高，目前全球只有英伟达和芯动科技两家拥有。 芯动科技 GDDR6X研发负责人高专表示，GDDR6X的PAM4并行技术是英伟达与美光在一栋楼里共同研发两年才研发出来，而芯动团队是全球唯一一家，仅凭有限的远程技术支持，只用一年时间就做出来了，连AMD目前都还没有做到成功研发该技术。这都是基于芯动科技团队十多年的技术基础积累和200次流片打磨的经验。

此外，为了保持技术的领先，芯动科技还立足全球和GPU全产业链，持续引入了大量GPU领域顶尖专业人才。

芯动首席算法科学家杨喜乐博士是顶级的架构师，她自从博士毕业之后，曾在英国Imagination公司担任架构师，过去的25年间一直从事GPU核心图形引擎的建模和创新，是全球GPU芯片领域从几何物理渲染到计算引擎领域的知名专家，持有GPU 3D计算机图形学核心领域顶级图形专利共计125项，目前Imagination、苹果等公司最新的核心GPU产品的设计、优化和迭代都离不开她的专利和算法。在芯动科技的邀请下，她回国投身国产GPU图形引擎的持续创新。

在芯动科技 GPU专家团队的努力下，“风华1号”GPU架构目前已在Imagination GPU的架构授权下，自主研发了两代，把原生移动端的架构拓展到了高性能计算、云计算的场景，在架构自主可控上不存在被“卡脖子”风险。

芯动科技 DX团队负责人章涛也是其从海外招揽的技术大咖。据悉，章涛是来自前AMD的图形框架开发的领军人物。他表示，“投身芯动开发GPU软件感觉非常棒！芯动团队从老板到员工，都在专心做事。”章涛透露，明年芯动科技就会发布风华显卡Windows操作系统的DX框架。

芯动云计算总裁敖海在“风华1号”发布会上曾这样总结：“‘风华1号’凝聚了芯动科技自有的众多技术积累，又有世界著名GPU公司顶尖人才的联合参与的加持，是芯动人努力和成果的结晶，也是芯动科技完成‘让风华GPU走进千家万户，让大家习惯用国产的GPU办公和娱乐 ’使命的开端。风华系列GPU赋能国产生态正加紧奋勇向前，目前芯动科技正在加紧与合作伙伴进行‘风华1号’适配调优，在向数据中心和国产桌面GPU 等合作伙伴送样的同时，风华2号和3号已经在路上了。”

写在最后

在半导体供应链面临不确定风险的产业环境下， 芯动科技瞄准高速成长的高清画质云渲染和元宇宙需求，推出的“风华1号”正当其时 ，填补了国产4K级桌面显卡和服务器显卡两大空白，为国产新基建5G数据中心、桌面、元宇宙、云游戏、云桌面等千亿级产业提供了有力支持，值得国产半导体产业为其喝彩。

同时，我们也该注意到，罗马不是一天建成的，发展中的中国GPU产业和国际巨头之间仍有不小的差距。芯动科技选择的是既充满机遇、又充满挑战的GPU市场，未来国产GPU生态的长期发展也需要国产GPU产业链企业的持续支持。

巨大的研发费用和长期资本开支，在已经多年持续盈利的芯动科技看来，并非很大挑战。芯动科技工程副总毛鸣明认为，硬科技要“十年坐得板凳冷”，需要长期打磨，不是像互联网靠砸钱就能成功的，投资人需要非常清楚这一点。 长远来看，国产GPU芯片技术突围最终还是需要靠经年累月的迭代和优化, 通过不断试错，走进应用于千家万户的终端产品供应链中取胜。

芯动科技 SoC体系架构师何颖也表示：“芯动科技是全球6大晶圆代工厂签约支持的技术合作伙伴，有着众多自研IP和强大稳定的团队执行力，在多年的持续奋斗中，芯动科技在跨工艺研发和供应链能力上极具优势，令合作客户长期受惠。而国产GPU上下游产业链的长期、持续商用也会成为芯动科技 GPU芯片发展的强大驱动力。未来，芯动科技将根据产业链客户需求，为风华系列GPU产品找到更多可持续落地场景，完成让风华GPU走进大家生活的使命。”

国产全功能GPU“苏堤”发布

国产全功能GPU“苏堤”发布，首款全功能国产智能显卡发布，这也是其基于MUSA统一系统架构的第一款桌面级显卡，主打桌面级PC、工作站市场。国产全功能GPU“苏堤”发布。

国产全功能GPU“苏堤”发布1

近两年频繁获得巨额融资的中国初创GPU公司正陆续取得进展。

3月30日，摩尔线程在北京发布其首款GPU芯片，并面向个人电脑和数据中心用途推出对应的显卡产品。

摩尔线程成立于2020年10月，总部位于北京，主要研发GPU芯片。去年11月，摩尔线程宣布完成A轮20亿元融资，由上海国盛资本、五源资本、中银国际旗下渤海中盛基金联合领投，建银国际、前海母基金、招商证券和湖北高质量发展产业基金等九家知名机构联合参投。摩尔线程创始人兼CEO张建中曾任英伟达全球副总裁、中国区总经理。

据张建中介绍，此次摩尔线程发布首个GPU架构“MUSA”，以及基于该架构的首款GPU芯片“苏堤”和显卡产品，搭配摩尔线程自研物理仿真系统以及多种GPU应用解决方案，有助于推动“元宇宙”应用落地。

张建中称，“苏堤”是全功能GPU芯片，可用于游戏、科学计算、3D仿真等用途，而MTT S60台式机显卡基于“苏堤”核心晶片制成，单精度算力最高可达6TFlops，配置8GB显存，搭配MUSA软件运行库和驱动程序等软件工具。

发布会上，张建中展示了使用MTT S60显卡玩《英雄联盟》的游戏情景，并称该显卡为首款能打《英雄联盟》的国产显卡，支持所有主流国产PC操作系统。

面向服务器市场，摩尔线程则推出了MTT S2000显卡，单精度浮点计算达12TFlops，支持32GB显存和PyTorch、TensorFlow等AI框架，支持虚拟化等技术，可用于支持云游戏、云渲染等应用。摩尔线程称已与多家OEM厂商合作适配显卡产品。

过去两年，GPU成为热门赛道，除摩尔线程外，沐曦集成电路、天数智芯、壁仞科技、登临科技等都是这个赛道的高端玩家，每轮融资动辄上亿元，尤其是吸金王壁仞科技成立三年多累计融资超47亿元。市场期待从中可以跑出“中国英伟达”。

然而，GPU作为“大芯片”，一直由海外巨头长期占领市场，国内技术积累极为匮乏，研发难度极大。尤其是全功能GPU领域，国内具备图形、科学计算等相关专业知识的'芯片人才储备不足。因此，像登临科技等企业选择GPU的AI计算方向进行研发，即GPGPU（通用计算GPU），专注于数据中心领域。

也有部分企业选择向外购买IP（知识产权），降低开发难度。芯动科技于去年发布的GPU“风华1号”，其IP购买自英国GPU技术授权公司Imagination。此次摩尔线程并未透露其IP是自研还是来自授权。

随着国内GPU初创企业的产品陆续面试，如何吸引客户进行验证、测试，搭建生态系统，将成为包括摩尔线程在内的GPU公司们下一个关键命题。

国产全功能GPU“苏堤”发布2

3月30日，摩尔线程正式发布了首款全功能国产智能显卡“MTT S60”，这也是其基于MUSA统一系统架构的第一款桌面级显卡，主打桌面级PC、工作站市场。

同时发布的还有面向数据中心的MTT S200，以及GPU物理引擎AlphaCore、数字人解决方案DIGITALME。

摩尔线程(Moore Threads)成立于2020年10月，创始人兼CEO张建中是原NVIDIA全球副总裁、中国区总经理，拥有真正世界级的、能够覆盖GPU研发设计、生产制造、市场销售、服务支持等完整成熟的团队，致力于研发设计国产全功能GPU芯片及相关产品，面向数据中心、边缘计算、高性能PC、工作站。

摩尔线程的MUSA统一系统架构包括统一的编程模型、软件运行库、驱动程序框架、指令集架构、芯片架构，应用具备广泛的可移植性，可以同时运行在云端、边缘计算平台上，适用于图形、计算、多媒体、人工智能等。

摩尔线程MTT S60显卡核心代号“苏堤”，采用12nm工艺，包含2048个MUSA核心，内置现代图形渲染引擎、智能多媒体引擎、AI计算加速引擎、物理仿真、科学计算四大引擎，单精度算力最高6TFlops，搭配8GB LPDDR4X显存。

它支持DirectX、Vulkan、OpenGL、OpenGL ES等图形API接口，可满足GIS、BIM、设计、主流游戏、原生Android、三维渲染等应用对图形性能的需求。

同时有基于全栈功能GPU的通用计算能力，可加速DBNet、CRNN、Yolo、Restnet50/101等AI模型推理计算，支持OCR、图像处理、视频增强等AI场景。

视频编解码不仅支持H.264、H.265(HEVC)，还业界首次加入了最新的AV1，并有三个DP 1.4接口，可输出8K、4K画面。

MTT S60显卡还提供了一站式的PES图形化控制中心，不仅可以监控GPU运行状态、设置2D/3D输出，还支持无人自动驱动更新。

CPU平台支持x86、ARM、LoongArch指令集，已适配Intel、AMD、飞腾、龙芯、兆芯、海光等平台，操作系统支持Windows 10、麒麟、统信、多种Linux发行版，比如可以在Windows下玩《英雄联盟》等。

目前，摩尔线程MTT S60显卡的PC合作伙伴包括联想、浪潮、清华同方、长城超云等。

行业应用合作伙伴包括金山办公、小鱼易连、太极图形、中望CAD、广联达、D5、苍穹数码、超图软件、易智瑞、中地数码、OSG社区、Gala Sports等等。

AlphaCore是摩尔线程独立设计研发的下一代多平台GPU物理仿真系统，能够对物理世界中复杂的固体、柔性体、流体等效果，进行超高精度的物理仿真处理，通过运算模拟，让布料、毛发、数字角色软体肌肉组织的物理交互效果，达到电影级别一般的真实。

AlphaCore物理引擎基于材料力学模块，可以实现丰富的材料交互动态效果，包括弹塑性材料、各项异性材料、羽绒服、皮革、丝绸、绵纶等。

同时，摩尔线程基于AlphaCore开发了一系列工具，包括布料毛发制作工具VeraFiber、气体流体仿真工具Catalys、生物仿生计算工具Bionics。

对比Houdini Vellum的软体毛发布料、PyroFX 的烟火流体，AlphaCore物理引擎都有5~10倍的性能提升。

AlphaCore也提供多平台兼容版本，最大程度兼容Vulkan、CUDA、DirectX等现有的运行时API环境，及Houdini、Unreal、Unity、D5等游戏引擎和设计软件。

国产全功能GPU“苏堤”发布3

在今天的摩尔线程 2022 春季发布会上，摩尔线程创始人兼 CEO 张建中发布了公司自主研发的首款全功能 GPU 产品“苏堤”，面向元计算提供元驱动力。

据介绍，“苏堤”基于摩尔线程最新推出的统一系统架构“MUSA”研发，具有现代图形渲染、AI 计算加速以及科学计算机物理仿真等功能引擎。是第一款支持 AV1 编解码的 GPU，支持视频云、直播、8K 游戏等智能多媒体运用。

据介绍，摩尔线程 GPU“苏堤”已开始适配国产主流 CPU 和操作系统，目前摩尔线程已与数百个生态伙伴建立合作关系，共同推进国产 GPU 应用软件的联合开发、性能优化和应用创新。

去年 11 月，摩尔线程宣布，不到 300 天，首颗国产全功能 GPU 研制成功，同时完成 A 轮融资。在完成融资的同时，摩尔线程还公布首颗国产全功能 GPU 芯片如期研制成功。

摩尔线程称，拥有完整的设计现代全功能 GPU 体系结构的软硬件设计团队，芯片内置自主研发的 3D 图形计算核芯、AI 训练与推理计算核芯、高性能并行计算核芯、超高清视频编解码计算等核芯。

欢迎分享，转载请注明来源：夏雨云

原文地址:https://www.xiayuyun.com/zonghe/634247.html

获得20亿融资的摩尔线程推首颗国产全功能GPU，研发用时仅300天

发表评论

评论列表（0条）