独家 | 寒武纪二代芯片发布在即,提前揭秘如何挑战英伟达!

独家 | 寒武纪二代芯片发布在即,提前揭秘如何挑战英伟达!,第1张

「初创公司要贸然打入云端市场,简直就是自寻死路」。

长久以来,云端的数据中心市场被视为创业公司的禁地,因为英特尔、英伟达、AMD 等巨头林立,竞争太过凶残。

但近年来,云计算势不可挡,云端芯片市场呈现爆发式增长,不乏勇者前来破局。

作为一家发源于中科院计算所、背靠多家「国字辈」资本、估值已经来到 30 亿美金的硬核创业公司,寒武纪挑战云端市场的底气十足。

2018 年 5 月,寒武纪发布首颗云端 AI 芯片,并对外透露获得中国前三大服务器浪潮、联想、曙光的订单。据机器之心了解,滴滴、海康威视也已经成为寒武纪的客户。

与此同时,寒武纪成数亿美元 B 轮融资。据机器之心了解,目前寒武纪的估值约为 30 亿美元,与今年 2 月完成 6 亿美元融资后成为「全球最具价值的 AI 芯片公司」的地平线不相上下。

一年后,寒武纪二代芯片已经箭在弦上,这颗积蓄了中科院计算所研发实力四年之久的二代或将为行业带来不小震荡。

机器之心独家获悉,寒武纪二代云端芯片或将于本月公布,同时我们采访到寒武纪技术研发相关知情人士、寒武纪云端芯片客户等多方信源,提前揭秘关于该颗芯片的细节亮点和核心技术。

这回有了中文名

据机器之心了解,寒武纪二代云端 AI 芯片代号为「MLU270」,延续上一代芯片「MLU170」的 MLU(Machine Learning Unit)系列。今年初,寒武纪已经为旗下芯片注册两大中文商标名,分别是「思元」、「玄思」。综上,寒武纪二代云端 AI 芯片中文名为「思元 270」。

在今年的新品议程表上,虽然还名列有其他芯片,但「思元 270」及其板卡将会是重头戏。这也表明寒武纪将从终端向华为等品牌商授权 IP 的模式,转向主打云端市场的芯片方案提供商。

在芯片架构方面,寒武纪二代芯片将从上一代的「MLUv01」升级为「MLUv02」。考虑到视频数据正呈现爆炸性增长,成为数据中心的任务主流,寒武纪在「思元 270」里内建视频解码单元,瞄准海量的视频处理市场专门配置。

据机器之心了解,寒武纪「思元 270」在今年年初研制成功,制程工艺方面明显抛弃了此前终端市场的激进打法,选择仍然沿用台积电 16nm 工艺,定位于「专注云端训练计算」。

对比两大巨头的主流云端产品线,英伟达去年 9 月发布并已发货的 Tesla T4 采用 14nm 工艺,AMD 去年 11 月发布的 Radeon Instinct MI60 和 MI50 采用 7nm 工艺,寒武纪这次似乎希望单纯依靠技术路线取胜,不再如去年对于 7nm 工艺寄予厚望。

「让英伟达难受」

在芯片性能方面,「思元 270」的性能参数有意向业界标杆英伟达 Tesla T4 看齐。

据机器之心目前了解到的情况来看,「思元 270」可支持 INT16/INT8/INT4 等多种定点精度计算,INT16 的峰值性能为 64Tops(64 万亿次运算),INT8 为 128Tops,INT4 为 256Tops。

对比 Tesla T4,FP16 的峰值性能为 65 Tops,INT8 为 130 Tops,INT4 为 260 Tops。

功耗方面,「思元 270」功耗为 75w,与 Tesla T4 持平。

但值得注意的是,这些「理论峰值」不过是纸面规格,真正实测水平相比理论峰值通常有一定缩水。据某大体量计算数据中心负责人,同时也是阿里云早期核心技术研发人员李立表示,「T4 在实测过程中,75w 功耗维持不了多久就降一半频率。」

据该负责人介绍,他在几个月前已经拿到「思元 270」的具体规格和特性,「对比而言,第一代 MLU100 是试水,第二代 270 就聚焦多了,威力非常大,NV 后面会很难受。」

与此同时,该负责人还指出,「寒武纪的方案在某些领域可能不会特别好使,尚待观察。」

核心技术解密

这里需要引入一对运算表示法的概念,整数运算(定点运算)与浮点运算。

它们是计算机计算中最为常用的两种运算表示法,顾名思义,其差异就体现在整数和浮点上,加减乘除运算都是一样的。

整数表示法,即所有位都表示各位数字,小数点固定;浮点表示法,则分成两部分,阶码和尾数,尾数就是数字部分,阶码表示乘幂的大小,也就是小数点位置。所以浮点数在做运算的时候,除了对尾数做加减乘除,还要处理小数点位置。

基于两种不同的运算表示法规则,导致面对同样长度的整数和浮点运算,后者计算模式更为复杂,需要消耗更多的资源去处理,并且二者功耗差距通常是数量级的。 简单来说,就是浮点运算占用的芯片面积和功耗相比于整数运算器都要大很多倍。

但浮点运算又有其不可取代性。首先,定点表示法运算虽然直观,但是固定的小数点位置决定了固定位数的整数部分和小数部分,不利于同时表达特别大的数或者特别小的数,可能「溢出」。

而浮点的精度虽然没有定点大,但是浮点运算的小数点位置可以移动,运算时不用考虑溢出,所以科学计算法一般都使用浮点。所谓「溢出」,指超出某种数据格式的表示范围。

此外,具体到使用 GPU 做训练,业界通常更倾向于浮点运算单元,主要是因为在有监督学习的 BP 算法中,只有浮点运算才能记录和捕捉到训练时很小的增量。 由于训练的部分模块对精度要求比较高,所以通常必须是高精度的浮点运算,比如 FP32 才能搞定,FP16 都难。

综上,虽然浮点运算相比定点运算在功耗、计算速度、性价比等方面都不占优势,但截止目前,浮点计算在云端的训练场景中仍具有不可替代的特性,并且以高精度运算为主。

那么,如何在不增加芯片面积和功耗的前提下,如何大幅提升芯片做训练的运算能力就成为云端训练芯片的主要研课题之一。

参考计算过程相对简单的推断计算思路,目前该领域的 AI 芯片多采用集成大量整数运算器或低精度浮点运算器。

面对计算过程更为复杂的训练计算,业界一直在尝试是否可能用性价比更高的定点运算器实现。「但这个问题在学术界也还没有普适的解决方案。」王一说道。

李立表达了类似的观点, 目前大家的研究热点之一,就在于如何全部的定点单元(比如 INT8)代替浮点单元,或者以主要的定点单元配合少量的高精度浮点计算单元(比如 FP32)做更多的训练任务,目的是达到定点计算的快速度,同时实现接近高精度浮点计算的精度。

谈到目前该方向的研究成果和代表论文,李立表示,行业相关的研究文章已经有一些,不过都不具有普适性。

王一进一步向机器之心透露了关于实现低精度运算的「关键心法」,要做好低精度训练,就要找到一个好的数据表示方法,既能表达最后大的数,又能让 0 附近的小量能够更好地表达,因此这个数据表示可能需要有自适应性,能随着训练的过程调整。

他还补充, 「低精度训练确实未必要是浮点数,只要能把数域表达好,0 附近的小量表达好,什么样的数据表示都可以。」

综上,寒武纪在大幅度提升训练阶段的计算功耗比方面,很有可能采用的是以整数为主的低精度运算,这在目前已公布的 AI 芯片项目中属于首创。

实际上,寒武纪在计算机计算领域的开创精神和技术积淀由来已久。早在 2014 年—2016 年期间,寒武纪创始人兼 CEO 陈天石、陈云霁两兄弟的研究就基本奠定了神经网络芯片的经典设计思路,也就是现在常谈到的 AI 芯片架构。

当时他俩的「DianNao 系列」论文横扫体系结构学术圈: Diannao(电脑)是 ASPLOS'14 最佳论文(亚洲第一次),DaDiannao(大电脑)是 MICRO'14 最佳论文(美国以外国家的第一次)……

而在大洋彼岸,美国两家风头正劲的 AI 芯片公司 Graphcore、GTI(Gyrfalcon Technology, Inc.)正是沿用了 DianNao 系列论文的基本思路,采用大量堆叠的简单计算单元以实现复杂的云端计算。(机器之心曾进行过相关报道,《一款芯片训练推理全搞,Hinton 为其背书,Graphcore 完成 2 亿美元融资》、《30 年前的「CNN 梦」在这颗芯片落地,能效比高出 Tesla10 倍 | CES 直击》)

此外,要切数据中心市场的蛋糕,一套完备成熟的软件生态也是其核心竞争力的重要体现。英伟达之所以能够在云端训练领域成为绝对主流,其 CUDA 软件生态的基础功不可没。

据机器之心了解,寒武纪从 2016 年起逐步推出了寒武纪 NeuWare 软件工具链,该平台终端和云端产品均支持,可以实现对 TensorFlow、Caffe 和 MXnet 的 API 兼容,同时提供寒武纪专门的高性库,可以方便地进行智能应用的开发,迁移和调优。

「云芯」之争一触即发

尽管前述了寒武纪的种种硬核技术护体、大资本和客户加持,但想要真正在数据中心市场扎下根,以实现陈天石去年在发布会上谈到的目标:到 2020 年底,力争占据中国高性能智能芯片市场的 30% 份额,仍然面临着异常残酷的市场竞争。

整体上,英特尔在数据中心服务器芯片市场仍然牢牢占据着的 95% 以上份额。

而随着深度学习计算和人工智能技术逐步兴起的云端训练市场,同样被巨头绝对垄断。目前 90% 以上的云端加速采用英伟达 GPU,AMD、FPGA 占据非常小的份额,剩余市场还在被国内外芯片创业公司不断瓜分。

据机器之心了解,近期还有一家国内知名 AI 算法公司将要入局云端推理芯片市场。据德勤最新出炉的报道显示,到 2022 年,全球人工智能训练市场的规模将达到约 170 亿美元,云端推理芯片市场的规模将达到 70 亿美元。

可以预见,2019 年,AI 芯片之争将从端燃及云上,云端的大体量、高增速市场势必迎来更多强劲玩家。

(应采访者需求,文中李立、王一均为化名。)

7月20日,AI芯片明星企业寒武纪正式登陆科创板。发行价64.39元/股。至此,创立4年、68天过会的“AI芯片独角兽”与投资者们在二级市场初次会面,A股市场迎来了AI芯片龙头股。

寒武纪早已声名在外:处在人工智能这一“风口”,却甚少在公众面前主动展示自己,被视作低调的“实干家”,但由于产品过硬,行业地位颇高,谈及AI芯片必然要提及寒武纪,正如其名字是地质纪元上的开创意味,寒武纪是国内AI芯片的拓荒者。

于资本市场而言,寒武纪上市意味着科创板注册制对于“优秀企业”的评判标准走向多元化,意味着创新物种开始在国内资本市场生根发芽。于寒武纪而言,上市不是目的,而是走向公众的手段,有益于远大目标的实现,从而吸引更多人才的加盟——毫无疑问,创新型企业走向星辰大海最重要的资本之一就是人才。

“我们有远大的志向,但长跑才刚刚开始。”三年营收50倍增长,手握40亿元现金,处于“新基建”机会窗口,正如其创始人陈天石所言,寒武纪站在远大征程的起点,而未来是一片蓝海。

投资者等来科创板AI芯片龙头股

2016年3月,陈天石创办寒武纪,2020年3月,上海证券交易所受理寒武纪的科创板上市申请。四年时间,硬 科技 明星企业通过注册制走向公众投资者。

虽然成立时间不长,但寒武纪底蕴深厚,技术与产品性能高居全球领先水平。券商研报介绍,寒武纪是目前国际上少数几家全面系统掌握了智能芯片及其基础系统软件研发和产品化核心技术的企业之一,公司凭借领先的核心技术,较早实现了多项技术的产品化,专门设计的通用型智能芯片架构已达到行业先进水平。

寒武纪正处于快速发展期。2017年度、2018年度和2019年度,其营业收入分别为784.33万元、1.17亿元和4.44亿元,2018年度和2019年度较前年增幅分别为1392.05%及279.35%,将2019年的营收与2017年作对比,寒武纪在3年间实现了55.6倍的营收增长。

招股书显示,寒武纪此次公开发行4010万股,占公司发行后总股本的10.02%,规模并不大。寒武纪募资了25.8亿元,主要来自保荐机构跟投子公司和其他战略投资者,后者包括联想(北京)有限公司、美的控股有限公司和OPPO广东移动通信有限公司,均为与寒武纪具有战略合作关系或长期合作愿景的大型企业及其下属企业。

相较于中芯国际等 历史 较长的芯片企业,寒武纪的成功上市开创了硬 科技 独角兽企业在注册制下成功上市的先河,搅动了一池春水。

长期以来,A股市场有着严格且固定的审核标准,这使得一些独具创新型的 科技 企业无法登陆A股市场,转求纳斯达克等更加“宽容”的市场环境。而一些A股上市公司,尽管上市时盈利能力达标,但不乏上市后业绩“变脸”,且后续发展乏力的例证,这并非投资者愿意看到的场景。

璞玉并不以当下的盈利能力作为唯一标准,如何留住可能伟大的企业?设立科创板实行注册制成为众望所归的转折点。寒武纪虽然尚未盈利,但其主要产品性能在与国内外主要竞争对手ARM、英伟达、英特尔以及华为海思的对比中不分上下,部分指标甚至领先对手,展示出了强大的发展潜力。

长跑型选手“放长线钓大鱼”

寒武纪本次募集的资金主要用于新一代云端训练芯片及系统项目、新一代云端推理芯片及系统项目、新一代边缘端人工智能芯片及系统项目和补充流动资金。

自成立以来,寒武纪快速实现了技术的产业化输出,先后推出了用于终端场景的寒武纪1A、寒武纪1H、寒武纪1M系列芯片、基于思元100和思元270芯片的云端智能加速卡系列产品以及基于思元220芯片的边缘智能加速卡。

2017年寒武纪将1A处理器IP授权华为海思使用,搭载在华为Mate10手机上,是全球首款AI手机芯片。思元系列产品也已应用于浪潮、联想等多家服务器厂商的产品中,思元270芯片获得第六届世界互联网大会领先 科技 成果奖。截至2020年2月29日,寒武纪已获授权的境内外专利有65项,PCT专利申请120项。

在人工智能芯片设计初创企业中,寒武纪是少数已实现产品成功流片且规模化应用的公司之一,这亦是其大手笔投入研发的成果。招股书显示,寒武纪2017至2019年研发支出分别为0.3亿元、2.4亿元、5.43亿元,研发投入营收占比连续3年超过了100%,处于行业的较高水平。目前,寒武纪共有研发人员680名,占总员工的79.25%,硕士及以上的人员占比超过60%。

对于芯片企业而言,如寒武纪一般巨额的研发投入并不罕见——不论是设计还是流片,芯片企业都需要大量资金,“烧钱”是芯片企业的共同属性。按照普遍的流程,芯片研发不仅耗资巨大,耗时也较长,研究成品还需“Design in”,得到客户的响应与支持,磨合后方可进入大规模出货的营收创造阶段。

硬 科技 企业与互联网企业有着本质的不同,这首先体现在回收研发成本的周期上,不过更需要看到得是,芯片企业一旦研发成功,护城河便是难以轻易被超越的,因此回报也将如研发投入一样,是巨量且长期的。

研发投入换取的“效率”成为决定胜负的关键。陈天石曾表示:“芯片这个赛道,比的就是出产品的速度,以及产品好不好用。”寒武纪进入赛道比较早,幸运地占了先机,产品又得到了客户的认可,在研发效率上已经经过市场的验证,成立四年,寒武纪每年都会推出和迭代新产品,相较于其他国外芯片设计公司与A股上市芯片设计公司以平均约每1-3年的迭代周期,寒武纪的研发能力表现突出。而相较于科创板企业的平均毛利率53.49%,寒武纪的综合毛利率也高过平均值。

不过,通往伟大芯片公司的赛程很长,更加需要长跑型选手,投资者也需要建立“放长线钓大鱼”的投资心态。寒武纪在招股书中坦言亏损还将持续一段时间,这也是芯片企业的正常生长进程,尤其AI芯片是人工智能产业的引擎,也是技术要求和附加值最高的环节,为了在以后“钓到更大的鱼”,寒武纪必须持续研发、快速迭代,而耐心的投资者将享受到最大的利益。

AI芯片领跑者“横着长”的生态路径

当部分初创企业靠着一颗芯片艰难维生时,寒武纪已经做出了一把芯片,这是“领跑者”的优势积累。

寒武纪的业务大致分为四部分:智能计算集群、AI推理芯片、IP授权、AI训练芯片。其中前三部分业务在2019年分别产生2.96亿元、7888万元和6877万元收入,毛利率分别为58.23%、78.23%、99.77%。第四部分业务AI训练芯片是技术的制高点,产品于2020年推出,预计2021年产生收入。

与华为的合作是寒武纪声名鹊起的因素之一,这证实了寒武纪的产品可靠性,而华为选择自研道路,也同时证明了AI芯片这一赛道的重要性。

研报显示,2020年仅智能手机、AR/ VR、无人机等在内的消费电子市场AI智能芯片需求量预计就达到26.11亿美元,而智能驾驶有望带来更广阔的市场需求。IDC预测,云端推理和训练对应的智能芯片市场,预计将从2017年的26亿美元增长到2022年的136亿美元,年均复合增长率39.22%。ABI Research预计,边缘智能芯片市场规模将从2019年的26亿美元增长到2024年的76亿美元,年均复合增长率23.93%。

对于寒武纪而言,与华为的友好竞争有益于长期发展。目前,寒武纪已不存在向单个客户销售比例超过公司销售总额50%的情况。而从寒武纪的收入结构变化可见,其2017-2018年99%的收入来自终端智能处理器IP授权业务,2019年新增云端智能芯片及加速卡、智能计算集群系统业务收入,业务走向多元化。

寒武纪定位于中立、独立的芯片企业,走的是生态型发展路线,而今,经过四年发展,寒武纪“云边端”三条产品线已经完备,接下来仍将不断迭代升级,未来,如英伟达等企业一样,寒武纪将构建出独有的生态,并延伸至交通、教育、医疗等多个细分领域。

“云边端一体的作用就是让开发者省力省心,让我们自己也省力省心。云边端一体意味着,部署在不同场景的芯片在硬件层具有统一的指令集和架构,在软件层具备统一的应用开发环境。这能减少公司和开发者研发不同种类芯片时的成本,是我们生态战略的重要组成部分。”陈天石介绍寒武纪的业务架构时表示。

人工智能时代,新的巨头正在成长,毋庸置疑,寒武纪是种子选手。超过40亿元现金储备以及25亿元募集资金加持,寒武纪无疑是AI计算芯片初创企业中资金实力较雄厚之一,这是其巩固优势的基础。面对征途,寒武纪手握成熟且性能领先的产品,以及生态的雏形,蓝海就在前方,只待乘风破浪。 文/慧瑾

每日经济新闻

寒武纪营收无法覆盖研发投入,去年亏损超8亿

寒武纪营收无法覆盖研发投入,去年亏损超8亿,从2017年到2021年,寒武纪已经连续亏损5年,合计亏损28.6亿元。寒武纪营收无法覆盖研发投入,去年亏损超8亿。

寒武纪营收无法覆盖研发投入,去年亏损超8亿1

4月15日晚间,寒武纪发布年报。2021年全年营收7.21亿元,同比增长57.12%;亏损8.25亿元,2020年亏损金额为4.35亿元,亏损扩大89.66%;扣非亏损金额更是高达11.1亿元。芯片是资金密集型行业,具有高特入特点,高昂的研发投入使得寒武纪自身盈利能力堪忧,近五年累计亏损超过28亿元,且还将存在持续亏损风险。

寒武纪不计成本投入,研发平均薪酬超60万

对于2021年亏损扩大3.9亿元的情况,寒武纪指出了确保智能芯片产品及基础系统软件平台的高质量迭代,在竞争激烈的市场中保持技术领先优势,持续加大研发投入,积极引进优秀人才、保持公司研发团队稳定,在报告期内研发费用大幅增长。2021年,研发投入达11.35亿元,与去年同期增长47.8%,研发投入占营收收入比例157.5%。

营收无法覆盖研发投入,可以看出寒武纪不计成本搞研发,其研发人员薪酬更是惊人。年报数据显示,2021年应付职工薪酬为19.18亿元,同比增长41.75%。需要指出的是,寒武纪在职员工数量是1497个人,平均薪酬12.8万元,但研发人员的平均薪酬则超60万元。

截止2021年12月31日,寒武纪研发团队规模为1213人,占总人数比例81%,研发人员的薪酬合计为7.38亿元,平均薪酬达60.88万元,2020年研发人员平均薪酬为45.27万。因芯片设计人才稀缺,为吸引行业高端人才,稳定研发人才队伍,导致研发人员平均薪酬较上年同期提升34.48%。

当然,高昂的研发投入是为了保持技术先进性和市场竞争力,是其营收增长的核心驱动力,2021年营收同比大增五成。

营收增长强劲背后,单一客户营收占比超六成

营收看似增长强劲,遗憾的是,背后依赖单一客户。2021年,寒武纪来自智能计算集群系统营收4.56亿元,同比增长39.9%,占总收入比例六成以上。而这个营收主要来自昆山智能计算中心项目。

2021年12月,寒武纪与江苏昆山高新技术产业投资发展有限公司签署了智能计算中心基础设施建设项目设备采购合同,合同含税金额为5.089亿元。主要提供含智能加速器、计算服务器、人工智能算力平台软件等软硬件产品。

值得一提的是,昆山智能计算中心项目为寒武纪贡献了4.5亿元,占2021年公司营业收入的 63.19%。换一句话说,一个客户支撑起了寒武纪智能计算集群业务板块,也是支撑整个公司营收核心。且其他业务板块营收规模并不亮眼,尤其云端产品线、IP授权及软件、其他业务营收面临下滑尴尬局面。

要知道,寒武纪所处的芯片赛道上,汇聚了英特尔、英伟达、ARM等芯片大厂,与这些芯片巨头相比,寒武纪整体规模、资金实力、研发储备等存在较大差距。

尤其英伟达是全球人工智能芯片领导者,全球科技巨头都依赖于英伟达发展AI技术,包括微软、谷歌、Meta等全球科技巨头们均依赖于其GPU来训练AI,带动市场对英伟达AI的需求激增,在超大规模和云扩展的推动下,使得英伟达数据中心板块营收不断创纪录,且有望成取代游戏成为最大业务板块。

英伟达在云计算、企业和边缘数据中心、超级计算等市场中展现出强劲的竞争力。对于寒武纪来说,人工智能芯片产品主要应用于各类云服务器、边缘计算设备、终端设备。

目前推出了云端推理思元270、边缘推理思元220、云端训练思元290,还有推训一体思元370等芯片。其云端智能芯片及加速卡,已与包括阿里巴巴等国内头部互联网厂商的多个业务部门进行了深入合作。

在云端产品中,寒武纪推出了思元370,凭借7nm制程工艺和最新智能芯片架构MLUarch03,思元370智能芯片最大算力高达256TOPS(INT8),是寒武纪第二代云端推理产品思元270算力的2倍。并推出3款加速卡(MLU370-S4/X4/X8),在视觉、语音、图文识别等场景的适配性能表现超出客户预期,部分场景已经进入小批量销售环节。

在金融领域,MLU370-X4在招行多个业务场景的实测性能超过竞品,能够大幅提升客户的效率。只是寒武纪云端产品线表现低迷,2021年营收为8023万,同比下降6.98%。

增速最快的板块是边缘产品线。2021年,思元220智能芯片及边缘智能加速卡实现出货量快速增长,实现收入1.75亿元,较上年同期显著增长741%,且是寒武纪第一款年度出货量近百万片的产品。

寒武纪营收无法覆盖研发投入,去年亏损超8亿2

4月16日消息,A股上市公司寒武纪在4月15日发布2021年全年财报,财报显示寒武纪实现营收7.21亿元,较2020年同期的4.589亿元同比上涨了57.12%;全年净亏损为8.249亿元,较2020年同期的净亏损4.345亿元同比扩大89.86%。

从主营业务来看,寒武纪的智能芯片及加速卡业务贡献收入2.15亿元,智能计算集群系统业务实现收入4.56亿元。

不过从2017年到2021年,寒武纪已经连续亏损5年,合计亏损28.6亿元。

寒武纪还在财报中分析了至今仍未实现盈利的3个原因:

第一、为了在竞争激烈的市场中保持技术领先优势,寒武纪持续加大研发投入,积极引进优秀人才、保持公司研发团队稳定,报告期内研发费用增长幅度较大,2021年公司的研发投入总额为11.357亿元,较上年同期增长47.83%;

第二、寒武纪2020年底及2021年实施的股权激励计划,导致本报告期按归属期分摊的股份支付费用显著增加。较上年同期增长了1669.97%。

第三、寒武纪积极发力市场推广及生态建设,向客户提供高质量的服务,积聚品牌效应,销

售费用有一定程度的增加,增幅为58.98%。

2021年,寒武纪在3项业务上都在持续推进:

硬件方面,他们发布了基于第四代智能处理器微架构的推训一体思元370智能芯片及加速卡;软件方面,公司投入了大量的资源优化基础系统软件平台,统一的软件平台日臻完善;同时,新一代产品及智能驾驶芯片的研发也在有序进行。

2021年,寒武纪还设立了控股子公司行歌科技,开展智能驾驶芯片的研发和产品化工作。这家公司在进行独立融资时,还曾获得蔚来、上汽及宁德时代旗下基金等机构的战略投资。截至 2021年12月31日,行歌科技已有超过80名员工,其中约90%是研发人员。

2021年共有超过200名资深专家和年轻员工加入寒武纪,截至2021年底,寒武纪共有1213名研发人员,与2020年同期的`978人相比增长24.03%。

同时寒武纪也表示因芯片设计人才稀缺,为吸引行业高端人才,稳定研发人才队伍,2021年研发人员的平均薪酬较上年同期也有所提升,从2020年的平均年薪45.27万元,上升到2021年的平均年薪60.88万元。

也就是说,寒武纪的研发人员,在2021年里,平均月薪超过5万元,达到5.07万元。

其中公司创始人、董事长兼CEO陈天石的年薪为103.19万元,COO王在的年薪为154.4万元,副总经理刘少礼的年薪是133.86万元,CFO叶淏尹的年薪是126.36万元。这些高管中年薪最高的是公司前CTO梁军,他在2021年的年薪高达395.85万元。

不过遗憾的是,梁军在2022年已经离职。

梁军是在2022年3月14日晚间被宣布离职的,他在2022年1月份递交辞职申请,寒武纪曾尝试挽留,但最终没有成功。

寒武纪在2020年7月20日登陆A股,上市首日开盘曾上涨近290%,市值一度突破1000亿元,当天收盘价为212.4元。但目前其股价仅为56.26元,已经跌破发行价,当前市值也仅有225.5亿元。

作为科创板AI芯片第一股,寒武纪未来的亏损能否缩小并最终实现盈利,是他们面临的终极考验。

寒武纪营收无法覆盖研发投入,去年亏损超8亿3

2022年4月15日,寒武纪(688256.SH)发布2021年年度报告。报告显示,2021全年,公司营业收入达到7.21亿元,较上年同期增长57.12%,综合毛利率为62.39%,较上年同期基本持平。营业收入中,智能芯片及加速卡业务贡献收入2.15亿元,同比上年增长101.01%。

另外,报告显示,本报告期内,公司在市场开拓方面也取得了一定成绩,报告期内毛利总额为44,989.46万元,同比上一年度增长49.94%。

新产品方面,报告显示,思元370是寒武纪第三代云端产品,采用台积电7nm先进制程工艺,是寒武纪首款采用Chiplet(芯粒)技术的人工智能芯片。

思元370智能芯片最大算力高达256TOPS(INT8),是寒武纪第二代云端推理产品思元270算力的2倍。同时,思元370芯片支持LPDDR5内存,内存带宽是思元270的3倍,可在板卡有限的功耗范围内给人工智能芯片分配更多的能源,输出更高的算力。

思元370智能芯片采用了先进的Chiplet芯粒技术,支持芯粒间的灵活组合,仅用单次流片就达成了多款智能加速卡产品的商用。公司目前已推出3款加速卡:MLU370-S4、MLU370-X4、MLU370-X8,已与国内主流互联网厂商开展深入的应用适配。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/796868.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-08-27
下一篇2023-08-27

发表评论

登录后才能评论

评论列表(0条)

    保存