对话阿里云李飞飞:关于云原生数据库的五大预判

对话阿里云李飞飞:关于云原生数据库的五大预判,第1张

作者:王慧贤

数据存储、数据分析、数据安全......如今,围绕“数据”的话题越来越多,离人们的生活也越来越近。

从陌生到熟悉,数据不仅“出圈”,甚至已然站在了C位。去年,中央发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确表示,继土地、劳动力、资本、技术后,数据成为第五大生产要素。

步入信息化时代后,数据库、操作系统与中间件作为计算机最基础的三大软件,支撑着企业的正常运行。

当数据成为生产要素后,必然会迎来爆发式增长,企业的数据存储和处理需求将进一步释放。更重要的是,疫情加快了数字化转型的脚步,更加速了企业的上云速度。

从信息化到数字化,时代的变革,总会带来商业世界的变化。如何在云原生架构下使用数据库,成为企业的痛点和云厂商的机会,亚马逊AWS的CTO Werner Vogels曾多次强调:“数据库是云计算的终极之战。”

在数智化时代,云原生到底意味着什么?云原生数据库和传统数据库相比,核心优势是什么?是否把数据库搬上云就是云原生?基于这些问题,雷锋网与阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞展开一场对话。

国产云原生数据库,摆脱「切肤之痛」

如今,数据库的商业世界,因为云的出现与发展,分成了两大派系。

一派是以Oracle为代表的传统商用数据库,一派是以国外AWS、国内阿里云为代表的云原生数据库,去“IOE革命”下的产物。

其实,早期较为火热的数据库种类有三种,层次式数据库、网络式数据库和关系型数据库。

在《浪潮之巅》一书中,作者吴军写下了这样的观点:“Oracle 的兴起很大程度上靠的是它最早看到关系型数据库的市场前景,并且在商业模式上优于 IBM。”

因此,在云原生数据库“入世”之前,数据库的天下一直是Oracle的,国内大部分互联网公司都不得不采用Oracle+IBM小型机+EMC的模式来维持正常运营。

高昂的费用,使得对于数据库需求较大的互联网巨头“忍无可忍”。

2009年,阿里巴巴的Oracle RAC 集群节点数达到了创记录的20个。可由于Oracle并没有弹性扩展的功能,只能按照峰值流量购买小型机和数据库,导致阿里将业务上涨带来的大部分利润,都支付给了Oracle。

第二年,阿里便开始走上了去“IOE”之路,根据开源MySQL搭建了AliSQL,并顺利经过了淘宝双11的考验,国产云原生数据库算是正式摆脱了“切肤之痛”,逐渐受到市场的真正认可。

另一边,国外的AWS在2015年公布了基于云计算的自研数据库Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其最大的特性就是高性能和高可用性。

云计算巨头的入局,让云原生数据库在国内外一步步成为主流。据Gartner预测,到了2021年,云数据库在整个数据库市场中的占比将首次达到50%,到2023年,75%的数据库都要跑在云平台之上。

关于云原生数据库,随着逐步的出圈,也让人们关心的焦点从“是啥?”转变为“还能解决哪些问题?”

但云原生数据库存在着数据孤岛的问题,无法打通多个数据系统的情况下,企业在数据加工和数据管理上就会“压力较大”,甚至在数据安全方面还存在隐患。

传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求。

因此,在李飞飞看来,云原生数据库已经走到2.0阶段。这个阶段要解决的问题,就是上述存在的痛点。

9月26日,在阿里云数据库创新上云峰会上,阿里云发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,使企业的在线数据可以释放出更大的价值。

相较于传统方案,阿里云一站式敏捷数据仓库解决方案有4大核心优势:

1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;

2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;

3、支持复杂实时数据加工、计算逻辑;

4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。

除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。

传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。

针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。

此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。

谈起未来数据库的发展趋势,李飞飞提到以下五点:

1、云原生+分布式一定是数据库的标配,分布式已经是必选项。分布式数据库由多个相互连接的数据库组合而成,面向用户则是以单个数据库的形态出现。云原生分布式数据库具备易用性、高扩展性、快速迭代、节约成本等特征,从资源池化到弹性扩展,再到智能运维,再到离在线一体化,解决企业用户的核心诉求。

2、AI for DB(database,指数据库)和 DB for AI 将是主流趋势。用AI将数据库运维管控智能化,尤其在云原生+分布式这个前提下更重要,因为数据库不仅是内核的能力弹性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。在数据库里,面对越来越多非结构化的数据,分析能力十分重要。

3、数据的安全可信,在今天这个大环境下变得愈发重要,如何确保整个数据库系统,在处理数据全链路过程中提供加密能力、多方安全计算能力、隐私保护的能力,也是很重要的趋势。

4、多模数据处理能力将越来越重要。比如,新型数据库多模态的处理能力,在新能源 汽车 企业打标签、智能电池化预测等应用场景中,将发挥越来越重要的作用。

5、一份数据,多个数据处理引擎:实现仓库一体、仓库联动、仓库打通,数据之间无缝流转。

以上判断,也从侧面反映出阿里云数据库的走向,这点毋庸置疑。但除此之外,业界最关心的,还有开源。

近半年,国内很多厂商相继提出开源战略,背后缘由显而易见,为了打造生态。就在今年的阿里云峰会上,阿里云智能总裁、达摩院院长张建锋(花名行癫)将2021年阿里云的发展关键词归纳为:做好服务、做深基础、做厚中台、做强生态。

做好服务与生态,成为如今厂商们不约而同的目标,而开源,就是最好的选择。

当雷锋网问到:“未来,阿里云数据库会不会把所有能力都开源?”这一问题时,李飞飞给到的回答是:“不会。”

之所以有这样的回答,是因为对于开源,他有着一些判断和看法。

李飞飞表示,这些部分,本就是阿里云数据库的商业化版本。

事实上,业界大多数的数据库厂商都不会针对自身的核心能力开源,如TiDB的核心管控组件、TiFlash。

与像MongoDB,、Cassandra、CouchDB这些以开源起家的数据库厂商不同,开源只是阿里云数据库的战略,不是阿里云数据库的命脉。

前几年,有业内人士表示,在面向开源时,国产数据库首先需要解决信任以及开源知识产权等问题。“开源会让厂商更加认真思考版权还有专利的问题,事实上,选择开源后,对于数据库厂商提出了更高的要求。”

李飞飞认为,开源只是一种选择,数据库开源成功并不代表着商业化就能够成功,不开源也不能代表厂商不先进。

更准确的说,开源只是一种有效手段。

最终,阿里云数据库希望客户能够通过开源版本把阿里云数据库产品技术快速用起来,并能够参与到技术产品的迭代过程中,在一些高阶能力上,借鉴团队专业能力和阿里云的服务能力,成为良好的商业合作伙伴,这是李飞飞以及阿里云数据库对于开源的一些基本思考。雷锋网雷锋网雷锋网

阿里云数据库 InfluxDB® 版已于近日正式启动商业化 。 云数据库 InfluxDB® 是基于当前最流行的开源数据库 InfluxDB 提供的在线数据库服务,相比较开源具有免运维,稳定可靠,可弹性伸缩的优势,广泛应用于互联网基础资源监控,容器监控,业务运营监控分析,物联网设备远程实时监控,工业安全生产监控,生产质量评估和故障回溯。提供时序数据自动化采集,压缩存储,类SQL查询,多维聚合计算和数据可视化分析能力。点击关注,InfluxDB 商业化活动

时序数据和企业业务密切相关,不可或缺。任何一家企业都需要一套高效的运维系统保证实时发现应用和业务问题,通过监控,故障告警的手段,进行故障定位,保证在线业务的稳定,减少不可用时常。业务运营人员依赖运营系统,保证有充足的数据进行业务分析判断,便于更准确的做出业务决策。物联网企业和工业企业都需要能够实时掌握设备的运行状态,对生产过程进行监控,实时判故障预警,故障定位,故障回溯以及业务。以上业务场景都需要时序数据作为“数据证据”来表示指标“变化”过程,进而达到告警,诊断,修复和预测的业务目的。

时序数据很简单,构成具有三个要素,主体,时间戳,和指标数据。比如: xxx公司(主体)2019年8月26日上午10时,11时, 12时(时间戳)的股价分别是:160 USD,165 USD,180 USD(指标值)。概括来说,区别于关系数据库关心的是“最终结果”。时序数据表示的是资产或者过程是如何随着时间变化的,体现的是“变化”的过程价值。

时序数据主要应用在:运维监控,运营分析,设备监控,BI分析,工业安全生产监控场景。这些场景上,产生的核心数据是时序数据,业务特征表现在 写多读少 ,无事务性要求,数据分析强关联时间维度,且实时性要求高。

时序数据库针对时序数据业务特征进行针对性的数据存储结构设计,以及存储方式的优化,在监控等时序业务场景下数据的写入,读取,分析能力相比较传统的关系型数据库如 MySQL ,具有百倍的性能提升。

从数据存储架构上看,关系数据库通常按照行来记录一条时间记录数据,且顺序记录之间无主体关联性,单个主体的记录数据随机分散在多行,如果是分布式数据库甚至分布在多个分分库上,记录之间也没有时间顺序组织数据,连续时间戳的数据,分散在不连续的存储上,这样就造成按照主体和时间维度的数据写入和存储的效率大大降低。

而时序数据库按照主体为维度进行数据存储和索引,完全按照业务使用场景组织数据,相同主体指标数据组织在一起,并且按照时间为度进行分片存储,只需要获取主体信息和时间分片信息就可以顺序进行写入和读取操作。单次IO请求磁盘寻道的时间和获取数据量比关系数据库寻道的效率和获取数据量都要高,查询的时间区间越大,查询主体越多,数据越多,效率差异越大,整体性能比关系数据库要高出十倍甚至百倍。

云InfluxDB® 相比较开源InfluxDB 优势明显。 云InfluxDB 提供云服务的方式,有行业顶级的专家支持服务,具有 免安装,免运维,稳定性高,数据高可靠的优势。使用云存储的方案,数据多副本存储,数据可靠性达到99.9999% 。

自建快速迁移上云

云 InfluxDB 提供了快速迁云的工具,只需动动鼠标就可以完成自建InfluxDB 到 云 InfluxDB 的迁移。

类SQL 开发友好,快速上手

阿里云 InfluxDB 完全兼容开源 InfluxDB ,面向开发友好, 为了方便传统关系数据库开发者能够快速适应Influx DB开发, 提供给了类 SQL的查询语言 InfluxQL,在提供强大的时序分析能力的基础上,最大程度的沿用了SQL的开发模式,使得学习成本大大降低。

集成数据采集,搭建监控更简单

阿里云数据库 InfluxDB 继承了 Influx DB 良好的开源生态,具有完整的数据采集,存储和数据可视化监控告警体系 TICK Stack 支撑。 同时相比较开源产品,提供了产品化的数据采集服务,只需在控制台进行几步简单操作,“0” 代码完成各类监控源的监控数据自动采集。

云InfluxDB® 金融高可用版即将推出

服务的高可靠和数据一致性对金融类企业至关重要,开源的InfluxDB 没有提供高可靠的HA 版本,阿里云InfluxDB 针对金融,保险,银行,涉及数据和服务高可靠的研发了 HA高可用版本, 目前正在商业化上线的过程中,不久就可上线提供服务。

云InfluxDB® 商业化限时优惠

阿里云是阿里巴巴的吗

阿里云是阿里巴巴的吗,阿里云全称阿里云计算有限公司,阿里云的成长潜力可谓非常一般,可以称得上是全球的几大独角兽之一。是一个又大又快的计算机平台。阿里云是阿里巴巴的吗。

阿里云是阿里巴巴的吗1

阿里云是阿里巴巴集团旗下云计算品牌。

阿里巴巴网络技术有限公司(简称:阿里巴巴)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。阿里巴巴集团经营多项业务,另外也从关联公司的业务和服务中取得经营商业生态系统上的支援。业务和关联公司的业务包括:淘宝网、天猫、聚划算、全球速卖通、阿里巴巴国际交易市场、1688、阿里妈妈、阿里云、蚂蚁金服、菜鸟网络等。

阿里云是全球卓越的云计算技术和服务提供商。致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。创立于2009年,在杭州、北京、硅谷等地设有研发中心和运营机构。

阿里云使用技巧:

1、阿里云可以购买服务器,打开阿里云官网,登录个人账号,打开控制台,点击云服务ECS-,选择实例,选择创建实例,之后根据需要选择相关服务即可。

2、阿里云账号可以注销,进入阿里云官网,登录阿里云账号,点击右上角的个人头像,点击用户名,打开账号管理页面,点击注销账号,点击获取验证码,最后输入验证码即可注销。

3、阿里云无法登录,可能是网络异常导致,可以切换网络再使用。

资料拓展:2018年11月26日,阿里巴巴集团宣布阿里云升级阿里云智能,加强技术、智能互联网的投入和建设。2019年6月18日,阿里钉钉进入阿里云智能事业群,钉钉CEO陈航向阿里巴巴集团CTO兼阿里云智能事业群总裁张建锋汇报。

阿里云是阿里巴巴的吗2

如今的互联网行业也是发展迅速,这让许多企业也随之纷纷崛起。就像新浪,网易,阿里巴巴,腾讯一样,都成为了互联网的巨头了。其中最有名的就是马云建立的阿里巴巴了。旗下的淘宝、天猫、蚂蚁金服、支付宝等,无论哪一样都给我们的生活来了非常大的便利。

或许大家对于阿里巴巴旗下的淘宝和支付宝印象最为深刻,因为我们的日常生活就经常接触到这些东西。不过对于其它的就不是非常的了解了。其实阿里巴巴还藏着一个互联网的“独角兽”。那就是阿里云。它的成长潜力可谓非常一般,可以称得上是全球的几大独角兽之一。是一个又大又快的计算机平台。

以前要回家过年的时候用支付宝买车票,服务器就经常会崩溃。可想而知过年的时候人们买车票是多么繁忙,而现在淘宝双十一比过年还要繁忙,但是服务器为什么就不会崩溃呢?原因是阿里云可以处理了每秒十几万的订单,可想而知,阿里云的成长是多么的恐怖了。那到底是谁在背后支撑这么强大的阿里云呢?

他就是阿里云的创始人王坚。可能大家并不是很了解王坚是谁,用我们的话来说就是一个非常厉害的人物,当过导师、教授、主任、编委、副院长等。这些职位都造就了现在的他。不过他刚刚在阿里巴巴创建阿里云的时候,因为技术难度非常的高,以至于他在起手的时候,每年就烧了10亿元。但是没有任何的成果,于是这位阿里云的创始人就这样不被人们看好。但唯独作为阿里巴巴老大的马云却一直在坚信着他,给予他资金以及技术的支持。最终他没有让马云失望,2014年阿里云正式上线了,并且获得了第一桶金。

王坚并没有因此而放弃了研究,为了不辜负马云的信任,自己又研发出了一个“飞天系统”。这个系统能够连接全球的互联网而组成一台超级计算机。并且打破了4项世界纪录,是世界上最顶尖的系统之一,就连美国都非常的羡慕。后面通过美国的相关机构评估,“飞天系统”的价值在60000亿,也就是说不被人们看好的阿里云创始人如今创造出了60000亿的价值。其中马云也是有着半的功劳。现在总算知道马云为什么能够铸造阿里巴巴的辉煌了。马云在眼光的方面真的非常的独到,或许人真的要遇到一个伯乐后才能成长得更快。不知道大家怎么看?

阿里云是阿里巴巴的'吗3

首先在当前时代背景下,我们看到云一字就能联想到大数据、云数据这类东西,那么阿里云也是这样,是阿里巴巴旗下的云计算公司

阿里云(全称:阿里云计算有限公司)是一家云计算及人工智能科技公司,致力于与全球领先的云计算厂商密切合作,并提供多样化的项目促成稳定巩固的长期发展。阿里云带动了中国云计算的发展,从零搭建自主的飞天系统,在天猫双11全球狂欢节、12306春运购票等应用场景中,始终保持着良好的稳定性。还曾帮助用户抵御全球互联网史上最大的DDoS攻击。阿里云最先在香港设立了第一个中国大陆以外的数据中心,而后在新加坡、美国西部和东部也先后设立了数据中心。未来,阿里云还在迪拜、欧洲、日本等地开设新的数据中心,输出中国的高科技服务。目前,阿里云在中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本等13个地域开设了数据中心

阿里云的产品共分为以下几大块:

弹性计算

这包括基础云产品,如云服务器ECS,云服务器ECS是一种可弹性扩展、安全、稳定、易用的计算服务,用户可以像用水和电一样按需购买云服务器,而不必承担高昂的服务器硬件运维成本。云服务器可以根据自己的业务实际需要随意升级或者降配,也可以根据业务高发时期临时增加带宽,让服务器的使用变得非常方便。

弹性计算的产品还包括负载均衡SLB,负载均衡SLB对多台云服务器进行流量分发服务。为了应对业务需求,企业往往会有多台云服务器提供服务器,负载均衡就是将用户的请求按照企业自定义的策略转发到最优的服务器。

数据库

云数据库RDS:完全兼容MySQL,SQLServer,PostgreSQL等,相对于云服务器,云数据库属于非必需品,因为用户完全可以在云服务器上搭建数据库。由于自身业务发展需要,将数据库独立出来,这时候就需要阿里云的RDS云数据库了。

存储

阿里云存储产品有很多种,最基本也用得最多的是对象存储,对象存储OSS:海量、安全和高可靠的云存储服务。如果企业静态文件较多(图片、视频等大文件),可以将大量的存储内容转移独立出来,放到对象存储OSS里面。

网络

CDN:跨运营商、跨地域全网覆盖的网络加速服务

专有网络 VPC:帮您轻松构建逻辑隔离的专有网络

高速通道:高速稳定的VPC互联和专线接入服务

NAT网关:支持NAT转发、共享带宽的VPC网关

2018年6月20日,阿里云宣布联合三大运营商全面对外提供IPv6服务。

除此之外,阿里云还有大数据、云安全、人工智能、域名与云通信等产品,阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的领军企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎、锤子科技等明星互联网公司。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/64356.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-02-28
下一篇2023-02-28

发表评论

登录后才能评论

评论列表(0条)

    保存