大数据是指什么?

大数据是指什么?,第1张

数据是指在一定时间内,常规软件工具无法捕捉、管理和处理的数据集合。它是一种海量、高增长、多元化的信息资产,需要一种新的处理模式,以具备更强的决策、洞察和流程优化能力。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些有意义的数据进行专业的处理。换句话说,如果把大数据比作一个行业,这个行业盈利的关键在于提高数据的“处理能力”,通过“处理”实现数据的“增值”。

从技术上讲,大数据和云计算的关系就像硬币的正反面一样密不可分。大数据不能用单台计算机处理,必须采用分布式架构。其特点在于海量数据的分布式数据挖掘。但它必须依赖云计算分布式处理、分布式数据库、云存储和虚拟化技术。

扩展信息:

大数据只是现阶段互联网的一个表征或特征。没有必要将其神话或保持敬畏。在以云计算为代表的技术创新背景下,这些原本看似难以收集和使用的数据开始被轻松使用。通过各行各业的不断创新,大数据将逐渐为人类创造更多的价值。

是体现大数据技术价值的手段,是进步的基石。这里从云计算、分布式处理技术、存储技术、感知技术的发展,阐述大数据从采集、处理、存储到形成结果的全过程。

实践是大数据的终极价值。在这里,我们从互联网大数据、政府大数据、企业大数据、个人大数据四个方面来描绘大数据的美好图景和将要实现的蓝图。

01

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

什么是大数据

大数据指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据历史和当前考虑因素

虽然术语“大数据”相对较新,但收集和存储大量信息以进行最终分析的行为已经很久了。这个概念在 21 世纪初获得了动力,当时行业分析师 Doug Laney 将现在主流的大数据定义表达为三个 V:

1.卷,组织从各种来源收集数据,包括业务交易,社交媒体和来自传感器或机器到机器数据的信息。在过去,存储它将是一个问题 – 但新技术(如 Hadoop)减轻了负担。

2.速度,数据以前所未有的速度流入,必须及时处理。RFID 标签,传感器和智能电表正在推动近乎实时处理数据的需求。

3.品种,数据有各种格式 – 从传统数据库中的结构化数字数据到非结构化文本文档,电子邮件,视频,音频,股票报价数据和金融交易。

在 SAS,我们在大数据方面考虑两个额外的维度:

1.变化性,除了速度和数据种类的增加之外,数据流还可能与周期性峰值高度不一致。社交媒体中有什么趋势吗?每日,季节性和事件触发的峰值数据负载可能难以管理。非结构化数据更是如此。

2.复杂,今天的数据来自多个来源,这使得难以跨系统链接,匹配,清理和转换数据。但是,有必要连接和关联关系,层次结构和多个数据链接,否则您的数据可能会迅速失控。

为什么大数据很重要?

大数据的重要性不在于您拥有多少数据,而在于您使用它做了多少。您可以从任何来源获取数据并进行分析,以找到能够降低成本,减少时间,新产品开发和优化产品,以及智能决策的答案。将大数据与高性能分析结合使用时,您可以完成与业务相关的任务,例如:

1.近乎实时地确定故障,问题和缺陷的根本原因;

2.根据客户的购买习惯在销售点生成优惠券;

3.在几分钟内重新计算整个风险组合;

4.在欺诈行为影响您的组织之前检测它。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/17657.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-02-13
下一篇2023-02-13

发表评论

登录后才能评论

评论列表(0条)

    保存