数据分析常见的误区有哪些?

数据分析常见的误区有哪些?,第1张

1、数据必定客观

其实数据也会骗人,举个例子,二战时英军发现从战场飞回来的战机,机身上的弹孔比引擎和油箱上的要多得多,依据这个数据很简单得出要加强机身的防护的主张。但现实的本相是引擎和油箱上中弹的飞机现已回不来了更应加强引擎和油箱的防护,这就是常说的“幸存者偏差”。

2、过度依靠数据

关于事务决策来说数据剖析只是辅助手法,而不是核心推动力。许多数据是无意义的,过度依靠数据于决策无益甚至会引导上级做出过错的决策。

3、小看事务

数据剖析初学者极易犯的过错,只懂技能不懂事务不能真正了解事务需求。许多新手认为工作中只需要兢兢业业敲代码就行,无数SQL boy/girl就这么诞生。好的剖析师既懂技能又懂事务。由于技能为事务服务,公司衡量技能的价值不在于剖析技能有多高超而是对事务有没有贡献。

4、忽略功率

数据剖析是整个商业活动的一环,而商业是寻求功率的。许多新人简单陷入寻求完美算法的圈套,放着简单的计划不必,非要花大量时刻在钻数据算法的牛角尖上,最后交出一份领导懒得看的长文报告。

5、“套路式”剖析

在数据剖析学习时或许习惯了各种解题套路,但实操时其实并不存在通用的剖析套路。不同的行业、不同的事务,不同的阶段,哪怕用的是同一种剖析办法结论都应有所区别。

1、数据分析需要大量投资

如今,似乎对每一项新技术的投入都必须通过严格的财务支出的筛选过程。“它需要多少费用?”——是IT和业务经理在提议启动项目或部署新工具时需要首先考虑的问题之一。

有些人认为数据分析本质上是一项代价高昂的工作,因此仅限于拥有大量预算或大量内部资源的企业机构。但是事实并非如此,现在市场上有很多开源工具和其他工具能够帮助展示数据分析的价值并且基于云系统的大数据架构,也会比传统的数据仓库便宜得多。你只需要明确内部数据存储以及要解决的问题,就可以轻松的在云上使用分析来解决业务问题。

此外,数据分析通常用于实现三个结果:提高流程效率、实现收入增长和主动进行风险管理,总的来说,数据分析在任何公司的应用中都带来了巨大的成本效益。

2、你需要“大数据”才能执行分析

对于许多人来说,大数据和分析的概念是相辅相成的,企业需要在执行分析之前收集大量数据,以便生成业务洞察,改进决策制定等。

当然,大数据分析的优势也很明确,拥有这些资源的公司利用大数据存储作为促进分析工作的一部分,获得了显着的竞争优势。但是大数据却并不是分析必不可少的搭配。

分析师需要特定的数据,而不是更多的数据。要想更好地支持决策和提高绩效,企业必须更多的考虑业务用户,确定他们需要访问哪些数据,如何呈现数据,而不是关注更多的数据。95%以上的用户会寻找和他们工作相关的信息来支持他们进行决策,来提高业务表现,所以企业需要以最简单的格式向他们提供这些信息,帮助他们快速定位重要信息。

3、分析消除了人类的偏见

自动化系统执行的方式不应该存在偏见,但技术是由人类建立的,因此消除所有偏见几乎是不可能的。

有些人认为分析和机器学习消除了人类的偏见,不幸的是,这并没有实现。算法和分析使用“训练数据”进行调整,并将重现“训练数据”所具有的任何特征,在某些情况下,这会在分析过程中引入良性偏见,但也有可能带来更严重的偏见——因为“算法这么说”并不意味着答案是公平的或者有用的。

4、最好的算法意味着绝对的胜利

事实证明,有了足够的数据,有时算法无关紧要。谷歌的工程师认为,数据有着不合理有效性 ,简单的统计模型,加上极大量的数据,比包含大量特征和总结的“智能优越模型”能输出更优质的结果。

因此,在某些情况下,只需处理更大量的数据就可以获得最佳效果。

5、算法是安全的

人们固执地信任统计模型和算法,并且随着分析程序的组织构建,他们会越来越依赖复杂的模型来支持决策。这或许是因为用户并不觉得他们有能力挑战模型,因此他们必须相信构建它们的“聪明人”。

比如,在过去的50到60年里,我们反复听到“人工智能将在20年内接管人类工作”的言论,现在也还是有人反复强调这种观点。在我们可以完全信任机器学习和它们输出的结果之前,还有很多事情要做。在那之前,我们需要挑战构建算法和模型的人,让他们解释如何得到答案。这并不是说我们不能依赖于结果,而是说我们需要透明度,这样我们才可以信任和验证分析结果。


欢迎分享,转载请注明来源:夏雨云

原文地址:https://www.xiayuyun.com/zonghe/102120.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-03-09
下一篇2023-03-09

发表评论

登录后才能评论

评论列表(0条)

    保存