对于数据分析新手来说,最核心的是业务,通过业务的分析逻辑影射到数据分析的处理逻辑,而数据分析工具则是帮助我们实现结果的手段。
但是,你说工具不重要吧,他又很重要,对应数据分析的不同环节,也要选择不同的工具,甚至选择更容易上手,下面我就推荐四个适合新手入门的数据分析工具:
一、Excel
适用场景:
- 一般的办公需求下的数据处理工作;
- 中小公司数据管理,存储(很多国有企业都用);
- 学校学生,老师做简单的统计分析(如方差分析,回归分析);
- 结合Word,PowerPoint制作数据分析报告;
- 数据分析师的主力分析工具(部分数据分析师的辅助工具);
- 部分商业杂志,报刊图表制作(数据可视化);
优点:
- 容易上手;
- 学习资源十分丰富;
- 可以用Excel做很多事情,建模,可视化,报表,动态图表;
- 帮助你在进一步学习其它工具之前(比如Python,R),理解很多操作的含义;
缺点:
- 深入学习需要掌握VBA,难度还是很高;
- 当数据量较大时,会出现卡顿的情况;
- 到Excel2016版,在不借助其它工具的情况下,Excel数据文件本身能够容纳的数据仅有108万行,不适合处理大规模数据集;
- 内置统计分析种类太简单,实用价值不大;
- 不像Python,R语言等开源软件,正版Excel需要付费,比如我用office365.每年需要支付300多块钱(不过也值了)
二、R语言
使用场景:
通过扩展的第三方R包,R能够做的事情几乎涵盖了任何需要数据的领域。就我们一般的数据分析或者学术数据分析工作而言,R能做的事情包括但不限于如下方面:
- 数据清洗与整理;
- 网络爬虫;
- 数据可视化;
- 统计假设检验(t检验,方差分析,卡方检验等);
- 统计建模(线性回归,逻辑回归,树模型,神经网络等);
- 数据分析报告输出(Rmarkdown);
那么R容易学吗?
从我个人来看,想要入门R是非常简单的,10天的集中学习,对于掌握R的基本使用,基本数据结构,数据导入导出,简单的数据可视化,是完全没有问题的。有了这些基础,在遇到实际的问题时,去找到需要使用的R包,通过阅读R的帮助文档,以及网络上的资料,就能够相对快速的解决具体问题了。
三、Python
R语言和Python同为需要编程的数据分析工具,所不同的是,R专门用于数据分析领域,而科学计算与数据分析只是Python的一个应用分支,Python还可以用来开发web页面,开发游戏,做系统的后端开发,以及运维工作。
现在的一个趋势是,Python在数据分析领域正在追赶R,在某些方面已经超越了R,比如机器学习,文本挖掘等偏编程的领域,但R语言在偏统计的领域仍然保持优势。
Python在数据分析方面的发展,很多地方借鉴了R语言中的一些特色。所以,如果你现在还是一片空白,还没开始学习,要做决定学习R还是Python的话,建议从Python入手。
Python和R都比较容易学习,但是如果你同时学习两者,由于在很多地方它们非常相似,就会很容易混淆,所以建议不要同时学习它们。等其中一个掌握到一定的程度,再着手学习另外一个。
Python能做什么?
- 数据爬取,使用Python能够很容易的编写强大的爬虫,抓取网络数据;
- 数据清洗;
- 数据建模;
- 根据业务场景和实际问题构造数据分析算法;
- 数据可视化(个人感觉不如R好用);
- 机器学习,文本挖掘等高级数据挖掘与分析领域;
应该学习R还是Python?
如果因为时间有限,只能选择其中的一种来学习的话,我建议使用Python。但我仍然建议两者都了解一下,毕竟每个人都不一样。可能你在某些地方听说,Python在工作中更加常用,但是工作中,解决问题才是最重要的,如果你能够用R高效的解决问题,那就用R。
实际上,Python很多数据分析方面的特色,是模仿R来实现的,比如pandas的数据框,正在开发中的ggplot可视化包模仿的是R语言中非常著名的ggplot2.
四、BI工具
多数分析师日常的工作就是做报表,而数据分析师更多用到的报表是BI。
BI全称商业智能,在传统企业中,它是一套完整的解决方案。将企业的数据有效整合,快速制作出报表以作出决策。涉及数据仓库,ETL,OLAP,权限控制等模块。
BI工具主要有两种用途:一种是利用BI制作自动化报表,数据类工作每天都会接触大量数据,并且需要整理汇总,这是一块很大的工作量。这部分工作可以交给BI自动化完成,从数据规整、建模到下载。另外一种是使用其可视化功能进行分析,BI的优点在于它提供比Excel更丰富的可视化功能,操作简单上手,而且美观,如果大家每天作图需要两小时,BI会缩短一半时间。
BI作为企业级应用,可以通过它连接公司数据库,实现企业级报表的制作。这块涉及数据架构,就不深入讲了。
关于BI,像Tableau、PowerBI、FineBI、Qlikview这类BI(商业智能)工具,涵盖了报表、数据分析、可视化等多层。底层还可于数据仓库衔接,构建OLAP分析模型。
个人觉得,要想快速上手数据分析,前期数据思维的养成,BI工具无疑是最容易上手的。
数据分析工具其实有很多种,对应不同类型的使用者也有各自适合的选择。例如懂数据算法计算机语言的人,可能给他一款,填写算法代码流畅的分析软件就是有效。掌握了数据分析专业技能的人,强大的分析功能能将工作做到事半功倍,不管看着功能多复杂。还有就是我这种非计算机专业出身,非统计学出身,但工作做还需要对大量数据进行分析的人。
如果你跟我一样,那么可以看下我的解答。
我总结了下,我以前找分析工具的时候,自己先想了几个方向点:
1、好上手。一看板面就知道怎么导入数据,怎么做图表,怎么排版的。这样的高效。
2、功能还得强大的.毕竟是非专业人士了,找分析工具就是为了充分发挥工具自身能动性,和强大功能,来给我们创造价值的,特别是涉及到数据大量、复杂,必须有给力的功能支撑才能是良心工具。
3、可视化呈现要好一点,就是图表要高大上的。数据分析报告得拿出手,图表的展现就是第一门面。包装的意识还是要有的。
所以结论就是找一些操作容易、功能强大、图表颜值还得好的工具了。我就是照着这个思路找的,也用过几个,可以给大家说说。像东软做的Dataviz,是用着比较顺手的了。具体介绍我就摘抄下,自己懒得码那么多字
DataViz数据可视化分析工具,不需要编写代码,也不需要任何程序设计基础,用户可以通过简单的拖拽就可以实现数据可视化展示与分析。DataViz使用简单,但是实现的功能却不简单,上百种丰富的炫酷图表,可以实现数据的多维度多层次分析。
上图先,先看些基本图
各种数据分析好后,可以做成组合图册:
重点就是操作起来简单,拖拖拽拽的,看起来特别复杂的图表,其实拼贴一下就能搞定了。操作面板基本本国人都可以分分钟用起来。
如果是专业人士或者计算机大拿的,估计可以寻找更复杂的工具进行尝试了。但不适合我,所以我这里就不进行推荐了。
原创文章,作者:普尔小编,如若转载,请注明出处:http://www.puerpx.cn/pxwd/8602.html