第2章玩转数据分析
在Mr.林的悉,心指导下, 小白对大型数据的处理能力得到大幅提升, Access数据库、 Microsoft Ouery都不在话下。
Mr 林 小白, 数据处理的下一步是什么?
小白脱口而出: 数据分析,它主要有三大作用 现状分析、原因分析与预测分析。
Mr 林: 没错 l 那你通常是用什么分析工具来实现呢?
小白嘟着嘴: 您又不是不知道, 大多数情况下我是用Excel的数据透视表进行汇总分析,可
是数据量 大, 它就跑末动了。幸好有您传授的两大法宝 Access数据库和Microsoft Ouery ,可 以使用SOU喜旬进行查询汇总分析。
Mr 林- 嗯,数据分析方法归纳起来主要有两大类。
一类是呈现现状的描述性分析, 主要通过对比与细分送行现状及原因分析。可以制作数据透 视表,通过求和、求均值以及数据分组了解其构成, 甚至通过不同时间维度的对比,查找数据变 化的原因,最后制作相关图表对现状进行呈现及描述。
另一类是展望未来的预测性分析, 主要分析现有数据间的相关哇,探寻数据之|可存在的联 系, 并进一步通过建立相关回归模型的方式对未来进行合理的预测。
小臼.确实如此。
Mr林:鉴于你对Excel 的操作已是轻车熟路了,所以今天就带你进 步熟悉两款数据分析利 器。它们都是基于Excel 环境的数据分析工具 一个是侧重于描述性分析的PowerPivot; 另 个是 侧重于攘断统计分析的Excel数据分析工具库。
小白机灵地说: 喔 Mr 林,快快传授给我,好让我替您分担分析工作。
Mr林很受用.你这丫头,小嘴真甜,我们就从PowerPivot 开始吧。
2.1 Excel数据分析工具一- PowerPivot
2.1.1
PowerPivot是神马小白 PowerPivo
t?
Mr林 , lfE 拼错了吧!Mr 林:没拼错, 就是PowerPivot , 简称PP0 PowerPivot是微软在Excel2010中新增的一个插 件工具。在PowerPivot中, Excel的行、列限制已被取消,这样我们能方便地操作更大型的数据, 也就是说摘走了PowerPivot,别说是1万多行的数据, 就是100万行都是小菜一碟。到时候你就可 以大喊, 让数据来得更猛烈些日1'"
71
72
》 谁说菜鸟不会数据分析(工具篇)
小臼怀疑地嘟晾着·是不是真的啊?
Mr 林 当然,认识我这么久,我什么时候骗过你呢?
小自想了想:虽然这可以有,但还真是没有。
@
功能Mr 林接着在自板上画起来:我们现在就来认识下 PowerPivotQ~I 它的核心杀伤力表现在如 图 2-1 所示的囚个方面
图 2-1 PowerP,vot 四大优势
*整合多数据i原 PP可以从几乎任意地方导入任意数据源中的数据,包括Web服务、文本 文件、关系数据库等数据源。
食处理海量数据 可以轻松组织、连接和操作大型数据集中的衰,处理大型数据集(通常 几百万行)时所体现的性能就像处理几百行 样。
食操咋界面简洁 通过使用固有的 Excel 2010 功能(例如数据透视表、数据透视图、
切片器等) ,以交互方式浏览、分析和创建报表,只要我们熟悉 Excel ,就可以使用
PowerPivot。
食实现信息共享 PowerPivot for SharePoint可以共享整个团队的工作簿或将其发布到
Web 。
小自昕得一愣一愣的,还没缓过神来 Mr 林,我还有个问题 , !'t 之前已经教我如何用 Access、 Microsoft Query处理大型数据,现在又加上这个PowerPivot ,这三个工具分别在什么时 候使用呢。
Mr 林:嗯,你这个问题间得好 l 擅于提问是数据分析师必备的基本素质之-。我们先来对 比一下这三个工具的优势及不足之处,如圈 2-2所示。
第2童玩转数据分析
l 工具 优点 | 缺点 E
·擞但处理能力轻强
·数据超干万条时性能会下降 AA;幢幢醺蟹摩 ·使用SQl处理鼓露较为灵活
·使用 SQl分析披露坏如透凯轰灵活
·适合5QL初学者学习SQL语句
M 阻,。因ft Q且居ry
PowerPivot
·适合SQl初学者学习 SQl语句 ·撒据处理性能弱子Access数据库
图 2-2 三个数据处理分析工具优劣势对比
Mr 林:每个工具都有自己的优势及劣势,通过以上三种工具优势与劣势的对比,我打]可以
了解采用PowerPivot进行数据处理分析的几种情况,如图 2-3所示。
图 2-3 PowerPivot适用条件 小白 太强大 7' 赶紧教教我 l
@
安后Mr 林:另 IJ 着急,咱先给 Excel 装上 PowerPivot分析工具 l (1 )安装准备条件
PowerPivot可安装在32位或64位版本Excel2010的计算机上,所以需要根据使用的计算机情 况选择相应版本迸行安装。
(2
)安装过程E 打开 Microsoft网站 http://川 microsoft ∞m/zh-cn/download/details 叫川id=29074
(短链接 http://t.
cn/zWt2duL )。选择下载对应版本的 PowerPivot_for_ Excel. msi安装程序(x86(32位)/x64 (64位)版本)。
73
》 谁说菜鸟不会数据分析(工具篇)
双击己下载的文件PowerPivoUor_ Excel. msi , 以启动安装向导。
单击
I
下一步]
按钮进入安装向导,接受许可协议,然后一直单击[
下一步]
按钮,直 到安装完成o~
启动Exce12010,可以看到Excel功能区出现[
PowerPi叩门选项卡。此时, PowerPivot分析工具己安装成功。
@
界面Mr林 单击
[
PowerPivot1
选项卡[
启动]
组中的[
PowerPivot 窗口]
按钮,送入 PowerPivot窗口界面,如图2-4所示。p ;J~!、;;a....u.Micto由ft &Cel 到 M