考 下你,前面在学习 Access数据库曰期分组时,咱们学过用哪个函数进行曰期分组呢?
2.2 Excel数据分析工具库
2.2.1 分析工具库简介
小白一昕到有新的分析工具就来劲了·好啊 '2 有什么作用?与 SPSS 、 SAS 等专业统计软 件相比,它有什么优势与劣势呢?
@
分析工具库的作用Mr 林耐心地说道 通常大家在用 Excel远行数据统计分析,尤其是统计预测类分析时, 经常 会使用到 些函数,简单的函数如 SUM (求和) ,稍复杂的函数如 STDEV (标准偏差) ,再复 杂一些的函数如 CORREL( 相关系数)、 UNEST (线性回归)等, 这些统计函数不仅多,而且需 要设置的参数也比较复杂,如果不熟悉统计理论,很可能会被它们搞得晕头转向。
为了方便我们迸行数 t据居统计分析, Ex沁ce创|提供了一个数据分析加载工具 分析工具 库
数据手和日参数'该工具就会使用适当的统计函数,在输出表格中显示相应的结果。其中有些工具在 生成输出表格时还能同时生成图表。
Excel分析工具库可以完成的数据统计分析包括 描述统计、直方图、相关系数、移动平 均、指数平滑、回归等19种统计分析方法, 后面我会介绍Excel分析工具库中常用的统计分析。
小白兴奋地说 太好了,之前我就被这些统计函数绕晕了,花了N多时间处理、分析数据, 现在就不用愁啦 l
91
92
》 谁说菜鸟不会数据分析(工具篇)
@
优势与劣势M r.林 使用 种数据分析工具之前,我们需要了解它的优势与劣势,以便更好地发挥出它
的最大价值。与主流的专业统计分析软件SPSS 、 SAS等相比, Excel分析工具库的优点在于 食 与Excel无缝结合,操作简单、容易上手。
"Excel加载项如图 2-26所示。
E.u.I~~ ¥'liiEiI
自军λE疆军 Moo:.ow Ft.~qlS阴轨....Da14~,帽,。精臼l.u:cl.COIW四,,,、~or_.d e..." elm昆'" '1 肘问主~F 晤市晴 O:\"'L>.. lm 插琅!
也晕 日内吨,~阴险,,..矶.Micf"QKlftAne)-,;, ~呻销、ASbc~ζ..耐川 tyloc.osoftAr咄咄自明H. Mock怪,后..,dl id..四叶酬 民'" M<刷刷呻'õe...r >'o睛,民啕譬如Micro <l>hhu
」→~I 恒生堕哩丑1 -.,... :1
~→...寸
图 2-26 [ Excel ìí't项}对话框
第2章玩转数据分析
陪;"'03 单击
[
转到]
按钮, Excel会弹出[
加载宏]
对话框,勾选需要安装的加载宏-[
分析工具库]复选框,若要包含分析工具库的VBA函数,贝IJ 同时勾选[分析工具库
VBA) ,单击[确认]按钮,即可完成加载安装,如图 2-27所示。
""囊~
富旦
[@动化也〉
| 制工陆
盘 S明于统叶相工程?当听窗抽倒给.'"工具图 2-27 [加载宏],对话框
Mr 林 安装成功后,在{数据]选项卡 [分析]组中, 即可看到[数据分析l按钮,单击 此按钮 E 即可弹出[数据分析]对话框,它提供各种统计分析方洼,如图 2-28所示。
.!... 委餐霉. . 句侨氧量工翼xu-MicrQ四 ft Úo:c~ 自国
h 画 A
企 主Bi ~!
:1]
i 毡.. M}昆·
9..
-".,
i~肇事重-r'~O
L 德Jr::::10巳二2
图 2-28 [数据分析]对话框
Mr 林.小白,前面我们提到实现数据分析三大作用的分析方法归纳起来主要有两大类 93
》 谁说菜鸟不会数据分析(工具篇)
类是描述性统计分析,另一类是推断性预测分析。这里先来了解一下,这个 Excel分析工具库中 各种统计分析方法分别对应于哪一类统计分析方法呢?
说着, Mr 林在记事本上画了起来, Excel数据分析工具库各种统计分析方法归纳如图2-29所
可飞。
-11活}i~lì~
图 2-29 Excel分析工具库中各统计分析方法归纳
小白恍然大悟 Mr林, 经您这么一梳理,各种统计分析方法之间的逻辑关系 下就清晰
了。我就像 个困惑的小和尚, 经过您这样的得道高僧一指点,顿时领悟开窍。
Mr 林笑道:哈哈!你这个比喻也太夸张 7 。接下来就着重讲解Excel分析工具库中常用的几 个统计分析方法。
小白: 好的。
2.2.2 描述性统计分析
Mr 林:小白,现在我们 起学习通过Excel分析工具库进行描述性统计分析。
描述性统计分析是统计分析的第-步,只有先做好这 步,才能进行正确的统计推断分析。
描述统计分析的常用指标主要有平均数、方差、中位数、众数、标准差、方差等,提供分析对象 数据的集中程度和离散程度等信息。
我们以某公司"用户消费数据"为例,利用用户消费金额这个变量来简述用户消费行为特 征, 分析了解用户消费分布。
小白快速反应道· 可以通过榈关统计函数如 求和、平均值、最大(小)值、中位数、众数
等来描述它的数据特点。
Mr 林:没错,我们现在不用 Excel 的统计函数来处理,而是用
Excel分析工具库一一"描述统
计"分析工具来进行分析, 步即可实现这些描述性统计函数的相关功能,操作简单,并且不容94 易出错。
第2章 玩转数据分析
我们现在就来看看如何用"描述统计"分析工具来进行分析。
单击[数据l选项卡[分析]组中的[数据分析l按钮。
理~æ.. 在弹出的[数据分析]对话框中,选择[描述统计], 单击[确定]按钮,如图 2-30
所示。
图 2-30 [数据分析J;对话框
$1B'臼『 在弹出 [描述统计]对话框中,对各类参数分别进行如下设置, 如图2-31所示。
100285 7 100290 7356 8 100336 5094
10 100405 6462
11 10 100410 8008
12 11 100482 6933 毓出埠国
13 12 100539 2170
•
c凶I8Il1即l
‘
13 100553 1954 额工作量民组由15 14 100623 5993 领工作?事也》
16 15 100626 3642 , LSllR\tili)
17 16 100819 4343 J 早金钥位置情~1Il 95
‘
18 17 100858 3207 'ii! ,大僵 ω 5
'ii! ,小(J il) -5--~
19 18 1∞909 2351 20 19 100996 6244
'"噜 F、叫.nAr、
一
图 2-31 描述统计l参数设置对话框
输入
①输入区域 输入需要分析的数据源区域,主日本例中数据源区域为C1C101(注 对话框参 数会自动设置为单元格绝对号|用,为便于|凋i虫,后面在讲解操作步骤时均不带有绝对号|
用符号"$" )。
②分组方式 选择分组方式,如果需要指出[输入区域l中的数据是按行还是接列排列 95
》 谁说菜鸟不会数据分析(工具篇)
第2章玩转数据分析
费金额为5098元,用户的最高消费金额达到8886元,最低消费金额仅为1044元。
Mr 林进行补充:没错,楼下来我们可以对用户消费能力迸行如下详细解析。
①表现数据集中趋势的指标有 平均值、中位数、众数。平均值是N个数相加除以 N ,所 得到的结果,中位数是 组数据按大小排序,排在中间位置的数值,众数是该组数据中 次数出现最多的那个数值。本伊j这些用户平均消费金额为 5098。
②描述数据离散程度的指标有 方差与标准差,它们反映的是与平均值之间的离散程度。
③呈现数据分布形状的指标有 峰度系数与偏度系数。
峰度系数是描述对称分布曲线峰顶尖峭程度的指标,是相对于正态分布而言的。峰度系 数 >0 , 两侧极端数据较少,比正态分布更高更瘦,呈尖峭峰分布!峰度系数 <0 ,表示两侧极端 数据较多,比正态分布更矮更胖,呈平阔峰分布。如图 2-33所示,尖山肖峰分布、正态分布、平阔 峰分布很清晰地区分出来。
八
...r l >\òti!itt至1
图 2-33 峰度分布示意图
偏度系数是以正态分布为标准来描述数据对称性的指标。偏度系数 =0 ,就是分布对称 2 如 果频数分布的高峰向左偏移(偏度系数 <0) ,长尾向右侧延伸称为正偏态分布?同样的,如果 频数分布的高峰向右偏移(偏度系数 >0) ,长尾向左延伸则成为负偏态分布。偏度系数大于1 或 小子-1 , 被称为高度偏态分布 ; i宿度系数在0.5-1 或-0.5 --1 范围内,被认为是中等偏态分布 1 偏度系数越接近0 ,偏斜程度就越低。如图 2-34所示,正偏在、分布、正态分布、负偏态分布很清 晰地区分出来。
本例中,峰度系数<0且偏度系数<0 ,所以这些用户消费数据呈现为平阔峰式正偏态分布。
小白激动不巴: 多谢 Mr 林的详细介绍,让我更深刻地了解描述统计量之间的关系。 97
98
》 谁说菜鸟不会数据分析(工具篇)
I
!:l1U至1图 2-34 偏度分布示意图