• 沒有找到結果。

[rIFK寄:的11

在文檔中 费留依照. (頁 59-62)

‘四】'

、,

'" ‘"

m回2

时时四

'''''''

1 687:揭

,.撑到

需要补充说明 点,如果数据量超过Excel窑纳范围(如 Excel 2007-2010版本最大记录数 为 1048576) ,不过只需得到统计分析结果,无须获取处理后的明细数据, 也是可以使用 Micro

soft Ouery工具迸行数据处理与分析的。在计算机配置允许的情况下, Microsoft Ouery工具也可

以处理千万级的数据 g 只是性能会变差,耗时较长。

小臼:好的,具体如何使用 MicrosoftQuery工具迸行数据处理与分析呢?

Mr 林 使用MlcrosoftOuery工具进行数据处理与分析,需要以下四步,如图 1-60所示。

[rIFK寄:的11

因 1-60 Microsoft Ouery数据处理与分析步骤 61

》 谁说菜鸟不会数据分析(工具篇)

1.2

.1 数据导入

@

建立数据源连接数据 小白 如何建立数据源以连接数据呢?

Mr 林·仍以"订购明细"、 "用户明细"文本数据为例,我们需要了解不同年龄段用户的 产品购买偏好,要用到"订购明细"表的"用户 10" 、 "产品"字段,以及"用户明细"表的

"年龄"字段,首先就是建主数据源以连接数据。

H~"' ,'l军:f___________囚I

it镰λ披露1! 8a

"Microsoft Text Oriver (*以t. 事 csv)" 项。

62

食 在第3项设置数据源所在文件夹路径,本例选择 "0\数据"。

第1 章 高安置处理千万数据

在第4项中可选择其申 个文本文件作为数据源选定默认表本例选择 H订购明 细txt'\ 单击[确定]按钮。

在[创建新数据源l对话框中设置完相应参数后,单击 [确定]按钮,返回[选择数 据源]对话框, 这时在[数据库]选项卡下就会出现一个名为 "数据" 的数据源,如 图1-61所示, 这时数据源已经设置好。

小白, Excel数据源如何建立连接。

Mr. 林, Excel数据源建立连接与文本数据源建立连接的操作步骤类似,只是选择的驱动程

序不一样, 可以只设置Excel2003版以下的数据格式,也可以设置Excel2007-2010版的数据格 式。你可以事后进行练习,我在此就不再重复阐述。

小白· 再请教个问题,图1-61所示的 [选择数据源]对话框中, 可以直接选择现有的吧x cel File俨"、 "Text Files'" 等现有数据源么?

Mr 林 可以的,步骤也类似,但是每次打开向-个Excel 、文本文件,都需要重新操作一 次,如果建立好数据源, 以后就可以直接调用,所以需要根据自己的需求选择建立 次性数据源 还是永久数据源。

小白 好的,明白了。

@

使用"查询向导"选择数据

Mr 林: 建立好数据源,接下来就使用"查询向导"选择我们所需要的数据。

返回[选择数据源]对话框,确认对话框中下方的 [使用"查询向导"创建/编辑 查询] 项被勾选上,双击[数据库]选项卡下刚建好的名为"数据"的数据源, 如 1-61 所示。

在弹出的I查询向导选择列]对话框中'将所需的

"产品"、 "数量"字段,以及"用户明细"表的"年龄"字段,分别从左边[可 用的表和列]中选择并移至右边的[查询结果中的列1 ,单击[下一步]按钮,如 1-63所示。

ES刊市...,曙 111

t:l1

到一一」旦旦~ ---..I!丐百τl一旦旦」

图 1-63 Microsoft Query [查询向导选择列l对话框 63

》 谁说菜鸟不会数据分析(工具篇)

'mB.03

在弹出的警告提示框申(如图1-64所示) ,单击 [确定]按钮, 将出现如图 1-65所示 的Microsoft Query查询操作界面。

么?

11

~~G是号费M?'旗"础-'&.I!:IfJ*削....在陆可』仲的,

口重J ....!堕」

图 1-64 Mlcrosoft Query 警告提示框

图 1-65 Mlcrosoft Query查询操作界面 1

Mr 林 小白,你来看一下,从图 1.65所示的 MicrosoftQuery查询操作界面可以发现什

小自认真地看了一会后兴奋地跳起来 Mr 林,我发现了

①"订购明细"与"用户明细"两个表之间没有建立关系。

套"用户10" 与"年龄"没有对应,出现同 个用户有不同年龄信息。

在文檔中 费留依照. (頁 59-62)