本步骤通过BI报表原始数据,分析10大用户关注最多的产品和10大用户评价最差的商 品,然后通过作业定期调度执行并将结果每日导出到表中,以支撑信息分析。
分析 10 大用户关注最多的产品
步骤1 登录DGC控制台。选择对应工作空间的“数据开发”模块,进入数据开发页面。
图1-8 选择数据开发
步骤2 创建一个DLI SQL脚本,以通过DLI SQL语句来创建数据表。
图1-9 新建脚本
步骤3 在新建脚本弹出的SQL编辑器中输入如下SQL语句,从OBS原始数据表中计算出10大用 户关注最多的产品,将结果存放到top_like_product表。
FROM action
JOIN product ON (action.product_id = product.product_id) WHERE
action.type = 'like' group by
brand ORDER BY like_count desc LIMIT
10
图1-10 脚本(分析 10 大用户关注最多的产品)
关键参数说明:
● 数据连接:步骤3中创建的DLI数据连接。
● 数据库:步骤5中创建的数据库。
● 资源队列:使用提供的默认资源队列“default”。
步骤4 脚本调试无误后,点击“保存并提交版本”保存该脚本,脚本名称为
“top_like_product”。在后续开发并调度作业会引用该脚本。
步骤5 脚本保存完成且运行成功后,您可通过如下SQL语句查看top_like_product表数据。您 还可以参考图1-11,下载或转储表数据。
SELECT * FROM top_like_product
图1-11 查看 top_like_product 表数据
----结束
分析 10 大用户评价最差的商品
步骤1 登录DGC控制台。选择对应工作空间的“数据开发”模块,进入数据开发页面。
图1-12 选择数据开发
步骤2 创建一个DLI SQL脚本,以通过DLI SQL语句来创建数据表。
图1-13 新建脚本
INSERT
OVERWRITE table top_bad_comment_product SELECT
DISTINCT product_id, comment_num, bad_comment_rate FROM
comment WHERE
comment_num > 3 ORDER BY
bad_comment_rate desc LIMIT
10
图1-14 脚本(分析 10 大用户评价最差的产品)
关键参数说明:
● 数据连接:步骤3中创建的DLI数据连接。
● 数据库:步骤5中创建的数据库。
● 资源队列:使用提供的默认资源队列“default”。
步骤4 脚本调试无误后,点击“保存并提交版本”保存该脚本,脚本名称为
“top_bad_comment_product”。在后续开发并调度作业会引用该脚本。
步骤5 脚本保存完成且运行成功后,您可通过如下SQL语句查看top_bad_comment_product 表数据。您还可以参考图1-15,下载或转储表数据。
SELECT * FROM top_bad_comment_product
图1-15 查看 top_bad_comment_product 表数据
----结束
开发并调度作业
假设在OBS中原始BI报表是每日更新的,我们希望每天更新分析结果,那么这里可以 使用DLF作业编排和作业调度功能。
步骤1 登录DGC控制台。选择对应工作空间的“数据开发”模块,进入数据开发页面。
图1-16 选择数据开发
步骤2 创建一个DLF批处理作业,作业名称为“BI_analysis”。
图1-17 新建作业
图1-18 配置作业
步骤3 然后进入到作业开发页面,拖动两个Dummy节点和两个DLI SQL节点到画布中,选中 连线图标 并拖动,编排图1-19所示的作业。
图1-19 连接和配置节点属性
关键说明:
● Begin(Dummy节点):不执行任何操作,只作为起始点的标识。
● top_like_product(DLI SQL节点):在节点属性中,关联分析10大用户关注最多
的产品中开发完成的DLI SQL脚本“top_like_product”。
● top_bad_comment_product(DLI SQL节点):在节点属性中,关联分析10大用
户评价最差的商品中开发完成的DLI SQL脚本“top_bad_comment_product”。
● Finish(Dummy节点):不执行任何操作,只作为结束点的标识。
步骤4 作业编排完成后,单击 ,测试运行作业。
步骤5 如果作业测试运行正常,单击画布空白处,在右侧的“调度配置”页面,配置作业的 调度策略。
图1-20 调度配置
说明:
● 调度属性:2022/02/09至2022/02/28,每天1点执行一次作业。
● 依赖属性:可以配置为依赖其他作业运行,本例不涉及,无需配置。
● 跨周期依赖:可以选择配置为依赖上一周期或者不依赖,此处配置为不依赖即 可。
步骤6 最后保存并提交版本(单击 ),执行调度作业(单击 )。实现作业每天自动运 行,BI报表分析结果自动保存到“top_like_product”和
“top_bad_comment_product”表。
步骤7 您如果需要及时了解作业的执行结果是成功还是失败,可以通过数据开发的运维调度 界面进行查看,如图1-21所示。
图1-21 查看作业执行情况
步骤8 数据开发还支持配置通知管理,可以选择配置当作业运行异常/失败后,进行短信、邮 件、控制台等多种方式提醒,此处不再展开描述。
----结束
至此,基于电商BI报表的数据开发流程示例完成。此外,您还可以根据原始BI报表数 据,分析用户的年龄分布、性别比例、商品评价情况、购买情况、浏览情况等,为营 销决策、广告推荐、信用评级、品牌监控、用户行为预测等提供高质量的信息。
2 基于电影评分的数据集成与开发流程
2.1 示例场景说明
本实践通过DGC服务的数据集成CDM组件、数据开发DLF组件和数据仓库服务
(DWS)对电影评分原始数据进行分析,输出评分最高和最活跃Top10电影。您可以 学习到数据集成模块的数据迁移和数据开发模块的脚本开发、作业开发、作业调度等 功能,以及DWS SQL基本语法。
说明
本入门示例涉及DGC批量数据集成、管理中心和数据开发模块,DGC各版本均可以满足使用要 求(试用DGC的基础版时,需要在另购CDM集群后再操作本示例)。
操作流程如下:
1. 准备工作,包括使用DGC前的准备、数据源准备、数据湖准备和认证数据准备。
2. 创建数据迁移作业,OBS数据迁移到DWS。
3. 数据开发,包含创建DWS SQL脚本和开发作业。
–
创建DWS SQL脚本top_rating_movie(用于存放评分最高的Top10电影)
–
创建DWS SQL脚本top_active_movie(用于存放最活跃的Top10电影)
–
开发并调度作业,通过编排作业和配置作业调度策略,定期执行作业,使得
用户可以每天获取到最新的Top10电影结果。
2.2 步骤 1:准备工作
使用 DGC 前的准备
如果您是第一次使用DGC,请参考准备工作章节完成注册华为云帐号、购买DGC实 例、创建工作空间等一系列操作。然后进入到对应的工作空间,即可开始使用DGC。
为方便演示,本示例提供了用于模拟原始数据的部分数据。为了方便将源数据集成到 云上,我们需要先将样例数据存储为CSV文件,将CSV文件上传至OBS服务中。
步骤1 创建CSV文件(UTF-8无bom格式),文件名称为对应的数据表名,将后文提供的各样 例数据分别拷贝粘贴到不同CSV文件中,然后保存CSV文件。
以下是Windows下生成.csv文件的办法之一:
1. 使用文本编辑工具(例如Sublime Text,Notepad++等)新建一个文档,将后文 提供的样例数据拷贝进文档中。注意拷贝后检查下数据的行数及数据分行的正确 性。(注意,如果是从PDF文档中拷贝样例数据,单行的数据过长时会产生换 行,需手动重新调整为单行)
2. 选择“格式 > 以UTF-8无BOM格式编码”。
3. 选择“文件 > 另存为”。
4. 在弹出的对话框中输入文件名后,以CSV格式保存该文件。
步骤2 将源数据CSV文件上传到OBS服务。
1. 登录控制台,选择“存储 > 对象存储服务 OBS”,进入OBS控制台。
2. 单击“创建桶”,然后根据页面提示配置参数,创建一个名称为“fast-demo”的 OBS桶。
说明
为保证网络互通,OBS桶区域请选择和DGC实例相同的区域。如果需要选择企业项目,也 请选择与DGC实例相同的企业项目。
使用OBS控制台创建桶的操作,请参见《对象存储服务控制台指南》中的创建
桶。
3. 上传数据到名称为“fast-demo”的OBS桶中。
使用OBS控制台上传文件的操作,请参见《对象存储服务控制台指南》中的上传
文件。
----结束
本示例中涉及到两部分样例数据,分别为电影数据movies.csv和评分数据 ratings.csv。具体数据和说明如下:
● movies.csv:
movieId,movieTitle,videoReleaseDate,IMDbURL,unknown,Action,Adventure,Animation,Childrens,Comed y,Crime,Documentary,Drama,Fantasy,FilmNoir,Horror,Musical,Mystery,Romance,SciFi,Thriller,War,Wester n1,Toy Story (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Toy%20Story%20(1995),
0,0,0,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0
2,GoldenEye (1995),1-Jan-95,http://us.imdb.com/M/title-exact?GoldenEye%20(1995), 0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0
3,Four Rooms (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Four%20Rooms%20(1995), 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0
4,Get Shorty (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Get%20Shorty%20(1995), 0,1,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0
5,Copycat (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Copycat%20(1995), 0,0,0,0,0,0,1,0,1,0,0,0,0,0,0,0,1,0,0
6,Shanghai Triad (Yao a yao yao dao waipo qiao) (1995),1-Jan-95,http://us.imdb.com/Title?Yao+a+yao +yao+dao+waipo+qiao+(1995),0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
7,Twelve Monkeys (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Twelve%20Monkeys%20(1995), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0
8,Babe (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Babe%20(1995), 0,0,0,0,1,1,0,0,1,0,0,0,0,0,0,0,0,0,0
9,Dead Man Walking (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Dead%20Man%20Walking
%20(1995),0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
10,Richard III (1995),22-Jan-96,http://us.imdb.com/M/title-exact?Richard%20III%20(1995), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0
11,Seven (Se7en) (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Se7en%20(1995), 0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0
12,"Usual Suspects, The (1995)",14-Aug-95,"http://us.imdb.com/M/title-exact?Usual%20Suspects,
%20The%20(1995)",0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0
13,Mighty Aphrodite (1995),30-Oct-95,http://us.imdb.com/M/title-exact?Mighty%20Aphrodite
%20(1995),0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0
14,"Postino, Il (1994)",1-Jan-94,"http://us.imdb.com/M/title-exact?Postino,%20Il%20(1994)", 0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0
15,Mr. Holland's Opus (1995),29-Jan-96,http://us.imdb.com/M/title-exact?Mr.%20Holland's%20Opus
%20(1995),0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
16,French Twist (Gazon maudit) (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Gazon%20maudit
%20(1995),0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0
17,From Dusk Till Dawn (1996),5-Feb-96,http://us.imdb.com/M/title-exact?From%20Dusk%20Till
%20Dawn%20(1996),0,1,0,0,0,1,1,0,0,0,0,1,0,0,0,0,1,0,0
18,"White Balloon, The (1995)",1-Jan-95,http://us.imdb.com/M/title-exact?Badkonake%20Sefid
%20(1995),0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
19,Antonia's Line (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Antonia%20(1995), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
20,Angels and Insects (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Angels%20and%20Insects
%20(1995),0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0
21,Muppet Treasure Island (1996),16-Feb-96,http://us.imdb.com/M/title-exact?Muppet%20Treasure
%20Island%20(1996),0,1,1,0,0,1,0,0,0,0,0,0,1,0,0,0,1,0,0
22,Braveheart (1995),16-Feb-96,http://us.imdb.com/M/title-exact?Braveheart%20(1995), 0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0
23,Taxi Driver (1976),16-Feb-96,http://us.imdb.com/M/title-exact?Taxi%20Driver%20(1976), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0
24,Rumble in the Bronx (1995),23-Feb-96,http://us.imdb.com/M/title-exact?Hong%20Faan%20Kui
%20(1995),0,1,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0
25,"Birdcage, The (1996)",8-Mar-96,"http://us.imdb.com/M/title-exact?Birdcage,%20The%20(1996)", 0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0
26,"Brothers McMullen, The (1995)",1-Jan-95,"http://us.imdb.com/M/title-exact?Brothers
%20McMullen,%20The%20(1995)",0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0
27,Bad Boys (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Bad%20Boys%20(1995), 0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
28,Apollo 13 (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Apollo%2013%20(1995), 0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0
29,Batman Forever (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Batman%20Forever%20(1995), 0,1,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,0
30,Belle de jour (1967),1-Jan-67,http://us.imdb.com/M/title-exact?Belle%20de%20jour%20(1967), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
31,Crimson Tide (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Crimson%20Tide%20(1995), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,1,0
32,Crumb (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Crumb%20(1994), 0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0
33,Desperado (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Desperado%20(1995), 0,1,0,0,0,0,0,0,0,0,0,0,0,0,1,0,1,0,0
34,"Doom Generation, The (1995)",1-Jan-95,"http://us.imdb.com/M/title-exact?Doom%20Generation,
%20The%20(1995)",0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0
35,Free Willy 2: The Adventure Home (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Free%20Willy
%202:%20The%20Adventure%20Home%20(1995),0,0,1,0,1,0,0,0,1,0,0,0,0,0,0,0,0,0,0 36,Mad Love (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Mad%20Love%20(1995), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0
37,Nadja (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Nadja%20(1994), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
38,"Net, The (1995)",1-Jan-95,"http://us.imdb.com/M/title-exact?Net,%20The%20(1995)", 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0,0
39,Strange Days (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Strange%20Days%20(1995), 0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0
40,"To Wong Foo, Thanks for Everything! Julie Newmar (1995)",1-Jan-95,"http://us.imdb.com/M/title-exact?To%20Wong%20Foo,%20Thanks%20for%20Everything!%20Julie%20Newmar%20(1995)", 0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0
41,Billy Madison (1995),1-Jan-95,http://us.imdb.com/M/title-exact?Billy%20Madison%20(1995), 0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0
42,Clerks (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Clerks%20(1994),
45,Eat Drink Man Woman (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Yinshi%20Nan%20Nu
%20(1994),0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0
46,Exotica (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Exotica%20(1994), 0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0
47,Ed Wood (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Ed%20Wood%20(1994), 0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,0
48,Hoop Dreams (1994),1-Jan-94,http://us.imdb.com/M/title-exact?Hoop%20Dreams%20(1994), 0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0
49,I.Q. (1994),1-Jan-94,http://us.imdb.com/M/title-exact?I.Q.%20(1994), 0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0
50,Star Wars (1977),1-Jan-77,http://us.imdb.com/M/title-exact?Star%20Wars%20(1977), 0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,0,1,0
数据说明如下:
表2-1 电影数据说明
字段名称 字段类型 字段说明
movieId INT 电影ID movieTitle VARCHAR 电影名 videoReleaseDate VARCHAR 电影发行日期 IMDbURL VARCHAR IMDb链接
unknown INT 未知,是则为1,否为0 Action INT 动作,是则为1,否为0 Adventure INT 冒险,是则为1,否为0 Animation INT 动画,是则为1,否为0 Childrens INT 儿童,是则为1,否为0 Comedy INT 喜剧,是则为1,否为0 Crime INT 犯罪,是则为1,否为0 Documentary INT 纪录片,是则为1,否为0 Drama INT 戏剧,是则为1,否为0 Fantasy INT 幻想,是则为1,否为0 FilmNoir INT 黑色,是则为1,否为0 Horror INT 恐怖,是则为1,否为0 Musical INT 音乐,是则为1,否为0 Mystery INT 神秘,是则为1,否为0 Romance INT 浪漫,是则为1,否为0 SciFi INT 科幻,是则为1,否为0 Thriller INT 惊悚,是则为1,否为0 War INT 战争,是则为1,否为0
字段名称 字段类型 字段说明
Western INT 西部,是则为1,否为0
● ratings.csv:
userId,movieId,rating,timestamp 210,40,3,891035994
224,29,3,888104457 308,1,4,887736532 7,32,4,891350932 10,16,4,877888877 99,4,5,886519097 115,20,3,881171009 138,26,5,879024232 243,15,3,879987440 293,5,3,888906576 162,25,4,877635573 135,23,4,879857765 62,21,3,879373460 59,23,5,888205300 43,14,2,883955745 19,4,4,885412840 5,2,3,875636053 72,48,4,880036718 224,26,3,888104153 299,14,4,877877775 151,10,5,879524921 6,14,5,883599249 250,7,4,878089716 268,2,2,875744173 292,11,5,881104093 181,3,2,878963441 145,15,2,875270655 1,33,4,878542699 276,2,4,874792436 18,26,4,880129731 87,40,3,879876917 272,12,5,879455254 296,20,5,884196921 5,17,4,875636198 128,15,4,879968827 287,1,5,875334088 65,47,2,879216672 1,20,4,887431883 290,50,5,880473582 45,25,4,881014015 109,8,3,880572642 157,25,3,886890787 301,33,4,882078228 62,12,4,879373613 276,40,3,874791871 269,22,1,891448072 10,7,4,877892210 244,17,2,880607205 222,26,3,878183043 185,23,4,883524249 207,13,3,875506839 8,22,5,879362183 222,49,3,878183512 200,11,5,884129542 90,25,5,891384789
268,21,3,875742822 262,28,3,879792220 90,22,4,891384357 270,25,5,876954456 194,23,4,879522819 161,48,1,891170745 58,9,4,884304328 79,50,4,891271545 221,48,5,875245462 223,11,3,891550649 292,9,4,881104148 16,8,5,877722736 17,13,3,885272654 148,1,4,877019411 280,1,4,891700426 110,38,3,886988574 90,12,5,891383241 239,9,5,889180446 311,9,4,884963365 151,13,3,879542688 2,50,5,888552084 8,50,5,879362124 286,44,3,877532173 85,25,2,879452769 274,50,5,878944679 217,27,1,889070011 181,14,1,878962392 297,25,4,874954497 1,47,4,875072125 6,23,4,883601365 222,22,5,878183285 314,28,5,877888346 291,15,5,874833668 94,24,4,885873423 83,43,4,880308690 43,40,3,883956468 44,15,4,878341343 158,24,4,880134261 151,12,5,879524368 66,1,3,883601324 5,1,4,875635748 207,25,4,876079113 109,1,4,880563619 227,50,4,879035347 181,1,3,878962392 213,13,4,878955139 121,14,5,891390014 117,15,5,880125887 85,13,3,879452866 313,22,3,891014870 43,5,4,875981421 11,38,3,891905936 72,28,4,880036824 115,8,5,881171982 95,1,5,879197329 145,22,5,875273021 66,7,3,883601355 267,17,4,878971773 25,25,5,885853415 103,24,4,880415847 87,9,4,879877931 49,47,5,888068715 135,39,3,879857931 269,13,4,891446662 99,50,5,885679998 306,14,5,876503995 291,7,5,874834481 312,28,4,891698300 184,36,3,889910195
305,11,1,886323237 198,7,4,884205317 104,7,3,888465972 293,39,3,888906804 256,25,5,882150552 92,15,3,875640189 1,17,3,875073198 214,42,5,892668130 82,14,4,876311280 305,50,5,886321799 223,8,2,891550684 91,28,4,891439243 315,13,4,879821158 269,9,4,891446246 217,7,4,889069741 49,7,4,888067307 87,2,4,879876074 268,1,3,875742341 262,47,2,879794599 84,12,5,883452874 264,33,3,886122644 224,20,1,888104487 200,24,2,884127370 92,24,3,875640448 276,38,3,874792574 286,34,5,877534701 49,38,1,888068289 311,5,3,884365853 269,47,4,891448386 194,4,4,879521397 57,28,4,883698324 108,50,4,879879739 207,4,4,876198457 181,16,1,878962996 94,9,5,885872684 234,20,4,891227979 68,7,3,876974096 13,14,4,884538727 98,47,4,880498898 53,24,3,879442538 239,10,5,889180338 63,20,3,875748004 276,43,1,874791383 272,48,4,879455143 116,7,2,876453915 26,25,3,891373727 62,24,4,879372633 295,47,5,879518166 63,50,4,875747292 49,17,2,888068651 310,24,4,879436242 7,44,5,891351728 326,22,4,879874989 213,12,5,878955409 222,29,3,878184571 249,11,5,879640868 217,22,5,889069741 189,1,5,893264174 234,50,4,892079237 296,48,5,884197091 81,3,4,876592546 151,15,4,879524879 59,12,5,888204260 246,8,3,884921245
7,28,5,891352341 41,28,4,890687353
数据说明如下:
表2-2 评分数据说明
字段名称 字段类型 字段说明
userId INT 用户ID movieId INT 电影ID rating INT 评分,5分制 timestamp VARCHAR 时间戳
数据湖准备
在本示例中,选择数据仓库服务(DWS)服务作为数据湖。
创建DWS集群的具体操作请参见创建集群。为确保DWS集群与DGC实例网络互通,
DWS集群需满足如下要求:
● DGC实例(指DGC实例中的CDM集群)与DWS集群处于不同区域的情况下,需要 通过公网或者专线打通网络。
● DGC实例(指DGC实例中的CDM集群)与DWS集群同区域情况下,同虚拟私有 云、同子网、同安全组的不同实例默认网络互通;如果同虚拟私有云但是子网或 安全组不同,还需配置路由规则及安全组规则,配置路由规则请参见如何配置路
由规则章节,配置安全组规则请参见如何配置安全组规则《虚拟私有云(VPC)使用
指南》中的“安全组 > 添加安全组规则”章节。● 此外,您还必须确保DWS集群与DGC工作空间所属的企业项目必须相同,如果不 同,您需要修改工作空间的企业项目。
创建DWS集群后,您需要在管理中心创建DWS连接,然后通过数据开发组件新建数据
创建DWS集群后,您需要在管理中心创建DWS连接,然后通过数据开发组件新建数据