• 沒有找到結果。

计费说明_数据湖治理中心 DGC_产品介绍_华为云

N/A
N/A
Protected

Academic year: 2022

Share "计费说明_数据湖治理中心 DGC_产品介绍_华为云"

Copied!
58
0
0

加載中.... (立即查看全文)

全文

(1)

产品介绍

文档版本 07

发布日期 2021-03-31

(2)

版权所有 © 华为技术有限公司 2022。 保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传 播。

商标声明

和其他华为商标均为华为技术有限公司的商标。

本文档提及的其他所有商标或注册商标,由各自的所有人拥有。

注意

您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或 特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或暗示的声 明或保证。

由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文 档中的所有陈述、信息和建议不构成任何明示或暗示的担保。

华为技术有限公司

地址: 深圳市龙岗区坂田华为总部办公楼 邮编:518129 网址: https://www.huawei.com

客户服务邮箱:[email protected] 客户服务电话:4008302118

(3)

目 录

1 图解数据湖治理中心 DGC... 1

2 什么是数据湖治理中心 DGC...3

3 基本概念...6

4 产品功能...12

5 产品优势...19

6 应用场景...21

7 如何选择 DGC 版本...24

8 计费说明...27

9 DGC 权限管理...32

10 DGC 权限列表... 34

11 约束与限制... 53

12 与其他云服务的关系... 54

13 配额说明... 55

(4)

1 图解数据湖治理中心 DGC

产品介绍 1 图解数据湖治理中心 DGC

(5)
(6)

2 什么是数据湖治理中心 DGC

企业数字化转型面临的挑战

企业在进行数据管理时,通常会遇到下列挑战。

● 数据治理的挑战

– 缺乏企业数据体系标准和数据规范定义的方法论,数据语言不统一。

– 缺乏面向普通业务人员的高效、准确的数据搜索工具,数据找不到。

– 缺乏技术元数据与业务元数据的关联,数据读不懂。

– 缺乏数据的质量管控和评估手段,数据不可信。

● 数据运营的挑战

– 数据运营效率低,业务环境的快速变化带来大量多样化的数据分析报表需 求,因为缺乏高效的数据运营工具平台,数据开发周期长、效率低,不能满 足业务运营决策人员的诉求。

– 数据运营成本高,数据未服务化,导致数据拷贝多、数据口径不一致,同时 数据重复开发,造成资源浪费。

● 数据创新的挑战

– 企业内部存在大量数据孤岛,导致数据不共享、不流通,无法实现跨领域的 数据分析与数据创新。

– 数据的应用还停留在数据分析报表阶段,缺乏基于数据反哺业务推动业务创 新的解决方案。

什么是 DGC?

数据湖治理中心DGC(Data Lake Governance Center) 是为了应对上述挑战、针对企业 数字化运营诉求提供的数据全生命周期管理、具有智能数据管理能力的一站式治理运 营平台,包含数据集成、数据开发、规范设计、数据质量监控、数据资产管理、数据 服务、数据安全等功能,支持行业知识库智能化建设,支持大数据存储、大数据计算 分析引擎等数据底座,帮助企业快速构建从数据接入到数据分析的端到端智能数据系 统,消除数据孤岛,统一数据标准,加快数据变现,实现数字化转型。

产品架构如图2-1所示。

产品介绍 2 什么是数据湖治理中心 DGC

(7)

2-1 产品架构

如图所示,DGC基于数据湖底座,提供数据集成、开发、治理、开放等能力。DGC支 持对接所有华为云的数据湖与数据库云服务作为数据湖底座,例如数据湖探索(Data Lake Insight,简称DLI)、MRS Hive、数据仓库服务DWS等,也支持对接企业传统数 据仓库,例如Oracle、Greenplum等。

DGC包含如下功能组件:

● 管理中心

提供DGC数据连接管理的能力,将DGC与数据湖底座进行对接,用于数据开发与 数据治理等活动。

● 数据集成之批量数据迁移

批量数据迁移提供20+简单易用的迁移能力和多种数据源到数据湖的集成能力,全 向导式配置和管理,支持单表、整库、增量、周期性数据集成。

● 数据集成之实时数据集成

实时数据接入为处理或分析流数据的自定义应用程序构建数据流管道,主要解决 云服务外的数据实时传输到云服务内的问题。实时数据接入每小时可从数十万种 数据源(例如日志和定位日志事件、网站点击流、社交媒体源等)中连续捕获、

传送和存储数TB数据。

● 规范设计

作为数据治理的一个核心模块,承担数据治理过程中的数据加工并业务化的功 能,提供智能数据规划、自定义主题数据模型、统一数据标准、可视化数据建 模、标注数据标签等功能,有利于改善数据质量,有效支撑经营决策。

● 数据开发

大数据开发环境,降低用户使用大数据的门槛,帮助用户快速构建大数据处理中 心。支持数据建模、数据集成、脚本开发、工作流编排等操作,轻松完成整个数 据的处理分析流程。

● 数据质量

数据全生命周期管控,数据处理全流程质量监控,异常事件实时通知。

● 数据资产

提供企业级的元数据管理,厘清信息资产。通过数据地图,实现数据资产的数据 血缘和数据全景可视,提供数据智能搜索和运营监控。

● 数据服务

(8)

数据服务定位于标准化的数据服务平台,提供一站式数据服务开发、测试部署能 力,实现数据服务敏捷响应,降低数据获取难度,提升数据消费体验和效率,最 终实现数据资产的变现。

● 数据安全

数据安全为数据湖治理中心提供数据生命周期内统一的数据使用保护能力。通过 敏感数据识别、分级分类、隐私保护、资源权限控制、数据加密传输、加密存 储、数据风险识别以及合规审计等措施,帮助用户建立安全预警机制,增强整体 安全防护能力,让数据可用不可得和安全合规。

产品介绍 2 什么是数据湖治理中心 DGC

(9)

3 基本概念

数据库、数据仓库、数据湖与华为智能数据湖方案

请参考数据库、数据仓库、数据湖与华为智能数据湖方案

DGC 实例

DGC实例是数据湖治理中心给用户提供的最小计算资源单位。数据湖治理中心以DGC 实例的方式提供给用户,用户可以同时创建多个DGC实例,并分别管理和访问每个 DGC实例。每个DGC实例具有用户指定的基础计算资源,包含管理中心、规范设计、

数据集成、数据开发、数据质量、数据资产和数据服务七个模块。用户可根据业务需 要申请相应规格的DGC实例。

工作空间

工作空间是从系统层面为管理者提供对使用DGC的用户(成员)权限、资源、DGC底 层计算引擎配置的管理能力。

工作空间作为成员管理、角色和权限分配的基本单元,每个团队都可具有独立的工作 空间。

您只有在加入工作空间并被分配权限后,才可具备管理中心、数据资产、数据质量、

业务指标、数据规范、数据服务、数据开发、数据迁移和数据接入模块的系列操作权 限。

成员和角色

成员是被授予工作空间访问或使用权限的华为云帐号。在添加工作空间成员时,您需 要同时为添加的成员设置相应的角色。

角色是一组操作权限的集合。不同的角色拥有不同的操作权限,把角色授予成员后,

成员即具有了角色的所有权限。每位成员至少要拥有一个角色,并且可以同时拥有多 种角色。

批量数据迁移集群

批量数据迁移给用户提供的最小资源单位,一个批量数据迁移集群运行在一个弹性云 服务器之上,用户可以在集群中创建数据迁移作业,在云上和云下的同构/异构数据源 之间批量迁移数据。

(10)

数据源

即数据的来源,本质是讲存储或处理数据的媒介,比如:关系型数据库、数据仓库、

数据湖等。每一种数据源不同,其数据的存储、传输、处理和应用的模式、场景、技 术和工具也不相同。

源数据

源数据强调数据状态是“创建”之后的“原始状态”,也就是没有被加工处理的数 据。在数据管理的过程中,源数据一般是指直接来自源文件(业务系统数据库、线下 文件、IoT等)的数据,或者直接拷贝源文件的“副本数据”。

数据连接

定义访问数据实体存储(计算)空间所需的信息的集合,包括连接类型、名称和登录 信息等。

并发数

并发数是数据迁移作业中,可以从源端并行读取的最大线程数。

脏数据

脏数据是对于业务没有意义或者格式非法的数据。例如,源端是VARCHAR类型的数据 写到INT类型的目标列中,导致因为转换不合理而无法写入的数据。

接入通道

租户创建的用于发送或者接收实时数据的逻辑单位,用以区分不同租户实时数据的集 合。

分区

分区(Partition)是接入实时数据流的基本吞吐量单位,每个Partition提供1MB/秒数 据输入和2MB/秒数据输出容量。一个分区最高可支持每秒1000个PUT记录。创建数据 流时,您将指定所需的分区数量。

作业(数据开发)

在数据开发中,作业由一个或多个节点组成,共同执行以完成对数据的一系列操作。

节点

节点用于定义对数据执行的操作。例如,使用“MRS Spark”节点可以实现在MRS中 执行预先定义的Spark作业。

解决方案

解决方案定位于为用户提供便捷的、系统的方式管理作业,更好地实现业务需求和目 标。每个解决方案可以包含一个或多个业务相关的作业,一个作业可以被多个解决方 案复用。

产品介绍 3 基本概念

(11)

资源

用户可以上传自定义的代码或文本文件作为资源,并在节点运行时调用。

表达式

数据开发作业中的节点参数可以使用表达式语言(Expression Language,简称EL),

根据运行环境动态生成参数值。数据开发 EL表达式使用简单的算术和逻辑计算,引用 内嵌对象,包括作业对象和一些工具类对象。

环境变量

环境变量是在操作系统中一个具有特定名字的对象,它包含了一个或者多个应用程序 所将使用到的信息。

补数据

手工触发周期方式调度的作业任务,生成过去某时间段内的实例。

数据治理

数据资源及其应用过程中相关管控活动、绩效和风险管理的集合。

数据调研

基于现有业务数据、行业现状进行数据调查、需求梳理、业务调研,输出企业业务流 程以及数据主题划分。

主题设计

通过分层架构表达对数据的分类和定义,帮助厘清数据资产,明确业务领域和业务对 象的关联关系。

主题域分组

基于业务场景对主题域分组。

主题域

互不重叠数据的高层面的数据分类,用于管理其下一级的业务对象。

业务对象

指企业运作和管理中不可缺少的重要人、事、物信息。

流程设计

流程设计是针对流程的一个结构化的整体框架,描述了企业流程的分类、层级以及边 界、范围、输入/输出关系等,反映了企业的商业模式及业务特点。

(12)

数据标准

数据标准用于描述公司层面需共同遵守的数据含义和业务规则。其描述了公司层面对 某个数据的共同理解,这些理解一旦确定下来,就应作为企业层面的标准在企业内被 共同遵守。

码表

通常只包括一系列允许的值和附加文本描述,与数据标准关联用于生成值域校验质量 监控。

SDI

Source Data Integration (SDI)又称贴源数据层。SDI是源系统数据的简单落地。

DWI

Data Warehouse Integration (DWI)又称数据整合层。DWI整合多个源系统数据,源 系统进来数据会有整合、清洗,基于三范式关系建模。

DWR

Data Warehouse Report (DWR)又称数据报告层。 DWR基于多维模型,和DWI层数 据粒度保持一致。

DM

Data Mart (DM) 又称数据集市。DM面向展现层,数据有多级汇总。

关系建模

关系建模是用实体关系(Entity Relationship,ER)模型描述企业业务,它在范式理论 上符合3NF,出发点是整合数据,将各个系统中的数据以整个企业角度按主题进行相 似性组合和合并,并进行一致性处理,为数据分析决策服务,但是并不能直接用于分 析决策。

维度建模

维度建模是从分析决策的需求出发构建多维模型,它主要是为分析需求服务,因此它 重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性 能。

多维模型是由数字型度量值组成的一张事实表连接到一组包含描述属性的多张维度 表,事实表与维度表通过主/外键实现关联。

在DGC规范设计中,维度建模是以维度建模理论为基础,构建总线矩阵、抽象出事实 和维度,构建维度模型和事实模型,同时对报表需求进行抽象整理出相关指标体系,

构建出汇总模型。

指标(规范设计)

指标是衡量目标总体特征的统计数值,是能表征企业某一业务活动中业务状况的数值 指示器。指标一般由指标名称和指标数值两部分组成,指标名称及其涵义体现了指标

产品介绍 3 基本概念

(13)

质的规定性和量的规定性两个方面的特点,指标数值反映了指标在具体时间、地点、

条件下的数量表现。

度量

度量是用于衡量业务状况的可量化的数值表现,通常为数字,如:金额、数量、周期 等。指标与度量的关系:度量是一个数值型数据,其本身不带有业务含义,只有将度 量放在业务语境下,方能体现出业务含义,才能成为指标。

维度

维度是用于观察和分析业务数据的视角,支撑对数据汇聚、钻取、切片分析,用于 SQL中的GROUP BY条件。多数维度具有层级结构,如:地理维度(其中包括国家、地 区、省以及城市等级别的内容)、时间维度(其中包括年度、季度、月度等级别的内 容)。

原子指标

原子指标包含属性和度量,是基于业务活动下某一业务对象所产生的业务状况的度 量,以及和所有相关的属性。通过原子指标数据旨在用于支撑衍生指标的敏捷自助消 费,其与多维模型中的最细数据粒度保持一致,如:零售门店数量(包含门店名称、门 店等级等属性)。多维模型是由数字型度量值组成的一张事实表连接到一组包含描述属 性的多张维度表,事实表与维度表通过主外键实现关联。

原子指标中的度量和属性来源于多维模型中的维度表和事实表,与多维模型所属的业 务对象保持一致,与多维模型中的最细数据粒度保持一致。原子指标中仅含有唯一度 量,所含其它所有与该度量、该业务对象相关的属性,旨在用于支撑指标的敏捷自助 消费。

衍生指标

衍生指标是原子指标通过添加口径/修饰词、维度卷积而成,口径/修饰词、维度均来源 于原子指标中的属性。例如:促销员门店覆盖率。

复合指标

复合指标由一个或多个衍生指标叠加计算而成,其中的维度、口径/修饰词均继承于衍 生指标(不能脱离衍生指标维度和口径/修饰词的范围,去产生新的维度和口径/修饰 词)。

数据质量规则

不符合业务实质、不满足数据应用要求的数据判断逻辑。

数据资产

由企业拥有或者控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录 的数据资源。在企业中并非所有的数据都构成数据资产,数据资产是能够为企业产生 价值的数据资源。

(14)

数据地图

以数据搜索为核心,通过可视化方式,综合反映有关数据来源、数量、分布、标准、

流向、关联关系、数据质量。让用户找到数据、读懂数据、消费数据,致力于为用户 提供高效率的数据消费产品。

元数据

元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的 数据。元数据包括元数据实体和元数据元素。元数据元素是元数据的基本单元,若干 个相关的元数据元素构成了元数据实体。

数据资产采集

支持创建自定义策略的采集任务,采集数据源中的技术元数据。

数据资产报告

数据资产总览与统计信息展示。

数据服务

数据服务是基于数据分发、发布的框架,将数据作为一种服务产品提供,满足客户的 实时数据需求,能复用并符合企业和工业标准,兼顾数据共享和安全。

API 网关

API网关(API Gateway)提供API托管服务,涵盖API发布、管理、运维、售卖的全生 命周期管理。帮助您简单、快速、低成本、低风险地实现微服务聚合、前后端分离、

系统集成,向合作伙伴、开发者开放功能和数据。

API网关是数据服务共享版API对外开放,或者在自己的应用中调用的最后一道防线,

提供权限管理、流量控制、访问控制、计量等服务。通常在数据服务共享版中生成和 注册的API,需要发布至API网关才能对外提供服务。

产品介绍 3 基本概念

(15)

4 产品功能

数据集成:多种方式异构数据源高效接入

DGC数据集成支持批量数据迁移和实时数据接入两种方式。

● 批量数据迁移

批量数据迁移提供20+同构/异构数据源之间批量数据迁移的功能,帮助您实现数 据自由流动。支持自建和云上的文件系统,关系数据库,数据仓库,NoSQL,大 数据云服务,对象存储等数据源。

批量数据迁移基于分布式计算框架,利用并行化处理技术,支持用户稳定高效地 对海量数据进行移动,实现不停服数据迁移,快速构建所需的数据架构。

4-1 批量数据迁移

批量数据迁移提供全向导式任务管理界面,帮助用户在几分钟内完成数据迁移任 务的创建,轻松应对复杂迁移场景。批量数据迁移支持的功能主要有:

(16)

– 表/文件/整库迁移

支持批量迁移表或者文件,还支持同构/异构数据库之间整库迁移,一个作业 即可迁移几百张表。

– 增量数据迁移

支持文件增量迁移、关系型数据库增量迁移、HBase增量迁移,以及使用 Where条件配合时间变量函数实现增量数据迁移。

– 事务模式迁移

支持当迁移作业执行失败时,将数据回滚到作业开始之前的状态,自动清理 目的表中的数据。

– 字段转换

支持去隐私、字符串操作、日期操作等常用字段的数据转换功能。

– 文件加密

在迁移文件到文件系统时,批量数据迁移支持对写入云端的文件进行加密。

MD5校验一致性

支持使用MD5校验,检查端到端文件的一致性,并输出校验结果。

– 脏数据归档

支持将迁移过程中处理失败的、被清洗过滤掉的、不符合字段转换或者不符 合清洗规则的数据自动归档到脏数据日志中,方便用户分析异常数据。并支 持设置脏数据比例阈值,来决定任务是否成功。

● 实时数据接入

实时数据接入为处理或分析流数据的自定义应用程序构建数据流管道,主要解决 云服务外的数据实时传输到云服务内的问题。实时数据接入每小时可从数十万种 数据源(例如日志和定位日志事件、网站点击流、社交媒体源等)中连续捕获、

传送和存储数TB数据。

数据流向:

– 实时数据接入实时从多种数据源采集数据。

– 实时数据接入连续传输数据,自动将数据传输至MRS,DLI,DWS和OBS等服 务做计算、分析和存储。

4-2 数据流向

关键能力:

产品介绍 4 产品功能

(17)

– 无限扩展:实时数据接入通道的吞吐量每小时可从数MB扩展到数TB,PUT记 录每秒钟可从数千次扩展到数百万。

– 易于使用:您可以在几秒钟内创建数据接入通道,轻松的将数据放入通道 中,并构建用于数据处理的应用程序。

– 成本低廉:没有前期成本,您只需要为实际使用的资源付费即可。

– 并行处理:您可以用多个应用程序同时处理同一个数据通道。例如,您可以 让一个应用程序运行实时分析,让其他应用程序从同一个数据通道中将数据 发送至对象存储服务(Object Storage Service,简称OBS)。

– 安全可靠:实时数据接入可将数据保留24~72小时,以防数据在应用程序故 障、个别机器故障或设施故障时丢失。

规范设计:数据建模可视化、自动化、智能化

DGC规范设计践行数据治理方法论,将数据治理行为可视化,打通数据基础层到汇总 层、集市层的数据处理链路,落地数据标准和数据资产,通过关系建模、维度建模实 现数据标准化,通过统一指标平台建设,实现规范化指标体系,消除歧义、统一口 径、统一计算逻辑,对外提供主题式数据查询与挖掘服务。

4-3 数据规范设计

DGC规范设计主要包括以下三个部分:

● 主题设计

构建统一的数据分类体系,用于目录化管理所有业务数据,便于数据的归类,查 找,评价,使用。通过分层架构对数据分类和定义,可帮助用户厘清数据资产,

明确业务领域和业务对象的关联关系。

● 数据标准

(18)

构建统一的数据标准体系,数据标准流程化、系统化。用户可基于国家标准或行 业标准,对每一行数据、每一个字段的具体取值进行标准化,从而提升数据质量 和易用性。

● 数据建模

构建统一的数据模型体系,通过规范定义和数据建模,自顶向下构建企业数据分 层体系,沉淀企业数据公共层和主题库,便于数据的流通、共享、创造、创新,

提升数据使用效率,极大的减少数据冗余,混乱,隔离,不一致以及谬误等。

DGC规范设计支持的数据建模方法有:

– 关系建模

关系建模是用实体关系(Entity Relationship,ER)模型描述企业业务,它在 范式理论上符合3NF,出发点是整合数据,将各个系统中的数据以整个企业 角度按主题进行相似性组合和合并,并进行一致性处理,为数据分析决策服 务,但是并不能直接用于分析决策。

– 维度建模

维度建模是以维度建模理论为基础,构建总线矩阵、抽象出事实和维度,构 建维度模型和事实模型,同时对报表需求进行抽象整理出相关指标体系,构 建出汇总模型。

数据开发:一站式协同开发平台

DGC数据开发是一个一站式敏捷大数据开发平台,提供可视化的图形开发界面、丰富 的数据开发类型(脚本开发和作业开发)、全托管的作业调度和运维监控能力,内置 行业数据处理pipeline,一键式开发,全流程可视化,支持多人在线协同开发,支持管 理多种大数据云服务,极大地降低了用户使用大数据的门槛,帮助用户快速构建大数 据处理中心。

4-4 数据开发模块架构

数据开发支持数据管理、脚本开发、作业开发、资源管理、作业调度、运维监控等操 作,帮助用户轻松完成整个数据的处理分析流程。

● 数据管理

– 支持管理DWS、DLI、MRS Hive等多种数据仓库。

产品介绍 4 产品功能

(19)

– 支持可视化和DDL方式管理数据库表。

● 脚本开发

– 提供在线脚本编辑器,支持多人协作进行SQL、Shell、Python脚本在线代码 开发和调测。

– 支持使用变量。

● 作业开发

– 提供图形化设计器,支持拖拽式工作流开发,快速构建数据处理业务流水 线。

– 预设数据集成、SQL、Spark、Shell、机器学习等多种任务类型,通过任务间 依赖完成复杂数据分析处理。

– 支持导入和导出作业。

● 资源管理

支持统一管理在脚本开发和作业开发使用到的file、jar、archive类型的资源。

● 作业调度

– 支持单次调度、周期调度和事件驱动调度,周期调度支持分钟、小时、天、

周、月多种调度周期。

– 作业调度支持多种云服务的多种类型的任务混合编排,高性能的调度引擎已 经经过几百个应用的检验。

● 运维监控

– 支持对作业进行运行、暂停、恢复、终止等多种操作。

– 支持查看作业和其内各任务节点的运行详情。

– 支持配置多种方式报警,作业和任务发生错误时可及时通知相关人,保证业 务正常运行。

数据质量:可控可检验

数据质量模块支持对业务指标和数据质量进行监控,数据质量可检验,帮助用户及时 发现数据质量问题。

● 业务指标监控

业务指标监控是对业务指标数据进行质量管理的有效工具,可以灵活的创建业务 指标、业务规则和业务场景,实时、周期性进行调度,满足业务的数据质量监控 需求。

● 数据质量监控

数据质量监控是对数据库里的数据质量进行质量管理的工具,您可以配置数据质 量检查规则,在线监控数据准确性。

数据质量可以从完整性、有效性、及时性、一致性、准确性、唯一性六个维度进 行单列、跨列、跨行和跨表的分析,也支持数据的标准化,能够根据数据标准自 动生成标准化的质量规则,支持周期性的监控。

(20)

4-5 数据质量规则体系

数据资产管理:360 度全链路数据资产可视化

DGC提供企业级的元数据管理,厘清信息资产。数据资产管理可视,支持钻取、溯源 等。通过数据地图,实现数据资产的数据血缘和数据全景可视,提供数据智能搜索和 运营监控。

● 元数据管理

元数据管理模块是数据湖治理的基石,支持创建自定义策略的采集任务,可采集 数据源中的技术元数据。支持自定义业务元模型,批量导入业务元数据,关联业 务和技术元数据、全链路的血缘管理和应用。

4-6 全链路数据血缘

● 数据地图

数据地图围绕数据搜索,服务于数据分析、数据开发、数据挖掘、数据运营等数 据表的使用者和拥有者,提供方便快捷的数据搜索服务,拥有功能强大的血缘信 息及影响分析。

– 在数据地图中,可通过关键词搜索数据资产,支持模糊搜索,快速检索,定 位数据。

– 使用数据地图根据表名直接查看表详情,快速查阅明细信息,掌握使用规 则。获得数据详细信息后,可添加额外描述。

– 通过数据地图的血缘分析可以查看每个数据表的来源、去向,并查看每个表 及字段的加工逻辑。

– 对数据资产,可以从业务角度定义分类或标签。

产品介绍 4 产品功能

(21)

数据服务:提升访问查询检索效率

DGC数据服务旨在为企业搭建统一的数据服务总线,帮助企业统一管理对内对外的API 服务,支撑业务主题/画像/指标的访问、查询和检索,提升数据消费体验和效率,最终 实现数据资产的变现。数据服务为您提供快速将数据表生成数据API的能力,同时支持 您将现有的API快速注册到数据服务平台以统一管理和发布。

数据服务采用Serverless架构,您只需关注API本身的查询逻辑,无需关心运行环境等 基础设施,数据服务会为您准备好计算资源,并支持弹性扩展,零运维成本。

4-7 数据服务架构图

数据安全:全方位安全保障

● 网络安全

基于网络隔离、安全组规则以及一系列安全加固项,实现租户隔离和访问权限控 制,保护系统和用户的隐私及数据安全。

● 用户权限策略

基于角色的访问控制,用户通过角色与权限进行关联,并支持细粒度权限策略,

可满足不同的授权需求。针对不同的用户,DGC提供了管理者、开发者、运维 者、访问者四种不同的角色,各个角色拥有不同的权限。

● 数据安全

针对规范设计、数据服务等关键流程,DGC提供了审核流程。

数据的分级分类管理,数据的全生命周期管理,保证数据的隐私合规、可回溯。

(22)

5 产品优势

一站式数据运营平台

贯穿数据全流程的一站式治理运营平台,提供全域数据集成、标准规范设计、连接并 萃取数据价值、全流程数据质量监控、统一数据资产管理、数据开发服务等,帮助企 业构建完整的数据中台解决方案。

全链路数据治理管控

数据全生命周期管控,提供数据规范定义及可视化的模型设计,智能化的帮助用户生 成数据处理代码,数据处理全流程质量监控,异常事件实时通知。

丰富的数据开发类型

支持多人在线协作开发,脚本开发可支持SQL、Shell在线编辑、实时查询;作业开发 可支持CDM、SQL、MRS、Shell、MLS、Spark等多种数据处理节点,提供丰富的调 度配置策略与海量的作业调度能力。

统一调度和运维

全面托管的调度,支持按时间、事件触发的任务触发机制,支持分钟、小时、天、周 和月等多种调度周期。

可视化的任务运维中心,监控所有任务的运行,支持配置各类报警通知,便于责任人 实时获取任务的情况,保证业务正常运行。

可复用行业知识库

提供垂直行业可复用的领域知识库,涵盖行业数据标准、行业领域模型、行业数据主 题库、行业算法库和行业指标库等,支持智慧政务、智慧税务、智慧园区等行业,帮 助企业快速定制数据运营端到端解决方案。

统一数据资产管理

全局资产视图、快速查看、智能管理、数据溯源和数据开放共享,从业务视角管理和 查看数据,定义业务架构、业务分类和业务术语,统一管理资产访问权限。

产品介绍 5 产品优势

(23)

数据运营全场景可视

数据治理运营过程可视,托拉拽配置,无需编码;处理结果可视,更直观,便于交互 和探索;数据资产管理可视,支持钻取、溯源等。

全方位的安全保障

统一的安全认证,租户隔离,数据的分级分类管理,数据的全生命周期管理,保证数 据的隐私合规、可审计、可回溯。

基于角色的访问控制,用户通过角色与权限进行关联,并支持细粒度权限策略,可满 足不同的授权需求。

(24)

6 应用场景

一站式的数据运营治理平台

从数据采集->规范设计->质量监控->数据清洗->数据建模->数据联接->数据整合->数据 消费->智能分析,一站式数据智能运营平台,帮助企业快速构建数据运营能力。

优势

● 多种云服务作业编排

● 全链路数据治理管控

● 丰富数据引擎支持

支持对接所有华为云的数据湖与数据库云服务,也支持对接企业传统数据仓库,

比如Oracle、Greenplum等。

● 简单易用

图形化编排,即开即用,轻松上手。

6-1 一站式数据运营治理平台

产品介绍 6 应用场景

(25)

云上数据平台快速搭建

快速将线下数据迁移上云,将数据集成到云上大数据服务中,并在DGC的界面中就可 以进行快速的数据开发工作,让企业数据体系的建设变得如此简单。

优势

● 数据集成一键式操作

通过在服务界面配置化操作,可实现线上线下数据快速集成到云数据仓库。

● 支持多种数仓服务类型

根据需求,可以灵活选择数据服务类型,可以选择DWS服务建数仓,也可以选择 MRS服务等数据平台。

● 安全稳定、降低成本

一站式的服务能力和稳定的数仓服务,让云上数据万无一失;免自建大数据集 群、免运维,极大降低企业建设数仓成本。

6-2 云上数据平台

基于行业领域知识库快速构建数据中台

通过应用华为在企业业务领域积累的丰富的行业领域模型和算法,帮助企业构建数据 中台,快速提升数据运营能力。

优势

● 多行业支持

覆盖政务/税务/城市/交通/园区等各行业。

● 标准规范支持

支持分层结构的行业数据标准。

● 领域模型丰富

支持包含人员/组织/事件/时空/车辆/资产/设备/资源等八大类数据以及相互之间关 系的行业领域模型。

● 快速应用行业库

支持快速应用的行业主题库、行业算法库、行业指标库。

(26)

6-3 数据中台

产品介绍 6 应用场景

(27)

7 如何选择 DGC 版本

请您根据您所需的功能和规格,慎重选择DGC版本。

● 购买版本后,无法直接降级版本。如已购买专业版,无法直接降级到高级版,您 需要采取先备份数据,然后退订原有实例,购买新实例,最后迁移备份数据到新 实例的方式来实现版本降级。

● 如果您的业务量不断增长,已购版本无法满足您的业务需求,您可以选择升级版 本。登录DGC控制台,找到需要升级的DGC实例,单击“升级”,然后根据页面 提示购买更高规格的套餐。

如何选择 DGC 版本

7-1 DGC 各版本建议使用场景 版本 建议使用场景

初级版 建设初数据湖项目,无全职数据开发人员、不涉及数据治理。

基础版 拥有1~2名全职数据开发人员,原始数据规模小于1000张表。

高级版 拥有5~10名全职数据开发人员,有明确的数据标准、数据质量管理、数 据规模小于2000张表。

专业版 有完善的数据管理团队和体系,拥有10~30名全职数据开发人员,中大 型企业规模。

企业版 大型企业,多分支机构企业。

DGC 版本规格说明

7-2 DGC 版本支持的组件

DGC组件 初级版 基础版 高级版 专业版 企业版

数据集成之 批量数据迁 移

√ √ √ √ √

(28)

DGC组件 初级版 基础版 高级版 专业版 企业版 数据集成之

实时数据接 入

支持,需 另外购买 实时数据 接入增量 包

支持,需另 外购买实时 数据接入增 量包

支持,需另 外购买实时 数据接入增 量包

支持,需另 外购买实时 数据接入增 量包

支持,需另 外购买实时 数据接入增 量包

管理中心 √ √ √ √ √

规范设计 x √ √ √ √

数据开发 √ √ √ √ √

数据质量 x √ √ √ √

数据资产 x √ √ √ √

数据服务 x √ √ √ √

数据安全

(公测) x √ √ √ √

7-3 DGC 版本规格说明

DGC规格 初级版 基础版 高级版 专业版 企业版

DGC数据集 成节点

节点数量:1个 规格名 称:cdm.medi um vCPUs/内 存:4核8GB 基准/最大 带宽:0.4/1.5Gb ps

作业并发数:20

节点数量:

1个

规格名称:

cdm.mediu m

vCPUs/内 存:4核8GB 基准/最大 带宽:0.4/1.5Gbp s

作业并发数:20

节点数量:

1个

规格名称:

cdm.large vCPUs/内 存:8核16GB 基准/最大 带宽:0.8/3Gbps 作业并发数:30

节点数量:

1个

规格名称:

cdm.xlarge vCPUs/内 存:16核 32GB 基准/最大带 宽:4/10Gbps 作业并发数:100

节点数量:1 个

规格名称:

cdm.xlarge vCPUs/内 存:16核 32GB 基准/最大带 宽:4/10Gbps 作业并发数:100

数据作业节 点调度次数/

(包括数据 开发作业、

数据质量监 控作业、元 数据采集作 业)

5,000次/天 20,000次/

40,000次/

80,000次/天 200,000次/

产品介绍 7 如何选择 DGC 版本

(29)

DGC规格 初级版 基础版 高级版 专业版 企业版 数据治理支

持的对象数 量

(元数据采 集、数据建 模、质量监 控等功能可 操作的表、

schema等 对象数量)

不支持 1,000 2,000 4,000 10,000

(30)

8 计费说明

数据湖治理中心DGC采用基础包+增量包的计费模式。为了便于您便捷的下单购买,在 控制台购买界面中系统会为您计算好所购买的套餐包价格,您可一键完成整个配置的 购买。

计费项

DGC采用基础包+增量包的计费模式。

● 基础包:基础包即DGC实例,如果需要使用DGC服务,则必须先购买DGC实例。

DGC实例根据不同版本,包含了不同的组件和规格,具体请参见如何选择DGC版 本。

● 增量包:如果基础包无法满足您的使用需求,您可以为DGC实例购买增量包。当 前包含以下增量包:

– 实时数据接入增量包:如果需要使用实时数据接入,在购买DGC基础包实例 后,需要购买实时数据接入增量包。

实时数据接入为处理或分析流数据的自定义应用程序构建数据流管道,主要 解决云服务外的数据实时传输到云服务内的问题。实时数据接入每小时可从 数十万种数据源(例如日志和定位日志事件、网站点击流、社交媒体源等)

中连续捕获、传送和存储数TB数据。

– 批量数据迁移增量包:DGC基础包中已经包含一个批量数据迁移的集群,如 果无法满足业务需求,在购买DGC基础包实例后,您可以根据实际需求购买 批量数据迁移增量包。

批量数据迁移提供20+简单易用的迁移能力和多种数据源到数据湖的集成能 力,全向导式配置和管理,支持单表、整库、增量、周期性数据集成。

– 数据服务专享集群增量包:数据服务当前提供共享版与专享版两种服务方 式。其中数据服务共享版即开即用,数据服务专享版需要在购买DGC基础包 实例后,购买专享版集群增量包。

说明

数据服务专享版在每个工作空间具有创建10个专享版API免费试用额度,超出试用配 额后会产生数据服务专享版API的费用,所创建的超出试用配额API按每天每个按1元 收费。

数据服务定位于标准化的数据服务平台,提供一站式数据服务开发、测试部 署能力,实现数据服务敏捷响应,降低数据获取难度,提升数据消费体验和 效率,最终实现数据资产的变现。专享版与共享版的差异请参见共享版与专 享版数据服务的对比。

产品介绍 8 计费说明

(31)

DGC计费套餐如下表所示:

8-1 DGC 计费模式 计费套

餐包

套餐包子类 计费模式 计费说明

DGC基 础包

初级版 基础版 高级版 专业版 企业版

包年包月 DGC基础包的计费详情,请参见数据湖治 理中心价格详情。

在使用DGC过程中,使用其他云服务的费 用(如弹性公网IP/带宽、对象存储服务 OBS等),需按照相应云服务的计费规则 进行计费,DGC基础包不包含此类费用。

例如,在数据开发过程中,创建了DWS数 据连接,并创建了数据库和表,DWS服务 所需的费用需按照DWS服务的计费规则进 行计费。

DGC增 量包

(可 选)

批量数据迁

移增量包 ● 按需计费

● 套餐包

(包年包 月)

计费详情请参见DGC批量数据迁移增量包 价格详情。

实时数据接

入增量包 ● 按需计费

● 套餐包

(包年包 月)

计费详情请参见DGC实时数据接入增量包 价格详情。

数据服务专 享集群增量 包

套餐包(包

年包月) 计费详情请参见DGC数据服务专享集群增 量包价格详情。

公测期间的数据服务专享集群将转为收费 集群,宽限期内充值只能选择包周期,充 值后不存在宽限期。超过宽限期后集群状 态转为冻结期。

数据服务专享版在每个工作空间具有创建 10个专享版API免费试用额度,超出试用 配额后会产生数据服务专享版API的费 用,所创建的超出试用配额API按每天每 个按1元收费。

(32)

说明

购买“批量数据迁移/实时数据接入增量包时,需注意如下几点:

购买“按需计费”增量包,系统会按照您所选规格自动创建一个批量数据迁移的集群/实时 数据接入通道。

购买“套餐包”增量包,系统不会创建批量数据迁移集群/实时数据接入通道。如果您只购 买了一个“套餐包”计费模式的增量包,因为当前没有批量数据迁移集群/实时数据接入通 道,该套餐包不会消耗所购买的时长。

如果您希望享受“套餐包”的优惠价格,需要先购买一个“套餐包”增量包,再购买一个 和“套餐包”增量包具有相同区域和规格的“按需计费”增量包。

如果您先购买一个“按需计费”增量包,再购买一个和“按需计费”增量包具有相同区域 和规格的“套餐包”增量包,则在购买“套餐包”增量包之前已经产生的费用按“按需计 费”计费,购买“套餐包”增量包之后的费用按“套餐包”计费。

您可以将批量数据迁移集群关机,以降低费用成本。关机期间会产生一定的低额按需费 用,但不会消耗您的套餐包时长。

计费模式

DGC基础包

DGC基础包仅支持包年包月计费模式。您可以根据实际使用情况,选择合适的 DGC基础包套餐,然后根据购买时长一次性支付套餐的费用,最短购买时长为一 个月。

DGC增量包

– 按需计费:增量包按实际使用时长计费,计费周期为一小时。

– 套餐包:您可以根据实际使用情况,选择合适的DGC增量包套餐包,然后根 据购买时长一次性支付套餐包的费用,最短购买时长为一个月。

变更配置

在购买DGC时,有多种基础包套餐或增量包规格供您选择,您可根据业务需要选择合 适的套餐包或增量包。当您完成DGC基础包或增量包的购买后,DGC提供如下几种变 更配置的方式。

DGC基础包升级:DGC基础包套餐允许升级,升级时,已经产生的费用按天结 算。升级成功后,按新订购套餐进行计费。

如需升级,请登录DGC控制台,找到需要升级的DGC实例,单击“升级”,然后 根据页面提示购买更高规格的套餐。

套餐升级后,系统会根据升级后的套餐创建一个新的批量数据迁移集群。原基础 包中的批量数据迁移集群仍为您保留,但是不会再产生费用。您需要将原集群的 数据连接、作业等信息手动迁移到新集群,具体操作请参见批量管理作业。

● 实时数据接入扩缩容:实时数据接入通道支持扩缩容。扩缩容后,将按扩、缩容 后的实际规格进行计费。当前支持自动和手动扩缩容两种方式,具体操作请参见 弹性扩缩容。

若DGC提供的变更配置方式不满足您的要求,您也可以重新购买DGC基础套餐包。

续费

DGC基础包

对于DGC基础包,请在所购买的套餐包时长用完前进行续费。

产品介绍 8 计费说明

(33)

DGC基础包,采用包年包月计费模式,在订单周期结束后,订单进入保留期。保 留期届满时若您仍未续费订单,相应的资源将被释放,您资源中的数据也将被删 除。在保留期内所产生的相关费用将在您续费时一并收取。

DGC基础包支持自动续费,自动续费的默认续费周期为:

– 按月购买:自动续费周期为1个月。

– 按年购买:自动续费周期为1年。

您可以通过以下两种方式开通自动续费:

– 登录DGC控制台,在购买DGC实例的页面中,勾选“自动续费”选项。

– 如果您已购买DGC实例,请进入续费管理页面,在实例列表中查找所需续费 的DGC实例,单击其所在行的“开通自动续费”,然后请根据页面提示完成 自动续费的开通。

您也可以进行手动续费,请进入续费管理页面,在列表中查找所需续费的DGC实 例,单击其所在行的“续费”,进行手动续费操作。有关续费的更多信息,请参 见续费管理。

● “套餐包”计费模式的DGC增量包

“套餐包”计费模式的DGC增量包,在订单周期结束后,会自动转为“按需计 费”方式。

如果希望继续享受“套餐包”的优惠方式,请在所购买的套餐包时长用完前进行 再次购买。

如需再次购买,请进入续费管理页面,找到所需购买的DGC增量包,然后单击

“再次购买”。

● “按需计费”的DGC增量包

按需计费是按每小时扣费,当余额不足时,就会导致欠费,因此在欠费前请及时 充值。

欠费后,按需资源进入保留期。保留期满,若您仍未支付账户欠款,相应的云服 务资源将被释放,您资源中的数据也会被删除。

如需充值,请进入续费管理页面,在左侧导航树单击“总览”,在总览页面单击

“充值”对账户进行充值。

到期与欠费

● 到期

DGC基础包套餐

DGC基础包套餐采用包年包月计费模式,套餐到期后进入保留期。保留期 内,数据仍予以保留,但是您将无法访问DGC实例,您无法在DGC管理控制 台进行操作,相关接口也无法调用。如果在保留期结束时您没有续费,DGC 将终止服务,系统中的数据也将被永久删除。

DGC增量包

按需购买的DGC增量包,没有到期,只要账户中有余额就可以继续使 用。

DGC增量包的套餐包到期后进入保留期,保留期内,数据仍予以保留,

但是您无法在DGC管理控制台进行操作,相关接口也无法调用。若保留 期到期您仍未续费,相应的资源将被释放,您资源的内容也会被删除。

● 欠费

– DGC基础包套餐和DGC增量包的套餐包采用包年包月的计费模式,没有欠费 的概念,在所购买的时长用完时套餐结束。

(34)

– 按需购买的DGC增量包是按每小时扣费,当余额不足,无法对上一个小时的 费用进行扣费,就会导致DGC增量包欠费,欠费后有保留期。您续费后解冻 相关资源,可继续正常使用,请注意在保留期进行的续费,是以原到期时间 作为生效时间,您应当支付从进入保留期开始到续费时的服务费用。

退订

DGC服务套餐生效期间,您可以根据需要,灵活退订DGC包年包月套餐。有关退订的 更多信息,请参见退订管理。

产品介绍 8 计费说明

(35)

9 DGC 权限管理

如果您需要对购买的DGC资源,给企业中的员工设置不同的访问权限,以达到不同员 工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access

Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分 配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。

通过IAM,您可以在华为云帐号中给员工创建IAM用户,并授权来控制他们对华为云资 源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有DGC的使用 权限,但是不希望他们拥有删除工作空间等高危操作的权限,那么您可以使用IAM为 开发人员创建用户,通过授予仅能使用DGC服务,但是不允许删除工作空间的权限,

控制他们对DGC资源的使用范围。

IAM是华为云提供权限管理的基础服务,无需付费即可使用,您只需要为您帐号中的 资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。

DGC 权限

默认情况下,管理员创建的IAM用户没有任何权限,需要将其加入用户组,并给用户 组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。

授权后,用户就可以基于被授予的权限对云服务进行操作。

DGC部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区 域级项目”,然后在指定区域对应的项目中设置相关权限,并且该权限仅对此项目生 效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问DGC 时,需要先切换至授权区域。

IAM角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机 制。该机制以服务为粒度,提供有限的服务相关角色用于授权。IAM角色并不能 满足用户对精细化授权的要求,无法完全达到企业对权限最小化的安全管控要 求。

DGC基于IAM角色的权限控制,提供了基于工作空间角色授权的能力,这是一种 更加灵活的授权方式,可以精确到具体的操作。

如表9-1所示,DGC的IAM系统角色包括DAYU Administrator和DAYU User;工作 空间角色是基于IAM角色DAYU User进一步授予的,DGC权限列表列出了DGC常 用操作与工作空间角色的授权关系,您可以参照这些权限列表选择合适的角色。

(36)

9-1 DGC 系统角色

系统角色名称 描述 类别

DAYUAdministrato r

数据湖治理中心DGC管理员权限,拥有对DGC的 所有执行权限。具备对所有工作空间的所有权 限。

说明Tenant Administrator具有除统一身份认证服务外,其 他所有服务的所有执行权限。即Tenant Administrator 权限的用户也拥有对DGC的所有执行权限。

系统角色

DAYU User 数据湖治理中心DGC普通用户,拥有被授予的工 作空间的指定角色的权限。

赋予DAYU User策略的用户具有什么权限,依赖 于该用户在工作空间中被赋予什么角色。工作空 间有管理员、开发者、运维者和访客四种角色,

每种角色的操作权限请参见DGC权限列表。

系统角色

用户通过工作空间角色与权限进行关联,可满足不同的授权需求。DGC角色的授权方 法,请参见授权用户使用DGC。

相关链接

IAM产品介绍

● 授权用户使用DGC

产品介绍 9 DGC 权限管理

(37)

10 DGC 权限列表

工作空间成员共有管理员、开发者、运维者和访客四种角色,本文将为您介绍具体角 色的权限说明。

说明

华为云帐号、拥有DAYU Administrator或Tenant Administrator权限的用户具有DGC的所有 执行权限,包括购买DGC实例或DGC增量包的权限。其他用户默认情况下不具备购买DGC的权 限,如需购买,您需要给用户赋予所需的权限。

Tenant Administrator权限具有所有云服务的管理员权限(除IAM管理权限之外),为安全起 见,一般不建议给IAM用户授予该权限,请谨慎操作。

工作空间

权限点 管理员 开发者 运维者 访客

创建工作空间 DAYU Administrator或Tenant Administrator权限的用户拥有该 功能操作权限。

修改工作空间 Y N N N

禁用/启用工作空 间

Y N N N

查询工作空间 Y Y Y Y

添加工作空间成 员

Y N N N

修改工作空间成

员 Y N N N

移除工作空间成

员 Y N N N

查询工作空间成

员 Y Y Y Y

(38)

管理中心

权限点 管理员 开发者 运维者 访客

创建数据连接 Y Y N N

更新数据连接 Y Y N N

删除数据连接 Y Y N N

获取数据连接 Y Y Y Y

测试数据连接 Y Y N N

获取数据源类型

列表 Y Y Y Y

获取数据资产可 用数据源类型列 表

Y Y Y Y

查询hive连接信息 Y Y Y Y

获取数据源目录 列表

Y Y Y Y

数据源扩展表信 息更新

Y Y N N

创建数据采集任 务

Y Y N N

获取obs桶列表 Y Y Y Y

获取obs桶中文件 列表

Y Y Y Y

导入数据源 Y Y N N

导出数据源 Y Y N N

获取kms密钥列表 Y Y Y Y

获取cdm集群列 表

Y Y Y Y

规范设计

权限点 管理员 开发者 运维者 访客

查看统计信息 Y Y Y Y

导入主题设计 Y Y Y N

导出主题设计 Y Y Y N

查看主题设计 Y Y Y Y

产品介绍 10 DGC 权限列表

(39)

权限点 管理员 开发者 运维者 访客

创建主题设计 Y Y N N

查询所有表 Y Y Y Y

查看业务表 Y Y Y Y

创建、编辑业务表 Y Y N N

删除业务表 Y Y N N

业务表关联主题设 计

Y Y N N

关系建模导入 Y Y Y N

关系建模导出 Y Y Y N

逆向数据库 Y Y N N

创建标签 Y Y N N

关联、移除标签 Y Y N N

关联数据标准 Y Y N N

查看DDL模板 Y Y Y Y

更新、恢复默认

DDL模板 Y Y N N

预览SQL Y Y Y Y

查看原子指标 Y Y Y Y

创建、编辑原子指 标

Y Y N N

删除原子指标 Y Y N N

查看维度列表 Y Y Y Y

创建、编辑维度 Y Y N N

删除维度 Y Y N N

查看衍生指标列表 Y Y Y Y

创建、编辑衍生指 标

Y Y N N

删除衍生指标 Y Y N N

查看复合指标列表 Y Y Y Y

创建、编辑复合指 标

Y Y N N

删除复合指标 Y Y N N

(40)

权限点 管理员 开发者 运维者 访客

查看时间限定 Y Y Y Y

创建、编辑时间限

定 Y Y N N

删除时间限定 Y Y N N

编辑、删除系统默

认时间限定 Y N N N

查看维度表 Y Y Y Y

删除维度表 Y Y N N

查看事实表 Y Y Y Y

创建、编辑事实表 Y Y N N

删除事实表 Y Y N N

查看汇总表 Y Y Y Y

创建、编辑汇总表 Y Y N N

删除汇总表 Y Y N N

查看目录 Y Y Y Y

创建目录 Y Y N N

编辑目录 Y Y N N

删除目录 Y Y N N

查看码表 Y Y Y Y

创建、编辑码表 Y Y N N

删除码表 Y Y N N

导入导出码表 Y Y Y N

添加码表数据 Y Y N N

查看数据标准 Y Y Y Y

创建、编辑数据标 准

Y Y N N

删除数据标准 Y Y N N

查看数据标准模板 Y Y Y Y

编辑数据标准模板 Y N N N

查看模型 Y Y Y Y

创建、编辑模型 Y Y N N

产品介绍 10 DGC 权限列表

(41)

权限点 管理员 开发者 运维者 访客

删除模型 Y Y N N

查看OBS文件夹、

详情 Y Y Y Y

创建、更新、删除

OBS目录 Y Y N N

查看审核人 Y Y Y Y

添加审核人 Y N N N

删除审核人 Y N N N

发布、下线各项定

义 Y Y Y N

同步表模型 Y N N N

试运行衍生指标 Y Y N N

运行衍生指标 Y Y Y N

编辑调度 Y Y Y N

启动、停止调度 Y Y Y N

查看调度列表、实

例信息、运行日志 Y Y Y N

字段类型的增、

删、改、查 Y N N N

数据集成之批量数据迁移

权限点 管理员 开发者 运维者 访客

查询连接 Y Y Y Y

测试连接 Y Y Y N

测试连通性 Y Y Y N

创建连接 Y Y Y N

删除连接 Y Y Y N

查询历史作业 Y Y Y Y

查询整库作业 Y Y Y Y

查询普通作业 Y Y Y Y

查询作业名称是否 存在

Y Y Y Y

(42)

权限点 管理员 开发者 运维者 访客 查询单个作业的状

态 Y Y Y Y

取连接元数据 Y Y Y Y

创建连接元数据 Y Y Y N

修改连接元数据 Y Y Y N

保存作业 Y Y Y N

编辑作业 Y Y Y N

执行作业 Y Y Y N

停止作业 Y Y Y N

查询多个作业的状

态 Y Y Y Y

查询作业详情 / 查

看作业JSON Y Y Y Y

查询作业执行的历

史记录 Y Y Y Y

查看作业日志 Y Y Y Y

删除作业 Y Y Y N

导入作业 Y Y Y N

导出作业 Y Y Y N

备份作业 Y Y Y N

查询作业分组 Y Y Y Y

创建作业分组 Y Y Y N

修改作业分组 Y Y Y N

删除作业分组 Y Y Y N

查询配置变量 Y Y Y N

设置配置变量 Y Y Y N

用户隔离 Y Y Y N

弹性IP检测授权 Y N N N

重启集群 Y Y N N

绑定EIP Y N N N

解绑EIP Y N N N

修改集群信息 Y Y N N

产品介绍 10 DGC 权限列表

(43)

权限点 管理员 开发者 运维者 访客

删除集群 Y Y N N

创建动态集群 Y Y N N

查询集群列表 Y Y Y Y

查询单个集群详情 Y Y Y Y

查询单个实例详情 Y Y Y Y

集群统计信息 Y Y Y Y

集群agent Y Y Y N

数据集成之实时数据接入

权限点 管理员 开发者 运维者 访客

创建通道 Y Y Y N

创建转储任务 Y Y Y N

创建标签 Y Y Y N

更新通道 Y Y Y N

更新转储任务 Y Y Y N

变更分区数量 Y Y Y N

更新标签 Y Y Y N

删除通道 Y Y Y N

删除转储任务 Y Y Y N

删除标签 Y Y Y N

新增通道授权 Y Y Y N

删除通道授权 Y Y Y N

查询通道授权 Y Y Y Y

查询通道详情 Y Y Y Y

查询转储任务详情 Y Y Y Y

查询用户转储任务

概况 Y Y Y Y

查询通道列表 Y Y Y Y

查询转储任务列表 Y Y Y Y

查询通道分区数量 Y Y Y Y

(44)

权限点 管理员 开发者 运维者 访客

查询标签列表 Y Y Y Y

查询转储日志列表 Y Y Y Y

查询用户实例使用

概况 Y Y Y Y

上传流式数据 Y Y Y N

下载流式数据 Y Y Y N

获取数据游标 Y Y Y N

新增CheckPoint Y Y Y N

查询CheckPoint Y Y Y N

删除CheckPoint Y Y Y N

consumerGroup 心跳

Y Y Y N

consumerGroup

新增 Y Y Y N

consumerGroup

离线 Y Y Y N

consumerGroup

同步 Y Y Y N

查询通道监控信息 Y Y Y Y

查询分区监控信息 Y Y Y Y

创建APP Y Y Y N

删除APP Y Y Y N

查询APP列表 Y Y Y Y

查询APP详情 Y Y Y Y

获取通道消费信息 Y Y Y Y

查询用户的事件列

表 Y Y Y Y

查询支持订阅事件

列表 Y Y Y Y

创建用户事件订阅 Y Y Y N

删除用户事件订阅 Y Y Y N

更新用户事件订阅 Y Y Y N

产品介绍 10 DGC 权限列表

(45)

权限点 管理员 开发者 运维者 访客 查询用户事件订阅

列表 Y Y Y Y

数据开发

权限点 管理员 开发者 运维者 访客

获取环境变量列表 Y Y Y Y

更新环境变量 Y Y N N

导入环境变量 Y Y N N

导出环境变量 Y Y N N

获取数据表列表 Y Y Y Y

查看表详情 Y Y Y Y

创建数据表 Y Y N N

更新数据表 Y Y N N

删除数据表 Y Y N N

获取数据库列表 Y Y Y Y

查看数据库详情 Y Y Y Y

新建数据库 Y Y N N

更新数据库 Y Y N N

删除数据库 Y Y N N

获取schema列表 Y Y Y Y

查看schema详情 Y Y Y Y

创建schema Y Y N N

更新schema Y Y N N

删除schema Y Y N N

获取目录树 Y Y Y Y

新建目录 Y Y N N

更新目录 Y Y N N

删除目录 Y Y N N

执行脚本 Y Y Y N

创建脚本 Y Y N N

(46)

权限点 管理员 开发者 运维者 访客

获取脚本详情 Y Y Y Y

更新脚本 Y Y N N

删除脚本 Y Y N N

脚本列表 Y Y Y Y

取消执行 Y Y Y N

导入脚本 Y Y N N

导出脚本/执行结 果

Y Y Y N

创建解决方案 Y Y N N

删除解决方案 Y Y N N

更新解决方案 Y Y N N

查看解决方案详情 Y Y Y Y

获取解决方案列表 Y Y Y Y

导出解决方案 Y Y Y N

导入解决方案 Y Y N N

获取作业列表 Y Y Y Y

查看作业详情 Y Y Y Y

创建作业 Y Y N N

重命名作业 Y Y N N

删除作业 Y Y N N

更新作业 Y Y Y N

导出作业 Y Y Y N

导入作业 Y Y N N

导入作业校验参数 Y Y Y N

测试运行 Y Y Y N

暂停作业运行 Y Y Y N

继续执行作业 Y Y Y N

运行作业 Y Y Y N

停止作业 Y Y Y N

获取实例列表 Y Y Y Y

产品介绍 10 DGC 权限列表

(47)

权限点 管理员 开发者 运维者 访客

重跑实例 Y Y Y N

停止实例 Y Y Y N

强制成功 Y Y Y N

继续执行实例 Y Y Y N

实时作业禁用 Y Y Y N

实时作业恢复 Y Y Y N

作业节点手工重试 Y Y Y N

跳过作业节点 Y Y Y N

暂停作业节点 Y Y Y N

恢复作业节点 Y Y Y N

强制成功 Y Y Y N

查看数据连接详情 Y Y Y Y

获取数据连接列表 Y Y Y Y

创建数据连接 Y Y N N

更新数据连接 Y Y N N

删除数据连接 Y Y N N

测试数据连接 Y Y N N

导入数据连接 Y Y Y N

导出数据连接 Y Y Y N

获取资源列表 Y Y Y Y

查看资源详情 Y Y Y Y

创建资源 Y Y N N

更新资源 Y Y N N

删除资源 Y Y N N

导入资源 Y Y Y N

导出资源 Y Y Y N

启动每日备份 Y Y Y N

停止每日备份 Y Y Y N

获取备份列表 Y Y Y Y

获取通知列表 Y Y Y Y

(48)

权限点 管理员 开发者 运维者 访客

配置通知 Y Y N N

更新通知 Y Y N N

删除通知 Y Y N N

创建作业监控补数

据 Y Y N N

补数据监控列表 Y Y Y Y

停止作业补数据 Y Y Y N

数据质量

权限点 管理员 开发者 运维者 访客

获取目录 Y Y Y Y

创建目录 Y Y N N

修改目录 Y Y N Y

删除目录 Y Y N N

查看规则列表 Y Y Y Y

查看规则详情 Y Y Y Y

创建规则 Y Y N N

编辑规则 Y Y N N

删除规则 Y Y N N

运行规则 Y Y Y N

停止规则运行实例 Y Y Y N

启动调度 Y Y Y N

停止调度 Y Y Y N

查看运行结果 Y Y Y N

查看总览数据 Y Y Y Y

处理问题 Y Y Y N

查看运行历史 Y Y Y Y

查看运行详情 Y Y Y Y

查看日志 Y Y Y Y

校验规则模板 Y N N N

产品介绍 10 DGC 权限列表

(49)

权限点 管理员 开发者 运维者 访客

新建规则模板 Y N N N

删除规则模板 Y N N N

查看规则模板列表 Y Y Y Y

编辑规则模板 Y N N N

查看规则模板详情 Y Y Y Y

业务指标

查看目录 Y Y Y Y

创建目录 Y Y N N

修改目录 Y Y N N

删除目录 Y Y N N

查看指标 Y Y Y Y

创建指标 Y Y N N

修改指标 Y Y N N

删除指标 Y Y N N

查看规则 Y Y Y Y

创建规则 Y Y N N

修改规则 Y Y N N

删除规则 Y Y N N

查看业务场景 Y Y Y Y

创建业务场景 Y Y N N

修改业务场景 Y Y N N

删除业务场景 Y Y N N

运行业务场景 Y Y Y N

查看日志 Y Y Y Y

启动调度 Y Y Y N

停止调度 Y Y Y N

查看运行结果 Y Y Y Y

查看总览数据 Y Y Y Y

处理问题 Y Y Y N

(50)

数据资产

权限点 管理员 开发者 运维者 访客

创建采集任务 Y Y N N

更新采集任务 Y Y N N

删除采集任务 Y Y N N

查看采集任务 Y Y Y Y

运行、启动调度、

停止调度采集任务 Y Y Y N

查询任务实例运行

状态 Y Y Y Y

停止任务实例运行 状态

Y Y Y N

重跑任务实例 Y Y Y N

创建任务目录 Y Y N N

修改任务目录 Y Y N N

删除任务目录 Y Y N N

获取任务目录列表 Y Y Y Y

技术资产高级搜索 Y Y Y Y

获取保存的搜索条

件 Y Y Y Y

保存搜索条件 Y Y N N

删除搜索条件 Y Y N N

业务资产搜索 Y Y Y Y

获取业务资产目录

树 Y Y Y Y

获取技术资产查询 条件

Y Y Y Y

获取实体详情 Y Y Y Y

删除实体指定的关 联分类

Y Y N N

批量删除实体 Y Y N N

创建类别 Y Y N N

创建标签 Y Y N N

获取类别详情 Y Y Y Y

产品介绍 10 DGC 权限列表

(51)

权限点 管理员 开发者 运维者 访客

更新类别 Y Y N N

删除类别 Y Y N N

获取标签详情 Y Y Y Y

更新标签 Y Y N N

删除实体关联的标

签 Y Y N N

实体关联标签 Y Y N N

获取数据开发模块

算子的血缘信息 Y Y Y Y

资产统计接口 Y Y Y Y

技术资产历史统计 Y Y Y Y

业务资产统计 Y Y Y Y

技术资产统计 Y Y Y Y

技术资产业务资产

总量统计 Y Y Y Y

导入采集任务 Y Y Y N

导出采集任务 Y Y Y N

导入分类标签 Y Y Y N

导出分类标签 Y Y Y N

创建标签 Y Y N N

获取标签列表 Y Y Y Y

给实体添加标签 Y Y N N

删除实体的标签 Y Y N N

创建分类 Y Y N N

删除分类 Y Y N N

更新分类 Y Y N N

获取分类列表 Y Y Y Y

添加分类至资产 Y Y N N

获取列的完整性 Y Y Y Y

获取列的合法性 Y Y Y Y

创建数据权限规则 Y N N N

(52)

权限点 管理员 开发者 运维者 访客

删除数据权限规则 Y N N N

查看数据权限规则 Y Y Y Y

修改数据权限规则 Y N N N

查看数据权限规则

列表 Y Y Y Y

设置数据权限生效

状态 Y N N N

数据服务

权限点 管理员 开发者 运维者 访客

创建DLM 专享版集 群

具备以下权限之一的用户才能进行该操作:

● DAYU Administrator并且拥有VPCEndpoint Administrator权限

● Tenant Administrator并且拥有VPCEndpoint Administrator权限 删除DLM

专享版集 群

具备以下权限之一的用户才能进行该操作:

● DAYU Administrator并且拥有VPCEndpoint Administrator权限

● Tenant Administrator并且拥有VPCEndpoint Administrator权限 查询DLM

专享版集 群

Y Y Y Y

查看API Y Y Y Y

创建API Y Y N N

注册API Y Y N N

删除API Y Y N N

复制API Y Y N N

导入API Y Y Y N

导出API Y Y Y N

编辑API Y Y N N

调试API Y Y Y N

发布API Y Y Y N

下线API Y Y Y N

添加授权 Y Y Y N

产品介绍 10 DGC 权限列表

數據

表 9-1 DGC 系统角色 系统角色名称 描述 类别 DAYU Administrato r 数据湖治理中心DGC管理员权限,拥有对DGC的所有执行权限。具备对所有工作空间的所有权限。 说明 Tenant Administrator具有除统一身份认证服务外,其 他所有服务的所有执行权限。即Tenant Administrator 权限的用户也拥有对DGC的所有执行权限。 系统角色 DAYU User 数据湖治理中心DGC普通用户,拥有被授予的工 作空间的指定角色的权限。 赋予DAYU User策略的用户具

參考文獻

相關文件

超定方程组QR分解算法 数据拟合确定常微分方程..

操作流程: 系統選單->財產管理系統->點選報廢申請單->填寫報廢申請單資料(主 單、明細)->點選確認

圖4 1 整合資訊系統風險 圖4.1 整合資訊系統風險..

為紀念其雙親終生默默行善,設置此助學金,幫助家境 清寒學生順利完成學業。89 學年度至 91 學年度,每學 年捐資 18 萬元。92 學年度至 95 學年度,每學年捐資 10

因此若將效率應用在教育機構方面,陳云愷【 45】認為教育

相簿輪播: 只要在 [相簿]

[r]

,在需求分析过程中应该建立起软件系统的 行为模型。状态转换图 ( 简称为状态图 ) 通