多对一实时同步
5.2 常见场景的同步任务配置
5.2.2 DDM 数据库到 GaussDB(DWS)同步实例
本小节以DDM->GaussDB(DWS)的实时同步为示例,介绍如何使用数据复制服务配置 实时同步任务。
前提条件
● 已登录数据复制服务控制台。
● 账户余额大于等于0元。
● 参见实时同步。
● 参见使用须知。
操作步骤
步骤1 在“实时同步管理”页面,单击“创建同步任务”。
步骤2 在“同步实例”页面,填选区域、任务名称、任务异常通知信息、SMN主题、时延阈 值、任务异常自动结束时间、描述、同步实例信息,单击“下一步”。
图5-7 同步任务信息
表5-6 任务和描述
参数 描述
区域 当前所在区域,可进行切换。
任务名称 任务名称在4-50位之间,必须以字母开头,不区分大小写,可以包 含字母、数字、中划线或下划线,不能包含其他的特殊字符。
任务异常通
知设置 该项为可选参数,开启之后,选择对应的SMN主题。当同步任务状 态异常时,系统将发送通知。
SMN主题 “任务异常通知设置”项开启后可见,需提前在SMN上申请主题并 添加订阅。
SMN主题申请和订阅可参考《消息通知服务用户指南》。
时延阈值 在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一 个时间差,称为时延,单位为秒。
时延阈值设置是指时延超过一定的值后(时延阈值范围为1—
3600s),DRS可以发送告警通知。告警通知将在时延稳定超过设定 的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情 况。
说明
● 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于
图5-8 同步实例信息
表5-7 同步实例信息
参数 描述
数据流动方向 选择“入云”。
源数据库引擎 选择“DDM”。
目标数据库引擎 选择“GaussDB(DWS)”。
网络类型 此处以“公网网络”为示例。目前支持可选公网网络、VPC网 络、VPN和专线网络。
目标数据库实例 可用的GaussDB(DWS)实例。
同步实例所在子 网
请选择同步实例所在的子网。也可以单击“查看子网”,跳转 至“网络控制台”查看实例所在子网帮助选择。
默认值为当前所选数据库实例所在子网,请选择有可用IP地址 的子网。为确保同步实例创建成功,仅显示已经开启DHCP的子 网。
同步类型 全量+增量
该模式为数据持续性实时同步,通过全量过程完成目标端数据 库的初始化后,增量同步阶段通过解析日志等技术,将源端和 目标端数据保持数据持续一致。
说明选择“全量+增量”同步模式,增量同步可以在全量同步完成的基础上 实现数据的持续同步,无需中断业务,实现同步过程中源业务和数据库 继续对外提供访问。
参数 描述 源端数据库实例
个数 源端数据库实例个数默认值为2,最大值为16,您需要根据源端 实际的分片数据库个数设置该值大小。
企业项目 对于已成功关联企业项目的用户,仅需在“企业项目”下拉框 中选择目标项目。
如果需要自定义企业项目,请前往项目管理服务进行创建。关 于如何创建项目,详见《项目管理用户指南》。
标签 可选配置,对同步任务的标识。使用标签可方便管理您的实时 同步任务。每个任务最多支持10个标签配额。
任务创建成功后,您可以单击实例名称,在“标签”页签下查 看对应标签。关于标签的详细操作,请参见标签管理。
步骤3 在“源库及目标库”页面,同步实例创建成功后,填选源库信息和目标库信息,建议 您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通 后,勾选协议,单击“下一步”。
图5-9 源库信息
表5-8 源库信息
参数 描述
中间件IP地址或
域名 源数据库的IP地址或域名。
端口 源数据库服务端口,可输入范围为1~65535间的整数。
参数 描述
SSL安全连接 通过该功能,用户可以选择是否开启对迁移链路的加密。如果 开启该功能,需要用户上传SSL CA根证书。
说明
● 最大支持上传500KB的证书文件。
● 如果不使用SSL证书,请自行承担数据安全风险。
数据库实例 根据源库实际的分片数据库,填写对应的数据库信息。
说明
源数据库IP地址、端口、用户名和密码将在同步过程中被加密暂存到数据库和同步实例主机上,
待该任务删除后会永久清除。
图5-10 目标库信息
表5-9 目标库信息
参数 描述
数据库实例名称 默认为创建同步任务时选择的GaussDB(DWS)实例,不可进行修 改。
数据库用户名 目标数据库对应的数据库用户名。
数据库密码 数据库用户名和密码将被系统加密暂存,直至该任务删除后清 除。
说明
目标数据库的用户名和密码将在同步过程中被加密暂存到数据库和同步实例主机上,待该任务删 除后会永久清除。
步骤4 在“设置同步”页面,选择同步对象,单击“下一步”。
图5-11 同步模式
表5-10 同步模式和对象
参数 描述
同步对象 可选表级同步、库级同步,您可以根据业务场景选择对应的数据进行 同步。
● 选择数据的时候支持搜索,以便您快速选择需要的数据库对象。
● 如果有切换源数据库的操作,请在选择同步对象前单击右上角的
,以确保待选择的对象为最新源数据库对象。
● 在同步对象右侧已选对象框中,可以使用对象名映射功能进行源数 据库和目标数据库中的同步对象映射,具体操作可参考对象名映 射。
步骤5 在“数据加工”页面,选择需要加工的表对象,填写需要添加的列名、类型、操作类 型信息,检查无误后,单击“下一步”。
图5-12 数据加工
步骤6 在“预检查”页面,进行同步任务预校验,校验是否可进行实时同步。
● 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”
按钮重新进行任务预校验。
图5-13 预检查
说明
所有检查项结果均通过时,若存在待确认项,需要阅读并确认详情后才可以继续执行下一 步操作。
步骤7 在“任务确认”页面,设置同步任务的启动时间,并确认同步任务信息无误后,勾选 协议,单击“启动任务”,提交同步任务。
说明
● 同步任务的启动时间可以根据业务需求,设置为“立即启动”或“稍后启动”。
● 预计同步任务启动后,会对源数据库和目标数据库的性能产生影响,建议选择业务低峰期,
合理设置同步任务的启动时间。
步骤8 同步任务提交后,您可在“实时同步管理”页面,查看并管理自己的任务。
● 您可查看任务提交后的状态,状态请参见任务状态。
● 在任务列表的右上角,单击 刷新列表,可查看到最新的任务状态。
----结束