• 沒有找到結果。

RDS for MySQL 到 Kafka 同步实例

对比同步项

5.2.9 RDS for MySQL 到 Kafka 同步实例

本小节以RDS for MySQL->Kafka的出云同步为示例,介绍如何使用数据复制服务配置

操作步骤

SMN主题 “任务异常通知设置”项开启后可见,需提前在SMN上申请主题并 添加订阅。

SMN主题申请和订阅可参考《消息通知服务用户指南》。

时延阈值 在增量同步阶段,源数据库和目标数据库之间的同步有时会存在一 个时间差,称为时延,单位为秒。

时延阈值设置是指时延超过一定的值后(时延阈值范围为1—

3600s),DRS可以发送告警通知。告警通知将在时延稳定超过设定 的阈值6min后发送,避免出现由于时延波动反复发送告警通知的情 况。

说明

● 首次进入增量同步阶段,会有较多数据等待同步,存在较大的时延,属于 正常情况,不在此功能的监控范围之内。

● 设置时延阈值之前,需要设置任务异常通知。

参数 描述 任务异常自

动结束时间

(天)

设置任务异常自动结束天数,输入值必须在14-100之间。

说明

异常状态下的任务仍然会计费,而长时间异常的任务无法续传和恢复。设置 任务异常自动结束天数后,异常且超时的任务将会自动结束,以免产生不必 要的费用。

描述 描述不能超过256位,且不能包含! = < > & ' " \ 特殊字符。

5-59 同步实例信息

5-50 同步实例信息

参数 描述

数据流动方向 选择“出云”。

源数据库引擎 选择“MySQL”。

目标数据库引擎 选择“Kafka”。

网络类型 此处以“公网网络”为示例。目前支持可选公网网络、VPC网 络、VPN网络和专线网络。

源数据库实例 源数据库的RDS for MySQL实例。

参数 描述

同步类型 增量。

增量同步通过解析日志等技术,将源端产生的增量实时同步至 目标端。

无需中断业务,实现同步过程中源业务和数据库继续对外提供 访问。

企业项目 对于已成功关联企业项目的用户,仅需在“企业项目”下拉框 中选择目标项目。

如果需要自定义企业项目,请前往项目管理服务进行创建。关 于如何创建项目,详见《项目管理用户指南》。

标签 可选配置,对同步任务的标识。使用标签可方便管理您的实时 同步任务。每个任务最多支持10个标签配额。

任务创建成功后,您可以单击实例名称,在“标签”页签下查 看对应标签。关于标签的详细操作,请参见标签管理。

步骤3 在“源库及目标库”页面,同步实例创建成功后,填选源库信息和目标库信息,建议 您单击“源库和目标库”处的“测试连接”,分别测试并确定与源库和目标库连通 后,勾选协议,单击“下一步”。

5-60 源库信息

5-51 源库信息

参数 描述

数据库实例名称 默认为创建迁移任务时选择的关系型数据库实例,不可进行修 改。

数据库用户名 源数据库的用户名。

数据库密码 源数据库的用户名所对应的密码。

说明

源数据库的数据库用户名和密码,会被系统加密暂存,直至删除该迁移任务后自动清除。

5-61 目标库信息

5-52 源库信息

参数 描述

IP地址或域名 目标数据库的IP地址或域名。

步骤4 在“设置同步”页面,选择同步策略、数据格式和同步对象,单击“下一步”。

5-62 同步模式

5-53 同步对象

参数 描述 Topic名字

格式 Topic名字格式,同步Topic策略选择“自动生成Topic名字”时可见。

Topic名字格式支持database和tablename两个变量,其他字符都当做 常量。分别用$database$代替数据库名,$tablename$代替表名。

例如:配置成$database$-$tablename$时,如果数据库名称为db1,

表名为tab1,则Topic名字为db1-tab1。如果是DDL语句,

$tablename$为空,则Topic名字为db1.

同步到kafka partition策 略

同步到kafka partition策略。

● 按库名+表名的hash值投递到不同Partition:适用于单表的查询场 景,表内保序,表与表之间不保序,可以提高单表读写性能,推荐 使用此选项。

● 全部投递到Partition 0:适用于有事务要求的场景,事务保序,可 以保证完全按照事务顺序消费,写入性能比较差,如果没有强事务 要求,不推荐使用此选项。投递到Partition 0必须是自动创建 Topic,选择已有Topic不支持该选项。

● 按表的主键值hash值投递到不同的Partion:适用于一个表一个 Topic的场景。

投送到kafka的数 据格式

选择MySQL投送到kafka的数据格式。

● Avro:可以显示Avro二进制编码,高效获取数据。

● JSON:为Json消息格式,方便解释格式,但需要占用更多的空间。

● JSON-C:一种能够兼容多个批量,流式计算框架的数据格式。

详细格式可参考Kafka消息格式。

同步对象 同步对象支持表级同步、库级同步、导入对象文件,您可以根据业务

5-63 数据加工

步骤6 在“预检查”页面,进行同步任务预校验,校验是否可进行实时同步。

● 查看检查结果,如有不通过的检查项,需要修复不通过项后,单击“重新校验”

按钮重新进行任务预校验。

预检查不通过项处理建议请参见《数据复制服务用户指南》中的“预检查不通过 项修复方法”。

● 预检查完成后,且所有检查项结果均通过时,单击“下一步”。

5-64 预检查

说明

步骤8 同步任务提交后,您可在“实时同步管理”页面,查看并管理自己的任务。

● 您可查看任务提交后的状态,状态请参见任务状态。

● 在任务列表的右上角,单击 刷新列表,可查看到最新的任务状态。

----结束