3.8.1 支持的监控指标
前提条件
使用CDM监控功能,需获取CES相关权限。
功能说明
本节定义了批量数据迁移上报云监控的监控指标的命名空间、监控指标列表和维度定 义,用户可以通过云监控提供的API接口来检索监控指标。
命名空间
SYS.CDM
监控指标
CDM集群支持的监控指标如表3-2所示。
表3-2 CDM 的监控指标
bytes_i
n 网络流
bytes_o
ut 网络流
cpu_us
age CPU使 用率
该指标用于统计测量对 象的CPU使用率。
单位:%。
0%~100% CDM集群 实例
1分钟
mem_u
sage 内存使
disk_us
age 磁盘利
0.001%~9
0% CDM集群
实例 1分钟
disk_io 磁盘io 该指标为从物理机层面 采集的磁盘每秒读取和 写入的字节数,数据准 确性低于从弹性云服务 器内部采集的数据。
单位:Byte/sec
0~10GB CDM集群 实例
1分钟
tomcat _heap_
usage
堆内存
0.001%~9
0% CDM集群
实例 1分钟
tomcat _conne ct
tomcat 并发连 接数
该指标为从物理机层面 采集的tomcat并发连接 数。
单位:Count/个。
0~214748
3647 CDM集群 实例
1分钟
指标ID 指标名 称
含义 取值范围 测量对象 监控周期
(原始指 标)
tomcat _thread _count
tomcat 线程数
该指标为从物理机层面 采集的tomcat所占线程 数。
单位:Count/个。
0~214748
3647 CDM集群
实例 1分钟
pg_con
nect 数据库 连接数
该指标为从物理机层面 采集的postgres数据库 连接数。
单位:Count/个。
0~214748
3647 CDM集群
实例 1分钟
pg_sub mission _row
历史记 录表行 数
该指标为从物理机层面 采集的postgres数据库 submission表行数。
单位:Count/个。
0~214748
3647 CDM集群 实例
1分钟
pg_fail ed_job_
rate
失败作 业率
该指标为从物理机层面 sqoop进程采集的失败 作业率。
单位:%。
0.001%~1
00% CDM集群
实例 1分钟
inodes_
usage Inodes 利用率
该指标为从物理机层面 采集的磁盘inodes使用 率,数据准确性低于从 弹性云服务器内部采集 的数据。
单位:%。
0.001%~0.
9% CDM集群
实例 1分钟
维度
Key Value
instance_id 云数据迁移服务实例
3.8.2 设置告警规则
操作场景
通过设置CDM集群告警规则,用户可自定义监控目标与通知策略,及时了解CDM集群 运行状况,从而起到预警作用。
设置CDM集群的告警规则包括设置告警规则名称、监控对象、监控指标、告警阈值、
监控周期和是否发送通知等参数。本节介绍了设置CDM集群告警规则的具体方法。
操作步骤
步骤1 进入CDM主界面,选择“集群管理”,选择集群操作列中的“更多 > 查看监控指 标”。
步骤2 点击监控指标页面左上角的返回按钮,进入云监控服务的界面,选择“云数据迁移服 务”服务监控项对应操作列的“创建告警规则”。
图3-16 “云数据迁移服务”服务监控项
步骤3 根据界面提示设置CDM集群的告警规则。
步骤4 设置完成后,单击“确定”。当符合规则的告警产生时,系统会自动进行通知。
说明
更多关于CDM集群监控规则的信息,请参见云监控用户指南。
----结束
3.8.3 查看监控指标
操作场景
您通过云监控服务可以对CDM集群的运行状态进行日常监控。您可以通过云监控管理 控制台,直观地查看各项监控指标。
由于监控数据的获取与传输会花费一定时间,因此,监控显示的是当前时间5~10分钟 前的状态。如果您的CDM集群刚刚创建完成,请等待5~10分钟后查看监控数据。
前提条件
● CDM集群正常运行。
关机、重启失败、不可用状态的集群,无法查看其监控指标。当集群再次启动或 恢复后,即可正常查看。
● CDM集群已正常运行一段时间(约10分钟)。
对于新创建的集群,需要等待一段时间,才能查看上报的监控数据和监控视图。
操作步骤
步骤1 进入CDM主界面,选择“集群管理”,选择集群操作列中的“更多 > 查看监控指 标”。
步骤2 在CDM监控页面,可查看所有监控指标的小图。
图3-17 查看监控指标
步骤3 单击小图右上角的 ,可进入大图模式查看。
步骤4 您可以在左上角选择时长作为监控周期,查看一段时间的指标变化情况。
----结束