功能说明
用户需要查看集群的监控指标信息时,可以通过云监控(Cloud Eye)确认集群各项指 标情况。通过监控集群运行时的各项指标,用户可以识别出数据库集群状态异常的时 间段,然后在数据库日志中,分析可能存在问题的活动,从而优化数据库性能。本章 节定义了数据仓库服务上报云监控服务的监控指标的命名空间、监控指标列表和维度 定义。用户可以通过云监控服务提供的管理控制台或API接口来检索数据仓库服务产生 的监控指标和告警信息。
命名空间
SYS.GaussDB(DWS)
集群监控指标
cal_reads 文件读取 次数
cal_writes 文件写入 次数
指标ID 指标名称 含义 取值范围 测量对象&
e_sql_count 活跃SQL 数
usage CPU使用 率
指标ID 指标名称 含义 取值范围 测量对象&
_usage 内存使用
率 该指标用于统计每个
dws012_iops IOPS 该指标用于统计每个 集群节点每秒处理的
total_size 磁盘总大 小
2000GB 测量对象:
数据仓库节
指标ID 指标名称 含义 取值范围 测量对象&
used_size 磁盘使用
量 该指标用于统计每个
集群节点的数据磁盘 已用大小。
单位:吉字节(GB)
0GB~3600GB 测量对象:
数据仓库节
维度
Key Value
datastore_id 数据仓库集群ID dws_instance_id 数据仓库节点ID
查看集群监控和节点监控信息
步骤1 登录GaussDB(DWS) 管理控制台,进入“集群管理”页面。
步骤2 查看集群信息:在集群列表中,在指定集群所在行,单击“查看监控指标”,打开云 监控管理控制台。默认显示的是集群监控信息。
用户可以根据需要,选择指定的监控指标名称以及时间范围,从而显示监控指标的性 能曲线。
步骤3 查看节点信息:单击 可回到云监控管理控制台,右侧切换到“数据仓库节点”页 签,可以从集群节点维度查看每个节点的指标。
用户可以根据需要,选择指定的监控指标名称以及时间范围,从而显示监控指标的性 能曲线。
云监控也支持多个节点间的监控指标对比,具体操作请参见多节点间的监控指标对 比。
----结束
多节点间的监控指标对比
步骤1 在云监控管理控制台的左侧导航栏中,选择“总览 > 监控面板”。
步骤2 在“监控面板”页面,单击“创建监控面板”,在弹出对话框中,输入“名称”后,
单击“确定”。
步骤3 在“监控面板”页面,单击右上角的“添加监控视图”。
步骤4 在弹出的“添加监控视图”窗口中,配置标题和监控项。
说明
单击“添加监控项”可以添加多个监控指标。
图7-1 添加监控视图
以对比两个节点间的CPU使用率为例,参数设置如下表所示。
表7-2 配置样例
参数名 样例值
资源类型 数据仓库服务
维度 数据仓库节点
监控对象 dws-demo-dws-cn-cn-2-1 dws-demo-dws-cn-cn-1-1 dws-demo-dws-dn-1-1
监控指标 CPU使用率
步骤5 单击“确定”。
添加成功后,可在“监控面板”区域看到对应的监控视图。鼠标移至监控视图单击右 上角的 ,可放大监控视图,查看详细的指标对比数据。
图7-2 查看监控视图
----结束
创建告警规则
通过设置GaussDB(DWS) 的告警规则,用户可以自定义监控目标和通知策略,及时了 解GaussDB(DWS) 运行状态,从而起到预警作用。
设置GaussDB(DWS) 的告警规则包括设置告警规则名称、监控对象、监控指标、告警 阈值、监控周期和是否发送通知等参数。本节介绍设置GaussDB(DWS) 规则的具体方 法。
步骤1 登录GaussDB(DWS) 管理控制台。
步骤2 在左侧导航栏中选择“集群管理”。
步骤3 在指定集群所在行的“操作”列中,单击“查看监控指标”,进入云监控管理控制 台,查看数据仓库服务监控信息。
确认待查看“监控信息”的集群状态必须为“可用”,否则不能进行创建告警操作。
步骤4 在云监控管理控制台的左侧导航树上,选择“告警 > 告警规则”。
步骤5 在“告警规则”界面,单击右上方“创建告警规则”。
步骤6 在“创建告警规则”界面,根据界面提示配置参数。
1. 配置规则名称和描述。
2. 配置告警内容,根据界面提示配置参数。
图7-3 选择监控对象
图7-4 设置告警策略
表7-3 配置告警内容
参数名称 参数说明 取值样例
资源类型 配置告警规则监控的云服务资源名 称。
数据仓库服务
参数名称 参数说明 取值样例
GaussDB(DWS) 而言,选择您创建的 集群实例ID或节点ID。单击 将
图7-5 配置告警通知
表7-4 配置告警通知
参数名称 参数说明 取值样例
发送通知 配置是否发送邮件、短信、HTTP和HTTPS通知用 户。
选择“是”(推荐选择),会发送通知;选择
“否”,不会发送通知。
是
生效时间 该告警规则仅在生效时间内发送通知消息。
如生效时间为00:00-8:00,则该告警规则仅在 00:00-8:00发送通知消息。
-通知对象 需要发送告警通知的主题名称。
当发送通知选择“是”时,需要选择已有的主题名 称,若此处没有需要的主题则需先创建主题,该功 能会调用消息通知服务(SMN),创建主题请参见
《消息通知服务用户指南》。
-触发条件 可以选择“出现告警”、“恢复正常”两种状态,
作为触发告警通知的条件。
-4. 配置完成后,单击“立即创建”,完成告警规则的创建。
告警规则添加完成后,当监控指标触发设定的阈值时,云监控会在第一时间通过 消息通知服务实时告知您资源异常,以免因此造成业务损失。
----结束
配置 OBS 转储
云监控各监控指标的原始数据的保留周期为两天,超过保留周期后原始数据将不再保 存。用户可以开通对象存储服务,然后将原始数据同步保存至OBS,以保存更长时 间。
关于如何配置OBS转储,具体请参见《云监控服务用户指南》中的配置OBS数据存储 章节。
相关链接
● 资源负载管理
● 资源监控