4.11 查看主机监控的监控指标
操作场景
本章节指导用户查看主机监控指标,监控指标分为Agent插件采集的细颗粒度的操作系 统级别监控指标和ECS自带的监控指标。
操作系统监控指标和基础监控指标请参见13 支持监控的服务列表。
前提条件
已完成Agent插件的安装。安装请参考4.4 在ECS/BMS中安装配置Agent(Linux)、
4.5.2 安装配置Agent(Windows)进行安装。
操作步骤
1. 登录管理控制台。
2. 单击“服务列表 > 云监控服务”。
3. 查看ECS或BMS的监控指标:
说明
支持企业项目的服务,系统默认展示用户拥有权限的企业项目的主机资源列表。
– 查看ECS操作系统监控指标的方法:单击左侧导航栏的“弹性云服务器”,再 单击ECS实例所在行的“查看监控指标”,如图4-17所示。
图4-17 操作系统监控
– 查看ECS基础监控指标的方法:单击左侧导航栏的“弹性云服务器”,再单击 ECS实例所在行的“查看监控指标”,最后单击“操作系统监控”右侧的“基 础监控”,如图4-18所示。
图4-18 基础监控
– 查看BMS操作系统监控指标的方法:单击右侧导航栏的“裸金属服务器”,
再单击BMS实例所在行的“查看监控指标”。
– 查看进程监控指标的方法:单击左侧导航栏的“弹性云服务器”,再单击实 例所在行的“查看监控指标”,最后单击最右侧的“进程监控”。
4. 查看监控指标。
在“操作系统监控”页面上方,分为CPU、内存、磁盘等不同类型的监控指标。
可查看不同监控指标“近1小时”、“近3小时”、“近12小时”、“近24小 时”、“近7天”和“近30天”的原始监控数据曲线图。您可以选择是否开启“自 动刷新”功能,云监控服务提供了“60秒”自动刷新周期。
5. 在监控指标视图右上角,单击 可查看监控指标视图详情。
页面左上方提供查看“近1小时”、“近3小时”、“近12小时”、“近24小 时”、“近7天”和“近30天”6个固定时长的监控周期,同时也支持以通过“自 定义时间段”选择查看近六个月内任意时间段的历史监控数据。
图4-19 (Agent)CPU 使用率
6. 选择页面左上方的“设置”按钮,进入“聚合”设置页面,对监控数据的聚合方 法进行更改。
– 近1小时”、“近3小时”、“近12小时”、“近24小时”的监控数据:系统 默认显示原始数据。
– “近7天”、“近30天”的监控数据:系统默认显示聚合后的数据。
– “近1小时”、“近3小时”、“近12小时”、“近24小时”GPU 指标数据均 为7中设置的指标采集周期的原始数据。
– 单击监控大图右侧的放大按钮后,可拖动鼠标选择自定义时间段。
4.12 创建主机监控的告警通知
操作场景
本章节指导用户对ECS或BMS的监控指标创建告警规则。
操作步骤
1. 登录管理控制台。
2. 在管理控制台左上角选择区域和项目。
3. 单击“服务列表 > 云监控服务”。
4. 单击页面左侧的“主机监控”,进入主机监控页面。
5. 单击ECS或BMS主机所在栏右侧的“更多”按钮,选择下拉出的“创建告警规 则”。
6. 在“创建告警规则”界面,根据界面提示配置参数。
a. 根据界面提示,配置告警规则基本信息。
表4-15 主机监控告警规则基本信息配置说明
参数 参数说明
名称 系统会随机产生一个名称,用户也可以进行修改。
描述 告警规则描述(此参数非必填项)。
企业项目 告警规则所属的企业项目。只有拥有该企业项目权限的用户 才可以查看和管理该告警规则。
b. 选择监控对象,配置告警内容参数。
表4-16 主机监控告警内容配置说明
参数 参数说明 取值样例
资源类型 配置告警规则监控的服务名称。 弹性云服务器 维度 用于指定告警规则对应指标的维度名称 云服务器
监控范围 告警规则适用的资源范围。 指定资源
参数 参数说明 取值样例 监控对象 监控对象为当前选择的弹性云服务器,无需配
置。
-条件类型 针对弹性云服务器,您可以选择静态阈值和动 态阈值。当前仅在华南-广州上线。
● 静态阈值:指告警触发规则设置成固定的 阈值,如果指标达到设置的阈值,则触发 告警。
● 动态阈值:指告警触发阈值是根据智能计 算指标的历史数据预测指标的阈值,若实 际值偏离预测值,则触发告警。
静态阈值
选择类型 根据需要可选择从模板导入或自定义创建。 自定义创建
模板 选择需要导入的模板。
-告警策略 触发告警规则的-告警策略。
例如:CPU使用率,监控周期为5分钟,连续 三个周期平均值≥80%,每一小时告警一次。
基础监控和操作系统指标请参见13 支持监控 的服务列表。
说明
每一小时告警一次是指告警发生后如果状态未恢复 正常,每间隔一个小时重复发送一次告警通知。
-告警级别 根据告警的严重程度不同等级,可选择紧急、
重要、次要、提示。
重要
c. 根据界面提示,配置告警通知参数。
图4-20 配置主机监控告警通知
表4-17 主机监控告警通知配置说明
参数 参数说明
发送通知 配置是否发送邮件、短信、HTTP和HTTPS通知用户。
参数 参数说明
通知对象 需要发送告警通知的对象,可选择云账号联系人或主题。
● 云账号联系人为注册账号时的手机和邮箱。
● 主题是消息发布或客户端订阅通知的特定事件类型,若此 处没有需要的主题则需先创建主题并订阅该主题,该功能 会调用消息通知服务(SMN),创建主题并添加订阅请 参见3.2.1 创建主题、3.2.2 添加订阅,HTTP(S)终端节点 使用样例请参考消息通知用户指南。
生效时间 该告警规则仅在生效时间内发送通知消息。
如生效时间为08:00-20:00,则该告警规则仅在08:00-20:00 发送通知消息。
触发条件 可以选择“出现告警”、“恢复正常”两种状态,作为触发 告警通知的条件。
d. 配置完成后,单击“立即创建”,完成告警规则的创建。
告警规则添加完成后,当监控指标触发设定的阈值时,云监控服务会在第一时间通过 消息通知服务实时告知您云上资源异常,以免因此造成业务损失。
5 自定义监控
自定义监控展示用户所有自主定义上报的监控指标。用户可以针对自己关心的业务指 标进行监控,将采集的监控数据通过使用简单的API请求上报至云监控服务进行处理和 展示。
查看自定义监控
1. 登录管理控制台。
1. 单击“服务列表 > 云监控服务”。
2. 单击页面左侧的“自定义监控”。
3. 在“自定义监控”页面,可以查看当前用户通过API请求上报至云监控服务的相关 数据,包括自定义上报的服务,指标等。
说明
● 当用户通过API添加监控数据后,云监控服务界面才会显示自定义监控数据。
● 添加监控数据请参见添加监控数据(RESTful API)、添加监控数据(Java SDK)、添 加监控数据(Python SDK)。
4. 选择待查看的云服务资源所在行的“查看监控指标”,进入“监控指标”页面。
在这个页面,用户可以选择页面左上方的时间范围按钮,查看该云服务资源“近1 小时”、“近3小时”、“近12小时”、“近1天”和“近7天”的监控原始数据 曲线图,同时监控指标视图右上角会动态显示对应时段内监控指标的最大值与最 小值。
创建告警规则
1. 登录管理控制台。
2. 单击“服务列表 > 云监控服务”。
3. 单击页面左侧的“自定义监控”。
4. 在“自定义监控”页面,单击待创建的云服务资源所在行的“创建告警规则”。
5. 在“创建告警规则”页面,根据界面提示配置参数,具体参数说明请参见表3-2-表3-4。
6. 单击“立即创建”,完成告警规则的创建。