操作场景
本章节指导用户安装指标采集插件,用于采集GPU类指标和RAID类指标。
说明
● ECS支持GPU类指标,BMS暂不支持。
● BMS支持RAID类指标,ECS暂不支持。
● 若Agent升级到1.0.5及以上版本,对应插件需使用最新的版本,否则会出现指标采集异常。
前提条件
● 已安装Agent并处于正常运行状态。
● GPU类指标采集需弹性云服务器支持GPU。
● 执行如下命令,确认使用Agent的版本。
if [[ -f /usr/local/uniagent/extension/install/telescope/bin/telescope ]];
then /usr/local/uniagent/extension/install/telescope/bin/telescope -v; elif [[ -f /usr/local/telescope/bin/telescope ]]; then echo "old agent"; else echo 0; fi
– 返回“old agent”,表示使用老版本Agent。
– 返回版本号,表示使用新版本Agent。
– 返回“0”,表示未安装Agent。
操作步骤(新版本)
1. 使用root账号,登录ECS。
说明
● 若要监控BMS的软RAID指标,请登录BMS。
● 以下以安装GPU插件为例,安装监控软RAID插件类似。
2. 执行以下命令,进入Agent安装路径。
cd /usr/local/uniagent/extension/install/telescope 3. 执行以下命令,创建plugins文件夹。
mkdir plugins
4. 执行以下命令,进入plugins文件夹。
cd plugins
5. 执行如下命令,下载采集插件脚本(以下以GPU插件为例)。
wget https://telescope.obs.cn-north-1.myhuaweicloud.com/gpu_collector
表4-9 获取插件采集安装包
名称 下载路径
Linux 64位GPU指
标采集插件安装包
华北-北京一:https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/
extension/gpu/gpu_collector
华北-北京四:https://obs.cn-north-4.myhuaweicloud.com/uniagent-cn-north-4/
extension/gpu/gpu_collector
华南-广州:https://obs.cn-south-1.myhuaweicloud.com/uniagent-cn-south-1/
extension/gpu/gpu_collector
华东-上海二:https://obs.cn-east-2.myhuaweicloud.com/uniagent-cn-east-2/
extension/gpu/gpu_collector
中国-香港:https://obs.ap- southeast-1.myhuaweicloud.com/uniagent-ap-southeast-1/extension/gpu/gpu_collector
亚太-曼谷:https://obs.ap- southeast-2.myhuaweicloud.com/uniagent-ap-southeast-2/extension/gpu/gpu_collector
亚太-新加坡:https://obs.ap- southeast-3.myhuaweicloud.com/uniagent-ap-southeast-3/extension/gpu/gpu_collector Linux 64位RAID指
标采集插件安装包
华北-北京一:https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/
extension/raid/raid_monitor.sh
华北-北京四:https://obs.cn-north-4.myhuaweicloud.com/uniagent-cn-north-4/
extension/raid/raid_monitor.sh
华南-广州:https://obs.cn-south-1.myhuaweicloud.com/uniagent-cn-south-1/
extension/raid/raid_monitor.sh
华东-上海二:https://obs.cn-east-2.myhuaweicloud.com/uniagent-cn-east-2/
extension/raid/raid_monitor.sh
中国-香港:https://obs.ap- southeast-1.myhuaweicloud.com/uniagent-ap-southeast-1/extension/raid/raid_monitor.sh
亚太-曼谷:https://obs.ap- southeast-2.myhuaweicloud.com/uniagent-ap-southeast-2/extension/raid/raid_monitor.sh
6. 执行如下命令,添加脚本执行权限。
chmod 755 gpu_collector
7. 执行如下命令,新建conf.json文件并添加配置内容,配置插件路径和指标采集周 期crontime(单位:秒)。
vi conf.json GPU指标插件配置
{ "plugins": [ {
"path": "/usr/local/uniagent/extension/install/telescope/plugins/gpu_collector", "crontime": 60
} ] }
RAID指标插件配置
{ "plugins": [ {
"path": "/usr/local/uniagent/extension/install/telescope/plugins/raid_monitor.sh", "crontime": 60
} ] }
说明
● path路径后的参数为gpu_collector和raid_monitor.sh分别为GPU插件和RAID插件配置 内容。
● 插件采集周期为60s,若采集周期配置错误,会导致指标采集异常。
● 插件路径path请勿私自修改,否则指标采集异常。
8. 打开“/usr/local/uniagent/extension/install/telescope/bin”路径下的 conf_ces.json文件,新增配置项"EnablePlugin":true,开启插件采集开关。
{
"Endpoint": "所在区域地址,默认无需修改", "EnablePlugin": true
}
9. 执行如下命令,重启Agent。
ps -ef | grep telescope | grep -v grep | awk '{print $2}' | xargs kill -9
操作步骤(老版本)
1. 使用root账号,登录ECS。
说明
● 若要监控BMS的软RAID指标,请登录BMS。
● 以下以安装GPU插件为例,安装监控软RAID插件类似。
2. 执行以下命令,进入Agent安装路径。
cd /usr/local/telescope
3. 执行以下命令,创建plugins文件夹。
mkdir plugins
4. 执行以下命令,进入plugins文件夹。
cd plugins
5. 执行如下命令,下载采集插件脚本(以下以GPU插件为例)。
wget https://telescope.obs.cn-north-1.myhuaweicloud.com/gpu_collector
表4-10 获取插件采集安装包
名称 下载路径
Linux 64位GPU指
标采集插件安装包
华北-北京一:https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/
extension/gpu/gpu_collector
华北-北京四:https://obs.cn-north-4.myhuaweicloud.com/uniagent-cn-north-4/
extension/gpu/gpu_collector
华南-广州:https://obs.cn-south-1.myhuaweicloud.com/uniagent-cn-south-1/
extension/gpu/gpu_collector
华东-上海二:https://obs.cn-east-2.myhuaweicloud.com/uniagent-cn-east-2/
extension/gpu/gpu_collector
中国-香港:https://obs.ap- southeast-1.myhuaweicloud.com/uniagent-ap-southeast-1/extension/gpu/gpu_collector
亚太-曼谷:https://obs.ap- southeast-2.myhuaweicloud.com/uniagent-ap-southeast-2/extension/gpu/gpu_collector
亚太-新加坡:https://obs.ap- southeast-3.myhuaweicloud.com/uniagent-ap-southeast-3/extension/gpu/gpu_collector Linux 64位RAID指
标采集插件安装包
华北-北京一:https://obs.cn-north-1.myhuaweicloud.com/uniagent-cn-north-1/
extension/raid/raid_monitor.sh
华北-北京四:https://obs.cn-north-4.myhuaweicloud.com/uniagent-cn-north-4/
extension/raid/raid_monitor.sh
华南-广州:https://obs.cn-south-1.myhuaweicloud.com/uniagent-cn-south-1/
extension/raid/raid_monitor.sh
华东-上海二:https://obs.cn-east-2.myhuaweicloud.com/uniagent-cn-east-2/
extension/raid/raid_monitor.sh
中国-香港:https://obs.ap- southeast-1.myhuaweicloud.com/uniagent-ap-southeast-1/extension/raid/raid_monitor.sh
亚太-曼谷:https://obs.ap- southeast-2.myhuaweicloud.com/uniagent-ap-southeast-2/extension/raid/raid_monitor.sh
6. 执行如下命令,添加脚本执行权限。
chmod 755 gpu_collector
7. 执行如下命令,新建conf.json文件并添加配置内容,配置插件路径和指标采集周 期crontime(单位:秒)。
vi conf.json GPU指标插件配置
{ "plugins": [ {
"path": "/usr/local/telescope/plugins/gpu_collector", "crontime": 60
} ] }
RAID指标插件配置
{ "plugins": [ {
"path": "/usr/local/telescope/plugins/raid_monitor.sh", "crontime": 60
} ] }
说明
● path路径后的参数为gpu_collector和raid_monitor.sh分别为GPU插件和RAID插件配置 内容。
● 插件采集周期为60s,若采集周期配置错误,会导致指标采集异常。
● 插件路径path请勿私自修改,否则指标采集异常。
8. 打开/usr/local/telescope/bin路径下的conf_ces.json文件,新增配置项
"EnablePlugin":true,开启插件采集开关。
{
"Endpoint": "所在区域地址,默认无需修改", "EnablePlugin": true
}
9. 执行如下命令,重启Agent。
/usr/local/telescope/telescoped restart