管理组件监控 说明
MRS Manager操作,请参考管理服务监控操作。
步骤1 在MRS集群详情页面,单击“组件管理”。
组件列表中标题包含“服务”、“操作状态”、“健康状态”、“配置状态”、“角 色数”和“操作”。
● 服务操作状态描述如表3-9所示。
表3-9 服务操作状态
状态 描述
已启动 服务已启动。
已停止 服务已停止。
启动失败 用户启动操作失败。
停止失败 用户停止操作失败。
未知 后台系统重启后,服务的初始状态。
● 服务健康状态如表3-10所示。
表3-10 服务健康状态
状态 描述
良好 该服务中所有角色实例正常运行。
状态 描述
故障 至少一个角色实例运行状态为“故障”或被依赖的服 务状态不正常。
未知 该服务中所有角色实例状态为“未知”。
正在恢复 后台系统正在尝试自动启动服务。
亚健康 该服务所依赖的服务状态不正常,异常服务的相关接 口无法被外部调用。
● 服务配置状态如表3-11所示。
表3-11 服务配置状态
状态 描述
已同步 系统中最新的配置信息已生效。
配置超期 参数修改后,最新的配置未生效。需重启相应服务生 效最新配置信息。
配置失败 参数配置过程中出现通信或读写异常。尝试使用“同 步配置”恢复。
配置中 参数配置进行中。
未知 无法获取当前配置状态。
默认以“服务”列按升序排列,单击服务、操作状态、健康状态或配置状态可修改排 列方式。
步骤2 单击列表中指定服务名称,查看服务状态及指标信息。
步骤3 定制、查看监控图表。
1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
----结束
管理角色实例监控 说明
针对MRS 3.x之前版本,请参考管理角色实例监控操作。
步骤1 在MRS集群详情页面,单击“组件管理”,在组件列表中单击服务指定名称。
图3-4 组件管理
步骤2 单击“实例”,查看角色状态。
图3-5 实例
角色实例列表中包含实例信息的角色、主机名、管理IP、业务IP、机架、运行状态及 配置状态。
● 角色实例的运行状态如表3-12所示。
表3-12 角色实例运行状态
状态 描述
良好 表示实例当前运行正常。
故障 表示实例当前无法正常工作。
已退服 表示实例处于退服状态。
未启动 表示实例已停止。
状态 描述
未知 表示实例的初始状态信息无法检测。
正在启动 表示实例正在执行启动过程。
正在停止 表示实例正在执行停止过程。
正在恢复 表示实例可能存在异常正在自动修复。
正在退服 表示实例正在执行退服过程。
正在入服 表示实例正在执行入服过程。
启动失败 表示实例启动操作失败。
停止失败 表示实例停止操作失败。
● 角色实例的配置状态如表3-13所示。
表3-13 角色实例配置状态
状态 描述
已同步 系统中最新的配置信息已生效。
配置超期 参数修改后,最新的配置未生效。需重启相应服务生 效最新配置信息。
配置失败 参数配置过程中出现通信或读写异常。尝试使用“同 步配置”恢复。
配置中 参数配置进行中。
未知 无法获取当前配置状态。
默认以“角色”列按升序排列,单击角色、主机名、管理IP、业务IP、机架、运行状 态或配置状态可修改排列方式。
支持在“角色”筛选相同角色的全部实例。
单击“高级搜索”,在角色搜索区域中设置搜索条件,单击“搜索”,查看指定的角 色信息。单击“重置”清除输入的搜索条件。支持模糊搜索条件的部分字符。
步骤3 单击列表中指定角色实例名称,查看角色实例状态及指标信息。
步骤4 定制、查看监控图表。
1. 在“图表”区域框中,单击“定制”自定义服务监控指标。
2. 在“时间区间”选择查询时间,单击“查看”显示该时间段内的监控数据。
----结束
管理主机监控
说明
针对MRS 3.x之前版本,请参考管理主机监控操作。
步骤1 在MRS集群详情页面,单击“节点管理”并展开节点组信息,查看所有主机状态。
主机列表中包括节点名称、IP、机架、操作状态、健康状态、CPU使用率、内存使用 率、磁盘使用率、网络速度、规格名、规格、付费类型、可用区。
● 主机操作状态如表3-14所示。
表3-14 主机操作状态
状态 描述
正常 主机及主机上的服务角色正常运行。
已隔离 主机被用户隔离,主机上的服务角色停止运行。
● 主机健康状态描述如表3-15所示。
表3-15 主机健康状态
状态 描述
良好 主机心跳检测正常。
故障 主机心跳超时未上报。
未知 执行添加操作时,主机的初始状态。
默认以“节点名称”列按升序排列,单击节点名称、IP、机架、操作状态、健康状 态、CPU使用率、内存使用率、磁盘使用率、网络速度、规格名或规格可修改排列方 式。
步骤2 单击列表中指定的节点名称,查看单个节点状态及指标。
----结束
3.3 集群运维
3.3.1 导入导出数据
用户通过“文件管理”页面可以在分析集群进行文件夹创建、删除,文件导入、导 出、删除操作,暂不支持文件创建功能。流式集群暂不支持在界面使用“文件管理”
功能。开启Kerberos认证的集群中,根目录下的文件夹有权限限制,如需对其进行读 写,请参考创建角色内容添加拥有对应文件夹权限的角色,再请参考相关任务修改提 交作业用户所属的用户组,将新增的组件角色加入到该用户组中。
背景信息
MRS集群处理的数据源来源于OBS或HDFS,HDFS是Hadoop分布式文件系统
(Hadoop Distributed File System),OBS即对象存储服务,是一个基于对象的海量
存储服务,为客户提供海量、安全、高可靠、低成本的数据存储能力。MRS可以直接 处理OBS中的数据,客户可以基于管理控制台Web界面和OBS客户端对数据进行浏 览、管理和使用,同时可以通过REST API接口方式单独或集成到业务程序进行管理和 访问数据。
用户创建作业前需要将本地数据上传至OBS系统,MRS使用OBS中的数据进行计算分 析。当然MRS也支持将OBS中的数据导入至HDFS中,使用HDFS中的数据进行计算分 析。数据完成处理和分析后,您可以将数据存储在HDFS中,也可以将集群中的数据导 出至OBS系统。需要注意,HDFS和OBS也支持存储压缩格式的数据,目前支持存储 bz2、gz压缩格式的数据。