应用性能管理
产品介绍
文档版本 01
发布日期 2022-01-05
版权所有 © 华为技术有限公司 2022。 保留一切权利。
非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传 播。
商标声明
和其他华为商标均为华为技术有限公司的商标。
本文档提及的其他所有商标或注册商标,由各自的所有人拥有。
注意
您购买的产品、服务或特性等应受华为公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或 特性可能不在您的购买或使用范围之内。除非合同另有约定,华为公司对本文档内容不做任何明示或暗示的声 明或保证。
由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文 档中的所有陈述、信息和建议不构成任何明示或暗示的担保。
目 录
1 图解应用性能管理 2.0... 1
2 产品概述...3
3 产品功能...7
4 应用场景...9
5 基本概念...14
6 权限管理...18
7 隐私与敏感信息保护声明... 20
8 数据采集...21
9 使用限制...23
10 计费说明... 26
11 版本说明... 29
产品介绍 目 录
1 图解应用性能管理 2.0
产品介绍 1 图解应用性能管理 2.0
产品介绍 1 图解应用性能管理 2.0
2 产品概述
应用运维遇到挑战
在云时代,分布式微服务架构下应用日益丰富,用户数量爆发式增长,纷杂的应用异 常问题接踵而来。传统运维模式下,多套运维系统上的各项指标无法关联分析, 运维 人员需要根据运维经验逐一排查应用异常,分析定位问题效率低,维护成本高且稳定 性差。
海量业务下应用运维面临以下两个方面的挑战:
● 大型分布式应用关系错综复杂,分析定位应用问题困难,应用运维面临如何保障 应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。
● 应用体验差导致用户流失。运维人员不能实时感知并追踪体验差的业务,未能及 时诊断应用异常,严重影响用户体验。
APM 帮您解决
华为云应用性能管理服务(Application Performance Management,简称APM)是实
产品介绍 2 产品概述
以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户 体验保驾护航。
2.0:
APM2.0包含应用监控和前端监控两大子产品,涵盖分布式应用、容器环境、浏览器、
小程序、APP等领域的性能管理,能帮助您实现全栈式性能监控和端到端全链路追踪诊 断,让应用管理轻松高效。
您无需修改代码,只需为应用安装一个Agent,APM应用监控就能够对该应用进行全 方位监控,帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈,从而 大幅提升线上问题诊断的效率。目前仅支持JAVAAgent,具体的应用监控能力概览如 下表。
表2-1 APM2.0 监控能力
场景能力 说明
非侵入的应用性能
数据采集 用户无需更改应用代码,只需要将APM的agent包部署到服务 器,并且修改应用启动参数,就可以实现应用监控。
应用视角的指标监
控 无须配置,自动监控应用相关大量监控指标,如JVM、
JavaMethod、URL、Exception、Tomcat、httpClient、
Mysql、Redis、kafka等。
应用拓扑自动发现 通过对RPC调用信息进行动态分析、智能计算,自动生成分布 式应用间拓扑关系。
调用链的自动跟踪 多个应用接入APM后,自动针对某一些请求进行采样,采集单 个请求的服务之间调用关系以及中间调用的健康情况,实现全 局调用链路的自动跟踪。
常用诊断场景的指 标下钻分析
根据应用响应时间、请求数、错误率等指标下钻分析,按业 务、应用、环境、数据库和中间件等多维度查看。
异常事务和慢事务 捕捉
基于调用事务(Transaction)的超时和异常分析,并有效自动 关联到对应的接口调用,如 SQL、MQ 等。
1. 接入APM:应用通过APM自身的AK/SK鉴权进行接入。
2. 数据采集:APM可以通过非侵入方式采集JavaAgent提供的应用数据、基础资源 数据、用户体验数据等多项指标。
3. 业务实现:APM支持指标数据、拓扑、调用链追踪功能。
1.0:
APM作为云应用诊断服务,拥有强大的分析工具,通过拓扑图、调用链、事务分析可 视化地展现应用状态、调用过程、用户对应用的各种操作,快速定位问题和改善性能
产品介绍 2 产品概述
图2-1 APM1.0 架构图
1. 访问APM:通过IAM(统一身份认证)的委托、AK/SK鉴权可以访问APM。
2. 数据采集:APM可以通过非侵入方式采集Java探针、Istio网格等提供的应用数 据、基础资源数据、用户体验数据等多项指标。
3. 业务实现:APM支持全链路拓扑、调用链追踪、事务分析功能。
4. 业务拓展:
– AOM(应用运维管理)实时监控应用运维指标,APM通过拓扑、调用链等快 速诊断应用性能异常。
– 通过APM找到性能瓶颈后,CPTS(云性能测试服务)关联分析生成性能报 表。
– 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务 正常与异常时上下文数据特征,通过聚类分析找到问题根因。
产品优势
2.0:
产品介绍 2 产品概述
JavaAgent:基于自研Agent通过非侵入方式采集业务调用数据、服务存量数据、调用 的KPI数据等应用指标。
支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。
开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。
1.0:
非侵入式性能数据采集,无需修改业务代码即可轻松接入APM,数据源包括如下:
● Java探针:基于业界Pinpoint开源项目通过非侵入方式采集业务调用数据、服务存 量数据、调用的KPI数据等应用指标。
● Istio网格:集成Kubernetes平台通过非侵入方式采集业务调用数据、资源信息、
调用的KPI数据等应用指标。
支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。
AI智能阈值检测,机器学习历史基线数据产生告警,通过RCA(Root Cause Analysis)分析找到问题根因。
开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。
产品介绍 2 产品概述
3 产品功能
APM作为云应用诊断服务,拥有全链路拓扑、调用链追踪、事务分析功能。
全链路拓扑
● 可视化拓扑:APM通过拓扑可视化展示应用间调用关系和依赖关系。拓扑使用应 用性能指标对应用性能满意度进行量化,并使用不同颜色对不同区间的值进行标 识,方便您快速发现应用性能问题,并进行定位。如图3-1所示,拓扑清晰地展示 应用间关系、调用数据(服务、实例指标)、健康状况等详细内容。
图3-1 拓扑图
● 跨应用调用:拓扑图支持在不同应用服务间的调用关系,对于不同应用之间有服 务调用时,可实现跨应用调用关系的采集并展示应用的性能数据。
● 异常SQL分析:拓扑图可以统计并展示数据库或SQL语句的关键指标。APM提供 数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,通过这些 指标视图,您可以分析异常(慢或调用出错)SQL语句导致的数据库性能问题。
● JVM指标监控:拓扑图可以统计并展示实例的JVM指标数据。APM实时监控JVM 运行环境的内存和线程指标,快速发现内存泄漏、线程异常等问题。
产品介绍 3 产品功能
调用链追踪
APM能够针对应用的调用情况,对调用进行全方面的监控,可视化地还原业务的执行 轨迹和状态,协助性能及故障快速定界。
● 在查询后的调用链列表中,单击待查看的调用链的链接,查看该调用链基本信 息。
● 调用链详情页面可以查看调用链的完整链路信息,包含本地方法堆栈和相关远程 调用的调用关系。
事务分析
事务分析:APM通过对服务端业务流实时分析,展示事务的吞吐率、错误率、时延等 关键指标,使用健康指标Apdex对应用打分,直观体现用户对应用的满意度。当事务 异常,则上报告警;对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。
如图 事务分析所示,以电商应用为例展示事务状况,健康指标异常的事务表示体验不 佳。
图3-2 事务分析
产品介绍 3 产品功能
4 应用场景
APM应用广泛,下面介绍APM的三个典型应用场景,以便您深入了解。
应用异常诊断
业务痛点
分布式微服务架构下复杂的应用丰富多样、开发效率高,但是给传统运维诊断技术带 来了巨大挑战。以电商为例,主要遇到如下问题:
● 定位问题难
客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服 务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求 出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的 排查也常常涉及多个团队。
● 架构梳理难
在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游 服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳 理、架构的治理和容量的规划(例如“双十一”促销活动的准备过程中,需要为 每个应用准备多少台机器)也变得更加困难。
业务实现
APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓 扑+调用链下钻能力分钟级完成问题定位。
● 可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。
产品介绍 4 应用场景
● 调用链追踪:发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。
● 慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标 视图,支持异常SQL语句导致的数据库性能问题分析。
产品介绍 4 应用场景
应用体验管理
业务痛点
在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统 时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之 后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流 失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场 景;能否知晓用户遇到的详细报错信息而快速修复。
业务实现
APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到 服务器、用户请求的完整过程,采用Apdex(应用性能指数)自动化打分,实时感知 用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过 拓扑和调用链完成事务问题定位。
● 应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用 户体验一览无遗。
● 全链路性能追踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握。
产品介绍 4 应用场景
故障智能诊断
业务痛点
海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维 数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,
自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析 给出可能原因。
业务实现
APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当事务出现异常 时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异 常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。APM 可以统计历史上体验好和差的数据并进行比对,同时记录可能导致应用出错的环境数 据,包括出入参、调用链、资源数据、JVM参数等,基于EI(企业智能)引擎,对历史 数据在线训练与警告预测。
产品介绍 4 应用场景
产品介绍 4 应用场景
5 基本概念
拓扑
拓扑是对应用间调用关系和依赖关系的可视化展示(拓扑图)。拓扑图(2.0)主要是 由圆圈、箭头连线、资源组成。每个箭头连线代表一个调用关系。连线上的数据表示 请求量和平均RT。拓扑使用平均RT进行量化,并使用不同颜色对不同区间RT值进行标 识,方便用户快速发现问题,并进行定位。
拓扑图(1.0)主要是由圆圈、箭头连线、资源组成。每个圆圈代表一个服务,圆圈上 每个分区代表一个实例。每个圆圈中的分数表示活跃的实例/总实例数。分数下的内容 分别表示在当前所选的时间中应用的服务时延、应用被调用次数、错误数。每个箭头
产品介绍 5 基本概念
调用链
调用链跟踪、记录业务的调用过程,可视化地还原业务请求在分布式系统中的执行轨 迹和状态,用于性能及故障快速定界。
Agent
Agent通过字节码增强技术进行调用埋点,生成数据。该数据后续会被JavaAgent采 集,之后JavaAgent会将数据上报并呈现在界面中。停止agent字节码方式拦截后,
MBEAN方式所采集到的数据不受影响,如JVM等监控指标。
事务
事务表示一个HTTP请求,是从“用户请求 > webserver > DB > webserver > 用户请 求”的完整过程。现实生活中,事务即一次任务,用户使用应用完成一项任务,比如 电商应用程序中一次商品查询就是一个事务,一次支付也是一个事务。
Apdex
Apdex全称是Application Performance Index,是由Apdex联盟开发的用于评估应用性 能的工业标准。Apdex标准从用户的角度出发,将对应用响应时间的表现,转为用户 对于应用性能的可量化范围为0-1的满意度评价。
● Apdex的原理
Apdex定义了应用响应时间的最优门槛为T(即Apdex阈值,T由性能评估人员根据预期 性能要求确定),然后根据应用响应时间结合T定义了三种不同的性能表现:
Satisfied(满意):应用响应时间低于或等于T,比如T为1.5s,则一个耗时1s的响应结 果则可以认为是satisfied的。
Tolerating(可容忍):应用响应时间大于T,但同时小于或等于4T。假设应用设定的 T值为1s,则4*1=4s为应用响应时间的容忍上限。
Frustrated(烦躁期):应用响应时间大于4T。
● APM如何计算Apdex
APM中,Apdex阈值即自定义阈值中设置的阈值,应用响应时延即服务时延,
产品介绍 5 基本概念
Apdex=(满意样本*1+可容忍样本*0.5+令人沮丧样本*0)/样本总数
其计算结果表示应用的不同性能状态,即用户对应用的体验结果,采用不同的颜色表 示,如表5-1:
表5-1 Apdex 说明
Apdex值 颜色 说明
0.75 ≤ Apdex ≤ 1 绿色 表示应用、实例或事务被调用时响应很快,用户 体验较满意。
0.3 ≤ Apdex < 0.75 黄色 表示应用、实例或事务被调用时响应较慢,用户 体验一般。
0 ≤ Apdex < 0.3 红色 表示应用、实例或事务被调用时响应极慢,用户 体验较差。
● APM中如何设置Apdex阈值
您可以可根据实际业务对Apdex阈值进行设置,设置方法详见自定义阈值。
TP99 时延
TP99时延=完成99%的网络请求所需要的最短耗时。在APM中,所有的时延都是指 TP99时延。
举例:假设总请求数为100个,它们的请求耗时分别为1s、2s、3s、4s……98s、99s、
100s。若要完成99%的请求,我们至少需要99s,故TP99为99s。
计算:将所有请求按照耗时从小到大排序,第(99%*总请求数)个请求的耗时即为 TP99时延。若(99%*总请求数)出现小数则向上取整。
整体时延/服务时延
时延指调用从发起请求到获得响应的耗时。APM中,整体时延指整个请求的总耗时,
服务时延指单个服务的耗时,即整体耗时减去调用其他安装探针服务的耗时。例如,
有服务A、B、C,A调用B,B调用C,如下图示:
产品介绍 5 基本概念
● B服务整体时延=Tb1+Tb2+Tc,服务时延=Tb1+Tb2
● C服务整体时延=Tc,服务时延=Tc
探针
探针通过字节码增强技术进行调用埋点,生成数据。该数据后续会被ICAgent采集,之 后ICAgent会将数据上报并呈现在界面中。开启了内存检测机制后,如果检测到实例内 存过大时探针会进入休眠状态,停止数据采集。APM如何采集探针数据
网格
Istio网格是以非侵入的方式获取流入、流出应用程序的数据。ICAgent和CCE服务的 Istio mixer组件会获取并处理网格数据,然后上报并呈现在APM服务界面中。启用 Istio,开启网格数据的采集。APM如何采集网格数据
ICAgent
ICAgent是APM的采集代理,运行在应用所在的服务器上,用于实时采集探针所获取的 数据,所采集的数据及用途见服务声明。安装ICAgent是使用APM的前提。
产品介绍 5 基本概念
6 权限管理
如果您需要对华为云上购买的APM资源,给企业中的员工设置不同的访问权限,以达 到不同员工之间的权限隔离,您可以使用统一身份认证服务(Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分 配、访问控制等功能,可以帮助您安全的控制APM资源的访问。
通过IAM,您可以在华为云帐号中给员工创建IAM用户,并使用策略来控制他们对 APM资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有APM 的使用权限,但是不希望他们拥有删除服务发现规则等高危操作的权限,那么您可以 使用IAM为开发人员创建用户,通过授予仅能使用服务发现规则,但是不允许删除服 务发现规则的权限策略,控制他们对服务发现规则资源的使用范围。
如果华为云帐号已经能满足您的使用需求,不需要创建独立的IAM用户进行权限管 理,您可以跳过本章节,不影响您使用APM的其它功能。
IAM是华为云提供权限管理的基础服务,无需付费即可使用,您只需要为您帐号中的 资源进行付费。关于IAM的详细介绍,请参见《IAM产品介绍》。
APM 权限
默认情况下,管理员创建的IAM用户没有任何权限,您需要将其加入用户组,并给用 户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授 权。授权后,用户就可以基于被授予的权限对APM进行操作。
APM部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区 域级项目”,然后在指定区域(如华北-北京1)对应的项目(cn-north-1)中设置相 关权限,并且该策略仅对此项目生效;如果在“所有项目”中设置权限,则该权限在 所有区域项目中都生效。访问APM时,需要先切换至授权区域。
如表6-1所示,包括了APM的所有系统权限。
表6-1 APM 系统权限
角色名称 描述 类别
产品介绍 6 权限管理
表2列出了APM1.0常用操作与系统权限的授权关系,您可以参照该表选择合适的系统 权限。
表6-2 常用操作与系统权限的关系
操作 APM FullAccess APM
ReadOnlyAccess APM
Administrator
获取应用拓扑信息 √ √ √
修改应用拓扑配置 √ x √
删除应用拓扑配置 √ x √
创建应用拓扑配置 √ x √
获取慢SQL分析结 果
√ √ √
获取调用链数据 √ √ √
更新调用链配置 √ x √
查询应用性能管理 配置
√ √ √
添加应用性能管理 配置
√ x √
删除应用性能管理 配置
√ x √
查询ICAgent列表 √ √ √
安装ICAgent √ x √
获取ICAgent版本 信息
√ √ √
升级ICAgent版本 √ x √
卸载ICAgent √ x √
下发ICAgent事件 √ x √
产品介绍 6 权限管理
7 隐私与敏感信息保护声明
由于APM会将运维数据内容展示到APM控制台,请您在使用过程中,注意您的隐私及 敏感信息数据保护,不建议将隐私或敏感数据上传到APM,必要时请加密保护。
采集器部署
在ECS上手动部署ICAgent过程中,安装命令会使用到您的AK/SK作为输入参数,安装 前请您关闭系统的历史纪录收集,以免泄露隐私。安装后ICAgent会加密存储您的 AK/SK,有效保护敏感信息。
产品介绍 7 隐私与敏感信息保护声明
8 数据采集
在使用APM服务过程中用户开启APM数据采集开关后,APM仅采集应用的业务调用链 数据、资源信息、资源属性、内存检测信息、调用请求的KPI数据,不涉及个人隐私数 据。所采集的数据仅用于APM性能分析和故障诊断,不会用于其他商业目的。
数据 类型
采集数据 传输方式
(2.0) 传输方 式(1.0)
存储方 式
数据用途 时 限(2.
0)
时限(1.
0)
调用 链数 据
调用链Span 数据
通过WSS方 式传输
通过https加 密结合AKSK鉴 权的方 式传输
APM服 务端按 照Project 隔离存 储
调用链前台 查询展示
30 天
, 到 期 彻 底 删 除
可配 置,
最大7 天,
到期 彻底 删除
调用 请求KPI数 据
调用发起方 地址、调用 接收方地 址、调用接 口、调用耗 时、调用状 态
通过WSS方 式传输
通过https加 密结合AKSK鉴 权的方 式传输
APM服 务端按 照Project 隔离存 储
用于计算事 务调用KPI指 标(吞吐量、TP99时 延、平均时 延、错误调 用次数等)
与绘制应用 拓扑,在前 台界面展示
30 天
, 到 期 彻 底 删 除
7 天,
到期 彻底 删除
产品介绍 8 数据采集
数据 类型
采集数据 传输方式
(2.0) 传输方 式(1.0)
存储方 式
数据用途 时 限(2.
0)
时限(1.
0)
资源 信息
服务类型、
服务名称、
创建时间、
删除时刻、
所在节点地 址、服务发 布端口
通过WSS方 式传输
通过https加 密结合AKSK鉴 权的方 式传输
APM服 务端按 照Project 隔离存 储
资源库前台 查询展示 30
天
, 到 期 彻 底 删 除
7 天,
到期 彻底 删除
资源 属性
系统类型、
系统启动事 件、CPU个 数、服务执 行用户名 称、服务进 程id、服务 的PodID、
CPU标志、
系统版本、
服务使用的 Web框架、
JVM版本、
时区、系统 名称、采集 器版本以及 LastMail的 Url
通过WSS方 式传输
通过https加 密结合AKSK鉴 权的方 式传输
APM服 务端按 照Project 隔离存 储
资源库前台 查询展示 30
天
, 到 期 彻 底 删 除
7 天,
到期 彻底 删除
内存 检测 信息
内存使用 率、使用 量、最大使 用量、剩余 内存大小、
内存超限时 刻以及内存 监测机制的 配置信息
通过WSS方 式传输
通过https加 密结合AKSK鉴 权的方 式传输
APM服 务端按 照Project 隔离存 储
资源库前台 查询展示
30 天
, 到 期 彻 底 删 除
7 天,
到期 彻底 删除
产品介绍 8 数据采集
9 使用限制
ICAgent 支持的 Linux 操作系统
ICAgent支持多个Linux操作系统,在购买弹性云服务器时您选择ICAgent支持的操作系 统,详见表9-1。
表9-1 支持的操作系统及版本 操作系统 版本
SUSE SUSE
Enterprise 11 SP4 64bit
SUSEEnterprise 12 SP1 64bit
SUSEEnterprise 12 SP2 64bit
SUSEEnterprise 12 SP3 64bit OpenSUSE 13.2 64bit 15.0 64bit
暂不支持syslog 日志采集。
42.2 64bit
EulerOS 2.2 64bit 2.3 64bit 2.5 64bit
CentOS 6.3 64bit 6.5 64bit 6.8 64bit 6.9 64bit 6.10 64bit 7.1 64bit 7.2 64bit 7.3 64bit 7.4 64bit 7.5 64bit 7.6 64bit 7.7 64bit 7.8 64bit 7.9 64bit 8.0 64bit 8.1 64bit 8.2 64bit
Ubuntu 14.04 server
64bit 16.04 server
64bit 18.04 server 64bit Fedora 24 64bit 25 64bit 29 64bit
Debian 7.5.0 32bit 7.5.0 64bit 8.2.0 64bit 8.8.0 64bit 9.0.0 64bit
产品介绍 9 使用限制
说明
● 对于Linux x86_64服务器,ICAgent支持上表中所有的操作系统及版本。
● 对于Linux ARM服务器,CentOS操作系统仅支持7.4 及其以上版本,上表所列的其他操作系 统对应版本均支持。
APM 支持的 JAVA 类型
APM支持JAVA类应用,目前已支持多种主流Java框架、web服务器、通讯协议、数据 库等,可实现应用轻松接入。当前支持的类型详见表 APM支持的Java类型。
表9-2 APM 支持的 Java 类型
类型 名称 版本
工具 JDK jdk7、jdk8
通讯协议 httpclient apache httpclient3、apache httpclient4、jdk httpurlconnection Java框架 CXF Client 2.6.0~3.2.1
iBatis 2.3.0、2.3.4.726 jersey 2.0~2.9.1
mybatis 1.0.0~1.3.1(Mybatis-Spring)、3.0.1~
3.4.5(Mybatis3)
spring 3.1.x~5.0.x
springboot 1.2.x~1.5.x、2.0.4~2.0.9
Dubbo 2.5.3~2.6.2(Dubbo RPC、Dubbo REST)、2.8.4(Dubbo RPC、Dubbo REST)
CSE(HuaWei) 1.0.0.B011~1.1.0.B046(REST over Servlet、REST over Vert.x、Highway RPC)
gRPC 1.11.x~1.14.x
数据库 MySQL mysql-connector-java 5.1.X Oracle ojdbc5、ojdbc6、ojdbc14 Sybase 2.6.0~3.2.1
mariadb 1.3.x
产品介绍 9 使用限制
类型 名称 版本
Jetty 7.6.x~8.0.0, 8.1.x~9.x.x JBoss
说明JBoss在使用javaagent探针 的时候,需要特殊的设置。
详见如何对JBoss Standalone模式接入 APM。
7.0.0~12.0.0
undertow 1.4.x
消息队列 ActiveMQ 5.6.x~5.15.x RocketMQ 4.1.x~4.2.x
RabbitMQ 1.3.3+(spring-rabbit)、2.7.x(amqp- client)、2.6.0、3.6.5
Kafka 0.9.0.1~0.10.0.2 NoSQL Redis jedis 2.0.0~2.9.0
Memcache 2.9.0~2.12.3(arcus) Mongodb 3.0.x~3.6.x
Casandra 2.1.x~3.2.x
zookeeper 1.0.x(com.github.adyliu.zkclient)、
0.1.x(com.github.sgroschupf.zkclient)
ElasticSearch 2.4.x、5.1.x
RestClient Common HTTP 2.x、3.x、4.x(httpclient)、ALL
(HttpURLConnection)
探针个数限制
APM的应用性能指标采集,包含调用链、SLA、SQL调用、JVM等性能指标采集。此类 指标采集时所消耗的资源和使用的APM探针个数、服务间调用次数、采样率等强相 关。为保证采集可靠性,单节点使用APM的探针个数建议控制在20个以内。
产品介绍 9 使用限制
10 计费说明
说明
本章节为APM1.0计费说明,2.0目前处于免费公测阶段。
计费说明
APM提供按需计费和按需套餐包两种方式。APM支持按需计费和按需套餐包叠加的计 费方式,即如果您购买了套餐包,则先扣除套餐包内实例,超出部分按需计费。如果 您没有购买套餐包,则所有实例均按需计费。计费规则详见APM-价格说明。
APM产品类型分为探针型产品和网格型产品,探针型产品版本包括基础版、专业版、
企业版和铂金版,网格型产品版本包括基础版和专业版。当您从基础版切换到其他版 本后,会以按需计费,如果购买了套餐包,则使用探针实例数优先在套餐包中扣除,
超出套餐包额度的探针实例,则以按需计费计算价格。
说明
● 探针型专业版、企业版和铂金版支持Java方式接入APM。
● 网格型专业版支持Istio方式(不受语言限制)接入APM。
● 探针实例使用时长不足1小时按照1小时计算。
● 1个专业版探针实例为1个探针计费单元,1个企业版探针实例为2个探针计费单元,1个铂金 版探针实例为7个探针计费单元。
探针计费单元是指按需计费和按需套餐包计费中探针实例的基本计费单位,不同版本 的探针实例都可以转化为探针计费单元。例如:用户购买按需套餐包中的100个专业版 探针实例,即100个探针计费单元,该用户1小时内也可以选择使用50个企业版探针实 例(100个探针计费单元/2)或者14个铂金版探针实例(100个探针计费单元/7)。
套餐包详情
探针型产品各版本支持的功能详见下表。
产品介绍 10 计费说明
版本 基础版 专业版 企业版 铂金版 功能可用 每次限时1小
时,共50次。
每次超过1小 时,APM会自 动停止数据采 集,界面上只 能查询历史数 据,需手动设 置继续免费体 验或切换版本 升级至付费的 专业版、企业 版、铂金版才 可正常使用。
总次数超过50 次,需切换版 本升级至付费 的专业版、企 业版、铂金版 才可正常使 用。
完全开放 完全开放 完全开放
数据存储时
长 7天 7天 30天 90天
应用拓扑 √ √ √ √
调用链 √ √ √ √
事务分析 √ √ √ √
慢SQL √ √ √ √
JVM分析 √ x √ √
AI能力 √ x √ √
方法追踪 √ x √ √
专家支持 x x 24小时在线支
持 ● 24小时在线
支持
● 中国境内,
每个季度可 安排专家现 场支持1 天。
说明(是否支持,√表示支持,x表示不支持)
网格型产品各版本支持的功能详见下表。
产品介绍 10 计费说明
版本 基础版 专业版 版本说明 每次限时1小时,共50
次。每次超过1小时,
APM会自动停止数据采 集,界面上只能查询历史 数据,需手动设置继续免 费体验或切换版本升级至 付费的专业版才可正常使 用。总次数超过50次,需 切换版本升级至付费的专 业版才可正常使用。
完全开放
数据存储时长 7天 7天
应用拓扑 √ √
调用链 √ √
说明(是否支持,√表示支持,x表示不支持)
续费说明
由于套餐包是先付费再使用方式,所以在您套餐包的订单到期或即将到期时,请及时 续费。如果不及时续费,则可能影响您的使用。
表10-1 不同阶段续费说明
- 账户余额充足 账户余额不足或欠费 保留期
APM状 态
可正常使用APM 冻结,不再采集并展示欠费后的应用数据,但之 前的数据仍可展示、查询。
续费说 明
此期间续订套餐包,
可正常使用APM。如 何续费
如果充值,APM自动解除冻结,按需计费。如果 您需要套餐包,需要重新续订或购买。否则,
APM按需计费。
如果不续订套餐包,
APM自动将收费方式 转为按需计费。
如果不充值,超出保留期后,所有资源被释放,
此期间APM不计费。
产品介绍 10 计费说明
11 版本说明
Pinpoint 更新说明
表11-1 Pinpoint 说明列表
版本号 发行时间 更新说明
1.0.47 2021-5-22 1. 支持kafkaclient 2.0.x-2.8.x。
2. 支持mariadb-java-client 1.2.x-2.4.x。
3. undertow已知调用链问题优化。
1.0.43 2021-2-2 1. 支持cse2.0使用场景。
2. 修复其他已知问题。
1.0.39 2020-11-2
3 1. 优化事务匹配机制。
2. JVM增加Direct Buffer监控。
1.0.38 2020-11-0
9 优化事务自学习能力。
1.0.36 2020-10-1
0 1. 优化ServiceComb调用链。
2. 优化JVM线程监控。
1.0.32 2020-8-27 1. 支持Tomcat监控 。 2. 优化gRPC插件。
1.0.29 2020-5-9 支持Spring Cloud OpenFeign的Hystrix异步模式。
1.0.28
(CCElatest版 本)
2020-2-12 修复Redis Lettuce插件可能导致内存泄漏的问题。
产品介绍 11 版本说明
版本号 发行时间 更新说明 1.0.27 2019-11-3
0 1. 支持mysql客户端mysql-connector-java-8.x.x。
2. 支持redis客户端lettuce。
3. 支持jetty新版本。
4. 修复netty可能出现内存泄漏的bug。
5. 优化探针资源占用。
1.0.14 2019-10-3
0 支持apache dubbo2.7.1版本。
1.0.4 CCE
2019-5-6 1. 支持gRPC 1.11.x-1.14.x。
2. 支持Thrift 0.11。
0.1.36 CCE
2019-3-15 1. 支持ServiceComb 2.3.25-2.3.52。
2. 支持Netty 4.1.22。
3. 解决JDK http调用链中断的问题。
4. 支持非CCE用户的Docker应用接入。
0.1.25 CCE
2018-12-2
4 1. JVM指标监控。
2. 错误过滤,指定某些特定的自定义返回码、异常为非 错误。
3. JDK http Client的调用链添加http.url属性。
4. 方法追踪增加参数采集。
特性更新说明
表11-2 特性说明列表 发行时
间 更新说明
2021-10
-26 APM2.0补充新上线Region信息:
华北-北京一、华东-上海二、华南-广州-友好用户环境、华北-乌兰察布 一
2021-04
-26 ● APM2.0新增环境标签功能
● APM2.0优化指标和调用链用户体验增强 2021-03
-30 ● 2.0发布上线
● 支持企业项目和资源配置管理CMDB,支持用户按照业务、项目、环 境等维度对应用进一步进行管理,方便运维自动化的实施
产品介绍 11 版本说明
发行时 间
更新说明
2020-12
-10 支持通过静态阈值模板创建批量阈值规则。
2019-8-
21 1. 支持统计分析APP的用户运营数据,便于您更有针对性的开展运营活 动。
2. 支持统计分析APP的网络交互数据,便于您更好的有针对性的进行网 络优化,提升APP使用体验。
2019-6-
11 事务列表功能增强,支持事务分组、自定义事务规则。
2019-6-
4 支持非华为云主机上安装、升级、卸载ICAgent。
2019-5-
22 1、Docker应用接入APM。
2、Deployment应用接入APM。
2019-4-
18 创建IAM委托获取AK/SK。
2019-4-
9 Istio网格集群应用接入APM。
2019-3-
15 JVM监控功能增强,支持阈值规则和统计方式。
2019-3-
6 全链路拓扑功能增强,完善服务、实例的指标数据,展示拓扑详情。
2018-12
-26 1. JVM内存和线程指标监控,图表展示JVM堆内存和非堆内存,以及线 程状态指标,可以快速发现内存泄漏、线程挂死等异常。
2. 调用链方法参数采集,在事务异常时,通过方法追踪配置采集入参和 出参值,快速定位问题根因。
3. 异常白名单,过滤业务自定义返回码、异常等非错误,解除误报烦 恼。
2018-8-
15 支持创建通知规则,将告警信息以短信或邮件的方式发送给指定的用 户。
2018-6-
30 上线新的计费模式,提供按需+按需套餐包计费方式,方便用户灵活搭 配。计费详见价格详情。
2018-5-
16 支持按监控组查询调用链数据,即在搜索调用链时设置需要查看的监控 组,可以快速找到需要查询的调用链数据。如何使用调用链定位问题
产品介绍 11 版本说明
发行时 间
更新说明
2018-4-
20 1. ICAgent新增5.10版本,该版本支持SQL和方法追踪,在使用SQL和方 法追踪前,您需要升级ICAgent。
2. SQL语句分析:通过响应时间、错误耗时等关键指标,帮您快速定位 异常SQL语句导致的数据库性能问题。详情请参见SQL。
3. 方法追踪:支持自定义方法追踪规则,帮您快速在线定位方法级性能 问题。具体设置请参见自定义方法追踪。
4. 应用级事务Apdex阈值配置:支持对同一应用的不同事务设置不同的 Apdex阈值,满足您的多样化需求。具体设置请参见精准设置事务 Apdex阈值。
2018-2-
9 1. UI升级:使用全新的绘图引擎绘制界面,支持IE11浏览器,详情请参 见拓扑、事务。
2. 拓扑数据任性展示:支持7天内的拓扑数据按任意时长汇聚展示,您 可随性设置时间段。此特性需要您升级ICAgent并重启应用,详情请 参见拓扑、事务。
3. 调用链智能采样:全采样异常事务调用链,抽样采样正常事务调用 链,以便减少对问题定位无用数据对您的干扰。具体设置请参见采集 设置。
4. 支持个性化设置:在监控组界面支持删除监控组卡片;支持自定义事 务别名。
5. 新增内存检测机制:当检测到实例内存过大时,采集探针进入休眠状 态(停止采集数据),避免对实例产生影响。具体设置请参见采集设 置。
2018-1-
19 发布ICAgent 5.7,增强了采集代理ICAgent的功能,支持升级、卸载。
ICAgent 更新说明
表11-3 ICAgent 更新说明 ICAgent版本 更新说明
5.12.43 修复采集容器日志场景下icagent进程概率性重启问题。
5.12.42 修复rsyslog日志采集部分场景下close_wait网络连接数过多问 题。
5.12.36 ● 支持CCE场景下AOM可以根据应用、组件维度展示运维信 息。
产品介绍 11 版本说明
ICAgent版本 更新说明
5.12.27 优化应用发现规则。
5.12.26 支持采集指定文本文件路径下的日志,不限制文件后缀名称。
5.12.23 增加容器的文件系统使用率指标。
5.12.22 日志路径配置支持通配、递归配置。
产品介绍 11 版本说明