• 沒有找到結果。

基 于 可 解 释 基 拆 解 和 知 识 图 谱 的 深 度 神 经 网 络 可 视 化

N/A
N/A
Protected

Academic year: 2022

Share "基 于 可 解 释 基 拆 解 和 知 识 图 谱 的 深 度 神 经 网 络 可 视 化"

Copied!
20
0
0

加載中.... (立即查看全文)

全文

(1)

第4卷 第9期

年9月 计  算  机  学  报

CHINESEJOURNALOFCOMPUTERS 4N  

收稿日期在线发布日期本课题得到国家重点研究计划软件开发环境国家重点实验室课 和国家自然科学基金青年项目资助. 利,博士硕士生导师研究领域为A安全 序分析知识图谱和分布式系统.温莎莎,学士研究方向为知识图谱.牛易明,本科生研究方向为知识图 谱.李绍宁,本科生主要研究方向为时序分析网络安全.薛云志,博士研究员主要研究领域为可信赖人工智能人工智能测试与评 知识图谱. 涛,硕士助理研究员研究方向为国内外专利翻译等.肖利民,博士教授研究领域为高性能计算分布式系统.

基 于 可 解 释 基 拆 解 和 知 识 图 谱 的 深 度 神 经 网 络 可 视 化

阮  

  温莎莎

  牛易明

  李绍宁

  薛云志

   

  肖利民

软件开发环境国家重点实验室 北京 

北京航空航天大学计算机学院 北京 

中国科学院软件研究所 北京 

中国专利信息中心 北京 

  近年来以卷积神经网络等为代表的深度学习模型以其深度分层学习无标签化学习等优势 图像识别为代表的各个领域得到日益广泛的应用.然而深度神经网络模型由于其内在的黑盒原理对其内部工 作机制的解释仍然面临巨大挑战其可解释性问题已成为了研究界和工业界的前沿性热点研究课题.针对现有研 究存在的缺乏基于图谱的可解释性方法的问题以及可解释基模型的图谱构建优势本文提出了一种基于可解释 基拆解和知识图谱的深度神经网络可视化方法.首先采用一种面向可解释基模型特征拆解结构的知识图谱构建方 构建了场景和解释特征之间的解释关系和并列关系等图谱信息利用场景特征的解释关系网络提出了一种 系数的场景间相似度聚类方法针对现有可解释基模型对相似的场景其解释特征重合率可能很高的 问题提出了一种基于场景的判别性特征提取方法在特征拆解结果中能对每一类样本分别提取出能够区别此类 其他类并且拥有同等重要性的拆解特征即判别性特征针对现有可解释基的深度网络可视化测试缺乏保真度 试的问题提出了一种适于深度神经网络的保真度测试方法.保真度测试和人类置信度测试均表明本文所提方 法可取得优异效果.

关键词 深度神经网络可视化可解释基拆解模型知识图谱解释深度学习模型 中图法分类号   

犇 犲 犲 狆 犖 犲 狌 狉 犪 犾 犖 犲 狋 狑 狅 狉 犽 犞 犻 狊 狌 犪 犾 犻 狕 犪 狋 犻 狅 狀 犅 犪 狊 犲 犱 狅 狀 犐 狀 狋 犲 狉 狆 狉 犲 狋 犪 犫 犾 犲 犅 犪 狊 犻 狊 犇 犲 犮 狅 犿 狆 狅 狊 犻 狋 犻 狅 狀 犪 狀 犱 犓 狀 狅 狑 犾 犲 犱 犵 犲 犌 狉 犪 狆 犺

RUANLi WENShaSha NIUYiMing LIShaoNing XUEYunZhi RUANTao XIAOLiMin

 

 

 

 

犃犫狊狋狉犪犮狋 Recentlyowingtotheadvantagesofdeeplayeredlearningandunlabeledlearning etc.deeplearningmodelsrepresentedbyconvolutionalneuralnetworkdeepneuralnetwork recurrentneuralnetworkhavegainedincreasingapplicationsinvariousfieldssuchasimage recognitionvideoandnaturallanguageprocessing.Toachievethehightransparencyandsecurity assuranceofdeeplearningmodelstheinterpretabilityresearchofdeepneuralnetworksisof greattheoreticalsignificanceandindustrialapplicationvalueandrecentlygainsincreasingly attention.Howeverbecauseoftheintrinsicblackboxcharacteristicsofthedeeplearningmodels

《 计

(2)

theinterpretationofitsinternalstructureandtherunningmechanismisstillofgreatchallenges includingtherigoroustheoreticalresultsoriginatedfromthemanualobservationsoflargescale trainingandtestingsetandscarceappropriateexplanationofthelearningresultsbasedonthe humanunderstanding.Moreovermostoftheexistingresearchesanalyzingthedecisionmaking processofdeeplearningmodelsonlyfromalocalperspectiveandlacksagraphicalrepresentation basedontheoverallunderstanding.Ontheotherhandtheinterpretablebasisdecomposition

IBDmodelhastheadvantagesthatitsinterpretationresultisnotonlyastrictcorresponding relationfromscenetofeaturebutalsoisakindofsemistructureddatawhichcanfacilitateIBD basedknowledgemapconstructionfromit.Aimingattheproblemthatexistingdeepneural networkvisualizationresearcheslackstheinterpretabilitybasedontheknowledgemapandthe wellsuitedknowledgemaprepresentabilityofIBDweproposeadeepneuralnetworkvisualization approachbasedoninterpretablebasisdecompositionandknowledgemapwhichfullytakesthe advantageofmapconstructionabilityofinterpretablebasisdecomposition.Firstlyweproposea knowledgemapconstructionmethodbasedonthefeaturedecompositionstructureofIBDwhich constructsthemapinformationsuchastheinterpretationrelationshipandjuxtaposition relationshipbetweenthesceneandtheinterpretablefeature.Thenasimilarityclustering algorithmbetweenscenesusingJaccardcoefficientbasedontheinterpretationrelationnetworkof scenesandfeaturesisproposed.Basedonascenediscriminantfeatureextractionmethodthe decomposedfeaturesthatcandistinguishthisclassfromotherclassesareextractedfromeachtype ofsamplenamelydiscriminantfeatures.Meanwhilewequantifytheaccuracyofdiscriminant featureextractionbymeansofmanualevaluationbyexploringthedifferencebetweendifferent modelsunderstandingoftherecognitiontargetandthatofhumanbeings.Furthermoreafidelity testmethodfordeepnetworkhasbeenproposedtosolvetheproblemthatexistingresearchlacks fidelitytest.Wecombinethemultifeaturethermalspectrogramsintoacomprehensivecharacteristic thermalspectrogramandthenusetheHadmagproducttorefusethecomprehensivecharacteristic thermalspectrogramwiththeoriginalimagetoobtainthecharacteristicfusionspectrogram.The luminancelabeleddepthneuralnetworkclassificationmodeloffeaturefusionmapwasusedto identifythetargetlocationpixelareaandthetargetlocationabilityofthermalspectrummapwas measuredbycomparingthedeviationofinputoriginalmapandfeaturefusionmaptothemodel classificationabilitysoastoobtainthefidelityoftheinterpretablebasisdecompositionmodel. Boththefidelitytestandthehumanconfidencetestshowthattheproposedmethodcanachieve excellentresults.

犓犲狔狑狅狉犱狊 deepneuralnetworksvisualizationinterpretablebasisdecompositionknowledge mapinterpretingdeeplearningmodels

1    

近年来以深度神经网络DeepNeuralNetwork DNN卷积神经网络ConvolutionalNeuralNetwork CNN循环神经网络RecurrentNeuralNetwork RNN等为代表的深度学习模型以其深度分层学

无标签化学习模型等优势已在计算机视觉语 音识别自然语言处理为代表的各个领域都得到日

益广泛的应用.

近年来随着深度学习应用领域的不断拓展作 为制约深度学习更深入和长远应用的瓶颈可解释 性问题受到各领域研究者的日益广泛的重视.深 度学习的模型学习训练的推演过程以数字运算为 主导且具有黑盒性质缺乏可解释性且难以通过人 类社会的概念进行理解.更具体的挑战包括在 深度学习观测值和结果层面由于对观测值无法进 行严密的逻辑推理进而观测结果缺乏强有力的理

9期 阮 利等基于可解释基拆解和知识图谱的深度神经网络可视化

《 计

(3)

论支撑或基于现实的合理解释在深度学习网 络层面深度网络缺乏因果逻辑推理因此深度神经 网络存在一定安全隐患难以对某些神经网络的木 马攻击进行有效防范如特洛伊木马.可见如何 提高深度神经网络模型的透明性已成为了当前一个 前沿和热点的研究课题.

神经网络的可解释性研究经历了从早期利用了 模型对输入的敏感度差异性特征的粗粒度探索到 近期探索单个组合神经元在一次识别任务中的功 能体现的过程.然而现有研究的思路仍然仅仅是从 局部的角度分析神经网络的决策依据决策过程缺 乏对神经网络学习和决策的整体理解的图形化的抽 象表示尤其缺乏一套完整的神经网络学习结果的 知识图谱构建方法和实例.因此针对现有研究存在 的上述问题开展深度神经网络的可解释性研究将 对深度网络模型透明性安全性保障都有重大的理 论研究意义和工业应用价值.另一方面由于可解释 基拆解模型对深度神经网络的解释结果为场景到特 征的严格对应关系是一种半结构化数据从结构上 就具有便于进行知识图谱构建的优势.因此针对现 有深度神经网络研究缺乏基于可解释基拆解和图谱 融合的可解释性方法的问题以及可解释基模型的 图谱构建优势本文提出了一种基于可解释基拆解 模型和知识图谱的深度神经网络可视化方法.

2   相关研究

从可解释性的角度给机器学习模型分类主要 有两大类自解释模型和依赖外部可解释性技术的 模型.

深度神经网络属于后者依赖外部可解释性 技术的模型针对深度神经网络的解释算法也可从 多种角度进行设计.下文将按规则提取显著性映 射深度网络表示这三大解释角度对上述两种模型 分析最新的研究进展及其不足.

21 基于规则提取的可解释性相关研究

规则提取是研究人员最早提出的对黑盒模型的 解释方法其把已训好的模型当作黑盒借助自解释 模型的优势使用自解释模型模拟黑盒模型的决策 过程抽象出一系列决策依据使得自解释模型尽可 能接近黑盒模型的决策能力这样的自解释模型也 被称为代理模型.代理模型主要有两大类线性代理 模型和决策树模型.

2016年Ribeiro等人提出的线性代理模型 LIME通过探测输入数据扰动构建一个局部线性

模型用于判断输入数据中某些部分对模型输出结 果的影响度且可根据线性模型非零维数量来量化 表示LIME解释性的复杂度.2016年Zilke等人提 出DeepRED模型构建的决策树几乎达到了深度 神经网络模型的完整性但执行时间和内存开销大 是其一大弊端.2019年UCLA的张拳石教授团队 提出一种新的决策树解释模型该模型挖掘了 CNN的所有潜在决策模式决策模式提供从粗到细 粒度的决策依据用以解释CNN在不同粒度上的 预测依据.然而基于规则提取的方法存在依赖于已 训练模型泛化性和可扩展性受限等问题.

22 基于显著性映射的可解释性相关研究

2011年纽约大学的Zeiler等人提出了一种 通过卷积稀疏编码和最大池交替层学习图像分解的 分层模型AdaptiveDeconvnet.2013年Zeiler等 人通过对CNN逐层还原结果表明从Deconvnet 模型的深浅层可提取图像不同粗细粒度的信息以 及模型对输入图像的平移缩放不敏感但对图像的 旋转敏感.以上工作忽略了神经网络内部除了梯度 以外的其他重要信息.其他显著性映射方法还有 LRPDeepLIFTCAMGradCAMGrad CAM++Integratedgradients等.这些工作

的核心思想是利用神经元激活值找到输入样本中对 输出结果影响最大的区域以及高网络敏感度. ETH的Ancona等人对比了以上显著性映射方

法的解释能力.

2015年法国国家信息与自动化研究所的Oquab 等人提出使用全局最大池化globalmaxpooling 方式对目标分类模型的识别点进行定位.受文献

16启发2016年MIT的Zhou等人提出一种 类映射激活CAM方法用于具有全局平均池化

GAP的CNN模型并证实CNN提取的特征含 有位置信息.2018年MIT的Zhou等人在之前 的研究基础上提出一种InterpretableBasis DecompositionIBD方法核心思想是对CNN得

到的ActivationMapAM进行解码得到对预测结 果的合理解释.2018年Selvaraju等人利用神经 元能够在分类任务中从训练集中学习到的物体特征 的特性可以通过神经网络可视化的技术获取到模 型学习到的概念用以构建相关领域的知识网络. 23 基于深度网络表示的可解释性相关研究

深度网络表示的出发点是从网络结构本身的功 能来解释网络的决策依据.

深度网络表示的工作可按网络结构层次分为 层级解释神经元级解释向量级解释.2014年

计  算  机  学  报

《 计

(4)

Razavian等人发现使用ImageNet数据集训练 的分类网络的内部层的输出产生了一个特征向量 可通过复用该特征向量来解决对不同种类的鸟类进 行细粒度分类属性检测和对象定位等图像处理问 题.2014年Nguyen等人对AlexNet模型进行实 验使用梯度上升法最大化softmax输出最终 DNN分类模型对图像的识别结果可信度达 99.99%在MINIST数据集上错误率达0.94%.

康奈尔大学的Yosinski等人在2015年提出 并实现了两种不同的神经网络可视化工具最终得 到辨识度更高的图像.

MIT的Zhou等人在2017年提出Network Dissection模型模型通过评估隐层神经元和一

系列语义概念之间的契合度来解释神经网络与实 际意义关联度高的神经元被赋予具象化解释如物 体标签场景的具体某个部分文字材料和颜色等 并以一系列神经元的随机线性组合为单位赋予网 络实际意义.同时提出了分割表示的概念借鉴独 热编码的思想通过将神经网络黑盒学习的特征分 割成若干个人类可辨识的视觉概念特征.基于Zhou 等人的分割思想2019年MIT的Bau等人 将CNN的分割延展到GAN模型上这篇论文介绍 了一种对GAN模型的可视化框架通过人为定义 一些检测功能神经元并将这一改动介入到网络中 探索GAN网络的人为介入对模型的影响进而推 测并解释GAN模型.Cao等人采用观察神经网 络的反馈来分析CNN的视觉定位与分割.近几年 有研究人员探究单个神经元的线性组合在表示空 间中的其他方向形成的表示如2018年谷歌大脑提 出的概念激活向量解释方法ConceptActivation VectorsCAVs

可解释基拆解模型InterpretableBasisDecom position以下简称IBD模型是MIT的Zhou等

人近年来新提出的对CNN的另一种可视化方法.

算法核心思想是拆解CNN最后一层激活特征向 量将多分类任务中对每个识别目标的激活特征向 量拆解最终分解成若干个不同相对更细粒度概念 特征向量的表示.然而以IBD模型的直接结果如 百分比方式对网络结构的解释缺乏场景类型维度 的抽象只能提取出单个输入样本的特征解释结果 而无法对一类场景或整个数据集样本总体进行解 释.同时文献对可解释基拆解模型的测试仅覆盖 人类置信度的度量缺乏保真度做量化测试模型存 在测试维度不全面的问题.本文的工作针对Zhou 等人的工作存在的结果采用百分比缺乏场景理

解和以及IBD测试存在的问题提出了新方法. 综上可知虽然知识图谱具有更直观的解释能 力是近年来进行可视化直观解释的前沿技术然而 深度学习神经网络可解释性的现有研究中仍然缺 乏一套完整的神经网络学习结果的知识图谱构建方 法和实例.另一方面虽然现有的研究已经有基于可 解释基拆解模型的深度可视化方法但是现有方法 并没有有效利用到可解释基拆解模型对深度神经网 络的解释结果为场景到特征的严格对应关系是一 种半结构化数据其结构上就具有便于进行知识图 谱构建的优势.

3   基于可解释基拆解和知识图谱的 深度网络可视化建模及问题分析

基于可解释基拆解的深度神经网络可视化方 法主要针对场景是在CNN等分类模型中有不 同的网络结构实现如Resnet18Resnet50VGG AlexNet等深度网络结构在同一数据集上训练的识

别效果不同.因为神经网络的黑盒特性所以模型应 用人员无法直接分辨是什么原因导致这些模型在同 样的数据上有不同的识别效果.IBD方法的目的就 是为了探究对同一识别目标的识别任务中这些深 度网络学习了哪些特征以及哪些特征更能作为识 别目标的特有属性在多分类任务中帮助区分不同 识别目标.IBD深度网络可视化方法主要是通过作 用于CNN最后一层的激活特征向量最终得到每 类识别目标对应激活特征向量的具象化概念标签拆 解并给出百分比的形式衡量具象化特征在CNN 识别模型中的重要性.向量拆解表示和概念特征热 谱图的构建算法是本文IBD模型中的核心下面首 先引入MIT中对这两者的理论介绍为本文的算 法提出打下理论基础.

31 理论基础

3.1.1 深度网络向量拆解表示

假设犳∈犚为深度网络对输入狓的犓维输 出结果.犳表示输入狓对应分类结果为犽的概 率由此可得输入标签为犮的狓样本被误分到犽标 签的概率犳.用犺作为犳的中间表示 方式其中犺为网络最顶层犪=犵∈犚为表 示域中的一个点.在本算法中将CNN倒数第二层 输出抽象为犪=犵为简单线性组合可表 示为狑和犪的线性组合如式所示.

=犠犪+犫

=狑犪+犫

9期 阮 利等基于可解释基拆解和知识图谱的深度神经网络可视化

《 计

(5)

假设有一系列向量狇∈犚每个概念特征犮 总存在一个向量狇与之对应.其中犮标签比犽标签 粒度更细用于辅助解释分类结果.这样狑可向量 分解为式所示这样的一组狇就是概念特征正 交基.

≈狊+狊 将狇用犆矩阵表示则使得该式子两边最接近 的问题可类比为最小二乘问题如式所示.即找 到狊使得|狉|最小.

=狊+狊+狉=犆狊+狉 由此得到的狊=犆为最优解其中犆是犆 的伪逆解.

3.1.2 概念特征热谱图

在图像识别任务中由于图像包含的信息非常 丰富尽管深度网络用到的数据集如Broden数据 集等已经包含丰富且密集的标签但也无法囊括 CNN在图像识别任务中提取到的特征.因此本文考 虑在候选基向量组犆中加入一项残差向量狉=狑- 犆记为犆.这样犆包括了整个CNN学习到的特 征表示.对于CNN最后一层分类结果为犽的分数可 表示为如式所示.

=狑犪+犫犪+犫

=狊犪++狊犪+狉犪+犫 其中狊犪为拆解向量对应概念标签犮对识别结果 为犽的贡献度犪为残差狉对识别结果为犽的贡献 度可理解为非Broden数据集包含的标签

因此对每个标签犮可作用于池化层得到输入 图像狓关于特征犮的热谱图如式所示.

犪=狊狆狅狅犾=狆狅狅犾) ( 其中狇犃为特征犮的热谱图.

32 犐犅犇模型解释结果可视化效果及问题分析 以Resnet18网络结构为例我们运用IBD模型 在Places365数据集上对其进行解释解释结果可 视化效果如图1所示图中展示了样本对应的类向 量特征热谱图以及该类向量拆解得到的一组概念 特征正交基的贡献度最大的4组热谱图.图1为其 中4种识别场景如第一个例子中识别对象为人行 道拆解结果中重要性百分比排前三的特征分别是 人行道迷你自行车和厢式货车重要性分别占 25.34%4.62%和3.44%.在热谱图中网络在红 色部分暖色活性较高蓝色部分冷色活性较低 即网络更关注热谱图中活性高的区域.

图1 D模型在R网络结构和P数据集上的类向量拆解结果可视化

计  算  机  学  报

《 计

(6)

图2 基于D和知识图谱的深度神经网络可视化算法总体设计

以上解释结果可视化图是IBD模型的直接解 释结果主要以两种形式呈现特征热谱图和特征贡 献度百分比.从中我们只能直观地感受场景的主要 特征组成以及从热谱图中可以直接看出这些特征 在原图中的像素分布区域.可见由于以上两点均是 以输入样本为解释单位缺乏对数据集中场景类型 维度的解释.模型对结果的解释为从拆解特征中提 取出权重最高的几个特征作为类的解释对解释结 果的分析角度较为单一这些权重是仅针对一个样 本而言并不能体现该类所有样本的普遍性结果权 重仅能体现某一特征对分类目标的重要性而不能 体现该特征是否有助于区别其他类特征.

即以IBD模型的直接结果对网络结构的解释 缺乏场景类型维度的抽象只能提取出单个输入样 本的特征解释结果而无法对一类场景或整个数据 集样本总体进行解释.我们的研究目标是希望解释 模型能够达到以场景为单位的解释效果对一类场 景的特征做更进一步的可视化工作进而构建出对 整个数据集样本的抽象解释结果.

4   基于可解释基拆解和知识图谱的 深度神经网络可视化

41 基本思路和总体设计

基于可解释基拆解和知识图谱的深度神经网络 可视化方法核心思想是基于第3节理论首先采用 IBD模型通过作用于CNN最后一层的激活特征向 量最终得到每类识别目标对应激活特征向量的具 象化概念标签拆解然后通过知识图谱更加图谱化

和场景化地衡量具象化特征在CNN识别模型中的 重要性将可以直观地看出神经网络对不同标签事 物的决策依据知识图谱内容在训练数据集包含的 范围内既能对不同的数据集可产生不同的知识图 谱也可在训练时融合多个数据集的知识或分别在 不同的数据集上训练模型并把解释结果融合成一个 覆盖范围更广的图谱.

基于上述设计思路本文方法的模型图2主 要包括3个核心基于IBD对深度神经网络进 行可视化可解释基拆解模型特征拆解结果的 知识图谱构建基于保真度和人类置信度的测 试.总体设计如图2所示.如图2所示其中基 于IBD对深度神经网络进行可视化方法的网络结 构构成方法是包括神经网络的输入数据集图2左 上角改进的CNN网络结构图2中间部分.其 中改进CNN网络结构主要指将CNN最后一层全 连接层替换为GAP层.其算法流程是首选通过可 解释基拆解算法将权向量拆解为若干个特征向量的 表示.然后对每个特征向量使用GradCAM算法

用每一类的分数对倒数第二层激活图进行一次反 向传播求导可以得到特征热谱图.

其中可解释基拆解模型特征拆解结果的知 识图谱构建方法主要对于现有对IBD模型的结果 解释缺乏对神经网络学习和决策的整体抽象问题 本文通过场景提取判别性特征提取场景特征关系 构建场景相似度和差异度计算步骤构建了一个完 整的神经网络学习结果的知识图谱的方式实现对 IBD模型解释结果的知识图谱化解释.

  作为示例图3以IBD模型对resnet18网络结

9期 阮 利等基于可解释基拆解和知识图谱的深度神经网络可视化

《 计

(7)

图3 D模型对网络结构的解释结果在数据集p_v上的知识图谱构建总体设计图

构的解释结果为例展示了本文方法在数据集 places365_val上的知识图谱构建步骤和效果.图3中 输入部分为IBD模型解释结果构成的特征场景数 据集特征和场景被视为同类节点中间部分为通 过关系抽取构建的特征场景关系网络该关系将 被存储到Neo4j图数据库中针对特征场景之间的 解释关系和加权解释关系分别进行本文的场景间相 似度计算和基于TFIDFTermFrequencyInverse DocumentFrequency指标提取每类样本的判别性

特征提取.更详细的关键技术将在后续详细分析. 42 算法流程

特征向量确定和图谱输入是基于IBD和图谱 模型进行深度神经网络可视化的输入的关键.本文 算法输入模型的特征向量来自训练数据集使用 IBD和知识图谱模型对其验证数据集在多种深度神 经网络结构上的多分类任务进行解释.现有的深度 学习网络的训练数据集常常是融合了多个不同标注 的数据集例如ADEOpenSerfacesPasalContext PascaPart和DescribaleTexturesDataSet每个样

本都有若干个pixelwise的标签例如物体场景 物体的部分纹理材料和颜色除了纹理和场景标 签外大部分样例都细分到像素级别每张图片都对 应若干个标签图labelmap.用于构建知识图谱的 数据包含两大类概念类别和特征数据以文本标签 的形式存储.IBD解释模型的拆解结果为半结构化 数据本文选取每一类样本拆解向量平均贡献度 Top5的特征构建知识图谱并将特征和类别视为概 念而非从属关系从而使数据结构化.下面进一步结 合图2介绍本文的算法流程客厅场景为例

基于可解释基拆解和知识图谱的深度神经网络 可视化算法的核心步骤设计如下所示客厅为 例目标是输入客厅场景本文方法能够输出与

客厅场景相关的场景特征关系网络.

场景识别.将场景图片客厅输入场景识别深 度网络模型如C得到判别结果为客厅的权向量 打分置信度

可解释基拆解.可解释基拆解算法将CN判别结 果为客厅的权向量拆解为若干个特征向量的表示得到的 依赖于可解释基拆解模型的训练数据如图2 客厅被拆解为扶手沙发靠枕这三个特征

输出特征热谱图.为了达到更直观的可视化效果 及方便后续对拆解结果准确性校验对上一步得到的每个 特征向量在原图中进行可视化对CN最后一层激活图使 用GM算法经过一次反向传播求导得到对应的特 征热谱图2

进行特征场景解释.基于哈德玛积输出场景的热 我们使用重要程度最高的三个特征作为

客厅场景的解释扶手沙发靠枕合并三个特征 热谱图得到客厅场景的热谱图然后进行特征场景解释

场景热谱增强图生成.基于哈德玛积在原图中对这 三个特征进行增强处理生成客厅场景的m

计算场景识别效果评分.这一步作为可解释基拆解 模型的算法保真度测试将上一步得到的mk图重新输入 到第一步的场景识别CN模型得到打分置信度 通过生成热谱图对应的m对比实验测 试m集和原图集在分类神经网络中的准确率等指标 化测试热谱图在目标识别任务下的聚焦能力并分析网络 结构在物体识别任务上的可优化点

计算可解释基拆解模型保真度.对原图的打分 置信度和m图的打分置信度 数据进行分析得到可解释基拆解模型保真度

的量化结果

构建场景知识图谱.利用第二步得到的半结构化数 包含场景拆解特征以及场景特征之间的关系构建知 图谱并把知识图谱存储到图数据库.客厅场景为例 二步得到三个特征向量扶手沙发靠枕利用三个

计  算  机  学  报

《 计

數據

表 6   特征融合数据集在 狆 犾 犪 犮 犲 狊 3 6 5 数据集上的测试结果 3 网络结构  数据集  A v e r a g e D r o p % ( L o w e r i s b e t t e r ) C o n f i d e n c e I n c r . % ( H i g h e r i s b e t t e r ) a l e x n e t  p l a c e s 3 6 5 _v a l _m a s k 3 2  8 7 3 3  7 1 狉 犲 狊 狀 犲 狋

參考文獻

相關文件

文化溯尋(知識基礎) 九龍城 歷史淵源 4課節 文化稽考(知識基礎) 九龍城 地文誌、地域考 4課節 文化內韻(知識基礎) 九龍城 特色意義

•在理解的 基礎上,推 斷閱讀材料 以外的內容

。如何是奪境不奪人。濟曰。王令已行天下徧。將軍塞外絕煙塵。師曰。如何是人境

• 學生需理解《愛蓮 說》中「菊」的象 徵意義,也需通過 掌握《陋室銘》的 中心思想,理解劉 禹錫的人生態度。. •

明龍計算一題兩個數相加的數學題目,不小心算成了相減,所得到的答

「思有合一」外,還可以用“arche”(始基)的觀念來理解萬物存在之基

基本的原理是假設我們知道 light source 在那裡,找出 shadow edge,light source 和 shadow edge 可以求得 shadow plane,加上有 calibrate 後的 camera 知道那物體上一 點 p

明確的 可量度的 可實現的 相關的 有時限的.