• 沒有找到結果。

深度学习赋能的恶意代码攻防研究进展

N/A
N/A
Protected

Academic year: 2022

Share "深度学习赋能的恶意代码攻防研究进展"

Copied!
27
0
0

加載中.... (立即查看全文)

全文

(1)

第4卷 第4期

年4月 计  算  机  学  报

CHINESEJOURNALOFCOMPUTERS 4N

稿日期在线发布日期本课题得到广东省重点领域研发计划北京邮电 基金资助项目资助冀甜甜,博士研究生主要研究方向为网络安全 方滨兴,主要研究领域为计算机体系结构计算机网络网络安全 翔(通信作者博士 博士生导师主要研究领域为网络安全.王忠儒(通信作者博士高级工程师主要研究方向为人工 网络安全.甘蕊灵,硕士研究生主要研究方向为网络安全. 宇,硕士研究生主要研究方 向为网络安全.余伟强,硕士主要研究方向为网络安全人工智能.

深度学习赋能的恶意代码攻防研究进展

冀甜甜

 

方滨兴

   

  王忠儒

  甘蕊灵

   

余伟强

北京邮电大学网络空间安全学院可信分布式计算与服务教育部重点实验室 北京 

广州大学网络空间先进技术研究院 广州 

中国网络空间研究院 北京 

北京丁牛科技有限公司 北京 

  深度学习赋能的恶意代码攻防研究已经成为网络安全领域中的热点问题.当前还没有针对这一热点问题 相关综述为了及时跟进该领域的最新研究成果本文首先分析并总结了恶意代码攻击的一般流程.基于该攻击 流程本文对深度学习的赋能攻击点和赋能防御点进行了定位将深度学习助力攻击的技术分为5类基于对 抗样本生成的自动化免杀基于自然语言生成的自动化网络钓鱼基于神经网络的精准定位与打击 于生成对抗网络的流量模仿基于黑盒模型的攻击意图隐藏并将深度学习助力防御的新型技术分为3类

基于深度学习的恶意代码查杀自动化网络钓鱼识别深度学习赋能的恶意行为检测其次基于以上 本文对恶意代码攻防研究中的前沿技术进行了综述并从技术原理实际可行性发展趋势等不同的角度对 这些技术进行了深入剖析再者由于深度学习的伴生安全问题与其在恶意代码攻防领域的赋能安全问题紧密相 本文对其中代表性的模型后门攻击与防御的相关技术也进行了关注之后本文分析并总结了当前深度学习赋 的恶意代码攻防研究领域中的主要研究方向并对其未来的发展趋势进行了讨论最后深度学习赋能的恶意代 攻防研究才刚刚起步基于恶意代码攻击链的更多可能的赋能攻击与防御点有待研究者继续探索和发掘.此外 度学习助力恶意代码攻防的一大挑战是数据集的限制如何建立有效公开的数据集供研究者使用这也是一个 非常值得思考和研究的问题.

关键词 恶意代码深度学习赋能攻击赋能防御攻击链

中图法分类号   

犚 犲 狊 犲 犪 狉 犮 犺 狅 狀 犇 犲 犲 狆 犔 犲 犪 狉 狀 犻 狀 犵  犘 狅 狑 犲 狉 犲 犱犕 犪 犾 狑 犪 狉 犲 犃 狋 狋 犪 犮 犽 犪 狀 犱 犇 犲 犳 犲 狀 狊 犲 犜 犲 犮 犺 狀 犻 狇 狌 犲 狊

JITianTian FANGBinXing CUIXiang WANGZhongRu GANRuiLing HANYu YUWeiQiang

狔犇  

 

 

 

犃犫狊狋狉犪犮狋 Theresearchondeeplearningpoweredmalwareattackanddefensetechniqueshas becomeahotissueinthefieldofcybersecurity.Tothebestofourknowledgetherearenorelevant reviewonthisburningissueatpresentandourreviewisthefirstwork.Inordertofollowupon thelatestresearchresultsinthisfieldthisarticlefirstanalyzesandsummarizesthegeneral malwareattackprocess.Basedonthisattackprocessthisarticlelocatestheattackpointsand

《 计

算 机

学 报

(2)

defensepointspoweredbydeeplearning.Thedeeplearningassistedattacktechnologiesare dividedintofivecategoriesAutomatedvirusevasionbasedonadversarialsamplegeneration correspondingtothepreparationstageinthemalwareattackprocessAutomatedphishing basedonnaturallanguagegenerationcorrespondingtothedeliverystageinthemalwareattack processPinpointandstrikebasedonneuralnetworkscorrespondingtotheimpactstages inthemalwareattackprocessTrafficimitationbasedongenerativeadversarialnetworks correspondingtothecommandandcontrolandevasionstagesinthemalwareattackprocess

Theblackboxmodelbasedattackintenthidingcorrespondingtotheevasionstageinthe malwareattackprocess.Inadditionthedeeplearningassisteddefensetechnologiesaredivided intothreecategoriesMalwareresistancebasedondeeplearningwhichisadefensetechnology fortheengagementandpresencestagesAutomatedphishingrecognitionwhichisa defensetechnologyforthedeliverystageandMaliciousbehaviordetectionpoweredby deeplearningwhichisadefensetechnologyforthetwostagesofimpactandcommandand control.Secondlybasedontheaboveclassificationthisarticlereviewsthecuttingedge technologiesinthisfield.Alsoitanalyzesthesetechnologiesindepthfromdifferentperspectives suchastechnicalprinciplespracticalfeasibilityanddevelopmenttrends.Furthermoredueto theaccompanyingsecurityissuesofdeeplearningiscloselyrelatedtodeeplearningpowered malwaresecurityissuesthispaperalsopaysattentiontotheaccompanyingsecurityissuesof deeplearninganddiscussestherepresentativebackdoorattackanddefensetechnologiesinthis field.Afterthatthisarticleanalyzesandsummarizesthemainresearchdirectionsinthefieldof deeplearningpoweredmalwareattacksanddefensesanddiscussesitsfuturedevelopmenttrend. Amongthemforthetwonewattacktechnologiespinpointandstrikebasedonneuralnetworks andtheblackboxmodelbasedattackintenthidingthispaperanalyzesandconcludesthatthey haveopenedthefirststepforattackerstouseneuralnetworksasattackcomponentsactively.In thefuturethiswillbeadirectioninwhichattackersareverylikelytoexploreindepthand generateattackswhichdeservesourattention.Finallytheresearchondeeplearningpowered malwareattacksanddefensesisinitsinfancyandmorepossiblepoweredattackanddefense pointsbasedonmalwareattackchainsremaintobeexploredbyresearchers.Furthermorea significantchallengefordeeplearningpoweredmalwareattackanddefenseisthelimitationof datasets.Howtoestablishavalidandopendatasetforresearcherstouseisalsoaveryworthy considerationandresearch.

犓犲狔狑狅狉犱狊 malwaredeeplearningAIPoweredAttackAIPoweredDefenseattackchain

1    

恶意代码Malware主要包括病毒Virus 蠕虫Worm远控木马RemoteAccessTrojan RAT僵尸程序Bot勒索软件Ransomeware 等攻击形态.自1988年Morris蠕虫出现以来恶意 代码的破坏力开始引发国际关注.从近年来网络安 全厂商和媒体报道的重大安全事件报告中可以发 现大多数报告实际上是以恶意代码分析为重心

的.毫无疑问恶意代码在网络空间安全中占据重 要位置.从实际案例来看近年来爆发的僵尸网络

Botnet高级持续性威胁AdvancedPersistent Threat简称APT和勒索软件Ransomware等重

大网络安全事件大多数是以恶意代码为核心攻击 组件并由此造成实质危害的.例如2001年爆发的 CodeRed蠕虫在不到一周的时间内感染了近40万 台服务器造成全球经济损失约26亿美元2006年 出现的Zeus僵尸网络至今依然活跃据统计该僵尸

计  算  机  学  报

《 计

算 机

学 报

(3)

网络拥有高达100万台计算机设备造成了超过一 亿美元的损失2010年发起的针对工控系统中核设 施的APT攻击其核心攻击组件是Stuxnet蠕虫 该攻击对伊朗纳坦兹核电站的上千台铀浓缩离心机 造成了实质性破坏2015年造成乌克兰电网断电事 故的APT攻击其核心攻击组件是BlackEnergy恶意 工具包这是首次导致停电的网络攻击2017年 WannaCry勒索软件全球大爆发造成的损失达80亿 美元.诸如此类不胜枚举.

恶意代码对抗一直是国际网络安全厂商关注 重点国内外安全厂商已研发出较为成熟的终端 查杀和网络检测系统如反病毒软件Antivirus Software主机入侵防护系统HIPS入侵检测与

防护系统IDPS.然而近年来人工智能热潮的再 度兴起对恶意代码的免杀传播驻留持久化隐 蔽通信和精准打击等能力产生了显著的助力效应 并由此引发了新一轮的由人工智能赋能的恶意代码 攻防研究这对传统的恶意代码攻防技术发展将产 生重要影响.

人工智能技术对恶意代码发展的影响可分为 两种分别是赋能效应伴生效应.所谓赋能 效应主要体现在两个方面一是指人工智能技术 很强大可以助力恶意代码研发和利用引发更大 的危害笔者将其称为赋能攻击AIPowered Attack二是指人工智能技术也可以助力恶意代 码防御让安全问题借助人工智能技术得到更好 的解决笔者将其称为赋能防御AIPowered Defense.所谓伴生效应是指尽管人工智能技术在

酝酿之初会根据以往的经验去充分地考虑安全问 题但在推出之后势必会在不断地应用中发现新的 脆弱性伴生而来.

本文重点关注赋能效应并聚焦于人工智能领 域中一个重要分支深度学习技术.在下文中本 文将围绕恶意代码对深度学习在助力恶意代码攻 击助力恶意代码防御两个方面的最新研究工 作展开综述和分析.值得一提的是恶意代码的存在 形式有多种涵盖二进制JavaScriptPowerShell 等但当前的很多研究表明这些类型的恶意代 码均可通过深度学习进行处理因此它们均被包含 在本文的研究范畴之内这也进一步突显了本文综 述的一般性和通用性.

助力攻击方面通过对恶意代码攻击链的分析 能够更加清晰地定位可赋能的攻击阶段.针对不同

攻击阶段的行为特点可以发现面向不同攻击阶段 的赋能技术有效地实现对这些技术的分类.安全研 究人员已经提出了多种知名的网络威胁框架其中 CyberKillChain

MITREATT&CK

和NSA CSS网络威胁框架v2NSACSSCyberThreat Frameworkv2简称NTCTFv2

三者具有很高的

权威性.本文基于以上网络威胁框架和知名网络安 全事件总结形成恶意代码攻击的一般流程以下称 为恶意代码攻击链或简称攻击链Attack Chain如图1所示.攻击链包括七个阶段分别为 准备Preparation投递Delivery突破Engage ment存在持久化PresencePersistense影响

Effect命令与控制CommandandControl简称 C2和规避Evasion.与之对应地本文将深度学 习助力攻击的赋能技术分为九类分别是基于对抗 样本生成AdversarialSampleGeneration的自动 化免杀基于自然语言生成NaturalLanguage Generation简称NLG的自动化网络钓鱼基于深

度学习分类的精准定位与打击基于生成对抗网络

GenerativeAdversarialNetwork简称GAN的流 量模仿基于黑盒模型的攻击意图隐藏自动化漏洞 挖掘自动化漏洞利用自动化绕过凭证和基于深度 学习的密码破解.其中自动化漏洞挖掘与利用以及 自动化绕过凭证和密码破解技术分属于一个独立的 研究领域且已有大量的工作和研究进展的跟踪故 本文不将它们作为关注的重点而是重点关注与恶 意代码紧密相关的其他5类研究工作.

助力防御方面假设深度学习赋能的恶意代码 攻击实际可行安全防御人员在理论层面也进行了 很多超前探索因此本文对当前最新的深度学习赋 能的恶意代码防御研究工作进行了总结归纳以期 推动赋能恶意代码防御的研究进展.同理由图1所 示我们不关注与自动化漏洞挖掘与利用对应的自 动化漏洞修复技术而是重点关注基于深度学习的 恶意代码查杀自动化网络钓鱼攻击识别深度学习 赋能的恶意行为检测三类赋能防御技术旨在从防 御者可检测的目标侧对恶意代码攻击链的各个环节 开展防御研究.

4期 冀甜甜等深度学习赋能的恶意代码攻防研究进展

② ③

rKlC

EA

SCrTtFkv R_N _V

《 计

算 机

学 报

(4)

图1 基于恶意代码攻击链的赋能技术分类

综上将本文的贡献总结如下

通过对网络威胁框架和知名网络安全事件 的分析本文提取并总结了具有通用性的恶意代码 攻击链通过刻画攻击流程帮助有效定位恶意代码 攻防赋能点

以攻击链为主线本文关注深度学习在恶 意代码攻防研究中的赋能效应对深度学习助力恶 意代码攻击和防御两个方面的研究工作进行了分 析归纳总结与思考

本文基于深度学习的助力安全问题进行了 扩展延伸总结并分析了模型后门攻击与防御的相 关研究工作它属于深度学习的伴生效应但在恶意 代码投递阶段也起到助力安全的作用

本文对恶意代码攻防研究的未来发展趋势 进行了分析与展望旨在从更前沿的视角研究基于 恶意代码的智能安全问题.

具体地本文第23节分别对深度学习赋能的 恶意代码攻击和防御的相关研究进行梳理和总结 第4节扩展综述深度学习的伴生安全研究第5节 概括总结全文工作并对深度学习赋能的恶意代码 攻防研究的未来发展趋势进行分析与讨论.

2   深度学习助力攻击

在深度学习助力攻击方面攻击者试图基于恶 意代码攻击链对可操作的各个攻击环节进行赋能 以增强攻击的鲁棒性.基于恶意代码攻击链刻画的 攻击流程本文将深度学习赋能研究的新型攻击技

术具化为5类它们分别是基于对抗样本生成 的自动化免杀基于自然语言生成的自动化网 络钓鱼基于深度学习分类的精准定位与打击

基于生成对抗网络的流量模仿基于黑盒模 型的攻击意图隐藏.

21 基于对抗样本生成的自动化免杀

在恶意代码攻击过程的准备阶段中必要的一 件事情是恶意代码构建以提升恶意代码的免杀和 生存能力.而每当恶意代码出现新的趋势和威胁时 反病毒引擎作为与恶意代码对抗过程中的产物则需 要不断发展以制衡恶意代码.当前反病毒引擎在变 种检测方面的健壮性正在不断加强基于深度学习 的反病毒引擎已经面世例如腾讯开发的TRPAI 反病毒引擎就是基于深度学习来查杀恶意代码的. 但相应地反病毒引擎的发展也必定会促进恶意代 码的研究.为了深入了解攻击者的意图并提前做好 防御措施安全研究人员尝试以攻击者视角预测未 来恶意代码的发展趋势以期提前洞悉恶意代码的 范式转变.

在恶意代码免杀方面深度学习对比机器学习的 优势在于深度学习会自动学习到重要的特征不 需要人工选择特征对于恶意代码中某些潜在且 关键特征的增加或删除深度学习可以通过自主学习 实现自适应在恶意代码查杀的可扩展性上也优于 机器学习的方法.因此从开发新型恶意代码的角度 出发一种深度学习赋能免杀的对抗性恶意代码被 提出用于实现基于对抗样本生成的自动化免杀.

2016年Grosse等人基于前向导数算法生成

计  算  机  学  报

《 计

算 机

学 报

(5)

具有对抗性的恶意代码示例以对抗深度神经网络

DeepNeuralNetwork简称DNN的查杀通过实 验证明该方法对恶意代码实现了85%的误分类率 验证了基于对抗样本生成的恶意代码攻击的可行性. 2017年Hu等人基于GAN提出了MalGAN模

型来生成对抗性恶意代码以绕过黑盒检测系统实 验结果表明MalGAN能够将检测率降低到接近零 并使基于再训练的防御性方法难以对抗此类攻击 同年Hu等人还将深度学习中的递归神经网络

RecurrentNeuralNetwork简称RNN与GAN 相结合在原始恶意代码的API序列中插入一些不 相关的API生成基于顺序的对抗性恶意代码可有 效对抗多种不同RNN结构的模拟反病毒引擎.

2018年Kolosnjaji等人首次在字节粒度上提出 在恶意代码末尾填充字节的方式来生成对抗性恶意 代码并基于梯度下降算法指导决定要填充的字节 其测试准确率高达92.83%并在实际对抗基于字 节粒度的检测系统MalConv时获得了60%的 成功率同年Anderson等人利用深度强化学习 网络DeepReinforcementlearningNetwork简称 DRN提出了一种基于对抗样本生成的黑盒攻击 方法用于攻击静态PE反杀毒引擎这是当前第一 个可以产生对抗性PE恶意代码的工作在模拟现 实的攻击中达到了90%的成功率.

以上基于对抗样本生成的自动化免杀方法中 API或字节填充等操作是直接反馈到恶意代码的样 本中的体现在深度学习的赋能效应上则是恶意代 码的免杀和生存能力的增强表1中的测试成功率 便很好地证明了深度学习在该类技术上赋能的有效 性.此外这些自动化免杀方法它们分别从不同的 角度为生成对抗性恶意代码提供了不同的攻击思 路.为了深入了解并探索该类新型赋能攻击技术的 实际可行性以及其未来的发展趋势从不同维度对

这些方法做深度分析与对比是必要的.如表1所示 本文从这些方法基于的前提假设使用的验证引 擎实验数据集实验结果等几个角度进行了概述. 从该表中可以看出基于对抗样本生成的自动化免杀 正在不断发展进步但同时也面临着很多问题具体 总结如下

三个方面的发展与进步

①自动化免杀这一研究的限制条件越来越严 苛研究从最初的白盒假设上升了到黑盒假设这意 味着研究者对于攻击的预测也越来越偏向于实际应 用场景有利于防御者提前构建面向实际应用的新 型防御措施掌握攻防主动性.

②验证引擎中使用的深度神经网络结构也已经从 单纯的DNN涵盖到包含GANRNNDRN等多种 网络模型.从广义上讲DNN泛指包含了全连接深 度卷积神经网络ConvolutionalNeuralNetwork简 称CNNRNN等具体变种形式的神经网络结构 但有时研究者也用于特指全连接的神经网络结构 具体取决于不同文献中对DNN定义的不同CNN 的主要功能在于特征提取RNN主要用于序列生 成GAN的主要作用是序列生成和鉴别DRN则用 于预测和评估.由表1可以看出以上这些深度学习 模型均可用于自动化免杀技术的攻击验证可见 基于对抗样本的自动化免杀已经建立了对模型结 构的普适性并可针对多种模型架构的反病毒引 擎实施攻击使得该类攻击的实际可操作性进一 步增强.③恶意代码的生成方式除了涵盖粗粒度的功 能添加和删除还扩展到了字节填充等细粒度的方 法上并且通过实验测试对抗性恶意代码成功绕过 验证引擎的概率也越来越高有的甚至达到了 100%从技术细节和攻击性能上为防御者提供了启

发和警示的作用.

 深度学习赋能的自动化免杀技术对比与分析

年份文献 前提假设 验证引擎 数据集来源 测试成功率 核心方法 实际可行性 攻击者知道神经

NA 假设但攻击者知道恶

使能G 接近1 替代检测器拟合 黑盒检测系统 攻击者不知道神

Nh % 不相关的AI序 列插入 黑盒假设 19 字节粒度的梯度

下降算法 黑盒假设 l 9

4期 冀甜甜等深度学习赋能的恶意代码攻防研究进展

《 计

算 机

学 报

數據

表 6   深度学习助力防御技术对比与分析 分类 特点 / 技术 年份 文献 前提 / 假设 验证引擎 方法描述 学习的恶意基于深度 代码查杀 增强式对抗性训练 2 0 1 8 [ 2 4 ] 白盒假设 D N N 通过鞍点公式将模型学习视为一个鲁棒的优化问题特征压缩2018[25](1)白盒假设;(2)攻击者未意识到特征压缩的使用.DNN特征压缩( 将与原始空间中许多不同特征向量相对应的样本合并为一个样本,从而减少攻击者可用的搜索空间) 赋能式仿真 执行 2 0 1 9 [ 2 6 ] ( 1 ) 白盒假
表 9   深度学习伴生的模型后门防御技术对比与分析 年 份 文 献 前 提 / 假 设 攻 击 引 擎 数 据 集 ( 来 源 ) 攻 击 成 功 率 技 术 贡 献 2 0 1 8 [ 5 4 ] 白 盒假设 , 假设强大的 “ 白盒 ” 攻击者可以完全控制训练过程和训 练 数 据 集 . D N N / C N N(DeepID、A l e x N e t 、FasterRCNN) Y o u T u b eA l i g n e dFacedataset[40]、theU.S.traffic s

參考文獻

相關文件

Nowadays Nan-Gan Island and Bei-Gan Island are in Matsu archipelago called Gan-Tang-Shan by Ming Dynasty. Gan-Tang-Shan located on the sea out Min-Jiang estuary in Fu-Jian Province

培養創意 發展音樂 培養評賞音樂 認識音樂 及想像力 技能與過程 的能力 的情境. 價值觀 與 態度

培養創意 發展音樂 培養評賞音樂 認識音樂 及想像力 技能與過程 的能力 的情境. 價值觀 與

培養創意 發展音樂 培養評賞音樂 認識音樂 及想像力 技能與過程 的能力 的情境. 價值觀 與

本書立足中華文化大背景,較為深入系統地分析研究了回族傳統法文化的形成基礎、發展歷

關於宋代寺院的合法性,日本的高雄義堅先生《宋代教史の研究》第三章的第一節、竺

鉴于课程发展和教学方法的研究和实践一日千里,加上教育局课程发展处多 年来透过不同途径,搜集各界对历史课程及教学等方面的意见,课程发展议会于

MASS::lda(Y~.,data) Linear discriminant analysis MASS::qda(Y~.,data) Quadratic Discriminant Analysis class::knn(X,X,Y,k,prob) k-Nearest Neighbour(X 為變數資料;Y 為分類)