车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法

(1)

书书书

第４４卷　第１２期

２０２１年１２月计　　算　　机　　学　　报

ＣＨＩＮＥＳＥＪＯＵＲＮＡＬＯＦＣＯＭＰＵＴＥＲＳ ^Ｖ^ｏ^ｌ^．^４^４Ｎ^Ｄ^ｅ^ｃ^．^ｏ^２^．^０^１^２^２^１

收稿日期：２０２０１００９^；在线发布日期：２０２１０３２９．本课题得到江苏省重点研发计划项目（ＢＥ２０１９１０４^）^、国家自然科学基金（６１８７２２１９^）^、国家重点研发计划（２０１７ＹＦＢ１４００６００^）^、新疆生产建设兵团科技计划项目（２０２０ＤＢ００５^）资助．许小龙，博士，教授，硕士生导师，中国计算机学会（ＣＣＦ^）会员，主要研究领域为边缘计算、云计算和服务计算．Ｅｍａｉｌ^：ｘｌｘｕ＠ｎｕｉｓｔ．ｅｄｕ．ｃｎ．^方子介，学士，主要研究方向为边缘计算、深度学习．^齐连永（通信作者），博士，教授，博士生导师，主要研究领域为服务计算、推荐系统和隐私保护．Ｅｍａｉｌ^：ｌｉａｎｙｏｎｇｑｉ＠ｇｍａｉｌ．ｃｏｍ．窦万春，博士，教授，博士生导师，主要研究领域为大数据、云计算和边缘计算．何　^强，博士，高级讲师，博士生导师，主要研究领域为边缘计算、软件工程和云计算．段玉聪，博士，教授，博士生导师，中国计算机学会（ＣＣＦ^）会员，主要研究领域为信息安全、人工智能和大数据．

车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法

许小龙

^１^）^，^２^）

　 ^方子介

_１_） ^１^）

　 ^齐连永

^３^）

^窦万春

^２^）

^何　 ^强

^４^）

^段玉聪

^５^）

（南京信息工程大学计算机与软件学院　南京　２１００４４^）

２）（南京大学计算机软件新技术国家重点实验室　南京　２１００２３^）

３^）（曲阜师范大学信息科学与工程学院　山东曲阜　２７３１９９^）

４^）（斯威本科技大学计算机科学与软件工程系　墨尔本澳大利亚　３１２２^）

５）（海南大学计算机与网络空间安全学院　海口　５７０２２８^）

摘　^要　边缘计算将计算^、存储和带宽等资源分布到了靠近用户的一侧．通过将边缘计算引入车联网，服务提供商能为车载用户提供低延时的服务，从而提高用户出行的服务体验．然而，由于边缘服务器所配备的资源一般是有限的，不能同时支持所有车联网用户的服务需求，因此，如何在边缘服务器资源限制的约束下，确定服务卸载地点，为用户提供低时延的服务，仍然是一个巨大的挑战．针对上述问题，本文提出了一种“端边云”协同的５Ｇ车联网边缘计算系统模型，并针对该系统模型设计了深度学习和深度强化学习协同的分布式服务卸载方法ＤＳＯＡＣ．首先，通过深度时空残差网络，ＤＳＯＡＣ在中心云预测出潜在的用户服务需求量^，协同各边缘服务器获取本地车联网边缘计算环境的系统状态，输入边缘服务器上的本地行动者网络，得到该状态下的服务卸载策略．然后，本地评论家网络基于时序差分误差评价该服务卸载策略的优劣，并指导本地行动者网络进行网络参数的优化．优化一定步数后，边缘服务器将优化过的本地网络参数上传到位于中心云的全局网络，协同中心云进行网络参数的更新．最后，中心云将最新的参数推送回本地网络，从而不断对行动者评论家网络进行调优，获得服务卸载的最优解．基于来自现实世界的车载用户服务需求数据集的实验结果表明，在各种车联网边缘计算环境中，相比于四种现有的服务卸载算法，ＤＳＯＡＣ能够降低０．４％～２０．４％的用户平均服务时延．

关键词　边缘计算^；车联网；服务卸载；深度时空残差网络；异步优势行动者评论家中图法分类号ＴＰ３１１　　　犇犗犐号１０．１１８９７／ＳＰ．Ｊ．１０１６．２０２１．０２３８２

犃犇犲犲狆犚犲犻狀犳狅狉犮犲犿犲狀狋犔犲犪狉狀犻狀犵  犅犪狊犲犱犇犻狊狋狉犻犫狌狋犲犱犛犲狉狏犻犮犲犗犳犳犾狅犪犱犻狀犵犕犲狋犺狅犱犳狅狉犈犱犵犲犆狅犿狆狌狋犻狀犵犈犿狆狅狑犲狉犲犱犐狀狋犲狉狀犲狋狅犳犞犲犺犻犮犾犲狊

ＸＵＸｉａｏＬｏｎｇ^１^）^，^２^）ＦＡＮＧＺｉＪｉｅ^１^）ＱＩＬｉａｎＹｏｎｇ^３^）ＤＯＵＷａｎＣｈｕｎ^２^）ＨＥＱｉａｎｇ^４^）ＤＵＡＮＹｕＣｏｎｇ^５^）

１）（犛犮犺狅狅犾狅犳犆狅犿狆狌狋犲狉犪狀犱犛狅犳狋狑犪狉犲^，犖犪狀犼犻狀犵犝狀犻狏犲狉狊犻狋狔狅犳犐狀犳狅狉犿犪狋犻狅狀犛犮犻犲狀犮犲犪狀犱犜犲犮犺狀狅犾狅犵狔^，犖犪狀犼犻狀犵　２１００４４^）

２）（犛狋犪狋犲犓犲狔犔犪犫狅狉犪狋狅狉狔犳狅狉犖狅狏犲犾犛狅犳狋狑犪狉犲犜犲犮犺狀狅犾狅犵狔^，犖犪狀犼犻狀犵犝狀犻狏犲狉狊犻狋狔^，犖犪狀犼犻狀犵　２１００２３^）

３^）（犛犮犺狅狅犾狅犳犐狀犳狅狉犿犪狋犻狅狀犛犮犻犲狀犮犲犪狀犱犈狀犵犻狀犲犲狉犻狀犵^，犙狌犳狌犖狅狉犿犪犾犝狀犻狏犲狉狊犻狋狔^，犙狌犳狌^，犛犺犪狀犱狅狀犵　２７３１９９^）

４）（犇犲狆犪狉狋犿犲狀狋狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犛狅犳狋狑犪狉犲犈狀犵犻狀犲犲狉犻狀犵^，犛狑犻狀犫狌狉狀犲犝狀犻狏犲狉狊犻狋狔狅犳犜犲犮犺狀狅犾狅犵狔^，犕犲犾犫狅狌狉狀犲３１２２^，犃狌狊狋狉犪犾犻犪^）

５）（犛犮犺狅狅犾狅犳犆狅犿狆狌狋犲狉犛犮犻犲狀犮犲犪狀犱犆狔犫犲狉狊狆犪犮犲犛犲犮狌狉犻狋狔^，犎犪犻狀犪狀犝狀犻狏犲狉狊犻狋狔^，犎犪犻犽狅狌　５７０２２８^）

犃犫狊狋狉犪犮狋　Ｔｈｅｉｎｃｒｅａｓｉｎｇｎｕｍｂｅｒｏｆｖｅｈｉｃｌｅｓ^，ａｌｏｎｇｗｉｔｈｔｈｅｄｅｖｅｌｏｐｍｅｎｔｏｆｔｈｅｆｉｆｔｈｇｅｎｅｒａｔｉｏｎ

（５Ｇ^）ｗｉｒｅｌｅｓｓｃｏｍｍｕｎｉｃａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ^，ｈａｓｍａｄｅｔｈｅｉｎｔｅｒｃｏｎｎｅｃｔｉｏｎｓｂｅｔｗｅｅｎｖｅｈｉｃｌｅｓａｎｄｏｔｈｅｒｏｂｊｅｃｔｓ^（ｅ．ｇ．^，ｐｅｄｅｓｔｒｉａｎｓ^，ｉｎｆｒａｓｔｒｕｃｔｕｒｅｓ^，ａｎｄｓｅｒｖｉｃｅｐｌａｔｆｏｒｍｓ^）ｂｅｃｏｍｅａｒｅａｌｉｔｙ^，ｗｈｉｃｈ

《计

算机

学报

》

(2)

ｆｏｒｍｓａｎｏｖｅｌｎｅｔｗｏｒｋｉｎｇｐａｒａｄｉｇｍ^：ｔｈｅＩｎｔｅｒｎｅｔｏｆＶｅｈｉｃｌｅｓ^（ＩｏＶ^）．ＩｎｔｈｅＩｏＶ^，ｄｕｅｔｏｔｈｅｒａｐｉｄｓｐｅｅｄｏｆｔｈｅｖｅｈｉｃｌｅｓ^，ｓｅｒｖｉｃｅｓｓｕｃｈａｓｒｏｕｔｅｒｅｃｏｍｍｅｎｄａｔｉｏｎａｎｄｃｏｌｌｉｓｉｏｎｗａｒｎｉｎｇａｒｅｒｅｑｕｉｒｅｄｔｏｂｅｓａｔｉｓｆｉｅｄｉｎｔｉｍｅ．Ｔｈａｎｋｓｔｏｔｈｅｂｉｒｔｈｏｆｅｄｇｅｃｏｍｐｕｔｉｎｇ^，ｗｈｉｃｈｄｅｐｌｏｙｓｒｅｓｏｕｒｃｅｓ^（ｅ．ｇ．^，ｃｏｍｐｕｔａｔｉｏｎ^，ｓｔｏｒａｇｅ^，ａｎｄｂａｎｄｗｉｄｔｈ^）ａｔｔｈｅｓｉｄｅｃｌｏｓｅｔｏｔｈｅｕｓｅｒｓ^，ｔｈｅｒｅｂｙｒｅｄｕｃｉｎｇｔｈｅｔｒａｎｓｍｉｓｓｉｏｎｌａｔｅｎｃｙａｎｄａｌｌｅｖｉａｔｉｎｇｔｈｅｎｅｔｗｏｒｋｌｏａｄ^，ｓｅｒｖｉｃｅｐｒｏｖｉｄｅｒｓｃａｎｅｆｆｉｃｉｅｎｔｌｙｓｅｒｖｅｕｓｅｒｓｗｉｔｈｌｏｗｌａｔｅｎｃｙｓｅｒｖｉｃｅｓｂｙｉｎｔｒｏｄｕｃｉｎｇｅｄｇｅｃｏｍｐｕｔｉｎｇｉｎｔｏｔｈｅＩｏＶ．Ｎｅｖｅｒｔｈｅｌｅｓｓ^，ｓｉｎｃｅｔｈｅｅｄｇｅｓｅｒｖｅｒｓａｒｅｏｆｔｅｎｌｉｍｉｔｅｄｗｉｔｈｉｎｓｕｆｆｉｃｉｅｎｔｒｅｓｏｕｒｃｅｓ^，ｐｒｏｂｌｅｍｓｓｕｃｈａｓｏｖｅｒｌｏａｄｗｏｕｌｄｏｃｃｕｒｉｆａｌｌｔｈｅｓｅｒｖｉｃｅｓｒｅｑｕｅｓｔｅｄｂｙｔｈｅＩｏＶｕｓｅｒｓａｒｅｏｆｆｌｏａｄｅｄｔｏｔｈｅｅｄｇｅｓｅｒｖｅｒｓｆｏｒｅｘｅｃｕｔｉｎｇ^，ｗｈｉｃｈｗｉｌｌｓｉｇｎｉｆｉｃａｎｔｌｙｓｌｏｗｄｏｗｎｔｈｅｐｒｏｃｅｓｓｉｎｇｓｐｅｅｄａｎｄｒｅｄｕｃｅｔｈｅｑｕａｌｉｔｙｏｆｓｅｒｖｉｃｅ^（ＱｏＳ^）ｐｒｏｖｉｄｅｄｂｙｔｈｅｅｄｇｅｓｅｒｖｅｒｓ．Ｔｈｅｒｅｆｏｒｅ^，ｈｏｗｔｏａｌｌｏｃａｔｅｔｈｅｌｉｍｉｔｅｄｃｏｍｐｕｔａｔｉｏｎａｎｄｂａｎｄｗｉｄｔｈｒｅｓｏｕｒｃｅｓｏｆｔｈｅｅｄｇｅｓｅｒｖｅｒｓｔｏｔｈｅＩｏＶｓｅｒｖｉｃｅｓａｎｄｄｅｔｅｒｍｉｎｅｔｈｅｏｆｆｌｏａｄｉｎｇｄｅｓｔｉｎａｔｉｏｎｓｏｆｔｈｅｓｅｒｖｉｃｅｓｔｏｓｅｒｖｅｔｈｅＩｏＶｕｓｅｒｓｗｉｔｈｌｏｗｌａｔｅｎｃｙｓｅｒｖｉｃｅｓｓｔｉｌｌｒｅｍａｉｎｓｅｎｏｒｍｏｕｓｃｈａｌｌｅｎｇｅ．

Ｔｏｗａｒｄｔｈｉｓｅｎｄ^，ａｎｅｎｄｅｄｇｅｃｌｏｕｄｃｏｌｌａｂｏｒａｔｉｖｅｃｏｍｐｕｔｉｎｇｆｒａｍｅｗｏｒｋｆｏｒ５ＧｅｎａｂｌｅｄＩｏＶｉｓｐｒｏｐｏｓｅｄｉｎｔｈｉｓｐａｐｅｒ．Ｂａｓｅｄｏｎｔｈｉｓｆｒａｍｅｗｏｒｋ^，ａｄｉｓｔｒｉｂｕｔｅｄｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｍｅｔｈｏｄｗｉｔｈａｓｙｎｃｈｒｏｎｏｕｓａｄｖａｎｔａｇｅａｃｔｏｒｃｒｉｔｉｃ^（Ａ３Ｃ^）^，ｎａｍｅｄＤＳＯＡＣ^，ｉｓｄｅｖｅｌｏｐｅｄｔｏｆｉｇｕｒｅｏｕｔｔｈｅｏｐｔｉｍａｌｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｓｔｒａｔｅｇｙ．Ｓｐｅｃｉｆｉｃａｌｌｙ^，ｂｙｌｅｖｅｒａｇｉｎｇｔｈｅｄｅｅｐｓｐａｔｉｏｔｅｍｐｏｒａｌｒｅｓｉｄｕａｌｎｅｔｗｏｒｋ^（ＳＴＲｅｓＮｅｔ^）^，ＤＳＯＡＣｐｒｅｄｉｃｔｓｔｈｅｆｕｔｕｒｅｓｅｒｖｉｃｅｒｅｑｕｉｒｅｍｅｎｔｓｆｒｏｍｔｈｅＩｏＶｕｓｅｒｓｉｎｅａｃｈｒｏａｄｓｅｇｍｅｎｔｆｉｒｓｔｌｙａｎｄｓｅｎｄｓｔｈｅｍｔｏｔｈｅｌｏｃａｌｅｄｇｅｓｅｒｖｅｒｄｅｐｌｏｙｅｄｉｎｔｈｅｒｏａｄｓｅｇｍｅｎｔ．Ｓｅｃｏｎｄｌｙ^，ｔｈｒｏｕｇｈｃｏｍｂｉｎｉｎｇｔｈｅｌｏｃａｌｆｕｔｕｒｅｓｅｒｖｉｃｅｒｅｑｕｉｒｅｍｅｎｔｓｗｉｔｈｔｈｅｌｏｃａｌｃｏｍｍｕｎｉｃａｔｉｏｎｃｏｎｄｉｔｉｏｎ^（ｅ．ｇ．^，ｔｒａｎｓｍｉｓｓｉｏｎｐｏｗｅｒａｎｄｃｈａｎｎｅｌｇａｉｎ^）ａｎｄｔｈｅｌｏｃａｌｒｅｓｏｕｒｃｅｃｏｎｄｉｔｉｏｎ^（ｅ．ｇ．^，ｒｅｍａｉｎｉｎｇｃｏｍｐｕｔａｔｉｏｎｒｅｓｏｕｒｃｅｓａｎｄｂａｎｄｗｉｄｔｈｒｅｓｏｕｒｃｅｓｏｆｔｈｅｌｏｃａｌｅｄｇｅｓｅｒｖｅｒ^）ｉｎｔｏｌｏｃａｌｓｙｓｔｅｍｓｔａｔｅｓ^，ｅａｃｈｅｄｇｅｓｅｒｖｅｒｆｅｅｄｓｔｈｅｌｏｃａｌｓｙｓｔｅｍｓｔａｔｅｉｎｔｏｔｈｅｌｏｃａｌａｃｔｏｒｎｅｔｗｏｒｋｔｏｏｂｔａｉｎｔｈｅｐｒｅｌｉｍｉｎａｒｙｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｓｔｒａｔｅｇｙ．Ｔｅｃｈｎｉｃａｌｌｙ^，ｔｏａｖｏｉｄｄｉｍｅｎｓｉｏｎｅｘｐｌｏｓｉｏｎｏｆａｃｔｉｏｎｓｐａｃｅｉｎＡ３Ｃ^，ａｍｕｌｔｉｏｕｔｐｕｔａｃｔｏｒｎｅｔｗｏｒｋｉｓｉｎｔｒｏｄｕｃｅｄ．Ｔｈｉｒｄｌｙ^，ｂａｓｅｄｏｎｔｈｅｔｅｍｐｏｒａｌｄｉｆｆｅｒｅｎｃｅ^（ＴＤ^）ｅｒｒｏｒ^，ｔｈｅｌｏｃａｌｃｒｉｔｉｃｎｅｔｗｏｒｋｅｖａｌｕａｔｅｓｔｈｅｐｒｅｌｉｍｉｎａｒｙｏｆｆｌｏａｄｉｎｇｓｔｒａｔｅｇｙａｎｄｃａｌｃｕｌａｔｅｓｉｔｓｐａｒａｍｅｔｅｒｇｒａｄｉｅｎｔ^，ｗｈｉｃｈｆｕｒｔｈｅｒｇｕｉｄｅｓｔｈｅｇｒａｄｉｅｎｔａｓｃｅｎｔｏｆｔｈｅｌｏｃａｌａｃｔｏｒｎｅｔｗｏｒｋｆｏｒｇｒａｄｉｅｎｔａｃｃｕｍｕｌａｔｉｏｎ．Ａｆｔｅｒｔｈｅａｃｃｕｍｕｌａｔｉｏｎｏｆｔｈｅｐａｒａｍｅｔｅｒｇｒａｄｉｅｎｔ^，ｔｈｅｌｏｃａｌｎｅｔｗｏｒｋｐｕｓｈｅｓｔｈｅａｃｃｕｍｕｌａｔｅｄｇｒａｄｉｅｎｔｔｏｔｈｅｇｌｏｂａｌｎｅｔｗｏｒｋｉｎｔｈｅｃｌｏｕｄｃｅｎｔｅｒｆｏｒｐａｒａｍｅｔｅｒｕｐｄａｔｉｎｇａｎｄｐｕｌｌｓｔｈｅｕｐｄａｔｅｄｇｌｏｂａｌｎｅｔｗｏｒｋｐａｒａｍｅｔｅｒｓｂａｃｋｔｏｔｈｅｌｏｃａｌｎｅｔｗｏｒｋｓａｆｔｅｒｗａｒｄ^，ｔｈｅｒｅｂｙｃｏｌｌａｂｏｒａｔｉｎｇｗｉｔｈｔｈｅｇｌｏｂａｌｎｅｔｗｏｒｋｉｎｏｐｔｉｍｉｚｉｎｇｔｈｅｐｒｅｌｉｍｉｎａｒｙｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｓｔｒａｔｅｇｙｓｔｅａｄｉｌｙａｎｄｏｂｔａｉｎｉｎｇｔｈｅｏｐｔｉｍａｌｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｓｔｒａｔｅｇｙ．Ｅｖｅｎｔｕａｌｌｙ^，ｅｘｔｅｎｓｉｖｅｅｘｐｅｒｉｍｅｎｔａｌｅｖａｌｕａｔｉｏｎｓｏｆＤＳＯＡＣａｒｅｃｏｎｄｕｃｔｅｄｂａｓｅｄｏｎａｂｉｇｒｅａｌｗｏｒｌｄｓｅｒｖｉｃｅｒｅｑｕｉｒｅｍｅｎｔｄａｔａｓｅｔ．ＴｈｅｅｘｐｅｒｉｍｅｎｔｒｅｓｕｌｔｓｄｅｍｏｎｓｔｒａｔｅｔｈａｔＤＳＯＡＣｄｅｃｒｅａｓｅｓｔｈｅａｖｅｒａｇｅｓｅｒｖｉｃｅｌａｔｅｎｃｙｂｙ０．４％ｔｏ２０．４％ｃｏｍｐａｒｅｄｗｉｔｈｆｏｕｒｅｘｉｓｔｉｎｇｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇｍｅｔｈｏｄｓｉｎｄｉｆｆｅｒｅｎｔＩｏＶｅｎｖｉｒｏｎｍｅｎｔｓ^，ｐｒｏｖｉｎｇｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓａｎｄｅｆｆｉｃｉｅｎｃｙｏｆＤＳＯＡＣ．

犓犲狔狑狅狉犱狊　ｅｄｇｅｃｏｍｐｕｔｉｎｇ^；Ｉｎｔｅｒｎｅｔｏｆｖｅｈｉｃｌｅｓ^；ｓｅｒｖｉｃｅｏｆｆｌｏａｄｉｎｇ^；ｄｅｅｐｓｐａｔｉｏｔｅｍｐｏｒａｌｒｅｓｉｄｕａｌｎｅｔｗｏｒｋ^；ａｓｙｎｃｈｒｏｎｏｕｓａｄｖａｎｔａｇｅａｃｔｏｒｃｒｉｔｉｃ

１　 ^引　 ^言

据研究，目前全世界商用和民用车辆数之和已经超过了１０亿．到２０３５年，预计这一数字将会达到２０亿^［^１^］．汽车保有量的增加^，给城市带来了诸如交

通拥堵^、行车安全等一系列问题^［^２^］．与此同时^，互联网的迅速发展使得人们对出行的服务需求更加复杂和多样化．在此背景下，车联网（ＩｎｔｅｒｎｅｔｏｆＶｅｈｉｃｌｅｓ^，ＩｏＶ^）应运而生．基于车用无线通信技术^（ＶｅｈｉｃｌｅｔｏＥｖｅｒｙｔｈｉｎｇ^，Ｖ２Ｘ^）^，车联网将车辆、路边单元（ＲｏａｄｓｉｄｅＵｎｉｔ^，ＲＳＵ^）以及服务提供商连接为一个有机的网络

３８３１２期许小龙等：车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法２

《计

算

机

学

报

》

(3)

整体^，实现了它们之间的全方位通信^［^３^］．通过车联网，服务提供商能够获取用户服务需求和道路环境信息，基于这些数据为车载用户提供例如自动驾驶^、路径规划^、碰撞预警^、车载娱乐等多种服务．这些服务能够有效地缓解城市中的各种道路交通问题^，提高了驾驶安全性和旅途舒适性^，用户体验^（ＱｕａｌｉｔｙｏｆＥｘｐｅｒｉｅｎｃｅ^，ＱｏＥ^）也因此得以提高^［^４^］．

一般而言^，搭载在车辆上的计算设备的计算能力有限^，甚至某些车辆不会搭载计算设备^［^５^］．目前最常见的解决方案是将车联网用户的服务需求卸载到云端进行处理^［^６^］．云平台将用户的服务需求处理完成后，再将结果传回车联网用户．然而，由于云端和用户之间的地理距离较远^，将服务卸载到云端进行处理再返回的过程往往会产生较长的时延．与此同时^，车联网中的用户通常处于高速移动的状态^，这要求用户服务应在极低的时延之内完成．如果某一些服务（例如，碰撞预警）的延迟超过了一定限度，会导致服务质量（ＱｕａｌｉｔｙｏｆＳｅｒｖｉｃｅ^，ＱｏＳ^）的下降甚至交通事故的发生^［^７^］．

边缘计算作为解决此矛盾的可行方案之一^，通过在ＲＳＵ上部署边缘服务器^（ＥｄｇｅＳｅｒｖｅｒ^，ＥＳ^）^，将原来集中在云端的计算资源分布到靠近车联网用户一侧^［^８^］．因此^，车联网用户和计算资源的距离得以大大缩短^，所获服务的时延也得以降低．有鉴于此^，目前已有大量案例将边缘计算运用在车联网环境中．例如^，文献^［９^］中提出了一种名为ＨＶＣ^（ＨｙｂｒｉｄＶｅ ｈｉｃｕｌａｒＥｄｇｅＣｌｏｕｄ^）的分布式车联网边缘计算解决

方案．利用多路存取网络，该方法实现了路边单元和云端计算资源的有效共享．Ｃｕｉ等人为车联网环境设计了一种基于区块链的容器化边缘计算平台ＣＵＴＥ^，该平台能够协助车联网进行资源协调和管

理，从而降低用户的服务时延^［^１^０^］．

但是^，由于边缘服务器所配备的计算^、存储和带宽资源往往是有限的^，很难保证将所有车联网用户的服务请求卸载到边缘服务器后，边缘服务器仍不处于过载状态．一旦边缘服务器发生过载^，服务时延将会升高^，用户体验也会相应地降低^［^１^１^］．因此^，某些车联网用户的服务请求仍需在云平台或者本地执行，从而保证边缘服务器资源的使用效率．如何在满足边缘服务器资源受限的约束下^，对车联网用户服务的卸载目的地进行决策^，尽可能地降低服务时延，是车联网边缘计算中极具挑战性的问题之一．

此外^，第五代无线通信技术^（５Ｇ^）的快速发展给车联网边缘计算赋予了巨大的动能．相比于传统的第四代无线通信技术^（４Ｇ^）^，５Ｇ能够为车联网服务提供更大的带宽、更低的延时以及更少的能耗．更重要的是^，车联网用户的移动性给网络连接的稳定性带来极大的挑战^，传统的４Ｇ通信并不能保证用户在高速移动时网络连接依然稳定．而如果采用基于５Ｇ的无线通信^，即使用户的移动速度达到５００ｋｍ^／ｈ^，仍能保证稳定的网络连接与通信^［^１^２^］．因此，将５Ｇ技术引入车联网边缘计算中是十分必要的．

在车联网边缘计算环境中，网络环境、计算资源和用户服务需求等无时无刻不处在变化状态．其中服务卸载的决策过程可以抽象为马尔科夫决策过程

（ＭａｒｋｏｖＤｅｃｉｓｉｏｎＰｒｏｃｅｓｓ^，ＭＤＰ^）^［^１^３^］．强化学习

（ＲｅｉｎｆｏｒｃｅｍｅｎｔＬｅａｒｎｉｎｇ^，ＲＬ^）作为人工智能领域的一部分，是一类通过智能体在和环境的交互过程中不断试错^，学习如何得到最大收益的方法^，能够有效求解马尔科夫决策问题^［^１^４^］．此外，近年来深度学习（ＤｅｅｐＬｅａｒｎｉｎｇ^，ＤＬ^）的快速发展，使得计算机学习数据的高维抽象特征表示成为了可能^［^１^５^］．深度强化学习（ＤｅｅｐＲｅｉｎｆｏｒｃｅｍｅｎｔＬｅａｒｎｉｎｇ^，ＤＲＬ^）将深度学习和强化学习结合^，较好地解决了传统强化学习无法应用于高维度状态空间和动作空间的问题，进一步提高了强化学习求解问题的能力^［^１^６^］．

目前为止^，虽然有一些研究已将深度强化学习应用于５Ｇ车联网边缘计算服务卸载中^，但这些研究存在着两方面的问题．一方面是^，某些研究^，例如文献［１７^］^，仅仅将强化学习作为优化目标函数例如时延^、能耗的一种手段^，而并未考虑环境的动态变化，真正运用强化学习对边缘计算环境中用户服务进行长期的^、动态的服务卸载决策．另一方面^，某些研究^，例如文献^［１８^］和文献^［１９^］^，虽然利用强化学习解决了服务卸载的动态决策问题，但是设计的服务卸载方法同时考虑环境中所有的边缘服务器^，而没有考虑边缘服务器的分布式特征．因此，当边缘服务器数量较多或者服务需求量较大时^，会导致状态空间和动作空间维度爆炸，造成网络参数过多、训练缓慢甚至难于训练等问题．

总的来说^，如何在考虑车联网边缘计算环境动态变化、资源受限的同时，充分利用边缘计算分布式的特点^，避免因边缘服务器数量或用户服务需求量较大而产生的维度爆炸问题，从而长期、稳定地为用户提供低时延的服务^，是当前车联网边缘计算服务卸载的一大挑战．为此^，本文提出了一种基于深度强

４８３

２计　　算　　机　　学　　报２０２１年

《计

算

机

学

报

》

(4)

化学习的车联网边缘计算服务卸载方法．特别地^，考虑到边缘计算具有分布式的特征，本方法基于分布式的强化学习算法^，从而提高服务卸载的效率．本文的主要贡献包含以下三个方面：

（１^）提出了一种^“端边云^”协同的５Ｇ车联网边缘计算系统模型．该模型中^，边缘服务器能够对服务卸载方法进行局部优化，而中心云负责服务卸载方法的全局优化^；边缘服务器和中心云协同工作^，从而实现分布式的服务卸载优化．

（２^）将深度时空残差网络^［^２^０^］^（ＤｅｅｐＳｐａｔｉｏ ＴｅｍｐｏｒａｌＲｅｓｉｄｕａｌＮｅｔｗｏｒｋ^，ＳＴＲｅｓＮｅｔ^）和异步优势行动者评论家^［^２^１^］^（ＡｓｙｎｃｈｒｏｎｏｕｓＡｄｖａｎｔａｇｅＡｃｔｏｒＣｒｉｔｉｃ^，Ａ３Ｃ^）结合^，提出了一种车联网边缘计算环境下分布式的服务卸载方法ＤＳＯＡＣ．该方法协同了深度学习和强化学习^，实验证明其能够有效地降低车联网用户长期的平均服务时延．

（３^）引入了一种多动作输出的行动者网络^，并推导出该网络的参数梯度．解决了传统深度强化学习中，当动作由多个子动作复合而成时，动作空间维度随子动作取值数呈多项式增长^，导致行动者网络参数过多、难于训练的问题．

本文第２节介绍和本文相关的研究工作^，并对这些研究的成果和存在的问题做一定分析；第３节对５Ｇ车联网边缘计算环境中的服务卸载问题建立详细的系统模型^；第４节提出分布式的５Ｇ车联网边缘计算服务卸载方法ＤＳＯＡＣ^；第５节介绍实验的参数设置和实验结果^；最后总结全文^，指出未来的研究工作方向．

２　 ^相关工作

２１　边缘计算在车联网中的应用

由于边缘计算能够很好满足车联网用户对低延迟服务的需求^，近年来其在车联网中的应用得到了中外学者极大关注和广泛研究．例如，为了满足车联网环境中通信^、计算和存储的多种需求^，文献^［２２^］设计了一种能耗敏感的车联网移动边缘计算（ＭｏｂｉｌｅＥｄｇｅＣｏｍｐｕｔｉｎｇ^，ＭＥＣ^）调度框架．该文作者提出了

一种启发式的算法^，该算法同时考虑了移动边缘计算服务器的计算和网络下行能量消耗．实验表明，该方法在降低能耗^、时延和任务阻塞概率方面有着极好的效果．张海波等人^［^２^３^］通过整合内容分发网络

（ＣｏｎｔｅｎｔＤｅｌｉｖｅｒｙＮｅｔｗｏｒｋ^）和ＭＥＣ^，利用动态信道分配算法和基于ＲＳＵ调度的合作博弈算法^，形

成了一个能够合理组织中心云^、边缘云和车载云资源的架构，有效降低了车联网用户的服务时延，提高了资源利用率．为了有效利用车联网中不同计算架构的优势，进而部署大规模的ＩｏＶ系统^，Ｗａｎｇ等人^［^２^４^］提出了一种名为ＣＶＥＣ^（ＣｏｌｌａｂｏｒａｔｉｖｅＶｅｈｉｃｕｌａｒＥｄｇｅＣｏｍｐｕｔｉｎｇ^）的新型车辆边缘协同计算框架．

该框架能够同时为可扩展的车联网服务以及车联网应用提供水平方向和垂直方向的协作和支持．然而^，这些研究在将边缘计算应用于车联网的过程中，均未考虑边缘计算的分布式特征能给车联网带来的服务速度和灵活性方面的提升．

２２　边缘计算中的分布式服务卸载

考虑到边缘计算环境中^，一般会有多个配置在不同地理位置的边缘服务器，因此边缘计算天生具有分布式的特征^，可以应用分布式算法进行服务卸载决策．相比于传统的集中式服务卸载算法，分布式算法所要考虑的决策空间更小^，因此能够更加高效^、快速地解决服务卸载问题，获得了中外学者的极大关注和深入研究．文献［２５^］设计了一种移动边缘计算环境下的分布式服务卸载方法^，该方法将卸载过程中用户和边缘云的交互过程抽象为斯塔克尔伯格博弈^（ＳｔａｃｋｅｌｂｅｒｇＧａｍｅ^）模型^，旨在降低用户使用边缘服务器所产生的花费．而文献［２６^］则关注在服务时延约束下边缘计算系统的能耗．该文作者将卸载问题建模为一个潜在博弈^（ＰｏｔｅｎｔｉａｌＧａｍｅ^）模型，并证明了该模型那什均衡的存在性．实验表明，该文提出的方法在环境规模增大时^，能够取得较低的系统能耗．Ｃｈｅｎ等人考虑了多用户场景中移动边缘云计算的计算卸载问题^［^２^７^］．他们首先提出了一种集中式的计算卸载最优化问题，并证明了该问题是ＮＰＨａｒｄ．然后^，他们设计了一种分布式的计算卸载模型作为集中式计算卸载问题的替代^，并使用博弈论设计了一种分布式的多用户计算卸载算法．实验表明^，当用户数量增加时^，该算法仍能够获得较好的性能表现．然而，上述研究均只考虑了某一时刻下的服务卸载策略^，并没有考虑随着时间流逝^，用户服务需求、网络环境、计算资源的动态变化导致的诸如服务质量不稳定的问题．而本文运用深度学习模型ＳＴ ＲｅｓＮｅｔ预测用户服务需求量^，协同深度强化学习方

法Ａ３Ｃ^，将车联网环境的动态变化考虑在内，构建出分布式的车联网边缘计算服务卸载方法ＤＳＯＡＣ^，从而为车联网环境下车载用户提供长期的高质量服务．２３　强化学习在车联网中的应用

近年来^，将深度学习技术应用于强化学习而形

５８３１２期许小龙等：车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法２

《计

算

机

学

报

》

(5)

成的深度强化学习方法^，相比于传统的强化学习方法有着更强的环境感知能力，在诸如电子游戏、参数优化^、机器人控制等多个领域得到了广泛的研究和令人振奋的成果^［^２^８^］．如何将强化学习应用于车联网环境中^，提高车联网用户的服务体验^，也是当今车联网领域的一大研究方向．文献^［２９^］中^，作者设计了一种启发式算法来对车联网中ＲＳＵ云资源进行有效的管理．该文将启发式算法中选择帕累托最优解的过程定义为马尔可夫决策过程，并将强化学习应用于此．实验表明^，该算法能够最小化长期使用的虚拟机（ＶｉｒｔｕａｌＭａｃｈｉｎｅ^，ＶＭ^）迁移次数．如引言所述，目前已有研究者运用深度强化学习进行车联网边缘计算服务卸载．例如^，Ｎｉｎｇ等人^［^３^０^］将车联网边缘计算环境中的通信和计算状态抽象为有限马尔科夫链^，将任务规划和卸载问题表示为一个最大化用户服务体验的联合优化问题，通过运用深度强化学习方法^，规划出了最佳的服务卸载和网络资源分配方案．文献［３１^］在考虑车联网环境中车流量、服务需求和通信环境的变化的同时，基于Ｑ学习^（Ｑ Ｌｅａｒｎｉｎｇ^）和深度强化学习^，寻找最佳的计算卸载和

资源分配策略．然而^，这些研究都将车联网中所有边缘服务器和用户一次性纳入环境中．当用户服务需求量较大^，或者边缘服务器数量较多时^，容易导致状态空间和动作空间维度过高，神经网络参数过多，造成训练时间的延长^，甚至导致网络难于训练．为了解决这一问题^，本文基于Ａ３Ｃ算法^，充分发挥了边缘计算分布式的特点，每个本地网络仅负责所在环境的用户服务需求的卸载决策^，最后与全局网络协同进行网络参数的更新，从而有效降低了强化学习中状态空间和动作空间的维度^，减少了参数的数量^，提高了训练的效率．

３　 ^系统模型

本节首先提出了一种如图１所示的^“端边云^” 协同的５Ｇ车联网边缘计算系统模型．然后，在此基础上^，对系统内的网络通信和用户服务时延建立了数学模型．最终，我们将车联网边缘计算中的服务卸载问题抽象为一个整数规划问题．系统模型中一些重要变量的符号表示及其含义如表１所示．

图１　^“端边云”协同的５Ｇ车联网边缘计算系统模型图６

８３

２计　　算　　机　　学　　报２０２１年

《计

算

机

学

报

》

(6)

表１　系统模型中的重要变量符号及其含义

变量含义

犕^（τ^） τ时间段内系统用户的总数量犚道路段编号

犕犚（τ^） τ^{时间段内道路段}犚中用户的总数量犝犚（τ^） τ^{时间段内道路段}犚^的用户集

犖^犫边缘服务器可分配的子信道个数犖^犮边缘服务器可分配的计算资源个数

３１　^“^端^边^云”协同车联网边缘计算模型

车联网环境中^“端边云^”协同的５Ｇ边缘计算系统模型如图１所示．该系统分为车联网用户层、边缘层和云服务层三层．其中^，车联网用户层包括了在道路上行驶的所有用户车辆^，且每一用户车辆都配备了有限的计算资源．用户的服务需求可以运用本地的计算资源^，在安装于本地的车载应用内满足．边缘层包括分散在道路旁的５Ｇ边缘计算节点^，每个节点包括路边单元以及配备在该路边单元上的边缘服务器两大部分．路边单元用于收集用户服务需求^、网络状况等信息，具有一定的覆盖范围，该范围将道路分为一个个不重合的道路段^，车联网用户层中的用户也因此被分在唯一的道路段中．特别地，５Ｇ边缘计算节点和用户车辆上都安装有５Ｇ通信设备．

通过５Ｇ无线信道^，基于毫米波^（ＭｉｌｌｉｍｅｔｅｒＷａｖｅ^，ｍｍＷａｖｅ^）^［^３^２^］等无线通信技术，用户车辆和相应的边缘计算节点之间形成高带宽的通信连接．在本文中^，我们假设每一个路边单元均会配备一个边缘服务器，并在服务器中已经预先安装好了服务提供商提供的各类车载应用^，可以满足用户卸载到边缘服务器上的服务需求．同时^，用户的服务需求还可卸载到中心云执行，此时边缘计算节点会将服务需求通过有线信道转发到中心云进行计算．中心云所在的层即为云服务层，该层包含了高性能的计算资源，并且同服务提供商直接相连^，能够高效^、快速地满足用户的服务需求．

该系统中，时间被离散化为不同的时间段．此外^，运用虚拟化技术^，各个边缘服务器的计算资源可以被虚拟化为一份份独立的计算资源，分配给用户使用．在每个时间段开始时，路边单元会收集所属道路段的环境信息^（例如用户服务需求^、网络状况等^）^，发送给对应的边缘服务器．边缘服务器首先根据环境信息对本地的车联网服务需求做出卸载决策．之后^，其会对刚刚做出的卸载决策进行评判^，学习本地的卸载策略的优化方向．当学习一定次数后，边缘服务器会将其学习到的优化知识发送给中心云．中心云对来自不同道路段的优化知识进行汇总后，可以

得出优化后的卸载策略^，并将其回传给各个边缘服务器进行实现．因此，卸载策略的优化过程被分配给了多个不同的本地边缘服务器同时进行处理^，最后再由中心云进行处理结果的汇总．这一过程满足分布式的特征．

值得注意的是^，由于车辆具有移动性^，在某一时间段结束时，该车辆可能会移动到和时间段开始时不同的道路段中．我们假设在某一时间段内^，用户车辆会与且仅会与时间段开始时用户车辆所在道路段中的５Ｇ边缘计算节点连接．也就是说^，即使在某一时刻，用户离开了在时间段开始时其所在的道路段狉^，但是用户车辆还会和道路段狉中的５Ｇ边缘计算节点保持连接．因此，服务卸载决策的优化过程会付出^“端边^”之间^，也就是用户车辆和边缘计算节点之间稳定的通信连接的代价．考虑到５Ｇ技术的特性^，这一代价是可以被满足的．

３２　^{网络通信模型}

为了更准确地对５Ｇ车联网边缘计算服务卸载系统中的网络通信建立计算模型^，首先对车联网用户进行定义，如定义１所示．

定义１．　车联网用户．车联网用户是一个三元组^，记为狌^犻＝^〈λ^犻^，狆^犻^，δ^犻^〉^，其中^，犻表示车联网用户的编号^，λ^犻是车联网用户和边缘计算节点之间的最大数据传输速率^，狆^犻代表该用户的信号发射功率^，δ^犻表示该用户和边缘计算节点之间的信道增益．用犝^（τ^）＝

｛狌１，狌２，…，狌犕（τ^）｝表示用户集^，代表车联网边缘计算环境中τ时间段内所有用户的集合．

如３．１节所述^，本系统中用户和５Ｇ边缘计算节点以无线方式连接．假设用户采用频分复用正交多址接入技术与边缘计算节点相连^［^３^３^］^，实现数据的双向传输，其中，每一个子信道的带宽为狑．假设在某一道路段内^，各用户与边缘计算节点之间的通信干扰可以忽略不计，则用户狌^犻和对应的边缘计算节点之间的最大数据传输速率为

λ^犻＝狀^犻^犫^·狑ｌｏｇ^２^（１＋狆^犻^·δ^犻^·σ^－^２^） ^（１^）其中，狀^犫^犻表示分配给用户狌^犻的子信道数；σ代表环境中的高斯白噪声的标准差．

３３　^{服务时延计算模型}

在本系统中，由于用户的服务需求既可以在本地执行^，亦可卸载到边缘服务器执行^，亦可卸载到中心云上执行，所以需要考虑这三种不同情况下的服务时延．首先定义系统中的服务需求如下．

定义２．　服务需求．车联网环境中的服务需求是一个三元组狊^犻＝^〈犱^犻^，狉^犻^，狌^犻^〉^，其中^，犱^犻代表该服务

７８３１２期许小龙等：车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法２

《计

算

机

学

报

》

(7)

需求所需的输入参数的数据量大小^；狉^犻代表完成该服务需求所需的计算量^；狌^犻表示产生该服务需求的用户．用犛^（τ^）＝^｛狊^１^，狊^２^，^…，狊犕（τ）｝表示车联网边缘计算环境中τ时间段内所有的用户服务需求集合．

在服务需求定义的基础上^，下文为不同情况下满足用户服务需求所需的服务时延进行定义^，并最终给出系统总服务时延的计算公式．

３．３．１　本地执行时用户的服务时延

当用户的服务需求在本地执行时^，用户无需将该服务的输入参数数据通过无线信道上传到边缘服务器^，而只需通过位于本地的车载应用^，利用本地的计算资源进行处理即可．因此^，对于用户狌^犻和其产生的服务需求狊^犻＝^〈犱^犻^，狉^犻^，狌^犻^〉^，可以得到该用户在本地完成其服务需求的时延为

狋^ｌ^犻^ｏ^ｃ＝狉^犻

犳^犻 ^（２^）其中，犳^犻是用户狌^犻所配备的本地计算资源的计算速率大小．

３．３．２　卸载到边缘服务器执行时用户的服务时延当用户的服务需求被卸载到边缘服务器上进行处理时^，需要考虑等待无线信道空闲所产生的等待时延^、将服务需求输入参数从用户本地上传至边缘服务器的传输时延、在边缘服务器上处理服务需求的执行时延以及将处理完成的服务结果返回给用户的回程时延四大部分．考虑到服务结果相比于输入参数来说^，数据量一般较小^，因此回程时延一般忽略不计．在本系统中，我们也忽略回程时延．其余三部分中，用户狌^犻＝^〈λ^犻^，狆^犻^，δ^犻^〉将其所需求服务狊^犻的输入参数上传至边缘服务器所需的时间可由下式计算^：

狋犻^ｕ^ｐ＝犱^犻

λ^犻 ^（３^）在边缘服务器上处理服务狊^犻的执行时延的计算公式如下所示^：

狋^犻^ｃ^ａ^ｌ＝狉狀^犮犻·犳^犻^Ｍ^Ｅ^Ｃ ^（４^）其中，狀犻^犮代表分配给用户狌^犻的计算资源数；犳^Ｍ^Ｅ^Ｃ表示单个边缘服务器计算资源的计算速率．

因此，如果用户狌^犻的服务需求被卸载到边缘服务器执行，所产生的服务时延可被下式计算：

狋^犻^ｅ^ｄ^ｇ^ｅ＝狋^犻^ｗ^ａ^ｉ^ｔ＋狋犻^ｕ^ｐ＋狋^犻^ｃ^ａ^ｌ ^（５^）其中^，狋^犻^ｗ^ａ^ｉ^ｔ是用户的等待时延．对于某一个用户的服务需求来说^，其等待时延即为从该用户产生该服务需求开始^，直到该服务需求得到处理的时间间隔．在本文中，由于卸载的服务需求需要等待无线信道空

闲时才能进行上传^，因此^，服务需求开始处理的时间即为该需求被分配到无线信道的时间．使用狋^犻^ｓ^ｔ^ａ^ｒ^ｔ表示用户狌^犻产生服务需求狊^犻的时间^，使用狋^犻^ｅ^ｎ^ｄ表示用户狌^犻的服务需求狊^犻被分配到无线信道的时间^，则用户狌^犻的等待时延狋^犻^ｗ^ａ^ｉ^ｔ可以被计算为

狋^犻^ｗ^ａ^ｉ^ｔ＝狋^犻^ｅ^ｎ^ｄ－狋^犻^ｓ^ｔ^ａ^ｒ^ｔ ^（６^）３．３．３　卸载到云服务器执行时用户的服务时延

根据３．１节的５Ｇ车联网边缘计算模型^，如果用户的服务需求需要被卸载到云端执行^，那么该服务的输入参数首先要通过无线信道由用户车辆上传到边缘层，再由相应的边缘计算节点通过有线信道转发给云端进行处理．考虑到云端配备的云服务器有着较强的计算能力^，处理时延相较于传输时延来说可以忽略不计，因此，当用户狌^犻将服务狊^犻卸载到云端执行时产生的服务时延主要包括等待无线信道空闲的等待时延、将输入参数上传到边缘计算节点的传输时延以及边缘计算节点和云服务器之间传输数据所产生的往返时延^（ＲｏｕｎｄＴｒｉｐＴｉｍｅ^，ＲＴＴ^）三部分^，计算公式如下所示^：

狋^犻^ｃ^ｌ^ｏ^ｕ^ｄ＝狋^犻^ｗ^ａ^ｉ^ｔ＋犱^犻

λ^犻＋犚犜犜 ^（７^）由于云服务器距离边缘计算节点的地理距离较远，边缘计算节点将输入参数数据转发给云端这一过程和云端将服务处理结果返回的过程一般会产生相近的时延^，且该时延与输入参数的数据量无关．因此^，犚犜犜可以写成^：

犚犜犜＝２狋^ｃｏ^ｌｆ^ｏｆ^ｕ^ｄ（８^）其中^，狋^ｃｏ^ｌｆ^ｏｆ^ｕ^ｄ表示将数据从边缘服务器转发到云端所产生的时延．

３．３．４　系统总服务时延

在本系统中^，每一个用户的服务需求仅可被卸载到本地^、边缘服务器和云端三地中的其中一处执行．使用０１变量α^犻和β^犻表示某一个服务狊^犻的卸载情况，其中，变量α^犻定义为是否在本地执行：

α^犻＝１^，服务狊^犻于本地执行０^，服务狊^犻

烅烄

烆不于本地执行 ^（９^）变量β^犻定义为是否在边缘服务器执行^：

β^犻＝１^，服务狊^犻卸载至边缘服务器执行０^，服务狊^犻

烅烄

烆卸载至云服务器执行 ^（１０^）因此，对于任意服务狊^犻^，其服务时延为

狋^犻＝α狋^犻^ｌ^ｏ^ｃ＋^（１－α^）^［β狋^犻^ｅ^ｄ^ｇ^ｅ＋^（１－β^）狋^犻^ｃ^ｌ^ｏ^ｕ^ｄ^］（１１^）所以^，对于τ时间段内的所有用户来说^，系统总服务时延的计算公式如下所示：

车联网边缘计算环境下基于深度强化学习的 分布式服务卸载方法

车联网边缘计算环境下基于深度强化学习的 分布式服务卸载方法

许小龙

方子介

齐连永

窦万春

何 强

段玉聪

《 计

算 机

学 报

》

１ 引 言

《 计

算

机

学

报

》

《 计

算

机

学

报

》

２ 相关工作

《 计

算

机

学

报

》

３ 系统模型

《 计

算

机

学

报

》

《 计

算

机

学

报

》

《 计

算

机

学

报

》

车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法

车联网边缘计算环境下基于深度强化学习的分布式服务卸载方法

　 ^方子介

　 ^齐连永

^窦万春

^何　 ^强

^段玉聪

《计

算机

学报

１　 ^引　 ^言

《计

《计

２　 ^相关工作

《计

３　 ^系统模型

《计

《计

《计