基于強化學習的邊緣計算網(wǎng)絡資源在線分配方法
控制與決策
頁數(shù): 7 2021-08-03
摘要: 針對邊緣計算應用對實時性的要求,引入軟件定義網(wǎng)絡和網(wǎng)絡功能虛擬化技術對邊緣計算網(wǎng)絡進行重構(gòu).基于此,考慮以最大化長期平均實時任務處理成功率為目標的計算和通信資源在線分配問題.通過建立馬爾可夫決策過程模型,提出基于Q學習的資源在線分配方法. Q學習在狀態(tài)動作空間較大時內(nèi)存占用大且會發(fā)生維度災難,鑒于此,進一步提出基于DQN的資源在線分配方法.實驗結(jié)果表明,所提出算法能夠較快收斂,...