基于深度強化學(xué)習(xí)的多目標(biāo)邊緣任務(wù)調(diào)度研究
電子測量技術(shù)
頁數(shù): 8 2023-04-23
摘要: 針對深度強化學(xué)習(xí)在邊緣計算環(huán)境下的多目標(biāo)任務(wù)調(diào)度時存在優(yōu)化效果差等問題,提出了一種新的基于改進的競爭深度雙Q網(wǎng)絡(luò)的多目標(biāo)任務(wù)調(diào)度算法(IMTS-D3QN)。首先將深度雙Q網(wǎng)絡(luò)對目標(biāo)中的最大操作分解為動作選擇和動作評估,以消除過高估計;采用立即獎勵經(jīng)驗樣本分類方法,對經(jīng)驗樣本按照重要性程度分類存儲,訓(xùn)練時選取更多重要性程度高的經(jīng)驗樣本,提高了實際樣本的利用率,加快了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練...