基于知識(shí)指導(dǎo)的安全強(qiáng)化學(xué)習(xí)路由算法
中國(guó)工程機(jī)械學(xué)報(bào)
頁(yè)數(shù): 6 2022-08-15
摘要: 在大流量傳輸場(chǎng)景中,傳統(tǒng)啟發(fā)式路由選擇協(xié)議無(wú)法根據(jù)網(wǎng)絡(luò)狀態(tài)動(dòng)態(tài)調(diào)整路由策略,而基于數(shù)據(jù)驅(qū)動(dòng)的路由協(xié)議在訓(xùn)練初期無(wú)法保證網(wǎng)絡(luò)吞吐量。針對(duì)此問(wèn)題,提出基于先驗(yàn)知識(shí)指導(dǎo)的安全強(qiáng)化學(xué)習(xí)路由算法,把先驗(yàn)知識(shí)引入深度強(qiáng)化學(xué)習(xí)模型的動(dòng)作選擇,結(jié)合ε-greedy策略,根據(jù)網(wǎng)絡(luò)狀態(tài)對(duì)下一跳進(jìn)行評(píng)估和約束,必要時(shí)提供更優(yōu)動(dòng)作,避免無(wú)效動(dòng)作?;贙eras與Networkx的仿真實(shí)驗(yàn)表明:該算法可...