當前位置:首頁 > 實用文檔 > 船舶工業(yè) > 正文

基于深度強化學習的多無人艇協(xié)同目標搜索算法

兵器裝備工程學報 頁數(shù): 8 2023-11-25
摘要: 針對應用于海上多無人艇目標搜索任務的經(jīng)典深度強化學習模型難以收斂且訓練耗時長的問題,提出一種基于優(yōu)先經(jīng)驗回放的異步確定性策略梯度模型。為提升模型收斂效果,引入一種基于優(yōu)先級的經(jīng)驗回放機制,該機制可以有效提高高價值經(jīng)驗的利用率,從而避免算法收斂困難的問題。為進一步減少模型訓練耗時長,引入異步學習的訓練框架,該框架通過多子線程的同步訓練參數(shù)更新主進程網(wǎng)絡,有效提高了模型訓練效率。在...

開通會員,享受整站包年服務立即開通 >