當(dāng)前位置:首頁 > 實用文檔 > 武器工業(yè)與軍事技術(shù) > 正文

智能藍軍作戰(zhàn)行為決策模型優(yōu)化技術(shù)研究

火力與指揮控制 頁數(shù): 8 2023-11-15
摘要: 針對藍軍模型適應(yīng)性和學(xué)習(xí)能力不足等問題,提出一種融合決策樹和PPO強化學(xué)習(xí)的智能藍軍作戰(zhàn)行為決策優(yōu)化技術(shù),在決策樹運行過程中若智能體陷入決策困境,利用基于PPO算法訓(xùn)練的網(wǎng)絡(luò)模型生成最優(yōu)動作,確保其得以繼續(xù)順利高效執(zhí)行,最后基于廟算·智勝平臺開展對比實驗,對優(yōu)化技術(shù)進行了可行性和有效性驗證。

開通會員,享受整站包年服務(wù)立即開通 >