智能藍軍作戰(zhàn)行為決策模型優(yōu)化技術(shù)研究
火力與指揮控制
頁數(shù): 8 2023-11-15
摘要: 針對藍軍模型適應(yīng)性和學(xué)習(xí)能力不足等問題,提出一種融合決策樹和PPO強化學(xué)習(xí)的智能藍軍作戰(zhàn)行為決策優(yōu)化技術(shù),在決策樹運行過程中若智能體陷入決策困境,利用基于PPO算法訓(xùn)練的網(wǎng)絡(luò)模型生成最優(yōu)動作,確保其得以繼續(xù)順利高效執(zhí)行,最后基于廟算·智勝平臺開展對比實驗,對優(yōu)化技術(shù)進行了可行性和有效性驗證。