基于深度強(qiáng)化學(xué)習(xí)的智能對(duì)手自主空戰(zhàn)決策技術(shù)
火力與指揮控制
頁(yè)數(shù): 7 2023-10-15
摘要: 為提升空戰(zhàn)訓(xùn)練對(duì)手的智能性與自主性,提升空戰(zhàn)訓(xùn)練效果。針對(duì)空戰(zhàn)戰(zhàn)術(shù)訓(xùn)練智能對(duì)手自主空戰(zhàn)決策問題,提出一種基于深度強(qiáng)化學(xué)習(xí)的智能體訓(xùn)練方法,采用最大熵強(qiáng)化學(xué)習(xí)(SAC)算法平衡策略探索與利用的優(yōu)勢(shì),引入自博弈和多智能體聯(lián)盟訓(xùn)練方法提升空戰(zhàn)智能體策略的多樣性和魯棒性。針對(duì)一對(duì)一近距格斗空戰(zhàn)場(chǎng)景建立智能博弈框架及獎(jiǎng)勵(lì)函數(shù),仿真結(jié)果表明,基于零經(jīng)驗(yàn)訓(xùn)練得到的智能體能夠有效自主機(jī)動(dòng)決策并...