基于分配策略優(yōu)化算法的智能防空任務(wù)分配
系統(tǒng)仿真學(xué)報(bào)
頁數(shù): 12 2022-08-09
摘要: 針對(duì)分配策略最優(yōu)算法在大規(guī)模場(chǎng)景中求解速度不足的問題,基于馬爾可夫決策過程,將深度強(qiáng)化學(xué)習(xí)與其相結(jié)合,將大規(guī)模防空任務(wù)分配問題進(jìn)行智能化求解。根據(jù)大規(guī)模防空作戰(zhàn)特點(diǎn),利用馬爾可夫決策過程對(duì)智能體進(jìn)行建模,構(gòu)建數(shù)字戰(zhàn)場(chǎng)仿真環(huán)境;設(shè)計(jì)防空任務(wù)分配智能體,通過近端策略優(yōu)化算法,在數(shù)字戰(zhàn)場(chǎng)仿真環(huán)境中進(jìn)行訓(xùn)練。以大規(guī)模防空對(duì)抗任務(wù)為例,驗(yàn)證了該方法的可行性和優(yōu)越性。