被動探測視場角約束下的深度強化學(xué)習(xí)制導(dǎo)方法
宇航學(xué)報
頁數(shù): 9 2024-08-30
摘要: 針對紅外制導(dǎo)導(dǎo)彈攔截機動目標(biāo)的導(dǎo)引律設(shè)計問題,提出了一種純角度量測下考慮視場角約束的深度強化學(xué)習(xí)制導(dǎo)方法。首先,將攔截制導(dǎo)問題轉(zhuǎn)化為一個馬爾可夫決策過程,建立了基于雙延遲深度確定性策略梯度算法的深度強化學(xué)習(xí)制導(dǎo)模型,并充分考慮了導(dǎo)彈一階自動駕駛儀特性;其次,設(shè)計了一種滿足導(dǎo)引頭視場角約束,同時又能權(quán)衡能量消耗和制導(dǎo)精度的綜合獎勵函數(shù),并在典型場景下進(jìn)行了深度強化學(xué)習(xí)制導(dǎo)律訓(xùn)練。... (共9頁)