當前位置:首頁 > 科技文檔 > 航空航天 > 正文

基于強化學習的無人機安全避障與圍捕制導(dǎo)

戰(zhàn)術(shù)導(dǎo)彈技術(shù) 頁數(shù): 13 2024-04-15
摘要: 針對無人機在受約束環(huán)境下面臨繞飛障礙物與跟蹤目標相互掣肘的問題,提出了一種基于強化學習的無人機安全避障與圍捕制導(dǎo)方法。根據(jù)極坐標原理設(shè)計環(huán)繞跟蹤控制器,驅(qū)使無人機在GPS拒止的情況下到達預(yù)設(shè)的圓形軌道。將環(huán)繞約束和障礙物約束轉(zhuǎn)化為馬爾可夫過程,以速度、徑向誤差、角速度誤差和碰撞函數(shù)為狀態(tài)空間,以控制器的補償量為動作空間,設(shè)計考慮跟蹤誤差和碰撞概率的獎勵函數(shù),利用深度確定性策略梯...

開通會員,享受整站包年服務(wù)立即開通 >