基于雙估計(jì)強(qiáng)化學(xué)習(xí)結(jié)合前向預(yù)測(cè)控制的自動(dòng)駕駛運(yùn)動(dòng)控制研究
汽車工程
頁數(shù): 13 2024-04-25
摘要: 運(yùn)動(dòng)控制研究是實(shí)現(xiàn)自動(dòng)駕駛目標(biāo)的重要組成部分,針對(duì)傳統(tǒng)強(qiáng)化學(xué)習(xí)算法在求解中因單步?jīng)Q策局限而導(dǎo)致控制序列次優(yōu)的問題,提出了一種基于雙估計(jì)強(qiáng)化學(xué)習(xí)算法及前向預(yù)測(cè)控制方法結(jié)合的運(yùn)動(dòng)控制框架(DEQL-FPC)。在該框架中引入雙估計(jì)器以解決傳統(tǒng)強(qiáng)化學(xué)習(xí)方法動(dòng)作值過估計(jì)問題并提高訓(xùn)練優(yōu)化的速度,設(shè)計(jì)前向預(yù)測(cè)多步?jīng)Q策方法替代傳統(tǒng)強(qiáng)化學(xué)習(xí)的單步?jīng)Q策,以有效提高全局控制策略的性能。通過虛擬駕駛... (共13頁)