環(huán)境感知的自適應(yīng)深度強(qiáng)化學(xué)習(xí)路由算法
計(jì)算機(jī)工程與設(shè)計(jì)
頁數(shù): 8 2023-11-16
摘要: 針對現(xiàn)有強(qiáng)化學(xué)習(xí)路由算法未能根據(jù)網(wǎng)絡(luò)負(fù)載變化較好權(quán)衡動作探索和利用的問題,提出一種基于環(huán)境感知的自適應(yīng)深度強(qiáng)化學(xué)習(xí)路由算法。依據(jù)智能體經(jīng)驗(yàn)回放時的平均誤差,動態(tài)調(diào)整ε-greedy策略以平衡探索和利用,引入啟發(fā)式規(guī)則限制動作探索以積累正向經(jīng)驗(yàn),結(jié)合優(yōu)先經(jīng)驗(yàn)回放機(jī)制加速模型收斂,提升智能體收斂前后的網(wǎng)絡(luò)吞吐量和數(shù)據(jù)交付率。仿真結(jié)果表明,部署了該算法的網(wǎng)絡(luò)的吞吐量和數(shù)據(jù)交付率均高于... (共8頁)