基于PPO算法的攻擊路徑發(fā)現(xiàn)與尋優(yōu)方法
信息網(wǎng)絡(luò)安全
頁數(shù): 11 2023-09-10
摘要: 基于策略網(wǎng)絡(luò)選擇滲透動作發(fā)現(xiàn)最優(yōu)攻擊路徑,是自動化滲透測試的一項(xiàng)關(guān)鍵技術(shù)。然而,現(xiàn)有方法在訓(xùn)練過程中存在無效動作過多、收斂速度慢等問題。為了解決這些問題,文章將PPO(Proximal Policy Optimization)算法用于解決攻擊路徑尋優(yōu)問題,并提出帶有滲透動作選擇模塊的改進(jìn)型PPO算法IPPOPAS(Improved PPO with Penetration Ac... (共11頁)