TextLeak:基于決策的單詞級黑盒文本對抗攻擊方法
武漢大學學報(理學版)
頁數(shù): 10 2023-06-27
摘要: 現(xiàn)有的基于決策的黑盒文本對抗攻擊方案無法兼顧攻擊效果和攻擊效率,因此,提出了一種簡單而高效的基于決策的單詞級黑盒文本對抗攻擊方法 TextLeak。該方法的核心思想是通過多級搜索的方式尋找最小擾動以生成對抗樣本,即先通過粗粒度搜索確定目標區(qū)域,然后基于該目標區(qū)域通過細粒度搜索找到最優(yōu)解作為對抗樣本。以攻擊成功率、擾動率以及查詢次數(shù)為主要評估指標,在相同的數(shù)據(jù)集和模型下,選取了三... (共10頁)