基于文本摘要的無監(jiān)督關(guān)鍵詞抽取方法
計(jì)算機(jī)工程與設(shè)計(jì)
頁數(shù): 6 2024-09-16
摘要: 為克服基于嵌入的關(guān)鍵詞抽取方法在長文檔上性能下降的問題,提出一種基于文本摘要的方法(summarization-based document embedding rank, SDERank)。將句向量的加權(quán)和作為文檔嵌入,根據(jù)每個(gè)句子與文檔主題的語義相關(guān)度賦予權(quán)重。以往基于嵌入的方法選擇關(guān)鍵詞時(shí)忽略候選詞之間的關(guān)聯(lián),針對(duì)該問題,在SDERank的改進(jìn)版SDERank+中,Pag... (共6頁)