摘要:
文本自动摘要技术在网页搜索和网页内容推荐等多个领域都有着非常广阔的应用前景。经典的文本摘要算法采用统计学的方法来提取文章关键字,进而提取主题句。这种方法在一定程度上忽略了文本的语义和语法信息。近年来,分布式词向量嵌入技术已经应用到文本检索当中,基于该技术提出了一种词向量化的自动文本摘要方法,该方法主要分为4个步骤:词向量生成、基于词向量的段向量生成、关键词提取和主题句抽取,最终实现文本段落的自动摘要。实验结果表明,改进的文本自动摘要方法能够有效提取主题句。
申强强,熊泽宇,熊岳山. 一种新的基于段向量的文本自动摘要方法[J]. 计算机工程与科学.
SHEN Qiangqiang,XIONG Zeyu,XIONG Yueshan.
A new automatic summarization method
based on paragraph vector
[J]. Computer Engineering & Science.