J4 ›› 2007, Vol. 29 ›› Issue (3): 52-53.
• 论文 • 上一篇 下一篇
曹恬 周丽 张国煊
出版日期:
发布日期:
Online:
Published:
摘要:
在文本检索中,由于用户需求的表达方式不充分,常会得到大量无关信息,给用户检索带来诸多不便。本文提出的基于词共现的文本相似度计算,可以让用户选择去掉或保留和某一文本相似的文本集,提高用户检索效率。
关键词: 文本相似度 中文信息处理 特征串 词共现
Abstract:
In text retrieval,insufficient expression of the client requirements usually leads to large amounts of inappropriate information,which brings inconven ience to user retrieval.The text similarity computing based on word co-occurrence presented in this paper enables users to delete or maintain text colle ctions similar to a certain text in order to improve retrieval efficiency.
Key words: text similarity;Chinese information processing;string of feature code;word co-occurrence
曹恬 周丽 张国煊. 一种基于词共现的文本相似度计算[J]. J4, 2007, 29(3): 52-53.
0 / / 推荐
导出引用管理器 EndNote|Ris|BibTeX
链接本文: http://joces.nudt.edu.cn/CN/
http://joces.nudt.edu.cn/CN/Y2007/V29/I3/52