计算机工程与科学 ›› 2014, Vol. 36 ›› Issue (08): 1609-1614.
舒忠梅1,左亚尧2,张祖传2
SHU Zhongmei1,ZUO Yayao2,ZHANG Zuchuan2
摘要:
针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持,提出时态语义相关度算法(TSRR)。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能,通过引入时态正则表达式规则,抽取查询关键词和网页文档中的时态点或时态区间等时态表达式,综合计算网页内容的文本相关度和时态语义相关度,从而得到网页的最终排序评分。实验表明,应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。