时态信息的语义抽取与排序方法研究及系统实现

计算机工程与科学 ›› 2014, Vol. 36 ›› Issue (08): 1609-1614.

时态信息的语义抽取与排序方法研究及系统实现

舒忠梅1,左亚尧2,张祖传2

(1.中山大学教育学院，广东广州 510275；2.广东工业大学计算机学院，广东广州 510006)

收稿日期:2013-05-28 修回日期:2013-09-29 出版日期:2014-08-25 发布日期:2014-08-25
基金资助:
国家自然科学基金资助项目(60970044)；广东省自然科学基金资助项目(S2011040004281)

Study on extraction and ranking of temporal #br# semantics and system implementation

SHU Zhongmei1,ZUO Yayao2,ZHANG Zuchuan2

(1.School of Education,Sun YatSen University,Guangzhou 510275；
2.Faculty of Computer,Guangdong University of Technology,Guangzhou 510006,China)

Received:2013-05-28 Revised:2013-09-29 Online:2014-08-25 Published:2014-08-25

摘要/Abstract

摘要：

针对通用搜索引擎缺乏对网页内容的时态表达式的准确抽取及语义查询支持，提出时态语义相关度算法（TSRR）。在通用搜索引擎基础上添加了时态信息抽取和时态信息排序功能，通过引入时态正则表达式规则，抽取查询关键词和网页文档中的时态点或时态区间等时态表达式，综合计算网页内容的文本相关度和时态语义相关度，从而得到网页的最终排序评分。实验表明，应用TSRR算法可以准确而有效地匹配与时态表达式相关的关键词查询。

关键词: 时态语义, 信息抽取, 排序, 搜索引擎

Abstract:

General search engine lacks of extraction and retrieval of temporal semantic from the text content of the Web pages. To address the temporal query problem, the Temporal Semantic Relevancy Ranking (TSRR) algorithm is proposed by integrating the temporal information extraction and ranking functions. Firstly, the rule of the temporal regular expression is introduced to extract the temporal points or temporal intervals from the query keywords and the text content of the web pages. Secondly, the scores of web pages are reevaluated and the returned results are ranked according to the text relevancy and the temporal semantic relevancy. Experiments show that the TSRR algorithm precisely and effectively matches the keywords queries related to the temporal expression.

Key words: temporal semantic, information extraction, ranking, search engine

舒忠梅, 左亚尧, 张祖传. 时态信息的语义抽取与排序方法研究及系统实现[J]. 计算机工程与科学, 2014, 36(08): 1609-1614.

SHU Zhongmei, ZUO Yayao, ZHANG Zuchuan. Study on extraction and ranking of temporal #br# semantics and system implementation [J]. Computer Engineering & Science, 2014, 36(08): 1609-1614.

编辑推荐

Metrics

阅读次数

全文

192

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	192

来源	本网站	其他网站

次数	129	63
比例	67%	33%

摘要

最新录用	在线预览	正式出版

0	0	93

	来源	本网站

	次数	93
	比例	100%

[1]	卓灵1，聂静1，肖静薇1，袁杨2，胡新1，陈柯1. 电力无线通信异构多网共存环境中的网络选择算法[J]. J4, 20160101, 38(01): 78-83.
[2]	曾涛, 王晶晶, 张涵, 刘一丁. 一种针对对话文本属性级情感信息抽取的词对关系建模方法[J]. 计算机工程与科学, 2024, 46(12): 2239-2251.
[3]	彭频, 王欣悦. 基于匮乏理论的应急物资调度模型构建及算法研究[J]. 计算机工程与科学, 2024, 46(11): 2063-2070.
[4]	王辉, 陈宇, 申自浩, 刘沛骞. 结合对比监督和排序树的轨迹数据差分隐私保护方案[J]. 计算机工程与科学, 2023, 45(10): 1797-1805.
[5]	刘通, 周宁宁. 基于Setwise排序的深度输入感知因子分解机[J]. 计算机工程与科学, 2023, 45(10): 1891-1900.
[6]	曹军航, 黄瑞章, 白瑞娜, 赵建辉, . DCsR：一种面向中文文本的集成式纠错框架[J]. 计算机工程与科学, 2023, 45(02): 370-380.
[7]	何海江. 融合语句复杂度的软件错误定位轻量级方法[J]. 计算机工程与科学, 2022, 44(12): 2187-2195.
[8]	张勇, 张曦, 万云博, 何先耀, 赵钟, 卢宇彤. 非结构有限体积CFD计算的网格重排序优化[J]. 计算机工程与科学, 2022, 44(10): 1721-1729.
[9]	陈华烨, 汪海涛, 姜瑛, 陈星. 基于排序学习的构件检索方法的研究[J]. 计算机工程与科学, 2021, 43(06): 1006-101.
[10]	刘亚波, 吴秋轩. 基于长短时记忆网络的电商大数据同一性标定[J]. 计算机工程与科学, 2021, 43(03): 407-415.
[11]	杨柳, 金培权. 面向DRAM和NVM异构混合内存架构的排序连接算法优化[J]. 计算机工程与科学, 2021, 43(02): 191-198.
[12]	肖满, 丁璐, 张怡. 带两个服务等级的3台机半在线算法[J]. 计算机工程与科学, 2020, 42(12): 2252-2258.
[13]	官蕊, 丁家满, 贾连印, 游进国, 姜瑛, . 基于强化学习的多样性文档排序算法[J]. 计算机工程与科学, 2020, 42(09): 1697-1703.
[14]	朱国晖，张茵，刘秀霞，孙天骜. 基于两次优先级排序的虚拟网络映射算法[J]. 计算机工程与科学, 2020, 42(05): 795-802.
[15]	李茜, 周华健, 杨浩运, 殷海兵. 一种基于listwise的在线学习书目排序检索算法[J]. 计算机工程与科学, 2020, 42(04): 749-754.