• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2010, Vol. 32 ›› Issue (12): 122-124.doi: 10.3969/j.issn.1007130X.2010.

• 论文 • 上一篇    下一篇

语义网检索中的知识收集方法研究

王志华1,王鹏2   

  1. (1.郑州大学软件技术学院,河南 郑州 450002;2.中国电子科技集团公司第五十四研究所,河北 石家庄 050081)
  • 收稿日期:2010-03-16 修回日期:2010-07-02 出版日期:2010-12-25 发布日期:2010-12-25
  • 通讯作者: 王志华
  • 作者简介:王志华(1977),男,河南周口人,硕士,讲师,CCF会员(E200015348M),研究方向为信息检索和信息处理;王鹏,高级工程师,研究方向为网络技术和移动通信。
  • 基金资助:

    河南省教育厅自然科学基金资助项目(2009A520027)

Research on the Knowledge Collecting Methods  of Semantic Web Information Retrieval

WANG Zhihua1,WANG Peng2   

  1. (1.School of Software Technology,Zhengzhou University,Zhengzhou 450002;
    2.The 54 Research Institute of CETC,Shijiazhuang 050081,China)
  • Received:2010-03-16 Revised:2010-07-02 Online:2010-12-25 Published:2010-12-25

摘要:

针对传统信息检索中存在的缺乏知识表示和语义处理能力低的问题,本文提出了一个基于本体的语义网信息检索框架,该框架包括知识收集与储存层、人机交互层和知识处理层。对该框架中知识收集与储存层的关键技术及实现进行了介绍,主要包括领域本体库的构建、元数据的提取和知识库的构建等功能。其中,对元数据提取中的核心技术的实现,如领域本体库的解析、文件预处理、语义标注、知识抽取等作了详尽的介绍。

关键词: 本体, 语义网, 信息检索, 知识收集, 知识储存

Abstract:

Aiming at the problem of lacking knowledge representation and semantic processing capacity in traditional information retrieval, this paper proposes an ontologybased semantic web information retrieval framework, which includes the knowledge collection and storage layer, the humancomputer interaction layer and the knowledge processing layer. And the realization of the key technologies in the knowledge collection and storage layer is described, including the construction of the domain ontology library, metadata extraction,and the construction of knowledge base. Among them, the realization of the core technology in metadata extraction, such as the domain ontology library analysis, document preprocessing, semantic annotation, knowledge extraction, etc. is described in detail.

Key words: ontology;semantic web;information retrieval;knowledge collection;knowledge storage