• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2010, Vol. 32 ›› Issue (10): 145-149.doi: 10.3969/j.issn.1007130X.2010.

• 论文 • 上一篇    下一篇

基于时间分布特征的博客突发事件检测

林达真,李绍滋,曹冬林   

  1. (1.厦门大学智能科学与技术系, 福建 厦门 361005;2.厦门大学福建省仿脑系统重点实验室,福建 厦门 361005)
  • 收稿日期:2010-03-11 修回日期:2010-06-17 出版日期:2010-09-29 发布日期:2010-09-25
  • 作者简介:林达真(1979-),女,福建莆田人,硕士,助理教授,研究方向为自然语言处理和信息检索;李绍滋,博士,教授,研究方向为人工智能及其应用、自然语言处理与多媒体信息检索、视频图像处理与运动目标识别、网络多媒体及CSCW技术、智能中医信息处理、变电站综合自动化系统软件开发等;曹冬林,博士,助理教授,研究方向为多媒体信息处理、自然语言处理和信息检索。
  • 基金资助:

    国家自然科学基金资助项目(60873179);深圳市科技计划基础研究资助项目(JC200903180630A);高等学校博士学科点专项科研基金资助项目(20090121110032)

Blog Emergent Event Detection Based on Temporal Distribution

LIN Dazhen,LI Shaozi,CAO Donglin   

  1. (1.Department of Cognitive Science,Xiamen University,Xiamen 361005;2.Fujian Key Laboratory of the BrainLike Intelligent Systems,Xiamen University,Xiamen 361005,China)
  • Received:2010-03-11 Revised:2010-06-17 Online:2010-09-29 Published:2010-09-25

摘要:

博客是目前网络舆论的重要载体之一,如何自动检测博客中的突发事件对于舆情分析与疏导具有重要的研究价值。针对目前突发事件检测中存在的时间信息有歧义的虚假突发事件问题,本文提出了一种基于时间分布特征的博客突发事件检测方法。该方法通过波峰检测和计算事件文档与背景语料文档之间、事件相关文档和不相关文档之间的时间分布差异来判断该事件在时间特征上是否具有突发性和关联性。实验结果表明,该方法可有效检测博客中的突发事件并可有效去除时间信息有歧义的虚假突发事件。

关键词: 时间分布特征, KL距离, 时间信息明确的事件, 时间信息有歧义的事件

Abstract:

Blog is one of the most important carriers for public opinions, and how to automatically detect emergent events of the blog has an important research value for analyzing and diverting public opinions. Because the false emergent events can be detected by ambiguous temporal information, this paper presents a blog emergent event detection method based on temporal distribution. This method can  determine whether there are emergency and relevance between events and temporal information through the peak detection and calculating the difference of temporal distribution between the event documents and the background corpus documents, and between eventrelevant documents and eventirrelevant documents. The experimental results show that the method can effectively detect emergent events in the blog, and can effectively remove the false emergent events which have ambiguous temporal information.

Key words: temporal distribution;KullbackLeibler divergence;temporally unambiguous event;temporally ambiguous event