• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2011, Vol. 33 ›› Issue (6): 133-137.

• 论文 • 上一篇    下一篇

基于多元索引后继树的时间序列数据流挖掘

唐雁,吴绍春   

  1. (上海大学计算机工程与科学学院,上海 200072)
  • 收稿日期:2010-09-20 修回日期:2010-12-28 出版日期:2011-06-25 发布日期:2011-06-25
  • 作者简介:唐雁(1985),男,安徽巢湖人,硕士,研究方向为数据挖掘。吴绍春(1965),女,江西宜春人,博士,教授,博士生导师,研究方向为智能信息处理、数据挖掘、云存储及云计算。
  • 基金资助:

    上海市自然科学基金资助项目(08ZR1408400);上海市重点学科建设资助项目(J50103)

TimeSeries Data Stream Mining Based on the MultiIndex Successive Tree

TANG Yan,WU Shaochun   

  1. (School of Computer Engineering and Science,Shanghai University,Shanghai 200072,China)
  • Received:2010-09-20 Revised:2010-12-28 Online:2011-06-25 Published:2011-06-25

摘要:

本文以地电前兆观测数据流为研究对象,提出了一种新颖的基于多元索引后继树的时间序列数据流挖掘模型。该模型的主要特点是使用一种新颖的位置索引方法,通过一遍扫描创建描述一个序列的所有元素的绝对位置的多元索引后继树,使用索引匹配方法以模式增长的方式生成频繁模式。理论分析与实验表明,该方法简单、高效,具有很好的实用价值。同时,通过对大量持续的地电前兆观测数据流进行分析处理,挖掘隐藏在其中的反映地电参数正常变化规律及趋势的频繁模式,为发现地电前兆异常识别提供依据,从而辅助进行地震预报。

关键词: 多元索引后继树, 地电前兆, 时间序列数据流, 频繁模式

Abstract:

Studying the geoelectric precursory data streams, a new timeseries data stream data model based on the Sequence MultiIndex Successive Trees (SMIST) is put forward, which uses index to create SMIST through scanning the sequence by one time, and then uses index matching and pattern growth to generate frequent patterns. The results in both theory analyses and experiments show that this algorithm is so simple and direct, efficient, and has a practical value. In order to discover the hidden regularity of the geoelectric knowledge, a large number of geoelectric precursory data streams are  processed and analyzed. The newlyfound regular patterns and the trend of geoelectric parameters can provide a basis for detecting abnormal precursors, which can be used in earthquake prediction.

Key words: multiindex successive tree;geoelectric precursors;timeseries data stream;frequent pattern