摘要:
装备作战仿真数据流中的事务性数据属性之间存在着各种各样的关联,数据流关联规则分析的目的是找出这些隐藏的关联关系。针对装备作战仿真数据流关联规则分析时数据流的大数据量、变长度的特点,就关联规则获取过程中如何得到频繁项集这一问题进行了研究。为了在有限空间内快速地从装备作战仿真数据流事务数据中获取频繁项集,针对经典的频繁项集算法Lossy Counting空间占用过大的缺陷,提出了一种基于下三角矩阵的Lossy Counting数据流关联规则频繁项集搜索算法FIBM。该算法通过下三角项集存储结构代替trie树结构,能在较少的空间占用下扫描数据流一次,在线实时分析装备作战仿真数据流,具有较强的实用性。数值实验证明,进行频繁项集搜索时,FIBM算法比Lossy Couting算法的执行效率有了明显的改善。