J4 ›› 2011, Vol. 33 ›› Issue (2): 92-96.doi: 10.3969/j.issn.1007130X.2011.
刘彩虹1,刘 强2,李爱平3
LIU Caihong1,LIU Qiang2,LI Aiping3
摘要:
针对负关联规则中非频繁项集的生成问题,将向量内积引入到该领域。通过对事务数据库的布尔化表示及对数据存储结构的合理分配,提出了一种新的非频繁项集快速生成算法。该算法首先将布尔化所得矩阵中的向量进行内积运算,通过逐层递增的思想,用两级支持度模型来约束非频繁项集与频繁项集的产生,使非频繁项集不仅可由频繁项集之间连接产生,而且可由频繁项集与非频繁项集、非频繁项集与非频繁项集之间连接产生。实验结果表明,该方法仅需扫描一次数据库,且具有动态剪枝、不保留中间候选项、不丢失非频繁项集和节省大量内存等优点,对数据库中负关联规则及各项集中低频率、强相关模式等相关算法的研究具有重要意义。