摘要:
高平均效用项集挖掘是当前研究的热点之一。针对高平均效用项集挖掘算法产生大量无意义的候选项集,而导致高内存消耗和运行时间长的问题,提出了dMHAUI算法。首先定义了集成矩阵Q,并提出了4种基于垂直数据库表示的紧凑平均效用上界及3种有效的修剪策略;将高平均效用项集挖掘所需的信息存储于IDUL结构树,利用改进的diffset技术快速计算项集的平均效用和上界;最后通过递归调用搜索函数得到高平均效用项集。与EHAUPM算法和MHAI算法进行仿真比较,结果表明,dMHAUI算法在运行时间、连接比较次数和可扩展性等方面都有较优的性能。
浦蓉, 邵剑飞, 胡常礼, 曲坤. 基于优化上界的高平均效用项集垂直挖掘算法[J]. 计算机工程与科学.
PU Rong, SHAO Jian-fei, HU Chang-li, QU Kun.
A vertical mining algorithm for high average-utility
itemsets based on optimal upper bound
[J]. Computer Engineering & Science.