计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (09): 1676-1683.
文凯1,2,3,许萌萌1,2,张许红1,2
WEN Kai1,2,3,XU Meng-meng1,2,ZHANG Xu-hong1,2
摘要: 可擦除项集挖掘是从大规模产品数据库中挖掘出低利润项集,以解决厂商财务危机的方法。传统挖掘方法只处理静态产品数据库,在提取可擦除项集时忽略项本身的权值。为解决现有可擦除项集挖掘算法考虑条件单一、效率低下的问题,提出一种有效的在增量数据集上挖掘加权可擦除项集的算法WELI。该算法综合考虑了数据不断积累和项具有不同重要性的因素,采用简洁的列表结构减少内存消耗,利用权重条件进行项集修剪,并结合包含索引和差集思想简化增益的计算过程,以实现高效的增量挖掘操作。实验表明:就运行时间和内存消耗而言,该算法在稠密数据集和稀疏数据集上均具有良好的实验效果,就可伸缩性而言,该算法也优于以往算法。