J4 ›› 2010, Vol. 32 ›› Issue (10): 108-111.doi: 10.3969/j.issn.1007130X.2010.
梁碧珍1,陆月然1,耿立中2,秦亮曦3
LIANG Bizhen1,LU Yueran1,GENG Lizhong2,QIN Liangxi3
摘要:
通用的频繁模式挖掘算法通常产生庞大的频繁模式集,其中很多是用户不感兴趣的非目标模式。要排除这些非目标模式,用户必须进行“二次挖掘”。TFPgrowth虽然生成所有最大目标频繁模式,但要从中获得目标频繁模式,还需经过“二次挖掘”。若在挖掘的早期就对非目标频繁模式的产生加以限制,则有望提高算法的效率。本文在TFP growth 和SFPgrowth的基础上,提出一种目标频繁模式挖掘算法STFPgrowth,通过对TFP树的排序、根据树根结点的不同情形采用不同的建子树方法和目标频繁模式筛选方法等来提高算法的效率。STFPgrowth挖掘的结果是所有满足用户需求的目标频繁模式,不需“二次挖掘”。实验表明,STFPgrowth的效率高于TFPgrowth,也明显优于Apriori和Eclat。