J4 ›› 2013, Vol. 35 ›› Issue (12): 173-177.
王小伟1, 郭红涛2, 王中锋3
WANG Xiaowei1,GUO Hongtao2,WANG Zhongfeng3
摘要:
针对当前基于人工免疫技术的垃圾邮件过滤算法中很少考虑干扰词攻击的情况,提出了一种抗干扰词攻击的免疫垃圾邮件过滤模型训练算法ANWAIS。该算法在基因库生成阶段,采用互信息差值作为评估函数,可以过滤掉垃圾邮件中的好词和正常邮件中的垃圾词,从而使基因库更能反映垃圾邮件的特征;同时,在抗体更新阶段,通过维护丢弃词表,可保证基因库的纯洁性。仿真实验表明,该算法能够比未考虑干扰词攻击的垃圾邮件过滤算法获得更好的抗体质量和更优的分类性能。