计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (9): 1700-1710.
• 人工智能与数据挖掘 • 上一篇
王凤英1,2,宋子凯2,张岩1,杜利明1
WANG Fengying1,2,SONG Zikai2,ZHANG Yan1,DU Liming1
摘要: 在图像识别领域,测试用例冗余且标记标签仍需人工操作,对测试用例进行优化是解决测试代价高昂、测试效率低下的有效方法。基于此,提出一种基于进化算法的测试用例优化约简方法—ERIR,使用深度神经网络模型提取图像特征,代入HDBSCAN聚类算法分析原始测试集数据分布,在聚类结果的基础上以最小化测试子集与原始分布为目标设计进化算法。提出了基于最大均值差异与遗传算法融合的测试用例挑选算法—MMD-GA,能够在每个聚类簇中挑选出最具有代表性的原型构成测试子集。应用该算法在CNN结构和Transformer结构模型上进行了大量实验,结果显示挑选出的测试输入在提升时间效率的基础上保证了准确率接近原始测试集,对比整体测试集准确率平均误差在0.18%~2.32%。