计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (7): 1285-1294.
纪磊,李希,徐大宏,刘宏,郭建平
JI Lei,LI Xi,XU Dahong,LIU Hong,GUO Jianping
摘要: 在基于分类的模式识别任务中,训练过程需要处理大量不同类别的样本。在实际应用中,这些样本具有显著的长尾分布特性,给模式识别任务带来了巨大挑战。长尾分布带来的挑战主要体现在2个方面:特征空间不平衡以及难以关注长尾区域的困难样本。针对这2个方面,提出了一种类别感知的半监督知识蒸馏模型,该模型包含了2个核心组成部分:平衡的半监督知识蒸馏和平衡的类别感知学习。前者利用半监督知识蒸馏,使特征空间更加平衡;后者融合类别感知的扩张损失函数与困难样本延迟学习激活式损失函数,提升了分类器的性能,并增强对困难样本的关注度。所有实验在5个基线数据集上进行,包括CIFAR10-LT,CIFAR-100-LT,ImageNet-LT,iNaturalist2018和Places-LT,其中在ImageNet-LT上,所提模型达到了57.5%的Top-1准确率,优于其他的模型。