计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (02): 253-263.
杨晓强,黄加诚
YANG Xiao-qiang,HUANG Jia-cheng
摘要: 为了解决细粒度分类类间差异小、类内差异大的分类难点,在Swin Transformer基础上,提出了一种改进的端到端的细粒度分类模型(TBformer)。针对复杂背景对网络识别产生的干扰,使用ECA、Resnet50、SCDA相结合的动态定位模块(DLModule)捕获关键物体,并设计了基于DLModule的三分支特征提取模块,提高对目标判别性特征的提取能力。为了充分挖掘三分支特征蕴含的丰富细粒度信息,提出了基于ECA的特征融合方法,增强特征的全面性、精确性,提高网络对细粒度分类的鲁棒性。实验结果表明:相比基础方法,TBformer在CUB-200-2011上的准确率提升了3.19%,在Stanford Dogs上的准确率提升了3.47%,在NABirds上的准确率提升了1.09%。