计算机工程与科学 ›› 2026, Vol. 48 ›› Issue (1): 108-118.
李燕,樊新宇,陈芹
LI Yan,FAN Xinyu,CHEN Qin
摘要: 近年来,Transformer及其变种在图像识别领域已取得显著进展,但其在像素级分割任务中仍面临挑战,主要原因在于它们对局部偏差的处理不够显式和有效。对此,提出了一种名为DMANet的多路径多尺度注意力网络。该网络在编码阶段结合了卷积神经网络和Transformer的优势,能够同时捕获图像的精细局部信息和广泛的全局上下文信息,有效地提升特征提取能力。提出的交互式双分支结构加强了对特征的整合能力,提高网络模型在密集预测任务中的性能。在解码阶段实施跨层特征融合,增强DMANet对复杂目标的识别能力。通过在Potsdam,GID-15和L8 SPARCS数据集上进行测试,DMANet展示了其在复杂土地覆盖分割任务中的优异性能及广泛适用性。