计算机工程与科学 ›› 2026, Vol. 48 ›› Issue (4): 689-698.
李琼,漆昌仕,谢凯
LI Qiong,QI Changshi,XIE Kai
摘要: 针对自然场景中文本形态各异和背景复杂多变引起文本区域定位不准确的问题,提出了一种基于特征增强和自适应多尺度特征融合的文本检测算法。首先,改进残差网络,以减少语义信息的流失。其次,将坐标注意力嵌入到提取的特征中,以抑制冗余的背景信息和提高对文本区域的关注,从而增强对文本边界的定位能力。再次,结合自适应多尺度特征融合模块,将学习到的空间位置权重融入到不同尺度特征图中,以更充分地融合多尺度特征信息。最后,采用可微分二值化算法来生成文本检测结果。为了验证该算法的有效性,在公开数据集ICDAR2015、MSRA-TD500和Total-Text上进行实验,其综合指标F1值分别达到了88.1%,87.7%和86.3%。实验结果表明,该算法在文本检测上具有良好的鲁棒性和泛化性。