摘要:
由于自然场景下文本检测不同于传统的物体检测,直接采用RPN算法对文本检测会有一定的限制,一方面,由于文本区域具有可变长度、背景复杂、多样化等因素,网络必须设计更大的感受野;另一方面,在RPN训练阶段,正样本的选择会出现大量的误检和漏检情况。对此提出一种基于垂直区域回归网络的算法,首先采用Hough算法对部分场景图像进行倾斜校正预处理;其次在训练阶段基于groundtruth框与候选框Anchor在垂直方向上IOU值(交集与并集之比)大于某个阈值的情况下选择正样本,且在垂直方向上对正样本进行分类回归;最后由多个相邻Anchor合并形成文本区域。实验结果表明,在ICDAR2011和ICDAR2013数据集上获得了良好的检测效果。
杨国亮,王志元,张雨,康乐乐,胡政伟. 基于垂直区域回归网络的自然场景文本检测[J]. 计算机工程与科学.
YANG Guoliang,WANG Zhiyuan,ZHANG Yu,KANG Lele,HU Zhengwei.
Scene text detection based on
perpendicular regional regression networks
[J]. Computer Engineering & Science.