计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (4): 718-727.
朱西平,高昂,肖丽娟
ZHU Xiping,GAO Ang,XIAO Lijuan
摘要: 针对农作物病虫害数据领域性强、数据类型不平衡以及实体嵌套导致通用模型识别精度不高等问题,提出了一种融合双词典的农作物病虫害命名实体识别模型。首先,将原始字符数据和词汇数据分别引入LE-RoBERTa模块和GC-SoftLexicon模块,经增强处理后获得2个独立的字符向量。然后,将融合后的字符向量输入到BiLSTM编码层和CRF解码层获得最优实体序列输出。实验结果表明,模型在构建的农作物病虫害实体数据集上的F1值达到了95.56%,能够有效识别农作物病虫害命名实体。