计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (06): 1106-1113.
曾垂振1,2,崔良中1,马文卓2
ZENG Chuizhen1,2,CUI Liangzhong1,MA Wenzhuo2
摘要: 在雷达维修领域的知识图谱构建中,由于其专业性强、标注数据集稀缺,命名实体识别模型训练存在较大困难,传统模型训练效果达不到应用要求。在BiGRU-CRF模型的基础上引入了预训练模型,提出了ERNIE-BiGRU-CRF模型。首先,以某型号雷达为例,收集维修数据,并进行数据的预处理,同时使用doccano平台对数据进行人工标注,获得雷达维修领域命名实体识别数据1 100余条。然后,通过ERNIE预训练模型获取雷达维修训练数据的动态词向量,BiGRU获取双向语义信息。最后,通过CRF约束得到最合理的序列标注结果。实验结果表明,在少量训练语料的条件下,所提模型具有较强的识别效果,相比于BiGRU-CRF、BiLSTM-CRF模型,其F1值有一定提升,有效解决了雷达维修领域训练语料缺乏、训练效果不佳的问题,在雷达维修领域知识图谱的自动化构建中具有一定的实用价值。