李相成, 汪永伟, 李强, 刘鹏程, 唐继鹏
LI Xiangcheng, WANG Yongwei, LI Qiang, LIU Pengcheng, TANG Jipeng
摘要: 传统知识图谱构建主要依赖于数据预处理、实体识别、关系抽取以及实体对齐等技术手段,此类方法通常伴随高昂的计算与时间开销。针对这一问题,提出一种结合大语言模型抽取、检索和纠错的知识图谱构建方法,以优化知识图谱的生成效率与准确性。通过特征词抽取与领域专家知识相结合的方式精准确定知识图谱的实体集合,构建实体语料检索器,筛选与目标实体最相关的上下文语句作为大语言模型的输入。设计提示模板和验证反馈机制,实现高质量三元组抽取,并完成国防科技领域知识图谱构建。实验结果表明,图谱构建精确率达到94.32%,验证了方法的精确性与合理性,为领域知识图谱的快速构建贡献了新的研究思路。