计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (06): 1121-1132.
徐春,孙恩威,汪晓洁
XU Chun,SUN Enwei,WANG Xiaojie
摘要: 涵盖DRG编码的真实电子病历数据过少无法支撑语言模型学习文本特征,并且现有的疾病编码模型针对复杂文本难以作出结果解释。为此,设计了一种融合医疗知识图谱和大语言模型的医疗问答系统模型GLM-2B-DRAGON。首先,利用ChatGLM-6b模型抽取并更新医疗实体及实体关系,得到涵盖DRG编码等医疗知识的知识图谱DRG-Net;其次, 使用跨模态编码器将QA问题对与知识图谱进行联合编码,实现相互补充的文本-图谱双向信息流以捕捉医疗文本特征;最后,通过知识图谱路径权重可视化分析,验证回答结果的可解释性。实验结果表明:在公开数据集CommenSenseQA和自建医疗数据集MedicalQA上,所构建的医疗问答系统模型优于现有的知识图谱增强语言模型。