摘要: 近年来,知识图谱在恶意软件分析领域应用广泛,但是多数研究人员着重于构建恶意软件API知识图谱,利用知识图谱去检测恶意代码,而利用API知识图谱解释性较弱、专业性较高。针对上述问题,提出通过NER模型去抽取恶意软件名称、发现地等文本实体信息,以此构建恶意软件知识图谱,并通过知识图谱发现其多样性、演化路径、威胁方式与分类关联等。首先研究了恶意软件知识图谱的构建方法,完成数据预处理、模式层构建与数据层构建。其次对恶意软件结构化与半结构化数据进行实体标识与规范化,完成本体构建(实体、关联与附加属性),通过模式层指导数据层的方法,利于BERT-BiLSTM-CRF模型进行知识抽取。最后,利用Neo4j图数据库对知识图谱进行存储与可视化。利用病毒库数据对所建模型进行仿真验证,实验结果表明:此模型相比同类模型效果更好,性能指标更优异,对推进网络安全知识简易化和防御体系知识普及化具有重要意义。