基于图神经网络的源代码漏洞检测研究综述

计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (10): 1775-1792.

• 计算机网络与信息安全 • 上一篇下一篇

基于图神经网络的源代码漏洞检测研究综述

陈子雄1,陈旭1,景永俊1，宋吉飞2

(1.北方民族大学计算机科学与工程学院，宁夏银川 750021；2.国家（中卫）新型互联网交换中心，宁夏中卫 755000)

收稿日期:2024-01-03 修回日期:2024-03-06 接受日期:2024-10-25 出版日期:2024-10-25 发布日期:2024-10-29
基金资助:
宁夏回族自治区重点研发项目(2023BDE02017)；北方民族大学中央高校基本科研业务费专项资金(2022PT_S04)

A survey of source code vulnerability detection research based on graph neural networks

CHEN Zi-xiong1,CHEN Xu1,JING Yong-jun1,SONG Ji-fei2

(1.School of Computer Science and Engineering,North Minzu University,Yinchuan 750021；
2.National (Zhongwei) New-type Internet Exchange Point,Zhongwei 755000,China)

Received:2024-01-03 Revised:2024-03-06 Accepted:2024-10-25 Online:2024-10-25 Published:2024-10-29

摘要/Abstract

摘要： 随着开源软件在各个领域的广泛应用，源代码漏洞已经导致了一系列严重的安全问题。鉴于这些漏洞对计算机系统的潜在威胁，检测软件中的源代码漏洞以防止网络攻击已成为一个重要的研究领域。为了实现自动化检测并降低人力成本，研究人员提出了许多基于传统深度学习的方法。然而，这些方法大多将源代码视为自然语言序列而没有充分考虑代码的结构信息，因此其检测效果受到了限制。近年来，基于代码图表示和图神经网络的源代码漏洞检测方法应运而生。全面综述了图神经网络在源代码漏洞检测中的应用，并提出了一个基于图神经网络的源代码漏洞检测通用框架。从文件级别、函数级别和切片级别3种漏洞检测粒度出发，系统地总结和阐述了现有的方法和相关数据集。最后，讨论了该领域所面临的挑战，并对未来可能的研究重点进行了展望。

关键词: 图神经网络, 漏洞检测, 数据集, 数据流图, 控制流图

Abstract: With the widespread application of open-source software across various domains, source code vulnerabilities have led to a series of serious security issues. Given the potential threats these vulnerabilities pose to computer systems, detecting source code vulnerabilities in software to prevent network attacks is a crucial research area. To achieve automated detection and reduce human labor costs, researchers have proposed numerous traditional deep learning-based methods. However, these methods mostly treat source code as natural language sequences and do not adequately consider the structural information of the code, limiting their detection effectiveness. In recent years, methods for detecting source code vulnerabilities based on code graph representation and graph neural networks have emerged. This paper provides a comprehensive review of the application of graph neural networks in source code vulnerability detection and proposes a general framework for source code vulnerability detection based on graph neural networks. Starting from three levels of vulnerability detection granularity: file-level, function-level, and slice-level, the existing methods and relevant datasets are systematically summarized and elucidated. Finally, the challenges faced by this field are discussed, and potential research directions for the future are outlined.

Key words: graph neural networks, vulnerability detection, datasets, data flow graph, control flow graph

陈子雄, 陈旭, 景永俊, 宋吉飞. 基于图神经网络的源代码漏洞检测研究综述[J]. 计算机工程与科学, 2024, 46(10): 1775-1792.

CHEN Zi-xiong, CHEN Xu, JING Yong-jun, SONG Ji-fei. A survey of source code vulnerability detection research based on graph neural networks[J]. Computer Engineering & Science, 2024, 46(10): 1775-1792.

编辑推荐

Metrics

阅读次数

全文

562

HTML			PDF

最新录用	在线预览	正式出版	最新录用	在线预览	正式出版
0	0	0	0	0	562

来源	本网站	其他网站

次数	368	194
比例	65%	35%

摘要

402

最新录用	在线预览	正式出版

0	0	402

	来源	本网站

	次数	402
	比例	100%

[1]	罗婧, 叶志晟, 杨泽华, 傅天豪, 魏雄, 汪小林, 罗英伟, . 研发类GPU集群任务数据集的构建及分析[J]. 计算机工程与科学, 2024, 46(12): 2128-2137.
[2]	黄智慧, 肖祥立, 张玉书, 薛明富. 基于隐形后门水印的开源数据集版权保护[J]. 计算机工程与科学, 2024, 46(06): 1013-1021.
[3]	孙庆骁, 刘轶, 杨海龙, 王一晴, 贾婕, 栾钟治, 钱德沛. GNNSched：面向GPU的图神经网络推理任务调度框架[J]. 计算机工程与科学, 2024, 46(01): 1-11.
[4]	牛为华, 翟瑞冰. 基于改进3D ResNet的视频人体行为识别方法研究[J]. 计算机工程与科学, 2023, 45(10): 1814-1821.
[5]	葛旭冉, 刘洋, 陈志广, 肖侬. 基于MPI的并行大数据集生成器[J]. 计算机工程与科学, 2022, 44(07): 1152-1161.
[6]	李一, 李阳, 苗壮, 王家宝, 张睿. 一种扩展VIFB的红外与可见光图像融合基准[J]. 计算机工程与科学, 2022, 44(06): 1072-1082.
[7]	郭文强, 寇馨, 李梦然, 侯勇严, 肖秦琨. 小数据集情况下基于变权重融合的BN参数学习算法[J]. 计算机工程与科学, 2022, 44(05): 916-923.
[8]	陆卫忠, 宋正伟, 吴宏杰, 曹燕, 丁漪杰, , 张郁. 基于深度学习的人体行为检测方法研究综述[J]. 计算机工程与科学, 2021, 43(12): 2206-2215.
[9]	张策1，伊文敏2，白睿1，盛晟1，徐早辉1，高天翼1，王瞰宇1，苏嘉尧1. SRGM下失效数据集效用与验证分析[J]. 计算机工程与科学, 2020, 42(06): 1012-1020.
[10]	覃福钿,李晶. 大数据对高校教学研的影响与探索[J]. 计算机工程与科学, 2019, 41(增刊S1): 238-241.
[11]	李克文1，林亚林1，杨耀忠2. 一种改进的基于欧氏距离的SDRSMOTE算法[J]. 计算机工程与科学, 2019, 41(11): 2063-.
[12]	杨冬菊1,2,徐晨阳1,2. 大数据环境下基于元模型控制的数据质量保障技术研究[J]. 计算机工程与科学, 2019, 41(02): 197-206.
[13]	张圣,伍星,邹东升. 垃圾商品评论检测研究综述[J]. 计算机工程与科学, 2018, 40(11): 2060-2066.
[14]	赵双,陈曙晖. 基于机器学习的流量识别技术综述与展望[J]. 计算机工程与科学, 2018, 40(10): 1746-1756.
[15]	吴帅，赵方. 基于随机森林的老年人居住偏好预测研究[J]. 计算机工程与科学, 2018, 40(05): 924-930.

基于图神经网络的源代码漏洞检测研究综述

A survey of source code vulnerability detection research based on graph neural networks

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价