Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2025年第7期目录
    2025, 47(7): 0. doi:
    摘要 ( 55 )   PDF (250KB) ( 38 )     
    高性能计算
    Rubyphi:面向gem5的Cache一致性协议自动化模型检验
    徐学政, 方健, 梁少杰, 王璐, 黄安文, 隋京高, 李琼
    2025, 47(7): 1141-1151. doi:
    摘要 ( 132 )   PDF (1683KB) ( 71 )     
    Cache一致性协议是多核系统数据一致性的保障,也直接影响内存子系统的性能,一直是微处理器设计和验证的重点。Cache一致性协议的设计和优化通常需借助gem5等软件模拟器快速实现。同时,由于协议设计中存在的错误在仿真测试中具有难触发、难定位和难修复的特点,需借助Murphi等模型检验工具进行形式化验证。然而,基于模拟器的协议设计优化和基于模型检验的协议验证在编程语言和抽象层次上存在巨大差异,设计者需要分别进行模拟器实现和模型检验建模,这不仅增加了时间成本,也为二者的等价性带来了隐患。设计并实现了面向gem5模拟器的Cache一致性协议自动化模型检验方法Rubyphi,通过提取gem5中实现的协议,自动完成基于Murphi的模型检验建模,进而对协议进行形式化验证。实验表明,Rubyphi能够有效地完成gem5中一致性协议的建模和验证,并成功发现了2个gem5现有协议中存在的错误,相关问题和解决方案已得到社区确认。

    面向多值逻辑计算的基于CNFET的三元逻辑单元库设计
    王蕾1, 王洪2, 王耀3, 朱晓章2, 杨智杰1, 唐玉华3
    2025, 47(7): 1152-1161. doi:
    摘要 ( 105 )   PDF (1983KB) ( 151 )     
    相比二值逻辑,三元逻辑具有更多的逻辑状态,因而基于三元逻辑的电路具有面积小、利用率高、传输效率高和安全性强等优点。利用常见的碳纳米管场效应晶体管(CNFET)搭建了基本三元逻辑门电路,设计了一个逻辑完备的三元逻辑库,提出了减小CNFET的物理信道长度 Lch和源/漏极长度 Ls/Ld的方法来降低转换延迟时间,还以构建的三元逻辑库为基础,设计搭建了一个一位乘法器电路,通过HSPICE仿真,验证了各电路的性能以及降低转换延迟时间的方法的有效性。与之前的三元1-bit乘法器相比,所设计的电路平均转换延迟时间降低了47 ps。在实际电路应用中,所构建的三元逻辑单元库可以用于更高阶电路的电路综合和物理设计,提出的降低三元电路转换延迟时间的方法为未来以高性能微处理器和人工智能芯片为代表的超大规模集成电路提供了思路。

    一种面向112 Gbit/s SerDes接收机的前瞻滑动判决反馈均衡器
    杨周灏, 吕方旭, 徐炜遐, 李世杰, 许超龙, 胡小月
    2025, 47(7): 1162-1169. doi:
    摘要 ( 89 )   PDF (2516KB) ( 156 )     
    随着信息技术的不断发展,有线传输速率经历了从112 Gbit/s到224 Gbit/s的飞跃。数据速率的提升也对SerDes接收端均衡器的复杂度提出了更高的要求。针对复杂的均衡器结构带来了时序紧张等一系列问题,提出了一种基于前瞻结构的滑动块判决反馈均衡器。该设计采用了6抽头前馈均衡器和9抽头判决反馈均衡器对数字信号进行处理。通过MATLAB仿真建模对功能进行验证,结果表明数据传输速率为112 Gbit/s,在8 dB~35 dB的不同信道衰减下,这种采用最小均方算法自适应均衡的数字信号处理设计能有效降低数据误码率,其误码性能均能满足KP4前向纠错码的甄别要求,且相较于传统的均衡器结构有更佳的误码性能表现。

    基于Tensor Cores的新型GPU架构的高性能Cholesky分解
    石璐, 邹高远, 伍思琦, 张少帅
    2025, 47(7): 1170-1180. doi:
    摘要 ( 142 )   PDF (1240KB) ( 84 )     
    稠密矩阵乘法(GEMMs)在Tensor Cores上可以实现高度优化。然而,现有的Cholesky分解的实现由于其有限的并行性无法达到Tensor Cores大部分的峰值性能。研究使用一种递归Cholesky分解的算法,通过将对角线块的递归细分,将原本的对称矩阵秩K更新(SYRK)和三角方程组求解(TRSM)操作转化为大量的通用矩阵乘法(GEMMs),从而更充分地发挥 Tensor Cores 的峰值性能。实验结果表明,提出的递归Cholesky分解算法在FP32和FP16上分别比MAGMA/cuSOLVER算法提高了1.72倍和1.62倍。

    计算机网络与信息安全
    无线传感器网络优质虚拟骨干的构建算法
    黄金河1, 2, 梁家荣1, 2, 黎昌珍3
    2025, 47(7): 1181-1192. doi:
    摘要 ( 72 )   PDF (1493KB) ( 69 )     
    无线传感器网络的虚拟骨干由承担网络的计算和路由任务的节点组成,其能耗效率是整个网络寿命的关键。无线传感器网络的长寿命容错虚拟骨干构建问题,可以抽象成加权无向图中的加权连通坡面划分问题,这是一个NP-Hard问题。提出一种考虑寿命的容错虚拟骨干构建算法,它包括2个子算法:子算法1采用贪婪策略选取能量较大的节点来构建多个不相交的连通控制集,基于睡眠唤醒机制将虚拟骨干节点电池的使用效率最大化;子算法2采用伪不相交连通控制集技术选取寿命较长的节点更新子算法1获得的虚拟骨干,构建新的长寿命容错虚拟骨干。仿真结果表明,在虚拟骨干的寿命和连通控制集的数量方面,所提算法的性能优于其他对比算法。

    基于多视图图注意力机制的软件定义光传输网络路由优化算法
    陈俊彦1, 李欣梅1, 朱昌洪2, 肖微3
    2025, 47(7): 1193-1204. doi:
    摘要 ( 150 )   PDF (2519KB) ( 170 )     
    针对传统深度强化学习在软件定义光传输网络路由优化应用中收敛性能差、泛化能力弱等问题,提出了一种基于多视图注意力机制的深度Q网络MGATDQN算法来优化软件定义光传输网络的路由决策。首先,设计了基于深度强化学习的路由决策模型,为光网络每个输入的源目的地流量需求寻找最佳路由策略。其次,考虑到光网络中节点的稀疏连接特点,使用多视图注意力网络作为深度Q网络的网络模型,通过计算邻边的注意力权重,使强化学习智能体有意识地聚合重要的网络信息,提高模型的泛化能力。同时,结合多视图来提升图注意力网络模型的收敛速度和收敛稳定性。最后,基于Gym设计仿真路由实验,并在不同的网络拓扑中评估算法的负载均衡能力和泛化能力。实验结果表明,MGATDQN算法在软件定义光传输网络的路由优化中具有较好的收敛性能和负载均衡能力,并且能够泛化新的网络结构,即使在网络某些节点出现故障时仍然能保持较好的决策能力。

    车边云协同的任务卸载调度和资源分配机制研究
    赵鹏, 邝祝芳
    2025, 47(7): 1205-1214. doi:
    摘要 ( 119 )   PDF (1385KB) ( 69 )     
    在车辆边缘计算的基础上,车边云协同能够进一步实现车辆与云端之间的协同,为车辆提供更多的计算和存储资源,以实现更智能、安全和可靠的驾驶体验。在传统研究中,车辆用户的计算任务是独立、不可再分的,各任务之间没有依赖关系。而在当下的应用场景中,随着人工智能的发展,不少应用程序会由多个存在依赖关系的组件构成,对此类依赖任务计算需求的考虑是不可或缺的。因此,聚焦车边云协同的多车辆多任务的边缘计算场景,构建一个考虑车边云协同、任务依赖关系和任务优先级的任务卸载决策、任务调度决策和资源分配问题的模型,并以最小化系统能耗为目标,提出了一种基于优先级算法和双深度Q网络的联合优化算法JPDDO。首先,对多组依赖任务进行优先级排序;然后,对得到的任务队列通过双深度Q网络算法求解卸载决策、调度决策、计算频率和传输功率。仿真实验验证了该算法的有效性,并且在不同的网络环境和参数设置下都能取得比较低的能耗。


    基于生成对抗网络的恶意代码变体家族溯源方法
    李莉, 张晴, 孔悠然, 苏仁嘉, 赵鑫
    2025, 47(7): 1215-1225. doi:
    摘要 ( 145 )   PDF (3333KB) ( 127 )     
    针对恶意代码变更速度快、溯源困难的问题,提出了一种通过创建恶意代码变体数据集,增强模型家族溯源能力的分类方法。该方法将恶意代码可视化,使用改进的生成对抗网络对恶意代码进行分类,使用Ghost模块与Dropout层调节生成器与判别器的对抗能力,引入高效通道注意力机制帮助模型聚焦重要特征,使用卷积与上采样结合的结构避免生成图像棋盘格化。测试阶段使用恶意代码变体数据集与不同类别特征数据集,验证模型恶意代码变体的家族溯源能力。使用所提方法构建的模型具有更强的特征提取能力、更少的资源消耗以及更快的推理速度,满足当今恶意代码变更迅速对恶意代码分类模型提出的强抗混淆能力、高泛化能力的要求,且便于部署在移动、嵌入式等设备中,提供对恶意代码的实时检测。
    软件工程
    BotChecker:一种基于Transformer的GitHub Bot检测模型#br# #br#
    张锦1, 3, 吴星瑾1, 张洋2, 许舜宇1
    2025, 47(7): 1226-1236. doi:
    摘要 ( 109 )   PDF (1997KB) ( 77 )     
    在开源软件中,准确识别软件开发辅助机器人(Bot)和人类贡献者对于理解和评估贡献活动至关重要。针对深度学习模型在自然语言处理和软件工程相关领域中的优异表现,提出了一种基于Transformer架构的Bot自动检测模型BotChecker。通过在Transformer中引入增强的全连接层和专用的二分类器结构,该模型能有效学习Bot和人类账户的评论文本数据,进而对Bot进行检测。实验验证了BotChecker在Bot检测任务中的有效性,准确率、召回率和F1值分别达到0.941,0.894和0.938。此外,还分析了模型超参数、零样本学习对于BotChecker性能的影响。所提出的模型可为开源社区Bot账户识别提供技术支撑,并为后续研究提供方法基准。

    物面网格构造方法对高速流动气动力/热数值模拟的影响分析
    张建伟, 文豪, 赵杨
    2025, 47(7): 1237-1243. doi:
    摘要 ( 63 )   PDF (3037KB) ( 74 )     
    高速流场十分复杂,对其进行细致刻画是困难的,网格布局优化有助于高速流场刻画,进而提高气动力/热数值模拟的准确度。选用钝头体模型作为研究对象,采用不同头部物面网格划分方法构造高速流动物面网格,对比分析不同网格的气动力/热数值模拟精度,给出不同物面网格构造方法对气动力/热数值模拟的影响,并经过多算例验证,给出优选的适用于高速流场高精度计算的物面网格构造方法。对比结果表明该方法可为高速流动气动力/热高精度数值模拟提供支撑。

    模糊测试用例生成技术研究综述
    刘慧1, 2, 侯同定1, 2, 赵博3, 4, 郭涵彬1, 2
    2025, 47(7): 1244-1261. doi:
    摘要 ( 187 )   PDF (2836KB) ( 448 )     
    模糊测试是主流的软件漏洞挖掘技术之一,在不同领域都有着广泛的应用。近年来,模糊测试用例生成技术的研究已经取得了长足的进展。首先,回顾模糊测试用例生成技术的发展历程,对相关研究工作进行分类归纳及综合对比。其次,基于模糊测试用例生成技术的深入研究,形成基于生成方式和基于变异方式的模糊测试用例生成架构。再次,对模糊测试用例生成技术进行分类,深入剖析模糊器从程序结构和语义中提取特征并结合反馈信息生成测试用例的过程。然后,从浏览器、网络协议、编译器和操作系统4个方面,对现有模糊测试用例生成技术在生成测试用例过程中面临的任务及挑战予以分类阐述,并进行系统总结和对比研究。最后,从不同角度探讨现有模糊测试用例生成技术中存在的局限性及解决方案,并展望未来具有潜力的研究方向。

    图形与图像
    用于全色锐化的金字塔特征解耦提取融合网络
    林毅1, 2, 3, 宋慧慧1, 2, 3
    2025, 47(7): 1262-1273. doi:
    摘要 ( 96 )   PDF (3536KB) ( 127 )     
    全色锐化的目的在于将同一个遥感卫星获取的低分辨率多光谱图像LRMS及其对应的高分辨全色图像PAN进行融合,以生成高分辨率的多光谱图像HRMS。现有网络过于依赖基于深度学习的特征提取和融合能力而无法聚焦模态优势特征,忽略了多模态各自具有的特定表征,导致最终得到过多冗余特征。为了提取的特征可以独立表达期望表征、减少冗余信息从而更好融合2种模态的互补信息,提出了一种全新的用于全色锐化的金字塔特征解耦提取融合网络,以有效地增强图像的光谱和纹理细节的表示能力。首先,网络借鉴分治思想,将光谱和纹理信息进行解耦提取,设计不同注意力机制分别提取多模态的独特细节信息。其次,通过跨模态特征融合模块加强不同模态特征之间的交互,促进网络获得多模态的互补信息且去除冗余信息。最后,网络基于金字塔结构在多个空间尺度上进行了特征提取融合操作,获得了出色效果。在GaoFen-2和WorldView-3卫星数据集上进行了大量实验,结果表明提出的网络相较对比网络取得了显著的改进,对全色锐化任务有很大的帮助。

    基于改进LESRCNN超分模型的高精度接触角测量方法研究
    张毛迪1, 王军1, 2, 孙晓红1
    2025, 47(7): 1274-1284. doi:
    摘要 ( 138 )   PDF (2405KB) ( 153 )     
    针对当前接触角测量准确性与稳定性不高的问题,提出一种基于改进轻量级增强超分辨率网络LESRCNN接触角测量方法。改进网络采用由ResNet50借鉴Swin Transformer结构改进而来的ConvNeXt Block构成的特征提取器取代原网络的信息提取部分来提高超分性能,同时引入一个有效的增强空间注意力ESA增强其收集图像细粒度信息的能力,并使用高斯误差线性单元GELU取代修正线性单元ReLU作为激活函数提高网络的收敛速度。为提高拟合结果的鲁棒性,以Huber函数为权函数,用基于迭代重加权最小二乘IRLS的椭圆拟合法从液滴左右两侧同时进行轮廓拟合求取接触角大小。实验证明,在比例因子为3时,改进后的网络模型与原网络相比,对同一液滴数据集训练的峰值信噪比PSNR与结构相似性指数SSIM值分别提高了0.8 dB与0.002 6;对90°以下接触角标准片测量结果的准确性与稳定性分别提升了34.3%与7.4%,对90°及以上标准片测量结果的准确性与稳定性则分别提升了18.2%与29.4%。

    一种类别感知的半监督知识蒸馏长尾分类模型
    纪磊, 李希, 徐大宏, 刘宏, 郭建平
    2025, 47(7): 1285-1294. doi:
    摘要 ( 117 )   PDF (1480KB) ( 50 )     
    在基于分类的模式识别任务中,训练过程需要处理大量不同类别的样本。在实际应用中,这些样本具有显著的长尾分布特性,给模式识别任务带来了巨大挑战。长尾分布带来的挑战主要体现在2个方面:特征空间不平衡以及难以关注长尾区域的困难样本。针对这2个方面,提出了一种类别感知的半监督知识蒸馏模型,该模型包含了2个核心组成部分:平衡的半监督知识蒸馏和平衡的类别感知学习。前者利用半监督知识蒸馏,使特征空间更加平衡;后者融合类别感知的扩张损失函数与困难样本延迟学习激活式损失函数,提升了分类器的性能,并增强对困难样本的关注度。所有实验在5个基线数据集上进行,包括CIFAR10-LT,CIFAR-100-LT,ImageNet-LT,iNaturalist2018和Places-LT,其中在ImageNet-LT上,所提模型达到了57.5%的Top-1准确率,优于其他的模型。

    人工智能与数据挖掘
    一种基于代理模型的数字资源集成方法
    王斌锋, 蔡利兵, 孔龙星, 黄少华, 韩文彬
    2025, 47(7): 1294-1302. doi:
    摘要 ( 81 )   PDF (1705KB) ( 94 )     
    数字化技术正在持续赋能各个行业领域,并取得了巨大的成果效益。开发和应用数字资源是数字化赋能的关键环节,但是围绕特定目标构建仿真系统所需的多种数字资源形态不尽相同,这导致了仿真系统开发复杂度的增加和运行效率的降低。通过分析数字资源基础概念,梳理了其相关的应用需求,进而提出一种基于代理模型的数字资源集成方法,该方法在屏蔽系统内各个数字模型差异性方面具有显著优势,同时从2方面对该方法展开了具体阐述:1)基于代理模型的集成框架,该框架既支持基于代理模型的数字资源集成,也支持未采用代理模型方式数字资源的集成;2)数字资源代理模型的设计,可满足代理模型对外和对内的数据传输需求,以及不同外部接口间的数据转化,最后通过卫星轨迹实时态势显示实例系统验证了基于代理模型方式进行数字资源集成的有效性和灵活性。

    基于PKUSEG-Text-GCN的肿瘤疾病预测模型
    高志玲1, 赵新宇1, 2
    2025, 47(7): 1303-1311. doi:
    摘要 ( 96 )   PDF (1763KB) ( 127 )     
    当前疾病预测模型仅关注病历文本的局部信息以及上下文信息,缺乏对全局信息的考虑,由此导致预测结果准确率不高。利用图神经网络关注全局信息的特点,提出将图卷积神经网络(GCN)用于中文电子病历的肿瘤疾病预测。首先,利用医学领域分词工具包PKUSEG对中文电子病历进行分词;其次,通过病历与词的共现关系和病历文本中词与词之间的关系,建立文本图;最后,基于该医学文本图利用图卷积神经网络(Text-GCN)对文本图的特征进行学习,将学习到的模型用于肿瘤疾病预测。实验结果显示,所提模型相比多个模型中的最优模型准确率提升了6%。同时,当数据较少的时候准确率并不会明显下降,表明该模型在电子病历较少的情况下仍具有很好的鲁棒性。


    多策略改进的蝴蝶优化算法
    张琪1, 顾腾达1, 任宇辰1, 季津琪2, 陈海涛1
    2025, 47(7): 1312-1320. doi:
    摘要 ( 109 )   PDF (1630KB) ( 62 )     
    摘要:针对蝴蝶优化算法存在搜索精度差、全局搜索和局部开发能力不平衡、容易陷入局部最优等问题,为提升蝴蝶优化算法的鲁棒性和寻优能力,提出一种多策略改进的蝴蝶优化算法。该算法选用随机一致性初始化蝴蝶种群,使蝴蝶个体在搜索空间中的各个维度分布更加均匀,对解空间的覆盖率更广;引入动态惯性权重策略,平衡全局搜索与局部搜索;引入精英差分变异策略,提高算法的全局搜索能力。将改进后的算法与7种优化算法在17个基准函数上进行实验对比,结果表明,改进后的算法相比于原始蝴蝶优化算法,具有更好的收敛性和求解精度,且全局寻优能力和鲁棒性得到了提升。



    基于双通道图卷积网络的多模态方面级情感分析
    张凤1, 邵玉斌1, 杜庆治1, 龙华1, 马迪南2
    2025, 47(7): 1321-1330. doi:
    摘要 ( 179 )   PDF (1551KB) ( 134 )     
    针对在多模态方面级情感分析任务中,传统方法主要关注图文模态交互的深层信息而较少关注图像和文本中与方面相关的浅层信息,导致引入与方面无关的噪声,使得模型在捕获方面与情感之间复杂关系的能力上受到限制的问题,提出一种双通道图卷积网络模型DCGCN。在BART模型的结构上,利用注意力机制增强方面语义,通过图卷积网络获取方面增强的多模态特征,并将句法依赖、基于方面的位置依赖和方面增强的图文相关性信息聚合到GCN邻接权重矩阵中以获得感知多信息的多模态特征。实验表明,所提DCGCN模型在Twitter的2个数据集上的F1值分别达到了67.4%和67.9%,提高了多模态方面级情感分析的性能。