Please wait a minute...
中国计算机学会会刊
中国科技核心期刊
中文核心期刊
首页
期刊介绍
编委会
投稿指南
投稿须知
排版规范
投稿模板
审稿流程
常见问题
开放获取
出版道德
期刊订阅
下载中心
联系我们
English
当期目录
2026年, 第1期 刊出日期:2026-01-25
上一期
本期栏目:
目录
高性能计算
计算机网络与信息安全
图形与图像
人工智能与数据挖掘
目录
2026年第1期目录
2026, 48(1): 0. doi:
摘要
(
30
)
PDF
(239KB) (
14
)
高性能计算
一种基于神经网络的发送端均衡调优方法
申慧毅, 李晋文, 曹继军, 赖明澈
2026, 48(1): 1-10. doi:
摘要
(
62
)
PDF
(2120KB) (
19
)
随着数据中心和高性能计算机系统日益增长的数据传输带宽需求,高速互连网络数据传输的速率越来越快,而信号传输的链路也越来越复杂,对于高速串行通信SerDes信号的均衡技术也提出了更高的要求。目前接收端的均衡可以做到自适应,但是发送端前馈均衡FFE难以做到自适应,需要手动配置。针对这个问题,提出了一种基于神经网络的发送端前馈均衡系数的多目标调优方法,首先通过采集模拟仿真数据,利用神经网络对FFE的抽头系数与眼高和眼宽建模,再使用多目标优化算法对训练好的神经网络模型求解,能够快速得到最优的FFE电路抽头系数。与传统基于逐位模拟的FFE系数单目标优化方法相比,所提出的方法最高可以在眼图面积上实现约25%的提升,并且大大减少时间开销,提高优化效率。
面向大规模系统的并行进化策略框架
张涵, 王小平
2026, 48(1): 11-19. doi:
摘要
(
31
)
PDF
(914KB) (
9
)
进化策略算法是一种高效的优化算法,适用于解决无梯度信息或难以获取梯度信息的问题,广泛应用于强化学习和黑盒优化等任务。随着问题规模和复杂度的增加,进化策略算法的采样规模也越来越大,相应地,计算并行度也随之增加。面向大规模系统,提出了新的并行进化策略算法框架,主要优化进化策略算法在超大规模并行执行中的容错计算和通信开销问题。针对这些问题,提出了高并发的规约机制,并针对算法特点提出了低开销的容错方法。实验显示,新的并行进化策略算法框架在大规模系统中的并行效率在54.7%以上,且在并行规模上升至上万节点时,并行效率比OpenAI-NES高出23%。
OBCC:后摩尔时代E级计算编程墙的一种估计方法
张晓哲, 陈涛, 肖调杰, 张翔, 包为民, 龚春叶
2026, 48(1): 20-27. doi:
摘要
(
45
)
PDF
(624KB) (
11
)
后摩尔时代的E级计算面临的编程墙缺乏衡量标准。代码复杂度作为软件代码的内在属性,是代码理解、优化和计价的基础。针对现有的代码复杂度衡量方法在HPC应用中存在局限性的问题,提出了基于操作符数目和代码行数的代码绝对复杂度和相对复杂度,其中绝对复杂度为代码操作符总数,相对复杂度为绝对复杂度与代码行数的比值。通过43个软件代码的实验验证,该方法能够合理评估不同类型代码的复杂度,特别是在科学计算领域。其中llvm和linux内核分别以3 300万和2 300万的绝对复杂度位列前两位;jellyfin-media-player,spheral和llvm则以4.54,3.9和3.12的相对复杂度排名前3位。该方法为不同代码的分析、比较和计价提供了新视角,也为E级计算编程墙的衡量提供了一种客观、可量化的标准。
超算集群作业特征分析与运行时间预测
杨泓桢, 程伟, 杜量, 黄聃, 曾楚轩, 肖侬
2026, 48(1): 28-39. doi:
摘要
(
46
)
PDF
(2339KB) (
14
)
高性能计算集群的作业日志可以用来分析系统工作负载,发现系统使用的周期性规律、作业特征之间的相关性和用户行为模式,并进一步帮助开发运行时间预测模型,降低作业运行时间估计值误差,提高作业回填调度的性能。现有的预测算法侧重于提高作业运行时间的平均预测准确率,而忽略了预测值低于实际运行时间的情况(低估预测),可能导致调度器提前终止执行中的作业,降低系统资源的有效利用率。为解决上述问题,在对HPC作业特征的长期变化趋势和相关性开展分析的基础上,提出了一个集成学习模型预测作业运行时间,并提出有序扩展最大值策略调整集成模型的预测结果。实验结果表明,作业运行时间预测模型在保持较高预测准确率的同时显著降低了低估率,并且具有较好的稳定性和泛化能力。
面向安全可编程阀门阵列生物芯片的基于深度强化学习的组件布局算法#br#
陈子阳, 陈钧, 朱予涵, 刘耿耿, 黄兴
2026, 48(1): 40-50. doi:
摘要
(
34
)
PDF
(1081KB) (
16
)
作为一种新型的连续流体式微流控生物芯片,完全可编程阀门阵列FPVA生物芯片具备高灵活性和可编程性的优点,将其用作实验平台可以提供更加灵活的操纵,同时可以实现个性化的实验流程配置。 然而,随着芯片制造工艺不断提高,FPVA生物芯片的集成度已经达到很高的水平,结合其高自由度的特性,对FPVA生物芯片进行编程和设计的难度也在不断提高。 组件布局是生物芯片设计中的一个重要步骤,在以往的研究中通常采用启发式算法进行布局,但是对于离散问题的求解效果比较有限,而且参数设置难度较大,因此设计一种高效易用、更加适合离散化的组件布局算法,能够提高整体芯片设计过程的效率。 深度强化学习DRL具备高效率、强自适应性和灵活性等优点,智能体通过不断地与环境交互,进行自我训练和调节,能够迅速适应各种复杂的变化和需求并找到最优或近似最优的策略。相比启发式算法,DRL能够更加贴合环境,找到全局最优的布局方案。 因此,设计了一种面向FPVA生物芯片的基于DRL的组件布局算法,为DRL智能体构建了FPVA芯片交互环境并采用双重深度Q网络构建组件布局决策模型,利用智能体能够快速迭代的优点迅速完成大规模集成FPVA生物芯片的组件布局工作。 同时,通过设计并发关系约束和布局区域约束来判断各个组件之间的并发关系并且对芯片上的可布局区域进行限制,使得布局方案能够更加符合实际情况,从而保证布局方案的正确性与可行性。 利用多个测试样例,将所提算法与最新相关算法进行了对比,实验结果表明所提算法能够生成具有更短预布线线长与更少单元复用次数的组件布局方案,从而为后续的布线阶段提供高质量的布局方案。
计算机网络与信息安全
基于PUF的TPM架构设计与应用研究
施江勇, 高志远, 刘天祎, 刘威, 郭振斌, 张咏鼎, 李少青
2026, 48(1): 51-60. doi:
摘要
(
36
)
PDF
(1996KB) (
9
)
现有的可信平台模块TPM主要依赖单一RSA公私钥对作为安全的可信根基础,该RSA密钥对固定不变地存储于TPM芯片中。因此,此种设计架构可能使得系统面临着物理分析与侧信道分析等物理层面攻击的威胁,进而导致系统的安全性难以得到有效保障。为此,提出采用物理不可克隆函数PUF作为可信根,利用PUF具有的物理不可篡改性、随机性和不可预测性等安全特性,设计并实现了基于PUF的TPM架构。此外,还针对现有研究中密钥生成算法存在的安全漏洞以及认证机制的不完善等问题进行了有效的改进,并将改进后的设计应用于可信启动验证及固件的安全更新中,从而有效提升了可信计算环境面临安全威胁的防御能力。通过BAN逻辑和协议自动化验证工具AVISPA对所提协议的安全性进行了深入分析,并在ZynqTM 7000系列开发板上实现了可信启动的相关实验,结果表明了所提出的方法可增强密钥生成算法的安全性,并有效降低了对引导程序和固件更新数据进行篡改等攻击的威胁。性能评估结果显示,所提协议整个认证过程平均时长仅0.06 s,展现出了其在性能上的优越性。
基于重叠汉明码的QR码信息隐藏方案设计
张丽娜, 侯明会, 辛鹏, 刘苗, 岳恒怡
2026, 48(1): 61-69. doi:
摘要
(
30
)
PDF
(1918KB) (
13
)
QR码因其信息容量大、解码速度快且具有较好的容错能力而被广泛应用。然而,由于其解码规则公开,容易造成隐私泄露。为此,结合QR码的基本性质,提出了一种基于重叠汉明码的QR码信息隐藏方案来保护QR码中的敏感信息。该方案以普通黑白QR码转变的二级灰度QR码作为载体,降低了信息隐藏位置的更改程度,提高了秘密信息的不可见性。同时设计了重叠(16,11)汉明码算法及相应码字更改规则表,从而隐藏更多位秘密信息。与现有研究工作相比,所提方案在秘密有效载荷和嵌入效率方面取得了更好的性能,信息隐藏和提取过程更加简便。
一种基于通用扰动的后门攻击防御框架
饶月, 马晓宁, 程忠锋
2026, 48(1): 70-78. doi:
摘要
(
35
)
PDF
(1353KB) (
8
)
最近研究表明,深度神经网络(DNN)容易受到后门攻击,这种攻击隐蔽且强大,能让模型输出攻击者所期待的结果。针对目前后门攻击防御研究需要较高计算开销的同时还会影响模型准确率的问题,提出了一种基于通用扰动的防御框架,该框架将检测后门与消除后门的工作结合起来。检测阶段在样本集上产生能使良性样本分类错误而对后门样本无影响的扰动,通过对比待检测样本添加扰动后模型前后输出结果的变化来完成后门样本的高效检测。消除阶段将检测到的后门样本使用随机主色覆盖方法重建后与良性样本混合去重训练后门模型。在MNIST、Fashion-MNIST和CIFAR-10数据集上验证该框架在不同触发器设计、中毒比例对防御的影响以及对于特定标签攻击的防御效果。实验表明,该框架不仅能很好地降低后门攻击在不同条件下的攻击成功率,还对良性样本的分类性能几乎没有影响,同时对于特定标签攻击的防御效果相比之前的研究也有了很大的提升。
基于RISC-V的AES_ll协处理器设计
韩进, 武泽伟
2026, 48(1): 79-88. doi:
摘要
(
47
)
PDF
(1750KB) (
7
)
随着计算机技术的快速发展,数据的存储及运算量不断增加,安全、可靠且高效的数据存储及传输愈发重要,在众多加密算法中,AES算法是一种应用广泛的对称加密算法。研究的目标是对AES算法进行改进,令其更适用于硬件实现,以减小面积并提升处理性能。首先,提出了一种轻量化的AES算法AES_ll,并基于RISC-V指令集架构设计了4种自定义指令,以提高算法的灵活性并降低成本。其次,设计了专用的AES_ll协处理器并建立了一个可随机生成明文和对应密文的验证平台,以确保AES_ll算法的硬件实现在不同输入下的可靠性和稳定性。最后,在28 nm工艺下进行了综合,实验结果表明,所设计的AES_ll协处理器的吞吐率可达到2.976 Gbit/s,面积约为13.97 kgates,在吞吐率和面积比方面占有显著优势,为资源受限且对加解密有较高需求的领域提供了一种良好的解决方案。
适用于智能家居系统的SM2两方协同签名方案
许国威, 刘登志
2026, 48(1): 89-97. doi:
摘要
(
60
)
PDF
(740KB) (
10
)
智能家居系统已经在人们的日常生活中得到了广泛的普及和应用。然而,智能家居节点计算资源受限,在实现隐私保护和密钥管理方面仍存在诸多问题。为了提升智能家居系统的安全性,设计出了一种轻量级签名方案。该方案基于SM2密码算法和两方协同签名进行构造,并进行密钥分割存储,以降低密钥泄露的风险。同时,将密钥生成与用户注册相结合,并在用户与智能网关交互生成私钥的过程中增加认证参数,从而进一步提高系统安全性且在签名阶段无需合成完整的私钥。最后,提供安全性证明,包括不可伪造性、匿名性和存储安全性。模拟实验的结果表明,所设计的签名方案适用于轻量级环境下的智能家居系统。
图形与图像
基于FPGA的低照度图像增强算法的研究与实现
肖剑, 李志斌, 杨进, 程鸿亮, 胡欣
2026, 48(1): 98-107. doi:
摘要
(
37
)
PDF
(2280KB) (
9
)
针对深度学习等软件方法实现低照度图像增强算法时,计算量大且复杂、实时性差等问题,实现了一种便于部署到FPGA上的基于Retinex模型的改进的低照度图像增强算法。该算法首先将输入的低照度图像进行RGB色彩空间到YCbCr色彩空间的转换,取空间中的Y分量作为初始照度分量对其进行自适应伽玛校正和双边滤波处理,提高初始照度分量亮度的同时实现对图像的降噪和对细节的增强,接着依据Retinex模型得到增强图像。将增强后的图像再次转换到YCbCr色彩空间,对Y分量进行多尺度细节增强后转换到RGB色彩空间,作为最终的增强结果输出。实验结果表明,将在FPGA上部署所提出的低照度图像增强算法和在MATLAB上进行算法仿真后的输出图像进行比较,两者的相似度指标SSIM接近1,肉眼很难分辨出两者的差别;在时钟频率为200 MHz时,处理一幅分辨率为1 280×720的图像仅需约21 ms;将所提出的算法部署在国产某型号的FPGA上时资源占用率较低,功耗为3.357 W,满足低功耗要求,具有较大的实用意义和工程应用价值。
用于土地覆盖分割的多路径多尺度注意力网络
李燕, 樊新宇, 陈芹
2026, 48(1): 108-118. doi:
摘要
(
68
)
PDF
(1296KB) (
11
)
近年来,Transformer及其变种在图像识别领域已取得显著进展,但其在像素级分割任务中仍面临挑战,主要原因在于它们对局部偏差的处理不够显式和有效。对此,提出了一种名为DMANet的多路径多尺度注意力网络。该网络在编码阶段结合了卷积神经网络和Transformer的优势,能够同时捕获图像的精细局部信息和广泛的全局上下文信息,有效地提升特征提取能力。提出的交互式双分支结构加强了对特征的整合能力,提高网络模型在密集预测任务中的性能。在解码阶段实施跨层特征融合,增强DMANet对复杂目标的识别能力。通过在Potsdam,GID-15和L8 SPARCS数据集上进行测试,DMANet展示了其在复杂土地覆盖分割任务中的优异性能及广泛适用性。
基于新的自适应组合损失函数的肺部气道CT图像分割方法
鲜领, 徐修远, 周凯, 牛颢, 郭际香
2026, 48(1): 119-132. doi:
摘要
(
31
)
PDF
(1260KB) (
10
)
基于计算机断层扫描CT影像进行肺部气道的分割对于肺部疾病诊疗具有重要意义。近年来基于深度学习的肺部气道分割方法取得了不少进步,但实现高精度的分割仍然面临巨大挑战。肺部气道CT影像存在的类别不平衡严重影响着分割性能。针对该问题,提出一种基于新的自适应组合损失函数的分割方法。首先,通过局部不平衡策略,提升模型对前景体素的辨别力。其次,将径向距离信息集成到焦点损失函数中,提高模型自动辨别细小气道的能力。最后,基于拓扑敏感度与拓扑精确度提升气道的拓扑连续性。实验结果表明,与现有最先进模型相比,所提出的方法使模型在骰子相似系数、分支检测率和树长检测率上均取得了最好的表现,提升了肺部气道分割性能。
ASOD-YOLO:基于YOLOv8n改进的航空小目标检测模型
曹利, 徐慧英, 谢刚, 李毅, 黄晓, 陈昊, 朱信忠
2026, 48(1): 133-145. doi:
摘要
(
47
)
PDF
(3282KB) (
29
)
针对无人机航拍图像中目标分布不集中、尺寸变化大和特征不明显等特性造成的漏检、误检等问题,提出了一种基于YOLOv8n改进的航空小目标检测模型ASOD-YOLO。首先,重新设计了特征融合网络,将原有的特征金字塔结构的自上而下部分替换为低层的信息分发结构(Low-GD),在减少特征损失的同时增强不同尺度间信息融合的能力。其次,将原有的20×20的大目标检测头替换为160×160的小目标检测头,以增强对小目标的检测能力,并且改进了多尺度跨层连接,为检测头提供更加丰富的语义信息。同时,引入了快速傅里叶卷积(FFC)模块,以减少下采样后小目标信息丢失率,并增强全局上下文信息的提取能力。在航空小目标数据集VisDrone上的实验结果表明,ASOD-YOLO模型相较于基线YOLOv8n模型,在mAP@50指标上提升了4.1个百分点,在mAP@50:95指标上提升了2.3个百分点,单幅图像的处理时间仅有6.8 ms,表明了提出的ASOD-YOLO模型能有效完成航空小目标检测的任务。
人工智能与数据挖掘
数据库查询重写技术综述
李弋杰, 高锦涛, 梁璞
2026, 48(1): 146-161. doi:
摘要
(
30
)
PDF
(1940KB) (
11
)
数据库中查询语句的写法十分丰富且灵活,针对同一需求,可能会写出千差万别的句式。查询的执行性能直接关系用户体验。查询重写技术将输入的查询转换为等价且性能更优的查询。面对众多的重写规则以及复杂的查询环境,如何设计高质量的查询重写策略挑战巨大。传统查询重写策略基于成本或者基于启发式,但在复杂查询环境下很难得到最优的查询重写结果。随着AI4DB的兴起,将机器学习方法结合到查询重写技术中成为主流,能够进一步解决传统查询重写中存在的问题。因此,首先阐述传统查询重写策略的相关技术以及存在的问题和适用的场景,其次引出基于机器学习的查询重写策略,并重点讨论它们如何提升性能;最后讨论现阶段查询重写存在的问题,并对未来的研究方向提出展望。
GPR:一种大语言模型增强的方法
高福财, 何廷年, 杨阳, 杨江伟
2026, 48(1): 162-171. doi:
摘要
(
49
)
PDF
(1195KB) (
13
)
大型语言模型(LLMs)通过大量的数据习得各种能力和知识,但仍有着幻觉、专业领域知识不足等问题,这些问题可通过引入外部知识图谱来缓解。为从知识图谱中获取知识,提出了一种新方法GPR,通过广度优先搜索(BFS)检索相关关系及实体,并以全局视角修剪提取高度相关的关系及实体。同时将问题中的实体通过最短路径进行关系连接。将关系及实体转化为提示词推送到LLMs,引导LLMs推理生成答案并文字化展示推理过程,使得决策透明且可追溯。在多个数据集上的实验结果表明GPR有着更好的推理优势,检索到的知识可更好缓解LLMs的幻觉及知识不足问题。
基于增强预测模型的自动驾驶轨迹预测
田红鹏, 崔丹, 张筱培
2026, 48(1): 172-179. doi:
摘要
(
49
)
PDF
(742KB) (
12
)
自动驾驶技术面临的主要挑战之一是实时预测周边智能体(Agent)未来可靠的轨迹信息,为辅助规划做出最优化决策。提出了一种名为GT-Former的智能体间交互预测模型。该模型以Transformer结构为基础,融合图卷积网络(GCN)以输出智能体动态交互特征。此外,地图与智能体的交互以智能体特征为查询条件,利用交叉注意力机制与多模态注意力机制结合,整合单模态与多模态的交互信息,全面获取智能体与各类地图特征之间的相互作用信息。在Waymo数据集上的仿真实验表明,这一综合策略提升了模型多智能体轨迹预测的准确性。
基于知识点会话感知的知识追踪方法
王静, 马慧芳, 张梦媛
2026, 48(1): 180-190. doi:
摘要
(
78
)
PDF
(1272KB) (
12
)
知识追踪(KT)旨在根据学习者的历史学习记录动态建模他们不断变化的知识状态,在在线教育系统中发挥着重要作用。多数现有的KT方法将知识状态视为学习者从完成前一道习题到完成下一道习题的知识点掌握程度的转换模式,并将学习者的学习记录视为连续且均匀分布的数据。然而,现实中的学习记录被认为可以划分为不同的较短的会话。据此,提出了一种名为基于知识点会话感知的知识追踪方法KSMKT,旨在以更精细的粒度捕捉学习者知识状态的变化。具体而言,首先从知识点角度将学习者的历史学习记录划分为较短的会话。随后,提出了一个细粒度知识状态建模模块,该模块能够建模会话内和会话间的细粒度交互依赖性和知识状态变化。此外,还引入了一个全局知识熟练度建模模块,从整体的角度建模学习者的知识状态。在3个真实世界数据集上的大量实验结果表明,KSMKT优于大多数当前的基线方法,从而证明了KSMKT的有效性。
作者中心
作者投稿查稿系统
作者须知
论文模板
版权转让协议
审稿中心
外审专家审稿
编委审稿
主编审稿
编辑部办公
在线期刊
当期目录
最新录用
过刊浏览
出版专刊
下载排行
引用排行