Please wait a minute...
中国计算机学会会刊
中国科技核心期刊
中文核心期刊
首页
期刊介绍
期刊荣誉
数据库收录
编委会
投稿指南
投稿须知
出版道德
期刊订阅
下载中心
联系我们
English
当期目录
2025年, 第01期 刊出日期:2025-01-25
上一期
本期栏目:
目录
高性能计算
计算机网络与信息安全
图形与图像
人工智能与数据挖掘
目录
2025年第1期目录
2025, 47(01): 0-0. doi:
摘要
(
66
)
PDF
(244KB) (
107
)
高性能计算
粒子输运非确定性模拟的加速方法研究进展
张建民, 许炜康, 刘津津, 黎铁军
2025, 47(01): 1-9. doi:
摘要
(
88
)
PDF
(708KB) (
154
)
粒子输运非确定性模拟是高性能计算机的主要应用之一,在国民经济建设和国家安全领域具有重要作用。当前核数值模拟、核反应堆设计与航空航天等实际应用对高精度粒子输运非确定性模拟存在迫切需求,其加速方法逐步成为高性能计算领域的研究热点。针对近年来涌现的众多研究成果,首先介绍了粒子输运非确定性模拟的基本原理;其次给出粒子输运模拟程序的基本流程和伪代码;再次对软件加速方法以及基于硬件加速技术的最新研究成果进行了概述;最后基于体系结构模拟器提取的程序特征,讨论了粒子输运模拟所面临的主要挑战,并结合相关研究工作对今后的研究方向进行了展望。
DSP处理器二级缓存的结构优化研究
安昕辰
2025, 47(01): 10-17. doi:
摘要
(
61
)
PDF
(1263KB) (
96
)
近年来自动驾驶、医用仪器、智能家居等领域涌现出的新应用对DSP处理器的实时性和数据吞吐能力提出了更高的要求。多级缓存结构在DSP中的使用引入了因缓存缺失和一致性维护等过程带来的延迟不确定性。针对长延时访问导致的性能下降问题,提出将缺失缓冲区和逐出缓冲区合并,在运行时灵活分配缓冲条目的功能,以提高缓冲区利用率。针对L1 Cache、L2 Cache间一致性维护信息同步效率低的问题,提出利用无效化地址的连续性,将无效化信息非阻塞地同步到监听过滤器。测试结果表明,生产者-消费者场景下包含大量脏数据更新的程序性能提高了19.91%,32行无效化信息的同步时间从61个时钟周期降低到16个时钟周期。
面向向量部件的指数和对数函数优化方法
沈洁, 龙标, 黄春, 唐滔, 彭林
2025, 47(01): 18-26. doi:
摘要
(
52
)
PDF
(823KB) (
109
)
指数和对数函数是浮点计算中重要的超越函数,在不同应用领域使用广泛。现代处理器向量寄存器宽度呈现逐代增加的趋势,为了进一步提高上层应用对向量部件的利用率,研究向量指数和对数函数优化方法具有重要的科学价值和现实意义。针对现有向量函数实现的性能瓶颈,设计和实现了面向向量部件的指数和对数函数优化方法,包括基于硬件加速指令的向量查表优化、分支优化和精度性能取舍优化。模拟器上的实验表明,优化实现的向量指数和对数函数均达到业界高精度标准,函数性能优于当前最佳开源实现,加速比达1.44以上。真实应用测试进一步表明,应用程序在优化的向量函数支持下可以实现高效向量化,相比原始标量实现平均性能提升达2.53倍。
面向Duobinary信号的时钟恢复电路研究与设计
袁梁勇, 齐星云, 吕方旭, 罗章, 黄恒, 张庚, 王文晨, 李萌, 赖明澈
2025, 47(01): 27-34. doi:
摘要
(
39
)
PDF
(1862KB) (
75
)
高速串行接口是高性能计算机系统中芯片之间的互连核心,针对高速串行通信所需高带宽问题,在Candence平台上基于Verilog-AMS完成56 Gbps Duobinary信号时钟数据恢复电路设计与仿真,多电平传输可以减小对带宽的需求。基于相位差值器(PI)设计时钟数据恢复(CDR)电路,以Bang-Bang鉴相器的鉴相结果作为鉴相依据,采用数字信号处理(DSP)算法处理鉴相结果,其包括投票算法、滤波算法以及相位控制码转换算法。数字算法降低了电路设计的复杂度,便于调节环路增益,提高了系统的稳定性,降低环路延迟。仿真结果表明,该CDR电路可以进行相差和100 PPM频差的追踪。对输入数据分别增加0.25 UI正弦抖动,环路带宽为23 MHz,当抖动频率未超过环路带宽时,系统能够跟踪正弦抖动。抖动容限满足CEI-56G协议规范。
基于Patches-CNN的模拟电路故障诊断
吴玉虹, 王建
2025, 47(01): 35-44. doi:
摘要
(
35
)
PDF
(1536KB) (
74
)
深度学习在故障诊断中应用广泛,但目前基于深度学习的模拟电路故障诊断模型复杂度较高,难以在边缘设备上部署。针对该问题,为了进一步提高故障诊断精度,提出了一种简单且轻量化的Patches-CNN模拟电路故障诊断深度学习模型。首先,将输入的图像分割成patches,并通过Patches Embedding算子转换为词向量(tokens),作为ViT风格的同质结构的输入,利用轻量化算子GSConv进行特征提取和获取token之间的信息,可以有效地提高模型的故障诊断精度。其次,添加层归一化可以防止模型梯度爆炸和加快模型收敛,为了提升模型的非线性,采用GELU激活函数。最后,将Sallen-Key带通滤波电路和Four-Opamp双二阶高通滤波电路作为实验对象。实验结果表明,该模型可以实现故障的准确分类与定位。
面向同构非对称多核的OpenOCD调试功能优化研究
唐竹, 陈宝海, 王敬宇, 朱琪
2025, 47(01): 45-55. doi:
摘要
(
48
)
PDF
(2097KB) (
90
)
多核架构是提升处理器性能的重要手段,其在网络处理领域的应用也日渐广泛,因此,需要配套高效的多核调试工具才能提升多核网络处理器的开发效率。由于处理网络任务的多核之间并不存在很强的关联性,业务核更多使用运行到结束(RTC)而非流水线(Pipeline)的处理模式,多个业务核之间并不需要复杂的缓存一致性逻辑,因此采用同构的非对称多处理AMP架构,可有效降低芯片复杂度和研发成本。目前,非对称多核调试需要同时启动多个GDB,不仅调试不便,同时还会导致较大的资源开销。针对同构非对称多核场景下OpenOCD多端口调试方案进行优化,以单个GDB端口实现针对多个非对称核的调试功能,同时支持对称多处理核簇与非对称多核的混合场景。最后,基于RISC-V软硬件平台搭建了非对称多核调试环境,对线程操作、单步执行、单步跳过、继续运行、查看堆栈和断点设置等GDB调试命令进行测试,验证了单端口OpenOCD进行非对称多核调试的可行性和有效性。
基于模糊强化学习的云计算虚拟机调度策略
余世瑞, 姜春茂
2025, 47(01): 56-65. doi:
摘要
(
55
)
PDF
(1058KB) (
89
)
针对云计算数据中心中,低效的资源管理产生的高能耗问题,提出一种基于模糊的(Q- learning(λ))强化学习算法,通过处理虚拟机放置(VMP)问题来解决云计算数据中心的高能耗开销问题。将当前状态下的虚拟机数量以及物理机利用率作为输入状态传入模糊控制器,并与强化学习(RL)算法相结合来执行对应相关的策略。该算法能够动态地将相关虚拟机分配到所对应的物理服务器上并且能够减少虚拟机迁移次数,优化资源利用率,在满足用户服务级别协议(SLA)的同时降低能源消耗。该算法能够应对工作负载波动的情况,并在满足SLA的期望服务质量(QoS)需求的同时,提供合适的VM部署(初始或重新映射)。实验结果显示,与Q-learning、Q-learning(λ)、Greedy和PSO放置算法相比,基于模糊的Q-learning(λ)算法的能源消耗显著减少且具有更快的收敛速度和一定的实用价值。
基于分数阶2D-TFCDM映射和改进的Hilbert曲线置乱的图像加密算法
高颖颖, 田野
2025, 47(01): 66-74. doi:
摘要
(
49
)
PDF
(3220KB) (
86
)
为增强数字图像在传输中的安全性,同时解决图像像素间关联性强、数据量大等问题,提出了一种基于分数阶2D-TFCDM映射和改进的Hilbert曲线置乱的图像加密算法。首先,利用分数阶2D-TFCDM映射产生伪随机序列;其次,对明文图像进行分块,将改进的Hilbert曲线对子块图像进行置乱,为充分地削弱图像的相关性,进一步提高图像的置乱度,再对图像进行M×N次Arnold变换,同时改变每次Arnold变换的参数;最后,将异或运算与明文图像的平均像素值相结合进行扩散,得到最终的加密图像。对3幅256×256大小的灰度图像进行测试,结果表明,加密图像的像素间关联性较弱,具有较好的加密效果、良好的统计特征和强大的抗干扰能力,可有效抵抗各种常见的攻击,在图像加密方面具有较好的实用价值。
计算机网络与信息安全
基于网格密度积叠的流数据异常检测
武培成, 赵旭俊, 靳黎忠
2025, 47(01): 75-85. doi:
摘要
(
52
)
PDF
(1074KB) (
87
)
多数的流数据异常检测算法采用滑动的单一窗口模型,这会导致大量数据点进行重复计算,异常点也会受到滑动窗口中近邻更替的干扰,进而影响异常检测算法的准确性。为解决上述问题,提出了联合窗口模型,采用若干无重叠的窗口作为异常点的检测范围。在此模型上,提出了基于网格密度积叠的异常检测算法,首先,优化了核密度估计函数用于数据点局部密度的计算;其次,提出网格密度积叠操作,用于异常网格的度量。在异常网格中,通过计算数据点的异常分数来确定最终异常数据。为了提高算法效率,提出一种自适应剪枝策略,剪枝一些异常点不可能出现的区域。实验结果表明,该算法同现有的数据流异常检测算法相比,在效率和准确性2个方面体现出较强的优势。
恶意软件知识图谱的构建与研究
罗养霞, 李浩, 武晨明
2025, 47(01): 86-94. doi:
摘要
(
45
)
PDF
(1280KB) (
83
)
近年来,知识图谱在恶意软件分析领域应用广泛,但是多数研究人员着重于构建恶意软件API知识图谱,利用知识图谱去检测恶意代码,而利用API知识图谱解释性较弱、专业性较高。针对上述问题,提出通过NER模型去抽取恶意软件名称、发现地等文本实体信息,以此构建恶意软件知识图谱,并通过知识图谱发现其多样性、演化路径、威胁方式与分类关联等。首先研究了恶意软件知识图谱的构建方法,完成数据预处理、模式层构建与数据层构建。其次对恶意软件结构化与半结构化数据进行实体标识与规范化,完成本体构建(实体、关联与附加属性),通过模式层指导数据层的方法,利于BERT-BiLSTM-CRF模型进行知识抽取。最后,利用Neo4j图数据库对知识图谱进行存储与可视化。利用病毒库数据对所建模型进行仿真验证,实验结果表明:此模型相比同类模型效果更好,性能指标更优异,对推进网络安全知识简易化和防御体系知识普及化具有重要意义。
一种基于区块链的医疗数据审计方法
徐超, 阮荣耀, 陈勇,
2025, 47(01): 95-106. doi:
摘要
(
59
)
PDF
(1239KB) (
97
)
医疗数据是医疗体系最重要的支柱和驱动力,对于健康医疗领域的发展至关重要。针对目前医院存在的医疗数据造假、医疗诊断错误等问题,提出了一种基于区块链的医疗数据审计方法。从审计的视角出发,采用IPFS和区块链相结合的方式存储医疗数据,并借助智能合约进行医疗数据的存取和访问控制,保证医疗数据真实可靠和公开透明;然后,设计了一种基于注意力机制的深度学习医疗数据审计模型,自动提取医疗数据的关键特征,以求更精准地定位医疗数据审计线索。实验结果表明,构建的基于区块链的医疗数据审计方法不但能够保证医疗数据的可靠性,而且在审计线索定位的准确率和精确率上,相比现有审计模型均有一定程度的提升。
图形与图像
通道差先验下的自适应高斯函数去雾算法
任瑞琳, 杨燕
2025, 47(01): 107-118. doi:
摘要
(
45
)
PDF
(3634KB) (
71
)
针对图像去雾过程中存在的天空区域失真、结果偏色和去雾不彻底等问题,提出一种通道差先验下的自适应高斯函数去雾算法。从雾天图像降质的本质出发,提出一种反映有雾图像与无雾图像内在联系的统计先验——通道差先验,通过该先验建立有雾图像和无雾图像的方程组,利用有雾图像的饱和度与亮度之差近似估计景深,设计了自适应标准差高斯函数求解方程组,获得初始透射率,经归一化处理后解决高亮区域“加雾”现象,并使用联合双边滤波深度优化透射率。利用多尺度滤波和几何均值优化局部大气光,结合大气散射模型获得去雾图像。实验结果表明:所提算法避免了天空区域失真,细节信息丰富,去雾效果显著,同时又能保持良好的图像颜色。
基于残差注意力编-解码网络的道路提取方法
齐然然, 帕力旦·吐尔逊, 汤泊川, 钱育蓉,
2025, 47(01): 119-129. doi:
摘要
(
34
)
PDF
(1515KB) (
77
)
针对遥感图像中相似形状地物对道路提取造成干扰的问题,提出基于残差注意力的编-解码网络RAED-Net。RAED-Net的编码网络采用改进的通道注意力残差模块来提取输入图像的局部特征和全局特征,自适应地调整通道特征映射的权重,提高对重要通道信息的关注,减少背景干扰。在解码网络中引入条形卷积模块,提高上采样过程中跨通道信息交互以及对道路边缘细节信息的恢复能力,提升复杂环境中道路提取结果的准确度。在2个不同类型公开数据集上的对比实验结果表明,RAED-Net能够准确提取道路信息,缓解了相似地物对道路提取带来的干扰问题,取得综合最优结果且参数量最少。尤其在全像素标注、复杂性较高的mini DGRD数据集上的F1、IoU和mIoU分别比次优网络提高了3.53%,5.76%和2.21%。
改进注意力混合自动编码器视频异常检测研究
陈兆波, 张琳, 马晓轩
2025, 47(01): 130-139. doi:
摘要
(
61
)
PDF
(1186KB) (
89
)
视频异常检测是计算机视觉领域的重要研究内容之一,广泛应用于交通、公共安全等领域。然而,目前视频异常检测领域存在单个预测模型易受噪声干扰、单个重构模型存在泛化异常等问题。为了解决这些问题,提出了一种结合重构和预测模型的视频异常检测方法。在正常光流数据上训练具有注意力机制和内存增强模块的重构网络,再将重构后的光流和原始视频帧同时输入未来帧预测网络中,以重构光流为条件辅助帧预测网络更好地生成未来帧。为了提取更有效的特征,提出了一种残差卷积注意力模块SRCAM以促进重构和预测网络在全局和局部层面有效学习潜在空间的特征表示,从而增强模型对视频中异常事件的检测能力,提高模型的鲁棒性。通过在UCSD Ped2和CUHK Avenue这2个常用的视频异常检测数据集上进行的广泛的实验评估,表明了所提方法的有效性。
人工智能与数据挖掘
融合强化学习的分阶段策略求解旅行背包问题
章政, 夏小云, 陈泽丰, 向毅
2025, 47(01): 140-149. doi:
摘要
(
56
)
PDF
(715KB) (
84
)
旅行背包问题TTP是传统的旅行商问题和背包问题的结合,属于NP难问题。相较于独立的旅行商问题和背包问题,旅行背包问题更加符合现实情况,具有更高的研究价值。先前的TTP求解算法主要为启发式算法,性能有限,其他类型的算法则研究较少。为了提高TTP的求解性能,提出了融合强化学习的算法,采用分阶段策略。第1阶段根据物品的属性生成物品选择计划,第2阶段利用强化学习演员-评论家(Actor-Critic)算法求解旅行路径,第3阶段引入邻域搜索策略优化所得解。实验结果表明,所提算法在大部分算例上都取得了较好的结果,并且在部分算例上,解的质量超越了其他对比算法,表明了所提算法具有较优的性能。
基于注意力指导的双粒度跨模态医学特征学习框架
陈欣然, 刘宁, 闫中敏, 刘磊, 崔立真
2025, 47(01): 150-159. doi:
摘要
(
56
)
PDF
(1303KB) (
91
)
深度学习在医学影像诊断中取得显著成果,基于深度神经网络的模型可以有效辅助医生进行决策。然而,随着模型参数规模逐渐增大,且高质量医学影像数据的标签需要专业医师手工完成,因此大规模参数模型在医疗领域愈发面临数据稀缺的挑战。一种解决方案是引入与医学影像成对的医学报告指导训练,这涉及2种模态的交互,而通用领域的跨模态对齐方法缺乏对细节信息的捕捉,不能完全适用于医疗领域。为解决此问题,提出一种注意力指导的双粒度跨模态医学特征学习框架ADCRL,实现了医学影像和报告在粗粒度和细粒度上的对齐。ADCRL能够提取出医学影像和医学报告2种粒度上的特征,使用注意力指导的模块选择医学任务可能感兴趣的影像区域,并去除噪声区域。通过对比学习式的代理任务实现2个粒度上模态的对齐。ADCRL在无监督范式下训练模型理解2种模态的全局语义和细节语义,并在下游任务中仅使用有限标注数据,即可表现出优秀的性能。主要工作包括提出细粒度特征选择方法和双粒度跨模态特征学习框架,并在公开医疗数据集上预训练并验证了框架的有效性。
融合交叉序列预测和一致性对比的WiFi人体活动识别
王杨, 许佳炜, 王傲, 宋世佳, 谢帆, 赵传信, 季一木
2025, 47(01): 160-170. doi:
摘要
(
47
)
PDF
(2883KB) (
122
)
随着IEEE 802.11bf标准的发布,WiFi感知技术已从学术研究走向工业应用。针对现有的基于 WiFi的人体活动检测系统往往依赖于较强假设约束问题,从如何充分利用无标签 CSI样本出发,设计了一种适用于WiFi感知领域的自监督模型CPCC-Fi。模型在对比学习思想的基础上首先使用序列数据增强生成不同视图的无标记CSI样本;然后通过自监督学习获取CSI序列内在表示特征;再通过少量标记样本对模型进行微调,最后即可实现下游人体活动的有效感知和识别。在自采和公开数据集上的相关实验结果表明,与CNN+Linear、CNN+Transformer+Linear和TS-TCC相比,CPCC-Fi模型的各项性能均有所提升。
混合策略改进的蜣螂优化算法
高纪元, 刘杰, 陈昌盛, 李伟, 刘影, 杨靖,
2025, 47(01): 171-179. doi:
摘要
(
48
)
PDF
(1005KB) (
80
)
蜣螂优化算法是一种新的全局优化元启发式算法,具有寻优能力强和收敛速度快的特点,但是其也存在容易陷入局部最优和收敛精度低等缺点。为此,提出了一种基于混合策略改进的蜣螂优化HSIDBO算法。首先,采用改进后的Logistic混沌进行种群初始化得到更加均匀分布的种群;其次,采用自适应最优引导策略加快算法的收敛速度,提升局部收缩能力;最后,增加透镜成像学习策略改善蜣螂偷窃环节以增强算法的局部逃逸能力。通过对14个经典测试函数和工程应用问题进行求解测试,表明引入的3种策略能有效提升蜣螂优化算法的性能。
基于修辞结构的篇章级神经机器翻译
姜云卓, 贡正仙
2025, 47(01): 180-190. doi:
摘要
(
43
)
PDF
(719KB) (
90
)
虽然篇章级神经机器翻译发展多年,并取得了长足的进步,但是其大部分工作都是从模型的角度出发,利用上下文字词信息来构建有效的网络结构,忽视了使用跨句子的篇章结构和修辞信息对模型进行指导。针对这一问题,在修辞结构理论的指导下,提出了对篇章单元和修辞结构树特征分别进行编码的方法。实验结果表明,所提方法加强了编码器对篇章结构和修辞上的表征能力,使用该方法对模型进行改进后,其翻译结果在多个数据集上都获得了明显提升,性能超过了多个优质的基线模型,并且在提出的定量评估方法和人工分析中译文质量上也表现出了明显改善。
作者中心
作者投稿查稿系统
作者须知
论文模板
版权转让协议
审稿中心
外审专家审稿
编委审稿
主编审稿
编辑部办公
在线期刊
当期目录
最新录用
过刊浏览
出版专刊
下载排行
引用排行