• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊
本刊未委托任何机构组稿,投稿唯一方式只能通过我刊官方网站http://joces.nudt.edu.cn在线投稿,请作者注意。

当期目录

2025年 47卷 02期

刊出日期

2025-02-25

栏目

  • 当期目录
  • 网络首发
  • 过刊浏览
  • 下载排行
  • 阅读排行
  • 目录
    2025年第2期目录
    2025, 47(02): 0-0. doi:
    摘要 ( 118 )   PDF (244KB) ( 174 )     
    高性能计算
    GPU上基于环展开的RTL模拟加速技术研究
    田茜, 李暾, 程悦, 皮彦, 邹鸿基
    2025, 47(02): 191-199. doi:
    摘要 ( 141 )   PDF (1661KB) ( 201 )     
    随着开源和敏捷硬件设计方法学的发展,为其提供高效的RTL模拟支持变得日益重要。GPU的并行能力使得利用RTL模拟的结构级和激励级并行性加速RTL模拟成为可能。然而,由于时序设计中存在反馈环,如何实现单个Testbench内的数据级并行仍然是一个很大的挑战。提出了一种新的利用GPU加速RTL模拟的方法,该方法的核心技术是RTL设计中反馈环的识别与展开,以及基于此的RTL电路划分技术。电路划分和环展开从单个Testbench内的结构并行和数据并行2个方面,发挥了基于GPU的并行能力来加速RTL模拟。实验结果表明,所提出的GPU加速RTL模拟方法,相比传统的基于GPU的RTL模拟方法得到了1.2~107.1倍的加速,相比目前最快的RTL模拟器ESSENT得到了2.2~14倍的加速。

    基于国产异构众核处理器的等值线与等值面提取算法优化
    张元胤, 肖敏广, 刘志勇, 翁灵玲, 陈志广, 卢宇彤
    2025, 47(02): 200-209. doi:
    摘要 ( 93 )   PDF (1993KB) ( 164 )     
    MT-3000是由国防科技大学面向下一代超级计算机设计的国产异构众核处理器,具有优越的计算能力,可以有效加速可视化数据处理。等值线和等值面提取是标量场数据最常用的几何可视化方法,但现有的提取算法通常仅面向通用CPU或GPU。在MT-3000处理器上,由于片上缓存空间有限,从核访存带宽限制等问题,导致计算效率低下;另外,由于编程模型的特殊性,现有软件与方法无法直接在MT-3000上运行。为了充分发挥国产超算系统在可视化领域的计算效能,基于MT-3000的微体系结构对等值线网格序列算法和等值面移动立方体算法分别提出了新的并行化算法。新方法采用向量指令、流水线实现存算重叠等技术,更加适应异构众核架构,从而达到加速算法执行的目的。实验结果表明,2种算法的加速比均达到4以上,并且随着从核的增多,算法的执行时间近呈线性下降,这证明所提算法具有良好的可扩展性。

    基于FastCAE的Geant4集成关键技术研究
    余昊昊, 唐滨
    2025, 47(02): 210-218. doi:
    摘要 ( 55 )   PDF (1584KB) ( 114 )     
    蒙特卡罗应用工具包Geant4主要用于模拟粒子在物质中输运的物理过程,被广泛应用在空间应用、辐射医学以及加速器物理等领域,然而Geant4默认交互界面简单、输入文件和命令繁琐,易用性较差。首先,依托FastCAE开源前后处理集成平台,开展面向Geant4求解器集成的关键技术研究,包含构建集几何建模、网格划分、求解计算、后处理可视化一体化的仿真软件解决方案。其次,针对集成中的几何模型转为物理几何体问题,开发了“Geometry”和“mesh”2种文件转换方式,同时通过将Geant4的结果文件vtu和vtp转换为vtk文件,实现了Geant4计算结果的可视化。最后,通过质子放疗算例实现了Geant4完整集成流程,证明了开发的网格转换方式和可视化方法满足性能需求。提出的方案可提高Geant4二次开发效率,加速产品化进程。
    基于动态时序裕量压缩的高性能处理器设计
    连子涵, 何卫锋
    2025, 47(02): 219-227. doi:
    摘要 ( 47 )   PDF (1037KB) ( 100 )     
    传统的同步电路设计方法根据静态时序分析得到的关键路径确定工作频率,但是关键路径并不是每个周期都会被激发,在关键路径和实际激发路径之间存在动态时序裕量。为此,提出了一种基于指令级时序裕量压缩的高性能处理器设计方法,旨在最大化压缩动态时序裕量从而获得性能提升。搭建了时序分析平台自动化获取指令时序;设计了一种时序编码策略,在不增加硬件开销的基础上将时序信息通过指令编码传递到硬件,并在硬件层设计了时序译码及仲裁电路,根据指令时序编码相应调节时钟周期,从而实现了指令级动态时序裕量压缩。在一款基于RISC-V指令集的超标量处理器上完成所提方法的仿真验证,结果表明,相比传统设计方法,通过该方法最高可获得31%的性能提升。

    一种基数为4的高基数SRT立方根算法设计与实现
    赵彩虹, 刘梓璇, 周建涛,
    2025, 47(02): 228-237. doi:
    摘要 ( 66 )   PDF (1085KB) ( 114 )     
    SRT立方根算法在多媒体、计算机图形学等领域发挥着重要作用。虽然现有算法可通过增加基数以加快计算速度,但仍存在初始化处理缺乏、商位选择表设计复杂及实现困难的问题。研究设计并实现基数为4的SRT立方根算法。首先,提出一种高基数SRT立方根初始化算法,保证后续迭代计算的可执行性;设计基数为4的SRT立方根算法的商位选择表,为商位选择提供必要条件;优化即时转换算法,能够避免转换过程中出现多次进位的情况。其次,基于PyRTL工具改进并实现了上述基数为4的SRT立方根算法,有效缓解了高基数SRT立方根算法困难的问题。最后,与现有基数为2的SRT立方根算法进行对比,以证明该算法的有效性和优越性。

    计算机网络与信息安全
    rtTorTIM:基于多模态特征融合和Stacking集成学习的实时Tor流量识别方法#br#
    王宇飞, 刘强, 张唯贞, 伍晓洁, 李佳雯, 王煜恒
    2025, 47(02): 238-246. doi:
    摘要 ( 74 )   PDF (988KB) ( 150 )     
    以Tor网络为代表的匿名网络在带来强隐私性保护的同时也为网络违法犯罪活动提供了温床,因此,开展实时、高精度的Tor网络流量识别研究具有重要的现实意义。为此,针对现有研究存在泛化性不强和实时性差等问题,提出了一种基于多模态特征融合和Stacking集成学习技术的Tor网络流量识别方法rtTorTIM。具体来讲,该方法首先提取Tor网络流量的主机级、流级和包级3种模态相关特征并构造特征数据集;随后,rtTorTIM选取随机森林、线性回归和K-近邻方法作为基学习器,并使用一个线性神经网络进行决策融合,从而构建起一个2层Stacking流量分类器。基于ISCX Tor 2016公开数据集的对比实验结果表明,rtTorTIM方法在Tor流量识别上的准确率、精确率和召回率均达到了99%,同时该方法在分类实时性上也展现出更优的性能。

    一种基于新型混淆操作的RFID双向认证协议
    贾昊洲, 徐鹏, 王丹琛, 徐扬,
    2025, 47(02): 247-255. doi:
    摘要 ( 58 )   PDF (1485KB) ( 177 )     
    针对 RFID系统中存在的隐私和安全问题,提出了一种基于新型混淆操作的超轻量RFID认证协议,通过利用简单的逐位异或、循环左旋转和新提出的超轻量化分组循环操作,达到低复杂度、高安全性的目的。此外,由于在协议交互过程中的消息根据随机数生成,攻击者无法通过穷举来破解消息。分析与验证结果表明,所提协议可以有效地抵御常见的网络攻击类型,并且在计算和存储成本方面具备优势。

    基于SAE和WGAN的入侵检测方法研究
    刘拥民, 许成, 黄浩, 张钱垒, 赵俊杰,
    2025, 47(02): 256-264. doi:
    摘要 ( 74 )   PDF (1180KB) ( 137 )     
    近年来,机器学习和深度学习(ML/DL)领域技术飞速发展,将其应用到IDS中的研究也越来越多。但是,目前入侵检测领域的数据集存在特征冗余和攻击分类样本数量不平衡的问题。针对上述问题,提出基于自编码器SAE和生成对抗网络WGAN的网络异常检测方法。首先,针对特征冗余问题,使用堆叠自编码器的编码-隐层-解码思想进行数据降维,细化各类特征,提取更适用于分类的低维度特征。其次,针对样本不平衡(数据量少、种类不多的)问题,将处理过的数据作为生成器的来源输入到WGAN模型中,利用生成对抗网络的生成功能进行样本扩充,弥补分类模型训练过程中某些类型样本数据不足的问题,最终通过RF分类模型进行检测。在数据集NSL-KDD上的实验结果表明,基于本文方法建立的模型SAE-WGAN-RF的F1-Score为95.58%,Recall为96.54%,Precision为96.03%,相比常见的经典算法的性能有显著提高。

    基于深度神经网络的隐私保护基因检测
    黄颖, 唐敏,
    2025, 47(02): 265-275. doi:
    摘要 ( 53 )   PDF (1471KB) ( 101 )     
    深度神经网络(DNN)功能强大,被广泛应用于生物医学中的基因检测。构建可靠的DNN模型需要大量有效医疗样本,而现实中生物数据通常分散存储且具有高度隐私。现有方案在处理此类分布式大规模的复杂学习任务时,难以在实现数据安全的同时保证DNN模型的高精度。为此,提出一个基于DNN的隐私保护方案,联合多方数据快速构建起精确的基因检测模型。首先,使用盲化矩阵结合内积函数加密消除全同态、秘密共享等方案中需要的近似替换策略,确保在隐私保护的同时,实现与明文集中式训练一致的效果。其次,构造非交互式训练模式抵抗全局模型参数泄漏造成的推断攻击,保证数据安全。在真实医疗数据集上的实验结果表明了所提方案的正确性、有效性和高精度。

    图形与图像
    PCB表面缺陷数据集与基于YOLOv5s-P6SE的检测
    梁泰然, 蒋诗新, 李泉洲, 欧阳斌, 吕盛坪
    2025, 47(02): 276-287. doi:
    摘要 ( 79 )   PDF (2409KB) ( 157 )     
    针对PCB生产中表面缺陷检测的需求,结合车间实际制定一个包含11种类别的缺陷分类标准,采集真实PCB表面缺陷图像,最终构建一个包含3 239幅图像4 672个缺陷目标的数据集Dataset_PCBSD。基于YOLOv5s改进得到一种新的PCB表面缺陷检测模型YOLOv5s-P6SE。为提高检测精度,在YOLOv5s中增加用于检测特大目标的P6检测层,引入了SE注意力模块和柔性非极大抑制后处理。实验结果显示,相较于基准模型YOLOv5s,YOLOv5s-P6SE在均值平均精度上提升了5.5%。同时,YOLOv5s-P6SE在mAP和模型大小上均优于Faster R-CNN、SSD、PCB缺陷检测模型YOLOv4-MN3以及DETR模型RT-DETR-L,且在平衡mAP和模型大小方面优于YOLOv8s。

    基于可逆生成对抗网络的鲁棒图像隐藏
    许天佑, 高光勇
    2025, 47(02): 288-297. doi:
    摘要 ( 65 )   PDF (2022KB) ( 110 )     
    图像隐藏的目的是在载体图像中隐藏秘密图像,使秘密图像对人眼来说仍然是不可察觉的,但是在需要时可以恢复秘密图像。已有的图像隐藏方法在隐藏能力和鲁棒性方面受到限制,通常容易受到网络传输中图像失真的影响。因此,提出了一个名为RIHIGAN的模型。该模型在前向和后向的过程中使用同一网络来实现图像隐藏和恢复;在可逆网络模块中,通过结合注意力机制来增强模型的图像重建能力。在可逆网络的基础上,引入了生成对抗网络;同时改良了判别器的结构,结合残差块提升其判别能力。实验结果表明,RIHIGAN在保持恢复率和不可见性的同时,有效地增强了鲁棒性。

    聚焦式学习分割一切提示的无监督视频目标分割
    沈勇辉, 卜东旭, 张胜裕, 宋慧慧,
    2025, 47(02): 298-307. doi:
    摘要 ( 58 )   PDF (2618KB) ( 97 )     
    无监督视频目标分割旨在测试阶段自动定位和分割视频帧中的主要目标。目前,大多数模型、方法依赖于从RGB图提取的外观线索和从光流图提取的运动线索来进行目标分割。然而,目标遮挡、快速运动或静止等问题会导致光流获取的信息缺失,仅依靠外观分支获取的有限信息难以实现良好的分割效果。为了解决这一问题,提出了一种聚焦式学习网络模型FPLNet,该模型引入额外的双分支结构以捕捉主要目标的位置信息和轮廓信息,从而弥补光流信息的缺失。首先,所提出的模型利用分割一切模型SAM的骨干网络提取外观和运动信息,从而提高模型的泛化性。然后,将额外引入的粗粒度和细粒度的2个分割分支共同作为聚焦式学习网络的提示部分。在解码部分,RGB外观信息、光流运动信息、粗粒度特征和细粒度特征逐步融合,以此模仿人类视觉系统,实现聚焦式学习目标特征的过程。在3个标准数据集上进行了大量的测试,实验结果表明,与现有的模型相比,所提出的模型拥有更优异的性能。

    基于表观token和标志点token的头影解剖标志点定位模型
    陆刚, 肖金梅, 王向文, 蒋芸, 蔺想红
    2025, 47(02): 308-316. doi:
    摘要 ( 61 )   PDF (1195KB) ( 97 )     
    目前,已有的深度学习模型还无法准确、可靠地定位出2D头影X射线图像上的解剖标志点。为此,提出了一种用于头影测量的基于表观token和标志点token定位的模型。首先,从原始图像中采样出分辨率不同但大小固定的图像块;其次,将图像块输入到特征提取网络中提取多尺度特征;再次,通过线性投影将多尺度特征转换成表观token,将其与标志点token一起输入到关系推理层中,让标志点token在推理层中学习其与表观token间的内在关系;最后,经过多次迭代推理,令初始点以级联的方式逐步向目标移动。与先进的基线模型相比,所提出模型在公开头影X射线图像上表现出更优越的性能。

    改进ESP-YOLO的PCB缺陷检测算法
    王海群, 王炳楠, 葛超
    2025, 47(02): 317-326. doi:
    摘要 ( 60 )   PDF (1093KB) ( 126 )     
    PCB板的缺陷检测是保证其质量的重要手段。为了避免漏检、误检现象的发生,并提高PCB缺陷检测速度,提出了一种改进ESP-YOLO的PCB缺陷检测算法。引入ESP网络结构,通过ESPblock实现下采样,并改进特征提取模块,采用更轻量的网络结构实现特征提取,解决PCB缺陷检测模型较大并且难以部署的问题;引入一种无参数注意力机制SimAM,在不增加网络参数的同时提高复杂环境中算法对目标的关注度,解决由于背景复杂导致的PCB缺陷漏检问题;引入RFB多尺度特征提取模块,扩大算法感受野并提高多尺度特征提取能力,解决由于缺陷大小差异导致的漏检问题;引入可学习参数特征融合模块BiFPN,提高融合特征图的特征表达能力。实验结果显示,ESP-YOLO算法的参数量和GFLOPs分别为5.32×106和11.2,相比YOLOv5s算法分别降低了23.8%和29.1%;平均精度为97.8%,相比于原YOLOv5s算法提升了3.2%。

    人工智能与数据挖掘
    基于多层次密度中心图的聚类算法
    卢建云, 邵俊明
    2025, 47(02): 327-335. doi:
    摘要 ( 61 )   PDF (1852KB) ( 100 )     
    密度聚类是一种依据数据对象之间的密度关系进行聚类的算法。密度聚类通过判断数据集中低密度对象与密度中心对象的隶属关系实现对数据集的划分,能够有效地处理数据集中各种大小、不同形状和密度的簇。然而,受到数据集变密度、噪声和复杂分布的影响,如何准确估计数据对象的局部密度并通过密度中心确定聚类数目仍是需要研究的问题。针对上述密度聚类问题提出一种多层次密度中心图的聚类算法CMDCG。首先,基于每个数据对象的邻域,利用信息熵计算其局部密度;其次,依据局部密度和邻域空间确定每个数据对象的隶属关系并确定密度中心;最后,通过变化邻域空间得到多层次密度中心,根据多层次密度中心的隶属关系构建图结构,得到图的连通分量即为初始聚类,其他数据对象根据隶属关系划归到对应的初始聚类。在人工和真实数据集上的实验结果表明,CMDCG算法能够准确地识别聚类数目并形成正确的初始聚类,算法对变密度和噪声情况下的数据集有很好的鲁棒性。

    基于上下文全局空间图的轨迹用户链接
    侯萱, 梁志贞, 张磊, 刘佰龙, 张雪飞
    2025, 47(02): 336-348. doi:
    摘要 ( 35 )   PDF (2388KB) ( 93 )     
    轨迹用户链接TUL是指判定目标轨迹所属用户,已成为一项重要的轨迹数据挖掘任务。尽管基于深度学习的模型在TUL研究中取得显著进展,但现有模型主要关注单个轨迹点的基本时空特征,忽略全局位置空间相关性、上下文信息和用户的多周期移动规律,导致TUL结果准确度不高。提出了一种基于上下文全局空间图的轨迹用户链接模型CGSG-TUL。在位置嵌入方面,根据历史轨迹构建上下文全局空间图,融入所有位置的邻近关系和类别等上下文信息,对位置的空间相关性有效建模。在时间编码方面,根据不同时间尺度对签入的时间戳进行编码,捕获用户的多周期移动规律。在Foursquare-NYK和Foursquare-TKY这两个真实数据集上的实验结果表明,CGSG-TUL性能比目前最好的基准模型GNNTUL的ACC@1和Marco-F1分别平均提高2.50%和2.72%。

    基于多源知识注入的常识问答方法研究
    朱嘉骏, 包美凯, 张凯, 刘烨, 刘淇
    2025, 47(02): 349-360. doi:
    摘要 ( 55 )   PDF (1404KB) ( 95 )     
    常识问答任务致力于让模型回答人类常识问题。针对该任务的一类方法是检索相关的知识来辅助模型回答常识问题。该类方法主要分为知识查询和知识推理2个步骤。知识查询是指根据问题检索到与之相关联的知识,而知识推理是指利用检索到的知识辅助回答常识问题。对此,常识问答面临的一个挑战是如何找到合适的外部知识来帮助回答问题。现有的许多常识问答模型通常依赖于单个外部知识源,但鉴于常识知识的广泛性和多样性,单一来源很难全面覆盖所需的所有知识。针对这一问题,提出了一种基于多源知识注入的常识问答方法。首先,在知识查询过程中为了应对知识覆盖度问题,利用预训练语言模型整合来自多个来源的知识(包括结构化和非结构化的知识),形成统一的知识表征;其次,在知识推理过程中为了充分利用结构化知识蕴含的语义关系,模型识别文本中的实体概念和实体之间的关系路径从而构建实体关系图,然后,利用图注意力网络对实体关系图建模;最后,利用实体关系图和实体知识表征中的证据信息对问题进行推理和解答。所提方法经预训练得到的模型在CommonsenseQA数据集上的测试结果显示,基于多源知识注入的常识问答方法在验证集和测试集上的准确率分别达到79.20%和75.02%,超过了最好的基线模型。实验结果表明了多源知识注入方法在常识问答任务中的有效性。

    基于双通道异质超图神经网络的引文推荐方法
    李瑞红, 李晓红, 姚锦, 王闪闪
    2025, 47(02): 361-369. doi:
    摘要 ( 63 )   PDF (839KB) ( 116 )     
    针对现有引文推荐方法侧重于使用图结构建模二元关系,对节点类型和交互关系的多元化及多样性表示不足的问题,提出了基于双通道异质超图神经网络的引文推荐方法。首先,构建异质图,利用卷积神经网络和Transformer分别编码异质图中各个节点的局部和全局语义特征,获得异质图通道上关于目标节点的结构表征。其次,设计多种类型的超边,扩展异构数据信息。再次,使用超图编码节点间的交互,并利用超图神经网络捕获超图中潜在的复杂高阶语义关系,获得超图通道上关于目标节点的语义表征。最后,聚合2个通道上的信息,得到目标节点的最终语义表示,并计算目标论文节点与候选论文节点间的相关性,生成引用文献推荐列表。在DBLP和PubMed数据集上的实验结果表明,所提出的方法能有效提升引文推荐的质量,获得较好的推荐结果。

    基于自然邻域图划分的层次聚类算法
    蔡发鹏, 冯骥, 杨德刚, 陈仲尚
    2025, 47(02): 370-380. doi:
    摘要 ( 69 )   PDF (3115KB) ( 89 )     
    自然邻域图能自适应地识别不同形状、大小和维度的数据,但在面对密度不均匀且结构复杂的数据时,部分小簇无法被算法正确识别。针对这一问题,提出一种基于自然邻域图划分的层次聚类算法HC-PNNG。HC-PNNG算法首先利用自然邻居关系实现了自然稀疏图的构建,随后利用基于自然稀疏图的图间相似度完成了自然稀疏图的层次化合并,进而实现了更具普适性的层次化聚类结果。在合成数据集和真实数据集上将HC-PNNG与最新的聚类算法进行了对比实验,结果表明该算法明显优于其他聚类算法,验证了HC-PNNG算法的有效性。

期刊收录

  • 中文核心期刊
  • 中国科技核心期刊
  • 中国科技论文统计分析源期刊
  • 中国科学引文数据库(CSCD)扩展期刊
  • 中国学术期刊综合评价数据库来源期刊
  • 中国期刊网全文入编期刊
  • 中国知网(CNKI)电子版全文入编期刊
  • 万方数据库全文入编期刊
  • 英国《科学文摘》(INSPEC)收录期刊
  • 《日本科学技术振兴机构数据库(中国)》(JSTChina)收录期刊
  • 美国《史蒂芬斯全文数据库》(EBSCOhost)收录期刊
  • 美国《乌利希期刊指南(网络版)》(UlrichsWeb)收录期刊

本刊声明

    1. 本刊实行同行专家匿名评审制度。

    2. 本刊所发作品仅为作者观点,不代表编委会或编辑部的立场。

    3. 本刊对所发作品享有中文专有出版权,请勿一稿多投。

    4. 本刊对来稿保留修改权,有特殊要求者,请事先声明。

    5. 本刊不以任何形式收取版面费。

    6. 本刊对所发论文享有汇编权、翻译权、电子出版权及信息网络传播权、转让权,如有异议,请事先声明。

专题栏目 更多...

联系我们

    办公地点:中国湖南省长沙市开福区德雅路109号
    邮  编:410073
    电  话:0731-87002567
    E-mail : jsjgcykx@vip.163.com
    网  址:http://joces.nudt.edu.cn