Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2025年第9期目录
    2025, 47(9): 0-0. doi:
    摘要 ( 150 )   PDF (250KB) ( 85 )     
    高性能计算
    芯粒互联接口中多协议支持技术及标准化研究
    何星洋1, 2, 周宏伟1, 2, 周雨萱1, 2, 孙玉波3, 黎梦金1, 2
    2025, 47(9): 1521-1534. doi:
    摘要 ( 239 )   PDF (5213KB) ( 186 )     
    通过芯粒集成构建更大规模的芯片成为后摩尔时代突破芯片工艺墙、存储墙、功耗墙和扩展性墙的有效手段。 制定芯粒互联接口规范是实现异构芯粒集成的前提,对于简化芯粒适配、提高芯粒和芯粒互联接口复用和加速多芯粒SoC芯片设计具有重要意义。 由于不同类型的芯粒在协议层采用不同的协议标准,芯粒互联接口需要支持多个协议。 为此,提出一种按大类支持的多协议支持技术,将协议根据其报文特点分为两类,一类为符合固定模式特点的协议,另一类为符合流模式特点的协议。该技术可以直接支持符合这两类报文特点的协议,对不符合这两类的报文类型则通过“原生模式”间接支持。该技术还支持任意两个协议并发并且可以更高效地支持CXL和UCIe。该技术通过微包级兼容技术提高了对各种协议间接支持的效率,通过把链路管理信息在数据负载中的填充交由协议层负责实现了协议层与适配器层彻底解耦。 在此基础上,设计了支持PCIe和CXL.mc协议并发执行的芯粒互联接口,搭建了仿真验证环境。 实验结果表明了所提技术支持多个协议和支持多协议并发的可行性和正确性。

    基于多源日志语义分析的异构超算平台作业故障识别
    胡鹤1, 赵毅1, 顾蓓蓓1, 2, 赵芸卿1
    2025, 47(9): 1535-1543. doi:
    摘要 ( 118 )   PDF (1179KB) ( 96 )     
    为了充分利用高性能计算环境资源并提升作业完成效率,提出了一种面向大规模分布式高性能异构平台的作业故障识别方法,通过对作业运行时的日志数据进行分析来发现异常。然而,海量的日志数据对人类而言缺乏直观性,难以快速理解。因此,基于多源日志语义分析,利用潜在狄利克雷分布主题LDA模型对作业运行过程中多个来源的日志进行语义分析,构建主题随时间变化的序列模型,并通过与历史故障作业的序列模型进行匹配,实现对作业异常的预测。在某国产异构高性能计算平台上开展的实验结果表明,所提方法在作业异常识别方面表现优异,识别精度高达95.2%。该方法不仅增强了作业异常的预知能力,还能够协助用户和系统管理员快速定位异常原因,从而显著提升了高性能计算环境的可用性。

    MIMD众核架构ILU分解并行算法优化研究
    石永振1, 2, 莫淏天1, 2, 胡星宇1, 2, 刘杰1, 2, 王庆林1, 2
    2025, 47(9): 1544-1554. doi:
    摘要 ( 146 )   PDF (1169KB) ( 98 )     
    ILU分解被广泛应用于求解大规模稀疏线性系统,能够有效减少迭代次数、提高求解效率,但限于线性系统的数据依赖性和分解过程中计算访存的不规则,较难进行高效的并行优化。多指令多数据(MIMD)众核架构中众多并行计算线程可以执行不同的指令,对于控制流不规则的算法具有天然的适应性。基于MIMD众核架构PEZY-SC3s处理器开展ILU分解并行算法优化研究,提出了一种面向MIMD架构的ILU并行算法,并采用基于图着色的并行性优化、基于向量单元的访存优化、基于线程分组的负载平衡优化以及基于片上局部存储的数据局部性优化等措施来优化算法性能。实验结果表明,所提ILU并行分解算法与Intel Xeon 4314 CPU上MKL实现和NVIDIA A30 GPU上cuSPARSE实现相比,分别获得了16.70与1.39的平均加速比。

    面向偏微分方程求解的存内计算电路及宏单元设计
    王景可, 谢艾森, 常亮
    2025, 47(9): 1555-1562. doi:
    摘要 ( 111 )   PDF (1727KB) ( 151 )     
    为了应对在自然科学和工程领域中遇到的高精度偏微分方程求解的计算挑战,提出了一种基于存内计算(CIM)架构的新型偏微分方程求解系统。该求解系统基于存内计算技术,通过将计算逻辑直接嵌入存储器中,显著减少了处理器与存储器间的数据传输需求。详细分析了偏微分方程求解的计算过程,提取关键的计算流程,并转化为适合于存内计算的矩阵乘法和累加运算。通过设计针对CIM架构的并行计算方案和相应的行为级模型,进一步开发和测试了硬件实现方案。通过与传统CPU的计算结果进行对比,验证了所提设计的正确性和高效性。 实验结果显示,在处理二维泊松方程和波动方程等偏微分方程时,所提设计对于二维方程的求解精度超过98%,对于一维方程的求解精度达到99.8%,并且求解速度相比CPU的提高了76倍。

    CPWS:一种基于检查点的GPGPU多级warp调度器
    姜泽坤, 原博, 崔剑峰, 黄立波, 常俊胜, 刘胜
    2025, 47(9): 1563-1570. doi:
    摘要 ( 128 )   PDF (2089KB) ( 200 )     
    通用图形处理器(GPGPU)使用单指令多线程(SIMT)模型,该模型允许大量线程同时执行同一指令,从而显著提高计算效率。在SIMT模型中,GPGPU将一组线程组织成名为线程束(warp)的逻辑执行单元。由于硬件必须在多个warp之间进行时分复用,所以warp调度是实现高效并行计算的关键。通过添加新的检查点指令,设计并实现了一种基于检查点的多级warp调度器CPWS。CPWS能够跟踪每个warp的执行进度,并根据该进度动态调整其调度策略,整体硬件开销较低。实验表明,CPWS的性能与贪婪调度器(GTO)的相比提高了11%,与松散轮询调度(LRR)的相比提高了16.7%,与两级轮询的相比提高了10.6%。此外,通过在FPGA上的综合结果表明,CPWS相比GTO增加的逻辑单元开销仅为0.8%。

    计算机网络与信息安全
    针对无线网络的变权重多属性决策算法
    袁鑫1, 刘云彦2, 马亮3, 宋野4, 李宁1, 郭霖旭5, 张兆心1, 于昌利1
    2025, 47(9): 1571-1585. doi:
    摘要 ( 131 )   PDF (1068KB) ( 120 )     
    在路由决策、云计算、数据中心网络、网络选择和边缘计算等无线网络的应用中,多属性决策MADM算法因其可以有效地解决多目标决策问题而被广泛应用。然而,在现代无线网络中,传统MADM算法的性能不能很好地满足在业务流快速、连续和大规模的无线网络场景的需求。基于此,提出了iMADM和变权重MADM算法(vw-MADM),相较于传统算法,vw-MADM算法更加简单且有效。在vw-MADM算法中,当其中一个参数发生变化时,只需要计算该参数的效用,且其他候选参数的效用不受影响,其创新在于提高精度的同时降低了计算复杂度。此外,对所提出的vw-MADM算法和iMADM算法进行了评估,包括合理性、有效性、计算复杂度、参数和效用的变化阈值等。实验仿真结果表明,所提出的vw-MADM算法在精度、计算复杂度和合理性方面均优于传统MADM算法和iMADM算法,证明了所提算法能够显著提高MADM的性能。

    对抗性仲裁器物理不可克隆函数真的安全吗
    姜昊霖1, 2, 3, 邓丁1, 2, 3, 倪少杰1, 2, 楼生强1, 2, 3, 孙鹏跃1, 2, 3, 张书政1, 2, 3
    2025, 47(9): 1586-1597. doi:
    摘要 ( 93 )   PDF (1356KB) ( 119 )     
    物理不可克隆函数PUF是一种在身份认证领域极具潜力的安全原语,针对不同的PUF提出相应的攻击模型,可以促进PUF不断完善结构设计,提高安全性。A-APUF是2021年提出的一种安全PUF,宣称能有效抵御建模攻击。针对A-APUF,提出了一种基于双向激励序列求解的攻击模型。首先,向A-APUF施加双向激励序列得到双向响应序列,进而计算控制序列;其次,利用控制序列计算异或抽头系数;最后,根据异或抽头系数将A-APUF破解为APUF。实验结果表明,所提出模型对普通保护机制和升级保护机制下的A-APUF均有效,可以将攻击难度降低为普通APUF水平。采用传统的前馈神经网络仅需约1 000个激励响应对,即可对A-APUF达到90%以上的预测准确率。

    面向分类器进行特征加权的Android恶意软件检测
    熊智1, 2, 刘芳1, 王逸轩1
    2025, 47(9): 1598-1608. doi:
    摘要 ( 102 )   PDF (1007KB) ( 92 )     
    特征加权可以提供更综合的信息增强模型的学习能力和决策准确性,但在实际运用时往往忽视了特征与分类器之间的相互关系。针对这一问题,提出一种面向分类器的特征加权法COFW,并将其应用于Android恶意软件检测。首先从Android应用程序包中提取7个类别的特征,并挑选出最重要的特征子集;其次根据检测恶意软件所使用的分类器,采用COFW为该分类器计算每个特征的最优权重;最后采用加权后的特征训练该分类器。COFW采用去一法为每个特征计算初始权重,然后通过一个映射函数将其映射为最终权重,并采用差分进化算法优化映射函数和分类器的参数。实验结果表明,运用COFW进行特征加权能够提升分类器的性能,并且COFW的性能优于其他4种为Android恶意软件检测设计的特征加权法。

    基于区块链和属性基加密的用户分类分级访问控制模型
    尹晓帆1, 李晓会1, 张思琪2
    2025, 47(9): 1609-1617. doi:
    摘要 ( 131 )   PDF (1280KB) ( 259 )     
    针对用户的理财数据发布隐私保护方法,利用联盟链多方维护的特点,采用链上链下相结合的方式,减少存储开销,由用户自定义访问策略,采用属性基加密技术实现用户分类分级的访问控制。该方案提出一种基于属性基加密的用户分类分级访问控制模型,该模型采用链上和链下相结合的形式,利用基于属性的访问控制模型,采取密文策略的属性加密,将声誉激励机制嵌入智能合约中,根据用户的上传和查询操作自动修改信任积分,根据数据请求者的信任积分对其进行分类分级的操作,从而实现让不同级别的用户拥有不同的访问数据权限,既能保证数据的安全性,又能保证用户访问数据时的灵活性。

    图形与图像
    LwFEN:一种无监督行人再识别的轻量特征提取网络
    高顺强1, 王智文1, 白云2
    2025, 47(9): 1619-1627. doi:
    摘要 ( 115 )   PDF (4525KB) ( 82 )     
    针对无监督行人再识别模型计算成本高、模型参数量大的问题,提出一种无监督行人再识别的轻量化特征提取网络。首先,重新设计Ghost Bottleneck,实现模型参数量的压缩,并将ECA注意力模块嵌入到轻量级骨干网络中以提高性能,加强网络的特征提取能力,解决因轻量化而导致的特征丢失问题。其次,引入了集群级动态内存字典和动量更新策略,解决无监督聚类特征的嵌入,有助于缓解特征不一致问题。最后,在数据集LUPerson上进行预训练。在常用的Market-1501,MSMT17和PersonX等公共数据集上开展了大量实验验证。与PPLR,Cluster Contrast和RTMem等方法训练的模型的比较结果表明,LwFEN使模型的参数量下降了24.3%,计算量(以FLOPs衡量)下降了28.12%,并将模型的mAP提升至83.4%。
    轻量级网络;无监督行人再识别;动态内存字典;动量更新

    基于特征解耦的双流网络模型全色锐化
    张胜裕1, 2, 3, 宋慧慧2, 3, 4
    2025, 47(9): 1628-1637. doi:
    摘要 ( 99 )   PDF (2797KB) ( 72 )     
    全色锐化的目的是将同一卫星生成的高分辨率全色图像和低分辨率多光谱图像融合起来,以生成高分辨率的多光谱图像。现有模型在融合多模态信息时未能充分挖掘不同模态之间的关联性和互补性,导致其未能充分发挥多模态信息的优势,影响全色锐化的质量。为了解决跨模态特征提取和融合不充分的问题,提出一种基于特征解耦的双流网络模型,从全色图像和多光谱图像中捕获到更丰富的特征信息。具体而言,该网络模型首先利用编码器将全色图像和多光谱图像的特征解耦为全局特征和局部特征,从而提高模型捕捉长程依赖和局部细节的能力。然后跨模态融合模块对这些特征进行域内和域间融合,使模型能够在不同层次上学习到更加丰富和全面的特征表示。接着,渐进融合模块逐步融合全局特征和局部特征,以获取更准确的特征表示。最后,将融合后的特征送入解码器生成高分辨率多光谱图像。在高分-2和WorldView-3上的实验结果表明,所提出的网络模型相较于许多现有的模型更具有优越性。

    一种适合大面积破损图像的多重修复网络
    李志鹏1, 陈丹阳1, 2, 钟诚1, 2
    2025, 47(9): 1638-1646. doi:
    摘要 ( 155 )   PDF (1264KB) ( 76 )     
    为了修复大面积破损图像,提出了一种新的多重修复网络模型。首先该模型通过增加特征修复环节减少了修复错误在网络上采样过程中的积累;其次提出多尺度修复模块(MSRM),该模块能够综合不同视野的信息对特征图进行补全;然后利用注意力机制对修复块进行优化,解决了由不同区域修复程度不同导致的输出图像各区域色彩不协调问题;最后对损失函数进行改进,使模型更加注重对图像破损区域的修复。实验结果显示,在Places2和CelebA数据集上的修复图像的质量均有不同程度的提升,并且随着图像缺失像素比例增大,提升效果更加明显。

    基于Transformer的逐像素细节补偿去雾网络
    王燕, 刘晶晶, 胡津源, 陈燕燕
    2025, 47(9): 1647-1657. doi:
    摘要 ( 147 )   PDF (3767KB) ( 111 )     
    目前,基于深度学习的图像去雾算法难以同时提取图像的全局特征和局部特征,导致复原后的图像细节信息丢失,存在颜色失真现象。针对这一问题,提出一种基于Transformer的逐像素细节补偿去雾网络,主要由基于Transformer的编码器-解码器和CNN分支构成。输入有雾图像,通过编码器进行全局特征提取,编码器中的Transformer由通道自注意力块CAB、压缩注意力块CANB和双分支自适应块DANB组成,其中CANB通过特征聚合、注意力计算和特征恢复捕获图像超像素全局依赖性,DANB采用双分支结构将超像素全局依赖性封装到单个像素中,得到全局特征信息;同时,CNN分支中的空间注意力能够提高网络对不同雾度的感知能力,进行局部特征提取;最后,在解码器部分将编码器和CNN分支提取到的特征进行融合,输出清晰图像。实验结果表明,提出的网络在合成数据集RESIDE和真实数据集O-HAZE与NH-HAZE上均表现突出,能够有效解决细节特征丢失和颜色失真问题。

    人工智能与数据挖掘
    一种安全低功耗的无人机避障方法研究
    万众1, 陈任之1, 张翔宇2, 徐 实1, 赵静月1, 艾勇保1, 杨智杰1, 王蕾1
    2025, 47(9): 1658-1668. doi:
    摘要 ( 168 )   PDF (1718KB) ( 261 )     
    为实现高速敏捷自主飞行,需要提高无人机续航时间、降低指令传递延迟和增强无人机快速反应能力。同时,在复杂场景下,无人机对障碍物检测信息依赖性强,各种误差会降低其飞行安全性。基于以上问题,通过预定义规则的局部规划避障方法做出避障策略,分别基于卡尔曼滤波算法与贝叶斯线性回归模型对避障方法进行优化,实验结果表明,基于贝叶斯线性回归模型的方法比基于卡尔曼滤波算法的方法预测速度快2.8倍,不仅提高了预测效率,还保证了较高的预测精度和稳定性。同时,为得到既低功耗又能保证安全的避障速度,将避障速度作为决策变量,续航时间与置信度作为目标向量,通过寻找膝点的方式求得续航时间与置信度折中损耗最小的点,提供最优的避障速度。最后,在无人机避障环境中,对改进后的基于局部规划的避障方法进行仿真验证。仿真结果显示,无人机能够对动态障碍物做出及时躲避,与相同实验环境的避障方法相比,总时间延迟平均降低了约7%。

    求解异构带容量车辆路径问题的带有注意力协作机制的分层解码器模型
    郑明杰, 曹霑懋
    2025, 47(9): 1669-1678. doi:
    摘要 ( 96 )   PDF (772KB) ( 144 )     
    现有求解带容量车辆路径问题(CVRP)的深度强化学习(DRL)方法主要用于处理同构车队,即车队都具有相同容量。然而,在面对更贴近现实的异构车队时,现有的DRL方法效果不佳。以最小化路径长度为目标,提出一种新型的DRL模型,用于求解具有不同容量约束的异构带容量车辆路径问题(HCVRP)。具体来说,提出一种由2类解码器构成的分层解码器模型(HDM):路由分配解码器(RAD)和序列构建解码器(SCD)。RAD将节点分配给合适的车辆以形成若干的组,SCD则对组内的节点顺序进行构建,以最小化总路径长度。此外,还设计了一种注意力协作机制(ACM),旨在促进SCD之间的信息共享,以优化各组节点顺序,从而提高整体解决方案的质量。实验结果表明,HDM模型超越了现有的最先进的深度学习方法,能够在合理的时间内提供与传统优化求解器相当的解决方案。

    多策略改进的山地瞪羚优化算法及其应用
    李想1, 刘杰2, 覃涛1, 李伟3, 刘影4, 杨靖1, 5
    2025, 47(9): 1679-1690. doi:
    摘要 ( 85 )   PDF (1278KB) ( 94 )     
    针对山地瞪羚优化算法(MGO)收敛速度慢、收敛精度低和易陷入局部最优等问题,提出一种使用多策略改进的山地瞪羚优化算法MSIMGO。首先,采用佳点集初始化种群,提高初始种群质量;其次,融合黄金正弦策略提高收敛速度;然后,引入涡流效应改善后期种群多样性降低的情况;最后,采用柯西变异对最优瞪羚的位置进行扰动,提高了算法跳出局部最优的能力。通过与8种算法对8个基准测试函数和CEC2019基准测试函数进行寻优对比,结果表明MSIMGO具有更强的寻优能力,并且使用Wilcoxon秩和检验验证了MSIMGO的有效性。将MSIMGO应用于工程问题压力容器设计,结果表明MSIMGO处理实际工程问题的可行性和有效性。

    一种针对固定故障的忆阻神经网络容错方案
    程其宏1, 刘鹏1, 姚廉1, 尤志强2, 武继刚1
    2025, 47(9): 1691-1699. doi:
    摘要 ( 139 )   PDF (1086KB) ( 165 )     
    电阻式随机存取存储器RRAM以其非易失性、低延时等特性,在高效实现向量矩阵乘法运算的同时避免了大量的数据传输,因此在加速神经网络计算方面表现出巨大的潜力。然而,固定故障SAF会导致基于RRAM的神经网络的推理精度严重下降。提出了一种针对SAF的容错方案,包括权重映射变化、权重范围变化和损失函数正则化等方法,以尽可能减小由SAF引入的权重偏差。通过在不同神经网络上应用图像识别任务进行综合评估,实验结果表明,所提出的容错方案能够有效恢复由SAF造成的精度损失,即使在10%SAF的条件下,平均精度损失不超过1.5%。

    基于MMD-GA的深度学习测试集优化约简
    王凤英1, 2, 宋子凯2, 张岩1, 杜利明1
    2025, 47(9): 1700-1710. doi:
    摘要 ( 100 )   PDF (1651KB) ( 185 )     
    在图像识别领域,测试用例冗余且标记标签仍需人工操作,对测试用例进行优化是解决测试代价高昂、测试效率低下的有效方法。基于此,提出一种基于进化算法的测试用例优化约简方法—ERIR,使用深度神经网络模型提取图像特征,代入HDBSCAN聚类算法分析原始测试集数据分布,在聚类结果的基础上以最小化测试子集与原始分布为目标设计进化算法。提出了基于最大均值差异与遗传算法融合的测试用例挑选算法—MMD-GA,能够在每个聚类簇中挑选出最具有代表性的原型构成测试子集。应用该算法在CNN结构和Transformer结构模型上进行了大量实验,结果显示挑选出的测试输入在提升时间效率的基础上保证了准确率接近原始测试集,对比整体测试集准确率平均误差在0.18%~2.32%。