Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2025年第5期目录
    2025, 47(5): 0-0. doi:
    摘要 ( 162 )   PDF (248KB) ( 170 )     
    高性能计算
    面向国产芯片的可复现矩阵分解
    唐滔, 姜浩, 彭林, 漆海俊, 鲁轻风
    2025, 47(5): 761-774. doi:
    摘要 ( 231 )   PDF (2901KB) ( 394 )     
    浮点程序的可复现性是指相同的浮点程序在多次不同的运行中得到按位完全相同的数值结果,这对程序调试或数值结果的正确性检验具有重要意义,在数值仿真模拟领域应用广泛。然而,浮点计算的结果往往受到计算顺序的影响,因而指令的动态调度和乱序执行使得浮点计算的精确可复现成为一个挑战。矩阵分解算法在数值仿真应用中有着非常广泛的应用背景,基于可复现的矩阵分解算法可有效提升精度敏感的数值仿真应用的调试和结果分析的效率。基于无误差变换技术,在可复现BLAS库的基础上实现了分块LU分解、Cholesky分解和QR分解3个可复现矩阵分解算法,并在国产处理器上进行了验证。实验结果表明,可复现矩阵分解算法具备良好的数值精确性和可复现性。

    面向算力网络的跨集群数据迁移系统的设计和实现
    李俊哲, 付振新, 杨宏辉, 马银萍, 李若淼, 樊春,
    2025, 47(5): 775-786. doi:
    摘要 ( 215 )   PDF (1971KB) ( 1799 )     
    在算力网络的建设中,如何在不同地域算力中心的集群之间进行高效可靠的数据迁移,是影响算力网络建设成功与否的关键研究课题。鉴于此,设计并实现了基于RSYNC的高性能传输软件SCOW-SYNC。首先,SCOW-SYNC采用队列和线程池架构,对传统的RSYNC进行了优化,通过并行建立多个TCP连接和并行传输,提高了带宽利用率。此外,SCOW-SYNC还支持大文件自动切分、动态压缩、后台运行、进度实时查询和SSH连接池管理等功能。经测试,SCOW-SYNC相比RSYNC能够达到125%~130%的加速比。其次,为了提高传输的安全性,面向算力中心提出了一套可靠的跨集群传输系统架构,数据传输仅在“传输节点”之间发起,使用“传输密钥”进行加密,该密钥由“管理节点”负责动态检查、生成和分发。最后,将SCOW-SYNC集成到高性能计算门户和管理平台SCOW中,实现了SCOW的跨集群传输模块,使得用户可以通过浏览器在不同集群之间进行高性能的数据迁移,并通过容器化技术部署到了北京大学跨集群环境中,提高了生产效率。

    用于低间隔加速部件控制的多线程无中断RISC-V处理器
    张伟伟, 陈虎
    2025, 47(5): 787-796. doi:
    摘要 ( 171 )   PDF (1591KB) ( 467 )     
    为满足控制低间隔加速部件的需求,提出了一种多线程无中断的RV32I微处理器(MIRV)结构和相关软件系统。MIRV采用六级流水线单发射顺序执行结构,结合数据重定向技术解决了线程内指令间的大部分数据冲突问题。硬件支持4个线程的寄存器组和程序计数器,采用粗粒度线程调度机制,能够在线程内数据冲突和控制冲突无法解决时实现零时间开销的线程切换。还提出了硬件与软件统一的信号机制,利用特定CSR寄存器实现线程对外部加速部件信号的等待和快速唤醒,通过软件信号处理实现多线程同步与互斥。MIRV综合后包含1 811个LUT,主频为210 MHz。与PicoRV32和DarkRISCV相比,MIRV主频较高且拥有较为优秀的性能。在MK7160FA开发板上使用C语言实现了基于生产者-消费者模型的流水灯控制测试案例,在该实验中,从硬件定时器发出信号到软件产生外部LED的控制信号仅需要10个时钟周期,验证了MIRV对外部硬件事件信号的低延迟响应能力。MIRV具备较低的硬件资源占用量、优异的性能和高级语言编程能力,可作为多种低间隔加速部件的控制器。

    面向数据密集型应用的近数据处理架构设计
    谢洋, 李晨, 陈小文
    2025, 47(5): 797-810. doi:
    摘要 ( 201 )   PDF (2267KB) ( 439 )     
    大数据时代,多核处理器在处理数据密集型应用时,面临着数据局部性低、访存延迟高和内核计算效率低等挑战。近数据处理对于降低访存延迟、提高内核计算效率具有重要潜力。设计了一种计算访存松耦合的近数据处理架构(LcNDP),部署在多核处理器的共享缓存端和内存端。一方面通过迁移内核的访存任务,实现内核计算与访存的并行,隐藏访存开销;另一方面通过近数据计算单元,处理流数据计算,降低内核计算量和访存开销。实验结果表明LcNDP相较于传统多核架构,平均延迟降低了43%,与传统近数据处理的多核架构相比平均延迟降低了23%。

    一种新型低开销抗三节点翻转的锁存器设计
    徐辉, 唐琳, 马瑞君, 梁华国, 黄正峰
    2025, 47(5): 811-822. doi:
    摘要 ( 162 )   PDF (2365KB) ( 339 )     
    在先进纳米级半导体工艺下,晶体管特征尺寸的持续缩小以及集成度的提高导致辐射诱发的三节点翻转愈发显著。为降低辐射粒子对电路可靠性的影响,基于双模冗余技术,采用瞬态脉冲的翻转极性原理和输入分离反相器相结合的互锁设计方式,提出了一种新型低开销抗三节点翻转的NLC-TNUTL锁存器。通过HSPICE仿真和PVT波动分析证明,与具有同等容错能力的最新加固锁存器相比,所提出的锁存器具有较低的功耗、延迟和更小的面积开销;同时,该锁存器对阈值电压、电源电压和温度变化的敏感度适中,具有良好的成本效益。

    计算机网络与信息安全
    面向多层递归域名系统的自适应缓存管理方法
    陈楚依, 罗雄飞, 鄢宝彤, 冯宇轩, 马可, 乔颖
    2025, 47(5): 823-831. doi:
    摘要 ( 170 )   PDF (1773KB) ( 365 )     
    域名系统是互联网的核心基础设施,其服务的质量与效率直接影响着互联网的运行情况。为了优化域名系统性能,提高域名解析效率,提出一种面向多层递归域名系统的自适应缓存管理方法,能够根据DNS流量的变化,动态调整域名服务器的缓存内容,从而提高域名系统的缓存命中率,缩短域名解析时间。实验表明采用自适应缓存管理方法的多层递归域名系统,相比于传统多层递归域名系统,具有更高的缓存命中率和更短的DNS响应时延,取得了良好的加速效果。
    扩展汉明码下二级QR码信息隐藏方案
    张丽娜, 辛鹏, 侯明会, 刘苗, 岳恒怡
    2025, 47(5): 832-842. doi:
    摘要 ( 186 )   PDF (1761KB) ( 218 )     
    快速响应码QR code是一种二维条形码,具有解码速度快、纠错能力强等优点,已广泛应用于生活中的各个领域。然而,因为QR码公开的编码规则,当把QR码作为传输秘密信息的载体时,以往的部分相关方案中存在泄露秘密信息以及载荷量受限的问题。为了解决此类问题,提出一种新的QR码信息隐藏方案。该方案结合数独矩阵设计了一种新的映射函数,并对传统的(7,4)汉明码进行扩展,设计出对应的翻转规则表。在确保正确解读 QR 码公共信息的基础上,实现了更高的破解难度和更大的信息隐藏容量。实验分析表明,所构造的码字映射函数能够防止攻击者根据载体QR码破解秘密信息。与现有的隐写方案相比,该方案在嵌入载荷量和破解难度系数上均有所提高。

    基于GATv2-TCN联合优化的WSN数据流异常检测算法
    苏宇杭, 马俊, 樊津瑜, 陈博行, 周家城, 尹博然
    2025, 47(5): 843-850. doi:
    摘要 ( 199 )   PDF (1096KB) ( 191 )     
    在传感器网络中,通过对数据流进行异常检测能够及时发现故障并报警,以确保系统安全可靠运行。然而WSN数据流异常检测仍面临2大难题:1)不同时间序列间复杂的相关性有待深入挖掘;2)在正常/异常样本分布极度不平衡的数据集中异常样本不易检出。提出一种基于GATv2-TCN的异常检测算法。采用GATv2和TCN来建模特征和时间维度的复杂关系,并优化预测和重构模块。采用4个数据集对所提算法进行性能验证与分析。实验结果表明,所提算法获得了较高的F1和AUC,特别是在不平衡的数据集中各项指标均高于基线模型,具有较好的WSN数据流异常检测效果。

    基于双曲图卷积神经网络的切片级漏洞检测方法
    陈旭, 陈子雄, 景永俊, 王叔洋, 宋吉飞
    2025, 47(5): 851-863. doi:
    摘要 ( 200 )   PDF (990KB) ( 697 )     
    针对源代码漏洞检测领域中存在的挑战,特别是现有方法在代码图精准嵌入和捕获其复杂层次结构方面的不足,提出了一种创新的基于双曲图卷积神经网络的切片级源代码漏洞检测方法VulDHGCN。该方法融合了图卷积神经网络和双曲几何的强大表达能力,更全面地嵌入和保留了源代码的结构特征,有效降低了代码图嵌入过程中的信息失真。为了全面评估VulDHGCN的有效性,选择了3种传统的基于规则的静态漏洞检测方法和3种先进的基于模型的漏洞检测方法作为对比基线方法。实验结果表明,在多个关键性能指标上,VulDHGCN均优于基线方法。具体而言,VulDHGCN的准确率、精确率、召回率和F1得分分别达到了96.52%,92.31%,85.12%和88.57%,相较于基线漏洞检测方法,F1分数提高了6.62%~153.92%,具有明显的优势。这不仅证明了VulDHGCN方法的有效性,也为深度学习在源代码漏洞检测领域的进一步应用提供了新的视角和方法。

    图形与图像
    用于遥感图像时空融合的多尺度全聚合网络
    于致远, 宋慧慧,
    2025, 47(5): 864-874. doi:
    摘要 ( 436 )   PDF (1582KB) ( 258 )     
    时空融合旨在生成具有高时空分辨率的遥感图像。目前,大多数时空融合模型通常使用卷积运算进行特征提取,无法对全局特征的相关性进行建模,这限制了它们捕获长程依赖性的能力。同时,由于图像空间分辨率的显著差异,重建细节纹理变得十分困难。为了解决这些问题,提出了一种用于遥感图像时空融合的多尺度全聚合网络模型。首先,引入改进的Transformer编码器结构学习图像中的局部时间特征和全局时间特征,通过在空间和通道维度对像素交互进行建模,有效提取图像中包含的时间和空间纹理信息。其次,设计了一种多尺度分层聚合模块,包括局部卷积、中尺度自注意力和全局自注意力,提供全尺度的特征提取能力,这有助于弥补模型在重建过程中出现的特征损失。最后,采用自适应实例归一化和权重融合模块,通过学习从粗图像到精细图像的纹理转移和局部变化,生成具有全局时空相关性的融合图像。在CIA和LGC这2个标准数据集上将提出的模型与5个具有代表性的时空融合模型进行了对比实验。实验结果显示,所提出模型在5种评价指标上均取得了最优结果。

    基于Floyd-Steinberg误差扩散的数字半调高效计算
    廉凯成, 杨晨, 朱佳伟, 柴志雷,
    2025, 47(5): 875-884. doi:
    摘要 ( 194 )   PDF (1517KB) ( 198 )     
    针对工业界采用的主流数字半调算法——Floyd-Steinberg误差扩散算法在处理日益增大的图像数据时存在的数据依赖严重、可并行性低和实时性差等问题,提出高效计算方法。首先,通过预生成像素-误差扩散值查找表避免了频繁的误差和扩散过程计算;其次,通过基于行缓冲的高效数据结构实现访存优化;再次,提出误差累加单指令多数据SIMD并行方法,使用AVX-512指令集并行累加多个像素同向误差,增强CPU中矢量寄存器的作用;最后,通过边缘误差限制的列分块方法实现多核数据并行,同时消除由于数据并行处理时边界部分数据依赖导致的误差问题。实验结果表明:本文提出的优化算法具有良好的规模伸缩性,计算性能随最佳并行核心数量线性提升;与传统的Floyd-Steinberg误差扩散算法相比,在16核Intel CoreTM i7-11700 CPU平台上处理5 120×5 120灰度图时,获得15倍性能提升,仅需23 ms即可完成处理,更好地满足大规模、超大幅面、超高分辨率和多变内容的工业高速印刷的需求。

    基于双混沌系统的双随机相位编码和压缩感知的图像加密算法
    赵雪妍, 张钊, 贾静雯, 周红艳, 陈雪波
    2025, 47(5): 885-893. doi:
    摘要 ( 229 )   PDF (2056KB) ( 412 )     
    通过将一维Logistic混沌系统、四维新超混沌系统NHS、压缩感知CS理论和双随机相位编码DRPE技术以及二维离散余弦变换DCT相结合,提出了一种新的图像加密算法。首先,利用二维DCT对灰度图像进行稀疏表示,对通过索引排序置乱得到的稀疏矩阵进行置乱;其次,利用CS进行测量,测量矩阵由四维NHS生成;最后,进行DRPE的二次加密,使用Logistic混沌映射和四维NHS作为双重密钥,实现DRPE,得到最终加密图像。该算法充分利用了CS的优点,同时实现压缩和加密,并将CS理论与DRPE技术相结合,既减少了存储空间、降低了传输带宽,又提高了加密的安全性能。仿真实验和对比分析表明,所提出的图像加密算法具有良好的安全性、鲁棒性和解密质量。

    基于生成对抗网络的跨模态图像情感感知描述
    杨春苗, 王杨, 韩力英, 孙赫彬
    2025, 47(5): 894-901. doi:
    摘要 ( 199 )   PDF (1566KB) ( 349 )     
    图像描述旨在根据视觉信息生成符合图像内容的文本,属于跨模态任务。尽管当前图像描述已取得一定成果,但在细粒度情感语义特征捕捉和描述文本情感细腻度等方面仍有提升空间。针对此问题,提出一种基于生成对抗网络生成方面级情感语言描述的模型。以融合双模态注意力机制的编解码结构为生成器、卷积神经网络为判别器,提升模型在跨模态情感匹配方面的准确性及生成情感语句的可靠性。引入迁移学习和RMSProp优化算法以增强模型的可解释性。最终,在MSCOCO与SentiCap数据集上进行了验证,模型收敛性良好并取到了较高的准确率。

    人工智能与数据挖掘
    基于注意力机制的特征融合推荐模型
    马汉达, 李腾飞
    2025, 47(5): 902-911. doi:
    摘要 ( 337 )   PDF (1045KB) ( 820 )     
    针对目前推荐系统难以获得特征信息,缺乏有效的方法来表示特征信息的权重的问题,提出了一种基于注意力机制与特征融合的推荐模型FFADeepCF_SPS。首先,针对特征表示不够充分的问题,使用因子分解机融合特征,将特征从一维扩展到高维,从而获得特征的低阶表示,然后使用深度神经网络学习高阶特征,并通过一个全连接层将2种特征组合起来,以获得所需的特征表示;其次,针对单头注意力机制过度倾斜权重的问题,使用将输入切分成多个单头分别计算其注意力权重的多头注意力机制,再经由线性变换将各结果进行拼接,获得最终的输出;最后,结合上述2点构建了基于注意力机制与特征融合的推荐模型。为了验证模型的有效性,在4个公开数据集上与基线模型GMF、DeepCF_SPS和CNN- BiLSTM进行了对比实验以及消融实验。实验结果表明,在不同规模的数据集上,所提模型与基线模型相比在MSE、RMSE、MAE评价指标上表现出的性能均更优。

    基于随机对称搜索的进化强化学习算法
    邸剑, 万雪, 姜丽梅,
    2025, 47(5): 912-920. doi:
    摘要 ( 228 )   PDF (850KB) ( 568 )     
    进化算法的引入极大地提高了强化学习算法的性能。然而,现有的基于进化强化学习ERL的算法还存在易陷入欺骗性奖励、易收敛到局部最优和稳定性差的问题。为了解决这些问题,提出了一种随机对称搜索策略,直接作用于策略网络参数,在策略网络参数中心的基础上由最优策略网络参数指导全局策略网络参数优化更新,同时辅以梯度优化,引导智能体进行多元探索。在MuJoCo的5个机器人运动连续控制任务中的实验结果表明,提出的算法性能优于以前的进化强化学习算法,且具有更快的收敛速度。

    基于非对称空间特征的脑电信号情感分析研究
    王莹, 杨青, 王翔宇, 张勇,
    2025, 47(5): 921-930. doi:
    摘要 ( 153 )   PDF (978KB) ( 668 )     
    大脑的不对称性会对脑电情感分析产生影响,但是目前很多研究对此特性缺少考虑。结合大脑空间的不对称性,提出了一种混合模型,该模型利用多尺度卷积神经网络提取大脑左右不对称的脑电空间特征,然后使用双向长短期记忆神经网络提取时序特征,最后,通过多头自注意力机制学习特征之间的关系。该模型在公开的DEAP数据集上进行实验验证,唤醒维度分类准确率和F1值分别为93.11%和93.46%,效价维度分类准确率和F1值分别为92.12%和93.27%。该模型在公开的MAHNOB-HCI数据集上进行实验验证,唤醒维度分类准确率和F1值分别为98.58%和97.98%,效价维度分类准确率和F1值分别为98.76%和98.25%。结果表明,在脑电情感识别上该模型具有一定优势,同时通过消融实验证明了非对称空间层的重要性。

    低资源场景下的汉语—传统蒙古语跨语言摘要方法研究
    班琪, 云静, 邓磊,
    2025, 47(5): 931-939. doi:
    摘要 ( 194 )   PDF (1922KB) ( 280 )     
    跨语言摘要任务旨在给定一种语言的源文档(如中文)生成目标语言(如传统蒙古文)的摘要。传统的多任务框架通常采用序列到序列的网络,应用多个专用于各特定任务的解码器。然而,在将文档从一种语言提炼为另一种具有不同形态和结构特性语言的摘要时,多任务框架无法有效捕捉和理解2种语言之间的关系和差异。特别是对于传统蒙古语,其形态变化繁杂、构词形式多样的特点,使得低资源下语言特征的学习和处理变得更加困难。为了解决这一问题,提出一种在多任务框架中引入一致性学习的跨语言摘要模型。通过计算源语言摘要和生成的目标语言摘要之间概率分布差异的距离度量进行一致性建模,在交叉熵损失和一致性损失的约束下优化跨语言摘要模型。此外,构建了一个中—蒙跨语言摘要数据集,在此数据集上获得了有竞争力的ROUGE分数,表明了所提模型在资源匮乏情况下的有效性。

    面向不平衡数据的特征子空间增强的异质集成学习
    陈丽芳, 白云, 施永辉, 代琪
    2025, 47(5): 940-950. doi:
    摘要 ( 179 )   PDF (938KB) ( 188 )     
    对于不平衡数据,传统分类器趋向于保证多数类的准确率,而牺牲少数类的准确率,造成算法的整体性能下降。针对这一问题,提出一种面向不平衡数据的特征子空间增强的异质集成学习算法HEL-FSA。首先利用XGBoost算法学习特征的重要性,并选择重要的特征,形成数据集的特征子空间;其次使用SMOTE算法在特征子空间中生成新样本,获得更加平衡的训练数据;最后,采用逻辑回归、决策树、多层感知器、支持向量机和XGBoost这5种基模型,并使用if_any算法融合异质基模型。在9个不平衡数据集上的实验结果验证了该算法的可行性,同时,将提出的算法用于宫颈癌风险预测,增强了其对宫颈癌风险的理解和预测能力。