Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2025年第11期目录
    2025, 47(11): 0-0. doi:
    摘要 ( 63 )   PDF (247KB) ( 66 )     
    高性能计算
    面向特定应用的可配置CPU性能分析方法
    邓全, 林荣臻, 罗莉, 鲁建壮, 王永文
    2025, 47(11): 1901-1911. doi:
    摘要 ( 98 )   PDF (1901KB) ( 93 )     
    随着集成电路的发展和芯片应用的不断拓展,可配置CPU为芯片设计空间的探索提供了便利。可配置CPU不仅能满足敏捷设计的需求,还能兼顾用户根据目标应用进行调优的需求。然而,目前面向特定应用的可配置CPU的性能调优仍主要依赖于资深体系结构工程师,缺乏一套科学方法进行指导,因此,提出了一种面向特定应用的可配置CPU性能分析方法。在软件层面,利用Perf工具快速定位应用程序在硬件执行时的热点代码块;在硬件层面,通过分析框架的2种计数模式(时钟周期计数与slots计数),锁定各个执行部件的热点执行情况,以便设计人员快速定位硬件执行的热点行为。对支持RISC-V指令集的可配置DMR架构在流体力学典型程序NPB上进行了敏捷设计。实验结果表明,迭代后可配置CPU单核性能提升了13.2%,面积开销增加了12.2%。


    一种具有动态可重构数据流的混合矩阵向量处理器
    艾晨阳, 赵乐川, 华涛, 王新安, 王颖
    2025, 47(11): 1912-1921. doi:
    摘要 ( 62 )   PDF (2498KB) ( 68 )     
    脉动阵列作为通用矩阵乘法(GEMM)算子的高能效加速器,受到了学术界和工业界广泛关注。然而,它往往占用大量面积,并且通常需要 VPU 单元配合使用,这种组合经常出现在神经网络加速器中。此外,它还存在时间空间利用率低、端到端场景性能有限等问题。为了解决这些问题,通过结合脉动阵列与向量处理器,提出了一种脉动向量处理器HVSA。通过对 VPU 中存储、广播和通道间通信单元进行复用,HVSA可在阵列的形状和数据流方面进行可重构配置,可以在可接受的硬件面积开销的前提下,更有效地支持 GEMM 和向量运算。同时提出了适用于 HVSA 的端到端编译框架,包括基于 MLIR 的编译前端、数据流调度和兼容 RISC-V 向量扩展的编程模型。实验数据表明,与同等面积的脉动阵列相比,HVSA 计算速度提升了 30.30 倍。在端到端应用中,相比同等面积的“VPU+脉动阵列”,HVSA的平均运行时间缩短为原来的约4.7%,能耗减少约 58.7%。


    云原生边缘计算系统离线自治技术研究综述
    李漠, 夏国傲, 任怡, 李宝, 王庆坤, 张建锋, 谭郁松
    2025, 47(11): 1922-1931. doi:
    摘要 ( 72 )   PDF (1204KB) ( 42 )     
    云原生边缘计算系统支持云边一体的容器集群管理,不稳定的云边网络使得离线自治成为该领域的重要研究点,然而学术界尚缺乏对其所面临技术问题的分析和对当前技术现状的系统梳理。首先,阐述了云原生边缘计算系统的典型架构和组成,分析并提出了离线自治场景需解决的离线节点状态判断、离线节点重启后恢复和节点重连后云边同步3个重要问题。其次,分析了典型云边系统针对上述问题采用的不同离线自治技术,并设计实验验证其重要功能和性能优势。最后,讨论了离线自治技术未来的研究方向。
    基于循环展开的高效RISC-V内存一致性测试方法
    胡津涛, 徐学政, 杨德亨, 黄安文, 寇广, 李琼
    2025, 47(11): 1932-1944. doi:
    摘要 ( 85 )   PDF (1339KB) ( 43 )     
    内存一致性模型,简称内存模型,规定了多核系统访存的观测规律,是软硬件共同遵守的架构规范,具有难设计、难描述、难实现和难测试的特点,一直是学术界和工业界的研究热点。由于并行程序执行顺序的不确定性,内存模型的测试通常需要大量重复地运行特定程序,通过最终的程序状态判断是否存在非法的访存顺序。这在硅前的仿真阶段尤其耗时,为芯片验证带来了极大的挑战。近年来,RISC-V因其开源、精简、模块化和高可定制性的特点广受欢迎。由于其开源的特点,RISC-V芯片的指令集扩展和微架构设计有着极高的灵活度,其内存模型也允许在兼容规范的基础上进行定制,这种高可定制性为芯片的验证带来了更多的挑战。为此,面向RISC-V架构提出了一种基于循环展开的高效内存一致性测试方法,通过分析已有测试方法的性能瓶颈,借鉴传统编译技术中的循环展开,将反复运行的测试程序合并,在大大降低线程同步开销的同时,提升了线程间访存交叉执行的概率,从而提高了测试效率。实验结果表明,所提方法在包括RISC-V板卡和模拟器在内的不同平台上相比已有的内存一致性测试方法,测试效率提升至1.5~184倍。
    ISA真的重要么? ——基于Gem5的仿真调查
    李华, 王永文
    2025, 47(11): 1945-1952. doi:
    摘要 ( 79 )   PDF (3358KB) ( 47 )     
    指令集体系结构(ISA)是芯片最底层、最核心的部分,已有的关于ISA对性能影响的研究工作通常基于物理硬件平台实现,但不同的硬件实现方案使得无法直接对比分析ISA对性能的影响。基于以上原因,使用Gem5模拟器,采用相同的硬件配置与相同版本的编译器,对ARM,RISC-V和x86这3种ISA进行了仿真对比。采用CoreMark,Dhrystone和Whetstone作为基准测试程序。同时,利用McPAT对功耗进行了评估。模拟结果表明,ARM ISA在性能和功耗方面优于RISC-V和x86 ISA,但ARM和RISC-V之间的差异非常细微,而ARM和x86之间的性能差距可能是由实验中使用相对较低的硬件配置引起的,并且可以通过更积极的硬件方法将差距缩小甚至逆转。研究表明,ISA并不能从根本上提高效率。


    计算机网络与信息安全
    基于门控特征融合与多尺度卷积的网络流量异常检测
    尹春勇, 李荣标
    2025, 47(11): 1953-1963. doi:
    摘要 ( 67 )   PDF (909KB) ( 36 )     
    在当前网络流量异常检测领域中普遍存在着模型结构复杂和计算资源需求大等问题,这导致在资源受限的设备上难以完成部署和检测。为此,提出了一种基于门控特征融合与多尺度卷积的网络流量异常检测模型GFMCAD。首先,将主成分分析与聚类方法相结合以降低网络流量数据的复杂度。其次,采用由一维卷积神经网络构成的并行多尺度卷积块与多层长短期记忆网络分别提取网络流量在不同尺度下的空间与时序特征。然后,通过门控特征融合模块将提取到的空间与时序特征进行自适应特征融合。最后,使用残差全连接层与Softmax函数识别异常流量。实验结果显示,GFMCAD在3个基准数据集上分别取得了0.971 6,0.965 8与0.987 5的准确率。实验结果表明,GFMCAD在降低计算资源消耗的同时提升了模型的检测能力。

    音频删除篡改的多阶段检测与多模态定位
    张国富, 王茹, 苏兆品, 岳峰, 廉晨思, 杨波
    2025, 47(11): 1964-1973. doi:
    摘要 ( 74 )   PDF (1301KB) ( 44 )     
    音频删除篡改检测在数字音频鉴真领域面临严峻挑战,尤其是在反取证攻击下。针对删除篡改难以检测且定位困难的问题,提出了一种音频删除篡改的多阶段检测与多模态定位方法。首先,设计一种头文件信息分析方法,用以筛选出疑似存在头尾删除篡改的音频文件;其次,提出一种基于列平均的常数Q频谱草图特征,并设计一种基于深度残差收缩网络和注意力机制的中间删除篡改分类网络;再次,结合头文件信息分析与分类网络的检测结果,综合判断音频是否存在删除篡改;最后,对于检测到的中间删除篡改,提出一种基于小波包分析与多模态特征结合的定位方法。对比实验结果表明,所提方法可以实现头尾删除篡改的检测和中间删除篡改的精确定位,其中中间删除分类的准确率、精确率、召回率和F1分数均超过98%,并在面对常规信号处理攻击时展现出更强的鲁棒性与定位精度。

    MinRS:一种兼顾模型可用性与模型隐私性的防御方法
    任志强, 陈学斌, 张宏扬
    2025, 47(11): 1974-1983. doi:
    摘要 ( 49 )   PDF (1273KB) ( 38 )     
    联邦学习是一种解决机器学习中数据共享和隐私保护问题的技术。然而,联邦学习系统面临着模型可用性和模型隐私性这2方面的安全隐患。此外,目前针对这2类安全隐患的防御方法之间并不能兼容。针对这些问题,从兼顾模型可用性与模型隐私性的角度出发,提出了一种名为MinRS的防御方法,该方法由安全访问方案和选择算法组成,能在不影响模型隐私性的前提下防御恶意模型攻击,实现安全的模型聚合。实验结果表明,MinRS在保护模型隐私性的前提下,成功防御了3种不同攻击策略生成的恶意模型,并且几乎没有对模型的性能造成负面影响。


    基于单类支持向量机的联邦学习安全聚合算法
    朱海, 缪祥华, 郭施帆, 覃叶贵, 尚游
    2025, 47(11): 1984-1995. doi:
    摘要 ( 43 )   PDF (1734KB) ( 35 )     
    联邦学习允许用户在不用上传数据的情况下参加模型训练,因此在学术界备受关注。然而,联邦学习也面临着来自恶意参与方的各种安全挑战,例如拜占庭攻击和标签翻转攻击。现有的防御算法在数据分布不均匀时防御效果会大打折扣。针对上述问题,提出一种基于单类支持向量机的联邦学习安全聚合算法。该算法通过单类支持向量机提取合适的特征参数,确定一个阈值,将正常数据和异常数据分开。由于其构建最优超平面的能力能有效区分正常数据和异常数据,而且在不同数据下能选择更适合的阈值,因此具有较强的泛化能力和鲁棒性。通过一系列攻防实验,并使用4种不同的防御算法进行比较,实验结果表明,在不同比例的恶意客户端的环境中,无论数据分布均匀或不均匀,所提算法都能有效防御攻击。


    人工智能与数据挖掘
    基于人工智能模型的数学推理研究进展
    杨凯翕, 陈昕怡, 阚志刚, 韩旭, 赵宝康, 乔林波
    2025, 47(11): 1996-2007. doi:
    摘要 ( 97 )   PDF (844KB) ( 40 )     
    人工智能(AI)为数学家提供了新的工具和方法,可以加速数学问题求解与证明的探索。首先介绍主流的数学推理工具和推理数据集。数学推理工具不仅提高了复杂数学问题的求解效率,也为人工智能模型提供了结构化输入以促进机器与数学思维的结合。推理数据集包括数学知识库以及公开数据资源,它们为人工智能模型提供了丰富的数学知识,支持模型训练和自动化推理。其次,探讨人工智能辅助数学推理的多种途径,包括自动化推理和模型加速求解等。再次,讨论了人工智能与数学家协同合作的重要性,人机协作将提高数学研究的效率和准确性。最后,对人工智能赋能数学研究的多种途径和机制进行总结,并展望智能化数学研究的新方向。


    基于大语言模型的司法文本摘要研究
    裴炳森, 李欣, 樊志杰, 蒋章涛, 孙昊扬, 刘梓锐
    2025, 47(11): 2008-2018. doi:
    摘要 ( 65 )   PDF (1975KB) ( 50 )     
    随着科学技术的不断发展,通用人工智能技术展现了其强大的语言理解和生成能力。在司法领域,人工智能也发挥着越来越重要的作用,司法信息化已经逐渐转变为司法智能化、智慧化。在转变进程中,司法文本的摘要生成是一项重要工作,根据司法文本生成摘要能够实现“降维”的目的,并有助于迅速了解案件详情、获取案件要素,为从业者高效进行信息获取提供支撑。但是目前的司法文本摘要生成技术仍存在部分问题,如:生成摘要中缺少法律条文作为判罚依据,摘要存在语法错误和语句不通等导致摘要可读性不强等一系列问题。为解决上述问题,利用大语言模型出色的语言理解能力和生成能力,结合不同的微调技术并设计不同的提示模板,构建了针对法律文本摘要生成的垂直领域大模型,经过在各类数据集上的验证,表明了该模型的可行性,为大语言模型和司法领域结合提供了可能的方式。

    基于时空融合的多视角3D感知网络设计
    李贺, 陈品同, 余荣, 谭北海
    2025, 47(11): 2019-2028. doi:
    摘要 ( 54 )   PDF (1252KB) ( 38 )     
    感知系统作为自动驾驶的关键组成部分,直接影响车辆对周围环境的理解,是实现安全可靠自动驾驶的基础。相比传统2D图像检测感知技术提供的有限信息,3D感知可以提供更丰富的感知数据,但也存在空间信息融合不充分与时序信息利用不足的关键问题。提出一种融合时空信息的多视角3D感知网络,该网络包括多视角环视3D感知网络与时空融合网络MVSPNet。多视角环视感知网络可以通过精确的空间视角转换,高效地融合多相机图像数据,以构建统一鸟瞰图空间表征,实现多个相机数据的空间对齐和融合。相较于当前先进的单目基准模型FCOS3D,所提出网络的全类平均精度mAP达到了0.343,相对提升了14.7%。时空融合网络MVSPNet可以实现时序上多视角的图像融合,融合多帧数据,进一步显著提升了网络性能,融合2帧时序数据,mAP进一步提升了10.2%。实验结果充分证明了所设计的网络在有效融合多视角空间信息与时序信息方面的先进性,为提升自动驾驶系统在动态复杂场景下的3D感知提供了有效的解决方案,对推动安全、可靠的自动驾驶技术发展具有重要意义。


    基于保持节点簇分布的图提示少样本节点分类
    谢秋园, 李秋瑶, 柴变芳
    2025, 47(11): 2029-2037. doi:
    摘要 ( 55 )   PDF (805KB) ( 29 )     
    在图挖掘任务中,基于原型的图提示学习已被广泛视为提升图数据分析性能的有效手段。然而,在少样本节点分类场景下,现有方法存在无标签数据利用不充分导致类原型构建不准确以及对图拓扑结构信息利用不充分的问题,这些不足限制了图提示学习方法在下游任务中的效果。为此,提出了一种融合所有节点簇分布的图提示学习方法PNCD-GP,旨在通过更有效地利用无标签数据的簇分布和拓扑结构信息,提升图数据分析的性能和准确性。在预训练阶段,采用预测掩码和保持图节点聚类作为优化策略,以学习具有判别力的节点表示,缩小上下游任务之间的差距。在图提示阶段,在原始图中引入类原型虚拟节点作为提示,引入高阶信息增强图的拓扑结构,提升模型对图结构的理解和利用能力,并通过保持无标签样本与有标签节点的簇分布来学习提示。该方法能够构建更精准的原型向量,并利用类原型与节点表示的相似性进行节点分类。在多个公开图数据集上的实验结果表明,PNCD-GP方法在效率与准确率方面均有显著优势,验证了其在图提示学习领域的有效性和潜力。


    基于空间注意力机制和多特征数据增强的环境声分类
    刘翔, 李传坤, 郭锦铭, 刘宇
    2025, 47(11): 2038-2044. doi:
    摘要 ( 88 )   PDF (2200KB) ( 35 )     
    针对环境声分类任务中,数据集样本信噪比低、对数梅尔谱(Log-Mel)谱图特征表达能力不足等问题,提出了一种基于高低频分离的环境声分类改进模型。首先在输入特征中增加了相位谱作为Log-Mel谱图的补充,构建相位、Log-Mel和时频谱的多特征参数输入,增强了模型输入特征的表达能力;其次在神经网络的输入部分添加注意力机制,提升网络模型的抗噪声干扰能力并提高了网络的鲁棒性和泛化能力。实验表明,所提模型有效地提升了对环境声的识别准确率,在ESC10,ESC50和UrbanSound8K数据集上的分类准确率达到了97.25%,89.00%和83.45%,与原有的模型相比准确率提升了2.25%,10.50%和2.22%。

    基于多策略鲸鱼算法的ESN参数优化模型
    郭伟, 郝思琦, 任志忠, 米娜娃尔·木提拉
    2025, 47(11): 2045-2055. doi:
    摘要 ( 82 )   PDF (889KB) ( 28 )     
    针对传统回声状态网络ESN储层参数选择的随机性导致网络预测性能不佳的问题,提出了基于多策略鲸鱼优化算法MWOA的回声状态网络参数优化模型MWOA-ESN。其实质是通过MWOA算法对ESN储层关键参数进行优化。MWOA通过引入池化机制、迁移策略和优先选择策略,有效地解决了鲸鱼优化算法存在的种群多样性低和易陷入局部最优等问题,提升了优化效率。对多个时间序列数据集和短期电力负荷数据集进行仿真实验,结果表明所提MWOA-ESN模型具有普适性,在预测精度和拟合性方面,优于已有经典模型。相比现有成果,MWOA-ESN参数优化模型是可行和有效的。

    基于视觉特征增强与双向交互融合的图文情绪分类
    王露瑶, 胡慧君, 刘茂福
    2025, 47(11): 2056-2066. doi:
    摘要 ( 89 )   PDF (1485KB) ( 33 )     
    多模态情感分析日益受到广泛关注,其目的是利用文本和图像等多模态信息实现情感预测。相较于文本,视觉模态作为辅助模态,可能包含更多与情感无关的混淆或者冗余信息,同时现有研究未充分考虑多个感知模态间的交互作用和互补性。针对上述问题,提出了基于视觉特征增强与双向交互融合的图文情绪分类VFEBIF模型。其中,细粒度视觉特征增强模块利用场景图的结构化知识和基于CLIP的筛选技术,提取出与视觉语义相关的文本关键词,从而增强视觉局部特征。此外,双向交互融合模块并行实现模态间交互,并融合多模态特征以深入挖掘模态间的互补信息,进而实现情绪分类。在TumEmo和MVSA-Single这2个公共数据集上的实验表明,VFEBIF模型优于多数现有模型,能够有效提升情绪分类性能。

    基于PCA-PSO_KFCM聚类和BiLSTM-Attention的短期电力负荷预测
    邓明亮, 张钊, 周红艳, 陈雪波
    2025, 47(11): 2067-2081. doi:
    摘要 ( 54 )   PDF (1835KB) ( 37 )     
    准确可靠的短期电力负荷预测能优化电力调度、提高电力资源利用率,并为电力部门的生产实际提供有价值的参考。随着用电终端的多样化以及气象和日期等短期因素的影响,负荷序列呈现明显的不确定性和随机性。为此,提出基于改进核模糊C均值聚类和双向长短时记忆注意力的新型两阶段短期电力负荷预测方法。第1阶段,采用基于主成分分析和粒子群优化共同改进的KFCM聚类,将具有相似用电特征的负荷数据点归为一类,使得模型训练更有针对性。第2阶段,通过皮尔逊相关系数选取关联度高的气象和时间特征作为输入。同时,为提高预测性能,在BiLSTM模型中引入时间注意力机制和多头自注意力机制。最后,将所提出的方法应用于中国重庆电力公司所提供的真实电力负荷数据集。实验结果表明,与多种不同的预测方法相比,所提方法的预测精度有显著提升。


    融合平衡与地位理论的自监督符号社交关系预测模型
    唐月晨, 马慧芳, 舒珂
    2025, 47(11): 2082-2090. doi:
    摘要 ( 55 )   PDF (1305KB) ( 34 )     
    符号社交关系预测旨在预测社交网络中的社会实体之间是否存在积极有向交互或消极有向交互。现有的社交关系预测模型往往忽略社交网络中的符号、方向特性,而平衡理论为建模符号相关的社交关系提供了指导依据,地位理论为建模符号、方向联合的社交关系提供了指导依据。此外,自监督技术能从上述2个角度为节点特征学习彼此提供有效辅助信息。据此,提出了融合平衡与地位理论的自监督符号社交关系预测模型。该模型充分利用平衡和地位理论建模友谊和层级关系,分别捕捉边符号和方向对不同社交关系的影响。为了提高预测性能,采用自监督学习的对比学习机制探索网络中方向和符号在训练过程中的互补信息,并在真实数据集上验证了该模型的有效性。