计算机工程与科学

2024年第2期目录

2024, 46(02): 0-0. doi:

摘要 ( 122 )

PDF (1688KB) ( 359 ) 　　

MVSim：面向VLIW多核向量处理器的快速、可扩展和精确的体系结构模拟器

刘仲, 李程, 田希, 刘胜, 邓让钰, 钱程东

2024, 46(02): 191-199. doi:

摘要 ( 308 )

PDF (1227KB) ( 527 ) 　　

设计了一个面向VLIW多核向量处理器的快速、可扩展、精确的体系结构模拟器MVSim。设计了可扩展的VLIW多核向量处理器模型、多级存储体系结构模型和多核性能模型；实现了指令集架构的节拍精准模拟，Cache、DMA和多核同步部件的高效功能模拟，采用多线程技术实现了多核处理器的高效和可扩展模拟。实验结果表明，MVSim能够准确模拟多核处理器的目标程序执行，模拟结果完全正确，具有良好的可扩展性。MVSim的平均模拟速度分别是RTL模拟和CCS的227倍和5倍，平均性能误差约为2.9%。

面向装备平台的敏捷交换芯片设计与实现

刘汝霖, 杨惠, 李韬, 吕高锋, 孙志刚

2024, 46(02): 200-208. doi:

摘要 ( 213 )

PDF (1495KB) ( 454 ) 　　

在构建车载、舰船、航空航天等装备平台网络系统时，需要综合考虑功能、性能、体积、功耗、易用性等制约因素，传统高性能的商用网络交换芯片功耗高、配置和使用复杂，难以满足相关需求。对此提出了一种面向装备平台的可编程、低功耗的敏捷交换芯片架构。该架构引入协议无关的超长内容匹配-动作流水线，提供可编程的转发配置、流限速、报文修改等功能，支持现存各类网络协议及用户自定义协议。架构提供灵活的管理配置模式，可满足远程配置、无管理CPU的轻量化配置等多种应用需求。另外，通过敏捷交换协议的扩展功能，可将查表结果、动作处理记录、用户配置信息等随原报文一同送出芯片，实现单个报文粒度的精细化处理和灵活的功能扩展。基于敏捷交换架构，流片制造了YHHX-DS160敏捷交换芯片，该芯片可提供160 Gbps全接口线速交换能力，最大功耗仅6.6 W，能效比达到24 Gbps/W。

面向高性能计算的互连网络拥塞控制分析与评估

孙岩, 张建民, 黎渊, 孙舜禹

2024, 46(02): 209-216. doi:

摘要 ( 258 )

PDF (979KB) ( 644 ) 　　

随着高性能计算技术的发展，高性能计算系统的网络节点数量不断增长，高性能计算应用对网络性能的要求越来越高，高性能互连网络的拥塞控制面临很大的压力与挑战。针对高性能计算互连网络的特点，研究高效、低开销的拥塞控制方法，是确保高性能互连网络性能和稳定性的关键。针对高性能计算系统中互连通信的核心问题，对主流的拥塞控制方法进行分析和实验比较；基于高性能计算系统的结构特点和通信特性，设计用于大规模模拟仿真的数据流模型和流文件生成工具，并提出一种拥塞控制综合评价指标；使用所提出的数据流模型，在较大规模网络中对不同拥塞控制方法进行模拟，并基于所提出的评价指标对几种拥塞控制方法的性能进行分析和评估。提出的分析和评估技术可以对高性能互连网络的拥塞控制方法进行更客观和准确的分析与评估。

基于ZYNQ 芯片的基板管理控制器设计与实现

马柯帆, 李宝峰, 周悦锦, 武园园, 余永兰, 多瑞华

2024, 46(02): 217-223. doi:

摘要 ( 270 )

PDF (1328KB) ( 608 ) 　　

随着超算、云计算等数据中心的大规模发展，主板的架构日益复杂，成本控制越来越严苛，常用的基板管理控制器（BMC）设计方案可扩展功能有限，迫切需要设计一种低成本且高效的BMC方案。提出一种基于Vivado和Yocto Project的集成开发平台，选用XILINX ZYNQ系列FPGA芯片，采用其内部硬核ARM运行的OpenBMC方案。该设计通过AXI总线扩展外设，可扩展性强、灵活性高，从而实现BMC与FPGA的双重管理二合一，节约了主板的空间与成本。

软硬件混合的高效CHI协议分析

赵祉乔, 周理, 荀长庆, 潘国腾, 铁俊波, 王伟征

2024, 46(02): 224-231. doi:

摘要 ( 208 )

PDF (1269KB) ( 558 ) 　　

在片上系统SoC开发过程中，如何高效准确地进行功能验证与性能分析，是亟待解决的难题。针对目前在FPGA原型平台上对片上网络协议监测手段有限的问题，提出了一种软硬件混合的高效CHI协议监测和分析方法，通过SystemVerilog的直接编程接口DPI连接C代码，由可综合的硬件部分提供共享函数体，不可综合的软件部分通过共享函数体从片上网络协议的各个通道捕捉待测SoC中的CHI报文，进行离线保存或在线检查。实验结果表明，该方法具有硬件资源占用少、可重用性高的优点，离线模式对仿真速率影响不大，在线模式可以在待测SoC运行的同时发现问题，能够实现在原型平台上对CHI协议报文的高效监测，有效加速SoC问题的定位和性能分析。

自动车辆排中可撤销可追溯的访问控制方案

李宇昕, 王峥, 王惠, 孙建伟

2024, 46(02): 232-243. doi:

摘要 ( 161 )

PDF (1335KB) ( 442 ) 　　

在提高燃油效率和驾驶安全性上智能交通系统中的自动车辆排是一种优秀的解决方案。以物联网和5G通信技术为基础的自动车辆排在实现智能组队和行为通信过程中容易受到各种攻击，导致安全事故的发生。为此，结合边缘计算技术，提出一种基于属性的可撤销可追溯的访问控制方案。首先，使用基于属性的加密实现了细粒度的访问控制；其次，利用中国剩余定理动态更新排密钥实现消息的可撤销存储，并借助路边基础设施降低车辆侧的计算开销；接着在此基础上，利用椭圆曲线加密机制实现了用户的匿名和对恶意车辆的追溯。安全性分析和仿真实验结果表明，该方案在安全性和效率方面是可行的。

面向Stacking算法的差分隐私保护研究

董燕灵, 张淑芬, 徐精诚, 王豪石,

2024, 46(02): 244-252. doi:

摘要 ( 169 )

PDF (1162KB) ( 486 ) 　　

为解决同质集成学习算法对噪声更敏感，难以兼顾较好的预测性能和有效的隐私保护这一问题，提出一种基于差分隐私的DPStacking算法，将异质Stacking算法与差分隐私技术相结合，以优化算法的隐私保护和预测性能。但是，由于Stacking算法的低层和高层模型都可以由不同的学习器构成，若对某个具体学习器设计隐私预算分配方案来提供差分隐私保护，该方案往往无法适用于由任意基学习器和元学习构成的Stacking算法。基于此，设计了一种基于元学习器的隐私预算分配方案，此方案根据皮尔逊相关系数及差分隐私并行组合的特性为元学习器输入的不同构成体分配不同的隐私预算。通过理论与实验验证，DPStacking算法符合ε-差分隐私保护，与基于差分隐私的随机森林算法(DiffRFs)、Adaboost算法(DP-AdaBoost)、XGBoost算法(DPXGB)相比，能有效保护数据隐私的同时拥有更好的预测性能，并较好地解决了单一同质集成学习算法对噪声更加敏感的问题。

基于动态定位和特征融合的多分支细粒度识别方法

杨晓强, 黄加诚

2024, 46(02): 253-263. doi:

摘要 ( 230 )

PDF (1324KB) ( 480 ) 　　

为了解决细粒度分类类间差异小、类内差异大的分类难点，在Swin Transformer基础上，提出了一种改进的端到端的细粒度分类模型（TBformer）。针对复杂背景对网络识别产生的干扰，使用ECA、Resnet50、SCDA相结合的动态定位模块（DLModule）捕获关键物体，并设计了基于DLModule的三分支特征提取模块，提高对目标判别性特征的提取能力。为了充分挖掘三分支特征蕴含的丰富细粒度信息，提出了基于ECA的特征融合方法，增强特征的全面性、精确性，提高网络对细粒度分类的鲁棒性。实验结果表明：相比基础方法，TBformer在CUB-200-2011上的准确率提升了3.19%，在Stanford Dogs上的准确率提升了3.47%，在NABirds上的准确率提升了1.09%。

基于改进 RetinaNet网络的水下机器人目标检测与实验

黄珍伟, 陈伟, 王文杰, 路锦通

2024, 46(02): 264-271. doi:

摘要 ( 256 )

PDF (1614KB) ( 487 ) 　　

针对目前水下机器人目标检测算法存在图像退化严重和目标识别率低的问题，提出了一种融合改进RetinaNet和注意力机制的水下目标检测算法。首先，把RetinaNet骨干网络替换成 DenseNet网络，保留了更多目标特征并减少了参数量。其次，替换初始卷积为深度分离可变形卷积，从而大大减少了模型的参数量，提高了模型的运算速度。最后，引入CBAM注意力模块，利用CBAM模块在空间和通道2个维度加强特征，减少了水下复杂环境对目标检测的干扰。水下机器人抓取实验结果表明，与初始的RetinaNet算法相比，改进后的算法mAP值可达81.9％，参数量为56.8 MB，检测速度为16.8 f/s，在水下目标检测方面性能优异。

滑动窗口投票策略的QRS波群形态识别

宋鑫海, 韩京宇, 郎杭, 毛毅

2024, 46(02): 272-281. doi:

摘要 ( 162 )

PDF (987KB) ( 546 ) 　　

QRS波群形态识别是心电异常检测的关键环节，是疾病诊断的主要依据。目前的QRS波群形态识别方法存在识别出的形态较少、对参数敏感等问题。为此，提出一种基于隐马尔科夫的滑动窗口投票策略SWVHMM自动识别QRS波群形态。首先，将每个QRS波群划分成4个波段，对各波段设置滑动窗口提取样本；其次，将各波段波形作为状态，窗口样本聚类后的类簇中心作为观测，构建状态转移受限的隐马尔科夫模型；最后，对待预测波群的各波段窗口组合结果进行投票，识别最可能的波群形态。在专业医生标注的真实数据集上，与现存方法比较，SWVHMM F1值分别提高了5.97%，5.49%和2.27%。这表明SWVHMM不仅能识别多种QRS波群形态，而且准确度更高。

融合特征权重与改进粒子群优化的特征选择算法

刘振超, 苑迎春, 王克俭, 何晨

2024, 46(02): 282-291. doi:

摘要 ( 206 )

PDF (1169KB) ( 484 ) 　　

随着教育信息化的发展，教育数据呈现特征数量高、冗余度高等特点，这使目前的分类算法在教育数据上分类准确率不理想。提出一种将特征权重算法与改进粒子群优化算法融合的混合式特征选择算法（RF-ATPSO）。该算法首先使用RELIEF-F算法计算各个特征的权重，筛除冗余特征，然后在筛选后的特征集合中利用改进粒子群算法搜索最优特征子集。实验结果表明，在6个UCI公共数据集上，经RF-ATPSO算法进行特征选择后，平均准确率提升了10.04%，且平均特征子集规模最小、收敛速度最快；在学生学业成绩画像特征数据集上，该算法以较小的特征子集规模达到较高的分类准确率，平均准确率为94.77%，明显优于其它特征选择算法，实验充分证明了该算法具有实际应用意义。

基于模型的非凸聚类算法

钟卓辉, 陈黎飞,

2024, 46(02): 292-302. doi:

摘要 ( 153 )

PDF (982KB) ( 544 ) 　　

由于数据可能分布在非规则的流形上，其中潜在的簇往往呈现非凸的形状和结构，针对这类数据的聚类问题被统称为非凸聚类。现有的主流非凸聚类方法包括基于原始空间的方法和基于空间变换的方法，均忽略了非凸数据模式的显式描述。提出一种描述性模型用于非凸聚类。首先，基于核密度方法定义了一种具有混合形式的特征加权核密度模型，其无需事先假定任何概率分布模型且不限制簇的形状，这是传统基于模型的聚类方法无法实现的。其次，基于提出的模型推导了聚类目标函数，并基于期望最大化算法提出一种求解密度函数局部区域密度极大值的优化算法，那些上升到密度函数相同密度极大值的样本点被划分为同一个簇。最后，定义了一种基于模型的非凸聚类算法。算法不需人为定义簇的数量，并且能够为每个簇分配一个显式的概率密度函数，有助于更稳健和更准确地表征集群。除此之外，算法不仅在优化过程中进行自适应带宽选择，而且在优化过程中赋予了样本空间特征权重，实现了嵌入式特征选择。

一种混合多策略改进的麻雀搜索算法

李江华, 王鹏晖, 李伟

2024, 46(02): 303-315. doi:

摘要 ( 295 )

PDF (1768KB) ( 813 ) 　　

针对麻雀搜索算法SSA求解目标函数最优解时具有过早收敛、在多峰条件下易陷入局部最优和在高维情况下求解精度不足等问题，提出了一种混合多策略改进的麻雀搜索算法MISSA。考虑到算法初始解的质量很大程度上会影响整个算法的收敛速度与精度，引入精英反向学习策略，扩大算法的搜索区域，提升初始种群的质量和多样性；对步长进行分阶段控制，以提高算法的求解精度；通过在跟随者的位置中加入Circle映射参数与余弦因子，提高算法的遍历性与搜索能力；采用自适应选择机制在麻雀个体位置更新中加入Lévy飞行，增强算法寻优和跳出局部最优的能力。将改进后的算法与麻雀搜索算法及其他算法在13个测试函数上进行对比，并进行Friedman检验。实验结果表明，改进后的麻雀搜索算法能够有效提高寻优精度与收敛速度，并在高维问题中也具备较高的稳定性。

基于类型注意力和GCN的远程监督关系抽取

张欢, 李卫疆,

2024, 46(02): 316-324. doi:

摘要 ( 180 )

PDF (822KB) ( 400 ) 　　

远程监督关系抽取通过自动对齐自然语言文本与知识库生成带有标签的训练数据集，解决样本人工标注的问题。目前的远程监督研究大多没有关注到长尾（long-tail）数据，因此远程监督得到的大多数句包中所含句子太少，不能真实全面地反映数据的情况。因此，提出基于位置-类型注意力机制和图卷积网络的远程监督关系抽取模型PG+PTATT。利用图卷积网络GCN聚合相似句包的隐含高阶特征，并对句包进行优化以此得到句包更丰富全面的特征信息；同时构建位置-类型注意力机制PTATT，以解决远程监督关系抽取中错误标签的问题。PTATT利用实体词与非实体词的位置关系以及类型关系进行建模，减少噪声词带来的影响。提出的模型在New York Times数据集上进行实验验证，实验结果表明提出的模型能够有效解决远程监督关系抽取中存在的问题；同时，能够有效提升关系抽取的正确率。

中文电子病历信息提取方法研究综述

吉旭瑞, 魏德健, 张俊忠, 张帅, 曹慧

2024, 46(02): 325-337. doi:

摘要 ( 480 )

PDF (887KB) ( 849 ) 　　

电子病历里承载的大量医疗信息能够帮助医生更好地了解患者的情况，辅助医生进行临床诊断。作为中文电子病历信息提取的2大核心任务，命名实体识别和实体关系抽取的目标是识别出电子病历文本中的医学实体并提取出各个实体间的医学关系。首先，系统阐述了中文电子病历的研究现状，指出命名实体识别和实体关系抽取2大任务在中文电子病历信息提取中所发挥的重要作用。随后，介绍了面向中文电子病历信息提取的命名实体识别和关系抽取算法的最新研究成果，并分析了每个阶段各个模型的优缺点。最后，讨论了中文电子病历现阶段所存在的问题并对未来的研究趋势进行展望。

基于元学习个性化推荐研究综述

吴国栋, 刘旭旭, 毕海娇, 范维成, 涂立静

2024, 46(02): 338-352. doi:

摘要 ( 411 )

PDF (1157KB) ( 947 ) 　　

推荐系统作为缓解“信息过载”的工具，为用户过滤冗余信息并提供个性化服务，近年来得到了广泛应用。然而，实际推荐场景中，通常存在冷启动与不同推荐算法难以根据实际环境自适应选择等问题。元学习因其具有基于少量训练样本快速学会新知识和技能的优点，被越来越多地应用于推荐系统相关研究中。对现有基于元学习技术缓解推荐系统冷启动问题以及自适应推荐问题的主要研究进行探讨。首先，分析了基于元学习推荐在上述2个方面已取得的相关研究进展；然后，指出了现有元学习推荐研究存在难以适应复杂任务分布、计算代价高和容易陷入局部最优等问题；最后，对元学习在推荐系统领域的一些最新研究方向进行了展望。

基于早期时间序列分类的可解释实时机动识别算法

庞诺言, 关东海, 袁伟伟

2024, 46(02): 353-362. doi:

摘要 ( 236 )

PDF (1288KB) ( 473 ) 　　

战斗机机动识别是判断战斗机战术意图的基础，然而现有的机动识别方法实时性不强且不具有可解释性，无法满足空战中对实时性的要求且不利于人机互信。设计基于早期时间序列分类的实时机动识别算法，将完整机动切分为机动单元，使用集成学习算法对机动单元进行识别并实时监控，以满足实时性要求并获得高识别精度。算法使用可解释模型，通过特征贡献度进行模型解释，使模型更透明从而降低空战决策者的决策风险。选择盘旋、斤斗等9种不同机动动作进行仿真实验，结果表明：在完整机动动作执行到20%时，所提算法即可识别其机动类别，识别准确率可达93%。

基于精英引导的改进哈里斯鹰优化算法

李雨恒, 高尚, 孟祥宇

2024, 46(02): 363-373. doi:

摘要 ( 285 )

PDF (957KB) ( 559 ) 　　

针对哈里斯鹰优化算法(HHO)易陷入局部最优和收敛速度慢的问题,提出一种基于精英引导的改进哈里斯鹰优化算法(EHHO)。首先,引入精英反向学习,以精英中心为对称中心进行反向学习来优化种群结构,增强算法跳出局部最优的能力；其次,引入精英演化策略,以精英个体为主体进行基于高斯随机突变的演化来提升种群质量，加快算法收敛速度；最后,引入自适应机制,动态调整精英演化策略中2种演化方式的选择概率,以提升算法稳定性。为验证改进算法的有效性,选取15个基准函数进行仿真实验。实验结果表明,改进算法在寻优性能和鲁棒性上均有明显提升,在优化算法中具有一定竞争力。

一阶逻辑中基于treelet图神经网络的前提选择

马雪, 何星星, 兰咏琪, 李莹芳

2024, 46(02): 374-380. doi:

摘要 ( 156 )

PDF (671KB) ( 377 ) 　　

前提选择是解决自动定理证明器面对大规模问题时性能降低的有效方法。当前面向一阶逻辑中前提选择的主流图神经网络忽略了逻辑公式图内部的节点顺序信息。针对此问题，将一种面向高阶逻辑公式的保序方法拓展到一阶逻辑中，并提出了一种基于treelet的图神经网络模型。该模型在信息聚合时一部分聚合中心节点的父、子节点信息，另一部分聚合节点顺序信息。实验分析表明：基于treelet的图神经网络模型在前提选择任务中比最优的主流图神经网络模型的分类准确率提高了约2%。

当期目录

作者中心

审稿中心

在线期刊