计算机工程与科学

2024年第6期目录

2024, 46(6): 0-0. doi:

摘要 ( 300 )

PDF (257KB) ( 512 ) 　　

基于PSS+PXF的ISF高精度振荡器噪声分析模型

袁珩洲, 桑浩, , 刘胜, , 陈小文, , 颜广达, 郭阳,

2024, 46(6): 951-958. doi:

摘要 ( 697 )

PDF (1160KB) ( 1059 ) 　　

提出了一种基于PSS+PXF的ISF的相位噪声模型，用于预测振荡器的相位噪声。该模型相对传统的拉扎维模型考虑了振荡器的非线性时变特性，因此更加精确。通过仿真验证了该模型的有效性，基于PSS+PXF的ISF的相位噪声模型精度相比传统拉扎维模型提升200%以上。

基于Actor模型的众核数据流硬件架构探索

张家豪, 邓金易, 尹首一, 魏少军, 胡杨

2024, 46(6): 959-967. doi:

摘要 ( 635 )

PDF (1750KB) ( 824 ) 　　

超大规模AI模型的分布式训练对芯片架构的通信能力和可扩展性提出了挑战。晶圆级芯片通过在同一片晶圆上集成大量的计算核心和互联网络，实现了超高的计算密度和通信性能，成为了训练超大规模AI模型的理想选择。AMCoDA是一种基于Actor模型的众核数据流硬件架构，旨在利用Actor并行编程模型的高度并行性、异步消息传递和高扩展性等特点，在晶圆级芯片上实现AI模型的分布式训练。AMCoDA的设计包括计算模型、执行模型和硬件架构3个层面。实验表明，AMCoDA 能广泛支持分布式训练中的各种并行模式和集合通信模式，灵活高效地完成复杂分布式训练策略的部署和执行。

面向飞腾迈创DSP的自主软件栈设计

时洋, 陈照云, 孙海燕, 王耀华, 文梅, 扈啸

2024, 46(6): 968-976. doi:

摘要 ( 1278 )

PDF (1494KB) ( 1296 ) 　　

飞腾迈创DSP是国防科技大学计算机学院为了突破卡脖子技术,解决我国相关重点领域内芯片长久受制于人的现实问题而自主设计的高性能数字信号处理器。由于该系列芯片采用全自主设计的指令集,无法兼容已有的软件,一套自主完备且高效的软件栈是决定飞腾迈创DSP生命力的关键。基于团队长期以来的持续工作,系统阐述了飞腾迈创DSP软件栈的设计原则与层次化架构,重点介绍了包括支持层、编译层以及工具层在内的相关软件工具的创新功能、实现方法以及性能。同时,结合用户的反馈与团队的思考,还讨论了飞腾迈创DSP软件栈未来需要探索的相关问题。

面向广义Chiplet的高速BGA与PCB传输结构设计

陈天宇, 李川, 王彦辉

2024, 46(6): 976-983. doi:

摘要 ( 541 )

PDF (1667KB) ( 779 ) 　　

从广义Chiplet互连设计出发，重点研究BGA区域孔串扰分析方法和优化措施。提出以单元阵列孔建模计算作为全芯片BGA区域孔串扰评估方式，进一步根据不同布线层互连分析需求构建了多层扇出的孔建模平台。单元阵列孔建模分析结果和多层扇出孔阵建模分析结果相互印证，说明以单元阵列作为串扰评估最小单元是准确的，多层扇出孔阵建模方式是高效可行的。采用多层扇出孔阵建模平台对2种BGA封装管脚对应的PCB孔串扰进行了对比分析。结果显示，在封装管脚设计时，提高邻近信号孔间距与邻近信号孔地孔间距比例比增加地孔数量和管脚间距更能有效地抑制串扰。

面向众核CPU的稠密线性求解器性能评测与优化

付晓, 苏醒, 董德尊, 钱程东

2024, 46(6): 984-992. doi:

摘要 ( 709 )

PDF (1739KB) ( 999 ) 　　

稠密线性求解器在高性能计算和机器学习等领域扮演着重要的角色。其典型的并行算法实现通常构建在著名的fork-join或task-based编程模型之上。尽管采用fork-join模型的主流稠密线性代数库能将大部分的计算转移到高度优化、高性能的BLAS 3例程上，由于fork-join不灵活的执行流，它们仍然未能高效地利用众核CPU的计算资源。采用task-based编程模型的开源库能实现更加灵活、负载更均衡的算法，因此能获得明显的性能提升。然而，在众核CPU平台上，尤其是对于中等矩阵规模的问题而言，它们仍然有较大的优化空间。对稠密线性求解器的性能进行了全面的测评，以定位性能瓶颈，并提出了2种优化策略，以提高程序性能。具体地，通过重叠LU分解和下三角求解的计算过程,减少同步开销线程的空等，从而提高算法的并行性；进一步通过减少冗余的矩阵打包操作，降低算法的访存开销。分别在2个主流的众核CPU平台（Intel Xeon Gold 6252N（48核）和HiSilicon Kunpeng 920（64核））上进行了性能评估。实验结果表明，该优化的稠密线性求解器在上述两个CPU平台上，相比最佳开源实现分别取得了10.05%（Xeon）和13.63%（Kunpeng 920）的性能提升。

基于遗传算法的晶圆级芯片映射算法研究

李成冉, 方佳豪, 尹首一, 魏少军, 胡杨

2024, 46(6): 993-1000. doi:

摘要 ( 1756 )

PDF (1212KB) ( 1051 ) 　　

近年来，随着人工智能领域的发展，深度学习已经成为如今最重要的计算负载之一，下一代人工智能以及高性能计算应用对计算平台的算力与通信能力提出了前所未有的需求，晶圆级芯片通过在整片晶圆上集成超高密度的晶体管数量以及互连通信能力，有望为未来的人工智能与超算平台提供革命性的算力解决方案。而其中，晶圆级芯片具有的超大计算资源和独特的新架构使得任务映射算法面临前所未有的新问题，相关研究成为近年来学术界的研究重点。专注于研究人工智能任务在晶圆级硬件资源的映射算法，即通过将人工智能算法表达为多个卷积核，再考虑卷积核的算力特性来基于遗传算法设计晶圆级芯片的映射算法。一系列映射任务下的仿真结果验证了映射算法的有效性，并揭示了执行时间、适配器成本等参数对代价函数的影响。

带宽异构网络下的精确修复再生码数据修复方案

王艳, 皮婵娟, 刘亚东, 施君豪

2024, 46(6): 1001-1012. doi:

摘要 ( 881 )

PDF (1052KB) ( 635 ) 　　

再生码技术以高容错性、低冗余开销等优点在数据存储领域得到了广泛应用，但基于再生码的冗余技术在修复失效数据时需从其他帮助节点下载多个编码块。考虑到节点间链路带宽的异构性，在实际网络中链路可用带宽容量变化很大，网络流量最小化并不一定意味着数据修复时间最小化，并且现有针对带宽异构网络下的再生码数据修复方案难以支持精确地修复再生码。由于精确修复再生码具有特定的数学结构，其并行修复难以实现，因此提出一个在带宽异构网络下实现精确修复再生码的数据修复方案ERC-TREE，此方案通过构建一棵最优树来有效利用帮助节点之间的可用带宽，从而实现失效节点数据的精确修复。仿真实验结果表明，在带宽异构网络下采用树型结构修复对精确修复再生码具有可行性。在带宽差异很大的情况下，ERC-TREE的数据修复时间相比星型结构的修复时间减少78%。

基于隐形后门水印的开源数据集版权保护

黄智慧, 肖祥立, 张玉书, 薛明富

2024, 46(6): 1013-1021. doi:

摘要 ( 1108 )

PDF (1264KB) ( 817 ) 　　

针对图像分类领域开源数据集的版权保护问题，提出了一种基于后门水印的可溯源方法IBWOD，其能够保证水印在具有较强隐蔽性的同时保持良好的可用性和有效性。首先，利用一个编码器-解码器网络将后门水印嵌入到所选取的部分样本中，生成水印样本。接着，修改这些水印样本的标签为指定标签，然后将水印样本与未修改的样本合并为水印数据集。使用该水印数据集训练的模型会留下特定后门，即从后门水印到指定标签的一种映射关系。最后，提出了一种相应的模型验证算法，基于这种特殊的映射关系来验证一个可疑模型是否使用了水印数据集。实验结果表明，IBWOD能够很好地验证模型是否使用了水印数据集，并具有较强的隐蔽性。

基于标识密码的内生安全最短路径优先协议

荀鹏, 陈红艳, 王勇志, 李世杰

2024, 46(6): 1022-1031. doi:

摘要 ( 682 )

PDF (1068KB) ( 699 ) 　　

路由协议如开放的最短路径优先协议OSPFV2的安全运行对网络的连通及信息安全传输至关重要。传统OSPFV2协议在设计上缺少抵御源路由伪造或路由信息篡改的能力，致使组网易遭遇攻击，而现有的安全策略多为外挂式，易引发新的安全问题或安全效能低，为此，提出基于标识密码的内生安全OSPFV2协议，将标识密码内嵌于路由交换流程内，使网络具备高效的、内生式的抵御路由在传输过程中的篡改和伪造攻击能力。另一方面，考虑大范围部署安全OSPFV2协议存在多种限制因素，利用不透明链路状态通告，设计支持增量部署的运行机制。仿真实验表明，设计的内生安全OSPFV2协议在不损耗过多收敛时延的同时，具备抵御源路由伪造、数据篡改的安全能力。

区块链环境中的隐私保护推荐算法研究

赵文韬, 官礼和, 何建国, 唐昊

2024, 46(6): 1032-1040. doi:

摘要 ( 1525 )

PDF (888KB) ( 812 ) 　　

针对区块链环境中推荐算法难以抵御恶意攻击和推荐效果不佳的问题，一方面，提出了基于整数向量的快速同态加密算法，对用户数据进行隐私保护，其安全性由LWE问题保证；另一方面，基于E2LSH设计了一种高效的个性化推荐算法，该算法根据哈希桶编号进行密钥分发，从而使得同一哈希桶中的用户能进行同态加密运算并快速计算相似度。在区块链+IPFS的基础系统模型上，使用公用数据集与最新相关的隐私保护推荐算法进行了对比实验，实验结果表明，所提算法在安全性和隐私性得到保障的同时拥有理想的推荐效果和速度。

基于影响力地图的计算机兵棋推演路径规划

吕倩茹, 杨翔瑞, 蔡志平

2024, 46(6): 1041-1049. doi:

摘要 ( 1564 )

PDF (2262KB) ( 785 ) 　　

兵棋推演是一种描述战争行动的作战模拟工具，兵力机动是作战行动的基础，而路径规划则是作战行动的核心内容。路径规划简化为图论中的最短路径求解。然而，战术路径不等价于最短路径。考虑到战场推演的复杂性、信息多样性和动态性等特点，战术路径采用战场态势与路径规划分离的决策方法导致作战行动失败。提出了一种能将战场态势与地图信息有效融合的战术路径规划算法，该算法在传统A*算法的基础上，结合影响力地图对战场态势因子进行数值化，并采用数值化态势因子结合地形因子作为改进A*算法目标函数，从而在相同算法复杂度条件下使A*算法向战术最优路径收敛。通过仿真实验表明，相较于传统A*算法，该算法能够支持更复杂多样的战术路径规划，战场态势信息指导路径规划能够有效降低机动时一方所受战损并提高我方进攻能力，塑造整体有利态势。

基于YOLOv8改进的密集行人检测算法：MER-YOLO

王泽宇, 徐慧英, 朱信忠, 李琛, 刘子洋, 王子奕

2024, 46(6): 1050-1062. doi:

摘要 ( 2734 )

PDF (3288KB) ( 2178 ) 　　

在大型人员密集的场所中，人群异常聚集情况时有发生，对自动驾驶和大型公共场所人流量监控系统等应用场景中涉及到的密集行人检测技术带来了一定挑战，新一代的密集行人检测技术要求精确度更高、计算开销更小、检测速度更快以及部署更加方便等。针对上述需求，提出了一种基于YOLOv8改进的轻量级密集行人检测算法MER-YOLO，首先采用MobileViT作为主干网络，提升模型在总体上对行人聚集区域的特征提取能力；引入EMA注意力机制模块，对全局信息进行编码，通过维度交互来进一步聚合像素级特征，并结合160×160尺度的检测头加强小目标检测能力；使用排斥损失(Repulsion Loss)作为边界框损失函数，减少了人群密集情况下小目标行人的漏检误检的情况。实验结果表明，相较于YOLOv8n，MER-YOLO行人检测算法在Crowd Human数据集上mAP@0.5提升了4.5%，在WiderPerson数据集上mAP@0.5提升了2.1%，同时只有3.1×106的参数量和9.8 GFLOPs，满足低算力兼顾高精度的部署需求。

改进Faster R-CNN的遥感图像小目标检测算法

胡昭华, 王长富,

2024, 46(6): 1063-1071. doi:

摘要 ( 1052 )

PDF (1062KB) ( 927 ) 　　

遥感图像目标检测是目标检测领域的一个关键问题，目前利用深度学习检测目标的算法大多在单向特征融合过程中添加注意力机制，一视同仁地去增强各类型的目标，并不能突出小目标。为了取得更好的检测效果，通过引入非对称高低层调制机制，构造兼顾低层细节信息和高层语义信息的特征图，以达到增强小目标特征检测的目的；同时使用DIoU损失函数代替原算法SmoothL1损失函数以提升算法检测精度与收敛速度；并且在感兴趣区域分类任务中引入灵活上下文信息以提高小目标分类准确性。实验结果表明，该算法在DIOR和NWPU VHR-10数据集上均取得了良好的表现。

基于网络融合的改进MobileViT人脸表情识别

邓翔宇, 裴浩媛, 盛迎

2024, 46(6): 1072-1080. doi:

摘要 ( 802 )

PDF (1407KB) ( 1065 ) 　　

从轻量化模型的角度提出一种基于网络融合的改进MobileViT人脸表情识别网络。该网络将多尺度卷积PSConv和注意力机制通过残差结构进行融合，形成RAPSConv特征重构模块，该模块能从细粒度角度更高效地提取多尺度特征，加强关键特征表达，进而提高网络的表达能力，构建出一个端到端的表情识别网络。同时，为了进一步缩小同类表情间差距，提出联合使用Softmax Loss和Center Loss损失函数，有效减少了表情识别的误判率。实验结果表明，改进后的网络在3个自然场景表情数据集FER2013、FER+和RAF-DB上的准确率均优于基础网络MobileViT，准确率分别提高了1.73%，2.18%和1.64%，改进后的网络参数量较少，鲁棒性较强，便于实现轻量化和集成，适合人脸表情识别在现实场景中的应用。

对抗环境中基于种群多样性的鲁棒策略生成方法

庄述鑫, 陈永红, 郝一行, 吴巍炜, 徐学永, 王万元

2024, 46(6): 1081-1091. doi:

摘要 ( 909 )

PDF (1201KB) ( 855 ) 　　

在对抗博弈环境中,目标智能体希望生成具有高鲁棒性的博弈策略，使得目标智能体在面对不同对手策略时，始终具有较高的收益。现有的基于自我博弈的策略生成方法通常会过拟合到针对对手某个特定策略进行学习，所学习到的策略鲁棒性低且容易受到其他对手策略的攻击。此外，现有的结合深度强化学习和博弈论方法迭代生成对手策略的方法在复杂且具有庞大决策空间的对抗场景下收敛效率低。鉴于此，提出一种基于种群多样性的鲁棒策略生成方法，其中对抗双方各自维护一个种群策略池，并且需要保证种群中的策略是具有多样性的，以此生成鲁棒的目标策略。为了保证种群多样性，将从策略的行为和质量2个视角度量策略的多样性，其中行为多样性是指不同策略状态-动作轨迹的差异性，质量多样性是指不同策略面对相同对手时最终获得的收益的差异性。最后，在典型的具有连续状态、连续动作的对抗环境中验证了所提出的基于种群多样性所生成的策略的鲁棒性。

Corrective-Net：面向多标签文本分类的标签关联学习模块

肖新正, 黄瑞章, 陈艳平, 秦永彬, 宋玉梅, 周裕林,

2024, 46(6): 1092-1100. doi:

摘要 ( 1002 )

PDF (1390KB) ( 894 ) 　　

在目前的多标签文本分类任务中，主要面临以下2个问题：(1)侧重文本表示学习，对标签之间的关联信息建模不充分；(2)尽管使用了标签关联信息来改善多标签分类任务，但对标签关联的建模过于依赖人工预定义的外部知识，而外部知识的获取成本高昂，限制了其实际应用。针对以上问题，提出了一种面向多标签文本分类的标签关联学习模块Corrective-Net。该模块可以在不依赖外部知识的前提下，自动学习数据中的标签关联信息；同时，它还可以利用标签关联信息，对基础分类模块的初始预测结果进行修正，使得最终预测兼顾语义信息和标签关联信息，以获得更精准的多标签预测结果。在AAPD和SO数据集上的大量实验表明，Corrective-Net具有通用性和有效性，通过分析标签修正对各个标签性能的影响，得到了显式的标签关联信息，并进行了可视化。

基于新图模糊距离的EDAS决策方法及其应用

王磊, 柳然然

2024, 46(6): 1101-1111. doi:

摘要 ( 655 )

PDF (576KB) ( 859 ) 　　

研究决策信息为图模糊集的多属性决策问题。首先，针对现有图模糊距离的不足，定义了含参数的弃权度的分配，同时结合一致性概念提出了反映决策者风险偏好的图模糊距离，通过数值算例将新图模糊距离与现有图模糊距离进行比较分析，验证其优越性。其次，针对属性权重，采用博弈论组合赋权法对熵权法确定的客观权重和决策者给出的主观权重进行组合优化。在此基础上，将新图模糊距离拓展到一种离平均方案距离的决策方法(EDAS)，并运用新图模糊距离计算各方案与平均方案的正、负距离加权和，进而得到综合得分。最后，通过算例来验证所提决策方法的适用性和有效性。灵敏度与对比分析结果表明：决策者可以依据自身风险偏好调整参数的取值来满足不同的决策需求；所提方法相较于其他现有决策方法更具一般性与灵活性，所得排序结果更加合理。

基于情感增强和语义依存的金融隐式情感分析模型

张玉莹, 朱广丽, 谈光璞,

2024, 46(6): 1112-1120. doi:

摘要 ( 691 )

PDF (850KB) ( 829 ) 　　

金融情感分析是一种判断金融文本的情感倾向性的技术，广泛应用于舆情分析和监管协调等方面。由于金融领域文本中包含隐式情感信息，难以根据情感特征直接判定情感极性。针对这一问题，提出一种基于情感增强和语义依存的金融隐式情感分析模型(FSED)，以期提高分类的准确率。首先，采用FinBERT生成词向量，并输入到Bi-GRU提取上下文语义信息，通过嵌入积极和消极情感词向量构建两极注意力机制，用于分别提取2种语境下的情感特征向量；然后，根据文本的语义依存图建立依存关系和关系类型矩阵，结合2种矩阵和top-k策略构建选择注意力矩阵，再输入到图卷积网络来提取文本的语义依存特征；最后，融合情感增强和语义依存的特征，并使用平均池化和最大池化层对特征进行压缩，经全连接层和Softmax获得分类结果。实验结果表明，相较于A-GCN，FSED可以提升金融领域隐式情感分析的准确率。

融合音素的缅甸语语音识别文本纠错

陈璐, 董凌, 王文君, 王剑, 余正涛, 高盛祥,

2024, 46(6): 1121-1127. doi:

摘要 ( 1013 )

PDF (1286KB) ( 1226 ) 　　

缅甸语语音识别文本中包含大量的同音和空格错误，使用通用的文本语义信息纠正错误字符，对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言，并且音素中包含了声调信息，因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模，利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明，本文所提方法相比基线方法ConvSeq2Seq，在缅甸语语音识别纠错任务中的F1值提升了85.97%，达到了79.15%。

基于双向局部开发和黄金正弦的异构导向的鲸鱼优化算法

徐慧玲, 刘升, 李安东

2024, 46(6): 1128-1140. doi:

摘要 ( 730 )

PDF (1046KB) ( 1020 ) 　　

为了解决鲸鱼优化算法WOA准确率低和稳定性差的问题，提出了一种基于双向局部开发和黄金正弦算法的异构导向的鲸鱼优化算法LEDGWOA。在搜索猎物阶段嵌入黄金正弦算子，结合“更优更近”的原则，增强个体间信息交流的强度。此外，根据适应度值区分出统治鲸鱼群，用自适应惯性权重计算出一个虚拟领导者。在包围猎物阶段时，整合切比雪夫阈值的双向开发策略，从而加强了邻域的开发强度。随机螺旋式更新可以间接地增加种群在迭代后期的分散度。改进后的算法在CEC2017和CEC2019函数上进行仿真实验，并成功应用于压力容器的优化设计。LEDGWOA与17种算法进行对比，结果表明其具有优越的性能。

当期目录

作者中心

审稿中心

在线期刊