计算机工程与科学

2023年第8期目录

2023, 45(08): 0-0. doi:

摘要 ( 124 )

PDF (248KB) ( 227 ) 　　

基于机器学习的多压多温多参标准单元延迟快速计算方法

赵振宇, 杨天豪, 蒋汶乘, 张书政

2023, 45(08): 1331-1338. doi:

摘要 ( 249 )

PDF (913KB) ( 667 ) 　　

标准单元库是芯片设计、分析和验证的基础，其生成需要耗费大量时间和服务器资源，因此供应商往往只提供少量端角的标准单元库。但是，芯片性能、功耗、可靠性等指标的设计需要标准单元在多种电压、温度和参数（驱动强度、沟道长度和阈值电压等）下的延迟信息。为快速实时计算多种端角下标准单元的延迟，提出了一种基于机器学习的多压多温多参标准单元延迟计算方法。通过深入研究影响标准单元延迟的因素，从28 nm工艺标准单元库和时序报告中提取数据构成数据集，使用机器学习算法训练并校准得到了标准单元延迟计算模型。模型的建立仅耗时数分钟，远远低于模拟方法耗费的时间（通常数百小时）。该模型对未知电压下单元延迟的计算平均误差为1.542 ps，未知温度下单元延迟的计算平均误差为1.814 ps，不同参数下单元延迟的计算平均误差为2.202 ps，静态时序分析流程中单元延迟预测偏差小于3%。该方法可以快速实时地计算单元延迟，并且具有较高的准确性，可以应用于签核前的多场景快速时序分析。

一种面向Chiplet互连的高效传输协议设计与实现

熊国杰, 张津铭, 贺光辉

2023, 45(08): 1339-1346. doi:

摘要 ( 323 )

PDF (909KB) ( 524 ) 　　

高效、高带宽、高可靠性的传输协议对于Chiplet异构集成技术有着至关重要的作用。为此，提出了一种面向Chiplet互连的并行传输接口协议。采用新型分层架构提升协议的灵活性和可兼容性；通过基于多路选择链的冗余通道技术提高对物理链路故障的容错性，并在硬件上实现循环冗余校验，从而提升协议的传输可靠性。为了验证提出的传输协议，在2块VC709 FPGA上实现了协议传输通路。实验结果表明，与PCIe相比，所提协议具有带宽高、接口面积小、可靠性高的优势。

应用级兼容RISC-V的混合指令集处理器

孙彩霞, 隋兵才, 邓全, 郑重, 倪晓强, 王永文

2023, 45(08): 1347-1353. doi:

摘要 ( 216 )

PDF (854KB) ( 419 ) 　　

指令集架构的改变会导致处理器硬件平台发生变化,面向旧硬件平台编译的二进制应用程序将无法在新的硬件平台上继续运行。提出了一种应用级兼容多种指令集的混合指令集架构,基于该混合指令集架构的处理器可原生运行多种指令集的应用,能有效避免程序开发移植的重复工作或二进制翻译执行的性能损失。在自主研发的一款处理器基础上实现了应用级兼容RISC-V的混合指令集处理器。与单一指令集相比，应用级支持2种指令集带来的硬件开销仅增加了0.45%。FPGA原型系统成功启动了面向混合指令集架构移植的操作系统,并能正确运行2种指令集的应用,验证了混合指令集架构思想的可行性。RISC-V指令集下,Coremark性能为5.58/MHz,SPECint2006的性能为8.44/GHz,SPECfp2006的性能为10.75/GHz。

基于注意力机制的城市多元空气质量数据缺失值填充

马思远, 焦佳辉, 任晟岐, 宋伟

2023, 45(08): 1354-1364. doi:

摘要 ( 293 )

PDF (1333KB) ( 537 ) 　　

空气污染严重影响着人类的身体健康与社会的可持续发展，但传感器获取的多元变量空气质量数据往往存在缺失值，这为数据的分析与处理带来了困扰。目前，许多对某一种空气成分变化的分析方法只依赖于此属性的时间数据与空间数据，忽略了在相同时间区间内其他空气成分对此属性变化趋势的影响，且在离散型缺失数据的填充上难以达到理想的效果。提出了一种时间注意力深度学习模型(TAM)。该模型使用注意力机制来关注不同时间戳之间的相关性与不同特征时间序列之间的相关性，并结合短期历史数据来填充多元变量空气质量数据中的缺失读数。使用北京市的空气质量数据对所提出的模型进行评估，实验结果表明，相比较于其他10种基线模型，TAM具有一定优势。

基于Surrogate模型的断言覆盖技术研究

史明川, 龙巧洲, 邹鸿基, 李暾

2023, 45(08): 1365-1375. doi:

摘要 ( 150 )

PDF (802KB) ( 314 ) 　　

随着集成电路设计规模不断增大，验证成为制约设计进程的瓶颈之一。目前，仿真仍是集成电路设计验证的主导方法之一，仿真的完备性通常通过各种覆盖率测度来度量。功能覆盖率是抽象层次较高的一种覆盖率，实际工程中，功能常以SystemVerilog断言形式呈现。目前常用的随机测试向量生成较难生成大量激活断言的测试向量；而采用约束求解的策略时，一旦覆盖条件中涉及到非初始输入信号（内部信号、输出信号），约束求解的效率将极为低下，导致仍然难以覆盖目标断言。针对含非初始输入信号断言的覆盖问题，提出了一种利用Surrogate模型的断言覆盖率提升方法，主要是为非初始输入信号生成体现其与初始输入信号关系的、只包含初始输入信号的Surrogate模型，再以此Surrogate模型作为约束求解的对象，降低了约束求解的复杂度。实验结果表明，相比于随机测试向量生成，该方法在断言覆盖方面有较大提升。

一种基于混合加固的容软错误NoC路由器

高文才, 陈小文

2023, 45(08): 1376-1382. doi:

摘要 ( 147 )

PDF (1792KB) ( 319 ) 　　

片上网络已成为众核处理器互连网络的标准范式。然而，随着电源电压的逐渐降低，工艺尺寸的逐渐缩减，片上网络中出现软错误的概率逐渐增大。错误纠正码常用于容软错误的片上网络路由器设计中。然而，传统的路由器设计往往只采用汉明码进行纠错，这样的设计结构简单却存在纠错能力不足的问题。提出了一种基于错误纠正码的混合加固容软错误路由器设计方案，该设计方案的核心思想是，依据信息位重要性的不同，采取不同的容错码设计，实现了路由器可靠性与容错开销之间的权衡。实验结果显示，该设计方案相较于基准设计在合成流量和PARSEC benchmark下实现了系统可靠性的提升；同时，硬件综合结果也表明该设计方案可以缩短4%的关键路径延迟。

海量地铁乘客轨迹相似性连接方法：以深圳地铁为例

王星苏, 熊文, 张瑞

2023, 45(08): 1383-1392. doi:

摘要 ( 185 )

PDF (1044KB) ( 458 ) 　　

当前主要的轨迹相似性连接方法都以GPS轨迹为研究对象。针对GPS轨迹的优化方法无法直接用于解决地铁乘客轨迹相似性连接的问题，充分利用地铁乘客轨迹的时空特征，借助轨迹的重复性和对称性，将轨迹从点序列转化为OD序列。以OD序列为基础的轨迹，长度是原轨迹的一半，对应的索引空间变小，后续的计算量也随之减少。着重研究了基于PPJoin+的轨迹连接算法在Spark平台上的设计与实现。在一个13结点Spark集群和一个包含500万个乘客轨迹集合(5.6亿条刷卡记录)的超大规模数据集上验证了该算法的有效性。实验结果显示，基于OD序列的PPJoin+算法的执行时间为14.0 min，比默认的点序列轨迹连接算法的节约了62.5%，比Dima连接算法的节约了78.2%，并表现出了良好的可扩展性。

边缘计算中的信任问题：挑战与评论

夏戈明, 虞朝栋, 陈健

2023, 45(08): 1393-1404. doi:

摘要 ( 264 )

PDF (647KB) ( 523 ) 　　

边缘计算是未来互联网的重要技术之一。边缘网络包含海量动态异构的边缘设备，其中一些边缘设备可能是恶意的，而恶意的边缘设备会破坏边缘网络内部的数据处理和传输，因此边缘计算面临着严峻的信任需求。对边缘计算中的信任问题进行了深入的调查和研究。首先，从边缘信任管理和边缘信任评估2个方向对目前的研究进行了回顾和分类；然后，重点讨论和比较了基于区块链的信任管理系统和信任评估方法；接着，进一步对边缘信任问题中的可信数据采集的路径规划、信任激励机制、协同信任评估以及边缘计算信任的应用进行了分析与讨论；最后，根据已完成的回顾和评价，探讨了边缘信任问题面临的挑战，并提出了未来研究值得努力的方向。

基于注意力机制的半监督日志异常检测方法

尹春勇, 冯梦雪

2023, 45(08): 1405-1415. doi:

摘要 ( 318 )

PDF (1094KB) ( 513 ) 　　

日志记载着系统运行时的重要信息，通过日志异常检测可以快速准确地找出系统故障的原因。然而，日志序列存在数据不稳定和数据之间相互依赖等问题。为此，提出了一种新的半监督日志序列异常检测方法。该方法利用双向编码语义解析BERT模型和多层卷积网络分别提取日志信息，得到日志序列之间的上下文相关信息和日志序列的局部相关性，然后使用基于注意力机制的Bi-GRU网络进行日志序列异常检测。在3个数据集上验证了所提方法的性能。与6个基准方法相比，所提方法拥有最优的F1值，同时获得了最高的AUC值0.981 3。实验结果表明，所提方法可以有效处理日志序列的数据不稳定性和数据之间相互依赖的问题。

基于Transformer和多特征融合的DGA域名检测方法

余子丞, 凌捷

2023, 45(08): 1416-1423. doi:

摘要 ( 318 )

PDF (795KB) ( 504 ) 　　

针对域名生成算法生成的恶意域名隐蔽性高，现有方法在恶意域名检测上准确率不高的问题，提出一种基于Transformer和多特征融合的DGA域名检测方法。该方法使用Transformer编码器捕获域名字符的全局信息，通过并行深度卷积神经网络获取不同粒度的长距离上下文特征，同时引入双向长短期记忆网络BiLSTM和自注意力机制Self-Attention结合浅层CNN得到浅层时空特征，融合长距离上下文特征和浅层时空特征进行DGA域名检测。实验结果表明，所提方法在恶意域名检测方法上有更好的性能。相对于CNN、LSTM、L-PCAL和SW-DRN，所提方法在二分类实验中准确率分别提升了1.72%，1.10%，0.75%和0.34%；在多分类实验中准确率分别提升了1.75%,1.29%,0.88%和0.83%。

面向路网的空间众包隐私保护任务分配算法

侯占伟, 李鑫, 王辉, 申自浩, 刘琨, 刘沛骞

2023, 45(08): 1424-1432. doi:

摘要 ( 142 )

PDF (1009KB) ( 480 ) 　　

隐私保护和任务分配是空间众包的2个核心问题。现有研究大多基于欧氏空间使用地理不可区分性保护位置隐私，但忽略了底层的路网信息，由此带来了众包工人的隐私泄露和效用损失。为了保护工人位置隐私，同时产生较小的效用损失，提出了面向路网的隐私保护批处理任务分配算法。首先，提出了图指数机制优化问题，并设计了一种贪心算法寻找近似最优解，同时引入边缘服务器作为工人的隐私保护代理。然后，将任务分配问题转化为以工人旅行距离为权值的二分图最大流问题，采用KM算法得到最优解。最后，通过实验验证了所提算法在隐私保护程度和效用上均有明显提升。

基于预训练语言模型的安卓恶意软件检测方法

印杰, 黄肖宇, 刘家银, 牛博威, 谢文伟,

2023, 45(08): 1433-1442. doi:

摘要 ( 295 )

PDF (1192KB) ( 534 ) 　　

近年来，基于有监督机器学习的安卓恶意软件检测方法取得了一定进展。但是，由于恶意软件样本搜集困难，带标签的数据集规模一般较小，导致训练出的有监督模型泛化能力有限。针对这一问题，提出无监督和有监督相结合的恶意软件检测方法。首先，使用无监督方法预训练语言模型，从大量无标记APK样本中学习字节码中丰富、复杂的语义关系，提高模型的泛化能力。然后，利用有标记的恶意软件样本对语言模型进行微调，使其能更有效地检测恶意软件。在Drebin等实验数据集上的实验结果表明，相比基准方法，提出的方法泛化能力更好，检测性能更优，最高检测准确率达98.7%。

基于双模态的小角散射图像结构表征技术研究

谷文俊, 张晟恺, 邱晓梦, 李亚康, 宋伟

2023, 45(08): 1443-1452. doi:

摘要 ( 136 )

PDF (1035KB) ( 319 ) 　　

小角X射线散射设备的不断升级和发展产生了更多更高维的散射数据，给研究人员快速获取实验结果带来了极大挑战。亟需有效的自动化分类方法，加快数据表征速度的同时保证较高的准确率。然而，许多模型学习特征主要针对光照图像，忽略了散射图像特点，分类准确率较低。因此，基于散射模式特点，提出了一种双模态细粒度特征提取模型BRTNet。该模型采用双模态输入模式，其一为采用多尺度卷积为架构的特征学习网络PRS，学习散射图像的微观信息；其二为融合局部信息的多头注意力机制ConvTransformer，学习散射序列的相关性信息。然后，模型结合图像信息和序列信息，融合双分支特征，对散射数据进行分类并获得分类结果。在生物溶液散射数据集上的实验结果表明，模型分类准确率超89%，同基准模型相比具有较为明显的优势。

融入注意力机制的多尺度卷积图像去雾方法

唐剑, 车文刚, 高盛祥

2023, 45(08): 1453-1462. doi:

摘要 ( 234 )

PDF (2304KB) ( 619 ) 　　

图像的去雾问题是一项富有挑战性的视觉任务。以往的图像去雾方法往往过于依赖雾天图像退化的物理模型，且当前利用卷积神经网络进行图像去雾的模型较为复杂，基于此提出一种不依赖于物理模型的轻量级去雾网络MADNet。该网络主要由融入注意力机制的多尺度卷积模块构成，通过将有雾图像看成是清晰的无雾图像和雾度残留图像组成，让MADNet直接学习目标无雾图像和输入的有雾图像之间的雾度残留物，最后实现端到端的图像去雾。实验结果表明，MADNet在数据集SOTS和NH-HAZE上的结构相似性和峰值性噪比均优于其它对比方法的，在真实场景中也能取得较好的去雾效果。

基于轻量化YOLOX的电子元器件缺陷检测方法研究

吴栋梁, 刘知贵,

2023, 45(08): 1463-1471. doi:

摘要 ( 256 )

PDF (1361KB) ( 532 ) 　　

针对传统目标检测方法在对电子元器件进行缺陷检测时存在参数量大、检测效率低的问题，提出了一种基于轻量化YOLOX检测网络的目标检测方法。首先，使用深度可分离卷积对主干网络实现轻量化处理，减少参数量的同时提高检测速度；其次，构建基于空间金字塔的通道注意力模型，对不同尺度特征进行筛选融合，加强小尺寸缺陷的特征权重；在特征融合的采样过程中，加入高效通道注意力，在略微增加参数量的情况下，提升检测精度；最后，采用EIoU损失函数优化IoU损失函数，并使用余弦退火算法来使模型达到最佳检测效果。采用自制的电子元器件外观缺陷数据集进行实验，所提方法的平均检测精度达到98.96%，每幅图像的检测时间大约为0.09 s，与原YOLOX网络相比检测速度提高了一倍，模型大小缩小了约60%，并且在PCB瑕疵公共数据集上进行了验证，结果表明所提方法实现了目标缺陷的快速检测。

图卷积神经网络综述

刘俊奇, 涂文轩, 祝恩

2023, 45(08): 1472-1481. doi:

摘要 ( 832 )

PDF (787KB) ( 1822 ) 　　

由于图数据的广泛存在，图卷积神经网络发展速度越来越快。根据卷积算子定义方式的不同，图卷积神经网络大体可以分为2类，其中一类基于谱方法，另一类基于空间方法。首先对这2类方法中的代表性模型以及二者之间的联系进行详细论述，并进一步全面总结图的池化操作;接着介绍了图卷积神经网络在各个领域中的广泛应用;最后提出了图卷积神经网络的几个可能的发展方向并对全文进行了总结。

基于高低阈值的脉冲神经元抗噪学习算法

杨静, 徐彦, 姜赢

2023, 45(08): 1483-1489. doi:

摘要 ( 126 )

PDF (1485KB) ( 320 ) 　　

脉冲神经元的动态阈值学习算法在训练神经元的过程中通过改变阈值的大小，可以有效提高神经元的抗噪能力。然而，动态阈值的使用又会降低神经元的学习精度，且在与基于梯度下降的学习算法结合使用时容易导致神经元沉默。基于此，提出了一种改进的基于梯度下降的高低阈值抗噪算法，使用高低阈值来避免神经元的学习精度损失，并在神经元沉默时使用虚拟激发脉冲来继续学习过程，同时使用动态的学习速率来降低高低阈值对学习周期的影响程度。实验结果表明，该算法可以显著提高神经元的抗噪能力，并且能够保证学习精度和收敛速度，适用于基于梯度下降的脉冲神经元学习算法。

基于NPN融入词性注意力机制的中文事件探测

胡庆孟, 王红斌, 王俊钟

2023, 45(08): 1490-1497. doi:

摘要 ( 170 )

PDF (712KB) ( 314 ) 　　

事件探测主要研究触发词探测以及事件类型识别。现阶段基于深度学习的模型大部分集中在利用语义角色信息、句法依存树信息以及预训练模型方面，忽略了词性的重要性。针对这个问题，提出基于块提取网络融入词性注意力机制的中文事件探测方法，首先基于NLP词性标注工具获得词性序列，然后使用CBOW算法获得词性嵌入，最后在模型中使用词性嵌入计算词性注意力用于事件探测。在ACE2005数据集上进行实验，融入词性注意力后模型在事件探测任务上的F1分数分别提升了3.8%和2.4%，表明了该方法的有效性。

基于RoBERTa-wwm-BiLSTM-CRF的扶持政策文本实体识别研究

喻金平, 朱伟锋, 廖列法

2023, 45(08): 1498-1507. doi:

摘要 ( 288 )

PDF (682KB) ( 521 ) 　　

扶持政策能够帮助企业获得政府在资金补助、税务减免等方面的支持，帮助企业更好地发展。针对扶持政策文本存在实体边界难以划分且传统词向量无法解决一词多义的问题，提出基于RoBERTa-wwm-BiLSTM-CRF的扶持政策文本实体识别模型。该模型使用预训练语言模型RoBERTa-wwm训练得到动态词向量，能够表征词的多义性；利用BiLSTM网络进一步抽取扶持政策文本的上下文信息和语义特征；最后通过条件随机场得到最佳的预测序列。提出的模型在自建的5 512条语料组成的扶持政策数据集上的F1值达到91.7%，结果表明，该模型能够有效识别扶持政策文本的命名实体，从而提高企业筛选政策的效率。

多策略融合改进的均衡优化算法及其应用

罗仕杭, 何庆

2023, 45(08): 1508-1520. doi:

摘要 ( 275 )

PDF (1057KB) ( 486 ) 　　

针对均衡优化(EO)算法寻优过程中存在兼顾全局探索和局部开发能力弱、寻优精度低、易陷入局部最优等问题，提出多策略融合改进的均衡优化算法(MEO)。首先，采用高破坏性多项式突变策略初始化种群，提高初始阶段解的质量，为全局寻优奠定基础；其次，提出差分变异的重构均衡池策略，丰富迭代过程中种群的多样性，增强算法规避局部最优的能力；同时，采用S型变换因子平衡算法的全局探索和局部开发能力；最后，引入动态螺旋搜索策略，扩大算法的搜索范围，提高算法的收敛精度和速度。仿真实验将MEO算法与标准EO算法以及其他元启发式算法在8个基准测试函数上进行寻优比较，实验结果与Wilcoxon秩和检验结果均表明，本文改进策略能提高EO算法的寻优精度、全局探索和局部开发的能力以及跳出局部最优的能力。另外，将MEO算法应用在无线传感器网络(WSN)覆盖优化中，实验结果表明，MEO算法可以显著提高WSN的覆盖率，降低节点的冗余度，使节点分布更均匀。

当期目录

作者中心

审稿中心

在线期刊