计算机工程与科学

2024年第3期目录

2024, 46(3): 0-0. doi:

摘要 ( 343 )

PDF (243KB) ( 546 ) 　　

DRM:基于迭代归并策略的GPU并行SpMV存储格式

王宇华, 何俊飞, 张宇琪, 徐悦竹, 崔环宇

2024, 46(3): 381-394. doi:

摘要 ( 888 )

PDF (2000KB) ( 883 ) 　　

稀疏矩阵向量乘（SpMV）在线性系统的求解问题中具有重要意义，是科学计算和工程实践中的核心问题之一，其性能高度依赖于稀疏矩阵的非零分布。稀疏对角矩阵是一类特殊的稀疏矩阵，其非零元素按照对角线的形式密集排列。针对稀疏对角矩阵，在GPU平台上提出的多种存储格式虽然使SpMV性能有所提升，但仍存在零填充和负载不平衡的问题。针对上述问题，提出了一种DRM存储格式，利用基于固定阈值的矩阵划分策略和基于迭代归并的矩阵重构策略，实现了少量零填充和块间负载平衡。实验结果表明，在NVIDIA Tesla V100平台上，相比于DIA、HDC、HDIA和DIA-Adaptive格式，在时间性能方面，该存储格式分别取得了20.76,1.94,1.13和2.26倍加速;在浮点计算性能方面，分别提高了1.54,5.28,1.13和1.94倍。

未知工艺角下时序违反的机器学习预测

黄鹏程, 冯超超, 马驰远,

2024, 46(3): 395-399. doi:

摘要 ( 520 )

PDF (549KB) ( 794 ) 　　

集成电路设计复杂性的增长以及工艺尺寸的持续缩减给静态时序分析以及设计周期带来了新的严峻挑战。为了提升静态时序分析效率、缩短设计周期，充分考虑FinFET工艺特性以及静态时序分析原理，提出了未知工艺角下时序违反的机器学习预测方法，实现了基于部分工艺角的时序特性来预测另外一部分工艺角的时序特性的目标。基于某工业设计进行实验，结果表明，提出的方法利用5个工艺角时序预测另外31个工艺角时序，可达到小于2 ps的平均绝对误差，远远优于传统方法所需的21个工艺角，显著改善了预测精度和减少了静态时序分析工作量。

可满足性模理论综述

唐傲, 王晓峰, 何飞

2024, 46(3): 400-415. doi:

摘要 ( 1211 )

PDF (1183KB) ( 1768 ) 　　

可满足性模理论（SMT）是指判定一阶逻辑公式在特定背景理论下的可满足性问题。基于一阶逻辑的SMT相比SAT描述能力更强、抽象能力更高，能处理更加复杂的问题。SMT求解器在各个领域都有应用，已经成为重要的形式化验证引擎。目前，SMT已被广泛应用在人工智能、硬件RTL验证、自动化推理和软件工程等领域。根据近些年SMT的发展，首先阐述SMT基本知识和常见的背景理论；然后分析总结Eager方法、Lazy方法和DPLL(T)方法的实现流程，并进一步介绍主流求解器Z3、CVC5和MathSAT5的实现过程；接着介绍SMT的扩展问题#SMT、SMT应用在深度神经网络的SMTlayer方法和量子SMT求解器；最后对SMT的发展进行展望，并讨论其面临的挑战。

移动边缘计算中计算卸载与资源分配联合优化策略

刘向举, 李金贺, 方贤进, 王宇

2024, 46(3): 416-426. doi:

摘要 ( 997 )

PDF (1534KB) ( 1774 ) 　　

为了在移动边缘计算(MEC)中最大限度地减少处理用户任务的时延和能耗，改善用户体验，以最小化用户的完成时间和能耗的加权和为目标，在计算资源的约束下研究了多用户、多MEC服务器中的计算卸载问题。针对此问题，考虑卸载决策和资源分配之间存在的依赖关系，首先将原问题解耦为卸载决策和计算资源分配2个子问题。然后，使用鲸鱼优化算法求解卸载决策问题，通过添加非线性收敛因子和惯性权重加快收敛速度；引入反馈机制，防止陷入局部最优，得到更高概率可行的卸载决策；对于资源分配问题使用拉格朗日乘子法得到每个卸载决策下的最佳计算资源分配解。最后，通过多次迭代得到稳定的收敛解。仿真实验结果表明，与其他基准方案相比，最多减少了44.6%的系统开销。

基于胶囊网络的异常多分类模型

阳予晋, 王堃, 陈志刚, 徐悦, 李斌

2024, 46(3): 427-439. doi:

摘要 ( 833 )

PDF (2943KB) ( 769 ) 　　

国网公司日益庞大的服务器集群产生的大量生产运行数据，以及实时分析各类设备、系统产生的海量监控数据成为电力IT运维工作的新挑战。异常检测技术作为智能电网信息运维工作的关键技术，可以有效检测运维故障并及时告警，避免损坏敏感设备。目前一些传统异常检测方法检测的异常种类少且精度低，导致故障发现不及时。为了应对这一挑战，提出了基于胶囊网络的多维时间序列异常多分类模型NNCapsNet。首先，应用无监督算法结合专家知识对电网营销业务应用服务器性能监控数据进行预处理和标注。其次，引入胶囊网络进行分类和异常检测。五折交叉验证的实验结果表明，NNCapsNet在包含15类异常的数据集上实现了91.21%的平均分类准确度。还在包含2万条监控数据的数据集上与4个基准模型进行了对比，NNCapsNet在关键评估指标上均取得了较好的结果。

结合决策树和AdaBoost的缓存侧信道攻击检测

李扬, 尹大鹏, 马自强, 姚梓豪, 魏良根,

2024, 46(3): 440-452. doi:

摘要 ( 1084 )

PDF (1520KB) ( 776 ) 　　

缓存侧信道攻击严重威胁各类系统的安全，对攻击进行检测可以有效阻断攻击。为此，提出了一种基于决策树和AdaBoost的AD检测模型，通过匹配系统硬件事件信息特征，快速有效地识别缓存侧信道攻击。首先，分析缓存侧信道攻击特点，提取攻击硬件事件特征模式。其次，利用决策树的快速响应能力，同时结合AdaBoost对数据样本进行加权迭代，对采集的不同负载下的特征数据进行模型训练，优化检测模型在不同负载时的整体检测精度。实验结果表明，该模型在不同系统负载条件下的检测精度均不低于98.8%，能够快速准确地检测出缓存侧信道攻击。

身份加密多云多副本完整性审计协议

张逢, 文斌, 闫一非, 曾昭武, 周伟,

2024, 46(3): 453-462. doi:

摘要 ( 753 )

PDF (1054KB) ( 789 ) 　　

为解决现有可证明数据持有(PDP)协议只适用于单云存储服务器且过度依赖公钥基础设施的问题，提出一种新的基于身份的多云多副本PDP协议。该协议采用身份加密来简化证书管理，并设计双层默克尔哈希树作为新的安全数据结构，以维护多副本的新鲜性和一致性。安全性分析和实验结果均验证了该协议具备安全性和高效性，能够在多个云存储服务器上实现多副本完整性审计，并在标签生成、证据生成和证据验证3个阶段的效率上明显优于对比算法。

面向工业缺陷分类的交互式易混淆缺陷分离方法研究

罗月童, 李超, 周波, 张延孔

2024, 46(3): 463-470. doi:

摘要 ( 484 )

PDF (1202KB) ( 781 ) 　　

在工业生产中会根据严重程度对缺陷做不同处理，所以需要对缺陷进行分类。但是，实际生产中经常因为存在一些易混淆缺陷而导致分类精度不够，使得在生产实践中只能对所有缺陷进行保守处理，带来很大人力成本和经济代价。为解决该问题，提出一种交互式易混淆缺陷分离方法，将少量易混淆缺陷从其他缺陷中分离出来，从而保证剩下的绝大部分缺陷的分类结果能被直接使用。首先，将训练数据中的易混淆缺陷挑选出来作为一个或多个新缺陷类别，称之为虚缺陷，从而使得训练所得网络能区分虚缺陷和其它类缺陷。其中，还设计了一套可视化界面辅助用户交互地挑选易混淆缺陷以构建虚类别。使用实际工业现场的CMOS缺陷数据进行有效性验证，结果表明所提方法能快速分类出易混淆缺陷，并保证剩余缺陷的分类精度满足工业应用要求。

基于双调和插值的锥束CT金属伪影校正算法

王中昊, 夏竟, 李世杰, 蔡志平

2024, 46(3): 471-478. doi:

摘要 ( 691 )

PDF (1233KB) ( 1030 ) 　　

在计算机断层扫描 (CT)中，金属植入物会引入严重的伪影，导致图像质量降低影响诊断价值。为了对锥束CT中的金属伪影进行校正，提出了一种基于双调和方程的金属伪影校正算法。首先，对含金属伪影的重建图像进行双边滤波和金属阈值分割，获得金属和非金属图像；然后，对二者进行正向投影，获得金属投影区域和先验投影图像；接下来，利用先验投影图像对原始投影进行归一化，并对金属区域进行双调和方程插值修复，获得修复的投影数据；最后，对修复的投影数据去归一化,并利用FDK 算法进行重建，再与金属图像融合获得最终的校正图像。为了验证该算法的性能，采用实际拍摄的数据进行金属伪影校正实验。结果表明，与常用的线性插值校正算法和归一化校正算法相比，所提算法ROI区域内图像的均方根误差分别减少了22%和8%，有效地抑制了金属伪影，优于常用的去金属伪影算法。

融合多注意力机制的自监督小样本医学图像分割

要媛媛, 刘宇航, 程雨菁, 彭梦晓, 郑文,

2024, 46(3): 479-487. doi:

摘要 ( 1203 )

PDF (1132KB) ( 1429 ) 　　

主流的基于全监督的深度学习分割模型在丰富的标记数据上训练时可以取得良好的效果，但医疗图像领域的图像分割存在标注成本高、分割目标种类多的问题，且往往缺少足够的标注数据。提出一个模型，通过融合自监督从数据中提取标签，利用超像素表征图像特性，进行小样本标注条件下的图像分割。引入多注意力机制使得模型更多关注图像的空间特征，位置注意模块和通道注意模块致力于单一图像内部的多尺度特征融合，而外部注意力模块显著突出了不同样本间的联系。在CHAOS健康腹部器官数据集上进行实验，1-shot极端情况下DSC达0.76，相较baseline分割结果提升3%左右。通过调整N-way-K-shot任务数来探讨小样本学习的意义，在7-shot设置下DSC有显著提升，与基于全监督的深度学习分割效果的差距在可接受范围内。

基于自适应纹理特征融合的纹理图像分类方法

吕伏, 韩晓天, 冯永安, 项梁

2024, 46(3): 488-498. doi:

摘要 ( 996 )

PDF (1155KB) ( 1547 ) 　　

现有基于深度学习的图像分类方法普遍缺少纹理特征的针对性，分类精度较低，难以同时适用于简单纹理和复杂纹理分类。提出一种基于自适应纹理特征融合的深度学习模型，能够结合类间差异性纹理特征做出分类决策。首先，根据纹理特征的最大类间差异性，构建图像的纹理特征图像；然后，采用原始图像与特征鲜明的纹理特征图像并行训练改进的双线性模型，获取双通道特征；最后，基于决策融合构建自适应分类模块，连接原图与纹理集的平均池化特征图进行通道权重提取，根据通道权重融合2个并行神经网络模型的分类向量，得到最优融合分类结果。在KTH-TIPS，KTH-TIPS-2b,UIUC和DTD 4个公共纹理数据集上对模型的分类性能进行评估，分别得到了99.98%、99.95%、99.99%和67.09%的准确率，表明所提模型具有普遍高效的识别性能。

面向林地环境的四足机器人自主定位方法

夏文强, 王书涵, 曾理湛, 罗欣

2024, 46(3): 499-507. doi:

摘要 ( 656 )

PDF (1879KB) ( 898 ) 　　

林地是四足机器人野外作业的典型场景，其树木多且间距小，对四足机器人快速导航的定位频率和精度提出了更高的要求。采用腿部里程计定位可以获得较高的更新频率，但林地地面松软、凹凸不平等会引起足端打滑，使其精度降低；而激光雷达定位，虽然林地环境特征丰富，但其存在一定匹配误差且更新频率低，也难以满足快速导航要求。针对此问题，提出了一种适用于林地环境的自主定位方法，采用腿部里程计去除激光雷达点云畸变，并分别提取林地地面和树干特征进行匹配，提高激光雷达定位精度；在激光雷达2次定位之间采用中值和窗口滤波融合腿部里程计的插值数据，提高定位频率。在林地实验中，四足机器人行走110 m，最终偏移为0.09 m，在设定路线导航下最终定位值与期望值相差0.2 m，定位频率500 Hz，四足机器人能准确顺利地完成导航任务。

增强依存结构表达的零样本跨语言事件论元角色分类

张远洋, 贡正仙, 孔芳

2024, 46(3): 508-517. doi:

摘要 ( 494 )

PDF (908KB) ( 727 ) 　　

事件论元角色分类是事件抽取中的子任务，旨在为事件中的候选论元分配相应的角色。事件语料标注规则复杂、人力耗费大，在很多语言中缺少相关标注文本。零样本跨语言事件论元角色分类可以利用源语言的丰富语料建立模型，然后直接应用于标注语料匮乏的目标语言端。围绕不同语言的事件文本在依存结构上的表达共性，提出了使用BiGRU网络模块对触发词到候选论元的依存路径信息进行额外编码的方法。本文设计的编码模块能灵活地与当前主流的基于深度学习框架的事件论元角色分类模型相联合。实验结果表明，本文提出的方法能更有效地完成跨语言迁移，提高多个基准模型的分类性能。

融合乌尔都语词性序列预测的汉乌神经机器翻译

陈欢欢, 王剑, Muhammad Naeem Ul Hassan

2024, 46(3): 518-524. doi:

摘要 ( 621 )

PDF (951KB) ( 711 ) 　　

面向南亚和东南亚的小语种机器翻译，目前已有不少研究团队开展了深入研究，但作为巴基斯坦官方语言的乌尔都语，由于稀缺的数据资源和与汉语之间的巨大差距，有针对性的汉乌机器翻译方法研究非常稀少。针对这种情况，提出了基于Transformer的融合乌尔都语词性序列的汉乌神经机器翻译模型。首先利用Transformer对目标语言乌尔都语的词性序列进行预测，然后将翻译模型的预测结果和词性序列模型的预测结果相结合进行联合预测，从而实现语言知识到翻译模型的融入。在现有小规模汉乌数据集上的实验表明，所提方法在数据集上的BLEU值相较于基准模型提升了0.13，取得了较为明显的效果。

基于长短期记忆网络的移动轨迹目的地预测

晋广印, 赵旭俊, 龚艺璇

2024, 46(3): 525-534. doi:

摘要 ( 995 )

PDF (1280KB) ( 1096 ) 　　

移动轨迹目的地预测是基于位置服务的重要一环，现有的预测方法存在历史轨迹不能完全覆盖所有可能的查询轨迹(数据稀疏)问题，没有考虑前缀轨迹点对预测结果的影响差异(长期依赖问题)。为了解决上述问题，提出了轨迹分布式表示方法。首先，将轨迹进行网格划分，把表示位置的高维独热码向量进行降维处理，生成包含地理拓扑关系的低维嵌入向量。其次，对目的地进行聚类，把聚类中心作为簇中轨迹的标签，缩小相似轨迹的差异，放大不相似轨迹的特征，有效克服了数据稀疏问题。在目的地预测中，将自注意力机制引入长短期记忆网络，提出了基于长短期记忆网络的目的地预测模型SATN-LSTM，挖掘序列中的关键点并根据其重要程度分配权重，较好地解决了长期依赖问题。最后，在真实轨迹数据集上进行了多次实验，验证了模型的有效性，并与现有的模型进行对比，验证了本模型具有更好的准确性。

可靠响应表示增强的知识追踪方法

赵琰, 马慧芳, 王文涛, 童海斌, 贺相春

2024, 46(3): 535-544. doi:

摘要 ( 1246 )

PDF (1411KB) ( 976 ) 　　

知识追踪是教育数据挖掘领域中的一项关键任务，旨在建模学生随时间不断变化的知识状态，以推断学生对知识点的掌握程度。然而，现有知识追踪方法大多忽略了基于学生-习题-知识点关系构造的学生-知识点空间的不可靠性和高维稀疏性，并且未结合学生在习题上的作答情况生成习题的可靠响应表示。针对上述问题，提出可靠响应表示增强的知识追踪方法。具体地，首先根据学生的作答记录细粒度地划分学生-习题空间，并基于习题-知识点空间得到不同划分下的学生-知识点空间；其次，从学生-知识点空间的相对可靠性和绝对可靠性2方面获得学生-知识点空间的可靠性，并采用维数约减方法得到可靠且低维的学生-知识点空间；再次，结合学生在习题上的作答情况和习题表示方法得到习题在2种作答下的可靠响应表示；最后，利用长短期记忆网络和得到的可靠响应表示评估学生在不同时刻的知识状态。在4个真实数据集上验证了本文方法的有效性和可解释性。

基于深度学习节点表示的谣言源定位方法

刘维, 杨洁, 罗佳莉, 王赛威, 陈崚

2024, 46(3): 545-559. doi:

摘要 ( 675 )

PDF (2419KB) ( 1047 ) 　　

随着互联网的普及，网络上的信息以惊人的速度传播给公众。然而，由于级联效应，虚假信息和谣言同时也在迅速蔓延，对社会造成了巨大的危害。在社交网络上找到谣言的传播源头，对抑制谣言的传播起到至关重要的作用。传统的谣言源定位方法大多未能够融合多源特征且定位准确率还需进一步提高，因此，提出一种基于深度学习的谣言源定位方法，根据观测受谣言影响的节点多源特征来识别谣言源。首先，根据节点与观测节点之间的影响力相似度得到节点的影响力向量。然后，利用自编码网络对节点的影响力向量进行编码，得到包含节点信息、扩散路径和传播时间信息在内的节点的新的嵌入表示。最后，根据节点新的影响力向量计算节点为谣言源的概率，以定位谣言源。在2个模拟网络和4个真实网络上的实验结果表明，与其他方法相比，所提方法能够以更快的速度定位谣言源，且谣言源定位的准确率提升了25%以上。

基于双通道轻量图卷积的序列推荐算法

罗旭, 汪海涛, 贺建峰

2024, 46(3): 560-570. doi:

摘要 ( 518 )

PDF (1126KB) ( 912 ) 　　

传统基于图神经网络的序列推荐算法，在构图阶段忽略了其他用户序列中项目的转换关系，针对这一问题，提出了一种基于双通道轻量图卷积的序列推荐算法。首先，为目标用户找到其邻居用户序列，将目标用户序列和得到的邻居序列合并成一个有向序列图，充分利用了用户之间潜在的协作信息。然后，通过双通道轻量图卷积，分别对2种序列进行信息传播，每个通道通过指数分母的形式组合每一层的信息，融合2个通道得到的嵌入生成最终的项目嵌入。最后，对得到的项目嵌入通过后几项取平均的方式提取短期偏好，再通过引入挤压激励网络的多头自注意力机制提取长期偏好，整合长短期偏好得到用户的最终偏好。在2个公开数据集Beauty和MovieLens-20M上进行充分的实验并验证了算法的有效性。

当期目录

作者中心

审稿中心

在线期刊