计算机工程与科学

2024年第4期目录

2024, 46(4): 0-0. doi:

摘要 ( 447 )

PDF (247KB) ( 677 ) 　　

全息存储中的纠错码研究综述

于勤, 吴非, 张猛, 谢长生

2024, 46(4): 571-579. doi:

摘要 ( 918 )

PDF (1981KB) ( 1226 ) 　　

大数据时代对于高密度大容量的存储技术需求与日俱增。与传统存储技术的按位记录方式不同，全息存储以二维数据页为读写单位，采用三维体存储模式，凭借存储密度高、数据转换速率快、节能安全以及超长期保存等优势，成为海量冷数据存储的有力竞争者。重点介绍了相位调制的同轴全息存储，分析了目前面向全息存储的纠错码研究现状，并详细介绍了一种参考光辅助的低密度奇偶校验 LDPC码优化方案。

面向多核向量加速器的卷积神经网络推理和训练向量化方法

陈杰, 李程, 刘仲

2024, 46(4): 580-589. doi:

摘要 ( 1836 )

PDF (982KB) ( 1303 ) 　　

随着以卷积神经网络为代表的深度学习得到广泛应用，神经网络模型中的计算量也急速增长，推动了深度学习加速器的发展。如何针对加速器硬件的体系结构特性进行加速和优化神经网络模型的性能成为研究热点。针对自主设计的多核向量加速器FT-M7004上的VGG网络模型推理和训练算法，分别提出了卷积、池化和全连接等核心算子的向量化映射方法，采用SIMD向量化、DMA双缓冲传输和权值共享等优化策略，充分发挥了向量加速器的体系结构优势，取得了较高的计算效率。实验结果表明，在FT-M7004平台上，卷积层推理和训练的平均计算效率分别达到了86.62%和69.63%；全连接层推理和训练的平均计算效率分别达到了93.17%和81.98%；VGG网络模型在FT-M7004上的推理计算效率超过GPU平台20%以上。

基于GGInformer模型的多维时间序列特征提取与预测研究

任晟岐, 宋伟

2024, 46(4): 590-598. doi:

摘要 ( 1297 )

PDF (740KB) ( 959 ) 　　

随着大数据与物联网技术的迅猛发展，多维时间序列数据的应用范围变得更加广泛。面对大量的非线性、高维冗余特征的复杂时间序列，传统的时间序列分析方法已经不能很好地解决多维时间序列的复杂高维特征问题，从而导致预测效果欠佳。针对以上问题，通过对遗传算法和Informer模型进行改进，并融合GRU网络，提出了GGInformer模型。该模型不仅可以有效提取多维时间序列的关键特征，而且较好地解决了长程依赖问题。为了验证模型的预测能力，选取了2种实际数据集与3种公共基准数据集进行实验，相比较Informer基准模型，GGInformer模型在5种数据集上的MSE分别降低了22%,13%,20%,23%和38%。实验结果表明，GGInformer模型可以有效解决多维时间序列数据的复杂特征提取问题，并可以进一步提高时序预测能力。

面向芯粒间互连的低功耗发射机驱动设计

任博琳, 肖立权, 齐星云, 张庚, 王强, 罗章, 庞征斌, 徐佳庆

2024, 46(4): 599-605. doi:

摘要 ( 845 )

PDF (1091KB) ( 1019 ) 　　

面向UCIe协议提出的芯粒间互连标准，设计与实验了一种面向芯粒（Chiplet）间互连的低功耗发射机驱动。该驱动电路采用了SST电压模驱动器，功耗仅为CML电流模驱动器结构的1/4。此外，该驱动电路基于可调前馈均衡技术，针对不同的信道衰减调整均衡强度，采用去加重均衡的方式提高发射信号质量，最终降低码间干扰。本文设计采用CMOS 28 nm工艺设计，前端仿真结果表明，在0.9 V电压供电时，最大均衡强度为-3.7 dB，当32 Gbps的NRZ信号通过21 mm的信道时（16 GHz奈奎斯特频率处衰减为-2.37 dB），选择合适均衡强度后，输出波形眼图眼高为253 mV（71.8%），眼宽为27 ps（87%），仿真功耗仅为4.0 mW。

可变流水级SM4加解密算法硬件设计及FPGA实现

朱麒瑾, 陈小文, 鲁建壮,

2024, 46(4): 606-614. doi:

摘要 ( 1189 )

PDF (1472KB) ( 1726 ) 　　

SM4加解密算法作为我国第一个商用密码算法，凭借其算法结构简单易实现、加解密速度快和安全性高等优点，被广泛应用在数据加密存储和信息加密通信等领域中。以可变流水级SM4加解密算法硬件设计以及FPGA实现为研究课题，重点研究了不同流水线级数设计的性能差异，设计了一种可控制流水线级数的SM4加解密电路，并将其封装为带有AXI接口和APB接口的IP核。基于XILINX ZYNQ器件，在XILINX ZYNQ-7020开发板上搭建小型SoC，将设计的SM4 IP核挂载到AXI总线上，模拟实际工作情景并进行性能测试。通过软件加解密数据与仿真测试得到的数据来验证设计功能的正确性；测试不同流水线级数的性能，以此选出最适合的流水线级数。

线云隐私攻击算法的并行加速研究

郭宸良, 阎少宏, 宗晨琪

2024, 46(4): 615-625. doi:

摘要 ( 782 )

PDF (1529KB) ( 1012 ) 　　

线云定位方法能保护场景隐私，但也存在被隐私攻击算法破解的风险。该攻击算法能从线云恢复近似点云，但其计算效率较低。针对该问题，提出了一种并行优化算法，并对其运行时间和加速比进行了分析。具体来说，分别采用SPMD模式和流水线模式实现了CPU多核并行和GPGPU并行。然后，进一步结合数据并行模式实现了异构计算，以达到最高的并行度。实验结果表明，并行优化算法加速比最大为15.11，最小为8.20；相比原算法，并行优化算法的还原点云相对误差控制在原误差的0.4％以内，保证了算法的精度。该研究对线云隐私攻击算法以及其他密度估计问题、不同场景下的线云隐私保护算法等有重要意义和参考价值。

无线携能通信下mmWave协作通信小单元的能效最优策略

卢明妤, 李陶深, 吕品

2024, 46(4): 626-634. doi:

摘要 ( 946 )

PDF (734KB) ( 801 ) 　　

针对无线携能通信（SWIPT）网络中的能量与信息同时传输阶段的优化问题，以最大化链路能量效率为目标，提出一种SWIPT下mmWave协作通信小单元的能效最优策略。该策略在最小链路传输速率和最小收集能量的联合约束下，在能量受限型用户设备的接收端采用功率分流工作模式，通过优化发射功率控制和功率分流因子，最大化系统链路能量效率。针对原问题是一个非凸的分式规划问题，具有NP难性质，采用Dinkelbach方法将目标函数转化为易于求解的凸优化问题，并设计一个交叉迭代的算法求出最优解。仿真实验结果表明，提出的策略在优化系统能量效率性能上要优于传统功率控制方法和最大发射功率法。

基于异构图神经网络的半监督网站主题分类

王谢中, 陈旭, 景永俊, 王叔洋

2024, 46(4): 635-646. doi:

摘要 ( 1569 )

PDF (2434KB) ( 2411 ) 　　

互联网网站数量快速增长使现有方法难以准确分类特定网站主题，如基于URL的方法无法处理未反映在URL中的主题信息，基于网页内容的方法受到数据稀疏性和语义关系捕捉的限制。为此，提出一种基于异构图神经网络的半监督网站主题分类方法HGNN-SWT。该方法不仅利用网站文本特征来弥补仅使用URL特征的不足，还利用异构图对网站文本和词语的稀疏关系进行建模，通过处理图中的节点和边关系来提高分类性能。同时引入基于随机游走的邻居节点采样方法，考虑节点的局部特征和全局图结构，并提出特征融合策略，捕捉网站文本数据的上下文关系和特征交互。通过在自制的Chinaz Website数据集上的实验，证明了HGNN-SWT方法在网站主题分类任务中相较于现有方法具有更高的准确率。

一种基于认证文件的双方验证模型水印方案

吴瑕, 郑洪英, 肖迪

2024, 46(4): 647-656. doi:

摘要 ( 991 )

PDF (1037KB) ( 831 ) 　　

随着边缘计算框架和联邦学习协议的结合，越来越多的深度学习模型版权保护工作被提出，但仅从发送方角度进行所有权验证，无法为接收方提供帮助。大量研究指出，在端-边-云联邦学习系统中，存在恶意用户试图无贡献获取公共模型，甚至向公共模型投毒，为此，有必要给接收方提供模型所有权验证方案。该研究在现有神经网络水印方案的基础上，提出了一种基于认证文件的双方验证模型水印方案，添加了认证文件生成步骤，并以模型结构调整实现双方对模型的所有权验证。通过实验验证了所提方案的可行性、鲁棒性以及获得的水印嵌入速度提升。

基于改进型3D_Henon混沌映射的彩色图像加密方法

牛士铭, 薛茹, 丁聪

2024, 46(4): 657-666. doi:

摘要 ( 1150 )

PDF (2223KB) ( 870 ) 　　

为了解决现有混沌映射模型的混沌空间小及混沌能力弱的问题，首先通过耦合二维Henon混沌映射模型和Sine混沌映射模型，设计了一种新的三维混沌映射模型。其次，针对密钥重复使用会降低加密系统安全性的问题，使用Chebyshev映射，结合明文图像，设计出一种新的密钥生成方法。最后，通过本文设计的三维混沌映射模型以及密钥生成方法，提出了一种彩色图像加密方法，并对此方法进行了仿真实验，结果表明，该方法能够安全有效地进行图像加密，保护图像信息安全。

融合多结构信息的代码注释生成模型

余天赐, 高尚

2024, 46(4): 667-675. doi:

摘要 ( 939 )

PDF (804KB) ( 1327 ) 　　

代码注释可以帮助开发人员理解代码的功能和实现方法。代码注释生成模型可以自动识别代码中的关键信息，并生成相关注释，提高代码的可读性和可维护性。现有的代码注释生成模型通常只使用抽象语法树结构信息来表示代码，导致模型生成注释质量不高。提出一种融合多结构信息的代码注释生成模型，该模型在代码抽象语法树的基础上，增加了数据流图结构信息来表示代码。模型使用Transformer的编码器对抽象语法树序列进行编码，捕获代码全局信息。使用图神经网络对数据流图进行特征提取，提供变量之间的计算依赖关系等信息。然后使用跨模态注意力机制融合抽象语法树和数据流2种特征，经过Transformer的解码器生成相应的注释。实验结果表明，与6种主流模型相比，所提出的模型在Java和Python数据集上的BLEU、METEOR和ROUGE-L指标得分均有提高，生成的注释也具有良好的可读性。

基于模糊测度的模糊分支时态逻辑模型检测

刘子源, 马占有, 李霞, 高滢囡, 何娜娜, 黄瑞祺

2024, 46(4): 676-683. doi:

摘要 ( 549 )

PDF (552KB) ( 673 ) 　　

针对具有模糊性和不确定性的复杂系统的验证问题，提出一种基于模糊测度的模糊分支时态逻辑模型检测算法。首先，在模糊决策过程模型的基础上引入模糊分支时态逻辑的语法和语义。然后，给出模糊分支时态逻辑模型检测算法，该算法将模型检测问题转化为矩阵运算，具有计算方式简洁、复杂度较低的优点。最后，通过医疗专家系统的实例说明了该模型检测算法的有效性。

基于深度学习的中文文本分类综述

高珊, 李世杰, 蔡志平

2024, 46(4): 684-692. doi:

摘要 ( 1891 )

PDF (1058KB) ( 2257 ) 　　

大数据时代，随着社交媒体的不断普及，在网络以及生活中，各类文本数据日益增长，采用文本分类技术对文本数据进行分析和管理具有重要的意义。文本分类是自然语言处理领域中的一个基础研究内容，在给定标准下，根据内容对文本进行分类，文本分类的场景应用十分广泛，如情感分析、话题分类和关系分类等。深度学习是机器学习中一种基于对数据进行表征学习的方法，在文本数据处理中表现出了较好的分类效果。中文文本与英文文本在形、音、象上都有着区别，着眼于中文文本分类的特别之处，对用于中文文本分类的深度学习方法进行分析与阐述，最终梳理出常用于中文文本分类的数据集。

基于混合策略改进的蛇优化算法及其应用

梁昔明, 史兰艳, 龙文

2024, 46(4): 693-706. doi:

摘要 ( 1009 )

PDF (1058KB) ( 1057 ) 　　

针对基本蛇优化算法求解优化问题时易陷入局部最优的问题，提出了一种基于维度选择策略、选择交配策略和重新分组策略的改进蛇优化算法(SSO)。算法SSO在基本蛇优化算法在战斗或交配阶段引入维度选择策略，由随机概率选择每条蛇个体在不同维度的位置更新模式，以避免迭代后期出现个体位置停滞现象；同时引入选择交配策略，选择适应度值小的部分个体进行战斗或交配，剩余个体利用探索阶段位置更新公式进行位置更新，以提高战斗或交配阶段的探索能力；采用重新分组策略，个体每迭代10次都将随机打乱并重新分组，以增加种群多样性，提高算法寻优能力。利用30个标准无约束优化问题进行了数值实验，结果表明，相比于基本蛇优化算法SO等6种对比算法，算法SSO的寻优能力更强，且对求解高维优化问题更有效。用算法SSO优化BP神经网络的初始权值和阈值，实验结果表明所得SSO-BP神经网络在红酒分类和预测鲍鱼年龄时的准确性和稳定性优于其他对比神经网络。

双视图对比学习引导的多行为推荐方法

李清风, 金柳, 马慧芳, 张若一

2024, 46(4): 707-715. doi:

摘要 ( 1900 )

PDF (875KB) ( 1018 ) 　　

多行为推荐（MBR）通常利用多种类型的用户交互行为（例如，浏览、添加购物车和购买）来学习用户对目标行为（即购买）的偏好。受到稀疏监督信号的影响，现有的MBR方法推荐性能欠佳。最近，对比学习从原始数据本身挖掘辅助监督信号取得成功，受此启发提出了一种双视图对比学习引导的方法来增强MBR。首先，利用多行为交互数据来构造2个能同时捕获局部和高阶结构的信息视图；然后，设计2个不同的视图编码器在上述互补视图上学习用户和项目的嵌入表示；最后，通过跨视图协同对比学习与相互监督从而学习到更好的嵌入表示。在2个真实数据集上的实验结果表明，本文方法明显优于基线方法。

基于多视角对比学习的隐式篇章关系识别

吴一珩, 李军辉, 朱慕华

2024, 46(4): 716-724. doi:

摘要 ( 1166 )

PDF (710KB) ( 784 ) 　　

隐式篇章关系识别IDRR的相关工作集中在篇章单元编码器的设计上。将对比学习引入到IDRR，以此获得区分度更高的篇章单元表征。具体地，首先使用一个轻量的IDRR模型；然后为了学习到更好的篇章单元表征，分别从样例层级、批层级和群层级，探索了3种不同视角的对比学习方法在IDRR中的应用；最后本文将多视角对比学习目标联合IDRR同时进行训练。本文提出的方法几乎不增加训练时间，而且只引入少量额外参数。基于PDTB 2.0的实验结果表明该方法达到了最优性能。

三支概念背景下属性粒化效率的度量

张晓燕, 王佳一

2024, 46(4): 725-733. doi:

摘要 ( 1139 )

PDF (558KB) ( 761 ) 　　

三支概念分析是三支决策与形式概念分析结合的产物，该理论相对于形式概念分析最大的进步是可以同时研究形式背景中“共同具有”和“共同不具有”的信息。属性粒化是一种基于粒度树与剪枝将属性分解为子属性，形成新属性集合的理论。而由于同一粒度树上剪枝众多，如何选择剪枝，确定最优的粒化方向以进行进一步运算成为保证属性粒化效率的关键问题。通过理论推导，证明了原三支概念与属性粒化得到的新三支概念存在紧密的内在联系，以此作为度量属性粒化效率的基础。首先，基于属性粒化层次的关系，将属性粒化层次分为存在偏序关系的属性粒化层次和不存在偏序关系的属性粒化层次。进一步，给到细化系数的含义，并分别阐述了细化系数在2种属性粒化层次中的度量作用，从而达到度量不同属性粒化效率的目的。

融合序列局部信息的日期感知序列推荐算法

曹浩东, 汪海涛, 贺建峰

2024, 46(4): 734-742. doi:

摘要 ( 1566 )

PDF (684KB) ( 888 ) 　　

基于自注意力机制的序列推荐算法利用用户的交互序列建模用户的动态偏好，预测用户未来的行为。但是，将交互序列直接输入自注意力层将会限制算法对序列局部关联信息的有效利用。此外，现有的大部分推荐算法利用用户最近的行为表征与目标项目的点积计算项目得分，这将削弱先前交互项目对推荐结果的影响。提出融合序列局部信息的日期感知序列推荐算法，使用多个垂直过滤器融合各交互项目在交互序列中的多种局部关联信息，同时使用交叉注意力机制捕获所有历史交互项目和目标项目的关系，并且抛弃了传统的位置嵌入方法，改用交互发生的日期作为绝对时间嵌入。在多个公开数据集上的实验表明，该算法在不同的评估指标上较基线算法均有一定程度的提升。

语言模型蒸馏的低资源神经机器翻译方法

申影利, 赵小兵,

2024, 46(4): 743-751. doi:

摘要 ( 1039 )

PDF (787KB) ( 1340 ) 　　

大规模平行语料库的缺乏是低资源神经机器翻译面临的关键问题之一。提出语言模型蒸馏的神经机器翻译方法，通过单语语言模型对神经机器翻译训练进行正则化，引入语言模型包含的先验知识以提升翻译效果。具体地，借鉴知识蒸馏思想，使用丰富单语数据训练的目标端语言模型（教师模型）构造低资源神经机器翻译模型（学生模型）的正则化因子，让翻译模型学习到语言模型中高度泛化的先验知识。与传统单语语言模型融合参与解码过程不同的是，本文方法中的语言模型只在训练阶段使用，不参与推断阶段，因此能够有效提升解码速度。在第十七届全国机器翻译大会CCMT2021维吾尔语-汉语和藏语-汉语2种民汉低资源翻译数据集上的实验结果表明，相比目前最先进的语言模型融合方法，BLEU提高了1.42%（藏汉方向）~2.11%（汉维方向）。

基于用户权威度和多特征融合的微博谣言检测模型

许莉芬, 曹霑懋, 郑明杰, 肖博健

2024, 46(4): 752-760. doi:

摘要 ( 796 )

PDF (718KB) ( 882 ) 　　

网络谣言的广泛传播及其对社会的负面影响急切需要高效的谣言检测模型。由于数据集的文本缺乏语义信息和严格的句法结构，结合用户特征和语境特征来丰富语义信息显得很有意义。对此，提出一种基于用户权威度和多特征融合的微博谣言检测模型MRUAMF。首先，抽取出用户信息完整度、用户活跃度、用户交际广度和用户平台认证指数4项指标构建用户权威度定量计算模型，通过级联用户权威度及其构成指标，并使用2层全连接网络融合特征，有效量化用户特征。其次，考虑到语境对谣言理解的有效性，提取相关语境特征。最后，使用BERT预训练模型提取文本特征，并结合多模态适应门MAG融合用户特征、语境特征与文本特征。在微博数据集上进行的实验表明，相比基线模型，MRUAMF模型的检测性能更优，准确率达0.941。

当期目录

作者中心

审稿中心

在线期刊