计算机工程与科学

2022年第11期目录

2022, 44(11): 0-0. doi:

摘要 ( 129 )

PDF (260KB) ( 203 ) 　　

面向众核系统的层次化栅栏同步机制

臧照虎, 李晨, 王耀华, 陈小文, 郭阳

2022, 44(11): 1901-1908. doi:

摘要 ( 339 )

PDF (1395KB) ( 469 ) 　　

同步操作在保证多核处理器线程的数据一致性和正确性等方面起着重要作用。随着处理器内核数量的不断增加，同步操作的开销也越来越大。栅栏同步是并行应用中多核同步的重要方法之一。软件同步方法通常需要数千个周期才能完成多个内核之间的同步，这种高延迟和串行化同步会导致多核程序性能的显著下降。相比于软件栅栏同步方法，硬件栅栏能够实现较低的同步延迟，然而传统集中式硬件栅栏的可扩展性有限，难以适应众核处理器系统的同步需求。面向众核处理器提出了一种层次化硬件栅栏机制——HSync,它由本地栅栏单元和全局栅栏单元组成,二者协调配合,以实现低硬件开销的快速同步。实验结果表明，与传统的集中式硬件栅栏相比，层次化硬件栅栏机制将众核处理器系统性能提高了1.13倍，同时网络流量减少了74%。

面向FT-M7002平台点积算法的优化实现

郭盼盼, 陈梦雪, 梁祖达, 马晓畅, 许邦建

2022, 44(11): 1909-1917. doi:

摘要 ( 382 )

PDF (645KB) ( 337 ) 　　

基于国产的FT-M7002平台高性能DSP，针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势，对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了程序的向量并行性，有效地提升了数据传输的速度，提高了程序性能。实验结果表明，输入不同规模大小的数组，不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.416 6~45.233 8。相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能，FT-M7002平台优化后的性能与TI平台的平均性能比为1.371 6~4.519 6。实验结果表明了该DSP平台相对于TI主流平台的计算性能优势。

基于行为监测的嵌入式操作系统堆栈溢出测试

杨兴达, 陈灿, 方菱,

2022, 44(11): 1918-1923. doi:

摘要 ( 191 )

PDF (728KB) ( 288 ) 　　

堆栈测试是嵌入式操作系统安全评估的重要环节，堆栈溢出会覆盖邻近堆栈中的数据，造成数据错乱进而引发系统崩溃。然而捕获并定位堆栈溢出具有一定难度。首先，溢出数据可能会侵占操作系统中其它任务的私有堆栈，而发生溢出的任务本身没有异常表现，以致难以确定堆栈溢出的根源；其次，由于操作系统任务的优先级差异，堆栈溢出的暴露时间可能滞后于其发生时间。提出了一种基于实时堆栈分配与回收行为监测的动态堆栈测试方法，首先在堆栈行为测试点插入桩函数，以采集任务堆栈的测试码；然后设置上位机测试程序，以分析测试码并提供测试结果，实现实时捕获并定位堆栈溢出。利用此方法，在基于车载远程信息处理终端的实际测试中，定位到了3处造成系统崩溃或复位的堆栈溢出异常，评估了操作系统堆栈的安全性。另外，根据测试结果，优化了堆栈大小的静态分配，在单个任务中最多节省了42%的堆栈空间，并将整个任务RAM压缩至原来的63%。

基于光量子芯片的量子自旋链中完美态转移可编程量子模拟

詹俊伟, 曾茹, 王易之, 薛诗川, 黄光耀, 吴俊杰

2022, 44(11): 1924-1931. doi:

摘要 ( 227 )

PDF (1096KB) ( 464 ) 　　

近些年，量子计算物理实现技术进步很快，构建能够发挥实际用途的量子计算装置成为发展重点。采用量子模拟研究量子自旋系统的演化行为，相比于经典模拟会更加高效。一维量子自旋链中完美态转移模型在量子通信和量子计算领域具有重要的研究价值。提出一种基于双光子连续时间量子漫步的可编程完美态转移量子模拟方法，并且基于光量子芯片完成了2类特殊哈密顿量作用下XY型量子自旋链中双激发“周期-镜像”完美态转移的量子模拟实验，为模拟量子自旋系统的演化提供了一种实用且可扩展的实验方案。

一种改进的基于深度神经网络的偏微分方程求解方法

陈新海, 刘杰, 万仟, 龚春叶,

2022, 44(11): 1932-1940. doi:

摘要 ( 564 )

PDF (1169KB) ( 700 ) 　　

偏微分方程求解是计算流体力学等科学与工程领域中数值分析的计算核心。由于物理的多尺度特性和对离散网格质量的敏感性，传统的数值求解方法通常包含复杂的人机交互和昂贵的网格剖分开销，限制了其在许多实时模拟和优化设计问题上的应用效率。提出了一种改进的基于深度神经网络的偏微分方程求解方法TaylorPINN。该方法利用深度神经网络的万能逼近定理和泰勒公式的函数拟合能力，实现了无网格的数值求解过程。在Helmholtz、Klein-Gordon和Navier-Stokes方程上的数值实验结果表明，TaylorPINN能够很好地拟合计算域内时空点坐标与待求函数值之间的映射关系，并提供了准确的数值预测结果。与常用的基于物理信息神经网络方法相比，对于不同的数值问题,TaylorPINN将预测精度提升了3~20倍。

面向移动终端的密文可验证属性基可搜索加密方案

牛淑芬, 张美玲, 周思玮, 闫森

2022, 44(11): 1941-1950. doi:

摘要 ( 182 )

PDF (660KB) ( 339 ) 　　

轻量级设备的数据大多都存储在云服务器上。由于云服务不完全可信，且传统的单关键词可搜索加密会产生许多与检索内容无关的信息，因此提出一个面向移动终端的密文可验证属性基可搜索加密方案。该方案结合CP-ABE技术控制访问细粒度，引入可信第三方进行数据完整性验证，同时帮助用户进行部分解密工作。该方案在困难问题假设下被证明是选择性不可区分的密文策略和选择明文攻击IND-sCP-CPA及不可区分的选择关键词攻击IND-CKA。理论分析和数值模拟实验表明，该方案具有更高的效率。

考虑任务依赖的卫星边缘计算资源分配与卸载决策算法

方海, 赵扬, 高媛, 杨旭

2022, 44(11): 1951-1958. doi:

摘要 ( 340 )

PDF (749KB) ( 629 ) 　　

针对高低轨卫星网络协同边缘计算的卸载决策问题，提出了一种考虑任务依赖的联合计算资源、无线资源分配与任务调度的卫星网络边缘计算卸载决策算法。首先，将任务卸载问题建模为最小化任务延迟和能量消耗的联合优化问题；然后,将能源消耗和时延引入子任务优先级定义中，基于动态优先级进行启发式卸载策略搜索。该算法保证了子任务之间的依赖性并同时考虑了无线资源分配。仿真结果表明，与已有研究相比，该算法能缩短高低轨卫星协同计算的任务执行延迟,且能够降低低轨卫星功耗。

深度神经网络模型后门植入与检测技术研究综述

马铭苑, 李虎, 王梓斌, 况晓辉

2022, 44(11): 1959-1968. doi:

摘要 ( 267 )

PDF (636KB) ( 642 ) 　　

作为当前人工智能快速发展的代表性技术之一，深度神经网络的应用范围越来越广，由此带来的安全性问题也逐渐受到关注。现有研究主要聚焦于如何高效构造多样化的对抗样本，以实现对深度神经网络模型的欺骗，以及如何检测对抗样本并加固深度神经网络模型。但是，随着深度神经网络模型的开发越来越依赖开源数据集、预训练模型和计算框架等第三方资源，模型被植入后门的风险越来越高。从深度神经网络模型生命周期的各个环节出发，对深度神经网络模型后门植入与检测相关技术进行了归纳总结，对比分析了不同技术的主要特征与适用场景，对相关技术未来的发展方向进行了展望。

萤火虫算法优化支持向量机室内定位研究

仲臣, 余学祥, 邰晓曼, 韩雨辰, 肖星星, 刘清华,

2022, 44(11): 1968-1975. doi:

摘要 ( 169 )

PDF (898KB) ( 292 ) 　　

针对室内定位指纹库匹配冗余信息多造成定位浮动大，且数据库中样本数过多定位时效性差等问题，提出一种基于萤火虫算法FA优化支持向量机SVM的室内定位算法FA-SVM。利用奇异谱分析SSA预处理数据去除噪声，通过萤火虫算法优化支持向量机参数，建立室内定位回归模型。实验结果表明，相对于目前其它室内定位算法，FA-SVM算法收敛速度快，提高了室内定位精度和稳定性。

Tsai氏相机平面标定算法的一种解析改进

姚隆兴, 韩江涛, 张志毅

2022, 44(11): 1976-1984. doi:

摘要 ( 192 )

PDF (520KB) ( 241 ) 　　

针对径向畸变的针孔透视投影模型，提出了一种简单快速的相机标定算法。该算法在假设图像中心点与CCD或CMOS传感器中心重合的前提下，将相机的内外参数和相机模型的畸变参数分离，以进一步进行线性相机标定，避免了非线性优化带来的误差，降低了算法复杂度，可适当提高标定精度，节约计算时间。首先,根据透视投影的交比不变性原理标定镜头的畸变系数；然后，根据旋转变换关系和平移变换关系，充分利用径向畸变约束、旋转变换的正交性和旋转矩阵特有的性质约束线性求解出相机的内参和外参；最后，通过实验与Tsai氏相机平面标定算法进行对比，所提算法在标定时间上节约了35%左右，在精度上至少提高了15%。

基于文本特征及二次矫正的指针式仪表自动读数算法

陈锟剑, 李竹, 周依莎, 盛庆华

2022, 44(11): 1985-1994. doi:

摘要 ( 161 )

PDF (1508KB) ( 351 ) 　　

现有的指针式仪表读数算法常通过检测仪表的刻度进行示数识别，但仪表图像中的刻度包含的特征较少，从而容易出现误检测。针对此问题，提出了一种新的指针式仪表自动读数算法，该算法通过选取较大区域的图像特征大幅度地提高了仪表读数识别的鲁棒性。由于指针刻度值文本是各类仪表具有的共同部分且具有远多于刻度图像的特征,因此所提算法以刻度值文本作为识别依据，首先通过卷积神经网络检测仪表图像中的刻度值文本，并使用其位置坐标来拟合仪表的圆心，在得到圆心的基础上通过极坐标变换及图像二次矫正将圆弧形的刻度区域转换为水平直线型的区域，同时被识别的文本值也用于改进距离判读法。该方法与其他读数算法的比较结果表明，该算法具有较高的读数准确率，引用误差在0.5%以下，且在复杂拍摄条件下具有更高的鲁棒性。

基于无锚框目标检测算法的多样性感受野注意力特征补偿

张海燕, 付应娜, 丁桂江, 孟庆岩

2022, 44(11): 1995-2002. doi:

摘要 ( 137 )

PDF (880KB) ( 249 ) 　　

作为目标检测的研究热点之一，无锚框算法摒弃大量预定义框的设置而采取逐像素的方式进行预测。即便如此，它仍不能够很好地处理重叠目标。此外，该算法获取图像的全局信息能力较弱且易出现感受野不匹配。因此，提出2种改进方法：多样性感受野注意力机制和全局信息指导特征融合。PASCAL VOC和MS COCO数据集上广泛的实验证实了改进方法的有效性。与基线FCOS相比，本文方法的检测精度在PASCAL VOC上提升了1.4%,在MS COCO上的精确度为42.8%,检测性能明显优于许多先进算法。

基于改进Mask R-CNN的生活垃圾检测

张睿萍, 宁芊, 雷印杰, 陈炳才

2022, 44(11): 2003-2009. doi:

摘要 ( 208 )

PDF (584KB) ( 349 ) 　　

近年来，人们对于垃圾的分类与回收越来越重视,但垃圾分类耗费了大量的人力和物力且分拣效率低下。针对基于矩形边界框的垃圾检测方法在多分类环境下效果不够理想等问题,提出了一种基于改进Mask R-CNN算法的生活垃圾检测模型。该模型摒弃了传统的ResNet，采用改进的ResNeXt101 作为主干网络进行特征提取，提高了目标检测的准确率和背景边界线分割的精确度。实验结果表明，与传统的Mask R-CNN算法相比，本文模型的mAP为91.1%,提升了2.35%；与当前流行的目标检测模型进行了对比，本文模型的分类准确率和分割精确度均表现优异，表明了所提模型在垃圾检测任务中的可行性与有效性。

基于注意力机制的自适应滤波遥感图像分割网络

吴从中, 董浩, 方静

2022, 44(11): 2010-2018. doi:

摘要 ( 215 )

PDF (1177KB) ( 370 ) 　　

遥感图像尺度变化较大，背景类内差异较大以及前景和背景之间的不平衡等问题，增加了遥感图像小目标和目标边缘分割的难度。在卷积神经网络中，下采样引起的混叠效应造成目标信息的失真和损失，容易被忽视。同时，扩张卷积虽然捕获到了丰富的感受野信息，但仍存在冗余的背景信息干扰。据此，提出了一种基于注意力机制自适应滤波分割网络（ARGNet）。在DeepGlobe Road Extraction数据集和Inria Aerial Image Labeling数据集上进行实验，结果表明，所提出的网络能够分割出更加精准的目标。

基于端到端双网络的低照度图像增强方法

陈清江, 李金阳, 屈梅, 胡倩楠

2022, 44(11): 2019-2026. doi:

摘要 ( 186 )

PDF (1152KB) ( 286 ) 　　

由于环境的不确定性，捕获的图像存在亮度低、对比度低和信息丢失严重等问题，且利用现存算法增强后的图像存在曝光过度问题，不能满足计算机视觉任务的输入要求。针对此问题,提出了基于端到端双网络的低照度图像增强方法，该网络由Inception网络模块与URes-Net模块组成。首先利用Retinex理论合成低照度图像样本;然后运用双网络模型进行特征提取、特征融合与重建，根据测试集的损失不断调整参数以优化模型,最终使双网络模型具有较高的低照度图像增强能力。实验结果表明,所提方法的PSNR和SSIM的均值分别为28.659 8 dB和0.896 6，亮度、对比度显著提高，获得的图像更加符合人类视觉，优于其他先进的低照度图像增强方法。

带有协方差矩阵的卷积神经网络在人体运动识别中的应用

权威铭, 刘天一, 张雷

2022, 44(11): 2027-2036. doi:

摘要 ( 180 )

PDF (1354KB) ( 474 ) 　　

目前，深度学习已经在各种人体运动识别（HAR）任务中发挥了重要作用。但是，由于运动数据具有时间序列和包含肢体动作的特殊性，现有神经网络在进行卷积操作时会导致数据高度相关，并且随着网络影响到下一层，这限制了模型的识别效果。为此，提出了一种带有协方差矩阵的改进卷积神经网络用于HAR场景，通过矩阵变换搭建一种去相关的网络结构来消除相关性问题，可以在网络表现不佳时替代现有的批量归一化（BN）层用于归一化数据。在4个HAR公共数据集上进行实验，并与传统CNN和带有BN层的模型进行比较。实验结果表明，对比此前的深度学习网络，改进的神经网络有1%~2%的性能提升，验证了该方法的有效性，并将程序移植到了移动端进行实时运动识别。

联合注意力和Transformer的视网膜血管分割网络

蒋芸, 刘文欢, 梁菁

2022, 44(11): 2037-2047. doi:

摘要 ( 192 )

PDF (1878KB) ( 411 ) 　　

视网膜血管分割在许多眼科疾病诊断和治疗方面至关重要。对复杂的视网膜结构及低对比度眼底图像来说，准确地分割视网膜图像的血管特征仍具有挑战性。联合注意力和Transformer的视网膜血管分割网络JAT-Net，通过对编码阶段特征的通道信息和位置信息联合关注增强编码局部细节特征，利用Transformer增强对长距离上下文信息和空间依赖关系建模的能力。在DRIVE和CHASE数据集上进行视网膜血管分割实验，其准确率分别为0.970 6和0.977 4，F1分数分别为0.843 3和0.815 4,在视网膜血管分割方面表现不错。

基于Gist和IPCA算法的多文种离线手写签名识别

韩辉, 麦合甫热提, 吾尔尼沙·买买提, 朱亚俐, 库尔班·吾布力,

2022, 44(11): 2048-2055. doi:

摘要 ( 165 )

PDF (1135KB) ( 283 ) 　　

由于离线手写签名图像有效的笔画部分普遍比较稀疏，存在大量的无效白色背景，目前常用的特征描述方法会使得得到的特征数据存在大量冗余，影响识别准确率。识别准确率的提高，需要依赖大量的训练数据和提取多个特征并进行融合，但这样又会因特征数据过多和维度过大而造成计算困难，影响识别效率。为此，提出了一种基于Gist和IPCA算法的多文种离线手写签名识别方法，利用Gist特征聚焦图像的整体布局和笔画部分，同时利用IPCA算法的批处理能力来提高识别效果和运行效率。使用中、英、维3种语言的实验数据集，并使用SVM分类器进行识别实验。结果显示，3个数据集上的识别准确率分别为97.97%,98.43%和97.19%，3种数据混合后的识别准确率为97.70%。经过对比分析可知，提出的方法与之前的相关方法相比明显较优。

基于线性注意力机制的单样本生成对抗网络研究

陈曦, 赵红东, 杨东旭, 徐柯南, 任星霖, 封慧杰

2022, 44(11): 2056-2063. doi:

摘要 ( 170 )

PDF (1041KB) ( 267 ) 　　

目前，使用单样本训练生成对抗网络已经成为研究人员关注的重点。但是，网络模型不容易收敛，生成的图像结构易崩塌，训练速度慢等问题依旧亟待解决。研究人员提出在生成对抗网络中使用自注意力模型用以获取样本更大范围的结构，提高生成图像的质量。但是，传统的卷积自注意力模型由于注意力图谱中的信息冗余，容易造成计算资源浪费。提出了一种新的线性注意力模型，在该模型中使用了双重归一化方法来缓解注意力模型对输入特征敏感的问题，并且基于该模型搭建了一种新的单样本生成对抗网络模型。此外，模型还使用了残差网络和光谱归一化方法用于稳定训练，降低了发生崩塌的风险。实验结果表明，相较于使用已有的网络结构，该模型具有训练速度快，生成图像的分辨率高且评价指标改善明显等特点。

一种基于SARIMA-LSTM模型的电网主机负载预测方法

王堃, 郑晨, 张立中, 陈志刚

2022, 44(11): 2064-2070. doi:

摘要 ( 211 )

PDF (674KB) ( 362 ) 　　

随着智能电网的不断发展，如何提高对信息设备运行状态的预测准确率以及设置适应数据变化的动态阈值区间是电网IT运维面临的巨大挑战。为了解决这些问题，提出了组合时间序列预测模型(SARIMA-LSTM)，即在传统周期性ARIMA 模型(SARIMA)的基础上，引入深度学习领域的LSTM模型，并摒弃了过去精度低、效果差的误差拟合方法，使用误差自回归方法来补偿预测结果。该模型可以学习到传统ARIMA模型无法捕捉到的误差波动规律，解决其无法预测非线性数据的问题。实验结果表明，在实际预测电网内存负载数据时，与ARIMA模型和SAIRIMA模型相比，SARIMA-LSTM模型可以实现更高的预测精度。

基于词共现的方面级情感分析模型

杨春霞, 姚思诚, 宋金剑,

2022, 44(11): 2071-2079. doi:

摘要 ( 179 )

PDF (770KB) ( 281 ) 　　

针对方面级情感分析存在的局部信息捕捉不充分、多个意见词混淆的问题，提出了一种基于词共现的方面级情感分析模型。该模型将方面级情感分析看成句子对任务，利用BERT获得包含上下文与方面词交互注意力的节点信息；同时，对每条数据样本构建独立的词共现图，使用门控图神经网络更新节点，加强方面词附近信息的融合，减少无关意见词的干扰；之后在自注意力层进一步融合全局信息，最终取出方面词节点送入非线性层获得分类结果。与6个基线模型的对比实验结果表明，该模型有效地提升了方面级情感分析的准确性。

基于改进人工鱼群算法与RBF神经网络的股票价格预测

谢俊标, 江峰, 杜军威, 赵军

2022, 44(11): 2080-2090. doi:

摘要 ( 249 )

PDF (1086KB) ( 330 ) 　　

股票价格受多种因素影响，这对股票价格预测造成了巨大挑战。近年来，机器学习方法被广泛用于股票价格预测的研究中，然而，现有方法存在相对误差较大、时间复杂度高等缺点。对此，提出基于引力搜索的改进人工鱼群算法AFSA_GS。该算法将引力搜索中计算质量和加速度的策略分别用于调节人工鱼的视野和步长，从而提高了人工鱼群算法在优化过程中的自适应能力；AFSA_GS算法还优化了RBF神经网络的相关参数，并使用优化后的网络预测股票价格。在多家上市公司股票数据上进行了实验，实验结果表明，相对于传统的优化算法，采用AFSA_GS算法优化的RBF神经网络，可以获得更好的股票预测性能。

当期目录

作者中心

审稿中心

在线期刊