计算机工程与科学

2022年第10期目录

2022, 44(10): 0-0. doi:

摘要 ( 564 )

PDF (259KB) ( 353 ) 　　

基于ARMv8处理器的高性能图像处理算法实现与优化研究

韦存阳, 贾海鹏, 张云泉, 曲国远, 魏大洲, 张广婷

2022, 44(10): 1711-1720. doi:

摘要 ( 696 )

PDF (1585KB) ( 645 ) 　　

色彩空间转换、图像缩放、图像滤波都是图像处理领域常见的算法，广泛应用于数字媒体、数据通信、生物医学和航空航天等领域。目前上述算法在ARM处理器上虽有开源的OpenCV库，但缺少与Intel IPP库精度相当的高性能图像处理库。为此，根据算法的计算访存特征，将上述算法分为数据无关算法、数据共享算法及非规则访存算法3类，提出了不同类别算法在ARMv8计算平台上的优化方法体系，最终构建了一个基于ARMv8计算平台的高性能图像处理算法库，精度上对标Intel IPP库，并通过算法优化、访存优化、SIMD优化及汇编指令优化等一系列优化方法的应用，大幅提升了图像处理算法的性能。实验结果表明，在华为鲲鹏920计算平台上，重点优化的CvtColor、Filter和Resize模块性能较OpenCV算法库都有显著提升。

非结构有限体积CFD计算的网格重排序优化

张勇, 张曦, 万云博, 何先耀, 赵钟, 卢宇彤

2022, 44(10): 1721-1729. doi:

摘要 ( 846 )

PDF (1305KB) ( 666 ) 　　

网格重排序是提升流体力学CPU和GPU并行计算效率的重要手段之一。对于非结构网格，由于其数据存储无规律，数据的间接访问会导致访存延迟，尤其是在GPU并行计算时，数据的间接访问将引起内存的非对齐访问，放大了访存延迟的影响。对此，采用Reverse Cuthill-Mckee网格重排序方法优化了非结构网格的数据局部性，并设计了一种面向编号重排序方法。算例测试表明，网格重排序不影响最终计算结果。对比分析了网格重排序对非结构求解器在CPU和GPU上的性能影响：对CPU计算，可以使部分热点函数运行时间降低约20%，整体运行时间降低15%~20%；对GPU计算，大部分热点函数运行时间可降低35%~60%，程序整体运行时间降低约40%。

基于 Spark 平台的网络游戏用户流失预测方法

胡艳芳, 熊文, 高炜

2022, 44(10): 1730-1737. doi:

摘要 ( 1091 )

PDF (1022KB) ( 510 ) 　　

随着移动互联网的广泛普及，国内网络游戏市场日趋饱和，游戏公司获得新用户的成本不断增加,如何预防存量用户的流失已经成为市场营销的重心。提出了一种基于Spark平台的网络游戏用户流失预测方法，基于一个真实游戏日志数据对用户进行了流失预测。首先，从日志数据中抽取和计算了用户特征;随后,按权重选取了一组重要特征；最后，以特征为输入、流失与否为输出进行了二分类建模。综合比较了随机森林、支持向量机、多层感知机、梯度提升决策树和逻辑回归等6种常见分类算法。实验结果表明，随机森林算法表现最优，模型预测精度达到91%。

基于ARM架构的中值滤波算法优化

牟明任, 贾海鹏, 张云泉, 邓明森, 曲国远, 魏大洲, 张广婷

2022, 44(10): 1738-1746. doi:

摘要 ( 1041 )

PDF (1072KB) ( 508 ) 　　

中值滤波是图像处理中降低椒盐噪声的一种有效手段，其核心是计算当前滤波窗口内所有像素的中值。中值滤波具有稳定性，当一幅图像的像素点被改变时，即使改变的值很大，也不会影响中值滤波的计算结果。滤波窗口遍历整幅图像后，就完成了整幅图像的中值滤波计算。中值滤波算法的关键是定义最优中值算法，以在最短的时间内获取中值。对此，提出并实现了自适应中值算法，能够根据滤波窗口半径和数据类型，自动选择性能最佳的中值算法，并使用ARM NEON指令集进行优化加速。实验结果表明，提出的自适应中值滤波算法较OpenCV的中值滤波算法性能有显著提升，平均性能提升了20%。

基于FPGA快速实现定制化RISC-V处理器

陆松, 蒋句平, 任会峰

2022, 44(10): 1747-1752. doi:

摘要 ( 1332 )

PDF (1625KB) ( 636 ) 　　

随着RISC-V指令集的流行，出现了一批应用于IoT智能硬件、嵌入式系统、人工智能芯片、安全设备及高性能计算等不同领域的开源和商业IP软核。性能、功耗和面积三者之间的平衡需要指令集可裁剪、易扩展，以及软件开发环境的配套支持。为此，按照增加自定义指令、扩展ALU功能单元、连接控制信号和数据通路、FPGA原型验证、定制交叉编译环境和应用程序测试的流程，基于FPGA快速实现了定制化RISC-V处理器。以加速矩阵运算为例，基于FPGA在开源IP蜂鸟E203上设计了一条计算向量内积的自定义指令，并在FPGA上进行了原型验证。应用测试程序表明，定制化的RISC-V处理器的计算性能有显著提升，矩阵乘法运算的性能加速比达到了5.3~7.6。

基于用户行为的超级计算机作业失败预测方法

唐阳坤, 鲜港, 杨文祥, 喻杰, 张晓蓉, 王耀彬

2022, 44(10): 1753-1761. doi:

摘要 ( 1224 )

PDF (1001KB) ( 436 ) 　　

超级计算机的规模不断扩大，与此同时，科学应用的复杂性也在不断增加，这导致了超级计算机上许多作业失败。作业失败会造成资源浪费，排队作业等待时间延长，严重影响系统的执行效率。提前预测作业失败，就可以采取必要的措施提升系统资源利用率和系统执行效率，这对未来的E级超级计算机至关重要。为此，尝试研究从已知的传统特征和构建特征中预测作业失败，发现能够反映用户工作行为模式和提交行为模式的特征及处理方式。通过结合行为特征和传统特征，提出基于树结构模型的综合框架来预测作业失败。实验结果表明，预测效果优于其他相关方法。

基于AFP的有向加权注意力流网络链路预测

马满福, 姜璐娟, 李勇, 张强, 范颜军, 邓晓飞

2022, 44(10): 1762-1770. doi:

摘要 ( 633 )

PDF (882KB) ( 434 ) 　　

个性化推荐系统在减轻信息超载、提供个性化服务和辅助用户决策等方面应用广泛，链路预测是个性化推荐的重要方法之一。传统启发式链路预测方法仅考虑网络的图结构特征，缺乏对显式特征和隐式特征信息的应用，且大多数方法基于无向无权网络。针对传统链路预测方法存在的不足，基于集体注意力流网络和R-GCN方法，提出了链路预测算法AFP，将注意力流网络中2节点间不同的边方向抽象为2种边关系类型，并引入注意力机制学习网络中的节点属性和边属性，还综合考虑了网络的图结构特征、显式特征和隐式特征，最后通过评分函数得到三元组成立与否的概率，将链路预测问题转化为一个二分类问题，预测节点间的边属于某个关系类型的可能性。实验结果表明，相比于GCN、GAT等6个基准算法，该算法在准确度、精度和召回率等多个评价指标上均有提升。

基于区块链监管的联盟数据可信流通

丁滟, 王闯, 冯了了, 王锋, 常俊胜

2022, 44(10): 1771-1780. doi:

摘要 ( 1800 )

PDF (1450KB) ( 760 ) 　　

随着大数据技术在网络开放环境中的推广应用，越来越多的机构合作联盟产生，数据的共享与流通成为联盟中重要的资源共享方式，尤其在银行、医疗等联合作业场景中，只有系统中的各个组成机构共享各自拥有的数据，才能形成全面、清晰的业务视图，有效提升联盟的服务和生产效率。然而，在机构之间数据流通的过程中，在跨不同利益主体之间如何控制与追溯数据流向成为支持数据高效可信流通必须要解决的问题。提出了一种基于区块链监管的数据可信流通系统，通过区块链技术保证数据的流通信息不可篡改、可追溯，从而促进安全可信的数据共享流通生态建设。在此基础上，针对在开放环境中大规模网络环境存在的传输效率低、网络不稳定的复杂情况，在系统结构中引入可信代理作为数据服务的接口，从安全性与性能2个角度对系统进行优化，实现可信高效的数据流通。基于Hyperledger Fabric实现了原型系统，实验结果表明，系统在流通数据规模、用户请求并发规模等方面都具有良好的可扩展性。

基于理性密码学的分布式隐私保护数据挖掘框架

程小刚, 郭韧, 周长利,

2022, 44(10): 1781-1787. doi:

摘要 ( 2043 )

PDF (531KB) ( 475 ) 　　

在数据挖掘的应用中，隐私保护非常重要。在数据中加上噪声可以在一定程度上保护用户的隐私，但会降低数据的准确性，进而影响数据挖掘结果的有效性。提出一种高效的基于理性密码学的分布式隐私保护数据挖掘框架，在此框架中每个参与方都被认为是理性的，而不像在经典密码学中简单地把每个参与方认为是恶意的或诚实的。基于此种假设和一个半可信的第三方，许多数据挖掘函数，如求和、求平均值、求积、比较、和求频繁项等，都可以在本框架下高效地实现。

访问策略隐匿的可追责层次属性加密方案

唐广镇, 陈卓

2022, 44(10): 1788-1794. doi:

摘要 ( 818 )

PDF (634KB) ( 382 ) 　　

在传统的属性加密方案中，用户可能会共享私钥给具有相同属性集的多个用户而不怕被追责；此外，访问策略包含的信息可能会泄露用户隐私。针对这2个问题，提出一种可追责的隐匿策略的层次化属性加密方案。该方案在合数阶双线性群下基于访问树进行构造，具有灵活的表达能力，在访问策略中插入合数阶子群的随机元素实现策略隐匿；将用户标识加入私钥运算中，实现对泄露信息的违规用户的可追责；使用层次授权体系，降低单权威授权的计算负荷，提高了整体安全性和效率。实验结果和效率对比分析表明，该方案在加解密计算开销方面具备优势，且支持访问策略的隐匿和对违规用户的追责，大大提高了方案的安全性。

基于边缘检测的快速纸张检测方法

徐琨, 赵启雯, 徐源, 柳有权

2022, 44(10): 1795-1803. doi:

摘要 ( 1369 )

PDF (1535KB) ( 475 ) 　　

结合普通纸笔交互方式对纸张检测的实时性和鲁棒性的要求，提出了一种基于边缘检测的快速纸张检测方法。在边缘检测阶段，提出了跨层特征融合的快速纸张边缘检测方法。在HED主干网上添加线性瓶颈逆残差块和融入高效通道注意力的B-ECA块，大幅度减少了参数量，增加了显著特征的权重;分阶段融合各阶段各层特征，保留了更多的边缘特征;对高阶段特征上采样，并与低阶段特征进行跨层特征融合，解决了边缘模糊的问题。在自建的MPDS数据集上进行训练和测试，相较于HED方法，提出的纸张边缘检测方法在ODS和OIS指标上分别提高了8.1%和6.6%，检测速度由22.08 fps提高到了39.02 fps。在纸张提取阶段，提出了基于纸张结构约束的纸张提取方法。依次对纸张边缘进行基于非极大值抑制的边缘细化、直线检测与筛选、结构约束的纸张顶点提取，最终提取出只包含纸张的图像。实验结果表明，在各种复杂桌面环境及遮挡情况下，提出的纸张提取方法均可以快速、准确地提取完整的纸张图像，可以为普通纸笔交互方法提供交互基础。

轮式移动机器人轨迹跟踪控制研究

张小俊, 刘昊学

2022, 44(10): 1804-1811. doi:

摘要 ( 1092 )

PDF (1009KB) ( 582 ) 　　

针对轮式移动机器人参数摄动和内外部扰动等问题，提出一种新型的基于自适应扩张状态观测器的滑模控制算法。采用自适应虚拟速度控制器估计系统未知参数，滑模控制器抑制参数摄动和内外部扰动，非线性扩张状态观测器观测系统扰动并减小控制输入的抖振，实现了轨迹跟踪误差的快速收敛。利用Lyapunov稳定性理论证明了控制算法的稳定收敛性。将所提算法与传统自适应反演滑模算法进行对比，对比结果表明了所提算法的有效性和鲁棒性。

基于改进的YOLOv3口罩佩戴检测和识别

任小康, 刘行行

2022, 44(10): 1812-1821. doi:

摘要 ( 771 )

PDF (1744KB) ( 595 ) 　　

新冠疫情仍在全球肆虐，佩戴口罩可以有效阻断新冠病毒传播，口罩佩戴检测系统能及时提醒公共场所活动的人佩戴口罩。针对该问题及小尺度目标检测困难的问题，提出了一种基于YOLOv3改进的网络模型Face_mask Net用于口罩佩戴检测。由于YOLOv3算法训练的网络模型对小目标检测率低,IoU值相同时不能反映预测框和目标框是否相交，以及传统NMS对于遮挡经常产生错误抑制情况，Face_mask Net改进了残差块和神经网络结构，引入SPP模块和CSPNet网络模块，并采用DIoU作为损失函数,DIoU-NMS算法作为分类器。实验结果表明，Face_mask Net可以有效提高目标检测准确率，AP75下的平均准确率为58.05%，相比由YOLOv3算法训练的网络模型提高了4.11%。

基于曲率滤波和N-P准则的路面裂缝识别方法

王墨川, 何莉, 胡成雪, 陶健, 张德津

2022, 44(10): 1822-1831. doi:

摘要 ( 687 )

PDF (2023KB) ( 369 ) 　　

针对沥青路面裂缝不连续问题，提出一种基于曲率滤波和N-P准则的裂缝识别方法。通过组合最小矩形切平面和最小三角切平面及修正正则能量项的改进型曲率滤波算法，消除随机噪声并平滑纹理。采取二次分割策略提取疑似裂缝目标和运用裂缝几何特性去除块状或点状噪声，实现裂缝定位和获取裂缝片段。在此基础上，融合裂缝片段的位置和方向信息，提出利用N-P准则连接裂缝片段的端点，从而获得完整裂缝数据。研究结果表明，提出的方法对横裂、纵裂、块裂及龟裂等裂缝都具有较好的检测效果和较高的检测精度，裂缝检测的完整性达到90.5%以上。

低层人工拣货仓库货位优化问题研究

罗嫚玲, 林海, 刘威

2022, 44(10): 1832-1843. doi:

摘要 ( 743 )

PDF (1018KB) ( 556 ) 　　

在现代物流总成本中，仓储成本占很大比重，合理的储位分配是提高仓储拣选效率，降低仓储成本的核心所在。通过对低层人工拣货仓库的出库过程分析，同时考虑商品热销程度、商品之间的关联关系及货架位置等影响因素，设计了基于社区划分的货位优化算法。首先，根据商品关联性构建无向有权网络，并采用社区划分算法进行多次划分；然后，以社区为单位存放到货架，并通过调整阶段补齐货架；最后根据评估指标从多个方案中选出最优方案。评估指标根据缩短行走路径、缓解堵塞和减少拣选人员数量3个优化目标构建。实验结果表明，提出的货位优化算法无论是时间消耗还是货位摆放方案质量，与其他对比方案相比均具有显著优势。

改进的麻雀搜索优化算法及其应用

尹德鑫, 张达敏, 蔡朋宸, 秦维娜

2022, 44(10): 1844-1851. doi:

摘要 ( 1437 )

PDF (638KB) ( 849 ) 　　

麻雀搜索算法SSA在求解目标函数最优解时，存在种群多样性不丰富，易陷于局部最优,多维函数求解精度差等问题，针对这些问题提出改进的麻雀搜索算法ISSA。首先，利用反向学习策略初始化种群，增加种群多样性；然后，对步长因子进行动态调整，提高算法的求解精度；最后，在侦查预警的麻雀位置更新公式中引入Levy飞行,提高算法寻优能力和跳出局部极值的能力。将ISSA、SSA和其他算法在8个测试函数上进行求解，并进行秩和检验，仿真结果表明，ISSA具有更高的寻优性能。还将ISSA应用到认知无线电的频谱分配中，实验结果表明，ISSA的系统效益和公平性优于其他算法，验证了ISSA在实际应用中的可行性。

具有时变通信延迟的多智能体系统改进蜂拥控制

寇巧媛, 袁杰

2022, 44(10): 1852-1860. doi:

摘要 ( 628 )

PDF (1482KB) ( 388 ) 　　

针对不确定非线性二阶多智能体系统中存在的时变通信时延和未知干扰问题，提出了一种鲁棒自适应蜂拥控制规律。为了使二阶多智能体系统能够具有更好的抗干扰能力，设计了基于智能体位置状态信息和速度状态信息的鲁棒自适应算子，实现了系统在时变通信时延扰动下的分布控制。通过使用Lyapunov-Krasovskii方法构造能量函数，证明了多智能体系统的网络连通性，智能体的速度收敛于虚拟领导者的速度，并给出了具有时变通信时延的多智能体系统收敛条件。仿真实验结果表明，在不同干扰强度和不同通信时延下系统均能实现快速收敛，形成稳定的拓扑结构，证明所提方法正确有效。

基于回译和比例抽取孪生网络筛选的汉越平行语料扩充方法

王可超, 郭军军, 张亚飞, 高盛祥, 余正涛,

2022, 44(10): 1861-1868. doi:

摘要 ( 586 )

PDF (1091KB) ( 569 ) 　　

回译作为翻译中重要的数据增强方法，受到了越来越多研究者的关注。其基本思想为首先基于平行语料训练基础翻译模型，然后利用模型将单语语料翻译为目标语言，组合为新语料用于模型训练。然而在汉越低资源场景下，训练得到的基础翻译模型性能较差，导致在其上应用回译方法得到的平行语料中含有较多噪声，较难用于下游任务。针对此问题，构建基于比例抽取的孪生网络筛选模型，通过训练使得模型可以识别平行句对和伪平行句对，在同一语义空间上对回译得到的伪平行语料进行筛选去噪，进而得到更优的平行语料。在汉越数据集上的实验结果表明，所提方法训练的模型的性能相较基线模型有显著提升。

手语到情感语音的转换

王伟喆, 郭威彤, 杨鸿武,

2022, 44(10): 1869-1876. doi:

摘要 ( 664 )

PDF (907KB) ( 475 ) 　　

为了解决语言障碍者与健康人之间的交流障碍问题，提出了一种基于神经网络的手语到情感语音转换方法。首先，建立了手势语料库、人脸表情语料库和情感语音语料库；然后利用深度卷积神经网络实现手势识别和人脸表情识别，并以普通话声韵母为合成单元，训练基于说话人自适应的深度神经网络情感语音声学模型和基于说话人自适应的混合长短时记忆网络情感语音声学模型；最后将手势语义的上下文相关标注和人脸表情对应的情感标签输入情感语音合成模型，合成出对应的情感语音。实验结果表明，该方法手势识别率和人脸表情识别率分别达到了95.86%和92.42%，合成的情感语音EMOS得分为4.15，合成的情感语音具有较高的情感表达程度，可用于语言障碍者与健康人之间正常交流。

基于时域-频域哈希编码的电网图像检索方法

强梓林, 刘建国, 刘云峰, 卫栋, 强彦

2022, 44(10): 1877-1884. doi:

摘要 ( 490 )

PDF (1146KB) ( 394 ) 　　

电网数据信息的准确检索在保障电网系统正常运行方面起着非常重要的作用。快速准确地从电网图像数据库中查找到与目标图像相似度高的图像可以有效地提高电网工作人员的工作效率，降低设备维护成本。针对传统检索方法检索精度低的问题，提出了一种基于时域-频域的端到端哈希编码方法。最后，在2个数据集上将该方法与最新的8种方法进行了比较，实验结果表明该方法是有效的。该方法创新性地结合了频域信息，以提高预测正确率，且结合了多任务学习和距圆损失来更加清晰地约束哈希编码任务的训练过程，使图像检索结果更加准确。

非Hermitian正定线性方程组的外推的广义HSS方法

吴思婷, 鲍亮

2022, 44(10): 1885-1892. doi:

摘要 ( 535 )

PDF (619KB) ( 498 ) 　　

探讨了如何高效求解非Hermitian正定线性方程组，提出了一种外推的广义Hermitian和反Hermitian (EGHSS) 迭代方法。首先，根据矩阵的广义Hermitian和反Hermitian分裂，构造出了一种新的非对称的二步迭代格式。接着，理论分析了新方法的收敛性，并给出了新方法收敛的充要条件。数值实验结果表明，在处理某些问题时，EGHSS迭代方法比GHSS迭代方法和EHSS迭代方法更有效。

基于深度BiLSTM和图卷积网络的方面级情感分析

杨春霞, 宋金剑, 姚思诚,

2022, 44(10): 1893-1900. doi:

摘要 ( 750 )

PDF (678KB) ( 615 ) 　　

现有方面级情感分析方法，存在无法获取最优文本表示和使用普通图卷积网络不能提取依存图中深层结构信息的问题。为此，提出了一种基于深度BiLSTM（DBiLSTM）和紧密连接的图卷积网络（DDGCN）模型。首先,通过DBiLSTM获取方面词与上下文单词间的深层语义信息；其次，在原始图卷积网络中加入紧密连接，以生成能提取深层结构信息的紧密图卷积网络；然后，利用改进后的图卷积网络捕获依存图上的结构信息；最终，将融合2种深层信息的文本表示用于情感分类。3个数据集上的实验结果表明，DDGCN模型相比对比模型在准确度和F1上均有提升。

当期目录

作者中心

审稿中心

在线期刊