计算机工程与科学

2022年第12期目录

2022, 44(12): 0-0. doi:

摘要 ( 332 )

PDF (285KB) ( 291 ) 　　

基于即时编译的GNU Octave性能优化

莫舒恒, 卢圣有, 黄聃, 卢宇彤

2022, 44(12): 2091-2101. doi:

摘要 ( 1068 )

PDF (1126KB) ( 612 ) 　　

GNU Octave是一款数值计算软件，具有免费、开源以及几乎完全兼容MATLAB语言的优点。然而，Octave内置的基于LLVM的实验性即时编译器仅支持对少部分代码进行即时编译，无法有效解决Octave效率低下的问题。基于Octave即时编译器探究对Octave的性能优化方案，从工作原理角度出发，对该即时编译器整体工作原理和其中的类型推断系统进行分析；从工作现状角度出发，评估该即时编译器对Octave代码的适用范围和性能提升效果；针对该即时编译器的内置函数调用、索引运算与算术逻辑运算进行特性修复和功能新增，使Octave获得性能提升。实验结果表明，基于即时编译器的优化方案有效扩展了即时编译器的适用范围，为Octave代码执行带来56~283倍不等的性能提升。此外，总结了该即时编译器中存在的16类缺陷，对进一步优化Octave性能具有参考意义。

工业区块链中基于CUDA的数据并行处理方法

陈强, 谭林, 王云丽, 肖靖

2022, 44(12): 2102-2110. doi:

摘要 ( 1040 )

PDF (1179KB) ( 526 ) 　　

工业区块链数据交易系统能够使交易双方在没有中间商存在的情况下安全地进行交易，简化了交易流程，降低了交易成本。针对大规模数据上链，现有的一般做法是将源数据的哈希值作为元数据存储到区块链，源数据本身则存储在本地或云端。一方面，传统哈希值的计算方式难以满足工业大规模数据高效上链的需求。另一方面，由于只将元数据存储到了区块链，交易时数据需求者在只收到元数据时无法确认源数据本身是否完整。因此，设计了一种基于CUDA的数据并行处理方法，通过合理的数据分块、线程布局等手段加快大规模工业数据哈希值的计算速度，提高上链效率。并且，基于此方法构建了两方数据完整性验证模型，数据需求者在交易时能够在未得到源数据的情况下，根据证明信息有效地验证源数据的完整性，避免了因传输无用数据而付出的通信代价。对于较大规模工业数据，所提出的计算方法可将哈希值计算效率提升至少22%。同时，由安全性分析可知，在数据拥有者持有签名私钥的特殊情况下，数据需求者在交易时可以对源数据进行完整性验证。

基于指令Cache和寄存器压力的循环展开优化

王翠霞, 韩林, 刘浩浩

2022, 44(12): 2111-2119. doi:

摘要 ( 1186 )

PDF (797KB) ( 741 ) 　　

循环展开是一种常用的编译优化技术，能够有效减少循环开销，提升指令级并行程度和数据局部性，提升循环的执行效能。然而，过度的循环展开会造成指令Cache溢出，增大寄存器压力，循环展开次数太少又会浪费潜在的性能提升机会，因此寻找恰当的展开因子是研究循环展开问题的核心。基于GCC开源编译器，面向循环展开问题开展深入的分析与研究，针对指令Cache和寄存器资源对循环展开的影响，提出了一种基于指令Cache和寄存器压力的循环展开因子计算方法，并在GCC编译器中实现了该计算方法。申威和海光平台上的实验结果显示，相较于目前GCC中存在的其它展开因子计算方法，所提出的方法可以获得更为有效的循环展开因子，提升了程序性能。在SPEC CPU 2006测试集上的平均性能分别提升了2.7%和3.1%，在NPB-3.3.1测试集上的分别为5.4%和6.1%。

一种HEVC帧内预测算法的动态自重构实现方法

崔馨月, 蒋林, 杨坤, 惠超, 胡传瞻, 赵静

2022, 44(12): 2120-2127. doi:

摘要 ( 926 )

PDF (1355KB) ( 440 ) 　　

高效视频编码HEVC中帧内预测算法在专用硬件上的实现无法满足在高清和移动视频等多种应用场景间灵活切换的需求，导致编码性能差，硬件资源利用率不高。针对这一问题，提出一种新的帧内预测算法在可重构阵列处理器上的实现方法。该方法基于状态监测机制监测处理单元的执行状态，监测到空闲状态的处理单元则下发新的执行任务，根据处理单元的执行状态实现不同映射方案间的灵活切换，达到算法执行过程的动态自重构。实验结果表明，与帧内预测算法在专用处理器上的实现相比，本文方法在提高灵活性的同时，硬件资源使用减少了33.6%，算法执行的时钟周期数减少了16.2%。不同测试序列经过整个I帧环路测试的结果，与HM16.7官方软件的测试结果相比，平均图像质量有所提高。

面向多智能体博弈的并行蒙特卡洛树搜索算法研究

管延霞, 刘逊韵, 刘运韬, 谢旻, 徐新海

2022, 44(12): 2128-2133. doi:

摘要 ( 853 )

PDF (789KB) ( 1038 ) 　　

蒙特卡洛树搜索算法是一种常用的强化学习算法，博弈过程中动态空间的指数级增长是制约该算法学习效率的因素。基于并行方法对蒙特卡洛树搜索算法进行优化，提出基于胜率估值传递的并行蒙特卡洛树搜索算法。改进后的并行博弈搜索策略框架包含一个主进程和多个子进程，其中子进程用于探索，主进程根据子进程传递的胜率估值数据进行决策。结合多智能体博弈平台Pommerman进行实验验证，与传统的蒙特卡罗树搜索算法相比，并行蒙特卡罗树搜索算法有效提高了资源利用率、博弈胜率及决策效率。

几类线性码的扩展码及其在密钥共享中的应用

李晓茹, 衡子灵, 李文婷

2022, 44(12): 2134-2139. doi:

摘要 ( 533 )

PDF (388KB) ( 390 ) 　　

极小线性码在构造安全高效访问结构上的密钥共享方案中应用广泛。研究了几类线性码的扩展码,并得出了其参数和重量分布。结果表明,这些扩展码都是极小码,可用于构造密钥共享方案。此外，还给出了一些最优码或几乎最优码。

对认证加密算法Pyjamask的伪造攻击

贺水喻, 魏悦川, 潘峰, 畅利鹏

2022, 44(12): 2140-2145. doi:

摘要 ( 443 )

PDF (519KB) ( 411 ) 　　

Pyjamask算法是入围LWC竞赛第2轮的竞选算法之一。该算法结构简单、轻量高效，具有良好的非线性部件并行运算能力，引起了大量密码学者的高度关注。目前该算法的安全性问题研究相对较少，迫切需要新一轮的安全性评估。基于Pyjamask的结构与参数的特点，提出了一种对明文进行伪造的方法，可以准确伪造出认证标签。理论分析表明：选择1组明文时成功概率为1，数据复杂度和时间复杂度可忽略不计；选择s+1组明文时成功概率也为1，但对所选数据要求较高。

基于身份的无对密文等值测试公钥加密方案

丁宾宾, 曹素珍, 丁晓晖, 窦凤鸽, 马佳佳

2022, 44(12): 2146-2152. doi:

摘要 ( 815 )

PDF (609KB) ( 511 ) 　　

公钥加密等值测试技术可以判断云服务器中使用了不同公钥加密的密文所对应的明文是否相同。基于传统PKI体系的密文等值测试公钥加密方案大多数是借助双线性对来实现，计算繁琐、效率偏低，同时随着用户数量增加，大量证书的生成、申请、颁发和撤销等工作愈发繁重，给系统的维护工作和可持续工作带来了挑战。针对该问题，提出了基于身份的无对密文等值测试公钥加密方案PF-IBEET，通过明文信息构造出的2点确定一条直线，利用直线实现加密、解密、授权和等值测试过程，摆脱了双线性对的限制，计算效率得到提高，同时PF-IBEET方案是在身份密码体制下构建的，解决了传统PKI体系中复杂的证书管理问题。在随机预言模型下,基于CDH和DDH数学困难问题，证明了PF-IBEET方案满足OW-ID-CCA和IND-ID-CCA安全。

改进Stacking集成学习的指纹识别算法

苏赋, 罗海波

2022, 44(12): 2153-2161. doi:

摘要 ( 1156 )

PDF (972KB) ( 540 ) 　　

针对传统卷积神经网络对多传感器指纹识别泛化能力降低、准确率不高的问题，提出改进的Stacking集成学习算法。首先将AlexNet进行改进，在AlexNet中引入深度可分离卷积减少参数量，加快训练速度；引入空间金字塔池化，提升网络获取全局信息的能力；引入批归一化，加快网络收敛速度,同时提升网络在测试集上的准确率；使用全局平均池化替代全连接层，防止过拟合。然后将DenseNet和改进的AlexNet 2种卷积神经网络作为Stacking的基学习器对指纹进行分类，获得预测结果。最后对相同基学习器训练得到的各个模型，根据预测精度对各预测结果赋权，得到的预测结果再由元分类器分类。改进的Stacking算法在多传感器指纹数据库上进行实验，最终识别准确率达98.43%，相对AlexNet提升了20.05%，相对DenseNet提升了4.25%。

故障检测率对软件可靠性影响实证分析

孙智超, 张策, 江文倩, 刘凯卫, 范苗苗, 李文毓, 温雅菲

2022, 44(12): 2162-2173. doi:

摘要 ( 1532 )

PDF (974KB) ( 554 ) 　　

故障检测率是软件可靠性模型的主要参数之一，不同形式的故障检测率具有不同的作用。聚焦于故障检测率对软件可靠性的影响，提出基于信息熵与优劣距离决策算法的单可靠性模型单失效数据集多故障检测率与多可靠性增长模型多失效数据集多故障检测率2种实证分析方案，旨在全面地分析故障检测率的影响。经过实验分析，对于单一可靠性模型单一数据集，故障检测率对软件可靠性的影响主要与失效数据集相关，在不同数据集上不同故障检测率函数的性能差异较大；在多可靠性模型多数据集上，幂函数与S型故障检测率对应的软件可靠性模型的综合性能较好，指数型故障检测率对应的软件可靠性模型的综合性能较差。本文的研究对于软件可靠性建模中的模型参数选择、最优发布时间的确定等具有较强的指导作用。

模糊测试技术研究综述

牛胜杰, 李鹏, 张玉杰,

2022, 44(12): 2173-2186. doi:

摘要 ( 3379 )

PDF (884KB) ( 2114 ) 　　

随着人们对软件系统安全问题关注度的不断提升，模糊测试作为一种用于安全漏洞检测的安全测试技术，具有自动化程度高、误报率低等优点，其应用越来越广泛，地位也越来越重要。经过近些年的不断改进，模糊测试无论在技术发展上还是在应用创新上，都取得了诸多成就。首先，对模糊测试的相关概念和基本理论进行简要说明，总结了模糊测试在各领域的应用情况，针对不同领域的漏洞挖掘需求，分析得出相应的模糊测试解决方案。其次，重点总结了近几年来模糊测试的重要发展成果，包括测试工具、框架、系统及方法的改进与创新，并分析总结了各发展成果所采用的创新方法，提出的理论以及各工具、系统的优点与不足。最后，分别从协议逆向工程应用、云平台建设、新兴技术结合、模糊测试对抗技术研究及模糊测试工具集成的角度，为模糊测试下一步的研究提供了方向参考。

融合语句复杂度的软件错误定位轻量级方法

何海江

2022, 44(12): 2187-2195. doi:

摘要 ( 905 )

PDF (518KB) ( 636 ) 　　

在程序调试过程中，基于程序谱的软件错误定位(SBFL)技术能提供有效的帮助。为改善SBFL的性能，提出一种组合程序谱、代码行静态属性的软件错误定位排序学习方法，由线性排序支持向量机学习最优错误定位模型。代码行静态属性包括局部变量、类属性、逻辑运算符和方法调用等程序实体的个数。在使用C、C++和Java语言开发的22个实际故障项目上，采用跨工程的形式训练错误定位模型。实验结果表明，新方法比最优SBFL减少了37.1%的最坏策略EXAM和22.6%的平均策略EXAM。还比较了程序语句的3类轻量级特征：结构化类别、变量谱和静态属性。新方法的时间复杂度低，能实时地推荐可能出现故障的语句序列。

改进YOLO v4-tiny的火焰实时检测

王冠博, 赵一帆, 李波, 杨俊东, 丁洪伟

2022, 44(12): 2196-2205. doi:

摘要 ( 1411 )

PDF (1300KB) ( 1099 ) 　　

为解决火焰实时检测参数量大、对硬件计算能力要求高等问题，提出了改进型YOLO v4-tiny的轻量级火焰实时检测模型。首先，对模型的参数进行了修剪；其次，通过在模型的浅层加入改进型的CSP-RFBs，扩大网络浅层的感受野；然后，对CSP-ResNet的框架进行改进，提出了速度更快、准确率更高的沙漏型CSP-ResNet；最后，在网络深层采用改进型CSP-SPPs，对多重感受野进行进一步融合。实验结果表明，改进型YOLO v4-tiny模型的准确率可达48.5%，较原模型提升了15.5%；模型的参数量和权重文件大小分别为2.45 BFLOPs和16.3 Mb，分别比原模型减少了63.9%和30.6%。在移动开发板NVIDIA Jeston Xavier上FPS可达49.6，比原模型提升了21.9%。

一种基于pix2pix改进的工业缺陷数据增强方法

罗月童, 段昶, 江佩峰, 周波

2022, 44(12): 2206-2212. doi:

摘要 ( 1382 )

PDF (583KB) ( 597 ) 　　

基于深度学习的目标检测算法在工业检测中应用广泛，为解决工业缺陷数据不足的问题，提出了一种基于pix2pix改进的缺陷数据增强方法。从加强生成器和判别器对图像中缺陷区域的注意力出发，针对pix2pix进行了如下改进：（1）仅将整幅图像的缺陷区域作为判别器的输入，以此提升生成器对缺陷区域的注意力，同时，判别器采用了更小的卷积核提取缺陷区域的特征；（2）仅将图像中所有缺陷区域的平均生成对抗损失作为该图像的生成对抗损失，使网络更加关注缺陷区域的特征学习。在工业LED缺陷数据集上的实验结果表明，本方法生成的缺陷具有更逼真的视觉效果和更低的FID指数，同时有效提升了基于RetinaNet算法的缺陷检测精度。

基于路径签名的改进时空图卷积网络

赵艺

2022, 44(12): 2213-2219. doi:

摘要 ( 913 )

PDF (681KB) ( 510 ) 　　

针对时空图卷积网络ST-GCN中GCN的关节邻接图不易学习远端关节之间的语义信息和TCN在描述时间信息方面存在不足的问题，引入了数字签名预处理来增强数据，提出了基于路径签名的改进时空图卷积网络SSIT-GCN。首先将关节位置坐标的时间序列输入签名层进行数据预处理，在该层时间序列通过嵌入算法被转换为多维路径，将其划分为多条路径并计算每条路径的签名特征；其次重新设计GCN的关节邻接矩阵，并用反卷积来代替补零，以保持TCN的尺寸不变，还引入1×1的卷积核增加非线性来改进ST-GCN,得到改进时空图卷积网络SIT-GCN;最后用签名特征代替原始数据输入SIT-GCN，得到最终的输出结果。实验结果表明，基于路径签名的改进时空图卷积网络大大提高了训练精度，缩短了训练时间，对动态手势识别有较好的识别能力和识别速度。

基于深度学习的海岸线边缘检测网络模型

李忠瑞, 崔宾阁, 杨光, 张昊卿

2022, 44(12): 2220-2229. doi:

摘要 ( 1340 )

PDF (1669KB) ( 878 ) 　　

海岸线的动态监测对海岸带的规划管理具有非常重要的意义。由于海陆环境错综复杂，遥感影像中海陆边界光谱特征不明显，导致提取的海岸线定位不准确。提出一种融合语义分割网络和边缘检测网络的深度卷积神经网络模型(EWNet)。该模型包含2个分支流：语义分割流负责提取分层语义信息并用来指导边缘检测流获取岸线语义信息；边缘检测流通过语义分割流完善边缘语义信息。在“高分一号”遥感图像上的实验结果表明，与几种最新网络模型相比，EWNet获得了更精确的海岸线边界提取结果。

基于提高伪平行句对质量的无监督领域适应机器翻译

肖妮妮, 金畅, 段湘煜

2022, 44(12): 2230-2237. doi:

摘要 ( 878 )

PDF (597KB) ( 542 ) 　　

神经机器翻译系统的良好性能依赖于大规模内领域双语平行数据，当特定领域数据稀疏或不存在时，领域适应是个很好的解决办法。无监督领域适应方法通过构建伪平行语料来微调预训练的翻译模型，然而现有的方法没有充分考虑语言的语义、情感等特性，导致目标领域的翻译包含大量的错误和噪声，从而影响到模型的跨领域性能。为缓解这一问题，从模型和数据2个方面来提高伪平行句对的质量，以提高模型的领域自适应能力。首先，提出更加合理的预训练策略来学习外领域数据更为通用的文本表示，增强模型的泛化能力，同时提高内领域的译文准确性；然后，融合句子的情感信息进行后验筛选，进一步改善伪语料的质量。实验表明，该方法在中-英与英-中实验上比强基线系统反向翻译的BLEU值分别提高了1.25和 1.38，可以有效地提高翻译效果。

改进搜索机制的单纯形法引导麻雀搜索算法

刘成汉, 何庆

2022, 44(12): 2238-2245. doi:

摘要 ( 667 )

PDF (669KB) ( 467 ) 　　

为了改善基本麻雀搜索算法在处理优化问题时存在的收敛精度不高、速度慢和易陷入局部极小值的问题，提出一种改进搜索机制的单纯形法引导麻雀搜索算法。首先，针对发现者搜索过程随机性过高的问题，改进发现者搜索机制，提高算法收敛速度和稳定性；其次，改进麻雀搜索算法侦察机制，提高算法跳出局部极小值能力；最后，对每一次迭代适应度较差的部分个体采用单纯形法的相关操作，提高算法搜索能力。在8个基准测试函数以及部分CEC2014测试函数上的性能对比，同时结合Wilcoxon秩和检测分析，验证了改进算法的鲁棒性。

基于混合分布注意力机制与混合神经网络的语音情绪识别方法

陈巧红, 于泽源, 贾宇波

2022, 44(12): 2246-2254. doi:

摘要 ( 702 )

PDF (698KB) ( 665 ) 　　

针对现有语音情绪识别中存在无关特征多和准确率较差的问题，提出一种基于混合分布注意力机制与混合神经网络的语音情绪识别方法。该方法在2个通道内，分别使用卷积神经网络和双向长短时记忆网络进行语音的空间特征和时序特征提取，然后将2个网络的输出同时作为多头注意力机制的输入矩阵。同时，考虑到现有多头注意力机制存在的低秩分布问题，在注意力机制计算方式上进行改进，将低秩分布与2个神经网络的输出特征的相似性做混合分布叠加，再经过归一化操作后将所有子空间结果进行拼接，最后经过全连接层进行分类输出。实验结果表明，基于混合分布注意力机制与混合神经网络的语音情绪识别方法比现有其他方法的准确率更高,验证了所提方法的有效性。

采用双档案协同进化离散多目标烟花算法的低碳疫苗冷链优化配送

申晓宁, 游璇, 陈庆洲, 潘红丽, 黄遥

2022, 44(12): 2255-2265. doi:

摘要 ( 1662 )

PDF (967KB) ( 533 ) 　　

建立低碳疫苗冷链配送问题的约束多目标优化模型，在满足可用车数量、车辆容量约束和时间窗约束的条件下，考虑最小化碳排放的企业运输成本和客户不满意度。提出一种双档案协同进化的离散多目标烟花算法，采用消除车辆数量和容量约束的解码方式，设计了部分映射爆炸算子，设置可行解档案和不可行解档案协同进化，并对不可行解档案实施可行性搜索。实验结果表明，与已有算法相比，所提算法在低碳疫苗冷链配送问题上能高效地搜索到一组收敛精度和分布性能更优的Pareto非支配解。

基于多级语义信息融合编码的序列标注方法

蔡雨岐, 郭卫斌

2022, 44(12): 2266-2272. doi:

摘要 ( 837 )

PDF (484KB) ( 471 ) 　　

序列标注是自然语言处理领域的基本任务。目前大多数序列标注方法采用循环神经网络及其变体直接提取序列中的上下文语义信息，尽管有效地捕捉到了词之间的连续依赖关系并取得了不错的性能，但捕获序列中离散依赖关系的能力不足，同时也忽略了词与标签之间的联系。因此，提出了一种多级语义信息融合编码方式，首先，通过双向长短期记忆网络提取序列上下文语义信息;然后,利用注意力机制将标签语义信息添加到上下文语义信息中，得到融合标签语义信息的上下文语义信息;接着,引入自注意力机制捕捉序列中的离散依赖关系，得到含有离散依赖关系的上下文语义信息;最后,使用融合机制将3种语义信息融合，得到一种全新的语义信息。实验结果表明，相比于采用循环神经网络或其变体对序列直接编码的方式,多级语义信息融合编码方式能明显提升模型性能。

基于同步压缩和DCGAN的癫痫脑电信号检测方法

齐永锋, 裴晓旭, 吕雪超, 王静

2022, 44(12): 2273-2280. doi:

摘要 ( 765 )

PDF (743KB) ( 520 ) 　　

脑电信号智能识别是癫痫病检测的重要手段，为更加准确地预测癫痫发作，针对目前的深度学习方法特别是卷积神经网络在脑电信号分类方面存在的一些问题，如算法复杂度过高、样本量太少导致分类效果差等，提出基于傅里叶同步压缩变换和深度卷积生成对抗网络的癫痫脑电信号检测方法。首先同步压缩方法将短时傅里叶变换处理后的信号时频能量进行压缩，使得频谱图像精度更高；其次构建深度卷积生成对抗网络来提取特征;最后实现癫痫发作预测。实验在CHB-MIT脑电数据集上进行，结果表明该方法具有97.9%的检测准确率。使用生成对抗网络有效解决了样本量不足的问题，结合同步压缩处理方法后，具有良好的识别准确性。

当期目录

作者中心

审稿中心

在线期刊