计算机工程与科学

2021年第6期目录

2021, 43(06): 0-0. doi:

摘要 ( 181 )

PDF (293KB) ( 228 ) 　　

分布式环境中的多作业执行调度策略与优化

季航旭, 姜苏, 赵宇海, 吴刚, 王国仁

2021, 43(06): 951-961. doi:

摘要 ( 380 )

PDF (943KB) ( 432 ) 　　

分布式大数据计算引擎是科研机构、互联网企业和政府部门处理大规模数据必不可少的工具，它们的使用和推广促进了各个领域的快速发展，为社会进步做出了巨大贡献。但是，在多作业处理的情况下，目前主流的大数据计算引擎在资源分配和作业调度方面仍有许多不足之处，它们通常对多作业平均划分内存资源并以先进先出FIFO的方式调度作业，这样简单的资源划分方式和作业调度机制并不能充分利用系统性能。针对此问题，从计算引擎的作业层面做出了改进：在资源划分方面，通过提取作业特征对作业的任务量进行预估，判断作业任务量和作业预分配资源间的差异，合并对集群资源浪费较高的作业，充分利用计算资源；在作业调度方面，对作业池中的作业进行特征提取，使用多路K-means算法对作业进行聚类分析，然后基于分析的结果，使用自平衡轮询调度算法对作业进行调度，达到负载均衡的目的。为了验证所提算法的有效性，使用大规模文本数据集在分布式集群环境中进行对比实验，实验结果表明，提出的作业合并算法和多作业调度算法可以减少5%~23%的作业运行时间，提高了7.5%~29%的系统吞吐量，在最好情况下可减少40%的线程启动数。

编译器中激进蝴蝶优化方法的研究与实现

朱广林, 吕方, 赖庆宽, 陈华英, 何先波,

2021, 43(06): 962-968. doi:

摘要 ( 340 )

PDF (660KB) ( 238 ) 　　

编译优化技术的目的是挖掘程序中的优化空间，提高程序编译或运行效率，无效代码删除优化是被广泛使用的编译优化技术之一，它旨在删除程序中不可达的代码，以提升程序的执行效率。许多应用程序的执行路径往往与运行时的输入参数值相关，并且在一些分支路径上与运行时参数值相结合，可能存在无效代码，通过现有的无效代码删除优化，很难做出优化处理。为此，提出一种依赖数据流分析的激进蝴蝶优化方法，利用SSA中间表示，根据动态运行时的参数可能值，自动为程序生成代码形状类似蝴蝶（butterfly）的分支代码，使编译器在程序编译阶段为相关优化提供可行的优化依据。最后通过实验验证了该方法的有效性和可行性。

FPD平行端口矩形区域内电阻驱动的自动布线算法

韩奥, 赵振宇, 刘国强, 杨天豪

2021, 43(06): 969-975. doi:

摘要 ( 212 )

PDF (814KB) ( 288 ) 　　

平板显示器技术已逐渐发展为主流屏幕显示技术，而自动化布线是其面板电路和触摸屏电路设计领域的重要研究任务之一。根据布线需求的不同，需要不同的布线解决方案，如定阻值布线或等电阻布线。该类布线任务通常需要在2组端口间进行指定布线区域和最大电阻值的布线。每根布线电阻限制在指定范围内，从而满足IC驱动负载的要求。平行端口矩形区域布线是常见且重要的布线目标，找到一种合适的空间分配方案是十分必要的。电阻驱动的端到端布线算法，在布线规划时进行端口分组，然后对每组端口进行多段式的预布线，再以自适应步长调节电阻至限定区域。在3个对比实验中成功完成了30个平行端口实例的布线。相比于简单三段式布线和定步长调节电阻的形式，能够有效减少约40%的平均布线时间和31%的平均内存,布线电阻达标率为100%。

基于TPU和FPGA的深度学习边缘计算平台的设计与实现

栾奕, 刘昌华

2021, 43(06): 976-983. doi:

摘要 ( 293 )

PDF (665KB) ( 350 ) 　　

针对深度神经网络为了追求准确度对计算资源造成的巨大消耗，与边缘计算平台所处的受限环境之间的矛盾，探究利用FPGA逻辑资源搭建神经网络张量处理器（TPU），通过配合ARM CPU实现全新的边缘计算架构，不仅实现对深度神经网络模型的加速计算以及准确度的提升，还对功耗进行明显优化。该架构下，压缩后的MobileNet-V1网络准确度可达78.1%，而功耗仅为3.4 W，与其他不同计算架构的深度学习边缘计算平台的对比结果表明，该系统在不降低准确度的条件下，对于小规模深度神经网络的加速计算有着明显优势。

基于机器学习方法的高速信道建模研究

何静, 李晋文, 杨安毅

2021, 43(06): 984-988. doi:

摘要 ( 272 )

PDF (698KB) ( 330 ) 　　

随着高速信道的传输速率变快，传输长度变长，结构复杂度变高，对信道进行建模也变得复杂与艰难。将目前比较火热的机器学习方法与高速信道结合起来，提出了一个新颖的方法。利用采集的大量模拟数据，采用深度神经网络DNN与循环神经网络RNN对信道建模，模型一旦训练成功，就可以通过该仿真模型预测输出信号的眼图，快速精准地对信号完整性进行评估和分析。另外，在高速信道中，信号的严重干扰和衰减问题会限制传输距离和传输速率，给测试和信息采集带来困难。为了恢复理想信号，高速串行链路通常包含复杂的均衡摸块，采用最小均方算法LMS可以有效地消除干扰，减小误码率，提高传输速率。

基于ARM SVE的光滑粒子流体动力学SIMD加速方法

范小康, 夏泽宇, 龙思凡, 杨灿群

2021, 43(06): 989-996. doi:

摘要 ( 251 )

PDF (915KB) ( 296 ) 　　

光滑粒子流体动力学（SPH）是近年来兴起的一种无网格的粒子方法，SPH在处理大变形、运动物质表面以及自由表面等问题时优势明显，在数值模拟领域得到了非常广泛的应用，是一种典型的科学计算应用。作为一种显式的粒子方法，SPH在每一个迭代步都需要计算大量的粒子间相互作用，计算量非常大，如何提高SPH的计算效率成为研究热点。可伸缩矢量扩展（SVE）是ARM针对高性能计算推出的下一代SIMD指令集，基于SVE研究了SPH方法的SIMD加速方法，取得了显著的加速效果。

一种基于国产异构众核处理器的C++智能源码转换框架

俞茂学, 贾东宁, 魏志强, 许佳立, 马广浩

2021, 43(06): 997-1005. doi:

摘要 ( 262 )

PDF (1305KB) ( 359 ) 　　

国产异构众核处理器是我国打破国际技术壁垒，在高性能计算领域取得突破的关键环节。围绕国产超算的软件生态环境建设，采用智能源码转换的方法盘活海量多核架构的遗产代码是加速软件研发效率，推动领域发展的重要途径。针对国产运算核心不支持C++编译的现状，基于开源的ANTLR语言翻译工具，提出了一种面向异构众核处理器的智能化C++语言向C语言转换的辅助框架。该框架聚焦面向对象语言的关键特征，基于抽象语法树，实现了基类和继承类、函数定义、基于标签法的模板实例化以及部分STL库的C语言转换，建立了待转换代码的自动化标注体系，极大地提高了C++代码的转换和移植效率。通过对可衡量的并行计算基准应用BableStream进行自动转换和移植测试，证实了该转换框架的有效性。

基于排序学习的构件检索方法的研究

陈华烨, 汪海涛, 姜瑛, 陈星

2021, 43(06): 1006-101. doi:

摘要 ( 198 )

PDF (727KB) ( 221 ) 　　

将排序学习的方法应用于构件检索的研究中，首先，采用刻面描述的方法对构件进行全面的描述，并通过word2vec模型和权重设定的方法对刻面描述的构件进行特征提取;然后，对构件特征进行潜在语义分析和余弦相似度计算,得到构件训练数据集;最后，通过使用构件训练数据集和构件数据集对经过改进的Plackett-Luce概率排序模型用最大似然估计方法训练模型参数，从而得到一种构件排序模型。将构件排序模型应用到构件检索中开发实现了一个构件检索方法，通过实验验证了此方法的有效性，其查全率、查准率和效率都优于传统的构件检索方法。

引入线索约束的设计模式变体挖掘研究

肖卓宇, 何锫, 徐运标, 陈果, 郭杰, 黄俊

2021, 43(06): 1014-1023. doi:

摘要 ( 136 )

PDF (869KB) ( 183 ) 　　

针对设计模式变体挖掘准确率较低的问题，提出引入线索约束的设计模式变体挖掘方法，旨在基于约束满足问题CSP描述设计模式变体线索，给出DPVMC算法，分结构特征约束与时序特征约束2个阶段引入线索。以Proxy、Bridge、Command、Factory Method 模式变体为例，设计了2阶段的单个设计模式变体挖掘实验与集成设计模式变体挖掘实验，通过4种主流设计模式挖掘工具与4种基准系统进行了设计模式挖掘实验，实验结果表明，本文方法取得了较好的效果。

基于无监督学习的无人机目标跟踪

方梦华, 姜添,

2021, 43(06): 1024-1031. doi:

摘要 ( 254 )

PDF (859KB) ( 242 ) 　　

随着计算机视觉领域中各项研究的发展，目标跟踪变得越来越热门，在各行各业得到广泛应用。基于无人机的目标跟踪也随之得到发展。相比于普通的目标跟踪，利用无人机进行目标跟踪有不少优势，但是也存在一些挑战。针对有关无人机目标跟踪的数据集有限，数据质量不高，且部分数据集中数据缺少统一标注的情况，基于无监督学习，设计了一种新的无人机目标跟踪模型。该模型对UDT模型的主干网络和跟踪方法进行了改进。结合了SiamFc网络结构和UDT无监督的目标跟踪思想，将模型的主干网络改进为AlexNet轻量级神经网络，通过前向跟踪、多帧后向验证方法实现目标跟踪。对比实验结果表明，设计的模型比改进前的模型以及其他经典的跟踪模型效果更佳。

一种改进的OSID的图像匹配算法

陈雪松, 雷嫚, 毕波, 唐锦萍

2021, 43(06): 1032-1040. doi:

摘要 ( 170 )

PDF (1163KB) ( 253 ) 　　

针对OSID在构建描述符时未考虑一个特征点的图像块里存在其他特征点，以及生成直方图描述子匹配速度较慢的问题，提出一种基于OSID的改进二进制描述符。在OSID描述符构建的过程中，扇形个数m的选择是固定的，因此提出当一个特征点的图像块里有多个特征点时，尝试将m的值自适应，丰富描述子所包含的信息，提高算法的正确匹配率；并将OSID最后生成的直方图描述子编码成二进制描述子，使用汉明距离代替欧氏距离进行图像匹配，提高算法的匹配速度。在标准数据集上进行测试，结果表明在复杂的视点变化、图像模糊和JPEG压缩等场景下，改进OSID的匹配精度优于同类描述符以及原算法。

基于光源颜色和噪声的图像拼接篡改检测方法

魏伟一, 赵秀锋, 赵毅凡

2021, 43(06): 1041-1046. doi:

摘要 ( 224 )

PDF (899KB) ( 267 ) 　　

数字图像拼接篡改是一种常见的图像伪造手段。在图像取证中，检测拼接伪造仍然是一项艰巨的任务。现有的拼接伪造检测方法多根据一种图像特性的不一致检测并定位篡改区域，而实际拼接篡改伪造往往会造成多种图像特性的改变。针对现有单一特征提取不能充分反映拼接图像特性导致检测精确率低的问题，提出一种通过提取光源颜色和噪声的混合特征来定位并显示拼接区域的高效图像拼接检测方法。实验结果表明，混合特征提取方法较单一特征提取方法能取得更高的检测精确率。

基于加权变换的蒙古族家具纹样增强研究

董霙达, 张成涛, 多化琼, 杜豫怡

2021, 43(06): 1047-1051. doi:

摘要 ( 170 )

PDF (592KB) ( 253 ) 　　

针对蒙古族传统家具纹样模糊不清、边缘失真等问题，提出了基于加权变换的图像增强方法。首先将蒙古族家具纹样分解成RGB分量，
然后利用提升小波变换、平稳小波变换、插值算法和逆提升小波变换获得高分辨率纹样，最后利用加权变换函数对直方图进行修改，对贡献最小的直方图进行滤波，得到高分辨率和对比度增强的纹样。实验结果表明，该方法的评价指标峰值信噪比PSNR和结构相似性SSIM比传统直方图均衡化和双三次插值法的均有提升，有效地增强了蒙古族家具纹样。所提方法对传统蒙古族家具纹样的修复和保护研究具有重要价值。

基于图嵌入与拓扑结构信息的蛋白质复合物识别算法

徐周波, 李萍, 刘华东, 李珍

2021, 43(06): 1052-1059. doi:

摘要 ( 182 )

PDF (616KB) ( 213 ) 　　

蛋白质复合物是细胞结构和生化机制的研究基础，如何准确识别蛋白质复合物成为近年来的研究热点。针对传统算法根据结构信息对蛋白质复合物进行搜索存在敏感度和F-measure低的问题，以及现有监督学习算法根据人为构造特征进行蛋白质复合物识别存在特征构造不能较好地反映图的真实信息等不足，提出了graph2vec-SVM识别算法。将蛋白质复合物看作稠密子图并考虑子图模块度大小，利用graph2vec将图信息转换为向量，并进一步采用SVM分类器对蛋白质复合物进行识别，提高了蛋白质复合物识别的敏感度和F-measure。该算法分别与目前流行的4种非监督学习算法(ClusterOne、CMC、HC-PIN和COACH)和3种监督学习算法(SCI-BN、SCI-SVM和RM)进行比较，在精准度、敏感度和F-measure 3项指标上都显示出了良好的性能。

k最近邻流序列算法对异常流检测的优化研究

刘云, 王梓宇

2021, 43(06): 1060-1066. doi:

摘要 ( 152 )

PDF (535KB) ( 339 ) 　　

通过时空异常流检测技术可以发现城市交通数据中的异常交通特征。与时间序列中单个异常流检测采用的方法不同，提出了从流序列中检测异常流分布的k最近邻流序列算法（kNNFS）。算法首先为每个位置测定每个时间区间内的单个流观测值；随后计算单个流的观测频率来构建每个位置处每个时间区间的流分布概率库；最后由阈值判定使用KL散度计算的新的流分布概率与其k最近邻之间的距离是否为异常值，距离值小于阈值则更新入流分布概率库，否则为异常的流分布。仿真分析表明，对比DPMM算法和SETMADA算法，kNNFS算法在检测精度和算法运行时间方面均有优化提升。

融合结构-属性交互二部图随机游走的社区搜索方法

李举, 马慧芳, 李青青, 宿云

2021, 43(06): 1067-1075. doi:

摘要 ( 199 )

PDF (701KB) ( 265 ) 　　

属性图中的社区搜索是一种局部社区发现方法，本质是基于用户提供的查询节点返回包含查询节点且在结构内聚的同时属性与查询属性相似的个性化子图。该任务有助于用户更好地理解社区是如何形成的以及社区形成的原因。提出了一种融合结构-属性交互二部图随机游走机制，有效地支持属性图中的社区搜索。具体地，首先基于网络拓扑结构构建结构概率转移矩阵；其次探索结构与属性交互形成的二部图定义2阶段的节点-属性-节点概率转移矩阵，将其与结构概率转移矩阵有效融合得到属性图的概率转移矩阵；最后设计重启随机游走方法，基于融合结构和属性的并行电导值精准查询社区。在真实数据集和人工数据集上的实验表明了本文方法的有效性。

基于RCNN的问题相似度计算方法

杨德志, 柯显信, 余其超, 杨帮华

2021, 43(06): 1076-1080. doi:

摘要 ( 169 )

PDF (558KB) ( 289 ) 　　

在搜索引擎、问答系统中利用深度学习的方法计算问题相似度是NLP领域研究的热点。结合卷积神经网络（CNN）和长短记忆网络（LSTM），提出了递归卷积神经网络（RCNN）问句相似度的计算方法，首先利用双向递归神经网络提取上下文信息，然后采用1D卷积神经网络将词嵌入信息与上下文信息进行融合;再利用全局最大池化提取关键信息来完成问句的语义表示;最后通过匹配层判断问句对的相似度。在Quora Question Pairs数据集上的实验结果表明，该相似度计算方法准确率为83.57%，优于其他方法。

融合相似度图和随机游走模型的多标签短文本分类算法

李晓红, 王闪闪, 马堉银, 马慧芳

2021, 43(06): 1081-1087. doi:

摘要 ( 309 )

PDF (634KB) ( 290 ) 　　

提出一种融合相似度图和随机游走模型的多标签短文本分类算法。首先，以样本数据和标签为节点创建相似度图，借助外部知识库计算样本与标签之间的权重，得到预测样本与标签集合之间的匹配度。然后，将多标签数据映射成多标签依赖图，在图上进行重启随机游走，并将已获得的匹配度作为初始预测值，计算每个节点的概率分布，直到概率分布趋于稳定时，节点的概率分布即为标签的概率分布，进而确定预测文本的标签集。实验结果表明，本文提出的算法有较好的多标签文本分类性能，与同类算法相比较，分类性能显著提升。

低信噪比下联合训练生成对抗网络的语音分离

王涛, 全海燕

2021, 43(06): 1088-1094. doi:

摘要 ( 174 )

PDF (738KB) ( 205 ) 　　

提升低信噪比下的分离语音质量是语音分离技术研究的重点，而大多数语音分离方法在低信噪比下仍只对目标说话人的语音进行特征训练。针对目前方法的不足，提出了一种基于联合训练生成对抗网络GAN的混合语音分离方法。为避免复杂的声学特征提取，生成模型采用全卷积神经网络直接提取混合语音时域波形的高维特征，判别模型通过构建二分类卷积神经网络来学习干扰说话人的特征信息，继而使系统得到的分离信息来源不再单一。实验结果表明，所提方法在低信噪比下仍能更好地恢复高频成分的信息，在双说话人混合语音数据集上的分离性能要优于所对比的方法。

基于Petri网的流程变体合并方法

王吴松, 方欢, 郑雪文

2021, 43(06): 1095-1103. doi:

摘要 ( 152 )

PDF (598KB) ( 195 ) 　　

业务融合时往往需要将已有的多个流程合并，从而形成新的满足实际需求的业务流程，如何识别已有业务流的共性特征来消除流程冗余具有较大的实际应用价值。因此，提出了一种基于Petri网的流程变体合并方法。首先，由计算匹配分数算法计算多个流程变体间不同组合的匹配分数，由此来选定一对匹配分数最高的流程变体组合；然后，根据提出的合并算法提取流程变体组合的公共部分，创建对应的副本，并将流程变体间存在的差异使用可配置连接符的分支进行合并，进而生成单个可配置的流程模型。合并后的流程模型可以捕获输入模型的所有行为，且可以对模型中的节点溯源，以此来判定节点来自于哪个流程变体。

基于时态边缘算子的时间序列自主分段表示法

殷炜宏, 王若愚, 段倩倩, 李国强

2021, 43(06): 1104-1111. doi:

摘要 ( 168 )

PDF (649KB) ( 209 ) 　　

时间序列具有数据量大、维数高和更新速度快等特点，导致一般的分段线性方法难以刻画原始时间序列的全局趋势特征。针对时间序列的特性，提出了一种基于时态边缘算子的自主分段表示方法（简称APLR_TEO），能够有效刻画出时间序列的形状特征。首先通过时态边缘算子与原始时间序列做卷积并根据关联规则得到边缘极值点；然后根据时序的变化特征，采用趋势转折距离的关联规则进行自主线性分段得到关键点，进而用关键点组成的序列来线性近似表示原始时间序列。实验结果表明，APLR_TEO能够有效地刻画序列的形状特征，针对不同规模的数据集具有良好的适应性和稳定性，有效降低了拟合误差。

基于确定性拥挤的多模态郊狼优化算法

陈丹妮, 赵剑冬, 高静

2021, 43(06): 1112-1120. doi:

摘要 ( 202 )

PDF (650KB) ( 214 ) 　　

为了解决多模态优化问题，对郊狼优化算法进行研究，提出了一种基于确定性拥挤的多模态郊狼优化算法—DCCOA。将小生境技术的确定性拥挤方法引入郊狼优化算法中，定义了新的郊狼进化机制，改进了郊狼群组文化趋势的计算方法。同时，为了更真实地模拟郊狼的种群生活，算法还定义了2只阿尔法郊狼并且采用了权重法更新郊狼的社会状况。最后将DCCOA与其它智能优化算法在多个典型基准函数上进行不同决策变量维数的多次对比实验。实验结果表明，小生境技术的引入进一步促进了算法在探索和勘探之间的平衡，提升了郊狼优化算法在多模态情况下的全局寻优能力，从而比原算法具有更好的收敛精度、更快的收敛速度和更强的稳定性。

基于一种新型分支定价算法的电动车支线镇际快递配送路径规划研究

师欣欣, 陈树国, 马弘, 邓明荣

2021, 43(06): 1121-1130. doi:

摘要 ( 146 )

PDF (895KB) ( 223 ) 　　

针对由电动汽车支持的支线镇际快递配送系统，提出一类新型的分支定价算法实现对车辆和货物的路径规划。研究利用时空网络将时间离散化构建模型，同时考虑了车辆资源、仓储资源和充电桩资源的管理问题。在分支定价算法中，分支策略和割平面策略的结合有效削弱了时间离散化所带来的对称性问题。强化策略则通过对生成路径变量进行有效筛选，并利用求解器帮助算法快速找到高质量可行解。实验将分支定价算法和商用求解器求解以及基于列生成的启发式算法进行对比，结果表明分支定价算法在精确求解小规模问题和启发求解中等规模问题时都具有明显优势，从而能有效地对该问题进行求解。

基于改进型柯西变异灰狼优化算法训练的多层感知器

王栎桥, 张达敏, 樊英, 徐航, 王依柔

2021, 43(06): 1131-1140. doi:

摘要 ( 193 )

PDF (992KB) ( 385 ) 　　

多层感知器MLP是处理分类问题的一种方法,可实现非线性高维度分类,并有很好的扩展能力。但是,在传统MLP的训练过程中,MLP分类结果的好坏与参数选择关系密切,而且传统算法的参数选择有很多缺陷。使用群智能算法替代传统多层感知器训练器是一种解决方案。灰狼优化算法GWO是其中一种兼顾高水平的探索和开发能力的算法。但是，GWO算法训练MLP时，依然存在开发和探索不平衡的问题，导致MLP分类准确率不理想。为了提升算法探索能力，将柯西变异算子引入灰狼优化算法，同时平衡开发能力，加入余弦收敛因子，提出一种改进的柯西变异灰狼优化算法IGWO。最后，将改进后的算法作为MLP的训练器，用于对3个不同复杂度分类问题进行分类实验，检验训练器在不同结构MLP下的性能表现。结果表明：相较于其他对比算法，IGWO训练MLP在分类准确率、陷入局部最优抗性、全局收敛速度和稳定性方面均具有较好的性能。

当期目录

作者中心

审稿中心

在线期刊