计算机工程与科学

2020年第2期目录

2020, 42(02): 0-0. doi:

摘要 ( 93 )

PDF (294KB) ( 233 ) 　　

评审附件

结合通信重排和消息合并的通信调度方法研究

彭晋韬1，杨章1,2,刘青凯1,2,张倩1

2020, 42(02): 191-196. doi:

摘要 ( 421 )

PDF (745KB) ( 500 ) 　　

评审附件

网络通信对于高性能计算机应用至关重要。当前,随着数值模拟应用的复杂化和并行规模的不断提升，应用软件对于缓解拥塞和减少通信协议开销的需求愈发迫切。传统的消息合并方法只以减少通信协议开销和延迟为目标，所以针对小消息进行合并。与之不同的是，从调度算法的角度提出了一种通过消息重排以减缓大消息网络拥塞，并基于优先级合并消息来提高网络有效利用率的算法。实验表明，该算法针对真实应用的通信性能最大可以提升41%，平均对每个应用提升了10%。

一种适用于GPU图像处理算法的合并存储结构

左宪禹1,2，张哲1,5，黄祥志4,5，葛强1,2，张理涛3，臧文乾4,5

2020, 42(02): 197-202. doi:

摘要 ( 402 )

PDF (592KB) ( 505 ) 　　

评审附件

大多数图像处理算法都可利用GPU进行加速以达到更好的执行性能，但数据传输操作与核函数执行之间的调度策略问题仍是桎梏加速性能进一步提升的主要瓶颈。为了解决这个问题，通常采用GPU任务流将核函数执行与数据传输操作进行重叠，以隐藏部分数据传输与核函数执行耗时。但是，由于CUDA编程模型的特性以及GPU硬件资源的限制，在某些情况下，即使创建较多的任务流用于任务重叠，每个流上仍会存在串行执行的任务，导致加速效果无法进一步提升。因此，考虑利用CSS将待处理图像进行合并从而将单个流中的算子核函数及数据传输操作进行合并，以减少数据传输操作和核函数执行的固定代价及调用间隙。通过实验结果可知，提出的CSS结构不仅能在单流的情况下提高GPU图像处理算法执行性能，在多流的情况下其加速性能也得到了进一步提升，具有较好的实用性及可扩展性，适用于包含较多算子操作或较小尺寸图像批量处理的情况。此外，提出的方法对图像处理算法的GPU加速提供了新的研究思路。

资源不均衡Spark环境任务调度优化算法研究

胡亚红1，盛夏2，毛家发1

2020, 42(02): 203-209. doi:

摘要 ( 562 )

PDF (804KB) ( 585 ) 　　

评审附件

由于硬件资源的更新换代，集群中各个节点的计算能力会变得不一致。集群异构的出现导致集群计算资源不均衡。目前Spark大数据平台在任务调度时未考虑集群的异构性以及节点资源的利用情况，影响了系统性能的发挥。构建了集群节点的评价指标体系，提出利用节点的优先级来表示其计算能力。提出的节点优先级调整算法能够根据任务执行过程中节点的状态动态调整各个节点的优先级。基于节点优先级的Spark动态自适应调度算法（SDASA）则根据实时的节点优先级值完成任务的分配。实验表明，SDASA能够缩短任务在集群中的执行时间，从而提升集群整体计算性能。

风雷（PHengLEI）通用CFD软件设计

赵钟，何磊，何先耀

2020, 42(02): 210-219. doi:

摘要 ( 2852 )

PDF (1866KB) ( 1668 ) 　　

评审附件

风雷软件（PHengLEI）是由中国空气动力研究与发展中心开发的，具有完全自主知识产权的计算流体力学CFD软件平台，已在国内广泛推广使用。作为当前实施的国家数值风洞系统的重要组成部分，正在集成包括直升机旋翼、飞机结冰、风工程、化学反应与燃烧、虚拟飞行、结构/非结构高精度等学科物理模型。针对多学科、多物理模型集成开发的需求，为了适应下一代高性能计算机硬件，在已有工作基础上，进一步设计了面向下一代高性能计算的PHengLEI软件体系结构和数据结构。

一种可重构以太网数据包解析器中可重构单元的设计

赵宇1,2，殷树娟1，李翔宇2

2020, 42(02): 220-228. doi:

摘要 ( 774 )

PDF (766KB) ( 630 ) 　　

不停变化的网络协议标准和用户定制化网络业务需求要求交换机硬件具有更高的灵活性。在此背景下，
提出了一种能够通过软件编程定义协议解析规则的以太网交换机芯片数据包解析器基本处理单元，具有高性能且高灵活性的优点，通过灵活配置硬件解析逻辑和查找表内容，定义对数据包包头内容的提取、查找、匹配、动作等解析过程，从而支持对不同种类的协议解析任务，其由2类基本结构的串联或并联组合而成，
这样可以根据需要进行硬件资源裁剪。基于该可重构基本处理单元，可以构成可重构报文解析器，支持自定义协议及未知协议的解析。
主要介绍了该可重构基本处理单元的结构，并介绍了基于该基本处理单元的解析器架构的实现方法。采用40 nm 工艺综合后的评估结果显示，该基本单元电路最高工作时钟频率可以达到240 MHz，基于该基本处理单元结构实现的支持4层常用以太网协议解析的解析器每秒可处理2.4亿个数据包。该可重构基本处理单元所用存储资源共计87.98 Kb，设计规模约147万门。

一种基于多模数据的室内定位算法

贾玉福1，刘文平1，胡胜红2

2020, 42(02): 229-235. doi:

摘要 ( 411 )

PDF (604KB) ( 387 ) 　　

针对室内定位问题，提出一种利用WiFi和视觉信息实现定位的算法。首先利用坐标变换原理分析并建立物体的图像平面坐标与世界坐标系坐标之间的数学关系，再以2个信标之间的距离作为约束条件建立数学方程，求解摄像机的俯仰角；然后根据俯仰角分别计算观察点与2个信标的平面距离，最后根据计算得到的距离和信标的坐标实现观察点定位。依据上述定位求解过程将会解析得到观察点的多个虚拟坐标。为此，利用SAE与DNN模型，以多个自定义WiFi特征为输入，11个距离类别为标签，依据节点之间的距离来识别定位坐标的有效值。实验结果表明，此定位算法能够在室内环境下提供高精度实时定位，算法的可靠性得到了充分验证。

基于格式保留的敏感信息加密方案

张玉磊1，骆广萍1，张永洁2，张雪微1，刘祥震1，王彩芬3

2020, 42(02): 236-240. doi:

摘要 ( 498 )

PDF (391KB) ( 457 ) 　　

格式保留加密具有加密后数据格式和数据长度不变的特点，不会破坏数据格式约束，从而降低改造数据格式的成本。分析现有敏感信息格式保留加密方案，均基于对称加密体制，存在密钥传输安全性低和密钥管理成本较高等问题。提出了身份密码环境下基于格式保留的敏感信息加密方案，与现有的格式保留加密方案相比，通信双方不需要传递密钥，通过密钥派生函数来生成加密密钥和解密密钥，利用混合加密的方式提高了敏感信息传输的安全性。并且证明了该方案满足基于身份的伪随机置换安全，在适应性选择明文攻击下具有密文不可区分性。

基于蚁群算法的测试用例优先排序

张卫祥，齐玉华，魏波，张敏，窦朝晖

2020, 42(02): 241-249. doi:

摘要 ( 486 )

PDF (656KB) ( 609 ) 　　

测试用例优先排序技术通过优化测试用例的执行次序来提高软件测试的效率，是增强型软件测试和回归测试的重要研究课题。针对基于需求的测试用例优先排序问题，提出了一种基于蚁群算法的求解方法，采用不同的测试用例间距离及用例序列评价策略，给出了该方法的2种不同实现方式。首先，针对黑盒测试特点，设计了基于需求的一般性测试用例序列评价指标；其次，提出测试用例吸引度概念，基于测试用例吸引度定义了测试用例间的距离；然后，给出了信息素更新策略、最优解集更新策略、局部最优解突变策略等主要设计策略，分别实现了该方法基于距离和基于指标的2种实现方式。实验结果表明，该方法具有很好的全局寻优能力，整体效果上优于粒子群算法、遗传算法和随机测试。

方差辗转的软集参数约简算法

林连海1,田立勤1,2,蔡铭楷1,李升宏1

2020, 42(02): 250-258. doi:

摘要 ( 377 )

PDF (1225KB) ( 452 ) 　　

软集是一种处理不确定数据的理论、工具，通常用于决策论中。软集的参数约简是指删除对决策几乎没有影响的冗余参数，自从0-1线性规划算法提出以来，软集的参数约简问题基本得到了解决，但0-1线性规划算法实现复杂，需要依赖整数规划算法。在此，考虑软集的实际应用背景，将软集与概率论结合，设计出一个在大数据背景下的软集参数约简方法——方差辗转法，该算法的时间复杂度为O(m2n)，而0-1线性规划通常视为NP难问题。方差辗转法实现简单，在物集（或全集）较小，不超过属性集大小的2倍时，效果较差，但随着物集（或全集）大小的增长，效率会逐步上升，最终运算效率会全面优于 0-1线性规划算法的，对于约简稠密度高的软集效率会更高。

结合自注意力的对抗性领域适应图像分类方法

陈诚1，郭卫斌1，李庆瑜2

2020, 42(02): 259-265. doi:

摘要 ( 469 )

PDF (557KB) ( 464 ) 　　

作为解决数据集迁移和适应的系统性框架，领域适应在近年来发展迅速。在生成对抗网络出现以后，对抗性思想的引入为领域适应中的无监督适应问题带来了新的思路。通过研究生成对抗网络和领域适应的内在联系，类比生成对抗网络的改进方法，提出了结合自注意力模块的领域适应方法，用以弥补无法建模长距离依赖的缺陷。同时，考虑到生成对抗网络和领域适应任务上的不同，通过引入新的学习参数来改进自注意力模块，使其在分类任务上有更高的精度和健壮性。最后，在公开的领域适应数据集上的实验证实了本文方法的有效性和可行性。

基于改进混合高斯模型和图形句柄的异常车辆检测

刘艳萍1，崔彤1，周长兵2，李小翠2，刘甜1

2020, 42(02): 266-272. doi:

摘要 ( 364 )

PDF (1000KB) ( 445 ) 　　

由于交通安全隐患在当下的生活中造成的不良影响越发严重，所以在步行街、校园等禁止车辆行驶的场景中，对异常车辆的检测具有一定的现实意义。针对
利用混合高斯建立背景模型时易出现重影和空洞问题，提出了一种基于SSIM结构相似性的混合高斯建模的异常车辆检测，采用SSIM计算2幅图像像素点间的相似度，在高斯建模后进行二次背景建模，同时引入了指数函数来优化高斯建模过程中的权值更新过程，提高了更新速度。采用图形句柄函数优化连通域方法对前景区域进行异常车辆检测，能够检测出异常车辆且标注框更加贴近车辆形状。
对580幅由视频分割得到的图像的实验结果表明，检测率可以达到90.3%。

联合损失优化孪生网络的行人重识别

樊琳1,2，张惊雷1,2

2020, 42(02): 273-280. doi:

摘要 ( 434 )

PDF (904KB) ( 476 ) 　　

针对行人重识别应用中行人图像易受到光照、相似着装、拍摄角度影响而出现难分样本对，导致错误匹配的问题，提出一种联合损失结合孪生网络的行人重识别优化算法。首先利用残差卷积神经网络提取图像特征，并以焦点损失（Focal Loss）和交叉熵损失的联合损失对提取的特征进行监督训练，增加模型对难分样本对的关注度；然后采用余弦距离计算图像间的相似度实现行人的重识别；最后加入重排序算法降低误匹配率。采用Market-1501和DukeMTMC-reID数据集进行实验，结果表明，该算法的匹配率分别为91.2%和84.4%，平均精度均值（mAP）分别为85.8%和78.6%。

多目标粒子群和人工蜂群混合优化的阈值图像分割算法

赵凤1,2，孔令润1,2，马改妮1,2

2020, 42(02): 281-290. doi:

摘要 ( 536 )

PDF (963KB) ( 473 ) 　　

在图像分割中，为了准确地把目标和背景分离出来，提出了一种基于多目标粒子群和人工蜂群混合优化的阈值图像分割算法。在多目标优化的框架下，将改进的类间方差准则和最大熵准则作为适应度函数，通过粒子群和蜂群混合优化这2个适应度函数来获得1组非支配解。同时，为了提高全局和局部搜索能力，在蜂群进化时，将粒子群的全局最优解引入到人工蜂群算法的雇佣蜂阶段蜜源的更新中，并对搜索方程进行改进。最后通过类间差异和改进的类内差异的加权比值，从一组非支配解中选取最优阈值。实验结果表明，该算法能够取得理想的分割结果。

一种基于自适应分块八叉树颜色量化的图像压缩技术

吴振华1,沈虎峻1,2,公佐权1,冯平1,龚彤艳1,3,邓明森1

2020, 42(02): 291-298. doi:

摘要 ( 388 )

PDF (1420KB) ( 453 ) 　　

null

基于人机交互式图割的目标快速提取

徐秋平

2020, 42(02): 299-306. doi:

摘要 ( 432 )

PDF (984KB) ( 460 ) 　　

根据RGB颜色值表征像素距离，运用图割理论，提出一种人机交互式的目标快速提取方法。在目标外围人工划出封闭折线作为初始活动轮廓线，向内生成单侧变宽域，消除前后重叠，避免重复切割，构造能量函数，生成s-t网络，通过对s-t网络的最小代价切割实现目标提取。后期对局部错误提供方便快捷、安全导向、手自结合的纠错措施。实验表明，所提算法人机交互方便快捷，纠错方式有效完备，目标提取快速准确。

改进果蝇算法优化回声状态网络的旅游需求预测研究

陈明扬，王林，余晓晓

2020, 42(02): 307-316. doi:

摘要 ( 651 )

PDF (808KB) ( 484 ) 　　

首先对标准果蝇优化算法FOA进行改进，自适应调整果蝇种群数量和搜索步长，同时优化初始迭代位置，改善算法局部搜索能力和搜索效率。接着将改进的FOA算法AFOA与回声状态网络ESN相结合，构建一个两阶段组合预测模型(AFOA-ESN)，通过AFOA优化ESN获取其关键参数，将优化后的参数输入ESN，形成最终的组合预测模型。最后利用该模型进行旅游需求预测。实验结果表明，AFOA-ESN模型较自回归移动平均模型、支持向量机模型、BP神经网络、标准ESN网络以及其他预测模型具有更高的预测精度。

一种基于密度峰值的针对模糊混合数据的聚类算法

陈奕延1,2,李晔3,李存金1

2020, 42(02): 317-324. doi:

摘要 ( 480 )

PDF (722KB) ( 439 ) 　　

将CFSFDP算法拓展到连续型模糊集和离散型模糊集上，提出了一种针对模糊混合数据的拓展型CFSFDP算法，将其命名为FMD-CFSFDP算法。FMD-CFSFDP算法将样本涵盖的经典信息拓展到了模糊集上，利用寻找密度峰值的方法对模糊样本进行聚类，这是一种建立在模糊集上针对模糊混合数据的基于密度的聚类算法。

首先简单介绍了CFSFDP算法及其改进，给出了“模糊混合数据”的数学概念；然后结合传统模糊欧氏距离的概念，分别提出了误差更小的针对连续型模糊集与离散型模糊集的改进型欧氏距离，在此基础上，依托权值构建了针对混合型模糊数据的整体距离。参考CFSFDP算法的聚类步骤给出了FMD-CFSFDP算法的聚类步骤。随后，在不同样本量、不同指标数量、不同簇数、不同取数规则的条件下，对算法进行了随机模拟实验并对聚类结果进行了分析。最后分别总结了FMD-CFSFDP算法的优缺点，并在此基础上提出了改进方案，为今后深入研究提供了参考。

动态空间网络中的黑洞模式挖掘算法

谭胜昔，贾金萍，赵斌，吉根林

2020, 42(02): 325-333. doi:

摘要 ( 581 )

PDF (779KB) ( 499 ) 　　

黑洞模式是人类移动模式研究中的标志性成果，但在移动模式的演化建模方面存在局限性，因此研究具有时间演化特性的黑洞模式。新模式定义需要满足群体规模性、空间区域性和时间持续性3方面要求。提出具有时间演化特性的动态空间网络模型，基于此模型定义新的黑洞模式，并提出相应的挖掘算法。为了提升模式挖掘算法的效率，设计了基于时空划分的候选模式剪枝算法，有效降低了挖掘算法在时空维中的搜索代价。最后，基于真实数据的实验结果表明了该黑洞模式及其挖掘算法的有效性和可行性。

基于异质信息网络的模糊推荐算法

李娴, 赵霞, 张泽华, 张晨威

2020, 42(02): 334-340. doi:

摘要 ( 388 )

PDF (575KB) ( 421 ) 　　

随着互联网信息的爆炸式增长，推荐系统扮演着越来越重要的角色。为了解决传统推荐系统存在的信息稀疏问题，并且合理表达用户的偏好，提出基于异质信息网络的模糊推荐算法（HFR）。HFR方法构建三角模糊评分模型将用户离散的评分信息模糊化，此外，还加入了项目的属性信息并使用元路径表示；在此基础上充分利用多源信息，提出了一种新的相似性度量，并预测评分获得最终的推荐结果。实验结果表明，HFR方法有效解决了信息稀疏问题，提高了推荐质量。

一种融合上下文特征的中文隐式情感分类模型

潘东行，袁景凌，李琳，盛德明

2020, 42(02): 341-350. doi:

摘要 ( 530 )

PDF (668KB) ( 856 ) 　　

对网络上海量的文本数据进行情感分析，可以更好地挖掘网民行为规律、帮助决策机构了解舆情倾向和改善商家服务质量。在实际表达中，人们除了采用带有明显情感词的主观表达外，还采用含蓄的方式表达自己的主观倾向。带有显式情感词的文本情感分析作为自然语言处理领域的基础性研究任务，已经取得了丰富的研究成果。然而，针对隐式文本的情感分析技术还处于起步阶段。与显式情感分析任务相比，隐式情感分类任务更加困难。隐式表达文本具有中立性表达、缺乏情感词和上下文依赖的特点，使得传统的文本分类方法不再适用。针对以上问题，采用word2vec词嵌入技术提取文本特征，分别进行了基于TextCNN、LSTM和BiGRU 分类模型的研究。在各个深度分类模型研究基础上，还进行了融合注意力机制的分类模型研究。针对隐式表达对上下文内容依赖的特点，设计了一种融合上下文语义特征和注意力机制的分类模型，增强了部分中立性隐式表达句的分类效果。最后在SMP2019公开数据集上进行了实验，取得了比上述几种基础深度网络模型与融合注意力机制分类模型更好的分类效果。

基于相似度优化和流形学习的协同过滤算法改进研究

宋月亭, 吴晟

2020, 42(02): 351-357. doi:

摘要 ( 460 )

PDF (677KB) ( 442 ) 　　

协同过滤算法中存在着数据稀疏性和可扩展性问题，由于用户和项目数据量巨大致使数据十分稀疏，且不同数据集中数据存在差异，致使现有算法中的相似度计算
不够准确和用户聚类效果不佳，对推荐算法准确率产生了显著影响。为了提高相似度计算和最近邻居搜索的准确率，提出了一种基于相似度优化和流形学习的协同过滤算法。通过加权因子优化相似度计算，结合流形学习对稀疏的用户评分数降维后进行谱聚类，通过获得的全局最优解提高聚类所得目标用户最近邻居的准确率，进而提高协同过滤推荐精度。在Epinions数据集和MovieLens数据集上进行实验，结果表明，提出的算法可以有效降低协同过滤算法的平均绝对误差和均方根误差，提高召回率，拥有更高的推荐准确率。

基于深层特征融合的行人重识别方法

熊炜, 熊子婕, 杨荻椿, 童磊, 刘敏, 曾春艳

2020, 42(02): 358-364. doi:

摘要 ( 409 )

PDF (618KB) ( 620 ) 　　

针对现有基于深度学习的行人重识别方法对于行人姿态变化、部分遮挡等引起的行人判别特征信息缺失的问题，提出了一种深层特征融合的行人重识别方法。首先，利用卷积层和池化层多次提取网络深层特征，从空间维度提升网络性能，使用融合后的深层特征作为行人图像的全局特征属性；其次，为提高模型的泛化能力，在深层融合特征后加入一个批量归一化层，同时采用标签平滑损失函数和三元组损失函数对模型进行联合训练。实验结果表明，所提的深层特征融合方法具有很好的表达能力。在Market1501、DukeMTMC-reID、CUHK03和MSMT17 4个数据集上对所提方法进行了验证，其中在Market1501数据集上，Rank-1值达到了95.0%，mAP达到了85.6%。

融合邻居选择策略和信任关系的兴趣点推荐

刘辉, ., 曾斌, 刘子恺

2020, 42(02): 365-372. doi:

摘要 ( 404 )

PDF (723KB) ( 461 ) 　　

兴趣点推荐是推荐系统的关键研究之一，传统的算法只利用用户签到信息进行推荐，且对于签到信息只单纯地考虑签到和没签到，而忽略了用户签到的频次和信任关系。为提高推荐精度，提出了一种融合用户相似性、地理位置和信任关系的混合推荐算法(UGT)。对于签到信息，采用签到频次来代替传统的二值签到，并对签到信息添加时间权重；对于基于用户的协同过滤,提出了一种邻居选择策略来提高预测精度；对于信任关系，首先分析用户的属性，然后给出社会地位的计算方法，重构信任度的计算方法。实验结果表明，该混合算法相比较传统的推荐算法而言，在准确率和召回率上有了显著的提升。

表示学习中句子与随机游走序列等价性的一种新证明

孙燕, 孙茂松, 赵海兴, 冶忠林,

2020, 42(02): 373-380. doi:

摘要 ( 450 )

PDF (679KB) ( 434 ) 　　

表示学习是机器学习中通过浅层的神经网络将具有关联关系的信息映射到低维度向量空间中。词表示学习的目标是将词语与其上下文词语的关系映射到低维度的表示向量空间中，而网络表示学习的目标是将网络节点及上下文节点之间的关系映射到低维度的表示向量空间中。词向量是词表示学习的结果，而节点表示向量是网络表示学习的结果。DeepWalk通过随机游走策略获取网络节点上的游走序列作为word2vec模型中的句子，之后通过滑动窗口获取节点对输入到神经网络中进行训练，而word2vec和DeepWalk底层所采用模型和优化方法是相同的，即Skip-Gram模型和负采样优化方法，在word2vec和DeepWalk中负采样的Skip-Gram模型称为SGNS。现有研究结果表明，基于SGNS模型实现的词表示学习和网络表示学习算法均为隐式地分解目标特征矩阵。有学者提出基于单词词频服从Zipf定律和网络中节点度服从幂律分布，认为网络中的随机游走序列等同于语言模型中的句子，但是仅仅基于它们服从幂律分布的理由，来判断句子等同随机游走序列是不充分的。因此，基于SGNS隐式分解目标特征矩阵的理论和依据，设计了2个对比实验，利用奇异值分解和矩阵补全方法分别在3个公共数据集上做节点分类任务，通过实验证实了句子和随机游走序列的等同性。

当期目录

作者中心

审稿中心

在线期刊