计算机工程与科学

2019年第9期目录

2019, 41(09): 0-0. doi:

摘要 ( 16 )

PDF (289KB) ( 59 ) 　　

评审附件

用于高性能计算的作业调度能效性研究综述

郑文旭,潘晓东,马迪,汪浩

2019, 41(09): 1526-1533. doi:

摘要 ( 279 )

PDF (595KB) ( 387 ) 　　

评审附件

由于科学研究与商业应用等对高性能计算的需求与日俱增，高性能计算的性能和系统规模得到迅速发展。但是，急剧增长的功耗严重限制了高性能计算系统的设计和使用，使得低功耗技术成为高性能计算领域的关键技术。作为整个系统的核心组件，作业调度系统立足有限的系统资源，对用户提交的应用进行作业-资源分配，其能效性对于整个高性能计算系统的能耗控制与调节起到至关重要的作用。首先介绍主要的能量效率技术和常用的作业调度策略，然后对当前高性能计算作业调度能效性进行分析，并讨论了其面临的挑战及未来发展方向。

基于模拟退火算法的改进主/副版本调度算法

朱永超1，周川1，崔玉伟2，郭健1，吴益飞1

2019, 41(09): 1534-1540. doi:

摘要 ( 194 )

PDF (691KB) ( 293 ) 　　

评审附件

针对异构分布式系统中面向任务优先级约束的调度问题，提出一种基于模拟退火算法的改进主/副版本调度算法SAPB。任务模型以有向无环图DAG表示，该算法共计调度主、副2个版本的任务。在任务优先级排序阶段，采取HEFT的任务排序方法，避免了eFRD等主/副版本调度算法中任务模型描述的局限性问题；在任务处理器分配阶段，采取模拟退火算法搜索满足截止时限条件下具有更高可靠性的调度结果，并且采取多一重备份策略以解决处理器数量相对较少时任务优先级约束带来的副版本调度易失败问题。最后，通过随机生成的DAG图进行仿真实验，结果表明，相比eFRD等算法SAPB具有更优的副版本可调度性和更高的系统可靠性。

面向安全关键应用的多核处理器执行时间波动性分析

宾婧怡，丁旭阳，齐晓铭，陈浩

2019, 41(09): 1541-1550. doi:

摘要 ( 154 )

PDF (1518KB) ( 295 ) 　　

评审附件

在安全关键系统中，针对多核处理器共享硬件资源竞争带来的执行时间波动性问题，提出了基于性能计数器PMR和RSB的通用测试方法，通过捕捉执行时间波动性相关的硬件事件来分析硬件资源的共享性、执行时间的波动性和硬件平台的黑盒或灰盒行为。此方法可用于硬件平台的性能评估，也可用于应用任务的资源消耗评估，从而为WCET预测提供指导。

一种基于低频种子的三代测序序列比对方法

宋思怡1,2，程昊宇1,2，徐云1,2

2019, 41(09): 1551-1556. doi:

摘要 ( 154 )

PDF (692KB) ( 235 ) 　　

评审附件

随着测序技术的发展，三代测序已广泛应用于基因研究中。但是，由于三代测序序列具有平均长度长、错误率高的特性，如何快速、准确地将测序片段比对到参考基因组上成为严峻挑战。现有方法使用种子（从测序片段中挑选的短序列）来加速比对过程，但在挑选时未考虑频率特性，导致定位候选区域阶段时间消耗较大。因此，提出了一种基于低频种子的三代测序序列比对方法，该方法采用种子投票策略，使用低频种子进行投票，减少投票计数的时间消耗，并根据位置及票数关系对候选区域进行再过滤，进一步提高比对速度。实验结果表明，在确保敏感性和准确率的同时，本文方法比现有方法快3倍左右。

基于Winograd稀疏算法的卷积神经网络加速器设计与研究

徐睿，马胜，郭阳，黄友，李艺煌

2019, 41(09): 1557-1566. doi:

摘要 ( 232 )

PDF (996KB) ( 324 ) 　　

评审附件

随着卷积神经网络得到愈加广泛的应用，针对其复杂运算的定制硬件加速器得到越来越多的重视与研究。但是，目前定制硬件加速器多采用传统的卷积算法，并且缺乏对神经网络稀疏性的支持，从而丧失了进一步改进硬件，提升硬件性能的空间。重新设计一款卷积神经网络加速器，该加速器基于Winograd稀疏算法，该算法被证明有效降低了卷积神经网络的计算复杂性，并可以很好地适应稀疏神经网络。通过硬件实现该算法，本文的设计可以在减少硬件资源的同时，获得相当大的计算效率。实验表明，相比于传统算法，该加速器设计方案将运算速度提升了近4.15倍；从乘法器利用率的角度出发，相比现有的其他方案，该方案将利用率最多提高了近9倍。

求解鞍点问题的广义正定和反Hermitian分裂方法

董贝贝，鲍亮

2019, 41(09): 1567-1573. doi:

摘要 ( 179 )

PDF (1156KB) ( 280 ) 　　

评审附件

探讨了如何求解大型稀疏鞍点问题，给出了一种基于正定分裂的广义正定和反Hermitian分裂(GPSS)方法。该方法首先利用矩阵的正定分裂，构造出鞍点矩阵的2种分裂格式；然后利用这2种分裂格式构造出GPSS迭代；接着给出了迭代收敛的充要条件。最后进行了数值对比实验，实验结果表明,GPSS比正定和反Hermitian分裂(PSS)和Hermitian和反Hermitian分裂(HSS)方法更有效。

负载均衡的主导资源公平分配算法

刘梓璇，周建涛

2019, 41(09): 1574-1580. doi:

摘要 ( 369 )

PDF (934KB) ( 382 ) 　　

评审附件

随着使用云计算并行且可靠地处理计算问题成为一种趋势，各种云计算平台应运而生，在这些平台中，保证多种资源调度策略的公平性非常重要。主导资源公平

分配算法DRF有效地实现了多种资源环境中的公平分配，但在资源分配过程中容易出现集群负载不均的情况。因此，提出在使用DRF算法分配资源过程中，通过集群中各节点的资源利用率情况对节点进行K-means聚类分析，根据聚类结果将资源分配给任务来提高集群负载均衡的能力。基于CloudSim 4.0实现了改进DRF算法的仿真实验，实验结果表明，负载均衡的DRF算法比原始的DRF算法以及基于层次分析法（AHP）改进的DRF算法更能有效地改善集群整体的负载均衡。

基于双区块链的医疗记录安全存储与共享方案

张利华1，蓝凡1，姜攀攀2，蒋腾飞2

2019, 41(09): 1581-1587. doi:

摘要 ( 304 )

PDF (811KB) ( 541 ) 　　

在当前的医疗信息化建设中，电子医疗记录的存储与共享给病人带来了隐私泄露的风险，从而造成名誉损害和财产损失。现有的多数保护隐私的医疗记录存储与共享方案使用了中心化的管理节点，容易遭受集中攻击导致单点失效和恶意篡改的威胁。针对这些问题，设计了一个双区块链结构的医疗记录安全存储与共享方案
EMRSBC，其中使用2条联盟链分别用于医疗记录存储与共享。该方案解决了传统单链应用中拓展性差、吞吐量低的问题，将医疗记录的共享与存储分开，利用区块链的去中心化特性以及智能合约的链上代码实现在不可信环境中的访问控制，有效地保护了病人的隐私数据在存储与共享过程中的安全性。

车载自组网中基于无证书的密钥隔离批量消息认证方案

汪锐,曹素珍,王斐,郎晓丽,杜霞玲

2019, 41(09): 1588-1596. doi:

摘要 ( 162 )

PDF (538KB) ( 318 ) 　　

针对车载自组网(VANET)中匿名认证存在的安全性问题，提出了一种高效的车载自组网的匿名认证方案。该方案将无证书密码体制和密钥隔离技术结合应用在车载自组网的环境中，通过更新协助器RSU与车辆用户OBUi的密钥，使得某时间段的临时私钥的泄漏不会影响到前向和后向的安全性,并在随机预言模型下证明了该方案的安全性。最后，性能分析结果表明，该方案不仅提高了消息签名匿名认证的效率，而且降低了整个系统运算的开销，具有较好的理论意义与实用价值。

可动态更新的口令授权多秘密共享方案

王彩芬1,2，苏舜昌1，杨小东1

2019, 41(09): 1597-1602. doi:

摘要 ( 175 )

PDF (405KB) ( 287 ) 　　

秘密共享作为密码学中的一个重要分支，在秘钥托管、安全多方计算、导弹发射等诸多领域有重要作用。现有秘密共享方案大多数都是基于Shamir (t,n)门限方案构造的，其核心思想是秘密分发者通过秘密多项式将秘密s分为n个影子秘密并分发给持有者，其中任意少于t个影子秘密都不能得到主秘密的任何信息，但是传统方案一直没有实现秘密数量动态更新与秘密拥有者口令授权。基于传统的Shamir秘密共享方案和有限域上的模运算，在RSA密码体制的基础上提出了一种可验证的口令授权的多秘密共享方案。在秘密共享过程中，可防止分发者欺骗和恶意参与者攻击，实现秘密数量动态更新与秘密拥有者口令授权，使方案更加具有实用价值。

基于LSTM模型的食品安全网络舆情预警研究

马永军，陈海山

2019, 41(09): 1603-1611. doi:

摘要 ( 199 )

PDF (699KB) ( 356 ) 　　

近几年，食品安全网络舆情事件数量激增，引起了国家的高度重视。目前的食品安全网络舆情预警指标体系对主题属性和传播扩散指标考虑不全面，未深入考虑舆情自身特性和演化规律，而且目前的网络舆情预警模型也不能很好地考虑舆情不同特征之间的相互联系，导致舆情预警准确率不高。针对以上问题，提出包括主题属性、传播扩散等5个维度的指标体系，并在此基础上提出长短时记忆网络Re-LSTM模型,使用正则化方法约束网络中各单元输入权重并用softsign函数替代tanh激活函数。与其他经典模型对比，所构建的模型不仅能够提高预警准确率，而且还能够更好地避免梯度消失和过拟合问题。

基于势能冷却的内容中心网络缓存替换算法

张建伟1，王旭辉2，蔡增玉2，黄万伟1，杜春锋2

2019, 41(09): 1612-1617. doi:

摘要 ( 148 )

PDF (860KB) ( 246 ) 　　

针对目前内容中心网络CCN缓存替换策略所存在的效率低下等问题，引用物理学中“势能”的概念，并结合“自然冷却”这一自然现象，提出了一种基于势能冷却的替换算法PEC-Rep。根据被访问的次数以及时间间隔，准确判断出内容在未来一段时间内的使用价值，在进行内容替换时，将价值最小的内容删除，使得节点中的内容保持最大价值，满足用户的后续请求。仿真结果表明，PEC-Rep可以有效地提高域内缓存命中率，减轻服务器的负载，提高CCN的整体性能。

基于混沌机制与Levy变异烟花算法的服务组合优化

刘婷1,2,杨秋翔1

2019, 41(09): 1618-1626. doi:

摘要 ( 160 )

PDF (863KB) ( 251 ) 　　

为了在大规模Web服务环境中筛选出满足用户复杂应用需求且综合性能高的服务组合，提出一种混合混沌机制与Levy变异的改进烟花算法。
首先利用混沌理论产生初始烟花群体，避免种群个体分散不均，造成重复多次局部寻优现象；然后在搜索过程中引入Levy变异算子，提高算法的全局搜索能力，有效避免早熟收敛；最后采用精英选择策略筛选下一代烟花种群，降低了算法的时间开销。通过大量实验结果说明了该算法的寻优性能和稳定性。

基于多尺度特征融合的小目标行人检测

张思宇1,2，张轶1,2

2019, 41(09): 1627-1634. doi:

摘要 ( 304 )

PDF (790KB) ( 401 ) 　　

针对SSD当前存在的小目标漏检以及误检问题，结合反卷积与特征融合思想，提出hgSSD模型。将原SSD特征层反卷积后与较浅层特征结合，实现复杂场景下小目标行人检测。为了保留浅层网络特征，提高算法实时性，节省计算资源，hgSSD模型基础网络使用VGG16，而非更深层的ResNet101。为了加强对小目标的检测，将VGG16中的Conv3_3改进为特征层加入训练。融合后的网络相对于SSD较为复杂，但基本保证实时性，且成功检测到大部分SSD网络漏检的小目标，检测精度相比于SSD模型也有提升。在选择框置信度得分阈值为0.3的情况下，基本检测到SSD漏检小目标。在VOC2007+2012中相对于SSD行人检测的Average Precision值从0.765提升为0.83。

相似性维数在点云中的应用

刘妮，张志毅

2019, 41(09): 1635-1641. doi:

摘要 ( 142 )

PDF (1004KB) ( 291 ) 　　

3D点云配准、分割、识别等任务中都需要获取形状属性，传统的形状属性对尺度变化敏感且计算复杂，表达的几何意义简单。结合分形几何中相似性维数的概念，给出了一种可作为点云模型形状属性的维数定义。首先，求取模型中每个点的k邻域得到一个点集，计算其外接球半径；其次，计算由该点集组成的体积与面积信息，并通过缩放处理解决尺度敏感的问题；最后，利用相似性维数表达式计算点云模型中每个点的维数值，使用该值来表示点云模型的形状属性。实验结果表明，相似性维数具有表达形状的能力，并且能够清晰地表达模型的全局特征。

芯片表面印刷符号结构缺陷的质量评估方法研究

饶永明1，吴帅1,2，闫峰2，罗月童1

2019, 41(09): 1642-1649. doi:

摘要 ( 148 )

PDF (840KB) ( 236 ) 　　

因为芯片表面符号用于标识芯片名称、性能和功能信息，所以芯片表面符号质量检测是芯片生产的重要环节。目前，基于机器视觉的芯片表面符号质量评估被广泛使用，其中多数是基于逐像素对比的评估方法，但它面临2个主要问题：（1）符号的少量形变会导致质量评估结果变差；（2）没有考虑符号的缺陷特征。因此，
提出面向芯片表面符号的结构缺陷的评估方法。首先采用薄板样条插值将待评估符号和参考符号对齐，消除细小形变的影响，同时提出形变量公式，用于判定形变较大的待评估符号；接着通过提出缺陷的检测方法和缺陷簇、关键位置等概念，得到质量评估的2个主要影响因子：缺陷的本身特征和缺缺陷所在位置是否关键；最后基于上述特征给出合理的打分策略。本质量评估方法是一个客观评价方法，它的优势是：（1）在只需要1张参考图像的前提下，对存在形变的评估符号进行质量评估具有较好的鲁棒性；（2）本方法聚焦于图像符号的结构质量评估，而非图像的本身质量评估，使得评估结果在具备客观性的同时，也符合人对符号内容的实际感觉。采用实际生产线数据进行实验，实验结果表明了本文方法的有效性。

基于多约束优化的图像深度信息估计

袁浩翔，陈姝，林敏

2019, 41(09): 1650-1655. doi:

摘要 ( 158 )

PDF (630KB) ( 273 ) 　　

提出了一种基于深度学习的多约束框架，用于从单目视频中预测深度图。该框架不仅通过最小化光度误差来对网络进行优化，还引入了匹配点对约束和极线约束来弥补光度误差在无纹理区域和光照变化情况下的不稳定性。此外，该框架还加入了非连续图像之间的约束来改善模型的表现。通过与其他深度估计方法进行对比分析，结果表明：该框架可以提高深度预测的准确性，增强了模型在处理无纹理区域和光照变化时的鲁棒性。

带有双判别器的对抗性领域适应图像分类算法

许浩，郭卫斌

2019, 41(09): 1656-1661. doi:

摘要 ( 170 )

PDF (542KB) ( 290 ) 　　

生成对抗网络的出现将对抗学习的思想引入了机器学习的不同知识体系，带来了全新的发展。对抗性的领域适应算法利用一个共享特征提取器提取域不变表征，一个判别器进行辨别，双方通过对抗性的迭代更新方式达到最优解。在数据来源上，生成对抗网络和领域适应都有极其类似的2个域。在目标函数上，两者都试图追寻一致性。从理论和逻辑结构出发分析两者的内在相似性，尝试利用已成熟的生成对抗网络体系从更深层次进一步提升领域适应性能。通过类比，提出使用2个判别器解决已有对抗性领域适应算法中存在的“模式崩溃”问题，并使用伪标签进行结构上的完善。最后，在标准领域适应任务上的实验表明了本文算法的可行性和有效性。

基于YOLO算法的眼底图像视盘定位方法

蒋芸，彭婷婷，谭宁，侯金泉

2019, 41(09): 1662-1670. doi:

摘要 ( 297 )

PDF (893KB) ( 411 ) 　　

视盘的各个参数是衡量眼底健康状况和病灶的重要指标，视盘的检测和定位对于观察视盘的形态尤为重要。在以往的视盘定位研究中，主要根据视盘的形状、亮度、眼底血管的走向等特征使用图像处理的方法对眼底图像中视盘进行定位。由于人为因素影响较大，特征提取时间较长，且视盘定位效率低，因此提出一种基于YOLO算法的眼底图像视盘定位方法。利用YOLO算法将眼底图像划分为N×N的格子，每个格子负责检测视盘中心点是否落入该格子中，通过多尺度的方式和残差层融合低级特征对视盘进行定位，得到不同大小的边界框，最后通过非极大抑制的方式筛选出得分最高的边界框。通过在3个公开的眼底图像数据集(DRIVE、DRISHTI-GS1和MESSIDOR)上，对所提出的视盘定位方法进行测试，定位准确率均为100%，实验同时定位出视盘的中心点坐标，与标准中心点的平均欧氏距离分别为2236 px、2.52 px、21.42 px，验证了该方法的准确性和通用性。

基于可变形卷积的服装检索方法

王振，全红艳

2019, 41(09): 1671-1678. doi:

摘要 ( 143 )

PDF (802KB) ( 346 ) 　　

传统的服装检索方法使用固定形状的感受野，当服装目标存在几何变形时无法有效地提取其特征。针对这个问题，提出基于可变形卷积和相似性学习的服装检索方法。首先，构建可变形卷积网络，自动学习服装特征的采样位置和服装图像的哈希编码；然后，级联相似性学习网络，度量哈希编码的相似性；最后，根据相似性评分产生检索结果。实验结果表明，该方法能够有效地提取存在几何变形的服装目标的特征，从而减少了图像背景特征的干扰，提高了检索模型的准确率。

融合情感极性与信任函数的虚假评论检测方法

杨丰瑞1，2,3，吴晓浩1,2，万程峰1,2

2019, 41(09): 1679-1685. doi:

摘要 ( 144 )

PDF (438KB) ( 276 ) 　　

在线评论是用户判断商品质量的一个依据。虚假评论严重影响了消费者的购买行为，现有的虚假评论检测方法从文本出发，忽略了评分的虚假性，评分通常是不精确和不确定的，对虚假评论检测效果不佳。提出融合情感极性与信任函数的虚假评论检测方法（EP-BFRD），利用信任函数处理给定评论者评分中的不确定性和不准确性，考虑与其他评分者提供的评分的相似性，以检测误导性，并判断评论文本情感极性与评分一致性。综合考虑信任函数处理的结果以及评分与文本情感一致性的结果来判断评论的虚假性。在一个真实的数据库上进行实验，实验表明该方法可
有效解决虚假评论检测问题。

多元动态演绎在Prover9证明器中的应用

曹锋1,3，徐扬2,3，吴贯锋1,3，钟建1,3

2019, 41(09): 1686-1692. doi:

摘要 ( 295 )

PDF (552KB) ( 256 ) 　　

Prover9证明器只采用二元归结方法，是一种静态的、局部的推理规则。基于矛盾体分离规则，提出了一种多元动态演绎算法，采用整体式演绎框架，通过子句演绎权重与文字演绎权重规划演绎路径，并带有回溯机制搜索较优路径。以CADE2017竞赛例（FOF组）进行测试，加入多元动态演绎算法的Prover9证明器证明定理总数提高了40.7%，且所用的平均时间降低了7.46 s。实验表明,提出的多元动态演绎算法是一种有效的推理方法，能有效提高一阶逻辑自动定理证明器的能力。

一种有效的Gk-prototypes聚类算法

郭映江，徐蔚鸿，陈沅涛，文泽林

2019, 41(09): 1693-1699. doi:

摘要 ( 172 )

PDF (908KB) ( 204 ) 　　

针对传统的聚类算法对初始聚类中心敏感、只能对单一属性聚类且聚类效果有时欠佳等不足，提出了一种能处理数值属性和分类属性的Gk-prototypes聚类算法。
在经典的k-prototypes聚类算法的基础上，利用去模糊相似矩阵来构造粗粒子集，结合粒计算和最大最小距离法确定初始聚类中心，并改进了目标函数。实验结果和理论分析表明，Gk-prototypes聚类算法与其他基于k-prototypes的改进算法相比，聚类更准确，有效性更好，鲁棒性更强。

基于信息熵的集成学习过程多样性度量研究

周钢,郭福亮

2019, 41(09): 1700-1707. doi:

摘要 ( 167 )

PDF (506KB) ( 262 ) 　　

基分类器的多样性是提升集成学习的精度和泛化能力的重要因素，大数据环境下的传统后验证多样性度量方法计算效率较低，提出一种基于信息熵的过程多样性度量方法。通过使用分类器各属性的增益及其所在树层次得到属性集的联合增益，并计算分类器间的熵距离评估其多样性，利用熵距离按照K-means方法即可动态购置集成学习分类器。在西瓜数据集和典型分类数据集上进行比较研究，发现与传统集成学习方法相比，该方法具有相近的准确性和更高的计算效率。

基于CNN-LSTM的活动识别方法

李允，孟凡荣，张磊，邵长兴，崔淑敏，朱少杰

2019, 41(09): 1708-1714. doi:

摘要 ( 307 )

PDF (805KB) ( 295 ) 　　

在识别活动时，传统的循环神经网络RNN识别方法不考虑传感器活动数据之间依赖性强的问题，导致识别准确率降低。为了提高识别准确率，解决活动数据依赖性强的问题，用长短期记忆网络LSTM进行活动识别，LSTM在考虑当前点输入的同时考虑先前点的输出，能够保持数据之间的强依赖性。但是，LSTM在处理传感器活动数据的特征提取方面时间效率不高，而卷积神经网络CNN能共享卷积核，且可以从杂乱无章的数据中提取出明显特征向量。提出一种基于CNN-LSTM的活动识别方法CLAR，利用CNN能够很好地提取出活动序列数据中的特征向量，并将提取出的特征向量作为LSTM的输入，利用LSTM门限之间的相互作用进行活动识别，使得依赖性很强的活动数据成为活动识别的优势，进而提高活动识别的准确率和时间效率。实验表明，CLAR方法的识别准确率比单一神经网络活动识别方法的准确率提高了9%，时间平均缩短了10%。

当期目录

作者中心

审稿中心

在线期刊