计算机工程与科学

2019年第6期目录

2019, 41(6): 0-0. doi:

摘要 ( 19 )

PDF (291KB) ( 77 ) 　　

评审附件

并行任务图的优化调度算法

李于锋1,2，莫则尧2，肖永浩1，熊敏1

2019, 41(6): 955-962. doi:

摘要 ( 663 )

PDF (670KB) ( 569 ) 　　

评审附件

科学与工程计算中的很多复杂应用问题需要使用科学工作流技术，超算领域中的科学工作流常以并行任务图建模，并行任务图的有效调度对应用的高效执行有重要意义。给出了资源限制条件下并行任务图的调度模型；针对ForkJoin类并行任务图给出了若干最优化调度结论；针对一般并行任务图提出了一种新的调度算法，该算法考虑了数据通信开销对资源分配和调度性能的影响，并对已有的CPA算法在特定情况下进行了改进。通过实验与常用的CPR和CPA算法做比较，验证了提出的新算法能够获得很好的调度效果。本文提出的调度算法和得到的最优调度结论对工作流应用系统的高性能调度功能开发具有借鉴意义。

基于平铺数据流的可配置神经网络加速器

李艺煌，马胜，郭阳，陈桂林，徐睿

2019, 41(6): 963-972. doi:

摘要 ( 654 )

PDF (1507KB) ( 464 ) 　　

评审附件

卷积神经网络已经是公认最好的用于深度学习的算法，被广泛地应用于图像识别、自动翻译和广告推荐。由于神经网络结构规模的逐渐增大，使其具有大量的神经元和突触，所以，使用专用加速硬件挖掘神经网络的并行性已经成为了热门的选择。在硬件设计中,经典的平铺结构实现了很高的性能，但是平铺结构的单元利用率很低。目前，随着众多深度学习应用对硬件性能要求的逐渐提高，加速器对单元利用率也具有越来越严格的要求。为了在平铺数据流结构上获得更高的单元利用率，可以调换并行的顺序,采用并行输入特征图和输出通道的方式来提高计算的并行性。但是，随着神经网络运算对硬件性能要求的提高，运算单元阵列必然会越来越大。当阵列大小增加到一定程度，相对单一的并行方式会使利用率逐渐下降。这就需要硬件可以开发更多的神经网络并行度，从而抑制单元空转。同时，为了适应不同的网络结构，要求硬件阵列对神经网络的运算是可配置的。但是，可配置硬件会极大地增加硬件开销和数据的调度难度。提出了一种基于平铺结构加速器的并行度可配置的神经网络加速器。为了减少硬件复杂度，提出了部分配置的技术，既能满足大型单元阵列下单元利用率的提升，也能尽可能地减少硬件额外开销。在阵列大小超过512之后，硬件单元利用率平均可以维持在82%～90%。同时加速器性能与单元阵列数量基本成线性比例上升。

一种支持DDR4的软硬件结合的访存踪迹收集分析工具集

李作骏1,2，陈明宇1,2，秦晓宁3

2019, 41(6): 973-980. doi:

摘要 ( 1029 )

PDF (1572KB) ( 558 ) 　　

评审附件

随着多核技术的发展，大数据、云计算、人工智能应用的普及，非易失性内存技术的逐步实用以及信息安全的迫切需求，作为数据处理核心部分的内存系统的设计显得极为重要，而现有的内存系统分析工具却由于各种缺陷已经无法满足研究人员的需求。在原有HMTT的基础上进行硬件级别的重新设计，在最新的DDR41600平台上实现了完整、高效、无失真地获取访存踪迹的功能，并在原有系统的基础上进一步提升了工具的可移植性。最后，使用该工具对最新的SPEC CPU 2017应用进行了访存踪迹的采集测试，并对收集到的访存踪迹信息进行了分析，进一步验证了本文工作的有效性，为今后的各类应用访存行为以及内存系统结构设计研究提供了强有力的工具支撑。

一种基于Java虚拟机的动静结合自适应优化方法

张海军1，郑艳2，叶俊1，白书敬1

2019, 41(6): 981-986. doi:

摘要 ( 419 )

PDF (661KB) ( 481 ) 　　

评审附件

动态语言可以利用程序运行时获取的动态信息，指导程序进行各种优化。但是，现有的Java虚拟机没有将运行过程中收集的信息有效利用，而是在运行结束后直接丢弃，下一次执行程序的时候重新监测、收集、优化需要的信息。基于HotSpot虚拟机提出一种动静结合的自适应优化方法，将运行过程中优化对象迭代搜索到的最佳参数或者信息保存到资源库中；能够从资源库中学习获得适合当前程序的最佳参数或选项，可有效地利用运行过程中积累的数据；资源分析是静态且离线的，不占用应用程序运行的开销；迭代学习的过程中，通过避免冗余实例入库以及从库中剔除噪声实例，保证资源库学习过程的精度与效率。实验表明，该框架对指导Java虚拟机在不同的平台上自适应优化具有一定的实用性。

GA-Sim：一种基于分类和实例学习相结合的作业运行时间预测算法

肖永浩，许伦凡，熊敏

2019, 41(6): 987-992. doi:

摘要 ( 874 )

PDF (701KB) ( 473 ) 　　

评审附件

在高性能计算作业调度系统中，许多调度算法依赖于对作业运行时间的准确估计，尤其是以EASY为代表的回填算法，而使用用户提供的作业运行时间往往会降低调度性能。提出了一种基于分类和实例学习相结合的作业运行时间预测算法--GA-Sim，该算法在考虑预测准确性的同时考虑了低估问题。在两个实际调度日志上的数值实验结果表明，相较于IRPA和TRIP算法，GA-Sim在取得更高预测精度的同时降低了低估率。
对数值实验结果进行了深入分析，并给出了不同情形下选择恰当预测算法的建议。

新一代并行可扩展裂缝性油藏聚合物驱模拟器的开发

钟贺1，刘辉1，崔涛2，王昆1，何也2，沈丽华1，杨渤1，何睿健1，朱舟元3，胡景宏4，陈掌星1

2019, 41(6): 993-1000. doi:

摘要 ( 717 )

PDF (1175KB) ( 549 ) 　　

评审附件

石油作为一种主要能源，在交通、工业生产以及日常生活中发挥着重要作用。大量的新技术已经被开发并用于最大化石油生产，比如聚合物驱等技术在我国得到了广泛的应用。天然裂缝油藏聚合物驱模拟对油田的可持续生产和延长油田寿命至关重要。开发了一种可扩展的并行油藏模拟器，用于使用聚合物驱技术模拟天然裂缝性油藏的石油开采，使油藏工程人员能够利用强大的并行计算机研究生产技术，优化采油过程。通过与现有的商用软件对比，数值结果验证了该模拟器的正确性和有效性。此外，数值实验也证明了该模拟器拥有良好的扩展性，它可以使用成千上万的CPU核来计算具有数亿个网格块的大规模油藏模型。

CoFM：一种加速Middlebox应用的软硬件协同流管理机制

税潇宇，厉俊男，孙志刚，黄金锋

2019, 41(6): 1001-1008. doi:

摘要 ( 462 )

PDF (706KB) ( 382 ) 　　

流管理是Middlebox实现有状态报文处理的基础，负责管理端到端通信所建立的连接及其状态。为了满足不同Middlebox对于流管理的多样化需求，流管理功能通常采用软件实现，以保证灵活性，例如Bro、mOS。但是，受限于CPU的处理性能，软件流管理的性能有限。针对现有解决方案无法兼顾性能和灵活性的缺点，
提出一种软硬件协同的流管理机制——CoFM，将流管理解耦为应用无关的映射管理（即根据流标识查找连接）和应用相关的连接管理2部分，将映射管理卸载到硬件上实现，在减少软件的访存次数提升性能的同时，保持了软件连接管理的灵活性。此外，CoFM的映射管理还支持新映射的动态插入和超时映射的删除，分别用于减少软硬件交互次数和降低硬件资源开销。最后，使用Verilog语言在FPGA上实现了映射管理功能，并基于CAIDA数据集对其做了相应的性能和资源开销测试。实验结果表明，CoFM的映射管理具有50 Gbps的吞吐率和极低的处理延时（<1 μs），且硬件资源开销相对较少，适合用于流管理的加速。

N状态二进制一致性算法设计及其优化

刘华1，杨春曦1，韩光松2，谢可心1

2019, 41(6): 1009-1015. doi:

摘要 ( 672 )

PDF (828KB) ( 370 ) 　　

针对二进制一致性算法扩展性差、经验依赖性强的缺点，提出了一种N状态分布式二进制一致性算法。首先，基于Gossip算法的平均一致性思想和轮盘赌思想，更新无线传感器网络状态均值和当前状态均值的偏差程度，计算所有可能更新状态的初始概率分布；然后，利用遗传算法优化初始概率分布，得到准确率较高的最优概率分布。仿真结果表明，在相同状态个数条件下，本文所设计的算法具有更好的准确率和收敛时间。

航空机载嵌入式控制软件需求建模的形式化工程方法

黄怿豪，冯劲草，郑寒月，缪炜恺，蒲戈光

2019, 41(6): 1016-1025. doi:

摘要 ( 901 )

PDF (860KB) ( 536 ) 　　

嵌入式控制软件是现代航空飞行器的核心部件之一。构建软件需求的形式化规约精确地刻画人们对软件期望的功能和运行场景，是确保此类安全攸关软件质量的根本途径。在工业界，形式化需求建模的大规模应用尽管有成功的案例，但仍面临众多的困难。其根本性难点在于缺少一种系统化的工程方法来引导工业界软件实践者，从原始需求开始最终完成形式化需求规约，并能确认该规约真实、充分地反映了人们对软件期望的功能。针对上述挑战，提出了一种面向机载控制软件需求建模的形式化工程方法ACSDLMV，以形式化方法为理论基础，结合软件需求工程的基本原理，引导工程人员从原始需求出发以演化式的过程逐步完成需求规约的构建；定制了航空控制软件的形式化描述语言ACSDL，用以构建形式化规约；为了确认软件需求规约准确、充分地描述了人们对软件期望的功能，该方法给出了基于图形的静态审查和基于模型的动态模拟技术。在航空发动机公司中的实验结果表明，该方法相比传统方法探测到了更多的潜在错误。

一种基于失效传播模型的危害分析方法

葛晓瑜1，沈国华1,2，黄志球1,2，邓刘梦1，宛伟健1

2019, 41(6): 1026-1033. doi:

摘要 ( 616 )

PDF (680KB) ( 578 ) 　　

嵌入式实时系统越来越多地应用于交通、航空、核能等安全关键环境。尽管系统设计可能没有任何缺陷，但由于物理组件的磨损或环境的突变而导致的随机故障在运行时仍可能导致系统发生危险。目前基于失效传播模型的危害分析方法要么仅考虑失效传播时间，要么仅考虑失效概率，缺少综合分析失效传播时间及失效概率对危害分析的影响。时间失效传播图TFPGs模型用于建模安全关键系统设计阶段中失效传播过程，该模型包含失效传播时延建模。考虑到失效传播路径的不确定对危害发生的概率影响，提出了一种危害分析方法，用概率时间失效传播图P-TFPGs模型建模失效传播过程，并基于该模型设计了一种分析
危害发生时间与发生概率之间关系的方法；最后，给出了一个案例来说明方法的可行性。

面向Web服务测试的单线执行序列生成方法

何娟娟1,刘冬梅1,朱鸿2,杜益宁1,周子健1,郑小宇1

2019, 41(6): 1034-1043. doi:

摘要 ( 761 )

PDF (897KB) ( 452 ) 　　

测试用例自动生成是实现Web服务自动化测试的关键，基于代数规约的传统测试技术均依赖于创建、初始化和复制被测对象等操作来验证测试结果的正确性，但第三方Web服务并不支持这些操作，无法将测试用例转换成可执行操作序列。一种可行的解决方案是将测试用例转换成只包含一个被测服务实例、不包括实例初始化、只对实例进行状态修改和检查的线性执行序列。改进已有工作，提出包含逆项的测试执行图TEGI来描述测试用例执行过程中的状态变化，设计TEGI构造算法和单线执行序列生成算法并实现相应原型工具。实验结果表明，提出的方法能够有效地自动完成测试用例生成，提高Web服务的可测试性。

三种测度融合的加权引导滤波匹配算法

郭鑫1,2，王延杰1，付东辉1,2，樊博1,2

2019, 41(6): 1044-1049. doi:

摘要 ( 451 )

PDF (561KB) ( 547 ) 　　

针对立体匹配算法中，census变换在弱纹理区域具有较好效果，但忽略了图像的灰度信息，造成在重复纹理区域匹配效果不理想，提出了一种改进的census变换。在初始匹配代价阶段，设计了一种在census变换的基础上融合互信息和梯度信息的相似性测度算法。在代价聚合阶段，采用自适应权重引导滤波聚合策略。最后，通过视差计算、视差优化得到最终的视差图。在VS2015软件平台上对Middlebury网站上提供的标准测试图进行实验，实验结果表明，所提算法能够得到较为准确的视差图，平均误匹配率为5.29%，可以满足三维重构的需要。

基于SIFT算法的物体运动方向快速识别方法

李洪锋1，魏镜弢1，付亚伟2，王家涛1

2019, 41(6): 1050-1056. doi:

摘要 ( 511 )

PDF (828KB) ( 430 ) 　　

为了解决成像设备只能在较低的分辨率成像且不能区分运动方向的问题,提出了一种基于SIFT算法的快速识别物体运动方向的方法。首先，根据块匹配算法中的角点特征提取法确定块的位置，并将该块命名为检测块。然后，用已经确定的块遍历下一帧图像，找到相匹配的块，命名为目标块并确定检验块与目标块之间的运动方向。最后，采用SIFT算法对2幅图像的特征点进行匹配，选取3个特征点构建三角形，对2个对应三角形的变换关系构建数学模型，做出运动方向的判断。实验结果表明，与块匹配相比，运动方向判断速度提高了3.3倍，匹配的准确程度提高了2.9倍，获得了更高的判断速度和准确度。
2种方法的比较结果显示，基于SIFT算法的识别方法具有较强的可行性，能够更快地确定多帧图像中物体的运动方向。

基于改进灰狼算法优化支持向量机的人脸识别

冯璋，裴东,王维

2019, 41(6): 1057-1063. doi:

摘要 ( 602 )

PDF (784KB) ( 529 ) 　　

针对二维主成分分析法（2DPCA）与主成分分析法（PCA）相结合提取人脸特征时效率不高的问题，提出一种2DPCA和快速PCA结合与改进灰狼算法（EGWO）共同优化支持向量机的人脸识别方法。该方法在特征提取方面运用2DPCA与快速PCA相结合，以减少提取特征的维数和提取时间，从而缩短了SVM所需的识别时间。为了提高灰狼算法的全局搜索能力，引用精英反向学习策略初始化种群个体，有效增强GWO的勘探和开采能力，再将其使用到SVM中，迭代获取最佳核参数和惩戒参数，将训练得到的最终分类器应用于人脸识别中。通过6个基准测试函数与GWO和反向学习灰狼算法（OGWO）进行性能比较，改进灰狼算法的收敛精度和收敛速度更优；经ORL和Yale中的人脸图像实验，证明了改进算法相对于GWO、粒子群算法（PSO）和差分进化算法（DE）结合SVM模型的识别结果更佳且稳定性更强。

一种新的基于段向量的文本自动摘要方法

申强强，熊泽宇，熊岳山

2019, 41(6): 1064-1070. doi:

摘要 ( 563 )

PDF (1107KB) ( 439 ) 　　

文本自动摘要技术在网页搜索和网页内容推荐等多个领域都有着非常广阔的应用前景。经典的文本摘要算法采用统计学的方法来提取文章关键字，进而提取主题句。这种方法在一定程度上忽略了文本的语义和语法信息。近年来，分布式词向量嵌入技术已经应用到文本检索当中，基于该技术提出了一种词向量化的自动文本摘要方法，该方法主要分为4个步骤：词向量生成、基于词向量的段向量生成、关键词提取和主题句抽取，最终实现文本段落的自动摘要。实验结果表明，改进的文本自动摘要方法能够有效提取主题句。

基于改进CNN的局部相似性预测推荐模型

吴国栋1,2，宋福根1，涂立静2，史明哲2

2019, 41(6): 1071-1077. doi:

摘要 ( 27 )

PDF (734KB) ( 78 ) 　　

为缓解推荐系统中数据稀疏性问题，利用卷积神经网络CNN具有较强捕捉局部特征能力的优势，通过加入一个调节层，提出一种改进CNN的局部相似性预测推荐模型LSPCNN。新模型对初始用户项目评分矩阵进行迭代调整，使用户兴趣偏好局部特征化，再融合CNN对缺失评分进行预测，从而实施个性化推荐。实验结果表明，LSPCNN模型在不同数据稀疏度下的MAE值较传统推荐方法平均下降4%，有效缓解了数据稀疏性，提高了推荐系统的性能。

动态环境下改进蚁群算法的多Agent路径规划

郑延斌1,2，王林林1，席鹏雪1，樊文鑫1，韩梦云1

2019, 41(6): 1078-1085. doi:

摘要 ( 797 )

PDF (1001KB) ( 444 ) 　　

针对动态环境下的多Agent路径规划问题，提出了一种改进的蚁群算法与烟花算法相结合的动态路径规划方法。通过自适应信息素强度值及信息素缩减因子来加快算法的迭代速度，并利用烟花算法来解决路径规划过程中的死锁问题，避免陷入局部最优。在多Agent动态避碰过程中，根据动态障碍物与多Agent之间的运行轨迹是否相交制定相应的避碰策略，并利用路径转变函数解决多Agent的正面碰撞问题。仿真实验表明，该方法优于经典蚁群算法，能够有效解决多Agent路径规划中的碰撞问题，从而快速找到最优无碰路径。

基于概率阈值Bagging算法的不平衡数据分类方法

张忠林，吴挡平

2019, 41(6): 1086-1094. doi:

摘要 ( 893 )

PDF (962KB) ( 552 ) 　　

类别不平衡问题广泛存在于现实生活中，多数传统分类器假定类分布平衡或误分类代价相等，因此类别不平衡数据严重影响了传统分类器的分类性能。针对不平衡数据集的分类问题，提出了一种处理不平衡数据的概率阈值Bagging分类方法—PTBagging。将阈值移动技术与Bagging集成算法结合起来，在训练阶段使用原始分布的训练集进行训练，在预测阶段引入决策阈值移动方法，利用校准的后验概率估计得到对不平衡数据分类的最大化性能测量。实验结果表明，PTBagging算法具有更好的处理不平衡数据的分类优势。

基于Canopy聚类的谱聚类算法

周伟，肖杨

2019, 41(6): 1095-1100. doi:

摘要 ( 621 )

PDF (710KB) ( 473 ) 　　

传统的谱聚类算法对初始化敏感，针对这个缺陷，引入Canopy算法对样本进行“粗”聚类得到初始聚类中心点，将结果作为K-Means算法的输入，提出了一种基于Canopy和谱聚类融合的聚类算法（Canopy-SC），减少了传统谱聚类算法选择初始中心点的盲目性，并将其用于人脸图像聚类。与传统的谱聚类算法相比，Canopy-SC算法能够得到较好的聚类中心和聚类结果，同时具有更高的聚类精确度。实验结果表明了该算法的有效性和可行性。

基于蜂群K-means聚类模型的协同过滤推荐算法

李艳娟，牛梦婷，李林辉

2019, 41(6): 1101-1109. doi:

摘要 ( 965 )

PDF (813KB) ( 546 ) 　　

评审附件

针对目前协同过滤推荐算法的推荐质量和推荐效率低的问题，提出了一种基于改进蜂群Kmeans聚类模型的协同过滤推荐算法。首先，根据用户属性信息，
采用改进蜂群Kmeans算法对用户进行聚类，建立用户聚类模型；然后，计算目标用户与用户聚类模型中各聚类中心的距离，其中距离最近的类为目标用户的检索空间；最后，从检索空间中依据用户项目评分矩阵通过相似度计算搜索目标用户的最近邻居，由最近邻居的信息产生推荐列表。实验结果表明，该算法降低了平均绝对误差值，缩短了运行时间，提高了推荐质量和推荐效率。

基于联合神经网络模型的中文医疗实体分类与关系抽取

张玉坤1,2，刘茂福1,2，胡慧君1,2

2019, 41(6): 1110-1118. doi:

摘要 ( 563 )

PDF (898KB) ( 572 ) 　　

评审附件

近年来，医疗健康领域的实体分类与关系抽取引起了广泛关注。以往工作大多采用流水线模型，此类模型容易忽略任务间联系并造成错误传播，而联合学习则能够很好地避免这2个问题。为此，把卷积神经网络与支持向量机、条件随机场相结合，构建了联合神经网络模型。在此模型基础上，以参数共享的方式，分别通过任务联合、模型联合以及特征联合对实体分类与关系抽取2个任务进行联合学习，在药品说明书语料库中取得了非常不错的效果，实体分类和关系抽取的F值分别达到了98.0%和98.3%。实验表明，联合神经网络模型对于实体分类和关系抽取是非常有效的。

基于EMD改进的Elman神经网络对股票的短期预测模型

吴曼曼1，徐建新 1，2

2019, 41(6): 1119-1127. doi:

摘要 ( 568 )

PDF (869KB) ( 458 ) 　　

Elman神经网络在短期预测股市收盘价时存在预测趋势良好但准确度较低的问题。在Elman神经网络的思想上提出以经验模态分解EMD为基础的Elman新组合模型。应用EMD将各交易日的收盘价序列分解成不同时间尺度上的本征模函数IMF分量和剩余分量，进而利用偏自相关函数PACF计算每一个分量的滞后期，以确定各分量在Elman神经网络中的输入和输出变量，从而得到各分量的预测值，相加得到最终的预测结果。与EMD单一网络、EMDElman模型、BP网络及EMDBP模型进行实验对比，结果表明：该短期预测模型的预测值均方误差、平均绝对误差和平均绝对百分比误差都得到较大的改善；新组合模型可有效实现对股票收盘价的短期预测，且能降低非平稳性对预测结果的影响。该研究为进一步预测股市的走向提供了有效依据，也为投资者提供了更充分的决策参考。

基于知网的个人微博语义相关度的聚类研究

高永兵1,宋添树1,2,李江宇1,马占飞3

2019, 41(6): 1128-1135. doi:

摘要 ( 24 )

PDF (640KB) ( 57 ) 　　

评审附件

聚类相关度大的个人微博有助于快速了解博主的专业兴趣和经历，目前的短文本聚类方法缺乏对于语义和句子相关度的充分考虑，提出了一种基于知网的个人微博语义相关度的聚类方法。其要点如下：（1）利用Skipgram训练大量微博文本生成词汇向量；（2）根据词汇义原进行句内词汇消除歧义；（3）分别计算个人微博之间词汇和句子的相似度并将其综合得到博文相关度；（4）根据博文相关度进行个人微博的聚类。实验表明，相较于层次聚类法、密度聚类法，本文算法的准确度有明显提高。

基于SPARK与随机森林的短信诈骗用户识别研究

杨杰超，许江淳，岳秋燕，曾德斌，陆万荣

2019, 41(6): 1136-1144. doi:

摘要 ( 995 )

PDF (1319KB) ( 739 ) 　　

评审附件

当今数据时代电信诈骗现象日益增多，为了在短信诈骗份子实施诈骗前及时识别出其身份，根据目前电信行业需求及研究现状，在SPARK并行处理框架上，针对性地提出了分层子空间的加权随机森林算法。面对短信用户种类繁杂导致的数据类别不平衡带来的随机森林性能低下的问题，采用改进的分层子空间的方法，并根据评估出的每棵树的分类能力给决策树加权，相较于其他分类算法，改进的随机森林表现得更优异；针对电信行业海量数据的特点，选择分布式SPARK作为数据处理平台，并行化的平台缩短了模型训练和测试时间，提高了效率，实时、准确地识别电信短信诈骗用户，其准确率达到90%以上。

当期目录

作者中心

审稿中心

在线期刊