计算机工程与科学

2019年第5期目录

2019, 41(05): 0-0. doi:

摘要 ( 22 )

PDF (292KB) ( 99 ) 　　

评审附件

面向大规模海洋数据同化算法的并行实现及优化

万威强，肖俊敏，洪学海，谭光明

2019, 41(05): 765-772. doi:

摘要 ( 309 )

PDF (792KB) ( 530 ) 　　

评审附件

海洋数据同化是一种将海洋观测资料融合到海洋数值模式中的有效手段，经过同化的海洋数据更加接近海洋的真实情况，对人类理解和认识海洋具有重要意义。围绕海洋数据同化设计了一种基于区域分解的一般性并行实现方法。在此基础上，提出了一种基于IO代理的新并行算法。首先，IO代理进程负责数据的并行读取；接下来，IO代理进程对数据进行切块，然后将块数据发送给相应的计算进程；当计算进程完成局部数据同化后，IO代理进程负责收集计算进程的同化结果，并将其写入磁盘。该方法的主要优势在于：利用IO代理进程来负责IO，而不是像传统方法那样让所有进程都来参与IO（直接并行IO），这样可以防止大量进程对磁盘的同时访问，有效避免进程排队所导致的等待。在天河二号集群上的测试结果表明，对于1度分辨率的数据同化，在核心数为425时，该并行实现的总运行时间为9.1 s，相对于传统串行程序的加速比接近38倍。此外，对于0.1度分辨率的数据同化，基于IO代理的并行同化算法在使用10 000核时依然具有较好的可扩展性，并且可将其IO时间最大限制在直接并行IO时间的1/9。

虚拟化环境中线程级SLO保障的I/O软件框架研究

刘希明，李雨轩，宫晓利，张金

2019, 41(05): 773-779. doi:

摘要 ( 178 )

PDF (808KB) ( 261 ) 　　

评审附件

云计算产业的快速发展使得虚拟化技术在各大云服务商心目中占据重要地位。为了获取更高的利润，云服务商需要在保障用户体验的前提下尽可能地利用设备性能。通过利用I/O请求的优先级和重要性等信息，研究者们已经在Linux内核中实现了很多提高程序性能的方法。然而，虚拟机中的这些信息在传递到宿主机的过程中会丢失，所以
提出了一种基于服务水平目标SLO的I/O保障框架。首先分析了I/O请求优先级等信息丢失的原因，并提出了传递这些信息需要解决的关键性问题。在此基础上，本文提出的框架通过对Linux内核、virtio协议以及KVM的I/O虚拟化程序QEMU进行扩展，成功地将虚拟机线程的SLO信息传送至宿主机并在此基础上实现了基于SLO信息的调度器。最后，通过实验验证了框架的可行性，优先级最高的线程吞吐量可以达到260 KB/s，优先级最低的线程吞吐量只有10 KB/s，成功证明了由框架传递下来的SLO信息对宿主机中调度器的调度起到了积极作用。

稀疏数据频繁项集挖掘算法研究综述

肖文，胡娟

2019, 41(05): 780-787. doi:

摘要 ( 214 )

PDF (831KB) ( 434 ) 　　

评审附件

频繁项集挖掘FIM是最重要的数据挖掘任务之一,被挖掘数据集的特征对FIM算法的性能有着显著影响。在大数据时代，稀疏是大数据的典型特征之一，对传统FIM算法的性能带来严峻挑战。针对在稀疏数据中如何高效进行FIM的问题，从稀疏数据的特征出发，分析了稀疏数据对3种类型FIM算法性能的主要影响，对已经提出的稀疏数据FIM算法进行了综述，对算法中采用的优化策略进行了讨论，最后通过实验对代表性的稀疏数据FIM算法进行了性能分析。实验结果表明，采用伪构造策略的模式增长算法最适合用于稀疏数据的FIM，在运算时间和存储空间上，相比其他算法该算法具有较大的优势。

一种基于Inter-warp异构性的缓存管理与内存调度机制

方娟，魏泽琳，于婷雯

2019, 41(05): 788-795. doi:

摘要 ( 17 )

PDF (1263KB) ( 36 ) 　　

评审附件

在GPU中，一个warp内的所有线程在锁步中执行相同的指令。某些线程的内存请求可以得到快速处理，而其余请求会经历较长时间。在最慢的请求完成之前，warp不能执行下一条指令，导致内存发散。对GPU中warp间的异构性进行了研究，实现并优化了一种基于interwarp异构性的缓存管理机制和内存调度策略，以减少内存发散和缓存排队延迟的负面影响。根据缓存命中率将warp分类，以驱动后面的3个组件：（1）基于warp类型的缓存旁路技术组件，使低缓存利用率的warp进入旁路，不访问L2缓存；（2）基于warp类型的缓存插入/提升策略组件，防止来自高缓存利用率warp的数据被过早清除；（3）基于warp类型的内存控制器组件，优先处理从高缓存利用率的warp接收到的请求，并优先处理来自相同warp的请求。基于warp间异构性的缓存管理和内存调度机制在8种不同的GPGPU应用中，与基准GPU相比，平均加速18.0％。

通过K-means算法实现神经网络的加速和压缩

陈桂林，马胜，郭阳，李艺煌，徐睿

2019, 41(05): 797-803. doi:

摘要 ( 227 )

PDF (640KB) ( 273 ) 　　

评审附件

近年来，以神经网络为代表的机器学习领域快速发展，已广泛地应用于语音识别和图像识别等各个工业领域。随着应用环境越来越复杂，精度要求越来越高，网络规模也越来越大。大规模神经网络既是计算密集型又是存储密集型结构，其中卷积层是计算密集型层次，全连接层是存储密集型层次。前者的处理速度跟不上存取速度，后者的存取速度跟不上处理速度。基于神经网络本身训练的预测准确率置信区间，提出了一种使用Kmeans加速和压缩神经网络的方法。通过将卷积过程中的输入特征图采用Kmeans压缩来减少计算量；通过将全连接层的权重压缩来减少存储量。所提方法对AlexNet网络单个卷积层的计算量最多能降低2个数量级，加入合适的Kmeans层，整个网络的处理时间加速比能达到2.077，对网络压缩率达到8.7%。

基于聚类的环形kNN算法

匡振曦，武继刚，李嘉兴

2019, 41(05): 804-812. doi:

摘要 ( 242 )

PDF (722KB) ( 278 ) 　　

评审附件

传统k最近邻算法kNN在数据分类中具有广泛的应用，但该算法具有较多的冗余计算，致使处理高维数据时花费较多的计算时间。同时，基于地标点谱聚类的分类算法（LCkNN和RCkNN）中距离当前测试点的最近邻点存在部分缺失，导致其准确率降低。针对上述问题，提出一种基于聚类的环形k最近邻算法。提出的算法在聚类算法的基础上，首先将训练集中相似度较高的数据点聚成一个簇，然后以当前测试点为中心设置一个环形过滤器，最后通过kNN算法对过滤器中的点进行分类，其中聚类算法可以根据实际情况自由选择。算法性能已在UCI数据库中6组公开数据集上进行了实验测试，实验结果表明：AkNNE与AkNNH算法比kNN算法在计算量上平均减少51%，而在准确率上比LCkNN和RCkNN算法平均提高3%。此外，当数据在10 000维的情况下该算法仍然有效。

可证安全的CLPKC-to-IDPKC在线/离线异构签密方案

张玉磊1，刘祥震1，张永洁2，骆广萍1，陈文娟1，王彩芬1

2019, 41(05): 813-820. doi:

摘要 ( 158 )

PDF (513KB) ( 289 ) 　　

在线/离线签密不仅可以提高移动设备的计算效率，而且还可以保证数据的机密性和不可伪造性。异构密码环境下，需要考虑不同公钥密码环境之间的在线/离线签密问题。定义了从无证书密码体制到身份密码体制的在线/离线异构签密安全模型，并提出了具体的CLPKCtoIDPKC在线/离线异构签密方案。方案执行签密运算时，不需要双线性对运算；执行解签密时，只需要2个双线性对运算。与已有在线/离线异构签密方案相比，在效率相当的情况下不存在证书管理问题，适合于计算能力受限的移动设备。通过安全性证明本文方案满足机密性和不可伪造性。最后的实验仿真分析了所提方案在线/离线签密和解签密的效率，
该方案采用了独立系统参数，更适用于实际应用环境。

高速跳频网络中时间同步的研究与实现

施利萍1，赵建宏2

2019, 41(05): 821-827. doi:

摘要 ( 167 )

PDF (1069KB) ( 297 ) 　　

针对无线通信网络中各通信节点间守时存在较大的误差，提出了一种基于传感器网络时间同步协议TPSN双向时间同步算法，设计了一种小型化、模块化的高精度时统系统，可用于跳频同步和TDMA组网体制下的时隙同步。首先选取主机，仅当10 s内未收到校时呼叫的节点设置为主机；其次发送及应答，规定主机1 s内仅对一个从机请求作出应答；最后通过记录校时主从节点的发送时刻，扣除或补偿逻辑处理延迟、射频传输延迟、校时两端的频差等，计算节点间的同步误差。在不同条件下进行了仿真实验，节点间的同步误差可以精确到30 ns左右，表明该方案时间同步精度高、误差较小，可满足该无线通信网络中各节点间协同探测、协同攻击和协同干扰等战术目标的需要。

抵制轨迹相似性攻击的轨迹（k，e）匿名算法

贾俊杰，黄贺

2019, 41(05): 828-834. doi:

摘要 ( 152 )

PDF (568KB) ( 229 ) 　　

针对轨迹匿名集中轨迹间的相似性过高导致的轨迹隐私泄露问题，提出抵制轨迹相似性攻击的轨迹（k，e）匿名算法。该算法在预处理过程中，采用轨迹同步化处理
方法减少信息损失；生成匿名集时，将轨迹斜率作为轨迹数据的敏感值，选择至少k条不同轨迹斜率的轨迹来满足轨迹k匿名，并要求每个类中轨迹斜率差异值至少为e，以防止集合中轨迹的斜率相似性过高而导致隐私泄露。实验结果表明，该算法可以有效抵制轨迹相似性攻击，在减少信息损失的同时增强了轨迹数据可用性，更好地实现了轨迹隐私保护。

Mediator模型的SystemC代码自动生成

张琦1,2，李屹1，孙猛1

2019, 41(05): 835-842. doi:

摘要 ( 207 )

PDF (521KB) ( 492 ) 　　

Mediator是一种基于组件的建模语言，该语言主要通过自动机和系统对模型进行描述。将Mediator语言描述的模型自动生成为可执行代码，可以避免编码过程中由于人为疏忽而造成的错误，从而提高编码的可靠性，同时缩短模型开发周期。介绍一种从Mediator模型到SystemC代码的自动生成工具，该工具旨在将基于特定平台的模型转换为能直接仿真运行的代码。首先对Mediator语言的语法语义进行分析，选择合适的SystemC代码组织形式，然后针对Mediator模型的每一个组成部分
设计生成规则，其中重点对类型生成、状态转移语句生成、同步语句的生成进行分析。最后，通过一个机器掉电检测系统说明该工具运行结果的正确性。

Qsimulation:一个量子计算模拟器工具

邓曦，邓玉欣

2019, 41(05): 843-850. doi:

摘要 ( 334 )

PDF (659KB) ( 369 ) 　　

介绍一个可在经典计算机上模拟量子计算的工具Qsimulation。该工具由4个主要部分组成：一个命令式的量子编程语言，一个量子计算解释器，一个用于模拟量子程序执行的图形用户界面以及错误处理模块，它能帮助教师和新手设计并测试简单的量子电路和量子程序。

联合弯曲能量和标志点对应约束的非刚性医学图像配准

朱天宇，全惠敏，刘国才

2019, 41(05): 851-857. doi:

摘要 ( 172 )

PDF (930KB) ( 350 ) 　　

由于缺乏图像几何空间约束，基于互信息的非刚性医学图像配准常常产生不合理的形变。提出一种联合弯曲能量和标志点对应约束的非刚性医学图像配准方法，在互信息配准目标函数中添加弯曲能量惩罚和对应标志点间欧氏距离2个正则项，约束医学图像软组织不合理形变。脑部MRI、头颈部CT、胸部CBCT影像配准实验结果表明，该方法可有效提高配准质量。

基于改进模糊C均值的海面目标图像分割算法

任佳1,2，张胜男1，董超2，赵敏钧1

2019, 41(05): 858-864. doi:

摘要 ( 183 )

PDF (1968KB) ( 315 ) 　　

提出一种图像分割算法，解决水面无人艇在执行目标跟踪与识别任务过程中的图像快速准备分割问题。首先使用均值滤波算法对彩色的海洋背景图像进行滤波，同时利用其非参数性得到图像的聚类中心和类别数，并以此作为初始化参数进行图像的模糊C均值聚类，在此基础上进行大津法Otsu二值化处理实现目标提取。使用BSDS500标准数据集和海洋背景图像对算法的分割效果及效率进行验证，与传统的模糊C均值算法、脉冲耦合神经网络算法、自适应遗传算法以及马尔科夫随机场算法进行对比的结果显示了该算法的有效性。

改进的二阶总广义变分图像前后景分割模型

孔晓然，朱华平

2019, 41(05): 865-872. doi:

摘要 ( 187 )

PDF (1115KB) ( 280 ) 　　

针对总变分TV图像前后景分割模型易导致阶梯效应的缺陷，提出了二阶总广义变分TGV图像前后景分割模型。为进一步提升图像分割质量，在TGV前后景分割模型的正则项中引入边缘指示函数，使其在图像边缘区域减弱扩散，较好地保护边缘；在图像平滑区域增强扩散，有效地消除噪声。为突出前景信息，用矩形框标出图像的前景信息，对框内部、外部和边缘的像素做距离映射，并根据能量最小化原则，在二阶TGV模型的数据项中引入此距离映射函数，使模型总能量更小。最后，提出了一种有效的原始对偶分割算法来求解模型。实验表明，新模型不但能够去除阶梯效应现象，保持图像的边缘信息，还使得模型总能量更小，分割得到的图像视觉效果更好。

基于改进AKAZE特征的无人机影像拼接算法研究

宋伟1，王永波1，张培佩1,2

2019, 41(05): 873-878. doi:

摘要 ( 177 )

PDF (1402KB) ( 277 ) 　　

针对目前无人机影像拼接时间效率较低,效果较差的问题，提出一种改进的AKAZE特征的无人机影像拼接算法。算法在影像匹配阶段利用BRISK描述符来代替MLDB描述符；采用特征点尺度信息和均方根误差作为约束条件剔除错误匹配；另外，将并行运算的思想应用于特征点提取和特征描述符的计算中来提升算法的时间效率。在影像融合阶段，利用RANSAC算法与LM算法相结合进行单应矩阵计算，以提高其计算精度，并采用多频段融合算法实现影像拼接。实验表明：通过改进算法在有效提升时间效率的同时，可以获得较高准确率和较高精度的匹配结果，实现无人机影像的快速无缝拼接。

基于改进粒子群优化的电容层析成像图像重建算法

严春满，陆根源，张道亮，董俊松

2019, 41(05): 879-884. doi:

摘要 ( 172 )

PDF (703KB) ( 368 ) 　　

Landweber电容层析成像ECT图像重建算法与粒子群优化算法PSO结合后能够进一步提高成像质量，但标准粒子群优化算法用于图像重建优化时存在陷入局部最优的现象。针对该问题，提出一种基于改进粒子群优化结合Landweber算法的电容层析成像图像重建算法。新算法在Landweber算法的基础上加入改进的惯性权值指数衰减粒子群优化策略，通过增加以指数规律衰减的粒子速度更新公式的约束因子，以保证算法在开始阶段具有较强的全局寻优能力，而在后期具有较强的局部寻优能力，从而实现对Landweber算法初始重建结果的进一步优化，以提高重建图像的质量。为验证新算法的有效性，选取较典型的LBP、改进Tikhonov迭代算法及Landweber图像重建算法，完成了ECT图像重建的对比实验。仿真结果表明，相对于其他算法，对于常见的几种流型，新算法在重建图像的主观及客观质量方面均有明显提高。

基于改进的OPTICS聚类和LOPW的离群数据检测算法

肖雪,薛善良

2019, 41(05): 885-892. doi:

摘要 ( 176 )

PDF (3555KB) ( 263 ) 　　

针对现有的离群数据检测算法时间复杂度过高，且检测质量不佳的不足，提出一种新的基于改进的OPTICS聚类和LOPW的离群数据检测算法。首先，使用改进的OPTICS聚类算法对原始数据集进行预处理，筛选由聚类形成的可达图得到初步离群数据集；然后，利用新定义的基于P权值的局部离群因子LOPW计算初步离群数据集中对象的离群程度，计算距离时引入去一划分信息熵增量确定属性的权重，提高离群检测准确性。实验结果表明，改进后的算法不仅提高了运算效率，而且提高了对离群数据检测的精确度。

基于深度学习的MOOCs辍学率预测方法

孙霞，吴楠楠，张蕾，陈静，冯筠

2019, 41(05): 893-899. doi:

摘要 ( 344 )

PDF (780KB) ( 535 ) 　　

近年来大规模开放在线课程获得了较为广泛的关注。由于学习者学习方式不合理使得学习兴趣下降，学习效果不佳，MOOCs辍学率很高，针对这一问题，
从学习者学习活动日志中自动抽取一段时间内连续特征，以学习者行为特征为自变量，建立MOOCs辍学预测模型。在KDD Cup 2015数据集上的实验表明，使用基于卷积神经网络的长短期记忆CNN_LSTM辍学预测模型，能够帮助MOOCs课程教师和设计者追踪课程学习者在不同时间步长的学习状态，从而动态监控不同阶段的辍学行为，模型的预测准确率高，这将为教师改进教学方法提供更合理的指导和建议。

一种自适应调整种群子代数量与步长的优化算法——爆米花算法

赵志刚，莫海淼，温泰，李智梅，郭杨

2019, 41(05): 900-909. doi:

摘要 ( 179 )

PDF (829KB) ( 295 ) 　　

提出了一种新的群体智能优化算法——爆米花算法。借鉴了烟花算法爆炸机制的优点，利用个体在寻优过程中适应度值的优劣来动态调整子代的数量，个体的适应度值越好，产生的子代数量越多，并且在该个体附近搜索的子代数量越多，以此控制局部搜索与全局搜索之间的平衡。还借鉴了粒子群优化算法的记忆机制，引入个体最优和全局最优来构造新的爆炸半径，使算法能够在寻优过程中动态地调整步长，并对全局最优进行高斯扰动，增加种群的多样性。实验结果表明：与其他优化算法(如蝙蝠算法、标准粒子群算法、烟花算法)相比，本文提出的爆米花算法总体性能更优。

基于任务相关性的机务虚拟维修系统的场景管理

陈静杰,李浩

2019, 41(05): 910-916. doi:

摘要 ( 116 )

PDF (905KB) ( 251 ) 　　

为解决机务虚拟维修训练系统中场景、模型一次性全部加载速度慢、内存占用量高的问题，基于任务的相关性提出一种场景管理方法。使用TF-IDF算法获取系统中包含的虚拟维修任务工卡的相似度并进行划分。工卡的相似度越高表示所描述的虚拟维修场景、维修工具、维修对象等虚拟资源相关性越强。当在场景资源加载、内存分配时，将相关性大于68%的任务工卡描述的虚拟资源利用伙伴系统进行加载分配，对于相关性小于42%的任务场景，则在伙伴系统中申请一块内存，并将这块内存划分为内存池进行加载分配。而任务相关性介于42%～68%的任务场景用双动态双链表的方法进行管理。解决了传统虚拟维修训练系统中加载资源时没有维修资源相关性分配管理的不足，分配方法没有任务针对性的局限，避免了单独划分内存块的系统分配时间。实验结果表明，改进后的分配方法减少了17%内存占用量，并提高了17.57的帧率。

基于改进遗传算法的RBF神经网络结构优化研究

文常保，马文博，刘鹏里

2019, 41(05): 917-923. doi:

摘要 ( 205 )

PDF (743KB) ( 331 ) 　　

针对RBF神经网络隐含层节点数过多导致网络结构复杂的问题，提出了一种基于改进遗传算法（IGA）的RBF神经网络优化算法。利用IGA优化基于正交最小二乘法的RBF神经网络结构，通过对隐含层输出矩阵的列向量进行全局寻优，从而设计出结构更优的基于IGA的RBF神经网络（IGARBF）。将IGA-RBF神经网络的学习算法应用于电子元器件贮存环境温湿度预测模型，与基于正交最小二乘法的RBF神经网络进行比较的结果表明：IGA-RBF神经网络设计出来的网络训练步数减少了44步，隐含层节点数减少了34个，且预测模型得到的温湿度误差较小，拟合精度大于0.95，具有更高的预测精度。

基于SDAE特征表示的协同主题回归推荐模型

谢国民，张婷婷，刘明，屠乃威，刘志邦

2019, 41(05): 924-932. doi:

摘要 ( 145 )

PDF (930KB) ( 234 ) 　　

为解决推荐系统中的冷启动问题，在协同主题回归CTR模型的基础上引入堆叠去噪自编码器SDAE深度学习网络，用于学习用户辅助信息的隐表示，建立SDAECTR模型。模型应用2层SDAE网络，以用户信息为网络输入量，将编码过程获得的用户辅助信息的隐表示和解码过程获得的输入近似表示为网络的双输出量，最小化用户辅助信息和近似表示的差值来确定最优隐表示。模型融合用户-项目评分矩阵（冷启动条件无评分）、项目内容信息和用户辅助信息实现用户对未评分项目的评分预测，并在LastFM、Book Crossing和MovieLens数据集上从推荐准确度、新颖性和用户冷启动条件下的推荐效果等3方面对SDAECTR模型和CTR模型进行比较。结果表明，SDAE-CTR模型在冷启动或非冷启动的条件下，推荐效果都要优于CTR模型的，虽然新颖性较CTR模型稍微逊色一些，但理论上在合理的范围内，总体上SDAECTR模型表现较优。

基于汉字笔画与结构的特征字库构造及优化

宋春晓，黄峰，靳松清，白晓东，仇宏斌，姜杰，李艺

2019, 41(05): 933-941. doi:

摘要 ( 110 )

PDF (1160KB) ( 355 ) 　　

以GB2312标准的6 763个汉字为例，首先以笔画骨架点集形式制作楷体字库标准模板；而后以同种形式采集书写者的45个手写汉字，从中提取笔画和部件等字素，计算基本书写特征并将其赋予标准字库模板，从而初步构造出该书写者的基本特征字库；接着利用机器学习的SVM和KNN方法，针对45个例字，对不同书写者例字集的结构特征进行计算，将所得结构特征赋予上述基本特征字库，最终得到书写者的个性特征字库，此即谓“优化”。最后进行的主观判断实验说明，优化后的字库有更高的接受度，本方法有望大大降低个性化字库的制作难度，降低书写者输入压力，缩短字库制作时间，节约字库制作成本。

人工鱼群与遗传混合算法在无人艇路径规划中的应用

梁雪慧1，2，赵嘉祺2

2019, 41(05): 942-947. doi:

摘要 ( 162 )

PDF (705KB) ( 262 ) 　　

为了使水环境监测无人艇在监测和采集水样时能有效躲避静态障碍物，且以最优或接近最优的路径行进，提出了一种变步长和变视野的自适应人工鱼群算法与改进遗传算法混合的策略，在人工鱼完成觅食、追尾、聚群等行为后，进行遗传算法的操作。通过指数函数型衰减函数使算法前期视野和步长很大，后期视野和步长很小，提高算法的运行效率和精确性；在基本遗传算法中加入精英选择策略和保护、淘汰算子，得到全局最优解。仿真结果表明，混合算法有效克服了单一算法容易局部收敛的缺点，收敛速度快，能有效得到最优路径，计算精度高。

语音驱动自适应协同系统的决策方法

张晓冰1,2，杨启亮1，薛广通1

2019, 41(05): 948-954. doi:

摘要 ( 122 )

PDF (671KB) ( 278 ) 　　

语音驱动的自适应协同系统应用日趋广泛，语音式任务目标具有的模糊性给自适应协同带来了挑战，自适应协同系统如何针对带有模糊性的语音进行任务决策是亟待解决的问题。为此，提出语音驱动的模糊自适应协同框架和决策方法。首先基于市场拍卖机制进行任务发布、投标和决策；然后把多属性的数据信息转化为二元语义并借助VIKOR方法进行排序；最后通过异构机器人自适应协同应用案例，说明了所提方法的决策步骤，表明了所提方法的有效性。

当期目录

作者中心

审稿中心

在线期刊