计算机工程与科学

2019年第10期目录

2019, 41(10): 0-0. doi:

摘要 ( 65 )

PDF (292KB) ( 236 ) 　　

评审附件

基于MapReduce和Spark的大数据主动学习比较研究

翟俊海1,2，齐家兴1,2,沈矗1,2,宋丹丹1,2,王谟瀚1,2,田石1,2

2019, 41(10): 1715-1722. doi:

摘要 ( 172 )

PDF (925KB) ( 331 ) 　　

评审附件

在我们以前的工作中，提出了基于MapReduce的大数据主动学习算法。在本文中，将这一算法移植到Spark环境，提出了基于Spark的大数据主动学习算法，并对基于MapReduce和Spark的2种大数据主动学习算法从运行时间、文件数目、同步数目和内存耗费4个方面进行了比较研究，得出了一些有价值的结论，这些结论将为相关研究人员提供很好的帮助。

基于Spark的并行化高效用项集挖掘算法

何登平1，2，3，何宗浩1,2，李培强1,2

2019, 41(10): 1723-1730. doi:

摘要 ( 197 )

PDF (654KB) ( 350 ) 　　

评审附件

针对传统基于链表结构的Top-K高效用挖掘算法在大数据环境下不能满足挖掘需求的问题，提出一种基于Spark的并行化高效用项集挖掘算法(STKO)。首先从阈值提升、搜索空间缩小等方面对TKO算法进行改进；然后选择Spark平台，改变原有数据存储结构，利用广播变量优化迭代过程，在避免大量重新计算的同时使用负载均衡思想实现Top-K高效用项集的并行挖掘。实验结果表明，该并行算法能有效地挖掘出大数据集中的高效用项集。

基于以太网和PCIe的多核DSP开发平台

张象羽，施慧莉

2019, 41(10): 1731-1737. doi:

摘要 ( 162 )

PDF (957KB) ( 302 ) 　　

评审附件

多核数字信号处理器（DSP）在航空、航天等领域的信号处理系统中应用较广泛，在实际工程应用时，由于JTAG接口的性能限制，存在速度慢、不稳定、难操作等问题，导致开发效率低下并严重影响项目进度。建立了一种以千兆以太网和PCIe作为加载和调试接口的多核DSP软硬件开发平台，包括标准化的硬件模块和软件开发环境，具有易重构、易扩展、不再依赖JTAG接口、兼容多个软件操作系统、资源占用低等优点。以多核DSP TMS320C 6678为例，描述了多片DSP组成的信号处理系统开发中的关键技术，包括商用标准（COTS）模块、系统架构、硬件诊断、软件加载、软件调试等。用该平台可以显著降低使用门槛，大幅度提高开发效率。

基于复合物参与度和密度的关键蛋白质预测

毛伊敏，刘银萍

2019, 41(10): 1738-1748. doi:

摘要 ( 162 )

PDF (1090KB) ( 293 ) 　　

评审附件

针对在蛋白质相互作用网络上的关键蛋白质识别只关注拓扑特性，蛋白质相互作用数据中存在较高比例的假阳性数据以及基于复合物信息的关键蛋白质识别算法对节点的邻域信息和复合物的挖掘对关键蛋白质的识别影响效果考虑不够全面等导致的识别准确率和特异性不高的问题，提出一种基于复合物参与度和密度的关键蛋白质预测算法PEC。首先融合GO注释信息和边聚集系数构造加权PPI网络，克服假阳性对实验结果的影响；基于蛋白质相互作用的边权重，构造相似度矩阵，设计特征值间的最大本征差值来自动确定划分数目K，同时根据加权网络中的蛋白质节点度来选取K个初始聚类中心，进而利用谱聚类结合模糊C-means聚类算法实现复合物的挖掘，提高聚类的准确率，降低数据的维数；其次基于蛋白质节点的复合物参与度以及节点邻域子图密度，设计出关键节点的关键性得分。在DIP和Krogan 2个数据集上，将PEC与
DC、BC、CC、SC、IC、PeC、WDC、LIDC、LBCC和UC 10种经典算法相比，实验结果表明，PEC算法能够识别出更多的关键蛋白质，且聚类结果的准确率和特异性较高。

SoC嵌入式存储器内建自修复方法

秦盼1，王健2，朱芳1，焦贵忠1

2019, 41(10): 1749-1754. doi:

摘要 ( 196 )

PDF (674KB) ( 327 ) 　　

评审附件

嵌入式存储器的内建自测试及修复是提高SoC芯片成品率的有效办法。详细描述了存储器良率的评估方法，提出了一种基于Mentor公司Tessent工具的存储器修复结构。

该结构采用了冗余修复及电可编程熔丝eFuse硬修复的方法，具有很好的通用性及可行性，已多次应用在实际项目中。

基于最短时间距离的校园无线网络用户关联性度量

李鑫健，刘漫丹

2019, 41(10): 1755-1762. doi:

摘要 ( 144 )

PDF (770KB) ( 270 ) 　　

在校园网络中，存在着大量的信息系统，记录着用户的日常行为信息。通过对大量用户的日常轨迹信息分析，可以发现用户之间的行为关联性，度量用户之间的社会关系强度。基于上海某校的校园网络数据特点，提出了一种改进的基于用户时间序列模型，用最短时间距离进行社会关系度量的方法。该方法首先依据用户的行为数据生成用户行为时间序列，并在此基础上进行行为关联性的度量，以反映用户在真实世界中的社会关系强度，并利用地点访问热度修正社会关系强度的分析结果。实验中使用该方法对上海某校的校园网数据进行分析，度量用户关联性强度，验证了该方法的有效性。

基于面部动作时空特征的疲劳预警算法

郁松，卢霖胤

2019, 41(10): 1763-1770. doi:

摘要 ( 218 )

PDF (978KB) ( 315 ) 　　

目前疲劳预警算法多采用实时监测报警的方式，这在高速行驶中具有很大的安全隐患。鉴于人类疲劳状态的时序相关性，提出一种基于面部动作时空特征提取的预警算法。首先，构建加入空间变换结构的卷积神经网络，识别人脸区域，对脸部特征点进行检测标记；其次，建立时空特征提取网络，利用采集的人脸图像序列，对未来图像序列进行预测并输出；最后，在输出的图像序列中根据眼部、嘴部综合状态判断是否发出警告。实验结果表明，以15 fps的速率采集图像，预测未来2 s 30帧图像的方式下，该算法能以90%以上的准确率提前26帧（约1.5 s）预警，且提前15帧（1 s）预警的准确率达到97%。在我国高速公路平均100 km/h的车速下，相当于提前40 m预警，能进一步减少交通事故的发生。

一种多网络模型融合的烟雾检测方法

王洋1,程江华1,刘通1,周岳勇1,熊艳晔2

2019, 41(10): 1771-1776. doi:

摘要 ( 212 )

PDF (824KB) ( 306 ) 　　

为降低云雾等类烟雾目标引起的烟雾检测虚警现象，提出一种多网络模型融合的烟雾检测方法。在采用VGG16网络提取烟雾细节特征的基础上，与ResNet50网络特征提取层进行融合，提取到更多细微特征，采用跳跃连接机制将图像信息传递到神经网络的更深层，避免烟雾图像重要特征的丢失，并解决因梯度消失导致的欠拟合问题。训练过程采用基于同构空间下的特征迁移学习方法，解决小样本训练难题，在新的目标检测领域进行重新训练，更有利于将网络模型融合，重新搭建全连接层输出检测结构，采用随机失活的方法，提高模型泛化能力。实验结果表明，与目前流行的深度卷积网络相比，该方法虚警率低，准确率和召回率高。

融合结构与属性相似性的加权图聚集算法

邴睿1，马慧芳1,2,3，刘宇航1，余丽1

2019, 41(10): 1777-1784. doi:

摘要 ( 191 )

PDF (890KB) ( 320 ) 　　

图聚集技术是将一个大规模图用简洁的小规模图来表示，同时保留原始图的结构和属性信息的技术。现有算法未同时考虑节点的属性信息与边的权重信息，导致图聚集后与原始图存在较大差异。因此,提出一种同时考虑节点属性信息与边权重信息的图聚集算法，使得聚集图既保留了节点属性相似度又保留了边权重信息。该算法首先定义了闭邻域结构相似度，通过一种剪枝策略来计算节点之间的结构相似度；其次使用最小哈希(MinHash)技术计算节点之间的属性相似度，并调节结构相似与属性相似所占的比例；最后，根据2方面相似度的大小对加权图进行聚集。实验表明了该算法可行且有效。

图像差与加权核范数最小化的压缩图像融合

苏金凤，张贵仓，汪凯

2019, 41(10): 1785-1794. doi:

摘要 ( 209 )

PDF (1004KB) ( 343 ) 　　

现有的图像融合算法存在非线性操作产生的噪声干扰和空间复杂度高等问题，使得融合图像易失真和丢失信息。一些学者提出的压缩感知图像融合算法能有效改善这一问题，但大多忽略了图像矩阵的低秩性，往往会降低融合质量。由此，将压缩感知融合技术与低秩矩阵逼近方法相结合，提出基于信息论图像差与自适应加权核范数最小化的图像融合算法。该算法由3个阶段组成。首先，将2幅源图像通过小波稀疏基稀疏化，并利用结构随机矩阵压缩采样，得到测量输出矩阵。然后，将测量输出矩阵进行分块，再利用图像差融合算法得到融合后的测量输出矩阵块。最后，利用自适应加权核范数最小化优化得到的块权重，通过正交匹配追踪法重建融合图像。实验结果表明了该算法的有效性和普适性，并且在多种评价指标上优于其他融合算法。

改进STC和SURF特征联合优化的目标跟踪算法

黄云明1，张晶1,2，喻小惠1，陶涛3，龚力波4

2019, 41(10): 1795-1802. doi:

摘要 ( 159 )

PDF (1253KB) ( 290 ) 　　

针对传统时空上下文目标跟踪（STC）算法中目标窗口不能适应目标尺度变化，导致对目标针对性不强等问题，提出改进STC和SURF特征联合优化的目标跟踪算法（STC-SURF）。首先利用加速稳健（SURF）特征算法对相邻的2帧图像提取特征点并进行匹配，再通过随机抽样一致（RANSAC）算法消除误匹配，
提高匹配精度。进而根据2帧图像中匹配特征点的变化对目标窗口进行调整。最终对STC算法中模型的更新方式进行优化以提高跟踪结果的准确性。实验结果表明，STC-SURF算法能够适应目标尺度变化，并且其目标跟踪成功率优于TLD算法和传统STC算法的。

混合特征下最优阈值预测的图像匹配

严春满，郝有菲，张迪，陈佳辉

2019, 41(10): 1803-1808. doi:

摘要 ( 165 )

PDF (784KB) ( 295 ) 　　

针对单一特征条件下图像匹配率较低，以及SIFT算法由于固定对比度阈值造成特征点数目提取不均的问题，提出一种混合特征下最优阈值预测的图像匹配算法。该算法首先采用SIFT算法提取图像特征点，然后利用纹理参数二阶矩自适应法得到最优阈值，并用描述性较强的纹理特征向量对SIFT匹配过程进行约束实现图像的匹配。实验结果表明，提出的算法根据图像灰度分布自适应选取对比度阈值，能够增强图像细节信息且使提取的特征点数量稳定，在匹配过程中引入纹理向量作为约束准则，避免了相似区域的误匹配，对光照和模糊图像有较好的鲁棒性。

基于改进绝对差值代价和动态窗口的立体匹配算法

柴钰，曹小京，刘杰

2019, 41(10): 1809-1815. doi:

摘要 ( 153 )

PDF (1059KB) ( 321 ) 　　

针对传统的SAD局部立体匹配容易引起幅度失真、存在匹配窗口大小选择困难等问题，提出一种改进SAD局部立体匹配算法。首先在传统的SAD算法的基础上，提出利用像素灰度间欧氏距离的大小关系代替像素差值作为相似度量函数，很好地利用了邻近像素灰度值之间的连续性约束；在极限约束条件下，提出引导滤波器的动态匹配窗口的建立，能够很好地保持边缘特性；最后经过左右一致性检测策略来检测匹配异常点，再进一步平滑去噪，求得最终的视差图。实验结果表明，本文算法效率高、匹配精度高，对光照失真条件和边缘信息较多、深度不连续区域具有更好的鲁棒性。

高分辨率遥感影像的多特征多核ELM分类方法

楚恒1,2,3,4，蔡衡1,2,3，单德明1,2,3

2019, 41(10): 1816-1822. doi:

摘要 ( 206 )

PDF (900KB) ( 246 ) 　　

针对高分辨率遥感影像地物分布复杂多变，利用ELM的快速分类性能，提出了一种ELM的多特征多核高分辨率遥感影像分类方法。首先利用多尺度分割算法将原始影像粗分为若干地物区域；然后依据区域合并准则对粗分割图像合并得到典型地物特征的对象信息，并提取分割对象的光谱特征与空间特征；最后以多种核函数加权组合的方式构建多核ELM对影像分类，获得最终的分类结果。实验结果表明，所提方法不仅降低了对目标训练样本的要求，同时还提高了分类的准确性、及时性和完整性。

基于密度权重Canopy的改进K-medoids算法

陈胜发，贾瑞玉

2019, 41(10): 1823-1828. doi:

摘要 ( 214 )

PDF (566KB) ( 262 ) 　　

为了提高K-medoids算法的精度和稳定性，并解决K-medoids算法的聚类数目需要人工给定和对初始聚类中心点敏感的问题，提出了基于密度权重Canopy的改进K-medoids算法。该算法首先计算数据集中每个样本点的密度值，选择密度值最大的样本点作为第1个聚类中心，并从数据集中删除这个密度簇；然后通过计算剩下样本点的权重，选择出其他聚类中心；最后将密度权重Canopy作为K-medoids的预处理过程，其结果作为K-medoids算法的聚类数目和初始聚类中心。UCI真实数据集和人工模拟数据集上的仿真实验表明，该算法具有较高的精度和较好的稳定性。

一种基于全局领域和短期记忆因子的图模型

邵玉涵，李培培，胡学钢

2019, 41(10): 1829-1836. doi:

摘要 ( 114 )

PDF (767KB) ( 263 ) 　　

词义消歧是一项具有挑战性的自然语言处理难题。作为词义消歧中的一种优秀的半监督消歧算法，遗传蚁群词义消歧算法能快速进行全文词义消歧。该算法采用了一种局部上下文的图模型来表示语义关系，以此进行词义消歧。然而，在消歧过程中却丢失了全局语义信息，出现了消歧结果冲突的问题，导致算法精度降低。因此，
提出了一种基于全局领域和短期记忆因子改进的图模型来表示语义以解决这个问题。该图模型引入了全局领域信息，增强了图对全局语义信息的处理能力。同时根据人的短期记忆原理，在模型中引入了短期记忆因子，增强了语义间的线性关系，避免了消歧结果冲突对词义消歧的影响。大量实验结果表明：与经典词义消歧算法相比，所提的改进图模型提高了词义消歧的精度。

基于边缘的双路卷积神经网络及其可视化

李雨冲，闫昭帆，严国萍

2019, 41(10): 1837-1845. doi:

摘要 ( 167 )

PDF (869KB) ( 350 ) 　　

为提高小尺度复杂图像识别准确率，通过对LeNet-5卷积神经网络并入一个新通道，让其处理与边缘有关的信息。结合两种通道产生的不同特征构造分类器，提出一种基于边缘的双路卷积神经网络，对小尺度复杂数据集进行识别。在包含10类产品数据上分类的结果表明，双路卷积神经网络的识别准确率远高于传统网络。最后通过神经网络可视化算法对双路卷积神经网络进行了可视化分析。

基于专家信任的协同过滤推荐算法改进研究

刘国丽，白晓霞，廉孟杰，张斌

2019, 41(10): 1846-1853. doi:

摘要 ( 172 )

PDF (645KB) ( 293 ) 　　

针对目前协同过滤推荐算法存在的冷启动、数据稀疏、可扩展性不高以及未考虑到不同社区簇之间可能存在相关性导致的推荐准确度低的问题，提出了一种在考虑同社区簇内专家信任基础上结合不同社区簇专家信任的推荐算法。在改进相似度计算时，改进算法不仅结合了Jaccard相关系数、用户的平均评分因子以及加权处理的Pearson相关系数，还结合了用来惩罚热门物品权重的流行度。在改进评分预测时，改进算法在引入了传统聚类推荐算法中的同社区簇专家信任后，还引入了不同社区簇专家信任。实验在MovieLens数据集上进行，实验结果表明，改进算法不仅缓解了冷启动和数据稀疏等问题，还显著提高了推荐准确度。

基于局部正、负标记相关性的k近邻多标记分类新算法

蒋芸，肖潇，侯金泉，陈莉

2019, 41(10): 1854-1860. doi:

摘要 ( 134 )

PDF (781KB) ( 260 ) 　　

在多标记学习中，每个样本都由一个实例表示，并与多个类标记相关联。现有的多标记学习算法大多是在全局利用标记相关性，即假设所有的样本共享不同类别标记之间的正相关性。然而，在实际应用中，不同的样本共享不同的标记相关性，标记间不仅存在正相关性，而且存在相互排斥的现象，即负相关性。针对这一问题，提出了基于局部正、负成对标记相关性的k近邻多标记分类算法PNLC。首先，对多标记数据的特征向量进行预处理，分别为每类标记构造对该类标记最具有判别能力的属性特征；然后，在训练阶段，PNLC算法通过所有训练样本中各样本的每个k近邻的真实标记构建标记之间的正、负局部成对相关性矩阵；最后，在测试阶段，首先得到每个测试样例的k近邻及其对应的正、负成对标记关系，利用该标记关系计算最大后验概率对测试样例进行预测。实验结果表明，PNLC算法在yeast和image数据集上的分类准确率明显优于其他常用的多标记分类算法。

一种领域知识图谱的本体根类型设计

王亚强1,2，臧根林1,2，吴庆蓉1,2，占春丽1,2，谢新扬1,2

2019, 41(10): 1861-1867. doi:

摘要 ( 154 )

PDF (749KB) ( 302 ) 　　

对象根类型的分类是构建领域知识图谱的基础工作，而现有流行的公共知识库并没有按照领域数据的特点分类，如SUMO的唯一的根类型就是实体，使得领域知识表达存在一定挑战，无法完整地表达如文本、视频图片等知识和关联。领域知识图谱本体的对象根类型除了实体类型，还应增加事件类型、文本类型和多媒体类型，基于4种根类型再扩展到具体分类来表达领域的知识，采用这种方式，可以更好地描述各种典型的领域场景，在实际知识图谱的工具研发中，体现出良好的知识体系和清晰的分类思路。

基于投射的藏语语义依存分析研究

夏吾吉1,2，华却才让1

2019, 41(10): 1868-1873. doi:

摘要 ( 157 )

PDF (711KB) ( 247 ) 　　

藏语是语序非常灵活的一种语言，藏语词法分析和句法分析等浅层研究不能很好地满足藏语自然语言理解的需求。从简单句型的藏语句子出发，研究了基于投射的藏语语义依存分析，构建了藏语语义依存树库，设计了语义依存弧类型分析特征模板。最后通过最大熵分类模型，对人工分析过的语义依存弧的句子进行依存弧的类型分析并进行标注，为今后的语义依存分析提供新的思考视角和更好的理论支撑。

A*估价函数在复杂配送路径优化中的改进

李世明1,2,王玉芬1,张秉桢1,李秋月1

2019, 41(10): 1874-1881. doi:

摘要 ( 205 )

PDF (1183KB) ( 277 ) 　　

随着城市交通日趋复杂，时间和路径成本直接决定路径规划的效果，但传统的A*算法已经不能满足复杂路径优化的需求。对此，提出了一种TWA*算法，在传统的A*算法基础上对其估价函数进行了改进。首先，通过时间参数建立时间因子归一化模型来提高节点被选择概率，节约时间成本；其次，结合时间因子与估价函数降低路程成本。实验采用北京市某一区域GPS数据，分别用A*算法和TWA*算法进行验证，结果表明，与传统A*算法相比，TWA*算法在时间及路径成本上分别提高了约6%和5%，达到了路径优化的目的，同时为企业物流的高效配送提供了较可靠的参考依据。

Beam-PSO优化算法在多行程车辆路径问题的应用

宋强

2019, 41(10): 1882-1891. doi:

摘要 ( 205 )

PDF (1039KB) ( 296 ) 　　

评审附件

针对城市物流配送系统，研究了一类带时间窗和释放时间约束的多行程车辆路径问题。首先，对该运输调度问题进行了描述，构建了以总配送时长最小化为目标的数学模型。其次，为了快速获得问题的满意解，提出了Beam-PSO优化算法。在算法设计中，结合该问题的性质，构建了基于随机键的编解码方法，以克服标准粒子群算法无法直接适用于求解离散问题的不足。同时，设计了基于Beam search优化技术的局部搜索流程，用于强化算法的优化性能。最后，进行了仿真实验，实验结果表明了Beam-PSO优化算法的可行性和有效性。

超前采样时间迭代学习的下肢康复机器人轨迹跟踪控制

于振中，谷华航

2019, 41(10): 1892-1898. doi:

摘要 ( 152 )

PDF (1218KB) ( 284 ) 　　

评审附件

为了实现下肢康复机器人在康复训练过程中高精度的末端轨迹跟踪控制，提出了一种利用超前采样时间的鲁棒自适应迭代学习控制方法。所述超前采样时间迭代算法，是指利用之前运行批次在t+Δ采样时刻的髋膝关节力矩输出，优化调整下一次运行时刻t处的关节力矩给定。仿真结果表明，采用超前采样时间迭代控制，末端轨迹误差具有更快的收敛速度和跟踪精度，并且具有较好的抗干扰性能。

基于AP聚类的约简孪生支持向量机快速分类算法

韦修喜1，黄华娟1，周永权1,2

2019, 41(10): 1899-1904. doi:

摘要 ( 141 )

PDF (567KB) ( 245 ) 　　

评审附件

孪生支持向量机TWSVMs分类过程的计算量和样本的数量成正比，当样本个数较多时，其分类过程将会比较耗时。为了提高样本集的稀疏性，从而提高TWSVMs的分类速度，提出了一种基于AP聚类的约简孪生支持向量机快速分类算法FCTSVMs-AP。首先对原始数据集进行AP聚类操作。聚类的中心为约简后新的样本集，按照分类误差最小的原则构建优化模型，用二次规划方法求解新的决策函数的系数，并证明了当样本集压缩时，收紧新的快速决策函数和原始决策函数之间的误差等价于在样本空间对原始数据集进行AP聚类操作。在人工数据集和UCI数据集上的实验表明，保持分类精度的损失在统计意义上不明显的前提下，FCTSVMs-AP可以通过有效压缩样本数量的方式提高分类速度。

当期目录

作者中心

审稿中心

在线期刊