计算机工程与科学

2018年第10期目录

2018, 40(10): 0-0. doi:

摘要 ( 25 )

PDF (286KB) ( 84 ) 　　

评审附件

并行动态位向量频繁闭合序列模式挖掘算法

陈倩,刘云,高钰莹

2018, 40(10): 1717-1725. doi:

摘要 ( 383 )

PDF (1035KB) ( 581 ) 　　

针对在时间和空间上都具有高计算成本的长序列数据库,一个更有效和更紧凑且可以完全提取信息的挖掘模式是当前的研究热点。提出一种并行动态位向量频繁闭合序列模式的挖掘算法（PDBVFCSP）,该算法采用多核处理器架构和DBV数据结构相结合的方式,有效加快了序列数据库的处理速度,并对搜索空间进行划分,尽早执行预处理序列的闭合检查,减少了所需的存储空间和挖掘频繁闭合序列模式的执行时间,克服了现有并行挖掘算法通信开销、同步和数据复制等问题。利用重新分配工作的动态负载平衡机制,解决处理器之间的负载均衡问题,最大限度地减少了CPU空闲时间。对DBVVDF算法和PDBVFCSP（24核）算法进行仿真比较,结果表明,PDBVFCSP算法在运行时间、内存使用和可伸缩性等方面都有较优的性能提升,且当内核数增加时,性能更优。

基于飞腾处理器的瘦客户机散热结构设计

李红,李俊,龚国辉

2018, 40(10): 1726-1730. doi:

摘要 ( 606 )

PDF (557KB) ( 743 ) 　　

评审附件

基于目前国产处理器的瘦客户机整机功耗相对较高,利用常用的无风扇散热的被动散热方式在整机散热性能方面稍显不足,尤其是存在散热死区,从而设计了一种基于飞腾四核处理器的瘦客户机。该瘦客户机采用双散热模组设计,采用4个进风道和2个出风道设计,使得机体内部无散热死区,实现整机超强的散热性能。温度测试数据表明：在25℃环境中,机器满负荷工况运行时,机体内各测试点的温度均在52℃以内,满足所有元器件的工作温度要求；同时,机器箱体外表面温度低于36℃,用户体验感良好。

基于标签自适应选择的矩阵分解推荐算法

宋威1,2,李雪松1

2018, 40(10): 1731-1736. doi:

摘要 ( 673 )

PDF (484KB) ( 408 ) 　　

评审附件

将标签融入矩阵分解方法是当前推荐系统研究的热点。提出了一种基于标签自适应选择的矩阵分解推荐算法。首先,提出了标签评分稀疏系数,较好地平衡了推荐过程中潜在特征与标签的使用问题。其次,利用标签的次数来计算标签向量,体现了标签的不同频率对不同物品的影响。最后,给出了算法的总体描述。实验结果表明,算法具有较高的推荐精度和较快的收敛速度。

基于BTM主题模型的Web服务聚类方法研究

陈婷1,2,刘建勋1,2,曹步清1,2,李润2

2018, 40(10): 1737-1745. doi:

摘要 ( 673 )

PDF (731KB) ( 516 ) 　　

评审附件

针对网络中海量的Web服务聚类时,因其表征数据稀疏而导致使用传统建模方法所获效果不理想的问题,提出了一种基于BTM主题模型的Web服务聚类方法。该方法首先利用BTM学习整个Web服务描述文档集的隐含主题,通过推理得出每篇文档的主题分布,然后应用KMeans算法对Web服务进行聚类。通过与LDA、TFIDF等方法进行对比发现,该方法在聚类纯度、熵和FMeasure指标上均具有更好的效果。实验表明，该方法能够有效解决因Web服务描述所具有的短文本性质而导致的数据稀疏性问题,可显著提高服务聚类效果。

基于机器学习的流量识别技术综述与展望

赵双,陈曙晖

2018, 40(10): 1746-1756. doi:

摘要 ( 815 )

PDF (569KB) ( 1504 ) 　　

流量识别是实现网络管理与网络安全的关键环节。随着基于端口号和深度包检测两种流量识别方法相继失效,基于机器学习的流量识别技术成为近十年流量识别领域最受关注的方法。鉴于流量识别技术的重要性,首先介绍流量识别技术的概况及相关基本概念,包括其应用场景、输入对象、识别类型及评价指标。然后详述机器学习背景下,流量识别过程中的数据集获取、特征提取与选择、识别模型设计等关键技术的进展,并对近年主要研究工作进行总结和比较。最后对基于机器学习的流量识别技术面临的主要挑战及未来的发展方向进行探讨与展望。

OpenFlow协议IPv6属性测试研究

李元平1,3,李华1,2,赵俊岚3,阮宏玮1

2018, 40(10): 1757-1765. doi:

摘要 ( 790 )

PDF (1168KB) ( 376 ) 　　

鉴于SDN网络中数据转发与控制相互分离的特性，OpenFlow协议在其南向接口中扮演着重要的角色。随着下一代互联网的发展，IPv4可供分配的地址资源已然耗尽，瓶颈地位益发凸显。如何尽快部署IPv6，使其服务于社会生产与生活，使得当前网络与IPv6网络长期共存或平滑过渡到IPv6网络是工业界与学术界要解决的问题。SDN则提供了这样一个选项，其中OpenFlow协议是否支持IPv6协议便成为我们关注的重点。通过形式化方法对OpenFlow协议进行形式化建模，得到其非确定性有限状态机模型，在此基础上得到其测试生成树，以指导测试。同时，对于其是否支持IPv6进行重点关注，利用组合测试的方法，产生了167条测试例。
完成了测试引擎的开发，支持高效的测试生成算法，以及测试执行与判定。利用此测试引擎，以上述测试例为测试输入，执行测试过程，同时进一步对测试结果进行分析，得到了定量的分析结果，符合预期要求。

WSN的极坐标最小能耗覆盖空洞修复算法

崔丽珍，李晓宇，胡海东，高丽丽

2018, 40(10): 1766-1771. doi:

摘要 ( 609 )

PDF (735KB) ( 445 ) 　　

针对混合无线传感器网络中的覆盖空洞问题，提出了一种基于极坐标的空洞修复算法。首先，通过计算静态节点感知圆交叉点的位置确定空洞边界点，连接空洞边界点构造空洞多边形；其次，按照极坐标方法计算每个空洞多边形中的虚拟修复节点位置；最后，建立虚拟修复节点与移动节点之间的距离数据表，将表中移动节点移动到与之匹配的虚拟节点位置上，完成空洞修复。仿真结果表明，该算法能够有效判定并修复网络中的覆盖空洞，相比同类算法，所需移动修复节点数量较少，移动节点平均移动距离较短，在提高网络覆盖质量的同时延长了网络的生存周期。

一种基于Slant变换和SVD的稳健性数字水印算法

肖振久，郭冰莹，李南，唐晓亮

2018, 40(10): 1772-1779. doi:

摘要 ( 767 )

PDF (997KB) ( 446 ) 　　

针对奇异值分解(SVD)存在的虚警错误和水印隐蔽性与鲁棒性的矛盾问题，提出了一种基于Slant变换和SVD的稳健性数字水印算法。对二值水印图像进行Arnold置乱和Logistic映射双因子加密预处理，增强水印信息安全性；将原始载体图像分成8×8不重叠子块分别对其进行Slant变换和块奇异值分解；然后将水印图像SVD后的左奇异矩阵和奇异值矩阵相乘作为水印主成分嵌入到每个子块的最大奇异值中。仿真实验结果表明，该算法不仅有效解决了传统SVD水印算法的虚警问题，提升了运行速度和水印安全性，在具有较好隐蔽性的同时，对JPEG压缩、噪声、滤波、几何攻击等也有较好的稳健性。

结构化公开加密密钥支撑群组密钥操作研究

周健1，2，孙丽艳1，陈红琳1

2018, 40(10): 1780-1786. doi:

摘要 ( 410 )

PDF (472KB) ( 392 ) 　　

加密解密协议中的单加密解密密钥结构不能满足群组密钥管理的性能需要，公开加密密钥更新导致全部解密密钥更新。针对这一问题，提出结构化公开加密密钥组织结构，满足密钥独立性的群组解密密钥集合成员具有有限修改公开加密密钥的能力，使得群组成员在无可信中心支持下采用自配置方式更新公开加密密钥，更新后的公开加密密钥不会破坏非更新成员解密密钥的合法性。给出的公钥结构丰富了解密密钥和加密密钥之间的关系，扩展了群组密钥操作，适合环境苛刻的网络群组密钥管理。

基于代价敏感支持向量机的软件缺陷预测研究

任胜兵，廖湘荡

2018, 40(10): 1787-1795. doi:

摘要 ( 730 )

PDF (786KB) ( 497 ) 　　

软件缺陷预测是典型的非平衡学习问题。基于CSSVM和聚类算法改进代价敏感支持向量机（SVM）算法，提出了CCSSVM软件缺陷预测模型。在CCSSVM预测模型中，将SVM与类别误分代价结合起来，以非平衡数据评价指标作为目标函数，优化错分代价因子，提升少数类样本的识别率。通过聚类找到每类样本的中心点，根据样本到其中心点的距离定义每个样本的类别置信度，给每个样本分配不同的误分代价系数，并把样本的置信度引入到代价敏感SVM优化问题中，提高算法鲁棒性，提升SVM分类性能。此外，为了提高模型的泛化能力，使用遗传算法优化特征选择和模型参数。通过美国航空航天局NASA MDP数据集实验表明，本文方法的Gmean和Fmeasure模型评价值有明显的提升。

基于深度自编码网络的软件缺陷预测方法

周末，徐玲，杨梦宁，廖胜平，鄢萌

2018, 40(10): 1796-1804. doi:

摘要 ( 1122 )

PDF (941KB) ( 660 ) 　　

软件缺陷预测是提升软件质量的有效方法，而软件缺陷预测方法的预测效果与数据集自身的特点有着密切的相关性。针对软件缺陷预测中数据集特征信息冗余、维度过大的问题，结合深度学习对数据特征强大的学习能力，提出了一种基于深度自编码网络的软件缺陷预测方法。该方法首先使用一种基于无监督学习的采样方法对6个开源项目数据集进行采样，解决了数据集中类不平衡问题；然后训练出一个深度自编码网络模型。该模型能对数据集进行特征降维，模型的最后使用了三种分类器进行连接，该模型使用降维后的训练集训练分类器，最后用测试集进行预测。实验结果表明，该方法在维数较大、特征信息冗余的数据集上的预测性能要优于基准的软件缺陷预测模型和基于现有的特征提取方法的软件缺陷预测模型，并且适用于不同分类算法。

基于社会-技术属性的软件服务活跃度分析

何鹏1,刘雅新1,李兵2,曾诚1

2018, 40(10): 1805-1814. doi:

摘要 ( 833 )

PDF (1077KB) ( 416 ) 　　

开源环境下,软件作为一类粗粒度的服务供用户使用和二次开发,其活跃程度反映了软件服务的发展状态,理解影响软件服务活跃度的因素是提高社区软件服务质量至关重要的一步。以SourceForge开源社区为研究对象,以软件服务的下载量、页面规模和点击量作为衡量软件服务活跃度的指标,分别从社会技术属性角度来探究对开源软件服务的活跃度影响。研究结果表明：（1）软件服务要取得较好的活跃度,在核心人员组织上要规模适当（17人左右）,为确保成员的实际贡献力度,可同时参与的软件服务控制在7个以内,成员的角色应尽可能多且分布越均匀越好；（2）越成熟的软件服务倾向于越活跃,而其他技术属性的影响差异不明显且与它们的流行度无关,但它们的多样性与软件服务活跃度呈显著线性相关。

利用佳点集遗传算法的白盒测试用例优先排序

孙家泽1,2,王刚1

2018, 40(10): 1815-1821. doi:

摘要 ( 594 )

PDF (1024KB) ( 475 ) 　　

在软件演化过程中,测试用例优先排序作为一种高效实用的回归测试技术,对于提高缺陷的早期检测速率和降低测试成本有重要意义。针对传统遗传算法在白盒测试用例优先排序中收敛速度慢和稳定性差的问题,采用佳点集遗传算法求解白盒测试用例优先排序问题。算法根据程序实体覆盖矩阵对个体进行编码,以程序实体覆盖平均百分比作为适应度函数,采用随机抽样选择算子和佳点集交叉算子产生新一代种群。实验选择6个典型的基准开源项目,以语句、分支和方法作为程序实体,实验结果表明佳点集遗传算法收敛速度快、稳定性好,为回归测试提供了一个有效的测试用例优先排序方法,有助于尽早发现软件缺陷,降低测试成本。

基于增补小波变换和PCNN的NSCT域图像融合算法

王健1,2,张修飞1,任萍1,院文乐1

2018, 40(10): 1822-1828. doi:

摘要 ( 517 )

PDF (817KB) ( 426 ) 　　

针对传统NSCT图像融合算法存在的不足,提出一种基于增补小波变换和PCNN的NSCT域图像融合算法。首先对源图像进行NSCT分解,生成一系列低频和高频分量。对低频分量利用二维小波分解,生成一个低频和三个方向分量,对低频分量利用局部区域能量加权方法融合,三个方向分量利用改进的高斯加权SML方法融合；对NSCT分解的高频分量,分为对最高层和其它层的融合,最高层利用改进的高斯加权SML方法融合,其余层利用边缘梯度信息激励PCNN方法融合。最后对NSCT进行逆变换得到融合图像。实验结果证实了所提算法的有效性。

基于选择性搜索算法的车脸部件检测

李熙莹1,2,3,4,周智豪1,2,3,4,吕硕1,2,3,4

2018, 40(10): 1829-1836. doi:

摘要 ( 611 )

PDF (802KB) ( 451 ) 　　

车脸部件检测能够广泛地应用于车辆识别及车辆的语义分割。尽管对于车脸的检测已经做出过大量的努力,但现有的研究大多集中在车脸的整块区域的检测及定位,提出了一种基于选择性搜索的车脸部件检测算法。该算法分为两个阶段：首先,将车辆图片进行高斯滤波去噪以及图像归一化预处理。其次,对预处理后的图片,利用基于图表示的图像分割算法获取初始分割区域,计算两两相邻区域在颜色、纹理、大小及吻合度之间的相似度;随后利用初始分割区域相邻区域间的颜色、纹理、大小以及吻合度的相似性对初始分割区域进行合并,从而准确分割车脸各部件。采用部分香港中文大学的公开数据集CompCars,总计4 199张图像,作为测试样本以测试车脸部件分割检测效果。实验结果表明,该算法检测车脸部件的平均重合度达到73.74%,明显胜过其它目标检测算法,此外,该算法不需训练,具有更强的通用性。

利用变精度粗糙熵的图像分割算法

吴尚智1，佘志用2，张霞1，赵慧琴3

2018, 40(10): 1837-1843. doi:

摘要 ( 1257 )

PDF (548KB) ( 428 ) 　　

图像分割是把图像分成若干个特定的、具有独特性质的区域并提取感兴趣目标的技术和过程，其结果将直接影响到目标物特征提取和描述，以及更进一步的目标物识别、分类和图像理解。因图像信息的复杂性和相关性，图像分割会出现不确定性和模糊性。图像用变精度粗糙集表示，结合粗糙熵和粒子群优化算法，提出变精度粗糙熵的图像分割算法，求出最大粗糙熵对应的最佳分割阈值，再用二值分割法对图像进行分割。实验结果表明，所提算法优于传统的单阈值分割法，且具有一定实用性和灵活性。

基于集成学习与位置信息约束的前方车辆检测

耿磊1,2，彭晓帅1,2，肖志涛1,2，李秀艳1,2，甘鹏1,2

2018, 40(10): 1844-1850. doi:

摘要 ( 800 )

PDF (1057KB) ( 375 ) 　　

针对传统前方车辆检测方法难以同时满足准确性与实时性问题，提出一种结合AdaBoost集成学习与位置信息约束的车辆检测方法。首先，利用Edge Boxes算法根据车辆边缘序列信息计算推荐窗口。然后，通过帧存坐标系中车辆位置信息对非目标推荐窗口进行排除。最后，将过滤后窗口聚类处理并择优选取作为AdaBoost分类器输入，进行检测评判，并对最终检测结果进行边框回归处理，以提升检测精准度。实验结果表明，该方法对于不同检测场景有较强鲁棒性，能够同时满足车辆检测的准确性与实时性要求。

基于半监督LDA特征子空间优化的人脸识别算法

纪明君，刘漫丹，才乐千

2018, 40(10): 1851-1857. doi:

摘要 ( 1019 )

PDF (785KB) ( 400 ) 　　

人脸特征提取是人脸识别流程最重要的步骤，特征的好坏直接影响了识别效果。为了得到更好的人脸识别效果，需要充分利用样本的信息。为了充分利用训练样本和测试样本包含的信息，提出了利用样本散度矩阵将主成分分析PCA算法和线性判别分析LDA算法加权组合的半监督LDA（SLDA）特征提取算法。同时，受组合优化问题的启发，利用二进制遗传算法对半监督特征提取算法得到的特征空间进行优化。在ORL人脸数据库上的实验结果表明：与人脸识别经典算法和部分改进算法相比，SLDA算法获得了更高的识别率。

特征聚类自适应变组稀疏自编码网络及图像识别

肖汉雄，陈秀宏，田进

2018, 40(10): 1858-1866. doi:

摘要 ( 494 )

PDF (1216KB) ( 419 ) 　　

由于缺乏先验信息，组Lasso模型在训练时仅是基于组数参数对单元进行均匀、连续、固定的分组，缺乏分组依据，容易造成变量组结构的有偏估计。为此，提出特征聚类自适应变组稀疏自编码网络模型，在迭代过程中使用特征聚类法来改变隐层单元的分组，使得分组能够随着特征的收敛而自适应地发生改变，从而更好地实现变量组结构的估计。实验表明，该模型能够很好地捕捉训练过程中出现的组相关信息，并在一定程度上提高图像的分类识别率。

基于谱残差和聚类法的运动目标检测研究

马琴，张兴忠，李海芳，邓红霞

2018, 40(10): 1867-1873. doi:

摘要 ( 401 )

PDF (1583KB) ( 397 ) 　　

传统基于特征点匹配的目标检测算法目标识别率低、误检率较高是因为特征点匹配不准确、目标轮廓不连续。针对这一问题，分别引入谱残差算法和kmeans聚类算法，并加以改进，提出一种基于谱残差算法和kmeans聚类算法的运动目标检测算法。具体方法是：首先，每隔两帧提取加速鲁棒特征SURF并对图像配准，再对帧差结果采用谱残差算法提取视觉显著性特征，去除因匹配不准确造成的噪点和伪运动目标；其次，形态学处理之后引入改进后的kmeans聚类算法，对不连续的轮廓进行聚类；最后形成完整的目标。实验显示，本文算法目标识别率达到90.61%，误检率达到21.25%,分别优于传统基于SURF特征的运动目标检测算法66.60%的识别率、31.91%的误检率和基于新的局部不变性特征ORB匹配的目标检测算法87.573%的识别率、26.80%的误检率。虽然该算法平均运行时间为18 fps，但仍可以满足视频流畅的需求，因此动态背景下该算法可做为一种有效的运动目标检测算法使用。

基于最大类间方差的最大熵图像分割

易三莉，张桂芳，贺建峰，李思洁

2018, 40(10): 1874-1881. doi:

摘要 ( 469 )

PDF (719KB) ( 474 ) 　　

最大熵分割算法对于目标与背景之间界限模糊的图像分割效果较好，但该算法对图像边缘的处理能力较差。最大类间方差分割算法对图像边缘的识别能力较强，但该算法对于目标和背景之间界限模糊的图像分割效果不好。针对上述问题，提出了一种基于最大类间方差的最大熵图像分割算法，该算法既能很好地对目标与背景之间界限模糊的图像进行分割，又能有效地识别图像的边缘。实验结果表明，本文所提算法对目标与背景之间界限模糊的图像的分割效果以及对图像边缘的识别能力均优于传统的最大类间方差算法和最大熵算法，且具有更好的有效性和鲁棒性。

基于细菌觅食的改进蚁群算法

张立毅1，肖超2，费腾1

2018, 40(10): 1882-1889. doi:

摘要 ( 660 )

PDF (961KB) ( 428 ) 　　

蚁群算法是模仿蚂蚁觅食行为的一种新的仿生学智能优化算法。针对其收敛速度慢和易陷入局部最优的不足，将细菌觅食算法和蚁群算法相结合，提出一种细菌觅食蚁群算法。在蚁群算法迭代过程中，引入细菌觅食算法的复制操作，以加快算法的收敛速度；引入细菌觅食算法的趋向操作，以增强算法的全局搜索能力。通过经典的旅行商问题和函数优化问题测试表明，细菌觅食蚁群算法在寻优能力、可靠性、收敛效率和稳定性方面均优于基本蚁群算法及两种改进蚁群算法。

基于LSTM的蒙汉机器翻译的研究

刘婉婉，苏依拉，乌尼尔，仁庆道尔吉

2018, 40(10): 1890-1896. doi:

摘要 ( 618 )

PDF (1278KB) ( 491 ) 　　

由于内蒙古地区蒙汉机器翻译水平落后、平行双语语料规模较小，利用传统的统计机器翻译方法会出现数据稀疏以及训练过拟合等问题，导致翻译质量不高。针对这种情况，提出基于LSTM的蒙汉神经机器翻译方法，通过利用长短时记忆模型构建端到端的神经网络框架并对蒙汉机器翻译系统进行建模。为了更有效地理解蒙古语语义信息，根据蒙古语的特点将蒙古文单词分割成词素形式，导入模型，并在模型中引入局部注意力机制计算与目标词有关联的源语词素的权重，获得蒙古语和汉语词汇间的对齐概率，从而提升翻译质量。实验结果表明，该方法相比传统蒙汉翻译系统提高了翻译质量。

基于加权密度的自适应谱聚类算法

万月，陈秀宏，何佳佳

2018, 40(10): 1897-1901. doi:

摘要 ( 286 )

PDF (1106KB) ( 365 ) 　　

谱聚类算法中如何定义一个合适的尺度参数仍待学习。针对谱聚类算法中由高斯核函数建立的相似度矩阵对尺度参数敏感的问题，提出了一个新的基于加权密度的自适应谱聚类算法——WDSC。该算法将数据点的加权K近邻距离作为尺度参数，尺度参数的倒数作为数据点所在邻域的密度，引入新的密度差调整相似度矩阵；考虑了每个数据点的邻域分布，故对噪声有一定的鲁棒性，且对参数也不再敏感。在不同数据集上的实验以及对比实验均验证了该算法的有效性与鲁棒性。

车载环境下的语音端点检测

涂志强,梁亚玲,杜明辉

2018, 40(10): 1902-1906. doi:

摘要 ( 594 )

PDF (679KB) ( 342 ) 　　

评审附件

为了提高车载噪声环境下语音端点检测的准确性,提出了一个基于GRURNN的神经网络结构,
对带噪语音的LogMel特征序列进行处理,实现语音与噪声的分离,从而恢复出纯净语音的LogMel特征序列；在此基础上,提出一种新的特征LogMelSum,并用该特征进行端点检测。实验结果表明,在车载环境下,本文方法具有很好的端点检测性能。

当期目录

作者中心

审稿中心

在线期刊