计算机工程与科学

面向大数据流式计算的任务管理技术综述

梁毅1，侯颖1，陈诚1，金翊2

2017, 39(2): 215-226. doi:

摘要 ( 545 )

PDF (693KB) ( 1091 ) 　　

评审附件

流式计算是大数据的一种重要计算模式，大数据流式计算已成为研究热点。任务管理是大数据流式计算的核心功能之一，负责对流式计算的任务进行资源调度及全生命周期管理。目前对于大数据流式计算的技术调研工作主要集中于流式计算应用需求、体系结构及整体技术，缺乏对大数据流式计算任务管理技术的精细化调研分析。首先给出流式计算任务管理的抽象功能模型，其次基于该模型对任务管理的关键技术进行了分类和综述，最后对既有主流的大数据流式计算系统对上述关键技术的应用、集成和优化进行了调研分析。

Spark下的并行多标签最近邻算法

王进，夏翠萍，欧阳卫华，王鸿，邓欣，陈乔松

2017, 39(2): 227-235. doi:

摘要 ( 473 )

PDF (1090KB) ( 885 ) 　　

评审附件

随着大数据时代的到来，大规模多标签数据挖掘方法受到广泛关注。多标签最近邻算法MLKNN是一种简单高效、应用广泛的多标签分类方法，其分类精度在很多应用中都高于其他常见的多标签学习方法。然而随着需要处理的数据规模越来越大，传统串行MLKNN算法已经难以满足大数据应用中时间和存储空间上的限制。结合Spark的并行机制和其基于内存的迭代计算特点，提出了一种基于Spark并行框架的MLKNN算法SMLKNN。在Map阶段分别找到待预测样本每个分区的K近邻，随后Reduce阶段根据每个分区的近邻集合确定最终的K近邻，最后并行地对近邻的标签集合进行聚合，通过最大化后验概率准则输出待预测样本的目标标签集合。串行和并行环境下的对比实验结果表明，SMLKNN在保证分类精度的前提下性能与计算资源呈近似线性关系，提高了MLKNN算法对大规模多标签数据的处理能力。

基于Isolation Forest的并行化异常探测设计

侯泳旭1,段磊1,2,秦江龙3,秦攀1,唐常杰1

2017, 39(2): 236-244. doi:

摘要 ( 544 )

PDF (1110KB) ( 923 ) 　　

评审附件

异常探测具有广泛的应用，受到了工业界和学术界的共同关注。在众多异常探测方法中，Isolation Forest算法具有执行效率高、探测准确度好的特点，获得了众多应用。但是，传统Isolation Forest算法难以处理大规模数据。为解决此问题，设计了一种基于云计算平台的算法。具体地，使用Hadoop分布式存储系统和MapReduce分布式计算框架设计并实现了基于Isolation Forest的并行化异常探测算法PIFH。通过将探测模型构建和数据异常评价的过程并行化，提升了PIFH算法探测异常的执行效率，扩展了其应用范围。利用真实世界数据集验证了所提算法的执行效率和可扩展性。

一种多级无缓存高阶路由器的设计与实现

杨文祥，董德尊，李存禄，雷斐，孙凯旋，吴际

2017, 39(2): 245-251. doi:

摘要 ( 527 )

PDF (874KB) ( 725 ) 　　

随着高性能网络规模的增加，高阶路由器结构设计成为高性能计算研究的重点和热点。使用高阶路由器，网络能实现更低的报文传输延迟、网络功耗和网络构建成本，同时高阶路由器的应用还可以提高网络可靠性。高性能路由器的阶数不断提高，仅靠扩展单级crossbar交换结构的阶数使路由器内部的连线资源急速增长，交叉开关的实现代价将不可接受，这就需要为高阶路由器设计新型的交换结构。近十年来，出现了以YARC为代表的经典结构化设计以及“network within a network”等新型设计方法，未来的研究重点是解决高阶路由器结构设计中遇到的缓存、仲裁和扩展性等各种问题。鉴于此，实现了一种多级无缓存高阶路由器，这种高阶路由器内部是一个多级Clos网络，每一级有相应的仲裁模块对请求进行调度，数据包缓存在输入/输出端口实现，除去这些缓冲区单元，该网络是无缓存的。最后通过BookSim模拟器进行了大量的性能测试，所设计的路由器能够正常工作，性能良好。

基于ECC校验码的存储器可扩展自修复算法设计

任秀江1，谢向辉2，施晶晶1

2017, 39(2): 252-257. doi:

摘要 ( 452 )

PDF (841KB) ( 732 ) 　　

评审附件

随着微电子工艺的不断进步，SoC芯片设计中SRAM所占面积越来越大，SRAM的缺陷率成为影响芯片成品率的重要因素。提出了一种可扩展的存储器自修复算法（SMBISR），在对冗余的SRAM进行修复时，可扩展利用存储器访问通路中校验码的纠错能力，在不改变SRAM结构的前提下能够进一步提高存储器的容错能力，进而提高芯片成品率。最后对该算法进行了RTL设计实现。后端设计评估表明，该算法能够工作在1 GHz频率，面积开销仅增加1.5%。

一种高性能流式并行加密算法

费雄伟1,2，李肯立2，阳王东1,2

2017, 39(2): 258-266. doi:

摘要 ( 438 )

PDF (968KB) ( 1031 ) 　　

评审附件

随着网络用户的数量持续增多和对安全需求的增长，以AES加密的方式对用户数据流进行加密保护得到了广泛的应用。对服务器而言，大量用户形成的数据流具有流速高和突发性强的特点，而传统的串行加密却效率低下，会造成服务失效或服务质量差，因此在目前普及的CPU+GPU异构环境的基础上，通过流水线方式组织并行AES加密，以提高加密的性能，并通过滑动窗口进行突发流量控制，以提供高质量的流加密服务。实验结果显示，所提出的异构环境下的流式AES并行加密算法能满足高速率突发性的用户数据流的流式加密的需求，提高了加密的处理速度并有效地控制了流量。

面向移动端基于社交关系的图片缓存替换算法

王菁1,2，牛利杰1,2

2017, 39(2): 267-274. doi:

摘要 ( 420 )

PDF (1000KB) ( 742 ) 　　

评审附件

随着移动终端深入人们的生活，移动社交APP得到了广泛使用。在移动社交APP中往往会使用大量的图片资源，如微信朋友圈、Instagram的图片分享等。在APP中浏览图片会消耗较多的网络流量，影响加载速度，因此大部分APP采用首先显示缩略图，根据用户需求再加载原图的策略。在服务器端也采用缓存技术来加快缩略图产生时间，减少磁盘I/O。但是，当前的缓存机制更多关注的是缓存的访问频率、最近访问时间等因素，并没有过多关注数据生成用户之间的社交关系，也没有考虑移动用户对缩略图和原图的不同访问模式。把缓存划分为两个部分：缩略图缓存区和原图缓存区，提出了基于社交关系的图片缓存替换算法，在传统缓存替换算法的基础上增加用户的社交关系以及缩略图和原图的关联关系，通过计算图片的缓存价值进行缓存替换。实验表明，所提出的基于社交关系的图片缓存替换算法对于缩略图和原图的缓存命中率都有明显提高。

直线引导的Torus结构路由算法

丁毓良，张剑贤，周端，裘雪红

2017, 39(2): 275-279. doi:

摘要 ( 670 )

PDF (517KB) ( 666 ) 　　

评审附件

为了提高片上网络在Torus拓扑结构下的路由通信效率，提出了一种基于直线引导思想的路由算法Tline。该路由算法将Torus拓扑结构的片上网络拓展为类似Mesh结构的坐标平面，以数据包的源节点和目的节点构成的直线为路由转发方向，并根据周围邻近节点的拥塞状况选择传输路径方向实现部分自适应路由。实验结果表明，与XY、OE路由算法相比，在热点流量模式下Tline路由算法具有较好的路由性能，且平均能耗降低约8%。

FC-AE-ASM协议优化设计

李攀1,2，田泽1,2，蔡叶芳1,2，张亦姝3，杨海波1,2,霍卫涛1,2,王玉欢1,2

2017, 39(2): 280-284. doi:

摘要 ( 883 )

PDF (731KB) ( 723 ) 　　

评审附件

参照文献资料对光纤通道FC协议的多种实现方式，深入研究光纤通道航空电子环境匿名订户消息FCAEASM协议，基于Xilinx FCIP核，对FCAEASM协议实现流程中涉及到的ASM消息的接收/发送过程进行优化设计，遵循的原则是尽可能使用硬件电路，减少软件干预，提高协议处理和执行效率，以满足航空电子环境低延迟、实时性需求。最后使用Verilog语言对优化后的协议处理流程进行了实现，Modelsim仿真结果表明，FC链路速率为2.125/1.062 5 Gbps时，最大有效载荷的ASM消息最大接收和发送带宽可达到FC链路线速率带宽，能够满足FCAEASM协议实时性的要求，为在航空电子环境中构建嵌入式光纤通道网络提供参考。

Hadoop下改进布隆过滤器算法的网页去重

黄伟建，杨海龙

2017, 39(2): 285-290. doi:

摘要 ( 710 )

PDF (682KB) ( 618 ) 　　

评审附件

针对服务器中存储的大量重复和相似数据造成的空间浪费问题，改进的布隆过滤器（Bloom Filter）算法通过增加位数组并根据位数组的重复命中次数所计算的权重来动态优化重复数据的副本数，然后在 Hadoop 分布式集群下对改进的算法进行并行实现，以进一步提高作业处理效率。实验结果表明，与传统网页去重算法相比，改进的 Bloom Filter 算法的并行实现不仅提高了作业的处理效率，而且通过基于位数组下动态重复次数对副本数的优化，在一定程度上节省了服务器的存储空间。

基于TDMA的远距离无线网络MAC层访问控制

华超1,2，黄传河1,2

2017, 39(2): 291-296. doi:

摘要 ( 1003 )

PDF (456KB) ( 612 ) 　　

评审附件

近年来，随着移动终端的普及，人们希望无线网络能够更加方便、更加高效。如今的无线网络致力于提供高效、公平以及服务质量等特性，而在远距离的无线网络环境中，这些特性却很难得到满足。提出控制终端的上行传输机制，将远距离的终端和近距离的终端同时传输，以提高基站的带宽利用率。主要解决了以下几个问题，首先，如何取得终端的距离；其次，如何调度各个终端的发送，使得带宽利用率提高。

一种山区环境下车际网的中继节点选择方法

曹敦1,2，雷正保1

2017, 39(2): 297-302. doi:

摘要 ( 510 )

PDF (702KB) ( 591 ) 　　

中继节点的选择决定了车际网中消息传播的效率和可靠性。现有的中继节点选择方法多集中于高速的直道和城市的十字路口场景，对于山区环境的弯道场景研究较少。提出一种基于指数迭代分割，适用于弯道下的中继节点选择方法EPBPC。该方法无需先验车辆信息，借助阻塞信号，通过坐标映射，选择发送节点传输范围内最远且宽度最小的子区间内节点作为中继节点，从而获得稳定的较小传输延时和较高的包到达率。在实际山路环境下的仿真实验结果表明，EPBPC在传输延时和包到达率性能上有所提升，尤其在单跳范围内车辆数较大的情况下，能获得相对于其他方法24.45%的点到点延时增益及高于99.8%的包到达率。

抑制纹理信息的偏置场变分图像分割模型

李虎，汪西莉

2017, 39(2): 303-310. doi:

摘要 ( 353 )

PDF (1135KB) ( 716 ) 　　

偏置场变分水平集图像分割模型利用原始图像的局部灰度信息，可以对灰度不均匀图像进行有效的分割，但当灰度图像中存在纹理时，分割效果往往很差。针对这一问题，提出抑制纹理信息的偏置场变分水平集图像分割模型。利用一种基于纹理几何结构的纹理描述符描述图像中不同的纹理区域，使得不同纹理区域对比更加明显，相同纹理区域更加平滑，通过抑制纹理信息使后续的图像分割在纹理部分的错分大大减少。实验结果表明，相比偏置场变分模型，所提模型对自然及人工合成纹理图像均获得更好的分割结果。

HE染色乳腺癌组织病理图像癌巢与间质分割研究

阚贤响，刘娟，屈爱平

2017, 39(2): 311-316. doi:

摘要 ( 845 )

PDF (661KB) ( 854 ) 　　

评审附件

HE染色的乳腺癌组织病理图像是分析诊断乳腺癌常用的方法，病理学家普遍认为癌巢和间质的病理形态学特征对研究乳腺癌的生物学行为有着预示作用，所以准确分割癌巢和间质显得尤为重要。对于HE染色乳腺癌组织病理图像，视癌巢和间质的分割为图像中像素点的分类问题，提取并分析特征，选取最佳特征组合，然后分类为癌巢或间质，并结合间隔采样、归一化与阈值法。实验表明，该方法能较为准确地分割出癌巢和间质，保证较高准确率和精度，在时间效率上能达到较为满意的结果。

一种改进的快速SLIC分割算法

马军福，魏玮

2017, 39(2): 317-322. doi:

摘要 ( 653 )

PDF (924KB) ( 690 ) 　　

评审附件

近年来，超像素算法被应用到计算机视觉的各个领域。超像素捕获图像冗余信息,降低图像后续处理的复杂度。超像素分割作为图像的预处理过程需要满足图像处理的实时性和准确性。在SLIC算法的框架下，所提算法的主要目的是提高超像素分割的效率;通过原图像降尺度过程，提取原图像中少量像素，生成降尺度图像;利用SLIC算法对降尺度图像进行超像素分割;初次超像素分割之后，根据降尺度图像的分割结果对原图像中像素进行K近邻分类，实现原图像的超像素最终分割结果。实验表明，对于同一处理对象，在准确度相近的状态下，本算法处理速度高于SLIC算法。

基于卷积受限玻尔兹曼机的医学图像分类新方法

张娟,蒋芸,胡学伟,肖吉泽

2017, 39(2): 323-329. doi:

摘要 ( 506 )

PDF (778KB) ( 823 ) 　　

评审附件

利用数据挖掘方法对医学图像做分析是目前研究的热点之一，常用的挖掘方法首先需要从医学图像中提取特征，然后进行分类分析。目前，应用最多的是提取图像的统计特征，这种方法对所提取的特征有很强的依赖性。采用一种深度学习的新方法——卷积受限玻尔兹曼机模型，并且采用改进的快速持续对比散度算法对模型进行训练。该方法直接从乳腺Ｘ光图像中自主学习特征并利用学习到的特征对图像进行分类。实验结果显示，新方法对医学图像的分类精度相对于已有方法有明显的提升。

基于加速度传感器的人体跌倒检测方法

孙子文,孙晓雯

2017, 39(2): 330-335. doi:

摘要 ( 722 )

PDF (547KB) ( 1035 ) 　　

评审附件

针对人体跌倒检测阈值算法在由于阈值设定不当而引起的检测精度下降问题，采用支持向量机方法决定跌倒检测的阈值大小。从加速度传感器中获取人体运动信号，提取合加速度以及倾角作为分类特征，根据人体在跌倒时经过的失重、撞击地面和平稳三个阶段，建立基于阈值的跌倒检测模型。采用所建立的跌倒检测模型，分别用支持向量机方法以及人工方法设定阈值，仿真结果显示采用支持向量机设定阈值的检测效果优于对比算法，结果表明本文方法能有效识别跌倒。

向导滤波器的整数FPGA设计结构

刘祝华，袁文

2017, 39(2): 336-342. doi:

摘要 ( 662 )

PDF (658KB) ( 713 ) 　　

评审附件

对一种单图像向导滤波器的高性能FPGA设计结构进行了分析，发现其中的均值滤波器存在设计缺陷，据此提出了一种向导滤波器的整数FPGA设计结构。通过改变均值滤波器的数据累加顺序,减少了存储资源的使用，同时以整数数据处理方式实现了向导滤波器中方差和变换系数的计算，并且通过参数调整，可以方便地实现不同大小图像的不同尺寸窗口的向导滤波。在Altera公司Cyclone系列FPGA芯片上进行了综合，实验结果表明，向导滤波整数FPGA结构的处理结果与浮点计算四舍五入取整后的结果相比，最大误差不超过1，同时新结构大幅度降低了硬件资源的使用量，有效提升了数据处理速度，使用EP3C40F484C8芯片综合时，能以高达162 fps的速度处理1024×1024的图像，能很好地满足各种图像实时处理要求。

L2,1范数正则化的不相关判别分析及其在人脸识别中的应用

傅俊鹏，陈秀宏，葛骁倩

2017, 39(2): 343-350. doi:

摘要 ( 599 )

PDF (770KB) ( 699 ) 　　

评审附件

对高维数据降维并选取有效特征对分类起着关键作用。针对人脸识别中存在的高维和小样本问题，从特征选取和子空间学习入手，提出了一种L2,1范数正则化的不相关判别分析算法。
该算法首先对训练样本矩阵进行奇异值分解；然后通过一系列变换，将原非线性的Fisher鉴别准则函数转化为线性模型；最后加入L2,1范数惩罚项进行求解，得到一组最佳鉴别矢量。将训练样本和测试样本投影到该低维子空间中，利用最近欧氏距离分类器进行分类。由于加入了L2,1范数惩罚项，该算法能使特征选取和子空间学习同时进行，有效改善识别性能。在ORL、YaleB及PIE人脸库上的实验结果表明，算法在有效降维的同时能进一步提高鉴别能力。

结合区域特性的有限离散剪切波图像融合

陈清江，张彦博，柴昱洲，魏冰蔗

2017, 39(2): 351-358. doi:

摘要 ( 518 )

PDF (947KB) ( 574 ) 　　

评审附件

为了提高多聚焦图像和红外与可见光图像的融合精度，结合有限离散剪切波变换具有良好的局部化特性及平移不变性，提出了一种基于有限离散剪切波变换(FDST)的图像梯度信息相关性因子加权与对比度相结合的融合算法。首先对严格配准后的图像进行FDST分解，得到低频子带系数和不同尺度不同方向的高频子带系数；然后对低频子带系数采用图像梯度信息相关性因子加权融合算法，高频则利用对比度将低频系数与高频系数联系起来并以对比度作为度量系数取舍的准则进行融合；最后应用有限离散剪切波逆变换重构得到融合图像，并对融合结果进行主观视觉和客观评价。实验结果表明，该算法在主观视觉效果和客观评价指标上优于其它融合算法。

基于HSV空间改进的多尺度显著性检测

王文豪，周静波，高尚兵，严云洋

2017, 39(2): 354-370. doi:

摘要 ( 538 )

PDF (924KB) ( 740 ) 　　

评审附件

图像显著性特征已被广泛地应用于图像分割、图像检索和图像压缩等领域，针对传统算法耗时较长，易受噪声影响等问题，提出了一种基于HSV色彩空间改进的多尺度显著性检测方法。该方法选择HSV色彩空间的色调、饱和度和亮度作为视觉特征，先通过高斯金字塔分解获得三种尺度的图像序列，然后使用改进的SR算法从三种尺度的图像序列中提出每个特征图，最后将这些特征图进行点对点的平方融合和线性融合。与其它算法的对比实验表明，该方法具有较好的检测效果和鲁棒性，能够较快速地检测出图像的显著性区域，能够突显整个显著性目标。

一种融入PCA的LBP特征降维车型识别算法

董恩增，魏魁祥，于晓，冯倩

2017, 39(2): 359-363. doi:

摘要 ( 534 )

PDF (624KB) ( 682 ) 　　

评审附件

车型识别是智能交通系统研究的关键技术之一，针对车型识别的过程中存在处理的信息量大，提取特征维数高，识别实时性较差等问题，设计了一种融入PCA的LBP特征降维车型识别算法。首先在视频序列中使用帧间差分法提取目标车辆；然后计算目标车辆的LBP特征并利用PCA方法将数据由像素维数降至训练数据维数，在增强识别算法对光线变化鲁棒性的同时，一定程度上降低了车型识别的计算量；最后利用最小距离分类器对目标车辆进行分类识别。实验结果表明，所设计的车型识别算法与常规PCA方法相比，所设计的算法在光照变化时识别准确率有所提高，算法的实时性得到了一定的提升。

通用三维服装模型的强约束动态仿真方法

刘正东

2017, 39(2): 371-377. doi:

摘要 ( 399 )

PDF (782KB) ( 903 ) 　　

评审附件

随着三维游戏和虚拟试衣要求的不断提高，服装仿真已经从布料模拟向服装动态模拟的方向发展，具有真实性、实时性、通用性与交互性的服装仿真技术有很强的研究和实用价值。针对目前算法研究中普遍存在的实时性与通用性不足，提出了一种针对任意三维服装模型的实时仿真方法，将模型顶点和三角面映射为质点的弹簧模型，以克服传统的布料解算器对三维模型的网格限制。利用简便易行的Verlet积分器提高运算效率，并对质点间的形变进行强约束补偿，防止过拉伸（超弹）现象的发生，提高了系统的稳定性。通过实验验证了算法的高效性和可靠性，并可方便地以插件或模块形式与其它软件整合。

时钟有限自动机模型及其演化算法

范林军1，史湘宁2，凌云翔1,3

2017, 39(2): 378-384. doi:

摘要 ( 657 )

PDF (568KB) ( 613 ) 　　

评审附件

传统分布仿真系统时钟不一致影响因素分析方法，已不能满足当前面向服务分布仿真的时钟状态分析需要。从系统全局时钟演化出发，阐述了时钟状态演化内涵与过程；在此基础上，基于有限自动机理论，提出了用于时钟不一致影响因素量化分析的动态演化模型及其算法：时钟有限自动机CFSA和时钟一致性演化算法CCEA。仿真实验表明：相比传统的分析方法，使用CFSA模型及其CCEA演化算法刻画系统时钟一致性状态变迁过程，探寻各种不一致因素的影响机理，量化分析各因素的影响程度等具有可行性、有效性和新颖性，可为面向服务分布仿真中时钟同步算法设计提供指导性建议。

创意FCM算法

赵佳，王士同

2017, 39(2): 385-392. doi:

摘要 ( 368 )

PDF (622KB) ( 600 ) 　　

评审附件

针对现有模糊聚类方法仅仅是对已有数据点的聚类的不足，提出了在已有数据集的基础上找到新的一类集群的聚类方法CFCM。该算法在FCM算法的基础上，通过引入观测点P作为聚类的先验知识，来大致确定未知集群的聚类中心，定义了权重系数λ来限定观测点对新的一类聚类中心形成的影响程度。人造数据集和UCI真实数据集的实验结果表明，该算法不仅对已知数据点有较好的聚类效果，并且可以在观测点P的作用下在特定区域创造出新的一类无已知数据点的集群中心点的大致位置，因而在实际中有潜在应用价值。

基于特征融合与决策树技术的表情识别方法

钟伟1，黄元亮2

2017, 39(2): 393-398. doi:

摘要 ( 612 )

PDF (565KB) ( 760 ) 　　

评审附件

针对复杂状况下传统表情识别方法存在的问题，提出一种新的非特定人表情识别方法。该算法首先提取每张表情图像的HOG特征和Haar小波特征,然后将两种不同的特征串行融合得到整幅图像的特征，最后通过SVM多分类器完成各层人脸表情的分类识别。在JAFFE人脸表情库上的仿真实验中，该方法的分类准确率达到87.9%，平均时耗达到10.296 6 s。对比实验结果表明，所提算法具有更高的识别率、更好的实时性和更强的鲁棒性。

融合词语类别特征和语义的短文本分类方法

马慧芳，周汝南，吉余岗，鲁小勇

2017, 39(2): 399-404. doi:

摘要 ( 361 )

PDF (852KB) ( 800 ) 　　

评审附件

针对短文本内容简短、特征稀疏等特点，提出一种新的融合词语类别特征和语义的短文本分类方法。该方法采用改进的特征选择方法从短文本中选择最能代表类别特征的词语构造特征词典，同时结合利用隐含狄利克雷分布LDA主题模型从背景知识中选择最优主题形成新的短文本特征，在此基础上建立分类器进行分类。采用支持向量机SVM与k近邻法k-NN分类器对搜狗语料库数据集上的搜狐新闻标题内容进行分类，实验结果表明该方法对提高短文本分类的性能是有效的。

当期目录

作者中心

审稿中心

在线期刊