Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    论文
    一种阵列众核处理器的多级指令缓存结构
    陈逸飞,李宏亮,刘骁,高红光
    2018, 40(04): 571-579. doi:
    摘要 ( 144 )   PDF (1254KB) ( 254 )      评审附件
    阵列众核处理器由于其较高的计算性能和能效比已经被广泛应用于高性能计算领域。而要构建未来高性能计算系统处理器必须解决严峻的“访存墙”挑战以及核心协同问题。通常的阵列处理器中,核心多采用单线程结构,以减少开销,但是对访存提出了较高的要求。在阵列众核处理器中,在单核心中引入硬件同时多线程技术,针对实验中一级指令缓存命中率随着线程数增加而显著降低的问题,提出了一种面向阵列众核处理器的冗余指令缓存存储结构,基于该结构,提出采用FIFO及类LRU替换策略。通过上述优化的高速缓存结构设计,经实验模拟,双线程整体指令Cache失效率降低了25.2%,整体CPI性能提升了30.2%。

     
    众核计算平台的高吞吐率密码算法加速
    符鹤1,李春江2,王昊2,谢永芳1
    2018, 40(04): 580-586. doi:
    摘要 ( 111 )   PDF (545KB) ( 231 )      评审附件
    众核处理器适应于加速高吞吐率的计算密集型应用,而密码算法需要进行大量的数学计算,特别需要使用高吞吐率的计算平台。提出了一种面向众核平台的粗粒度并行加速框架,该框架不考虑算法内部的运算过程,将数据以计算函数为单位分配到众核协处理器上执行。使用MIC众核协处理器,采用三级并行结构及任务分配机制,提升了高吞吐率密码算法处理的并行性。针对多种密码算法应用的实验结果表明,该框架可充分利用众核平台实现粗粒度并行的高吞吐率加解密处理。
     
    Spark并行计算框架的内存优化
    廖旺坚1,2,黄永峰1,2,包从开1,2
    2018, 40(04): 587-593. doi:
    摘要 ( 145 )   PDF (545KB) ( 259 )     

    以Spark为代表的集群并行计算框架在大数据、云计算浪潮中广泛应用,其运行性能优化是应用的关键。为提高运行性能,分析了Spark框架执行流程、内存管理机制,结合Spark和JVM两个层面内存管理的特点,提出3条优化策略:(1)通过序列化和压缩方式减少缓存数据大小,使得GC消耗降低,提升性能;(2)在一定范围内减少运行内存大小,用重算代替缓存,可以提升性能;(3)配置适当的JVM新生代和老生代的比例、Spark计算与缓存空间比例等内存分配参数,能够较大程度地提升性能。实验结果表明,序列化和压缩能够减少缓存占用空间42%;提交运行内存由1 000 MB减少到800 MB时,性能增加21%;优化内存配比,性能比默认参数有10%~30%的提升。

    面向网络通信的高实时压缩引擎设计
    任秀江1,王磊1,周建毅1,谢向辉2
    2018, 40(04): 594-601. doi:
    摘要 ( 106 )   PDF (1412KB) ( 280 )      评审附件
    随着集成电路工艺的发展,高性能计算系统中互连网络性能提升速度远低于处理器性能的提升,互连网络带宽已成为制约高性能计算性能提高的瓶颈之一。从减少网络注入数据量的角度出发,对网络通信实时压缩技术进行了研究,给出了一种面向网络通信的硬件实时压缩引擎RTCE的设计,在网络通信过程中,硬件自动实现对网络包的压缩传输。采用SPEC2006、Graph500、CFD算法测试数据进行测试,压缩后的网络包数据量平均减少32.8%~48.7%。
     
     
    一种基于频度统计的动态二进制翻译优化方法
    李男,庞建民,单征
    2018, 40(04): 602-608. doi:
    摘要 ( 122 )   PDF (660KB) ( 233 )     

    在动态二进制翻译过程中,将执行频度高的代码片段长时间驻留在翻译缓存,同时扩大翻译器一次执行的代码量,是减少上下文切换开销、提升系统效率的有效途径。为此,提出了“热代码识别→超块缓存构造→T-Cache管理策略改进”的优化线索,设计了一种基于频度统计的热代码识别算法,将频度值超过预设阈值的基本块及其后续基本块作为热代码识别条件;基于识别出的热代码,提出了构造超块缓存的思想,将热代码包含的基本块翻译后做物理连接,形成容量更大的超块缓存提供给T-Cache系统;以此为基础,改进了T-Cache系统原有的查找方法和替换策略。实验验证了该优化方法的正确性和有效性,在国产申威处理器平台上,该方法使得标准测试集SPEC 2006获得平均9.34%的性能提升。

    基于突触离子通道动力学神经元网络的高效并行仿真算法
    彭霞,王直杰,韩芳,顾晓春
    2018, 40(04): 609-615. doi:
    摘要 ( 127 )   PDF (671KB) ( 264 )      评审附件
    在计算神经科学领域,大规模神经元网络的并行仿真对探索和揭示生物大脑中信息传递机制有着重要作用。为加速大规模神经元网络仿真,提出一种模块独立性强、耦合度低的基于突触递质受体离子通道动力学的神经元网络的并行算法。通过分析化学突触信息传递机理及递质分子、受体离子通道动力学特征,提出了递质受体计算分离的思想,增强了突触前神经元引起的递质分子浓度计算与突触后绑定状态的受体浓度计算之间的独立性,降低突触电流计算中突触前神经元状态和突触后神经元状态之间的耦合度。基于上述思想,设计并实现了一种生物神经网络并行算法。仿真结果表明了该算法的高效性。
     
     
    基于上下文感知和个性化度量嵌入的下一个兴趣点推荐
    鲜学丰1,陈晓杰2,赵朋朋2,杨元峰1,Victor S.Sheng3
    2018, 40(04): 616-625. doi:
    摘要 ( 186 )   PDF (1275KB) ( 324 )      评审附件
    随着基于位置的社交网络推荐系统的逐步发展,兴趣点推荐成为了研究热门。兴趣点推荐的研究旨在为用户推荐兴趣点,并且为商家提供广告投放和潜在客户发掘等服务。由于用户签到行为的数据具有高稀疏性,为兴趣点推荐带来很大的挑战。许多研究工作结合地理影响、时间效应、社会相关性等方面的因素来提高兴趣点推荐的性能。然而,在大多数兴趣点推荐的工作中,用户访问的周期性习惯和伴随用户偏好的上下文情境信息没有被深度地挖掘。而且,下一个兴趣点推荐中一直存在着数据的高稀疏度。基于以上考虑,针对用户签到的数据稀疏性问题,将用户周期性行为模式归结为上下文情境信息,提出了一种基于上下文感知的个性化度量嵌入推荐算法,同时将用户签到的上下文情境信息考虑进来,从而丰富有效数据,缓解数据稀疏性问题,提高推荐的准确率,并且进一步优化算法,降低时间复杂度。在两个真实数据集上的实验分析表明,本文提出的算法具有更好的推荐效果。
     
    野草猴群算法的传感器优化布置方法研究
    殷红1,杜国璋1,彭珍瑞1,马丽2
    2018, 40(04): 626-635. doi:
    摘要 ( 115 )   PDF (1206KB) ( 235 )      评审附件

    简易猴群算法存在初始化分布随机、爬步长固定、优秀猴子特征信息不能传承等缺陷,使算法求解性能受限。为解决以上问题,提出了一种用于传感器优化布置的野草猴群算法。该算法利用正态分布方法提高初始种群的多样性;采取自适应爬步长提升求解速度和搜索精度;融入野草繁殖进化和竞争排斥机制,扩大后代种群繁殖中优秀猴子的影响范围。以常用的模态置信度矩阵为传感器优化布置的目标函数,配置传感器的布置位置。以常用的8个测试函数和3个常用算法对其进行分析,验证了算法的可行性和有效性。最后以糊底机涂胶机构为例,进行传感器优化布置方案选择。实验结果表明,野草猴群算法的求解精度较简易猴群算法有大幅提高。

    现实环境中基于虚拟用户的LBS位置隐匿方法
    陈思,赵明,张锦健
    2018, 40(04): 636-641. doi:
    摘要 ( 110 )   PDF (659KB) ( 195 )      评审附件
    当前,基于位置服务LBS的应用得到了广泛的发展,并极大地方便了人们的生活。然而,位置也可能泄露大量用户隐私,这使得关于位置隐私的保护变得尤其重要。虽然现有技术在很大程度上解决了隐私保护问题,但在效果上还未能达到预期目标。对此,提出了一种基于现实环境的隐私保护方法DummyEx,通过生成一系列虚拟用户,并构建逼真的移动轨迹,从而实现隐私保护的目的。实验表明,此方法在安全性和有效性方面都能达到较好的效果。

     
    基于嵌入式技术的水声传感网和#br# VHF通信网络的互联网关设计
    羊秋玲1,2,解冰珊2,3,金志刚2,苏毅珊2,黄向党1
    2018, 40(04): 642-648. doi:
    摘要 ( 128 )   PDF (898KB) ( 269 )      评审附件

    针对水上船舶用户对水下网络监测存在长延时和高费用问题,结合水声传感网特点和水上船舶常用VHF通信设备,采用嵌入式技术,提出一种面向水上船舶用户的水声传感网和水上VHF通信网的无线网关设计方案,对网关的软硬件系统进行设计。仿真结果表明,嵌入式网关实现了水声传感网和VHF通信网的互联互通,具有较高的理论与实际应用价值。

    基于电信数据的室外定位技术研究
    廖山河,赵钦佩,李江峰,饶卫雄
    2018, 40(04): 649-659. doi:
    摘要 ( 140 )   PDF (1001KB) ( 248 )      评审附件
    越来越多的移动计算依赖位置信息提供基于位置的服务,移动设备的室外定位技术至关重要。目前广为采用的方式是GPS,但移动设备端的GPS位置信息依赖移动设备如手机的GPS传感器获取,电信运营商虽然为用户提供通话和数据服务,却无法获得用户的精确GPS位置。针对这种情况,提出利用手机端和电信基站之间的连接信号数据(简称电信数据),实现移动设备的定位服务。考虑到电信运营商积累了海量的电信数据,因此通过研究基于电信数据的室外定位技术,使得运营商获取用户位置成为可能。提取电信特征数据、以手机所在GPS位置作为标签数据,研究了五种基于机器学习模型的室外定位算法,实现了从基站信号数据到GPS坐标点的预测,通过大量的实验对比了这些方法的定位精度和运行时间、不同数据收集模式的定位精度、不同特征的定位精度以及探索了后处理对定位精度的提升效果。最终通过实验可知,基于栅格化的随机森林分类模型是效果最好的方法,能够达到15~20 m的平均误差和10 m的中位误差,比前期回归算法在2G和4G数据分别实现了39.46%和54.28%的精度提升,取得与GPS定位接近的定位精度。
     
    具有消息恢复功能的格身份签名方案
    阚元平
    2018, 40(04): 660-664. doi:
    摘要 ( 104 )   PDF (409KB) ( 232 )      评审附件
    随着量子计算机的发展,格密码成为可抵抗其攻击的密码体制之一。在格密码基础上提出了一种具有消息恢复功能的身份签名方案,具有高效、抵抗伪造攻击、签名长度短的特点,可广泛应用于轻量级认证领域。

     
    基于轮廓提取与深度筛选的双目三维重构技术
    马建设,魏云峰,苏萍
    2018, 40(04): 665-672. doi:
    摘要 ( 159 )   PDF (1100KB) ( 340 )      评审附件
    针对基于深度图融合三维重构方法获取的三维重构模型,易受到深度信息误差影响的情况,提出一种基于轮廓提取与深度筛选的双目立体视觉三维重构方法。采用标准棋盘校准双目三维重构系统,利用Canny算子对目标物体进行边界检测,综合采用形态学腐蚀与膨胀方法提取指定方向上的连续边界,用连续边界提取目标物体。在此基础上,对目标物体深度信息进行筛选、拟合插值以获取连续深度信息。结果表明,相对于常规三维重构算法,由本算法三维重构的目标物体表面完整度更高,且目标物体周围的背景环境噪声被去除。

     
    一种基于改进视觉背景提取算法的前景检测
    陈树,丁保阔
    2018, 40(04): 673-680. doi:
    摘要 ( 112 )   PDF (1174KB) ( 294 )      评审附件

    针对视觉背景提取ViBe算法在前景检测中存在的鬼影现象且长时间难以消除的缺点,提出一种改进的视觉背景提取算法。首先,在视频前n帧序列的帧差法中,引入大津(OTSU)算法求自适应阈值,以分割出更为准确的前景区域;其次,利用去除前景区域的前n帧图像合成一张尽量少的包含前景区域的样本图像;最后利用扩展的邻域范围在合成的样本图像中对模型初始化,并把扩大的范围用在ViBe背景模型更新阶段。该算法与各种经典算法在大量视频库中进行了对比实验,仿真结果表明,改进的ViBe算法能快速消除鬼影对前景检测的影响,前景检测更为准确。

    多角度融合的RGB-D显著检测
    张志华,刘政怡
    2018, 40(04): 681-689. doi:
    摘要 ( 101 )   PDF (1464KB) ( 261 )      评审附件
    显著检测是计算机视觉的重要组成部分,但大部分的显著检测工作着重于2D图像的分析,并不能很好地应用于RGBD图片的显著检测。
    受互补的显著关系在2D图像检测中取得的优越效果的启发,并考虑RGBD图像包含的深度特征,提出多角度融合的RGBD显著检测方法。此方法主要包括三个部分,首先,构建颜色深度特征融合的图模型,为显著计算提供准确的相似度关系;其次,利用区域的紧密度进行全局和局部融合的显著计算,得到相对准确的初步显著图;最后,利用边界连接权重和流形排序进行背景和前景融合的显著优化,得到均匀平滑的最终显著图。在RGBD1000数据集上的实验对比显示,所提出的方法超越了当前流行的方法,表明多个角度互补关系的融合能够有效提高显著检测的准确率。

     
    基于改进KCF的跟踪注册方法
    雍玖1,2,王阳萍1,2,雷晓妹3
    2018, 40(04): 690-698. doi:
    摘要 ( 166 )   PDF (1393KB) ( 281 )      评审附件

    针对三维注册易受环境以及目标跟踪检测算法耗时严重、精度低的影响,提出改进KCF(IKCF)的跟踪注册方法。该方法分为4步:(1)利用正则最小二乘分类器的样本训练来获取尺度核相关滤波器和位置信息;(2)搜索尺度核相关滤波器和位置输出响应最大值,完成尺度和目标位置的检测;(3)借鉴MOSSE跟踪器更新方法对模型更新;(4)采用ORB算法对目标位置特征检测并计算出注册矩阵。选取视觉跟踪基准数据集中的6组数据以及拍摄的视频序列仿真实验。仿真结果表明,当目标位置发生旋转、缩放、部分遮挡、光照和运动模糊时,IKCF在精确度、成功率以及效率上总体优于KCF、TLD、Struck和CT算法;且目标位置与OpenGL立方体注册融合度较高;基于IKCF的AR系统具有较好的实时性、稳定性和鲁棒性。

    一种自适应分数阶偏微分图像增强模型
    李伟凯1,王政霞1,蒋伟2
    2018, 40(04): 699-706. doi:
    摘要 ( 118 )   PDF (1045KB) ( 307 )      评审附件
    针对传统的自适应分数阶偏微分方程图像增强算法对图像暗区纹理区域的增强不足的缺点,考虑到人眼对光感的敏感程度不同,将亮度对视觉的影响因素考虑进传统的自适应分数阶偏微分方程图像增强算法。以梯度和灰度值为参数,建立了一种新的自适应分数阶偏微分图像增强模型。该模型改善了传统算法对暗区图像增强不足的缺点,图像增强后的平均梯度提升明显,很好地改善了图像的视觉效果。实验结果说明本算法具有一定的有效性。
     
    基于时域梯度相似度的视频质量评价模型
    邱亮1,夏慧明1,储久良2
    2018, 40(04): 707-711. doi:
    摘要 ( 152 )   PDF (482KB) ( 226 )      评审附件

    频质量评价有助于多媒体网络系统优化和视频编解码算法改进,近年来已成为图像质量评价领域的热门研究方向。在图像质量评价模型(FSIM)的基础上,结合视频局部多帧之间的时域相关性,通过采用新型的三维梯度算子计算原始视频序列与失真视频序列间的梯度相似度矩阵,提出了一种基于时域梯度相似度的视频质量评价模型(TGSMFSIM)。在LIVE视频数据上的测试结果表明,所提模型与视频主观评价有较好的一致性,SROCC与PLCC指标优于VSSIM和VQM两种广泛使用的视频质量评价算法。

    针对选址问题的一种遗传算法改进探究
    邹贵祥,张飞舟
    2018, 40(04): 712-722. doi:
    摘要 ( 195 )   PDF (905KB) ( 605 )      评审附件
    选址问题是现代地理信息资源配置的重要研究领域之一,通用性强、鲁棒性高的遗传算法可以较好地解决这类问题。常用方法是使用二进制编码的遗传算法对栅格数据地图进行选址。为克服二进制编码的标准遗传算法在解决选址问题过程中易陷入早熟的缺点,在研究了使用不同算子、引入观测概念这两大类解决标准遗传算法陷入早熟问题的方法后,针对选址问题的特点,选择了引入多样性测度与应用小生境技术对遗传算法进行改进,并深入探究了引入多样性测度与应用小生境技术后,遗传算法解决选址问题的过程中准确性、在线性能函数、离线性能函数的改善;接着提出了进一步改进小生境技术的方法,使得遗传群体中的每一个个体都参与遗传操作,并且避免了两个相同的个体参与交叉操作的情况。最后通过地图选址实验,将改进的小生境遗传算法与多样性测度结合,成功提高了遗传算法的性能。
     
    双种群分子动理论优化算法
    范朝冬1,任柯1,易灵芝1,肖乐意2,朱彪明1,李杰1
    2018, 40(04): 723-730. doi:
    摘要 ( 110 )   PDF (744KB) ( 240 )      评审附件

    针对传统分子动理论优化算法存在寻优精度差、易陷入局部极值等不足,提出了一种双种群分子动理论优化算法。该算法将种群分为精英和普通两个子群:普通子群采用传统分子动理论优化算法搜索策略进行大范围搜索,而精英子群则通过协同合作实现精细化搜索,以提高算法收敛精度;基于个体迁移实现子群间的信息交流,两个子群通过分工合作共同完成搜索过程。实验结果表明:改进算法在收敛速度、精度和算法稳定性等方面都有明显改善。

    幂律特性在新浪微博个性化推荐中的应用研究
    罗斌,陈翔
    2018, 40(04): 731-739. doi:
    摘要 ( 146 )   PDF (795KB) ( 888 )      评审附件

    在社交网络数据中,幂率分布是数据的基本规律,幂率分布的长尾部分数据有明显的稀疏性,长尾推荐一直是推荐系统的挑战,而冷启动、数据稀疏和覆盖率这些问题也是推荐系统的重要研究内容。通过分析数据幂律分布的特性,在研究社交网络个性化推荐方法的基础上,结合社交网络用户行为数据反映出来的幂律分布特性,通过极大似然估计数据幂律分布的标度值。结合幂率特性改进了相似度计算方法,提出了一种基于幂率特性的混合推荐方法PowerLawCF。最后,使用新浪微博的用户签到数据进行对比分析,PowerLawCF算法的推荐效果有显著提升,提高了长尾推荐的效果,对推荐系统的数据稀疏性和冷启动问题解决效果较好,说明基于幂律分布特征的推荐方法在推荐系统中的应用有积极的效果。

    基于扩展卡尔曼滤波的时钟模型辅助定位算法
    宋建材1,3,候春萍1,薛桂香2
    2018, 40(04): 740-744. doi:
    摘要 ( 108 )   PDF (630KB) ( 285 )     
    在城市峡谷、深坑矿、林地周边等应用场合中,由于卫星信号被遮挡导致接收机观测量不足而无法完成导航解算,提出了一种新的时钟模型辅助定位方法,即同时利用伪距和多普勒观测量,通过扩展卡尔曼滤波器实时估算得到接收机钟偏和钟漂参数,并构建时钟模型,在导航信号缺失情况下利用该时钟模型进行辅助定位。仿真分析和车载实验结果表明,该方法在卫星导航信号缺失后仍然能够继续完成实时定位解算,使得系统可用性得到显著改善。
     
     
    基于CTM模型的观点挖掘和可视化
    马长林,谢罗迪,陈梦丽
    2018, 40(04): 745-751. doi:
    摘要 ( 201 )   PDF (821KB) ( 246 )      评审附件
    如何从海量文本中自动提取有价值的观点信息已成为重要的技术挑战,当下的观点挖掘方法大多数是在假设主题相互独立的前提下进行的,但实际上主题与主题之间有着复杂的内在联系。为解决以上问题,在CTM模型的基础上提出了基于主题情感混合的主题相关模型,在考虑到主题相关性的同时,还分析了对应主题下的观点特征以及潜藏的情感倾向,更为精确地获取了文档主题的情感极性,仿真实验验证了本模型的有效性,并使用R语言进行了可视化实验分析。

     
    基于PSO优化GRNN的语音转换方法
    王民,杨秀峰,要趁红
    2018, 40(04): 752-756. doi:
    摘要 ( 102 )   PDF (593KB) ( 198 )      评审附件
    提出了一种基于粒子群算法PSO优化广义回归神经网络GRNN模型的语音转换方法。首先,该方法利用训练语音的声道和激励源的个性化特征参数分别训练两个GRNN,得到GRNN的结构参数;然后,利用PSO对GRNN的结构参数进行优化,减少人为因素对转换结果的影响;最后,对语音的韵律特征、基音轮廓和能量分别进行了线性转换,使得转换后的语音包含更多源语音的个性化特征信息。主客观实验结果表明:与径向基神经网络RBF和GRNN相比,使用本文提出的转换模型获得的转换语音的自然度和似然度都得到了很大的提升,谱失真率明显降低并且更接近于目标语音。
     
    制造企业供应商排序决策:#br# 基于SVM和TFN-RS的改进TOPSIS
    李联辉,王丽,雷婷,丁少虎
    2018, 40(04): 757-764. doi:
    摘要 ( 74 )   PDF (664KB) ( 211 )      评审附件
    考虑制造企业供应链的绿色内涵,构建供应商排序指标体系。为解决指标数量众多、计算方式复杂、协调困难等问题,构造一种基于SVM和TFNRS的改进TOPSIS方法来进行供应商排序决策。首先根据候选供应商的主要数据信息,应用基于SVM的分类模型对其进行初步筛选,以缩小候选供应商数量;通过专家对准则下属指标进行考察和掌握,利用专家的智慧和经验对准则进行TFN评分,设计一种TFNRS方法来计算供应商在准则上的分值;运用CRITIC方法对各准则进行赋权;最后通过相对熵替代欧氏距离的改进TOPSIS对各供应商进行排序。以某轴承制造企业的滚球供应商排序决策为例,验证了该方法的实用效果。