Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    论文
    基于私有云和物理机的混合型大数据平台设计及实现
    王永坤1,罗萱1,金耀辉1,2
    2018, 40(02): 191-199. doi:
    摘要 ( 163 )   PDF (916KB) ( 345 )      评审附件
    大数据分析技术的广泛应用离不开大数据平台的支撑,构建大数据平台已经是很多企业和机构的重要需求。构建大数据平台需要复杂的系统性的技术,特别是需要考虑系统性能和可扩展性两方面需求。随着数据体量不断增大、用户需求不断增多,规划时的数据平台规模很可能不能满足不断变化的需求。因此,设计了一种混合的大数据平台架构:混合使用物理服务器和私有云云主机的大数据平台。这样就兼顾了性能和可扩展性:由于物理服务器性能一般要高于云上的虚拟机,所以构建在物理服务器上的大数据平台,性能一般要好于构建在私有云上大数据平台;从私有云上启动云服务器非常方便、快捷,所以大数据平台的计算和存储结点可以动态弹性地扩容到私有云上,从而保证高峰期的时候大数据平台仍然可以有充足的处理能力。在生产环境实现了这种混合型设计,在生产环境中的测试也表明了这种设计的有效性。
     
    基于网络包延迟偏差的硬件动态拥塞控制机制
    任秀江1,斯添浩1,周建毅1,谢向辉2
    2018, 40(02): 200-209. doi:
    摘要 ( 117 )   PDF (1737KB) ( 284 )      评审附件

    互连网络已经成为提升高性能计算系统性能的技术瓶颈。对高性能互连网络中的拥塞控制进行研究,针对通信热点的形成过程,给出了一种基于网络包延迟偏差的硬件动态拥塞控制机制CMDPD,利用网络包传输延迟偏差预判网络拥塞状态,控制端到端网络注入,避免拥塞形成。构建了模拟环境,在Fat-tree和Dragonfly两种网络结构下,对CMDPD进行了模拟实验。结果表明,在Fat-tree网络中CMDPD的吞吐率可提高5%~12%。

    基于Spark的并行遗传算法求解多峰函数极值
    刘鹏1,2,叶帅3,孟磊1,2,王灿4
    2018, 40(02): 210-217. doi:
    摘要 ( 171 )   PDF (1301KB) ( 407 )      评审附件

    遗传算法求解多峰函数极值需进行反复多次的迭代运算,面对大数据样本时会出现运算效率过低的现象,这极大地限制了遗传算法的实际应用。经典Hadoop并行平台可在一定程度上提高遗传算法的运行效率,而新一代Spark并行平台可以更加充分地发挥遗传算法的并行潜能。设计并实现了基于Spark的并行遗传算法,在各个子节点上并行执行子种群个体的交叉、变异等操作,达到了高度并行化进化种群以高效求取多峰函数极值的目的。为方便比较,同时设计并实现了单机及Hadoop平台下的相应算法。实验结果表明,处理大数据样本时,相比传统单机和Hadoop平台,基于Spark的并行化遗传算法显著降低了求解多峰函数极值的耗时,大幅提高了算法的效率;同时,由于其并行计算带来的强大随机性,也有效避免了种群单一过早收敛的问题,提高了算法的准确性。

    一款高精度数控振荡器设计与实现
    赵信,潘天锲,王飙
    2018, 40(02): 218-223. doi:
    摘要 ( 185 )   PDF (898KB) ( 230 )      评审附件
    数控振荡器是全数字锁相环的关键部件,为其提供高频输出时钟。数控振荡器的性能直接影响全数字锁相环的频率范围和抖动性能。提出了一种基于全数字标准单元库设计的数控振荡器,该结构采用粗调、中调和精调级联的调节机制,实现了0.5 GHz~2.6 GHz的高频率范围和0.8 ps的高调节精度。在先进工艺下实现了该数控振荡器设计,并基于此数控振荡器完成了全数字锁相环的系统设计,系统抖动小于2 ps,功耗10 mW。
     
    异构高性能计算系统Linpack效率受限因素分析
    贾迅,邬贵明,谢向辉
    2018, 40(02): 224-230. doi:
    摘要 ( 300 )   PDF (487KB) ( 425 )      评审附件

    能耗是目前高性能计算系统性能提升的一大挑战。主处理器连接加速器的异构计算技术可以有效提升系统能效,因而被广泛应用于当前高性能计算系统的设计。同等系统规模下,异构计算系统的Linpack效率普遍低于同构系统。针对这一问题,从结构设计的角度,基于真实计算系统的设计参数和性能数据,分析了大规模异构高性能计算系统Linpack效率受限的主要因素及其对结构设计的需求,并构建了针对异构计算系统的Linpack性能模型对分析结论进行了验证。研究成果对异构计算系统Linpack的性能优化以及未来高效异构架构的设计具有一定的指导意义。

    基于日志挖掘的电商查询建议方法
    王菁1,2,王若飞1,2
    2018, 40(02): 231-237. doi:
    摘要 ( 146 )   PDF (657KB) ( 269 )      评审附件
    查询建议可以有效减少用户输入、消除查询歧义,提高信息检索的便捷性和准确率。随着电子商务的发展,查询建议也越来越多地应用于电子商务网站的商品搜索中。然而,传统的基于Web搜索的查询建议方法在电商领域并不能完全适用。针对电商这一特定领域,对不同的查询建议技术进行比较,提出了一种综合考虑用户的搜索以及购物行为的查询建议方法,运用MapReduce技术对用户日志进行挖掘,以此生成检索词词库;并通过在线计算与离线计算结合的方法,为用户提供实时查询建议。实验结果表明,本文提出的基于日志挖掘的电商查询建议方法能有效提高查询建议的准确率,并且具有良好的处理性能。
     
    改进的模糊聚类在控制系统故障诊断中的应用
    王印松,商丹丹,王艳飞,张婉君
    2018, 40(02): 236-330. doi:
    摘要 ( 130 )   PDF (548KB) ( 224 )      评审附件
    为了提高控制系统中传感器与执行器故障诊断的准确性,结合小波分析特征提取的优势和密度函数加权模糊C-均值聚类具有较好分类效果的特点,提出了一种新的控制系统故障诊断方法。该方法首先利用小波分析对故障信号进行特征提取,降低噪声的影响;然后对特征提取后的数据通过加权模糊C-均值聚类算法,对故障进行识别分类。实验表明,基于小波分析和加权模糊C-均值聚类相结合的方法,不仅可以识别不同部件的故障,而且可以对同一部件的不同类型的故障进行诊断。

     
    基于EKSC算法的网络事件热度预测方法
    张茂元,孙树园,王奕博,孟琼瑶,王琦
    2018, 40(02): 238-245. doi:
    摘要 ( 188 )   PDF (904KB) ( 565 )      评审附件
    随着互联网的发展,有效地对网络舆情进行监管和引导对社会的和谐稳定具有重要意义,网络事件的热度预测是舆情监管的重要组成部分。针对传统方法在预测的过程中忽视了事件时间序列中蕴含的时态信息和关联性,提出了一种基于EKSC算法的网络热点事件热度预测模型。该模型使用EKSC算法对每类已知网络舆情事件的时间序列进行聚类,并构建类模型库。对待预测事件已知的热度时间序列进行缩放变化,并使用最小二乘法选取类模型库中均方误差和最小的模型对该事件进行预测。实验表明,该方法能够对网络热点事件的热度进行有效的预测。
     
     
    基于聚类分析优化的距离修正室内定位算法
    杜佳星,陈亚伟,张静
    2018, 40(02): 246-254. doi:
    摘要 ( 107 )   PDF (998KB) ( 277 )      评审附件
    基于接收信号强度RSSI的定位系统易受环境影响,提出一种基于聚类算法分析的高斯混合滤波的RSSI信号处理优化策略,通过优化接收信号强度及距离修正的四边质心定位算法对未知节点进行精确室内定位,使用蓝牙4.0信标节点进行实地实验。实验结果表明,该算法可以有效提高测距精度,改善系统的定位精度,比传统加权质心算法的定位精度提高了34.6%,且定位平均误差不超过0.5 m,可满足室内定位精度要求。
     
    基于演化博弈的多用户网络选择算法
    唐夲1,2,李乐2,肖静薇1,吴维农1,冯文江2
    2018, 40(02): 255-260. doi:
    摘要 ( 112 )   PDF (889KB) ( 297 )      评审附件

    无线通信技术的发展和演进,使得多种广域蜂窝网和大量无线局域网共存、重叠。针对热点区域,密集分布的大量用户同时发起同种业务请求应用场景,提出一种基于演化博弈的多用户网络选择算法,依据选择网络的用户数设计效用函数,给出了演化博弈的复制动态方程。与RSSI算法的对比仿真结果表明:该算法能快速达到演化均衡,用户平均收益高于RSSI算法,接入网络的用户分布更均衡,能合理利用网络资源。

    免疫入侵检测多目标优化克隆选择算法研究
    张凤斌,范学林,席亮
    2018, 40(02): 261-267. doi:
    摘要 ( 117 )   PDF (678KB) ( 185 )      评审附件
    免疫入侵检测理论中克隆选择是检测器进化的关键。传统克隆选择算法通过比较样本间的亲和力累加值筛选样本,该方法具有较低的时间复杂度,但也造成了检测器的高重叠,影响迭代效率。将检测器个体的筛选与进化转化为pareto最优解的求解过程,提出了多目标优化理论的检测器克隆选择算法。实验表明,检测器基数不变的情况下,该算法明显提升了每代种群在进化过程中的检测范围,精简了记忆检测器的数量,提高了检测阶段系统的检测率。

     
    PAR平台中若干软件构件形式化验证技术研究
    胡启敏1,2,薛锦云 1,2,游珍1,2,程着1,2
    2018, 40(02): 268-274. doi:
    摘要 ( 162 )   PDF (462KB) ( 215 )      评审附件
    PAR平台是本团队研制成功的支撑软件形式化和自动化开发的软件平台。该平台充分体现了功能抽象和数据抽象的优越性,使得软件开发变得便捷和可靠,达到这一性能的关键要素是一批可重用软件构件。为保证整个软件平台的正确性和可靠性,确保其中软件构件的正确性和可靠性就显得十分重要。选取PAR平台中若干典型软件构件,用形式化方法对构件的语义进行形式化描述,并借助Coq定理证明系统,对构件的正确性进行形式化验证,大幅度提高了软件构件形式化验证的效率。
     
    基于改良程序谱的软件故障定位方法
    余晓菲,张仕,蔡蕊,陈慧峰,蒋建民
    2018, 40(02): 275-281. doi:
    摘要 ( 144 )   PDF (667KB) ( 309 )      评审附件

    故障定位是软件调试过程中一项耗时耗力的工作,自动化查错的应用对于提高软件调试效率具有重要的现实意义。近年来,基于程序谱的故障定位方法得到了研究人员的大量关注。针对单错误现象,提出了基于改良程序谱的软件故障定位新方法,该方法基于“在单错误情况下,若测试用例运行错误,则该测试用例运行必定覆盖了故障语句”这一论断,将所有的故障测试用例对程序语句的覆盖情况做交运算,从而得到故障基,再利用故障基定位故障。最后,以西门子测试程序集为测试数据,对比了不同方法对故障定位的效果和效率的影响,其结果表明所提出的方法可以有效地提高故障定位的效果和效率。

    人数统计与人群密度估计技术研究现状与趋势
    张君军,石志广,李吉成
    2018, 40(02): 282-291. doi:
    摘要 ( 222 )   PDF (776KB) ( 1373 )      评审附件
    人数统计与人群密度估计是人群分析中的重要分支,也是视频监控所关注的重要信息之一。尽管近几十年来该领域取得了一些重要进展,但仍存在一些具有挑战性的问题。综述了基于计算机视觉的人数统计与人群密度估计方法的研究现状以及发展动态。首先,介绍了人数统计与人群密度估计技术的发展背景及应用方向。其次,总结了近年来提出的比较重要的方法,从机器学习的角度,将其分为浅层学习的方法和深度学习的方法;而从学习到的模型角度又可将其分为直接的方法(即基于检测的方法)和间接的方法(如基于像素的方法、基于纹理的方法以及基于角点的方法)。详细介绍了近二十年来基于浅层学习的方法,并对近些年来基于深度学习的人数统计与人群密度估计技术做了一个简要的总结。然后,对人数统计及人群密度估计方法性能评估技术进行简介,并提供了几个用于人数统计与人群密度估计的测试与评估数据集。最后,总结了该领域存在的技术挑战并对未来的研究方向进行了展望。

     
    改进的SURF算法在书法笔画匹配识别中的应用
    王民,庞爽爽,周军妮
    2018, 40(02): 292-297. doi:
    摘要 ( 107 )   PDF (786KB) ( 228 )      评审附件
    书法笔画具有丰富的书写人特征,能否正确进行特征向量提取和匹配直接影响识别效果。针对SURF算法检测特征点少、误匹配率高的问题,提出了一种基于Contourlet变换的SURF算法。该算法利用Contourlet变换,在提取特征点前对书法字笔画进行子带分解(LP)和方向性滤波(DFB),得到低频和高频细节分量,采用最小欧氏距离准则(LEDC)对低频细节分量进行相似性计算,高频细节分量进一步分解后选取合适阈值提取高频特征点,然后进行SURF特征点匹配,采用RANSAC算法剔除误匹配点。实验表明,改进的SURF算法不仅能更好地提取笔画特征点,提高抗噪性能,识别率也提高了3%。
     
    一种脑电信息监督人脸图像的注意力分析方法
    刘冀伟1,史尹嘉1,白羽1,严朝雯2
    2018, 40(02): 298-303. doi:
    摘要 ( 133 )   PDF (510KB) ( 307 )      评审附件

    利用计算机视觉技术智能分析处于任务中的人的专注度问题。通过对人脸图像视频和对应脑电信号的采集和分析处理,建立连续的面部图片对应脑电信息的样本库,提出一种在脑电信息监督面部图片专注度的前提下,使用人的面部信息分析其专注度的方法。根据在多分布样本下训练的支持向量机分类器的识别结果,面部信息与其专注度确实存在相关关系,所以利用人脸图片分析任务中人的专注度是可行性的,并为后续的状态分析提供客观数据。

    面向谐波分析的电力系统数字仿真系统研究
    王同勋1,李寒2,3,周胜军1,李亚琼1,谈萌1
    2018, 40(02): 304-312. doi:
    摘要 ( 97 )   PDF (1772KB) ( 266 )     
    随着现代电网规模的不断扩大和谐波污染的不断加深,对电力系统中的谐波进行仿真分析的需求越来越迫切。针对现有电力系统数字仿真系统在谐波分析功能完整性和扩展性方面存在的不足,结合计算机可视化技术、Web技术和谐波分析技术,探讨并设计了面向谐波分析的电力系统数字仿真系统。该系统充分考虑谐波分析和用户的使用需求,支持传统和新型的谐波分析模型,采用SVG和JavaScript技术支撑单线图的可视化绘制,采用SVG和JavaScript实现结果的可视化。文中给出的仿真实例验证了面向谐波分析的电力系统数字仿真系统的可行性。该系统能够有效支撑多种类型的谐波分析,增强谐波分析的直观性,并具有良好的交互性和可扩展性。

     
    基于词向量语义聚类的微博热点挖掘方法
    刘培磊,唐晋韬,王挺,谢松县,岳大鹏,刘海池
    2018, 40(02): 313-319. doi:
    摘要 ( 114 )   PDF (615KB) ( 542 )     
    随着社交媒体的迅速发展,信息过载问题越发严重,因此如何从海量、短小而充满噪声的社交媒体数据中发现和挖掘出热点话题或者热点事件成为一个重要的问题。结合社交媒体数据实时性、地理性、包含较多元数据等特点,提出了用户行为分析与文本内容分析相结合的热点挖掘方法。在内容分析过程中,提出了从更细的词语粒度进行聚类,以代替传统的在消息粒度进行聚类的经典方法。为了提高话题关键词提取的效果,引入了基于词向量技术,并通过语义聚类的方法进行热点挖掘。在真实数据集上的实验结果表明,该方法提取的关键词语义关联性强、话题划分效果好,在主要指标上优于传统的热点挖掘方法。

     
    基于多维度体感信息的在线考试异常行为监测
    范子健,徐晶,刘威
    2018, 40(02): 320-325. doi:
    摘要 ( 120 )   PDF (928KB) ( 237 )      评审附件
    考试者监测是在线考试面临的主要难题之一。传统监测方案主要集中在考试者的身份识别方面,缺乏对考试者异常行为的有效识别。面向在线考试异常行为监测,提出通过体感数据采集仪Kinect获得考试者的骨骼关节点位置以及头部偏转角度等姿态数据,判别在线考试过程中考试者的异常行为。同时,针对单一的动作事件判别方法存在的虚警率高的问题,提出利用多维度体感信息识别考试者行为的新思路。通过分析一个时间窗口内异常事件发生的频次以及持续时间等信息,判断考试者当前的行为是否异常。实验表明,所提方案可以有效地监测考试者在考试过程中出现的异常行为。

     
    一种求解二维矩形Packing问题的拟人型全局优化算法
    邓见凯1,2,王磊1,2,尹爱华3
    2018, 40(02): 331-340. doi:
    摘要 ( 153 )   PDF (652KB) ( 307 )     
    针对二维矩形Packing问题,提出了基于占角动作的基本算法。以基本算法为基础,提出了三阶段优化的拟人型全局优化算法。在第一阶段生成初始布局。在第二阶段交替调用邻域搜索子程序和跳坑策略子程序对矩形块的优先级排序进行优化。邻域搜索采用交换式和插入式两种邻域结构,避免单一邻域结构的局限性。当搜索遇到局部最优解时,采用跳坑策略子程序跳出局部最优解,将搜索引向有希望的区域。在第三阶段调用优美度枚举子程序对占角动作的选择作进一步优化。提出了两条优度定理。对于六组benchmark测试用例的实验结果表明,算法的整体表现优于当前文献中的先进算法。针对矩形块方向固定的情形,算法对zdf6和zdf7两个问题实例得到了比已有文献记录更优的布局。
     
    基于改进禁忌搜索的基站布局优化算法
    陈诗军1,王慧强2,陈大伟1,刘秀兵2,胡海婧2
    2018, 40(02): 341-347. doi:
    摘要 ( 114 )   PDF (843KB) ( 297 )      评审附件

    由于室内定位场景的非视距特点,基站布局对于蜂窝网的定位精度具有重要影响,而目前基站布局仅关注容量、覆盖、信号质量,尚未考虑对室内定位精度的影响。提出了一种改进禁忌搜索的基站布局优化算法ITSA,改进了代价函数、邻域产生规则和解禁规则。对所提出的算法在相同的室内场景中仿真实验,结果说明,相比RFID读写器部署优化算法,该算法能够更好地降低定位区域的整体误差。

    面向兴趣主题的个性化好友推荐
    齐会敏,刘群,戴大祥
    2018, 40(02): 348-353. doi:
    摘要 ( 107 )   PDF (594KB) ( 225 )      评审附件
    个性化的好友推荐是促进社交网络服务不断提高的重要途径,在大规模的社交网络环境中,准确地为用户推荐兴趣主题相似的好友能够使得用户的粘性更强,然而海量数据的稀疏性使得现有的大多数社交网络都不能够准确根据用户间兴趣的相似性进行好友推荐。为此,提出一种面向用户兴趣主题的个性化好友推荐方法(ITOR)。该方法首先采用k-core分析法提取用户的兴趣主题,在拥有相似兴趣主题的基础上结合用户属性信息,通过先验概率计算出有相同属性信息的用户成为好友的概率,进一步强化推荐结果的准确性和满意度。最后,通过爬取2015年9月份发布的新浪微博数据进行实验分析,验证了本推荐方法的有效性。
     
     
    基于残差的优化卷积神经网络服装分类算法
    张振焕,周彩兰,梁媛
    2018, 40(02): 354-360. doi:
    摘要 ( 171 )   PDF (644KB) ( 384 )      评审附件
    针对目前服装分类算法在解决多类别服装分类问题时分类精度一般的问题,提出了一种基于残差的优化卷积神经网络服装分类算法,在网络中使用了如下三种优化方法:(1)调整批量归一化层、激活函数层与卷积层在网络中的排列顺序;(2)“池化层+卷积层”的并行池化结构;(3)使用全局均值池化层替换全连接层。经过由香港中文大学多媒体实验室提供的多类别大型服装数据集(DeepFashion)和标准数据集CIFAR-10上的实验表明,所提出的网络模型在处理图片的速度和分类精度方面都优于VGGNet和AlexNet,且得到了目前为止已知的在DeepFashion数据集上最好的分类准确率。该网络也可以更好地应用于目标检测和图像分割领域。

     
    一种基于全局和局部特征匹配的流形对齐算法
    徐猛,王靖
    2018, 40(02): 361-367. doi:
    摘要 ( 125 )   PDF (883KB) ( 381 )      评审附件
    不同流形样本点之间的关联性挖掘是决定流形对齐算法效率的关键问题。提出了一种新的思路,利用测地距离初步构造不同流形样本点之间的关联性,再利用样本点之间局部几何结构的相似性进行修正,以更为准确地挖掘不同流形样本点之间的关联性。进一步提出一种新的半监督流形对齐算法,利用已知对应点信息和所挖掘样本点之间的关联性,将多个流形数据投影到共同的低维空间。与传统的半监督流形对齐算法相比,本算法在先验信息不充分的情况下,能更准确地联结不同流形数据集。最后通过在实际数据集上的实验验证了算法的有效性。
     
     
    基于词向量与可比语料库的双语词典提取研究
    柳路芳1,李波1,陈鹏1,周凌寒1,王兵2
    2018, 40(02): 368-373. doi:
    摘要 ( 95 )   PDF (570KB) ( 308 )      评审附件
    双语词典是跨语言信息检索以及机器翻译等自然语言处理应用中的一项重要资源。现有的基于可比语料库的双语词典提取算法不够成熟,抽取效果有待提高,而且大多数研究都集中在特定领域的专业术语抽取。针对此不足,提出了一种基于词向量与可比语料库的双语词典提取算法。首先给出了该算法的基本假设以及相关的研究方法,然后阐述了基于词向量利用词间关系矩阵从可比语料库中提取双语词典的具体步骤,最后将该抽取方法与经典的向量空间模型做对比,通过实验分析了上下文窗口大小、种子词典大小、词频等因素对两种模型抽取效果的影响。实验表明,与基于向量空间模型的方法相比,本算法的抽取效果有着明显的提升,尤其是对于高频词语其准确率提升最为显著。
     
    一种基于MRⅡ算法的三层二值双向联想记忆网络
    徐彦,熊迎军
    2018, 40(02): 374-380. doi:
    摘要 ( 87 )   PDF (654KB) ( 222 )      评审附件

    传统的两层二值双向联想记忆(BAM)网络因其结构的限制存在着存储容量有限、区分小差别模式和存储非正交模式能力不足的缺陷,结构上将其扩展至三层网络是一个有效的解决思路,但是三层二值BAM网络的学习是一个难题,而三层连续型BAM网络又存在处理二值问题不方便的问题。为了解决这些问题,提出一种三层结构的二值双向联想记忆网络,创新之处是采用了二值多层前向网络的MR Ⅱ算法实现了三层二值BAM网络的学习。实验结果表明,基于MR Ⅱ算法的三层二值BAM网络极大地提高了网络的存储容量和模式区分能力,同时保留了二值网络特定的优势,具有较高的理论与实用价值。