Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2018年第7期目录
    2018, 40(07): 0-0. doi:
    摘要 ( 7 )   PDF (292KB) ( 24 )     
    高性能计算
    飞腾1500A处理器性能分析工具Likwid研究
    彭林1,方建滨1,杜琦1,唐滔1,黄春1,杨灿群1,2
    2018, 40(07): 1147-1154. doi:
    摘要 ( 184 )   PDF (576KB) ( 360 )     
    在飞腾1500A处理器平台对程序性能分析工具Likwid展开研究,主要研究了飞腾1500A处理器硬件拓扑信息的获取、性能监测单元PMU的访问以及性能分析工具的使用和数据分析。通过hwloc获取飞腾1500A处理器的硬件信息,给程序员提供关于飞腾1500A处理器的拓扑结构及相关概要信息;编写内核驱动模块使能飞腾1500A处理器的性能监控单元,指定事件类型,通过对应硬件计数器记录目标程序执行过程中事件发生的次数;结合简单代码和模板化的微基准测试程序,使用性能分析工具收集程序执行过程中相关数据,进行性能分析。

     
    基于负载基尼系数的服务网络公平均衡调度
    陈华鹏1,2,林杰1
    2018, 40(07): 1155-1164. doi:
    摘要 ( 135 )   PDF (1143KB) ( 315 )     
    针对组织结构较为稳定的区域内服务网络,提出了一种有监督的公平均衡负载调度算法。该算法受到经济学领域的收入分配基尼系数的启发,通过对网络负载分配基尼系数的监控,最终完成区域内服务任务的公平调度。给出了实现公平任务调度所需的系统结构和算法步骤,并通过仿真结果验证了该方法能有效完成服务网络任务均衡调度,具有较好的全局公平性。
     
    基于Kalman滤波的云数据中心能耗和性能优化
    何丽,汤莉
    2018, 40(07): 1165-1172. doi:
    摘要 ( 134 )   PDF (682KB) ( 261 )      评审附件
    云数据中心虚拟机的动态整合需要跟踪服务器的运行状态,而服务器的运行状态会受到数据中心负载变化的影响,现有的CPU使用率预测方法大都只关注当前服务器的CPU利用率变化。提出了一个基于Kalman滤波的CPU使用率预测模型,建立了基于所有服务器CPU使用率变化系数的数据中心负载变化模型,详细描述了基于Kalman滤波的CPU使用率预测方法,讨论了云数据中心的能耗和性能评价指标。最后,为了验证基于Kalman滤波的CPU使用率预测算法的有效性,在CloudSim仿真系统和PlanetLab的五个数据集上进行了实验。实验结果表明,Kalman滤波能够较好地反映服务器CPU使用率的变化趋势,有效地降低数据中心的能耗,并保持较好的计算性能。
     
    基于时间感知排序的云服务QoS预测方法研究
    蒋冰婷1,胡志刚1,马华2,姚景1
    2018, 40(07): 1173-1179. doi:
    摘要 ( 135 )   PDF (695KB) ( 229 )      评审附件

    随着云计算理论和技术的成熟,越来越多的云服务得到了蓬勃发展,如何建立高质量的云服务成为了云计算研究领域的一个关键难题。服务质量QoS排序为用户从一系列功能相似的云服务候选者中挑选最优云服务提供了非常有价值的信息。为了获得云服务的QoS值,就需要调用真实的候选云服务。为了避免时间消耗和昂贵的资源浪费,提出了一种基于时间感知排序的云服务QoS预测方法。不同于传统的QoS值预测,基于QoS排序相似度的预测考虑为特定用户检测服务的排序。分时段按权计算出排序相似度,结合时间偏好合成相似度的前k位用户,用来提供信息支持QoS的缺失预测。在WSDream真实数据集进行的实验研究表明,基于时间感知排序的云服务QoS预测方法有更好的预测精度。

    基于大数据的异常检测方法研究
    杨先圣1,姜磊1,彭雄2,周倩1,刘菊君1
    2018, 40(07): 1180-1186. doi:
    摘要 ( 236 )   PDF (776KB) ( 430 )      评审附件

    离群数据检测,主要目的是从海量数据中发现异常数据。其有以下两点好处:第一,作为数据预处理工作,减少噪声点对模型的影响;第二,针对特定场景检测出异常,并对异常现象本身进行挖掘,也非常有价值。目前,国内外主流的方法像LOF、KNN、ORCA等,无法兼顾全局离群点、局部离群点和离群簇同时存在的复杂场景的检测。
    针对这一情况,提出了一种新的离群数据检测模型。为了能够最大限度对全局、局部离群数据以及离群簇的全面检测,基于iForest、LOF、DBSCAN分别对于全局离群点、局部离群点、离群簇的高度敏感度,选定该三种特定基分类器,并且改变其目标函数,修正框架的错误率计算方式,进行融合,形成了新的离群数据检测模型ILD-BOOST。实验结果表明,该模型充分兼顾了全局和局部离群数据及离群簇的检测,且效果优于目前主流的离群数据检测方法。

    基于主成分分析和对数几率回归的硬件木马检测
    张金玲1,吕蕾2
    2018, 40(07): 1187-1191. doi:
    摘要 ( 166 )   PDF (482KB) ( 268 )      评审附件
    提出基于主成分分析和对数几率回归的硬件木马检测模型,以提高对硬件木马芯片的检测性能。对采集的旁路功耗信号进行主成分分析组合并选择主要特征,屏蔽信号噪声影响,简化计算操作。利用对数几率回归算法训练分类器,通过计算芯片包含和不包含木马可能性对数比率进行硬件木马识别。设计并搭建FPGA实验平台进行模型验证,通过查准率和查全率评估模型性能。实验结果表明,此模型能够准确高效地检测出硬件木马。
     
    计算机网络与信息安全
    基于多授权中心属性基加密的多域云访问控制方案
    杨小东,杨苗苗,刘婷婷,王彩芬
    2018, 40(07): 1192-1198. doi:
    摘要 ( 157 )   PDF (663KB) ( 256 )     
    针对多授权属性基加密方案的合谋攻击和多域共享数据问题,提出了一种基于多授权中心属性基加密的多域云访问控制方案。中央认证机构不参与用户私钥的生成过程,有效避免了用户与授权机构之间的联合攻击;通过线性秘密共享方案和代理重加密技术,云服务器对上传的数据文件进行重加密,实现了单域和多域用户数据的共享。分析结果表明,新方案在用户私钥生成和文件加/解密上具有较高的性能,并在qparallel BDHE假设下是自适应性安全的。

     
    ESF算法的相关密钥不可能差分分析
    谢敏,杨盼
    2018, 40(07): 1199-1205. doi:
    摘要 ( 150 )   PDF (963KB) ( 240 )     
    ESF算法是一种具有广义Feistel结构的32轮迭代型轻量级分组密码。为研究ESF算法抵抗不可能差分攻击的能力,首次对ESF算法进行相关密钥不可能差分分析,结合密钥扩展算法的特点和轮函数本身的结构,构造了两条10轮相关密钥不可能差分路径。将一条10轮的相关密钥不可能差分路径向前向后分别扩展1轮和2轮,分析了13轮ESF算法,数据复杂度是260次选择明文对,计算量是223次13轮加密,可恢复18 bit密钥。将另一条10轮的相关密钥不可能差分路径向前向后都扩展2轮,分析了14轮ESF算法,数据复杂度是262选择明文对,计算复杂度是243.95次14轮加密,可恢复37 bit密钥。
     
    (p,k)匿名数据集的增量更新算法
    贾俊杰,闫国蕾,邢里程,陈菲
    2018, 40(07): 1206-1212. doi:
    摘要 ( 110 )   PDF (611KB) ( 254 )     

    随着大数据时代的到来,数据数量呈指数形式增长,一次性发布所有的数据已无法满足实时掌握数据的需求,提出(p, k)匿名增量更新算法,动态更新匿名发布数据表。为避免数据动态更新时造成隐私泄露,算法利用加密技术对敏感属性进行保护,建立暂存表及临时表辅助待更新数据及时插入。(p, k)匿名增量更新算法改善了传统算法无法实时更新数据的问题,保证了数据的实时性,并利用加密技术增强了数据的隐私保护性。实验结果表明,(p, k)匿名增量更新算法在较少信息损失量以及较快更新速率的情况下,实现了数据实时更新的目标。

    图形与图像
    基于稠密光流和边缘特征的烟雾检测算法
    林成忠1,张为1,王鑫2,刘艳艳3
    2018, 40(07): 1213-1220. doi:
    摘要 ( 142 )   PDF (917KB) ( 534 )     
    为了克服传统火灾烟雾检测技术的缺陷,提高视频烟雾检测算法的检测率,通过观察烟雾运动的特性,提出一种基于稠密光流和边缘特征的烟雾检测算法。该算法首先利用混合高斯背景建模和帧差相结合的方法提取运动区域,然后将此运动区域池化为上、中、下三部分,并在每个池化区域提取光流矢量特征和边缘方向直方图。考虑到烟雾运动在时域中的连续相关性,提取相邻三帧的烟雾特征向量以提高算法的鲁棒性。最后使用支持向量机进行训练和烟雾检测。实验结果表明,该算法在测试视频集上准确率超过94%,与现有方法相比,能更好地适应实际应用中复杂的环境条件。
     
    狼群优化的二维Otsu快速图像分割算法
    曹爽,安建成
    2018, 40(07): 1221-1226. doi:
    摘要 ( 136 )   PDF (788KB) ( 258 )     
    传统二维Otsu算法的阈值选取大都采用穷尽搜索方式,造成算法分割时间较长、实时性差等缺点,影响图像分割效果。为提高算法的运行效率,采用狼群算法来搜索最优阈值,每匹人工狼代表一个可行的二维阈值向量,狼群通过游走、召唤、围攻这三种智能行为的不断迭代以及狼群间的信息交互来获取最佳阈值。仿真结果表明,与标准粒子群优化二维Otsu算法和传统二维Otsu算法相比,狼群优化算法降低了分割时间并提高了图像分割精度。

     
    混合鲁棒权重和改进方法噪声的两级非局部均值去噪
    陆海青1,2,葛洪伟1,2
    2018, 40(07): 1227-1236. doi:
    摘要 ( 134 )   PDF (977KB) ( 258 )     
    传统非局部均值去噪算法采用指数型函数计算相似性权重,不能准确反映图像块之间的相似性;现有两级非局部均值去噪算法对方法噪声的获取以及方法噪声中所含信息的利用不够充分。针对上述问题,提出一种混合鲁棒权重和改进方法噪声的两级非局部均值去噪算法。首先采用一种改进的混合鲁棒权重函数来计算图像块的相似性权重;再利用预去噪后的图像构造新的方法噪声,并与两级去噪框架相结合;最后将提出的混合鲁棒权重函数和改进的方法噪声应用到两级非局部均值去噪方法中。实验结果表明,该算法既能准确地反映图像块之间的相似性,也能充分利用方法噪声的信息,且在去噪性能与结构细节保持能力方面均优于传统算法。
     
    基于改进分数阶SVD的块协作表示的小样本人脸识别算法
    张建明1,2,廖婷婷1,2,吴宏林1,2,刘宇凯1,2
    2018, 40(07): 1237-1243. doi:
    摘要 ( 107 )   PDF (706KB) ( 275 )     

    随着训练样本数目减少,传统人脸识别方法的性能会急剧下降,因此提出了改进的分数阶SVD(IFSVDR)的块协作表示算法,以提高小样本下人脸识别率。为了减少噪声对分类的干扰,对SVD算法进行改进,利用分数阶增大主要正交基权值,提高特征的判别力;对相对较小权值进行抑制,降低噪声的干扰。然后,将得到的特征图像用基于块的协作表示算法进行分类(PCRC)。相对传统稀疏分类算法,PCRC融合了集成学习,能更好地解决小样本问题,且CRC计算复杂度低于SRC。在扩展的Yale B和AR人脸数据库上的实验表明,本文提出的算法在单样本的情况下也有较高的识别率。

    基于分层识别的快速说话人识别研究
    茅正冲,涂文辉
    2018, 40(07): 1244-1249. doi:
    摘要 ( 127 )   PDF (538KB) ( 202 )     
    随着说话人模型数量的增加,说话人识别系统的识别速度下降,不能满足实时性要求。针对这个问题,提出了基于分层识别模型的快速说话人识别方法。将变分法求解的KL散度的近似值作为模型间的相似性度量准则,并设计了说话人模型聚类的方法。结果表明,本文方法能够保证说话人模型聚类结果的有效性,在系统识别率损失很小的情况下,使系统的识别速度得到大幅度提升。

     
    基于引导滤波和shearlet稀疏的遥感图像融合算法
    王威1,2,张佳娥1,2
    2018, 40(07): 1250-1255. doi:
    摘要 ( 89 )   PDF (687KB) ( 236 )     
    针对遥感图像空间分辨率和光谱分辨率不可兼得的情况,
    结合多尺度变换与稀疏表示,提出一种shearlet稀疏基与引导滤波共同作用的遥感图像融合算法。以IHS融合模型为基础,利用引导滤波作拟合处理,再用shearlet变换分解亮度图像和全色图像,得到图像的高低频子带系数。
    对低频子图进行稀疏化处理并获取最优稀疏系数,稀疏系数以图像块活跃度取大的标准进行替换融合。
    基于区域能量和区域方差融合处理对应的高频子图,再利用shearlet反变换获取融合结果。
    实验结果表明,本文算法能提高图像清晰度以及光谱保留度,在图像完整度和细节考量上远好于其他算法。
    基于垂直区域回归网络的自然场景文本检测
    杨国亮,王志元,张雨,康乐乐,胡政伟
    2018, 40(07): 1256-1263. doi:
    摘要 ( 163 )   PDF (811KB) ( 249 )     
    由于自然场景下文本检测不同于传统的物体检测,直接采用RPN算法对文本检测会有一定的限制,一方面,由于文本区域具有可变长度、背景复杂、多样化等因素,网络必须设计更大的感受野;另一方面,在RPN训练阶段,正样本的选择会出现大量的误检和漏检情况。对此提出一种基于垂直区域回归网络的算法,首先采用Hough算法对部分场景图像进行倾斜校正预处理;其次在训练阶段基于groundtruth框与候选框Anchor在垂直方向上IOU值(交集与并集之比)大于某个阈值的情况下选择正样本,且在垂直方向上对正样本进行分类回归;最后由多个相邻Anchor合并形成文本区域。实验结果表明,在ICDAR2011和ICDAR2013数据集上获得了良好的检测效果。
    人工智能与数据挖掘
    汉语篇章广义话题结构的认知计算模型研究
    卢达威1,宋柔2,尚英3
    2018, 40(07): 1264-1274. doi:
    摘要 ( 117 )   PDF (1219KB) ( 250 )     

    广义话题结构是汉语篇章中客观存在的结构形式。依据有限状态机的思想设计了识别广义话题结构的计算模型,在较大规模语料中初步检验了它的有效性,分析了该模型的空间复杂度和时间复杂度。该模型的特点是:递推控制,输出和输入以标点句为单位同步进行,无长距离回溯,有限回填,有限存储,保持词序。这些特点正是人在“话题—说明”信息的认知过程中所遵循的准则,因此该计算模型可以看作人完成这一认知过程的机械模型。

    基于栈式自编码的上海地铁短时流量预测
    徐逸之1,2,彭玲1,林晖1,2,李祥1,2
    2018, 40(07): 1275-1280. doi:
    摘要 ( 188 )   PDF (760KB) ( 297 )     

    城市公共交通网每时每刻都承载巨大的客流量,客流量的增多为公共交通网和交通智能调度带来了巨大的压力。地铁站点短时的客流预测是智能地铁调度系统中重要的决策基础与技术支持。利用历史刷卡数据,提出了一种基于深度学习的地铁短时客流量预测方法,基于栈式自编码器构建深度神经网络模型,采用自下而上逐层非监督预训练,在预训练结束之后,采用反向传播BP算法自上而下来微调整个网络的参数。利用上海一个月范围内的地铁刷卡记录数据进行实验测试,实验结果优于小波神经网络WaveletNN与自回归移动平均模型ARIMA。

    融合共现距离和区分度的短文本相似度计算方法
    刘文1,马慧芳1,2,脱婷1,陈海波1
    2018, 40(07): 1281-1286. doi:
    摘要 ( 140 )   PDF (749KB) ( 276 )     
    针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。
     
    一种基于语义与句法结构的短文本相似度计算方法
    赵谦1,荆琪1,李爱萍1,2,段利国1
    2018, 40(07): 1287-1294. doi:
    摘要 ( 125 )   PDF (588KB) ( 352 )     
    为了提高短文本语义相似度计算的准确率,提出一种新的计算方法:将文本分割为句子单元,对句子进行句法依存分析,句子之间相似度计算建立在词语间相似度计算的基础上,在计算词语语义相似度时考虑词语的新特征——情感特征,并提出一种综合方法对词语进行词义消歧,综合词的词性与词语所处的语境,再依据Hownet语义词典计算词语语义相似度;将句子中词语之间的语义相似度根据句子结构加权平均得到句子的语义相似度,最后通过一种新的方法——二元集合法——计算短文本的语义相似度。词语相似度与短文本相似度的准确率分别达到了87.63%和93.77%。实验结果表明,本文方法确实提高了短文本语义相似度的准确率。
     
     
    基于FDH的分区域多目标遗传算法
    周忠宝1,刘悦悦1,2,金倩颖1,肖和录1,程旭曼3
    2018, 40(07): 1295-1302. doi:
    摘要 ( 138 )   PDF (1017KB) ( 214 )     
    提出了一种基于FDH的分区域多目标遗传算法(FDHMOGA)。该算法通过FDH对种群中所有个体进行评价,根据评价所得的效率值和拥挤度对种群进行选择,提高了该算法的局部搜索能力,同时引入分区策略增加算法的搜索范围,有效避免了遗传算法早熟的缺陷,提高了所获解的多样性。对多个测试函数以及投资组合优化问题的测试结果显示,FDHMOGA算法具有良好的计算性能,更具有效性。
    基于排列熵的SAX特征表示方法复杂度及相关特性研究
    宋伟1,宋玉1,张帆2,范明1,叶阳东1
    2018, 40(07): 1303-1309. doi:
    摘要 ( 99 )   PDF (1819KB) ( 187 )     

    符号化聚合近似SAX方法是典型且行之有效的符号化特征表示方法。目前对SAX方法实践应用较多,然而对其内在特性,如复杂度、信息损失、相关性及周期性等方面的分析研究却相对较为少见。运用排列熵来度量SAX方法的复杂度及相关特性的统计学特征,通过在实验数据集以及真实生理数据上的实验表明,SAX方法可以明显降低特征表示的复杂度,冗余效应也得到了缓解;此外,SAX较好地保留了采用自相关函数ACF度量的内在相关性。本文工作可以对SAX方法及其进一步应用提供支撑,为新的符号化特征表示方法的设计与评估提供分析与统计工具。

    多障碍物环境下挖掘机的连续避障轨迹规划
    钟星1,邵辉1,叶贤成2
    2018, 40(07): 1310-1315. doi:
    摘要 ( 142 )   PDF (1324KB) ( 246 )     
    针对多障碍物环境下,挖掘机在挖掘过程中,铲斗碰到障碍物无法进行适应性调整的问题,利用三次多项式和积分法规划挖掘轨迹,采用盲人摸路算法对挖掘过程中挖掘机与障碍物发生碰撞后进行及时有效的调整,运用原像规划算法判断避障方向。为了方便进行避障算法验证,利用Matlab图形用户界面(GUI)设计了一个能够实现参数设置、结果展示等功能的可视化界面。仿真实验表明,该避障算法能够在复杂环境中,多次平滑绕开障碍物来完成连续避障任务。
     
    基于共轭梯度法的反馈差分进化混合算法及其在弹簧设计中的应用
    黄辉先,胡鹏飞
    2018, 40(07): 1316-1322. doi:
    摘要 ( 126 )   PDF (574KB) ( 242 )     
    分析了差分进化算法多种变异方式的特点以及每种变异方式所适应的搜索状态,建立了一条能够让种群根据自身的搜索环境来动态选择变异方式的反馈回路,使个体能够自学习、自调节地高效搜索。在每一代的最优个体邻域内,采用共轭梯度法确定最佳的共轭搜索方向,向量能够在最优解邻域内进行细致的局部搜索。根据混合算法的子代更新形式,从理论上证明了种群能够以概率1的方式收敛到全局最优解。与其它进化算法的对比实验结果表明,本文的差分进化算法有效提高了benchmark函数的最优值精度,加快了收敛速度。在弹簧设计问题中,利用改进的差分进化混合算法得到了较好的结构参数。
     
     
    面向监狱服刑人员的聚类与分类算法研究
    郭曼1,张世春2,程利2,徐鹏3,王建元4,冷彪4
    2018, 40(07): 1323-1328. doi:
    摘要 ( 120 )   PDF (566KB) ( 223 )     

    分别提出了面向服刑人员的聚类和分类算法,针对服刑人员的表现特征在服刑期内连续变化和多样性的特点,分别采用隐马尔可夫模型为聚类模型和LDA主题模型为分类模型,对应急指挥综合管理平台中所收集到的多种服刑人员的业务管理信息进行综合聚类分类处理。实验表明,隐马尔可夫模型可以体现出各服刑人员在整个服刑阶段表现的时序变化,从而进行准确的聚类判断;LDA主题模型可以考虑到服刑人员的多种属性,从而对其进行准确的类别判断。

    基于改进混合算法优化RBF网络的滤波器建模
    南敬昌,陆亚男,高明明
    2018, 40(07): 1329-1336. doi:
    摘要 ( 145 )   PDF (1261KB) ( 222 )     
    为构建精确的微带线滤波器神经网络模型,提出一种结合自适应遗传算法和改进粒子群算法的混合算法。在自适应遗传算法中,构造二次型选择策略以提高优秀个体的复制概率,加快收敛到初始全局最优解;利用粒子群算法良好的局部搜索能力,在标准粒子群算法的位置迭代公式中引入高斯扰动项,以克服收敛速度慢和早熟收敛的缺点,提高搜索全局最优解的可能性。通过对测试函数仿真,验证改进算法的可行性。最后将混合算法用于优化神经网络参数,建立平行耦合微带线滤波器模型。结果表明,滤波器参数S21和S11的均方根误差至少减小18.22%与12.68%,微带滤波器建模精度得到提高,验证了该算法对滤波器建模的有效性和可靠性。