Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    论文
    允许违反局部时间约束的科学工作流调度策略
    陈旺虎,段菊,俞茂义
    2016, 38(11): 2165-2171. doi:
    摘要 ( 139 )   PDF (516KB) ( 366 )     

    提高科学工作流在云环境中的执行效率、降低执行费用受到广泛关注。用户期望的局部QoS约束与工作流的总体执行效率之间往往存在矛盾。针对该现象,在前期的研究基础上提出一种允许违反局部时间约束的科学工作流调度策略。通过对已聚簇的工作流任务集使用任务后向优先合并的方法,可实现任务间空闲时间片的合理利用,进而优化科学工作流的执行时间;另外,为充分利用任务的松弛时间,提高工作流的整体执行效率,允许部分任务的调度违反局部最晚完成时间的约束。实验结果表明,该策略能提前科学工作流的最早完成时间,提高处理机的利用率,并最终降低工作流的执行费用。

    云环境中基于LVS集群的负载均衡算法
    王晓龙,蒋朝惠
    2016, 38(11): 2172-2176. doi:
    摘要 ( 151 )   PDF (659KB) ( 335 )     

    为了解决传统负载均衡技术应用到云计算环境中引发的新问题,提出一种云环境下基于LVS集群分组负载均衡算法。该算法首先根据硬件性能计算各节点的权值,将性能相同(或近似相同)的服务器分为一组,每组节点数量相等(或近似相等),负载均衡器定期地收集各节点CPU、内存、I/O、网络利用率以及响应时间,动态改变节点的权值,使用改进算法选择该组内最佳节点,并计算节点的综合负载和组负载。最后再次使用改进算法由组负载均衡器选择集群最佳节点,并进行任务请求的合理分配,从而解决因并发量过大而引起的时延等问题。实验结果表明,与加权轮询算法(WRR)和加权最少连接算法(WLC)相比,本算法能够在并发量较大的情况下维持较短的响应时间和较高的吞吐率,使集群负载更加均衡。

    目标跟踪算法的并行优化
    陈伟1,祝恩1,刘天航1,殷建平1,邱明辉2
    2016, 38(11): 2177-2182. doi:
    摘要 ( 145 )   PDF (458KB) ( 282 )      评审附件
    目标跟踪是计算机视觉领域一个重要的研究方向,近年来学者提出了众多优秀的目标跟踪算法,但许多算法的低实时性制约了其在应用场景中的有效性。针对这些算法,提出了一个通用的跟踪模型,并针对此模型提出了一个可行的并行优化方案。之后使用SCM算法验证了所提出的并行优化方案。在四核CPU的环境下,并行后的SCM算法相比于未并行的算法取得了348倍的并行加速比,并且比原算法Matlab+C程序的运行速度快了约30倍,这说明了所提出的并行优化方案的有效性。
     
    两种面向推荐系统的数据压缩方法
    刘博1,刘晓光1,王刚1,吴迪2
    2016, 38(11): 2183-2190. doi:
    摘要 ( 145 )   PDF (969KB) ( 263 )      评审附件
    今日头条的服务器每天都会产生规模庞大的训练数据,为方便进行训练,这些数据都具有特定的格式和分布特征。使用不同类型的通用压缩算法(字典类型及非字典类型)进行测试,发现单独任何一种算法都无法在满足业务需求(速率需求和CPU占比等)的同时获得较为可观的压缩比。针对今日头条的训练数据,提出了分段聚类压缩和Hash recoding压缩两种策略。实验结果表明,分段聚类压缩方式在更好地保证了压缩率的同时提高了压缩速率的目的;Hash recoding压缩方式则更好地达到了以少量压缩速率的损失换取更可观的压缩率的目的。分段聚类方式搭配Gzip压缩算法的组合能使压缩速率提高300%以上;Hash recoding方式匹配Snappy压缩算法能使压缩率缩小50%以上。根据实际需求,不论选择哪种策略,对于降低今日头条的运营成本,提升业务处理的效率,提供更好的用户体验,都有一定意义。
     
    一种基于K-匿名聚类的可穿戴设备数据重发布方法
    李桐,刘强,蔡志平,周桐庆
    2016, 38(11): 2191-2196. doi:
    摘要 ( 120 )   PDF (526KB) ( 276 )      评审附件

    近年来,可穿戴设备被广泛地被应用于日常生活。用户量增加造成的可穿戴设备数据重发布是导致隐私泄漏的一个重要原因。为此,数据匿名化重发布方法受到了广泛关注。然而,现有的数据匿名化重发布方法存在两个方面的不足:一方面,现有的数据匿名化重发布算法可能会造成严重的信息损失或用户隐私数据的泄漏;另一方面,现有的数据匿名化重发布算法在兼顾保护用户隐私和减少信息损失的情况下会造成较高的发布成本。为了兼顾隐私安全和数据可用性,并且提高数据重发布算法的效率,结合可穿戴设备自身的特点,提出基于聚类的数据匿名化重发布算法,该算法直接对增量数据进行基于聚类匿名化操作,使数据匿名化重发布更为高效。此外,在数据量较大的应用场景中,基于聚类的数据匿名化重发布算法可以有效减少信息损失。实验结果表明,基于聚类的数据匿名化重发布算法能够在保证用户隐私安全的前提下减少信息的损失并且提高执行效率。

    自变量斥耦合混沌伪随机比特发生器
    伍琦
    2016, 38(11): 2197-2201. doi:
    摘要 ( 94 )   PDF (568KB) ( 207 )      评审附件
    设计了一种新的耦合方法——自变量斥耦合,并将其作用于斜帐篷映射来得到一个新的混沌系统。实验显示,这一系统的混沌性质相当优秀。随后,基于该系统构建了一个伪随机比特发生器。接着,用五项统计测试来检测该发生器所生成比特流的伪随机性。最后,计算了所生成比特流的线性复杂度及该发生器的密钥空间大小。所有实验均表明该发生器性质良好,较适合用于信息安全领域。
     
    一种基于混合社区的移动机会网络数据传输机制
    陈卫民1,2,陈志刚2,崔芳2,刘佳琦2
    2016, 38(11): 2202-2208. doi:
    摘要 ( 117 )   PDF (625KB) ( 281 )      评审附件

    由人携带或使用智能设备组成的移动机会网络采用“存储携带转发”的通信机制,通过中继转发来实现节点之间的数据传递。为了改善网络性能,往往需要借助节点的社会属性来进行中继选择和制定转发策略。然而,在已有的传输机制中,往往只是利用节点的部分社会属性,不能完全反映出节点之间的社会关系。为此,提出了一种新的基于混合社区的数据传输机制,并给出了混合社区的内涵、混合社区的构建方法和基于混合社区的数据传输算法。基于几种真实轨迹数据集的实验结果表明,与已有的几种经典路由算法相比,该方法传输成功率较高,传输延迟较短,性能更好。

    基于dpdk的高效数据包捕获技术分析与应用
    赵宁1,谢淑翠2
    2016, 38(11): 2209-2215. doi:
    摘要 ( 286 )   PDF (873KB) ( 319 )      评审附件

    对Intel dpdk数据包捕获技术进行了深入研究,对其优缺点进行了详细的分析。在此基础上,利用dpdk设计并实现了一套基于Linux的数据包捕获系统,成功地将其应用于千兆网络安全防护系统中。使用BPS软件对基于dpdk的网络安全防护系统与基于pf_ring的网络安全防护系统进行仿真分析,结果表明dpdk对整体系统性能的提高成效显著,取得了良好的效果,验证了该方法的可行性。

    GPS欺骗式干扰环境下MVDR算法的性能分析
    董惠,郝鹏飞,王纯,张鹭
    2016, 38(11): 2216-2220. doi:
    摘要 ( 107 )   PDF (563KB) ( 251 )      评审附件

    经典MVDR算法在GPS压制式干扰环境下的表现出色,为分析MVDR算法在欺骗式干扰环境下的性能,根据该环境下信号、干扰的功率都淹没于噪声功率之下的特点,推导出阵列天线采用MVDR算法后的方向图增益和输出信干噪比的近似表达式。通过仿真实验,分析验证了MVDR算法在欺骗式干扰环境下失去了抑制干扰能力的原因,并讨论了影响阵列输出信干噪比变化的因素及其随各因素变化的规律。

    数字图书馆中图编码匿名方法
    贾俊杰,陈菲,闫国蕾,邢里程
    2016, 38(11): 2221-2226. doi:
    摘要 ( 124 )   PDF (554KB) ( 290 )      评审附件

    现如今数字图书馆所发布的大部分数据只包含图书资源的相关信息,并没有用户属性与图书资源共同发布的数据,使得分析者不能从现有发布数据中分析出更多的信息,对有些科学研究造成困扰。建立一种用户属性与图书信息共同发布的匿名方式,首先将所有图书使用图书分类号进行重新编码,其次根据重新编码的稀疏情况将整个数据进行划分,最后在每个划分中使用置换方法进行匿名。实验结果表明,最终匿名表的数据具有较高的准确性和实用性,并能够通过散点图的方式直观地看到属性间的关系,为科学研究提供更多有用信息。

    基于量子混沌映射的高效安全的图像加密算法
    刘会,金聪
    2016, 38(11): 2227-2233. doi:
    摘要 ( 131 )   PDF (1702KB) ( 338 )      评审附件

    提出了一种基于带密钥的广义Arnold变换和量子混沌映射的图像加密算法。首先,利用二维Logistic映射产生初始条件和参数;其次,利用带密钥的广义Arnold变换对彩色图像的像素值进行置换;最后将初始条件和参数代入到量子混沌系统中,由该系统产生的一系列伪随机数与图像的像素值进行异或,改变各个位置的像素值,进而达到加密的效果。为了提高加密系统的复杂性和随机性,二维Logistic映射和二维量子混沌映射都结合加权耦合映像格子以运用到加密系统中。

    Linux内核提权攻击研究
    左玉丹,丁滟,魏立峰
    2016, 38(11): 2234-2239. doi:
    摘要 ( 262 )   PDF (638KB) ( 280 )      评审附件
    提权攻击是针对Linux系统的一种重要攻击手段。根据提权攻击所利用的漏洞类型,一般可将其分为应用层提权攻击和内核提权攻击。现有的防御技术已经能够防御基本的应用层提权攻击,但是并不能完全防御内核提权攻击,内核提权攻击仍是Linux系统面临的一个重要威胁。内核提权攻击一般通过利用内核提权漏洞进行攻击。针对内核提权攻击,分析研究了基本的内核提权漏洞利用原理以及权限提升方法,并对典型的内核提权攻击防御技术进行了分析。最后通过实验对SELinux针对内核提权攻击的防御效果进行了分析验证,并针对发现的问题指出了下一步具有可行性的研究方向。
     
    基于时间分割代理加密的一般性构造方法
    郑志伟,黄振杰
    2016, 38(11): 2240-2245. doi:
    摘要 ( 99 )   PDF (386KB) ( 219 )      评审附件

    基于时间分割代理加密是一种典型的代理密码方案,可以将解密权委托给代理解密者,从而减轻原解密者的解密负担,具有广泛的应用前景,但研究成果相对较少。基于身份加密可直接将用户的身份标识作为公钥,简化了公钥证书的管理,近年来受到广泛关注,研究者提出很多方案。根据基于时间分割代理加密和基于身份加密在算法构成和安全模型两方面的区别与联系,提出一个基于时间分割代理加密的一般性构造方法,并证明其安全性。该方法可将任意一个安全的基于身份加密方案转换成安全的基于时间分割代理加密方案。通过该方法得到标准模型下安全的基于时间分割代理加密方案,大大丰富了基于时间分割代理加密方案的数量和类型。

    几个签密方案的密码学分析与改进
    周才学
    2016, 38(11): 2246-2253. doi:
    摘要 ( 31 )   PDF (445KB) ( 175 )      评审附件

    对六个签密方案进行了安全性分析,指出它们都存在保密性的安全问题,其中两个方案还存在不可伪造性的安全问题。对每一个安全问题都给出了具体的攻击方法,并使用加密部分绑定发送者、签名部分绑定接收者、验证等式不含明文信息和部分私钥生成时绑定公钥的方法对每一个方案给出了改进措施。对改进后的方案给出了随机预言机模型下的安全性证明。安全分析表明,改进方案是安全的。最后提出了设计签密方案时必须注意的几个问题。

    软件体系结构脆性分析与验证
    张红,王小军
    2016, 38(11): 2254-2260. doi:
    摘要 ( 99 )   PDF (666KB) ( 220 )      评审附件

    软件系统因具有节点众多、节点间联系复杂、随时间演化、自组织临界等特性可将其视为复杂系统。在软件安全领域,对软件体系结构的分析一直是研究的重点。软件体系结构具有自身的脆性,这体现在软件系统的运行过程会出现由于内部组件失效或外部攻击而导致的级联故障乃至系统崩溃。首次将软件系统视为复杂系统,对软件体系结构的脆性进行相关分析,并结合“数据抽象和面向对象”风格的软件体系结构,通过蚁群算法及GROD算法指出该体系结构脆性的最大崩溃路径及脆性源。这将对软件安全领域系统的设计、监控等方面的研究提供理论及实践方面的指导意义。

    本体知识库的模块与保守扩充
    余泉1,2,常亮2,文习明3,王驹2
    2016, 38(11): 2261-2267. doi:
    摘要 ( 92 )   PDF (444KB) ( 248 )      评审附件

    模块化是软件工程的一种方法,近年来被引入到本体领域,用以支持本体的重用和本体的整合。 已有的工作没有讨论同时含有TBox和ABox的本体知识库的模块化的相关问题。在定义本体知识库的模块和知识库的保守扩充的基础之上,给出了知识库保守扩充的验证算法,并且从理论上证明可用知识库的保守扩充的验证算法来验证一个知识库是否为另外一个知识库的模块。

    全景图像镶嵌中累积误差的分析与减少方法研究
    吴琼,李良福,汪之涛,肖樟树
    2016, 38(11): 2268-2274. doi:
    摘要 ( 111 )   PDF (733KB) ( 293 )     

    针对全景图像镶嵌中累积误差的问题,提出了一种基于多次柱面投影的变换基准图策略。首先,为了将累积误差有效地分散到各相邻图像之间,并减少柱面投影变换的计算量,算法利用相位相关和多分辨率分解法对柱面投影算法进行了改进;然后,利用改进变换基准图的分层匹配策略对图像序列进行镶嵌,避免了误差的单向累积;最后,运用拉普拉斯算子对镶嵌图像分级融合,消除了镶嵌缝隙。实验结果表明,该方法可以大大减弱镶嵌过程中累积误差的影响,提高图像的镶嵌精度。

    基于QR分解重构虚拟样本的人脸识别算法
    郭艳君,许道云,秦永彬
    2016, 38(11): 2275-2281. doi:
    摘要 ( 127 )   PDF (913KB) ( 285 )      评审附件
    一直以来,小样本问题是人脸识别应用面临的一大难题。针对在实际人脸识别过程中存在的样本不足的问题,首次提出基于QR分解重构虚拟训练样本的算法。该算法使用Q与R的部分信息构造出与原始人脸图像具有一定差异性的虚拟样本,增加了人脸图像更多可能性变化的有效特征,扩大了训练样本集,然后对原始样本和虚拟重构样本协同表示的结果进行加权融合,选取最优权重组合,调整原始样本与虚拟样本对结果的影响比重,得到正确识别率。以ORL、FERET和AR三大人脸数据库对算法进行实验验证。实验结果表明,此算法能够取得较高的识别准确率。
     
    SRC最佳鉴别投影及其在人脸识别中的应用
    甘炎灵,金聪
    2016, 38(11): 2282-2288. doi:
    摘要 ( 103 )   PDF (734KB) ( 265 )      评审附件
    根据稀疏表示分类器的分类准则,提出了一种稀疏表示分类器最佳判别的投影方法。该方法优化两个目标,一是数据集的类间和类内稀疏重构误差,二是数据集中区分度。优化结果使样本投影到低维空间中,确保SRC具有更好的分类性能。在AR和Yale数据库上进行人脸识别实验,并与几种流行的方法进行了比较,结果表明所提出的方法具有良好的有效性和鲁棒性。
     
    基于低秩表示动态更新投影的在线运动目标检测
    杨国亮,丰义琴,唐俊,谢乃俊
    2016, 38(11): 2289-2296. doi:
    摘要 ( 96 )   PDF (1088KB) ( 216 )     

    视频图像中运动目标检测是机器视觉领域的重要研究内容,旨在将序列图像中的背景和前景进行有效分离。在研究几种典型运动目标检测算法的基础上,提出了一种基于低秩表示动态更新投影的在线运动目标检测算法。采用低秩表示方法对若干连续视频帧进行低秩分解,并将分解所获得的低秩部分对应的左奇异值矩阵的正交补引为投影矩阵;再构建投影模型,拟合出数据的稀疏前景;最后采用视频分段分析法则对投影矩阵进行动态更新,从而保证所分离的背景以及前景的有效性。在Curtain等多个视频数据库上与其他算法进行了对比实验,实验结果表明所提算法具有很好的检测效果,对复杂的运动前景和动态背景的处理表现出很强的鲁棒性。

    利用数据场和欧氏距离的图像边缘提取
    黄山1,李众1,黄蒙蒙2
    2016, 38(11): 2297-2302. doi:
    摘要 ( 91 )   PDF (1050KB) ( 282 )      评审附件
    图像边缘是图像分析和识别的基础,图像边缘信息的准确性和完整性对后续图像分析和识别有重要影响
    。为实现图像边缘有效提取,提出一种利用数据场和图像欧氏距离的图像边缘提取方法。首先,该方法
    利用数据场理论构建图像数据场,实现图像灰度值特征空间到数据场势值空间的转换。然后,在对图像
    数据场的势值计算时引入图像欧氏距离,利用图像区域欧氏距离扩大像素差异,抑制微小细节和噪声,
    得到“背景”和“目标”相对分离的势值图。最后,用改进Canny算法对势值图进行边缘提取。实验表明
    ,用本文方法可以有效提高边缘提取的准确性,减少伪边缘,抑制冗余细节和噪声。
    机器学习在乳腺肿瘤分类检测中的应用研究
    李喆,吕卫,闵行,褚晶辉
    2016, 38(11): 2303-2309. doi:
    摘要 ( 111 )   PDF (541KB) ( 352 )      评审附件
    机器学习算法在医学检测与诊断,尤其是乳腺肿瘤分类检测与诊断中扮演愈发重要的角色。分析比较了
    几种经典机器学习分类器在乳腺肿瘤分类检测中的性能,并从准确率、灵敏度、特异性及执行效率等方
    面对各分类器的性能进行了评估比较,根据在不同数据库上的实验结果,总结了各机器学习分类器在乳
    腺肿瘤分类中的性能特点:线性判别分析和极限学习机两种分类器性能优良且训练效率很高;支持向量
    机性能较为平均且非常稳定,但训练耗时较长;而人工神经网络分类器虽然可以给出良好的特异性指标
    ,但灵敏度指标不够理想。
    一种改进的协同优化算法
    徐傲,郑松,葛铭,王强,王春林
    2016, 38(11): 2310-2313. doi:
    摘要 ( 84 )   PDF (339KB) ( 261 )      评审附件
    针对协同优化过程对初始点敏感以及容易陷入局部最优点的问题,提出了一种改进的协同优化算法。改
    进后的协同优化算法综合考虑学科级优化设计点与系统级设计点的距离以及子学科级内部最优设计点,
    能较好地减弱优化结果对初始点以及松弛因子选择的依赖性,更容易找到优化问题全局最优设计点。最
    后,通过两个经典算例验证了改进算法的有效性及稳定性。
    双系统协同进化的基因表达式编程及其在函数发现中的应用
    王超学,吴书玲,张婧菁
    2016, 38(11): 2314-2320. doi:
    摘要 ( 129 )   PDF (579KB) ( 216 )     
    受人类进化过程的启发,提出了一种双系统协同进化的基因表达式编程算法DSCEGEP。DSCEGEP由自
    然进化系统和人工干预系统组成。人工干预系统包括个体干预和种群干预。个体干预是依据基因库对种
    群中的个体进行去劣和增优操作,旨在改善种群中个体的质量;种群干预通过引入随机和镜像个体来提
    高种群的多样性和全局寻优能力。与权威文献中改进的GEP关于函数发现问题的大量对比实验表明,本文
    算法在收敛速度、求解质量方面优于对比算法,具有明显的竞争力。
    基于LDA的表面肌电信号分类研究
    马正华,乔玉涛,李雷,戎海龙
    2016, 38(11): 2321-2327. doi:
    摘要 ( 80 )   PDF (848KB) ( 216 )     
    研究了一种基于LDA分类器的模式识别方法,比较了五种特征参数组合方式,分析了无关联线性判别分析
    ULDA和PCA两种降维方法,通道数量和窗口长度对肌电信号分类的影响,最后应用LDA分类器对降维后的
    数据进行分类。实验结果表明:均方根和四阶AR系数两种特征组合在4通道和8通道下的准确率分别可以
    达到90%和96%,增加通道数量或特征数量可以进一步提高准确率;通过ULDA将特征矢量的维数降低到6维
    时,仍可以保证较高的准确率;6种手势的识别率超过了94%,其中4种手超过了97%,分类出错的窗口主
    要集中在过渡阶段。
     
    标签SNPs选择及重构算法研究
    赵婧1,魏彬2
    2016, 38(11): 2328-2334. doi:
    摘要 ( 85 )   PDF (769KB) ( 192 )      评审附件
    研究复杂疾病与SNP之间的相关性是生物信息学最为重要的任务之一,然而基因分型的巨大花费却限制了
    其发展及应用。因此,选择部分有代表性的SNP(即标签SNP选择问题)进行研究,从而降低研究所需费
    用就显得十分必要。近年来,已有一些算法被提出用于解决该问题,但是大多数方法在预测精度及标签
    选择数目等指标方面仍未能达到实际应用的需求。据此,设计了一种前向矩阵法用于标签SNP的选择,并
    用改进的PSO算法对非标签SNP进行预测。最后通过大量数据集上的实验表明了算法与常用方法相比可选
    择更少的标签,同时可获得更高的预测精度,即在性能方面有了明显的提升,更适合于标签SNP选择问题
    的研究。
    基于模糊PID控制的液压同步提升系统仿真分析
    石云飞,章青,吕喆
    2016, 38(11): 2334-2341. doi:
    摘要 ( 79 )   PDF (1997KB) ( 274 )      评审附件
    在LNG储罐穹顶液压整体提升技术中,不仅要保证各个提升吊点的位移精度和负载均衡控制,又要保证系
    统在提升过程中的平稳性。常规PID控制方式能够实现提升系统的同步控制,但由于控制参数不能根据负
    载的改变进行实时调整,导致液压整体提升系统在提升过程中会因速度波动而产生提升不平稳性。模糊
    自适应PID控制器可以实现控制参数的实时改变。运用AMESim和Matlab软件对液压整体提升系统的模糊控
    制模型进行联合仿真。仿真结果表明,模糊自适应PID控制在实现位移同步控制和负载均衡控制的前提下
    ,能有效改善提升过程的不平稳性。
    基于相关系数的ID3优化算法
    吴思博,陈志刚,黄瑞
    2016, 38(11): 2342-2347. doi:
    摘要 ( 100 )   PDF (482KB) ( 213 )      评审附件
    ID3算法是目前最具有影响力的一种决策树构造算法,但仍然有许多的缺点,例如在多值属性偏向方面
    的问题、计算时间复杂度高、效率不高等问题。提出了一种基于斯皮尔曼等级相关系数的ID3决策树构造
    优化算法,利用相关系数克服了ID3算法在多值属性偏向方面的问题,在一定程度上提高了算法的分类准
    确率。利用相关数学知识对计算过程进行了化简,减少了ID3算法在log运算上的运行时间。最后通过实
    验验证了优化后的算法是可行的,且在准确率和运行速度方面都有更好的表现。
     
    基于社交特征的多维度文本表示方法
    陈功1,黄瑞章1,2,钟文良1
    2016, 38(11): 2348-2355. doi:
    摘要 ( 92 )   PDF (595KB) ( 279 )      评审附件
    Web文本表示方法作为所有Web文本分析的基础工作,对文本分析的结果有深远的影响。提出了一种多维
    度的Web文本表示方法。传统的文本表示方法一般都是从文本内容中提取特征,而文档的深层次特征和外
    部特征也可以用来表示文本。本文主要研究文本的表层特征、隐含特征和社交特征,其中表层特征和隐
    含特征可以由文本内容中提取和学习得到,而文本的社交特征可以通过分析文档与用户的交互行为得到
    。所提出的多维度文本表示方法具有易用性,可以应用于各种文本分析模型中。在实验中,改进了两种
    常用的文本聚类算法——Kmeans和层次聚类算法,并命名为多维度Kmeans MDKM和多维度层次聚类算
    法MDHAC。通过大量的实验表明了本方法的高效性。此外,我们在各种特征的结合实验结果中还有一些深
    层次的发现。
    基于强度熵的中文关键词识别方法
    闫蓉,高光来
    2016, 38(11): 2356-2361. doi:
    摘要 ( 67 )   PDF (542KB) ( 215 )      评审附件
    文本的关键词识别是文本挖掘中的基本问题之一。在研究现有基于复杂网络的关键词识别方法的基础上
    ,从整个复杂网络拓扑结构特征的信息缺失角度来考察各节点的重要程度。提出强度熵测度来量化评估
    各节点重要程度,用于解决中文关键词识别问题。实验结果表明,该评估方法简单有效,特别适用于带
    权复杂网络的节点重要性评估。
    基于三角函数搜索因子的混合蛙跳算法
    常小刚,赵红星
    2016, 38(11): 2362-2367. doi:
    摘要 ( 124 )   PDF (519KB) ( 259 )      评审附件
    针对传统混合蛙跳算法存在收敛速度慢、容易陷入局部最优和搜索精度不高的缺陷,提出了基于三角函
    数搜索因子的混合蛙跳算法。该算法将基于三角函数搜索因子的局部进化策略和产生新个体策略引入到
    混合蛙跳算法中,改进混合蛙跳算法的局部搜索精度和全局收敛性能。实验结果表明,基于三角函数搜
    索因子的混合蛙跳算法能够显著改善混合蛙跳算法的寻优精度和收敛速度,使算法的搜索效率和稳定性
    同时得到提高。
    结合词向量和聚类算法的新闻评论话题演进分析
    林江豪1,周咏梅1,2,阳爱民1,2,王伟2
    2016, 38(11): 2368-2374. doi:
    摘要 ( 116 )   PDF (762KB) ( 411 )      评审附件
    话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用
    word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序
    列下所有词汇的词向量,利用Kmeans对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基
    于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足
    够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作