计算机工程与科学

柴燕涛，董德尊，张鹤颖，朱成阳，廖湘科

2016, 38(01): 1-10. doi:

摘要 ( 209 )

PDF (1238KB) ( 608 ) 　　

拥塞管理是高性能网络领域的重要研究方向，网络拥塞会对网络的全局性能产生较大影响。现有的拥塞管理多采用分布式拥塞避免策略，能够在一定程度上解决网络的拥塞问题，但其处理过程基于局部信息，不能充分利用网络资源，处理效率偏低。近期，人们提出软件定义网络（SDN）架构，该架构采用集中控制器和多层网络技术，能够较好地获取网络的全局信息。在原有工作的基础上提出了一种基于SDN架构的全局拥塞避免策略OSCP，该策略在拥塞信息获取和控制信息的传输上，改进了原有的解决方案，并结合自适应传输进行网络路由。实验结果表明，该策略可以较好地避免和解决网络中存在的拥塞问题，降低网络延迟并提高饱和吞吐率。

基于运行数据分析的Spark任务参数优化

陈侨安1，李峰1，曹越1，龙明盛1,2

2016, 38(01): 11-19. doi:

摘要 ( 251 )

PDF (768KB) ( 622 ) 　　

运行数据是大数据系统中增长最快、最为复杂也是最有价值的数据资源之一。基于运行数据，软件开发者可以分析关于软件质量和开发模型的重要信息。Spark作为一个分布式系统，在运行过程中会产生大量的运行数据，包括日志数据、监控数据以及任务图数据。开发者可以基于运行数据对系统进行参数调优。然而该系统所涉及的参数种类繁多、影响多样且难以评估，若对系统了解不足，进行参数调优存在较大的困难。提出运行数据历史库的概念，历史库中存储的是以往运行任务的特征信息以及运行配置信息。同时提出了基于历史库搜索的参数优化模型，并实验验证了本文提出的参数优化模型对用户任务性能提升具有较好的效果。

基于云环境下一种小文件传输策略研究

周兰凤1，赵鹏飞1，彭俊杰2

2016, 38(01): 20-27. doi:

摘要 ( 224 )

PDF (579KB) ( 454 ) 　　

基于互联网的文件传输策略将直接影响到文件传输效率和网络资源的使用效率，这一情况在各种资源集中的云计算环境表现得更为明显，特别是当传输大量小文件时尤为突出。针对这种现状，提出了一种基于打包策略的文件传输策略，给出了文件包优化处理机制，基于该策略，文件传输之前对小文件进行打包处理，然后进行传输，在接收端收到文件时首先进行解包再进行存储，从而减小传输过程中大量的IO操作，提升文件传输效率。大量的实验表明了本文所提策略的正确性，能够极大地提升云环境下小文件的传输效率，提高云资源的利用率。

一款低噪声八相位锁相环设计

宋意良,袁珩洲,刘尧,梁斌,郭阳

2016, 38(01): 28-32. doi:

摘要 ( 189 )

PDF (668KB) ( 452 ) 　　

基于宽频率范围数字系统的需求，在0.13 μm工艺下设计了一款宽输出范围、低抖动八相位锁相环。首先通过数学建模优化环路带宽，在系统级减小环路噪声；在振荡器中引入了前馈传输管单元以提高振荡频率并降低振荡器相位噪声；最后利用具有伪静态结构的D触发器来降低鉴相器和分频器的功耗并提高其抗噪声能力。仿真结果表明，VCO输出频率在1.2 GHz时相位噪声为-95 dBc/Hz@1 MHz,FOM功耗为4.5 PJ@2 GHz。

NoSQL数据库间数据交换代价研究

郭昆1，宋杰1，王洁萍2，朱志良1

2016, 38(01): 33-40. doi:

摘要 ( 152 )

PDF (719KB) ( 361 ) 　　

随着互联网时代的到来，IT行业迅猛发展，NoSQL数据库以其在大数据环境下出色的业务处理处理能力，在IT行业内得到越来越广泛的应用。而各NoSQL数据库由于自身数据模型的不同，在数据组织方式上彼此存在差异。NoSQL数据库间进行数据交换时，数据模型的不同会导致数据库间数据传输的阻抗，以源数据库数据模型封装的业务数据可能无法直接被目标数据库解析，需进行额外的模型适配操作，参照目标数据库数据模型组织业务数据以供筛选存储。为此，拟定义一种数据描述模型，对NoSQL数据库数据模型特征建模，描述NoSQL数据库的数据组织方式，并定义NoSQL数据库数据模型间距离评估算法。根据数据描述模型与距离评估算法可设计实现一种通用数据模型，其在数据交换过程中可与相关NoSQL数据库进行数据模型上的转换，系统相关业务代码只需参照该数据模型设计，而独立于数据交换过程中NoSQL数据库具体的数据模型。

一种面向光收发器的ps级光脉冲产生器

许超龙，李晋文，罗章，王克非，庞征斌

2016, 38(01): 41-45. doi:

摘要 ( 202 )

PDF (696KB) ( 398 ) 　　

由于高速光开关在光互连通信中越来越广泛的应用，光开关的开关速度直接影响了整个光链路的传输速率，因此对驱动光开关产生长周期窄脉冲光信号的驱动电路的性能及集成度有了更高要求。基于光电集成工艺和高速光脉冲队列技术的发展，提出了一种应用于光SerDes收发器的集成ps级窄脉冲光信号产生器。该产生器为CMOS电路产生脉宽精确可调的长周期窄脉冲，在SMIC 013 μm CMOS工艺下可获得窄至25 ps的脉冲输出，其电源电压范围宽达14 V~25 V，时钟频率也可由数kHz到4 GHz，同时可移植到不同的CMOS工艺平台。

一种基于Hadoop+CUDA实现相关器的方法

苏丽，孙彦猛，张博为，杨先博，朱颖

2016, 38(01): 46-51. doi:

摘要 ( 158 )

PDF (986KB) ( 335 ) 　　

根据21CMA相关器的算法特点，在对比基于CPU并行的MPI集群、MPI+CUDA异构并行集群和Hadoop+CUDA异构并行集群的架构特点的基础上，提出了一种基于Hadoop+CUDA平台实现软相关器的方法。本方法利用GPU在计算FFT、向量乘和向量加等密集型计算模型的优势，设计相关器的并行模型，使其性能较前期在CPU并行的MPI集群实现的相关器有了大幅提升。同时，本文选择广泛应用于大数据处理平台的Hadoop软件架构，利用Hadoop Streaming工具实现非Java编写的程序在分布式系统中并行执行，非常便捷地获得了集群系统的线性加速比。Hadoop HDFS并行文件系统管理结果数据和过程日志更加灵活可靠，为后续的大数据分析提供了支撑环境。

一种高效的DMA核间同步传输方法

田玉恒,马胜,鲁建壮,杨柳

2016, 38(01): 52-56. doi:

摘要 ( 214 )

PDF (617KB) ( 484 ) 　　

对HPL基准程序的高速处理亟需一种能满足算法需求的高效DMA传输方式，同时DDR访问效率也直接决定了算法的运行速度。GEMM算法的操作占整个HPL基准程序操作的90%，为了提高该算法的处理速度，结合DDR访问特点，提出了一种基于核间同步的点对点DMA传输模式。实验结果表明，由于访存效率的提升，该传输模式相比于普通传输模式平均获得了25674%左右数据传输效率提升，明显减少了数据搬运时间开销，有效满足了HPL算法的处理需求。

基于效益博弈的云计算资源动态可协调分配策略研究

李卫平1,2，武海燕2，杨杰1

2016, 38(01): 57-61. doi:

摘要 ( 160 )

PDF (626KB) ( 385 ) 　　

在对用户的任务进行计算资源分配时，为了有效提高计算资源的利用效率，减少任务执行所需要的成本，提出了一种基于效益博弈的云计算资源动态可协调分配机制。该机制采用时间矩阵和费用矩阵作为任务效益的衡量指标，提出效益博弈模型，通过该模型的效益计算方程来得到最好的资源分配策略。为了使得计算资源能够合理地按需进行分配，提出了动态可协调分配机制，在合理地分配资源，满足所有任务正常执行时所需资源的同时，最大化任务的执行效益。实验仿真及对比结果表明，在任务完成时间、任务执行的平均成本、任务完成成功率上，本文算法都取得了较好的效果。

一种用于进化算法历史计算数据的高效利用方法

闫盼，谭瑛，张建华

2016, 38(01): 62-66. doi:

摘要 ( 147 )

PDF (777KB) ( 341 ) 　　

进化算法由于其强大的系统建模能力和空间搜索能力已被广泛应用于许多实际问题的求解中。然而，在算法进化的过程中存在个体适应值重复计算的问题，尤其在解决实际工程中的复杂问题时，适应值的计算会消耗大量时间。为此，利用哈希表的高速存取能力，将哈希表用于存取适应值的历史计算数据，从而避免优化过程中适应值的重复计算，并且对优化结果没有任何影响。仿真实验结果验证了此方法的有效性。

SDN中的端到端时延

黄晓鹏1，黄传河1，农黄武1，杨丹凤1，杨金羚2

2016, 38(01): 67-72. doi:

摘要 ( 237 )

PDF (689KB) ( 438 ) 　　

随着大规模SDN的不断发展，用来管理和衡量网络性能的指标也越来越重要。端到端时延就是其中重要的部分，针对该指标已经提出了很多计算的方法，主要分为主动探测和被动探测，但是各有优缺点。因此，提出一种主动探测和被动探测相结合的方法，通过特殊方法计算出第一个数据包的时延，再通过快速方法计算相邻数据包端到端时延之差，得到所有数据包的端到端时延。实验结果表明，新方法在时钟不同步的情况下，可以有效地计算出端到端时延。

面向软件攻击面的Web应用安全评估模型研究

张玉凤，楼芳，张历

2016, 38(01): 73-77. doi:

摘要 ( 184 )

PDF (594KB) ( 465 ) 　　

Web应用已成为互联网和企事业单位信息管理的主要模式。随着Web应用的普及，攻击者越来越多地利用它的漏洞实现恶意攻击，Web应用的安全评估已成为信息安全研究的热点。结合Web应用的业务逻辑，提出了其相关资源软件攻击面的形式化描述方法，构造了基于软件攻击面的攻击图模型，在此基础上，实现对Web应用的安全评估。本文构造的安全评估模型，在现有的通用漏洞检测模型基础上，引入业务逻辑安全性关联分析，解决了现有检测模型业务逻辑安全检测不足的缺陷，实现了Web应用快速、全面的安全评估。

电力无线通信异构多网共存环境中的网络选择算法

卓灵1，聂静1，肖静薇1，袁杨2，胡新1，陈柯1

2016, 38(01): 78-83. doi:

摘要 ( 145 )

PDF (994KB) ( 403 ) 　　

综合考虑电力业务需求和无线专网性能因素，针对邻域网、LTE无线专网、WiMAX无线专网和230 MHz无线专网等构成的异构多网混合共存场景，提出一种网络选择算法。该算法以AHPTOPSIS算法为基础，首先构建能表征候选网络与决策属性之间关系的决策矩阵，归一化处理获得归一化决策矩阵；利用AHP算法，依据不同业务类型下决策属性与网络性能之间的相对关系定义权重，对归一化决策矩阵加权获得加权归一化决策矩阵；然后对TOPSIS算法进行改进，依据加权归一化决策矩阵确定正负理想值，利用正理想值与候选网络之间的最小距离以及负理想值与候选网络之间的最大距离确定理想网络，计算各候选网络与理想网络之间的有效距离；据此执行候选网络排序和最佳网络选择，以避免运行TOPSIS算法可能存在的排序异常。仿真结果表明，该算法能根据电力业务需求对候选网络进行正确排序和最优选择，且能在满足业务服务质量的同时，提高资源利用率。

带长度约束的k端网络可靠性分析

宋凤,莫毓昌,潘竹生,钟发荣

2016, 38(01): 84-88. doi:

摘要 ( 160 )

PDF (534KB) ( 394 ) 　　

在网络视频和实时通信应用中需要研究带长度约束的k端网络可靠性分析问题,即任意两端点之间在给定时间延迟D约束内的k端网络可靠性。对带长度约束的k端网络可靠性问题进行了研究，主要是在传统不带路径约束的双端和k端网络可靠性研究基础上，提出了基于截断的路径约束方法；并根据该方法构造二元决策图BDD模型进行带约束的k端网络可靠性分析。该算法针对k端点对点信息流在一定时间延迟下完成传输问题，具有较强的实际意义。实例分析结果验证了本方法的可行性和有效性。

小生境分布估计量子遗传算法及其仿真分析

刘振,彭军,刘勇

2016, 38(01): 89-94. doi:

摘要 ( 115 )

PDF (644KB) ( 403 ) 　　

针对现有量子遗传算法进化机制存在的收敛速度慢以及易陷入局部极值的问题，为提高量子进化算法的全局收敛性能，结合小生境技术中的共享适应度函数方法，提出了小生境分布估计量子遗传算法NEDQGA，在种群内部利用多粒度机制和边缘积模块（MPM）进行量子染色体的两步旋转；并提出利用MPM进行交叉的方法，从而增强了种群多样性，避免了优良模式的损失，加快了算法的收敛；对算法的收敛性进行了分析，提出了MPM更新量子染色体的熵收敛准则。经函数仿真分析，算法收敛效果明显提高。

改进生成树算法的多机器人在线地图覆盖

陈泽涛，戴学丰

2016, 38(01): 95-101. doi:

摘要 ( 241 )

PDF (881KB) ( 491 ) 　　

研究在线多机器人地图覆盖。在单机器人生成树STC算法基础上做出改进，融入了市场拍卖算法，使机器人团体扩散地生成树，并沿各自生成树完成地图覆盖。通过两种不同环境地图覆盖仿真，结果验证改进后的IMPSTC算法，能够使机器人团队在更少的时间和重复覆盖区域情况下完成在线覆盖地图任务。

基于分层模糊有色Petri网的防空C3I系统建模研究

陈星佑1,2，乐晓波1，曹伟1，周恺卿3

2016, 38(01): 102-107. doi:

摘要 ( 151 )

PDF (718KB) ( 389 ) 　　

通过分析某防空C3I系统的组成和运行方式，针对系统结构复杂、多种资源、资源多种模糊属性等特点，定义了一种分层模糊有色Petri网HFCPN，并给出具体的推理算法。在此基础上建立该防空C3I系统模型，从而提出了一种建立防空C3I系统分析模型的新方法。最后通过应用实例验证了该方法在描述系统分布、并发、异步等特性的同时，分析系统资源多种模糊属性问题的能力。

基于几何变换的MAGA求解多纳什均衡

顾佼佼1，刘卫华1，赵建军1，刘吉伟2

2016, 38(01): 108-113. doi:

摘要 ( 124 )

PDF (884KB) ( 358 ) 　　

针对粒子群优化PSO早熟收敛而且只能寻找一个极值的问题，提出基于几何变换的MAGA混合智能算法，并应用于博弈论求解多纳什均衡问题。算法由粒子群优化和禁忌搜索TS算法构成，对粒子群优化的改进包括对粒子运动松散控制和引入遗传算法GA增强粒子多样性；禁忌搜索算法对邻域空间深度搜索；引入DeflectionRepulsion几何变换对目标函数进行动态变换使算法能够寻找多极值。仿真结果表明，该算法在多纳什均衡求解问题表现突出，寻优速度快，准确率高，可扩展到其他多模态多极值问题领域。

量子遗传算法优化BP神经网络的网络流量预测

张立仿，张喜平

2016, 38(01): 114-119. doi:

摘要 ( 219 )

PDF (549KB) ( 676 ) 　　

为了提高网络流量的预测精度，提出了一种改进的多种群量子遗传算法优化BP神经网络的网络流量预测模型。在确定了神经网络的结构后，采用多种群量子遗传算法对BP神经网络的初始权值和阈值进行优化。该模型利用K均值聚类算法将种群划分成若干子种群，多个子种群分别进化以保持种群的多样性。子种群间通过移民操作进行信息交互，减小了算法陷入局部最优的概率。同时采用一种自适应的量子旋转门调整策略加快算法的收敛速度。仿真结果表明，相较传统方法，该模型在网络流量预测方面具有收敛速度快、预测精度高的优点。

基追踪问题的近点算法及其应用研究

张小亚，张慧，王红霞

2016, 38(01): 120-124. doi:

摘要 ( 185 )

PDF (495KB) ( 408 ) 　　

基追踪问题具有广泛的应用背景，近年来得到了大量的关注和研究。近点算法是解决该问题的一种有效算法,其关键是子问题的求解,利用线性Bregman迭代的求解思想进行Lagrange对偶分析求解子问题，设计了一个新的迭代算法BPPPA。与线性Bregman算法相比，BPPPA可避免参数选取对模型的依赖，并用于非压缩感知的稀疏恢复问题求解。同时,为了提高新算法的收敛速度，进一步对新算法进行了Nestrove加速，得到了加速的BPPPA算法。数值实验中，分别针对压缩感知中的稀疏信号恢复和非压缩感知模型，测试了参数选取对算法效率的影响，实验结果验证了新算法的有效性。

编队卫星相对位置测量信息自主确定月球引力场的方法

王祎1，杏建军1，于洋1，郑黎明1，赵延鹏1，刘琛2

2016, 38(01): 125-130. doi:

摘要 ( 126 )

PDF (1019KB) ( 357 ) 　　

针对月球远月面引力场的数据不能直接测量而导致其测量精度不高的问题，提出了一种基于双星编队的月球引力场自主确定方法。该方法考虑到月球引力场对编队卫星相对运动的影响，通过扩展卡尔曼滤波算法对星间距离测量数据的处理，利用观测量的测量值与一步预测测量值之间的偏差来修正一步预测状态值，从而得到状态估计量，即实现了卫星自主定轨以及月球引力场的自主确定。仿真结果表明，根据对编队卫星在7 430 s内的相对位置测量数据的处理，卫星轨道位置和速度确定精度分别能达到5.04 m和6.07×10-3 m/s；月球J2项摄动常数的精度能达到9.14×10-8；月球引力场常数的精度能达到3.47×107 m3/s2。此结果能在一定程度上改善现有的月球引力场模型，为我国“嫦娥工程”提供更多的技术资料。

分布式仿真系统中的全局一致性问题研究

范林军1,董红林2，凌云翔1,3，李崇东1

2016, 38(01): 131-137. doi:

摘要 ( 150 )

PDF (699KB) ( 361 ) 　　

系统一致是分布仿真应用DSA的基础和前提。为提高DSA的全局一致性程度，获得真实、可信的仿真结果，首先阐述了DSA全局一致性问题；然后以某分布仿真系统为例，系统阐述了其全局不一致现象；在此基础上，分析了DSA系统的全局一致性需求；最后，重点给出了模型域、服务域和认知域内的一致性控制策略与建议。本研究可为DSA系统设计与开发人员提供技术与方法指导。

改进的双向SIFT特征匹配算法

安婷，贺一民，张志毅

2016, 38(01): 138-143. doi:

摘要 ( 172 )

PDF (1344KB) ( 423 ) 　　

以基于图像序列摄像机自标定为基础，针对尺度不变特征转换SIFT算法误匹配率高且运行效率低的问题，提出一种改进的双向SIFT特征匹配算法。在去除误匹配方面，首先采用双向匹配消除部分误匹配点对，然后结合视差梯度约束算法和随机抽样一致性RANSAC算法提纯匹配点对；在提高运行速度方面，首先在初匹配中采用K邻近算法，其次调整视差梯度约束迭代条件，都通过减少迭代次数来降低算法耗时。以基于图像序列摄像机自标定为基础，针对尺度不变特征转换SIFT算法误匹配率高且运行效率低的问题，提出一种改进的双向SIFT特征匹配算法。在去除误匹配方面，首先采用双向匹配消除部分误匹配点对，然后结合视差梯度约束算法和随机抽样一致性RANSAC算法提纯匹配点对；在提高运行速度方面，首先在初匹配中采用K邻近算法，其次调整视差梯度约束迭代条件，都通过减少迭代次数来降低算法耗时。实验表明，改进后的算法在去除了大部分误匹配的基础上，保留了足够的匹配点对以用于摄像机空间位置和姿态的自动标定，且相较SIFT算法在运行速度上有了较大的改进。关键词：实验表明，改进后的算法在去除了大部分误匹配的基础上，保留了足够的匹配点对以用于摄像机空间位置和姿态的自动标定，且相较SIFT算法在运行速度上有了较大的改进。关键词：

基于图像显著性检测的图像分割

刘志伟，周东傲，林嘉宇

2016, 38(01): 144-147. doi:

摘要 ( 275 )

PDF (594KB) ( 793 ) 　　

图像分割在许多图像处理和机器视觉问题中是一个非常重要的过程，是将一幅图分割成几个显著的区域，然而不能将其中最显著的目标直接分割出来，需要进一步处理。为此本文采用显著性检测的算法实现了对目标的分割。显著性区域检测可以应用于目标检测、图像检索、图像分割等机器视觉问题。使用杨等人提出的基于图论的流形排序算法检测显著性算法得到显著性图，再结合meanshift分割算法，实现了对视觉显著性目标分割提取，可获得可观的图像分割结果，并将此算法应用到了森林火灾检测中，能对图像中的火焰部分进行有效的分割提取。

基于改进快速鲁棒性特征的导弹视频特征匹配

杨凯达1，赵文杰2，李成2，李德军2

2016, 38(01): 148-155. doi:

摘要 ( 128 )

PDF (1086KB) ( 324 ) 　　

利用电视制导导弹视频图像确定导弹落点，从而开展精确目标毁伤评估研究，是目前全新的一种评估手段。图像特征匹配是利用视频图像确定导弹落点的关键步骤。针对导弹视频图像的特点及其作战应用，在特征匹配阶段，依据准确性和实时性两个原则，对快速鲁棒性特征算法做了两方面的改进：一是限制特征点提取区域，定义了图像区域限制算子；二是限制特征点数量，利用算法阈值和随机抽样一致性算法对特征点进行限制。实验结果表明，提出的算法对典型视频片段进行处理，较原算法在匹配时间上平均减少12.6%，匹配准确率平均提升13.4%，较尺度不变特征变换算法匹配时间平均提升了74.9%，同时，有效消除伪匹配点。通过对三段视频进行测试仿真，改进算法在整体上较原算法的匹配时间加快14.9%，且通用性较强，适用于视频图像的特征点匹配。关键词：

基于小波分析和Gaussian回归的急性低血压预测

孙浩军，张崇锐，张磊，李惊涛

2016, 38(01): 156-162. doi:

摘要 ( 126 )

PDF (713KB) ( 313 ) 　　

急性低血压是危害病人健康的并发症之一，对急性低血压发生的提早预测，能够帮助医生对重症病人找到更好的医疗处理方案。提出了一个基于趋势分量的Gaussian函数拟合预测模型，即用小波多尺度分析提取出信号的趋势分量；再根据Gaussian回归模型对趋势分量进行函数拟合，得到的函数参数作为特征值，用支持向量机SVM对数据分类。Gaussian回归模型使用的是数据驱动，用系数来描述数据之间的关系。通过在较大病人数据集上实验得到了较好的效果。

基于互联网信息的多约束多目标旅游路线推荐

陆国锋1，黄晓燕2，吕绍和1，王晓东1

2016, 38(01): 163-170. doi:

摘要 ( 242 )

PDF (974KB) ( 607 ) 　　

针对新游客在陌生城市如何规划旅游路线的问题，研究基于景点评分机制以及用户多约束的旅游路线推荐问题。首先提取景点的开放时间、门票与GPS坐标等及旅游网站上对于景点的评价信息等；然后提出一种基于多约束的k贪心算法，可以为游客推荐较好的旅游线路，并有效消除了推荐系统对先验知识的依赖。以驴评网上北京著名景点的信息作为数据集，实现并评估了推荐算法。实验结果表明，该方法能够为用户提供准确合理的路线规划。

基于灰色关联度聚类与标签重叠因子结合的协同过滤推荐方法研究

赵宏晨1，翟丽丽1,2，张树臣1,2

2016, 38(01): 171-176. doi:

摘要 ( 139 )

PDF (512KB) ( 366 ) 　　

协同过滤算法是目前被广泛运用在推荐系统领域的最成功技术之一，但是面对用户数量的快速增长及相应的评分数据的缺失，推荐系统中的数据稀疏性问题也越来越明显，严重地影响着推荐的质量和效率。针对传统协同过滤算法中的稀疏性问题，采用了基于灰色关联度的方法对用户评分矩阵进行数据标准化处理，得到用户关联度并形成关联度矩阵；然后对关联矩阵中的用户进行关联度聚类，以减少相似性算法的复杂度；之后利用标签重叠因子对传统计算用户相似性的协同过滤算法进行改进，将重叠因子与用户评分以非线性形式进行组合；最后通过实例改进后的算法在推荐精确度上有着较大的提高。

基于SVM的局部潜在语义分析算法研究

谭光兴，刘臻晖

2016, 38(01): 177-182. doi:

摘要 ( 128 )

PDF (599KB) ( 399 ) 　　

针对现有的Web文本分类与表示方法中出现的各种分类效果与性能优化等问题，基于局部潜在语义分析的理论原理，利用支持向量机分类优势，设计出一种基于文档与类别之间相关度的生成局部区域的算法，即SLLSA。该算法在语义分析使用矩阵的奇异值分解过程中引入不同类别信息，分析特征词的局部特征，使用支持向量机分类器计算文本对类别的相关度参数，并应用于局部区域生成过程。通过实验表明，SLLSA算法有效解决了局部区域如何进行局部奇异值分解问题，有效提高并优化了Web文本分类效果，更好地表示了Web文本潜在语义空间。

一种基于整体多样性增强的推荐算法

王森

2016, 38(01): 183-187. doi:

摘要 ( 122 )

PDF (469KB) ( 360 ) 　　

目前大多数推荐算法都是以提高用户对未知商品的预测评分值为主要目标，然而预测准确率并不是增加用户满意度的唯一标准，推荐列表的多样性也是衡量推荐质量的一个重要指标。提出了一种新的推荐方法，旨在提高系统的整体多样性和长尾商品的推荐率。算法综合考虑了商品预测值、商品流行度、商品的偏爱度等多个标准。实验表明，与其他方法相比，本方法在维持较高推荐准确率的同时，能够推荐更多的长尾商品，提高了系统的整体多样性。关键词：

基于多标记学习的汽车评论文本多性能识别

张晶,李德玉,王素格

2016, 38(01): 188-194. doi:

摘要 ( 99 )

PDF (660KB) ( 375 ) 　　

针对汽车产品评论文本中出现的多方面性能,提出一种基于多标记学习的汽车评论文本多方面性能识别方法。首先,结合文本挖掘方法,利用多标记文本特征选择方法选取特征,将非结构化的文本转化为结构化的多标记数据集。在此基础上,使用四种多标记分类方法,对待识别的评论文档标注一个或多个方面标记。最后,以八种多标记评价指标评估方面识别的性能。在新浪汽车评论语料上的实验表明,方面识别的子集准确率达到了95%,验证了方法的可行性。

当期目录

作者中心

审稿中心

在线期刊