计算机工程与科学

李瑞琳1,2，赵永华1，黄小磊2,3

2016, 38(5): 839-847. doi:

摘要 ( 569 )

PDF (1029KB) ( 673 ) 　　

谱聚类算法由于其可识别非凸数据分布、可有效避免局部最优解、不受数据点维数限制等优点，在许多领域得到广泛应用。然而，随着数据量的增大和数据维数的增多，在保证聚类准确性的前提下，尽可能降低计算时间将变得非常必要。此外，影响谱聚类算法聚类质量的因素除数据集本身外，还与所采用的求解距离矩阵的方法、相似性矩阵的尺度参数、Laplacian矩阵形式等多种因素相关。针对以上问题，首先对于大规模数据问题，将MPI并行编程模型应用于谱聚类算法；然后利用t最近邻方法对谱聚类算法中较大维数的Laplacian矩阵进行近似转化，同时用局部尺度（Local Scaling）参数对算法中的尺度参数进行自动调节。基于上述分析，提出了一种谱聚类并行实现算法，即稀疏化局部尺度并行谱聚类算法SLSPSC，并在四个数据集上进行了测试，与现有的并行谱聚类算法PSC在运行时间和聚类质量两方面做了比较分析。实验结果显示，该算法降低了求解Laplacian矩阵的总时间，同时部分数据集聚类质量得到较大提高。

异构多核下兼顾应用公平性和能耗的调度方法研究

杨亚琪，栾钟治，杨海龙，杨姝，钱德沛

2016, 38(5): 848-856. doi:

摘要 ( 761 )

PDF (1406KB) ( 493 ) 　　

异构多核处理器通常由高性能的大核和低能耗的小核组成，在其上进行合理的线程调度可以有效地提高资源利用率，节省能耗。之前论文提出的大小核上的公平性调度并没有考虑核上有不同频率/电压状态的情况，而现在支持DVFS调节的处理器越来越普遍，因此很有必要将线程间公平度的计算进行扩展和改进。提出在每个核有若干种不同的DVFS状态时异构多核处理器上线程公平度的计算方法，对已有的性能预测模型进行改进，采用自适应算法调整模型中的系数，并在此基础上提出了一种调度策略，维持各线程之间的公平度和处理器功率满足提前设定的阈值，同时选取能效最优化的配置，实现减小应用运行能耗的目的。实验结果表明，与所提出的调度策略相比，采用static、DVFSonly、swaponly三种调度方法时，在总的运行时间几乎相同的情况下，平均要多产生20%以上能耗，对于有些应用甚至达到了50%。

高性能大气校正算法中遥感数据切分策略研究

白连红1,2，徐澍1,2，司一丹1,李莘莘1

2016, 38(5): 857-862. doi:

摘要 ( 475 )

PDF (772KB) ( 596 ) 　　

高分辨率卫星遥感数据在地物识别等方面具有明显优势,然而其定量化应用中需要精确的大气校正，该过程通常相当耗时。分别研究了大气校正算法串行处理方法及基于通用计算机集群系统的并行处理过程。通过对2012年7月我国华北地区的环境卫星CCD数据进行大气校正，并分析了串、并行过程各个步骤运行时间，表明了对大气校正并行处理的高可行性。针对并行过程中负载不均衡和通讯频繁等问题，设计了基于卫星像元特征的数据切分策略，并对不同并行算法进行了性能分析，表明了本文反演结果的可靠性，以及提出的切分策略能达到更高的加速比。

一种用于片上网络布图规划的改进模拟退火与粒子群混合算法

宋国治，涂遥，张大坤，温越博

2016, 38(5): 863-870. doi:

摘要 ( 581 )

PDF (1072KB) ( 613 ) 　　

智能优化算法作为解决大规模集成电路芯片设计中布图规划问题的经典方法已被研究多年。结合异构三维片上网络布图问题的具体特点，采用B*tree间接描述布图问题中的解结构，针对模拟退火收敛速度慢、优化效率低的缺点，对搜索策略和概率性的劣向转移作出了改进，并将改进后的模拟退火思想引入粒子群优化算法中，使结合后的算法结合了粒子群并行计算的特点和模拟退火能够实现全局优化的特点。通过仿真实验验证，所提出的该混合改进算法在解决布图问题中要优于传统模拟退火算法。

基于快速自编码的RELM的文本分类

周杭霞，叶佳骏，任欢

2016, 38(5): 871-876. doi:

摘要 ( 462 )

PDF (666KB) ( 554 ) 　　

正则化极限学习机RELM是一种单隐层前馈神经网络，不同于传统神经网络算法，RELM通过随机设置输入层权重和偏置值，可以快速求得输出层权重，并且引入正则化因子，能够提高模型的泛化能力。针对文本信息高维度、多类别的问题，提出一种基于快速自编码的正则化极限学习机FARELM。将由RELM改进后的快速自编码神经网络对样本进行无监督特征学习，并对特征提取后的数据使用RELM进行分类。实验表明，FARELM的学习速度和分类精度较优。

多维数据的Z-Ordering存储映射算法及其缓存调度优化

侯昉,陆寄远,黄承慧

2016, 38(5): 877-884. doi:

摘要 ( 568 )

PDF (1045KB) ( 525 ) 　　

多维数据以线性形式在存储系统中进行访问操作，二维及以上维度空间中的相邻节点被不同的映射算法映射到一维空间的不相邻位置。高维空间中进行相邻节点访问时，其一维存储映射位置有着不同的访问距离和访问延迟。提出了基于空间填充曲线ZOrdering的存储映射方法及其访问距离的度量指标，并和常规优先算法进行了对比，发现能更好地将高维相邻的数据节点簇集到一维存储位置，加强了局部性。调整缓存空间中用于预取的空间大小，可以利用增强的局部性，提高了缓存命中率。实验结果表明，改善了多维数据的访问速度，优化了系统性能。

基于神经网络预测的SNP信息的剪接点识别算法研究

赵婧1，魏彬2，陈明淑1，张晓娟1

2016, 38(5): 885-890. doi:

摘要 ( 503 )

PDF (1031KB) ( 527 ) 　　

随着基因组计划的完成，人们需要尽快从这些海量数据中了解基因组的结构，揭示生命的奥秘，剪接位点识别是其中的一个重要环节，然而到目前为止该问题仍未能得到很好的解决。在分析此问题时引入了第三代遗传标记单核苷酸多态性(SNP)，以期探索变异对剪接机制的影响；其次，对DNA序列的数字化进行了探讨。通过实验表明，单核苷酸多态性的引入对于剪接位点识别算法的性能有着一定的影响，此外文中提出的编码方法对预测精度的提升亦有正面作用，整体效果比目前常用方法有了大幅提升。

机会网络中基于能量消耗的缓存管理策略

张峰，王小明

2016, 38(5): 891-897. doi:

摘要 ( 475 )

PDF (753KB) ( 495 ) 　　

为了减少机会网络中节点的能量消耗，均衡各节点之间能量使用情况，延长网络寿命，提出基于能耗的缓存管理策略。在节点缓存空间有限的情况下，所提出的算法根据周围邻居节点能量的使用情况，动态调整节点用于缓存转发消息空间的大小，从而减少节点在存储转发过程中的能量消耗。同时，为了避免传统休眠机制的能耗路由算法中由于目的节点休眠而导致消息投递失败的情况，引入了新的Inactive节点状态。实验仿真表明，与定时休眠机制的能耗算法比较，采用基于能量消耗的缓存管理策略能够使得机会网络中所有节点的整体能耗降低50%左右，并且节点之间能耗的标准差降低80%以上。

基于重叠社区和结构洞度的社会网络结构洞识别算法

冯健，丁媛媛

2016, 38(5): 898-904. doi:

摘要 ( 581 )

PDF (558KB) ( 697 ) 　　

结构洞是社会网络中的关键位置，对信息扩散起中介作用。为高效、准确地辨识具有社团结构的社会网络中占据结构洞的节点，提出了一种基于重叠社区和结构洞度的结构洞识别算法，旨在找到一组最具信息优势和控制优势的节点。基本思想是首先定位社区之间的重叠节点，然后利用节点的邻接差异和连接的社区差异衡量其非冗余性，计算出重叠节点的结构洞度，通过对结构洞度值升序排列发现占据结构洞的节点集。应用于实际数据集的实验结果表明，与网络约束系数算法、中介中心度算法、MaxD算法相比，该算法的识别准确度最高，时间复杂度最低。

北斗系统信号捕获方法研究综述

李灯熬，李帅，赵菊敏，牛文慧，刘金强

2016, 38(5): 905-913. doi:

摘要 ( 764 )

PDF (852KB) ( 890 ) 　　

目前针对北斗信号捕获技术研究较多，但缺少系统的分类、总结和性能比较的问题。按照单周期、多周期、辅助捕获三个标准进行研究；同时，分析了捕获算法的硬件实现现状，对国内外捕获研究领域的相关方法进行了系统的整理和综述；对捕获方法进行了性能对比，仿真验证了各自的优劣，指出了北斗系统捕获技术所面临的问题和未来的发展趋势，对捕获领域加强了理论支撑。

基于拍卖理论和高斯过程回归学习的频谱分配算法

刘觉夫，杨将，王建旭，胡静

2016, 38(5): 914-920. doi:

摘要 ( 596 )

PDF (871KB) ( 531 ) 　　

针对认知无线网络中认知用户的频谱分配问题，提出了一种基于拍卖理论和高斯过程回归学习的频谱分配算法。该算法基于VCG拍卖模型，考虑认知用户对通信质量的要求，构造出更有效的收益函数。在频谱拍卖过程中，认知用户通过学习拍卖历史数据预测其他认知用户的竞价，并最优化其竞价策略。频谱拍卖人根据各认知用户提交的竞价来分配频谱资源。理论分析和仿真结果证明了该算法是有效的，并且能够提高频谱利用率和认知用户的收益。

工业软件现场测试中的拆分及其测试数据设计

赵一丁1,樊银亭1,郑秋生1,楚纪正2,罗菁1

2016, 38(5): 921-931. doi:

摘要 ( 1071 )

PDF (959KB) ( 523 ) 　　

在工业软件的用户生产现场测试中，可能由于操作风险、用户生产限制等约束而导致测试不充分，针对实践中的难点提出新的现场测试过程及其测试数据生成方法。定义了测试拆分子集及相关属性概念，根据现场因素设计的测试拆分子集提高了现场测试可主动性；综合现场因素设计拆分方案，采用针对性的辅助管理程序引导每个测试拆分子集的现场测试的实施；通过对生产现场的历史数据的处理建立针对各测试拆分子集的测试准备数据库，以搜索测试准备数据库的结果为依据并结合现场因素设计现场主动测试的输入数据，并说明了实践中的综合实施过程。通过石化生产优化控制系统的现场测试的实际案例，说明了这种方法能够在预防风险的前提下显著提高现场测试的充分性和测试效率。

一种基于主题模型的软件缺陷预测技术研究

张泽涛1,2，叶立军1,2，程伟1,2，顾军1,2

2016, 38(5): 932-937. doi:

摘要 ( 529 )

PDF (588KB) ( 587 ) 　　

软件缺陷预测通常针对代码表面特征训练预测模型并对新样本进行预测，忽视了代码背后隐藏的不同技术方面和主题，从而导致预测不准确。针对这种问题，提出了一种基于主题模型的软件缺陷预测方法。将软件代码库视为不同技术方面和主题的集合，不同的主题或技术方面有不同的缺陷倾向。采用LDA主题模型对不同主题及其缺陷倾向进行建模，根据建模结果计算主题度量，并将传统度量方式和主题度量结合进行模型训练和预测。实验结果显示，该方法相对传统的软件缺陷预测技术有高的准确性，并且可以在软件演化中保证模型相对稳定，可以适用于各种缺陷预测任务。

配送中心选址分配问题的DNA-鱼群算法研究

费腾1,2，张立毅1,2

2016, 38(5): 938-945. doi:

摘要 ( 615 )

PDF (1824KB) ( 454 ) 　　

人工鱼群算法在算法后期容易陷入局部最优，从而降低了寻优的精度及收敛的速度。提出一种新的改进算法——DNA鱼群算法，将DNA算法中的交叉变异操作应用到基本人工鱼群算法中，丰富了鱼群的多样性，促进人工鱼跳出局部最优，并将改进的人工鱼群算法用于解决配送中心选址分配问题。实验仿真表明，DNA鱼群算法具有更好的寻优能力。

基于粒子群蚁群算法的供应链合作伙伴选择研究

卢志刚，申康

2016, 38(5): 946-953. doi:

摘要 ( 393 )

PDF (819KB) ( 481 ) 　　

针对供应链合作伙伴选择的准确性和效率问题，提出一种基于粒子群和蚁群优化的合作伙伴选择算法。建立基于供应链链节体和连接弧的有向图路径模型，构造多目标规划模型。利用改进的离散型粒子群算法，求取伙伴选择问题的初始解集，构建初始信息素矩阵，通过改进蚁群算法的寻径规则，求取供应链合作伙伴选择问题的最优解。实验结果表明，所提算法有效提高了供应链合作伙伴选择的精度和效率，具有较好的性能。

果蝇耦合均匀设计算法及其优化SVM参数

高雷阜，赵世杰，于冬梅，徒君

2016, 38(5): 954-959. doi:

摘要 ( 532 )

PDF (2099KB) ( 605 ) 　　

支持向量机的参数选择仍无系统的理论指导，且参数优化一直是支持向量机的一个重要研究方向。传统果蝇优化算法能够较快寻得一个较优的近似最优解，随后在该解的邻域继续迭代而造成寻优时间的严重增加。针对该问题构建了果蝇优化算法与均匀设计相耦合的果蝇耦合均匀设计算法，并将其用于支持向量机的参数优化。该算法首先利用果蝇优化算法并行寻优以快速得到所研究问题的一个较优近似最优解，然后跳转执行均匀设计的局部寻优，以获得一个更优的近似最优解。数值实验结果表明：该算法具有较快的寻优效率和较高的分类精度，验证了其在支持向量机参数优化中的有效性和可行性。

改进型HLBP纹理特征的行人检测

周书仁1,2,王刚1,2,徐岳峰1,2

2016, 38(5): 960-967. doi:

摘要 ( 469 )

PDF (858KB) ( 479 ) 　　

在行人检测中,Haar型LBP(HLBP)特征采用局部统计方式，有效地降低了噪声影响，相比LBP特征对图像纹理描述有明显优势。但是，HLBP特征在计算特征值时，中心点没有参与计算，导致其信息没有被利用。针对这一不足，提出了改进型HLBP（IHLBP）特征，该方法令中心点参与到计算工作中，并赋予其最大权值。首先利用二维离散Haar小波变换，对图像做两级分解处理，得到三种不同尺度图像；然后针对上述三种图像分别提取IHLBP特征并做归一化处理，最后串接三组特征得到最终的特征向量。在INRIA Person数据集上，采用SVM进行测试。实验结果表明，该方法能有效地提高行人检测识别率。

混合PCA/ICA与JPEG2000结合的高光谱图像压缩

叶珍1,白璘1,刘玉2,何明一3,粘永健2

2016, 38(5): 968-974. doi:

摘要 ( 706 )

PDF (567KB) ( 515 ) 　　

主成分分析（PCA）常常结合JPEG2000压缩标准用来对高光谱图像进行压缩。然而，由PCA得到的主成分仅利用了二阶统计信息。对于高光谱图像应用来说，只采用二阶统计信息是远远不够的，如异常像素的处理常常需要用到更高阶的统计信息。研究了一种混合PCA/ICA与JPEG2000相结合的高光谱图像压缩算法。首先，对原始高光谱图像进行PCA变换，提取出前m个主成分对应的特征向量矩阵WPCA；然后，对其余的特征向量进行ICA变换，得到n个特征向量矩阵WICA；最后，将得到的混合投影矩阵、原始高光谱图像及其均值向量共同嵌入JPEG2000比特流，从而完成对高光谱图像的压缩。在不同码率的情况下，通过空间相关系数（ρ）、信噪比（SNR）、光谱角填图（SAM）等技术指标对混合PCA/ICA+JPEG2000算法的压缩性能进行评估。实验结果表明，混合PCA/ICA+JPEG2000算法不但能有效去除高光谱图像的谱间相关性，而且能够有效提高光谱保真度，保护异常像素信息。

一种基于局部符号差能量的非局部分割模型

闫沫1，王瑜2

2016, 38(5): 975-982. doi:

摘要 ( 592 )

PDF (576KB) ( 478 ) 　　

针对灰度非均匀的图像，提出一种基于局部符号差能量的非局部图像分割模型。该模型包含基于局部符号差能量的数据驱动项和非局部全变分正则项，具有局部可分离性和全局一致性的特点。由于本文模型是凸的，因此在数值实现上可以采用splitBregman迭代算法，具有较快的运算速度。同经典的基于局部区域的主动轮廓分割模型相比，该方法具有以下优点：（1) 该模型受初始化的影响很小；（2) 采用splitBregman迭代算法，运算速度更快；（3) 能够对具有细密纹理和具有弱边缘目标的图像进行正确分割。实验结果表明，该模型对灰度非均匀图像能够进行较准确的分割，相比其他模型具有更好的鲁棒性。

一种改进的心电图QRS波群检测算法

王晓花，徐学军，何秋娅

2016, 38(5): 983-987. doi:

摘要 ( 602 )

PDF (449KB) ( 591 ) 　　

在利用小波变换检测QRS波群时，最关键的部分就是模极值配对，提出一种区域极值配对算法来检测R波。首先利用二次样条小波基函数和多孔（ATrous）算法对心电（ECG）信号进行小波变换求取模极值，用正极大值来确定搜索区域，以这个正极大值为起点，以这个确定区域为搜索范围，向左搜索负极大值点，将这两个极值配对，他们之间的过零点就是R波的对应点，然后在检测到R波的基础上检测出Q波与S波，再结合距离最大值法检测出QRS波群的起止点。并采用医学相关理论对检测结果进行优化，进一步去除错检点，补偿漏检点。最后利用MITBIH心率失常数据库中记录的数据对该算法进行验证，实验结果表明所提算法能准确检测QRS波群，平均检出率达到了99.97%。

基于SAX方法的时间序列分类问题的多阶段改进研究

宋伟1，张帆2,叶阳东1，韩鹏3，范明1

2016, 38(5): 988-996. doi:

摘要 ( 430 )

PDF (830KB) ( 621 ) 　　

分类问题是数据挖掘中的基本问题之一，时间序列的特征表示及相似性度量是时间序列数据挖掘中分类、聚类及模式发现等任务的基础。SAX方法是一种典型的时间序列符号化表示方法，在采用该方法的基础上对时间序列进行分类，不仅可以有效地降维、降噪，而且具有简单、直观等特点，但是该方法有可能造成信息损失并影响到分类结果的准确性。为了弥补信息损失对分类结果的影响，采用了集成学习中大多数投票方法来弥补BOP表示后的信息损失，从而提高整个分类器的效率。针对一些样本在BOP表示中都损失了相似的重要信息，以至于大多数投票无法进一步提高分类效率的问题，进一步提出了结合集成学习中AdaBoost算法，通过对训练样本权重的调整，从而达到以提高分类器性能来弥补信息损失的效果。实验结果表明，将BOP方法与集成学习相结合的方法框架，不仅能很好地处理SAX符号化表示中的信息损失问题，而且与已有方法相比，在分类准确度方面也有显著的提高。

协同过滤技术的改进研究

刘国丽，由志远，李艳萍，于丽梅

2016, 38(5): 997-1001. doi:

摘要 ( 352 )

PDF (445KB) ( 632 ) 　　

协同过滤算法应用于个性化推荐系统中取得了巨大成功，它是通过用户项目评分数据，以用户之间或者项目之间相互协作的方式来产生推荐。然而，邻居用户的相似度计算不精确一直是阻碍推荐系统推荐精度进一步提高的主要因素。从提高用户间相似度计算精度出发，提出了一种改进算法，该算法通过考虑不同特征、加强平均值影响、惩罚热门项目的比重，对用户的相似度计算方法进行改进，以期生成更加合理的邻居用户集，最后，根据评分预测公式进行预测，最终产生推荐。在MovieLens数据集上的实验表明，改进算法计算用户间的相似度更加精确，推荐算法的预测精确度有了显著提高。

基于形式概念分析的粗糙描述逻辑研究

闫之焕

2016, 38(5): 1002-1006. doi:

摘要 ( 302 )

PDF (390KB) ( 401 ) 　　

以往的粗糙描述逻辑(RDL)都是基于传统的粗糙集理论。实际上,经常会出现用形式概念表示一个概念的情况,此时一个自然的问题就是如何处理可能出现的不确定概念。把形式概念分析与粗糙集理论联系起来做为基础,给出可定义概念和不可定义概念的定义,并给出不可定义概念的上近似和下近似,这里的近似定义虽然不同于传统的粗糙近似算子形式,但是有很好的实用性。基于新的上下近似定义,把一组近似算子引入到描述逻辑的结构中，形成一种新的粗糙描述逻辑。给出了相应的语法和语义,最后还给出了扩展的Tableau算法,可以用来解决相应的推理问题。关键词：

基于遗传粒子群和粗糙集的最小属性约简算法

吴尚智1，罗艺纯2，翟敬鹏1

2016, 38(5): 1007-1013. doi:

摘要 ( 434 )

PDF (473KB) ( 465 ) 　　

阐述了粗糙集理论、遗传约简算法和粒子群约简算法。属性约简是知识发现的关键问题之一。传统的属性约简算法都是串行搜索的，算法效率低且收敛速度慢。将计算智能和粗糙集相结合，提出了一种基于遗传粒子群和粗糙集的最小属性约简算法。该算法利用属性依赖度计算属性核，并在种群初始化时引入属性核作为限制条件，动态调整适应度函数，以达到求得最小属性约简的目的。实验表明，对于数据量大、属性维度高的属性约简问题，该算法具有高效的处理能力。

基于AHTPSO的连续属性离散化算法

董跃华,刘力

2016, 38(5): 1014-1023. doi:

摘要 ( 380 )

PDF (634KB) ( 424 ) 　　

针对粗糙集不能较好地处理连续型属性的问题，结合粗糙集理论和粒子群算法，提出基于自适应混合禁忌搜索粒子群的连续属性离散化算法。首先，该算法通过对参数的自适应更新操作，从而避免了粒子群出现早熟的现象；然后将粒子群当代得到的全局最优粒子送入禁忌算法中进行优化，有效地提升了算法的局部探索能力；在兼顾决策表系统一致性的同时，将划分的断点初始化为一群随机粒子，通过改进后粒子群的自我迭代得到最佳的离散化划分点。实验结果表明，与其他结合粗糙集的离散化算法相比，该算法具有更高的规则分类精度和较少的离散化断点个数，对连续属性的离散化效果较好。

一种单位代价收益决策树剪枝算法

周美琴，陈诗旭，袁鼎荣，朱新华

2016, 38(5): 1023-1030. doi:

摘要 ( 665 )

PDF (565KB) ( 439 ) 　　

目前关于决策树剪枝优化方面的研究主要集中于预剪枝和后剪枝算法。然而，这些剪枝算法通常作用于传统的决策树分类算法，在代价敏感学习与剪枝优化算法相结合方面还没有较好的研究成果。基于经济学中的效益成本分析理论，提出代价收益矩阵及单位代价收益等相关概念，采用单位代价收益最大化原则对决策树叶节点的类标号进行分配，并通过与预剪枝策略相结合，设计一种新型的决策树剪枝算法。通过对生成的决策树进行单位代价收益剪枝，使其具有代价敏感性，能够很好地解决实际问题。实验结果表明，该算法能生成较小规模的决策树，且与REP、EBP算法相比具有较好的分类效果。

基于Voronoi图的障碍不确定数据的聚类算法

李宇涵，孙冬璞

2016, 38(5): 1031-1038. doi:

摘要 ( 387 )

PDF (749KB) ( 419 ) 　　

数据采集过程中普遍存在不确定性，并且在现实地理空间中，不确定数据之间可能存在障碍物间隔。为解决障碍空间中不确定数据的聚类问题，提出APPGCUO算法，该算法包括三个过程：在障碍物约束下采用R树节点最小最大值方法提出的RPTOUCure算法，用以生成局部最优解，提高生成局部最优解的效率；继而利用近似骨架的理论提出GIABO算法，以局部最优解生成有效初始解，避免划分聚类算法中任意初始解的不足；最后结合Voronoi图的特性提出VPTKMediods算法，减少不确定数据的积分运算量。实验结果表明，APPGCUO算法具有较高的聚类效率和质量。

一种基于倒排索引树的增量更新关联挖掘算法

徐春，李广原，王玄，田换

2016, 38(5): 1039-1045. doi:

摘要 ( 723 )

PDF (811KB) ( 428 ) 　　

增量更新关联规则挖掘主要解决事务数据库中交易记录不断更新和最小支持度发生变化时关联规则的维护问题。针对目前诸多增量更新关联规则挖掘算法存在效率低、计算成本高、规则难以维护等问题，提出一种基于倒排索引树的增量更新关联挖掘算法。该算法有效地将倒排索引技术与树型结构相结合，使得交易数据库中的数据不断更新和最小支持度随应用环境不同而不断改变时，以实现无需扫描原始交易数据库和不产生候选项集的情况下生成频繁项集。实验结果表明，该算法只需占用较小的存储空间、且检索项集的效率较高，能高效地解决增量更新关联规则难以维护的问题。

CRF和词典相结合的蒙古文地名识别研究

吴金星1，丽丽1，杨振新2

2016, 38(5): 1046-1051. doi:

摘要 ( 342 )

PDF (743KB) ( 515 ) 　　

蒙古语在命名实体识别方面开展过人名的识别，但在地名的识别方面还没有开展相应的研究。首次实现了基于条件随机场模型的蒙古文地名识别。首先从蒙古语黏着性特点分析入手，研究了蒙古语语料库中地名的存在形式以及各类地名的特点，针对蒙古语语料库中地名的特点，在词汇特征、指示词特征、特征词特征等特征基础上引入了词性特征。之后通过地名词典补召了未识别的地名。以内蒙古大学开发的100万词规模的标注语料库为训练数据，该模型的地名识别性能达到了94.68%的准确率、84.40%的召回率和89.24%的F值。

改进MFCC算法在朱鹮鸣声个体识别中的应用

王民，曹清菁，贠卫国，周军妮

2016, 38(5): 1052-1056. doi:

摘要 ( 287 )

PDF (765KB) ( 484 ) 　　

朱鹮鸣声信号具有非平稳性，针对FFT不能反映信号的瞬时性以及无法摆脱基函数的问题，提出了一种基于HHT变换的MFCC参数特征提取算法，通过对信号进行EMD分解，得到每一帧固有模态函数后进行HT变换，频率合成后的边际谱通过Mel滤波器；然后取对数能量，经过DCT变换后得到改进的MFCC系数，采用高斯混合模型分别在纯净和加噪两种环境以及不同信噪比下进行朱鹮鸣声的个体识别。实验结果表明，改进算法不仅能更好地体现鸣声信号的瞬时性，朱鹮个体的平均识别率也提高了4%。

基于加权支持向量机的凸轮升程误差拟合方法

王洪1,2,戴瑜兴1,3,谭彦杰2,李丹4

2016, 38(5): 1057-1065. doi:

摘要 ( 265 )

PDF (988KB) ( 583 ) 　　

针对凸轮磨削加工过程中存在局部升程误差严重超差的问题，提出了加权支持向量机的凸轮升程误差补偿方法。首先根据圆率的符号判断凸轮升程误差值是否连续，然后建立了不连续点与相邻点之间夹角与加权值的关系。通过加权支持向量机对凸轮升程误差值进行拟合。然后将原始凸轮升程值减去经拟合后的凸轮升程误差值，获得新的凸轮升程值。再根据圆率自动调整加权值的系数，使凸轮升程值光滑点数最大，即获得最优的凸轮升程值。对上述算法进行仿真和编程，经YTM833616数控凸轮轴磨床进行磨削验证。实验表明，凸轮升程误差由原来的±0.059 mm降至±0.011 mm，表面粗糙度由Ra032 μm降至Ra025 μm，获得良好的效果。

基于GA-BP算法的超声波测量精度优化研究

杨洪军1，董玉华2

2016, 38(5): 1066-1070. doi:

摘要 ( 338 )

PDF (608KB) ( 432 ) 　　

针对复杂环境下超声波传感器测量系统测量精度问题,以罐体油位测量为例，提出一种基于神经网络遗传算法的超声波传感器测量精度优化模型，实现超声波油位测量系统的非线性误差校正。仿真结果表明，该方法可以减小超声波传感器本身结构和外界因素的干扰，提高测量精度。

当期目录

作者中心

审稿中心

在线期刊